Dave Isbitski z Amazon: Voice Tech nie zna granic pokoleniowych

Opublikowany: 2020-05-30

W 2016 roku zrobiłem swoją pierwszą prezentację na Amazon Alexa i Echo i wtedy dostępnych było około 700 umiejętności. Dziś jest ich ponad 100 tys. I setki milionów urządzeń obsługujących Alexa. Tak więc, ponieważ większość z nas spędza więcej czasu niż kiedykolwiek w naszych domach, chciałem ponownie spotkać się z Dave'em Isbitskim, głównym ewangelistą Amazon dla Alexy i Echo.

Na dość obszernym czacie, który niedawno przeprowadziliśmy na LinkedIn Live, Dave dzieli się niektórymi historiami o tym, jak ludzie używają Alexa/Echo i ogólnie inteligentnych asystentów podczas pandemii Covid-19, dlaczego uważa, że ​​technologia głosowa łączy pokolenia i jak on widzi, że głos odgrywa główną rolę w erze PC (Post Covid).

Poniżej znajduje się zredagowany zapis fragmentu naszej rozmowy. Aby usłyszeć pełny konwój, kliknij osadzony odtwarzacz SoundCloud.

smallbiztrends · Dave Isbitski z Amazon – Voice to pierwsza technologia, którą moi rodzice są tak samo podekscytowani jak moje dzieci

Trendy dla małych firm: Jak daleko zaszły rzeczy z urządzeniami Alexa i Echo?

Dave Isbitski: W 2014 roku, jeśli powiem, kto ma Echo? Musiałem wyjaśnić, co to w ogóle było. Teraz w 2020 roku większość ludzi wie, czym jest Echo. Mam na myśli, że jest nawet skecz Saturday Night Live. Dostają to, czym jest Alexa. Prawdopodobnie mają wiele urządzeń. Są tylko inteligentnymi asystentami i sztuczną inteligencją na całym świecie. To się naprawdę zmieniło jako część języka ojczystego. To część codziennej rutyny ludzi.

To, co ludzie mogą wiedzieć lub nie, to to, że potrafisz uczyć tych AI. Więc to po prostu nie Alexa, to którykolwiek z tych inteligentnych asystentów. To, co robimy w Amazon, to sprawianie, że jest to bezpłatne, otwarte i dostępne dla wszystkich. Więc niezależnie od tego, czy chcą mieć Alexę w rzeczach, mogą to być samochody, samochodowe stereo, może to być twój telefon. Windows ma teraz wbudowaną Alexę lub chcesz nauczyć Alexę prowadzenia rozmów na różne tematy.

A kiedy rozmawiasz o czymś, nazywamy to umiejętnością. Więc uczysz Alexę nowej umiejętności i możesz porozmawiać o wszystkim. A to może być coś takiego jak zamawianie teraz Domino, prawda? Kiedy siedzimy w domu podczas pandemii, one dostarczają. Możesz zrobić proste zamówienie lub po prostu uruchamiać gry. Po prostu idź do Amazon… Jeśli ludzie są ciekawi, ponieważ słyszę od ludzi, którzy mówią: „Hej, moje dzieci doprowadzają mnie do szału. Czy są gry?” Są absolutnie gry. Wejdź na amazon.com/skills. Zobaczysz tam kategorie, Brent, których nie mieliśmy jakiś czas temu. Zobaczysz więc wszystkie te kategorie, tak jak każdy inny produkt Amazon, możesz posortować, możesz powiedzieć, pokazać mi cztery gwiazdki i wyższe oceny. Niektóre z nich mają teraz dziesiątki i dziesiątki tysięcy ocen.

Jedną z rzeczy, które możesz teraz zrobić jako klient Amazon, jest przejście do blueprints.amazon.com i tworzenie tych rzeczy wizualnie. Więc słyszę od rodziców, że ich dzieci tworzą własne historie.

Trendy dla małych firm: Tak.

Dave Isbitski: Może opiekujesz się kimś innym, kto jest w domu. Chcesz im przypominać, żeby coś robili. Chcesz stworzyć im możliwość zadawania pytań. Jak jakie leki biorę? O której mam to zrobić? Wszystko, co możesz zrobić, a następnie przypisać je do swojego konta Amazon.

Zrobiłem to dla moich rodziców, gdzie założyłem różne rzeczy. I to jest coś, w czym staraliśmy się stworzyć proces tak płynny, jak to tylko możliwe, abyś zaczął uczyć Alexę umiejętności prowadzenia rozmów, tworzenia treści, które chcesz, niezależnie od tego, czy potrafisz pisać kod, czy nie.

Trendy w małych firmach: Czy widzisz wiele zmian w zachowaniu i ludzie wykorzystują swoje głośniki do robienia rzeczy, których po prostu wcześniej nie robili?

Dave Isbitski: Cóż, jedną z rzeczy, które słyszę i zobaczysz w Internecie, może nawet zobaczysz to na swoich kanałach na Facebooku i Twitterze, jest to, że tak ważne jest łączenie się podczas tego wszystkiego. Właściwie mamy… Próbujemy raz w tygodniu połączyć się z moimi rodzicami przez wideo, tylko po to, żeby zobaczyć. I jedna z rzeczy, które konsekwentnie słyszymy… Jeśli pójdziesz tutaj. To zabierze Cię do wpisu na blogu dotyczącego Alexy i urządzeń oraz tego, co się dzieje. Usłyszysz, jak rozmawiamy o niektórych z tego.

Nie sądzę, żeby było to dostępne, kiedy ostatnio rozmawialiśmy, ale popularną funkcją jest możliwość wpadnięcia. I tak ustawiasz ludzi w swoim życiu, a potem po prostu mówią: „Alexa, wpadnij do dziadków”. Lub „Alexa wpada do mamy”. Lub „Alexa wpada do dzieci”. I to niesamowite, jak to się stało. A zwłaszcza podczas tej pandemii jest możliwość komunikowania się w ten sposób bez telefonu, bez aktualizacji aplikacji, prawda? To jest doświadczenie. Po prostu tam jest. A głos jest płynny. Jest inkluzywny. Każdy może to zrobić. Voice to pierwsza technologia, którą moi rodzice są tak samo podekscytowani jak moje dzieci, prawda? A mój tata nadal nie używa komputera, ale może podciągać rzeczy na-

Trendy w małych firmach: naprawdę?

Dave Isbitski: Tak, wiem, że to szaleństwo, prawda? Zarówno mój brat, jak i ja jesteśmy technikami, moja mama drukuje dla niego e-maile. Nigdy nie loguje… Tak. Ale mówiłem o tym, gdzie przekazaliśmy te urządzenia w szpitalach, a ludzie mogą po prostu porozmawiać w dowolnym momencie i połączyć się, prawda? Ponieważ ty też tego nie dotykasz, co jest ważne. Oddajemy je do szpitali, w których pielęgniarki mają możliwość zgłaszania się i rozmawiania przez to wszystko bez użycia rąk.

Właśnie rozmawiałem z ludźmi z Johns Hopkins. I nie wspomnę jego imienia. Jest chirurgiem w Nowym Jorku. I to było bardzo budujące. Powiedział tylko: „Chcę ci tylko podziękować. Dwa lata temu moja mama miała demencję i chorobę Alzheimera i cały czas używaliśmy Alexy. Miała możliwość wezwania pomocy. W każdej chwili mogła do nas zadzwonić. I w ten sposób mogliśmy się z nią porozumieć”.

Dodaliśmy więc kilka rzeczy. Jednym z tematów są opinie klientów na temat tego, aby Alexa była bardziej osobista. Na przykład każdemu w dowolnym momencie możesz po prostu powiedzieć Alexie, aby zapamiętała rzeczy, co jest pierwszą rzeczą, którą zrobiłem, było zapamiętanie hasła Wi-Fi, prawda? Jeśli więc mamy gości, mogą zapytać: „Jakie jest hasło do Wi-Fi?” Dobrze. I ona może ci powiedzieć, albo może to być takie, że moi rodzice pamiętają daty, urodziny i tym podobne.

Wszyscy mamy różne osobowości. Jeśli spojrzysz na Myers-Briggs, jeśli spojrzysz na NBTI i pięć podstawowych typów osobowości, tak jak w INFJ. Nie wiem, czy znasz te typy. Wiele razy nie mogę wyjść z własnej głowy, ale potrafię żonglować wieloma pomysłami w mojej głowie. Potrafię żyć w dysonansie poznawczym. Inni ludzie tacy nie są. A telefon komórkowy i internet to jeden rozmiar dla wszystkich. To tak, oto nasz projekt. A jeśli nie lubisz twardości, a potem trenujemy nasze mózgi, prawda? Budujemy te ścieżki neuronowe i jak używać interfejsu. A potem, jeśli zmienisz ten interfejs, dla ludzi jest to oszałamiające. Jeśli jeden z tych serwisów społecznościowych zmienia wygląd swojego kanału każdego dnia.


Trendy dla małych firm: dobrze.

Dave Isbitski: Wspaniałe w głosie jest to, że może to być sposób, w jaki chcesz go konsumować. Możesz zdecydować, jakiego typu osoby chcesz usłyszeć. W rzeczywistości mamy usługę o nazwie Polly Brand, która tworzy głosy. KFC, pracowaliśmy z nimi i możesz dostać głos pułkownika. To jest mój absolutny faworyt właśnie dzisiaj, dzięki urządzeniu Alexa możesz powiedzieć „Zapytaj Sama”. Więc Samuel L. Jackson, a opowie ci pogodę i dowcipy. A wszystko to przy użyciu technologii zwanej Neural TTS (tekst na mowę), prawda?

Przełomem było wykorzystanie sieci neuronowych do odtwarzania dźwięku. Więc teraz, dzięki Neural TTS, jeśli użyjesz komputera i zobaczysz, że jest on generowany komputerowo, ale dla ludzkiego ucha brzmi jak istota ludzka i możesz zmienić fleksję. Możesz go podekscytować. Zrobiliśmy to z Alexą, gdzie, kiedy tworzysz te doświadczenia, mam na myśli to, że wybierasz, jak brzmi głos. Możesz sprawić, że będzie brzmiała podekscytowana. Dodaliśmy rzecz dla klientów, w których słyszymy, że mamy dzieci, a ja idę grać kołysankę lub wyłączam światła w nocy, prawda? Ponieważ wiele osób korzystających z Alexy z inteligentnym domem będzie mówić: „Wyłącz światła”. I jest bardzo głośna i budzi dziecko, prawda? Jakby nigdy nie budzić dziecka.

Możesz więc szeptać do Alexy, a wtedy ona powie: „Och, brzmi, jakbyś szeptał. Czy chcesz, żebym ci odszeptał? A ty mówisz: „Tak, to tryb szeptany”. A więc powiesz: „Wyłącz światła”. A ona na to: „Dobra, wyłączę światła”. Dobrze? Ale to bardzo ludzkie. Innym obszarem, który możesz powiedzieć, jest: „Wiesz co, mów szybciej, mów wolniej, zwolnij”. I tak powie rzeczy wolniej, albo powie rzeczy szybciej.

Mamy możliwość wykrycia tonu, prawda? Więc to jest zupełnie inne. Jeśli powiem: „Alexa, zamknij się”. Przeciwko: „Alexa, dziękuję. Zatrzymać." A mamy różne rzeczy. Jakbyśmy zawsze mieli taką zdolność… Myślę, że rozmawialiśmy o tym podczas twojego ostatniego programu. Od pierwszego dnia, odkąd uruchomiliśmy, możesz usunąć wszystko, co kiedykolwiek powiedziałeś Alexie. Miałeś możliwość wejścia i zobaczenia rzeczy. A jeśli nie chcesz zajmować się technologią, możesz po prostu zadzwonić do Amazon i to zrobić. Ale ludzie chcieli słyszeć i mieć możliwość w locie. Więc otworzyliśmy to i możesz powiedzieć takie rzeczy jak: „Alexa, usuń to, co właśnie usłyszałeś”. Możesz powiedzieć: „Alexa, co właśnie usłyszałaś?” A potem powtórzy to z powrotem. Możesz powiedzieć: „Alexa, usuń wszystko, co dzisiaj słyszałeś”.

I to jest interesujące. Możesz nawet powiedzieć takie rzeczy jak: „Alexa, dlaczego to zrobiłeś?” A ona odpowie: „No cóż, to właśnie usłyszałam i dlatego to zrobiłam”. A więc jest to bardzo wzmacniające, ponieważ pomaga ludziom zrozumieć, ponieważ nawet jako istoty ludzkie powiem jedno, ale niekoniecznie jest to to, co słyszeliście lub przetworzyliście w ten sam sposób, prawda? A więc dając ludziom tę zdolność, mówią: „Och, ona ciągle słyszy to słowo. A może mówię w ten sposób. To bardzo wzmacniające w otwartej konfiguracji.

Niektóre inne rzeczy są dwujęzyczne. Więc możesz przełączać się między angielskim i hiszpańskim w USA w locie i za kulisami, bierzemy to, umieszczając to w leksykonie. Aby oba modele językowe działały i można było przełączać się między tym samym z… W Kanadzie, francuskim kanadyjskim, hindi i angielskim w Indiach. Ponieważ tak mówimy jako ludzie. Jeśli dorastałeś w dwujęzycznej rodzinie, po prostu poruszaj się tam iz powrotem między słowami i językami, a ona będzie w stanie to zrobić.

A więc to tego typu rzeczy, ponieważ nic nie jest szybsze niż po prostu możliwość proszenia o to. I tak bym powiedział, że ewoluujemy jak w teraźniejszości, oto gdzie jesteśmy i możemy rozmawiać o patrzeniu w przyszłość.

Trendy dla małych firm: Czy zauważasz, że niektóre interakcje, które zwykle miałyby miejsce, gdy Twój telefon zaczynają się odbywać z urządzeniami głosowymi?

Dave Isbitski: Cóż, patrzę na to w ten sposób. Misją naszej grupy zawsze była Alexa wszędzie tam, gdzie chcesz. A więc teraz to jest w domu. Ale jeśli wybierzesz się na przejażdżkę, powinieneś być w stanie powiedzieć: „Alexa, przeczytaj moją książkę”. I to był audiobook, którego może właśnie słuchałeś w swoim gabinecie, prawda? Jest po prostu bezproblemowy. Mówiono mi o tym już wcześniej i myślę, że nadal najlepszą analogią jest to, że głos to nowy HTML.

Zastanów się więc, kiedy po raz pierwszy pojawiła się sieć i internet. Jak kontaktowałeś się z firmami? Dobrze? To było tak, jakbyś napisał list, wszedł do ich lobby lub zadzwonił telefon. I nagle przez HTML, prawda? I nie chciałem powiedzieć, że głos to nowa sieć, ponieważ sieć tak bardzo obejmuje społeczności i wszystko. Bo to interfejs. Więc HTML nagle stał się interfejsem do łączenia się z kimkolwiek, gdziekolwiek na świecie, z każdą marką na świecie do nauki, prawda? Zadawać pytania o cokolwiek. W ten sposób HTML połączył sieć. I tak powinieneś patrzeć na głos. To HTML na wszystko.

Jest to część serii wywiadów jeden na jeden z liderami myśli. Transkrypcja została zredagowana do publikacji. Jeśli jest to wywiad audio lub wideo, kliknij osadzony odtwarzacz powyżej lub zasubskrybuj przez iTunes lub Stitcher.