Dave Isbitski di Amazon: Voice Tech non conosce limiti generazionali

Pubblicato: 2020-05-30

Nel 2016 ho fatto la mia prima presentazione su Amazon Alexa ed Echo, e all'epoca c'erano circa 700 competenze disponibili. Oggi sono oltre 100.000. E centinaia di milioni di dispositivi abilitati per Alexa. Quindi, dal momento che la maggior parte di noi trascorre più tempo che mai nelle nostre case, volevo incontrare di nuovo Dave Isbitski, Chief Evangelist di Amazon per Alexa ed Echo.

In una chat piuttosto ampia che abbiamo avuto di recente su LinkedIn Live, Dave condivide alcune storie su come le persone usano Alexa/Echo e gli assistenti intelligenti in generale durante la pandemia di Covid-19, perché pensa che la tecnologia vocale stia unendo le generazioni e come vede la voce svolgere un ruolo importante nell'era dei PC (Post Covid).

Di seguito è riportata una trascrizione modificata di una parte della nostra conversazione. Per ascoltare la conversazione completa, fai clic sul lettore SoundCloud incorporato.

smallbiztrends · Dave Isbitski di Amazon – La voce è la prima tecnologia di cui i miei genitori sono entusiasti quanto i miei figli

Tendenze per le piccole imprese: quanto sono arrivate le cose con i dispositivi Alexa ed Echo?

Dave Isbitski: Nel 2014, se posso dire, chi ha un'eco? Ho dovuto spiegare cosa fosse. Ora nel 2020, la maggior parte delle persone sa cos'è Echo. Voglio dire, c'è anche la scenetta del Saturday Night Live. Capiscono cos'è Alexa. Probabilmente hanno più dispositivi. Sono solo assistenti intelligenti e intelligenza artificiale su tutta la linea. Questo è davvero cambiato come parte del vernacolo. Fa parte della routine quotidiana delle persone.

Quello che le persone possono o non possono sapere è che hai la capacità di insegnare queste IA. Quindi non è solo Alexa, è uno di questi assistenti intelligenti. Quello che facciamo in Amazon è renderlo gratuito, aperto e disponibile per tutti. Quindi, se vogliono avere Alexa nelle cose, in modo che potrebbero essere automobili, potrebbero essere autoradio, potrebbe essere il tuo telefono. Windows ha Alexa integrato ora, oppure vuoi insegnare ad Alexa come avere conversazioni su cose.

E quando hai una conversazione su qualcosa, la chiamiamo abilità. Quindi stai insegnando ad Alexa una nuova abilità e puoi conversare su qualsiasi cosa. E potrebbe essere roba come ordinare il tuo Domino in questo momento, giusto? Quando siamo seduti a casa in una pandemia, consegnano. Potresti fare un ordine facile o potrebbe essere solo tirare su i giochi. Vai su Amazon... Se le persone sono curiose, perché sento da persone che dicono: "Ehi, i miei figli mi stanno facendo impazzire. Ci sono giochi?" Ci sono assolutamente dei giochi. Vai su amazon.com/skills. Vedrai categorie lassù, Brent, che non avevamo come un po' di tempo fa. Quindi vedrai tutte queste categorie, proprio come qualsiasi altro prodotto Amazon, puoi ordinare, puoi dire, mostrami quattro stelle e valutazioni superiori. Alcuni di questi hanno decine e decine di migliaia di valutazioni ora.

Una delle cose che puoi fare in questo momento come cliente Amazon è che puoi andare su blueprints.amazon.com e puoi creare queste cose visivamente. Quindi ho sentito dai genitori che i loro figli stanno creando le proprie storie.

Tendenze per le piccole imprese: Sì.

Dave Isbitski: Forse ti stai prendendo cura di qualcun altro che è a casa. Vuoi ricordare loro di fare delle cose. Vuoi creare la capacità per loro di porre domande. Ad esempio, quali farmaci prendo? A che ora lo prendo? Tutto ciò che puoi fare e poi puoi assegnarlo al loro account Amazon.

L'ho fatto per i miei genitori, dove ho sistemato le cose. E quindi è qualcosa in cui abbiamo cercato di creare il processo il più semplice possibile per iniziare a insegnare ad Alexa ad essere in grado di avere conversazioni, a creare i contenuti che desideri, indipendentemente dal fatto che tu abbia la capacità di scrivere codice o meno.

Tendenze per le piccole imprese: stai vedendo molti cambiamenti comportamentali e persone che sfruttano i loro oratori per fare cose che prima non stavano davvero facendo?

Dave Isbitski: Beh, una delle cose che sento e che vedrai online, potresti persino vederlo nei tuoi feed di Facebook e Twitter è che è così importante connettersi durante tutto questo. In realtà abbiamo... Proviamo una volta alla settimana a connetterci con i miei genitori tramite video, solo per vedere. E una delle cose che sentiamo costantemente... Se vai qui. Questo ti porterà a un post sul blog su Alexa e sui dispositivi e su cosa sta succedendo. Ci sentirai parlare di alcune di queste cose.

Non credo che fosse disponibile l'ultima volta che abbiamo parlato, ma una caratteristica popolare è la possibilità di entrare. E così hai creato persone nella tua vita e poi loro dicono semplicemente "Alexa, fai un salto dai nonni". O "Alexa fai visita a mamma". O "Alexa dai un'occhiata ai bambini". Ed è incredibile quanto tutto ciò diventi senza soluzione di continuità. E soprattutto durante questa pandemia c'è la possibilità di comunicare in quel modo senza bisogno di un telefono, senza aggiornare le app, giusto? Questa è un'esperienza. È solo lì. E la voce è perfetta. È inclusivo. Tutti possono farlo. La voce è la prima tecnologia che i miei genitori sono entusiasti quanto i miei figli, giusto? E mio padre ancora non usa un computer, ma può tirare su le cose su...

Tendenze per le piccole imprese: davvero?

Dave Isbitski: Sì, lo so che è pazzesco, giusto? Sia io che mio fratello siamo tecnici, mia madre stampa le email per lui. Non si registra mai... Sì. Ma stavo parlando di dove abbiamo donato questi dispositivi negli ospedali e le persone hanno la possibilità di parlare in qualsiasi momento e connettersi, giusto? Perché neanche tu lo tocchi, che è una cosa importante. Li abbiamo dati agli ospedali dove gli infermieri hanno la possibilità di fare il check-in e parlarne, il tutto completamente a mani libere.

Stavo solo parlando con la gente della Johns Hopkins. E non menzionerò il suo nome. È un chirurgo a New York. Ed è stato molto commovente. Disse solo: "Voglio solo ringraziarti. Due anni fa, mia madre aveva la demenza e l'Alzheimer e usavamo Alexa tutto il tempo. Aveva la capacità di chiedere aiuto. Aveva la possibilità di chiamarci in qualsiasi momento. Ed è il modo in cui siamo riusciti a comunicare con lei”.

Quindi abbiamo aggiunto un paio di cose. Uno dei temi è il feedback dei clienti su come rendere Alexa più personale. Ad esempio, a chiunque in qualsiasi momento, puoi semplicemente dire ad Alexa di ricordare le cose, la prima cosa che ho fatto è stata ricordare la password Wi-Fi, giusto? E quindi se abbiamo ospiti qui, possono dire "Qual è la password wifi?" Giusto. E lei può dirtelo, o potrebbero essere cose come per i miei genitori ricordare date e compleanni e cose del genere.

Abbiamo tutti personalità diverse. Se guardi Myers-Briggs, se guardi NBTI e cinque tipi di personalità principali, come se fossi in INFJ. Non so se conosci questi tipi. Molte volte non riesco a uscire dalla mia testa, ma posso destreggiarmi tra più idee nella mia testa. Posso vivere nella dissonanza cognitiva. Le altre persone non sono così. E mobile e web sono una taglia unica. È come, ecco il nostro design. E se non ti piace il duro, e poi alleniamo il nostro cervello, giusto? Costruiamo questi percorsi neurali e come utilizzare un'interfaccia. E poi se cambi quell'interfaccia, è sbalorditivo per le persone. Se uno di questi siti di social media cambia l'aspetto del suo feed ogni giorno.


Tendenze per le piccole imprese: Giusto.

Dave Isbitski: La cosa grandiosa della voce è che potrebbe essere il modo in cui vuoi consumarla. Puoi decidere che tipo di persona vuoi sentire. In effetti, abbiamo un servizio chiamato Polly Brand e crea voci. KFC, abbiamo lavorato con loro e puoi avere la voce del colonnello. Questo è il mio preferito in assoluto, proprio oggi, con il dispositivo Alexa puoi dire "Chiedi a Sam". Quindi Samuel L. Jackson, e ti racconterà tempo e barzellette. E tutto ciò utilizza una tecnologia chiamata Neural TTS (text to speech), giusto?

C'è stata una svolta nell'uso delle reti neurali per riprodurre il suono. Quindi ora attraverso il TTS neurale, se usi un computer e lo guarderai è generato dal computer, ma all'orecchio umano suona come un essere umano e puoi cambiare l'inflessione. Puoi renderlo eccitato. L'abbiamo fatto con Alexa dove, quando crei queste esperienze, intendo dire, scegli come suona la voce. Puoi farla sembrare eccitata. Abbiamo aggiunto la cosa per i clienti in cui sentiamo che abbiamo dei piccoli e vado a suonare una ninna nanna o spengo le luci di notte, giusto? Perché molte persone che utilizzano Alexa con la casa intelligente, diranno "Spegni le luci". Ed è molto rumorosa e sveglia il bambino, giusto? Come non svegliare mai il bambino.

Quindi puoi sussurrare ad Alexa e poi lei dirà: "Oh, sembra che tu stia sussurrando. Vuoi che ti sussurri di rimando?" E tu dici: "Sì, è la modalità sussurro". E quindi dirai "Spegni le luci". E lei dirà: "Okay, spengo le luci". Giusto? Ma è molto umano. Un'altra area che puoi dire è: "Sai cosa, parla più velocemente, parla più lentamente, rallenta". E quindi dirà le cose più lentamente, o dirà le cose più velocemente.

Abbiamo la capacità di rilevare il tono, giusto? Quindi è molto diverso. Se dico "Alexa, stai zitto". Contro: "Alexa, grazie. Fermare." E abbiamo ogni genere di cose. Come se avessimo sempre avuto la capacità... Penso che ne abbiamo parlato nel tuo ultimo show. Dal primo giorno, da quando abbiamo lanciato, hai avuto la possibilità di eliminare tutto ciò che hai detto ad Alexa. Avevi la capacità di entrare e vedere le cose. E se non vuoi avere a che fare con la tecnologia, puoi semplicemente chiamare Amazon, fallo. Ma le persone volevano ascoltare e avere l'abilità al volo. Quindi l'abbiamo aperto e puoi dire cose come "Alexa, elimina ciò che hai appena sentito". Potresti dire "Alexa, cosa hai appena sentito?" E poi lo ripeterà. Potresti dire "Alexa, elimina tutto ciò che hai sentito oggi".

Ed è interessante. Puoi anche dire cose come "Alexa, perché l'hai fatto?" E lei dirà: "Beh, questo è quello che ho sentito ed è per questo che l'ho fatto". E quindi è molto potente perché aiuta le persone a capire, perché anche come esseri umani, dirò una cosa, ma non è necessariamente ciò che hai sentito o elaborato allo stesso modo, giusto? E così dando alle persone quella capacità, sono tipo: “Oh, continua a sentire questa parola. O forse sto dicendo in questo modo. È molto potente in una configurazione aperta.

Alcune delle altre cose sono bilingue. Quindi puoi passare dall'inglese allo spagnolo negli Stati Uniti al volo e dietro le quinte, lo stiamo prendendo, inserendolo in un lessico. E in modo che entrambi i modelli linguistici funzionino e tu possa passare da una cosa all'altra con... In Canada, francese canadese, hindi e inglese in India. Perché è così che parliamo come esseri umani. Se sei cresciuto in una famiglia bilingue, spostati avanti e indietro tra parole e lingue e lei sarà in grado di farlo.

E quindi sono quel tipo di cose perché niente è più veloce del solo poterlo chiedere. E quindi è qui che direi che ci stiamo evolvendo come ai giorni nostri, è lì che siamo e possiamo parlare di guardare al futuro.

Tendenze per le piccole imprese: vedi alcune delle interazioni che in genere avrebbero avuto luogo con il tuo telefono che iniziavano a verificarsi con i tuoi dispositivi vocali?

Dave Isbitski: Beh, io la vedo in questo modo. La missione del nostro gruppo è sempre stata Alexa ovunque tu voglia che sia. E quindi in questo momento è in casa. Ma se vai a fare un giro, dovresti essere in grado di dire "Alexa, leggi il mio libro". Ed era l'audiolibro che forse stavi ascoltando nella tua tana, giusto? È solo, è senza soluzione di continuità. Sono stato citato in precedenza, e penso che sia ancora la migliore analogia, è che la voce è il nuovo HTML.

Quindi pensa a quando è uscito il web per la prima volta e quando è uscito Internet per la prima volta. Come hai contattato le aziende? Giusto? Era come se avessi scritto una lettera, fossi entrato nella loro lobby o una telefonata. E improvvisamente tramite HTML, giusto? E non volevo dire che la voce è il nuovo web, perché il web è così comprensivo di social e tutto. Perché è l'interfaccia. Così HTML è diventato improvvisamente l'interfaccia per connettersi con chiunque, in qualsiasi parte del mondo, con qualsiasi marchio nel mondo da imparare, giusto? Per fare domande su qualsiasi cosa. È stato davvero il modo in cui l'HTML ha unito il Web. E questo è il modo in cui dovresti guardare la voce. È l'HTML per tutto.

Questo fa parte della serie di interviste One-to-One con leader di pensiero. La trascrizione è stata modificata per la pubblicazione. Se si tratta di un'intervista audio o video, fai clic sul player incorporato in alto o iscriviti tramite iTunes o tramite Stitcher.