Dave Isbitski d'Amazon : la technologie vocale ne connaît pas de limites générationnelles

Publié: 2020-05-30

En 2016, j'ai fait ma première présentation sur Amazon Alexa et Echo, et à l'époque il y avait environ 700 compétences disponibles. Aujourd'hui, il y en a plus de 100 000. Et des centaines de millions d'appareils compatibles Alexa. Donc, puisque la plupart d'entre nous passent plus de temps que jamais dans nos maisons, je voulais rattraper Dave Isbitski, évangéliste en chef d'Amazon pour Alexa et Echo.

Dans une conversation assez approfondie que nous avons eue sur LinkedIn Live récemment, Dave partage certaines des histoires sur la façon dont les gens utilisent Alexa/Echo et les assistants intelligents en général pendant la pandémie de Covid-19, pourquoi il pense que la technologie vocale unit les générations, et comment il voit la voix jouer un rôle majeur à l'ère du PC (Post Covid).

Vous trouverez ci-dessous une transcription éditée d'une partie de notre conversation. Pour entendre l'intégralité de la conversation, cliquez sur le lecteur SoundCloud intégré.

smallbiztrends · Dave Isbitski d'Amazon - La voix est la première technologie dont mes parents sont aussi enthousiastes que mes enfants

Tendances des petites entreprises : où en sont les choses avec les appareils Alexa et Echo ?

Dave Isbitski : En 2014, si je dirais, qui a un Echo ? J'ai même dû expliquer ce que c'était. Maintenant, en 2020, la plupart des gens savent ce qu'est Echo. Je veux dire, il y a même le sketch de Saturday Night Live. Ils comprennent ce qu'est Alexa. Ils ont probablement plusieurs appareils. Ce ne sont que des assistants intelligents et une IA à tous les niveaux. Cela a vraiment changé dans le cadre de la langue vernaculaire. Cela fait partie des routines quotidiennes des gens.

Ce que les gens peuvent savoir ou non, c'est que vous avez la capacité d'enseigner ces IA. Ce n'est donc pas Alexa, c'est n'importe lequel de ces assistants intelligents. Ce que nous faisons chez Amazon, c'est que nous le rendons gratuit, ouvert et disponible pour tout le monde. Donc, s'ils veulent avoir Alexa dans des choses, cela pourrait être des automobiles, cela pourrait être des autoradios, cela pourrait être votre téléphone. Windows a Alexa intégré maintenant, ou vous voulez apprendre à Alexa comment avoir des conversations sur des choses.

Et quand vous avez une conversation sur quelque chose, nous appelons cela une compétence. Donc, vous apprenez à Alexa une nouvelle compétence et vous pouvez avoir une conversation sur n'importe quoi. Et ça pourrait être des trucs comme commander vos Domino's en ce moment, n'est-ce pas ? Lorsque nous sommes assis à la maison pendant une pandémie, ils livrent. Vous pouvez passer une commande facile ou simplement tirer des jeux. Allez simplement sur Amazon… Si les gens sont curieux, parce que j'entends des gens dire : « Hé, mes enfants me rendent fou. Y a-t-il des jeux ? » Il y a absolument des jeux. Allez sur amazon.com/skills. Vous verrez des catégories là-haut, Brent, que nous n'avions pas il y a quelque temps. Ainsi, vous verrez toutes ces catégories, comme tout autre produit Amazon, vous pouvez trier, vous pouvez dire, montrez-moi quatre étoiles et plus. Certains d'entre eux ont maintenant des dizaines et des dizaines de milliers de notes.

L'une des choses que vous pouvez faire dès maintenant en tant que client Amazon est d'aller sur blueprints.amazon.com et vous pouvez créer ces choses visuellement. J'entends donc des parents dire que leurs enfants créent leurs propres histoires.

Tendances des petites entreprises : Oui.

Dave Isbitski : Peut-être que vous vous occupez de quelqu'un d'autre qui est à la maison. Vous voulez leur rappeler de faire des choses. Vous voulez leur donner la possibilité de poser des questions. Comme quels médicaments est-ce que je prends ? Je le prends à quelle heure ? Tout ce que vous pouvez faire et ensuite vous pouvez l'attribuer à leur compte Amazon.

J'ai fait ça pour mes parents, où j'ai mis en place des choses. Et donc c'est quelque chose où nous avons essayé de créer le processus aussi transparent que possible pour que vous commenciez à apprendre à Alexa à pouvoir avoir des conversations, à créer le contenu que vous voulez, que vous ayez la capacité d'écrire du code ou non.

Tendances des petites entreprises : constatez-vous de nombreux changements de comportement et des gens qui utilisent leurs haut-parleurs pour faire des choses qu'ils ne faisaient pas vraiment avant ?

Dave Isbitski : Eh bien, l'une des choses que j'entends et que vous verrez en ligne, vous pouvez même voir cela apparaître dans vos flux Facebook et Twitter, c'est qu'il est si important de se connecter pendant tout cela. En fait, nous avons… Nous essayons une fois par semaine de communiquer avec mes parents par vidéo, juste pour voir. Et l'une des choses que nous entendons constamment… Si vous allez ici. Cela vous mènera à un article de blog sur Alexa et les appareils, et sur ce qui se passe. Vous nous entendrez en parler.

Je ne pense pas que cela était disponible lors de notre dernière conversation, mais une fonctionnalité populaire est la possibilité de passer. Et donc vous configurez des gens dans votre vie et ils disent simplement : « Alexa, passe voir les grands-parents. Ou "Alexa passe chez maman". Ou "Alexa passe sur les enfants". Et c'est incroyable à quel point cela devient transparent. Et surtout pendant cette pandémie, c'est la capacité de communiquer comme ça sans avoir besoin d'un téléphone, sans mettre à jour les applications, n'est-ce pas ? C'est une expérience. C'est juste là. Et la voix est transparente. C'est inclusif. Tout le monde peut le faire. La voix est la première technologie dont mes parents sont aussi enthousiastes que mes enfants, n'est-ce pas ? Et mon père n'utilise toujours pas d'ordinateur, mais il peut afficher des choses sur-

Tendances des petites entreprises : vraiment ?

Dave Isbitski : Ouais, je sais que c'est fou, non ? Mon frère et moi sommes techniciens, ma mère lui imprime des e-mails. Il ne se connecte jamais… Ouais. Mais je parlais de l'endroit où nous avons fait don de ces appareils dans les hôpitaux et les gens ont la possibilité de parler à tout moment et de se connecter, n'est-ce pas ? Parce que vous n'y touchez pas non plus, ce qui est une chose importante. Nous les avons donnés aux hôpitaux où les infirmières ont la possibilité de s'enregistrer et de parler tout au long de cela, le tout entièrement mains libres.

Je parlais juste aux gens de Johns Hopkins. Et je ne mentionnerai pas son nom. C'est un chirurgien à New York. Et c'était très réconfortant. Il a juste dit: «Je veux juste vous remercier. Il y a deux ans, ma mère, elle souffrait de démence et d'Alzheimer et nous utilisions Alexa tout le temps. Elle avait la capacité d'appeler à l'aide. Elle avait la capacité de nous appeler à tout moment. Et c'est la façon dont nous avons pu communiquer avec elle.

Nous avons donc ajouté quelques éléments. L'un des thèmes est les commentaires des clients sur la façon de rendre Alexa plus personnelle. Par exemple, n'importe qui à tout moment, vous pouvez simplement dire à Alexa de se souvenir des choses, ce qui est la première chose que j'ai faite a été de se souvenir du mot de passe Wi-Fi, n'est-ce pas ? Et donc, si nous avons des invités, ils peuvent nous demander : "Quel est le mot de passe Wi-Fi ?" À droite. Et elle peut vous le dire, ou ce pourrait être des choses comme pour mes parents de se souvenir des dates et des anniversaires et des choses comme ça.

Nous avons tous des personnalités différentes. Si vous regardez Myers-Briggs, si vous regardez NBTI et cinq types de personnalité de base, comme si j'étais dans INFJ. Je ne sais pas si vous connaissez ces types. Souvent, je ne peux pas sortir de ma propre tête, mais je peux jongler avec plusieurs idées dans ma tête. Je peux vivre dans la dissonance cognitive. Les autres ne sont pas comme ça. Et le mobile et le Web ont une taille unique. C'est comme, voici notre conception. Et si vous n'aimez pas ça dur, et puis nous entraînons nos cerveaux, n'est-ce pas ? Nous construisons ces voies neuronales et comment utiliser une interface. Et puis si vous changez cette interface, c'est stupéfiant pour les gens. Si l'un de ces sites de médias sociaux change l'apparence de son flux tous les jours.


Tendances des petites entreprises : oui.

Dave Isbitski : Ce qui est génial avec la voix, c'est que cela pourrait être la façon dont vous voulez la consommer. Vous pouvez décider quel type de personne vous voulez entendre. En fait, nous avons un service qui s'appelle Polly Brand et qui crée des voix. KFC, nous avons travaillé avec eux et vous pouvez entendre la voix du colonel. C'est mon préféré absolu aujourd'hui, avec l'appareil Alexa, vous pouvez dire "Demandez à Sam". Alors Samuel L. Jackson, et il vous dira la météo et des blagues. Et tout cela utilise une technologie appelée Neural TTS (text to speech), n'est-ce pas ?

Il y a eu une percée en utilisant des réseaux de neurones pour reproduire le son. Alors maintenant, grâce à Neural TTS, si vous utilisez un ordinateur et vous verrez qu'il est généré par ordinateur, mais pour l'oreille humaine, cela ressemble à un être humain et vous pouvez changer l'inflexion. Vous pouvez le rendre excité. Nous l'avons fait avec Alexa où, lorsque vous créez ces expériences, je veux dire, vous choisissez à quoi ressemble la voix. Vous pouvez la faire paraître excitée. Nous avons ajouté le truc pour les clients où nous entendons comme si nous avions des petits et je vais jouer une berceuse ou j'éteins les lumières la nuit, non ? Parce que beaucoup de gens qui utilisent Alexa avec la maison intelligente, ils diront : « Éteignez les lumières. Et elle est super bruyante et réveille le bébé, non ? Comme ne jamais réveiller le bébé.

Vous pouvez donc chuchoter à Alexa, puis elle dira : « Oh, on dirait que tu chuchotes. Voulez-vous que je vous réponde à voix basse ? » Et vous dites: "Oui, c'est le mode chuchotement." Et donc vous serez comme, "Éteignez les lumières." Et elle dira: "D'accord, je vais éteindre les lumières." À droite? Mais c'est très humain. Un autre domaine que vous pouvez dire est : « Vous savez quoi, parlez plus vite, parlez plus lentement, ralentissez ». Et donc elle dira les choses plus lentement, ou elle dira les choses plus vite.

Nous avons la capacité de détecter le ton, n'est-ce pas ? C'est donc très différent. Si je dis "Alexa, tais-toi". Versus, "Alexa, merci. Arrêt." Et nous avons toutes sortes de choses. Comme si nous avions toujours eu la capacité… Je pense que nous en avons parlé lors de votre dernière émission. Depuis le premier jour, depuis notre lancement, vous avez la possibilité de supprimer tout ce que vous avez dit à Alexa. Vous aviez la capacité d'entrer et de voir les choses. Et si vous ne vouliez pas vous occuper de la technologie, vous pouvez simplement appeler Amazon et le faire. Mais les gens voulaient entendre et avoir la capacité à la volée. Nous avons donc ouvert cela et vous pouvez dire des choses comme "Alexa, supprimez ce que vous venez d'entendre". Vous pourriez dire : « Alexa, qu'est-ce que tu viens d'entendre ? Et puis elle le répétera. Vous pourriez dire : « Alexa, supprime tout ce que tu as entendu aujourd'hui ».

Et c'est intéressant. Vous pouvez même dire des choses comme « Alexa, pourquoi as-tu fait ça ? Et elle dira: "Eh bien, c'est ce que j'ai entendu et c'est pourquoi j'ai fait ça." Et donc c'est très stimulant parce que ça aide les gens à comprendre, parce que même en tant qu'êtres humains, je dirai une chose, mais ce n'est pas nécessairement ce que vous avez entendu ou traité de la même manière, n'est-ce pas ? Et donc, en donnant aux gens cette capacité, ils se disent: «Oh, elle n'arrête pas d'entendre ce mot. Ou peut-être que je dis comme ça. C'est très stimulant dans une configuration ouverte.

Certaines des autres choses sont bilingues. Ainsi, vous pouvez basculer entre l'anglais et l'espagnol aux États-Unis à la volée et dans les coulisses, nous prenons cela, le mettons dans un lexique. Et pour que les deux modèles linguistiques fonctionnent et que vous puissiez basculer entre la même chose avec… Au Canada, le français canadien, l'hindi et l'anglais en Inde. Parce que c'est ainsi que nous parlons en tant qu'êtres humains. Si vous avez grandi dans une famille bilingue, il suffit d'aller et venir entre les mots et les langues et elle sera capable de le faire.

Et donc c'est ce genre de choses parce que rien n'est plus rapide que de pouvoir le demander. Et donc c'est là que je dirais, nous évoluons comme aujourd'hui, c'est là où nous en sommes et nous pouvons parler d'avenir.

Tendances des petites entreprises : voyez-vous certaines des interactions qui auraient généralement eu lieu avec votre téléphone commencer à avoir lieu avec vos appareils vocaux ?

Dave Isbitski : Eh bien, je vois les choses de cette façon. La mission de notre groupe a toujours été Alexa partout où vous le souhaitez. Et donc en ce moment c'est dans la maison. Mais si vous partez en voiture, vous devriez pouvoir dire : « Alexa, lis mon livre ». Et c'était peut-être le livre audio que vous écoutiez dans votre tanière, n'est-ce pas ? C'est juste, c'est transparent. On m'a déjà dit cela auparavant, et je pense que c'est toujours la meilleure analogie, c'est que la voix est le nouveau HTML.

Pensez donc au moment où le Web est sorti pour la première fois et où Internet est sorti pour la première fois. Comment avez-vous contacté les entreprises ? À droite? C'était comme si vous écriviez une lettre, vous entriez dans leur hall ou un appel téléphonique. Et tout d'un coup via HTML, n'est-ce pas ? Et je ne voulais pas dire que la voix est le nouveau web, parce que le web englobe tellement le social et tout aussi. Parce que c'est l'interface. Alors HTML est soudainement devenu l'interface pour se connecter avec n'importe qui, n'importe où dans le monde, n'importe quelle marque dans le monde pour apprendre, n'est-ce pas ? Pour poser des questions sur n'importe quoi. C'est vraiment ainsi que HTML a réuni le Web. Et c'est comme ça qu'il faut regarder la voix. C'est le HTML pour tout.

Cela fait partie de la série d'entretiens individuels avec des leaders d'opinion. La transcription a été éditée pour publication. S'il s'agit d'une interview audio ou vidéo, cliquez sur le lecteur intégré ci-dessus, ou abonnez-vous via iTunes ou via Stitcher.