Дэйв Исбитски из Amazon: Voice Tech не знает границ между поколениями

Опубликовано: 2020-05-30

В 2016 году я сделал свою первую презентацию на Amazon Alexa и Echo, и на тот момент было доступно около 700 навыков. Сегодня их более 100 тыс. И сотни миллионов устройств с поддержкой Alexa. Итак, поскольку большинство из нас проводят больше времени, чем когда-либо, в своих домах, я хотел снова встретиться с Дэйвом Исбитски, главным евангелистом Amazon для Alexa и Echo.

В довольно обширной беседе, которую мы недавно провели в LinkedIn Live, Дэйв делится некоторыми историями о том, как люди используют Alexa/Echo и умных помощников в целом во время пандемии Covid-19, почему, по его мнению, голосовые технологии объединяют поколения, и как он видит, что голос играет важную роль в эпоху ПК (после Covid).

Ниже приведена отредактированная стенограмма части нашего разговора. Чтобы прослушать полную беседу, нажмите на встроенный проигрыватель SoundCloud.

smallbiztrends · Дэйв Исбитски из Amazon – Голос – это первая технология, которая нравится моим родителям не меньше, чем детям.

Тенденции малого бизнеса: как далеко продвинулись дела с устройствами Alexa и Echo?

Дэйв Исбитски: В 2014 году, если бы я сказал, у кого есть Эхо? Пришлось даже объяснять, что это было. Сейчас, в 2020 году, большинство людей знают, что такое Эхо. Я имею в виду, что есть даже пародия «Субботним вечером в прямом эфире». Они понимают, что такое Алекса. Вероятно, у них несколько устройств. Они просто умные помощники и ИИ по всем направлениям. Это действительно изменилось как часть народного языка. Это часть повседневной жизни людей.

Люди могут знать или не знать, что у вас есть возможность обучать эти ИИ. Так что это просто не Alexa, это любой из этих умных помощников. Что мы делаем в Amazon, так это делаем это бесплатным, открытым и доступным для всех. Итак, хотят ли они, чтобы Alexa была в вещах, например, в автомобилях, автомобильных стереосистемах, может быть в вашем телефоне. В Windows теперь встроена Alexa, или вы хотите научить Alexa разговаривать о вещах.

И когда у вас есть разговор о чем-то, мы называем это навыком. Итак, вы обучаете Алексу новому навыку и можете поговорить о чем угодно. И это может быть что-то вроде заказа Domino's прямо сейчас, верно? Когда мы сидим дома в условиях пандемии, они приносят пользу. Вы можете сделать легкий заказ, или это может быть просто подтягивание игр. Просто зайдите на Amazon… Если людям интересно, потому что я слышу от людей: «Эй, мои дети сводят меня с ума. Есть ли игры?» Игры точно есть. Перейдите на amazon.com/skills. Вы увидите там категории, Брент, которых у нас не было некоторое время назад. Таким образом, вы увидите все эти категории, как и любой другой продукт Amazon, вы можете сортировать, вы можете сказать, покажите мне четыре звезды и выше. Некоторые из них сейчас имеют десятки и десятки тысяч оценок.

Одна из вещей, которую вы можете сделать прямо сейчас как клиент Amazon, — это зайти на blueprints.amazon.com и создать эти вещи визуально. Так что я слышу от родителей, что их дети создают свои собственные истории.

Тенденции малого бизнеса: Да.

Дэйв Исбитски: Может быть, вы заботитесь о ком-то еще, кто находится дома. Вы хотите напомнить им сделать что-то. Вы хотите создать для них возможность задавать вопросы. Например, какие лекарства я принимаю? В какое время я принимаю это? Все это вы можете сделать, а затем вы можете назначить это их учетной записи Amazon.

Я сделал это для своих родителей, где я все настроил. Именно поэтому мы постарались максимально упростить процесс, чтобы вы начали обучать Alexa вести диалоги, создавать контент, который вам нужен, независимо от того, умеете ли вы писать код или нет.

Тенденции малого бизнеса. Видите ли вы много изменений в поведении людей и людей, использующих свои динамики для того, чтобы делать то, чего они раньше не делали?

Дэйв Исбитски: Ну, одна из вещей, которые я слышу и вы увидите в Интернете, вы даже можете увидеть это в своих лентах Facebook и Twitter, заключается в том, что во время всего этого очень важно оставаться на связи. На самом деле у нас есть… Мы пытаемся раз в неделю связываться с моими родителями по видеосвязи, просто чтобы посмотреть. И одна из вещей, которые мы постоянно слышим… Если вы пойдете сюда. Это приведет вас к сообщению в блоге об Alexa и устройствах, а также о том, что происходит. Вы услышите, как мы поговорим о некоторых из них.

Я не думаю, что это было доступно, когда мы в последний раз разговаривали, но популярная функция — это возможность зайти. Итак, вы настраиваете людей в своей жизни, а затем они просто говорят: «Алекса, загляни к бабушке и дедушке». Или «Алекса заглянет к маме». Или «Алекса заглядывает к детям». И невероятно, насколько органично это получается. И особенно во время этой пандемии — это возможность просто так общаться без телефона, без обновления приложений, верно? Это опыт. Это просто там. И голос ровный. Это включительно. Каждый может это сделать. Голос — это первая технология, которой мои родители так же рады, как и мои дети, верно? А мой папа до сих пор не пользуется компьютером, но он может что-то подтянуть...

Тенденции малого бизнеса: правда?

Dave Isbitski: Да, я знаю, что это безумие, верно? И мой брат, и я технари, моя мама распечатывает для него электронные письма. Он никогда не регистрируется… Да. Но я говорил о том, где мы пожертвовали эти устройства в больницах, и у людей есть возможность просто поговорить в любое время и подключиться, верно? Потому что ты тоже не прикасаешься к нему, что очень важно. Мы даем их больницам, где медсестры имеют возможность зарегистрироваться и поговорить об этом, и все это полностью без помощи рук.

Я только что разговаривал с ребятами из Johns Hopkins. И я не буду упоминать его имя. Он хирург в Нью-Йорке. И это было очень душевно. Он просто сказал: «Я просто хочу поблагодарить вас. Два года назад у моей матери была деменция и болезнь Альцгеймера, и мы все время пользовались Alexa. У нее была возможность позвать на помощь. У нее была возможность позвонить нам в любое время. И именно так мы смогли с ней общаться».

Итак, мы добавили пару вещей. Одна из тем — отзывы клиентов о том, как сделать Alexa более персонализированным. Например, любой в любое время, вы можете просто сказать Алексе, чтобы она помнила вещи, и первое, что я сделал, это запомнил пароль Wi-Fi, верно? И поэтому, если к нам приходят гости, они могут спросить: «Какой пароль от Wi-Fi?» Верно. И она может рассказать вам, или это может быть что-то вроде того, чтобы мои родители запоминали даты, дни рождения и тому подобное.

У всех нас разные характеры. Если вы посмотрите на Майерс-Бриггс, если вы посмотрите на NBTI и пять основных типов личности, как я в INFJ. Я не знаю, знакомы ли вы с этими типами. Много раз я не могу выйти из своей головы, но я могу жонглировать несколькими идеями в своей голове. Я могу жить в когнитивном диссонансе. Другие люди не такие. И мобильный, и веб-один размер подходит всем. Это как, вот наш дизайн. А если жестко не нравится, то и мозги тренируем, да? Мы создаем эти нейронные пути и то, как использовать интерфейс. И затем, если вы измените этот интерфейс, это ошеломит людей. Если один из этих сайтов социальных сетей меняет внешний вид своей ленты каждый день.


Тенденции малого бизнеса: верно.

Дэйв Исбитски: Что хорошего в голосе, так это то, что вы можете использовать его так, как хотите. Вы можете решить, какого человека вы хотите услышать. На самом деле у нас есть сервис Polly Brand, который создает голоса. KFC, мы работали с ними, и вы можете получить голос Полковника. Это мой абсолютный фаворит прямо сегодня, с устройством Alexa, вы можете сказать: «Спросите Сэма». Итак, Сэмюэл Л. Джексон, и он расскажет вам погоду и анекдоты. И все это использует технологию Neural TTS (преобразование текста в речь), верно?

Произошел прорыв в использовании нейронных сетей для воспроизведения звука. Итак, теперь с помощью Neural TTS, если вы используете компьютер и посмотрите на него, он сгенерирован компьютером, но для человеческого уха это звучит как человеческое существо, и вы можете изменить интонацию. Вы можете сделать его возбужденным. Мы сделали это с Alexa, где, когда вы создаете эти впечатления, я имею в виду, вы выбираете, как звучит голос. Вы можете заставить ее звучать взволнованно. Мы добавили функцию для клиентов, когда мы слышим, как будто у нас есть маленькие, и я иду играть колыбельную или выключаю свет ночью, верно? Потому что многие люди, использующие Alexa с умным домом, скажут: «Выключите свет». И она очень громкая и будит ребенка, верно? Как никогда не будить ребенка.

Так что вы можете прошептать Алексе, и тогда она скажет: «О, похоже, ты шепчешь. Хочешь, я прошепчу в ответ? И вы говорите: «Да, это режим шепота». И поэтому вы будете такие: «Выключите свет». А она такая: «Хорошо, я выключу свет». Верно? Но это очень по-человечески. Еще одна область, в которой вы можете сказать: «Знаешь что, говори быстрее, говори медленнее, медленнее». И поэтому она будет говорить что-то медленнее или быстрее.

У нас есть возможность определять тон, верно? Так что это очень разные. Если я скажу: «Алекса, заткнись». Наоборот: «Алекса, спасибо. Останавливаться." А у нас есть всякое. Как будто у нас всегда были возможности… Я думаю, мы говорили об этом на вашем последнем шоу. С самого первого дня, с момента запуска, у вас была возможность удалить все, что вы когда-либо говорили Алексе. У вас была возможность войти и увидеть вещи. И если вы не хотите иметь дело с технологиями, вы можете просто позвонить в Amazon и сделать это. Но люди хотели услышать и иметь возможность на лету. Итак, мы открыли это, и вы можете сказать что-то вроде «Алекса, удали то, что ты только что услышал». Вы могли бы сказать: «Алекса, что ты только что услышала?» А потом она повторит это обратно. Вы можете сказать: «Алекса, сотри все, что ты слышал сегодня».

И это интересно. Вы даже можете сказать что-то вроде: «Алекса, зачем ты это сделала?» И она скажет: «Ну, это то, что я слышала, и поэтому я это сделала». И поэтому это очень вдохновляет, потому что помогает людям понять, потому что, даже как люди, я скажу одну вещь, но это не обязательно то, что вы услышали или обработали таким же образом, верно? И поэтому, давая людям эту способность, они говорят: «О, она продолжает слышать это слово. Или, может быть, я так говорю». Это очень расширяет возможности в открытой настройке.

Некоторые другие вещи двуязычны. Таким образом, вы можете переключаться между английским и испанским в США на лету и за кулисами, мы берем это, помещаем это в лексикон. И чтобы обе языковые модели работали, и вы могли переключаться между ними с помощью… В Канаде, франко-канадского, хинди и английского в Индии. Потому что так мы говорим как человеческие существа. Если вы выросли в двуязычной семье, просто переключайтесь между словами и языками, и она сможет это сделать.

И это такие вещи, потому что нет ничего быстрее, чем просто попросить об этом. И именно здесь я бы сказал, что мы развиваемся, как и в настоящее время, вот где мы находимся, и мы можем говорить о взглядах в будущее.

Тенденции малого бизнеса: вы видите, что некоторые взаимодействия, которые обычно происходили бы с вашим телефоном, начинают происходить с вашими голосовыми устройствами?

Дэйв Исбитски: Ну, я смотрю на это так. Миссией нашей группы всегда была Alexa везде, где вы хотите. И так прямо сейчас это в доме. Но если вы собираетесь прокатиться, вы должны иметь возможность сказать: «Алекса, прочитай мою книгу». И это была аудиокнига, которую вы, может быть, просто слушали в своей берлоге, верно? Это просто, это бесшовно. Меня уже цитировали, и я думаю, что это все еще лучшая аналогия: голос — это новый HTML.

Итак, подумайте о том, когда впервые появилась сеть и Интернет. Как вы связывались с компаниями? Верно? Это было похоже на то, что вы написали письмо, вы вошли в их вестибюль или позвонили. А вдруг через HTML, да? И я не хотел говорить, что голос — это новая сеть, потому что сеть включает в себя социальные сети и все такое. Потому что это интерфейс. Таким образом, HTML внезапно стал интерфейсом для общения с кем угодно, в любой точке мира, с любым брендом в мире, чтобы учиться, верно? Задавать вопросы о чем-либо. Именно так HTML объединил сеть. И именно так вы должны смотреть на голос. Это HTML для всего.

Это часть серии интервью один на один с лидерами мнений. Стенограмма была отредактирована для публикации. Если это аудио- или видеоинтервью, нажмите на встроенный проигрыватель выше или подпишитесь через iTunes или Stitcher.