Эрик Паундс из Nvidia: «Традиционно алгоритмы после того, как не поняли контекст диалогов»; Это возможно сейчас
Опубликовано: 2022-11-02Чуть больше года назад я разговаривал с Брайаном Катандзаро из Nvidia о некоторых интересных технологиях, которые они разрабатывали в области графического ИИ, синтеза голоса и разговорного/речевого ИИ.
Брайан поделился видением того, как такие вещи, как машинное и глубокое обучение, могут повлиять на то, как мы воспринимаем окружающий мир. И хотя некоторые вещи, такие как ИИ, создающий такие вещи, как искусство, музыка и человеческие голоса, привлекают много внимания, есть несколько более практических примеров того, как ИИ уже используется для улучшения качества обслуживания клиентов, когда нам нужна помощь с продуктом или услугой. .

По прошествии года мне было любопытно узнать, как продвигаются дела в этих областях, и мне посчастливилось поговорить через LinkedIn Live с Эриком Паундсом, старшим директором по корпоративным вычислениям и науке о данных в Nvidia, о таких вещах, как разговорный и речь ИИ переехал с тех пор, как я в последний раз разговаривал с Брайаном. Ниже приводится отредактированная стенограмма нашего разговора. Нажмите на встроенный проигрыватель SoundCloud, чтобы прослушать разговор полностью.
Брент Лири: С чем мы имеем дело сегодня, когда речь заходит о речевом ИИ и разговорном ИИ?
Эрик Паундс: Вы думаете о речевом ИИ, думаете о таких функциях, как автоматическое распознавание речи, когда ИИ работает в фоновом режиме и может сразу распознать, что вы говорите. Он может транскрибировать сказанное. Затем он может действовать в режиме реального времени на основе этой информации. И вы можете дать много полезных вещей, делая это. Представьте себе агента по обслуживанию клиентов в конце телефонного разговора. Многие из нас, с другой стороны, со стороны потребителя, хотят… А чего мы действительно хотим? Ну, во-первых, нам нравится разговаривать с людьми, а во-вторых, мы хотим быстро получить помощь, верно?
Представьте, что вы используете его на задней панели, поэтому на стороне агента представьте, что я разговариваю с агентом, пытающимся получить некоторую помощь, и задаю кучу вопросов, представьте, что ИИ работает в фоновом режиме, вытаскивая статьи, основанные на знаниях, поиск информации, поиск полезных инструментов и помощь в ответе на мой вопрос.
Тогда у агента будет вся эта информация прямо под рукой, чтобы помочь мне решить мою проблему. Это похоже на то, что рядом с вами сидит почти такая же сверхдержава, чтобы помочь кому-то получить отличный опыт и решить свои проблемы, верно? Когда мы думаем об ИИ, особенно в этом контексте, речь не идет о замене человека роботом, с которым вы будете разговаривать. Есть эти дополнительные шаги, которые смогут помочь предприятиям, предоставляющим услуги своим клиентам буквально на десятилетия вперед.
Данные имеют основополагающее значение, эмпатия добавляет необходимый человеческий фактор
Брент Лири: Когда люди думают об ИИ, у них есть узкое определение и узкий взгляд на то, на что он может реально повлиять. Но когда дело доходит до взаимодействия с клиентами, когда им нужна помощь, кажется, что это не просто ИИ, а комбинация, по крайней мере, ощущения, что вы общаетесь с человеком, по крайней мере, с человеческим звучанием или с кем-то, у кого есть какая-то сочувствие человека. Это так же важно, как иметь в своем распоряжении правильные данные.
Эрик Паундс: Абсолютно. Данные являются основополагающим элементом всего этого. Если мы расшифруем звонок, это даст данные в режиме реального времени. Но также есть и другие данные, которые уже существуют, часто хранящиеся внутри бизнеса, которые можно использовать. И я думаю, что одна из лучших стратегий, которую может использовать любой бизнес, — это выяснить: «Хорошо. Какие ценные данные у меня уже есть, которыми я уже владею? И как я могу использовать это, чтобы улучшить качество обслуживания клиентов?» Некоторые из них могут быть просто общими данными.
Например, каждый раз, когда происходит транзакция клиента, происходит взаимодействие, которое создает данные. Вы можете получить много информации о тенденциях, закономерностях и тому подобном. Они могли бы помочь будущим клиентам, верно? Часто многие из этих звонков, взаимодействий расшифровываются и сохраняются. Мы все слышим такую часть начала любого звонка, как: «Этот звонок может прослушиваться.
Если вы продолжите, вот что произойдет». Думайте об этом как о краудсорсинговой информации. Вы действительно можете использовать эту информацию в своих интересах. Поэтому я думаю, что многое начинается с того, как вы используете данные.
Соединительный контекст
Брент Лири: Не могли бы вы немного рассказать о компоненте этого, где мы можем не только иметь отличную транскрипцию и понимание естественного языка, но и компонент настроения, способность использовать эмпатию вместе с речевым ИИ как часть? комбинация. Потому что частью этого является решение проблемы или помощь, но другая часть — это то, как это происходит, и ощущение, которое люди получают не только от того, что что-то исправили, но и от того, как это было исправлено, от того, как они были вовлечены. , их сообщество, эмпатия, идущая туда и обратно. Можете ли вы немного рассказать о том, где мы находимся с этим?
Эрик Паундс: Часто, когда я говорю одно, а вы отвечаете, а потом я говорю другое, следующее предложение связано с первым предложением. Когда вы смотрите на то, как традиционно работали алгоритмы, они часто не понимают этого контекста. Они не обрабатывают это и не принимают во внимание. Это возможно сейчас. Например, недавно на нашей конференции в прошлом месяце мы представили несколько демо, NVIDIA GTC, мы выпустили демо.
Это демонстрация обслуживания клиентов с использованием платформы искусственного интеллекта, которую мы называем NVIDIA Tokkio, которая показывает, как именно это работает в отношении обеспечения взаимодействия, которое является реалистичным, которое понимает, что я говорю, что я прошу, и способно сделать это в естественном типе течения человеческого разговора. И это критично. Поскольку мы автоматизируем большую часть всего процесса, это абсолютно необходимо. Потому что, как вы сказали, мы хотим взаимодействовать с людьми, верно? Как вы сказали, кто-то звонит, они хотят услышать человеческий голос, им нужен кто-то дружелюбный, понимающий их, ценящий то, что они говорят.
Если ИИ построен на таком уровне, он должен уметь это делать. В противном случае опыт не будет хорошим. Я думаю, что это важно, когда мы говорим о технологии ИИ. Когда дело доходит до речевого ИИ или разговорного ИИ, есть много технических нюансов, например: «Хорошо. Хорошо, какой процент слов, которые вы говорите, я понимаю? Могу ли я понять ваши слова в шумной обстановке? Я могу делать все это». И так работает технология.
Но что действительно важно, так это отличный опыт или нет? Вы можете применить потрясающие технологии для решения этой задачи и все же не обеспечить отличный клиентский опыт. И это самое главное, не так ли? Таким образом, мы выбрали подход с нашей технологией, что одна из самых важных вещей, которые мы можем помочь нашим клиентам, — это взять ИИ, взять эти предварительно обученные модели и иметь возможность настраивать их для своей области и своей среды. .
Если вы управляете колл-центром, где большинство дискуссий идет о ботанике, я не могу вспомнить названия растений, которые я изменил за время моего переднего двора, верно? Но если это так, вам нужно убедиться, что этот ИИ понимает определенные термины, фразы и контекст в этой области. Или, если это компания по производству медицинского оборудования, вы можете себе представить, что в этом разговоре будет обсуждаться множество вещей, которые не являются обычным разговором, которому обучалась бы модель ИИ.
Так что кастомизация так же важна, как и жаргон, верно? Таким образом, исходя из регионов мира, в которых живут ваши клиенты или из которых звонят, вы хотите иметь возможность понимать диалекты, жаргон и подобные вещи и иметь возможность правильно с этим обращаться. Так что многое из этого не… Вы не можете просто взять стандартную модель ИИ и развернуть ее для работы в среде, и она везде обеспечит отличный опыт. Персонализация будет очень важна.
Не упускайте из виду данные прямо перед вами
Брент Лири: Каковы некоторые из вещей, которые, возможно, компании все еще пытаются понять с точки зрения продвижения вперед?
Эрик Паундс: В контексте этого разговора, как вы упомянули, у вас хорошие отношения с рядом компаний, которые создают платформы CRM, которые используются многими различными предприятиями и организациями. Часто у предприятия есть свой существующий стек услуг или стек технологий, а затем они хотят сделать что-то новое. Иногда там, где они есть сегодня, есть некоторые ограничения.
Так что это часто добавляет некоторые сложности, потому что отчасти это так: «Ну, я могу создать это самостоятельно и подключить к моей существующей платформе». Или иногда вам нужно вернуться к своему независимому поставщику программного обеспечения и сделать запрос на добавление функции, например: «Эй, мы действительно хотим это сделать. Каковы ваши идеи?»
Я думаю, что самое главное, когда вы начинаете эти разговоры, понимаете данные, которые у вас под рукой. Поймите, что вы можете сделать самостоятельно, на что способны ваши независимые поставщики программного обеспечения, что вы могли бы сделать, если бы вам немного помогли консультантом. И я думаю, что просто имея полное понимание, вы можете сделать позитивные шаги вперед.
Большинство первых ИИ-проектов внутри предприятий привыкли… Они на них зубы набивали, да? Они не всегда успешны. Это новая технология. Поэтому я бы сказал, что сейчас очень важно подготовиться как можно лучше, чтобы у вас были наибольшие шансы на успех в вашем первом проекте.
Брент Лири: С точки зрения приложения CRM, особенно если вы продавец, они ненавидят использовать CRM. Они не любят вкладывать вещи. Они не подписывались, чтобы печатать, свайпать или кликать. Они действительно хотят выходить на улицу, строить отношения и продавать вещи. И моя фантазия такова: было бы здорово, если бы вы могли просто поговорить со своим корпоративным приложением, будь то CRM или ERB, или любой другой аббревиатурой, которую вы хотите использовать, если бы вы могли просто поговорить с ним, как мы говорим прямо сейчас и заняться своими делами, это просто фантазия? Или вы видите день, когда мы действительно могли бы вести такой разговор с нашими приложениями?
Эрик Паундс: Нет, не должно быть. Особенно в наши дни, когда большинство из них… Вы упомянули что-то вроде: «Хорошо. Я должен вернуться в Salesforce и обновить эту запись после разговора с этим клиентом или потенциальным клиентом». И мы все знаем, что часто эти записи не так хорошо обновляются, и тогда у бизнеса нет аналитики, необходимой для продвижения вперед, верно? Трубопровод не обновлен. Вы не можете извлечь из этого урок. Многие из этих разговоров сейчас такие же, как у нас, верно? Они удаленные. Они не в конференц-зале в каком-то здании. Или даже если они находятся в конференц-зале в каком-то здании, часто есть кто-то удаленный. И так есть система прослушивания этого разговора.
Просто иметь возможность расшифровать этот разговор и иметь возможность сделать это, в данном случае, для менеджера по работе с клиентами или кого-либо, кто в нем участвует, было бы здорово. И на это сегодня способны все. Так же, как этот разговор, этот разговор расшифрован. Вы используете какую-то функцию ASR для расшифровки разговора, затем вы применяете какую-то функцию NLU или NLP, чтобы понять контекст того, о чем, черт возьми, мы говорим. И тогда вы могли бы довольно легко обновить множество этих стандартных полей. И это все повторяющиеся вещи. Чем более повторяющимся является действие, тем проще должно быть применение ИИ.
Это часть серии интервью один на один с лидерами мнений. Стенограмма была отредактирована для публикации. Если это аудио- или видеоинтервью, нажмите на встроенный проигрыватель выше или подпишитесь через iTunes или Stitcher.
