亞馬遜的 Dave Isbitski:語音技術沒有代際界限

已發表: 2020-05-30

2016 年,我在 Amazon Alexa 和 Echo 上做了第一次演示,當時有大約 700 種技能可用。 今天有超過100,000。 以及數以億計的支持 Alexa 的設備。 因此,由於我們大多數人在家里花費的時間比以往任何時候都多,我想再次趕上亞馬遜的 Alexa 和 Echo 首席佈道者 Dave Isbitski。

在我們最近在 LinkedIn Live 上進行的一次相當廣泛的聊天中,Dave 分享了一些關於人們在 Covid-19 大流行期間如何使用 Alexa/Echo 和智能助手的故事,為什麼他認為語音技術正在團結幾代人,以及他如何認為語音在 PC(後 Covid)時代發揮著重要作用。

以下是我們部分對話的編輯記錄。 要收聽完整的 convo,請單擊嵌入式 SoundCloud 播放器。

smallbiztrends · 亞馬遜的 Dave Isbitski – 語音是我的父母和我的孩子一樣興奮的第一項技術

小型企業趨勢:Alexa 和 Echo 設備取得了怎樣的進展?

Dave Isbitski: 2014 年,如果我說,誰有 Echo? 我不得不解釋那是什麼。 現在到了 2020 年,大多數人都知道 Echo 是什麼。 我的意思是,甚至還有周六夜現場的小品。 他們知道 Alexa 是什麼。 他們可能有多個設備。 他們只是全面的智能助手和人工智能。 作為白話的一部分,這確實發生了變化。 這是人們日常生活的一部分。

人們可能知道也可能不知道的是,您有能力教授這些 AI。 所以它不是 Alexa,而是這些智能助手中的任何一個。 我們在亞馬遜所做的就是讓所有人免費、開放和使用它。 因此,無論他們是否想在事物中使用 Alexa,例如汽車、汽車音響、手機。 Windows 現在內置了 Alexa,或者您想教 Alexa 如何就事物進行對話。

當您就某事進行對話時,我們稱其為技能。 所以你正在教 Alexa 一項新技能,你可以就任何事情進行對話。 這可能就像現在訂購你的多米諾骨牌一樣,對吧? 當我們在大流行中坐在家裡時,他們會提供。 你可以做一個簡單的訂單,或者它可能只是拉起遊戲。 去亞馬遜吧……如果人們很好奇,因為我確實聽到有人說,“嘿,我的孩子快把我逼瘋了。 有遊戲嗎?” 絕對有遊戲。 訪問 amazon.com/skills。 布倫特,你會在那裡看到我們不久前沒有的類別。 所以你會看到所有這些類別,就像任何其他亞馬遜產品一樣,你可以排序,你可以說,給我看四星及以上的評級。 其中一些現在有數以萬計的收視率。

作為亞馬遜客戶,您現在可以做的一件事是您可以訪問 blueprints.amazon.com,您可以直觀地創建這些東西。 所以我從父母那裡聽說他們的孩子正在創造自己的故事。

小企業趨勢:是的。

Dave Isbitski:也許你正在照顧其他在家的人。 你想提醒他們做事。 你想為他們創造提問的能力。 比如我吃什麼藥? 我幾點拿? 您可以執行所有這些操作,然後您可以將其分配給他們的亞馬遜帳戶。

我已經為我的父母這樣做了,我在那裡設置了一些東西。 所以這就是我們試圖創建盡可能無縫的過程,​​讓你開始教 Alexa 能夠進行對話,創建你想要的內容,無論你是否有能力編寫代碼。

小型企業趨勢:您是否看到很多行為變化以及人們利用他們的揚聲器來做他們以前沒有真正做過的事情?

Dave Isbitski:嗯,我聽到的其中一件事,你會在網上看到,你甚至可能會在你的 Facebook 訂閱源和 Twitter 中看到這一點,那就是在所有這些過程中連接非常重要。 我們實際上有......我們每週嘗試一次通過視頻與我的父母聯繫,只是為了看看。 我們經常聽到的一件事……如果你去這裡。 這將帶您訪問有關 Alexa 和設備以及正在發生的事情的博客文章。 您會聽到我們談論其中的一些內容。

我不認為這在我們上次談話時可用,但一個流行的功能是能夠加入。所以你在你的生活中設置了一些人,然後他們只是說,“Alexa,加入祖父母。” 或“Alexa 拜訪媽媽。” 或“Alexa 訪問孩子。” 令人難以置信的是,它變得如此無縫。 尤其是在這種大流行期間,無需手機,無需更新應用程序,就可以像這樣進行交流,對吧? 這是一種體驗。 它就在那裡。 而且聲音是無縫的。 它是包容的。 每個人都可以做到。 語音是我的父母和我的孩子一樣興奮的第一個技術,對吧? 而且我爸爸還不會用電腦,但他可以把東西拉起來——

小企業趨勢:真的嗎?

Dave Isbitski:是的,我知道這很瘋狂,對吧? 我哥哥和我都是技術人員,我媽媽為他打印電子郵件。 他從不記錄……是的。 但我說的是我們在醫院捐贈了這些設備,人們有能力隨時交談和聯繫,對吧? 因為你也沒有碰它,這很重要。 我們一直在將它們提供給醫院,在那裡護士能夠檢查並通過它進行交談,所有這些都完全免提。

我只是在和約翰霍普金斯大學的人交談。 我不會提到他的名字。 他是紐約的外科醫生。 這非常令人心曠神怡。 他只是說:“我只是想謝謝你。 兩年前,我的母親患有癡呆症和老年癡呆症,我們一直在使用 Alexa。 她有能力呼救。 她有能力隨時給我們打電話。 這是我們能夠與她交流的方式。”

所以我們添加了一些東西。 其中一個主題是客戶關於使 Alexa 更加個性化的反饋。 例如,任何人在任何時候,你都可以告訴 Alexa 記住事情,我做的第一件事就是記住 Wi-Fi 密碼,對嗎? 因此,如果我們有客人過來,他們可能會問:“wifi 密碼是多少?” 對。 她可以告訴你,或者讓我父母記住日期和生日之類的事情。

我們都有不同的個性。 如果你看看 Myers-Briggs,如果你看看 NBTI 和五種核心人格類型,就像我在 INFJ 中一樣。 我不知道你是否熟悉這些類型。 很多時候我無法擺脫自己的頭腦,但我可以在腦海中處理多個想法。 我可以生活在認知失調中。 其他人不是這樣的。 移動和網絡是一刀切。 就像,這是我們的設計。 如果你不喜歡它,那麼我們訓練我們的大腦,對吧? 我們建立這些神經通路以及如何使用接口。 然後,如果您更改該界面,這對人們來說是驚人的。 如果這些社交媒體網站之一改變了他們的訂閱源每天的外觀。


小企業趨勢:對。

Dave Isbitski:語音的好處在於它可以是你想要消費它的方式。 你可以決定你想听什麼類型的人。 事實上,我們有一項名為 Polly Brand 的服務,它可以創造聲音。 肯德基,我們與他們合作,你可以聽到上校的聲音。 這是我今天最喜歡的,使用 Alexa 設備,你可以說,“問 Sam。” 所以塞繆爾·傑克遜,他會告訴你天氣和笑話。 所有這些都使用了一種稱為神經 TTS(文本到語音)的技術,對吧?

使用神經網絡再現聲音取得了突破。 所以現在通過神經 TTS,如果你使用計算機,你會看到它是計算機生成的,但對於人耳來說,它聽起來像一個人,你可以改變語調。 你可以讓它興奮起來。 我們已經通過 Alexa 做到了這一點,當您創建這些體驗時,我的意思是,您可以選擇聲音的聲音。 你可以讓她聽起來很興奮。 我們為客戶添加了我們聽到的東西,就像我們有小孩一樣,我會去玩搖籃曲或者晚上關燈,對嗎? 因為很多人在智能家居中使用 Alexa,他們會說,“關燈”。 而且她聲音超級大,會吵醒嬰兒,對吧? 就像永遠不要叫醒嬰兒一樣。

所以你可以對 Alexa 耳語,然後她會說,“哦,聽起來你在耳語。 要我迴聲嗎?” 你說,“是的,這是耳語模式。” 所以你會說,“關燈。” 她會說,“好吧,我會關燈。” 對? 但它非常人性化。 你可以說的另一個方面是,“你知道嗎,說得快點,說得慢點,慢點。” 所以她會說得慢一些,或者說得更快。

我們有能力檢測音調,對吧? 所以這是非常不同的。 如果我說,“Alexa,閉嘴。” 與,“Alexa,謝謝你。 停止。” 我們有各種各樣的東西。 就像我們一直都有能力一樣……我想我們在你的上一場演出中談到了這個。 從我們推出的第一天起,您就可以刪除您曾經對 Alexa 說過的所有內容。 你有能力進去看看。 如果你不想處理技術,你可以打電話給亞馬遜,讓它完成。 但人們想听到並擁有即時的能力。 所以我們打開了它,你可以說,“Alexa,刪除你剛剛聽到的內容。” 你可以說,“Alexa,你剛剛聽到了什麼?” 然後她會重複一遍。 你可以說,“Alexa,刪除你今天聽到的所有內容。”

這很有趣。 你甚至可以說,“Alexa,你為什麼這樣做?” 她會說,“嗯,這就是我聽到的,這就是我這樣做的原因。” 所以它非常有力量,因為它可以幫助人們理解,因為即使作為人類,我也會說一件事,但這不一定是你聽到的或以同樣的方式處理的,對吧? 所以給人們這種能力,他們就像,“哦,她一直聽到這個詞。 或者我是這麼說的。” 它在開放式設置中非常強大。

其他一些東西是雙語的。 因此,您可以在美國即時在英語和西班牙語之間切換,在幕後,我們將其納入詞典。 這樣兩種語言模型都可以正常工作,您可以在同一事物之間切換……在加拿大、加拿大法語、印地語和印度英語。 因為這就是我們作為人類說話的方式。 如果你在雙語家庭長大,只要在單詞和語言之間來回移動,她就能做到。

所以它就是那些類型的東西,因為沒有什麼比能夠要求它更快的了。 所以這就是我想說的,我們正在像現在一樣發展,這就是我們所處的位置,我們可以談論未來的展望。

小型企業趨勢:您是否看到一些通常會在您的手機上發生的交互開始在您的語音設備上發生?

Dave Isbitski:嗯,我是這樣看的。 我們團隊的使命始終是讓 Alexa 出現在您想要的任何地方。 所以現在它在房子裡。 但如果你去開車,你應該可以說,“Alexa,讀我的書。” 那是有聲讀物,也許你只是在你的書房裡聽,對吧? 只是,它是無縫的。 之前有人引用過我這樣說,我認為這仍然是最好的類比,就是語音是新的 HTML。

所以想一想網絡是什麼時候出現的,互聯網是什麼時候出現的。 你是如何联系公司的? 對? 就像,你寫了一封信,你走進他們的大廳或打電話。 突然通過 HTML,對嗎? 我不想說語音是新的網絡,因為網絡是如此包含社交和一切。 因為是界面。 所以 HTML 突然變成了連接世界上任何人、任何地方、任何品牌學習的接口,對吧? 就任何事情提出問題。 正是 HTML 將 Web 結合在一起的方式。 這就是你看待聲音的方式。 它是所有內容的 HTML。

這是與思想領袖的一對一訪談系列的一部分。 成績單已編輯出版。 如果是音頻或視頻採訪,請點擊上面的嵌入式播放器,或通過 iTunes 或通過 Stitcher 訂閱。