Dave Isbitski จาก Amazon: Voice Tech รู้ไม่มีขอบเขตของยุค

เผยแพร่แล้ว: 2020-05-30

ในปี 2016 ฉันได้นำเสนอครั้งแรกเกี่ยวกับ Amazon Alexa และ Echo และในขณะนั้นมีทักษะที่มีอยู่ประมาณ 700 ทักษะ วันนี้มีมากกว่า 100,000 คน และอุปกรณ์ที่รองรับ Alexa หลายร้อยล้านเครื่อง เนื่องจากพวกเราส่วนใหญ่ใช้เวลาอยู่ในบ้านมากกว่าที่เคย ฉันต้องการติดต่อกับ Dave Isbitski หัวหน้าผู้เผยแพร่ศาสนาของ Amazon สำหรับ Alexa และ Echo อีกครั้ง

ในการแชทที่ค่อนข้างกว้างขวางที่เรามีบน LinkedIn Live เมื่อเร็วๆ นี้ Dave ได้แบ่งปันเรื่องราวบางส่วนเกี่ยวกับวิธีที่ผู้คนใช้ Alexa/Echo และผู้ช่วยอัจฉริยะโดยทั่วไปในช่วงการระบาดของ Covid-19 เหตุใดเขาจึงคิดว่าเทคโนโลยีเสียงเป็นหนึ่งเดียวจากหลายชั่วอายุคน และเขาเป็นอย่างไร เห็นเสียงมีบทบาทสำคัญในยุคพีซี (หลังโควิด)

ด้านล่างนี้คือข้อความถอดเสียงที่แก้ไขแล้วของส่วนหนึ่งของการสนทนาของเรา หากต้องการฟังการสนทนาแบบเต็ม ให้คลิกที่เครื่องเล่น SoundCloud ที่ฝังไว้

smallbiztrends · Dave Isbitski จาก Amazon – Voice เป็นเทคโนโลยีแรกที่พ่อแม่ของฉันตื่นเต้นเช่นเดียวกับลูกๆ ของฉัน

แนวโน้มธุรกิจขนาดเล็ก: อุปกรณ์ Alexa และ Echo มาไกลแค่ไหน?

Dave Isbitski: ในปี 2014 ถ้าฉันจะบอกว่าใครมี Echo? ฉันต้องอธิบายว่ามันคืออะไร ตอนนี้ในปี 2020 คนส่วนใหญ่รู้ว่า Echo คืออะไร ฉันหมายถึง มีแม้กระทั่งละคร Saturday Night Live พวกเขาเข้าใจสิ่งที่ Alexa เป็น พวกเขาอาจมีอุปกรณ์หลายเครื่อง พวกเขาเป็นเพียงผู้ช่วยที่ชาญฉลาดและ AI ทั่วกระดาน ที่มีการเปลี่ยนแปลงจริงๆโดยเป็นส่วนหนึ่งของภาษาถิ่น เป็นส่วนหนึ่งของกิจวัตรประจำวันของผู้คน

สิ่งที่คนอาจจะรู้หรือไม่รู้ก็คือคุณมีความสามารถในการสอน AI เหล่านี้ได้ ไม่ใช่แค่ Alexa เท่านั้น แต่เป็นผู้ช่วยอัจฉริยะเหล่านี้ สิ่งที่เราทำที่ Amazon คือทำให้ฟรี เปิดกว้าง และพร้อมใช้งานสำหรับทุกคน ไม่ว่าพวกเขาจะต้องการมี Alexa อยู่ในสิ่งของ ไม่ว่าจะเป็นรถยนต์ เครื่องเสียงติดรถยนต์ หรือโทรศัพท์ของคุณ Windows มี Alexa ในตัวอยู่แล้ว หรือคุณต้องการสอน Alexa ถึงวิธีสนทนาเกี่ยวกับสิ่งต่างๆ

และเมื่อคุณมีการสนทนาเกี่ยวกับบางสิ่งบางอย่าง เราเรียกว่าทักษะ คุณกำลังสอนทักษะใหม่ให้ Alexa และคุณสามารถสนทนาได้ทุกเรื่อง และนั่นอาจเป็นสิ่งที่เหมือนกับการสั่งซื้อ Domino ของคุณตอนนี้ใช่ไหม เมื่อเรานั่งอยู่ที่บ้านในช่วงการระบาดใหญ่ คุณสามารถทำคำสั่งง่ายๆหรือเพียงแค่ดึงเกมขึ้นมา ไปที่อเมซอน... ถ้ามีคนสงสัย เพราะฉันได้ยินจากคนที่พูดว่า “เฮ้ ลูกๆ ของฉันมันทำให้ฉันแทบบ้า มีเกมไหม” มีเกมอย่างแน่นอน ไปที่ amazon.com/skills คุณจะเห็นหมวดหมู่บนนั้น เบรนต์ ที่เราไม่มีเมื่อสักครู่นี้ คุณจะเห็นหมวดหมู่ทั้งหมดเหล่านี้ เช่นเดียวกับผลิตภัณฑ์อื่นๆ ของ Amazon คุณสามารถจัดเรียง แสดงให้ฉันเห็นสี่ดาวและให้คะแนนเหนือกว่าได้ บางส่วนเหล่านี้มีการจัดอันดับนับหมื่นในขณะนี้

สิ่งหนึ่งที่คุณสามารถทำได้ในตอนนี้ในฐานะลูกค้าของ Amazon คือ คุณสามารถไปที่ blueprints.amazon.com และคุณสามารถสร้างสิ่งเหล่านี้ด้วยสายตาได้ ดังนั้นฉันจึงได้ยินจากพ่อแม่ที่ลูก ๆ ของพวกเขากำลังสร้างเรื่องราวของตัวเอง

แนวโน้มธุรกิจขนาดเล็ก: ใช่

Dave Isbitski: บางทีคุณอาจกำลังดูแลคนอื่นที่อยู่ที่บ้าน คุณต้องการเตือนพวกเขาให้ทำสิ่งต่างๆ คุณต้องการสร้างความสามารถในการถามคำถาม ชอบกินยาอะไร? ฉันจะเอามันกี่โมง? สิ่งที่คุณทำได้ทั้งหมด จากนั้นคุณสามารถกำหนดให้กับบัญชี Amazon ของพวกเขาได้

ฉันทำเพื่อพ่อแม่ของฉัน ที่ฉันทำสิ่งต่างๆ และนั่นคือสิ่งที่เราได้พยายามสร้างกระบวนการที่ราบรื่นที่สุด เพื่อให้คุณเริ่มสอน Alexa ให้สามารถสนทนาได้ สร้างเนื้อหาที่คุณต้องการ ไม่ว่าคุณจะมีความสามารถในการเขียนโค้ดหรือไม่ก็ตาม

แนวโน้มของธุรกิจขนาดเล็ก: คุณเห็นการเปลี่ยนแปลงทางพฤติกรรมมากมายและผู้คนใช้ประโยชน์จากวิทยากรเพื่อทำสิ่งที่พวกเขาไม่เคยทำมาก่อนหรือไม่

Dave Isbitski: สิ่งหนึ่งที่ฉันได้ยินและคุณจะเห็นสิ่งนี้ทางออนไลน์ คุณอาจเห็นสิ่งนี้เกิดขึ้นในฟีด Facebook ของคุณและ Twitter ก็คือการเชื่อมต่อระหว่างสิ่งนี้เป็นสิ่งสำคัญมาก เรามี… เราพยายามเชื่อมต่อกับพ่อแม่ของฉันสัปดาห์ละครั้งผ่านวิดีโอเพื่อดู และสิ่งหนึ่งที่เราได้ยินมาโดยตลอด… ถ้าคุณไปที่นี่ ซึ่งจะพาคุณไปที่บล็อกโพสต์เกี่ยวกับ Alexa และอุปกรณ์ต่างๆ และสิ่งที่เกิดขึ้น คุณจะได้ยินเราพูดถึงเรื่องนี้บ้าง

ฉันไม่คิดว่าสิ่งนี้จะพร้อมใช้งานเมื่อเราคุยกันครั้งสุดท้าย แต่คุณสมบัติยอดนิยมคือความสามารถในการเข้ามา ดังนั้นคุณจึงตั้งค่าผู้คนในชีวิตของคุณแล้วพวกเขาก็พูดว่า "Alexa มาหาปู่ย่าตายาย" หรือ "Alexa มาหาแม่" หรือ "Alexa ตกหลุมรักเด็ก ๆ " และมันช่างราบรื่นอย่างไม่น่าเชื่อ และโดยเฉพาะอย่างยิ่งในช่วงการระบาดใหญ่นี้คือความสามารถในการสื่อสารแบบนั้นโดยไม่ต้องใช้โทรศัพท์โดยไม่ต้องอัปเดตแอปใช่ไหม นี่คือประสบการณ์ มันอยู่ที่นั่น และเสียงที่ไร้รอยต่อ มันรวม ทุกคนสามารถทำได้ เสียงเป็นเทคโนโลยีแรกที่พ่อแม่ของฉันตื่นเต้นพอๆ กับลูกๆ ใช่ไหม และพ่อของฉันก็ยังไม่ได้ใช้คอมพิวเตอร์ แต่เขาสามารถเปิด-

แนวโน้มธุรกิจขนาดเล็ก: จริงหรือ?

Dave Isbitski: ใช่ ฉันรู้ว่ามันบ้าใช่มั้ย ทั้งพี่ชายของฉันและฉันต่างก็มีเทคโนโลยี แม่ของฉันพิมพ์อีเมลให้เขา เขาไม่เคยบันทึก… ใช่ แต่ฉันกำลังพูดถึงสถานที่ที่เราบริจาคอุปกรณ์เหล่านี้ในโรงพยาบาล และผู้คนสามารถพูดคุยและเชื่อมต่อได้ตลอดเวลาใช่ไหม เพราะคุณไม่ได้สัมผัสมันเช่นกันซึ่งเป็นสิ่งที่สำคัญ เราส่งพวกเขาไปที่โรงพยาบาลที่พยาบาลสามารถเช็คอินและพูดคุยได้ ทั้งหมดนี้ไม่ต้องใช้มือ

ฉันแค่คุยกับคนที่ Johns Hopkins และฉันจะไม่เอ่ยชื่อเขา เขาเป็นศัลยแพทย์ในนิวยอร์ก และมันก็อบอุ่นหัวใจมาก เขาแค่พูดว่า “ฉันแค่อยากจะขอบคุณ เมื่อสองปีที่แล้ว แม่ของฉัน เธอเป็นโรคสมองเสื่อมและอัลไซเมอร์ และเราใช้ Alexa ตลอดเวลา เธอมีความสามารถในการโทรขอความช่วยเหลือ เธอสามารถโทรหาเราได้ตลอดเวลา และเป็นวิธีที่เราสามารถสื่อสารกับเธอได้”

สองสามสิ่งที่เราเพิ่มเข้าไป ธีมหนึ่งคือการตอบรับจากลูกค้าเกี่ยวกับการทำให้ Alexa เป็นส่วนตัวมากขึ้น ตัวอย่างเช่น ไม่ว่าใครก็ตาม คุณสามารถบอกให้ Alexa จดจำสิ่งต่างๆ ได้ตลอดเวลา สิ่งแรกที่ฉันทำคือจำรหัสผ่าน Wi-Fi ใช่ไหม แล้วถ้าเรามีแขกมา พวกเขาก็จะประมาณว่า "รหัสผ่าน wifi คืออะไร" ถูกต้อง. และเธอสามารถบอกคุณได้ หรืออาจเป็นสิ่งที่พ่อแม่ของฉันจำวันที่และวันเกิดและสิ่งต่างๆ เช่นนั้น

เราทุกคนมีบุคลิกที่แตกต่างกัน ถ้าคุณไปดูที่ Myers-Briggs ถ้าคุณดู NBTI และบุคลิกภาพหลักห้าประเภท เช่น ฉันอยู่ใน INFJ ฉันไม่ทราบว่าคุณคุ้นเคยกับประเภทเหล่านั้นหรือไม่ หลายครั้งที่ฉันไม่สามารถออกจากหัวของตัวเองได้ แต่ฉันสามารถเล่นปาหี่หลายความคิดในหัวได้ ฉันสามารถอยู่ในความไม่ลงรอยกันทางปัญญา คนอื่นๆ ไม่ได้เป็นเช่นนั้น และมือถือและเว็บมีขนาดเดียว มันเหมือนกับว่านี่คือการออกแบบของเรา และถ้าคุณไม่ชอบมันยาก แล้วเราก็ฝึกสมองของเราใช่ไหม? เราสร้างเส้นทางประสาทเหล่านี้และวิธีการใช้อินเทอร์เฟซ แล้วถ้าคุณเปลี่ยนอินเทอร์เฟซนั้น มันจะทำให้ผู้คนตะลึง หากหนึ่งในไซต์โซเชียลมีเดียเหล่านี้เปลี่ยนรูปลักษณ์ของฟีดทุกวัน


แนวโน้มธุรกิจขนาดเล็ก: ใช่

Dave Isbitski: สิ่งที่ยอดเยี่ยมเกี่ยวกับเสียงก็คือมันอาจเป็นวิธีที่คุณต้องการบริโภคได้ คุณเลือกได้ว่าอยากฟังคนประเภทไหน อันที่จริง เรามีบริการที่เรียกว่า Polly Brand และสร้างเสียงพูด KFC เราทำงานกับพวกเขา แล้วคุณจะได้เสียงผู้พัน นี่คือสิ่งที่ฉันโปรดปรานที่สุดในวันนี้ ด้วยอุปกรณ์ Alexa คุณสามารถพูดว่า "Ask Sam" ดังนั้น ซามูเอล แอล. แจ็คสัน และเขาจะเล่าเรื่องสภาพอากาศและเรื่องตลกให้คุณฟัง และทั้งหมดนั้นใช้เทคโนโลยีที่เรียกว่า Neural TTS (ข้อความเป็นคำพูด) ใช่ไหม

มีการพัฒนาโดยใช้โครงข่ายประสาทเพื่อสร้างเสียง ดังนั้นตอนนี้ผ่าน Neural TTS หากคุณใช้คอมพิวเตอร์และดูว่าคอมพิวเตอร์สร้างขึ้น แต่สำหรับหูของมนุษย์ ฟังดูเหมือนเป็นมนุษย์ และคุณสามารถเปลี่ยนการผันแปรได้ คุณสามารถทำให้ตื่นเต้น เราทำอย่างนั้นกับ Alexa ที่ซึ่งเมื่อคุณสร้างประสบการณ์เหล่านี้ ฉันหมายความว่าคุณเลือกได้ว่าจะให้เสียงเป็นอย่างไร คุณสามารถทำให้เธอรู้สึกตื่นเต้น เราได้เพิ่มสิ่งให้กับลูกค้าที่เราได้ยินเหมือนมีเด็กและฉันไปเล่นเพลงกล่อมเด็กหรือปิดไฟในเวลากลางคืนใช่ไหม? เนื่องจากผู้คนจำนวนมากที่ใช้ Alexa กับบ้านอัจฉริยะ พวกเขาจะชอบ "ปิดไฟ" และเธอก็ดังมากและปลุกทารกใช่ไหม? เหมือนไม่เคยปลุกทารก

คุณกระซิบบอก Alexa ได้ แล้วเธอก็จะแบบว่า “โอ้ ดูเหมือนคุณกำลังกระซิบ อยากให้ฉันกระซิบกลับไหม” และคุณพูดว่า "ใช่ มันเป็นโหมดกระซิบ" แล้วคุณจะเป็นเหมือน “ปิดไฟ” แล้วเธอก็จะแบบว่า “ตกลง ฉันจะปิดไฟ” ใช่ไหม แต่มันเป็นมนุษย์มาก อีกด้านที่คุณสามารถพูดได้คือ “คุณรู้อะไรไหม พูดเร็วขึ้น พูดช้าลง ช้าลง” ดังนั้นเธอจึงพูดช้าลงหรือพูดเร็วขึ้น

เรามีความสามารถในการตรวจจับโทนเสียงใช่ไหม? มันเลยแตกต่างกันมาก ถ้าฉันพูดว่า "Alexa หุบปาก" เทียบกับ "Alexa ขอบคุณ หยุด." และเรามีทุกสิ่ง เหมือนกับว่าเรามีความสามารถมาตลอด… ฉันคิดว่าเราพูดถึงเรื่องนี้ในรายการที่แล้วของคุณ ตั้งแต่วันแรกที่เราเปิดตัว คุณจะสามารถลบทุกสิ่งที่คุณเคยพูดกับ Alexa ได้ คุณมีความสามารถในการเข้าไปและดูสิ่งต่างๆ และถ้าคุณไม่ต้องการที่จะจัดการกับเทคโนโลยี คุณสามารถโทรหา Amazon ได้เลย แต่ผู้คนต้องการได้ยินและมีความสามารถทันที ดังนั้นเราจึงเปิดประเด็นนี้ขึ้นมาและคุณสามารถพูดได้ว่า "Alexa ลบสิ่งที่คุณเพิ่งได้ยิน" คุณสามารถพูดว่า "Alexa คุณเพิ่งได้ยินอะไร" แล้วเธอก็จะพูดซ้ำ คุณสามารถพูดว่า "Alexa ลบทุกสิ่งที่คุณเคยได้ยินในวันนี้"

และก็น่าสนใจ คุณยังสามารถพูดว่า “Alexa ทำไมคุณถึงทำอย่างนั้น” แล้วเธอก็จะแบบว่า “ฉันได้ยินมาแบบนี้ และนี่คือเหตุผลที่ฉันทำแบบนั้น” ดังนั้นมันจึงเป็นการเพิ่มขีดความสามารถอย่างมากเพราะมันช่วยให้ผู้คนเข้าใจ เพราะแม้ในฐานะมนุษย์ ฉันจะพูดอย่างหนึ่ง แต่ไม่จำเป็นว่าสิ่งที่คุณได้ยินหรือประมวลผลในลักษณะเดียวกันใช่ไหม และให้ความสามารถนั้นแก่ผู้คน พวกเขาแบบว่า "โอ้ เธอได้ยินคำนี้อยู่เรื่อย หรือบางทีฉันอาจจะพูดแบบนี้” มันมีพลังมากในการตั้งค่าแบบเปิด

สิ่งอื่น ๆ บางอย่างเป็นสองภาษา เพื่อให้คุณสามารถสลับระหว่างภาษาอังกฤษและสเปนในสหรัฐอเมริกาได้ทันทีและเบื้องหลัง เรากำลังพูดถึงเรื่องนี้โดยใส่ลงในพจนานุกรม และเพื่อให้โมเดลภาษาทั้งสองใช้งานได้ และคุณสามารถสลับไปมาระหว่างสิ่งเดียวกันกับ... ในแคนาดา ฝรั่งเศส แคนาดา ฮินดี และอังกฤษในอินเดีย เพราะนั่นคือวิธีที่เราพูดในฐานะมนุษย์ หากคุณเติบโตมาในครอบครัวที่พูดได้สองภาษา แค่สลับไปมาระหว่างคำและภาษา เธอก็จะทำได้

และมันก็เป็นแบบนั้นเพราะไม่มีอะไรจะเร็วไปกว่าเพียงแค่สามารถขอมันได้ และนั่นคือสิ่งที่ฉันจะบอกว่า เรากำลังพัฒนาเหมือนในปัจจุบัน นั่นคือที่ที่เราอยู่ และเราสามารถพูดคุยเกี่ยวกับการมองอนาคตได้

แนวโน้มธุรกิจขนาดเล็ก: คุณเห็นการโต้ตอบบางอย่างที่ปกติจะเกิดขึ้นกับโทรศัพท์ของคุณโดยเริ่มเกิดขึ้นกับอุปกรณ์เสียงของคุณหรือไม่?

Dave Isbitski: ฉันมองแบบนี้ ภารกิจของกลุ่มของเราคือ Alexa ทุกที่ที่คุณต้องการ และตอนนี้ก็อยู่ในบ้าน แต่ถ้าคุณไปขับรถ คุณจะสามารถพูดว่า "Alexa อ่านหนังสือของฉัน" และมันเป็นหนังสือเสียงที่คุณเพิ่งฟังในถ้ำใช่ไหม ก็แค่มันไร้รอยต่อ ฉันเคยพูดแบบนี้มาก่อนแล้ว และฉันคิดว่ามันยังเปรียบเทียบได้ดีที่สุด นั่นคือเสียงนั้นเป็น HTML ใหม่

ลองนึกถึงเวลาที่เว็บออกมาครั้งแรกและอินเทอร์เน็ตออกมาก่อน คุณติดต่อบริษัทต่างๆ ได้อย่างไร? ใช่ไหม มันเหมือนกับว่า คุณเขียนจดหมาย คุณเดินเข้าไปในล็อบบี้หรือโทรศัพท์ แล้วจู่ๆ ก็ผ่าน HTML ใช่ไหม? และฉันไม่อยากจะบอกว่าเสียงคือเว็บใหม่ เพราะเว็บนั้นครอบคลุมสังคมและทุกอย่างด้วย เพราะมันคืออินเทอร์เฟซ ดังนั้น HTML กลายเป็นอินเทอร์เฟซสำหรับเชื่อมต่อกับใครก็ได้ ทุกที่ในโลก แบรนด์ใดในโลกให้เรียนรู้ใช่ไหม ที่จะถามคำถามเกี่ยวกับอะไร มันเป็นวิธีการที่ HTML นำเว็บมารวมกันจริงๆ และนั่นคือวิธีที่คุณควรมองเสียง เป็น HTML สำหรับทุกสิ่ง

นี่เป็นส่วนหนึ่งของซีรีส์สัมภาษณ์ตัวต่อตัวกับผู้นำทางความคิด แก้ไขการถอดเสียงเพื่อเผยแพร่แล้ว หากเป็นการสัมภาษณ์ด้วยเสียงหรือวิดีโอ ให้คลิกที่โปรแกรมเล่นที่ฝังไว้ด้านบน หรือสมัครผ่าน iTunes หรือผ่าน Stitcher