Dave Isbitski dari Amazon: Teknologi Suara Tidak Mengenal Batas Generasi

Diterbitkan: 2020-05-30

Pada tahun 2016 saya melakukan presentasi pertama saya di Amazon Alexa dan Echo, dan pada saat itu ada sekitar 700 keterampilan yang tersedia. Hari ini ada lebih dari 100.000. Dan ratusan juta perangkat yang mendukung Alexa. Jadi, karena kebanyakan dari kita menghabiskan lebih banyak waktu daripada sebelumnya di rumah, saya ingin bertemu lagi dengan Dave Isbitski, Chief Evangelist Amazon untuk Alexa dan Echo.

Dalam obrolan yang cukup luas yang kami lakukan di LinkedIn Live baru-baru ini, Dave berbagi beberapa cerita tentang bagaimana orang menggunakan Alexa/Echo dan asisten pintar secara umum selama pandemi Covid-19, mengapa menurutnya teknologi suara menyatukan generasi, dan bagaimana dia melihat suara memainkan peran utama di era PC (Pasca Covid).

Di bawah ini adalah transkrip yang diedit dari sebagian percakapan kami. Untuk mendengar obrolan penuh klik pada pemutar SoundCloud yang disematkan.

smallbiztrends · Dave Isbitski dari Amazon – Suara adalah teknologi pertama yang disukai orang tua saya seperti anak-anak saya

Tren Bisnis Kecil: Seberapa jauh hal-hal datang dengan perangkat Alexa dan Echo?

Dave Isbitski: Pada tahun 2014, jika saya akan mengatakan, siapa yang memiliki Echo? Aku harus menjelaskan apa itu. Sekarang di tahun 2020, kebanyakan orang tahu apa itu Echo. Maksudku, bahkan ada drama komedi Saturday Night Live. Mereka mengerti apa itu Alexa. Mereka mungkin memiliki banyak perangkat. Mereka hanya asisten cerdas dan AI di semua bidang. Itu benar-benar berubah sebagai bagian dari bahasa sehari-hari. Itu bagian dari rutinitas sehari-hari orang.

Apa yang orang mungkin atau mungkin tidak ketahui adalah bahwa Anda memiliki kemampuan untuk mengajarkan AI ini. Jadi bukan Alexa, ini salah satu dari asisten pintar ini. Apa yang kami lakukan di Amazon adalah kami menjadikannya gratis, terbuka, dan tersedia untuk semua orang. Jadi, apakah mereka ingin memiliki Alexa dalam berbagai hal, seperti mobil, stereo mobil, atau ponsel Anda. Windows memiliki Alexa bawaan sekarang, atau Anda ingin mengajari Alexa cara melakukan percakapan tentang berbagai hal.

Dan ketika Anda berbicara tentang sesuatu, kami menyebutnya keterampilan. Jadi, Anda mengajari Alexa keterampilan baru dan Anda dapat mengobrol tentang apa saja. Dan itu bisa berupa hal-hal seperti memesan Domino Anda sekarang, bukan? Ketika kita duduk di rumah dalam pandemi, mereka mengantarkan. Anda bisa melakukan pemesanan yang mudah atau bisa juga hanya dengan melakukan permainan. Pergi saja ke Amazon… Jika orang penasaran, karena saya mendengar dari orang-orang yang mengatakan, “Hei, anak-anak saya membuat saya gila. Apakah ada permainan?” Pasti ada permainan. Buka amazon.com/skills. Anda akan melihat kategori di sana, Brent, yang tidak kami miliki beberapa waktu lalu. Jadi Anda akan melihat semua kategori ini, sama seperti produk Amazon lainnya, Anda dapat mengurutkan, katakanlah, tunjukkan empat bintang ke atas. Beberapa di antaranya memiliki peringkat puluhan dan puluhan ribu sekarang.

Salah satu hal yang dapat Anda lakukan sekarang sebagai pelanggan Amazon adalah Anda dapat membuka blueprints.amazon.com dan Anda dapat membuat hal-hal ini secara visual. Jadi saya mendengar dari orang tua anak-anak mereka membuat cerita mereka sendiri.

Tren Bisnis Kecil: Ya.

Dave Isbitski: Mungkin Anda sedang mengurus orang lain yang ada di rumah. Anda ingin mengingatkan mereka untuk melakukan sesuatu. Anda ingin menciptakan kemampuan bagi mereka untuk mengajukan pertanyaan. Seperti obat apa yang saya minum? Saya ambil jam berapa? Semua itu dapat Anda lakukan dan kemudian Anda dapat menetapkannya ke akun Amazon mereka.

Saya telah melakukan itu untuk orang tua saya, di mana saya telah menyiapkan sesuatu. Dan itu adalah sesuatu di mana kami telah mencoba untuk membuat proses semulus mungkin bagi Anda untuk mulai mengajar Alexa untuk dapat melakukan percakapan, untuk membuat konten yang Anda inginkan, apakah Anda memiliki kemampuan untuk menulis kode atau tidak.

Tren Bisnis Kecil: Apakah Anda melihat banyak perubahan perilaku dan orang-orang memanfaatkan pembicara mereka untuk melakukan hal-hal yang sebenarnya tidak mereka lakukan sebelumnya?

Dave Isbitski: Nah, salah satu hal yang saya dengar dan Anda akan melihat ini online, Anda bahkan mungkin melihat ini muncul di feed Facebook dan Twitter Anda adalah bahwa sangat penting untuk terhubung selama ini. Kami benar-benar memiliki… Kami mencoba seminggu sekali untuk terhubung dengan orang tua saya melalui video, hanya untuk melihat. Dan salah satu hal yang kami dengar secara konsisten… Jika Anda pergi ke sini. Itu akan membawa Anda ke posting blog seputar Alexa dan perangkat, dan apa yang terjadi. Anda akan mendengar kami membicarakan beberapa hal ini.

Saya rasa ini tidak tersedia saat terakhir kali kita berbicara, tetapi fitur yang populer adalah kemampuan untuk mampir. Jadi, Anda mengatur orang-orang dalam hidup Anda dan kemudian mereka hanya berkata, "Alexa, mampirlah ke kakek-nenek." Atau "Alexa mampir ke ibu." Atau "Alexa mampir ke anak-anak." Dan sungguh luar biasa betapa mulusnya itu. Dan terutama selama pandemi ini adalah kemampuan untuk berkomunikasi seperti itu tanpa perlu ponsel, tanpa memperbarui aplikasi, bukan? Ini adalah sebuah pengalaman. Itu hanya di sana. Dan suaranya mulus. Ini inklusif. Semua orang bisa melakukannya. Suara adalah teknologi pertama yang membuat orang tua saya bersemangat seperti anak-anak saya, bukan? Dan ayah saya masih tidak menggunakan komputer, tapi dia bisa melakukan sesuatu di-

Tren Bisnis Kecil: Benarkah?

Dave Isbitski: Ya, saya tahu ini gila, bukan? Baik saudara laki-laki saya dan saya adalah teknisi, ibu saya mencetak email untuknya. Dia tidak pernah login... Yeah. Tapi saya berbicara tentang di mana kami telah menyumbangkan perangkat ini di rumah sakit dan orang-orang memiliki kemampuan untuk berbicara kapan saja dan terhubung, bukan? Karena Anda juga tidak menyentuhnya, yang merupakan hal penting. Kami telah memberikannya ke rumah sakit di mana perawat memiliki kemampuan untuk check-in dan membicarakannya, semuanya benar-benar hands-free.

Saya baru saja berbicara dengan orang-orang di Johns Hopkins. Dan saya tidak akan menyebut namanya. Dia seorang ahli bedah di New York. Dan itu sangat menghangatkan hati. Dia hanya berkata, “Saya hanya ingin berterima kasih. Dua tahun lalu, ibu saya, dia menderita demensia dan Alzheimer dan kami menggunakan Alexa sepanjang waktu. Dia memiliki kemampuan untuk meminta bantuan. Dia memiliki kemampuan untuk menghubungi kami kapan saja. Dan itulah cara kami berkomunikasi dengannya.”

Jadi beberapa hal yang kami tambahkan. Salah satu temanya adalah feedback dari pelanggan tentang menjadikan Alexa lebih personal. Misalnya, siapa saja kapan saja, Anda bisa memberi tahu Alexa untuk mengingat sesuatu, yang pertama kali saya lakukan adalah mengingat kata sandi Wi-Fi, bukan? Jadi jika kita memiliki tamu, mereka bisa seperti, "Apa kata sandi wifinya?" Benar. Dan dia bisa memberi tahu Anda, atau bisa juga hal-hal seperti orang tua saya mengingat tanggal dan ulang tahun dan hal-hal seperti itu.

Kita semua memiliki kepribadian yang berbeda. Jika Anda melihat Myers-Briggs, jika Anda melihat NBTI dan lima tipe kepribadian inti, seperti saya di INFJ. Saya tidak tahu apakah Anda akrab dengan tipe-tipe itu. Sering kali saya tidak bisa keluar dari kepala saya sendiri, tetapi saya bisa menyulap banyak ide di kepala saya. Saya bisa hidup dalam disonansi kognitif. Orang lain tidak seperti itu. Dan seluler dan web adalah satu ukuran yang cocok untuk semua. Ini seperti, inilah desain kami. Dan jika Anda tidak suka sulit, dan kemudian kami melatih otak kami, bukan? Kami membangun jalur saraf ini dan cara menggunakan antarmuka. Dan kemudian jika Anda mengubah antarmuka itu, itu mengejutkan orang. Jika salah satu situs media sosial ini mengubah tampilan feed mereka setiap hari.


Tren Bisnis Kecil: Benar.

Dave Isbitski: Yang hebat dari suara adalah cara Anda ingin mengkonsumsinya. Anda dapat memutuskan orang seperti apa yang ingin Anda dengar. Faktanya, kami memiliki layanan bernama Polly Brand dan itu menciptakan suara. KFC, kami bekerja dengan mereka dan Anda bisa mendapatkan suara Kolonel. Ini adalah favorit mutlak saya hari ini, dengan perangkat Alexa, Anda dapat mengatakan, "Tanya Sam." Jadi Samuel L. Jackson, dan dia akan memberitahumu cuaca dan lelucon. Dan semua itu menggunakan teknologi yang disebut Neural TTS (text to speech), bukan?

Ada terobosan menggunakan jaring saraf untuk mereproduksi suara. Jadi sekarang melalui Neural TTS, jika Anda menggunakan komputer dan Anda akan melihatnya bahwa itu dihasilkan oleh komputer, tetapi bagi telinga manusia, itu terdengar seperti manusia dan Anda dapat mengubah infleksi. Anda bisa membuatnya bersemangat. Kami telah melakukannya dengan Alexa di mana, saat Anda membuat pengalaman ini, maksud saya, Anda memilih seperti apa suaranya. Anda bisa membuatnya terdengar bersemangat. Kami menambahkan hal untuk pelanggan di mana kami mendengar seperti kami memiliki anak kecil dan saya memainkan lagu pengantar tidur atau saya mematikan lampu di malam hari, bukan? Karena banyak orang yang menggunakan Alexa dengan rumah pintar, mereka akan seperti, "Matikan lampu." Dan dia sangat keras dan membangunkan bayinya, kan? Seperti tidak pernah membangunkan bayi.

Jadi Anda bisa berbisik ke Alexa dan kemudian dia akan berkata, “Oh, sepertinya Anda berbisik. Apakah Anda ingin saya berbisik kembali? ” Dan Anda berkata, "Ya, ini mode bisikan." Dan Anda akan seperti, "Matikan lampu." Dan dia akan seperti, "Oke, saya matikan lampunya." Benar? Tapi itu sangat manusiawi. Area lain yang dapat Anda katakan adalah, "Anda tahu, bicara lebih cepat, bicara lebih lambat, pelan-pelan." Jadi dia akan mengatakan hal-hal lebih lambat, atau dia akan mengatakan hal-hal lebih cepat.

Kami memiliki kemampuan untuk mendeteksi nada, kan? Jadi sangat berbeda. Jika saya mengatakan, "Alexa, tutup mulut." Sebaliknya, “Alexa, terima kasih. Berhenti." Dan kami memiliki segala macam hal. Seperti kita selalu memiliki kemampuan... Saya pikir kita membicarakan hal ini di acara terakhir Anda. Sejak hari pertama, sejak kami diluncurkan, Anda memiliki kemampuan untuk menghapus semua yang pernah Anda katakan kepada Alexa. Anda memiliki kemampuan untuk masuk dan melihat banyak hal. Dan jika Anda tidak ingin berurusan dengan teknologi, Anda bisa menelepon Amazon, selesaikan. Tetapi orang-orang ingin mendengar dan memiliki kemampuan dengan cepat. Jadi kami telah membukanya dan Anda dapat mengatakan hal-hal seperti, "Alexa, hapus apa yang baru saja Anda dengar." Anda bisa mengatakan, “Alexa, apa yang baru saja Anda dengar?” Dan kemudian dia akan mengulanginya kembali. Anda bisa mengatakan, "Alexa, hapus semua yang Anda dengar hari ini."

Dan itu menarik. Anda bahkan dapat mengatakan hal-hal seperti, “Alexa, mengapa Anda melakukan itu?” Dan dia akan seperti, "Nah, inilah yang saya dengar dan inilah mengapa saya melakukan itu." Jadi itu sangat memberdayakan karena membantu orang memahami, karena bahkan sebagai manusia, saya akan mengatakan satu hal, tetapi itu belum tentu apa yang Anda dengar atau proses dengan cara yang sama, bukan? Dan memberikan orang kemampuan itu, mereka seperti, “Oh, dia terus mendengar kata ini. Atau mungkin aku berkata seperti ini.” Ini sangat memberdayakan dalam pengaturan terbuka.

Beberapa hal lainnya adalah bilingual. Jadi Anda dapat beralih antara bahasa Inggris dan Spanyol di AS dengan cepat dan di belakang layar, kami mengambilnya, memasukkannya ke dalam leksikon. Dan agar kedua model bahasa berfungsi dan Anda dapat beralih di antara hal yang sama dengan… Di Kanada, Prancis Kanada, Hindi, dan Inggris di India. Karena begitulah cara kita berbicara sebagai manusia. Jika Anda tumbuh dalam keluarga bilingual, hanya bergerak bolak-balik antara kata dan bahasa dan dia akan dapat melakukannya.

Dan itulah hal-hal semacam itu karena tidak ada yang lebih cepat dari sekadar bisa memintanya. Dan di situlah saya akan mengatakan, kita berkembang seperti di masa sekarang, di situlah kita berada dan kita dapat berbicara tentang masa depan.

Tren Bisnis Kecil: Apakah Anda melihat beberapa interaksi yang biasanya terjadi dengan telepon Anda mulai terjadi dengan perangkat suara Anda?

Dave Isbitski: Yah, saya melihatnya seperti ini. Misi grup kami selalu Alexa di mana pun Anda inginkan. Dan jadi sekarang yang ada di rumah. Tetapi jika Anda berkendara, Anda seharusnya bisa mengatakan, "Alexa, baca buku saya." Dan itu adalah buku audio yang mungkin Anda dengarkan di ruang kerja Anda, bukan? Hanya saja, mulus. Saya telah dikutip mengatakan ini sebelumnya, dan saya pikir itu masih analogi terbaik, adalah bahwa suara adalah HTML baru.

Jadi pikirkan kapan web pertama kali keluar dan internet pertama kali keluar. Bagaimana Anda menghubungi perusahaan? Benar? Itu seperti, Anda menulis surat, Anda berjalan ke lobi mereka atau menelepon. Dan tiba-tiba melalui HTML, kan? Dan saya tidak ingin mengatakan suara adalah web baru, karena web juga mencakup sosial dan segalanya. Karena itu antarmuka. Jadi HTML tiba-tiba menjadi antarmuka untuk terhubung dengan siapa saja, di mana saja di dunia, merek apa pun di dunia untuk dipelajari, bukan? Untuk bertanya tentang apa saja. Itu benar-benar bagaimana HTML menyatukan web. Dan begitulah seharusnya Anda melihat suara. Ini adalah HTML untuk semuanya.

Ini adalah bagian dari seri Wawancara Satu-satu dengan para pemimpin pemikiran. Transkrip telah diedit untuk publikasi. Jika ini adalah wawancara audio atau video, klik pemutar tersemat di atas, atau berlangganan melalui iTunes atau melalui Stitcher.