Amazon'dan Dave Isbitski: Voice Tech Nesil Sınırlarını Bilmiyor

Yayınlanan: 2020-05-30

2016'da Amazon Alexa ve Echo'da ilk sunumumu yaptım ve o sırada yaklaşık 700 beceri mevcuttu. Bugün 100.000'den fazla var. Ve yüz milyonlarca Alexa özellikli cihaz. Çoğumuz evlerimizde her zamankinden daha fazla zaman geçirdiğimiz için, Amazon'un Alexa ve Echo Baş Evangelisti Dave Isbitski ile tekrar görüşmek istedim.

Geçenlerde LinkedIn Live'da yaptığımız oldukça kapsamlı bir sohbette Dave, insanların Kovid-19 pandemisi sırasında Alexa/Echo'yu ve genel olarak akıllı asistanları nasıl kullandığına, ses teknolojisinin neden nesilleri birleştirdiğini düşündüğüne ve nasıl kullandığına dair bazı hikayeleri paylaşıyor. PC (Post Covid) çağında sesin önemli bir rol oynadığını görüyor.

Aşağıda, konuşmamızın bir bölümünün düzenlenmiş bir dökümü bulunmaktadır. Konuşmanın tamamını dinlemek için yerleşik SoundCloud oynatıcıya tıklayın.

smallbiztrends · Amazon'dan Dave Isbitski – Voice, ailemin çocuklarım kadar heyecanlandığı ilk teknoloji

Küçük İşletme Eğilimleri: Alexa ve Echo cihazlarıyla işler ne kadar ilerledi?

Dave Isbitski: 2014'te, kimin Echo'su olduğunu söylersem? Bunun ne olduğunu açıklamam gerekiyordu. Şimdi 2020'de çoğu insan Echo'nun ne olduğunu biliyor. Yani, Saturday Night Live skeci bile var. Alexa'nın ne olduğunu anlıyorlar. Muhtemelen birden fazla cihazı vardır. Onlar sadece akıllı asistanlar ve yönetim kurulu genelinde AI. Bu, yerel dilin bir parçası olarak gerçekten değişti. İnsanların günlük rutinlerinin bir parçası.

İnsanların bilebileceği veya bilemeyeceği şey, bu AI'ları öğretme yeteneğine sahip olduğunuzdur. Yani sadece Alexa değil, bu akıllı asistanlardan herhangi biri. Amazon'da yaptığımız şey, bunu ücretsiz, açık ve herkes için erişilebilir kılmaktır. Yani otomobiller olabilir, araba teybi olabilir, telefonunuz olabilir. Windows'ta şu anda yerleşik Alexa var veya Alexa'ya bazı şeyler hakkında nasıl konuşulacağını öğretmek istiyorsunuz.

Ve bir şey hakkında konuştuğunuzda buna beceri deriz. Yani Alexa'ya yeni bir beceri öğretiyorsun ve her şey hakkında konuşabilirsin. Ve bu, şu anda Domino'nuzu sipariş etmek gibi bir şey olabilir, değil mi? Bir salgında evde otururken, teslim ediyorlar. Kolay bir sipariş verebilirsin ya da sadece oyunları çekmek olabilir. Sadece Amazon'a gidin… İnsanlar merak ediyorsa, çünkü insanlardan “Hey, çocuklarım beni deli ediyor. Oyunlar var mı?” Kesinlikle oyunlar var. amazon.com/skills adresine gidin. Orada, bir süre önce beğenmediğimiz kategorileri göreceksin, Brent. Böylece tüm bu kategorileri göreceksiniz, tıpkı diğer Amazon ürünleri gibi, sıralayabilirsiniz, diyebilirsiniz, bana dört yıldız ve üzeri puanlar gösterin. Bunlardan bazılarının şu anda on binlerce puanı var.

Bir Amazon müşterisi olarak şu anda yapabileceğiniz şeylerden biri, blueprints.amazon.com'a gidebilir ve bunları görsel olarak oluşturabilirsiniz. Bu yüzden ebeveynlerden çocuklarının kendi hikayelerini yarattığını duydum.

Küçük İşletme Eğilimleri: Evet.

Dave Isbitski: Belki de evde olan başka birine bakıyorsunuzdur. Onlara bir şeyler yapmalarını hatırlatmak istersiniz. Soru sormaları için yetenek yaratmak istiyorsunuz. Mesela hangi ilacı alıyorum? Ne zaman alırım? Bunların hepsini yapabilir ve ardından Amazon hesaplarına atayabilirsiniz.

Bunu ailem için yaptım, bir şeyler ayarladım. Ve bu, Alexa'ya sohbet edebilmeyi, kod yazabilme yeteneğine sahip olsanız da olmasanız da istediğiniz içeriği oluşturabilmeyi öğretmeye başlamanız için süreci olabildiğince sorunsuz oluşturmaya çalıştığımız bir şey.

Küçük İşletme Eğilimleri: Daha önce gerçekten yapmadıkları şeyleri yapmak için konuşmacılarından yararlanan çok sayıda davranış değişikliği ve insan görüyor musunuz?

Dave Isbitski: Şey, duyduğum şeylerden biri ve bunu çevrimiçi olarak göreceksiniz, hatta bunun Facebook beslemelerinizde ve Twitter'da karşınıza çıktığını görebilirsiniz, tüm bunlar sırasında bağlantı kurmanın çok önemli olduğu. Aslında biz... Sadece görmek için haftada bir kez ailemle video aracılığıyla bağlantı kurmaya çalışıyoruz. Ve sürekli duyduğumuz şeylerden biri… Buraya giderseniz. Bu sizi Alexa ve cihazlarla ilgili bir blog gönderisine ve neler olup bittiğine götürecek. Bunun hakkında konuştuğumuzu duyacaksınız.

Son konuştuğumuzda bunun mevcut olduğunu sanmıyorum, ancak popüler bir özellik, katılma yeteneğidir. Böylece hayatınıza insanları yerleştirirsiniz ve sonra onlar sadece "Alexa, büyükanne ve büyükbabalara uğra" derler. Veya "Alexa anneme uğrar." Veya "Alexa çocuklara uğrar." Ve bunun ne kadar kusursuz hale gelmesi inanılmaz. Ve özellikle bu salgın sırasında bir telefona ihtiyaç duymadan, uygulamaları güncellemeden sadece bu şekilde iletişim kurma yeteneği, değil mi? Bu bir deneyim. Sadece orada. Ve ses sorunsuz. Kapsayıcı. Herkes yapabilir. Ses, ailemin çocuklarım kadar heyecanlandırdığı ilk teknoloji, değil mi? Ve babam hala bilgisayar kullanmıyor ama bazı şeyleri toparlayabiliyor...

Küçük İşletme Trendleri: Gerçekten mi?

Dave Isbitski: Evet, çılgınca olduğunu biliyorum, değil mi? Hem erkek kardeşim hem de ben teknisyeniz, annem onun için e-postalar yazdırır. Asla günlüğe kaydetmez… Evet. Ama ben bu cihazları hastanelerde nereye bağışladığımızdan bahsediyordum ve insanlar istedikleri zaman konuşup bağlantı kurabiliyorlar, değil mi? Çünkü ona da dokunmuyorsun, ki bu önemli bir şey. Onları, hemşirelerin tamamen eller serbest olarak kontrol edip konuşabildiği hastanelere veriyoruz.

Johns Hopkins'teki insanlarla konuşuyordum. Ve adını anmayacağım. New York'ta bir cerrah. Ve çok iç açıcıydı. Sadece, "Sadece sana teşekkür etmek istiyorum. İki yıl önce annem bunama ve Alzheimer hastasıydı ve biz sürekli Alexa kullanıyorduk. Yardım çağırma yeteneği vardı. Bizi her an arayabilme yeteneğine sahipti. Ve onunla iletişim kurabilmemizin yolu buydu.”

Yani birkaç şey ekledik. Temalardan biri, müşterilerin Alexa'yı daha kişisel hale getirme konusundaki geri bildirimleridir. Örneğin, istediğiniz zaman herhangi biri, Alexa'ya bir şeyleri hatırlamasını söyleyebilirsiniz, yaptığım ilk şey Wi-Fi şifresini hatırlamaktı, değil mi? Ve eğer misafirimiz varsa, "Wifi şifresi nedir?" gibi olabilirler. Doğru. Ve size söyleyebilir, ya da ailemin tarihleri, doğum günlerini ve bunun gibi şeyleri hatırlaması gibi şeyler olabilir.

Hepimizin farklı kişilikleri var. Gidip Myers-Briggs'e, NBTI'ye ve beş temel kişilik tipine bakarsanız, INFJ'de olduğum gibi. Bu tiplere aşina mısınız bilmiyorum. Çoğu zaman kendi kafamdan çıkamıyorum ama kafamda birden fazla fikirle hokkabazlık yapabiliyorum. Bilişsel uyumsuzluk içinde yaşayabilirim. Diğer insanlar öyle değil. Ve mobil ve web, herkese uyan tek bir boyuttur. Sanki, işte tasarımımız. Ve eğer zoru sevmiyorsanız, o zaman beynimizi eğitiriz, değil mi? Bu sinir yollarını ve bir arayüzün nasıl kullanılacağını oluşturuyoruz. Ve sonra o arayüzü değiştirirseniz, bu insanlar için şaşırtıcı olur. Bu sosyal medya sitelerinden biri, beslemelerinin her gün görünüşünü değiştirirse.


Küçük İşletme Eğilimleri: Doğru.

Dave Isbitski: Sesle ilgili harika olan şey, onu tüketmek istediğiniz yol olabilir. Ne tür bir insan duymak istediğinize karar verebilirsiniz. Aslında Polly Brand adında bir hizmetimiz var ve sesler çıkarıyor. KFC, onlarla çalıştık ve Albay'ın sesini alabilirsiniz. Bugün kesinlikle favorim bu, Alexa cihazıyla "Sam'e sor" diyebilirsiniz. Yani Samuel L. Jackson, size hava durumunu ve şakaları anlatacak. Ve bunların hepsi Neural TTS (metinden konuşmaya) adlı bir teknoloji kullanıyor, değil mi?

Sesi yeniden üretmek için sinir ağlarını kullanan bir atılım oldu. Şimdi Neural TTS aracılığıyla, bir bilgisayar kullanıyorsanız ve onun bilgisayar tarafından üretildiğine bakacaksınız, ancak insan kulağına bir insan gibi geliyor ve bükülmeyi değiştirebilirsiniz. Onu heyecanlandırabilirsin. Bunu, bu deneyimleri yaratırken sesin neye benzediğini seçeceğiniz Alexa ile yaptık. Sesini heyecanlandırabilirsin. Küçüklerimiz varmış gibi duyduğumuz müşteriler için bir şey ekledik ve ninni çalıyorum ya da geceleri ışıkları kapatıyorum, değil mi? Alexa'yı akıllı ev ile kullanan birçok insan "Işıkları kapat" gibi olacak. Ve çok gürültülü ve bebeği uyandırıyor, değil mi? Bebeği hiç uyandırmamak gibi.

Böylece Alexa'ya fısıldayabilirsiniz ve o zaman "Ah, fısıldıyormuşsunuz gibi geliyor. Fısıldamamı ister misin?” Ve “Evet, fısıltı modu” diyorsunuz. Ve böylece, "Işıkları kapat" gibi olacaksınız. O da "Tamam, ışıkları kapatacağım" diyecek. Doğru? Ama çok insani. Diyebileceğiniz başka bir alan da, "Biliyor musun, daha hızlı konuş, daha yavaş konuş, yavaşla." Ve böylece ya şeyleri daha yavaş söyleyecek ya da daha hızlı söyleyecektir.

Tonu algılama yeteneğimiz var, değil mi? Bu yüzden çok farklı. "Alexa, kapa çeneni" dersem. Karşı, “Alexa, teşekkür ederim. Durmak." Ve her türlü şeye sahibiz. Sanki her zaman sahip olduğumuz bir yeteneğe sahipmişiz gibi… Sanırım bunu son programınızda konuşmuştuk. İlk günden beri, piyasaya sürdüğümüzden beri, Alexa'ya söylediğin her şeyi silme olanağın vardı. İçeri girip bir şeyler görme yeteneğin vardı. Ve teknoloji ile uğraşmak istemiyorsanız, Amazon'u arayıp yaptırabilirsiniz. Ancak insanlar anında duymak ve yeteneğe sahip olmak istediler. Bunu açtık ve "Alexa, az önce duyduğunu sil" gibi şeyler söyleyebilirsin. "Alexa, az önce ne duydun?" diyebilirsiniz. Ve sonra tekrar tekrar edecek. “Alexa, bugün duyduğun her şeyi sil” diyebilirsin.

Ve bu ilginç. Hatta "Alexa, bunu neden yaptın?" gibi şeyler söyleyebilirsin. Ve o şöyle olacak, "Şey, ben böyle duydum ve bunu bu yüzden yaptım." Ve bu çok güçlendirici çünkü insanların anlamalarına yardımcı oluyor, çünkü insan olarak bile bir şey söyleyeceğim, ama mutlaka aynı şekilde duyduğunuz veya işlediğiniz şey değil, değil mi? Ve böylece insanlara bu yeteneği vererek, "Ah, bu kelimeyi duymaya devam ediyor. Ya da belki ben böyle söylüyorum.” Açık bir kurulumda çok güçlendirici.

Diğer bazı şeyler iki dillidir. Böylece ABD'de anında ve perde arkasında İngilizce ve İspanyolca arasında geçiş yapabilirsiniz, bunu bir sözlük haline getiriyoruz. Ve böylece her iki dil modeli de çalışıyor ve aynı şey arasında geçiş yapabilirsiniz… Kanada'da, Kanada'da Fransızca, Hindistan'da Hintçe ve İngilizce. Çünkü insan olarak böyle konuşuyoruz. İki dilli bir ailede büyüdüyseniz, sadece kelimeler ve diller arasında gidip geliyorsanız, o bunu yapabilir.

Ve bu tür şeyler çünkü hiçbir şey onu istemekten daha hızlı olamaz. İşte bu noktada diyebilirim ki, günümüzdeki gibi evrimleşiyoruz, işte bu noktadayız ve geleceğe bakış hakkında konuşabiliriz.

Küçük İşletme Eğilimleri: Telefonunuzun ses cihazlarınızla gerçekleşmeye başlamasıyla birlikte gerçekleşecek olan etkileşimlerden bazılarını görüyor musunuz?

Dave Isbitski: Ben olaya şöyle bakıyorum. Grubumuzun misyonu, her zaman, olmasını istediğiniz her yerde Alexa olmuştur. Ve şu anda bu evde. Ama bir araba yolculuğuna çıkarsan, "Alexa, kitabımı oku" diyebilmelisin. Ve belki de çalışma odasında dinlediğin sesli kitaptı, değil mi? Sadece, sorunsuz. Bunu daha önce söylediğim için alıntı yapıldı ve bence hala en iyi benzetme bu sesin yeni HTML olmasıdır.

Web'in ilk çıktığı ve internetin ilk çıktığı zamanı bir düşünün. Şirketlerle nasıl iletişime geçtiniz? Doğru? Sanki bir mektup yazdınız, lobilerine girdiniz ya da bir telefon görüşmesi yaptınız. Ve aniden HTML aracılığıyla, değil mi? Ve sesin yeni web olduğunu söylemek istemedim, çünkü web sosyal ve her şeyi o kadar kapsıyor ki. Arayüz olduğu için. Böylece HTML birdenbire dünyanın herhangi bir yerindeki herhangi biriyle, dünyanın herhangi bir yerindeki herhangi bir markayla bağlantı kurmak için bir arayüz haline geldi, değil mi? Herhangi bir konuda soru sormak için. HTML'nin web'i nasıl bir araya getirdiği gerçekten buydu. Ve sese bu şekilde bakmalısın. Her şeyin HTML'si.

Bu, düşünce liderleriyle Bire Bir Röportaj serisinin bir parçasıdır. Transkript yayın için düzenlenmiştir. Sesli veya görüntülü bir röportajsa, yukarıdaki gömülü oynatıcıya tıklayın veya iTunes veya Stitcher aracılığıyla abone olun.