AI Berbasis Audio: Masa Depan Audio AI

Diterbitkan: 2024-03-20

Isi Artikel

Audio AI mengubah cara kita membuat dan mengonsumsi konten. Industri ini sudah bernilai $4 miliar , dan diperkirakan nilainya akan meningkat tiga kali lipat pada akhir dekade ini.

Namun seperti apa sebenarnya kondisi audio AI saat ini, dan bagaimana industri muda ini berubah?

Kami menguraikan jenis alat audio AI yang sudah ada, bagaimana pemasar dan bisnis dapat mulai menggunakannya saat ini, dan beberapa indikator menarik tentang arah industri ini.

Siap mendengar robot berbicara? Mari kita mulai.

Lanskap Audio AI Saat Ini

Audio AI menghasilkan suara dan ucapan dengan kecerdasan buatan .

Produk-produk dalam industri ini mencakup alat untuk mengubah teks menjadi ucapan, membuat replika suara untuk dubbing, dan mendukung asisten suara yang dapat meniru nada dan irama manusia. Alat seperti ElevenLabs dan Resemble AI sudah memiliki kemampuan untuk menghasilkan konten audio realistis dan berkualitas tinggi.

Berikut tiga cara masyarakat menggunakan teknologi inovatif ini.

Audio AI untuk Kreator

Audio AI mengubah pembuatan konten, terutama jika menyangkut jenis konten seperti buku audio dan podcast. Kreator kini memiliki opsi untuk menggunakan suara sintetis, yang dapat meniru intonasi dan emosi manusia, sehingga tidak memerlukan pengaturan rekaman tradisional. Hal ini dapat membantu mereka menghemat biaya dan waktu produksi.

Lihat saja video ini — kombinasi AI audio dan video — yang dibuat oleh CEO Foundation Ross Simmonds. Apa yang membutuhkan waktu berjam-jam (untuk duduk, membuat naskah, merekam, dan mengedit), dapat ia selesaikan dalam hitungan menit.

Bagi pemasar dan pebisnis lainnya, ada baiknya mempertimbangkan bagaimana hal ini dapat memungkinkan lebih banyak jenis konten audio. Hal ini terutama berlaku untuk usaha kecil dengan sumber daya terbatas — mungkin sekarang Anda dapat membuat podcast yang sebelumnya terlalu mahal atau memakan waktu.

Kasus penggunaan ini bukannya tanpa kontroversi. Para pengkritik mengemukakan kekhawatiran etis seputar persetujuan dan kompensasi dan berpendapat bahwa hal itu dapat melemahkan profesi pengisi suara. Risiko audio palsu dan potensi penyalahgunaan juga besar, sehingga menyoroti perlunya kerangka peraturan untuk mengelola teknologi baru ini secara bertanggung jawab.

Salah satu respons terhadap risiko teknologi ini adalah perizinan suara. Beberapa pengisi suara merespons ancaman terhadap profesi mereka dengan melisensikan suara mereka untuk digunakan sebagai klon suara AI di layanan seperti perpustakaan suara ElevenLabs. Lalu, mereka akan mendapat biaya lisensi setiap kali ada yang menggunakan suaranya.

Namun di AS, suara itu sendiri tidak dianggap memiliki hak cipta , hanya rekaman suara tertentu. Sama seperti menggunakan penyanyi yang “mirip suara” adalah cara legal untuk meniru suara seseorang, hal yang sama juga berlaku untuk audio deepfake. Hal ini menempatkan kloning dan perizinan suara dalam wilayah abu-abu hukum, terutama karena kasus hukum yang relevan berasal dari tahun 1988. Hanya kasus-kasus lebih lanjut dan pengesahan undang-undang seperti No AI Fraud Act yang dapat memperjelas hal ini.

Audio AI untuk Terjemahan dan Sulih Suara

Audio AI juga mengubah industri terjemahan dan sulih suara. Teknologi ini dapat menciptakan interpretasi teks-ke-suara dan suara-ke-suara, berupaya meniru nada dan emosi pembicara asli untuk pengalaman mendengarkan yang lebih autentik.

Postingan viral di media sosial ini menunjukkan kemampuan sulih suara AI untuk mendobrak hambatan bahasa bahkan dalam musik:

Sulih suara dari bahasa Inggris ke bahasa Mandarin ini telah ditonton 1,7 juta kali pada saat diposting. Sebagian besar orang yang mengomentari postingan tersebut bahkan tidak bisa berbicara bahasa tersebut — mereka hanya kagum dengan teknologinya.

Namun terlepas dari potensinya, masih ada risiko yang terkait dengan terjemahan dan sulih suara AI. Misalnya, hal ini membuka pintu bagi hilangnya nuansa dalam penerjemahan, serta salah tafsir budaya. Hal ini juga memunculkan pertimbangan etis terkait dengan mereplikasi suara seseorang tanpa persetujuannya.

Ada juga risiko bahwa orang dengan sengaja memanipulasinya untuk melakukan dubbing yang salah terhadap kata-kata seseorang yang sebenarnya. Berikut contoh seseorang membuat video palsu Morgan Freeman berbicara, dengan hasil yang cukup meyakinkan:

Memastikan keakuratan dan menghormati hak orang lain untuk memilih bagaimana suara mereka digunakan sangatlah penting seiring kemajuan teknologi ini. Jika digunakan secara efektif, hal ini dapat membuka banyak kemungkinan, memungkinkan kita menikmati konten yang sebelumnya tidak dapat diakses dan bahkan berbicara dengan orang lain dengan lebih mudah dibandingkan sebelumnya.

Audio AI untuk Asisten Suara

Asisten suara seperti Siri, Alexa, dan Google Assistant sudah didukung oleh audio AI, menggunakan pemrosesan bahasa alami untuk memahami dan merespons perintah pengguna. Asisten ini mewakili aplikasi audio AI yang signifikan, baik dalam mengenali maupun menggunakan ucapan untuk berinteraksi dengan pengguna.

Asisten suara sudah populer, dengan 62% orang dewasa Amerika melaporkan bahwa mereka menggunakannya.

Dengan semakin berkembangnya AI, kemungkinan besar teknologi tersebut akan menjadi lebih akurat – dan karenanya lebih populer – di masa depan. Seiring dengan meningkatnya jumlah tersebut, semakin penting bagi bisnis untuk mengoptimalkan artikel dan konten online lainnya untuk penelusuran suara.

Namun ada beberapa kekhawatiran juga pada mereka. Google telah menjadi sasaran tuntutan hukum yang menuduh mereka merekam dan mendistribusikan percakapan orang-orang yang mengaktifkan asisten suaranya secara tidak sengaja secara ilegal.

Masa Depan Audio AI

Ketiga aplikasi untuk audio AI tersebut hanyalah permulaan.

Jangan salah paham, text-to-speech, dubbing, dan asisten suara adalah aplikasi yang ampuh. Namun masih banyak lagi yang dapat dilakukan oleh AI audio di masa depan.

Berikut adalah tiga bidang utama yang kami perkirakan pertumbuhannya:

Pertumbuhan AI dalam Layanan Pelanggan

Integrasi AI suara ke dalam layanan pelanggan berpotensi merevolusi cara bisnis berinteraksi dengan klien mereka. Perusahaan sudah menggunakan chatbot AI untuk layanan pelanggan, jadi ini akan menjadi perpanjangan alami dari kasus penggunaan yang sudah ada

Misalnya, audio AI secara efektif dapat membuat versi audio dari interaksi ini dengan obrolan layanan pelanggan H&M:

Tangkapan layar obrolan layanan pelanggan

Dengan pusat panggilan yang didukung AI, perusahaan akan mampu menangani pertanyaan dalam jumlah besar dengan efisiensi yang lebih baik, mengurangi waktu tunggu, dan menyederhanakan pengalaman pelanggan.

Dari segi fitur, kami memperkirakan AI audio akan mampu melakukan lebih dari sekadar mengotomatiskan respons. Di masa depan, audio AI kemungkinan akan dapat menganalisis sentimen pelanggan dan menyesuaikan interaksi dengan kebutuhan individu. Hal ini dapat meningkatkan kualitas layanan secara keseluruhan pada skala yang mungkin sangat mahal bagi banyak bisnis saat ini.

Sebagai bagian dari hal ini, analisis suara AI dapat memberikan umpan balik secara real-time kepada profesional layanan pelanggan — menunjukkan rasa frustrasi atau kebingungan pelanggan yang mungkin tidak diungkapkan secara terang-terangan akan memungkinkan dilakukannya pendekatan yang lebih bernuansa dan berempati. Alat AI seperti Einstein dari Salesforce sudah dapat mengidentifikasi tren umum dalam data pelanggan, sehingga di masa depan, AI audio mungkin dapat melakukan hal yang sama dengan rekaman panggilan pelanggan.

Voice AI juga bisa menjadi titik kontak utama pelanggan dengan sebuah perusahaan. Saat ini, perusahaan menggunakan perangkat lunak pengenalan suara dengan respons yang telah direkam sebelumnya untuk menangani masalah paling umum yang dihadapi pelanggan. Dengan AI, hal ini dapat terintegrasi secara lebih alami ke dalam percakapan dengan pelanggan.

Namun, lompatan teknologi ini memiliki tantangan. Masalah awal penerapan AI dalam layanan pelanggan, seperti chatbot yang gagal memahami atau merespons pertanyaan pelanggan yang kompleks dengan tepat, telah menyoroti keterbatasan teknologi AI saat ini.

Faktanya, salah satu chatbot AI layanan pelanggan membebani maskapai penerbangan karena membuat janji yang tidak benar tentang kebijakan pengembalian dana mereka.

Ini adalah teknologi yang harus diwaspadai oleh perusahaan. Meskipun kita masih jauh dari layanan pelanggan yang sepenuhnya didukung AI, kita sudah melihat banyak perusahaan bergerak ke arah ini.

Pertumbuhan AI dalam Komunikasi Bisnis

Audio AI dirancang untuk mengubah lanskap profesional, tidak hanya dengan mengotomatiskan tugas-tugas rutin, seperti komunikasi internal dan dokumen sehari-hari, namun juga dengan mendefinisikan ulang sifat pekerjaan dan kolaborasi dalam organisasi.

Misalnya, audio AI dapat mengotomatiskan wawancara perekrutan awal untuk proses penyaringan yang lebih efisien. Hal ini akan memungkinkan perekrut untuk fokus pada kandidat yang memenuhi kriteria tertentu berdasarkan tanggapan mereka dan membantu menyederhanakan proses perekrutan. Hal ini juga akan mengurangi potensi bias manusia yang secara keliru mengabaikan kandidat potensial.

Audio AI juga dapat membantu komunikasi internal, menerjemahkan pesan ke berbagai bahasa secara real-time dan memastikan bahwa tim global tetap memiliki pemahaman yang sama melalui teknologi seperti yang telah dikembangkan ElevenLabs . Hal ini dapat membuat komunikasi dan kolaborasi menjadi lebih mudah di lingkungan kerja yang semakin beragam dan tersebar.

Dengan menyatukan orang-orang yang berbicara dalam berbagai bahasa, audio AI akan memudahkan perusahaan untuk merekrut orang-orang hebat di mana pun mereka tinggal atau bahasa apa yang mereka gunakan. Hal ini akan menghasilkan lebih banyak keragaman bahasa dan geografis, dan komunikasi internal akan menjadi lebih sederhana bahkan di antara karyawan yang tidak mengetahui satu kata pun dalam bahasa ibu satu sama lain.

Namun, integrasi audio AI ke tempat kerja bukannya tanpa risiko. Kekhawatirannya mencakup potensi salah tafsir selama wawancara otomatis, sehingga nuansa ucapan atau isyarat non-verbal mungkin terabaikan. Ketergantungan pada AI untuk komunikasi internal dan interaksi pelanggan juga dapat mengakibatkan hilangnya sentuhan pribadi yang memupuk hubungan tulus antar manusia.

Pertumbuhan AI dalam Hiburan

Hiburan adalah area lain di mana audio AI kemungkinan akan berubah secara dramatis di masa depan. Dengannya, orang akan dapat membuat musik dan podcast baru dengan lebih cepat dan mudah dibandingkan sebelumnya.

Alat yang didukung AI juga dapat membantu pembuat podcast mengotomatiskan berbagai aspek produksi seperti contoh di bawah, sehingga mengurangi waktu dan biaya produksi.

Salah satu penerapan audio AI yang paling menarik dan kontroversial adalah kemampuannya menghasilkan musik dengan gaya artis lama atau lama. Proyek seperti Jukebox OpenAI , yang menghasilkan musik dalam berbagai gaya dari awal, menggambarkan potensi dan keterbatasan AI saat ini dalam proses kreatif.

Meskipun hasilnya mengesankan untuk teknologi tahap awal, namun tidak memiliki kedalaman emosional dan kompleksitas musik yang diciptakan oleh seniman manusia. Meskipun hal ini mungkin akan membawa perubahan besar di masa depan, hal ini belum bisa menggantikan seniman manusia.

Di masa depan, AI dapat membantu seniman dengan membiarkan mereka mengeksplorasi genre, gaya, atau konsep baru tanpa menghabiskan waktu berhari-hari. Ini bisa berfungsi sebagai “bukti konsep” bagi seorang seniman yang ragu-ragu tentang sebuah ide.

Ini juga dapat membantu podcaster dengan mengotomatiskan sulih suara dan menghasilkan efek suara latar dan musik, setelah kemampuan tersebut dikembangkan.

Peraturan tertinggal dari penerapan dalam hal ini, meskipun Universal Music Group berhasil menghapus lagu buatan AI yang meniru kolaborasi antara Drake dan The Weeknd.

Masalah etika dan hukum juga muncul ketika AI digunakan untuk meniru suara atau gaya artis yang ada dan artis masa lalu. Perdebatan mengenai rilis anumerta dan keaslian karya yang diciptakan oleh AI menggarisbawahi perlunya pedoman yang jelas dan standar etika dalam penggunaan AI dalam dunia hiburan.

Penerapan Audio AI dengan hiburan akan menyebabkan teknologi dan kreativitas bertemu. Seiring dengan semakin matangnya teknologi AI dan semakin bernuansa dalam pemahaman dan replikasi kreativitas manusia, teknologi ini akan terus mengatasi keterbatasan yang ada, membuka cakrawala baru bagi para seniman dan risiko-risiko baru yang harus diatasi.

Cara Mempersiapkan Penggunaan Audio AI yang Baru dan Masa Depan

Berikut adalah empat langkah utama yang dapat Anda ambil untuk mempersiapkan diri Anda meraih kesuksesan dengan audio AI.

1. Pertimbangan Etis dan Pengembangan Kebijakan

Perusahaan perlu mengadopsi kebijakan yang jelas dan etis dalam menggunakan audio AI, dengan memprioritaskan transparansi kepada pengguna.

Jika Anda menggunakan suara AI berdasarkan suara orang lain selain suara Anda sendiri, pastikan Anda mendapatkan izinnya terlebih dahulu. Jika AI berkomunikasi dengan pelanggan, pastikan pelanggan mengetahui bahwa itu bukan orang yang hidup.

Anda juga harus membuat langkah-langkah keamanan untuk mencegah akses tidak sah dan penggunaan data suara apa pun yang Anda miliki. Hal ini berarti menciptakan kontrol akses yang ketat terhadap siapa yang dapat menggunakan data dan mengikuti praktik terbaik enkripsi .

Kebijakan Anda juga perlu mengatasi potensi perilaku buruk, memastikan Anda memiliki proses untuk menangani AI apa pun yang menyatakan sesuatu yang tidak sesuai dengan kebijakan perusahaan Anda, seperti pada contoh maskapai penerbangan sebelumnya.

2. Investasi dalam Literasi Audio AI

Untuk berinvestasi dalam literasi audio AI, perusahaan dapat memprioritaskan program pendidikan dan pelatihan untuk tim mereka mengenai cara kerja, potensi, dan keterbatasan teknologi audio AI.

Untuk melakukan hal ini, menyelenggarakan atau berinvestasi dalam lokakarya, seminar, dan kursus online untuk meningkatkan pemahaman di antara karyawan di semua tingkatan, mulai dari staf teknis hingga pengambil keputusan.

Di Foundation, kami melakukan hal ini dengan memberi karyawan berbagai cara untuk pengembangan profesional, seperti menanggung biaya bagi karyawan untuk mengikuti kelas. Perusahaan lain mungkin melakukan hal ini melalui bimbingan atau inisiatif pendidikan sejawat.

Pendidikan tersebut dapat membantu mengungkap misteri AI, menciptakan lingkungan di mana setiap orang dapat membuat keputusan yang tepat dan strategis tentang cara menggunakannya secara etis dan efektif.

3. Eksperimen dan Kolaborasi

Jika Anda telah mengikuti dua poin pertama, Anda telah membuat pedoman tentang bagaimana orangharusmenggunakan AI dan pendidikan tentang bagaimana merekadapatmenggunakannya. Sekarang, Anda harus menciptakan lingkungan di mana mereka bebas berinovasi. Dengan cara ini, merekaakanmemanfaatkannya secara maksimal.

Kemitraan antara insinyur dan orang-orang di departemen lain dapat bermanfaat di sini, membantu orang melihat bagaimana audio AI dapat membantu memecahkan masalah yang ada.

Anda bahkan dapat menjadikan ini sebagai proyek departemen SDM Anda, mendorong budaya kolaborasi secara keseluruhan dan menciptakan hari antardepartemen di mana orang-orang dapat berbagi apa yang telah mereka pelajari tentang AI bersama-sama.

4. Mengadaptasi Model Bisnis

Seiring dengan berkembangnya kemampuan AI audio, model bisnis Anda juga harus berkembang. Anda dapat menggunakan AI audio dengan beberapa cara, seperti:

  • Menggunakan kemampuan pembuatan konten dan hiburan untuk bereksperimen dengan bentuk pemasaran konten baru
  • Memanfaatkannya untuk komunikasi yang lebih efisien dalam angkatan kerja global
  • Menggunakannya dalam layanan pelanggan untuk efisiensi dan skalabilitas

Untuk mulai melakukan hal ini seiring dengan semakin matangnya teknologi, siapkan sistem proyek percontohan untuk menguji aplikasi audio AI. Anda harus memperhatikan area yang secara khusus memiliki potensi nilai terbesar bagi perusahaan Anda — seperti menganalisis data pelanggan untuk mempersonalisasi interaksi.

Pendekatan ini akan membantu Anda tetap kompetitif dan relevan dalam lanskap teknologi yang terus berubah dan merangkul AI.

Tetap Terdepan dalam Kemajuan Teknologi dan AI

Audio AI sudah ada, dan semakin canggih. Ini mengubah cara kita membuat, menjuluki, dan mencari konten. Di masa depan, penerapannya akan semakin bervariasi, membantu perusahaan meningkatkan layanan pelanggan, komunikasi internal, dan produk hiburan.

Itu sebabnya kami menguraikan bagaimana organisasi pemasaran paling maju di bidang teknologi berinovasi dan tetap menjadi yang terdepan.

Tertarik? Anda dapat mengakses perpustakaan lengkap studi kasus dan rincian kami di sini .