오디오 기반 AI: 오디오 AI의 미래

게시 됨: 2024-03-20

기사 내용

오디오 AI는 우리가 콘텐츠를 만들고 소비하는 방식을 바꾸고 있습니다. 이는 이미 40억 달러 규모의 산업이며 , 10년 말까지 그 가치가 3배로 늘어날 것으로 예상됩니다.

그러나 현재 오디오 AI의 실제 상태는 어떤 모습이며, 이 젊은 산업은 어떻게 변화하고 있을까요?

우리는 이미 어떤 종류의 오디오 AI 도구가 존재하는지, 마케팅 담당자와 기업이 오늘날 이를 사용할 수 있는 방법, 업계가 어디로 향하고 있는지에 대한 몇 가지 흥미로운 지표를 분석하고 있습니다.

로봇이 말하는 것을 들을 준비가 되셨나요? 시작하자.

오디오 AI의 현재 환경

오디오AI는 인공지능 으로 소리와 음성을 만들어냅니다 .

이 업계의 제품에는 텍스트를 음성으로 변환하고, 더빙을 위한 음성 복제본을 만들고, 인간의 어조와 억양을 모방할 수 있는 음성 지원 기능을 제공하는 도구가 포함됩니다. ElevenLabs 및 Resemble AI 와 같은 도구는 이미 고품질의 사실적인 오디오 콘텐츠를 제작할 수 있는 능력을 갖추고 있습니다.

사람들이 이미 이 획기적인 기술을 사용하고 있는 세 가지 방법은 다음과 같습니다.

크리에이터를 위한 오디오 AI

오디오 AI는 특히 오디오북 및 팟캐스트와 같은 콘텐츠 유형과 관련하여 콘텐츠 제작을 변화시키고 있습니다. 이제 제작자는 인간의 억양과 감정을 복제할 수 있는 합성 음성을 사용할 수 있으므로 기존 녹음 설정이 필요하지 않습니다. 이를 통해 생산 비용과 시간을 절약할 수 있습니다.

Foundation의 CEO인 Ross Simmonds가 제작한 오디오와 비디오 AI의 조합인 이 비디오를 보십시오. 앉아서, 대본을 작성하고, 녹음하고, 편집하는 데 몇 시간이 걸렸을 일을 몇 분 만에 만들 수 있었습니다.

주말 실험:
AI만으로 나의 영상을 만들어 보세요.
결과는 다음과 같습니다.
확신하는. 작업이 필요합니다. 하지만 꽤 가깝습니다…
어떻게?
1) AI는 오래된 팟캐스트 녹음을 사용하여 내 목소리를 재구성했습니다.
2) AI는 내 이전 블로그 게시물을 스크립트로 사용했습니다.
3) AI는 예전 영상의 화면 캡처를 사용했습니다. pic.twitter.com/xmuRUotrjV

— 로스 시몬즈(@TheCoolestCool) 2023년 7월 4일

마케팅 담당자와 기타 사업가의 경우 이것이 어떻게 더 많은 유형의 오디오 콘텐츠를 가능하게 만들 수 있는지 고려해 볼 가치가 있습니다. 리소스가 제한된 소규모 기업의 경우 특히 그렇습니다. 이전에는 너무 비싸거나 시간이 많이 걸렸던 팟캐스트를 이제는 만들 수 있습니다.

이 사용 사례에는 논란이 없지 않습니다. 비평가들은 동의와 보상에 대한 윤리적 우려를 제기하고 성우라는 직업을 훼손할 수 있다고 주장합니다. 딥 페이크 오디오와 오용 가능성의 위험도 커져 이러한 신흥 기술을 책임감 있게 관리하기 위한 규제 프레임워크의 필요성이 강조됩니다.

이 기술의 위험에 대한 한 가지 대응은 음성 라이선스입니다. 일부 성우들은 ElevenLabs의 음성 라이브러리와 같은 서비스에서 음성 AI 클론으로 사용할 수 있도록 자신의 목소리에 라이선스를 부여함으로써 직업에 대한 위협에 대응하고 있습니다. 그러면 누군가가 자신의 목소리를 사용할 때마다 라이선스 비용을 받게 됩니다.

그러나 미국에서는 음성 자체는 저작권 보호 대상이 아니며 특정 음성 녹음만 저작권으로 간주됩니다. "소리와 유사한" 가수를 사용하는 것이 사람의 목소리를 모방하는 합법적인 방법인 것처럼 딥페이크 오디오에도 동일하게 적용될 수 있습니다. 이는 특히 관련 판례가 1988년에 나온 것이기 때문에 음성 복제 및 라이선싱을 법적 회색 영역에 놓이게 합니다. 추가 사례와 No AI 사기법과 같은 법률의 통과 만이 이를 명확히 할 수 있을 것입니다.

번역 및 더빙을 위한 오디오 AI

오디오 AI는 번역 및 더빙 산업도 변화시키고 있습니다. 이 기술은 텍스트를 음성으로, 음성을 음성으로 해석하여 보다 실제적인 청취 경험을 위해 원래 화자의 어조와 감정을 밀접하게 모방하려고 노력합니다.

이 바이러스성 소셜 미디어 게시물은 음악에서도 언어 장벽을 허무는 AI 더빙의 능력을 보여줍니다.

Bro 저는 실제로 Lil Yachtys의 운문에서 눈물을 흘렸습니다️ pic.twitter.com/ZX6rqD0McE
— ₭ma (@KmaFr_) 2024년 2월 20일

영어에서 중국어로 더빙된 이 더빙은 게시 당시 조회수 170만 회를 기록했습니다. 게시물에 댓글을 단 대부분의 사람들은 해당 언어를 구사하지도 못합니다. 그들은 단지 기술에 놀랐을 뿐입니다.

그러나 그 잠재력에도 불구하고 AI 번역 및 더빙과 관련된 위험은 여전히 존재합니다. 예를 들어 번역의 뉘앙스 상실과 문화적 오해의 가능성이 높아집니다. 또한 동의 없이 개인의 목소리를 복제하는 것에 대한 윤리적 고려도 제기됩니다.

또한 사람들이 누군가의 실제 단어를 부정확하게 더빙하기 위해 의도적으로 조작할 위험도 있습니다. 다음은 Morgan Freeman이 말하는 가짜 비디오를 만드는 사람의 예이며 상당히 설득력 있는 결과를 보여줍니다.

속보: 연방선거관리위원회는 2024년 선거 이전에 AI가 생성한 딥페이크 정치 광고를 규제할 가능성을 조사하고 있습니다.

모르시는 분들을 위해 말씀드리자면, 딥 페이크는 일반적으로 AI가 생성한 오디오 클립/비디오로, 개인이 무언가를 말하는 것처럼 보이거나… pic.twitter.com/7lmlNht4QP
— 에드 크라센슈타인(@EdKrassen) 2023년 8월 11일

이 기술이 발전함에 따라 정확성을 보장하고 자신의 목소리가 사용되는 방식을 선택할 수 있는 다른 사람의 권리를 존중하는 것이 중요합니다. 효과적으로 사용하면 이전에 접근할 수 없었던 콘텐츠를 즐길 수 있고, 이전보다 더 쉽게 다른 사람과 대화할 수 있는 가능성의 세계가 열릴 수 있습니다.

음성 도우미용 오디오 AI

Siri, Alexa, Google Assistant와 같은 음성 도우미는 이미 오디오 AI를 기반으로 하며 자연어 처리를 사용하여 사용자 명령을 이해하고 응답합니다. 이러한 도우미는 음성을 인식하고 사용하여 사용자와 상호 작용하는 오디오 AI의 중요한 응용 프로그램을 나타냅니다.

음성 비서는 이미 인기가 높으며 미국 성인의 62%가 이를 사용한다고 보고했습니다.

AI가 향상됨에 따라 미래에는 더 정확해지고 결과적으로 더 대중화될 가능성이 높습니다. 그 수가 증가함에 따라 기업에서는 음성 검색을 위해 기사와 기타 온라인 콘텐츠를 최적화하는 것이 더욱 중요해질 것입니다.

그러나 그들에게도 몇 가지 우려 사항이 있습니다. 구글은 실수로 음성비서를 활성화한 사람들의 대화를 불법 녹음해 유포했다는 혐의 로 이미 소송 의 대상이 됐다 .

오디오 AI의 미래

오디오 AI를 위한 세 가지 애플리케이션은 시작에 불과합니다.

오해하지 마십시오. 텍스트 음성 변환, 더빙 및 음성 도우미는 강력한 응용 프로그램입니다. 하지만 오디오 AI가 미래에 할 수 있는 일은 훨씬 더 많습니다.

성장을 예측하는 세 가지 주요 영역은 다음과 같습니다.

고객 서비스 분야의 AI 성장

음성 AI를 고객 서비스에 통합하면 기업이 고객과 상호 작용하는 방식에 혁명을 일으킬 수 있는 잠재력이 있습니다. 기업들은 이미 고객 서비스를 위해 AI 챗봇을 사용하고 있으므로 이는 기존 사용 사례의 자연스러운 확장이 될 것입니다.

예를 들어, 오디오 AI는 H&M의 고객 서비스 채팅과의 상호작용의 오디오 버전을 효과적으로 생성할 수 있습니다.

AI 기반 콜센터를 통해 기업은 대량의 문의를 더 효율적으로 처리하고 대기 시간을 줄이고 고객 경험을 간소화할 수 있습니다.

기능 측면에서 우리는 오디오 AI가 단순히 응답을 자동화하는 것 이상의 일을 할 수 있을 것으로 예측합니다. 미래에는 오디오 AI가 고객 정서를 분석하고 개인의 요구에 맞게 상호 작용을 맞춤화할 수 있을 것입니다. 이는 오늘날 많은 기업에서 엄청나게 비용이 많이 드는 규모로 전반적인 서비스 품질을 향상시킬 수 있습니다.

그 일환으로 AI 음성 분석은 고객 서비스 전문가에게 실시간 피드백을 제공할 수 있습니다. 즉, 명백하게 표현되지 않은 고객의 불만이나 혼란을 지적하면 보다 미묘하고 공감적인 접근 방식이 가능해집니다. Salesforce의 Einstein 과 같은 AI 도구는 이미 고객 데이터의 일반적인 추세를 식별할 수 있으므로 미래에는 오디오 AI가 고객 통화 녹음에 대해 동일한 작업을 수행할 수 있습니다.

음성 AI는 고객과 기업의 주요 접점이 될 수도 있습니다. 현재 기업에서는 사전 녹음된 응답이 포함된 음성 인식 소프트웨어를 사용하여 고객의 가장 일반적인 문제를 처리합니다. AI를 사용하면 고객과의 대화에 더욱 자연스럽게 통합될 수 있습니다.

그러나 이러한 기술적 도약에는 어려움이 따른다. 챗봇이 복잡한 고객 쿼리를 이해하지 못하거나 적절하게 응답하지 못하는 등 고객 서비스에 AI를 구현하는 데 따른 초기 문제는 현재 AI 기술의 한계를 부각시켰습니다.

실제로 한 고객 서비스 AI 챗봇은 사실 이 아닌 환불 정책을 약속한 대가로 항공사에 비용을 발생시켰습니다.

기업이 조심해야 할 기술이다. 그러나 완전한 AI 기반 고객 서비스와는 거리가 멀지만 이미 기업들이 이 방향으로 움직이고 있는 모습을 볼 수 있습니다.

비즈니스 커뮤니케이션의 AI 성장

오디오 AI는 일상적인 내부 커뮤니케이션 및 서류 작업과 같은 일상적인 작업을 자동화할 뿐만 아니라 조직 내 업무 및 협업의 성격을 재정의함으로써 전문적인 환경을 변화시킬 예정입니다.

예를 들어 오디오 AI는 보다 효율적인 심사 프로세스를 위해 조기 채용 인터뷰를 자동화할 수 있습니다. 이를 통해 채용 담당자는 응답을 기반으로 특정 기준을 충족하는 후보자에게 집중하고 채용 프로세스를 간소화할 수 있습니다. 또한 인간의 편견이 잠재적 후보자를 잘못 평가할 가능성도 줄어듭니다.

오디오 AI는 내부 커뮤니케이션에도 도움이 될 수 있으며 메시지를 실시간으로 다양한 언어로 번역하고 ElevenLabs가 이미 개발한 것과 같은 기술을 통해 글로벌 팀이 동일한 페이지를 유지하도록 보장할 수 있습니다 . 이를 통해 점점 더 다양해지고 분산되는 작업 환경에서 의사소통과 협업이 훨씬 쉬워질 수 있습니다.

오디오 AI는 서로 다른 언어를 사용하는 사람들을 하나로 모음으로써 회사가 거주지나 사용 언어에 관계없이 우수한 인재를 더 쉽게 채용할 수 있게 해줄 것입니다. 이는 더욱 언어적, 지리적 다양성으로 이어질 것이며, 서로의 모국어를 한마디도 모르는 직원들 사이에서도 내부 의사소통이 단순해질 것입니다.

그러나 오디오 AI를 직장에 통합하는 데 위험이 없는 것은 아닙니다. 우려 사항에는 자동 인터뷰 중에 말의 뉘앙스나 비언어적 신호가 간과될 수 있는 오해의 가능성이 포함됩니다. 내부 커뮤니케이션과 고객 상호작용을 AI에 의존하면 사람들 간의 진정한 연결을 촉진하는 개인적인 접촉을 잃을 수도 있습니다.

엔터테인먼트 분야의 AI 성장

엔터테인먼트는 오디오 AI가 미래에 극적으로 변화할 가능성이 있는 또 다른 영역입니다. 이를 통해 사람들은 이전보다 더 빠르고 쉽게 새로운 음악과 팟캐스트를 만들 수 있습니다.

오디오 기반 AI는 수많은 사용 사례를 갖게 될 것입니다.
다음은 모든 것을 바꿀 것이라고 생각하는 몇 가지입니다(어떤 사람들은 너무 많은 것에서 *인간* 요소를 빼기 때문에 이것을 싫어할 것입니다).
– 합성 음성으로 생성된 오디오북
– 다음과 함께 실행되는 팟캐스트…
— 로스 시몬즈(@TheCoolestCool) 2023년 11월 30일

AI 기반 도구는 팟캐스트 제작자가 아래 예와 같이 제작의 다양한 측면을 자동화하여 제작 시간과 비용을 줄이는 데도 도움이 될 수 있습니다.

️ ChatGPT의 팟캐스터 사용 사례.
AI가 오디오 파일을 변환하고 병합하도록 하세요.
에피소드에 인트로/아웃트로를 추가합니다. pic.twitter.com/u8DSqHUq5h
— 트로이 테살론 | Automation Ace ️ (@AutomationAce_) 2023년 10월 27일

오디오 AI의 가장 흥미롭고 논란이 많은 응용 프로그램 중 하나는 기존 또는 과거 아티스트의 스타일로 음악을 제작하는 능력입니다. 처음부터 다양한 스타일의 음악을 생성하는 OpenAI의 Jukebox 와 같은 프로젝트는 창의적인 프로세스에서 AI의 잠재력과 현재 한계를 모두 보여줍니다.

이러한 초기 단계 기술의 결과는 인상적이지만 인간 예술가가 만든 음악의 정서적 깊이와 복잡성은 부족합니다. 이것이 미래에 판도를 바꿀 수도 있지만 아직 인간 예술가를 대체하지는 않습니다.

미래에는 AI가 아티스트가 작업 시간을 투자하지 않고도 새로운 장르, 스타일, 컨셉을 탐색할 수 있도록 함으로써 도움을 줄 수 있습니다. 이는 아이디어에 대해 고민하고 있는 예술가에게 "개념 증명" 역할을 할 수 있습니다.

또한 이러한 기능이 개발되면 음성 해설을 자동화하고 배경 음향 효과와 음악을 생성하여 팟캐스터에게 도움이 될 수도 있습니다.

유니버설 뮤직 그룹(Universal Music Group)이 드레이크(Drake)와 위켄드(The Weeknd)의 콜라보레이션을 모방 한 AI 생성 노래를 철거하는 데 성공했지만 이에 대한 규제는 적용에 뒤처져 있습니다 .

AI를 사용하여 기존 및 과거 아티스트의 목소리나 스타일을 모방하는 경우에도 윤리적, 법적 문제가 발생합니다. 사후 개봉작과 AI가 만든 작품의 진위에 대한 논쟁은 엔터테인먼트에서 AI를 사용하는 데 있어 명확한 지침과 윤리 기준의 필요성을 강조합니다.

오디오 AI의 엔터테인먼트 응용은 기술과 창의성의 만남을 가져올 것입니다. AI 기술이 성숙해지고 인간 창의성에 대한 이해와 복제가 더욱 정교해짐에 따라 현재의 한계를 지속적으로 극복하고 예술가에게 새로운 지평을 열어줄 것이며 극복해야 할 새로운 위험도 열어줄 것입니다.

새롭고 미래의 오디오 AI 사용을 준비하는 방법

오디오 AI를 성공적으로 활용하기 위해 취할 수 있는 4가지 주요 단계는 다음과 같습니다.

1. 윤리적 고려 및 정책 개발

기업은 오디오 AI 사용에 대한 명확하고 윤리적인 정책을 채택하고 사용자의 투명성을 우선시해야 합니다.

자신이 아닌 다른 사람의 목소리를 기반으로 한 AI 음성을 사용하는 경우 먼저 해당 사람의 허가를 받아야 합니다. AI가 고객과 통신하는 경우 고객이 자신이 실제 사람이 아니라는 점을 인지하도록 하십시오.

또한 귀하가 보유한 음성 데이터에 대한 무단 액세스 및 사용을 방지하기 위한 보안 조치를 마련해야 합니다. 이는 데이터를 사용할 수 있는 사람에 대한 엄격한 액세스 제어를 만들고 암호화 모범 사례를 따르는 것을 의미합니다 .

또한 정책은 잘못된 행동의 가능성을 해결해야 하며 이전 항공사 예와 같이 회사 정책에 없는 내용을 말하는 AI를 처리할 수 있는 프로세스가 있는지 확인해야 합니다.

2. 오디오 AI 리터러시에 대한 투자

오디오 AI 활용 능력에 투자하기 위해 기업은 오디오 AI 기술의 작동, 잠재력 및 한계에 대해 팀을 위한 교육 및 훈련 프로그램의 우선 순위를 지정할 수 있습니다.

이를 위해 기술 직원부터 의사 결정자에 이르기까지 모든 직급의 직원 간의 이해를 높일 수 있는 워크숍, 세미나, 온라인 강좌를 만들거나 투자하십시오.

Foundation에서는 직원의 수업 수강 비용을 지원하는 등 직원에게 전문성 개발을 위한 다양한 방법을 제공함으로써 이를 수행합니다. 다른 회사에서는 멘토링이나 동료 교육 계획을 통해 이를 수행할 수도 있습니다.

이러한 교육은 AI를 이해하는 데 도움이 될 수 있으며 모든 사람이 AI를 윤리적이고 효과적으로 사용하는 방법에 대해 정보에 입각한 전략적 결정을 내릴 수 있는 환경을 조성할 수 있습니다 .

3. 실험과 협업

처음 두 가지 사항을 따랐다면 사람들이 AI를 어떻게 사용해야 하는지에 대한 지침과 AI 사용 방법에 대한 교육을 이미마련한것 입니다 . 이제 그들이 자유롭게 혁신할 수 있는 환경을 조성해야 합니다. 이런 식으로 그들은 그것을 최대한 활용하게 될 것입니다.

혁신에 대한 자극이 기업가적 환경에서 나오는 스타트업과 달리 대기업은 사람들에게 영감을 줄 수 있는 환경과 구조를 설계해야 합니다.
— 월터 T. 람비(@hr_taurai) 2021년 10월 18일

여기에서는 엔지니어와 다른 부서 사람들 간의 파트너십이 유익할 수 있으며, 오디오 AI가 기존 문제를 해결하는 데 어떻게 도움이 될 수 있는지 사람들이 이해하는 데 도움이 될 수 있습니다.

이를 HR 부서의 프로젝트로 만들어 전반적인 협업 문화를 장려하고 사람들이 AI에 대해 배운 내용을 함께 공유할 수 있는 부서 간 날을 만들 수도 있습니다.

4. 비즈니스 모델의 적응

오디오 AI의 기능이 발전함에 따라 비즈니스 모델도 발전해야 합니다. 다음과 같은 여러 가지 방법으로 오디오 AI를 수용할 수 있습니다.

콘텐츠 제작 및 엔터테인먼트 기능을 활용하여 새로운 형태의 콘텐츠 마케팅 실험
글로벌 인력 내에서 보다 효율적인 커뮤니케이션을 위해 이를 활용합니다.
효율성과 확장성을 위해 고객 서비스에 사용

기술이 성숙함에 따라 이를 시작하려면 오디오 AI 애플리케이션을 테스트하기 위한 파일럿 프로젝트 시스템을 설정하십시오. 특히 고객 데이터를 분석하여 상호 작용을 개인화하는 등 회사에 가장 큰 잠재적 가치가 있는 영역에 주의를 기울여야 합니다.

이러한 접근 방식은 끊임없이 변화하고 AI를 수용하는 기술 환경에서 경쟁력과 관련성을 유지하는 데 도움이 될 것입니다.

기술과 AI 발전의 최첨단을 따라가세요

오디오 AI는 이미 존재하며 점점 더 발전하고 있습니다. 이는 우리가 콘텐츠를 만들고, 더빙하고, 검색하는 방식을 변화시키고 있습니다. 앞으로는 애플리케이션이 더욱 다양해져서 기업이 고객 서비스, 내부 커뮤니케이션, 엔터테인먼트 제품을 개선하는 데 도움이 될 것입니다.

이것이 바로 우리가 기술 분야의 가장 진보된 마케팅 조직이 어떻게 혁신하고 앞서 나가고 있는지 분석하는 이유입니다.

관심 있는? 여기에서 전체 사례 연구 및 분석 라이브러리에 액세스할 수 있습니다 .