Erik Pounds di Nvidia: tradizionalmente gli algoritmi spesso non hanno compreso il contesto delle conversazioni; Questo è possibile ora
Pubblicato: 2022-11-02Poco più di un anno fa ho parlato con Bryan Catanzaro di Nvidia di alcune delle interessanti tecnologie che stavano sviluppando nelle aree dell'IA grafica, della sintesi vocale e dell'IA conversazionale/vocale.
Bryan ha condiviso una visione del futuro di ciò che cose come l'apprendimento automatico e il deep learning potrebbero fare per influenzare il modo in cui viviamo il mondo che ci circonda. E mentre alcune cose come l'intelligenza artificiale che creano cose come arte, musica e voci dal suono umano attirano molta attenzione, ci sono alcuni esempi più pratici di intelligenza artificiale già utilizzati per aiutare a creare esperienze migliori per i clienti quando abbiamo bisogno di aiuto con un prodotto o servizio .

Con un anno passato ero curioso di sapere come stanno procedendo le cose in queste aree e ho avuto la fortuna di parlare tramite LinkedIn Live con Erik Pounds, Sr. Director of Enterprise Computing and Data Science di Nvidia, sulla direzione di cose come la conversazione e discorso L'IA si è trasferita dall'ultima volta che ho parlato con Bryan. Di seguito è riportata una trascrizione modificata della nostra conversazione. Fai clic sul lettore SoundCloud incorporato per ascoltare l'intera conversazione.
Brent Leary: Di cosa abbiamo a che fare oggi con l'IA vocale e l'IA conversazionale?
Erik Pounds: Pensi all'IA vocale, pensi a funzioni come il riconoscimento vocale automatico in cui l'IA è in esecuzione in background e puoi riconoscere immediatamente quello che stai dicendo. Può trascrivere ciò che viene detto. Può quindi agire in tempo reale su tali informazioni. E puoi fornire molte cose utili in questo modo. Immagina un agente del servizio clienti sul back-end di una conversazione telefonica. Molti di noi dall'altra parte, dal lato dei consumatori, vogliamo... E cosa vogliamo veramente? Bene, uno, ci piace parlare con gli umani, e l'altro è che vogliamo ottenere aiuto rapidamente, giusto?
Immagina di usarlo sul back-end, quindi sul lato agente, immagina se sto parlando con un agente che cerca di ottenere aiuto e sto facendo un sacco di domande, immagina se l'IA è in esecuzione in background, tirando trovare articoli basati sulla conoscenza, trovare informazioni, trovare strumenti utili e aiutarmi a rispondere alla mia domanda.
Quindi l'agente ha tutte queste informazioni a portata di mano per aiutarmi a risolvere il mio problema. È come avere quasi questo superpotere seduto proprio accanto a te, per aiutare qualcuno ad avere una grande esperienza e risolvere le sue sfide, giusto? Quando pensiamo all'IA, specialmente in quel contesto, non si tratta di sostituire l'umano con un robot con cui parlerai. Ci sono questi passaggi incrementali che saranno in grado di aiutare le aziende che forniscono un servizio ai propri clienti per i decenni a venire.
I dati sono fondamentali, l'empatia aggiunge l'elemento umano necessario
Brent Leary: Quando le persone pensano all'IA, hanno questa definizione ristretta e una visione ristretta di ciò che può effettivamente avere un impatto. Ma quando si tratta dell'esperienza del cliente quando ha bisogno di aiuto, sembra non solo l'intelligenza artificiale, ma la combinazione di almeno la sensazione di comunicare con un essere umano, almeno una cosa che suona umana o qualcuno che ha una sorta di empatia umana. È importante tanto quanto avere a disposizione i dati giusti.
Erik Pounds: Assolutamente. I dati sono l'elemento fondamentale di tutto questo. Se trascriviamo una chiamata, questo produce dati in tempo reale. Ma ci sono anche altri dati che esistono già, spesso a riposo all'interno di un'azienda che possono essere sfruttati. E penso che una delle migliori strategie che qualsiasi azienda possa adottare sia capire: "Va bene. Quali sono i dati preziosi che ho già, che già possiedo? E come posso sfruttarlo per fornire migliori esperienze ai clienti?" Alcuni di essi possono essere solo dati generali.
Ad esempio, ogni volta che si verifica una transazione con un cliente, si verifica un coinvolgimento che produce dati. Puoi ottenere molte informazioni da questo riguardo a tendenze, modelli e cose del genere. Potrebbero aiutare i futuri clienti, giusto? Spesso molte di queste chiamate, interazioni vengono trascritte e archiviate. Sentiamo tutti quella parte dell'inizio di qualsiasi chiamata come "Questa chiamata potrebbe essere monitorata.
Se procedi, questo è ciò che accadrà". Pensa a questo come quasi come le informazioni di crowdsourcing. Puoi davvero sfruttare queste informazioni a tuo vantaggio. Quindi penso che gran parte di ciò inizi con le basi di come si sfruttano e utilizzano i dati.
Contesto di collegamento
Brent Leary: Puoi parlare un po' della componente di questo in cui non siamo solo in grado di avere un'ottima trascrizione e comprensione del linguaggio naturale, ma anche la componente del sentimento, la capacità di sfruttare l'empatia insieme all'IA del parlato come parte del combinazione. Perché in parte è risolvere la sfida o aiutare, ma l'altra parte è come succede e la sensazione che le persone provano non solo quando la cosa è stata corretta, ma il modo in cui la cosa è stata corretta, il modo in cui sono stati coinvolti , la loro comunità, l'empatia che va avanti e indietro. Puoi parlare un po' di dove siamo con quello?
Erik Pounds: Spesso quando dico una cosa, e poi tu rispondi, poi dico un'altra cosa, quella frase successiva è legata alla prima frase. Quando guardi come tradizionalmente hanno funzionato gli algoritmi, spesso non capiscono quel contesto. Non lo stanno elaborando o prendendolo in considerazione. Questo è possibile ora. Ad esempio, abbiamo pubblicato alcune demo di recente alla nostra conferenza del mese scorso, NVIDIA GTC, abbiamo pubblicato una demo.
È una demo del servizio clienti che utilizza un framework AI che chiamiamo NVIDIA Tokkio che mostra esattamente come funziona per quanto riguarda la fornitura di un'interazione realistica, che capisce cosa sto dicendo, cosa sto chiedendo ed è in grado di fare in un tipo naturale di flusso di una conversazione umana. E questo è fondamentale. Poiché automatizziamo una parte maggiore del processo completo, questo è assolutamente fondamentale. Perché come hai detto tu, vogliamo interagire con gli umani, giusto? Come hai detto tu, qualcuno chiama, vuole sentire una voce umana, vuole qualcuno che sia amichevole, che lo capisca, che apprezzi quello che sta dicendo.
Se l'IA è costruita a quel livello, deve essere in grado di farlo. Altrimenti, l'esperienza non sarà buona. Penso che questo sia importante quando si parla di tecnologia AI. Quando si tratta di IA vocale o IA conversazionale, ci sono molti tecnicismi del tipo: "Va bene. Ebbene, quale percentuale delle parole che dici ho capito? Riesco a capire le tue parole in un ambiente rumoroso? Sono in grado di fare tutte queste cose". Ed è così che funziona la tecnologia.
Ma ciò che conta davvero è, è una grande esperienza o non è una grande esperienza? Puoi applicare una tecnologia straordinaria a questa sfida e continuare a non fornire un'esperienza cliente eccezionale. E questa è la cosa più importante, giusto? Quindi abbiamo adottato l'approccio con la nostra tecnologia che una delle cose più importanti che possiamo aiutare i nostri clienti a fare è prendere l'IA, prendere questi modelli pre-addestrati ed essere in grado di personalizzarli per il proprio dominio e i propri ambienti .
Se gestisci un call center in cui la maggior parte delle discussioni riguarda la botanica, non riesco a ricordare i nomi delle piante che ho cambiato nel corso dei tempi del mio giardino, giusto? Ma se è così, devi assicurarti che questa IA comprenda determinate terminologie, frasi e contesto in quel dominio. Oppure, se si tratta di un'azienda di dispositivi medici, puoi immaginare che ci saranno molte cose che verranno discusse in quella conversazione che non sono in una normale conversazione in cui un modello di IA verrebbe addestrato.
Quindi la personalizzazione è molto importante così come il gergo, giusto? Quindi, in base alle aree del mondo in cui vivono o da cui chiamano i tuoi clienti, vuoi essere in grado di capire dialetti, gergo, cose del genere ed essere in grado di gestirle correttamente. Quindi gran parte di questo non lo è... Non puoi semplicemente prendere un modello di IA di serie e implementarlo per funzionare in un ambiente e offre un'esperienza eccezionale ovunque. La personalizzazione sarà molto importante.
Non trascurare i dati di fronte a te
Brent Leary: Quali sono alcune delle cose che forse le aziende stanno ancora cercando di capire in termini di andare avanti con questo?
Erik Pounds: Nel contesto di questa conversazione, come hai detto, hai buoni rapporti con un gruppo di aziende che creano queste piattaforme CRM utilizzate da molte aziende e organizzazioni diverse. Spesso un'azienda dispone del proprio stack di servizi o stack tecnologico esistente e quindi vuole fare qualcosa di nuovo. A volte dove sono oggi ha dei limiti.
Quindi questo spesso aggiunge alcune complessità perché parte di esso è: "Beh, posso costruirlo da solo e collegarlo alla mia piattaforma esistente". O a volte devi tornare al tuo ISV, fare una richiesta di funzionalità del tipo: "Ehi, vogliamo davvero farlo. Quali sono le tue idee?"
Penso che la cosa più importante, mentre avvii quelle conversazioni, comprendi i dati che sono a portata di mano. Comprendi cosa puoi fare da solo, cosa sono in grado di fare i tuoi ISV, cosa potresti anche essere in grado di fare se avessi solo un piccolo aiuto di consulenza. E penso che solo avere una piena comprensione, così puoi fare passi avanti positivi.
La maggior parte dei primi progetti di intelligenza artificiale all'interno delle aziende sono abituati a... Si sono fatti le ossa con loro, giusto? Non sempre hanno successo. Questa è una nuova tecnologia. Quindi direi che essere preparati il più possibile, in modo da avere le maggiori possibilità di successo nel tuo primo progetto è estremamente importante in questo momento.
Brent Leary: Dal punto di vista dell'applicazione CRM, in particolare se sei un venditore, odiano usare il CRM. A loro non piace mettere roba. Non si sono registrati per digitare, scorrere o fare clic. Vogliono davvero uscire, costruire relazioni e vendere cose. E la mia fantasia è, non sarebbe bello se potessi semplicemente parlare con la tua applicazione aziendale, che si tratti di CRM o ERB o qualunque acronimo tu voglia buttare là fuori, se potessi semplicemente parlarci come stiamo parlando in questo momento e fai le tue cose, è solo pura fantasia? O vedi un giorno in cui potremmo effettivamente fare quel tipo di conversazione con le nostre app?
Erik Pounds: No, non dovrebbe essere. Soprattutto al giorno d'oggi, quando la maggior parte di questi... Hai detto tipo "Ok. Devo tornare in Salesforce e aggiornare questo record dopo aver avuto questa conversazione con questo cliente o potenziale cliente". E sappiamo tutti che molte volte questi record non sono aggiornati così bene, e quindi l'azienda non ha l'intelligenza di cui ha bisogno per andare avanti, giusto? La pipeline non è aggiornata. Non sei in grado di imparare da quello. Molte di queste conversazioni ora sono come quelle che stiamo avendo, giusto? Sono remoti. Non sono in una sala conferenze in qualche edificio. O anche se sono in una sala conferenze in qualche edificio, spesso c'è qualcuno che è a distanza. E quindi c'è un sistema che ascolta questa conversazione.
Solo essere in grado di trascrivere quella conversazione ed essere in grado di farlo, in questo caso, per l'account manager o chiunque sia coinvolto sarebbe fantastico. E questo è tutto in grado oggi. Proprio come questa conversazione, questa conversazione viene trascritta. Stai usando alcune funzioni ASR per trascrivere la conversazione, quindi stai applicando alcune funzioni NLU o NLP per capire il contesto di cosa diavolo stiamo parlando. E poi potresti facilmente andare ad aggiornare molti di quei campi standard. E questa è tutta roba ripetitiva. Più un'attività è ripetitiva, più facile dovrebbe essere applicare l'IA.
Questo fa parte della serie di interviste One-to-One con leader di pensiero. La trascrizione è stata modificata per la pubblicazione. Se si tratta di un'intervista audio o video, fai clic sul player incorporato in alto o iscriviti tramite iTunes o tramite Stitcher.
