Erik Pounds จาก Nvidia: ตามเนื้อผ้าอัลกอริทึมมักจะไม่เข้าใจบริบทของการสนทนา ที่เป็นไปได้ตอนนี้
เผยแพร่แล้ว: 2022-11-02เมื่อหนึ่งปีที่แล้ว ฉันได้พูดคุยกับ Bryan Catanzaro จาก Nvidia เกี่ยวกับเทคโนโลยีที่น่าสนใจที่พวกเขาพัฒนาขึ้นในด้าน AI แบบกราฟิก การสังเคราะห์เสียง และ AI การสนทนา/คำพูด
ไบรอันแบ่งปันวิสัยทัศน์เกี่ยวกับอนาคตว่าสิ่งต่างๆ เช่น แมชชีนเลิร์นนิงและการเรียนรู้เชิงลึกสามารถทำอะไรได้บ้างเพื่อส่งผลต่อวิธีที่เราสัมผัสโลกรอบตัวเรา และในขณะที่บางสิ่งเช่น AI ที่สร้างสิ่งต่าง ๆ เช่นศิลปะและดนตรีและเสียงของมนุษย์ได้รับความสนใจเป็นอย่างมาก แต่ก็มีตัวอย่างที่ใช้งานได้จริงของ AI อยู่แล้วเพื่อช่วยสร้างประสบการณ์ลูกค้าที่ดีขึ้นเมื่อเราต้องการความช่วยเหลือเกี่ยวกับผลิตภัณฑ์หรือบริการ .

หนึ่งปีผ่านไป ฉันอยากรู้ว่าสิ่งต่าง ๆ ก้าวหน้าไปในด้านเหล่านี้อย่างไร และฉันโชคดีที่ได้พูดผ่าน LinkedIn Live กับ Erik Pounds ผู้อำนวยการอาวุโสฝ่ายคอมพิวเตอร์องค์กรและวิทยาศาสตร์ข้อมูลที่ Nvidia ในด้านต่างๆ เช่น การสนทนาและ คำพูด AI ได้ย้ายเข้ามาตั้งแต่ครั้งสุดท้ายที่ฉันพูดกับไบรอัน ด้านล่างนี้คือบันทึกการสนทนาของเราที่แก้ไขแล้ว คลิกที่เครื่องเล่น SoundCloud แบบฝังเพื่อฟังการสนทนาแบบเต็ม
Brent Leary: เรากำลังเผชิญกับอะไรเมื่อพูดถึง AI การพูดและ AI การสนทนาในปัจจุบัน
Erik Pounds: คุณนึกถึง AI ในการพูด ให้นึกถึงฟังก์ชันต่างๆ เช่น การรู้จำคำพูดอัตโนมัติ โดยที่ AI กำลังทำงานอยู่เบื้องหลัง และสามารถจดจำสิ่งที่คุณกำลังพูดได้ทันที มันสามารถถ่ายทอดสิ่งที่กำลังพูด จากนั้นจะสามารถดำเนินการตามเวลาจริงกับข้อมูลนั้นได้ และคุณสามารถให้ข้อมูลที่เป็นประโยชน์มากมายโดยทำเช่นนั้น ลองนึกภาพตัวแทนฝ่ายบริการลูกค้าที่ส่วนหลังของการสนทนาทางโทรศัพท์ พวกเราหลายคนในอีกด้านหนึ่ง ในด้านผู้บริโภค เราต้องการ… และจริงๆ แล้วเราต้องการอะไรกันแน่? อย่างหนึ่ง เราชอบคุยกับมนุษย์ และอีกอย่างคือเราต้องการความช่วยเหลืออย่างรวดเร็วใช่ไหม
ลองนึกภาพใช้ที่ส่วนหลังของมัน ดังนั้น ในด้านตัวแทน ลองนึกภาพว่าฉันกำลังคุยกับตัวแทนที่พยายามขอความช่วยเหลือและฉันกำลังถามคำถามมากมาย ลองนึกภาพว่า AI กำลังทำงานอยู่เบื้องหลังหรือไม่ บทความเกี่ยวกับความรู้ ค้นหาข้อมูล ค้นหาเครื่องมือที่เป็นประโยชน์ และช่วยฉันตอบคำถาม
จากนั้นเจ้าหน้าที่ก็มีข้อมูลทั้งหมดนี้เพียงปลายนิ้วสัมผัสเพื่อช่วยฉันแก้ปัญหา มันเหมือนกับว่ามีพลังวิเศษเกือบเหมือนนั่งอยู่ข้างๆ คุณ เพื่อช่วยให้ใครซักคนมีประสบการณ์ที่ยอดเยี่ยมและไขความท้าทายของพวกเขา ใช่ไหม? เมื่อเรานึกถึง AI โดยเฉพาะอย่างยิ่งในบริบทนั้น มันไม่เกี่ยวกับการแทนที่มนุษย์ด้วยหุ่นยนต์ที่คุณจะพูดคุยด้วย มีขั้นตอนที่เพิ่มขึ้นเหล่านี้ซึ่งจะช่วยธุรกิจที่ให้บริการแก่ลูกค้าของตนในอีกหลายทศวรรษข้างหน้า
ข้อมูลเป็นพื้นฐาน ความเห็นอกเห็นใจเพิ่มองค์ประกอบที่จำเป็นของมนุษย์
เบรนท์ เลียรี: เมื่อผู้คนนึกถึง AI พวกเขามีคำจำกัดความที่แคบและมีมุมมองที่แคบว่าสิ่งใดที่มันจะส่งผลกระทบได้จริง แต่เมื่อพูดถึงประสบการณ์ของลูกค้าเมื่อพวกเขาต้องการความช่วยเหลือ รู้สึกเหมือนไม่ใช่แค่ AI แต่เป็นการรวมกันระหว่างความรู้สึกราวกับว่าคุณกำลังสื่อสารกับมนุษย์ อย่างน้อยก็เป็นสิ่งที่เสียงมนุษย์หรือใครบางคนที่มีบางอย่าง ความเห็นอกเห็นใจของมนุษย์ การมีข้อมูลที่ถูกต้องมีความสำคัญพอๆ กับการมีข้อมูลที่ถูกต้อง
Erik ปอนด์: แน่นอน ข้อมูลเป็นองค์ประกอบพื้นฐานของทั้งหมดนี้ หากเราถอดเสียงการโทร ข้อมูลนั้นจะสร้างข้อมูลแบบเรียลไทม์ แต่ก็มีข้อมูลอื่นๆ ที่มีอยู่แล้ว ซึ่งมักจะอยู่ในธุรกิจที่สามารถใช้ประโยชน์ได้ และฉันคิดว่าหนึ่งในกลยุทธ์ที่ดีที่สุดที่ธุรกิจสามารถทำได้คือการหาว่า "เอาล่ะ ข้อมูลอันมีค่าที่ฉันมีอยู่แล้วมีอะไรบ้าง? และฉันจะใช้ประโยชน์จากสิ่งนั้นเพื่อมอบประสบการณ์ที่ดีขึ้นให้กับลูกค้าได้อย่างไร” บางส่วนอาจเป็นเพียงข้อมูลทั่วไป
ตัวอย่างเช่น ทุกครั้งที่มีการทำธุรกรรมของลูกค้า การมีส่วนร่วมเกิดขึ้นซึ่งสร้างข้อมูล คุณสามารถได้รับข้อมูลมากมายเกี่ยวกับแนวโน้มและรูปแบบและสิ่งต่างๆ เช่นนี้ พวกเขาสามารถช่วยลูกค้าในอนาคตได้ใช่ไหม บ่อยครั้งที่การโทรจำนวนมาก การโต้ตอบจะถูกถอดความและจัดเก็บไว้ เราทุกคนได้ยินช่วงเริ่มต้นของการโทรเช่น "การโทรนี้อาจถูกตรวจสอบ
หากคุณดำเนินการต่อ นี่คือสิ่งที่จะเกิดขึ้น” คิดว่าเกือบจะเหมือนกับข้อมูลคราวด์ซอร์ซ คุณสามารถใช้ข้อมูลนั้นให้เกิดประโยชน์สูงสุดได้อย่างแท้จริง ดังนั้น ฉันคิดว่าหลายๆ อย่างเริ่มต้นจากรากฐานของการใช้ประโยชน์และใช้ข้อมูลของคุณอย่างไร
การเชื่อมต่อบริบท
เบรนท์ เลียรี: คุณช่วยพูดหน่อยได้ไหมเกี่ยวกับองค์ประกอบของสิ่งนี้ ซึ่งเราไม่เพียงแต่สามารถถอดความและเข้าใจภาษาที่เป็นธรรมชาติได้เท่านั้น แต่ยังรวมถึงองค์ประกอบของความรู้สึกด้วย ความสามารถในการใช้ประโยชน์จากความเห็นอกเห็นใจพร้อมกับคำพูด AI ซึ่งเป็นส่วนหนึ่งของ การผสมผสาน. เพราะส่วนหนึ่งเป็นการแก้โจทย์หรือช่วยเหลือ แต่อีกส่วนเป็นสิ่งที่เกิดขึ้นและความรู้สึกที่คนได้รับไม่เพียงแต่จากการแก้ไขสิ่งที่ถูกแก้ไขเท่านั้น แต่ยังรวมถึงลักษณะที่สิ่งถูกแก้ไข วิธีที่พวกเขามีส่วนร่วม , ชุมชนของพวกเขา, ความเห็นอกเห็นใจไปมา. คุณช่วยพูดหน่อยได้ไหมว่าเราอยู่ที่ไหน
Erik Pounds: บ่อยครั้งเมื่อฉันพูดสิ่งหนึ่ง แล้วคุณตอบ จากนั้นฉันก็พูดอีกสิ่งหนึ่ง ประโยคต่อไปนี้ผูกติดอยู่กับประโยคแรก เมื่อคุณดูว่าอัลกอริทึมแบบดั้งเดิมทำงานอย่างไร พวกเขามักจะไม่เข้าใจบริบทนั้น พวกเขาไม่ได้ประมวลผลหรือนำสิ่งนั้นมาพิจารณา ที่สามารถทำได้ในขณะนี้ ตัวอย่างเช่น เราได้เปิดตัวการสาธิตบางส่วนเมื่อเร็วๆ นี้ในการประชุมเมื่อเดือนที่แล้ว NVIDIA GTC เราเปิดตัวการสาธิต
เป็นการสาธิตการบริการลูกค้าโดยใช้เฟรมเวิร์ก AI ที่เราเรียกว่า NVIDIA Tokkio ซึ่งแสดงให้เห็นอย่างชัดเจนว่ามันทำงานอย่างไรโดยเกี่ยวข้องกับการโต้ตอบที่เหมือนจริง เข้าใจในสิ่งที่ฉันพูด สิ่งที่ฉันขอ และสามารถทำได้ มันอยู่ในรูปแบบธรรมชาติของการสนทนาของมนุษย์ และนั่นเป็นสิ่งสำคัญ ขณะที่เราทำให้กระบวนการทั้งหมดเป็นแบบอัตโนมัติมากขึ้น นั่นเป็นสิ่งสำคัญอย่างยิ่ง เพราะอย่างที่คุณพูด เราต้องการโต้ตอบกับมนุษย์ใช่ไหม อย่างที่คุณพูด มีคนโทรมา พวกเขาต้องการได้ยินเสียงของมนุษย์ พวกเขาต้องการใครสักคนที่เป็นมิตร เข้าใจพวกเขา และซาบซึ้งในสิ่งที่พวกเขาพูด
หาก AI ถูกสร้างมาจนถึงระดับนั้น มันจะต้องสามารถทำเช่นนั้นได้ มิฉะนั้นประสบการณ์จะไม่ดี ฉันคิดว่านี่เป็นสิ่งสำคัญเมื่อพูดถึงเทคโนโลยี AI เมื่อพูดถึง AI การพูดหรือ AI การสนทนา มีเทคนิคหลายอย่างเช่น “เอาล่ะ ฉันเข้าใจคำที่คุณพูดกี่เปอร์เซ็นต์ ฉันสามารถเข้าใจคำพูดของคุณในสภาพแวดล้อมที่มีเสียงดังหรือไม่? ฉันสามารถทำสิ่งนี้ได้ทั้งหมด” และนั่นคือวิธีการทำงานของเทคโนโลยี
แต่สิ่งที่สำคัญจริงๆ คือ มันเป็นประสบการณ์ที่ยอดเยี่ยมหรือไม่ใช่ประสบการณ์ที่ยอดเยี่ยม? คุณสามารถนำเทคโนโลยีอันน่าทึ่งมาใช้กับความท้าทายนี้ และยังไม่สามารถมอบประสบการณ์ที่ดีให้กับลูกค้าได้ และนั่นคือสิ่งที่สำคัญที่สุดใช่ไหม ดังนั้นเราจึงนำแนวทางมาใช้กับเทคโนโลยีของเรา ซึ่งสิ่งสำคัญที่สุดประการหนึ่งที่เราสามารถช่วยลูกค้าได้คือนำ AI มาใช้ นำแบบจำลองที่ได้รับการฝึกอบรมมาล่วงหน้าเหล่านี้ และสามารถปรับแต่งให้เข้ากับโดเมนและสภาพแวดล้อมของตนเองได้ .
หากคุณกำลังเปิดคอลเซ็นเตอร์ซึ่งมีการพูดคุยกันส่วนใหญ่เกี่ยวกับพฤกษศาสตร์ ฉันจำชื่อพืชที่ฉันเปลี่ยนในช่วงเวลาที่สวนหน้าบ้านไม่ได้ใช่ไหม แต่ถ้าเป็นกรณีนี้ คุณต้องแน่ใจว่า AI นี้เข้าใจคำศัพท์และวลีและบริบทบางอย่างรอบโดเมนนั้น หรือหากเป็นบริษัทอุปกรณ์ทางการแพทย์ คุณอาจนึกภาพว่ามีหลายสิ่งหลายอย่างที่จะพูดคุยกันในการสนทนานั้น ซึ่งไม่ใช่การสนทนาปกติที่โมเดล AI จะได้รับการฝึก
ดังนั้นการปรับแต่งเองจึงมีความสำคัญอย่างยิ่งเช่นเดียวกับศัพท์แสงใช่ไหม? ดังนั้น โดยพิจารณาจากพื้นที่ต่างๆ ในโลกที่ลูกค้าของคุณอาศัยอยู่หรือโทรเข้ามา คุณต้องการที่จะสามารถเข้าใจภาษาถิ่น ศัพท์แสง สิ่งต่าง ๆ เช่นนี้ และสามารถจัดการสิ่งนั้นได้อย่างถูกต้อง หลายๆ อย่างไม่ได้เป็นเช่นนั้น… คุณไม่สามารถเพียงแค่นำโมเดล AI แบบสต็อกมาปรับใช้เพื่อทำงานในสภาพแวดล้อมและมอบประสบการณ์ที่ยอดเยี่ยมในทุกที่ การปรับแต่งจะมีความสำคัญมาก
อย่ามองข้ามข้อมูลตรงหน้าคุณ
เบรนท์ เลียรี: มีอะไรบ้างที่บริษัทต่างๆ ยังคงพยายามที่จะก้าวไปข้างหน้าในแง่ของการก้าวไปข้างหน้า?
Erik Pounds: ในบริบทของการสนทนานี้ อย่างที่คุณพูดถึง คุณมีความสัมพันธ์ที่ดีกับบริษัทจำนวนหนึ่งที่สร้างแพลตฟอร์ม CRM เหล่านี้ซึ่งใช้โดยองค์กรและองค์กรต่างๆ บ่อยครั้งในองค์กร พวกเขามีเซอร์วิสสแต็กหรือเทคสแต็กอยู่แล้ว จากนั้นพวกเขาต้องการทำสิ่งใหม่ บางครั้งที่ที่พวกเขาอยู่ทุกวันนี้ก็มีข้อจำกัดบางอย่าง
ที่มักจะเพิ่มความซับซ้อนบางอย่างเพราะส่วนหนึ่งของมันคือ "ฉันสามารถสร้างสิ่งนี้ได้ด้วยตัวเองและเสียบเข้ากับแพลตฟอร์มที่มีอยู่ของฉัน" หรือบางครั้งคุณต้องกลับไปที่ ISV ของคุณ ขอคุณสมบัติเช่น "เฮ้ เราต้องการทำสิ่งนี้จริงๆ คุณมีความคิดอย่างไร”
ฉันคิดว่าที่สำคัญที่สุด เมื่อคุณเริ่มบทสนทนาเหล่านั้น ให้เข้าใจข้อมูลที่ปลายนิ้วของคุณ ทำความเข้าใจว่าคุณสามารถทำอะไรได้ด้วยตัวเอง ISV ของคุณทำอะไรได้บ้าง สิ่งที่คุณสามารถทำได้แม้กระทั่งความช่วยเหลือจากคำปรึกษาเพียงเล็กน้อย และฉันคิดว่าเพียงแค่มีความเข้าใจอย่างถ่องแท้ เพื่อให้คุณก้าวไปข้างหน้าในเชิงบวกได้
โปรเจ็กต์ AI แรกๆ ในองค์กรส่วนใหญ่เคยชินกับ... พวกเขาฟันฝ่ากับพวกมันใช่ไหม? พวกเขาไม่ประสบความสำเร็จเสมอไป นี่คือเทคโนโลยีใหม่ ดังนั้นฉันจะบอกว่าการเตรียมพร้อมให้มากที่สุดดังนั้นคุณจึงมีโอกาสประสบความสำเร็จมากที่สุดในโครงการแรกของคุณเป็นสิ่งสำคัญที่สุดในขณะนี้
Brent Leary: จากมุมมองของแอปพลิเคชัน CRM โดยเฉพาะอย่างยิ่งหากคุณเป็นพนักงานขาย พวกเขาเกลียดการใช้ CRM พวกเขาไม่ชอบใส่ของ พวกเขาไม่ได้ลงทะเบียนเพื่อพิมพ์หรือปัดหรือคลิก พวกเขาต้องการออกไปสร้างความสัมพันธ์และขายของ และจินตนาการของฉันคือ คงจะดีไม่น้อยถ้าคุณสามารถพูดคุยกับแอปพลิเคชันระดับองค์กรของคุณ ไม่ว่าจะเป็น CRM หรือ ERB หรือตัวย่อใดๆ ที่คุณต้องการจะทิ้งไป หากคุณสามารถพูดคุยกับมันเหมือนที่เรากำลังพูดถึงอยู่ตอนนี้ และทำสิ่งต่าง ๆ ให้เสร็จ นั่นเป็นเพียงจินตนาการใช่ไหม หรือคุณเห็นวันที่เราสามารถสนทนาแบบนั้นกับแอพของเราได้จริงหรือ
Erik Pounds: ไม่ มันไม่ควรเป็นเช่นนั้น โดยเฉพาะทุกวันนี้เมื่อสิ่งเหล่านี้ส่วนใหญ่… คุณพูดว่า “เอาล่ะ ฉันได้กลับไปที่ Salesforce และอัปเดตบันทึกนี้หลังจากที่ได้สนทนากับลูกค้าหรือผู้มีแนวโน้มจะเป็นลูกค้ารายนี้แล้ว” และเราทุกคนรู้ดีว่าหลายครั้งบันทึกเหล่านี้ไม่ได้รับการอัปเดตอย่างดี จากนั้นธุรกิจก็ไม่มีสติปัญญาที่จำเป็นในการก้าวไปข้างหน้าใช่ไหม ไปป์ไลน์ไม่ทันสมัย คุณไม่สามารถเรียนรู้จากสิ่งนั้นได้ บทสนทนาเหล่านี้ตอนนี้เหมือนกับว่าเรากำลังมีใช่ไหม? พวกมันอยู่ห่างไกล พวกเขาไม่ได้อยู่ในห้องประชุมในบางอาคาร หรือแม้ว่าพวกเขาจะอยู่ในห้องประชุมในอาคารบางแห่ง ก็มักจะมีคนที่อยู่ห่างไกล ดังนั้นจึงมีระบบการฟังการสนทนานี้
แค่สามารถถอดความบทสนทนานั้นออกมาได้ ในกรณีนี้ ผู้จัดการบัญชีหรือใครก็ตามที่เกี่ยวข้องก็จะดีมาก และนั่นคือทั้งหมดที่สามารถทำได้ในวันนี้ เช่นเดียวกับการสนทนานี้ การสนทนานี้ถูกถอดความ คุณกำลังใช้ฟังก์ชัน ASR เพื่อถอดเสียงการสนทนา จากนั้นคุณกำลังใช้ฟังก์ชัน NLU หรือ NLP เพื่อทำความเข้าใจบริบทของสิ่งที่เรากำลังพูดถึง จากนั้นคุณสามารถอัปเดตฟิลด์มาตรฐานเหล่านั้นได้อย่างง่ายดาย และนี่คือสิ่งที่ซ้ำซากทั้งหมด ยิ่งกิจกรรมซ้ำๆ กันมากเท่าไหร่ ก็ยิ่งควรใช้ AI มากขึ้นเท่านั้น
นี่เป็นส่วนหนึ่งของซีรีส์สัมภาษณ์ตัวต่อตัวกับผู้นำทางความคิด แก้ไขการถอดเสียงเพื่อเผยแพร่แล้ว หากเป็นการสัมภาษณ์ด้วยเสียงหรือวิดีโอ ให้คลิกที่โปรแกรมเล่นที่ฝังไว้ด้านบน หรือสมัครผ่าน iTunes หรือผ่าน Stitcher
