อุปสรรคต่อการวิเคราะห์ตามเวลาจริง

เผยแพร่แล้ว: 2016-08-30
สารบัญ แสดง
การวิเคราะห์ข้อมูลขนาดใหญ่ที่สร้างขึ้นจากการรวบรวมข้อมูลเว็บและการดึงข้อมูล
การวิเคราะห์ข้อมูลมีการพัฒนาอย่างไรในช่วงหลายปีที่ผ่านมา?
ความจำเป็นในการวิเคราะห์ข้อมูลแบบเรียลไทม์
ความท้าทายในการวิเคราะห์ข้อมูลแบบเรียลไทม์
สรุป

Big Data ให้คุณค่าแก่ธุรกิจในหลายอุตสาหกรรมในหลายระดับ ยกตัวอย่างอุตสาหกรรมค้าปลีก ภาคส่วนนี้กำลังต่อสู้ดิ้นรนในระบบนิเวศที่ซับซ้อนขึ้นเรื่อยๆ ด้วยความต้องการและความชอบที่ค่อยๆ พัฒนาไปทีละนาที ลูกค้าสามรายต้องการบริการที่เร็วขึ้น คุณภาพที่เหนือกว่า และราคาที่ต่ำกว่า คือสิ่งที่ก่อให้เกิดบิ๊กดาต้าเป็นอาวุธในการรับมือกับความต้องการเหล่านี้และตอบสนองความต้องการเหล่านี้อย่างเหมาะสม เพื่อหลีกเลี่ยงการสูญเสียรายได้

อุปสรรคต่อการวิเคราะห์ตามเวลาจริง

ขั้นตอนแรกในการตอบสนองความต้องการเหล่านี้คือการรู้ว่าลูกค้าพูดถึงแบรนด์ใดแบรนด์หนึ่งว่าอย่างไร ซึ่งจะช่วยให้ผู้ค้าปลีกสามารถระบุได้ว่าลูกค้าต้องการอะไร ด้วยความช่วยเหลือของการรวบรวมข้อมูลเว็บที่เป็นเป้าหมายซึ่งให้บริการโดย บริษัทสกัดข้อมูล ผู้เชี่ยวชาญ ขณะนี้บริษัทต่างๆ มีอำนาจในการดึงข้อมูลจากหน้าเว็บและแพลตฟอร์มโซเชียลมีเดียนับล้านๆ

การวิเคราะห์ข้อมูลขนาดใหญ่ที่สร้างขึ้นจากการรวบรวมข้อมูลเว็บและการดึงข้อมูล

ขั้นตอนต่อไปคือการ วิเคราะห์ข้อมูลที่รวบรวมจากการรวบรวมข้อมูลเว็บ ซึ่งจะช่วยให้นักวิทยาศาสตร์ข้อมูลและผู้จัดการฝ่ายการตลาดเข้าใจว่าความต้องการ ความต้องการ ความชอบ และทางเลือกที่ลูกค้าต้องการคืออะไร เป็นผลให้ผู้มีอำนาจตัดสินใจในอุตสาหกรรมค้าปลีกสามารถดำเนินการเพื่อเติมเต็มช่องว่างในความต้องการหรือปรับแต่งการแบ่งประเภทผลิตภัณฑ์ได้อย่างรวดเร็วเพื่อให้ตรงกับสิ่งที่ลูกค้าต้องการเห็น อย่างไรก็ตาม การวิเคราะห์ข้อมูลจะไม่ง่ายเมื่อคุณมีข้อมูลหลายล้านแถวให้วิเคราะห์ ตาม Gartner ข้อมูลจะเติบโตที่ 800% อย่างไม่เคยปรากฏมาก่อนใน 5 ปีข้างหน้าและ 80% ของข้อมูลจะไม่มีโครงสร้าง ดังนั้นความจำเป็นในการวิเคราะห์ข้อมูลขนาดใหญ่กำลังจะระเบิดในอีกไม่กี่ปีข้างหน้า

การวิเคราะห์ข้อมูลมีการพัฒนาอย่างไรในช่วงหลายปีที่ผ่านมา?

แม้ว่าการวิเคราะห์ข้อมูลจะมีมานานหลายปีแล้วก็ตาม แต่ขนาดและความเร็วของข้อมูลที่ขณะนี้กำลังเข้ามา กำลังสร้างปัญหาให้กับนักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ อย่างที่ อนันต์ ราชรามัน รองประธานอาวุโสของ Walmart Global e-commerce และผู้ร่วมก่อตั้ง @WalmartLabs กล่าวว่า “ ผู้คนจำนวนมากรู้วิธีทำงานกับข้อมูล แต่ตอนนี้มีข้อมูลมากขึ้น ดังนั้นสิ่งที่คุณทำได้ กับมันและวิธีการทำงานของคุณจะแตกต่างกันมาก….. เครื่องมือ [สำหรับ Big Data] แตกต่างกันมาก อัลกอริธึมพื้นฐานจำนวนมากสำหรับการวิเคราะห์เชิงคาดการณ์ขึ้นอยู่กับการเก็บข้อมูลในหน่วยความจำหลักด้วย CPU ตัวเดียวในการเข้าถึง Big Data ทำลายเงื่อนไขนั้น ข้อมูลไม่สามารถอยู่ในหน่วยความจำทั้งหมดได้ในเวลาเดียวกัน ดังนั้นจึงจำเป็นต้องประมวลผลแบบกระจาย ที่ต้องใช้รูปแบบการเขียนโปรแกรมใหม่

ความจำเป็นในการวิเคราะห์ข้อมูลแบบเรียลไทม์

หากเรามองย้อนกลับไปเมื่อสองสามปีก่อน ข้อดีของการวิเคราะห์แบบเรียลไทม์นั้น หายไปจากแผนงานของนักการตลาดดิจิทัลอย่างมาก ข้อจำกัดนี้สร้างปัญหาให้กับผู้ลงโฆษณา ผู้จัดการฝ่ายการตลาด และผู้มีอำนาจตัดสินใจในหลาย ด้าน แม้ว่าพวกเขาจะใช้สถิติที่มีอายุเพียงไม่กี่วันหรือหลายสัปดาห์ แต่ช่วงเวลานี้ก็เพียงพอแล้วที่จะทำให้ข้อมูลล้าสมัย ต้องขอบคุณความเร็วมหาศาลของข้อมูลขนาดใหญ่ สิ่งนี้สร้างความต้องการในการเข้าถึงข้อมูลเชิงลึกได้เร็วขึ้นและมีการวิเคราะห์ในระยะเวลาที่สั้นลง

มูลค่าที่เสนอโดยบิ๊กดาต้านั้นมีเหตุผล เพียงพอสำหรับบริษัทต่างๆ ในการค้นหาการค้นพบและข้อมูลเชิงลึกจากการวิเคราะห์ข้อมูลที่รวดเร็วยิ่งขึ้น ในฐานะ CTO ของ EMC ที่ Greenplum เป็นเจ้าของ Duke Lonergan กล่าวว่า "ทุกธุรกิจกำลังมองหาวิธีในการ เชื่อมต่อกับลูกค้าอย่างแน่นแฟ้นยิ่งขึ้น เพื่อปรับปรุงการคาดการณ์และเคลื่อนย้ายพวกเขาไปตามวิถี เราเห็นความเร่งด่วนบางอย่างเกี่ยวกับ Big Data

นี่แสดงให้เห็นว่าโลกธุรกิจและเทคโนโลยีกำลังพึ่งพาการวิเคราะห์บิ๊กดาต้าแบบเรียลไทม์มากขึ้นเรื่อยๆ เกี่ยวกับข้อมูลแบบเรียลไทม์ ที่ดึงมาจากการรวบรวมข้อมูลเว็บและความเชี่ยวชาญในการดึงข้อมูลของผู้เชี่ยวชาญในสาขานี้ ด้วยความช่วยเหลือของการวิเคราะห์ข้อมูลแบบเรียลไทม์ ผู้จัดการฝ่ายการตลาดและผู้บริหารระดับสูงสามารถดูแบบเรียลไทม์ ตัวชี้วัดประสิทธิภาพต่างๆ เช่น จำนวนคนที่เห็นผลิตภัณฑ์เฉพาะ จำนวนที่ตอบสนองต่อผลิตภัณฑ์ออนไลน์ จำนวนเท่าใด จริง ๆ แล้วซื้อมัน สำหรับบริษัท จะช่วยเพิ่มหรือลดการใช้จ่ายดิจิทัลโดยพิจารณาจากสิ่งที่ผู้คนกำลังพูดถึงจริงๆ และสิ่งที่กำลังเป็นที่นิยมในขณะนั้น การเพิ่มประสิทธิภาพการใช้จ่ายดิจิทัลช่วยให้แบรนด์กระชับความสัมพันธ์กับลูกค้าและสร้าง มูลค่าแบรนด์ในระยะยาว

ความท้าทายในการวิเคราะห์ข้อมูลแบบเรียลไทม์

อย่างไรก็ตาม แม้ว่าการวิเคราะห์ข้อมูลตามเวลาจริงอาจดูยอดเยี่ยมในทางทฤษฎี แต่ก็ซับซ้อนเล็กน้อยในการออกแบบและการส่งมอบจริง การวิเคราะห์ข้อมูลตามเวลาจริงที่สร้างขึ้นด้วยความช่วยเหลือของการรวบรวมข้อมูลเว็บที่ดำเนินการจาก บริษัทคัดแยกข้อมูล ควรเป็นไปตามวัตถุประสงค์ด้านล่าง:

  • วิเคราะห์ข้อมูลเป็นระยะเวลานาน เพื่อช่วยเปิดเผยรูปแบบและปลดล็อกแนวโน้มที่น่ารู้
  • สร้างแบบจำลองสำหรับการพยากรณ์อนาคตหรือประดิษฐ์ระบบควบคุม
  • ช่วยในการเชื่อมโยงพารามิเตอร์ที่ดูเหมือนไม่เกี่ยวข้องกัน ตัวอย่างเช่น สามารถสำรวจข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับพฤติกรรมการขับขี่ได้โดยการตรวจสอบพารามิเตอร์ เช่น ข้อมูลเซ็นเซอร์ IoT เกี่ยวกับการเร่งความเร็วและความเร็ว

เห็นได้ชัดว่ามีความท้าทายที่สำคัญบางประการที่จะต้องเอาชนะก่อนที่ RoI ในการวิเคราะห์ตามเวลาจริงจะน่าสนใจ ด้านล่างนี้คือความท้าทายหลักบางประการ -

  1. การพึ่งพาระบบเดิม : เมื่อสองสามปีก่อน – ประมาณปี 2009 การสืบค้นง่ายๆ และการค้นหาข้อมูลเพื่อตอบคำถามนั้นใช้เวลานาน สมมติว่าหากคุณมีคำถามว่า "มีลูกค้ากี่รายที่เรียกดูไซต์ของฉันผ่านโทรศัพท์ Android" ขั้นตอนแรกในการรับคำตอบสำหรับคำถามนี้คือการปรับปรุงสคีมาในคลังข้อมูลของคุณ ขั้นตอนนี้เองจะใช้เวลา สองสามเดือน โดยเฉลี่ย

ดังนั้น แนวโน้มทั่วไปของผู้จัดการข้อมูลคือต้องค้นหาคำถามล่วงหน้า เมื่อออกแบบสคีมาและคลังสินค้า เพื่อให้พอดีกับการตอบคำถามเมื่อพบเห็นจริง อย่างไรก็ตาม ในสภาพแวดล้อมแบบไดนามิก สิ่งนี้ไม่สามารถทำได้อีกต่อไป ดังนั้น การพึ่งพาระบบเดิมโดยไม่ต้องอัปเกรดเป็นเครื่องมือวิเคราะห์ข้อมูลแบบเรียลไทม์ที่พร้อมใช้งานในอนาคต เช่น Vertica, Hive และ MapReduce จึงเป็นอุปสรรคใหญ่ในการวิเคราะห์ข้อมูลแบบเรียลไท ม์

  1. เร็วแค่ไหนในปัจจุบัน : การปรับปรุงภูมิทัศน์เทคโนโลยีทำให้มั่นใจได้ว่ากระบวนการวิเคราะห์ทั้งหมดที่เคยใช้เวลาเป็นเดือน สัปดาห์ และวัน ตอนนี้ใช้เวลาเป็นนาที วินาที และไมโครวินาที นักวิทยาศาสตร์ด้านข้อมูลก็ต้องนึกถึงคำถามและวิโอลา! พวกเขามีผลลัพธ์ของการทดลองและสมมติฐานต่อหน้าพวกเขาในทันทีทันใด เวลาประมวลผลที่สั้นลงสำหรับการวิเคราะห์ข้อมูลได้นำไปสู่ความคาดหวังที่เพิ่มขึ้น

Justin Erickson ผู้จัดการผลิตภัณฑ์อาวุโสของ Cloudera กล่าวว่า " เป็น เรื่องเกี่ยวกับการเคลื่อนไหวอย่างรวดเร็วยิ่งขึ้นไปยังคำถามที่ไม่รู้จักก่อนหน้านี้ การกำหนดข้อมูลเชิงลึกใหม่ และลดเวลาระหว่างเวลาที่เหตุการณ์เกิดขึ้นที่ใดที่หนึ่งในโลกและมีคนตอบสนองหรือตอบสนองต่อเหตุการณ์นั้น ” ดังนั้นความต้องการที่เพิ่มขึ้นในการลดระยะเวลาในการวิเคราะห์ข้อมูลและการสร้างข้อมูลเชิงลึกจึงเป็นอุปสรรคในการมอบคุณค่าด้วยการวิเคราะห์ข้อมูลแบบเรียลไทม์

  1. การตัดสินใจ: ค่อนข้างแน่นอนว่าเทคโนโลยี กระบวนการ และผู้คนได้รับอำนาจในการรวบรวมข้อมูลอย่างรวดเร็วผ่าน การดึงข้อมูล และ การรวบรวมข้อมูล เว็บ พวกเขายังสามารถใช้และวิเคราะห์ข้อมูลในแบบเรียลไทม์ได้อีกด้วย อย่างไรก็ตาม เรารู้สึกอย่างไรเมื่อต้องดำเนินการและตัดสินใจโดยอิงจากการวิเคราะห์ข้อมูล มีสองตัวเลือกที่นี่ -
  • Human centric – วิธีการดั้งเดิมที่ผู้อาวุโสหรือผู้มีอำนาจตัดสินใจจะดูผลการวิเคราะห์แล้วทำการตัดสินใจตามข้อมูลเชิงลึกและการแสดงภาพเหล่านี้
  • ระบบอัตโนมัติ – กระบวนการอัตโนมัติสามารถช่วยในการตัดสินใจตามชุดผลลัพธ์เฉพาะโดยไม่ต้องรอให้คนเข้ามาแทรกแซง

เห็นได้ชัดว่าการมีระบบอัตโนมัติจะช่วยปรับปรุงประสิทธิภาพของการวิเคราะห์ข้อมูลแบบเรียลไทม์ และกระบวนการตัดสินใจที่ตามมา อย่างไรก็ตาม การไม่สามารถจับคู่ความน่าเชื่อถือของการดำเนินการในกระบวนการตัดสินใจทำให้การตัดสินใจที่เน้นมนุษย์เป็นศูนย์กลางได้เปรียบกว่า นี่เป็นอุปสรรคในการปรับปรุงประสิทธิภาพของ การวิเคราะห์ข้อมูล แบบเรียลไทม์อีกครั้ง

  1. การเปลี่ยนแปลงทางวัฒนธรรม : การมีการวิเคราะห์ตามเวลาจริงและเข้าถึงได้จะส่งผลต่อวิธีการทำงานของบริษัทในปัจจุบัน ข้อมูลเชิงลึกแบบเรียลไทม์จะทำให้บริษัทต่างๆ ที่เคยทำงานเกี่ยวกับข้อมูลเชิงลึกจำนวนมากหลั่งไหลเข้ามาท่วมท้นสัปดาห์ละครั้งหรือสองครั้ง ลองนึกภาพว่าบริษัทได้สร้างบุคลากร กระบวนการ และตัวชี้วัดประสิทธิภาพโดยใช้แนวทางการดำเนินการเชิงลึกสัปดาห์ละครั้งหรือไม่ จะเกิดอะไรขึ้นกับตัวชี้วัด ประสิทธิภาพการทำงาน และประสิทธิภาพเมื่อข้อมูลเชิงลึกเริ่มเข้ามาทุกวันแทนที่จะเป็นรายสัปดาห์ ด้วยการวิเคราะห์ข้อมูลแบบเรียลไทม์

ผลลัพธ์จะเกิดความโกลาหลหากการเปลี่ยนแปลงไม่ได้วางแผนในลักษณะเชิงกลยุทธ์ เนื่องจากการรับและดำเนินการตามข้อมูลเชิงลึกทุก ๆ วินาทีในแต่ละวันจะต้องใช้วัฒนธรรมและแนวทางที่แตกต่างจากวิธีดั้งเดิมในการดำเนินการตามข้อมูลเชิงลึกเป็นประจำทุกสัปดาห์ อุปสรรคทางวัฒนธรรมดังกล่าวในสถานที่ทำงานขององค์กรในการใช้การวิเคราะห์ข้อมูลแบบเรียลไทม์ก็ไม่ใช่เรื่องแปลกเช่นกัน

สรุป

ในการลงนาม ข้อเสนอมูลค่ามหาศาลที่นำเสนอโดยการวิเคราะห์ข้อมูลขนาดใหญ่แบบเรียลไทม์จะช่วยขับเคลื่อนภาคอุตสาหกรรมที่สำคัญในปัจจุบันให้ก้าวผ่านการแข่งขันในการให้บริการลูกค้าได้อย่างน่าพอใจและได้เปรียบในการแข่งขัน โดยมีเงื่อนไขว่าพวกเขาสามารถจัดการกับความท้าทายได้อย่างน่าพอใจ

วางแผนที่จะรับข้อมูลจากเว็บหรือไม่? เราอยู่ที่นี่เพื่อช่วย แจ้งให้เราทราบ เกี่ยวกับความต้องการของคุณ