การแสดงข้อมูล Python สำหรับผู้เริ่มต้น

เผยแพร่แล้ว: 2021-06-07

การสร้างภาพข้อมูลมีบทบาทสำคัญในการวิเคราะห์ข้อมูลและทำให้ทุกคนเข้าใจข้อมูลได้ชัดเจนขึ้นและเข้าใจง่ายขึ้น การแสดงข้อมูลด้วยภาพด้วยเครื่องมือสร้างภาพข้อมูล เช่น Python ช่วยระบุแนวโน้ม รูปแบบ และความสัมพันธ์ที่คุณอาจไม่เคยค้นพบ หรือตามที่นักวิทยาศาสตร์คอมพิวเตอร์ชาวอเมริกัน Ben Schneiderman กล่าวว่า ''Visualizations ให้คำตอบสำหรับคำถามที่คุณไม่รู้จัก มี''.

ในบล็อกนี้ เราจะพูดถึงว่าการสร้างภาพข้อมูลใน Python คืออะไร วิธีการแสดงข้อมูลใน Python โดยใช้ไลบรารีการสร้างภาพของ Python และนำเสนอตัวอย่างการแสดงภาพ Python เพื่อช่วยให้คุณเข้าใจถึงพลังของการสร้างภาพข้อมูลและวิธีที่ Python สามารถช่วยเหลือคุณได้ ใช้มัน

การสร้างภาพใน Python คืออะไร?

Python เป็นภาษาการเขียนโปรแกรมเอนกประสงค์ที่มีโครงสร้างข้อมูลระดับสูง ไดนามิกไทป์และการโยงไดนามิก และคุณสมบัติอื่นๆ มากมายที่ทำให้มันมีค่าและเป็นประโยชน์สำหรับการพัฒนาแอพพลิเคชั่นที่ซับซ้อน

ด้วยความสำคัญที่เพิ่มขึ้นของการแสดงข้อมูลเป็นภาพในช่วงสองทศวรรษที่ผ่านมา Python จึงเป็นมากกว่าภาษาโปรแกรม มันเติบโตเป็นภาษาการเขียนโปรแกรมที่ใช้มากที่สุดสำหรับวิทยาศาสตร์ข้อมูล นำเสนอตัวเลือกมากมายให้กับนักพัฒนาในการแสดงข้อมูลเป็นภาพและรับข้อมูลเชิงลึกที่ข้อมูลดิบเพียงอย่างเดียวไม่สามารถให้ได้

เพียงใช้ Python เพื่อสร้างการแสดงข้อมูลเป็นภาพข้อมูลจะช่วยให้ผู้ใช้ของคุณได้รับข้อมูลเชิงลึกในหน่วยมิลลิวินาที เมื่อเทียบกับวินาทีหรือนาทีที่พยายามวิเคราะห์และทำความเข้าใจชุดข้อมูลขนาดใหญ่ของข้อมูลที่ไม่ได้จัดรูปแบบซึ่งแสดงในรูปแบบตาราง ยิ่งไปกว่านั้น การใช้เครื่องมือสร้างภาพข้อมูลใน Python ช่วยให้คุณเพิ่มสี เส้นแนวโน้ม เครื่องหมาย คำอธิบายประกอบ และตัวชี้นำภาพอื่น ๆ อีกมากมายที่ช่วยให้ผู้ดูการแสดงภาพของคุณเข้าใจเรื่องราวของข้อมูลในทันที

ลองหนังสติ๊ก

Python Visualization Libraries

มีโอเพ่นซอร์สและไลบรารีการสร้างภาพเชิงพาณิชย์จำนวนมากสำหรับ Python ที่มีแผนภูมิธุรกิจ แผนภูมิทางวิทยาศาสตร์ แผนภูมิทางการเงิน การทำแผนที่ภูมิสารสนเทศ และอื่นๆ อีกมากมาย ในฐานะนักพัฒนา คุณสามารถนำเข้าไลบรารีเหล่านี้ไปยังโปรเจ็กต์ Python ของคุณได้อย่างง่ายดาย และตามประเภทของข้อมูลที่คุณมี ในโค้ดสองสามบรรทัด คุณสามารถสร้างการแสดงภาพได้

นี่คือ 5 ไลบรารีการสร้างภาพข้อมูล Python ที่ได้รับความนิยมมากที่สุด:

  • Matplotlib – Matplotlib เป็นไลบรารีการสร้างภาพข้อมูลแห่งแรกของ Python และเป็นไลบรารีพื้นฐานที่สร้างไลบรารีการสร้างภาพข้อมูล Python อื่น ๆ เป็นห้องสมุดที่ใช้มากที่สุดและเป็นห้องสมุดพล็อต 2 มิติ Matplotlib สามารถสร้างพล็อต แผนภูมิแท่ง แผนภูมิวงกลม ฮิสโตแกรม พาวเวอร์สเปกตรัม แผนภาพกระจาย แผนภูมิข้อผิดพลาด และการแสดงภาพข้อมูลประเภทอื่นๆ ห้องสมุดอนุญาตให้ควบคุมการแสดงภาพได้อย่างสมบูรณ์ มันมีประสิทธิภาพมาก แต่ก็ซับซ้อนมากเช่นกัน – คุณสามารถสร้างอะไรก็ได้ แต่ต้องใช้ความพยายามอย่างมากเพื่อให้ได้กราฟที่ดูสมเหตุสมผล
  • Seaborn – จาก Matplotlib ทำให้ Seaborn เป็นที่รู้จักในการสร้างการแสดงข้อมูล Python ที่ดึงดูดสายตามากที่สุด ห้องสมุดมีอินเทอร์เฟซระดับสูงสำหรับการวาดกราฟิกเชิงสถิติที่น่าสนใจและให้ข้อมูลโดยใช้โค้ดน้อยกว่าเมื่อเทียบกับ Matplotlib
  • ggplot – ไลบรารีนี้เป็นการนำการแสดงภาพข้อมูล ggplot2 ของ Python ไปใช้ในภาษาการเขียนโปรแกรม R ggplot ถูกรวมเข้ากับไลบรารี Pandas อย่างแน่นหนา และแสดงให้เห็นรูปแบบการเรียนรู้ของเครื่องที่ดีที่สุดรูปแบบหนึ่ง หลังจากที่ได้รับการบอกเล่าถึงวิธีการแมปตัวแปรต่างๆ กับสุนทรียศาสตร์และสิ่งที่ต้องใช้พื้นฐาน สามารถใช้เพื่อสร้างการนำเสนอแบบกราฟิกอย่างง่าย และไม่สามารถใช้สำหรับการสร้างกราฟิกที่ปรับแต่งได้สูง
  • Plotly – Plotly อนุญาตให้สร้างทั้งการสร้างภาพข้อมูลและการวิเคราะห์โดยใช้โค้ดเพียงไม่กี่บรรทัดและมีแผนภาพเส้นชั้นความสูงซึ่งไม่ธรรมดาสำหรับไลบรารีอื่นๆ ทั้งหมด มันสามารถสร้างการแสดงภาพได้มากมาย เช่น แผนภาพกระจาย แผนภูมิเส้น แผนภูมิแท่ง แถบข้อผิดพลาด แผนผังย่อย ฮิสโตแกรม แผนภาพกล่อง ฯลฯ นอกจากนี้ Plotly ยังมีความสามารถของเครื่องมือโฮเวอร์ที่ช่วยให้สามารถตรวจจับค่าผิดปกติหรือความผิดปกติในจุดข้อมูลจำนวนมากได้
  • Pandas – แม้ว่าจะไม่ใช่ไลบรารีการสร้างภาพ แต่ Pandas เป็นไลบรารีโอเพนซอร์ซที่มีประสิทธิภาพสูงที่ให้การจัดการข้อมูลและการแปลงข้อมูลที่รวดเร็วและยืดหยุ่นสำหรับใช้ในไลบรารีการสร้างภาพ Python การใช้ API ระดับสูงของ Pandas สำหรับการประมวลผลข้อมูลหมายความว่าคุณเขียนโค้ด Python น้อยลงสำหรับการจัดการข้อมูลเพื่อให้ได้ผลลัพธ์แบบเดียวกับที่คุณทำกับโค้ด Python ที่มีความยาวและซับซ้อน

Python Interactive Visualization

หากคุณกำลังมองหาเครื่องมือสร้างภาพแบบโต้ตอบ Python คุณควรพิจารณาโบเก้

Bokeh เป็นไลบรารีการสร้างภาพแบบโต้ตอบที่แสดงกราฟิกโดยใช้ HTML และ JavaScript อย่างไรก็ตาม โบเก้มี Python API เพื่อสร้างภาพข้อมูลเชิงโต้ตอบใน D3.js โดยมีหรือไม่มีความจำเป็นในการเขียนโค้ด JavaScript ใดๆ เหมาะสำหรับสินทรัพย์ข้อมูลขนาดใหญ่หรือการสตรีม และสามารถใช้เพื่อพัฒนาพล็อต แอปพลิเคชัน และแดชบอร์ดบนเว็บแบบโต้ตอบได้ โบเก้เป็นเครื่องมือที่ทรงพลังมากสำหรับการสำรวจและทำความเข้าใจข้อมูลของคุณ และสร้างแผนภูมิแบบกำหนดเองที่น่าสนใจสำหรับโครงการหรือรายงาน ในพื้นที่การสร้างภาพข้อมูล Python โบเก้คือตัวเลือกอันดับ 1 สำหรับการสร้างการแสดงข้อมูลเชิงโต้ตอบ

ไลบรารียังทำงานอย่างใกล้ชิดกับเครื่องมือ PyData และอนุญาตให้ใช้อ็อบเจ็กต์ Pandas และ NumPy มาตรฐานสำหรับการลงจุด

การแสดงข้อมูลอนุกรมเวลาของ Python

ข้อมูลอนุกรมเวลาคือชุดของจุดข้อมูลที่แสดงตามลำดับเวลา เป็นลำดับของจุดช่วงเวลาเท่ากันต่อเนื่องกัน และประกอบด้วยวิธีการวิเคราะห์เพื่อดึงข้อมูลเชิงลึกที่มีความหมายและคุณลักษณะที่เป็นประโยชน์อื่นๆ ของข้อมูล ข้อมูลประเภทอนุกรมเวลามีความสำคัญในหลายอุตสาหกรรม เช่น เภสัชกรรม การค้าปลีก การขนส่ง การเงิน และแม้แต่โซเชียลมีเดียและบริษัทการตลาดผ่านอีเมล และอื่นๆ อีกมากมาย

ต่อไปนี้คือตัวอย่างข้อมูลอนุกรมเวลาทั้งหมด:

  • ยา: การตรวจวัดอัตราการเต้นของหัวใจ การติดตามน้ำหนัก การติดตามความดันโลหิต ฯลฯ
  • ขายปลีก: จำนวนสินค้าที่ขายต่อชั่วโมงในช่วง 24 ชั่วโมงหรือ 48 ชั่วโมง
  • การเดินทาง: จำนวนผู้เดินทางในระยะเวลาหนึ่งสัปดาห์หรือหนึ่งเดือน
  • เศรษฐศาสตร์: ผลิตภัณฑ์มวลรวมภายในประเทศ ดัชนีราคาผู้บริโภค ฯลฯ

แผนภูมิเส้นเป็นวิธีที่ใช้บ่อยที่สุดในการแสดงภาพข้อมูลอนุกรมเวลา โดยปกติการแสดงแผนภูมิจะอนุญาตให้มีการโต้ตอบ เช่น การซูมเข้าเพื่อดูข้อมูลตามเวลาที่มีรายละเอียดมากขึ้น หรือการย่อเพื่อดูข้อมูลในระดับสูง

ตัวอย่างการแสดงภาพ Python

เครื่องมือสร้างภาพข้อมูลและแดชบอร์ดประกอบด้วยแผนภูมิหลากหลายประเภท เครื่องมือต่างๆ เช่น Python และไลบรารีกราฟิก Python ที่กล่าวถึงข้างต้น สามารถช่วยสร้างการแสดงภาพข้อมูลที่เป็นประโยชน์และให้ข้อมูล เมื่อคุณต้องการทำมากกว่าประเภทแผนภูมิที่มีให้ ตัวอย่างเช่น ผลิตภัณฑ์ส่วนใหญ่ไม่มีการแสดงภาพขั้นสูง เช่น Sankey Diagrams, Heatmaps หรือ Steamgraphs Slingshot ทำให้ง่ายต่อการเพิ่มการแสดงภาพขั้นสูงเหล่านี้ใน Python

ตามค่าเริ่มต้น การสร้างภาพ Python ใน Slingshot จะรวมไลบรารีเหล่านี้ไว้ในโปรแกรมแก้ไขสคริปต์ของคุณ:

 #import matplotlib #import matplotlib.pyplot as plt #import numpy as np #import pandas as pd

และตามค่าเริ่มต้น ฟิลด์ที่พร้อมใช้งานโดยค่าเริ่มต้นในตัวแก้ไขสคริปต์คือสิ่งที่คุณเลือกจากตัวเลือกฟิลด์ในตัวแก้ไขการแสดงภาพ:

 #data['Territory'] #data['CampaignID'] #data['Sum of Spend']

คุณกำลังสร้างการแสดงภาพของคุณ เช่นเดียวกับแผนภูมิในตัวอื่นๆ ความแตกต่างเพียงอย่างเดียวคืออันนี้ถูกสร้างขึ้นด้วยรหัส Python บางส่วน:

 campaignid = np.unique(np.array(data['CampaignID'])) territory = np.unique(np.array(data['Territory'])) spend = np.array(data['Sum of Spend']).reshape((7, 5)) fig, ax = plt.subplots(figsize=(5.5, 6.5)) im = ax.imshow(spend) # Show all ticks... ax.set_xticks(np.arange(len(territory))) ax.set_yticks(np.arange(len(campaignid))) # ... and label them with the respective list entries ax.set_xticklabels(territory) ax.set_yticklabels(campaignid) # Loop over data dimensions and create text annotations. for i in range(len(campaignid)): for j in range(len(territory)): text = ax.text(j, i, spend[i, j], ha="center", va="center", color="w") ax.set_title("Campaign Spend (dollars)") fig.tight_layout()

ส่งผลให้มีการแสดงภาพแผนที่ความร้อนที่สวยงามซึ่งคุณสามารถแชร์กับคนอื่นๆ ในทีมของคุณได้อย่างง่ายดาย!

Python Data Visualization for Beginners

ความคิดสุดท้าย

ในขณะที่ธุรกิจต่างๆ ยังคงพึ่งพาข้อมูลในการตัดสินใจที่ดีขึ้นและอิงตามข้อเท็จจริง ความสำคัญของการแสดงข้อมูลเป็นภาพจะยิ่งเพิ่มมากขึ้น และเนื่องจากเทคนิคการแสดงภาพ เช่น แผนภูมิและกราฟจะมีประสิทธิภาพมากกว่าในแง่ของการทำความเข้าใจข้อมูลเมื่อเปรียบเทียบกับสเปรดชีตแบบเดิมและรายงานข้อมูลที่ล้าสมัย การใช้เครื่องมืออย่าง Python เพื่อสร้างการแสดงข้อมูลเป็นภาพจึงมีความจำเป็นสำหรับทีมข้ามสายงานทุกทีม

อย่างไรก็ตาม แม้จะมีความสำคัญของข้อมูลและข้อมูลเชิงลึก แต่การมีข้อมูลเหล่านี้ไม่เพียงพออีกต่อไป เพื่อปลดล็อกศักยภาพในการดึงข้อมูล คุณต้องเปลี่ยนข้อมูลนั้นเป็นการกระทำที่เข้ากับเวิร์กโฟลว์การปฏิบัติงานประจำวันของคุณ คุณสามารถเปลี่ยนจากข้อมูลเชิงลึกไปสู่การดำเนินการได้อย่างราบรื่นด้วย Slingshot

ด้วย Slingshot คุณสามารถวิเคราะห์ข้อมูล สร้างภาพข้อมูลที่สวยงาม ทำงานร่วมกับทุกคนในองค์กรของคุณ และจัดการโครงการทั้งหมดของคุณได้อย่างง่ายดาย ทั้งหมดนี้มาจากแพลตฟอร์มเดียวกัน

สนใจเรียนรู้เพิ่มเติม? ลองใช้ Slingshot ฟรีและดูว่าจะช่วยให้คุณใช้ประโยชน์จากข้อมูลเชิงลึกที่นำไปใช้ได้จริงได้อย่างไร ในขณะที่ทำให้ทีมของคุณใช้ข้อมูลได้ง่ายขึ้น ปลูกฝังวัฒนธรรมที่ขับเคลื่อนด้วยข้อมูล และปรับปรุงประสิทธิภาพการทำงาน