تصور بيانات بايثون للمبتدئين
نشرت: 2021-06-07يلعب تصور البيانات دورًا مهمًا في تحليل البيانات وجعل البيانات أكثر وضوحًا وأسهل في الفهم من قبل الجميع. يساعد التمثيل المرئي للمعلومات باستخدام أدوات تصور البيانات مثل Python في تحديد الاتجاهات والأنماط والارتباطات التي ربما لم تكتشفها أبدًا ، أو كما يقول عالم الكمبيوتر الأمريكي بن شنايدرمان ، "تمنحك التصورات إجابات لأسئلة لم تكن تعرفها. كان''.
في هذه المدونة ، سنناقش ماهية تصور البيانات في Python ، وكيفية تصور البيانات في Python باستخدام مكتبات التصور Python ، ونقدم لك بعض أمثلة التصور Python لمساعدتك على فهم قوة تصور البيانات بشكل أفضل وكيف يمكن أن تساعدك Python في الاستفادة منه.
ما هو التخيل في بايثون؟
Python هي لغة برمجة للأغراض العامة تتضمن هياكل بيانات عالية المستوى ونمط ديناميكي وربط ديناميكي ومجموعة متنوعة من الميزات الأخرى التي تجعلها ذات قيمة ومفيدة لتطوير التطبيقات المعقدة.
مع تزايد أهمية تصور البيانات في العقدين الماضيين ، أصبحت بايثون أكثر من مجرد لغة برمجة. لقد نمت لتصبح لغة البرمجة الأكثر استخدامًا لعلوم البيانات ، مما يوفر للمطورين عددًا لا يحصى من الخيارات لتصور البيانات واكتساب رؤى لا يمكن أن توفرها البيانات الأولية وحدها.
ببساطة ، فإن استخدام Python لإنشاء تصورات البيانات الخاصة بك سيساعد المستخدمين على اكتساب رؤى البيانات في أجزاء من الثانية مقارنة بالثواني أو حتى الدقائق في محاولة لتحليل وفهم مجموعات البيانات الكبيرة من البيانات غير المنسقة الممثلة في تنسيقات جدولية. والأفضل من ذلك ، يتيح لك استخدام أدوات تصور البيانات في Python إضافة اللون وخطوط الاتجاه والعلامات والتعليقات التوضيحية والعديد من الإشارات المرئية التي تساعد عارض التصور على فهم قصة بياناتهم على الفور.
جرب مقلاع
مكتبات تصور بايثون
هناك العديد من مكتبات التصور التجارية والمفتوحة المصدر لبايثون والتي تقدم مخططات الأعمال والمخططات العلمية والمخططات المالية ورسم الخرائط الجغرافية وغيرها الكثير. بصفتك مطورًا ، يمكنك بسهولة استيراد هذه المكتبات إلى مشاريع Python الخاصة بك ، وبناءً على نوع البيانات التي لديك ، يمكنك تقديم تصور مرئي في بضعة أسطر من التعليمات البرمجية.
هذه هي أكثر 5 مكتبات تصور بيانات Python شيوعًا:
- Matplotlib - Matplotlib هي أول مكتبة لتصور البيانات في Python وهي مكتبة الأساس التي تم بناء كل مكتبة أخرى لتصور بيانات Python عليها. وهي الأكثر استخدامًا وهي مكتبة للتخطيط ثنائي الأبعاد. يمكن لـ Matplotlib إنشاء مخططات ، ومخططات شريطية ، ومخططات دائرية ، ومخططات بيانية ، وأطياف الطاقة ، ومخططات مبعثرة ، ومخططات خطأ ، وأنواع أخرى من تصورات البيانات. تتيح المكتبة التحكم المطلق في التصور. إنه قوي جدًا ، ولكنه أيضًا معقد للغاية - يمكنك إنشاء أي شيء ، لكن الأمر يتطلب الكثير من العمل والجهد للحصول على رسوم بيانية ذات مظهر معقول.
- Seaborn - استنادًا إلى Matplotlib ، يُعرف Seaborn بإنشاء تصورات بيانات Python الأكثر جاذبية. توفر المكتبة واجهة عالية المستوى لرسم رسومات إحصائية جذابة وغنية بالمعلومات مع رمز أقل مطلوب مقارنةً بـ Matplotlib.
- ggplot - هذه المكتبة هي تطبيق Python لتصور بيانات ggplot2 في لغة البرمجة R. تم دمج ggplot بإحكام مع مكتبة Pandas ويوضح أحد أفضل أشكال التعلم الآلي بعد أن يتم إخباره بكيفية تعيين المتغيرات إلى الجماليات والأساسيات التي يجب استخدامها. يمكن استخدامه لإنشاء تمثيلات رسومية بسيطة ولا يمكن استخدامه لإنشاء رسومات مخصصة للغاية.
- Plotly - يسمح Plotly بإنشاء كل من تصورات البيانات وتحليلاتها مع عدد قليل جدًا من أسطر التعليمات البرمجية المطلوبة ولها مخططات كفافية وهو أمر غير مألوف للغاية بالنسبة لجميع المكتبات الأخرى. يمكن أن تولد العديد من المرئيات مثل المخططات المبعثرة ، المخططات الخطية ، المخططات الشريطية ، أشرطة الخطأ ، المخططات الفرعية ، الرسوم البيانية ، المخططات الصندوقية ، إلخ. علاوة على ذلك ، تمتلك Plotly إمكانيات أداة التمرير التي تسمح باكتشاف القيم المتطرفة أو الحالات الشاذة في عدد كبير من نقاط البيانات.
- Pandas - على الرغم من أنها ليست مكتبة تصور ، فإن Pandas هي مكتبة مفتوحة المصدر عالية الأداء توفر وظائف معالجة البيانات وتحويل البيانات بسرعة ومرونة لاستخدامها في مكتبات التصور في Python. إن استخدام واجهة برمجة تطبيقات Pandas عالية المستوى لمعالجة البيانات يعني أنك تكتب كود Python أقل لمعالجة البيانات لتحقيق نفس النتائج التي تريدها باستخدام كود Python الطويل والمعقد.
التصور التفاعلي لبايثون
إذا كنت تبحث عن أداة التصور التفاعلي لـ Python ، فعليك التفكير في Bokeh.
Bokeh هي مكتبة تصور تفاعلي تعرض رسوماتها باستخدام HTML و JavaScript. ومع ذلك ، يوفر Bokeh واجهة برمجة تطبيقات Python لإنشاء تصورات تفاعلية في D3.js مع أو بدون ضرورة كتابة أي كود JavaScript. وهي مناسبة لأصول البيانات الكبيرة أو المتدفقة ويمكن استخدامها لتطوير المؤامرات والتطبيقات ولوحات المعلومات التفاعلية المستندة إلى الويب. Bokeh هي أداة قوية للغاية لاستكشاف وفهم بياناتك وإنشاء مخططات مخصصة جذابة لمشروع أو تقرير. في مساحة تصور بيانات Python ، Bokeh هو المرشح الأول لبناء تصورات تفاعلية.
تعمل المكتبة أيضًا بشكل وثيق مع أدوات PyData ، وتسمح باستخدام كائنات Pandas و NumPy القياسية للتخطيط.
التصور المتسلسل الزمني لبايثون
بيانات السلاسل الزمنية هي سلسلة نقاط البيانات المدرجة بالترتيب الزمني. وهي عبارة عن سلسلة من النقاط المتتالية المتساوية في الوقت وتتكون من طرق للتحليل من أجل استخلاص رؤى ذات مغزى وخصائص مفيدة أخرى للبيانات. يعد نوع البيانات المتسلسلة الزمنية مهمًا في العديد من الصناعات مثل الأدوية وتجارة التجزئة والنقل والتمويل وحتى وسائل التواصل الاجتماعي وشركات التسويق عبر البريد الإلكتروني ، بالإضافة إلى العديد من الصناعات الأخرى.

فيما يلي أمثلة على بيانات السلاسل الزمنية:
- الطب: مراقبة معدل ضربات القلب ، تتبع الوزن ، تتبع ضغط الدم ، إلخ.
- البيع بالتجزئة: عدد العناصر المباعة في الساعة خلال فترة 24 ساعة أو 48 ساعة
- المواصلات: عدد المسافرين الذين يسافرون خلال فترة أسبوع أو شهر
- الاقتصاد: الناتج المحلي الإجمالي ، مؤشر أسعار المستهلك ، إلخ.
المخطط الخطي هو الطريقة الأكثر استخدامًا لتصور بيانات السلاسل الزمنية ، وعادةً ما يسمح عرض المخطط بالتفاعلات ، مثل التكبير للحصول على بيانات أكثر تفصيلاً تستند إلى الوقت ، أو التصغير للحصول على مزيد من العروض عالية المستوى للبيانات.
مثال على تصور بايثون
تتضمن أدوات تصور البيانات ولوحة المعلومات مجموعة متنوعة من أنواع المخططات. يمكن أن تساعد أدوات مثل Python ومكتبات رسومات Python المذكورة أعلاه في إنشاء تصورات مفيدة وغنية بالمعلومات عندما تحتاج إلى تجاوز أنواع المخططات المتوفرة. على سبيل المثال ، لا تتضمن معظم المنتجات تصورات متقدمة مثل مخططات سانكي أو خرائط الحرارة أو ستيمغرافس. يجعل Slingshot من السهل إضافة هذه التصورات المتقدمة في Python.
بشكل افتراضي ، يتضمن تصور Python في Slingshot هذه المكتبات في محرر البرنامج النصي الخاص بك:
#import matplotlib #import matplotlib.pyplot as plt #import numpy as np #import pandas as pdوبشكل افتراضي ، الحقول المتوفرة افتراضيًا في محرر النص البرمجي هي ما حددته من منتقي الحقول في محرر التصور:
#data['Territory'] #data['CampaignID'] #data['Sum of Spend']أنت تقوم بإنشاء التصور الخاص بك ، تمامًا مثل أي مخطط مدمج آخر. الاختلاف الوحيد ، هو أن هذا تم إنشاؤه ببعض كود Python:
campaignid = np.unique(np.array(data['CampaignID'])) territory = np.unique(np.array(data['Territory'])) spend = np.array(data['Sum of Spend']).reshape((7, 5)) fig, ax = plt.subplots(figsize=(5.5, 6.5)) im = ax.imshow(spend) # Show all ticks... ax.set_xticks(np.arange(len(territory))) ax.set_yticks(np.arange(len(campaignid))) # ... and label them with the respective list entries ax.set_xticklabels(territory) ax.set_yticklabels(campaignid) # Loop over data dimensions and create text annotations. for i in range(len(campaignid)): for j in range(len(territory)): text = ax.text(j, i, spend[i, j], ha="center", va="center", color="w") ax.set_title("Campaign Spend (dollars)") fig.tight_layout()مما أدى إلى تصور خارطة تمثيلي جميل يمكنك مشاركته بسهولة مع باقي أعضاء فريقك!

افكار اخيرة
مع استمرار الشركات في الاعتماد على البيانات لاتخاذ قرارات أفضل تستند إلى الحقائق ، ستزداد أهمية تصور البيانات بشكل أكبر. ونظرًا لأن تقنيات التصور مثل المخططات والرسوم البيانية أكثر كفاءة من حيث فهم البيانات مقارنة بجداول البيانات التقليدية وتقارير البيانات القديمة ، فإن استخدام أدوات مثل Python لإنشاء تصورات للبيانات يعد أمرًا ضروريًا لكل فريق متعدد الوظائف.
ومع ذلك ، حتى مع أهمية البيانات والرؤى ، فإن مجرد الحصول عليها لم يعد كافيًا بعد الآن. لفتح إمكانات سحب البيانات ، تحتاج إلى تحويل تلك البيانات إلى إجراءات تتناسب مع سير عمل العمليات اليومية. يمكنك الانتقال بسلاسة من الأفكار إلى العمل باستخدام Slingshot.
باستخدام Slingshot ، يمكنك تحليل البيانات ، وإنشاء تصورات جميلة للبيانات ، والتعاون مع الجميع داخل مؤسستك وإدارة جميع مشاريعك بسهولة ، وكل ذلك من نفس النظام الأساسي.
هل أنت مهتم بمعرفة المزيد؟ جرب Slingshot مجانًا وتعرّف على كيفية مساعدتك في الاستفادة من الرؤى القابلة للتنفيذ مع تسهيل استخدام فريقك للبيانات وتكوين ثقافة قائمة على البيانات وتحسين الإنتاجية.
