Yeni Başlayanlar için Python Veri Görselleştirme
Yayınlanan: 2021-06-07Veri görselleştirme, verilerin analiz edilmesinde ve verilerin daha net ve herkes tarafından anlaşılmasını kolaylaştırmada önemli bir rol oynar. Bilginin Python gibi veri görselleştirme araçlarıyla görsel temsili, aksi takdirde asla keşfedemeyeceğiniz eğilimleri, kalıpları ve korelasyonları belirlemenize yardımcı olur veya Amerikalı bilgisayar bilimcisi Ben Schneiderman'ın dediği gibi "Görselleştirmeler, sizi tanımadığınız sorulara yanıt verir. vardı''.
Bu blogda, Python'da veri görselleştirmenin ne olduğunu, Python'un görselleştirme kitaplıklarını kullanarak verileri Python'da nasıl görselleştireceğinizi tartışacağız ve veri görselleştirmenin gücünü ve Python'un size nasıl yardımcı olabileceğini daha iyi anlamanıza yardımcı olacak bazı Python görselleştirme örnekleri sunacağız. onu kullanarak.
Python'da Görselleştirme Nedir?
Python, üst düzey veri yapıları, dinamik tipik ve dinamik bağlama ve onu karmaşık uygulamaların geliştirilmesi için değerli ve faydalı kılan çeşitli diğer özellikleri içeren genel amaçlı bir programlama dilidir.
Son yirmi yılda veri görselleştirmenin artan önemi ile Python, bir programlama dilinden daha fazlası haline geldi. Veri bilimi için en çok kullanılan programlama dili haline geldi ve geliştiricilere verileri görselleştirmek ve ham verilerin tek başına sağlayamayacağı içgörüler elde etmek için sayısız seçenek sunuyor.
Basitçe, veri görselleştirmelerinizi oluşturmak için Python'u kullanmak, kullanıcılarınızın tablo biçimlerinde temsil edilen biçimlendirilmemiş büyük veri kümelerini analiz etmeye ve anlamaya çalışırken saniyeler hatta dakikalarla karşılaştırıldığında milisaniyeler içinde veri içgörüleri elde etmesine yardımcı olacaktır. Daha da iyisi, Python'da veri görselleştirme araçlarını kullanmak, görselleştirmenizi görüntüleyen kişinin verilerinin öyküsünü anında anlamasına yardımcı olan renk, eğilim çizgileri, işaretçiler, açıklamalar ve daha birçok görsel ipucu eklemenize olanak tanır.
Sapan deneyin
Python Görselleştirme Kitaplıkları
Python için iş çizelgeleri, bilimsel çizelgeler, finansal çizelgeler, coğrafi haritalama ve çok daha fazlasını sunan çok sayıda açık kaynak ve ticari görselleştirme kitaplığı vardır. Bir geliştirici olarak, bu kitaplıkları Python projelerinize kolayca aktarabilir ve sahip olduğunuz verilerin türüne göre birkaç satır kodla bir görselleştirme oluşturabilirsiniz.
Bunlar en popüler 5 Python veri görselleştirme kitaplığıdır:
- Matplotlib – Matplotlib, Python'un ilk veri görselleştirme kütüphanesidir ve diğer tüm Python veri görselleştirme kütüphanelerinin üzerine inşa edildiği temel kütüphanedir. En çok kullanılan ve 2B çizim kitaplığıdır. Matplotlib grafikler, çubuk grafikler, pasta grafikler, histogramlar, güç spektrumları, dağılım grafikleri, hata çizelgeleri ve diğer veri görselleştirme türleri oluşturabilir. Kütüphane, görselleştirmenin mutlak kontrolünü sağlar. Çok güçlüdür, ancak aynı zamanda çok karmaşıktır - her şeyi yaratabilirsiniz, ancak makul görünen grafikler elde etmek çok fazla çalışma ve çaba gerektirir.
- Seaborn – Matplotlib'e dayanan Seaborn'un görsel olarak en çekici Python veri görselleştirmelerini oluşturduğu bilinmektedir. Kütüphane, Matplotlib'e kıyasla daha az kod gerektiren çekici ve bilgilendirici istatistiksel grafikler çizmek için üst düzey bir arayüz sağlar.
- ggplot – Bu kitaplık, Python'un R programlama dilinde ggplot2 veri görselleştirmesinin uygulamasıdır. ggplot, Pandas kitaplığıyla sıkı bir şekilde entegre edilmiştir ve değişkenlerin estetikle nasıl eşleneceği ve hangi ilkellerin kullanılacağı anlatıldıktan sonra en iyi makine öğrenimi biçimlerinden birini gösterir. Basit grafik temsiller oluşturmak için kullanılabilir ve son derece özelleştirilmiş grafikler oluşturmak için kullanılamaz.
- Plotly – Plotly, gerekli çok az kod satırı ile hem veri görselleştirmelerinin hem de analitiklerin oluşturulmasına izin verir ve diğer tüm kütüphaneler için çok nadir görülen kontur grafiklerine sahiptir. Dağılım grafikleri, çizgi grafikler, çubuk grafikler, hata çubukları, alt grafikler, histogramlar, kutu grafikleri vb. gibi birçok görselleştirme oluşturabilir. Ayrıca, Plotly, çok sayıda veri noktasında aykırı değerlerin veya anormalliklerin algılanmasına izin veren vurgulu araç özelliklerine sahiptir.
- Pandalar – Bir görselleştirme kitaplığı olmasa da Pandas, Python görselleştirme kitaplıklarında kullanım için hızlı ve esnek veri işleme ve veri dönüştürme işlevleri sağlayan açık kaynaklı, yüksek performanslı bir kitaplıktır. Veri işleme için Pandas üst düzey API'sini kullanmak, uzun ve karmaşık Python koduyla elde ettiğiniz sonuçların aynısını elde etmek için verileri işlemek için daha az Python kodu yazmanız anlamına gelir.
Python Etkileşimli Görselleştirme
Python etkileşimli görselleştirme aracı arıyorsanız, Bokeh'i düşünmelisiniz.
Bokeh, grafiklerini HTML ve JavaScript kullanarak oluşturan etkileşimli bir görselleştirme kitaplığıdır. Ancak Bokeh, herhangi bir JavaScript kodu yazma zorunluluğu olsun ya da olmasın, D3.js'de etkileşimli görselleştirmeler oluşturmak için bir Python API'si sağlar. Büyük veya akışlı veri varlıkları için uygundur ve etkileşimli web tabanlı grafikler, uygulamalar ve panolar geliştirmek için kullanılabilir. Bokeh, verilerinizi keşfetmek ve anlamak ve bir proje veya rapor için çekici özel grafikler oluşturmak için çok güçlü bir araçtır. Python veri görselleştirme alanında Bokeh, etkileşimli görselleştirmeler oluşturmak için 1 numaralı adaydır.

Kitaplık ayrıca PyData araçlarıyla yakın çalışır ve çizim için standart Pandas ve NumPy nesnelerinin kullanılmasına izin verir.
Python Zaman Serisi Görselleştirme
Zaman serisi verileri, zaman sırasına göre listelenen veri noktaları serisidir. Zaman içinde birbirini izleyen eşit aralık noktalarının bir dizisidir ve anlamlı içgörüler ve verilerin diğer yararlı özelliklerini çıkarmak için analiz yöntemlerinden oluşur. Zaman serisi verileri, ilaç, perakende, ulaşım, finans ve hatta sosyal medya ve e-posta pazarlama şirketleri gibi birçok sektörde ve diğer birçok sektörde önemlidir.
Aşağıdakilerin tümü zaman serisi verilerinin örnekleridir:
- Tıp: kalp atış hızı izleme, kilo takibi, kan basıncı takibi vb.
- Perakende: 24 saatlik veya 48 saatlik bir süre içinde saat başına satılan ürün sayısı
- Ulaşım: Bir haftalık veya bir aylık dönemde seyahat eden yolcu sayısı
- Ekonomi: gayri safi yurtiçi hasıla, tüketici fiyat endeksi, vb.
Çizgi grafik, zaman serisi verilerini görselleştirmenin en yaygın kullanılan yoludur; genellikle grafik ekranı, daha ayrıntılı zamana dayalı veriler için yakınlaştırma veya daha yüksek düzeyli veri görünümleri için uzaklaştırma gibi etkileşimlere izin verir.
Bir Python Görselleştirme Örneği
Veri görselleştirme ve pano araçları, çok çeşitli grafik türlerini içerir. Python ve yukarıda bahsedilen Python grafik kitaplıkları gibi araçlar, sağlanan grafik türlerinin ötesine geçmeniz gerektiğinde kullanışlı ve bilgilendirici görselleştirmeler oluşturmanıza yardımcı olabilir. Örneğin, çoğu ürün Sankey Diyagramları, Isı Haritaları veya Steamgrafları gibi gelişmiş görselleştirmeler içermez. Slingshot, bu gelişmiş görselleştirmeleri Python'a eklemeyi kolaylaştırır.
Varsayılan olarak, Slingshot'taki bir Python görselleştirmesi, komut dosyası düzenleyicinizde şu kitaplıkları içerir:
#import matplotlib #import matplotlib.pyplot as plt #import numpy as np #import pandas as pdVe varsayılan olarak, Komut Dosyası Düzenleyicisi'nde varsayılan olarak kullanılabilen alanlar, görselleştirme düzenleyicisindeki alan seçiciden seçtiğiniz alanlardır:
#data['Territory'] #data['CampaignID'] #data['Sum of Spend']Diğer tüm yerleşik grafikler gibi görselleştirmenizi oluşturuyorsunuz. Tek fark, bunun bazı Python kodları ile oluşturulmuş olmasıdır:
campaignid = np.unique(np.array(data['CampaignID'])) territory = np.unique(np.array(data['Territory'])) spend = np.array(data['Sum of Spend']).reshape((7, 5)) fig, ax = plt.subplots(figsize=(5.5, 6.5)) im = ax.imshow(spend) # Show all ticks... ax.set_xticks(np.arange(len(territory))) ax.set_yticks(np.arange(len(campaignid))) # ... and label them with the respective list entries ax.set_xticklabels(territory) ax.set_yticklabels(campaignid) # Loop over data dimensions and create text annotations. for i in range(len(campaignid)): for j in range(len(territory)): text = ax.text(j, i, spend[i, j], ha="center", va="center", color="w") ax.set_title("Campaign Spend (dollars)") fig.tight_layout()Sonuç olarak, ekibinizin geri kalanıyla kolayca paylaşabileceğiniz güzel bir Isı Haritası görselleştirmesi!

Son düşünceler
İşletmeler daha iyi ve gerçeklere dayalı kararlar almak için verilere güvenmeye devam ettikçe, veri görselleştirmenin önemi daha da artacak. Ve grafikler ve grafikler gibi görselleştirme teknikleri, geleneksel elektronik tablolar ve güncel olmayan veri raporlarına kıyasla verileri anlama açısından daha verimli olduğundan, veri görselleştirmeleri oluşturmak için Python gibi araçları kullanmak, her işlevler arası ekip için bir zorunluluktur.
Ancak, verilerin ve içgörülerin önemine rağmen, sadece onlara sahip olmak artık yeterli değil. Verilerin çekme potansiyelini ortaya çıkarmak için, bu verileri günlük operasyon iş akışınıza uyan eylemlere dönüştürmeniz gerekir. Slingshot ile öngörüden eyleme sorunsuz bir şekilde geçiş yapabilirsiniz.
Slingshot ile verileri analiz edebilir, güzel veri görselleştirmeleri oluşturabilir, kuruluşunuzdaki herkesle işbirliği yapabilir ve tüm projelerinizi aynı platformdan kolaylıkla yönetebilirsiniz.
Daha fazlasını öğrenmek ister misiniz? Slingshot'ı ücretsiz deneyin ve ekibinizin verileri kullanmasını, veriye dayalı bir kültür geliştirmesini ve üretkenliği geliştirmesini kolaylaştırırken eyleme geçirilebilir içgörülerden yararlanmanıza nasıl yardımcı olabileceğini görün.
