Визуализация данных Python для начинающих
Опубликовано: 2021-06-07Визуализация данных играет важную роль в анализе данных и делает данные более четкими и понятными для всех. Визуальное представление информации с помощью инструментов визуализации данных, таких как Python, помогает выявлять тенденции, закономерности и корреляции, которые иначе вы могли бы никогда не обнаружить. было''.
В этом блоге мы обсудим, что такое визуализация данных в Python, как визуализировать данные в Python с помощью библиотек визуализации Python, а также представим вам несколько примеров визуализации Python, которые помогут вам лучше понять возможности визуализации данных и то, как Python может помочь вам в этом. используя это.
Что такое визуализация в Python?
Python — это язык программирования общего назначения, который включает высокоуровневые структуры данных, динамическую типизацию и динамическую привязку, а также множество других функций, которые делают его ценным и полезным для разработки сложных приложений.
С ростом важности визуализации данных за последние два десятилетия Python стал больше, чем просто языком программирования. Он превратился в наиболее используемый язык программирования для науки о данных, предоставляя разработчикам множество вариантов визуализации данных и получения информации, которую им не могут предоставить одни только необработанные данные.
Проще говоря, использование Python для создания визуализаций данных поможет вашим пользователям получить представление о данных за миллисекунды по сравнению с секундами или даже минутами, пытающимися проанализировать и понять большие наборы данных неформатированных данных, представленных в табличных форматах. Более того, использование инструментов визуализации данных в Python позволяет добавлять цвета, линии тренда, маркеры, аннотации и многие другие визуальные подсказки, которые помогают зрителю вашей визуализации мгновенно понять историю своих данных.
Попробуйте Рогатку
Библиотеки визуализации Python
Существует множество открытых и коммерческих библиотек визуализации для Python, которые предлагают бизнес-диаграммы, научные диаграммы, финансовые диаграммы, геопространственные карты и многое другое. Как разработчик, вы можете легко импортировать эти библиотеки в свои проекты Python, и, в зависимости от типа имеющихся у вас данных, с помощью нескольких строк кода вы можете визуализировать визуализацию.
Это 5 самых популярных библиотек визуализации данных Python:
- Matplotlib — Matplotlib является первой библиотекой визуализации данных Python и базовой библиотекой, на основе которой были построены все остальные библиотеки визуализации данных Python. Это наиболее часто используемая библиотека для 2D-графики. Matplotlib может генерировать графики, гистограммы, круговые диаграммы, гистограммы, спектры мощности, диаграммы рассеяния, диаграммы ошибок и другие типы визуализации данных. Библиотека позволяет полностью контролировать визуализацию. Он очень мощный, но и очень сложный — вы можете создать что угодно, но для получения разумно выглядящих графиков требуется много труда и усилий.
- Seaborn — основанный на Matplotlib, Seaborn, как известно, создает наиболее визуально привлекательные визуализации данных Python. Библиотека предоставляет высокоуровневый интерфейс для рисования привлекательной и информативной статистической графики с меньшим объемом кода по сравнению с Matplotlib.
- ggplot — эта библиотека представляет собой реализацию Python визуализации данных ggplot2 на языке программирования R. ggplot тесно интегрирован с библиотекой Pandas и демонстрирует одну из лучших форм машинного обучения после того, как ему рассказывают, как сопоставлять переменные с эстетикой и какие примитивы использовать. Его можно использовать для создания простых графических представлений, но его нельзя использовать для создания графики с широкими возможностями настройки.
- Plotly — Plotly позволяет создавать как визуализацию данных, так и аналитику с очень небольшим количеством строк кода и имеет контурные графики, что очень необычно для всех других библиотек. Он может генерировать множество визуализаций, таких как точечные диаграммы, линейные диаграммы, гистограммы, планки погрешностей, подграфики, гистограммы, ящичные диаграммы и т. д. Кроме того, Plotly имеет возможности инструмента наведения, которые позволяют обнаруживать выбросы или аномалии в большом количестве точек данных.
- Pandas — хотя это и не библиотека визуализации, Pandas — это высокопроизводительная библиотека с открытым исходным кодом, которая предоставляет быстрые и гибкие функции обработки и преобразования данных для использования в библиотеках визуализации Python. Использование высокоуровневого API Pandas для обработки данных означает, что вы пишете меньше кода Python для манипулирования данными, чтобы достичь тех же результатов, что и с длинным и сложным кодом Python.
Интерактивная визуализация Python
Если вы ищете интерактивный инструмент визуализации Python, вам следует рассмотреть Bokeh.
Bokeh — это интерактивная библиотека визуализации, которая визуализирует свою графику с использованием HTML и JavaScript. Однако Bokeh предоставляет Python API для создания интерактивных визуализаций в D3.js с необходимостью написания кода JavaScript или без него. Он подходит для больших или потоковых ресурсов данных и может использоваться для разработки интерактивных веб-графиков, приложений и информационных панелей. Bokeh — очень мощный инструмент для изучения и понимания ваших данных, а также для создания привлекательных пользовательских диаграмм для проекта или отчета. В пространстве визуализации данных Python Bokeh является кандидатом №1 для создания интерактивных визуализаций.

Библиотека также тесно сотрудничает с инструментами PyData и позволяет использовать стандартные объекты Pandas и NumPy для построения графиков.
Визуализация временных рядов Python
Данные временного ряда — это ряд точек данных, перечисленных во временном порядке. Это последовательность последовательных моментов времени с равными интервалами, состоящая из методов анализа для извлечения осмысленной информации и других полезных характеристик данных. Тип данных временных рядов важен во многих отраслях, таких как фармацевтика, розничная торговля, транспорт, финансы и даже в социальных сетях и компаниях, занимающихся маркетингом по электронной почте, а также во многих других.
Ниже приведены все примеры данных временных рядов:
- Медицина: мониторинг сердечного ритма, отслеживание веса, отслеживание артериального давления и т. д.
- Розничная торговля: количество товаров, проданных в час в течение 24 или 48 часов.
- Транспорт: количество путешественников, которые путешествуют в течение одной недели или одного месяца.
- Экономика: валовой внутренний продукт, индекс потребительских цен и др.
Линейная диаграмма является наиболее часто используемым способом визуализации данных временных рядов. Обычно отображение диаграммы допускает взаимодействие, например увеличение масштаба для получения более подробных данных, основанных на времени, или уменьшение масштаба для просмотра данных на более высоком уровне.
Пример визуализации Python
Инструменты визуализации данных и инструментальные панели включают в себя широкий спектр типов диаграмм. Такие инструменты, как Python и вышеупомянутые графические библиотеки Python, могут помочь в создании полезных и информативных визуализаций, когда вам нужно выйти за рамки предоставленных типов диаграмм. Например, в большинстве продуктов нет расширенных визуализаций, таких как диаграммы Санки, тепловые карты или графики Steam. Slingshot упрощает добавление этих расширенных визуализаций в Python.
По умолчанию визуализация Python в Slingshot включает следующие библиотеки в вашем редакторе скриптов:
#import matplotlib #import matplotlib.pyplot as plt #import numpy as np #import pandas as pdИ по умолчанию поля, доступные по умолчанию в редакторе сценариев, — это те, которые вы выбрали в окне выбора полей в редакторе визуализации:
#data['Territory'] #data['CampaignID'] #data['Sum of Spend']Вы создаете свою визуализацию, как и любую другую встроенную диаграмму. Единственное отличие состоит в том, что этот создан с помощью некоторого кода Python:
campaignid = np.unique(np.array(data['CampaignID'])) territory = np.unique(np.array(data['Territory'])) spend = np.array(data['Sum of Spend']).reshape((7, 5)) fig, ax = plt.subplots(figsize=(5.5, 6.5)) im = ax.imshow(spend) # Show all ticks... ax.set_xticks(np.arange(len(territory))) ax.set_yticks(np.arange(len(campaignid))) # ... and label them with the respective list entries ax.set_xticklabels(territory) ax.set_yticklabels(campaignid) # Loop over data dimensions and create text annotations. for i in range(len(campaignid)): for j in range(len(territory)): text = ax.text(j, i, spend[i, j], ha="center", va="center", color="w") ax.set_title("Campaign Spend (dollars)") fig.tight_layout()В результате вы получите красивую визуализацию тепловой карты, которой вы можете легко поделиться с остальной частью вашей команды!

Последние мысли
Поскольку предприятия продолжают полагаться на данные для принятия более эффективных и основанных на фактах решений, важность визуализации данных будет расти еще больше. А поскольку методы визуализации, такие как диаграммы и графики, более эффективны с точки зрения понимания данных по сравнению с традиционными электронными таблицами и устаревшими отчетами о данных, использование таких инструментов, как Python, для создания визуализации данных является необходимостью для каждой межфункциональной команды.
Однако, даже учитывая важность данных и идей, просто иметь их уже недостаточно. Чтобы раскрыть потенциал извлечения данных, вам нужно превратить эти данные в действия, которые вписываются в ваш повседневный рабочий процесс. С помощью Slingshot вы можете плавно перейти от идей к действиям.
С помощью Slingshot вы можете анализировать данные, создавать красивые визуализации данных, сотрудничать со всеми в вашей организации и с легкостью управлять всеми своими проектами с одной платформы.
Хотите узнать больше? Попробуйте Slingshot бесплатно и узнайте, как он может помочь вам использовать полезную информацию, облегчая вашей команде использование данных, развитие культуры, основанной на данных, и повышение производительности.
