Основные качества Data Scientist

Опубликовано: 2017-01-12
Оглавление показать
Статистическое мышление
Навыки программирования
Пытливый ум
Ориентация на результат
Креативность
Понимание баз данных
Отличные коммуникативные навыки
Жажда данных

Большие данные растут с самого начала информационных технологий. Теперь данные, которые мы создаем через день, эквивалентны всем данным, которые мы накопили до 2003 года. Этот гигантский объем данных содержит бесценную информацию не только для бизнеса, но и для всего человечества. Анализ больших данных уже довольно давно помогает отрасли здравоохранения в исследованиях. Более того, большие данные могут вскоре даже решить загадку рака .

Что, если я скажу вам, что большие данные — это просто куча данных, которые не имеют смысла, если вы не знаете, как их использовать? Именно здесь в игру вступают специалисты по данным. Чтобы разобраться в больших данных, нам нужны специалисты по данным, и, если быть точным, хорошие специалисты. И пусть вас не вводит в заблуждение название «ученый данных», есть немало качеств, которыми должен обладать специалист по данным, чтобы называться таковым. Если вы хотите нанять специалиста по данным или планируете им стать сами, вот качества, которые вам следует искать или которыми вы должны обладать.

специалист по данным

Статистическое мышление

Превращение данных в информацию — основная задача специалиста по данным. Следовательно, знание статистики является само собой разумеющимся качеством. Смотреть на вещи с количественным мышлением важно, чтобы оставаться нейтральным и избегать предубеждений при работе с данными. Хороший специалист по данным понимает, что глубина и достоверность выводов возрастают пропорционально количеству данных, и воздерживается от выводов на основе неадекватных данных. При огромном количестве данных тенденции и идеи выражаются в виде цифр. Следовательно, любовь к числам необходима для того, чтобы быть настоящим специалистом по данным. Специалист по обработке и анализу данных должен уметь анализировать большие объемы данных, чтобы получать ценную информацию, а затем применять методы прогнозного моделирования для прогнозирования будущих тенденций. Хорошее владение статистикой необходимо для подготовки отчетов и построения рекомендуемых действий на основе полученных данных.

Навыки программирования

Специалист по данным будет работать с разными командами для создания конвейеров, инструментов, модулей, пакетов, веб-сайтов, информационных панелей и многого другого. Это не означает, что специалист по данным должен быть опытным программистом, но понимание алгоритмов и того, как работают коды, может иметь большое значение в работе специалиста по данным. Когда система не может предоставить вам правильные тенденции или идеи, пришло время засучить рукава и написать код. Это было бы невозможно без некоторых навыков программирования и технической гибкости.

Python считается наиболее универсальным и совместимым языком программирования и идеально подходит для обработки баз данных и запросов типа MapReduce. Будучи простым в изучении языка и открытым исходным кодом, изучение Python не должно быть большим препятствием между вами и вашей мечтой о науке о данных.

Многие организации также учитывают наличие отличных «навыков работы с псевдокодом» при найме специалиста по данным. «Навыки работы с псевдокодом» — это способность написать простым языком, как должен работать запрос или алгоритм. Этот навык решения проблем необходим, чтобы стать специалистом по данным. Наука о данных — это отрасль, в которой золотые стандарты меняются с угрожающей скоростью, что подчеркивает важность наличия большего количества навыков, чем требуется в текущем сценарии.

Пытливый ум

Хотя наука о данных — довольно старая область, время от времени в ней делаются открытия. Причиной этого является стремление найти новые пути решения старой проблемы. Исследователь данных всегда должен быть любознательным, чтобы следить за новыми и лучшими способами сбора, объединения и обработки данных и находить инструменты для получения лучшего понимания. Идеальный специалист по данным никогда не должен переставать быть любопытным, поскольку данные содержат секреты, о которых они могут рассказать только любопытным. Настоящий специалист по данным не пытается увидеть, как данные подтверждают его предубеждения, а вместо этого ищет правду, скрытую глубоко внутри них.

С данными иногда все может стать довольно сложно, и только любопытство может привести вас к результатам. Вот почему любознательность — одно из важнейших качеств специалиста по данным.

Ориентация на результат

Аналитика данных — это больше о результатах, чем о самом процессе. Неважно, как вы приводите результаты с данными, пока есть ожидаемые результаты. Специалистам по обработке и анализу данных иногда приходится идти несколькими путями для решения определенных проблем. Застрять из-за небольших препятствий — нехорошее качество для специалиста по обработке и анализу данных. Ориентация на результат помогает в таких случаях, поскольку твердая решимость преобразовать данные в результаты становится для них движущей силой. Специалисты по данным, как правило, — это люди, которые переходят от одной проблемы к другой, одновременно манипулируя разными задачами. Ничто, кроме результата, не может остановить их от начинания.

Креативность

Креативность может показаться странной в этом списке. По правде говоря, это одно из самых важных качеств для специалиста по данным. Творческие люди не боятся ошибаться, они экспериментируют с новыми вещами и осмеливаются осваивать новые территории. Они находят возможности в своих неудачах и могут легко изменить направление. Все это необходимо для науки о данных.

Мы часто делим людей на левополушарных и правополушарных. Точные науки, такие как большие данные, редко ассоциируются с творчеством, и это большая ошибка. Специалисты по данным находятся где-то между этими двумя категориями и нуждаются в творческом подходе, чтобы найти новые подходы и способы обработки данных. Статистика и базы данных — это не то, чем занимается наука о данных, это рассказывание историй, которое делает конечный результат аналитики полезным для лиц, принимающих решения.

Само по себе творчество, конечно, не может стать специалистом по данным. Кто-то, кто может подготовить простые в использовании, привлекательные и привлекающие внимание отчеты, не всегда лучше всего подходит для роли специалиста по данным. Специалистов по данным можно назвать творческими решателями проблем.

Понимание баз данных

Независимо от того, работаете ли вы со структурированными данными, неструктурированными или с обоими вместе, хороший специалист по данным должен иметь фундаментальное представление о работе с базами данных. Кроме того, базовое понимание столбчатых и реляционных баз данных может существенно облегчить работу специалиста по данным. Многие корпоративные хранилища по-прежнему используют традиционные реляционные базы данных. Специалисты по данным также должны будут участвовать в настройке этих баз данных, хотя для выполнения этой задачи будет задействован технический персонал. Ноу-хау по разработке инфраструктуры базы данных, способной обрабатывать неструктурированные данные, — это как вишенка на торте.

Отличные коммуникативные навыки

Специалист по данным в основном будет работать одновременно с техническими специалистами, аналитиками и бизнесменами. Он (он) часто выступает в качестве переводчика для всех вовлеченных сторон. Чтобы одновременно обращаться с техническим и деловым жаргоном и знать, что использовать с теми, кто требует сильных навыков общения. Результат анализа обычно не очень хорош, по крайней мере, для тех, кто не занимается анализом данных. Идеи и тенденции застряли внутри цифр, и их следует интерпретировать и сообщать бизнес-команде и заинтересованным сторонам так, как они понимают. Великий специалист по данным должен уметь переводить сложные результаты анализа в более простую форму, понятную людям с разным опытом, используя рассказывание историй, метафоры и визуальные средства коммуникации.

Жажда данных

Великий специалист по данным всегда жаждет большего количества данных. В поисках данных нет поставленных целей, поскольку чем больше данных, тем лучше. Исследователь данных должен продолжать искать новые источники данных, лучшие способы их получения и инновационные методы их обработки. Стремление к получению большего количества данных — это то, чем должен обладать специалист по данным, поскольку данные — это топливо для аналитики.