Ваша организация страдает от нехватки данных?
Опубликовано: 2021-04-23В мире финансов инвестиционные менеджеры всегда ищут новые источники информации, которые обеспечат ранее неиспользованный источник для создания Альфы. Эти самые источники данных называются Альтернативными данными или усталостью данных. Данные, ну, информация. Альтернативные, потому что они выходят за рамки типичных наборов данных компании. Рискуя преувеличить клише, это то, что запускает «несправедливое преимущество», к которому мы все стремимся.
Рынок альтернативных данных все еще находится в зачаточном состоянии. Компания, тратящая их, увеличивается в несколько раз из года в год. Некоторыми из наиболее популярных источников альтернативных данных были транзакции по кредитным картам, данные, собранные в Интернете , данные о геолокации с мобильных телефонов и т. д. Интуитивно можно сказать, что эти источники попали бы в поле зрения за нарушение серьезных проблем с конфиденциальностью. Следовательно, потребность в менее навязчивых альтернативных точках данных.
Несмотря на то, что рынок альтернативных данных в настоящее время процветает, несмотря на проблемы с безопасностью, и, по прогнозам, в 2020 году он будет стоить колоссальные 350 миллионов долларов, что почти вдвое больше, чем 183 миллиона долларов в 2016 году, мы стали свидетелями того, как компании страдают от усталости от альтернативных данных в 2019 году. Вы спросите, усталость от альтернативных данных? Да, это так же само собой разумеющееся. На ум приходит старая поговорка: «Старое вино в новой бутылке». Одни и те же наборы данных переупаковываются и продаются одним и тем же группам менеджеров хедж-фондов, которые теряют драгоценное время на подготовку данных, а не на их анализ. К тому времени рынок насыщается новыми компаниями: все они будут предлагать одно и то же обещание конкурентных идей.
Безопасная пользовательская информация
Есть несколько основных шагов по гигиене, которые вы можете предпринять , чтобы избежать усталости от альтернативных данных. Первый шаг — убедиться, что вы защищаете специализированную и специфичную для бизнеса информацию, которая будет способствовать развитию вашего бизнеса. Это большое отличие, если вы хотите избавиться от усталости. Благодаря последствиям постоянно растущего интереса к альтернативным данным, существует множество исследовательских фирм, которые предлагают лучшее понимание альтернативных данных и / или продают наборы альтернативных данных инвесторам, управляющим капиталом, турагентам и всем, кто хочет воспользоваться этим. пони. Представьте себе, что одни и те же наборы данных, одни и те же идеи, извлеченные из одного и того же набора данных, одни и те же точки действия лежат в основе выводов, полученных из одного и того же набора данных фирмой А и фирмой Б. С одной лишь небольшой разницей. Они оба совершенно не подозревают, что используют одну и ту же информацию друг против друга.
Альтернативными потоками данных могут быть все, что не считается «традиционным» в конкретной компании. Линии действительно становятся размытыми. То, что тогда считалось нетрадиционным, сегодня является одним из важнейших факторов, определяющих маркетинговые решения. Необходимо следить за тем, чтобы то, что для вас считается «альтернативой», не стало отраслевым стандартом в следующем году. Это будет означать, что все будут иметь равный доступ к данным, на сбор которых вы потратили много сил.

Альтернативная летаргия данных
Это задача очистки и поддержания «основных» данных как есть. Тратить время и энергию на сбор, обслуживание и обработку больших объемов альтернативных данных абсолютно не касается основного круга интересов. Так в чем же главный виновник? Да, вы угадали. Летаргия.
Альтернативные наборы данных обычно содержат информацию, полученную из множества источников и веб-сайтов. Процесс очистки данных может отвлечь вас от анализа находок и извлечения информации. Не говоря уже о расширении возможностей для человеческих ошибок и двуличия. Скрапинг — первый большой шаг. Затем стандартизирует его. Он должен быть в «стандартном» формате, чтобы иметь какой-то смысл. Только так машина может обучиться и автоматизировать процесс.
Теперь, когда у нас есть формат, следующим шагом будет определение истинного назначения собранных данных. Вы знаете, как сильно различаются американский английский и британский английский? Мы не единственные, кого это раздражает. Например, есть два разных способа записи одной даты. 27 мая 2021 года можно записать как 27.05.2021 или 27.05.2021, и нам не нужно говорить вам, какое влияние это различие окажет на собранные данные. Следовательно, вы должны очищать, стандартизировать, делать выводы и принимать стратегические бизнес-решения. С минимальными человеческими усилиями.
Избавьтесь от усталости данных
Мы никогда не упоминаем о проблемах, для которых у нас нет решений. Есть куча вещей, с которых вы могли бы начать:
- Автоматизация: это не проблема. Мы только что объяснили последствия, казалось бы, безобидных человеческих ошибок. Чаще всего очищенные данные остаются в виде отдельных файлов, которые затем интегрируются вручную. Подобно автоматизированной стандартизации данных, автоматизация процесса интеграции резко снижает усталость, возникающую при работе, ориентированной на труд, и позволяет команде направить все свои усилия на анализ данных. Интеграцию данных можно сделать без участия человека, подготовив данные с помощью API-интерфейсов для поддержки бесшовной интеграции с внутренними бизнес-системами и создания надежных наборов данных для целей аналитики.
- Аутсорсинг: всегда имеет смысл автоматизировать рутинные задачи. Особенно там, где вам требуется уровень технических знаний. Просто не забудьте включить положение о неконкуренции. В противном случае вы найдете те же данные в руках ваших соперников. И будет ли это обломом.
- Индивидуально: если вы решите отдать всю помощь с альтернативными данными на аутсорсинг, сотрудничайте с компанией, у которой есть возможности для создания пользовательских наборов данных для вашего бренда. Универсальный подход здесь не подойдет. Они должны иметь правильные возможности интеграции веб-данных. Интеграция данных рассматривает весь жизненный цикл данных, извлеченных из Интернета, как единый связный процесс с акцентом на качество данных и контроль.
Существует огромное количество других способов абсолютно избежать усталости данных путем извлечения пользовательских данных . Это красиво. Анализ настроений в разделе комментариев в социальных сетях, данных кредитных карт, чтобы определить поведение потребителей (хотя это и не одобряется). Использование спутниковых изображений и/или изображений видеонаблюдения для подсчета автомобилей на парковках. Вам просто нужно сообщить своему поставщику услуг парсера, чтобы он собирал именно те данные, которые вам нужны. Это все. Убить усталость. Вы созданы для лучших вещей.
