Парсинг в эпоху GDPR — влияние и возможности
Опубликовано: 2018-09-05Как всегда, обо всем по порядку. Если вы погуглите GDPR, скорее всего, это определение из Википедии окажется первым.
Общее положение о защите данных
«Общее положение о защите данных (ЕС) 2016/679 («GDPR») — это положение в законодательстве ЕС о защите данных и конфиденциальности для всех лиц в Европейском союзе (ЕС) и Европейской экономической зоне (ЕЭЗ). Он также касается экспорта персональных данных за пределы ЕС и ЕЭЗ. GDPR направлен в первую очередь на то, чтобы дать людям контроль над своими личными данными и упростить нормативную среду для международного бизнеса путем унификации регулирования в рамках ЕС».
Не слишком ясно, не так ли? Ну, это в основном означает, что когда вы собираете, обрабатываете, продаете или покупаете личные данные клиентов, которые живут в ЕС, а также странах ЕЭЗ Исландии, Лихтенштейне и Норвегии, вы должны убедиться, что у вас есть явное согласие пользователей на хранение или передачу информации. Вы не можете сказать, что «Клиент ввел эти данные в форму или поле данных на моем веб-сайте, и поэтому я их храню». Нет, вам нужно получить явное разрешение, и у клиента также должна быть возможность отказаться, если человек решит, что он или она не хочет, чтобы его данные были общедоступны позже.
Эта нормативно-правовая база привносит как возможности, так и ограничения. Компании, использующие веб-скрапинг в качестве инструмента, могут повысить свой бизнес, помогая другим соответствовать требованиям GDPR, и в то же время им также необходимо убедиться, что они не собирают личную информацию граждан ЕС (и любых других лиц, если на то пошло). ) без их согласия. Мы обсудим обе стороны медали.
Как GDPR наносит удар по компаниям, собирающим личную информацию?
GDPR строго относится к персональным данным, чтобы люди не могли недобросовестно использовать данные. Последние скандалы, связанные с Cambridge Analytica и Facebook, фактически привели к необходимости такой структуры перед людьми. Данные — это сила, и в чужих руках они могут даже повлиять на результаты выборов в самых могущественных странах мира. Поэтому, если вы работаете с данными, относящимися к описаниям продуктов, техническим деталям и т. д., вам не нужно беспокоиться о GDPR. Большинство поставщиков услуг парсинга, таких как PromptCloud, на самом деле не сканируют личную информацию. Некоторые компании сканируют электронные письма, которые они используют для маркетинговых кампаний и лидогенерации.
Но, к сожалению, для парсеров электронной почты (или, к счастью для клиентов), даже номера электронной почты и мобильных телефонов подпадают под личную информацию в соответствии с GDPR, и вам необходимо согласие, прежде чем очищать ее. Большинство компаний решают эту проблему, создавая простые инструменты (налоговый калькулятор, калькулятор благосостояния и т. д.), которые, в свою очередь, действуют как механизмы сбора данных для компаний. Однако правила применяются не только к будущим действиям по очистке веб-страниц, но и к данным, которые в настоящее время хранятся в вашей базе данных. Вы должны убедиться, что для всех личных данных, которые у вас есть в вашей базе данных; у вас есть согласие от владельцев.
Подводя итог, можно сказать, что есть три основных фактора, с которыми компаниям приходится иметь дело, когда речь идет о GDPR:
- Получите согласие: в соответствии с законом, если вы хотите сохранить имя, адрес электронной почты или даже IP-адреса клиентов, вы должны запросить их согласие.
- Сообщить об утечке данных: данные, хранящиеся в компаниях, уязвимы для взлома. Иногда, когда происходят утечки данных, о них не сообщают, опасаясь негативной реакции общественности и цирка в СМИ. Это не может продолжаться в соответствии с GDPR. У компаний есть только 3 дня (72 часа), чтобы проинформировать пользователей в случае утечки данных.
- Никакие дополнительные данные не могут быть собраны: всякий раз, когда вы очищаете данные, каждая отдельная часть, которую вы сканируете, составляет отчетность, и у вас должна быть веская причина для ее очистки. Вы не можете просто указать «будущие потребности» в качестве причины для очистки определенных полей данных, которые вам в настоящее время не нужны, но, тем не менее, собираются. Это может привести к большому штрафу.
Но видите ли, возможности, возникшие благодаря GDPR, намного перевешивают ограничения.

Как GDPR может увеличить клиентскую базу компаний, занимающихся парсингом веб-страниц?
Компании, занимающиеся безопасностью и соблюдением нормативных требований, получают наибольшую выгоду от GDPR. Мало того, что их клиентская база увеличилась в разы за одну ночь. Руководящие принципы GDPR требуют, чтобы компании постоянно отслеживали утечку данных. Это заставило крупные компании вступить в партнерские отношения, чтобы соответствовать требованиям GDPR. Индустрия услуг извлекла из этого огромную выгоду, потому что большинство компаний не знали и не были готовы к тому, что рекомендации действительно вступили в силу.
Большинство крупных технологических компаний имеют дело с миллионами клиентов и тысячами поставщиков и в настоящее время не имеют системы для сопоставления всех своих данных и определения того, какие из них являются личной информацией и должны быть хорошо защищены. Вот тут-то и появляются компании, занимающиеся веб-скрейпингом. Аудит текущей практики и управление личными данными клиентов, а также онлайн-посетителей выполнялись вручную для крупных компаний, потому что когда они были созданы много лет назад. Они не знали, что такая структура соответствия может вступить в силу однажды. С петабайтами данных, собираемых веб-сайтами некоторых компаний, процесс аудита становится все более и более сложным.
Одним из примеров того, как веб-скрапинг может быть полезен в процессе аудита, является решение для мониторинга веб-страниц. Например, поставщику услуг парсинга может быть предоставлен целевой список веб-сайтов, и компания может создавать сканеры для обнаружения различных механизмов отслеживания данных на веб-сайте, таких как следующие:
- Google Analytics/Диспетчер тегов
- Пиксель Facebook или Quora для рекламы
- Решения для записи поведения пользователей
- Сторонние приложения для чата
Это можно постоянно отслеживать, чтобы можно было предпринять необходимые действия для соблюдения. Кроме того, это гарантирует, что всякий раз, когда происходит изменение методов сбора данных. Обновлены условия использования веб-сайта и план сбора согласия.
Нет, это особенно проблема для крупных организаций, таких как крупные университеты, правительственные и юридические агентства, многонациональные корпорации, работающие на разных континентах, которые создали большие сильно распределенные сайты с многочисленными участниками. Используя настройки мониторинга страниц, созданные PromptCloud, можно легко определить все точки доступа и предпринять необходимые шаги.
Использование данных для среднего бизнеса
Однако для малого и среднего бизнеса обработка личных данных пользователей не будет особенно сложной. Для больших старых веб-сайтов обычно есть несколько поставщиков данных. Отслеживание личной информации, отображаемой на их веб-сайте, может оказаться трудным.
Существует также возможность на другом конце спектра. Компании, которые хотят знать, была ли раскрыта какая-либо личная информация об их партнерах. Вы можете просто представить список всех его партнеров. И сведения о его бренде опытному поставщику услуг парсинга веб-страниц. Они легко смогут узнать, была ли их информация открыта на каком-либо веб-сайте. И, в свою очередь, подать в суд.
Этими услугами пользуются не только компании в ЕС. Но также и технологические гиганты в других странах, таких как США и Индия. Это страны, которые имеют дело с клиентами по всему миру (включая ЕС). Им необходимо убедиться, что они соответствуют GDPR, чтобы не быть оштрафованными.
GDPR находится в зачаточном состоянии. И у компаний и брендов есть время, чтобы начать меняться к лучшему до того, как время истечет. В то время как недостатки могут торчать в настоящее время. На самом деле это может помочь компаниям предотвратить судебные иски и внесудебные урегулирования, которые имели место раньше. Соблюдение рекомендаций GDPR. Сделать большую часть фреймворка можно, со временем. Вы можете подготовить эти компании к будущему. Когда в большинстве стран будут действовать строгие правила регулирования данных и предотвращения их неправомерного использования.
