hiQ против LinkedIn ⁠ — Собирать общедоступные веб-данные действительно законно

Опубликовано: 2019-10-15
Оглавление показать
HiQ против LinkedIn
Проблема с CFAA
Вывод

Лестница в небеса, если вы занимаетесь парсингом веб-страниц, то есть.

Скрапинг общедоступных данных является законным. Существует огромное количество данных, доступных в открытом доступе в Интернете. Однако, когда дело доходит до их использования, на сегодняшний день сделано немного. Но сегодня сервисные компании предоставляют данные как услугу или создают решения, основанные на данных. Допустим, вы хотите узнать цены на 20 000 товаров на 5 разных веб-сайтах, некоторые сервисы могут вам в этом помочь. Будь то найм новобранцев или принятие решения о том, по какой цене было бы правильно выставить свой дом, веб-скрейпинг помогает во всем. Однако, несмотря на то, что в веб-скрапинге обычно участвуют компании, извлекающие данные из открытого Интернета, многие компании выступают против этого. Почему? Они требуют данные от пользователей как свои собственные. И судя по всему, только они имеют на это право. Недавнее стремление к бесплатному и открытому доступу к общедоступным данным было замечено в деле hiQ против LinkedIn.

Сбор данных оказался непростой задачей для hiQ Labs — компании, занимающейся анализом данных, которая собирала общедоступные данные из LinkedIn. Последний решил сослаться на Закон о компьютерном мошенничестве и злоупотреблениях (CFAA) и обвинил hiQ в доступе к информации «без разрешения». Однако знаменательным шагом стал апелляционный суд девятого округа США, вынесший решение в пользу hiQ Labs, тем самым проложив путь к «открытому Интернету».

HiQ против LinkedIn

CFAA — это федеральный закон о кибербезопасности, который был создан для предотвращения взлома государственных систем безопасности «без разрешения». Но расплывчатость термина «авторизация» означала, что компании могли изменять его в соответствии со своими потребностями, когда это необходимо, как в случае hiQ и LinkedIn. То, что делал hiQ, было простым: оно использовало собранные данные для создания аналитических продуктов, связанных с HR. Например, Keeper выявлял непостоянных сотрудников, а Skill Mapper оценивал сотрудников и находил пробелы в рабочей силе. Но затем LinkedIn запустил аналогичный набор продуктов в 2017 году, и именно тогда сценарий начал ухудшаться.

  • 23 мая 2017 года компания направила hiQ письмо с требованием прекратить удаление данных. Две недели спустя hiQ подала иск о судебном запрете против LinkedIn.
  • Суду было ясно, что hiQ не выживет как компания, если бы не данные LinkedIn. Кроме того, данные в LinkedIn были общедоступны, поскольку пользователи не хранили информационный пароль в зашифрованном виде. «Существует мало доказательств того, что пользователи LinkedIn, которые решили сделать свои профили общедоступными, действительно сохраняют ожидание конфиденциальности», — заявил суд.
  • В политике конфиденциальности LinkedIn указано, что «любая информация, которую вы размещаете в своем профиле, и любой контент, который вы публикуете в LinkedIn, могут быть видны другим». Шансы были в пользу hiQ.
  • HiQ заявила о неправомерном вмешательстве в контракт — LinkedIn просто пыталась продать свою продукцию, бросая своего конкурента под автобус. Хотя LinkedIn признал агрессивную конкуренцию законной, суд этого не сделал.
  • LinkedIn попытался разыграть карту CFAA. Согласно закону, «кто… умышленно получает доступ к компьютеру без разрешения или превышает разрешенный доступ и тем самым получает… информацию с любого защищенного компьютера… подлежит наказанию» в виде штрафа или тюремного заключения. Кроме того, «любое лицо, которому причинен ущерб или убытки в результате нарушения» этого положения, может подать гражданский иск «против нарушителя с целью получения возмещения ущерба и судебного запрета или другого средства правовой защиты по праву справедливости».
  • Однако данные не были защищены идентификатором пользователя и паролем, и, следовательно, аргумент LinkedIn стал спорным. Суд постановил, что CFAA не применяется к делу. Данные были общедоступны; незаконного «взлома и проникновения» не было.

Проблема с CFAA

Хотя это крупная победа для аналитики данных, это также проливает свет на дело Девятого округа, которому удалось затуманить охват CFAA — дело Facebook против Power Ventures, решение, которое также цитировалось в прекращении и воздержании. письмо LinkedIn.

Power Ventures была компанией, которая позволяла человеку управлять всеми своими учетными записями в социальных сетях из одного места. В отличие от LinkedIn, где данные были общедоступны, Power Ventures запрашивала согласие у пользователя. Таким образом, именно пользователь предоставил Power Ventures доступ к данным, а не Facebook. Таким образом, несмотря на то, что компания в каком-то смысле находилась «в пределах полномочий», все же было установлено, что она нарушила CFAA.

В этом и заключается проблема с CFAA. Хотя теоретически он должен предотвращать взлом, он стал не более чем инструментом для крупных корпораций. Каждое крупное предприятие трактует закон по-своему и использует его в своих интересах. Power Ventures была просто дополнительной функцией, которую пользователь выбрал сам; hiQ создала аналитические продукты, на которые обратила внимание LinkedIn, и, поскольку более крупные компании хотели, чтобы эти третьи стороны были в их силах, они обратились за помощью к могущественному CFAA.

В то время как суд нашел блокировку при вызове CFAA в любое время, он все еще не закрыл дверь полностью. В недавнем деле Stackla против Facebook была обнаружена еще одна платформа, которая попала в полемику из-за веб-скрапинга.

Время от времени появляются новые дела, и в конечном итоге суду придется разъяснить CFAA и такие термины, как «без разрешения». Данные присутствуют повсюду, и создание различия между законным и незаконным становится первостепенной задачей. Монополия данных была бы опасна для инноваций, а в мире быстро меняющегося Интернета инновации — это все.

Вывод

Одержав победу, hiQ открыла путь для применения открытых веб-данных. Веб-сканирование и извлечение — самый дешевый способ сбора данных, и слишком долго к нему относились скептически. Нужно понимать, что единственный способ, которым малые и большие компании могут конкурировать на равных условиях, — это если Интернет и представленные в нем данные останутся бесплатными для всех.

Может ли Google утверждать, что данные, которые он показывает в результатах поиска, принадлежат ему? Может ли Википедия помешать нам учиться на ее страницах? В конце концов, большая часть информации, доступной в открытом доступе в Интернете, принадлежит отдельным лицам или рынку, и ни одна компания не может претендовать на монополию на нее. Вместо этого компании могут конкурировать в том, насколько хорошо они могут использовать данные и какие услуги они могут создавать. Эти службы могут обрабатывать открытые данные и создавать ценные результаты, которые могут быть использованы предприятиями.