Szarość web scrapingu – legalna czy nie?

Opublikowany: 2022-05-26
Spis treści pokaż
Czy scraping strony internetowej jest legalny?
Dane publiczne
Dane osobowe/dane prywatne
Dane dotyczące praw autorskich
Warunki usługi
Login do konta
Jak legalnie zeskrobać dane
Zawijanie

„Web scraping”, w dość dosłownych słowach, obejmuje skrobanie danych z sieci. W rękach wyszukiwarki web scraping to czynność, która generuje wyniki wyszukiwania, oceniając miliony witryn pod kątem informacji istotnych dla zapytań. Z drugiej strony, w rękach przedsiębiorców (korzystających ze skrobaków) legalność staje się wątpliwa.

Dlaczego jednak?

Ustawa o oszustwach i nadużyciach komputerowych (CAFA) zabrania nieuprawnionego korzystania z komputerów i zawartych w nich informacji – w tym zbieranie informacji z sieci. Jednak zakres tej działalności pozostaje na razie niejasny. Niedawno Sąd Najwyższy Stanów Zjednoczonych orzekł na korzyść Van Buren przeciwko Stanom Zjednoczonym, ogłaszając, że dostęp do dozwolonych danych, nawet w przypadku nieautoryzowanego/zakazanego użycia, nie może być uznany za naruszenie ustawy CAFA.

„Szarości” kwestii legalności skrobanych danych nie da się wyjaśnić bez wnikliwego przyjrzenia się ekosystemowi web scrapingu, z czym się on wiąże i co czyni go legalnym lub nielegalnym.

Czy scraping strony internetowej jest legalny?

Wiele czynników decyduje o tym, jak legalne jest zbieranie danych internetowych. Wszechobecny charakter web scrapingu może wchodzić w zakres przepisów dotyczących naruszenia prawa do Chattel, w których nieuprawnione wykorzystanie informacji danej osoby może stać się problemem prawnym.

Ponadto w celu ochrony prywatności konsumentów i kradzieży informacji zmobilizowano dziś wiele innych ustaw, ustaw i rozporządzeń. Być może słyszałeś o ogólnej ustawie o ochronie danych (GDPA), ustawie o ochronie prywatności dzieci w Internecie (COPPA) i ustawie o przenośności i odpowiedzialności w ubezpieczeniach zdrowotnych (HIPAA) - wszystkie te środki ochrony zostały wprowadzone, aby zapobiec niekontrolowanym nadużyciom prywatnych danych konsumentów.

Jednak w związku z orzeczeniem w sprawie Van Buren przeciwko Stanom Zjednoczonym wydaje się, że web scraping w pewnych okolicznościach może być w porządku.

W dziewiątym orzeczeniu Sądu Apelacyjnego w sprawie LinkedIn przeciwko hiQ Labs ogłoszono, że zbieranie informacji z profili publicznych jest w porządku, ponieważ działalność ta nie była objęta zakresem działania CAFA (ponieważ zebrane dane były dostępne publicznie) . Spowodowało to jednak, że LinkedIn ograniczył publiczny dostęp do profili użytkowników – teraz wymagane jest logowanie przez przeglądającego.

Wymóg zalogowania się do swojego konta użytkownika w serwisie w celu przeglądania informacji w nim zawartych powoduje, że wszystkie Twoje działania są z tego tytułu zgodne z regulaminem serwisu. Niniejsze warunki mogą zawierać klauzule, które powstrzymują lub zabraniają skrobania stron internetowych – jeśli nadal będziesz angażować się w wydobywanie danych, możesz popaść w bałagan prawny.

Skoro o tym mowa, to właśnie dlatego LinkedIn nakazał logowanie w celu przeglądania profili użytkowników – aby ograniczyć informacje o web scrapingu swoich użytkowników.

Mając to na uwadze, szara strefa nadal pozostaje szeroka. Czyli… czy web scraping jest nielegalny ? W dużej mierze zależy to od rodzaju danych, które próbujesz zeskrobać, i charakteru tych danych:

Dane publiczne

Dane, które napotykasz w Internecie, to w większości dane publiczne. O ile nie jesteś zobowiązany do zalogowania się na swoje konto lub wyrażenia zgody na warunki korzystania z danych lub uwierzytelnienia swojej tożsamości lub danych uwierzytelniających w celu uzyskania dostępu do niektórych danych, skrobanie jest całkowicie legalne.

Jedynym środkiem odstraszającym od przechwytywania sieci byłyby środki, które te witryny stosują w celu odwrócenia twoich skrobaków internetowych (oczywiście w celu ochrony ich informacji).

Dane osobowe/dane prywatne

Pozyskiwanie danych osobowych osoby jest nielegalne. Dane osobowe mogą być dowolne – imię i nazwisko, adres, dane finansowe, dane dotyczące zdrowia, data urodzenia, wszelkie inne informacje kontaktowe itp. Wszystko, co zdradza tożsamość osobistą osoby (informacje umożliwiające identyfikację osoby, lub PII) jest sygnałem ostrzegawczym dla web scrapingu . To surowe nie.

Jeśli jednak musisz, musisz najpierw uzyskać zgodę tej osoby. Dodatkowo, jeśli motywacja prawna jest przyczyną zlikwidowania PII, należy o tym poinformować.

Dane dotyczące praw autorskich

Wszelkie dane w Internecie, które są własnością intelektualną wydawcy, są nielegalne do zeskrobania. Jeśli musisz wykorzystać te dane, niezależnie od praw autorskich, musisz podać źródło tych informacji, gdziekolwiek z nich korzystasz.

Warunki usługi

Jest to warunkowy przypadek nielegalności web scrapingu. Jeśli witryna wyraźnie ogranicza pobieranie danych, uważaj, że jest to nielegalne. Zanim przystąpisz do pracy z robotami zgarniającymi, najlepiej dokładnie sprawdzić warunki użytkowania i obsługi.

Login do konta

Podobnie jak LinkedIn nakazał logowanie się na konto, aby uzyskać dostęp do swoich profili użytkowników, instancja logowania prawie zawsze otrzymuje Twoją zgodę na warunki witryny. Niniejsze warunki mogą zawierać klauzule dotyczące scrapingu danych. Kiedy nadal zwalniasz swoje skrobaki po zalogowaniu, ryzykujesz zakaz, a nawet postępowanie prawne.

Jak legalnie zeskrobać dane

Aby upewnić się, że nie zostaną podjęte żadne działania prawne przeciwko Tobie, dokładnie zapoznaj się z następującymi aspektami przed przystąpieniem do skrobania sieci:

  • Czy dane są publicznie dostępne?
  • Czy ujawnia PII jakiejkolwiek osoby?
  • Czy na stronie są wzmianki o zakazach dotyczących skrobania?
  • Czy istnieją jakieś prawa, ustawy, zasady lub przepisy, które kontrolują, jakie informacje można zeskrobać i wykorzystać?

Uważne rozważenie odpowiedzi na wszystkie te pytania pomogłoby określić stopień szarości, w jakim znajduje się Twoja aktywność w zakresie skrobania sieci.

Zawijanie

W kwintesencji „Czy to legalne zdrapywanie strony internetowej ” nie jest pytaniem. Prawdziwe pytanie brzmi: „ Jak legalne jest zbieranie stron internetowych? “.

Najlepiej upewnić się, że web scraping pobiera tylko te dane, które są publicznie dostępne i nie są chronione żadnymi prawnie uzasadnionymi klauzulami. Możesz także zlecić skrobanie stron internetowych profesjonalnym agencjom, takim jak PromptCloud, które wiedzą, co robią.