Web scraping w erze RODO – wpływ i możliwości
Opublikowany: 2018-09-05Jak zawsze, najpierw pierwsze rzeczy. Jeśli przejdziesz do google GDPR, są szanse, że ta definicja Wikipedii pojawi się na górze
Ogólne rozporządzenie o ochronie danych
„Ogólne rozporządzenie o ochronie danych (UE) 2016/679 („RODO”) to rozporządzenie w prawie UE dotyczące ochrony danych i prywatności wszystkich osób w Unii Europejskiej (UE) i Europejskim Obszarze Gospodarczym (EOG). Dotyczy również eksportu danych osobowych poza obszar UE i EOG. RODO ma przede wszystkim na celu zapewnienie osobom fizycznym kontroli nad ich danymi osobowymi oraz uproszczenie otoczenia regulacyjnego dla międzynarodowego biznesu poprzez ujednolicenie regulacji w UE”.
Niezbyt jasne, prawda? Zasadniczo oznacza to, że gdy zbierasz, przetwarzasz, sprzedajesz lub kupujesz dane osobowe klientów, którzy mieszkają w UE, a także w krajach EOG: Islandii, Liechtensteinie i Norwegii, musisz upewnić się, że masz wyraźną zgodę użytkowników na przechowywanie lub przekazywanie informacji. Nie można powiedzieć, że „Klient wpisał te dane w formularzu lub polu danych na mojej stronie internetowej, więc je przechowuję”. Nie, musisz uzyskać wyraźną zgodę, a klient powinien mieć również opcję rezygnacji, jeśli dana osoba zdecyduje, że nie chce, aby jej dane były później publicznie dostępne.
Te ramy regulacyjne niosą ze sobą zarówno możliwości, jak i ograniczenia. Firmy, które wykorzystują web-scraping jako narzędzie, mogą rozwijać swoją działalność, pomagając innym zachować zgodność z RODO, a jednocześnie muszą mieć pewność, że nie zbierają prywatnych informacji o obywatelach UE (i żadnej innej osobie w tym zakresie ) bez ich zgody. Omówimy obie strony medalu.
Jak RODO zadaje cios firmom zbierającym dane osobowe?
RODO ściśle zajmuje się danymi osobowymi, aby upewnić się, że ludzie nie mogą ich nieuczciwie wykorzystywać. Ostatnie skandale z udziałem Cambridge Analytica i Facebooka faktycznie sprawiły, że ludzie potrzebują takich ram. Dane to potęga, aw niewłaściwych rękach mogą nawet wpłynąć na wyniki wyborów najpotężniejszych narodów świata. Jeśli więc pracujesz z danymi związanymi z opisami produktów, szczegółami technicznymi itd., nie musisz się martwić o RODO. Większość dostawców usług internetowych, takich jak PromptCloud, w rzeczywistości nie indeksuje danych osobowych. Niektóre firmy indeksują wiadomości e-mail, których używają do kampanii marketingowych i generowania leadów.
Ale niestety w przypadku skrobaków poczty e-mail (lub na szczęście dla klientów), nawet adresy e-mail i numery telefonów komórkowych podlegają ochronie danych osobowych w ramach RODO i przed skrobaniem potrzebujesz zgody. Większość firm rozwiązuje ten problem, tworząc proste narzędzia (kalkulator podatkowy, kalkulator majątku i inne), które z kolei działają jako silniki do zbierania danych dla firm. Jednak zasady te dotyczą nie tylko przyszłych działań związanych z web scrapingiem, ale także danych, które aktualnie przechowujesz w swojej bazie danych. Musisz upewnić się, że dla wszystkich danych osobowych, które masz w swojej bazie danych; masz zgodę właścicieli.
Podsumowując, istnieją trzy główne czynniki, z którymi firmy muszą się zmierzyć, jeśli chodzi o RODO:
- Uzyskaj zgodę: zgodnie z prawem, niezależnie od tego, czy chcesz przechowywać imię i nazwisko, adres e-mail, czy nawet adresy IP klientów, musisz poprosić ich o zgodę.
- Zgłoś naruszenie danych: Dane przechowywane przez firmy są podatne na ataki hakerów. Czasami, gdy dochodzi do naruszeń danych, nie są one zgłaszane z obawy przed reakcją opinii publicznej i cyrkiem medialnym. To nie może być kontynuowane w ramach RODO. Firmy mają tylko 3 dni (72 godziny) na poinformowanie użytkowników w przypadku naruszenia bezpieczeństwa danych.
- Nie można zebrać żadnych dodatkowych danych: za każdym razem, gdy zbierasz dane, każdy element, który przemierzasz, raportowanie i musisz mieć uzasadniony powód, aby go zeskrobać. Nie możesz po prostu podać „przyszłych potrzeb” jako powodu skrobania pewnych pól danych, których obecnie nie potrzebujesz, a mimo to zbierasz. Może to doprowadzić do wysokiej grzywny.
Ale widzisz, możliwości, które pojawiły się dzięki RODO, znacznie przewyższają ograniczenia.

Jak RODO może zwiększyć bazę klientów firm zajmujących się web scrapingiem?
Firmy zajmujące się bezpieczeństwem i zapewnieniem zgodności to te, które odnoszą największe korzyści z RODO. Nie tylko ich baza klientów wzrosła z dnia na dzień. Wytyczne RODO wymagają od firm zapewnienia ciągłego monitorowania naruszeń danych. To sprawiło, że duże firmy nawiązały współpracę, aby zachować zgodność z RODO. Branża usługowa bardzo na tym skorzystała, ponieważ większość firm została przyłapana na nieświadomości i braku gotowości, gdy wytyczne faktycznie weszły w życie.
Większość dużych firm technologicznych ma do czynienia z milionami klientów i tysiącami dostawców i nie ma obecnie systemu do mapowania wszystkich ich danych i znajdowania, które z nich są danymi osobowymi i muszą być dobrze chronione. W tym miejscu wkraczają firmy zajmujące się zbieraniem stron internetowych. Audyty obecnych praktyk i zarządzanie danymi osobowymi klientów, a także odwiedzających online odbywały się ręcznie dla dużych firm, ponieważ powstały lata temu. Nie byli świadomi, że takie ramy zgodności mogą pewnego dnia wejść w życie. Przy petabajtach danych gromadzonych przez niektóre firmowe strony internetowe proces audytu staje się coraz trudniejszy.
Jednym z przykładów tego, jak web scraping może być pomocny w procesie audytu, jest rozwiązanie do monitorowania stron internetowych. Na przykład ukierunkowana lista witryn internetowych może zostać dostarczona dostawcy usług skrobania, a firma może zbudować roboty indeksujące do wykrywania różnych mechanizmów śledzenia danych na stronie internetowej, takich jak:
- Google Analytics/menedżer tagów
- Piksel Facebooka lub Quora do reklam
- Rozwiązania do rejestrowania zachowań użytkowników
- Aplikacje do czatu innych firm
Można to stale monitorować, aby można było podjąć niezbędne działania w celu zapewnienia zgodności. Zapewnia to również, że za każdym razem, gdy nastąpi zmiana w technikach gromadzenia danych. Aktualizacja regulaminu serwisu i planu zbierania zgód.
Nie, że jest to szczególnie problem dla dużych organizacji, takich jak duże uniwersytety, agencje rządowe i prawnicze, międzynarodowe korporacje działające na kontynentach, które zbudowały duże, wysoce rozproszone witryny z licznymi współpracownikami. Korzystając z konfiguracji monitorowania stron zbudowanych przez PromptCloud, można łatwo zidentyfikować wszystkie punkty dostępu i podjąć niezbędne kroki.
Wykorzystanie danych dla średnich firm
Dla małych i średnich firm obsługa danych osobowych użytkowników nie będzie jednak szczególnie trudna. W przypadku dużych starych witryn internetowych zwykle ma wielu dostawców danych. Śledzenie danych osobowych wyświetlanych na ich stronie internetowej może okazać się trudne.
Jest też szansa na drugim końcu spektrum. Firmy, które chcą wiedzieć, czy ujawniono jakiekolwiek dane osobowe ich współpracowników. Możesz po prostu przesłać listę wszystkich jego współpracowników. A szczegóły dotyczące marki do doświadczonego dostawcy usług web scrapingu. Z łatwością mogliby dowiedzieć się, czy ich informacje zostały otwarcie ujawnione przez jakąkolwiek stronę internetową. A z kolei podejmuj kroki prawne.
Z usług tych korzystają nie tylko firmy w UE. Ale także giganci technologiczni w innych krajach, takich jak USA i Indie. Są to kraje, które obsługują klientów na całym świecie (w tym UE). Muszą upewnić się, że są zgodne z RODO i nie są karane.
RODO jest w powijakach. I jest czas, aby firmy i marki zaczęły się zmieniać na dobre, zanim skończy się czas. Chociaż wady mogą się obecnie wyróżniać. W rzeczywistości może pomóc firmom zapobiegać procesom sądowym i pozasądowym ugodom, które miały miejsce wcześniej. Trzymanie się wytycznych RODO. Z czasem można wykorzystać większość ram. Możesz przygotować te firmy na przyszłość. Kiedy większość krajów będzie miała surowe zasady regulujące dane i zapobiegające ich niewłaściwemu wykorzystaniu.
