hiQ kontra LinkedIn — usuwanie publicznie dostępnych danych internetowych jest rzeczywiście legalne
Opublikowany: 2019-10-15Schody do nieba, to znaczy, jeśli zajmujesz się skrobaniem sieci.
Zbieranie publicznie dostępnych danych jest legalne. W publicznej domenie sieci dostępna jest ogromna ilość danych. Jednak jeśli chodzi o wykorzystanie tego samego, do tej pory niewiele zrobiono. Ale dziś firmy usługowe dostarczają dane jako usługę lub budują rozwiązania oparte na danych. Załóżmy, że chcesz poznać ceny 20000 artykułów na 5 różnych stronach internetowych, niektóre usługi mogą Ci w tym pomóc. Czy to zatrudnianie rekrutów, czy decydowanie, jaka cena byłaby odpowiednia, aby wystawić swój dom na sprzedaż, web scraping pomaga we wszystkim. Jednak mimo że web-scraping zazwyczaj wiąże się ze skrobaniem danych przez firmy z otwartego Internetu, wiele firm jest temu przeciwnych. Czemu? Żądają danych od użytkowników jako własnych. I najwyraźniej tylko oni mają do tego prawo. Dużą wolę bezpłatnego i otwartego dostępu do danych publicznych widać ostatnio w sprawie hiQ vs LinkedIn.
Pozyskiwanie danych okazało się zniechęcające dla hiQ Labs – firmy zajmującej się analizą danych, która zbierała publicznie dostępne dane z LinkedIn. Ten ostatni zdecydował się powołać ustawę o oszustwach i nadużyciach komputerowych (CAFA) i oskarżył HiQ o dostęp do informacji „bez autoryzacji”. Jednak w przełomowym posunięciu amerykański dziewiąty sąd apelacyjny orzekł na korzyść hiQ Labs, torując w ten sposób drogę dla „otwartego internetu”.
hiQ kontra LinkedIn
CFAA to federalna ustawa o bezpieczeństwie cybernetycznym, która została stworzona, aby zapobiec włamywaniu się do rządowych systemów bezpieczeństwa „bez upoważnienia”. Jednak niejasność terminu „autoryzacja” oznaczała, że firmy mogły w razie potrzeby dostosować je do własnych potrzeb, jak w przypadku hiQ vs. LinkedIn. To, co zrobił hiQ, było proste, wykorzystało zebrane dane do stworzenia produktów analitycznych związanych z HR. Na przykład Keeper identyfikował niestabilnych pracowników, podczas gdy Skill Mapper oceniał pracowników i znajdował luki w sile roboczej. Ale potem LinkedIn wprowadził podobny zestaw produktów w 2017 roku i wtedy scenariusz zaczął iść na południe.
- 23 maja 2017 r. wysłał do hiQ pismo o zaprzestaniu działalności, żądając, aby hiQ przestało z niego usuwać dane. Dwa tygodnie później hiQ złożyło pozew o wydanie nakazu sądowego przeciwko LinkedIn.
- Dla sądu było jasne, że hiQ nie przetrwałoby jako firma, gdyby nie dane z LinkedIn. Ponadto dane na LinkedIn były publicznie dostępne, ponieważ użytkownicy nie zaszyfrowali hasła informacyjnego. „Istnieje niewiele dowodów na to, że użytkownicy LinkedIn, którzy decydują się na upublicznienie swoich profili, faktycznie oczekują prywatności” – powiedział sąd.
- Polityka prywatności LinkedIn stanowi, że „wszelkie informacje, które umieszczasz w swoim profilu i wszelkie treści, które publikujesz na LinkedIn, mogą być widoczne dla innych”. Szanse były na korzyść hiQ.
- hiQ twierdził, że ingeruje w kontrakt – LinkedIn po prostu próbował sprzedawać swoje produkty, jednocześnie rzucając swojego konkurenta pod autobus. Podczas gdy LinkedIn uznał agresywną konkurencję za legalną, sąd nie.
- LinkedIn próbował zagrać w kartę CFAA. Zgodnie z prawem „kto… umyślnie uzyskuje dostęp do komputera bez upoważnienia lub przekracza upoważniony dostęp, a tym samym uzyskuje… informacje z dowolnego chronionego komputera… podlega karze” grzywny lub pozbawienia wolności. Ponadto „każda osoba, która poniosła szkodę lub stratę z powodu naruszenia” tego przepisu, może wnieść pozew cywilny „przeciwko sprawcy naruszenia w celu uzyskania odszkodowania i zabezpieczenia nakazu sądowego lub innego słusznego zadośćuczynienia”.
- Jednak dane nie były chronione identyfikatorem użytkownika i hasłem, a zatem argument LinkedIn stał się dyskusyjny. Sąd orzekł, że CAFA nie ma zastosowania w sprawie. Dane były publiczne; nie doszło do bezprawnego „włamania i wejścia”.
Problem z CAFA
Chociaż jest to wielkie zwycięstwo dla analityków danych, rzuca również światło na sprawę dziewiątego obwodu, który zdołał zamazać zasięg CAFA – Facebook przeciwko Power Ventures, orzeczenie, które zostało również przytoczone w orzeczeniu o zaprzestaniu działalności list LinkedIn.

Power Ventures to firma, która pozwalała na zarządzanie wszystkimi kontami w mediach społecznościowych z jednego miejsca. W przeciwieństwie do LinkedIn, gdzie dane były publicznie dostępne, Power Ventures prosiło użytkownika o zgodę. Dlatego to użytkownik przyznał Power Ventures dostęp do danych, a nie Facebook. W związku z tym, chociaż firma była w pewnym sensie „w ramach autoryzacji”, nadal stwierdzono, że narusza CAFA.
W tym tkwi problem z CAFA. Chociaż teoretycznie powinien zapobiegać włamaniom, stał się tylko narzędziem dla dużych korporacji. Każde duże przedsiębiorstwo interpretuje prawo na swój sposób i wykorzystuje je na swoją korzyść. Power Ventures był tylko dodatkiem, który użytkownik wybrał dla siebie; hiQ stworzył produkty analityczne, na które LinkedIn zwrócił uwagę, a ponieważ większe firmy chciały, aby te strony trzecie straciły swoją mocną pozycję, wezwały potężną CAFA.
Chociaż sąd zlokalizował blokadę przy powoływaniu się na CFAA za każdym razem, gdy uznano to za stosowne, nadal nie zamknął całkowicie drzwi. Nowsza Stackla przeciwko Facebookowi znalazła kolejną platformę, która wywołała kontrowersje za pośrednictwem web scrapingu.
Ponieważ od czasu do czasu pojawiają się nowe sprawy, w końcu sąd będzie musiał wyjaśnić CAFA i terminy takie jak „bez upoważnienia”. Dane są obecne wszędzie i tworzenie rozróżnienia między legalnym a nielegalnym staje się sprawą najwyższej wagi. Monopol na dane byłby niebezpieczny dla innowacji, aw świecie szybkiego Internetu innowacyjność jest wszystkim.
Wniosek
Dzięki wygranej w torbie hiQ utorowało drogę do stosowania otwartych danych internetowych. Przeszukiwanie i wyodrębnianie stron internetowych to najtańszy sposób gromadzenia danych i zbyt długo postrzegano je jako podejście sceptyczne. Trzeba zrozumieć, że jedynym sposobem, w jaki małe i duże firmy mogą konkurować na równych zasadach, jest to, by Internet i dane w nim zawarte były dostępne dla wszystkich.
Czy Google może twierdzić, że dane, które pokazuje w wynikach wyszukiwania, są jego własnymi? Czy Wikipedia może powstrzymać nas od uczenia się na jej stronach? W końcu większość informacji dostępnych w publicznej domenie internetu należy do osób fizycznych lub rynku i żadna firma nie może twierdzić, że ma na nie monopol. Zamiast tego firmy mogą konkurować z tym, jak dobrze mogą wykorzystywać dane i jakie usługi mogą tworzyć. Usługi te mogą przetrawiać otwarte dane i generować wartościowe dane wyjściowe, które mogą być wykorzystane przez firmy.
