hiQ vs. LinkedIn — Es ist in der Tat legal, öffentlich zugängliche Webdaten zu kratzen
Veröffentlicht: 2019-10-15Stairway to heaven, wenn Sie im Web-Scraping-Geschäft tätig sind.
Es ist legal, öffentlich zugängliche Daten zu scrapen. Es gibt eine riesige Menge an Daten, die im öffentlichen Bereich des Internets verfügbar sind. Was die Nutzung betrifft, hat sich bisher jedoch wenig getan. Aber heute bieten Dienstleistungsunternehmen Daten als Service an oder entwickeln Lösungen, die auf Daten basieren. Angenommen, Sie möchten die Preise von 20.000 Artikeln auf 5 verschiedenen Websites wissen. Einige Dienste können Ihnen dabei helfen. Sei es bei der Einstellung von Rekruten oder der Entscheidung, zu welchem Preis Sie Ihr Haus auflisten möchten, Web Scraping hilft bei allem. Obwohl beim Web-Scraping in der Regel Unternehmen Daten aus dem offenen Internet kratzen, lehnen viele Unternehmen dies ab. Wieso den? Sie beanspruchen die Daten der Nutzer als ihre eigenen. Und anscheinend sind sie die einzigen, die ein Recht darauf haben. Ein großer Wille zum freien und offenen Zugang zu öffentlichen Daten wurde kürzlich im Fall hiQ vs LinkedIn gesehen.
Das Scraping von Daten erwies sich für hiQ Labs als entmutigend – ein Datenanalyseunternehmen, das öffentlich zugängliche Daten von LinkedIn gescrapt hatte. Letztere berief sich auf den Computer Fraud and Abuse Act (CFAA) und beschuldigte hiQ, „ohne Autorisierung“ auf die Informationen zugegriffen zu haben. In einem wegweisenden Schritt entschied jedoch das US Ninth Circuit of Appeals zugunsten von hiQ Labs und ebnete damit den Weg für das „offene Internet“.
hiQ vs. LinkedIn
Die CFAA ist ein Bundesgesetz zur Cybersicherheit, das geschaffen wurde, um das Hacken staatlicher Sicherheitssysteme „ohne Genehmigung“ zu verhindern. Aber die Unbestimmtheit des Begriffs „Autorisierung“ bedeutete, dass Unternehmen ihn bei Bedarf an ihre eigenen Bedürfnisse anpassen konnten, wie im Fall hiQ vs. LinkedIn. Was hiQ tat, war einfach: Es würde abgekratzte Daten verwenden, um HR-bezogene Analyseprodukte zu erstellen. Beispielsweise identifizierte Keeper flüchtige Mitarbeiter, während Skill Mapper Mitarbeiter bewertete und Lücken in der Belegschaft fand. Aber dann brachte LinkedIn im Jahr 2017 eine ähnliche Reihe von Produkten auf den Markt, und das war der Zeitpunkt, an dem das Szenario nach Süden ging.
- Am 23. Mai 2017 schickte es eine Unterlassungserklärung an hiQ, in der es forderte, dass hiQ aufhört, Daten von ihm abzukratzen. Zwei Wochen später reichte hiQ Unterlassungsklage gegen LinkedIn ein.
- Dem Gericht war klar, dass hiQ als Unternehmen ohne die Daten von LinkedIn nicht überleben würde. Darüber hinaus waren die Daten auf LinkedIn öffentlich zugänglich, da die Benutzer das Informationspasswort nicht verschlüsselt aufbewahrt hatten. „Es gibt kaum Beweise dafür, dass LinkedIn-Nutzer, die sich dafür entscheiden, ihre Profile öffentlich zu machen, tatsächlich eine Erwartung an den Datenschutz haben“, sagte das Gericht.
- In der Datenschutzrichtlinie von LinkedIn heißt es: „Alle Informationen, die Sie in Ihr Profil einfügen, und alle Inhalte, die Sie auf LinkedIn posten, können von anderen gesehen werden.“ Die Chancen standen zugunsten von hiQ.
- hiQ klagte auf unerlaubte Vertragseinmischung – LinkedIn versuchte einfach, seine Produkte zu vermarkten, während es seinen Konkurrenten unter den Bus warf. Während LinkedIn den aggressiven Wettbewerb für legal hielt, tat das Gericht dies nicht.
- LinkedIn hat versucht, die CFAA-Karte auszuspielen. Nach dem Gesetz wird „wer … vorsätzlich unbefugt auf einen Computer zugreift oder den autorisierten Zugriff überschreitet und dadurch … Informationen von einem geschützten Computer … erlangt“, mit Geld- oder Freiheitsstrafe bestraft. Darüber hinaus kann „jede Person, die aufgrund einer Verletzung“ dieser Bestimmung einen Schaden oder Verlust erleidet, eine Zivilklage „gegen den Übertreter erheben, um Schadensersatz und Unterlassungsansprüche oder andere angemessene Rechtsbehelfe zu erhalten“.
- Die Daten waren jedoch nicht durch eine Benutzer-ID und ein Passwort geschützt, und daher wurde das Argument von LinkedIn hinfällig. Das Gericht entschied, dass die CFAA auf den Fall keine Anwendung fand. Die Daten waren öffentlich; kein rechtswidriges „Einbrechen und Betreten“ stattgefunden hat.
Das Problem mit CFAA
Während es ein großer Gewinn für die Datenanalyse ist, wirft es auch Licht auf einen Fall des Ninth Circuit, der es geschafft hat, die Reichweite der CFAA zu verwischen – das Urteil Facebook gegen Power Ventures, ein Urteil, das auch in der Unterlassung zitiert wurde Schreiben von LinkedIn.

Power Ventures war ein Unternehmen, das es einer Person ermöglichte, alle ihre Social-Media-Konten von einem Ort aus zu verwalten. Im Gegensatz zu LinkedIn, wo die Daten öffentlich zugänglich waren, würde Power Ventures die Zustimmung des Benutzers einholen. Daher war es der Benutzer, der Power Ventures Zugriff auf die Daten gewährte, und nicht Facebook. Obwohl das Unternehmen in gewisser Weise „innerhalb der Genehmigung“ war, wurde dennoch festgestellt, dass es gegen die CFAA verstößt.
Da liegt das Problem mit der CFAA. Während es theoretisch Hacking verhindern sollte, ist es zu nichts anderem als einem Werkzeug für große Unternehmen geworden. Jedes große Unternehmen legt das Gesetz auf seine Weise aus und nutzt es zu seinem Vorteil. Power Ventures war nur eine Zusatzfunktion, die der Benutzer für sich selbst ausgewählt hat; hiQ hat analytische Produkte entwickelt, auf die LinkedIn ein Auge geworfen hat, und da die größeren Unternehmen diese Drittanbieter aus ihrer Stärke herausholen wollten, wandten sie sich an die mächtige CFAA.
Während das Gericht die Sperre für die Berufung auf die CFAA, wann immer es angebracht erscheint, lokalisiert hat, hat es die Tür immer noch nicht vollständig geschlossen. Der neuere Stackla v. Facebook fand eine weitere Plattform, die über Web Scraping in Kontroversen geriet.
Da hin und wieder neue Fälle auftauchen, wird es schließlich Aufgabe des Gerichts sein, die CFAA und Begriffe wie „ohne Genehmigung“ zu klären. Daten sind überall präsent, und die Unterscheidung zwischen legal und illegal wird von größter Bedeutung. Das Datenmonopol wäre für Innovationen gefährlich, und in der Welt des schnelllebigen Internets ist Innovation alles.
Fazit
Mit dem Sieg in der Tasche hat hiQ den Weg für die Anwendung offener Webdaten geebnet. Web-Crawling und -Extrahieren ist die billigste Art, Daten zu sammeln, und wurde viel zu lange als skeptischer Ansatz angesehen. Man muss verstehen, dass kleine und große Unternehmen nur dann unter gleichen Wettbewerbsbedingungen konkurrieren können, wenn das Internet und die darin enthaltenen Daten für alle frei nutzbar bleiben.
Kann Google behaupten, dass die Daten, die es für ein Suchergebnis anzeigt, seine eigenen sind? Kann Wikipedia uns davon abhalten, von seinen Seiten zu lernen? Schließlich gehören die meisten öffentlich verfügbaren Informationen im Internet Einzelpersonen oder dem Markt, und kein Unternehmen kann behaupten, ein Monopol darauf zu haben. Womit Unternehmen stattdessen konkurrieren können, ist, wie gut sie die Daten nutzen und welche Dienste sie erstellen können. Diese Dienste können die offenen Daten verarbeiten und einen wertvollen Output erzeugen, der von Unternehmen genutzt werden kann.
