hiQ vs LinkedIn ⁠— Il est en effet légal de supprimer des données Web accessibles au public

Publié: 2019-10-15
Table des matières afficher
hiQ vs LinkedIn
Le problème avec CFAA
Conclusion

Escalier vers le paradis, si vous êtes dans le domaine du grattage Web, bien sûr.

Il est légal de gratter des données accessibles au public. Il existe une quantité massive de données disponibles dans le domaine public du Web. Cependant, en ce qui concerne leur utilisation, peu de choses ont été faites à ce jour. Mais aujourd'hui, les sociétés de services fournissent des données en tant que service ou créent des solutions qui s'appuient sur des données. Supposons que vous souhaitiez connaître les prix de 20 000 articles sur 5 sites Web différents, certains services peuvent vous aider. Qu'il s'agisse d'embaucher des recrues ou de décider du prix qui conviendrait le mieux pour inscrire votre maison, le grattage Web aide à tout. Cependant, même si le web-scraping implique généralement que les entreprises récupèrent des données sur l'Internet ouvert, de nombreuses entreprises s'y opposent. Pourquoi? Ils revendiquent les données des utilisateurs comme étant les leurs. Et apparemment, ils sont les seuls à y avoir droit. Une grande volonté d'accès gratuit et ouvert aux données publiques a été constatée récemment dans l'affaire hiQ vs LinkedIn.

Le grattage des données s'est avéré intimidant pour hiQ Labs, une société d'analyse de données qui grattait les données accessibles au public de LinkedIn. Ce dernier a choisi d'invoquer le Computer Fraud And Abuse Act (CFAA) et a accusé hiQ d'avoir accédé aux informations « sans autorisation ». Cependant, dans un geste historique, la Cour d'appel du neuvième circuit des États-Unis s'est prononcée en faveur de hiQ Labs, ouvrant ainsi la voie à «l'internet ouvert».

hiQ vs LinkedIn

La CFAA est une loi fédérale sur la cybersécurité qui a été créée pour empêcher le piratage des systèmes de sécurité gouvernementaux « sans autorisation ». Mais l'imprécision du terme "autorisation" signifiait que les entreprises pouvaient l'adapter à leurs propres besoins chaque fois que nécessaire, comme dans l'affaire hiQ contre LinkedIn. Ce que hiQ a fait était simple, il utiliserait des données extraites pour créer des produits d'analyse liés aux RH. Par exemple, Keeper a identifié les employés volages, tandis que Skill Mapper évaluerait les employés et trouverait des lacunes dans la main-d'œuvre. Mais ensuite, LinkedIn a lancé un ensemble de produits similaires en 2017, et c'est à ce moment-là que le scénario a commencé à se détériorer.

  • Le 23 mai 2017, il a envoyé une lettre de cesser et de s'abstenir à hiQ exigeant que hiQ cesse d'en retirer des données. Deux semaines plus tard, hiQ a intenté une action en injonction contre LinkedIn.
  • Il était clair pour le tribunal que hiQ ne survivrait pas en tant qu'entreprise sans les données de LinkedIn. De plus, les données sur LinkedIn étaient accessibles au public, car les utilisateurs n'avaient pas gardé le mot de passe d'information crypté. "Il y a peu de preuves que les utilisateurs de LinkedIn qui choisissent de rendre leurs profils publics maintiennent en fait une attente de confidentialité", a déclaré le tribunal.
  • La politique de confidentialité de LinkedIn stipulait que "toute information que vous mettez sur votre profil et tout contenu que vous publiez sur LinkedIn peuvent être vus par d'autres". Les chances étaient en faveur de hiQ.
  • hiQ a réclamé une ingérence délictuelle dans le contrat - LinkedIn essayait simplement de commercialiser ses produits tout en jetant son concurrent sous le bus. Alors que LinkedIn a jugé la concurrence agressive légale, le tribunal ne l'a pas fait.
  • LinkedIn a tenté de jouer la carte du CFAA. Selon la loi, « quiconque… accède intentionnellement à un ordinateur sans autorisation ou dépasse l'accès autorisé, et obtient ainsi… des informations à partir de tout ordinateur protégé… sera puni », d'une amende ou d'une peine d'emprisonnement. En outre, "toute personne qui subit un dommage ou une perte en raison d'une violation" de cette disposition peut intenter une action civile "contre le contrevenant pour obtenir des dommages-intérêts compensatoires et une injonction ou une autre réparation équitable".
  • Cependant, les données n'étaient pas protégées par un identifiant d'utilisateur et un mot de passe et, par conséquent, l'argument de LinkedIn est devenu sans objet. Le tribunal a jugé que la CFAA ne s'appliquait pas à l'affaire. Les données étaient publiques; aucune « introduction par effraction » illégale n'a eu lieu.

Le problème avec CFAA

Bien qu'il s'agisse d'une victoire majeure pour l'analyse de données, cela met également en lumière une affaire du neuvième circuit qui a réussi à brouiller la portée du CFAA - le Facebook contre Power Ventures, une décision qui a également été citée dans le cesser et s'abstenir lettre de LinkedIn.

Power Ventures était une entreprise qui permettait à un individu de gérer tous ses comptes de médias sociaux à partir d'un seul endroit. Contrairement à LinkedIn, où les données étaient accessibles au public, Power Ventures demanderait le consentement de l'utilisateur. Par conséquent, c'est l'utilisateur qui a accordé à Power Ventures l'accès aux données et non Facebook. Par conséquent, même si l'entreprise était « dans les limites de l'autorisation » d'une certaine manière, il a quand même été constaté qu'elle violait la CFAA.

Là est le problème avec le CFAA. Alors qu'en théorie, il devrait empêcher le piratage, il n'est devenu qu'un outil pour les grandes entreprises. Chaque grande entreprise interprète la loi à sa manière et l'utilise à son avantage. Power Ventures n'était qu'une fonctionnalité complémentaire que l'utilisateur a choisie pour lui-même ; hiQ a créé des produits analytiques sur lesquels LinkedIn a jeté son dévolu, et comme les grandes entreprises voulaient que ces tiers sortent de leur fort, ils ont fait appel au puissant CFAA.

Bien que le tribunal ait trouvé le verrou pour invoquer la CFAA à tout moment, il n'a toujours pas complètement fermé la porte. Le plus récent Stackla v. Facebook a trouvé une autre plate-forme qui a suscité la controverse via le grattage Web.

Avec de nouvelles affaires qui surgissent de temps en temps, il incombera éventuellement au tribunal de clarifier la CFAA et des termes comme « sans autorisation ». Les données sont présentes partout et la distinction entre le légal et l'illégal devient primordiale. Le monopole des données serait dangereux pour l'innovation, et dans le monde de l'Internet rapide, l'innovation est tout.

Conclusion

Avec la victoire dans son sac, hiQ a ouvert la voie à l'application des données Web ouvertes. L'exploration et l'extraction Web sont le moyen le moins cher de collecter des données et ont été considérées pendant trop longtemps comme une approche sceptique. Il faut comprendre que la seule façon pour les petites et les grandes entreprises de rivaliser sur un pied d'égalité est que l'Internet et les données qu'il contient restent libres d'utilisation pour tous.

Google peut-il prétendre que les données qu'il affiche pour un résultat de recherche sont les siennes ? Wikipédia peut-il nous empêcher d'apprendre de ses pages ? Après tout, la plupart des informations disponibles dans le domaine public d'Internet appartiennent à des particuliers ou au marché, et aucune entreprise ne peut prétendre en avoir le monopole. Ce sur quoi les entreprises peuvent rivaliser, c'est dans quelle mesure elles peuvent utiliser les données et quels services elles peuvent créer. Ces services peuvent digérer les données ouvertes et produire un résultat précieux qui peut être utilisé par les entreprises.