Web scraping à l'ère du RGPD - Impact et opportunités

Publié: 2018-09-05
Table des matières afficher
Le règlement général sur la protection des données
Comment le RGPD porte-t-il un coup aux entreprises qui récupèrent des informations personnelles ?
En résumé, il y a trois facteurs principaux auxquels les entreprises doivent faire face lorsqu'il s'agit de GDPR :
Comment le RGPD peut-il augmenter la clientèle des entreprises de web scraping ?
Utilisation des données pour les moyennes entreprises

Comme toujours, les premières choses d'abord. Si vous allez sur Google GDPR, il y a de fortes chances que cette définition de Wikipedia apparaisse en tête

Le règlement général sur la protection des données

« Le règlement général sur la protection des données (UE) 2016/679 (« RGPD ») est un règlement du droit de l'UE sur la protection des données et la vie privée pour tous les individus au sein de l'Union européenne (UE) et de l'Espace économique européen (EEE). Elle traite également de l'exportation de données personnelles en dehors des zones de l'UE et de l'EEE. Le GDPR vise principalement à donner aux individus le contrôle de leurs données personnelles et à simplifier l'environnement réglementaire du commerce international en unifiant la réglementation au sein de l'UE.

Pas trop clair, n'est-ce pas ? Eh bien, cela signifie essentiellement que, lorsque vous collectez, traitez, vendez ou achetez des données personnelles de clients résidant dans l'UE, ainsi que dans les pays de l'EEE tels que l'Islande, le Liechtenstein et la Norvège, vous devez vous assurer que vous avez le consentement explicite des utilisateurs pour stocker ou transférer les informations. Vous ne pouvez pas dire que "le client a saisi ces informations dans un formulaire ou un champ de données sur mon site Web, et je les stocke donc". Non, vous devez obtenir une autorisation explicite, et le client doit également avoir une option de désinscription, au cas où la personne déciderait qu'elle ne souhaite pas que ses données soient accessibles au public ultérieurement.

Ce cadre réglementaire apporte à la fois des opportunités et des contraintes. Les entreprises qui utilisent le web-scraping comme outil peuvent dynamiser leurs activités en aidant les autres à se conformer au RGPD, et en même temps, elles doivent également s'assurer qu'elles ne suppriment pas les informations privées des citoyens de l'UE (et de toute personne d'ailleurs ) sans leur consentement. Nous discuterons des deux côtés de la médaille.

Comment le RGPD porte-t-il un coup aux entreprises qui récupèrent des informations personnelles ?

GDPR traite strictement des données personnelles, pour s'assurer que les gens ne peuvent pas faire un usage déloyal des données. Les derniers scandales impliquant Cambridge Analytica et Facebook ont ​​en fait amené le besoin d'un tel cadre devant les gens. Les données, c'est le pouvoir, et entre de mauvaises mains, elles peuvent même influencer les résultats des élections des nations les plus puissantes du monde. Ainsi, si vous travaillez avec des données liées à des descriptions de produits ou à des détails techniques, etc., vous n'avez pas à vous soucier du RGPD. En fait, la plupart des fournisseurs de services de grattage Web comme PromptCloud n'explorent pas les informations personnelles. Certaines entreprises analysent les e-mails qu'elles utilisent pour les campagnes marketing et les générations de prospects.

Mais malheureusement pour les grattoirs d'e-mails (ou heureusement pour les clients), même les e-mails et les numéros de téléphone portable relèvent de la compétence des informations personnelles en vertu du RGPD, et vous avez besoin d'un consentement avant de les supprimer. La plupart des entreprises s'attaquent à ce problème en créant des outils simples (calculateur d'impôt, calculateur de patrimoine, etc.) qui, à leur tour, agissent comme des moteurs de collecte de données pour les entreprises. Cependant, les règles s'appliquent non seulement aux futures activités de grattage Web, mais également aux données que vous avez actuellement stockées dans votre base de données. Vous devez vous assurer que pour toutes les données personnelles que vous avez dans votre base de données ; vous avez l'accord des propriétaires.

En résumé, il y a trois facteurs principaux auxquels les entreprises doivent faire face lorsqu'il s'agit de GDPR :

  • Obtenir le consentement : Conformément à la loi, que vous souhaitiez stocker le nom, l'adresse e-mail ou même les adresses IP des clients, vous devez leur demander leur consentement.
  • Signaler une violation de données : les données stockées par les entreprises sont vulnérables aux piratages. Parfois, lorsque des violations de données se produisent, elles ne sont pas signalées par crainte d'une réaction du public et d'un cirque médiatique. Cela ne peut pas continuer sous GDPR. Les entreprises n'ont que 3 jours (72 heures) pour informer les utilisateurs en cas de violation de données.
  • Aucune donnée supplémentaire ne peut être collectée : chaque fois que vous récupérez des données, chaque élément que vous analysez, rapportez, et vous devez avoir une raison valable pour les récupérer. Vous ne pouvez pas simplement indiquer les « besoins futurs » comme raison de supprimer certains champs de données, dont vous n'avez pas besoin actuellement, mais que vous collectez néanmoins. Cela pourrait entraîner une lourde amende.

Mais voyez-vous, les opportunités qui découlent du RGPD l'emportent de loin sur les restrictions.

Comment le RGPD peut-il augmenter la clientèle des entreprises de web scraping ?

Les entreprises de sécurité et de conformité sont celles qui bénéficient le plus du RGPD. Non seulement leur clientèle a-t-elle augmenté du jour au lendemain. Les directives GDPR demandent aux entreprises de s'assurer que les violations de données sont surveillées en permanence. Cela a poussé les grandes entreprises à nouer des partenariats pour se conformer au RGPD. L'industrie des services en a énormément profité, car la plupart des entreprises ont été prises au dépourvu et n'étaient pas prêtes lorsque les directives sont entrées en vigueur.

La plupart des grandes entreprises technologiques traitent avec des millions de clients et des milliers de fournisseurs et ne disposent pas actuellement d'un système pour cartographier toutes leurs données et déterminer lesquelles d'entre elles sont des informations personnelles et doivent être bien protégées. C'est là qu'interviennent les entreprises de grattage Web. L'audit des pratiques actuelles et la gestion des données personnelles des clients ainsi que des visiteurs en ligne ont été effectués manuellement pour les grandes entreprises, car lors de leur création il y a des années. Ils ne savaient pas qu'un tel cadre de conformité pouvait entrer en vigueur un jour. Avec des pétaoctets de données collectées par certains sites Web d'entreprises, le processus d'audit devient de plus en plus difficile.

Un exemple de la façon dont le web scraping peut être utile dans le processus d'audit est la solution de surveillance des pages Web. Par exemple, une liste ciblée de sites Web peut être fournie au fournisseur de services de grattage et l'entreprise peut créer des robots d'exploration pour détecter divers mécanismes de suivi des données du site Web, comme les suivants :

  • Google Analytics/Gestionnaire de balises
  • Pixel Facebook ou Quora pour la publicité
  • Solutions d'enregistrement du comportement des utilisateurs
  • Applications de chat tierces

Cela peut être surveillé en permanence afin que les mesures nécessaires puissent être prises pour la conformité. En outre, cela garantit que chaque fois qu'il y a un changement dans les techniques de collecte de données. Les conditions d'utilisation du site et le plan de collecte du consentement ont été mis à jour.

Notez que c'est particulièrement un problème pour les grandes organisations telles que les grandes universités, les agences gouvernementales et juridiques, les sociétés multinationales opérant sur tous les continents, qui ont construit de grands sites hautement distribués avec de nombreux contributeurs. En utilisant les configurations de surveillance de page construites par PromptCloud, on peut facilement identifier tous les points d'accès et prendre les mesures nécessaires.

Utilisation des données pour les moyennes entreprises

Pour les petites et moyennes entreprises, le traitement des données personnelles des utilisateurs ne sera cependant pas particulièrement difficile. Les grands sites Web anciens ont généralement plusieurs contributeurs de données. Garder une trace des informations personnelles affichées sur leur site Web peut s'avérer difficile.

Il y a aussi une opportunité à l'autre bout du spectre. Les entreprises qui souhaitent savoir si des informations personnelles sur leurs associés ont été exposées. Vous pouvez simplement soumettre une liste de tous ses associés. Et ses détails de marque à un fournisseur de services de grattage Web expérimenté. Ils pourraient facilement savoir si leurs informations ont été exposées ouvertement par un site Web. Et à son tour, poursuivre une action en justice.

Ces services ne sont pas seulement utilisés par les entreprises de l'UE. Mais aussi des géants de la technologie dans d'autres pays comme les États-Unis et l'Inde. Ce sont les pays qui traitent avec des clients du monde entier (y compris l'UE). Ils doivent s'assurer qu'ils sont conformes au RGPD pour ne pas être condamnés à une amende.

Le RGPD en est à ses balbutiements. Et il est temps pour les entreprises et les marques de commencer à changer pour le bien avant la fin du temps imparti. Alors que les inconvénients pourraient ressortir actuellement. Cela pourrait en fait aider les entreprises à prévenir les poursuites et les règlements à l'amiable qui ont eu lieu auparavant. S'en tenir aux directives GDPR. Tirer le meilleur parti du cadre peut, avec le temps. Vous pouvez préparer ces entreprises pour l'avenir. Lorsque la plupart des pays auront des règles strictes pour réglementer les données et empêcher leur utilisation abusive.