Web scraping en la era del RGPD: impacto y oportunidades

Publicado: 2018-09-05
Mostrar tabla de contenido
El Reglamento General de Protección de Datos
¿Cómo afecta el RGPD a las empresas que extraen información personal?
En resumen, hay tres factores principales con los que las empresas deben lidiar cuando se trata de GDPR:
¿Cómo puede GDPR aumentar la base de clientes de las empresas de web scraping?
Uso de datos para empresas medianas

Como siempre, lo primero es lo primero. Si va a Google GDPR, es probable que esta definición de Wikipedia aparezca en la parte superior

El Reglamento General de Protección de Datos

“El Reglamento General de Protección de Datos (UE) 2016/679 (“RGPD”) es un reglamento de la legislación de la UE sobre protección de datos y privacidad para todas las personas dentro de la Unión Europea (UE) y el Espacio Económico Europeo (EEE). También aborda la exportación de datos personales fuera de las áreas de la UE y el EEE. El RGPD tiene como objetivo principal dar control a las personas sobre sus datos personales y simplificar el entorno regulatorio para los negocios internacionales al unificar la regulación dentro de la UE”.

No está demasiado claro, ¿verdad? Bueno, lo que básicamente significa es que, cuando recopila, procesa, vende o compra datos personales de clientes que viven en la UE, así como en los países del EEE de Islandia, Liechtenstein y Noruega, debe asegurarse de que usted tiene el consentimiento explícito de los usuarios para almacenar o transferir la información. No puede decir que "El cliente escribió estos detalles en un formulario o campo de datos en mi sitio web, por lo que los estoy almacenando". No, debe obtener un permiso explícito, y el cliente también debe tener una opción de exclusión, en caso de que la persona decida que no desea que sus datos estén disponibles públicamente más adelante.

Este marco regulatorio pone sobre la mesa tanto oportunidades como restricciones. Las empresas que utilizan el web-scraping como herramienta pueden impulsar sus negocios al ayudar a otros a cumplir con el RGPD y, al mismo tiempo, también deben asegurarse de que no están extrayendo información privada de los ciudadanos de la UE (y de cualquier persona). ) sin su consentimiento. Hablaremos de las dos caras de la moneda.

¿Cómo afecta el RGPD a las empresas que extraen información personal?

GDPR se ocupa estrictamente de los datos personales, para asegurarse de que las personas no puedan hacer un uso injusto de los datos. Los últimos escándalos que involucran a Cambridge Analytica y Facebook en realidad pusieron de manifiesto la necesidad de un marco de este tipo. Los datos son poder y, en las manos equivocadas, pueden incluso influir en los resultados electorales de las naciones más poderosas del mundo. Entonces, en caso de que esté trabajando con datos relacionados con descripciones de productos o detalles técnicos, etc., no debe preocuparse por GDPR. La mayoría de los proveedores de servicios de web scraping como PromptCloud, de hecho, no rastrean información personal. Algunas empresas rastrean correos electrónicos que utilizan para campañas de marketing y generación de clientes potenciales.

Pero desafortunadamente para los rastreadores de correo electrónico (o afortunadamente para los clientes), incluso el correo electrónico y los números de teléfono móvil están bajo el alcance de la información personal bajo GDPR, y necesita el consentimiento antes de rasparlo. La mayoría de las empresas están abordando este problema mediante la creación de herramientas simples (calculadora de impuestos, calculadora de riqueza y más) que a su vez actúan como motores de recopilación de datos para las empresas. Sin embargo, las reglas no solo se aplican a futuras actividades de web scraping, sino también a los datos que actualmente tiene almacenados en su base de datos. Debe asegurarse de que para todos los datos personales que tiene en su base de datos; usted tiene el consentimiento de los propietarios.

En resumen, hay tres factores principales con los que las empresas deben lidiar cuando se trata de GDPR:

  • Obtener consentimiento: según la ley, ya sea que desee almacenar el nombre, la dirección de correo electrónico o incluso las direcciones IP de los clientes, debe solicitarles su consentimiento.
  • Informar sobre la filtración de datos: los datos almacenados por las empresas son vulnerables a los ataques. A veces, cuando se producen filtraciones de datos, no se informan por temor a la reacción del público y al circo mediático. Esto no puede continuar bajo GDPR. Las empresas tienen solo 3 días (72 horas) para informar a los usuarios, en caso de una violación de datos.
  • No se pueden recopilar datos adicionales: cada vez que extraiga datos, cada pieza que rastree, informe realizado, y debe tener una razón válida para extraerla. No puede simplemente indicar "necesidades futuras" como la razón para raspar ciertos campos de datos, que actualmente no necesita, pero que, sin embargo, está recopilando. Podría dar lugar a una multa considerable.

Pero verá, las oportunidades que han surgido de GDPR superan con creces las restricciones.

¿Cómo puede GDPR aumentar la base de clientes de las empresas de web scraping?

Las empresas de seguridad y cumplimiento son las que más se benefician del RGPD. No solo ha aumentado su base de clientes de la noche a la mañana. Las pautas de GDPR piden a las empresas que se aseguren de que las violaciones de datos se controlen continuamente. Esto ha hecho que las grandes empresas se asocien para cumplir con el RGPD. La industria de servicios se ha beneficiado enormemente de esto porque la mayoría de las empresas fueron sorprendidas desprevenidas y no preparadas cuando las pautas realmente entraron en acción.

La mayoría de las grandes empresas de tecnología tratan con millones de clientes y miles de proveedores y actualmente no tienen un sistema para mapear todos sus datos y encontrar cuáles de ellos son información personal y deben protegerse bien. Aquí es donde entran las empresas de raspado web. La auditoría de las prácticas actuales y la gestión de los datos personales de los clientes, así como de los visitantes en línea, se han realizado manualmente para las grandes empresas, porque cuando se formaron hace años. No sabían que tal marco de cumplimiento podría entrar en vigor algún día. Con petabytes de datos recopilados por los sitios web de algunas empresas, el proceso de auditoría se vuelve cada vez más difícil.

Un ejemplo de cómo el web scraping puede ser útil en el proceso de auditoría es la solución de monitoreo de páginas web. Por ejemplo, se puede proporcionar una lista específica de sitios web al proveedor de servicios de extracción y la empresa puede crear rastreadores para detectar varios mecanismos de seguimiento de datos del sitio web como los siguientes:

  • Administrador de etiquetas/Google Analytics
  • Píxel de Facebook o Quora para publicidad
  • Soluciones de registro del comportamiento del usuario
  • Aplicaciones de chat de terceros

Esto se puede monitorear continuamente para que se puedan tomar las acciones necesarias para el cumplimiento. Además, esto asegura que siempre que haya un cambio en las técnicas de recolección de datos. Se actualizaron los términos de uso del sitio web y el plan de recolección de consentimiento.

Noe que esto es particularmente un problema para las grandes organizaciones como las grandes universidades, las agencias gubernamentales y legales, las corporaciones multinacionales con operaciones en todos los continentes, que han construido grandes sitios altamente distribuidos con numerosos colaboradores. Usando las configuraciones de monitoreo de páginas creadas por PromptCloud, uno puede identificar fácilmente todos los puntos de acceso y tomar las medidas necesarias.

Uso de datos para empresas medianas

Sin embargo, para las pequeñas y medianas empresas, el manejo de los datos personales de los usuarios no será particularmente desafiante. Los sitios web grandes y antiguos suelen tener múltiples contribuyentes de datos. Hacer un seguimiento de la información personal que se muestra en su sitio web puede resultar difícil.

También hay una oportunidad en el otro extremo del espectro. Empresas que deseen saber si algún dato personal de sus asociados ha sido expuesto. Simplemente puede enviar una lista de todos sus asociados. Y los detalles de su marca a un proveedor experimentado de servicios de web scraping. Fácilmente podrían encontrar si su información ha sido expuesta abiertamente por algún sitio web. Y a su vez, emprender acciones legales.

Estos servicios no solo los utilizan las empresas de la UE. Pero también gigantes tecnológicos en otros países como EE. UU. e India. Estos son los países que tratan con clientes en todo el mundo (incluida la UE). Deben asegurarse de que cumplen con el RGPD para no ser multados.

GDPR está en su infancia. Y hay tiempo para que las empresas y las marcas empiecen a cambiar para bien antes de que se agote el tiempo. Si bien las desventajas podrían sobresalir actualmente. De hecho, podría ayudar a las empresas a evitar demandas y acuerdos extrajudiciales que hayan tenido lugar antes. Cumplir con las pautas de GDPR. Hacer la mayor parte del marco puede, con el tiempo. Puede preparar estas empresas para el futuro. Cuando la mayoría de los países tendrán reglas estrictas para regular los datos y evitar su uso indebido.