Éviter un Cambridge Analytica - Comment respecter l'éthique du Big Data
Publié: 2018-04-07En mars 2018, un titre tendance était comment une entreprise peu connue, Cambridge Analytica, avait récolté les données personnelles d'environ 50 millions d'utilisateurs américains de Facebook sans leur permission. Facebook est toujours sous le choc des dommages causés par cette exposition - il a perdu plus de 50 milliards de dollars de capitalisation boursière, des chefs d'entreprise comme Tim Cook d'Apple et Elon Musk de Tesla Motors critiquant ouvertement la manière dont la vie privée des utilisateurs a été violée.
Le fiasco a carrément remis en lumière la façon dont l'éthique se joue à cette époque de volumes massifs de données volumineuses générées dans divers formats à partir de différentes sources structurées et non structurées. Le Big Data est en réalité très volumineux, mais sa structure gigantesque lui donne-t-elle une marge de manœuvre pour faire des compromis sur l'éthique ? Certainement pas.
Comment les deux se rencontrent ?
Le big data et l'éthique sont deux sujets distincts. Les données, en elles-mêmes, ne sont ni bonnes ni mauvaises. Cependant, il commence à porter une robe morale avec l'analyse et l'utilisation des résultats de l'analyse des données. Pour éviter ce sort, les organisations doivent mettre en œuvre un principe fort mettant l'accent sur la confidentialité et permettant aux utilisateurs de choisir ce qu'ils veulent partager et ce qu'ils ne veulent pas.
Vous souhaitez savoir quelles sont les mesures qui peuvent vous aider à atteindre cet objectif ambitieux ? Alors vous êtes au bon endroit. Aujourd'hui, nous examinons 7 façons de respecter l'éthique du Big Data et de fournir un code de conduite éthique aux experts du Big Data travaillant avec votre organisation.
1. Les données sont-elles vraiment utiles ?
Ce n'est pas parce que les organisations disposent des ressources et des technologies nécessaires pour collecter des données qu'elles doivent le faire . Prenons les deux exemples ci-dessous
a) Une compagnie de taxi prenant votre position pour aller chercher des taxis à proximité pour un voyage en taxi plus rapide
b) Une agence de voyage accédant à des discussions entre vous et votre ami planifiant les prochaines vacances du week-end pour proposer des forfaits vacances personnalisés
De toute évidence, le deuxième cas est une violation flagrante de la vie privée de l'utilisateur, d'autant plus que l'utilisateur n'a même pas contacté l'agence de voyages pour obtenir des informations.
2. Besoin urgent - Simplification de la politique de confidentialité
Au cœur de la débâcle Facebook-Cambridge Analytica se trouvent les dispositions mentionnées dans les conditions d'utilisation de Facebook , qui ont depuis été mises à jour. En tant qu'utilisateur profane, il suffit de sélectionner "Accepter" ou "Ne pas accepter" les conditions d'utilisation sans passer par le jargon juridique long et ennuyeux. Il est impératif, en ces temps troublés, d'avoir un document de « conditions d'utilisation » plus simple afin que les lecteurs comprennent à quoi ils s'inscrivent et comment leurs données seront utilisées. Les paramètres de confidentialité doivent également être simplifiés et rendus conviviaux afin que davantage d'utilisateurs visitent réellement la page et voient ce qu'elle contient pour eux.

3. Mesures de conséquences appropriées pour lutter contre la violation interne
Souvent, la source de la fuite de données est un initié. Ainsi, des contrôles adéquats doivent être en place pour s'assurer que cela ne se produise pas. Même lorsque cela se produit, des mesures strictes doivent être prises contre l'auteur. Cela est nécessaire pour qu'il soit pris comme exemple et que d'autres ne soient pas tentés de commettre à nouveau des violations de données dans un proche avenir.
De plus, une formation adéquate doit être dispensée afin que tous les employés soient conscients des mesures de contrôle en place pour sauvegarder l'éthique du Big Data à chaque minute de leur vie d'entreprise.
4. La vérification de l'authenticité du tiers est un must
Toutes les sociétés d'analyse et les sites de médias sociaux traitant avec des tiers lors du partage de données doivent vérifier l'identité exacte afin de confirmer qu'ils ne sont pas des imposteurs essayant de voler des données ou de commettre une usurpation d'identité.
Ces informations confidentielles sont généralement extraites par des personnes créant de fausses pièces d'identité ou se faisant passer pour une institution universitaire ou une société d'études de marché.
5. Évaluer les risques liés aux données spécifiques utilisées
Il est important que les organisations consacrent du temps à évaluer l'impact négatif de l'utilisation des données sur des groupes spécifiques d'utilisateurs. Ils devraient également tenir compte de l'impact des données mises à la disposition du public.
Cela conduira à une augmentation des niveaux de prise de conscience des dommages qu'une éventuelle violation de données pourrait causer à la crédibilité et à la réputation de l'entreprise. Les entreprises procèdent souvent à une évaluation de l'impact sur la vie privée pour éliminer le risque d'utilisation abusive des informations par les employés.
6. Une collecte de données bien définie est cruciale
Il est important que les experts en analyse de Big Data sachent à l'avance quelles données collecter et combien de données collecter afin de remplir le travail à accomplir. De cette façon, les analystes et les experts en collecte de données peuvent rester à l'écart des données qui n'ont aucune utilité dans leur schéma opérationnel.
Le point ici est qu'en limitant la collecte et l'analyse excessives (inutiles) de données, vous limitez l'exposition au risque de violation de données.
7. Soyez prêt à faire face à la crise
Malgré les meilleurs plans et intentions, une violation de données peut encore frapper votre entreprise. Dans cette situation, il n'est pas sage de paniquer. Vous devez mettre en place une stratégie de gestion de crise prédéfinie pour faire face à ces jours difficiles de la violation de données. Il est important d'arrêter le « saignement » des données, de nettoyer les systèmes, de vérifier que la source de la fuite est colmatée, puis de reprendre les opérations.
De conclure
IDC prévoit que d'ici 2020, plus de 1,5 milliard de personnes seront touchées par des violations de données. L'ensemble du processus de collecte, de stockage, de partage, d'analyse et de visualisation des données doit fonctionner avec des modèles de gouvernance solides en place.
Chaque partie prenante de la chaîne de valeur (utilisateurs, tiers, sociétés d'analyse et plateformes de médias sociaux) doit pratiquer l'éthique dans le Big Data pour apporter des changements tangibles dans
- Gagner la confiance des utilisateurs
- Renforcer l'intégrité de l'organisation
- Éliminer l'utilisation abusive des données
Des initiatives soutenues par l'industrie comme le prochain RGPD ou le partenariat Bloomberg/Bright Hive pourraient -elles être la réponse au dilemme éthique associé au Big Data ? Cela dépendra principalement de la manière dont les entreprises insuffleront ces valeurs dans leur stratégie et leur ADN. Plus précisément, les scientifiques des données devront intégrer l'examen éthique, les tests de biais algorithmiques et tenir compte de son impact sur la société dans son ensemble.
