Избегайте Cambridge Analytica — как соблюдать этику больших данных
Опубликовано: 2018-04-07В марте 2018 года одним из самых популярных заголовков было то, как малоизвестная фирма Cambridge Analytica без их разрешения собрала личные данные примерно 50 миллионов пользователей Facebook в США. Facebook все еще не оправился от ущерба, нанесенного этим разоблачением — он потерял более 50 миллиардов долларов рыночной капитализации, а бизнес-лидеры, такие как Тим Кук из Apple и Илон Маск из Tesla Motors, открыто критикуют то, как была нарушена конфиденциальность пользователей.
Фиаско снова привлекло внимание к тому, как этика играет роль в наш век огромных объемов больших данных, генерируемых в различных форматах из различных структурированных и неструктурированных источников. Большие данные на самом деле очень велики, но дает ли их громадная структура возможность идти на компромисс в отношении этики? Конечно нет.
Как эти двое встречаются?
Большие данные и этика — две разные темы. Данные сами по себе не являются хорошими или плохими. Тем не менее, он начинает носить моральное одеяние с анализом и использованием результатов анализа данных. Чтобы избежать этой участи, организациям необходимо внедрить строгий принцип, уделяя должное внимание конфиденциальности и позволяя пользователям выбирать, чем они хотят делиться, а чем нет.
Хотите узнать, какие меры могут помочь вам достичь этой сложной цели? Тогда вы находитесь в правильном месте. Сегодня мы рассмотрим 7 способов, с помощью которых вы можете поддерживать этику больших данных и предоставить этический кодекс поведения для экспертов по большим данным, работающих в вашей организации.
1. Полезны ли данные вообще?
Тот факт, что у организаций есть ресурсы и технологии для сбора данных, не означает, что они должны это делать . Возьмите два примера ниже
а) Таксомоторная компания, определяющая ваше местонахождение, чтобы найти ближайшие такси для более быстрой поездки на такси.
б) Туристическая компания, получающая доступ к чатам между вами и вашим другом, планирующим отпуск на следующих выходных, чтобы предложить персонализированные праздничные пакеты.
Очевидно, что второй случай является вопиющим нарушением конфиденциальности пользователя, особенно если учесть, что пользователь даже не обращался в турагентство за информацией.
2. Срочно нужно — Упрощение политики конфиденциальности
В основе фиаско Facebook-Cambridge Analytica лежат положения, упомянутые в условиях обслуживания Facebook , которые с тех пор обновлялись. Как неспециалист, пользователь просто выберет «Согласен» или «Не согласен» с условиями обслуживания, не проходя долгие и скучные юридические вопросы. В эти смутные времена крайне важно иметь более простой документ «условия обслуживания», чтобы читатели понимали, на что они подписываются и как будут использоваться их данные. Настройки конфиденциальности также необходимо упростить и сделать удобными для пользователя, чтобы больше пользователей действительно посещали страницу и видели, что она для них представляет.

3. Надлежащие меры по устранению внутренних нарушений
Часто источником утечки данных оказывается инсайдер. Таким образом, должны быть обеспечены адекватные меры контроля, чтобы этого не произошло. Даже если это произойдет, к нарушителю должны быть приняты строгие меры. Это нужно для того, чтобы это было взято за пример и у других не возникло соблазна снова осуществить утечку данных в ближайшем будущем.
Кроме того, необходимо провести надлежащее обучение, чтобы все сотрудники были осведомлены о мерах контроля, действующих для защиты этики больших данных каждую минуту своей корпоративной жизни.
4. Проверка подлинности третьей стороны обязательна
Все аналитические компании и сайты социальных сетей, имеющие дело с третьими лицами при обмене данными, должны подтвердить точную личность, чтобы подтвердить, что они не являются самозванцами, пытающимися украсть данные или совершить кражу личных данных.
Такая конфиденциальная информация обычно извлекается людьми, создающими поддельные идентификаторы или ложно представляющими себя из академического учреждения или компании, занимающейся исследованиями рынка.
5. Оцените риски, связанные с использованием конкретных данных
Важно, чтобы организации тратили время на оценку негативного влияния использования данных на конкретные группы пользователей. Они также должны учитывать влияние данных, которые становятся общедоступными.
Это приведет к повышению уровня осведомленности об ущербе, который возможная утечка данных может нанести авторитету и репутации компании. Компании часто проводят оценку воздействия на конфиденциальность, чтобы исключить риск неправомерного использования информации сотрудниками.
6. Четко определенный сбор данных имеет решающее значение
Важно, чтобы эксперты по аналитике больших данных заранее знали, какие данные собирать и в каком количестве, чтобы выполнить поставленную задачу. Таким образом, аналитики и специалисты по сбору данных могут держаться подальше от данных, которые не используются в их операционной схеме.
Дело в том, что, ограничивая чрезмерный (ненужный) сбор и анализ данных, вы ограничиваете подверженность риску утечки данных.
7. Будьте готовы справиться с кризисом
Несмотря на самые лучшие планы и намерения, утечка данных все равно может ударить по вашей компании. В такой ситуации паниковать неразумно. У вас должна быть заранее определенная стратегия антикризисного управления, чтобы справиться с этими трудными днями утечки данных. Важно остановить «утечку» данных, очистить системы, убедиться, что источник утечки закрыт, а затем возобновить работу.
Заключить
IDC прогнозирует, что к 2020 году более 1,5 миллиарда человек пострадают от утечек данных. Весь процесс сбора, хранения, обмена, анализа и визуализации данных должен осуществляться с использованием надежных моделей управления.
Каждому участнику цепочки создания стоимости (пользователям, третьим сторонам, аналитическим фирмам и платформам социальных сетей) необходимо практиковать этику в работе с большими данными, чтобы добиться ощутимых изменений в
- Завоевание доверия пользователей
- Построение целостности организации
- Исключение неправильного использования данных
Могут ли инициативы, поддерживаемые отраслью, такие как грядущий GDPR или партнерство Bloomberg и Bright Hive , стать ответом на этическую дилемму, связанную с большими данными? В основном это будет зависеть от того, как компании внедрят эти ценности в свою стратегию и корпоративную ДНК. В частности, специалисты по данным должны будут интегрировать этическую проверку, алгоритмическую проверку предвзятости и учитывать ее влияние на общество в целом.
