GDPR 時代の Web スクレイピング – 影響と機会
公開: 2018-09-05いつものように、まず最初に。 Google GDPR にアクセスすると、ウィキペディアによるこの定義が一番上に表示される可能性があります。
一般データ保護規則
「一般データ保護規則 (EU) 2016/679 (「GDPR」) は、欧州連合 (EU) および欧州経済領域 (EEA) 内のすべての個人のデータ保護とプライバシーに関する EU 法の規則です。 また、EU および EEA 地域外への個人データの輸出にも対応しています。 GDPR の主な目的は、個人データを個人が管理できるようにし、EU 内の規制を統一することで、国際ビジネスの規制環境を簡素化することです。」
はっきりしすぎませんか? 基本的には、EU、アイスランド、リヒテンシュタイン、ノルウェーの EEA 諸国に住む顧客の個人データを収集、処理、販売、または購入する場合は、次のことを確認する必要があるということです。情報の保存または転送について、ユーザーから明示的な同意を得ている場合。 「顧客がこれらの詳細を私の Web サイトのフォームまたはデータ フィールドに入力したので、それを保存している」とは言えません。 いいえ、明示的な許可を得る必要があります。また、顧客が自分のデータを後で公開したくないと判断した場合に備えて、オプトアウトのオプションも用意する必要があります。
この規制の枠組みは、チャンスと制約の両方をもたらします。 Web スクレイピングをツールとして使用する企業は、他の企業が GDPR に準拠するのを支援することでビジネスを後押しすることができます。同時に、EU 市民の個人情報をスクレイピングしていないことを確認する必要もあります。 ) 彼らの同意なしに。 コインの両面について説明します。
GDPR は、個人情報をスクレイピングする企業にどのような打撃を与えますか?
GDPR は個人データを厳密に扱い、人々がデータを不正に使用できないようにします。 ケンブリッジ・アナリティカとフェイスブックが関与した最新のスキャンダルは、実際にそのようなフレームワークの必要性を人々の前にもたらしました. データは力であり、悪者の手に渡れば、世界で最も強力な国の選挙結果にさえ影響を与える可能性があります. したがって、製品の説明や技術的な詳細などに関連するデータを扱っている場合は、GDPR について心配する必要はありません。 実際、PromptCloud などのほとんどの Web スクレイピング サービス プロバイダーは、個人情報をクロールしません。 一部の企業は、マーケティング キャンペーンやリード ジェネレーションに使用する電子メールをクロールしています。
しかし、残念なことに、電子メール スクレイパーにとって (または顧客にとっては幸いなことに)、電子メールや携帯電話の番号でさえ GDPR の下では個人情報の範囲に含まれており、スクレイピングする前に同意が必要です。 ほとんどの企業は、企業のデータ収集エンジンとして機能する単純なツール (税金計算機、資産計算機など) を作成することで、この問題に取り組んでいます。 ただし、ルールは将来の Web スクレイピング活動だけでなく、現在データベースに保存されているデータにも適用されます。 データベースにあるすべての個人データについて、次のことを確認する必要があります。 あなたは所有者から同意を得ています。
要約すると、GDPRに関して企業が対処しなければならない3つの主な要因があります。
- 同意を得る: 法律に従って、顧客の名前、電子メール アドレス、さらには IP アドレスを保存する場合でも、同意を求める必要があります。
- データ侵害の報告: 企業が保存するデータは、ハッキングに対して脆弱です。 データ侵害が発生した場合、世間の反発やメディアのサーカスを恐れて報告されないことがあります。 これは GDPR の下では続行できません。 データ侵害が発生した場合、企業はユーザーに通知するのに 3 日 (72 時間) しか与えられません。
- 余分なデータを収集することはできません: データをスクレイピングするときはいつでも、クロールするすべてのピースを報告し、それをスクレイピングする正当な理由が必要です。 現在は必要ないが、収集している特定のフィールドのデータをスクレイピングする理由として、「将来のニーズ」だけを述べることはできません。 多額の罰金につながる可能性があります。
しかし、ご覧のとおり、GDPR から生じた機会は、制限をはるかに上回ります。

GDPR は、Web スクレイピング企業の顧客ベースをどのように増やすことができますか?
GDPR から最も恩恵を受けるのは、セキュリティとコンプライアンスの企業です。 顧客ベースが一晩で多様化しただけではありません。 GDPR ガイドラインでは、データ侵害が継続的に監視されていることを確認するよう企業に求めています。 これにより、大企業はGDPRに準拠するためにパートナーシップを結ぶようになりました. ガイドラインが実際に施行されたとき、ほとんどの企業は気づかず、準備ができていなかったので、サービス業界はそれから大きな恩恵を受けました.
ほとんどの大手テクノロジー企業は、数百万の顧客と数千のベンダーを扱っていますが、現在、すべてのデータをマッピングし、それらのどれが個人情報であり、適切に保護する必要があるかを見つけるシステムを持っていません. ここで、Web スクレイピング企業の出番です。現在の慣行の監査と、顧客やオンライン訪問者の個人データの管理は、数年前に設立された大企業では手作業で行われてきました。 彼らは、そのようなコンプライアンスの枠組みがいつか発効する可能性があることに気づいていませんでした。 一部の企業の Web サイトで収集されたペタバイト規模のデータにより、監査プロセスはますます困難になっています。
監査プロセスで Web スクレイピングがどのように役立つかを示す例として、Web ページ監視ソリューションがあります。 たとえば、対象となる Web サイトのリストをスクレイピング サービス プロバイダーに提供すると、企業は次のような Web サイトのさまざまなデータ追跡メカニズムを検出するクローラーを構築できます。
- Google アナリティクス/タグ マネージャー
- 広告用の Facebook または Quora ピクセル
- ユーザー行動記録ソリューション
- サードパーティのチャット アプリ
これは継続的に監視できるため、コンプライアンスのために必要な措置を講じることができます。 また、これにより、データ収集手法に変更があった場合に常に保証されます。 ウェブサイトの利用規約と同意収集計画が更新されました。
これは、大規模な大学、政府機関、法律機関、大陸をまたいで事業を展開する多国籍企業などの大規模な組織にとって特に問題となることに注意してください。 PromptCloud によって構築されたページ監視設定を使用すると、すべてのアクセス ポイントを簡単に特定し、必要な手順を実行できます。
中規模企業のデータ使用量
ただし、中小企業の場合、ユーザーの個人データの取り扱いは特に難しいことではありません。 大規模な古い Web サイトの場合、通常、複数のデータ提供者がいます。 Web サイトに表示されている個人情報を追跡するのは難しい場合があります。
スペクトルの反対側にもチャンスがあります。 従業員に関する個人情報が公開されているかどうかを知りたい企業。 すべての関連会社のリストを送信するだけです。 そして、そのブランドの詳細を、経験豊富な Web スクレイピング サービス プロバイダーに提供します。 彼らは、自分の情報が Web サイトによって公然と公開されているかどうかを簡単に見つけることができます。 そして、法的手段を講じます。
これらのサービスは、EU 内の企業だけが利用できるわけではありません。 しかし、米国やインドなどの他の国のハイテク大手も同様です。 これらは、世界中 (EU を含む) のクライアントと取引している国です。 罰金を科されないように、GDPR に準拠していることを確認する必要があります。
GDPR はまだ始まったばかりです。 そして、時間がなくなる前に、企業やブランドが良い方向に変化し始める時があります。 欠点は現在突き出ているかもしれませんが。 実際、企業が以前に行われた訴訟や法廷外での和解を防ぐのに役立つかもしれません. GDPR ガイドラインに準拠しています。 フレームワークを最大限に活用することは、時間とともに可能になります。 これらの企業の将来に備えることができます。 ほとんどの国が、データを規制し、その悪用を防止するための厳格な規則を持つようになるとき。
