hiQ 対 LinkedIn ⁠— 公開されている Web データをスクレイピングすることは確かに合法です

公開: 2019-10-15
目次を見る
hiQ 対 LinkedIn
CFAAの問題
結論

天国への階段、ウェブスクレイピングのビジネスをしているなら、それはそうです。

公開されているデータをスクレイピングすることは合法です。 Web のパブリック ドメインには、膨大な量のデータが公開されています。 しかし、その利用に関しては、これまでほとんど行われていませんでした。 しかし今日、サービス企業はデータをサービスとして提供したり、データに裏打ちされたソリューションを構築したりしています。 たとえば、5 つの異なる Web サイトで 20000 個の商品の価格を知りたい場合、いくつかのサービスがそれを手助けしてくれます。 新兵を雇う場合でも、家をリストするのに適切な価格を決定する場合でも、Web スクレイピングはすべてに役立ちます。 ただし、Web スクレイピングには通常、企業がオープンなインターネットからデータをスクレイピングすることが含まれますが、多くの企業はこれに反対しています。 なんで? 彼らは、ユーザーからのデータを自分のものとして主張します。 そしてどうやら、それに対する権利を持っているのは彼らだけです。 最近の hiQ 対 LinkedIn の訴訟では、公開データへの無料でオープンなアクセスに対する大きな意志が見られました。

データのスクレイピングは、LinkedIn から一般にアクセス可能なデータをスクレイピングしていたデータ分析会社である hiQ Labs にとって困難であることが判明しました。 後者は、コンピューター詐欺および乱用防止法 (CFAA) を行使することを選択し、hiQ が「許可なく」情報にアクセスしたとして非難しました。 しかし画期的な動きとして、米国第 9 巡回控訴裁判所は hiQ Labs に有利な判決を下し、「オープン インターネット」への道を開きました。

hiQ 対 LinkedIn

CFAA は、政府のセキュリティ システムが「許可なく」ハッキングされるのを防ぐために作成された、連邦のサイバー セキュリティ法です。 しかし、「承認」という用語のあいまいさは、hiQ 対 LinkedIn のケースのように、企業が必要なときにいつでも独自のニーズに合わせてそれを形成できることを意味していました。 hiQ が行ったことは単純で、スクレイピングされたデータを使用して人事関連の分析製品を作成します。 たとえば、Keeper は気まぐれな従業員を特定し、Skill Mapper は従業員を評価して労働力のギャップを見つけました。 しかしその後、LinkedIn が 2017 年に同様の一連の製品を立ち上げ、シナリオが南下し始めたのはそのときです。

  • 2017 年 5 月 23 日、同社は hiQ にデータのスクレイピングを停止するよう要求する停止通知書を送信しました。 2 週間後、hiQ は LinkedIn に対して差し止めによる救済を求める訴訟を起こしました。
  • LinkedIn からのデータがなければ、hiQ が会社として生き残れないことは裁判所にとって明らかでした。 さらに、ユーザーが情報のパスワードを暗号化していなかったため、LinkedIn のデータは公開されていました。 「プロファイルを公開することを選択したLinkedInユーザーが実際にプライバシーを期待しているという証拠はほとんどない」と裁判所は述べた.
  • LinkedIn のプライバシー ポリシーには、「プロフィールに記載した情報や LinkedIn に投稿したコンテンツは、他のユーザーに表示される可能性がある」と記載されています。 オッズはhiQに有利でした。
  • hiQ は、不法に契約を妨害したと主張しました。LinkedIn は、競合他社をバスの下に投げ込みながら、製品を販売しようとしただけです。 LinkedIn は積極的な競争を合法と見なしましたが、裁判所はそうではありませんでした。
  • LinkedIn は CFAA カードをプレイしようとしました。 法律によれば、「許可なくコンピュータに故意にアクセスしたり、許可されたアクセスを超えて、保護されたコンピュータから情報を取得したりする者は、罰金または懲役によって処罰されます」。 さらに、その規定の「違反のために損害または損失を被った者」は、「損害賠償および差し止めによる救済またはその他の衡平法上の救済を得るために、違反者に対して」民事訴訟を起こすことができます。
  • しかし、データはユーザー ID とパスワードによって保護されていなかったため、LinkedIn の主張は根拠のないものになりました。 裁判所は、CFAA は本件には適用されないとの判決を下しました。 データは公開されていました。 違法な「侵入」は行われませんでした。

CFAAの問題

これはデータ分析にとって大きな勝利であると同時に、CFAA のアウトリーチを曖昧にすることに成功した第 9 巡回区控訴裁判所の事例、Facebook v. Power Ventures にも光を当てます。リンクトインの手紙。

Power Ventures は、個人がすべてのソーシャル メディア アカウントを 1 か所から管理できるようにする会社でした。 データが公開されていた LinkedIn とは異なり、Power Ventures はユーザーの同意を求めます。 したがって、Power Ventures にデータへのアクセスを許可したのはユーザーであり、Facebook ではありません。 したがって、会社はある意味では「許可の範囲内」でしたが、それでも CFAA に違反していることが判明しました。

CFAAには問題があります。 理論上はハッキングを防ぐはずですが、大手企業のツールにすぎません。 すべての大企業は、法律を独自の方法で解釈し、それを有利に利用しています。 Power Ventures は、ユーザーが自分で選択したアドオン機能にすぎません。 hiQ は、LinkedIn が目を向けた分析製品を作成しました。大企業は、これらのサードパーティを自社の得意分野から外したいと考えていたため、強力な CFAA に依頼しました。

裁判所は、適切と思われるときはいつでも CFAA を発動できるロックを見つけましたが、まだドアを完全に閉めていません。 最近の Stackla v. Facebook では、Web スクレイピングを介して論争を巻き起こした別のプラットフォームが見つかりました。

新しい訴訟が時折発生するため、最終的には、CFAA と「許可なし」などの条件を明確にするために法廷に出ることになります。 データはどこにでも存在し、合法と違法の区別を作成することが最も重要になります。 データの独占はイノベーションにとって危険であり、ペースの速いインターネットの世界では、イノベーションがすべてです。

結論

勝利を手にしたhiQは、オープンWebデータのアプリケーションへの道を切り開いた。 Web のクローリングと抽出は、データを収集する最も安価な方法ですが、あまりにも長い間、懐疑的なアプローチと見なされてきました。 大小の企業が平等な競争の場で競争できる唯一の方法は、インターネットとそこに存在するデータをすべての人が自由に使用できるようにしておくことであることを理解する必要があります。

Google は、検索結果に表示されるデータが独自のものであると主張できますか? ウィキペディアは私たちがそのページから学ぶのをやめさせることができますか? 結局のところ、インターネットのパブリック ドメインで入手可能な情報のほとんどは個人または市場に属しており、どの企業もそれを独占していると主張することはできません。 代わりに、企業が競争できるのは、データをどれだけうまく使用できるか、どのようなサービスを作成できるかです。 これらのサービスは、オープン データを消化し、企業が使用できる貴重な出力を生成できます。