Web Scraping'in Griliği – Yasal mı Değil mi?

Yayınlanan: 2022-05-26
İçindekiler gösterisi
Bir Web Sitesini Kazımak Yasal mı?
Herkese Açık Veriler
Kişisel Veriler/Özel Veriler
Telif Hakkı Verileri
Kullanım Şartları
Hesap girişi
Veriler Yasal Olarak Nasıl Kazılır?
Toplama

"Web kazıma", kelimenin tam anlamıyla, web'den verilerin kazınmasını içerir. Bir arama motorunun elinde, web kazıma, arama sorgularıyla ilgili bilgiler için milyonlarca web sitesini değerlendirerek arama sonuçları oluşturan etkinliktir. Diğer taraftan işletmelerin elinde (kazıma aletleri kullanılarak) yasallığı sorgulanır hale gelmektedir.

Neden?

Bilgisayar Sahtekarlığı ve Kötüye Kullanımı Yasası (CFAA), bilgisayarların ve içindeki bilgilerin - web kazıma dahil olmak üzere - yetkisiz kullanımını yasaklar. Ancak, bu faaliyetin kapsamı henüz belirsizliğini koruyor. Son zamanlarda ABD Yüksek Mahkemesi, izin verilen verilere izinsiz/yasaklanmış kullanım için bile olsa erişmenin CFAA'nın ihlali olarak adlandırılamayacağını açıklayarak Van Buren / Amerika Birleşik Devletleri lehine karar verdi.

Sökülen verilerin yasallığı sorununun “griliği”, web kazıma ekosistemine, neleri içerdiğine ve onu neyin yasal ya da yasa dışı kıldığına derinlemesine bakmadan netleştirilemez.

Bir Web Sitesini Kazımak Yasal mı?

Pek çok faktör, web verilerini kazımanın ne kadar yasal olduğunu belirler. Web kazımanın her yerde bulunan doğası, bir kişinin bilgilerinin yetkisiz kullanımının yasal bir sorun haline gelebileceği Trespass to Chattel yasalarının kapsamına girebilir.

Ek olarak, tüketici gizliliğini ve bilgi hırsızlığını korumak için bugün çok sayıda başka yasa, eylem ve düzenleme harekete geçirilmiştir. Genel Veri Koruma Yasasını (GDPA), Çocukların Çevrimiçi Gizliliğini Koruma Yasasını (COPPA) ve Sağlık Sigortası Taşınabilirlik ve Sorumluluk Yasasını (HIPAA) duymuş olabilirsiniz - bu koruma önlemlerinin tümü kontrolsüz kötüye kullanımı önlemek için uygulamaya konulmuştur. özel tüketici verilerinin

Ancak, Van Buren / Amerika Birleşik Devletleri kararıyla, belirli koşullar altında web kazıma işleminin uygun olabileceği görülüyor.

LinkedIn v. hiQ Labs davasına ilişkin bir Dokuzuncu Devre Temyiz Mahkemesi kararında, bu faaliyet CFAA kapsamına girmediğinden (çünkü kazınan veriler herkese açık olduğundan) herkese açık profillerden bilgi almanın uygun olduğu açıklandı. . Bununla birlikte, LinkedIn'in kullanıcı profillerine herkese açık olarak erişilmesini kısıtlamasına neden oldu - artık izleyici tarafından oturum açılması gerekiyor.

Bir web sitesinde yer alan bilgileri görüntülemek için kullanıcı hesabınıza giriş yapmanız gerekliliği, tüm faaliyetlerinizi web sitesinin hüküm ve koşulları altında buraya getirir. Bu şartlar ve koşullar, web'de kazımayı caydıran veya yasaklayan maddeler içerebilir - yine de veri ayıklamaya devam ederseniz, yasal bir karmaşaya girebilirsiniz.

Bundan bahsetmişken, tam da bu nedenle LinkedIn, kullanıcılarının web kazıma bilgilerini kısıtlamak için kullanıcı profillerini görüntülemek için girişleri zorunlu kılmıştır.

Bununla birlikte, gri alan hala geniş kalıyor. Yani… web kazıma yasa dışı mı? Büyük ölçüde, kazımaya çalıştığınız verilerin türüne ve bu verilerin doğasına bağlıdır:

Herkese Açık Veriler

İnternette karşılaştığınız veriler çoğunlukla halka açık verilerdir. Hesabınızda oturum açmanız veya veri kullanım koşullarını kabul etmeniz veya belirli verilere erişmek için kimliğinizi veya kimlik bilgilerinizi doğrulamanız gerekmedikçe, kazımak tamamen yasaldır.

Burada web toplamanın tek caydırıcısı, bu web sitelerinin web kazıyıcılarınızı saptırmak için (elbette bilgilerini korumak için) uyguladığı önlemler olacaktır.

Kişisel Veriler/Özel Veriler

Bir bireyin kişisel bilgilerini kazımak yasa dışıdır. Kişisel bilgiler herhangi bir şey olabilir – ad, adres, finansal bilgiler, sağlık bilgileri, doğum tarihi, diğer iletişim bilgileri vb. Bir bireyin kişisel kimliğini (Kişisel Olarak Tanımlanabilir Bilgiler veya PII) ele veren her şey, web kazıma için kırmızı bir bayraktır. . Kesin bir hayır-hayırdır.

Yine de mecbur kalırsanız, önce o kişinin rızasını almanız zorunludur. Ek olarak, PII'nin çıkarılmasının arkasında yasal bir motivasyon varsa, bunun bilinmesi gerekir.

Telif Hakkı Verileri

Yayıncının fikri mülkiyeti olan internetteki herhangi bir verinin kazınması yasa dışıdır. Telif haklarına rağmen bu verileri kullanmanız gerekiyorsa, kullandığınız her yerde bu bilgilerin kaynağına atıfta bulunmalısınız.

Kullanım Şartları

Bu, web kazıma işleminin yasa dışılığının koşullu bir örneğidir. Bir web sitesi veri kazımayı açıkça kısıtlıyorsa, bunu yasa dışı olarak kabul edin. Sıyırıcı botlarınızla devam etmeden önce, kullanım ve hizmet şartlarını iyice kontrol etmek en iyisidir.

Hesap girişi

LinkedIn'in kullanıcı profillerine erişmek için hesap girişlerini zorunlu kılması gibi, bir giriş örneği hemen hemen her zaman web sitesinin hüküm ve koşullarına ilişkin onayınızı alır. Bu şartlar ve koşullar, veri kazıma ile ilgili maddeler içerebilir. Giriş yaptıktan sonra sıyırıcı botlarınızı hala serbest bıraktığınızda, yasaklanma ve hatta yasal işlem yapma riskiniz vardır.

Veriler Yasal Olarak Nasıl Kazılır?

Size karşı herhangi bir yasal işlem yapılmadığından emin olmak için web kazıma işlemine devam etmeden önce aşağıdaki hususları iyice anlayın:

  • Veriler herkese açık mı?
  • Herhangi bir bireyin PII'sini ortaya çıkarıyor mu?
  • Web sitesi kazıma ile ilgili herhangi bir yasaktan söz ediyor mu?
  • Hangi bilgileri kazıyıp kullanabileceğinizi kontrol eden herhangi bir yasa, eylem, politika veya düzenleme var mı?

Tüm bu soruların yanıtlarını dikkatlice tartmak, web kazıma faaliyetinizin içinde bulunduğu gri derecenin belirlenmesine yardımcı olacaktır.

Toplama

Özünde, "Bir web sitesini kazımak yasal mı? " soru değil. Asıl soru şudur: “ Web sitesi kazıma ne kadar yasal? ".

Web kazıma işleminin yalnızca kamuya açık olan ve yasal olarak işlem yapılabilir maddelerle korunmayan verileri getirmesini sağlamak en iyisidir. Ayrıca, PromptCloud gibi ne yaptıklarını bilen profesyonel ajanslara web kazıma dış kaynak kullanabilirsiniz.