İçerik Keşif Platformları Web Kazıma ve Yapay Zeka Yoluyla Sahte Haberlerle Nasıl Mücadele Edebilir?
Yayınlanan: 2017-06-20İnsanların haberler için geleneksel medyaya bağımlı olduğu günler geride kaldı; şimdi internetteki çok sayıda çevrimiçi medya kuruluşu tarafından haber bombardımanına tutuluyorlar. O kadar ki, haberleri ve hikayeleri yakalamak için sınırlı zamanı olan ortalama bir kişi için aşırı bilgi yükü. Sosyal medya artık bir haber aracı görevi görüyor ve beslemeyi okuma alışkanlıklarına göre özelleştirerek kullanıcılar için deneyimi daha iyi hale getiriyor. Bununla birlikte, sosyal medya ve web yayıncılığının bu muazzam yaygınlaşması, kendi dezavantajlarını da beraberinde getiriyor.

WordPress gibi kullanımı kolay içerik yönetim sistemlerinin yaygın olarak bulunması, herkesin web yayıncısı olmasını kolaylaştırdı. Bu, kelimenin tam anlamıyla herkesin her şeyi yazabileceği ve yayınlayabileceği anlamına gelir - soru sorulmadan. Bunun, içerik yayınlama ağları ve blog yazarları için geniş bir olasılık yelpazesi açtığı doğrudur. Ancak, tüm güçlü şeylerde olduğu gibi, yayıncılık teknolojisinin hazır mevcudiyeti, büyük bir grup tarafından çirkin amaçlarla sahte haberler yaymak için kötüye kullanılıyor. Sahte haberler, yüzeyde göründüğünden daha büyük bir sorundur. Toplumda tahribat yaratma ve hatta işletmeleri ve diğer kurumları olumsuz etkileme potansiyeline sahiptir.
Problem ne kadar büyük?
Sahte haberlerin yayılmasının, son Amerikan başkanlık seçimlerinde teraziyi Donald Trump lehine çevirdiği söyleniyor. İddialarla ilgili gerçek ne olursa olsun, yalan haberler kuşkusuz kitleleri sağlıksız bir şekilde etkileyebilir, nokta. Sahte haberlerin yayılması toplumda güvensizlik yaratabilir, bu da diğer birçok sosyal kötülüğün temel nedeni olarak hareket edebilen yavaş bir zehirdir. Örneğin, sahte haberler toplumsal şiddeti teşvik edebilir ve insanların yaşamlarında rahatsız edici bir atmosfer yaratabilir.
Kolaylıkla yalan haber haline getirilebilecek bazı konular var; gücün kötüye kullanılması, yabancılaşma korkusu, savaş ve barış sorunları vb. orman yangını gibi kolayca yayılarak onarılamaz hasarlara neden olabilir.
Etkilenen şirketin müşteri kaybetmesini sağlamak amacıyla şirket hakkında yanlış söylentiler yayarak rakiplerini aşağı çekmek için karalama kampanyaları yürüten işletmelerin örnekleri olmuştur.
Kısa bir süre önce bir Suriyeli mülteci , kendisini terörizmle ilişkilendiren sahte haberlerin sosyal ağlarda yayılmasından sonra Facebook'a dava açtı . Facebook daha sonra gönderileri kaldırdı, ancak hasar çoktan verildi.
İçerik keşif platformları ve sosyal medya siteleri, bu tür sorunlar devam ederse dava açma tehlikesiyle karşı karşıya kalabilir. Bu durum, bu tür haberlerin yayıldığı içerik keşif platformlarının itibarını da etkileyerek kullanıcı etkileşiminin azalmasına neden olur. Tüm bu yansımalarla birlikte, sahte haberler, tomurcuk halinde kesilmesi gereken büyük bir sorundur.
AI yardımcı olabilir mi?
Sahte haberleri tespit etmek ve bunlarla mücadele etmek zorlu bir iştir, buna hiç şüphe yok. Gerçekliklerini değerlendirmek için içerik keşif platformlarında paylaşılan her gönderiyi gözden geçirmek için insanları istihdam etmek kesinlikle uygun bir çözüm değil. Memnuniyetle, artık tüm zor işi insanların yapması gereken bir çağda yaşamıyoruz.
Yapay zeka, bir zamanlar olduğu bilim kurgu kavramından çok yol kat etti. Artık güçlü ses, görüntü ve örüntü tanıma algoritmalarına ve bunları çalıştıracak bilgi işlem gücüne sahibiz.

Yapay zeka ve makine öğrenimi kullanarak sahte haberlerle mücadele etmek, bu sorunun derinliğini göz önünde bulundurmanın yolu olacaktır. Makinelerin sahte haberleri tespit etmesini sağlamak için öncelikle sahte haber gönderilerinin ortak özelliklerini belirlememiz gerekecek. Bunun nasıl başarılabileceğine bir bakalım.
Web sitesi itibarı
Bir web sitesinin itibarı, üzerinde yayınlanan bir makalenin gerçekliğini değerlendirmek için kullanılabilecek kilit göstergelerden biridir. Arama motoru devi Google, web sayfalarını SERP'lerinde itibarlarına göre sıralamada harika bir iş çıkarıyor. Sahte haberleri tespit etmek için Google'ın tescilli algoritmasını kullanamayacak olsak da, bir web sayfasını kendi sahte haber tespit sistemimizde sıralamak için diğer birçok web sitesinin DA, Alexa sıralaması ve alan yaşı gibi sıralama sinyallerini kullanabiliriz. Alexa sıralaması yüksek olan eski sitelerin güvenilir kaynaklar olma olasılığı daha yüksekken, tersi sığ bir web sitesini gösterebilir.
Doğal dil işleme
Doğal Dil İşleme, en basit tanımıyla, bir makinenin insan dilini gerçekten anlaması ve onu bir insanla aynı şekilde işlemesi yeteneğidir. NLP motorları, metin corpora ile makine öğrenme algoritmalarını besleyerek oluşturulur. Sahte haberleri gerçekten tespit etmek için, makinelerin tıpkı bizim yaptığımız gibi insan dillerini yorumlayabilmesi gerekir. Sahte haber tespiti söz konusu olduğunda, NLP motorunun hem orijinal makalelere hem de sahte makalelere ait büyük miktarda metin verisi ile beslenmesi gerekir. Oradan, sahte haber kodu kırılabilir ve bu da esasen makinelerin sahte haberleri iyi bir doğrulukla algılamasını sağlar. Algoritmanın sahte haber gönderilerini tespit etmek için kullanabileceği iki şey var.
a) İç tutarlılık
Sahte veya yanıltıcı makaleler genellikle gönderinin farklı bölümleri arasında büyük bir tutarsızlık içerir; başlık, gövde metni, snippet vb. söyleyin. Bir makalede sunulan gerçeklerin baştan sona tutarlı mı yoksa çelişkili mi olduğunu taramak ve değerlendirmek için bir NLP sistemi kullanılabilir.
b) Sansasyonel kelimeleri arayın
Aşırı sansasyonel makaleler genellikle sahte olma eğilimindedir. Haberde sansasyonel kelimelerin kullanımından haberin sansasyonel yönünü tanımlamak için doğal bir dil işleme sistemi kullanılabilir.
Web kazımanın rolü
Sahte haberleri tespit edebilen bir yapay zeka motoru, açıkçası, makine öğrenimi algoritmasının eğitimine girecek büyük miktarda veri gerektirecektir. Verimli web kazıma için kullanılabilecek gelişmiş teknolojiler olduğu düşünüldüğünde, web'den veri çıkarmak bir sorun olmamalıdır. Bununla birlikte, sahte haberleri tespit etmek başlı başına bir zorluk olduğundan, medya kuruluşlarından (hem gerçek hem de sahte) verileri almak için PromptCloud gibi bir hizmet olarak veri (DaaS) çözümü kullanılması önerilir. Veri çıkarma sürecinin uçtan uca sorumluluğunu üstlendiğimiz için, web kazıma ile ilgili karmaşıklıkları atlayabilir ve kullanıma hazır verileri, kurum içi kazıma işlemine kıyasla önemli ölçüde daha düşük bir maliyetle alabilirsiniz.
Manuel katman ekleme
Bir makine ipuçlarını tespit edip sahte olduğunu düşündüğü gönderileri işaretledikçe, bulguları doğrulamak için küçük bir insan katmanı kullanılabilir. Tüm ağır işler zaten AI sistemi tarafından yapıldığı için bu kolay olacak. Manuel katman yerinde olduğunda, sistem sahte haberleri çok yüksek doğrulukla tespit edecek kadar güçlü olacaktır. İçerik keşif platformları ve sosyal medya siteleri için, sahte haberleri ayıklama yeteneğine sahip olmak, zaman geçtikçe kullanıcıları meşgul etmek ve kullanıcılar bu tür platformlarda yayılan haberlere olan güvenini kaybetmek için çok önemli olacaktır. Bu bağlamda yapay zeka ve web veri çıkarma potansiyeli çok büyüktür ve bu kötülükle en kısa sürede mücadele etmek için kullanılmalıdır.
