Bagaimana Platform Penemuan Konten Dapat Melawan Berita Palsu melalui Pengikisan Web dan AI

Diterbitkan: 2017-06-20
Daftar Isi menunjukkan
Seberapa besar masalahnya?
Bisakah AI membantu?
Peran pengikisan web
Menambahkan lapisan manual

Lewatlah sudah hari-hari ketika orang harus bergantung pada media tradisional untuk berita; sekarang mereka dibombardir dengan berita oleh sejumlah besar outlet media online di internet. Sedemikian rupa sehingga informasi yang berlebihan bagi rata-rata orang yang memiliki waktu terbatas untuk mengejar berita dan cerita. Media sosial kini berperan sebagai media berita dan bahkan membuat pengalaman pengguna menjadi lebih baik dengan menyesuaikan feed agar sesuai dengan kebiasaan membaca mereka. Namun, proliferasi besar-besaran media sosial dan penerbitan web ini memiliki kelemahannya sendiri.

Pengikisan web data berita palsu

Ketersediaan luas sistem manajemen konten yang mudah digunakan seperti WordPress telah memudahkan siapa saja untuk menjadi penerbit web. Ini berarti, secara harfiah siapa pun dapat menulis dan menerbitkan apa pun – tanpa pertanyaan. Memang benar bahwa ini telah membuka berbagai kemungkinan untuk jaringan penerbitan konten dan blogger. Namun, seperti halnya semua hal yang kuat, ketersediaan teknologi penerbitan yang siap pakai disalahgunakan oleh kelompok besar untuk menyebarkan berita palsu dengan motif yang mengerikan. Berita palsu adalah masalah yang lebih besar daripada yang terlihat di permukaan. Ini memiliki potensi untuk mendatangkan malapetaka di masyarakat dan bahkan mempengaruhi bisnis dan perusahaan lainnya secara negatif.

Seberapa besar masalahnya?

Proliferasi berita palsu dikatakan telah meningkatkan skala yang mendukung Donald Trump dalam pemilihan presiden Amerika baru-baru ini. Terlepas dari kebenaran tentang tuduhan tersebut, berita palsu tidak diragukan lagi dapat memengaruhi opini massa dengan cara yang tidak sehat, titik. Penyebaran berita palsu dapat menciptakan ketidakpercayaan di masyarakat, yang merupakan racun lambat yang dapat bertindak sebagai akar penyebab banyak kejahatan sosial lainnya. Misalnya, berita palsu dapat mempromosikan kekerasan komunal dan menciptakan suasana yang meresahkan dalam kehidupan masyarakat.

Ada topik-topik tertentu yang bisa dengan mudah diwujudkan sebagai berita palsu; penyalahgunaan kekuasaan, ketakutan akan keterasingan, pertanyaan tentang perang dan perdamaian, dll. dapat dengan mudah menyebar seperti api, menyebabkan kerusakan yang tidak dapat diperbaiki.

Ada beberapa contoh bisnis yang menjalankan kampanye kotor untuk menjatuhkan pesaing mereka dengan menyebarkan desas-desus palsu tentang perusahaan dengan target untuk memastikan perusahaan yang terkena dampak akan kehilangan pelanggan.

Baru-baru ini seorang pengungsi Suriah menggugat Facebook setelah berita palsu yang menghubungkannya dengan terorisme menyebar di jejaring sosial. Facebook kemudian menghapus posting tersebut, tetapi kerusakan sudah terjadi.

Platform penemuan konten dan situs media sosial sendiri dapat berada dalam bahaya tuntutan hukum jika masalah seperti itu terus terjadi. Ini juga akan memengaruhi reputasi platform penemuan konten tempat berita tersebut menyebar, yang menyebabkan penurunan keterlibatan pengguna. Dengan semua dampak ini, berita palsu adalah masalah besar yang perlu dihentikan sejak awal.

Bisakah AI membantu?

Mendeteksi dan memerangi berita palsu adalah tugas yang menantang, tidak diragukan lagi. Ini tentu bukan solusi yang layak untuk mempekerjakan manusia untuk melalui setiap posting yang dibagikan di platform penemuan konten untuk mengevaluasi keasliannya. Untungnya, kita tidak lagi hidup di era di mana manusia harus melakukan semua kerja keras.

Kecerdasan buatan telah berkembang jauh dari konsep fiksi ilmiah yang dulu. Kami sekarang memiliki algoritma pengenalan suara, gambar dan pola yang kuat dan kekuatan komputasi untuk menjalankannya.

Memerangi berita palsu menggunakan kecerdasan buatan dan pembelajaran mesin akan menjadi cara yang harus dilakukan mengingat kedalaman masalah ini. Untuk mengaktifkan mesin untuk mendeteksi berita palsu, pertama-tama kita harus mengidentifikasi karakteristik umum dari posting berita palsu. Mari kita lihat bagaimana ini bisa dicapai.

Reputasi situs web

Reputasi situs web adalah salah satu petunjuk utama yang dapat digunakan untuk mengevaluasi keaslian artikel yang diterbitkan di dalamnya. Google, raksasa mesin telusur melakukan pekerjaan yang bagus dalam memeringkat halaman web di SERP mereka sehubungan dengan reputasi mereka. Meskipun kami tidak akan dapat menggunakan algoritme milik Google untuk mendeteksi berita palsu, kami dapat menggunakan banyak sinyal peringkat situs web lain seperti DA, peringkat Alexa, dan usia domain untuk menentukan peringkat halaman web dalam sistem deteksi berita palsu kami sendiri. Situs lama dengan peringkat Alexa tinggi lebih cenderung menjadi sumber tepercaya sementara sebaliknya mungkin menunjukkan situs web yang dangkal.

Pemrosesan bahasa alami

Pemrosesan Bahasa Alami, dalam definisi yang paling sederhana, adalah kemampuan mesin untuk benar-benar memahami bahasa manusia dan memprosesnya dengan cara yang sama seperti yang dilakukan manusia. Mesin NLP dibangun dengan memberi makan algoritma pembelajaran mesin dengan corpora teks. Untuk benar-benar mendeteksi berita palsu, mesin harus mampu menafsirkan bahasa manusia seperti yang kita lakukan. Ketika datang ke deteksi berita palsu, mesin NLP harus diisi dengan sejumlah besar data teks milik artikel asli dan juga yang palsu. Dari sana, kode berita palsu dapat dipecahkan yang pada dasarnya akan memungkinkan mesin mendeteksi berita palsu dengan akurasi yang layak. Berikut adalah dua hal yang dapat digunakan algoritme untuk menemukan postingan berita palsu.

a) Konsistensi internal

Artikel palsu atau menyesatkan sering kali memiliki banyak ketidakkonsistenan di antara berbagai bagian postingan itu sendiri; katakanlah judul, teks isi, cuplikan, dll. Sistem NLP dapat digunakan untuk memindai dan mengevaluasi apakah fakta-fakta yang diwakili dalam sebuah artikel konsisten atau bertentangan.

b) Carilah kata-kata sensasional

Artikel yang terlalu sensasional seringkali cenderung palsu. Sistem pemrosesan bahasa alami dapat digunakan untuk mendefinisikan aspek sensasional artikel dari penggunaan kata-kata sensasional dalam artikel berita.

Peran pengikisan web

Mesin kecerdasan buatan yang dapat mendeteksi berita palsu jelas akan membutuhkan sejumlah besar data yang akan digunakan untuk pelatihan algoritma pembelajaran mesin. Mengekstrak data dari web seharusnya tidak menjadi masalah mengingat ada teknologi canggih yang dapat digunakan untuk pengikisan web yang efisien. Namun, karena mendeteksi berita palsu merupakan tantangan tersendiri, disarankan untuk menggunakan solusi data sebagai layanan (DaaS) seperti PromptCloud untuk memperoleh data dari outlet media (baik asli maupun palsu). Karena kami bertanggung jawab dari ujung ke ujung proses ekstraksi data, Anda dapat melewati kerumitan yang terkait dengan pengikisan web dan mendapatkan data siap pakai dengan biaya yang jauh lebih rendah dibandingkan pengikisan internal.

Menambahkan lapisan manual

Saat mesin mengidentifikasi isyarat dan menandai pos yang dianggap palsu, lapisan manusia kecil dapat digunakan untuk memvalidasi temuan. Ini akan menjadi mudah sekarang karena semua pekerjaan berat telah dilakukan oleh sistem AI. Dengan adanya lapisan manual, sistem akan cukup kuat untuk mendeteksi berita palsu dengan akurasi yang sangat tinggi. Untuk platform penemuan konten dan situs media sosial, memiliki kemampuan untuk menyingkirkan berita palsu akan terbukti penting untuk membuat pengguna tetap terlibat seiring berjalannya waktu dan pengguna kehilangan kepercayaan pada berita yang menyebar di platform tersebut. Potensi AI dan ekstraksi data web dalam hal ini sangat besar dan harus dimanfaatkan untuk memerangi kejahatan ini sedini mungkin.