كيف يمكن لمنصات اكتشاف المحتوى محاربة الأخبار الزائفة عبر تجريف الويب والذكاء الاصطناعي

نشرت: 2017-06-20
عرض جدول المحتويات
ما هو حجم المشكلة؟
هل يمكن للذكاء الاصطناعي المساعدة؟
دور تجريف الويب
إضافة طبقة يدوية

لقد ولت الأيام التي كان على الناس فيها الاعتماد على وسائل الإعلام التقليدية للحصول على الأخبار ؛ الآن يتم قصفهم بالأخبار من قبل عدد هائل من وسائل الإعلام عبر الإنترنت على الإنترنت. لدرجة أنه يمثل عبئًا زائدًا من المعلومات بالنسبة للشخص العادي الذي لديه وقت محدود لمتابعة الأخبار والقصص. تعمل وسائل التواصل الاجتماعي الآن كوسيلة للأخبار ، بل إنها تجعل التجربة أفضل للمستخدمين من خلال تخصيص الخلاصة لتناسب عادات القراءة لديهم. ومع ذلك ، فإن هذا الانتشار الهائل لوسائل التواصل الاجتماعي والنشر على شبكة الإنترنت له سلبيات خاصة به.

كشط البيانات الإخبارية الوهمية على شبكة الإنترنت

إن التوافر الواسع لأنظمة إدارة المحتوى سهلة الاستخدام مثل WordPress جعل من السهل على أي شخص أن يكون ناشرًا على الويب. هذا يعني أنه يمكن لأي شخص كتابة ونشر أي شيء حرفيًا - دون طرح أي أسئلة. صحيح أن هذا قد فتح مجالًا واسعًا من الاحتمالات لشبكات نشر المحتوى والمدونين. ومع ذلك ، كما هو الحال مع جميع الأشياء القوية ، فإن التوافر الجاهز لتكنولوجيا النشر يتم إساءة استخدامه من قبل مجموعة كبيرة لنشر أخبار مزيفة بدوافع شنيعة. الأخبار المزيفة هي مشكلة أكبر مما يبدو على السطح. لديه القدرة على إحداث الخراب في المجتمع والتأثير حتى على الأعمال التجارية والمؤسسات الأخرى بشكل سلبي.

ما هو حجم المشكلة؟

يقال إن انتشار الأخبار الكاذبة قد قلب الموازين لصالح دونالد ترامب في الانتخابات الرئاسية الأمريكية الأخيرة. بغض النظر عن حقيقة المزاعم ، يمكن للأخبار المزيفة بلا شك أن تؤثر على الرأي العام بطريقة غير صحية. يمكن أن يؤدي انتشار الأخبار المزيفة إلى عدم الثقة في المجتمع ، وهو سم بطيء يمكن أن يكون بمثابة السبب الجذري للعديد من الشرور الاجتماعية الأخرى. على سبيل المثال ، يمكن للأخبار الكاذبة أن تعزز العنف الطائفي وتخلق جوًا مزعجًا في حياة الناس.

هناك موضوعات معينة يمكن أن تتجسد بسهولة كأخبار مزيفة ؛ إساءة استخدام السلطة ، والخوف من الاغتراب ، ومسائل الحرب والسلام ، وما إلى ذلك ، يمكن أن تنتشر بسهولة كالنار في الهشيم ، مسببة أضرارًا لا يمكن إصلاحها.

كانت هناك حالات من الشركات التي تدير حملات تشهير لإسقاط منافسيها من خلال نشر شائعات كاذبة حول الشركة بهدف ضمان خسارة الشركة المتضررة للعملاء.

في الآونة الأخيرة ، رفع لاجئ سوري دعوى قضائية ضد فيسبوك بعد انتشار قصص إخبارية مزيفة تربطه بالإرهاب على مواقع التواصل الاجتماعي. حذف Facebook المنشورات لاحقًا ، لكن الضرر كان قد حدث بالفعل.

يمكن أن تتعرض منصات اكتشاف المحتوى ومواقع التواصل الاجتماعي نفسها لخطر الدعاوى القضائية إذا استمرت هذه المشكلات في الحدوث. قد يؤثر ذلك أيضًا على سمعة منصات اكتشاف المحتوى حيث تنتشر مثل هذه الأخبار ، مما يؤدي إلى انخفاض مشاركة المستخدم. مع كل هذه التداعيات ، فإن الأخبار المزيفة هي مشكلة كبيرة يجب القضاء عليها في مهدها.

هل يمكن للذكاء الاصطناعي المساعدة؟

إن الكشف عن الأخبار المزيفة ومكافحتها مهمة صعبة ، ولا شك في ذلك. من المؤكد أنه ليس حلاً قابلاً للتطبيق لتوظيف البشر لتصفح كل منشور يتم مشاركته على منصات اكتشاف المحتوى لتقييم مصداقيتها. بكل سرور ، لم نعد نعيش في عصر يحتاج فيه البشر إلى القيام بكل العمل الشاق.

لقد قطع الذكاء الاصطناعي شوطًا طويلاً من مفهوم الخيال العلمي الذي كان عليه من قبل. لدينا الآن خوارزميات قوية للصوت والصورة والتعرف على الأنماط والقدرة الحاسوبية لتشغيلها.

ستكون مكافحة الأخبار المزيفة باستخدام الذكاء الاصطناعي والتعلم الآلي هي الطريقة المثلى للنظر في عمق هذه المشكلة. لتمكين الأجهزة من اكتشاف الأخبار المزيفة ، سيتعين علينا أولاً تحديد الخصائص المشتركة لمنشورات الأخبار المزيفة. دعونا نرى كيف يمكن تحقيق ذلك.

سمعة الموقع

تعد سمعة موقع الويب أحد المؤشرات الرئيسية التي يمكن استخدامها لتقييم مصداقية المقالة المنشورة عليه. يقوم Google ، عملاق محرك البحث ، بعمل رائع في ترتيب صفحات الويب على SERPs فيما يتعلق بسمعتها. على الرغم من أننا لن نتمكن من استخدام خوارزمية مملوكة لشركة Google للكشف عن الأخبار المزيفة ، إلا أنه يمكننا استخدام العديد من إشارات ترتيب مواقع الويب الأخرى مثل DA وترتيب Alexa وعمر المجال لتصنيف صفحة ويب في نظام الكشف عن الأخبار المزيفة الخاص بنا. من المرجح أن تكون المواقع القديمة ذات الترتيب المرتفع في Alexa مصادر موثوقة بينما قد يشير العكس إلى موقع ويب ضحل.

معالجة اللغة الطبيعية

معالجة اللغة الطبيعية ، في أبسط تعريف لها ، هي قدرة الآلة على فهم اللغة البشرية حقًا ومعالجتها بنفس الطريقة التي يقوم بها الإنسان. تم تصميم محركات البرمجة اللغوية العصبية من خلال تغذية خوارزميات التعلم الآلي بالنصوص الجماعية. لاكتشاف الأخبار الزائفة حقًا ، يجب أن تكون الآلات قادرة على تفسير اللغات البشرية تمامًا كما نفعل نحن. عندما يتعلق الأمر باكتشاف الأخبار المزيفة ، يجب تغذية محرك البرمجة اللغوية العصبية بكميات هائلة من البيانات النصية التي تنتمي إلى مقالات أصلية بالإضافة إلى المقالات المزيفة. من هناك ، يمكن اختراق شفرة الأخبار المزيفة والتي ستمكن الأجهزة بشكل أساسي من اكتشاف الأخبار المزيفة بدقة مناسبة. إليك شيئان يمكن أن تستخدمهما الخوارزمية لاكتشاف منشورات الأخبار الوهمية.

أ) الاتساق الداخلي

غالبًا ما تحتوي المقالات المزيفة أو المضللة على قدر كبير من التناقض بين أجزاء مختلفة من المنشور نفسه ؛ قل العنوان والنص الأساسي والمقتطف وما إلى ذلك. يمكن استخدام نظام البرمجة اللغوية العصبية لمسح وتقييم ما إذا كانت الحقائق المقدمة في مقالة متسقة أو متضاربة.

ب) ابحث عن الكلمات المثيرة

غالبًا ما تكون المقالات ذات الإثارة المفرطة مزيفة. يمكن استخدام نظام معالجة اللغة الطبيعية لتحديد الجانب المثير للمقالة من استخدام الكلمات المثيرة في المقالة الإخبارية.

دور تجريف الويب

من الواضح أن محرك الذكاء الاصطناعي الذي يمكنه اكتشاف الأخبار المزيفة سيتطلب كميات هائلة من البيانات التي ستستخدم في تدريب خوارزمية التعلم الآلي. لا ينبغي أن يكون استخراج البيانات من الويب مشكلة نظرًا لوجود تقنيات متقدمة يمكن استخدامها لكشط الويب بكفاءة. ومع ذلك ، نظرًا لأن اكتشاف الأخبار المزيفة يمثل تحديًا في حد ذاته ، فمن المستحسن استخدام البيانات كحل خدمة (DaaS) مثل PromptCloud للحصول على البيانات من وسائل الإعلام (الحقيقية والمزيفة). نظرًا لأننا نتحمل المسؤولية النهائية عن عملية استخراج البيانات ، يمكنك تخطي التعقيدات المرتبطة بكشط الويب والحصول على بيانات جاهزة للاستخدام بتكلفة أقل بكثير مقارنة بالتجريف الداخلي.

إضافة طبقة يدوية

نظرًا لأن الآلة تحدد الإشارات وتضع علامات على المشاركات التي تعتقد أنها مزيفة ، يمكن استخدام طبقة بشرية صغيرة للتحقق من صحة النتائج. سيكون هذا سهلاً الآن بعد أن تم بالفعل تنفيذ كل الرفع الثقيل بواسطة نظام AI. مع وجود الطبقة اليدوية في مكانها ، سيكون النظام قويًا بما يكفي لاكتشاف الأخبار المزيفة بدقة عالية جدًا. بالنسبة لمنصات اكتشاف المحتوى ومواقع التواصل الاجتماعي ، فإن القدرة على التخلص من الأخبار المزيفة ستكون ضرورية للحفاظ على تفاعل المستخدمين مع مرور الوقت ويفقد المستخدمون الثقة في الأخبار التي تنتشر على هذه المنصات. إن إمكانات الذكاء الاصطناعي واستخراج بيانات الويب في هذا الصدد هائلة ويجب استخدامها لمكافحة هذا الشر في أقرب وقت ممكن.