استخدام تجريف الويب للصحافة الاستقصائية
نشرت: 2016-09-09كأداة قيمة لتوليد البيانات والرؤى ، أضاف تجريف الويب قيمة هائلة للعديد من الشركات عبر قطاعات الصناعة المختلفة. من الرعاية الصحية إلى السيارات ، وعلوم الحياة إلى الوكالات الحكومية ، لا يوجد عمودي لم يمس من تأثير وتأثير تجريف الويب. ومع ذلك ، من المثير للاهتمام ملاحظة الطريقة التي يتم بها استخدام تجريف الويب واستخراج البيانات لأشكال أحدث من التطبيقات. أحد هذه الطرق المثيرة لتطبيق الأساليب العلمية لاستخراج البيانات هو مجال الصحافة الاستقصائية.
ما هي الصحافة الاستقصائية؟
الصحافة الاستقصائية جزء أساسي من تقارير الحقائق. إنه المجال الذي سيحقق فيه الصحفي بعمق في موضوع واحد ، خاصة تلك المتعلقة بالقانون والنظام أو الأنشطة ذات الطبيعة الإجرامية. الأمر الرائع الذي يجب ملاحظته هو مقدار الجهود والوقت الذي سيقضيه الصحفي في هذا الموضوع الفردي. قد يستغرق التحقيق أسابيع أو شهورًا أو حتى سنوات لتحقيق النتيجة المرجوة ، بعد البحث وإعداد تقرير تحقيق مفصل.

يعد البحث جانبًا حاسمًا في الصحافة الاستقصائية ، وهنا يساعد التنقيب عن البيانات عالية الجودة على تحسين الجودة الشاملة للتقرير النهائي. نظرًا لأن معظم البيانات المراد البحث عنها مخفية أو غير مرئية للعيان ، فإن الأمر يتطلب من الصحفي بذل الكثير من الجهد لتقشير طبقة تلو الأخرى لما يتم توفيره له / لها للكشف عن الحقائق الصحيحة. على الرغم من توفر قدر كبير من البيانات من خلال البيانات الصحفية والتعليقات والمؤتمرات الصحفية وإعلانات الشركات ، فإن الصحفي الاستقصائي الأزرق الحقيقي لن يعتمد فقط على هذه الحقائق. سيبحث عن الحقائق المظلمة المخبأة وراء الصورة الوردية التي يتم تقديمها لعامة الناس. سيستخدم التنقيب في البيانات لإنجاز هذه المهمة الصعبة.
هذا هو بالضبط العمود الفقري لصحافة البيانات - أي تعزيز الصحافة الاستقصائية بمساعدة البيانات.
ما هي صحافة البيانات؟
تمت صياغة مصطلح الصحافة القائمة على البيانات في عام 2009. ومع ذلك ، فإن تطبيقه العملي هو الشيخوخة مثل مفهوم البيانات نفسها. تجد صعوبة في تصديق؟ يُظهر التقرير المتعلق بظروف زمن الحرب التي كان على القوات البريطانية أن تواجهها في عام 1858 مدى جمال نسج القصة حول الحقائق والبيانات لتقديم تصور مقنع يستدعي تحركًا سريعًا من القادة. ونعم - التقرير عمره أكثر من 150 سنة!
لتعريف صحافة البيانات ، إنها الممارسة الصحفية المستخدمة في عصر انفجار البيانات اليوم. ترى الممارسة أن الصحفي يحلل البيانات ويولد رؤى من مجموعات البيانات الضخمة. تتمثل نتيجة هذه الممارسة في المساعدة في إنشاء قصة إخبارية مليئة بالحقائق تعتمد على البيانات بدلاً من الإشاعات. قد تسأل لماذا تكتسب هذه الممارسة الكثير من القوة في الآونة الأخيرة أثناء إنشاء قصة إخبارية منذ عقود. الجواب بسيط - يشهد عصر اليوم إنشاء الكثير من البيانات وتخزينها وتنظيمها واستهلاكها. تشمل المكونات الرئيسية التي دفعت صحافة البيانات
- توافر أدوات مفتوحة المصدر تعمل على خفض تكلفة تحليل البيانات المستندة إلى الكمبيوتر وتوليد الرؤى
- الوصول المفتوح إلى البيانات والمحتوى المنشور الذي ساعد في إزالة القيود المفروضة على الوصول (مثل رسوم الوصول أو رسوم الاشتراك) أو على استخدامها (مثل قيود حقوق النشر والتراخيص)
- مفهوم البيانات المفتوحة التي تجعل معظم البيانات متاحة مجانًا على قنوات مثل الإنترنت والمنشورات التجارية أو الحكومية.
تعني سهولة الوصول إلى البيانات المفتوحة أن صحافة البيانات لا يجب أن تقتصر على علماء البيانات المحترفين. يمكن لأي شخص لديه معرفة بجداول البيانات أن يقوم بعمل صحافة استقصائية لكشف الحقائق المخفية. ومع ذلك ، هذا يعني أيضًا أن الممارسة يجب أن يكون لها عملية محددة جيدًا بحيث لا يؤدي الانتشار الواسع للمستخدمين إلى إضعاف فعالية الصحافة الاستقصائية.
صحافة البيانات - الخطوات الأساسية
كما نوقش أعلاه ، يجب أن تكون صحافة البيانات عملية مدروسة جيدًا تتضمن خطوات أساسية ضرورية لتنفيذ العملية. على مستوى أساسي للغاية ، ينص سير العمل على أنه يجب أولاً الحصول على المعلومات أو العثور عليها (أو جعلها منطقية بعد العثور عليها). قد يتضمن ذلك استخدام أدوات مثل SQL. يجب بعد ذلك تحليلها (قد يتطلب ذلك الحصول على المصطلحات والمصطلحات الفنية الصحيحة). بعد ذلك ، يجب تصور البيانات لتقديم المعلومات التي تم جمعها في تنسيق تصويري لتعزيز هضم البيانات بشكل أفضل. بمجرد أن يصبح هذا جاهزًا ، يمكن تنزيله إلى الجمهور المطلوب أو أصحاب المصلحة. هذه هي المرحلة الأخيرة حيث يتم تقديم الحقائق والتقارير والاتجاهات إلى جمهور أكبر في شكل قصة إخبارية.
صدرت الدراسة الأكثر شهرة حول سير عمل صحافة البيانات في عام 2011 من قبل بول برادشو . حددت ست مراحل مختلفة في إطار "هرم مقلوب من صحافة البيانات". لنلقِ نظرة على سير عمل نموذجي يتضمن صحافة البيانات في هذا الهرم المقلوب:

- البحث: تحديد مصادر المعلومات أو البيانات عبر الإنترنت
- نظيف: أضف عوامل تصفية ومنطق لتحويل البيانات
- تصور: تُظهر البيانات المحولة النتائج في شكل استدلال أو اتجاهات أو إحصائيات أو أنماط ، في شكل مرئي ثابت أو متحرك
- نشر: ضم العناصر المرئية معًا لنسج قصة مقنعة
- التوزيع: مشاركة القصة على قنوات التوزيع المختلفة مثل الإنترنت أو وسائل التواصل الاجتماعي أو الهواتف الذكية أو الأجهزة اللوحية
- القياس: راقب استهلاك المحتوى لعرض الاتجاهات ونوع المستخدمين الذين يقرؤونه.
سنستكشف الآن هذه الخطوات بتفاصيل أفضل
العثور على البيانات - جمع البيانات هو الخطوة الأولى نحو الصحافة الاستقصائية. هناك العديد من الطرق للعثور على البيانات ، بدءًا من القيام برحلات ميدانية إلى اكتشاف السبب الفعلي لارتكاب مخالفات جنائية إلى دراسة تأثير مشكلة طويلة الأجل. للعثور على البيانات ، ستحتاج أولاً إلى تحديد المصادر الصحيحة. إذا كان شخص ما قد نشر بالفعل حول مشكلة مستمرة تصادف أنك تحقق فيها ، فمن المنطقي جعل البحث الثانوي كنقطة انطلاق. ومع ذلك ، إذا كنت تبحث عن شيء حساس ، فقد تحتاج إلى تجاوز العنب والشائعات وإجراء بحث محايد وغير متحيز للعثور على البيانات.
خذ على سبيل المثال العمل الصحفي الاستقصائي المثير للجدل الذي قامت به شركة "NH" معينة في عام 1821 (نعم ، منذ ما يقرب من 200 عام!). وأظهر قائمة بالطلاب المسجلين في مدارس في مانشستر وسالفورد والرسوم التي دفعوها. باستخدام القشط اليدوي ، حاول صحفي البيانات معرفة عدد الذين يتلقون تعليمًا مجانيًا. وبينما أظهر ما يقرب من 25000 طالب يتلقون تعليمًا مجانيًا ، فإن السجلات الرسمية قدرت العدد بـ 8000 فقط. وقد كشف هذا عن خلل هائل في الإحصاءات الرسمية التي جمعها رجال الدين (كتبة إدخال البيانات القديمة). كانت هذه حالة كلاسيكية للعثور على البيانات التي أدت إلى اتخاذ إجراء.
تنظيف البيانات - عادةً ما تكون البيانات من مصادر مختلفة بتنسيقات مختلفة. هذا يحتاج إلى التنظيف والتطبيع لسهولة التحليل في المستقبل. على سبيل المثال ، أثناء القيام باستخراج البيانات الخاصة بالوزن بين الأطفال البدينين ، ستكون البيانات الأمريكية بالكيلوجرام ، بينما ستكون بيانات المملكة المتحدة بالجنيه الاسترليني. لسهولة التحليل ، يجب تنظيفها وجعلها متسقة مع وحدة قياس واحدة.
تصور البيانات - هذا رابط مهم حيث تنتقل البيانات من مجرد أرقام إلى تمثيل مرئي يمكن أن يؤدي إلى استنتاجات سريعة. بمجرد وضع البيانات في جداول بيانات بتنسيق ذي معنى ، يتم تمريرها من خلال أدوات تصور البيانات مثل OpenRefine و Tableau Public. فيما يلي قائمة بأدوات تصور البيانات المجانية المتاحة لك.
النشر - باستخدام نظام إدارة المحتوى ، يتم نشر التصور بشكل استراتيجي ، بناءً على عدد القراء المتوقعين.
توزيع البيانات - توفر أسواق المحتوى المتخصصة إمكانية الوصول إلى هذا التصور الاستقصائي. من خلال هذه القناة ، يمكن للآخرين التقاط قصص البيانات والقيام بخط التحقيق الخاص بهم.
تقييم تأثير الصحافة الاستقصائية - الهدف الكامل من إجراء صحافة استقصائية متعمقة هو خلق تأثير عميق. وكيف تعرف ما إذا كانت قصتك لها تأثير؟ بالطبع ، من خلال الأدوات التي تم إنشاؤها خصيصًا لمراقبة تأثير قصص البيانات.
لخروج التسجيل
تشير العديد من دراسات الحالة إلى التأثير الهائل الذي تدفعه الصحافة الاستقصائية باستخدام استخراج البيانات. وأكثرها شهرة هو نشر ويكيليكس لبيانات الوكالات الحكومية السرية. إن الطريقة التي أثرت بها على السياسات العامة والرفاهية على أعلى مستوى في بلدان مثل الولايات المتحدة تتحدث عن قدر كبير من التأثير العميق للصحافة الاستقصائية.
اليوم لم يعد من الكافي جمع البيانات واستخلاص البصيرة. يجب أن تكون البصيرة مدعومة بتصور إبداعي ، ولكن الأهم من ذلك ، يجب أن تكون مدعومة بقصة قوية تم إنشاؤها لدعم وجهة نظرك. يُنظر إلى صحافة البيانات ، بمساعدة تجريف البيانات ، بشكل متزايد على أنها أداة رئيسية لتوليد الرؤى وأصبحت أداة مساعدة موثوقة لتصور البيانات وتقارير الأخبار المدعومة بالبيانات.
ترقبوا مقالتنا التالية حول تسعير منتجاتك بشكل صحيح.
هل تخطط للحصول على بيانات من الويب؟ نحن هنا للمساعدة. دعنا نعرف عن متطلباتك.
