A Hybrid Whale Optimization and Stacking Ensemble Model for Arabic Fake News Detection

يُشكل الانتشار السريع للأخبار الكاذبة على منصات التواصل الاجتماعي مثل تويتر تحديًا كبيرًا، وخاصةً للمحتوى العربي، نظرًا للتعقيدات اللغوية للغة، وندرة مجموعات البيانات الموثوقة. تهدف هذه الأطروحة إلى معالجة هذه المشكلة من خلال تطوير نموذج هجين عالي الدقة والكفاءة للكشف عن الأخبار الكاذبة في التغريدات العربية. تستفيد المنهجية المقترحة من مجموعة بيانات VERA-ARAB واسعة النطاق والموثقة لأكثر من 20000 تغريدة، وتجمع خوارزمية تحسين الحوت (WOA) لاختيار الميزات مع نماذج تعلم المجموعة المختلفة. بعد معالجة البيانات مسبقًا واستخراج الميزات باستخدام تقنيات مثل TF-IDF، تُطبق خوارزمية تحسين الحوت (WOA) لاختيار الميزات الأكثر تأثيرًا. ثم تُدخل هذه الميزات المُحسّنة في نماذج المجموعة، بما في ذلك التكديس والتصويت والتعبئة، والتي تجمع بين المصنفات الأساسية مثل آلات المتجهات الداعمة (SVMs) والغابات العشوائية (RFs) والانحدار اللوجستي (LRs). تُظهر النتائج التجريبية تفوق هذا النهج الهجين، محققًا دقة قصوى بلغت 94.56% مع نموذج الانحدار اللوجستي (LR) باستخدام خصائص "حقيبة الكلمات" (BoW) المُحسّنة باستخدام تحليل الكلمات بينما الدراسات السابقه حصلت على اعلى دقه 92.13 %. وتخلص الدراسة إلى أن هذا الإطار المتكامل يُمثل حلاً قويًا وفعالًا لتعزيز دقة كشف الأخبار الكاذبة باللغة العربية.