عنوان الإطروحه |
A Hybrid Whale Optimization and Stacking Ensemble Model for Arabic Fake News Detection
|
تاريخ مناقشة الاطروحه |
2025-10-30 |
اسم الطالب |
صفاء محمد سرحان الحسبان
|
المشرف |
نجاح مثقال علي الشنابله |
|
المشرف المشارك |
|
اعضاء لجنة المناقشة |
| مازن سالم حمد الزيود |
| يوسف كيلاني |
|
الكلية |
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات |
القسم |
علم الحاسوب |
الملخص بالعربية |
يُشكل الانتشار السريع للأخبار الكاذبة على منصات التواصل الاجتماعي مثل تويتر تحديًا كبيرًا، وخاصةً للمحتوى العربي، نظرًا للتعقيدات اللغوية للغة، وندرة مجموعات البيانات الموثوقة. تهدف هذه الأطروحة إلى معالجة هذه المشكلة من خلال تطوير نموذج هجين عالي الدقة والكفاءة للكشف عن الأخبار الكاذبة في التغريدات العربية. تستفيد المنهجية المقترحة من مجموعة بيانات VERA-ARAB واسعة النطاق والموثقة لأكثر من 20000 تغريدة، وتجمع خوارزمية تحسين الحوت (WOA) لاختيار الميزات مع نماذج تعلم المجموعة المختلفة. بعد معالجة البيانات مسبقًا واستخراج الميزات باستخدام تقنيات مثل TF-IDF، تُطبق خوارزمية تحسين الحوت (WOA) لاختيار الميزات الأكثر تأثيرًا. ثم تُدخل هذه الميزات المُحسّنة في نماذج المجموعة، بما في ذلك التكديس والتصويت والتعبئة، والتي تجمع بين المصنفات الأساسية مثل آلات المتجهات الداعمة (SVMs) والغابات العشوائية (RFs) والانحدار اللوجستي (LRs). تُظهر النتائج التجريبية تفوق هذا النهج الهجين، محققًا دقة قصوى بلغت 94.56% مع نموذج الانحدار اللوجستي (LR) باستخدام خصائص "حقيبة الكلمات" (BoW) المُحسّنة باستخدام تحليل الكلمات بينما الدراسات السابقه حصلت على اعلى دقه 92.13 %. وتخلص الدراسة إلى أن هذا الإطار المتكامل يُمثل حلاً قويًا وفعالًا لتعزيز دقة كشف الأخبار الكاذبة باللغة العربية. |
الملخص بالانجليزي |
The rapid spread of fake news on social media platforms such as Twitter poses a significant challenge, especially for Arabic content, due to the linguistic complexities of the language and the scarcity of reliable datasets. This thesis aims to address this problem by developing a highly accurate and efficient hybrid model for detecting fake news in Arabic tweets. The proposed methodology leverages the large-scale, authenticated VERA-ARAB dataset of over 20,000 tweets and combines the Whale Optimization Algorithm (WOA) for feature selection with various ensemble learning models. After data preprocessing and feature extraction using techniques such as TF-IDF, BOW, the WOA is applied to select the most influential features. These optimized features are then fed into ensemble models, including stacking, voting, and bagging, which combine basic classifiers such as support vector machines (SVMs), random forests (RFs), and logistic regression (LRs). The experimental results demonstrate the superiority of this hybrid approach, achieving a maximum accuracy of 94.56% with the logistic regression (LR) model using enhanced "Bag of Words" (BoW) characteristics through word analysis, compared to previous studies which achieved a maximum accuracy of 92.13%. The study concludes that this integrated framework represents a robust and effective solution for enhancing the accuracy of detecting fake news in Arabic |
رقم ISN |
8836 |
|
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN
|
|