عنوان الإطروحه
Predicting Student?s Performance Using Combined Heterogeneous Classification Models
تاريخ مناقشة الاطروحه
2022-12-29
اسم الطالب
دانية خالد دخل الله الصبيحات
المشرف
نجاح مثقال علي الشنابله
المشرف المشارك
اعضاء لجنة المناقشة
جهاد قبيل عوده النهود
محمد سعيد منصور البشير
يوسف الكيلاني
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
ارتبط تطوير التعليم بتنمية المجتمعات نظراً لأهمية التعليم في ازدهار الناس وتطورهم. نظرًا لأن أداء الطلاب هو المحدد الرئيسي للفعالية التعليمية ، كان من الضروري تقييم هذا العامل. مع تطور تكنولوجيا المعلومات ، أصبحت الجامعات أكثر اهتمامًا ببيانات طلابها. لذلك ، ساهم استخراج البيانات التعليمية (EDM) في استخراج معلومات مفيدة من هذه البيانات من خلال تحليل أداء الطلاب والتنبؤ به. نهدف في هذا البحث إلى تقديم نموذج يتنبأ بأداء الطلاب من خلال البيانات التي تم جمعها من إدارة القبول والتسجيل في البيات. الهدف الرئيسي هو مساعدة الطلاب على توقع حالتهم النهائية (إذا تخرجوا ، أو بشكل منتظم ، أو انفصلوا ، .. إلخ) ، واتخاذ أي إجراء في حالة وجود مخاطر ، وتغيير خططهم لرفع معدلهم التراكمي أو تغييرهم. التخصصات إذا كان من الصعب رفع CGPA. تقارن هذه الأطروحة وتحلل عددًا من أحدث الخوارزميات ، بما في ذلك Logistic Regression (LR)، (SVM) Support Vector Machine، K-Nearest Neighbor (K-NN)، (DT) Decision Tree، Naive Bayes (NB)، Multi -Layer Perceptron (MLP)، Random Forest (RF) ، Gradient Boosting (GB) ، Extreme Gradient Boosting (XGBoost)، Categorical Boosting (CatBoost)، و Light Gradient Boosting Machine (LightGBM) ، للتنبؤ بالأداء الأكاديمي للطلاب. وفقًا لتحليل النتائج ، أعطى كل من المصنفات المستخدمة في التجارب نتيجة مرضية ودقيقة. ومع ذلك ، أنتجت خوارزمية CatBoost نتيجة دقة تفوقت على جميع النتائج الأخرى ، حيث وصلت إلى 93.15? في نموذج التنبؤ بحالة الطالب ، وخوارزمية XGBoost بدقة تصل إلى 93? ، وتوفر Random Forest 92.9? من الدقة. انتهت نتيجة النموذج غير المتجانس بنسبة دقة 93.46?.في هذا البحث ، خوارزميات التصنيف والتقنيات المطبقة هي Random Forest (RF) ، Categorical Boosting (CatBoost) ، Extreme Gradient Boosting (XGBoost) باستخدام تقنيات المجموعات مجتمعة في نموذج واحد غير متجانس. تم أيضًا استخدام بيانات الطلاب الحقيقية من جامعة آل البيت ، وسنستخدم أيضًا أسلوبًا تحليليًا متطورًا للحصول على نظرة ثاقبة للمتغيرات الرئيسية التي تؤثر بشكل كبير على أداء الطلاب
الملخص بالانجليزي
Education development has been linked to the development of societies due to the importance of education in the prosperity and development of people. Since student performance is the main determinant of educational effectiveness, it was vital to assess this factor. With the development of information technology, universities have become more concerned with their student's data. Therefore, Educational Data Mining (EDM) has contributed to extracting useful information from this data by analyzing and predicting student performance. In this research, we aim to present a model that predicts students' performance through the data collected from the Admission and Registration Department of Al-al-Bayat. The main goal is to help students to predict their final status (if they graduate, or regular, or cut-off, ..etc.), take any action in case of risk, and change their plans to raise their CGPA or change their majors if the CGPA is challenging to raise. This thesis compares and analyzes a number of the most recent algorithms, including Logistic Regression (LR), K-Nearest Neighbor (K-NN), Decision Tree (DT), Support Vector Machine (SVM), Naive Bayes (NB), Multi-Layer Perceptron (MLP), Random Forest (RF), Gradient Boosting (GB), Extreme Gradient Boosting (XGBoost), Categorical Boosting (CatBoost), and Light Gradient Boosting Machine (LightGBM), to predict students' academic performance. According to the analysis of the results, each of the classifiers used in the experiments produced a satisfactory, accurate result. However, the CatBoost algorithm produced an accuracy result that was superior to all others, reaching 93.15% in the student status prediction model, the XGBoost algorithm with accuracy reach 93%, and Random Forest gives 92.9% of accuracy. The Heterogeneous model result ended with 93.46% of accuracy. In this research, the Classification algorithms and techniques applied are Random Forest (RF), Categorical Boosting (CatBoost), and Extreme Gradient Boosting (XGBoost) using ensemble techniques combined in one heterogeneous model. Real student data from Al-al-Bayt University was also used, we will also use a sophisticated analytical technique to get insight into key variables that significantly influence student performance
رقم ISN
7869
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN