عنوان الإطروحه
Predicting the Students? Academic Performance using Gradient Boosting Algorithms
تاريخ مناقشة الاطروحه
2022-04-20
اسم الطالب
اسراء احمد يوسف مشاقبه
المشرف
فيصل سليمان صالح السقار
المشرف المشارك
عطاالله محمود عواد الشطناوي
اعضاء لجنة المناقشة
مفلح محمد مفلح الذيابات
د.عيسى محمود شهابات
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
في السنوات الأخيرة تزايد الطلب على التعليم العالي في الأردن ، لذلك أصبح التعليم العالي أهم مرحلة في حياة الناس في مجتمعنا وزادت كمية البيانات المخزنة في قواعد البيانات التعليمية ، حيث تحتوي قواعد البيانات التعليمية على معلومات مخفيه تساعد في تحسين أداء الطلاب. لطالما كان الأداء الأكاديمي للطلاب مصدر قلق عميق في المؤسسات التعليمية حيث قد تؤثر عوامل مختلفة على أداء الطلاب .بالأضافة، غالبًا ما تكون المؤسسات التعليمية فضولية لمعرفة عدد الطلاب الذين سيتم اجتيازهم / عدم اجتيازهم في النتائج الأكاديمية لمعرفة طريقة تحسين أدائهم ومساعدة الجهات المسؤولة على تصميم آليات فعالة مبكرة تعمل على تحسين النتائج الأكاديمية ومساعدة الطلاب المنخفض ادائهم. هذه الرسالة عبارة عن دراسة مقارنة وتحليلية للتنبؤ بالأداء الأكاديمي للطلاب وتقييم أداء العديد من خوارزميات تعزيز التدرج الوظيفية والأحدث من حيث السرعة والدقة وإعداد الhyper-parameter بناءً على العوامل features)) الاكثر تأثيرًا والتي تنتج عن المعالجة المسبقة وإعداد البيانات الحقيقية للمهمة المطروحة ، الخوارزميات المستخدمة هي طرق تعزيز التدرج الشديد (XGBoost) وآلة تعزيز التدرج الخفيف (LightGBM) والتعزيز الفئوي (CatBoost). تناولنا مشكلتين: التنبؤ بالوضع النهائي لكل طالب والتنبؤ بتقدير الطالب حيث تم قياس الأداء الأكاديمي في هذا النموذج بالدرجة النهائية التي حصل عليها في جميع الدورات خلال سنواتهم الأكاديمية ثم تم تقييم أداء كل مصنف باستخدام العديد من مصفوفات الارتباك الشائعة الAccuracy وال F-measure وال Recall و ال Precision. أظهر تحليل النتائج التجريبية أن كل من المصنفات المستخدمة حققت نتائج ذات دقة مرضية ، في حين أن خوارزمية التعزيز الفئوي (CatBoost) حققت تنبؤًا فائق الدقة يصل إلى 92.16? في نموذج التنبؤ بالحالة النهائية وفي نموذج التنبؤ بالتقدير النهائي يصل إلى 86.89?. بينما يحصل LightGBM على أفضل النتائج في السرعة مما يعني أنه أسرع من طرق تعزيز التدرج المستخدمة الأخرى. يتمثل العمل المنجز في هذه الرسالة في التنبؤ بالأداء الأكاديمي للطلاب بناءً على خوارزميتين حديثتين لتعزيز التدرج LightGBM و CatBoost ، بالإضافة إلى استخدام بيانات طلاب حقيقية تم الحصول عليها من جامعة آل البيت في نهج تحليلي متقدم يمنحنا نظرة ثاقبة حول العوامل المهمة التي لها تأثير رئيسي على أداء الطلاب. أوضحت هذه الدراسة أهمية مهام المعالجة المسبقة للبيانات لحل مشكلات جودة البيانات ، حيث يساعدنا كل هذا العمل على زيادة مستويات جودة التعليم ويهدف إلى ضمان حصول الطالب على بيئة تعليمية مناسبة.
الملخص بالانجليزي
In recent years, an increase in the request for higher education in Jordan, therefore higher education become the most important stage in people's living in our society, and the amount of data stored in educational databases increased, where these databases contain hidden information that helps for the improvement of students? performance. The academic performance of students has always been a deep concern in educational institutes where various factors may affect the performance of students. As well, the educational institutions are often curious that how many students will pass/fail for academic results to know the way to improve their performance and help the responsible entities to design early effective mechanisms that improve academic results and help students with low performance. This thesis is a comparative and analytical study to predict the academic performance of students and evaluate the performance of several latest and functional gradient boosting algorithms in terms of speed, accuracy, and hyper-parameter setup, namely; Extreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM), and Categorical Boosting (CatBoost) methods based on the most impact features that result from preprocessing and preparing real data for the task at hand. We addressed two problems: prediction of the Final Status of each student and prediction of Student Appreciation where in this model academic performance was measured by the final grade earned in all courses during their academic years then the performances of each classifier were evaluated with several common confusion matrices Accuracy, Precision, Recall, and F-measure. The analysis of the experimental results showed that each of the used classifiers achieved a satisfying accuracy result, whereas the CatBoost algorithm achieves a superior accurate prediction reaching 92.16% in the final status prediction model, and in the Appreciation prediction model reaches to 86.89%. While LightGBM obtains the best results in speed which mean is the fastest than the other used gradient boosting methods. The work conducted in this thesis is to predict student academic performance based on modern two Gradient boosting algorithms LightGBM and CatBoost, in addition to using real student data sourced from Al-al-Bayt University in an advanced analytical approach that will give us insight about important factors that have the main effect of student performance. This study proves the importance of data preprocessing tasks to resolve data quality issues, where all this work helps us increase education quality levels and aims to ensure the student got a proper education environment
رقم ISN
7177
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN