عنوان الإطروحه |
Identifying the Best Base Classifier and the Significance of Capturing the Correlations among Labels in Multi-label Classification
|
تاريخ مناقشة الاطروحه |
2022-12-21 |
اسم الطالب |
حنين محمد عقله الزعبي
|
المشرف |
نجاح مثقال علي الشنابله |
|
المشرف المشارك |
مازن سالم حمد الزيود
|
اعضاء لجنة المناقشة |
| عمر علي عوده شطناوي |
| مفلح محمد مفلح الذيابات |
| عبيدة محمد هزايمة |
|
الكلية |
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات |
القسم |
علم الحاسوب |
الملخص بالعربية |
التصنيف متعدد الأنواع من أشهر المهام في مجالات التنقيب في البيانات، تعلم الآلة، و علم البيانات. هذه المهمة تهدف الى التنبؤ بنوع وتصنيف لحالة أو مثال جديد بدقة متناهية قدر الإمكان. عموماً، يقسم التصنيف الى نوعين أساسيين هما: التصنيف الأحادي (SLC) والتصنيف متعدد الأنواع (MLC). الفرق الرئيسي بين النوعين هو أن التصنيف الأحادي يربط أي حالة أو مثال بصنف واحد فقط، في حين أن التصنيف المتعدد الأنواع يسمح لأي حالة أو مثال بالارتباط بصنف واحد أو أكثر من صنف. هذه الدراسة تهتم أكثر بالتصنيف متعدد الأنواع. بشكل خاص، تعنى هذه الدراسة بهدفين أساسيين. هدف الدراسة الأول يسعى الى تحديد أفضل خوارزمية تصنيف أحادي يمكن استخدامها في مجال التصنيف المتعدد الأنواع، في حين أن هدف الدراسة الثاني يعنى بتحديد أهمية العلاقات في حل مشكلة التصنيف المتعدد الأنواع. بعد دراسة مستفيضة، خلصت هذه الدراسة الى أن خوارزمية RandomForest-X هي الخيار الأفضل للتعامل مع مشكلة التصنيف المتعدد الأنواع. كذلك، خلصت الدراسة الى أن استثمار العلاقات أو إهمالها قد يكون مهماً بنفس القدر في حل مشكلة التصنيف المتعدد الأنواع.علاوة على ذلك أوضحت النتائج أن الملصق الأكثر تكرارًا (MFL) أظهر أفضل أداء وأن استخدام تكرار الانواع كمعيار للتحويل أفضل من استخدام الارتباطات الموجبة وتحقيق نتائج أفضل |
الملخص بالانجليزي |
Classification is a well-known task in data mining, machine learning, and data science. This task aims to predict the class label for unseen instance as accurate as possible. In general, classification could be divided into two main types: Single Label Classification (SLC) and Multi-Label Classification (MLC). The main difference between SLC and MLC is that: MLC allows instances in the dataset to be associated with one or more class labels while SLC does not. This research is more interested in MLC. In specific, two main objectives are considered in this research. The first objective considers the identifying of the best base classifier that can handle the problem of MLC, while the second objective is the determining of the importance of discovering and exploiting the existing correlations among class labels in solving the problem of MLC. Extensive evaluations showed that RandomForest-X is the best classifier to handle MLC. Also, capturing high order correlations or ignoring these correlations could help in finding a solution for MLC problem. Moreover, the results revealed that Most Frequent Label (MFL) showed the best performance and utilizing the frequency of labels as a transformation criterion is better than utilizing the positive correlations and produces better results |
رقم ISN |
8658 |
|
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN
|