عنوان الإطروحه
Building a classification Approach for Arabic Text on Semantic Web Using Cosine-Similarity
تاريخ مناقشة الاطروحه
2018-05-10
اسم الطالب
حسان نضال حسان السرحان
المشرف
خالد محمد عبدالرحمن بطيحة
المشرف المشارك
اعضاء لجنة المناقشة
اكرم عارف نايف حمارشة
فيصل سليمان صالح السقار
احمد موسى العودات
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
الويب الدلالي يساعدنا في بناء تكنولوجيا لدعم شبكة من البيانات، ولفرز تلك البيانات الموجودة في قواعد البيانات. الهدف الرئيسي من "شبكة البيانات" هو تمكين الحواسيب من القيام بعمل أكثر فائدة وتطوير نظم قادرة على دعم التفاعلات الموثوقة عبر الشبكة. تهدف هذه الدراسة إلى بناء منهج لتصنيف النصوص العربية على تكنولوجيا الويب الدلالي باستخدام تشابه جيب التمام للمقارنة بين النصوص وخوارزمية اللاحقة والبادئة محللة الجذور لعملية التطبيع. في عملنا هذا تم استخدام أربعة مقاييس أساسية للتقييم : الدقة ، الاستدعاء ، الانظباط ، ومقياس F1. تم استخدام مجموعة بيانات معرفة مسبقاً لمقارنة نتائجنا بنتائج سابقة قد اجريت على خوارزمية معهد بحوث علوم المعلومات لتحليل الجذور (ISRI) وخوارزمية Tashaphyne لتحليل الجذور. حقق منهجنا المقترح نتائج أفضل من ISRI و Tashaphyne Stemmer في جميع المقاييس، بحيث كانت النتائج لدينا على النحو التالي: متوسط الدقة 97.8% ، متوسط الاستدعاء 96.7% ، متوسط الانظباط 98.4% ومتوسط مقياس (F1) 97.6%.
الملخص بالانجليزي
Semantic web is helping us to build a technology stack to support a web of data, and to sort the data which is found in the databases. The ultimate goal of ?Web of data? is to enable computers to do more useful work and to develop systems that can support trusted interactions over the network. This study aims to build an approach for Arabic texts classification on semantic web technology using cosine similarity for comparing texts, suffix and prefix stemming algorithm for normalization process. In our work, we use four standard evaluation metrics: accuracy, recall, precision and F-measure (F1). we used a known dataset to compare our results with the previous results for The Information Science Research Institute?s (ISRI) and Tashaphyne Stemmer. Our proposed approach achieved results better than ISRI and Tashaphyne Stemmer in all measures, the average of accuracy achieved 97.8%, the average of Recall achieved 96.7%, the average of precision achieved 98.4% and the average of F-measure achieved 97.6% in our proposed
رقم ISN
49
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN