عنوان الإطروحه
Triple integrated classifiers algorithm by adopting (KNN)، (BPNN) and (SVM) For Offline Handwritten Isolated Arabic Character Recognition System
تاريخ مناقشة الاطروحه
2021-01-02
اسم الطالب
طارق ساير عليان الخوالدة
المشرف
اكرم عارف نايف مصطفى حمارشة
المشرف المشارك
اعضاء لجنة المناقشة
عمر علي عوده شطناوي
فينوس وزير سماوي
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
تقدم هذه الدراسة تقنية متقدمة تهدف إلى التغلب على العقبات في العديد من أنظمة التعرف على خط اليد العربية. تُصنف اللغة العربية على أنها طبيعة مخطوطة ، وتختلف أحرفها في الشكل وأنماط الخط والحجم والعرض والارتفاع والمحاذاة والاتجاه ، وبعضها يحتوي على عدد من النقاط. لذلك ، فإن معظم أنظمة التعرف الضوئي على الحروف (OCR) للغة العربية تواجه مشكلة صعبة بسبب صعوبة وتعقيد تحديد النمط المتموج للأحرف . ومع ذلك ، فقد تم إيلاء القليل من الاهتمام لهذا المجال من البحث فيما يتعلق بمشكلة التعرف على الاحرف في هذه الدراسة ، تم تطوير نظام متكامل ثلاثي لنظام التعرف على الكتابة بخط اليد العربية المعزولة بناءً على المصنفات ثلاثية المراحل لتحسين دقة نظام التعرف. النظام المطور يستخدم ثلاثة مصنفات تشمل: دعم آلة المتجهات (SVM) ،K-Nearest Neighbor's (KNN) ، والشبكات العصبية القابلة للتعلم . تستخدم آلة المتجهات الداعمة (SVM) لتقسيم أحرف مجموعة البيانات إلى فئتين من الأحرف مع وبدون نقاط ، من أجل تقليل معدل الخطأ في التعرف على الأحرف التي تمتلك شكلًا مشابهًا. ثم تم تطبيق مصنف K-Nearest Neighbor's (KNN). تساهم نتائج المراحل السابقة في مرحلة الشبكة العصبية للانتشار الخلفي (BPNN) ، والتي توفر أفضل صحة ودقة من خلال التدريب. يستخدم هذا العمل مجموعة بيانات التونسية (IFN / ENIT) ، حيث يُظهر نظام التصنيف الثلاثي دقة تصل إلى 99?. تثبت SVM و KNN و BPNN المدمجة الثلاثية أنها توفر معدل دقة عاليًا مع معالجة منخفضة الوقت ، لا سيما مع مجموعة بيانات كبيرة (مع معدل خطأ محدود ، وهو أقل من 10-5) ، وهو خطأ ضئيل.
الملخص بالانجليزي
This study introduces an advanced technique that aims to overcome obstacles in many Arabic handwriting recognition systems. The Arabic Language is classified as cursive nature, its letters differ in form, font styles, size, width, height, alignment, orientation, and some containing number of points. Therefore, most Optical Character Recognition (OCR) systems for Arabic language experience a challenging problem due to difficulty and complexity of determining the wavy style of the characters. However, little attention has been paid to this area of research regarding character-recognition problem. In this study, triple integrated system of Isolated Arabic off-line handwritten recognition system was developed based on triple phase?s classifiers to improve the recognition system accuracy. The developed system utilized three classifiers including; Support Vector Machine (SVM), K-Nearest Neighbors (KNN), and supervised neural networks. The Support Vector Machine (SVM) used for partition the dataset characters into two categories of characters with and without dots, in order to decrease the error rate of characters? recognition that own similar shape. Then the K-Nearest Neighbors (KNN) classifier was applied. The output of the previous phases contributes to the Back Propagation Neural Network (BPNN) phase, which provides the best correctness and accuracy through training. This work utilizes Tunis (IFN/ENIT) dataset, where the triple classifier system shows an accuracy of 99%. The triple integrated SVM, KNN and BPNN proves that they provide a high accuracy rate with low time processing, particularly with a large dataset (with so limited recognition error rate, which is less than 10-5), which is a negligible error
رقم ISN
6518
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN