عنوان الإطروحه
Arabic Handwritten Text Recognition Using Genetic Algorithm and Artificial Neural Network
تاريخ مناقشة الاطروحه
2019-07-28
اسم الطالب
حمزة سليم محمد الصمادي
المشرف
فيصل سليمان صالح السقار
المشرف المشارك
عطاالله محمود عواد الشطناوي
اعضاء لجنة المناقشة
عمر علي عودة شطناوي
يوسف كيلاني
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
يعاني نظام التعرّف الحالي من مشكلة الأبعاد للميزات المستخرجة التي قد تقلل من نتائج التعرّف وتقلل من أداء التعرّف من خلال اختيار العديد من الميزات غير الملائمة أو الزائدة عن الحاجة. تقوم هذه الرسالة بتطوير نظام التعرّف على النص المكتوب بخط اليد باللغة العربية اعتماداً على مصنف الشبكة العصبية الاصطناعية لمعالجة مشكلة النظام. يتكون النظام المقترح من ثلاث مراحل رئيسية تشمل: استخراج الميزات ، اختيار الميزات ، والتصنيف. في حين أن الإنجاز الرئيسي لهذا البحث هو تحسين نظام التعرّف وإيجاد مجموعة فرعية مثالية من الميزات. تتضمن مرحلة استخراج الميزات مجموعة من الميزات الإحصائية والهيكلية وهي: المتوسط والانحراف المعياري والنمط الثنائي المحلي والميزات الهندسية. في اختيار الميزات ، تم اعتماد الطريقة الهجينة لتقليل أبعاد الميزات وتحديد مجموعة فرعية مثالية من الميزات استناداً إلى الخوارزمية الجينية التي تدعمها خوارزمية أقرب الجيران. تمكنت هذه الطريقة من تقليل 72.4% من الميزات غير المرغوب فيها والحصول على 21 ميزة فعالة. تمت مقارنة الطريقة المقترحة مع طريقة أخرى تعتمد على تحليل المكونات الرئيسية ، حيث تبين أن نهج الاختيار من الخوارزمية الجينية وخوارزمية اقرب الجيران أفضل من حيث معدل التعرف وعدد الميزات المحددة. استخدمت مرحلة التصنيف الشبكة العصبية الاصطناعية مصنف للتعرف على النص المكتوب بخط اليد باللغة العربية اعتماداً على مجموعة البيانات IFN/ENIT. يمكن للشبكة العصبية الاصطناعية التعرف على خط اليد العربي بنسبة 94.2% من معدل الدقة. تتم مقارنة الطريقة المقترحة مع طريقة أخرى تعتمد على تقنية تحليل المكونات الرئيسية. توضح المقارنة أن نهج الاختيار للنظام المقترح أفضل من تقنية تحليل المكونات الرئيسية من حيث معدل التعرف وعدد الميزات المحددة. حصلت هذه التقنية على معدل دقة 92.7 % مع 30 ميزة محددة.
الملخص بالانجليزي
The existing recognition system might suffer from the dimensionality problem of extracted features that may reduce the recognition results and decrease the performance of the recognition through many irrelevant or redundant features. In this thesis, we develop a hybrid Arabic handwritten text recognition system based on Artificial Neural Network (ANN) and Genetic Algorithm (GA) assisted by the k-Nearest Neighbors (kNN) algorithm to handle the features extraction problem. The proposed system consists of three main stages which include: features extraction, features selection, and classification. The main achievement of this thesis is optimizing the recognition system and finding the optimal subset of features. In the proposed approach, the features extraction stage includes a combination of statistical and structural features namely: the mean, standard deviation, Local Binary Pattern (LBP), and geometric features. The proposed hybrid method reduces the dimensionality of the features and selects an optimal subset of features based on the Genetic Algorithm (GA) assisted by the k-Nearest Neighbors (kNN) algorithm. This method is able to reduce 72.4% of undesirable features and obtain 21 efficient features. Moreover, in the classification stage, the proposed system uses the ANN classifier to recognize the Arabic handwritten text based on the IFN/ENIT dataset. Furthermore, experimental results show that the ANN classifier can recognize Arabic handwritten with 94.2% accuracy rate. Finally, the proposed method is compared with another method based on the Principal Component Analysis (PCA) technique. The comparison shows that the selection approach of the proposed system is better than the PCA in terms of recognition rate and a number of selected features. This technique obtained 92.7% accuracy rate with 30 selected features
رقم ISN
5717
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN