عنوان الإطروحه
Arabic Handwritten Word Recognition System Based On The Wavelet Packet Decomposition WPD
تاريخ مناقشة الاطروحه
2019-12-22
اسم الطالب
ايمان نمر محمد النمر
المشرف
مفلح محمد مفلح الذيابات
المشرف المشارك
اعضاء لجنة المناقشة
خالد محمد عبدالرحمن بطيحه
عدنان احمد حنيف
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
يمثل إدراك النصوص العربية المكتوبة بخط اليد تحديا، بسبب الإختلاف الكبير في طريقة الكتابة، وخصائص الأحرف بالإضافة إلى الكم الهائل من مفردات اللغة العربية. تنقسم طرق إدراك النصوص إلى نهجين رئيسين وهما: نموذج تجزئة الكلمات إلى أحرف أو أجزاء من الكلمة وهو خارج إطار البحث، أما النموذج الثاني فهو لإدراك الكلمة كوحدة واحدة. في هذا البحث، تم اقتراح وتطوير نظام شامل للتعرف على النصوص العربية المكتوبة بخط اليد على مستوى الكلمة باستخدام Wavelet Packet Decomposition بالاعتماد على مصنفين مختلفين وهما Support Vector Machine, K-NN. يحتوي النظام المقترح على ثلاث مراحل رئيسة تشمل مرحلة المعالجة القبلية، ومرحلة استخراج السمات، وأخيرا مرحلة التعرف أو التصنيف. في مرحلة المعالجة القبلية تتم إزالة علامات التشكيل والتشويش، ثم عملية ترقيق النص باستخدام النهج المورفولوجي، وأخيرا توحيد حجم الصور إلى حجم مناسب لعملية استخلاص السمات والتصنيف. في مرحلة استخراج السمات تم اقتراح (WPD) لاستخراج سمات الكلمات العربية المكتوبة بخط اليد وتصنيفها في المرحلة الأخيرة باستخدام كل من (SVM, K-NN). تم اختبار النظام المقترح لإدراك الكلمات العربية على قاعدة بيانات IFN/ENIT باستخدام أحجام مختلفة للصور، بناءا على التجارب التي تم اختبارها تبين أن الحجم (100*100) هو الحجم الأنسب عند استخدام SVM حيث كانت دقة تعرف النظام 93.7% ، أما عند تطبيق K-NN فإن أفضل حجم للصورة 45*269 حيث حقق نسبة التعرف 88.4%. تمت مقارنة النظام المقترح مع النظام القائم على أساس منهجية DWT وDCT وأثبتت الدراسة أن نتائج النظام المقترح أفضل من نتائج النظام المذكور ، وبناءا على ذلك فإن النظام المقترح للتعرف على الكلمات العربية المكتوبة بخط اليد يحقق فعالية عالية، ونتائج واعدة مقارنة مع الأنظمة الأخرى المذكورة في الدراسات السابقة.
الملخص بالانجليزي
Recognizing Arabic handwriting is a challenge due the high variability of Arabic scripts and its fundamental characteristics, in tradition Arabic recognition which divided into two main approaches namely, segmentation-based approach (analytical) and a word-based holistic approach (holistical). Analytically, the input word is handled as an array of parts/characters, with each part considered individually, but the holistical approach recognized the word as one unit. This thesis attempts to recognize Arabic handwriting based on the Wavelet Packet Decomposition (WPD) using two different classifiers (Support Vector Machine SVM with polynomial kernel and k-Nearest Neighbors K-NN) is proposed and developed. The suggested approach of recognizing Arabic handwriting contains three major stages including image preprocessing, extracting the features of the image, and allocation steps to classify features. Firstly the diacritics are removed using the opening morphological operation (i.e image preprocessing). Secondly extracting the structure of the paragraph using the morphological method. Finally, the word image size is converted into a suitable size for the next stages. In order to extract features from the image, the WPD method has been adopted to extract the features of Arabic handwritingas the transformation method of feature space. This shall extract the Arabic global features to be classified in the last stage using the SVM with polynomial kernel classifier and K-NN classifier. The proposed approach of recognizing Arabic handwriting is tested on IFN/ENIT dataset by rescaling images into various sizes {(38?38) (50?50) (80?80) (100?100) (125?125) (45?269)}. The (100?100) scale has shown the ultimate results using the adopted approach in this thesis. Therefore, a satisfying accuracy of 93.7% has been recorded for classification when the SVM is used.Nevertheless, the (45?269) word normalization (or scaling) has shown the ultimate results when the K-NN classifier achieved accuracy result is 88.4%. The approach of this thesis is based on the WPD system of recognizing Arabic handwriting. It has been validated against DCT and DWT Arabic handwriting recognitions on the same dataset. Higher accuracies have been accomplished in comparison to the DCT and DWT recognitions (i.e. 80.0% and 50.83%, respectively). Consequently, the adopted approach in this thesis has a good potential to be applied when it is verified with literature with various classifiers (namely; HMM and ANN).
رقم ISN
6471
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN