عنوان الإطروحه
A Novel Algorithm for Slant Detection and Correction Of the Arabic Handwritten Text Based on horizontal Segmentation
تاريخ مناقشة الاطروحه
2017-05-21
اسم الطالب
احمد مصطفى علي المصري
المشرف
محمد البشير
المشرف المشارك
عطالله الشطناوي
اعضاء لجنة المناقشة
قاسم احمد الردايدة
مفلح الذيابات
خالد بطيحة
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
التعرف إلى النصوص هو عملية محاكاة لعدد من الطرق الإحصائية والرياضية لتحقيق أداء مشابه لأداء الإنسان، وهو مهمٌّ في عدة تطبيقات مثل معالجة الوثائق، ورؤية الإنسان الآلي، وقراءة النصوص في الرسوم والصور. ولكنْ في حقل التعرف إلى النصوص فإن التعرف إلى حروف اللغة، الذي يُطبَّقُ على النصوص المطبوعة والمكتوبة بخط اليد سواء بسواء، هو واحدة من أكثر المشاكل تعقيدا في علم الذكاء الاصطناعي. وبعيدا عن مآزق عملية التعرف إلى النصوص بشكل عام فإن التعرف إلى النص المكتوب باليد يُعتبرُ عملية أكثر تحدّيا تُعقِّدُها قضايا مثل تنوع أنماط الكتابة، ما يؤدي إلى اختلافات في أشكال الحروف وإلى تداخُل مُصاحب. في الواقع إن التعرف البصري إلى الحروف العربية أكثرُ صعوبة من التعرف إلى حروف اللغات الأخرى، فمثلا كشْفُ وتصحيحُ ميل الأحرف هو مشكلة شائعة وحرِجة جدا في نظم التعرف إلى النصوص العربية المطبوعة والمكتوبة باليد. إن عدم تصحيح الأحرف والنصوص المائلة يُنتجُ تشوهات في صورة النص، وستكون له آثار سلبية على العمليات اللاحقة كتمييز النصوص واستخلاص المعالم. لذا فإن خوارزمية قوية لكشف وتصحيح الميل مهمةٌ جدا وحاجةٌ ملحة من أجل تقليل احتمال التصنيف الخاطئ للحروف والنصوص. وبناء على ذلك كان الهدفُ الرئيسُ للدراسة الحالية هو تطويرُ طريقة مبتكرة لكشف وتصحيح الميل لإعادة إنشاء النص العربي المكتوب باليد استنادا إلى التقطيع الأفقي والخصائص البنائية (التركيبية) للحروف العربية. بمقتضى ذلك اتبعت الدراسة الحالية منهجية تتكون من ثلاث مراحل وخمس عمليات رئيسة. بعد إدخال النص المكتوب باليد إلى الحاسب الآلي تبدأ مرحلة المعالجة الأولى. تتكون هذه المرحلة من عمليات إزالة التشوه، والتنحيف، وتحديد الخط الأساسي. وتَسْتَحثُّ هذه العمليات المرحلة الثانية التي تتكون من عملية التقطيع الأفقي للصورة. وبعد ذلك تبدأ المرحلة الثالثة التي تتضمن عملية كشف وتصحيح الميل. بتنفيذ ذلك تكون قد تمّت إعادة بناء النص المُدخَل. هذه الطريقة المُقترَحة تمّ فحصها والتحقق من صحتها باستخدام منظومة بيانات (IFN/ENIT). وتمت مقارنة أداء هذه الطريقة بأداء طريقة خطوط فوروني البيانية ((VDs) Voronoi Diagrams) باستخدام نفس منظومة البيانات. في هذه المقارنة استخدم الباحث المقياسين الإحصائيين الوسطَ الحسابيَّ والانحرافَ المعياريَّ كمؤشرات على دقة تصحيح الميلان العمودي للنص. هذا وقد قيّمَ الباحثُ مناسبةَ الطريقة المُقترَحة لتصحيح الميول في نصوص مطبوعة بخطوط مختلفة. نتائج هذه الدراسة تشير إلى أن الطريقة المقترحة لكشف وتصحيح الميل تستطيع إعادة بناء الحروف وتصنيف حركات القلم ضمن مجموعات بناءً على خصائص الحروف العربية. وبيّنت المقارنات في هذه الدراسة أن الطريقة المُقترَحة تعطي نتائج أفضل من طريقة خطوط فوروني البيانية ((VDs من ناحية تقريب الصورة المدخلة الى صورة النص المطبوع، حيث قربت الخوارزمية المقترحة الصورة الأصلية الى المطبوعة بنسبة (0.098) بناءً على الانحراف المعياري وبنسبة (0.049) بناءً على المتوسط الحسابي، في حين قربت طريقة خطوط فوروني المدخلة الى صورة النص المطبوع بنسبة (0.056) بناءً على الانحراف المعياري و (0.045) بناءً على المتوسط الحسابي. إضافة إلى ذلك تستطيع الطريقة المُقترَحة وبفعالية معالجة الميل في صور النصوص المطبوعة بعدة خطوط في الكلمة الواحدة وفي السطر الواحد. طريقة كشف وتصحيح الميل المُقْتَرَحة من قِبَلِ الدراسة الحالية مهمة لتحسين تمييز الحروف - وبالتالي النصوص - العربية المكتوبة باليد، ويمكن أن تُستخدم كنواة لبناء طريقةٍ شاملةٍ لاستخلاص المعالم ونظامٍ متقدمٍ للتمييز البصري للحروف العربية.
الملخص بالانجليزي
Text recognition is a simulation of various statistical and mathematical methods to achieve a performance similar to that of the human being. It is important in several applications like document processing, robot vision, and reading the text in images. However, in the text recognition field, language character recognition, which is equally applied to printed and handwritten texts, is one of the most complex problems in the Artificial Intelligence (AI) science. Apart from the pitfalls of the text recognition process in general, handwriting recognition is considered as a more challenging process that is complicated with issues like variety of the writing styles which lead to differences in the shapes of the characters and a concomitant noise. In fact, optical recognition of the Arabic characters is more difficult than that of other languages. For example, slant detection and correction is a very common and critical problem in the recognition systems of Arabic printed or handwritten texts. Not correcting the slanted text results in noise in the text image and will have negative effects on the next processes, e.g., text recognition and feature extraction. Therefore, a powerful algorithm for slant detection and correction is highly important and badly needed to reduce the possibility for misclassification. Thereupon, the main objective of this study was to develop a novel slant detection and correction method for reconstruction of the handwritten Arabic text based on horizontal segmentation and the structural characteristics of the Arabic characters. To this end, this study followed a three-stage, four-process methodology. After inputting the handwritten text to the computer, the first processing stage started. It consists of the processes of noise removal, thinning, and baseline detection. This triggered the second stage, which is made up of the process of image horizontal segmentation. Thereafter, the third stage of slant detection and correction started. By so doing, the input text was reconstructed. This proposed method was tested and validated on the IFN/ENIT dataset. Performance of the proposed method was compared with the Voronoi Diagrams (VDs)method using the same dataset. In this comparison, the arithmeticmean (AM) and standard deviation (SD) statistical measures were applied as indicators of the accuracy slant correction. As well, appropriateness of the proposed method for correction of slants in printed texts of different fonts was evaluated. The results of this study suggest that the proposed method can reconstruct the letters and classify the strokes into letter groups based on the Arabic letter characteristics. Comparison showed that this method gives better results than the VDs method in terms of bringing the input image close to the printed text as the proposed algorithm brought the original image to the printed one by a ratio of 0.098 based on the SD and 0.049 based on the AM while the VDs method brought the input image close to the printed text by a ratio of 0.056 based on the SD and by 0.045 based on the AM.. As well, the proposed method can efficiently handle slants in images of the printed text that is typed by several fonts in one word and in one line. The slant detection and correction method proposed by this study is important for improvement of recognition of the handwritten Arabic characters, and, hence, text. It can be used as a kernel for building global feature extraction method and an advanced AOCR system
رقم ISN
4889
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN