عنوان الإطروحه
Offline Writer Identification for Arabic Handwriting Texts Based on a Scale Invariant Feature Transform (SIFT)
تاريخ مناقشة الاطروحه
2017-05-18
اسم الطالب
محمد محمود علي الشياب
المشرف
خالد بطيحة
المشرف المشارك
عطالله الشطناوي
اعضاء لجنة المناقشة
اسماعيل عبابنة
احمد العودات
جهاد النهود
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
مع التطورات المستمرة في مجال الاتصالات و المجالات الصناعية الأخرى يزداد الطلب على استخدام أنظمة التوثيق ذات المصداقية العالية. تستخدم هذه الأنظمة في العديد من أعمالنا اليومية بما في ذلك: الأعمال المصرفية نشر المعلومات و أنظمة التجار الإلكترونية و التجارة عبر الانترنت. نظم تحديد هوية كاتب النص هي أحد أكثر أنظمة التوثيق شيوعا, بالرغم من التطور الهائل في الأنظمة إلا أنه لم يتم دراسة عملية التعرف على هوية الكاتب العربي كما هو الحال للكاتب اللاتيني أو الصيني حتى السنوات القليلة الماضية. تطوير أنظمة التعرف على هوية الكاتب العربي تواجه العديد من التحديات بما في ذلك خصائص الكتابة العربية، التشويش، وترقيق النص فضلا عن الملامح أو رسم الكتابة اليدوية؛ فإنه يتأثر بسهولة من الميل. في هذه الأطروحة قدمنا مقترح لنظام التعرف على هوية كاتب النصوص المختلفه المدخله مسبقا باللغه العربيه باستخدام خوارزميات (Scale Invariant Feature Transform (SIFT)) and (k-means clustering) للتعامل مع التحديات التي تواجه اللغه العربيه. النظام المقترح يتكون من مرحلتين: التدريب و التعرف . في مرحلة التدريب , تقوم خوارزمية (SIFT) باستخراج (SIFT descriptors (SD?s)) من النصوص المدخله المكتوبه باليد, وبعد ذلك نطبق عليها خوارزمية (k-means clustering) لانشاء مجموعه من المراكز لكل كاتب و تخزينها في سجل. في مرحلة التعرف , تقوم خوارزمية (SIFT) باستخراج ال (SDs) من النص المدخل لغاية الفحص المكتوب باليد ومن ثم مقارنتها مع (SDs) الموجوده في السجل للتعرف على كاتب هذا النص باستخدام k-nearest neighbors matcher (k-NN))). تم استخدام قاعدة البيانات (IFN/ENIT) في النظام المقترح. في هذه الأطروحه تمت المقارنه بين ثلاث حالات من خلال تغيير عدد مراكز(SDs clusters) التي تم انتاجها من خلال تطبيق خوارزمية (k-means clustering)والثلاث حالات هي(150,300,600 ) مركز. بينت النتائج ان افضل نتيجه كانت عند تطبيق 300 مركز حيث ان نسبة التعرف كانت 81% كأعلى قيمه, 86% كأعلى ثاني قيمه و 94% كأعلى ثالث قيمة. وكانت هذه النتائج أفضل عند مقارنتها مع (Chawki and Labiba, 2010)
الملخص بالانجليزي
The recent and ongoing improvements in telecommunications, financial, and industrial fields create remarkable needs for reliable and easy to use authentication system. These systems are broadly used in many ubiquitous applications including: banking, information dissemination, and online and electronic trade systems. Writer identification systems are one of the most common authentication systems currently used. In spite of the huge development in writer identification systems, Arabic writer identification has not been studied as Latin or Chinese writer identification until the last few years. Arabic Writer identification systems? development faces many challenges, including the characteristics of Arabic writing, noise effectiveness, text thinning as well as the contours or the allograph of handwriting. In this thesis, we propose an Arabic offline text-independent writer identification system based on the Scale Invariant Feature Transform (SIFT) algorithm and the k-means clustering algorithm. The system consists of two stages: training and identification stages. In the training stage, the SIFT descriptors (SDs) are extracted from the input handwritten samples, and then the k-means clustering algorithm is applied on these SDs to produce a centers for each writer and store them in the codebook. In the identification stage, the SDs are extracted from the test input handwritten sample and matched with the ones in the codebook for identification by using k-nearest neighbors matcher (K-NN).We used the IFN/ENIT database in our work. In this thesis, a comparison between three cases was applied by changing the centers of SIFT descriptors clusters that were produced by applying k-means clustering algorithm; the first case with 150 centers, the second one with 300 centers and the third one with 600 centers. The results showed that the best case was when using 300 centers where the recognition ratio (RR) of identifying the writer was 81% as Top 1, 86% as Top 2 and 94% as Top3, where Top 1 means that the system retrieves the correct writer for the sample as the first candidate, Top 2 means that the system retrieves the correct writer for the sample as the second candidate, Top 3 means that the system retrieves the correct writer for the sample as the third candidate. And these results were compared with (Chawki and Labiba, 2010) and achieved better recognition ratio
رقم ISN
4884
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN