عنوان الإطروحه
"Improve K-Medoids Clustering Technique using Cuckoo Search Algorithm"
تاريخ مناقشة الاطروحه
2017-01-04
اسم الطالب
لبنى حزوم سليمان البقوم
المشرف
خالد محمد عبدالرحمن بطيحة
المشرف المشارك
اعضاء لجنة المناقشة
بلال مصطفى حسين ابوعطا
اكرم عارف نايف مصطفى حمارشة
جهاد قبيل عوده النهود
الكلية
كلية الامير الحسين بن عبدالله لتكنولوجيا المعلومات
القسم
علم الحاسوب
الملخص بالعربية
إن ازدياد الإنتاج الغير محدود للمعلومات أدى إلى تضخم حجم هذه المعلومات في جميع المخازن المعلوماتية في العالم إذ إن علم تنقيب البيانات وجد للتحكم في مخازن المعلومات المهمة وهذا العلم ليس عشوائيا لأنه يعتمد على أنواع كثيرة من العلوم مثل علم الإحصاء و الخوارزميات الرياضية والذكاء الاصطناعي وغيرها من العلوم يعتبر تنقيب البيانات أهم مرحله في اكتشاف المعرفة في قواعد البيانات فبدون هذه المرحلة تكون العملية مستحيلة على الرغم من وجود الكثير من المراحل السابقة واللاحقة لمرحله تنقيب البيانات فمرحله تنقيب البيانات تستخرج معرفه ذات معنى مثل( قواعد, أنماط, انظمه) وتوظف المهام من قبل التنقيب عن البيانات لإشباع حاجه الإنسان للمعرفة وتتنوع هذه المهام بين التصنيف والتجميع والعنقودية وغيرها من المهام ,حيث كان نطاق عملنا يشمل تحسين مبدأ العنقودية في التنقيب عن البيانات ,وكان الهدف تحسين وزيادة كفائه خوارزميه ال k-medoids العنقودية ولكي تتفوق على سيئاتها ,تعتبر خوارزميه ال k-medoids العنقودية من أقوى الخوارزميات لأنها لا تتأثر بالشوائب , لكن هذه الخوارزمية لا تعمل بشكل جيد مع قواعد البيانات الكبيرة نسبيا وأيضا هي عشوائية في اختيار ال medoids (الكائن الذي تتجمع حوله نقطه مركز العنقود) لكل عنقود. خوارزميتنا المقترحة هي جمع بين خوارزميه ال k-medoids و خوارزميه البحث الوقواقي , التي تعدل في طريقه اختيار ال medoid الأولي لكل العناقيد لذلك نستخدم خوارزميه البحث الوقواقي التي تعتمد على سلوك التربية الطفيلي لتقوم باختيار ال medoid الأولي بدل من الخوارزمية التقليدية , هذه الخوارزمية المقترحة أنتجت عناقيد أفضل مقارنه بالخوارزمية الاصليه وتم تقييمها بواسطة عدد من مقاييس الأداء مثل مقياس النقاء والتكلفة والقيمة المطلقة للخطأ وتم حساب وقت التنفيذ بأجزاء من الثانية وأيضا الخوارزمية المقترحة تم مقارنتها مع خوارزميه عدلت على خوارزميه k-medoids بواسطة استخدام خوارزميه الخفاش وتمت التقييم بينهم تحت نفس الظروف ومعايير الأداء وكانت الخوارزمية المقترحة أفضل من الخوارزمية التقليدية
الملخص بالانجليزي
Data Mining is the main phase of knowledge discovery in database (KDD), without it the process is impossible, never minding the existence of other phases in (KDD), data mining extracts meaningful info as (pattern, rules, regularities). Tasks are hired by data mining to feed the human need for knowledge, this task varies between classification, association, clustering, where The scope of our work includes the improving of the clustering approach, where the goal was to improve and increase the quality of the k-medoids clustering algorithm and outperform its drawbacks, K-medoid clustering algorithm of powerful algorithms that are not affected by the outliers, but this algorithm does not work well with large data set, also it is a random style in choosing an initial medoid object in each cluster. Our proposed algorithm is a combination of the k-medoid algorithm and cuckoo search algorithm, that modifies the method of selecting an initial medoid object for clusters, so we use the cuckoo search algorithm that is based on the breeding behavior of some types of cuckoo birds, the cuckoo search algorithm does this job instead of the k-medoids, where this proposed algorithm produces a better clustering quality than the original k-medoid, and it is evaluated by a number of performance measures that are as follows: absolute mean error, purity and distance cost, where the time of execution is in milliseconds, moreover is that the proposed algorithm has been compared with the (K-medoids clustering technique using the bat algorithm) under the same conditions evaluated by the same performance measures, and the proposed algorithm works better than the (K-BAT) algorithm and the original k-medoids
رقم ISN
4361
للحصول على الرسالة كملف يرجى تزويد المكتبة برقم ISN