Function WCboAIG (Dataset, Kb, dT, cT) Return [Result, nCrowd] Initialized nCrowd to zero While we have base cluster [IDX, Basic-Parameter] = Generate-Basic-Algorithm (Dataset, Kb*cT) If (Diversity (IDX) > dT) then Find the Algoritms AID from AIDM Insert idx, AID, and Basic-Parameter to Crowd-Partitions Crowd = Crowd + 1 End if End while Generate AIM matrix W-Co-Acc = WEAC (Crowd-Partition, AIM) Z = Average-Linkage (W-Co-Acc) Result = Cluster (Z, Kb) شکل۳-۲۶. شبه کد خوشهبندی خردمند مبتنی بر گراف استقلال الگوریتم در این شکل تعداد خوشهها در الگوریتم پایه میباشد. همانند روش اول پارامترهای dT و cT به ترتیب مقادیر آستانه برای ارزیابی پراکندگی و عدم تمرکز هستند. تابع Generate-Basic-Algorithm نتایج اولیه (افرازهای) را با بهره گرفتن از الگوریتمهای خوشهبندیهای پایه تولید میکند. تابع Diversity برای ارزیابی پراکندگی به کار میرود و تابع WEAC ماتریس همبستگی را برای تولید نتیجه نهایی با بهره گرفتن از نتایج اولیه به صورت روش انباشت مدارک وزندار بر اساس رابطه ۳-۱۱ تولید میکند. برای تولید دندوگرام از ماتریس همبستگی ما از الگوریتم پیوندی میانگین استفاده کردهایم چون نتایج تجربی این تحقیق نشان داده است که این روش بهترین دقت را داراست. در اینجا تابع Average-Linkage نشاندهنده الگوریتم پیوندی میانگین است. در نهایت تابع Cluster بر اساس تعداد خوشه تعیینشده نتیجه نهایی را از روی دندوگرام تشکیل میدهد. به عنوان نکته پایانی میتوان به این موضوع اشاره کرد که در شبه کد شکل ۳-۲۶ با بهره گرفتن از روش ارزیابی استقلال مبتنی بر گراف و بهکارگیری آن به عنوان وزن در روش انباشت مدارک وزندار ما میزان تأثیر رأی هر الگوریتم را با تغییر اندازه در سطحهای دندوگرام بر روی نتیجه نهایی اعمال میکنیم. به عنوان مثال میتوان گفت اگر دو الگوریتم با درجه استقلال پایین در تولید نتیجهی شبه کد شکل ۳-۲۶ شرکت کنند و نتایج مشابه داشته باشند آنگاه روش پیشنهادی دوم فقط و فقط به اندازه میزان استقلال آن دو الگوریتم شکل دندوگرام را تغییر میدهد که بسیار کمتر از وقتی است که دو الگوریتم کاملاً مستقل (یعنی درجه استقلال آنها برابر با یک باشد) با نتایج برابر در تشکیل نتیجه نهایی شرکت میکنند. فصل چهارم پیادهسازی و تحلیل نتایج پیادهسازی و تحلیل نتایج ۴-۱. مقدمه در این فصل نتایج آزمایشهای تجربی این تحقیق را جهت ارزیابی الگوریتمهای پیشنهادی ارائه خواهیم کرد. از این روی در ادامه در بخش مجموعه داده، ابتدا به بررسی دادههای استاندارد بهکاررفته در این تحقیق خواهیم پرداخت. پس از معرفی دادهها و مشخصات آنها، در بخش مدلسازی الگوریتمها به زبان استقلال الگوریتم لیستی از الگوریتمهای پایه که در ساخت نتایج اولیه خوشهبندی از آنها استفاده شده است ارائه میگردد و همچنین پیادهسازی کدهای الگوریتمهای ذیل به زبان استاندارد استقلال الگوریتم که پیشتر به آن اشاره شد نیز ارائه خواهد شد. در بخش ابزار تحلیلگر کد استقلال الگوریتم[۱۸۲] به معرفی نرمافزاری که متناسب با استانداردهای این تحقیق برای تبدیل خودکار کد استقلال الگوریتم به گراف و ارزیابی آن به زبان برنامهنویسی C# در مجموعه Microsoft Visual Studio 2012 طراحی و ساخته شده است میپردازیم. سرانجام، در بخش نتایج آزمایشها دقت و میزان NMI نتایج نهایی الگوریتمهای پیشنهادی این تحقیق نسبت به کلاسهای واقعی داده را با روشهای پیشین مقایسه میکنیم و همچنین تأثیر پارامترهای معرفیشده در این تحقیق همچون پراکندگی، استقلال و عدم تمرکز بر روی کارایی نتایج و زمان اجرای الگوریتمها را بررسی خواهیم کرد. کلیه نتایج ارائهشده در این بخش توسط پیادهسازی و شبیهسازی الگوریتمها در نرمافزار Matlab R2013a (8.1.0.604) تولید و ارائهشدهاند. ۴-۲. مجموعه داده در این تحقیق نتایج تجربی آزمایشها بر روی چهارده مجموعه داده استاندارد برای ارزیابی روش پیشنهادی گزارششدهاند. بیشتر مجموعه دادهها در این تحقیق از مجموعه دادههای استاندارد UCI [76] میباشند که تقریباً نتایج تمام مطالعات اخیر دنیا در زمینه خوشهبندی با بهره گرفتن از این مجموعه دادهها گزارش میشوند. علاوه بر آن از داده Halfring که در کارهای تحقیقاتی عظیمی و همکاران [۲, ۴, ۵, ۶, ۷] و علیزاده و همکاران [۱, ۸, ۹, ۶۷] به عنوان یک داده مصنوعی با شکل غیر کروی که تشخیص آن توسط الگوریتمهای خوشهبندی پایه سخت میباشد نیز مورد استفاده قرار گرفته است. جدول ۴-۱ مشخصات مجموعه داده بهکاررفته در ارزیابی الگوریتمهای این تحقیق را نشان میدهد. جدول۴-۱. مجموعه داده Sample Class Feature Name No. ۴۰۰ ۲ ۲ Half Ring ۱ ۱۵۰ ۳ ۴ Iris
فرم در حال بارگذاری ...