وبلاگ

توضیح وبلاگ من

ﻧﮕﺎرش ﻣﻘﺎﻟﻪ ﭘﮋوهشی در مورد خوشه‌بندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی- فایل ۲۱

 
تاریخ: 04-08-00
نویسنده: فاطمه کرمانی

Function WCboAIG (Dataset, Kb, dT, cT) Return [Result, nCrowd] Initialized nCrowd to zero While we have base cluster [IDX, Basic-Parameter] = Generate-Basic-Algorithm (Dataset, Kb*cT) If (Diversity (IDX) > dT) then Find the Algoritms AID from AIDM Insert idx, AID, and Basic-Parameter to Crowd-Partitions Crowd = Crowd + 1 End if End while Generate AIM matrix W-Co-Acc = WEAC (Crowd-Partition, AIM) Z = Average-Linkage (W-Co-Acc) Result = Cluster (Z, Kb) شکل۳-۲۶. شبه کد خوشه‌بندی خردمند مبتنی بر گراف استقلال الگوریتم در این شکل تعداد خوشه‌ها در الگوریتم پایه می‌باشد. همانند روش اول پارامترهای dT و cT به ترتیب مقادیر آستانه برای ارزیابی پراکندگی و عدم تمرکز هستند. تابع Generate-Basic-Algorithm نتایج اولیه (افرازهای) را با بهره گرفتن از الگوریتم‌های خوشه‌بندی‌های پایه تولید می‌کند. تابع Diversity برای ارزیابی پراکندگی به کار می‌رود و تابع WEAC ماتریس همبستگی را برای تولید نتیجه نهایی با بهره گرفتن از نتایج اولیه به صورت روش انباشت مدارک وزن‌دار بر اساس رابطه ۳-۱۱ تولید می‌کند. برای تولید دندوگرام از ماتریس همبستگی ما از الگوریتم پیوندی میانگین استفاده کرده‌ایم چون نتایج تجربی این تحقیق نشان داده است که این روش بهترین دقت را داراست. در اینجا تابع Average-Linkage نشان‌دهنده الگوریتم پیوندی میانگین است. در نهایت تابع Cluster بر اساس تعداد خوشه تعیین‌شده نتیجه نهایی را از روی دندوگرام تشکیل می‌دهد. به عنوان نکته پایانی می‌توان به این موضوع اشاره کرد که در شبه کد شکل ۳-۲۶ با بهره گرفتن از روش ارزیابی استقلال مبتنی بر گراف و به‌کارگیری آن به عنوان وزن در روش انباشت مدارک وزن‌دار ما میزان تأثیر رأی هر الگوریتم را با تغییر اندازه در سطح‌های دندوگرام بر روی نتیجه نهایی اعمال می‌کنیم. به عنوان مثال می‌توان گفت اگر دو الگوریتم با درجه استقلال پایین در تولید نتیجه‌ی شبه کد شکل ۳-۲۶ شرکت کنند و نتایج مشابه داشته باشند آنگاه روش پیشنهادی دوم فقط و فقط به اندازه میزان استقلال آن دو الگوریتم شکل دندوگرام را تغییر می‌دهد که بسیار کمتر از وقتی است که دو الگوریتم کاملاً مستقل (یعنی درجه استقلال آن‌ها برابر با یک باشد) با نتایج برابر در تشکیل نتیجه نهایی شرکت می‌کنند. فصل چهارم پیاده‌سازی و تحلیل نتایج پیاده‌سازی و تحلیل نتایج ۴-۱. مقدمه در این فصل نتایج آزمایش‌‌های تجربی این تحقیق را جهت ارزیابی الگوریتم‌های پیشنهادی ارائه خواهیم کرد. از این روی در ادامه در بخش مجموعه داده، ابتدا به بررسی داده‌های استاندارد به‌کاررفته در این تحقیق خواهیم پرداخت. پس از معرفی داده‌ها و مشخصات آن‌ها، در بخش مدل‌سازی الگوریتم‌ها به زبان استقلال الگوریتم‌ لیستی از الگوریتم‌‌های پایه که در ساخت نتایج اولیه خوشه‌بندی از آن‌ها استفاده شده است ارائه می‌گردد و همچنین پیاده‌سازی کدهای الگوریتم‌های ذیل به زبان استاندارد استقلال الگوریتم که پیش‌تر به آن اشاره شد نیز ارائه خواهد شد. در بخش ابزار تحلیلگر کد استقلال الگوریتم[۱۸۲] به معرفی نرم‌افزاری که متناسب با استاندارد‌های این تحقیق برای تبدیل خودکار کد استقلال الگوریتم به گراف و ارزیابی آن به زبان برنامه‌نویسی C# در مجموعه Microsoft Visual Studio 2012 طراحی و ساخته شده است می‌پردازیم. سرانجام، در بخش نتایج آزمایش‌ها دقت و میزان NMI نتایج نهایی الگوریتم‌های پیشنهادی این تحقیق نسبت به کلاس‌های واقعی داده را با روش‌های پیشین مقایسه می‌کنیم و همچنین تأثیر پارامتر‌های معرفی‌شده در این تحقیق همچون پراکندگی، استقلال و عدم تمرکز بر روی کارایی نتایج و زمان اجرای الگوریتم‌ها را بررسی خواهیم کرد. کلیه نتایج ارائه‌شده در این بخش توسط پیاده‌سازی و شبیه‌سازی الگوریتم‌ها در نرم‌افزار Matlab R2013a (8.1.0.604) تولید و ارائه‌شده‌اند. ۴-۲. مجموعه داده‌ در این تحقیق نتایج تجربی آزمایش‌ها بر روی چهارده مجموعه داده استاندارد برای ارزیابی روش پیشنهادی گزارش‌شده‌اند. بیشتر مجموعه داده‌‌ها در این تحقیق از مجموعه داده‌های استاندارد UCI [76] می‌باشند که تقریباً نتایج تمام مطالعات اخیر دنیا در زمینه خوشه‌بندی با بهره گرفتن از این مجموعه داده‌ها گزارش می‌شوند. علاوه بر آن از داده Halfring که در کارهای تحقیقاتی عظیمی و همکاران [۲, ۴, ۵, ۶, ۷] و علیزاده و همکاران [۱, ۸, ۹, ۶۷] به عنوان یک داده مصنوعی با شکل غیر کروی که تشخیص آن توسط الگوریتم‌های خوشه‌بندی پایه سخت می‌باشد نیز مورد استفاده قرار گرفته است. جدول ۴-۱ مشخصات مجموعه داده‌ به‌کاررفته در ارزیابی الگوریتم‌های این تحقیق را نشان می‌دهد. جدول۴-۱. مجموعه داده Sample Class Feature Name No. ۴۰۰ ۲ ۲ Half Ring ۱ ۱۵۰ ۳ ۴ Iris


فرم در حال بارگذاری ...

« منابع پایان نامه درباره بررسی تاثیر بکارگیری سیستم کنترل سرعت متوسط وسایل نقلیه بر ...راهنمای ﻧﮕﺎرش ﻣﻘﺎﻟﻪ ﭘﮋوهشی درباره : بررسی مهمترین موانع اداری- خدماتی موثر بر صادرات محصولات غیر نفتی در استان ... »