رابطه ۲-۱۲
در این رابطه مقدار z از جدول مربوط به توزیع نرمال بدست می آید. متغیر f دقت دسته بندی در N بار امتحان است[۴].
۲-۲-۵-۳ روش K-DTREE
مشکل الگوریتمهای بالا سرعت کم است که با تعداد نمونه آموزشی رابطه مستقیم دارد به عبارتیO(D) است اگر اندازه مجموعه آموزشیD باشد. برای جل این مشکل از روش K-Dtree استفاده میکنیم. این روش از روی نمونههای آموزشی درختی میسازد که گرههای آن نمونهها هستند.K ، تعداد ویژگیها است. در واقع نمونهها را به عنوان نقاطی در فضای k بعدی در نظر میگیرد. این درخت دودوی ی فضای ورودی را به بخشهای ی افراز می کند. روال کلی بدین صورت است که در هر مرحله یک ویژگی انتخاب شده و بر اساس آن تقسیم بندی مجدد انجام می شود. تمام تقسیمات موازی بوده و در نهایت هر ناحیه دارای حداکثر یک نقطه است[۴].
شبه کد الگوریتم K-Dtreeدر شکل ۲-۷ آمده است. در این الگوریتم بازگشتی، در هر مرحله یک ویژگی به تناوب و با توجه به عمق انتخاب می شود. میانه حول آن محاسبه شده و نهایتا روال بصورت بازگشتی برای نقاط سمت چپ و راست میانه و با افزایش عمق فراخوانی می شود در واقع این روش یک روش شاخصگذاری[۲۶] برای جستجوی سریع است.[۴]
شکل ۲-۷: شبکه کد مربوط به الگوریتم KDD [4]
۲-۲-۶ماشین بردارپشتیبان
ماشین بردارپشتیبان در دسته بندی داده های خطی و هم غیرخطی کاربرد دارد. در دستهبندی غیرخطی، این الگوریتم از یک نگاشت غیر خطی برای تبدیل داده های اصلی به ابعاد بالاتر استفاده می کند. در بعد جدید از یک بهینه خطی برای جداسازی ابر صحفه استفاده می کند. داده ها از دو کلاس، همیشه توسط یک ابرصفحه جدا شده میشوند.ماشین بردار پشتیبان ابرصحفه را با بهره گرفتن از بردار پشتیبان(داده آموزشی) و حاشیه (توسط بردار پشتیان تعریف می شود) ایجاد می کند.[۴]
۲-۲-۶-۱ داده ها بطور خطی جدا پذیر هستند
مجموعه داده D بصورت
که مجموعه داده آموزشی همراه با برچسب، و y یکی از دو مقدار +۱ و -۱ است. ما نیازبه خطی داریم که مقادیر y از هم جدا و بهترین باشد. چون داده خطی است میتوان گفت که کوتاهترین فاصله از ابرصفحه به یک طرف حاشیه آن برابر است با کوتاهترین فاصله از ابرصفحه به طرف دیگر از حاشیه آن، هدف پیدا کردن ابرصفحه جداکننده با بیشترین فاصله از نقاط حاشیهای است که نقاط با را از نقاط با جدا کند.[۴]
هر ابر صحفه می تواند بصورت رابطه ۲-۱۳ تعریف شود
رابطه ۲-۱۳
W.x+b=0
که w بردار وزنها وn تعداد صفات و b یک عدد است اگرb به عنوان یک وزن اضافی در نظر بگیریم معادله بصورت رابطه ۲-۱۴ است.
رابطه ۲-۱۴
اگر این نقطه بالا جدا کننده ابر صحفه باشد معادله بصورت رابطه ۲-۱۵ است.
رابطه ۲-۱۵
اگر این نقطه پایین جدا کننده ابر صحفه باشد معادله بصورت رابطه ۲-۱۶ است
رابطه ۲-۱۶
فرم در حال بارگذاری ...