وبلاگ

توضیح وبلاگ من

مطالب درباره بررسی و تشخیص نفوذ با استفاده از الگوریتم های داده ...

 
تاریخ: 05-08-00
نویسنده: فاطمه کرمانی

رابطه ۲-۱۲

 

 

 

 

 

در این رابطه مقدار z از جدول مربوط به توزیع نرمال بدست می ­آید. متغیر f دقت دسته بندی در N بار امتحان است‎[۴].

۲-۲-۵-۳ روش K-DTREE

مشکل الگوریتم­های بالا سرعت کم است که با تعداد نمونه آموزشی رابطه مستقیم دارد به عبارتیO(D) است اگر اندازه مجموعه آموزشیD باشد. برای جل این مشکل از روش K-Dtree استفاده می­کنیم. این روش از روی نمونه­های آموزشی درختی می­سازد که گره­های آن نمونه­ها هستند.K ، تعداد ویژگی­ها است. در واقع نمونه­ها را به عنوان نقاطی در فضای k بعدی در نظر می­گیرد. این درخت دودوی ی فضای ورودی را به بخش­های ی افراز می­ کند. روال کلی بدین صورت است که در هر مرحله یک ویژگی انتخاب شده و بر اساس آن تقسیم بندی مجدد انجام می­ شود. تمام تقسیمات موازی بوده و در نهایت هر ناحیه دارای حداکثر یک نقطه است[۴].
پایان نامه - مقاله - پروژه
شبه کد الگوریتم K-Dtreeدر شکل ۲-۷ آمده است. در این الگوریتم بازگشتی، در هر مرحله یک ویژگی به تناوب و با توجه به عمق انتخاب می­ شود. میانه حول آن محاسبه شده و نهایتا روال بصورت بازگشتی برای نقاط سمت چپ و راست میانه و با افزایش عمق فراخوانی می­ شود در واقع این روش یک روش شاخص­گذاری[۲۶] برای جستجوی سریع است.‎[۴]

شکل ۲-۷: شبکه کد مربوط به الگوریتم KDD [4]

۲-۲-۶ماشین بردار­پشتیبان

ماشین بردار­پشتیبان در دسته بندی داده ­های خطی و هم غیر­خطی کاربرد دارد. در دسته­بندی غیرخطی، این الگوریتم از یک نگاشت غیر خطی برای تبدیل داده ­های اصلی به ابعاد بالاتر استفاده می­ کند. در بعد جدید از یک بهینه خطی برای جداسازی ابر صحفه استفاده می­ کند. داده ­ها از دو کلاس، همیشه توسط یک ابرصفحه جدا شده می­شوند.ماشین بردار پشتیبان ابرصحفه را با بهره گرفتن از بردار پشتیبان(داده آموزشی) و حاشیه (توسط بردار پشتیان تعریف می­ شود) ایجاد می­ کند.‎[۴]

۲-۲-۶-۱ داده ­ها بطور خطی جدا پذیر هستند

مجموعه داده D بصورت
که مجموعه داده آموزشی همراه با برچسب، و y یکی از دو مقدار +۱ و -۱ است. ما نیازبه خطی داریم که مقادیر y از هم جدا و بهترین باشد. چون داده خطی است می­توان گفت که کوتاه­ترین فاصله از ابرصفحه به یک طرف حاشیه آن برابر است با کوتاه­ترین فاصله از ابرصفحه به طرف دیگر از حاشیه آن، هدف پیدا کردن ابرصفحه جداکننده با بیشترین فاصله از نقاط حاشیه­ای است که نقاط با را از نقاط با جدا کند.‎[۴]
هر ابر صحفه می ­تواند بصورت رابطه ۲-۱۳ تعریف شود

 

 

رابطه ۲-۱۳

 

W.x+b=0

 

 

 

که w بردار وزن­ها وn تعداد صفات و b یک عدد است اگرb به عنوان یک وزن اضافی در نظر بگیریم معادله بصورت رابطه ۲-۱۴ است.

 

 

رابطه ۲-۱۴

 

 

 

 

 

اگر این نقطه بالا جدا کننده ابر صحفه باشد معادله بصورت رابطه ۲-۱۵ است.

 

 

رابطه ۲-۱۵

 

 

 

 

 

اگر این نقطه پایین جدا کننده ابر صحفه باشد معادله بصورت رابطه ۲-۱۶ است

 

 

رابطه ۲-۱۶

 

 

 

 


فرم در حال بارگذاری ...

« بررسی ارتباط میان مولفه های مدیریت دانش با نوآوری سازمان- ...دانلود فایل های پایان نامه درباره الگوهای-مختلف-تحدید-حدود-فلات-قاره-ایران-در-خلیج-فارس- فایل ۸ »
 
مداحی های محرم