۴-۶-۲-شناخت خوشه های خروجی
برای طراحی مدل پیش بینی از نرم افزار RapidMiner استفاده شده است.برای طراحی مدل بدین گونه عمل شد که ابتدا داده های خرابی بر حسب تاریخ بصورت صعودی مرتب شدند تا فاصله بین رخداد خرابی از یک مورد تا مورد بعدی قابل تشخیص باشد.به دلیل تکراری بودن ۴ مورد خرابی تعداد داده های خرابی به ۲۸ مورد کاهش یافت.
با توجه به این مرتب سازی می توان برای پیش بینی مدت زمان خرابی سه گروه مختلف تعریف نمود.
ابتدا یک بازه زمانی در نظر گرفته می شود.(YY-XX)
حد پایین مقدار YY می باشد و حد بالا مقدار XX است.
اگر مدت زمان باقیمانده تا خرابی از XX روز بزرگتر باشد خوشه A است.
در غیر این صورت اگر مدت زمان باقیمانده تا خرابی از YY روز بزرگتر باشد خوشه B است.
در غیر این صورت خوشه C خواهد بود.
به زبان دیگر خوشه ها به شکل زیر تعریف می شوند:
- خرابی قبل از XX روز اتفاق نخواهد افتاد ، بنابراین عملیاتی نیاز نیست.
- خرابی در XX روز آینده اتفاق خواهد افتاد ، برای تعمیرات شروع به برنامه ریزی نمایید.
- خرابی در YY روز آینده اتفاق خواهد افتاد ، تعمیرات به زودی مورد نیاز است.
برای یافتن حدود YY,XX در بین ۲۸ حالت خرابی مورد نظر کمترین و بیشترین زمان بین دو خرابی را درنظر گرفته و سپس با تغییر حدود بازه سعی شده است بهترین مقادیر را برای YY,XX با تحلیل و تفسیر مشخص نمود.که ادامه این فرایند بررسی خواهد شد.
در این پروژه کمترین و بیشترین فاصله بین دو خرابی اتفاق افتاده از ۱ روز تا ۲۵ روز بوده است.
۴-۷-طراحی مدل با روش های داده کاوی
برای طراحی و توسعه مدل پیش بینی از سه روش داده کاوی استفاده شده است.یکی روش درخت تصمیم(DT)1 ، دیگری استفاده از شبکه های عصبی مصنوعی و یک نوع از این شبکه ها به نام Multilayer Perceptron (MLP)2 و آخرین روش مورد استفاده شبکه عصبی۳ KNN است.
برای بررسی و ایجاد مدل در هر دو روش ذکر شده بازه های زمانی متفاوت در نظر گرفته شد و در هر بازه زمانی از تعدادی از رکوردها به عنوان مجموعه داده آموزشی و از تعدادی دیگر به عنوان مجموعه داده آزمایشی مورد استفاده قرار گرفت.
۱ Decision Tree
۲ Multilayer Perceptron
۳ K Nearest Neighbor
بازه های زمانی تعریف شده برای مدل مورد نظر در جدول زیر مشخص است.
جدول ۱۸ – بازه های زمانی تعریف شده برای مدل
XX-YY
ردیف
۲۵–۱۰
۱
۲۰–۱۰
۲
۱۵–۵
۳
۱۵–۳
۴
فرم در حال بارگذاری ...