پس از آشنا شدن با نحوهی اجرای پروژههای دادهکاوی و مراحل استخراج دانش، لازم است تمرکز بیشتری بر روی دادهکاوی و وظایفی که توسط آن قابل انجام است، و همچنین ابزار و تکنیکهای دادهکاوی داشته باشیم.
وظایف دادهکاوی
دادهکاوی بطور کلی به دو شکل هدایت شده[۴۲] و غیرهدایت شده[۴۳] وجود دارد(شهرابی ۱۳۹۰a). در دادهکاوی هدایت شده با داشتن یک متغیر هدف خاص و از پیش تعیین شده به دنبال الگویی خاص میگردیم، بطوری که در دادهکاوی غیرهدایت شده هیچ متغیر هدفی وجود نخواهد داشت و هدف یافتن تشابهات بین گروههایی از اطلاعات است. اگر بخواهیم تکنیکهای دادهکاوی را بر اساس فعالیت و وظیفه تقسیمبندی کنیم، شش عمل زیر را خواهیم داشت(Larose 2005):
در این تقسیمبندی سه مورد اول دادهکاوی هدایت شده هستند، همبستگی و خوشهبندی جزو دادهکاوی غیر هدایت شده است و توصیف و نمایهسازی نیز میتواند هم هدایت شده و هم غیر هدایت شده باشد. در ادامه به توضیح مختصری از هر یک از این وظیفهها میپردازیم.
دستهبندی
تکنیکهای دستهبندی از جمله تکنیکهای رایج و پرکاربرد در دادهکاوی است. دستهبندی شامل بررسی ویژگیهای یک شی جدید و تخصیص آن به یکی از کلاسهای از قبل تعیین شده است(شهرابی ۱۳۹۰a). به عبارت دیگر، در مسائل دستهبندی هدف شناسایی ویژگیهایی از دادهها است که گروهی که داده به آن تعلق دارد را نشان میدهند. از این مدل هم میتوان برای درک دادههای موجود استفاده کرد وهم میتوان آن را برای پیشبینی اینکه دادههای جدید به کدام گروه تعلق دارند بکار برد. به همین دلیل اغلب به ویژگیهای شناسایی شده متغیرهای پیشگو[۵۰] و به برچسب کلاسها متغیر هدف[۵۱] گفته میشود.
برای ایجاد یک مدل دستهبندی نیاز به مجموعه دادههای تاریخی است. این مجموعه داده که مجموعه داده آموزشی[۵۲] نامیده میشود شامل هم متغیرهای پیشگو و هم متغیر هدف است. به این طریق، مدل یاد میگیرد که چه ترکیبی از متغیرهای پیشگو به کدام متغیر هدف مربوط میشوند. سپس، مدل آموزش دیده شده میتواند کلاس مجموعه دادههای تست[۵۳] را که هیچ اطلاعی از متغیر هدف آنها نداریم، پیشبینی کند. (معمولا کارایی مدلهای دستهبندی را با مجموعه دادههای اعتبارسنجی[۵۴] اندازهگیری میکنند.)
از جمله تکنیکهای دستهبندی میتوان به درخت تصمیم، دستهبند بیزین، k- نزدیکترین همسایه (KNN)، شبکه عصبی و SVM اشاره کرد.
تخمین
تخمین شبیه دستهبندی است با این تفاوت که متغیر هدف بجای این که دستهای باشد بصورت عددی است (Larose 2005). مانند دستهبندی، یک مدل تخمین با بهره گرفتن از رکوردهای کاملی که حاوی مقادیر متغیر هدف و متغیرهای پیشگو است ساخته میشود. سپس، برای مشاهدات جدید، مقدار متغیر هدف بر اساس مقادیر متغیرهای پیشگو تخمین زده میشود.
مدلهای رگرسیون و شبکه عصبی از جمله تکنیکهای مناسب دادهکاوی برای تخمین هستند.
پیشبینی
پیشبینی مانند تخمین و دستهبندی است بجز اینکه در پیشبینی نتایج به آینده مربوط میشود(Larose 2005). تمامی تکنیکهای استفاده شده در دستهبندی و تخمین را میتوان تحت شرایط خاص برای پیشبینی بکار گرفت. پیشبینیهایی که بر اساس مدلهای دستهبندی ارائه میشوند دارای یک خروجی گسسته هستند که برچسب کلاس را برای آن مشاهده پیشبینی میکنند.
پیشبینی مقادیر پیوسته بر اساس یک سری خصوصیات داده شده، نوعی از پیشبینی است که به عنوان مثال میتوان به پیشبینی درآمد یک فرد بر اساس مشخصات وی اشاره کرد. درخت تصمیم و شبکههای عصبی تکنیکهایی هستند که در این نوع پیشبینیها قابل استفاده هستند. نوع دیگری از پیشبینیها، پیشبینی یک یا چند مقدار بر اساس الگوهای تکراری و متوالی است. پیشبینی سطح سهام بازار در ۳۰ روز آینده بر اساس دادههای ۶ ماه گذشته مثالی از این نوع پیشبینیها است. این گونه پیشبینیها به کمک سریهای زمانی و تکنیکهای رگرسیون انجام میشود.
همبستگی
قوانین همبستگی[۵۵] که گروهبندی شباهت[۵۶] نیز نامیده میشوند برای تعیین ویژگیهای همزمانی هستند که در وقوع یک پدیده رخ میدهند. به عبارت دیگر، گروهبندی شباهت احتمال وقوع و یا عدم وقوع همزمان ویژگیها را تعیین می کند(شهرابی ۱۳۹۰a). با توجه به مقیاسپذیری الگوریتمهای قوانین همبستگی و حجم دادهها که دائما در حال افزایش است، میتوان قوانین همبستگی را یکی از ابزارهای ضروری دادهکاوی جهت استخراج دانش از دادهها قلمداد کرد.
تحلیل سبد خرید[۵۷] یکی از بارزترین کاربردهای قوانین همبستگی بشمار میرود. در این تحلیل سعی میشود تا از طریق یافتن روابط و وابستگیهای موجود بین اجناس خریداری شده توسط مشتریها، الگوهای خرید شناسایی و تحلیل شوند(شهرابی and شجاعی ۱۳۸۸). به عنوان مثال، برای مشتری که شیر خریداری کرده چقدر احتمال دارد نان نیز خریداری کند. خروجی این تحلیل قوانینی به صورت قوانین اگر – آنگاه است که افراد را در رقابتهای بازاریابی و نیز چیدمان مناسب اجناس در فروشگاهها یاری میرساند. به منظور سنجش کیفیت یک قانون از مفاهیم پشتیبانی[۵۸] و اطمینان[۵۹] استفاده میشود.
پشتیبانی: درصدی از تراکنشهایی است که شامل هم مقدم و هم تالی قانون باشند (Witten and Frank 2005). به عبارت دیگر، برابر است با نسبت تعداد تراکنشهایی که شامل مقدم و تالی هستند به تعداد کل تراکنشها.
اطمینان: درصدی از تراکنشهایی است که وقتی مقدم قانون در آن ظاهر شده است، تالی نیز در آن وجود داشته باشد (Witten and Frank 2005). به عبارت دیگر، برابر است با نسبت تعداد تراکنشهایی که شامل مقدم و تالی هستند به تعداد تراکنشهایی که شامل مقدم هستند.
خوشهبندی
خوشهبندی به عمل تقسیم جمعیت ناهمگن به تعدادی زیر مجموعه یا خوشههای همگن گفته میشود(شهرابی ۱۳۹۰a). وجه تمایز خوشهبندی از دستهبندی این است که خوشهبندی به دستههای از پیش تعیین شده تکیه ندارد. در خوشهبندی هیچ دسته از پیش تعیین شدهای وجود ندارد و دادهها صرفا بر اساس تشابه گروهبندی میشوند. بنابراین، برای اینکه بتوانیم دادهها را خوشهبندی کنیم باید بتوانیم میزان شباهت آنها را بدست آوریم. اینکار معمولا با بهره گرفتن از مقیاسهای اندازهگیری فاصله که معرفترین آنها فاصله اقلیدسی است، انجام میشود.
چنانچه مشخص است، تعداد حالتهای زیادی برای خوشهبندی n داده در k خوشه وجود دارد؛ تعداد این حالات حتی با در اختیار نداشتن تعداد خوشهها (k) نیز افزایش خواهد یافت. به همین دلیل نیاز به معیارهایی برای سنجش اعتبار خوشهبندی داریم. فشردگی و تفکیکپذیری دو ویژگی اساسی و جالب در مورد خوشهها هستند که میتوانند به عنوان شاخص اعتبار خوشه محاسبه شوند(شهرابی and شجاعی ۱۳۸۸).
فشردگی: فشردگی، بیان کننده این موضوع است که عناصر موجود در خوشه چقدر به یکدیگر نزدیک هستند. به عنوان مثال،واریانس عناصر نشان دهنده فشردگی دادهها است؛ بطوری که هرچه واریانس کمتر باشد، فشردگی دادهها بیشتر است. میتوان فاصله میان عناصر موجود در خوشه را نیز محاسبه کرد.
تفکیکپذیری: بوسیله این ویژگی، مجزا بودن خوشهها را ارزیابی میکنیم. یکی از روشهای تعیین تفکیکپذیری، محاسبه فواصل بین خوشهای است.
بنابر آنچه گفته شد، به دنبال ساختاری هستیم که عناصر درون خوشهها بیشترین شباهت را با یکدیگر و بیشترین اختلاف را با دیگر خوشهها داشته باشند. به عبارت دیگر، ساختاری را مطلوب میپنداریم که در آن مقادیر فواصل درون خوشهای کم و مقادیر فواصل بین خوشهای زیاد باشد.
در کتاب هان و کرامبر روشهای خوشهبندی به پنج دسته تقسیم شده است: روشهای بخشبندی، روشهای سلسلهمراتبی، روشهای مبتنی بر تراکم، روشهای مبتنی بر Grid و روشهای مبتنی بر مدل (Han, Kamber et al. 2011). در ادامه به توضیح مختصری از هر یک از دسته ها میپردازیم.
خوشهبندی مبتنی بر بخشبندی[۶۰]: در این نوع خوشهبندی اساس کار یک تابع هدف مشخص است که کمینهسازی آن، ما را به کشف ساختار موجود در مجموعه داده رهنمون میسازد (شهرابی and شجاعی ۱۳۸۸). با وجود آنکه ساختار الگوریتمی بسیار جذاب و متقاعدکننده است (مسئله بهینهسازی را میتوان به خوبی فرموله کرد)؛ ولی، از آنجایی که شخص نمیداند چه نوع ساختاری را باید انتظار داشته باشد، تعیین مناسبترین فرم برای تابع هدف با دشواریهای فراوانی همراه است. بطور معمول، در این گروه از الگوریتمها، تعداد خوشهها را از قبل تعیین کرده و کار را با بهینهسازی تابع هدف ادامه میدهند.
الگوریتمهایی مانند [۶۱]CLARA، [۶۲]CLARANS، k – means، c – means و [۶۳]PAM نمونههایی از الگوریتمهای این گروه هستند (Mitra and Acharya 2003).
خوشهبندی سلسلهمراتبی: در این نوع از روشهای خوشهبندی، دادهها در درختی از خوشهها گروهبندی میشوند. به طور کلی روشهای سلسلهمراتبی را میتوان به دو دسته تقسیم کرد: روشهای جمعکننده[۶۴] و روشهای تقسیمکننده[۶۵] (شهرابی and شجاعی ۱۳۸۸). روشهای جمعکننده در ابتدا هر داده را در خوشهای جداگانه قرار میدهند. سپس خوشهها را با هم ادغام کرده و خوشههای بزرگتری ایجاد میکنند. این کار تا زمانی ادامه مییابد که یا تمام دادهها در یک خوشه واحد قرار گیرند و یا شرط معینی برقرار شود، مثلاً تعداد خوشهها به مقدار دلخواه برسد. در هر مرحله خوشههایی به هم متصل میشوند که بیشترین شباهت را با هم دارند. برای بررسی میزان شباهت خوشهها الگوریتمهای مختلفی وجود دارد. دسته دوم که روشهای تقسیمکننده نامیده میشوند عکس روش فوق را اعمال میکنند، یعنی درخت را از بالا به پایین میسازند.
برای بررسی میزان شباهت خوشهها میتوان فاصله بین خوشهها را معیار مناسبی در نظر گرفت. روشهای مختلفی مانند روش تکاتصالی[۶۶]، اتصالی کامل[۶۷] و اتصال میانگین گروهی[۶۸] برای محاسبه فاصله بین خوشهها استفاده میشود (شهرابی and شجاعی ۱۳۸۸).
خوشهبندی مبتنی بر تراکم: بسیاری از روشهای بخشبندی، دادهها را بر اساس فاصله آنها با یکدیگر خوشهبندی میکنند. چنین روشهایی فقط خوشههای کروی شکل را پیدا میکنند (مانند k – means). در خوشهبندهایی که بر اساس تراکم دادهها انجام میشود، میتوان خوشههایی پیدا کرد که دارای شکلهای پیچیدهتری هستند. ایده اصلی این روشها به این صورت است که یک خوشه تا زمانی که تراکم همسایگی تمامی اشیاء مرزی آن از حد معینی کمتر نشده گسترش مییابد. منظور از تراکم همسایگی یک شیء، تعداد اشیائی است که در فاصله ε از آن شیء قرار گرفتهاند. چنین روشهایی برای فیلتر کردن نویزها و یافتن خوشههایی با شکلهای دلخواه به کار میرود (Han, Kamber et al. 2011). الگوریتمهای DBSCAN[69]، OPTICS[70]، DENCLUE و [۷۱]CLIQUE در این دسته از الگوریتمها قرار میگیرند (شهرابی and شجاعی ۱۳۸۸).
خوشهبندی مبتنی بر Grid: در این نوع خوشهبندی فضای اشیاء را به تعداد محدودی سلول کوانتیزه میکنند که این سلولها یک Grid را بوجود میآورند. تمامی اعمال خوشهبندی بر روی ساختار این Grid (ساختار مشبک) انجام میشود. مزیت مهم این روش سرعت بالای آن است که مستقل از تعداد اشیاء بوده و فقط به تعداد سلولها در هر بعد از فضای کوانتیزه شده بستگی دارد. الگوریتمهای [۷۲]STING و CLIQUE نمونههایی از این الگوریتمها هستند.
خوشهبندی مبتنی بر مدل: الگوریتمهای این دسته، برای هر خوشه مدلی را در نظر گرفته و سعی میکنند به بهترین نحو دادهها را به آن مدلها انطباق دهند. دو راه عمده برای این کار وجود دارد: راه اول روشهای آماری مانند COBWEB و CLASSIT و راه دوم شبکههای عصبی مانند [۷۳]SOM است.
توصیف
گاهی اوقات هدف دادهکاوی، تنها توصیف آن چیزی است که در یک پایگاه دادهای پیچیده در جریان است. توصیف الگوها و روندها اغلب توضیحات ممکنی برای آن الگوها و روندها ایجاب میکند و درک ما را از مردم، محصولات و یا فرآیندهایی که دادهها در مرحله اول تولید کردهاند، افزایش میدهد.
مدلهای دادهکاوی باید تا حد ممکن شفاف باشند؛ به این معنی که نتایج مدلهای دادهکاوی باید الگوهای روشنی را که تمایلی به توضیح و تفسیر شهودی دارند، توصیف کنند. برخی از مدلهای دادهکاوی دارای تفسیر شفافتری نسبت به دیگر مدلها دارند. به عنوان مثال، درخت تصمیم توضیحات شهودی و انسان دوستانهای از نتایج خود فراهم میآورد؛ در حالی که شبکههای عصبی با ارائه مدلهای پیچیده نیاز به تفسیر نتایج دارند، به همین دلیل گاهی به شبکههای عصبی جعبه سیاه گفته میشود.
این شبکه ها بر مبنای مقایسه بین خروجی شبکه و هدف تعدیل میشوند و تا زمانی که خروجی شبکه با خروجی هدف تطبیق پیدا کند این کار ادامه مییابد. شبکه های آموزش یافته را میتوان به صورت رویهای از جعبه سیاه برای برآوردهای غیرخطی با عنوان نگاشتهای غیرخطی قابل تنظیم معرفی کرد، چرا که فضای بردار ورودی را به وسیله مجموعهای از توابع غیرخطی به فضای خروجی مرتبط میسازد. کاربردیترین نوع شبکه های عصبی، شبکه های پروسپترون چندلایه (MLP)[9] و شبکه های توابع شعاعی (RBF)[10] میباشد (کوچکزاده و بهمنی، ۱۳۸۴).
۱-۸-۱ ساختار شبکه عصبی مصنوعی
شبکه های عصبی اساساً حافظههایی هستند که اطلاعات را حفظ میکنند. درست همانطور که جای شبکه توزیع میگردد. ساختار شبکه عصبی از مدل نورون[۱۱]های زیستی الهام گرفته است و بسیاری از ویژگیهای نورونهای زیستی از قبیل غیرخطی بودن، سادگی واحدهای محاسباتی و قابلیت یادگیری را دارد. در یک نورون مصنوعی، هریک از مقادیر ورودی، تحت تاثیر وزنی قرار میگیرد که تابع این وزن شبیه اتصال سیناپسی در یک نورون طبیعی است. عناصر پردازشگر از دو قسمت تشکیل شدهاند. قسمت اول ورودیهای وزندار را با هم جمع میکند و قسمت دوم یک فیلتر غیر خطی است که تابع فعالیتهای نورون نامیده میشود. این تابع، مقادیر خروجی یک نورون مصنوعی را بین مقادیر مجانب فشرده میکند. این فشرده سازی باعث میشود که خروجی عناصر پردازشگر در یک محدوده مناسب قرار گیرند (محمدی منور، ۱۳۸۵). در شکل ۱-۱ ساختار یک نرون واقعی و یک مدل مصنوعی نشان داده شده است.
شکل ۱-۱ ساختار (a) یک نورون واقعی (b) مدل یک نورون مصنوعی(Sinanoglu et al., 2005).
در یک ANN، لایه ورودی به منزله پردازشگری است که پس از پردازش داده های ورودی، آنها را به شبکه میدهد. این لایه یک لایهی عصبی محاسباتی نیست زیرا لایه های آن نه وزن ورودی دارند و نه تابع فعالیت. لایه انتهایی لایه خروجی است که خروج شبکه را در پاسخ به یک ورودی خاص مشخص میکند. سایر لایه ها، لایه های میانی یا پنهان نامیده میشوند (Jain et al., 1996).
در شکل ۱-۲ ساختار یک شبکه عصبی مصنوعی نشان داده شده است.
شکل ۱-۲ ساختار یک شبکه عصبی مصنوعی (Vahdani et al., 2009)
۱-۸-۲- تشابهات شبکه عصبی مصنوعی و بیولوژیکی
الف) بلوکهای ساختاری هر دو شبکه مصنوعی و بیولوژیکی، دستگاه های محاسباتی خیلی سادهای هستند و علاوه بر این، نورونهای مصنوعی از سادگی بیشتری برخوردار میباشند.
ب) ارتباط بین نورونها، عملکرد شبکه را تعیین میکند.
اگرچه نورونهای بیولوژیکی از نورونهای مصنوعی بسیار کندتر میباشند اما عملکرد مغز خیلی سریعتر از عملکرد یک کامپیوتر معمولی است. علت این پدیده بیشتر به خاطر ساختار کاملا موازی نورونها میباشد (منهاج، ۱۳۸۴).
۱-۸-۳- توابع محرک[۱۲]
تابع محرک که به آن تابع فعال سازی یا تابع تبدیل نیز گفته میشود، ورودی خالص را به خروجی تبدیل میکند و بر اساس نیاز خاص مسالهای که قرار است بوسیلهی شبکه عصبی حل شود، میتواند خطی یا غیرخطی انتخاب شود. در حقیقت تابع محرک ارتباط بین ورودی و خروجی گرهها و شبکه را برآورد می کند. اما در عمل تعداد محدودی از توابع محرک مورد استفاده قرار میگیرند (منهاج، ۱۳۷۷(. در جدول (۱-۱) تعدادی از توابع محرک آورده شده است (منهاج، ۱۳۷۷(.
عموماً تابع محرک دامنه خروجی نورون را محدود میسازد و به همین علت آن را تابع محدود ساز نیز مینامند. از میان توابع فوق فقط تعداد محدودی در عمل کاربرد داشته و نتایج مناسبی ارائه مینمایند. از جمله میتوان به توابع زیگموئیدی، تانژانت هیپربولیک، سینوسی، کسینوسی و خطی اشاره نمود. در هر صورت، پژوهشگران شبکه عصبی ترجیح میدهند از توابع محرک غیر خطی استفاده کنند. در این میان تابع زیگموئیدی بیش از سایر توابع کاربرد دارد(Zhang and Hu, 1998).
جدول ۱-۱ انواع توابع محرک
ردیف | نام تابع | تعریف تابع |
۱ | خطی | |
۲ | خطی مثبت | |
۳ | آستانهای خطی | |
۴ | آستانهای خطی متقارن | |
۵ | زیگموئیدی (لوجستیک) | |
۶ | تانژانت هیپربولیک (تانژانت زیگموئیدی) |
بیرون نکرد ســر ز گریبان آســـــتین
(نگانی، ۱۳۵۴: ۷۸۱- ۷۸۰)
حتّی شاعری همچون صائب که به دربار پادشاه بابری هندوستان متصّل بود، خواهشی برای پیوستن وی به دربار نکرده بود. غنی حتّی با حاکم کشمیر، سیف خان نیز مراودهای نداشت. اما از برخی از ابیات دیوان غنی برمیآید که وی برای مدّت کوتاهی به پایتخت بابریان مهاجرت کرده است.
۲-۲-۷ ادبیّات در دوره گورکانیان هند
دوره بابریان، نقطهی اوج گسترش ادبیّات فارسی در هند است. در دوره پادشاهی همایون (۹۳۷ـ۹۶۴)، به ویژه پس از بازگشت او از تبعید اجباری به ایران، اهمّیّت زبان فارسی افزایش یافت و روند فارسیگرایی برتمام جنبه های فرهنگ هندی ـ اسلامی اثر نهاد. تا دوره اکبر، برتری زبان فارسی آن چنان تثبیت شد که در ۹۹۰، در تمام قلمرو امپراتوری بابریان، زبانِ رسمی و دیوانی اعلام شد.
در این دوره، آثار منظوم رواج بیشتری داشت. عامل مهم در غنای شعر بابری، مهاجرت برخی از شاعران ایرانی به هند بود که بیشتر آنان از حمایت اشراف برخوردار گردیدند اما شکوفایی واقعی شعر بابری از دوره اکبر آغاز شد که بسیاری از شاعران برجسته از جمله غزّالی مشهدی (متوفّی ۹۸۰)، فیضی (متوفّی ۱۰۰۴) و عرفی (متوفّی ۹۹۹) را به دربار خود دعوت کرد. مهاجرت شاعران ایرانی در دوره سلطنت جهانگیر و شاه جهان، همچنان ادامه یافت. طالب آملی (۱۰۳۶) مهمترین شاعر دربار جهانگیر، ملکالشعرای دربار او بود. صائب (متوفّی ۱۰۸۱)، که مشهورترین شاعر ایرانی سده یازدهم محسوب می شود، جایگاه خاصّی در دربار شاه جهان داشت . در دوره پادشاهی اورنگ زیب، حمایت رسمی از شاعران پایان یافت و مقام ملکالشعرایی منسوخ شد. اما یکی از مشهورترین شعرای سبک هندی در دوره او، بیدل دهلوی (۱۰۵۴ـ۱۱۳۳) بود که اشعارش نمایانگر اوج سبک هندی است. گرچه دراین دوره سبک هندی در شعر فارسی به کمال رسید، مکان و چگونگی پیدایش و نضج این سبک به بحث نیاز دارد. از قرن دوازدهم به بعد، اهمّیّت زبان اردو پیوسته روبه فزونی نهاد و جایگزین فارسی به عنوان زبان ادبی شد؛ با اینهمه نفوذ مستمر زبان فارسی به عنوان بخشی از فرهنگ هندی ـ اسلامی و ظهور بسیاری از شاعران دوزبانه که به فارسی و اردو شعر میسرودند، آشکار است. غالب دهلوی (۱۲۱۲ـ۱۲۸۵) شاخصترین شاعر دوزبانه بود. افزون بر سرودن شعر، تاریخنگاری و نوشتن شرح حال، در متون ادبی دوره بابری جایگاهی ویژه دارد.
آثار تاریخی این دوره را میتوان به سه دسته بزرگ تقسیم کرد. تاریخهای جهانی، تاریخهای عمومی و تاریخهای سلسلههای خاص. از مشهورترین تاریخهای گروه نخست تاریخ الفی است و در گروه دوم طبقات اکبری، منتخبالتواریخ و گلشن ابراهیمی (= تاریخ فرشته ) از جمله آثار معروف اند که اهمیّتی خاص دارند. از مهمترین متون تاریخی گروه سوم، تذکره همایون و اکبر است. برجستهترین تاریخ دوره بابری و یکی از بزرگترین تاریخهای نوشته شده درهند، اکبرنامه ابوالفضل علاّمی (متوفّی ۱۰۱۱)، در شرح مفصّل زندگی اکبر و رخدادهای سلطنت اوست. آیین اکبری نیز کتاب برجسته دیگری از همان نویسنده است که به اوضاع اجتماعی، فرهنگی و دیوانی دوره اکبر پرداخته است. کتاب مهمّ دوره جهانگیر، اقبالنامه جهانگیری تألیف معتمدخان (متوفّی ۱۰۴۹) و تاریخهای عمده دوره شاه جهان، پادشاهنامه اثر لاهوری و عمل صالح تألیف محمّدصالح است. در زمان اورنگزیب، محمّد کاظم (متوفّی ۱۰۹۲) کتابی به نام عالمنامه نوشت که محمّدساقی مستعدخان (متوفی ۱۱۳۶) ادامه آن را نگاشت. و در مآثرعالمگیری رویدادهای دوره بابری را تا پایان سلطنت اورنگزیب بیان کردهاست.
یکی از ارزندهترین متون شرححالی، مآثرالامرا تألیف عبدالرزاق اورنگآبادی (متوفی ۱۱۷۱) است که دایرهالمعارف گونه ای در برگیرنده یادداشتهایی درباره بزرگان و اشراف دوره بابری از زمان اکبر تا روزگار نویسنده است . از دیگر گونه های ادبی که در دوره بابری اهمیّت یافت ، انشابود که نخستین نمونه آن نامه های ابوالفضل است. این اثر به سبب سبک ساده آن ـ که با سیاق کلام متکلّف و خشک آثار تاریخی تفاوت دارد ـ شایان توجّه است. دوره بابریان، همچنین شاهد رشد ترجمه در راستای برگرداندن آثار ادبیّات هندی به زبان فارسی بود. نهضت ترجمه، مانند دیگر زمینه های ادبیّات، پیشرفت خود را از دوره اکبر آغاز کرد که به گفته ابوالفضل، اکبر مشوق ترجمه آثار هندی به فارسی بود. مهمترین این متون عبارتاند از حماسه مهابهاراتا (باعنوان فارسی «رزمنامه» ) و رامایانا مجموعه ای از افسانهها، باعنوان «نامهی خردافروز» ترجمه بداؤنی.
سبک مسلّط نثر بابری شباهتهای خاصّی با نثر فارسی در ایران دارد؛ و آثاری چون تاریخ وصّاف و ظفرنامه بیان کننده این امر است.
۲-۲ –۸ غنی، صائب و کلیم
اکثر تذکرهنویسان برآنند که صائب و غنی همعصر بوده اند و با هم مراوداتی داشته اند. چنانکه صائب « از دیوانش، دو صد بیست (۲۲۰) [بیت] انتخاب نموده، در بیاض خود رقم کرد. »(ظفرخان، ۱۳۴۲: ۴۶) درباره این مراودات و ملاقات دو شاعر ـ حکایات عجیبه گفتهاند که با حقیقت وفق نمیدهد و عقل سلیم از تسلیم کردن آنها خودداری می کند. » (همان) یکی از این حکایات، حکایت ذیل است:«چون ملکالشعراء میرزا صائب تبریزی به همراهی ظفرخان[۱۰] به کشمیر رفت با این نابغه کشمیر ملاقات کرد و بسیار تحت تاثیرش قرار گرفت. بعد چندین شعر در استقبال غزلهای غنی ساخت- شاعر کشمیر یک نسخه دیوان منتخب خود را به میرزا تقدیم نمود- به قول حسن مرادآبادی چون نظر ملکالشعراء بر این شعر غنی افتاد که میگوید:
حسن سبزی به خطّ سبز مرا کرد اسیر
دام همرنگ زمین بود گرفتار شدم
چنان خوشش آمد که بنا به روایت، حاضر شد تمام دیوان غزلیات خود را در مقابل آن عوض کند. »(نگانی، ۱۳۵۲: ۷۸۲- ۷۸۱)
بعدها این رابطه مستحکمتر نیز شد. چنان که مؤلّف تذکره حسینی گفته بود، صائب در ایران، همیشه منتظر ارمغانی از اشعار غنی بود که مسافران بازگشته از هند برای او میآوردند.
رابطه غنی و کلیم، رابطهای عاطفیتر است چه آندو در کشمیر بیشتر با هم مراوده داشته اند. حتّی در مجلسی که او و قدسی خراسانی و ملّامحسن فانی به همراه بزرگان شعر و ادب و حکمت کشمیر تدارک دیده بودند، همیشه در کنار هم حاضر میشدند. بالأخره، در وفات کلیم، مادّهتاریخ مشهور غنی یکی از زیباترین مادّهتاریخهاست.
۲-۲-۹ غنی و عزلت
سخنسرایان معاصرش قصیدهسرایی پادشاهان و مدحتگویی امراء و اعیان را وسیله کسب معاش و نشانه امتیاز میدانستند ولی او مردی با وقار و دیندار و فقیرمنش و قانع بود. بنابراین در تمام زندگیاش نه قصیدهای ساخت و نه در مدح کسی سخنی پرداخت:
به چشمم آب و رنگی نیست خوان پادشاهان را
که دارد کاسه درویش نعمت های الوان را
چشم کــــرم مدار ز شاهــان که جـز نمــــد
آیینه خلعتی ز سکنـــدر نیافـــته است
(نگانی ، ۱۳۵۴: ۷۸۱- ۷۸۰)
«نامبرده کلبهی کوچکی داشت و گوشهگیری را ترجیح میداد. وقتی خارج از کشور مسافرت کرد، خیلی دلتنگ شد و اظهار داشت:
کرده است هوای هند دلگـــیر مرا
پس از تأمین مالی سرمایهگذاری های خود میتواند به صورت پرداخت های متقابل به تأمین کنندگان مالی پرداخت نماید. پرداخت های متقابل به صورت بازخرید سهام، تقسیم سود، پرداخت بهره وام ها و یا باز پرداخت اصل وام ها می باشد.
۲-۴-۵-۲-۳)اهمیت جریان های نقدی آزاد
پژوهش های مختلفی نشان داده اند که ارزش جریان های نقدی آزاد می تواند به عنوان معیاری برای سهامداران تلقی شود و آن را تضمین کند.(تهرانی و باقری،۱۳۸۷). اما پن من بر این مطلب تردید دارد. وی معتقد است ارزش جریان های نقدی آزاد تحت تاثیر سیاست های سرمایه گذاری واحد تجاری قرار دارد. واحدهای تجاری در حال رشد به دلیل سرمایه گذاری زیاد، جریان های نقدی آزاد منفی یا مثبت اندک برخوردارند. در حالی که در واحدهای تجاری دارای رشد در حال نزول، به دلیل عدم سرمایه گذاری وجوه خود، با جریان های نقدی آزاد مثبت یا بالا مواجه اند. بر اساس این استدلال پن من می گوید، این بدان معنی نیست که واحدهای تجاری با جریان های نقدی آزاد منفی یا مثبت اندک در مقایسه با واحد های تجاری با جریان های نقدی آزاد مثبت زیاد عملکرد ضعیفی دارند. بنابراین جریان های نقدی آزاد به تنهایی نمی توانند به عنوان معیاری برای تعیین ارزش برای سهامداران تلقی شود. لذا لازم است عواملی مورد بررسی قرار گیرند که می توانند بر رابطه بین جریان های نقدی آزاد و ارزش برای سهامدار موثر باشند(Penman,2001)
یاد یانتی(۲۰۰۳) پس از بررسی ارتباط بین جریان های نقدی آزاد و ارزش برای سهامداران به این نتیجه رسید که اگر واحد تجاری فرصت های رشد بالایی داشته باشد در این صورت جریان های نقدی آزاد بالا باعث ایجاد افزایش ارزش برای سهامداران می شود(اثر مثبت عامل فرصت رشد بر ارتباط جریان های نقدی آزاد و ارزش برای سهامداران) همچنین نتایج تحقیقات وی نشان دهنده تاثیر منفی مدیریت سود بر ارتباط بین جریان های نقدی آزاد و ارزش برای سهامداران می باشد. (Yudianti,2003) محتوای اطلاعاتی جریان های نقدی آزاد به طور خلاصه در جدول صفحه بعد ارائه شده است:(مهام و همکاران،۱۳۸۷)
وضعیت جریان های نقدی | اخبار بد | اخبار خوب |
جریان های نقدی آزاد مثبت | شرکت وجه نقدی بیشتر از نیاز برای طرح های سودآور تولید وبقیه را در طرح های غیر سود آور ضایع می کند. | شرکت وجه نقد عملیاتی ایجاد می کند که بیشتر از نیازهای او برای طرح های سودآور است. |
جریان های نقدی آزاد منفی | شرکت در ایجاد وجه نقد عملیاتی کافی برای پوشش نیازهای سرمایه گذاری خود برای رشد آتی خود ناتوان است. | شرکت آنقدر طرح های سودآور دارد که وجه نقد عملیاتی بدست آمده برای آن طرح ها کافی نیست. |
یادیانتی(۲۰۰۳) طی تحقیقات خود به این نتیجه رسید که تنها جریان های نقدی آزاد مثبت دارای محتوای به منظور پیش بینی ارزش برای سهامداران است و نتایج برای جریان های نقدی آزاد منفی بی معنی است. به عبارت دیگر جریان های نقدی آزاد منفی، معیار مناسبی برای پیش بینی ارزش برای سهامدار تلقی نمی گردد.
۲-۴-۵-۲-۴)جریان های نقدی آزاد معیارارزیابی واحد های تجاری
ارزیابی واحد تجاری بر مبنای سود خالص دارای محدودیت هایی از قبیل مدیریت سود می باشد و لذا نمی تواند به عنوان مبنایی مناسب برای تعیین ارزش به کار برده شود. لذا برای تعیین ارزش شرکت مدل هایی نظیر ارزش افزوده اقتصادی و جریان های نقدی آزاد مطرح گردید.(تهرانی و باقری،۱۳۸۷)
برای تعیین ارزش شرکت فـقط مراجعه به ترازنامه کافی نیست. ترازنامه شرکت در بهترین حالت میتواند معیاری برای تعیین سرمایه بکار گـرفته شده، یعنی وجوهی باشد که توسط سرمایهگذاران در شرکت تامین شده است. تبدیل چنین سرمایـهای به ارزش بستگی به موفقیت مدیریت در زمینه کسب عایداتی که این سرمایه تحصیل میکند و نرخ تنزیل این عایدات دارد. طبق مدل اقتصادی،تعیین ارزش مستلزم برای تعیین ارزش شرکت (تعیین جریان های نقدی آزاد) فـقط مراجعه به ترازنامه کافی نیست چون ترازنامه تنها بیانگر آن است که در گذشته واحد تجاری چقدرمنابع پـولی در آن واریز شده است و اگر بخواهیم ارزش شرکت را محاسبه نماییم باید مقدار منابع پولی را محـاسبـه نماییم که از آن ایجاد می شود یعنی ارزش فعلی وجوهی که تعیین کننده ارزش شرکت است از دارایـی های شـرکت تحـصیل می شود. به بیان دقیقتر، ترازنامه شرکت در بهترین حالت میتواند معیاری برای تعیین سرمایه بکار گـرفته شده، یعنی وجوهی باشد که توسط سرمایهگذاران در شرکت تامین شده است. تبدیل چنین سرمایـهای به ارزش بستگی به موفقیت مدیریت در زمینه کسب عایداتی که این سرمایه تحصیل میکند و نرخ تنزیل این عایدات دارد. طبق مدل اقتصادی،تعیین ارزش مستلزم پیشبینی جریان های نقدی آزاد واحد تجاری میباشد.(ایزدی نیا،۱۳۸۴)
نحوه تعیین ارزش شرکت به وسیله جریان های نقدی آزاد به شرح زیر است:
“ارزش فعلی کلیه جریان های نقدی آزاد آتی در طی عمر بر آوردی واحد تجاری= ارزش”
جریان های نقدی آزاد واحد تجاری با بهره گرفتن از نرخ تنزیل مناسب تنزیل میشود که همان میانگین موزون هزینه سرمایه واحد تجاری اسـت. این نرخ میانگین، هزینه منابع مالی مختلفی است که در اختیار شرکت گذاشته شده است یعـنی هر کدام از این منابع مالی بر حسب وزن خود در ساختار سرمایه و نرخ خاص هزینه خود در محـاسبه نرخ میانگین موزون هزینه سرمایه دخالت دارند. (Fernandez,2008) فرمول نظری ارزشیابی شرکت با عمر معین و محدود n دوره به قرار زیر است:
از آنجا که شرکت های سهامی عام در دنیای امروز دارای تداوم فعالیت و عمرناشناخته و معمولا بی انتها هستند از این رو ارزش این شرکت ها، ارزش فعلی جریانهای نقدی بی انتها و دائمی است . اما چون نمی توان جریان های نقدی دایمی و بی انتها را تخمین زد، لذا جریان های نقدی را برای دوره مشخص رشد تخمین زده و سپس در پایان این دوره ارزش نقطه پایانی[۲۸] را محاسبه مینماییم. در نهایت، تمام ارزش های محاسبه شده را با توجه به زمانبندی این ارزش ها تنزیل میکنند. پس می توان معادله کلی زیر را در این رابطه نوشت:
عمده مدل های ارزشیابی مبتنی بر جریان های نقدی آزاد براساس معادله فوق تنظیم میشود. بدین ترتیب ارزش شرکت به میزان جریان های نقدی آتی، زمانبندی و ریسک این جریانات بستگی دارد. این شیوه ارزشیابی تمام عناصر مؤثر بر ارزش شرکت را مدنظر قرار میدهد و با دیدگاه سرمایهگذاران سازگار است که انتظار دریافت وجوه نقد آتی را دارند. (ایزدی نیا،۱۳۸۴)
۲-۴-۵-۳)الگوی ارزش افزوده اقتصادی
۲-۴-۵-۳-۱)تعریف ارزش افزوده اقتصادی
ارزش افزوده اقتصادی به عنوان مقیاسی از منافع سهامداران است و مدیران نیز با همان هدف مشمول ارزیابی و اعطا پاداش قرار می گیرند. ارزش افزوده اقتصادی مفهوم جدیدی نیست بلکه همان مفهومی است که اقتصاددانان آن را سود اقتصادی می نامیدند لیکن تا این اواخر فاقد روش اندازه گیری بود. بعد از دوره تکوینی نسبتاً طولانی اندازه گیری ارزش افزوده اقتصادی توسط شرکت استرن استوارت[۲۹] در سال ۱۹۸۹ آغاز گردید از آن زمان تاکنون بیش از ۳۰۰ شرکت در نقاط مختلف جهان با این سیستم خود را سازگار نموده اند که از آن جمله می توان از شرکت های زیر نام برد: (ایزدی نیا،۱۳۸۴)
تیت و لیل | بریجس و استراتون | کوکاکولا |
w.x+b = -1
w.x+b = 0
SV
SV
SV
کلاس ۱-
کلاس ۱
شکل ۲- ۶: دستهبند ماشین بردار پشتیبان [۲۶]
همانطور که در شکل (۲-۶) مشاهده میشود فراصفحههایی که از نزدیکی دادههای آموزش میگذرند حساس به خطا میباشند و احتمال اینکه برای دادههای خارج از مجموعه آموزش قدرت تعمیم دهی خوبی داشته باشند بسیار کم است. در عوض، به نظر میرسد فراصفحه ای که بیشترین فاصله را از تمام نمونههای آموزشی دارد قابلیتهای تعمیم دهی مناسبی را فراهم آورد. نزدیکترین دادههای آموزشی به فراصفحههای تفکیک کننده را بردار پشتیبان (SV[13]) نامیده میشوند [۲۶]. اگر مجموعه داده به صورت نشان داده شود. Yi میتواند مقدار ۱ و ۱- دریافت کند که توسط این ثابتها دستهه ای نقاط Xi مشخص میگردد که هر Xi یک بردار n بعدی است. هنگامی که دادههای آموزشی که در دستهه ای صحیح دستهبندی شدهاند را در اختیار داریم، SVM توسط تقسیمبندی فراصفحه ای آنها را از هم جدا کرده و در دستهه ای جداگانه قرار میدهد به طوری که ، بردار W نقاط عمودی فراصفحهها را جدا میکند و b میزان حاشیه را مشخص میکند. فراصفحههای موازی را میتوان به صورت و تعریف کرد.
اگر دادههای آموزشی به صورت خطی جدایی پذیر باشند، میتوان فراصفحهها را به طوری انتخاب نمود که هیچ نمونهای میان آنها نباشد و سپس تلاش کرد تا فاصله آنها را به حداکثر رسانید. برای هر نمونه i از دادهها رابطه زیر را داریم:
(۲-۵) or
(۲-۶)
فاصله بین دو فراصفحه را از طریق تحلیل هندسی با رابطه میتوان بدست آورد. بنابراین مسأله بهینهسازی ما به صورت زیر خواهد بود:
(۲-۷) or
میتوان تصور کرد SVM بین دو دسته داده صفحهای را ترسیم میکند و دادهها را در دو طرف این صفحه تفکیک می کند. این فراصفحه به گونهای قرار میگیرد که ابتدا دو بردار از یکدیگر دور میشوند و به گونهای حرکت میکنند که هر یک به اولین داده نزدیک به خود برسد. سپس صفحهای که در میان حد واسط این دو بردار رسم میشود از دادهها حداکثر فاصله را خواهد داشت و تقسیم کننده بهینه است.
تا اینجا، با این فرض که نمونههای آموزشی به صورت خطی جدایی پذیرند به استفاده از الگوریتم ماشین بردار پشتیبان پرداختیم. همانطور که میدانیم در عمل توزیع دادههای دستهه ای مختلف ممکن است به راحتی جدایی پذیر نبوده و دارای تداخل باشد [۲۶]. در این صورت، تفکیک سازی دقیق نمونهها ممکن است سبب تعمیم دهی ضعیف گردد.
یک راه حل این است که مقداری خطا در دستهبندی را بپذیریم. این کار با معرفی متغیر بی دقت[۱۴] (ξi) انجام میشود که نشانگر نمونههایی است که توسط تابع غلط ارزیابی میشوند. این روش که به SVM با حاشیهی نرم[۱۵] معروف است که اجازه میدهد بعضی از نمونهها در ناحیه اشتباه قرار گیرند سپس آنها را جریمه میکند؛ لذا این روش برخلاف SVM حاشیهی سخت[۱۶] برای مواردی که نمونههای آموزشی به صورت خطی جدایی پذیر نیستند قابل استفاده است.
با معرفی متغیر ξi محدودیتهای قبلی سادهتر شده و رابطه (۲-۳) به صورت زیر تغییر میکند:
(۲-۸)
شکل ۲- ۷: دستهبند ماشین بردار پشتیبان با حاشیه نرم [۲۶]
w
ξi
ξi
در این صورت مسأله بهینهسازی تبدیل میشود به یافتن w به نحوی که معادله زیر مینیمم شود:
(۲-۹)
ماشین بردار پشتیبان با حاشیه نرم تلاش میکند ξi را صفر نگه دارد در حالی که حاشیههای دستهبند را حداکثر میکند. SVM تعداد نمونههایی که به اشتباه دستهبندی شدهاند را کمینه نمیکند بلکه سعی دارد مجموع فواصل از حاشیهی فراصفحهها را کمینه نماید [۲۶]. مقادیر بزرگ برای c سبب میشود که رابطه (۲-۶) مانند روش با حاشیه سخت عمل کند. ماشین بردار پشتیبان با حاشیه نرم همیشه یک راه حل پیدا میکند و در مقابل مجموعه دادههایی که دارای یک عضو جدا[۱۷] هستند مقاوم است و به خوبی عمل میکند.
روشهای دستهبندی مبتنی بر قانون دانش خروجی را به صورت یک مجموعه از قوانین اگر-آنگاه ارائه میدهد. این قوانین به صورت زیر میباشند:
If <Conditions> then <Class>
که Condition شامل یک مجموعه از شرایط میباشد که با عملگرهای منطقی به یکدیگر متصل میشوند. هر شرط شامل یک سهتایی مرتب <Atti, Opp, Valj> میباشد که Atti i امین صفت، Opp عملگر مورد استفاده برای مقایسه یک صفت با یک مقدار است و Valj نشان دهندهی j امین مقدار دامنه صفت Atti میباشد. به عنوان مثال عبارت <Gender=Male> بررسی میکند که آیا مقدار صفت Gender برابر با Male هست یا خیر. در یک مجموعه شرایط نباید دو ترم متناقض وجود داشته باشد. یک قانون تنها در صورتی ارضا میشود که کلیه ترمهای آن ارضا شوند که در این صورت کلاس متناظر رویت میشود.
مهمترین مزیت روشهای دستهبندی مبتنی بر قانون، قابلیت تفسیر بسیار مناسب آنها میباشد. این قابلیت مهم سبب شده که در سالهای اخیر توجه بسیاری از پژوهشگران به روشهای مبتنی بر قانون جلب شود. کاربرانی که از این سیستمها استفاده میکنند بیشتر افرادی هستند که در حوزههای دیگر فعالیت میکنند. به عنوان مثال نباید انتظار داشت که یک پزشک که میخواهد از یک سیستم دستهبندی استفاده کند، دارای اطلاعات تخصصی در مورد سیستمهای دستهبندی باشد. بنابراین این پزشک نیازمند یک سیستم دستهبند است که دانش خروجی را به سادهترین روش ممکن به او نمایش دهد. دیگر مزیت مهم این روشها، نرخ دستهبندی قابل قبول سیستمهای دستهبندی که از روشهای مبتنی بر قانون استفاده میکنند میباشد. هر چند ممکن است روشهای دستهبندی معروفی مانند SVM و ANN دقت بهتری را فراهم کنند ولی در این روشها کاربر در تفسیر دانش خروجی دچار مشکل میشود [۲۷]. در نتیجه روشهای مبتنی بر قانون که دارای قابلیت تفسیر و دقت مناسبی هستند، میتوانند بسیار مورد توجه قرار گیرند.
روشهای گوناگون دستهبندی مبتنی بر قانون مانند AQ15، CART، CN2، ID3 و C4.5 را میتوان به دو دسته کلی تقسیم نمود؛ الگوریتمهای پوششی ترتیبی و الگوریتمهای پوششی آنی. الگوریتمهای پوششی آنی مانند C4.5 و ID3 کل مجموع قوانین را در یک زمان و به صورت گروهی استخراج میکنند. این روشها از تقسیم و غلبه برای کشف قوانین استفاده میکنند. به این صورت که ابتدا مجموعه آموزش را به زیر مجموعههایی تقسیم نموده سپس برای هر زیرمجموعه یک درخت ایجاد میکنند. در مرحله بعدی ساختار هر درخت به قوانین معادل ترجمه میشود. الگوریتمهای پوششی ترتیبی مانند CN2 و AQ15 به صورت افزایشی قوانین دستهبندی را کشف میکنند. یعنی برای هر قسمت از دادههای آموزش یک مجموعه از قوانین استخراج شده و از بین این قوانین بهترین قانون انتخاب شده و نمونههایی که توسط این قانون پوشش داده شدهاند از مجموعه آموزش حذف میشوند.
در استخراج مجموعه قوانین از مجموعه دادهها با یک مسأله بهینهسازی رو به رو هستیم. الگوریتمهای تکاملی روالهای جستجوی تصادفی الهام گرفته شده از طبیعت هستند که به عنوان روشهای بهینهسازی استفاده میشوند. الگوریتمهای تکاملی بر روی یک جمعیت از رشتهها که بیانگر راه حل های ممکن برای یک مسأله میباشند، کار میکنند. جمعیت اولیه میتواند تصادفی یا به کمک دانش قبلی ایجاد شود. الگوریتم هر یک از رشته راه حل ها را با یک تابع هدف که وابسته به مسأله است ارزیابی میکند. رشتههایی با کارایی بهتر برای ایجاد رشتههای جدید مورد استفاده قرار میگیرند. الگوریتمهای تکاملی رشتههای جدید را با بهره گرفتن از عملگرهای ساده و تصادفی نظیر تبادل و جهش ایجاد میکنند و آنها مورد ارزیابی قرار میدهند. چرخه انتخاب و ایجاد راه حل های جدید ادامه مییابد تا اینکه راهحل مطلوب یافت شود و یا یک شرط از پیش تعیین شده برای پایان الگوریتم تکاملی ارضا شود. از روشهای مهم یادگیری تکاملی میتوان به الگوریتم ژنتیک، الگوریتم بهینهسازی ازدحام ذرات، الگوریتم کلونی مورچهها[۱۸]، الگوریتم زنبور عسل BA[19]، الگوریتم رقابت استعماری ICA[20] و روش SA[21] اشاره کرد.
الگوریتم ژنتیک یکی از مطرحترین روشها برای استخراج قوانین بوده است. این الگوریتم ابتدا مجموعه از قوانین اولیه را استخراج و سپس با بهره گرفتن از عملگرهای جهش و تبدیل به مرور زمان این قوانین را تکامل میدهد تا مجموعه بیشتری از نمونهها را پوشش دهند [۲۸]. شرط پایانی برای این الگوریتم میتواند یک تعداد مشخص از تکرارها باشد و یا یک مقدار مشخص از تابع برازش باشد.
الگوریتم ژنتیک به دو دسته عمده پیتسبورگ[۲۲] و میشیگان[۲۳] تقسیم میشود [۲۸]. در روش پیتسبورگ مجموعهای از قوانین اگر-آنگاه در یک قالب رشته کد میشوند در حالی که در روش میشیگان یک قانون اگر-آنگاه به صورت یک رشته کد میشود.
روش پیتسبورگ کارایی هر مجموعه از قوانین را به عنوان درجه شایستگی در نظر میگیرد. بنابراین جستجو به دنبال مجموعههایی با کارایی بالاتر است. تعدادی از قوانین بدون هیچ تغییری به عنوان قوانین ممتاز از جمعیت کنونی به نسل بعد انتقال مییابند. در روش پیتسبورگ یک قانون درون مجموعه خود حائز اهمیت است. چه بسا که قوانین خوبی در مجموعه ضعیفی قرار بگیرند و در روند به روز رسانی یک نسل، نادیده گرفته شوند. از آنجایی که جمعیت شامل تعدادی مجموعه میباشد و هر مجموعه نیز شامل تعدادی قانون است، لذا زمان اجرای آن طولانی و فضای حافظه زیادی نیز نیاز میباشد.
از سوی دیگر در روش میشیگان یک قانون اگر-آنگاه در قالب یک رشته کد میشود و کارایی یک قانون به عنوان درجه شایستگی آن مورد استفاده قرار میگیرد. در اینجا نیز تعدادی از قوانین بدون تغییری به عنوان قوانین ممتاز به نسل بعد منتقل میشوند. از آنجایی که در روش میشیگان جمعیت مورد بررسی در هر لحظه فقط شامل تعدادی قانون است، بنابراین زمان محاسبات و فضای حافظهی مورد نیاز بسیار کمتر از روش پیتسبورگ است. در واقع میتوان روش یادگیری به صورت آنی را معادل روش پیتسبورگ و روش یادگیری ترتیبی را معادل روش میشیگان دانست.
یکی از شاخههای مهم الگوریتمهای تکاملی روشهای هوش جمعی میباشند که شامل الگوریتمهایی نظیر الگوریتم بهینهسازی ازدحام ذرات، الگوریتم کلونی مورچهها و الگوریتم رقابت استعماری میباشند. این الگوریتمها قادر هستند یک جواب مناسب را برای مسأله با ابعاد بالا پیدا کنند. مهمترین تفاوت این الگوریتمها با سایر الگوریتمهای تکاملی، ارتباط عاملها با یکدیگر است که به صورت غیر مستقیم است [۱۳]. این قابلیت به آنها اجازه میدهد تا به صورت توزیع شده بخش اعظمی از فضای جستجو را پوشش دهند و در نتیجه شانس الگوریتم برای یافتن یک راهحل مناسب افزایش یابد.
الگوریتم بهینهسازی ازدحام ذرات و کلا الگوریتمهایی که از مفهوم حرکت دسته جمعی حیوانات نظیر دستهه ای ماهی و پرندگان الگو گرفتهاند، سعی در به کار بردن ذراتی با هوش کم و در عین حال استفاده از هوش گروهی برخاسته از جمعیت دارند [۲۹]. از زمان معرفی PSO در سال ۱۹۹۵ [۳۰]، الگوریتم بهینهسازی ازدحام ذرات کاربردها و بهبودهای زیادی پیدا کرده است. بسیاری تغییرات در PSO اولیه، باعث بهبود همگرایی[۲۴] PSO و افزایش تنوع پراکندگی[۲۵] ازدحام ذرات شده است.
یک الگوریتم PSO، اجتماعی از ذرات با خصوصیات مربوطه را نگهداری میکند، که هر ذره نشان دهنده یک راهحل بالقوه است. در قیاس با نمونههای محاسبات تکاملی، یک ازدحام، تشکیل شده از تعدادی ذرات میباشد که شبیه به یک جمعیت است در حالی که ذرات، همان افراد را تشکیل میدهند. به عبارت سادهتر، ذرات در یک فضای جستجوی چندبعدی حرکت میکنند که موقعیت هر ذره، به وسیلهی دانش خود ذره و دانش همسایگانش تنظیم میشود. اگر xi(t) نشان دهندهی موقعیت فعلی ذرهی i ام در فضای جستجو در زمان t باشد، موقعیت آتی ذره i ام به وسیلهی جمع سرعت جدید همان ذره vi(t+1)، با موقعیت فعلی آن، طبق رابطهی زیر محاسبه میشود:
(۲-۱۰)
الگوریتم بهینهسازی ازدحام ذرات مانند هر الگوریتم تکاملی دیگر دارای دو فاز مقدار دهی اولیه[۲۶] و تکامل[۲۷] است. در شروع، مکان اولیه ذرات با رابطهی توزیع تصادفی نرمال مقداردهی اولیه میشود. در مرحله تکامل، ذرات در فضای راهحل با به روز کردن خود بر طبق وضعیت فعلی خود و اطلاعات گذشته به سمت مقادیر بهینه حرکت میکنند تا شرایط پایانی رخ دهد.
به طور کلی، متغیر سرعت است که فرایند بهینهسازی را به جلو میراند و نشان دهندهی دانش تجربی ذره و تبادل اطلاعات اجتماعی از همسایگان ذره است. دانش ذره، که نشأت گرفته از تجربهی شخصی آن میباشد، معمولاً به مولفهی ادراکی ذره اشاره میکند که متناسب با فاصله ذره از بهترین موقعیت پیدا شده از لحظه شروع فرایند است که به بهترین خاطره شخصی ذره معروف است. تبادل اطلاعات اجتماعی هر ذره به مولفهی اجتماعی معادلهی سرعت اشاره میکند. مولفهی اجتماعی به دانش جمعی که میتواند از تمام ذرات یا بخشی از ذرات نشأت گرفته باشد اشاره دارد، که متناسب با فاصله ذره از بهترین موقعیت پیدا شده توسط تمام ذرات از لحظه شروع فرایند است که به بهترین خاطره جمعی معروف است.
(۲-۱۱)
که در آن ضریبی از حرکت در جهت قبلی یا اینرسی، vij(t) سرعت ذره i ام در بُعد j=1,…,n در زمان t و xij(t) موقعیت ذره i ام در بعد - j ام در زمان t است و c1 و c2 فاکتورهای افزایش سرعت هستند که به ترتیب برای سنجش سهم مولفههای ادراکی و اجتماعی میباشند. r1(t), r2(t) ~ U(0,1) به صورت تصادفی با توزیع یکنواخت به دست میآید. این مقادیر تصادفی، معرف بخش اتفاقی در این الگوریتم است. بهترین موقعیت شخصی yi، مربوط به ذره i ام، بهترین موقعیت مشاهده شده توسط ذره از ابتدای فرایند است. بهترین موقعیت سراسری یا جمعی ، بهترین موقعیت مشاهده شده توسط تمام ذرات از ابتدای فرایند است. الگوریتم بهینهسازی ازدحام ذرات در شکل (۲-۸) خلاصه شده است.
Algorithm PSO
Create and initialize an nx-dimensional swarm;