در روشهای کنونی برای استخراج ویژگیهای خستگی و عدم تمرکز حواس راننده از تصویر چهره، ابتدا باید اجزای چهره آشکارسازی شود. تقریبا در تمام سیستمهای نظارت چهره راننده از ویژگیهای ناحیه چشم استفاده شده است، بنابراین آشکارسازی چشم اهمیت ویژهای دارد. مهمترین روشهای آشکارسازی چشم به سه دسته اصلی قابل تقسیم است: روشهای مبتنی بر نورپردازی و تصویربرداری طیف مادون قرمز روشهای مبتنی بر دوسطحی کردن تصویر روشهای مبتنی بر پروجکشن روشهای مبتنی بر نورپردازی و تصویربرداری در طیف مادون قرمز یکی از روشهای سریع و نسبتا دقیق در آشکارسازی چشم، استفاده از روشهای مبتنی بر نورپردازی و تصویربرداری در طیف مادون قرمز میباشد که در آن از ساختار فیزیولوژی و اپتیکی چشم در طیف مادون قرمز استفاده میشود. این روش بدون نیاز به آشکارسازی چهره، قادر به آشکارسازی چشم است. به همین علت، حجم محاسبات در سیستمهایی که از این نوع روش استفاده میکنند، نسبت به سایر سیستمها کمتر است. البته این روش بیشتر برای سیستمهایی مناسب میباشد که فقط بر اساس پردازش ناحیه چشم خستگی و عدم تمرکز حواس راننده را تشخیص میدهند. مهمترین عیب این روش این است که اگر به دلیل خطای ردیابی در هنگام خوابآلودگی راننده که چشم تقریبا بسته میباشد، مکان چشم گم شود، سیستم قادر به آشکارسازی آن نخواهد بود. چرا که در این حالت مردمک چشم تقریبا مشخص نیست و آشکارسازی چشم مشکل است. بسیاری از سیستمهای نظارت چهره راننده از این روش برای آشکارسازی چشم استفاده کردهاند [۶, ۲۰-۲۳, ۳۹-۴۳]. در اکثر اینگونه سیستمها، از یک پیکربندی خاص برای سیستم نورپردازی و تصویربرداری طیف مادون قرمز استفاده گردیده است. در این پیکربندی نورپردازی مادون قرمز توسط دو دسته LED تامین میشود که در این سیستم نقش بسیار موثری ایفا میکنند. مطابق شکل ۲‑۴، LEDها به دو دسته تقسیم شده و در دو حلقه متحدالمرکز و با شعاعهای مختلف قرار میگیرند. در هر لحظه فقط یکی از دو حلقه روشن و دیگری خاموش است. هنگامیکه حلقه داخلی روشن باشد، نور بازتابیده شده از سطح مردمک چشم[۴۳] به دوربین میرسد و چشم به طور واضح، روشنتر از سایر قسمتهای چهره است. اما وقتی حلقه خارجی روشن باشد، چنین حالتی برای مردمک چشم رخ نمیدهد و چشم تاریک است. به دو حالت متفاوت چشم به ترتیب مردمک روشن[۴۴] و مردمک تیره[۴۵] میگویند (شکل ۲‑۵). شکل ۲‑۴: سیستم نورپردازی مادون قرمز شامل دو دسته LED به شکل دو حلقه کوچک و بزرگ [۶] منبع نور مادون قرمز پرتوی منعکس شده از چشم پرتوی تابیده شده به چشم چشم دوربین منبع نور مادون قرمز پرتوی منعکس شده از چشم پرتوی تابیده شده به چشم چشم دوربین مردمک روشن مردمک تیره شکل ۲‑۵: نمایش ایجاد پدیده مردمک روشن و مردمک تیره در نورپردازی مادون قرمز در مرحله آشکارسازی چشم، از خاصیت مردمک روشن و مردمک تیره استفاده شده است. در این روش ابتدا تفاضل فریم زوج از فریم فرد بدست میآید (مطابق شکل ۲‑۶). سپس تصویر حاصل از تفاضل، دوسطحی شده و مکان چشم تعیین میگردد. شکل ۲‑۶: آشکارسازی چشم بر اساس ویژگی مردمک تیره و روشن: شکلها از سمت راست به ترتیب فریم زوج با تصویر مردمک روشن، فریم فرد با تصویر مردمک تیره و تفاضل فریمهای زوج و فرد [۶] Zhu و همکارانش [۳۹] روشی مشابه روش فوق برای آشکارسازی چشم استفاده کردهاند. با این تفاوت که پس از تعیین نقاط چشم از ماشین بردار پشتیبان[۴۶] (SVM) برای افزایش دقت آشکارسازی چشم استفاده شده است. در این مقاله هسته[۴۷]های مختلفی برای SVM انتخاب گردیده و نشان داده شده که هسته گوسی بهترین دقت را دارد. با انتخاب هسته گوسی برای SVM، دقت آشکارسازی چشم بیش از ۹۵% خواهد بود. در [۴۱, ۴۲, ۴۴] نیز مشابه این روش برای آشکارسازی چشم استفاده شده است. Zhao و همکارش [۴۵] برای آشکارسازی چشم تنها از یک منبع نور مادون قرمز استفاده کردهاند که در راستای محور اپتیکی دوربین قرار دارد. با توجه به این چینش منبع نور، همواره بازتابش مردمک چشم در دوربین وجود دارد و در تصویر چهره، مردمک روشن دیده میشود. با بهره گرفتن از عملگر ریختشناسی[۴۸] بازکردن[۴۹] تصویر و محاسبه تفاضل این تصویر و تصویر اصلی، نقاط منتخب چشم معین میشود. این نقاط منتخب با اعمال یک سطح آستانه بر روی تفاضل دو تصویر و استفاده از تحلیل اجزای همبند قابل استخراج است. برای اطمینان از انتخاب صحیح این نقاط به عنوان چشم، از ماشین بردار پشتیبان (SVM) و تبدیل تقارن تعمیمیافته[۵۰] (GST) استفاده شده است. با ترکیب نتایج حاصل از خروجی SVM و تبدیل GST، نقاط چشم تعیین خواهد شد. در ارزیابی این روش برای آشکارسازی چشم بدون عینک، TPR 4/99% و FPR صفر و برای آشکارسازی چشم با عینک TPR 3/88% و FPR 14% گزارش شده است. این در حالی است که در صورت عدم استفاده از تبدیل GST، برای آشکارسازی چشم با عینک TPR 1/54% و FPR 3% است. روشهای مبتنی بر دوسطحی کردن تصویر یکی از سادهترین روشهای آشکارسازی چشم، اعمال یک حد آستانه بر روی مقادیر پیکسلهای تصویر چهره برای دو سطحی کردن تصویر و تخمین مکان چشم است. این روش بر اساس این فرض عمل میکند که مردمک چشمها تیرهترین نقاط چهره هستند. مهمترین بخش این الگوریتم تعیین مقدار حد آستانه میباشد. این روش دقت چندانی در آشکارسازی چشم ندارد، بهویژه اینکه در افراد سیاهپوست یا در محیطی با نور کم خطای آن به شدت افزایش مییابد. به همین دلیل معمولا پس از دوسطحی کردن تصویر چهره، پردازشهای دیگری مانند تحلیل اجزای همبند[۵۱] (CCA) [46, 47] یا محاسبه کانتور نواحی آشکارسازی شده [۷, ۲۷] انجام میگیرد تا دقت آشکارسازی چشم افزایش یابد. روشهای مبتنی بر پروجکشن یکی دیگر از سادهترین و پرکاربردترین روشهای آشکارسازی چشم، استفاده از پروجکشن[۵۲] است. پروجکشن به معنی محاسبه مجموع مقادیر پیکسلها در یک جهت مشخص است. جهت پروجکشن معمولا در راستای افقی یا عمودی انتخاب میشود. این روش میتواند بر روی تصاویر دوسطحی یا سطح خاکستری اعمال شود. پروجکشن در راستای افقی و عمودی برای تصویر با ابعاد به ترتیب از روابط (۱) و (۲) محاسبه میشود. در این روابط i مربوط به ستونهای تصویر و j مربوط به سطرهای آن است. مهمترین مسئله در این روش، فرض یکنواخت بودن نورپردازی و تیرهتر بودن چشمها (مردمک) نسبت به پوست چهره است. بنابراین انتظار میرود پروجکشن افقی تصویر چهره در محل چشمها دارای مقدار کمینه محلی باشد. اگر نور محیط به گونهای باشد که تصویر چهره به شکل یکنواخت نورپردازی نشود یا اینکه فرد دارای پوست تیرهای باشد، آشکارسازی چشم دچار اختلال میشود. به همین دلیل در برخی سیستمها، پردازشهای بیشتری بر روی نواحی انتخاب شده انجام میشود تا دقت آشکارسازی چشم افزایش یابد. در [۲۶, ۲۸, ۳۴, ۳۵, ۴۸]، پروجکشن به عنوان روش اصلی برای آشکارسازی چشم میباشد و در [۴۹] از پروجکشن برای تعیین مکان اولیه چشمها استفاده شده است. برای افزایش دقت پروجکشن در آشکارسازی چشم، معمولا آشکارسازی با یک یا چند فرض اولیه انجام میشود. به عنوان مثال فرض بر این که چشم همواره در نیمه بالایی چهره قرار دارد [۲۸, ۳۰]، باعث میشود تا پروجکشن نیمه پایین چهره محاسبه نشود و مواردی همچون ریش یا سبیل، باعث کاهش دقت آشکارسازی چشم نگردد. علاوه بر این، معمولا پس از آشکارسازی چشمها، برای اطمینان از آشکارسازی، روشهایی مثل تحلیل اجزای همبند استفاده میشود [۲۸]. در برخی سیستمها برای کاهش وابستگی الگوریتم آشکارسازی به نور محیط، به جای محاسبه پروجکشن از روی تصویر اصلی، ابتدا تصویر چهره لبهیابی گردیده، سپس پروجکشن محاسبه میشود [۳۰]. گاهی نیز بهجای پروجکشن تصویر، پروجکشن واریانس تصویر محاسبه میشود [۲۷]. پروجکشن واریانس نسبت به تغییرات نور محیط حساسیت کمتری دارد. پروجکشن واریانس در راستای افقی و عمودی به ترتیب از روابط (۳) و (۴) محاسبه میشوند. در این روابط و به ترتیب میانگین مقادیر پیکسلها در ستون i و سطر j از تصویر I هستند. روشهای مبتنی بر یادگیری گاه برای افزایش دقت سیستم نظارت چهره در آشکارسازی صحیح چشم، یکی از روشهای قبلی به عنوان روش پایه استفاده شده و چند نقطه از تصویر چهره را به عنوان نقاط کاندیدا انتخاب میکنند. سپس با بهره گرفتن از روشهای مبتنی بر یادگیری مانند شبکههای عصبی یا ماشین بردار پشتیبان (SVM)، مکان دقیق چشم مشخص میشود. در سیستمهای [۳۹, ۴۱, ۴۲, ۴۴, ۴۵] روش اصلی آشکارسازی چشم بر اساس نورپردازی و تصویربرداری در طیف مادون قرمز است، اما پس از انتخاب نقاط کاندیدا، از ماشین بردار پشتیبان برای انتخاب نهایی نقاط چشم استفاده شده است. در [۵۰] از تبدیل هاف دایروی[۵۳] و بررسی تقارن نقاط برای انتخاب اولیه چند نقطه کاندیدا استفاده شده، سپس با بهره گرفتن از شبکه عصبی، وجود یا عدم وجود چشم در نقاط کاندیدا تعیین میگردد. آشکارسازی سایر اجزای چهره در سیستمهای نظارت چهره راننده کمتر از ویژگیهای سایر اجزای چهره مانند بینی و لبها استفاده شده، اما در این بخش مروری کوتاه بر روشهای آشکارسازی بینی و لب خواهد شد. معمولا از مکان بینی برای تعیین جهت سر و از مکان لبها برای تشخیص خمیازه کشیدن[۵۴] یا صحبت کردن راننده استفاده میشود. آشکارسازی دهان (لب) در اکثر سیستمهای نظارت چهره راننده که از مکان و شکل هندسی لب استفاده کردهاند، آشکارسازی لب را با بهره گرفتن از مدل رنگی انجام داده اند [۲۷, ۳۶, ۴۶, ۴۷]. بنابراین باید تصویربرداری در طیف مرئی انجام گیرد. مشکل دیگر این روش این است که در محیطی با نور کم، تفکیک رنگها مشکل بوده و آشکارسازی لب دچار خطا میشود. با توجه به عدم امکان نورپردازی چهره راننده در شب، استفاده از مدل رنگی برای آشکارسازی لب در سیستمهای واقعی عملی بهنظر نمیرسد. Saradadevi و همکارش [۵۱] برای آشکارسازی دهان از ویژگیهای شبه هار استفاده کردهاند. این روش دربرابر نور محیط مقاوم بوده و کارایی خوبی از لحاظ دقت و سرعت دارد. آشکارسازی بینی مکان نوک بینی نسبت به چهره و چشمها معیار بسیار مناسبی برای تعیین جهت سر است. با بهره گرفتن از مکان نوک بینی نسبت به مکان چشمها میتوان فقط با یک دوربین مدل سه بعدی چهره را تخمین زد. پس از تخمین مدل سه بعدی چهره، تعیین جهت سر به راحتی امکانپذیر است. Bergasa و همکارانش [۲۱-۲۳] برای آشکارسازی سوراخهای بینی[۵۵] از ویژگی سیاه بودن آنها نسبت به پوست چهره استفاده کردهاند. به این ترتیب با اعمال یک حد آستانه در محدوده بینی، سوراخهای بینی آشکارسازی میشود. Katahara و همکارش [۵۲] برای افزایش دقت آشکارسازی سوراخ بینی، از یک ماسک دایروی استفاده کردهاند. این روش نیز بر پایه این فرض انجام شده که سوراخ بینی تیرهتر از پوست چهره است. این گونه روشها در آشکارسازی سوراخ بینی افراد سیاهپوست و مردانی که سبیل دارند، دچار اختلال خواهند شد. ردیابی چهره و اجزای آن تقریبا در تمام سیستمهای نظارت چهره راننده، پس از آشکارسازی چهره ردیابی آن انجام میگیرد. ردیابی چهره به جای آشکارسازی آن در فریمهای متوالی باعث کاهش حجم محاسبات و در نتیجه افزایش سرعت سیستم خواهد شد. به همین دلیل معمولا پس از آشکارسازی اولیه چهره، در فریمهای بعد عملیات ردیابی[۵۶] چهره انجام میگیرد. ردیابی با فرض محدود بودن جابجایی چهره در دو فریم متوالی، به جای تمام تصویر تنها بخش محدودی از آن را جستجو میکند. تقریبا در تمام روشهای ردیابی، محدودیتهایی برای ردیابی شی هدف فرض میشود تا ردیابی با دقت و سرعت بیشتری انجام شود. یکی از معمولترین محدودیتهای اعمال شده، ثابت بودن سرعت حرکت جسم یا مفروض بودن شکل هندسی[۵۷] یا ظاهری[۵۸] شی هدف است [۵۳, ۵۴]. ردیابی شامل دو مرحله اصلی است: تخمین حرکت[۵۹] و تطابق[۶۰]. دو روش عمده که معمولا در تخمین حرکت مورد استفاده قرار میگیرد عبارتند از پنجره جستجو[۶۱] و فیلترهای تطبیقی[۶۲]. در مرحله تطابق نیز معمولا از سه معیار ضریب همبستگی[۶۳]، مجموع قدرمطلق تفاضل[۶۴] (SAD) و مجموع مربعات تفاضل[۶۵] (SSD) استفاده میشود. تخمین حرکت مرحله تخمین حرکت اولین گام برای ردیابی یک شی متحرک میباشد و عبارتست از تخمین موقعیت فعلی شی متحرک بر اساس موقعیت آن در فریمهای قبلی. سادهترین روش برای تخمین حرکت، تعریف یک پنجره جستجو در اطراف موقعیت قبلی شی هدف است. در این روش فقط از مکان شی متحرک در فریم قبل برای تخمین مکان فعلی آن استفاده میگردد. هر چه اندازه پنجره بزرگتر باشد، دقت تخمین بیشتر خواهد شد. اما افزایش اندازه پنجره باعث افزایش حجم محاسبات در مرحله تطابق شده و سرعت ردیابی را میکاهد [۵۳]. انواع پنجره جستجو و ارزیابی آنها در [۵۵] ارائه شده است. روش پنجره جستجو در [۲۴, ۲۸, ۳۰, ۵۶] برای ردیابی استفاده شده است. یکی دیگر از روشهای تخمین حرکت، استفاده از فیلترهای تطبیقی است. از مهمترین انواع فیلترهای تطبیقی میتوان به فیلتر کالمن[۶۶] (KF)، فیلتر کالمن توسعهیافته[۶۷] (EKF)، فیلتر کالمن غیرمعطر[۶۸] (UKF) و فیلتر ذرات[۶۹] (PF) اشاره کرد. درمیان این فیلترها، فیلتر ذرات با قابلیت ردیابی چند شی متحرک در مدل غیرخطی بهترین کارایی را دارد، اما حجم محاسبات آن زیاد است [۵۷]. در سیستمهای نظارت چهره راننده بیشتر از فیلتر کالمن [۶, ۲۱-۲۳, ۴۴, ۴۹] و فیلتر کالمن غیرمعطر [۳۴, ۳۵] برای ردیابی چهره و اجزای آن استفاده شده است. تطابق مهمترین روشهای مورد استفاده برای محاسبه تطابق، ضریب همبستگی، مجموع قدرمطلق تفاضل (SAD) و مجموع مربعات تفاضل (SSD) است. ضریب همبستگی بین قالب T و پنجره W با فرض این که هر کدام شامل N پیکسل باشند، از رابطه (۵) محاسبه میشود. به ضریب همبستگی مقدار همبستگی متقابل[۷۰] نیز گفته میشود. این مقدار همواره در بازه [-۱,۱] قرار دارد. محاسبه ضریب همبستگی پیچیدگی محاسباتی زیادی دارد، به همین دلیل برخی اوقات برای کاهش حجم محاسبات، از مجموع قدرمطلق تفاضل (SAD) (رابطه (۶)) استفاده میشود. در واقع SAD فاصله بین قالب و پنجرهای از تصویر را محاسبه میکند. هرچه مقدار SAD کمتر و نزدیک به صفر باشد، شباهت آن قسمت از تصویر به قالب بیشتر است.
فرم در حال بارگذاری ...