دانلود رایگان ترجمه مقاله نحوه یافتن چهره سریع و قوی

 

 

این مقاله انگلیسی در ۷ صفحه منتشر شده و ترجمه آن ۱۴ صفحه بوده و آماده دانلود رایگان می باشد.

 

دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word)
عنوان فارسی مقاله:

تشخیص چهره سریع و قوی با کمک بافت محلی

عنوان انگلیسی مقاله:

Fast and Robust Face Finding via Local Context

دانلود رایگان مقاله انگلیسی
دانلود رایگان ترجمه با فرمت pdf
دانلود رایگان ترجمه با فرمت ورد

 

مشخصات مقاله انگلیسی و ترجمه فارسی
فرمت مقاله انگلیسی pdf
تعداد صفحات مقاله انگلیسی ۷ صفحه با فرمت pdf
نوع نگارش مقاله پژوهشی (Research article)
رشته های مرتبط با این مقاله مهندسی کامپیوتر
گرایش های مرتبط با این مقاله هوش مصنوعی – مهندسی الگوریتم ها و محاسبات
رفرنس رفرنس ندارد 
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش  ۱۴ صفحه با فونت ۱۴ B Nazanin
فرمت ترجمه مقاله pdf و ورد تایپ شده با قابلیت ویرایش
وضعیت ترجمه انجام شده و آماده دانلود رایگان
کیفیت ترجمه

مبتدی (مناسب برای درک مفهوم کلی مطلب) 

کد محصول F2286

 

بخشی از ترجمه

در واقع، از ویژگی‎‌های این آشکارساز تفاوت‌های وزنی در انتگرال نواحی مستطیل شکل است. شکل ۴ مجموعه‌ای از انواع ویژگی‌های موجود (گرفته شده از [۱۳]) را به تصویر می‌کشد که در آن مستطیل‌های سیاه و سفید مربوط به وزن مثبت و منفی هستند. ویژگی‌ها شامل چهار نوع ویژگی مختلف لبه، هشت ویژگی خطی و دو ویژگی مرکزی فراگیر است.
الگوریتم یادگیری (بنا به یادگیری درخت تصمیم) ویژگی‌ها را به‌طور خودکار با توجه به تمام ویژگی‌های تفکیک شده‌ی ممکن، اندازه و مکان انتخاب می‌کند. مقایسه ویژگی‌های انتخاب شده در روش شی محور و روش بافت محلی جالب است.

در موارد شی محور سه ویژگی اول، ضبط نواحی داخلی چهره، به ویژه اطراف چشم و اطراف دهان و بینی با استفاده از امکانات خط افقی و عمودی است. ویژگی‌های اضافی عمدتا ویژگی‌های لبه برای گرفتن خطوط سر و چانه است (F5، F8 و F9 در شکل).
بنابراین، برای بافت محلی اولین ساختار در کل مسیر گسترش می‌یابد، به‌عنوان مثال آن واقعا از بافت محلی استفاده می‌کند. ویژگی‌های زیر خطوط سر و بدن (ویژگی های F2-F5) را ضبط می‌کند. ویژگی‌های دیگر شانه سمت چپ و راست (ویژگی های F9 و F10 در مثال بالا، ویژگی F14 در مثال پایین) را ضبط می‌کند. از این رو کاملا متفاوت از آشکارسازهای سنتی چهره است، که به تنهایی بر روی قطعات صورت تکیه داشتند.

۲٫۱٫ روش آموزش و جزئیات پیاده‌سازی
چارچوب آشکارساز استفاده شده در این ایده بر اساس افزایش آشکارساز آبشاری طبقه‌بندی شده است (نگاه کنید به [۷]) اما قابلیت تنظیم اصلی را گسترش می‌دهد و انواع مختلف تقویت یادگیری را ارائه می‌دهد [۱۳]. این بخش خلاصه‌ای از ضروری‌ترین جزئیات پیاده‌سازی در مورد ویژگی‌های الگوریتم یادگیری و پارامترهای آموزشی است.
انواع ویژگی‌های مشخص شده در شکل ۴ یادآور موجک‌ها و ویژگی‌های اولیه از مسیر بینایی انسان مانند مرکز فراگیر و جهت پاسخ است. مزیت اصلی آنها این است که می‌توان آنها را باهم و در زمان ثابتی در هر مقیاسی محاسبه کرد. هر ویژگی با جمع پیکسل در مستطیل‌های کوچکتر قابل محاسبه است.

با وزن‌های ωi ∈ R، مستطیل r_i و شماره آن‌ها یعنی N، تنها ترکیب وزنی مجموع پیکسل‌های دو مستطیل در نظر گرفته می‌شود، که N=2 است. وزن‌ها علاماتی مخالف دارند (با نقاط سیاه و سفید در شکل نشان داده شده‌اند)، و برای جبران تفاوت در منطقه استفاده می‌شود. محاسبات کافی با استفاده از خلاصه جدول‌ها قابل دستیابی است. ویژگی‌های چرخشی و ویژگی‌های فراگیر مرکزی مجموعه‌ای از ویژگی‌های اصلی از ویولا-جونز توسط Lienhart و همکارانش [۱۳] با استفاده از خلاصه جداول چرخش است. مجموعه اصلی تنها شامل ویژگی‌های ( ۱a)، ( ۱b)، ( ۲a)، ( ۲c) به‌عنوان یکی از ویژگی‌های مورب است که توسط ویژگی‌های چرخشی رده‌بندی می‌شود. مجموعه‌ای از ویژگی افزوده برای گسترش بیان و تطبیق‌پذیری ویژگی‌های اصلی منجر به تشخیص دقیق‌تر نشان داده شده است. توجه داشته باشید که نمایش ویژگی‌ها نیازی به محاسبه هرم تصویر برای جستجو در مقیاس‌های مختلف ندارد.
الگوریتم یادگیری آبشاری مشابه درخت تصمیم یادگیری است. اساسا، طبقه‌بند آبشاری می‌تواند به‌عنوان یک درخت تصمیم‌گیری بیان شود. برای هر مرحله در آبشار زیرطبقه‌بند جداگانه‎ای برای تشخیص تمام اهداف اشیاء آموزش داده شده است درحالی که بخش خاصی از الگوهای غیر شی صرف‌نظر می‌شوند.

برای مثال، اگر یک آشکارساز ۲۰ مرحله‌ای به گونه‌ای آموزش دیده باشد که در هر مرحله ۵۰ درصد از الگوهای غیرشی حذف شوند (هدف قرار دادن میزان مثبت کاذب) درحالی‌که تنها ۰٫۱٪ از الگوهای شی (نرخ تشخیص هدف) به اشتباه از بین رفته است سپس انتظار می‌رود نرخ تشخیص کلی ۰٫۹۹۹۲۰ ≈ ۰٫۹۸ با میزان مثبت کاذب ۰٫۵۲۰ ≈ ۰٫۹ * ۱۰-۶ باشد. در نهایت، تعداد مورد نظری از مراحل، هدف نرخ مثبت کاذب و نرخ تشخیص هدف در هر مرحله اجازه می‌دهد تا دقت و سرعت طبقه‌بندی مورد نظر مبادله شود. همچنین توضیح می‌دهد که تعداد مختلفی از ویژگی‌ها در مرحله اول برای آشکارساز شی محور و برای آشکارساز بافت محلی در شکل ۵ نشان داده شده است.
مراحل جداگانه بااستفاده از تقویت که مجموعه‌ای از “یادگیرنده‌های ضعیف” نامیده می‌شود ترکیب می‌شوند ( “طبقه‌بندی قوی”). در این مورد یک یادگیرنده ضعیف معادل یکی از ویژگی‌های خاص و (به‌طور خودکار آموزش‌دیده) آستانه باینری در مقدار آن است. هر دور از افزایش یادگیرنده ضعیفی را (به‌عنوان مثال از ویژگی‌ها و آستانه) انتخاب می‌کند که مجموعه آموزش را به بهترین شکل ممکن طبقه‌بندی می‌کند. اولین افزایش، فرض می‌کند که وزن داده‌های آموزشی یکنواخت است درحالی‌که مراحل پی‌در‌پی وزن بالاتری به موارد آموزشی که به اشتباه طبقه‌بندی شده‌اند نگاشت می‌کند. این مسئله موجب می‌شود بر روی الگوریتم در موارد “سخت”بیشتر تمرکز شود. تفاوت افزایش در انواع گسسته، AdaBoost واقعی و آرام به‌طور عمده توسط چارچوب OpenCV در نحوه تعیین وزن‌های جدید متفاوت از داده‌های آموزشی ارائه شده است. برای جزئیات بیشتر توصیه می‌شود به [۱۴] مراجعه کنید. به‌صورت تجربی در [۱۲] تجربی نشان داده شده است که AdaBoostآرام در موارد گسسته بهتر عمل می‌کند و AdaBoost واقعی برای کارهای تشخیص چهره دقت و سرعت بیشتری دارد. بنابراین AdaBoost آرام (GAB) انتخاب نهایی شده است.

در نهایت، مهم‌ترین پارامترهای آموزشی مانند نوع و تعداد نمونه آموزش، نرخ هدف و اندازه پنجره تشخیص به‌صورت خلاصه بیان شده است. حدودا ۱۰۰۰ نمونه بافت محلی از جهان گسترده وب و از مجموعه عکس‌های خصوصی جمع آوری شده است. به‌منظور محدود کردن میزان تنوع و در نتیجه افزایش تفکیک، تنها دیدگاه روبه‌جلو برای آموزش و موارد تقریبا تراز وسط استفاده شده است. هر مثال مثبت به ۲۰ × ۲۰ پیکسل کوچک شده است.
برای جمع‌آوری نمونه‌های منفی یک زیرمجموعه از پایگاه‌داده‌های تصویر WuArchive استفاده شده است که شامل تمام افراد نیست. این تصاویر بارها و بارها توسط الگوریتم یادگیری برای جستجوی الگوهای شی بررسی شده است. “مرز موارد” اجازه می‌دهد تا کران تصمیم مجددا تعریف شود (این روش گاهی اوقات به عنوان “خود راه انداز” نامیده می‌شود). آموزش آشکارساز بافت محلی حدودا ۴۸ ساعت در یک ماشین پنتیوم ۱GHz زمان می‌برد. جدول ۱ پارامترهای آشکارساز بافت محلی را با آشکارساز جسم محور که همراه با کتابخانه OpenCV است مقایسه می‌کند که در آزمایشات بخش بعدی مورد استفاده قرار گرفته است.

 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا