دانلود رایگان ترجمه مقاله تشخیص حرکات و ژست دست مبتنی بر بینایی (ساینس دایرکت – الزویر 2015)

 

 

این مقاله انگلیسی ISI در نشریه الزویر در 14 صفحه در سال 2015 منتشر شده و ترجمه آن 37 صفحه بوده و آماده دانلود رایگان می باشد.

 

دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word)
عنوان فارسی مقاله:

روش های اخیر و پایگاه های داده در تشخیص حرکات و اشارات (ژست) دست مبتنی بر بینایی: یک بررسی

عنوان انگلیسی مقاله:

Recent methods and databases in vision-based hand gesture recognition: A review

دانلود رایگان مقاله انگلیسی: مقاله انگلیسی
دانلود رایگان ترجمه با فرمت pdf: ترجمه pdf
دانلود رایگان ترجمه با فرمت ورد: ترجمه ورد

 

مشخصات مقاله انگلیسی و ترجمه فارسی
فرمت مقاله انگلیسی pdf
سال انتشار 2015
تعداد صفحات مقاله انگلیسی 14 صفحه با فرمت pdf
نوع مقاله ISI
نوع نگارش مقاله پژوهشی (Research article)
نوع ارائه مقاله ژورنال
رشته های مرتبط با این مقاله مهندسی کامپیوتر
گرایش های مرتبط با این مقاله هوش مصنوعی – مهندسی الگوریتم ها و محاسبات – برنامه نویسی کامپیوتر
چاپ شده در مجله (ژورنال) بینایی کامپیوتر و درک تصویر
کلمات کلیدی
تشخیص ژست – تشخیص وضعیت – تخمین ژست دست – تشخیص زبان اشاره – پایگاه داده ژست دست – پایگاه داده ژست – نظرسنجی
کلمات کلیدی انگلیسی
Gesture recognition – Posture recognition – Hand pose estimation – Sign language recognition – Hand gesture dataset – Gesture database – Survey
ارائه شده از دانشگاه موسسه محاسبات با عملکرد بالا، سنگاپور
نمایه (index) Scopus – Master Journals – JCR
شناسه شاپا یا ISSN
1077-3142
شناسه دیجیتال – doi https://doi.org/10.1016/j.cviu.2015.08.004
رفرنس دارای رفرنس در داخل متن و انتهای مقاله
نشریه
الزویر – Elsevier
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش  37 صفحه با فونت 14 B Nazanin
فرمت ترجمه مقاله pdf و ورد تایپ شده با قابلیت ویرایش
وضعیت ترجمه انجام شده و آماده دانلود رایگان
کیفیت ترجمه

مبتدی (مناسب برای درک مفهوم کلی مطلب)

کد محصول

F1874

 

بخشی از ترجمه

تشخیص مرسوم ژست دست: روش های مبتنی بر سنسور RGB
2.1 تشخیص ژست های پویای دست
تکنیک های مورد استفاده برای HGR پویا را می توان به صورت زیر دسته بندی نمود: الف) HMM [10-23] و سایر روش های آماری [24-31]، ب) ANN [32-34] و سایر روش های مبتنی بر یادگیری [35، 36]، c) [37، 38]، d) روش های مبتنی بر فضای ویژه, تناسب منحنی [39]، و e) برنامه نویسی پویا [40] / انحراف زمان پویا [41، 42] (شکل 3).

2.1.1 HMM و سایر روش های آماری
HMM پراستفاده ترین تکنیک HGR است. HMM یک مدل آماری است که در آن سیستم مدلسازی شده به عنوان یک فرآیند مارکوف با پارامتر های مجهول فرض می شود. HMM, نشان دهنده رفتار آماری توالی نماد قابل مشاهده با استفاده از شبکه ای از حالات پنهان با احتمالات انتقال و انتشار است. HMM را زمانی می توان برای تشخیص الگو استفاده کرد که پارامترهای پنهان با استفاده از داده های قابل مشاهده شناسایی شوند.
روشهای پویای تشخیص ژست مبتنی بر HMM عمدتاً از ویژگیهای زمانی و فضایی تصاویر ورودی استفاده می کنند. Chen و همکاران [14] از توصیفگر فوریه و تحلیل حرکت مبتنی بر جریان اپتیک به ترتیب به منظور مشخص کردن ویژگی های فضایی و زمانی استفاده نمودند. این الگوریتم با استفاده از ردیابی دست در زمان واقعی، شکل دست را از پس زمینه های پیچیده استخراج می کند. شناساگرهای مبتنی بر HMM, بهترین مدل ژست احتمال را برای یک الگوی معین شناسایی می کنند. تغییرات در ژست از یک الگوی مرجع، احتمال این ژست را با مدل کاهش می دهند.
Lee و Kim [10] یک مفهوم مدل آستانه مبتنی بر HMM را برای فیلتر کردن الگوها با احتمال کمتر معرفی کردند. جهت حرکت دست برای نشان دادن توالی های فضایی-زمانی ژست ها استفاده می شود. این روش به طور قابل اعتماد نقطه پایانی یک ژست را تشخیص می دهد و نقطه شروع را با ردیابی به عقب می یابد.
HMM مبتنی بر زنجیره های مارکف همگن است زیرا پویایی سیستم تنها توسط احتمالات گذار مستقل زمان تعیین می شود. Marcel و همکاران [15] یک فرمت HMM، یعنی مدل ورودی / خروجی مخفی مارکوف (IOHMM) را برای HGR پیشنهاد کردند. IOHMM مبتنی بر یک زنجیره غیرهمگن مارکوف است که احتمالات انتقال و انتشار آن به ورودی بستگی دارد. IOHMM یاد می گیرد تا توالی های ورودی، مشاهدات، توالی های خروجی و کلاس های ژست را برای همه مشاهدات با استفاده از یادگیری اختیاری تحت نظارت یاد بگیرد. در مقایسه با HMMها، IOHMM یک رویکرد تبعیض آمیز است زیرا به طور مستقیم احتمالهای خلفی را مدلسازی می کند. مطالعه در [15] محدود به 2 کلاس بود. Just و همکاران [13], این مطالعه را برای شناختن حرکات تک و دوبل دست گسترش دادند و یک مقایسه از HMM و IOHMM ارائه کردند. آزمایشات انجام شده بر روی پایگاه های داده بزرگتر، اعم از 7 تا 16 کلاس ژست، نتیجه گرفتند که برای تعداد زیادی از کلاس ها, HMM عملکرد خوبی نسبت به IOHMM دارد.
ویژگی های موقعیت دست، زاویه و سرعت در [11] برای پیاده سازی HMM در HGR ترکیب می شوند. دست توسط تجزیه و تحلیل رنگ-پوست موقعیت یابی می شود و با اتصال مرکز حرکت ناحیه های دست ردیابی می شود. این مقاله، مطلوبیت سه ویژگی، موقعیت، زاویه و سرعت را مقایسه کردند و نتیجه گرفتند که ویژگی های زاویه ای, موثرترین هستند و دارای قدرت تشخیص بهتر هستند. ویژگی های مکان و سرعت, به ترتیب رتبه دوم و سوم را دارند. یک پیاده سازی HMM مشابه با استفاده از زوایای حرکت در امتداد مسیر مرکز دستی در [16] ارائه شده است.
Ramamoorthy و همکاران توسط ترکیب طرح مشخص سازی زمانی مبتنی بر HMM با یک سیستم تشخیص شکل استاتیک [12], یک سیستم HGR را توسعه دادند. آنها از یک ردگیر خط دستی مبتنی بر فیلتر کالمن استفاده کردند که ویژگی های زمانی ژست را ارائه می کند. اشکال با استفاده از طبقه بند مبتنی بر متمایزکننده خط شناخته می شوند. این توصیفگرهای نمادین ژست ها برای آموزش HMM استفاده می شوند. این سیستم می تواند به طور قابل اطمینان, ژست های دینامیک را به رغم تغییرات حرکت و گسسته در ژست های دست تشخیص دهد. همچنین این الگوریتم توانایی تشخیص نقاط شروع و پایان توالی های ژست را دارد.
الگوریتم های تشخیص ژست پویا از یک طرح نقطه یابی رو به عقب استفاده می کنند که ابتدا نقطه پایان یک ژست را تشخیص می دهد و سپس به سمت نقطه شروع ردیابی می شود. Kim و همکاران [17] یک روش جایگزین، یک طرح نقطه گذاری مستقیم را پیشنهاد کردند که به طور همزمان بخش بندی و تشخیص ژست را اجرا می کند. نقاط شروع و پایان ژست ها توسط عبورهای از صفر احتمال دیفرانسیل سیگنال شناسایی می شوند. مجموعه ای از ویژگی های مبتنی بر تشریح سه بعدی با استفاده از روش نگاشت ارتباطی استخراج می شوند که داده های شکل دو بعدی را به داده های مفصل سه بعدی متصل می کند. ژست ها با یک رای اکثریت با استفاده از HMM تجمعی طبقه بندی می شوند.
Davis و Shah [31] ژست ها را به چهار مرحله متمایز تقسیم نمودند که در یک نظم ثابت اتفاق می افتد و یک مدل ماشین حالت متناهی (FSM) را برای تشخیص توسعه دادند. نشانه زماني حرکت دست استخراج می شود و ژست های دست با استفاده از FSM در [29] مدلسازی می شود. مفهوم انرژی حرکت برای تخمین حرکت غالب از یک توالی تصویر استفاده می شود. Hong و همکاران [30] از موقعیت های دوبعدی مراکز سر و دستان افراد برای توسعه FSM استفاده نمودند. مدل پویای شبکه بیزی در [24] برای تشخیص ژست های جدا شده و پیوسته دست ارائه شده است. ویژگی های استفاده شده عبارتند از کدهای جهت برای حرکت دست، رابطه موضعی بین دو دست و رابطه موقعیتی بین صورت و دست.
Chen و همکاران [25] از یک روش دو مرحله ای تجزیه و تحلیل آماری و نحوی به ترتیب برای تشخیص ژست های دستی استاتیک و پویا پیشنهاد کردند. سطح اول، تجزیه و تحلیل آماری، بر اساس یک الگوریتم یادگیری AdaBoost و ویژگی های Haar-مانند است. سطح دوم، تجزیه و تحلیل نحوی، مبتنی بر یک گرامر تصادفی عاری از زمینه (SCFG) است. ویژگی های Haar-مانند به طور موثر الگوی وضعیت دست را توصیف می کنند و الگوریتم AdaBoost, یک طبقه بند قوی را با ترکیب یک دنباله ای از طبقه بندهای ضعیف ایجاد می کند. موقعیت های شناسایی شده توسط سطح اول به دنباله ای از رشته های ترمینال با توجه به دستور زبان، در مرحله دوم تبدیل می شوند.

2.1.2 ANN و سایر روشهای مبتنی بر یادگیری
Yang و همکاران [32، 33] از یک شبکه عصبی تاخیر زمانی (TDNN) برای یادگیری مسیرهای حرکت دو بعدی استفاده کردند. TDNN, یک شبکه چند لایه تغذیه-مستقیم است که از پنجره های جابجایی بین تمام لایه ها برای نشان دادن روابط زمانی بین وقایع استفاده می کند. طبقه بندی در TDNN, پویا است، زیرا این شبکه, تنها یک پنجره کوچک از الگوی حرکت ورودی را می بیند و پنجره بر روی داده های ورودی لغزش می کند در حالی که شبکه, یک سری تصمیمات موضعی می گیرد. این تصمیمات موضعی به صورت زمانی با یک تصمیم کلی در لایه خروجی یکپارچه می شوند.

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا