دانلود ترجمه مقاله روش فاکتورگیری نامنفی ماتریس در شناسایی صوت – مجله IEEE

ieee2

 

 عنوان فارسی مقاله: روش فاکتورگیری نامنفی ماتریس (NMF) مبتنی بر نمونه در شناسایی رویداد صوتی
 عنوان انگلیسی مقاله: AN EXEMPLAR-BASED NMF APPROACH FOR AUDIO EVENT DETECTION
دانلود مقاله انگلیسی: برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید
خرید ترجمه آماده: downloadbutton

 

سال انتشار  ۲۰۱۳
تعداد صفحات مقاله انگلیسی  ۳ صفحه
تعداد صفحات ترجمه مقاله  ۹ صفحه
مجله  چالش در تشخیص و طبقه بندی رویدادها
دانشگاه  گروه بهداشت دانشگاه اورله بلژیک
کلمات کلیدی  تشخیص رخدادهای صوتی ، نمونه
نشریه IEEE ieee2

 

 


فهرست مطالب:

 

چکیده
۱     مقدمه
۲     روش‌ها
۲ ۱  مدل ترکیبی
۲ ۲  ایجاد دیکشنری
۲ ۳  تشخیص رخدادهای صوتی
۳     تنظیمات آزمایشی
۴     آزمایشات  برروی داده‌های توسعه‌یافته
۴ ۱  نتایج
۵     بحث
۵ ۱  مجموعه داده  Office Live
۵ ۲  مجموعه داده  Office synthetic
۶     نتایج و کارهای آینده


بخشی از ترجمه:

 

مجموعه داده  Office synthetic
به طور کلی،  می‌توانیم  ببینیم که  عملکرد  مجموعه داده  Office Synthetic  بسیار پایین تر از مجموعه داده  Office Liveاست،  احتمالآ با توجه به تاثیرات  نویزهای اضافه‌شده  و همپوشانی رخدادها این نتیجه گرفته‌شده‌است.  جدول ۲ به ما اجازه می‌دهد تا عملکرد چارچوب‌های پیشنهادشده  در مجموعه داده  Office Synthetic  را به عنوان  تابعی از SNR و  تراکم‌های صوتی مطالعه کنیم.  در صورتی که  باید به این نکته اشاره‌کرد که  هر امتیاز F  گزارش‌شده  به تنهایی براساس رکوردسازی واحد است، می‌توانیم  مشاهده کنیم  که  بالاترین  امتیاز F  برای شرایط تراکم بالا  و متوسط در SNR  ۴dB  بدست‌می‌آید.  اگرچه  چارچوب‌های ترکیبی  می‌توانند ذاتآ  همپوشانی بین  نویز و دیگر رخدادها را  اداره  کنند،  تنها یک  مجموعه  کوچک از تغییرات  (۱۰۰)  ذرات  نویزی در دسترس است، در صورتی که  نویز  به نوعی کمتر ساخت یافته‌است و بنابراین سخت تر مدل می‌شود.
شاید تعجب آور باشد،  که  اغلب شرایط مشکل   در تنظیم تراکم “پایین” هستند، برای مواردی که  بهترین نتایج  در پایین‌ترین  SNR بدست‌می‌آید.   بااین  حال، در این شرایط رخدادهای صوتی  بسیار کم رنگ هستند که به احتمال زیاد این نتایج   به طور کامل نشان داده‌نمی‌شود.   بازرسی‌های  دقیق‌تر  نشان‌می‌دهند که   موقعیت موقتی رخدادهای صوتی  کمتر یا بیشتر به درستی تعیین می‌شود، حتی در شرایط نویز بالا،  اما  آن رخدادها   خودشان  به طور نادرستی  تشخیص داده‌می‌شوند.  یک  تحلیل با جزییات  بیشتر  در کارهای آینده   باید نشان‌دهند که  آیا این  تاثیری بر تخریب نویز دارد یا نه  یا  باتوجه به  دیگر تست‌های باقی مانده عدم  تطابق .
در تنظیمات  تراکم “بالا”  ، نتایج   به  تنظیمات تراکم   ” پایین” افت می‌یابد.  اگر چه  چارچوب‌های ترکیبی  می‌توانند رخدادهای متداخل را  اداره کنند، استفاده از دیکدر مبتنی بر HMM  به عنوان  یک  مرحله هموارکننده  مانع رخدادهای متداخل است.  ما به طور خلاصه   با  گذرهای Viterbi   متعدد آن را آزمایش کردیم  (  در هر ناحیه گذر همه  رخدادهای فعالسازی عبورهای قبلی )  ، که در [۱] استفاده می‌شود، اما این  نتایج رضایت‌بخش  تا زمانی که  به  تعداد بزرگتری از خطاهای درج منجرنشود، حاصل نمی‌شود.

۶-    نتایج و کارهای آینده
ما چارچوب‌های NMF  مبتنی بر نمونه را نشان دادیم، که  در نتایج امیدوارکننده  برروی مجموعه داده  Office synthetic و  عملکرد بهتر قابل ملاحظه  سیستم‌های پایه  مجموعه داده  Office Live   نتیجه می‌دهد.  کارهای آینده  برروی استفاده از گروه‌های پراکنده برای بهبود مدلسازی صوتی، و استفاده از مدل باطنی نیرومندتر برای جایگزینی یا  افزودن  هموارسازی مبتنی HMMتمرکز می‌کند.  یکسری از احتمالات استفاده از بازه زمانی صریح  HMM  برای مدل کردن  طول رخدادهای صوتی است، و استفاده از مدل‌های مبتنی بر حالت  ذرات ریز مانند انچه که در اینجا کشف شد؛ است.


بخشی از مقاله انگلیسی:

 

INTRODUCTION

Automatic audio event detection is an application of pattern recognitionand machine learning in which an audio signal is mapped to asymbolic description of the corresponding sound event(s) present inthe auditory scene. Automatic audio event detection is utilized in ahost of applications, including context-based indexing and retrievalin multimedia such as movies and sports videos, unobtrusive monitoringin health care, surveillance, lifeblogging, audio segmentationand military applications.Most conventional audio event detection techniques employGaussian Mixture Models (GMMs), operating on Mel-Cepstral Coefficients(MFCCs) [1]. In this work, we built on state-of-theartnoise robust Automatic Speech Recognition (ASR) techniques[2, 3] and pursue an exemplar-based Non-negative Matrix Factorisation(NMF) approach to audio event detection. NMF hasonly recently been considered in the context of audio event detection[4, 5, 6] and our submission offers three contributions: 1)modelling all training data through exemplars which facilitates theuse of long temporal contexts and large, possibly overcomplete dictionaries,2) artificially increasing the (limited) amount of trainingdata through resampling at various rates, and 3) explicit modellingof background events such as noise. The method is evaluated on theOffice Live and Office Synthetic development datasets released bythe AASP Challenge on Detection and Classification of AcousticScenes and Events [7]. 2. METHOD2.1. Compositional modelThe compositional model for audio event detection is based on representingboth individual audio events, as well as mixtures of audioevents, as a linear combination of atoms. The collection of audioevent atoms form a dictionary, and in this work atoms are formedby exemplars, spectrogram segments extracted from a set of trainingsamples.The atoms are B  T magnitude spectrogram segments, reshapedto a E = B  T dimensional vector, where B is the numberof frequency bands and T is the number of consecutive time framesin an atom. With an observed signal      represented in the formof overlapping windows of length T, a spectrogram window Y isreshaped to an E-dimensional vector y and approximated as:y hA1A2   ADi26664x1x2…xD37775= Ax s.t. x  ۰ (۱)with D the total number of audio event dictionaries, and xd theweight of the linear combination of atoms in dictionary Ad, 1 d  D. Each dictionary Ad is a matrix of size E Nd, with N thenumber of atoms. The total number of atoms in A is M


 

 

 عنوان فارسی مقاله: تخشیص رویدادهای صوتی با رویکرد NMF  مبتنی بر نمونه
 عنوان انگلیسی مقاله: AN EXEMPLAR-BASED NMF APPROACH FOR AUDIO EVENT DETECTION
دانلود مقاله انگلیسی: برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید
خرید ترجمه آماده: downloadbutton

 

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *