دانلود مقاله ترجمه شده کاربرد ترکیبی از اطلاعات فاز و MFCC جهت شناسایی و تائید هویت گوینده – مجله IEEE

 

دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی

 

عنوان فارسی مقاله:

بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC

عنوان انگلیسی مقاله:

High improvement of speaker identification and verification by combining MFCC and phase information

  • برای دانلود رایگان مقاله انگلیسی با فرمت pdf بر روی عنوان انگلیسی مقاله کلیک نمایید.
  • برای خرید و دانلود ترجمه فارسی آماده با فرمت ورد، روی عنوان فارسی مقاله کلیک کنید.

 

مشخصات مقاله انگلیسی (PDF)
سال انتشار  ۲۰۰۹
تعداد صفحات مقاله انگلیسی  ۴ صفحه با فرمت pdf
رشته های مرتبط با این مقاله  مهندسی کامپیوتر و مهندسی فناوری اطلاعات و ارتباطات
گرایش های مرتبط با این مفاله  نرم افزار، سخت افزار، هوش مصنوعی و سیستمهای چند رسانه ای
مجله  کنفرانس بین المللی آکوستیک، گفتار و پردازش سیگنال(International Conference on Acoustics, Speech and Signal Processing)
دانشگاه  دانشکده مهندسی سیستم ها، دانشگاه شیزوئوکا، ژاپن
کلمات کلیدی  تشخیص هویت گوینده،تصدیق هویت گوینده، MFCC، اطلاعات فاز، روش ترکیبی
شناسه شاپا یا ISSN ISSN ۱۵۲۰-۶۱۴۹
رفرنس دارد
لینک مقاله در سایت مرجع لینک این مقاله در سایت IEEE
نشریه آی تریپل ای – IEEE

 

مشخصات و وضعیت ترجمه فارسی این مقاله (Word)
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت ۱۴ B Nazanin ۱۱ صفحه
ترجمه عناوین تصاویر و جداول ترجمه شده است
ترجمه پاورقی ترجمه نشده است
درج تصاویر در فایل ترجمه درج شده است
درج جداول در فایل ترجمه درج شده است
درج فرمولها و محاسبات در فایل ترجمه به صورت عکس درج شده است

 


  • فهرست مطالب:

 

 چکیده
۱ مقدمه
۲ آنالیز اطلاعات فاز
۱ ۲ فرمول
۲ ۲ مثالها
۳ روش ترکیبی و روش تصمیم
۴ آزمایشات
۱ ۴ پایگاه داده و آنالیز گفتار
۲ ۴ نتایج تشخیص هویت گوینده
۳ ۴ نتایج تصدیق هویت گوینده
۵ نتیجه گیری

 


  • بخشی از ترجمه:

 

۵ نتیجه گیری

در این مقاله روش تشخیص هویت گوینده مستقل از متن با ترکیب MFCC و اطلاعات فاز جدیداً تعریف شده را پیشنهاد کردیم. آزمایشات تشخیص هویت گوینده روی پایگاه داده NTT انجام شد که از داده های جملات ادا شده در مد سرعت نرمال/ آهسته/ سریع توسط ۳۵ گوینده ژاپنی تشکیل می شود. اطلاعات فاز جدید پیشنهاد شده sinϴ}،cosϴ } کارایی تشخیص هویت از اطلاعات فاز اصلی ϴ برای کلیه مدهای گفتاری را به طور قابل ملاحظه ای بهبود بخشید. با ترکیب MFCC و اطلاعات فاز، در مقایسه با MFCC ، برای مدهای گفتار نرمال، آهسته و سریع، نرخ کاهش خطای ۲٫ ۵۲، ۶٫ ۵۵ و ۲٫ ۵۹ درصدی بدست آوردیم. با ترکیب GMM مبتنی بر MFCC، HMM مبتنی بر MFCC، و GMM مبتنی بر فاز، نرخ های درست ۴٫ ۹۹ درصد، ۹٫ ۹۸ درصد، و ۹٫ ۹۸ درصد برای مدهای گفتاری نرمال، سریع و آهسته بدست آوردیم. نتایج بدست آمده بهترین عملکرد را در مقایسه با نتایج سایر محققین و پژوهشگران برای این پایگاه داده نشان می دهد.
جهت تشریح پایداری و توانمندی اطلاعات فاز برای تشخیص هویت گوینده، از اطلاعات فاز جدید sinϴ}،cosϴ } در تصدیق هویت گوینده نیز استفاده گردید. آزمایشات ترکیبی، نرخ خطای برابر ۰٫۱۸ درصد برای مدهای گفتاری نرمال، ۰٫۳۷ درصد برای سریع و ۰٫۷۱ درصد برای آهسته نشان دادند. نتایج بدست آمده، نرخ کاهش خطای درحدود ۵۰ درصد درمقایسه با [۱۹] را نشان می دهند.

 


  • بخشی از مقاله انگلیسی:

 

۵٫ CONCLUSION

We proposed a text-independent speaker recognition method by combining MFCC and newly defined phase information. The speaker identification experiments were conducted on NTT database which consists of sentences data uttered at normal/slow/fast speed mode by 35 Japanese speakers. The proposed new phase information {cos,sin} remarkably improved the identification performance from the original phase information for all speaking modes. Combining the MFCC and phase information, we obtained the error reduction rate of 52.2%, 55.6% and 59.2% than MFCC for normal, slow and fast speaking modes, respectively. Combining the MFCCbased GMM, MFCC-based HMM and phase-based GMM, we obtained the correct rates of 99.4%, 98.9%, 98.9% for normal, fast and slow speaking modes, respectivey. These results show the best performance in comparison with the other rescarcher’s results for the same database [1, 6, 15, 16, 17].

To demenstrate the robustness of phase information for speaker recognition, the new phase information {cos,sin} was also used in speaker verification. The experiments of the combination showed the equal error rate of 0.18% for normal, 0.37% for fast and 0.71% for slow speaking modes, respectively. These results are the error reduction rate of about 50% in comparison with [19].


 

دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی

 

عنوان فارسی مقاله:

بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC

عنوان انگلیسی مقاله:

High improvement of speaker identification and verification by combining MFCC and phase information

  • برای دانلود رایگان مقاله انگلیسی با فرمت pdf بر روی عنوان انگلیسی مقاله کلیک نمایید.
  • برای خرید و دانلود ترجمه فارسی آماده با فرمت ورد، روی عنوان فارسی مقاله کلیک کنید.

 

دانلود رایگان مقاله انگلیسی

 

خرید ترجمه فارسی مقاله

 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا