دانلود مقاله ترجمه شده کاربرد ترکیبی از اطلاعات فاز و MFCC جهت شناسایی و تائید هویت گوینده – مجله IEEE
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC |
عنوان انگلیسی مقاله: |
High improvement of speaker identification and verification by combining MFCC and phase information |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | ۲۰۰۹ |
تعداد صفحات مقاله انگلیسی | ۴ صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر و مهندسی فناوری اطلاعات و ارتباطات |
گرایش های مرتبط با این مفاله | نرم افزار، سخت افزار، هوش مصنوعی و سیستمهای چند رسانه ای |
مجله | کنفرانس بین المللی آکوستیک، گفتار و پردازش سیگنال(International Conference on Acoustics, Speech and Signal Processing) |
دانشگاه | دانشکده مهندسی سیستم ها، دانشگاه شیزوئوکا، ژاپن |
کلمات کلیدی | تشخیص هویت گوینده،تصدیق هویت گوینده، MFCC، اطلاعات فاز، روش ترکیبی |
شناسه شاپا یا ISSN | ISSN ۱۵۲۰-۶۱۴۹ |
رفرنس | دارد |
لینک مقاله در سایت مرجع | لینک این مقاله در سایت IEEE |
نشریه | آی تریپل ای – IEEE |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت ۱۴ B Nazanin | ۱۱ صفحه |
ترجمه عناوین تصاویر و جداول | ترجمه شده است |
ترجمه پاورقی | ترجمه نشده است |
درج تصاویر در فایل ترجمه | درج شده است |
درج جداول در فایل ترجمه | درج شده است |
درج فرمولها و محاسبات در فایل ترجمه به صورت عکس | درج شده است |
- فهرست مطالب:
چکیده
۱ مقدمه
۲ آنالیز اطلاعات فاز
۱ ۲ فرمول
۲ ۲ مثالها
۳ روش ترکیبی و روش تصمیم
۴ آزمایشات
۱ ۴ پایگاه داده و آنالیز گفتار
۲ ۴ نتایج تشخیص هویت گوینده
۳ ۴ نتایج تصدیق هویت گوینده
۵ نتیجه گیری
- بخشی از ترجمه:
۵ نتیجه گیری
در این مقاله روش تشخیص هویت گوینده مستقل از متن با ترکیب MFCC و اطلاعات فاز جدیداً تعریف شده را پیشنهاد کردیم. آزمایشات تشخیص هویت گوینده روی پایگاه داده NTT انجام شد که از داده های جملات ادا شده در مد سرعت نرمال/ آهسته/ سریع توسط ۳۵ گوینده ژاپنی تشکیل می شود. اطلاعات فاز جدید پیشنهاد شده sinϴ}،cosϴ } کارایی تشخیص هویت از اطلاعات فاز اصلی ϴ برای کلیه مدهای گفتاری را به طور قابل ملاحظه ای بهبود بخشید. با ترکیب MFCC و اطلاعات فاز، در مقایسه با MFCC ، برای مدهای گفتار نرمال، آهسته و سریع، نرخ کاهش خطای ۲٫ ۵۲، ۶٫ ۵۵ و ۲٫ ۵۹ درصدی بدست آوردیم. با ترکیب GMM مبتنی بر MFCC، HMM مبتنی بر MFCC، و GMM مبتنی بر فاز، نرخ های درست ۴٫ ۹۹ درصد، ۹٫ ۹۸ درصد، و ۹٫ ۹۸ درصد برای مدهای گفتاری نرمال، سریع و آهسته بدست آوردیم. نتایج بدست آمده بهترین عملکرد را در مقایسه با نتایج سایر محققین و پژوهشگران برای این پایگاه داده نشان می دهد.
جهت تشریح پایداری و توانمندی اطلاعات فاز برای تشخیص هویت گوینده، از اطلاعات فاز جدید sinϴ}،cosϴ } در تصدیق هویت گوینده نیز استفاده گردید. آزمایشات ترکیبی، نرخ خطای برابر ۰٫۱۸ درصد برای مدهای گفتاری نرمال، ۰٫۳۷ درصد برای سریع و ۰٫۷۱ درصد برای آهسته نشان دادند. نتایج بدست آمده، نرخ کاهش خطای درحدود ۵۰ درصد درمقایسه با [۱۹] را نشان می دهند.
- بخشی از مقاله انگلیسی:
۵٫ CONCLUSION
We proposed a text-independent speaker recognition method by combining MFCC and newly defined phase information. The speaker identification experiments were conducted on NTT database which consists of sentences data uttered at normal/slow/fast speed mode by 35 Japanese speakers. The proposed new phase information {cos,sin} remarkably improved the identification performance from the original phase information for all speaking modes. Combining the MFCC and phase information, we obtained the error reduction rate of 52.2%, 55.6% and 59.2% than MFCC for normal, slow and fast speaking modes, respectively. Combining the MFCCbased GMM, MFCC-based HMM and phase-based GMM, we obtained the correct rates of 99.4%, 98.9%, 98.9% for normal, fast and slow speaking modes, respectivey. These results show the best performance in comparison with the other rescarcher’s results for the same database [1, 6, 15, 16, 17].
To demenstrate the robustness of phase information for speaker recognition, the new phase information {cos,sin} was also used in speaker verification. The experiments of the combination showed the equal error rate of 0.18% for normal, 0.37% for fast and 0.71% for slow speaking modes, respectively. These results are the error reduction rate of about 50% in comparison with [19].
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC |
عنوان انگلیسی مقاله: |
High improvement of speaker identification and verification by combining MFCC and phase information |
|