دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC |
عنوان انگلیسی مقاله: |
High improvement of speaker identification and verification by combining MFCC and phase information |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2009 |
تعداد صفحات مقاله انگلیسی | 4 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر و مهندسی فناوری اطلاعات و ارتباطات |
گرایش های مرتبط با این مفاله | نرم افزار، سخت افزار، هوش مصنوعی و سیستمهای چند رسانه ای |
مجله | کنفرانس بین المللی آکوستیک، گفتار و پردازش سیگنال(International Conference on Acoustics, Speech and Signal Processing) |
دانشگاه | دانشکده مهندسی سیستم ها، دانشگاه شیزوئوکا، ژاپن |
کلمات کلیدی | تشخیص هویت گوینده،تصدیق هویت گوینده، MFCC، اطلاعات فاز، روش ترکیبی |
شناسه شاپا یا ISSN | ISSN 1520-6149 |
رفرنس | دارد |
لینک مقاله در سایت مرجع | لینک این مقاله در سایت IEEE |
نشریه | آی تریپل ای – IEEE |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت 14 B Nazanin | 11 صفحه |
ترجمه عناوین تصاویر و جداول | ترجمه شده است |
ترجمه پاورقی | ترجمه نشده است |
درج تصاویر در فایل ترجمه | درج شده است |
درج جداول در فایل ترجمه | درج شده است |
درج فرمولها و محاسبات در فایل ترجمه به صورت عکس | درج شده است |
- فهرست مطالب:
چکیده
1 مقدمه
2 آنالیز اطلاعات فاز
1 2 فرمول
2 2 مثالها
3 روش ترکیبی و روش تصمیم
4 آزمایشات
1 4 پایگاه داده و آنالیز گفتار
2 4 نتایج تشخیص هویت گوینده
3 4 نتایج تصدیق هویت گوینده
5 نتیجه گیری
- بخشی از ترجمه:
5 نتیجه گیری
در این مقاله روش تشخیص هویت گوینده مستقل از متن با ترکیب MFCC و اطلاعات فاز جدیداً تعریف شده را پیشنهاد کردیم. آزمایشات تشخیص هویت گوینده روی پایگاه داده NTT انجام شد که از داده های جملات ادا شده در مد سرعت نرمال/ آهسته/ سریع توسط 35 گوینده ژاپنی تشکیل می شود. اطلاعات فاز جدید پیشنهاد شده sinϴ}،cosϴ } کارایی تشخیص هویت از اطلاعات فاز اصلی ϴ برای کلیه مدهای گفتاری را به طور قابل ملاحظه ای بهبود بخشید. با ترکیب MFCC و اطلاعات فاز، در مقایسه با MFCC ، برای مدهای گفتار نرمال، آهسته و سریع، نرخ کاهش خطای 2. 52، 6. 55 و 2. 59 درصدی بدست آوردیم. با ترکیب GMM مبتنی بر MFCC، HMM مبتنی بر MFCC، و GMM مبتنی بر فاز، نرخ های درست 4. 99 درصد، 9. 98 درصد، و 9. 98 درصد برای مدهای گفتاری نرمال، سریع و آهسته بدست آوردیم. نتایج بدست آمده بهترین عملکرد را در مقایسه با نتایج سایر محققین و پژوهشگران برای این پایگاه داده نشان می دهد.
جهت تشریح پایداری و توانمندی اطلاعات فاز برای تشخیص هویت گوینده، از اطلاعات فاز جدید sinϴ}،cosϴ } در تصدیق هویت گوینده نیز استفاده گردید. آزمایشات ترکیبی، نرخ خطای برابر 0.18 درصد برای مدهای گفتاری نرمال، 0.37 درصد برای سریع و 0.71 درصد برای آهسته نشان دادند. نتایج بدست آمده، نرخ کاهش خطای درحدود 50 درصد درمقایسه با [19] را نشان می دهند.
- بخشی از مقاله انگلیسی:
5. CONCLUSION
We proposed a text-independent speaker recognition method by combining MFCC and newly defined phase information. The speaker identification experiments were conducted on NTT database which consists of sentences data uttered at normal/slow/fast speed mode by 35 Japanese speakers. The proposed new phase information {cos,sin} remarkably improved the identification performance from the original phase information for all speaking modes. Combining the MFCC and phase information, we obtained the error reduction rate of 52.2%, 55.6% and 59.2% than MFCC for normal, slow and fast speaking modes, respectively. Combining the MFCCbased GMM, MFCC-based HMM and phase-based GMM, we obtained the correct rates of 99.4%, 98.9%, 98.9% for normal, fast and slow speaking modes, respectivey. These results show the best performance in comparison with the other rescarcher’s results for the same database [1, 6, 15, 16, 17].
To demenstrate the robustness of phase information for speaker recognition, the new phase information {cos,sin} was also used in speaker verification. The experiments of the combination showed the equal error rate of 0.18% for normal, 0.37% for fast and 0.71% for slow speaking modes, respectively. These results are the error reduction rate of about 50% in comparison with [19].
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC |
عنوان انگلیسی مقاله: |
High improvement of speaker identification and verification by combining MFCC and phase information |
|