دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
الگوریتم CLOSE: روشی داده محور برای تفکیک گفتار |
عنوان انگلیسی مقاله: |
CLOSE—A Data-Driven Approach to Speech Separation |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2013 |
تعداد صفحات مقاله انگلیسی | 14 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله | مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار و هوش مصنوعی |
مجله | نتایج و یافته های بدست آمده در حوزه پردازش شنیداری، بیان و زبان |
دانشگاه | مهندسی برق و علوم کامپیوتر، دانشکده الکترونیک، دانشگاه کوئین بلفاست، بریتانیا |
کلمات کلیدی | گفتار هم کانال، طولانی ترین بخش تطبیقی، شناسایی گوینده، بازشناسی گفتار، تفکیک گفتار، ساختار های زمانی |
شناسه شاپا یا ISSN | ISSN 1558-7916 |
رفرنس | دارد |
لینک مقاله در سایت مرجع | لینک این مقاله در سایت IEEE |
نشریه | IEEE |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت 14 B Nazanin | 33 صفحه |
ترجمه عناوین تصاویر و جداول | ترجمه شده است |
ترجمه متون داخل تصاویر | ترجمه نشده است |
ترجمه متون داخل جداول | ترجمه نشده است |
درج تصاویر در فایل ترجمه | درج شده است |
درج جداول در فایل ترجمه | درج شده است |
درج فرمولها و محاسبات در فایل ترجمه به صورت عکس | درج شده است |
- فهرست مطالب:
چکیده
1. مقدمه
2. روش CLOSE برای تفکیک گفتار
A. مدل سازی سخن های آموزش
B. تفکیک مبتنی بر ترکیب طولانی ترین بخش ها- CLOSE
C. موارد خاص
3. جزئیات بیشتر اجرا
A. اصلاح فریم ترکیبی و مدلسازی GA
B. تعیین زوج گوینده ها
C. بازسازی بیان بی نقص
4. مطالعات تجربی
A. داده تست، سیستم ها و سنجش های عملکرد
B. ارزیابی شناسایی گوینده
C. ارزیابی سیستم CLOSE محدود یک طرفه
D. تحلیل الگوریتم CLOSE
5. نتایج به دست آمده
- بخشی از ترجمه:
5. نتایج به دست آمده
در این مقاله ما روش جدیدی به نام CLOSE را برای تفکیک گفتار تک کانالی ارائه کردیم. هدف روش CLOSE بهبود دفت تفکیک از طریق تحمیل محدودیت های زمانی طولانی مدت بر سیگنال های گفتاری بدون در نظر گرفتن دانش (آگاهی) درباره لغات، دستور زبان یا مدل زبان سیگنال های زبانی تخمینی است. این کار از طریق استفاده از یک ساختار داده محور به دست آمد. با توجه به گفتار هم کانال و داده آموزش مربوط به گویندگان منحصر به فرد، ما در جستجوی طولانی ترین بخش های گفتاری هم کانال با بخش های آموزشی ترکیبی تطبیقی برای انجام جداسازی بودیم. حدس ما این بود که این مساله می تواند به کاهش عدم قطعیت بخش های آموزشی تطبیقی و در نتیجه کاهش خطای جداسازی کمک کند. یک روش آماری برای شناسایی طولانی ترین بخش های تطبیقی در سیستم CLOSE ارائه شده بود.
آزمایش ها بر روی دیتابیس WSJ به منظور جداسازی ترکیب های سخنان های گفتار با دایره لغات وسیع که توسط گویندگان مختلف بیان شده بود و بدون در نظر گرفتن دانش قبلی درباره دایره لغات و مدل زبان و رو نوشت های داده آموزش، انجام شده بود. سنجش های اهدافی و موضوعی مختلفی برای ارزیابی عملکرد شامل بازشناسی گفتار پیسوته با دایره لغات وسیع مورد استفاده قرار گرفت. نتایج حاصله اهمیت تطبیق طولانی ترین بخش های گفتار برای تفکیک گفتار را بر حسب بهبود عملکرد نسبت به الگوریتم های متداول تفکیک فریم به فریم برای تمامی اندازه گیری ها نشان داده بود. ما همچنین نشان دادیم که این روش از نظر محاسباتی عملیاتی است. هم اکنون ما در حال مطالعه به کارگیری مستقیم الگوریتم CLOSE در یک سیستم بازشناسی گفتار را برای بهبود بیشتر عملکرد بازشناسی هستیم.
- بخشی از مقاله انگلیسی:
V. CONCLUDING REMARKS
In this paper, we presented a new approach, namely CLOSE, to single-channel speech separation. The CLOSE approach aimed to improve the separation accuracy by imposing long-range temporal constraints on the speech signals, without assuming knowledge about the vocabulary, grammar, or language model of the speech signals to be estimated. This was achieved by using a data-driven framework. Given co-channel speech and the training data of the individual speakers, we seek the longest co-channel speech segments with matching composite training segments to perform the separation. Our conjecture was that this would help reduce the uncertainty of the matching constituent training segments and hence the error of separation. A statistical method was presented for identifying the longest matching segments within the CLOSE system. Experiments were conducted on the WSJ database, for separating mixtures of large-vocabulary speech utterances spoken by different speakers, without assuming knowledge about the task’s vocabulary and language model, and transcripts of the training data. Various objective and subjective measures were used to evaluate the performance, including large-vocabulary continuous speech recognition. The results have demonstrated the significance of matching longest speech segments for speech separation, in terms of improving performance over conventional frame-by-frame separation algorithms for all the measures. We have also demonstrated the computational feasibility of the new method. Presently, we are studying the direct incorporation of the CLOSE algorithm into a speech recognition system, for further optimized recognition performance.
تصویری از مقاله ترجمه و تایپ شده در نرم افزار ورد |
|
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
الگوریتم CLOSE: روشی داده محور برای تفکیک گفتار |
عنوان انگلیسی مقاله: |
CLOSE—A Data-Driven Approach to Speech Separation |
|