عنوان فارسی مقاله: | شناسایی گفتار جدا شده با بخشبندی بعدهای فرکتال |
عنوان انگلیسی مقاله: | FRACTAL DIMENSION SEGMENTATION: ISOLATED SPEECH RECOGNITION |
دانلود مقاله انگلیسی: | جهت دانلود رایگان نسخه انگلیسی این مقاله اینجا کلیک نمایید |
سال انتشار | 2000 |
تعداد صفحات مقاله انگلیسی | 5 |
تعداد صفحات ترجمه مقاله | 10 |
مجله | کدینگ سخنرانی برای الگوریتم های کانال های رادیویی |
دانشگاه | دانشگاه دی مون فارت، کشور انگلستان |
کلمات کلیدی | – |
نشریه IEEE | IEEE |
بخشی از ترجمه:
چکیده ترجمه:
در این مقاله قصد داریم استفاده از هندسه ی فراکتال را برای تقسیم بندی سیگنال های دیجیتال مورد بررسی قرار دهیم. یک متد تقسیم بندی بافت را معرفی خواهیم کرد که بر مبنای بعد فراکتال خواهد بود. با استفاده از این روش، تغییرات صورت گرفته در بافت موجود در امتداد یک سیگنال یا تصویر را میتوان بر حسب تغییرات در بعد فراکتال توصیف کرد.
با استفاده از تحلیل نوسانات فضایی در بعد فراکتال بدست آمده با استفاده از روش پنجره ی حرکتی مرسوم، یک سیگنال دیجیتال یا تصویری را میتوان بر اساس بافت بخش بندی کرد؛ این همان اصل بخش بندی بعد فراکتال (FDS) میباشد.
در این مقاله، ما از این نوع بخش بندی بافت بر روی سیگنال های گفتار ایزوله شده استفاده خواهیم کرد.
متد های مربوط به محاسبه ی بعد فراکتال را نیز با هدف تمرکز بر روی روشی که از تابع چگالی انرژی(FSDF) مربوط به سیگنال فراکتال مقیاس بندی تصادفی استفاده میکند، مورد بازبینی قرار خواهیم داد.
FDS در یک سری سیگنال گفتار مختلف بکار گرفته شده است و نتایج آن برای واژه ها و مؤلفه های مجزا(مانند سایشی) که این واژه ها از آن بدست آمده است. به طور خاص، نشان داده شده است که سیگتال های گفتار پیش فیلترینگ با یک فیلتر گذر سطح پایین دارای شکل ١/K خواهند بود. این خصیصه باعث شده تا سطح اطمینانی از این روش در بخش بندی گفتار بدست آید که منجر به ارائه ی شِمای تطابق الگو شده که باید آنرا بر مبنای FDS به صورت انحصاری طراحی کرد.
١.مقدمه
تشخیص گفتار، یک دامنه ی جدیدی از سرویس های محاسباتی را که قابلیت های انسانی را توسعه میدهد معرفی کرده است، که از نیازمندی های اجتماعی آن به منظور افزایش بهره وری آن استفاده میکند.
برای مثال تشخیص واژه مجزا، میتواند برای ثبت سیستم حمل در انبار ها و یا تشخیص و شمارش آیتم ها به منظور کنترل دارائی مفید باشد. این امر نیاز به یک وقفه ی کوتاهی در قبل و بعد از گفتار و سخن که باید به صورت کلی تشخیص داده شود، دارد[١]. به عبارت دیگر، این واژه ها به صورت مجزا بیان میشوند. توقف بین واژه ها باعث ساده شدن تشخیص خواهد شد، چرا که تشخیص نقاط نهایی را آسان میسازند. (مثلاٌ شروع و پایان هر کلمه) و باعث کمینه شدن تأثیرات گفتار کلمات به صورت چسبیده پشت سر هم خواهد شد. علاوه بر این، واژه های مجزا به صورت دقیق تلفظ میشوند، چرا که نیاز برای توقف بین واژه ها باعث شده تا روانی گفتار با اختلال روبرو شده که در غیر اینصورت، باعث ترغییب تلفظ طبیعی تری و با سطح دقت کمتری خواهد شد.
بخشی از مقاله انگلیسی:
Abstract:
This paper investigates the use of fractal geometry for segmenting digital signals. A method of texture segmentation is introduced which is based on the Fractal Dimension. Using this approach, variations in texture across a signal or image can be characterized in terms of variations in the fractal dimension. By analyzing the spatial fluctuations in fractal dimension obtained using a conventional moving window approach, a digital signal or image can be texture segmented; this is the principle of Fractal Dimension Segmentation (FDS).
In this paper, we apply this form of texture segmentation to isolated speech signals. An overview of methods for computing the fractal dimension is presented focusing on an approach that makes use of the characteristic Power Density Function (PSDF) of a Random Scaling Fractal Signal. FDS is applied to a number of different speech signals and the results discussed for isolated words and the components (e.g. fricatives) from which these words are composed. In particular, it is shown that by pre-filtering speech signals with a low-pass filter ofthe form lk. This provides confidence in the approach to speech segmentation considered in this paper and in principle, allows a template matching scheme to be designed that is based exclusively on FDS.
عنوان فارسی مقاله: | شناسایی گفتار جدا شده با بخشبندی بعدهای فرکتال |
عنوان انگلیسی مقاله: | FRACTAL DIMENSION SEGMENTATION: ISOLATED SPEECH RECOGNITION |