دانلود ترجمه مقاله تکنیک تقسیم بندی جدید برای متن فارسی با هر فونت – الزویر ۲۰۰۱

elsevier

 

دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
عنوان فارسی مقاله:

تکنیک تقسیم بندی جدید برای متن فارسی با هر فونت

عنوان انگلیسی مقاله:

A new segmentation technique for omnifont Farsi text

 

 

مشخصات مقاله انگلیسی (PDF)
سال انتشار ۲۰۰۱
تعداد صفحات مقاله انگلیسی ۸ صفحه با فرمت pdf
رشته های مرتبط با این مقاله مهندسی کامپیوتر
گرایش های مرتبط با این مقاله مهندسی الگوریتم ها و محاسبات، هوش مصنوعی
چاپ شده در مجله (ژورنال) اسناد تشخیص الگو – Pattern Recognition Letters
کلمات کلیدی متن فارسی. با هر فونت. تقسیم بندی کاراکتر. ردیابی حد فاصل. کد زنجیره ای
ارائه شده از دانشگاه گروه مهندسی برق، دانشگاه تربیت مدرس، تهران، ایران
نویسندگان R. Azmi , E. Kabir
شناسه شاپا یا ISSN ISSN ۰۱۶۷-۸۶۵۵
شناسه دیجیتال – doi https://doi.org/10.1016/S0167-8655(00)00086-6
رفرنس دارد  
کد محصول ۹۵۱۹
لینک مقاله در سایت مرجع لینک این مقاله در نشریه Elsevier
نشریه الزویر

 

مشخصات و وضعیت ترجمه فارسی این مقاله (Word)
وضعیت ترجمه انجام شده و آماده دانلود
کیفیت ترجمه طلایی⭐️
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش  ۱۲ صفحه با فونت ۱۴ B Nazanin
ترجمه عناوین تصاویر و جداول ترجمه شده است  
ترجمه متون داخل تصاویر ترجمه شده است 
ترجمه متون داخل جداول ترجمه شده است  
درج تصاویر در فایل ترجمه درج شده است 
درج جداول در فایل ترجمه درج شده است  
منابع داخل متن به صورت انگلیسی درج شده است  

 

فهرست مطالب

چکیده

۱- مقدمه

۲- پیش پردازش

۲-۱- محاسبه اندازه قلم

۲-۲ تشخیص خط مبنای کلی

۲-۳- تنظیم خط مبنای موضعی

۳- الگوریتم تقسیم بندی

۳- ۱- برچسب گذاری حد فاصل

۳-۲ تقسیم بندی کاراکتر

۴- پس از پردازش

۵- نتایج تجربی

۶- نتیجه گیری

 

بخشی از ترجمه

چکیده

یک الگوریتم تقسیم بندی جدید بر اساس برچسب گذاری مشروط حد فاصل فوقانی ارائه شده است. یک روش پیش پردازش پیشنهاد شده است که خط مبنای موضعی برای هر زیرکلمه تنظیم می کند. این الگوریتم روی یک مجموعه داده ها از متون فارسی چاپ شده در ۲۰ فونت مورد آزمایش قرار گرفت. ۹۸٫۵% از کاراکترهای متصل شده به درستی تقسیم بندی شدند.

 

۵- نتایج تجربی
الگوریتم تقسیم بندی بر روی مجموعه ای از متون چاپ شده در ۲۰ فونت مختلف (شکل ۱۴) مورد آزمایش قرار گرفت. مجموعه آزمون شامل ۱۱۳۴۷ کاراکتر می شود که ۸۰۵۶ از آنها متصل هستند. نمونه های آموزش در مجموعه آزمون گنجانده نمی شوند. جدول ۱ خلاصه ای از نتایج را قبل و بعد از پس پردازش نشان می دهد. برخی از نمونه های نوعی از تقسیم بندی نادرست در شکل ۱۵ نشان داده شده اند.

۶- نتیجه گیری
در این مقاله، یک الگوریتم تقسیم بندی کاراکتر برای متن فارسی با هر فونت پیشنهاد شد. نرخ تقسیم بندی صحیح در حدود ۹۹٪ به دست آمد. الگوریتم در برابر کج شدن و تا حدی به هم ریختن خطوط پایه موضعی، مقاوم است. خطاهای تقسیم بندی عمدتا ناشی از رزولوشن اسکن کم و خطوط اریب متن می باشند.

 

بخشی از مقاله انگلیسی

Abstract

A new segmentation algorithm based on the conditional labeling of the upper contour is presented. A pre-processing technique is proposed that adjusts the local base line for each subword. The algorithm was tested on a data set of printed Farsi texts in 20 fonts. 98.5% of the connected characters were correctly segmented.

 

۵- Experimental results

The segmentation algorithm was tested on a set of printed texts in 20 dierent fonts (Fig. 14). The test set includes 11,347 characters, 8056 of them connected. The training samples are not included in the test set. Table 1 shows a summary of the results, before and after the post-processing. Some typical examples of incorrect segmentation are shown in Fig. 15.

۶- Conclusion

In this paper, a character segmentation algorithm was proposed for omnifont Farsi text. A correct segmentation rate of about 99% was achieved. The algorithm is tolerant to the slant and to some extent to the misalignment of the local base lines. The segmentation errors were mainly due to the low scanning resolution and skewed text lines.

 

 

تصویری از مقاله ترجمه و تایپ شده در نرم افزار ورد

 

 

دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
عنوان فارسی مقاله:

تکنیک تقسیم بندی جدید برای متن فارسی با هر فونت

عنوان انگلیسی مقاله:

A new segmentation technique for omnifont Farsi text

 

 

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد.