عنوان فارسی مقاله: | استخراج کاراکتر در تصویر وب به منظور تشخیص و بازشناسی متن |
عنوان انگلیسی مقاله: | Character Extraction in Web Image for Text Recognition |
دانلود مقاله انگلیسی: | برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید |
سال انتشار | 2012 |
تعداد صفحات مقاله انگلیسی | 4 صفحه |
تعداد صفحات ترجمه مقاله | 8 صفحه |
مجله | کنفرانس بین المللی تشخیص الگو |
دانشگاه | سنگاپور |
کلمات کلیدی | – |
نشریه IEEE | IEEE |
فهرست مطالب:
چکیده
۱ مقدمه
۲ تکنیک پیشنهاد شده
۱ ۲ پیش پردازش
۲ ۲ هموارسازی و دودویی سازی تصویر
۳ ۲ تشخیص و آشکارسازی مولفه های کاراکتر
۴ ۲ تصحیح چوله و تشخیص متن
۳ آزمایشات و بحث
۴ نتیجه گیری
بخشی از ترجمه:
۱ مقدمه
در طول این سالها تصاویر موجود بر روی اینترنت به سرعت رو به افزایش می باشد. بسیاری از این تصاویر حاوی اطلاعات متنی هستند که در سایر مکان های صفحات وب یافت نمی شوند. تشخیص اطلاعات متنی در تصاویر وب برای درک و شناخت بهتر محتوای صفحات وب بسیار مفید می باشد. از آنجایی که این تصاویر متنی (تصاویری که متن درون آنها درج شده است) در اینترنت به منظورهای مختلف بکاربرده شده اند، در نتیجه از روش تشخیص متن درتصاویر وب می توان در برنامه های کاربردی مختلف من جمله شاخص گذاری (اندیس گذاری) و بازیابی صفحه وب، فیلتر نمودن محتوای صفحه وب استفاده نمود. از آنجایی که اطلاعات متنی درون تصاویر وب سهم بسزایی در توسعه آتی شبکه دارند در نتیجه این امر حتی مهمتر نیز ظاهر می شود.
تکنیک های زیادی برای استخراج و تشخیص متن برروی تصاویر ویدیویی و صفحه و منظره طبیعی پیشنهاد شده است، اما در خصوص تشخیص متن درون تصاویر وب تلاشهای کمی صورت گرفته است. در مقایسه با سایر تصاویر، تصاویر وب اغلب مستعد تنزل و کاهش کارایی تصویر خاص من جمله رزولاسیون پائین و اندازه کوچک برای نرخ انتقال سریعتر شبکه، آثار کاراکتر تولید شده توسط کامپیوتر و اثرات خاص برروی تصاویر به منظور جذابیت می باشند. در نتیجه در صورت استفاده مستقیم ازتکنیک های توسعه یافته برای تصاویر ویدیویی / مناظر طبیعی برای تصاویر وب، نتایج رضایتبخشی حاصل نمی کنند.
4. نتیجه گیری
در این مقاله، تکنیک تشخیص متن پایداری برای تصاویر وب جهت بررسی مشکلات توصیف شده در قسمت فوق پیشنهاد می کنیم. تکنیک پیشنهاد شده از هموارسازی نرم L0 برای بهبود کنتراست بین متن و زمینه استفاده کرده و مانع از تغییر شدت درون متن و زمینه تصاویر وب می شود. آزمایشات انجام شده روی مجموعه داده های روباست تحت آخرین کنفرانس CI-DAR انجام شد تا بدین طریق توضیح داده شود که تکنیک پیشنهادی نرخ تشخیص OCR را به طور قابل توجهی بهبود می بخشد.
بخشی از مقاله انگلیسی:
1. Introduction
The images on Internet are increasing tremendouslyduring these years. Many of these images contain textinformation that cannot be found in other places of theweb pages [2]. The recognition of the textual informa-tion within web images is very helpful for a better un-derstanding of the contents of web pages. As these im-ages with text embed are used in Internet for differentpurposes, text recognition in web images can be appliedon different kinds of applications, such as web page in-dexing & retrieval, web page content filtering [3]. It willbecome even more important as the textual informationwithin web images is contributing more and more due to the future network development.
Many techniques have been proposed for text ex-traction and recognition on videos and natural sceneimages [6, 10], but much fewer efforts have been re-ported for the recognition of the text within web im-ages [3, 5]. Compared with other images, web im-ages are often more susceptible to certain specific imagedegradations including low resolution and small size forfaster network transmission rate, computer-generate-character artifacts, and special effects on images for at-tractiveness purpose. As a result, the techniques devel-oped for video/natural scene images often fail to pro-duce satisfactory results when they are directly appliedfor web images.
4. Conclusion
In this paper, we propose a robust text recognition technique for web images to address the problems described above. The proposed technique that makes uses of the L0-norm smoothing to enhance the contrast between text and background and suppress the intensity variation within text and background of the web images. Experiments have been conducted on the recent Robust Reading Competition dataset held under the latest ICDAR conference [3] to demonstrate that our proposed technique significantly improves the OCR recognition rate.
عنوان فارسی مقاله: | استخراج کاراکتر در تصویر وب به منظور تشخیص و بازشناسی متن |
عنوان انگلیسی مقاله: | Character Extraction in Web Image for Text Recognition |
خرید ترجمه فارسی مقاله با فرمت ورد