دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: | یک پروژه Matlab در تشخیص نوری کاراکترها (OCR) |
عنوان انگلیسی مقاله: | (A Matlab Project in Optical Character Recognition (OCR |
مشخصات مقاله انگلیسی (PDF) | |
تعداد صفحات مقاله انگلیسی | 6 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر و فیزیک |
گرایش های مرتبط با این مقاله | اپتیک و لیزر، پرتو شناسی، مهندسی نرم افزار و هوش مصنوعی |
نشریه | ele.uri |
مشخصات و وضعیت ترجمه مقاله (Word) | |
تعداد صفحات ترجمه مقاله | 10 صفحه با فرمت ورد، به صورت تایپ شده و با فونت 14 – B Nazanin |
ترجمه اشکال | ترجمه توضیحات زیر اشکال انجام شده و اشکال و نمودارها به صورت عکس در فایل ترجمه درج شده است. عبارات داخل کادر و اشکال ترجمه نشده است. |
فهرست مطالب:
مقدمه OCR چیست؟
فرآیند طبقه بندی
۱ تعلیم
۲ تست
OCR برآورد مدل (نگاه کنید به مرجع شماره ۱)
OCR طبقه بندی (نگاه کنید به مرجه شماره ۱)
اجرای Matlab
واسط کاربر گرافیکی دسته ساز کاراکتر (GUI)
بارگذاری یک تصویر
باینری سازی و قسمت بندی
برچسب گذاری بر روی کاراکترها
ذخیره سازی و بارگذاری ویژگی ها، برچسب ها و غیره
تعیین اطلاعات مربوط به طبقه/ویژگی ها
بخشی از ترجمه:
ذخیره سازی و بارگذاری ویژگی ها، برچسب ها و غیره.
تصاویر قطعه بندی شده، ویژگی های کاراکتر، و برچسب ها را می توان با کلیک کردن بر روی منوی Data و انتخاب گزینه Save ذخیره کرد. برای ذخیره سازی داده ها نیازی به برچسب گذاری کاراکترها نیست. داده های تصویر (ویژگی ها و غیره) را با کلیک کردن بر روی منوی Data و انتخاب گزینه Load بارگذاری کنید. به شکل 4 نگاه کنید.
تعیین اطلاعات مربوط به طبقه/ویژگی ها
همه کاراکترها را باید قبل از اینکه اطلاعات طبقه/ویژگی ها تعیین گردد، برچسب گذاری کرد. اگر کاراکترها برچسب گذاری شده بودند، دو تا از ویژگی ها را با بررسی کردن کادرهای مناسب انتخاب کنید. سپس، بر روی دکمه بدون برچسب کلیک کنید تا طبقات کاراکترها بعنوان تابعی از ویژگی ها تعیین گردد. اگر بیشتر از دو کادر بررسی شده بود، فقط از دو ویژگی انتخاب شده اول استفاده خواهد شد.
بخشی از مقاله انگلیسی:
Other Examples of Pattern Recognition: 1. Facial feature recognition (airport security) – Is this person a bad-guy? 2. Speech recognition – Translate acoustic waveforms into text. 3. A Submarine wishes to classify underwater sounds – A whale? A Russian sub? A friendly ship? The Classification Process: (Classification in general for any type of classifier) There are two steps in building a classifier: training and testing. These steps can be broken down further into sub-steps. 1. Training a. Pre-processing – Processes the data so it is in a suitable form for… b. Feature extraction – Reduce the amount of data by extracting relevant information—Usually results in a vector of scalar values. (We also need to NORMALIZE the features for distance measurements!) c. Model Estimation – from the finite set of feature vectors, need to estimate a model (usually statistical) for each class of the training data 2. Testing a. Pre-processing b. Feature extraction – (both same as above) c. Classification – Compare feature vectors to the various models and find the closest match. One can use a distance measure. OCR – Pre-processing These are the pre-processing steps often performed in OCR Binarization – Usually presented with a grayscale image, binarization is then simply a matter of choosing a threshold value. Morphological Operators – Remove isolated specks and holes in characters, can use the majority operator. Segmentation – Check connectivity of shapes, label, and isolate. Can use Matlab 6.1’s bwlabel and regionprops functions. Difficulties with characters that aren’t connected, e.g. the letter i, a semicolon, or a colon (; or :). Segmentation is by far the most important aspect of the pre-processing stage. It allows the recognizer to extract features from each individual character. In the more complicated case of handwritten text, the segmentation problem becomes much more difficult as letters tend to be connected to each other. OCR – Feature extraction (see reference [2]) Given a segmented (isolated) character, what are useful features for recognition? 1. Moment based features Think of each character as a pdf. The 2-D moments of the character are: ∑∑ − = − = = 1 0 1 0 ( , ) W x H y p q pq m x y f x y From the moments we can compute features like: 1. Total mass (number of pixels in a binarized character) 2. Centroid – Center of mass 3. Elliptical parameters i. Eccentricity (ratio of major to minor axis) ii. Orientation (angle of major axis) 4. Skewness 5. Kurtosis 6. Higher order moments 2. Hough and Chain code transform 3. Fourier transform and series OCR – Model Estimation (see reference [1]) Given labeled sets of features for many characters, where the labels correspond to the particular classes that the characters belong to, we wish to estimate a statistical model for each character class. For example, suppose we compute two features for each realization of the characters 0 through 9.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: | یک پروژه Matlab در تشخیص نوری کاراکترها (OCR) |
عنوان انگلیسی مقاله: | (A Matlab Project in Optical Character Recognition (OCR |