عنوان فارسی مقاله: | تشخیص چهره (چهره نگاری) با استفاده از شبکه های عصبی RBF (تابع مبنای شعاعی) |
عنوان انگلیسی مقاله: | Face Recognition With Radial Basis Function (RBF) Neural Networks |
دانلود مقاله انگلیسی: | برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید |
سال انتشار | 2008 |
تعداد صفحات مقاله انگلیسی | 14 صفحه |
تعداد صفحات ترجمه مقاله | 30 صفحه |
مجله | یافته ها در موضوع شبکه عصبی |
دانشگاه | کینگ دام کشور لندن |
کلمات کلیدی | تشخیص چهره ، مبین و مشخص کننده خطی فیشر، پایگاه داده ORL ، آنالیز مولفه اصلی، شبکه های عصبی RBF ، مجموعه های آموزشی کوچک با ابعاد بالا |
نشریه IEEE | آی تریپل ای – IEEE |
فهرست مطالب:
چکیده
مقدمه
تابع تشخیص خطی فیشر (FLD)
تعیین ساختار و راه اندازی شبکه های عصبی RBF
تعیین ساختارو انتخاب نمونه های اولیه
تخمین عرض
الگوریتم یادگیری هیبریدی
تعدیل وزن
اصلاح پارامترهای واحدهای RBF
روش یادگیری
ملاحظات
نتایج آزمایش
پایگاه داده ORL
خطای رده بندی قبل از یادگیری
خطای رده بندی بعد از یادگیری
مقایسه با سایر شیوه ها
بحث
رابطه بین مشخصه های چهره،رده بندها و عملکرد
رابطه بین نمونه های تمرینی و عملکرد
رابطه بین ارزش دهی اولیه و عملکرد
مشکل مجموعه نمونه های کوچک
نتیجه گیری
بخشی از ترجمه:
چکیده
در این مقاله شیوه طراحی کارآمد و عمومی با استفاده از رده بند و دسته کننده عصبی RBF برای رسیدگی به مجموعه های آموزشی کوچک با ابعاد بالا که در تشخیص چهره به کرار دیده می شود، معرفی شده است. به منظور اجتناب از انطباق زیاد و کاهش بار محاسباتی، ابتدا ویژگیها و مشخصه های چهره با روش آنالیز مولفه اصلی (PCA) استخراج می شوند. سپس مشخصه های حاصله با تکنیک FLD بیشتر مورد پردازش قرار می گیرند، تا بدین طریق الگوهای مبین و مشخص کننده با ابعاد پائین تر بدست آید. در اینجا الگوی جدیدی پیشنهاد شده است که به واسطه آن از اطلاعات داده برای تعیین ساختار و پارامترهای فردی رده بند عصبی RBF قبل از فراگیری استفاده شده است. در این راستا از الگوریتم یادگیری هیبریدی برای آموزش و تمرین شبکه های عصبی RBF استفاده شده است، به گونه ای که اندازه فضای جستجو در الگوی گرادیان به طور چشمگیری کاهش یافته است. نتایج شبیه سازی اجرا شده برروی پایگاه داده ORL نشان می دهد که سیستم از نظر نرخ خطای رده بندی و راندمان یادگیری، به عملکرد عالی دست می یابد.
واژگان کلیدی: تشخیص چهره ، مبین و مشخص کننده خطی فیشر، پایگاه داده ORL ، آنالیز مولفه اصلی، شبکه های عصبی RBF ، مجموعه های آموزشی کوچک با ابعاد بالا
1. مقدمه
تشخیص چهره انسان به روش ماشینی از طریق تصاویر ویدیویی به یک بخش تحقیقاتی فعال در جوامع پردازش تصویر، تشخیص الگو ، شبکه های عصبی و نگرش و دیدگاه کامپیوتری تبدیل شده است. انگیزه این علاقه از طریق برنامه های کاربردی ، از انطباق ایستایی عکس هایی با فرمت کنترل شده نظیر پاسپورت، کارت های اعتباری، گواهینامه های رانندگی، و عکس های گرفته شده در حین جنایت گرفته تا انطباق واقعی تصاویر ویدیویی نظارت و مراقبت که بازتابی از محدودیت های مختلف بر حسب نیازمندیهای پردازشی می باشند، حاصل شده است. اگرچه محققین در رشته روانشناسی، علوم عصبی و مهندسی، پردازش تصویر و نگرش و دید سیستم تعدادی از مسائل وابسته به تشخیص چهره توسط انسانها و ماشین ها را مورد پژوهش قرار داده اند، اما طراحی یک سیستم اتوماتیک برای این کار هنوز سخت و دشوار است، به ویژه زمانی که نیاز به شناسایی واقعی حتمی می باشد. دلایل این وضعیت سخت و دشوار عبارتنداز: 1) تصاویر چهره بسیار متنوع بوده و (2) منابع تغییرپذیری عبارتنداز ظاهر فرد، ژست سه بعدی (3-D) ، حالت چهره، موی چهره، آرایش ، و غیره که با گذشت زمان تغییر می کنند. به علاوه، روشنایی، پس زمینه، مقیاس و پارامترهای اکتساب نیز همگی در تصاویر چهره بدست آمده تحت سناریوهای واقعی متنوع و متغیر می باشند. بنا به اظهارات ، تغییرات بین تصاویر یک چهره به خاطر روشنایی و جهت دید ، تقریباً همیشه بزرگتر از تغییرات تصویر به خاطر تغییرات صورت گرفته در هویت چهره می باشند. این مسئله تشخیص چهره را به مشکل چالش برانگیزی تبدیل کرده است. به نظر ما، دو مسئله در بطن تشخیص چهره حائز اهمیت می باشد:
1) از کدام ویژگیها می توان برای نشان دادن چهره تحت شرایط تغییرات زیست محیطی استفاده نمود.
2) چگونه می توان تصاویر چهره جدید را بر اساس نمایش انتخاب شده، طبقه بندی نمود؟
برای مورد 1 ، الگوهای زیادی برای تشخیص چهره و استخراج مشخصه توسعه یافته است. کاربردی ترین شیوه ها عبارتنداز: استفاده از مشخصه های هندسی که موقعیت و حالت نسبی و اشکال مشخصه های مختلف اندازه گیری می شود. در این وضعیت، الگوهای زیادی پیشنهاد شده است که از نمایش کلی چهره استفاده می کنند، یعنی کلیه مشخصه های چهره به طور خودکار از یک تصویر چهره ورودی استخراج می شوند. در مرجع 4 نشان داده شده است که این الگوریتم ها با رمزگذاری کلی چهره در خصوص تشخیص چهره سریع عمل می کنند. در مرجع 5، از SVD (تجزیه مقدار ویژه) ماتریس برای استخراج مشخصه ها از الگوها استفاده شده است. در این راستا توضیح داده شده است که مقادیر ویژه و منفردیک تصویر ثابت بوده و بازتابی از مشخصه های جبری یک تصویر خواه به صورت ذاتی خواه مرئی و قابل مشاهده می باشند. شیوه چهره مشخصه توصیف مشخصه های چهره، در مرجع 6 معرفی گردید. ایده کلیدی، محاسبه بهترین سیستم مختصات برای تراکم تصویر می باشد که هر مختصات در واقع تصویری است که یک تصویر مشخصه نامیده می شود. اما الگوی چهره مشخصه که از آنالیز مولفه اصلی (PCA) استفاده می کنند، جهت هایی به تصویر می دهد که پراکندگی کل در میان کلیه طبقات به عبارتی در میان کلیه تصاویر چهره را به حداکثر می رساند.
در جریان انتخاب تصویری که پراکندگی کل را به حداکثر برساند، PCA تغییرات ناخواسته ناشی از نور، حالت چهره و سایر فاکتورها را حفظ می کند. همچنین، مشخصه های حاصله الزاماً مناسب تمایز و تشخیص در میان کلاس ها نمی باشند. در مراجع 7 و 8 ، مشخصه های چهره با استفاده از الگوی مشخصه متمایز یا چهره فیشر بدست آمده اند. هدف این الگوغلبه بر مانع الگوی چهره ویژه یا مشخصه از طریق تلفیق معیارهای FLD بوده و در عین حال ایده الگوی چهره ویژه در ترسیم چهره ها از فضای ترسیم با بعد بالا به فضای مشخصه کم بعد تر را حفظ می کند. به جای استفاده از تئوری آماری، استخراج مشخصه بر مبنای شبکه های عصبی اخیراً توسعه یافته است. هدف پردازش چهره با استفاده از شبکه های عصبی، نمایش داخلی فشرده چهره هاست که معادله استخراج مشخصه عمل می کند. بنابراین، تعداد نورون های مخفی کمتر از لایه های ورودی یا خروجی می باشد، این مسئله موجب می گردد ورودی های رمزگذاری شبکه در ابعاد کوچکتری قرار داشته باشند که بیشتر اطلاعات مهم را حفظ می کنند. سپس، واحدهای مخفی شبکه عصبی می تواند به عنوان لایه ورودی شبکه عصبی دیگر و طبقه بندی تصاویر چهره عمل کند. در بسیاری از سیستم های تشخیص الگو، روش مکرراً به کارگرفته شده ، شیوه آماری می باشد که تئوری تصمیم حاصله از آماره های الگوهای ورودی برای طراحی رده بند به کار گرفته شده است. اگرچه از این الگو برای حل مسائل مختلف در زمینه رده بندی الگو استفاده شده است، اما بیان و ارائه اطلاعات ساختاری کار سخت و دشواری می باشد، مگر اینکه ویژگیها و مشخصه های درست انتخاب شده باشند. به علاوه، این شیوه برای طراحی رده بند به اطلاعات کلی نیاز دارد. الگوهای بر مبنای شبکه های عصبی، به عنوان ابزارهای جدید برای اجرای رده بندهای مختلف بر اساس شیوه ساختاری و آماری، مزایای زیادی برای رده بندی دارند، علت این امر توانایی یادگیری آنها و تعمیم مطلوب و بهینه آنها می باشد. عموماً، شبکه های چندلایه (MLN) معمولاً با الگوریتم انتشار معکوس (BP) جفت شده و یکی از کاربردی ترین روشها در تشخیص چهره به شمار می روند. با این وجود، از الگوریتم BPدو انتقاد عمده مطرح شده است: 1) به خاطر سرعت همگرایی کند ، از لحاظ محاسباتی بسیار سخت و دشوار بوده و 2) هیچ تضمینی وجود ندارد که کلیه مینیموم های مطلق بدست بیایند. از طرف دیگر، شبکه های عصبی RBF در جوامع شبکه های عصبی به خاطر طیف وسیع کاربردها، علاقه زیاد مسئولین را به خود جلب کرده اند
بخشی از مقاله انگلیسی:
I. INTRODUCTION
MACHINE recognition of human face from still and videoimages has become an active research area in the communitiesof image processing, pattern recognition, neural networksand computer vision. This interest is motivated by wideapplications ranging from static matching of controlled formatphotographs such as passports, credit cards, driving licenses,and mug shots to real-time matching of surveillance video imagespresenting different constraints in terms of processing requirements[1]. Although researchers in psychology, neural sciencesand engineering, image processing and computer visionhave investigated a number of issues related to face recognitionby human beings and machines, it is still difficult to design anautomatic system for this task, especially when real-time identificationis required. The reasons for this difficulty are two-fold:
1) Face images are highly variable and
2) Sources of variabilityinclude individual appearance, three-dimensional (3-D) pose,facial expression, facial hair, makeup, and so on and these factorschange from time to time. Furthermore, the lighting, background,scale, and parameters of the acquisition are all variables in facial images acquired under real-world scenarios [1].As stated by Moses et al. [2], “The variations between the imagesof the same face due to illumination and viewing directionare almost always larger than image variations due to changesin the face identity.” This makes face recognition a great challengingproblem. In our opinion, two issues are central to facerecognition:1) What features can be used to represent a face under environmentalchanges?2) How to classify a new face image based on the chosenrepresentation? For 1), many successful face detection and feature extractionparadigms have been developed [3]–[12]. The frequentlyused approaches are to use geometrical features, where the relativepositions and shapes of different features are measured[3], [4]. At the same time, several paradigms have been proposedto use global representation of a face, where all featuresof a face are automatically extracted from an input facial image[5]–[12]. It has been indicated in [4] that these algorithms withglobal encoding of a face are fast in face recognition. In [5],singular value decomposition (SVD) of a matrix was used toextract features from the patterns. It has been illustrated thatsingular values of an image are stable and represent the algebraicattributes of an image, being intrinsic but not necessarily visible. The eigenface approach of describing the features of aface was presented in [6]. The key idea is to calculate the bestcoordinate system for image compression, in which each coordinateis actually an image that is called an eigenpicture. However,the eigenface paradigm, which uses principal component analysis(PCA), yields projection directions that maximize the totalscatter across all classes, i.e., across all face images. In choosingthe projection which maximizes the total scatter, the PCA retainsunwanted variations caused by lighting, facial expression,and other factors [7]. Accordingly, the features produced are notnecessarily good for discrimination among classes. In [7], [8],the face features are acquired by using the fisherface or discriminanteigenfeature paradigm. This paradigm aims at overcomingthe drawback of the eigenface paradigm by integrating Fisher’slinear discriminant (FLD) criteria, while retaining the idea of theeigenface paradigm in projecting faces from a high-dimensionimage space to a significantly lower-dimensional feature space.Instead of using statistical theory, neural-networks-based featureextraction has been reported recently [9]–[12]. The goal offace processing using neural networks is to develop a compactinternal representation of faces, which is equivalent to featureextraction. Therefore, the number of hidden neurons is less thanthat in either input or output layers, which results in the networkencoding inputs in a smaller dimension that retains most of theimportant information. Then, the hidden units of the neural net- work can serve as the input layer of another neural network toclassify face images.In many pattern recognition systems, the methodology frequentlyused is the statistical approach, whereby decision theoryderived from statistics of input patterns is used to design a classifier[13]. Although this paradigm has been successfully appliedto solve various problems in pattern classification, it hasdifficulty in expressing structural information unless an appropriatechoice of features is made possible. Furthermore, this approachrequires much heuristic information to design a classifier[14]. Neural-networks-based paradigms, as new means ofimplementing various classifiers based on statistical and structuralapproach, have been proven to possess many advantagesfor classification because of their learning ability and good generalization[9]–[12], [14]–[16]. Generally speaking, multilayerednetworks (MLNs), usually coupled with the backpropagation(BP) algorithm, are most widely used in face recognition[9]. Yet, two major criticisms are commonly raised against theBP algorithm: 1) It is computationally intensive because of itsslow convergence speed and 2) there is no guarantee at all thatthe absolute minima can be achieved. On the other hand, RBFneural networks have recently attracted extensive interests in thecommunity of neural networks for a wide range of applications[17]–[29]. The salient features of RBF neural networks are asfollows.• They are universal approximators [17].• They possess the best approximation property [18].• Their learning speed is fast because of locally tuned neurons[19].• They have more compact topology than other neural networks[20].Normally, RBF neural networks are widely used for functionapproximation and pattern recognition wherein the pattern dimensionin these applications is usually small. As pointed out byMoody and Darken [19], “RBF neural networks are best suitedfor learning to approximate continuous or piecewise continuous,real-valued mapping where the input dimension is sufficientlysmall.” When RBF neural networks are implemented in facerecognition, such systems possess the following characteristics:• High dimension. For example, a 128 128 image willhave 16 384 features.• Small sample sets. The sample patterns are very few foreach class, say, only one–ten images per person so that( is the number of training patterns, is thenumber of features), which is more severe than the caseshown in [16].
عنوان فارسی مقاله: | تشخیص چهره (چهره نگاری) با استفاده از شبکه های عصبی RBF (تابع مبنای شعاعی) |
عنوان انگلیسی مقاله: | Face Recognition With Radial Basis Function (RBF) Neural Networks |
خرید ترجمه فارسی مقاله با فرمت ورد
خرید نسخه پاورپوینت این مقاله جهت ارائه