دانلود رایگان ترجمه مقاله طبقه‌ بندی عمیق تصاویر فراطیفی (آی تریپل ای ۲۰۱۷)

 

 

این مقاله انگلیسی ISI در نشریه آی تریپل ای در ۱۴ صفحه در سال ۲۰۱۷ منتشر شده و ترجمه آن ۳۱ صفحه بوده و آماده دانلود رایگان می باشد.

 

دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word)
عنوان فارسی مقاله:

طبقه‌ بندی عمیق تصویر Hyperspectral با CNN متنی

عنوان انگلیسی مقاله:

Going Deeper with Contextual CNN for Hyperspectral Image Classification

دانلود رایگان مقاله انگلیسی
دانلود رایگان ترجمه با فرمت pdf
دانلود رایگان ترجمه با فرمت ورد

 

مشخصات مقاله انگلیسی و ترجمه فارسی
فرمت مقاله انگلیسی pdf
سال انتشار ۲۰۱۷
تعداد صفحات مقاله انگلیسی ۱۴ صفحه با فرمت pdf
نوع مقاله ISI
نوع نگارش مقاله پژوهشی (Research article)
نوع ارائه مقاله ژورنال
رشته های مرتبط با این مقاله مهندسی کامپیوتر
گرایش های مرتبط با این مقاله هوش مصنوعی – علوم داده
چاپ شده در مجله (ژورنال)/کنفرانس معاملات در پردازش تصویر
کلمات کلیدی شبکه عصبی کانولوشن (CNN) – طبقه‌ بندی تصویر Hyperspectral – یادگیری وابسته – بانک فیلتر چندمقیاسی – شبکه‌ ی کاملا کانولوشن (FCN)
کلمات کلیدی انگلیسی Convolutional neural network (CNN) – hyperspectral image classification – residual learning – multi-scale filter bank – fully convolutional network (FCN)
ارائه شده از دانشگاه شعبه پردازش تصویر، اداره حسگرها و دستگاه های الکترونی
نمایه (index) Scopus – Master Journals – JCR – Medline
شناسه شاپا یا ISSN ۱۹۴۱-۰۰۴۲
شناسه دیجیتال – doi https://doi.org/10.1109/TIP.2017.2725580
لینک سایت مرجع https://ieeexplore.ieee.org/document/7973178
رفرنس دارای رفرنس در داخل متن و انتهای مقاله
نشریه آی تریپل ای – IEEE
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش  ۳۱ صفحه با فونت ۱۴ B Nazanin
فرمت ترجمه مقاله pdf و ورد تایپ شده با قابلیت ویرایش
وضعیت ترجمه انجام شده و آماده دانلود رایگان
کیفیت ترجمه

مبتدی (مناسب برای درک مفهوم کلی مطلب) 

کد محصول F2296

 

بخشی از ترجمه

Chen و همکارانش [۱] از stacked autoencoders (SAE) برای یادگیری ویژگی‌های عمیق از hypersepctral در حالت بدون نظارت همراه با رگرسیون لجستیک مورد استفاده برای طبقه‌بندی ویژگی‌های عمیق استخراج شده به دسته‌های مناسب استفاده می‌کنند. هر دو بردار پیکسل طیفی و بردار فضایی مربوطه‌ی به دست آمده از تجزیه‌وتحلیل مولفه‌های اصلی (PCA) به داده‌های hypersepctral بر روی ابعاد طیفی جداگانه از یک منطقه محلی به دست می‌آیند و سپس به طور مشترک به عنوان ورودی به SAE مورد استفاده وارد می‌شوند. در [۷]، chen و همکارانش SAE را با یک شبکه عمیق (DBN) جایگزین کردند، که شبیه شبکه عصبی کانولوشن عمیق برای طبقه‌بندی HSI است. li و همکارانش [۸] از یک DBL دو لایه استفاده کردند اما از کاهش اندازه اولیه استفاده نکرد، که به ناچار باعث از بین رفتن اطلاعات بحرانی تصاویر hypersepctral بود. Hu و همکارانش [۲] از بردارهای پیکسل طیفی به‌صورت جداگانه از طریق CNN ساده استفاده کردند که در آن فيلترهای کانولوشن محلی به بردارهای طيفي برای استخراج ویژگی‌های طيفي محلی اعمال می‌شود. سپس نگاشت‌های ویژگی تولید شده پس از جمع‌آوری حداکثری به عنوان ورودی به مرحله طبقه‌بندی کاملا متصل برای طبقه‌بندی مورد استفاده قرار می‌گیرند. Chen و همکارانش [۴] همچنین از شبکه عصبی کانولوشن عمیق با پنج لایه‌ی کانولوشن و یک لایه کاملا متصل برای طبقه‌بندی hyperspectral استفاده کردند.
بر خلاف روش‌های مبتنی بر یادگیری عمیق، ابتدا در تلاش برای ساختن شبکه عمیق‌تر و وسیع‌تر با استفاده از مقادیر نسبتا کم نمونه‌های آموزشی بودیم. انتظار می‌رود که شبکه به طور موثر بهینه‌سازی شده و عملکرد پیشرفته‌ای را در شبکه‌های نسبتا جزئی و باریک ارائه دهد.

۳٫ شبکه‌های عصبی عمیق
در این بخش ابتدا مدل CNN که به طور گسترده مورد استفاده قرار می‌گیرید با عنوان AlexNet شرح داده می‌شود و سپس معماری کل شبکه پیشنهادی مورد بحث قرار می‌گیرد. دو عنصر کلیدی شبکه پیشنهادی، «بانک فیلتر چندمقیاسی کانولوشن» و «یادگیری وابسته» توضیح داده می‌شود. در نهایت روند یادگیری شبکه در انتهای بخش بحث می‌شود.

.A شبکه عصبی مصنوعی عمیق
مدل CNN عمیق که استفاده شده شامل چندین لایه از نورون‌ها است، که هر کدام از آنها یک سطح متفاوتی از ویژگی‌های غیرخطی را از ورودی که از ویژگی‌های سطح پایین به بالا است، استخراج می‌کند. غیرخطی بودن در هر لایه با استفاده از یک کارکرد غیرخطی برای تولید لایه‌ها در هر لایه انجام می‌شود. شبکه پیشنهادی اساسا یک شبکه عصبی کانولوشن با یک تابع فعال غیرخطی است که در [۱۶] استفاده شده است. در این بخش ابتدا معماری AlexNet، یک مدل CNN عمیق، همانطور که در شکل ۲ نشان داده شده است، را توصیف می‌کنیم تا پایه‌ای برای درک معماری شبکه پیشنهادی ارائه شود. AlexNet شامل پنج لایه کانولوشن و سه لایه کاملا متصل است.

جایی که k، n، α، و β دارای پارامترهای هیدرولیکی هستند. خروجی لایه‌ها با استفاده از جایگزینی یک زیر منطقه خروجی با حداکثر مقدار، که معمولا برای کاهش ابعاد در CNN استفاده می‌شود، نمونه‌ای از لایه‌ها را می‌سازد. ReLU مقادیر منفی را به صفر می‌رساند و برای شبکه و در جهت یادگیری پارامترها با استفاده از فعال‌سازی مثبت استفاده می‌شود. ReLU اساسا عملکرد تابع sigmoid را که معمولا برای شبکه‌های عصبی دیگر استفاده می‌شود، جایگزین می‌کند، عمدتا به این دلیل که یادگیری CNN عمیق با ReLU چندین بار سریعتر از شبکه با سایر توابع فعال غیرخطی مانند tanh است. Dropout یک تابع است که خروجی گره‌های جداگانه هر لایه را با احتمال با یک آستانه مشخص صفر می‌کند و هر مقداری را در داخل (۰، ۱) قرار می‌دهد. در این کار، از آستانه ۰٫۵ استفاده کردیم. Dropout با جلوگیری از هماهنگی چندگانه داده‌های آموزشی همزمان (که به عنوان “سازگاری های پیچیده” شناخته می‌شود) از بین می‌رود.

.B معماری شبکه پیشنهادی
یک شبکه کاملا مجتمع جدید (FCN) [13] با تعدادی لایه کانولوشن برای طبقه‌بندی HSI ارائه می‌دهیم، همانطور که در شکل ۳ نشان داده شده است. قسمت اول شبکه، یک “بانک چندمقیاسی” همراه دو بلوک از لایه‌های کانولوشن مرتبط با یادگیری وابسته است. سه لایه کانولوشن بعدی به نحوی مشابه با لایه‌های کاملا متصل برای طبقه‌بندی AlexNet عمل می‌کنند که طبقه‌بندی را با استفاده از ویژگی‌های محلی انجام می‌دهند.

مشابه AlexNet، لایه‌های کانولوشن هفتم و هشتم در آموزش دیده می‌شوند. ReLU پس از بانک فلیتر چندمقیاسی، لایه‌های کانولوشن دوم، سوم، پنجم، هفتم، هشتم و دو ماژول یادگیری وابسته استفاده می‌شود. خروجی اولین لایه کانولوشن توسط LRN نرمال می‌شود. توجه داشته باشید که ارتفاع و عرض تمام بلوک‌های داده در معماری یکسان هستند و تنها عمق آنها تغییر می‌کند. کاهش حجم در طول پردازش FCN انجام نمی‌شود.
توجه داشته باشید که برگرداندن ۱ × ۱ × d با فیلترهای ۱ × ۱ × ۱ می‌تواند همان اثر را برگرداند که به‌عنوان کاملا متصل ۱ × ۱ × d گره ورودی به خروجی، همانطور که در شکل ۴ نشان داده شده داشته باشد. با توجه به مدل convolutionalized، FCN می‌تواند برای طبقه‌بندی پیکسل، مانند تقسیم معنایی، طبقه‌بندی HSI، و غیره استفاده شود. از آنجا که شبکه ما براساس FCN است، شبکه پیشنهاد شده بر روی ۵ × ۵ پیکسل در محدوده بردارهای پیکسل‌های فردی و برای تست کل تصویر یاد می‌گیرد.

شبکه‌های پیشنهادی چقدر عمیق هستند؟ شبکه پیشنهاد شده شامل ۹ لایه است که خیلی بیشتر از سایر CNN ها برای طبقه‌بندی HSI آموزش داده شده بر روی مجموعه داده‌های مشابه مناسب است [۲]. با این حال، عمق ۹ هنوز به نظر نمی‌رسد به اندازه کافی بزرگ باشد، به ویژه در مقایسه با CNN های پیشرفته موجود برای طبقه‌بندی تصویر، مانند ResNet [11]. این مسئله به این دلیل است که CNN های مبتنی بر HSI باید در مقادیر بسیار کمتر از نمونه‌های آموزشی تربیت شوند تا از CNN های طبقه‌بندی تصویر که به طور عمده در پایگاه داده‌های بزرگ مانند ImageNet (1.2 M) آموزش داده می‌شود [۱۷] آموزش داده شوند. استراتژی عمیق پیشنهاد شده محدود به داده‌های بسیار محدود آموزش HSI، با استفاده از تعداد بسیار زیادی لایه برای اجتناب از overfitting است. با این حال، هنوز هم تعداد بسیار زیادی از لایه‌ها از سایر CNN های مبتنی بر HSI استفاده می‌کنند. جدول ۱ مقایسه CNN های مختلف برای طبقه‌بندی تصویر و HSI با متغیرهای شبکه، مانند تعداد لایه‌ها و پارامترها، اندازه داده‌های آموزشی و نسبت تعدادی از پارامترها و اندازه‌های داده را نشان می‌دهد.
بنا به افزایش اطلاعات استفاده شده در CNN های طبقه‌بندی تصویر، شبکه پیشنهاد شده از یک استراتژی تقویت اطلاعات توصیف شده در بخش III-E استفاده می‌کند. همانطور که در جدول ۱ نشان داده شده است، شبکه پیشنهاد شده نسبت تعداد پارامترها و داده‌های آموزش را نسبت به مقادیر پایه [۲] برای یک مجموعه داده‌های آموزشی مشابه، نسبتا بزرگتر است. همچنین پارامتر نسبت داده‌ها نسبت به شبکه‌های پیشنهادی تقریبا هشت برابر بزرگتر از هر کدام از CNN های طبقه‌بندی تصویر است. این مسئله نشان می‌دهد که معماری شبکه پیشنهادی طراحی شده است تا اطمینان حاصل شود که عمق مناسب لایه‌ها به طور کامل از داده‌های آموزشی بهره‌برداری می‌کند.

.C بانک فیلتر چندمقیاسی
اولین لایه کانولوشن که به تصویر Hyperspectral ورودی اعمال شده است از یک بانک فیلتر چندبعدی استفاده می‌کند که به صورت محلی تصویر ورودی را با سه فیلتر کانولوشن با ابعاد مختلف (۱ × ۱ × B، ۳ × ۳ × B، و ۵ × ۵ × B که در آن B تعداد نوارهای طیفی است) پردازش می‌کند. فیلترهای ۳ × ۳ × B و ۵ × ۵ × B برای بهره‌برداری از همبستگی‌های فضایی محلی تصویر ورودی استفاده می‌شود در حالی که فیلتر ۱ × ۱ × B برای استفاده از ارتباطات طیفی استفاده می‌شود. خروجی اولین لایه کانولوشن ترکیبی برای ایجاد یک نگاشت ویژگی مشترک فضایی طیفی استفاده شده به عنوان ورودی به لایه‌های کانولوش بعدی است.
با این حال، از آنجا که اندازه نگاشت‌های ویژگی از سه فیلتر کانولوشن متفاوت است، استراتژی برای تنظیم اندازه نگاشت‌های ویژگی با ترکیب آنها برای نگاشت ویژگی مشترک موردنیاز است. ابتدا، یک فضا با عرض دو پیکسل که با صفرها در اطراف تصویر ورودی پوشیده ‌شده است، به‌طوری‌که اندازه ویژگی‌ها از فیلترهای ( ۱ × ۱، ۳ × ۳ و ۵ × ۵ (H + 4، W +4 )، (H + 2، W +2) و (H، W) تشکیل شده است. H و W ارتفاع و عرض تصویر ورودی است. اندازه تمام نگاشت‌های ویژگی (H، W) پس از ۵ × ۵ و ۳ × ۳ حداکثر به طور کامل به نگاشت‌های ویژگی فیلتر ۱ × ۱ و ۳ × ۳ اعمال می‌شود.
کانولوشن ۳ × ۳ و ۵ × ۵ با تعداد زیادی نوارهای طیفی می‌تواند گران باشد و ادغام خروجی از کانال فیلتر باعث افزایش اندازه شبکه می‌شود که ناگزیر به پیچیدگی محاسباتی بالا می‌شود. همانطور که اندازه شبکه افزایش می‌یابد، بهینه‌سازی شبکه با تعداد کمی نمونه آموزشی با بیش‌برازش و اختلاف روبرو خواهد شد. بنابراین، باید استراتژی برای رسیدگی به مسائل فوق مورد استفاده قرار گیرد. برای مقابله با مسائل، از تقویت اطلاعات آموزشی و ماژول‌های یادگیری وابسته در بخش‌های د-۳ و ه-۴ استفاده می‌کنیم.

قابلیت بانک فیلتر چند مقیاسی .بانک فیلتر چندمقیاسی با مفهومی شبیه به ماژول اولیه در [۱۲] برای بهینه‌سازی بهره‌برداری از ساختارهای متنوع و مختلف تصویر ورودی سازگار است. [۱۲] اثربخشی ماژول اولیه را نشان می‌دهد که باعث می‌شود شبکه عمیق‌تر شود و همچنین از ساختارهای محلی تصویر ورودی به منظور دستیابی به عملکرد state-of-the-art در طبقه‌بندی تصویر استفاده شود. بانک فیلتر چندگانه در شبکه پیشنهاد شده به شیوه‌ای متفاوت به کار می‌رود که هدف آن ساختارهای فضایی محلی مشترک در ارتباط با همبستگی‌های طیفی محلی در مرحله اولیه ساختار پیشنهادی است.

 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا