این مقاله انگلیسی ISI در نشریه آی تریپل ای در 22 صفحه در سال 2017 منتشر شده و ترجمه آن 62 صفحه بوده و آماده دانلود رایگان می باشد.
دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word) |
عنوان فارسی مقاله: |
تلفیق داده ها و اینترنت اشیا برای محیط های فراگیر هوشمند: یک مطالعه
|
عنوان انگلیسی مقاله: |
Data Fusion and IoT for Smart Ubiquitous Environments: A Survey
|
دانلود رایگان مقاله انگلیسی |
|
دانلود رایگان ترجمه با فرمت pdf |
|
دانلود رایگان ترجمه با فرمت ورد |
|
مشخصات مقاله انگلیسی و ترجمه فارسی |
فرمت مقاله انگلیسی |
pdf |
سال انتشار |
2017 |
تعداد صفحات مقاله انگلیسی |
22 صفحه با فرمت pdf |
نوع مقاله |
ISI |
نوع نگارش |
مقاله پژوهشی (Research article) |
نوع ارائه مقاله |
ژورنال |
رشته های مرتبط با این مقاله |
مهندسی فناوری اطلاعات – مهندسی کامپیوتر – مهندسی معماری |
گرایش های مرتبط با این مقاله |
هوش مصنوعی – اینترنت و شبکه های گسترده – مهندسی الگوریتم ها و محاسبات – علوم داده – شبکه های کامپیوتری – معماری پایدار |
چاپ شده در مجله (ژورنال)/کنفرانس |
دسترسی (IEEE) |
کلمات کلیدی |
اینترنت اشیاء – داده های بزرگ – تلفیق داده ها – هوش محاسباتی و مصنوعی – محاسبات با کارایی بالا – شهر های هوشمند – جوامع هوشمند – محیط های فراگیر |
کلمات کلیدی انگلیسی |
Internet of Things – big data – data fusion – computational and artificial intelligence – high performance computing – smart cities – smart societies – ubiquitous environments |
ارائه شده از دانشگاه |
گروه علوم کامپیوتر، دانشکده محاسبات و فناوری اطلاعات |
نمایه (index) |
Scopus – Master Journals – JCR – DOAJ |
شناسه شاپا یا ISSN |
2169-3536 |
شناسه دیجیتال – doi |
https://doi.org/10.1109/ACCESS.2017.2697839 |
لینک سایت مرجع |
https://ieeexplore.ieee.org/document/7911293 |
رفرنس |
دارای رفرنس در داخل متن و انتهای مقاله ✓ |
نشریه |
آی تریپل ای – IEEE |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش |
62 صفحه با فونت 14 B Nazanin |
فرمت ترجمه مقاله |
pdf و ورد تایپ شده با قابلیت ویرایش |
وضعیت ترجمه |
انجام شده و آماده دانلود رایگان |
کیفیت ترجمه |
مبتدی (مناسب برای درک مفهوم کلی مطلب)
|
کد محصول |
F2289 |
بخشی از ترجمه |
.B چالش های تلفیق داده
تلفیق داده با چالش های متعددی روبه رو است که در ادبیات مختلف مورد بررسی قرار می گیرند. برخی از آنها به شرح زیر است:
• نقص داده: داده های سنسور در زمان مبهم است؛ این می تواند نادرست و نامشخص باشد. این رفتار در شبکه های حسگر بی سیم نا معلوم است. این نقص باید به طور موثر با استفاده از الگوریتم های تلفیق داده مورد رسیدگی قرار گیرد.
• ابهام و ناسازگاری: نه تنها عدم دقت عامل ناسازگاری داده است؛ بلکه محیطی که در آن سنسور کار می کند تا حد زیادی تاثیر پذیر است [21]. تشخیص داده های خارج از محدوده، جایگزینی و محاسبه داده ها در محیط IoT حیاتی هستند.
• تداخل طبیعی: ماهیت تداخل داده ها می تواند منجر به نتایج بر خلاف روال معمول شود. مشکل تداخل داده در شواهد استدلال گمان و قاعده تلفیق Dempster’s بیشتر دیده می شود. الگوریتم تلفیق داده باید در هنگام پردازش تداخل داده، توجه مهمی داشته باشد (22).
• همبستگی و هم ترازی داده ها: این مشکل بیشتر در شبکه های حسگر بی سیم (WSNs) رایج است و می تواند در یک الگوریتم تلفیقی داده اطمینان بیش از حد و یا کمتر در نتیجه حاصل شود. یک مشکل هم ترازی که همچنین به عنوان یک مشکل ثبت سنسور شناخته می شود زمانی رخ می دهد که داده سنسور از هر فریم محلی سنسور به یک فریم معمول قبل از تلفیق تبدیل شود.
• ویژگی های بی اهمیت: در محیط IoT، برنامه های کاربردی ممکن است شامل چندین صدها و هزاران پارامترهای مختلف حسگر های حس کننده باشد. این مقدار های حس شده در مجموعه های بزرگ مانند شهر های هوشمند و کارخانه های صنعتی شامل داده بی اهمیت و با اهمیت است. پردازش داده های بی اهمیت ممکن است دقت تلفیق داده را تحت تأثیر قرار دهد. بنابراین، قبل از تلفیق داده ها، باید بیشترین ویژگی های مرتبط انتخاب شوند.
• فرآیند تکراری پویا: تلفیق داده ها یک فرایند ایستا در طبیعت نیست با این حال، تکرار پویا نیازمند بازبینی منظم تخمین ها در یک محیط تلفیق است. بدون الگوریتم خبره: با تحقیقات زمان در حوزه تلفیق داده ها پیشرفت ها و الگوریتم های با عملکرد بالا در حال حاضر وجود دارد. با این حال، هنوز هم سخت است که بگوییم یک الگوریتم تلفیق داده بی عیب وجود دارد.
در IoT تلفیق اطلاعات محیط را می توان در حوزه های مختلف برای ارتقاء جنبه ی همه جانبه IoT استفاده کرد. این ها حوزه های نظارت بر محیط زیست، مراقبت های بهداشتی، مدیریت بحران، نظارت، کنترل، ردیابی، هوش جمعی و بسیاری موارد دیگر است. تلفیق داده ها در IoT می تواند در چهار مرحله انجام شود: سطح تصمیم، سطح ویژگی، سطح پیکسل و سطح سیگنال. با توجه به شکل 2، تلفیق داده های IoT را می توان با دو دیدگاه مختلف مشاهده کرد. اولا می توان آن را به عنوان یک تک hob مشاهده کرد که هر سنسور به طور مستقیم داده ها را به مرکز تلفیق داده انتقال می دهد. دوم، اینکه می تواند با یک فرایند چند hob رخ دهد، که در آن داده ها از طریق سنسورهای مجاور عبور می کنند.
شکل 2: نمودار تلفیق داده های سنسور تک hob و چند hob
مکانیزم چند hob دارای مزایای متعددی است که در بخش IV.A مقاله بحث شده است.
.3روش های ریاضی برای تلفیق داده ها
تکنیک های تلفیق داده ها می توانند براساس روش های ریاضی به سه دسته گسترده تر طبقه بندی شوند:
• روش های مبتنی بر احتمال، از جمله تجزیه و تحلیل بیزی، آمار و اپراتورهای بازگشتی.
• تکنیک های هوش مصنوعی (AI) شامل یادگیری ماشین کلاسیک، منطق فازی، شبکه های عصبی مصنوعی (ANN) و ارزیابی ژنتیکی است.
• روش های تلفیق داده ها مبتنی بر نظریه شواهد
در سیستم های تلفیق داده، مدل های مختلف معماری وجود دارد؛ با این حال، برنامه های کاربردی دائما از معماری های تلفیق داده خود استفاده می کنند. برخی از مدل های پایه و اساسی شامل مدل مدیران مشترک آزمایشگاه ها ( (JDL، مدل تلفیق ابشاری اصلاح شده، مدل Boyd و مدل کاربردی Dasarathy [23]–[25]. این مدل ها بعدا به لایه های مختلف تقسیم و سپس لایه ها به زیر لايه ها تقسیم می شوند. با این حال، هسته تلفیق داده ها در معماری آن نهفته است. این بدون شک در روش های تلفیق داده ها است که در آن پردازش تلفیق نهایی اتفاق می افتد.
در این بخش، ادبیات را بر مبنای دسته بندی های متفاوتی از رویکردهای تلفیق داده ها بررسی و طبقه بندی کردیم. این بخش به سه زیر بخش تقسیم شده است که در آن، ادبیات بر مبنای روش های تلفیق داده احتمالاتی، روش های تلفیق داده ها مبتنی بر هوش مصنوعی و روش های تلفیق داده ها مبتنی بر نظریه شواهد مورد بررسی قرار گرفته است.
.Aالگوریتم های تلفیق داده احتمالاتی
در این بخش، ما برخی از کارهای اخیر مربوط به تکنیک های تلفیق داده احتمالی و الگوریتم ها را بررسی کردیم. تکنیک های احتمالی کلاسیک تر هستند، پیچیدگی کمتری دارند و به طور گسترده برای تلفیق داده استفاده می شوند، اگرچه ممکن است دقتشان نسبت به روش های انتگرال کم تر باشند [19]، [24]. اکثر الگوریتم های معمول برای تلفیق داده برای تلفیق داده ها در هسته هایشان احتمال دارند. با این حال، برخی از چالش هایی که برای تلفیق داده احتمالاتی وجود دارد، شامل: تحقیقات نشان می دهد که سیستم های تلفیق داده احتمالاتی نمیتوانند اطلاعات کامل را که برای تعریف و مجسم کردن حس کردن و عملیات تلفیق داده ها مورد نیاز است، فراهم آورند، سطح بالایی از پیچیدگی در بررسی منطق غیریکنواخت از طریق احتمال وجود دارد، و برای بررسی عضویت درجه بندی شده در مقایسه با منطق فازی در یک مجموعه، مشکل است [19]. نظریه بیز، زنجیره مارکوف و روش مونت کارلو، برخی از روش های مورد مطالعه اخیر و به طور گسترده استفاده شده در تلفیق داده ها در زمان های اخیر هستند.
الگوریتم های تلفیق داده مبتنی بر احتمال به طور گسترده ای در مسائل ردیابی هدف مورد استفاده قرار می گیرند. نمونه کلاسیک ردیابی تک هدف، الگوریتم تخصیص داده احتمالی ((PDA است. چندین نسخه بهبود یافته PDA در ادبیات داده شده است و در ردیابی تک هدفه بسیار مفید هستند. ما همچنین مشاهده کردیم که وضعیت و پیچیدگی در ردیابی چند هدفه ((MTTتغییر می کند. اعتبار سنجی شیار مشکل است، زیرا شیارها با یکدیگر رقابت می کنند، بنابراین برای MTT یک الگوریتم تخصیص داده احتمالی توام (JPDA) کارآمد تر است. این یک ارزیابی احتمالی تخصیص اندازه گیری به مسیر را استفاده می کند. الگوریتم JPDA یک تقریب تک اسکن زیربهینه به فیلتر بیزی بهینه است که در آن تخصیص ها به صورت پیوسته بین شیارهایی که شناخته شده هستند و آخرین مشاهدات ساخته شده اند [19]، [24]، [26]. یک روش بهینه سازی JPDA در [27] پیشنهاد شده است که به صورت محاسباتی قابل قبول از الگوریتم معمولی JPDA در برنامه های با تراکم درهم ریختگی بالاتر است. با روش بهینه شده JPDA و چارچوبی ساده در [27] بهتر از برخی از الگوریتم های شناخته شده MTT انجام شده است. هر دو PDA و JPDA از پدیده تعصب رنج می برند. مشاهده می شود که الگوریتم PDA دارای تعصبات بیشتر ی نسبت به الگوریتم JPDA است. در برش محیط الگوریتم PDA پدیده تعصب دارد و الگوریتم JPDA دارای تعصب رد و همبستگی است [28].
علاوه بر این، یک الگوریتم کارآمدتری نسبت به JPDA شناخته شده به عنوان الگوریتم ردیابی چند فرضیه (MHT) توسعه یافته است. این یک الگوریتم بازگشتی است. در سال های اخیر توجه بیشتر به MHT در برنامه های عملی صورت گرفته است. MHT در نظارت چندین هدف مبهم نقش مهمی دارد، زیرا این امر به تصمیمات معلق اجازه می دهد. بنابراین، تجمع آسان و طبیعی اطلاعات هدف صورت گرفته است. پیاده سازی آسان مسیر جدید با منطق ساده آغاز می شود [29]. در MHT، ردیابی چند هدف با انجام یک ارزیابی احتمالی انجام می شود که عملکرد آن را نسبت به JPDA افزایش می دهد [19]، [24]. با این حال، الزامات حافظه MHT به صورت نمایی به عنوان افزایش فریم ها به منظور حل تخصیص ها افزایش می یابد [30].
رویکرد تلفیق داده Bayesian رویکردی کلاسیک است، به این عنوان پذیرفته شده و به طور گسترده ای برای تلفیق داده استفاده می شود و این بخشی از هسته روش های مختلف تلفیق داده است [31]. این اطلاعات تلفیقی چند مدله، مبتنی بر نظریه احتمالات است [32]. رویکرد Bayesian از تعریف پیشین، مشخصات آن و محاسبات پسین تشکیل شده است. چندین روش تلفیق داده مبتنی بر رویکرد بیزی در [33] و [34] پیشنهاد شده است. در [33]، برای تشخیص هدف توزیع شده، دو روش پیشنهاد شده است. اولين روش رويکرد بيزي توزيع شده است و روش دوم آزمون نسبت احتمال تعمیم یافته (GLRT) برای WSN است. هر سنسور با توجه به محدودیت های انرژی و پهنای باند، هدف را با یک تک بیت قبل از انتقال به مرکز تلفیق تقریب می زند. رویکرد Bayesian ثابت شده که نسبت به الگوریتم های مبتنی بر GLRT عملکرد بهتر مشخصه عملیاتی گیرنده (ROC)داشته است. مقاله [33] همچنین با مشکلاتی سرو کار داشته که در آن زمان تعداد سنسورها می تواند تصادفی باشد و مکان های مرکز تلفیق ناشناخته است. برای این مشکل، یک قانون تلفیق بر اساس طرح کلی پیشنهاد شده است که توسط آمار اسکن استفاده شده است. در حالی که در [34] یک روش پیشنهاد شده است که نویسندگان از دو ردیاب بیزی با فرمول های مختلف استفاده می کنند این راه حل چالش هایی مانند سایه ها، انسداد ها، تغییرات روشنایی، درهم ریختگی و تغییرات حرکتی را کنترل می کند بنابراين، محاسبه به تدریج احتمال براساس مشاهدات جديد و استفاده از دانش پيشين احتمال برای استنتاج، با توجه به اين واقعيت که رويکرد بيزي در اینجا استفاده می شود، خروجی قوی و با دقت بالا می باشد.
اکثر روش های موجود برای به دست آوردن تخمین های سراسری وابسته به تلفیق داده هستند. هیچ کدام از این روش ها کامل نیستند. دقت الگوریتم ردیابی توسط فرایند نویز رایج تحت تاثیر قرار می گیرد. تعداد کمی از تکنیک های سازگار برای اداره فرایند نویز رایج در مطالعات [35] – [37] استفاده می شود تا معضل فیلترینگ را متوقف کند. اینها با استفاده از مجموعه ای از دو گروه موازی از فیلترها، با ذکر نام، پهنای باند وسیع و فرایند نویز رایج از پهنای باند باریک به دست می آید. با این حال، این روش ها به سناریوهای هدف خاص و هدف های تک مانور وابسته هستند.
برای اداره کردن تغییرات دینامیکی هدف در تغییر سریع سناریوها و تنوع الزامات دقت، یک طرح برآورد تلفیق داده سازگار لازم است، و یک راه حل الگوریتم تلفیقی مورد نیاز است. در مقاله [38]، پهنای باند جهت دار فیلتر ماتریس اطلاعات در سطوح خاموش و برای فاز مانور ردیابی هدف انتخاب شده است. پهنای باند وسیع IMF برای غلبه بر چالش های فرایند نویز رایج انتخاب شده است .پیش بینی IMF بستگی به ضریب انتشار دارد که مستقل از مشاهده است. همچنین به جدا کردن و غیر متمرکزکردن ساده تر است. مقاله [39] نیز از تکنیک IMF برای الگوریتم سوئیچینگ جدید استفاده می کند که از نظریه طبقه بند Bayesian ]38] تکامل یافته است. این در یک IMF دو بانده برای ایجاد یک فیلتر سویئچینگ منطبق (SAF) برای هدف پویای غیر قابل پیش بینی اغاز شده است. الگوریتم طراحی شده توسط فرمول حافظه محو شده و مجموع نوآوری های نرمال شده مربع شده است. این با فرض دو کلاس طبقه بندی در مجموعه های داده ی مستقل آماری به دست می آید. این کار نتایج کارایی بهتری از یک تک IMF برای ردیابی هدف مانور یا غیر مانور را فراهم می آورد.
زنجیره مارکوف، مونت کارلو (MCMC) و برخی از روش های تلفیقی نیز در چندین مقاله برای ردیابی هدف بر اساس نظریه احتمالات استفاده می شود .در یکی از این نوع کارها [40] یک تکنیک برای به دست آوردن اطلاعات مفید برای تشخیص و ردیابی انسان با لیزر و RGB-D در روباتیک موبایل استفاده می شود. الگوریتم ردیابی کارامدی بر اساس روش MCMC برای محیط چالش برانگیز ارائه شده است که شامل انسداد مکرر و صحنه های به هم ریخته است. سیستم تلفیق داده پیشنهادی صحیح است که چندین انسان را در سرویس کلاسیک سناریوهای ربات کشف و ردیابی کند.
در یک کار مشابه دیگر [41]، یک الگوریتم ردیابی تلفیقی پیشنهاد شده است که از نمونه برداری فیلترBayesian و MCMC برای مدیریت تعاملات هدف استفاده می کند. در این کار، طولانی مدت اطلاعات تصویر برای رسیدگی به شناسایی چهره گمشده و غیرقابل شناسایی استفاده می شود. الگوریتم از هر دو مشاهدات ایستا و پویا برای ارزیابی های شکست استفاده می کند. عملکرد این الگوریتم بهتر هست از سایر الگوریتم های پیشرفته ای است که به ترتیب از مشاهدات طولانی مدت و مدل مخفی Markov استفاده نمی کنند [41]. رویکردهای تلفیق داده تلفیقی، از مزایای استفاده از هر روش متداول بهره می برند. الگوریتم های تلفیق داده تلفیقی محاسبات پیچیده تری نسبت به روش های غیر تلفیقی دارند [42]. هیچ کدام از این الگوریتم ها هیچ مزیتی بیش از دیگری ندارند. با این حال، روش های تلفیقی کارآمدتر هستند و می توانند با چالش های بیشتری نسبت به رویکرد های غیر تلفیقی برخورد کنند [42].
میان افزار IOT یک رابط است که ادغام و تسهیل تعامل بین عناصر مختلف که “چیزها” نام دارد و اینترنت را فراهم می کند. یک قسمت بسیار مهمی از میان افزار IoT پردازش رویداد است. پیش بینی تجزیه و تحلیل تلفیق در [43] با استفاده از میانگین مدل بیزی(BAM) مورد مطالعه قرار گرفته است. برای پردازش رویداد پیچیده فعالانه، پیش بینی تحلیل می تواند نقش یک حمایت کننده را که با تلفیق داده ها به دست می آید، بازی کند. این روش برای برنامه های IoT در مقیاس بزرگ استفاده می شود. این روش با استفاده از استنتاج انتظار-حداکثر (EM)و مدل ماتریس Gaussian برای پیش بینی های Bayesian اولیه استفاده می شود. تقریب MCMC برای میانگین گرفتن Bayesian استفاده می شود و مدل توسعه یافته براساس خوشه بندی محتوی رویداد است. نتایج نشان داد که در مقایسه با سایر رویکردهای سنتی این روش دقت بالایی دارد. با این حال در [43]، BAM و EM برای موازی سازی در تکنیک توسعه یافته همچنان مورد نیاز است. برای پردازش رویداد در IoT، چالش های مختلفی مانند ناهمگونی داده ها و دستگاه ها، حجم زیاد داده ها، زمان رخداد رویداد ناشناخته و پردازش رویداد توزیع شده وجود دارد.
|