دانلود ترجمه مقاله کافی بودن داده های کم برای تشخیص داده های پرت (ساینس دایرکت – الزویر 2022)

 

 

این مقاله انگلیسی ISI در نشریه الزویر در سال 2022 منتشر شده که 9 صفحه می باشد، ترجمه فارسی آن نیز 16 صفحه میباشد. کیفیت ترجمه این مقاله عالی بوده و به صورت کامل ترجمه شده است.

 

دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
عنوان فارسی مقاله:

کافی بودن داده های کم برای تشخیص داده های پرت بر اساس فاصله

عنوان انگلیسی مقاله:

Little data is often enough for distance-based outlier detection

 

 

مشخصات مقاله انگلیسی 
نشریه ساینس دایرکت، الزویر – (Sciencedirect – Elsevier)
سال انتشار 2022
فرمت مقاله انگلیسی pdf و ورد تایپ شده با قابلیت ویرایش
تعداد صفحات مقاله انگلیسی 9 صفحه
نوع مقاله ISI
نوع نگارش مقاله پژوهشی (Research Article)
نوع ارائه مقاله ژورنال
رشته های مرتبط با این مقاله مهندسی کامپیوتر
گرایش های مرتبط با این مقاله مهندسی نرم افزار – علوم داده – مهندسی الگوریتم ها و محاسبات
چاپ شده در مجله (ژورنال) Procedia Computer Science
کلمات کلیدی تشخیص داده های پرت – تشخیص ناهنجاری – خوشه بندی – نمونه های اولیه – نظارت نشده – نزدیکترین همسایگی ها – عامل داده های پرت محلی – knn – lof – k-means
کلمات کلیدی انگلیسی outlier detection – anomaly detection – clustering – prototypes – unsupervised – nearest neighbors – local outlier factor- knn – lof – k-means
نویسندگان David Muhr – Michael Affenzeller
شناسه شاپا یا ISSN 1877-0509
شناسه دیجیتال – doi https://doi.org/10.1016/j.procs.2022.01.297
لینک سایت مرجع https://www.sciencedirect.com/science/article/pii/S1877050922003064
ایمپکت فاکتور (IF) مجله 2.267 در سال 2021
شاخص H_index مجله 92 در سال 2022
شاخص SJR مجله 0.569 در سال 2021
بیس نیست 
مدل مفهومی ندارد 
پرسشنامه ندارد 
متغیر ندارد 
فرضیه ندارد 
رفرنس دارای رفرنس در داخل متن و انتهای مقاله
کد محصول 13491

 

مشخصات و وضعیت ترجمه فارسی این مقاله 
فرمت ترجمه مقاله ورد تایپ شده با قابلیت ویرایش و pdf
وضعیت ترجمه ترجمه شده و آماده دانلود
کیفیت ترجمه عالی (مناسب استفاده دانشگاهی و پژوهشی)
تعداد صفحات ترجمه 16 (2 صفحه رفرنس انگلیسی) صفحه با فونت 14 B Nazanin
ترجمه عناوین تصاویر و جداول ترجمه شده است 
ترجمه متون داخل تصاویر ترجمه شده است 
ترجمه متون داخل جداول ترجمه شده است 
ترجمه ضمیمه ندارد 
درج تصاویر در فایل ترجمه درج شده است  
درج جداول در فایل ترجمه درج شده است  
درج فرمولها و محاسبات در فایل ترجمه ندارد 
منابع داخل متن به صورت عدد درج شده است
منابع انتهای متن به صورت انگلیسی درج شده است

 

فهرست مطالب

چکیده

1 مقدمه

2 روش شناسی

3 نتایج

4 نتیجه گیری

منابع

 

بخشی از ترجمه

چکیده

     تعداد زیادی از مطالعات موردی از آموزش سریع و دفعات پیش بینی سود می برند، و بیشتر تحقیقات به بررسی تسریع روش های تشخیص داده های پرت مبتنی بر فاصله برای میلیون ها نقطه داده می پردازند. یافته های ما برخلاف عقیده عموم نشان می دهند که داده های اندک اغلب برای مدلهای تشخیص داده های پرت مبتنی بر فاصله کافی هستند. ما نشان می دهیم که از بخش کوچکی از داده ها برای آموزش مدلهای تشخیص داده های پرت مبتنی بر فاصله استفاده می شود که اغلب منجر به کاهش غیرمعنی داری در عملکرد پیش بینانه و واریانس تشخیص در محدوده گسترده ای از مجموعه داده های جدولی می شود. علاوه بر این، ما کاهش داده را براساس زیرنمونه گیری تصادفی و نمونه های اولیه مبتنی بر خوشه بندی مقایسه می کنیم و نشان می دهیم که هر دو رویکرد منجر به نتایج تشخیص داده های پرت مشابهی می شوند. بنابراین، زیرنمونه گیری تصادفی ساده ثابت می کند که یک معیار مفید و مبنایی برای تحقیقات آینده در تسریع تشخیص داده های پرت مبتنی بر فاصله است.

 

روش شناسی
     هدف ما بررسی نحوه تاثیرگذاری الگوریتم های تشخیص داده های پرت مبتنی بر فاصله بر کاهش داده های آموزشی یا از طریق زیرنمونه گیری تصادفی یا از طریق نمونه های اولیه مبتنی بر خوشه بندی است. به ویژه، بررسی ما با سه سوال تحقیقاتی (RQ) زیر مرتبط می شود.
RQ1: چگونه زیرنمونه گیری داده های تصادفی بر عملکرد تشخیص داده های پرت مبتنی بر فاصله تاثیر می گذارند؟
RQ2: چگونه زیرنمونه گیری داده های مبتنی بر نمونه اولیه بر عملکرد تشخیص داده های پرت مبتنی بر فاصله تاثیر می گذارند؟
RQ3: آیا زیرنمونه گیری مبتنی بر نمونه اولیه منجر به نتایج تشخیص داده های پرت بهتر نسبت به زیرنمونه گیری تصادفی می شود؟
ما در بخش های زیر مجموعه داده های مختلف مورد استفاده برای ارزیابی (2.1)، زیرنمونه گیری تصادفی خودمان و روش شناسی نمونه اولیه (2.2)، الگوریتم های مورد استفاده در تحقیق خودمان (2.3)، و روش ارزیابی مورد استفاده برای پاسخ به سوالات تحقیقاتی مطرح شده را توصیف می کنیم (2.4).

 

مجموعه داده ها
     مجموعه داده های مورد استفاده در تحقیق ما اغلب از بررسی کامپوس و همکاران در ارزیابی تشخیص داده های پرت بدون نظارت نشات می گیرند و شامل محدوده ای از مجموعه داده های جدولی هستند. این مجموعه ها قبلا در ادبیات تحقیق آشکار شدند یا در اصل با هدف طبقه بندی آشکار شدند، که یک یا چند کلاس تفسیر مفهومی به صورت داده های پرت دارند. تمام مجموعه داده های معنی دار مفهومی به شکاف های داده های پرت مختلف نمونه گذاری می شوند. شکافهای نمونه گیری داده های پرت {0.02,0.05,0.1,0.2} هستند. برای کاهش اثر تصادفی سازی هنگام کاهش میزان نمونه ها، این روش ده مرتبه برای هر مجموعه داده تکرار می شود که منجر به 10 متغیر مختلف برای این مجموعه داده ها می شود. چهار مجموعه داده ارائه شده در [8] شامل کمتر از 200 نمونه هستند که ما آن را از ارزیابی خودمان حذف می کنیم.
پیش پردازش شامل حذف تکرارها، تبدیل ویژگی های طبقه بندی شده و عادی سازی ویژگی خطی با محدوده [0,1] است. اطلاعات دقیق درباره مجموعه داده های فردی و پیش پردازش مربوطه را می توان در [8] یافت. علاوه بر این، ما نتایج خودمان را بر روی دوازده مجموعه داده اختصاصی متشکل از داده های حسگر تولید با ابعاد بالا ارزیابی می کنیم. در مجموع، 31 مجموعه داده در نظر گرفته می شود، و بررسی تمام مجموعه داده ها و خصوصیات آنها را می توان در جدول 1 پیدا کرد.

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا