دانلود رایگان ترجمه مقاله ساخت درخت تصمیم پیشرفته بر پایه انتخاب صفات و نمونه داده (نشریه الزویر 2014)

این مقاله انگلیسی ISI در نشریه الزویر در 13 صفحه در سال 2014 منتشر شده و ترجمه آن 31 صفحه میباشد. کیفیت ترجمه این مقاله رایگان – برنزی ⭐️ بوده و به صورت کامل ترجمه شده است.

دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
عنوان فارسی مقاله:	ساخت درخت تصمیم پیشرفته بر پایه انتخاب صفات و نمونه داده به منظور تشخیص نقص در ماشین آلات دوار
عنوان انگلیسی مقاله:	Improved decision tree construction based on attribute selection and data sampling for fault diagnosis in rotating machines
دانلود رایگان مقاله انگلیسی دانلود رایگان ترجمه مقاله جستجوی ترجمه مقالات

مشخصات مقاله انگلیسی (PDF)
سال انتشار	2014
تعداد صفحات مقاله انگلیسی	13 صفحه با فرمت pdf
رشته های مرتبط با این مقاله	مهندسی صنایع و مکانیک
گرایش های مرتبط با این مقاله	برنامه ریزی و تحلیل سیستم ها، بهینه سازی سیستم ها و طراحی کاربردی
چاپ شده در مجله (ژورنال)	کاربرد مهندسی هوش مصنوعی – Engineering Applications of Artificial Intelligence
کلمات کلیدی	ساخت درخت تصمیم، هرس کردن، نمودار پژوهش، انتخاب صفات، نمونه داده
رفرنس	دارد ✓
کد محصول	F1227
نشریه	الزویر – Elsevier

مشخصات و وضعیت ترجمه فارسی این مقاله
وضعیت ترجمه	انجام شده و آماده دانلود
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش	31 صفحه با فونت 14 B Nazanin
ترجمه عناوین تصاویر و جداول	ترجمه نشده است ☓
ترجمه متون داخل تصاویر	ترجمه نشده است ☓
ترجمه متون داخل جداول	ترجمه نشده است ☓
درج تصاویر در فایل ترجمه	درج شده است ✓
درج جداول در فایل ترجمه	درج شده است ✓
کیفیت ترجمه	کیفیت ترجمه این مقاله متوسط میباشد

فهرست مطالب

چکیده
1- مقدمه
2- کارهای مربوطه
3- مقدماتی
3-1 ترتیب نسبی
3.1.1 الگوهای اختصاصی سازی و تعمیم دهی
3-1-2 اپراتورهای اختصاصی سازی و تعمیم دهی
3-1-3 الگوهای بیشینه و کمینه
3-1-4 استراتژی قطع نمودار جستجو
3.2 تناسب
3-3 خصوصیات ویژگی
3-3-1 مرتبط بودن
3-3-2 ارتباط افزایشی
3-3-3 حشو یا افزونگی
4 رویکرد IUDT
4-1 پیش پردازش داده ها
4-2 کد گذاری
4-3 کاوش فضای تحقیق
5 روایی IUDT
6 کاربرد تشخیص نقص در یک ماشین دوار
1-6 مطالعه تجربی
2-6 پردازش سیگنال
3-6 استخراج شاخص ها
4-6- نتایج و بحث
7- نتیجه گیری

بخشی از ترجمه

چکیده
در این مقاله رویکرد جدیدی که از مشکلات بیش برازش و پیچیدگی که در ساخت درخت تصمیم نادیده گرفته میشوند ارائه میشود. درخت های تصمیم, ابزارهایی کارآمد برای ساخت نمونه های طبقه بندی به خصوص در مهندسی صنعتی هستد. در مرحله ی ساخت این درخت ها دو مشکل عمده وجود دارد که عبارتند از: انتخاب صفات مناسب و اجزای پایگاه داده . در پژوهش پیش رو، ازانتخاب صفات و نمونه داده به منظور غلبه بر مشکلات ذکر شده استفاده شده است. جهت اثبات رویکرد پیشنهادی، چندین آزمایش روی 10 مجموعه داده ی معیار انجام و نتایج آنها با رویکردهای کلاسیک مقایسه شده است. در پایان، کارکرد مؤثر رویکرد پیشنهادی را در ساخت قواعد غیر پیچیده ی تصمیم به منظور تشخیص نقص در ماشین آلات دوار را ارائه خواهیم داد..
1- مقدمه
در زمینه ی صنعتی، با پیچیدگی تجهیزات نصب شده خطرات شکست و اختلال در حال افزایش هستند. این پدیده بر کیفیت محصول اثر میگذارد، باعث میشود ماشین فوراٌ خاموش شود و به عملکرد صحیح کل سیستم تولید لطمه میزند. ماشین های دوار رده ای عمده از تجهیزات مکانیکی هستند و به بیش ترین دقت و کنترل بی وقفه نیاز دارند تا از عملکرد بهینه آنها اطمینان حاصل شود. بطور سنتی، تجزیه و تحلیل های ارتعاش و بسیاری از روش های پردازش سیگنال به منظور بدست آوردن اطلاعات سودمند جهت کنترل شرایط عملکرد مورد استفاده قرار گرفته اند. خلف و دیگران (2013) دامنه بسامد را به منظور کسب اطلاعات و تشخیص نقص مورد تجزیه و تحلیل قرار دادند. تجزیه و تحلیل سپسترال (روش غیر خطی پردازش سیگنال) برای ساخت نشانگر نقص سیستم پر توان به کار رفته است (بداوی و دیگران، 2004) و تبدیل فوریه کوتاه مدت (روش پردازش سیگنال برای تجزیه و تحلیل امواج متغیر) ارائه شد (موشر و دیگران، 2003). روش های دیگر مثل توزیع ویگنر-ویله ( بایدر و بال، 2001)، تجزیه و تحلیل امواج کوچک پیوسته (کانکار و دیگران، 2011) و تجزیه و تحلیل امواج کوچک گسسته (دی جی ابالا و دیگران، 2008) نیز مورد استفاده قرار گرفته اند.
از الگوریتم های طبقه بندی نیز میتوان در ساخت سیستم های تشخیصی کنترل شرایط استفاده کرد. به عنوان مثال, شبکه های عصبی (چن و چن، 2011) ماشین بردار پشتیبان (دنگ و دیگران، 2011) و طبقه بندی بیزین (یانگ و دیگران، 2005) همه به کار گرفته شده اند. در هر حال, تکنیک های درخت تصمیم همچنان برای کاربردهای مهندسی به دیگر تکنیک ها ترجیح داده میشوند, زیرا به کاربران این امکان را میدهند که به آسانی به رفتار مدل های ساخته شده در مقابل طبقه بندی های ذکر شده در قسمت بالا پی ببرند. استفاده از درخت های تصمیم برای چنین کاربردهایی در مقالات پژوهشی بیشماری از جمله سوگوماران و راماچاندران (2007)، ژاوو و ژانگ (2008)، ساکتیول و دیگران (2010) و سوگوماران و دیگران (2007) گزارش شده است.
ساخت درخت تصمیم (Decision Tree,DT) دو مرحله رشد و هرس را شامل میشود. در مرحله رشد, طبق قوانین مشخص جدا کننده تا زمانی که همه ی نمونه های هر یک از زیرمجموعه ها، در زیرهمان طبقه مخصوص به خود (خالص) قرار گیرند یا به معیارهای توقف برسند؛ داده های آموزشی (نمونه ها) بطور پی در پی به دو یا چند زیرمجموعه که رو به پایین ترسیم میشوند تفکیک میشوند. به طور کلی, این مرحله ی رشد، درخت تصمیم بزرگی را تولید میکند که نمونه های یادگیری را در برمیگیرد و ابهامات داده ها ( به طور ویژه سروصدا و تغییرهای باقی مانده) را مورد توجه قرار میدهد. رویکردهای هرس کردن برپایه مدل های هیوریستیک (مدل سیستماتیک پردازش اطلاعات) با از بین بردن تمامی بخش های درخت تصمیم که ممکن است بر پایه داده های پر سروصدا و یا غلط باشند از مشکلات بیش برازش جلوگیری میکند. این امر, از پیچیدگی و اندازه درخت تصمیم می کاهد. مرحله هرس میتواند یک درخت تصمیم رشد یافته را یا از قسمت بالای آن یا از قسمت پایینش هرس کند. علاوه بر این, بسیاری از مدل های هیوریستیک موجود بسیار چالش برانگیز هستند (بریمن و دیگران، 1984؛ نیبلت و براتکو، 1987؛ کویینلن، 1987)، اما متاٌسفانه هیچ یک از روش ها به تنهایی بهتر از دیگر روش ها عمل نمیکند(مینگرز، 1989؛ اسپوسیتو و دیگران، 1997).
در مورد مشکلات مرحله رشد, دو راه حل وجود دارد: راه حل اول با کاهش میزان داده های یادگیری و ساده سازی قواعد تصمیم، پیچیدگی درخت تصمیم را کاهش میدهد (پیراموتو، 2008). راه حل دوم برای غلبه بر مشکلات بیش برازش, انتخاب صفات را به کار میگیرد (ییلدیز و آلپیدین، 2005؛ کوهاوی و جان، 1997). برای غلبه بر اندازه درخت تصمیم و خطرات بیش برازش, ترکیب انتخاب صفات و کاهش داده ها را به منظور ساخت درخت تصمیم پیشرفته و هرس نشده پیشنهاد میکنیم. بدین ترتیب, مشکل ساخت درخت تصمیم بهینه به اکتشاف مشکل فضای پژوهش نمودار ترکیبی تبدیل خواهد شد. ویژگی کلیدی این موضوع, کد گذاری هر یک از زیرمجموعه های صفت Ai, و زیرمجموعه نمونه های Xj، به مجموعه (Ai, Xj) میباشد. تمامی مجموعه های احتمالی (Ai, Xj) نمودار فضای پژوهش را تشکیل میدهند. نتایج نشان میدهند که نمودار پیشنهادی تا حد زیادی عملکرد این درخت تصمیم را در مقایسه با درخت های تصمیم استاندارد و هرس شده و همچنین درخت های تصمیمی که تنها بر پایه انتخاب صفات یا کاهش داده ها ترسیم میشوند بهبود میبخشد. بقیه این مقاله را مباحث زیر تشکیل میدهند:
در بخش دوم به طور خلاصه به بحث راجع به برخی از مطالعات پیشین در زمینه ساخت درخت تصمیم پرداخته میشود. در بخش سوم مفاهیم به کار گرفته شده در این پژوهش معرفی میشوند. در بخش چهارم به شرح رویکرد خود بر پایه انتخاب صفات و نمونه پایگاه داده به منظور بهینه سازی معمول ساخت درخت تصمیم میپردازیم. در بخش پنجم نتایج آزمایشاتی که در آنها از 10 مجموعه دهده معیاراستفاده شده است گزارش میشوند. در بخش ششم، درخت تصمیم پیشرفته و هرس نشده برای مشکل تشخیص نقص در ماشین آلات دوارمورد استفاده قرار گرفته است. در پایان, بخش هفتم, از این مطالعه نتیجه گیری میکند.

بخشی از مقاله انگلیسی

Abstract

This paper presents a new approach that avoids the over-fitting and complexity problems suffered in the construction of decision trees. Decision trees are an efficient means of building classification models, especially in industrial engineering. In their construction phase, the two main problems are choosing suitable attributes and database components. In the present work, a combination of attribute selection and data sampling is used to overcome these problems. To validate the proposed approach, several experiments are performed on 10 benchmark datasets, and the results are compared with those from classical approaches. Finally, we present an efficient application of the proposed approach in the construction of non-complex decision rules for fault diagnosis problems in rotating machines..

1- Introduction

In the industrial field, the risks of failure and disruption are increasing with the complexity of installed equipment. This phenomenon affects product quality, causes the immediate shutdown of a machine, and undermines the proper functioning of an entire production system. Rotating machines are a major class of mechanical equipment, and need the utmost care and continuous monitoring to ensure optimal operation. Traditionally, vibration analyses and many signal processing techniques have been used to extract useful information for monitoring the operating condition. Khelf et al. (2013) analysed the frequency domain to extract information and diagnose faults. Cepstral analysis has been used to construct a robust gear fault indicator (Badaoui et al., 2004), and a short-time Fourier transform representation was derived (Mosher et al., 2003). Other techniques have also been employed, such as the Wigner–Ville distribution (Baydar and Ball, 2001), continuous wavelet analysis (Kankar et al., 2011), and discrete wavelet analysis (Djebala et al., 2008).

Classification algorithms can be used in the construction of condition-monitoring diagnostic systems. For example, neural networks (Chen and Chen, 2011), support vector machines (Deng et al., 2011), and Bayesian classifiers (Yang et al., 2005) have all been applied. However, decision tree techniques are still preferred in engineering applications, because they allow users to easily understand the behaviour of the built models against the abovementioned classifiers. Their use in such applications has been reported in numerous research papers, e.g. Sugumaran and Ramachandran (2007), Zhao and Zhang (2008), Sakthivel et al. (2010), and Sugumaran et al. (2007).

The construction of a decision tree (DT) includes growing and pruning stages. In the growing phase, the training data (samples) are repeatedly split into two or more descendant subsets, according to certain split rules, until all instances of each subset wrap the same class (pure) or some stopping criterion has been reached. Generally, this growing phase outputs a large DT that includes the learning examples and considers many uncertainties in the data (particularity, noise and residual variation). Pruning approaches based on heuristics prevent the over-fitting problem by removing all sections of the DT that may be based on noisy and/or erroneous data. This reduces the complexity and size of the DT. The pruning phase can under-prune or over-prune the grown DT. Moreover, many existing heuristics are very challenging (Breiman et al., 1984; Niblett and Bratko, 1987; Quinlan, 1987), but, unfortunately, no single method outperforms the others (Mingers, 1989; Esposito et al., 1997).

In terms of growing phase problems, there are two possible solutions: the first reduces DT complexity by reducing the number of learning data, simplifying the decision rules (Piramuthu, 2008). The second solution uses attribute selection to overcome overfitting problems (Yildiz and Alpaydin, 2005; Kohavi and John, 1997). To overcome both the DT size and over-fitting risks, we propose to combine attribute selection and data reduction to construct an Improved Unpruned Decision Tree IUDT . The optimal DT construction (DTC) problem will thus be converted into an exploration of the combinatorial graph research space problem. The key feature of this proposition is to encode each subset of attributes Ai and a samples subset Xj into a couple ðAi; XjÞ. All possible ðAi; XjÞ couples form the research space graph. The results show that the proposed schematic largely improves the tree performance compared to standard pruned DTs, as well as those based solely on attribute selection or data reduction.

The rest of the paper is organized as follows: In Section 2, some previous studies on DTC are briefly discussed. Section 3 introduces the main notions used in this work. In Section 4, we describe our approach based on attribute selection and database sampling to outperform conventional DTC. Section 5 reports the experimental results using 10 benchmark datasets. In Section 6, IUDT is applied to the problem of fault diagnosis in rotating machines. Finally, Section 7 concludes the study.

ساخت درخت تصمیم پیشرفته بر پایه انتخاب صفات و نمونه داده به منظور تشخیص نقص در ماشین آلات دوار

Improved decision tree construction based on attribute selection and data sampling for fault diagnosis in rotating machines

دیدگاهتان را بنویسید لغو پاسخ