این مقاله انگلیسی ISI در نشریه الزویر در 12 صفحه در سال 2003 منتشر شده و ترجمه آن 26 صفحه میباشد. کیفیت ترجمه این مقاله ارزان – نقره ای ⭐️⭐️ بوده و به صورت ناقص ترجمه شده است.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی | |
عنوان فارسی مقاله: |
ارزیابی اثربخشی روشهای درخت تصمیم برای طبقه بندی پوشش زمین |
عنوان انگلیسی مقاله: |
An assessment of the effectiveness of decision tree methods for land cover classification |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2003 |
تعداد صفحات مقاله انگلیسی | 12 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی عمران، مهندسی کامپیوتر و جغرافیا |
گرایش های مرتبط با این مقاله | سنجش از دور و سیستم اطلاعات جغرافیایی، نقشه برداری، مهندسی الگوریتم ها و محاسبات |
چاپ شده در مجله (ژورنال) | سنجش از دور محیطی – Remote Sensing of Environment |
کلمات کلیدی | درخت تصميم، پوشش زمین، الگوریتم طبقه بندی |
ارائه شده از دانشگاه | دانشکده جغرافیا، دانشگاه ناتینگهام، انگلستان |
رفرنس | دارد ✓ |
کد محصول | F1549 |
نشریه | الزویر – Elsevier |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
وضعیت ترجمه | انجام شده و آماده دانلود |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش | 26 صفحه (1 صفحه رفرنس انگلیسی) با فونت 14 B Nazanin |
ترجمه عناوین تصاویر و جداول | ترجمه نشده است ☓ |
ترجمه متون داخل تصاویر | ترجمه نشده است ☓ |
ترجمه متون داخل جداول | ترجمه نشده است ☓ |
درج تصاویر در فایل ترجمه | درج شده است ✓ |
درج جداول در فایل ترجمه | درج شده است ✓ |
درج فرمولها و محاسبات در فایل ترجمه | به صورت عکس درج شده است ✓ |
منابع داخل متن | درج نشده است ☓ |
کیفیت ترجمه | کیفیت ترجمه این مقاله پایین میباشد |
توضیحات | یک بخش از این مقاله ترجمه نشده است. |
فهرست مطالب |
چکیده |
بخشی از ترجمه |
چکیده
انتهاب یک الگوریتم طبقه بندی معمولاً مبتنی بر چندین عامل است، که از میان آن ها دسترسی پذیری نرم افزار، سهولت استفاده، و عملکرد در اینجا بواسطه دقت طبقه یندی کلی ارزیابی شده اند. رویه ماکسیمم مشابهت (ML) برای بسیاری از کاربران الگوریتم انتخاب است چون آماده استفاده است و این حقیقت که مستلزم فرایند آموزش بسط یافته نمی باشد. شبکه های عصبی مصنوعی (ANN ها) اکنون به طور گسترده توسط محققان استفاده می شوند، اما از کاربردهای عملیاتی آن ها بواسطه نیاز به کاربر برای تخصیص پیکربندی معماری شبکه برای ارائه مقادیری برای تعدادی از پارامترها جلوگیری شده است، که هر دو روی عملکرد تأثیر می گذارند. ANN نیز مستلزم فاز آموزش بسط یافته می باشد.
در چند سال اخیر، استفاده از درخت های تصمیم (DTها) برای رده بندی داده هایی که از راه دور حس شده اند افزایش یافته اند. طرفداران این روش ادعا می کنند که این درخت مزایای متعددی نسبت به الگوریتم های ML و ANN دارند. DT از نظر محاسباتی سریع است، و هیچ فرضیه آماری ایجاد نمی کند، و می تواند داده هایی را کنترل کند که در مقیاس های سنجش مختلف نشان داده شده است. نرم افزار لازم برای پیاده سازی DT ها به راحتی از اینترنت قابل دسترسی است. هرس کردن DT ها می تواند باعث کوچک تر شدن آن ها و تفسیر ساده تر و راحت تر آن ها بشود، در حالی که استفاده از تکنیک های تقویت می تواند باعث بهبود عملکرد شود. در این مطالعه، مجموعه تست جداگانه و مجموعه های داده ای آموزشی از دو حوزه جغرافیایی مختلف و دو سنسور مختلف برای ارزیابی عملکرد DT های تک متغیره و چند متغیره برای طبقه بندی پوشش زمین استفاده شده اند. عوامل در نظر گرفته شده به شرح زیر هستند: اثرات تغییرات در اندازه مجموعه داده های آموزشی چند بعدی بود فضای ویژگی، همراه با تأثیر تویت، مقیاس های انتخاب ویژگی، و هرس کردن. سطح دقت رده بندی DT تک متغیره با نتایج ANN پس انتشار و رده بندی کننده های ML مقایسه شده است. نتایج ما نشان می دهد که عملکرد DT تک متغیره در مقایسه با عملکرد دیگر رده بندی کننده ها قابل قبول است، به جز با داده های دارای ابعاد بالا. دقت رده بندی به طور خطی با اندازه مجموعه داده های آموزشی تا حد 300 پیکسل در هر رده در این مورد افزایش می یابد. DT های چند متغیره عملکرد بهتری نسبت به DT های تک متغیره ندارند. در حالی که تقویت باعث افزایشی در دقت رده بندی بین 3 و 6 درصد می شود و به نظر می رسد که روش های انتخاب ویژگی با توجه به افزایش های ایجاد شده در دقت تنظیم شود. اما، نه DT تک متغیره و نه DT چند متغیره عملکرد مشابه با ANN یا رده بندی کننده های ML با ابعاد دارای ابعاد بالا دارند. 1- مقدمه
در سه دهه قبل شاهد توسعه های مداوم در حوزه تشخیص الگو بودیم. تحقیق در جنبه های الگوریتمی تشخیص الگو در کنار توسعه ابزارهایی پیش رفته است که قادر به تولید مقادیر بالایی از داده ها می باشند، شامل تصاویر با وضوح فضایی و طیفی بهتر. پس از 30 سال حسگری از راه دور ماهواره ای از سطح زمین، کاربرانی که از راه دور داده ها را حس می کنند اکنون به الگوریتم های آماری پیچیده و عصبی / ارتباط گرا برای رده بندی های فازی و سخت داده های آن ها دسترسی دارند.
هر دو روش آماری و عصبی / اتصال گرا محدودیت هایی دارند. روش های آماری تکیه بر این فرضیه دارند که احتمالات عضویت در رده می تواند با یک تابه چگالی احتمال خاص مدلسازی شود. در اغلب موارد، توزیع اقلیدسی انتخاب شده است، چون بواسطه آماره ترتیب اول و ترتیب دوم توصیف شده است، یعنی بردارهای میانگین رده و ماتریس های کوواریانس رده. اگر اندازه مجموعه آموزشی ثابت باشد، دقت تخمین ای عناصر بردار میانگین رده نمونه و ماتریس کوواریانس رده نمونه با افزایش تعداد ویژگی ها (ابعاد) کاهش می یابند. این فرضیه که داده ها در هر رده از مدل نرمال چند متغیره تبعیت می کنند تحلیل وقفه یا داده های مقیاس نسبت را محدود می کند. به نظر می رسد که روش های عصبی / اتصال گرا به خوبی با مجموعه های داده ای آموزشی کار می کنند که اندازه کوچکتری نسبت به آن هایی دارند که در رویه های آماری لازم هستند. از طرف دیگر، زمان های آموزش شبکه می توانند طولانی باشند، در حالی که انتخاب طرح معماری شبکه (از نظر تعداد لایه های پنهان و نورون ها در هر لایه) و مقادیر پارامترهای نرخ یادگیری رو به جلو نیستند. بر خلاف روش های آموری، مشی عصبی / اتصال گرا هیچ فرضیه ای در رابطه با توزیع بسامد آماری داده ها با مقیاس های اندازه گیری (ارزیابی) ویژگی هایی که در تحلیل استفاده شده اند ارائه نمی کنند. معمول ترین الگوریتم عصبی / اتصال گرای استفاده شده پرسپترون چند لایه پس انتشار است که در این مطالعه استفاده شده است. رده بندی کننده های درخت تصمیم بطور گسترده در گروه حسگری از راه دور به گستردگی روش های آماری یا روش های عصبی / اتصال گرا مورد استفاده قرار نگرفته اند. مزایاییی که درخت های تصمیم ارائه می کنند شامل توانایی کنترل داده های ارزیابی شده با مقیاس های مختلف، فقدان هر گونه فرضیه ای در رابطه با توزیع بسامدهای داده ها در هر یک از رده ها، انعطاف پذیری، و توانایی کنترل روابط غیر خطی میان ویژگی ها و رده ها می باشد. در مقابل شبکه های عصبی، درخت های تصمیم می توانند به سرعت آموزش داده شوند، و اجرای آن ها سریع است. آن ها می توانند برای انتخاب / کاهش و همچنین به مقاصد رده بندی مورد استفاده قرار گیرند. در نهایت، تحلیل گر می تواند یک درخت تصمیم را تفسیر کند. این جعبه سیاه نیست، مثل شبکه عصبی، یعنی کارهای پنهانی که از دید پنهان شده اند. دقت رده بندی کلی در این جا برای اندازه گیری عملکرد روش های مختلف استفاده شده اند. سطح دقت رده بندی که در یک مورد خاص بدست امده است بسته به تعدادی از عوامل می باشد، شامل طبیعت مسأله رده بندی از نظر پیچیدگی محدودیت های تصمیم که رده ها را در فضای ویژگی، اندازه نمونه آموزشی، کفایت داده های آموزشی در توصیف ویژگی های رده های منتخب، چند بعدی بودن داده ها و ویژگی های رده بندی استفاده شده جدا می کنند. ما تمام این مشکلات را در این مقاله در نظر نمی گیریم. اما نتایج تحلیل های ما در داخل خودشان قابل مقایسه اند، چون همان مجموعه های داده ای آموزش و تست برای هر سه رده بندی در دو حوزه مختلف مطالعه استفاده شده اند. از این رو آزمودن عملکرد نسبی رده بندی کننده های مختلف و سازگاری این مقایسات میان مجموعه های داده ای با مشخصه های نامشابه از نظر زمینه حوزه مطالعه و طبیعت سیستم تصویربرداری استفاده شده ممکن می باشد. مقاله به شرح زیر سازمان دهی شده است. در بهش دو دو مجموعه داده ای تست شرح داده شده اند که در این مطالعه استفاده شده اند. جزئیات خلاصه سه رده بندی کننده در بخش 2 ارائه شده اند. اثرات اندازه مجموعه آموزشی، چند بعدی بودن داده ها، روش های انتخاب ویژگی ، هرس کردن و تقویت عملکرد رده بندی کننده های DT در بخش 4 در نظر گرفته شده اند. تحلیل تطبیقی کوتاه عملکرد نسبی DT، شبکه های عصبی مصنوعی (ANN ها) و ماکسیمم مشابها رده بندی کننده ها در بخش 5 داده شده است که به دنبال آن خلاصه ای از نتایج ارائه شده است. |
بخشی از مقاله انگلیسی |
Abstract Choice of a classification algorithm is generally based upon a number of factors, among which are availability of software, ease of use, and performance, measured here by overall classification accuracy. The maximum likelihood (ML) procedure is, for many users, the algorithm of choice because of its ready availability and the fact that it does not require an extended training process. Artificial neural networks (ANNs) are now widely used by researchers, but their operational applications are hindered by the need for the user to specify the configuration of the network architecture and to provide values for a number of parameters, both of which affect performance. The ANN also requires an extended training phase. In the past few years, the use of decision trees (DTs) to classify remotely sensed data has increased. Proponents of the method claim that it has a number of advantages over the ML and ANN algorithms. The DT is computationally fast, make no statistical assumptions, and can handle data that are represented on different measurement scales. Software to implement DTs is readily available over the Internet. Pruning of DTs can make them smaller and more easily interpretable, while the use of boosting techniques can improve performance. In this study, separate test and training data sets from two different geographical areas and two different sensors—multispectral Landsat ETM+ and hyperspectral DAIS—are used to evaluate the performance of univariate and multivariate DTs for land cover classification. Factors considered are: the effects of variations in training data set size and of the dimensionality of the feature space, together with the impact of boosting, attribute selection measures, and pruning. The level of classification accuracy achieved by the DT is compared to results from back-propagating ANN and the ML classifiers. Our results indicate that the performance of the univariate DT is acceptably good in comparison with that of other classifiers, except with high-dimensional data. Classification accuracy increases linearly with training data set size to a limit of 300 pixels per class in this case. Multivariate DTs do not appear to perform better than univariate DTs. While boosting produces an increase in classification accuracy of between 3% and 6%, the use of attribute selection methods does not appear to be justified in terms of accuracy increases. However, neither the univariate DT nor the multivariate DT performed as well as the ANN or ML classifiers with high-dimensional data. 1 Introduction The past three decades have seen continuing developments in the area of pattern recognition. Research into algorithmic aspects of pattern recognition has proceeded alongside the development of instruments that are capable of producing high volumes of data, including images with increasingly finer spatial and spectral resolution. After 30 years of satellite remote sensing of the Earth’s land surface, users of remotely sensed data now have access to sophisticated statistical and neural/connectionist algorithms for both fuzzy and hard classifications of their data (Mather, 1999; Schowengerdt, 1997). Both the statistical and neural/connectionist approaches have limitations. Statistical methods rely on the assumption that the probabilities of class membership can be modelled by a specific probability density function. In most cases, the Gaussian distribution is chosen, as it is characterised by first- and second-order statistics, that is, the class mean vectors and class covariance matrices. If training set size is fixed, then the precision of the estimates of the elements of the sample class mean vector and sample class covariance matrix declines as the number of features (dimensions) increases, so that one might expect the performance of the classifier to degrade as the number of features increases. The assumption that the data in each class follow a multivariate normal model restricts the analysis to interval or ratio scale data. Neural/connectionist methods appear to work well with training data sets that are smaller in size than those required for statistical procedures. On the other hand, network training times can be lengthy, while choice of the design of network architecture (in terms of numbers of hidden layers and neurons per layer) and the values of the learning rate parameters is not straightforward (Foody & Arora, 1997; Kavzoglu, 2001; Wilkinson, 1997). Unlike statistical methods, the neural/connectionist approach makes no assumptions concerning the statistical frequency distribution of the data or the measurement scales of the features that are used in the analysis. The most commonly used neural/ connectionist algorithm is the back-propagating multi-layer perceptron (Wilkinson, 1997), which is used in this study. Decision tree (DT) classifiers have not been as widely used within the remote sensing community as either the statistical or the neural/connectionist methods. The advantages that decision trees offer include an ability to handle data measured on different scales, lack of any assumptions concerning the frequency distributions of the data in each of the classes, flexibility, and ability to handle non-linear relationships between features and classes (Friedl & Brodley, 1997). In contrast to neural networks, decision trees can be trained quickly, and are rapid in execution (Gahegan & West, 1998). They can be used for feature selection/reduction as well as for classification purposes (Borak & Strahler, 1999). Finally, the analyst can interpret a decision tree. It is not a ‘black box’, like the neural network, the hidden workings of which are concealed from view. Overall classification accuracy is used here to measure the performance of the different methods. The level of classification accuracy that is achieved in a particular case depends on a number of factors, including the nature of the classification problem in terms of the complexity of the decision boundaries that separate the classes in feature space (assuming that the classes are separable), the training sample size, the adequacy of the training data in characterising the properties of the chosen classes, the dimensionality of the data, and the properties of the classifier used (Raudys and Pikelis, 1980). We do not consider all of these problems in this paper. However, the results of our analyses are internally comparable, as the same training and test data sets are used for all three classifiers, for two dissimilar study areas (Section 2). Thus, it is possible to examine both the relative performance of the different classifiers and the consistency of these comparisons between data sets with dissimilar characteristics in terms of the terrain of the study area and the nature of the imaging system used. The paper is structured as follows. Section 2 describes the two test data sets that are used in this study. Brief details of the three classifiers are provided in Section 3. The effects of training set size, data dimensionality, attribute selection methods, pruning and boosting on the performance of the DT classifier are considered in Section 4. A short comparative analysis of the relative performance of the DT, artificial neural networks (ANNs), and maximum likelihood (ML) classifiers is given in Section 5, which is followed by a summary of conclusions. |