دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
شناسایی Spam در بین اطلاعات به دست آمده ایمیل- آنالیز عملکرد نسبی |
عنوان انگلیسی مقاله: |
Spam Mail Detection through Data Mining – A Comparative Performance Analysis |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار مقاله | 2013 |
تعداد صفحات مقاله انگلیسی | 9 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر و مهندسی فناوری اطلاعات IT |
گرایش های مرتبط با این مقاله | اینترنت و شبکه های گسترده و مهندسی الگوریتم ها و محاسبات |
مجله مربوطه | مجله بین المللی آموزش مدرن و علوم کامپیوتر |
دانشگاه تهیه کننده | گروه علوم کامپیوتر دانشگاه Banasthali، هند |
کلمات کلیدی این مقاله | طبقه بندی کننده، انتخاب ویژگی ها، ایمیل، میل های Spam |
رفرنس | دارد |
نشریه | Ijmecs |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت 14 B Nazanin | 22 صفحه |
ترجمه عناوین تصاویر و جداول | ترجمه شده است |
ترجمه متون داخل تصاویر | ترجمه شده است |
ترجمه متون داخل جداول | ترجمه شده است |
درج تصاویر در فایل ترجمه | درج شده است |
درج جداول در فایل ترجمه | درج شده است |
- فهرست مطالب:
چکیده
مقدمه
سابقه مطالعات
الگوریتم مورد استفاده در این مقاله
Naïve Bayes
تعیین درخت
ویژگی های انتخاب
طبقه بندی و پیشگویی
کار های انجام شده
ساختار پیشنهادی
آنالیز و تحلیل
آزمایش اول
آزمایش دوم
نتیجه گیری
- بخشی از ترجمه:
نتیجه گیری
در طبقه بندی ایمیل های Spam امروزه کار های زیادی برای شناخت این ایمیل¬های نامطلوب بررسی شده است. امروزه خیلی از محقیقین برای پیدا کردن بهترین طبقه بندی کننده برای یافتن ایمیل های Spam تلاش زیادی می کنند. بنابراین فیلتر¬های با دقت بالا نیاز است تا ایمیل¬های نامطلوب را حذف کند. در این مقاله ما به بررسی و یافتن طبقه بندی کننده هایی برای یافتن بهترین دسته برای ایمیل¬های Spam با استفاده از ساختار جمع¬آوری اطلاعات پرداختیم. بنابراین ما انواع مختلفی از الگوریتم¬های طبقه¬بندی با ورودی¬های مختلف آزمایش کردیم. با آنالیز طبقه¬بندی کننده¬ها به این نتیجه رسیدیم که موقعی که ما روش انتخاب ویژگی را در مراحل طبقه¬بندی به کار بردیم، دقت کار به طرز قابل توجهی افزایش پیدا کرد. با توجه به نتایج به دست آمده دقت روش درخت رندم هنگامی که الگوریتم انتخاب ویژگی را به کار برده¬ایم ۷۱۵/۹۹ درصد است و هنگامی که الگوریتم انتخاب ویژگی را به کار نبرده¬ایم دقت آن ۹۳/۹۰ درصد است. بنابراین در این مقاله ما به بیشترین دقت که در حدود ۷۱۵/۹۹ درصد است رسیدیم. همان¬طور که می¬دانیم رسیدن به دقت ۱۰۰ درصد تقریبا مشکل می¬باشد اما روش درخت رندم و جنگل رندم به دقتی بیشتر از ۹۹ درصد رسیده¬اند. بنابراین واضح است که روش درخت رندم همانند طبقه¬بندی کننده¬ها به خوبی در تشخیص Spam و دقت آن کار می¬کند. هنگامی که الگوریتم انتخاب ویژگی را برای کل مراحل به کار بردیم به دقت خیلی خوبی رسیدیم.
- بخشی از مقاله انگلیسی:
VI.CONCLUSION
In Spam mail classification is major area of concern these days as it helps in the detection of unwanted emails and threats. So now a day’s most of the researchers are working in this area in order to find out the best classifier for detecting the spam mails. So a filter is required with high accuracy to filter the unwanted mails or spam mails. In this paper we focussed on finding the best classifier for spam mail classification using Data Mining techniques. So we applied various classification algorithms on the given input data set and check the results. From this study we analyze that classifiers works well when we embed feature selection approach in the classification process that is the accuracy improved drastically when classifiers are applied on the reduced data set instead of the entire data set. The results gained were promising Accuracy of the classifier Random Tree is 99.715% with best-first feature selection algorithm and accuracy is 90.93% only when we don’t apply this subset selection algorithm. So, here in this study we achieve highest accuracy = 99.715%. As we all know that it is very difficult to achieve 100% accuracy but Random Tree and Random Forest (accuracy>99%) is very nearby to that. Therefore it is find that tree like classifiers works well in spam mail detection and accuracy improved incredibly when we first apply feature selection algorithm into the entire process.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
شناسایی Spam در بین اطلاعات به دست آمده ایمیل- آنالیز عملکرد نسبی |
عنوان انگلیسی مقاله: |
Spam Mail Detection through Data Mining – A Comparative Performance Analysis |
|
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی |