دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
یادگیری فیلتر کردن هرزه نامه پست الکترونیکی: مقایسه روش های Naive Bayesian و memory-based |
عنوان انگلیسی مقاله: |
Learning to Filter Spam E-Mail: A Comparison of a Naive Bayesian and a Memory-Based Approach |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار مقاله | 2000 |
تعداد صفحات مقاله انگلیسی | 12 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله | مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار و برنامه نویسی کامپیوتر |
مجله مربوطه | کنفرانس اروپایی اصول و روش های کشف دانش در پایگاه های داده |
دانشگاه تهیه کننده | آزمایشگاه مهندسی نرم افزار و دانش، موسسه انفورماتیک و ارتباطات مرکز ملی پژوهش های علمی Demokritos، آتن، یونان |
رفرنس | دارد |
نشریه | Arxiv |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت 14 B Nazanin | 17 صفحه |
ترجمه عناوین تصاویر و جداول | ترجمه شده است |
ترجمه پاورقی | ترجمه شده است |
درج تصاویر در فایل ترجمه | درج شده است |
درج جداول در فایل ترجمه | درج شده است |
درج فرمولها و محاسبات در فایل ترجمه به صورت عکس | درج شده است |
- فهرست مطالب:
مقدمه
1- معرفی
2- گردآوری نوشته ها
3 – پیش پردازش نوشته ها
4- دسته بندی پیام های پست الکترونیک
4-1- روش دسته بندی Naive Bayesian
4-2- دسته بندی مبنی بر حافظه
5- معیارهای ارزیابی عملکرد دسته بندی
6- نتایج تجربی
6-1- سناریو 1: پیام های هرزه نامه علامتدار (λ=1)
6-2- سناریو 2: اخطار دادن به فرستنده درباره پیام های مسدود شده (λ=9)
6-3- سناریو 3: حذف پیام های مسدود شده λ=999
6-4- موقعیت بهترین عملکرد
7- نتیجه گیری
تقدیر و تشکر
- بخشی از ترجمه:
7- نتیجه گیری
در این مقاله ارزیابی کامل دو روش یادگیری فیلتر نمون هرزه نامه را با استفاده از یک مجموعه نوشته که به صورت عمومی وجود دارد و یک مقیاس حساسیت هزینه مناسب انجام داده ایم. هر دو روش به یک دقت دسته بندی بالا می رسند و نسبت به الگوی واژه کلیدی ضد هرزه نامه عملکرد بهتری دارند. روش پیشنهادی ما ساخت فیلتر هرزه نامه را براحتی امکان پذیر می نماید، زمانیکه پیامهای هرزه نامه علامت گذاری شده اند یا مکانیزم اضافی جهت مطلع ساختن فرستنده گان پیام های مسدود شده موجود باشد. اما زمانی که چنین مکانیزمی وجود نداشته باشد روش مبنی بر حافظه مناسب تر است.
ما روش یادگیری پیشنهادی را در موقعیت های متفاوت امتحان کرده ایم، همچنین روش پیشنهادی نشانه انتخابی شامل روش های استخراج اصطلاحات برای تغییر لغات به نشانه های عبارتی را نیز طراحی نموده ایم.
- بخشی از مقاله انگلیسی:
7. Conclusions
We performed a thorough evaluation of two learning methods on the task of anti-spam filtering, using a corpus that we made publicly available, and suitable cost-sensitive evaluation measures. Both methods achieved very high classification accuracy and clearly outperformed the anti-spam keyword patterns of a widely used e-mail reader. Our findings suggest that it is entirely feasible to construct learning-based anti-spam filters when spam messages are simply to be flagged, or when additional mechanisms are available to inform the senders of blocked messages. When no such mechanisms are present, a memory-based approach appears to be more viable, but great care is needed to configure the filter appropriately. We are currently examining alternative learning methods for the same task, including attribute-weighted versions of the memory-based algorithm. We also plan to explore alternative attribute selection techniques, including term extraction methods to move from word to phrasal attributes.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
مقایسه کارایی Naive Bayesian و memory-based در آموزش فیلترینگ اسپم ایمیل |
عنوان انگلیسی مقاله: |
Learning to Filter Spam E-Mail: A Comparison of a Naive Bayesian and a Memory-Based Approach |
|