دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
Sprint: یک طبقه بندی موازی مقیاس پذیر برای داده کاوی |
عنوان انگلیسی مقاله: |
SPRINT: A Scalable Parallel Classifier for Data Mining |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار مقاله | 1996 |
تعداد صفحات مقاله انگلیسی | 12 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله | داده کاوی، مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار و رایانش ابری |
مجله مربوطه | بیست و دومین کنفرانس بین المللی بانک های اطلاعاتی بسیار بزرگ |
دانشگاه تهیه کننده | مرکز تحقیقات آلمادن IBM |
شناسه شاپا یا ISSN | ISBN 1-55860-382-4 |
لینک مقاله در سایت مرجع | لینک این مقاله در سایت ACM |
نشریه | ACM |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت 14 B Nazanin | 30 صفحه |
ترجمه عناوین تصاویر و جداول | ترجمه شده است |
ترجمه متون داخل تصاویر | ترجمه نشده است |
ترجمه متون داخل جداول | ترجمه نشده است |
درج تصاویر در فایل ترجمه | درج شده است |
درج جداول در فایل ترجمه | درج شده است |
درج فرمولها و محاسبات در فایل ترجمه به صورت عکس | درج شده است |
- فهرست مطالب:
1-مقدمه
2- الگوریتم مجموعه ای
2-1-ساختار های داده
لیستهای صفات
هیستوگرامها
2-2 یافتن نقاط تقسیم
صفات پیوسته
صفات طبقه ای
2-3 انجام تقسیم
2-4- مقایسه با SLIQ
3- موازی سازی طبقه بندی
3-1-قرار دهی داده و حفظ تعادل حجم کار
3-2-یافتن نقاط تقسیم
صفات پیوسته
صفات دسته بندی
3-3- انجام تقسیم
3-4- موازی سازی SLIQ
3-4-1- لیست طبقه تکرار شده
3-4-2-لیست طبقه توزیع یافته
4-ارزیابی کارایی
4-1- مجموعه داده ها
4-2- کارایی مجموعه ای
4-3-عملکرد موازی
4-3-1 مقایسه الگوریتم های موازی
4-3-2 مقیاس پذیری
4-3-3-افزایش سرعت
4-3-4-سایزبندی
5 نتیجه گیری
- بخشی از ترجمه:
5 نتیجه گیری
با ظهور اخیر زمینه داده کاوی، نیاز زیادی برای الگوریتمها به منظور ایجاد طبقه بندی کننده هایی وجود دارد که می توانند پایگاههای داده بسیار بزرگ را کنترل نمایند. الگوریتم SLIQ که اخیرا پیشنهاد شده اولین الگوریتمی بود که در این ارتباط بیان شد. متاسفانه، به دلیل استفاده از ساختار داده ی ساکن در حافظه که با اندازه مجموعه آموزشی مقیاس بندی می شود، حتی SLIQ نیز محدودیت بالایی برای تعداد رکوردهایی که می تواند پردازش کند، دارد.
در این مقاله، ما یک الگوریتم طبقه بندی کننده جدید به نام SPRINT را ارائه کردیم که همه محدودیتهای حافظه موجود در الگوریتم های درخت تصمیم حذف می کند و هنوز هم رفتار مقیاس بندی عالی مشابه مانند SLIQ نشان می دهد. با اجتناب از نیاز برای هر گونه ساختار داده ساکن در حافظه، متمرکز ، SPRINT به طور موثری به طبقه بندی مجموعه داده های مجازی با هر اندازه ای اجازه می دهد. اهداف طراحی ما همچنین این نیاز را شامل می شود که الگوریتم به راحتی و به طور موثر قابل موازی سازی باشد. SPRINT موازی سازی موثری ندارد که نیازمند افزایش های اندکی به الگوریتم های مجموعه ای می باشد.
- بخشی از مقاله انگلیسی:
5 Conclusion
With the recent emergence of the field of data mining, there is a great need for algorithms for building classifiers that can handle very large databases. The recently proposed SLIQ algorithm was the first to address these concerns. Unfortunately, due to the use of a memory-resident data structure that scales with the size of the training set, even SLIQ has an upper limit on the number of records it can process. In this paper, we presented a new classification algorithm called SPRINT that removes all memory restrictions that limit existing decision-tree algorithms, and yet exhibits the same excellent scaling behavior as SLIQ. By eschewing the need for any centralized, memory-resident data structures, SPRINT efficiently allows classification of virtually any sized dataset. Our design goals also included the requirement that the algorithm be easily and efficiently parallelizable. SPRINT does have an efficient parallelization that requires very few additions to the serial algorithm.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
Sprint: یک طبقه بندی موازی مقیاس پذیر برای داده کاوی |
عنوان انگلیسی مقاله: |
SPRINT: A Scalable Parallel Classifier for Data Mining |
|