دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
استخراج مجموعه اقلام مکرر در یک جریان |
عنوان انگلیسی مقاله: |
Mining frequent itemsets in a stream |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2014 |
تعداد صفحات مقاله انگلیسی | 23 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله | مهندسی الگوریتم ها و محاسبات و مهندسی نرم افزار |
مجله | سیستم های اطلاعاتی – Information Systems |
دانشگاه | دانشگاه فناوری آیندهوون، هلند |
کلمات کلیدی | استخراج مجموعه اقلام مکرر، جریان دادهها، نظریه، الگوریتم، آزمایشات |
شناسه شاپا یا ISSN | ISSN 0306-4379 |
رفرنس | دارد |
لینک مقاله در سایت مرجع | لینک این مقاله در نشریه Elsevier |
نشریه | Elsevier |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش و فونت 14 B Nazanin | 69 صفحه |
ترجمه عناوین تصاویر و جداول | ترجمه شده است |
ترجمه متون داخل تصاویر | ترجمه شده است |
ترجمه متون داخل جداول | ترجمه شده است |
درج تصاویر در فایل ترجمه | درج شده است |
درج جداول در فایل ترجمه | درج شده است |
درج فرمولها و محاسبات در فایل ترجمه به صورت عکس | درج شده است |
- فهرست مطالب:
چکیده
۱.پیشگفتار
۲.بازبینی حداکثر فرکانس
۲.۱. شمارشها، فرکانسها و ماکسیمم فرکانس
۳.۲. طول پنجرهی مینیمال
۲.۳. مسالهی کاوش (یا استخراج) مجموعه آیتم با ماکسیمم فرکانس
۳.استخراج یک مجموعه آیتم مفرد
۳.۱. پنجرههای ماکسیمال، مرزها، و خلاصهها
۳.۲. طول پنجرهی مینیمال
۳.۳. آستانهی فرکانس مینیمال
۳.۴. طول پنجرهی مینیمال و آستانهی فرکانس مینیمال
۴.استخراج همهی آیتمها
۴.۱. الگوریتم
۴.۲. پیچیدگی
۴.۳. بهینهسازیها
۵.بهرهوری مرز بزرگتر
۵.۱. تنها مرزهای آیتم
۵.۲. بستار مرز
۶ تجزیه و تحلیل بدترین حالت
۶.۱. جریانهای فری
۶.۲. کرانها
۷ آزمایشها
۷.۱.۱. Eclat افزایشی
۷.۲.۱ خلاصههای موقعیت
۷.۲.مجموعه دادهها
۷.۲.۱. جریانهای دادهای ترکیبی (یا مصنوعی)
۷.۲.۲. جریانهای دادهای جهان واقعی: هشدارها
۷.۳. بهرهوری حافظه
7.3.1 نتیجهگیری
۷.۴. زمانبندی کنترل و رسیدگی سست
۷.۴.۱. جریانهای پراکنده و پشت سر هم (یا متوالی)
۷.۴.۲. جریانهای پشت سر هم
۷.۴.۳. جریانهای کوتاه
۷.۴.۴. هشدارها
۷.۴.۵. نتیجه گیری
۷.۵. موقعیتهای مرز
۸ خلاصه
- بخشی از ترجمه:
۸ خلاصه
اندازهگیری ماکسیمم فرکانس برای کاوش مجموعه آیتمهای مکرر در یک جریان دادهای، مناسب است. آن به گونهای صادقانه فرکانس مجموعه آیتمها را در بند میکشد همانطورکه در شکل ۱۰ نشان داده شده است. مجموعه آیتمهای مکرر میتوانند به گونهای موثر هم در زمینهی مکان و هم زمان، کاوش شوند. کارامدی الگوریتم را میتوان به طور نظری به وسیلهی ارتباط دادن تعداد مرزها به مفهوم جریانها Farey از نظریهی اعداد به دست آورد. از این ارتباط، ما نتیجه میگیریم که حتی در بدترین حالت، تعداد مرزها کندتر از طول جریان افزایش مییابد. آزمایشهای روی مجموعههای دادهها، که در انها مجموعه آیتمها در الگوهای مختلفی رخ میدهند، در عمل، نسبت به زمان، نسبتا پایا باقی میمانند. ما نشان دادیم که هیچ حاشیهای نمیتواند از بهرهبرداری رابطهی زیرمجموعه بین مجموعه آیتمها حاصل شود. به طور ساده، ذخیرهسازی خلاصههای آیتم منجر به مساعل فضا میشود. به اشتراک گذاری مرزها در میان خلاصههای ارتباط یافته توسط رابطهی زیرمجموعه روی مجموعه آیتمها، غیر ممکن است زیرا در هر نقطهی داده شدهای یک موقعیت ممکن است مرزی برای مجموعه آیتمهای A1، A3 باشد اما برای مجموعه آیتم A2 نباشد، هنگامی که ما داشته باشیم.A2 ⊂A3 A1 ⊂
- بخشی از مقاله انگلیسی:
8. Conclusion
The max-frequency measure is apt for mining frequent itemsets in a datastream. It truthfully captures the frequency of itemsets, as is shown by Fig. 10. Frequent itemsets can be mined efficiently, both in terms of time and space. The efficiency of the algorithm can be derived theoretically by linking the number of borders to the concept of Farey streams, from number theory. From this connection we can deduce that, even in the worst case, the number of borders increases slower than the length of the stream. Experiments on datasets, in which itemsets occur in varying patterns, show that the number of borders in a summary, in practice, remains relatively stable over time. We showed that no edge can be gained from exploiting the subset relation between itemsets. Simply storing itemsummaries results in space issues. Sharing borders among summaries linked by the subset relation on itemsets is impossible because at any given point a position might be a border for itemsets A1 and A3 but not for itemset A2, where we have that A1 A2 A3. As a result, further optimizations of the algorithm will need to be based on non-trivial insights.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
استخراج مجموعه اقلام مکرر در جریان |
عنوان انگلیسی مقاله: |
Mining frequent itemsets in a stream |
|