دانلود رایگان ترجمه مقاله استخراج الگوی مشابه مکرر بسته (ساینس دایرکت – الزویر ۲۰۱۸)

 

 

این مقاله انگلیسی ISI در نشریه الزویر در ۱۳ صفحه در سال ۲۰۱۸ منتشر شده و ترجمه آن ۳۹ صفحه بوده و آماده دانلود رایگان می باشد.

 

دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word)
عنوان فارسی مقاله:

شناسایی الگوهای مشابه مکرر بسته شده: کاهش تعداد الگوهای مشابه مکرر بدون از دست دادن اطلاعات

عنوان انگلیسی مقاله:

Closed frequent similar pattern mining: Reducing the number of frequent similar patterns without information loss

دانلود رایگان مقاله انگلیسی
دانلود رایگان ترجمه با فرمت pdf
دانلود رایگان ترجمه با فرمت ورد

 

مشخصات مقاله انگلیسی و ترجمه فارسی
فرمت مقاله انگلیسی pdf
سال انتشار ۲۰۱۸
تعداد صفحات مقاله انگلیسی ۱۳ صفحه با فرمت pdf
نوع مقاله ISI
نوع نگارش مقاله پژوهشی (Research article)
نوع ارائه مقاله ژورنال
رشته های مرتبط با این مقاله مهندسی کامپیوتر – مهندسی صنایع – ریاضی
گرایش های مرتبط با این مقاله مهندسی الگوریتم ها و محاسبات – داده کاوی – تحقیق در عملیات
چاپ شده در مجله (ژورنال)/کنفرانس سیستم های خبره با برنامه های کاربردی
کلمات کلیدی داده کاوی – الگوهای مکرر – داده های ترکیبی – توابع شباهت – بسته شدن رو به پایین
کلمات کلیدی انگلیسی Data mining – Frequent patterns – Mixed data – Similarity functions – Downward closure
ارائه شده از دانشگاه گروه علوم کامپیوتر، موسسه اخترفیزیک، اپتیک و الکترونیک (INAOE)
نمایه (index) Scopus – Master Journal List – JCR
شناسه شاپا یا ISSN ۱۸۷۳-۶۷۹۳
شناسه دیجیتال – doi https://doi.org/10.1016/j.eswa.2017.12.018
لینک سایت مرجع https://www.sciencedirect.com/science/article/abs/pii/S0957417417308345
رفرنس دارای رفرنس در داخل متن و انتهای مقاله
نشریه الزویر – Elsevier
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش  ۳۹ صفحه با فونت ۱۴ B Nazanin
فرمت ترجمه مقاله pdf و ورد تایپ شده با قابلیت ویرایش
وضعیت ترجمه انجام شده و آماده دانلود رایگان
کیفیت ترجمه

مبتدی (مناسب برای درک مفهوم کلی مطلب) 

کد محصول F2376

 

بخشی از ترجمه

اولین الگوریتمی برای استخراج الگوهای مشابه مکرر بود که از تابع شباهت متفاوت با برابری استفاده می کرد و از الگوریتم Apriori الهام گرفته شده بود (Agrawal et al.، ۱۹۹۴). ObjectMiner با پیروی از یک استراتژی جستجوی اولیه در عرض چند ثانیه کار می کند. با توجه به مجموعه داده D، یک تابع شباهت و حداقل آستانه فرکانس، ObjectMiner الگوهای مشابهی را در D فقط با یک ویژگی پیدا می کند. فرکانس الگوها با اضافه کردن رخداد خود و رخداد الگوهای مشابه آن محاسبه می شود. هر الگوی با فرکانس بیشتر از حداقل آستانه فرکانس، الگوی مشابهی را در نظر می گیرد. در تکرار k (شروع با k = 2) ObjectMiner الگوهای مکرر مشابهی را در D با ویژگی k پیدا می کند. این کار با ادغام الگوهای مشابه مکرر با ویژگی های k-1 انجام می شود. این فرآیند پس از آنکه هیچ الگوهای مکرر دیگری پیدا نشد، پایان می یابد.
ضعف اصلی ObjectMiner، این است که شباهت بین یک الگوی و تکرار آن در هر تکرار الگوریتم محاسبه می شود، که باعث محاسبه اضافی و غیر ضروری می شود. ObjectMiner همچنین مجموعه ای از تمام زیر توصیف های مشابه (از جمله تکرار آن ها) را از هر یک از زیر فهرست های مکرر ذخیره می کند، که کارایی را کند می کند همانطور که در Rodríguez-González و همکاران نشان داده شده است. (۲۰۱۳).
StreeDC-Miner (Rodríguez-González ، ۲۰۱۳) یک الگوریتم دیگر برای استخراج نمونه های مکرر است. STreeDC-Miner با پیروی از یک استراتژی جستجوی اولیه عمق ، با استفاده از یک ترتیب کامل بر روی ویژگی که در D تنظیم شده است، کار می کند. STreeDC-Miner شروع به تجزیه و تحلیل هر مجموعه با تنها یک ویژگی A می کند و یک ویژگی جدید به این مجموعه اضافه می کند که بعد از آخرین ویژگی در مجموعه به ترتیب مشخص شده است. مورد پایه در بازگشت که الگوهای مشابه مکرر بیشتری برای مجموعه فعلی ویژگی های تحت تجزیه و تحلیل کشف نشده است کامل می شود. به منظور افزایش کارایی فرکانس الگوهای محاسبه، STreeDC-Miner از ساختار درختی به نام STree استفاده می کند. هر برگ در STree تکرار الگوی تحت این شاخه را ذخیره می کند و همچنین شباهت بین این الگو و الگوهای مشابه آن را ذخیره می کند. شباهت بین دو الگو در STree تنها اگر زیرالگوها در STree شبیه باشند و اگر یکی از آنها یک الگوی مشابه مکرر است، محاسبه می شود. به این ترتیب STreeDC-Miner تلاش محاسباتی را برای محاسبه فرکانس هر الگو با کاهش ترسیم تابع شباهت کاهش می دهد. با این حال، STreeDC-Miner مانند ObjectMiner همان نقص یافتن بسیاری از الگوهای مکرر مشابه را دارد.

۲٫۲ استخراج آیتم های مکرر بسته
استخراج آیتم های مکرر بسته مکرر تنها یافتن آن مجموعه های مکرر است که در آن مجموعه های دیگری وجود دارد که حاوی آن با همان فرکانس باشد (Prabha et al.، ۲۰۱۳). مزیت محاسبه مجموعه های مکرر بسته این است که آنها تمام اطلاعات مورد نیاز برای به دست آوردن تمام الگوهای مکرر و فرکانس دقیق آنها بدون نیاز به مجموعه داده های اصلی را حفظ می کنند. دو الگوریتم استخراج مشتق شده مکرر اول و معروف ترین Closet و CHARM است.
Closet (پی و همکاران، ۲۰ ۰ ۰) بر اساس: i) فشرده سازی الگوهای مکرر در ساختار درختی حاوی الگوهای مکرر برای مجموعه های استخراج بسته شده بدون تولید کاندید، II) فشرده سازی یک مسیر تک درخت برای انجام شناسایی سریع الگوهای مکرر بسته، iii) اجرای مکانیزم پیش بینی مبتنی بر پارتیشن برای کاوش مقیاس پذیر در پایگاه داده های بزرگ.
Closet با استفاده از روش تقسیم و فتح برای استخراج الگوهای مکرر بسته استفاده می کند. اولا موارد مکرر در فرکانس نزولی یافت می شوند و مرتب می شوند. سپس فضای جستجو به زیر مجموعه های غیر همپوشانی تقسیم می شود و هر زیر مجموعه ای از مجموعه های مکرر بسته به صورت مجزا با ساختن پایگاه های داده ی مشروط مرتبط استخراج می شود.
CHARM از سوی دیگر، (Zaki & Hsiao، ۲۰۰۲) از روش پایین به بالا برای استخراج مجموعه های مکرر بسته استفاده می کند. این روش فضاهای مجموعه نمونه ها و جابجایی ها را از طریق یک درخت جستجوی مجموعه نمونه – مجموعه زمان دوبعدی، با استفاده از یک جستجوی هیبریدی کارآمد که در طول جستجو در سطوح مختلف، از بین میرود، بررسی میکند. CHARM همچنین با استفاده از یک تکنیک به نام diffsets برای کاهش حافظه از محاسبات متوسط استفاده می کند. در نهایت، از یک رویکرد مبتنی بر هش استفاده می کند تا هر مجموعه غیر بسته که در طی جستجو پیدا می شود حذف شود.
LCM (Uno et al،) ۲۰۰۳ یکی دیگر از الگوریتم های استخراج معادلات مکرر بسته است. این تعریف یک رابطه پدر و کودک بین الگوهای بسته است. ثابت شد که هر رابطه والدین یک درخت را ایجاد می کند که از طریق آن می توان تمام الگوهای بسته را پیدا کرد. LCM همچنین یک روش کارآمد برای عبور از هر درخت در زمان چندجمله ای با توجه به مقدار مجموعه های مکرر بسته در مجموعه داده ها معرفی کرد.
از CHARM، Closet و LCM، دیگر الگوریتم ها نیز برای استخراج اقلام مکرر بسته شده از قبیل COBBLER (Pan، Tung، Cong، & Xu، ۲۰۰۴)، TD-Close (Han & Shao، ۲۰۰۶)، PGMiner (Moonesinghe، Fodeh ، TTD-Close (لیو و همکاران، ۲۰۰۹) CFIM-P (Nair)، TTD-Close (نجد و صدرالدینی، ۲۰۰۷)، ICMiner (لی، وانگ، ونگ، چن و وو، ۲۰۰۸) & Tripathy، ۲۰۱۱)، DBV-Miner (Vo، Hong، & Le، ۲۰۱۲)، NAFCP (Le & Vo، ۲۰۱۵) و اخیرا BVCL (هاشم، کریم، ساملی اله و احمد، ۲۰۱۷) پیشنهاد شده است.
بر خلاف همه این الگوریتم های قبلی، کار ما یک الگوریتم را برای استخراج الگوهای مکرر بسته در مجموعه داده ها ارائه می دهد که در آن اشیا با ویژگی های عددی و غیر عددی توصیف می شوند.

۳٫ مفاهیم و عبارات پایه
در این بخش، برخی از مفاهیم مربوط به استخراج الگوی مشابه مکرر و یافتن الگوی مکرر بسته معرفی شده است. در ابتدا، مفاهیم رایج توصیف شده اند. سپس، مفاهیم یافتن الگوی مشابه مکرر ذکر شده است. سوم ، مفاهیم یافتن الگوی مکرر بسته نیز بیان شده اند.

 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا