این مقاله انگلیسی در نشریه آی تریپل ای در 7 صفحه در سال 2015 منتشر شده و ترجمه آن 19 صفحه بوده و آماده دانلود رایگان می باشد.
دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word) |
عنوان فارسی مقاله: |
ابزارهای یادگیری ماشین مبتنی بر ابر برای نرم افزارهای پیشرفته داده های بزرگ
|
عنوان انگلیسی مقاله: |
Cloud-based Machine Learning Tools for Enhanced Big Data Applications
|
دانلود رایگان مقاله انگلیسی |
|
دانلود رایگان ترجمه با فرمت pdf |
|
دانلود رایگان ترجمه با فرمت ورد |
|
مشخصات مقاله انگلیسی و ترجمه فارسی |
فرمت مقاله انگلیسی |
pdf |
سال انتشار |
2015 |
تعداد صفحات مقاله انگلیسی |
7 صفحه با فرمت pdf |
نوع نگارش |
مقاله پژوهشی (Research article) |
نوع ارائه مقاله |
کنفرانس |
رشته های مرتبط با این مقاله |
مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله |
هوش مصنوعی – مهندسی نرم افزار – رایانش ابری یا محاسبات ابری – مهندسی الگوریتم ها و محاسبات – علوم داده |
چاپ شده در مجله (ژورنال)/کنفرانس |
سمپوزیوم بین المللی محاسبات خوشه ای و شبکه (CCGRID) |
کلمات کلیدی |
مدلهای پنهان مارکوف – تست معیار – تبدیل کسینوس گسسته – دادههای بزرگ – ماشینکاری مجازی – الگوریتمهای یادگیری ماشین – آموزش |
کلمات کلیدی انگلیسی |
Hidden Markov models – Benchmark testing – Discrete cosine transforms – Big data – Virtual machining – Machine learning algorithms – Training |
ارائه شده از دانشگاه |
گروه DIA، دانشگاه تریست، تریست، ایتالیا |
شناسه دیجیتال – doi |
https://doi.org/10.1109/CCGrid.2015.170 |
لینک سایت مرجع |
https://ieeexplore.ieee.org/document/7152575 |
رفرنس |
دارای رفرنس در داخل متن و انتهای مقاله ✓ |
نشریه |
آی تریپل ای – IEEE |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش |
19 صفحه با فونت 14 B Nazanin |
فرمت ترجمه مقاله |
pdf و ورد تایپ شده با قابلیت ویرایش |
وضعیت ترجمه |
انجام شده و آماده دانلود رایگان |
کیفیت ترجمه |
مبتدی (مناسب برای درک مفهوم کلی مطلب)
|
کد محصول |
F2216 |
بخشی از ترجمه |
طبقهبندیهای مختلف و ویژگیها میتواند در یک چارچوب ادغام داده به منظور بهبود دقت طبقهبندی در نظر گرفته شود، همانگونه که در شکل 2 گزارش شده است.
همانگونه که در پایان این مقاله نشان داده شده است، این طبقهبندی با بالاترین کیفیت را میتوان برای پیدا کردن یک دسته حجم کار ناشناخته استفاده کرد.
3. معیار SPEC 2006
CINT2006 [40] معیار CPU متمرکز، بر یک سیستم پردازنده، زیر سیستم حافظه و کامپایلر تاکید میکند. SPEC، CPU2006 را برای ارائه یک مقایسه از عملکرد محاسبه متمرکز طراحی. کرده است. تمام معیارها بهعنوان کد منبع ارائه شده است. دوازده برنامهی گنجانده شده در مجموعه معیارها را میتوان در کلاسهای زیر با توجه به قابلیتها گروهبندی کرد: کلاس کامپایلر، کلاس بازی، کلاس فشردهسازی، کلاس محاسبات علمی، کلاس بهینهسازی.
در این کار، مدلهای حجم کار از شش معیار مشتق شده است، بانامهای401.bzip2،403.gcc،458.sjeng، 471.omnetpp،400.perlbench و 462.libquantum. . در آزمایش اول، مدلهای مشتق شده با همان شش معیار تست شده است. مهم است که توجه داشته باشید که دادههای ورودی از دادههای مورد استفاده در آموزش متفاوت هستند، در نتیجه توالی اجرا همیشه متفاوت است. در آزمایش دوم، شش معیار دیگر برای ارزیابی شباهت برای ارزیابی مدلهای حجم کار استفاده شده است.
معیارهای مورد استفاده تنها کسری از برنامههای کاربردی مشابه هستند، چرا که I / O و فعالیت حافظه از دست رفته است. بنابراین، نتایج گزارش شده به عنوان یک دیدگاه اولیه از کل در نظر گرفته شده است و تنها در حجم کار متمرکز کامپیوتر است.
توضیح اینکه چطور دادههای ورودی به معیارها به منظور ایجاد گزارش نتایج قابل تکرار سازماندهی میشود، مهم است. SPEC شش ورودی مختلف برای bzip، نه برای gcc و سه برای perlbench. معیار sjeng تنها یک ورودی دارد؛ دو ورودی دیگر برای sjeng از اولین موقعیتهای شطرنج از chess.html بهدست میآید که از WWW.DOWNSCRIPTS.COM/CHESSDATABASE ASP.NET-SCRIPT.HTML دانلود میشود. بهطور مشابه، omnetpp تنها یک ورودی توسطSPEC دارد و ورودیهای دیگر از اولین مثال شبکه گزارش شده در HTTP://INET.OMNETPP.ORG/DOC/INET/NEDDOC/INDEX.HTML. بهدست میآید. درنهایت، libquantum از زوج اعداد اضافی زیر داده شده است: (159، 15) و (1413، 17).
تمام معیارها حداقل سه ورودی دارند که برای آموزش استفاده میشوند. ورودیهای اضافی برای تست از روش مشابه بهدست میآید.
4. تنظیم ماشین مجازی
زیرساختهای مجازیسازی مورد استفاده در این کار توسط نرم افزار VirtualBox [43] ارائه شده است نرم افزار VirtualBox برنامه مجازیسازی منبع باز است که مجموعهای غنی از رابطهای برنامه کاربردی فراهم میکند و معیارهای مختلف برنامهی مجازی را ارائه میدهد. مجموعهای کامل از API های موجود در شرح داده شده است. SDK، که با VirtualBox ارائه شده، به اشخاص ثالث اجازه میدهد تا برنامههای کاربردی در تعامل با VirtualBox را توسعه دهند. VirtualBox در سطوح طراحی شده است. در پایین VMM. را توضیح دادهایم. VMM قلب مجازیسازی است، عملکرد ماشینهای مجازی را نظارت میکند و امنیت و عدم وجود درگیری بین ماشین مجازی و میزبان را فراهم میکند. ماژولهای وجود دارد که قابلیتهای اضافی، بهعنوان مثال، سرور RDP (پروتکل از راه دور دسکتاپ) را ارائه میکنند. سطح API بالاتر از این بلوکهای اساسی نمایش داده شده است.
نرم افزار VirtualBox با یک وبسرویس همراه است، یک بار در حال اجرا، به عنوان سرور HTTP عمل میکند، اتصالات SOAP را میپذیرد [38] و آنها را پردازش میکند. رابط کاربری در یک فایل زبان توصیف وبسرویس (WSDL ) توصیف شده است [45]. نوشتن برنامههای مشتری در هر زبان برنامهنویسی ممکن است که ابزاری برای پردازش فایلهای WSDL، مانند جاوا فراهم کرده ، C ++، PHP NET، پایتون، پرل فراهم کرده باشد. علاوه بر جاوا و پایتون، SDK شامل کتابخانههایی آماده برای استفاده است. API با استفاده از مدل شیء گرا (COM ) بهعنوان یک مدل مرجع پیادهسازی شده است. در ویندوز، استفاده از Micrisoft COM طبیعی است. در میزبانهای دیگر، که COM وجود ندارد، XPCOM که یک برنامه رایگان برای اجرای COM است، استفاده میشود.
با وجود مزایای متعدد وب سرویس API، ما از روش COM استفاده کردیم به دلیل اینکه سربار کمتری دارد و نرخ دادهی بالاتری دارد. ما یک تبادل اطلاعات انجام دادیم و معلوم شد که وب سرویس قادر است، بهطورمتوسط 5.96 MS اطلاعات جمعآوری کند درحالیکه با استفاده از داده COM میتواند 0.49 MS جمعآوری کند. دیگر ویژگیهای جالب، نگرانی مجموعهای از دادههای آماری در منابع مورد استفاده است. API توابع زیرا را فراهم میکند:
• تعیین میکند که کدام گروههها از شاخصهای مورد علاقه ما هستند (CPU، RAM، شبکه، دیسک).
• تنظیم محدوده اندازهگیری (حداقل فاصله زمانی 1)؛
• تنظیم اندازه فریم برای آمار (حداقل، حداکثر، میانگین).
• ساخت پرس و جوهایی در مورد استفاده از یک منبع واحد
5. معیارها
با توجه به معیارها، یک سیستم مالکیت با توجه به دیاگرام شکل 3 توسعه دادیم. مالکیت توسط میزبان هدایت میشود؛ تمام دستورات و دادههای بهدست آمده از رابط کاربری COM استفاده میکند. یک رابط وب برای VMM وجود دارد اما آن از آنچه در بالا بیان شد آهستهتر است.
مقادیر اندازهگیری برای توصیف حجم کار از دو نوع، یعنی منابع حافظه و تقاضای منبع مورد استفاده قرار میگیرد. هر دو مقادیر با استفاده از نرم افزار VirtualBox وکلاسهای API VMM جمعآوری. شده است منابع حافظه، آدرس تولید شده توسط فرآیندهای مجازی هستند. API IMachineDebugger VMM میتواند ارزش شمارندههای برنامه مربوط به دستورالعمل در هر 0.5 میلیثانیه را جمعآوری کند. در شکل 4، یک تکه از منابع حافظه در حال جمعآوری در طول اجرای مجازی از یک معیار SPEC (gobmk) است.
|