این مقاله انگلیسی ISI در نشریه IEEE در 4 صفحه در سال 2013 منتشر شده و ترجمه آن 10 صفحه میباشد. کیفیت ترجمه این مقاله ارزان – نقره ای ⭐️⭐️ بوده و به صورت کامل ترجمه شده است.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی | |
عنوان فارسی مقاله: |
پیش بینی طوفان در یک ابر |
عنوان انگلیسی مقاله: |
Storm Prediction in a Cloud |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2013 |
تعداد صفحات مقاله انگلیسی | 4 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله | رایانش ابری |
چاپ شده در مجله (ژورنال) | پنجمین کارگاه آموزشی بین المللی اصول سیستم های خدماتی مبتنی بر مهندسی |
کلمات کلیدی | رگرسیون، سری های زمانی، پیشگویی ، ابر |
ارائه شده از دانشگاه | دانشکده علوم کامپیوتر، دانشگاه واترلو، کانادا |
رفرنس | دارد ✓ |
کد محصول | F1301 |
نشریه | آی تریپل ای – IEEE |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
وضعیت ترجمه | انجام شده و آماده دانلود |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش | 10 صفحه با فونت 14 B Nazanin |
ترجمه عناوین تصاویر | ترجمه شده است ✓ |
ترجمه متون داخل تصاویر | ترجمه نشده است ☓ |
درج تصاویر در فایل ترجمه | درج شده است ✓ |
منابع داخل متن | درج نشده است ☓ |
کیفیت ترجمه | کیفیت ترجمه این مقاله متوسط میباشد |
فهرست مطالب |
چکیده |
بخشی از ترجمه |
چکیده
پیشگویی رفتار آینده به طور قابل اتکا و کارامد برای سیستم هایی مهم است که خدمات مجازی را مدیریت می کنند. چنین سیستم هایی باید قادر به متعادلسازی بارهای درون یک محیط ابری برای اطمینان ازاین امر باشد که موافقت نامه ها در سطح خدماتی با هزینه قابل قبولی برطرف شود. در اصل پیشگویی های صحیح می تواند با استخراج از انواع منابع داده ها حاصل اید که شرح رفتار تاریخی خدمات، شروط برنامه هایی که روی آنها اجرا شده است، و تقاضاهای پدید آمده روی ابر توسط کاربران نهایی می باشد. پیشگویی صحیح بارهای ماکزیمم که احتمالا در کوتاه مدت مشاهده گردیده است، از اهمیت خاصی برخوردار است. اما رهیافتهای استاندارد برای مدلسازی رفتار سیستم، با تحلیل تمامیت داده های مشاهده شده تمایل به پیشگویی رفتار سیستمی متوسط به جای استثنایی و نادیده گرفتن الگوهای مهم تغییر طی زمان دارد. در این مقاله، ما به مطالعه توانایی یک رگرسیون خطی چندمتغیره ساده برای پیش بینی استفاده از CPU پیک (طوفانها) در یک محیط ابری صنعتی می پردازیم. نیز چندین اصلاح را در رگرسیون خطی استاندارد برای تنظیم آن برای پیشگویی طوفان مطرح می داریم.
1- مقدمه
فراساختار به شکل یک خدمات یا IaaS یک هنجار در سیستم های IT در مقیاس بزرگ شده است و مجازی سازی در این محیطها متداول است. یکی از مشکلات اصلی چنین مجازی سازی هایی قرار دادن ماشین های مجازی یا VM و متعادل سازی بار است. اگر تقاضاها روی فراساختارها از ظرفیت آنها خارج باشد، شکست رخ خواهد داد، زمانهای پاسخ افزایش خواهد یافت، و رضایت مشتری سقوط خواهد کرد. از اینرو ضروری است که مطمئن شویم قرار دادن و متعادلسازی به طور مناسبی صورت گرفته است.
متعادل سازی مناسب و برنامه ریزی ظرفیت مناسب در چنین محیطهای ابری نیاز به پیشگویی بار کاری آینده و مصرف های منبع دارد. بدون پیشگویی های خوب، مدیران ابر مجبور به پیکربندی بیش از حد ذخایر منابع خود برای دستیابی به قابلیت دسترسی لازم برای احترام به توافقات سطح خدمات یا SLA می شوند. این کار گران بوده و می تواند باز در براورده سازی SLA ها به طور مداوم شکست بخورد. بی توجه به پیش بینی های خوب ، مدیران ابر تمایل به کار در یک حالت واکنشی دارند و می توانند ناکارامد و حتی از هم گسیخته شوند. چندین تکنیک پیش بینی بار کاری براساس انالیز سری های زمانی طی سالیان ارائه شده است که می تواند در محیطهای ابری نیز بکار بسته شود. خط پایینی چنین متونی این است که هیچ تکنیک خوبی برای پیش بینی وجود ندارد. بسته به ماهیت داده ها و مشخصات خدمات و بار کاری، تکنیک های آماری مختلف و الگوریتم های یادگیری ماشینی می تواند بهتر از سایرین عمل کند. در برخی موارد حتی ساده ترین تکنیک ها مانند رگرسیون خطی می تواند بهتر از رقبای پیچیده تر عمل کند. برای درک قابلیت کاربرد چنین تکنیک های پیشگویی درباره مسائل در مقیاس صنعتی، ما یک سری مطالعات موردی را تنظیم کرده ایم که در ان تکنیک های پیشگویی مختلفی را روی داده هایی که از همکار صنعتی ما CA Technologies آمده است ، بکار می بندیم. CA Technologies یک فراهم کننده ابر برای سازمانهای مقیاس کلان متعددی است. اینها IaaS را برای مشتریان خود فراهم می کنند و بر استفاده ایشان نظارت دارند. سیستم مدیریت ابر اساسا مسئول متعادلسازی بار کاری با قراردادن ماشین های مجازی روی فراساختار فیزیکی است. در این مقاله، ما تجربه خود را روی بکارگیری یک تکنیک رگرسیون خطی چندمتغیره یا MVLR برای پیشگویی استفاده از CPU ی ماشین های مجازی در زمینه یکی از مشتریان CA گزارش می دهیم. اما برخلاف بسیاری از تکنیک های پیشگویی موجود ، که در آن ایشان خطاهای پیشگویی متوسط را به حداقل رسانده یا احتمالات متوسط را به حداکثر رسانده اند، ما به پیشگویی موارد فوق العاده به جای متوسط علاقمندتریم. انگیزه از نوع بار کاری ناشی می شود که ما در مطالعه موردی خود با آن روبروییم که برای سایر کاربردهای مبتنی بر ابر نیز خیلی نامتداول نیست . در مورد ما، متوسط استفاده بین کلیه VMها حداکثر 20 درصد بوده است ولی ماکزیمم استفاده تقریبا خیلی نزدیک به 100 درصد به طور تغییرناپذیر بوده است. بکارگیری MVLR در چنین داده هایی (بیشتر اوقات خیلی استفاده کمی دارد ولی گاهی اوقات به اوج می رسد)، ما درک کرده ایم که هرچند متوسط پیشگویی ها خیلی صحیح است ولی پیشگویی برای مقادیر بزرگ (طوفانها) به طور برجسته ای ضعیف است. برای سازگاری با این مسئله، ما چندین اصلاحات را در MVLR اصلی برای تنظیم آن برای پیشگویی مقادیر پیک ارائه کرده ایم. نتایج نشان می دهد که کسر موسمی بودن های استخراجی توسط تغییر شکل Fourier و بعد استفاده از متوسط گیریMVLR بهترین نتایج مشاهده شده را برای پیشگویی طوفان فراهم می کند. در بخشهای ذیل، ما به شرح جزئیات هر MVLR اصلاح شده و گزارش نتایج ان می پردازیم. |
بخشی از مقاله انگلیسی |
Abstract Predicting future behavior reliably and efficiently is key for systems that manage virtual services; such systems must be able to balance loads within a cloud environment to ensure that service level agreements are met at a reasonable expense. In principle accurate predictions can be achieved by mining a variety of data sources, which describe the historic behavior of the services, the requirements of the programs running on them, and the evolving demands placed on the cloud by end users. Of particular importance is accurate prediction of maximal loads likely to be observed in the short term. However, standard approaches to modeling system behavior, by analyzing the totality of the observed data, tend to predict average rather than exceptional system behavior and ignore important patterns of change over time. In this paper, we study the ability of a simple multivariate linear regression for forecasting of peak CPU utilization (storms) in an industrial cloud environment. We also propose several modifications to the standard linear regression to adjust it for storm prediction. 1 Introduction Infrastructure as a Service (IaaS) is becoming a norm in large scale IT systems and virtualization in these environments is common. One of the main difficulties of such virtualization is the placing of virtual machines (VMs) and balancing the load. If the demands placed on the infrastructure exceed its capabilities, thrashing will occur, response times will rise, and customer satisfaction will plummet. Therefore it is essential to ensure that the placing and balancing is done properly [1-4]. Proper balancing and capacity planning in such cloud environments requires forecasting of future workload and resource consumptions. Without good forecasts, cloud managers are forced to over-configure their pools of resources to achieve required availability, in order to honor service level agreements (SLAs). This is expensive, and can still fail to consistently satisfy SLAs. Absent good forecasts, cloud managers tend to operate in a reactive mode and can become ineffective and even disruptive. Several workload forecast techniques based on time series analysis have been introduced over the years [5] that can be applied in the cloud settings as well. The bottom-line of such literature is that there is no “silver bullet” technique for forecasting. Depending on the nature of the data and characteristics of the services and the workload, different statistical techniques and machine learning algorithms may perform better than the others. In some cases even the simplest techniques such as linear regression may perform better than the more complex competitors [6]. To understand the practicality of such prediction techniques on industrial size problems, we set up a series of case studies where we apply different forecasting techniques on data coming from our industrial collaborator, CA Technologies [7]. CA Technologies is a cloud provider for several large scale organizations. They provide IaaS to their clients and monitor their usage. Their cloud manager system basically is responsible for balancing the workload by placing the virtual machines on the physical infrastructure. In this paper, we report our experience on applying a basic multivariate linear regression (MVLR) technique to predict the CPU utilization of virtual machines, in the context of one of the CA clients. However, unlike many existing prediction techniques, where they minimize the average prediction errors or maximize average likelihoods, we are more interested in predicting extreme cases rather than averages. The motivation comes from the type of workload we are facing in our case study, which is not very uncommon for other cloud-based applications, as well. In our case, the average utilization across all VMs was at most 20%, but the maximum utilization was almost invariably very close to 100%. Applying MVLR in such data (most of the time very low utilization but occasionally reaching to peaks), we realized that though the average predictions are very accurate but the forecast for large values (storms) are drastically poor. To cope with this problem, we introduce several modifications to the basic MVLR to adjust it for predicting peak values. The results show that subtracting seasonalities extracted by Fourier transform and then using a weighted MVLR provides our best observed results for storm prediction. In the following sections, we describe the details of each modified MVLR and report its results. |