دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی | |
عنوان فارسی مقاله: |
انبار داده ها و OLAP داده های بزرگ: چالشهای موجود و سمت و سوی مطالعات آتی |
عنوان انگلیسی مقاله: |
Data Warehousing and OLAP over Big Data: Current Challenges and Future Research Directions |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2013 |
تعداد صفحات مقاله انگلیسی | 4 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی صنایع |
گرایش های مرتبط با این مقاله | داده کاوی و برنامه ریزی و تحلیل سیستم ها |
کلمات کلیدی | داده های بزرگ، داده های چندبعدی بزرگ، انبار داده ها، OLAP |
ارائه شده از دانشگاه | دانشگاه کالابریا، ایتالیا |
رفرنس | دارد ✓ |
کد محصول | F1011 |
نشریه | ACM |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
وضعیت ترجمه | انجام شده و آماده دانلود |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش | 7 صفحه با فونت 14 B Nazanin |
منابع داخل متن | درج نشده است ☓ |
کیفیت ترجمه | کیفیت ترجمه این مقاله متوسط میباشد |
توضیحات | ترجمه این مقاله به صورت خلاصه انجام شده است. |
فهرست مطالب |
خلاصه
1. مقدمه
2. چالش های تحقیقی انبار داده ها و OLAP داده های بزرگ
3. سمت و سوی مطالعات آتی انبار داده ها و OLAP روی داده های بزرگ
4. نتیجه گیری
|
بخشی از ترجمه |
خلاصه 1. مقدمه
در ادبیات تحقیقی این حوزه علاقه ی زیادی به “داده های بزرگ” ایجاد شده است. این اصطلاح به انواع خاصی از مجموعه داده ها اشاره دارد که در اپلیکیشن های محاسبات علمی از آنها استفاده میشود. داده های ذخیره شده در لایه ی اصلی تمامی این اپلیکیشن ها یک سری از مشخصات مشترک دارند مثلا: 1) داده های بزرگ مقیاس که به حجم و توزیع مخازن داده اشاره دارد 2) مسائل مقیاس پذیری که مربوط به قابلیت های اپلیکیشن هایی است که برای مخازن داده ی حجیم و بزرگ مقیاس کاربرد دارند. 3) پشتیبانی از پروسه های ExtractionTransformation-Loading (ETL) 4) طراحی و ارائه ی تجزیه و تحلیل آسان و قابل تفسیر مخازن داده های بزرگ بمنظور حصول آگاهی و دانش مفید.
به سبب مشخصات خاص کاربردهای داده های بزرگ استفاده ی از روشهای انبار داده ها و OLAP با هدف جمع آوری، استخراج، انتقال، بارگذاری، انبار و OLAP این نوع از پایگاه های داده امری کاملا منطقی است. و مبحثی کاملا جدید در حوزه ی مطالعات پایگاه داده و انبار داده ها است.
انبار داده ها و OLAP زمینه های علمی سابقه داری در این رابطه ها هستند که توسط محققان جامعه ی علمی انبار داده ها و پایگاه داده برای دهه های متمادی مورد تحقیق و تفحص واقع شده اند. مشکل اصلی در حوزه ی محاسبه ی داده ها در انواع گسترده ای از مطالعات مطرح شده است.
با ظهور حوزه ی مطالعاتی داده های بزرگ کاملا طبیعی است که مشکل محاسبه ی مکعب های داده را یکی از جالب ترین و موردتوجه ترین چالش های پیش روی جامعه ی علمی محققین داده تلقی کنیم. که باید حصول فناوریهای قدرتمند در اپلیکیشن ها و سیستم های بزرگ مقیاس در زندگی واقعی را نیز در این رابطه مدنظر قرار دهیم.
متاسفانه روشهای کنونی قابلیت های لازم جهت محاسبه ی مکعب های داده ی OLAP را ندارند که عمدتا به سبب دو مشخصه ی اصلی مخازن بزرگ داده است: 1) حجم، که در این نوع پایگاه های داده خیلی بالاست. 2) پیچیدگی(مدل های داده ی چندبعدی)، که در این نوع پایگاه های داده میتواند خیلی زیاد باشد.
در نتیجه برای طراحی مدل ها، تکنیک ها، الگوریتم ها و پایگاه های محاسباتی جدید جهت مدیریت مشکل محاسبه ی مکعب های داده ی OLAP در داده های بزرگ نیازی مبرم احساس میشود. ضرورت دارد که برای مطالعات آتی انبار داده ها و OLAP از هم اکنون آماده باشیم.
به همین سبب است که در این مقاله به مشکلات و سمت و سوی مطالعات کنونی در حوزه ی انبار داده ها و OLAP داده های بزرگ میپردازیم. تا افق های پژوهشی جدیدی را معرفی کنیم و بر رهیافت های امیدبخش آتی حاصل از این نوع تحقیقات اشاره ای داشته باشیم.
|
بخشی از مقاله انگلیسی |
ABSTRACT In this paper, we highlight open problems and actual research trends in the field of Data Warehousing and OLAP over Big Data, an emerging term in Data Warehousing and OLAP research. We also derive several novel research directions arising in this field, and put emphasis on possible contributions to be achieved by future research efforts. 1. INTRODUCTION A strong interest towards the term “Big Data” is arising in the literature actually (e.g., [12,17,18]). This term identifies specific kinds of data sets, manly of unstructured data, which populate the data layer of scientific computing applications (e.g., [21]). Data stored in the underlying layer of all these application scenarios have some specific characteristics in common, among which we recall [1]: (i) large-scale data, which refers to the size and the distribution of data repositories; (ii) scalability issues, which refers to the capabilities of applications running on large-scale, enormous data repositories (i.e., big data, for short) to scale over growing-in-size inputs rapidly; (iii) supporting advanced ExtractionTransformation-Loading (ETL) processes from low-level, raw data to somewhat structured information; (iv) designing and developing easy and interpretable analytics over big data repositories in order to derive intelligence and extract useful knowledge from them. Due to the intrinsic nature of Big Data application scenarios (e.g., [25]), it is natural to adopt Data Warehousing and OLAP methodologies [2] with the goal of collecting, extracting, transforming, loading, warehousing and OLAPing such kinds of datasets, by adding significant add-ons supporting analytics over Big Data (e.g., [11,1,21]), an emerging topic in Database and Data Warehousing research. Data Warehousing and OLAP are classical scientific fields which have been addressed since several decades by the Database and Data Warehousing research community. Symmetrically, the fundamental problem of computing OLAP data cubes has been contextualized in a wide family of types, ranging from classical relational data sets (e.g., [3]) to graph data sets (e.g., [4]), and from XML data (e.g., [5]) to novel social network data (e.g., [6]), and so forth. With the advent of the Big Data research context, it is natural to think of the problem of computing OLAP data cubes over Big Data as one of the top-interesting challenges in the research community, with also powerful technological achievements to be reached within the scope of real-life large-scale data-intensive applications and systems. Unfortunately, despite the clear convergence, state-of-the-art solutions are not capable to deal with computing OLAP data cubes over Big Data, mainly due to two intrinsic factors of Big Data repositories: (i) size, which becomes really explosive in such data sets; (ii) complexity (of multidimensional data models), which can be very high in such data sets (e.g., cardinality mappings, irregular hierarchies, dimensional attributes etc.). As a consequence, there emerge the forceful needs of designing novel models, techniques, algorithms and computational platforms for supporting the problem of computing OLAP data cubes over Big Data, which, indeed, literally represents an effective call to arms for next-generation Data Warehousing and OLAP research. Inspired by this main motivation, in this paper we highlight open problems and actual research trends in the field of Data Warehousing and OLAP over Big Data (Section 2), (2) derive several novel research directions arising in this field, and (3) put emphasis on possible contributions to be achieved by future research efforts. |