این مقاله انگلیسی در نشریه اسپرینگر در 18 صفحه در سال 2017 منتشر شده و ترجمه آن 25 صفحه بوده و آماده دانلود رایگان می باشد.
دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word) |
عنوان فارسی مقاله: |
تجزیه و تحلیل داده های بزرگ: برنامه های کاربردی، چشم اندازها و چالش ها
|
عنوان انگلیسی مقاله: |
Big Data Analytics: Applications, Prospects and Challenges
|
دانلود رایگان مقاله انگلیسی |
|
دانلود رایگان ترجمه با فرمت pdf |
|
دانلود رایگان ترجمه با فرمت ورد |
|
مشخصات مقاله انگلیسی و ترجمه فارسی |
فرمت مقاله انگلیسی |
pdf |
سال انتشار |
2017 |
تعداد صفحات مقاله انگلیسی |
18 صفحه با فرمت pdf |
نوع نگارش |
|
نوع ارائه مقاله |
ژورنال |
رشته های مرتبط با این مقاله |
مهندسی فناوری اطلاعات – مهندسی کامپیوتر – مدیریت |
گرایش های مرتبط با این مقاله |
اینترنت و شبکه های گسترده – علوم داده – مدیریت فناوری اطلاعات – مدیریت دانش |
چاپ شده در مجله (ژورنال)/کنفرانس |
داده های بزرگ موبایل |
کلمات کلیدی |
دادههای بزرگ – تجزیهوتحلیل دادههای بزرگ – عملکرد – شرکت مدیریت دانش – اینترنت اشیا (IoT) |
کلمات کلیدی انگلیسی |
Big data – Big data analytics – Performance – Enterprises Knowledge management – Internet of things (IoT) |
ارائه شده از دانشگاه |
گروه اقتصاد، دانشگاه کرت، پردیس گالوس |
شناسه دیجیتال – doi |
https://doi.org/10.1007/978-3-319-67925-9_1 |
لینک سایت مرجع |
https://link.springer.com/chapter/10.1007/978-3-319-67925-9_1 |
رفرنس |
دارای رفرنس در داخل متن و انتهای مقاله ✓ |
نشریه |
اسپرینگر – Springer |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش |
25 صفحه با فونت 14 B Nazanin |
فرمت ترجمه مقاله |
pdf و ورد تایپ شده با قابلیت ویرایش |
وضعیت ترجمه |
انجام شده و آماده دانلود رایگان |
کیفیت ترجمه |
مبتدی (مناسب برای درک مفهوم کلی مطلب)
|
کد محصول |
F2359 |
بخشی از ترجمه |
دادههای بزرگ را میتوان با هفت V مشخص کرد: حجم، تنوع، صحت، سرعت، متغیر، تجسم و ارزش.
حجم (Volume) بهاندازهی بزرگ مجموعه دادهها اشاره دارد. اینیک واقعیت است که اینترنت اشیا (IoT) از طریق توسعه و افزایش گوشیهای هوشمند، حسگرها و سایر دستگاههای متصل شده به همراه فناوری اطلاعات و ارتباطات سریع (ICT) ازجمله هوش مصنوعی (AI)، به نسل فوقالعادهای از دادهها (شمارش رکوردها، معاملات، جداول، فایلها و غیره) کمک کردهاند. سرعت دادهها فراتر از قانون مور است و حجم تولید دادهها اقدامات جدیدی را برای ذخیرهسازی دادهها به وجود آورده است، بهعنوانمثال exabytes، zettabytes و yottabytes.
تنوع (Variety) نشاندهنده تنوع در حال افزایش منابع دادهها و فرمتهای داده است. وب 3.0 منجر به رشد شبکههای وب و شبکههای اجتماعی میشود که منجر به تولید نسل جدیدی از دادههای متفاوت میشود. مانند پیامها، بهروزرسانیها، عکسها و فیلمهایی که در شبکههای رسانههای اجتماعی مانند فیسبوک یا توییتر ارسال میشوند، اس ام اس، سیگنالهای GPS از گوشیهای هوشمند، معاملات مشتری در بانکداری، کسبوکار الکترونیکی و خردهفروشی، دادههای صوتی در مراکز تماس و غیره. خیلی از منابع حیاتی دادههای بزرگ ، نسبتاً نو و جدید هستند، ازجمله دستگاههای تلفن همراه که جریانهایی گسترده از دادههایی که با رفتار انسانی از طریق فعالیتها و مکانهایشان مرتبط است، را تولید میکنند؛ یا منابع اینترنتی که از طریق ثبت دامنه، جریان کلیک و اقدامات رسانههای اجتماعی، دادههایی را تولید میکنند. علاوه بر این، دادههای بزرگ همچنین در انواع دادهای که تولید میشوند، متفاوت است. بنابراین دادههای بزرگ ، از دادههای ساختاریافته (جداول، پروندهها)، دادههای بدون ساختار (متن و صدا)، دادههای نیمه ساختاریافته (XML، RSS feeds) و سایر دادههایی مانند دادههای حاصل از صوتی، ویدئو و سایر لوازم که طبقهبندیشان دشوار است، تشکیل میشود.
اغلب متغیر بودن (Variability) را با انواع مختلف (تنوع) اشتباه میگیرند، اما تغییرات با تغییر سریع معنا مرتبط است. بهعنوانمثال، کلمات در یک متن میتوانند با توجه به زمینهی اطلاعاتی متن، معنای متفاوتی داشته باشند، بنابراین برای تجزیهوتحلیل مفهومی دقیق ، لازم است الگوریتمها و چارچوبها معنی (احساس) یک کلمه را با توجه به کل متن و زمینهای که در آن بهکاربرده شده است، پیدا کنند.
سرعت (Velocity) دادههای بزرگ با سرعت بالای تولید دادهها مشخص میشود. دادههایی که توسط دستگاههای متصل و وب تولیدشدهاند به شرکتها در زمان واقعی میرسند. این سرعت برای شرکتها در انجام اقدامات مختلف که آنها را در برابر رقبا قادر به به دست آوردن مزیت رقابتی و سرعت و چابکی بیشتر میکند، بسیار بااهمیت است. باوجوداین واقعیت که برخی از شرکتها در حال حاضر دادههای بزرگ (دادههای جریانهای کلیک) را برای پیشنهاد دادن به مشتریان توصیههای خود ، ارائه کردهاند، شرکتهای امروزه، حتی تحلیلکنندههای های دادههای بزرگ، توانایی تجزیهوتحلیل و درک اقدامات گرفتن اطلاعات را در زمان واقعی دارند.
صحت (Veraciy) دادهها به اعتبار و دقت دادهها اشاره دارد. مجموعهی دادهها دارای دادههایی است که تمیز و دقیق نیستند، بنابراین اعتبار و صحت دادهها به عدم قطعیت داده و سطح اطمینان مربوط به برخی از انواع دادهها اشاره میکند.
تجسم (Visualization) . تجسم داده یا مصور کردن دادهها ،علم تجسم بصری دادهها و اطلاعات است.این ویژگی اطلاعات کمی و کیفی را در برخی از اشکال تصویری مانند الگوها، روند، ناهنجاری، پایداری و تنوع که در فرمهای دیگری مانند متن و جداول قابل ارائه نیستند، نمایش میدهد. [9].
نیرو و قدرت دادههای بزرگ میتواند دانش ارزشمندی را ارائه دهد و بنابراین ارزش ارائه شده توسط فرایند تجزیهوتحلیل دادهها میتواند به نفع شرکتها، سازمانها، جامعه و مصرف کنندگان باشد.
بنگاههایی که بر چالشها غلبه میکنند و دادههای بزرگ را به کار میگیرند، اطلاعات دقیقتری دارند و میتوانند دانش جدیدی را ایجاد کنند تا به وسیله ی آن بتوانند استراتژی و عملیات تجاری خود را در مورد اهداف مشخص مانند بهرهوری، عملکرد مالی و ارزش بازار بهبود بخشند. درحالیکه دادههای بزرگ نقش مهمی در تحول دیجیتالی شرکتهای نوآورانه ایفا میکند. در نتیجه، افزایش علاقه به بهرهبرداری از اطلاعات بزرگ در میان نهادها و سازمانها وجود دارد (شکل 2).
مزایای اقتصادی دادههای بزرگ در کسبوکارهای خصوصی و دولتی در بریتانیا از 25.1 میلیارد پوند در سال 2011 به 216 میلیارد پوند در سال 2017 افزایش خواهد یافت [11]. دادههای بزرگ میتوانند در راههای مختلف در شرکتها ارزش بیشتری به دست آورند و قادر به افزایش تولید و رقابت پذیری شرکتها هستند. دادههای بزرگ به رشد مداوم دادهها و فن آوری هایی که برای جمعآوری، ذخیرهسازی، مدیریت و تحلیل دادهها ضروری است، اشاره میکند. شیوه تفکر در مورد کسبوکار با دادههای بزرگ تغییر کرده است، زیرا عناصر اصلی سازمانها و نهتنها مدیریت را تغییر میدهد. دادههای بزرگ میتوانند یک منبع کلیدی برای کسب دانش جدید، ارزش افزوده و پرورش محصولات، فرایندها و بازارهای جدید باشند، بنابراین دادهها بهعنوان دارایی مدیران شرکتها نشان داده شده و نشاندهنده اهمیت رویکرد دادهها در شرکتها است [12] . شرکتها اطلاعات را سالها جمعآوری میکنند، اما امروزه بیشتر و بیشتر شرکتها در حال تجزیهوتحلیل دادهها به جای نگه داشتن آنها هستند. ازاینرو، شرکتهای داده محور در شرایط مالی و عملیاتی بهتر عمل میکنند، 5٪ تولیدی تر و 6٪ سودآورتر از شرکتهای غیر دادههای محور هستند، و برتری رقابتی بهتری نسبت به رقبای خود به دست میآورند [13].
1.2 تجزیهوتحلیل داده بزرگ
تجزیهوتحلیل مجموعه دادههای بزرگ در شرکتها، اصطلاح تجزیهوتحلیل دادههای بزرگ با دانش دادهها، هوش کسبوکار و تجزیهوتحلیل کسبوکار مرتبط است. علم دادهها بهعنوان مجموعهای از اصول اساسی تعریف میشود که اطلاعات و دانش را از اطلاعات به دست می آورد [4]. در طی سالهای گذشته، رویکردهای داده محور نظیر هوش کسبوکار (BI) و تجزیهوتحلیل کسبوکار برای شرکتها عاملی ضروری است. BI بهعنوان روش ها، سیستم ها و برنامههای کاربردی برای جمعآوری، تهیه و تحلیل دادهها برای ارائه اطلاعات به تصمیم گیرندگان تعریف میشود. به عبارت دیگر، سیستمهای BI سیستمهای تصمیمگیری مبتنی بر دادهها هستند [14]، درحالیکه تجارت تجزیهوتحلیل تکنیکها، فن آوری ها، سیستم ها و برنامههای کاربردی است برای تجزیهوتحلیل دادههای حیاتی کسبوکار برای حمایت از آنها برای درک محیط کسبوکار خود و کسبوکار تصمیمگیری در زمان. قدرت تجزیهوتحلیل کسبوکار بهمنظور ساده کردن حجم گسترده دادهها برای افزایش ارزش آن، درحالیکه BI عمدتا بر دادههای تاریخی در نمودار ها و گزارش های جدول دادهها بهعنوان راهی برای ارائه پاسخ به پرسشنامه ها بدون بهینه سازی دادهها و افزایش ارزش آن تمرکز میکند.
تجزیهوتحلیل کسبوکار جهت معرفی عنصر تحلیلی اصلی در BI در اواخر 2000 آغاز شد. پس از آن، شرایط دادههای بزرگ و تجزیهوتحلیل دادههای بزرگ مورداستفاده قرار گرفته است برای توصیف تکنیکهای تجزیهوتحلیل برای مجموعه دادههایی که بسیار بزرگ و پیچیده اند، نیاز به ذخیرهسازی پیشرفته دادهها، مدیریت، تجزیهوتحلیل و تکنیکهای تجسم است. در این محیط به سرعت در حال رشد، سرعت دادهها تبدیل دادهها به دانش ارزشمند را به سرعت ضروری می سازد. تفاوت بین تجزیهوتحلیلهای معمولی و تجزیهوتحلیل سریع با دادههای بزرگ در مشخصات تجزیهوتحلیل (نوع، هدف و روش)، ویژگیهای داده (نوع، سن / جریان، حجم) و هدف اولیه است(جدول 1) [15، 16].
توسعه اینترنت و سپس اتصال وب به افزایش حجم و سرعت دادهها کمک کرده است. از اوایل 2000، فناوریهای اینترنتی و وب برای جمعآوری و تجزیهوتحلیل دادههای منحصربهفرد ارائه شده است. سیستمهای وب 1.0 شرکتها را قادر به ایجاد حضور وب میکنند و محصولات / خدمات خود را به صورت آنلاین در ارتباط با مشتریان خود ارائه می دهند. سیستمهای وب 2.0، ازجمله معرفی شبکههای اجتماعی مانند فیسیوک، اطلاعات بیشتری را در مورد شرکتها، محصولات و مشتریان ارائه می دهند. روند در حال افزایش دستگاههای تلفن همراه در برابر تعدادی از رایانه های عصر جدید، تجزیهوتحلیل کسبوکار را آغاز کرد، ازجمله تجزیهوتحلیل محتوای تولیدشده توسط کاربر توسط کانال های رسانههای اجتماعی. دستگاههای موبایل توانایی ترویج برای مثال پردازشها و معاملات بسیار متحرک، محل آگاه و متمرکز شده را داراست. بنابراین، تصمیمگیری مبتنی بر دادهها بر روی دادههای حاصل از همه منابع شرکتها است، درحالیکه پیش بینی ها و یادگیری ماشین بر اساس دادههای سنتی و منابع نوین جدید مانند IoT و AI است.
تجزیهوتحلیل دادهها فرایند بازرسی، تمیز کردن، تبدیل و مدل سازی دادهها به دست آوردن اطلاعات مفید برای پیشنهادات و پشتیبانی در تصمیمگیری است. این جنبه ها و رویکردهای متعدد شامل تکنیکهای متنوع تحت نام های مختلف در طرح های مختلف کسبوکار، علم و علوم اجتماعی است، درحالیکه “تحلیل دادههای بزرگ” اشاره به تکنیکهای پیشرفته تحلیلی، با توجه به انواع مختلفی از مجموعه دادهها برای بررسی و استخراج دانش از دادههای بزرگ، متشکل از فرآیند فرعی در به دست آوردن بینش از فرآیند داده بزرگ است. با استفاده از فناوری پیشرفته، Big Data Analytics (BDA) شامل مدیریت دادهها، برنامه نویسی منبع باز مانند Hadoop، تجزیهوتحلیل آماری مانند احساسات و مقیاس زمانی، ابزارهای ویژوال است که به ساختار و اتصال دادهها کمک میکند تا الگوهای پنهان، ارتباطات ناشناخته و بینشهای عملی دیگر.
روند BDA یک منبع برای تصمیمگیریهای استراتژیک است که منجر به بهبود قابل ملاحظه ای در عملکرد عملیات، جریان درآمد جدید و رقابت پذیری نسبت به رقبا میشود. در این زمینه، روند به دست آوردن بینش از دادههای بزرگ را میتوان به دو مرحله تقسیم کرد: مدیریت دادهها و تجزیهوتحلیل دادهها. مدیریت دادهها با فرایندها و فن آوری های مربوط به تولید، ذخیرهسازی، استخراج و آماده سازی برای تجزیهوتحلیل دادهها مرتبط است، درحالیکه تجزیهوتحلیل دادهها به روش ها و تکنیکهای تحلیل و تفسیر بینش از دادههای بزرگ اشاره میکند [17] (شکل3)
|