عنوان فارسی مقاله: | مشکلات ، روش ها و چالش های فرایند پاکسازی کامل داده |
عنوان انگلیسی مقاله: | Problems, Methods, and Challenges in Comprehensive Data Cleansing |
دانلود مقاله انگلیسی: | برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید |
سال انتشار | 2014 |
تعداد صفحات مقاله انگلیسی | 23 صفحه |
تعداد صفحات ترجمه مقاله | 34 صفحه |
مجله | پزشکی مراقبت بحرانی |
دانشگاه | ماری لند |
کلمات کلیدی | – |
نشریه | Hindawi |
فهرست مطالب:
چکیده
۱ مقدمه
۲ انگیزه
۳ خطاهای داده
۱ ۳ مدل داده
۲ ۳ طبقه بندی خطاهای داده
۱ ۲ ۳ خطاهای نحوی
۲ ۲ ۳ خطاهای معنایی
۳ ۲ ۳ خطاهای پوششی
۴ پاکسازی و کیفیت داده
۱ ۴ کیفیت داده
۲ ۴ معیارهای کیفی
۵ رویکرد فرایند در مورد پاکسازی داده
۱ ۵ حسابرسی داده
۲ ۵ مشخصات جریان گردش کار
۳ ۵ اجرای جریان کار
۴ ۵ عملیات پس پردازش و کنترل
۶ روشهای به کار رفته برای پاکسازی داده
۱ ۶ تجزیه
۳ ۶ اجرای محدودیت یکپارچگی
۴ ۶ حذف نسخه کپی
۵ ۶ روشهای آماری
۷ شیوه های فعلی پاکسازی داده
۱ ۷ AJAX
۲ ۷ FraQL
۳ ۷ Potter’s Wheel
۴ ۷ ARKTOS
۵ ۷ IntelliClean
۶ ۷ مقایسه
۸ چالش ها و مسائل باز
۱ ۸ تصحیح خطا و حل تعارض
۳ ۸ پاکسازی داده در محیط های مجازی یکپارچه
۴ ۸ چارچوب پاکسازی داده
۹ نتیجه گیری
بخشی از ترجمه:
مقدمه
کاربرد و بهره برداری از داده های زیاد در اقتصاد ، دولت و تحقیقات مدرن نقش زیادی ایفا می کند. خطاهای رخ داده در داده باعث تکرار و عدم سودمندی موثر و در نهایت ناتوان شدن فرایند با عملکرد بالا و تائید نتایج به دست آمده به روش تفسیر و تحلیل داده می گردد.
این وضعیت منجر به بالا رفتن هزینه و فایده کمتر پردازش داده شده و در نهایت از نظر مصرف کننده برنامه کاربردی بی ارزش می شود. در بخش (Engoo) مسائل و مشکلات متعدد ناشی از خطاهای داده لیست شده است که از این جمله می توان به داده های نادرست در مورد قیمت در پایگاه های داده خرده فروشی می گردد. هزینه مصرف آمریکائیان سالانه ۵٫ ۲ بیلیون دلار می باشد. در این محیط، ظرف چند سال فرایند پاکسازی داده توجه خاصی را به خود معطوف کرده است. در این جا بر داده های فاقد خطا و توانایی آرایش آن بر حسب نیازها تکیه می کنیم. این آرایش در برگیرنده یکپارچگی کارآمد، کاربرد، تفسیر و تحلیل داده ها برای حمایت از فرایندهای تجاری، وظایف اجرایی، تصمیم گیری و استدلال علمی می باشد. وجود خطا در داده های واقعی امری معلوم و مشخص می باشد. در بخش (Orr98,Red98( ، نرخ نمونه آنها ۵% برآورد شده است. این امر منجر به توسعه طیف وسیعی از روش ها با هدف شناسایی و حذف آنها در داده های موجود می گردد. در اینجا تمام این موارد را تحت عنوان پاکسازی داده طبقه بندی می کنیم. از دیگر اسامی پاکسازی می توان به تنظیف، حذف و تطبیق اشاره کرد.
در بخش های مختلف پردازش و نگهداری داده، فرایند پاکسازی داده کاربرد دارد. هدف اصلی پاکسازی داده کاهش و حذف نسخه های کپی در مجموعه داده بود، مسئله ای که قبلاً در برنامه های کاربردی پایگاه داده رخ داده و زمانی بدتر می شود که داده های منابع مختلف با هم تلفیق می شوند. بنابراین، پاکسازی داده به عنوان بخش اصلی فرایندیکپارچگی داده در نظر گرفته شد. علاوه بر حذف نسخه ها کپی، در فرایند یکپارچگی داده ها به شکل مورد نظر برنامه کاربردی مربوطه تبدیل شده و محدودیت های وابسته به حوزه داده ها اجرا می گردد. معمولاً فرایند پاکسازی داده بدون دخالت متخصص رشته میسر نمی باشد، زیرا خطایابی و تصحیح آن نیازمند دانش حوزه می باشد. بنابراین فرایند پاکسازی داده، فرایندی نیمه خودکار است اما به خاطر مقدار زیاد داده های پردازش شده و به خاطر مدت زمان مورد نیاز برای پاکسازی داده ها به روش دستی و توسط متخصص، در صورت امکان به صورت خودکار باید انجام شود.
9. نتیجه گیری
فرایند پاکسازی داده در بخشهای مختلف تلفیق داده و فرایند مدیریت کاربرد دارد. پاکسازی به توالی عملیات های انجام شده با هدف بهبود کیفیت کلی داده های مجموعه های داده اتلاق می شود. روش پاکسازی داده به خاطر وابستگی به حوزه و اکتشافی بودن آن، به طور تقریبی توصیف شده است، شیوه های فعلی پاکسازی داده عمدتاً بر تبدیل داده ها و حذف نسخه های کپی تاکید می کنند. بعضی از شیوه ها قابلیت توصیف جامع مشخصات اخباری فرایندهای پاکسازی را دارا هستند ، در عین حال توصیف جزئیات اجرای عملیات پاکسازی بر عهده کاربر می باشد. با این اوصاف هنوز مسائل و چالش زیادی در زمینه پاکسازی داده همچنان وجود دارد. این قبیل مسائل عمدتاً با مدیریت مقادیر راهبردی متعدد، مدیریت و ثبت عملیات های پاکسازی داده و تبار پاکسازی و توصیف مشخصات و توسعه یک چارچوب مناسب برای حمایت از فرایند پاکسازی داده سرو کار دارند.
بخشی از مقاله انگلیسی:
Introduction
Since the introduction of closed chest compressions in 1960[1], cardiopulmonary resuscitation has become the standardintervention in CPA. The ensuing five decades have seenmany advances in resuscitation techniques, including thedevelopment of Advanced Cardiac Life Support (ACLS)procedures and comprehensive postarrest care [2]. However,the survival-to-discharge rates of 15–20% are little changed,and survival with good quality of life is rare [3–13].Given the low success rate and high cost of in-hospitalACLS, an accurate understanding of predictors of survivalfrom CPA could improve decision making for patients, families,healthcare providers, and healthcare payers when consideringthe appropriate application of resuscitation efforts.Factors previously shown to predict poor CPA outcomes,although with variable strength, consistency, and patientpopulations [14], include: CPA during off-hours [13, 15–17],longer duration of CPR [18], delayed initiation of CPR/defibrillation [17–19], comorbidities [6, 9, 12, 18, 20–25],unwitnessed (versus witnessed) arrest [9, 13, 23], primarycardiac (versus primary respiratory) arrest [9, 13, 25], pulselesselectrical activity (PEA) or asystole (versus ventriculartachycardia (VT) or ventricularfibrillation (VF)) [9, 13, 16, 20,25, 26], African-American race [27], increased age [9, 16, 18,20, 23, 24, 28–30], and decreasedBMI [25, 31]. There are somedata to suggest that hospital bed typemay influence outcomes[9, 12].There has been increased use of the National Registryof Cardiopulmonary Resuscitation (NRCPR) to report outcomesand assess risk factors from a far larger and morediverse patient population that can be done in smaller studies [15, 27, 32–34]. We were interested in determining whetherfactors influencing CPA outcomes were similar in our largeurban academic medical center, which features experiencedintensivists managing patients during and immediately afterarrest. We present a retrospective review of all resuscitationattempts at the UMMC from 2000 to 2005, examiningpatient demographics, arrest characteristics, comorbidities,unit and service type, and witnessed status on survival.Wehypothesized that there would be important differences inoutcomes and risk factors from our institution, with its differentpatient populations and CPA/post-CPA management,from those in the broad-based medical literature. Any significantdifferences could be critically important in decisionmaking regarding resuscitation attempts at institutionswhosepatient population differs fromthose in the aggregateNRCPRdatabase.2. MethodsThis study was approved by the UMMC IRB as H-0023774.2.1. Study Population. All patients over 18 years of age whounderwent CPAbetween the years 2000 and 2005 in any locationin the UMMC, including the emergency room, unmonitoredfloor units, telemetry units, ICUs, the dialysis unit, andthe radiology suite, were included in the study. Patients wereexcluded if their arrest occurred while being in transit to thehospital or prior to arrival to the emergency room.
عنوان فارسی مقاله: | مشکلات ، روش ها و چالش های فرایند پاکسازی کامل داده |
عنوان انگلیسی مقاله: | Problems, Methods, and Challenges in Comprehensive Data Cleansing |
خرید ترجمه فارسی مقاله با فرمت ورد