دانلود ترجمه مقاله کاربرد حداقل مربعات غیر منفی موازی کارآمد در معماری چند هسته ای – مجله CiteSeerX

دانلود ترجمه مقاله کاربرد حداقل مربعات غیر منفی موازی کارآمد در معماری چند هسته ای – مجله CiteSeerX

 

 عنوان فارسی مقاله: کاربرد حداقل مربعات غیر منفی موازی کارآمد در معماری چند هسته ای
 عنوان انگلیسی مقاله: EFFICIENT PARALLEL NON-NEGATIVE LEAST SQUARES ON MULTI-CORE ARCHITECTURES
دانلود مقاله انگلیسی: برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید

 

سال انتشار  ۲۰۱۱
تعداد صفحات مقاله انگلیسی  ۱۶ صفحه
تعداد صفحات ترجمه مقاله  ۳۴ صفحه
مجله  محاسبات علمی
دانشگاه  ماری لند
کلمات کلیدی  حداقل مربعات غیر منفی، مجموعه فعال، به روزرسانی QR ، موازات و برابری، چند هسته ای، GPU ، از حالت پیچشی درآوردن
نشریه CiteSeerX CiteSeerX

 


فهرست مطالب:

 

چکیده
۱ مقدمه
۱ ۱ حداقل مربعات غیر منفی
۲ ۱ بررسی الگوریتم های NNLS
۲ روش مجموعه فعال
۳ الگوریتم پیشنهاد شده
۱ ۳ به روزرسانی QR
۲ ۳ به روزرسانی آلترناتیو QR با چرخش
۴ ۳ تنزل رتبه QR با چرخش
۴ معماریهای CPU چند هسته ای
۱ ۴ اجرای CPU
۵ معماریهای GPU
۱ ۵ اجرای GPU
۲ ۵ موازی سازی روشهای QR
۳ ۵ مصرف حافظه
۶ کاربرد
۷ آزمایشات
۱ ۷ داده های تست غیر مصنوعی
۲ ۷ داده های تست مصنوعی
۸ ملاحظات پایانی

 


 

بخشی از ترجمه:

 

 معماریهای GPU

پیشرفتهای اخیر در واحدهای پردازش گرافیکی همه منظوره (GPU) ، به معماریهای قابل برنامه نویسی انجامیده است که با کاربردهای موازی در ذهن طراحی شده اند. به علاوه GPU ها نمونه ای از نسل های آتی  پردازنده های چند هسته ای، چند رشته ای و موازی با قدرت اسب بخار محاسباتی بسیار عظیم در نظر گرفته شده اند. آنها مناسب الگوریتم هایی هستند که با معماری  SIMT طرح و نگاشت می شوند. بنابراین، GPU در هنگام اجرای این عملیات ها در میان رشته های متعدد برروی چند پردازنده، به شدت حسابی بالایی دست می یابد ( نسبت عملیات حسابی به عملیات های حافظه).
GPU ها اغلب به صورت مجموعه مولتی یا چند پردازنده هایی طراحی شده اند که هر یک حاوی مجموعه کوچکتری از پردازنده های اسکالر (SP) با معماری SIMD می باشند. چند رشته ای سخت افزار تحت معماری SIMT رشته های متعدد را برروی یک SP نگاشت می کند. یک SP آدرس دستور را جابجا و حالات رشته های متعدد را رجیستر یا ثبت می کند به گونه ای که آنها می توانند به صورت مستقل اجرا شوند. واحد SIMT چندپردازنده دسته های رشته ها را به منظور اجرای یک دستور مشترک، زمان بندی می کند. اگر رشته های دسته از طریق شاخه شرطی وابسته به داده ها واگرا شوند، آنگاه تا زمان همگرایی به سمت مسیر اجرا، کلیه رشته های واقع در امتداد دسته های جداگانه به صورت سریالی و پیاپی قرار می گیرند.

 ۸٫ ملاحظات پایانی
 در این مقاله یک روش کارآمد برای حل زیرمسائل حداقل مربعات در الگوریتم مجموعه فعال مطرح کرده ایم. در اینجا نشان داده ایم که ازتجزیه های قبلی QR می توان برای به روزرسانی و حل زیرمسائل حداقل مربعات مشابه استفاده نمود. به علاوه، مرتب سازی مجدد متغیرها در مجموعه غیر فعال محاسبات کمتری در مرحله به روزرسانی حاصل نمود. این امر منجر به تسریع قابل توجه و اساسی نسبت به روشهای موجود در اجراهای GPU و CPU گردید. روی کاربردها برای نگاشت و نقشه برداری از زمین مبتنی بر ماهواره (نقشه برداری ماهواره ای) و پردازش سیگنال آرایه میکروفون کار شده است. 


بخشی از مقاله انگلیسی:

 

۵٫ GPU Architectures.

Recent advances in general purpose graphics processing units (GPUs) have given rise to highly programmable architectures designed with parallel applications in mind. Moreover, GPUs are considered to be typical of future generations of highly parallel, multi-threaded, multi-core processors with tremendous computational horsepower. They are well-suited for algorithms that map to a SingleInstruction-Multiple-Thread (SIMT) architecture. Hence, GPUs achieve a high arithmetic intensity (ratio of arithmetic operation to memory operations) when performing the same operations across multiple threads on a multi-processor.

GPUs are often designed as a set of multiprocessors, each containing a smaller set of scalar-processors (SP) with a Single-Instruction-Multiple-Data (SIMD) architecture. Hardware multi-threading under a SIMT architecture maps multiple threads to a single SP. A single SP handles the instruction address and register states of multiple threads so that they may execute independently. The multiprocessor’s SIMT unit schedules batches of threads to execute a common instruction. If threads of the same batch diverge via a data-dependent conditional branch, then all the threads along the separate branches are serialized until they converge back to the same execution path.

۸٫ Concluding Remarks.

In this paper, we have presented an efficient procedure for solving least squares sub-problems in the active-set algorithm. We have shown that prior QR decompositions may be used to update and solve similar least squares sub-problems. Furthermore, a reordering of variables in the passive-set yielded fewer computations in the update step. This has lead to substantial speed-ups over existing methods in both the GPU and CPU implementations. Applications to satellite based terrain mapping and in microphone array signal processing are being worked on.

 


 عنوان فارسی مقاله: کاربرد حداقل مربعات غیر منفی موازی کارآمد در معماری چند هسته ای
 عنوان انگلیسی مقاله: EFFICIENT PARALLEL NON-NEGATIVE LEAST SQUARES ON MULTI-CORE ARCHITECTURES

 

دانلود رایگان مقاله انگلیسی

 

خرید ترجمه فارسی مقاله با فرمت ورد

 

خرید نسخه پاورپوینت این مقاله جهت ارائه

برچسب ها

ثبت دیدگاه