این مقاله انگلیسی ISI در نشریه BMC در ۱۰ صفحه در سال ۲۰۱۴ منتشر شده و ترجمه آن ۱۸ صفحه بوده و آماده دانلود رایگان می باشد.
دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word) |
عنوان فارسی مقاله: |
ابزاری از MATLAB برای غنی سازی مسیر با استفاده از امتیاز نظم مسیر مبتنی بر توپولوژی
|
عنوان انگلیسی مقاله: |
A MATLAB tool for pathway enrichment using a topology-based pathway regulation score
|
دانلود رایگان مقاله انگلیسی |
|
دانلود رایگان ترجمه با فرمت pdf |
|
دانلود رایگان ترجمه با فرمت ورد |
|
مشخصات مقاله انگلیسی و ترجمه فارسی |
فرمت مقاله انگلیسی |
pdf |
سال انتشار |
۲۰۱۴ |
تعداد صفحات مقاله انگلیسی |
۱۰ صفحه با فرمت pdf |
نوع مقاله |
ISI |
نوع نگارش |
مقاله پژوهشی (Research article) |
نوع ارائه مقاله |
ژورنال |
رشته های مرتبط با این مقاله |
پزشکی – زیست شناسی – مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله |
زیست پزشکی – انفورماتیک پزشکی – بیوانفورماتیک – ژنتیک – مهندسی نرم افزار |
چاپ شده در مجله (ژورنال)/کنفرانس |
بیوانفورماتیک – Bioinformatics |
کلمات کلیدی |
یکسان سازی زبان مدلسازی – گره مهم – توپولوژی مسیر – امتیاز مسیر – شرح مسیر |
کلمات کلیدی انگلیسی |
Unify Modelling Language – Significant Node – Pathway Topology – Pathway Score – Pathway Description |
ارائه شده از دانشگاه |
گروه محاسبات کاربردی، دانشگاه باکینگهام، باکینگهام، انگلستان |
نمایه (index) |
Scopus – Master Journal List – JCR – DOAJ – Medline |
شناسه شاپا یا ISSN |
۱۴۷۱-۲۱۰۵ |
شناسه دیجیتال – doi |
https://doi.org/10.1186/s12859-014-0358-2 |
لینک سایت مرجع |
https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-014-0358-2 |
رفرنس |
دارای رفرنس در داخل متن و انتهای مقاله ✓ |
نشریه |
|
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش |
۱۸ صفحه با فونت ۱۴ B Nazanin |
فرمت ترجمه مقاله |
pdf و ورد تایپ شده با قابلیت ویرایش |
وضعیت ترجمه |
انجام شده و آماده دانلود رایگان |
کیفیت ترجمه |
مبتدی (مناسب برای درک مفهوم کلی مطلب)
|
کد محصول |
F2119 |
بخشی از ترجمه |
نمایش مسیر
الگوریتم اساسی ما پیشازاین توصیه شد [۲۷]. بهطور خلاصه، دایره المعارف Kyoto تعاریف مسیر ژنها و ژنوم ها [۲۸] استفاده شد که در آن مسیرها در فرمت (KGML) زبان نشانهگذاری KEGG حفظشدهاند. مجموعاً ما ۱۸۹ توصیف علامتدهی و متابولیک از KEGG وارد کردیم و اینها را در موارد MATLAB تجزیهوتحلیل کردیم و سپس به گرافهای مستقیم تبدیل کردیم. پروندههای KGML شامل سه نوع مورد است: ورودیها، روابط و واکنشها. اینها میتوانند بهصورت موارد گرافیکی در نقشه مسیر مرتبط کشیده شود (پرونده اضافی ۱). تنها ورودیها (که متشکل از گرهها هستند و بهصورت جعبه نمایش داده میشوند) و روابط (که بهصورت مرز نمایش داده میشوند) در نمایش مسیرهای علامتگذاری که پروتئینها (جعبهها) با “روابط” پیوند دادهشدهاند، استفاده میشوند. تمام سه نوع در نمایش ساختار مسیرهای متابولیک برای گرفتن روابط لایه-آنزیم- محصول که در آن آنزیمها (جعبهها) با ” روابط” پیوند دارند و ترکیبات (دایرهها) با ” واکنشها” پیوند دارند استفاده میشوند. برای تبدیل یک مسیر متابولیک به یک گراف به روشی منطقی، ما آنزیمها را بهعنوان گرهها در گراف نشان دادیم، درحالیکه لایهها و محصولات برای شناسایی جهت روابط (مرزها) بین گرهها استفاده شدند (شکل ۲). درحالیکه اذعان کردیم که ممکن نیست تا هرگونه تأثیر بر روی شار را با این منطق پیشبینی کرد، استدلال کردیم که هرگونه تغییر در تظاهر گره در یک مسیر متابولیک میتواند فیزیولوژیکی باشد مخصوصاً اگر گرهها متصل باشند.
نمایش مسیرها بهصورت گراف با توجه به اینکه فراوانی را که ژنها تنها یکبار در هر گراف مسیر نشان دادند کاهش میدهد، دارای مزیت است. یک الگوریتم جستجوی عمق اول (DFS) ناشی از نظریه گراف برای تضمین اینکه حلقهها تنها یکبار شمرده میشوند به کار رفت.
امتیازدهی مسیر
روش ما اوزان را به تمام گرههای مهم (همان DEGs) در یک مسیر اختصاص داد تا نیروی توپولوژیکی آنها را نشان دهد (مخصوصاً تعداد گرههای مهم پاییندست که به آن یا بهصورت مستقیم یا از طریق دیگر گرههای مهم اشاره شد همانطور که پیشازاین توصیف شد [۲۷]). یک PRS بر مبنای ارزش تغییر کل و وزن دهی تمام گرههای مهم در مسیر و محاسبه شد و برای اندازه مسیر نرمال شد. همچنین ما یک امتیاز Z را نیز محاسبه کردیم [۲۹] (با بهبودی در اجراهای اولیه که در آن بعد از حذف ژنهای فراوان از توصیفات مسیر، این کار انجام شد). نرمافزار دو فهرست از مسیرهای رتبهبندی شده طبق PRS و امتیاز Z را به دست میدهد که هم به برای تحلیل بیشتر هم بهصورت فایل excel و هم بهصورت.mat ذخیره شدند.
ارزیابی اهمیت مسیر
سپس ما احتمال کسب امتیازاتی حداقل بهاندازه امتیاز PRS بهصورت اتفاقی و با استفاده از روش جایگشت غیر پارامتریک را ایجاد کردیم. در ابتدا، مقادیر تغییر کل برای تمام ژنهای ریزآرایه تغییر کرد. سپس این مقادیر به سمت مسیرها بازگشت و PRS دوباره محاسبه شد. این فرایند n بار تکرار شد که در آن n توسط مصرفکننده از طریق رابط ارائه شد (معمولاً n=1000). اهمیت آماری (مقدار p) هر امتیاز مسیر با مقایسه بین امتیاز مشاهدهشده و امتیازات ایجادشده رندم n برآورد شد. برای کسب ارزیابی اهمیت آماری قابلاعتمادتر، مقادیر p برای چندین تست اصلاحی توسط روش نرخ کشف خطا (FDR) بر اساس آستانه ارائهشده توسط مصرفکننده، تنظیم شدند. این مسئله بهصورت دقیقتر در گزارش اصلی ما توصیفشده است [۲۷].
تجسم مسیرهای غنیشده
بعد از انجام تحلیل، نتایج بهصورت فایلهایی با فرمت .mat برای بازیابی آسان ذخیره شدند. با کلیک کردن بر روی نام مسیر از فهرست مسیرهای رتبهبندی شده که در جدول ۱ نشان دادهشده است و انتخاب گزینه تجسم یک مسیر از رابط، یک نقشه مسیر علامتگذاری شده نشان داده خواهد شد. درواقع، نرمافزار یک خدمات وب نقشهکشی مسیر فرا خواهد خواند که بر روی وبسایت KEGG قرار دارد و تعدادی از پارامترها را منجمله فهرستی از ژنهای تظاهر با تغییرات کلی و رنگهای مشخص را عبور میدهد تا بین DEG ها با ژنهای غیر نهفته تفاوت قائل شود. شکل ۳ نشاندهنده یک نقشه مسیر معمولی است که در آن ژنهای مهم (بالای آستانه) به رنگ قرمز مشخصشدهاند و غیر مهمها (تغییر نکرده یا ظاهرنشده) به رنگ سبز.
UML برای مدلسازی و توصیف نرمافزار
در اینجا، ما از زبان مدلسازی یکپارچه (UML) استفاده کردیم تا ساختار و توابع روش خود را با نمودارها توصیف، مدلسازی و تجسم کنیم. ۱۴ نوع نمودار دستهبندیشده در سهطبقه در UML 2.0 وجود دارد [۳۰]، اگرچه، در این مقاله ما از دوتا استفاده کردیم: نمودارهای طبقه و توالی. نمودارهای طبقه ساختارهای ثابت یا موارد اصلی در نرمافزار را نشان میدهد. شکل ۴ نشاندهنده طبقههای اصلی در مرحله تحلیل مسیر است. تحلیل طبقه، طبقه اصلی است که رابطی برای اجرای تمام خدمات ارائهشده توسط ابزار ارائه میکند؛ و دارای چهار ویژگی اصلی است:
– مورد ریزآرایه: موردی از طبقه “مجموعه داده- ریزآرایه” که با فراخوانی اولیه تابع ریزآرایه () ایجاد میشود (فایل اضافی ۲ را ببینید)؛ و دادههای تظاهر ژنی نرمال شده را و فهرستی از تمام ژنها با مقادیر تغییر کلیشان را دارد.
– مورد KGML: موردی از طبقه “KGML_Parser” را با فراخوانی تابع ParseKGML(فایل اضافی ۳ را ببینید) ایجاد میکند؛ و ساختار پایای تماممسیرها را بهعنوان فهرستی از موارد طبقه “KGML-PATH” که با فرمت KGML تعریفشده است، داراست. یک مورد از “KGML_path” ساختار یک مسیر KEGG را نشان میدهد و متشکل از فهرست مطالب، فهرست واکنشها و فهرست روابط است (فایل اضافی ۱ را ببینید).
– فهرست مسیر: این فهرستی از موارد طبقه مسیر است که با فراخوانی تابع Createpathlistfromkegg() ایجاد میشود (فایل اضافی ۴ را ببینید). این مورد درنهایت فهرستی از مسیرهای غنیسازی شده با ارجاع به یک مجموعه داده ریزآرایه را داراست.
– مسیرهای رتبه دهی شده: این مورد با فراخوانی تابع rankpaths() ایجاد میشود؛ و دارای همان فهرست مسیرهای تعریفشده توسط Pathslist میباشد، اما بهصورت نزولی بر اساس مقادیر PRS رتبهبندی شدهاند.
نمودارهای توالی برای نشان دادن توابع ابزار PRS طبق انواع مختلف روابط درونی بین موارد استفادهشده است. بهعنوانمثال، شکل ۵ نمایشدهنده توابع PRS اصلی با گامهای زیر است:
۱٫ تبدیل مسیرها به گراف توسط تابع convertpath2graph که نیاز به استفاده از مورد KGML دارد و دارای فهرستی از مطالب، روابط و واکنشهای تماممسیرهاست.
۲٫ با استفاده از اطلاعات ذخیرهشده در مورد KGML و pathlist برای هر گراف (شکل ۴ را ببینید)، فهرستی از گرهها (که هر گره نشاندهنده یک یا چند ژن از مسیر اصلی است) و فهرستی از کودکان برای هر گره ایجاد میشود.
۳٫ حذف ژنهای فراوان که ممکن است بارها در همان مسیر نشان دادهشده باشد. دو تابع برای رسیدگی به فراوانی گره طراحیشده است: checknoderedundancy() و handlenoderedundancy().
۴٫ بعد از ایجاد یک گراف برای هر مسیر، گرافها با فراخوانی تابع createwightedgraphs() وزن دهی میشود که از الگوریتم DFS برای عبور دادن گرههای هر گراف و اختصاص یک وزن برای هر گره مهم با در نظر گرفتن حلقههای گراف استفاده میکند.
۵٫ امتیاز نظم مسیر (PRS) به هر گراف وزن دهی شده با استفاده از اوزان گرههای مهم در گراف و دیگر پارامترها اختصاص مییابد.
ما تمام این طبقهها، توابع و الگوریتم DFS را با استفاده از MATLAB R2010a اجرا کردیم.
|