این مقاله انگلیسی ISI در نشریه ساینس دایرکت (الزویر) در 8 صفحه در سال 2018 منتشر شده و ترجمه آن 20 صفحه میباشد. کیفیت ترجمه این مقاله ویژه – طلایی ⭐️⭐️⭐️ بوده و به صورت کامل ترجمه شده است.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی | |
عنوان فارسی مقاله: |
ساخت سلسله مراتب و طبقه بندی متن بر اساس استراتژی آزاد سازی و مدل حداقل اطلاعات |
عنوان انگلیسی مقاله: |
Hierarchy construction and text classification based on the relaxation strategy and least information model |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2018 |
تعداد صفحات مقاله انگلیسی | 8 صفحه با فرمت pdf |
نوع مقاله | ISI |
نوع نگارش | مقاله پژوهشی (Research Article) |
نوع ارائه مقاله | ژورنال |
رشته های مرتبط با این مقاله | مهندسی فناوری اطلاعات |
گرایش های مرتبط با این مقاله | مدیریت سیستم های اطلاعات |
چاپ شده در مجله (ژورنال) | سیستم های خبره با کاربردهای آن – Expert Systems With Applications |
کلمات کلیدی | دسته بندی سلسله مراتب، استراتژی آزاد سازی، نظریه حداقل اطلاعات، وزن دهی واژه |
کلمات کلیدی انگلیسی | Hierarchy classification – Relaxation strategy – Least Information Theory – Term weighting |
ارائه شده از دانشگاه | دانشکده فناوری اطلاعات ، دانشگاه صنعتی پکن ، چین |
نمایه (index) | Scopus – Master journals – JCR |
نویسندگان | Yongping Du، Jingxuan Liu، Weimao Ke، Xuemei Gong |
شناسه شاپا یا ISSN | ISSN 0957-4174 |
شناسه دیجیتال – doi | https://doi.org/10.1016/j.eswa.2018.02.003 |
ایمپکت فاکتور(IF) مجله | 5.891 در سال 2018 |
شاخص H_index مجله | 162 در سال 2019 |
شاخص SJR مجله | 1.190 در سال 2018 |
شاخص Q یا Quartile (چارک) | Q1 در سال 2018 |
بیس | نیست ☓ |
مدل مفهومی | ندارد ☓ |
پرسشنامه | ندارد ☓ |
متغیر | دارد ✓ |
رفرنس | دارای رفرنس در داخل متن و انتهای مقاله ✓ |
کد محصول | 10089 |
لینک مقاله در سایت مرجع | لینک این مقاله در نشریه Elsevier |
نشریه الزویر |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
وضعیت ترجمه | انجام شده و آماده دانلود در فایل ورد و PDF |
کیفیت ترجمه | ویژه – طلایی ⭐️⭐️⭐️ |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش | 20 صفحه با فونت 14 B Nazanin |
ترجمه عناوین تصاویر و جداول | ترجمه شده است ✓ |
ترجمه متون داخل تصاویر | ترجمه شده است ✓ |
ترجمه متون داخل جداول | ترجمه شده است ✓ |
درج تصاویر در فایل ترجمه | درج شده است ✓ |
درج جداول در فایل ترجمه | درج شده است ✓ |
درج فرمولها و محاسبات در فایل ترجمه | به صورت عکس درج شده است ✓ |
منابع داخل متن | به صورت فارسی درج شده است ✓ |
منابع انتهای متن | به صورت انگلیسی درج شده است ✓ |
فهرست مطالب |
چکیده |
بخشی از ترجمه |
چکیده دسته بندی سلسله مراتب رویکردی مؤثر برای دسته بندی داده های متنی بزرگ مقیاس است. ما یک استراتژی آزاد سازی شده روش دسته بندی سلسله مراتبی مرسوم را به منظور بهبود عملکرد سیستم معرفی می کنیم. روش ما در حین فرایند ساخت سازه سلسله مراتبی داوری گره دسته نامعین را تا زمانی که به وضوح بتوان آن را دسته بندی کرد به تأخیر می اندازد. این رویکرد مسئله «انسداد» را به صورت مؤثری کاهش می دهد که در سازه سلسله مراتبی خطای دسته بندی را از سطح بالاتر به سطح پایین تر انتقال می دهد. یک رویکرد وزن دهی واژه جدید بر مبنای نظریه حداقل اطلاعات (LIT) برای دسته بندی سلسله مراتب اتخاذ شده است. این رویکرد اطلاعات را در تغییرات توزیع احتمال تعیین می کند و مدل نمایش سند جدیدی را ارائه می کند که در آن می توان مشارکت هر واژه را به صورت صحیح وزن داد. نتایج آزمایشگاهی نشان می دهد که رویکرد آزاد سازی سلسله مراتب معقول تری ایجاد می کند و عملکرد دسته بندی را بیشتر بهبود می بخشد. این رویکرد همچنین در مقایسه با روش های دسته بندی دیگر مانند SVM (ماشین بردار پشتیبان) عملکرد بهتری بر حسب کارایی دارد و برای وظایف دسته بندی متن بزرگ مقیاس کارآمدتر است. روش های مبتنی بر LIT در مقایسه با روش وزن دهی واژه کلاسیک TF*IDF به بهبود قابل توجهی در عملکرد دسته بندی دست می یابد.
6- نتایج ما رویکرد دسته بندی سلسله مراتب را بر مبنای استراتژی آزاد سازی ارائه می کنیم که تأثیر مسئله «انسداد» را کاهش می دهد. این رویکرد تصمیم دسته نامعین را تا زمانی که به صورت قطعی دسته بندی شود به تأخیر می اندازد و بنابراین خطایی که در سطح بالاتر روی داده است به سطح پایین تر انتقال داده نمی شود. همچنین نظریه حداقل اطلاعات را در وزن دهی واژه و نمایش سند سازی نیز اعمال کردیم که توسط توزیع های احتمال مختلف مدل تعیین کیفیت اطلاعات اساسی جدیدی را ارائه می کند. آزمایش های روی داده های RCV1 نشان می دهد که روش دسته بندی سلسله مراتبی متن مبتنی بر استراتژی آزاد سازی با افزایش اندازه داده در مقایسه با SVM کارایی بالاتری بر حسب عملکرد زمانی دارد. همچنین می تواند همزمان دقت بالاتر و فراخوانی را حفظ کند. به ویژه با استفاده از روش LIT برای وزن دهی واژه عملکرد دسته بندی در بیشتر رده بندها در مقایسه با TF*IDF بهبود قابل توجهی می یابد. LIT فاصله بین دو توزیع احتمال را اندازه می گیرد و رویکرد کمیت اطلاعات اساسی جدیدی را وضع می کند. این رویکرد نه تنها در زمینه دسته بندی متن بلکه در کاربردهای پردازش زبان طبیعی، مانند خوشه بندی، بازیابی اطلاعات و غیره، نیز عملکرد بهتری در مقایسه با TF*IDF دارد. |
بخشی از مقاله انگلیسی |
Abstract Hierarchical classification is an effective approach to categorization of large-scale text data. We introduce a relaxed strategy into the traditional hierarchical classification method to improve the system performance. During the process of hierarchy structure construction, our method delays node judgment of the uncertain category until it can be classified clearly. This approach effectively alleviates the ‘block’ problem which transfers the classification error from the higher level to the lower level in the hierarchy structure. A new term weighting approach based on the Least Information Theory (LIT) is adopted for the hierarchy classification. It quantifies information in probability distribution changes and offers a new document representation model where the contribution of each term can be properly weighted. The experimental results show that the relaxation approach builds a more reasonable hierarchy and further improves classification performance. It also outperforms other classification methods such as SVM (Support Vector Machine) in terms of efficiency and the approach is more efficient for large-scale text classification tasks. Compared to the classic term weighting method TF*IDF, LIT-based methods achieves significant improvement on the classification performance.
6- Conclusions We propose the hierarchical classification approach based on the relaxation strategy which alleviates the impact of the ‘blocking’ problem. It delays the uncertain category decision until it can be classified definitely, and so the error that has occurred in the upper level will not be transferred to the lower level. We also apply the Least Information Theory in term weighting and documentation representation and it offers a new basic information quantify model by different probability distributions. The experiments on RCV1 data shows that the text hierarchical classification method based on the relaxation strategy has greater advantage on the time performance over SVM with an increasing data size. And it can also maintain both higher precision and recall simultaneously. Specially, by the use of LIT method for term weighting, the classification performance achieves significant improvement over classic TF∗IDF on most classifiers. LIT measures the distance between two probability distributions and establishes a new basic information quantity approach. It performed better than TF∗IDF not only in the field of text classification but also other natural language processing application, such as clustering, information retrieval and so on. |
تصویری از مقاله ترجمه و تایپ شده در نرم افزار ورد |
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی | |
عنوان فارسی مقاله: |
ساخت سلسله مراتب و طبقه بندی متن بر اساس استراتژی آزاد سازی و مدل حداقل اطلاعات |
عنوان انگلیسی مقاله: |
Hierarchy construction and text classification based on the relaxation strategy and least information model |
|