عنوان فارسی مقاله: | تجزیه و تحلیل معنایی و نهان متدهای تجزیه مقدار منفرد و فاکتورگیری نامنفی ماتریس (SVD و NMF) |
عنوان انگلیسی مقاله: | Evaluation of SVD and NMF Methods for Latent Semantic Analysis |
دانلود مقاله انگلیسی: | برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید |
خرید ترجمه آماده: | تماس گزفته شود |
کد مقاله | S2 |
سال انتشار | 2009 |
تعداد صفحات مقاله انگلیسی | 3 |
تعداد صفحات ترجمه مقاله | 8 |
مجله | مجله بین المللی روندهای اخیر در مهندسی |
دانشگاه | آمریتا، هند |
کلمات کلیدی | – |
نشریه | ACEEE |
بخشی از ترجمه:
چکیده
تکنیکهای ریاضیاتی مختلفی به منظور کاهش ابعاد دادهها در مجموعه دادههای بزرگ، برای بازیابی مناسب اطلاعات موردنیاز ایجاد میشوند. آنالیز پنهان مفهومی (LSA)، شکل تقریب اصلاح شدهی مدل فضای برداری با رتبه کم است که میتوان از آن برای شناسایی روابط مفهومی بسیار مهم در مجموعه نوشتارهای متنی استفاده کرد. LSA یک تقریب با رتبه کم را بر روی ماتریس جمله-سند انجام میدهد، که با تبدیل دادههای متنی به یک نمایش برداری ایجاد میشود، و در نتیجه ارتباط معنایی موجود میان اسناد مجموعه نوشتارهای متنی را بیان میکند. تجزیهی مقادیر تکین (SVD) یک روش تقریب متعارف است که برای LSA استفاده میشود، که در آن مولفهها با ابعاد کمتر حاصل از تجزیه کوتاه میشوند. در کوتاهسازی، نویز زبانی موجود در نمایش برداری حذف میشود، و ارتباط مفهومی قابل مشاهده میشود. یکی از مشکلات استفاده از SVD این است که ماتریس کوتاه شده دارای مولفههای منفی خواهد بود، که برای بیان نمایش متنی عادی نیست. فاکتورگیری نامنفی ماتریس (NMF) با ایجاد بیان مبتنی بر بخشهای نامنفی به عنوان تقریب رتبه کم برای انجام LSA به این مساله میپردازد. این مقاله بررسی جامعی در مورد نحوه استفاده از هر دو روش به منظور بازیابی اطلاعات انجام میدهد. ارزیابی عملکرد این روشها با استفاده از مجموعه دادههای آزمایشی استاندارد انجام شده است.
بخشی از مقاله انگلیسی:
Abstract -Different mathematical techniques are being developedto reduce the dimensionality of data within large datasets,for robust retrieval of required information. LatentSemantic Analysis (LSA), a modified low rank approximationform of Vector Space Model, can be used for detecting underlyingsemantic relationships within text corpora. LSA performsa low-rank approximation on term-document matrix,which is generated by transforming textual data into a vectorrepresentation, thereby bringing out the semantic connectednesspresent among the documents of the corpus. SingularValue Decomposition (SVD) is the traditional approximationmethod used for LSA, wherein lower dimensional componentsfrom the decomposition are truncated. On truncation, the linguisticnoise present in the vector representation is removed,and the semantic connectedness is made visible. One of thepitfalls of using SVD is that the truncated matrix will havenegative components, which is not natural for interpretingthe textual representation. Nonnegative Matrix Factorization(NMF) addresses this issue by generating non-negativeparts-based representation as the low rank approximation forperforming LSA. The paper provides an in-depth overview ofhow both methods are being used for the purpose of InformationRetrieval. Performance evaluation of the methods hasbeen performed using standard test datasets.I. INTRODUCTIONSince information explosion has been taking hold over theInternet, handling of large datasets has become an activeresearch area. A huge amount of data is being generatedeveryday from a variety of sources, and techniques forstructuring the same data are being explored, so that theycan be stored and retrieved in a convenient fashion. InformationRetrieval has come a long way, evolving itselfthrough different classic models such as Boolean model,Probabilistic Model and finally, Vector Space Model (VSM)[1].VSM relies on the fact that the meaning of the documentcan be derived from the document’s constituent terms. VSMdeals with transforming the text corpus into a termdocumentmatrix,
عنوان فارسی مقاله: | تجزیه و تحلیل معنایی و نهان متدهای تجزیه مقدار منفرد و فاکتورگیری نامنفی ماتریس (SVD و NMF) |
عنوان انگلیسی مقاله: | Evaluation of SVD and NMF Methods for Latent Semantic Analysis |
دانلود مقاله انگلیسی: | برای دانلود رایگان مقاله انگلیسی با فرمت pdf اینجا کلیک نمائید |
خرید ترجمه آماده: | تماس بگیرید |