دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی | |
عنوان فارسی مقاله: |
استخراج شاخص ویژگی ضمنی برای نظر کاوی مبتنی بر ویژگی (تجزیه تحلیل مبتنی بر سطح ویژگی احساسات) |
عنوان انگلیسی مقاله: |
Implicit Aspect Indicator Extraction for Aspect-based Opinion Mining |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2014 |
تعداد صفحات مقاله انگلیسی | 18 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر |
گرایش های مرتبط با این مقاله | مهندسی نرم افزار |
چاپ شده در مجله (ژورنال) | مجله بین المللی زبان شناسی محاسباتی و کاربردهای آن – International Journal of Computational Linguistics and Applications |
کلمات کلیدی | نظر کاوی مبتنی بر ویژگی (تجزیه تحلیل مبتنی بر سطح ویژگی احساسات)، تحلیل احساسات، میدان تصادفی شرطی |
ارائه شده از دانشگاه | موسسه پلی تکنیک ملی، مکزیک |
رفرنس | دارد ✓ |
کد محصول | F1016 |
نشریه | Ijcla |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
وضعیت ترجمه | انجام شده و آماده دانلود |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش | 16 صفحه با فونت 14 B Nazanin |
ترجمه عناوین تصاویر و جداول | ترجمه شده است ✓ |
ترجمه متون داخل تصاویر | ترجمه نشده است ☓ |
ترجمه متون داخل جداول | ترجمه شده است ✓ |
درج تصاویر در فایل ترجمه | درج شده است ✓ |
درج جداول در فایل ترجمه | درج شده است ✓ |
درج فرمولها و محاسبات در فایل ترجمه | به صورت عکس درج شده است ✓ |
منابع داخل متن | به صورت عدد درج شده است ✓ |
کیفیت ترجمه | کیفیت ترجمه این مقاله متوسط میباشد |
فهرست مطالب |
چکیده
1.مقدمه
2-مطالعات مربوطه
3-روش شناسی
3-1 استخراج شاخص های ویژگی ضمنی
3-2 میدان های تصادفی شرطی
3-3 ویژگیها
4-شرایط ازمایشی
4-1 مجموعه داده ها
4-2 متریک ها وروش های ارزیابی
4-3 رویکرد معیار
5- نتایج
6.نتیجه گیری
|
بخشی از ترجمه |
چکیده
هدف نظر کاوی مبتنی بر ویژگی( تجزیه تحلیل مبتنی بر سطح ویژگی احساسات) مدل سازی روابط بین قطبیت یک سند و اهداف یا ویژگی های کاوش آن می باشد. اگرچه استخراج ویژگی صریح به طور گسترده ای مورد مطالعه قرار گرفته است، با این حال مطالعات محدودی در زمینه استخراج ویژگی های ضمنی و غیر صریح انجام شده اند. یک ویژگی ضمنی، یک هدف کاوش است که به طور صریح در متن مشخص نمی شود. برای مثال، جمله این دور بین شفاف و بسیار ارزان است، یک ایده و نظری را در خصوص ویژگی های ظاهر و قیمت ارایه می کند که با کلمات شفاف و ارزان نشان داده می شود. ما این کلمات را شاخص های ویژگی ضمنی می نامیم(IAI). در این مقاله، ما یک روش جدید را برای استخراج این IAI بااستفاده از میدان تصادفی شرطی پیشنهاد کرده ونشان می دهیم که روش ما عملکرد معنی داری نسبت به رویکرد های موجود دارد. هم چنین در بخشی از این مقاله، ما یک مجموعه ای از متون را برای استخراج IAI از طریق نام گذاری و برچسب گذاری دستی IAI و ویژگی های متناظر آن هادر یک مجموعه متون نظر کاوی شناخته شده توسعه دادیم. تا آن جا که می دانیم، متن ما اولین منبع قابل دسترس عمومی است که ویژگی های ضمنی را همراه با شاخصهای آن ها مشخص می کند.
1- مقدمه
نظر کاوی شامل مجموعه ای از فناوری ها برای استخراج و خلاصه سازی نظرات و عقاید بیان شده در محتواهای تولید شده توسط کاربر مبتنی بر وب می باشد. نظر کاوی موجب بهبود کیفیت حیات و زندگی برای افراد معمولی با اجازه دادن به آن ها برای در نظر گرفتن نظرجمعی کاربران دیگر در خصوص یک محصول، یک چهره و شخصیت سیاسی، یک مقصد توریستی و غیره می شود.هم چنین نظر کاوی موجب بهبود درامد شرکت هامی شود زیرا به این شرکت ها امکان می دهد تا بدانند که مشتریان از چه چیز هایی خوششان می اید و ازچه چیز هایی خوششان نمی اید. هم چنین نظر کاوی موجب بهبود دموکراسی از طریق اجازه دادن به دولت ها و احزاب وگروه های سیاسی برای ارزیابی دقیق پذیرش اجتماعی برنامه ها و اقدامات خود می شود.
نظر کاوی بستگی به تشخیص دقیق نظرات و عقاید بیان شده در تک تک اسناد نظیر پست های وبلاگ، توییت ها و یا کامنت ها و نظرات کاربران دارد. این تشخیص را می توان در سطوح دقت مختلف انجام داد. برای مثال، قطبیت کل سند را می توان تعیین کرد خواه محقق نظر مثبت را بیان کند یا نظر منفی. برای یک نظر در خصوص این محصول،این سطح از دقت می تواند کافی باشد. با این حال، تعیین جمله به جمله یک ویژگی خاص محصول که در خصوص آن نظرات در یک جمله معین بیان می شود، اغلب مطلوب است.
نظر کاوی مبتنی بر ویژگی( تجزیه تحلیل مبتنی بر سطح ویژگی احساسات(1-2) روابط بین ویژگی های شی مورد نظر و قطبیت وتقارن سند(احساس مثبت و منفی بیان شده در نظر) را در نظر می گیرد. هم چنین ویژگی موسوم به اهداف نظرکاوی است. یک ویژگی،مفهومی است که در خصوص آن یک محقق یانویسنده، نظر خود را در سند بیان می کند.برای مثال، جمله “عدسی این دوربین بسیار خوب است و عمر باطری آن عالی است” را در نظر بگیرید. می توان گفت که قطبیت این دیدگاه در مورد یک دوربین عکس برداری مثبت است. با این حال، به طور اخص، آن چه که نویسنده دوست دارد، عدسی( قدرت دید) وعمر باطری این دور بین است. این مفاهیم، ویژگی های این نظر می باشند.
استخراج ویژگی، فرایند شناسایی ویژگی ها یا اهداف نظر کاوی و یا یک سند معین است. این ویژگی ها مشتمل بر دو قسم هستند: ویزگی های صریح و ویژگی های ضمنی.ویژگی های صریح متناظر یا مرتبط با کلمات و عبارات خاص در سند هستند. در مثال ما، اهداف نظر یعنی عدسی و عمر باطری صریحا در سند قید شده اند. بر عکس، یک ویژگی ضمنی به طور صریح در سند قید نمی شود. جمله “این تلفن ارزان و زیبا است” را در نظر بگیرید. این جمله، نظر مثبت را در خصوص قیمت و ظاهر تلفن بیان می کند. این ویژگی ها در جمله معادل” قیمت این تلفن پایین است و ظاهر آن زیبا است” صریح می باشند.
اگرچه مطالعات بسیاری وجود دارند که به استخراج ویژگی صریح پرداخته اند، استخراج ویژگی ضمنی کم تر مورد مطالعه قرار گرفته است.استخراج ویژگی ضمنی بسیار پیچیده تر از استخراجویژگی صریح است.بااین حال، ویژگی های ضمنی در اسناد فراگیر هستند همان طور که مثال زیر از متن توصیف شده در(1) نشان می دهد:” این بهترین تلفنی است که می توان داشت. این تلفن همه ویژگی های مورد نیاز در یک موبایل را دارد.این تلفن سبک، براق و جذاب است. این تلفن بسیار کاربر پسند بوده و کار با آن آسان است( دست ورزی آن آسان است).جا به جایی منو ها و حرکت منوی آن نیز بسیار راحت است.” در این مثال، عباراتی نظیر سبک وزن، براق و جذاب، کاربرپسند و حرکت منو وسهولت دست ورزی متناظر با ویژگی های وزن، ظاهر، رابط و عملکرد تلفن می باشد. عبارت اخیر یعنی عملکرد اشاره به ویژگی منوی تلفن دارد. اگرچه این مفاهیم به طور صریح در متن ذکر نشده اند، با این حال آن ها به طور ضمنی توسط کلمات موجود معرفی می شوند. این کلمات که نشانه ها و علاماتی برای استنباط ویژگی های ضمنی نظر هستند، موسوم به شاخص های ویژگی ضمنی هستند(IAI).
توجه کنید که در این مقاله، ما هر اسمی را به صورت یک ویژگی در نظر نمی گیریم. در عوض ما فرض می کنیم که یک مجموعه تعریف شده از ویژگی ها( متغیر ها) وجود دارند که شاخص های ویژگی آن ها نشان دهنده ارزش ها می باشند. شاخص های ویژگی از عبارات ویژگی ضمنی تعریف شده توسط لیو(3) به صورت عبارات ویژگی ای که اسم یا عبارات اسمی نیستند از این نظر متفاوت می باشند که شاخص های ویژگی از نظر معنایی اشاره به ارزش های ویژگی های از قبل تعریف شده صرف نظر از بخش سطحی گفتار دارد. در زیر ما مثال هایی را در خصوص شاخص های ویژگی بیان شده با اسم و عبارات اسمی ارایه می کنیم. به جدول 3 مراجعه کنید.
فرایند شناسایی ویژگی های ضمنی یا استخراج ویژگی ضمنی، معمولا در دو مرحله انجام می شود. در ابتدا، شاخص های ویژگی در سند شناسایی می شوند برای مثال، کاربرپسند. سپس، آن ها بر روی ویژگی های متناظر برای مثال “رابط” نگاشته می شوند.در این مقاله، ما به اولین مرحله می پردازیم: شناسایی شاخص های ویژگی،فرایندی که موسوم به استخراج شاخص ویژگی ضمنی یا استخراج IAI می باشد. رویکرد های موجود برای دومین مرحله( نگاشت IAI بر روی ویژگی ها) در بخش 2 ذکر شده اند.
یک IAI می تواند تک بخشی یا تک کلمه ای باشد نظیر براق و یا دو کلمه ای باشد نظیر کاربرپسندو یا حتی یک عبارت کامل باشد نظیر پیمایش و حرکت در منو که در مثال فوق گفته شد.
IAI می تواند بخش های مختلفی از گفتار باشد: در عبارت” این MP3پلیمر واقعا گران است”، شاخص ویژگی گران، نشان می دهد که ویژگی قیمت، یک صفت است . در عبارت ” این دور بین عالی به نظر می رسد” عبارت به نظر می رسد نشان می دهد که ظاهر یک فعل است. در عبارت من از این تلفن بدم می اید، عمر این تلفن کم تر از شش ماه بود، شاخص ویژگی عمر کم، نشان می دهد که دوام تلفن، یک فعل است.
مثال های زیر، شاخص های ویژگی را به صورت اسم یا عبارات اسمی نشان می دهد.در عبارت حتی اگر من قیمت کامل را به این تلفن پرداخت می کردم، این تلفن برای من یک معامله خوب بود. شاخص ویژگی معامله خوب نشان دهنده ویژگی قیمت است.در عبارت شفافیت این تلفن، شاخص ویژگی شفافیت نشان دهنده ویژگی “ظاهر” است. درعبارت( این پلیمر یا پخش کننده موسیقی با خطاهای تصادفی همراه است” شاخص ویژگی خطا های تصادفی نشان دهنده ویژگی کیفیت است.در عبارت این تلفن اشغال است، شاخص ویژگی اشغال نشان دهنده ویژگی کیفیت است.
شاخص های ویژگی ضمنی مختلف می توانند متناظر با یک ویژگی ضمنی باشند. این شاخص های ویژگی ضمنی شااره به ارزش های مختلف این ویژگی دارند برای مثال زیبا یا زشت برای ظاهر و یا اشاره به یک ارزش دارند که در این صورت آن ها مترادف خواهند بود برایمثال زیبا، جذاب یا شفاف و یا در عبارات تقریبا مترادف به کار می روند برای مثال،” نگاه گردن به تلفن جذاب است و یا این که طراح یک سلیقه بسیار خوب را نشان داده است”.
بسیاری از محققان تنها کلمات قطبیت یا احساس را به صورت شاخص های ویژگی ضمنی در نظر می گیرند. برای مثال، در جمله ” این تلفن زیبا است”، عبارت زیبا دارای قطبیت مثبت است و طبیعی است که فرض کنیم نشاندهنده یک نظر و ایده در مورد یک ویژگی می باشد که در این جا این ویژگی ” ظاهر “است. توجه داشته باشید که فرض ما در این جا این است که هر دو ویژگی و ارزش به صورت تجمعی با یک عبارت بیان می شوند. اگرچه این رویکرد در بسیاری از موارد موثر است، با این حال در موارد دیگر کارکردی ندارد. برای مثال، در جمله” طراحان این دوربین کارشان عالی بوده است” عبارت طراحان، یک عبارت احساسی نیست بلکه به طور ضمنی نشاندهنده ویژگی” ظاهر” است که به طور ضمنی تنها با کلمه قطبی ” خوب” در این جمله نشان داده نشده است. یعنی در این جا ویژگی غیر ضمنی با یک کلمه نشان داده شده و ارزش آن با یک کلمه دیگر نشان داده می شود. شاخص های ویژگی ضمنی و کلمه ای که به آن ارزش می دهد می توانند در جملات متفاوتی ظاهر شوند برای مثال” من این تلفن را دوست دارم”. اینتلفن حتی در مناطق با سیگنال پایین کار میکند ” که در آن عبارت دوست داشتن، به ویژگی پذیرش، ارزش می دهد.
تصمیم گیری در مورد این که آیا ارزش یک ویژگی به طور ضمنی نشان دهنده نظر مثبت یا منفی است همیشه کم اهمیت نیست. برای مثال، ” این تلفن بسیار سنگین است در برابر باطری عمر زیادی دارد” نشان می دهد که وزن بالای یک تلفن بد است و ظرفیت بالای یک باطری خوب است. این موسوم به حقایق مطلوب است حتی اگر متن فاقد یک نظر و ایده صریح در مورد ویژگی خوب یا بد باشد ولی تنها منعکس کننده واقعیت عینی در مورد آن باشد، حقیقت و واقعیت هنوز مطلوب است که به طور ضمنی اشاره به نظر مثبت دارد و یا واقعیت نامطلوب است که به طور ضمنی اشاره به نظر منفی دارد. مثال دیگر” تلفن دارای اخرین نسخه اندروید است” یک واقعیت عینی است و هیچ نظری در این متن وجود ندارد، با این حال برای یک تلفن که اخرین نسخه سیستم عامل است مطلوب است و بنابر این نظری که به طور ضمنی در مورد سیستم عامل نشان داده می شود مثبت است.
در این مقاله، ما یک روش جدید را برای استخراج شاخص ویژگی های ضمنی ارایه می کنیم. ما از یک رویکرد یادگیری نظارت شده بر اساس برچسب زنی متوالی با میدان های تصادفی شرطی استفاده می کنیم. نتایج ما نشان می دهد که رویکرد ما عملکرد بیشتری از رویکرد های موجود دارد.
تا آنجا که می دانیم، هیچ متونی برای فرایند استخراج ویژگی های شاخص ضمنی وجود ندارد. از این روی ما این متن را توسعه دادیم. برای همین منظور، ما به طور دستی شاخص های ویژگی ضمنی و ابعاد متناظر آن ها را در یک متن مشخص برای نظر کاوی(1) نام گذاری کردیم. این متن برای اهداف تحقیقاتی قابل دسترس است.
این مقاله به صورت زیر سازماندهی شده است. بخش دوم در مورد کار ها و مطالعات انجام شده بحث می کند. بخش 3 در مورد طرح ها و ویژگیهای مورد استفاده بحث می کند. بخش 4 به توصیف روش ازمایشی می پردازد. نتایج در بخش 5 ارایه شده است. در نهایت، بخش 6 شامل نتیجه گیری است.
|
بخشی از مقاله انگلیسی |
ABSTRACT Aspect-based opinion mining aims to model relations between the polarity of a document and its opinion targets, or aspects. While explicit aspect extraction has been widely researched, limited work has been done on extracting implicit aspects. An implicit aspect is the opinion target that is not explicitly specified in the text. E.g., the sentence “This camera is sleek and very affordable” gives an opinion on the aspects appearance and price, as suggested by the words “sleek” and “affordable”; we call such words Implicit Aspect Indicators (IAI). In this paper, we propose a novel method for extracting such IAI using Conditional Random Fields and show that our method significantly outperforms existing approaches. As a part of this effort, we developed a corpus for IAI extraction by manually labeling IAI and their corresponding aspects in a well-known opinion-mining corpus. To the best of our knowledge, our corpus is the first publicly available resource that specifies implicit aspects along with their indicators. 1 INTRODUCTION Opinion mining comprises a set of technologies for extracting and summarizing opinions expressed in web-based user-generated contents. It improves the quality of life for ordinary people by permitting them to consider the collective opinion of other users on a product, political figure, tourist destination, etc. It improves the incomes of businesses by letting them know what the consumers like and what they do not like. It improves the democracy by permitting political parties and governments evaluate in real time social acceptance of their programs and actions. Opinion mining depends on accurate detection of opinions expressed in individual documents, such as blog posts, tweets, or user-contributed comments. Such detection can be done at different levels of granularity. For example, the polarity of the whole document can be determined: whether the author expresses a positive or negative opinion. For a comment on a specific product, this level of granularity might be enough. However, it is often desirable to determine sentence per sentence a specific aspect of the product on which opinion is expressed in the given sentence. Aspect-based Opinion Mining [1, 2] considers relations between the aspects of the object of the opinion and the document polarity (positive or negative feeling expressed in the opinion). Aspect are also called opinion targets. An aspect is a concept on which the author expresses their opinion in the document. Consider, for example, a sentence “The optics of this camera is very good and the battery life is excellent.” We can say that the polarity of this review of a photo camera is positive. However, more specifically, what the author likes are optics and battery life of this camera. These concepts are the aspects of this opinion. Aspect Extraction is the task of identifying the aspects, or opinion targets, or a given opinionated document. The aspects can be of two types: explicit aspects and implicit aspects. Explicit aspects correspond to specific words in the document: in our example, the opinion targets optics and battery life explicitly appear in the document. In contrast, an implicit aspect is not specified explicitly in the document. Consider the sentence “This phone is inexpensive and beautiful.” This sentence expresses a positive opinion on price and appearance of the phone. These aspects would be explicit in an equivalent sentence “The price of this phone is low and its appearance is beautiful.” While there are many works devoted to the explicit aspect extraction, implicit aspect extraction is much less studied. Implicit aspect extraction is much more complicated than explicit aspect extraction. However, implicit aspects are ubiquitous in the documents, as the following example from the corpus described in [1] shows: This is the best phone one could have. It has all the features one would need in a cellphone: It is lightweight, sleek and attractive. I found it very user-friendly and easy to manipulate; very convenient to scroll in menu etc. In this example, |