این مقاله انگلیسی ISI در نشریه الزویر در 18 صفحه در سال 2016 منتشر شده و ترجمه آن 35 صفحه میباشد. کیفیت ترجمه این مقاله ارزان – نقره ای ⭐️⭐️ بوده و به صورت کامل ترجمه شده است.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی | |
عنوان فارسی مقاله: |
GeoSRS: یک سیستم پیشنهاد دهنده اجتماعی ترکیبی برای داده های موقعیت جغرافیایی |
عنوان انگلیسی مقاله: |
GeoSRS: A hybrid social recommender system for geolocated data |
|
مشخصات مقاله انگلیسی (PDF) | |
سال انتشار | 2016 |
تعداد صفحات مقاله انگلیسی | 18 صفحه با فرمت pdf |
رشته های مرتبط با این مقاله | مهندسی فناوری اطلاعات، مهندسی صنایع |
گرایش های مرتبط با این مقاله | مدیریت سیستم های اطلاعاتی، اینترنت و شبکه های گسترده، داده کاوی |
چاپ شده در مجله (ژورنال) | سیستم های اطلاعاتی – Information Systems |
کلمات کلیدی | سیستم های پیشنهاد دهنده، متن کاوی، تکنیک Quadtree، خزش، شبکه های اجتماعی، شبکه اجتماعی مبتنی بر موقعیت کاربر |
ارائه شده از دانشگاه | دانشگاه بارسلونا / دانشگاه پلی تکنیک کاتالونیا، اسپانیا |
رفرنس | دارد ✓ |
کد محصول | F1345 |
نشریه | الزویر – Elsevier |
مشخصات و وضعیت ترجمه فارسی این مقاله (Word) | |
وضعیت ترجمه | انجام شده و آماده دانلود |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش | 35 صفحه با فونت 14 B Nazanin |
ترجمه عناوین تصاویر و جداول | ترجمه شده است ✓ |
ترجمه متون داخل تصاویر | ترجمه نشده است ☓ |
ترجمه متون داخل جداول | ترجمه نشده است ☓ |
درج تصاویر در فایل ترجمه | درج شده است ✓ |
درج جداول در فایل ترجمه | درج شده است ✓ |
درج فرمولها و محاسبات در فایل ترجمه | به صورت عکس درج شده است ✓ |
منابع داخل متن | درج نشده است ☓ |
کیفیت ترجمه | کیفیت ترجمه این مقاله متوسط میباشد |
فهرست مطالب |
چکیده
مقدمه کارهای مربوطه سیستم های پیشنهاددهنده اجتماعی مبتنی بر موقعیت کاربر فرایند بازیابی داده ها شبکه های اجتماعی به عنوان منابع داده های باز بازیابی داده ها از شبکه های اجتماعی الگوریتم Quadtree مقیاس بندی الگوریتم Quadtree مطالعه موردی: پلتفورم Foursquare شرح سیستم GeoSRS مرور اجمالی شاخه مبتنی بر محتوا شاخه همکاری تنظیمات هیبرید ارزیابی سیستم مجموعه داده های نکات مهم رستوران Foursquare پوشش پیشنهادات صحت عملکرد نتیجه گیری ها و کارآتی |
بخشی از ترجمه |
چکیده
ما سیستم GeoSRS را ارائه داده ایم که یک سیستم پیشنهاد دهنده هیبرید برای یک شبکه اجتماعی مشهور مبتنی بر موقعیت کاربر یا LBSN می باشد، که در آن کاربران قادرند مطالب مروری کوتاهی درباره محلهای مورد علاقه ای که دیدن کرده اند بنویسند. با استفاده از تکنیک های داده کاوی متن پیشرفته، سیستم ما موقعیت هایی را به کاربران توصیه کرده اند تا به عنوان مجموعه کاملی از مرور های متنی علاوه بر محل جغرافیایی شان استفاده بشود. برای ارزیابی سیستم خود، ما مجموعه داده های خودمان را با خزش در شبکه اجتماعی Foursquare جمع آوری کرده ایم. برای انجام موثر چنین کاری، ما استفاده از نسخه موازی تکنیک Quadtree را پیشنهاد کرده ایم که می تواند برای خزش/کاوش منابع توزیع شده فضایی دیگر کاربرد داشته باشد. سرانجام اینکه، ما عملکرد GeoSRS را روی مجموعه داده های جمع آوری شده مان مطالعه کرده ایم و نتیجه گرفته ایم که با ترکیب تحلیل گرایشات و احساسات و مدلسازی متنی، GeoSRS پیشنهادات صحیح تری را بوجود می آورد. عملکرد این سیستم جوری بهبود یافته است که مرورهای بیشتری در دسترس خواهند بود، و استفاده از تکنیک های خزش در مقیاس بزرگ را نظیر Quadtree بیشتر ترغیب خواهد کرد.
1- مقدمه
تکثیر تکنولوژی های ارتباطات موبایل و GPS باعث شده کاربران کلان داده های شناسایی جغرافیایی را به رسانه های اجتماعی مختلفی اضافه نمایند از جمله عکس، مرور متنی، یا ویدئو که چند نمونه از بسیار نمونه های دیگر می باشند. شبکه های اجتماعی مبتنی بر موقعیت کاربر یا LBSN روابط کاربر (بخش اجتماعی) و اطلاعات فضایی جغرافیایی (بخش مبتنی بر موقعیت کاربر) را به شکل یک شبکه منفرد با هم ترکیب کرده اند. با درنظرگیری موقعیت فیزیکی کاربران، LBSNها فاصله دنیای فیزیکی و جوامع مجازی را نظیر Foursquare و Facebook یا Twitter را پر می کنند.
استفاده گسترده از این محلهای شبکه سازی اجتماعی باعث شده که اینها منابع ارزشمند اطلاعاتی بشوند. ولیکن، حجم زیاد داده هایی که از این محلها جریان می یابد، کار را حتی از لحاظ یک کاربر منفرد، به طور روزافزونی مشکل می سازد که انسانها همه این اطلاعات را راهگیری کنند. ازا ینرو بیشتر سایت های شبکه اجتماعی نوعی از سیستم توصیه اجتماعی SRS را اجرا می نمایند: برای مثال، توییتر می گوید که چه کسی را دنبال کنید، فیس بوک پست ها را در قسمت دیوار کاربران فیلترسازی و اولویت بندی می کند. و Foursquare رفتن به مکانهایی را پیشنهاد می کند. وقتی محتوای اجتماعی از لحاظ جغرافیایی نشاندار بشود، به شدت لازم می شود که کاربر و مکان یابی گزینه در پارادیگم پیشنهادات درنظر گرفته شود. پیشنهادات مبتنی بر موقعیت کاربر یک کاربر بینظیری در LBSNها دارد و اساسا از سیستم های پیشنهاددهنده معمولی متفاوت است از این لحاظ که سیستم های معمولی خصوصیات فضایی کاربران و گزینه ها را درنظر نمی گیرند. بعلاوه، پیشنهادات مبتنی بر موقعیت کاربر در بالای LBSNها ممکن است از تعامل میان سه لایه تشکیل دهنده یک LBSN یعنی کاربر، موقعیت جغرافیایی و لایه محتوایی بهره مند گردد. در این مقاله، ما یک سیستم کاملا یکپارچه ای را برای بازیابی اطلاعات داده های مبتنی بر موقعیت جغرافیایی کاربر و سیستم پیشنهاد دهنده مبتنی بر موقعیت انتها به انتها پیشنهاد داده ایم که برای شبکه اجتماعی مشهور Foursquare مناسب می باشد. ولیکن خواننده باید توجه داشته باشد که روش کار ما برای شبکه های اجتماعی دیگر هم کاربرد دارد که حاوی مرورهای مرجع زمانی مبتنی بر موقعیت جغرافیایی میباشد و با اینحساب در مقاله مان، از این حقیقت جدا می شویم که داریم از یک سایت خاصی استفاده می کنیم. ما براین باوریم که سیستم های پیشنهاد دهنده کاملا عملیاتی در بالای LBSNها نیاز به طراحی های انتهاب به انتها دارند، که قادر به اجرای بازیابی داده ها از شبکه های اجتماعی و پاکسازی سروصدا و داده های تکراری، و استخراج ویژگی های مرتبط و نه دست کم اجرای پیشنهادات می باشند. سیستم اطلاعات مبتنی بر موقعیت کاربر که ما پیشنهاد داده ایم، در شکل 1 خلاصه سازی شده است. این سیستم مرورهای کوتاه را همراه با محلهای مکان یابی شده جغرافیایی شان و شناسایی مرورکننده ها به عنوان اساسی برای پیشنهادات بازیابی می کند. در Foursquare، کاربران قادر به بررسی محلهای مورد علاقه (مسیرها)، نوشتن مرورهای کوتاه (نکات مهم) برای محلهایی که آنها را بررسی کرده اند، و به اشتراک گذاری اطلاعات با کاربران درون شبکه اجتماعی شان می باشند. برای کار خزش سازی محل ها، کاربران و نکات مهم، ما مجبور به استفاده از APIی Foursquare گردیدیم که یک سطح مشترک با محدودیت های مقدار اطلاعاتی است که فرد می پرسد و مقدار درخواست هایی است که فرد دارد. از اینرو، لازم بود یک مکانیسم خزش سازی ابداع گردد که استفاده بهینه از سوالات در دسترس ما قرار گیرد. برای دستیابی به این کار، ما یک نسخه موازی الگوریتم Quadtree را طراحی کرده ایم، که خیلی مناسب خزش سازی محلهایی می باشد که به لحاظ فضایی توزیع یافته اند، درحالیکه در عین حال ظرفیت پذیرش قابل ملاحظه ای را کسب کرده اند. ما دریافته ایم که خزش سازی همه محلها از نواحی شهری بزرگ مانند Mexico D.F. یا نیویورک در زمان منطقی با الگوریتم مطرح شده Quadtree امکانپذیر بوده است. ما بکارگیری الگوریتم Quadtree موازی را برای این مسئله در مقاله خود به عنوان یک کاری ارزشمند می دانیم و براین باوریم که مسائلی که نیازمند وسایل فضایی کاوشی (سنسورها) می باشند می توانند همچنین از این امر بهره مند شوند. برای انجام پیشنهادات سیستم ما استفاده زیادی از مرورهای کاربری (نکات مهم) نموده است. برای استخراج اطلاعات معنی دار از این مرورهای به شکل ازاد، سیستم GeoSRS متکی بر بسیاری تکنیک های پیشرفته برای متن کاوی و تحلیل احساسات و گرایشات می باشد، که از لحاظ صحت توصیه ارزیابی می شوند و متکی بر تکنیک هایی است که اجرای عالی دارند انتخاب می شوند که در GeoSRS استفاده بشوند. نقش مرتبط دیگری از مقاله ما همان افزایش صحت هنگام ترکیب گرایشات مرور و محتوا به شکل تنظیم پیشنهاددهنده توزین شده ساده ولی تا اندازه ای موثر می باشد. گرایشات اشاره به عقاید جهانی دارد که در مرور مربوطه بازتاب یافته است (مثبت، منفی یا خنثی) درحالیکه محتوا نشان دهنده موضوعاتی است که مرور مطرح می سازد. این امر باعث تقویت این ایده می شود که انتخابهای مبتنی بر مرور خالص و محض صرفا براساس عقایدی نیست که در یک مرور کوتاه بازتاب یافته است (خدمات خیلی کند می باشند)، بلکه براساس محتوای مربوط به کاربر است (این یک نوع محل کار به جای کافی شاپ است). برای ارزیابی سیستم خود، ما مجموعه داده های خودمان را از رستورانها و نکاتی از ناحیه منهتن در نیویورک جمع آوری کرده ایم. ما منهتن را به دلیل تراکم بالای محله ها و تعداد کاربران فعال برای روایی سازی هم قابلیت معیاربندی خزشگر Quadtree و هم کارایی و پوشش سیستم پیشنهاد دهنده انتخاب کرده ایم. سیستم پیشنهاددهنده به شکل سنجشهای صحت بازیابی (عملکرد) در عوض سنجشهای صحت آماری ارزیابی می شود چون ما قصد داشتیم درجه بندی فردی محل ها را پیشگویی کنیم و ترتیب بندی نسبی در میان آنها را انجام دهیم، یک روش ارزیابی را مطرح کردیم که در آن ما به لحاظ تاریخی مجموعه داده های نکات مهم را به شکل آموزشی و تستی تقسیم بندی کرده ایم. نکات مهم تستی به شکل حقیقت زمینه ای برای ارزیابی مقایسه ای پیشنهادات درنظر گرفته شده اند. دست آخر اینکه، تنظیم پیشنهاد دهنده هیبرید توزین شده ساده که در GeoSRS بکار گرفته شده است طبق پیکربندی های پیشرفته دیگر مانند مدلهای کلان سطح و ابشاری مقایسه شده اند. |
بخشی از مقاله انگلیسی |
Abstract We present GeoSRS, a hybrid recommender system for a popular location-based social network (LBSN), in which users are able to write short reviews on the places of interest they visit. Using state-of-the-art text mining techniques, our system recommends locations to users using as source the whole set of text reviews in addition to their geographical location. To evaluate our system, we have collected our own data sets by crawling the social network Foursquare. To do this efficiently, we propose the use of a parallel version of the Quadtree technique, which may be applicable to crawling/exploring other spatially distributed sources. Finally, we study the performance of GeoSRS on our collected data set and conclude that by combining sentiment analysis and text modeling, GeoSRS generates more accurate recommendations. The performance of the system improves as more reviews are available, which further motivates the use of large-scale crawling techniques such as the Quadtree. 1 Introduction The proliferation of mobile communication and GPS technologies has allowed users to add geographical identification metadata to various social media, such as photographs, text reviews or video, among many others. Location-based social networks (LBSNs) [54] integrate into a single network user relations (the “social” part) and geo-spatial information (the “location-based” part). By taking into account the physical location of users, LBSNs are bridging the gap between physical world and virtual communities such as Foursquare, 4 Facebook5 or Twitter. 6 The extensive use of these social networking sites has made them invaluable sources of information. However, the sheer volume of data flowing through these sites, even for a single user, has made it increasingly difficult for humans to track all this information. Therefore, most social networking sites implement some sort of Social Recommendation System (SRS) [16]: for example, Twitter suggests who to follow, Facebook filters and prioritizes posts in users’ walls and Foursquare recommends locations where to go. When the social content is geotagged, it becomes strictly necessary to consider user and item localization in the recommendation paradigm. Location-based recommendation constitutes a unique application in LBSNs and it substantially differs from traditional recommender systems in the fact that the latter does not take into account the spatial properties of users and items [34]. Moreover, location-based recommendation on top of LBSNs might also benefit from the interaction between the three layers composing a LBSN, namely the user, the location and the content layer [47]. In this paper, we propose a fully integrated system for information retrieval of geolocated data and end-to-end locationbased recommender, suitable for the popular social network Foursquare. The reader should note, however, that our methods are applicable to any other social network that contains geolocated time-referenced reviews and hence, in our presentation we abstract from the fact that we are using this particular site. We believe that fully operative recommender systems on top of LBSNs require end-to-end designs, capable of performing data retrieval from social networks, cleaning the noisy and duplicated data, extracting relevant features and, not least, performing recommendation. Our proposed location-based information system is summarized in Fig. 1. It retrieves the short reviews together with their geolocated venues and reviewers identification as its basis for recommendations. In Foursquare, users are able to check-in to places of interest (venues), write short reviews (tips) for the venues where they checked into, and share this information with users within their social network. For the task of crawling venues, users and tips, we had to use Foursquare’s API, an interface which imposes restrictions to the amount of information one can query and the amount of requests one can make. Therefore, it was imperative to devise a crawling mechanism that would make optimal use of the queries available to us. To achieve this task, we have designed a parallel version of the Quadtree algorithm [42], which is very well suited for crawling venues that are spatially distributed, while at the same time gaining considerable throughput. We have found that crawling all venues from large urban areas such as Mexico D.F. or New York in reasonable time was possible by the proposed Quadtree algorithm. We consider the application of the parallel Quadtree algorithm to this problem an important contribution of our paper and we believe that problems that require sweeping spatial devices (sensors) could also benefit from it. To make recommendations our system makes extensive use of user’s reviews (tips). In order to extract meaningful information from these free-form reviews, GeoSRS relies upon many state-of-the-art techniques for text mining and sentiment analysis, which are evaluated in terms of recommendation accuracy and the ones that outperform are selected to be used in GeoSRS. Another relevant contribution from our paper is the increase of accuracy when mixing the review’s sentiment and content into a simple but rather effective weighted hybrid recommender setup [9]. Sentiment refers to the global opinion that is reflected in the review (positive, negative or neutral) while content indicates the topics that the review addresses. This enforces the idea that pure review-based choices are not merely based on the opinion reflected on a short review (The service was too slow), but also on the content relevant to the user (This is a kinda working place rather than a coffee shop). To evaluate our system, we have collected our own data set of restaurants and tips from the area of Manhattan in New York City. We have chosen Manhattan due to the high density of venues and the number of active users, to validate both the scalability of the Quadtree crawler and the effectiveness and coverage of the recommender system. Recommender system is evaluated in terms of retrieval accuracy (performance) measures rather than statistical accuracy measures since we do not intend to predict individual venue ratings but relative order among them. Moreover, we propose an evaluation method in which we divide historically the tips data set in training and testing. Test tips are taken as ground truth to comparatively assess the recommendation. Last but not least, the simple weighted hybrid recommender setup employed in GeoSRS is compared against other state-of-the-art configurations such as meta-level and cascade models. |