این مقاله انگلیسی در نشریه الزویر در 8 صفحه در سال 2015 منتشر شده و ترجمه آن 15 صفحه بوده و آماده دانلود رایگان می باشد.
دانلود رایگان مقاله انگلیسی (pdf) و ترجمه فارسی (pdf + word) |
عنوان فارسی مقاله: |
مدل ترکیبی فازی-عصبی برای کاربردکاوی وب
|
عنوان انگلیسی مقاله: |
Neuro-Fuzzy Based Hybrid Model for Web Usage Mining
|
دانلود رایگان مقاله انگلیسی |
|
دانلود رایگان ترجمه با فرمت pdf |
|
دانلود رایگان ترجمه با فرمت ورد |
|
مشخصات مقاله انگلیسی و ترجمه فارسی |
فرمت مقاله انگلیسی |
pdf |
سال انتشار |
2015 |
تعداد صفحات مقاله انگلیسی |
8 صفحه با فرمت pdf |
نوع نگارش |
مقاله پژوهشی (Research article) |
نوع ارائه مقاله |
ژورنال – کنفرانسی |
رشته های مرتبط با این مقاله |
مهندسی کامپیوتر – مهندسی صنایع |
گرایش های مرتبط با این مقاله |
امنیت اطلاعات – مهندسی الگوریتم ها و محاسبات – داده کاوی |
چاپ شده در مجله (ژورنال)/کنفرانس |
پروسدیا علوم کامپیوتر |
کلمات کلیدی |
خروجی شبکه عصبی – خوشه بندی فازی C میانگین – شناسایی کاربر – شناسایی جلسه کاربر – وب داده ها |
کلمات کلیدی انگلیسی |
Feed forward neural network – Fuzzy C means clustering – User identification – User session identification – Web log data |
ارائه شده از دانشگاه |
گروه CSE، موسسه فناوری مانیپال، دانشگاه مانیپال |
شناسه دیجیتال – doi |
https://doi.org/10.1016/j.procs.2015.06.038 |
لینک سایت مرجع |
https://www.sciencedirect.com/science/article/pii/S1877050915013629 |
رفرنس |
دارای رفرنس در داخل متن و انتهای مقاله ✓ |
نشریه |
الزویر – Elsevier |
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش |
15 صفحه با فونت 14 B Nazanin |
فرمت ترجمه مقاله |
pdf و ورد تایپ شده با قابلیت ویرایش |
وضعیت ترجمه |
انجام شده و آماده دانلود رایگان |
کیفیت ترجمه |
مبتدی (مناسب برای درک مفهوم کلی مطلب)
|
کد محصول |
F2285 |
بخشی از ترجمه |
3. متودولوژی
3.1. روش جمعآوری دادههای وب
هر درخواست کاربر به سرور در لاگ وب سرور ثبت خواهد شد. هر خط در لاگ نشاندهندهی درخواست به سرور است و معمولا در فرمت قابل تعمیم لاگ شامل موارد زیر است:
1. میزبان/ آدرس IP از راه دور: شناسایی کسی که از وبسایت بازدید کرده بود.
2. تأیید هویت کاربر: نام کاربری و رمز عبور در صورتی که سرور نیاز به احراز هویت کاربران داشته باشد (بهطورکلی “-“)
3. تاریخ و زمان درخواست: برای تعیین مدت زمانی که بازدیدکننده در یک صفحه داده به سر برده است مورد استفاده قرار میگیرد.
4. درخواست HTTP: روش (GET، POST، HEAD، و غیره) که برای انتقال اطلاعات همراه با ذکر نام درخواست منابع (یک صفحه HTML، یک فایل تصویری و یا یک اسکریپت) و نسخه پروتکل (پروتکل HTTP مورد استفاده قرار گرفته) استفاده میشود.
5. وضعیت درخواست پاسخ: کد وضعیت HTTP به مشتری بازگردانده میشود (200، 404 و غیره).
6. اندازه صفحه: شامل محتوا یا طول سند منتقل شده است.
1. ارجاع درست: لیست آدرس سایت قبلی بازدید شده توسط مشتری است که به صفحه فعلی لینک شده است (اگر این اطلاعات از دست رفته باشد).
2. عامل کاربر: اطلاعاتی در مورد مرورگر مشتری، مدل مرورگر و سیستم عامل مشتری ارائه میدهد (اگر این اطلاعات از دست رفته باشد).
لاگ ورود به سیستم از وب سرور وبسایت پلیتکنیک دکتر M. A.T از 31 دسامبر 2014 از ساعات 12:09:56 تا 11:18:07 15 ژانویه2015، در مجموع در 15 روز جمعآوری شده است. نمونه رکورد لاگ وب در شکل 1 داده شده است.
لاگ ورود به سیستم بالا نشان میدهد که کاربر با IP آدرس 124.40.247.196 درخواست لینک اتومبیل – مهندسی تحت دورههای آموزشی در 9ژانویه 2015 در 10:04:32 کرده است و او از لینک http://tmapaipolytechnic.com عبور کرده است. درخواست موفقیتآمیز بوده است و در مجموع 2116 بایت دانلود شده است. همچنین، مرورگر موزیلا (سازگار) 5.0 و سیستمعامل ویندوز NT 6.3 استفاده میشود.
3.2. مرحله قبل از پردازش لاگ وب
ورود به سیستم وب شامل تمام تعاملات با وب سرور است. که شامل درخواست واقعی کاربر و درخواست با توجه به فایلهای تصویری موجود در صفحه وب است. علاوهبراین به درخواست کاربر، ورود به سیستم متشکل از درخواست خودکار آغاز شده توسط روبات و یا برنامهها است. بهمنظور کشف الگوهای مفید از لاگ وب، ورود به سیستم وب باید برای شناسایی کاربران و جلسات کاربر و یا فعالیتهای کاربران در وبسایت پیش پردازش شود. پیش پردازش لاگ وب متشکل از تمیز کردن لاگ وب، شناسایی کاربر و شناسایی جلسه است. قبل از تمیز کردن لاگ وب، ویژگیهای وب نیاز به استخراج و زمان دارند، یک عدد صحیح برای نمایش زمان سپری شده از تاریخ پایه برای محاسبات بیشتر استفاده میشود.
پیش پردازش ورود به وب از تکنیکهای کاهش ابعاد مختلف و روشهای ترکیب، به نحو احسن برای شناسایی کاربران و جلسات کاربر استفاده میکند.
3.2.1. تمیز کردن لاگ وب
یک الگوریتم کلی برای تمیز کردن لاگ وب در زیر ارائه شده است. الگوریتم، لاگ فایل وب را بهعنوان ورودی (WebLogFile) دریافت میکند و یک لاگ فایل تمیز بهعنوان خروجی (New-LogFile) ارائه میدهد، که عاری از ورودیهای اضافی است. الگوریتم روال خواستار چک کردن این است گه آیا درخواست فعلی یک درخواست تصویر، یک درخواست ربات، یک درخواست GET موفق با توابع بولی با خروجی TRUE و FALSE است.
مرحله 1. تکرار مراحل 2-3 تا پایان فایل (WebLogFile) قابل دسترسی نیست.
مرحله 2. رکورد بعدی از WebLogFile خوانده میشود.
مرحله 3. اگر Log-Record یک درخواست ربات و یک درخواست تصویر نیست و یک GET موفق است Log-Record را در New-LogFile بنویس.
مرحله 4. توقف
3.2.2. شناسایی کاربر
شناسایی کاربر براساس آدرس IP، عامل کاربر و ارجاع درست اجرا شده برای شناسایی منحصربهفرد کاربران است. الگوریتم شناسایی کاربر است که در زیر بیان میشود لاگ فایل تمیز را بهعنوان ورودی دریافت میکند و هر کاربر مجزا را تشخیص میدهد.
مرحله 1. تنظیم کاربر – تعداد ← 0.
مرحله 2. تکرار مراحل 3-8 در حالی که انتهای فایل (New-LogFile) قابل دسترس نیست.
مرحله 3. رکورد جاری از New-LogFile به Cur-Record خوانده شود.
مرحله 4. رکورد بعدی New-LogFile به Next-Record خوانده شود.
مرحله 5. فرض کنید IPcur و IPnext آدرس IP در Cur-Record و Next-Record باشند.
مرحله 6. فرض کنید UAcur و UAnext عامل کاربر در Cur-Record و Next-Recordباشند.
مرحله 7. فرض کنید RUcur و RUnext URL ارجاع در Cur-Record و Next-Record باشند.
مرحله 8.
مرحله 9. توقف
3.2.3. شناسایی جلسه
شناسایی جلسه با هدف شناسایی فعالیتهای کاربر در یک وبسایت است. الگوریتم برای شناسایی جلسه براساس هر دو روش اکتشافی و ناوبری در زیر ارائه شده است.
مرحله 1. تنظیم PageStayTime ← 10 دقیقه.
مرحله 2. فرض کنید SessionSet = {}
مرحله 3. تنظیم K ⇓ 0 و ⇓ J 0.
مرحله 4. فرض کنید LJ، URIj، TJ، RUj و UJ نشاندهندهی ورود به سیستم، URI، زمان، ارجاع URL و کاربر باشند.
مرحله 5. برای هر کاربر منحصربه فرد UJ مراحل 6-8 را انجام میدهد.
مرحله 6. فرض کنید I ⇓ 0.
مرحله 7. برای هر ورود LJ مرحله 8 را انجام میدهد.
مرحله 8.
مرحله 9. توقف
3.3. کشف دانش بااستفاده از الگوریتم خوشهبندی فازی- عصبی
هنگامی که جلسات کاربر شناسایی شدند، یک فرایند خوشهبندی بهمنظور گروهبندی جلسات مشابه در خوشه یکسان بهکار برده میشود. هر خوشه شامل کاربران با رفتار جستجوی مشترک و منافع مشابه است. در کار پیش رو، الگوریتم خوشهبندی فازی C-میانگین برای خوشهبندی جلسات کاربر استفاده شد.
شبکه عصبی مصنوعی در جستجوی معماری و نمایش اطلاعات الگوهایی از انسان مغز است. شبکه عصبی مصنوعی برای انجام هر هدف انجام میشود. الگوها در ورودی ارائه شدهاند، و با گرههای خروجی با وزنهای متفاوت همراه هستند. فرآیند تکرار شونده برای تنظیم وزن بین گرههای ورودی و خروجی دنبال میشود. فرایند تنظیم وزن، به نام یادگیری، ارائه، یادگیری مستمر و یا قابلیت یادگیری مصنوعی به سیستم است، که میتواند یادگیری تحت نظارت و یا بدون نظارت در شبکههای عصبی مصنوعی باشد. یادگیری تحت نظارت خواستار تعریف کلاس خروجی برای هر یک از ورودیها است.
در کار فعلی، یک مدل ترکیبی براساس شبکههای عصبی و خوشهبندی فازی برای خوشهبندی کاربران با توجه به الگوهای جستجو ارائه شده است. ابتدا، مجموعه نمونهای از اطلاعات ورود به سیستم وب پیش پردازش با استفاده از الگوریتم خوشهبندی فازی C میانگین خوشهبندی میشود. سپس، ورودی الگوریتم خوشهبندی بهعنوان ورودی به شبکه عصبی داده شده و خروجی الگوریتم خوشهبندی بهعنوان خروجی هدف و آموزش شبکه عصبی انجام شده است. میانگین مربعات خطا – متوسط مربع خطاها بین خروجی شبکه و خروجی مورد نظر است و بهعنوان اندازهگیری عملکرد استفاده میشود.
ما از شبکه عصبی رو به جلو چندلایه، آموزش دیده با الگوریتم آموزش در شکل 2 نشان داده شده است.
|