دانلود رایگان ترجمه مقاله تشخیص موثر تقلب بانکداری آنلاین پیشرفته در داده های بسیار نامتوازن – اسپرینگر ۲۰۱۳

 

دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
عنوان فارسی مقاله:

تشخیص موثر تقلب ها و کلاهبرداری های بانکی پیشرفته آنلاین در داده های به شدت نامتوازن

عنوان انگلیسی مقاله:

Effective detection of sophisticated online banking fraud on extremely imbalanced data

 
 
 
 
 

 

مشخصات مقاله انگلیسی (PDF)
سال انتشار ۲۰۱۳
تعداد صفحات مقاله انگلیسی ۲۷ صفحه با فرمت pdf
رشته های مرتبط با این مقاله مدیریت، مهندسی فناوری اطلاعات، مهندسی صنایع و مهندسی کامپیوتر
گرایش های مرتبط با این مقاله بانکداری، تجارت الکترونیک، اینترنت و شبکه های گسترده، هوش مصنوعی، داده کاوی
چاپ شده در مجله (ژورنال) وب جهان گستر – World Wide Web
کلمات کلیدی تشخیص تقلب، بانکداری آنلاین، الگوی مقابل، شبکه عصبی، داده کاوی
ارائه شده از دانشگاه دانشگاه تکنولوژی سیدنی، استرالیا
رفرنس دارد 
کد محصول F995
نشریه اسپرینگر – Springer

 

مشخصات و وضعیت ترجمه فارسی این مقاله (Word)
وضعیت ترجمه انجام شده و آماده دانلود
تعداد صفحات ترجمه تایپ شده با فرمت ورد با قابلیت ویرایش  ۳۲ صفحه با فونت ۱۴ B Nazanin
ترجمه عناوین تصاویر و جداول ترجمه شده است 
ترجمه متون داخل تصاویر ترجمه نشده است 
ترجمه متون داخل جداول ترجمه نشده است 
درج تصاویر در فایل ترجمه درج شده است 
درج جداول در فایل ترجمه درج شده است  
درج فرمولها و محاسبات در فایل ترجمه  به صورت عکس درج شده است  
منابع داخل متن به صورت عدد درج شده است  
کیفیت ترجمه کیفیت ترجمه این مقاله متوسط میباشد 

 

فهرست مطالب
چکیده
۱٫ مقدمه
۲٫ ویژگی های تقلب بانکی آنلاین و کارهای مرتبط
۱٫۲٫ ویژگی های تقلب در بانکداری آنلاین
۲٫۲٫ کار عمومی در تشخیص تقلب
۳٫۲٫ تشخیص تقلب در بانکداری آنلاین
۴٫۲٫ تشخیص کارت اعتباری تقلبی
۵٫۲٫ تشخیص نفوذ به کامپیوتر
۶٫۲٫ تشخیص تقلب از راه دور
۳٫  بیان مسئله
۴ . چارچوب سیستم 
۱٫۴٫ استخراج الگوی کنتراست
۲٫۴٫ شبکه عصبی حساس به هزینه
۳٫۴٫ جنگل تصمیم
۵٫  رفتار بانکداری ماینینگ کانترست یا کانترست کاوی
۱٫۵٫ چارچوب
۵٫۲٫ مدل سازی رفتار پیچیده
۳٫۵٫ گزیده ای از الگوهای رفتاری 
۶٫ خطر رفتار بانکی اینترنتی بر اساس مدل های ترکیبی
۱٫۶٫ منطق
۲٫۶٫ مدل منحصر به فرد به ثمر رساند خطر
۱٫۲٫۶٫ امتیاز دهی در برابر الگوی ماینستر
۲٫۲٫۶٫ امتیاز دهی توسط شبکه های عصبی حساس به هزینه
۳٫۲٫۶٫ امتیاز دهی به جنگل تصمیم 
۳٫۶٫ ریسک با استفاده از مدل ترکیبی
۷٫ آزمایش و ارزیابی
۲٫۷٫  تنظیمات تجربی
۳٫۷٫ ارزیابی عملکرد کلی
۴٫۷٫  عملکرد رفتار مدل سازی کنتراست
۸٫ نتیجه گیری
 

 

بخشی از ترجمه

چکیده :
تقلب در بانکداری آنلاین نشان دهنده منابع یکپارچه اجتماعی ، سایبری و دنیای فیزیکی است. این تشخیص نوعی استفاده از اینترنت و موارد گسترده با روش (W2T) است. با این حال، اطلاعات بسیار محدودی برای تشخیص تقلب پویا از رفتار مشتری واقعی در چنین محیط اطلاعاتی بسیار پراکنده و نامتوازن در دسترس می باشد، که باعث می شود تشخیص فوری و موثر بیشتر مهم و چالش برانگیز شود. در این مقاله، ما یک چارچوب آنلاین تشخیص تقلب بانکی موثر داریم که از ترکیب منابع مربوطه و شامل چندین تکنیک پیشرفته داده کاوی است. با ساخت یک بردار برای هر معامله بر اساس توالی رفتار تاریخی مشتری ، ما نرخ افتراق هر معامله موجود در برابر مشخصات رفتار مشتری را بدست می آوریم . یک الگوریتم ، کانترست ماینبر برای کاوش موثر الگوهای کانترست و تفکیک رفتار های جعلی از اصیلی معرفی شده است ، به دنبال انتخاب الگوی موثر که ترکیبی از پیش بینی مدل های مختلف و خطر است. نتایج حاصل از آزمایشات واقعی داده های بانکی آنلاین در مقیاس بزرگ نشان می دهد که سیستم ما می تواند به دقت بالاتر و حجم هشدار پایین تر از سیستم تشخیص تقلب ، معیار ترکیب دانش تخصصی و روش های تشخیص تقلب سنتی دست یابد.

۱٫ مقدمه
با استفاده گسترده از تکنولوژی اینترنت به طور فزاینده [۱۵، ۴۷، ۶۰]، بانکداری آنلاین (اگرچه بانکداری اینترنتی نامیده می شود) به عنوان یک کانال اصلی برای خرده فروشی و تجارت در حال ظهور است. در مقابل، فعالیت های بانکداری آنلاین جعلی بیشتر و بیشتر پیچیده می شوند، و به طور جدی امنیت و اعتماد در تجارت با بانکداری آنلاین تهدید شده است. تقلب در بانکداری آنلاین یک مسئله جدی در مدیریت جرائم مالی برای همه بانک ها تبدیل شده است. این اتفاق سبب به چالش کشیدن و منجر به ضرر و زیان های عظیم، که ناشی از ظهور و تکامل تقلب در بانکداری آنلاین ، از قبیل کلاهبرداری فیشینگ، الودگی بد افزار و وب سایت های شبح است. تشخیص موثر و کارآمد تقلب بانکی اینترنتی به عنوان یک چالش عمده برای تمام بانک ها در نظر گرفته شده ، و از علل افزایش نگرانی است.
یک سیستم تشخیش کلاهبرداری انلاین بانکی می تواند شامل استفاده از روش اینترنت (W2T) و چیز های گسترده باشد [۶۳-۶۶]. به این علت موقع جمع آوری داده ها چند جنبه از مشتریان بانکداری آنلاین خواسته می شود ، از جمله اطلاعات دموگرافیک، داده های معامله بانکی آنلاین ، اطلاعات تراکنش کارت اعتباری و انواع دیگر از داده های معامله. این داده ها از طریق اینترنت / WWW و SEA به شبکه بانکداری آنلاین و مرکز داده های مشتری منتقل می شود. مرکز داده یک پلت فرم برای کل فرایند تشخیص تقلب در بانکداری آنلاین را فراهم می کند. این یک چرخه اطلاعات کامل از اطلاعاتی ناهمگن ، و دانش در دنیای فیزیکی برای ارائه خدمات فعال در جهان مجازی به مشتریان اجتماعی است. مشتریان بانکداری آنلاین (در جهان اجتماعی)، همه چیز (در جهان فیزیکی)، و سیستم های کامپیوتری (در دنیای سایبر) یک نهاد یکپارچه برای تحقق بخشیدن به هماهنگی و همزیستی با استفاده از یک چرخه داده W2T هستند. در این چرخه، فرآیند تشخیص کلاهبرداری یک وظیفه مهم است.
تقلب در بانکداری اینترنتی نمایانگر ویژگی های پیچیده خاص است (به بحث های مفصل در بخش ۲٫۱ نگاه کنید) :
– مشتریان مشکوک فعال و هوشمند در انجام فعالیت های بانکی جعلی ،
– رفتار جعلی بسیار پویا ،
– تقلب پنهان و متنوع در رفتار مشتری ، مربوط به تقلب در معاملات بسیاری از مجموعه داده های بزرگ پراکنده و نامتوازن، و
– وقوع تقلب در یک زمان بسیار محدود که نیاز به تشخیص زمان واقعی دارند.
تقلب در بانکداری آنلاین نیاز به تشخیص فوری دارد ، دلیل آن بازیابی موارد از دست رفته در صورت انجام کلاهبرداری است. اکثر مشتریان معمولا به ندرت تاریخ بانکی آنلاین خود را به طور منظم چک می کنند و بنابراین قادر به کشف و گزارش معاملات جعلی بلافاصله پس از وقوع یک کلاهبرداری نیستند. این باعث می شود امکان بازیابی موارد از دست رفته بسیار کم شود. علاوه بر این، تمام هشدارهای تولید شده از سیستم تشخیص باید به صورت دستی بررسی شود، که بسیار وقت گیر است. سیستم های تشخیص بانکداری آنلاین دارای دقت بالا، نرخ تشخیص بالا و کنترل تعداد هشدار در تجارت پیچیده بانکداری آنلاین هستند.
ویژگی های بالا و الزامات تجارت تا حد زیادی روش های تشخیص تقلب و مدل های داده کاوی موجود را برای حفاظت از معاملات کارت اعتباری، تجارت الکترونیک، بیمه، خرده فروشی، ارتباطات راه دور، کامپیوتر، و غیره به چالش می کشد ، این روش ها عملکرد ضعیف در بهره وری و / یا دقت در زمانی که برای تشخیص تقلب در بانکداری آنلاین استفاده می شود را نشان می دهد [۳۵]. به عنوان مثال، کارت اعتباری و یا تشخیص تقلب مخابراتی اغلب در کشف الگوهای رفتاری خاص از یک مشتری خاص و یا گروه رخ می دهد، اما معاملات بانکی آنلاین مربوط به سرقت تمرکز بسیار پویا است و بسیار شبیه به رفتار مشتری واقعی به نظر می رسد. برخی از روش های تشخیص نفوذ در یک محیط کامپیوتر پویا به خوبی انجام شده، اما آن ها نیاز به مقدار زیادی از داده های آموزشی با سیاهه های مربوط به عنوان شواهد دارند. با این حال، هیچ مدرکی وجود ندارد که آشکار نشان دهد که یک تراکنش بانکی آنلاین جعلی است.
یک مورد امیدوار کننده به تازگی پدید آمده است که به دقت تفاوت بین رفتار های جعلی و واقعی را بررسی می کند، و روش های مربوطه و الگوهای مقابل را توسعه می دهد، به عنوان مثال، در مقابل مجموعه [۶] و الگوهای در حال ظهور [۲۴، ۲۵، ۵۲]. با این حال، آزمایش از روش های کلاسیک بر روی داده های بانکداری آنلاین واقعی نشان داده است که دقت و صحت آنها به دلیل چالش در تشخیص تقلب بانکداری آنلاین بسیار بالا است. علاوه بر این، با توجه به پژوهش [۶۱]، الگوی کنتراست به معنی یک مشکل سخت NP است، زمان زیادی هنگامی که تعداد ویژگی ها آن زیاد است صرف آن می شود ، و آستانه سرعت کشف و شناسایی آن کوچک است. بر اساس آزمایش های ما، روش الگوی کنتراست [۲۴] به طور موثر طرح بانکداری آنلاین را انجام نمی دهد.
تنها چند مقاله در مورد کنترل تقلب در بانکداری آنلاین [۳۵، ۳۷، ۴۴] وجود دارد. جریان اصلی سیستم های تشخیص تقلب بانکی آنلاین برای ایجاد قوانین برای فیلتر معاملات مشکوک که مشکلات مهمی ایجاد می کنند، از جمله نرخ مثبت کاذب بسیار بالا و نرخ تشخیص کم ، به کارشناسان تکیه می کنند. از همه مهمتر، اقتباس قوانین به پویایی تقلب و به تخصص دامنه به طور کامل وابسته هستند. کیفیت تشخیص تقلب بدون کنترل پایدار بسیار وقت گیر است ، و از طریق پیام رسان از قوانین پشتیبانی نمی کند.
بسیاری از حوادث و رفتارهای قبلی در زمان های مختلف مستقل بوده و اطلاعات ثبت شده در توالی رویداد را نادیده می گیرد. در بانکداری آنلاین، توالی فعالیت برای افتراق رفتار جعلی از رفتار واقعی مفید هستند. به عنوان مثال در جدول ۱ و ۲ نشان داده شده است. جدول ۱ دنباله دسترسی به صفحه وب توسط یک تروجان است، در حالی که جدول ۲ یک معامله واقعی از طریق یک مرورگر وب است. دو ویژگی متضاد بین این دو توالی وجود دارد. یکی این که تقلب کنار برخی از صفحات وب مانند homepage.aspx بعد از ورود و صفحه چاپ پس از تایید انتقال ناچیز برای ارسال معامله می باشد. دیگر این که معامله در کمتر از ۳ ثانیه پس از ورود به سیستم به پایان رسیده ، که بیش از حد برای یک کاربر معمول بانکداری آنلاین برای دستیابی از طریق یک مرورگر وب سریع است.
با استفاده از داده ها و ویژگی های تجارت فوق، این مقاله یک چارچوب موثر در شناسایی پیچیده تقلب بانکی اینترنتی پیشنهاد می کند. ایده اصلی، مزایا و کمک های حاصل از این چارچوب به شرح زیر است :
– این است که توسط تئوری مهندسی meta-synthetic [11] ، M-Computing [12] و حکمت وب از چیزهایی که [۶۶] الهام گرفته، یک راه حل سیستماتیک با ترکیب دانش دامنه، تجربه در سیستم تشخیص مبتنی بر قواعد ، مزایای استفاده از مدل های مختلف، و پالایش توسط کارشناسان فراهم می کند.
– این تعبیه ماژول سیستماتیک با انتخاب ویژگی ها بر اساس کسب اطلاعات، استخراج رفتار مقابل طبقه بندی ساختمان ، تولید نمره خطر کلی برای هر معامله در بانکداری آنلاین، و شناسایی الگوهای رفتاری جعلی را انجام می دهد. سیستم تشخیص تقلب بانکی آنلاین با هر سیستم بانکداری آنلاین و یا خدمات ارتباط برقرار نمی کند.
– ما نه تنها دنبال این اطلاعات رفتاری برای شناسایی الگوهای مقابل هستم، بلکه این روش جدید، برای ادغام رفتار های متوالی پایگاه داده برای استخراج الگوهای مقابل موثر است.
– این سیستم شامل ادغام چندین مدل داده کاوی ، هزینه شبکه های عصبی حساس [۶۷]، الگوی کنتراست ، و جنگل تصمیم است. از آنجا که مدل های مختلف کشف تقلب و الگوهای رفتاری واقعی از زوایای مختلف مورد برسی قرار می گیرد ، ترکیب آنها [۱۳] الگوهای رفتاری جامع تر ارائه می دهد.
– هر مدل را می تواند به راحتی در طول زمان از تغییرات در رفتار جعلی حفظ کنید.
– آزمایش های عظیم در یک بانک در استرالیا که سیستم و مدل های تشخیص نرخ بالاتر و سرعت کاذب پایین تر دارند از هر مدل داده کاوی کلاسیک سیستم مبتنی بر قواعد موجود مورد استفاده در تمام بانک های بزرگ استرالیا بهتر عملکرده است. علاوه بر این، سیستم ما عملکرد تشخیصی نسبتا خوب بر روی مجموعه داده بسیار نامتوازن و مدل الگوی کنتراست ایجاد می کند و به اصلاح بر روی داده های زمان واقعی کارآمد است. همچنین الگوهای رفتاری توالی کشف ، و اطلاعات بیشتری در مورد شواهد پزشکی قانونی برای تشخیص تقلب فراهم می کند.
ادامه مقاله به شرح زیر تدوین شده است. بخش ۲ ویژگی های تقلب بانکداری آنلاین در جزئیات و ارائه یک نمای کلی از کار مرتبط در کشف تقلب. بخش ۳ بیانیه مشکل و تعریف اصطلاحات را ارائه می دهد ، در حالی که بخش ۴ دقت و چارچوب تشخیص تقلب بانکی آنلاین در جزئیات را توضیح می دهد. روش مقابل استخراج الگوی با بردار مقابل در بخش ۵ معرفی و روش امتیازدهی خطر بر اساس مدل های ترکیب شده در بخش ۶ است. ارزیابی آزمایش ارائه شده در بخش ۷ مورد بحث است و ۸ نتایج و جهت تحقیقات آینده را نشان می دهد.

 

بخشی از مقاله انگلیسی

Abstract

Sophisticated online banking fraud reflects the integrative abuse of resources in social, cyber and physical worlds. Its detection is a typical use case of the broad-based Wisdom Web of Things (W2T) methodology. However, there is very limited information available to distinguish dynamic fraud from genuine customer behavior in such an extremely sparse and imbalanced data environment, which makes the instant and effective detection become more and more important and challenging. In this paper, we propose an effective online banking fraud detection framework that synthesizes relevant resources and incorporates several advanced data mining techniques. By building a contrast vector for each transaction based on its customer’s historical behavior sequence, we profile the differentiating rate of each current transaction against the customer’s behavior preference. A novel algorithm, ContrastMiner, is introduced to efficiently mine contrast patterns and distinguish fraudulent from genuine behavior, followed by an effective pattern selection and risk scoring that combines predictions from different models. Results from experiments on large-scale real online banking data demonstrate that our system can achieve substantially higher accuracy and lower alert volume than the latest benchmarking fraud detection system incorporating domain knowledge and traditional fraud detection methods.

۱ Introduction

With the widespread use of increasingly advanced Internet technology [15, 47, 60], online banking (also called Internet banking) is emerging as a major channel for retail and business banking. In contrast, fraudulent online banking activities are becoming more and more sophisticated, seriously threatening the security and trust of online banking business. Online banking fraud has become a serious issue in financial crime management for all banks. It is becoming ever more challenging and leads to massive losses, due to the emergence and evolution of sophisticated online banking fraud, such as phishing scams, malware infection and ghost web sites. Effective and efficient detection of Internet banking fraud is regarded as a major challenge to all banks, and is an increasing cause for concern. An online banking fraud detection system can be a typical use case of the broadbased Wisdom Web of Things (W2T) [63–۶۶] methodology. It has to timely gather multi-aspect data of online banking customers, including demographic data, online banking transaction data, credit card transaction data and other types of transaction data.These data will be transferred via the Internet/WWW and SEA-nets to an online banking customer data center. The data center provides a platform for the whole process of online banking fraud detection. It is a complete data cycle from acquisition of heterogeneous data, information, and knowledge in the physical world to the provision of active services in the cyber world to customers in the social world. Online banking customers (in the social world), things (in the physical world), and computer systems (in the cyber world) are integrated into an entity to realize their harmony and symbiosis by using an effective W2T data cycle. In this cycle, the process of fraud detection is one important task. Internet banking fraud exhibits certain sophisticated characteristics (see detailed discussions in Section 2.1): – suspicious customers are active and intelligent in conducting fraudulent banking activities, – fraudulent behavior is very dynamic, – fraud is hidden in diversified customer behavior, – fraud-related transactions are dispersed in highly imbalanced large data sets, and – the occurrences of fraud appear in a very limited time which requires real-time detection. The detection of online banking fraud needs to be instant, because it is very difficult to recover the loss if a fraud is undiscovered during the detection period. Most customers usually rarely check their online banking history regularly and are therefore not able to discover and report fraud transactions immediately after an occurrence of a fraud. This makes the possibility of loss recovery very low. In addition, all alerts generated from the detection system need to be manually investigated, which is very time-consuming. Online banking detection systems are therefore expected to have high accuracy, a high detection rate, and a low false positive rate for generating a small, manageable number of alerts in complex online banking business. The above characteristics and business requirements greatly challenge existing fraud detection techniques and data mining models for protecting credit card transactions, e-commerce, insurance, retail, telecommunication, computer intrusion, etc. These existing methods demonstrate poor performance in efficiency and/or accuracy when directly applied to online banking fraud detection [35]. For instance, credit card or telecommunication fraud detection often focuses on discovering particular behavior patterns of a specific customer or group, but fraud-related online banking transactions are very dynamic and appear very similar to genuine customer behavior. Some intrusion detection methods perform well in a dynamic computer environment, but they require a large amount of training data with complete attack logs as evidence. However, there is no obvious evidence to show whether an online banking transaction is fraudulent. A promising direction emerged recently that scrutinizes the difference between fraudulent and genuine behavior, and develops corresponding approaches for mining contrast patterns, for instance, contrast sets [6] and emerging patterns [24, 25, 52]. However, experiments of classic methods on real online banking data have shown that their accuracy is not very high because of the challenges in online banking fraud detection. In addition, according to the research in [61], contrast pattern mining is an NP hard problem, the time cost is expensive, especially when the number of attributes is large, and the threshold of minimal detection rate is small. Based on our experiments, the contrast pattern method in [24] does not perform efficiently in the online banking scenario. There are few papers about fraud control in online banking [35, 37, 44]. The mainstream online banking fraud detection systems rely on domain experts and knowledge to create rules for filtering suspicious transactions, which face critical problems, including very high false positive rates and low detection rates. More importantly, the adaptation of rules to fraud dynamics is fully dependent on domain expertise. This is very time-consuming, leaves the quality of fraud detection without sustainable control, and cannot support instant adjustment of rules. Most previous work treats events at different time points as independent and ignores the information incorporated in event sequences. In online banking, activity sequences are useful for differentiating fraudulent behavior from genuine behavior. An example is shown in Tables 1 and 2. Table 1 is a web page access sequence committed by a Trojan, while Table 2 is from a genuine transaction via a web browser. There are two contrasting features between these two sequences. One is that the fraud bypassed some web pages that are insignificant for submission of the transaction, such as homepage.aspx after login and the print page after the transfer confirmation. The other is that the transaction was completed within 3 seconds of login, which is too fast for a common online banking user to achieve via a web browser.Using the above data and business characteristics, this paper proposes an effective framework for detecting sophisticated Internet banking fraud efficiently. The main ideas, advantages and resulting contributions of this framework are as follows: – It is inspired by the theory of meta-synthetic engineering [11], M-Computing [12] and Wisdom Web of Things [66], and provides a systematic solution by synthesizing domain knowledge, experience learned in the rule-based detection system, advantages from multiple models, and refinement by domain experts. – It embeds systematic modules by selecting features based on information gain, extracting contrast behavior, building classifiers, generating an overall risk score for every online banking transaction, and identifying patterns of fraudulent behavior. This makes it a real time online banking fraud detection system that does not interfere with any existing online banking system or its service. – We not only construct sequence behavior information for identifying contrast patterns, but also propose a new method, a contrast vector, to integrate the sequential behavior contrast into the relational transaction database for mining more effective contrast patterns. – The system incorporates and integrates several data mining models, costsensitive neural network [67], contrast pattern mining, and decision forest. Because different models discover fraud and genuine behavior patterns from different angles, their combination [13] captures behavior patterns in a more comprehensive way. – Each model can be easily retrained over time to keep abreast of changes in fraud behavior. – Massive experiments in a major Australian bank show that our system and models have a higher detection rate and a lower false positive rate than any single classic data mining model, outperforming the existing rule-based system used in all major Australian banks. In addition, our system generates comparably good detection performance on highly imbalanced data sets and the modified contrast pattern mining model is efficient on real time data. The sequence behavior patterns discovered also provide more information about forensic evidence for fraud detection. The remainder of the paper is organized as follows. Section 2 describes the characteristics of online banking fraud in detail and presents an overview of related work on fraud detection. Section 3 gives a problem statement and definition of terminology, while Section 4 presents and explains the online banking fraud detection framework in detail. The method of contrast pattern mining with contrast vectors is introduced in Section 5 and the risk scoring method based on combined models is presented in Section 6. Experiment evaluation is discussed in Sections 7 and 8 provides conclusions and suggests future research directions.

 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا