رشته فناوری اطلاعات (IT)
این پایان نامه در مورد داده کاوی و با عنوان استفاده از داده کاوی برای ضد پولشویی و کشف تقلب می باشد. هدف از این پایان نامه شناسایی جرایم پولشویی در بانکها با استفاده داده کاوی می باشد.
دادهکاوی عبارت است از تحلیل دادهها بهمنظور کشف روابطِ از قبل نامعلومی که اطلاعات مفیدی ارائه میکنند. کشف تقلب به یکی از جا افتادهترین کاربردهای دادهکاوی چه در صنعت و چه در دولت تبدیل شده است. هر چند بستههای نرمافزاری تجاری مختلفی با محیط تعاملی آسان برای کاربران، در حال حاضر در دسترس هستند که انجام کارهای پیچیده دادهکاوی را بهظاهر آسان میکنند و الگوریتمهای دادهکاوی بسیاری برای کشف تقلب مورد استفاده قرار گرفتهاند، اما کاربرد آنها، همچنان از چارچوب سنتی دادهکاوی یعنی انتخاب ویژگی، نمایندگی، گرداوری و مدیریت دادهها، پیشپردازش، دادهکاوی، پسپردازش و ارزیابی عملکرد پیروی میکند.
پرکاربردترین روشهای دادهکاوي برای کشف تقلبهای مالی عبارتند از مدلهای رگرسیون لجستیک (رایجترین)، شبکههای عصبی، شبکه استنباط بیزین و درخت تصمیم که همه آنها راهحلهای قابل توجهي را برای مشکلات ذاتی در کشف و طبقهبندی دادههای تقلبي ارائه میکنند [17]
دادهکاوی اين توان را دارد که سناریوهای جدیدی برای کشف نمونههای پولشویی ارائه دهد.دادهکاوی به عنوان فرايندي خودکار برای استخراج اطلاعات و الگوهای جالب توجه، بارز، ضمنی، از قبل ناشناخته و بالقوه مفید از انبار دادههای حجیم، شناخته می شود. . هنگامی که الگوریتمها و تکنیکهای دادهکاوی روی چنین تراکنشهایی اعمال می شوند، الگوهای پنهان از جریان وجوه را پرده برداری میکنند [21]همراه شدن اطلاعات مشتری و دانش فرد خبره منجر به آن میگردد که معاملات مشکوک به طور همروند با زمان اتفاق افتادنشان شناسائی شوند.سیستم ضد پولشويي قابلیت اجرا با الگوریتمهای نظارت شده و بدون نظارت را به طور همزمان دارد.در این سیستم علاوه بر به کارگیری الگوریتمهای رایج در دادهکاوی، شاخصهایی محاسبه میشوند که میتوانند بخوبی ملاکی برای میزان مشکوک بودن عملکرد یک مشتری باشند و بر اساس آن شاخصها، دادههای پرت (خارج از محدوده ) تفکیک و شناسائی شوند.
فهرست مطالب
1 فصل اول کلیات تحقیق 1
1.1 تعریف مسأله و بیان سئوالهاي اصلی تحقیق 2
1.2 اهمیت و ضرورت پژوهش 3
1.3 اهداف پژوهش 4
1.4 روش پژوهش 5
1.5 جامعۀ تحقیق 5
2 فصل دوم مطالعه پولشویی، دادهکاوی و ارتباط این دو دیباچه 8
2.1 پولشویی و بررسی ابعاد آن 10
2.1.1 مفهوم پولشویی 10
2.1.2 تاریخچه و خاستگاه پولشویی 11
2.1.3 ایران و ریسک پولشويي 13
2.1.4 انواع پولشويي 14
2.1.5 مراحل پولشويي 14
2.1.6 روشهای پولشويي 16
2.1.7 موارد مشکوک به پولشویی در بانکها و مؤسسات اعتباری 19
2.1.8 ضرورت بهره گیری از راه حلهای ضد پولشويي 24
2.1.9 روشهای مبارزه با پولشویی 25
2.1.10 وظایف و اصول الزامی برای بانکها و مؤسسات اعتباری در مبارزه با پولشویی 33
2.1.11 انواع گزارشهای مفید جهت شناسایی موارد مشکوک 42
2.2 دادهکاوی 46
2.2.1 تاریخچه دادهکاوی 46
2.2.2 چارچوبی کلی برای الگوریتمهای دادهکاوی 48
2.2.3 کاربرد دادهکاوی در کشف تقلبات مالی 51
2.2.4 پرکاربردترین روشهای دادهکاوي برای کشف تقلبهای مالی 58
2.2.5 رویکرد دادهکاوی در حل مسائل پولشویی 60
2.2.6 برخی تحقیقات مرتبط 67
2.3 جمع بندی 71
3 فصل سوم ارائه طرح سیستم ضد پولشویی با دادهکاوی 75
3.1 روششناسی تحقیق 76
3.1.1 روش تحقیق 76
3.2 شیوهها و ابزارهای جمعآوری دادهها 78
3.2.1 بررسی دادههای قابل دریافت 78
3.2.2 بررسی سایر اطلاعات موجود در بانك 79
3.2.3 بررسی محدودیتهای بانك در ارائه اطلاعات 79
3.2.4 بررسی محدودیتهای بانك اطلاعاتی 79
3.2.5 مشخص شدن دادههای مورد نیاز برای فازهای مختلف پروژه . 80
3.2.6 ارائه فرمت دریافت اطلاعات از بانك اطلاعاتی . 80
3.2.7 حجم ، زمان و مکان مورد نیاز جهت ارائه اطلاعات . 81
3.2.8 آمایش دادهها 81
3.3 جامعه نظری و روش نمونهگیری 82
3.4 مفروضات تحقیق 83
3.5 شیوه تجزیه و تحلیل دادهها 84
3.5.1 مرور پیشینه تحقیق 84
3.5.2 نظرخواهی از خبرگان 85
3.5.3 بررسی اسناد و مدارک آرشیوی 94
3.5.4 طراحی مدل ضد پولشویی بر اساس دادهکاوی 98
3.5.5 جمع بندی 106
4 فصل چهارم اجراي تحقیق دیباچه 107
4.1 جزئیات پیادهسازی مدل 108
4.1.1 آمایش دادهها 108
4.1.2 دسته بندی اطلاعات براساس شاخصهای خطی و جدا نمودن بخش مشکوک 109
4.1.3 فیلترینگ و جداسازی اطلاعات مناسب 112
4.1.4 خوشه بندی 116
4.1.5 اجرای الگوریتم نظارتشده 127
4.1.6 جمعآوری نتایج 129
4.2 ارزیابی 129
4.2.1 نحوه تست 130
4.2.2 محاسبه معیارهای Precision، Recall، Specificity و Sensitivity 131
4.3 نتیجه گیری 133
5 فصل پنجم جمعبندی و نتیجهگیری دیباچه 134
5.1 نتیجه گیری 135
5.2 محدودیتهای پژوهش 137
5.3 پیشنهاد برای پژوهشهای آینده 138
6 مراجع 140
فهرست شکلها
شکل 2 1 مدل CRISP-DM 34
شکل 2 2 روشهای استفاده شده برای کشف انواع تقلبات مالی 36
شکل 3 1 فلوچارت کشف موارد پولشوئی با دادهکاوی 72
شکل 4 1 توزیع شاخص MLI 79
شکل 4 2 توزیع شاخص MLISQR 79
شکل 4 3 نمودار واریز نقدی مشتریان 80
شکل 4 4 مراحل ایجاد شاخص MLISQR 81
شکل 4 5 جدول دادههای تفکیك شده بر اساس شاخص پولشویی(MLISQR) 82
شکل 4 6 هیستوگرام مجموع واریز در خوشهبندی ایام 84
شکل 4 7 هیستوگرام مجموع برداشت در خوشه بندی ایام 84
شکل 4 8 هیستوگرام تعداد واریز در خوشه بندی ایام 85
شکل 4 9 هیستوگرام تعداد برداشت در خوشه بندی ایام 85
شکل 4 10 خوشهبندی توسط کامینز، کوهنن، گروه متناظر 86
شکل 4 11 خوشه بندی گروه متناظر مدل اول 87
شکل 4 12 خوشه بندی گروه متناظر مدل دوم 88
شکل 4 13 خوشهبندی گروه متناظر مدل سوم 89
شکل 4 14 جدا کردن خوشه اکثریت 90
شکل 4 15 خوشهبندی توسط کامینز و کوهنن 91
شکل 4 16 اجرای الگوریتمهای نظارتشده 93
فهرست جداول
جدول 4 1 معیارهای ارزیابی 95
جدول 4 2 محاسبه معیارهای ارزیابی برای شبکه عصبی 95