HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Lưu Thị Thu
NGHIÊN CỨU PHÁT HIỆN GIAN LẬN TRONG GIAO DỊCH
THẺ TÍN DỤNG DỰA VÀO HỌC SÂU
CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN
MÃ SỐ: 8.48.01.04
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2021
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS. NGUYỄN VĂN THỦY
Phản biện 1: ……………………………………………………………
Phản biện 2: ……………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông.
M ĐẦU
1. Lý do chọn đề tài
Trong những năm qua, sự phát triển của các thiết bị thông minh nhân, ngân hàng
số đang làm thay đổi hành vi tiêu dùng như mua bán trực tuyến, chuyển tiền và cho vay trực
tuyến. Cũng vậy ngày càng nhiều vụ việc gian lận trong nh vc tài chính, ngân hàng
liên quan đến thẻ tín dụng được phát hiện trên toàn cầu. Các dịch vụ giao dịch lớn thường b
tội phạm mạng để mắt đến và thực hiện tấn công nhằm gian lận trong giao dịch thẻ tín dụng.
Gần đây gian lận thẻ n dụng phát triển đáng báo động. Trong khi slượng giao dịch ngày
càng lớn, thời gian xmỗi giao dịch ngày càng phải rút ngắn, thì việc phát triển kthuật
phát hiện ngăn chặn gian lận thtín dụng là cần thiết để chống lại các hot động tài chính
phi pháp. Để ngăn chặn các hành vi gian lận và rửa tiền, các ngân hàng đang gấp rút chuyển
đổi, thích ứng dựa vào công nghệ để chống lại các mối đe dọa, gian lận từ bên ngoài.
Gian lận không hình mẫu cố định. Tội phạm luôn thay đổi hành vi để giảm thiểu
nguy bị phát hiện. Những kgian lận tìm hiểu về công nghệ mới cho phép họ thể thực
hiện các hành vi gian lận thông qua các giao dịch trực tuyến. Kẻ gian lận giả định hành vi
thường xuyên của người tiêu dùng và các hình gian lận thay đổi nhanh. Chúng thực hiện
gian lận một lần thông qua các phương tiện trực tuyến sau đó chuyển sang phương tiện
kỹ thuật khác.
Với mong muốn tìm hiểu sâu vnh vực trí tuệ nhân tạo, đặc biệt là các giải thuật và
mô hình học sâu, cũng như cách áp dụng o nghiệp vụ ngân ng, học viên lựa chọn đề tài
“Nghiên cứu phát hiện gian lận trong giao dịch thtín dụng dựa vào Hc sâu m luận văn
tốt nghiệp thạc sĩ ca mình.
2. Tổng quan về vấn đề nghiên cứu
Trong lĩnh vực ngân hàng, h thống phát hiện gian lận (Failure Detection system
(FDS)) không chỉ phát hiện gian lận đúng phải đảm bảo chi phí cho việc kiểm tra giao
dịch đó là gian lận hay không, không nên cao hơn so với tổn thất do gian lận. Bhatla chỉ ra
rằng việc sàng lọc chỉ 2% giao dịch thể giúp giảm thiệt hại do gian lận chiếm 1% tổng
giá trị giao dịch. Để giảm thiểu chi phí cho việc phát hiện gian lận c chuyên gia sử dụng
các mô hình dựa trên học máy (machine learning) để phát hiện gian lận và giúp các nhà điều
tra chỉ xem xét những trường hợp có nguy cao. nh dự đoán sẽ cho điểm từng giao
dịch ri ro gian lận cao hoặc thấp rồi đưa ra cảnh báo các giao dịch ri ro đó gian lận
hay không gian lận. Những phản hồi này sau đó được sử dụng để cải thiện hình dự
2
đoán. hình dự đoán được y dựng dựa trên các quy tắc của chuyên gia, tức các quy
tắc dựa trên kiến thức từ các chuyên gia phát hiện gian lận, quy tắc y đòi hỏi sđiều
chỉnh thủ ng và sự giám sát của con người.
Nghiên cứu phát hiện gian lận trong giao dịch thẻ tín dụng dựa vào Deep Leaning mở
ra một phương pháp phát hiện c gian lận d đoán các giao dịch thể là gian lận. Luận
văn sẽ tập trung nghiên cứu các vấn đề liên quan đến việc phát hin các hiện tượng bất thường
(gian lận) trên tập dữ liệu mất cân đối, đây tập dữ liệu được tải xuống từ trang web
(https://www.kaggle.com/dalpozz/creditcardfraud). Cách xây dựng, áp dụng nh bộ
hóa tđộng (Autoencoder) để dự báo c hiện tượng bất thường ứng dụng vào bài tn thực
tế phát hiện gian lận trong giao dch thẻ tín dụng.
Autoencoder hay còn gọi bộ a tự động một mạng neural nhân tạo có đầu
ra của mạng giống hệt với đầu vào. Autoencoder cho phép khái quát hóa các đặc trưng quan
trọng nhất của c sự kiện nh thường. Sau quá trình huấn luyện, nh khả ng tái
tạo khá hiệu quả với các sự kiện bình thường, nhưng đối với các hiện tượng gian lận, sự
kiện gian lận bất thường lại gây ra hiện tượng gian lận. thế những dữ liệu sau khi chạy
qua hình huấn luyện Autoencoder c đặc trưng khác so với đầu vào thì khả năng
là sự kin gian lận trong giao dịch.
3. Mục đích nghiên cứu
Luận văn tập trung nghiên cứu, áp dụng mô hình Autoencoder vào i toán phát hiện
gian ln, nhận ra gian lận trong giao dịch thẻ tín dụng; đánh giá hình Autoencoder
sẵn vào bài toán phát hiện gian lận, nhận ra gian lận trong giao dịch th tín dụng.
4. Đối tượng và phạm vi nghiên cứu.
Đối ng nghiên cứu
Đối ợng nghiên cứu của luận văn hình mạng neural nhân tạo thể nhận
dạng được các sự kiện bất thường, cụ thể mô hình Autoencoder cho i toán phát hiện
gian lận trong giao dịch thẻ tín dụng.
Phạm vi nghiên cứu
Luận n ss dụng b d liệu thc nghiệm tập dữ liu được tải xuống ttrang web
(https://www.kaggle.com/dalpozz/creditcardfraud) đm dliu nghiên cứu.
5. Phương pháp nghiên cứu
- Phương pháp nghiên cứu thuyết: Nghiên cứu tổng quan về các hình phát hiện
bất thường.
3
- Phương pháp thực nghiệm:
+ Xây dựng mô hình, môi trường để huấn luyện mô hình Autoencoder
+ Thực nghiệm và đánh giá kết quả
CHƯƠNG 1 - SỞ LÝ LUẬN
1.1. Khái niệm về hiện tượng gian lận (bất thường)
1.1.1. Định nghĩa hiện tượng gian lận
Giao dịch điện tử, thanh toán không ng tiền mặt ngày càng phát triển mang lại sự tiện lợi,
tính minh bạch trong thanh toán cho các nhân, tổ chức. Tuy nhiên, sự phát triển của giao dịch
điện tử cũng kéo theo sự gia tăng nguy cơ mất an tn thanh toán, gian lận, lừa đảo tài chính đối với
người dùng. Có nhiu công trình nghiên cứu về gian lận, bất thường vì thế có nhiều công trình
nghiên cứu đã đưa ra nhiều khái niệm vgian lận. Thuật ng“gian lậnthẻ n dụng hình
thức gian lận sdụng công nghệ cao để đánh cp tng tin thẻ tín dụng (Visa, MasterCad,
ATM...) ca người sử dụng thuộc về lĩnh vực tài chính, ngân hàng.
1.1.2 Phát hiện gian lận (bất thường).
Phát hiện gian lận (cũng phát hin, bất thường, ngoại lai) là vic xác định các s
kiện khác biệt so với d liệu còn lại. Gian lận hay còn gọi là bất thường, ngoại lai, sai lệch
hoặc bất thường trong tập dữ liu việc thống kê những hiện tượng gian lận, bất thường
trong tập dữ liệu ban đầu. Trong các trường hợp, dữ liệu được tạo bởi một hoặc nhiều quá
trình sinh ra, thkhông đạt chtiêu đại diện cho hoạt động trong hệ thống còn th
quan sát được các thực thể còn lại. Khi các hoạt động gian lận (bất thường) sinh ra trong quá
trình hoạt động, nó tạo ra các gian lận (anomalies) hoặc các ngoi lai (outliers).
1.2. Giới thiệu các ứng dụng của AI với ngân hàng hình thc gian lận
thẻ tín dụng.
1.2.1 Các ứng dụng ca AI hiện tại trong hoạt động ngân hàng
Chatbots cho dịch vụ khách hàng
Chatbots được xem ng dụng đầu tiên d thấy nhất sc ảnh ởng ca AI được áp
dụng trong hoạt động ca ngânng kng cần đến s can thiệp của nn vn nnng. AI
có th nhn ra ng chục nghìn giao dch và c u hỏi phbiến mà khách ng có thhỏi.
Phát hiện gian lận và chống rửa tiền
Để đối mặt với việc các gian lận và chống rửa tiền Anti-Money Laundering (AML)
thì các ngân hàng đang nhanh chóng chuyển đổi thích ứng ng nghệ để chống li các
mối đe dọa gian lận. Các giải pháp kích hoạt AI các mô hình tài chính tiên tiến mới sẽ