
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Lưu Thị Thu
NGHIÊN CỨU PHÁT HIỆN GIAN LẬN TRONG GIAO DỊCH
THẺ TÍN DỤNG DỰA VÀO HỌC SÂU
CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN
MÃ SỐ: 8.48.01.04
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2021

Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS. NGUYỄN VĂN THỦY
Phản biện 1: ………………………………………………………………
Phản biện 2: ………………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông.

MỞ ĐẦU
1. Lý do chọn đề tài
Trong những năm qua, sự phát triển của các thiết bị thông minh cá nhân, ngân hàng
số đang làm thay đổi hành vi tiêu dùng như mua bán trực tuyến, chuyển tiền và cho vay trực
tuyến. Cũng vì vậy mà ngày càng nhiều vụ việc gian lận trong lĩnh vực tài chính, ngân hàng
liên quan đến thẻ tín dụng được phát hiện trên toàn cầu. Các dịch vụ giao dịch lớn thường bị
tội phạm mạng để mắt đến và thực hiện tấn công nhằm gian lận trong giao dịch thẻ tín dụng.
Gần đây gian lận thẻ tín dụng phát triển đáng báo động. Trong khi số lượng giao dịch ngày
càng lớn, thời gian xử lý mỗi giao dịch ngày càng phải rút ngắn, thì việc phát triển kỹ thuật
phát hiện và ngăn chặn gian lận thẻ tín dụng là cần thiết để chống lại các hoạt động tài chính
phi pháp. Để ngăn chặn các hành vi gian lận và rửa tiền, các ngân hàng đang gấp rút chuyển
đổi, thích ứng dựa vào công nghệ để chống lại các mối đe dọa, gian lận từ bên ngoài.
Gian lận không có hình mẫu cố định. Tội phạm luôn thay đổi hành vi để giảm thiểu
nguy cơ bị phát hiện. Những kẻ gian lận tìm hiểu về công nghệ mới cho phép họ có thể thực
hiện các hành vi gian lận thông qua các giao dịch trực tuyến. Kẻ gian lận giả định hành vi
thường xuyên của người tiêu dùng và các mô hình gian lận thay đổi nhanh. Chúng thực hiện
gian lận một lần thông qua các phương tiện trực tuyến và sau đó chuyển sang phương tiện
kỹ thuật khác.
Với mong muốn tìm hiểu sâu về lĩnh vực trí tuệ nhân tạo, đặc biệt là các giải thuật và
mô hình học sâu, cũng như cách áp dụng vào nghiệp vụ ngân hàng, học viên lựa chọn đề tài
“Nghiên cứu phát hiện gian lận trong giao dịch thẻ tín dụng dựa vào Học sâu ” làm luận văn
tốt nghiệp thạc sĩ của mình.
2. Tổng quan về vấn đề nghiên cứu
Trong lĩnh vực ngân hàng, hệ thống phát hiện gian lận (Failure Detection system
(FDS)) không chỉ phát hiện gian lận đúng mà phải đảm bảo chi phí cho việc kiểm tra giao
dịch đó là gian lận hay không, không nên cao hơn so với tổn thất do gian lận. Bhatla chỉ ra
rằng việc sàng lọc chỉ 2% giao dịch có thể giúp giảm thiệt hại do gian lận chiếm 1% tổng
giá trị giao dịch. Để giảm thiểu chi phí cho việc phát hiện gian lận các chuyên gia sử dụng
các mô hình dựa trên học máy (machine learning) để phát hiện gian lận và giúp các nhà điều
tra chỉ xem xét những trường hợp có nguy cơ cao. Mô hình dự đoán sẽ cho điểm từng giao
dịch có rủi ro gian lận cao hoặc thấp rồi đưa ra cảnh báo các giao dịch rủi ro đó có gian lận
hay không gian lận. Những phản hồi này sau đó được sử dụng để cải thiện mô hình dự

2
đoán. Mô hình dự đoán được xây dựng dựa trên các quy tắc của chuyên gia, tức là các quy
tắc dựa trên kiến thức từ các chuyên gia phát hiện gian lận, quy tắc này đòi hỏi sự điều
chỉnh thủ công và sự giám sát của con người.
Nghiên cứu phát hiện gian lận trong giao dịch thẻ tín dụng dựa vào Deep Leaning mở
ra một phương pháp phát hiện các gian lận và dự đoán các giao dịch có thể là gian lận. Luận
văn sẽ tập trung nghiên cứu các vấn đề liên quan đến việc phát hiện các hiện tượng bất thường
(gian lận) trên tập dữ liệu mất cân đối, ở đây tập dữ liệu được tải xuống từ trang web
(https://www.kaggle.com/dalpozz/creditcardfraud). Cách xây dựng, áp dụng mô hình bộ mã
hóa tự động (Autoencoder) để dự báo các hiện tượng bất thường ứng dụng vào bài toán thực
tế phát hiện gian lận trong giao dịch thẻ tín dụng.
Autoencoder hay còn gọi là bộ mã hóa tự động là một mạng neural nhân tạo có đầu
ra của mạng giống hệt với đầu vào. Autoencoder cho phép khái quát hóa các đặc trưng quan
trọng nhất của các sự kiện bình thường. Sau quá trình huấn luyện, mô hình có khả năng tái
tạo khá hiệu quả với các sự kiện bình thường, nhưng đối với các hiện tượng gian lận, sự
kiện gian lận bất thường lại gây ra hiện tượng gian lận. Vì thế những dữ liệu sau khi chạy
qua mô hình huấn luyện Autoencoder có các đặc trưng khác so với đầu vào thì có khả năng
là sự kiện gian lận trong giao dịch.
3. Mục đích nghiên cứu
Luận văn tập trung nghiên cứu, áp dụng mô hình Autoencoder vào bài toán phát hiện
gian lận, nhận ra gian lận trong giao dịch thẻ tín dụng; đánh giá mô hình Autoencoder có
sẵn vào bài toán phát hiện gian lận, nhận ra gian lận trong giao dịch thẻ tín dụng.
4. Đối tượng và phạm vi nghiên cứu.
Đối tượng nghiên cứu
Đối tượng nghiên cứu của luận văn là mô hình mạng neural nhân tạo có thể nhận
dạng được các sự kiện bất thường, cụ thể là mô hình Autoencoder cho bài toán phát hiện
gian lận trong giao dịch thẻ tín dụng.
Phạm vi nghiên cứu
Luận văn sẽ sử dụng bộ dữ liệu thực nghiệm là tập dữ liệu được tải xuống từ trang web
(https://www.kaggle.com/dalpozz/creditcardfraud) để làm dữ liệu nghiên cứu.
5. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết: Nghiên cứu tổng quan về các mô hình phát hiện
bất thường.

3
- Phương pháp thực nghiệm:
+ Xây dựng mô hình, môi trường để huấn luyện mô hình Autoencoder
+ Thực nghiệm và đánh giá kết quả
CHƯƠNG 1 - CƠ SỞ LÝ LUẬN
1.1. Khái niệm về hiện tượng gian lận (bất thường)
1.1.1. Định nghĩa hiện tượng gian lận
Giao dịch điện tử, thanh toán không dùng tiền mặt ngày càng phát triển mang lại sự tiện lợi,
tính minh bạch trong thanh toán cho các cá nhân, tổ chức. Tuy nhiên, sự phát triển của giao dịch
điện tử cũng kéo theo sự gia tăng nguy cơ mất an toàn thanh toán, gian lận, lừa đảo tài chính đối với
người dùng. Có nhiều công trình nghiên cứu về gian lận, bất thường vì thế có nhiều công trình
nghiên cứu đã đưa ra nhiều khái niệm về gian lận. Thuật ngữ “gian lận” thẻ tín dụng là hình
thức gian lận sử dụng công nghệ cao để đánh cắp thông tin thẻ tín dụng (Visa, MasterCad,
ATM...) của người sử dụng thuộc về lĩnh vực tài chính, ngân hàng.
1.1.2 Phát hiện gian lận (bất thường).
Phát hiện gian lận (cũng là phát hiện, bất thường, ngoại lai) là việc xác định các sự
kiện khác biệt so với dữ liệu còn lại. Gian lận hay còn gọi là bất thường, ngoại lai, sai lệch
hoặc bất thường trong tập dữ liệu và việc thống kê những hiện tượng gian lận, bất thường
trong tập dữ liệu ban đầu. Trong các trường hợp, dữ liệu được tạo bởi một hoặc nhiều quá
trình sinh ra, có thể không đạt chỉ tiêu đại diện cho hoạt động trong hệ thống mà còn có thể
quan sát được các thực thể còn lại. Khi các hoạt động gian lận (bất thường) sinh ra trong quá
trình hoạt động, nó tạo ra các gian lận (anomalies) hoặc các ngoại lai (outliers).
1.2. Giới thiệu các ứng dụng của AI với ngân hàng và hình thức gian lận
thẻ tín dụng.
1.2.1 Các ứng dụng của AI hiện tại trong hoạt động ngân hàng
Chatbots cho dịch vụ khách hàng
Chatbots được xem là ứng dụng đầu tiên và dễ thấy nhất sức ảnh hưởng của AI được áp
dụng trong hoạt động của ngân hàng mà không cần đến sự can thiệp của nhân viên ngân hàng. AI
có thể nhận ra hàng chục nghìn giao dịch và các câu hỏi phổ biến mà khách hàng có thể hỏi.
Phát hiện gian lận và chống rửa tiền
Để đối mặt với việc các gian lận và chống rửa tiền Anti-Money Laundering (AML)
thì các ngân hàng đang nhanh chóng chuyển đổi và thích ứng công nghệ để chống lại các
mối đe dọa và gian lận. Các giải pháp kích hoạt AI và các mô hình tài chính tiên tiến mới sẽ

