
TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
TRƯỜNG CÔNG NGHỆ
----------------
KHÓA LUẬN TỐT NGHIỆP
Nghiên cứu và cài đặt thử nghiệm mô
hình phát hiện gian lận thẻ tín dụng
Tên sinh viên : Cấn Thu An
Giảng viên hướng dẫn : TS. Lương Văn Thiện
Hà Nội, 5/2025
2025.2 CÔNG NGHỆ THÔNG TIN CẤN THU AN 11218439

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN
TRƯỜNG CÔNG NGHỆ
----------------
KHÓA LUẬN TỐT NGHIỆP
Nghiên cứu và cài đặt thử nghiệm mô hình
phát hiện gian lận thẻ tín dụng
Tên sinh viên : Cấn Thu An
Mã sinh viên : 11218439
Lớp : Công nghệ thông tin K63A
Ngành : Công nghệ thông tin
Khoa : Công nghệ thông tin
Giảng viên hướng dẫn : TS. Lương Văn Thiện
(Chữ ký GVHD)
Hà Nội, 5/2025

i
MỤC LỤC
MỤC LỤC .............................................................................................................. i
LỜI CAM ĐOAN ................................................................................................ iv
LỜI CẢM ƠN ....................................................................................................... v
DANH MỤC CÁC TỪ VIẾT TẮT .................................................................... vi
DANH MỤC BẢNG, BIỂU ĐỒ ........................................................................ vii
DANH MỤC HÌNH ........................................................................................... viii
MỞ ĐẦU ............................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN VỀ ĐỀ TÀI ........................................................... 2
1.1. Bối cảnh về việc dùng thẻ tín dụng ............................................................. 2
1.2. Gian lận thẻ tín dụng (Credit card fraud) ..................................................... 2
1.2.1. Phương pháp gian lận phổ biến ............................................................. 3
1.2.1.1. Skimming (Sao chép thông tin thẻ) .................................................... 3
1.2.1.2. Phishing (Lừa đảo qua email/tin nhắn) .............................................. 4
1.2.1.3. Identity (Đánh cắp danh tính) ............................................................ 4
1.2.2. Gian lận thẻ tín dụng trong ngân hàng .................................................. 5
1.2.3. Thách thức trong phát hiện gian lận thẻ tín dụng .................................. 6
1.3. AI/ML trong phát hiện gian lận ................................................................... 7
1.4. Giới thiệu về đề tài ....................................................................................... 8
1.4.1. Mục tiêu và phạm vi của đề tài ............................................................. 8
1.4.2. Đề xuất mô hình bài toán ...................................................................... 8
1.4.3. Đóng góp của đề tài ............................................................................... 9
1.4.3.1. Đóng góp khoa học ............................................................................ 9
1.4.3.2. Đóng góp thực tiễn ............................................................................. 9
1.4.3.3. Đóng góp về công cụ và tài liệu nghiên cứu ...................................... 9
1.5. Công cụ triển khai đề tài ............................................................................ 10
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT .................................................................. 11
2.1. Bối cảnh của phát hiện gian lận thẻ tín dụng ............................................. 11
2.1.1. Gian lận thẻ tín dụng (Credit card fraud) ............................................ 11
2.1.2. Phát hiện gian lận thẻ tín dụng (Credit card fraud detection) ............. 14
2.2. Phương pháp phát hiện gian lận................................................................. 15
2.2.1. Các phương pháp phát hiện gian lận truyền thống .............................. 15

ii
2.2.1.1. Quy tắc phát hiện dựa trên ngưỡng (Rule-based Detection) ............ 15
2.2.1.2. Hệ thống chuyên gia (Expert Systems) ............................................ 16
2.2.2. Ứng dụng AI/ML trong phát hiện gian lận ......................................... 17
2.2.2.1. Ứng dụng AI/ML trong phát hiện gian lận thẻ tín dụng .................. 18
2.2.2.2. Thách thức khi áp dụng AI/ML vào triển khai thực tế..................... 19
CHƯƠNG 3. PHƯƠNG PHÁP HỌC MÁY VÀ HỌC SÂU .......................... 22
(MACHINE LEARNING AND DEEP LEARNING APPROACH) ....... Error!
Bookmark not defined.
3.1. Kỹ thuật xử lý dữ liệu mất cân bằng (Imbalanced Data) ........................... 22
3.1.1. Vấn đề mất cân bằng lớp (Class Imbalance Problem) ........................ 22
3.1.2. Các kỹ thuật xử lý mất cân bằng (Resampling Techniques) ............... 23
3.1.2.1. Undersampling ................................................................................. 23
3.1.2.2. Oversampling ................................................................................... 24
3.1.2.3. SMOTE + Tomek Links (Undersampling) ...................................... 27
3.2. Ensemble Learning .................................................................................... 29
3.2.1 Basic Ensemble Techniques ................................................................. 29
3.2.2. Advanced Ensemble Techniques ........................................................ 30
3.3. Các mô hình AI/ML được sử dụng ............................................................ 31
3.3.1. Sơ đồ quy trình (Workflow) ................................................................ 31
3.3.2. XGBoost .............................................................................................. 32
3.3.3. Random Forest .................................................................................... 34
3.3.4. CatBoost .............................................................................................. 35
3.3.4. MLP ..................................................................................................... 36
3.4. Đánh giá mô hình ....................................................................................... 37
3.4.1. Evaluation metrics ............................................................................... 37
3.4.2. Cross-validation .................................................................................. 40
CHƯƠNG 4. DATASET .................................................................................... 42
4.1. Mô tả dữ liệu gốc (Raw data description) ................................................. 42
4.2. EDA (Phân tích khám phá dữ liệu) ............................................................ 43
4.3. Data Preprocessing .................................................................................... 46
4.3.1. Tạo đặc trưng mới (Feature Creation) ................................................. 46
4.3.2. Loại bỏ biến dư thừa (Redundant Variable Removing) ...................... 48
4.3.3. Chuẩn hóa dữ liệu (Scaling and Encoding) ......................................... 49

iii
4.4. Data Split ................................................................................................... 50
CHƯƠNG 5: KẾT QUẢ VÀ CÀI ĐẶT THỬ NGHIỆM ............................... 52
5.1. Kết quả của mô hình khi chưa dùng kỹ thuật Resampling ........................ 52
5.3. Điều chỉnh tham số và đánh giá kết quả (Hyperparameter tuners and
evaluation result) ............................................................................................... 54
5.4. Cài đặt thử nghiệm ..................................................................................... 57
KẾT LUẬN ......................................................................................................... 59
TÀI LIỆU THAM KHẢO ................................................................................. 61
PHỤ LỤC ................................................................ Error! Bookmark not defined.

