BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
ĐỖ XUÂN SƠN
GIẢI PHÁP ỨNG DỤNG TRÍ TUỆ NHÂN TẠO NHẰM PHÁT HIỆN GIAO
DỊCH BẤT THƯỜNG TRONG HỆ THỐNG QUẢN TRỊ GIAO DỊCH TÀI
CHÍNH
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HỆ THỐNG THÔNG TIN
Hà Nội – 2024
BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
ĐỖ XUÂN SƠN
GIẢI PHÁP ỨNG DỤNG TRÍ TUỆ NHÂN TẠO NHẰM PHÁT
HIỆN GIAO DỊCH BẤT THƯỜNG TRONG HỆ THỐNG QUẢN
TRỊ GIAO DỊCH TÀI CHÍNH
Ngành hệ thống thông tin
Mã số 8480104
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HỆ THỐNG THÔNG TIN
NGƯỜI HƯỚNG DẪN:
TS.Vũ Việt Thắng
Hà Nội – 2024
i
MC LC
DANH MỤC HÌNH ẢNH ............................................................................... iii
DANH MỤC CÁC KÝ HIỆU VÀ TỪ VIẾT TẮT ......................................... iv
DANH MỤC BẢNG ......................................................................................... v
LỜI CAM ĐOAN ............................................................................................ vi
MỞ ĐẦU ......................................................................................................... vii
CHƯƠNG 1: TỔNG QUAN VỀ GIAN LẬN TRONG GIAO DỊCH TÀI
CHÍNH .............................................................................................................. 1
1.1. Giới thiệu bài toán .................................................................................. 1
1.2. Các loại hình gian lận trong tài chính ..................................................... 1
1.2.1. Gian lận thông qua mã khuyến mãi.................................................. 2
1.2.2. Gian lận thông qua chính sách thành viên ....................................... 4
1.2.3. Giả mạo danh tính ............................................................................ 9
1.2.4. Đánh cắp tài khoản ......................................................................... 12
1.2.5. Gian lận thẻ tín dụng ...................................................................... 18
1.3. Hệ thống gian lận tài chính ................................................................... 20
1.3.1. Tổng quan hệ thống ........................................................................ 20
1.3.2. Hệ thống phát hiện gian lận của Alipay ......................................... 21
1.4. Kết luận chương .................................................................................... 31
CHƯƠNG 2: ỨNG DỤNG THUẬT TOÁN TRÍ TUỆ NHÂN TẠO PHÁT
HIỆN GIAN LẬN TÀI CHÍNH ...................................................................... 33
2.1. Giới thiệu các thuật toán trí tuệ nhân tạo .............................................. 33
2.1.1. Supervised learning (học có giám sát) ........................................... 33
ii
2.1.2. Unsupervised Learning (Học không giám sát) .............................. 38
2.1.3. Semi-Supervised Learning (Học bán giám sát): ............................ 42
2.1.4. Reinforcement Learning (Học Củng Cố/Tăng cường): ................. 45
2.2. Ứng dụng AI phát hiện gian lận tài chính ............................................ 48
2.2.1. Hiện trạng các thuật toán AI trong phát hiện gian lận tài chính .... 48
2.2.2. Mô hình Semi-Supervised learning phát hiện gian lận tài chính ... 49
2.3. Kết luận chương .................................................................................... 51
CHƯƠNG 3: XÂY DỰNG HỆ THỐNG PHÁT HIỆN GIAN LẬN ............. 52
3.1. TỔNG QUAN HỆ THỐNG ................................................................. 52
3.1.1. Cơ sở dữ liệu đồ thị ........................................................................ 52
3.1.2. Mô hình AI đồ thị học bán giám sát ............................................... 61
3.1.3. Giám sát .......................................................................................... 70
3.1.4. Bộ xử lý trung tâm ......................................................................... 71
3.2. KẾT QUẢ ............................................................................................. 71
3.2.1. Bộ dữ liệu ....................................................................................... 71
3.2.2. Đánh giá kết quả thực nghiệm........................................................ 73
3.3. Kết luận chương .................................................................................... 75
KẾT LUẬN ........................................................................................................ i
DANH MỤC TÀI LIỆU THAM KHẢO ......................................................... iii
iii
DANH MC HÌNH NH
Hình 1. 1. Hệ thống phát hiện giao dịch bất thường của ngân hàng ............... 20
Hình 1. 2. Hệ thống phát hiện giao dịch bất thường của Alipay(TitAnt) ....... 23
Hình 1. 3. Kiến trúc MaxCompute .................................................................. 25
Hình 1. 4. Kiến trúc hệ thống của KunPeng ................................................... 26
Hình 1. 5. Kiến trúc hệ thống của Ali-HBase ................................................. 27
Hình 1. 6. Kiến trúc hệ thống của MS và sự tương tác với các thành phần khác
......................................................................................................................... 28
Hình 1. 7. Chia dataset huấn luyện và thử nghiệm mô hình dự báo .............. 29
Hình 3 . 1. Kiến trúc hệ thống sử dụng mô hình Semi-Supervised Graph Neural
Network ........................................................................................................... 52
Hình 3 . 2. Đồ thị mối quan hệ mạng xã hội ................................................... 53
Hình 3 . 3. Ví dụ minh họa node và cạnh trong cơ sở dữ liệu đồ thị .............. 54
Hình 3 . 4. Kiến trúc dữ liệu trong Graph DataBase ....................................... 56
Hình 3 . 5. Giao diện Neo4j ............................................................................ 58
Hình 3 . 6. Tổng quan về hoạt động tiêu chuẩn của thư viện GDS ................ 59
Hình 3 . 7. Kiến trúc mô hình Gated Temporal Attention Network (GTAN) 62
Hình 3 . 8. Huấn luyện model ......................................................................... 69
Hình 3 . 9. Luồng triển khai ............................................................................ 70