
MỤC LỤC
LỜI CAM ĐOAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
LỜI CẢM ƠN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
MỤC LỤC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
DANH MỤC CÁC TỪ VIẾT TẮT VÀ THUẬT NGỮ . . . . . . . . . . . v
DANH MỤC HÌNH VẼ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
DANH MỤC BẢNG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii
DANH MỤC THUẬT TOÁN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x
MỞ ĐẦU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU. . . . . 11
1.1. Bài toán phân lớp với dữ liệu không cân bằng...................... 11
1.2. Một số thuật toán liên quan ....................................... 14
1.2.1. Thuật toán SVM .............................................. 14
1.2.2. Thuật toán Weighted-SVM .................................... 15
1.2.3. Fuzzy SVM-CIL ............................................... 16
1.2.4. Thuật toán AdaBoost.......................................... 17
1.2.5. Thuật toán CNN .............................................. 19
1.2.6. Phương pháp Cây quyết định .................................. 20
1.2.7. K-nearest neighbors và Tomek link............................. 21
1.3. Bài toán dự đoán đồng tác giả ..................................... 23
1.3.1. Giới thiệu ..................................................... 23
1.3.2. Mô hình hóa bài toán.......................................... 26
1.4. Phương pháp phân lớp cho bài toán dự đoán đồng tác giả.......... 29
1.5. Phương pháp thực nghiệm và đánh giá............................. 32
1.5.1. Tập dữ liệu thử nghiệm........................................ 32
1.5.2. Độ đo đánh giá ................................................ 36
1.5.3. Môi trường và kịch bản thử nghiệm ............................ 38
1.6. Kết luận Chương 1 ................................................ 39
iii