BỘ GIÁO DỤC VÀ ĐÀO TO
ĐẠI HỌC CH KHOA NỘI
VÕ ĐỨC QUANG
CẢI TIẾN THUẬT TOÁN PHÂN LỚP
CHO DỮ LIỆU KHÔNG CÂN BẰNG
VÀ ỨNG DỤNG TRONG DỰ ĐOÁN ĐỒNG TÁC GIẢ
LUẬN ÁN TIẾN HỆ THỐNG THÔNG TIN
NỘI2024
BỘ GIÁO DỤC VÀ ĐÀO TO
ĐẠI HỌC CH KHOA NỘI
VÕ ĐỨC QUANG
CẢI TIẾN THUẬT TOÁN PHÂN LỚP
CHO DỮ LIỆU KHÔNG CÂN BẰNG
VÀ ỨNG DỤNG TRONG DỰ ĐOÁN ĐỒNG TÁC GIẢ
Ngành: Hệ thống thông tin
số: 9480104
LUẬN ÁN TIẾN HỆ THỐNG THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. TRẦN ĐÌNH KHANG
NỘI2024
LỜI CAM ĐOAN
Tôi xin cam đoan các kết quả trình bày trong luận án công trình nghiên
cứu của bản thân nghiên cứu sinh trong thời gian học tập và nghiên cứu
tại Đại học Bách khoa Nội dưới sự hướng dẫn của PGS.TS. Trần Đình
Khang. Các số liệu, kết quả trình y trong luận án hoàn toàn trung thực.
Các kết quả sử dụng tham khảo đều đã được trích dẫn đầy đủ và theo đúng
quy định.
Nội, ngày tháng 5 năm 2024
Giáo viên hướng dẫn Nghiên cứu sinh
PGS.TS. Trần Đình Khang Võ Đức Quang
ĐẠI HỌC CH KHOA NỘI
TL. GIÁM ĐỐC
TRƯỞNG BAN ĐÀO TẠO
i
LỜI CẢM ƠN
Chặng đường làm nghiên cứu sinh một hành trình dài đầy khó khăn và
thử thách. Trên hành trình đó, bên cạnh sự nỗ lực của bản thân, không thể
thiếu sự đồng hành dẫn dắt của những Thầy kính mến, sự hỗ trợ giúp
đỡ của những người đồng nghiệp, người bạn, người thân trong gia đình. Tôi
thực sự rất biết ơn và xin trân trọng gửi lời cảm ơn sâu sắc tới mọi người
đã dành cho tôi sự giúp đỡ, chia sẻ quý giá trong suốt khoảng thời gian qua.
Đầu tiên, tôi xin gửi lời cảm ơn sâu sắc tới PGS.TS. Trần Đình Khang,
người Thầy đã hướng dẫn, đồng hành, chỉ dạy, nhắc nhở và động viên tôi rất
nhiều trong suốt quá trình nghiên cứu.
Tôi cũng xin gửi lời cảm ơn tới các Thầy giáo, giáo giảng dạy tại Trường
Công nghệ Thông tin và Truyền thông - Đại học Bách khoa Nội đã truyền
đạt cho tôi những kiến thức mới quý giá, giúp tôi mở rộng kiến thức, gợi mở
những ý tưởng nghiên cứu để hoàn thành luận án.
Tôi xin gửi lời cảm ơn đến các đồng nghiệp tại Trường Đại học Vinh, các
em sinh viên sự hỗ trợ, chia sẻ, giúp đỡ nhiệt tình của mọi người.
Cuối cùng, tôi muốn nói lời biết ơn chân thành đến gia đình thân yêu,
những người thân và bạn bè đã luôn động viên, ủng hộ tôi trong suốt quá
trình nghiên cứu và giúp tôi vượt qua các giai đoạn khó khăn để đạt được
một số kết quả bước đầu hôm nay.
ii
MỤC LỤC
LỜI CAM ĐOAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
LỜI CẢM ƠN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ii
MỤC LỤC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
DANH MỤC C TỪ VIẾT TT VÀ THUẬT NGỮ . . . . . . . . . . . v
DANH MỤC HÌNH VẼ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
DANH MỤC BẢNG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii
DANH MỤC THUẬT TOÁN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x
MỞ ĐU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
CHƯƠNG 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU. . . . . 11
1.1. Bài toán phân lớp với dữ liệu không cân bằng...................... 11
1.2. Một số thuật toán liên quan ....................................... 14
1.2.1. Thuật toán SVM .............................................. 14
1.2.2. Thuật toán Weighted-SVM .................................... 15
1.2.3. Fuzzy SVM-CIL ............................................... 16
1.2.4. Thuật toán AdaBoost.......................................... 17
1.2.5. Thuật toán CNN .............................................. 19
1.2.6. Phương pháp y quyết định .................................. 20
1.2.7. K-nearest neighbors và Tomek link............................. 21
1.3. Bài toán dự đoán đồng tác giả ..................................... 23
1.3.1. Giới thiệu ..................................................... 23
1.3.2. hình hóa bài toán.......................................... 26
1.4. Phương pháp phân lớp cho bài toán dự đoán đồng tác giả.......... 29
1.5. Phương pháp thực nghiệm và đánh giá............................. 32
1.5.1. Tập dữ liệu thử nghiệm........................................ 32
1.5.2. Độ đo đánh giá ................................................ 36
1.5.3. Môi trường và kịch bản thử nghiệm ............................ 38
1.6. Kết luận Chương 1 ................................................ 39
iii