
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Nguyễn Thanh Hà
NGHIÊN CỨU PHƯƠNG PHÁP XÁC ĐỊNH
THỨ TỰ ƯU TIÊN CỦA THƯ ĐIỆN TỬ
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Hà Nội – Năm 2023

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Nguyễn Thanh Hà
NGHIÊN CỨU PHƯƠNG PHÁP XÁC ĐỊNH
THỨ TỰ ƯU TIÊN CỦA THƯ ĐIỆN TỬ
Chuyên ngành : Hệ thống thông tin
Mã số: 9.48.01.04
LUẬN ÁN TIẾN SĨ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS. TS. Trần Quang Anh
2. TS. Trần Hùng
Hà Nội - Năm 2023

i
LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi. Nội dung của luận án có
tham khảo và sử dụng các tài liệu, thông tin được đăng tải trên những tạp chí và các
trang web theo danh mục tài liệu tham khảo. Tất cả các tài liệu tham khảo đều có xuất
xứ rõ ràng và được trích dẫn hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho
lời cam đoan của mình.
Hà Nội, ngày tháng năm 2023
Người cam đoan
Nguyễn Thanh Hà

ii
LỜI CẢM ƠN
Lời đầu tiên, tôi xin trân trọng cảm ơn tới Ban Giám đốc Học viện, Khoa Đào tạo
Sau Đại học, các Thầy Cô giáo và các Khoa-Phòng liên quan của Học viện đã tạo điều
kiện giúp đỡ trong suốt quá trình làm nghiên cứu sinh tại trường.
Tôi xin gửi lời cảm ơn sâu sắc đến PGS.TS. Trần Quang Anh. Thầy là người định
hướng và tận tình hướng dẫn, chỉ bảo cho tôi trong suốt quá trình theo đuổi con đường
học thuật. Những phương pháp và tầm nhìn của thầy là cơ sở vững chắc cho những
thành tựu khoa học mà tôi đạt được.
Tôi xin gửi lời cám ơn chân thành đến TS. Trần Hùng. Thầy là người hướng dẫn, tư
vấn quý giá, thầy đã luôn động viên, ủng hộ tôi hoàn thành bản luận án. Thầy đã hướng
dẫn phương pháp nghiên cứu khoa học và kịp thời gợi ý nhiều hướng tiếp cận cho
nghiên cứu sinh.
Tôi xin dành sự yêu thương và cám ơn tới gia đình, những người thân đã luôn đồng
hành cùng tôi vượt qua những khó khăn trên suốt một chặng đường dài.
Cuối cùng, Tôi xin chân thành cảm ơn các lãnh đạo, các bạn đồng nghiệp tại cơ quan
đã luôn tạo mọi điều kiện tốt nhất cho tôi thực hiện nghiên cứu của mình.
Xin chân thành cảm ơn!
Hà Nội, ngày tháng năm 2023

iii
MỤC LỤC
LỜI CAM ĐOAN ............................................................................................................ i
LỜI CẢM ƠN ................................................................................................................. ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ................................................ vi
DANH MỤC CÁC BẢNG, BIỂU ............................................................................... viii
DANH MỤC CÁC HÌNH VẼ ....................................................................................... ix
DANH MỤC CÁC KÝ HIỆU TOÁN HỌC DÙNG TRONG LUẬN ÁN .................... x
MỞ ĐẦU ........................................................................................................................ 1
1. GIỚI THIỆU ................................................................................................................................... 1
2. TÍNH CẤP THIẾT CỦA LUẬN ÁN ............................................................................................. 2
3. MỤC TIÊU CỦA LUẬN ÁN ......................................................................................................... 3
4. PHƯƠNG PHÁP NGHIÊN CỨU................................................................................................... 5
5. CÁC ĐÓNG GÓP CỦA LUẬN ÁN............................................................................................... 6
6. BỐ CỤC CỦA LUẬN ÁN ............................................................................................................. 7
CHƯƠNG 1 – TỔNG QUAN VỀ THƯ ĐIỆN TỬ VÀ XÁC ĐỊNH THỨ TỰ ƯU
TIÊN CỦA THƯ ĐIỆN TỬ ........................................................................................... 8
1.1. HỆ THỐNG THƯ ĐIỆN TỬ ....................................................................................................... 8
1.1.1. Sơ lược về thư điện tử ........................................................................................................... 8
1.1.2. Cấu trúc của một bức thư điện tử .......................................................................................... 9
1.1.3. Mô hình xử lý thư điện tử ................................................................................................... 11
1.1.4. Sơ lược về thư rác ............................................................................................................... 13
1.2. CÁC BÀI TOÁN XÁC ĐỊNH THỨ TỰ ƯU TIÊN CỦA THƯ ĐIỆN TỬ .............................. 13
1.2.1. Lọc thư rác .......................................................................................................................... 14
1.2.2. Dự đoán hành động của người dùng thư điện tử ................................................................. 15
1.2.3. Xếp hạng thư điện tử ........................................................................................................... 15
1.3. TỔNG QUAN NGHIÊN CỨU VỀ XÁC ĐỊNH THỨ TỰ ƯU TIÊN CỦA THƯ ĐIỆN TỬ .. 17
1.3.1. Nghiên cứu về lọc thư rác ................................................................................................... 17
1.3.2. Nghiên cứu về dự đoán hành động người dùng .................................................................. 36
1.3.3. Nghiên cứu về xếp hạng thư điện tử ................................................................................... 39
1.3.4. Các tiêu chí đánh giá ........................................................................................................... 43
1.4. TẬP DỮ LIỆU THƯ ĐIỆN TỬ ................................................................................................ 46
1.4.1. Tập dữ liệu Enron ............................................................................................................... 46
1.4.2. Tập dữ liệu TREC ............................................................................................................... 47
1.4.3. Các tập dữ liệu khác ............................................................................................................ 48
1.4.4. Tập dữ liệu thư điện tử tiếng Việt ....................................................................................... 49
1.5. KẾT LUẬN CHƯƠNG 1 .......................................................................................................... 57
CHƯƠNG 2: PHÁT HIỆN THƯ RÁC ........................................................................ 59

