BAN CƠ YU CHÍNH PH
HỌC VIN KTHUT MT MÃ
PHÍ NGUYỄN HẢI MINH
NGHIÊN CỨU GIẢI PHÁP PHÂN LOẠI SPEAR
PHISHING EMAIL DỰA TRÊN CÁC KỸ
THUẬT XỬ LÝ NGÔN NGỮ TỰ NHIÊN
ĐỀ ÁN THẠC SĨ
HÀ NỘI 2025
2
BAN CƠ YU CHÍNH PH
HỌC VIN KTHUT MT MÃ
PHÍ NGUYỄN HẢI MINH
NGHIÊN CỨU GIẢI PHÁP PHÂN LOẠI SPEAR
PHISHING EMAIL DỰA TRÊN CÁC KỸ THUẬT
XỬ LÝ NGÔN NGỮ TỰ NHIÊN
Chuyên ngành: An Toàn Thông Tin
số: 8480202
Khóa: CHAT10
ĐỀ ÁN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC :
TS. Nguyễn Mạnh Thắng Học viện KTMM
HÀ NỘI 2025
3
LỜI CAM ĐOAN
Tôi cam đoan đ tài: “Nghiên cu gii pháp phân loi Spear Phishing
Email da trên các kthut xlý ngôn ngữ tự nhiên” là công trình nghiên cu
của riêng tôi dưi sng dn ca thy giáo TS. Nguyn Mnh Thng.
Nhng ni dung, phân tích, kết lun, kết qutrong lun văn này đu là kết
qucủa nhân tôi, sliu nêu ra trung thc hoc ca nhân tôi hoc
đưc tng hp tnhiu ngun tài liu khác nhau trích dn ràng và các kết
quả đạt đưc ca luận văn chưa tng đưc công btrong bt kcông trình nào
khác.
Hà Ni, ngày … tháng năm 2025
Học viên
Phí Nguyn Hi Minh
4
LỜI CM ƠN
Tôi xin trân trọng cảm ơn các thầy giáo công tác trong Học viện Kỹ
thuật Mật mã, nhất là Quý thầy cô, cán bộ, giảng viên Khoa An toàn thông tin
Khoa sau đại học đã tận tâm giảng dạy, truyền đạt cho chúng tôi những kiến
thức quý báu và nền tảng vững chắc trong suốt quá trình học tập.
Đặc biệt, em xin gửi lời cảm ơn sâu sắc tới TS. Nguyễn Mạnh Thắng đã
hướng dẫn hỗ trợ em xuyên suốt quá trình thực hiện đề án, đưa ra những
nhận xét quý báu để có thể hoàn thành đề án tốt nghiệp.
Tôi xin trân trọng cảm ơn các Thầy (Cô) trong Hội đồng khoa học đã đóng
góp những ý kiến, những lời khuyên quý giá cho đề án.
Tôi cũng xin trân trọng cảm ơn gia đình, anh em bạn đã quan tâm
giúp đỡ, động viên tạo điều kiện thuận lợi trong quá trình thực hiện hoàn thành
đề án.
Xin trân trọng cảm ơn!
5
MỤC LỤC
LỜI CAM ĐOAN .............................................................................................. 3
LỜI CẢM ƠN ................................................................................................... 4
MỤC LỤC ........................................................................................................ 5
DANH MỤC TỪ VIẾT TẮT ............................................................................. 7
DANH MỤC HÌNH VẼ .................................................................................... 9
LỜI MỞ ĐẦU ................................................................................................ 11
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT ................................................................. 17
1.1. Tổng quan về Spear Phishing ........................................................... 19
1.1.1. Khái niệm về Spear Phishing ........................................................ 19
1.1.2. Các kỹ thuật phát hiện Spear Phishing .......................................... 21
1.1.3. Những nguy cơ và tác động của các cuộc tấn công Spear Phishing
23
1.2. Xử lý ngôn ngữ tự nhiên .................................................................. 25
1.2.1. Khái niệm cơ bản về NLP ............................................................. 25
1.2.2. Một số mô hình NLP .................................................................... 28
1.2.3. Các mô hình NLP tiên tiến ............................................................ 30
1.3. Phân loại email ................................................................................. 33
1.3.1. Phương pháp phân loại email ........................................................ 33
1.3.2. Phương pháp phân tích ngữ nghĩa trong email ............................. 35
1.3.3. Giới thiệu các phương pháp học máy và ứng dụng ....................... 37
1.4. Kết luận Chương 1 ........................................................................... 39