
BAN CƠ YẾU CHÍNH PHỦ
HỌC VIỆN KỸ THUẬT MẬT MÃ
PHÍ NGUYỄN HẢI MINH
NGHIÊN CỨU GIẢI PHÁP PHÂN LOẠI SPEAR
PHISHING EMAIL DỰA TRÊN CÁC KỸ
THUẬT XỬ LÝ NGÔN NGỮ TỰ NHIÊN
ĐỀ ÁN THẠC SĨ
HÀ NỘI – 2025

2
BAN CƠ YẾU CHÍNH PHỦ
HỌC VIỆN KỸ THUẬT MẬT MÃ
PHÍ NGUYỄN HẢI MINH
NGHIÊN CỨU GIẢI PHÁP PHÂN LOẠI SPEAR
PHISHING EMAIL DỰA TRÊN CÁC KỸ THUẬT
XỬ LÝ NGÔN NGỮ TỰ NHIÊN
Chuyên ngành: An Toàn Thông Tin
Mã số: 8480202
Khóa: CHAT10
ĐỀ ÁN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC :
TS. Nguyễn Mạnh Thắng – Học viện KTMM
HÀ NỘI – 2025

3
LỜI CAM ĐOAN
Tôi cam đoan đề tài: “Nghiên cứu giải pháp phân loại Spear Phishing
Email dựa trên các kỹ thuật xử lý ngôn ngữ tự nhiên” là công trình nghiên cứu
của riêng tôi dưới sự hướng dẫn của thầy giáo TS. Nguyễn Mạnh Thắng.
Những nội dung, phân tích, kết luận, kết quả trong luận văn này đều là kết
quả của cá nhân tôi, số liệu nêu ra là trung thực hoặc là của cá nhân tôi hoặc
được tổng hợp từ nhiều nguồn tài liệu khác nhau có trích dẫn rõ ràng và các kết
quả đạt được của luận văn chưa từng được công bố trong bất kỳ công trình nào
khác.
Hà Nội, ngày … tháng … năm 2025
Học viên
Phí Nguyễn Hải Minh

4
LỜI CẢM ƠN
Tôi xin trân trọng cảm ơn các thầy cô giáo công tác trong Học viện Kỹ
thuật Mật mã, nhất là Quý thầy cô, cán bộ, giảng viên Khoa An toàn thông tin
và Khoa sau đại học đã tận tâm giảng dạy, truyền đạt cho chúng tôi những kiến
thức quý báu và nền tảng vững chắc trong suốt quá trình học tập.
Đặc biệt, em xin gửi lời cảm ơn sâu sắc tới TS. Nguyễn Mạnh Thắng đã
hướng dẫn và hỗ trợ em xuyên suốt quá trình thực hiện đề án, đưa ra những
nhận xét quý báu để có thể hoàn thành đề án tốt nghiệp.
Tôi xin trân trọng cảm ơn các Thầy (Cô) trong Hội đồng khoa học đã đóng
góp những ý kiến, những lời khuyên quý giá cho đề án.
Tôi cũng xin trân trọng cảm ơn gia đình, anh em và bạn bè đã quan tâm
giúp đỡ, động viên tạo điều kiện thuận lợi trong quá trình thực hiện hoàn thành
đề án.
Xin trân trọng cảm ơn!

5
MỤC LỤC
LỜI CAM ĐOAN .............................................................................................. 3
LỜI CẢM ƠN ................................................................................................... 4
MỤC LỤC ........................................................................................................ 5
DANH MỤC TỪ VIẾT TẮT ............................................................................. 7
DANH MỤC HÌNH VẼ .................................................................................... 9
LỜI MỞ ĐẦU ................................................................................................ 11
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT ................................................................. 17
1.1. Tổng quan về Spear Phishing ........................................................... 19
1.1.1. Khái niệm về Spear Phishing ........................................................ 19
1.1.2. Các kỹ thuật phát hiện Spear Phishing .......................................... 21
1.1.3. Những nguy cơ và tác động của các cuộc tấn công Spear Phishing
23
1.2. Xử lý ngôn ngữ tự nhiên .................................................................. 25
1.2.1. Khái niệm cơ bản về NLP ............................................................. 25
1.2.2. Một số mô hình NLP .................................................................... 28
1.2.3. Các mô hình NLP tiên tiến ............................................................ 30
1.3. Phân loại email ................................................................................. 33
1.3.1. Phương pháp phân loại email ........................................................ 33
1.3.2. Phương pháp phân tích ngữ nghĩa trong email ............................. 35
1.3.3. Giới thiệu các phương pháp học máy và ứng dụng ....................... 37
1.4. Kết luận Chương 1 ........................................................................... 39

