
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
NGUYỄN ĐÌNH TUẤN
TÓM TẮT TIN TỨC TIẾNG VIỆT
SỬ DỤNG MÔ HÌNH BERT
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
HÀ NỘI-2024

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
NGUYỄN ĐÌNH TUẤN
TÓM TẮT TIN TỨC TIẾNG VIỆT
SỬ DỤNG MÔ HÌNH BERT
CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 8.48.01.01
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS NGUYỄN MẠNH HÙNG
HÀ NỘI-2024

i
LỜI CAM ĐOAN
Tôi xin cam đoan mọi nội dung nghiên cứu, số liệu, kết quả trong đề án “Tóm
tắt tin tức tiếng Việt sử dụng mô hình BERT” của tôi là công trình nghiên cứu của cá
nhân tôi, mọi nội dung đều là trung thực và không sao chép từ bất kì báo cáo, công
trình nào có trước.
Ký và ghi rõ họ tên
NGUYỄN ĐÌNH TUẤN

ii
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn sâu sắc đến Phó Giáo Sư, Tiến Sĩ Nguyễn Mạnh Hùng,
Khoa Công Nghệ Thông Tin, vì sự hỗ trợ và hướng dẫn liên tục trong suốt quá trình
thực hiện đề án của tôi. Sự đóng góp của Thầy trong việc giảng dạy và hướng dẫn, từ
việc lựa chọn đề tài đề án cho đến việc thực hiện và kiểm tra quá trình soạn thảo báo
cáo này một cách tỉ mỉ, đều là rất quý giá. Kiến thức chuyên môn và lời khuyên sâu
sắc của Thầy đã góp phần quan trọng giúp tôi hoàn thành thành công đề án của mình.
Ngoài ra, tôi cũng xin gửi lời cảm ơn chân thành tới toàn thể các thầy cô trong
Khoa Công Nghệ Thông Tin, và các Thầy/Cô ở khoa Sau Đại Học, những người đã
tận tâm giảng dạy và hướng dẫn tôi trong suốt hai năm học tập. Trí tuệ và sự động
viên của mọi người là nền tảng cho sự phát triển của tôi.
NGUYỄN ĐÌNH TUẤN

iii
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... i!
LỜI CẢM ƠN ........................................................................................................... ii!
MỤC LỤC ................................................................................................................ iii!
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ......................................... v!
DANH MỤC CÁC BẢNG ...................................................................................... vi!
DANH MỤC CÁC HÌNH ...................................................................................... vii!
MỞ ĐẦU ................................................................................................................... 1!
CHƯƠNG 1: BÀI TOÁN TÓM TẮT TIN TỨC TIẾNG VIỆT .......................... 4!
1.1 Giới thiệu bài toán tóm tắt văn bản tiếng Việt .................................................. 4!
1.2 Các nghiên cứu liên quan .................................................................................. 6!
1.2.1 Thảo luận các nghiên cứu về tóm tắt văn bản trên thế giới ........................ 6!
1.2.2 Thảo luận một số nghiên cứu về tóm tắt văn bản tại Việt Nam ................. 8!
1.3 Kết luận chương .............................................................................................. 10!
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT CỦA CÁC MÔ HÌNH SỬ DỤNG TRONG
ĐỀ ÁN ...................................................................................................................... 11!
2.1 Giới thiệu mô hình biến đổi (Transformer) .................................................... 11!
2.1.1 Nguồn gốc của mô hình biến đổi .............................................................. 11!
2.1.2 Kiến trúc của mô hình biến đổi: Cơ chế chú ý và mã hóa vị trí ............... 12!
2.2 Giới thiệu về Mô hình BERT .......................................................................... 15!
2.2.2 Sự ra đời của BERT: Cách mạng hóa NLP .............................................. 16!
2.2.3 Khám phá kiến trúc của BERT ................................................................. 18!
2.3 Giới thiệu về mạng bộ nhớ dài ngắn hạn LSTM ............................................ 20!
2.3.1 Sự ra đời của mạng LSTM ....................................................................... 20!
2.3.2 Kiến trúc của LSTM ................................................................................. 21!
2.3.3 Ứng dụng rộng rãi của mạng LSTM ........................................................ 23!
2.4 Kết luận chương .............................................................................................. 25!
CHƯƠNG 3: GIẢI PHÁP BERT-LSTM-LSTM VỚI CƠ CHẾ TỰ CHÚ Ý VÀ
KẾT QUẢ THỰC NGHIỆM, THẢO LUẬN ....................................................... 26!

