HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
NGUYỄN ĐÌNH TUẤN
TÓM TẮT TIN TỨC TIẾNG VIỆT
SỬ DỤNG MÔ HÌNH BERT
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
HÀ NỘI-2024
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
NGUYỄN ĐÌNH TUẤN
TÓM TẮT TIN TỨC TIẾNG VIỆT
SỬ DỤNG MÔ HÌNH BERT
CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
MÃ SỐ: 8.48.01.01
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS NGUYỄN MẠNH HÙNG
HÀ NỘI-2024
i
LỜI CAM ĐOAN
Tôi xin cam đoan mọi ni dung nghiên cu, sliu, kết qutrong đán “Tóm
tắt tin tc tiếng Việt sử dụng mô hình BERT” của tôi công trình nghiên cu ca cá
nhân tôi, mi ni dung đu trung thc không sao chép tbất báo cáo, công
trình nào có trưc.
Ký và ghi rõ htên
NGUYỄN ĐÌNH TUẤN
ii
LỜI CẢM ƠN
Tôi xin gửi li cảm ơn sâu sc đến Phó Giáo Sư, Tiến Nguyn Mnh Hùng,
Khoa Công NghThông Tin, vì sự hỗ trvà hưng dn liên tục trong sut quá trình
thc hin đề án của tôi. Sđóng góp của Thầy trong vic ging dy và hưng dn, t
vic la chn đtài đề án cho đến vic thc hin và kim tra quá trình son tho báo
cáo này mt cách tmỉ, đu rất quý giá. Kiến thc chuyên môn và li khuyên sâu
sắc ca Thầy đã góp phn quan trng giúp tôi hoàn thành thành công đề án của mình.
Ngoài ra, tôi cũng xin gi li cm ơn chân thành ti toàn thcác thy trong
Khoa Công NghThông Tin, và các Thy/Cô khoa Sau Đại Học, nhng ngưi đã
tận tâm ging dy ng dn tôi trong suốt hai năm hc tp. Trí tusđộng
viên của mi người là nn tng cho sphát trin ca tôi.
NGUYN ĐÌNH TUẤN
iii
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... i!
LỜI CM ƠN ........................................................................................................... ii!
MỤC LỤC ................................................................................................................ iii!
DANH MC CÁC KÝ HIU, CÁC CHVIT TẮT ......................................... v!
DANH MC CÁC BNG ...................................................................................... vi!
DANH MC CÁC HÌNH ...................................................................................... vii!
MỞ ĐẦU ................................................................................................................... 1!
CHƯƠNG 1: BÀI TOÁN TÓM TT TIN TC TING VIỆT .......................... 4!
1.1 Gii thiu bài toán tóm tt văn bn tiếng Việt .................................................. 4!
1.2 Các nghiên cu liên quan .................................................................................. 6!
1.2.1 Tho lun các nghiên cu vtóm tt văn bn trên thế giới ........................ 6!
1.2.2 Tho lun mt snghiên cu vtóm tt văn bn ti Vit Nam ................. 8!
1.3 Kết lun chương .............................................................................................. 10!
CHƯƠNG 2: CƠ SỞ THUYT CA CÁC MÔ HÌNH SỬ DỤNG TRONG
ĐỀ ÁN ...................................................................................................................... 11!
2.1 Gii thiu mô hình biến đi (Transformer) .................................................... 11!
2.1.1 Ngun gc ca mô hình biến đổi .............................................................. 11!
2.1.2 Kiến trúc ca mô hình biến đi: Cơ chế chú ý và mã hóa vtrí ............... 12!
2.2 Gii thiu vMô hình BERT .......................................................................... 15!
2.2.2 Sra đi ca BERT: Cách mng hóa NLP .............................................. 16!
2.2.3 Khám phá kiến trúc ca BERT ................................................................. 18!
2.3 Gii thiu về mạng bnhdài ngn hn LSTM ............................................ 20!
2.3.1 Sra đi ca mng LSTM ....................................................................... 20!
2.3.2 Kiến trúc ca LSTM ................................................................................. 21!
2.3.3 ng dng rng rãi ca mng LSTM ........................................................ 23!
2.4 Kết lun chương .............................................................................................. 25!
CHƯƠNG 3: GII PHÁP BERT-LSTM-LSTM VI CƠ CHTỰ CHÚ Ý VÀ
KẾT QUTHC NGHIM, THO LUẬN ....................................................... 26!