HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
……..….……….………………..
ĐINH NGỌC THI
PHT TRIN CC MÔ HNH HỌC SÂU KT HP
CU TRC Đ TH! VÀ PHÂN T"CH NG# NGH$A
CHO BÀI TON KHUYN NGH! TR"CH DẪN
LUẬN N TIN S$ MY T"NH
Hà Nội - 2024
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
……..….……….………………..
ĐINH NGỌC THI
PHT TRIN CC MÔ HNH HỌC SÂU KT HP
CU TRC Đ TH! VÀ PHÂN T"CH NG# NGH$A
CHO BÀI TON KHUYN NGH! TR"CH DẪN
LUẬN N TIN S$ MY T"NH
Ngành: Khoa h8c m;y t>nh
Mã số: 9 48 01 01
Hà Nội - 2025
BỘ GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
X;c nhận của H8c viện
Khoa h8c và Công nghệ
Người hướng dẫn 1
(Ký, ghi rõ họ tên)
PGS.TS. Võ Đình Bảy
Người hướng dẫn 2
(Ký, ghi rõ họ tên)
PGS.TS. Nguyễn Long Giang
LỜI CAM ĐOAN
T+c giả xin cam đoan luận +n "Ph+t tri5n c+c mô hình h7c sâu k;t h<p c>u tr?c đ@
thA vC phân tDch ngE nghFa cho bCi to+n khuy;n nghA trDch dIn" lC công trình nghiên cứu
của chDnh mình dưới sự hướng dIn khoa h7c của hai Thầy gi+o PGS.TS. Đình Bảy
vC PGS.TS. Nguyễn Long Giang. Luận +n sử dụng thông tin trDch dIn từ nhiều ngu@n
tham khảo kh+c nhau vC c+c thông tin trDch dIn đư<c ghi rCng ngu@n gốc. C+c k;t
quả nghiên cứu của t+c gi công bố chung với c+c t+c giả kh+c đã đư<c sự nh>t trD của
đ@ng t+c giả khi đưa vCo luận +n. C+c số liệu, k;t quả đư<c trình bCy trong luận +n lC
hoCn toCn trung thực vC chưa từng đư<c công bố trong b>t kỳ một công trình nCo kh+c
ngoCi c+c công trình công bố của t+c giả. Luận +n đư<c hoCn thCnh trong thời gian t+c
giả lCm nghiên cứu sinh tại H7c viện Khoa h7c vC Công nghệ, Viện HCn lâm Khoa h7c
vC Công nghệ Việt Nam.
Hà nội, ngày 05 tháng 03 năm 2025
T;c giả luận ;n
Đinh Ng8c Thi
LỜI CẢM ƠN
Luận +n nCy đư<c hoCn thCnh với sự nỗ lực không ngừng của bản thân t+c giả vC
sự gi?p đỡ tận tâm h;t mình từ c+c Thầy gi+o hướng dIn, bạn đ@ng hCnh vC người thân
trong suốt nhEng năm th+ng h7c tập vC nghiên cứu tại Viện Công nghệ thông tin (Viện
HCn lâm Khoa h7c vC Công nghệ Việt Nam).
Đầu tiên, t+c giả xin bCy tỏ lòng bi;t ơn chân thCnh vC sâu sắc nh>t tới hai Thầy
gi+o hướng dIn PGS.TS. Đình Bảy vC PGS.TS Nguyễn Long Giang. Sự tận tình
chỉ bảo, hướng dIn vC động viên của c+c Thầy dCnh cho t+c giả trong suốt thời gian
thực hiện lCm nghiên cứu sinh lC không th5 nCo k5 h;t đư<c. T+c giả cũng xin bCy tỏ
lòng bi;t ơn sâu sắc đối với sự gi?p đỡ, chia sẻ vC đ@ng hCnh của TS. Phạm Th; Anh
Ph? trong suốt qu+ trình nghiên cứu vừa qua. T+c giả cũng xin gửi lời cảm ơn tới c+c
Thầy, Cô gi+o vC c+c C+n bộ của Viện Công nghệ thông tin, Ban Lãnh đạo, phòng ĐCo
tạo, c+c phòng chức năng của H7c viện Khoa h7c vC Công nghệ (Viện HCnm Khoa
h7c vC Công nghệ Việt Nam) đã nhiệt tình gi?p đỡ vC tạo ra môi trường nghiên cứu
thuận l<i đ5 t+c giả có th5 hoCn thCnh công trình nghiên cứu của mình.
Đặc biệt t+c giả xin kDnh dâng tặng luận +n nCy như một lời tri ân vC tưởng nhớ
đ;n Bố, l?c sinh thời đã luôn muốn t+c giả đi theo con đường nghiên cứu khoa h7c. T+c
giả cũng xin đư<c bCy tỏ lòng bi;t ơn sâu sắc tới Mẹ, v< con vC c+c thCnh viên trong
gia đình, nhEng người đã luôn khuy;n khDch, động viện vC truyền cảm hứng cho t+c giả
trong suốt qu+ trình nghiên cứu.
T+c giả xin trân tr7ng cảm ơn!
Hà nội, ngày 05 tháng 03 năm 2025
T;c giả luận ;n
Đinh Ng8c Thi
MỤC LỤC
LỜI CAM ĐOAN........................................................................................................iii
LỜI CẢM ƠN..............................................................................................................iv
MỤC LỤC.....................................................................................................................v
DANH MỤC CC KX HIỆU, CC CH# KX VIT TZT....................................viii
DANH MỤC BẢNG....................................................................................................ix
DANH MỤC HNH V\, Đ TH!..............................................................................xi
MỞ ĐẦU.......................................................................................................................1
CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU VÀ KIN THỨC NỀN TẢNG..........7
1.1. Giới thiệu.............................................................................................................7
1.1.1. TrDch dIn vC tCi liệu tham khảo....................................................................10
1.1.2. Liên k;t trDch dIn của c+c bCi b+o khoa h7c.................................................11
1.1.3. NgE cảnh trDch dIn vC bi5u diễn trừu tư<ng.................................................11
1.1.4. BCi b+o ứng viên trDch dIn...........................................................................11
1.1.5. Người dung của hệ thống khuy;n nghA trDch dIn..........................................12
1.1.6. Nội dung vC siêu dE liệu của bCi b+o khoa h7c............................................12
1.1.7. Khuy;n nghA trDch dIn cục bộ vC khuy;n nghA trDch dIn toCn cục................12
1.2. Tổng quan c+c nghiên cứu liên quan..................................................................13
1.2.1. Mô hình l7c cộng t+c....................................................................................15
1.2.2. Mô hình l7c nội dung...................................................................................17
1.2.3. Mô hình l7c dựa vCo đ@ thA..........................................................................19
1.2.4. Mô hình k;t h<p...........................................................................................21
1.3. Một số hạn ch; của c+c mô hình khuy;n nghA trDch dIn hiện nay.......................24
1.3.1. Hạn ch; c+c mô hình l7c nội dung...............................................................24
1.3.2. Hạn ch; của c+c mô hình k;t h<p l7c nội dung vC l7c cộng t+c...................25
1.3.3. Hạn ch; c+c mô hình k;t h<p l7c nội dung vC l7c dựa vCo đ@ thA................26
1.4. Đặt v>n đề nghiên cứu........................................................................................27
1.4.1. V>n đề nghiên cứu 1....................................................................................27
1.4.2. V>n đề nghiên cứu 2....................................................................................27
1.4.3. V>n đề nghiên cứu 3....................................................................................28
1.5. C+c lý thuy;t nền tảng........................................................................................28
1.5.1. Phép bi;n đổi nh?ng văn bản (document embedding)..................................28
1.5.2. H7 c+c mô hình nơ-ron h@i quy....................................................................31