B THÔNG TIN VÀ TRUYN THÔNG
HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Nguyễn Đình Quý
XÂY DNG MÔ HÌNH HỎI ĐÁP
H TR SINH VIÊN TRƯỜNG ĐẠI HC XÂY DNG
LUẬN VĂN THẠC SĨ K THUT
(Theo định hướng ng dng)
HÀ NI - NĂM 2021
B THÔNG TIN VÀ TRUYN THÔNG
HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Nguyễn Đình Quý
XÂY DNG MÔ HÌNH HỎI ĐÁP
H TR SINH VIÊN TRƯỜNG ĐẠI HC XÂY DNG
Chuyên ngành: Khoa hc máy tính
Mã s: 8.48.01.01
LUẬN VĂN THẠC SĨ K THUT
(Theo định hướng ng dng)
Người hướng dn: GS.TS T Minh Phương
HÀ NI - NĂM 2021
i
MC LC
ỜI C Đ N ......................................................................................... iii
ỜI CẢ N ............................................................................................... iv
DANH MC HÌNH V .................................................................................v
DANH MC BNG BIU .......................................................................... vi
DANH MC T VIT TT VÀ THUT NG ..................................... vii
Ở Đ U .........................................................................................................1
CHƯ NG 1. TNG QUAN VI TOÁN HỎI ĐÁP TỰ ĐỘNG .. 4
1.1. Bài toán tr li t động cho sinh viên trường Đại hc Xây dng .4
1.2. Khái quát h thng hỏi đáp tự động ..............................................5
1.3. Truy xut và tìm kiếm thông tin (IR) ............................................7
1.3.1. Mô hình da trên lý thuyết tp hp: .........................................9
1.3.2. Mô hình đi s ..........................................................................9
1.3.3. Mô hình xác sut ....................................................................11
1.3.4. Mô hình ngôn ng ..................................................................13
1.4. Kết luận chương ..........................................................................14
CHƯ NG 2. PHƯ NG PHÁP TR LI T ĐỘNG ....................... 15
2.1. Kiến trúc mô hình ........................................................................15
2.2. Phân loại ý định ...........................................................................17
2.2.1. Lung x lý phương pháp xác định ý định ca câu hi .........18
2.2.2. Tin x lý d liu ...................................................................20
2.2.3. Trích xut đặc trưng ...............................................................22
2.2.4. Mô hình phân lớp ...................................................................31
2.2.5. Tăng cường d liu để hun luyn mô hình phân lớp ý đnh 34
2.3. m kiếm và truy xut thông tin. .................................................43
2.3.1. Mt s khái nim ....................................................................44
ii
2.3.2. Công thc tính BM25 .............................................................45
2.3.3. Đánh giá mô hình IR ..............................................................46
2.4. Kết hợp xác định ý định và truy xut thông tin ...........................50
2.4.1. T chc d liệu để tìm kiếm thông tin theo ý định ................51
2.4.2. m kiếm theo ý định và câu hi ............................................52
CHƯ NG 3. THC NGHIM VÀ KT QU .................................. 55
3.1. Các bước cài đt ..........................................................................55
3.1.1. D liu hun luyn .................................................................55
3.2. Cài đặt module truy xut thông tin ..............................................55
3.2.1. Tin x lý văn bn ..................................................................56
3.2.2. Đánh ch mc tài liu .............................................................57
3.2.3. Xếp hạng văn bản ...................................................................58
3.2.4. Kết qu thc nghim ..............................................................58
3.3. Cài đt mô hình phân lớp ý định .................................................62
3.3.1. y dng mô hình phân lớp ý định ........................................62
3.3.2. Tăng cưng d liu cho bài toán phân lp ý định ..................64
3.3.3. Kết qu hun luyện sau khi tăng cường d liu .....................65
3.4. Kết qu thc hin sau khi kết hp IR và phân lớp ý định ...........65
3.5. So sánh vi các h thng hỏi đáp tương tự .................................66
KT LUN VÀ KIN NGH .....................................................................67
TÀI LIU THAM KHO ...........................................................................69
iii
ỜI C Đ N
Tôi cam đoan đây công trình nghiên cứu của riêng tôi được GS.TS. T
Minh Phương - giảng viên khoa Công nghthông tin trường Học viện Công nghệ
Bưu ch nh Vi n thông hướng dẫn khoa học Nguồn tài liệu của các tác giả quan
tổ chức nếu sử dụng thì tôi đều ghi r trong ph n tài liệu tham khảo
Tôi xin hoàn toàn chịu trách nhiệm về nội dung luận văn của mình
Hà nội ngày tháng năm 1.
Họ v n C o họ .
N u ễn Đình Qúy.