ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN VĂN ĐẠT
GIẢI QUYẾT VẤN ĐỀ PHÂN PHỐI TRONG HỆ
THỐNG KHUYẾN NGHỊ DỰA TRÊN ĐẶC
TRƯNG NỘI DUNG CỦA ĐỐI TƯỢNG
LUN VĂN THC SĨ CÔNG NGHTHÔNG TIN
HÀ NI - 2021
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYN VĂN ĐẠT
GIẢI QUYẾT VẤN ĐỀ PHÂN PHỐI TRONG HỆ
THỐNG KHUYẾN NGHỊ DỰA TRÊN ĐẶC
TRƯNG NỘI DUNG CỦA ĐỐI TƯỢNG
Ngành: Công nghthông tin
Chuyên ngành: Khoa hc máy tính
Mã s: 8480101.01
LUN VĂN THC SĨ CÔNG NGHTHÔNG TIN
NGƯI HƯNG DN KHOA HC:
PGS. TS. Lê Thanh Hà
TS. Ngô ThDuyên
HÀ NI - 2021
i
MỤC LỤC
MỤC LỤC ............................................................................................................ i
LỜI CM ƠN .................................................................................................... iii
LỜI CAM ĐOAN ............................................................................................... iv
TÓM TẮT ........................................................................................................... v
DANH MC HÌNH V.................................................................................... vi
DANH MC BNG BIỂU .............................................................................. vii
DANH MỤC VIT TẮT ................................................................................. viii
Chương 1. Gii thiệu ....................................................................................... 1
1.1. Đặt vấn đ............................................................................................. 1
1.2. Bài toán ................................................................................................. 4
1.3. Đóng góp ca lun văn ........................................................................ 5
1.4. Cấu trúc lun văn ................................................................................ 6
Chương 2. Kiến thc liên quan ...................................................................... 7
2.1. Hệ thng khuyến ngh.......................................................................... 7
2.2. Thut toán khuyến nghCFRS ........................................................... 8
2.3. Thành phn thut toán khuyến nghCB ........................................... 9
2.3.1 Thut toán so sánh đtương đng ................................................. 9
2.3.2 Gaussian Mixture Model (GMM) ................................................ 10
2.3.3 Word Embeddings (WE) ............................................................. 12
2.4. Thut toán gi ý da trên ni dung ................................................. 15
2.5. Kết chương ......................................................................................... 18
Chương 3. Đề xut thuật toán khuyến nghphân phi CB ......................... 19
3.1. Dữ liệu ................................................................................................. 19
3.1.1 Gii thiu chung .......................................................................... 19
3.1.2 Đặc tính ........................................................................................ 19
3.1.3 Nhiễu ............................................................................................ 21
ii
3.2. Thut toán khuyến nghCB đưc đxuất ...................................... 22
3.2.1 Tiền xử lý dliệu ......................................................................... 23
3.2.2 Phân cụm ...................................................................................... 24
3.2.3 Thut toán sp xếp ....................................................................... 25
3.2.4 Gi .......................................................................................... 27
3.3. Khnăngng dng trong thc tế .................................................... 28
3.4. Kết chương ......................................................................................... 28
Chương 4. Thc nghiệm ............................................................................... 29
4.1. Môi trưng thc nghiệm ................................................................... 29
4.2. Phương pháp đánh giá ...................................................................... 29
4.3. Kịch bn thc nghiệm ....................................................................... 30
4.3.1 BOW + GFF ................................................................................. 30
4.3.2 GMM + ED .................................................................................. 30
4.3.3 W2V + GFF ................................................................................. 31
4.3.4 GMM + GFF ................................................................................ 32
4.4. Kết quthc nghiệm ......................................................................... 32
4.5. Kết chương ......................................................................................... 36
KẾT LUẬN ....................................................................................................... 37
TÀI LIU THAM KHẢO ................................................................................ 38
iii
LỜI CM ƠN
Trưc tiên tôi xin dành li cm ơn chân thành sâu sc đến thy giáo, PGS.
TS. Thanh giáo, TS. Ngô ThDuyên ngưi đã ng dn, khuyến
khích, chbảo và to cho tôi nhng điu kin tt nht tkhi bt đu cho ti khi hoàn
thành công vic ca mình.
Tôi xin dành li cm ơn chân thành ti các thy giáo khoa Công nghthông
tin, trưng Đi hc Công ngh, ĐHQGHN đã tn tình đào to, cung cp cho tôi nhng
kiến thc cùng quý giá đã to điu kin tt nht cho i trong sut quá trình
học tp, nghiên cu ti trưng.
Đồng thi tôi xin cm ơn tt cnhng ngưi thân yêu trong gia đình tôi cùng
toàn thbạn , nhng ngưi đã luôn giúp đ, đng viên tôi nhng khi vp phi
nhng khó khăn, bế tắc.
Cui cùng, tôi xin chân thành cm ơn các bạn hc cùng khóa đã giúp đ, đng
viên tôi trong học tp nghiên cu chương trình thc ti Đi hc Công ngh,
ĐHQGHN.