
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN VĂN ĐẠT
GIẢI QUYẾT VẤN ĐỀ PHÂN PHỐI TRONG HỆ
THỐNG KHUYẾN NGHỊ DỰA TRÊN ĐẶC
TRƯNG NỘI DUNG CỦA ĐỐI TƯỢNG
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
HÀ NỘI - 2021

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN VĂN ĐẠT
GIẢI QUYẾT VẤN ĐỀ PHÂN PHỐI TRONG HỆ
THỐNG KHUYẾN NGHỊ DỰA TRÊN ĐẶC
TRƯNG NỘI DUNG CỦA ĐỐI TƯỢNG
Ngành: Công nghệ thông tin
Chuyên ngành: Khoa học máy tính
Mã số: 8480101.01
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS. TS. Lê Thanh Hà
TS. Ngô Thị Duyên
HÀ NỘI - 2021

i
MỤC LỤC
MỤC LỤC ............................................................................................................ i
LỜI CẢM ƠN .................................................................................................... iii
LỜI CAM ĐOAN ............................................................................................... iv
TÓM TẮT ........................................................................................................... v
DANH MỤC HÌNH VẼ .................................................................................... vi
DANH MỤC BẢNG BIỂU .............................................................................. vii
DANH MỤC VIẾT TẮT ................................................................................. viii
Chương 1. Giới thiệu ....................................................................................... 1
1.1. Đặt vấn đề ............................................................................................. 1
1.2. Bài toán ................................................................................................. 4
1.3. Đóng góp của luận văn ........................................................................ 5
1.4. Cấu trúc luận văn ................................................................................ 6
Chương 2. Kiến thức liên quan ...................................................................... 7
2.1. Hệ thống khuyến nghị .......................................................................... 7
2.2. Thuật toán khuyến nghị CFRS ........................................................... 8
2.3. Thành phần thuật toán khuyến nghị CB ........................................... 9
2.3.1 Thuật toán so sánh độ tương đồng ................................................. 9
2.3.2 Gaussian Mixture Model (GMM) ................................................ 10
2.3.3 Word Embeddings (WE) ............................................................. 12
2.4. Thuật toán gợi ý dựa trên nội dung ................................................. 15
2.5. Kết chương ......................................................................................... 18
Chương 3. Đề xuất thuật toán khuyến nghị phân phối CB ......................... 19
3.1. Dữ liệu ................................................................................................. 19
3.1.1 Giới thiệu chung .......................................................................... 19
3.1.2 Đặc tính ........................................................................................ 19
3.1.3 Nhiễu ............................................................................................ 21

ii
3.2. Thuật toán khuyến nghị CB được đề xuất ...................................... 22
3.2.1 Tiền xử lý dữ liệu ......................................................................... 23
3.2.2 Phân cụm ...................................................................................... 24
3.2.3 Thuật toán sắp xếp ....................................................................... 25
3.2.4 Giả mã .......................................................................................... 27
3.3. Khả năng ứng dụng trong thực tế .................................................... 28
3.4. Kết chương ......................................................................................... 28
Chương 4. Thực nghiệm ............................................................................... 29
4.1. Môi trường thực nghiệm ................................................................... 29
4.2. Phương pháp đánh giá ...................................................................... 29
4.3. Kịch bản thực nghiệm ....................................................................... 30
4.3.1 BOW + GFF ................................................................................. 30
4.3.2 GMM + ED .................................................................................. 30
4.3.3 W2V + GFF ................................................................................. 31
4.3.4 GMM + GFF ................................................................................ 32
4.4. Kết quả thực nghiệm ......................................................................... 32
4.5. Kết chương ......................................................................................... 36
KẾT LUẬN ....................................................................................................... 37
TÀI LIỆU THAM KHẢO ................................................................................ 38

iii
LỜI CẢM ƠN
Trước tiên tôi xin dành lời cảm ơn chân thành và sâu sắc đến thầy giáo, PGS.
TS. Lê Thanh Hà và cô giáo, TS. Ngô Thị Duyên – người đã hướng dẫn, khuyến
khích, chỉ bảo và tạo cho tôi những điều kiện tốt nhất từ khi bắt đầu cho tới khi hoàn
thành công việc của mình.
Tôi xin dành lời cảm ơn chân thành tới các thầy cô giáo khoa Công nghệ thông
tin, trường Đại học Công nghệ, ĐHQGHN đã tận tình đào tạo, cung cấp cho tôi những
kiến thức vô cùng quý giá và đã tạo điều kiện tốt nhất cho tôi trong suốt quá trình
học tập, nghiên cứu tại trường.
Đồng thời tôi xin cảm ơn tất cả những người thân yêu trong gia đình tôi cùng
toàn thể bạn bè, những người đã luôn giúp đỡ, động viên tôi những khi vấp phải
những khó khăn, bế tắc.
Cuối cùng, tôi xin chân thành cảm ơn các bạn học cùng khóa đã giúp đỡ, động
viên tôi trong học tập và nghiên cứu chương trình thạc sĩ tại Đại học Công nghệ,
ĐHQGHN.