intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Công nghệ thông tin: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn

Chia sẻ: Hứa Tung | Ngày: | Loại File: PDF | Số trang:74

41
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn Thạc sĩ Công nghệ thông tin: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn được thực hiện với mục tiêu nhằm tìm hiểu các hệ tư vấn (recommendation systems), tìm hiểu các khái niệm, phương pháp xây dựng 1 hệ tư vấn, tìm hiểu kỹ thuật phân rã ma trận, áp dụng phương pháp phân rã ma trận để xây dựng 1 hệ tư vấn về phim. Mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Công nghệ thông tin: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM --------------------------- NGUYỄN LÊ DUY KỸ THUẬT MATRIX FACTORIZATION TRONG XÂY DỰNG HỆ TƯ VẤN LUẬN VĂN THẠC SĨ Chuyên ngành : Công nghệ thông tin Mã số ngành: 60480201 TP. HỒ CHÍ MINH, tháng 10 năm 2015
  2. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM --------------------------- NGUYỄN LÊ DUY KỸ THUẬT MATRIX FACTORIZATION TRONG XÂY DỰNG HỆ TƯ VẤN LUẬN VĂN THẠC SĨ Chuyên ngành : Công nghệ thông tin Mã số ngành: 60480201 CÁN BỘ HƯỚNG DẪN KHOA HỌC: PGS. TS. QUẢN THÀNH THƠ TP. HỒ CHÍ MINH, tháng 10 năm 2015
  3. CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM Cán bộ hướng dẫn khoa học : PGS. TS. Quản Thành Thơ Luận văn Thạc sĩ được bảo vệ tại Trường Đại học Công nghệ TP. HCM ngày 17 tháng 10 năm 2015 Thành phần Hội đồng đánh giá Luận văn Thạc sĩ gồm: TT Họ và tên Chức danh Hội đồng 1 PGS. TSKH. Nguyễn Xuân Huy Chủ tịch 2 TS. Trần Đức Khánh Phản biện 1 3 TS. Lư Nhật Vinh Phản biện 2 4 TS. Võ Đình Bảy Ủy viên 5 TS. Nguyễn Thị Thúy Loan Ủy viên, Thư ký Xác nhận của Chủ tịch Hội đồng đánh giá Luận văn sau khi Luận văn đã được sửa chữa (nếu có). Chủ tịch Hội đồng đánh giá LV
  4. TRƯỜNG ĐH CÔNG NGHỆ TP. HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM PHÒNG QLKH – ĐTSĐH Độc lập – Tự do – Hạnh phúc TP. HCM, ngày 15 tháng 09 năm 2015 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: NGUYỄN LÊ DUY Giới tính: NAM Ngày, tháng, năm sinh: 27/11/1985 Nơi sinh: TP HCM Chuyên ngành: Công nghệ thông tin MSHV: 1341860036 I- Tên đề tài: KỸ THUẬT MATRIX FACTORIZATION TRONG XÂY DỰNG HỆ TƯ VẤN. II- Nhiệm vụ và nội dung: Nghiên cứu kỹ thuật Matrix Factorization và ứng dụng xây dựng hệ tư vấn phim. III- Ngày giao nhiệm vụ: 03/04/2015 IV- Ngày hoàn thành nhiệm vụ: 15/09/2015 V- Cán bộ hướng dẫn: PGS. TS. QUẢN THÀNH THƠ CÁN BỘ HƯỚNG DẪN KHOA QUẢN LÝ CHUYÊN NGÀNH PGS. TS. QUẢN THÀNH THƠ
  5. i LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này đã được cảm ơn và các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc. Học viên thực hiện Luận văn Nguyễn Lê Duy
  6. ii LỜI CÁM ƠN Luận văn được thực hiện tại Khoa Công nghệ thông tin - Trường Đại học Công nghệ TP HCM, dưới sự hướng dẫn khoa học của PGS. TS. Quản Thành Thơ. Trước tiên tôi xin bày tỏ lòng biết ơn sâu sắc tới PGS. TS. Quản Thành Thơ đã đưa tôi đến với lĩnh vực nghiên cứu này. Thầy đã tận tình giảng dạy, hướng dẫn giúp tôi tiếp cận và đạt được thành công trong công việc nghiên cứu của mình. Thầy đã luôn tận tâm động viên, khuyến khích và chỉ dẫn giúp tôi hoàn thành được luận văn này. Tôi xin bày tỏ lòng biết ơn tới các Thầy Cô thuộc Khoa Công nghệ thông tin và cán bộ phòng Quản lý khoa học và đào tạo sau đại học - Trường Đại học Công nghệ TP HCM, đã tạo mọi điều kiện thuận lợi giúp đỡ tôi trong quá trình học tập và nghiên cứu tại trường. Tôi xin chân thành cảm ơn các Thầy Cô trong Hội đồng đánh giá luận văn Thạc Sĩ đã đóng góp ý kiến quý báu giúp tôi hoàn thiện bản luận án. Học viên thực hiện Luận văn Nguyễn Lê Duy
  7. iii TÓM TẮT Trong xu thế công nghệ thông tin phát triển, việc sử dụng mạng Internet đã trở thành một công việc không thể thiếu trong thời gian biểu hằng ngày của con người hiện đại. Có rất nhiều thông tin được đưa lên mạng, từ thông tin cá nhân, đánh giá, nhận xét một dịch vụ, sự kiện,... Cuộc sống con người ngày càng bận rộn, chúng ta không thể đọc hết mọi thông tin trên Internet để rút ra được một quyết định cho riêng mình. Do đó hệ tư vấn đang trở thành xu hướng phát triển. Hệ tư vấn giúp con người tham khảo và ra quyết định dựa trên tập hợp ý kiến, số liệu từ những kinh nghiệm của người đi trước. Thấy được sự cần thiết và lợi ích của hệ tư vấn cũng như muốn khai thác nguồn thông tin vô tận và vô giá của Internet, tác giả quyết định chọn đề tài “Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn”. Bên cạnh việc nghiên cứu lý thuyết, tác giả còn lập trình một phần mềm mẫu áp dụng kỹ thuật trên để xây dựng một hệ tư vấn nhằm đánh giá và hỗ trợ người dùng chọn những bộ phim mình nên xem (vì thời gian của chúng ta là có hạn và nguồn phim thì vô tận).
  8. iv ABSTRACT Nowaday, with deveplopment of the information technology, using the internet has been a dispensable part of a modern man’s daily work. You can find many types of information on the Internet, such as private information of someone, some comments about a service, events, etc. Of course we cant check every information on the internet to make an our own decision. Because of this matter, recommendation systems has been a global inevitable tendency. A recommendation systems gathers and presents data from a wide range of sources, thus helps us with refering and making a decision. Because of benefit and necessary characteristics of recommendation systems, as well as hoping to take advantage of an unlimited and invaluable information sourse from the internet, the writer chose the thesis on “recommendation systems with Matrix Factorization technology”. Not only theoritical research, the writer also developed a demonstration software using a Matrix Factorization technology to develop a recommendation systems to evaluate and support users in choosing movies.
  9. v MỤC LỤC LỜI CAM ĐOAN .............................................................................................................i LỜI CÁM ƠN ..................................................................................................................ii TÓM TẮT ...................................................................................................................... iii ABSTRACT ....................................................................................................................iv DANH MỤC TỪ VIẾT TẮT .........................................................................................vii DANH MỤC CÁC BẢNG........................................................................................... viii DANH MỤC HÌNH VẼ, ĐỒ THỊ ..................................................................................ix CHƯƠNG 1 GIỚI THIỆU ............................................................................................... 1 1.1. LÝ DO CHỌN ĐỀ TÀI: ....................................................................................... 1 1.2. MỤC TIÊU CỦA ĐỀ TÀI: ................................................................................... 1 1.3. CẤU TRÚC CỦA LUẬN VĂN:........................................................................... 1 CHƯƠNG 2 CÁC NGHIÊN CỨU LIÊN QUAN ........................................................... 3 2.1. TỔNG QUAN VỀ HỆ TƯ VẤN ........................................................................ 3 2.1.1. GIỚI THIỆU HỆ TƯ VẤN ......................................................................... 3 2.2. KIẾN TRÚC CƠ BẢN MỘT HỆ TƯ VẤN ...................................................... 5 2.3. MÔ TẢ BÀI TOÁN TƯ VẤN ........................................................................... 6 2.4. PHÂN LOẠI HỆ TƯ VẤN ................................................................................ 8 2.4.1. PHƯƠNG PHÁP DỰA TRÊN NỘI DUNG (CONTENT-BASED) .......... 8 2.4.2. PHƯƠNG PHÁP CHỌN LỌC CỘNG TÁC (COLLABORATIVE FILTERING) .......................................................................................................... 13 2.4.3. PHƯƠNG PHÁP DỰA TRÊN NHÂN KHẨU HỌC (DEMOGRAPHIC- BASED) .................................................................................................................. 18 2.4.4. PHƯƠNG PHÁP DỰA TRÊN TRI THỨC (KNOWLEDGE-BASED)... 20 2.4.5. PHƯƠNG PHÁP DỰA TRÊN CỘNG ĐỒNG (COMMUNITY-BASED).. .................................................................................................................... 23
  10. vi 2.4.6. PHƯƠNG PHÁP LAI (HYBRID) ............................................................. 25 2.4.7. VẤN ĐỀ RAMP-UP .................................................................................. 30 CHƯƠNG 3 CƠ SỞ LÝ THUYẾT ............................................................................... 32 3.1. MÔ HÌNH PHÂN RÃ MA TRẬN ...................................................................... 32 3.2. CÁC THUẬT TOÁN HỌC (Learning Algorithms) ........................................... 35 3.2.1. PHƯƠNG PHÁP GIẢM GRADIENT NGẪU NHIÊN (STOCHASTIC GRADIENT DESCENT)........................................................................................ 35 3.2.2. PHƯƠNG PHÁP ALTERNATING LEAST SQUARE (ASL) ................ 37 3.3. HỆ SỐ BIAS........................................................................................................ 38 3.4. REGULARIZATION .......................................................................................... 39 3.5. PHÂN RÃ MA TRẬN KHÔNG ÂM (NMF) ..................................................... 40 CHƯƠNG 4 HỆ THỐNG ĐỀ NGHỊ ............................................................................. 42 4.1. MÔ HÌNH HỆ THỐNG: ..................................................................................... 42 4.2. GIẢI THUẬT CHƯƠNG TRÌNH ...................................................................... 42 4.2.1. ĐẦU VÀO: ................................................................................................... 42 4.2.2. ĐẦU RA:....................................................................................................... 43 4.2.3. LƯU ĐỒ THUẬT TOÁN: ............................................................................ 43 CHƯƠNG 5 HIỆN THỰC VÀ THÍ NGHIỆM ............................................................. 44 5.1. HIỆN THỰC ....................................................................................................... 44 5.1.1. GIỚI THIỆU .............................................................................................. 44 5.2. MỘT SỐ THỬ NGHIỆM VÀ NHẬN XÉT VỀ THUẬT TOÁN ...................... 46 5.2.1. TẬP DỮ LIỆU: 10 Người dùng, 712 Hạng mục ....................................... 47 5.2.2. TẬP DỮ LIỆU: 50 Người dùng, 1084 Hạng mục ..................................... 51 5.2.3. TẬP DỮ LIỆU: 100 Người dùng, 1238 Hạng mục ................................... 54 CHƯƠNG 6 KẾT LUẬN............................................................................................... 57 TÀI LIỆU THAM KHẢO .............................................................................................. 59
  11. vii DANH MỤC TỪ VIẾT TẮT Ký hiệu Tiếng Anh Tiếng Việt NMF Non-negative Matrix Phân rã ma trận không âm Factorization UI User Interface Giao diện người dùng DB Database Cơ sở dữ liệu MinErr Min Error Lỗi tối thiểu
  12. viii DANH MỤC CÁC BẢNG Bảng 2.1. Kết quả đánh giá của người xem phim với một số phim khảo sát .................. 8 Bảng 2.2. Các kỹ thuật tư vấn ........................................................................................ 10 Bảng 2.3. Thông tin nhân khẩu học được sử dụng trong hệ tư vấn ............................... 19 Bảng 2.4. Các phương pháp lai ...................................................................................... 26 Bảng 3.1. Ma trận điểm đánh giá ................................................................................... 33 Bảng 5.1. Thay đổi số lần học ........................................................................................ 48 Bảng 5.2. Thay đổi hệ số alpha ...................................................................................... 49 Bảng 5.3. Thay đổi hệ số beta ........................................................................................ 50 Bảng 5.4. Thay đổi số lần học ........................................................................................ 51 Bảng 5.5. Thay đổi hệ số alpha ...................................................................................... 52 Bảng 5.6. Thay đổi hệ số beta ........................................................................................ 53 Bảng 5.7. Thay đổi số lần học ........................................................................................ 54 Bảng 5.8. Thay đổi hệ số alpha ...................................................................................... 55 Bảng 5.9. Thay đổi hệ số beta ........................................................................................ 56
  13. ix DANH MỤC HÌNH VẼ, ĐỒ THỊ Hình 2.1. Ví dụ về một hệ tư vấn trên website thương mại ............................................. 5 Hình 2.2. Kiến trúc cơ bản một hệ tư vấn ........................................................................ 6 Hình 2.3. Ví dụ về một hệ tư vấn trên website thương mại ............................................. 9 Hình 2.4. Hoạt động của hệ tư vấn chọn lọc hợp tác ..................................................... 13 Hình 2.5. Mô hình hoạt động của hệ tư vấn dựa trên hạng mục của Amazon ............... 16 Hình 2.6. Mô hình hệ tư vấn dựa trên nhân chủng học .................................................. 19 Hình 2.7. Vòng tròn suy luận của kỹ thuật dựa trên trường hợp. .................................. 22 Hình 2.8. Mô hình tư vấn dựa trên cộng đồng ............................................................... 24 Hình 2.9. Mô hình một hệ tư vấn lai .............................................................................. 27 Hình 3.1. Mô hình Phân rã ma trận ................................................................................ 34 Hình 3.2. Ảnh hưởng của bước nhảy trong quá trình tiệm tiến đến cực tiểu ................. 36 Hình 4.1. Mô hình hệ tư vấn dựa trên kỹ thuật Phân rã ma trận .................................... 42 Hình 4.2. Lưu đồ thuật toán NMF.................................................................................. 43 Hình 5.1. Giao diện chương trình thử nghiệm ............................................................... 46 Hình 5.2. Thay đổi số lần học. ....................................................................................... 48 Hình 5.3. Thay đổi hệ số alpha ...................................................................................... 49 Hình 5.4. Thay đổi hệ số beta ........................................................................................ 50 Hình 5.5. Thay đổi số lần học ........................................................................................ 51 Hình 5.6. Thay đổi hệ số alpha ...................................................................................... 52 Hình 5.7. Thay đổi hệ số beta ........................................................................................ 53 Hình 5.8. Thay đổi số lần học ........................................................................................ 54 Hình 5.9. Thay đổi hệ số alpha ...................................................................................... 55 Hình 5.10. Thay đổi hệ số beta ...................................................................................... 56
  14. 1 CHƯƠNG 1 GIỚI THIỆU 1.1. LÝ DO CHỌN ĐỀ TÀI: Có thể nói rằng hiện nay có đủ mọi loại thông tin trên mạng internet; và với sự giúp sức của các công cụ tìm kiếm thông tin hiện hữu, người ta có thể dễ dàng tìm thấy những gì mà họ quan tâm. Mặt khác, do có quá nhiều thông tin, nên đã gây không ít khó khăn, lúng túng cho việc định hướng chọn lựa hoặc ra quyết định từ phía người sử dụng các thông tin trên. Các hệ tư vấn (recommendation systems) ra đời không nằm ngoài mục đích hỗ trợ cho người dùng trong các lựa chọn và/hoặc ra quyết định. Có nhiều hướng tiếp cận để xây dựng một hệ tư vấn. Tùy thuộc vào nguồn thông tin có được, nhu cầu tư vấn thực tế, đặc thù riêng của dịch vụ tư vấn cần cung cấp, v.v… mà mỗi hệ tư vấn sẽ có phương pháp và thuật toán phù hợp cho riêng mình. Kỹ thuật phân rã ma trận (Matrix Factorization) là một trong số các kỹ thuật được sử dụng để xây dựng một hệ tư vấn dựa trên các dữ liệu đánh giá. Kỹ thuật này được đánh giá cao nhờ khả năng cải thiện độ chính xác của các thuật toán tư vấn khác, tính linh hoạt, thời gian thực thi thấp, v.v... 1.2. MỤC TIÊU CỦA ĐỀ TÀI:  Tìm hiểu các hệ tư vấn (recommendation systems).  Tìm hiểu các khái niệm, phương pháp xây dựng 1 hệ tư vấn.  Tìm hiểu kỹ thuật phân rã ma trận.  Áp dụng phương pháp phân rã ma trận để xây dựng 1 hệ tư vấn về phim. 1.3. CẤU TRÚC CỦA LUẬN VĂN:  Chương 1: Giới thiệu đề tài.  Chương 2: Các nghiên cứu liên quan.  Chương 3: Cơ sở lý thuyết.  Chương 4: Hệ thống đề nghị.
  15. 2  Chương 5: Hiện thực và thí nghiệm.  Chương 6: Tổng kết.
  16. 3 CHƯƠNG 2 CÁC NGHIÊN CỨU LIÊN QUAN 2.1. TỔNG QUAN VỀ HỆ TƯ VẤN 2.1.1. GIỚI THIỆU HỆ TƯ VẤN Hệ tư vấn (Recommender system) được xem là một hệ thống chọn lọc thông tin nhằm tìm kiếm và dự báo các đánh giá (rating)/ưa chuộng (preferences) mà người sử dụng sẽ dành cho các hạng mục / sản phẩm (items) mà trước đó họ chưa quan tâm đến. Hệ tư vấn được sử dụng nhiều trên các website thương mại của nhiều công ty kinh doanh lớn nhằm dự báo và giúp người sử dụng hướng đến các sản phẩm phù hợp với nhu cầu và sở thích của họ hơn, từ đó nâng cao uy tín, doanh thu và lợi nhuận của công ty. Có thể kể đến một vài hệ tư vấn của một số công ty nổi tiếng như:  Hệ tư vấn trên Amazon.com: khi xem một sản phẩm trên website của hãng này, hệ thống sẽ đề nghị một danh sách các sản phẩm cộng thêm dựa trên ma trận sản phẩm mà những người mua hàng trước đó đã mua kèm với sản phẩm đang được xem.  Netflix lại quan tâm đến việc dự báo những phim người tiêu dùng thích xem dựa trên kết quả bình chọn trước đó, thói quen xem phim và các đặc tính của phim (thể loại phim chẳng hạn).  Last.fm cung cấp dịch vụ radio trên internet miễn phí. Hệ tư vấn của Last.fm dựa trên các băng tần mà người sử dụng đã nghe cũng như thói quen nghe đài của họ.  Ngoài ra, còn có khá nhiều hệ tư vấn của nhiều công ty thuộc nhiều lĩnh vực kinh doanh khác nhau như: Yahoo, YouTube, MovieLens, Morse, Polylens, Gab, Fab, v.v… Hình 2.1 minh họa một hệ tư vấn trên website thương mại www.cduniverse.com.
  17. 4 Đặc điểm của các tư vấn là mang tính chất cá nhân hóa nghĩa là nó chỉ phù hợp với một số người dùng (hay nhóm người dùng) có cùng một số đặc tính đã được khảo sát trước đó. Điều này cũng phù hợp với thực tế bởi lẽ không thể có được một lời khuyên chung nhất cho mọi đối tượng. Các hệ tư vấn ngày càng đóng vai trò quan trọng trong việc thúc đẩy phát triển các giao dịch trên mạng. Vai trò đó được thể hiện qua một số chức năng cơ bản sau đây:  Gia tăng doanh số bán hàng: nhờ tư vấn mà người kinh doanh có thể bán được một nhóm sản phẩm phù hợp với nhu cầu và thị hiếu của người dùng so với việc không tư vấn chỉ bán được các sản phẩm đơn lẻ.  Gia tăng thỏa mãn khách hàng: khách hàng càng được thỏa mãn, họ càng gia tăng việc sử dụng các tiện ích khác của công ty (nếu có).  Tăng độ trung thành của khách hàng. Đối với người sử dụng, hệ tư vấn mang lại một số lợi ích sau đây:  Giúp họ giới hạn phạm vi tìm kiếm trong số vô vàn các thông tin thực và ảo.  Tự tin và quyết đoán hơn khi quyết định mua sản phẩm được tư vấn.  Nắm bắt kịp thời các xu hướng sử dụng hiện hành.
  18. 5 Hình 2.1. Ví dụ về một hệ tư vấn trên website thương mại 2.2. KIẾN TRÚC CƠ BẢN MỘT HỆ TƯ VẤN Về cơ bản, một hệ tư vấn thường bao gồm các thành phần sau (Hình 2.2.): 1. Giao diện người dùng (UI): gồm giao diện trên ứng dụng hoặc giao diện Web. Trên đó, yêu cầu về tư vấn có thể do người dùng đề xuất trực tiếp cho hệ thống hoặc được tự động chuyển đổi thông qua các yêu cầu truy cập, chẳng hạn yêu cầu tìm kiếm thông tin về sản phẩm trên website. Các yêu cầu tư vấn này được chuyển thành các truy vấn cho hệ thống. Giao diện còn là nơi hệ thống trả về kết quả tư vấn cho người dùng. 2. Hệ thống cơ sở dữ liệu: gồm cơ sở dữ liệu về các người dùng, các hạng mục. Chẳng hạn như dữ liệu điểm đánh giá của các người dùng đánh giá các hạng mục, thông tin nhân khẩu học của người dùng, đặc tính của hạng mục, quan hệ giữa người dùng và hạng mục, v.v… Hệ thống cơ sở dữ liệu còn có module chuyển đổi dữ liệu từ UI, lưu trữ vào hệ thống bổ sung cho nguồn dữ liệu sẵn có.
  19. 6 3. Recommender module: nhận các yêu cầu truy vấn từ UI thông qua một module tích hợp trung gian và cơ sở dữ liệu từ hệ thống, thực hiện triển khai các thuật toán tư vấn, xử lý truy vấn trả kết quả về UI cho người dùng. User User interface Recommended Data conversion module Contents Recommendation Request User Item Other DB Integration module DB DB Recommender module Hình 2.2. Kiến trúc cơ bản một hệ tư vấn 2.3. MÔ TẢ BÀI TOÁN TƯ VẤN Một cách hình thức, bài toán tư vấn có thể được mô tả như sau: Gọi U là tập tất cả người dùng, I là tập tất cả các hạng mục có thể tư vấn được. Không gian U và I có thể từ vài trăm đến vài ngàn, thậm chí lên đến hàng triệu. Khi đó hàm R(u,i) đo lường mức độ hữu ích của hạng mục i đối với người dùng u được gọi là hàm hữu dụng và R: U x I  P, với P là một tập có thứ tự.
  20. 7 Khi đó, với mỗi người dùng uU, ta sẽ tìm các hạng mục i’I để tối ưu hóa tính hữu dụng cho người dùng u. Nghĩa là ta sẽ tìm iu’ sao cho: uU, i 'u  arg max R (u , i ) (2.1) iI Tính hữu dụng của một hạng mục đối với người dùng trong các hệ tư vấn được đo lường bằng điểm đánh giá, nó biểu thị mức độ ưa chuộng của người dùng đối với một hạng mục nào đó. Hàm hữu dụng R tổng quát có thể là một hàm bất kỳ, hoặc do người dùng đặc tả hoặc được tính toán bởi một ứng dụng cụ thể. Mỗi người dùng trong không gian U có thể được xác định thông qua profile, chứa nhiều thông tin đặc trưng cho người dùng như tuổi, giới tính, hôn nhân, thu nhập, … hay đơn giản hơn chỉ là mã số người dùng (userId). Tương tự, mỗi hạng mục trong tập I cũng được xác định bởi tập các đặc trưng cho hạng mục đó. Trong các hệ tư vấn, hàm R không được xác định trên toàn bộ không gian U x I mà chỉ xác định trên một miền nhỏ của không gian trên. Điều này dẫn đến việc hàm R phải được ngoại suy trong không gian U x I. Tính hữu dụng trong hệ tư vấn được biểu diễn bằng điểm đánh giá và thường chỉ được bắt đầu tính cho một số hạng mục trước đó đã được người dùng bình chọn (thường là rất nhỏ). Thang điểm đánh giá có thể là 10 hoặc 5. Với các hạng mục chưa được người dùng bình chọn thì dùng ký hiệu  để biểu diễn. Điểm hữu dụng giữa người dùng và hạng mục được biểu diễn dưới dạng ma trận như ví dụ trong Bảng 2.1. Từ những thông tin đó, hệ tư vấn sẽ ước lượng (dự đoán) điểm đánh giá giữa các cặp người dùng / hạng mục chưa được bình chọn, từ đó đưa ra các khuyến nghị thích hợp nhất. Việc ngoại suy từ điểm đánh giá đã biết trước sang các điểm đánh giá chưa biết thường được thực hiện bởi (i) đặc tả các heuristics để định nghĩa hàm hữu dụng và đánh giá hiệu năng theo kinh nghiệm và (ii) ước lượng hàm hữu dụng dựa trên các phương pháp xấp xỉ tối ưu như MSE (mean square error) chẳng hạn.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2