intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc

Chia sẻ: Codon_02 Codon_02 | Ngày: | Loại File: PDF | Số trang:36

94
lượt xem
9
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc tập trung trình bày các vấn đề về tiến trình tìm kiếm và phù hợp phản hồi; mô hình Berry-picking; phương pháp phù hợp phản hồi; các bước tìm kiếm cơ bản với phù hợp phản hồi;...

Chủ đề:
Lưu

Nội dung Text: Bài giảng Tìm kiếm và trình diễn thông tin: Bài 9 - TS.Nguyễn Bá Ngọc

  1. (IT4853) Tìm kiếm và trình diễn thông tin Tiến trình tìm kiếm và phù hợp phản hồi
  2. Giảng viên  TS. Nguyễn Bá Ngọc  Địa chỉ: Viện CNTT & TT/BM HTTT/B1-603  Email: ngocnb@soict.hust.edu.vn  Website: http://is.hust.edu.vn/~ngocnb
  3. Nội dung chính  Tiến trình tìm kiếm thông tin  Phương pháp phù hợp phản hồi  Giải thuật Rocchio 3
  4. Tiến trình tìm kiếm thông tin 4
  5. Tiến trình tìm kiếm thông tin  Người dùng tiếp nhận thông tin mới trong quá trình tìm kiếm:  Kéo theo sự thay đổi nhu cầu thông tin;  Kéo theo những hiệu chỉnh truy vấn;  Nảy sinh những nhu cầu thông tin mới.  Thông thường nhu cầu thông tin không được thỏa mãn bởi một văn bản đơn lẻ:  Trong thực tế nhu cầu thông tin thường được thỏa mãn bởi nhiều đoạn thông tin thấy được trong quá trình tìm kiếm 5
  6. Mô hình “Berry-picking” 6
  7. Nội dung chính  Tiến trình tìm kiếm thông tin  Phương pháp phù hợp phản hồi  Giải thuật Rocchio 7
  8. Các bước tìm kiếm cơ bản với phù hợp phản hồi 1. Người dùng cung cấp một truy vấn ban đầu; 2. Công cụ tìm kiếm trả về tập kết quả tương ứng. 3. Người dùng phản hồi thông tin về những văn bản phù hợp và những văn bản không phù hợp. 4. Công cụ tìm kiếm sinh câu truy vấn mới:  Hy vọng sẽ tốt hơn truy vấn hiện tại. 5. Thực hiện truy vấn mới và cập nhật lại kết quả:  Hy vọng sẽ đầy đủ hơn. Có thể lặp nhiều vòng phản hồi (Các bước 3, 4, 5). 8
  9. Giả thuyết phù hợp phản hồi  Mục đích: Tăng tính đầy đủ của kết quả tìm kiếm.  Điều kiện 1: Truy vấn ban đầu thể hiện đúng nhu cầu thông tin của người dùng.  Điều kiện 2: Những văn bản phù hợp chứa những thuật ngữ tương tự  Giải quyết vấn đề từ đồng nghĩa, vd: Ô tô / xe máy  Nhờ đó có thể thu được những văn bản phù hợp khác khi sử dụng thông tin phản hồi.  Tuy nhiên có thể làm giảm tính chính xác vì các văn bản phù hợp chứa từ không liên quan đến chủ đề. 9
  10. Ví dụ tập kết quả tìm kiếm Truy vấn: “xe máy” 10
  11. Thông tin phản hồi 11
  12. Tập kết quả mới 12
  13. Ví dụ phù hợp phản hồi trong không gian vec-tơ truy vấn “canine” Fernando Díaz 13
  14. Ví dụ phù hợp phản hồi trong không gian vec-tơ Fernando Díaz 14
  15. Ví dụ phù hợp phản hồi trong không gian vec-tơ Fernando Díaz 15
  16. Ví dụ phù hợp phản hồi trong không gian vec-tơ Fernando Díaz 16
  17. Nội dung chính  Tiến trình tìm kiếm thông tin  Phương pháp phù hợp phản hồi  Giải thuật Rocchio 17
  18. Giải thuật Rocchio  Rocchio lựa chọn truy vấn để cực đại hóa hàm      qopt  arg max [ sim(q ,  ( Dr ))  sim(q ,  ( Dnr ))]  q  Dr tập văn bản phù hợp; Dnr tập văn bản không phù hợp.  xu hướng: ~qopt là vec-tơ tách biệt tối đa văn bản phù hợp và không phù hợp.  1  1  qopt  Dr  d j  Dnr  d j d j Dr d j Dr Vấn đề: Không biết được tập văn bản phù hợp thực tế 18
  19. Truy vấn tối ưu trên lý thuyết x x x x o x x x x x x x x o x o o x x x  o o x x x Văn bản không phù hợp Truy vấn tối ưu o Văn bản phù hợp 19
  20. Trọng tâm của bộ văn bản  Trong mô hình không gian vec-tơ, mỗi văn bản được biểu diễn như một điểm trong không gian đa chiều:  Trọng tâm của một bộ văn bản D được định nghĩa như sau:  1   ( D)   | D | dD d  Trọng tâm của một tập điểm được xác định tương tự khối tâm của vật rắn. 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0