Giảng viên: Nguyễn Anh Việt<br />
<br />
1<br />
<br />
• Mục tiêu:<br />
Biết cách tìm kiếm thông tin hiệu quả nhất trên<br />
mạng internet<br />
• Yêu cầu:<br />
Biết các cỗ máy tìm kiếm<br />
Tìm kiếm cơ bản<br />
Tìm kiếm nâng cao<br />
Đa dạng các cỗ máy tìm kiếm<br />
2<br />
<br />
• Là các thuật toán tìm kiếm thông tin 3 chiều<br />
trên Internet<br />
• Thông tin của search engine thực chất là một<br />
loại cơ sở dữ liệu (database) cực lớn. Công cạ<br />
này tìm các tài liệu dựa trên các từ khoá<br />
(keyword) và trả về một danh mục của các<br />
trang có chứa từ khoá.<br />
<br />
3<br />
<br />
• Có 3 loại:<br />
Individual search<br />
Meta search<br />
Hierarchical search engine<br />
<br />
4<br />
<br />
• Cơ sở dữ liệu của các SE cập nhật bởi các chương trình<br />
“robot”, “spider” hay “web crawler”. Chúng sẽ tự động dò<br />
tìm và phân tích từ những trang có sẵn trong cơ sở dữ liệu<br />
để kiếm tra các nối kết (link) từ các trang và trở lại bổ<br />
sung dữ liệu cho các search engine sau khi phân tích.<br />
<br />
5<br />
<br />