intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Internet - Bài 3: Tìm kiếm thông tin trên Internet

Chia sẻ: BDBC BDBC | Ngày: | Loại File: PPT | Số trang:44

211
lượt xem
26
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Chương này gồm có những mục tiêu sau: Trình bày được các khái niệm Engine, Meta Search Engine, Subject Directory; sử dụng thành thạo các kỹ thuật tìm kiếm trên mạng; xác định các nguyên tắc tìm kiếm và chọn lọc các thông tin tìm kiếm; Vận dụng 6 kỹ năng tìm kiếm ( Big6) theo Eisenberg va Berkowitz;... Mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Internet - Bài 3: Tìm kiếm thông tin trên Internet

  1. Bài 3: Tìm kiếm thông tin trên Internet TG: 6. LT: 2, TH: 4 1
  2. Mục tiêu - Trình bày được các khái niệm Engine, Meta Search Engine, Subject Directory; - Sử dụng thành thạo các kỹ thuật tìm kiếm trên mạng; - Xác định các nguyên tắc tìm kiếm và chọn lọc các thông tin tìm kiếm; - Vận dụng 6 kỹ năng tìm kiếm ( Big6) theo Eisenberg va Berkowitz; - Rèn luyện tính tổ chức kỷ luật, tính logic trong kỹ năng tìm kiếm. 2
  3. Nội dung 1. Giới thiệu về tìm kiếm 2. Kỹ thuật tìm kiếm căn bản  3. Tìm kiếm thông tin với google 3
  4. 1. Giới thiệu về tìm kiếm 1.1. Khái quát về tìm kiếm thông tin 1.2. Khái niệm Search engine, Meta- search engine, Subject directories 1.3. Giới thiệu các công cụ tìm kiếm: Việt Nam và Quốc tế 4
  5. 1.1. Khái quát về tìm kiếm thông tin a) Mục đích sử dụng thông tin - Kết quả thông tin nhận được thường rất  lớn  nên  gây  mất  tập  trung  cho  sự  chọn  lựa.  Vì  vậy,  cần  xác  định  mục  tiêu  tổng  quát  khi  tìm  tin.  Một  tìm  kiếm  thông  tin  theo diện rộng sẽ tìm được một lượng lớn  thông  tin  hơn  tìm  theo  chiều  sâu.  Một  cuộc tìm kiếm thông tin theo chiều sâu sẽ  tìm  được  thông  tin  sát  với  chủ  đề  hơn,  mặc dù số lượng thông tin sẽ ít hơn. 5
  6. 1.1. Khái quát về tìm kiếm thông tin b) Chuẩn bị các từ khóa cần tìm - Bước xác định từ khóa và tạo lập chiến  thuật tìm tin (sẽ đề cập ở phần sau) là rất  quan trọng. Nhiều người, cứ bắt tay ngay  vào  việc  tìm  kiếm  mà  bỏ  qua  giai  đoạn  này  nên  mất  rất  nhiều  thời  gian,  cuối  cùng  không  thu  được  kết  quả  như  ý  muốn. 6
  7. 1.1. Khái quát về tìm kiếm thông tin - Khái niệm từ khóa : Từ khóa là một từ  hoặc cụm từ được rút trong tên chủ đề  hoặc  chính  văn  tài  liệu,  nó  phản  ánh  một  phần  nội  dung  hoặc  toàn  bộ  nội  dung của chủ đề hoặc tài liệu đó. 7
  8. 1.1. Khái quát về tìm kiếm thông tin Các bước tiến hành B1 : Xác định từ chủ đạo để tìm kiếm thông tin  cho lần đầu tiên. Ví  dụ  :  Tìm  hiểu  bệnh  SARS  gây  tử  vong  ở  người. Từ chủ đạo là "bệnh SARS" do đó được  tìm trước. B2 : Chọn từ có nghĩa, tránh chọn từ đa nghĩa,  lọc  bỏ  các  phụ  từ  (liên  từ,  giới  từ,  mạo  từ…ví  dụ : và, với, and, the, a …). B3  :  Xác  định  từ  đồng  nghĩa,  từ  có  nghĩa  liên  quan (từ có nghĩa rộng hơn hoặc hẹp hơn) 8
  9. 1.1. Khái quát về tìm kiếm thông tin c) Lập chiến thuật tìm - Mặc định của trang tìm kiếm là tìm đơn giản và  cơ bản, cho nên kết quả tìm được là một lượng  lớn  thông  tin,  thỏa  mãn  từ  cần  tìm.  Tuy  nhiên,  nhu  cầu  chúng ta cần  là  cụ  thể  và  sát  với  chủ  đề, do đó cần tạo lập chiến thuật tìm để khống  chế  kết  quả  cho  phù  hợp.  Tạo  lập  chiến  thuật  tìm  tin  là  việc  thiết  lập  lôgích  giữa  các  từ  tìm  kiếm.  Việc  sử  dụng  tốt  các  từ  nối  của  toán  tử  lôgích (Boolean) sẽ cho kết quả tìm như ý. 9
  10. 1.1. Khái quát về tìm kiếm thông tin - Các từ nối (phổ biến) Cách dùng Ví dụ: + OR Hoặc từ này hoặc từ kia. Kết quả cho  lượng  tin  rất  lớn.  Kinh  tế  OR  Thương  mại  Kinh tế hoặc thương mại đều được + AND  dấu  (+)  Tất  cả  đều phải có. Kết quả  được thu hẹp. Kinh tế AND Thương mại Cần  có cả hai khái niệm + NOT dấu (­) Loại trừ, giới hạn. Kinh tế NOT  Thương  mại  Kết  quả  chỉ  có  khái  niệm  kinh  tế, loại bỏ từ thương mại 10
  11. 1.1. Khái quát về tìm kiếm thông tin Lưu  ý  :  Mỗi  trang  tìm  kiếm  có  thể  áp  dụng  hình  thức  kết  hợp  toán  tử  lôgích  khác nhau. Vì vậy, cần đọc hướng dẫn  trước  khi  áp  dụng.  Thông  thường,  ở  phần  tìm  kiếm  cơ  bản  đã  có  thể  ứng  dụng các từ nối nói trên. 11
  12. 1.1. Khái quát về tìm kiếm thông tin d)  Kiên  nhẫn  và  dùng  nhiều  trang  tìm  kiếm  khác nhau - Mỗi trang tìm kiếm có những tiêu chí tìm khác  nhau,  vì  vậy,  kết  quả  tìm  được  sẽ  khác  nhau.  Kết  quả  tìm  đối  với  trang  này  có  thể  ít,  nhưng  trang khác thì rất phong phú hoặc ngược lại. Do  đó,  bạn  nên  dùng  nhiều  trang  tìm  kiếm  khác  nhau để tìm cùng một vấn đề mới có hiệu quả.  Tất nhiên, bạn sẽ mất nhiều thời gian hơn. Vậy,  kiên  nhẫn  là  yếu  tố  giúp  bạn  sở  hữu  được  thông tin cần thiết. 12
  13. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories a) Search  engine:  hay  còn  gọi  là  công  cụ  tìm  kiếm  giúp  người  xem  tìm  thấy  những  thông  tin  một  cách  liên  quan  nhất.  Nó có  thể  tìm  kiếm  thông  tin  theo  từ  khoá,  hình  ảnh,  địa  điểm… trên  search  engine.  Khi  nhận  được  câu  lệnh  yêu  cầu  tìm  kiếm,  search  engine  sẽ  phân  tích  yêu  cầu  đó,  đánh  giá,  sếp  hạng  và  trả  về  kết  quả  liên  quan  nhất.  Có  thể  tưởng  tượng  rằng  search  engine  hoạt  động  theo  quy  trình  như  sau : 13
  14. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories + Khảo  sát  –  Crawl  :  là  cách  search  engine tham quan, thu thập thông tin trên  website. Search engine có những con bọ  (spider hay crawler)  được lập trình để có  thể tự động theo các liên kết(link) để mò  đến  các  website  khác  nhau,  thu  thập  và  đánh  giá  các  thông  tin  trên  website  đó.  Giai đoạn crawl là một giai đoạn rất quan  trọng. 14
  15. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories + Lưu  trữ  ­  Index :  là  giai  đoạn  search  engine lưu lại thông tin sau khi đã crawl.  Với khối lượng lưu trữ vô hạn, các search  engine  có  thể  chứa  hàng  tỉ  kết  quả  liên  quan.  Một  trang  web  có  thể  được  index  nhanh  hoặc  chậm  tuỳ  thuộc  vào  tốc  độ  crawl, độ trust của website và nhiều yếu  tố khác. 15
  16. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories + Phân tích – Analysis : giai đoạn này  search  engine  sẽ  làm  việc  trên  các  dữ  liệu  mà  nó  thu  thập  được.  Sau  đó  tính  toán  độ  liên  quan  của  dữ  liệu  so  với  yêu  cầu  của  người  dùng.  Các  search  engine  khác  nhau  có  những  thuật  toán  phân  tích  khác  nhau  từ  đây  tạo  ra  sự  khác  biệt  giữa  các  search  engine.  Giai  đoạn  phân  tích  sẽ  tạo  tiền  đề  cho  giai  đoạn phía sau – Trả về kết quả 16
  17. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories + Kết quả ­ Results : Các kết quả liên  quan  sẽ  được  hiển  thị  trong  giai  đoạn  này.  Những  kết  quả  liên  quan  thường  được  sắp  ở  phía  trên,  cao  hơn  những  kết quả ít liên quan. Mặc dù không phải  lúc  nào  các  kết  quả  cũng  thoả  mãn  được  yêu  cầu  của  người  tìm  kiếm.  Nhưng  cho  đến  hiện  nay,  người  dùng  khá  hài  lòng  với  những  gì  mà  search  engine trả về. 17
  18. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories b) Meta-search engine: - Một meta­search engine không tự xây dựng  bất  cứ  thành  phần  nào  trong  ba  thành  phần  kể trên của một máy tìm kiếm thông thường.  Thay  vào  đó,  với  mỗi  câu  truy  vấn  (query)  của  người  dùng,  meta­search  engine  sẽ  chuyển  nó  đến  các  máy  tìm  kiếm  như  Google, Yahoo và sau đó xử lí kết quả trả về  từ các máy tìm kiếm này trước khi trả ra kết  quả cho người dùng. 18
  19. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories - Điểm  mạnh: Meta  search  engine  không  phải tốn tài nguyên cho việc thu thập và lưu  trữ các trang web. Thay vào đó meta search  engine  chủ  yếu  tập  trung  vào  phát  triển  các  thuật toán xử lí kết quả từ các máy tìm kiếm  khác. Các thuật toán xử lí thông thường gồm  có gom cụm (clustering) để loại bỏ trùng lắp,  và  phân  tích  ngữ  nghĩa  (semantic  analysis)  để  có  thể  cho  kết  quả  gần  với  yêu  cầu  của  người dùng nhất. 19
  20. 1.2. Khái niệm Search engine, Meta- search engine, Subject directories - Điểm yếu: +  Thứ  nhất,  tốc  độ  của  các  meta­search  engine thường chậm vì phải chờ kết quả trả  về từ các máy tìm kiếm khác. Nếu một meta­ search  engine  gửi  câu  truy  vấn  đến  càng  nhiều  máy  tìm  kiếm,  tốc  độ  càng  chậm.  Có  thể xem một ví dụ của zingsearch. + Thứ hai, khả năng tìm kiếm nâng cao như  các máy tìm kiếm thông thường khác bị hạn  chế.  Các  toán  tử  tìm  kiếm  AND,  OR  và  tìm  kiếm  theo  cụm  từ  (phrase)  có  thể  không  được hỗ trợ 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0