Chương 3 Tìm kiếm & khai thác thông tin

1. Tổng quan Internet 2. Tìm kiếm thông tin 3. Công cụ tìm kiếm -SE

1. Tổng quan Internet

 Các KN cơ bản về mạng, mạng máy tính  Giới thiệu Internet  Các thành phần cơ bản trên Internet  Các dịch vụ cơ bản trên Internet

2 07/2010 Tổng quan về Internet

Các KN cơ bản về Mạng và Mạng máy tính

 Mạng là gì?  Mạng máy tính  Phân loại mạng

3 07/2010 Tổng quan về Internet

Mạng là gì?

 Là một nhóm hai hoặc nhiều thiết bị có

thể giao tiếp với nhau:  Mạng điện thoại: kết nối các máy điện thoại

và các bộ chuyển mạch.

 Mạng máy tính: kết nối các thiết bị máy tính

4 07/2010 Tổng quan về Internet

Mạng máy tính

Chia sẻ tài nguyên

Trao đổi thông tin

Mạng máy tính: hệ thống kết nối từ 2 máy tính trở lên

5 07/2010 Tổng quan về Internet

Phân loại mạng theo phạm vi

 Mạng cá nhân: Personal Area Network (PAN)  Kết nối các thiết bị máy tính trong phạm vi vài mét

 Mạng cục bộ: Local Area Network (LAN)

 Kết nối máy tính trong phạm vi nhỏ như nhà, văn

phòng, trường học…

 Metropolitan Area Network (MAN)

 Kết nối máy tính trong phạm vi lớn hơn như giữa

các tp, giữa các khu của trường ĐH…

 Mạng diện rộng: Wide Area Network (WAN)

 Internet

6 07/2010 Tổng quan về Internet

Internet

 Internet: là hệ thống gồm các mạng máy tính liên kết với nhau trên phạm vi toàn thế giới theo giao thức chuẩn TCP/IP, thông qua các hệ thống kênh truyền thông.

7 07/2010 Tổng quan về Internet

Lợi ích của Internet

 Mạng Internet mang lại rất nhiều tiện ích hữu dụng cho người sử dụng, một trong các tiện ích phổ biến của Internet là:  Hệ thống thư điện tử (email)  Môi trường trao đổi và tìm kiếm thông tin nhanh

chóng, chính xác, thuận tiện và tiết kiệm.  Môi trường học tập, nghiên cứu hiệu quả.  Môi trường lưu trữ dữ liệu an toàn, chi phí thấp.  Môi trường giải trí.  Môi trường kinh doanh.

8 07/2010 Tổng quan về Internet

Các thành phần cơ bản trên Internet

 Các máy chủ (host – server)  Các máy trạm (client)  Đường truyền  Các phần mềm trên máy chủ  Các phần mềm trên máy trạm

9 07/2010 Tổng quan về Internet

Các nhà cung cấp

 IAP (Internet Access Provider)

 Nhà cung cấp cổng truy cập vào Internet cho

các mạng ở cấp quốc gia.  ISP (Internet Service Provider)

 Nhà cung cấp dịch vụ Internet như VNPT,

FPT, Viettel..

 ICP (Internet Content Provider)

 Nhà cung cấp thông tin lên Internet như kinh tế, thể thao, chính trị, quân sự, giáo dục…

10 07/2010 Tổng quan về Internet

Sơ đồ cấu trúc INTERNET

INTERNET

Nhà cung cấp khả năng truy cập Internet

IAP

Nhà cung cấp dịch vụ Internet

Nhà cung cấp dịch vụ Internet

ISP

ISP

Máy chủ

Máy chủ

Nhà cung cấp dịch vụ Internet

USER

Người dùng truy cập trực tiếp

ISP

Máy chủ

USER

USER

Người dùng từ xa qua kết nối modem, dịch vụ…

Mạng LAN kết nối trực tiếp

11 07/2010 Tổng quan về Internet

Giao thức TCP/IP

 TCP/IP: Transmission Control Protocol /

Internet Protocol

 Là tập hợp các giao thức truyền nhận và sửa lỗi dữ liệu, cho phép truyền dữ liệu từ máy này đến máy khác trên internet

12 07/2010 Tổng quan về Internet

Địa chỉ Internet

 Mỗi máy tính trên internet có một địa

chỉ duy nhất  Địa chỉ dạng số  Địa chỉ dạng chuỗi

 IP  tên miền (domain name)

DNS

IP 203.162.207.165

Tên miền www.agu.edu.vn

13 07/2010 Tổng quan về Internet

Địa chỉ IP

 Địa chỉ IP bao gồm 32 bit, được chia thành 4

nhóm, các nhóm cách nhau bởi một dấu chấm ‘.’, mỗi nhóm gồm ba chữ số có giá trị từ 000 đến 255.  Có dạng

n1.n2.n3.n4

0  ni  255

Có 2^32 = 4.294.967.296 đ/c IP khác nhau

11001111

10100101

 Ví dụ

203.162.207.165 10100010 11001011 203

162

207

165

14 07/2010 Tổng quan về Internet

Địa chỉ IP

 Địa chỉ IP (như 203.162.207.165) khó

nhớ, không tiện cho chúng ta sử dụng.

 Điều gì xảy ra nếu ta muốn chuyển

web server sang máy khác với địa chỉ IP khác?  Ta phải liên hệ với tất cả những người

muốn truy xuất đến server để cho họ địa chỉ IP mới!

15 07/2010 Tổng quan về Internet

Hệ thống tên miền (Domain Name System) DNS

 Do đó một hệ thống dùng để ánh xạ tên miền dễ nhớ sang địa chỉ IP gọi là DNS (Domain Name System) được tạo ra.  Tên miền có thể giữ nguyên khi có nhu

cầu thay đổi địa chỉ IP.

16 07/2010 Tổng quan về Internet

Hệ thống tên miền

 Tên miền là tên hiệu hoặc tên tương

đương bằng tiếng Anh của một địa chỉ IP của máy tính.

 Hệ thống tên miền (DNS) cho phép sử dụng các tên dễ nhớ thay vì các địa chỉ IP để định vị máy tính trên Internet.  Các thiết bị giải tên miền quét trên

Internet dịch tên miền thành địa chỉ IP.

17 07/2010 Tổng quan về Internet

Tên miền

tên máy.tên lĩnh vực.tên nước

www.agu.edu.vn www.yahoo.com

 Có dạng  Ví dụ

18 07/2010 Tổng quan về Internet

Tên miền

 Tên máy: gợi nhớ, đăng ký  Tên lĩnh vực

.com – các công ty và các tổ chức có hoạt động thương mại.

 .org – các tổ chức phi lợi nhuận.  .net – các tổ chức về mạng như các nhà cung cấp

Internet.

 .gov – dành cho các tổ chức thuộc chính phủ ở Mỹ.  .mil – dành cho các tổ chức quân đội ở Mỹ.  .edu – dành cho các trường ĐH ở Mỹ.

19 Tổng quan về Internet 07/2010

Tên miền

 Tên nước

Australia  .au  .uk United Kingdom Japan  .jp  .vn Vietnam  .cn China  .sg

Singapore

20 07/2010 Tổng quan về Internet

Các dịch vụ cơ bản của Internet

 Internet chứa đựng tất cả các thông tin mà bạn cần, đồng thời nó cũng là môi trường truyền thông cho vô số các dịch vụ quan trọng như :  Dịch vụ Web (WWW - World Wide Web)  Dịch vụ thư điện tử (E-mail)  Dịch vụ truyền tệp FTP (File Transfer Protocol)  Dịch vụ hội thoại trên Internet (Chat)  Diễn đàn thảo luận (Discussion Forum ) ...

21 07/2010 Tổng quan về Internet

Dịch vụ WWW (World Wide Web)

 Cung cấp thông tin dạng văn bản, hình

ảnh, âm thanh, phim ảnh, … (multimedia)

 Sử dụng giao thức HTTP (HyperText Transfer Protocol) là giao thức truyền siêu văn bản

22 07/2010 Tổng quan về Internet

Dịch vụ thư điện tử (Email)

 Gửi nhận thư  Sử dụng các giao thức:

 SMTP (Simple Mail Transfer Protocol)  POP3 (Post Office Protocol)  IMAP (Internet Message Access Protocol)

23 07/2010 Tổng quan về Internet

Dịch vụ truyền file (FTP)

 Chia sẻ, truyền nhận tập tin  Sử dụng giao thức FTP (File Transfer

Protocol)

24 07/2010 Tổng quan về Internet

Dịch vụ hội thoại trên Internet (Chat)

 Là hình thức hội thoại trực tuyến (trò

chuyện) trên Internet

 hai hay nhiều người có thể cùng trao đổi thông tin trực tuyến qua bàn phím máy tính

25 07/2010 Tổng quan về Internet

Diễn đàn thảo luận (Discussion Forum )

 Cho phép bạn trao đổi thông tin với những người quan tâm ở tất cả mọi nước.

26 07/2010 Tổng quan về Internet

Tham gia Internet

 Quay số vào mạng qua điện thoại  Kết nối trực tiếp với ISP

27 07/2010 Tổng quan về Internet

Quay số vào mạng qua điện thoại POST OFFICE

QUAY SỐ VÀO MẠNG

ISP

MODEM

28 07/2010 Tổng quan về Internet

Quay số vào mạng qua điện thoại

 Yêu cầu thiết bị

 Máy tính  Điện thoại hữu tuyến  MODEM (MOdulation DEModulation)  Đăng ký thuê bao hòa mạng trả sau,

(hoặc trả cùng điện thoại, không đăng ký)

29 07/2010 Tổng quan về Internet

Quay số vào mạng qua điện thoại

 Ưu điểm

 Đơn giản  Nhược điểm  Tốc độ chậm

30 07/2010 Tổng quan về Internet

Quay số vào mạng qua điện thoại

TRỰC TUYẾN

 Ưu điểm

 Đơn giản  Nhược điểm  Tốc độ chậm

ISP

31 07/2010 Tổng quan về Internet

Kết nối trực tuyến

 Tốc độ cao  Kết nối với mạng LAN cho nhiều máy  Sử dụng 24/24 giờ  Chi phí phụ thuộc tốc độ đường truyền

32 07/2010 Tổng quan về Internet

TÌM KIẾM THÔNG TIN

Tìm kiếm thông tin trên Internet

 Thông tin (information) trên Internet  Bao trùm hầu hết các lĩnh vực.  Dung lượng khổng lồ.  Tuy nhiên, chỉ 30% trong số đó là hữu ích.  Không ai kiểm soát được hết.  Vd: Tri thức, tin tức,…

 Vấn đề:

 Tìm thông tin như thế nào để hiệu quả???

34 07/2006 Tổng quan về Internet

Tìm kiếm thông tin trên Internet

 Hướng giải quyết

 Công cụ tìm kiếm (Search Engine).  Danh bạ web.  Từ điển bách khoa toàn thư.  Từ điển tra cứu khác.  Catalog của thư viện.  Các cơ sở dữ liệu tóm tắt.

35 07/2006 Tổng quan về Internet

Công cụ tìm kiếm (Search Engine – SE)

 Một vài trang web hỗ trợ tìm kiếm:

 http://www.google.com.vn  http://www.yahoo.com  http://www.altavista.com  http://www.lycos.com  http://www.vinaseek.com  http://www.panvietnam.com  …

36 07/2006 Tổng quan về Internet

Vấn đề thường gặp khi tìm kiếm

 Ví dụ:

 Tìm kiếm thông tin về Khoa học máy tính.  Tìm kiếm thông tin về các khóa học miễn phí trên

Internet...

 Vấn đề: không có được thông tin mong muốn do:

 Kết quả tìm được quá nhiều.  Kết quả tìm được quá ít.  Các kết quả khác với mong đợi.

 Giải pháp:

 Sử dụng từ khóa hợp lý (tra từ điển chuyên ngành).  Sử dụng các ký pháp truy vấn (tìm kiếm nâng cao).

37 07/2006 Tổng quan về Internet

Tìm kiếm theo toán tử Boolean

 Sử dụng toán tử

 AND  OR  NOT

38 07/2006 Tổng quan về Internet

Cú pháp truy vấn của Google

 Cặp dấu nháy kép “ ”: Tìm kiếm một cụm từ.

 Vd: “agriculture library”.

 Dấu cộng (+): AND; Mặc định với Google.

 agriculture library = agriculture + library.

 Dấu trừ (-): NOT.  Dấu phảy: OR.  Dấu ~: Tìm kiếm đồng nghĩa.

 Vd: ~food ~facts sẽ nhắc Google tìm cả nutrition,

cooking.

 Tham khảo thêm:

 http://www.google.com.vn/advanced_search  http://www.google.com/help

39 07/2006 Tổng quan về Internet

Kỹ thuật tìm kiếm nâng cao - Mẹo

 Rút gọn  Tìm kiếm gần đúng  Tìm kiếm cụm từ  Toán tử Near  Phân biệt chữ hoa

40 07/2006 Tổng quan về Internet

Kỹ thuật tìm kiếm khác

 Tìm kiếm vùng cụ thể

 Tên bài báo  Ngày tháng  Địa chỉ URL

 Giới hạn ngôn ngữ

41 07/2006 Tổng quan về Internet

Kỹ thuật tìm kiếm khác

 Tìm kiếm vùng cụ thể

 Tên bài báo  Ngày tháng  Địa chỉ URL

 Giới hạn ngôn ngữ

42 07/2006 Tổng quan về Internet

Thực hành

43 07/2006 Tổng quan về Internet

44 07/2006 Tổng quan về Internet