intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Bài 4: Tìm kiếm thông tin trên internet

Chia sẻ: Thị Huyền | Ngày: | Loại File: PDF | Số trang:13

496
lượt xem
63
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mời các bạn cùng tìm hiểu một số khái niệm tìm kiếm thông tin; một số trang web hỗ trợ tìm kiếm; một số nguyên tắc chung khi tìm kiếm thông tin;... là những nội dung chính được trình bày trong "Bài giảng Bài 4: Tìm kiếm thông tin trên internet". Hy vọng tài liệu là nguồn thông tin hữu ích cho quá trình học tập và nghiên cứu của các bạn.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Bài 4: Tìm kiếm thông tin trên internet

  1. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET @  4.1. Một số khái niệm tìm kiếm thông tin 4.1.1. Tìm kiếm thông tin là gì? Tìm kiếm thông tin là quá trình mà con người muốn làm để thay đổi tình trạng hiểu biết của mình. Nó là quá trình nhận thức cấp cao nhằm để học hỏi hay để giải quyết một vấn đề Vậy một bài toán tất yếu nảy sinh đó là người dùng cần được cung cấp cách thức tìm kiếm thông tin trên kho tàng dữ liệu khổng lồ này. Giải pháp và cách thức đã được đưa ra nhưng theo thời gian sử dụng chỉ còn hai cách sau đây được dùng rộng rãi: - Cách thứ nhất là tìm kiếm theo danh mục địa chỉ được các nhà cung cấp dịch vụ đặt trên các trang web tĩnh. - Cách thứ hai là tìm kiếm qua các trang web động goi là máy tìm kiếm Search Engine Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  2. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET @  4.1. Một số khái niệm tìm kiếm thông tin 4.1.2. Máy tìm kiếm (Search Engine) Search Engine: Máy tìm kiếm là một hệ thống cho phép tìm kiếm các thông tin trên Internet theo yêu cầu của người dùng. Người dùng muốn tìm thông tin trên Internet chỉ cần truy xuất vào địa chỉ của máy tìm kiếm, gõ từ khóa hoặc nội dung cần tìm và đợi máy tìm kiếm trả về kết quả. Thông thường, màn hình làm việc mặc định của máy tìm kiếm chính là trang chủ của website chứa máy tìm kiếm đó Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  3. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET @  4.1. Một số khái niệm tìm kiếm thông tin 4.1.3. Máy tìm kiếm liên hợp (Meta Search Engine) Một máy tìm kiếm (search engine) thường có 3 thành phần chính: - Thứ nhất là web crawling, thành phần chuyên thu thập các trang web có trên Internet - Thứ hai là indexing, thành phần rút trích các đặc trưng của các trang web (ví dụ tiêu đề, từ khóa tiêu biểu) và lưu trữ vào cơ sở dữ liệu để phục vụ cho nhu cầu tìm kiếm sau này - Thứ ba là searching, thành phần tìm các trang web phù hợp/liên quan đến nhu cầu của người dùng (thông qua việc gõ vào các từ khóa trong ô tìm kiếm). Một máy tìm kiếm liên hợp không tự xây dựng bất cứ thành phần nào trong ba thành phần kể trên của một máy tìm kiếm thông thường. Thay vào đó, với mỗi câu truy vấn của người dùng, máy tìm kiếm liên hợp sẽ chuyển nó đến các máy tìm kiếm khác (tạm gọi là máy tìm kiếm nguồn) như Google, Yahoo và sau đó xử lí kết quả trả về từ các máy tìm kiếm này trước khi đưa ra kết quả cho người dùng. Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  4. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET @  4.2. Giới thiệu một số trang web hỗ trợ tìm kiếm Trên thế giới và Việt Namcó rất nhiều website chuyên tìm kiếm, trong đó có những trang nổi tiếng có thể kể đến như: Google: http:// www.google.com Alta Visa : http://www.altavista.com MSN: http://www.msn.com Yahoo: http://www.yahoo.com Để sử dụng một trong các công cụ tìm kiếm trên, chỉ cần gõ địa chỉ của máy tìm kiếm tương ứng vào thanh địa chỉ (Adress) và nhấn Enter. Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  5. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET @  4.3. Một số nguyên tắc chung khi tìm kiếm thông tin - Xác định nội dung thông tin cần tìm (cụ thể là các từ khóa, các tựa đề, các thuật ngữ) và đồng thời cần xác định loại thông tin cần tìm (ví dụ: hình ảnh, phim, trang web, …) - Xác định công cụ tìm kiếm thông tin - Thực hiện tìm kiếm thông tin - Lưu trữ thông tin vừa tìm được: Lưu trữ hình ảnh, âm thanh, văn bản, các trang website, lấy lại các địa chỉ đã truy cập. Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  6. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Đây là công cụ tìm kiếm đa năng nhất, công cụ này có khả năng tìm kiếm trên vài tỉ trang Web. Nhập địa chỉ: http://www.google.com.vn vào thanh địa chỉ của IE Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  7. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Một số kỹ thuật tìm kiếm đơn giản với Google Để tìm kiếm thông tin bạn chỉ cần nhập từ khoá vào mục tìm kiếm. Ví dụ: Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  8. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Một số kỹ thuật tìm kiếm đơn giản với Google Muốn tìm kiếm một cụm từ bạn hãy đưa nó vào dấu “ “. Ví dụ: “giao trinh tin hoc dai cuong” Google không phân biệt chữ hoa, chữ thường và có thể nhập chữ Unicode. Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  9. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Một số kỹ thuật tìm kiếm đơn giản với Google - Loại bỏ một từ nào đó ra khỏi kết quả tìm kiếm Google sẽ tìm tất cả các trang Web có chứa từ khóa cần tìm nhưng không có từ bị loại bỏ. Cú pháp: từ khóa -từ loại bỏ Ví dụ: - Bắt buộc phải có một từ nào đó ra trong kết quả tìm kiếm Google sẽ tìm tất cả các trang Web có chứa từ khóa cần tìm và bắt buộc phải có thêm từ bắt buộc. Cú pháp: từ khóa +từ bắt buộc Ví dụ: Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  10. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Một số kỹ thuật tìm kiếm nâng cao với Google 1.Toán tử OR. Cú pháp: từ khoá 1 OR từ khoá 2 Từ khóa OR (OR viết chữ in) giữa các từ khóa cần tìm kiếm và kết quả thu được là các trang web có chứa ít nhất một từ khóa trong tất cả các từ khóa đó.Ví dụ nhập từ khoá “tin học kinh tế” OR “tin học” tìm tất cả các tài liệu liên quan tới tin học kinh tế hoặc tin học. 2. Toán tử filetype. Cú pháp từ khoá + filetype:phầnmởrộngcủatàiliệu Cho phép tìm thông tin theo kiểu tập tin cụ thể. Ngoài các file .txt, .html, hiện nay Google còn có thể tìm kiếm thông tin bên trong nhiều loại file khác nhau từ .pdf, .doc, đến .flash, .swf. Rất nhiều người thường sử dụng từ khóa này để tìm tài liệu, sách điện tự ebook. Ví dụ nhập từ khóa "tin học đại cương" filetype:pdf vào Google Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  11. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Một số kỹ thuật tìm kiếm nâng cao với Google 3. Toán tử Intitle. Cú pháp: intitle: từ khoá hoặc cụm từ khoá Dùng Intitle cho phép tìm kiếm thông tin dựa theo titles của trang web. Lưu ý: Title luôn phản ánh nội dung của trang web nên với cách tìm kiếm này sẽ có hiệu quả hơn rất nhiều cách dùng từ khóa đơn giản. Ví dụ: 4. Toán tử site Cú pháp: từ khoá site:tên miền Hạn chế kết quả tìm kiếm trong các vùng tên miền ở cấp cao nhất, được dùng chủ yếu trong trường hợp bạn muốn tìm một thông tin quan trọng, một trang web hay một tên miền nào đó. Ví dụ: Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  12. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Một số kỹ thuật tìm kiếm nâng cao với Google 3. Toán tử Link. Cú pháp: link: tên website Dùng link cho phép tìm kiếm thông tin tên các trang web có đặt link theo tên Ví dụ: 4. Toán tử Intext Cú pháp: intext:từ cần tìm Với từ khóa này Google chỉ tìm trong nội dung trang mà không tìm trong địa chỉ và tiêu đề. Ví dụ: Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
  13. Bài 4 TÌM KIẾM THÔNG TIN TRÊN INTERNET 4.4. Giới thiệu về máy tìm kiếm Google Sử dụng chức năng tìm kiếm nâng cao của Google Tìm kết quả: Đặt điều kiện cho kết quả tìm kiếm: + có tất cả các từ: kết quả tìm kiếm phải bao gồm tất cả các từ cần tìm. + có cụm từ chính xác: kết quả tìm kiếm phải có chính xác cụm từ cần tìm. + có ít nhất một trong các từ: kết quả tìm kiếm phải có ít nhất một trong những từ cần tìm. + không có các từ: kết quả tìm kiếm không chứa những từ này. Hiển thị kết quả trả về: chọn số kết quả trả về từ hộp kê thả, mặc nhiên sẽ trả về 10 kết quả nếu tìm được từ 10 trang Web trở lên. Ngoài ra ta có thể đặt thêm điều kiện vào những tùy chọn khác như ngôn ngữ, thời gian, định dạng, … Nguyễn Văn Ninh – Khoa CNTT – Cao đẳng nghề Airserco
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2