Trang chủ » Công Nghệ Thông Tin » Kỹ thuật phần mềm

2 trang

166 lượt xem

7

0

“Tam gia” tìm kiếm tuyên bố hỗ trợ Giao thức loại trừ Robots

“Tam gia” tìm kiếm tuyên bố hỗ trợ Giao thức loại trừ Robots Hôm qua (3/6/08) cả Google, Yahoo! và Microsoft cùng ra tuyên bố chung hỗ trợ “Giao thức loại trừ Robots” (Robots Exclusion Protocol, viết tắt REP): file Robots.txt và thẻ Meta Robots. REP giúp webmaster điều hướng hoạt động của robot (hay còn gọi là crawler, spider - phần mềm dò tìm dữ liệu của các cỗ máy tìm kiếm) đối với website của mình. Webmaster có thể dùng file Robots.txt để ngăn chặn robot xâm nhập các thư mục và file trên server của mình và thẻ...

Chủ đề:

Robot tự hành

/

2

“Tam gia” tìm kiếm tuyên bố hỗ trợ Giao thức loại trừ

Robots

Hôm qua (3/6/08) cả Google, Yahoo! và Microsoft cùng ra tuyên bố

chung hỗ trợ “Giao thức loại trừ Robots” (Robots Exclusion Protocol,

viết tắt REP): file Robots.txt và thẻ Meta Robots.

REP giúp webmaster điều hướng hoạt động của robot (hay còn gọi là

crawler, spider - phần mềm dò tìm dữ liệu của các cỗ máy tìm kiếm) đối với

website của mình. Webmaster có thể dùng file Robots.txt để ngăn chặn robot

xâm nhập các thư mục và file trên server của mình và thẻ Meta Robots giúp

ngăn chặn robots ở cấp độ từng trang riêng lẻ.

Về Robots.txt, cả 3 đại gia tìm kiếm đều hỗ trợ các chỉ dẫn (directive) sau:

 Disallow: không cho phép crawler dò tìm site.

 Allow: cho phép crawler dò tìm site.

 Ký tự đặc biệt *, $: thông báo crawler (dò hay không dò) một số thuộc

tính chung. Microsoft sẽ hỗ trợ từ cuối tháng 6 này.

 Sitemap Location: khai báo crawler vị trí Sitemaps của site.

[ Các chỉ dẫn trên có thể dùng kết hợp với nhau và hẹn gặp lại bạn ở bài

hướng dẫn chi tiết khác! ]

Về thẻ Meta Robots, cả Google, Yahoo! và Microsoft đều thỏa thuận:

 noindex: không cho phép crawler dò tìm trang này.

 nofollow: không cho phép crawler đi theo các link trên trang này.

 noarchive: không cho hiển thị cache của trang này.

 nosnippet: không cho phép hiển thị snippet của trang này.

 noodpt: không cho phép crawler dùng Title và snippet từ ODP.

Thực ra Giao thức ngăn chặn Robots – REP đã được hiểu ngầm là 1 tiêu

chuẩn chưa chính thức (de-facto standard) của các cỗ máy tìm kiếm từ

những năm 1990. Tuy nhiên đây là lần đầu tiên Google, Yahoo! và

Microsoft “cộng tác” (collaborating) hay “làm việc với nhau” (working

together) về REP, mặc dù họ chưa xây dựng nên 1 tiêu chuẩn mới (như đã

từng dựng trang Sitemaps.org năm 2006 hướng dẫn Sitemap cho website)

mà chỉ mới tuyên bố trên blog của họ.

Tài liệu liên quan

Tạo và sử dụng file robots.txt chuẩn SEO

Tạo và sử dụng file robots.txt – Seo

Lập trình đồ họa: Hướng dẫn từ A-Z cho người mới bắt đầu

Lập trình đồ họa

YouTube Robot: Tải, chuyển đổi file YouTube nhanh chóng

YouTube Robot: download, convert file từ YouTube

Robots.txt: Những điều cần biết [A-Z cho SEO 2024]

Robots.txt những điều cần biết

RobotVN 1.0: Lấy tin tự động từ báo VnExpress và báo Tuổi Trẻ

RobotVN 1.0 – Lấy tin tự động từ báo VnExpress và TuoiTre

Tìm hiểu về Thẻ META Robots và cách dùng Tập Tin Robots.txt hiệu quả

Tìm Hiểu Thẻ META Robots Và Tập Tin Robots.txt

SEO với file robots: Kinh nghiệm tối ưu hóa chuẩn nhất

Seo với file robots

Robot.txt: Hướng dẫn Allow và Disallow Googlebot hiệu quả

Robot.txt và Googlebot – Allow và Disallow

Cách phát hiện và xử lý phần website không được Google crawl hiệu quả

Cách phát hiện xử lý những phần trong website không được google crawl

Web crawler, Web spider, Web robot, Googlebot là gì?

Web crawler- web spider- web robot- googlebot

Tài liêu mới

Xây dựng hệ thống dạy và học trực tuyến: Bài thuyết trình tích hợp công nghệ Android cho di động

Bài thuyết trình: Xây dựng hệ thống hỗ trợ dạy và học trực tuyến với tích hợp công nghệ Android cho di dộng

Bài giảng Lập trình hướng đối tượng ThS. Trương Thị Minh Châu

Bài giảng Lập trình hướng đối tượng - ThS. Trương Thị Minh Châu

Bài giảng Lập trình Java: Kết nối cơ sở dữ liệu (JDBC) - Chương 5

Bài giảng Lập trình Java: Chương 5 - Kết nối cơ sở dữ liệu (JDBC)

Bài giảng Lập trình Java: Luồng (streams) - Chương 4

Bài giảng Lập trình Java: Chương 4 - Luồng (streams)

Bài giảng Lập trình Java: Kế thừa - Đa hình - Đóng gói (Chương 3)

Bài giảng Lập trình Java: Chương 3 - Kế thừa - Đa hình - Đóng gói

Bài giảng Lập trình Java: Đối tượng, lớp và phương thức (Chương 2)

Bài giảng Lập trình Java: Chương 2 - Đối tượng - lớp - phương thức

Bài giảng Lập trình Java: Tổng quan ngôn ngữ Java - Chương 1

Bài giảng Lập trình Java: Chương 1 - Tổng quan ngôn ngữ Java

Bài tập lớn quản lý thư viện: Kinh nghiệm và giải pháp

Bài tập lớn: Quản lý thư viện

Hệ thống quản lý cửa hàng bán thức ăn nhanh: Bài tập lớn [chuẩn nhất]

Bài tập lớn: Hệ thống quản lý cửa hàng bán thức ăn nhanh

Bộ câu hỏi trắc nghiệm Nhập môn Công nghệ phần mềm [mới nhất]

Bộ câu hỏi trắc nghiệm Nhập môn Công nghệ phần mềm

Bài tập thực hành Thiết kế web chuẩn SEO cho người mới

Bài tập thực hành Thiết kế web

Bài tập thực hành phân tích thiết kế hướng đối tượng

Bài tập Thực hành Phân tích thiết kế hướng đối tượng

Hệ thống POS cho cửa hàng đồ ăn nhanh: Báo cáo bài tập lớn

Báo cáo bài tập lớn: Hệ thống POS của cửa hàng bán đồ ăn nhanh

Bài giảng Lập trình Python nâng cao

Bài giảng Lập trình Python nâng cao

Tổng hợp tài liệu bài lab Java chi tiết

Tài liệu Tổng hợp bài lab Java

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu trực tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 670/GP-BTTTT cấp ngày 30/11/2015