Thuật toán google tìm
kiếm website
Thuật toán google tìm kiếm website
Chắc hẳn mọi người đã nghe vSeo, và th thuật Seo, Seo là tiến hành làm
tăng thứ hạng website đó lên top đầu tìm kiếm google. Hãy thxem google
tìm kiếm website của bạn như thế nào?
Googebot, Web Crawler ca Google
Googlebot là một robot ca Google, tìm lấy các trang trên các web, đưa
chúng vào ch mục của Google (indexer). thtưởng tượng giống như
một con nhện nhỏ đang tất bật trên khp các trang mạng. Trên thực tế,
Googlebot không đi tới tất cả các trang, gửi yêu cu tới các máy chủ để
ly các page, tải toàn btrang đó và giao cho bphn u chỉ mục của
Google.
Google gửi yêu cu tới hàng ngàn máy ch khác nhau cùng một lúc. Để
tránh vic tràn ngập các máy chủ nhân hoặc ln át các yêu cu của người
dùng, Googlebot cý làm cho tốc độ gửi yêu cu tới các trang chậm hơn rất
nhiều so với khả năng của nó.
Google tìm các trang web theo hai ch: thông qua địa chỉ URL và qua việc
tìm kiếmc link trên web.
Google Indexer
Sau khi Googlebot ti về toàn bcác trang được tìm thy, những trang này
được lưu trtrong sở dữ liu ca chỉ mục Google (hay nói cách khác là
được Google Index). Cơ sở dữ liu được sắp xếp theo thứ tự bảng chữ i
các cụm từ tìm kiếm, mỗi mục sẽ lưu một danh sách các tài liệu chứa từ
tìm kiếm này vtrí xuất hiện trong n bản. Nhờ đó, cấu trúc ca dữ
liu cho phép truy cập nhanh chóng các tài liệu chứa các truy vn của
người dùng.
Để cải thiện hiệu suất tìm kiếm, Google sbỏ qua (không index) những t
gọi là stop words” (the, is, on, or, of, how, why, as well as cũng như những
chs1 chữ số và một schữ i đơn). Google cũng bỏ qua các dấu chấm
câu và các khong để dấu cách quá ln, cũng như chuyển tất cả các chữ cái
về dạng viết thường.
Bộ xử lý truy vấn của Google
Bxử truy vn bao gồm giao din người dùng (box tìm kiếm trên trang
chGoogle), bộ máyđánh giá mức độ liên quan giữa truy vấn và các d
liu, văn bản, và hin thị kết quả tìm kiếm.
PageRank hthống xếp hạng các trang web của Google góp phần rất quan
trọng việc đánh giá của Google. Một trang có PageRank cao hơn được coi là
quan trọng hơn và nhiều khả năng được hiển thị ở vị trí cao hơn các trang
PageRank thấp. Google dựa trên rất nhiều yếu tố để đưa ra chỉ số PageRank
quyết định những tài liu nào liên quan đến truy vấn, bao gồm cả sphổ
biến của trang, vị trí và sng các từ tìm kiếm trong trang, và mức độ liên
quan đếnc từ tìm kiếm trên trang.