Thut toán xếp hng ca các c máy tìm kiếm
Khi tìm kiếm bt c thvi các c máy tìm kiếm ưu tch của các bn, thì gn
như ngay lập tc, các c máy tìm kiếm s tìm trong cơ sở d liung triu trang
ca nó ly mt hay nhiu kết qu phù hp nht cho bn. Nhng kết qu phù hp
hơn sẽ được lit kê trên cùng.
Tt nhiên, nhng c máy tìm kiếm không luôn luôn đúng. Những trang không liên
quan làm nó b qua, và đôi khi nó có thể đưa nhiều hơn những gì bn cn. Nhưng,
đối vi nhng c máy tìm kiếm ln, kết qu thật đáng kinh ngạc.
Brian Pinkerton - người sáng lp WebCrawler nói: "khi bn vào mt thư vin, bn
hỏi người th thư: 'travel'? Người th thư s nhìn bn chm chm và đưa ra vài gợi
ý để bn có th miêu t nhiu hơn, rõ nghĩa hơn những gì bn cn tìm liên quan đế
n
t khóa 'travel'. Đối vi các search engine thì không phải như vậy. Bn ch có th
tìm được những thông tin liên quan đến t khóa bn nhập vào. Nó ít khi đưa ra cho
bn mt gi ý tốt hơn (ngoại tr t bn đưa vào b sai chính t)."
Vậy, làm sao để nhng c y tìm kiếm có th tìm kiếm, lc lọi trong đng h
hàng trăm triệu trang của chúng để tìm ra nhng kết qu liên quan cho bn? Câu tr
li đây là chúng có những quy tc nhất định, được biết đến như những gii thut
đặc bit. Mi gii thut được th hiện chính xác như thế nào thì không ai được biết,
đây là bí mật tơng mại, nhưng nhìn chung, chúng có nhng điểm cơ bn sau
đây:
V trí, v trí, v trí...và tn s
Mt trong s nhng quy tc chính trong gii thut xếp hng bao gm s định v (v
trí) và tn s xut hin ca nhng t khóa trên mt trang web. Gi ngn gn, nó là
phương pháp đnh v (v trí)/ tn s. Ly li ví d trước: Khi bn hi mt th thư về
"travel", rõ ràng anh ta s đi tìm đến nhng cunchtiêu đề liên quan đến du
lch (travel). Các c máy tìm kiếm cũng làm việc như vậy. Nhng trang vi nhng
thut ng tìm kiếm xut hin trong tiêu đề HTML thường là nhng ni dung liên
quan nht của đề tài. Nhng c máy tìm kiếm cũng kim tra xem phải chăng những
t khóa cn tìm kiếm xut hin gn đỉnh ca mt trang web, như trong hàng tít hay
trong câu đầu tiên văn bản. Chúng gi thiết rng bt k trang nào liên quan đối vi
đềi s đề cp nhng t đó ngay t đầu tiên.
Tn s là nhân t chính khác trong nhng c máy tìm kiếm xác đnh mi quan h
như thế nào. Các c máy tìm kiếm s phân tích tn s xut hin ca mt t khóa
trong tòan b trang web. Mt t xut hin lp li nhiu ln tng trên mt trang
được coi là liên quan hơn so với các trang khác.
Gia v trong công thc
Bây gi s là thi gian phân loi phương pháp định v (v trí)/ tn s được mô t
trên. Tt c nhng c y tìm kiếm chính cho phép nó ti độ nào đó, giống như
những người nu bếp có th đi theo sau mt công thc tiêu chun. Tr phi nhng
người nu bếp tch thêm nhng thành phn bí mt ca mình. Vi hình thc ging
như vy, nhng c máy tìm kiếm thêm đồ gia v vào phương pháp đnh v (v trí)/
tn s. Khôngmt công thc nào là mu s chung. Chính vy, mi c máy
tìm kiếm s cho ra kết qu khác nhau vi cùng mt t khóa được tìm kiếm.
Đầu tiên, mt s c máy tìm kiếm lp ch mc nhiều trang web hơn so với các c
máy khác. Mt s c máy tìm kiếm lại thường index mt s trang web nào đó
thường xuyên hơn. Kết qu là không có cy tìm kiếm nào có cùng kết qu v
danh sách h sơ chúng tập hợp được. Đó là điều t nhiên khi chúng ta th so sánh
kết qu.
Nh
ng c máy tìm kiếm có th cũng phạt nhng trang hay loi tr h t danh b