ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Nguyn Th Kim Chi
GII PHÁP TÌM KIM NGƯỜI THEO TÊN TRÊN
WEB DA TRÊN PHÂN CM PHÂN CP VÀ XP
HNG CP TH T VÀ TH NGHIM VÀO H
THNG TÌM KIM THC TH NGƯỜI TING
VIT
KHOÁ LUN TT NGHIP ĐẠI HC H CHÍNH QUY
Ngành:
Công Ngh Thông Tin
HÀ NI - 2011
ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Nguyn Th Kim Chi
GII PHÁP TÌM KIM NGƯỜI THEO TÊN TRÊN
WEB DA TRÊN PHÂN CM PHÂN CP VÀ XP
HNG CP TH T VÀ TH NGHIM VÀO H
THNG TÌM KIM THC TH NGƯỜI TING
VIT
KHOÁ LUN TT NGHIP ĐẠI HC H CHÍNH QUY
Ngành:
Công Ngh Thông Tin
Cán b hướng dn: ThS.Nguyn Cm Tú
HÀ NI - 2011
i
Li cm ơn
Trước tiên, tôi xin gi li cm ơn lòng biết ơn sâu sc nht ti Phó Giáo
sư Tiến sĩ Quang Thy Thc sĩ Nguyn CNm Tú, nhng người đã tn tình ch
bo và hướng dn tôi trong sut quá trình thc hin khoá lun tt nghip.
Tôi chân thành cm ơn các thy, đã to nhng điu kin thun li cho tôi
hc tp và nghiên cu ti trưng Đại hc Công ngh.
Tôi cũng xin gi li cm ơn ti các anh ch, các bn các em sinh viên
trong phòng nghiên cu SIS-KTLab đã giúp tôi rt nhiu trong vic h tr kiến thc
chuyên môn để hoàn thành tt khoá lun. Khóa lun này nhn được s h tr t đề
tài QG.10.38.
Cui cùng, tôi mun gi li cm hn ti gia đình và bn bè, nhng người
thân yêu luôn bên cnh động viên tôi trong sut quá trình thc hin khóa lun tt
nghip.
Tôi xin chân thành cm ơn!
Sinh viên
Nguyn Th Kim Chi
ii
Tóm tt
Qua máy tìm kiếm thông dng, người dùng đưa truy vn v thc th quan
tâm dưới dng mt t khóa hoc mt cm t khóa nhn kết qu tr v mt
danh sách địa ch các trang Web cha t khóa/cm t khóa đó. S phát trin không
ngng ca k thut trích chn thông tin dn ti s ra đời ca máy tìm kiếm thc th
kết qu tr v ca thc th không đa ch. Do thc th người thuc
loi được tìm kiếm nhiu nht, vy tìm kiếm thc th người mt ni dung
nghiên cu nhn được s quan tâm đặc bit hin nay.
Khóa lun nghiên cu c gii pháp tìm kiếm người theo tên trên Web, tp
trung vào hai vn đề chính phân bit nhp nhng n người xếp hng thc th
người cùng tên trên min d liu giáo dc tiếng Vit da trên các thông tin v thc
th người. Trên cơ s đó, khóa lun đề xut mt mô hình h thng tìm kiếm thc th
người tiếng Vit thc nghim.
Thc nghim ban đu vi tp tên ngưi Vit Nam ph biến cho thy mô hình
tìm kiếm người theo tên trên Web độ chính xác tương đối cao đạt độ đo phân
cm mc 0.86 và xếp hng thc th mc 0.8. Kết qu này cho thy mô hình m
kiếm người theo n tiếng Vit trên Web dưc đề xut trin khai có tính kh
quan.
iii
Li cam đoan
Tôi cam đoan gii pháp tìm kiếm người trên Web da trên thut toán phân
cm phân cp xếp hng cp th t thc nghim được trình bày trong khóa
lun do tôi thc hin dưới s hướng dn ca PGS.TS Quang Thy ThS.
Nguyn CNm Tú.
Trong toàn b ni dung ca khóa lun, nhng điu được trình bày hoc là ca
nhân hoc là được tng hp t nhiu ngun tài liu. Tt c c tài liu tham kho
đều có xut x rõ ràng và đưc trích dn hp pháp.