ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Phan Nguyên Cương
TRÍCH CHN T ĐỘNG QUAN H C VN
HƯỚNG DN KHOA HC DA TRÊN MÔ HÌNH ĐỒ
THN XÁC SUT PH THUC THI GIAN VÀ TH
NGHIM ĐÁNH G
KHÓA LUN TT NGHIP ĐẠI HC H CHÍNH QUY
Ngành: Công ngh thông tin
HÀ NI – 2011
ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Phan Nguyên Cương
TRÍCH CHN T ĐỘNG QUAN H C VN
HƯỚNG DN KHOA HC DA TRÊN MÔ HÌNH
ĐỒ THN XÁC SUT PH THUC THI GIAN VÀ
TH NGHIM ĐÁNH GIÁ
KHOÁ LUN TT NGHIP ĐẠI HC H CHÍNH QUY
Ngành: Công ngh thông tin
Cán b hướng dn: PGS.TS Hà Quang Thy
Cán b đồng hướng dn: TS. Nguyn Vit Cường
HÀ NI - 2011
LI CM ƠN
Trước tiên, em mun gi li cm ơn sâu sc nht đến các thy giáo PGS.TS
Quang Thy TS.Nguyn Vit Cường, nhng người đã tn tình hướng dn em sut
quá trình nghiên cu khoa hc và thc hin khóa lun tt nghip.
Em xin chân thành cm ơn các thy, giáo đã ging dy em trong bn năm hc
qua, nhng kiến thc mà em nhn được trên ging đưng đại hc shành trang giúp
em vng bước trong tương lai.
Em cũng xin gi li cm ơn ti các anh ch, các bn sinh viên ti phòng thí
nghim KT-Sislab đã cho em nhng li khuyên b ích v chuyên môn trong quá trình
nghiên cu. Xin cm ơn s h tr t đề tài QG.10.38 trong thi gian em thc hin
khóa lun. Em xin gi li cm ơn ti các bn trong lp K52CA và K52CHTTT đã ng
h khuyến khích em trong sut quá trình hc tp ti trường.
Cui cùng, em mun được gi li cm ơn sâu sc đến tt c bn bè, và đặc bit là
ba m các ch - nhng người thân yêu luôn kp thi động vin giúp đ em vượt
qua nhng khó khăn trong hc tp cũng như trong cuc sng.
Hà Ni, ngày 19 tháng 05 năm 2011
Sinh viên
Phan Nguyên Cương
TÓM TT
Bài toán trích chn quan h hướng dn hướng dn khoa hc (quan h gia
người c vn người đưc hướng dn) t các công trình khoa hc đưc công b trên
DBLP bài toán thi s ý nghĩa, đặc bit trong h thng m kiếm các chuyên gia
khoa hc, chng hn như h thng Arnetminer ca nhóm Knowledge Engineering
Tsinghua University, China [11], AI Genealogy Project [10]… Khóa lun này trình
bày nghiên cu v mt phương pháp trích chn quan h c vn hướng dn da
trên cơ s lý thuyết đồ th và xác sut.
Trên cơ s phân tích và tìm hiu mt s hướng tiếp cân bài toán v trích chn
quan h trên mng thông tin, khóa lun áp dng phương pháp trích chn quan h da
trên hình đ th xác sut ph thuc thi gian. D liu trích chn được trên min d
liu DBLP, s đưc lưu tr trong cơ s d liu, tiến hành quá trình lc x d
liu, tìm ra các cp người c vn người được hướng dn “tim năng”, t đó làm d
liu đầu vào cho mô hình hc d liu để trích chn ra được các cp quan h. Khóa lun
đưa ra hình th nghim da trên hình đồ th xác sut ph thuc thi gian, tìm
được các cp “tim năng”. Kết qu bước đầu cho thy, hình kh quan th
tiếp tc thc nghim các pha x lý tiếp theo.
LI CAM ĐOAN
Em xin cam đoan đây phn nghiên cu thc hin khóa lun ca riêng em,
dưới s hướng dn ca PTS.TS Quang Thy TS. Nguyn Vit Cường, không
sao chép t các công trình nghiên cu khác. Em đã trích dn đầy đủ các tài liu tham
kho, các công trình nghiên cu liên quan trong nước và quc tế. Nếu sai em xin
chu hoàn toàn trách nhim và chu mi k lut ca ĐHQH Hà Ni và Nhà trưng.
Hà Ni, ngày 19 tháng 5 năm 2011
Sinh viên
Phan Nguyên Cương