
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phan Nguyên Cương
TRÍCH CHỌN TỰ ĐỘNG QUAN HỆ CỐ VẤN –
HƯỚNG DẪN KHOA HỌC DỰA TRÊN MÔ HÌNH ĐỒ
THN XÁC SUẤT PHỤ THUỘC THỜI GIAN VÀ THỬ
NGHIỆM ĐÁNH GIÁ
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
HÀ NỘI – 2011

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phan Nguyên Cương
TRÍCH CHỌN TỰ ĐỘNG QUAN HỆ CỐ VẤN –
HƯỚNG DẪN KHOA HỌC DỰA TRÊN MÔ HÌNH
ĐỒ THN XÁC SUẤT PHỤ THUỘC THỜI GIAN VÀ
THỬ NGHIỆM ĐÁNH GIÁ
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hướng dẫn: PGS.TS Hà Quang Thụy
Cán bộ đồng hướng dẫn: TS. Nguyễn Việt Cường
HÀ NỘI - 2011

LỜI CẢM ƠN
Trước tiên, em muốn gửi lời cảm ơn sâu sắc nhất đến các thầy giáo PGS.TS Hà
Quang Thụy và TS.Nguyễn Việt Cường, những người đã tận tình hướng dẫn em suốt
quá trình nghiên cứu khoa học và thực hiện khóa luận tốt nghiệp.
Em xin chân thành cảm ơn các thầy, cô giáo đã giảng dạy em trong bốn năm học
qua, những kiến thức mà em nhận được trên giảng đường đại học sẽ là hành trang giúp
em vững bước trong tương lai.
Em cũng xin gửi lời cảm ơn tới các anh chị, các bạn sinh viên tại phòng thí
nghiệm KT-Sislab đã cho em những lời khuyên bổ ích về chuyên môn trong quá trình
nghiên cứu. Xin cảm ơn sự hỗ trợ từ đề tài QG.10.38 trong thời gian em thực hiện
khóa luận. Em xin gửi lời cảm ơn tới các bạn trong lớp K52CA và K52CHTTT đã ủng
hộ khuyến khích em trong suốt quá trình học tập tại trường.
Cuối cùng, em muốn được gửi lời cảm ơn sâu sắc đến tất cả bạn bè, và đặc biệt là
ba mẹ và các chị - những người thân yêu luôn kịp thời động viện và giúp đỡ em vượt
qua những khó khăn trong học tập cũng như trong cuộc sống.
Hà Nội, ngày 19 tháng 05 năm 2011
Sinh viên
Phan Nguyên Cương

TÓM TẮT
Bài toán trích chọn quan hệ hướng dẫn – hướng dẫn khoa học (quan hệ giữa
người cố vấn – người được hướng dẫn) từ các công trình khoa học được công bố trên
DBLP là bài toán thời sự có ý nghĩa, đặc biệt trong hệ thống tìm kiếm các chuyên gia
khoa học, chẳng hạn như hệ thống Arnetminer của nhóm Knowledge Engineering
Tsinghua University, China [11], AI Genealogy Project [10]… Khóa luận này trình
bày và nghiên cứu về một phương pháp trích chọn quan hệ cố vấn – hướng dẫn dựa
trên cơ sở lý thuyết đồ thị và xác suất.
Trên cơ sở phân tích và tìm hiểu một số hướng tiếp cân bài toán về trích chọn
quan hệ trên mạng thông tin, khóa luận áp dụng phương pháp trích chọn quan hệ dựa
trên mô hình đồ thị xác suất phụ thuộc thời gian. Dữ liệu trích chọn được trên miền dữ
liệu DBLP, sẽ được lưu trữ trong cơ sở dữ liệu, tiến hành quá trình lọc và xử lý dữ
liệu, tìm ra các cặp người cố vấn – người được hướng dẫn “tiềm năng”, từ đó làm dữ
liệu đầu vào cho mô hình học dữ liệu để trích chọn ra được các cặp quan hệ. Khóa luận
đưa ra mô hình thử nghiệm dựa trên mô hình đồ thị xác suất phụ thuộc thời gian, tìm
được các cặp “tiềm năng”. Kết quả bước đầu cho thấy, mô hình là khả quan và có thể
tiếp tục thực nghiệm các pha xử lý tiếp theo.

LỜI CAM ĐOAN
Em xin cam đoan đây là phần nghiên cứu và thực hiện khóa luận của riêng em,
dưới sự hướng dẫn của PTS.TS Hà Quang Thụy và TS. Nguyễn Việt Cường, không
sao chép từ các công trình nghiên cứu khác. Em đã trích dẫn đầy đủ các tài liệu tham
khảo, các công trình nghiên cứu liên quan ở trong nước và quốc tế. Nếu sai em xin
chịu hoàn toàn trách nhiệm và chịu mọi kỷ luật của ĐHQH Hà Nội và Nhà trường.
Hà Nội, ngày 19 tháng 5 năm 2011
Sinh viên
Phan Nguyên Cương

