ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Trn Trung Hiếu
H THUT TOÁN GIRVAN-NEWMAN TRONG
PHÁT HIN CNG ĐỒNG VÀ CÀI ĐẶT TH
NGHIM TRÊN MNG XÃ HI TRC TUYN
KHOÁ LUN TT NGHIP ĐẠI HC H CHÍNH QUY
Ngành: ng ngh thông tin
HÀ NI - 2011
ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Trn Trung Hiếu
H THUT TOÁN GIRVAN-NEWMAN TRONG
PHÁT HIN CNG ĐỒNG VÀ CÀI ĐẶT TH
NGHIM TRÊN MNG XÃ HI TRC TUYN
KHOÁ LUN TT NGHIP ĐẠI HC H CHÍNH QUY
Ngành: Công ngh thông tin
Cán b hướng dn : PGS.TS Hà Quang Thy
Cán b đồng hướng dn : ThS Nguyn Cm Tú.
HÀ NI - 2011
LI CM ƠN
Đầu tiên, em xin gi li cm ơn chân thành và sâu sc nht ti thy Quang
Thy, người đã trc tiếp hướng dn tn nh đóng góp nhng ý kiến quý báu trong
sut quá trình em làm khóa lun tt nghip này.
Em xin gi li cm ơn ti giáo viên đồng hướng dn, cô Nguyn CNm cũng
như các anh ch các bn trong phòng thí nghim KT-SISLAB, nhng người đã tn
tình giúp đỡ em trong quá trình làm khóa lun
Tiếp theo em xin gi li cm ơn đến đến các thy cô giáo trường Đi Hc Công
Ngh - Đại Hc Quc Gia Hà Ni, đã tn tâm truyn đạt nhng kiến thc quý báu làm
nn tng để em bước vào đi. Em xin gi li cm ơn ti s h tr t đề tài QG.10.38
trong quá trình em làm khóa lun.
Cui cùng, em xin được cm ơn cha m, bn bè người thân, nhng người đã
bên em, khuyến khích đng viên em trong cuc sng, hc tp.
Sinh viên
Trn Trung Hiếu
LI CAM ĐOAN
Tôi xin cam đoan hình phát hin cng đng trong mng hi trc tuyến
Twitter thc nghim da trên h thut toán Girvan-Newman được trình bày trong
khóa lun do tôi thc hin dưới s hướng dn ca PGS. TS. Quang Thy
ThS. Nguyn CNm Tú.
Tt c nhng tham kho t các nghiên cu liên quan đều được nêu ngun gc
mt cách ng t danh mc i liu tham kho trong khóa lun. Trong khóa lun,
không có vic sao chép tài liu, công trình nghiên cu ca ngưi khác mà không ch
v tài liu tham kho.
Hà Ni, ngày 22 tháng 5 năm 2011
Sinh viên
Trn Trung Hiếu
TÓM TT KHÓA LUN
Mng hi bài toán phát hin cng đồng trong mng hi là ni dung
nghiên cu thi s, được nhiu nhà khoa hc thuc nhiu lĩnh vc như hi hc,
kinh tế, khoa hc máy tính, sinh hc, quan tâm nghiên cu [xx]. Các nhà khoa hc
đã đề xut c thut toán phát hin cng đồng trong mng xã hi, trong đó thut toán
Girvan-Newman được Girvan Newman đề xut năm 2002 các ci tiến ca thut
toán này được s dng khá ph biến vì tính hiu qu ca chúng [xxx].
Trong khóa lun này, chúng tôi đi sâu nghiên cu h thut toán Girvan-
Newman cho phát hin cng đồng, tp trung vào thut toán CONGA (Cluster
Overlapping Newman Girvan Algorithm) được Steve Gregory đề xut năm 2007.
Chúng tôi đề ngh mt mô hình áp dng thut toán CONGA phát hin cng đng trong
mng trc tuyến Twitter. H thng thc nghim phát hin cng đồng trong Twitter
được xây dng da trên phn mm CONGA (Steve Gregory, 2010) giao din
chương trình ng dng Twitter API (Yusuke Yamamoto và cng s, 2009).
Kết qu phân cm th nghim trên mt đồ th con ca Twitter (do chúng tôi xây
dng) được đánh giá theo phân lp SVM cho độ đo F1 khong 81% cho thy hình
đặt ra là có tính kh thi.