
1
2
[IT4868] Khai phá Web
3
Gi ng viênả
Nguy n Kiêm Hi uễ ế
BM HTTT – Vi n CNTT & TT – ĐHBKHNệ
Phòng làm vi c: P1002 B1ệ
Email: hieunk@soict.hust.edu.vn
Personal page: http://is.hust.edu.vn/~hieunk
4
Thông tin môn h cọ
Webpage: [personal_page]/courses/IT4868
FB: IT4868-HUST-WebMining
Kh i l ng: 60 ti t LT + BTố ượ ế
Đánh giá:
Quá trình: assignments, BTL
Link đăng ký: https://goo.gl/NkGtYR
H n đăng ký: 1/10/2018 (3-4 ng i/nhóm)ạ ườ
Cu i kỳ: t lu n (đc s d ng tài li u gi y)ố ự ậ ượ ử ụ ệ ấ

5
Tài li uệ
[1] Slide bài gi ngả
[2] Bing Liu. Web Data Mining: Exploring Hyperlinks, Contents, and Usage
Data. 2nd edition. 2011
6
Đ c ngề ươ
CH NG 1 T ng quanƯƠ ổ
1.1 M t s ng d ngộ ố ứ ụ
1.2 Khái ni mệ
1.3 Các lĩnh v c ch y uự ủ ế
1.4 Các kĩ thu tậ
7
CH NG 2 Phân tích m ng xã h iƯƠ ạ ộ
2.1 M ng xã h iạ ộ
2.2 Thu t toán PageRankậ
2.3 Thu t toán HISTậ
2.4 Nh n d ng c ng đngậ ạ ộ ồ
8
CH NG 3 Khai phá quan đi mƯƠ ể
3.1 Khai phá quan đi m là gì?ể
3.2 Nh n di n c m xúcậ ệ ả
3.3 Tóm t t quan đi mắ ể
3.4 Tìm ki m quan đi mế ể
3.5 L c quan đi mọ ể

9
CH NG 4 Khai phá hành vi ng i dùngƯƠ ườ
4.1 Ti n x lý d li uề ử ữ ệ
4.2 Mô hình hóa hành vi
4.3 Khai phá truy v nấ
4.4 Qu ng cáo tr c tuy nả ự ế
10
CH NG 5 H g i ýƯƠ ệ ợ
5.1 T ng quanổ
5.2 K-láng gi ng g n nh tềầấ
5.3 Phân rã ma tr nậ
5.4 Các ch đ nâng caoủ ề

