Danh sách chủ đề BTL<br />
<br />
[IT4868] Khai phá Web<br />
Hướng dẫn thực hiện BTL<br />
<br />
●<br />
<br />
Social network analysis on Twitter<br />
<br />
●<br />
<br />
Social network analysis on Wikipedia<br />
<br />
●<br />
<br />
Sentiment analysis on Twitter<br />
<br />
●<br />
<br />
Sentiment analysis on news comments<br />
<br />
●<br />
<br />
Sentiment analysis on product reviews<br />
<br />
●<br />
<br />
Recommendation systems<br />
<br />
1<br />
<br />
2<br />
<br />
SNA - Twitter<br />
●<br />
<br />
1 - Thu thập dữ liệu:<br />
<br />
●<br />
<br />
1 - Thu thập dữ liệu:<br />
<br />
–<br />
<br />
Twitter API<br />
<br />
–<br />
<br />
https://dumps.wikimedia.org/<br />
<br />
–<br />
<br />
Xuất phát từ một tài khoản ban đ ầu, m ở r ộng ra các tài kho ản<br />
khác thông qua quan hệ reply và retweet<br />
<br />
–<br />
<br />
Xuất phát từ một bài viết ban đ ầu, m ở r ộng ra các bài vi ết<br />
liên quan thông qua quan hệ wiki-link<br />
<br />
●<br />
<br />
2 - Nhận diện cộng đồng trên đồ th ị thu đ ược (delphi)<br />
<br />
●<br />
<br />
3 - Trực quan hóa và nh ận xét k ết qu ả thu đ ược<br />
<br />
●<br />
<br />
SNA - Wikipedia<br />
<br />
●<br />
<br />
4 - Trực quan hóa nội dung đ ược th ảo lu ận s ử d ụng word<br />
cloud: Coi mỗi văn bản là các t ập h ợp các tweet c ủa m ột<br />
tài khoản; mỗi cộng đồng sẽ tương ứng v ới m ột t ập văn<br />
b ản<br />
3<br />
<br />
●<br />
●<br />
<br />
2 - Nhận diện cộng đồng trên đ ồ th ị thu đ ược<br />
(delphi)<br />
3 - Trực quan hóa và nhận xét k ết qu ả thu đ ược<br />
4 - Trực quan hóa nội dung sử d ụng word cloud: Coi<br />
mỗi văn bản là nội dung bài vi ết<br />
4<br />
<br />
SA - Twitter<br />
●<br />
<br />
●<br />
<br />
●<br />
<br />
SA - News comments<br />
<br />
1 - Thu thập dữ liệu<br />
–<br />
<br />
Twitter API<br />
<br />
–<br />
<br />
Thu thập các tweet theo keyword trong m ột kho ảng<br />
thời gian<br />
<br />
●<br />
<br />
●<br />
<br />
2 - Tiến hành nhận diện khía cạnh & phân tích<br />
cảm xúc theo khía cạnh trên các tweet thu đ ược<br />
<br />
●<br />
<br />
3 - Trực quan hóa kết quả dạng biểu đ ồ, timeline<br />
<br />
1 - Thu thập dữ liệu: Comments from online<br />
news<br />
2 - Tiến hành nhận diện khía c ạnh & phân tích<br />
cảm xúc theo khía cạnh trên các comment thu<br />
được<br />
3 - Trực quan hóa kết quả dạng bi ểu đ ồ,<br />
timeline<br />
<br />
5<br />
<br />
6<br />
<br />
SA - Product reviews<br />
●<br />
<br />
●<br />
<br />
●<br />
<br />
RecSys<br />
<br />
1 - Thu thập dữ liệu: Product reviews (food,<br />
hotels….)<br />
<br />
●<br />
<br />
1 - Chuẩn bị dữ liệu<br />
–<br />
<br />
2 - Tiến hành nhận diện khía c ạnh & phân tích<br />
cảm xúc theo khía cạnh trên các comment thu<br />
được<br />
<br />
●<br />
<br />
●<br />
<br />
3 - Trực quan hóa kết quả dạng bi ểu đ ồ,<br />
timeline<br />
<br />
7<br />
<br />
Sử dụng các tập dữ liệu chuẩn có s ẵn (movielens…)<br />
<br />
2 - Đánh giá các phương pháp g ợi ý trên các t ập d ữ<br />
liệu chuẩn (train/dev/test, RSE, precision/recall…)<br />
3 - Xây dựng một hệ gợi ý hướng ng ười dùng d ựa<br />
trên tập dữ liệu đã có<br />
–<br />
<br />
Có chức năng gợi ý sản phẩm, đăng nh ập, đăng xu ất,<br />
xem lịch sử đánh giá<br />
<br />
–<br />
<br />
Sản phẩm: phim, nhạc, sách, nhà hàng, khách s ạn, ...<br />
<br />
8<br />
<br />
Q&A<br />
mail to: hieunk@soict.hust.edu.vn<br />
9<br />
<br />