
BÀI GIẢNG KHAI PHÁ QUAN ĐIỂM
VÀ KHAI PHÁ PHƯƠNG TIỆN XÃ HỘI
CHƯƠNG 5. XÂY DỰNG KHO NGỮ LIỆU QUAN ĐIỂM
VÀ TỔNG HỢP QUAN ĐIỂM
PGS. TS. HÀ QUANG THỤY
HÀ NỘI 09-2013
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẠI HỌC QUỐC GIA HÀ NỘI
1

Nội dung
1. Giới thiệu tiếp cận kho ngữ liệu
2. Tiếp cận dựa trên từ điển
3. Tiếp cận dựa trên ngữ liệu
4. Sự kiện mong muốn và không mong muốn
5. Giới thiệu tổng hợp quan điểm
6. Tổng hợp quan điểm theo khía cạnh
7. Cải tiến tổng hợp quan điểm theo khía cạnh
8. Tổng hợp tương phản
9. Tổng hợp truyền thống
2

1. Tiếp cận từ vựng quan điểm
Đặt vấn đề
Từ quan điểm: từ đánh giá, từ phân cực, từ mang quan điểm.
Từ quan điểm tích cực: trạng thái, chất lượng mong muốn
Từ QĐ tiêu cực: trạng thái, chất lượng không mong muốn
Từ quan điểm đơn, cụm từ quan điểm, thành ngữ: Từ vựng
quan điểm
Vai trò từ quan điểm
Phương pháp dựa trên từ vựng: Phân lớp quan điểm, phân lớp
quan điểm câu và khai phá quan điểm mức khía cạnh
Phương pháp học máy: Cần các từ loại, có phân biệt từ quan
điểm
Phân loại và xây dựng
Kiểu từ quan điểm tiếng Anh: cơ sở và so sánh
So sánh: so sánh và cực trị. Tốt hơn, tồi hơn, tốt nhất, tồi
nhất… so sánh nhiều thực thể
Xây dựng : thủ công, dựa trên từ vựng, dựa trên kho ngữ liệu
Thủ công: kiếm tra cuối cùng, kết hợp các tiếp cận tự động
3

2. Tiếp cận dựa trên từ điển
Đặt vấn đề
Hầu hết các từ điển liệt kê các từ đồng nghĩa/trái nghĩa
Phương pháp chung
Sử dụng một vài từ hạt giống (seed) “mồi”
Loang (Boostraping) dựa trên cấu trúc đồng nghĩa/trái nghĩa của
một từ điển
Nội dung
Phương pháp chung
(1) Thu thập bằng tay một tập nhỏ hạt giống các từ quan điểm
(tích cực, tiêu cực)
(2) Sử dụng từ điển loang theo cấu trúc đồng nghĩa, trái nghĩa
thêm vào danh sách hạt giống
(3) Lặp cho tới khi không tìm thấy từ mới
(4) Kiểm tra thủ công làm sạch danh sách
(5) Đưa độ đo cho mỗi từ quan điểm phát hiện được
Rất nhiều tiếp cận phức tạp hơn được đề xuất:
Xác định định hướng quan điểm bằng khoảng cách trong
Wordnet
Tập hạt giống: tích cực, tiêu cực &trung lập. Trung lập chặn
loang. Trọng số +1, -1, điều chỉnh trong quá trình loang 4

3. Tiếp cận dựa theo ngữ liệu miền
Giới thiệu chung
Cũng sử dụng tập dữ liệu hạt giống
Ngữ liệu miền thay cho từ điển
Ngữ liệu miền: tập các văn bản về miền ứng dụng
Gắn với miền ứng dụng
Từ vựng có tính “cục bộ”
Phương pháp
Tương tự như dựa trên từ điển
Hạt giống: tích cực, tiêu cực
Cấu trúc đồng nghĩa, trái nghĩa đoạn câu là danh sách các
từ có chứa từ hạt giống
Độ giàu có của ngữ liệu
Rất nhiều phương pháp được đề xuất: hoạt động công phu
hơn.
5

