intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Khai phá quan điểm và khai phá phương tiện xã hội: Chương 2 - PGS.TS. Hà Quang Thụy

Chia sẻ: Lavie Lavie | Ngày: | Loại File: PPT | Số trang:10

70
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Khai phá quan điểm và khai phá phương tiện xã hội: Chương 2 - Bài toán khai phá quan điểm (phân tích tình cảm) bao gồm những nội dung về định nghĩa bài toán; tóm tắt quan điểm; các kiểu khai phá quan điểm; chủ quan và cảm xúc trong khai phá quan điểm.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Khai phá quan điểm và khai phá phương tiện xã hội: Chương 2 - PGS.TS. Hà Quang Thụy

  1. BÀI GIẢNG KHAI PHÁ QUAN ĐIỂM VÀ KHAI PHÁ PHƯƠNG TIỆN XÃ HỘI CHƯƠNG 2. BÀI TOÁN KHAI PHÁ QUAN ĐIỂM (PHÂN TÍCH TÌNH CẢM) PGS. TS. HÀ QUANG THỤY HÀ NỘI 09-2013 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI 1
  2. Nội dung 1. Định nghĩa bài toán 2. Tóm tắt quan điểm 3. Các kiểu khai phá quan điểm 4. Chủ quan và cảm xúc 2
  3. 1. Định nghĩa bài toán đánh giá QĐ  Ví dụ liên quan (Ví dụ 2.1) Người đưa: John Smith Ngày: 10 tháng chín năm 2011 "(1) Tôi mua một máy ảnh Canon G12 sáu tháng trước đây. (2) Tôi đơn giản chỉ là thích nó. (3) Chất lượng hình ảnh là tuyệt vời. (4) Tuổi thọ pin cũng dài. (5) Tuy nhiên, vợ tôi nghĩ rằng nó là quá nặng cho cô ấy. “  Phân tích ví dụ + Đánh giá này có một số quan điểm tích cực (Câu 2, 3, 4) và tiêu cực (câu 5) Nhận diện: Mỗi quan điểm có hai thành phần chính “(g, s): g là đối tượng và s là quan điểm tích cực tiêu chức” Khai phá quan điểm ở đây có dạng (g, s): g là thực thể/khía cạnh, s là đánh giá tích cực, tiêu cực, trung tính: định hướng phân cực (sentiment/opinion) orientations/polarities). + Đánh giá này có hai tác giả + Đánh giá này xẩy ra ngày 10/9/2011 3
  4. Định nghĩa quan điểm  Định nghĩa quan điểm sơ bộ  Quan điểm: (g, s, h, t)  g: đối tượng quan điểm (hoặc tình cảm): opinion target,  s : đánh giá về đối tượng: sentiment,  h: người chủ quan điểm: opinion holder  t : thời gian bày tỏ quan điểm  Ví dụ: (Canon G12, thích, Smith, 10/9/2011) (Hình ảnh Canon G12, tuyệt vời, Smith, 10/9/2011)  Định nghĩa thực thể  Thực thể: sản phẩm, dịch vụ, chủ đề, vấn đề, người, tổ chức, hoặc sự kiện.  Mô tả bằng cặp e: (T, W), với T là một hệ phân cấp của các thành phần, thành phần con v.v., và W là một tập các thuộc tính của e.  Phân biệt khía cạnh – thành phần: trọng lượng: đặc trưng, pin: thành phần (tháo lắp được) 4
  5. Định nghĩa quan điểm khái quát  Định nghĩa quan điểm khái quát  Một quan điểm p = (ei, aij, sijkl, hk, tl),  ei : tên một thực thể,  aij : một khía cạnh của ei,  sijkl : quan điểm trên khía cạnh aij của thực thể ei,  hk : người chủ quan điểm,  tl : thời gian khi quan điểm được hk bày tỏ. sijkl tình cảm tích cực, tiêu cực hoặc trung tính, hoặc thể hiện với mức độ sức mạnh / cường độ khác nhau (1-5)  Nhận xét định nghĩa  quan điểm sijkl phải được người chủ quan điểm hk đưa ra về khía cạnh aij của thực thể ei vào thời điểm tl.  Năm thành phần là rất cần thiết, thiếu bất kỳ thành phần nào sẽ là vấn đề 5
  6. Thể hiện khía cạnh và quan điểm  Thể hiện khía cạnh hiện/ẩn  Thể hiện hiện được biểu diễn bằng danh từ/cụm danh từ. “Ảnh chụp của Canon rất tươi”  Thể hiện ẩn: không có danh từ/cụm danh từ biểu diễn. “Canon nặng”. Khía cạnh “trọng lượng” ẩn. “Máy ảnh này đắt”  Thể hiện tình cảm  Tình cảm/đánh giá sijkl thường là từ/cụm từ. Phổ biến hiện: có từ tình cảm xuất hiện  Có thể có thêm trọng số: (1-5), hoặc như SentiWordNet. 6
  7. MH thực thể và MH tài liệu quan điểm  Mô hình thực thể  Biểu diễn ei một cách toàn bộ và một tập hữu hạn khía cạnh Ai = {ai1, ai2,..., ain}.  ei được biểu diễn với bất kỳ một tập hữu hạn các thể hiện thực thể của nó {eei1, eei2,..., eeis}.  Mỗi khía cạnh aij. của thực thể ei được thể hiện với bất kỳ một tập hợp hữu hạn của các biểu diễn khía cạnh {aeij1, aeij2,..., aeijm}  Mô hình tài liệu quan điểm  Tài liệu d chứa quan điểm trên một tập thực thể {e1, e2,..., er} và một tập con các khía cạnh của chúng từ một tập các chủ sở hữu quan điểm {h1, h2,..., hp} vào một thời điểm cụ thể 7
  8. Bài toán trong phân tích quan điểm  Trích xuất và phân lớp thực thể  Input: Tài liệu quan điểm d  Output: tập thực thể {e1, e2,..., er} xuất hiện trong d  Trích xuất và phân lớp khía cạnh  Input: Thực thể e trong tài liệu d  Output: Các nhóm cụm từ thể hiện các khía cạnh của e  Trích xuất và phân lớp chủ của tình cảm  Input: tập thực thể {e1, e2,..., er} xuất hiện trong d  Output: Người nêu một quan điểm về một thực thể e  Trích xuất và chuẩn hóa thời gian  Input: Một quan điểm trong tài liệu d  Output: Thời gian phát biểu quan điểm  Phân lớp khía cạnh quan điểm  Input: Cho một khía cạnh a và một nhận xét  Output: Nhận xét là tích cực/tiêu cực  Sinh bộ 5 quan điểm  Input: Tài liệu quan điểm d  Output: Mọi bộ năm quan điểm trong d 8
  9. Ví dụ  Nhận xét bigJohn ngày: 15 Tháng Chín, 2011 (1) Tôi mua một máy ảnh Samsung và bạn của tôi mua một máy ảnh Canon hôm qua. (2) Tuần qua, hai chúng tôi sử dụng máy ảnh rất nhiều. (3) Hình ảnh từ Samy của tôi là không tuyệt vời, và tuổi thọ pin ngắn. (4) Bạn của tôi hài lòng với máy ảnh của mình và rất hài lòng về chất lượng hình ảnh của nó. (5) Tôi muốn có một máy ảnh có thể chụp ảnh tốt. (6) Tôi sẽ có nó vào ngày mai. Chỉ có câu 3,4 là câu quan điểm  Kết quả  (Samsung, chất_lượng_ảnh, tiêu cực, bigJohn, Sept-15-2011)  (Samsung, tuổi_thọ_pin, tiêu cực, bigJohn, Sept-15-2011)  (Canon, GENERAL, tích cực, Bạn-bigJohn, Sept-15-2011)  (Canon, chất_lượng_ảnh, tích cực, Bạn-bigJohn, Sept-15-2011) 9
  10. Tổng hợp quan điểm  Quan điểm cần được tổng hợp  Một người không cho ý kiến quyết định  Tập hợp quan điểm nhiều người  Phân tích quan điểm ~ Tóm tắt đa văn bản  Ví dụ Máy ảnh số 1: Khía cạnh: CHUNG Tích cực: 105 Phủ định: 12 Khía cạnh: Chất lượng hình ảnh Tích cực: 95 Phủ định: 10 Khía cạnh: Tuổi thọ pin Tích cực: 50 Phủ định: 9  ” 10
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2