intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận án Tiến sĩ Kỹ thuật: Khai phá quan điểm với kỹ thuật học sâu

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:164

7
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận án Tiến sĩ Kỹ thuật "Khai phá quan điểm với kỹ thuật học sâu" trình bày các nội dung chính sau: Đề xuất trích rút khía cạnh của thực thể với hướng tiếp cận học sâu và mô hình khai phá quan điểm thực hiện tác vụ này dựa trên các kỹ thuật học sâu; Đề xuất xây dựng một tập dữ liệu đa miền dùng cho thực nghiệm được hình thành trên cơ sở tích hợp các bình luận của người dùng trên các miền khác nhau; và mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền sử dụng hướng tiếp cận học sâu được thực nghiệm trên tập dữ liệu đa miền này.

Chủ đề:
Lưu

Nội dung Text: Luận án Tiến sĩ Kỹ thuật: Khai phá quan điểm với kỹ thuật học sâu

  1. ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN UYÊN TRANG KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU (Opinion mining with deep learning) LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐÀ NẴNG – 2023
  2. ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN UYÊN TRANG KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU (Opinion mining with deep learning) Ngành: Khoa học máy tính Mã số: 9.48.01.01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Cán bộ hướng dẫn: 1. TS. Hoàng Thị Thanh Hà 2. TS. Đặng Hoài Phương ĐÀ NẴNG – 2023 ii
  3. LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu do tôi thực hiện, dưới sự hướng dẫn của TS. Hoàng Thị Thanh Hà và TS. Đặng Hoài Phương. Tôi cam đoan các kết quả nghiên cứu được trình bày trong luận án là trung thực và không sao chép từ bất kỳ công trình nghiên cứu nào khác. Mọi trích dẫn trong luận án đều đề cập đến nguồn gốc xuất xứ rõ ràng và đầy đủ. Tác giả Trần Uyên Trang iii
  4. MỤC LỤC LỜI CAM ĐOAN ........................................................................................................III MỤC LỤC .................................................................................................................... IV DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT.................................................... VII DANH MỤC BẢNG .................................................................................................... IX DANH MỤC HÌNH ...................................................................................................... X PHẦN MỞ ĐẦU ............................................................................................................ 1 1. TÍNH CẤP THIẾT CỦA LUẬN ÁN ........................................................................... 1 2. MỤC TIÊU, ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU CỦA LUẬN ÁN ...................... 4 3. CÁC ĐÓNG GÓP CỦA LUẬN ÁN ............................................................................. 5 4. BỐ CỤC CỦA LUẬN ÁN .......................................................................................... 6 CHƯƠNG 1- TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM VÀ KỸ THUẬT HỌC SÂU ....................................................................................................................... 9 1.1. KHAI PHÁ QUAN ĐIỂM ......................................................................................... 9 1.2. CÁC CẤP ĐỘ KHAI PHÁ QUAN ĐIỂM .................................................................. 11 1.2.1. Khai phá quan điểm mức tài liệu .............................................................. 12 1.2.2. Khai phá quan điểm mức câu.................................................................... 12 1.2.3. Khai phá quan điểm mức khía cạnh hay mức đặc trưng ......................... 12 1.3. CÁC HƯỚNG NGHIÊN CỨU KHAI PHÁ QUAN ĐIỂM ............................................ 13 1.3.1. Hướng tiếp cận dựa trên ngữ liệu ............................................................. 14 1.3.2. Hướng tiếp cận máy học ............................................................................ 14 1.3.3. Các nghiên cứu liên quan ......................................................................... 16 1.4. MỘT SỐ HẠN CHẾ CỦA CÁC TIẾP CẬN KHAI PHÁ QUAN ĐIỂM HIỆN NAY ......... 24 1.5. HỌC SÂU VÀ NHÓM KỸ THUẬT HỌC SÂU ĐƯỢC SỬ DỤNG TRONG CÁC MÔ HÌNH KHAI PHÁ QUAN ĐIỂM ĐỀ XUẤT ..................................................................... 30 1.5.1. Học sâu ....................................................................................................... 30 iv
  5. 1.5.2. Các kỹ thuật học sâu phổ biến dùng trong xử lý ngôn ngữ tự nhiên và khai phá quan điểm............................................................................................... 34 1.6. ĐỀ XUẤT NGHIÊN CỨU: KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU ........ 46 1.7. KẾT LUẬN CHƯƠNG 1 ........................................................................................ 47 CHƯƠNG 2-TRÍCH RÚT KHÍA CẠNH TRONG KHAI PHÁ QUAN ĐIỂM VỚI HƯỚNG TIẾP CẬN HỌC SÂU ................................................................................ 49 2.1. TRÍCH RÚT KHÍA CẠNH VỚI HƯỚNG TIẾP CẬN HỌC SÂU .................................. 49 2.2. MÔ HÌNH TRÍCH RÚT KHÍA CẠNH VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT................ 54 2.2.1. Mô hình tích hợp BiGRU-CRF cho trích rút khía cạnh .......................... 55 2.2.2. Mô hình tích hợp Bi-IndyLSTM-CRF cho trích rút khía cạnh ............... 59 2.3. KẾT QUẢ THỰC NGHIỆM.................................................................................... 64 2.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm ................................ 64 2.3.2. Kết quả thực nghiệm và đánh giá hiệu quả trích rút khía cạnh .............. 65 2.4. KẾT LUẬN CHƯƠNG 2........................................................................................ 67 CHƯƠNG 3-KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI HƯỚNG TIẾP CẬN HỌC SÂU ................................................................................ 68 3.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ ........................................ 68 3.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT .......................................................................................... 69 3.2.1. Mô hình CNN-BiGRU cho trích rút khía cạnh và quan điểm ................. 71 3.2.2. Mô hình CNN-IOB2 cho trích rút từ mục tiêu ......................................... 76 3.2.3. Mô hình MABSA cho trích rút và phân loại ba tác vụ tiếp theo: khía cạnh, thực thể và quan điểm................................................................................. 82 3.3. KẾT QUẢ THỰC NGHIỆM CÁC MÔ HÌNH ............................................................ 89 3.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm ................................ 90 3.3.2. Kết quả thực nghiệm, đánh giá hiệu quả khai phá quan điểm đa tác vụ 91 3.4. KẾT LUẬN CHƯƠNG 3........................................................................................ 97 CHƯƠNG 4-KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ, ĐA MIỀN VỚI HƯỚNG TIẾP CẬN HỌC SÂU ............................................................ 99 v
  6. 4.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA MIỀN.......................................... 101 4.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ ĐA MIỀN ĐỀ XUẤT ............................................................................................................. 102 4.2.1. Mô hình khai phá quan điểm mức khía cạnh đa miền CNN-BiLSTM . 103 4.2.2. Mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền CNN- BiIndyLSTM-Attention ....................................................................................... 110 4.3. KẾT QUẢ THỰC NGHIỆM.................................................................................. 115 4.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm .............................. 116 4.3.2. Kết quả thực nghiệm và đánh giá hiệu quả khai phá quan điểm đa tác vụ trên đơn miền và đa miền ................................................................................... 117 4.4. KẾT LUẬN CHƯƠNG 4...................................................................................... 124 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ............................................................... 126 KẾT LUẬN ................................................................................................................ 126 HƯỚNG PHÁT TRIỂN ............................................................................................... 132 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ ........................ 133 TÀI LIỆU THAM KHẢO ........................................................................................ 135 vi
  7. DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT STT Thuật ngữ Tiếng Anh Viết tắt 1 Đơn vị tuyến tính được chỉnh Rectified Linear Unit ReLU lưu 2 Học máy Machine learning ML 3 Học sâu Deep learning DL 4 Khai phá quan điểm/Phân tích Opinion mining/Sentiment analysis OM/SA cảm xúc 5 Khai phá quan điểm mức tài Document_based sentiment analysis DBSA liệu 6 Khai phá quan điểm mức câu Sentence_based sentiment analysis SBSA 7 Khai phá quan điểm mức khía Aspect/Feature_based sentiment ABSA cạnh/đặc trưng analysis 8 Khai phá quan điểm mức khía Multitask aspect/feature_based MABSA cạnh/đặc trưng đa tác vụ sentiment analysis 9 Khai phá quan điểm mức khía Multidomain aspect/feature_based cạnh/đặc trưng đa miền sentiment analysis 10 Ma trận đồng xuất hiện Co-occurrence matrix 11 Mạng neural hồi quy Recurrent Neural Network RNN 12 Mạng neural hồi quy hai Bidirectional Recurrent Neural BiRNN chiều Network 13 Mạng bộ nhớ ngắn dài Long_Short Term Memory LSTM 14 Mạng bộ nhớ ngắn dài hai Bidirectional Long_Short Term BiLSTM chiều Memory 15 Mạng bộ nhớ ngắn dài độc lập Independently Long_Short Term IndyLSTM Memory 16 Mạng bộ nhớ ngắn dài độc lập Bidirectional Independently BiIndyLSTM hai chiều Long_Short Term Memory 17 Mạng đơn vị hồi quy có cổng Gated Recurrent Unit GRU 18 Mạng đơn vị hồi quy có cổng Bidirectional Gated Recurrent Unit BiGRU hai chiều 19 Mạng neural đệ quy Recursive Neural Network 20 Mạng neural tích chập Convolutional Neural Network CNN 21 Máy vector hỗ trợ Support Vector Machine SVM 22 Mô hình Markov ẩn Hidden Markov Models HMM 23 Phân bổ Dirichlet tiềm ẩn Latent Dirichlet Allocation LDA 24 Phân loại miền Domain classification 25 Phân loại quan điểm Sentiment classification 26 Phân rã đạo hàm Gradient decay 27 Phân tích ngữ nghĩa tiềm ẩn Latent Semantic Analysis LSA 28 Phân tích ngữ nghĩa tiềm ẩn Probabilistic Latent Semantic pLSA xác suất Analysis 29 Quan điểm Opinion 30 Quan điểm tích cực Positive opinion 31 Quan điểm tiêu cực Negative opinion 32 Quan điểm trung lập Neutral opinion vii
  8. 33 Quá khớp Overfitting 34 Trích rút khía cạnh Aspect extraction 35 Trích rút từ mục tiêu quan Opinion target extraction điểm 36 Trích rút thực thể Entity extraction 37 Trường ngẫu nhiên có điều Conditional Random Field CRF kiện 38 Triệt tiêu/bùng nổ đạo hàm Vanishing/exploding gradient 39 Vector toàn cục Global Vector GloVe viii
  9. DANH MỤC BẢNG Bảng 1.1. Các mô hình khai phá quan điểm dựa trên hướng tiếp cận ngữ liệu nổi bật và hiệu suất của các mô hình ................................................................................................................. 26 Bảng 1.2. Các mô hình khai phá quan điểm dựa trên hướng tiếp cận máy học nổi bật và hiệu suất của các mô hình ................................................................................................................. 27 Bảng 2.1. Tập dữ liệu SemEval 2014 ....................................................................................... 65 Bảng 2.2. So sánh độ đo F1 trên mô hình BiGRU-CRF và Bi-IndyLSTM-CRF với các mô hình hiện có ....................................................................................................................................... 65 Bảng 3.1. Sử dụng miền Restaurant trong tập dữ liệu SemEval 2016 cho thực nghiệm ......... 90 Bảng 3.2. Kết quả thực nghiệm mô hình hiện có so với các mô hình đề xuất của luận án trong Chương 2 và Chương 3 trên miền Laptop của tập dữ liệu SemEval 2014 ............................... 92 Bảng 3.3. Kết quả thực nghiệm mô hình hiện có so với các mô hình đề xuất của luận án trong Chương 2 và Chương 3 trên miền Restaurant của tập dữ liệu SemEval 2014 ......................... 92 Bảng 3.4. Kết quả thực nghiệm xét trên độ đo F1 và Accuracy của các mô hình hiện có và mô hình CNN-IOB2 trên miền Restaurant của SemEval 2016 ...................................................... 95 Bảng 3.5. Kết quả thực nghiệm mô hình MABSA đề xuất xét trên các độ đo Precision, Recall, F1 và Accuracy trên miền Restaurant của tập SemEval 2016 .................................................. 96 Bảng 4.1. Tập dữ liệu huấn luyện gồm các đơn miền Restaurant, Laptop của tập SemEval 2016, đa miền Laptop_Restaurant, và đa miền Laptop_Restaurant_Hotel ...................................... 117 Bảng 4.2. Trích rút khía cạnh xét trên độ đo Precision, Recall và F1 của hai mô hình đề xuất so với các mô hình hiện có trên miền Laptop và Restaurant....................................................... 118 Bảng 4.3. Kết quả thực nghiệm mô hình CNN-BiLSTM trên đa miền Laptop_Restaurant .. 120 Bảng 4.4. Kết quả thực nghiệm mô hình CNN-BiIndyLSTM-Attention trên đa miền Laptop_Restaurant_Hotel ....................................................................................................... 121 Bảng 4.5. Trích rút khía cạnh xét trên độ đo Precision, Recall và F1 của hai mô hình đề xuất so với các mô hình hiện có trên đơn miền Restaurant, đa miền Laptop_Restaurant và đa miền Laptop_Restaurant_Hotel ....................................................................................................... 122 Bảng 5.1. Bảng tổng hợp đặc điểm của các mô hình khai phá quan điểm đề xuất ................ 128 ix
  10. DANH MỤC HÌNH Hình 1.1. Các cấp độ cụ thể trong khai phá quan điểm............................................................ 12 Hình 1.2. Mô hình mạng neural đơn giản gồm 1 lớp ẩn .......................................................... 32 Hình 1.3. Mô hình mạng học sâu gồm 3 lớp ẩn ....................................................................... 33 Hình 1.4. Mạng neural tích chập .............................................................................................. 35 Hình 1.5. Tính toán với MaxPooling ....................................................................................... 36 Hình 1.6. Mô hình CNN trong xử lý văn bản .......................................................................... 37 Hình 1.7. Mô hình mạng RNN và các tính toán bên trong RNN ............................................. 38 Hình 1.8. Cấu trúc của mô-đun trong RNN ............................................................................. 40 Hình 1.9. Cấu trúc của mô-đun trong LSTM ........................................................................... 40 Hình 1.10. Cấu trúc chi tiết của một mô-đun LSTM ............................................................... 41 Hình 1.11. Cấu trúc mạng BiLSTM ......................................................................................... 42 Hình 1.12. Cấu trúc cơ bản của GRU ...................................................................................... 43 Hình 1.13. Cấu trúc mạng BiGRU ........................................................................................... 44 Hình 1.14. Cấu trúc mạng Bidirectional IndyLSTM ............................................................... 45 Hình 2.1. Quy trình trích rút khía cạnh của mô hình BiGRU-CRF ......................................... 56 Hình 2.2. Cấu trúc mô hình BiGRU-CRF cho trích rút khía cạnh trong câu quan điểm ......... 58 Hình 2.3. Quy trình trích rút khía cạnh của mô hình Bi-IndyLSTM-CRF .............................. 61 Hình 2.4. Cấu trúc mô hình Bi-IndyLSTM-CRF cho trích rút khía cạnh trong câu quan điểm .................................................................................................................................................. 63 Hình 2.5. Biểu đồ so sánh độ chính xác F1 của hai mô hình đề xuất với các mô hình đã được đánh giá cao trước đây .............................................................................................................. 66 Hình 3.1. Quy trình trích rút, phân loại khía cạnh và quan điểm của mô hình CNN-BiGRU . 74 Hình 3.2. Cấu trúc mô hình CNN-BiGRU cho khai phá quan điểm mức khía cạnh trích rút đồng thời khía cạnh và quan điểm ..................................................................................................... 75 Hình 3.3. Quy trình trích rút từ mục tiêu của mô hình CNN-IOB2 ......................................... 79 Hình 3.4. Cấu trúc mô hình CNN-IOB2 cho trích rút từ mục tiêu........................................... 82 Hình 3.5. Quy trình trích rút, phân loại khía cạnh, thực thể và quan điểm của mô hình MABSA .................................................................................................................................................. 86 Hình 3.6. Cấu trúc mô hình khai phá quan điểm mức khía cạnh đa tác vụ MABSA cho phân loại khía cạnh, thực thể và quan điểm....................................................................................... 88 x
  11. Hình 3.7. So sánh độ chính xác của tác vụ trích rút khía cạnh xét trên độ đo F1 của các mô hình hiện có so với mô hình CNN-BiGRU đề xuất .......................................................................... 93 Hình 3.8. So sánh độ chính xác của tác vụ phân loại quan điểm xét trên độ đo Accuracy của mô hình hiện có so với mô hình CNN-BiGRU đề xuất .................................................................. 94 Hình 3.9. Biểu đồ so sánh độ chính xác của mô hình đề xuất với các mô hình hiện có xét trên độ đo F1 và Accuracy ............................................................................................................... 96 Hình 3.10. Biểu đồ biểu diễn độ đo Precision, Recall, F1 và Accuracy của mô hình MABSA đề xuất............................................................................................................................................ 97 Hình 4.1. Quy trình thực hiện của mô hình khai phá quan điểm mức khía cạnh đa miền CNN- BiLSTM .................................................................................................................................. 106 Hình 4.2. Cấu trúc mô hình khai phá quan điểm mức khía cạnh đa miền CNN-BiLSTM .... 107 Hình 4.3. Quy trình thực hiện của mô hình CNN-BiIndyLSTM-Attention ........................... 113 Hình 4.4. Cấu trúc mô hình khai phá quan điểm mức khía cạnh đa tác vụ đa miền .............. 114 Hình 4.5. Biểu đồ so sánh độ chính xác thực thi tác vụ trích rút khía cạnh của mô hình CNN- BiLSTM đề xuất với các mô hình hiện có trên miền Restaurant ............................................ 115 Hình 4.6. Biểu đồ so sánh độ chính xác thực thi tác vụ trích rút khía cạnh của mô hình CNN- BiIndyLSTM-Attention đề xuất với các mô hình hiện có trên miền Restaurant .................... 120 Hình 4.7. Kết quả thực thi mô hình đa tác vụ CNN-BiIndyLSTM-Attention đề xuất với các độ đo Precision, Recall, F1 và Accuracy trên đa miền Laptop_Restaurant_Hotel ...................... 122 xi
  12. PHẦN MỞ ĐẦU 1. Tính cấp thiết của luận án Trong kỷ nguyên bùng nổ thông tin hiện nay, với sự phát triển mạnh mẽ và nhanh chóng của các nền tảng truyền thông xã hội, thương mại điện tử, người dùng không chỉ chia sẻ thông tin mà còn có thể bày tỏ thái độ, quan điểm cá nhân trực tiếp trên những nền tảng này. Cụ thể là những bình luận, đánh giá, chia sẻ kinh nghiệm của cộng đồng đối với các sản phẩm, dịch vụ mà họ đã từng trải nghiệm; các quan điểm của cộng đồng đối với một chính sách mới hay đối với một nhân vật có tầm ảnh hưởng lớn; và một số vấn đề khác thông qua mạng xã hội, các diễn đàn, blog cá nhân…Thông tin từ các bình luận, chia sẻ, quan điểm dạng này đã ảnh hưởng trực tiếp đến suy nghĩ, tâm tư, nguyện vọng, hành vi của người dùng toàn cầu. Lượng thông tin này đã và đang là một khối dữ liệu khổng lồ không ngừng tăng lên từng ngày từng giờ một cách khó kiểm soát. Đặc biệt từ năm 2020 đến nay, do ảnh hưởng của dịch bệnh Covid 19 cùng với những diễn biến phức tạp của đại dịch, thương mại điện tử đã tăng trưởng ngoạn mục dựa trên lựa chọn ngày càng nhiều của người tiêu dùng. Đối với các cá nhân thường xuyên mua sắm trực tuyến, việc tham khảo các bình luận, nhận xét trên mạng đã ảnh hưởng rất lớn đến quyết định mua hàng của họ. Điều này cho thấy các nền tảng truyền thông xã hội, thương mại điện tử…chính là nơi trao đổi thông tin, đưa ra các bình luận, góp ý cũng như cập nhật trạng thái người dùng ở khắp mọi nơi liên quan đến mọi vấn đề trong xã hội hiện đại. Nguồn thông tin khổng lồ này đã trở thành một kho dữ liệu lớn để các cá nhân và tổ chức sử dụng quan điểm cộng đồng trong tiến trình ra quyết định, hoạch định chiến lược đối với một sản phẩm hay dịch vụ cụ thể. Tuy nhiên, các tương tác như chia sẻ, cập nhật, để lại bình luận liên tục được thực hiện sẽ dẫn đến lượng kích hoạt mới tăng mạnh. Vấn đề này là một tất yếu làm phát sinh bùng nổ dữ liệu. Việc tìm kiếm và chắt lọc thông tin cần thiết vẫn là một tác vụ khó khăn vì sự gia tăng không ngừng của dữ liệu. Nói một cách cụ thể, vấn đề dữ liệu lớn sẽ đi kèm vướng mắc, khó khăn trong việc kiểm soát, tìm kiếm, tổng hợp, phân tích và đánh giá quan điểm. Do đó, việc sử dụng một hệ thống khai phá và tổng hợp quan điểm tự
  13. động giữa lớp lớp thông tin phi cấu trúc dạng này là rất cần thiết. Đặc biệt đối với các nhà hoạch định chiến lược kinh doanh, các doanh nghiệp, các tổ chức chính trị, việc sử dụng hệ thống khai phá và tổng hợp quan điểm tự động sẽ giúp họ dễ dàng xác định được hướng quan điểm chuyên biệt đối với vấn đề họ quan tâm. Khai phá quan điểm hay phân tích cảm xúc [11][12][16] là lĩnh vực nghiên cứu về trích rút và phân loại quan điểm, ý kiến, cảm xúc, thái độ, đánh giá chủ quan của người dùng đối với các thực thể, cá nhân, vấn đề, sự kiện từ nội dung được phát sinh trong văn bản. Khai phá quan điểm áp dụng cho các nền tảng truyền thông xã hội để nghiên cứu hành vi và phản ứng của người dùng đối với một sản phẩm, dịch vụ hay một chính sách cụ thể. Việc phân tích, khai thác ý kiến của người dùng có thể mang lại những tri thức hữu ích hỗ trợ cho việc tìm hiểu xem cộng đồng sử dụng cảm thấy thế nào về dịch vụ, sản phẩm, chủ đề, tổ chức, sự kiện hay các nhân vật nổi tiếng…Trên cơ sở này, các cá nhân và tổ chức có thể sử dụng ý kiến của cộng đồng để ra quyết định. Ngoài ra, khai phá quan điểm còn giúp đạt được những mục đích khác nhau như theo dõi được tâm trạng của cộng đồng liên quan đến các cuộc vận động chính trị, mua bán, giao dịch thông minh [5], phép đo độ thoả mãn của khách hàng [72], phán đoán doanh số của một bộ phim [117]. Quan điểm [8][39][53] trong một hệ thống khai phá quan điểm là nhân tố ảnh hưởng cốt yếu đến hành vi, thái độ của người dùng. Quan điểm đóng vai trò nền tảng trong tiến trình ra quyết định của cả cá nhân và tổ chức bởi vì quan điểm có sức ảnh hưởng lớn đến dự định, xu hướng của con người. Khai phá quan điểm cho phép cung cấp những hiểu biết hữu ích thúc đẩy các quyết định, chiến lược và mục tiêu kinh doanh hiệu quả. Mục đích chính là hỗ trợ doanh nghiệp đề ra những giải pháp kinh doanh chủ động; hỗ trợ cá nhân trong tiến trình ra quyết định sử dụng sản phẩm, dịch vụ mà họ đang quan tâm. Chính vì lý do này mà nhu cầu khai thác năng lực thăm dò và hiểu các quan điểm một cách tự động ngày càng được quan tâm nghiên cứu [91]. Những nội dung liên quan trong khai phá quan điểm [13][66][71] bao gồm: (1) phân loại quan điểm, (2) phân loại tính chủ quan, (3) tổng hợp quan điểm, (4) tìm kiếm và khôi phục quan điểm, (5) phân tích các quan điểm so sánh, (6) thăm dò quan điểm spam, (7) chất lượng của các bình luận. 2
  14. Hiện nay có hai hướng tiếp cận để khai phá quan điểm [70][120]: hướng tiếp cận dựa trên từ vựng và hướng tiếp cận dựa trên máy học. • Hướng tiếp cận dựa trên từ vựng [54][159] sử dụng phương pháp dựa trên từ điển hoặc dựa trên ngữ liệu để xác định quan điểm. Đến thời điểm hiện tại đã có nhiều những nghiên cứu sử dụng kỹ thuật thống kê như phân tích ngữ nghĩa tiềm ẩn LSA [23]; hoặc kỹ thuật ngữ nghĩa như đồng nghĩa và trái nghĩa. • Hướng tiếp cận máy học [17] có thể thực hiện phương pháp học giám sát và học không giám sát để tiến hành phân loại quan điểm. Trong học giám sát, các bài toán phân loại cây quyết định, phân loại tuyến tính cụ thể là kỹ thuật máy vector hỗ trợ SVM hoặc mạng neuron, phân loại dựa trên luật, phân loại xác suất cụ thể là Naïve Bayes, Bayesian Network, Maximum Entropy được sử dụng [139]. Tuy nhiên các kỹ thuật này thường không hiệu quả đối với một số vấn đề khó nhận biết trong cấu trúc của ngôn ngữ tự nhiên. Chẳng hạn như phủ định của một cụm từ thể hiện quan điểm tích cực sẽ hoàn toàn ngược lại với quan điểm ban đầu của nó nhưng nếu chúng ta không biểu diễn được cấu trúc của câu trên tập đặc trưng một cách hợp lý thì sẽ không đạt được kết quả. Xét ở mức độ trừu tượng cao hơn thì những ý chế nhạo hay nghĩa bóng trong một bình luận sẽ là một thử thách lớn đối với máy tính. Các hướng tiếp cận máy học truyền thống để khai phá quan điểm đều dựa trên những đặc trưng được thiết kế, tuy nhiên rất khó xử lý, điều chỉnh các đặc trưng để trích rút thuộc tính được đề cập. Học sâu [25][26][44][47] là một lĩnh vực mới trong nghiên cứu về máy học được phát triển từ năm 2006. Học sâu bao gồm một lớp các kỹ thuật và kiến trúc máy học với khả năng sử dụng nhiều lớp trạng thái xử lý thông tin không tuyến tính [52][61][83]. Dựa vào những kiến trúc và kỹ thuật này để xác định hướng sử dụng phù hợp, chẳng hạn: tổng hợp, phát sinh, nhận dạng hay phân loại [143]. Ưu thế của học sâu là khả năng tự học tận dụng nguồn dữ liệu khổng lồ liên tục được cập nhật từ các trang web, các diễn đàn giúp các mô hình học sâu càng ngày càng trở nên thông minh hơn, đạt độ chính xác cao hơn [145][171][172] . 3
  15. Gần đây, các giải thuật học sâu [29][74] đã cho những kết quả khả quan trong xử lý tín hiệu nói chung và xử lý ngôn ngữ tự nhiên nói riêng. Với tốc độ học nhanh dựa trên khả năng tích hợp card đồ hoạ và độ chính xác đạt được khá cao nhờ vào lợi thế của dữ liệu lớn sẵn có, học sâu đang ngày càng được quan tâm nghiên cứu triển khai cho các bài toán xử lý dữ liệu lớn hiện nay. Dựa trên nhu cầu tất yếu cần có một hệ thống khai phá, tổng hợp quan điểm tự động hỗ trợ người dùng và khả năng xử lý tốt của học sâu trên dữ liệu lớn sẵn có hiện nay, đề tài “Khai phá quan điểm với kỹ thuật học sâu” được thực hiện trong khuôn khổ luận án tiến sĩ chuyên ngành khoa học máy tính đã được triển khai. Luận án mong muốn được đóng góp một phần vào lĩnh vực khai phá, phân tích quan điểm và nghiên cứu hướng tiếp cận học sâu áp dụng cho khai phá quan điểm. 2. Mục tiêu, đối tượng và phạm vi nghiên cứu của luận án 2.1. Mục tiêu nghiên cứu Luận án đi sâu tìm hiểu, áp dụng lý thuyết học sâu vào lĩnh vực khai phá quan điểm. Mục tiêu chung là vận dụng các kỹ thuật học sâu để đề xuất và tinh chỉnh mô hình khai phá quan điểm mức khía cạnh nhằm cải tiến độ chính xác, nâng cao hiệu suất, tăng tính tiện ích của mô hình. Các mục tiêu cụ thể gồm: - Đề xuất trích rút khía cạnh của thực thể với hướng tiếp cận học sâu và mô hình khai phá quan điểm thực hiện tác vụ này dựa trên các kỹ thuật học sâu; - Đề xuất, mở rộng khả năng trích rút, phân loại các tác vụ chính một cách đồng thời (đa tác vụ/đa nhiệm) trong một hệ thống khai phá quan điểm dựa trên mức khía cạnh; và mô hình khai phá quan điểm mức khía cạnh đa tác vụ thực hiện trích rút các tác vụ nói trên sử dụng hướng tiếp cận học sâu; - Đề xuất xây dựng một tập dữ liệu đa miền dùng cho thực nghiệm được hình thành trên cơ sở tích hợp các bình luận của người dùng trên các miền khác nhau; và mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền sử dụng hướng tiếp cận học sâu được thực nghiệm trên tập dữ liệu đa miền này. 2.2. Đối tượng nghiên cứu Luận án tập trung cụ thể vào các đối tượng nghiên cứu sau: - Khía cạnh, quan điểm, khai phá và phân tích quan điểm mức khía cạnh. 4
  16. - Các kỹ thuật học sâu áp dụng cho xử lý ngôn ngữ tự nhiên. - Các mô hình trích rút khía cạnh và khai phá quan điểm mức khía cạnh sử dụng kỹ thuật học sâu. 2.3. Phạm vi nghiên cứu Luận án được giới hạn trong phạm vi cụ thể sau: - Tập trung vào vấn đề khai phá quan điểm và những thuận lợi cũng như tính thực tiễn cao của việc trích rút quan điểm của người dùng. - Tìm hiểu các giải thuật học sâu áp dụng cho khai phá và phân tích quan điểm - Tập trung nghiên cứu về các mạng neural sâu hỗ trợ xử lý ngôn ngữ tự nhiên và khai phá quan điểm, thế mạnh và khả năng tích hợp với card đồ hoạ để giải quyết vấn đề tốc độ xử lý trong máy học. 3. Các đóng góp của luận án Luận án có những đóng góp sau: - Xây dựng mô hình trích rút khía cạnh của thực thể trong khai phá quan điểm dựa trên hướng tiếp cận học sâu mới với cải tiến về hiệu suất của mô hình. - Xây dựng hệ thống khai phá quan điểm dựa trên mức khía cạnh đa tác vụ mới nhằm dự đoán quan điểm người dùng. Hệ thống thực hiện đồng thời các tác vụ: trích rút từ mục tiêu, trích rút khía cạnh, phân loại thực thể và xác định quan điểm thể hiện trên khía cạnh của thực thể trong các bình luận trên một miền xác định. - Xây dựng một tập dữ liệu bình luận đa miền dùng cho thực nghiệm. Tập dữ liệu này được hình thành từ việc thực hiện trộn ngẫu nhiên các bình luận từ các miền khác nhau thành một tập dữ liệu hỗn hợp đa miền và triển khai hệ thống khai phá quan điểm trên tập dữ liệu đa miền này. - Xây dựng hệ thống khai phá quan điểm mức khía cạnh đa tác vụ đa miền mới nhằm dự đoán quan điểm người dùng. Hệ thống thực hiện đồng thời các tác vụ: trích rút khía cạnh, phân loại thực thể, phân loại miền và xác định quan điểm thể hiện trên khía cạnh của thực thể trong các bình luận thuộc tập dữ liệu đa miền. 5
  17. Cụ thể, các mô hình khai phá quan điểm mới được nêu ở trên đã được xây dựng dựa trên cơ chế tích hợp các mạng học sâu: - Mô hình khai phá quan điểm BiGRU-CRF và BiIndyLSTM-CRF thực hiện trích rút khía cạnh trong câu bình luận. - Mô hình khai phá quan điểm mức khía cạnh đa tác vụ CNN-BiGRU, CNN- IOB2 và MABSA thực hiện trích rút và phân loại đa tác vụ (trích rút từ mục tiêu, khía cạnh, phân loại thực thể và xác định quan điểm trên mỗi khía cạnh của thực thể) trên tập dữ liệu đơn miền. - Mô hình khai phá quan điểm mức khía cạnh đa tác vụ đa miền CNN-BiLSTM và CNN-BiIndyLSTM-Attention thực hiện trích rút và phân loại đa tác vụ trên tập dữ liệu đơn miền và đa miền. Các mô hình này khi được thực nghiệm trên các tập dữ liệu đơn miền và đa miền đều đạt hiệu suất cao so với các mô hình trước đây chỉ thực nghiệm trên các tập dữ liệu đơn miền. 4. Bố cục của luận án Trên cơ sở mục tiêu đặt ra, các đối tượng và phạm vi nghiên cứu được giới hạn, luận án được tổ chức thành ba phần: Phần mở đầu; Phần nội dung và kết quả nghiên cứu, thực nghiệm; Phần kết luận và hướng phát triển. • Phần mở đầu giới thiệu về tính cấp thiết, mục tiêu, đối tượng, phạm vi và các đóng góp của luận án • Phần nội dung và kết quả nghiên cứu được xây dựng thành bốn chương. Phần này trình bày tổng quan lý thuyết về khai phá quan điểm, các cấp độ khai phá quan điểm, các kỹ thuật học sâu phổ biến cho xử lý ngôn ngữ tự nhiên và khai phá quan điểm, các nghiên cứu hiện nay về khai phá quan điểm cũng như những vấn đề còn phải tiếp tục giải quyết để nâng cao hiệu suất và độ chính xác của nó, từ đó đề xuất nội dung nghiên cứu của luận án. Cụ thể các chương được giới thiệu khái quát bên dưới: Chương 1 đi sâu tìm hiểu về lĩnh vực khai phá, phân tích quan điểm, các cấp độ khai phá quan điểm, học sâu và các kỹ thuật học sâu phổ biến dùng trong xử lý ngôn ngữ tự nhiên, phương pháp đánh giá hiệu suất của một mô hình khai phá quan điểm, các hướng tiếp cận khai phá quan điểm cũng như những nghiên cứu hiện có về lĩnh vực khai 6
  18. phá quan điểm để từ đó xác định được phạm vi nghiên cứu của luận án. Trên cơ sở này, Chương 1 phác thảo những đề xuất cho mô hình khai phá quan điểm sẽ được cụ thể hoá trong các chương tiếp theo. Chương 2 tập trung vào nghiên cứu trích rút khía cạnh trong khai phá quan điểm với mô hình trích rút sử dụng kỹ thuật học sâu. Mô hình này cho phép trích rút được các khía cạnh liên quan thực thể được đề cập trong các bình luận. Mô hình trích rút khía cạnh dựa trên các mạng học sâu này được so sánh với một số mô hình hiện có cũng thực hiện cùng một tác vụ trích rút trên hai miền Laptop và Restaurant của cùng một tập dữ liệu SemEval 2014. Hiệu suất của mô hình đề xuất trong chương 2 được đánh giá qua tính chính xác đạt được thể hiện trên độ đo F1. Chương 3 giới thiệu các tác vụ chính trong khai phá quan điểm bên cạnh tác vụ trích rút khía cạnh đã được thực hiện trong Chương 2. Song song với đó, Chương 3 cũng trình bày mô hình khai phá quan điểm mức khía cạnh đa tác vụ tập trung trích rút và phân loại các tác vụ chính đã nêu sử dụng các kỹ thuật học sâu tích hợp. Xuyên suốt mô hình được xây dựng trong Chương 3 thực hiện các tác vụ này là các mạng học sâu phổ biến được tích hợp chồng lên nhau đi kèm với một số kỹ thuật nhúng từ và xác định hình thái từ nhằm mục đích tăng mức độ hiểu ngữ cảnh, hình thái và ngữ nghĩa của từ trong câu bình luận. Mô hình khai phá quan điểm đa tác vụ đề xuất không chỉ trích rút từng thành phần riêng lẻ trong nhóm các tác vụ chính đã nêu mà tiến hành trích rút đồng thời các tác vụ này. Hiệu suất của mô hình đa tác vụ đề xuất được so sánh với các mô hình trước đây chỉ trích rút hoặc phân loại từng thành phần riêng lẻ được thực nghiệm trên cùng tập dữ liệu; được đánh giá thông qua việc đánh giá độ chính xác đạt được thể hiện lần lượt trên các độ đo Precision, Recall, F1 và Accuracy. Chương 4 trình bày mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền thực nghiệm trên một tập dữ liệu đa miền với hướng tiếp cận học sâu. Khác với tiếp cận trong Chương 2 và Chương 3 chỉ thực nghiệm mô hình trên các tập dữ liệu đơn miền, mô hình khai phá quan điểm đa miền được đề cập trong Chương 4 thực nghiệm trên tập dữ liệu đa miền. Đề xuất này góp phần cung cấp một mô hình hiệu quả và tương thích với dữ liệu trên các bình luận thuộc nhiều miền khác nhau. Mô hình được xây dựng khẳng định tính thuận tiện, tinh gọn trong trường hợp chỉ cần dùng một mô hình khai 7
  19. phá quan điểm cho việc trích rút, phân loại khía cạnh, quan điểm…đa tác vụ trên một tập dữ liệu đa miền sử dụng hướng tiếp cận học sâu mà vẫn đảm bảo độ chính xác tương đối cao. Tương tự các chương trước, hiệu suất của mô hình khai phá quan điểm đa tác vụ, đa miền đề xuất được so sánh với các mô hình trước đây, được đánh giá cho thấy tính hiệu quả cao hơn thông qua độ chính xác đạt được thể hiện trên các độ đo Precision, Recall, F1 và Accuracy như trong Chương 3. Bên cạnh đó, mô hình cũng được triển khai thực nghiệm trên cả dữ liệu đơn miền và đa miền. • Phần kết luận và hướng phát triển đúc kết lại những đóng góp của luận án và hướng nghiên cứu tiếp theo để phát triển luận án. 8
  20. CHƯƠNG 1- TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM VÀ KỸ THUẬT HỌC SÂU Chương này tập trung nghiên cứu sự gắn kết giữa lý thuyết học sâu với bài toán khai phá quan điểm thông qua việc: (i) tìm hiểu, nghiên cứu lý thuyết khai phá và phân tích quan điểm, các mức cụ thể trong khai phá quan điểm và những nghiên cứu đã có trước đây dựa trên các hướng tiếp cận khác nhau cùng với những thuận lợi và hạn chế của các hướng tiếp cận này để có cơ sở định hướng nghiên cứu cho luận án; (ii) tìm hiểu các kỹ thuật học sâu phổ biến hiện nay, từ đó xác định những kỹ thuật nào có thể áp dụng cho trích rút, phân loại quan điểm; (iii) xác định kỹ thuật, hướng tiếp cận khai phá quan điểm và phương pháp đánh giá mô hình khai phá quan điểm được sử dụng trong luận án. Dựa trên cơ sở này, phần cuối chương trình bày các đề xuất cho mô hình trích rút, khai phá quan điểm sử dụng học sâu. Các đề xuất này sẽ được thực hiện và trình bày chi tiết trong các chương tiếp theo của luận án. 1.1. Khai phá quan điểm Quan điểm thể hiện thái độ, xúc cảm của chủ thể bày tỏ quan điểm đối với một sản phẩm, dịch vụ, một nhân tố cụ thể có tầm ảnh hưởng lớn đối với cộng đồng hay một chính sách mới tác động đến quyền lợi, nghĩa vụ của toàn xã hội. Quan điểm đóng vai trò nền tảng trong tiến trình ra quyết định của mỗi cá nhân, tổ chức và được chia thành hai loại [11][101]: (1) quan điểm chính quy và (2) quan điểm so sánh. (1) Quan điểm chính quy được chia thành hai loại: quan điểm trực tiếp_được thể hiện trực tiếp trên thực thể hoặc khía cạnh của thực thể và quan điểm không trực tiếp_ không thể hiện trực tiếp trên thực thể hoặc trên khía cạnh của thực thể mà dựa trên những kết quả của nó trên một số thực thể khác. (2) Quan điểm so sánh biểu diễn mối liên quan về độ tương tự hoặc khác nhau của các thực thể hoặc thể hiện quan điểm của chủ thể nắm giữ quan điểm là thích khía cạnh này hơn hay khía cạnh kia hơn. Ngoài ra, khai phá quan điểm cũng có thể phân loại thành: (i) quan điểm hiện hay (ii) quan điểm ẩn, dựa trên cách quan điểm được thể hiện trong văn bản [12]. 9
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2