
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM NGUYÊN BÌNH
ỨNG DỤNG MÔ HÌNH MAXIMUM ENTROPY
TRONG PHÂN LỚP QUAN ĐIỂM CHO DỮLIỆU VĂN BẢN
Ngành: Công nghệthông tin
Chuyên ngành: Kỹthuật phần mềm
Mã số: 60480103
TÓM TẮT LUẬN VĂN THẠC SĨ KỸTHUẬT PHẦN MỀM
Hà Nội – 2016

Mục lục
Danh sách hình vẽ..................................................................3
Danh sách bảng biểu..............................................................4
MỞ ĐẦU.................................................................................1
1. Tính cấp thiết của đề tài luận văn.....................................1
2. Mục tiêu của luận văn ......................................................2
3. Cấu trúc của luận văn.......................................................2
Chương 1 Bài toán phân lớp quan điểm và các hướng tiếp cận.3
1.1 Bài toán phân tích quan điểm.........................................3
1.2 Các hướng tiếp cận và giải quyết bài toán .....................3
1.3 Mô hình phân lớp Naïve Bayes......................................5
1.4 Mô hình phân lớp SVM..................................................5
1.5 Mô hình phân lớp Maximum Entropy............................7
Chương 2 Tổng quan hệthống VNU-SMM.........................8
2.1 Kiến trúc tổng thểcủa hệthống ...............................8
2.1.1 Khối chức năng tự động thu thập dữliệu................9
2.1.2 Khối chức năng lõi với chức năng theo dõi và giám
sát thông tin trực tuyến.....................................................9
2.1.3 Khối hiển thị, giao diện tương tác với người dùng
cuối...................................................................................9
2.2 Thu thập và gán nhãn dữliệu.................................10
2.3 Phân lớp quan điểm................................................10
Chương 3 Bộphân lớp Maximum Entropy.......................11
3.1. Tổng quan vềentropy cực đại.....................................11
3.2. Entropy là gì?..............................................................11

3.3.1. Các ràng buộc và đặc trưng..................................11
3.3.2. Nguyên lý Entropy cực đại...................................12
3.3.3. Dạng tham số........................................................12
3.3.4. Tính toán các tham số...........................................13
Chương 4 Kết quảthửnghiệm và đánh giá....................... 17
4.1. Tiến hành thửnghiệm .................................................17
4.2. Tiền xửlý dữliệu........................................................17
4.3. Xây dựng mô hình.......................................................17
4.3.1. Lựa chọn đặc trưng...............................................17
4.3.2. Cài đặt thuật toán học...........................................18
4.4. Kết quảthửnghiệm.....................................................18
4.4.1. Các chỉsố đo kiểm chất lượng bộphân lớp .........18
4.4.2. Kết quảthực nghiệm bài toán phân lớp mức độ câu
........................................................................................18
4.5. So sánh với bộphân lớp Naïve Bayes.........................19
4.6. Đánh giá kết quả..........................................................20
Chương 5 Tổng kết và hướng phát triển tiếp theo............21

Danh sách bảng biểu
Bảng 4.2: Kết quảthực nghiệm bài toán phân lớp mức độ câu
sửdụng ME............................................................................18
Bảng 4.3: Kết quảthực nghiệm bài toán với bộphân lớp Naïve
Bayes......................................................................................19