
5
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. 3
LỜI CẢM ƠN ....................................................................................................... 4
MỤC LỤC ............................................................................................................. 5
DANH SÁCH CÁC HÌNH ................................................................................... 7
DANH SÁCH CÁC BẢNG ................................................................................ 10
DANH SÁCH CHỮ VIẾT TẮT ......................................................................... 11
LỜI MỞ ĐẦU ..................................................................................................... 12
CHƯƠNG 1: CƠ SỞ KHOA HỌC .................................................................... 14
1.1. Nội dung phản động trên Facebook ......................................................... 14
1.2. Tác hại của nội dung phản động trên Facebook ...................................... 17
1.3. Kiểm duyệt nội dung phản động trên Facebook ...................................... 19
1.4. Mục tiêu nghiên cứu của luận văn ........................................................... 20
1.5. Cấu trúc của luận văn ............................................................................... 21
CHƯƠNG 2: ĐỀ XUẤT PHƯƠNG PHÁP ....................................................... 23
2.1. Danh sách đen .......................................................................................... 23
2.1.1. User Facebook phản động ................................................................... 23
2.1.2. Fanpage Facebook phản động............................................................. 24
2.1.3. Group Facebook phản động ................................................................ 24
2.1.4. Website, blog phản động .................................................................... 24
2.2. Phương pháp học máy .............................................................................. 25
2.2.1. Trích chọn đặc trưng nội dung phản động .......................................... 25
2.2.2. Mô hình, thuật toán phân loại phổ biến .............................................. 39
2.3. Sử dụng Hệ số tương quan Matthews ...................................................... 44
CHƯƠNG 3: CÀI ĐẶT THỬ NGHIỆM ........................................................... 46
3.1. Mô hình kiểm duyệt nội dung phản động ................................................ 46
3.2. Xây dựng các blacklist phản động ........................................................... 47
3.3. Xây dựng tập dữ liệu mẫu ........................................................................ 51
3.3.1. Thu thập dữ liệu .................................................................................. 51
3.3.2. Gán nhãn dữ liệu ................................................................................. 54
3.4. Xây dựng bộ từ điển phản động ............................................................... 55
3.5. Xây dựng vector đặc trưng ....................................................................... 56