ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
BÙI VĂN MINH
KIỂM DUYỆT BÀI VIẾT VÀ BÌNH LUẬN TIẾNG VIỆT
CÓ NỘI DUNG KHÔNG PHÙ HỢP TRÊN
MẠNG XÃ HỘI FACEBOOK
LUẬN VĂN THẠC SĨ AN TOÀN THÔNG TIN
Hà Nội, tháng 12/2021
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
BÙI VĂN MINH
KIỂM DUYỆT BÀI VIẾT VÀ BÌNH LUẬN TIẾNG VIỆT
CÓ NỘI DUNG KHÔNG PHÙ HỢP TRÊN
MẠNG XÃ HỘI FACEBOOK
Ngành: Công nghệ thông tin
Chuyên ngành: An toàn thông tin
Mã số: 8480202.01
LUẬN VĂN THẠC SĨ AN TOÀN THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Lê Đình Thanh
Hà Nội, tháng 12/2021
3
LỜI CAM ĐOAN
Tôi cam đoan rằng, luận văn Kim duyt bài viết bình lun tiếng Vit
ni dung không phù hp trên mng hi Facebookcông trình nghiên
cu ca riêng tôi. Nhng s liệu được s dng trong luận văn là trung thực được
ch ngun trích dn. Kết qu nghiên cứu này chưa được công b trong bt k
công trình nghiên cu nào t trước đến nay.
Tôi hoàn toàn chu trách nhim vi lời cam đoan ca mình.
Hà Ni, ngày tháng 12 năm 2021
Người cam đoan
Bùi Văn Minh
4
LỜI CẢM ƠN
Để hoàn thành luận văn này, ngoài s c gng ca bản thân, tôi đã nhn
đưc s giúp đỡ ca nhiu tp thể, cá nhân trong và ngoài trường.
Tôi xin bày t ng biết ơn đến TS. Đình Thanh đã luôn tận tình hướng
dẫn, động viên tôi thc hin lun văn này.
Tôi xin bày t lòng biết ơn tới các quý thy Ngành An toàn thông tin,
Khoa Công ngh Thông tin nói riêng trong Trường Đại hc Công ngh -
ĐHQGHN nói chung đã tạo điều kin tt nht cho tôi trong quá trình hc tp,
nghiên cu và hoàn thin luận văn này.
Cui cùng, tôi xin cm ơn gia đình, đồng nghip, bạn bè, người thân đã
động viên, khích l tôi trong quá trình hc tp và nghiên cu.
Mc bản thân đã rt nhiu c gắng nhưng luận văn không tránh khi
nhng khiếm khuyết, hn chế. vy, tôi rất mong được s góp ý chân thành
ca quý thầy cô, đồng nghip và bạn đọc để luận văn được hoàn thiện hơn.
Xin trân trọng cảm ơn!
Hà Nội, tháng 12 năm 2021
Tác giả luận văn
Bùi Văn Minh
5
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. 3
LI CẢM ƠN ....................................................................................................... 4
MC LC ............................................................................................................. 5
DANH SÁCH CÁC HÌNH ................................................................................... 7
DANH SÁCH CÁC BNG ................................................................................ 10
DANH SÁCH CH VIT TT ......................................................................... 11
LI M ĐẦU ..................................................................................................... 12
CHƯƠNG 1: CƠ SỞ KHOA HC .................................................................... 14
1.1. Ni dung phản động trên Facebook ......................................................... 14
1.2. Tác hi ca ni dung phản động trên Facebook ...................................... 17
1.3. Kim duyt ni dung phản động trên Facebook ...................................... 19
1.4. Mc tiêu nghiên cu ca lun văn ........................................................... 20
1.5. Cu trúc ca luận văn ............................................................................... 21
CHƯƠNG 2: ĐỀ XUẤT PHƯƠNG PHÁP ....................................................... 23
2.1. Danh sách đen .......................................................................................... 23
2.1.1. User Facebook phản động ................................................................... 23
2.1.2. Fanpage Facebook phản động............................................................. 24
2.1.3. Group Facebook phản động ................................................................ 24
2.1.4. Website, blog phản động .................................................................... 24
2.2. Phương pháp học máy .............................................................................. 25
2.2.1. Trích chọn đặc trưng nội dung phản động .......................................... 25
2.2.2. Mô hình, thut toán phân loi ph biến .............................................. 39
2.3. S dng H s tương quan Matthews ...................................................... 44
CHƯƠNG 3: CÀI ĐẶT TH NGHIM ........................................................... 46
3.1. Mô hình kim duyt ni dung phản động ................................................ 46
3.2. Xây dng các blacklist phản động ........................................................... 47
3.3. Xây dng tp d liu mu ........................................................................ 51
3.3.1. Thu thp d liu .................................................................................. 51
3.3.2. Gán nhãn d liu ................................................................................. 54
3.4. Xây dng b t đin phản động ............................................................... 55
3.5. Xây dựng vector đặc trưng ....................................................................... 56