LỜI CAM ĐOAN<br />
Tôi xin cam đoan, những kiến thức trình bày trong luận văn là do tôi tìm<br />
hiểu, nghiên cứu và trình bày dưới sự hướng dẫn của PGS.TS Hoàng Xuân<br />
Huấn. Trong quá trình làm luận văn, tôi đã tham khảo các tài liệu có liên quan<br />
và đều trích dẫn nguồn đầy đủ, rõ ràng. Những kết quả mới trong luận văn là<br />
của riêng tôi, không sao chép từ bất kỳ một công trình nào khác. Nếu có điều gì<br />
không trung thực, tôi xin hoàn toàn chịu trách nhiệm.<br />
Học viên<br />
<br />
Vũ Minh Mạnh<br />
<br />
LỜI CẢM ƠN<br />
Trước hết, tôi xin gửi lời cảm ơn sâu sắc đến PGS.TS Hoàng Xuân Huấn,<br />
người thầy đã giành nhiều thời gian để hướng dẫn, góp ý giúp tôi hoàn thành<br />
luận văn này. Thầy luôn truyền cho tôi cảm hứng, nhiệt huyết nghiên cứu khoa<br />
học, động viên và cho tôi nhiều lời khuyên quý báu.<br />
Tôi cũng xin bày tỏ lòng biết ơn chân thành tới các thầy, cô giáo đã giảng dạy<br />
tôi trong suốt 2 năm học tại Trường Đại học Công nghệ - Đại học Quốc gia Hà<br />
Nội. Mỗi thầy cô đều cho tôi những bài giảng thật hay và bổ ích.<br />
Tôi cũng xin gửi lời cảm ơn tới Ban giám đốc Học viện An ninh nhân dân,<br />
Lãnh đạo Khoa Công nghệ và An ninh thông tin cùng các anh chị đồng nghiệp<br />
đã tạo mọi điều kiện thuận lợi giúp tôi tham gia và hoàn thành khóa học.<br />
Cuối cùng, tôi xin gửi lời biết ơn đến bố mẹ, anh chị trong gia đình, bạn bè,<br />
người thân đã luôn ủng hộ, động viên tôi vượt qua những khó khăn trong cuộc<br />
sống, để tôi có thể theo đuổi ước mơ và hoài bão của mình.<br />
Học viên<br />
<br />
Vũ Minh Mạnh<br />
<br />
Mục lục<br />
<br />
MỞ ĐẦU<br />
<br />
1<br />
<br />
1 GIỚI THIỆU VỀ MẠNG XÃ HỘI<br />
<br />
5<br />
<br />
1.1<br />
<br />
1.2<br />
<br />
1.3<br />
<br />
Giới thiệu chung về mạng xã hội . . . . . . . . . . . . . . . . . . .<br />
<br />
5<br />
<br />
1.1.1<br />
<br />
Lịch sử phát triển của mạng xã hội . . . . . . . . . . . . . .<br />
<br />
5<br />
<br />
1.1.2<br />
<br />
Những tính năng của mạng xã hội . . . . . . . . . . . . . .<br />
<br />
5<br />
<br />
Các đặc trưng cơ bản của mạng xã hội . . . . . . . . . . . . . . . .<br />
<br />
5<br />
<br />
1.2.1<br />
<br />
Đặc trưng thế giới nhỏ . . . . . . . . . . . . . . . . . . . . .<br />
<br />
5<br />
<br />
1.2.2<br />
<br />
Đặc trưng tập nhân . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
6<br />
<br />
1.2.3<br />
<br />
Phân bố luật lũy thừa . . . . . . . . . . . . . . . . . . . . .<br />
<br />
6<br />
<br />
1.2.4<br />
<br />
Đặc trưng cấu trúc cộng đồng . . . . . . . . . . . . . . . . .<br />
<br />
6<br />
<br />
1.2.5<br />
<br />
Các đặc trưng khác của mạng xã hội . . . . . . . . . . . . .<br />
<br />
6<br />
<br />
Một số chủ đề được nghiên cứu trên mạng xã hội . . . . . . . . . .<br />
<br />
7<br />
<br />
1.3.1<br />
<br />
Phát hiện cấu trúc cộng đồng trên mạng xã hội . . . . . .<br />
<br />
7<br />
<br />
1.3.2<br />
<br />
Dự đoán liên kết trên mạng xã hội . . . . . . . . . . . . . .<br />
<br />
7<br />
<br />
1.3.3<br />
<br />
Tính riêng tư trên mạng xã hội . . . . . . . . . . . . . . . .<br />
<br />
7<br />
<br />
1.3.4<br />
<br />
Tiến hóa động trên mạng xã hội . . . . . . . . . . . . . . .<br />
<br />
7<br />
<br />
1.3.5<br />
<br />
Khai phá dữ liệu trên mạng xã hội . . . . . . . . . . . . . .<br />
<br />
7<br />
<br />
1.3.6<br />
<br />
Tối đa hóa ảnh hưởng trên mạng xã hội . . . . . . . . . . .<br />
<br />
7<br />
<br />
1.3.7<br />
<br />
Phát hiện, giám sát và ngăn ngừa thông tin sai lệch trên<br />
mạng xã hội . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
7<br />
<br />
2 THÔNG TIN SAI LỆCH VÀ CÁC MÔ HÌNH LAN TRUYỀN<br />
THÔNG TIN SAI LỆCH<br />
<br />
8<br />
<br />
2.1<br />
<br />
Định nghĩa thông tin sai lệch . . . . . . . . . . . . . . . . . . . . .<br />
<br />
8<br />
<br />
2.2<br />
<br />
Mô hình lan truyền thông tin sai lệch . . . . . . . . . . . . . . . .<br />
<br />
8<br />
<br />
2.2.1<br />
<br />
Mô hình tầng độc lập . . . . . . . . . . . . . . . . . . . . .<br />
<br />
9<br />
<br />
2.2.2<br />
<br />
Mô hình ngưỡng tuyến tính . . . . . . . . . . . . . . . . . .<br />
<br />
9<br />
<br />
2.3<br />
<br />
Một số hướng nghiên cứu liên quan đến bài toán hạn chế lan<br />
truyền thông tin sai lệch trên mạng xã hội trực tuyến . . . . . . .<br />
<br />
10<br />
<br />
3 GIẢI PHÁP GIẢM THIỂU TỐI ĐA THIỆT HẠI DO THÔNG<br />
TIN SAI LỆCH GÂY RA TRÊN MẠNG XÃ HỘI TRỰC TUYẾN 12<br />
3.1<br />
<br />
Phát biểu bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
12<br />
<br />
3.2<br />
<br />
Độ khó của bài toán . . . . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
14<br />
<br />
3.3<br />
<br />
Các thuật toán đề xuất giải quyết bài toán MDM . . . . . . . . .<br />
<br />
14<br />
<br />
3.3.1<br />
<br />
Thuật toán tham lam dựa trên hàm f (I) . . . . . . . . . .<br />
<br />
15<br />
<br />
3.3.2<br />
<br />
Thuật toán tham lam dựa trên hàm α(v) . . . . . . . . . .<br />
<br />
16<br />
<br />
4 THỰC NGHIỆM<br />
<br />
18<br />
<br />
4.1<br />
<br />
Mục đích thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
18<br />
<br />
4.2<br />
<br />
Dữ liệu tiến hành thực nghiệm . . . . . . . . . . . . . . . . . . . .<br />
<br />
18<br />
<br />
4.3<br />
<br />
Cài đặt thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
19<br />
<br />
4.4<br />
<br />
Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
19<br />
<br />
4.5<br />
<br />
Kết luận và nhận xét . . . . . . . . . . . . . . . . . . . . . . . . . .<br />
<br />
23<br />
<br />
KẾT LUẬN<br />
<br />
24<br />
<br />
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ<br />
<br />
25<br />
<br />
PHỤ LỤC<br />
<br />
33<br />
<br />
1<br />
<br />
MỞ ĐẦU<br />
Ngày nay, các mạng xã hội trực tuyến đã trở thành một phần không thể thiếu<br />
trong cuộc sống của con người, cho phép mỗi chúng ta có thể tạo, chia sẻ và trao<br />
đổi thông tin, ý tưởng một cách nhanh chóng và dễ dàng hơn bao giờ hết. Đối<br />
với nhiều người dùng, các trang mạng xã hội trực tuyến như Facebook, Twitter,<br />
Google+ được coi là những kênh tin tức chính. Trong nhiều trường hợp, các trang<br />
mạng xã hội này còn đưa những tin tức quan trọng trước cả một số phương tiện<br />
truyền thông đại chúng khác như phát thanh, truyền hình vv.. Ví dụ, tin tức về<br />
trùm khủng bố Bin Laden bị tiêu diệt lan truyền trên Twitter trước khi Tổng<br />
thống Mỹ chính thức thông báo trên các phương tiện truyền thông công cộng [52]<br />
hoặc câu chuyện về cái chết của ca sĩ Whitney Houston lan rộng trên Twitter,<br />
trước 27 phút so với hãng tin AP (Associated Press) [53]. Có thể nói rằng, các<br />
trang mạng xã hội ngày nay là một trong những nguồn cung cấp thông tin phong<br />
phú, đa chiều và là "nơi khám phá tin tức" của nhiều độc giả, đặc biệt là những<br />
độc giả trẻ và phụ nữ, chiếm số đông nhất trong nhóm chọn mạng xã hội để cập<br />
nhật tin tức.<br />
Bên cạnh những thông tin tin cậy, chính xác thì những thông tin sai lệch cũng<br />
lan truyền rộng rãi trên mạng xã hội một cách dễ dàng. Một nhóm nghiên cứu<br />
đến từ Đại học Columbia (New York, Mỹ) [23] đã chỉ ra rằng tốc độ lan truyền<br />
của thông tin sai lệch ngang bằng so với những tin tức chính thống. Chính những<br />
điều này đã gây ra những thiệt hại to lớn cho các cá nhân, tổ chức không những<br />
về kinh tế, chính trị mà còn tác động đến tâm lý, cuộc sống con người. Gần<br />
đây, diễn đàn Kinh tế thế giới (World Economic Forum, 2014) đã coi sự gia tăng<br />
nhanh chóng của thông tin sai lệch trên các phương tiện xã hội trực tuyến là<br />
một trong mười xu hướng hàng đầu mà thế giới phải đối mặt.<br />
Trước những thách thức nêu trên, làm thể nào để có thể hạn chế sự lan truyền<br />
của thông tin sai lệch trên mạng xã hội một cách kịp thời và hiệu quả? là một<br />
câu hỏi đang nhận được sự quan tâm nghiên cứu của nhiều nhà khoa học trong<br />
thời gian gần đây.<br />
Một số nghiên cứu tập trung vào việc nhận dạng thông tin sai lệch và tin đồn<br />
(Rumor) như nghiên cứu của Qazvinian, 2011, [6] và Kwwon, 2013, [7].<br />
Một số khác, nghiên cứu vấn đề xác định tập đỉnh là nguồn phát thông tin sai<br />
<br />