HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
NGUYỄN THỊ THANH HƯỜNG
NGHIÊN CỨU GIẢI PHÁP PHỤC VỤ CÔNG TÁC ĐÁNH GIÁ TIN TỨC TRÊN MỘT SỐ TRANG MẠNG XÃ HỘI TRONG PHẠM VI TỈNH NINH BÌNH
: HỆ THỐNG THÔNG TIN
Chuyên ngành
: 8.48.01.04
Mã số
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2020
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: PGS.TSKH HOÀNG ĐĂNG HẢI
Phản biện 1: PGS.TS. NGUYỄN HÀ NAM
Phản biện 2: PGS.TS. PHẠM VĂN CƯỜNG
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện
Công nghệ Bưu chính Viễn thông
Vào lúc:
....... giờ ....... ngày ....... tháng ....... .. năm 2020
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
1
MỞ ĐẦU
1. Lý do chọn đề tài
Trang mạng xã hội Facebook là một trang Web đặc biệt tập hợp nội dung thông tin
có tính chất cá nhân hoặc nhóm, đưa thông tin dưới mọi chủ đề liên quan đến ý kiến, quan
điểm, bình luận cá nhân…
Trang mạng xã hội Facebook đã trở nên rất phổ biến. Tuy nhiên, do sự phát triển lan
rộng của các hình thức chia sẻ thông tin đến số lượng lớn người dùng mạng, việc kiểm soát
nội dung các trang mạng xã hội Facebook đã trở thành một vấn đề lớn đối với các cơ quan
quản lý. Nhiều bản tin trên các trang mạng xã hội Facebook mang màu sắc chính trị, có nội
văn hóa không lành mạnh, tiêu cực, nội dung đồi trụy, mê tín… có ảnh hưởng không nhỏ
đến xã hội. Do đó cần có biện pháp giám sát, kiểm tra của các cơ quan quản lý. Song song
với các chính sách pháp luật quản lý, cần có các biện pháp và hệ thống kỹ thuật hỗ trợ
nhanh chóng phát hiện những nội dung thông tin xấu độc.
1. Tổng quan về vấn đề nghiên cứu
Trên thế giới, hiện nay Việt Nam đứng thứ hơn 80 về ứng dụng công nghệ thông tin,
tức là ở mức trung bình. Nhưng về an toàn thông tin, chúng ta đứng thứ 100, có nghĩa là ở
mức trung bình yếu. Đây là thực trạng cần đặc biệt quan tâm với những giải pháp cụ thể,
chặt chẽ và quyết liệt. Nếu bảo đảm tốt an ninh mạng, chúng ta sẽ có cơ sở vững chắc để
ngăn chặn và xử lý kịp thời, hiệu quả cao các thông tin xấu, độc .
Hiện nay, việc theo dõi, kiểm soát nội dung các trang mạng xã hội Facebook nói
riêng và các trang tin điện tử nói chung tại Sở thông tin và truyền thông tỉnh Ninh Bình và
các Sở thông tin và truyền thông khác đều chủ yếu thực hiện bằng hình thức thủ công.
Trên cơ sở đó và xuất phát từ nhu cầu nghiệp vụ thực tế, đề tài nghiên cứu của luận
văn đặt ra là: “Nghiên cứu giải pháp phục vụ công tác đánh giá tin tức trên một số trang
mạng xã hội trong phạm vi tỉnh Ninh Bình”.
3. Mục đích nghiên cứu:
Mục đích nghiên cứu là tìm hiểu phương pháp thu thập một phần nội dung thông tin
từ trang mạng xã hội Facebook và xây dựngmột giải pháp phục vụ công tác đánh giá tin tức
quản lý, nội dung thông tin trang mạng xã hội để có thể đưa vào áp dụng thực tiễn cho công
tác nghiệp vụ tại Sở thông tin và truyền thông Ninh Bình, nơi em đang công tác. Mô hình có
2
thể phát triển và ứng dụng cho các Sở thông tin và truyền thônghoặc các cơ quan quản lý
khác.
4. Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu
- Là trang mạng xã hội Facebook, phương pháp thu thập thông tin từ trang mạng xã hội, hệ
thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội.
Phạm vi nghiên cứu
- Chọn thử nghiệm cho một trang mạng xã hội Facebook cụ thể trong khuôn khổ thời gian
có hạn của luận văn thạc sỹ.
- Thu thập các tài liệu liên quan, phân tích các thông tin liên quan đến đề tài.
5. Phương pháp nghiên cứu
- Phương pháp thu thập dữ liệu và tổng hợp lại dữ liệu để phục vụ công tác đánh giá một
phần nội dung tin tức trên một số trang mạng xã hội Facebook trong phạm vi tỉnh Ninh
Bình.
- Phương pháp khảo sát tài liệu: Tìm kiếm và hệ thống hóa một số mô hình, phương pháp
thu thập thông tin, đánh giá nội dung trang mạng xã hội Facebook sẵn có.
- Nghiên cứu lý thuyết: Nghiên cứu về các mô hình, phương pháp, kỹ thuật liên quan đến
thu thập thông tin, kiểm tra, đánh giá một phần nội dung thông tin trên trang mạng xã hội.
- Phương pháp lập cơ sở dữ liệu và xây dựng mô hình hệ thống hỗ trợ công tác
quản lý đánh giá tin tức các trang mạng xã hội trong phạm vi tỉnh Ninh Bình.
Cấu trúc của luận văn
Ngoài phần mở đầu và kết luận, luận văn được chia thành ba chương:
Chương 1: Tổng quan về vấn đề nghiên cứu
Chương 2: Hệ thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội
Và trang thông tin điện tử tại trung tâm công nghệ thông tin và truyền thông
Ninh Bình
Chương 3: Một số thử nghiệm
3
CHƯƠNG I: TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU Các nguy cơ, trong lĩnh vực quản lý trang thông tin điện tử đặc biệt là
trang mạng xã hội Facebook trong phạm vi tỉnh Ninh Bình
Mạng xã hội đang trở thành công cụ để các thế lực thù địch lợi dụng Mạng xã hội làm gia tăng nguy cơ lộ lọt bí mật nhà nước Mạng xã hội đang trở thành công cụ để tội phạm lợi dụng hoạt động 1.1 Công tác nghiệp vụ quản lý nội dung các trang thông tin điện tử và trang
mạng xã hội
1.1.1 Quản lý các trang thông tin điện tử tại tỉnh Ninh Bình
Ảnh minh họa. Nguồn: dangcongsan.vn
1.1.2 Một số công tácnghiệp vụ quản lý nội dung các trang thông tin điện tử
và trang mạng xã hội
Hình 1.1 Sơ đồ công tác nghiệp vụ hiện tại
1.3 Một số mô hình, phương pháp thu thập thông tin, kiểm soát nội dung trang mạng xã hội
Một số khái niệm
1.3.1 Khái niệm và đặc điểm thông tin 1.3.2 Khái niệm, đặc điểm và mục đích thu thập thông tin 1.3.3 Khái niệm, đặc điểm xử lý thôngtin 1.3.4 Phương pháp thu thập thông tin Phương pháp nghiên cứu tài liệu
Phương pháp thực nghiệm
4
1.3.5 Các phương pháp xử lý thông tin
1.3.6 Vai trò của việc thu thập và xử lý thông tin
Hình 1.3 Sơ đồ quản lý trang mạng xã hội Facebook và trang thông tin điện tử
Để làm tốt được, nhân viên phải hiểu công việc và nắm vững chu trình, mục đích thu
thập thông tin và phải làm công việc của mình một cách nghiêm túc.
Hình 1.4 Sơ đồ tổng quát công tác thu thập thông tin
5
Hình 1.5 Sơ đồ chức năng thống kê trang mạng xã hội Facebook và trang
thông tin điện tử
1.4 Kỹ thuật thu thập thông tin, đánh giá một phần nội dung trang mạng
xã hội.
1.4.1 Kỹ thuật thu thập thông tin
Hình 1.6 Sơ đồ kỹ thuật thu thập thông tin
6
1.4. 2 Các bước thu thập thông tin
Hình 1.7 Sơ đồ các bước thu thập thông tin
1.5 Nghiên cứu về các mô hình, phương pháp, kỹ thuật liên quan đến thu
thập thông tin, đánh giá một phần nội dung trang mạng xã hội
1.6 Phương pháp, xây dựng mô hình hệ thống hỗ trợ quản lý các trang mạng
xã hội
Xây dựng mô hình
Lập một công cụ ứng dụng vào công việc rà soát cho kỹ thuật viên hàng ngày để đỡ tốn
nguồn nhân lực, thời gian và kịp thời cho việc phát hiện báo cáo, để sớm có biện pháp báo
cáo xử lý những vụ vi phạm hàng ngày trên các trang mạng xã hội và trang thông tin điện
tử. Thông qua đó, người dùng có thể dễ dàng hình dung nắm bắt được tổng quát những nội
dung công việc.
1. 6.1 Nhận diện thông tin xấu độc: 10 biểu hiện
1.6.2 Các bước xử lý thông tin xấu độc
7
Hình 1.8 Sơ đồ các bước xử lý thông tin xấu độc
1.6.3 Một số vi phạm thường gặp và kết quả xử lý trong thời gian gần đây
1.6.4 Những khó khăn vướng mắc trong việc thu thập thông tin và xử lý vi
phạm
1.7 Nhu cầu nghiệp vụ quản lý, nội dung thông tin trang mạng xã hội
Hiện nay, việc theo dõi, kiểm soát nội dung các trang mạng xã hội Facebook và 1959
trang Thông tin điện tử có chủ sở hữu là người Ninh Bình tại Sở thông tin và truyền
thông tỉnh Ninh Bình và các Sở thông tin và truyền thông khác đều chủ yếu thực hiện
bằng hình thức thủ công kết quả đạt được còn rất hạn chế. Trên cơ sở đó và xuất phát từ
nhu cầu nghiệp vụ thực tế, đề tài nghiên cứu của luận văn đặt ra là: “Nghiên cứu giải
pháp phục vụ công tác đánh giá tin tức trên một số trang mạng xã hội trong phạm vi tỉnh
Ninh Bình” là điều cần thiết.
8
CHƯƠNG II: HỆ THỐNG HỖ TRỢ QUẢN LÝ TRANG MẠNG
XÃ HỘI VÀ TRANG THÔNG TIN ĐIỆN TỬ TẠI TRUNG TÂM
CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NINH BÌNH
2.1 Khái quát về kiến trúc chung của các trang mạng xã hội
Kiến trúc cơ bản của một mạng xã hội
Để có một cái nhìn tổng thể về mạng xã hội, ta hãy xem xét kiến trúc của mạng xã hội ở
ba khía cạnh, đó là: kiến trúc truyền thông, kiến trúc phần mềm ứng dụng và kiến trúc hạ
tầng công nghệ thông tin (CNTT) của nhà cung cấp dịch vụ.
Đối với kiến trúc truyền thông thì mạng xã hội được xem như là một mạng liên kết các
cá nhân và các cộng đồng với nhau. Kiến trúc mạng xã hội sẽ là một đồ thị với các đỉnh là
các thành viên và các cạnh thể hiện mối liên kết giữa các thành viên đó với nhau. Nghiên
cứu về cấu trúc này sẽ cho ta biết mối liên hệ giữa các thành viên với nhau tuân theo quy
luật nào, hiểu được xu thế giãn nở và kích thước của mạng. Từ đó có thể xây dựng được các
thuật toán cho việc tìm kiếm những người quen biết nhau trong một cộng đồng, tìm kiếm
các nguồn tài nguyên phát sinh trên mạng, xác định giá trị các mối liên hệ theo thời gian và
theo các mối liên hệ khác. Với kiến trúc mạng xã hội là các mô đun phần mềm liên kết với
nhau, ta sẽ xác định được đâu là các thành phần chính tạo nên mạng xã hội và chúng liên kết
với nhau như thế nào. Kiến trúc này sẽ giúp cho chúng ta thiết kế, xây dựng được một trang
mạng xã hội đáp ứng được mục tiêu đưa ra. Kiến trúc hạ tầng CNTT của nhà cung cấp dịch
vụ sẽ cho ta một cái nhìn tổng thể về việc triển khai hệ thống, đưa dịch vụ mạng xã hội vào
khai thác và sử dụng. Sau đây, ta sẽ xem xét từng kiến trúc để hiểu rõ thêm về các nội dung
đã đưa ra.
Kiến trúc truyền thông của mạng xã hội
- Kiến trúc ứng dụng
- Kiến trúc phân lớp ứng dụng
9
Hình 2.1 Kiến trúc phân lớp ứng dụng Kiến trúc mạng xã hội với các mô đun chức năng
Hình 2.2 Kiến trúc các mô đun chức năng của mạng xã hội Kiến trúc hạ tầng công nghệ thông tin của nhà cung cấp dịch vụ
- Kiến trúc của các trang mạng xã hội nhỏ
10
Hình 2.3 Kiến trúc của những trang mạng xã hội nhỏ
- Kiến trúc của các trang mạng xã hội lớn
Hình 2.4 Kiến trúc của những trang mạng xã hội lớn
Mạng xã hội là gì
Mạng xã hội là dịch vụ nối kết các thành viên cùng sở thích trên Internet lại với nhau với
nhiều mục đích khác nhau không phân biệt không gian và thời gian. Những người tham gia
vào dịch vụ mạng xã hội còn được gọi là cư dân mạng. Có tên gọi khác như "cộng đồng ảo"
, "cộng đồng mạng" là nơi mọi người có thể làm quen, chia sẻ mọi điều trong cuộc sống với
nhau.
Lợi ích của mạng xã hội
11
- Làm quen, kết bạn, giao lưu khắp mọi miền đất nước.
- Chia sẻ khoảng khắc, địa điểm đến mọi người dùng và bạn bè.
- Trao đổi tài liệu, thông tin đến những người quen ở xa.
- Tính cộng đồng phổ biến cao và được nhiều người lựa chọn sử dụng.
Các mạng xã hội phổ biến hiện nay Facebook (https://www.facebook.com/) Twitter (https://twitter.com/) Instagram (https://www.instagram.com/) Tumblr (https://www.tumblr.com/) Zalo (https://chat.zalo.me/) Lotus (https://lotus.vn/)
Đặc điểm cơ bản của mạng xã hội
Lịch sử mạng xã hội
Thành phần cấu thành mạng xã hội
2.1.1 Khái quát về thông tin trên môi trường mạng tại Việt Nam
2.2 Phương pháp thu thập thông tin từ trang mạng xã hội
2.2.1 Phương pháp thực nghiệm
Thực nghiệm mô hình bao gồm mô hình toán, thiết bị, công nghệ mô phỏng…
Xây dựng hệ thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội và
trang thông tin điện tử tại Trung tâm công nghệ thông tin và truyền thông
Ninh Bình.
Lập một công cụ ứng dụng vào công việc rà soát cho kỹ thuật viên hàng ngày để sớm
có biện pháp báo cáo xử lý những vụ vi phạm hàng ngày trên các trang mạng xã hội và
trang thông tin điện tử. Thông qua đó, người dùng có thể dễ dàng hình dung nắm bắt
được tổng quát những nội dung công việc.
12
2.3 Phương pháp thu thập thông tin từ trang mạng xã hội có liên quan tới
tỉnh Ninh Bình
Mô hình Tổng quan
Hình 2.5: Mô hình hệ thống
Diễn giải: Hàng ngày hệ thống được lập trình tự động rà quét tổng quan trên mạng xã
hội gồm group Facebook(….) Fanpage Facebook(…..) và API Google tìm có từ Ninh Bình
sau đó hệ thống sẽ phân tích tin bằng cách chuẩn hóa tin (tên tin, trích dẫn, nội dung,
ảnh,thời gian đăng tin, các nội dung bình luận, nguồn tin) sau đó hệ thống sẽ đưa vào cơ sở
dữ liệu. Bước tiếp theo cán bộ đánh giá tin đọc nội dung, và các bình luận tin này (nếu có),
sau đó cán bộ đánh giá tin sẽ đưa ra nhận xét tin này vào hệ thống ( tin tốt, bình thường, tiêu
cực, tin có yếu tố chính trị). Kết quả cuối cùng sẽ xuất ra các báo cáo tổng kết các tin mình
thu thập được để báo cáo tới nhà quản lý hoặc các cơ quan, cá nhân có nhu cầu cần tìm hiểu
thông tin.
13
2.3.1 Xác định các từ khóa cần thu thập
Để thu thập thông tin về Ninh Bình chúng ta cần xác định các từ khóa liên quan tới
tỉnh Ninh Bình.
Các từ khóa liên quan địa danh: Ninh Bình, Nho quan,Tam Điệp,Yên Mô,Yên
Khánh, Kim Sơn, Hoa Lư, Gia Viễn. 148 xã phường thị trấn trong tỉnh Ninh Bình: Thanh
Bình, Nam Bình, Văn Phú….
Các từ khóa liên quan đến tên người: Nguyễn Văn A, Trần Thị B, Phạm Văn C, Lý
Quang D. Đây là những người thuộc nhóm người có chức vụ quan trọng thường xuyên xuất
hiện trên tin tức báo đài, mạng xã hội có ảnh hưởng lớn tới truyền thông, chính trị kinh tế xã
hội.
2.3.2. Phương pháp thu thập thông tin bằng phương pháp chuẩn hóa
cấu trúc Mạng Xã hội trên Web.
Kích thước quá lớn và bản chất thay đổi không ngừng của Web đã đặt ra nhu cầu to
lớn trong việc hỗ trợ và cập nhật một cách không ngừng các hệ thống trích chọn các thông
tin dựa trên nền Web.
Bước 1: Lấy toàn bộ nội dung mạng Xã hội trên nên web về.
Bước 2: Duyệt và phân tích nội dung (parsing).
Bước 3: Quá trình lấy ra và chuẩn hóa các URL.
Bước 4: Loại bỏ các từ dừng và chuyển các dạng thức của từ sang dạng gốc.
Bước 5: Xây dựng cây các thẻ HTML.
Bước 6: Sử dụng các hàm API của Facebooks để đọc dữ liệu.
Bước 7: Sử dụng Google để đọc dữ liệu.
Bước 8: Xử lý tin lỗi và dữ liệu lấy về quá lớn.
Bước 9: Lưu dữ liệu sau khi đã chuẩn hóa.
Sau khi tin tức được lấy về hệ thống sẽ được lập trình qua các bộ lọc Facebook API,
Google API, HTML tin tức sẽ được chuẩn hóa thành dạng (tên tin, trích dẫn, ảnh, nội dung,
bình luận nếu có). Tiếp theo ta sẽ so sánh các tin này xem có sự trùng lặp hay không việc so
sánh sẽ dựa trên tiêu chí tên tin, nguồn tin, thời gian đăng. Bước cuối cùng ta sẽ lưu vào cơ
sở dữ liệu trung tâm phục vụ cho việc đánh giá và tổng hợp báo cáo .
14
CHƯƠNG III: MỘT SỐ THỬ NGHIỆM
3.1 Sử dụng công cụ
3.1.1 Công cụ
Công cụ lập trình: PHP
Database: MySQL.
Công cụ hỗ trợ: Html,Java,FreamWork, Microsof Excell ….
3.1.2 Cài đặt sản phẩm
Máy chủ cài đặt Hệ điều hành Linux (Cấu hình tối thiểu CPU 4.3 Ghz, Ram 8 Gb, ổ cứng
500G.
Máy chủ được cài webserver Apache (có thể dùng LAMP để thay thế).
Cơ sở dữ liệu ta cài đặt MySQL.
3.2 Sản phẩm phần mềm
3.2.1 Các chức năng chính của phần mềm
Các chức năng chính của phần mềm:
- Chức năng lấy thông tin trên mạng xã hội (Facebook Group).
- Chức năng lấy thông tin trên mạng xã hội (Facebook Fanpage).
- Chức năng lấy thông tin trên mạng có các nội dung liên quan tới Ninh Bình
- Chức năng xem tin lấy về (tên tin, trích dẫn, thời gian tin, nội dung, người đăng tin, bình
luận tin tức).
- Chức năng đánh giá thông tin lấy về.
- Chức năng xuất báo cáo tổng hợp (Việc thống kê sẽ xuất ra được 3 bản report tổng hợp
theo thời gian đó là thống kê thông tin về Ninh Bình trên các báo, thống kê tin tức trên
Group FaceBook và Fanpage FaceBook)
- Chức năng đổi mật khẩu.
15
3.2.2. Cấu trúc bảng dữ liệu
Bảng người dùng
STT Thuộc tính Chiều dài Ý nghĩa Kiểu
int Mã người dùng 1 id
varchar Tên đăng nhập 2 name
varchar Nội dung đánh giá 3 pass
int Quyền 4 role
50 nvarchar Họ và tên 5 hoten
100 nvarchar Chức vụ 6 chucvu
12 sodienthoai nvarchar Số điện thoại 7
Bảng tin Group
Ý nghĩa STT Thuộc tính Kiểu Chiều dài
Int (auto) Mã group 1 id
Nvarchar Tên tin 2 tentin
Nvarchar Tóm tat tin 3 tomtat
Nvarchar Nguồn tin 4 nguon
noidung Ntext Nội dung tin 5
Nvarchar 50 Domain chính 6 domain
Nvarchar 100 Link trực tiếp 7 url
Nvarchar 30 Thời gian đăng 8 time1
danhgia Int Đánh giá 9
16
Bảng tin Fanpage
STT Thuộc tính Kiểu Chiều dài Ý nghĩa
1 Id Mã fanpage Int (auto)
2 tentin Tên tin nvarchar
3 tomtat Tóm tắt tin nvarchar
4 nguon Nguồn tin nvarchar
5 noidung ntext Nội dung tin
6 domain Domain chính nvarchar 50
7 url Link trực tiếp nvarchar 100
8 time1 Thời gian đăng nvarchar 30
9 danhgia int Đánh giá
Bảng tin khác
Ý nghĩa STT Thuộc tính Kiểu Chiều dài
1 Id Mã tin Int (auto)
2 tentin Tên tin nvarchar
3 tomtat Tóm tắt tin nvarchar
4 nguon Nguồn tin nvarchar
5 noidung ntext Nội dung tin
6 domain nvarchar 50 Domain chính
7 url nvarchar 100 Link trực tiếp
8 time1 nvarchar 30 Thời gian đăng
9 danhgia int Đánh giá
3.2.3. Một số giao diện chính của phần mềm
Màn hình đăng nhập
17
Màn hình chính
Màn hình chính hiển thị menu chức năng và bảng điều khiển các chức năng:
Xem và đánh giá tin Facebook Group
Xem và đánh giá tin Facebook Fanpage
Xem và đánh giá tin Facebook Fanpage
Quản trị người dùng
Báo cáo thống kê dữ liệu
Chức năng đổi mật khẩu
Màn hình đổi mật khẩu
18
Màn hình xem dữ liệu lấy từ nguồn Facebook Group
Màn hình xem dữ liệu lấy từ nguồn Facebook Fanpage
19
Màn hình xem dữ liệu lấy từ các nguồn có liên quan đến Ninh Bình
Màn hình đánh giá tin
20
Màn hình quản lý tiêu chí đánh giá tin
21
Màn hình thống kê, báo cáo
Màn hình xuất dữ liệu Excell
3.3. Phân tích, đánh giá kết quả thử nghiệm.
Với chỉ trong 4 tháng, năm 2020 Trung tâm Công nghệ thông tin và truyền thông đã
thực hiện nhiệm vụ rà soát các thông tin trên mạng xã hội bằng công cụ thu thập thông tin
trên mạng xã hội đã thu thập được hơn 32.000 tin tức liên quan đến tỉnh Ninh Bình trong đó
14.000 tin FaceBook, 18.000 tin tức ở các trang mạng xã hội và tin tức tổng hợp.
22
KẾT LUẬN
Kết quả đạt được và ứng dụng của luận văn
Luận văn đã trình bày khái quát về các nghiên cứu lý thuyết, phương pháp, mô hình,
kiến trúc hệ thống hỗ trợ về giải pháp thu thập thông tin từ trang mạng xã hội, xây dựng hệ
thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội.
Bằng công cụ thu thập thông tin trên mạng xã hội, khả năng áp dụng cho công tác nghiệp
vụ của Sở thông tin và truyền thông Ninh Bình tại Trung tâm Công nghệ thông tin và truyền
thông đã thực hiện nhiệm vụ rà soát các thông tin trên mạng xã hội, đã thu thập được tin tức
liên quan đến tỉnh Ninh Bình. Kết quả đã thu thập được hơn 32.000 tin tức liên quan đến
tỉnh Ninh Bình trong đó 14.000 tin FaceBook, 18.000 tin tức ở các trang mạng xã hội và tin
tức tổng hợp.
Hệ thống đã thực hiện thao tác lấy tin tự động; Chuẩn hóa thành dạng: tin, trích dẫn ,
ảnh, nội dung, bình luận (nếu có). Tiếp theo ta so sánh tin này có sự trùng lặp hay không,
việc so sánh là dựa vào tiêu chí tin để đánh giá: time đăng tin, nguồn tin, tên tin, bước cuối
cùng sẽ là lưu thông tin dữ liệu phục vụ cho công tác đánh giá. Đóng góp của tác giả trong
hệ thống lọc tin của chương 3 là: Hệ thống tự động thu thập tất cả những tin mạng xã hội
Facebook liên quan đến tỉnh Ninh Bình có kết quả đạt 99%.
Hướng phát triển nghiên cứu
Tác giả xin đề cập một số hướng nghiên cứu trong tương lai:
Mạng xã hội Facebook nói riêng và rất nhiều trang thông tin điện tử khác nói chung,
việc lấy dữ liệu, thông tin của người dùng cũng còn gặp rất nhiều khó khăn. Bên cạnh đó, sự
quan tâm của người dùng còn gắn với những vấn đề mang tính thời sự, thay đổi không
ngừng. Luận văn phát triển theo hướng khai thác dữ liệu, người dùng trong sự thay đổi về
mặt thời gian. Luận văn có thể phát triển theo hướng dựa vào tất cả các thông tin người
dùng chia sẻ, bình luận trên Mạng xã hội, các vấn đề họ quan tâm.
Ứng dụng của bài toán thu thập thông tin trên mạng xã hội là rất lớn. Không chỉ với
mạng xã hội Facebook, kết quả bài toán sẽ là công cụ đắc lực để các nhà chính trị, cơ quan
tổ chức, doanh nghiệp có những điều chỉnh, định hướng quan tâm sau đó là quan điểm của
từng người dùng. Do đó luận văn có thể phát triển theo hướng ứng dụng của bài toán đề ra.
Nghiên cứu sâu hơn các chức năng của hệ thống. Để đánh giá tự động nội dung tin
tích cực hay tiêu cực, cần bổ sung thêm các nội dung đánh giá theo tiêu chí của Bộ Thông
23
tin và truyền thông (code thêm nội dung của 10 biểu hiện nhận diện xấu độc, những từ khóa
đặc biệt như tên những người thuộc nhóm người có chức vụ quan trọng thường xuyên xuất
hiện trên tin tức báo đài, mạng xã hội có ảnh hưởng lớn tới truyền thông, chính trị kinh tế xã
hội tại địa bàn tỉnh, các từ khóa virus, covid -19...) và bổ sung thêm nội dung cảnh báo các
trang tin, hiển thị tách riêng màn hình đánh giá tin trên hệ thống.
Xây dựng một giải pháp phục vụ công tác đánh giá tin tức quản lý, nội dung thông tin
trang mạng xã hội hoàn thiện hơn để đưa vào áp dụng thực tiễn hiệu quả cho công tác
nghiệp vụ tại Sở thông tin và truyền thông Ninh Bình. Mô hình có thể phát triển rộng và ứng
dụng cho các Sở thông tin và truyền thông hoặc các cơ quan quản lý khác.