HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

---------------------------------------

NGUYỄN THỊ THANH HƯỜNG

NGHIÊN CỨU GIẢI PHÁP PHỤC VỤ CÔNG TÁC ĐÁNH GIÁ TIN TỨC TRÊN MỘT SỐ TRANG MẠNG XÃ HỘI TRONG PHẠM VI TỈNH NINH BÌNH

: HỆ THỐNG THÔNG TIN

Chuyên ngành

: 8.48.01.04

Mã số

TÓM TẮT LUẬN VĂN THẠC SĨ

HÀ NỘI - 2020

Luận văn được hoàn thành tại:

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: PGS.TSKH HOÀNG ĐĂNG HẢI

Phản biện 1: PGS.TS. NGUYỄN HÀ NAM

Phản biện 2: PGS.TS. PHẠM VĂN CƯỜNG

Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện

Công nghệ Bưu chính Viễn thông

Vào lúc:

....... giờ ....... ngày ....... tháng ....... .. năm 2020

Có thể tìm hiểu luận văn tại:

- Thư viện của Học viện Công nghệ Bưu chính Viễn thông

1

MỞ ĐẦU

1. Lý do chọn đề tài

Trang mạng xã hội Facebook là một trang Web đặc biệt tập hợp nội dung thông tin

có tính chất cá nhân hoặc nhóm, đưa thông tin dưới mọi chủ đề liên quan đến ý kiến, quan

điểm, bình luận cá nhân…

Trang mạng xã hội Facebook đã trở nên rất phổ biến. Tuy nhiên, do sự phát triển lan

rộng của các hình thức chia sẻ thông tin đến số lượng lớn người dùng mạng, việc kiểm soát

nội dung các trang mạng xã hội Facebook đã trở thành một vấn đề lớn đối với các cơ quan

quản lý. Nhiều bản tin trên các trang mạng xã hội Facebook mang màu sắc chính trị, có nội

văn hóa không lành mạnh, tiêu cực, nội dung đồi trụy, mê tín… có ảnh hưởng không nhỏ

đến xã hội. Do đó cần có biện pháp giám sát, kiểm tra của các cơ quan quản lý. Song song

với các chính sách pháp luật quản lý, cần có các biện pháp và hệ thống kỹ thuật hỗ trợ

nhanh chóng phát hiện những nội dung thông tin xấu độc.

1. Tổng quan về vấn đề nghiên cứu

Trên thế giới, hiện nay Việt Nam đứng thứ hơn 80 về ứng dụng công nghệ thông tin,

tức là ở mức trung bình. Nhưng về an toàn thông tin, chúng ta đứng thứ 100, có nghĩa là ở

mức trung bình yếu. Đây là thực trạng cần đặc biệt quan tâm với những giải pháp cụ thể,

chặt chẽ và quyết liệt. Nếu bảo đảm tốt an ninh mạng, chúng ta sẽ có cơ sở vững chắc để

ngăn chặn và xử lý kịp thời, hiệu quả cao các thông tin xấu, độc .

Hiện nay, việc theo dõi, kiểm soát nội dung các trang mạng xã hội Facebook nói

riêng và các trang tin điện tử nói chung tại Sở thông tin và truyền thông tỉnh Ninh Bình và

các Sở thông tin và truyền thông khác đều chủ yếu thực hiện bằng hình thức thủ công.

Trên cơ sở đó và xuất phát từ nhu cầu nghiệp vụ thực tế, đề tài nghiên cứu của luận

văn đặt ra là: “Nghiên cứu giải pháp phục vụ công tác đánh giá tin tức trên một số trang

mạng xã hội trong phạm vi tỉnh Ninh Bình”.

3. Mục đích nghiên cứu:

Mục đích nghiên cứu là tìm hiểu phương pháp thu thập một phần nội dung thông tin

từ trang mạng xã hội Facebook và xây dựngmột giải pháp phục vụ công tác đánh giá tin tức

quản lý, nội dung thông tin trang mạng xã hội để có thể đưa vào áp dụng thực tiễn cho công

tác nghiệp vụ tại Sở thông tin và truyền thông Ninh Bình, nơi em đang công tác. Mô hình có

2

thể phát triển và ứng dụng cho các Sở thông tin và truyền thônghoặc các cơ quan quản lý

khác.

4. Đối tượng và phạm vi nghiên cứu:

Đối tượng nghiên cứu

- Là trang mạng xã hội Facebook, phương pháp thu thập thông tin từ trang mạng xã hội, hệ

thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội.

Phạm vi nghiên cứu

- Chọn thử nghiệm cho một trang mạng xã hội Facebook cụ thể trong khuôn khổ thời gian

có hạn của luận văn thạc sỹ.

- Thu thập các tài liệu liên quan, phân tích các thông tin liên quan đến đề tài.

5. Phương pháp nghiên cứu

- Phương pháp thu thập dữ liệu và tổng hợp lại dữ liệu để phục vụ công tác đánh giá một

phần nội dung tin tức trên một số trang mạng xã hội Facebook trong phạm vi tỉnh Ninh

Bình.

- Phương pháp khảo sát tài liệu: Tìm kiếm và hệ thống hóa một số mô hình, phương pháp

thu thập thông tin, đánh giá nội dung trang mạng xã hội Facebook sẵn có.

- Nghiên cứu lý thuyết: Nghiên cứu về các mô hình, phương pháp, kỹ thuật liên quan đến

thu thập thông tin, kiểm tra, đánh giá một phần nội dung thông tin trên trang mạng xã hội.

- Phương pháp lập cơ sở dữ liệu và xây dựng mô hình hệ thống hỗ trợ công tác

quản lý đánh giá tin tức các trang mạng xã hội trong phạm vi tỉnh Ninh Bình.

Cấu trúc của luận văn

Ngoài phần mở đầu và kết luận, luận văn được chia thành ba chương:

Chương 1: Tổng quan về vấn đề nghiên cứu

Chương 2: Hệ thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội

Và trang thông tin điện tử tại trung tâm công nghệ thông tin và truyền thông

Ninh Bình

Chương 3: Một số thử nghiệm

3

CHƯƠNG I: TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU Các nguy cơ, trong lĩnh vực quản lý trang thông tin điện tử đặc biệt là

trang mạng xã hội Facebook trong phạm vi tỉnh Ninh Bình

 Mạng xã hội đang trở thành công cụ để các thế lực thù địch lợi dụng  Mạng xã hội làm gia tăng nguy cơ lộ lọt bí mật nhà nước  Mạng xã hội đang trở thành công cụ để tội phạm lợi dụng hoạt động 1.1 Công tác nghiệp vụ quản lý nội dung các trang thông tin điện tử và trang

mạng xã hội

1.1.1 Quản lý các trang thông tin điện tử tại tỉnh Ninh Bình

Ảnh minh họa. Nguồn: dangcongsan.vn

1.1.2 Một số công tácnghiệp vụ quản lý nội dung các trang thông tin điện tử

và trang mạng xã hội

Hình 1.1 Sơ đồ công tác nghiệp vụ hiện tại

1.3 Một số mô hình, phương pháp thu thập thông tin, kiểm soát nội dung trang mạng xã hội

Một số khái niệm

1.3.1 Khái niệm và đặc điểm thông tin 1.3.2 Khái niệm, đặc điểm và mục đích thu thập thông tin 1.3.3 Khái niệm, đặc điểm xử lý thôngtin 1.3.4 Phương pháp thu thập thông tin  Phương pháp nghiên cứu tài liệu

 Phương pháp thực nghiệm

4

1.3.5 Các phương pháp xử lý thông tin

1.3.6 Vai trò của việc thu thập và xử lý thông tin

Hình 1.3 Sơ đồ quản lý trang mạng xã hội Facebook và trang thông tin điện tử

Để làm tốt được, nhân viên phải hiểu công việc và nắm vững chu trình, mục đích thu

thập thông tin và phải làm công việc của mình một cách nghiêm túc.

Hình 1.4 Sơ đồ tổng quát công tác thu thập thông tin

5

Hình 1.5 Sơ đồ chức năng thống kê trang mạng xã hội Facebook và trang

thông tin điện tử

1.4 Kỹ thuật thu thập thông tin, đánh giá một phần nội dung trang mạng

xã hội.

1.4.1 Kỹ thuật thu thập thông tin

Hình 1.6 Sơ đồ kỹ thuật thu thập thông tin

6

1.4. 2 Các bước thu thập thông tin

Hình 1.7 Sơ đồ các bước thu thập thông tin

1.5 Nghiên cứu về các mô hình, phương pháp, kỹ thuật liên quan đến thu

thập thông tin, đánh giá một phần nội dung trang mạng xã hội

1.6 Phương pháp, xây dựng mô hình hệ thống hỗ trợ quản lý các trang mạng

xã hội

Xây dựng mô hình

Lập một công cụ ứng dụng vào công việc rà soát cho kỹ thuật viên hàng ngày để đỡ tốn

nguồn nhân lực, thời gian và kịp thời cho việc phát hiện báo cáo, để sớm có biện pháp báo

cáo xử lý những vụ vi phạm hàng ngày trên các trang mạng xã hội và trang thông tin điện

tử. Thông qua đó, người dùng có thể dễ dàng hình dung nắm bắt được tổng quát những nội

dung công việc.

1. 6.1 Nhận diện thông tin xấu độc: 10 biểu hiện

1.6.2 Các bước xử lý thông tin xấu độc

7

Hình 1.8 Sơ đồ các bước xử lý thông tin xấu độc

1.6.3 Một số vi phạm thường gặp và kết quả xử lý trong thời gian gần đây

1.6.4 Những khó khăn vướng mắc trong việc thu thập thông tin và xử lý vi

phạm

1.7 Nhu cầu nghiệp vụ quản lý, nội dung thông tin trang mạng xã hội

Hiện nay, việc theo dõi, kiểm soát nội dung các trang mạng xã hội Facebook và 1959

trang Thông tin điện tử có chủ sở hữu là người Ninh Bình tại Sở thông tin và truyền

thông tỉnh Ninh Bình và các Sở thông tin và truyền thông khác đều chủ yếu thực hiện

bằng hình thức thủ công kết quả đạt được còn rất hạn chế. Trên cơ sở đó và xuất phát từ

nhu cầu nghiệp vụ thực tế, đề tài nghiên cứu của luận văn đặt ra là: “Nghiên cứu giải

pháp phục vụ công tác đánh giá tin tức trên một số trang mạng xã hội trong phạm vi tỉnh

Ninh Bình” là điều cần thiết.

8

CHƯƠNG II: HỆ THỐNG HỖ TRỢ QUẢN LÝ TRANG MẠNG

XÃ HỘI VÀ TRANG THÔNG TIN ĐIỆN TỬ TẠI TRUNG TÂM

CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NINH BÌNH

2.1 Khái quát về kiến trúc chung của các trang mạng xã hội

 Kiến trúc cơ bản của một mạng xã hội

Để có một cái nhìn tổng thể về mạng xã hội, ta hãy xem xét kiến trúc của mạng xã hội ở

ba khía cạnh, đó là: kiến trúc truyền thông, kiến trúc phần mềm ứng dụng và kiến trúc hạ

tầng công nghệ thông tin (CNTT) của nhà cung cấp dịch vụ.

Đối với kiến trúc truyền thông thì mạng xã hội được xem như là một mạng liên kết các

cá nhân và các cộng đồng với nhau. Kiến trúc mạng xã hội sẽ là một đồ thị với các đỉnh là

các thành viên và các cạnh thể hiện mối liên kết giữa các thành viên đó với nhau. Nghiên

cứu về cấu trúc này sẽ cho ta biết mối liên hệ giữa các thành viên với nhau tuân theo quy

luật nào, hiểu được xu thế giãn nở và kích thước của mạng. Từ đó có thể xây dựng được các

thuật toán cho việc tìm kiếm những người quen biết nhau trong một cộng đồng, tìm kiếm

các nguồn tài nguyên phát sinh trên mạng, xác định giá trị các mối liên hệ theo thời gian và

theo các mối liên hệ khác. Với kiến trúc mạng xã hội là các mô đun phần mềm liên kết với

nhau, ta sẽ xác định được đâu là các thành phần chính tạo nên mạng xã hội và chúng liên kết

với nhau như thế nào. Kiến trúc này sẽ giúp cho chúng ta thiết kế, xây dựng được một trang

mạng xã hội đáp ứng được mục tiêu đưa ra. Kiến trúc hạ tầng CNTT của nhà cung cấp dịch

vụ sẽ cho ta một cái nhìn tổng thể về việc triển khai hệ thống, đưa dịch vụ mạng xã hội vào

khai thác và sử dụng. Sau đây, ta sẽ xem xét từng kiến trúc để hiểu rõ thêm về các nội dung

đã đưa ra.

Kiến trúc truyền thông của mạng xã hội

- Kiến trúc ứng dụng

- Kiến trúc phân lớp ứng dụng

9

Hình 2.1 Kiến trúc phân lớp ứng dụng Kiến trúc mạng xã hội với các mô đun chức năng

Hình 2.2 Kiến trúc các mô đun chức năng của mạng xã hội  Kiến trúc hạ tầng công nghệ thông tin của nhà cung cấp dịch vụ

- Kiến trúc của các trang mạng xã hội nhỏ

10

Hình 2.3 Kiến trúc của những trang mạng xã hội nhỏ

- Kiến trúc của các trang mạng xã hội lớn

Hình 2.4 Kiến trúc của những trang mạng xã hội lớn

Mạng xã hội là gì

Mạng xã hội là dịch vụ nối kết các thành viên cùng sở thích trên Internet lại với nhau với

nhiều mục đích khác nhau không phân biệt không gian và thời gian. Những người tham gia

vào dịch vụ mạng xã hội còn được gọi là cư dân mạng. Có tên gọi khác như "cộng đồng ảo"

, "cộng đồng mạng" là nơi mọi người có thể làm quen, chia sẻ mọi điều trong cuộc sống với

nhau.

Lợi ích của mạng xã hội

11

- Làm quen, kết bạn, giao lưu khắp mọi miền đất nước.

- Chia sẻ khoảng khắc, địa điểm đến mọi người dùng và bạn bè.

- Trao đổi tài liệu, thông tin đến những người quen ở xa.

- Tính cộng đồng phổ biến cao và được nhiều người lựa chọn sử dụng.

Các mạng xã hội phổ biến hiện nay Facebook (https://www.facebook.com/) Twitter (https://twitter.com/) Instagram (https://www.instagram.com/) Tumblr (https://www.tumblr.com/) Zalo (https://chat.zalo.me/) Lotus (https://lotus.vn/)

Đặc điểm cơ bản của mạng xã hội

Lịch sử mạng xã hội

Thành phần cấu thành mạng xã hội

2.1.1 Khái quát về thông tin trên môi trường mạng tại Việt Nam

2.2 Phương pháp thu thập thông tin từ trang mạng xã hội

2.2.1 Phương pháp thực nghiệm

Thực nghiệm mô hình bao gồm mô hình toán, thiết bị, công nghệ mô phỏng…

 Xây dựng hệ thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội và

trang thông tin điện tử tại Trung tâm công nghệ thông tin và truyền thông

Ninh Bình.

Lập một công cụ ứng dụng vào công việc rà soát cho kỹ thuật viên hàng ngày để sớm

có biện pháp báo cáo xử lý những vụ vi phạm hàng ngày trên các trang mạng xã hội và

trang thông tin điện tử. Thông qua đó, người dùng có thể dễ dàng hình dung nắm bắt

được tổng quát những nội dung công việc.

12

2.3 Phương pháp thu thập thông tin từ trang mạng xã hội có liên quan tới

tỉnh Ninh Bình

Mô hình Tổng quan

Hình 2.5: Mô hình hệ thống

Diễn giải: Hàng ngày hệ thống được lập trình tự động rà quét tổng quan trên mạng xã

hội gồm group Facebook(….) Fanpage Facebook(…..) và API Google tìm có từ Ninh Bình

sau đó hệ thống sẽ phân tích tin bằng cách chuẩn hóa tin (tên tin, trích dẫn, nội dung,

ảnh,thời gian đăng tin, các nội dung bình luận, nguồn tin) sau đó hệ thống sẽ đưa vào cơ sở

dữ liệu. Bước tiếp theo cán bộ đánh giá tin đọc nội dung, và các bình luận tin này (nếu có),

sau đó cán bộ đánh giá tin sẽ đưa ra nhận xét tin này vào hệ thống ( tin tốt, bình thường, tiêu

cực, tin có yếu tố chính trị). Kết quả cuối cùng sẽ xuất ra các báo cáo tổng kết các tin mình

thu thập được để báo cáo tới nhà quản lý hoặc các cơ quan, cá nhân có nhu cầu cần tìm hiểu

thông tin.

13

2.3.1 Xác định các từ khóa cần thu thập

Để thu thập thông tin về Ninh Bình chúng ta cần xác định các từ khóa liên quan tới

tỉnh Ninh Bình.

Các từ khóa liên quan địa danh: Ninh Bình, Nho quan,Tam Điệp,Yên Mô,Yên

Khánh, Kim Sơn, Hoa Lư, Gia Viễn. 148 xã phường thị trấn trong tỉnh Ninh Bình: Thanh

Bình, Nam Bình, Văn Phú….

Các từ khóa liên quan đến tên người: Nguyễn Văn A, Trần Thị B, Phạm Văn C, Lý

Quang D. Đây là những người thuộc nhóm người có chức vụ quan trọng thường xuyên xuất

hiện trên tin tức báo đài, mạng xã hội có ảnh hưởng lớn tới truyền thông, chính trị kinh tế xã

hội.

2.3.2. Phương pháp thu thập thông tin bằng phương pháp chuẩn hóa

cấu trúc Mạng Xã hội trên Web.

Kích thước quá lớn và bản chất thay đổi không ngừng của Web đã đặt ra nhu cầu to

lớn trong việc hỗ trợ và cập nhật một cách không ngừng các hệ thống trích chọn các thông

tin dựa trên nền Web.

Bước 1: Lấy toàn bộ nội dung mạng Xã hội trên nên web về.

Bước 2: Duyệt và phân tích nội dung (parsing).

Bước 3: Quá trình lấy ra và chuẩn hóa các URL.

Bước 4: Loại bỏ các từ dừng và chuyển các dạng thức của từ sang dạng gốc.

Bước 5: Xây dựng cây các thẻ HTML.

Bước 6: Sử dụng các hàm API của Facebooks để đọc dữ liệu.

Bước 7: Sử dụng Google để đọc dữ liệu.

Bước 8: Xử lý tin lỗi và dữ liệu lấy về quá lớn.

Bước 9: Lưu dữ liệu sau khi đã chuẩn hóa.

Sau khi tin tức được lấy về hệ thống sẽ được lập trình qua các bộ lọc Facebook API,

Google API, HTML tin tức sẽ được chuẩn hóa thành dạng (tên tin, trích dẫn, ảnh, nội dung,

bình luận nếu có). Tiếp theo ta sẽ so sánh các tin này xem có sự trùng lặp hay không việc so

sánh sẽ dựa trên tiêu chí tên tin, nguồn tin, thời gian đăng. Bước cuối cùng ta sẽ lưu vào cơ

sở dữ liệu trung tâm phục vụ cho việc đánh giá và tổng hợp báo cáo .

14

CHƯƠNG III: MỘT SỐ THỬ NGHIỆM

3.1 Sử dụng công cụ

3.1.1 Công cụ

Công cụ lập trình: PHP

Database: MySQL.

Công cụ hỗ trợ: Html,Java,FreamWork, Microsof Excell ….

3.1.2 Cài đặt sản phẩm

Máy chủ cài đặt Hệ điều hành Linux (Cấu hình tối thiểu CPU 4.3 Ghz, Ram 8 Gb, ổ cứng

500G.

Máy chủ được cài webserver Apache (có thể dùng LAMP để thay thế).

Cơ sở dữ liệu ta cài đặt MySQL.

3.2 Sản phẩm phần mềm

3.2.1 Các chức năng chính của phần mềm

Các chức năng chính của phần mềm:

- Chức năng lấy thông tin trên mạng xã hội (Facebook Group).

- Chức năng lấy thông tin trên mạng xã hội (Facebook Fanpage).

- Chức năng lấy thông tin trên mạng có các nội dung liên quan tới Ninh Bình

- Chức năng xem tin lấy về (tên tin, trích dẫn, thời gian tin, nội dung, người đăng tin, bình

luận tin tức).

- Chức năng đánh giá thông tin lấy về.

- Chức năng xuất báo cáo tổng hợp (Việc thống kê sẽ xuất ra được 3 bản report tổng hợp

theo thời gian đó là thống kê thông tin về Ninh Bình trên các báo, thống kê tin tức trên

Group FaceBook và Fanpage FaceBook)

- Chức năng đổi mật khẩu.

15

3.2.2. Cấu trúc bảng dữ liệu

Bảng người dùng

STT Thuộc tính Chiều dài Ý nghĩa Kiểu

int Mã người dùng 1 id

varchar Tên đăng nhập 2 name

varchar Nội dung đánh giá 3 pass

int Quyền 4 role

50 nvarchar Họ và tên 5 hoten

100 nvarchar Chức vụ 6 chucvu

12 sodienthoai nvarchar Số điện thoại 7

Bảng tin Group

Ý nghĩa STT Thuộc tính Kiểu Chiều dài

Int (auto) Mã group 1 id

Nvarchar Tên tin 2 tentin

Nvarchar Tóm tat tin 3 tomtat

Nvarchar Nguồn tin 4 nguon

noidung Ntext Nội dung tin 5

Nvarchar 50 Domain chính 6 domain

Nvarchar 100 Link trực tiếp 7 url

Nvarchar 30 Thời gian đăng 8 time1

danhgia Int Đánh giá 9

16

Bảng tin Fanpage

STT Thuộc tính Kiểu Chiều dài Ý nghĩa

1 Id Mã fanpage Int (auto)

2 tentin Tên tin nvarchar

3 tomtat Tóm tắt tin nvarchar

4 nguon Nguồn tin nvarchar

5 noidung ntext Nội dung tin

6 domain Domain chính nvarchar 50

7 url Link trực tiếp nvarchar 100

8 time1 Thời gian đăng nvarchar 30

9 danhgia int Đánh giá

Bảng tin khác

Ý nghĩa STT Thuộc tính Kiểu Chiều dài

1 Id Mã tin Int (auto)

2 tentin Tên tin nvarchar

3 tomtat Tóm tắt tin nvarchar

4 nguon Nguồn tin nvarchar

5 noidung ntext Nội dung tin

6 domain nvarchar 50 Domain chính

7 url nvarchar 100 Link trực tiếp

8 time1 nvarchar 30 Thời gian đăng

9 danhgia int Đánh giá

3.2.3. Một số giao diện chính của phần mềm

Màn hình đăng nhập

17

Màn hình chính

Màn hình chính hiển thị menu chức năng và bảng điều khiển các chức năng:

Xem và đánh giá tin Facebook Group

Xem và đánh giá tin Facebook Fanpage

Xem và đánh giá tin Facebook Fanpage

Quản trị người dùng

Báo cáo thống kê dữ liệu

Chức năng đổi mật khẩu

Màn hình đổi mật khẩu

18

Màn hình xem dữ liệu lấy từ nguồn Facebook Group

Màn hình xem dữ liệu lấy từ nguồn Facebook Fanpage

19

Màn hình xem dữ liệu lấy từ các nguồn có liên quan đến Ninh Bình

Màn hình đánh giá tin

20

Màn hình quản lý tiêu chí đánh giá tin

21

Màn hình thống kê, báo cáo

Màn hình xuất dữ liệu Excell

3.3. Phân tích, đánh giá kết quả thử nghiệm.

Với chỉ trong 4 tháng, năm 2020 Trung tâm Công nghệ thông tin và truyền thông đã

thực hiện nhiệm vụ rà soát các thông tin trên mạng xã hội bằng công cụ thu thập thông tin

trên mạng xã hội đã thu thập được hơn 32.000 tin tức liên quan đến tỉnh Ninh Bình trong đó

14.000 tin FaceBook, 18.000 tin tức ở các trang mạng xã hội và tin tức tổng hợp.

22

KẾT LUẬN

Kết quả đạt được và ứng dụng của luận văn

Luận văn đã trình bày khái quát về các nghiên cứu lý thuyết, phương pháp, mô hình,

kiến trúc hệ thống hỗ trợ về giải pháp thu thập thông tin từ trang mạng xã hội, xây dựng hệ

thống hỗ trợ quản lý nội dung thông tin trang mạng xã hội.

Bằng công cụ thu thập thông tin trên mạng xã hội, khả năng áp dụng cho công tác nghiệp

vụ của Sở thông tin và truyền thông Ninh Bình tại Trung tâm Công nghệ thông tin và truyền

thông đã thực hiện nhiệm vụ rà soát các thông tin trên mạng xã hội, đã thu thập được tin tức

liên quan đến tỉnh Ninh Bình. Kết quả đã thu thập được hơn 32.000 tin tức liên quan đến

tỉnh Ninh Bình trong đó 14.000 tin FaceBook, 18.000 tin tức ở các trang mạng xã hội và tin

tức tổng hợp.

Hệ thống đã thực hiện thao tác lấy tin tự động; Chuẩn hóa thành dạng: tin, trích dẫn ,

ảnh, nội dung, bình luận (nếu có). Tiếp theo ta so sánh tin này có sự trùng lặp hay không,

việc so sánh là dựa vào tiêu chí tin để đánh giá: time đăng tin, nguồn tin, tên tin, bước cuối

cùng sẽ là lưu thông tin dữ liệu phục vụ cho công tác đánh giá. Đóng góp của tác giả trong

hệ thống lọc tin của chương 3 là: Hệ thống tự động thu thập tất cả những tin mạng xã hội

Facebook liên quan đến tỉnh Ninh Bình có kết quả đạt 99%.

Hướng phát triển nghiên cứu

Tác giả xin đề cập một số hướng nghiên cứu trong tương lai:

Mạng xã hội Facebook nói riêng và rất nhiều trang thông tin điện tử khác nói chung,

việc lấy dữ liệu, thông tin của người dùng cũng còn gặp rất nhiều khó khăn. Bên cạnh đó, sự

quan tâm của người dùng còn gắn với những vấn đề mang tính thời sự, thay đổi không

ngừng. Luận văn phát triển theo hướng khai thác dữ liệu, người dùng trong sự thay đổi về

mặt thời gian. Luận văn có thể phát triển theo hướng dựa vào tất cả các thông tin người

dùng chia sẻ, bình luận trên Mạng xã hội, các vấn đề họ quan tâm.

Ứng dụng của bài toán thu thập thông tin trên mạng xã hội là rất lớn. Không chỉ với

mạng xã hội Facebook, kết quả bài toán sẽ là công cụ đắc lực để các nhà chính trị, cơ quan

tổ chức, doanh nghiệp có những điều chỉnh, định hướng quan tâm sau đó là quan điểm của

từng người dùng. Do đó luận văn có thể phát triển theo hướng ứng dụng của bài toán đề ra.

Nghiên cứu sâu hơn các chức năng của hệ thống. Để đánh giá tự động nội dung tin

tích cực hay tiêu cực, cần bổ sung thêm các nội dung đánh giá theo tiêu chí của Bộ Thông

23

tin và truyền thông (code thêm nội dung của 10 biểu hiện nhận diện xấu độc, những từ khóa

đặc biệt như tên những người thuộc nhóm người có chức vụ quan trọng thường xuyên xuất

hiện trên tin tức báo đài, mạng xã hội có ảnh hưởng lớn tới truyền thông, chính trị kinh tế xã

hội tại địa bàn tỉnh, các từ khóa virus, covid -19...) và bổ sung thêm nội dung cảnh báo các

trang tin, hiển thị tách riêng màn hình đánh giá tin trên hệ thống.

Xây dựng một giải pháp phục vụ công tác đánh giá tin tức quản lý, nội dung thông tin

trang mạng xã hội hoàn thiện hơn để đưa vào áp dụng thực tiễn hiệu quả cho công tác

nghiệp vụ tại Sở thông tin và truyền thông Ninh Bình. Mô hình có thể phát triển rộng và ứng

dụng cho các Sở thông tin và truyền thông hoặc các cơ quan quản lý khác.