B GIÁO DỤC
VÀ ĐÀO TẠO
VIỆN HÀN M KHOA HỌC
CÔNG NGHỆ VIT NAM
HC VIN KHOA HC CÔNG NGH
VŨ CHÍ QUANG
NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP GIẢI BÀI TOÁN
CỰC ĐẠI ẢNH HƯỞNG TRÊN MẠNG HỘI
VỚI RÀNG BUỘC ƯU TIÊN CHI PHÍ
TÓM TẮT LUN ÁN TIN H THNG THÔNG TIN
Mã s: 9 48 01 04
Hà Nim 2024
2
Công trình đưc hoàn thành ti: Hc vin Khoa hc Công ngh- Vin n m
Khoa hc và Công nghVit Nam.
Người hướng dẫn khoa học:
1. Ngưi hưng dn khoa hc: TS Nguyn Như Sơn - Vin ng ngh TT
2. Ngưi ng dn khoa hc: PGS. TS N Quốc ng - HV Công nghệ bưu
chính viễn thông
Phn bin 1:……………….……………………………………………………
Phn bin 2:………………………………………………………………………..
Phn bin 3:…………………………………………………………..
Lun án sđưc bo vtrưc Hi đng đánh giá lun án tiến cp Hc vin, hp ti
Hc vin Khoa hc Công ngh- Vin Hàn lâm Khoa hc và Công nghVit Nam
vào higi …’, ngày tháng năm 2024
Có thtìm hiu lun án ti:
- Thư vin Hc vin Khoa hc Công ngh
- Thư vin Quc gia Vit Nam
1
M ĐẦU
1. Tính cấp thiết của lun án
- V mt thc tin: Với số lượng người dùng ln mạng xã hội (Social
Network -SN) đã và đang mang lại nhiu li ích thiết thc với người ng.
Có th nói, SN đã và đang trở thành một công c hữu ích trong đời sống của
con người, đng thời một kho tri thức khổng l mọi ngưi có th d
dàng tiếp cận. SN đã mang lại nhng lợi ích to ln v chính tr, v kinh tế cho
toàn hội. Do đó cần nghn cứu để tối đa hóa thông tin lan truyền trên SN
ngày ng hiu qu n.
- Về mặt khoa học: Nghiên cứu bài toán Cực đại ảnh hưởng trên SN
một hướng nghiên cứu được nhiều nhà khoa học quan tâm, thuộc nhóm
các bài toán lan truyền thông tin (Spread Information -SI), Bên cạnh đó,
SN khối dữ liệu khổng lồ, phân tán quá trình lan truyền thông tin
ngẫu nhiên, cấu trúc mạng phức tạp, không đồng nhất liên tục biến
động do vậy cần phải đưa các giải pháp hiệu quả về mặt thời gian bộ
nhớ.
2. Mục tiêu nghiên cứu ca luận án
- Nghiên cứu c i toán cực đại ảnh hưởng trên các mô nh lan truyn
thông tin. Qua đó đề xut c biến th mới có nh ng dng trong thực tin.
- Đ xuất các hình gii quyết các i toán trên, nghiên cứu độ phức tạp
của chúng trên các hình lan truyền thông tin.
- Đề xuất các thuật toán hiệu quả để giải quyết c bài toán trên,
trong đó đặc biệt chú trọng tới việc nâng cao chất lượng lời giải cũng
như khả năng ứng dụng với các mạng c lớn hàng trăm nghìn cho tới
hàng triệu, ng tỷ cạnh hoặc đỉnh.
3. Các ni dung nghiên cứu chính của luận án
Chương 1: Cơ sở lý thuyết của luận án các nghiên cứu liên quan.
Trong chương y, lun án giới thiệu v SN, c thành phn bản, một s
đặc tng cũng những lợi ích và mặt trái ca SN; Giới thiu c mô hình và
2
mt số bài toán SI ph biến trên SN. Những kiến thức tổng quan, mang tính
nền tảng cho c nghiên cứu trong c chương sau của luận án.
Chương 2: Cc đại nh hưởng vi ng buộc ưu tiên trên mng xã hội.
Chương này, luận án đặt vn đề và định nghĩa bài toán IMP trên mô nh lan
truyền thông tin; đề xuất thuật toán tham lam tích hợp (IG) thuật toán ly
mu dựa trên tham lam tích hợp (IGS) cho bài toán IMP; chng minh hiệu
suất thut toán đạt xp xỉ so với phương án tối ưu; phân tích thuyết và đánh
giá thuật toán da trên thực nghiệm vi c bộ d liệu của SN .
Chương 3: Cực đại ảnh hưởng lan truyền thông tin nhiều ch đề với
chi phí giới hạn. Lun án đề xuất hình mi cho i toán lan truyền thông
tin nhiều ch đề, định nghĩa bài toán BkIM, đ xut hai thut toán luồng duyệt
d liệu một lần cung cp giới hn thuyết của i toán. Để xem xét hiu suất
của các thut toán đ xuất trong thực tế, luận án tiến hành th nghiệm trên
ng dụng Cực đại ảnh hưởng với kch đề trong điều kiện chi phí hạn chế.
CHƯƠNG 1
CƠ S LÝ THUYT CA LUẬN ÁN VÀ C NGHIÊN CU LIÊN QUAN
1.1 Giới thiệu v mạng xã hội
Khái niệm mng xã hội ln đầu đưc đề cập và sử dụng bởi Barnes t
năm 1954. T đó đến nay hàng trăm nghìn SN được y dựng với hàng tỷ
người dùng trên khắp thế gii. Mi mng đều cấu trúc và mục đích riêng,
nhưng chúng đều 04 thành phần cơ bản đó : Người ng, liên kết gia
các người ng, thông tin lan truyền trên mạng tương tác của người ng
với nhau. Ngoài ra SN còn 04 đc trưng chung đó : Đặc trưng thế giới
nhỏ, đc trưng tập nhân, đc trưng cấu trúc cộng đồng và đặc trưng phân b
lũy tha.
Với số lượng người ng lớn SN đã và đang mang li nhiều lợi ích thiết
thực đối với người ng. n cạnh đó, ng cho phép lan truyn nhanh
chóng thông tin sai lệch, y ra nhng thiệt hại đáng k đối với đời sống con
3
người. Để SN ngày càng hu ích n với cộng đồng, chúng ta cần tìm ra
những giải pháp hiệu qu để phát huy lợi ích và hạn chế mặt trái của SN.
1.2 Mô nh hóa lan truyn thông tin tn mạng xã hi
Mô nh hóa các bài toán lan truyền tng tin trên SN đóng vai t quan
trọng trong vic gii quyết các i toán SI. Giúp các nhà nghiên cứu có i
nhìn tổng quan ngắn gọn nht về SN. Để t đó đưa ra các giải pháp hiu
qu giải quyết c i toán trên mô nh và từng bước áp dụng vào thực tiễn.
Mô nh lan truyền rời rạc được sử dng rng i trong c nghn cứu. Điển
hình là hình Ngưỡng tuyến tính LT (Linear Threshold) và Bc độc lập IC
(Independent Cascade), đây đưc xem là những hình lan truyn rời rc
đưc s dụng trong luận án.
1.2.1 Mô nh Ngưỡng tuyến nh (LT)
Một mng hội đưc biểu diễn bi đồ th �(, ), mỗi cạnh có trọng s
, làmt sthc dương thỏa mãn điu kiện ∈���() �(�, ) 1 .
(�),(�) là tập nút vào và tập t ra của đỉnh . Mỗi t có trạng thái
kích hot hoặc không kích hoạt và ngưỡng kích hot [0,1]. Gi Slà
tp nguồn (tập hạt ging), tập nút b kích hot bởi ti thời điểm . Khi
= 0, c t trong tập 0đu trạng thái ch hoạt; Khi 1, mỗi t
s bị kích hoạt nếu: �(�)�−1 (�, ) θ. Quá trình lan truyn kết thúc
khi sau mi c không có nút o đưc ch hot thêm.
1.2.2 Mô nh Bậc đc lập (IC)
Khác vi hình LT, trên mô nh IC mi cạnh đưc n một xác suất
nh ởng �(�, ) [0, 1]. Gọi là tp c t bị kích hoạt bởi tại thời
điểm . Khi = 0, c t trong tập ngun 0đều có trạng ti kích hoạt.
Tại thời điểm 1, mỗi nút 0có một cơ hội duy nht ch hoạt đến nút
��(�) với c sut thành công là �(�, ). Quá trình lan truyn kết thúc
khi gia hai bước không nút o bị kích hot thêm.