
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT&TT
Nguyễn Văn Chung
ĐỀ XUẤT MỘT SỐ GIẢI PHÁP KHAI PHÁ
DỮ LIỆU PHÂN TÁN ĐẢM BẢO TÍNH RIÊNG TƯ
Chuyên ngành
Mã số
: Khoa học máy tính
: 9480101
TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - NĂM 2023

Công trình được hoàn thành tại: Trường Đại học Công nghệ thông tin
và Truyền thông - Đại học Thái Nguyên
Người hướng dẫn khoa học:
1. PGS.TS Trần Đức Sự
2. TS Nguyễn Văn Tảo
Phản biện 1: .........................................................................
..............................................................................................
Phản biện 2: .........................................................................
..............................................................................................
Phản biện 3: .........................................................................
..............................................................................................
Luận án được bảo vệ trước Hội đồng chấm luận án cấp Đại học Thái
Nguyên, họp tại ..................................................................................
.............................................................................................................
Vào hồi giờ ngày tháng năm
Có thể tìm hiểu luận án tại thư viện: ...................................

1
MỞ ĐẦU
1. Tính cấp thiết
Mỗi ngày, hàng triệu giao dịch điện tử có thể được thực hiện,
hay hàng tỷ bình luận/cảm xúc được bày tỏ trên các trang mạng xã hội.
Bằng việc khai phá, phân tích những nguồn dữ liệu này, các tri thức
hoặc thông tin có giá trị đã được tìm ra và đem lại nhiều lợi ích đáng
kể cho những tổ chức, cá nhân [1].
Trên thực tế, bất kỳ một tập dữ liệu nào cũng chứa những thông
tin mang tính chất riêng tư, nhạy cảm như: bệnh lý của bệnh nhân, thu
nhập của khách hàng, quan điểm chính trị của người dùng. Vấn đề này
là cản trở lớn đối với hoạt động khai phá dữ liệu.
Trước thách thức đó, nghiên cứu và phát triển các giải pháp khai
phá tri thức và thông tin hữu ích tiềm ẩn trong các tập dữ liệu trong
khi những thông tin riêng tư, nhạy cảm tồn tại bên trong dữ liệu vẫn
được giữ an toàn và bí mật bởi các bên sở hữu trở thành một nhiệm vụ
rất cần thiết và quan trọng, thu hút được nhiều sự quan tâm từ cộng
đồng nghiên cứu [2].
2. Mục tiêu nghiên cứu
Luận án tập trung nghiên cứu ba vấn đề chính sau đây:
- Vấn đề thứ nhất là nghiên cứu, đánh giá các giải pháp khai phá
dữ liệu đảm bảo tính riêng tư hiện có, đặc biệt là những giải pháp dựa
trên lĩnh vực tính toán bảo mật nhiều thành viên.
- Vấn đề thứ hai là phát triển một số kỹ thuật tính toán bảo mật
nhiều thành viên và chứng minh các đề xuất mới hiệu quả hơn và có
khả năng ứng dụng cao hơn các phương pháp đã có.
- Vấn đề thứ ba là dựa trên các kỹ thuật tính toán bảo mật nhiều
thành viên mới phát triển, đề xuất một số giao thức khai phá dữ liệu đảm
bảo tính riêng tư cho cả hai mô hình dữ liệu phân mảnh theo chiều ngang
và chiều dọc; đánh giá hiệu quả và tính riêng tư của các giải pháp mới.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu của luận án là các phương pháp khai
phá dữ liệu từ nhiều nguồn có đảm bảo tính riêng tư dựa trên phương
pháp tính toán bảo mật nhiều thành viên.

2
- Phạm vi nghiên cứu của luận án tập trung vào bài toán khai
dữ liệu từ nhiều nguồn có đảm bảo tính riêng tư.
4. Cách tiếp cận và phương pháp nghiên cứu
- Cách tiếp cận: luận án tổng hợp, phân tích, đánh giá các công
trình có liên quan tới vấn đề khai phá dữ liệu từ nhiều nguồn có đảm
bảo tính riêng tư, từ đó đề xuất giải pháp phù hợp để giải quyết các
vấn đề đã đặt ra.
- Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết
và nghiên cứu thực nghiệm.
5. Các nội dung nghiên cứu chính, đóng góp mới của luận án
- Thứ nhất, luận án góp phần làm rõ bức tranh khái quát về lĩnh
vực khai phá dữ liệu từ nhiều nguồn có đảm bảo tính riêng tư, đồng
thời phát hiện ra những khoảng trống nghiên cứu dựa trên việc đánh
giá một số công trình nghiên cứu liên quan.
- Thứ hai, luận án phát triển một số giao thức tính toán bảo mật
nhiều thành viên. Giao thức thứ nhất tính tổng bảo mật cải tiến, giao
thức thứ hai tính tổng bảo mật tổng quát, giao thức thứ ba cho phép
tính toán tích vô hướng bảo mật trong mô hình ba thành viên dựa trên
giao thức đánh giá đa thức bảo mật, và hai giao thức cuối cùng tính độ
hỗ trợ bảo mật cũng cho mô hình tính toán ba thành viên.
- Thứ ba, luận án đề xuất các giao thức an toàn và hiệu quả để
khai phá dữ liệu đảm bảo tính riêng tư cho ngữ cảnh phân tán ngang
và phân tán dọc. Đồng thời, các thí nghiệm trên dữ liệu thật cũng đã
chứng minh khả năng ứng dụng thực tế của những giải pháp đề xuất.
6. Ý nghĩa khoa học và thực tiễn
6.1. Ý nghĩa khoa học
- Đề xuất một số giao thức tính toán bảo mật nhiều thành viên
an toàn và hiệu quả.
- Đề xuất giải pháp phân lớp dữ liệu Naïve Bayes đảm bảo tính
riêng tư cho mô hình dữ liệu phân tán ngang và giải pháp khai phá luật
kết hợp đảm bảo tính riêng tư cho kịch bản dữ liệu phân tán dọc ba
thành viên.

3
6.2. Ý nghĩa thực tiễn
Kết quả nghiên cứu của luận án có thể được sử dụng làm cơ sở
phát triển các ứng dụng khai phá dữ liệu đảm bảo tính riêng tư cho các
kịch bản mô hình dữ liệu phân tán.
7. Bố cục luận án
- Chương 1 trình bày tổng quan về khai phá dữ liệu từ nhiều
nguồn có đảm bảo tính riêng tư.
- Chương 2 trình bày các khái niệm cơ bản về mật mã và tính
toán bảo mật nhiều thành viên; phân tích đánh giá một số giao thức
tính toán bảo mật nhiều thành viên điển hình để từ đó phát triển các
giao thức tính toán bảo mật nhiều thành viên, bao gồm: giao thức tính
tổng bảo mật cải tiến, giao thức tính tổng bảo mật tổng quát, giao thức
tính tích vô hướng bảo mật trong mô hình ba thành viên, hai giao thức
tính độ hỗ trợ bảo mật cũng cho mô hình tính toán ba thành viên.
- Chương 3 trình bày các giao thức mới để khai phá dữ liệu đảm
bảo tính riêng tư cho ngữ cảnh phân tán dọc và phân tán ngang.
CHƯƠNG 1. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU TỪ
NHIỀU NGUỒN CÓ ĐẢM BẢO TÍNH RIÊNG TƯ
1.1. Giới thiệu chương
Trong chương này, luận án trình bày tổng quan về khai phá dữ
liệu từ nhiều nguồn có đảm bảo tính riêng tư, trong đó giới thiệu một
số phương pháp phá dữ liệu từ nhiều nguồn có đảm bảo tính riêng tư
phổ biến: Phương pháp biến đổi ngẫu nhiên, phương pháp tính toán
bảo mật nhiều thành viên, phương pháp ẩn danh dữ liệu. Cuối chương
này, luận án đánh giá một số giải pháp khai phá luật kết hợp từ nhiều
nguồn có đảm bảo có đảm bảo tính riêng tư và xác định các vấn đề
luận án cần giải quyết.
1.2. Giới thiệu về khai phá dữ liệu có đảm bảo tính riêng tư
Các nghiên cứu về khai phá dữ liệu phân tán có đảm bảo quyền
riêng tư liên quan đến ba vấn đề chính sau đây [5]. Thứ nhất, các tổ
chức như các cơ quan chính phủ muốn công bố dữ liệu cho các nhà

