ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HC CNTT&TT
Nguyễn Văn Chung
ĐỀ XUT MT S GII PHÁP KHAI PHÁ
D LIỆU PHÂN TÁN ĐẢM BẢO TÍNH RIÊNG TƯ
Chuyên ngành
Mã số
: Khoa học máy tính
: 9480101
TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - NĂM 2023
Công trình được hoàn thành tại: Trường Đại học Công nghệ thông tin
và Truyền thông - Đại học Thái Nguyên
Người hướng dn khoa hc:
1. PGS.TS Trần Đức S
2. TS Nguyễn Văn Tảo
Phn bin 1: .........................................................................
..............................................................................................
Phn bin 2: .........................................................................
..............................................................................................
Phn bin 3: .........................................................................
..............................................................................................
Luận án đưc bo v trưc Hội đồng chm luận án cấp Đại học Thái
Nguyên, họp ti ..................................................................................
.............................................................................................................
Vào hồi gi ngày tháng năm
Có thể tìm hiểu luận án tại thư viện: ...................................
1
MỞ ĐẦU
1. Tính cấp thiết
Mỗi ngày, hàng triu giao dịch điện t thể được thc hin,
hay hàng tỷ bình luận/cm xúc được bày tỏ trên các trang mạng hội.
Bng việc khai phá, phân tích nhng ngun d liệu này, các tri thc
hoặc thông tin có giá trị đã được tìm ra đem lại nhiu lợi ích đáng
k cho nhng t chức, cá nhân [1].
Trên thực tế, bt k mt tp d liệu nào cũng cha những thông
tin mang tính chất riêng tư, nhạy cảm như: bnh của bệnh nhân, thu
nhp của khách hàng, quan điểm chính trị của người dùng. Vấn đề này
là cản tr lớn đối vi hoạt đng khai phá dữ liu.
Trước thách thức đó, nghiên cứu phát triển các giải pháp khai
phá tri thức thông tin hữu ích tiềm ẩn trong các tập d liu trong
khi những thông tin riêng tư, nhy cm tn tại bên trong dữ liu vn
được gi an toàn và bí mật bởi các bên s hu tr thành một nhim v
rt cn thiết quan trọng, thu hút được nhiu s quan tâm từ cng
đồng nghiên cứu [2].
2. Mục tiêu nghiên cứu
Luận án tập trung nghiên cứu ba vấn đề chính sau đây:
- Vấn đề th nhất nghiên cứu, đánh giá các giải pháp khai phá
d liệu đảm bảo tính riêng tư hiện có, đặc biệt là những giải pháp dựa
trên lĩnh vực tính toán bảo mt nhiều thành viên.
- Vấn đề th hai là phát triển mt s k thuật tính toán bảo mt
nhiều thành viên chứng minh các đề xut mi hiu qu hơn
kh năng ứng dụng cao hơn các phương pháp đã có.
- Vấn đ th ba da trên các kỹ thuật tính toán bo mt nhiu
thành vn mới phát triển, đề xut mt s giao thc khai p d liệu đảm
bo nh riêng cho cả hai mô hình dữ liu phân mnh theo chiu ngang
chiu dọc; đánh giá hiệu qu tính riêng của các giải pháp mi.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu ca luận án là các phương pháp khai
phá dữ liu t nhiu nguồn có đảm bảo tính riêng tư dựa trên phương
pháp tính toán bảo mt nhiều thành viên.
2
- Phạm vi nghiên cứu ca luận án tập trung vào bài toán khai
d liu t nhiu nguồn có đảm bảo tính riêng tư.
4. Cách tiếp cận và phương pháp nghiên cứu
- Cách tiếp cn: luận án tng hp, phân tích, đánh giá các công
trình có liên quan ti vấn đề khai phá dữ liu t nhiu nguồn đảm
bảo tính riêng , t đó đ xut giải pháp phù hợp để gii quyết các
vấn đề đã đặt ra.
- Phương pháp nghiên cứu ca luận án là nghiên cứu lý thuyết
và nghiên cứu thc nghim.
5. Các nội dung nghiên cứu chính, đóng góp mi ca luận án
- Th nht, luận án góp phần làm rõ bức tranh khái quát về lĩnh
vực khai phá dữ liu t nhiu nguồn đảm bảo tính riêng tư, đồng
thời phát hin ra nhng khong trống nghiên cứu dựa trên việc đánh
giá một s công trình nghiên cứu liên quan.
- Thứ hai, luận án phát triển mt s giao thức tính toán bảo mt
nhiều thành viên. Giao thc th nht tính tổng bo mt ci tiến, giao
thc th hai tính tổng bo mt tổng quát, giao thc th ba cho phép
tính toán tích vô hướng bo mật trong mô hình ba thành viên dựa trên
giao thức đánh giá đa thức bo mật, và hai giao thức cuối cùng tính độ
h tr bo mật cũng cho mô hình tính toán ba thành viên.
- Th ba, luận án đề xut các giao thc an toàn và hiệu qu để
khai phá d liệu đảm bảo tính riêng tư cho ngữ cảnh phân tán ngang
phân tán dọc. Đồng thời, các thí nghiệm trên d liu tht cũng đã
chng minh kh năng ứng dng thc tế ca nhng giải pháp đề xut.
6. Ý nghĩa khoa học và thực tin
6.1. Ý nghĩa khoa học
- Đề xut mt s giao thc tính toán bảo mt nhiều thành viên
an toàn và hiệu qu.
- Đề xut giải pháp phân lớp d liệu Naïve Bayes đảm bảo tính
riêng tư cho hình dữ liệu phân tán ngang giải pháp khai phá luật
kết hợp đảm bảo tính riêng cho kịch bn d liu phân tán dc ba
thành viên.
3
6.2. Ý nghĩa thực tin
Kết qu nghiên cứu ca luận án có thể được s dụng làm cơ s
phát triển các ứng dụng khai phá dữ liu đảm bảo tính riêng cho các
kch bản mô hình dữ liệu phân tán.
7. B cc luận án
- Chương 1 trình bày tổng quan về khai phá dữ liệu từ nhiều
nguồn có đảm bảo tính riêng tư.
- Chương 2 trình bày các khái niệm bản v mật tính
toán bảo mt nhiều thành viên; phân tích đánh giá một s giao thc
tính toán bảo mt nhiều thành viên điển hình để t đó phát triển các
giao thức tính toán bảo mt nhiều thành viên, bao gm: giao thức tính
tng bo mt ci tiến, giao thức tính tổng bo mt tổng quát, giao thc
tính tích vô hướng bo mật trong hình ba thành viên, hai giao thc
tính độ h tr bo mật cũng cho mô hình tính toán ba thành viên.
- Chương 3 trình bày các giao thức mới để khai phá dữ liệu đảm
bảo tính riêng tư cho ngữ cảnh phân tán dọc và phân tán ngang.
CHƯƠNG 1. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU TỪ
NHIỀU NGUỒN CÓ ĐẢM BẢO TÍNH RIÊNG TƯ
1.1. Giới thiệu chương
Trong chương này, luận án trình bày tng quan v khai phá dữ
liu t nhiu nguồn có đảm bảo tính riêng tư, trong đó giới thiu mt
s phương pháp phá dữ liu t nhiu nguồn có đảm bảo tính riêng
ph biến: Phương pháp biến đổi ngẫu nhiên, phương pháp nh toán
bo mt nhiều thành viên, phương pháp ẩn danh d liu. Cuối chương
này, luận án đánh giá một s giải pháp khai phá luật kết hp t nhiu
nguồn đảm bảo đảm bảo tính riêng và xác định các vấn đề
luận án cn gii quyết.
1.2. Giới thiệu về khai phá dữ liệu có đảm bảo tính riêng
Các nghiên cứu v khai phá dữ liệu phân tán có đảm bo quyn
riêng liên quan đến ba vấn đề chính sau đây [5]. Th nhất, các tổ
chức như các quan chính phủ muốn công bố d liệu cho các nhà