
1
MỞ ĐẦU
1. Tính cấp thiết
Mỗi ngày, hàng triệu giao dịch điện tử có thể được thực hiện,
hay hàng tỷ bình luận/cảm xúc được bày tỏ trên các trang mạng xã hội.
Bằng việc khai phá, phân tích những nguồn dữ liệu này, các tri thức
hoặc thông tin có giá trị đã được tìm ra và đem lại nhiều lợi ích đáng
kể cho những tổ chức, cá nhân [1].
Trên thực tế, bất kỳ một tập dữ liệu nào cũng chứa những thông
tin mang tính chất riêng tư, nhạy cảm như: bệnh lý của bệnh nhân, thu
nhập của khách hàng, quan điểm chính trị của người dùng. Vấn đề này
là cản trở lớn đối với hoạt động khai phá dữ liệu.
Trước thách thức đó, nghiên cứu và phát triển các giải pháp khai
phá tri thức và thông tin hữu ích tiềm ẩn trong các tập dữ liệu trong
khi những thông tin riêng tư, nhạy cảm tồn tại bên trong dữ liệu vẫn
được giữ an toàn và bí mật bởi các bên sở hữu trở thành một nhiệm vụ
rất cần thiết và quan trọng, thu hút được nhiều sự quan tâm từ cộng
đồng nghiên cứu [2].
2. Mục tiêu nghiên cứu
Luận án tập trung nghiên cứu ba vấn đề chính sau đây:
- Vấn đề thứ nhất là nghiên cứu, đánh giá các giải pháp khai phá
dữ liệu đảm bảo tính riêng tư hiện có, đặc biệt là những giải pháp dựa
trên lĩnh vực tính toán bảo mật nhiều thành viên.
- Vấn đề thứ hai là phát triển một số kỹ thuật tính toán bảo mật
nhiều thành viên và chứng minh các đề xuất mới hiệu quả hơn và có
khả năng ứng dụng cao hơn các phương pháp đã có.
- Vấn đề thứ ba là dựa trên các kỹ thuật tính toán bảo mật nhiều
thành viên mới phát triển, đề xuất một số giao thức khai phá dữ liệu đảm
bảo tính riêng tư cho cả hai mô hình dữ liệu phân mảnh theo chiều ngang
và chiều dọc; đánh giá hiệu quả và tính riêng tư của các giải pháp mới.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu của luận án là các phương pháp khai
phá dữ liệu từ nhiều nguồn có đảm bảo tính riêng tư dựa trên phương
pháp tính toán bảo mật nhiều thành viên.