B KHOA HC VÀ CÔNG NGHỆ
HC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
--------------------------------------
HOÀNG NGỌC CNH
PHÁT TRIỂN MT S PHƯƠNG PHÁP TRUY VẤN HIU QU TRÊN
CƠ SỞ D LIU QUAN H MÃ HOÁ
Ngành: H thống thông tin
Mã số: 9.48.01.04
TÓM TẮT LUN ÁN TIẾN SĨ K THUT
HÀ NỘI - 2025
Công trình được hoàn thành tại:
HC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dn khoa hc:
GS.TS. NGUYN HIU MINH
TS. NGÔ ĐỨC THIN
Phn bin 1:
Phn bin 2:
Phn bin 3:
Luận án được bo v trước Hội đồng chm luận án cấp Hc vin hp ti:
HC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
vào hồi: gi 00’, ngày tháng m 2025
Có thể tìm hiểu luận án tại:
1. Thư viện Quc gia Vit Nam
2. Thư viện Hc viện Công nghệ Bưu chính Viễn thông
1
M ĐẦU
1. GII THIU
Ngày nay, việc người s hu d liu (DO) triển khai CSDL nói chung và CSDLQH nói riêng trên nền
tng h tầng thuê ngoài (CS) ngày càng phổ biến. Tuy nhiên mt vấn đề được đặt ra là làm sao để CSDL thuê
ngoài đảm bảo được an toàn, ngăn cấm việc khai thác thông tin bất hợp pháp của các tổ chức/cá nhân không
thẩm quyn, k c nhà cung cấp dch v (DSP). ràng ngoài việc DO cần thêm các điều khon hp
đồng cht ch hơn về an ninh d liu với DSP và tăng cường các lớp bo mật cho đường truyền, máy chủ, h
điều hành, hệ qun tr CSDL thì việc xây dựng các biện pháp ch động che giu ni dung d liu nhy cm
(bằng phương pháp mã hóa) trong tất c các khâu: lưu trữ, gi nhận khai thác dữ liệu sao cho thông tin chứa
trong d liệu luôn an toàn trên máy chủ và đường truyền là vô cùng quan trọng. Khi d liệu mã hóa được lưu
trên CSDL thuê ngoài, đồng nghĩa CSDL này sẽ không được tn tại các khóa hoặc metadata đ phc v quá
trình mã hóa, giải mã hoặc truy xuất thông tin. Do đó mọi yêu cầu truy vấn trên d liệu rõ từ người dùng phải
được chuyển đổi thành các lệnh truy vấn trên dữ liệu hóa gửi ti CSDL thuê ngoài để thc thi. Tuy
nhiên dữ liu nhy cm (dng số, tự, logic, …) sau khi hóa bởi các thuật toán mật tiêu chuẩn như
AES, DES, … sẽ không còn giữ được các tính chất vốn ban đầu như: thứ tự, so sánh, tính toán số hc, thng
kê,… Vì vậy bài toán truy vấn hiu qu trên dữ liệu mã (đặc biệt truy vấn trên CSDLQH mã hoá thuê ngoài)
có tính cấp thiết và được quan tâm đặc bit trong những năm gần đây.
2. MỤC TIÊU CA LUẬN ÁN
Mục tiêu chung: Đề xuất các mô hình, lược đồ thuật toán truy vn hiu qu vi hai dng thc d
liu ph biến nêu trên theo các chuỗi điều kin truy vấn hay được s dụng trong CSDLQH mã hoá thuê ngoài.
Mục tiêu cụ th:
- Nghiên cứu áp dụng mô hình DAS-PROXY trong triển khai các lược đồ mã hoá đi xứng có thể tìm
kiếm (SSE) dựa trên chỉ mục mù.
- Nghiên cứu các kiến thức liên quan về CSDL quan h, cấu trúc dữ liu B+Tree, b lọc Bloom, phục
v xây dựngc chỉ mục mù và thuật toán truy vấn hiu qu.
- Đề xuất các lược đồ SSE mi dựa vào chỉ mục mù cho phép truy vấn hiu qu d liu dng s
t trên CSDL quan hệ mã hóa thuê ngoài theo các điều kin truy vấn thường được người dùng yêu cầu.
- Thc nghiệm và phân tích tính hiệu qu của các lược đồ SSE đã đề xut, trong đó tập trung chính vào
các khía cạnh đánh giá bo mật hiệu năng thực thi truy vn của các lược đồ cũng như tính khả thi trin
khai lược đồ truy vn.
- So sánh hiệu qu với các công trình nghiên cứu liên quan nổi bt trước đó.
3. PHƯƠNG PHÁP NGHIÊN CỨU
H thng danh mục công trình nghiên cứu tiêu biểu liên quan đến đề i. T đó phân tích chỉ ra các tồn
ti nhằm xác định được đối tượng, phm vi chi tiết, mục tiêu và nội dung nghiên cứu c th ca luận án.
Phát triển các phương pháp giải quyết bài toán dựa trên các đề xut cấu trúc dữ liu mi kết hp vi
la chọn áp dụng các đim mnh t những nghiên cứu trước đó: Xây dựng sở dn luận ý tưởng gii
quyết bài toán, sau đó hiện thc theo th t: la chọn mô hình triển khai đề xut thiết kế ca ợc đồ, xây
dng các cấu trúc d liệu, quy trình truy vấn và thuật toán liên quan.
La chọn CSDL và các kịch bn, ch s đo lường phù hợp để thc nghiệm và phân tích đánh ghiệu
qu của lược đồ đề xut. Cuối cùng là so sánh sự hiu qu với các nghiên cứu liên quan trước đó.
2
4. CÁC ĐÓNG GÓP CỦA LUN ÁN
Luận án có hai đóng góp chính là đề xuất hai lược đồ SSE tương ng h tr truy vn hiu qu chui con
trên dữ liệu tự truy vấn khoảng trên dữ liu s trong CSDLQH hoá. Áp dụng nhất quán nh
DAS-PROXY trong trin khai hai lược đồ đã đề xut, mang lại tính khả thi và tiềm năng cao trong ng dng
thc tiễn. Tính hiệu qu th hin qua kh năng đảm bảo các tiêu chí về bo mt, hiệu năng và tính khả thi trin
khai của các lược đồ. C th:
1) Đề xuất xây dựng lược đồ DIQ-SSE dựa trên chỉ mc mù hỗ tr truy vn chui con hiu qu trên d
liệu ký t trong CSDLQH hoá khi người dùng yêu cầu chuỗi điều kin "𝐿𝐼𝐾𝐸 ′% 𝑠𝑢𝑏𝑠𝑡𝑟𝑖𝑛𝑔 %′". Điểm
ni bt của đóng góp này xây dựng quy trình truy vấn tun t trên hai chỉ mục 𝐼𝑛𝑑𝑒𝑥1,𝐼𝑛𝑑𝑒𝑥2 sử
dng mt s cấu trúc dữ liu mới trong xây dựng 𝐼𝑛𝑑𝑒𝑥1,𝐼𝑛𝑑𝑒𝑥2.
2) Đề xuất xây dựng lược đồ ESIT-SSE dựa trên chỉ mục hỗ tr truy vn khong hiu qu trên dữ
liu s trong CSDLQH mã hoá khi được người dùng yêu cầu chuỗi điều kin "𝐵𝐸𝑇𝑊𝐸𝐸𝑁 𝑙 𝑎𝑛𝑑 ℎ". Đim ni
bt của đóng góp này là đưa ra quy trình xây dựng ch mục mù qua hai bước, gồm: Bước 1. Xây dựng ch mc
NewBucketIndex; Bưc 2. Biến đổi NewBucketIndex v vector giấu tin IHV cho phép che giấu thông tin thứ
t các ch mc.
5. B CC CA LUẬN ÁN
Chương 1. Tổng quan v mã hoá có thể tìm kiếm và vấn đề nghiên cứu
Trong chương 1, luận án tập trung gii thiu v ợc đồ mã hoá có thể tìm kiếm, phân loại các lược đồ,
các kỹ thut t chức mã hoá - phương thức tìm kiếm trong xây dựng lược đồ, mô hình DAS-PROXY và tình
hình nghiên cứu liên quan tới đề tài luận án. Từ đó nêu các nhận xét, bình luận, ch ra các khoảng trống nghiên
cứu và kết luận các vấn đề cn gii quyết trong lun án. Trong chương này cũng trình bày mt s kiến thức
s phc v cho các nội dung s trình bày tại chương 2, 3.
Chương 2. Phát triển phương pháp truy vấn chui con hiu qu trên dữ liệu tự trong CSDLQH
mã hoá
Trong chương 2, luận án tập trung đề xuất xây dựng lược đồ DIQ-SSE và triển khai trên mô hình DAS-
PROXY cho phép truy vấn chui con hiu qu trong CSDLQH mã hoá thuê ngoài thông qua chuỗi điều kin
“𝐿𝐼𝐾𝐸 ′% 𝑠𝑢𝑏𝑠𝑡𝑟𝑖𝑛𝑔 %. Trong đó điểm nhấn là xây dng cp ch mục mù đặc bit, các thuật toán liên quan
cùng quy trình truy vấn hiu qu cho lược đồ. Chương 2 cũng dành một phn ln nội dung để phân tích bảo
mt, thc nghiệm đánh giá hiệu năng, độ phc tạp tìm kiếm để khẳng định tính hiu qu của lược đồ DIQ-
SSE.
Chương 3. Phát triển phương pháp truy vấn khong hiu qu trên dữ liu s trong CSDLQH mã
hoá
Trong chương 3, luận án tập trung đề xuất xây dựng lược đ ESIT-SSE và triển khai trên hình DAS-
PROXY cho phép truy vấn khong hiu qu trong CSDLQH hoá thuê ngoài thông qua chuỗi điều kin
"𝐵𝐸𝑇𝑊𝐸𝐸𝑁 𝑙 𝑎𝑛𝑑 ℎ". Trọng tâm của quá trình này kỹ thuật phân khoảng d liu s các phương pháp
biến đổi cho phép to ra mt ch mục đặc biệt (còn gọi là vector giấu tin IHV) cung cp kh năng so sánh an
toàn nhưng không tiết l nội dung và thứ t ch mc. Tiếp theo đề xut cấu trúc dữ liu IHV_B+Tree và thuật
toán tìm kiếm cho phép tăng tốc truy vn khong. Cuối chương tập trung làm tính hiệu qu của lược đ
ESIT-SSE thông qua các thực nghiệm đánh giá hiệu năng, độ phc tạp tìm kiếm và phân tích bảo mt.
3
CHƯƠNG 1 . TNG QUAN V HOÁ CÓ THỂ TÌM KIẾM VÀ VẤN ĐỀ NGHIÊN CỨU
1.1. TNG QUAN V MÃ HOÁ CÓ TH TÌM KIẾM (SE)
Với các thách thức của bài toán mã hoá có thể tìm kiếm khi được trin khai tại các hạ tầng thuê ngoài,
các nhà nghiên cứu đã cho ra đời một lĩnh vực mới là “Mã hóa có thể tìm kiếm (sau đây gọi là SE)”, là sự kết
hợp đặc bit giữa các nghiên cứu v bo mt, truy xut thông tin và gii thuật tìm kiếm (xem nh 1.1). Bng
1.1 ch thống kê một s hướng và công trình nghiên cứu tiêu biểu trong lĩnh vực SE theo dòng thời gian.
Hình 1.1. Các lĩnh vực liên quan trong SE
Bng 1.1. Mt s hướng nghiên cứu trong SE theo thi gian
Năm
ớng nghiên cứu tiêu biểu trong SE
2000
Mã hóa đối xứng có thể tìm kiếm
2003
Ch mục mã hóa có thể tìm kiếm
2004
Mã hóa công khai có thể tìm kiếm
2008
Tìm kiếm đa từ khóa và tìm kiếm liên hợp các từ khóa
2010
Tìm kiếm t khóa đơn có xếp hng
Tìm kiếm m
2011
Tìm kiếm đa từ khóa có xếp hng
2013
Tìm kiếm dựa trên từ khóa đồng nghĩa
Tìm kiếm dựa trên ngữ nghĩa của t khóa
2014
Giải pháp SE dựa trên phần cng
2015-
2023
Ch mục tìm kiếm thích ứng; m kiếm chui con; Truy vn d liu mã dựa trên
chia s thông tin bí mt; Mã hóa đồng hình; …
1.2. TRIỂN KHAI LƯỢC Đ SE TRÊN MÔ HÌNH DAS
1.2.1. Mô hình DAS
DAS là một mô hình cung cấp CSDL như một dch v, mang ti kh năng quản lý dữ liu t xa đối vi
CSDL nói chung và cho phép triển khai hiu qu các lược đ SE trên CSDLQH mã nói riêng. V cơ bn DAS
gồm 3 đối tượng là DO, EU và CS. nh 1.2 mô t mi quan h vận hành giữa ba đối tượng này.
Hình 1.2. Mô hình DAS
1.2.2. Áp dụng mô hình DAS vào triển khai lược đồ SE
Để đảm bo nhim v của các đối tượng trong mô hình DAS, lược đồ SE cần được thiết kế t 5 thành