intTypePromotion=1
ADSENSE

Luận văn Thạc sĩ Khoa học máy tính: Bảo vệ cơ sở dữ liệu bằng kỹ thuật thủy vân dựa vào giải thuật di truyền và thuật toán mở rộng hiệu

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:60

7
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bố cục nội dung luận văn được chia thành 3 chương: Chương 1 - Tổng quan; Chương 2 - Thủy vân CSDL bằng giải thuật di truyền và phương pháp mở rộng hiệu; Chương 3 - Phần mềm thủy vân cơ sở dữ liệu quan hệ. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Khoa học máy tính: Bảo vệ cơ sở dữ liệu bằng kỹ thuật thủy vân dựa vào giải thuật di truyền và thuật toán mở rộng hiệu

  1. 1
  2. ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ----------------------------- PHẠM VIẾT HOÀI BẢO VỆ CƠ SỞ DỮ LIỆU BẰNG KỸ THUẬT THỦY VÂN DỰA VÀO GIẢI THUẬT DI TRUYỀN VÀ THUẬT TOÁN MỞ RỘNG HIỆU LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 2
  3. MỤC LỤC LỜI CẢM ƠN ....................................................................................... 5 CHƢƠNG 1.TỔNG QUAN ....................................................................... 7 1.1.Một số khái niệm cơ bản ...................................................................... 7 1.1.1.Khái niệm cơ sở dữ liệu ..................................................................... 7 1.1.2.Mô hình cơ sở dữ liệu quan hệ ........................................................... 7 1.1.3.Thủy vân số ..................................................................................... 10 1.1.4.Thủy vân CSDL quan hệ ................................................................. 13 1.2. Các tính chất của thủy vân trên CSDL quan hệ .............................. 15 1.2.1.Khả năng có thể phát hiện ............................................................... 15 1.2.2.Tính bền vững và dễ vỡ ................................................................... 16 1.2.3.Khả năng cập nhật phần tăng thêm .................................................. 16 1.2.4.Không dễ cảm nhận đƣợc ................................................................ 16 1.3.Một số phép tấn công trên hệ thủy vân CSDL quan hệ ....................... 16 1.3.1.Cập nhật thông thƣờng .................................................................... 17 1.3.2.Tấn công có chủ đích ....................................................................... 17 1.4.Các ứng dụng chủ yếu của thủy vân trên CSDL quan hệ .................... 17 1.4.1.Bảo vệ bản quyền CSDL ................................................................. 18 1.4.2.Xác thực tính toàn vẹn của CSDL.................................................... 18 1.4.3.Dán nhãn ......................................................................................... 18 1.4.4.Điều khiển truy cập ......................................................................... 18 1.4.5.Điều khiển sao chép......................................................................... 19 1.5.Thủy vân CSDL không thuận nghịch bằng phƣơng pháp LSB ........... 19 1.5.1.Thuật toán nhúng thủy vân .............................................................. 21 1.5.2.Thuật toán trích dấu thủy vân .......................................................... 22 CHƢƠNG 2. THỦY VÂN CSDL QUAN HỆ BẲNG GIẢI THUẬT DI TRUYỀN VÀ PHƢƠNG PHÁP MỞ RỘNG ........................................... 24 1.6.Một số phƣơng pháp thủy vân trên CSDL quan hệ ............................. 24 1.7.Phƣơng pháp mở rộng hiệu................................................................. 26 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 3
  4. 1.7.1.Phép biến đổi Haar nguyên trên một cặp giá trị ............................... 26 1.7.2.Phƣơng pháp mở rộng hiệu .............................................................. 28 1.8.Thủy vân mở rộng hiệu kết hợp với thuật toán di truyền .................... 39 1.8.1.Giải thuật di truyền .......................................................................... 40 1.8.2.Hàm thích nghi ................................................................................ 42 1.8.3.Nhúng thủy vân ............................................................................... 44 1.8.4.Trích dấu thủy vân ........................................................................... 46 1.8.5.Phân tích độ phức tạp tính toán ........................................................ 47 CHƢƠNG 3.XÂY DỰNG PHẦN MỀM THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ ..................................................................................... 49 1.9.Tổng quan về .NET ........................................................................... 49 1.9.1.Khái niệm .NET .............................................................................. 49 1.9.2.Visual Studio.Net ............................................................................ 50 1.9.3.Giới thiệu ngôn ngữ lập trình C# ..................................................... 51 1.10.Hệ quản trị cơ sở dữ liệu SQL Service 2008 ..................................... 53 1.10.1.Tổng quan về SQL......................................................................... 53 1.10.2.Hệ quản trị cơ sở dữ liệu SQL Server 2008 ................................... 55 1.11.Mô hình hoạt động của phần mềm .................................................... 55 1.12.Một số giao diện của phần mềm ....................................................... 57 KẾT LUẬN ..................................................................................... 59 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 4
  5. LỜI CẢM ƠN Để hoàn thành đƣợc luận văn này tôi đã nhận đƣợc rất nhiều sự động viên, giúp đỡ của nhiều cá nhân và tập thể. Trƣớc hết, tôi xin bày tỏ lòng biết ơn sâu sắc và sự tôn kính đến PGS. TS. Phạm Văn Ất đã hƣớng dẫn tôi thực hiện nghiên cứu luận văn của mình. Xin cùng bày tỏ lòng biết ơn chân thành tới TS Đỗ Văn Tuấn các thầy cô giáo, ngƣời đã đem lại cho tôi những kiến thức bổ trợ, vô cùng có ích trong trong thời gian thực hiện đề tài và trong những năm học vừa qua. Đồng thời xin gửi lời cám ơn chân thành tới Ban Giám hiệu, Phòng Đào tạo sau đại học, Đại học công nghệ thông tin & truyền thông đã tạo điều kiện cho tôi trong quá trình học tập. Cuối cùng tôi xin gửi lời cám ơn đến gia đình, bạn bè, những ngƣời đã luôn bên tôi, động viên và khuyến khích tôi trong quá trình thực hiện đề tài nghiên cứu của mình. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 5
  6. ĐẶT VẤN ĐỀ Truy cập Internet một cách dễ dàng đã thúc đẩy sự tăng trƣởng của nhiều ngành nghề khác nhau và nhiều lĩnh khác. Ngày nay, việc chia sẻ thông tin trực tuyến là một hoạt động quan trọng đối với kinh doanh và nghiên cứu,không những vậy, nó còn liên quan đến việc mua bán của cơ sở dữ liệu. Ví dụ, chia sẻ dữ liệu liên quan đến thời tiết, thị trƣờng chứng khoán, tiêu thụ điện năng, y tế, khoa học… vv đƣợc thực hiện thƣờng xuyên. Do đó, có một nhu cầu lớn trong việc cung cấp bảo mật cơ sở dữ liệu để ngăn cản việc sao chép và phân phối bất hợp pháp trong môi trƣờng internet. Kỹ thuật thuỷ vân đang đƣợc xem là một trong những giải pháp đạt đƣợc kết quả cao trong việc bảo vệ bản quyền và xác thực tính toàn vẹn của dữ liệu số. Vì vậy những năm gần đây xuất hiện một hƣớng nghiên cứu mới là thủy vân thuận nghịch Trong giấu tin và thủy vân thuận nghịch thƣờng sử dụng các phép biến đổi nguyên khả nghịch nhƣ dịch chuyển Histogram, Wavelet nguyên, phép biến đổi tƣơng phản, phép biến đổi theo thuật toán di truyền, phép biến đổi mở rộng hiệu, ….Trong số đó kỹ thuật giấu tin và thủy vân dựa trên phép biến đổi theo giải thuật di truyền và mở rộng hiệu đạt đƣợc hiệu quả cao nên đang đƣợc nhiều ngƣời quan tâm. Chính vì vậy em chọn đề tài “Bảo vệ CSDL bằng kỹ thuật thủy vân dựa vào giải thuật di truyền và thuật toán mở rộng hiệu” làm luận văn tốt nghiệp của mình. Nội dung luận văn đƣợc tổ chức thành 3 chƣơng: Chƣơng 1. Tổng quan, Chƣơng 2. Thủy vân CSDL bằng giải thuật di truyền và phƣơng pháp mở rộng hiệu, Chƣơng 3. Phần mềm thủy vân cơ sở dữ liệu quan hệ. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 6
  7. CHƢƠNG 1. TỔNG QUAN 1.1. Một số khái niệm cơ bản Phần này trình bày một số khái niệm cơ bản về cơ sở dữ liệu, thủy vân số nói chung và thủy vân cơ sở dữ liệu nói riêng. 1.1.1. Khái niệm cơ sở dữ liệu Cơ sở dữ liệu là bộ sƣu tập về các loại dữ liệu tác nghiệp bao gồm: chữ viết, văn bản, đồ họa, hình ảnh,... đƣợc lƣu trữ dƣới dạng file dữ liệu trên băng từ, đĩa từ,... Cấu trúc lƣu trữ dữ liệu tuân theo các nguyên tắc dựa trên lý thuyết toán học. Cơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều ngƣời, bất kỳ ngƣời dùng nào có quyền sử dụng, khai thác toàn bộ hay một phần đều có thể sử dụng và khai thác nó nhằm thỏa mãn nhu cầu khai thác thông tin 1.1.2. Mô hình cơ sở dữ liệu quan hệ Mô hình cơ sở dữ liệu quan hệ đƣợc tiến sĩ E.F. Codd phát triển vào năm 1970. Loại cơ sở dữ liệu này đã loại bỏ đƣợc những vấn đề liên quan đến các thiết kế cơ sở dữ liệu khác. Sử dụng mô hình này có thể giảm thiểu việc dƣ thừa dữ liệu, tiết kiệm đƣợc không gian lƣu trữ và có khả năng truy xuất dữ liệu hiệu quả. Hiện nay cơ sở dữ liệu quan hệ đang đƣợc sử dụng phổ biến cho các ứng dụng. Mô hình cơ sở dữ liệu quan hệ lƣu trữ dữ liệu trên một hoặc nhiều bảng, mỗi bảng gồm nhiều hàng (row), nhiều cột (column) và đƣợc gọi là một quan hệ. Trong thực tế các hàng, các cột đƣợc gọi tên theo thuật ngữ là bản ghi (record) và trƣờng (field). Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 7
  8. Hình 1.1.Biểu diễn quan hệ - Thực thể: là đối tƣợng có trong thế giới thực mà ta cần mô tả các đặc trƣng của nó. Ví dụ: Thực thể NHANVIEN. Các đặc trƣng của thực thể NHANVIEN gồm: Mã nhân viên (1), Họ (Trần Văn), Tên (An) Ngày sinh (15/4/1971),... - Thuộc tính: Là tên các cột của quan hệ, các dữ liệu thể hiện các đặc trƣng của thực thể, mỗi thuộc tính có một kiểu dữ liệu tƣơng ứng. Hình 1.2.Biểu diễn thuộc tính - Miền thuộc tính: Tập các giá trị có thể có của thuộc tính gọi là miền giá trị của thuộc tính đó gồm có tên, kiểu dữ liệu, khuôn dạng,... Ví dụ: Ten: kiểu dữ liệu và Text, Ngaysinh, kiểu dữ liệu: date/time, khuôn dạng:dd/mm/yyyy Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 8
  9. - Bộ dữ liệu: Là các dòng (bản ghi) của quan hệ không kể dòng tên của các thuộc tính, mỗi bộ chứa giá trị cụ thể của các thuộc tính. Hình 1.3.Biểu diễn bộ dữ liệu - Quan hệ: Cho 𝑅 = {𝐴1 , 𝐴2 , . . . , 𝐴𝑛 }(trong đó R là tên quan hệ, A1,A2,...,An là các thuộc tính) là một tập hữu hạn các thuộc tính khác rỗng. Mỗi thuộc tính 𝐴𝑖  𝑅; 𝑖 = 1 ÷ 𝑛có một miền giá trị xác định. Mô hình cơ sở dữ liệu quan hệ thƣờng biểu diễn một quan hệ trên tập các thuộc tính bằng bảng 2 chiều. Các thuộc tính của quan hệ là các cột 𝐴1 , 𝐴2 , . . . , 𝐴𝑛 , các hàng của quan hệ đƣợc gọi là các bộ (bản ghi), ký hiệu r và giá trị của mỗi bộ gồm m thành phần. Quan hệ r đƣợc biểu diễn bởi bảng sau: A1 A2 ... An r1 r1. A1 r1. A2 ... r1. An r2 R2. A1 R2. A2 ... R2. An ... ... ... ... ... rm rm. A1 rm. A2 ... rm. An Ví dụ: SINHVIEN(MaSV Ten Ngaysinh Điachi) HCN01 Hải 12/10/1987 Hà Nội HCN02 Bình 06/08/1989 Hải Phòng HCN03 Minh 28/10/1990 Nghệ An HCN04 Hoa 17/09/1991 Quảng Ninh Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 9
  10. Trong đó các thuộc tính là MaSV: Mã sinh viên; Ten: tên; Ngaysinh: Ngày sinh; Diachi: Địa chỉ. Bộ giá trị là (HCN01, Hải, 12/10/1987, Hà Nội). - Lƣợc đồ quan hệ: Tập tất cả các thuộc tính trong một quan hệ cùng với mối liên hệ giữa chúng đƣợc gọi là lƣợc đồ quan hệ. - Khóa của quan hệ: Trong một lƣợc đồ quan hệ luôn tồn tại một thuộc tính hay một tập các thuộc tính có khả năng biểu diễn duy nhất các thuộc tính còn lại. Nói cách khác giá trị của một hay nhiều thuộc tính có thể xác định duy nhất giá trị các thuộc tính khác. Ví dụ Số chứng minh thƣ sẽ xác định đƣợc tất cả thông tin về ngƣời mang chứng minh thƣ đó. Tập thuộc tính có tính chất nhƣ trên đƣợc gọi là khoá của lƣợc đồ quan hệ. Thông thƣờng trong một lƣợc đồ quan hệ có thể tồn tại nhiều khoá. Trong số đó sẽ chọn một khoá làm khoá chính sao cho đơn giản và không nhập nhằng thông tin. Giá trị các thành phần của khoá không thể nhận giá trị null hay các giá trị không xác định. Khóa của quan hệ R xác định trên tập thuộc tính 𝑅 = {𝐴1 , 𝐴2 , . . . , 𝐴𝑛 } là tập con K  R sao cho bất kỳ hai bộ khác nhau t1, t2 r luôn thỏa t1.K ≠ t2.K. Khóa là khái niệm quan trọng trong thiết kế cơ sở dữ liệu quan hệ. Khóa thƣờng đƣợc áp dụng trong việc tìm kiếm và cập nhật dữ liệu trong các quan hệ cơ sở dữ liệu. 1.1.3. Thủy vân số Thủy vân số là kỹ thuật nhúng thêm một lƣợng thông tin (dấu thủy vân) vào dữ liệu đa phƣơng tiện nhƣ: văn bản, hình ảnh, âm thanh và cơ sở dữ liệu (dữ liệu đa phƣơng tiện). Việc nhúng dấu thủy vân vào dữ liệu đa phƣơng tiện có thể làm giảm chất lƣợng dữ liệu nhƣng nó là dấu vết để chứng minh quyển sở hữu hoặc dùng để phát hiện ra sự đổi trái phép trên dữ liệu trong quá trình trao đổi thông tin. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 10
  11. Các lƣợc đồ thủy vân có thể đƣợc phân loại theo nhiều tiêu chí khác nhau nhƣ: Phân loại theo mục đích sử dụng: Dựa vào mục đích sử dụng, các lƣợc đồ thủy vân có thể đƣợc chia thành 2 loại nhƣ hình sau: Thủy vân số Thủy vân bền vững Thủy vân dễ vỡ Hình 1.1. Phân loại thủy vân theo mục đích sử dụng. Trên Hình 1.1. thủy vân bền vững là các lƣợc đồ thủy vân có khả năng chống đƣợc một số phép tấn công nhằm vi phạm bản quyền. Theo đó, dấu thủy vân cần ít bị biến đổi (bền vững) trƣớc sự thay đổi của dữ liệu thủy vân. Do vậy các lƣợc đồ thủy vân bền vững thƣờng đƣợc ứng dụng trong bài toán bảo vệ bản quyền các sản phẩm dữ liệu sô. Trái với thủy vân bền vững, thủy vân dễ vỡ yêu cầu dấu thủy vân phải nhạy cảm (dễ bị biến đổi) trƣớc các sự thay đổi trái phép trên dữ liệu chứa dấu thủy vân. Vì vậy các lƣợc đồ này đƣợc dùng để xác thực tính toàn vẹn của dữ liệu hay định vị các vùng dữ liệu bị tấn công. Phân loại theo cách sử dụng khóa: Ngoài cách phân loại các lƣợc đồ thủy vân theo mục đích ứng dụng, ta còn có thể phân loại theo cách sử dụng khóa nhƣ hình sau: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 11
  12. Thủy vân số Thủy vân khóa bí mật Thủy vân khóa công khai Hình 1.2. Phân loại thủy vân theo cách sử dụng khóa. Trên Hình 1.2, các lƣợc đồ thủy vân khóa bí mật sử dụng chung khóa cho cả quá trình nhúng và trích dấu (kiểm tra) dấu thủy vân. Do vậy, khi triển khai ứng dụng cần phải thực hiện quá trình trao đổi khóa giữa bên gửi và bên kiểm tra. Trái với thủy vân khóa bí mật, các lƣợc đồ thủy vân khóa công khai sử dụng các khóa khác nhau cho hai quá trình. Thông thƣờng, khóa bí mật đƣợc dùng bên phía ngƣời nhúng dấu thủy vân và khóa công khai đƣợc sử dụng ở phía ngƣời kiểm tra dấu thủy vân. Cũng giống nhƣ các hệ mật mã, từ khóa công khai khó có thể suy ra đƣợc khóa bí mật. Do không phải thực hiện quá trình trao đổi khóa nên các lƣợc đồ thủy vân khóa công khai thƣờng an toàn hơn và dễ dàng triển khai trong thực tế. Phân loại theo sự hiện diện của dấu thủy vân: Ngoài hai cách phân loại ở trên, dựa vào sự hiển thị hay không hiển thị (ẩn) của dấu thủy vân trên các sản phẩm chứa dấu thủy vân ngƣời ta có thể phân thành hai loại nhƣ: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 12
  13. Thủy vân số Thủy vân ẩn Thủy vân hiện Hình 1.3. Phân loại thủy vân theo sự hiện diện của dấu thủy vân. Trong Hình 1.3, thủy vân hiện gồm các lƣợc đồ cho phép dấu thủy vân hiển thị trên sản phẩm cần bảo vệ. Các dấu thủy vân này thƣờng là các logo của các tổ chức. Một ví dụ điển hình về thủy vân hiện là biểu tƣợng của các đài truyền hình đƣợc hiển thị trên màn hình tivi. Không giống nhƣ thủy vân hiện, trong thủy vân ẩn, dấu thủy vân ẩn lấp dƣới dữ liệu cần bảo vệ. Và bằng mắt thƣờng, ngƣời dùng khó có thể phân biệt sự khác biệt giữa dữ liệu chứa dấu thủy vân và dữ liệu không chứa dấu thủy vân. Nói một cách khác, dấu thủy vân trong suốt đối với ngƣời dùng. Dạng thủy vân ẩn hay đƣợc sử dụng để phát hiện ra sự tấn công trái phép của các đối thủ, những ngƣời muốn xuyên tạc thông tin hay làm giả các sản phẩm đa phƣơng tiện. Ngoài 3 cách phân loại cơ bản nhƣ trên, dựa vào kiểu dữ liệu chứa dấu thủy vân ngƣời ta cũng có thể phân thành: thủy vân trên ảnh số, thủy vân trên video, thủy vân trên âm thanh và thủy vân trên cơ sở dữ liệu. Do mỗi kiểu dữ liệu có những đặc trƣng khác nhau nên các lƣợc đồ thủy vân tƣơng ứng cũng có cách tiếp cận riêng. Tuy nhiên, cũng có những phƣơng pháp nhúng dấu thủy vân không phụ thuộc vào kiểu dữ liệu. 1.1.4. Thủy vân CSDL quan hệ Ngày nay, việc sử dụng các cơ sở dữ liệu trong các ứng dụng càng ngày càng tăng lên đang tạo ra một nhu cầu tƣơng tự đối với thủy vân cơ sở dữ liệu. Internet hiện đang đƣa đến một sức ép rất nặng nề cho những ngƣời Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 13
  14. bảo vệ dữ liệu trong việc tạo ra các dịch vụ cho phép ngƣời sử dụng tìm kiếm và truy cập cơ sở dữ liệu từ xa. Mặc dù xu hƣớng này là hữu ích cho ngƣời dùng cuối nhƣng nó cũng bộc lộ một mối nguy hiểm cho những nhà cung cấp dữ liệu trƣớc những kẻ trộm cắp dữ liệu. Do đó, những ngƣời cung cấp dữ liệu đòi hỏi phải có công nghệ nhận dạng đƣợc những bản sao các cơ sở dữ liệu của họ bị đánh cắp. Cho dù có khá nhiều điều có thể học hỏi đƣợc từ các kết quả đã đạt đƣợc về thủy vân dữ liệu đa phƣơng tiện nhƣng cho đến nay vẫn còn rất nhiều thách thức kỹ thuật mới đối với lĩnh vực thủy vân các cơ sở dữ liệu quan hệ bởi vì các dữ liệu quan hệ và các dữ liệu đa phƣơng tiện khác nhau ở khá nhiều khía cạnh quan trọng. Chẳng hạn nhƣ, các phần khác nhau của một đối tƣợng đa phƣơng tiện không thể cắt bỏ hoặc thay thế một cách tùy ý mà không gây ra những thay đổi về cảm quan trong đối tƣợng. Ngƣợc lại, việc thêm, bớt và cập nhật các bộ của một bảng quan hệ lại là những phép toán chuẩn trong cơ sở dữ liệu. Do những khác nhau này mà các kỹ thuật đƣợc phát triển cho các dữ liệu đa phƣơng tiện không thể đƣợc sử dụng trực tiếp để thủy vân các quan hệ. Thuỷ vân cơ sở dữ liệu quan hệ là phƣơng pháp nhúng một lƣợng thông tin nào đó vào trong cơ sở dữ liệu quan hệ. Thuỷ vân cơ sở dữ liệu quan hệ là thuỷ vân ẩn, bền vững. Một thuỷ vân có thể đƣợc áp dụng cho bất kỳ một cơ sở dữ liệu quan hệ nào có các thuộc tính mang một đặc điểm là những thay đổi nhỏ tại một số giá trị của chúng không làm ảnh hƣởng đến các ứng dụng. Một ví dụ khác là các nhà xuất bản sách khi in các bảng toán học (nhƣ các bảng logarit và lịch thiên văn) thƣờng đƣa vào một số lỗi nhỏ để có thể dễ dàng nhận dạng các bản sao bị ăn cắp. Đối với hầu hết các cơ sở dữ liệu quan hệ trong đó có chứa các tham số thì những sai lệch do hệ thống thuỷ vân gây ra có thể đƣợc điều chỉnh sao cho chúng nằm trong miền dung sai của độ đo. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 14
  15. 1.2. Các tính chất của thủy vân trên CSDL quan hệ Có thể thấy rằng thủy vân cơ sở dữ liệu quan hệ có những thách thức kỹ thuật và có các ứng dụng trong thực tế cao, do đó cần phải phát triển một hệ thống thủy vân và kèm theo đó là các kỹ thuật nhất định. Những kỹ thuật này chắc chắn sẽ dựa phần lớn vào các nguyên tắc thủy vân đang tồn tại. Tuy nhiên, chúng cũng sẽ đòi hỏi phải có những mở rộng và các sáng kiến mới. Để minh họa cho sự khả thi của một lƣợc đồ thủy vân cơ sở dữ liệu quan hệ, một kỹ thuật hữu hiệu thỏa mãn những tiêu chuẩn của một hệ thống thủy vân. Kỹ thuật này chỉ đánh dấu các thuộc tính (trƣờng) có kiểu dữ liệu số thực và giả thiết là các trƣờng đƣợc đánh dấu có thể chấp nhận những thay đổi nhỏ ở một số giá trị. Ý tƣởng chính là đảm bảo tại một số vị trí bit của một số thuộc tính trong một số bộ có chứa các giá trị nhất định. Các bản ghi (bộ), các thuộc tính trong một bộ, các vị trí bit trong một thuộc tính và các giá trị bit nhất định này đều phải đƣợc xác định một cách chính xác và logic dƣới sự kiểm soát của một khóa bí mật của chủ nhân CSDL quan hệ. Mẫu bit này sẽ hình thành ra thủy vân. Chỉ duy nhất chủ nhân của khóa bí mật mới có thể tìm lại đƣợc thủy vân với một xác suất cao. Các phân tích chi tiết chỉ ra rằng thủy vân này có thể bền vững trƣớc các tấn công gây hại khác nhau. Giả thiết, Alice là chủ nhân của CSDL quan hệ R chứa  bộ, trong đó cô đã đánh dấu  bộ. Hệ thống thủy vân cần phải thỏa mãn những tính chất sau đây. 1.2.1. Khả năng có thể phát hiện Alice cần phải có khả năng phát hiện thủy vân của cô bằng cách xem xét  bộ từ cơ sở dữ liệu nghi ngờ. Rõ ràng là nếu mẫu bít của cô thủy vân có mặt ở tất cả  bộ thì cô có lý do xác đáng để nghi ngờ có sự sao chép trái phép. Tuy nhiên, Alice cũng có thể ngờ vực ngay cả khi mẫu của cô chỉ có mặt ở ít nhất là 𝑡bộ (t), trong đó t phụ thuộc vào  và một giá trị Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 15
  16. cho trƣớc, đƣợc gọi là mức ý nghĩa của phép thử. Giá trị của t đƣợc xác định sao cho xác suất để Alice sẽ tìm thấy mẫu bit của cô trong ít nhất t bộ từ  bộ là nhỏ hơn . 1.2.2. Tính bền vững và dễ vỡ Các dấu thủy vân cần phải bền vững trƣớc những tấn công nhằm xóa bỏ. Khi đó, nói rằng thủy vân là an toàn đối với tấn công này nếu kẻ tấn công không thể phá hủy các dấu hiệu thủy vân ở ít nhất tbộ, trong đó t phụ thuộc vào  và . Ngƣợc lại với thủy vân bền vững, trong các lƣợc đồ thủy vân dễ vỡ, khi có bất kỳ tấn công nào lên dữ liệu thì các thủy vân không còn nguyên vẹn. Vì vậy, kẻ tấn công dữ liệu mong muốn thay đổi  bộ trong quan hệ r của chủ sở hữu mà vẫn không làm thay đổi thủy vân. Khi đó, nếu những thay đổi của kẻ tấn công làm thay đổi các thủy vân đƣợc giấu thì ta có thể kết luận rằng quan hệ đã bị tấn công. 1.2.3. Khả năng cập nhật phần tăng thêm Sau khi có quan hệ R đã thủy vân, Alice có thể cập nhật R khi cần thiết mà không làm hỏng thủy vân. Khi Alice thêm, bớt các bộ hoặc sửa đổi các giá trị của các thuộc tính của R, thủy vân cần phải có khả năng cập nhật trên những phần gia tăng. Tức là, các giá trị thủy vân chỉ phải tính toán lại đối với các bộ đƣợc thêm vào hoặc bị sửa đổi. 1.2.4. Không dễ cảm nhận đƣợc Thuỷ vân ẩn, không dễ nhận thấy đƣợc bằng mắt thƣờng của con ngƣời. Sự thay đổi do các dấu hiệu thuỷ vân gây ra cho dữ liệu quan hệ không đƣợc làm giảm giá trị sử dụng của cơ sở dữ liệu. Hơn nữa, các phép đo thống kê thông thƣờng nhƣ trung bình, phƣơng sai của các thuộc tính số cũng không nên bị ảnh hƣởng đáng kể. 1.3. Một số phép tấn công trên hệ thủy vân CSDL quan hệ Để biện luận đƣợc đơn giản, ta sử dụng ba nhân vật điển hình vẫn thƣờng đƣợc dùng trong các ví dụ về mật mã, giấu tin và thủy vân. Đó là Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 16
  17. một cô gái tên là Alice và bạn trai của cô tên là Bob. Hai ngƣời này thƣờng hay gửi thƣ cho nhau và ở giữa là một anh chàng tên là Mallory thƣờng xuyên làm phiền họ. Do cơ sở dữ liệu quan hệ luôn luôn đƣợc cập nhật nên thuỷ vân đƣợc giấu trong một cơ sở dữ liệu quan hệ có thể bị mất do những cập nhật thông thƣờng (thêm, sửa, xóa) cũng nhƣ các tấn công có mục đích. 1.3.1. Cập nhật thông thƣờng Giả thiết Mallory lấy trộm đƣợc dữ liệu của Alice mà không thể nhận ra nó đã đƣợc thủy vân. Sau đó, Mallory tiến hành cập nhật dữ liệu đã ăn trộm khi anh ta sử dụng nó. Kỹ thuật đánh dấu cần đảm bảo rằng Alice không bị mất thủy vân của cô ngay trong các dữ liệu bị ăn trộm, thậm chí đối với cả những cập nhật của Mallory. Tức là các phép toán cập nhật thông thƣờng nhƣ xóa, sửa, bổ sung các bộ trong cơ sở dữ liệu quan hệ. Các kỹ thuật thuỷ vân cần đảm bảo rằng ngƣời chủ cơ sở dữ liệu không bị mất thuỷ vân ngay trong dữ liệu bị kẻ khác ăn trộm, thậm chí đối với những cập nhật của tên trộm đó. 1.3.2. Tấn công có chủ đích Mallory có thể biết dữ liệu anh ta ăn trộm có chứa thủy vân, nhƣng anh ta có thể cố xóa thủy vân này hoặc thử dùng các phƣơng tiện khác để đòi quyền sở hữu trái phép. Hệ thống đánh dấu cần phải bảo vệ Alice trƣớc những tấn công gây hại của Mallory. Nghĩa là các cơ sở dữ liệu có thể bị những kẻ xấu ăn trộm, tấn công nhằm mục đích đòi quyền sở hữu trái phép hay phá huỷ dữ liệu, phá huỷ thuỷ vân,... Do đó, hệ thống thuỷ vân cần phải bảo vệ ngƣời chủ cơ sở dữ liệu trƣớc những tấn công gây hại của kẻ trộm. 1.4. Các ứng dụng chủ yếu của thủy vân trên CSDL quan hệ Có rất nhiều ứng dụng của thủy vân trên tài liệu số. Nhƣng có 2 ứng dụng quan trọng và đƣợc sử dụng phổ biến là: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 17
  18. 1.4.1. Bảo vệ bản quyền CSDL Đây là ứng dụng quan trọng nhất của thủy vân số. Một thông điệp đƣợc nhúng vào dữ liệu để chứng minh quyền sở hữu của tác giả (gọi là watermark hay thủy vân) trƣớc khi các dữ liệu này đƣợc đƣa lên mạng. Thủy vân này chỉ có ngƣời sở hữu sản phẩm mới có và đƣợc sử dụng làm minh chứng bản quyền của sản phẩm. Yêu cầu quan trọng với ứng dụng này là tính bền vững của thủy vân, để ngƣời khác khó có thể gỡ chúng ra khỏi các sản phẩm số đó. 1.4.2. Xác thực tính toàn vẹn của CSDL Thủy vân số có thể đƣợc dùng để xác thực thông tin hay phát hiện giả mạo. Thủy vân đƣợc dùng để kiểm tra xem dữ liệu là nguyên gốc hay đã chịu sự tác động bằng các phƣơng pháp tấn công thông thƣờng. Ngƣời ta thƣờng dùng phƣơng pháp thủy vân dễ vỡ để nhúng thông tin vào dữ liệu. Nếu dữ liệu bị tác động bằng các phƣơng pháp xử lý thông thƣờng, thủy vân sẽ không còn nguyên vẹn. 1.4.3. Dán nhãn Trong ứng dụng này, thủy vân đƣợc dùng để nhận diện ngƣời gửi hay ngƣời nhận thông tin. Ví dụ với trƣờng hợp nhận diện ngƣời nhận: Một bức ảnh ban đầu bán cho các khách hàng khác nhau. Nó sẽ đƣợc nhúng watermark là chữ ký của từng khách hàng tƣơng ứng. Sau đó, ảnh đƣợc chuyển cho các khách hàng. Mỗi khách hàng có thể kiểm tra watermark trong ảnh để chắc chắn ảnh đó chuyển cho mình. 1.4.4. Điều khiển truy cập Trƣờng hợp khách hàng sử dụng các dịch vụ truyền hình, nhƣ trả tiền cho các kênh truyền hình hay hoặc mua các đĩa phim mới. Mỗi khách hàng sẽ có một set-top box và một thẻ thông minh (smart card), các thiết bị này sẽ có định danh duy nhất, đại diện cho khách hàng. Để ngăn chặn những ngƣời sử dụng dịch vụ mà không trả tiền, nhà cung cấp dịch vụ sẽ mã hóa dữ liệu sử dụng các khóa trƣớc khi chuyển đến Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 18
  19. cho khách hàng. Khi smart card của khách hàng còn hiệu lực, set-top sẽ giải mã dữ liệu chuyển đến. Sau đó, nó nhúng thủy vân là định danh của ngƣời dùng vào dữ liệu đó. Quá trình ấy đƣợc gọi là ghi dấu vân tay (fingerprinting). Dữ liệu sau khi đã đƣợc ghi dấu vân tay sẽ đƣợc sử dụng bình thƣờng. Nếu một kháchhàng nào đó cố tình cho ngƣời khác sử dụng trái phép những dữ liệu ấy, nhà cung cấp dịch vụ sẽ biết điều đó và ngăn chặn hoặc xử phạt. 1.4.5. Điều khiển sao chép Tất cả các ứng dụng của thủy vân số trình bày ở trên chỉ có tác dụng sau khi ngƣời dùng đã làm sai. Khi có sự vi phạm bản quyền xảy ra, thì mới dùng thủy vân để xác định chính xác ai là chủ sở hữu thực sự, hoặc sau khi một bức ảnh đã bị thay đổi mới dùng thủy vân để xác định bức ảnh nào là giả mạo,… Ứng dụng điều khiển sao chép có tác dụng ngăn chặn hành động sai, cụ thể là ngăn chặn việc sao chép trái phép các nội dung có bản quyền. Ví dụ: Hệ thống quản lý sao chép DVD. Các thiết bị phát hiện thủy vân sẽ đƣợc tích hợp vào thiết bị đọc ghi DVD. Khi muốn sao chép DVD, phải có sự đồng ý của chủ sở hữu. 1.5. Thủy vân CSDL không thuận nghịch bằng phƣơng pháp LSB Giống nhƣ các kiểu dữ liệu đa phƣơng tiện khác, trong những năm đầu phát triển, các phƣơng pháp thủy vân cơ sở dữ liệu không có khả năng khôi phục lại cơ sở dữ liệu gốc từ dữ liệu thủy vân. Đối với loại thủy vân này, phƣơng pháp chèn bít thấp là một trong những phƣơng pháp phổ biến, bởi dữ liệu sau khi nhúng có ít sự thay đổi so với dữ liệu gốc. Kỹ thuật thủy vân sử dụng các bít LSB chỉ sử dụng các thuộc tính kiểu số với giả thiết rằng sự thay đổi nhỏ về giá trị không làm ảnh hƣởng đến ý nghĩa của thuộc tính. Ta ký hiệu quan hệ dùng để nhúng thủy vân là: 𝑅(𝑃 ; 𝐴1 , . . . , 𝐴𝑛 ) Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 19
  20. trong đó, P là thuộc tính khóa chính và giả sử rằng các thuộc tính 𝐴𝑖 đều có thuộc kiểu dữ liệu số, nếu không thì ta chỉ chọn các trƣờng kiểu số. Các thuộc tính 𝐴𝑖 có chung tính chất là nếu thay đổi giá trị của bít thấp thứ 𝑘 thì đều không ảnh hƣởng đến ý nghĩa của trƣờng. Các bít ít ý nghĩa nhất (LSB – Least Significant Bits) là các bít ở bên phải nhất của một chuỗi bít. Ví dụ, trong chuỗi bít 11110000 thì các bít bít ít ý nghĩa nhất là 0 nhƣ hình sau: Hình 1.1. Khái niệm các bít có ý nghĩa thấp Kỹ thuật thủy vân dựa vào các bít ít ý nghĩa nhất sử dụng hàm băm mật mã để xây dựng mã xác thực (MAC – Message Authentication Code). Để tính MAC của thông điệp (dãy byte có độ dài tùy ý) ta sử dụng hàm băm 𝐻 nào đó nhƣ sau: 𝑀𝐴𝐶 = 𝐻(𝑀) Trong đó, H là một trong những hàm băm cho trƣớc nhƣ 𝑀𝐷5, 𝑆𝐻𝐴1, 𝑆𝐻𝐴2, . .. Khi đó MAC có độ dài cố định và không phụ thuộc vào độ dài của thông điệp M. Ngoài ra, hàm băm 𝐻 là hàm một chiều, nghĩa là từ M tính MAC thì dễ dàng nhƣng từ MAC không thể suy ra đƣợc 𝑀. Để tính MAC của bản ghi bất kỳ, các lƣợc đồ thủy vân xác định theo công thức sau: 𝑀𝐴𝐶 = 𝐻(𝑆𝑘 ||𝐻(𝑃| 𝑆𝑘 ) Trong đó, 𝑆𝑘 là khóa bí mật và 𝑃 là giá trị của trƣờng khóa chính của bản ghi đang xét, phép toán || dùng để ghép hai dãy. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2