Trang chủ » Luận Văn - Báo Cáo » Thạc sĩ - Tiến sĩ - Cao học

26 trang

107 lượt xem

Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu và phát triển một số kỹ thuật che giấu thông tin nhạy cảm trong khai phá hữu ích cao

Tóm tắt Luận án Tiến sĩ Kỹ thuật "Nghiên cứu và phát triển một số kỹ thuật che giấu thông tin nhạy cảm trong khai phá hữu ích cao" được nghiên cứu với mục tiêu là: Nghiên cứu và đề xuất các thuật toán ẩn tập mục hữu ích cao nhạy cảm và luật kết hợp hữu ích cao nhạy cảm dựa trên kỹ thuật heuristic; Nghiên cứu và áp dụng lý thuyết Giàn để giảm hiệu ứng phụ trong quá trình che giấu thông tin nhạy cảm trong khai phá hữu ích cao.

Chủ đề:

vimulcahy

Luận văn thạc sĩ CNTT

Luận văn thạc sĩ an toàn thông tin

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA

HUỲNH TRIỆU VỸ

NGHIÊN CỨU VÀ PHÁT TRIỂN MỘT SỐ KỸ

THUẬT CHE GIẤU THÔNG TIN NHẠY CẢM

TRONG KHAI PHÁ HỮU ÍCH CAO

Chuyên ngành : KHOA HỌC MÁY TÍNH

Mã số : 9480101

TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT

Đà Nẵng, 02/2023

Công trình được hoàn thành tại

TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học:

1. TS. Trương Ngọc Châu

2. TS. Lê Quốc Hải

Phản biện 1: ……………………………………………….

Phản biện 2: ……………………………………………….

Phản biện 3: ……………………………………………….

Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp

Trường, Trường Đại học Bách khoa

Vào hồi … giờ … ngày … tháng … năm 20....

Có thể tìm hiểu luận án tại:

- Thư viện quốc gia Việt Nam.

- Trung tâm Học liệu và Truyền thông, Trường Đại học Bách khoa,

Đại học Đà Nẵng.

MỞ ĐẦU

1. Đặt vấn đề

Ngày nay, với sự phát triển nhanh chóng của ứng dụng công nghệ thông

tin trong hầu hết các lĩnh vực, lượng dữ liệu từ các hệ thống thông tin, ứng

dụng ngày càng gia tăng và được lưu trữ thành các kho dữ liệu lớn. Các

phương pháp khai thác dữ liệu truyền thống không còn đáp ứng đầy đủ

những yêu cầu về phân tích, đánh giá, dự đoán, dự báo dựa trên dữ liệu. Do

đó, kỹ thuật phát hiện tri thức trong cơ sở dữ liệu (CSDL) đã ra đời nhằm

giải quyết bài toán khai phá dữ liệu đang được áp dụng một cách rộng rãi

trong nhiều lĩnh vực khác nhau của đời sống. Mục đích của khai phá dữ liệu

(KPDL) là khám phá tri thức nhằm tìm ra những mẫu mới, những thông tin

tiềm ẩn mang tính dự đoán chưa được biết đến, có khả năng mang lại lợi ích

cho người sử dụng, trong đó quan trọng nhất là tìm ra các mẫu chứa đựng

những thông tin có thể hỗ trợ ra quyết định tồn tại trong CSDL. Có nhiều

kỹ thuật đã được nghiên cứu và đề xuất trong KPDL. Một trong những kỹ

thuật quan trọng được ứng dụng rộng rãi là khai phá tập mục thường xuyên

và luật kết hợp.

Trong khai phá tập mục thường xuyên vai trò của các mục xuất hiện

trong các giao tác là như nhau. Mỗi mục không thể xuất hiện nhiều hơn một

lần trong mỗi giao tác. Tập mục xuất hiện phổ biến hơn trong CSDL sẽ có ý

nghĩa hơn đối với người dùng. Như vậy, các tập mục thường xuyên khai

thác được chỉ mang ngữ nghĩa thống kê nên nó chỉ đáp ứng một phần nhu

cầu ứng dụng thực tiễn. Chẳng hạn như nhà kinh doanh quan tâm đến tần

suất xuất hiện đồng thời của các mặt hàng trong cùng một giao dịch của

khách hàng thì có thể sử dụng kỹ thuật khai thác tập mục thường xuyên để

dự đoán xu thế mua sắm của khách hàng. Tuy nhiên, nhà quản lý có thể cần

đến những thông tin chi tiết hơn như lợi ích mang lại của một hoặc một

nhóm mặt hàng được khách hàng mua sắm cùng nhau trong một giao dịch.

Khai phá tập mục thường xuyên không đáp ứng được điều này. Chính vì

điều này mà một khái niệm mới ra đời, đó là Khai phá hữu ích cao, tức là có

xét đến yếu tố hữu ích của mỗi mục trong CSDL (ví dụ: số lượng, lợi nhuận

của mỗi mặt hàng trong mỗi giao tác của CSDL).

Ngày nay, sự phát triển nhanh chóng của Công nghệ thông tin đang tạo

môi trường thuận lợi để thúc đẩy hợp tác thương mại toàn cầu và kinh

doanh xuyên quốc gia. Trong môi trường kinh doanh quốc tế, việc chia sẻ

dữ liệu giữa các đối tác hoặc công bố ra bên ngoài internet là rất cần thiết

để thúc đẩy sự phát triển. Tuy nhiên, bên trong dữ liệu có thể ẩn chứa các

thông tin riêng tư hoặc nhạy cảm (gọi chung là thông tin nhạy cảm) mà chủ

sở hữu không muốn tiết lộ ra bên ngoài, vì việc lộ những thông tin nhạy

cảm ra bên ngoài có thể khiến cho bên sở hữu dữ liệu đánh mất bí mật kinh

doanh hoặc lợi thế cạnh tranh,... Do đó, hiện nay có nhiều mô hình và kỹ

thuật đang được nghiên cứu để giải quyết vấn đề đặt ra, làm thế nào để cho

phép thực hiện quá trình KPDL trên các tập dữ liệu trong khi vẫn bảo vệ

được các thông tin nhạy cảm.

Như vậy, để đảm bảo các thông tin nhạy cảm không bị khai thác khi

CSDL được chia sẻ ra bên ngoài, thuật toán che giấu thông tin nhạy cảm

trong KPDL được áp dụng để sửa dữ liệu nhằm loại bỏ các mẫu dữ liệu có

thể suy luận ra các thông nhạy cảm từ kết quả KPDL. Quá trình thực hiện

che giấu thông tin nhạy cảm luôn gây ra các hiệu ứng phụ. Hiệu ứng phụ

được xác định là sự sai khác của bản thân dữ liệu và kết quả KPDL của

CSDL gốc so với CSDL sửa đổi. Như vậy, vấn đề chính cần giải quyết

trong bài toán che giấu thông tin nhạy cảm trong KPDL là đề xuất các thuật

toán che giấu được tất cả thông tin nhạy cảm nhưng giảm thiểu các hiệu

ứng phụ. Có nhiều phương pháp tiếp cận để giải quyết bài toán này: Theo

tiếp cận heuristic để thay đổi dữ liệu hoặc khóa dữ liệu; theo tiếp cận

border-based; theo tiếp cận exact,...

Để giải quyết bài toán che giấu thông tin nhạy cảm trong khai phá hữu

ích cao, năm 2010 Jieh-Shan Yeh và cộng sự đề xuất phương pháp ẩn tập

mục hữu ích cao nhạy cảm theo hướng tiếp cận heuristic để sửa CSDL gốc

với 2 thuật toán được đề xuất HHUIF (Hiding High Utility Item First

Algorithm) và MSICF (Maximum Sensitive Itemsets Conflict First

Algorithm). Dựa trên nền tảng này nhiều thuật toán hiệu quả hơn cũng được

đề xuất. Nhìn chung, hướng tiếp cận của các thuật toán đã được đề xuất đều

dựa trên hướng tiếp cận heuristic để sửa CSDL nhằm tối ưu cục bộ. Tuy

nhiên, mỗi thuật toán đều tập trung đưa ra phương pháp tối ưu cục bộ cho

một hoặc một số tiêu chí cực tiểu hiệu ứng phụ, những tiêu chí khác của

hiệu ứng phụ vẫn còn cao. Chính vì vậy, việc tiếp tục nghiên cứu và đề xuất

các thuật toán che giấu thông tin nhạy cảm trong khai phá hữu ích cao hiệu

quả hơn các thuật toán hiện tại là một hướng nghiên cứu cần thiết.

Nhằm góp phần giải quyết một phần vấn đề nêu trên, nghiên cứu sinh đã

chọn đề tài "Nghiên cứu và phát triển một số kỹ thuật che giấu thông tin

nhạy cảm trong khai phá hữu ích cao" làm nội dung nghiên cứu luận án tiến

sĩ kỹ thuật của mình.

2. Mục tiêu nghiên cứu

Luận án được thực hiện nhằm nghiên cứu giải quyết một phần các thách

thức trong giải quyết bài toán che giấu thông tin nhạy cảm trong khai phá

hữu ích cao nhằm mục đích đảm bảo cho chủ sở hữu CSDL che giấu được

thông tin nhạy cảm khi thực hiện chia sẻ CSDL ra bên ngoài hoặc cho các

đối tác. Cụ thể hơn, luận án nhằm hướng đến hai mục tiêu chính sau:

- Thứ nhất, nghiên cứu và đề xuất các thuật toán ẩn tập mục hữu ích cao

nhạy cảm và luật kết hợp hữu ích cao nhạy cảm dựa trên kỹ thuật heuristic.

- Thứ hai, nghiên cứu và áp dụng lý thuyết Giàn để giảm hiệu ứng phụ

trong quá trình che giấu thông tin nhạy cảm trong khai phá hữu ích cao.

3. Đối tượng và phạm vi nghiên cứu

3.1. Đối tượng nghiên cứu của luận án gồm:

- Về cơ sở dữ liệu cần thực hiện che giấu thông tin nhạy cảm: CSDL

giao tác.

- Về thuật toán, gồm: Ẩn tập mục hữu ích cao nhạy cảm; ẩn tập mục hữu

ích trung bình cao nhạy cảm; ẩn tập mục hữu ích cao và phổ biến nhạy cảm;

ẩn luật kết hợp hữu ích cao nhạy cảm.

- Về cơ sở toán học: Giàn giao của tập hợp.

3.2. Phạm vi nghiên cứu của luận án:

- Thứ nhất, nghiên cứu tổng quan về khai phá hữu ích cao và che giấu

thông tin nhạy cảm trong khai phá hữu ích cao từ CSDL giao tác dựa trên

kỹ thuật heuristic để xác định các hạn chế của các thuật toán hiện tại, các

vấn đề hiện nay chưa được đề xuất và giải quyết.

- Thứ hai, dựa trên các kết quả phân tích tổng quan khai phá hữu ích cao

và che giấu thông tin nhạy cảm trong khai phá hữu ích cao dựa trên kỹ thuật

heuristic, đề xuất một số thuật toán cải tiến:

+ Đề xuất thuật toán cải tiến ẩn tập mục hữu ích cao nhạy cảm và thuật

toán ẩn tập mục hữu ích cao và phổ biến nhạy cảm.

+ Đề xuất mô hình và thuật toán ẩn tập mục hữu ích trung bình cao nhạy

cảm, ẩn luật kết hợp hữu ích cao nhạy cảm.

- Thứ ba, áp dụng các tính chất của lý thuyết Giàn để chọn mục mục tiêu

hiệu quả nhằm giảm hiệu ứng phụ của quá trình sửa dữ liệu để ẩn thông tin

nhạy cảm, cụ thể: Xây dựng giàn giao có ràng buộc của tập các tập mục

Tài liệu liên quan

Giải pháp đảm bảo an toàn thông tin cho học liên kết dựa trên mật mã: Tóm tắt Luận án Tiến sĩ Nghiên cứu xây dựng

Tóm tắt Luận án Tiến sĩ: Nghiên cứu xây dựng giải pháp đảm bảo an toàn thông tin cho quá trình học liên kết dựa trên mật mã

Giải pháp bảo mật lớp vật lý trong hệ thống thông tin quang không dây dưới nước: Luận án Tiến sĩ

Luận án Tiến sĩ: Nghiên cứu giải pháp bảo mật lớp vật lý trong hệ thống thông tin quang không dây dưới nước

Nghiên cứu phát triển hệ mật mã khóa công khai dựa trên bài toán logarit rời rạc và phân tích số: Tóm tắt Luận án Tiến sĩ Toán học

Tóm tắt Luận án Tiến sĩ Toán học: Nghiên cứu phát triển hệ mật mã khóa công khai dựa trên bài toán logarit rời rạc và phân tích số

Ứng dụng lý thuyết độ tin cậy trong phân tích an toàn công trình kè bảo vệ bờ sông Nam bộ: Tóm tắt Luận án Tiến sĩ Kỹ thuật

Tóm tắt Luận án Tiến sĩ Kỹ thuật: Ứng dụng lý thuyết độ tin cậy trong phân tích an toàn công trình kè bảo vệ bờ sông Nam bộ

Phân tích an toàn công trình kè bảo vệ bờ sông Nam bộ: Ứng dụng lý thuyết độ tin cậy (Luận án Tiến sĩ Kỹ thuật)

Luận án Tiến sĩ Kỹ thuật: Ứng dụng lý thuyết độ tin cậy trong phân tích an toàn công trình kè bảo vệ bờ sông Nam bộ

Pháp luật bảo vệ dữ liệu cá nhân trên Internet: Tóm tắt luận văn Thạc sĩ Luật kinh tế

Tóm tắt Luận văn Thạc sĩ Luật kinh tế: Pháp luật về bảo vệ dữ liệu cá nhân trên môi trường internet

Đề án Thạc sĩ Luật Kinh Tế: Pháp luật Bảo Vệ Dữ Liệu Cá Nhân Trên Môi Trường Internet

Đề án Thạc sĩ Luật kinh tế: Pháp luật về bảo vệ dữ liệu cá nhân trên môi trường internet

Thuật toán bảo mật IoT: Luận án Tiến sĩ Toán học về nghiên cứu và phát triển nâng cao

Luận án Tiến sĩ Toán học: Nghiên cứu, phát triển một số thuật toán nâng cao khả năng bảo mật cho các thiết bị trong mạng IoT

Nâng cao chất lượng công tác hành chính – an ninh: Tóm tắt luận văn Thạc sĩ Quản lý công tại Học viện Kỹ thuật mật mã giai đoạn 2024-2030

Tóm tắt Luận văn Thạc sĩ Quản lý công: Nâng cao chất lượng công tác hành chính – an ninh tại Học viện Kỹ thuật mật mã giai đoạn 2024-2030

Đề án tốt nghiệp Quản lý công: Giải pháp nâng cao chất lượng công tác hành chính – an ninh tại Học viện Kỹ thuật mật mã giai đoạn 2024-2030

Đề án tốt nghiệp Quản lý công: Nâng cao chất lượng công tác hành chính – an ninh tại Học viện Kỹ thuật mật mã giai đoạn 2024-2030

Tài liêu mới

Phát triển du lịch nông nghiệp bền vững tại tỉnh Thái Nguyên: Luận án Tiến sĩ

Luận án Tiến sĩ: Phát triển du lịch nông nghiệp bền vững tại tỉnh Thái Nguyên

Các yếu tố ảnh hưởng đến hành vi ứng dụng Digital Marketing của doanh nghiệp khởi nghiệp ở Việt Nam: Luận án Tiến sĩ

Luận án Tiến sĩ: Các yếu tố ảnh hưởng đến hành vi ứng dụng Digital Marketing của các doanh nghiệp khởi nghiệp ở Việt Nam

Bài toán xác định tham số nguồn đối với phương trình dưới khuếch tán nửa tuyến tính: Luận án Tiến sĩ

Luận án Tiến sĩ: Bài toán xác định tham số nguồn đối với một số lớp phương trình dưới khuếch tán nửa tuyến tính

Bài toán xác định tham số nguồn đối với phương trình dưới khuếch tán nửa tuyến tính: Tóm tắt Luận án Tiến sĩ

Tóm tắt Luận án Tiến sĩ: Bài toán xác định tham số nguồn đối với một số lớp phương trình dưới khuếch tán nửa tuyến tính

Năng lực đổi mới sáng tạo của doanh nghiệp chế biến thực phẩm Việt Nam: Tóm tắt luận án Tiến sĩ

Tóm tắt Luận án Tiến sĩ: Năng lực đổi mới sáng tạo của doanh nghiệp ngành chế biến thực phẩm Việt Nam

Năng lực đổi mới sáng tạo của doanh nghiệp ngành chế biến thực phẩm Việt Nam: Luận án Tiến sĩ

Luận án Tiến sĩ: Năng lực đổi mới sáng tạo của doanh nghiệp ngành chế biến thực phẩm Việt Nam

Đánh giá hiệu năng đường truyền trong mạng 5G NR: Tóm tắt đề án tốt nghiệp Thạc sĩ

Tóm tắt Đề án tốt nghiệp Thạc sĩ: Đánh giá hiệu năng đường truyền trong mạng 5G NR

Giải pháp VXLAN trong trung tâm dữ liệu: Tóm tắt đề án tốt nghiệp Thạc sĩ Nghiên cứu

Tóm tắt Đề án tốt nghiệp Thạc sĩ: Nghiên cứu giải pháp VXLAN trong các trung tâm dữ liệu

Tóm tắt Đề án tốt nghiệp Thạc sĩ: Nghiên cứu và đánh giá giải pháp quản lý truy cập đặc quyền CyberArk

Nhận diện cảm xúc trong văn bản tiếng Việt bằng mô hình học sâu: Đề án tốt nghiệp Thạc sĩ

Đề án tốt nghiệp Thạc sĩ: Nhận diện cảm xúc trong văn bản tiếng Việt bằng mô hình học sâu

Đề án tốt nghiệp: Nghiên cứu, thiết kế hệ thống điều khiển động cơ PMSM không cảm biến tốc độ, tựa hướng từ thông rotor (FOC)

Đề án tốt nghiệp Thạc sĩ: Nghiên cứu, thiết kế hệ thống điều khiển động cơ PMSM không sử dụng cảm biến tốc độ dựa trên phương pháp điều khiển tựa hướng từ thông rotor (FOC)

Tóm tắt Luận án Tiến sĩ Kỹ thuật: Nghiên cứu và phát triển một số kỹ thuật che giấu thông tin nhạy cảm trong khai phá hữu ích cao

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi