Luận án Tiến sĩ Máy tính: Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định
lượt xem 7
download
Luận án nghiên cứu với mục tiêu là xuất phát từ những tồn tại và hạn chế của các công bố về tập mờ phức và hệ suy diễn dựa trên tập mờ phức thì luận án tập trung nghiên cứu tìm hiểu và áp dụng hệ suy diễn mờ phức đối với bài toán hệ hỗ trợ ra quyết định với dữ liệu có yếu tố thời gian.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Luận án Tiến sĩ Máy tính: Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định
- VIỆN HÀN LÂM KHOA HỌC VÀ BỘ GIÁO DỤC VÀ ĐÀO TẠO CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ LƯƠNG THỊ HỒNG LAN MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Hà Nội - 2021
- VIỆN HÀN LÂM KHOA HỌC VÀ BỘ GIÁO DỤC VÀ ĐÀO TẠO CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ LƯƠNG THỊ HỒNG LAN MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH Chuyên ngành: Khoa học máy tính Mã số: 9.48.01.01 LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. PGS.TS Lê Hoàng Sơn 2. PGS.TS Nguyễn Long Giang Hà Nội - 2021
- LỜI CAM ĐOAN Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả, được hoàn thành dưới sự hướng dẫn của PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long Giang. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định. Hà Nội, ngày 19 tháng 06 năm 2021 Tác giả luận án Lương Thị Hồng Lan
- LỜI CẢM ƠN Luận án này được hoàn thành với sự nỗ lực không ngừng của tác giả và sự giúp đỡ hết mình từ các thầy giáo hướng dẫn, bạn bè và người thân. Đầu tiên, tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các thầy giáo hướng dẫn PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long Giang. Sự tận tình chỉ bảo, hướng dẫn và động viên của các thầy dành cho tác giả suốt thời gian thực hiện luận án là không thể nào kể hết được. Tác giả xin gửi lời cảm ơn tới các thầy, cô giáo và cán bộ của bộ phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ (Viện Hàn lâm Khoa học và Công nghệ Việt Nam), bộ phận quản lý nghiên cứu sinh của Viện Công nghệ thông tin đã nhiệt tình giúp đỡ và tạo ra môi trường nghiên cứu tốt để tác giả hoàn thành công trình của mình. Tác giả xin chân thành cảm ơn các anh chị em trong Lab Tại Viện Công nghệ thông tin - Đại học Quốc gia Hà Nội đã giúp đỡ tác giả trong suốt quá trình học tập và nghiên cứu tại Lab. Tác giả xin chân thành cảm ơn tới Ban Giám hiệu trường Đại học Sư phạm, Đại học Thái Nguyên, các đồng nghiệp khoa Toán, nơi tác giả đã công tác những năm đầu nghiên cứu sinh; và Ban Giám hiệu trường Đại học Thủy Lợi Hà Nội, các đồng nghiệp khoa Công nghệ thông tin, nơi tác giả hiện đang công tác đều đã luôn động viên, giúp đỡ tác giả trong công tác để tác giả có thời gian tập trung nghiên cứu và hoàn thành luận án đúng thời hạn. Đặc biệt tác giả xin bày tỏ lòng biết ơn sâu sắc tới Bố, Mẹ, các em trong gia đình, những người luôn dành cho những tình cảm nồng ấm và sẻ chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tôi trong quá trình nghiên cứu. Cảm ơn con gái luôn ngoan ngoãn và ủng hộ để mẹ tập trung nghiên cứu, hoàn thành luận án. Luận án cũng là món quà tinh thần mà tôi trân trọng gửi tặng đến các thành viên trong Gia đình. Tôi xin trân trọng cảm ơn! Hà Nội, ngày 19 tháng 06 năm 2021 Người thực hiện Lương Thị Hồng Lan
- i MỤC LỤC Danh mục các bảng vi Danh mục các hình vẽ, đồ thị vii MỞ ĐẦU 1 Chương 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT 9 1.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2 Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . . 9 1.3 Tổng quan các nghiên cứu liên quan . . . . . . . . . . . . . . . . . . . 10 1.3.1 Hệ suy diễn mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.3.2 Các hệ phát triển dựa trên tập mờ phức . . . . . . . . . . . . . 14 1.3.3 Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay . . 19 1.4 Cơ sở lý thuyết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.4.1 Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.2 Tập mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.3 Các phép toán trên tập mờ phức . . . . . . . . . . . . . . . . . . 24 1.4.4 Logic mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.4.5 Độ đo mờ và độ đo mờ phức . . . . . . . . . . . . . . . . . . . . 28 1.5 Dữ liệu thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 1.5.1 Bộ dữ liệu chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . 30 1.5.2 Bộ dữ liệu thực- Bệnh gan Liver . . . . . . . . . . . . . . . . . . 31 1.5.3 Các độ đo đánh giá thực nghiệm . . . . . . . . . . . . . . . . . 32 1.6 Kết Chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
- ii Chương 2. XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI (M-CFIS) 34 2.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.2 Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức . . . . . . . . . . . . . 36 2.2.1 Toán tử t-chuẩn và t-đối chuẩn . . . . . . . . . . . . . . . . . . 37 2.2.2 Toán tử t-chuẩn và t-đối chuẩn mờ phức . . . . . . . . . . . . . 38 2.2.3 Ví dụ minh họa hỗ trợ ra quyết định . . . . . . . . . . . . . . . . 41 2.3 Hệ suy diễn mờ phức Mamdani (M-CFIS) . . . . . . . . . . . . . . . . 44 2.3.1 Đề xuất hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . . 44 2.3.2 Các lựa chọn sử dụng trong hệ suy diễn mờ phức Mamdani . . 45 2.3.3 Cấu trúc của hệ suy diễn mờ phức Mamdani . . . . . . . . . . 47 2.3.4 Ví dụ số minh họa mô hình suy diễn M-CFIS . . . . . . . . . . . 49 2.3.5 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . 51 2.4 Kết Chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Chương 3. TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC MAMDANI (M-CFIS-R) 55 3.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.2 Đề xuất độ đo tương tự mờ phức . . . . . . . . . . . . . . . . . . . . . 60 3.2.1 Độ đo tương tự mờ phức Cosine . . . . . . . . . . . . . . . . . . 61 3.2.2 Độ đo tương tự mờ phức Dice . . . . . . . . . . . . . . . . . . . 62 3.2.3 Độ đo tương tự mờ phức Jaccard . . . . . . . . . . . . . . . . . 63 3.3 Đề xuất mô hình hệ suy diễn M-CFIS-R . . . . . . . . . . . . . . . . . 64 3.3.1 Ý tưởng xây dựng mô hình . . . . . . . . . . . . . . . . . . . . . 64 3.3.2 Phần Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.3.3 Phần Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.4 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . . 71 3.4.1 Kết quả thực nghiệm trên bộ dữ liệu UCI . . . . . . . . . . . . . 71 3.4.2 Kết quả thực nghiệm trên bộ dữ liệu thực . . . . . . . . . . . . . 73
- iii 3.5 Kết Chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 Chương 4. MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ THỊ TRI THỨC (M-CFIS-FKG) 77 4.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 4.2 Một số mở rộng của mô hình M-CFIS-R . . . . . . . . . . . . . . . . . 79 4.2.1 Hệ suy diễn mờ phức Sugeno và Tsukamoto . . . . . . . . . . . 79 4.2.2 Độ đo mờ phức dựa trên lý thuyết tập hợp . . . . . . . . . . . . 80 4.2.3 Tích phân mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . 86 4.3 Đề xuất mô hình hệ suy diễn mờ phức M-CFIS-FKG . . . . . . . . . . 93 4.3.1 Ý tưởng xây dựng mô hình . . . . . . . . . . . . . . . . . . . . . 93 4.3.2 Xây dựng đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . 95 4.3.3 Thuật toán suy diễn nhanh trên đồ thị tri thức mờ . . . . . . . . 96 4.3.4 Ví dụ minh họa hệ suy diễn mờ phức M-CFIS-FKG . . . . . . . 98 4.4 Thực nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . 103 4.4.1 Thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.4.2 Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 104 4.5 Kết Chương 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 114 Những kết quả chính của luận án . . . . . . . . . . . . . . . . . . . . . . . . 114 Hướng phát triển của luận án . . . . . . . . . . . . . . . . . . . . . . . . . . 116 TÀI LIỆU THAM KHẢO 119
- iv Kí hiệu và viết tắt STT Từ tắt Tiếng anh Diễn dải 1 FS Fuzzy Set Tập mờ 2 CFS Complex Fuzzy Set Tập mờ phức 3 CFL Complex Fuzzy Logic Logic mờ phức 4 FIS Fuzzy Inference System Hệ suy diễn Complex Fuzzy Inference 5 CFIS Hệ suy diễn mờ phức System Intituition Fuzzy Inference 6 IFIS Hệ suy diễn mờ trực cảm System Adaptive Neuro Fuzzy Hệ suy diễn mờ noron thích 7 ANFIS Inference System nghi Complex Neuro-Fuzzy Hệ suy diễn mờ noron thích 8 CANFIS Inference System nghi phức Adaptive Neuro Complex Mạng noron giá trị mờ phức 9 ANCFIS Fuzzy Inference System thích nghi 10 CNS Complex Neutrosophic Set Tập Neutrosophic phức Multicriteria decision Hệ hỗ trợ ra quyết định đa tiêu 11 MCDM making chí Fast Inference Search Thuật toán tìm kiếm suy diễn 12 FISA Algorithm nhanh 13 KG Knowledge Graph Đồ thị tri thức 14 FKG Fuzzy Knowledge Graph Đồ thị tri thức mờ Mamdani Fuzzy Inference 15 M-FIS Hệ suy diễn mờ Mamdani System Mamdani Complex Fuzzy Hệ suy diễn mờ phức 16 M-CFIS Inference System Mamdani Mamdani Complex Fuzzy Hệ suy diễn mờ phức 17 M-CFIS-R Inference System Reduce Mamdani - giảm luật Rule
- v Mamdani Complex Fuzzy M-CFIS- Hệ suy diễn mờ phức 18 Inference System Fuzzy- FKG Mamdani - Đồ thị tri thức mờ Knowledge Graph 19 GRC Granular Computing Tính toán hạt 20 UCI UC Irvine Machine Kho dữ liệu chuẩn UCI Randomized Adaptive- Mạng nơ ron giá trị mờ phức 21 RANCFIS Network Based Fuzzy thích nghi ngẫu nhiên Inference System Fast Adaptive-Network Mạng nơ ron giá trị mờ phức 22 FANCFIS Based Fuzzy Inference thích nghi nhanh System
- vi Danh mục các bảng 1.1 Các bộ dữ liệu thực nghiệm chuẩn Benchmark . . . . . . . . . . . . . . 31 1.2 Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan Liver . . . . 32 2.1 Ma trận ra quyết định dựa trên các mẫu dữ liệu . . . . . . . . . . . . . 42 2.2 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.3 Ma trận chuẩn hóa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.4 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.5 Ma trận quyết định kết quả . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.6 Bộ dữ liệu đầu vào . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 2.7 Bộ cơ sở luật . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 4.1 Hệ cơ sở luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 4.2 Kịch bản 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.3 Kịch bản 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
- vii Danh mục các hình vẽ, đồ thị 1 Cấu trúc luận án . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.1 Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . . . . . . 10 1.2 Sơ đồ tổng quan của hệ suy diễn mờ . . . . . . . . . . . . . . . . . . . 11 1.3 Hệ thống suy diễn Mamdani với hai đầu vào và hai luật . . . . . . . . . 12 1.4 Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật . . . . . . . 13 1.5 Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật . . . . . . . . . 14 1.6 Hệ thống logic mờ do Ramot đề xuất . . . . . . . . . . . . . . . . . . . 15 1.7 Kiến trúc của hệ thống CANFIS . . . . . . . . . . . . . . . . . . . . . . 17 1.8 Biểu diễn của hàm thuộc mờ phức . . . . . . . . . . . . . . . . . . . . 22 2.1 Mô hình hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . . . . . 45 2.2 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu WBCD . . . . . . . 52 2.3 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu Diebetes . . . . . . 52 2.4 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu thực Liver . . . . . . 53 3.1 Giai đoạn Training của mô hình đề xuất . . . . . . . . . . . . . . . . . 66 3.2 Giai đoạn Testing của mô hình M-CFIS-R đề xuất . . . . . . . . . . . . 71 3.3 Kết quả thực nghiệm trên bộ dữ liệu WBCD . . . . . . . . . . . . . . . 72 3.4 Kết quả thực nghiệm trên bộ dữ liệu Diebetes . . . . . . . . . . . . . . 73 3.5 Kết quả thực nghiệm trên bộ dữ liệu thực Liver . . . . . . . . . . . . . 74 4.1 Quá trình Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 4.2 Quá trình Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 4.3 Biểu diễn của luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . . 96
- viii 4.4 Đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.5 Đồ thị FKG cho sáu luật . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.6 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có 2 nhãn . . . . . . 104 4.7 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có nhiều nhãn . . . . 105 4.8 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu WBCD . 106 4.9 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Diebetes 107 4.10 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Liver . . 108 4.11 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Wine . . 109 4.12 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu CTG . . 110 4.13 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Arrhythmia111
- 1 MỞ ĐẦU Mở đầu Ra quyết định là một phần vô cùng quan trọng trong cuộc sống, do đó gần đây rất nhiều nhà nghiên cứu đã đưa ra nhiều hướng tiếp cận khác nhau để giải quyết, hỗ trợ quá trình ra quyết định như tiếp cận mờ, mô hình giá trị độ đo... Quá trình hỗ trợ ra quyết định chủ yếu tập trung vào việc đưa ra những phương pháp, cách thức để có thể hỗ trợ đưa ra quyết định cuối cùng một cách đúng đắn nhất, nhất là đối với môi trường dữ liệu ngày càng nhiều biến động, dữ liệu không chắc chắn, không xác định rõ ràng. Tập mờ (Fuzzy Set-FS) được Zadel đề xuất năm 1965 [1] được coi là một trong những công cụ hữu hiệu để giải quyết các bài toán mà có dữ liệu không chắc chắn, không xác định rõ ràng. Rất nhiều những nghiên cứu mở rộng của FS đã được giới thiệu trong vài năm gần đây [2, 3, 4, 5, 6] và được ứng dụng nhiều trong bài toán hệ hỗ trợ ra quyết định. Một trong những kĩ thuật quan trọng dựa trên lý thuyết FS và ứng dụng trong việc giải quyết các bài toán của hệ hỗ trợ ra quyết định là Hệ suy diễn mờ (Fuzzy Inference System - FIS). FIS hiện đã và đang được ứng dụng rộng rãi trong nhiều bài toán phân loại/dự báo và các bài toán của hệ hỗ trợ ra quyết định như lựa chọn nhân sự, lựa chọn nhà cung cấp, hỗ trợ ra chiến lược phát triển công ty... Bên cạnh đó, trong một vài ứng dụng khác thì hệ FIS được sử dụng để tạo ra một tập hợp các luật mờ nhằm mục đích phát hiện, dự báo hoặc phân loại các đối tượng như phát hiện ung thư phổi, phát hiện bệnh đái tháo đường, dự đoán bị bệnh tim ... [7, 8, 9, 10, 11, 12, 13]. Một phiên bản mở rộng của FIS nhúng vào mạng nơ ron và kết hợp với học dựa trên phương pháp gradient có tên gọi là Hệ suy diễn mờ nơ ron thích nghi (ANFIS) [14] và cho kết quả tốt trong vấn đề dự báo bệnh mạch vành, ước tính sự tăng cường độ dẫn nhiệt của kim loại và oxit kim loại ... [15, 16, 17, 18]. Ngoài ra, ANFIS còn được kết hợp với các mô hình học máy khác như thuật toán tối ưu hóa bầy đàn và áp
- 2 dụng đối với các bài toán trong hệ hỗ trợ ra quyết định [19, 20, 21]. Bên cạnh đó, nhiều phiên bản khác nhau của hệ FIS trên các tập mờ mở rộng áp dụng đối với bài toán hỗ trợ ra quyết định cũng đã và đang được nghiên cứu rộng rãi. Ví dụ như hệ suy diễn mờ trực cảm (IFIS) được sử dụng trong hồi quy và ứng dụng hỗ trợ dự báo phá sản của doanh nghiệp [22, 23, 24, 25, 25, 26, 27]. Một số nghiên cứu kết hợp giữa hệ suy diễn mờ bức tranh (PFS) với thuật toán phân cụm mờ bức tranh và độ đo mờ bức tranh được ứng dụng trong việc giải quyết một số vấn đề ra quyết định như dự báo thời tiết, dự báo giá cổ phiếu và phân đoạn hình ảnh [28, 29, 30, 31, 32, 33, 34, 35]. Gần đây, cùng với sự gia tăng của các vấn đề ra quyết định dựa trên các dữ liệu có sự thay đổi về thời gian hay các dữ liệu có yếu tố chu kì, định kì thì khái niệm tập mờ phức (CFS) [36] ra đời với hàm thuộc bao gồm cả thành phần biên độ và thành phần pha để biểu diễn, mô tả các dữ liệu có yếu tố chu kì, định kì hay các dữ liệu có sự thay đổi về thời gian. CFS được áp dụng trong nhiều nghiên cứu, tập trung chủ yếu vào các vấn đề như các toán tử tổng hợp mờ phức, thông tin mềm mờ phức, độ đo khoảng cách mờ phức và mạng các khái niệm mờ phức [37, 38, 39, 40, 41, 42, 43]. Ưu điểm của CFS là khả năng mô hình hóa các hiện tượng và sự kiện theo thời gian, theo giai đoạn để từ đó có thể cho thấy tổng thể chúng trong một ngữ cảnh nhất định. Ví dụ như để xác nhận chẩn đoán huyết áp của bệnh nhân là “cao” hay “thấp” thì một bệnh nhân được đo 30 lần rồi ghi lại giá trị tương ứng với mỗi lần đo, sau đó giá trị trung bình và phương sai được tính toán đối với giá trị huyết áp đo được. Từ đó huyết áp của bệnh nhân có thể tính được dễ dàng bằng cách lấy giá trị trung bình và phương sai của các lần đo (sử dụng ý nghĩa của mờ hóa của hệ FIS trên tập CFS), ví dụ như là huyết áp thấp với giá trị trung bình và phương sai cho giá trị nhỏ. Còn nếu như huyết áp chỉ đo tại một thời điểm và đưa ra quyết định thì có thể dẫn đến quyết định về huyết áp của bệnh nhân không chính xác. Một ví dụ khác về vấn đề chẩn đoán bệnh: nếu chỉ dựa vào các giá trị thuộc tính bệnh mà không xét tới các thuộc tính khác thì làm cho kết quả chẩn đoán không được chính xác, do kết luận bệnh không chỉ phụ thuộc vào mỗi một giá trị thuộc tính
- 3 bệnh mà còn cần phải xét tới các yếu tố liên quan tới bệnh đó. Hơn nữa, cũng có nhiều kịch bản, dữ liệu trong thực tế liên quan đến yếu tố pha, trong dữ liệu có xu hướng tuần hoàn, chẳng hạn như lượng mưa được ghi lại trong một vùng hoặc sóng âm thanh do một nhạc cụ tạo ra. Do đó, hiển nhiên rằng số phức cũng phải có một vị trí trong hệ thống suy luận mờ. Đây cũng là động cơ chính của luận án này. Hệ suy diễn mờ phức được coi là một công cụ hiệu quả đối với việc giải quyết các vấn đề không chắc chắn và có yếu tố định kỳ, chu kì. Hệ suy diễn mờ phức đầu tiên được giới thiệu Ramot [44] được gọi là Hệ logic mờ phức được phát triển từ hệ thống logic mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến đổi phức tương ứng của nó. Một nghiên cứu khác bởi Man và cộng sự [45] dựa trên sự kết hợp giữa phương pháp học quy nạp với hệ suy diễn trong tập phức. Một phiên bản học nhúng khác với mạng mờ nơ ron trên tập CFS với tên gọi Hệ thống suy diễn mờ phức nơ ron thích nghi (ANCFIS) được giới thiệu bởi Chen và công sự [46]. Sau đó 2 cải tiến của ANCFIS với mục đích làm gia tăng tốc độ tính toán được đưa ra trong [47, 48]. Mặc dù nhiều hệ thống suy diễn phát triển dựa trên tập mờ phức đã được nghiên cứu và ứng dụng nhưng các hệ thống đã có đều chưa thực sự đúng với ý nghĩa của hệ thống suy diễn mờ phức thực sự. Hầu hết các hệ thống đều sử dụng tập mờ phức làm biến đầu vào nhưng các nghiên cứu đều chỉ sử dụng thành phần biên độ trong quá trình ra quyết định mà bỏ qua thành phần pha. Ví dụ như hệ logic mờ phức của Ramot thì bỏ qua thành phần pha trong giải mờ kết quả đầu ra, làm cho hệ thống không đủ yếu tố khi xử lý với dữ liệu có yếu tố lặp lại hoặc dữ liệu xảy ra định kì, và điều này làm giảm đi ý nghĩa của mô hình hệ suy diễn mờ phức, trở thành hệ suy diễn mờ thường. Còn mô hình ANCFIS của Man và Chen [46] thì sử dụng phép tích vô hướng vec tơ cho quá trình tổng hợp kết quả, và coi các giá trị đầu vào phức như là các giá trị thực. Do đó, hệ thống ANCFIS không thực sự là hệ thống phức khi đầu ra của hệ thống không thể đại diện cho tính tuần hoàn của các thành phần trong đó. Khi xử lý đối với dữ liệu có yếu tố chu kì, định kì, dữ liệu có yếu tố thay đổi theo thời gian thì các hệ FIS, ANFIS hay các hệ phát triển trên tập mờ phức đều đưa
- 4 ra hai phương thức xử lý chung: (1) Bỏ qua thông tin liên quan đến yếu tố thành phần pha; (2) Biểu diễn thành phần biên độ và pha riêng biệt với nhau thành 2 thành phần riêng biệt bằng cách sử dụng 2 tập mờ. Điều này sẽ làm cho thông tin bị mất mát và kết quả thu được không có độ tin cậy cao (nếu các thông tin về thành phần pha bị bỏ qua), làm sai lệch thông tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và pha được xử lý riêng biệt), thời gian tính toán sẽ tăng thêm do số lượng các bộ cần được xử lý tăng thêm. Thêm nữa, các nghiên cứu đã có hệ suy diễn dựa trên lý thuyết tập mờ phức vẫn còn tồn tại một số hạn chế như sau: • Các hệ suy diễn mờ phức chưa đưa ra được quy trình tổng thể xây dựng hệ suy diễn mờ phức cho hệ hỗ trợ ra quyết định. • Các hệ luật trong các hệ suy diễn mờ phức đã có chỉ sinh ra dựa trên kinh nghiệm, dựa trên tư duy logic suy diễn mà chưa đề cập đến vấn đề tối ưu, tinh giảm hệ luật suy diễn mờ phức. • Các hệ suy diễn chưa được nghiên cứu để áp dụng đối với bộ dữ liệu mới mà không có trong dữ liệu huấn luyện khi sinh mô hình suy diễn. • Các toán tử t-chuẩn và t-đối chuẩn mờ phức còn chưa được quan tâm nghiên cứu tìm hiểu và ứng dụng trong hệ hỗ trợ ra quyết định. Mục tiêu nghiên cứu của luận án Xuất phát từ những tồn tại và hạn chế của các công bố về tập mờ phức và hệ suy diễn dựa trên tập mờ phức thì luận án tập trung nghiên cứu tìm hiểu và áp dụng hệ suy diễn mờ phức đối với bài toán hệ hỗ trợ ra quyết định với dữ liệu có yếu tố thời gian , cụ thể như sau: • Nghiên cứu lý thuyết về tập mờ phức, logic mờ phức, các độ đo dựa trên tập mờ phức. • Nghiên cứu và phát triển các hệ suy diễn dựa trên tập mờ phức.
- 5 • Nghiên cứu các kĩ thuật để giảm luật mờ trong hệ suy diễn mờ phức. • Nghiên cứu đồ thị tri thức mờ trong biểu diễn luật mờ để giảm thời gian tính toán suy diễn đối với tập testing và xử lí suy diễn khi có một tập dữ liệu mới mà không có sẵn trong tập dữ liệu huấn luyện. Xuất phát từ mục tiêu nghiên cứu, phạm vi nghiên cứu của luận án tập trung nghiên cứu một số các vấn đề sau: • Nghiên cứu lý thuyết về tập mờ phức, các phép toán và hệ suy diễn dựa trên tập mờ phức • Luận án chỉ nghiên cứu và thử nghiệm các bài toán hệ hỗ trợ ra quyết định với dữ liệu có yếu tố thời gian. Với mục tiêu đặt ra như trên, luận án đạt được một số kết quả chính như sau: • Đề xuất hệ suy diễn mờ phức theo mô hình Mamdani: Dựa trên mô hình hệ suy diễn mờ cổ điển Mamdani, luận án phát triển mô hình suy diễn Mamdani trên tập mờ phức. Mô hình cấu trúc của hệ suy diễn mờ phức đề xuất cũng như các bước cụ thể trong hệ suy diễn mờ phức Mamdani cũng được đưa ra và áp dụng thực nghiệm mô hình suy diễn đối với với các bộ dữ liệuchuẩn UCI và dữ liệu thực. Thêm nữa, NCS cũng đề xuất các toán tử t-chuẩn, t-đối chuẩn mờ phức và ví dụ số với hệ hỗ trợ ra quyết định. Các đóng góp này được trình bày trong nội dung Chương 2 của luận án. • Đề xuất các độ đo tương tự dựa trên tập mờ phức, kết hợp giữa độ đo tương tự mờ phức và tính toán hạt để giải quyết vấn đề tinh giảm hệ luật trong mô hình suy diễn mờ phức Mamdani. Cải tiến mô hình hệ suy diễn mờ phức Mamdani ở Chương 2 và xây dựng hệ suy diễn mờ phức M-CFIS-R. Các đóng góp này được trình bày chi tiết trong Chương 3 của luận án. • Đề xuất mở rộng hệ suy diễn mờ phức theo mô hình Sugeno và Tsukamoto và các độ đo mờ phức, tích phân mờ phức dựa trên lý thuyết tập hợp. Nghiên cứu
- 6 cách biểu diễn luật mờ dựa trên đồ thị tri thức và cải tiến mô hình hệ suy diễn mờ phức M-CFIS-R để đưa ra mô hình M-CFIS-FKG. Thực nghiệm trên các bộ dữ liệu cũng chứng minh hiệu quả về thời gian tính toán của mô hình và suy diễn trong trường hợp bộ dữ liệu kiểm tra không có trong bộ dữ liệu huấn luyện Đối tượng nghiên cứu của luận án là các hệ suy diễn theo tiếp cận tập mờ phức, các phương pháp cải tiến hệ luật và biểu diễn hệ luật qua đồ thị tri thức. Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và nghiên cứu thực nghiệm. i) Nghiên cứu lý thuyết: Nghiên cứu tổng quan lý thuyết về tập mờ phức, các phép toán mờ phức t-chuẩn, t-đối chuẩn, các độ đo dựa trên tập mờ phức và các hệ suy diễn mờ phức đã công bố, phân tích ưu điểm, nhược điểm và các vấn đề còn tồn tại của các nghiên cứu liên quan. Trên cơ sở đó, đề xuất các phép toán, các độ đo tương tự, độ đo dựa trên lý thuyết tập hợp và các hệ suy diễn mờ phức theo mô hình Mamdani, Sugeno và Tsukamoto. Các đề xuất, cải tiến được chứng minh chặt chẽ về lý thuyết bởi các định lý, mệnh đề. ii) Nghiên cứu thực nghiệm: Các thuật toán đề xuất được cài đặt, chạy thử nghiệm, so sánh, đánh giá với các hệ suy diễn khác trên các bộ số liệu mẫu từ kho dữ liệu UCI và bộ dữ liệu thực tế tại Bệnh viện Gang thép Thái Nguyên nhằm minh chứng về tính hiệu quả của các nghiên cứu về lý thuyết. Cấu trúc của luận án Bố cục của luận án gồm bốn chương nội dung chính, phần Mở đầu, Kết luận và danh mục các tài liệu tham khảo. Phần Mở đầu trình bày tổng quan về vấn đề nghiên cứu, lý do chọn đề tài, đối tượng, mục tiêu và nội dung nghiên cứu của luận án. Phần Kết luận tổng kết những kết quả đã đạt được của luận án và hướng phát triển, hướng nghiên cứu trong tương lai. Các chương nội dung chính được tổ chức như trong Hình 1 cụ thể như sau: Chương đầu tiên NCS trình bày về các kiến thức tổng quan sử dụng trong luận án như các kiến thức nền tảng về tập mờ, tập mờ phức và hệ suy diễn dựa trên tập mờ và tập mờ phức. Thêm nữa các độ đo phát triển dựa trên tập mờ và tập
- 7 Hình 1: Cấu trúc luận án mờ phức cũng được trình bày trong chương mở đầu này. Từ các kiến thức nền đó mà chúng tôi đưa ra lí do để sử dụng hệ suy diễn mờ phức đối với việc giải quyết bài toán hỗ trợ ra quyết định có dữ liệu thay đổi theo thời gian. Các bộ dữ liệu thực nghiệm trong luận án cùng với các thước đo dùng để đánh giá thực nghiệm cũng được trình bày chi tiết trong chương đầu tiên này. Chương 2, dựa trên hệ suy diễn mờ cổ điển Mamdani, NCS phát triển hệ suy diễn Mamdani trên tập mờ phức và đồng thời cũng trình bày chi tiết các thành phần cũng như phép toán sử dụng trong mô hình đề xuất. Các phép toán t- chuẩn và t-đối chuẩn cũng được định nghĩa và ứng dụng trong bài toán hỗ trợ ra quyết định. Cuối chương là kết quả thực nghiệm và nhận xét so sánh của hệ suy diễn đã đề xuất trên các bộ dữ liệu thực nghiệm với hệ suy diễn mờ Mamdani. Vấn đề tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani là nội dung được đề cập và xem xét đến trong nội dung của chương 3. Xuất phát từ lý thuyết về tính toán hạt, NCS đề xuất ra các độ đo tương tự mờ phức và độ đo mờ phức kết hợp với tính toán hạt để thực hiện việc tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani
- 8 đã đề xuất ở chương 2 (hệ suy diễn mờ phức M-CFIS-R). Ví dụ số và thực nghiệm trên các bộ dữ liệu cũng đã được trình bày để chứng minh được tính hiệu quả của vấn đề giảm luật và tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani. Chương 4, NCS mở rộng mô hình M-CFIS-R sang hệ mờ Sugeno và Tsukamoto đồng thời đề xuất thêm độ đo mờ phức và tích phân mờ phức dựa trên lý thuyết tập hợp. Nếu trong Chương 3, NCS chỉ đi tập trung vào vấn đề giảm luật, tối ưu luật trong phần Training thì Chương 4 NCS lại tập trung vào cải tiến đối với bộ Testing bằng cách sử dụng lý thuyết về đồ thị tri thức mờ để biểu diễn luật và thực hiện suy luận xấp xỉ đối với những bản ghi không có trong bộ dữ liệu Training. Việc biểu diễn luật mờ phức bằng đồ thị tri thức mờ đã giảm khá nhiều thời gian tính toán của hệ suy diễn mờ phức M-CFIS-R.
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Luận án Tiến sĩ Máy tính: Nghiên cứu cải tiến một số mô hình học máy và học sâu áp dụng cho bài toán phân loại DGA Botnet
158 p | 17 | 9
-
Luận án Tiến sĩ Máy tính: Một số phương pháp nâng cao hiệu quả dự báo lan truyền thông tin trên mạng xã hội
107 p | 31 | 8
-
Luận án Tiến sĩ Máy tính: Nghiên cứu, phát triển phương pháp phát hiện và xử lý tấn công hố đen vào giao thức định tuyến RPL
117 p | 19 | 7
-
Luận án Tiến sĩ Máy tính: Nghiên cứu phương pháp phân loại dữ liệu đám mây điểm LiDAR và ứng dụng
350 p | 24 | 7
-
Luận án Tiến sĩ Máy tính: Nghiên cứu phương pháp chuẩn hoá văn bản và nhận dạng thực thể định danh trong nhận dạng tiếng nói tiếng Việt
124 p | 12 | 6
-
Luận án Tiến sĩ Máy tính: Nghiên cứu xây dựng hệ thống V-Sandbox trong phân tích và phát hiện mã độc IoT Botnet
139 p | 10 | 6
-
Luận án Tiến sĩ Máy tính: Nghiên cứu xây dựng hệ thống VSandbox trong phân tích và phát hiện mã độc IoT Botnet
139 p | 25 | 5
-
Luận án Tiến sĩ Máy tính: Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ
132 p | 24 | 5
-
Luận án Tiến sĩ Máy tính: Phương pháp gia tăng rút gọn thuộc tính trong bảng quyết định thay đổi theo tiếp cận tập thô mờ
133 p | 41 | 5
-
Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ
139 p | 14 | 4
-
Luận án Tiến sĩ Máy tính: Tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử
148 p | 24 | 4
-
Tóm tắt Luận án Tiến sĩ Máy tính: Nghiên cứu cải tiến một số mô hình học máy và học sâu áp dụng cho bài toán phân loại DGA Botnet
26 p | 10 | 3
-
Tóm tắt Luận án Tiến sĩ Máy tính: Một số kỹ thuật nâng cao hiệu quả tra cứu ảnh theo nội dung dựa trên độ đo khoảng cách thích nghi và phân cụm phổ
24 p | 10 | 2
-
Tóm tắt luận án Tiến sĩ Máy tính: Khai phá luật quyết định trên mô hình dữ liệu dạng khối
25 p | 17 | 2
-
Tóm tắt Luận án Tiến sĩ Máy tính: Phương pháp gia tăng rút gọn thuộc tính trong bảng quyết định thay đổi theo tiếp cận tập thô mờ
27 p | 19 | 2
-
Tóm tắt Luận án Tiến sĩ Máy tính: Nghiên cứu một số kỹ thuật phát hiện va chạm trong vật thể biến dạng và cánh tay cobot
27 p | 2 | 1
-
Luận án Tiến sĩ Máy tính: Nghiên cứu một số kỹ thuật phát hiện va chạm trong vật thể biến dạng và cánh tay cobot
114 p | 1 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn