VIỆN HÀN LÂM KHOA HỌC VÀ BỘ GIÁO DỤC VÀ ĐÀO TẠO CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
LƯƠNG THỊ HỒNG LAN
MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO
BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH
LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
Hà Nội - 2021
VIỆN HÀN LÂM KHOA HỌC VÀ BỘ GIÁO DỤC VÀ ĐÀO TẠO CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
LƯƠNG THỊ HỒNG LAN
MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH
Chuyên ngành: Khoa học máy tính
Mã số: 9.48.01.01
LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS Lê Hoàng Sơn
2. PGS.TS Nguyễn Long Giang
Hà Nội - 2021
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả, được hoàn thành dưới sự hướng dẫn của PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long Giang. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.
Hà Nội, ngày 19 tháng 06 năm 2021 Tác giả luận án
Lương Thị Hồng Lan
LỜI CẢM ƠN
Luận án này được hoàn thành với sự nỗ lực không ngừng của tác giả và sự giúp
đỡ hết mình từ các thầy giáo hướng dẫn, bạn bè và người thân.
Đầu tiên, tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các thầy giáo hướng dẫn PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long Giang. Sự tận tình chỉ bảo, hướng dẫn và động viên của các thầy dành cho tác giả suốt thời gian thực hiện luận án là không thể nào kể hết được.
Tác giả xin gửi lời cảm ơn tới các thầy, cô giáo và cán bộ của bộ phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ (Viện Hàn lâm Khoa học và Công nghệ Việt Nam), bộ phận quản lý nghiên cứu sinh của Viện Công nghệ thông tin đã nhiệt tình giúp đỡ và tạo ra môi trường nghiên cứu tốt để tác giả hoàn thành công trình của mình.
Tác giả xin chân thành cảm ơn các anh chị em trong Lab Tại Viện Công nghệ thông tin - Đại học Quốc gia Hà Nội đã giúp đỡ tác giả trong suốt quá trình học tập và nghiên cứu tại Lab.
Tác giả xin chân thành cảm ơn tới Ban Giám hiệu trường Đại học Sư phạm, Đại học Thái Nguyên, các đồng nghiệp khoa Toán, nơi tác giả đã công tác những năm đầu nghiên cứu sinh; và Ban Giám hiệu trường Đại học Thủy Lợi Hà Nội, các đồng nghiệp khoa Công nghệ thông tin, nơi tác giả hiện đang công tác đều đã luôn động viên, giúp đỡ tác giả trong công tác để tác giả có thời gian tập trung nghiên cứu và hoàn thành luận án đúng thời hạn.
Đặc biệt tác giả xin bày tỏ lòng biết ơn sâu sắc tới Bố, Mẹ, các em trong gia đình, những người luôn dành cho những tình cảm nồng ấm và sẻ chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tôi trong quá trình nghiên cứu. Cảm ơn con gái luôn ngoan ngoãn và ủng hộ để mẹ tập trung nghiên cứu, hoàn thành luận án. Luận án cũng là món quà tinh thần mà tôi trân trọng gửi tặng đến các thành viên trong Gia đình.
Tôi xin trân trọng cảm ơn!
Hà Nội, ngày 19 tháng 06 năm 2021
Người thực hiện
Lương Thị Hồng Lan
i
MỤC LỤC
Danh mục các bảng vi
Danh mục các hình vẽ, đồ thị vii
MỞ ĐẦU 1
Chương 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT 9
1.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . . 9
1.3 Tổng quan các nghiên cứu liên quan . . . . . . . . . . . . . . . . . . . 10
1.3.1 Hệ suy diễn mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Các hệ phát triển dựa trên tập mờ phức . . . . . . . . . . . . . 14
1.3.3 Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay . . 19
1.4 Cơ sở lý thuyết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.4.1 Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.4.2 Tập mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.4.3 Các phép toán trên tập mờ phức . . . . . . . . . . . . . . . . . . 24
1.4.4 Logic mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4.5 Độ đo mờ và độ đo mờ phức . . . . . . . . . . . . . . . . . . . . 28
1.5 Dữ liệu thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.5.1 Bộ dữ liệu chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.5.2 Bộ dữ liệu thực- Bệnh gan Liver . . . . . . . . . . . . . . . . . . 31
1.5.3 Các độ đo đánh giá thực nghiệm . . . . . . . . . . . . . . . . . 32
1.6 Kết Chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
ii
Chương 2. XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI
(M-CFIS) 34
2.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2 Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức . . . . . . . . . . . . . 36
2.2.1 Toán tử t-chuẩn và t-đối chuẩn . . . . . . . . . . . . . . . . . . 37
2.2.2 Toán tử t-chuẩn và t-đối chuẩn mờ phức . . . . . . . . . . . . . 38
2.2.3 Ví dụ minh họa hỗ trợ ra quyết định . . . . . . . . . . . . . . . . 41
2.3 Hệ suy diễn mờ phức Mamdani (M-CFIS) . . . . . . . . . . . . . . . . 44
2.3.1 Đề xuất hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . . 44
2.3.2 Các lựa chọn sử dụng trong hệ suy diễn mờ phức Mamdani . . 45
2.3.3 Cấu trúc của hệ suy diễn mờ phức Mamdani . . . . . . . . . . 47
2.3.4 Ví dụ số minh họa mô hình suy diễn M-CFIS . . . . . . . . . . . 49
2.3.5 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . 51
2.4 Kết Chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Chương 3. TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC
MAMDANI (M-CFIS-R) 55
3.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 Đề xuất độ đo tương tự mờ phức . . . . . . . . . . . . . . . . . . . . . 60
3.2.1 Độ đo tương tự mờ phức Cosine . . . . . . . . . . . . . . . . . . 61
3.2.2 Độ đo tương tự mờ phức Dice . . . . . . . . . . . . . . . . . . . 62
3.2.3 Độ đo tương tự mờ phức Jaccard . . . . . . . . . . . . . . . . . 63
3.3 Đề xuất mô hình hệ suy diễn M-CFIS-R . . . . . . . . . . . . . . . . . 64
3.3.1 Ý tưởng xây dựng mô hình . . . . . . . . . . . . . . . . . . . . . 64
3.3.2 Phần Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3.3 Phần Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.4 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . . 71
3.4.1 Kết quả thực nghiệm trên bộ dữ liệu UCI . . . . . . . . . . . . . 71
3.4.2 Kết quả thực nghiệm trên bộ dữ liệu thực . . . . . . . . . . . . . 73
iii
3.5 Kết Chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Chương 4. MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ
THỊ TRI THỨC (M-CFIS-FKG) 77
4.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2 Một số mở rộng của mô hình M-CFIS-R . . . . . . . . . . . . . . . . . 79
4.2.1 Hệ suy diễn mờ phức Sugeno và Tsukamoto . . . . . . . . . . . 79
4.2.2 Độ đo mờ phức dựa trên lý thuyết tập hợp . . . . . . . . . . . . 80
4.2.3 Tích phân mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.3 Đề xuất mô hình hệ suy diễn mờ phức M-CFIS-FKG . . . . . . . . . . 93
4.3.1 Ý tưởng xây dựng mô hình . . . . . . . . . . . . . . . . . . . . . 93
4.3.2 Xây dựng đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . 95
4.3.3 Thuật toán suy diễn nhanh trên đồ thị tri thức mờ . . . . . . . . 96
4.3.4 Ví dụ minh họa hệ suy diễn mờ phức M-CFIS-FKG . . . . . . . 98
4.4 Thực nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . 103
4.4.1 Thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.4.2 Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 104
4.5 Kết Chương 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 114
Những kết quả chính của luận án . . . . . . . . . . . . . . . . . . . . . . . . 114
Hướng phát triển của luận án . . . . . . . . . . . . . . . . . . . . . . . . . . 116
119 TÀI LIỆU THAM KHẢO
iv
Kí hiệu và viết tắt
STT 1 2 3 4 Từ tắt FS CFS CFL FIS Diễn dải Tập mờ Tập mờ phức Logic mờ phức Hệ suy diễn
5 CFIS Hệ suy diễn mờ phức
6 IFIS Hệ suy diễn mờ trực cảm
Fuzzy 7 ANFIS
Neuro-Fuzzy 8 CANFIS
9 ANCFIS Hệ suy diễn mờ noron thích nghi Hệ suy diễn mờ noron thích nghi phức Mạng noron giá trị mờ phức thích nghi
10 CNS
decision 11 MCDM
Inference Search 12 FISA
13 14 KG FKG Hệ hỗ trợ ra quyết định đa tiêu chí Thuật toán tìm kiếm suy diễn nhanh Đồ thị tri thức Đồ thị tri thức mờ
Hệ suy diễn mờ Mamdani 15 M-FIS
diễn mờ phức 16 M-CFIS suy Hệ Mamdani
diễn mờ suy phức 17 M-CFIS-R Hệ Mamdani - giảm luật Tiếng anh Fuzzy Set Complex Fuzzy Set Complex Fuzzy Logic Fuzzy Inference System Complex Fuzzy Inference System Intituition Fuzzy Inference System Adaptive Neuro Inference System Complex Inference System Adaptive Neuro Complex Fuzzy Inference System Complex Neutrosophic Set Tập Neutrosophic phức Multicriteria making Fast Algorithm Knowledge Graph Fuzzy Knowledge Graph Mamdani Fuzzy Inference System Mamdani Complex Fuzzy Inference System Mamdani Complex Fuzzy Inference System Reduce Rule
v
suy diễn mờ 18 M-CFIS- FKG Hệ phức Mamdani - Đồ thị tri thức mờ
19 20 GRC UCI Tính toán hạt Kho dữ liệu chuẩn UCI
21 RANCFIS Adaptive- Fuzzy Mạng nơ ron giá trị mờ phức thích nghi ngẫu nhiên
22 FANCFIS Adaptive-Network Inference Fuzzy Mạng nơ ron giá trị mờ phức thích nghi nhanh Mamdani Complex Fuzzy Inference System Fuzzy- Knowledge Graph Granular Computing UC Irvine Machine Randomized Network Based Inference System Fast Based System
vi
Danh mục các bảng
1.1 Các bộ dữ liệu thực nghiệm chuẩn Benchmark . . . . . . . . . . . . . . 31
1.2 Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan Liver . . . . 32
2.1 Ma trận ra quyết định dựa trên các mẫu dữ liệu . . . . . . . . . . . . . 42
2.2 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.3 Ma trận chuẩn hóa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.4 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.5 Ma trận quyết định kết quả . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.6 Bộ dữ liệu đầu vào . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.7 Bộ cơ sở luật . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.1 Hệ cơ sở luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.2 Kịch bản 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.3 Kịch bản 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
vii
Danh mục các hình vẽ, đồ thị
1 Cấu trúc luận án . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1 Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . . . . . . 10
1.2 Sơ đồ tổng quan của hệ suy diễn mờ . . . . . . . . . . . . . . . . . . . 11
1.3 Hệ thống suy diễn Mamdani với hai đầu vào và hai luật . . . . . . . . . 12
1.4 Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật . . . . . . . 13
1.5 Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật . . . . . . . . . 14
1.6 Hệ thống logic mờ do Ramot đề xuất . . . . . . . . . . . . . . . . . . . 15
1.7 Kiến trúc của hệ thống CANFIS . . . . . . . . . . . . . . . . . . . . . . 17
1.8 Biểu diễn của hàm thuộc mờ phức . . . . . . . . . . . . . . . . . . . . 22
2.1 Mô hình hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . . . . . 45
2.2 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu WBCD . . . . . . . 52
2.3 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu Diebetes . . . . . . 52
2.4 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu thực Liver . . . . . . 53
3.1 Giai đoạn Training của mô hình đề xuất . . . . . . . . . . . . . . . . . 66
3.2 Giai đoạn Testing của mô hình M-CFIS-R đề xuất . . . . . . . . . . . . 71
3.3 Kết quả thực nghiệm trên bộ dữ liệu WBCD . . . . . . . . . . . . . . . 72
3.4 Kết quả thực nghiệm trên bộ dữ liệu Diebetes . . . . . . . . . . . . . . 73
3.5 Kết quả thực nghiệm trên bộ dữ liệu thực Liver . . . . . . . . . . . . . 74
4.1 Quá trình Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
4.2 Quá trình Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
4.3 Biểu diễn của luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . . 96
viii
4.4 Đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.5 Đồ thị FKG cho sáu luật . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.6 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có 2 nhãn . . . . . . 104
4.7 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có nhiều nhãn . . . . 105
4.8 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu WBCD . 106
4.9 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Diebetes 107
4.10 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Liver . . 108
4.11 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Wine . . 109
4.12 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu CTG . . 110
4.13 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Arrhythmia111
1
MỞ ĐẦU
Mở đầu
Ra quyết định là một phần vô cùng quan trọng trong cuộc sống, do đó gần đây
rất nhiều nhà nghiên cứu đã đưa ra nhiều hướng tiếp cận khác nhau để giải quyết, hỗ
trợ quá trình ra quyết định như tiếp cận mờ, mô hình giá trị độ đo... Quá trình hỗ trợ
ra quyết định chủ yếu tập trung vào việc đưa ra những phương pháp, cách thức để có
thể hỗ trợ đưa ra quyết định cuối cùng một cách đúng đắn nhất, nhất là đối với môi
trường dữ liệu ngày càng nhiều biến động, dữ liệu không chắc chắn, không xác định
rõ ràng.
Tập mờ (Fuzzy Set-FS) được Zadel đề xuất năm 1965 [1] được coi là một trong
những công cụ hữu hiệu để giải quyết các bài toán mà có dữ liệu không chắc chắn,
không xác định rõ ràng. Rất nhiều những nghiên cứu mở rộng của FS đã được giới
thiệu trong vài năm gần đây [2, 3, 4, 5, 6] và được ứng dụng nhiều trong bài toán
hệ hỗ trợ ra quyết định. Một trong những kĩ thuật quan trọng dựa trên lý thuyết FS
và ứng dụng trong việc giải quyết các bài toán của hệ hỗ trợ ra quyết định là Hệ suy
diễn mờ (Fuzzy Inference System - FIS). FIS hiện đã và đang được ứng dụng rộng
rãi trong nhiều bài toán phân loại/dự báo và các bài toán của hệ hỗ trợ ra quyết định
như lựa chọn nhân sự, lựa chọn nhà cung cấp, hỗ trợ ra chiến lược phát triển công
ty... Bên cạnh đó, trong một vài ứng dụng khác thì hệ FIS được sử dụng để tạo ra một
tập hợp các luật mờ nhằm mục đích phát hiện, dự báo hoặc phân loại các đối tượng
như phát hiện ung thư phổi, phát hiện bệnh đái tháo đường, dự đoán bị bệnh tim ...
[7, 8, 9, 10, 11, 12, 13].
Một phiên bản mở rộng của FIS nhúng vào mạng nơ ron và kết hợp với học dựa
trên phương pháp gradient có tên gọi là Hệ suy diễn mờ nơ ron thích nghi (ANFIS)
[14] và cho kết quả tốt trong vấn đề dự báo bệnh mạch vành, ước tính sự tăng cường
độ dẫn nhiệt của kim loại và oxit kim loại ... [15, 16, 17, 18]. Ngoài ra, ANFIS còn
được kết hợp với các mô hình học máy khác như thuật toán tối ưu hóa bầy đàn và áp
2
dụng đối với các bài toán trong hệ hỗ trợ ra quyết định [19, 20, 21].
Bên cạnh đó, nhiều phiên bản khác nhau của hệ FIS trên các tập mờ mở rộng
áp dụng đối với bài toán hỗ trợ ra quyết định cũng đã và đang được nghiên cứu rộng
rãi. Ví dụ như hệ suy diễn mờ trực cảm (IFIS) được sử dụng trong hồi quy và ứng
dụng hỗ trợ dự báo phá sản của doanh nghiệp [22, 23, 24, 25, 25, 26, 27]. Một số
nghiên cứu kết hợp giữa hệ suy diễn mờ bức tranh (PFS) với thuật toán phân cụm
mờ bức tranh và độ đo mờ bức tranh được ứng dụng trong việc giải quyết một số vấn
đề ra quyết định như dự báo thời tiết, dự báo giá cổ phiếu và phân đoạn hình ảnh
[28, 29, 30, 31, 32, 33, 34, 35].
Gần đây, cùng với sự gia tăng của các vấn đề ra quyết định dựa trên các dữ liệu
có sự thay đổi về thời gian hay các dữ liệu có yếu tố chu kì, định kì thì khái niệm tập
mờ phức (CFS) [36] ra đời với hàm thuộc bao gồm cả thành phần biên độ và thành
phần pha để biểu diễn, mô tả các dữ liệu có yếu tố chu kì, định kì hay các dữ liệu có
sự thay đổi về thời gian. CFS được áp dụng trong nhiều nghiên cứu, tập trung chủ yếu
vào các vấn đề như các toán tử tổng hợp mờ phức, thông tin mềm mờ phức, độ đo
khoảng cách mờ phức và mạng các khái niệm mờ phức [37, 38, 39, 40, 41, 42, 43].
Ưu điểm của CFS là khả năng mô hình hóa các hiện tượng và sự kiện theo thời gian,
theo giai đoạn để từ đó có thể cho thấy tổng thể chúng trong một ngữ cảnh nhất định.
Ví dụ như để xác nhận chẩn đoán huyết áp của bệnh nhân là “cao” hay “thấp”
thì một bệnh nhân được đo 30 lần rồi ghi lại giá trị tương ứng với mỗi lần đo, sau đó
giá trị trung bình và phương sai được tính toán đối với giá trị huyết áp đo được. Từ đó
huyết áp của bệnh nhân có thể tính được dễ dàng bằng cách lấy giá trị trung bình và
phương sai của các lần đo (sử dụng ý nghĩa của mờ hóa của hệ FIS trên tập CFS), ví
dụ như là huyết áp thấp với giá trị trung bình và phương sai cho giá trị nhỏ. Còn nếu
như huyết áp chỉ đo tại một thời điểm và đưa ra quyết định thì có thể dẫn đến quyết
định về huyết áp của bệnh nhân không chính xác.
Một ví dụ khác về vấn đề chẩn đoán bệnh: nếu chỉ dựa vào các giá trị thuộc
tính bệnh mà không xét tới các thuộc tính khác thì làm cho kết quả chẩn đoán không
được chính xác, do kết luận bệnh không chỉ phụ thuộc vào mỗi một giá trị thuộc tính
3
bệnh mà còn cần phải xét tới các yếu tố liên quan tới bệnh đó. Hơn nữa, cũng có nhiều
kịch bản, dữ liệu trong thực tế liên quan đến yếu tố pha, trong dữ liệu có xu hướng
tuần hoàn, chẳng hạn như lượng mưa được ghi lại trong một vùng hoặc sóng âm thanh
do một nhạc cụ tạo ra. Do đó, hiển nhiên rằng số phức cũng phải có một vị trí trong
hệ thống suy luận mờ. Đây cũng là động cơ chính của luận án này.
Hệ suy diễn mờ phức được coi là một công cụ hiệu quả đối với việc giải quyết
các vấn đề không chắc chắn và có yếu tố định kỳ, chu kì. Hệ suy diễn mờ phức đầu
tiên được giới thiệu Ramot [44] được gọi là Hệ logic mờ phức được phát triển từ hệ
thống logic mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến đổi
phức tương ứng của nó. Một nghiên cứu khác bởi Man và cộng sự [45] dựa trên sự
kết hợp giữa phương pháp học quy nạp với hệ suy diễn trong tập phức. Một phiên bản
học nhúng khác với mạng mờ nơ ron trên tập CFS với tên gọi Hệ thống suy diễn mờ
phức nơ ron thích nghi (ANCFIS) được giới thiệu bởi Chen và công sự [46]. Sau đó
2 cải tiến của ANCFIS với mục đích làm gia tăng tốc độ tính toán được đưa ra trong
[47, 48].
Mặc dù nhiều hệ thống suy diễn phát triển dựa trên tập mờ phức đã được nghiên
cứu và ứng dụng nhưng các hệ thống đã có đều chưa thực sự đúng với ý nghĩa của
hệ thống suy diễn mờ phức thực sự. Hầu hết các hệ thống đều sử dụng tập mờ phức
làm biến đầu vào nhưng các nghiên cứu đều chỉ sử dụng thành phần biên độ trong quá
trình ra quyết định mà bỏ qua thành phần pha. Ví dụ như hệ logic mờ phức của Ramot
thì bỏ qua thành phần pha trong giải mờ kết quả đầu ra, làm cho hệ thống không đủ
yếu tố khi xử lý với dữ liệu có yếu tố lặp lại hoặc dữ liệu xảy ra định kì, và điều này
làm giảm đi ý nghĩa của mô hình hệ suy diễn mờ phức, trở thành hệ suy diễn mờ
thường. Còn mô hình ANCFIS của Man và Chen [46] thì sử dụng phép tích vô hướng
vec tơ cho quá trình tổng hợp kết quả, và coi các giá trị đầu vào phức như là các giá
trị thực. Do đó, hệ thống ANCFIS không thực sự là hệ thống phức khi đầu ra của hệ
thống không thể đại diện cho tính tuần hoàn của các thành phần trong đó.
Khi xử lý đối với dữ liệu có yếu tố chu kì, định kì, dữ liệu có yếu tố thay đổi
theo thời gian thì các hệ FIS, ANFIS hay các hệ phát triển trên tập mờ phức đều đưa
4
ra hai phương thức xử lý chung: (1) Bỏ qua thông tin liên quan đến yếu tố thành phần
pha; (2) Biểu diễn thành phần biên độ và pha riêng biệt với nhau thành 2 thành phần
riêng biệt bằng cách sử dụng 2 tập mờ. Điều này sẽ làm cho thông tin bị mất mát và
kết quả thu được không có độ tin cậy cao (nếu các thông tin về thành phần pha bị bỏ
qua), làm sai lệch thông tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và
pha được xử lý riêng biệt), thời gian tính toán sẽ tăng thêm do số lượng các bộ cần
được xử lý tăng thêm.
Thêm nữa, các nghiên cứu đã có hệ suy diễn dựa trên lý thuyết tập mờ phức
vẫn còn tồn tại một số hạn chế như sau:
• Các hệ suy diễn mờ phức chưa đưa ra được quy trình tổng thể xây dựng hệ suy
diễn mờ phức cho hệ hỗ trợ ra quyết định.
• Các hệ luật trong các hệ suy diễn mờ phức đã có chỉ sinh ra dựa trên kinh
nghiệm, dựa trên tư duy logic suy diễn mà chưa đề cập đến vấn đề tối ưu, tinh
giảm hệ luật suy diễn mờ phức.
• Các hệ suy diễn chưa được nghiên cứu để áp dụng đối với bộ dữ liệu mới mà
không có trong dữ liệu huấn luyện khi sinh mô hình suy diễn.
• Các toán tử t-chuẩn và t-đối chuẩn mờ phức còn chưa được quan tâm nghiên cứu
tìm hiểu và ứng dụng trong hệ hỗ trợ ra quyết định.
Mục tiêu nghiên cứu của luận án
Xuất phát từ những tồn tại và hạn chế của các công bố về tập mờ phức và hệ
suy diễn dựa trên tập mờ phức thì luận án tập trung nghiên cứu tìm hiểu và áp dụng
hệ suy diễn mờ phức đối với bài toán hệ hỗ trợ ra quyết định với dữ liệu có yếu tố thời
gian , cụ thể như sau:
• Nghiên cứu lý thuyết về tập mờ phức, logic mờ phức, các độ đo dựa trên tập mờ
phức.
• Nghiên cứu và phát triển các hệ suy diễn dựa trên tập mờ phức.
5
• Nghiên cứu các kĩ thuật để giảm luật mờ trong hệ suy diễn mờ phức.
• Nghiên cứu đồ thị tri thức mờ trong biểu diễn luật mờ để giảm thời gian tính
toán suy diễn đối với tập testing và xử lí suy diễn khi có một tập dữ liệu mới mà
không có sẵn trong tập dữ liệu huấn luyện.
Xuất phát từ mục tiêu nghiên cứu, phạm vi nghiên cứu của luận án tập trung
nghiên cứu một số các vấn đề sau:
• Nghiên cứu lý thuyết về tập mờ phức, các phép toán và hệ suy diễn dựa trên tập
mờ phức
• Luận án chỉ nghiên cứu và thử nghiệm các bài toán hệ hỗ trợ ra quyết định với
dữ liệu có yếu tố thời gian.
Với mục tiêu đặt ra như trên, luận án đạt được một số kết quả chính như sau:
• Đề xuất hệ suy diễn mờ phức theo mô hình Mamdani: Dựa trên mô hình hệ suy
diễn mờ cổ điển Mamdani, luận án phát triển mô hình suy diễn Mamdani trên
tập mờ phức. Mô hình cấu trúc của hệ suy diễn mờ phức đề xuất cũng như các
bước cụ thể trong hệ suy diễn mờ phức Mamdani cũng được đưa ra và áp dụng
thực nghiệm mô hình suy diễn đối với với các bộ dữ liệuchuẩn UCI và dữ liệu
thực. Thêm nữa, NCS cũng đề xuất các toán tử t-chuẩn, t-đối chuẩn mờ phức và
ví dụ số với hệ hỗ trợ ra quyết định. Các đóng góp này được trình bày trong nội
dung Chương 2 của luận án.
• Đề xuất các độ đo tương tự dựa trên tập mờ phức, kết hợp giữa độ đo tương tự
mờ phức và tính toán hạt để giải quyết vấn đề tinh giảm hệ luật trong mô hình
suy diễn mờ phức Mamdani. Cải tiến mô hình hệ suy diễn mờ phức Mamdani ở
Chương 2 và xây dựng hệ suy diễn mờ phức M-CFIS-R. Các đóng góp này được
trình bày chi tiết trong Chương 3 của luận án.
• Đề xuất mở rộng hệ suy diễn mờ phức theo mô hình Sugeno và Tsukamoto và
các độ đo mờ phức, tích phân mờ phức dựa trên lý thuyết tập hợp. Nghiên cứu
6
cách biểu diễn luật mờ dựa trên đồ thị tri thức và cải tiến mô hình hệ suy diễn
mờ phức M-CFIS-R để đưa ra mô hình M-CFIS-FKG. Thực nghiệm trên các bộ
dữ liệu cũng chứng minh hiệu quả về thời gian tính toán của mô hình và suy diễn
trong trường hợp bộ dữ liệu kiểm tra không có trong bộ dữ liệu huấn luyện
Đối tượng nghiên cứu của luận án là các hệ suy diễn theo tiếp cận tập mờ
phức, các phương pháp cải tiến hệ luật và biểu diễn hệ luật qua đồ thị tri thức.
Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và nghiên cứu
thực nghiệm.
i) Nghiên cứu lý thuyết: Nghiên cứu tổng quan lý thuyết về tập mờ phức, các
phép toán mờ phức t-chuẩn, t-đối chuẩn, các độ đo dựa trên tập mờ phức và các hệ
suy diễn mờ phức đã công bố, phân tích ưu điểm, nhược điểm và các vấn đề còn tồn
tại của các nghiên cứu liên quan. Trên cơ sở đó, đề xuất các phép toán, các độ đo
tương tự, độ đo dựa trên lý thuyết tập hợp và các hệ suy diễn mờ phức theo mô hình
Mamdani, Sugeno và Tsukamoto. Các đề xuất, cải tiến được chứng minh chặt chẽ về
lý thuyết bởi các định lý, mệnh đề.
ii) Nghiên cứu thực nghiệm: Các thuật toán đề xuất được cài đặt, chạy thử
nghiệm, so sánh, đánh giá với các hệ suy diễn khác trên các bộ số liệu mẫu từ kho
dữ liệu UCI và bộ dữ liệu thực tế tại Bệnh viện Gang thép Thái Nguyên nhằm minh
chứng về tính hiệu quả của các nghiên cứu về lý thuyết.
Cấu trúc của luận án
Bố cục của luận án gồm bốn chương nội dung chính, phần Mở đầu, Kết luận và
danh mục các tài liệu tham khảo. Phần Mở đầu trình bày tổng quan về vấn đề nghiên
cứu, lý do chọn đề tài, đối tượng, mục tiêu và nội dung nghiên cứu của luận án. Phần
Kết luận tổng kết những kết quả đã đạt được của luận án và hướng phát triển, hướng
nghiên cứu trong tương lai. Các chương nội dung chính được tổ chức như trong Hình
1 cụ thể như sau: Chương đầu tiên NCS trình bày về các kiến thức tổng quan sử dụng
trong luận án như các kiến thức nền tảng về tập mờ, tập mờ phức và hệ suy diễn dựa
trên tập mờ và tập mờ phức. Thêm nữa các độ đo phát triển dựa trên tập mờ và tập
7
Hình 1: Cấu trúc luận án
mờ phức cũng được trình bày trong chương mở đầu này. Từ các kiến thức nền đó mà
chúng tôi đưa ra lí do để sử dụng hệ suy diễn mờ phức đối với việc giải quyết bài toán
hỗ trợ ra quyết định có dữ liệu thay đổi theo thời gian. Các bộ dữ liệu thực nghiệm
trong luận án cùng với các thước đo dùng để đánh giá thực nghiệm cũng được trình
bày chi tiết trong chương đầu tiên này.
Chương 2, dựa trên hệ suy diễn mờ cổ điển Mamdani, NCS phát triển hệ suy
diễn Mamdani trên tập mờ phức và đồng thời cũng trình bày chi tiết các thành phần
cũng như phép toán sử dụng trong mô hình đề xuất. Các phép toán t- chuẩn và t-đối
chuẩn cũng được định nghĩa và ứng dụng trong bài toán hỗ trợ ra quyết định. Cuối
chương là kết quả thực nghiệm và nhận xét so sánh của hệ suy diễn đã đề xuất trên
các bộ dữ liệu thực nghiệm với hệ suy diễn mờ Mamdani.
Vấn đề tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani là nội dung được
đề cập và xem xét đến trong nội dung của chương 3. Xuất phát từ lý thuyết về tính
toán hạt, NCS đề xuất ra các độ đo tương tự mờ phức và độ đo mờ phức kết hợp với
tính toán hạt để thực hiện việc tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani
8
đã đề xuất ở chương 2 (hệ suy diễn mờ phức M-CFIS-R). Ví dụ số và thực nghiệm
trên các bộ dữ liệu cũng đã được trình bày để chứng minh được tính hiệu quả của vấn
đề giảm luật và tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani.
Chương 4, NCS mở rộng mô hình M-CFIS-R sang hệ mờ Sugeno và Tsukamoto
đồng thời đề xuất thêm độ đo mờ phức và tích phân mờ phức dựa trên lý thuyết tập
hợp. Nếu trong Chương 3, NCS chỉ đi tập trung vào vấn đề giảm luật, tối ưu luật trong
phần Training thì Chương 4 NCS lại tập trung vào cải tiến đối với bộ Testing bằng
cách sử dụng lý thuyết về đồ thị tri thức mờ để biểu diễn luật và thực hiện suy luận
xấp xỉ đối với những bản ghi không có trong bộ dữ liệu Training. Việc biểu diễn luật
mờ phức bằng đồ thị tri thức mờ đã giảm khá nhiều thời gian tính toán của hệ suy diễn
mờ phức M-CFIS-R.
9
Chương 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT
1.1. Giới thiệu
Lý thuyết tập mờ nói chung và tập mờ phức nói riêng được coi là một trong
những công cụ toán học hiệu quả để biểu diễn và xử lý những khái niệm không chắc
chắn, không tường minh. Trong chương đầu tiên này, luận án trình bày một số lý thuyết
tổng quan về tập mờ nói chung và tập mờ phức nói riêng. Tổng quan Các nghiên cứu
liên quan về hệ suy diễn mờ cũng như các hệ mờ phức cũng được trình bày khái quát
trong nội dung chương để đưa ra một cái nhìn tổng quan chung về các hệ suy diễn
phát triển dựa trên lý thuyết tập mờ phức. Thêm nữa, trong nội dung chương cũng giới
thiệu khái quát về các bộ dữ liệu và thước đo đánh giá hiệu năng của các hệ suy diễn
trên tập mờ phức.
1.2. Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định
Con người đưa ra quyết định dựa trên các quy luật mà họ tổng kết được từ thực
tiễn cuộc sống, hay nói cách khác là thông qua quá trình học để cung cấp phương án
đầu ra tốt nhất cho quá trình ra quyết định. Với đặc trưng gần gũi với suy luận tự nhiên
của con người và khả năng học, hệ mờ đã và đang được nghiên cứu, ứng dụng thành
công với vai trò như là một trong những công cụ làm cho "máy học thông minh hơn".
Để giải quyết bài toán hệ hỗ trợ ra quyết định thì đã có rất nhiều phương pháp
được áp dụng như cây quyết định, trí tuệ nhân tạo, hệ chuyên gia, các hệ mờ... Tuy
nhiên trong thực tế việc lựa chọn phương pháp nào thì lại tùy thuộc vào từng bài toán
cụ thể như đối tượng, mục tiêu cần hỗ trợ ra quyết định hay dữ liệu trong hệ hỗ trợ ra
quyết định ...
10
Với khả năng làm việc với các đối tượng là biến ngôn ngữ, gần gũi với suy luận
tự nhiên của con người, khả năng học, tổng kết tri thức để hình thành nên hệ luật, thì
hệ mờ dược coi là một trong những công cụ mạnh mẽ và được ứng dụng nhiều trong
các hệ hỗ trợ ra quyết định. Hệ thống với các mô hình suy diễn mờ có thể cung cấp
Hình 1.1: Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định
các lựa chọn thay thế và đẩy nhanh kết quả trong việc quyết định đầu ra mong muốn
Hình 1.1 mô tả quy trình chung của phương pháp sử dụng hệ mờ trong các hệ
hỗ trợ ra quyết định. Ban đầu dựa trên dữ liệu mẫu huấn luyện, một quy trình sinh luật
được áp dụng để tạo ra hệ các luật mờ. Hệ luật này là trung tâm tập hợp các quy luật,
kiến thức trích rút ra từ tập dữ liệu huấn luyện. Tiếp theo, với mỗi đầu vào mới được
áp dụng với từng luật và tính toán các đầu ra. Một quy trình tổng hợp kết quả từ các
luật để cho ra một giá trị chung. Cuối cùng, ở bước ra quyết định thì giá trị này được
điều chỉnh, chuẩn hóa để đưa ra quyết định cuối cùng.
1.3. Tổng quan các nghiên cứu liên quan
Logic mờ lần đầu tiên được giới thiệu coi như là một khái niệm để mô tả những
thông tin không chắc chắn, mơ hồ. Nó được ứng dụng rộng rãi để giải quyết các vấn
đề liên quan đến dự báo, điều khiển, phát hiện mẫu và các hệ hỗ trợ ra quyết định với
thông tin không chắc chắn. Đó được coi là mô hình tính toán mà có khả năng xử lý
đồng thời cả tri thức ngôn ngữ và dữ liệu số. Đó là cách lập trình cho máy tính hiểu
và bắt chước suy nghĩ của con người, với mục tiêu là làm tăng hiệu quả của quá trình
ra quyết định đối với các thông tin đầu vào là thông tin mơ hồ và không chắc chắn. Từ
lý thuyết về logic mờ đã dẫn đến sự phát triển của các hệ thống suy diễn mờ. Một hệ
11
suy diễn mờ được định nghĩa như là một ánh xạ phi tuyến để đưa ra kết quả dựa trên
các lập luận mờ và một tập các luật mờ dạng if-then.
1.3.1. Hệ suy diễn mờ
Suy diễn là cơ chế liên kết các tri thức đã có để suy dẫn ra các tri thức mới. Cơ
chế suy diễn phụ thuộc rất nhiều vào phương thức biễu diễn tri thức và không có một
phương pháp suy diễn duy nhất cho mọi loại tri thức. Hệ suy diễn mờ (FIS) là một
khung tính toán phổ biến dựa trên khái niệm lý thuyết tập mờ, thường được áp dụng
khi xây dựng các quá trình hỗ trợ ra quyết định. Hệ suy diễn mờ tỏ ra hiệu quả trong
trường hợp tri thức không đầy đủ, bất định hoặc không chính xác.
Sơ đồ chung của một hệ FIS bao gồm ba phần chính: một bộ mờ hóa, một bộ
cơ sở luật và một bộ giải mờ. Hệ suy diễn mờ [2, 7] (mô tả trong Hình 1.2) có cấu trúc
cơ bản như sau:
- Giao diện mờ hóa: chuyển đổi các lớp đầu vào thành các biên độ phù hợp với
các giá trị ngôn ngữ.
- Cơ sở trí thức bao gồm hai phần: Cơ sở dữ liệu ( định nghĩa các hàm thuộc
của các tập mờ được sử dụng trong các luật mờ) và bộ luật ( gồm các luật mờ IF –
THEN)
- Đơn vị thực thi: thực hiện các hoạt động suy diễn trong các luật
- Giao diện giải mờ: chuyển đổi các giá trị kết quả mờ của hệ suy diễn ra các
Hình 1.2: Sơ đồ tổng quan của hệ suy diễn mờ
lớp đầu ra rõ.
Các bước suy diễn mờ:
• Mờ hóa các biến đầu vào: ta cần mờ hóa những giá trị rõ bởi hàm thuộc mờ để
12
tham gia vào quá trình suy diễn
• Áp dụng các toán tử mờ (AND hoặc OR) cho các giả thiết của từng luật.
• Áp dụng phép kéo theo để tính toán giá trị các giá trị từ giả thiết đến kết luận
của từng luật.
• Áp dụng toán tử gộp để kết hợp các kết quả trong từng luật thành một kết quả
duy nhất cho cả hệ.
• Giải mờ kết quả tìm được cho ta một kết quả rõ.
Các phương pháp suy diễn mờ được phân loại theo ba phương pháp chính: Hệ
suy diễn mờ Mamdani, hệ suy diễn mờ Sugeno (hay còn gọi là hệ suy diễn mờ Takagi
1.3.1.1 Hệ suy diễn mờ Mamdani
– Sugeno) và hệ suy diễn mờ Tsukamoto.
Hệ suy diễn mờ Mamdani [49] là hệ có phương pháp suy diễn mờ đầu tiên
Hình 1.3: Hệ thống suy diễn Mamdani với hai đầu vào và hai luật
được xây dựng bằng cách sử dụng lý thuyết tập mờ.
Hình 1.3 mô tả về hệ suy diễn mờ Mamdani có hai biến đầu vào x, y và một biến
đầu ra z. Mỗi đầu vào có hai hàm thuộc đầu vào, kí hiệu lần lượt là {A1, A2} , {B1, B2}
và đầu ra kí hiệu là {C1, C2}.
j THEN z is Ck
i and y is Bk
l với k = 1, ..., R; i = 1, .., N ; j = 1, .., M và l = 1, .., L trong đó N, M, L là số lượng hàm
Luật thứ k sẽ có dạng như sau: k: IF x is Ak
13
thuộc của hai biến đầu vào và biến đầu ra. Trong hệ suy diễn này, phương pháp giải
1.3.1.2 Hệ suy diễn mờ Tagaki- Sugeno
mờ thường được sử dụng là lấy cực đại và tính toán điểm trọng tâm.
Ck
l bởi một hàm của các biến đầu vào thì sẽ thu được luật mờ Tagaki-Sugeno [50]. Như vậy, trong hệ suy diễn Sugeno (Hình 1.4), các luật được hình thành có dạng như
Xét theo luật mờ Mamdani ở mục trên, nếu ở phần kết luận ta thay các tập mờ
k: IF x is Ak
i and y is Bk
j THEN zk = f (x, y)
sau:
N, M là số lượng hàm thuộc cho biến đầu vào.
Hình 1.4: Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật
Cũng giống như Mamdani, k = 1, ..., R; i = 1, .., N và j = 1, .., M trong đó
Phương pháp giải mờ thường được sử dụng đối với hệ suy diễn Tagaki- Sugeno
là toán tử tính độ mạnh trung bình.
Do hệ suy diễn Tagaki-Sugeno được đánh giá hiệu quả tính toán cao hơn so
với hệ suy diễn Mamdani nên thường được sử dụng cho các kỹ thuật thích ứng trong
việc xây dựng các mô hình mờ. Những kỹ thuật thích ứng có thể được sử dụng để tùy
chỉnh các hàm thuộc để đạt được mô hình hiệu quả nhất cho từng loại dữ liệu.
Lợi thế của hệ suy diễn Sugeno là tính toán hiệu quả, làm việc tốt với các kỹ
thuật tuyến tính, tối ưu hóa, và rất thích hợp để phân tích toán học.Tuy nhiên, một
trong những vấn đề còn hạn chế của hệ suy diễn mờ Tagaki- Sugeno là không có
phương pháp trực quan tốt nào để xác định các hệ số p, q, và r. Thêm nữa, trong hệ
14
1.3.1.2 Hệ suy diễn mờ Tsukamoto
suy diễn Tagaki-Sugeno chỉ có đầu ra là rõ.
Trong hệ suy diễn Tsukamoto (hình 1.5), luật if – then được biểu diễn có dạng
k: IF x is Ak
i and y is Bk
j THEN zk = f (x, y).
Hình 1.5: Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật
như sau:
Các luật trong hệ suy diễn này được đại diện bởi một tập mờ với hàm thuộc
monotonical. Kết quả suy diễn của từng luật được xác định là một giá trị rõ và được
tính toán khi tính độ mạnh của luật. Kết quả cuối cùng thu được bằng cách lấy giá trị
trung bình đầu ra của từng luật.
Vì mỗi luật suy diễn ra một kết quả rõ, hệ suy diễn Tsukamoto lấy giá trị cuối
cùng là trung bình nên quá trình giải mờ diễn ra nhanh chóng. Tuy nhiên, hệ suy diễn
mờ Tsukamoto được khuyến cáo không hiệu quả như hai hệ suy diễn mờ Mamdani và
Sugeno nên không được sử dụng thường xuyên.
1.3.2. Các hệ phát triển dựa trên tập mờ phức
Sau khi lý thuyết tập mờ phức được Ramot giới thiệu vào năm 2002 [36] thì
đã có nhiều nhà nghiên cứu chú ý và nghiên cứu phát triển các hệ thống dựa trên nền
tảng lý thuyết của tập mờ phức. Tập mờ phức có thể được coi như là một khái niệm cơ
bản được sử dụng trong các hệ thống thông minh để giải quyết các vấn đề đối với các
dữ liệu có tính chu kì định kì hay dữ liệu cần có thêm nhiều thông tin bổ trợ, điều mà
1.3.2.1 Hệ logic mờ phức của Ramot
các tập mờ thường không thể diễn tả đầy đủ được. Cụ thể như sau:
Sau khi Ramot và cộng sự giới thiệu khái niệm mới về mở rộng của tập mờ
thường sang miền mặt phẳng phức với tên gọi là tập mờ phức. Năm 2003, Ramot [44]
15
phát triển mô hình logic mới sử dụng tập mờ phức với tên là logic mờ phức. Cũng
giống như các hệ thống logic mờ thông thường, hệ thống logic mờ phức là phép ánh
xạ không tuyến tính một vec tơ dữ liệu đầu vào thành đầu ra. Một hệ thống mờ phức
được đặc trưng bởi một tập các luật mờ trong đó phép kéo theo mờ phức được mô tả
theo câu lệnh If-then. Nói chung thì hệ thống mờ phức giống như hệ thống mờ thông
thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến đổi phức tương ứng của
nó.
Hình 1.6: Hệ thống logic mờ do Ramot đề xuất
Hệ thống mờ phức được minh họa chỉ rõ trong hình 1.6 như sau:
Tương tự như hệ thống mờ thông thường, hệ thống logic mờ phức do Ramot
đề xuất bao gồm ba giai đoạn:
Giai đoạn đầu tiên là module mờ hóa, được sử dụng để ánh xạ đầu vào rõ thành
tập đầu vào mờ. Những tập mờ này có thể có hoặc không có phần phức, điều đó tùy
thuộc vào ứng dụng.
Giai đoạn thứ hai là giai đoạn của module Suy diễn mờ phức, thông qua việc sử
dụng cơ sở luật mờ phức để ánh xạ các dữ liệu đầu vào mờ thành đầu ra mờ. Phương
thức suy diễn mờ được Ramot sử dụng trong hệ thống là dựa theo mô hình Modus
Ponen. Đầu ra của mô hình được tính theo công thức phép kéo theo mờ phức. Tiếp
theo bằng việc sử dụng toán tử tổ hợp vec tơ, đầu ra mờ phức của từng luật được kết
nối lại với nhau và đưa ra được một tập đầu ra mờ phức, kí hiệu B∗.
Phép kéo theo mờ phức (có hàm thuộc mờ phức, kí hiệu µA→B (x, y) ) được
Ramot sử dụng trong Hệ suy diễn mờ phức, kết quả tập mờ phức B∗ có hàm thuộc mờ
16
[rA∗ (x) ⊗ rA→B (x, y)]
rB∗ (y) = sup x∈U
[rA∗ (x) ⊗ (rA (x) · rB (y))]
= sup x∈U
ωB∗ (y) = f [g (ωA∗ (x) , ωA→B (x, y))]
= f [g (ωA∗ (x) , (ωA (x) + ωB (y)))]
phức µB∗ (y) = rB∗ (y) · ejωB∗ (y), trong đó:
với hàm g được sử dụng để tính toán phép giao giữa hai thành phần pha của tập
mờ, và tùy thuộc vào ứng dụng mà có thể lựa chọn hàm f và g khác nhau.
Trong module suy diễn mờ phức, phép toán tổ hợp vec tơ được sử dụng để tổ
hợp các luật và đưa ra kết quả cuối cùng. Mối tương tác giữa các luật là kết quả trực
tiếp của việc kết hợp giữa phép tổ hợp vec tơ và phép kéo theo mờ phức.
Giai đoạn giải mờ là giai đoạn cuối cùng thực hiện việc giải mờ tập đầu ra mờ
phức thành một đầu ra rõ. Một cách tiếp cận khả thi đối với giải mờ tập đầu ra mờ
phức là bỏ qua thành phần pha mà chỉ quan tâm đến thành phần biên độ của tập mờ
phức. Trong mô hình hệ logic mờ phức của Ramot thì bất kì phương pháp giải mờ nào
áp dụng được đối với hệ logic mờ truyền thống đều có thể được áp dụng ở giai đoạn
Giải mờ này.
Như vậy, Ramot và cộng sự đã đưa ra một hệ thống tổng quát dựa trên khái
niệm tập mờ phức. Hệ thống này vẫn giữ được những ý nghĩa của hệ thống logic mờ
thông thường và thêm vào đó là các tính chất của tập mờ phức. Tuy nhiên, nhóm tác
giả mới chỉ đưa ra mô hình tổng quát và ví dụ minh họa chứ chưa áp dụng một hệ suy
1.3.2.2 Hệ thống CANFIS
diễn mờ rõ ràng nào trong hệ thống.
Hệ thống CANFIS [51] là hệ thống do nhóm tác giả Li và Jang đề xuất với với
tên gọi là Hệ suy diễn mờ nơron thích nghi phức CANFIS (Complex Neuro-Fuzzy
Inference System). Đây được coi là một mở rộng của Hệ suy diễn nơ ron mờ thích
nghi với các biến đầu vào là vec tơ phức và đầu ra là số phức. Tập các biến đầu vào
mờ được định nghĩa như các biến phức, và các tham số tùy chỉnh trong hệ thống đều
là giá trị phức (ví dụ như tâm của tập mờ đầu vào, vec tơ trọng số của hàm đầu ra).
17
Hệ thống CANFIS bao gồm năm lớp: ba lớp ban đầu gọi là lớp mờ hóa, ví dụ
đưa ra giá trị độ mạnh đối với từng luật mờ ; lớp thứ tư thực hiện công việc suy diễn
(đưa ra giá trị đầu ra tương ứng với mỗi luật) và lớp cuối cùng thực hiện việc tổng hợp
kết quả (kết nối các giá trị đầu ra của mỗi luật để đưa ra giá trị đầu ra cuối cùng).
Hình 1.7: Kiến trúc của hệ thống CANFIS
Hình 1.7 minh họa cụ thể ví dụ về hệ thống CANFIS với ba biến đầu vào.
Hệ thống CANFIS được ứng dụng rộng rãi đối với các tín hiệu phức và với
các hệ thống có tín hiệu không tuyến tính trong viễn thông. Tuy nhiên, hệ thống này
không hoàn toàn đúng ý nghĩa trên miền phức, bởi việc sử dụng các hàm thuộc mờ
loại 1 riêng cho phần thực và phần ảo của từng giá trị biến đầu vào. Chính điều đó làm
giảm đi ý nghĩa của hệ thống suy diễn trên tập mờ phức do việc tách riêng phần thực
và phần ảo của các giá trị đầu vào làm giảm đi ý nghĩa của việc ứng dụng trong miền
phức. Thêm nữa, việc tách riêng phần thực và phần ảo cũng đã làm tăng số lượng luật
1.3.2.3 Hệ ANCFIS
và làm tăng độ phức tạp tính toán của hệ thống.
Hệ thống ANCFIS do nhóm tác giả Chen và cộng sự đề xuất năm 2010 [46]
gần giống với kiến trúc mạng nơ ron giá trị phức. Mạng nơ ron giá trị phức này cho
18
phép dữ liệu đầu vào và đầu ra là các giá trị phức (mặc dù vẫn chấp nhận giá trị đầu
vào và đầu ra là giá trị thực hay nhị phân...), và các giá trị trọng số trong mô hình có
thể mang giá trị phức hoặc giá trị thực.
Mô hình ANCFIS được đề xuất áp dụng với đối với dữ liệu theo chuỗi thời
gian, hệ thống chỉ yêu cầu 1 biến đầu vào hay chính là một giá trị trong chuỗi dữ liệu
theo thời gian. Điều này nhấn mạnh ý nghĩa tự nhiên của tập mờ phức nhưng khi đó
họ cần phân đoạn dữ liệu theo chuỗi thời gian để sao cho phù hợp với thành phần pha
và biên độ của tập mờ phức trong bài toán của họ đề xuất.
Khi đó, mô hình hệ thống ANCFIS kết hợp thêm một lớp bổ sung, sử dụng
các tín hiệu giá trị phức trong phần lớn mô hình mạng và sử dụng hàm kích hoạt ở
các nút khác nhau. Trong pha sau thì cần xác định hàm thuộc giá trị phức đối với mỗi
đoạn của chuỗi thời gian và hàm thuộc cho tập mờ phức. Còn trong pha trước thì cần
cập nhật những tham số a, b, c và d cho tập mờ phức bằng sử dụng thuật toán tối ưu
Gradient descent. Trong các lựa chọn thì nhóm tác giả chọn thực nghiệm toán tử L2
norm, tích chập giá trị thực và tích chập với giá trị phức đối với pha trước và thuật
toán tối ưu đàn kiến ACO được áp dụng trong pha sau của hệ thống.
Như vậy, trong hệ thống này nhóm tác giả chỉ chú ý tập trung đưa ra thuật toán
học lan truyền đối với tập mờ phức và áp dụng với các bộ dữ liệu chuỗi thời gian. Đó
1.3.2.4 Một số hệ suy diễn khác dựa trên tập mờ phức
là một hệ thống lai giữa CFIS và ANFIS.
Bên cạnh các nghiên cứu đã có thì tập mờ phức cũng được nhiều nhóm nghiên
cứu và phát triển. Deshmukh và cộng sự [52] lại đề xuất một hệ logic mờ phức và áp
dụng chúng để thiết kế bộ vi xử lý mờ sử dụng công nghệ VLSI (công nghệ tích hợp
mạch cỡ lớn - Very large scale integration). Tuy nhiên, nhóm tác giả không thực hiện
suy diễn luật và không đưa ra module giải mờ phù hợp trong hệ thống của mình.
Tiếp nối mô hình ANCFIS do nhóm tác giả Chen và cộng sự đề xuất [46] thì
nhóm tác giả Yazdanbakhsh và Dick [53] đã cải tiến hệ thống ANCFIS bằng cách áp
dụng thêm thuật toán học máy nhằm tăng tốc độ học trong quá trình huấn luyện của
mô hình ANCFIS. Từ đó, nhóm tác giả xây dựng hệ thống hệ suy diễn mờ phức dựa
trên mạng nơ ron thích nghi ngẫu nhiên (RANCFIS- Randomized Adaptive-Network
19
Based Fuzzy Inference System) [54] và ứng dụng mô hình đề xuất trong đối với cả
dữ liệu chuỗi thời gian nhiều chiều trong. Sau đó vào năm 2019, trong nghiên cứu
[48] nhóm tác giả Yazdanbakhsh và Dick tiếp tục cải tiến hệ thống của mình và đề
xuất hệ thống mới có tên gọi hệ suy diễn mờ phức dựa trên mạng nơ ron thích nghi
nhanh (FANCFIS- Fast Adaptive-Network Based Fuzzy Inference System). Bằng việc
sử dụng thuật toán Fourier trong quá trình huấn luyện, hệ thống đã phát hiện nhanh
được những tần số chi phối của bộ dữ liệu theo chuỗi thời gian và từ đó đề xuất tập
mờ phức phù hợp trong quá trình xây dựng hệ luật.
1.3.3. Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay
Từ các nghiên cứu về hệ suy diễn phát triển từ tập mờ phức, các hệ suy diễn
phát triển dựa trên tập mờ phức đã có chưa thực sự đúng với ý nghĩa của hệ thống
phức thực sự. Hầu hết các hệ thống đều sử dụng tập mờ phức làm biến đầu vào nhưng
các nghiên cứu đều chỉ sử dụng thành phần biên độ trong quá trình ra quyết định mà
bỏ qua thành phần pha. Ví dụ như trong hệ thống logic mờ phức tổng quát của Ramot
thì bỏ qua thành phần pha trong giải mờ kết quả đầu ra, làm cho hệ thống không đủ
yếu tố khi xử lý với dữ liệu chuỗi thời gian của các yếu tố có sự lặp lại hoặc xảy ra
định kì, và điều này làm giảm đi ý nghĩa của mô hình hệ suy diễn mờ phức, trở thành
hệ suy diễn mờ thường. Còn mô hình ANCFIS của Man và Chen thì sử dụng phép
tích vô hướng vec tơ cho quá trình tổng hợp kết quả, và coi các giá trị đầu vào phức
như là các giá trị thực, do đó nó thu được một giá trị vô hướng đối với phép tích vô
hướng. Điều này có thể sẽ không thực hiện được nếu các đầu vào thực sự là các giá trị
phức, vì tích vô hướng của hai số phức là một giá trị phức chứ không phải là một giá
trị vô hướng. Do đó hệ thống ANCFIS không thực sự là hệ thống phức khi đầu ra của
hệ thống không thể đại diện cho tính tuần hoàn của các thành phần trong đó.
Sau đó mô hình hệ ANCFIS được nhóm tác giả phát triển và cải thiện thành hệ
thống Hệ suy diễn mờ phức dựa trên mạng nơ ron thích nghi ngẫu nhiên (RANCFIS-
Randomized Adaptive-Network Based Fuzzy Inference System) và Hệ suy diễn mờ
phức dựa trên mạng nơ ron thích nghi nhanh (FANCFIS- Fast Adaptive-Network
Based Fuzzy Inference System). Tuy nhiên, hai hệ thống này đều không cải thiện
ý nghĩa phức trong hệ suy diễn ANCFIS trước đó mà chỉ tập trung nghiên cứu cải tiến
20
vấn đề học trong mô hình ANCFIS.
Như vậy, các hệ thống phát triển dựa trên lý thuyết tập mờ phức như hệ logic
mờ phức của Ramot hay các phiên bản khác nhau theo kiến trúc ANFIS khi xử lý với
dữ liệu chuỗi thời gian hay các bộ dữ liệu có yếu tố tuần hoàn, biến đổi theo thời gian
thì các hệ FIS hay ANFIS đều đưa ra hai phương thức xử lý chung như sau:
• Các hệ thống thường bỏ qua thông tin liên quan đến yếu tố thành phần pha,
• Đối với dữ liệu đầu vào thì biểu diễn thành phần biên độ và pha riêng biệt với
nhau thành hai thành phần riêng biệt bằng cách sử dụng hai tập mờ. Điều này sẽ
làm cho mất mát thông tin trong quá trình suy diễn và kết quả thu được không
đáng tin cậy (nếu các thông tin về thành phần pha bị bỏ qua), làm sai lệch thông
tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và pha được xử lý riêng
biệt) và thời gian tính toán của hệ thống sẽ tăng thêm do số lượng các bộ cần
được xử lý tăng thêm.
1.4. Cơ sở lý thuyết
Ý tưởng của khái niệm tập mờ là từ những khái niệm trừu tượng về ngữ nghĩa
của thông tin mờ, thông tin không chắc chắn như trung niên-già trẻ, nhanh-chậm, cao-
thấp. Năm 1965, Zadel [1] đã đưa ra cách biểu diễn những thông tin mờ, không chắc
chắn trên bằng một khái niệm toán học, được gọi là tập mờ. Về cơ bản, tập mờ xử lý
các thông tin mơ hồ, không chắc chắn trong các tình huống khác nhau. Các ứng dụng
của logic mờ và tập mờ được nghiên cứu trong nhiều lĩnh vực khác nhau như trí tuệ
nhân tạo, lý thuyết điều khiển, xử lý tín hiệu, hệ hỗ trợ ra quyết định.
Có một số hướng tiếp cận khác nhau dựa trên các tập mờ để xử lý những thông
tin không chắc chắn, không rõ ràng của dữ liệu như tập mờ giá trị khoảng, tập mờ loại
hai, tập mờ trực cảm, tập mờ phức... Trong phần này, luận án trình bày khái quát qua
về lý thuyết mờ và tập trung vào lý thuyết tập mờ phức và logic mờ phức. Nếu tập
mờ loại một được mô tả bởi hàm thuộc ánh xạ các phần tử trong không gian nền vào
khoảng [0,1] thì tập mờ phức được coi là mở rộng của tập mờ loại một với hàm thuộc
là giá trị phức. Đây được coi là một trong những hướng nghiên cứu phát triển trong
21
thời gian gần đây và được ứng dụng trong nhiều lĩnh vực khác nhau như xử lý tín hiệu
[52], hệ hỗ trợ ra quyết định [55], dự báo [56], chứng khoán [48, 53], ...
1.4.1. Tập mờ
Theo lý thuyết cổ điển thì khi xét quan hệ thuộc của một phần tử với với tập
hợp, ta chỉ có hai giá trị: 1 (nếu thuộc) và 0 (nếu không thuộc). Các tập hợp như vậy
được gọi là tập rõ.
Cho tập X (cid:54)= 0, tập rõ A ⊆ X được xác định bởi hàm thuộc sau:
z (cid:55)→ χA(z)) =
0
(cid:40) 1 nếu x ∈ A (1.1) nếu x /∈ A
trong đó X là không gian nền (tập nền).
Khái niệm tập mờ được giáo sư Lotfi A. Zadel đưa ra vào năm 1965 [1] với
mục đích là mô tả những khái niệm "tập hợp chưa rõ ràng" trong nghiên cứu những
yếu tố chưa bất định.
Định nghĩa 1.1 ([1]). A được coi là một tập mờ trên không gian nền X nếu A được
xác định bởi hàm sau:
µA : X → [0, 1]; x (cid:55)→ µA(x)
(1.2)
1.4.2. Tập mờ phức
Khái niệm về tập mờ phức (Complex Fuzzy Set - CFS) và logic mờ phức
(Complex Fuzzy Logic - CFL) [36, 44] đã được đề xuất bởi Ramot và các cộng sự
được coi như là một phần mở rộng của lý thuyết tập mờ và logic mờ.
Định nghĩa 1.2 ([36]). Một tập mờ phức A định nghĩa trên không gian nền U được
√
−1
đặc trưng bởi một hàm thuộc giá trị phức có dạng như sau:
µA (x) = rA (x) .ejωA(x); j =
(1.3)
rA (x) ∈ [0, 1], ωA (x) ∈ (0, 2π].
Trong đó, rA (x) là biên độ, ωA (x) là pha của hàm thuộc mờ phức và với điều kiện
22
µA (x) mà phạm vi giá trị của nó là đường tròn đơn vị trong không gian phức. Thành
Như vậy, một tập mờ phức được đặc trưng bởi một hàm thuộc giá trị phức
phần pha ở đây chỉ là một số thông tin mở rộng bổ sung thêm liên quan tới chu kì
không gian hay thông tin thời gian trong tập mờ đã được xác định bởi thành phần biên
độ.
Theo Ramot [36, 44] thì tập mờ phức được coi như là công cụ mô hình hóa
hiệu quả đối với những vấn đề, những đối tượng có ý nghĩa thay đổi theo thời gian (ví
dụ như phần pha biểu diễn ý nghĩa thay đổi theo ngữ cảnh) hay với những vấn đề có
yếu tố chu kì, định kì.
Khác với tập mờ, phạm vi của hàm thuộc chỉ giới hạn trong khoảng [0,1] thì
với tập mờ phức, phạm vi được mở rộng đến vòng tròn đơn vị trong mặt phẳng phức.
Như vậy, tập mờ phức cung cấp một nền tảng toán học để biểu diễn hàm thuộc dưới
dạng số phức. Do đó, tập mờ chỉ là một trường hợp cụ thể của tập mờ phức khi thành
phần pha bằng 0 [36, 57].
Hình 1.8 mô tả biểu diễn của hàm thuộc mờ phức qua đồ thị 3 chiều với không
gian nền được coi là trục thứ ba. Hình trụ màu xanh biểu diễn giới hạn của các lớp mờ
Hình 1.8: Biểu diễn của hàm thuộc mờ phức
phức trên không gian nền U.
23
Tuy nhiên khái niệm về tập mờ phức này khác với các khái niệm do Buckley
[58, 59] và Zhang [60, 61] đưa ra. Các tập mờ phức giữ lại các đặc điểm về sự không
chắc chắn dưới dạng biên độ, trong khi thêm vào thành phần pha để chỉ ra các thuộc
tính dạng sóng.
Các ví dụ sau sẽ minh họa rõ hơn tập mờ phức và ý nghĩa khái niệm thành phần
biên độ, thành phần pha của tập mờ phức.
Ví dụ 1 [36]: Xem xét vấn đề biểu diễn hoạt động năng lượng mặt trời thông
qua quan sát các vết đen mặt trời. Nếu năng lượng mặt trời đạt ở mức cao thì số lượng
vết đen mặt trời nhiều, còn nếu năng lượng mặt trời ở mức thấp thì số lượng vết đen ít
đi. Tuy nhiên, theo ý kiến của các chuyên gia thì cứ 11 năm thì mặt trời lại có một giai
đoạn năng lượng mặt trời đạt giá trị cực đại sau một khoảng thời gian đạt cực tiểu. Do
đó, để đánh giá được năng lượng mặt trời của tháng là thấp hay cao, ngoài việc xem
xét các vết đen trung bình của mặt trời mà còn cần chú ý tới chu kì của năng lượng
mặt trời.Ví dụ như, năm 2000 số lượng vết đen 50 được coi là giá trị năng lượng đạt
cực đạ nhưng đến năm 2015 thì giá trị đó chỉ bằng một phần tư của chu kì đi lên của
vòng năng lượng mặt trời.
Do đó, để thể hiện tất cả các thông tin cần thiết liên quan tới hoạt động năng
lượng mặt trời trong từng tháng cụ thể thì có thể định nghĩa như là một tập mờ phức,
bao gồm cả thành phần biên độ và pha. Thành phần biên độ là số lượng vết đen mặt
trời và thành phần pha chứa các thông tin liên quan đến vị trí của tháng đó trong chu
kì vòng quay mặt trời. Còn nếu sử dụng tập mờ truyền thống thì chỉ có thể sử dụng tập
mờ đơn lẻ để biểu diễn số lượng điểm đen của mặt trời, còn thông tin liên quan đến vị
trí trong chu kì vòng quay mặt trời thì mơ hồ và không thể hiện rõ.
Ví dụ 2 [44]: Xem xét trong trường hợp một nhà đầu tư có ý định đầu tư vào
một công ty bằng cách mua cổ phiếu giao dịch trên thị trường chứng khoán New York.
Khi đó, nhà đầu tư quan tâm đến vấn đề tối ưu hóa thời gian mua hàng và tối đa hóa
lợi nhuận (tức là mua cổ phiếu khi giá cổ phiếu còn thấp). Khi đó nhà đầu tư tư vấn
với một chuyên gia, người cung cấp dữ liệu sau đây:
- Giá cổ phiếu hiện tại của công ty liên quan đến đánh giá tổng thể về hiệu suất
của công ty.
24
- Giai đoạn thực tại của thị trường chứng khoán. Thị trường chứng khoán
thường làm việc theo định kì (ví dụ như, theo dõi chỉ số SP theo định kì 4 năm).
Như vậy thông tin về giai đoạn hiện tại của thị trường chứng khoán có thể đóng vai
trò khá quan trọng đối với các nhà đầu tư.
Nếu theo lý thuyết tập mờ thì nhà đầu tư sẽ sử dụng một tập mờ để mô tả tình
hình giá cổ phiếu hiện tại của thị trường chứng khoán bằng cách gán cho nó một giá
trị độ thuộc mờ, ví dụ như “giá thấp”. Tuy nhiên, thông tin về giai đoạn thực tại của
thị trường chứng khoán lại không thể hiện được trong đó. Khi đó, để miêu tả rõ hơn
về vấn đề đầu tư cổ phiếu và có thể biểu diễn ngắn gọn, chính xác tất cả các thông tin
được cung cấp bởi chuyên gia đầu tư chứng khoán thì có thể sử dụng khái niệm tập
mờ phức. Việc sử dụng một tập mờ phức với thành phần biên độ biểu thị giá cổ phiếu
hiện tại tương ứng với hiệu suất của công ty và thành phần pha hiển thị giai đoạn hiện
tại của thị trường chứng khoán.
1.4.3. Các phép toán trên tập mờ phức
Phần bù của tập mờ phức
Trong phần này luận án tập trung trình bày về các phép toán trên tập mờ phức.
Cho A tập mờ phức với hàm thuộc mờ phức tương ứng là: µA(x) = rA(x)ejωA(x).
Định nghĩa 1.3 ([36]). phần bù của tập mờ phức A ( kí hiệu A) có thể được xác định
A = (cid:8)(x, µA(x))|x ∈ U(cid:9) =
như sau: (cid:111) (1.4) (cid:110) (x, rA(x)ejωA(x))|x ∈ U
Với rA(x) = 1 − rA(x) và ωA(x) = 2π − ωA(x).
Theo [36], phép toán phần bù mờ phức có thể có các dạng như sau:
A = (1 − rA (x)) .ej(−ωA(x))
(1.5)
A = (1 − rA (x)) .ej(ωA(x))
(1.6)
A = (1 − rA (x)) .ej(ωA(x)+π)
(1.7)
Ví dụ 1.1. Cho tập mờ phức A = 0.6ej1.2π(cid:14)x + 1.0ej2π(cid:14)y + 0.8ej1.6π(cid:14)z Khi đó, A = 0.4ej0.8π(cid:14)x + 0/y + 0.2ej0.4π(cid:14)z
25
Phép hợp và phép giao của hai tập mờ phức
Ramot [36] đã trình bày về phép hợp và phép giao trên tập mờ phức cùng với
những toán tử áp dụng đối với thành phần pha của cấp độ thuộc mờ phức.
Cho A và B là hai tập mờ phức với hàm thuộc mờ phức tương ứng là: µA(x) = rA(x)ejωA(x) và µB(x) = rB(x)ejωB(x), khi đó, các phép toán trên tập mờ phức được
định nghĩa như sau:
Định nghĩa 1.4 ([36]). Phép hợp hai tập mờ phức A và B (kí hiệu A ∪ B) được định
A ∪ B = {(x, µA∪B(x))|x ∈ U }
nghĩa như sau:
=
(x, rA∪B(x)ejωA∪B(x))|x ∈ U
(cid:111) (cid:110) (1.8)
=
(x, [rA(x) ⊕ rB(x)] ejωA∪B(x))|x ∈ U
(cid:111) (cid:110)
Với phép ⊕ có thể là phép t-đối chuẩn, ví dụ như rA∪B(x) = max {rA(x), rB(x)}.
Định nghĩa 1.5 ([36]). Phép giao hai tập mờ phức A và B (kí hiệu A ∩ B) được xác
A ∩ B = {(x, µA∩B(x))|x ∈ U }
định bởi
=
(x, rA∩B(x)ejωA∩B(x))|x ∈ U
(cid:111) (cid:110) (1.9)
=
(x, [rA(x) ⊗ rB(x)] ejωA∩B(x))|x ∈ U
(cid:111) (cid:110)
Với rA∩B(x) = min {rA(x), rB(x)} và ωA∩B(x) = min (ωA(x), ωB(x)).
Trong đó, phép ⊗ biểu diễn hàm t-chuẩn, ví dụ như toán tử Min hoặc phép
nhân đại số. Khi rA và rB là giá trị thực, các toán tử max và min đều có thể được sử
dụng ở đây.
Ramot [36] đề xuất trong phép hợp và phép giao của tập mờ phức thì các giá
trị thành phần pha ωA∩B(x) và ωA∪B(x) có thể được chọn tùy thuộc vào ngữ cảnh ứng
dụng. Các phép toán được sử dụng với ωA∩B(x) thì cũng được dùng với ωA∩B(x) và
có thể có các dạng như sau:
Sum : ωA∪B = ωA + ωB
(1.10)
M ax : ωA∪B = max (ωA, ωB)
(1.11)
26
M in : ωA∪B = min (ωA, ωB)
(1.12)
(cid:40)
”W innerT akeAll” : ωA∪B =
ωA rA > rB ωB rA < rB
(1.13)
W eightedAverage : ωA∪B =
rA.ωA + rB.ωB rA + rB
(1.14)
Average : ωA∪B =
ωA + ωB 2
(1.15)
Dif f erence : ωA∪B = ωA − ωB
(1.16)
Ví dụ 1.2. Cho 2 tập mờ phức A và B được định nghĩa trên không gian nền U như
A = 1.0ej.0/x + 0.4ejπ/y + 0.8ejπ/2 /z
B = 0.2ej.3π/4 /x + 0.3ej.2π/y + 1.0ej.π/5 /z
sau:
A ∪ B = 1.0ej.0/x + 0.4ej.π/y + 1.0ej.π/5 /z
Thứ tự trong tập các số phức
Phép hợp giữa hai tập mờ phức (sử dụng hàm max- min) được tính toán như sau:
Vào năm 2011, Azam và cộng sự [62] đã giới thiệu về không gian metric giá
trị phức và định nghĩa thứ tự từng phần (kí hiệu (cid:22)) trên tập các số phức.
Im(z2), điều đó có nghĩa là z1 (cid:22) z2 nếu thỏa mãn một trong bốn điều kiện sau:
Định nghĩa 1.6 ([62]). Cho C là tập các số phức với z1, z2 ∈ C, thứ tự từng phần (cid:22) trong C được xác định như sau: z1 (cid:22) z2 khi và chỉ khi Re(z1) ≤ Re(z2) và Im(z1) ≤
• Re (z1) = Re (z2) và Im (z1) = Im (z2),
• Re (z1) < Re (z2) và Im (z1) = Im (z2),
• Re (z1) = Re (z2) và Im (z1) < Im (z2),
• Re (z1) < Re (z2) và Im (z1) > Im (z2).
27
1.4.4. Logic mờ phức
Logic mờ phức [44] là mô hình được thiết kế để duy trì những ưu điểm của
logic mờ truyền thống, và cập nhật thêm những đặc điểm nổi trội riêng biệt của tập
mờ phức. Điểm đáng chú ý của logic mờ phức là các luật được xây dựng bằng việc sử
dụng mô hình logic mờ phức này được liên kết một cách chặt chẽ với nhau; mối quan
hệ giữa các thành phần pha biểu hiện bởi phép kéo theo mờ phức. Điều này dẫn đến
một mối tương tác duy nhất, sự phụ thuộc giữa các luật mà cho phép xây dựng một hệ
thống mới gọi là hệ logic mờ phức.
Giống như hệ logic mờ truyền thống, hệ logic mờ phức được xây dựng dựa trên
các luật suy diễn. Tuy nhiên, đầu ra của mỗi một luật này là một tập mờ phức, do đó
đối với hệ logic mờ phức thì việc cân nhắc tính toán thành phần pha đóng một vai
trò quan trọng trong việc xác định ra kết quả đầu ra cuối cùng của hệ logic mờ phức.
Ngược lại trong hệ logic mờ truyền thống thì chỉ cần xem xét đến thành phần biên độ
hay chính là mức độ thuộc mà thôi. Đặc điểm này của hệ logic mờ phức được coi là
hệ quả trực tiếp của chính các tính chất của số phức, và không thể thực hiện song song
giống như tập mờ truyền thống.
Một trong những yêu cầu cơ bản đặt ra đối với hệ logic mờ phức là cần duy trì
những ưu điểm của tập mờ truyền thống. Do đó mô hình logic mờ phức sẽ tiếp thu
được những ưu điểm của cả tập mờ và của cả lý thuyết số phức. Đặc biệt là:
- Mô hình phải duy trì được khả năng duy nhất của logic mờ để nắm bắt được
cả dữ liệu số và tri thức ngôn ngữ.
- Xây dựng hệ thống sử dụng logic mờ phức phải duy trì được mối quan hệ đơn
giản và trực quan (mặc dù bản chất trực quan của các cấp độ hàm thuộc phức).
- Hệ thống logic mờ phức sẽ dựa trên những luật tăng trưởng “song song”, do
đó đạt được yêu cầu tính toán hiệu quả.
Do đó, hệ logic mờ phức tương tự như hệ logic mờ thông thường. Một hệ logic
mờ phức liên quan đến vấn đề thực hiện mờ hóa vấn đề (bao gồm định nghĩa các luật
mờ), suy diễn mờ và cuối cùng là giải mờ để thu được kết quả. Tất nhiên, tất cả các tập
mờ được sử dụng cho việc xây dựng một hệ logic mờ phức được đặc trưng bởi hàm
thuộc giá trị phức.
28
Hệ logic mờ phức sử dụng luật được xây dựng dưa trên tập mờ phức để tạo ra
X là A then Y là B” với X là biến nhận các giá trị x từ không gian nền U, A là một
một hệ logic mờ phức. Những luật này được biểu diễn theo dạng câu lệnh if-then “ If
tập mờ phức trên U, Y nhận các giá trị y từ không gian nền V , B là một tập mờ phức
trên V . Một luật chính là biểu diễn của một quan hệ kéo theo mờ phức giữa hai tiền
đề mờ phức không có điều kiện p và q, trong đó tiền đề p được mô tả là cụm “X là A”
còn q được mô tả bởi “Y là B”.
Quan hệ kéo theo mờ phức được mô tả bởi một hàm thuộc giá trị phức và được
kí hiệu bởi µA→B (x, y). Theo lý thuyết của tập mờ phức thì hàm thuộc được chia ra
thành 2 phần riêng biệt: thành phần biên độ và thành phần pha. Thành phần biên độ
(kí hiệu bởi rA→B (x, y)) là cấp độ hàm thuộc có giá trị thực, nó chỉ rõ mức độ thực
của quan hệ kéo theo,.. ví dụ như mức độ tăng trưởng luật.
Thành phần pha (kí hiệu bởi ωA→B (x, y)) liên quan đến vấn đề kết hợp pha
trong phép kéo theo. Theo đúng ý nghĩa của nó thì thành phần pha chiếm ít ảnh hưởng
đến phần kết quả, tuy nhiên,nó cũng là một tham số quan trọng khi một số quan hệ
kéo theo được xét đồng thời cùng với nhau, cùng xảy ra trong hệ logic mờ phức.
Ramot [44] đề xuất hàm kéo theo của hệ logic mờ phức được mô tả như sau:
µA→B (x, y) = µA (x) · µB (y) = rA (x) .rB (y) .ej(ωA(x)+ωB(x))
(1.17)
Ý nghĩa của hàm kéo theo mờ phức tương tự như hàm kéo theo mờ, điểm khác
biệt chỉ ở chỗ hàm thuộc trong công thức là hàm thuộc mờ phức. Chú ý ở phép kéo
theo mờ phức ở đây là, ảnh hưởng của phép tích trên thành phần biên độ của A và
B giống như đối với tập mờ thường giá trị thực. Do đó, phép tích đại số phù hợp với
cách giải thích biên độ được trình bày trong tập mờ phức, theo đó thành phần biên độ
chính tương đương với hàm thuộc giá trị thực trong tập mờ thường. Đây cũng chính là
lí do mà phép tích đại số thường được chọn cho logic mờ phức.
1.4.5. Độ đo mờ và độ đo mờ phức
Trong những năm gần đây, lý thuyết về độ đo mờ và độ đo mờ phức đã và đang
nhận được nhiều chú ý từ những nhà khoa học và nghiên cứu trong và ngoài nước phát
triển và ứng dụng trong các hệ hỗ trợ ra quyết định.
29
Định nghĩa 1.7. Một độ đo mờ phức [63] kí hiệu ρ : (F ∗ (U ) × F ∗ (U )) → [0, 1] đối
với A, B và C ∈ F ∗ (U ) nếu thỏa mãn các tính chất sau:
1. ρ (A, B) ≥ 0, ρ (A, B) = 0 khi và chỉ khi A = B
2. ρ (A, B) = ρ (B, A)
3. ρ (A, B) ≤ ρ (A, C) + ρ (C, B)
Với F ∗ (U ) là tập các tập mờ phức trong U
Dựa vào khái niệm của tập mờ phức do Ramot đề xuất, Alkouri và cộng sự
[64] cũng đề xuất một số khoảng cách giữa các tập mờ phức như sau:
Định nghĩa 1.8 ([64]). Khoảng cách giữa các tập mờ phức mờ phức được định nghĩa
như sau:
(i) Khoảng cách Hamming
n (cid:88)
|ωA (xi) − ωB (xi)|
|rA (xi) − rB (xi)| +
dCF (A, B) =
1 2
1 2π
i=1
i=1
(cid:35) (cid:34) n (cid:88) (1.18)
n (cid:88)
eCF (A, B) =
(rA (xi) − rB (xi))2 +
1 2
i=1
(cid:104) (1.19) (ii) Khoảng cách Euclidean (cid:118) (cid:117) (cid:117) (cid:116) (cid:105) 1 2π2 (ωA (xi) − ωB (yi))
(iii) Khoảng cách Hamming tiêu chuẩn
n (cid:88)
lCF (A, B) =
|rA (xi) − rB (yi)| +
|ωA (xi) − ωB (yi)|
1 2π
1 2n
i=1
i=1
(cid:35) (cid:34) n (cid:88) (1.20)
(iv) Khoảng cách Euclidean tiêu chuẩn
n (cid:88)
qCF (A, B) =
(rA (xi) − rB (xi))2 +
1 2n
i=1
(cid:104) (1.21) (cid:118) (cid:117) (cid:117) (cid:116) (cid:105) 1 2π2 (ωA (xi) − ωB (yi))
Ngoài ra, Zhang cùng cộng sự [63] cũng đưa ra khái niệm về cân bằng δ giữa
hai tập mờ phức A, B và từ đó đề xuất độ đo khoảng cách giữa các tập mờ phức:
Định nghĩa 1.9 ([63]). Cho A và B là hai tập mờ phức có hàm thuộc mờ phức tương
ứng như sau ηA (x) = pA (x) ejµA(x); ηB (x) = pB (x) ejµB(x). Khi đó A và B được coi
là cân bằng δ khi và chỉ khi (A, B) ≤ 1 − δ, 0 ≤ δ ≤ 1.
30
Định nghĩa 1.10 ([63]). Cho A và B là hai tập mờ phức có hàm thuộc mờ phức tương
ứng là: µA(x) = rA(x)ejωA(x) và µB(x) = rB(x)ejωB(x). Khoảng cách giữa hai tập mờ
phức được định nghĩa như sau:
d (A, B) = max
|ωA (x) − ωB (x)|
|rA (x) − rB (x)| ;
1 2π
sup x∈U
sup x∈U
(cid:19) (cid:18) (1.22)
1.5. Dữ liệu thực nghiệm
1.5.1. Bộ dữ liệu chuẩn
Đây là các bộ dữ liệu chuẩn lấy từ kho dữ liệu học máy UCI, bao gồm các bộ
dữ liệu sau:
• Bộ dữ liệu ung thư vú Breast Wisconsin Dataset (WBCD): Bộ dữ liệu ung thư
vú được lấy từ Bệnh viện đại học Wisconsin, Madison, Mỹ. Bộ dữ liệu bao gồm
kết quả của 699 bệnh nhân (trong đó 458 bệnh nhân được chẩn đoán là u lành
tính và 241 bệnh nhân được chẩn đoán là ung thư).
• Bệnh tiểu đường Diebete: Dữ liệu bệnh tiểu đường được lấy từ kho dữ liệu bệnh
của Đại học Y Virgina. Dữ liệu được thu thập từ 391 bệnh nhân người Mỹ gốc
Phi ở miền trung Virgina để tìm hiểu dự báo về bệnh tiểu đường.
• Bộ dữ liệu đo chất lượng rượu (Wine Quality): Bộ dữ liệu gồm các thông tin về
các mẫu rượu vang đỏ và vang trắng từ phía bắc của Bồ Đào Nha, với mục đích
là mô hình hóa chất lượng rượu vang dựa trên các thực nghiệm hóa lý để phân
loại chất lượng rượu
• Bộ dữ liệu Hình ảnh tim thai CardiotocoGraphy- CTG: Dữ liệu gồm 2126 hình
ảnh chụp tim thai (CTG) được xử lý tự động và đo các đặc điểm chẩn đoán tương
ứng. Các hình ảnh thu được cũng được phân loại bởi các bác sĩ sản khoa chuyên
nghiệp thành 10 lớp dữ liệu.
• Bộ dữ liệu Rối loạn nhịp tim (Arrhythmia): Dữ liệu được thu thập với mục đích
nghiên cứu để phân biệt giữa sự hiện diện có hay không có biểu hiện rối loạn
nhịp tim và phân nó vào một trong 13 lớp.
31
Tóm tắt về các bộ dữ liệu chuẩn BenchMark được mô tả trong Bảng 1.1, cụ thể
Bảng 1.1: Các bộ dữ liệu thực nghiệm chuẩn Benchmark
Số thứ tự
Bộ dữ liệu
Số nhãn
Số thuộc tính
Số bản ghi
1
9
680
2
2
5
390
2
3
11
1599
6
4
19
2126
10
5
36
452
13
Bộ dữ liệu ung thư vú - WBCD Bộ dữ liệu tiểu đường - Diebetes Bộ dữ liệu Chất lượng rượu - Wine Bộ dữ liệu ảnh chụp tim thai - CTG Bộ dữ liệu Rối loạn nhịp tim-Arrhythmia
như sau:
1.5.2. Bộ dữ liệu thực- Bệnh gan Liver
Trong thực tế, để chẩn đoán bệnh thì các bác sĩ cần thu thập thông tin khác
nhau từ quá trình thăm khám, từ số liệu của các kết quả xét nghiệm... Trong ứng dụng
này luận án chỉ dừng lại việc hỗ trợ chẩn đoán bệnh gan sử dụng khai thác các thông
tin là số liệu từ các kết quả xét nghiệm men gan.
Chẩn đoán viêm gan, xơ gan dựa trên kết quả xét nghiệm, các chỉ số xét nghiệm
Aminotransferase tăng từ 1,5 - 5 lần, thường dưới 10 lần giới hạn bình thường trên,
kéo dài từ 6 tháng trở lên. ALP và GGT tăng nhẹ, bilirubin, albumin và INR thường
bình thường trừ khi bệnh tiến triển hay nặng. Siêu âm, chụp cắt lớp hay chụp cộng
hưởng từ gợi ý tình trạng viêm gan mạn tính bằng các dấu hiệu thay đổi cấu trúc của
gan. Biểu hiện mô học của viêm gan mạn là sự thâm nhiễm tế bào viêm đơn nhân mà
chủ yếu là tế bào lympho ở khoảng ngưỡng cho phép [65].
Thông tin về dữ liệu bệnh gan được được trích từ hồ sơ bệnh án liên quan đến
kết quả xét nghiệm (sinh hóa máu và công thức máu) và chẩn đoán bệnh từ các bác sĩ
tại Bệnh viện Gang Thép và Bệnh viện Đa khoa Thái Nguyên. Sau khi thu được kết
quả xét nghiệm từ hồ sơ bệnh án của bệnh nhân,NCS thực hiện việc trích chọn những
thuộc tính liên quan đếnbệnh viêm gan. Cụ thể bao gồm các thuộc tính sau:
32
Bảng 1.2: Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan Liver
Số thứ tự 1 2 3 4 5 6 7 8 9
Thuộc tính Tuổi (Age) Giới tính (Gender) 3 AST ALT GGT Albumin TB DB DB/TB
Mô tả Tuổi tính đến ngày xét nghiệm 0: nam; 1: nữ Chỉ số men AST Chỉ số men ALT Chỉ số GGT Chỉ số Albumin Chỉ số Total Bilirubin Chỉ số Direct Bilirubin Tỷ số DB/TB
Tập dữ liệu bệnh gan thực nghiệm gồm 4156 bệnh nhân đến khám và điều trị
bệnh do rối loạn men gan. Trong số 4156 hồ sơ bệnh nhân, có 1202 hồ sơ bệnh nhân
được chuẩn đoán là mắc bệnh viêm gan.
1.5.3. Các độ đo đánh giá thực nghiệm
Mục đích: Các độ đo được sử dụng để đánh giá mô hình hệ suy diễn mờ phức
đối với hệ hỗ trợ ra quyết định. Với kết quả phân loại có:
- TP: số lượng mẫu của lớp Positive được phân loại đúng là Positive
- TN: số lượng mẫu của lớp Negative được phân loại đúng là Negative
- FP: số lượng mẫu của lớp Negative bị phân loại nhầm thành Positive
- FN: số lượng mẫu của lớp Positive bị phân loại nhầm thành Negative
• Độ chính xác (Accuracy): là tỉ lệ giữa số mẫu được phân loại đúng trên tổng số
Accuracy =
mẫu.
T N + T P T N + F N + F P + T P
(1.23)
• Độ đo Precision và Recall Chỉ số độ đo Precision và recall được tính theo công
precision =
thức sau:
T P T P + F P
recall =
(1.24)
T P T P + F N
(1.25)
• Thời gian thực hiện - Time(s): tổng thời gian thực hiện (giây) của hệ thống phân
loại
33
1.6. Kết Chương 1
Ra quyết định là một phần khá quan trọng của cuộc sống, do đó nhiều nhà
nghiên cứu đã đi tìm hiểu, ứng dụng với nhiều hướng tiếp cận khác nhau, với nhiều
kĩ thuật khác nhau. Mục tiêu của quá trình hỗ trợ ra quyết định là làm thế nào để có
thể đưa ra được quyết định cuối cùng một cách chính xác và đúng đắn nhất. Ngày
nay, với nhu cầu thực tiễn của cuộc sống và sự phát triển nhanh chóng của công nghệ
dẫn đến việc gia tăng về dung lượng cũng như tính không chính xác, không chắc chắn
của dữ liệu. Những vấn đề không rõ ràng, chính xác hay không chắc chắn này có thể
được biểu diễn bởi lý thuyết thống kê, xác suất hay lý thuyết mờ. Chính vì lí do đó
mà hướng tiếp cận mờ đang là một hướng nghiên cứu được nhiều nhà khoa học quan
tâm và chú ý, trong đó phải nói đến hướng tiếp cận theo hệ suy diễn mờ. Tuy nhiên,
các hệ suy diễn mờ thường xử lý với dữ liệu thực mà không thể đưa ra cách biểu diễn
phù hợp với những dữ liệu có thêm yếu tố chu kì, định kì hay có yếu tố bổ sung. Để
khắc phục hạn chế đó, Ramot đưa ra lý thuyết về CFS, hệ logic mờ phức. Và nhiều
nhà khoa học đã tiếp cận theo hướng CFS để xử lý đối với những lớp bài toán mà dữ
liệu có yếu tố, chu kì, định kì hay yếu tố bổ sung.
Do đó, trong khuôn khổ nội dung Chương 1, luận án đi trình bày tổng quan về
bài toán ra quyết định theo hướng tiếp cận hệ suy diễn mờ và tập trung vào tiếp cận
đối với các hệ thống mờ phức. Lý thuyết về CFS, về các hệ thống dựa trên lý thuyết
tập mờ phức cũng được trình bày trong nội dung chương này và sẽ là các kiến thức
nền và sử dụng trong các chương tiếp sau của luận án. Dựa vào những nghiên cứu đã
có, các hệ thống phát triển dựa trên lý thuyết CFS hầu như chưa có ý nghĩa phức thực
sự. Đó cũng chính là động lực định hướng nghiên cứu của luận án, bao gồm:
- Nghiên cứu các lý thuyết về tập mờ phức, logic mờ phức và độ đo dựa trên
tập mờ phức;
- Phát triển hệ suy diễn theo mô hình FIS dựa trên lý thuyết tập mờ phức;
- Nghiên cứu các phương pháp cải tiến hệ suy diễn dựa trên tập mờ phức đã đề
xuất.
Cuối chương, luận án cũng trình bày về các bộ dữ liệu thực nghiệm cũng như
thước đo dùng để đánh giá thực nghiệm trong các chương tiếp sau của luận án.
34
Chương 2. XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI (M-CFIS)
2.1. Giới thiệu
Logic mờ là một nhánh của lý thuyết tập hợp mờ với mục đích bắt chước suy
nghĩ và lý luận của con người nhằm tăng hiệu quả của quá trình ra quyết định khi xử
lý sự không chắc chắn hoặc dữ liệu mơ hồ. Hệ thống suy diễn mờ (FIS) có thể được
định nghĩa như là một ánh xạ phi tuyến tính kết quả của nó dựa trên suy luận mờ. Sự
phát triển với tốc độ nhanh của tập mờ đã dẫn đến sự phát triển của FIS bao gồm các
FIS được sử dụng phổ biến nhất, đó là hệ thống Mamdani, Sugeno và Tsukamoto. Kể
từ khi ra đời, FIS đã được ứng dụng thành công trong nhiều bài toán thực tế. Nhiều
nghiên cứu sử dụng hệ suy diễn mờ để giải quyết bài toán hệ hỗ trợ ra quyết định nhằm
giúp cho những nhà ra quyết định đưa ra những quyết định chính xác và phù hợp.
Nhiều nhà nghiên cứu đã phát triển hệ suy diễn mờ theo mô hình mờ Mamdani,
hệ ANFIS và đồng thời đưa ra ứng dụng đối với nhiều vấn đề, bài toán thực tế như:
đánh giá rủi ro môi trường[66], chẩn đoán bệnh [67, 68], bài toán nâng cao độ tương
phản của ảnh [69], đánh giá hiệu suất của công ty [70] hay
Thêm nữa, các hệ thống ANFIS dựa trên Mamdani và ứng dụng của nó cũng
được nhiều nhà khoa học nghiên cứu và giới thiệu. Borkar và cộng sự [71] áp dụng
mô hình ANFIS trên hệ FIS Mamdani trong việc phát triển hệ thống giám sát hiệu
suất cho thiết bị trao đổi nhiệt dạng ống, đồng thời hệ thống cũng được đánh giá là
hiệu quả hơn so với ANFIS thông thường. Nhóm tác giả Chai và Zhang [72] đưa ra
mô hình ANFIS dựa trên Mamdani và ứng dụng chúng cho việc đánh giá mức độ lưu
lượng giao thông. Tác giả cũng chứng minh được rằng mô hình này vượt trội hơn về
35
thời gian tính toán so với mô hình ANFIS thường và sai số thử nghiệm ít hơn.
Mặc dù FIS được sử dụng rộng rãi, nhưng hầu hết các hệ FIS đều là thực
nghiệm tính toán của các hệ mờ cơ bản như Mamdani FIS, Sugeno FIS hay Tsukamoto
FIS trên miền số thực. Tuy nhiên, trong thực tế, nhiều kết quả có thể có những biến
động không mong muốn, nhiều kịch bản mà cần có các yếu tố bổ sung tới dữ liệu
hay những loại dữ liệu có xu hướng tuần hoàn, chẳng hạn như lượng mưa được ghi lại
trong một khu vực hoặc những thông tin bổ sung tác động vào quá trình chẩn đoán
bệnh. Do đó, hiển nhiên là cần phải có phương pháp nhằm mục đích thể hiện những
thông tin bổ sung, những thông tin có yếu tố chu kì, định kì. Năm 2002, khi Ramot
đưa ra lý thuyết về CFS [36, 44] thì tác giả đã đưa ra khái niệm pha để biểu diễn các
thông tin bổ trợ, thông tin có yếu tố thời gian hay thông tin về yếu tố chu kì, định kì
đối với dữ liệu. Ưu điểm của CFS là khả năng mô hình hóa các hiện tượng và sự kiện
theo thời gian, theo giai đoạn để từ đó có thể cho thấy tổng thể chúng trong một ngữ
cảnh nhất định.
Hệ logic mờ phức đầu tiên được giới thiệu Ramot[44] là hệ phát triển từ hệ
thống logic mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến
đổi phức tương ứng của nó. Một nghiên cứu khác bởi Man và cộng sự [45] dựa trên
sự kết hợp giữa phương pháp học quy nạp với hệ suy diễn trong tập phức. Một phiên
bản học nhúng khác với mạng mờ nơ ron trên tập CFS với tên gọi Hệ thống suy diễn
mờ phức nơ ron thích nghi (ANCFIS) được giới thiệu bởi Chen và công sự [46]. Sau
đó, hai cải tiến về tốc độ tính toán của hệ ANCFIS do nhóm tác giả Yazdanbakhsh và
Dick được cũng được giới thiệu trong [48, 54].
Tuy nhiên, các hệ thống phát triển dựa trên tập mờ phức đã có đều chưa thực
sự đúng với ý nghĩa của hệ thống suy diễn mờ phức thực sự. Hầu hết các hệ thống đều
sử dụng tập mờ phức làm biến đầu vào nhưng các nghiên cứu đều chỉ sử dụng thành
phần biên độ trong quá trình ra quyết định mà bỏ qua thành phần pha. Ví dụ như hệ
logic mờ phức của Ramot [44] thì bỏ qua thành phần pha trong giải mờ kết quả đầu
ra, làm cho hệ thống không đủ yếu tố khi xử lý với dữ liệu chuỗi thời gian của các yếu
tố có sự lặp lại hoặc xảy ra định kì, và điều này làm giảm đi ý nghĩa của mô hình hệ
suy diễn mờ phức, trở thành hệ suy diễn mờ thường. Còn mô hình ANCFIS của Man
36
và Chen [46] thì sử dụng phép tích vô hướng vec tơ cho quá trình tổng hợp kết quả,
và coi các giá trị đầu vào phức như là các giá trị thực, do đó nó thu được một giá trị
vô hướng đối với phép tích vô hướng. Điều này có thể sẽ không thực hiện được nếu
các đầu vào thực sự là các giá trị phức, vì tích vô hướng của hai số phức là một giá trị
phức chứ không phải là một giá trị vô hướng. Do đó hệ thống ANCFIS không thực sự
là hệ thống phức khi đầu ra của hệ thống không thể đại diện cho tính tuần hoàn của
các thành phần trong đó.
Bên cạnh đó, các nghiên cứu về hệ FIS thường như Mamdani, Sugeno, Tsukamoto
hay các phiên bản khác nhau của kiến trúc ANFIS chỉ có thể xử lý các hiện tượng
không theo chu kỳ hoặc không có yếu tố bổ sung. Còn khi giảiquyết đối với những bài
toán có dữ liệu có yếu tố thời gian, có yếu tố chu kì, định kì thì các hệ mờ, hệ ANFIS
hay các hệ thống mờ phức đã có thường chỉ đưa ra hai phương thức xử lý chung: thứ
nhất là bỏ qua thông tin liên quan đến yếu tố thành phần pha; thứ hai là biểu diễn
thành phần biên độ và pha riêng biệt với nhau thành hai thành phần riêng biệt bằng
cách sử dụng hai tập mờ. Điều này sẽ làm cho thông tin bị mất mát và kết quả thu
được không có độ tin cậy cao (nếu các thông tin về thành phần pha bị bỏ qua) hay làm
sai lệch thông tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và pha được
xử lý riêng biệt). Và cuối cùng thì thời gian tính toán sẽ tăng thêm do số lượng các bộ
cần được xử lý tăng thêm.
Dựa trên các nghiên cứu đã có về việc phát triển mô hình hệ suy diễn mờ
Mamdani và dựa trên mô hình Hệ logic mờ phức do Ramot đề xuất, luận án đề xuất
lựa chọn mô hình hệ suy diễn mờ Mamdani là mô hình chi tiết cho Module Suy diễn
mờ phức Hệ logic mờ phức của Ramot. Do đó, trong khuôn khổ nội dung chương này,
luận án đề xuất Hệ suy diễn mờ phức theo mô hình mờ Mamdani và chi tiết các thành
phần trong hệ thống. Thêm vào đó, luận án cũng đề xuất các toán tử t-chuẩn, t-đối
chuẩn mờ phức nhằm mục đích bổ sung thêm lý thuyết đối với tập mờ phức.
2.2. Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức
Trong lôgic mờ khái niệm t-chuẩn và t-đối chuẩn đóng vai trò khá quan trọng
trong việc tổng quát hóa các toán tử kết hợp and, or và đóng góp cơ bản cho lập luận
37
xấp xỉ đối với những tình huống thông tin thiếu chính xác, chưa đầy đủ trong hệ hỗ
trợ ra quyết định. Chính vì lí do đó, trong nội dung Chương 2 này, luận án đề xuất
các phép toán t-chuẩn và t-đối chuẩn dựa trên lý thuyết tập mờ phức và minh họa ứng
dụng vào trong việc giải bài toán hỗ trợ ra quyết định
2.2.1. Toán tử t-chuẩn và t-đối chuẩn
Toán tử t-chuẩn và t- đối chuẩn đóng một vai trò quan trọng đối với việc xây
dựng các phép toán của lý thuyết mờ. Sau đây, một vài khái niệm cơ bản về phép toán
t-chuẩn và t-đối chuẩn được giới thiệu như là tiền đề để phát triển toán tử đó trên lý
thuyết tập mờ phức.
Định nghĩa 2.1 ([73, 74]). Một hàm T : [0, 1] × [0, 1] → [0, 1] được gọi là hàm t-chuẩn
nếu nó thỏa mãn bốn điều kiện sau:
(i) T (1, x) = x với mọi x,
(ii) T (x, y) = T (y, x) với mọi x, y,
(cid:48)
, y
(iii) T (T (x, y) , z) = T (x, T (y, z)) với mọi x, y và z,
(cid:48)và y ≤ y
(cid:48) thì T (x, y) ≤ T (cid:0)x
(cid:48)(cid:1).
(iv) Nếu x ≤ x
Bốn T-norm cơ bản
(1) Tmin(x, y) = min(x, y);
(2) TP (x, y) = xy
(3) TL(x, y) = max(x + y − 1, 0)
min(x, y) nếu max(x, y) = 1
TD(x, y) =
0, nếu max(x, y) < 1
(4) (cid:40)
Định nghĩa 2.2 ([73, 74]). Một hàm S : [0, 1] × [0, 1] → [0, 1]được gọi là phép t-đối
chuẩn nếu nó thỏa mãn bốn điều kiện sau đây:
(i) S (0, x) = x với mọi x,
(ii) S (x, y) = S (y, x) với mọi x, y,
(cid:48)
, y
(iii) S (S (x, y) , z) = S (x, S (y, z)) với mọi x, y và z,
(cid:48)và y ≤ y
(cid:48) thì S (x, y) ≤ S (cid:0)x
(cid:48)(cid:1).
(iv) Nếu x ≤ x
38
Bốn T-đối chuẩn cơ bản
(1) Smax(x, y) = max(x, y);
(2) SP (x, y) = x + y − xy
(3) SL(x, y) = min(x + y, 1)
max(x, y) nếu min(x, y) = 0
SD(x, y) =
1, nếu min(x, y) (cid:54)= 0
(4) (cid:40)
2.2.2. Toán tử t-chuẩn và t-đối chuẩn mờ phức
Dựa trên lý thuyết về phép toán t-chuẩn và t-đối chuẩn, nội dung này luận án
đề xuất phát triển các phép toán đó trên lý thuyết của tập mờ phức. Cụ thể như sau:
Định nghĩa 2.3. Cho ánh xạ J : [0, 1] × [0, 1] → [0, 1]với [0, 1] là mặt phẳng đơn vị
phức chứa tập hợp các số phức. Phép J được gọi là phép t-chuẩn mờ phức nếu các
điều kiện sau thỏa mãn đối với mọi giá trị p, q, r ∈ [0, 1], với p, q, r tương ứng là các
hàm thuộc mờ phức p = p1ejω1, q = q1ejω2, r = r1ejω3
(i) J (p, q) = J (q, p),
(ii) J (p, q) ≤ J (p, r), nếu q ≤ r,
(iii) J (p, J (q, r)) = J (J (p, q) , r),
(iv) J (p, 1) = p.
Định nghĩa 2.4. Cho ánh xạ J ∗ : [0, 1] × [0, 1] → [0, 1]với [0, 1] là mặt phẳng đơn vị
phức chứa tập hợp các số phức. Phép J ∗ được gọi là phép t-đối chuẩn mờ phức nếu
các điều kiện sau thỏa mãn đối với mọi giá trị p, q, r ∈ [0, 1], với p, q, rtương ứng là
các hàm thuộc mờ phức p = p1ejω1, q = q1ejω2, r = r1ejω3
(i) J ∗ (p, q) = J ∗ (q, p),
(ii) J ∗ (p, q) ≤ J ∗ (p, r) nếu q ≤ r,
(iii) J ∗ (p, J ∗ (q, r)) = J ∗ (J ∗ (p, q) , r),
(iv) J ∗ (p, 0) = p.
39
p ∈ (0, 1) thì nó được gọi là hàm toán tử t-chuẩn mờ phức Archimedean. Nếu một toán
Định nghĩa 2.5. Nếu hàm t-chuẩn mờ phức J (p, q) liên tục và |J (p, p)| < p với mọi
tử t-chuẩn mờ phức Archimedean tăng chặt với mọi p, q ∈ (0, 1) thì nó được gọi là toán
tử t-chuẩn mờ phức Archimedean chặt.
Định nghĩa 2.6. Nếu hàm t-đối chuẩn mờ phức J ∗ (p, q) liên tục và |J ∗ (p, p)| < p với
mọi p ∈ (0, 1) thì nó được gọi là hàm toán tử t-đối chuẩn mờ phức Archimedean. Nếu
một toán tử t-đối chuẩn mờ phức Archimedean tăng chặt với mọi p, q ∈ (0, 1) thì nó
được gọi là toán tử t-đối chuẩn mờ phức Archimedean chặt.
Ví dụ 2.1. Có thể mở rộng toán tử Zadeh sang toán tử T mờ phức như sau:
• J (p, q) = min (p, q),
1 (p, q) = max (p, q).
• J ∗
Ví dụ 2.2. Một vài toán tử T mờ phức sau:
• J2 (p, q) = p · q = p1 · q1e(w1+w2),
2 (p, q) = p + q − pq.
• J ∗
J (p, q) = max (cid:0)p + q − 1, 0(cid:1) = max (cid:0)p1 · ejω1 + q1 · ejω2 − 1.ej0, 0.ej0(cid:1)
Ví dụ 2.3. Cho 1 = 1.ej0 và 0 = 0.ej0, toán tử t-chuẩn mờ phức Lukasiewics là:
= max
(p1 + q1 − 1) · ej(ω1+ω2), 0.ej0(cid:17)
= [(p1 + q1 − 1) ∨ 0] · ej[(ω1+ω2)∨0]
= [(p1 + q1 − 1) ∨ 0] · ej[(ω1+ω2)]
(cid:16)
= min
J ∗ (p, 0) = min (cid:0)p1 + q1, 1(cid:1) = min (cid:0)p1 · ejω1 + q1 · ejω2, 1.ej0(cid:1) (p1 + q1) · ej(ω1+ω2), 1.ej0(cid:17)
= [(p1 + q1) ∧ 1] · ej(ω1+ω2)∨0
= [(p1 + q1) ∧ 1] · ej(ω1+ω2)
(cid:16)
Định lý 2.1. Toán tử T-chuẩn J và T- đối chuẩn J ∗ phải thỏa mãn các tính chất sau:
J (p, J ∗ (q, r)) = J ∗ (J (p, q) , J (p, r)),
J ∗ (p, J (q, r)) = J (J ∗ (p, q) , J ∗ (p, r))
(i) Tính chất phân phối:
40
J (J ∗ (p, q) , p) = p,
J ∗ (J (p, q) , p) = p,
(ii) Tính nuốt:
J (p, p) = p,
J ∗ (p, p) = p.
(iii) Tính lũy đẳng:
1 (p, q) = max (p, q) thì ta có:
.
Bổ đề 2.1. Giả sử J1 (p, q) = min (p, q)và J ∗
Tính chất phân phối → tính nuốt →tính lũy đẳng→ { J=J1 J∗ = J ∗ 1
Định nghĩa 2.7. Cho N : [0, 1] × [0, 1] → [0, 1], N được gọi là hàm phủ định nêú nó
thỏa mãn tính chất sau:
• N (0) = 1, N (1) = 0,
• N (p) ≤ N (q) khi p ≥ q.
Định nghĩa 2.8. Hàm phủ định N được coi là chặt nếu nó thỏa mãn điều kiện: N là
hàm liên tục và giảm chặt tức là N (p) < N (q) nếu p > q với mọi p, q ∈ [0, 1]
p với mọi p ∈ [0, 1]
Định nghĩa 2.9. Hàm phủ định N được coi là mạnh nếu thỏa mãn điều kiện N (N (p)) =
Ví dụ 2.4. Toán tử phủ định Zadeh có thể được chuyển sang toán tử phủ định phức
như sau: N (p) = 1 − p.
Định lý 2.2. Toán tử t-chuẩn J, toán tử t-đối chuẩn J ∗ và toán tử phủ định phải thỏa
mãn các luật sau:
N (J (p, q)) = J ∗ (N (p) , N (q)) ,
N (J ∗ (p, q)) = J (N (p) , N (q)) ,
(i) Luật De Morgan:
(ii) Luật loại trừ trung bình: J (p, N (p)) = 0 và J ∗ (p, N (p)) = 1.
41
Bổ đề 2.2. Nếu toán tử phủ định N là mạnh thì hai điều kiện về luật loại trừ trung
bình trong định lý 2.2 là tương đương.
Bổ đề 2.3. Nếu toán tử phủ định N là mạnh thì
• J (p, q) = N (J ∗ (N (p) , N (q))),
• J ∗ (p, q) = N (J (N (p) , N (q))).
2.2.3. Ví dụ minh họa hỗ trợ ra quyết định
Trong phần này, luận án trình bày về ứng dụng toán tử t-chuẩn và t-đối chuẩn
trong quá trình hỗ trợ ra quyết định, quá trình gồm các bước sau:
Bước 1. Xây dựng ma trận ra quyết định mờ
Giả sử vấn đề hỗ trợ ra quyết định với m phương án Υ (i = 1, 2, ..., m) và n
Γ = (yik)m×n trong đó yik thể hiện mức độ mà người ra quyết định thích phương án Υi đối với tiêu chí Λk. Trọng số của tiêu chí được diễn tả bởi các số mờ phức CFNs
tiêu chí Λk (k = 1, 2, ..., n). Người ra quyết định đi xây dựng ma trận ra quyết định
αk =
µαkej(ωαk)(cid:17)
, (k = 1, 2, ..., n), với µαk là thành phần biên độ hay mức độ thích
(cid:16)
của người ra quyết định đối với tiêu chí Λk và ωαklà thành phần pha.
D = (λik)m×n, với
, i = 1, ..., m; k = 1, ..., n
λik =
yik
yik max ∀i,k
Bước 2. Biến đổi ma trận quyết định Γ = (yik)m×n thành ma trận chuẩn hóa
Bước 3. Sử dụng các toán tử trong ví dụ 2.3 để tính toán t-chuẩn mờ phức
Lukasiewicz
Bước 4: Tổng hợp các cấp độ thuộc phức.
Bước 5: Xem xét điểm cao nhất là ứng cử viên cho thứ hạng tốt nhất.
Ví dụ số trên bộ dữ liệu thực bệnh Viêm gan thu thập ở Bệnh viện Gang
thép Thái Nguyên và Bệnh viện đa khoa Thái Nguyên. Những bệnh nhân này đến
Bệnh viện để kiểm tra chức năng chức năng gan theo 8 chỉ số, bao gồm AST, ALT,
AST/ALT, GGT, Albumin, Total Bilirubin, Direct Bilirubin trực tiếp, DB/TB. Dựa
trên các kết quả này, bác sĩ có thể yêu cầu bệnh nhân thực hiện các xét nghiệm bổ
sung nhằm cải thiện kết quả chẩn đoán.
42
Bước 1. Tiến hành xây dựng ma trận ra quyết định mờ dựa vào bộ dữ liệu.
Theo ý kiến các chuyên gia chuyên ngành trong quá trình chẩn đoán bệnh viêm
gan, bốn tiêu chí cơ bản thường được sử dụng, xem xét khi đưa ra quyết định gồm các
tiêu chí sau:
Tiêu chí 1 (C1): Chỉ số AST và ALT tăng và AST cao hơn ALT
Tiêu chí 2 (C2): Chỉ số Albumin giảm trong khi AST và ALT tăng
Tiêu chí 3 (C3): Tỷ lệ DB/TB nhỏ hơn 20%
Tiêu chí 4 (C4): Tỷ lệ DB/TB trong khoảng 20-50%
Các yêu cầu kiểm tra (kí hiệu E1, E2 và E3) sau cần thực hiện:
E1: Kiểm tra HbsAg, HbeAg và viêm gan C
E2: Kiểm tra chức năng gan gồm PT, APTT và tỷ lệ INR
E3: Xét nghiệm Hemolysis
Đầu tiên, dựa vào ý kiến của chuyên gia chuyên ngành khi thực hiện chẩn đoán
bệnh viêm gan và dựa vào tình hình khảo sát thực tế của các bệnh nhân khi đi khám
bệnh chẩn đoán có bị viêm gan hay không, ma trận ra quyết định tương ứng với các
tiêu chí và yêu cầu thực hiện các xét nghiệm kiểm tra của bác sĩ đối với bệnh nhân,
ma trận ra quyết định đối với vấn đề chẩn đoán bệnh viêm gan được mô tả trong Bảng
Bảng 2.1: Ma trận ra quyết định dựa trên các mẫu dữ liệu
C1 C2 C3 C4 0.5 0.8 0.2 0.2 0.3 0.7
0.5 0.8 0.5
0.2 0.6 0.9
E1 E2 E3
2.1.
Từ bảng ma trận ra quyết định trên các mẫu dữ liệu, ta tiến hành mờ hóa sử
dụng hàm mờ Gauss đối với dữ liệu có dạng tương ứng với phần thực và phần ảo như
Re(Gauss) = exp
sau: (cid:104) (cid:1)2(cid:105)
Im(Gauss) = − exp
−0.5(cid:0) x−m σ (cid:104) −0.5(cid:0) x−m σ
× (cid:0) x−m σ2
(cid:1)2(cid:105) (cid:1)
Do đó, ma trận kết quả thu được như trong Bảng 2.2.
Trong đó Ai, Pi tương ứng là giá trị biên độ và giá trị pha của tiêu chí Ci.
43
Bảng 2.2: Ma trận quyết định mờ
A1 0.9727 0.9727 0.9809
P1 -6.44E-14 0.0899 0.0154
A2 0.9727 0.9727 0.9727
P2 0.1798 -1.87E-11 0.1798
A3 0.9727 0.9920 0.9727
P3 0.0830 0.0391 -1.85E-06
A4 0.9997 0.9999 0.9997
P4 0 0.0014 0.0028
Vectơ trọng số của các tiêu chí thu được: ((0.5, 0.4) , (0.6, 0.3) , (0.3, 0.4) , (0.2, 0.6)).
Bước 2: Tiến hành chuẩn hóa ma trận ra quyết định mờ
(cid:48)
Pi
(cid:48) A
i =
i =
Ai max{Ai,i=1,...,n} ; P
max{Pi,i=1,...,n} với mọi i = 1, ..., n.
Chuẩn hóa ma trận quyết định mờ theo công thức sau:
Bảng 2.3: Ma trận chuẩn hóa
A1 0.9730 0.9728 0.9812
P1 0.0000 1.0000 0.0857
A2 0.9730 0.9728 0.9730
P2 1.0000 0.0000 1.0000
A3 0.9730 0.9921 0.9730
P3 0.4616 0.4349 0.0000
A4 1.0000 1.0000 1.0000
P4 0.0000 0.0156 0.0156
Kết quả thu được ma trận quyết định chuẩn hóa như Bảng 2.3 sau:
Bước 3. Tính toán t-chuẩn mờ phức
Sử dụng toán tử trong ví dụ 2.3 để tính t-chuẩn mờ phức Lukasiewicz, và tổng
Bảng 2.4: Ma trận quyết định mờ
A1 0.9458 0.9386 0.9541
P1 0.1952 0.6951 0.2808
A2 0.8988 0.9188 0.8588
P2 1.6667 0.6667 1.6667
A3 0.8986 0.9479 0.8886
P3 0.6879 0.4441 0.2264
A4 0.9505 0.9807 0.9531
P4 0.0077 0.0154 0.0231
hợp các giá trị thu được kết quả là một ma trận quyết định mờ (Bảng 2.4) sau:
Bước 4. Tổng hợp các cấp độ thuộc phức
Giải mờ kết quả trong Ma trận quyết định mờ, ta thu được ma trận quyết định
cuối cùng có trong Bảng 2.5.
Bước 5. Dựa vào bảng ma trận quyết định kết quả, các kiểm tra yêu cầu tương
ứng được chọn là các giá trị lớn nhất (giá trị bôi đậm) trong mỗi tiêu chí.
Kết quả từ ví dụ số đối với toán tử t-chuẩn, t-đối chuẩn mờ phức trong bài toán
hệ hỗ trợ ra quyết định đã được bác sĩ xác minh kết quả yêu cầu kiểm tra là hợp lý. Từ
44
Bảng 2.5: Ma trận quyết định kết quả
C3 0.7 0.8 0.95
C1 0.9 0.45 0.5
C2 0.92 0.97 0.5
C4 0.94 0.8 0.89
E1 E2 E3
đó, ta có thể thấy rằng việc áp dụng các toán tử t-chuẩn và t-đối chuấn mờ phức trong
việc hỗ trợ ra quyết định đã cho vấn đề quá trình ra quyết định được giải quyết đơn
giản và hiệu quả.
2.3. Hệ suy diễn mờ phức Mamdani (M-CFIS)
2.3.1. Đề xuất hệ suy diễn mờ phức Mamdani
Như trong tìm hiểu về hệ thống logic mờ phức do Ramot đề xuất [44] dựa trên
lý thuyết tập mờ phức thì nhóm tác giả mới chỉ đưa ra mô hình hệ thống logic mờ phức
tổng quát mà không chỉ rõ cụ thể từng bước trong mô hình. Và do Ramot và cộng sự
chỉ đưa ra mô hình về hệ logic tổng quát chứ chưa đưa ra cụ thể về hệ FIS nào sử dụng
trong hệ thống logic mờ phức đó. Thêm nữa, trong hầu hết các giai đoạn của hệ thống
logic mờ phức đều bỏ qua thành phần pha, đầu vào vẫn chủ yếu là các giá trị số thực.
Như vậy, hệ thống logic mờ phức này vẫn chưa thể nắm bắt được các yếu tố liên quan
đến thời gian (thông tin liên quan đến điều kiện pha).
Với mục đích chi tiết cụ thể hóa cho Module suy diễn mờ phức trong hệ logic
mờ phức do Ramot đề xuất [44] theo một mô hình suy diễn từ hệ FIS truyền thống
(cụ thể hệ FIS Mamdani), NCS đề xuất hệ thống suy diễn mờ phức Mamdani, đây
cũng được coi là mô hình suy diễn mờ phức đầu tiên phát triển từ hệ FIS truyền thống
Mamdani. Do mục đích là phát triển của hệ suy diễn mờ Mamdani trên tập mờ phức
cho nên trong mô hình đề xuất sẽ thay thế, sử dụng các toán tử và hàm sao cho phù
hợp đối với dữ liệu có yếu tố định kì, chu kì, có các tham số hỗ trợ và tập mờ phức.
Còn phần cấu trúc của mô hình đề xuất thì tương tự như mô hình tổng quát về hệ logic
mờ phức của Ramot đưa ra 2003, nhưng việc lựa chọn các toán tử, phương pháp giải
mờ sẽ khác so với mô hình hệ logic mờ phức của Ramot. Hình 2.1 sau sẽ mô tả rõ mô
hình chung của hệ suy diễn mờ phức Mamdani (M-CFIS).
45
Hình 2.1: Mô hình hệ suy diễn mờ phức Mamdani
2.3.2. Các lựa chọn sử dụng trong hệ suy diễn mờ phức Mamdani
Trước khi đi vào cụ thể các bước xây dựng hệ suy diễn Mamdani dựa trên tập
mờ phức, các lựa chọn đối với mô hình hệ suy diễn mờ phức Mamdani được đề xuất
gồm có: hàm thuộc mờ phức, phương pháp xác định độ tăng trưởng luật và toán tử tổ
2.3.2.1 Hàm thuộc mờ phức
hợp. Cụ thể như sau:
Trong các hệ thống phát triển dựa trên lý thuyết tập mờ phức đã có thường sử
dụng hàm thuộc Gause và hàm Sin. Tuy nhiên, với mục đích xây dựng Hệ suy diễn
mờ phức Mamdani là sự khái quát từ hệ suy diễn mờ thường Mamdani tức hàm thuộc
phải đảm bảo sao cho giá trị µ (x) ∈ [0, 1]. Và hệ thống đề xuất phải đảm bảo theo
mô hình tổng quát của hệ logic mờ phức của Ramot nên hàm thuộc mờ phức có dạng
hàm thuộc mờ phức có sẵn như trong mô hình hệ logic mờ phức của Ramot, cụ thể
như sau: µ (x) = r (x) .eiω(x) với thành phần pha ω (x) ∈ (0, 2π] and thành phần biên
độ r (x) ∈ [0, 1].
46
2.3.2.2 Các toán tử sử dụng trong hệ M-CFIS
Trong mô hình hệ M-CFIS, các toán tử được xác định như sau:
• Toán tử T- chuẩn Minimum được sử dụng để tính toán độ mạnh của luật mờ
phức với phép toán AND được dùng để liên kết các điều kiện của luật
• Toán tử T-đối chuẩn Maximum được sử dụng để tính toán độ mạnh của luật mờ
phức với phép toán OR được dùng để liên kết các điều kiện luật
• Luật kéo theo Mamdani được dùng để tính toán kết quả của mỗi luật mờ phức
(cid:17)
(cid:16) ωA(x)
i2π
2π . ωB (y)
2π
sử dụng phép tích vô hướng có dạng như sau:
µA→B (x, y) = (rA (x) .rB (y)) .e
(2.1)
Ở đây, phép tích vô hướng đối với các vector giá trị phức là phép toán khái quát
hóa của phép tích vô hướng với các vector giá trị thực. Thêm nữa, phép tích
T-chuẩn được sử dụng như trong ngữ cảnh hệ suy diễn Mamdani thường. Chú ý:
2.3.2.3 Vec tơ tổ hợp đối với tập mờ phức
độ mạnh của luật và hệ quả của các luật mờ phức là các giá trị phức.
Ramot và cộng sự [44] giới thiệu một hàm tổng hợp mới gọi là tổng hợp vectơ
cho phép kết hợp các luật mờ phức bằng cách xem xét cả các điều kiện pha của chúng.
Đầu ra được tổng hợp theo nguyên tắc: nếu tất cả các đối số của thành phần pha là
bằng nhau thì thành phần biên độ được lấy giá trị cực đại; còn nếu các thành phần pha
không bằng nhau thì thành phần biên độ có thể được lấy nhỏ hơn giá trị ban đầu. Còn
trong mô hình ANCFIS của Man và cộng sự [46] thì vector tổng hợp là phép tích vô
hướng độ mạnh của luật và hàm thuộc mờ phức tương ứng với mỗi tập mờ phức tuy
nhiên chỉ thực hiện trên các giá trị thực.
Trong mô hình mờ phức Mamdani đề xuất, chúng tôi trọng tâm chú ý đến phát
triển hệ suy diễn với ý nghĩa phức thực sự tức là trong quá trình thực hiện suy diễn
luật thì cả hai thành phần pha và biên độ đều được quan tâm chú ý đến trong suốt quá
trình ra quyết định. Do vậy, chúng tôi coi phép toán tổ hợp là phép tích vô hướng giữa
47
(cid:48)
wp.µAp (x) = wp.µAp (x) (cid:17) (cid:16)
các vector giá trị phức có dạng như sau:
(cid:48) p
=
r
rAp (x) e−iωAp (x)(cid:17)
peiω
(cid:16)
(cid:17)
(cid:48)
ω
(cid:48) p−ωAp (x)
= r
(cid:48)
(cid:48)
(cid:48)
i prAp (x) e (cid:16)
(cid:16)
= r
ω
+ i sin
ω
.
prAp (x)
p − ωAp (x)
p − ωAp (x)
2.3.2.4 Tổng hợp đầu ra cuối cùng
(cid:16) (cid:17) (cid:16)(cid:16) (cid:17)(cid:17)(cid:17) cos
Với mục đích có thể đảm bảo rằng mô hình suy diễn mờ phức Mamdani được
khái quát hóa từ hệ FIS Mamdani thì cần phải điều chỉnh các số phức theo đúng cách
mà hệ FIS Mamdani thực hiện với số thực.
Do vậy, chúng tôi đề xuất hàm đầu ra như sau:
D (y) = Γ1 (y) + Γ2 (y) + ... + Γk (y)
(2.2)
với Γp (y) là các hàm giá trị phức.
Bằng cách này có thể đảm bảo rằng hệ thống đề xuất hệ suy diễn mờ phức thực
sự, trong đó thành phần pha được xem xét trong tất cả các bước của quá trình ra quyết
định.
2.3.3. Cấu trúc của hệ suy diễn mờ phức Mamdani
Giống như hệ suy diễn mờ Mamdani thì vấn đề tính toán kết quả đầu ra thông
qua mô hình hệ suy diễn mờ phức Mamdani cũng bao gồm sáu bước. Cụ thể từng
bước như sau:
Bước 1: Xác định tập các luật mờ phức
CF R1: If xm(1,1) is A1,1 O1,1 xm(1,2) is A1,2 O1,2 . . . O1,n1−1 xm(1,n1) is A1,n1 then y is
C1
CF R2: If xm(2,1) is A2,1 O2,1 xm(2,2) is A2,2 O2,2 . . . O2,n2−1 xm(2,n2) is A2,n2 then y is
C2
Xuất phát từ bộ dữ liệu, hệ luật mờ phức được xây dựng có dạng như sau:
CF Rk: If xm(k,1) is Ak,1Ok,1 xm(k,2) is Ak,2 Ok,2 . . . Ok,nk−1 xm(k,nk) is Ak,nk then y is
...
48
Ck
Trong đó:
(a) m (p, q) ∈ {1, 2, ..., n} với 1 ≤ m (p, 1) < m (p, 2) < ... < m (p, np) ≤ n
Ở phần này, giả thiết chúng ta không nhất thiết phải có n giá trị đầu vào của
CFIS xuất hiện trong 1 luật mờ phức. Với mỗi giá trị (p, np) được coi là số lượng đầu
vào trong luật thứ p (CF Rp). Giá trị đầu vào có thể đề cập đến np giá trị np đầu vào
từ x1, x2..xn chứ không nhất thiết tất cả các giá trị từ x1, x2..xnp. Đó là lí do chúng tôi
viết xm(p,1), xm(p,2), ..., xm(p,np) để xác định một cách ngẫu nhiên np giá trị từ n giá trị
(cid:1) eiωAp,q (xm(p,q)), (cid:1) = rAp,q (b) µAp,q
đầu vào trong tất cả các luật mờ phức. (cid:0)xm(p,q) (cid:0)xm(p,q) với rAp,q : C → [0, 1]và ωAp,q : C → (0, 2π].
(c) µCp (y) = rCp (y) eiωCp (y) , với rCp : C → [0, 1] và ωCp : C → (0, 2π]. (d) T0 là toán tử T-chuẩn vàS0 là toán tử S-chuẩn (ví dụ như T-đối chuẩn) tương
ứng với T0.
(e) fp : (0, 2π]np → (0, 2π] ,với fp (2π, 2π, ..., 2π) = 2π (f) ωp = τpeiψp,
Trong đó:
(cid:1)(cid:1) (cid:0)rAp,1 (cid:1) , rAp,2 (cid:0)xm(p,1) (cid:0)xm(p,2) (cid:0)xm(p,np)
ψp = fp
(cid:1)(cid:1) ..., rAp,np (cid:1)(cid:1). (cid:0)...Np,2 (cid:0)xm(p,1) (cid:0)xm(p,2) (cid:0)xm(p,3) (cid:0)xm(p,3) (cid:0)xm(p,np) (cid:1)(cid:1) , rAp,3 (cid:1) , ..., ωAp,np
(cid:0)Np,1 τp = Np,np−1 (cid:0)ωAp,1 (cid:1) , ωAp,2 (cid:1) , ωAp,3 (i) Op,q = and khi và chỉ khi Np,q = T0
(ii) Op,q = or khi và chỉ khi Np,q = S0
Tương tự như với hệ FIS thường thì việc chọn toán tử T0 tùy thuộc vào ngữ
cảnh và vấn đề được nghiên cứu. Hơn nữa để giữ được tính tổng quát hóa lên từ hệ (cid:1) là giá trị thực với ∀q thì giá trị wp Mamdani FIS, bất cứ khi nào giá trị µAp,q (cid:0)xm(p,q)
cũng là giá trị thực. Do đó, giới hạn của hàm fp (2π, 2π, ..., 2π) = 2π.
Bước 2: Mờ hóa dữ liệu đầu vào
Trong bước này mỗi giá trị dữ liệu đầu vào được mờ hóa bởi hàm thuộc mờ
µAp,q
(cid:1) eiωAp,q (am(p,q)) với ∀p, q phức có dạng sau: (cid:0)am(p,q) (cid:0)am(p,q)
(cid:1) = rAp,q Bước 3: Xác định độ mạnh của luật
49
Mỗi luật mờ phức sẽ được xác định giá trị độ mạnh của luật, hay còn gọi là độ
tăng trưởng luật và được tính toán theo công thức sau: wp = τpeiψp.
Trong đó:
(cid:1) (cid:1) , rAp,2 (cid:0)rAp,1 (cid:0)xm(p,2) (cid:0)xm(p,1) (cid:0)xm(p,np)
ψp = fp
(cid:1)(cid:1) , ...rAp,np (cid:1)(cid:1). (cid:1) , ωAp,3 (cid:0)Np,1 (cid:1) , ωAp,2 (cid:0)xm(p,3) (cid:0)...Np,2 (cid:0)xm(p,1) (cid:0)xm(p,3) (cid:0)xm(p,np)
(cid:1)(cid:1) , rAp,3 τp = Np,np−1 (cid:1) , ..., ωAp,np (cid:0)xm(p,2) (cid:0)ωAp,1 Bước 4: Tính toán các kết quả đầu ra y của luật mờ phức Chọn hàm U0 : [0, 1]2 → [0, 1]với U0 (1, 1) = 1, và hàm g0 : (0, 2π]2 → (0, 2π]
với g0 (2π, 2π) = 2π
Dạng của hàm đầu ra tương ứng đối với mỗi luật mờ phức CF Rp được tính
theo công thức: Γp (y) = U0 (cid:0)τp, rCp (y)(cid:1) eig0(ψp,ωCp (y))
Ở bước này thì việc chọn hàm U0 và g0 tùy thuộc vào ngữ cảnh và vấn đề nghiên cứu. Ví dụ, chúng ta có thể chọn Γp (y) = (cid:0)τp, rCp (y)(cid:1) ei(ψp−ωCp (y)) = wp · µCp (y) với phép “.” được định nghĩa là phép tích vô hướng phức.
Bước 5: Tổng hợp kết quả đầu ra của các luật mờ phức
Phân bố đầu ra được định nghĩa như sau: D (y) = Γ1 (y) + Γ2 (y) + ... + Γk (y) Với D = F (C, C)
Mục đích sử dụng phép toán tổng hợp là để tính toán đến sự tác động của thành
phần trong các dữ liệu đầu vào một cách được chính xác nhất.
Bước 6: Giải mờ kết quả đầu ra Chọn hàm φ : F (C, C) → C, giá trị đầu ra được xác định bởi: yop = φ (D)
(cid:82) ∞ −∞ y|D(y)|dy −∞ |D(y)|dy sử dụng luật hình thang (cid:82) ∞
Ví dụ chúng ta có thể chọn xấp xỉ φ (D) =
đối với mọi f ∈ F (R, R).
2.3.4. Ví dụ số minh họa mô hình suy diễn M-CFIS
Để minh họa rõ hơn về mô hình M-CFIS đề xuất, trong nội dung phần này,
luận án trình bày một ví dụ số trên bộ dữ liệu chuẩn Benchmark WBCD.
Giả sử với bộ dữ liệu đầu vào có 10 bản ghi, 9 thuộc tính với 2 nhãn đầu ra như
bảng 2.6 sau:
Bước 1: Sinh luật mờ phức
Để sinh luật mờ phức từ bộ dữ liệu đầu vào, ta thực hiện tuần tự theo từng bước
sau:
50
Bảng 2.6: Bộ dữ liệu đầu vào
ST T Nhãn A1 A2 A3 A4 A5 A6 A7 A8 A9 1 1 1 5 1 1 1 4 1 2
1 2 3 4 5 6 7 8 9 10
5 3 8 2 4 2 5 8 7 10
2 2 10 1 1 1 3 9 1 10
2 1 10 1 2 1 3 7 4 7
2 1 10 1 1 1 3 5 6 7
2 1 8 1 1 1 3 10 4 6
3 3 9 1 2 2 4 5 4 4
1 1 7 1 1 1 4 5 3 1
2 2 1 2 2 2 1 1 1 1
2 2 7 2 2 2 2 7 6 4
- Đầu tiên, ta thực hiện sinh phần thực và phần ảo cho dữ liệu đầu vào:
Đối với từng bản ghi đầu vào, với từng giá trị thuộc tính, việc sinh phần thực
và ảo cho dữ liệu được thực hiện theo suy tắc sau: Phần thực được lấy chính giá trị gốc
đầu vào của thuộc tính; phần ảo được tính bằng cách tính tổng phương sai theo cột và
theo hàng (Var.R(bản ghi) + var.A(thuộc tính)).
- Tiếp theo, sử dụng thuật toán FCM để thực hiện phân cụm dữ liệu theo từng
thuộc tính và từ đó có thể sinh nhãn ngôn ngữ.
- Xây dựng bộ luật ban đầu và thực hiện việc giảm luật trùng để được bộ luật
cơ sở.
Bảng 2.7: Bộ cơ sở luật
L VL
ST T Nhãn A1 A2 A3 A4 A5 A6 A7 A8 A9 M VL VL VL VL VL VL VL L H VH VH H H VH VH H VL VL VL VL VL VL VL VL VL M L VL VL VL VL VL VL VL VL VL VL VL VL VL VL VL VL VL L M L VL M L L VH H
L H M L VH M VL
1 2 3 4 5 6 7
2 1 2 2 2 1 1
Kết quả của quá trình trên, ta thu được bộ luật cơ sở như bảng 2.7:
Bước 2: Mờ hóa dữ liệu
Thực hiện mờ hóa dữ liệu sử dụng hàm mờ Gausse như sau:
51
(xp,q −cq)2 2δ2
−
− e
(xp,q −cq)2 2δ2
(xp,q −cq) δ2
(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)
(cid:12) (cid:12) (cid:12) +i (cid:12) (cid:12) (cid:12)
µAp,q (xp,q) = e
Giả sử có bộ dữ liệu test sau: X1 = (5, 1, 1, 1, 2, 1, 3, 1, 1)
Ta thực hiện mờ hóa dữ liệu bằng cách sử dụng hàm mờ Gausse trên thì thu
được kết quả là các giá trị mờ hóa tương ứng với mỗi thuộc tính của bộ X1 như
(1.000, 0.1448) ; (0.9995, 0.0075); (1.000, 0.0768); (1.000, 0.1452)
sau: (1.000, 0.1279) ; (1.000, 0.0776); (1.000, 0.0517);(1.000, 0.0016); (0.9998, 0.1571);
Bước 3: Tính toán trọng số của luật
Ta thực hiện tính lần lượt trọng số đối với từng luật trong bộ luật cơ sở:
Re (R1) = M in (1.0000, 1.0000, 1.0000, 1.0000, 0.9998, 1.0000, 0.9995, 1.0000, 1.0000)
= 0.9995.
Im (R1) = M in (0.1279, 0.0776, 0.0517, 0.0016, 0.1571, 0.1448, 0.0075, 0.0768, 0.1452)
= 0.0016.
Ví dụ với luật 1, ta có:
ω1 = 0.9995e0.0016.
Vậy, đối với luật 1 ta tính được trọng số của bản ghi test với luật 1 như sau:
Tương tự, ta tính được trọng số của bản ghi với 6 luật còn lại.
Bước 4: Tổng hợp kết quả đầu ra
ωizi
yop =
ωi
7 (cid:80) i=1 7 (cid:80) i=1
Ở đây ta chọn công thức Tính trung bình trọng số để tổng hợp kết quả đầu ra
(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)
Kết quả: yop = 2.0796 và nhãn đầu ra được gán cho bản ghi mới là 2.
2.3.5. Thử nghiệm và đánh giá kết quả
Chúng tôi thực nghiệm so sánh mô hình đề xuất M-CFIS với mô hình hệ suy
diễn mờ Mamdani (M-FIS) [66] trên môi trường Matlab 2014 và với cấu hình máy PC
VAIO Core i5. Kết quả thực nghiệm so sánh trên bộ dữ liệu chuẩn UCI và bộ dữ liệu
52
thực Liver lấy từ Bệnh viện Gang thép và đa khoa Thái Nguyên được mô tả rõ trong
Hình 2.2, 2.3 tương ứng với mỗi bộ dữ liệu chuẩn UCI và Hình 2.4 tương ứng với bộ
Hình 2.2: Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu WBCD
Hình 2.3: Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu Diebetes
dữ liệu thực Liver.
Từ kết quả thực nghiệm đã cho thấy mô hình M-CFIS được đề xuất tốt hơn mô
hình M-FIS trên các chỉ số độ chính xác, chỉ số Recall và Precision. Các mô hình được
phát triển trên lý thuyết tập mờ phức được đánh giá là mô hình xử lý hiệu quả đối với
lớp các bài toán mà có dữ liệu trong đó có yếu tố chu kì, định kì hay có yếu tố bổ sung
đối với dữ liệu. Chính vì lí do đó, đối với các dữ liệu bệnh thì mô hình M-CFIS cho
kết quả tốt hơn mô hình FIS Mamdani, bởi với kết quả đầu ra chẩn đoán bệnh thì việc
đánh giá kết luận cuối cùng không chỉ dựa vào một vài thông số giá trị thuộc tính bệnh
53
Hình 2.4: Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu thực Liver
đo được mà giữa các thông số giá trị thuộc tính bệnh đó còn có sự gắn kết lẫn nhau,
tác động lẫn nhau (được mô tả trong phần pha của tập mờ phức). Nói chung, tất cả các
chỉ số đánh giá trên mô hình M-CFIS đều tốt hơn M-FIS. Trong tất cả các trường hợp
thì độ chính xác của mô hình M-CFIS luôn lớn hơn khi thực hiện với mô hình M-FIS,
ví dụ như 90.69% và 85.062% đối với bộ dữ liệu WBCD, 85.386% và 75.061% trên
bộ dữ liệu Diebetes, và 83.683% và 80.569% trên dữ liệu thực Liver. Tuy nhiên, thời
gian thực hiện mô hình M-CFIS còn cao so với thời gian thực hiện mô hình M-FIS
bởi việc đánh giá thêm thành phần pha trong tập mờ phức trong tất cả các giai đoạn
của hệ thống.
2.4. Kết Chương 2
Chương 2 trình bày các kết quả nghiên cứu về hướng tiếp cận của luận án dựa
trên tập mờ phức. Nội dung trong chương bao gồm hai kết quả chính như sau:
i) Đề xuất toán tử t-chuẩn và t-đối chuẩn dựa trên lý thuyết tập mờ phức. Kết
quả này được công bố trong công trình [A1] phần “Danh mục các công trình của tác
giả”.
ii) Đề xuất mô hình hệ suy diễn mờ phức Mamdani dựa trên nền tảng lý thuyết
về tập mờ phức và mô hình hệ suy diễn mờ Mamdani. Trong mô hình đề xuất, NCS
cũng đưa ra từng bước thực hiện cũng như các thành phần cụ thể trong mô hình. Kết
quả này được công bố trong công trình [A2] phần “Danh mục các công trình”.
54
Để chứng minh tính hiệu quả của mô hình hệ suy diễn đề xuất, NCS tiến hành
thực nghiệm các thuật toán trên các bộ dữ liệu thử nghiệm từ kho dữ liệu UCI và dữ
liệu bệnh thực Liver được lấy từ Bệnh viện Gang Thép và Bệnh viện đa khoa Thái
Nguyên nhằm đánh giá tính hiệu quả của mô hình đề xuất so với mô hình hệ suy diễn
mờ Mamdani thường M-FIS. Kết quả thử nghiệm cho thấy, mô hình hệ suy diễn đề
xuất tốt hơn hệ suy diễn M-FIS trên các độ đo đánh giá độ chính xác, chỉ số Precision
và chỉ số Recall. Tuy nhiên thời gian thực hiện vẫn còn cao hơn do phải thực hiện tính
toán với cả phần biên độ và phần pha của tập mờ phức và hệ cơ sở luật chỉ thu được
theo cách thô sơ bằng cách bỏ đi các luật yếu, luật trùng nhau. Đây cũng chính là hạn
chế của mô hình đề xuất và động lực để tác giả thực hiện nghiên cứu và giải quyết
trong chương tiếp theo của luận án.
55
Chương 3. TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC MAMDANI (M-CFIS-R)
3.1. Giới thiệu
Giảm số lượng luật mờ đang là một trong những vấn đề cần thiết trong việc
kiểm soát độ phức tạp của các mô hình mờ truyền thống. Chính vì thế mà một số các
kĩ thuật giảm luật mờ đã và đang được nghiên cứu và phát triển. Ví dụ như tiêu chí
entropy được đề xuất để thiết lập một cấu trúc mô hình mờ đơn giản bằng cách giảm
thiểu sự tương tác giữa các luật mờ [75] và số lượng luật mờ trong cùng điều kiện
được xác định bằng cách sử dụng các tiêu chí không thiên vị. Một chiến lược cắt tỉa
luật và hợp nhất luật dư thừa được đề xuất để giảm các luật mờ dư thừa trong nghiên
cứu [76], và sử dụng các thuật toán di truyền để trích xuất các luật mờ được nhóm tác
giả nghiên cứu và đề xuất.
Một số phương pháp biến đổi trực giao cũng được thảo luận và đưa ra trong
các nghiên cứu [77, 78]. Phương pháp tối ưu hóa tỷ lệ đa chiều và hạn chế phi tuyến
được sử dụng để xây dựng một mô hình mờ chính xác với cấu trúc đơn giản và minh
bạch [79]. Witold Pedrycz [80] đã giới thiệu hệ thống dựa trên luật mờ tiếp cận theo
tính toán hạt. Tác giả cho rằng vấn đề tinh giảm luật mờ có thể thực hiện được thông
qua việc tối ưu phân phối hạt thông tin giữa các tập mờ. Các tập mờ ban đầu sẽ được
thu gọn bằng cách diễn tả theo hạt thông tin tương ứng với nó và được biểu diễn theo
tập mờ giá trị khoảng, tập mờ loại hai hay tập thô mờ.
Hatem Bellaaj và cộng sự [81] đưa ra phương pháp giảm luật mờ bằng cách đề
xuất độ đo tương tự giữa các luật mờ để loại bỏ các luật có độ tương đồng cao, sau đó
tác giả thực hiện thuật toán nội suy để tính toán giá trị đầu ra cho hệ thống suy diễn
56
TSK. Jun Wang và cộng sự [82] đề xuất một mô hình suy diễn mờ Takagi-Sugeno đa
nhiệm gọi là mtSparseTSK, trong đó nhóm tác giả xem xét việc giảm luật mờ bằng
cách đưa ra các quy định về độ thưa của nhóm tiêu chí trong mô hình.
Tóm lại, các nghiên cứu trên đều đưa ra phương pháp để giảm số luật của mô
hình mờ nhưng thường chỉ áp dụng cho các mô hình tập mờ thông thường và thường
chỉ kết hợp với các kĩ thuật như phân rã hay nội suy. Ý tưởng cơ bản đều là hợp nhất
các tập mờ tương đồng nhau và tạo ra một tập luật cơ sở mới. Số lượng luật của các
nghiên cứu đều đã được giảm đáng kể, tuy nhiên việc đánh giá hiệu quả hay độ chính
xác của mô hình cũng bị giảm đi khá nhiều. Chính vì lí do đó, trong nội dung chương
này luận án đề xuất phương pháp giảm luật mờ bằng cách đề xuất ra các độ đo tương
tự và kết hợp độ đo với tính toán hạt để đưa ra hệ luật mới.
Các nghiên cứu liên quan đến độ đo mờ phức
Độ đo mờ phức đã được nhiều nhà khoa học chú ý và nghiên cứu ứng dụng
trong hệ hỗ trợ ra quyết định. Hầu hết các độ đo mờ phức chủ yếu tập trung theo các
hướng: một số lượng tập con nhất định của tập hợp cổ điển và một độ đo giá trị thực
(theo lý thuyết Choquet), lý thuyết độ đo mờ và lý thuyết cổ điển của số mờ phức, khái
niệm độ đo khoảng cách và độ đo tương tự.
Trong những năm 1991-1992, Buckley [58, 59] đã đưa ra khái niệm về số phức
mờ và nhu cầu cần giải quyết về vấn đề độ đo và tích phân trên số phức mờ. Dựa
trên khái niệm số phức mờ của Buckley mà nhóm tác giả Wang và Li [83] đã định
nghĩa hàm giá trị phức mờ và độ đo mờ giá trị phức mờ tương ứng với với tích phân
Lebesgue tổng quát của hàm có giá trị phức mờ. Hơn nữa, họ cũng đưa ra những tính
chất cơ bản và định lý hội tụ liên quan đến tích phân Lebesgue. Bên cạnh đó, bằng
cách sử dụng các hàm có giá trị phức mờ và độ đo mờ có giá trị phức mờ, nhóm tác
giả Jang và Kim cũng giới thiệu tích phân Choquet đối với một độ đo mờ giá trị phức
của một hàm độ đo giá trị phức mờ [84] và hàm độ đo có giá trị thực [85]. Trong
nghiên cứu đó, nhóm tác giả cũng củng cố lý thuyết độ đo đề xuất bằng bổ sung thêm
một số lý thuyết và định lý trên số phức mờ.
Ở một hướng nghiên cứu khác, dựa trên lý thuyết độ đo mờ và lý thuyết cổ điển
về số phức mờ, năm 2009 Ma và cộng sự [86] đã đưa ra định nghĩa và các tính chất
57
của độ đo phức mờ. Sau đó, họ đưa ra định nghĩa của hàm phức mờ và độ đo phức
mờ, đồng thời cũng thảo luận nghiên cứu sâu hơn về các tính chất cơ bản của hàm độ
đo phức mờ. Năm 2012, Chen và cộng sự [87] đã nghiên cứu định lý mờ phức của các
hàm độ đo và đưa ra lý thuyết hội tụ của những hàm này. Kết quả thu được từ nghiên
cứu này đã tạo ra nền tảng nhất định cho lý thuyết tích phân phức mờ.
Cũng dựa trên khái niệm về độ đo giá trị phức mờ, nhóm tác giả, Zhao và Ma
[88] định nghĩa độ đo mờ giá trị phức mờ và hàm độ đo giá trị phức mờ trên tập phức
mờ. Bên cạnh đó Ma và cộng sự [87] cũng đưa ra khái niệm về tích phân Choquet và
giới thiệu phương pháp thiết kế mới đối với việc phân loại tích phân giá trị mờ phức.
Nhóm tác giả Ma và Li đã mở rộng độ đo giá trị phức mờ dựa trên lý thuyết
về độ đo cổ điển và đưa ra định nghĩa về khoảng cách phức mờ và độ đo mờ phức giá
trị mờ phức trên trường số phức mờ [89]. Nhóm tác giả cũng đưa ra một số tính chất
quan trọng của độ đo mờ phức giá trị phức mờ. Theo một hướng nghiên cứu khác, Ma
và cộng sự lại đưa ra khái niệm độ đo mờ phức khác với khái niệm phức mờ đã có
trong nghiên cứu [88] bằng việc phân biệt giữa phần thực và phần ảo trong số phức
mờ. Dựa trên độ đo mờ phức giá trị mờ phức, nhóm tác giả Ma và Li [90] tập trung về
vấn đề hội tụ của tích phân mờ phức giá trị mờ phức. Sau đó, tác giả Ma kết hợp cùng
Zhao [91] đưa ra khái niệm và các thuộc tính về hàm giá trị tập phức và tích phân giá
trị tập mờ phức.
Hướng nghiên cứu cuối cùng là độ đo mờ phức dựa trên độ đo khoảng cách
và độ đo tương tự. Vào năm 2009, nhóm tác giả Zhang và cộng sự của mình [63] đã
δ giữa các tập mờ phức và minh họa độ đo đề xuất trên bộ dữ liệu tín hiệu số. Bên
đề xuất khoảng cách mờ giữa hai tập mờ phức và từ đó định nghĩa về phép cân bằng
cạnh đó, nhóm Alkouri và Salleh [64] cũng giới thiệu các giá trị ngôn ngữ trên tập
mờ phức. Trong nghiên cứu này nhóm tác giả cũng đưa ra một số độ đo khoảng cách
trên tập mờ phức và ứng dụng trong một số bài toán hệ hỗ trợ ra quyết định, dự báo
và phát hiện mẫu ... để đưa ra phương án tối ưu.
Trong một nghiên cứu khác về hệ hỗ trợ ra quyết định đối với những dữ liệu
không chắc chắn và dữ liệu mờ, nhóm tác giả Garg và Rani [37] đã đề xuất độ đo thông
tin trên tập mờ trực cảm phức. Cũng trên lý thuyết tập mờ trực cảm phức, nghiên cứu
58
của Ngan và cộng sự [92] trình bày biểu diễn bộ bốn và các độ đo khoảng cách trên
tập mờ trực cảm phức, sau đó áp dụng đối với bài toán hỗ trợ chẩn đoán bệnh. Các
công thức tính toán biểu diễn bộ bốn và các độ đo khoảng cách này được dùng để biểu
diễn mối quan hệ giữa bệnh nhân và bệnh trong mô hình chẩn đoán bệnh mà nhóm
tác giả đề xuất.
Độ đo khoảng cách khác được phát triển dựa trên độ đo khoảng cách Euclidean
và Harmming đã được Dai và cộng sự [93] trình bày trên tập mờ phức giá trị khoảng
(IvCFS). Nghiên cứu cũng đưa ra ví dụ minh họa đối với độ đo được đề xuất trong bài
toán hỗ trợ ra quyết định. Một nghiên cứu khác trên tập Neutrosophic phức (CNS),
Mondal và cộng sự [94] giới thiệu các độ đo tương tự và độ đo tương tự có trọng số
trên tập CNS. Những độ đo được đề xuất cũng được đưa vào ứng dụng trong mô hình
dùng để xếp hạng thứ tự ưu tiên của các ứng viên và từ đó có thể quyết định chọn ra
được ứng viên tốt nhất. Việc áp dụng độ đo trong mô hình hỗ trợ ra quyết định này
được đánh giá cao vì trong mô hình đã xem xét đến sự tương tác giữa các thuộc tính
trong tập dữ liệu cũng như tính không xác định của dữ liệu.
Tổng quan về tính toán hạt
Tính toán hạt (Granular Computing - GrC) là một mô hình xử lý thông tin đang
phát triển trong trí tuệ nhân tạo và các hệ thống tập trung vào con người. Tính toán
hạt ban đầu được gọi là hạt thông tin hoặc kết hạt thông tin có liên quan đến nghiên
cứu bộ mờ (Zadeh 1979) và xuất hiện vào năm 1996 trong bài báo của Zadeh [95].
Tuy nhiên, thuật ngữ tính toán hạt lần đầu tiên được đề xuất bởi Lin [96] là một mô
hình điện toán tổng hợp có hiệu quả trong giải quyết các phần tử và các hạt, các tập
con tổng quát mơ hồ. Mục tiêu tính toán hạt là xây dựng một mô hình tính toán hiệu
quả để xử lý dữ liệu, thông tin và kiến thức với lượng rất lớn.
Mô hình tính toán hạt được các nhà khoa học quốc tế quan tâm và đã có nhiều
ứng dụng được công bố. Năm 2002, Yao và Zhong [97] đã xem xét một số nghiên
cứu hiện có về tính toán hạt không mờ và đề xuất một mô hình tính toán hạt dựa trên
các bảng thông tin. Năm 2013, Yao và Pedrycz [98] đưa ra một cách nhìn khái quát
về quan điểm và các thách thức của tính toán hạt. Đồng thời các tác giả cũng đề xuất
các hướng nghiên cứu có liên quan đến tính toán hạt trong tương lai. Theo đó, về mặt
59
kỹ thuật, tính toán hạt sẽ được tiếp cận theo hướng lý thuyết tập mờ và tập thô. Các
phương pháp lai ghép sẽ là ưu thế lớn khi sử dụng tính toán hạt trong xử lý thông tin.
Pedrycz và cộng sự trình bày các ứng dụng khác nhau của tính toán hạt trong
nghiên cứu [99]. Các ứng dụng khác được kể tới trong công trình này là ứng dụng của
tính toán hạt trong tin y, trong học máy và trong khai phá dữ liệu. Như vậy, tính toán
hạt quan tâm bởi nhiều nhà khoa học và được cải tiến mô hình trong ứng dụng thuộc
nhiều lĩnh vực khác nhau. Mô hình tính toán hạt được sử dụng trong các bài toán phân
lớp dữ liệu [100]. Trong nghiên cứu này, Artiemjew đưa ra mô hình phân lớp dựa vào
cấu trúc hạt. Kết quả mô phỏng cho thấy phân lớp dựa vào tính toán hạt có hiệu quả
cao hơn các phương pháp phân lớp đã có. Butenkov và cộng sự [101] xây dựng mô
hình tính toán hạt trên không gian affine và xây dựng các độ đo tương ứng. Mô hình
này được sử dụng trong các bài toán nhận dạng mẫu và phân tích dữ liệu thông minh.
Đồng thời nó cũng được sử dụng trong các thuật toán xử lý dữ liệu đa chiều hiệu quả.
Bên cạnh đó, tính toán hạt còn là một cách tiếp cận tính toán với từ ngữ (một
cách tiếp cận khác là tính toán với số). Những ý tưởng cơ bản về hạt thông tin đã xuất
hiện trong các lĩnh vực liên quan, như phân tích khoảng cách, lý thuyết tập hợp, phân
tích cụm, ra quyết định, học máy, cơ sở dữ liệu ... Một kỹ thuật mới được đề xuất trong
việc giải quyết các bài toán liên quan đến việc xử lý và hiểu các hình ảnh số [101].
Với nghiên cứu này, tác giả tập trung vào đồ họa và các ảnh số. Từ kết quả đề xuất, tác
giả cũng đưa ra ý tưởng cho các nghiên cứu về các kỹ thuật mới liên quan đến xử lý
ảnh trong tưởng lai. Năm 2016, Filippo Maria Bianchi và cộng sự đã đề xuất các kỹ
thuật tính toán hạt để phân loại và mô tả đặc trưng ngữ nghĩa của dữ liệu có cấu trúc
[102]. Trong đề xuất của mình, nhóm tác giả giới thiệu các kỹ thuật nhúng đồ thị, các
kỹ thuật tìm kiếm và các kỹ thuật khai phá đồ thị. Các kỹ thuật này chủ yếu dựa trên
một thủ tục tiền xử lý nhằm ánh xạ tất cả các yếu tố đầu vào vào một đồ thị có nhãn
đầy đủ, hệ thống sẽ giải quyết vấn đề phân loại trong miền đồ thị.
Giải thuật tham lam được sử dụng kết hợp với tính toán hạt để giải các bài toán
liên quan đến xử lý dữ liệu hiệu quả với những bộ dữ liệu tự nhiên không đầy đủ [103].
Trong nghiên cứu [104] Yuping Zhang đề xuất kết hợp giữa tính toán hạt và lý thuyết
tập mờ. Các tác giả đã mở rộng logic hạt từ tập cổ điển sang tập mờ và các tập mờ trực
60
cảm và đề xuất một hàm mức độ đúng đắn dựa trên tập mờ trực cảm được đề xuất.
Tính toán hạt vẫn còn là lĩnh vực mới ở Việt Nam, các nhà nghiên cứu mới bắt
đầu tiếp cận theo hướng kết hợp tính toán hạt vào các kỹ thuật đã có với rất ít công bố
được đưa ra. Nhóm Ngô Thành Long, Trương Quốc Hùng và Witold Pedrycz [105]
cũng đã nghiên cứu việc sử dụng tính toán hạt kết hợp với phân cụm mờ trong phân
tích sinh học. Cụ thể trong nghiên cứu của mình, phương pháp phân cụm C-means
khả năng mờ (Fuzzy Possibilistic C-Means Clustering - FPCM) và tính toán hạt được
giới thiệu với mục đích để giải quyết bài toán trích chọn đặc trưng và phát hiện ngoại
lệ trong bài toán vi lượng DNA. Từ các nghiên cứu lý thuyết, phương pháp FPCM cải
tiến dựa trên tính toán hạt đuộc đề xuất. Các thử nghiệm đã được thực hiện trên 20 bộ
dữ liệu biểu diễn gen khác nhau và một phân tích so sánh với các phương pháp có liên
quan khác cũng được trình bày chi tiết.
Tóm lại, trong chương hai, luận án đã đề xuất phát triển một hệ suy diễn mờ
phức theo mô hình mờ Mamdani. Tuy nhiên, hệ thống đề xuất M-CFIS còn hạn chế
ở chính hệ cơ sở luật vì việc giảm luật chỉ thực hiện dựa vào việc tính toán độ mạnh
và yếu của luật. Thêm nữa hệ luật thu được trong mô hình M-CFIS vẫn có thể còn dư
thừa bởi trong mô hình chỉ thực hiện giảm luật trùng, luật yếu.
Dựa trên nghiên cứu về các độ đo mờ phức và tính toán hạt mà trong khuôn
khổ nội dung chương này luận án trình bày phương pháp tinh giảm hóa hệ luật của
M-CFIS bằng việc áp dụng tính toán hạt kết hợp với các độ đo tương tự để khắc phục
những nhược điểm của mô hình M-CFIS đã đề xuất trong Chương 2. Phương pháp đề
xuất có tổng số luật thu gọn hơn đáng kể và với độ chính xác cao hơn so với hệ thống
M-CFIS. Đồng thời trong quá trình thực hiện thì luôn có sự đánh giá hiệu quả của bộ
luật mới so với bộ luật đã có để từ đó đưa ra bộ luật tốt hơn với hiệu quả cao hơn bộ
luật cũ.
3.2. Đề xuất độ đo tương tự mờ phức
Độ đo tương tự được dùng để đánh giá mức độ tương tự giữa 2 đối tượng để
thực hiện các thao tác tiếp theo cho phù hợp với từng đối tượng. Trong phần này luận
án đề xuất 3 độ đo tương tự mờ phức cùng với trọng số tương ứng với các độ đo đó.
61
Cụ thể như sau:
3.2.1. Độ đo tương tự mờ phức Cosine
Độ đo tương tự giữa mờ phức Cosine là độ đo được tính toán bởi phép tích vô
hướng bên trong giữa hai vec tơ chia cho tích của hai độ dài vec tơ đó. Đó được coi
là cosin của góc giữa hai vec tơ biểu diễn hai tập mờ phức. Chúng tôi đề xuất độ đo
tương tự cosin giữa các tập mờ phức như sau:
Định nghĩa 3.1. Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x)
trong S với mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức
đều ∈ [0, 1].
S2 được định nghĩa theo công thức sau:
a1a2 + b1b2
n (cid:88)
Độ đo tương tự mờ phức Cosine (kí hiệu CFCSM) giữa hai tập mờ phức S1 và
CCF S =
1 n
k=1
(a1)2 + (b1)2.
(a2)2 + (b2)2
(3.1) (cid:113) (cid:113)
Với a1 = Re (cid:0)rS1 (x) ejωS1 (x)(cid:1); b1 = Im (cid:0)rS1 (x) ejωS1 (x)(cid:1); a2 = Re (cid:0)rS2 (x) ejωS2 (x)(cid:1); b2 = Im (cid:0)rS2 (x) ejωS2 (x)(cid:1)
Định lý 3.1. Cho hai tập mờ phức S1 và S2 thì độ đo tương tự mờ phức Cosine thỏa
mãn các tính chất sau:
(i) 0 ≤ CCF S (S1, S2) ≤ 1,
(ii) CCF S (S1, S2) = CCF S (S2, S1),
(iii) CCF S (S1, S2) = 1 khi và chỉ khi S1 = S2,
CCF S (S2, S).
(iv) Nếu S1 ⊂ S2 ⊂ S thì CCF S (S1, S) ≤ CCF S (S1, S2) và CCF S (S1, S) ≤
Chứng minh:
(i) Hiển nhiên ta luôn có 0 ≤ CCF S (S1, S2) ≤ 1 do tất cả các giá trị của hàm
cosine đều nằm trong khoảng từ 0 đến 1.
(ii) Điều đó là hiển nhiên và CCF S (S1, S2) = CCF S (S2, S1) luôn đúng.
(iii) Khi S1 = S2 thì ta luôn có CCF S (S1, S2) = 1.
Ngược lại, nếu CCF S (S1, S2) = 1 có nghĩa a1 = a2, b1 = b2. Do đó S1 = S2.
62
(iv) Cho S = rS (x) ejωS(x) và L1 = Re (cid:0)rS (x) ejωS(x)(cid:1) và L2 = Im (cid:0)rS (x) ejωS(x)(cid:1). Nếu S1 ⊂ S2 ⊂ S có nghĩa là ta có a1 ≤ a2 ≤ L1 và b1 ≥ b2 ≥ L2 (theo
định nghĩa 1.6 về thứ tự từng phần trong tập mờ phức). Do hàm cosine là hàm đơn
CCF S (S1, S) ≤ CCF S (S2, S).
điệu giảm trong khoảng [0, π/2] nên ta có thể viết CCF S (S1, S) ≤ CCF S (S1, S2) và
Định nghĩa 3.2. Độ đo tương tự Cosine mờ phức có trọng số (WCNCSM) Cho hai tập
mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x) trong S với mọi x ∈ X; thành
phần biên độ và thành phần pha của hai tập mờ phức đều ∈ [0, 1].
Một độ đo tương tự Cosine mờ phức có trọng số giữa hai tập mờ phức S1 và S2 được
định nghĩa như sau:
a1a2 + b1b2
n (cid:88)
CW CF S =
ωk
k=1
(a1)2 + (b1)2.
(a2)2 + (b2)2
(3.2) (cid:113) (cid:113)
ωj = 1.
n (cid:80) k=1
với
3.2.2. Độ đo tương tự mờ phức Dice
Định nghĩa 3.3. Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x)
trong S với mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức
đều ∈ [0, 1].
Độ đo tương tự mờ phức Dice (kí hiệu CFDSM) giữa hai tập mờ phức S1 và S2
n (cid:88)
được định nghĩa theo công thức sau:
DCF S =
1 n
√ a1b1a2b2 2 a1b1 + a2b2
k=1
(3.3)
Với a1 = Re (cid:0)rS1 (x) ejωS1 (x)(cid:1); b1 = Im (cid:0)rS1 (x) ejωS1 (x)(cid:1); a2 = Re (cid:0)rS2 (x) ejωS2 (x)(cid:1); b2 = Im (cid:0)rS2 (x) ejωS2 (x)(cid:1)
Định lý 3.2. Cho hai tập mờ phức S1 và S2 thì các tính chất sau được thỏa mãn đối
với độ đo tương tự mờ phức Dice :
(i) 0 ≤ DCF S (S1, S2) ≤ 1,
(ii) DCF S (S1, S2) = DCF S (S2, S1),
63
(iii) DCF S (S1, S2) = 1 khi và chỉ khi S1 = S2,
DCF S (S2, S).
(iv) Nếu S1 ⊂ S2 ⊂ S thì ta có DCF S (S1, S) ≤ DCF S (S1, S2) và DCF S (S1, S) ≤
Chứng minh: tương tự như định lý 3.1.
Định nghĩa 3.4. Độ đo tương tự mờ phức Dice có trọng số (WCFDSM)
Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x) trong S với
mọi x ∈ X.
Một độ đo tương tự mờ phức Dice có trọng số giữa hai tập mờ phức S1 và S2
√
được định nghĩa như sau:
n (cid:88)
a1b1a2b2 √
DW CF S =
ωk
a1b1 +
a2b2
k=1
(cid:21) (cid:20) 2 √ (3.4)
ωj = 1.
n (cid:80) k=1
với
3.2.3. Độ đo tương tự mờ phức Jaccard
Định nghĩa 3.5. Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x)
trong S với mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức
đều ∈ [0, 1].
S2 được định nghĩa theo công thức sau:
n (cid:88)
√
Độ đo tương tự mờ phức Jaccard (kí hiệu CFJSM) giữa hai tập mờ phức S1 và
JCF S =
1 n
√ a1b1a2b2 (a1b1 + a2b2) − (cid:0)√
a1b1.
a2b2
k=1
(3.5) (cid:1)
Với a1 = Re (cid:0)rS1 (x) ejωS1 (x)(cid:1); b1 = Im (cid:0)rS1 (x) ejωS1 (x)(cid:1); a2 = Re (cid:0)rS2 (x) ejωS2 (x)(cid:1); b2 = Im (cid:0)rS2 (x) ejωS2 (x)(cid:1)
Định lý 3.3. Cho hai tập mờ phức S1 và S2 thì độ đo tương tự mờ phức Jaccard thỏa
mãn các tính chất sau:
(i) 0 ≤ JCF S (S1, S2) ≤ 1,
(ii) JCF S (S1, S2) = JCF S (S2, S1),
(iii) JCF S (S1, S2) = 1 khi và chỉ khi S1 = S2,
64
JCF S (S2, S).
(iv) Nếu S1 ⊂ S2 ⊂ S thì ta có JCF S (S1, S) ≤ JCF S (S1, S2) và JCF S (S1, S) ≤
Chứng minh: tương tự như định lý 3.1.
Định nghĩa 3.6. Độ đo tương tự mờ phức Jaccard có trọng số (WCFJSM)
Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x) trong S với
mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức đều ∈ [0, 1].
S2 được định nghĩa như sau:
n (cid:88)
√
Một độ đo tương tự mờ phức Jaccard có trọng số giữa hai tập mờ phức S1 và
ωj
JW CF S =
√ a1b1a2b2 (a1b1 + a2b2) − (cid:0)√
a1b1.
a2b2
j=1
(3.6) (cid:1)
ωj = 1.
n (cid:80) k=1
với
3.3. Đề xuất mô hình hệ suy diễn M-CFIS-R
3.3.1. Ý tưởng xây dựng mô hình
Vấn đề thay đổi số lượng các luật và tối ưu luật trong hệ thống luật mờ được
coi là một vấn đề cần được quan tâm chú ý khi thiết kế một mô hình hệ suy diễn mờ.
Điều đó có thể giúp cho hệ thống suy diễn mờ làm việc hiệu quả hơn và kết quả chính
xác hơn. Do đó, rất cần phải có thước đo để đánh giá được tầm quan trọng của từng
luật mờ trong hệ luật mờ cơ sở.
Trong phần này NCS sử dụng ba độ đo tương tự mờ phức đã đề xuất trong Mục
3.2 để áp dụng trong giai đoạn Traning. Sau đó, tính toán hạt được kết hợp với các độ
đô mờ phức cũng được dùng trong bước cuối cùng của giai đoạn Training để giảm số
luật mờ phức có độ tương tự cao hoặc thêm vào bộ luật những luật có độ bao phủ lớn.
Kết quả của giai đoạn Training sẽ thu được một bộ luật mới với số lượng ít hơn và cho
kết quả phân loại cao hơn so với hệ luật mờ ban đầu.
Để thực hiện so sánh với mô hình hệ suy diễn mờ phức Mamdani (M-CFIS)
thì trong mô hình này NCS đề xuất bổ sung thêm giai đoạn Training để tạo ra bộ luật
mờ phức cơ sở và tối ưu bộ luật mờ phức cơ sở đó bằng cách sử dụng tính toán hạt kết
65
hợp với độ đo mờ phức. Giai đoạn Testing được thực hiện tiếp sau quá trình suy diễn
trong mô hình M-CFIS.
Mô hình M-CFIS-R đề xuất chia làm hai phần chính:
- Phần Training: được sử dụng để huấn luyện, sinh ra các luật mờ và tối ưu hệ
luật mờ sử dụng tính toán hạt kết hợp với độ đo mờ phức.
- Phần Testing: được sử dụng để kiểm tra việc thực hiện suy diễn trên hệ luật
mờ mới đã được tối ưu trong phần Training.
3.3.2. Phần Training
Trong phần này, bộ dữ liệu ban đầu được chia thành ba phần: Training –
Validation và Testing theo k-fold. Với dữ liệu trong phần Training, chúng tôi thực
hiện chia thành bộ dữ liệu dành cho phần thực và phần ảo (mục 3.3.2.1). Sau đó thuật
toán phân cụm mờ Fuzzy C-Means được áp dụng trên từng thuộc tính để phân thành
từng cụm tương ứng với mỗi nhãn ngôn ngữ trên thuộc tính đó. Cuối cùng sẽ thu được
một tập các luật, được coi như là bộ luật mờ phức ban đầu. Tập các luật mờ phức này
được thực hiện đánh giá trên bộ dữ liệu Validation, kí hiệu là bộ luật A (mục 3.3.2.2).
Sau đó, để tối ưu hóa hệ luật mờ phức A, các độ đo mờ phức đề xuất trong Mục
3.2 được dùng để tính toán độ tương đồng giữa các luật mờ phức. Tiếp theo, độ tương
tự giữa các luật mờ phức được xác định thông qua phương pháp tính toán hạt tương
ứng trên từng nhãn đối với bộ dữ liệu Validation (mục 3.3.2.3).
Cuối cùng, thực hiện đánh giá mô hình suy diễn trên bộ luật mờ phức mới (có
tên gọi là A’) trên bộ dữ liệu Validation trên cùng một module suy diễn (tương tự như
mục 3.3.2.2) . Nếu kết quả suy diễn trên bộ luật A’ tốt hơn trên bộ luật A thì giai đoạn
Training kết thúc và chuyển sang giai đoạn Testing; còn không thì tiếp tục lặp lại quá
trình tính toán sử dụng độ đo mờ phức theo tính toán hạt để huấn luyện lại và đưa ra
bộ luật mới khác.
Hình 3.1 sau mô tả rõ ràng giai đoạn Training của mô hình đề xuất.
66
t ấ u x ề đ h n ì h
ô m a ủ c g n i n i a r T n ạ o đ
i a i G
: 1 . 3
h n ì H
67
3.3.2.1. Chọn dữ liệu phần thực và phần ảo
Từ bộ dữ liệu Training, dữ liệu dành cho phần thực và phần ảo được xây dựng
theo nguyên tắc như sau :
- Phần dữ liệu thực : chính là giá trị dữ liệu ban đầu.
- Phần dữ liệu ảo trên mỗi bản ghi R của thuộc tính A được tính bằng công
thức sau : var.R(bản ghi)+ var.A(thuộc tính) với Var.R(dòng) là giá trị phương sai trên
3.3.2.2. Thuật toán phân cụm mờ FCM
dòng bản ghi thứ R và Var.A(thuộc tính) là giá trị phương sai trên thuoc tính A.
Trong phần này, thuật toán toán phân cụm mờ FCM được sử dụng để phân cụm
dữ liệu trong mỗi thuộc tính thành từng nhóm khác nhau, mỗi nhóm tương ứng với
một nhãn ngôn ngữ của nhóm đó. Số lượng các nhóm cho mỗi thuộc tính là khác nhau
tùy thuộc vào giá trị ngữ nghĩa của mỗi thuộc tính. Số lượng nhóm cho dữ liệu phần
thực và phần ảo là như nhau. Cuối cùng, chúng tôi đưa ra được các luật mờ dựa vào
các nhãn ngôn ngữ trong từng thuộc tính.
Thuật toán FCM
Algorithm 1 Thuật toán FCM
Input Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C; mờ hóa m;
ngưỡng ε; số lần lặp lớn nhất MaxStep > 0
Output Ma trận U và tâm cụm V
1: T = 0 2: Khởi tạo ngẫu nhiên u(t)
ukj = 1 với
kj ← random (cid:0)k = 1, N ; j = 1, C(cid:1) sao cho
C (cid:80) j=1
ukj ∈ [0, 1] và ∀k = 1, N
3: Lặp lại: 4: t = t + 1 5: Tính u(t)
; (cid:0)k = 1, N ; j = 1, C(cid:1)
kj =
(cid:33) 1
m−1
C (cid:80) i=1
6: Cho đến khi: (cid:13)
1 (cid:32) (cid:107)Xk −Vj(cid:107) (cid:107)Xk −Vi(cid:107) (cid:13)U (t) − U (t−1)(cid:13)
(cid:13) ≤ ε hoặc t > M axStep
3.3.2.3. Độ đo mờ phức tính toán hạt
Trong phần này, luận án mô tả cách xác định độ tương tự giữa các luật mờ phức
dựa trên mối tương quan của các luật (đã được mô tả trong phần đề xuất độ đo tương
68
tự mờ phức). Để thực hiện điều đó, ý tưởng dùng tính toán hạt được đề xuất ứng dụng
để đưa ra mối quan hệ trong việc kết nối các độ đo tương quan mờ.
Kết quả thu được của ba độ đo tương tự mờ phức là ba ma trận tương quan
D1, D2, D3). Sau đó, mức độ tương tự cuối cùng giữa các luật mờ phức được xác
với mỗi thành phần được coi là mối tương quan giữa cặp luật mờ phức (kí hiệu
định dựa vào phép tổ hợp sau:
Fij = a1D1
ij + a2D2
ij + a3D3 ij
(3.7)
Đối với mỗi nhãn, chúng tôi đi tính các giá trị a1(l), a2(l), ..., ae(l) để từ đó tính
Fij(l). Các hệ số tương ứng với mỗi nhãn được tính bằng công thức sau:
được giá trị độ tương tự giữa các luật mờ phức cuối cùng tương ứng với mỗi nhãn
Dt
|Dt/l| (cid:88)
|Dt/l| (cid:88)
(cid:16)
at(l) =
i=1
j=i+1
(3.8) (cid:17) ij/t |Dt/l|
Đối với mỗi luật ứng với nhãn khác thì giá trị Fij = 0. Cuối cùng, thu được hệ cơ sở
luật mờ phức chính là ma trận F . Một hệ cơ sở luật mờ phức mới được đưa ra bằng
cách loại bỏ những luật có độ tương đồng cao trong nhóm luật và tiếp theo sẽ thực
hiện đánh giá hiệu quả của hệ luật mới này. Trong trường hợp mà hiệu quả của cơ sở
luật mờ phức mà kém hơn thì ta quay trở lại bước trước để tính lại độ đo tương tự mờ
phức và tính toán hạt tiếp cho hệ cơ sở luật mới này. Quá trình này lặp lại cho đến khi
hiệu quả của hệ cơ sở luật mới này cao hơn bộ luật gốc hoặc độ chính xác của luật đối
với bất kì nhãn nào bằng 1.
Các bước chính quá trình tinh giảm luật trong hệ M-CFIS-R được thể hiện rõ
trong ví dụ sau:
R1, R3, R4 và ba luật R2, R5, R6 có nhãn 2 (k = 2).
R1: If x1 is Medium and x2 is High and x3 is High then k is 1
R2: If x1 is High and x2 is Low and x3 is Low then k is 2
R3: If x1 is Low and x2 is Medium and x3 is High then k is 1
R4: If x1 is Low and x2 is High and x3 is Medium then k is 1
R5: If x1 is High and x2 is Low and x3 is Medium then k is 2
Ví dụ: Cho bộ luật gồm có sáu luật mờ phức với ba luật có nhãn 1 (k = 1) là
69
R6: If x1 is Medium and x2 is Low and x3 is Low then k is 2
Sau khi sử dụng ba độ đo mờ phức để tính toán độ tương tự giữa sáu luật trên thì thu
được ba ma trận tương ứng như sau:
0
0.5 0.8 0.7 0.4 0.3
0.5
0
0.5 0.4 0.8 0.9
0.8 0.5
0
0.9 0.4 0.5
D1 =
0 0.7 0.4 0.9 0.4 0.8 0.4 0.5
0.5 0.3 0.7 0
0.3 0.9 0.5 0.3 0.7
0
0 0.2
0.2 0.5 0.4 0.2 0.1 0.2 0.3 0.5 0.6 0
0.5 0.2
0
0.5 0.2 0.1
D2 =
0.4 0.3 0.5
0
0.2 0.3
0.2 0.5 0.2 0.2 0 0.1 0.6 0.1 0.3 0.5
0.5 0
0
0.1 0.4 0.4 0.2 0.1
0.1
0
0.1 0.2 0.4 0.3
0.4 0.1
0
0.4 0.1 0.2
D3 =
0.4 0.2 0.4 0 0.2 0.4 0.1 0.2
0.2 0.1 0.3 0
0.1 0.3 0.2 0.1 0.3
0
Sau đó, mối tương quan của từng ma trận với nhãn 1 và 2 được tính toán theo
= 0.8; a1
= 0.467; a1
= 0.4
3
3
3
= 0.8; a2
= 0.533; a2
= 0.333
2 = 0.5+0.4+0.5 2 = 0.5+0.6+0.5
3 = 0.4+0.4+0.4 3 = 0.4+0.3+0.3
3
3
3
1 = 0.8+0.7+0.9 a1 1 = 0.8+0.9+0.7 a2 Cuối cùng thu được ma trận F như sau:
công thức 3.8 và thu được các giá trị sau:
0
0
1.034 0.907
0
0
0 0.397
0 0
0 0
0 1.114
1.04 0
1.14 0
F =
0.563
0
0.51
0
0
0
0
0.29
0
0.926
0
0
0
0.657
0
0
0
0.926
Qua ma trận F chúng ta có thể nhìn thấy rõ ràng độ tương tự cao giữa các cặp
luật đối với nhãn 1 và nhãn 2 tương ứng là R3 and R4, R2 và R6. Khi đó, sau khi giảm
70
R2, R5 với nhãn 2.
(cid:48)
(cid:48)
luật có độ tương tự cao, ta thu được bộ luật cơ sở mới như sau:R1, R3 với nhãn 1, và
(cid:48) thu được là: luật R
1, R
3 với nhãn 1 và
(cid:48)
(cid:48)
R
2, R
Lần lặp thứ 2: Tập luật mờ phức mới R
4 với nhãn là 2. Khi đó ma trận các độ đo tương ứng như sau
(cid:48)
(cid:48)
(cid:48)
0 0.1
0.1 0.3 0.1 0.1 0.4 0
0 0.2
0.2 0.5 0.1 0.2 0.4 0
0 0.5
0.5 0.8 0.3 0.4 0.7 0
D3
=
D2
=
D1
=
0.3 0.1
0
0.2
0.5 0.2
0
0.1
0.8 0.4
0
0.3
0.1 0.4 0.2
0
0.1 0.4 0.1
0
0.3 0.7 0.3
0
Dựa vào kết quả thu được từ việc tính toán các độ đo mờ phức, hệ số mối tương
1 = 0.8
1 = 0.5
1 = 0.3
2 = 0.4
2 = 0.4
2 = 0.7
a(cid:48) 1 a(cid:48) 1
1 = 0.3 1 = 0.4
1 = 0.5; a(cid:48) 1 = 0.8; a(cid:48) 3 2 1 = 0.4; a(cid:48) 1 = 0.7; a(cid:48) 3 2 Ma trận F cuối cùng được tính như sau :
quan đối với các nhãn 1 và 2 thu được kết quả như sau:
0 0
0 0
0.98 0
0 0.81
F (cid:48) =
0.98
0
0
0
0
0.81
0
0
(cid:48)
(cid:48)
Từ ma trận kết quả cuối cùng, độ tương tự giữa các luật mờ phức có cùng nhãn
1 và R
(cid:48) 3, R 2
(cid:48)
(cid:48)
(cid:48)
và độ tương tự cao nhất được chỉ rõ. Cụ thể các luật sau tương tự nhau: R
4. Cuối cùng bộ luật thu gọn mới gồm có R
1 với nhãn 1 và R
2 với nhãn 2.
và R
Tiếp theo đó cần xác định hiệu năng của bộ luật cơ sở mới này có tốt hơn bộ
luật cũ hay không? Ngay cả khi hiệu năng của bộ luật cơ sở mới này không tốt hơn bộ
luật đã có, chúng tôi vẫn dừng thuật toán bởi vì độ chính xác trong cả hai nhãn 1 và
2 đều là 1. Trong trường hợp này, để có được hiệu năng tốt nhất thì hệ M-CFIS-R sử
dụng luôn hệ cơ sở luật mờ phức ban đầu mà được sinh ra từ quá trình Training. Chính
điều này sẽ đảm bảo cho hệ thống M-CFIS-R trong trường hợp xấu nhất thì cũng sẽ
có hiệu năng tương đương với M-CFIS.
3.3.3. Phần Testing
Trong phần Testing, quá trình suy diễn tương tự như M-CFIS được thực hiện
để kiểm tra hiệu năng của hệ thống với bộ luật mờ phức mới thu được từ giai đoạn
71
Traning (quá trình suy diễn được mô tả rõ trong Hình 3.2). Cụ thể, từ dữ liệu Testing,
chúng tôi xây dựng dữ liệu cho phần thực và phần ảo. Sau đó sử dụng tập luật mờ phức
đã được giảm trong quá trình Training để đưa ra kết quả tương ứng với mỗi bản ghi
trong bộ dữ liệu Testing. Bằng cách sử dụng toán tử tổng hợp và giải mờ thì chúng tôi
thu được kết quả đầu ra tương ứng với các bản ghi đầu vào Testing. Cuối cùng, chúng
tôi đánh giá hiệu năng của mô hình trên các tham số: thời gian, độ chính xác, chỉ số
Hình 3.2: Giai đoạn Testing của mô hình M-CFIS-R đề xuất
Recall, chỉ số Precision và tổng số luật.
3.4. Thử nghiệm và đánh giá kết quả
Mục đích: thực nghiệm so sánh mô hình đề xuất M-CFIS-R với mô hình M-
CFIS ở Chương 2 nhằm mục đích đánh giá hệ thống sau khi thực hiện tinh giảm luật
trong hệ luật thu được của mô hình M-CFIS.
3.4.1. Kết quả thực nghiệm trên bộ dữ liệu UCI
Hình 3.3 mô tả rõ kết quả thực hiện chạy mô hình M-CFIS và M-CFIS-R trên
bộ dữ liệu đầu tiên WBCD. Độ chính xác của mô hình M-CFIS-R trên bộ dữ liệu
Training (Hình 3.3(a)) thì cao hơn độ chính xác của mô hình M-CFIS 1.2% và với
độ lệch chuẩn khá nhỏ (khoảng 0.02). Giá trị này đối với dữ liệu testing cũng cao
hơn 1.6% và độ lệch chuẩn SD là 0.01. Tương tự, giá trị Recall trong hình 3.3(b) của
72
M-CFIS-R trong cả dữ liệu Training và Testing đều cao hơn mô hình M-CFIS và với
độ lệch chuẩn nhỏ hơn 0.02. Giá trị độ đo Precision trong hình 3.3(c) của M-CFIS-R
cao hơn chút so với mô hình M-CFIS với độ lệch khá nhỏ (thậm chí độ lệch chuẩn
(a) Độ chính xác
(b) Chỉ số Recall
(c) Chỉ số Precision
(d) Thời gian thực hiện
(e) Số lượng luật
Hình 3.3: Kết quả thực nghiệm trên bộ dữ liệu WBCD
trong dữ liệu Testing còn bằng 0).
Thời gian tính toán của mô hình M-CFIS-R (thể hiện trong hình 3.3(c)) cao
hơn chút so với thời gian chạy của M-CFIS, 0.25s trên dữ liệu Training và 0.41s trên
dữ liệu Testing. Do đó, có thể nói thời gian thực hiện của hai mô hình này là tương
đương nhau với số lượng luật trung bình của M-CFIS-R ít hơn 36 luật so với M-CFIS
(thể hiện trong hình 3(d)). Qua đó, có thể dễ dàng nhận thấy là số lượng luật của mô
hình M-CFIS-R thấp hơn khá nhiều so với mô hình M-CFIS.
Hình 3.4 thể hiện quá trình thực hiện suy diễn của M-CFIS-R và M-CFIS trên
bộ dữ liệu bệnh tiểu đường Diebetes. Giá trị của các chỉ số so sánh (hình 3.4(a, b)) đối
với mô hình M-CFIS-R cao hơn so với mô hình M-CFIS trên 1% với độ lệch chuẩn
khá nhỏ. Nhưng tổng thời gian tính toán của M-CFIS-R cao hơn M-CFIS 0.02 trên dữ
liệu Training và 0.086 trên dữ liệu Testing với độ lệch chuẩn tương ứng trên các bộ dữ
liệu cũng khá nhỏ. Như vậy cũng có thể coi như thời gian tính toán của M-CFIS-R là
73
tương đương với M-CFIS. Trong khi đó tổng số lượng luật của M-CFIS-R chỉ ít hơn
(a) Độ chính xác
(b) Chỉ số Recall
(c) Chỉ số Precision
(d) Thời gian thực hiện
(e) Số lượng luật
Hình 3.4: Kết quả thực nghiệm trên bộ dữ liệu Diebetes
năm luật so với mô hình M-CFIS và có độ lệch chuẩn là 0.94
3.4.2. Kết quả thực nghiệm trên bộ dữ liệu thực
Trên các bộ dữ liệu thực, kết quả so sánh đánh giá phân loại của mô hình M-
CFIS-R đề xuất với mô hình M-CFIS được thể hiện trong hình 3.5. Hình 3.5 thể hiện
các chỉ số kết quả thực hiện của hai mô hình so sánh M-CFIS-R và M-CFIS trên bộ
dữ liệu bệnh Gan của bệnh viện Gang thép và bệnh viện Đa khoa Thái Nguyên. Từ
hình 3.5(a), chúng ta có thể thấy rõ độ chính xác khi chạy mô hình M-CFIS-R trên
bộ dữ liệu Training cao hơn 2.5% so với chạy mô hình M-CFIS. Hơn nữa, các chỉ số
Precision và Recall khi thực hiện mô hình M-CFIS-R (thể hiện ở hình 3.5(b),(c)) trên
cả dữ liệu Training và Testing đều cao hơn M-CFIS khoảng 2.2%.
Cho dù chỉ số Recall khi thực hiện mô hình M-CFIS trên bộ dữ liệu Testing
nhỏ hơn 0.4% so với mô hình M-CFIS nhưng với độ lệch chuẩn nhỏ (chỉ 0.03). Điều
này có thể dễ lí giải bởi nguyên nhân do sự giảm số luật chỉ rõ trong hình 3.5(e). Đối
với bộ dữ liệu bệnh Liver, số lượng luật trong M-CFIS-R ít hơn so với M-CFIS 69 luật.
Đó cũng chính là lí do mà tổng thời gian thực hiện của C-FIS-R nhiều hơn M-CFIS,
cụ thể là cao hơn 34.5s trong bộ dữ liệu training và 8.5s trên dữ liệu testing (thể hiện
74
trong hình 5(d)). Độ lệch chuẩn của các chỉ số độ đo này cũng khá thấp trên cả hai bộ
(a) Độ chính xác
(b) Chỉ số Recall
(c) Chỉ số Precision
(d) Thời gian thực hiện
(e) Số lượng luật
Hình 3.5: Kết quả thực nghiệm trên bộ dữ liệu thực Liver
dữ liệu Training và Testing.
Nhận xét về mô hình M-CFIS-R:
- Ưu điểm: Mô hình M-CFIS-R là mô hình kết hợp giữa hệ M-CFIS, các độ đo
mờ phức và tính toán hạt trong quá trình Training. Kết quả của quá trình thu được một
hệ thống các luật mờ phức mới hiệu quả hơn so với hệ luật cũ trong M-CFIS. Tính
mới của nghiên cứu này nằm ở vấn đề áp dụng độ đo mờ phức với tính toán hạt. Trong
mô hình M-CFIS ở Chương 2 thì quá trình Training không được mô tả chi tiết, nên
trong chương này NCS bổ sung và làm rõ hơn quá trình Trainning của mô hình. Kết
quả thu được một hệ M-CFIS với hệ luật mới hiệu quả hơn so với mô hình M-CFIS
cũ. Thông qua việc thực nghiệm mô hình hệ suy diễn M-CFIS-R trên bộ dữ liệu chuẩn
Benchmark UCI hay bộ dữ liệu thực thì mô hình M-CFIS-R đều được đánh giá là tốt
hơn so với mô hình M-CFIS trên hầu hết các thước đo đánh giá. Trong quá trình tinh
giảm luật, những luật dư thừa, luật nhiễu được tinh giảm và thay vào đó là luật có độ
bao phủ hơn nên kết quả thực nghiệm mô hình đề xuất M-CFIS-R tốt hơn.
- Nhược điểm: Tuy nhiên trong mô hình mới này chỉ dừng ở mức tối ưu cục bộ
mà chưa có giải pháp tối ưu toàn cục khi đánh giá hiệu năng của cơ sở luật mờ mới
trong quá trình Training (nếu việc đánh giá mô hình suy diễn M-CFIS trên bộ luật
75
mới cho kết quả tốt hơn thì thuật toán lập tức dừng lại). Điều này cần phải nghiên cứu
và cải thiện hơn nữa. Bên cạnh đó, tổng thời gian thực hiện của mô hình đề xuất cũng
lâu hơn so với thời gian thực hiện trong mô hình M-CFIS.
3.5. Kết Chương 3
Trong Chương 3, luận án đề xuất một hệ thống M-CFIS-R, trong đó sự kết hợp
của các độ đo tương tự mờ phức như độ đo Cosine mờ phức, độ đo Dice mờ phức và
độ đo Jaccard mờ phức với kĩ thuật tính toán hạt. Mục đích của hệ thống nhằm đưa ra
được hệ luật mờ phức tốt hơn hệ luật cũ trong mô hình M-CFIS. Hệ luật mới được cải
thiện hơn bởi tính toán độ tương quan giữa các luật mờ phức với nhau dựa trên các độ
đo mờ phức. Cuối cùng độ tương tự của các luật mờ phức được tính toán bằng cách
áp dụng tính toán hạt đối với từng nhãn đầu ra trong bộ dữ liệu Validation. Sau đó
chúng tôi thực hiện mô hình suy diễn trên bộ dữ liệu Validation để đánh giá hiệu quả
của bộ luật mờ phức mới. Nếu kết quả đánh giá tốt hơn thì kết thúc quá trình Training
và thực hiện quá trình tiếp theo Testing; còn ngược lại thì quá trình sử dụng độ đo mờ
phức tính toán hạt được thực hiện lại. Trong giai đoạn Testing, chúng tôi thực hiện hệ
M-CFIS với hệ luật mờ phức đã được giản lược trong bước Training để đánh giá hiệu
quả của hệ luật mới với bộ dữ liệu Testing. Tóm lại, mô hình M-CFIS-R là mô hình
kết hợp M-CFIS, các độ đo mờ phức và tính toán hạt trong quá trình Training. Dựa
trên đó chúng tôi thu được một hệ M-CFIS mới với bộ luật mờ phức tốt hơn và cho
kết quả thực hiện tốt hơn hệ M-CFIS cũ.
Mô hình M-CFIS-R được thực hiện với các bộ dữ liệu được từ kho thư viện
chuẩn UCI và bộ dữ liệu thực Liver lấy từ bệnh viện Gang thép và bệnh viện đa khoa
Thái Nguyên và từ bệnh viện Đại học Y Hà nội. Rõ ràng là các kết quả được đưa ra
trong mục 3.4.1 và 3.4.2 đã cho thấy mô hình M-CFIS-R được đề xuất tốt hơn mô
hình M-CFIS trên các chỉ số độ chính xác, chỉ số Recall và Precision. Nói chung,
tất cả các chỉ số đánh giá trên mô hình M-CFIS-R đều tốt hơn M-CFIS với độ lệch
tiêu chuẩn thấp. Trong tất cả các trường hợp thì độ chính xác của mô hình M-CFIS-R
trong dữ liệu Training luôn nhỏ hơn khi thực hiện mô hình đối với dữ liệu Testing,
ví dụ như 92.89% và 95.84% đối với bộ dữ liệu WBCD, 86.37% và 89.47% trên bộ
76
dữ liệu Diebetes, và 87.69% và 88.44% trên dữ liệu thực Dental. Tuy nhiên, thời gian
thực hiện mô hình M-CFIS-R còn khá cao bởi sử dụng kết hợp tính toán hạt và độ đo
mờ phức. Mặt khác, hệ luật cơ sở thu được từ hệ M-CFIS-R có chất lượng tốt hơn với
số lượng luật nhỏ hơn so với M-CFIS. Tóm lại, độ chính xác của mô hình M-CFIS-R
đạt xấp xỉ (86.3%-92.9%) đối với bộ dữ liệu Training và (85%-95.8%) đối với dữ liệu
Testing. Số lượng luật của mô hình M-CFIS-R giảm so với mô hình M-CFIS khoảng
(4.8%-22.1%).
Tuy nhiên, hệ M-CFIS-R chỉ dừng lại ở tối ưu cục bộ chứ chưa đạt được tối ưu
hóa toàn cục bởi lí do thuật toán chỉ thực hiện đánh giá hiệu quả của hệ luật mới trên
bộ dữ liệu Training thì lập tức dừng lại. Bên cạnh đó, thời gian thực hiện của mô hình
đề xuất vẫn còn cao hơn so với thời gian chạy mô hình M-CFIS. Các kết quả nghiên
cứu ở Chương 3 được công bố trong công trình công trình [A3] phần “Danh mục các
công trình”.
77
Chương 4. MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ THỊ TRI THỨC (M-CFIS-FKG)
4.1. Giới thiệu
Gần đây, đồ thị tri thức (KG) [106] đã nhận được sự chú ý của nhiều nhà nghiên
cứu và được đưa vào ứng dụng trong nhiều lĩnh vực như máy tìm kiếm, học máy, hệ
tư vấn... KG được coi như là một mô hình mạng bao gồm các nút thực thể và các cạnh
quan hệ, trong đó nút tương ứng với thuộc tính hay thực thể, còn cạnh thì biểu diễn
mối quan hệ giữa các thực thể hay giữa các thuộc tính đó.
Đồ thị tri thức cũng được ứng dụng nhiều trong y học [107] và trong nhiều lĩnh
vực khác [108, 109, 110, 111, 112]. Trong nghiên cứu [113] thì đồ thị tri thức được
sử dụng kết hợp với các thuật toán học sâu để dự báo xu hướng tăng giảm của giá cổ
phiếu và mạng CNN được sử dụng để chia nhóm các nhà đầu tư và trích xuất ra những
thuộc tính thông tin cần thiết. Trong một nghiên cứu khác, Chen và cộng sự [114] lại
đưa ra một cái nhìn tổng quan về các nghiên cứu, xem xét các kỹ thuật suy luận dựa
trên luật logic, cách biểu diễn và mạng nơ ron trên đồ thị tri thức.
Tuy nhiên, đồ thị tri thức cũng có một số hạn chế về phạm vi và kích thước của
đồ thị. Nhóm tác giả Yoo và Jeong [115] đã giới thiệu một mô hình mở rộng của đồ thị
tri thức với tên gọi là PolarisX cho phép biểu diễn một cách linh hoạt trong việc tìm
hiểu và phân tích tình huống cũng như mối quan hệ giữa hai thực thể. Ngoài ra, đồ thị
tri thức cũng đã được đưa vào ứng dụng trong một số các nghiên cứu [116, 117, 118].
Shi và cộng sự [119] đã đề xuất mô hình dựa trên đồ thị tri thức để quản lý thông tin
chăm sóc sức khỏe của bệnh nhân tùy theo ngữ cảnh áp dụng. Để phát hiện được ngữ
nghĩa phức tạp của thực thể, nhóm tác giả đã đề xuất một thuật toán cắt tỉa suy luận
78
trên đồ thị tri thức. Vấn đề dự báo rủi ro về sức khỏe cũng còn có thể được thực hiện
thông qua việc khai phá đồ thị tri thức sức khỏe trong nghiên cứu của [120]. Trong
nghiên cứu này, thông tin sức khỏe của bệnh nhân được phân tích và lưu trữ biểu diễn
trên đồ thị tri thức. Dựa trên đó một mô hình phân loại được đưa ra để áp dụng và khai
phá những thông tin sức khỏe theo từng vùng miền và những thông tin bị ẩn đi. Mô
hình dự báo rủi ro về sức khỏe này cũng được thực nghiệm và so sánh với các phương
pháp khác, tuy nhiên mô hình này chỉ hiệu quả hơn đối với các bộ dữ liệu rời rạc.
Mục đích của KG là nhằm phân tích được tối đa hóa giá trị của tri thức, phát
hiện và tránh được lỗi và có thể lập luận suy ra được kết luận mới từ những dữ liệu
đã có. Việc lựa chọn biểu diễn thực thể mới và mối quan hệ giữa chúng thông qua mô
hình KG có thể thu được nhiều thông tin hữu ích và có thể hỗ trợ nhiều hơn đối với
các ứng dụng thực tế. Chính vì lí do đó mà KG được nhiều nhà khoa học nghiên cứu
và phát triển trong nhiều bài toán thực tế, đặc biệt trong mô hình có suy luận xấp xỉ.
Bên cạnh đó, trong nội dung Chương 3, luận án đã đưa ra phương pháp cải tiến
hệ luật trong mô hình của M-CFIS và xây dựng mô hình mới M-CFIS-R). Mô hình
M-CFIS-R sử dụng kết hợp giữa tính toán hạt với ba độ đo tương tự mờ phức để thực
hiện quá trình giảm luật trong hệ luật đã thu được trong mô hình M-CFIS. Tập luật
được tạo ra bởi mô hình M-CFIS-R được thu gọn hơn so với mô hình M-CFIS thông
qua các kết quả thực nghiệm trên cả tập dữ liệu chuẩn UCI và dữ liệu thực. Tuy nhiên,
ngoài những ưu điểm thì hệ thống M-CFIS-R vẫn còn tồn tại một số hạn chế sau:
(i) Mô hình M-CFIS-R hoạt động dựa trên mô hình suy luận mờ Mamdani, tuy
nhiên chúng cần được phát triển với các mô hình suy luận mờ khác như mô hình suy
luận mờ Sugeno và Tsukamoto.
(ii) Độ đo đề xuất trong mô hình M-CFIS-R là độ đo được phát triển dựa trên
lý thuyết độ đo tương tự. Tuy nhiên những khái niệm độ đo hay tích phân mờ phức
khác cũng cần được nghiên cứu và xem xét.
(iii) Trong mô hình M-CFIS-R, dữ liệu được kiểm tra trong phần Testing bằng
cách kiểm tra đối với từng luật trong hệ luật để đưa ra kết luận cuối cùng. Điều này
dẫn đến chi phí thời gian tính toán khá cao.
(iv) Giả thiết nếu dữ liệu trong phần Testing mà không chứa các bản ghi được
79
suy ra bởi luật trong hệ luật thì khi đó khó có thể đưa ra được kết quả do trong hệ luật
không có. Điều này thường xảy ra trong các hệ thống thương mại thực tế, hệ cơ sở luật
được tạo ra nhỏ và khi đó cần thiết phải cung cấp hay tạo ra thêm những luật mới.
Xuất phát từ những hạn chế của mô hình M-CFIS-R và ưu điểm của việc biểu
diễn theo mô hình KG, trong khuôn khổ nội dung Chương này , luận án đề xuất cách
tiếp cận mới dựa trên đồ thị tri thức để khắc phục hai nhược điểm (iii) và (iv) của mô
hình M-CFIS-R trong Chương 3.
4.2. Một số mở rộng của mô hình M-CFIS-R
Trong phần này, luận án trình bày một số mở rộng của mô hình M-CFIS-R
bao gồm bốn nội dung chính: Hệ suy diễn mờ phức Sugeno, hệ suy diễn mờ phức
Tsukamoto, độ đo mờ phức và tích phân mờ phức. Cụ thể từng nội dung như sau:
4.2.1. Hệ suy diễn mờ phức Sugeno và Tsukamoto
• Hệ suy diễn mờ phức Sugeno.
Hệ suy diễn mờ phức Sugeno được mô tả thông qua các bước sau:
Bước 1. Sinh luật mờ phức. Đối với mô hình hệ suy diễn mờ phức Sugeno thì
CF Ri : If xm,1 is Ai,1 Oi,1 xm,2 is Ai,2 Oi,2 . . . Oi,ni−1 xm,ni is Ai,ni then fi
một luật kí hiệu là CFRi có thể được biểu diễn như sau:
Trong đó: Ai,1, ..., Ai,ni là tập mờ phức và là các biến đầu vào của mô hình; Oi,1, ..., Oi,ni−1
là các toán tử t- chuẩn và t-đối chuẩn tùy thuộc vào ứng dụng và fi là hàm tuyết tính
của kết quả đầu ra tương ứng với mỗi luật mờ phức.
Bước 2: Mờ phức hóa. Thực hiện quá trình mờ phức hóa mỗi giá trị đầu vào
bởi hàm thuộc mờ phức.
Bước 3: Tổng hợp độ mạnh của luật. Mỗi luật mờ phức có một giá trị độ mạnh
của luật, kí hiệu bởi và được tính toán bởi hàm sau: wm = τm ej ψm;
Bước 4: Tính toán giá trị đầu ra của các luật mờ phức Sử dụng công thức tính
zm = fm (am,1, am,2, ..., am,nm)
toán kết quả đầu ra tương ứng với mỗi luật như sau:
80
2nπ với n ∈ Z. Cho zm = vm ei ϕm và wm ∗ zm = (τmvm) ei g0(ψm, ϕm) với mọi m.
Bước 5: Tổng hợp kết quả cuối cùng. Chọn hàm g0 : (0, 2π]2 → R với g0(2π, 2π) =
Khi đó, kết quả đầu ra được tính toán bằng công thức tính tổng hợp trọng số
wm ∗ zm
k (cid:80) m=1
=
yop =
w1 ∗ z1 + w2 ∗ z2 + ... + wk ∗ zk w1 + w2 + ... + wk
sau:
wm
k (cid:80) m=1
(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)
(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)
• Hệ suy diễn mờ phức Tsukamoto
Quy trình suy diễn của mô hình hệ suy diễn mờ phức Tsukamoto cũng tương
tự như đối với mô hình hệ suy diễn mờ phức Sugeno. Mỗi kết quả trong mỗi luật trong
mô hình hệ suy diễn mờ phức Tsukamoto được xác định bởi một hàm đơn điệu trên
tập mờ phức. Do đó kết quả suy luận của mỗi luật sẽ thu được dựa vào các giá trị
dự đoán. Cuối cùng, kết quả cũng được tính toán bằng công thức trung bình trọng số
(tương tự như với S-CFIS-R).
4.2.2. Độ đo mờ phức dựa trên lý thuyết tập hợp
Định nghĩa 4.1. Cho một tập mờ phức không rỗng C trên không gian nền X. Một tập
con CF của CF (C) được coi là phép đại số của tập mờ phức trên C nếu nó thỏa mãn
các điều kiện sau: (i) 1∅, C ∈ CF ,
(ii) Nếu P ∈ CF thì C\P ∈ CF ,
A lg(C) là tập hợp các biểu diễn đại số của tập mờ phức trên C . Và một cặp
(C, CF ) được coi là không gian độ đo mờ phức trên C nếu CF là phép đại số của
(iii) Nếu P, Q ∈ CF thì P ∪ Q ∈ CF .
P ∈ CF (C) thì có thể nói P là độ đo CF với P ∈ CF .
tập mờ phức trên C. Nếu chúng ta có một không gian đo được mờ phức (C, CF ) và
Định nghĩa 4.2. Cho một không gian độ đo mờ phức (C, CF ). Một ánh xạ r : CF → H
r (1∅) .ejω(1∅) = 0 và r (C) .ejω(C) = 1,
được định nghĩa là độ đo mờ phức trên (C, CF ) nếu thỏa mãn các điều kiện sau: (i)
(ii) rD (x) .ejωD(x) ≤ rE (x) .ejωE(x) với x ∈ X, với D, E ∈ X và D ⊆ E.
81
Một không gian độ đo mờ phức được định nghĩa bởi bộ bốn (C, CF, r, ω) trong
đó (C, CF ) là một không gian độ đo mờ phức, r là một độ đo mờ phức trong không
gian (C, CF ). CFms (X) được coi là lớp không gian độ đo mờ định nghĩa trên không
gian nền không rỗng X. Khi C ∈ CF (X) thì không gian độ đo mờ phức (C, CF, r, ω)
(cid:48)(cid:1).
(cid:48) thì CFms (X) ⊆ CFms
(cid:0)X sẽ phụ thuộc vào giá trị của CFms (X), và nếu X ⊆ X
H, độ đo mờ phức trên (1X , X) được xác định theo hàm sau:
1 (cid:82)
rC (x) .ejωC (x) =
rC (x) .ejωC (x)dx
0
Ví dụ 4.1. Cho không gian độ đo mờ phức (1X , CF ) với X = [0, 1] và ánh xạ C : X →
Với mục đích là phát triển không gian độ đo mờ phức, sau đây NCS sẽ đưa ra
độ đo bên trong của tập mờ phức.
Cho (C, CF ) là một không gian độ đo mờ phức và P ∈ CF (X). Tập các tập độ
đo -CF ( viết tắt CFP ) được xác định bởi CFP = {D|D ∈ CF, D ⊆ P }
Chú ý rằng ở đây: 1∅ ∈ CFP với mỗi P ∈ CF (X) và nếu P là một tập độ đo
(cid:48)(cid:1)
-CF thì P ∈ CF (P ). Và nếu P = C thì có thể viết CF thay thế cho CFC.
Do đó, chúng tôi có thể định nghĩa độ đo mờ phức bên trong trên (cid:0)X, CF
bằng cách sử dụng độ đo mờ phức r (x) .ejω(x) trên không gian độ đo mờ phức (X, CF )
(cid:48).
với CF ⊆ CF
Định lý 4.1. Cho một không gian độ đo mờ phức (C, CF, r, ω) và CF ∈ A lg (C) sao
P (p) = ∨
cho CF ⊆ CF ∗.
rD (d) .ejωD(d)
P (p) .ejω∗
D∈CFP
Ánh xạ (r∗, ω∗) : CF ∗ → H xác định bởi hàm r∗
được gọi là một độ đo mờ phức trên (C, CF ∗).
(r∗, ω∗) được coi như là độ đo mờ phức trong được xác định bởi r, ω trên (C, CF ∗).
Bên cạnh đó, (r∗, r) và (ω∗, ω) được coi tương đương nhau trên CF . Do đó
Chứng minh:
P (p) = rP (p) .ejωP (p).
P (p) .ejω∗
Hiển nhiên ta có với P ∈ CF thì r∗
P (p) = r∗
Q(q) với
Do đó, r (∅) .ejω(∅) = 0 và r (A) .ejω(A) = 1.
P (p) .ejω∗
Q (q) .ejω∗
P, Q ∈ CF ∗ và P ⊆ Q. Hơn nữa, (r∗, ω∗) là một độ đo mờ phức trên (C, CF ∗) nên có
Thêm nữa, CFP ⊆ CFQ khi P ⊆ Q, thì r∗
thể coi (r, ω) và (r∗, ω∗) là tương đương nhau trên CF .
82
CF (C) ( CF ∗là tập tất cả các tập con mờ phức của C). Vì vậy ta có:
Ví dụ 4.2. Cho không gian độ đo mờ phức (C, CF, r, ω)với CF = {1∅, C} và CF ∗ =
D(d) =
P (p) = ∨
D (d) .ej∗ µ∗
P (p) .ej∗ µ∗
D∈CFP
1 P = C khác 0
(cid:40)
µ (C) .ejω(C) = 1
Nếu CFM hoặc bằng {1∅} hoặc {1∅, C} = CF thì µ (∅) .ejω(∅) = 0 và
k : CF → CG. Ánh xạ k được gọi là một phép đẳng cấu giữa (C, CF ) và (D, CG) nếu
Định nghĩa 4.3. Cho không gian độ đo mờ phức (C, CF ), (D, CG) và một ánh xạ
các điều kiện sau được thỏa mãn: (i) k là một song ánh với k (1∅) = 1∅,
(ii) k (P ∪ Q) = k (P ) ∪ k (Q) và k (C\P ) = D\k (P ) với P, Q ∈ CF ,
CF và x ∈ Dom (C).
(iii) Tồn tại một song ánh l : Dom (C) → Dom (D) với P (x) = k (P ) (l (x)),P ∈
CF → CG. Ánh xạ k được coi là phép đẳng cấu giữa không gian (C, CF ) và (D, CG)
Định lý 4.2. Cho không gian độ đo mờ phức (C, CF ) , (D, CG) và một toàn ánh k :
khi và chỉ khi tồn tại một song ánh l : Dom (C) → Dom (D) sao cho k = l→|CF .
Chứng minh.
Đầu tiên, giả sử rằng k : CF → CG là một đẳng cấu của không gian (C, CF )
và (D, CG) thì tồn tại một song ánh l : Dom (C) → Dom (D) (điều kiện thứ (iii) của
Định nghĩa 4.3) và có P (x) = k (P ) (l (x)) với x ∈ Dom (C).
l→ (P ) = k (P ) với P ∈ CF và k = l→|CF .
Nếu l→ (P ) (l (x)) = P (x) = k (P ) (l (x)) với x ∈ Dom (C) thì khi đó ta có
Mặt khác, cho một ánh xạ toàn ánh k : CF → CG sao cho k = l→|CF đối với
song ánh l : Dom (C) → Dom (D). Giả sử rằng có k (P ) = k (Q) với P, Q ∈ CF . Nếu
k (P ) (x) = l→ (P ) (x) = P (cid:0)l−1 (x)(cid:1) = Q (cid:0)l−1 (x)(cid:1) = l→ (Q) (x) = k (P ) (x)
cho một song ánh l : Dom (C) → Dom (D) thì có thể viết:
Do đó, P = Q và k là một song ánh. Hơn nữa, k (1∅) (x) = l→ (1∅) (x) = 1∅ (cid:0)l−1 (x)(cid:1) = 0 với mọi x ∈ Dom (D) nên k (1∅) = 1∅, điều này có nghĩa là điều kiện
(i) trong định nghĩa 4.3 thỏa mãn.
83
k (P ∪ Q) (x) = l−1 (P ∪ Q) (x) = (P ∪ Q) l−1 (x)
= P (cid:0)l−1 (x)(cid:1) ∨ Q (cid:0)l−1 (x)(cid:1)
= l→ (P ) (x) ∨ l→ (Q) (x)
= (l (P ) ∪ l (Q)) (x)
Nếu P, Q ∈ CF thì ta có với x ∈ Dom (D)
k (C\P ) (x) = l→ (C\P ) (x) = (C\P ) l−1 (x)
= C (cid:0)l−1 (x)(cid:1) ⊗ (cid:0)P (cid:0)l−1 (x)(cid:1) → 0(cid:1)
= D(x) ⊗ (l→ (P ) (x) → 0)
= D(x) ⊗ (k (P ) (x) → 0)
= (D\k (P )) (x)
Cho P ∈ CF thì ta có với P ∈ CF và x ∈ Dom (D)
Do đó điều kiện (ii) trong Định nghĩa 4.3 cũng được chứng minh.
Nếu l là một song ánh với k (P ) (l(x)) = l→ (P ) (l(x)) = P (x) thì điều kiện (iii)
cũng được thỏa mãn.
Định nghĩa 4.4. Cho không gian độ đo mờ phức (C, CF, r, ω) và (D, CG, r∗, ω∗). Một
ánh xạ k : CF → CG được gọi là ánh xạ đẳng cấu giữa hai không gian (C, CF, r, ω)
và (D, CG, r∗, ω∗) nếu điều kiện sau được thỏa mãn: (i) k là một ánh xạ đẳng cấu giữa
hai không gian độ đo mờ phức (C, CF ) và (D, CF ),
(ii) r (P ) .ejω(P ) = r∗ (k (P )) .ejω∗(P ) với P ∈ CF .
Khái niệm đẳng cấu giữa hai không gian độ đo mờ phức còn có thể được tính
toán bằng cách sử dụng phép song ánh giữa hai không gian độ đo mờ phức.
Bổ đề 4.1. Cho hai không gian độ đo mờ phức đẳng cấu (C1, CF1, r1, ω1) và (C2, CF2, r2, ω2).
2) là đẳng cấu.
2, α∗
1, α∗
Nếu có Di = Ci|Supp (Ci), CGi = {Pi|Supp (Ci) ∩ dom (Pi) , Pi ∈ CFi} và i (Pi|Supp (Ci)) .ejω(Pi|Supp(Ci)) = ri (Pi) ejω(Pi) với Pi ∈ CFi và i = (1, 2), thì có r∗ 1) và (D2, CG2, µ∗ thể nói rằng bộ bốn (D1, CG1, µ∗
Chứng minh:
84
Dựa vào Định nghĩa 4.4, cho hai không gian độ đo mờ phức U = (C, CF, r, ω)
k (C, CF, r, ω) = (D, CG, r∗, ω∗) hoặc k (U ) = V . Nếu một ánh xạ giữa U và V được
và V = (D, CG, r∗, ω∗). Nếu k là một phép đẳng cấu thì ta có thể viết như sau
tính toán bởi một song ánh l : Dom (C) → Dom (D) (dựa vào Bổ đề 4.2) thì có thể
viết l→ (C) = D.
Một hệ thống AS của không gian độ đo mờ phức trên CFms (X) được coi là
V ∈ CFms (X) là đẳng cấu thì có thể nói V ∈ AS.
đóng dưới đẳng cấu trong CFms (X) nếu thỏa mãn các điều kiện sau: Nếu U ∈ AS và
CFms (X) . Chúng có thể bao gồm các không gian độ đo mờ phức đẳng cấu. AS được
Trong những phần tiếp theo của luận án sẽ đề cập đến hệ thống đóng trong
xác định trên các không gian độ đo mờ phức lẫn nhau với điều kiện là nó phải đóng.
Định nghĩa 4.5. Một không gian mờ phức (C, CF, r, ω) được gọi là không gian đẳng
cấu nếu thoả mãn các tính chất sau: (i) P ∈ CF , thì l→ (P ) ∈ CF ,
Dom (C).
(ii) r (P ) .ejω(P ) = r (l→ (P )) .ejω(l→(P )) với P ∈ CF và với hoán vị l trên
Khái niệm “đẳng cấu” trong Định nghĩa 4.5 có nghĩa là độ đo bất biến trên
cùng không gian tập mờ phức đẳng cấu. Hai bộ của tập mờ phức P và Q có thể coi
như là tương đương nhau nếu có một hoán vị trên Dom (C) và có l→ (P ) = Q.
Ví dụ 4.3. Cho ví dụ sau với không gian độ đo mờ phức (C, (1∅, C) , r, ω) với C
(C, CF, r, ω), trong đó rC (c) ejωC (c) = rD (d) ejωD(d) khi có một hoán vị l trên Dom (C) mà có l→ (C) = D.
là một tập mờ phức không đổi, C ∈ CF (X), và một không gian độ đo mờ phức
Bổ đề 4.2. Tập hợp {U } được coi là hệ thống đóng CFms (X) nếu không gian độ đo
mờ phức U là đẳng cấu.
Chứng minh. Điều này là hiển nhiên đúng.
Bổ đề 4.3. C được coi là tập hợp mờ phức dạng hằng số nếu không gian độ đo mờ
phức là một không gian đo được.
85
C (x) (cid:54)= l→ (C) (l (x)) trong trường hợp C không phải là tập mờ phức hằng số. Phát
Chứng minh. Điều này là hiển nhiên khi ta có một hoán vị l trên Dom (C) và
biểu này mâu thuẫn với hoán vị của bổ đề.
i∈I Ci, CF = (cid:83) CFi,P = {Q|Q ∈ CFi và Q ⊆ P }.
Bổ đề 4.4. Cho một hệ thống đóng AS = {(Ci, CFi, ri, ωi)|i ∈ I} trên CFms (X). Với C = (cid:83) i∈I CFi và rP (p) ejωP (p) = ∨i∈I ∨Q∈CFi,P riQ (q) ejωQ(q) trong đó
Khi đó, (C, CF, r, ω) được gọi là không gian độ đo mờ phức đo được.
Chứng minh.
Cho ASi = (Ci, CFi, ri, ωi). Có thể nói rằng AS = (C, CF, r, ω) là không gian độ đo mờ phức, và chú ý rằng rP (p).ejωP (p) (cid:54)= riP (p).ejωiP (p) với P ∈ CFi. Mọi phần tử
(cid:48)→(P ) ∈ CF khi P ∈ CF .
i∈I CF i và l→(Ci) ∈ AS đối với i ∈ I thì khi đó ta có k
trong CF có thể tính toán bằng cách xác định có bao nhiêu thao tác được áp dụng trên (cid:83)
m : I → I sao cho l→(ASi) = ASm(i) với mọi đẳng cấu l→. Rõ ràng chúng ta có P ∈ CFi nên suy ra l→(P ) ∈ CFm(i).
Cho hoán vị k trên Dom (C), nếu tập AS được cho đóng đẳng cấu, tồn tại
Hơn nữa, nếu có P ⊆ Q thì hiển nhiên rằng l→(P ) ⊆ l→(Q). Do đó, l→ chính
là ánh xạ từ CFi,P vào CFm(i),l→(P ) với P ∈ CF .
riQ(q).ejωiQ(q)
rP (p).ejωP (p) = ∨ i∈I
∨ Q∈CFi,P
rm(i)Q(l→(Q)).ejωm(i),l→(P )(l→(Q))
= ∨ i∈I
∨ l→(Q)∈CFm(i),l→(P )
riG(g).ejωiG(g)
≤ ∨ i∈I
∨ G∈CFi,k→(P ) = rl→(P )(p).ejωl→(P )(p),
Khi đó có thể viết như sau:
rl→(P )(p).ejωl→(P )(p) = rQ(q).ejωQ(q)
≤ rk→(Q)(q).ejωk→(Q)(q) = r(k→(l→(P )))(p).ejω(k→(l→(P ))) (p)
= rP (p).ejωP (p),
Do đó, ta có : rP (p).ejωP (p) ≤ rl→(P )(p).ejωl→(P )(p) đối với l trên Dom (C) và P ∈ CF . Mặt khác, nếu có Q = l→(P ) và k = l−1 thì các điều kiện sau đảm bảo:
86
Với k→(l→(P ))(x) = l→(P )(k−1(x)) = l→(P )(l(x)) = P (x)
Đối với x ∈ Dom(Ci) thì AS được coi như là một không gian độ đo mờ phức
đo được.
4.2.3. Tích phân mờ phức
Nội dung phần này của luận án sẽ đi trình bày về tích phân mờ phức được xây
dựng trong không gian độ đo mờ phức bất kì (kí hiệu bởi (C, CF, r, ω)).
Định nghĩa 4.6. Cho một không gian độ đo mờ phức (C, CF, r, ω) với X = Dom(C),
một ánh xạ l : X → H và CF - độ đo P . Tích phân mờ phức- (cid:12) của k trên P được tính
theo công thức sau:
f drP (x) .ejωP (x) = ∨
l (x) (cid:12) rQ (q) .ejωQ(q)(cid:17)
∧ x∈supp(Q)
P
Q∈CF − P
(cid:90) (cid:12) (cid:16)
P = CFP \ {1∅}. Nếu P = C, thì ta có thể viết (cid:82) (cid:12)
P f drX (x) .ejωX (x).
với CF −
Bổ đề 4.5. Cho không gian độ đo mờ phức (C, CF, r, ω) với X = Dom(C), một ánh
xạ l : X → H và CF - độ đo P trên tập mờ phức.
P l|GdrP (x) .ejωP (x), với tập G sao cho
P ldrP (x) .ejωP (x) = (cid:82) (cid:12)
Supp (P ) ⊆ G ⊆ X
4.2.3.1 Tích phân mờ phức
Khi đó có: (cid:82) (cid:12)
Cho không gian độ đo mờ phức (C, CF, r, ω) và một tập độ đo -CF , P ∈ CF .
Hợp của tất cả các tập mờ phức từ CF (kí hiệu R (P ) ) được xác định thông qua hàm
R (P ) = (cid:83) {Q|Q ∈ CF and Supp(Q) = Supp(P )
sau:
Dựa trên khái niệm đại số trên tập mờ phức có thể nói rằng CF là R-complete
nếu R (P ) ∈ CF với P ∈ CF .
Bổ đề 4.6. Cho một không gian độ đo mờ phức (C, CF, r, ω) trong đó CF là R-
complete. Có thể viết như sau:
ldrP (x) .ejωP (x) = ∨
l (x) (cid:12) rQ (q) .ejωQ(q)(cid:17)
∧ x∈supp(Q)
Q∈R− P
P Trong đó SR−
P = (cid:8)Q|Q ∈ CF −
P và R (Q) = Q}
(cid:90) (cid:12) (cid:16)
87
Chứng minh.
Kết quả này có thể thu được bằng cách sử dụng hệ quả đơn điệu của độ đo mờ
phức.
P = (cid:8)Supp (Q) |Q ∈ CF −
P
SR−
P → SP − P .
Cho SP − (cid:9), ta có thể định nghĩa một song ánh Supp :
P → H với r ∗ (Q) = r ∗ (cid:0)supp−1 (Q)(cid:1) và ω∗ : SP − P , r, ω(cid:1) tương ứng bởi (cid:0)SP −
ω ∗ (Q) = ω ∗ (cid:0)supp−1 (Q)(cid:1), ta có thể thay (cid:0)SR− Khi đó thu được: (cid:82) (cid:12)
P → H với P , r∗, ω∗(cid:1). P kdrP (x) .ejωP (x). Do đó nếu CF là R-complete, ta có thể diễn tả
Giả sử r∗ : SP −
tích phân dưới dạng tập hợp.
P (x) với P ∈ CF và l : X → H.
Hơn nữa, nếu (C, CF, r, ω) là không gian độ đo mờ phức thì sẽ có một không
P (x) .ejω∗
P ldr∗
P ldrP (x) .ejωP (x) = (cid:82) (cid:12)
gian mờ phức tương ứng (C, CF, r∗, ω∗) trong đó supp (C) = X và SP ⊆ SP (X) sao cho (cid:82) (cid:12)
Định nghĩa 4.7. Cho không gian độ đo mờ phức (C, CF ) và X = Supp (C), một phép
đại số của các tập SP trên X là một biểu diễn rõ của phép đại số CF khi và chỉ khi
có Q ∈ CF với P ∈ SP thỏa mãn các điều kiện sau: (i) supp (Q) ⊆ P ,
(ii) Nếu supp (Q∗) ⊆ P với Q∗ ∈ CF , thì Q∗ ⊆ Q.
Bổ đề 4.7. Nếu tồn tại một biểu diễn rõ của một phép đại số CF thì CF là R- complete.
Chứng minh.
Q∗ ∈ CF và supp (Q∗) ⊆ P , ta có Q∗ ⊆ Q.
Giả sử rằng P = supp (G) với G ∈ CF . Khi đó tồn tại Q ∈ CF sao cho với
Do đó, Q được coi như là cận trên đúng của tập mờ phức sao cho trùng với P .
Do đó, bổ đề được chứng minh.
Định lý 4.3. Cho không gian độ đo mờ phức (C, CF, r, ω) với X = supp (C) và một
Q(q)
P (p) =
P (p) .ejω∗ r∗
Q(q).ejω∗ r∗
∨ Q∈CF Supp(Q)⊆P
biểu diễn rõ SP của CF thì r∗, ω∗ : SP → H được định nghĩa theo hàm sau
Thì, (P, CF, r∗, ω∗) là không gian độ đo sao cho R-complete thỏa mãn.
Chứng minh.
88
P (p) ≥
P (p) .ejω∗
rQ (q) .ejωQ(q) với supp (Q) = X, ta có bất đẳng thức sau
(cid:12) (cid:90)
(cid:12) (cid:90)
P (p)
ldr∗
ldrP (p) .ejωP (p) ≤
P (p) .ejω∗
P
supp(P )
Dựa trên hệ quả của Bổ đề 4.6 và 4.7 có thể dễ dàng nhận thấy rằng r∗
Q(q) với Q ∈ SP .
. Với SP là một biểu diễn rõ của CF , ta có một tập mờ phức G ∈ CF với mỗi tập
Q (kí hiệu GQ) đều phải thỏa mãn điều kiện (1) và (2) của định nghĩa 4.7. Ta có Supp (cid:0)GQ Q (q) .ejω∗
(cid:1) ⊆ Q và rGQ (g) .ejωGQ (g) = r∗
Vậy, ta có thể viết:
Q(q)(cid:17)
l (x) (cid:12) r∗
ldr∗
X (x) = ∨
Q (q) .ejω∗
X (x).ejω∗
∧ x∈Q
supp(P )
Q∈SP − P
(cid:90) (cid:12) (cid:16)
(g)(cid:17)
GQ
(g).ejω∗
≤ ∨
GQ
Q∈SP − P
∧ x∈supp(GQ) (cid:16)
≤ ∨
l (x) (cid:12) r∗ l (x) (cid:12) rG (g) .ejωG(g)(cid:17)
∧ x∈supp(G)
G∈CF − P (cid:90) (cid:12)
=
ldrX (x).ejωX (x)
X
4.2.3.2 Liên hệ với tích phân Sugeno
(cid:16)
{x|x ∈ X ; l (x) ≥ b} với b ∈ H. Một tập Kb được cho là lát cắt - b của ánh xạ l. Theo
Dựa trên định nghĩa của tích phân mờ phức và tích phân Sugeno, ta có Kb =
lý thuyết tích phân mờ, có thể coi ánh xạ l is CF -đo được, nếu Kb ∈ CF với b ∈ H
(trong đó H = [0, ∞] hoặc H = [0, 1]).
Định lý 4.4. Cho dàn thặng dư có thể chia hoàn toàn U, một không gian độ đo mờ
jω∗
(b)(cid:19)
phức (C, CF, r, ω) với X = Dom (C) và một ánh xạ l : X → H. Thì ta có:
(P ∩1Kb)
(b) .e
b ∧ r∗
(P ∩1Kb)
ldrP (b) .ejωP (b) = ∨ b∈H
P
(cid:18) (cid:90) ∧
Với (r∗, ω∗) là độ đo mờ phức trong trên (C, CF (C)).
Chứng minh.
Trước tiên, ta biến đổi vế phải của biểu thức trên.
Q(b) = ∨G∈CFQrG (b) .ejωG(b) (định lý
Q (b) .ejω∗
Cho CFQ = {G ∈ CF |G ⊆ Q},r∗
4.1) và G (b) = P ∩ 1Kb với b ∈ H. Dễ dàng nhận thấy rằng ∧x∈supp(G(b))l (x) ≥ b.
89
Chú ý rằng supp (G (b)) ⊆ Kb và khi ∨i∈I (b ∧ ci) = b ∧ ∨i∈I ci thì vế phải của
biểu thức có thể viết lại như sau,
jω∗
G(b)(cid:17)
(P ∩1Kb)(b)(cid:19)
b ∧ r∗
b ∧ r∗
(b) .e
G (b) .ejω∗
(P ∩1Kb)
= ∨ b∈H
∨ b∈H
(cid:18) (cid:16)
Dễ dàng nhận thấy rằng b ≤ ∧x∈supp(G(b))l (x), do đó ta có
G(b)(cid:17)
l (x)
∧
b ∧ r∗
G (b) .ejω∗
≤ ∨ b∈H
∨ b∈H
∧ x∈supp(G(b)) (cid:18)(cid:18)
∨ Q∈CFG(b) (cid:19) (cid:16)
l (x)
∧
= ∨ b∈H
∨ Q∈CFG(b)
∧ x∈supp(G(b)) (cid:18)(cid:18)
(cid:18)(cid:18) (cid:19)(cid:19) (cid:19) (cid:18) (cid:16)
≤
l (x)
∧
rQ (b) .ejωQ(b) rQ (b) .ejωQ(b)(cid:17)(cid:19) rQ (b) .ejωQ(b)(cid:17)(cid:19)
∧ x∈supp(Q)
∨ Q∈CFG(b)
∨ b∈H G(b)(cid:54)=1∅
(cid:19) (cid:16)
Và ta có:
l (x)
∧
rQ (b) .ejωQ(b)(cid:17)(cid:19)
∧ x∈supp(Q)
∨ Q∈CFG(b)
∨ b∈H G(b)(cid:54)=1∅
(cid:18)(cid:18) (cid:19) (cid:16) (4.1)
l (x)
=
∧
rQ (b) .ejωQ(b)(cid:17)(cid:19)
∧ x∈supp(Q)
∨ Q∈CF −
G(b)
∨ b∈H G(b)(cid:54)=1∅
(cid:18)(cid:18) (cid:19) (cid:16) (4.2)
≤
l (x) ∧ rQ (b) .ejωQ(b)(cid:17)
∧ x∈supp(Q)
∨ Q∈CF −
G(b)
∨ b∈H G(b)(cid:54)=1∅
(cid:16) (4.3)
=
l (x) ∧ rQ (b) .ejωQ(b)(cid:17)
∧ x∈supp(Q)
G(b)
∨ Q∈CF − (cid:90) ∧
=
(cid:16) (4.4)
ldrP (b).ejωP (b)
P
(4.5)
l(x)
= 0.
∧ rQ (b) .ejωQ(b)
∧ x∈supp(Q)
∨ Q∈CFG(b)
(cid:18)(cid:18) (cid:19) (cid:19)
Chú ý rằng: ∨ b∈H G(b)=1∅
jωGbQ
(b) .e
Khi CFG(b) = {1∅} và r (1∅) .ejω(1∅) = 0 thì có thể đặt bQ = ∧x∈supp(Q)l (x).
với Q ∈ CF − X . Rõ ràng có supp(Q) ⊆ CFbQ = và l (x) ≥ bQ. (b) Do đó ta có rQ (b) .ejωQ(b) = rGbQ
Xét vế trái:
l (x) ∧ rQ (b) .ejωQ(b)(cid:17)
ldrP (b).ejωP (b) = ∨
P
Q∈CF − P
(cid:90) ∧ (cid:16)
∧ x∈supp(Q) (cid:18)(cid:18)
l (x)
= ∨
∧ rQ (b) .ejωQ(b)
∧ x∈supp(Q)
Q∈CF − P
(cid:19) (cid:19)
90
Ta có bQ = ∧x∈supp(Q)l (x), nên
l (x)
= ∨
∧ rQ (b) .ejωQ(b)
∧ x∈supp(Q)
∨ Q∈CF − P
Q∈CF − P
jω∗
(b)(cid:17)
bQ ∧ rQ (b) .ejωQ(b)(cid:17) (cid:16)
GbQ
(b) .e
≤ ∨
bQ ∧ r∗
GbQ
jω∗
(b)(cid:17)
Q∈CF − P (cid:16)
GbQ
(b) .e
b ∧ r∗
GbQ
≤ ∨ b∈H
(cid:18)(cid:18) (cid:19) (cid:19) (cid:16)
jω∗
(P ∩1Kb) (b)(cid:19)
b ∧ r∗
(b) .e
(P ∩1Kb)
= ∨ b∈H
(cid:18)
Định lý được chứng minh.
jω(P ∩1Kb)(b)(cid:19)
(b) .e
b ∧ r
Định lý 4.5. Cho một dàn phần dư đầy đủ U, một không gian độ đo mờ phức (C, CF, r, ω)
P ldrP (b).ejωP (b) = ∨
(P ∩1Kb)
b∈H
với X = Dom (C) và ánh xạ l : X → H với X ∩ 1Kb ∈ CF và b ∈ H. (cid:18) Ta có: (cid:82) ∧
Chứng minh.
Tương tự như chứng minh trong Định lý 4.4, vế phải của biểu thức trên có thể
viết như sau:
jω(P ∩1Kb)(b)(cid:19)
(b) .e
b ∧ r
(P ∩1Kb)
∨ b∈H
(cid:18) (4.6)
jω(P ∩1Kb)(b)(cid:19)(cid:33)
(l(x))
∧
(cid:33) (cid:32)(cid:32)
(b) .e
≤ ∨ b∈H
∧ x∈supp(P ∩1Kb)
(cid:18) r (4.7)
≤ ∨
(P ∩1Kb) l (x) ∧ r(Q) (b) .ejω(Q)(b)(cid:17)
∧ x∈sup(Q)
Q∈CF − X (cid:90) ∧
=
(cid:16) (4.8)
ldrP (b).ejωP (b)
P
(4.9)
jω(P ∩1Kb)(b)
P với b ∈ H và P ∩1Kb (cid:54)= 1∅. = 0. Giả sử bây giờ có b(Q) =
(4.10)
∧x∈supp(Q)l (x) thì vế trái của biểu thức trên có thể được viết như sau:
Khi P ∩1Kb ∈ CF là CF - đo được thì P ∩1Kb ∈ CF − Nếu P ∩ 1Kb = 1∅, thì r(P ∩1Kb) (b) .e
ldrP (b).ejωP (b) = ∨
l (x) ∧ rQ (b) .ejωQ(b)(cid:17) (cid:16)
P
Q∈CF − X
∧ x∈supp(Q) (cid:18)
(cid:90) ∧
= ∨
∧ rQ (b) .ejωQ(b)
∧ x∈supp(Q)
Q∈CF − X
(cid:19)
= ∨
l (x) b(Q) ∧ rQ (b) .ejωQ(b)(cid:17)
Q∈CF − X
(cid:16)
91
jω(cid:18)
P thì: (cid:19)(b)
P ∩1KbQ
.
(cid:19)(b)(cid:33)
jω(cid:18)
P ∩1KbQ
≤ ∨
b(Q) ∧ rQ (b) .ejωQ(b)(cid:17)
b(Q) ∧ r(P ∩1KbQ) (b) .e
∨ Q∈CF − X
Q∈CF − X (cid:32)
(cid:19)(b)(cid:33)
jω(cid:18)
P ∩1KbQ
b ∧ r(P ∩1KbQ) (b) .e
≤ ∨ b∈H
Rõ ràng khi có Q ⊆ P ∩ 1Kb và Q ∈ CF − rQ (b) .ejωQ(b) ≤ r(P ∩1KbQ) (b) .e Nên: (cid:32) (cid:16)
4.2.3.3 Các tính chất của tích phân mờ phức
Định lý được chứng minh.
Trong mục này luận án trình bày một số định lý cùng với điều kiện của nó trong
tích phân mờ phức.
P drP (p).ejωP (p) là một độ đo mờ phức trên
D ∈ CF (X) với C ⊆ D, CG ∈ A lg (D) và C là rõ thì ánh xạ η : CG → H được xác định bởi hàm sau: ηP (p) .ejτP (p) = (cid:82) (cid:12) (D, CG).
Định lý 4.6. Cho không gian độ đo mờ phức (C, CF, r, ω) với X = Dom (C). Nếu có
Chứng minh:
C = CF −)
Nếu P = 1∅ thì (có thể coi CF −
η1∅ (p) .ejτ 1∅(p) = ∨
1∅ (x) (cid:12) rQ (b) .ejωQ(b)(cid:17)
Q∈CF −
∧ x∈supp(Q)
0 = 0
= ∨
Q∈CF −
∧ x∈supp(Q)
(cid:16)
C (x) (cid:12) rQ (x) .ejωQ(x)(cid:17) (cid:16)
ηC (p) .ejτC (p) = ∨
Q∈CF −
∧ x∈supp(Q)
= C (x) (cid:12) rC (x) .ejωC (x) = 1 (cid:12) 1 = 1
Trong đó C là tập mờ phức rõ
Do đó, ηP (p) .ejτP (p) = 1.
Cho P ⊆ Q là hai tập mờ phức-CG-độ đo, thì có
ηP (p) .ejτP (p) = ∨
Q∈CF −
∧ x∈supp(G)
≤ ∨
= ηQ (x) .ejτQ(x)
P (x) (cid:12) rG (x) .ejωG(x)(cid:17) Q (x) (cid:12) rG (x) .ejωG(x)(cid:17) (cid:16)
Q∈CF −
∧ x∈supp(G)
(cid:16)
92
(D, CG).
Khi P (x) ≤ Q (x) với x ∈ X. Từ đó ta kết luận η là một độ đo mờ phức trên
Bổ đề 4.8. Cho dàn có thứ tự tuyến tính đầy đủ U. Với b ∈ H, ta có
jω∗
(P ∩1Kb)(a)
(b) .e
ldrP (b).ejωP (b) ≤ b ∨ r∗
(P ∩1Kb)
P
(cid:90) (cid:12)
Chứng minh.
Với b ∈ H, ta có:
ldrP (b).ejωP (b) = ∨
l (x) (cid:12) rQ (b) .ejωQ(b)(cid:17)
∧ x∈supp(Q)
P
(cid:90) (cid:12) (cid:16)
Q∈CF − P
=
l (x) (cid:12) rQ (b) .ejωQ(b)(cid:17) (cid:16)
∧ x∈supp(Q)
Q∈CF − P Q⊆P ∩1Kb
∨ ∨
l (x) (cid:12) rQ (b) .ejωQ(b)(cid:17)
(cid:16)
∧ x∈supp(Q)
Y ∈CF − P Q(cid:54)⊂P ∩1Kb
≤
rQ (b) .ejωQ(b) ∨ b
∨ Q∈CF − P Q⊆P ∩1Kb
=
rQ (b) .ejωQ(b) ∨ b
∨ Q∈CF Q⊆P ∩1Kb
jω∗
(M ∩1CFa )(a)
= r∗
∨ a
(M ∩1CFa ) (a) .e
∨
∧ x∈supp(Q)
∨ Y ∈CF − P Q(cid:54)⊂P ∩1Kb
Trong đó có bất đẳng thức (cid:0)l (x) (cid:12) rQ (b) .ejωQ(b)(cid:1) ≤ b
Khi Q (cid:54)⊂ P ∩ 1Kb và Supp(Q) ⊆ Supp(P ) thì l(x) < b.
∧ x∈supp(Q) Cho dàn phần dư đầy đủ U và b ∈ H. Giả sử rằng U là liên tục dưới trong b nếu
∨b∗∈[0,b[ b∗ = b,với [0, b[= {b ∗ |b∗ ∈ H và b∗ ≤ b}.
f drM (a).ejωM (a) = 1 khi và chỉ khi
(M ∩1Fa )(a)
= 1 với a ∈ L\ {1}.
Do đó, (cid:0)l (x) (cid:12) rQ (b) .ejωQ(b)(cid:1) ≤ b.
Bổ đề 4.9. Giả sử rằng dàn phần dư có thứ tự tuyến tính đầy đủ U là liên tục cận dưới 0 thì biểu thức (cid:82) (cid:12) jω∗ r∗ (M ∩1Fa ) (a) .e
P ldrP (b).ejωP (b) = 1, thì dựa vào Bổ đề 4.3, ta có:
Chứng minh: Nếu (cid:82) (cid:12)
93
jω∗
(P ∩1Kb)(b)
(b) .e
= 1
b ∨ r∗
(P ∩1Kb)
jω∗
(P ∩1Kb)(b)
(b) .e
= 1.
(P ∩1Kb)
jω∗
(P ∩1Kb)(b)
(b) .e
= 1 với b ∈ H\ {1}, thì dựa trên tính chất liên
Do đó nếu b ∈ H\ {1}, thì r∗
(P ∩1Kb)
Và nếu r∗
tục của U trong 1, có thể viết:
jω∗
(P ∩1Kb)(b)(cid:19)
(b) .e
b ∧ r∗
(P ∩1Kb)
ldrP (b).ejωP (b) = ∨ b∈H
P
(cid:18) (cid:90) (cid:12)
jω∗
(P ∩1Kb)(b)(cid:19)
b ∧ r∗
(b) .e
≥ ∨
(P ∩1Kb)
b∈H\{1}
b = 1.
= ∨
(b ∧ 1) = ∨
b∈H\{1}
b∈H\{1}
(cid:18)
4.3. Đề xuất mô hình hệ suy diễn mờ phức M-CFIS-FKG
Như đã đề cập tới trong phần mở đầu, giới hạn của mô hình M-CFIS-R là thời
gian tính toán với bộ dữ liệu testing còn khá cao. Bên cạnh đó, nếu trong trường hợp
các bản ghi trong bộ dữ liệu testing không có trong bộ cơ sở luật thì khó có thể suy
luận ra đầu ra của bản ghi đó. Do đó, một mô hình hệ suy diễn mờ phức Mamdani
mới với đồ thị tri thức mờ (viết tắt M-CFIS-FKG) được NCS giới thiệu trong mục này
với mục đích cải thiện những hạn chế trong mô hình M-CFIS-R.
4.3.1. Ý tưởng xây dựng mô hình
Với mục đích là cải thiện tốc độ tính toán của quá trình suy diễn trong bộ dữ
liệu Testing, NCS mở rộng mô hình hệ M-CFIS-R theo cách như sau. Bộ dữ liệu đầu
tiên được chia thành 3 phần với tên gọi Training, Validation và Testing. Với bộ dữ liệu
Training, NCS thực hiện tính dữ liệu phần thực và phần ảo. Bằng cách áp dụng mô
hình M-CFIS-R, NCS thu được bộ cơ sở luật mờ phức được thu gọn và hiệu quả. Sau
đó, NCS đi thực hiện xây dựng đồ thị tri thức mờ (FKG) từ bộ cơ sở luật và biểu diễn
nó bởi ma trận kề (thể hiện ở mục 4.3.2 và Hình 4.1). Với bộ dữ liệu Testing, NCS đi
xây dựng Thuật toán tìm kiếm suy diễn nhanh (FISA) để thu được đầu ra từ đồ thị tri
thức mờ (thể hiện ở mục 4.3.3 và Hình 4.2). Cuối cùng, NCS đưa ra một ví dụ số để
minh họa cho mô hình đề xuất (thể hiện ở mục 4.3.4).
94
g n i n i a r T h n ì r t
á u Q
: 1 . 4
h n ì H
95
Hình 4.2: Quá trình Testing
4.3.2. Xây dựng đồ thị tri thức mờ
Trong mục này, luận án trình bày cách xây dựng Đồ thị tri thức mờ (FKG) từ
hệ cơ sở luật mờ phức. Cho hệ cơ sở luật mờ phức (Bảng 4.1) với X1, X2, ..., Xm là các
Bảng 4.1: Hệ cơ sở luật mờ phức
Xm−1
X1 High
X2 High
... ... Very high Medium Medium ... Medium
...
...
...
Xm High Low ...
... Medium Medium ... Medium Medium
Low
Medium ...
Low
Label 1 2 ... 2 3
Rule R1 R2 ... Rk−1 Rk
Rule label
...
1, 2,... C
High Medium
High Medium Low
High Medium Low
Low Very High High Medium Low
thuộc tính của bộ dữ liệu.
Chúng tôi sẽ dần dần xây dựng FKG cho từng luật mờ Rt. Với t = 1, k. Với
mỗi cặp thuộc tính (Xi, Xj) , 1 ≤ i < j ≤ m trong luật Rt, ta xây dựng cạnh như sau
96
V alue (Xi) → V alue (Xj) với V alue (Xi) là biến ngôn ngữ ứng với thuộc tính Xi. Với
mỗi cặp giá trị (Xi, Label) , 1 ≤ i ≤ m, mỗi cạnh V alue (Xi) → Labelt được xây dựng
đồ thị với Labelt là nhãn của luật thứ t. Đối với các bài toán thực tế, số lượng các biến
ngôn ngữ tùy thuộc vào các biến đầu vào thực tế và phân bố của chúng. Dòng cuối
cùng của Bảng 4.1 chỉ ra một ví dụ về biến ngôn ngữ đối với từng thuộc tính của mô
Hình 4.3: Biểu diễn của luật mờ phức
hình đề xuất. Biểu diễn đồ thị tri thức các luật mờ được chỉ rõ trong Hình 4.3 sau:
ij là trọng số của cạnh V alue (Xi) → V alue (Xj) trong luật t với t = 1, k,
1 ≤ i < j ≤ m, thì At
ij được tính toán theo công thức:
At
Cho At
ij =
|Xi quan hệ với Xj trong luật thứ t | |R|
(4.11)
il biểu diễn mối quan hệ của thuộc tính Xi với nhãn l trong đó
t = 1, k, 1 ≤ i < j ≤ m, l = 1, C. Thì giá trị Bt
il được tính theo công thức sau:
Trọng số Bt
Bt
∗
At ij
il =
| Xi quan hệ với nhãn l trong luật thứ t| |R|
(cid:32) (cid:33) (cid:88) (4.12)
Biểu diễn đồ thị của các luật mờ phức được chỉ rõ trong Hình 4.3, sau đó sẽ
chuyển thành đồ thị FKG như Hình 4.4 và lưu trữ trong một ma trận liền kề.
4.3.3. Thuật toán suy diễn nhanh trên đồ thị tri thức mờ
Điểm khác biệt giữa mô hình M-CFIS-FKG và M-CFIS-R được thể hiện ở
trong quá trình Testing. Bằng việc sử dụng Đồ thị tri thức mờ để biểu diễn luật, quá
97
Hình 4.4: Đồ thị tri thức mờ
trình Testing gán các nhãn đối với từng bộ dữ liệu đầu vào Testing Hình 4.2. Đối với
mỗi bộ dữ liệu Testing đầu vào, sẽ được thực hiện mờ phức hóa để chuyển các biến
đầu vào giá trị rõ thành các biến đầu vào giá trị mờ phức thông qua việc sử dụng hàm
thuộc mờ phức. Sau đó các giá trị ngôn ngữ sẽ được xác định dựa trên hàm thuộc đầu
vào tương ứng đối với mỗi thuộc tính trong bộ dữ liệu đầu vào. Cuối cùng, thuật toán
tìm kiếm suy diễn nhanh FISA (Fast Inference Search Algorithm) được thực hiện
tính toán trên đồ thị tri thức mờ FKG để có thể đưa ra nhãn tương ứng với từng luật
mờ theo cách như sau.
Đầu tiên các giá trị ngôn ngữ tương ứng với mỗi nhãn trong từng luật trên đồ
thị tri thức mờ FKG được tính toán theo công thức sau:
Cil =
Bt il
t
(cid:88) (4.13)
il biểu diễn mối quan hệ của thuộc tính Xi với nhãn l. Ý tưởng của gán nhãn (công thức 4.14) dựa trên khái niệm suy luận xấp xỉ , điều đó có nghĩa là các giá
Với giá trị Bt
trị ngôn ngữ của từng bản ghi mới trong bộ dữ liệu Testing được tính toán suy luận
xấp xỉ theo từng thuộc tính tương ứng trong đồ thị FKG, với mục đích tìm ra nhãn
tương ứng phù hợp nhất. Với mỗi bản ghi mới thì nhãn tương ứng với từng luật được
tính bởi toán tử MIN-MAX như sau:
Dl = mini=1,k(Cil) + maxi=1,k(Cil)
(4.14)
98
Nhãn kết luận cuối cùng của bản ghi mới được xác định bằng luật MAX theo
quy tắc như sau:
Label = p ⇐⇒ Dp = maxl=1,C(Dl)
(4.15)
Thuật toán FISA sẽ mô tả cách thức gán nhãn đầu ra cho từng bản ghi trong bộ
dữ liệu testing.
Algorithm 2 Thuật toán FISA
Bt il
Input Dữ liệu testing Data, Đồ thị tri thức mờ Output Nhãn đầu ra của Dữ liệu testing 1: Xây dựng dữ liệu phần thực và phần ảo 2: Thực hiện mờ hóa để xây dựng các giá trị biến ngôn ngữ 3: Với từng bản ghi thứ t trong bộ dữ liệu 4: Với từng nhãn l 5: Với từng thuộc tính i 6: Tính toán: Cil = (cid:80) t 7: Tính: Dl = mini=1,k(Cil) + maxi=1,k(Cil) 8: Xác định nhãn đầu ra theo quy tắc: Label = p nếu Dp = max l=1,C (Dl) 9: Gán nhãn và lặp lại các bước từ 1-8 đối với từng bản ghi mới cho đến khi kết thúc.
Trong đó, việc xây dựng dữ liệu dữ liệu phần thực và phần ảo tuân theo quy tắc
sau:
- Phần thực được xác định dùng chính các giá trị gốc đầu vào
- Phần ảo được tính toán theo công thức var.R (bản ghi) + var.A (thuộc tính)
trong đó: Var.R (bản ghi) là giá trị phương sai trên bản ghi thứ P còn Var.A (thuộc
tính) là giá trị phương sai trên thuộc tính Q.
Thuật toán FISA cho phép gán nhãn cho từng luật đầu vào sau khi mờ hoá dữ
liệu. Mô hình đề xuất được phân tích và cho kết quả thời gian thực hiện thuật toán với
tổng thời gian giảm hơn nhiều so với thuật toán MCFIS-R.
4.3.4. Ví dụ minh họa hệ suy diễn mờ phức M-CFIS-FKG
Trong mục này, luận án trình bày một ví dụ số được đưa ra để minh hoạ rõ cho
mô hình đề xuất.
Ví dụ: Cho bộ luật gồm có sáu luật mờ phức với hai nhãn (k = 1 và k = 2) như
R1: If x1 is Medium1 and x2 is High2 and x3 is High3 then k is 1
sau
99
R2: If x1 is High1 and x2 is Low2 and x3 is Low3 then k is 2
R3: If x1 is Low1 and x2 is Medium2 and x3 is High3 then k is 1
R4: If x1 is Low1 and x2 is High2 and x3 is Medium3 then k is 1
R5: If x1 is High1 and x2 is Low2 and x3 is Medium3 then k is 2
R6: If x1 is Medium1 and x2 is Low2 and x3 is Low3 then k is 2
Bước 1. Xây dựng Đồ thị tri thức mờ
ij bằng công thức (4.11) được
Xem xét với luật R1, ta có thể tính được giá trị A1
= 1/6
A1
12 =
|M edium1 → High2 | |R|
A1
= 1/6
13 =
|M edium1 → High3 | |R|
A1
= 1/6
23 =
|High2 → High3 | |R|
các giá trị như sau:
il đối với nhãn đầu ra theo công thức (4.12) như sau:
Sau đó, tính toán được giá trị B1
=
+
+
=
∗
11 = (cid:0)A1 B1
12 + A1
13 + A1 23
| Medium1 → 1 | |R|
1 6
1 6
1 6
1 12
(cid:17) (cid:1) ∗ (cid:16) 1 6
2l = 1/6 và B1
3l = 1/6.
Tương tự, ta tính được giá trị B1
ij, B1
il từ sáu luật như
Kết quả thu được ma trận kề chứa các giá trị tính toán A1
Rule At
23 Bt 13 At 12 At 1/6 1/6 1/6 1/12
1l Bt 1/6
2l Bt 3l 1/6
1
1/3 1/6 1/3 5/18 5/12 5/18
2
1/6 1/6 1/6
1/6
1/12
1/6
3
1/6 1/6 1/6 1/3 1/6 1/6
1/6 2/9
1/6 1/3
1/12 1/9
4 5
1/6 1/6 1/3
1/9
1/3
2/9
6
sau:
Đồ thị FKG cho sáu luật được mô tả trong Hình 4.5 sau đây.
Bước 2. Áp dụng thuật toán FISA đối với quá trình Testing
Trong quá trình Testing, mục đích cần phải gán được nhãn cho mỗi bản ghi
bằng sử dụng thuật toán FISA trên đồ thị FKG đã thu được. Ở ví dụ này minh hoạ việc
gán nhãn đối với bộ luật mờ phức sinh ra sau khi mờ hoá bộ dữ liệu Testing đầu vào.
1) Trường hợp 1: Giả sử gán nhãn cho sáu luật đầu vào mà có điều kiện tương
tự như với sáu luật mờ phức ban đầu. Điều đó có nghĩa các luật mới đều phù hợp với
100
Hình 4.5: Đồ thị FKG cho sáu luật
bộ luật cơ sở mờ phức ban đầu. Bộ sáu luật đầu vào được đặt tên tương ứng là Rule 1,
. . . , Rule 6.
Dựa theo công thức (4.13), ta thu được Cil đối với từng nhãn đầu ra l (1 or 2).
Xem xét luật R1, với nhãn đầu ra là l = 1 ta thu được:
Bt
C11 =
11 = B11 = 1/12,
t
(cid:88)
Bt
C21 =
21 = B21(rule R1) + B21(rule R4) = 1/6 + 1/6 = 1/3,
t (cid:88)
Bt
C31 =
31 = B31(rule R1) + B31(rule R3) = 1/6 + 1/6 = 1/3.
t
(cid:88)
C22 = 0, C32 = 0.
Với nhãn đầu ra l = 2, tính toán theo cách tương tự ta thu được C12 = 1/9,
Cuối cùng ta thu được kết quả các giá trị của Cil tương ứng với mỗi nhãn đầu
ra như sau:
Với nhãn 1:
101
Rule C11 C21 C31 1/3
1/12
1/3
1
0
0
0
2
1/3 1/3
1/12 1/3
1/3 1/12
3 4
0
0
1/12
5
1/12
0
0
6
Rule C12 C22 C32 0
1/9
0
1
1/2 13/12 1/2
2
0
0
0
3
1/9 0 0 1/2 13/12 1/9
4 5
1/9 13/12 1/2
6
Với nhãn 2:
Áp dụng toán tử trong công thức 4.14 để tính toán giá trị Dl đối với từng nhãn
đầu ra (l = 1, l = 2), cụ thể như sau:
Dl = min (C11, C21, C31) + max (C11, C21, C31) = 1/2 + 1/3 = 5/6
Dl = min (C12, C22, C32) + max (C12, C22, C32) = 1/9
Với luật 1:
Do Dl > D2 nên theo (4.15), nhãn đầu ra của luật 1 là 1.
Tương tự, ta thu được nhãn đầu ra của các luật 2, luật 3, luật 4, luật 5, luật 6
tương ứng là 2, 1, 1, 2, 2. Theo như kết quả cho thấy thì nhãn đầu ra của sáu luật đầu
vào khi được thực hiện thông qua thuật toán FISA có kết quả tương tự như với sáu luật
cơ sở ban đầu.
2) Trường hợp 2: Ở trường hợp này thuật toán FISA được sử dụng để gán các
nhãn đầu ra đối với từng mẫu bản ghi đầu vào với các bản ghi có thể không có sẵn
trong bộ sáu luật cơ sở ban đầu. Cụ thể như sau:
i) Giả sử có luật 1 như sau:
If x1 is Medium1 and x2 is High2 and x3 is Medium3 then Label =?
Dựa vào đồ thị tri thức của các luật chỉ rõ trong Hình 4.5 có thể chỉ ra rằng
không có cạnh nào nối từ nhãn ngôn ngữ Medium1 tới High2 và nối từ nhãn High2
tới Medium3. Tuy nhiên từng cạnh riêng tới nhãn vẫn có tồn tại trong đồ thị. Bằng
102
việc sử dụng mô hình suy diễn trong Suy luận xấp xỉ trong thuật toán FISA thì ta có
thể gán nhãn cho từng luật theo cách sau.
D1 = min(CM edium1,1, CHigh2,1, CM edium3,1) + max(CM edium1,1, CHigh2,1, CM edium3,1)
= 1/12 + 1/3 = 5/12
Với nhãn 1: ta có CM edium1,1 = 1/12 , CHigh2,1 = 1/3 , CM edium3,1 = 1/12 ,
D2 = min(CM edium1,2, CHigh2,2, CM edium3,2) + max(CM edium1,2, CHigh2,2, CM edium3,2)
= 0 + 1/9 = 1/9
Với nhãn 2, ta có: CM edium1,2 = 1/9, CHigh2,2 = 0, CM edium3,2 = 1/9
Do Dl > D2 nên suy ra nhãn của luật là 1.
ii) Xét luật 2 như sau:
If x1 is High1 and x2 is Medium2 and x3 is Low3 then Label =?
Với luật đang xét và trên đồ thị tri thức FKG diễn tả các luật cơ sở thì cũng
không có cạnh từ nhãn Medium2 tới Low3. Do đó, ta cần sử thuật toán suy luận xấp
xỉ trong FISA để gán nhãn cho luật mới này. Tính toán tương tự như luật trên ta thu
được D1 = 1/12, D2 = 19/18. Vì vậy mà nhãn đầu ra của luật mới này được gán bằng
2.
iii) Xét trường hợp luật cuối cùng với trường hợp giả sử không có cạnh nào
trong đồ thị tri thức biểu diễn luật đó:
If x1 is Medium1 and x2 is Medium2 and x3 is Medium3 then Label =?
Trên đồ thị FKG, không có cạnh nào đi từ nhãn Medium1 tới Medium2 và cũng
không có cạnh nào nối từ nhãn Medium2 tới Medium3. Do đó phương pháp suy luận
xấp xỉ trong thuật toán FISA được dùng để gán nhãn đầu ra đối với trường hợp này.
Tính toán tương tự như trên thì thu được D1 = 1/6, D2 = 1/4. Do đó, nhãn đầu ra
được gán là 2.
Với ví dụ số về các trường hợp có thể xảy rađối với dữ liệu đầu vào đã minh họa
rõ về khả năng suy diễn đầu ra dựa trên đồ thị tri thức FKG và mô hình suy luận xấp
xỉ trong thuật toán FISA. Nó giúp cho chúng ta có thể suy luận một cách linh động,
mềm dẻo hơn đối với những trường hợp thiếu tri thức hay những hệ thống mà có quá
ít luật biểu diễn.
103
4.4. Thực nghiệm và đánh giá kết quả
4.4.1. Thực nghiệm
Việc đánh giá hiệu quả của mô hình đề xuất trong việc giải quyết bài toán hỗ
trợ ra quyết định như sau. Để việc đánh giá hiệu quả hơn thì trong nội dung này, mô
hình đề xuất được thực nghiệm với hai loại bộ dữ liệu (bộ dữ liệu hai nhãn và bộ dữ
liệu nhiều nhãn). Các bộ dữ liệu hai nhãn là hai bộ dữ liệu chuẩn Benchmark được lấy
từ kho dữ liệu chuẩn gồm (Bộ Breast Wisconsin, Bộ Diabetes) và một bộ dữ liệu thực
Liver. Bộ dữ liệu nhiều nhãn là bộ lấy từ kho dữ liệu chuẩn UCI bao gồm bộ dữ liệu
Wine, bộ Cardiotcography-CTG và bộ Arrthymia.
Trong thực nghiệm, mỗi bộ dữ liệu sẽ được chia làm bốn nhóm bao gồm bộ
dữ liệu Training, bộ dữ liệu Testing, bộ dữ liệu Validation và bộ dữ liệu New data. Bộ
dữ liệu New data là bộ dữ liệu bao gồm các bản ghi mới được sử dụng với mục đích
kiểm tra mô hình đề xuất trong trường hợp không có bản ghi nào xuất hiện trong phần
Training (dùng để đo độ tương thích và khả năng suy luận của mô hình đề xuất).
Bảng 4.2: Kịch bản 1
Dữ liệu Training Validation Testing New data
Số lượng bản ghi đối với mỗi nhãn 2/3 ∗ 2/3 ∗ 0.6∗(Số lượng bản ghi đối với mỗi nhãn) 2/3 ∗ 1/3 ∗ 0.6∗(Số lượng bản ghi đối với mỗi nhãn) 1/3 ∗ 0.6∗ (Số lượng bản ghi đối với mỗi nhãn) 0.4∗ (Số lượng bản ghi đối với mỗi nhãn)
Bảng 4.3: Kịch bản 2
Dữ liệu
Training
Validation
Testing
New data
Nếu số lượng bản ghi đối với mỗi nhãn/Tổng số bản ghi >5% 2/3*2/3*0.3*(Số lượng bản ghi đối với mỗi nhãn) 2/3*1/3*0.3* (Số lượng bản ghi đối với mỗi nhãn) 1/3*0.3* (Số lượng bản ghi đối với mỗi nhãn) 0.7* (Số lượng bản ghi đối với mỗi nhãn)
Nếu số lượng bản ghi đối với mỗi nhãn/Tổng số bản ghi >5% 2/3*2/3*0.05* (Số lượng bản ghi đối với mỗi nhãn) 2/3*1/3*0.05* (Số lượng bản ghi đối với mỗi nhãn) 1/3*0.05* (Số lượng bản ghi đối với mỗi nhãn) 0.7* (Số lượng bản ghi đối với mỗi nhãn)
Hai kịch bản chạy thực nghiệm được chỉ rõ trong Bảng 4.2 và 4.3.
104
Bảng 4.2 là kịch bản chạy thực nghiệm được sử dụng để đánh giá mô hình
M-CFIS-FKG với M-CFIS-R về độ chính xác cũng như thời gian chạy thực nghiệm
với từng bộ dữ liệu. Còn kịch bản trong Bảng 4.3 được sử dụng với mục đích dùng
để kiểm chứng khả năng suy luận của mô hình đề xuất trong trường hợp kích thước
của bộ dữ liệu mới nhiều hơn rất nhiều so với các bộ dữ liệu Training, Testing và
Validation. Bên cạnh đó, một số nhãn đầu ra có thể có hoặc có rất ít trong bộ dữ liệu
Training. Điều này sẽ kiểm chứng cách thức mô hình sinh ra từ bộ dữ liệu Training để
(a) Bộ WBCD
(b) Bộ Diebetes
(c) Bộ Liver
Hình 4.6: Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có 2 nhãn
thực hiện suy luận với dữ liệu mới.
Đối với mỗi bộ dữ liệu hai nhãn và nhiều nhãn, Hình 4.6 và 4.7 mô tả cách
nhìn trực quan về cách phân chia các nhãn đầu ra tương ứng với các bộ dữ liệu, trong
đó Hình 4.6 dành cho các bộ dữ liệu hai nhãn và Hình 4.7 dành cho các bộ dữ liệu
có nhiều nhãn. Tiêu chí đánh giá thực nghiệm theo hai kịch bản là dựa trên thời gian
thực hiện và độ chính xác của mô hình so sánh.
4.4.2. Kết quả thực nghiệm
4.5.2.1 Kết quả thực nghiệm trên các bộ dữ liệu 2 nhãn
Đối với các bộ dữ liệu hai nhãn, kết quả thực nghiệm so sánh mô hình đề xuất
M-CFIS-FKG với mô hình M-CFIS-R được thực hiện so sánh trên hai tiêu chí đánh
105
(a) Bộ Wine
(b) Bộ CTG
(c) Bộ Arrthythmia
Hình 4.7: Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có nhiều nhãn
giá gồm thời gian thực hiện và độ chính xác. Cụ thể như sau:
Hình 4.8 minh họa thực nghiệm so sánh về độ chính xác và thời gian tính toán
của hai mô hình trên bộ dữ liệu WBCD. Như đã chỉ rõ trong hình 4.8(a) thì ta có thể
thấy không có nhiều sự khác biệt về độ chính xác giữa hai kịch bản thực nghiệm. Với
kịch bản thực nghiệm thứ nhất, độ chính xác của mô hình M-CFIS-FKG thấp hơn chút
so với mô hình M-CFIS-R (khoảng 13.93%). Còn với kịch bản thực nghiệm thứ hai
thì độ chính xác của mô hình M-CFIS-FKG chỉ thấp hơn khoảng 3.44%. Tuy nhiên,
thời gian thực hiện tính toán của mô hình M-CFIS-FKG lại thấp hơn nhiều so với mô
106
hình M-CFIS-R trên cả hai kịch bản thực nghiệm (trung bình giảm gần 97% tổng thời
gian thực hiện). Hơn nữa, đối với bộ dữ liệu mới, tổng thời gian thực hiện của mô hình
M-CFIS-R (ví dụ 1.98s đối với kịch bản thứ nhất và 2.44s đối với kịch bản thứ hai)
cao hơn nhiều so với tổng thời gian thực hiện của mô hình M-CFIS-FKG (tương ứng
là 0.05s đối với kịch bản thứ nhất và 0.1s đối với kịch bản thứ hai). Điều đó thể hiện
cho thấy mô hình đề xuất M-CFIS-FKG có khả năng suy luận xấp xỉ tốt hơn đối với
(a) Độ chính xác
(b) Thời gian thực hiện
Hình 4.8: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu WBCD
những bản ghi không có sẵn trong bộ Training.
Hình 4.9 thể hiện kết quả thực nghiệm so sánh giữa hai mô hình M-CFIS-R và
M-CFIS-FKG trên bộ dữ liệu Diabetes. Như thể hiện trong hình 4.9(a), độ chính xác
của mô hình đề xuất M-CFIS-FKG nhỏ hơn chút so với mô hình M-CFIS-R trên cả hai
kịch bản chạy thực nghiệm (cụ thể trung bình khoảng 6.89% đối với kịch bản thứ nhất
và 3.82% đối với kịch bản thứ hai). Còn về thời gian thực hiện thì tổng thời gian thực
107
hiện của mô hình M-CFIS-FKG vẫn thấp hơn so với mô hình M-CFIS-R. Đặc biệt
trong kịch bản thực nghiệm thứ hai, thời gian thực nghiệm của mô hình M-CFIS-R
cao gấp 2.31 lần so với M-CFIS-FKG mà với độ chính xác gần như nhau (76.43% đối
với M-CFIS-R và 74.43% đối với M-CFIS-FKG – mô tả trong hình 4.9(a)). Như vậy,
ta có thể thấy M-CFIS-FKG thực hiện tốt hơn đối với dữ liệu mới trong kịch bản thực
(a) Độ chính xác
(b) Thời gian thực hiện
Hình 4.9: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Diebetes
nghiệm thứ hai.
Kết quả thực nghiệm đối với bộ dữ liệu thực Liver được mô tả rõ trong Hình
4.10. Rõ ràng là đối với kịch bản thực nghiệm thứ nhất, độ chính xác của M-CFIS-
FKG thấp hơn 4.27% so với M-CFIS-R nhưng thời gian tính toán thì trung bình giảm
khoảng 3.77 lần. Còn trong kịch bản thực nghiệm thứ hai, mô hình M-CFIS-FKG
được cho là hiệu quả hơn so với M-CFIS-R với độ chính xác thấp hơn khoảng 2.23%
nhưng tổng thời gian thực hiện lại giảm tới 4.1 lần. Hơn nữa, trong trường hợp có
nhiều dữ liệu mới trong kịch bản thứ hai, mô hình M-CFIS-FKG cho kết quả gần như
108
tương đương, độ chính xác thấp hơn 1.14% với thời gian chạy giảm 33.56% so với mô
(a) Độ chính xác
(b) Thời gian thực hiện
Hình 4.10: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Liver
4.5.2.2 Kết quả thực nghiệm trên các bộ dữ liệu nhiều nhãn
hình M-CFIS-R.
Đối với các bộ dữ liệu nhiều nhãn, kết quả thực nghiệm được chỉ rõ trong các
hình 4.11- 4.13. Đối với các bộ dữ liệu nhiều nhãn, độ phân bố dữ liệu trong từng
nhóm dữ liệu cũng khác hơn so với các bộ dữ liệu có hai nhãn, điều đó cũng dẫn đến
kết quả thực nghiệm khác so với các bộ dữ liệu có hai nhãn.
Độ chính xác và thời gian tính toán của thuật toán M-CFIS-R và M-CFIS-FKG
trên bộ dữ liệu Wine được minh họa rõ trong Hình 4.11. Ở hình 4.11(a), độ chính xác
của mô hình M-CFIS-FKG chỉ thấp hơn chút so với của mô hình M-CFIS-R, ngoại
trừ đối với dữ liệu mới trong kịch bản hai. Kết quả trung bình là thấp hơn 7.8% và
5.3% tương ứng với kịch bản thực nghiệm thứ nhất và thứ hai. Giống như kết quả thực
109
(a) Độ chính xác
(b) Thời gian thực hiện
Hình 4.11: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Wine
nghiệm đối với các bộ dữ liệu khác thì thời gian tính toán của mô hình M-CFIS-FKG
thấp hơn nhiều so với thời gian chạy mô hình M-CFIS-R. Đặc biệt trong trường hợp
có nhiều dữ liệu mới trong kịch bản chạy thực nghiệm thứ hai thì độ chính xác của
M-CFIS-FKG chỉ thấp hơn 0.37% với thời gian thực hiện giảm tới 2.88 lần.
Đối với bộ dữ liệu ảnh chụp tim thai CTG, độ chính xác và tổng thời gian thực
hiện tính toán của hai mô hình được mô tả rõ trong Hình 4.12, và có cùng chung kết
quả thực nghiệm như đối với các bộ dữ liệu trên. Mô hình M-CFIS-FKG được cho là
tốt hơn mô hình M-CFIS-R trong trường hợp chạy thực nghiệm đối với kịch bản hai,
tức là đối với trường hợp có nhiều dữ liệu mới (độ chính xác thấp hơn 1.27% nhưng
tổng thời gian thực hiện thì thấp hơn 2.49).
Đối với bộ dữ liệu rối loạn nhịp tim Arrhythmia, sự phân bố dữ liệu trong kịch
bản hai cũng chịu ảnh hưởng nhiều như với các bộ dữ liệu nhiều nhãn khác.
Như đã mô tả rõ trong hình 4.7(c), rất nhiều nhãn không có trong bộ dữ liệu
110
(a) Độ chính xác
(b) Thời gian thực hiện
Hình 4.12: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu CTG
Training, nhưng vẫn giữ nguyên trong bộ dữ liệu mới để kiểm chứng cho vấn đề suy
luận xấp xỉ ra nhãn đầu ra cuối cùng của mô hình đề xuất. Trong trường hợp này thì
độ chính xác của mô hình M-CFIS-FKG cao hơn M-CFIS-R (khoảng 1.94%) trong
khi thời gian thực hiện giảm đi khoảng 3.88 lần. Điều đó có nghĩa là mô hình đề xuất
M-CFIS-FKG thực sự hiệu quả trong việc suy luận trong trường hợp có nhiều thông
tin mới không sẵn có trong bộ dữ liệu Traning và thậm chí cả trong quá trình Testing.
Như vậy, với kịch bản thực nghiệm thứ nhất trên tất cả các bộ dữ liệu, số lượng
dữ liệu trong các nhãn đầu ra đối với từng bộ dữ liệu là tương đương nhau (cụ thể
trong Bảng 4.2). Trong trường hợp này, các nhãn đều được phân bố đồng đều trong
các bộ dữ liệu Training, Testing và New data. Điều này cũng góp phần làm giảm tổng
thời gian thực hiện của mô hình M-CFIS-FKG. Bên cạnh đó, kết quả về độ chính xác
của mô hình M-CFIS-FKG và M-CFIS-R trên các bộ dữ liệu có nhiều nhãn đầu ra
cũng nhỏ hơn nhiều so với các bộ dữ liệu có hai nhãn. Điều đó chứng minh được tính
111
(a) Độ chính xác
(b) Thời gian thực hiện
Hình 4.13: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Arrhythmia
hiệu quả của mô hình đề xuất M-CFIS-FKG đối với các bộ dữ liệu có nhiều nhãn đầu
ra.
Sự khác nhau giữa các bộ dữ liệu hai nhãn và nhiều nhãn được thể hiện ở sự
phân bố các nhãn trong bộ dữ liệu New data trong kịch bản thực nghiệm thứ hai. Trong
kịch bản này, đặc biệt trong bộ dữ liệu New data chứa nhiều nhãn đầu ra không có hay
ít có xuất hiện trong hai bộ dữ liệu Training và Testing. Chính vì đó mà thực nghiệm
trên bộ dữ liệu này sẽ chứng minh được khả năng suy luận xấp xỉ của mô hình đề xuất.
Trong một số trường hợp thì có thể nói mô hình M-CFIS-FKG mới này có khả năng
suy luận, khám phá thông tin đối với cả các thông tin mới từ các bản ghi không quen
thuộc.
Bằng kết quả thực nghiệm đối với tất cả các bộ dữ liệu theo kịch bản thực
nghiệm thứ hai, mô hình M-CFIS-FKG đã chứng tỏ khả năng phân loại mẫu gần
chính xác tương đương với mô hình M-CFIS-R (thậm chí có bộ dữ liệu còn có độ
112
chính xác cao hơn, ví dụ như ở bộ dữ liệu Arrhythmia) với thời gian chạy trung bình
thấp (trung bình giảm khoảng 6.45 lần). Điều này chứng tỏ mô hình M-CFIS-FKG
hoạt động hiệu quả trong quá trình suy luận.
Kết quả thực nghiệm của mô hình M-CFIS-KFG trên cả hai kịch bản thực
nghiệm về mặt thời gian tính toán và độ chính xác của mô hình đã chứng minh được
tính hiệu quả của mô hình đề xuất trong việc giảm khá nhiều thời gian tính toán mô
hình với độ chính xác được coi là chấp nhận được. Đặc biệt mô hình có ý nghĩa thực
tiễn đối với những trường hợp thiếu thông tin dữ liệu trong kho dữ liệu mẫu.
4.5. Kết Chương 4
Trong nội dung chương này, luận án đưa ra một số chú ý và thuật toán mới đối
với Hệ suy diễn mờ phức (CFIS) mà có nhiều ứng dụng quan trọng trong việc giải
quyết các vấn đề hỗ trợ ra quyết định trong thế giới thực. Mô hình Hệ suy diễn mờ
phức Mamdani trong Chương 3 (M-CFIS-R) còn nhiều hạn chế như thời gian tính
toán còn nhiều và khả năng suy luận chưa được cao, nhất là khi xử lí đối với các bộ
dữ liệu mới. Do đó, trong nội dung chương này NCS đã nghiên cứu và phát triển tiếp
mô hình M-CFIS-R, cụ thể như sau:
Trước tiên NCS đề xuất mở rộng mô hình M-CFIS-R: bao gồm Hệ suy diễn
mờ phức Sugeno (S-CFIS-R) và Hệ suy diễn mờ phức Tsukamoto (T-CFIS-R), độ đo
mờ phức và tích phân mờ phức. Đặc biệt, độ đo mờ phức và tích phân mờ phức cũng
cung cấp một số lý thuyết cũng như định lý cơ bản trong các ngữ cảnh khác nhau.
Thêm nữa, để khắc phục những hạn chế về mặt thời gian tính toán và khả năng
suy luận đối với mô hình M-CFIS-R thì NCS cũng đề xuất xây dựng Đồ thị tri thức
mờ (FKG) từ bộ cơ sở luật trong quá trình Training. Sau đó đồ thị tri thức mờ đó được
dùng để biểu diễn các nhãn ngôn ngữ và mối quan hệ giữa các thành phần đó trong
cơ sở luật. Kết quả thu được là một ma trận kề của đồ thị FKG và có thể thực hiện suy
luận trên đồ thị đó. Khi có một bản ghi mới được đưa vào trong bộ dữ liệu Testing, thì
bộ dữ liệu đó sẽ được mờ hoá và gán nhãn. Dựa vào đồ thị FKG thì từng thành phần
của bản ghi mới này sẽ được thực hiện thông qua cơ chế suy luận xấp xỉ gần đúng
(thuật toán FISA) để lựa chọn luật phù hợp một cách nhanh chóng nhất bằng cách so
113
khớp các bản ghi trong tập dữ liệu Testing với các luật mờ phức trong Bộ cơ sở luật
mờ phức đã thu được. Sau đó, việc lấy nhãn của bản ghi được thực hiện thông qua
toán tử Max-min. Cơ chế này sẽ giúp không những chỉ tăng tốc độ kiểm tra mà còn
giúp cho quá trình suy luận trong trường hợp có nhiều bản ghi mới mà không có sẵn
trong bộ dữ liệu Training.
Để chứng minh tính hiệu quả của mô hình M-CFIS-FKG đề xuất so với mô
hình M-CFIS-R, NCS thực nghiệm trên các bộ dữ liệu chuẩn UCI và dữ liệu Bệnh
gan thực trên hai kịch bản đánh giá. Kịch bản thứ nhất được dùng để đánh giá hiệu
suất của thuật toán dựa trên thời gian tính toán và độ chính xác. Với mục đích kiểm
tra khả năng suy luận của thuật toán trong trường hợp kích thước của dữ liệu mới lớn
hơn nhiều kích thước trong ba quá trình Training, Validation và Testing thì kịch bản
thứ hai được đưa vào thực nghiệm kiểm thử. Bên cạnh đó, còn có trường hợp có một
số nhãn trong dữ liệu mới không có hoặc có ít các bản ghi có trong dữ liệu Training.
Điều này có thể đánh giá được cách mà mô hình sinh ra từ dữ liệu Training để xử
lý đối với trường hợp dữ liệu mới. Kết quả thực nghiệm đã chỉ rõ độ chính xác của
mô hình M-CFIS-FKG trong kịch bản thứ nhất thấp hơn mô hình M-CFIS-R (khoảng
13.93%) và 3.44% đối với kịch bản thứ hai. Thời gian tính toán là một lợi thế của M-
CFIS-FKG, trong tất cả các trường hợp và trên hai kịch bản thì thời gian thực hiện của
M-CFIS-FKG đều thấp hơn so với M-CFIS-R (trung bình giảm khoảng 97%). Với các
bộ dữ liệu đa nhãn, khả năng suy luận được thể hiện rõ với mô hình M-CFIS-FKG đề
xuất. Tóm lại, mô hình M-CFIS-FKG phân loại mẫu với độ chính xác gần như tương
đương với mô hình M-CFIS-R (thậm chí còn cao hơn trong bộ dữ liệu Arrhythmia) và
với thời gian chạy thấp (trung bình khoảng 6.45 lần). Điều này chứng tỏ rằng mô hình
M-CFIS-FKG thực hiện hiệu quả hơn trong quá trình suy luận.
Các kết quả nghiên cứu ở Chương 4 được công bố trong công trình [A4], phần
“Danh mục các công trình” của luận án.
114
Chương 4. KẾT LUẬN
Những kết quả chính của luận án
Luận án tham gia vào dòng nghiên cứu về vấn đề Hỗ trợ ra quyết định đối với
các lớp bài toán có dữ liệu có tính chu kì, định kì và có yếu tố bổ sung. Cụ thể luận án
đã tập trung vào một số vấn đề còn tồn tại thiếu sót của các hệ thống đã có và đưa ra
được một số đóng góp chính như sau:
Kết quả của luận án bao gồm:
Thứ nhất, luận án đề xuất các phép toán t-chuẩn, t-đối chuẩn dựa trên tập mờ
phức.
Phép toán t-chuẩn và t-đối chuẩn được coi là phần quan trọng đối với việc phát
triển các phép toán trong lý thuyết tập mờ phức. Cho nên, với định hướng phát triển
thêm về lý thuyết tập mờ phức thì luận án đề xuất thêm về toán tử t-chuẩn và t-đối
chuẩn. Ngoài ra, để chứng minh tính hiệu quả của phép toán đề xuất với việc giải
quyết các vấn đề trong hệ hỗ trợ ra quyết định, ví dụ số minh họa cũng được thực hiện
nhằm áp dụng phép toán t-chuẩn và t-đối chuẩn mờ phức cũng được đưa ra trong nội
dung luận án.
Thứ hai, luận án đề xuất mô hình Hệ suy diễn mờ phức Mamdani (M-CFIS).
Với ý tưởng từ hệ logic mờ phức của Ramot, luận án chọn phương pháp suy
diễn đơn giản nhất hệ FIS Mamdani làm thành phần điều khiển Module suy diễn mờ
phức trong hệ logic mờ phức của Ramot. Mô hình M-CFIS luận án đề xuất là sự kết
hợp của hệ FIS Mamdani và hệ logic mờ phức của Ramot dựa trên nền tảng lý thuyết
của tập mờ phức. Trong đó, mô hình cũng chỉ ra rõ những thành phần, các phép toán
được sử dụng trong mô hình Hệ suy diễn mờ phức Mamdani. Thử nghiệm đối với các
bộ dữ liệu mẫu lấy từ kho dữ liệu UCI và dữ liệu thực lấy từ bệnh viện Gang thép
và Đa khoa Thái Nguyên cũng chứng minh cho thấy mô hình đề xuất cải thiện hơn
mô hình hệ suy diễn mờ Mamdani trên các chỉ số đánh giá độ chính xác, Recall và
Precision.
115
Thứ ba, đề xuất mô hình M-CFIS-R.
Nhận xét thấy mô hình hệ M-CFIS đề xuất còn nhiều hạn chế trong bộ luật cơ
sở, quá trình giảm luật còn thô sơ chỉ giảm luật trùng lặp và yếu. Bộ luật cơ sở đó
vẫn còn có thể còn có chứa các luật dư thừa nên luận án đề xuất xây dựng hệ thống
M-CFIS-R là hệ thống cải tiến của M-CFIS trong hệ cơ sở luật. Trong hệ thống M-
CFIS-R, các độ đo tương tự mờ phức được đề xuất kết hợp với tính toán hạt để thực
hiện phương thức tinh giảm luật mờ trong mô hình hệ suy diễn mờ phức Mamdani
M-CFIS. Kết quả thực nghiệm trên cả bộ dữ liệu chuẩn và dữ liệu thực cũng cho thấy
phương thức tinh giảm luật đề xuất trong hệ M-CFIS-R đã giảm thiểu được số lượng
luật và nâng cao độ chính xác của mô hình mới so với mô hình cũ M-CFIS.
Thứ tư, luận án đề xuất một số mở rộng của mô hình M-CFIS-R.
Với hạn chế còn tồn tại của hệ thống M-CFIS-R là chỉ thực hiện với mô hình
hệ FIS đơn giản Mamdani nên luận án đề xuất phát triển với các mô hình mờ khác
là Sugeno và Tsukamoto. Thêm nữa, nhằm bổ sung cho lý thuyết độ đo dựa trên lý
thuyết tập mờ phức, luận án cũng đưa ra lý thuyết thêm về độ đo mờ phức và tích phân
mờ phức dựa trên nền tảng lý thuyết tập hợp.
Cuối cùng, luận án đề xuất cải tiến mô hình M-CFIS-R bằng đề xuất xây dựng
mô hình M-CFIS-FKG. Nếu mô hình M-CFIS-R là mô hình cải tiến của M-CFIS
trong giai đoạn Training thì mô hình M-CFIS-FKG mà mô hình cải tiến của M-FIS và
M-FIS-R trong giai đoạn Testing. Phương thức biểu diễn luật mờ trên đồ thị tri thức
mờ được giới thiệu sử dụng để cải tiến quá trình Testing. Thêm nữa, phương pháp suy
diễn xấp xỉ thực hiện suy luận trên đồ thị tri thức mờ được giới thiệu sử dụng trong
mô hình M-CFIS-FKG đối với trường hợp dữ liệu trong bộ Testing có ít hoặc không
có trong bộ Training. Hiệu quả của mô hình đề xuất trong hệ hỗ trợ ra quyết định đã
được chứng minh thông qua thực nghiệm trên các bộ dữ liệu hai nhãn và nhiều nhãn
với hai kịch bản thực nghiệm (kịch bản thứ nhất nhằm đánh giá mô hình mới đề xuất
M-CFIS-FKG về độ chính xác cũng như thời gian thực hiện còn kịch bản thứ hai nhằm
kiểm chứng khả năng suy luận của mô hình trong trường hợp kích thước của bộ dữ
liệu mới nhiều hơn rất nhiều so với các bộ dữ liệu đã có).
Bên cạnh các kết quả nghiên cứu đã đạt được, những nghiên cứu trong luận án
vẫn còn tồn tại một số điểm hạn chế như:
– Tính chu kì, định kì hay các thông tin bổ sung thể hiện trong dữ liệu mờ phức
còn đơn giản. Việc tác động giữa dữ liệu không gian và yếu tố thời gian/chu kì
thời gian còn chưa được thực hiện.
116
– Luận án mới chỉ thực nghiệm trên các bộ dữ liệu số, còn dữ liệu không gian chưa
được thực hiện.
– Việc xây dựng hệ luật trong mô hình còn đơn giản, chưa áp dụng các cơ chế học
trong đó mà chỉ xây dựng hệ luật từ bộ dữ liệu đầu vào.
– Việc đánh giá hiệu năng của hệ luật cơ sở chỉ dừng lại ở mức tối ưu cục bộ, đơn
giản chưa thực hiện được tối ưu toàn cục.
– Một số phép toán và độ đo trên tập mờ phức trong nghiên cứu đang ở mức cơ
bản, còn chưa quan tâm nhiều đến toàn bộ không gian của thành phần pha. Các
mở rộng dựa trên nền các phép toán cổ điển được coi như là một tiền đề cho sự
phát triển.
Hướng phát triển của luận án
Trong tương lai, định hướng phát triển tiếp theo của luận án có thể thực hiện
theo các hướng nghiên cứu sau:
– Tiếp tục nghiên cứu và khắc phục những mặt hạn chế của các độ đo tương tự đã
đề xuất.
– Tiếp tục nghiên cứu, đề xuất toán tử hợp thành trên tập mờ phức và áp dụng các
toán tử đề xuất vào trong chính mô hình hệ hỗ trợ ra quyết định.
– - Tiếp tục cải tiến mô hình hệ suy diễn mờ phức nhằm nâng cao chất lượng của
mô hình như: o Tích hợp các phương pháp khác nhau lựa chọn các đặc trưng và
luật suy diễn cho quá trình học. o Thể hiện trọng số luật trong mô hình o Cải
tiến các toán tử/độ đo sử dụng trong mô hình phù hợp hơn với một số bài toán
chuyên biệt như bài toán chuẩn đoán bệnh, bài toán dự báo nhiệt độ, . . .
– Tiếp tục nghiên cứu, đề xuất các thuật toán học như học chuyển giao, học cộng
tác ... vào trong quá trình tinh giảm luật mờ với mục tiêu tối ưu hóa hệ luật.
– Tiếp tục nghiên cứu, đề xuất các phương pháp biểu diễn hệ luật mờ phức, phương
pháp suy diễn mới nhằm mục đích nâng cao khả năng tìm kiếm trên đồ thị tri
thức mờ.
– Thử nghiệm các mô hình đề xuất trong luận án với nhiều bộ dữ liệu phức tạp
hơn trong các lĩnh vực khác nhau trong cuộc sống như: y tế, kinh tế , địa lý...
117
– Áp dụng, triển khai và tích hợp các nghiên cứu đã đề xuất cho các hệ thống trong
thực tiễn như chăm sóc sức khỏe, dự báo bão, . . .
118
DANH MỤC CÁC CÔNG TRÌNH CỦA LUẬN ÁN
A1. Tran Thi Ngan, Luong Thi Hong Lan, Mumtaz Ali, Dan Tamir, Le Hoang Son,
Tran Manh Tuan, Naphtali Rishe, Abe Kandel (2018), “Logic Connectives of Complex
Fuzzy Sets”, Romanian Journal of Information Science and Technology, Vol. 21,
No. 4, pp. 344-358 (ISSN:1453-8245, SCIE, 2019 IF = 0.760), DOI = http://www.romjist.ro/abstract-
606.html
A2. Ganeshsree Selvachandran, Shio Gai Quek, Luong Thi Hong Lan, Le Hoang
Son, Nguyen Long Giang, Weiping Ding, Mohamed Abdel-Basset, Victor Hugo
C. de Albuquerque (2021), “A New Design of Mamdani Complex Fuzzy Inference
System for Multi-attribute Decision Making Problems”, IEEE Transactions on Fuzzy
Systems, Vol. 29, No.4, pp. 716-730 (ISSN:1063-6706, SCI, 2019 IF = 9.518),
DOI = http://dx.doi.org/10.1109/TFUZZ.2019.2961350
A3. Tran Manh Tuan, Luong Thi Hong Lan, Shuo-Yan Chou, Tran Thi Ngan, Le
Hoang Son, Nguyen Long Giang, Mumtaz Ali (2020), “M-CFIS-R: Mamdani Complex
Fuzzy Inference System with Rule Reduction Using Complex Fuzzy Measures in
Granular Computing”, Mathematics, Vol. 8, No. 5, pp. 707 – 731 (ISSN: 2227-
7390, SCIE, 2019 IF = 1.747),
DOI = https://doi.org/10.3390/math8050707.
A4. Luong Thi Hong Lan, Tran Manh Tuan, Tran Thi Ngan, Le Hoang Son, Nguyen
Long Giang, Vo Truong Nhu Ngoc, Pham Van Hai (2020), “A New Complex
Fuzzy Inference System with Fuzzy Knowledge Graph and Extensions in Decision
Making”, IEEE Access, Vol. 8, pp. 164899 - 164921 (ISSN: 2169-3536, SCIE,
2019 IF = 3.745), DOI = http://dx.doi.org/10.1109/ACCESS.2020.3021097.
119
Chương 4. Tài liệu tham khảo
[1] L. A. Zadeh, “Fuzzy sets,” Information and control, vol. 8, no. 3, pp. 338–353,
1965.
[2] G. Mapari and A. Naidu, “Study of fuzzy set theory and its applications,” IOSR
Journal of Mathematics, vol. 12, no. 4, pp. 148–154, 2016.
[3] T. Sooraj, R. Mohanty, and B. Tripathy, “Hesitant fuzzy soft set theory and
its application in decision making,” in Artificial Intelligence and Evolutionary
Computations in Engineering Systems, pp. 315–322, Springer, 2017.
[4] J. C. R. Alcantud and V. Torra, “Decomposition theorems and extension
principles for hesitant fuzzy sets,” Information Fusion, vol. 41, pp. 48–56,
2018.
[5] M.-Q. Wu, T.-Y. Chen, and J.-P. Fan, “Divergence measure of t-spherical
fuzzy sets and its applications in pattern recognition,” IEEE Access, vol. 8,
pp. 10208–10221, 2019.
[6] B. Paik and S. K. Mondal, “A distance-similarity method to solve fuzzy sets
and fuzzy soft sets based decision-making problems,” Soft Computing, vol. 24,
no. 7, pp. 5217–5229, 2020.
[7] L. Tiwari, R. Raja, V. Sharma, and R. Miri, “Fuzzy inference system for
efficient lung cancer detection,” in Computer Vision and Machine Intelligence
in Medical Image Analysis, pp. 33–41, Springer, 2020.
[8] B. Kapadia and A. Jain, “Detection of diabetes mellitus using fuzzy inference
system,” Studies in Indian Place Names, vol. 40, no. 53, pp. 104–110, 2020.
[9] A. M. Sagir and S. Sathasivam, “A novel adaptive neuro fuzzy inference system
based classification model for heart disease prediction.,” Pertanika Journal of
Science & Technology, vol. 25, no. 1, 2017.
120
[10] A. Bakhshipour, H. Zareiforoush, and I. Bagheri, “Application of decision trees
and fuzzy inference system for quality classification and modeling of black
and green tea based on visual features,” Journal of Food Measurement and
Characterization, pp. 1–15, 2020.
[11] E. Pourjavad and A. Shahin, “The application of mamdani fuzzy inference
system in evaluating green supply chain management performance,”
International Journal of Fuzzy Systems, vol. 20, no. 3, pp. 901–912, 2018.
[12] N. Priyadarshi, F. Azam, A. K. Sharma, and M. Vardia, “An adaptive neuro-
fuzzy inference system-based intelligent grid-connected photovoltaic power
generation,” in Advances in Computational Intelligence, pp. 3–14, Springer,
2020.
[13] A. C. Adoko and S. Yagiz, “Fuzzy inference system-based for tbm field
penetration index estimation in rock mass,” Geotechnical and Geological
Engineering, vol. 37, no. 3, pp. 1533–1553, 2019.
[14] J.-S. Jang, “Anfis: adaptive-network-based fuzzy inference system,” IEEE
transactions on systems, man, and cybernetics, vol. 23, no. 3, pp. 665–685,
1993.
[15] D. Karaboga and E. Kaya, “Adaptive network based fuzzy inference system
(anfis) training approaches: a comprehensive survey,” Artificial Intelligence
Review, vol. 52, no. 4, pp. 2263–2293, 2019.
[16] S. Subbulakshmi, G. Marimuthu, and N. Neelavathy, “Application of s-anfis
method in coronary artery disease,” Malaya Journal of Matematik (MJM),
no. 1, 2019, pp. 535–538, 2019.
[17] R. Razavi, A. Sabaghmoghadam, A. Bemani, A. Baghban, K.-w. Chau,
and E. Salwana, “Application of anfis and lssvm strategies for estimating
thermal conductivity enhancement of metal and metal oxide based nanofluids,”
Engineering Applications of Computational Fluid Mechanics, vol. 13, no. 1,
pp. 560–578, 2019.
[18] G. K. Tairidis, N. Stojanovic, D. Stamenkovic, and G. E. Stavroulakis, “Neuro-
fuzzy techniques and natural risk management. applications of anfis models in
floods and comparison with other models,” in Natural Risk Management and
Engineering, pp. 169–189, Springer, 2020.
121
[19] P. Sihag, N. Tiwari, and S. Ranjan, “Prediction of unsaturated hydraulic
conductivity using adaptive neuro-fuzzy inference system (anfis),” ISH Journal
of Hydraulic Engineering, vol. 25, no. 2, pp. 132–142, 2019.
[20] A. Azad, M. Manoochehri, H. Kashi, S. Farzin, H. Karami, V. Nourani, and
J. Shiri, “Comparative evaluation of intelligent algorithms to improve adaptive
neuro-fuzzy inference system performance in precipitation modelling,” Journal
of Hydrology, vol. 571, pp. 214–224, 2019.
[21] Y. K. Semero, J. Zhang, and D. Zheng, “Emd–pso–anfis-based hybrid approach
for short-term load forecasting in microgrids,” IET Generation, Transmission
& Distribution, vol. 14, no. 3, pp. 470–475, 2019.
[22] P. Hájek and V. Olej, “Adaptive intuitionistic fuzzy inference systems of takagi-
sugeno type for regression problems,” in IFIP International Conference on
Artificial Intelligence Applications and Innovations, pp. 206–216, Springer,
2012.
[23] P. Hajek and V. Olej, “Defuzzification methods in intuitionistic fuzzy inference
systems of takagi-sugeno type: The case of corporate bankruptcy prediction,”
in 2014 11th International Conference on Fuzzy Systems and Knowledge
Discovery (FSKD), pp. 232–236, IEEE, 2014.
[24] A. Hernandez-Aguila, M. Garcia-Valdez, and O. Castillo, “A proposal for an
intuitionistic fuzzy inference system,” in 2016 IEEE International Conference
on Fuzzy Systems (FUZZ-IEEE), pp. 1294–1300, IEEE, 2016.
[25] E. Egrioglu, E. Bas, O. C. Yolcu, and U. Yolcu, “Intuitionistic time series fuzzy
inference system,” Engineering Applications of Artificial Intelligence, vol. 82,
pp. 175–183, 2019.
[26] C. Luo, C. Tan, X. Wang, and Y. Zheng, “An evolving recurrent interval
type-2 intuitionistic fuzzy neural network for online learning and time series
prediction,” Applied Soft Computing, vol. 78, pp. 150–163, 2019.
[27] E. Bas, U. Yolcu, and E. Egrioglu, “Intuitionistic fuzzy time series functions
approach for time series forecasting,” Granular Computing, pp. 1–11, 2020.
122
[28] P. H. Thong et al., “Some novel hybrid forecast methods based on picture fuzzy
clustering for weather nowcasting from satellite image sequences,” Applied
Intelligence, vol. 46, no. 1, pp. 1–15, 2017.
[29] P. Van Viet, P. Van Hai, et al., “Picture inference system: a new fuzzy inference
system on picture fuzzy set,” Applied Intelligence, vol. 46, no. 3, pp. 652–669,
2017.
[30] L. H. Son, “Measuring analogousness in picture fuzzy sets: from picture
distance measures to picture association measures,” Fuzzy Optimization and
Decision Making, vol. 16, pp. 359–378, 2017.
[31] L. H. Son, “Generalized picture distance measure and applications to picture
fuzzy clustering,” Applied Soft Computing, vol. 46, no. C, pp. 284–295, 2016.
[32] P. H. Thong et al., “A novel automatic picture fuzzy clustering method based
on particle swarm optimization and picture composite cardinality,” Knowledge-
Based Systems, vol. 109, pp. 48–60, 2016.
[33] P. H. Thong et al., “Picture fuzzy clustering for complex data,” Engineering
Applications of Artificial Intelligence, vol. 56, pp. 121–130, 2016.
[34] L. H. Son, “A novel kernel fuzzy clustering algorithm for geo-demographic
Information Sciences—Informatics and Computer Science, analysis,”
Intelligent Systems, Applications: An International Journal, vol. 317,
no. C, pp. 202–223, 2015.
[35] P. Van Viet, H. T. M. Chau, P. Van Hai, et al., “Some extensions of membership
graphs for picture inference systems,” in 2015 seventh international conference
on knowledge and systems engineering (KSE), pp. 192–197, IEEE, 2015.
[36] D. Ramot, R. Milo, M. Friedman, and A. Kandel, “Complex fuzzy sets,” IEEE
Transactions on Fuzzy Systems, vol. 10, no. 2, pp. 171–186, 2002.
[37] H. Garg and D. Rani, “Some results on information measures for complex
intuitionistic fuzzy sets,” International Journal of Intelligent Systems, vol. 34,
no. 10, pp. 2319–2363, 2019.
[38] J.-P. Fan, R. Cheng, and M.-Q. Wu, “Extended edas methods for multi-
criteria group decision-making based on iv-cfswaa and iv-cfswga operators
123
with interval-valued complex fuzzy soft information,” IEEE Access, vol. 7,
pp. 105546–105561, 2019.
[39] S. Faizi, Multi-Criteria Decision Making Techniques Based on Some
Extensions of Fuzzy Set. PhD thesis, University of Management and
Technology, Lahore, 2019.
[40] H. Garg and D. Rani, “Robust averaging–geometric aggregation operators for
complex intuitionistic fuzzy sets and their applications to mcdm process,”
Arabian Journal for Science and Engineering, vol. 45, no. 3, pp. 2017–2033,
2020.
[41] K. Ullah, T. Mahmood, Z. Ali, and N. Jan, “On some distance measures of
complex pythagorean fuzzy sets and their applications in pattern recognition,”
Complex & Intelligent Systems, vol. 6, no. 1, pp. 15–27, 2020.
[42] Y. Al-Qudah and N. Hassan, “Complex multi-fuzzy soft expert set and its
application,” Int. J. Math. Comput. Sci, vol. 14, pp. 149–176, 2019.
[43] P. K. Singh, “Bipolar δ-equal complex fuzzy concept lattice with its
application,” Neural Computing and Applications, pp. 1–18, 2019.
[44] D. Ramot, M. Friedman, G. Langholz, and A. Kandel, “Complex fuzzy logic,”
IEEE Transactions on Fuzzy Systems, vol. 11, no. 4, pp. 450–461, 2003.
[45] J. Man, Z. Chen, and S. Dick, “Towards inductive learning of complex
fuzzy inference systems,” in NAFIPS 2007-2007 Annual Meeting of the North
American Fuzzy Information Processing Society, pp. 415–420, IEEE, 2007.
[46] Z. Chen, S. Aghakhani, J. Man, and S. Dick, “Ancfis: A neurofuzzy architecture
employing complex fuzzy sets,” IEEE Transactions on Fuzzy Systems, vol. 19,
no. 2, pp. 305–322, 2010.
[47] Y. Liu and F. Liu, “An adaptive neuro-complex-fuzzy-inferential modeling
mechanism for generating higher-order tsk models,” Neurocomputing, vol. 365,
pp. 94–101, 2019.
[48] O. Yazdanbakhsh and S. Dick, “Fancfis: Fast adaptive neuro-complex fuzzy
inference system,” International Journal of Approximate Reasoning, vol. 105,
pp. 417–430, 2019.
124
[49] E. H. Mamdani, “Application of fuzzy algorithms for control of simple dynamic
plant,” in Proceedings of the institution of electrical engineers, vol. 121,
pp. 1585–1588, IET, 1974.
[50] T. Takagi and M. Sugeno, “Fuzzy identification of systems and its applications
to modeling and control,” IEEE transactions on systems, man, and cybernetics,
no. 1, pp. 116–132, 1985.
[51] Y. Li and Y.-T. Jang, “Complex adaptive fuzzy inference systems,” in Soft
Computing in Intelligent Systems and Information Processing. Proceedings of
the 1996 Asian Fuzzy Systems Symposium, pp. 551–556, IEEE, 1996.
[52] A. Deshmukh, A. Bavaskar, P. Bajaj, and A. Keskar, “Implementation of
complex fuzzy logic modules with vlsi approach,” International Journal on
Computer Science and Network Security, vol. 8, pp. 172–178, 2008.
[53] O. Yazdanbakhsh and S. Dick, “Forecasting of multivariate time series via
complex fuzzy logic,” IEEE Transactions on Systems, Man, and Cybernetics:
Systems, vol. 47, no. 8, pp. 2160–2171, 2017.
[54] M. Yeganejou and S. Dick, “Inductive learning of classifiers via complex fuzzy
sets and logic,” in 2017 IEEE International Conference on Fuzzy Systems
(FUZZ-IEEE), pp. 1–6, IEEE, 2017.
[55] O. Yazdanbakhsh and S. Dick, “A systematic review of complex fuzzy sets and
logic,” Fuzzy Sets and Systems, vol. 338, pp. 1–22, 2018.
[56] C. Li and T.-W. Chiang, “Complex neurofuzzy arima forecasting—a new
approach using complex fuzzy sets,” IEEE Transactions on Fuzzy Systems,
vol. 21, no. 3, pp. 567–584, 2012.
[57] H. Bustince, E. Barrenechea, M. Pagola, J. Fernandez, Z. Xu, B. Bedregal,
J. Montero, H. Hagras, F. Herrera, and B. De Baets, “A historical account
of types of fuzzy sets and their relationships,” IEEE Transactions on Fuzzy
Systems, vol. 24, no. 1, pp. 179–194, 2015.
[58] J. Buckley and Y. Qu, “Fuzzy complex analysis i: differentiation,” Fuzzy Sets
and Systems, vol. 41, no. 3, pp. 269–284, 1991.
[59] J. J. Buckley, “Fuzzy complex analysis ii: integration,” Fuzzy Sets and Systems,
vol. 49, no. 2, pp. 171–179, 1992.
125
[60] Z. Guang-Quan, “Fuzzy limit theory of fuzzy complex numbers,” Fuzzy Sets
and Systems, vol. 46, no. 2, pp. 227–235, 1992.
[61] Z. Guangquan, “Fuzzy distance and limit of fuzzy numbers [j],” Fuzzy Systems
and Mathematics, vol. 1, 1992.
[62] A. Azam, B. Fisher, and M. Khan, “Common fixed point theorems in complex
valued metric spaces,” Numerical Functional Analysis and Optimization,
vol. 32, no. 3, pp. 243–253, 2011.
[63] G. Zhang, T. S. Dillon, K.-Y. Cai, J. Ma, and J. Lu, “Operation properties
and δ-equalities of complex fuzzy sets,” International journal of approximate
reasoning, vol. 50, no. 8, pp. 1227–1249, 2009.
[64] A. U. M. Alkouri and A. R. Salleh, “Linguistic variable, hedges and several
distances on complex fuzzy sets,” Journal of Intelligent & Fuzzy Systems,
vol. 26, no. 5, pp. 2527–2535, 2014.
[65] M. Guido, A. Mangia, G. Faa, et al., “Chronic viral hepatitis: the histology
report,” Digestive and Liver Disease, vol. 43, pp. S331–S343, 2011.
[66] F. Camastra, A. Ciaramella, V. Giovannelli, M. Lener, V. Rastelli, A. Staiano,
G. Staiano, and A. Starace, “A fuzzy decision system for genetically modified
plant environmental risk assessment using mamdani inference,” Expert Systems
with Applications, vol. 42, no. 3, pp. 1710–1716, 2015.
[67] B. Gayathri and C. Sumathi, “Mamdani fuzzy inference system for
breast cancer risk detection,” in 2015 IEEE International Conference on
Computational Intelligence and Computing Research (ICCIC), pp. 1–6, IEEE,
2015.
[68] S. Thakur, S. Raw, R. Sharma, and P. Mishra, “Detection of type of thalassemia
disease in patients: A fuzzy logic approach,” International Journal of Applied
Pharmaceutical Sciences and Research, vol. 1, no. 02, pp. 88–95, 2016.
[69] P. Mamoria and D. Raj, “Comparison of mamdani fuzzy inference system for
multiple membership functions,” International Journal of Image, Graphics and
Signal Processing, vol. 8, no. 9, p. 26, 2016.
126
[70] M. D. RU ˇZI ´C, J. Skenderovi´c, and K. T. LESI ´C, “Application of the mamdani fuzzy inference system to measuring hrm performance in hotel companies–a
pilot study,” 2016.
[71] P. K. Borkar, M. Jha, M. Qureshi, and G. Agrawal, “Performance assessment
of heat exchanger using mamdani based adaptive neuro-fuzzy inference system
(m-anfis) and dynamic fuzzy reliability modeling. 2014,” International Journal
of Innovative Research in Science, Engineering and Technology (An ISO 3297:
2007 Certified Organization), vol. 3, no. 9, 2014.
[72] Y. Chai, L. Jia, and Z. Zhang, “Mamdani model based adaptive neural fuzzy
inference system and its application,” International Journal of Computational
Intelligence, vol. 5, no. 1, pp. 22–29, 2009.
[73] E. P. Klement and R. Mesiar, Logical, algebraic, analytic and probabilistic
aspects of triangular norms. Elsevier, 2005.
[74] H. T. Nguyen, C. L. Walker, and E. A. Walker, A first course in fuzzy logic.
CRC press, 2018.
[75] R. R. Yager and D. P. Filev, “Unified structure and parameter identification of
fuzzy models,” IEEE Transactions on Systems, Man, and Cybernetics, vol. 23,
no. 4, pp. 1198–1205, 1993.
[76] H. Ishibuchi, K. Nozaki, N. Yamamoto, and H. Tanaka, “Selecting fuzzy if-then
rules for classification problems using genetic algorithms,” IEEE Transactions
on fuzzy systems, vol. 3, no. 3, pp. 260–270, 1995.
[77] J. Yen and L. Wang, “Simplifying fuzzy rule-based models using
orthogonal transformation methods,” IEEE Transactions on Systems, Man, and
Cybernetics, Part B (Cybernetics), vol. 29, no. 1, pp. 13–24, 1999.
[78] L. Wang and R. Langari, “Building sugeno-type models using fuzzy
discretization and orthogonal parameter estimation techniques,” IEEE
Transactions on Fuzzy Systems, vol. 3, no. 4, pp. 454–458, 1995.
[79] G. E. Tsekouras, “Fuzzy rule base simplification using multidimensional
scaling and constrained optimization,” Fuzzy sets and systems, vol. 297, pp. 46–
72, 2016.
127
[80] W. Pedrycz, “From fuzzy rule-based systems to granular fuzzy rule-based
systems: a study in granular computing,” in Combining Experimentation and
Theory, pp. 151–162, Springer, 2012.
[81] H. Bellaaj, R. Ketata, and M. Chtourou, “A new method for fuzzy rule base
reduction,” Journal of Intelligent & Fuzzy Systems, vol. 25, no. 3, pp. 605–613,
2013.
[82] J. L. S. L. P. Heim, S. Hellmann and T. Stegemann, “Multitask tsk fuzzy system
modeling by jointly reducing rules and consequent parameters,” Transactions
on Systems, vol. 25, no. 3, pp. 605–613, 2019.
[83] G. Wang and X. Li, “Generalized lebesgue integrals of fuzzy complex valued
functions,” Fuzzy Sets and Systems, vol. 127, no. 3, pp. 363–370, 2002.
[84] L.-C. Jang and H.-M. Kim, “On choquet integrals with respect to a
fuzzy complex valued fuzzy measure of fuzzy complex valued functions,”
International Journal of Fuzzy Logic and Intelligent Systems, vol. 10, no. 3,
pp. 224–229, 2010.
[85] L.-C. Jang and H.-M. Kim, “Some properties of choquet integrals with respect
to a fuzzy complex valued fuzzy measure.,” Int. J. Fuzzy Logic and Intelligent
Systems, vol. 11, no. 2, pp. 113–117, 2011.
[86] S.-q. Ma, D.-j. Peng, and D.-y. Li, “Fuzzy complex value measure and fuzzy
complex value measurable function,” in Fuzzy Information and Engineering,
pp. 187–192, Springer, 2009.
[87] S.-q. Ma, F.-c. Chen, and Z.-q. Zhao, “Choquet type fuzzy complex-valued
integral and its application in classification,” in Fuzzy Engineering and
Operations Research, pp. 229–237, Springer, 2012.
[88] S.-q. Ma, M.-q. Chen, and Z.-q. Zhao, “The complex fuzzy measure,” in Fuzzy
Information & Engineering and Operations Research & Management, pp. 137–
145, Springer, 2014.
[89] S. Ma and S. Li, “Complex fuzzy set-valued complex fuzzy measures and their
properties,” The Scientific World Journal, vol. 2014, 2014.
128
[90] S.-q. Ma and S.-g. Li, “Complex fuzzy set-valued complex fuzzy integral
and its convergence theorem,” in Fuzzy Systems & Operations Research and
Management, pp. 143–155, Springer, 2016.
[91] S. Ma, D. Peng, and Z. Zhao, “Generalized complex fuzzy set-valued
integrals and their properties,” in 2016 12th International Conference on
Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD),
pp. 906–910, IEEE, 2016.
[92] R. T. Ngan, M. Ali, D. E. Tamir, N. D. Rishe, A. Kandel, et al., “Representing
complex intuitionistic fuzzy set by quaternion numbers and applications to
decision making,” Applied Soft Computing, vol. 87, p. 105961, 2020.
[93] S. Dai, L. Bi, and B. Hu, “Distance measures between the interval-valued
complex fuzzy sets,” Mathematics, vol. 7, no. 6, p. 549, 2019.
[94] K. Mondal, S. Pramanik, and B. C. Giri, “Some similarity measures for madm
under a complex neutrosophic set environment,” in Optimization Theory Based
on Neutrosophic and Plithogenic Sets, pp. 87–116, Elsevier, 2020.
[95] A. Z. LOTFI, “The key roles of information granulation and fuzzy logic in
human reasoning, concept formulation and computing with words,” in FUZZ-
IEEE’96—Fifth IEEE International Conference on Fuzzy Systems, pp. 8–11.
[96] T. Lin, “Granular computing, announcement of the bisc special interest group
on granular computing [z]. 1997.”
[97] Y. Yao and N. Zhong, “Granular computing using information tables,” in Data
mining, rough sets and granular computing, pp. 102–124, Springer, 2002.
[98] J. T. Yao, A. V. Vasilakos, and W. Pedrycz, “Granular computing: perspectives
and challenges,” IEEE Transactions on Cybernetics, vol. 43, no. 6, pp. 1977–
1989, 2013.
[99] J. T. Yao, A. V. Vasilakos, and W. Pedrycz, “Granular computing: perspectives
and challenges,” IEEE Transactions on Cybernetics, vol. 43, no. 6, pp. 1977–
1989, 2013.
[100] P. Artiemjew, “Natural versus granular computing: Classifiers from granular
structures,” in International Conference on Rough Sets and Current Trends in
Computing, pp. 150–159, Springer, 2008.
129
[101] S. Butenkov, A. Zhukov, A. Nagorov, and N. Krivsha, “Granular computing
models and methods based on the spatial granulation,” Procedia Computer
Science, vol. 103, no. C, pp. 295–302, 2017.
[102] F. M. Bianchi, S. Scardapane, A. Rizzi, A. Uncini, and A. Sadeghian, “Granular
computing techniques for classification and semantic characterization of
structured data,” Cognitive Computation, vol. 8, no. 3, pp. 442–461, 2016.
[103] N. Krivsha, V. Krivsha, Z. Beslaneev, and S. Butenkov, “Greedy algorithms
for granular computing problems in spatial granulation technique,” Procedia
Computer Science, vol. 103, pp. 303–307, 2017.
[104] W. Zhang, G. Wang, W. Liu, and J. Fang, “An introduction to fuzzy
mathematics,” Xi’an Jiaotong University Press, Xi’an, 1991.
[105] H. Q. Truong, L. T. Ngo, and W. Pedrycz, “Granular fuzzy possibilistic c-means
clustering approach to dna microarray problem,” Knowledge-Based Systems,
vol. 133, pp. 53–65, 2017.
[106] P. Heim, S. Hellmann, J. Lehmann, S. Lohmann, and T. Stegemann, “Relfinder:
Revealing relationships in rdf knowledge bases,” in International Conference
on Semantic and Digital Media Technologies, pp. 182–187, Springer, 2009.
[107] T. Yu, J. Li, Q. Yu, Y. Tian, X. Shun, L. Xu, L. Zhu, and H. Gao, “Knowledge
graph for tcm health preservation: design, construction, and applications,”
Artificial Intelligence in Medicine, vol. 77, pp. 48–52, 2017.
[108] L. Shao, Y. Duan, X. Sun, Q. Zou, R. Jing, and J. Lin, “Bidirectional value
driven design between economical planning and technical implementation
based on data graph, information graph and knowledge graph,” in 2017
IEEE 15th International Conference on Software Engineering Research,
Management and Applications (SERA), pp. 339–344, IEEE, 2017.
[109] Z. Wang, J. Zhang, J. Feng, and Z. Chen, “Knowledge graph embedding by
translating on hyperplanes.,” in Aaai, vol. 14, pp. 1112–1119, Citeseer, 2014.
[110] J. Qiu, Q. Du, K. Yin, S.-L. Zhang, and C. Qian, “A causality mining
and knowledge graph based method of root cause diagnosis for performance
anomaly in cloud applications,” Applied Sciences, vol. 10, no. 6, p. 2166, 2020.
130
[111] L. He and P. Jiang, “Manufacturing knowledge graph: a connectivism to
answer production problems query with knowledge reuse,” IEEE Access, vol. 7,
pp. 101231–101244, 2019.
[112] R. Lijuan, L. Jun, and G. Wei, “Multi-source knowledge embedding research
of knowledge graph,” in 2019 IEEE 3rd International Conference on Circuits,
Systems and Devices (ICCSD), pp. 163–166, IEEE, 2019.
[113] J. Long, Z. Chen, W. He, T. Wu, and J. Ren, “An integrated framework
of deep learning and knowledge graph for prediction of stock price trend:
An application in chinese stock exchange market,” Applied Soft Computing,
p. 106205, 2020.
[114] X. Chen, S. Jia, and Y. Xiang, “A review: Knowledge reasoning over knowledge
graph,” Expert Systems with Applications, vol. 141, p. 112948, 2020.
[115] S. Yoo and O. Jeong, “Automating the expansion of a knowledge graph,” Expert
Systems with Applications, vol. 141, p. 112965, 2020.
[116] H. Liu, Y. Li, R. Hong, Z. Li, M. Li, W. Pan, A. Glowacz, and H. He,
“Knowledge graph analysis and visualization of research trends on driver
behavior,” Journal of Intelligent & Fuzzy Systems, vol. 38, no. 1, pp. 495–511,
2020.
[117] H. Wang, C. Shah, P. Sathaye, A. Nahata, and S. Katariya, “Service application
knowledge graph and dependency system,” in 2019 34th IEEE/ACM
International Conference on Automated Software Engineering Workshop
(ASEW), pp. 134–136, IEEE, 2019.
[118] E. Petrova, P. Pauwels, K. Svidt, and R. L. Jensen, “Towards data-driven
sustainable design: decision support based on knowledge discovery in disparate
building data,” Architectural Engineering and Design Management, vol. 15,
no. 5, pp. 334–356, 2019.
[119] L. Shi, S. Li, X. Yang, J. Qi, G. Pan, and B. Zhou, “Semantic health
knowledge graph: Semantic integration of heterogeneous medical knowledge
and services,” BioMed research international, vol. 2017, 2017.
131
[120] X. Tao, T. Pham, J. Zhang, J. Yong, W. P. Goh, W. Zhang, and Y. Cai, “Mining
health knowledge graph for health risk prediction,” World Wide Web, pp. 1–22,
2020.