Luận án Tiến sĩ Máy tính: Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định

VIỆN HÀN LÂM KHOA HỌC VÀ BỘ GIÁO DỤC VÀ ĐÀO TẠO CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

LƯƠNG THỊ HỒNG LAN

MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO

BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

Hà Nội - 2021

VIỆN HÀN LÂM KHOA HỌC VÀ BỘ GIÁO DỤC VÀ ĐÀO TẠO CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

LƯƠNG THỊ HỒNG LAN

MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH

Chuyên ngành: Khoa học máy tính

Mã số: 9.48.01.01

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC:

1. PGS.TS Lê Hoàng Sơn

2. PGS.TS Nguyễn Long Giang

Hà Nội - 2021

LỜI CAM ĐOAN

Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả, được hoàn thành dưới sự hướng dẫn của PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long Giang. Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.

Hà Nội, ngày 19 tháng 06 năm 2021 Tác giả luận án

Lương Thị Hồng Lan

LỜI CẢM ƠN

Luận án này được hoàn thành với sự nỗ lực không ngừng của tác giả và sự giúp

đỡ hết mình từ các thầy giáo hướng dẫn, bạn bè và người thân.

Đầu tiên, tác giả xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các thầy giáo hướng dẫn PGS.TS Lê Hoàng Sơn và PGS.TS Nguyễn Long Giang. Sự tận tình chỉ bảo, hướng dẫn và động viên của các thầy dành cho tác giả suốt thời gian thực hiện luận án là không thể nào kể hết được.

Tác giả xin gửi lời cảm ơn tới các thầy, cô giáo và cán bộ của bộ phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ (Viện Hàn lâm Khoa học và Công nghệ Việt Nam), bộ phận quản lý nghiên cứu sinh của Viện Công nghệ thông tin đã nhiệt tình giúp đỡ và tạo ra môi trường nghiên cứu tốt để tác giả hoàn thành công trình của mình.

Tác giả xin chân thành cảm ơn các anh chị em trong Lab Tại Viện Công nghệ thông tin - Đại học Quốc gia Hà Nội đã giúp đỡ tác giả trong suốt quá trình học tập và nghiên cứu tại Lab.

Tác giả xin chân thành cảm ơn tới Ban Giám hiệu trường Đại học Sư phạm, Đại học Thái Nguyên, các đồng nghiệp khoa Toán, nơi tác giả đã công tác những năm đầu nghiên cứu sinh; và Ban Giám hiệu trường Đại học Thủy Lợi Hà Nội, các đồng nghiệp khoa Công nghệ thông tin, nơi tác giả hiện đang công tác đều đã luôn động viên, giúp đỡ tác giả trong công tác để tác giả có thời gian tập trung nghiên cứu và hoàn thành luận án đúng thời hạn.

Đặc biệt tác giả xin bày tỏ lòng biết ơn sâu sắc tới Bố, Mẹ, các em trong gia đình, những người luôn dành cho những tình cảm nồng ấm và sẻ chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tôi trong quá trình nghiên cứu. Cảm ơn con gái luôn ngoan ngoãn và ủng hộ để mẹ tập trung nghiên cứu, hoàn thành luận án. Luận án cũng là món quà tinh thần mà tôi trân trọng gửi tặng đến các thành viên trong Gia đình.

Tôi xin trân trọng cảm ơn!

Hà Nội, ngày 19 tháng 06 năm 2021

Người thực hiện

Lương Thị Hồng Lan

MỤC LỤC

Danh mục các bảng vi

Danh mục các hình vẽ, đồ thị vii

MỞ ĐẦU 1

Chương 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT 9

1.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.2 Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . . 9

1.3 Tổng quan các nghiên cứu liên quan . . . . . . . . . . . . . . . . . . . 10

1.3.1 Hệ suy diễn mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.2 Các hệ phát triển dựa trên tập mờ phức . . . . . . . . . . . . . 14

1.3.3 Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay . . 19

1.4 Cơ sở lý thuyết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.4.1 Tập mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.4.2 Tập mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.4.3 Các phép toán trên tập mờ phức . . . . . . . . . . . . . . . . . . 24

1.4.4 Logic mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

1.4.5 Độ đo mờ và độ đo mờ phức . . . . . . . . . . . . . . . . . . . . 28

1.5 Dữ liệu thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.5.1 Bộ dữ liệu chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.5.2 Bộ dữ liệu thực- Bệnh gan Liver . . . . . . . . . . . . . . . . . . 31

1.5.3 Các độ đo đánh giá thực nghiệm . . . . . . . . . . . . . . . . . 32

1.6 Kết Chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Chương 2. XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI

(M-CFIS) 34

2.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.2 Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức . . . . . . . . . . . . . 36

2.2.1 Toán tử t-chuẩn và t-đối chuẩn . . . . . . . . . . . . . . . . . . 37

2.2.2 Toán tử t-chuẩn và t-đối chuẩn mờ phức . . . . . . . . . . . . . 38

2.2.3 Ví dụ minh họa hỗ trợ ra quyết định . . . . . . . . . . . . . . . . 41

2.3 Hệ suy diễn mờ phức Mamdani (M-CFIS) . . . . . . . . . . . . . . . . 44

2.3.1 Đề xuất hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . . 44

2.3.2 Các lựa chọn sử dụng trong hệ suy diễn mờ phức Mamdani . . 45

2.3.3 Cấu trúc của hệ suy diễn mờ phức Mamdani . . . . . . . . . . 47

2.3.4 Ví dụ số minh họa mô hình suy diễn M-CFIS . . . . . . . . . . . 49

2.3.5 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . 51

2.4 Kết Chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Chương 3. TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC

MAMDANI (M-CFIS-R) 55

3.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.2 Đề xuất độ đo tương tự mờ phức . . . . . . . . . . . . . . . . . . . . . 60

3.2.1 Độ đo tương tự mờ phức Cosine . . . . . . . . . . . . . . . . . . 61

3.2.2 Độ đo tương tự mờ phức Dice . . . . . . . . . . . . . . . . . . . 62

3.2.3 Độ đo tương tự mờ phức Jaccard . . . . . . . . . . . . . . . . . 63

3.3 Đề xuất mô hình hệ suy diễn M-CFIS-R . . . . . . . . . . . . . . . . . 64

3.3.1 Ý tưởng xây dựng mô hình . . . . . . . . . . . . . . . . . . . . . 64

3.3.2 Phần Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3.3.3 Phần Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3.4 Thử nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . . 71

3.4.1 Kết quả thực nghiệm trên bộ dữ liệu UCI . . . . . . . . . . . . . 71

3.4.2 Kết quả thực nghiệm trên bộ dữ liệu thực . . . . . . . . . . . . . 73

iii

3.5 Kết Chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

Chương 4. MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ

THỊ TRI THỨC (M-CFIS-FKG) 77

4.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.2 Một số mở rộng của mô hình M-CFIS-R . . . . . . . . . . . . . . . . . 79

4.2.1 Hệ suy diễn mờ phức Sugeno và Tsukamoto . . . . . . . . . . . 79

4.2.2 Độ đo mờ phức dựa trên lý thuyết tập hợp . . . . . . . . . . . . 80

4.2.3 Tích phân mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . 86

4.3 Đề xuất mô hình hệ suy diễn mờ phức M-CFIS-FKG . . . . . . . . . . 93

4.3.1 Ý tưởng xây dựng mô hình . . . . . . . . . . . . . . . . . . . . . 93

4.3.2 Xây dựng đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . 95

4.3.3 Thuật toán suy diễn nhanh trên đồ thị tri thức mờ . . . . . . . . 96

4.3.4 Ví dụ minh họa hệ suy diễn mờ phức M-CFIS-FKG . . . . . . . 98

4.4 Thực nghiệm và đánh giá kết quả . . . . . . . . . . . . . . . . . . . . . 103

4.4.1 Thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

4.4.2 Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 104

4.5 Kết Chương 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 114

Những kết quả chính của luận án . . . . . . . . . . . . . . . . . . . . . . . . 114

Hướng phát triển của luận án . . . . . . . . . . . . . . . . . . . . . . . . . . 116

119 TÀI LIỆU THAM KHẢO

Kí hiệu và viết tắt

STT 1 2 3 4 Từ tắt FS CFS CFL FIS Diễn dải Tập mờ Tập mờ phức Logic mờ phức Hệ suy diễn

5 CFIS Hệ suy diễn mờ phức

6 IFIS Hệ suy diễn mờ trực cảm

Fuzzy 7 ANFIS

Neuro-Fuzzy 8 CANFIS

9 ANCFIS Hệ suy diễn mờ noron thích nghi Hệ suy diễn mờ noron thích nghi phức Mạng noron giá trị mờ phức thích nghi

10 CNS

decision 11 MCDM

Inference Search 12 FISA

13 14 KG FKG Hệ hỗ trợ ra quyết định đa tiêu chí Thuật toán tìm kiếm suy diễn nhanh Đồ thị tri thức Đồ thị tri thức mờ

Hệ suy diễn mờ Mamdani 15 M-FIS

diễn mờ phức 16 M-CFIS suy Hệ Mamdani

diễn mờ suy phức 17 M-CFIS-R Hệ Mamdani - giảm luật Tiếng anh Fuzzy Set Complex Fuzzy Set Complex Fuzzy Logic Fuzzy Inference System Complex Fuzzy Inference System Intituition Fuzzy Inference System Adaptive Neuro Inference System Complex Inference System Adaptive Neuro Complex Fuzzy Inference System Complex Neutrosophic Set Tập Neutrosophic phức Multicriteria making Fast Algorithm Knowledge Graph Fuzzy Knowledge Graph Mamdani Fuzzy Inference System Mamdani Complex Fuzzy Inference System Mamdani Complex Fuzzy Inference System Reduce Rule

suy diễn mờ 18 M-CFIS- FKG Hệ phức Mamdani - Đồ thị tri thức mờ

19 20 GRC UCI Tính toán hạt Kho dữ liệu chuẩn UCI

21 RANCFIS Adaptive- Fuzzy Mạng nơ ron giá trị mờ phức thích nghi ngẫu nhiên

22 FANCFIS Adaptive-Network Inference Fuzzy Mạng nơ ron giá trị mờ phức thích nghi nhanh Mamdani Complex Fuzzy Inference System Fuzzy- Knowledge Graph Granular Computing UC Irvine Machine Randomized Network Based Inference System Fast Based System

Danh mục các bảng

1.1 Các bộ dữ liệu thực nghiệm chuẩn Benchmark . . . . . . . . . . . . . . 31

1.2 Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan Liver . . . . 32

2.1 Ma trận ra quyết định dựa trên các mẫu dữ liệu . . . . . . . . . . . . . 42

2.2 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.3 Ma trận chuẩn hóa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.4 Ma trận quyết định mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.5 Ma trận quyết định kết quả . . . . . . . . . . . . . . . . . . . . . . . . . 44

2.6 Bộ dữ liệu đầu vào . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.7 Bộ cơ sở luật . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.1 Hệ cơ sở luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.2 Kịch bản 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

4.3 Kịch bản 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

vii

Danh mục các hình vẽ, đồ thị

1 Cấu trúc luận án . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1 Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định . . . . . . . . . . . . . . 10

1.2 Sơ đồ tổng quan của hệ suy diễn mờ . . . . . . . . . . . . . . . . . . . 11

1.3 Hệ thống suy diễn Mamdani với hai đầu vào và hai luật . . . . . . . . . 12

1.4 Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật . . . . . . . 13

1.5 Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật . . . . . . . . . 14

1.6 Hệ thống logic mờ do Ramot đề xuất . . . . . . . . . . . . . . . . . . . 15

1.7 Kiến trúc của hệ thống CANFIS . . . . . . . . . . . . . . . . . . . . . . 17

1.8 Biểu diễn của hàm thuộc mờ phức . . . . . . . . . . . . . . . . . . . . 22

2.1 Mô hình hệ suy diễn mờ phức Mamdani . . . . . . . . . . . . . . . . . 45

2.2 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu WBCD . . . . . . . 52

2.3 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu Diebetes . . . . . . 52

2.4 Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu thực Liver . . . . . . 53

3.1 Giai đoạn Training của mô hình đề xuất . . . . . . . . . . . . . . . . . 66

3.2 Giai đoạn Testing của mô hình M-CFIS-R đề xuất . . . . . . . . . . . . 71

3.3 Kết quả thực nghiệm trên bộ dữ liệu WBCD . . . . . . . . . . . . . . . 72

3.4 Kết quả thực nghiệm trên bộ dữ liệu Diebetes . . . . . . . . . . . . . . 73

3.5 Kết quả thực nghiệm trên bộ dữ liệu thực Liver . . . . . . . . . . . . . 74

4.1 Quá trình Training . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

4.2 Quá trình Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.3 Biểu diễn của luật mờ phức . . . . . . . . . . . . . . . . . . . . . . . . 96

viii

4.4 Đồ thị tri thức mờ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

4.5 Đồ thị FKG cho sáu luật . . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.6 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có 2 nhãn . . . . . . 104

4.7 Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có nhiều nhãn . . . . 105

4.8 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu WBCD . 106

4.9 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Diebetes 107

4.10 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Liver . . 108

4.11 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Wine . . 109

4.12 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu CTG . . 110

4.13 So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Arrhythmia111

MỞ ĐẦU

Mở đầu

Ra quyết định là một phần vô cùng quan trọng trong cuộc sống, do đó gần đây

rất nhiều nhà nghiên cứu đã đưa ra nhiều hướng tiếp cận khác nhau để giải quyết, hỗ

trợ quá trình ra quyết định như tiếp cận mờ, mô hình giá trị độ đo... Quá trình hỗ trợ

ra quyết định chủ yếu tập trung vào việc đưa ra những phương pháp, cách thức để có

thể hỗ trợ đưa ra quyết định cuối cùng một cách đúng đắn nhất, nhất là đối với môi

trường dữ liệu ngày càng nhiều biến động, dữ liệu không chắc chắn, không xác định

rõ ràng.

Tập mờ (Fuzzy Set-FS) được Zadel đề xuất năm 1965 [1] được coi là một trong

những công cụ hữu hiệu để giải quyết các bài toán mà có dữ liệu không chắc chắn,

không xác định rõ ràng. Rất nhiều những nghiên cứu mở rộng của FS đã được giới

thiệu trong vài năm gần đây [2, 3, 4, 5, 6] và được ứng dụng nhiều trong bài toán

hệ hỗ trợ ra quyết định. Một trong những kĩ thuật quan trọng dựa trên lý thuyết FS

và ứng dụng trong việc giải quyết các bài toán của hệ hỗ trợ ra quyết định là Hệ suy

diễn mờ (Fuzzy Inference System - FIS). FIS hiện đã và đang được ứng dụng rộng

rãi trong nhiều bài toán phân loại/dự báo và các bài toán của hệ hỗ trợ ra quyết định

như lựa chọn nhân sự, lựa chọn nhà cung cấp, hỗ trợ ra chiến lược phát triển công

ty... Bên cạnh đó, trong một vài ứng dụng khác thì hệ FIS được sử dụng để tạo ra một

tập hợp các luật mờ nhằm mục đích phát hiện, dự báo hoặc phân loại các đối tượng

như phát hiện ung thư phổi, phát hiện bệnh đái tháo đường, dự đoán bị bệnh tim ...

[7, 8, 9, 10, 11, 12, 13].

Một phiên bản mở rộng của FIS nhúng vào mạng nơ ron và kết hợp với học dựa

trên phương pháp gradient có tên gọi là Hệ suy diễn mờ nơ ron thích nghi (ANFIS)

[14] và cho kết quả tốt trong vấn đề dự báo bệnh mạch vành, ước tính sự tăng cường

độ dẫn nhiệt của kim loại và oxit kim loại ... [15, 16, 17, 18]. Ngoài ra, ANFIS còn

được kết hợp với các mô hình học máy khác như thuật toán tối ưu hóa bầy đàn và áp

dụng đối với các bài toán trong hệ hỗ trợ ra quyết định [19, 20, 21].

Bên cạnh đó, nhiều phiên bản khác nhau của hệ FIS trên các tập mờ mở rộng

áp dụng đối với bài toán hỗ trợ ra quyết định cũng đã và đang được nghiên cứu rộng

rãi. Ví dụ như hệ suy diễn mờ trực cảm (IFIS) được sử dụng trong hồi quy và ứng

dụng hỗ trợ dự báo phá sản của doanh nghiệp [22, 23, 24, 25, 25, 26, 27]. Một số

nghiên cứu kết hợp giữa hệ suy diễn mờ bức tranh (PFS) với thuật toán phân cụm

mờ bức tranh và độ đo mờ bức tranh được ứng dụng trong việc giải quyết một số vấn

đề ra quyết định như dự báo thời tiết, dự báo giá cổ phiếu và phân đoạn hình ảnh

[28, 29, 30, 31, 32, 33, 34, 35].

Gần đây, cùng với sự gia tăng của các vấn đề ra quyết định dựa trên các dữ liệu

có sự thay đổi về thời gian hay các dữ liệu có yếu tố chu kì, định kì thì khái niệm tập

mờ phức (CFS) [36] ra đời với hàm thuộc bao gồm cả thành phần biên độ và thành

phần pha để biểu diễn, mô tả các dữ liệu có yếu tố chu kì, định kì hay các dữ liệu có

sự thay đổi về thời gian. CFS được áp dụng trong nhiều nghiên cứu, tập trung chủ yếu

vào các vấn đề như các toán tử tổng hợp mờ phức, thông tin mềm mờ phức, độ đo

khoảng cách mờ phức và mạng các khái niệm mờ phức [37, 38, 39, 40, 41, 42, 43].

Ưu điểm của CFS là khả năng mô hình hóa các hiện tượng và sự kiện theo thời gian,

theo giai đoạn để từ đó có thể cho thấy tổng thể chúng trong một ngữ cảnh nhất định.

Ví dụ như để xác nhận chẩn đoán huyết áp của bệnh nhân là “cao” hay “thấp”

thì một bệnh nhân được đo 30 lần rồi ghi lại giá trị tương ứng với mỗi lần đo, sau đó

giá trị trung bình và phương sai được tính toán đối với giá trị huyết áp đo được. Từ đó

huyết áp của bệnh nhân có thể tính được dễ dàng bằng cách lấy giá trị trung bình và

phương sai của các lần đo (sử dụng ý nghĩa của mờ hóa của hệ FIS trên tập CFS), ví

dụ như là huyết áp thấp với giá trị trung bình và phương sai cho giá trị nhỏ. Còn nếu

như huyết áp chỉ đo tại một thời điểm và đưa ra quyết định thì có thể dẫn đến quyết

định về huyết áp của bệnh nhân không chính xác.

Một ví dụ khác về vấn đề chẩn đoán bệnh: nếu chỉ dựa vào các giá trị thuộc

tính bệnh mà không xét tới các thuộc tính khác thì làm cho kết quả chẩn đoán không

được chính xác, do kết luận bệnh không chỉ phụ thuộc vào mỗi một giá trị thuộc tính

bệnh mà còn cần phải xét tới các yếu tố liên quan tới bệnh đó. Hơn nữa, cũng có nhiều

kịch bản, dữ liệu trong thực tế liên quan đến yếu tố pha, trong dữ liệu có xu hướng

tuần hoàn, chẳng hạn như lượng mưa được ghi lại trong một vùng hoặc sóng âm thanh

do một nhạc cụ tạo ra. Do đó, hiển nhiên rằng số phức cũng phải có một vị trí trong

hệ thống suy luận mờ. Đây cũng là động cơ chính của luận án này.

Hệ suy diễn mờ phức được coi là một công cụ hiệu quả đối với việc giải quyết

các vấn đề không chắc chắn và có yếu tố định kỳ, chu kì. Hệ suy diễn mờ phức đầu

tiên được giới thiệu Ramot [44] được gọi là Hệ logic mờ phức được phát triển từ hệ

thống logic mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến đổi

phức tương ứng của nó. Một nghiên cứu khác bởi Man và cộng sự [45] dựa trên sự

kết hợp giữa phương pháp học quy nạp với hệ suy diễn trong tập phức. Một phiên bản

học nhúng khác với mạng mờ nơ ron trên tập CFS với tên gọi Hệ thống suy diễn mờ

phức nơ ron thích nghi (ANCFIS) được giới thiệu bởi Chen và công sự [46]. Sau đó

2 cải tiến của ANCFIS với mục đích làm gia tăng tốc độ tính toán được đưa ra trong

[47, 48].

Mặc dù nhiều hệ thống suy diễn phát triển dựa trên tập mờ phức đã được nghiên

cứu và ứng dụng nhưng các hệ thống đã có đều chưa thực sự đúng với ý nghĩa của

hệ thống suy diễn mờ phức thực sự. Hầu hết các hệ thống đều sử dụng tập mờ phức

làm biến đầu vào nhưng các nghiên cứu đều chỉ sử dụng thành phần biên độ trong quá

trình ra quyết định mà bỏ qua thành phần pha. Ví dụ như hệ logic mờ phức của Ramot

thì bỏ qua thành phần pha trong giải mờ kết quả đầu ra, làm cho hệ thống không đủ

yếu tố khi xử lý với dữ liệu có yếu tố lặp lại hoặc dữ liệu xảy ra định kì, và điều này

làm giảm đi ý nghĩa của mô hình hệ suy diễn mờ phức, trở thành hệ suy diễn mờ

thường. Còn mô hình ANCFIS của Man và Chen [46] thì sử dụng phép tích vô hướng

vec tơ cho quá trình tổng hợp kết quả, và coi các giá trị đầu vào phức như là các giá

trị thực. Do đó, hệ thống ANCFIS không thực sự là hệ thống phức khi đầu ra của hệ

thống không thể đại diện cho tính tuần hoàn của các thành phần trong đó.

Khi xử lý đối với dữ liệu có yếu tố chu kì, định kì, dữ liệu có yếu tố thay đổi

theo thời gian thì các hệ FIS, ANFIS hay các hệ phát triển trên tập mờ phức đều đưa

ra hai phương thức xử lý chung: (1) Bỏ qua thông tin liên quan đến yếu tố thành phần

pha; (2) Biểu diễn thành phần biên độ và pha riêng biệt với nhau thành 2 thành phần

riêng biệt bằng cách sử dụng 2 tập mờ. Điều này sẽ làm cho thông tin bị mất mát và

kết quả thu được không có độ tin cậy cao (nếu các thông tin về thành phần pha bị bỏ

qua), làm sai lệch thông tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và

pha được xử lý riêng biệt), thời gian tính toán sẽ tăng thêm do số lượng các bộ cần

được xử lý tăng thêm.

Thêm nữa, các nghiên cứu đã có hệ suy diễn dựa trên lý thuyết tập mờ phức

vẫn còn tồn tại một số hạn chế như sau:

• Các hệ suy diễn mờ phức chưa đưa ra được quy trình tổng thể xây dựng hệ suy

diễn mờ phức cho hệ hỗ trợ ra quyết định.

• Các hệ luật trong các hệ suy diễn mờ phức đã có chỉ sinh ra dựa trên kinh

nghiệm, dựa trên tư duy logic suy diễn mà chưa đề cập đến vấn đề tối ưu, tinh

giảm hệ luật suy diễn mờ phức.

• Các hệ suy diễn chưa được nghiên cứu để áp dụng đối với bộ dữ liệu mới mà

không có trong dữ liệu huấn luyện khi sinh mô hình suy diễn.

• Các toán tử t-chuẩn và t-đối chuẩn mờ phức còn chưa được quan tâm nghiên cứu

tìm hiểu và ứng dụng trong hệ hỗ trợ ra quyết định.

Mục tiêu nghiên cứu của luận án

Xuất phát từ những tồn tại và hạn chế của các công bố về tập mờ phức và hệ

suy diễn dựa trên tập mờ phức thì luận án tập trung nghiên cứu tìm hiểu và áp dụng

hệ suy diễn mờ phức đối với bài toán hệ hỗ trợ ra quyết định với dữ liệu có yếu tố thời

gian , cụ thể như sau:

• Nghiên cứu lý thuyết về tập mờ phức, logic mờ phức, các độ đo dựa trên tập mờ

phức.

• Nghiên cứu và phát triển các hệ suy diễn dựa trên tập mờ phức.

• Nghiên cứu các kĩ thuật để giảm luật mờ trong hệ suy diễn mờ phức.

• Nghiên cứu đồ thị tri thức mờ trong biểu diễn luật mờ để giảm thời gian tính

toán suy diễn đối với tập testing và xử lí suy diễn khi có một tập dữ liệu mới mà

không có sẵn trong tập dữ liệu huấn luyện.

Xuất phát từ mục tiêu nghiên cứu, phạm vi nghiên cứu của luận án tập trung

nghiên cứu một số các vấn đề sau:

• Nghiên cứu lý thuyết về tập mờ phức, các phép toán và hệ suy diễn dựa trên tập

mờ phức

• Luận án chỉ nghiên cứu và thử nghiệm các bài toán hệ hỗ trợ ra quyết định với

dữ liệu có yếu tố thời gian.

Với mục tiêu đặt ra như trên, luận án đạt được một số kết quả chính như sau:

• Đề xuất hệ suy diễn mờ phức theo mô hình Mamdani: Dựa trên mô hình hệ suy

diễn mờ cổ điển Mamdani, luận án phát triển mô hình suy diễn Mamdani trên

tập mờ phức. Mô hình cấu trúc của hệ suy diễn mờ phức đề xuất cũng như các

bước cụ thể trong hệ suy diễn mờ phức Mamdani cũng được đưa ra và áp dụng

thực nghiệm mô hình suy diễn đối với với các bộ dữ liệuchuẩn UCI và dữ liệu

thực. Thêm nữa, NCS cũng đề xuất các toán tử t-chuẩn, t-đối chuẩn mờ phức và

ví dụ số với hệ hỗ trợ ra quyết định. Các đóng góp này được trình bày trong nội

dung Chương 2 của luận án.

• Đề xuất các độ đo tương tự dựa trên tập mờ phức, kết hợp giữa độ đo tương tự

mờ phức và tính toán hạt để giải quyết vấn đề tinh giảm hệ luật trong mô hình

suy diễn mờ phức Mamdani. Cải tiến mô hình hệ suy diễn mờ phức Mamdani ở

Chương 2 và xây dựng hệ suy diễn mờ phức M-CFIS-R. Các đóng góp này được

trình bày chi tiết trong Chương 3 của luận án.

• Đề xuất mở rộng hệ suy diễn mờ phức theo mô hình Sugeno và Tsukamoto và

các độ đo mờ phức, tích phân mờ phức dựa trên lý thuyết tập hợp. Nghiên cứu

cách biểu diễn luật mờ dựa trên đồ thị tri thức và cải tiến mô hình hệ suy diễn

mờ phức M-CFIS-R để đưa ra mô hình M-CFIS-FKG. Thực nghiệm trên các bộ

dữ liệu cũng chứng minh hiệu quả về thời gian tính toán của mô hình và suy diễn

trong trường hợp bộ dữ liệu kiểm tra không có trong bộ dữ liệu huấn luyện

Đối tượng nghiên cứu của luận án là các hệ suy diễn theo tiếp cận tập mờ

phức, các phương pháp cải tiến hệ luật và biểu diễn hệ luật qua đồ thị tri thức.

Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và nghiên cứu

thực nghiệm.

i) Nghiên cứu lý thuyết: Nghiên cứu tổng quan lý thuyết về tập mờ phức, các

phép toán mờ phức t-chuẩn, t-đối chuẩn, các độ đo dựa trên tập mờ phức và các hệ

suy diễn mờ phức đã công bố, phân tích ưu điểm, nhược điểm và các vấn đề còn tồn

tại của các nghiên cứu liên quan. Trên cơ sở đó, đề xuất các phép toán, các độ đo

tương tự, độ đo dựa trên lý thuyết tập hợp và các hệ suy diễn mờ phức theo mô hình

Mamdani, Sugeno và Tsukamoto. Các đề xuất, cải tiến được chứng minh chặt chẽ về

lý thuyết bởi các định lý, mệnh đề.

ii) Nghiên cứu thực nghiệm: Các thuật toán đề xuất được cài đặt, chạy thử

nghiệm, so sánh, đánh giá với các hệ suy diễn khác trên các bộ số liệu mẫu từ kho

dữ liệu UCI và bộ dữ liệu thực tế tại Bệnh viện Gang thép Thái Nguyên nhằm minh

chứng về tính hiệu quả của các nghiên cứu về lý thuyết.

Cấu trúc của luận án

Bố cục của luận án gồm bốn chương nội dung chính, phần Mở đầu, Kết luận và

danh mục các tài liệu tham khảo. Phần Mở đầu trình bày tổng quan về vấn đề nghiên

cứu, lý do chọn đề tài, đối tượng, mục tiêu và nội dung nghiên cứu của luận án. Phần

Kết luận tổng kết những kết quả đã đạt được của luận án và hướng phát triển, hướng

nghiên cứu trong tương lai. Các chương nội dung chính được tổ chức như trong Hình

1 cụ thể như sau: Chương đầu tiên NCS trình bày về các kiến thức tổng quan sử dụng

trong luận án như các kiến thức nền tảng về tập mờ, tập mờ phức và hệ suy diễn dựa

trên tập mờ và tập mờ phức. Thêm nữa các độ đo phát triển dựa trên tập mờ và tập

Hình 1: Cấu trúc luận án

mờ phức cũng được trình bày trong chương mở đầu này. Từ các kiến thức nền đó mà

chúng tôi đưa ra lí do để sử dụng hệ suy diễn mờ phức đối với việc giải quyết bài toán

hỗ trợ ra quyết định có dữ liệu thay đổi theo thời gian. Các bộ dữ liệu thực nghiệm

trong luận án cùng với các thước đo dùng để đánh giá thực nghiệm cũng được trình

bày chi tiết trong chương đầu tiên này.

Chương 2, dựa trên hệ suy diễn mờ cổ điển Mamdani, NCS phát triển hệ suy

diễn Mamdani trên tập mờ phức và đồng thời cũng trình bày chi tiết các thành phần

cũng như phép toán sử dụng trong mô hình đề xuất. Các phép toán t- chuẩn và t-đối

chuẩn cũng được định nghĩa và ứng dụng trong bài toán hỗ trợ ra quyết định. Cuối

chương là kết quả thực nghiệm và nhận xét so sánh của hệ suy diễn đã đề xuất trên

các bộ dữ liệu thực nghiệm với hệ suy diễn mờ Mamdani.

Vấn đề tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani là nội dung được

đề cập và xem xét đến trong nội dung của chương 3. Xuất phát từ lý thuyết về tính

toán hạt, NCS đề xuất ra các độ đo tương tự mờ phức và độ đo mờ phức kết hợp với

tính toán hạt để thực hiện việc tinh giảm hệ luật trong hệ suy diễn mờ phức Mamdani

đã đề xuất ở chương 2 (hệ suy diễn mờ phức M-CFIS-R). Ví dụ số và thực nghiệm

trên các bộ dữ liệu cũng đã được trình bày để chứng minh được tính hiệu quả của vấn

đề giảm luật và tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani.

Chương 4, NCS mở rộng mô hình M-CFIS-R sang hệ mờ Sugeno và Tsukamoto

đồng thời đề xuất thêm độ đo mờ phức và tích phân mờ phức dựa trên lý thuyết tập

hợp. Nếu trong Chương 3, NCS chỉ đi tập trung vào vấn đề giảm luật, tối ưu luật trong

phần Training thì Chương 4 NCS lại tập trung vào cải tiến đối với bộ Testing bằng

cách sử dụng lý thuyết về đồ thị tri thức mờ để biểu diễn luật và thực hiện suy luận

xấp xỉ đối với những bản ghi không có trong bộ dữ liệu Training. Việc biểu diễn luật

mờ phức bằng đồ thị tri thức mờ đã giảm khá nhiều thời gian tính toán của hệ suy diễn

mờ phức M-CFIS-R.

Chương 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT

1.1. Giới thiệu

Lý thuyết tập mờ nói chung và tập mờ phức nói riêng được coi là một trong

những công cụ toán học hiệu quả để biểu diễn và xử lý những khái niệm không chắc

chắn, không tường minh. Trong chương đầu tiên này, luận án trình bày một số lý thuyết

tổng quan về tập mờ nói chung và tập mờ phức nói riêng. Tổng quan Các nghiên cứu

liên quan về hệ suy diễn mờ cũng như các hệ mờ phức cũng được trình bày khái quát

trong nội dung chương để đưa ra một cái nhìn tổng quan chung về các hệ suy diễn

phát triển dựa trên lý thuyết tập mờ phức. Thêm nữa, trong nội dung chương cũng giới

thiệu khái quát về các bộ dữ liệu và thước đo đánh giá hiệu năng của các hệ suy diễn

trên tập mờ phức.

1.2. Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định

Con người đưa ra quyết định dựa trên các quy luật mà họ tổng kết được từ thực

tiễn cuộc sống, hay nói cách khác là thông qua quá trình học để cung cấp phương án

đầu ra tốt nhất cho quá trình ra quyết định. Với đặc trưng gần gũi với suy luận tự nhiên

của con người và khả năng học, hệ mờ đã và đang được nghiên cứu, ứng dụng thành

công với vai trò như là một trong những công cụ làm cho "máy học thông minh hơn".

Để giải quyết bài toán hệ hỗ trợ ra quyết định thì đã có rất nhiều phương pháp

được áp dụng như cây quyết định, trí tuệ nhân tạo, hệ chuyên gia, các hệ mờ... Tuy

nhiên trong thực tế việc lựa chọn phương pháp nào thì lại tùy thuộc vào từng bài toán

cụ thể như đối tượng, mục tiêu cần hỗ trợ ra quyết định hay dữ liệu trong hệ hỗ trợ ra

quyết định ...

Với khả năng làm việc với các đối tượng là biến ngôn ngữ, gần gũi với suy luận

tự nhiên của con người, khả năng học, tổng kết tri thức để hình thành nên hệ luật, thì

hệ mờ dược coi là một trong những công cụ mạnh mẽ và được ứng dụng nhiều trong

các hệ hỗ trợ ra quyết định. Hệ thống với các mô hình suy diễn mờ có thể cung cấp

Hình 1.1: Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định

các lựa chọn thay thế và đẩy nhanh kết quả trong việc quyết định đầu ra mong muốn

Hình 1.1 mô tả quy trình chung của phương pháp sử dụng hệ mờ trong các hệ

hỗ trợ ra quyết định. Ban đầu dựa trên dữ liệu mẫu huấn luyện, một quy trình sinh luật

được áp dụng để tạo ra hệ các luật mờ. Hệ luật này là trung tâm tập hợp các quy luật,

kiến thức trích rút ra từ tập dữ liệu huấn luyện. Tiếp theo, với mỗi đầu vào mới được

áp dụng với từng luật và tính toán các đầu ra. Một quy trình tổng hợp kết quả từ các

luật để cho ra một giá trị chung. Cuối cùng, ở bước ra quyết định thì giá trị này được

điều chỉnh, chuẩn hóa để đưa ra quyết định cuối cùng.

1.3. Tổng quan các nghiên cứu liên quan

Logic mờ lần đầu tiên được giới thiệu coi như là một khái niệm để mô tả những

thông tin không chắc chắn, mơ hồ. Nó được ứng dụng rộng rãi để giải quyết các vấn

đề liên quan đến dự báo, điều khiển, phát hiện mẫu và các hệ hỗ trợ ra quyết định với

thông tin không chắc chắn. Đó được coi là mô hình tính toán mà có khả năng xử lý

đồng thời cả tri thức ngôn ngữ và dữ liệu số. Đó là cách lập trình cho máy tính hiểu

và bắt chước suy nghĩ của con người, với mục tiêu là làm tăng hiệu quả của quá trình

ra quyết định đối với các thông tin đầu vào là thông tin mơ hồ và không chắc chắn. Từ

lý thuyết về logic mờ đã dẫn đến sự phát triển của các hệ thống suy diễn mờ. Một hệ

suy diễn mờ được định nghĩa như là một ánh xạ phi tuyến để đưa ra kết quả dựa trên

các lập luận mờ và một tập các luật mờ dạng if-then.

1.3.1. Hệ suy diễn mờ

Suy diễn là cơ chế liên kết các tri thức đã có để suy dẫn ra các tri thức mới. Cơ

chế suy diễn phụ thuộc rất nhiều vào phương thức biễu diễn tri thức và không có một

phương pháp suy diễn duy nhất cho mọi loại tri thức. Hệ suy diễn mờ (FIS) là một

khung tính toán phổ biến dựa trên khái niệm lý thuyết tập mờ, thường được áp dụng

khi xây dựng các quá trình hỗ trợ ra quyết định. Hệ suy diễn mờ tỏ ra hiệu quả trong

trường hợp tri thức không đầy đủ, bất định hoặc không chính xác.

Sơ đồ chung của một hệ FIS bao gồm ba phần chính: một bộ mờ hóa, một bộ

cơ sở luật và một bộ giải mờ. Hệ suy diễn mờ [2, 7] (mô tả trong Hình 1.2) có cấu trúc

cơ bản như sau:

- Giao diện mờ hóa: chuyển đổi các lớp đầu vào thành các biên độ phù hợp với

các giá trị ngôn ngữ.

- Cơ sở trí thức bao gồm hai phần: Cơ sở dữ liệu ( định nghĩa các hàm thuộc

của các tập mờ được sử dụng trong các luật mờ) và bộ luật ( gồm các luật mờ IF –

THEN)

- Đơn vị thực thi: thực hiện các hoạt động suy diễn trong các luật

- Giao diện giải mờ: chuyển đổi các giá trị kết quả mờ của hệ suy diễn ra các

Hình 1.2: Sơ đồ tổng quan của hệ suy diễn mờ

lớp đầu ra rõ.

Các bước suy diễn mờ:

• Mờ hóa các biến đầu vào: ta cần mờ hóa những giá trị rõ bởi hàm thuộc mờ để

tham gia vào quá trình suy diễn

• Áp dụng các toán tử mờ (AND hoặc OR) cho các giả thiết của từng luật.

• Áp dụng phép kéo theo để tính toán giá trị các giá trị từ giả thiết đến kết luận

của từng luật.

• Áp dụng toán tử gộp để kết hợp các kết quả trong từng luật thành một kết quả

duy nhất cho cả hệ.

• Giải mờ kết quả tìm được cho ta một kết quả rõ.

Các phương pháp suy diễn mờ được phân loại theo ba phương pháp chính: Hệ

suy diễn mờ Mamdani, hệ suy diễn mờ Sugeno (hay còn gọi là hệ suy diễn mờ Takagi

1.3.1.1 Hệ suy diễn mờ Mamdani

– Sugeno) và hệ suy diễn mờ Tsukamoto.

Hệ suy diễn mờ Mamdani [49] là hệ có phương pháp suy diễn mờ đầu tiên

Hình 1.3: Hệ thống suy diễn Mamdani với hai đầu vào và hai luật

được xây dựng bằng cách sử dụng lý thuyết tập mờ.

Hình 1.3 mô tả về hệ suy diễn mờ Mamdani có hai biến đầu vào x, y và một biến

đầu ra z. Mỗi đầu vào có hai hàm thuộc đầu vào, kí hiệu lần lượt là {A1, A2} , {B1, B2}

và đầu ra kí hiệu là {C1, C2}.

j THEN z is Ck

i and y is Bk

l với k = 1, ..., R; i = 1, .., N ; j = 1, .., M và l = 1, .., L trong đó N, M, L là số lượng hàm

Luật thứ k sẽ có dạng như sau: k: IF x is Ak

thuộc của hai biến đầu vào và biến đầu ra. Trong hệ suy diễn này, phương pháp giải

1.3.1.2 Hệ suy diễn mờ Tagaki- Sugeno

mờ thường được sử dụng là lấy cực đại và tính toán điểm trọng tâm.

l bởi một hàm của các biến đầu vào thì sẽ thu được luật mờ Tagaki-Sugeno [50]. Như vậy, trong hệ suy diễn Sugeno (Hình 1.4), các luật được hình thành có dạng như

Xét theo luật mờ Mamdani ở mục trên, nếu ở phần kết luận ta thay các tập mờ

k: IF x is Ak

i and y is Bk

j THEN zk = f (x, y)

N, M là số lượng hàm thuộc cho biến đầu vào.

Hình 1.4: Hệ suy diễn mờ Tagaki- Sugeno với hai đầu vào và hai luật

Cũng giống như Mamdani, k = 1, ..., R; i = 1, .., N và j = 1, .., M trong đó

Phương pháp giải mờ thường được sử dụng đối với hệ suy diễn Tagaki- Sugeno

là toán tử tính độ mạnh trung bình.

Do hệ suy diễn Tagaki-Sugeno được đánh giá hiệu quả tính toán cao hơn so

với hệ suy diễn Mamdani nên thường được sử dụng cho các kỹ thuật thích ứng trong

việc xây dựng các mô hình mờ. Những kỹ thuật thích ứng có thể được sử dụng để tùy

chỉnh các hàm thuộc để đạt được mô hình hiệu quả nhất cho từng loại dữ liệu.

Lợi thế của hệ suy diễn Sugeno là tính toán hiệu quả, làm việc tốt với các kỹ

thuật tuyến tính, tối ưu hóa, và rất thích hợp để phân tích toán học.Tuy nhiên, một

trong những vấn đề còn hạn chế của hệ suy diễn mờ Tagaki- Sugeno là không có

phương pháp trực quan tốt nào để xác định các hệ số p, q, và r. Thêm nữa, trong hệ

1.3.1.2 Hệ suy diễn mờ Tsukamoto

suy diễn Tagaki-Sugeno chỉ có đầu ra là rõ.

Trong hệ suy diễn Tsukamoto (hình 1.5), luật if – then được biểu diễn có dạng

k: IF x is Ak

i and y is Bk

j THEN zk = f (x, y).

Hình 1.5: Hệ suy diễn mờ Tsukamoto với hai đầu vào và hai luật

như sau:

Các luật trong hệ suy diễn này được đại diện bởi một tập mờ với hàm thuộc

monotonical. Kết quả suy diễn của từng luật được xác định là một giá trị rõ và được

tính toán khi tính độ mạnh của luật. Kết quả cuối cùng thu được bằng cách lấy giá trị

trung bình đầu ra của từng luật.

Vì mỗi luật suy diễn ra một kết quả rõ, hệ suy diễn Tsukamoto lấy giá trị cuối

cùng là trung bình nên quá trình giải mờ diễn ra nhanh chóng. Tuy nhiên, hệ suy diễn

mờ Tsukamoto được khuyến cáo không hiệu quả như hai hệ suy diễn mờ Mamdani và

Sugeno nên không được sử dụng thường xuyên.

1.3.2. Các hệ phát triển dựa trên tập mờ phức

Sau khi lý thuyết tập mờ phức được Ramot giới thiệu vào năm 2002 [36] thì

đã có nhiều nhà nghiên cứu chú ý và nghiên cứu phát triển các hệ thống dựa trên nền

tảng lý thuyết của tập mờ phức. Tập mờ phức có thể được coi như là một khái niệm cơ

bản được sử dụng trong các hệ thống thông minh để giải quyết các vấn đề đối với các

dữ liệu có tính chu kì định kì hay dữ liệu cần có thêm nhiều thông tin bổ trợ, điều mà

1.3.2.1 Hệ logic mờ phức của Ramot

các tập mờ thường không thể diễn tả đầy đủ được. Cụ thể như sau:

Sau khi Ramot và cộng sự giới thiệu khái niệm mới về mở rộng của tập mờ

thường sang miền mặt phẳng phức với tên gọi là tập mờ phức. Năm 2003, Ramot [44]

phát triển mô hình logic mới sử dụng tập mờ phức với tên là logic mờ phức. Cũng

giống như các hệ thống logic mờ thông thường, hệ thống logic mờ phức là phép ánh

xạ không tuyến tính một vec tơ dữ liệu đầu vào thành đầu ra. Một hệ thống mờ phức

được đặc trưng bởi một tập các luật mờ trong đó phép kéo theo mờ phức được mô tả

theo câu lệnh If-then. Nói chung thì hệ thống mờ phức giống như hệ thống mờ thông

thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến đổi phức tương ứng của

nó.

Hình 1.6: Hệ thống logic mờ do Ramot đề xuất

Hệ thống mờ phức được minh họa chỉ rõ trong hình 1.6 như sau:

Tương tự như hệ thống mờ thông thường, hệ thống logic mờ phức do Ramot

đề xuất bao gồm ba giai đoạn:

Giai đoạn đầu tiên là module mờ hóa, được sử dụng để ánh xạ đầu vào rõ thành

tập đầu vào mờ. Những tập mờ này có thể có hoặc không có phần phức, điều đó tùy

thuộc vào ứng dụng.

Giai đoạn thứ hai là giai đoạn của module Suy diễn mờ phức, thông qua việc sử

dụng cơ sở luật mờ phức để ánh xạ các dữ liệu đầu vào mờ thành đầu ra mờ. Phương

thức suy diễn mờ được Ramot sử dụng trong hệ thống là dựa theo mô hình Modus

Ponen. Đầu ra của mô hình được tính theo công thức phép kéo theo mờ phức. Tiếp

theo bằng việc sử dụng toán tử tổ hợp vec tơ, đầu ra mờ phức của từng luật được kết

nối lại với nhau và đưa ra được một tập đầu ra mờ phức, kí hiệu B∗.

Phép kéo theo mờ phức (có hàm thuộc mờ phức, kí hiệu µA→B (x, y) ) được

Ramot sử dụng trong Hệ suy diễn mờ phức, kết quả tập mờ phức B∗ có hàm thuộc mờ

[rA∗ (x) ⊗ rA→B (x, y)]

rB∗ (y) = sup x∈U

[rA∗ (x) ⊗ (rA (x) · rB (y))]

= sup x∈U

ωB∗ (y) = f [g (ωA∗ (x) , ωA→B (x, y))]

= f [g (ωA∗ (x) , (ωA (x) + ωB (y)))]

phức µB∗ (y) = rB∗ (y) · ejωB∗ (y), trong đó:

với hàm g được sử dụng để tính toán phép giao giữa hai thành phần pha của tập

mờ, và tùy thuộc vào ứng dụng mà có thể lựa chọn hàm f và g khác nhau.

Trong module suy diễn mờ phức, phép toán tổ hợp vec tơ được sử dụng để tổ

hợp các luật và đưa ra kết quả cuối cùng. Mối tương tác giữa các luật là kết quả trực

tiếp của việc kết hợp giữa phép tổ hợp vec tơ và phép kéo theo mờ phức.

Giai đoạn giải mờ là giai đoạn cuối cùng thực hiện việc giải mờ tập đầu ra mờ

phức thành một đầu ra rõ. Một cách tiếp cận khả thi đối với giải mờ tập đầu ra mờ

phức là bỏ qua thành phần pha mà chỉ quan tâm đến thành phần biên độ của tập mờ

phức. Trong mô hình hệ logic mờ phức của Ramot thì bất kì phương pháp giải mờ nào

áp dụng được đối với hệ logic mờ truyền thống đều có thể được áp dụng ở giai đoạn

Giải mờ này.

Như vậy, Ramot và cộng sự đã đưa ra một hệ thống tổng quát dựa trên khái

niệm tập mờ phức. Hệ thống này vẫn giữ được những ý nghĩa của hệ thống logic mờ

thông thường và thêm vào đó là các tính chất của tập mờ phức. Tuy nhiên, nhóm tác

giả mới chỉ đưa ra mô hình tổng quát và ví dụ minh họa chứ chưa áp dụng một hệ suy

1.3.2.2 Hệ thống CANFIS

diễn mờ rõ ràng nào trong hệ thống.

Hệ thống CANFIS [51] là hệ thống do nhóm tác giả Li và Jang đề xuất với với

tên gọi là Hệ suy diễn mờ nơron thích nghi phức CANFIS (Complex Neuro-Fuzzy

Inference System). Đây được coi là một mở rộng của Hệ suy diễn nơ ron mờ thích

nghi với các biến đầu vào là vec tơ phức và đầu ra là số phức. Tập các biến đầu vào

mờ được định nghĩa như các biến phức, và các tham số tùy chỉnh trong hệ thống đều

là giá trị phức (ví dụ như tâm của tập mờ đầu vào, vec tơ trọng số của hàm đầu ra).

Hệ thống CANFIS bao gồm năm lớp: ba lớp ban đầu gọi là lớp mờ hóa, ví dụ

đưa ra giá trị độ mạnh đối với từng luật mờ ; lớp thứ tư thực hiện công việc suy diễn

(đưa ra giá trị đầu ra tương ứng với mỗi luật) và lớp cuối cùng thực hiện việc tổng hợp

kết quả (kết nối các giá trị đầu ra của mỗi luật để đưa ra giá trị đầu ra cuối cùng).

Hình 1.7: Kiến trúc của hệ thống CANFIS

Hình 1.7 minh họa cụ thể ví dụ về hệ thống CANFIS với ba biến đầu vào.

Hệ thống CANFIS được ứng dụng rộng rãi đối với các tín hiệu phức và với

các hệ thống có tín hiệu không tuyến tính trong viễn thông. Tuy nhiên, hệ thống này

không hoàn toàn đúng ý nghĩa trên miền phức, bởi việc sử dụng các hàm thuộc mờ

loại 1 riêng cho phần thực và phần ảo của từng giá trị biến đầu vào. Chính điều đó làm

giảm đi ý nghĩa của hệ thống suy diễn trên tập mờ phức do việc tách riêng phần thực

và phần ảo của các giá trị đầu vào làm giảm đi ý nghĩa của việc ứng dụng trong miền

phức. Thêm nữa, việc tách riêng phần thực và phần ảo cũng đã làm tăng số lượng luật

1.3.2.3 Hệ ANCFIS

và làm tăng độ phức tạp tính toán của hệ thống.

Hệ thống ANCFIS do nhóm tác giả Chen và cộng sự đề xuất năm 2010 [46]

gần giống với kiến trúc mạng nơ ron giá trị phức. Mạng nơ ron giá trị phức này cho

phép dữ liệu đầu vào và đầu ra là các giá trị phức (mặc dù vẫn chấp nhận giá trị đầu

vào và đầu ra là giá trị thực hay nhị phân...), và các giá trị trọng số trong mô hình có

thể mang giá trị phức hoặc giá trị thực.

Mô hình ANCFIS được đề xuất áp dụng với đối với dữ liệu theo chuỗi thời

gian, hệ thống chỉ yêu cầu 1 biến đầu vào hay chính là một giá trị trong chuỗi dữ liệu

theo thời gian. Điều này nhấn mạnh ý nghĩa tự nhiên của tập mờ phức nhưng khi đó

họ cần phân đoạn dữ liệu theo chuỗi thời gian để sao cho phù hợp với thành phần pha

và biên độ của tập mờ phức trong bài toán của họ đề xuất.

Khi đó, mô hình hệ thống ANCFIS kết hợp thêm một lớp bổ sung, sử dụng

các tín hiệu giá trị phức trong phần lớn mô hình mạng và sử dụng hàm kích hoạt ở

các nút khác nhau. Trong pha sau thì cần xác định hàm thuộc giá trị phức đối với mỗi

đoạn của chuỗi thời gian và hàm thuộc cho tập mờ phức. Còn trong pha trước thì cần

cập nhật những tham số a, b, c và d cho tập mờ phức bằng sử dụng thuật toán tối ưu

Gradient descent. Trong các lựa chọn thì nhóm tác giả chọn thực nghiệm toán tử L2

norm, tích chập giá trị thực và tích chập với giá trị phức đối với pha trước và thuật

toán tối ưu đàn kiến ACO được áp dụng trong pha sau của hệ thống.

Như vậy, trong hệ thống này nhóm tác giả chỉ chú ý tập trung đưa ra thuật toán

học lan truyền đối với tập mờ phức và áp dụng với các bộ dữ liệu chuỗi thời gian. Đó

1.3.2.4 Một số hệ suy diễn khác dựa trên tập mờ phức

là một hệ thống lai giữa CFIS và ANFIS.

Bên cạnh các nghiên cứu đã có thì tập mờ phức cũng được nhiều nhóm nghiên

cứu và phát triển. Deshmukh và cộng sự [52] lại đề xuất một hệ logic mờ phức và áp

dụng chúng để thiết kế bộ vi xử lý mờ sử dụng công nghệ VLSI (công nghệ tích hợp

mạch cỡ lớn - Very large scale integration). Tuy nhiên, nhóm tác giả không thực hiện

suy diễn luật và không đưa ra module giải mờ phù hợp trong hệ thống của mình.

Tiếp nối mô hình ANCFIS do nhóm tác giả Chen và cộng sự đề xuất [46] thì

nhóm tác giả Yazdanbakhsh và Dick [53] đã cải tiến hệ thống ANCFIS bằng cách áp

dụng thêm thuật toán học máy nhằm tăng tốc độ học trong quá trình huấn luyện của

mô hình ANCFIS. Từ đó, nhóm tác giả xây dựng hệ thống hệ suy diễn mờ phức dựa

trên mạng nơ ron thích nghi ngẫu nhiên (RANCFIS- Randomized Adaptive-Network

Based Fuzzy Inference System) [54] và ứng dụng mô hình đề xuất trong đối với cả

dữ liệu chuỗi thời gian nhiều chiều trong. Sau đó vào năm 2019, trong nghiên cứu

[48] nhóm tác giả Yazdanbakhsh và Dick tiếp tục cải tiến hệ thống của mình và đề

xuất hệ thống mới có tên gọi hệ suy diễn mờ phức dựa trên mạng nơ ron thích nghi

nhanh (FANCFIS- Fast Adaptive-Network Based Fuzzy Inference System). Bằng việc

sử dụng thuật toán Fourier trong quá trình huấn luyện, hệ thống đã phát hiện nhanh

được những tần số chi phối của bộ dữ liệu theo chuỗi thời gian và từ đó đề xuất tập

mờ phức phù hợp trong quá trình xây dựng hệ luật.

1.3.3. Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay

Từ các nghiên cứu về hệ suy diễn phát triển từ tập mờ phức, các hệ suy diễn

phát triển dựa trên tập mờ phức đã có chưa thực sự đúng với ý nghĩa của hệ thống

phức thực sự. Hầu hết các hệ thống đều sử dụng tập mờ phức làm biến đầu vào nhưng

các nghiên cứu đều chỉ sử dụng thành phần biên độ trong quá trình ra quyết định mà

bỏ qua thành phần pha. Ví dụ như trong hệ thống logic mờ phức tổng quát của Ramot

thì bỏ qua thành phần pha trong giải mờ kết quả đầu ra, làm cho hệ thống không đủ

yếu tố khi xử lý với dữ liệu chuỗi thời gian của các yếu tố có sự lặp lại hoặc xảy ra

định kì, và điều này làm giảm đi ý nghĩa của mô hình hệ suy diễn mờ phức, trở thành

hệ suy diễn mờ thường. Còn mô hình ANCFIS của Man và Chen thì sử dụng phép

tích vô hướng vec tơ cho quá trình tổng hợp kết quả, và coi các giá trị đầu vào phức

như là các giá trị thực, do đó nó thu được một giá trị vô hướng đối với phép tích vô

hướng. Điều này có thể sẽ không thực hiện được nếu các đầu vào thực sự là các giá trị

phức, vì tích vô hướng của hai số phức là một giá trị phức chứ không phải là một giá

trị vô hướng. Do đó hệ thống ANCFIS không thực sự là hệ thống phức khi đầu ra của

hệ thống không thể đại diện cho tính tuần hoàn của các thành phần trong đó.

Sau đó mô hình hệ ANCFIS được nhóm tác giả phát triển và cải thiện thành hệ

thống Hệ suy diễn mờ phức dựa trên mạng nơ ron thích nghi ngẫu nhiên (RANCFIS-

Randomized Adaptive-Network Based Fuzzy Inference System) và Hệ suy diễn mờ

phức dựa trên mạng nơ ron thích nghi nhanh (FANCFIS- Fast Adaptive-Network

Based Fuzzy Inference System). Tuy nhiên, hai hệ thống này đều không cải thiện

ý nghĩa phức trong hệ suy diễn ANCFIS trước đó mà chỉ tập trung nghiên cứu cải tiến

vấn đề học trong mô hình ANCFIS.

Như vậy, các hệ thống phát triển dựa trên lý thuyết tập mờ phức như hệ logic

mờ phức của Ramot hay các phiên bản khác nhau theo kiến trúc ANFIS khi xử lý với

dữ liệu chuỗi thời gian hay các bộ dữ liệu có yếu tố tuần hoàn, biến đổi theo thời gian

thì các hệ FIS hay ANFIS đều đưa ra hai phương thức xử lý chung như sau:

• Các hệ thống thường bỏ qua thông tin liên quan đến yếu tố thành phần pha,

• Đối với dữ liệu đầu vào thì biểu diễn thành phần biên độ và pha riêng biệt với

nhau thành hai thành phần riêng biệt bằng cách sử dụng hai tập mờ. Điều này sẽ

làm cho mất mát thông tin trong quá trình suy diễn và kết quả thu được không

đáng tin cậy (nếu các thông tin về thành phần pha bị bỏ qua), làm sai lệch thông

tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và pha được xử lý riêng

biệt) và thời gian tính toán của hệ thống sẽ tăng thêm do số lượng các bộ cần

được xử lý tăng thêm.

1.4. Cơ sở lý thuyết

Ý tưởng của khái niệm tập mờ là từ những khái niệm trừu tượng về ngữ nghĩa

của thông tin mờ, thông tin không chắc chắn như trung niên-già trẻ, nhanh-chậm, cao-

thấp. Năm 1965, Zadel [1] đã đưa ra cách biểu diễn những thông tin mờ, không chắc

chắn trên bằng một khái niệm toán học, được gọi là tập mờ. Về cơ bản, tập mờ xử lý

các thông tin mơ hồ, không chắc chắn trong các tình huống khác nhau. Các ứng dụng

của logic mờ và tập mờ được nghiên cứu trong nhiều lĩnh vực khác nhau như trí tuệ

nhân tạo, lý thuyết điều khiển, xử lý tín hiệu, hệ hỗ trợ ra quyết định.

Có một số hướng tiếp cận khác nhau dựa trên các tập mờ để xử lý những thông

tin không chắc chắn, không rõ ràng của dữ liệu như tập mờ giá trị khoảng, tập mờ loại

hai, tập mờ trực cảm, tập mờ phức... Trong phần này, luận án trình bày khái quát qua

về lý thuyết mờ và tập trung vào lý thuyết tập mờ phức và logic mờ phức. Nếu tập

mờ loại một được mô tả bởi hàm thuộc ánh xạ các phần tử trong không gian nền vào

khoảng [0,1] thì tập mờ phức được coi là mở rộng của tập mờ loại một với hàm thuộc

là giá trị phức. Đây được coi là một trong những hướng nghiên cứu phát triển trong

thời gian gần đây và được ứng dụng trong nhiều lĩnh vực khác nhau như xử lý tín hiệu

[52], hệ hỗ trợ ra quyết định [55], dự báo [56], chứng khoán [48, 53], ...

1.4.1. Tập mờ

Theo lý thuyết cổ điển thì khi xét quan hệ thuộc của một phần tử với với tập

hợp, ta chỉ có hai giá trị: 1 (nếu thuộc) và 0 (nếu không thuộc). Các tập hợp như vậy

được gọi là tập rõ.

Cho tập X (cid:54)= 0, tập rõ A ⊆ X được xác định bởi hàm thuộc sau:

z (cid:55)→ χA(z)) =

(cid:40) 1 nếu x ∈ A (1.1) nếu x /∈ A

trong đó X là không gian nền (tập nền).

Khái niệm tập mờ được giáo sư Lotfi A. Zadel đưa ra vào năm 1965 [1] với

mục đích là mô tả những khái niệm "tập hợp chưa rõ ràng" trong nghiên cứu những

yếu tố chưa bất định.

Định nghĩa 1.1 ([1]). A được coi là một tập mờ trên không gian nền X nếu A được

xác định bởi hàm sau:

µA : X → [0, 1]; x (cid:55)→ µA(x)

(1.2)

1.4.2. Tập mờ phức

Khái niệm về tập mờ phức (Complex Fuzzy Set - CFS) và logic mờ phức

(Complex Fuzzy Logic - CFL) [36, 44] đã được đề xuất bởi Ramot và các cộng sự

được coi như là một phần mở rộng của lý thuyết tập mờ và logic mờ.

Định nghĩa 1.2 ([36]). Một tập mờ phức A định nghĩa trên không gian nền U được

√

−1

đặc trưng bởi một hàm thuộc giá trị phức có dạng như sau:

µA (x) = rA (x) .ejωA(x); j =

(1.3)

rA (x) ∈ [0, 1], ωA (x) ∈ (0, 2π].

Trong đó, rA (x) là biên độ, ωA (x) là pha của hàm thuộc mờ phức và với điều kiện

µA (x) mà phạm vi giá trị của nó là đường tròn đơn vị trong không gian phức. Thành

Như vậy, một tập mờ phức được đặc trưng bởi một hàm thuộc giá trị phức

phần pha ở đây chỉ là một số thông tin mở rộng bổ sung thêm liên quan tới chu kì

không gian hay thông tin thời gian trong tập mờ đã được xác định bởi thành phần biên

độ.

Theo Ramot [36, 44] thì tập mờ phức được coi như là công cụ mô hình hóa

hiệu quả đối với những vấn đề, những đối tượng có ý nghĩa thay đổi theo thời gian (ví

dụ như phần pha biểu diễn ý nghĩa thay đổi theo ngữ cảnh) hay với những vấn đề có

yếu tố chu kì, định kì.

Khác với tập mờ, phạm vi của hàm thuộc chỉ giới hạn trong khoảng [0,1] thì

với tập mờ phức, phạm vi được mở rộng đến vòng tròn đơn vị trong mặt phẳng phức.

Như vậy, tập mờ phức cung cấp một nền tảng toán học để biểu diễn hàm thuộc dưới

dạng số phức. Do đó, tập mờ chỉ là một trường hợp cụ thể của tập mờ phức khi thành

phần pha bằng 0 [36, 57].

Hình 1.8 mô tả biểu diễn của hàm thuộc mờ phức qua đồ thị 3 chiều với không

gian nền được coi là trục thứ ba. Hình trụ màu xanh biểu diễn giới hạn của các lớp mờ

Hình 1.8: Biểu diễn của hàm thuộc mờ phức

phức trên không gian nền U.

Tuy nhiên khái niệm về tập mờ phức này khác với các khái niệm do Buckley

[58, 59] và Zhang [60, 61] đưa ra. Các tập mờ phức giữ lại các đặc điểm về sự không

chắc chắn dưới dạng biên độ, trong khi thêm vào thành phần pha để chỉ ra các thuộc

tính dạng sóng.

Các ví dụ sau sẽ minh họa rõ hơn tập mờ phức và ý nghĩa khái niệm thành phần

biên độ, thành phần pha của tập mờ phức.

Ví dụ 1 [36]: Xem xét vấn đề biểu diễn hoạt động năng lượng mặt trời thông

qua quan sát các vết đen mặt trời. Nếu năng lượng mặt trời đạt ở mức cao thì số lượng

vết đen mặt trời nhiều, còn nếu năng lượng mặt trời ở mức thấp thì số lượng vết đen ít

đi. Tuy nhiên, theo ý kiến của các chuyên gia thì cứ 11 năm thì mặt trời lại có một giai

đoạn năng lượng mặt trời đạt giá trị cực đại sau một khoảng thời gian đạt cực tiểu. Do

đó, để đánh giá được năng lượng mặt trời của tháng là thấp hay cao, ngoài việc xem

xét các vết đen trung bình của mặt trời mà còn cần chú ý tới chu kì của năng lượng

mặt trời.Ví dụ như, năm 2000 số lượng vết đen 50 được coi là giá trị năng lượng đạt

cực đạ nhưng đến năm 2015 thì giá trị đó chỉ bằng một phần tư của chu kì đi lên của

vòng năng lượng mặt trời.

Do đó, để thể hiện tất cả các thông tin cần thiết liên quan tới hoạt động năng

lượng mặt trời trong từng tháng cụ thể thì có thể định nghĩa như là một tập mờ phức,

bao gồm cả thành phần biên độ và pha. Thành phần biên độ là số lượng vết đen mặt

trời và thành phần pha chứa các thông tin liên quan đến vị trí của tháng đó trong chu

kì vòng quay mặt trời. Còn nếu sử dụng tập mờ truyền thống thì chỉ có thể sử dụng tập

mờ đơn lẻ để biểu diễn số lượng điểm đen của mặt trời, còn thông tin liên quan đến vị

trí trong chu kì vòng quay mặt trời thì mơ hồ và không thể hiện rõ.

Ví dụ 2 [44]: Xem xét trong trường hợp một nhà đầu tư có ý định đầu tư vào

một công ty bằng cách mua cổ phiếu giao dịch trên thị trường chứng khoán New York.

Khi đó, nhà đầu tư quan tâm đến vấn đề tối ưu hóa thời gian mua hàng và tối đa hóa

lợi nhuận (tức là mua cổ phiếu khi giá cổ phiếu còn thấp). Khi đó nhà đầu tư tư vấn

với một chuyên gia, người cung cấp dữ liệu sau đây:

- Giá cổ phiếu hiện tại của công ty liên quan đến đánh giá tổng thể về hiệu suất

của công ty.

- Giai đoạn thực tại của thị trường chứng khoán. Thị trường chứng khoán

thường làm việc theo định kì (ví dụ như, theo dõi chỉ số SP theo định kì 4 năm).

Như vậy thông tin về giai đoạn hiện tại của thị trường chứng khoán có thể đóng vai

trò khá quan trọng đối với các nhà đầu tư.

Nếu theo lý thuyết tập mờ thì nhà đầu tư sẽ sử dụng một tập mờ để mô tả tình

hình giá cổ phiếu hiện tại của thị trường chứng khoán bằng cách gán cho nó một giá

trị độ thuộc mờ, ví dụ như “giá thấp”. Tuy nhiên, thông tin về giai đoạn thực tại của

thị trường chứng khoán lại không thể hiện được trong đó. Khi đó, để miêu tả rõ hơn

về vấn đề đầu tư cổ phiếu và có thể biểu diễn ngắn gọn, chính xác tất cả các thông tin

được cung cấp bởi chuyên gia đầu tư chứng khoán thì có thể sử dụng khái niệm tập

mờ phức. Việc sử dụng một tập mờ phức với thành phần biên độ biểu thị giá cổ phiếu

hiện tại tương ứng với hiệu suất của công ty và thành phần pha hiển thị giai đoạn hiện

tại của thị trường chứng khoán.

1.4.3. Các phép toán trên tập mờ phức

Phần bù của tập mờ phức

Trong phần này luận án tập trung trình bày về các phép toán trên tập mờ phức.

Cho A tập mờ phức với hàm thuộc mờ phức tương ứng là: µA(x) = rA(x)ejωA(x).

Định nghĩa 1.3 ([36]). phần bù của tập mờ phức A ( kí hiệu A) có thể được xác định

A = (cid:8)(x, µA(x))|x ∈ U(cid:9) =

như sau: (cid:111) (1.4) (cid:110) (x, rA(x)ejωA(x))|x ∈ U

Với rA(x) = 1 − rA(x) và ωA(x) = 2π − ωA(x).

Theo [36], phép toán phần bù mờ phức có thể có các dạng như sau:

A = (1 − rA (x)) .ej(−ωA(x))

(1.5)

A = (1 − rA (x)) .ej(ωA(x))

(1.6)

A = (1 − rA (x)) .ej(ωA(x)+π)

(1.7)

Ví dụ 1.1. Cho tập mờ phức A = 0.6ej1.2π(cid:14)x + 1.0ej2π(cid:14)y + 0.8ej1.6π(cid:14)z Khi đó, A = 0.4ej0.8π(cid:14)x + 0/y + 0.2ej0.4π(cid:14)z

Phép hợp và phép giao của hai tập mờ phức

Ramot [36] đã trình bày về phép hợp và phép giao trên tập mờ phức cùng với

những toán tử áp dụng đối với thành phần pha của cấp độ thuộc mờ phức.

Cho A và B là hai tập mờ phức với hàm thuộc mờ phức tương ứng là: µA(x) = rA(x)ejωA(x) và µB(x) = rB(x)ejωB(x), khi đó, các phép toán trên tập mờ phức được

định nghĩa như sau:

Định nghĩa 1.4 ([36]). Phép hợp hai tập mờ phức A và B (kí hiệu A ∪ B) được định

A ∪ B = {(x, µA∪B(x))|x ∈ U }

nghĩa như sau:

(x, rA∪B(x)ejωA∪B(x))|x ∈ U

(cid:111) (cid:110) (1.8)

(x, [rA(x) ⊕ rB(x)] ejωA∪B(x))|x ∈ U

(cid:111) (cid:110)

Với phép ⊕ có thể là phép t-đối chuẩn, ví dụ như rA∪B(x) = max {rA(x), rB(x)}.

Định nghĩa 1.5 ([36]). Phép giao hai tập mờ phức A và B (kí hiệu A ∩ B) được xác

A ∩ B = {(x, µA∩B(x))|x ∈ U }

định bởi

(x, rA∩B(x)ejωA∩B(x))|x ∈ U

(cid:111) (cid:110) (1.9)

(x, [rA(x) ⊗ rB(x)] ejωA∩B(x))|x ∈ U

(cid:111) (cid:110)

Với rA∩B(x) = min {rA(x), rB(x)} và ωA∩B(x) = min (ωA(x), ωB(x)).

Trong đó, phép ⊗ biểu diễn hàm t-chuẩn, ví dụ như toán tử Min hoặc phép

nhân đại số. Khi rA và rB là giá trị thực, các toán tử max và min đều có thể được sử

dụng ở đây.

Ramot [36] đề xuất trong phép hợp và phép giao của tập mờ phức thì các giá

trị thành phần pha ωA∩B(x) và ωA∪B(x) có thể được chọn tùy thuộc vào ngữ cảnh ứng

dụng. Các phép toán được sử dụng với ωA∩B(x) thì cũng được dùng với ωA∩B(x) và

có thể có các dạng như sau:

Sum : ωA∪B = ωA + ωB

(1.10)

M ax : ωA∪B = max (ωA, ωB)

(1.11)

M in : ωA∪B = min (ωA, ωB)

(1.12)

(cid:40)

”W innerT akeAll” : ωA∪B =

ωA rA > rB ωB rA < rB

(1.13)

W eightedAverage : ωA∪B =

rA.ωA + rB.ωB rA + rB

(1.14)

Average : ωA∪B =

ωA + ωB 2

(1.15)

Dif f erence : ωA∪B = ωA − ωB

(1.16)

Ví dụ 1.2. Cho 2 tập mờ phức A và B được định nghĩa trên không gian nền U như

A = 1.0ej.0/x + 0.4ejπ/y + 0.8ejπ/2 /z

B = 0.2ej.3π/4 /x + 0.3ej.2π/y + 1.0ej.π/5 /z

A ∪ B = 1.0ej.0/x + 0.4ej.π/y + 1.0ej.π/5 /z

Thứ tự trong tập các số phức

Phép hợp giữa hai tập mờ phức (sử dụng hàm max- min) được tính toán như sau:

Vào năm 2011, Azam và cộng sự [62] đã giới thiệu về không gian metric giá

trị phức và định nghĩa thứ tự từng phần (kí hiệu (cid:22)) trên tập các số phức.

Im(z2), điều đó có nghĩa là z1 (cid:22) z2 nếu thỏa mãn một trong bốn điều kiện sau:

Định nghĩa 1.6 ([62]). Cho C là tập các số phức với z1, z2 ∈ C, thứ tự từng phần (cid:22) trong C được xác định như sau: z1 (cid:22) z2 khi và chỉ khi Re(z1) ≤ Re(z2) và Im(z1) ≤

• Re (z1) = Re (z2) và Im (z1) = Im (z2),

• Re (z1) < Re (z2) và Im (z1) = Im (z2),

• Re (z1) = Re (z2) và Im (z1) < Im (z2),

• Re (z1) < Re (z2) và Im (z1) > Im (z2).

1.4.4. Logic mờ phức

Logic mờ phức [44] là mô hình được thiết kế để duy trì những ưu điểm của

logic mờ truyền thống, và cập nhật thêm những đặc điểm nổi trội riêng biệt của tập

mờ phức. Điểm đáng chú ý của logic mờ phức là các luật được xây dựng bằng việc sử

dụng mô hình logic mờ phức này được liên kết một cách chặt chẽ với nhau; mối quan

hệ giữa các thành phần pha biểu hiện bởi phép kéo theo mờ phức. Điều này dẫn đến

một mối tương tác duy nhất, sự phụ thuộc giữa các luật mà cho phép xây dựng một hệ

thống mới gọi là hệ logic mờ phức.

Giống như hệ logic mờ truyền thống, hệ logic mờ phức được xây dựng dựa trên

các luật suy diễn. Tuy nhiên, đầu ra của mỗi một luật này là một tập mờ phức, do đó

đối với hệ logic mờ phức thì việc cân nhắc tính toán thành phần pha đóng một vai

trò quan trọng trong việc xác định ra kết quả đầu ra cuối cùng của hệ logic mờ phức.

Ngược lại trong hệ logic mờ truyền thống thì chỉ cần xem xét đến thành phần biên độ

hay chính là mức độ thuộc mà thôi. Đặc điểm này của hệ logic mờ phức được coi là

hệ quả trực tiếp của chính các tính chất của số phức, và không thể thực hiện song song

giống như tập mờ truyền thống.

Một trong những yêu cầu cơ bản đặt ra đối với hệ logic mờ phức là cần duy trì

những ưu điểm của tập mờ truyền thống. Do đó mô hình logic mờ phức sẽ tiếp thu

được những ưu điểm của cả tập mờ và của cả lý thuyết số phức. Đặc biệt là:

- Mô hình phải duy trì được khả năng duy nhất của logic mờ để nắm bắt được

cả dữ liệu số và tri thức ngôn ngữ.

- Xây dựng hệ thống sử dụng logic mờ phức phải duy trì được mối quan hệ đơn

giản và trực quan (mặc dù bản chất trực quan của các cấp độ hàm thuộc phức).

- Hệ thống logic mờ phức sẽ dựa trên những luật tăng trưởng “song song”, do

đó đạt được yêu cầu tính toán hiệu quả.

Do đó, hệ logic mờ phức tương tự như hệ logic mờ thông thường. Một hệ logic

mờ phức liên quan đến vấn đề thực hiện mờ hóa vấn đề (bao gồm định nghĩa các luật

mờ), suy diễn mờ và cuối cùng là giải mờ để thu được kết quả. Tất nhiên, tất cả các tập

mờ được sử dụng cho việc xây dựng một hệ logic mờ phức được đặc trưng bởi hàm

thuộc giá trị phức.

Hệ logic mờ phức sử dụng luật được xây dựng dưa trên tập mờ phức để tạo ra

X là A then Y là B” với X là biến nhận các giá trị x từ không gian nền U, A là một

một hệ logic mờ phức. Những luật này được biểu diễn theo dạng câu lệnh if-then “ If

tập mờ phức trên U, Y nhận các giá trị y từ không gian nền V , B là một tập mờ phức

trên V . Một luật chính là biểu diễn của một quan hệ kéo theo mờ phức giữa hai tiền

đề mờ phức không có điều kiện p và q, trong đó tiền đề p được mô tả là cụm “X là A”

còn q được mô tả bởi “Y là B”.

Quan hệ kéo theo mờ phức được mô tả bởi một hàm thuộc giá trị phức và được

kí hiệu bởi µA→B (x, y). Theo lý thuyết của tập mờ phức thì hàm thuộc được chia ra

thành 2 phần riêng biệt: thành phần biên độ và thành phần pha. Thành phần biên độ

(kí hiệu bởi rA→B (x, y)) là cấp độ hàm thuộc có giá trị thực, nó chỉ rõ mức độ thực

của quan hệ kéo theo,.. ví dụ như mức độ tăng trưởng luật.

Thành phần pha (kí hiệu bởi ωA→B (x, y)) liên quan đến vấn đề kết hợp pha

trong phép kéo theo. Theo đúng ý nghĩa của nó thì thành phần pha chiếm ít ảnh hưởng

đến phần kết quả, tuy nhiên,nó cũng là một tham số quan trọng khi một số quan hệ

kéo theo được xét đồng thời cùng với nhau, cùng xảy ra trong hệ logic mờ phức.

Ramot [44] đề xuất hàm kéo theo của hệ logic mờ phức được mô tả như sau:

µA→B (x, y) = µA (x) · µB (y) = rA (x) .rB (y) .ej(ωA(x)+ωB(x))

(1.17)

Ý nghĩa của hàm kéo theo mờ phức tương tự như hàm kéo theo mờ, điểm khác

biệt chỉ ở chỗ hàm thuộc trong công thức là hàm thuộc mờ phức. Chú ý ở phép kéo

theo mờ phức ở đây là, ảnh hưởng của phép tích trên thành phần biên độ của A và

B giống như đối với tập mờ thường giá trị thực. Do đó, phép tích đại số phù hợp với

cách giải thích biên độ được trình bày trong tập mờ phức, theo đó thành phần biên độ

chính tương đương với hàm thuộc giá trị thực trong tập mờ thường. Đây cũng chính là

lí do mà phép tích đại số thường được chọn cho logic mờ phức.

1.4.5. Độ đo mờ và độ đo mờ phức

Trong những năm gần đây, lý thuyết về độ đo mờ và độ đo mờ phức đã và đang

nhận được nhiều chú ý từ những nhà khoa học và nghiên cứu trong và ngoài nước phát

triển và ứng dụng trong các hệ hỗ trợ ra quyết định.

Định nghĩa 1.7. Một độ đo mờ phức [63] kí hiệu ρ : (F ∗ (U ) × F ∗ (U )) → [0, 1] đối

với A, B và C ∈ F ∗ (U ) nếu thỏa mãn các tính chất sau:

1. ρ (A, B) ≥ 0, ρ (A, B) = 0 khi và chỉ khi A = B

2. ρ (A, B) = ρ (B, A)

3. ρ (A, B) ≤ ρ (A, C) + ρ (C, B)

Với F ∗ (U ) là tập các tập mờ phức trong U

Dựa vào khái niệm của tập mờ phức do Ramot đề xuất, Alkouri và cộng sự

[64] cũng đề xuất một số khoảng cách giữa các tập mờ phức như sau:

Định nghĩa 1.8 ([64]). Khoảng cách giữa các tập mờ phức mờ phức được định nghĩa

như sau:

(i) Khoảng cách Hamming

n (cid:88)

|ωA (xi) − ωB (xi)|

|rA (xi) − rB (xi)| +

dCF (A, B) =

1 2

1 2π

i=1

(cid:35) (cid:34) n (cid:88) (1.18)

n (cid:88)

eCF (A, B) =

(rA (xi) − rB (xi))2 +

1 2

i=1

(cid:104) (1.19) (ii) Khoảng cách Euclidean (cid:118) (cid:117) (cid:117) (cid:116) (cid:105) 1 2π2 (ωA (xi) − ωB (yi))

(iii) Khoảng cách Hamming tiêu chuẩn

n (cid:88)

lCF (A, B) =

|rA (xi) − rB (yi)| +

|ωA (xi) − ωB (yi)|

1 2π

1 2n

i=1

(cid:35) (cid:34) n (cid:88) (1.20)

(iv) Khoảng cách Euclidean tiêu chuẩn

n (cid:88)

qCF (A, B) =

(rA (xi) − rB (xi))2 +

1 2n

i=1

(cid:104) (1.21) (cid:118) (cid:117) (cid:117) (cid:116) (cid:105) 1 2π2 (ωA (xi) − ωB (yi))

Ngoài ra, Zhang cùng cộng sự [63] cũng đưa ra khái niệm về cân bằng δ giữa

hai tập mờ phức A, B và từ đó đề xuất độ đo khoảng cách giữa các tập mờ phức:

Định nghĩa 1.9 ([63]). Cho A và B là hai tập mờ phức có hàm thuộc mờ phức tương

ứng như sau ηA (x) = pA (x) ejµA(x); ηB (x) = pB (x) ejµB(x). Khi đó A và B được coi

là cân bằng δ khi và chỉ khi (A, B) ≤ 1 − δ, 0 ≤ δ ≤ 1.

Định nghĩa 1.10 ([63]). Cho A và B là hai tập mờ phức có hàm thuộc mờ phức tương

ứng là: µA(x) = rA(x)ejωA(x) và µB(x) = rB(x)ejωB(x). Khoảng cách giữa hai tập mờ

phức được định nghĩa như sau:

d (A, B) = max

|ωA (x) − ωB (x)|

|rA (x) − rB (x)| ;

1 2π

sup x∈U

(cid:19) (cid:18) (1.22)

1.5. Dữ liệu thực nghiệm

1.5.1. Bộ dữ liệu chuẩn

Đây là các bộ dữ liệu chuẩn lấy từ kho dữ liệu học máy UCI, bao gồm các bộ

dữ liệu sau:

• Bộ dữ liệu ung thư vú Breast Wisconsin Dataset (WBCD): Bộ dữ liệu ung thư

vú được lấy từ Bệnh viện đại học Wisconsin, Madison, Mỹ. Bộ dữ liệu bao gồm

kết quả của 699 bệnh nhân (trong đó 458 bệnh nhân được chẩn đoán là u lành

tính và 241 bệnh nhân được chẩn đoán là ung thư).

• Bệnh tiểu đường Diebete: Dữ liệu bệnh tiểu đường được lấy từ kho dữ liệu bệnh

của Đại học Y Virgina. Dữ liệu được thu thập từ 391 bệnh nhân người Mỹ gốc

Phi ở miền trung Virgina để tìm hiểu dự báo về bệnh tiểu đường.

• Bộ dữ liệu đo chất lượng rượu (Wine Quality): Bộ dữ liệu gồm các thông tin về

các mẫu rượu vang đỏ và vang trắng từ phía bắc của Bồ Đào Nha, với mục đích

là mô hình hóa chất lượng rượu vang dựa trên các thực nghiệm hóa lý để phân

loại chất lượng rượu

• Bộ dữ liệu Hình ảnh tim thai CardiotocoGraphy- CTG: Dữ liệu gồm 2126 hình

ảnh chụp tim thai (CTG) được xử lý tự động và đo các đặc điểm chẩn đoán tương

ứng. Các hình ảnh thu được cũng được phân loại bởi các bác sĩ sản khoa chuyên

nghiệp thành 10 lớp dữ liệu.

• Bộ dữ liệu Rối loạn nhịp tim (Arrhythmia): Dữ liệu được thu thập với mục đích

nghiên cứu để phân biệt giữa sự hiện diện có hay không có biểu hiện rối loạn

nhịp tim và phân nó vào một trong 13 lớp.

Tóm tắt về các bộ dữ liệu chuẩn BenchMark được mô tả trong Bảng 1.1, cụ thể

Bảng 1.1: Các bộ dữ liệu thực nghiệm chuẩn Benchmark

Số thứ tự

Bộ dữ liệu

Số nhãn

Số thuộc tính

Số bản ghi

680

390

1599

2126

452

Bộ dữ liệu ung thư vú - WBCD Bộ dữ liệu tiểu đường - Diebetes Bộ dữ liệu Chất lượng rượu - Wine Bộ dữ liệu ảnh chụp tim thai - CTG Bộ dữ liệu Rối loạn nhịp tim-Arrhythmia

như sau:

1.5.2. Bộ dữ liệu thực- Bệnh gan Liver

Trong thực tế, để chẩn đoán bệnh thì các bác sĩ cần thu thập thông tin khác

nhau từ quá trình thăm khám, từ số liệu của các kết quả xét nghiệm... Trong ứng dụng

này luận án chỉ dừng lại việc hỗ trợ chẩn đoán bệnh gan sử dụng khai thác các thông

tin là số liệu từ các kết quả xét nghiệm men gan.

Chẩn đoán viêm gan, xơ gan dựa trên kết quả xét nghiệm, các chỉ số xét nghiệm

Aminotransferase tăng từ 1,5 - 5 lần, thường dưới 10 lần giới hạn bình thường trên,

kéo dài từ 6 tháng trở lên. ALP và GGT tăng nhẹ, bilirubin, albumin và INR thường

bình thường trừ khi bệnh tiến triển hay nặng. Siêu âm, chụp cắt lớp hay chụp cộng

hưởng từ gợi ý tình trạng viêm gan mạn tính bằng các dấu hiệu thay đổi cấu trúc của

gan. Biểu hiện mô học của viêm gan mạn là sự thâm nhiễm tế bào viêm đơn nhân mà

chủ yếu là tế bào lympho ở khoảng ngưỡng cho phép [65].

Thông tin về dữ liệu bệnh gan được được trích từ hồ sơ bệnh án liên quan đến

kết quả xét nghiệm (sinh hóa máu và công thức máu) và chẩn đoán bệnh từ các bác sĩ

tại Bệnh viện Gang Thép và Bệnh viện Đa khoa Thái Nguyên. Sau khi thu được kết

quả xét nghiệm từ hồ sơ bệnh án của bệnh nhân,NCS thực hiện việc trích chọn những

thuộc tính liên quan đếnbệnh viêm gan. Cụ thể bao gồm các thuộc tính sau:

Bảng 1.2: Các thuộc tính dữ liệu đầu vào trong tập dữ liệu bệnh gan Liver

Số thứ tự 1 2 3 4 5 6 7 8 9

Thuộc tính Tuổi (Age) Giới tính (Gender) 3 AST ALT GGT Albumin TB DB DB/TB

Mô tả Tuổi tính đến ngày xét nghiệm 0: nam; 1: nữ Chỉ số men AST Chỉ số men ALT Chỉ số GGT Chỉ số Albumin Chỉ số Total Bilirubin Chỉ số Direct Bilirubin Tỷ số DB/TB

Tập dữ liệu bệnh gan thực nghiệm gồm 4156 bệnh nhân đến khám và điều trị

bệnh do rối loạn men gan. Trong số 4156 hồ sơ bệnh nhân, có 1202 hồ sơ bệnh nhân

được chuẩn đoán là mắc bệnh viêm gan.

1.5.3. Các độ đo đánh giá thực nghiệm

Mục đích: Các độ đo được sử dụng để đánh giá mô hình hệ suy diễn mờ phức

đối với hệ hỗ trợ ra quyết định. Với kết quả phân loại có:

- TP: số lượng mẫu của lớp Positive được phân loại đúng là Positive

- TN: số lượng mẫu của lớp Negative được phân loại đúng là Negative

- FP: số lượng mẫu của lớp Negative bị phân loại nhầm thành Positive

- FN: số lượng mẫu của lớp Positive bị phân loại nhầm thành Negative

• Độ chính xác (Accuracy): là tỉ lệ giữa số mẫu được phân loại đúng trên tổng số

Accuracy =

mẫu.

T N + T P T N + F N + F P + T P

(1.23)

• Độ đo Precision và Recall Chỉ số độ đo Precision và recall được tính theo công

precision =

thức sau:

T P T P + F P

recall =

(1.24)

T P T P + F N

(1.25)

• Thời gian thực hiện - Time(s): tổng thời gian thực hiện (giây) của hệ thống phân

loại

1.6. Kết Chương 1

Ra quyết định là một phần khá quan trọng của cuộc sống, do đó nhiều nhà

nghiên cứu đã đi tìm hiểu, ứng dụng với nhiều hướng tiếp cận khác nhau, với nhiều

kĩ thuật khác nhau. Mục tiêu của quá trình hỗ trợ ra quyết định là làm thế nào để có

thể đưa ra được quyết định cuối cùng một cách chính xác và đúng đắn nhất. Ngày

nay, với nhu cầu thực tiễn của cuộc sống và sự phát triển nhanh chóng của công nghệ

dẫn đến việc gia tăng về dung lượng cũng như tính không chính xác, không chắc chắn

của dữ liệu. Những vấn đề không rõ ràng, chính xác hay không chắc chắn này có thể

được biểu diễn bởi lý thuyết thống kê, xác suất hay lý thuyết mờ. Chính vì lí do đó

mà hướng tiếp cận mờ đang là một hướng nghiên cứu được nhiều nhà khoa học quan

tâm và chú ý, trong đó phải nói đến hướng tiếp cận theo hệ suy diễn mờ. Tuy nhiên,

các hệ suy diễn mờ thường xử lý với dữ liệu thực mà không thể đưa ra cách biểu diễn

phù hợp với những dữ liệu có thêm yếu tố chu kì, định kì hay có yếu tố bổ sung. Để

khắc phục hạn chế đó, Ramot đưa ra lý thuyết về CFS, hệ logic mờ phức. Và nhiều

nhà khoa học đã tiếp cận theo hướng CFS để xử lý đối với những lớp bài toán mà dữ

liệu có yếu tố, chu kì, định kì hay yếu tố bổ sung.

Do đó, trong khuôn khổ nội dung Chương 1, luận án đi trình bày tổng quan về

bài toán ra quyết định theo hướng tiếp cận hệ suy diễn mờ và tập trung vào tiếp cận

đối với các hệ thống mờ phức. Lý thuyết về CFS, về các hệ thống dựa trên lý thuyết

tập mờ phức cũng được trình bày trong nội dung chương này và sẽ là các kiến thức

nền và sử dụng trong các chương tiếp sau của luận án. Dựa vào những nghiên cứu đã

có, các hệ thống phát triển dựa trên lý thuyết CFS hầu như chưa có ý nghĩa phức thực

sự. Đó cũng chính là động lực định hướng nghiên cứu của luận án, bao gồm:

- Nghiên cứu các lý thuyết về tập mờ phức, logic mờ phức và độ đo dựa trên

tập mờ phức;

- Phát triển hệ suy diễn theo mô hình FIS dựa trên lý thuyết tập mờ phức;

- Nghiên cứu các phương pháp cải tiến hệ suy diễn dựa trên tập mờ phức đã đề

xuất.

Cuối chương, luận án cũng trình bày về các bộ dữ liệu thực nghiệm cũng như

thước đo dùng để đánh giá thực nghiệm trong các chương tiếp sau của luận án.

Chương 2. XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI (M-CFIS)

2.1. Giới thiệu

Logic mờ là một nhánh của lý thuyết tập hợp mờ với mục đích bắt chước suy

nghĩ và lý luận của con người nhằm tăng hiệu quả của quá trình ra quyết định khi xử

lý sự không chắc chắn hoặc dữ liệu mơ hồ. Hệ thống suy diễn mờ (FIS) có thể được

định nghĩa như là một ánh xạ phi tuyến tính kết quả của nó dựa trên suy luận mờ. Sự

phát triển với tốc độ nhanh của tập mờ đã dẫn đến sự phát triển của FIS bao gồm các

FIS được sử dụng phổ biến nhất, đó là hệ thống Mamdani, Sugeno và Tsukamoto. Kể

từ khi ra đời, FIS đã được ứng dụng thành công trong nhiều bài toán thực tế. Nhiều

nghiên cứu sử dụng hệ suy diễn mờ để giải quyết bài toán hệ hỗ trợ ra quyết định nhằm

giúp cho những nhà ra quyết định đưa ra những quyết định chính xác và phù hợp.

Nhiều nhà nghiên cứu đã phát triển hệ suy diễn mờ theo mô hình mờ Mamdani,

hệ ANFIS và đồng thời đưa ra ứng dụng đối với nhiều vấn đề, bài toán thực tế như:

đánh giá rủi ro môi trường[66], chẩn đoán bệnh [67, 68], bài toán nâng cao độ tương

phản của ảnh [69], đánh giá hiệu suất của công ty [70] hay

Thêm nữa, các hệ thống ANFIS dựa trên Mamdani và ứng dụng của nó cũng

được nhiều nhà khoa học nghiên cứu và giới thiệu. Borkar và cộng sự [71] áp dụng

mô hình ANFIS trên hệ FIS Mamdani trong việc phát triển hệ thống giám sát hiệu

suất cho thiết bị trao đổi nhiệt dạng ống, đồng thời hệ thống cũng được đánh giá là

hiệu quả hơn so với ANFIS thông thường. Nhóm tác giả Chai và Zhang [72] đưa ra

mô hình ANFIS dựa trên Mamdani và ứng dụng chúng cho việc đánh giá mức độ lưu

lượng giao thông. Tác giả cũng chứng minh được rằng mô hình này vượt trội hơn về

thời gian tính toán so với mô hình ANFIS thường và sai số thử nghiệm ít hơn.

Mặc dù FIS được sử dụng rộng rãi, nhưng hầu hết các hệ FIS đều là thực

nghiệm tính toán của các hệ mờ cơ bản như Mamdani FIS, Sugeno FIS hay Tsukamoto

FIS trên miền số thực. Tuy nhiên, trong thực tế, nhiều kết quả có thể có những biến

động không mong muốn, nhiều kịch bản mà cần có các yếu tố bổ sung tới dữ liệu

hay những loại dữ liệu có xu hướng tuần hoàn, chẳng hạn như lượng mưa được ghi lại

trong một khu vực hoặc những thông tin bổ sung tác động vào quá trình chẩn đoán

bệnh. Do đó, hiển nhiên là cần phải có phương pháp nhằm mục đích thể hiện những

thông tin bổ sung, những thông tin có yếu tố chu kì, định kì. Năm 2002, khi Ramot

đưa ra lý thuyết về CFS [36, 44] thì tác giả đã đưa ra khái niệm pha để biểu diễn các

thông tin bổ trợ, thông tin có yếu tố thời gian hay thông tin về yếu tố chu kì, định kì

đối với dữ liệu. Ưu điểm của CFS là khả năng mô hình hóa các hiện tượng và sự kiện

theo thời gian, theo giai đoạn để từ đó có thể cho thấy tổng thể chúng trong một ngữ

cảnh nhất định.

Hệ logic mờ phức đầu tiên được giới thiệu Ramot[44] là hệ phát triển từ hệ

thống logic mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến

đổi phức tương ứng của nó. Một nghiên cứu khác bởi Man và cộng sự [45] dựa trên

sự kết hợp giữa phương pháp học quy nạp với hệ suy diễn trong tập phức. Một phiên

bản học nhúng khác với mạng mờ nơ ron trên tập CFS với tên gọi Hệ thống suy diễn

mờ phức nơ ron thích nghi (ANCFIS) được giới thiệu bởi Chen và công sự [46]. Sau

đó, hai cải tiến về tốc độ tính toán của hệ ANCFIS do nhóm tác giả Yazdanbakhsh và

Dick được cũng được giới thiệu trong [48, 54].

Tuy nhiên, các hệ thống phát triển dựa trên tập mờ phức đã có đều chưa thực

sự đúng với ý nghĩa của hệ thống suy diễn mờ phức thực sự. Hầu hết các hệ thống đều

sử dụng tập mờ phức làm biến đầu vào nhưng các nghiên cứu đều chỉ sử dụng thành

phần biên độ trong quá trình ra quyết định mà bỏ qua thành phần pha. Ví dụ như hệ

logic mờ phức của Ramot [44] thì bỏ qua thành phần pha trong giải mờ kết quả đầu

ra, làm cho hệ thống không đủ yếu tố khi xử lý với dữ liệu chuỗi thời gian của các yếu

tố có sự lặp lại hoặc xảy ra định kì, và điều này làm giảm đi ý nghĩa của mô hình hệ

suy diễn mờ phức, trở thành hệ suy diễn mờ thường. Còn mô hình ANCFIS của Man

và Chen [46] thì sử dụng phép tích vô hướng vec tơ cho quá trình tổng hợp kết quả,

và coi các giá trị đầu vào phức như là các giá trị thực, do đó nó thu được một giá trị

vô hướng đối với phép tích vô hướng. Điều này có thể sẽ không thực hiện được nếu

các đầu vào thực sự là các giá trị phức, vì tích vô hướng của hai số phức là một giá trị

phức chứ không phải là một giá trị vô hướng. Do đó hệ thống ANCFIS không thực sự

là hệ thống phức khi đầu ra của hệ thống không thể đại diện cho tính tuần hoàn của

các thành phần trong đó.

Bên cạnh đó, các nghiên cứu về hệ FIS thường như Mamdani, Sugeno, Tsukamoto

hay các phiên bản khác nhau của kiến trúc ANFIS chỉ có thể xử lý các hiện tượng

không theo chu kỳ hoặc không có yếu tố bổ sung. Còn khi giảiquyết đối với những bài

toán có dữ liệu có yếu tố thời gian, có yếu tố chu kì, định kì thì các hệ mờ, hệ ANFIS

hay các hệ thống mờ phức đã có thường chỉ đưa ra hai phương thức xử lý chung: thứ

nhất là bỏ qua thông tin liên quan đến yếu tố thành phần pha; thứ hai là biểu diễn

thành phần biên độ và pha riêng biệt với nhau thành hai thành phần riêng biệt bằng

cách sử dụng hai tập mờ. Điều này sẽ làm cho thông tin bị mất mát và kết quả thu

được không có độ tin cậy cao (nếu các thông tin về thành phần pha bị bỏ qua) hay làm

sai lệch thông tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và pha được

xử lý riêng biệt). Và cuối cùng thì thời gian tính toán sẽ tăng thêm do số lượng các bộ

cần được xử lý tăng thêm.

Dựa trên các nghiên cứu đã có về việc phát triển mô hình hệ suy diễn mờ

Mamdani và dựa trên mô hình Hệ logic mờ phức do Ramot đề xuất, luận án đề xuất

lựa chọn mô hình hệ suy diễn mờ Mamdani là mô hình chi tiết cho Module Suy diễn

mờ phức Hệ logic mờ phức của Ramot. Do đó, trong khuôn khổ nội dung chương này,

luận án đề xuất Hệ suy diễn mờ phức theo mô hình mờ Mamdani và chi tiết các thành

phần trong hệ thống. Thêm vào đó, luận án cũng đề xuất các toán tử t-chuẩn, t-đối

chuẩn mờ phức nhằm mục đích bổ sung thêm lý thuyết đối với tập mờ phức.

2.2. Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức

Trong lôgic mờ khái niệm t-chuẩn và t-đối chuẩn đóng vai trò khá quan trọng

trong việc tổng quát hóa các toán tử kết hợp and, or và đóng góp cơ bản cho lập luận

xấp xỉ đối với những tình huống thông tin thiếu chính xác, chưa đầy đủ trong hệ hỗ

trợ ra quyết định. Chính vì lí do đó, trong nội dung Chương 2 này, luận án đề xuất

các phép toán t-chuẩn và t-đối chuẩn dựa trên lý thuyết tập mờ phức và minh họa ứng

dụng vào trong việc giải bài toán hỗ trợ ra quyết định

2.2.1. Toán tử t-chuẩn và t-đối chuẩn

Toán tử t-chuẩn và t- đối chuẩn đóng một vai trò quan trọng đối với việc xây

dựng các phép toán của lý thuyết mờ. Sau đây, một vài khái niệm cơ bản về phép toán

t-chuẩn và t-đối chuẩn được giới thiệu như là tiền đề để phát triển toán tử đó trên lý

thuyết tập mờ phức.

Định nghĩa 2.1 ([73, 74]). Một hàm T : [0, 1] × [0, 1] → [0, 1] được gọi là hàm t-chuẩn

nếu nó thỏa mãn bốn điều kiện sau:

(i) T (1, x) = x với mọi x,

(ii) T (x, y) = T (y, x) với mọi x, y,

(cid:48)

, y

(iii) T (T (x, y) , z) = T (x, T (y, z)) với mọi x, y và z,

(cid:48)và y ≤ y

(cid:48) thì T (x, y) ≤ T (cid:0)x

(cid:48)(cid:1).

(iv) Nếu x ≤ x

Bốn T-norm cơ bản

(1) Tmin(x, y) = min(x, y);

(2) TP (x, y) = xy

(3) TL(x, y) = max(x + y − 1, 0)

min(x, y) nếu max(x, y) = 1

TD(x, y) =

0, nếu max(x, y) < 1

(4) (cid:40)

Định nghĩa 2.2 ([73, 74]). Một hàm S : [0, 1] × [0, 1] → [0, 1]được gọi là phép t-đối

chuẩn nếu nó thỏa mãn bốn điều kiện sau đây:

(i) S (0, x) = x với mọi x,

(ii) S (x, y) = S (y, x) với mọi x, y,

(cid:48)

, y

(iii) S (S (x, y) , z) = S (x, S (y, z)) với mọi x, y và z,

(cid:48)và y ≤ y

(cid:48) thì S (x, y) ≤ S (cid:0)x

(cid:48)(cid:1).

(iv) Nếu x ≤ x

Bốn T-đối chuẩn cơ bản

(1) Smax(x, y) = max(x, y);

(2) SP (x, y) = x + y − xy

(3) SL(x, y) = min(x + y, 1)

max(x, y) nếu min(x, y) = 0

SD(x, y) =

1, nếu min(x, y) (cid:54)= 0

(4) (cid:40)

2.2.2. Toán tử t-chuẩn và t-đối chuẩn mờ phức

Dựa trên lý thuyết về phép toán t-chuẩn và t-đối chuẩn, nội dung này luận án

đề xuất phát triển các phép toán đó trên lý thuyết của tập mờ phức. Cụ thể như sau:

Định nghĩa 2.3. Cho ánh xạ J : [0, 1] × [0, 1] → [0, 1]với [0, 1] là mặt phẳng đơn vị

phức chứa tập hợp các số phức. Phép J được gọi là phép t-chuẩn mờ phức nếu các

điều kiện sau thỏa mãn đối với mọi giá trị p, q, r ∈ [0, 1], với p, q, r tương ứng là các

hàm thuộc mờ phức p = p1ejω1, q = q1ejω2, r = r1ejω3

(i) J (p, q) = J (q, p),

(ii) J (p, q) ≤ J (p, r), nếu q ≤ r,

(iii) J (p, J (q, r)) = J (J (p, q) , r),

(iv) J (p, 1) = p.

Định nghĩa 2.4. Cho ánh xạ J ∗ : [0, 1] × [0, 1] → [0, 1]với [0, 1] là mặt phẳng đơn vị

phức chứa tập hợp các số phức. Phép J ∗ được gọi là phép t-đối chuẩn mờ phức nếu

các điều kiện sau thỏa mãn đối với mọi giá trị p, q, r ∈ [0, 1], với p, q, rtương ứng là

các hàm thuộc mờ phức p = p1ejω1, q = q1ejω2, r = r1ejω3

(i) J ∗ (p, q) = J ∗ (q, p),

(ii) J ∗ (p, q) ≤ J ∗ (p, r) nếu q ≤ r,

(iii) J ∗ (p, J ∗ (q, r)) = J ∗ (J ∗ (p, q) , r),

(iv) J ∗ (p, 0) = p.

p ∈ (0, 1) thì nó được gọi là hàm toán tử t-chuẩn mờ phức Archimedean. Nếu một toán

Định nghĩa 2.5. Nếu hàm t-chuẩn mờ phức J (p, q) liên tục và |J (p, p)| < p với mọi

tử t-chuẩn mờ phức Archimedean tăng chặt với mọi p, q ∈ (0, 1) thì nó được gọi là toán

tử t-chuẩn mờ phức Archimedean chặt.

Định nghĩa 2.6. Nếu hàm t-đối chuẩn mờ phức J ∗ (p, q) liên tục và |J ∗ (p, p)| < p với

mọi p ∈ (0, 1) thì nó được gọi là hàm toán tử t-đối chuẩn mờ phức Archimedean. Nếu

một toán tử t-đối chuẩn mờ phức Archimedean tăng chặt với mọi p, q ∈ (0, 1) thì nó

được gọi là toán tử t-đối chuẩn mờ phức Archimedean chặt.

Ví dụ 2.1. Có thể mở rộng toán tử Zadeh sang toán tử T mờ phức như sau:

• J (p, q) = min (p, q),

1 (p, q) = max (p, q).

• J ∗

Ví dụ 2.2. Một vài toán tử T mờ phức sau:

• J2 (p, q) = p · q = p1 · q1e(w1+w2),

2 (p, q) = p + q − pq.

• J ∗

J (p, q) = max (cid:0)p + q − 1, 0(cid:1) = max (cid:0)p1 · ejω1 + q1 · ejω2 − 1.ej0, 0.ej0(cid:1)

Ví dụ 2.3. Cho 1 = 1.ej0 và 0 = 0.ej0, toán tử t-chuẩn mờ phức Lukasiewics là:

= max

(p1 + q1 − 1) · ej(ω1+ω2), 0.ej0(cid:17)

= [(p1 + q1 − 1) ∨ 0] · ej[(ω1+ω2)∨0]

= [(p1 + q1 − 1) ∨ 0] · ej[(ω1+ω2)]

(cid:16)

= min

J ∗ (p, 0) = min (cid:0)p1 + q1, 1(cid:1) = min (cid:0)p1 · ejω1 + q1 · ejω2, 1.ej0(cid:1) (p1 + q1) · ej(ω1+ω2), 1.ej0(cid:17)

= [(p1 + q1) ∧ 1] · ej(ω1+ω2)∨0

= [(p1 + q1) ∧ 1] · ej(ω1+ω2)

(cid:16)

Định lý 2.1. Toán tử T-chuẩn J và T- đối chuẩn J ∗ phải thỏa mãn các tính chất sau:

J (p, J ∗ (q, r)) = J ∗ (J (p, q) , J (p, r)),

J ∗ (p, J (q, r)) = J (J ∗ (p, q) , J ∗ (p, r))

(i) Tính chất phân phối:

J (J ∗ (p, q) , p) = p,

J ∗ (J (p, q) , p) = p,

(ii) Tính nuốt:

J (p, p) = p,

J ∗ (p, p) = p.

(iii) Tính lũy đẳng:

1 (p, q) = max (p, q) thì ta có:

Bổ đề 2.1. Giả sử J1 (p, q) = min (p, q)và J ∗

Tính chất phân phối → tính nuốt →tính lũy đẳng→ { J=J1 J∗ = J ∗ 1

Định nghĩa 2.7. Cho N : [0, 1] × [0, 1] → [0, 1], N được gọi là hàm phủ định nêú nó

thỏa mãn tính chất sau:

• N (0) = 1, N (1) = 0,

• N (p) ≤ N (q) khi p ≥ q.

Định nghĩa 2.8. Hàm phủ định N được coi là chặt nếu nó thỏa mãn điều kiện: N là

hàm liên tục và giảm chặt tức là N (p) < N (q) nếu p > q với mọi p, q ∈ [0, 1]

p với mọi p ∈ [0, 1]

Định nghĩa 2.9. Hàm phủ định N được coi là mạnh nếu thỏa mãn điều kiện N (N (p)) =

Ví dụ 2.4. Toán tử phủ định Zadeh có thể được chuyển sang toán tử phủ định phức

như sau: N (p) = 1 − p.

Định lý 2.2. Toán tử t-chuẩn J, toán tử t-đối chuẩn J ∗ và toán tử phủ định phải thỏa

mãn các luật sau:

N (J (p, q)) = J ∗ (N (p) , N (q)) ,

N (J ∗ (p, q)) = J (N (p) , N (q)) ,

(i) Luật De Morgan:

(ii) Luật loại trừ trung bình: J (p, N (p)) = 0 và J ∗ (p, N (p)) = 1.

Bổ đề 2.2. Nếu toán tử phủ định N là mạnh thì hai điều kiện về luật loại trừ trung

bình trong định lý 2.2 là tương đương.

Bổ đề 2.3. Nếu toán tử phủ định N là mạnh thì

• J (p, q) = N (J ∗ (N (p) , N (q))),

• J ∗ (p, q) = N (J (N (p) , N (q))).

2.2.3. Ví dụ minh họa hỗ trợ ra quyết định

Trong phần này, luận án trình bày về ứng dụng toán tử t-chuẩn và t-đối chuẩn

trong quá trình hỗ trợ ra quyết định, quá trình gồm các bước sau:

Bước 1. Xây dựng ma trận ra quyết định mờ

Giả sử vấn đề hỗ trợ ra quyết định với m phương án Υ (i = 1, 2, ..., m) và n

Γ = (yik)m×n trong đó yik thể hiện mức độ mà người ra quyết định thích phương án Υi đối với tiêu chí Λk. Trọng số của tiêu chí được diễn tả bởi các số mờ phức CFNs

tiêu chí Λk (k = 1, 2, ..., n). Người ra quyết định đi xây dựng ma trận ra quyết định

αk =

µαkej(ωαk)(cid:17)

, (k = 1, 2, ..., n), với µαk là thành phần biên độ hay mức độ thích

(cid:16)

của người ra quyết định đối với tiêu chí Λk và ωαklà thành phần pha.

D = (λik)m×n, với

, i = 1, ..., m; k = 1, ..., n

λik =

yik

yik max ∀i,k

Bước 2. Biến đổi ma trận quyết định Γ = (yik)m×n thành ma trận chuẩn hóa

Bước 3. Sử dụng các toán tử trong ví dụ 2.3 để tính toán t-chuẩn mờ phức

Lukasiewicz

Bước 4: Tổng hợp các cấp độ thuộc phức.

Bước 5: Xem xét điểm cao nhất là ứng cử viên cho thứ hạng tốt nhất.

Ví dụ số trên bộ dữ liệu thực bệnh Viêm gan thu thập ở Bệnh viện Gang

thép Thái Nguyên và Bệnh viện đa khoa Thái Nguyên. Những bệnh nhân này đến

Bệnh viện để kiểm tra chức năng chức năng gan theo 8 chỉ số, bao gồm AST, ALT,

AST/ALT, GGT, Albumin, Total Bilirubin, Direct Bilirubin trực tiếp, DB/TB. Dựa

trên các kết quả này, bác sĩ có thể yêu cầu bệnh nhân thực hiện các xét nghiệm bổ

sung nhằm cải thiện kết quả chẩn đoán.

Bước 1. Tiến hành xây dựng ma trận ra quyết định mờ dựa vào bộ dữ liệu.

Theo ý kiến các chuyên gia chuyên ngành trong quá trình chẩn đoán bệnh viêm

gan, bốn tiêu chí cơ bản thường được sử dụng, xem xét khi đưa ra quyết định gồm các

tiêu chí sau:

Tiêu chí 1 (C1): Chỉ số AST và ALT tăng và AST cao hơn ALT

Tiêu chí 2 (C2): Chỉ số Albumin giảm trong khi AST và ALT tăng

Tiêu chí 3 (C3): Tỷ lệ DB/TB nhỏ hơn 20%

Tiêu chí 4 (C4): Tỷ lệ DB/TB trong khoảng 20-50%

Các yêu cầu kiểm tra (kí hiệu E1, E2 và E3) sau cần thực hiện:

E1: Kiểm tra HbsAg, HbeAg và viêm gan C

E2: Kiểm tra chức năng gan gồm PT, APTT và tỷ lệ INR

E3: Xét nghiệm Hemolysis

Đầu tiên, dựa vào ý kiến của chuyên gia chuyên ngành khi thực hiện chẩn đoán

bệnh viêm gan và dựa vào tình hình khảo sát thực tế của các bệnh nhân khi đi khám

bệnh chẩn đoán có bị viêm gan hay không, ma trận ra quyết định tương ứng với các

tiêu chí và yêu cầu thực hiện các xét nghiệm kiểm tra của bác sĩ đối với bệnh nhân,

ma trận ra quyết định đối với vấn đề chẩn đoán bệnh viêm gan được mô tả trong Bảng

Bảng 2.1: Ma trận ra quyết định dựa trên các mẫu dữ liệu

C1 C2 C3 C4 0.5 0.8 0.2 0.2 0.3 0.7

0.5 0.8 0.5

0.2 0.6 0.9

E1 E2 E3

2.1.

Từ bảng ma trận ra quyết định trên các mẫu dữ liệu, ta tiến hành mờ hóa sử

dụng hàm mờ Gauss đối với dữ liệu có dạng tương ứng với phần thực và phần ảo như

Re(Gauss) = exp

sau: (cid:104) (cid:1)2(cid:105)

Im(Gauss) = − exp

−0.5(cid:0) x−m σ (cid:104) −0.5(cid:0) x−m σ

× (cid:0) x−m σ2

(cid:1)2(cid:105) (cid:1)

Do đó, ma trận kết quả thu được như trong Bảng 2.2.

Trong đó Ai, Pi tương ứng là giá trị biên độ và giá trị pha của tiêu chí Ci.

Bảng 2.2: Ma trận quyết định mờ

A1 0.9727 0.9727 0.9809

P1 -6.44E-14 0.0899 0.0154

A2 0.9727 0.9727 0.9727

P2 0.1798 -1.87E-11 0.1798

A3 0.9727 0.9920 0.9727

P3 0.0830 0.0391 -1.85E-06

A4 0.9997 0.9999 0.9997

P4 0 0.0014 0.0028

Vectơ trọng số của các tiêu chí thu được: ((0.5, 0.4) , (0.6, 0.3) , (0.3, 0.4) , (0.2, 0.6)).

Bước 2: Tiến hành chuẩn hóa ma trận ra quyết định mờ

(cid:48)

(cid:48) A

i =

Ai max{Ai,i=1,...,n} ; P

max{Pi,i=1,...,n} với mọi i = 1, ..., n.

Chuẩn hóa ma trận quyết định mờ theo công thức sau:

Bảng 2.3: Ma trận chuẩn hóa

A1 0.9730 0.9728 0.9812

P1 0.0000 1.0000 0.0857

A2 0.9730 0.9728 0.9730

P2 1.0000 0.0000 1.0000

A3 0.9730 0.9921 0.9730

P3 0.4616 0.4349 0.0000

A4 1.0000 1.0000 1.0000

P4 0.0000 0.0156 0.0156

Kết quả thu được ma trận quyết định chuẩn hóa như Bảng 2.3 sau:

Bước 3. Tính toán t-chuẩn mờ phức

Sử dụng toán tử trong ví dụ 2.3 để tính t-chuẩn mờ phức Lukasiewicz, và tổng

Bảng 2.4: Ma trận quyết định mờ

A1 0.9458 0.9386 0.9541

P1 0.1952 0.6951 0.2808

A2 0.8988 0.9188 0.8588

P2 1.6667 0.6667 1.6667

A3 0.8986 0.9479 0.8886

P3 0.6879 0.4441 0.2264

A4 0.9505 0.9807 0.9531

P4 0.0077 0.0154 0.0231

hợp các giá trị thu được kết quả là một ma trận quyết định mờ (Bảng 2.4) sau:

Bước 4. Tổng hợp các cấp độ thuộc phức

Giải mờ kết quả trong Ma trận quyết định mờ, ta thu được ma trận quyết định

cuối cùng có trong Bảng 2.5.

Bước 5. Dựa vào bảng ma trận quyết định kết quả, các kiểm tra yêu cầu tương

ứng được chọn là các giá trị lớn nhất (giá trị bôi đậm) trong mỗi tiêu chí.

Kết quả từ ví dụ số đối với toán tử t-chuẩn, t-đối chuẩn mờ phức trong bài toán

hệ hỗ trợ ra quyết định đã được bác sĩ xác minh kết quả yêu cầu kiểm tra là hợp lý. Từ

Bảng 2.5: Ma trận quyết định kết quả

C3 0.7 0.8 0.95

C1 0.9 0.45 0.5

C2 0.92 0.97 0.5

C4 0.94 0.8 0.89

E1 E2 E3

đó, ta có thể thấy rằng việc áp dụng các toán tử t-chuẩn và t-đối chuấn mờ phức trong

việc hỗ trợ ra quyết định đã cho vấn đề quá trình ra quyết định được giải quyết đơn

giản và hiệu quả.

2.3. Hệ suy diễn mờ phức Mamdani (M-CFIS)

2.3.1. Đề xuất hệ suy diễn mờ phức Mamdani

Như trong tìm hiểu về hệ thống logic mờ phức do Ramot đề xuất [44] dựa trên

lý thuyết tập mờ phức thì nhóm tác giả mới chỉ đưa ra mô hình hệ thống logic mờ phức

tổng quát mà không chỉ rõ cụ thể từng bước trong mô hình. Và do Ramot và cộng sự

chỉ đưa ra mô hình về hệ logic tổng quát chứ chưa đưa ra cụ thể về hệ FIS nào sử dụng

trong hệ thống logic mờ phức đó. Thêm nữa, trong hầu hết các giai đoạn của hệ thống

logic mờ phức đều bỏ qua thành phần pha, đầu vào vẫn chủ yếu là các giá trị số thực.

Như vậy, hệ thống logic mờ phức này vẫn chưa thể nắm bắt được các yếu tố liên quan

đến thời gian (thông tin liên quan đến điều kiện pha).

Với mục đích chi tiết cụ thể hóa cho Module suy diễn mờ phức trong hệ logic

mờ phức do Ramot đề xuất [44] theo một mô hình suy diễn từ hệ FIS truyền thống

(cụ thể hệ FIS Mamdani), NCS đề xuất hệ thống suy diễn mờ phức Mamdani, đây

cũng được coi là mô hình suy diễn mờ phức đầu tiên phát triển từ hệ FIS truyền thống

Mamdani. Do mục đích là phát triển của hệ suy diễn mờ Mamdani trên tập mờ phức

cho nên trong mô hình đề xuất sẽ thay thế, sử dụng các toán tử và hàm sao cho phù

hợp đối với dữ liệu có yếu tố định kì, chu kì, có các tham số hỗ trợ và tập mờ phức.

Còn phần cấu trúc của mô hình đề xuất thì tương tự như mô hình tổng quát về hệ logic

mờ phức của Ramot đưa ra 2003, nhưng việc lựa chọn các toán tử, phương pháp giải

mờ sẽ khác so với mô hình hệ logic mờ phức của Ramot. Hình 2.1 sau sẽ mô tả rõ mô

hình chung của hệ suy diễn mờ phức Mamdani (M-CFIS).

Hình 2.1: Mô hình hệ suy diễn mờ phức Mamdani

2.3.2. Các lựa chọn sử dụng trong hệ suy diễn mờ phức Mamdani

Trước khi đi vào cụ thể các bước xây dựng hệ suy diễn Mamdani dựa trên tập

mờ phức, các lựa chọn đối với mô hình hệ suy diễn mờ phức Mamdani được đề xuất

gồm có: hàm thuộc mờ phức, phương pháp xác định độ tăng trưởng luật và toán tử tổ

2.3.2.1 Hàm thuộc mờ phức

hợp. Cụ thể như sau:

Trong các hệ thống phát triển dựa trên lý thuyết tập mờ phức đã có thường sử

dụng hàm thuộc Gause và hàm Sin. Tuy nhiên, với mục đích xây dựng Hệ suy diễn

mờ phức Mamdani là sự khái quát từ hệ suy diễn mờ thường Mamdani tức hàm thuộc

phải đảm bảo sao cho giá trị µ (x) ∈ [0, 1]. Và hệ thống đề xuất phải đảm bảo theo

mô hình tổng quát của hệ logic mờ phức của Ramot nên hàm thuộc mờ phức có dạng

hàm thuộc mờ phức có sẵn như trong mô hình hệ logic mờ phức của Ramot, cụ thể

như sau: µ (x) = r (x) .eiω(x) với thành phần pha ω (x) ∈ (0, 2π] and thành phần biên

độ r (x) ∈ [0, 1].

2.3.2.2 Các toán tử sử dụng trong hệ M-CFIS

Trong mô hình hệ M-CFIS, các toán tử được xác định như sau:

• Toán tử T- chuẩn Minimum được sử dụng để tính toán độ mạnh của luật mờ

phức với phép toán AND được dùng để liên kết các điều kiện của luật

• Toán tử T-đối chuẩn Maximum được sử dụng để tính toán độ mạnh của luật mờ

phức với phép toán OR được dùng để liên kết các điều kiện luật

• Luật kéo theo Mamdani được dùng để tính toán kết quả của mỗi luật mờ phức

(cid:17)

(cid:16) ωA(x)

i2π

2π . ωB (y)

2π

sử dụng phép tích vô hướng có dạng như sau:

µA→B (x, y) = (rA (x) .rB (y)) .e

(2.1)

Ở đây, phép tích vô hướng đối với các vector giá trị phức là phép toán khái quát

hóa của phép tích vô hướng với các vector giá trị thực. Thêm nữa, phép tích

T-chuẩn được sử dụng như trong ngữ cảnh hệ suy diễn Mamdani thường. Chú ý:

2.3.2.3 Vec tơ tổ hợp đối với tập mờ phức

độ mạnh của luật và hệ quả của các luật mờ phức là các giá trị phức.

Ramot và cộng sự [44] giới thiệu một hàm tổng hợp mới gọi là tổng hợp vectơ

cho phép kết hợp các luật mờ phức bằng cách xem xét cả các điều kiện pha của chúng.

Đầu ra được tổng hợp theo nguyên tắc: nếu tất cả các đối số của thành phần pha là

bằng nhau thì thành phần biên độ được lấy giá trị cực đại; còn nếu các thành phần pha

không bằng nhau thì thành phần biên độ có thể được lấy nhỏ hơn giá trị ban đầu. Còn

trong mô hình ANCFIS của Man và cộng sự [46] thì vector tổng hợp là phép tích vô

hướng độ mạnh của luật và hàm thuộc mờ phức tương ứng với mỗi tập mờ phức tuy

nhiên chỉ thực hiện trên các giá trị thực.

Trong mô hình mờ phức Mamdani đề xuất, chúng tôi trọng tâm chú ý đến phát

triển hệ suy diễn với ý nghĩa phức thực sự tức là trong quá trình thực hiện suy diễn

luật thì cả hai thành phần pha và biên độ đều được quan tâm chú ý đến trong suốt quá

trình ra quyết định. Do vậy, chúng tôi coi phép toán tổ hợp là phép tích vô hướng giữa

(cid:48)

wp.µAp (x) = wp.µAp (x) (cid:17) (cid:16)

các vector giá trị phức có dạng như sau:

(cid:48) p

rAp (x) e−iωAp (x)(cid:17)

peiω

(cid:16)

(cid:17)

(cid:48)

(cid:48) p−ωAp (x)

= r

(cid:48)

i prAp (x) e (cid:16)

(cid:16)

= r

+ i sin

prAp (x)

p − ωAp (x)

2.3.2.4 Tổng hợp đầu ra cuối cùng

(cid:16) (cid:17) (cid:16)(cid:16) (cid:17)(cid:17)(cid:17) cos

Với mục đích có thể đảm bảo rằng mô hình suy diễn mờ phức Mamdani được

khái quát hóa từ hệ FIS Mamdani thì cần phải điều chỉnh các số phức theo đúng cách

mà hệ FIS Mamdani thực hiện với số thực.

Do vậy, chúng tôi đề xuất hàm đầu ra như sau:

D (y) = Γ1 (y) + Γ2 (y) + ... + Γk (y)

(2.2)

với Γp (y) là các hàm giá trị phức.

Bằng cách này có thể đảm bảo rằng hệ thống đề xuất hệ suy diễn mờ phức thực

sự, trong đó thành phần pha được xem xét trong tất cả các bước của quá trình ra quyết

định.

2.3.3. Cấu trúc của hệ suy diễn mờ phức Mamdani

Giống như hệ suy diễn mờ Mamdani thì vấn đề tính toán kết quả đầu ra thông

qua mô hình hệ suy diễn mờ phức Mamdani cũng bao gồm sáu bước. Cụ thể từng

bước như sau:

Bước 1: Xác định tập các luật mờ phức

CF R1: If xm(1,1) is A1,1 O1,1 xm(1,2) is A1,2 O1,2 . . . O1,n1−1 xm(1,n1) is A1,n1 then y is

CF R2: If xm(2,1) is A2,1 O2,1 xm(2,2) is A2,2 O2,2 . . . O2,n2−1 xm(2,n2) is A2,n2 then y is

Xuất phát từ bộ dữ liệu, hệ luật mờ phức được xây dựng có dạng như sau:

CF Rk: If xm(k,1) is Ak,1Ok,1 xm(k,2) is Ak,2 Ok,2 . . . Ok,nk−1 xm(k,nk) is Ak,nk then y is

...

Trong đó:

(a) m (p, q) ∈ {1, 2, ..., n} với 1 ≤ m (p, 1) < m (p, 2) < ... < m (p, np) ≤ n

Ở phần này, giả thiết chúng ta không nhất thiết phải có n giá trị đầu vào của

CFIS xuất hiện trong 1 luật mờ phức. Với mỗi giá trị (p, np) được coi là số lượng đầu

vào trong luật thứ p (CF Rp). Giá trị đầu vào có thể đề cập đến np giá trị np đầu vào

từ x1, x2..xn chứ không nhất thiết tất cả các giá trị từ x1, x2..xnp. Đó là lí do chúng tôi

viết xm(p,1), xm(p,2), ..., xm(p,np) để xác định một cách ngẫu nhiên np giá trị từ n giá trị

(cid:1) eiωAp,q (xm(p,q)), (cid:1) = rAp,q (b) µAp,q

đầu vào trong tất cả các luật mờ phức. (cid:0)xm(p,q) (cid:0)xm(p,q) với rAp,q : C → [0, 1]và ωAp,q : C → (0, 2π].

(c) µCp (y) = rCp (y) eiωCp (y) , với rCp : C → [0, 1] và ωCp : C → (0, 2π]. (d) T0 là toán tử T-chuẩn vàS0 là toán tử S-chuẩn (ví dụ như T-đối chuẩn) tương

ứng với T0.

(e) fp : (0, 2π]np → (0, 2π] ,với fp (2π, 2π, ..., 2π) = 2π (f) ωp = τpeiψp,

Trong đó:

(cid:1)(cid:1) (cid:0)rAp,1 (cid:1) , rAp,2 (cid:0)xm(p,1) (cid:0)xm(p,2) (cid:0)xm(p,np)

ψp = fp

(cid:1)(cid:1) ..., rAp,np (cid:1)(cid:1). (cid:0)...Np,2 (cid:0)xm(p,1) (cid:0)xm(p,2) (cid:0)xm(p,3) (cid:0)xm(p,3) (cid:0)xm(p,np) (cid:1)(cid:1) , rAp,3 (cid:1) , ..., ωAp,np

(cid:0)Np,1 τp = Np,np−1 (cid:0)ωAp,1 (cid:1) , ωAp,2 (cid:1) , ωAp,3 (i) Op,q = and khi và chỉ khi Np,q = T0

(ii) Op,q = or khi và chỉ khi Np,q = S0

Tương tự như với hệ FIS thường thì việc chọn toán tử T0 tùy thuộc vào ngữ

cảnh và vấn đề được nghiên cứu. Hơn nữa để giữ được tính tổng quát hóa lên từ hệ (cid:1) là giá trị thực với ∀q thì giá trị wp Mamdani FIS, bất cứ khi nào giá trị µAp,q (cid:0)xm(p,q)

cũng là giá trị thực. Do đó, giới hạn của hàm fp (2π, 2π, ..., 2π) = 2π.

Bước 2: Mờ hóa dữ liệu đầu vào

Trong bước này mỗi giá trị dữ liệu đầu vào được mờ hóa bởi hàm thuộc mờ

µAp,q

(cid:1) eiωAp,q (am(p,q)) với ∀p, q phức có dạng sau: (cid:0)am(p,q) (cid:0)am(p,q)

(cid:1) = rAp,q Bước 3: Xác định độ mạnh của luật

Mỗi luật mờ phức sẽ được xác định giá trị độ mạnh của luật, hay còn gọi là độ

tăng trưởng luật và được tính toán theo công thức sau: wp = τpeiψp.

Trong đó:

(cid:1) (cid:1) , rAp,2 (cid:0)rAp,1 (cid:0)xm(p,2) (cid:0)xm(p,1) (cid:0)xm(p,np)

ψp = fp

(cid:1)(cid:1) , ...rAp,np (cid:1)(cid:1). (cid:1) , ωAp,3 (cid:0)Np,1 (cid:1) , ωAp,2 (cid:0)xm(p,3) (cid:0)...Np,2 (cid:0)xm(p,1) (cid:0)xm(p,3) (cid:0)xm(p,np)

(cid:1)(cid:1) , rAp,3 τp = Np,np−1 (cid:1) , ..., ωAp,np (cid:0)xm(p,2) (cid:0)ωAp,1 Bước 4: Tính toán các kết quả đầu ra y của luật mờ phức Chọn hàm U0 : [0, 1]2 → [0, 1]với U0 (1, 1) = 1, và hàm g0 : (0, 2π]2 → (0, 2π]

với g0 (2π, 2π) = 2π

Dạng của hàm đầu ra tương ứng đối với mỗi luật mờ phức CF Rp được tính

theo công thức: Γp (y) = U0 (cid:0)τp, rCp (y)(cid:1) eig0(ψp,ωCp (y))

Ở bước này thì việc chọn hàm U0 và g0 tùy thuộc vào ngữ cảnh và vấn đề nghiên cứu. Ví dụ, chúng ta có thể chọn Γp (y) = (cid:0)τp, rCp (y)(cid:1) ei(ψp−ωCp (y)) = wp · µCp (y) với phép “.” được định nghĩa là phép tích vô hướng phức.

Bước 5: Tổng hợp kết quả đầu ra của các luật mờ phức

Phân bố đầu ra được định nghĩa như sau: D (y) = Γ1 (y) + Γ2 (y) + ... + Γk (y) Với D = F (C, C)

Mục đích sử dụng phép toán tổng hợp là để tính toán đến sự tác động của thành

phần trong các dữ liệu đầu vào một cách được chính xác nhất.

Bước 6: Giải mờ kết quả đầu ra Chọn hàm φ : F (C, C) → C, giá trị đầu ra được xác định bởi: yop = φ (D)

(cid:82) ∞ −∞ y|D(y)|dy −∞ |D(y)|dy sử dụng luật hình thang (cid:82) ∞

Ví dụ chúng ta có thể chọn xấp xỉ φ (D) =

đối với mọi f ∈ F (R, R).

2.3.4. Ví dụ số minh họa mô hình suy diễn M-CFIS

Để minh họa rõ hơn về mô hình M-CFIS đề xuất, trong nội dung phần này,

luận án trình bày một ví dụ số trên bộ dữ liệu chuẩn Benchmark WBCD.

Giả sử với bộ dữ liệu đầu vào có 10 bản ghi, 9 thuộc tính với 2 nhãn đầu ra như

bảng 2.6 sau:

Bước 1: Sinh luật mờ phức

Để sinh luật mờ phức từ bộ dữ liệu đầu vào, ta thực hiện tuần tự theo từng bước

Bảng 2.6: Bộ dữ liệu đầu vào

ST T Nhãn A1 A2 A3 A4 A5 A6 A7 A8 A9 1 1 1 5 1 1 1 4 1 2

1 2 3 4 5 6 7 8 9 10

5 3 8 2 4 2 5 8 7 10

2 2 10 1 1 1 3 9 1 10

2 1 10 1 2 1 3 7 4 7

2 1 10 1 1 1 3 5 6 7

2 1 8 1 1 1 3 10 4 6

3 3 9 1 2 2 4 5 4 4

1 1 7 1 1 1 4 5 3 1

2 2 1 2 2 2 1 1 1 1

2 2 7 2 2 2 2 7 6 4

- Đầu tiên, ta thực hiện sinh phần thực và phần ảo cho dữ liệu đầu vào:

Đối với từng bản ghi đầu vào, với từng giá trị thuộc tính, việc sinh phần thực

và ảo cho dữ liệu được thực hiện theo suy tắc sau: Phần thực được lấy chính giá trị gốc

đầu vào của thuộc tính; phần ảo được tính bằng cách tính tổng phương sai theo cột và

theo hàng (Var.R(bản ghi) + var.A(thuộc tính)).

- Tiếp theo, sử dụng thuật toán FCM để thực hiện phân cụm dữ liệu theo từng

thuộc tính và từ đó có thể sinh nhãn ngôn ngữ.

- Xây dựng bộ luật ban đầu và thực hiện việc giảm luật trùng để được bộ luật

cơ sở.

Bảng 2.7: Bộ cơ sở luật

L VL

ST T Nhãn A1 A2 A3 A4 A5 A6 A7 A8 A9 M VL VL VL VL VL VL VL L H VH VH H H VH VH H VL VL VL VL VL VL VL VL VL M L VL VL VL VL VL VL VL VL VL VL VL VL VL VL VL VL VL L M L VL M L L VH H

L H M L VH M VL

1 2 3 4 5 6 7

2 1 2 2 2 1 1

Kết quả của quá trình trên, ta thu được bộ luật cơ sở như bảng 2.7:

Bước 2: Mờ hóa dữ liệu

Thực hiện mờ hóa dữ liệu sử dụng hàm mờ Gausse như sau:

(xp,q −cq)2 2δ2

−

− e

(xp,q −cq)2 2δ2

(xp,q −cq) δ2

(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)

(cid:12) (cid:12) (cid:12) +i (cid:12) (cid:12) (cid:12)

µAp,q (xp,q) = e

Giả sử có bộ dữ liệu test sau: X1 = (5, 1, 1, 1, 2, 1, 3, 1, 1)

Ta thực hiện mờ hóa dữ liệu bằng cách sử dụng hàm mờ Gausse trên thì thu

được kết quả là các giá trị mờ hóa tương ứng với mỗi thuộc tính của bộ X1 như

(1.000, 0.1448) ; (0.9995, 0.0075); (1.000, 0.0768); (1.000, 0.1452)

sau: (1.000, 0.1279) ; (1.000, 0.0776); (1.000, 0.0517);(1.000, 0.0016); (0.9998, 0.1571);

Bước 3: Tính toán trọng số của luật

Ta thực hiện tính lần lượt trọng số đối với từng luật trong bộ luật cơ sở:

Re (R1) = M in (1.0000, 1.0000, 1.0000, 1.0000, 0.9998, 1.0000, 0.9995, 1.0000, 1.0000)

= 0.9995.

Im (R1) = M in (0.1279, 0.0776, 0.0517, 0.0016, 0.1571, 0.1448, 0.0075, 0.0768, 0.1452)

= 0.0016.

Ví dụ với luật 1, ta có:

ω1 = 0.9995e0.0016.

Vậy, đối với luật 1 ta tính được trọng số của bản ghi test với luật 1 như sau:

Tương tự, ta tính được trọng số của bản ghi với 6 luật còn lại.

Bước 4: Tổng hợp kết quả đầu ra

ωizi

yop =

ωi

7 (cid:80) i=1 7 (cid:80) i=1

Ở đây ta chọn công thức Tính trung bình trọng số để tổng hợp kết quả đầu ra

(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)

Kết quả: yop = 2.0796 và nhãn đầu ra được gán cho bản ghi mới là 2.

2.3.5. Thử nghiệm và đánh giá kết quả

Chúng tôi thực nghiệm so sánh mô hình đề xuất M-CFIS với mô hình hệ suy

diễn mờ Mamdani (M-FIS) [66] trên môi trường Matlab 2014 và với cấu hình máy PC

VAIO Core i5. Kết quả thực nghiệm so sánh trên bộ dữ liệu chuẩn UCI và bộ dữ liệu

thực Liver lấy từ Bệnh viện Gang thép và đa khoa Thái Nguyên được mô tả rõ trong

Hình 2.2, 2.3 tương ứng với mỗi bộ dữ liệu chuẩn UCI và Hình 2.4 tương ứng với bộ

Hình 2.2: Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu WBCD

Hình 2.3: Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu Diebetes

dữ liệu thực Liver.

Từ kết quả thực nghiệm đã cho thấy mô hình M-CFIS được đề xuất tốt hơn mô

hình M-FIS trên các chỉ số độ chính xác, chỉ số Recall và Precision. Các mô hình được

phát triển trên lý thuyết tập mờ phức được đánh giá là mô hình xử lý hiệu quả đối với

lớp các bài toán mà có dữ liệu trong đó có yếu tố chu kì, định kì hay có yếu tố bổ sung

đối với dữ liệu. Chính vì lí do đó, đối với các dữ liệu bệnh thì mô hình M-CFIS cho

kết quả tốt hơn mô hình FIS Mamdani, bởi với kết quả đầu ra chẩn đoán bệnh thì việc

đánh giá kết luận cuối cùng không chỉ dựa vào một vài thông số giá trị thuộc tính bệnh

Hình 2.4: Kết quả chạy thực nghiệm so sánh trên Bộ dữ liệu thực Liver

đo được mà giữa các thông số giá trị thuộc tính bệnh đó còn có sự gắn kết lẫn nhau,

tác động lẫn nhau (được mô tả trong phần pha của tập mờ phức). Nói chung, tất cả các

chỉ số đánh giá trên mô hình M-CFIS đều tốt hơn M-FIS. Trong tất cả các trường hợp

thì độ chính xác của mô hình M-CFIS luôn lớn hơn khi thực hiện với mô hình M-FIS,

ví dụ như 90.69% và 85.062% đối với bộ dữ liệu WBCD, 85.386% và 75.061% trên

bộ dữ liệu Diebetes, và 83.683% và 80.569% trên dữ liệu thực Liver. Tuy nhiên, thời

gian thực hiện mô hình M-CFIS còn cao so với thời gian thực hiện mô hình M-FIS

bởi việc đánh giá thêm thành phần pha trong tập mờ phức trong tất cả các giai đoạn

của hệ thống.

2.4. Kết Chương 2

Chương 2 trình bày các kết quả nghiên cứu về hướng tiếp cận của luận án dựa

trên tập mờ phức. Nội dung trong chương bao gồm hai kết quả chính như sau:

i) Đề xuất toán tử t-chuẩn và t-đối chuẩn dựa trên lý thuyết tập mờ phức. Kết

quả này được công bố trong công trình [A1] phần “Danh mục các công trình của tác

giả”.

ii) Đề xuất mô hình hệ suy diễn mờ phức Mamdani dựa trên nền tảng lý thuyết

về tập mờ phức và mô hình hệ suy diễn mờ Mamdani. Trong mô hình đề xuất, NCS

cũng đưa ra từng bước thực hiện cũng như các thành phần cụ thể trong mô hình. Kết

quả này được công bố trong công trình [A2] phần “Danh mục các công trình”.

Để chứng minh tính hiệu quả của mô hình hệ suy diễn đề xuất, NCS tiến hành

thực nghiệm các thuật toán trên các bộ dữ liệu thử nghiệm từ kho dữ liệu UCI và dữ

liệu bệnh thực Liver được lấy từ Bệnh viện Gang Thép và Bệnh viện đa khoa Thái

Nguyên nhằm đánh giá tính hiệu quả của mô hình đề xuất so với mô hình hệ suy diễn

mờ Mamdani thường M-FIS. Kết quả thử nghiệm cho thấy, mô hình hệ suy diễn đề

xuất tốt hơn hệ suy diễn M-FIS trên các độ đo đánh giá độ chính xác, chỉ số Precision

và chỉ số Recall. Tuy nhiên thời gian thực hiện vẫn còn cao hơn do phải thực hiện tính

toán với cả phần biên độ và phần pha của tập mờ phức và hệ cơ sở luật chỉ thu được

theo cách thô sơ bằng cách bỏ đi các luật yếu, luật trùng nhau. Đây cũng chính là hạn

chế của mô hình đề xuất và động lực để tác giả thực hiện nghiên cứu và giải quyết

trong chương tiếp theo của luận án.

Chương 3. TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC MAMDANI (M-CFIS-R)

3.1. Giới thiệu

Giảm số lượng luật mờ đang là một trong những vấn đề cần thiết trong việc

kiểm soát độ phức tạp của các mô hình mờ truyền thống. Chính vì thế mà một số các

kĩ thuật giảm luật mờ đã và đang được nghiên cứu và phát triển. Ví dụ như tiêu chí

entropy được đề xuất để thiết lập một cấu trúc mô hình mờ đơn giản bằng cách giảm

thiểu sự tương tác giữa các luật mờ [75] và số lượng luật mờ trong cùng điều kiện

được xác định bằng cách sử dụng các tiêu chí không thiên vị. Một chiến lược cắt tỉa

luật và hợp nhất luật dư thừa được đề xuất để giảm các luật mờ dư thừa trong nghiên

cứu [76], và sử dụng các thuật toán di truyền để trích xuất các luật mờ được nhóm tác

giả nghiên cứu và đề xuất.

Một số phương pháp biến đổi trực giao cũng được thảo luận và đưa ra trong

các nghiên cứu [77, 78]. Phương pháp tối ưu hóa tỷ lệ đa chiều và hạn chế phi tuyến

được sử dụng để xây dựng một mô hình mờ chính xác với cấu trúc đơn giản và minh

bạch [79]. Witold Pedrycz [80] đã giới thiệu hệ thống dựa trên luật mờ tiếp cận theo

tính toán hạt. Tác giả cho rằng vấn đề tinh giảm luật mờ có thể thực hiện được thông

qua việc tối ưu phân phối hạt thông tin giữa các tập mờ. Các tập mờ ban đầu sẽ được

thu gọn bằng cách diễn tả theo hạt thông tin tương ứng với nó và được biểu diễn theo

tập mờ giá trị khoảng, tập mờ loại hai hay tập thô mờ.

Hatem Bellaaj và cộng sự [81] đưa ra phương pháp giảm luật mờ bằng cách đề

xuất độ đo tương tự giữa các luật mờ để loại bỏ các luật có độ tương đồng cao, sau đó

tác giả thực hiện thuật toán nội suy để tính toán giá trị đầu ra cho hệ thống suy diễn

TSK. Jun Wang và cộng sự [82] đề xuất một mô hình suy diễn mờ Takagi-Sugeno đa

nhiệm gọi là mtSparseTSK, trong đó nhóm tác giả xem xét việc giảm luật mờ bằng

cách đưa ra các quy định về độ thưa của nhóm tiêu chí trong mô hình.

Tóm lại, các nghiên cứu trên đều đưa ra phương pháp để giảm số luật của mô

hình mờ nhưng thường chỉ áp dụng cho các mô hình tập mờ thông thường và thường

chỉ kết hợp với các kĩ thuật như phân rã hay nội suy. Ý tưởng cơ bản đều là hợp nhất

các tập mờ tương đồng nhau và tạo ra một tập luật cơ sở mới. Số lượng luật của các

nghiên cứu đều đã được giảm đáng kể, tuy nhiên việc đánh giá hiệu quả hay độ chính

xác của mô hình cũng bị giảm đi khá nhiều. Chính vì lí do đó, trong nội dung chương

này luận án đề xuất phương pháp giảm luật mờ bằng cách đề xuất ra các độ đo tương

tự và kết hợp độ đo với tính toán hạt để đưa ra hệ luật mới.

Các nghiên cứu liên quan đến độ đo mờ phức

Độ đo mờ phức đã được nhiều nhà khoa học chú ý và nghiên cứu ứng dụng

trong hệ hỗ trợ ra quyết định. Hầu hết các độ đo mờ phức chủ yếu tập trung theo các

hướng: một số lượng tập con nhất định của tập hợp cổ điển và một độ đo giá trị thực

(theo lý thuyết Choquet), lý thuyết độ đo mờ và lý thuyết cổ điển của số mờ phức, khái

niệm độ đo khoảng cách và độ đo tương tự.

Trong những năm 1991-1992, Buckley [58, 59] đã đưa ra khái niệm về số phức

mờ và nhu cầu cần giải quyết về vấn đề độ đo và tích phân trên số phức mờ. Dựa

trên khái niệm số phức mờ của Buckley mà nhóm tác giả Wang và Li [83] đã định

nghĩa hàm giá trị phức mờ và độ đo mờ giá trị phức mờ tương ứng với với tích phân

Lebesgue tổng quát của hàm có giá trị phức mờ. Hơn nữa, họ cũng đưa ra những tính

chất cơ bản và định lý hội tụ liên quan đến tích phân Lebesgue. Bên cạnh đó, bằng

cách sử dụng các hàm có giá trị phức mờ và độ đo mờ có giá trị phức mờ, nhóm tác

giả Jang và Kim cũng giới thiệu tích phân Choquet đối với một độ đo mờ giá trị phức

của một hàm độ đo giá trị phức mờ [84] và hàm độ đo có giá trị thực [85]. Trong

nghiên cứu đó, nhóm tác giả cũng củng cố lý thuyết độ đo đề xuất bằng bổ sung thêm

một số lý thuyết và định lý trên số phức mờ.

Ở một hướng nghiên cứu khác, dựa trên lý thuyết độ đo mờ và lý thuyết cổ điển

về số phức mờ, năm 2009 Ma và cộng sự [86] đã đưa ra định nghĩa và các tính chất

của độ đo phức mờ. Sau đó, họ đưa ra định nghĩa của hàm phức mờ và độ đo phức

mờ, đồng thời cũng thảo luận nghiên cứu sâu hơn về các tính chất cơ bản của hàm độ

đo phức mờ. Năm 2012, Chen và cộng sự [87] đã nghiên cứu định lý mờ phức của các

hàm độ đo và đưa ra lý thuyết hội tụ của những hàm này. Kết quả thu được từ nghiên

cứu này đã tạo ra nền tảng nhất định cho lý thuyết tích phân phức mờ.

Cũng dựa trên khái niệm về độ đo giá trị phức mờ, nhóm tác giả, Zhao và Ma

[88] định nghĩa độ đo mờ giá trị phức mờ và hàm độ đo giá trị phức mờ trên tập phức

mờ. Bên cạnh đó Ma và cộng sự [87] cũng đưa ra khái niệm về tích phân Choquet và

giới thiệu phương pháp thiết kế mới đối với việc phân loại tích phân giá trị mờ phức.

Nhóm tác giả Ma và Li đã mở rộng độ đo giá trị phức mờ dựa trên lý thuyết

về độ đo cổ điển và đưa ra định nghĩa về khoảng cách phức mờ và độ đo mờ phức giá

trị mờ phức trên trường số phức mờ [89]. Nhóm tác giả cũng đưa ra một số tính chất

quan trọng của độ đo mờ phức giá trị phức mờ. Theo một hướng nghiên cứu khác, Ma

và cộng sự lại đưa ra khái niệm độ đo mờ phức khác với khái niệm phức mờ đã có

trong nghiên cứu [88] bằng việc phân biệt giữa phần thực và phần ảo trong số phức

mờ. Dựa trên độ đo mờ phức giá trị mờ phức, nhóm tác giả Ma và Li [90] tập trung về

vấn đề hội tụ của tích phân mờ phức giá trị mờ phức. Sau đó, tác giả Ma kết hợp cùng

Zhao [91] đưa ra khái niệm và các thuộc tính về hàm giá trị tập phức và tích phân giá

trị tập mờ phức.

Hướng nghiên cứu cuối cùng là độ đo mờ phức dựa trên độ đo khoảng cách

và độ đo tương tự. Vào năm 2009, nhóm tác giả Zhang và cộng sự của mình [63] đã

δ giữa các tập mờ phức và minh họa độ đo đề xuất trên bộ dữ liệu tín hiệu số. Bên

đề xuất khoảng cách mờ giữa hai tập mờ phức và từ đó định nghĩa về phép cân bằng

cạnh đó, nhóm Alkouri và Salleh [64] cũng giới thiệu các giá trị ngôn ngữ trên tập

mờ phức. Trong nghiên cứu này nhóm tác giả cũng đưa ra một số độ đo khoảng cách

trên tập mờ phức và ứng dụng trong một số bài toán hệ hỗ trợ ra quyết định, dự báo

và phát hiện mẫu ... để đưa ra phương án tối ưu.

Trong một nghiên cứu khác về hệ hỗ trợ ra quyết định đối với những dữ liệu

không chắc chắn và dữ liệu mờ, nhóm tác giả Garg và Rani [37] đã đề xuất độ đo thông

tin trên tập mờ trực cảm phức. Cũng trên lý thuyết tập mờ trực cảm phức, nghiên cứu

của Ngan và cộng sự [92] trình bày biểu diễn bộ bốn và các độ đo khoảng cách trên

tập mờ trực cảm phức, sau đó áp dụng đối với bài toán hỗ trợ chẩn đoán bệnh. Các

công thức tính toán biểu diễn bộ bốn và các độ đo khoảng cách này được dùng để biểu

diễn mối quan hệ giữa bệnh nhân và bệnh trong mô hình chẩn đoán bệnh mà nhóm

tác giả đề xuất.

Độ đo khoảng cách khác được phát triển dựa trên độ đo khoảng cách Euclidean

và Harmming đã được Dai và cộng sự [93] trình bày trên tập mờ phức giá trị khoảng

(IvCFS). Nghiên cứu cũng đưa ra ví dụ minh họa đối với độ đo được đề xuất trong bài

toán hỗ trợ ra quyết định. Một nghiên cứu khác trên tập Neutrosophic phức (CNS),

Mondal và cộng sự [94] giới thiệu các độ đo tương tự và độ đo tương tự có trọng số

trên tập CNS. Những độ đo được đề xuất cũng được đưa vào ứng dụng trong mô hình

dùng để xếp hạng thứ tự ưu tiên của các ứng viên và từ đó có thể quyết định chọn ra

được ứng viên tốt nhất. Việc áp dụng độ đo trong mô hình hỗ trợ ra quyết định này

được đánh giá cao vì trong mô hình đã xem xét đến sự tương tác giữa các thuộc tính

trong tập dữ liệu cũng như tính không xác định của dữ liệu.

Tổng quan về tính toán hạt

Tính toán hạt (Granular Computing - GrC) là một mô hình xử lý thông tin đang

phát triển trong trí tuệ nhân tạo và các hệ thống tập trung vào con người. Tính toán

hạt ban đầu được gọi là hạt thông tin hoặc kết hạt thông tin có liên quan đến nghiên

cứu bộ mờ (Zadeh 1979) và xuất hiện vào năm 1996 trong bài báo của Zadeh [95].

Tuy nhiên, thuật ngữ tính toán hạt lần đầu tiên được đề xuất bởi Lin [96] là một mô

hình điện toán tổng hợp có hiệu quả trong giải quyết các phần tử và các hạt, các tập

con tổng quát mơ hồ. Mục tiêu tính toán hạt là xây dựng một mô hình tính toán hiệu

quả để xử lý dữ liệu, thông tin và kiến thức với lượng rất lớn.

Mô hình tính toán hạt được các nhà khoa học quốc tế quan tâm và đã có nhiều

ứng dụng được công bố. Năm 2002, Yao và Zhong [97] đã xem xét một số nghiên

cứu hiện có về tính toán hạt không mờ và đề xuất một mô hình tính toán hạt dựa trên

các bảng thông tin. Năm 2013, Yao và Pedrycz [98] đưa ra một cách nhìn khái quát

về quan điểm và các thách thức của tính toán hạt. Đồng thời các tác giả cũng đề xuất

các hướng nghiên cứu có liên quan đến tính toán hạt trong tương lai. Theo đó, về mặt

kỹ thuật, tính toán hạt sẽ được tiếp cận theo hướng lý thuyết tập mờ và tập thô. Các

phương pháp lai ghép sẽ là ưu thế lớn khi sử dụng tính toán hạt trong xử lý thông tin.

Pedrycz và cộng sự trình bày các ứng dụng khác nhau của tính toán hạt trong

nghiên cứu [99]. Các ứng dụng khác được kể tới trong công trình này là ứng dụng của

tính toán hạt trong tin y, trong học máy và trong khai phá dữ liệu. Như vậy, tính toán

hạt quan tâm bởi nhiều nhà khoa học và được cải tiến mô hình trong ứng dụng thuộc

nhiều lĩnh vực khác nhau. Mô hình tính toán hạt được sử dụng trong các bài toán phân

lớp dữ liệu [100]. Trong nghiên cứu này, Artiemjew đưa ra mô hình phân lớp dựa vào

cấu trúc hạt. Kết quả mô phỏng cho thấy phân lớp dựa vào tính toán hạt có hiệu quả

cao hơn các phương pháp phân lớp đã có. Butenkov và cộng sự [101] xây dựng mô

hình tính toán hạt trên không gian affine và xây dựng các độ đo tương ứng. Mô hình

này được sử dụng trong các bài toán nhận dạng mẫu và phân tích dữ liệu thông minh.

Đồng thời nó cũng được sử dụng trong các thuật toán xử lý dữ liệu đa chiều hiệu quả.

Bên cạnh đó, tính toán hạt còn là một cách tiếp cận tính toán với từ ngữ (một

cách tiếp cận khác là tính toán với số). Những ý tưởng cơ bản về hạt thông tin đã xuất

hiện trong các lĩnh vực liên quan, như phân tích khoảng cách, lý thuyết tập hợp, phân

tích cụm, ra quyết định, học máy, cơ sở dữ liệu ... Một kỹ thuật mới được đề xuất trong

việc giải quyết các bài toán liên quan đến việc xử lý và hiểu các hình ảnh số [101].

Với nghiên cứu này, tác giả tập trung vào đồ họa và các ảnh số. Từ kết quả đề xuất, tác

giả cũng đưa ra ý tưởng cho các nghiên cứu về các kỹ thuật mới liên quan đến xử lý

ảnh trong tưởng lai. Năm 2016, Filippo Maria Bianchi và cộng sự đã đề xuất các kỹ

thuật tính toán hạt để phân loại và mô tả đặc trưng ngữ nghĩa của dữ liệu có cấu trúc

[102]. Trong đề xuất của mình, nhóm tác giả giới thiệu các kỹ thuật nhúng đồ thị, các

kỹ thuật tìm kiếm và các kỹ thuật khai phá đồ thị. Các kỹ thuật này chủ yếu dựa trên

một thủ tục tiền xử lý nhằm ánh xạ tất cả các yếu tố đầu vào vào một đồ thị có nhãn

đầy đủ, hệ thống sẽ giải quyết vấn đề phân loại trong miền đồ thị.

Giải thuật tham lam được sử dụng kết hợp với tính toán hạt để giải các bài toán

liên quan đến xử lý dữ liệu hiệu quả với những bộ dữ liệu tự nhiên không đầy đủ [103].

Trong nghiên cứu [104] Yuping Zhang đề xuất kết hợp giữa tính toán hạt và lý thuyết

tập mờ. Các tác giả đã mở rộng logic hạt từ tập cổ điển sang tập mờ và các tập mờ trực

cảm và đề xuất một hàm mức độ đúng đắn dựa trên tập mờ trực cảm được đề xuất.

Tính toán hạt vẫn còn là lĩnh vực mới ở Việt Nam, các nhà nghiên cứu mới bắt

đầu tiếp cận theo hướng kết hợp tính toán hạt vào các kỹ thuật đã có với rất ít công bố

được đưa ra. Nhóm Ngô Thành Long, Trương Quốc Hùng và Witold Pedrycz [105]

cũng đã nghiên cứu việc sử dụng tính toán hạt kết hợp với phân cụm mờ trong phân

tích sinh học. Cụ thể trong nghiên cứu của mình, phương pháp phân cụm C-means

khả năng mờ (Fuzzy Possibilistic C-Means Clustering - FPCM) và tính toán hạt được

giới thiệu với mục đích để giải quyết bài toán trích chọn đặc trưng và phát hiện ngoại

lệ trong bài toán vi lượng DNA. Từ các nghiên cứu lý thuyết, phương pháp FPCM cải

tiến dựa trên tính toán hạt đuộc đề xuất. Các thử nghiệm đã được thực hiện trên 20 bộ

dữ liệu biểu diễn gen khác nhau và một phân tích so sánh với các phương pháp có liên

quan khác cũng được trình bày chi tiết.

Tóm lại, trong chương hai, luận án đã đề xuất phát triển một hệ suy diễn mờ

phức theo mô hình mờ Mamdani. Tuy nhiên, hệ thống đề xuất M-CFIS còn hạn chế

ở chính hệ cơ sở luật vì việc giảm luật chỉ thực hiện dựa vào việc tính toán độ mạnh

và yếu của luật. Thêm nữa hệ luật thu được trong mô hình M-CFIS vẫn có thể còn dư

thừa bởi trong mô hình chỉ thực hiện giảm luật trùng, luật yếu.

Dựa trên nghiên cứu về các độ đo mờ phức và tính toán hạt mà trong khuôn

khổ nội dung chương này luận án trình bày phương pháp tinh giảm hóa hệ luật của

M-CFIS bằng việc áp dụng tính toán hạt kết hợp với các độ đo tương tự để khắc phục

những nhược điểm của mô hình M-CFIS đã đề xuất trong Chương 2. Phương pháp đề

xuất có tổng số luật thu gọn hơn đáng kể và với độ chính xác cao hơn so với hệ thống

M-CFIS. Đồng thời trong quá trình thực hiện thì luôn có sự đánh giá hiệu quả của bộ

luật mới so với bộ luật đã có để từ đó đưa ra bộ luật tốt hơn với hiệu quả cao hơn bộ

luật cũ.

3.2. Đề xuất độ đo tương tự mờ phức

Độ đo tương tự được dùng để đánh giá mức độ tương tự giữa 2 đối tượng để

thực hiện các thao tác tiếp theo cho phù hợp với từng đối tượng. Trong phần này luận

án đề xuất 3 độ đo tương tự mờ phức cùng với trọng số tương ứng với các độ đo đó.

Cụ thể như sau:

3.2.1. Độ đo tương tự mờ phức Cosine

Độ đo tương tự giữa mờ phức Cosine là độ đo được tính toán bởi phép tích vô

hướng bên trong giữa hai vec tơ chia cho tích của hai độ dài vec tơ đó. Đó được coi

là cosin của góc giữa hai vec tơ biểu diễn hai tập mờ phức. Chúng tôi đề xuất độ đo

tương tự cosin giữa các tập mờ phức như sau:

Định nghĩa 3.1. Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x)

trong S với mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức

đều ∈ [0, 1].

S2 được định nghĩa theo công thức sau:

a1a2 + b1b2

n (cid:88)

Độ đo tương tự mờ phức Cosine (kí hiệu CFCSM) giữa hai tập mờ phức S1 và

CCF S =

1 n

k=1

(a1)2 + (b1)2.

(a2)2 + (b2)2

(3.1) (cid:113) (cid:113)

Với a1 = Re (cid:0)rS1 (x) ejωS1 (x)(cid:1); b1 = Im (cid:0)rS1 (x) ejωS1 (x)(cid:1); a2 = Re (cid:0)rS2 (x) ejωS2 (x)(cid:1); b2 = Im (cid:0)rS2 (x) ejωS2 (x)(cid:1)

Định lý 3.1. Cho hai tập mờ phức S1 và S2 thì độ đo tương tự mờ phức Cosine thỏa

mãn các tính chất sau:

(i) 0 ≤ CCF S (S1, S2) ≤ 1,

(ii) CCF S (S1, S2) = CCF S (S2, S1),

(iii) CCF S (S1, S2) = 1 khi và chỉ khi S1 = S2,

CCF S (S2, S).

(iv) Nếu S1 ⊂ S2 ⊂ S thì CCF S (S1, S) ≤ CCF S (S1, S2) và CCF S (S1, S) ≤

Chứng minh:

(i) Hiển nhiên ta luôn có 0 ≤ CCF S (S1, S2) ≤ 1 do tất cả các giá trị của hàm

cosine đều nằm trong khoảng từ 0 đến 1.

(ii) Điều đó là hiển nhiên và CCF S (S1, S2) = CCF S (S2, S1) luôn đúng.

(iii) Khi S1 = S2 thì ta luôn có CCF S (S1, S2) = 1.

Ngược lại, nếu CCF S (S1, S2) = 1 có nghĩa a1 = a2, b1 = b2. Do đó S1 = S2.

(iv) Cho S = rS (x) ejωS(x) và L1 = Re (cid:0)rS (x) ejωS(x)(cid:1) và L2 = Im (cid:0)rS (x) ejωS(x)(cid:1). Nếu S1 ⊂ S2 ⊂ S có nghĩa là ta có a1 ≤ a2 ≤ L1 và b1 ≥ b2 ≥ L2 (theo

định nghĩa 1.6 về thứ tự từng phần trong tập mờ phức). Do hàm cosine là hàm đơn

CCF S (S1, S) ≤ CCF S (S2, S).

điệu giảm trong khoảng [0, π/2] nên ta có thể viết CCF S (S1, S) ≤ CCF S (S1, S2) và

Định nghĩa 3.2. Độ đo tương tự Cosine mờ phức có trọng số (WCNCSM) Cho hai tập

mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x) trong S với mọi x ∈ X; thành

phần biên độ và thành phần pha của hai tập mờ phức đều ∈ [0, 1].

Một độ đo tương tự Cosine mờ phức có trọng số giữa hai tập mờ phức S1 và S2 được

định nghĩa như sau:

a1a2 + b1b2

n (cid:88)

 

CW CF S =

ωk

k=1

(a1)2 + (b1)2.

(a2)2 + (b2)2

(3.2)   (cid:113) (cid:113)

ωj = 1.

n (cid:80) k=1

với

3.2.2. Độ đo tương tự mờ phức Dice

Định nghĩa 3.3. Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x)

trong S với mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức

đều ∈ [0, 1].

Độ đo tương tự mờ phức Dice (kí hiệu CFDSM) giữa hai tập mờ phức S1 và S2

n (cid:88)

được định nghĩa theo công thức sau:

DCF S =

1 n

√ a1b1a2b2 2 a1b1 + a2b2

k=1

(3.3)

Với a1 = Re (cid:0)rS1 (x) ejωS1 (x)(cid:1); b1 = Im (cid:0)rS1 (x) ejωS1 (x)(cid:1); a2 = Re (cid:0)rS2 (x) ejωS2 (x)(cid:1); b2 = Im (cid:0)rS2 (x) ejωS2 (x)(cid:1)

Định lý 3.2. Cho hai tập mờ phức S1 và S2 thì các tính chất sau được thỏa mãn đối

với độ đo tương tự mờ phức Dice :

(i) 0 ≤ DCF S (S1, S2) ≤ 1,

(ii) DCF S (S1, S2) = DCF S (S2, S1),

(iii) DCF S (S1, S2) = 1 khi và chỉ khi S1 = S2,

DCF S (S2, S).

(iv) Nếu S1 ⊂ S2 ⊂ S thì ta có DCF S (S1, S) ≤ DCF S (S1, S2) và DCF S (S1, S) ≤

Chứng minh: tương tự như định lý 3.1.

Định nghĩa 3.4. Độ đo tương tự mờ phức Dice có trọng số (WCFDSM)

Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x) trong S với

mọi x ∈ X.

Một độ đo tương tự mờ phức Dice có trọng số giữa hai tập mờ phức S1 và S2

√

được định nghĩa như sau:

n (cid:88)

a1b1a2b2 √

DW CF S =

ωk

a1b1 +

a2b2

k=1

(cid:21) (cid:20) 2 √ (3.4)

ωj = 1.

n (cid:80) k=1

với

3.2.3. Độ đo tương tự mờ phức Jaccard

Định nghĩa 3.5. Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x)

trong S với mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức

đều ∈ [0, 1].

S2 được định nghĩa theo công thức sau:

n (cid:88)

√

Độ đo tương tự mờ phức Jaccard (kí hiệu CFJSM) giữa hai tập mờ phức S1 và

JCF S =

1 n

√ a1b1a2b2 (a1b1 + a2b2) − (cid:0)√

a1b1.

a2b2

k=1

(3.5) (cid:1)

Với a1 = Re (cid:0)rS1 (x) ejωS1 (x)(cid:1); b1 = Im (cid:0)rS1 (x) ejωS1 (x)(cid:1); a2 = Re (cid:0)rS2 (x) ejωS2 (x)(cid:1); b2 = Im (cid:0)rS2 (x) ejωS2 (x)(cid:1)

Định lý 3.3. Cho hai tập mờ phức S1 và S2 thì độ đo tương tự mờ phức Jaccard thỏa

mãn các tính chất sau:

(i) 0 ≤ JCF S (S1, S2) ≤ 1,

(ii) JCF S (S1, S2) = JCF S (S2, S1),

(iii) JCF S (S1, S2) = 1 khi và chỉ khi S1 = S2,

JCF S (S2, S).

(iv) Nếu S1 ⊂ S2 ⊂ S thì ta có JCF S (S1, S) ≤ JCF S (S1, S2) và JCF S (S1, S) ≤

Chứng minh: tương tự như định lý 3.1.

Định nghĩa 3.6. Độ đo tương tự mờ phức Jaccard có trọng số (WCFJSM)

Cho hai tập mờ phức S1 = rS1 (x) ejωS1 (x) và S2 = rS2 (x) ejωS2 (x) trong S với

mọi x ∈ X; thành phần biên độ và thành phần pha của hai tập mờ phức đều ∈ [0, 1].

S2 được định nghĩa như sau:

n (cid:88)

√

Một độ đo tương tự mờ phức Jaccard có trọng số giữa hai tập mờ phức S1 và

ωj

JW CF S =

√ a1b1a2b2 (a1b1 + a2b2) − (cid:0)√

a1b1.

a2b2

j=1

(3.6) (cid:1)

ωj = 1.

n (cid:80) k=1

với

3.3. Đề xuất mô hình hệ suy diễn M-CFIS-R

3.3.1. Ý tưởng xây dựng mô hình

Vấn đề thay đổi số lượng các luật và tối ưu luật trong hệ thống luật mờ được

coi là một vấn đề cần được quan tâm chú ý khi thiết kế một mô hình hệ suy diễn mờ.

Điều đó có thể giúp cho hệ thống suy diễn mờ làm việc hiệu quả hơn và kết quả chính

xác hơn. Do đó, rất cần phải có thước đo để đánh giá được tầm quan trọng của từng

luật mờ trong hệ luật mờ cơ sở.

Trong phần này NCS sử dụng ba độ đo tương tự mờ phức đã đề xuất trong Mục

3.2 để áp dụng trong giai đoạn Traning. Sau đó, tính toán hạt được kết hợp với các độ

đô mờ phức cũng được dùng trong bước cuối cùng của giai đoạn Training để giảm số

luật mờ phức có độ tương tự cao hoặc thêm vào bộ luật những luật có độ bao phủ lớn.

Kết quả của giai đoạn Training sẽ thu được một bộ luật mới với số lượng ít hơn và cho

kết quả phân loại cao hơn so với hệ luật mờ ban đầu.

Để thực hiện so sánh với mô hình hệ suy diễn mờ phức Mamdani (M-CFIS)

thì trong mô hình này NCS đề xuất bổ sung thêm giai đoạn Training để tạo ra bộ luật

mờ phức cơ sở và tối ưu bộ luật mờ phức cơ sở đó bằng cách sử dụng tính toán hạt kết

hợp với độ đo mờ phức. Giai đoạn Testing được thực hiện tiếp sau quá trình suy diễn

trong mô hình M-CFIS.

Mô hình M-CFIS-R đề xuất chia làm hai phần chính:

- Phần Training: được sử dụng để huấn luyện, sinh ra các luật mờ và tối ưu hệ

luật mờ sử dụng tính toán hạt kết hợp với độ đo mờ phức.

- Phần Testing: được sử dụng để kiểm tra việc thực hiện suy diễn trên hệ luật

mờ mới đã được tối ưu trong phần Training.

3.3.2. Phần Training

Trong phần này, bộ dữ liệu ban đầu được chia thành ba phần: Training –

Validation và Testing theo k-fold. Với dữ liệu trong phần Training, chúng tôi thực

hiện chia thành bộ dữ liệu dành cho phần thực và phần ảo (mục 3.3.2.1). Sau đó thuật

toán phân cụm mờ Fuzzy C-Means được áp dụng trên từng thuộc tính để phân thành

từng cụm tương ứng với mỗi nhãn ngôn ngữ trên thuộc tính đó. Cuối cùng sẽ thu được

một tập các luật, được coi như là bộ luật mờ phức ban đầu. Tập các luật mờ phức này

được thực hiện đánh giá trên bộ dữ liệu Validation, kí hiệu là bộ luật A (mục 3.3.2.2).

Sau đó, để tối ưu hóa hệ luật mờ phức A, các độ đo mờ phức đề xuất trong Mục

3.2 được dùng để tính toán độ tương đồng giữa các luật mờ phức. Tiếp theo, độ tương

tự giữa các luật mờ phức được xác định thông qua phương pháp tính toán hạt tương

ứng trên từng nhãn đối với bộ dữ liệu Validation (mục 3.3.2.3).

Cuối cùng, thực hiện đánh giá mô hình suy diễn trên bộ luật mờ phức mới (có

tên gọi là A’) trên bộ dữ liệu Validation trên cùng một module suy diễn (tương tự như

mục 3.3.2.2) . Nếu kết quả suy diễn trên bộ luật A’ tốt hơn trên bộ luật A thì giai đoạn

Training kết thúc và chuyển sang giai đoạn Testing; còn không thì tiếp tục lặp lại quá

trình tính toán sử dụng độ đo mờ phức theo tính toán hạt để huấn luyện lại và đưa ra

bộ luật mới khác.

Hình 3.1 sau mô tả rõ ràng giai đoạn Training của mô hình đề xuất.

t ấ u x ề đ h n ì h

ô m a ủ c g n i n i a r T n ạ o đ

i a i G

: 1 . 3

h n ì H

3.3.2.1. Chọn dữ liệu phần thực và phần ảo

Từ bộ dữ liệu Training, dữ liệu dành cho phần thực và phần ảo được xây dựng

theo nguyên tắc như sau :

- Phần dữ liệu thực : chính là giá trị dữ liệu ban đầu.

- Phần dữ liệu ảo trên mỗi bản ghi R của thuộc tính A được tính bằng công

thức sau : var.R(bản ghi)+ var.A(thuộc tính) với Var.R(dòng) là giá trị phương sai trên

3.3.2.2. Thuật toán phân cụm mờ FCM

dòng bản ghi thứ R và Var.A(thuộc tính) là giá trị phương sai trên thuoc tính A.

Trong phần này, thuật toán toán phân cụm mờ FCM được sử dụng để phân cụm

dữ liệu trong mỗi thuộc tính thành từng nhóm khác nhau, mỗi nhóm tương ứng với

một nhãn ngôn ngữ của nhóm đó. Số lượng các nhóm cho mỗi thuộc tính là khác nhau

tùy thuộc vào giá trị ngữ nghĩa của mỗi thuộc tính. Số lượng nhóm cho dữ liệu phần

thực và phần ảo là như nhau. Cuối cùng, chúng tôi đưa ra được các luật mờ dựa vào

các nhãn ngôn ngữ trong từng thuộc tính.

Thuật toán FCM

Algorithm 1 Thuật toán FCM

Input Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C; mờ hóa m;

ngưỡng ε; số lần lặp lớn nhất MaxStep > 0

Output Ma trận U và tâm cụm V

1: T = 0 2: Khởi tạo ngẫu nhiên u(t)

ukj = 1 với

kj ← random (cid:0)k = 1, N ; j = 1, C(cid:1) sao cho

C (cid:80) j=1

ukj ∈ [0, 1] và ∀k = 1, N

3: Lặp lại: 4: t = t + 1 5: Tính u(t)

; (cid:0)k = 1, N ; j = 1, C(cid:1)

kj =

(cid:33) 1

m−1

C (cid:80) i=1

6: Cho đến khi: (cid:13)

1 (cid:32) (cid:107)Xk −Vj(cid:107) (cid:107)Xk −Vi(cid:107) (cid:13)U (t) − U (t−1)(cid:13)

(cid:13) ≤ ε hoặc t > M axStep

3.3.2.3. Độ đo mờ phức tính toán hạt

Trong phần này, luận án mô tả cách xác định độ tương tự giữa các luật mờ phức

dựa trên mối tương quan của các luật (đã được mô tả trong phần đề xuất độ đo tương

tự mờ phức). Để thực hiện điều đó, ý tưởng dùng tính toán hạt được đề xuất ứng dụng

để đưa ra mối quan hệ trong việc kết nối các độ đo tương quan mờ.

Kết quả thu được của ba độ đo tương tự mờ phức là ba ma trận tương quan

D1, D2, D3). Sau đó, mức độ tương tự cuối cùng giữa các luật mờ phức được xác

với mỗi thành phần được coi là mối tương quan giữa cặp luật mờ phức (kí hiệu

định dựa vào phép tổ hợp sau:

Fij = a1D1

ij + a2D2

ij + a3D3 ij

(3.7)

Đối với mỗi nhãn, chúng tôi đi tính các giá trị a1(l), a2(l), ..., ae(l) để từ đó tính

Fij(l). Các hệ số tương ứng với mỗi nhãn được tính bằng công thức sau:

được giá trị độ tương tự giữa các luật mờ phức cuối cùng tương ứng với mỗi nhãn

|Dt/l| (cid:88)

(cid:16)

at(l) =

i=1

j=i+1

(3.8) (cid:17) ij/t |Dt/l|

Đối với mỗi luật ứng với nhãn khác thì giá trị Fij = 0. Cuối cùng, thu được hệ cơ sở

luật mờ phức chính là ma trận F . Một hệ cơ sở luật mờ phức mới được đưa ra bằng

cách loại bỏ những luật có độ tương đồng cao trong nhóm luật và tiếp theo sẽ thực

hiện đánh giá hiệu quả của hệ luật mới này. Trong trường hợp mà hiệu quả của cơ sở

luật mờ phức mà kém hơn thì ta quay trở lại bước trước để tính lại độ đo tương tự mờ

phức và tính toán hạt tiếp cho hệ cơ sở luật mới này. Quá trình này lặp lại cho đến khi

hiệu quả của hệ cơ sở luật mới này cao hơn bộ luật gốc hoặc độ chính xác của luật đối

với bất kì nhãn nào bằng 1.

Các bước chính quá trình tinh giảm luật trong hệ M-CFIS-R được thể hiện rõ

trong ví dụ sau:

R1, R3, R4 và ba luật R2, R5, R6 có nhãn 2 (k = 2).

R1: If x1 is Medium and x2 is High and x3 is High then k is 1

R2: If x1 is High and x2 is Low and x3 is Low then k is 2

R3: If x1 is Low and x2 is Medium and x3 is High then k is 1

R4: If x1 is Low and x2 is High and x3 is Medium then k is 1

R5: If x1 is High and x2 is Low and x3 is Medium then k is 2

Ví dụ: Cho bộ luật gồm có sáu luật mờ phức với ba luật có nhãn 1 (k = 1) là

R6: If x1 is Medium and x2 is Low and x3 is Low then k is 2

Sau khi sử dụng ba độ đo mờ phức để tính toán độ tương tự giữa sáu luật trên thì thu

được ba ma trận tương ứng như sau:

0.5 0.8 0.7 0.4 0.3

0.5

0.5 0.4 0.8 0.9

0.8 0.5

0.9 0.4 0.5

D1 =

0 0.7 0.4 0.9 0.4 0.8 0.4 0.5

0.5 0.3 0.7 0

 

0.3 0.9 0.5 0.3 0.7

                 

0 0.2

0.2 0.5 0.4 0.2 0.1 0.2 0.3 0.5 0.6 0

0.5 0.2

0.5 0.2 0.1

D2 =

0.4 0.3 0.5

0.2 0.3

 

0.2 0.5 0.2 0.2 0 0.1 0.6 0.1 0.3 0.5

0.5 0

                 

0.1 0.4 0.4 0.2 0.1

0.1

0.1 0.2 0.4 0.3

0.4 0.1

0.4 0.1 0.2

D3 =

0.4 0.2 0.4 0 0.2 0.4 0.1 0.2

0.2 0.1 0.3 0

 

0.1 0.3 0.2 0.1 0.3

                 

Sau đó, mối tương quan của từng ma trận với nhãn 1 và 2 được tính toán theo

= 0.8; a1

= 0.467; a1

= 0.4

= 0.8; a2

= 0.533; a2

= 0.333

2 = 0.5+0.4+0.5 2 = 0.5+0.6+0.5

3 = 0.4+0.4+0.4 3 = 0.4+0.3+0.3

1 = 0.8+0.7+0.9 a1 1 = 0.8+0.9+0.7 a2 Cuối cùng thu được ma trận F như sau:

công thức 3.8 và thu được các giá trị sau:

1.034 0.907

0 0.397

0 0

0 1.114

1.04 0

1.14 0

F =

0.563

0.51

0.29

0.926

 

0.657

0.926

                 

Qua ma trận F chúng ta có thể nhìn thấy rõ ràng độ tương tự cao giữa các cặp

luật đối với nhãn 1 và nhãn 2 tương ứng là R3 and R4, R2 và R6. Khi đó, sau khi giảm

R2, R5 với nhãn 2.

(cid:48)

luật có độ tương tự cao, ta thu được bộ luật cơ sở mới như sau:R1, R3 với nhãn 1, và

(cid:48) thu được là: luật R

1, R

3 với nhãn 1 và

(cid:48)

2, R

Lần lặp thứ 2: Tập luật mờ phức mới R

4 với nhãn là 2. Khi đó ma trận các độ đo tương ứng như sau  

(cid:48)

0 0.1

0.1 0.3 0.1 0.1 0.4 0

0 0.2

0.2 0.5 0.1 0.2 0.4 0

0 0.5

0.5 0.8 0.3 0.4 0.7 0

0.3 0.1

0.2

0.5 0.2

0.1

0.8 0.4

0.3

   

0.1 0.4 0.2

0.1 0.4 0.1

0.3 0.7 0.3

                       

Dựa vào kết quả thu được từ việc tính toán các độ đo mờ phức, hệ số mối tương

1 = 0.8

1 = 0.5

1 = 0.3

2 = 0.4

2 = 0.7

a(cid:48) 1 a(cid:48) 1

1 = 0.3 1 = 0.4

1 = 0.5; a(cid:48) 1 = 0.8; a(cid:48) 3 2 1 = 0.4; a(cid:48) 1 = 0.7; a(cid:48) 3 2 Ma trận F cuối cùng được tính như sau :

quan đối với các nhãn 1 và 2 thu được kết quả như sau:

0 0

0.98 0

0 0.81

F (cid:48) =

0.98

 

0.81

       

(cid:48)

Từ ma trận kết quả cuối cùng, độ tương tự giữa các luật mờ phức có cùng nhãn

1 và R

(cid:48) 3, R 2

(cid:48)

và độ tương tự cao nhất được chỉ rõ. Cụ thể các luật sau tương tự nhau: R

4. Cuối cùng bộ luật thu gọn mới gồm có R

1 với nhãn 1 và R

2 với nhãn 2.

và R

Tiếp theo đó cần xác định hiệu năng của bộ luật cơ sở mới này có tốt hơn bộ

luật cũ hay không? Ngay cả khi hiệu năng của bộ luật cơ sở mới này không tốt hơn bộ

luật đã có, chúng tôi vẫn dừng thuật toán bởi vì độ chính xác trong cả hai nhãn 1 và

2 đều là 1. Trong trường hợp này, để có được hiệu năng tốt nhất thì hệ M-CFIS-R sử

dụng luôn hệ cơ sở luật mờ phức ban đầu mà được sinh ra từ quá trình Training. Chính

điều này sẽ đảm bảo cho hệ thống M-CFIS-R trong trường hợp xấu nhất thì cũng sẽ

có hiệu năng tương đương với M-CFIS.

3.3.3. Phần Testing

Trong phần Testing, quá trình suy diễn tương tự như M-CFIS được thực hiện

để kiểm tra hiệu năng của hệ thống với bộ luật mờ phức mới thu được từ giai đoạn

Traning (quá trình suy diễn được mô tả rõ trong Hình 3.2). Cụ thể, từ dữ liệu Testing,

chúng tôi xây dựng dữ liệu cho phần thực và phần ảo. Sau đó sử dụng tập luật mờ phức

đã được giảm trong quá trình Training để đưa ra kết quả tương ứng với mỗi bản ghi

trong bộ dữ liệu Testing. Bằng cách sử dụng toán tử tổng hợp và giải mờ thì chúng tôi

thu được kết quả đầu ra tương ứng với các bản ghi đầu vào Testing. Cuối cùng, chúng

tôi đánh giá hiệu năng của mô hình trên các tham số: thời gian, độ chính xác, chỉ số

Hình 3.2: Giai đoạn Testing của mô hình M-CFIS-R đề xuất

Recall, chỉ số Precision và tổng số luật.

3.4. Thử nghiệm và đánh giá kết quả

Mục đích: thực nghiệm so sánh mô hình đề xuất M-CFIS-R với mô hình M-

CFIS ở Chương 2 nhằm mục đích đánh giá hệ thống sau khi thực hiện tinh giảm luật

trong hệ luật thu được của mô hình M-CFIS.

3.4.1. Kết quả thực nghiệm trên bộ dữ liệu UCI

Hình 3.3 mô tả rõ kết quả thực hiện chạy mô hình M-CFIS và M-CFIS-R trên

bộ dữ liệu đầu tiên WBCD. Độ chính xác của mô hình M-CFIS-R trên bộ dữ liệu

Training (Hình 3.3(a)) thì cao hơn độ chính xác của mô hình M-CFIS 1.2% và với

độ lệch chuẩn khá nhỏ (khoảng 0.02). Giá trị này đối với dữ liệu testing cũng cao

hơn 1.6% và độ lệch chuẩn SD là 0.01. Tương tự, giá trị Recall trong hình 3.3(b) của

M-CFIS-R trong cả dữ liệu Training và Testing đều cao hơn mô hình M-CFIS và với

độ lệch chuẩn nhỏ hơn 0.02. Giá trị độ đo Precision trong hình 3.3(c) của M-CFIS-R

cao hơn chút so với mô hình M-CFIS với độ lệch khá nhỏ (thậm chí độ lệch chuẩn

(a) Độ chính xác

(b) Chỉ số Recall

(d) Thời gian thực hiện

(e) Số lượng luật

Hình 3.3: Kết quả thực nghiệm trên bộ dữ liệu WBCD

trong dữ liệu Testing còn bằng 0).

Thời gian tính toán của mô hình M-CFIS-R (thể hiện trong hình 3.3(c)) cao

hơn chút so với thời gian chạy của M-CFIS, 0.25s trên dữ liệu Training và 0.41s trên

dữ liệu Testing. Do đó, có thể nói thời gian thực hiện của hai mô hình này là tương

đương nhau với số lượng luật trung bình của M-CFIS-R ít hơn 36 luật so với M-CFIS

(thể hiện trong hình 3(d)). Qua đó, có thể dễ dàng nhận thấy là số lượng luật của mô

hình M-CFIS-R thấp hơn khá nhiều so với mô hình M-CFIS.

Hình 3.4 thể hiện quá trình thực hiện suy diễn của M-CFIS-R và M-CFIS trên

bộ dữ liệu bệnh tiểu đường Diebetes. Giá trị của các chỉ số so sánh (hình 3.4(a, b)) đối

với mô hình M-CFIS-R cao hơn so với mô hình M-CFIS trên 1% với độ lệch chuẩn

khá nhỏ. Nhưng tổng thời gian tính toán của M-CFIS-R cao hơn M-CFIS 0.02 trên dữ

liệu Training và 0.086 trên dữ liệu Testing với độ lệch chuẩn tương ứng trên các bộ dữ

liệu cũng khá nhỏ. Như vậy cũng có thể coi như thời gian tính toán của M-CFIS-R là

tương đương với M-CFIS. Trong khi đó tổng số lượng luật của M-CFIS-R chỉ ít hơn

(a) Độ chính xác

(b) Chỉ số Recall

(d) Thời gian thực hiện

(e) Số lượng luật

Hình 3.4: Kết quả thực nghiệm trên bộ dữ liệu Diebetes

năm luật so với mô hình M-CFIS và có độ lệch chuẩn là 0.94

3.4.2. Kết quả thực nghiệm trên bộ dữ liệu thực

Trên các bộ dữ liệu thực, kết quả so sánh đánh giá phân loại của mô hình M-

CFIS-R đề xuất với mô hình M-CFIS được thể hiện trong hình 3.5. Hình 3.5 thể hiện

các chỉ số kết quả thực hiện của hai mô hình so sánh M-CFIS-R và M-CFIS trên bộ

dữ liệu bệnh Gan của bệnh viện Gang thép và bệnh viện Đa khoa Thái Nguyên. Từ

hình 3.5(a), chúng ta có thể thấy rõ độ chính xác khi chạy mô hình M-CFIS-R trên

bộ dữ liệu Training cao hơn 2.5% so với chạy mô hình M-CFIS. Hơn nữa, các chỉ số

Precision và Recall khi thực hiện mô hình M-CFIS-R (thể hiện ở hình 3.5(b),(c)) trên

cả dữ liệu Training và Testing đều cao hơn M-CFIS khoảng 2.2%.

Cho dù chỉ số Recall khi thực hiện mô hình M-CFIS trên bộ dữ liệu Testing

nhỏ hơn 0.4% so với mô hình M-CFIS nhưng với độ lệch chuẩn nhỏ (chỉ 0.03). Điều

này có thể dễ lí giải bởi nguyên nhân do sự giảm số luật chỉ rõ trong hình 3.5(e). Đối

với bộ dữ liệu bệnh Liver, số lượng luật trong M-CFIS-R ít hơn so với M-CFIS 69 luật.

Đó cũng chính là lí do mà tổng thời gian thực hiện của C-FIS-R nhiều hơn M-CFIS,

cụ thể là cao hơn 34.5s trong bộ dữ liệu training và 8.5s trên dữ liệu testing (thể hiện

trong hình 5(d)). Độ lệch chuẩn của các chỉ số độ đo này cũng khá thấp trên cả hai bộ

(a) Độ chính xác

(b) Chỉ số Recall

(d) Thời gian thực hiện

(e) Số lượng luật

Hình 3.5: Kết quả thực nghiệm trên bộ dữ liệu thực Liver

dữ liệu Training và Testing.

Nhận xét về mô hình M-CFIS-R:

- Ưu điểm: Mô hình M-CFIS-R là mô hình kết hợp giữa hệ M-CFIS, các độ đo

mờ phức và tính toán hạt trong quá trình Training. Kết quả của quá trình thu được một

hệ thống các luật mờ phức mới hiệu quả hơn so với hệ luật cũ trong M-CFIS. Tính

mới của nghiên cứu này nằm ở vấn đề áp dụng độ đo mờ phức với tính toán hạt. Trong

mô hình M-CFIS ở Chương 2 thì quá trình Training không được mô tả chi tiết, nên

trong chương này NCS bổ sung và làm rõ hơn quá trình Trainning của mô hình. Kết

quả thu được một hệ M-CFIS với hệ luật mới hiệu quả hơn so với mô hình M-CFIS

cũ. Thông qua việc thực nghiệm mô hình hệ suy diễn M-CFIS-R trên bộ dữ liệu chuẩn

Benchmark UCI hay bộ dữ liệu thực thì mô hình M-CFIS-R đều được đánh giá là tốt

hơn so với mô hình M-CFIS trên hầu hết các thước đo đánh giá. Trong quá trình tinh

giảm luật, những luật dư thừa, luật nhiễu được tinh giảm và thay vào đó là luật có độ

bao phủ hơn nên kết quả thực nghiệm mô hình đề xuất M-CFIS-R tốt hơn.

- Nhược điểm: Tuy nhiên trong mô hình mới này chỉ dừng ở mức tối ưu cục bộ

mà chưa có giải pháp tối ưu toàn cục khi đánh giá hiệu năng của cơ sở luật mờ mới

trong quá trình Training (nếu việc đánh giá mô hình suy diễn M-CFIS trên bộ luật

mới cho kết quả tốt hơn thì thuật toán lập tức dừng lại). Điều này cần phải nghiên cứu

và cải thiện hơn nữa. Bên cạnh đó, tổng thời gian thực hiện của mô hình đề xuất cũng

lâu hơn so với thời gian thực hiện trong mô hình M-CFIS.

3.5. Kết Chương 3

Trong Chương 3, luận án đề xuất một hệ thống M-CFIS-R, trong đó sự kết hợp

của các độ đo tương tự mờ phức như độ đo Cosine mờ phức, độ đo Dice mờ phức và

độ đo Jaccard mờ phức với kĩ thuật tính toán hạt. Mục đích của hệ thống nhằm đưa ra

được hệ luật mờ phức tốt hơn hệ luật cũ trong mô hình M-CFIS. Hệ luật mới được cải

thiện hơn bởi tính toán độ tương quan giữa các luật mờ phức với nhau dựa trên các độ

đo mờ phức. Cuối cùng độ tương tự của các luật mờ phức được tính toán bằng cách

áp dụng tính toán hạt đối với từng nhãn đầu ra trong bộ dữ liệu Validation. Sau đó

chúng tôi thực hiện mô hình suy diễn trên bộ dữ liệu Validation để đánh giá hiệu quả

của bộ luật mờ phức mới. Nếu kết quả đánh giá tốt hơn thì kết thúc quá trình Training

và thực hiện quá trình tiếp theo Testing; còn ngược lại thì quá trình sử dụng độ đo mờ

phức tính toán hạt được thực hiện lại. Trong giai đoạn Testing, chúng tôi thực hiện hệ

M-CFIS với hệ luật mờ phức đã được giản lược trong bước Training để đánh giá hiệu

quả của hệ luật mới với bộ dữ liệu Testing. Tóm lại, mô hình M-CFIS-R là mô hình

kết hợp M-CFIS, các độ đo mờ phức và tính toán hạt trong quá trình Training. Dựa

trên đó chúng tôi thu được một hệ M-CFIS mới với bộ luật mờ phức tốt hơn và cho

kết quả thực hiện tốt hơn hệ M-CFIS cũ.

Mô hình M-CFIS-R được thực hiện với các bộ dữ liệu được từ kho thư viện

chuẩn UCI và bộ dữ liệu thực Liver lấy từ bệnh viện Gang thép và bệnh viện đa khoa

Thái Nguyên và từ bệnh viện Đại học Y Hà nội. Rõ ràng là các kết quả được đưa ra

trong mục 3.4.1 và 3.4.2 đã cho thấy mô hình M-CFIS-R được đề xuất tốt hơn mô

hình M-CFIS trên các chỉ số độ chính xác, chỉ số Recall và Precision. Nói chung,

tất cả các chỉ số đánh giá trên mô hình M-CFIS-R đều tốt hơn M-CFIS với độ lệch

tiêu chuẩn thấp. Trong tất cả các trường hợp thì độ chính xác của mô hình M-CFIS-R

trong dữ liệu Training luôn nhỏ hơn khi thực hiện mô hình đối với dữ liệu Testing,

ví dụ như 92.89% và 95.84% đối với bộ dữ liệu WBCD, 86.37% và 89.47% trên bộ

dữ liệu Diebetes, và 87.69% và 88.44% trên dữ liệu thực Dental. Tuy nhiên, thời gian

thực hiện mô hình M-CFIS-R còn khá cao bởi sử dụng kết hợp tính toán hạt và độ đo

mờ phức. Mặt khác, hệ luật cơ sở thu được từ hệ M-CFIS-R có chất lượng tốt hơn với

số lượng luật nhỏ hơn so với M-CFIS. Tóm lại, độ chính xác của mô hình M-CFIS-R

đạt xấp xỉ (86.3%-92.9%) đối với bộ dữ liệu Training và (85%-95.8%) đối với dữ liệu

Testing. Số lượng luật của mô hình M-CFIS-R giảm so với mô hình M-CFIS khoảng

(4.8%-22.1%).

Tuy nhiên, hệ M-CFIS-R chỉ dừng lại ở tối ưu cục bộ chứ chưa đạt được tối ưu

hóa toàn cục bởi lí do thuật toán chỉ thực hiện đánh giá hiệu quả của hệ luật mới trên

bộ dữ liệu Training thì lập tức dừng lại. Bên cạnh đó, thời gian thực hiện của mô hình

đề xuất vẫn còn cao hơn so với thời gian chạy mô hình M-CFIS. Các kết quả nghiên

cứu ở Chương 3 được công bố trong công trình công trình [A3] phần “Danh mục các

công trình”.

Chương 4. MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ THỊ TRI THỨC (M-CFIS-FKG)

4.1. Giới thiệu

Gần đây, đồ thị tri thức (KG) [106] đã nhận được sự chú ý của nhiều nhà nghiên

cứu và được đưa vào ứng dụng trong nhiều lĩnh vực như máy tìm kiếm, học máy, hệ

tư vấn... KG được coi như là một mô hình mạng bao gồm các nút thực thể và các cạnh

quan hệ, trong đó nút tương ứng với thuộc tính hay thực thể, còn cạnh thì biểu diễn

mối quan hệ giữa các thực thể hay giữa các thuộc tính đó.

Đồ thị tri thức cũng được ứng dụng nhiều trong y học [107] và trong nhiều lĩnh

vực khác [108, 109, 110, 111, 112]. Trong nghiên cứu [113] thì đồ thị tri thức được

sử dụng kết hợp với các thuật toán học sâu để dự báo xu hướng tăng giảm của giá cổ

phiếu và mạng CNN được sử dụng để chia nhóm các nhà đầu tư và trích xuất ra những

thuộc tính thông tin cần thiết. Trong một nghiên cứu khác, Chen và cộng sự [114] lại

đưa ra một cái nhìn tổng quan về các nghiên cứu, xem xét các kỹ thuật suy luận dựa

trên luật logic, cách biểu diễn và mạng nơ ron trên đồ thị tri thức.

Tuy nhiên, đồ thị tri thức cũng có một số hạn chế về phạm vi và kích thước của

đồ thị. Nhóm tác giả Yoo và Jeong [115] đã giới thiệu một mô hình mở rộng của đồ thị

tri thức với tên gọi là PolarisX cho phép biểu diễn một cách linh hoạt trong việc tìm

hiểu và phân tích tình huống cũng như mối quan hệ giữa hai thực thể. Ngoài ra, đồ thị

tri thức cũng đã được đưa vào ứng dụng trong một số các nghiên cứu [116, 117, 118].

Shi và cộng sự [119] đã đề xuất mô hình dựa trên đồ thị tri thức để quản lý thông tin

chăm sóc sức khỏe của bệnh nhân tùy theo ngữ cảnh áp dụng. Để phát hiện được ngữ

nghĩa phức tạp của thực thể, nhóm tác giả đã đề xuất một thuật toán cắt tỉa suy luận

trên đồ thị tri thức. Vấn đề dự báo rủi ro về sức khỏe cũng còn có thể được thực hiện

thông qua việc khai phá đồ thị tri thức sức khỏe trong nghiên cứu của [120]. Trong

nghiên cứu này, thông tin sức khỏe của bệnh nhân được phân tích và lưu trữ biểu diễn

trên đồ thị tri thức. Dựa trên đó một mô hình phân loại được đưa ra để áp dụng và khai

phá những thông tin sức khỏe theo từng vùng miền và những thông tin bị ẩn đi. Mô

hình dự báo rủi ro về sức khỏe này cũng được thực nghiệm và so sánh với các phương

pháp khác, tuy nhiên mô hình này chỉ hiệu quả hơn đối với các bộ dữ liệu rời rạc.

Mục đích của KG là nhằm phân tích được tối đa hóa giá trị của tri thức, phát

hiện và tránh được lỗi và có thể lập luận suy ra được kết luận mới từ những dữ liệu

đã có. Việc lựa chọn biểu diễn thực thể mới và mối quan hệ giữa chúng thông qua mô

hình KG có thể thu được nhiều thông tin hữu ích và có thể hỗ trợ nhiều hơn đối với

các ứng dụng thực tế. Chính vì lí do đó mà KG được nhiều nhà khoa học nghiên cứu

và phát triển trong nhiều bài toán thực tế, đặc biệt trong mô hình có suy luận xấp xỉ.

Bên cạnh đó, trong nội dung Chương 3, luận án đã đưa ra phương pháp cải tiến

hệ luật trong mô hình của M-CFIS và xây dựng mô hình mới M-CFIS-R). Mô hình

M-CFIS-R sử dụng kết hợp giữa tính toán hạt với ba độ đo tương tự mờ phức để thực

hiện quá trình giảm luật trong hệ luật đã thu được trong mô hình M-CFIS. Tập luật

được tạo ra bởi mô hình M-CFIS-R được thu gọn hơn so với mô hình M-CFIS thông

qua các kết quả thực nghiệm trên cả tập dữ liệu chuẩn UCI và dữ liệu thực. Tuy nhiên,

ngoài những ưu điểm thì hệ thống M-CFIS-R vẫn còn tồn tại một số hạn chế sau:

(i) Mô hình M-CFIS-R hoạt động dựa trên mô hình suy luận mờ Mamdani, tuy

nhiên chúng cần được phát triển với các mô hình suy luận mờ khác như mô hình suy

luận mờ Sugeno và Tsukamoto.

(ii) Độ đo đề xuất trong mô hình M-CFIS-R là độ đo được phát triển dựa trên

lý thuyết độ đo tương tự. Tuy nhiên những khái niệm độ đo hay tích phân mờ phức

khác cũng cần được nghiên cứu và xem xét.

(iii) Trong mô hình M-CFIS-R, dữ liệu được kiểm tra trong phần Testing bằng

cách kiểm tra đối với từng luật trong hệ luật để đưa ra kết luận cuối cùng. Điều này

dẫn đến chi phí thời gian tính toán khá cao.

(iv) Giả thiết nếu dữ liệu trong phần Testing mà không chứa các bản ghi được

suy ra bởi luật trong hệ luật thì khi đó khó có thể đưa ra được kết quả do trong hệ luật

không có. Điều này thường xảy ra trong các hệ thống thương mại thực tế, hệ cơ sở luật

được tạo ra nhỏ và khi đó cần thiết phải cung cấp hay tạo ra thêm những luật mới.

Xuất phát từ những hạn chế của mô hình M-CFIS-R và ưu điểm của việc biểu

diễn theo mô hình KG, trong khuôn khổ nội dung Chương này , luận án đề xuất cách

tiếp cận mới dựa trên đồ thị tri thức để khắc phục hai nhược điểm (iii) và (iv) của mô

hình M-CFIS-R trong Chương 3.

4.2. Một số mở rộng của mô hình M-CFIS-R

Trong phần này, luận án trình bày một số mở rộng của mô hình M-CFIS-R

bao gồm bốn nội dung chính: Hệ suy diễn mờ phức Sugeno, hệ suy diễn mờ phức

Tsukamoto, độ đo mờ phức và tích phân mờ phức. Cụ thể từng nội dung như sau:

4.2.1. Hệ suy diễn mờ phức Sugeno và Tsukamoto

• Hệ suy diễn mờ phức Sugeno.

Hệ suy diễn mờ phức Sugeno được mô tả thông qua các bước sau:

Bước 1. Sinh luật mờ phức. Đối với mô hình hệ suy diễn mờ phức Sugeno thì

CF Ri : If xm,1 is Ai,1 Oi,1 xm,2 is Ai,2 Oi,2 . . . Oi,ni−1 xm,ni is Ai,ni then fi

một luật kí hiệu là CFRi có thể được biểu diễn như sau:

Trong đó: Ai,1, ..., Ai,ni là tập mờ phức và là các biến đầu vào của mô hình; Oi,1, ..., Oi,ni−1

là các toán tử t- chuẩn và t-đối chuẩn tùy thuộc vào ứng dụng và fi là hàm tuyết tính

của kết quả đầu ra tương ứng với mỗi luật mờ phức.

Bước 2: Mờ phức hóa. Thực hiện quá trình mờ phức hóa mỗi giá trị đầu vào

bởi hàm thuộc mờ phức.

Bước 3: Tổng hợp độ mạnh của luật. Mỗi luật mờ phức có một giá trị độ mạnh

của luật, kí hiệu bởi và được tính toán bởi hàm sau: wm = τm ej ψm;

Bước 4: Tính toán giá trị đầu ra của các luật mờ phức Sử dụng công thức tính

zm = fm (am,1, am,2, ..., am,nm)

toán kết quả đầu ra tương ứng với mỗi luật như sau:

2nπ với n ∈ Z. Cho zm = vm ei ϕm và wm ∗ zm = (τmvm) ei g0(ψm, ϕm) với mọi m.

Bước 5: Tổng hợp kết quả cuối cùng. Chọn hàm g0 : (0, 2π]2 → R với g0(2π, 2π) =

Khi đó, kết quả đầu ra được tính toán bằng công thức tính tổng hợp trọng số

wm ∗ zm

k (cid:80) m=1

yop =

w1 ∗ z1 + w2 ∗ z2 + ... + wk ∗ zk w1 + w2 + ... + wk

k (cid:80) m=1

(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)

(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)

• Hệ suy diễn mờ phức Tsukamoto

Quy trình suy diễn của mô hình hệ suy diễn mờ phức Tsukamoto cũng tương

tự như đối với mô hình hệ suy diễn mờ phức Sugeno. Mỗi kết quả trong mỗi luật trong

mô hình hệ suy diễn mờ phức Tsukamoto được xác định bởi một hàm đơn điệu trên

tập mờ phức. Do đó kết quả suy luận của mỗi luật sẽ thu được dựa vào các giá trị

dự đoán. Cuối cùng, kết quả cũng được tính toán bằng công thức trung bình trọng số

(tương tự như với S-CFIS-R).

4.2.2. Độ đo mờ phức dựa trên lý thuyết tập hợp

Định nghĩa 4.1. Cho một tập mờ phức không rỗng C trên không gian nền X. Một tập

con CF của CF (C) được coi là phép đại số của tập mờ phức trên C nếu nó thỏa mãn

các điều kiện sau: (i) 1∅, C ∈ CF ,

(ii) Nếu P ∈ CF thì C\P ∈ CF ,

A lg(C) là tập hợp các biểu diễn đại số của tập mờ phức trên C . Và một cặp

(C, CF ) được coi là không gian độ đo mờ phức trên C nếu CF là phép đại số của

(iii) Nếu P, Q ∈ CF thì P ∪ Q ∈ CF .

P ∈ CF (C) thì có thể nói P là độ đo CF với P ∈ CF .

tập mờ phức trên C. Nếu chúng ta có một không gian đo được mờ phức (C, CF ) và

Định nghĩa 4.2. Cho một không gian độ đo mờ phức (C, CF ). Một ánh xạ r : CF → H

r (1∅) .ejω(1∅) = 0 và r (C) .ejω(C) = 1,

được định nghĩa là độ đo mờ phức trên (C, CF ) nếu thỏa mãn các điều kiện sau: (i)

(ii) rD (x) .ejωD(x) ≤ rE (x) .ejωE(x) với x ∈ X, với D, E ∈ X và D ⊆ E.

Một không gian độ đo mờ phức được định nghĩa bởi bộ bốn (C, CF, r, ω) trong

đó (C, CF ) là một không gian độ đo mờ phức, r là một độ đo mờ phức trong không

gian (C, CF ). CFms (X) được coi là lớp không gian độ đo mờ định nghĩa trên không

gian nền không rỗng X. Khi C ∈ CF (X) thì không gian độ đo mờ phức (C, CF, r, ω)

(cid:48)(cid:1).

(cid:48) thì CFms (X) ⊆ CFms

(cid:0)X sẽ phụ thuộc vào giá trị của CFms (X), và nếu X ⊆ X

H, độ đo mờ phức trên (1X , X) được xác định theo hàm sau:

1 (cid:82)

rC (x) .ejωC (x) =

rC (x) .ejωC (x)dx

Ví dụ 4.1. Cho không gian độ đo mờ phức (1X , CF ) với X = [0, 1] và ánh xạ C : X →

Với mục đích là phát triển không gian độ đo mờ phức, sau đây NCS sẽ đưa ra

độ đo bên trong của tập mờ phức.

Cho (C, CF ) là một không gian độ đo mờ phức và P ∈ CF (X). Tập các tập độ

đo -CF ( viết tắt CFP ) được xác định bởi CFP = {D|D ∈ CF, D ⊆ P }

Chú ý rằng ở đây: 1∅ ∈ CFP với mỗi P ∈ CF (X) và nếu P là một tập độ đo

(cid:48)(cid:1)

-CF thì P ∈ CF (P ). Và nếu P = C thì có thể viết CF thay thế cho CFC.

Do đó, chúng tôi có thể định nghĩa độ đo mờ phức bên trong trên (cid:0)X, CF

bằng cách sử dụng độ đo mờ phức r (x) .ejω(x) trên không gian độ đo mờ phức (X, CF )

(cid:48).

với CF ⊆ CF

Định lý 4.1. Cho một không gian độ đo mờ phức (C, CF, r, ω) và CF ∈ A lg (C) sao

P (p) = ∨

cho CF ⊆ CF ∗.

rD (d) .ejωD(d)

P (p) .ejω∗

D∈CFP

Ánh xạ (r∗, ω∗) : CF ∗ → H xác định bởi hàm r∗

được gọi là một độ đo mờ phức trên (C, CF ∗).

(r∗, ω∗) được coi như là độ đo mờ phức trong được xác định bởi r, ω trên (C, CF ∗).

Bên cạnh đó, (r∗, r) và (ω∗, ω) được coi tương đương nhau trên CF . Do đó

Chứng minh:

P (p) = rP (p) .ejωP (p).

P (p) .ejω∗

Hiển nhiên ta có với P ∈ CF thì r∗

P (p) = r∗

Q(q) với

Do đó, r (∅) .ejω(∅) = 0 và r (A) .ejω(A) = 1.

P (p) .ejω∗

Q (q) .ejω∗

P, Q ∈ CF ∗ và P ⊆ Q. Hơn nữa, (r∗, ω∗) là một độ đo mờ phức trên (C, CF ∗) nên có

Thêm nữa, CFP ⊆ CFQ khi P ⊆ Q, thì r∗

thể coi (r, ω) và (r∗, ω∗) là tương đương nhau trên CF .

CF (C) ( CF ∗là tập tất cả các tập con mờ phức của C). Vì vậy ta có:

Ví dụ 4.2. Cho không gian độ đo mờ phức (C, CF, r, ω)với CF = {1∅, C} và CF ∗ =

D(d) =

P (p) = ∨

D (d) .ej∗ µ∗

P (p) .ej∗ µ∗

D∈CFP

1 P = C khác 0

(cid:40)

µ (C) .ejω(C) = 1

Nếu CFM hoặc bằng {1∅} hoặc {1∅, C} = CF thì µ (∅) .ejω(∅) = 0 và

k : CF → CG. Ánh xạ k được gọi là một phép đẳng cấu giữa (C, CF ) và (D, CG) nếu

Định nghĩa 4.3. Cho không gian độ đo mờ phức (C, CF ), (D, CG) và một ánh xạ

các điều kiện sau được thỏa mãn: (i) k là một song ánh với k (1∅) = 1∅,

(ii) k (P ∪ Q) = k (P ) ∪ k (Q) và k (C\P ) = D\k (P ) với P, Q ∈ CF ,

CF và x ∈ Dom (C).

(iii) Tồn tại một song ánh l : Dom (C) → Dom (D) với P (x) = k (P ) (l (x)),P ∈

CF → CG. Ánh xạ k được coi là phép đẳng cấu giữa không gian (C, CF ) và (D, CG)

Định lý 4.2. Cho không gian độ đo mờ phức (C, CF ) , (D, CG) và một toàn ánh k :

khi và chỉ khi tồn tại một song ánh l : Dom (C) → Dom (D) sao cho k = l→|CF .

Chứng minh.

Đầu tiên, giả sử rằng k : CF → CG là một đẳng cấu của không gian (C, CF )

và (D, CG) thì tồn tại một song ánh l : Dom (C) → Dom (D) (điều kiện thứ (iii) của

Định nghĩa 4.3) và có P (x) = k (P ) (l (x)) với x ∈ Dom (C).

l→ (P ) = k (P ) với P ∈ CF và k = l→|CF .

Nếu l→ (P ) (l (x)) = P (x) = k (P ) (l (x)) với x ∈ Dom (C) thì khi đó ta có

Mặt khác, cho một ánh xạ toàn ánh k : CF → CG sao cho k = l→|CF đối với

song ánh l : Dom (C) → Dom (D). Giả sử rằng có k (P ) = k (Q) với P, Q ∈ CF . Nếu

k (P ) (x) = l→ (P ) (x) = P (cid:0)l−1 (x)(cid:1) = Q (cid:0)l−1 (x)(cid:1) = l→ (Q) (x) = k (P ) (x)

cho một song ánh l : Dom (C) → Dom (D) thì có thể viết:

Do đó, P = Q và k là một song ánh. Hơn nữa, k (1∅) (x) = l→ (1∅) (x) = 1∅ (cid:0)l−1 (x)(cid:1) = 0 với mọi x ∈ Dom (D) nên k (1∅) = 1∅, điều này có nghĩa là điều kiện

(i) trong định nghĩa 4.3 thỏa mãn.

k (P ∪ Q) (x) = l−1 (P ∪ Q) (x) = (P ∪ Q) l−1 (x)

= P (cid:0)l−1 (x)(cid:1) ∨ Q (cid:0)l−1 (x)(cid:1)

= l→ (P ) (x) ∨ l→ (Q) (x)

= (l (P ) ∪ l (Q)) (x)

Nếu P, Q ∈ CF thì ta có với x ∈ Dom (D)

k (C\P ) (x) = l→ (C\P ) (x) = (C\P ) l−1 (x)

= C (cid:0)l−1 (x)(cid:1) ⊗ (cid:0)P (cid:0)l−1 (x)(cid:1) → 0(cid:1)

= D(x) ⊗ (l→ (P ) (x) → 0)

= D(x) ⊗ (k (P ) (x) → 0)

= (D\k (P )) (x)

Cho P ∈ CF thì ta có với P ∈ CF và x ∈ Dom (D)

Do đó điều kiện (ii) trong Định nghĩa 4.3 cũng được chứng minh.

Nếu l là một song ánh với k (P ) (l(x)) = l→ (P ) (l(x)) = P (x) thì điều kiện (iii)

cũng được thỏa mãn.

Định nghĩa 4.4. Cho không gian độ đo mờ phức (C, CF, r, ω) và (D, CG, r∗, ω∗). Một

ánh xạ k : CF → CG được gọi là ánh xạ đẳng cấu giữa hai không gian (C, CF, r, ω)

và (D, CG, r∗, ω∗) nếu điều kiện sau được thỏa mãn: (i) k là một ánh xạ đẳng cấu giữa

hai không gian độ đo mờ phức (C, CF ) và (D, CF ),

(ii) r (P ) .ejω(P ) = r∗ (k (P )) .ejω∗(P ) với P ∈ CF .

Khái niệm đẳng cấu giữa hai không gian độ đo mờ phức còn có thể được tính

toán bằng cách sử dụng phép song ánh giữa hai không gian độ đo mờ phức.

Bổ đề 4.1. Cho hai không gian độ đo mờ phức đẳng cấu (C1, CF1, r1, ω1) và (C2, CF2, r2, ω2).

2) là đẳng cấu.

2, α∗

1, α∗

Nếu có Di = Ci|Supp (Ci), CGi = {Pi|Supp (Ci) ∩ dom (Pi) , Pi ∈ CFi} và i (Pi|Supp (Ci)) .ejω(Pi|Supp(Ci)) = ri (Pi) ejω(Pi) với Pi ∈ CFi và i = (1, 2), thì có r∗ 1) và (D2, CG2, µ∗ thể nói rằng bộ bốn (D1, CG1, µ∗

Chứng minh:

Dựa vào Định nghĩa 4.4, cho hai không gian độ đo mờ phức U = (C, CF, r, ω)

k (C, CF, r, ω) = (D, CG, r∗, ω∗) hoặc k (U ) = V . Nếu một ánh xạ giữa U và V được

và V = (D, CG, r∗, ω∗). Nếu k là một phép đẳng cấu thì ta có thể viết như sau

tính toán bởi một song ánh l : Dom (C) → Dom (D) (dựa vào Bổ đề 4.2) thì có thể

viết l→ (C) = D.

Một hệ thống AS của không gian độ đo mờ phức trên CFms (X) được coi là

V ∈ CFms (X) là đẳng cấu thì có thể nói V ∈ AS.

đóng dưới đẳng cấu trong CFms (X) nếu thỏa mãn các điều kiện sau: Nếu U ∈ AS và

CFms (X) . Chúng có thể bao gồm các không gian độ đo mờ phức đẳng cấu. AS được

Trong những phần tiếp theo của luận án sẽ đề cập đến hệ thống đóng trong

xác định trên các không gian độ đo mờ phức lẫn nhau với điều kiện là nó phải đóng.

Định nghĩa 4.5. Một không gian mờ phức (C, CF, r, ω) được gọi là không gian đẳng

cấu nếu thoả mãn các tính chất sau: (i) P ∈ CF , thì l→ (P ) ∈ CF ,

Dom (C).

(ii) r (P ) .ejω(P ) = r (l→ (P )) .ejω(l→(P )) với P ∈ CF và với hoán vị l trên

Khái niệm “đẳng cấu” trong Định nghĩa 4.5 có nghĩa là độ đo bất biến trên

cùng không gian tập mờ phức đẳng cấu. Hai bộ của tập mờ phức P và Q có thể coi

như là tương đương nhau nếu có một hoán vị trên Dom (C) và có l→ (P ) = Q.

Ví dụ 4.3. Cho ví dụ sau với không gian độ đo mờ phức (C, (1∅, C) , r, ω) với C

(C, CF, r, ω), trong đó rC (c) ejωC (c) = rD (d) ejωD(d) khi có một hoán vị l trên Dom (C) mà có l→ (C) = D.

là một tập mờ phức không đổi, C ∈ CF (X), và một không gian độ đo mờ phức

Bổ đề 4.2. Tập hợp {U } được coi là hệ thống đóng CFms (X) nếu không gian độ đo

mờ phức U là đẳng cấu.

Chứng minh. Điều này là hiển nhiên đúng.

Bổ đề 4.3. C được coi là tập hợp mờ phức dạng hằng số nếu không gian độ đo mờ

phức là một không gian đo được.

C (x) (cid:54)= l→ (C) (l (x)) trong trường hợp C không phải là tập mờ phức hằng số. Phát

Chứng minh. Điều này là hiển nhiên khi ta có một hoán vị l trên Dom (C) và

biểu này mâu thuẫn với hoán vị của bổ đề.

i∈I Ci, CF = (cid:83) CFi,P = {Q|Q ∈ CFi và Q ⊆ P }.

Bổ đề 4.4. Cho một hệ thống đóng AS = {(Ci, CFi, ri, ωi)|i ∈ I} trên CFms (X). Với C = (cid:83) i∈I CFi và rP (p) ejωP (p) = ∨i∈I ∨Q∈CFi,P riQ (q) ejωQ(q) trong đó

Khi đó, (C, CF, r, ω) được gọi là không gian độ đo mờ phức đo được.

Chứng minh.

Cho ASi = (Ci, CFi, ri, ωi). Có thể nói rằng AS = (C, CF, r, ω) là không gian độ đo mờ phức, và chú ý rằng rP (p).ejωP (p) (cid:54)= riP (p).ejωiP (p) với P ∈ CFi. Mọi phần tử

(cid:48)→(P ) ∈ CF khi P ∈ CF .

i∈I CF i và l→(Ci) ∈ AS đối với i ∈ I thì khi đó ta có k

trong CF có thể tính toán bằng cách xác định có bao nhiêu thao tác được áp dụng trên (cid:83)

m : I → I sao cho l→(ASi) = ASm(i) với mọi đẳng cấu l→. Rõ ràng chúng ta có P ∈ CFi nên suy ra l→(P ) ∈ CFm(i).

Cho hoán vị k trên Dom (C), nếu tập AS được cho đóng đẳng cấu, tồn tại

Hơn nữa, nếu có P ⊆ Q thì hiển nhiên rằng l→(P ) ⊆ l→(Q). Do đó, l→ chính

là ánh xạ từ CFi,P vào CFm(i),l→(P ) với P ∈ CF .

riQ(q).ejωiQ(q)

rP (p).ejωP (p) = ∨ i∈I

∨ Q∈CFi,P

rm(i)Q(l→(Q)).ejωm(i),l→(P )(l→(Q))

= ∨ i∈I

∨ l→(Q)∈CFm(i),l→(P )

riG(g).ejωiG(g)

≤ ∨ i∈I

∨ G∈CFi,k→(P ) = rl→(P )(p).ejωl→(P )(p),

Khi đó có thể viết như sau:

rl→(P )(p).ejωl→(P )(p) = rQ(q).ejωQ(q)

≤ rk→(Q)(q).ejωk→(Q)(q) = r(k→(l→(P )))(p).ejω(k→(l→(P ))) (p)

= rP (p).ejωP (p),

Do đó, ta có : rP (p).ejωP (p) ≤ rl→(P )(p).ejωl→(P )(p) đối với l trên Dom (C) và P ∈ CF . Mặt khác, nếu có Q = l→(P ) và k = l−1 thì các điều kiện sau đảm bảo:

Với k→(l→(P ))(x) = l→(P )(k−1(x)) = l→(P )(l(x)) = P (x)

Đối với x ∈ Dom(Ci) thì AS được coi như là một không gian độ đo mờ phức

đo được.

4.2.3. Tích phân mờ phức

Nội dung phần này của luận án sẽ đi trình bày về tích phân mờ phức được xây

dựng trong không gian độ đo mờ phức bất kì (kí hiệu bởi (C, CF, r, ω)).

Định nghĩa 4.6. Cho một không gian độ đo mờ phức (C, CF, r, ω) với X = Dom(C),

một ánh xạ l : X → H và CF - độ đo P . Tích phân mờ phức- (cid:12) của k trên P được tính

theo công thức sau:

f drP (x) .ejωP (x) = ∨

l (x) (cid:12) rQ (q) .ejωQ(q)(cid:17)

∧ x∈supp(Q)

Q∈CF − P

(cid:90) (cid:12) (cid:16)

P = CFP \ {1∅}. Nếu P = C, thì ta có thể viết (cid:82) (cid:12)

P f drX (x) .ejωX (x).

với CF −

Bổ đề 4.5. Cho không gian độ đo mờ phức (C, CF, r, ω) với X = Dom(C), một ánh

xạ l : X → H và CF - độ đo P trên tập mờ phức.

P l|GdrP (x) .ejωP (x), với tập G sao cho

P ldrP (x) .ejωP (x) = (cid:82) (cid:12)

Supp (P ) ⊆ G ⊆ X

4.2.3.1 Tích phân mờ phức

Khi đó có: (cid:82) (cid:12)

Cho không gian độ đo mờ phức (C, CF, r, ω) và một tập độ đo -CF , P ∈ CF .

Hợp của tất cả các tập mờ phức từ CF (kí hiệu R (P ) ) được xác định thông qua hàm

R (P ) = (cid:83) {Q|Q ∈ CF and Supp(Q) = Supp(P )

Dựa trên khái niệm đại số trên tập mờ phức có thể nói rằng CF là R-complete

nếu R (P ) ∈ CF với P ∈ CF .

Bổ đề 4.6. Cho một không gian độ đo mờ phức (C, CF, r, ω) trong đó CF là R-

complete. Có thể viết như sau:

ldrP (x) .ejωP (x) = ∨

l (x) (cid:12) rQ (q) .ejωQ(q)(cid:17)

∧ x∈supp(Q)

Q∈R− P

P Trong đó SR−

P = (cid:8)Q|Q ∈ CF −

P và R (Q) = Q}

(cid:90) (cid:12) (cid:16)

Chứng minh.

Kết quả này có thể thu được bằng cách sử dụng hệ quả đơn điệu của độ đo mờ

phức.

P = (cid:8)Supp (Q) |Q ∈ CF −

SR−

P → SP − P .

Cho SP − (cid:9), ta có thể định nghĩa một song ánh Supp :

P → H với r ∗ (Q) = r ∗ (cid:0)supp−1 (Q)(cid:1) và ω∗ : SP − P , r, ω(cid:1) tương ứng bởi (cid:0)SP −

ω ∗ (Q) = ω ∗ (cid:0)supp−1 (Q)(cid:1), ta có thể thay (cid:0)SR− Khi đó thu được: (cid:82) (cid:12)

P → H với P , r∗, ω∗(cid:1). P kdrP (x) .ejωP (x). Do đó nếu CF là R-complete, ta có thể diễn tả

Giả sử r∗ : SP −

tích phân dưới dạng tập hợp.

P (x) với P ∈ CF và l : X → H.

Hơn nữa, nếu (C, CF, r, ω) là không gian độ đo mờ phức thì sẽ có một không

P (x) .ejω∗

P ldr∗

P ldrP (x) .ejωP (x) = (cid:82) (cid:12)

gian mờ phức tương ứng (C, CF, r∗, ω∗) trong đó supp (C) = X và SP ⊆ SP (X) sao cho (cid:82) (cid:12)

Định nghĩa 4.7. Cho không gian độ đo mờ phức (C, CF ) và X = Supp (C), một phép

đại số của các tập SP trên X là một biểu diễn rõ của phép đại số CF khi và chỉ khi

có Q ∈ CF với P ∈ SP thỏa mãn các điều kiện sau: (i) supp (Q) ⊆ P ,

(ii) Nếu supp (Q∗) ⊆ P với Q∗ ∈ CF , thì Q∗ ⊆ Q.

Bổ đề 4.7. Nếu tồn tại một biểu diễn rõ của một phép đại số CF thì CF là R- complete.

Chứng minh.

Q∗ ∈ CF và supp (Q∗) ⊆ P , ta có Q∗ ⊆ Q.

Giả sử rằng P = supp (G) với G ∈ CF . Khi đó tồn tại Q ∈ CF sao cho với

Do đó, Q được coi như là cận trên đúng của tập mờ phức sao cho trùng với P .

Do đó, bổ đề được chứng minh.

Định lý 4.3. Cho không gian độ đo mờ phức (C, CF, r, ω) với X = supp (C) và một

Q(q)

P (p) =

P (p) .ejω∗ r∗

Q(q).ejω∗ r∗

∨ Q∈CF Supp(Q)⊆P

biểu diễn rõ SP của CF thì r∗, ω∗ : SP → H được định nghĩa theo hàm sau

Thì, (P, CF, r∗, ω∗) là không gian độ đo sao cho R-complete thỏa mãn.

Chứng minh.

P (p) ≥

P (p) .ejω∗

rQ (q) .ejωQ(q) với supp (Q) = X, ta có bất đẳng thức sau

(cid:12) (cid:90)

P (p)

ldr∗

ldrP (p) .ejωP (p) ≤

P (p) .ejω∗

supp(P )

Dựa trên hệ quả của Bổ đề 4.6 và 4.7 có thể dễ dàng nhận thấy rằng r∗

Q(q) với Q ∈ SP .

. Với SP là một biểu diễn rõ của CF , ta có một tập mờ phức G ∈ CF với mỗi tập

Q (kí hiệu GQ) đều phải thỏa mãn điều kiện (1) và (2) của định nghĩa 4.7. Ta có Supp (cid:0)GQ Q (q) .ejω∗

(cid:1) ⊆ Q và rGQ (g) .ejωGQ (g) = r∗

Vậy, ta có thể viết:

Q(q)(cid:17)

l (x) (cid:12) r∗

ldr∗

X (x) = ∨

Q (q) .ejω∗

X (x).ejω∗

∧ x∈Q

supp(P )

Q∈SP − P

(cid:90) (cid:12) (cid:16)

(g)(cid:17)

(g).ejω∗

≤ ∨

Q∈SP − P

∧ x∈supp(GQ) (cid:16)

≤ ∨

l (x) (cid:12) r∗ l (x) (cid:12) rG (g) .ejωG(g)(cid:17)

∧ x∈supp(G)

G∈CF − P (cid:90) (cid:12)

ldrX (x).ejωX (x)

4.2.3.2 Liên hệ với tích phân Sugeno

(cid:16)

{x|x ∈ X ; l (x) ≥ b} với b ∈ H. Một tập Kb được cho là lát cắt - b của ánh xạ l. Theo

Dựa trên định nghĩa của tích phân mờ phức và tích phân Sugeno, ta có Kb =

lý thuyết tích phân mờ, có thể coi ánh xạ l is CF -đo được, nếu Kb ∈ CF với b ∈ H

(trong đó H = [0, ∞] hoặc H = [0, 1]).

Định lý 4.4. Cho dàn thặng dư có thể chia hoàn toàn U, một không gian độ đo mờ

jω∗

(b)(cid:19)

phức (C, CF, r, ω) với X = Dom (C) và một ánh xạ l : X → H. Thì ta có:

(P ∩1Kb)

(b) .e

b ∧ r∗

(P ∩1Kb)

ldrP (b) .ejωP (b) = ∨ b∈H

(cid:18) (cid:90) ∧

Với (r∗, ω∗) là độ đo mờ phức trong trên (C, CF (C)).

Chứng minh.

Trước tiên, ta biến đổi vế phải của biểu thức trên.

Q(b) = ∨G∈CFQrG (b) .ejωG(b) (định lý

Q (b) .ejω∗

Cho CFQ = {G ∈ CF |G ⊆ Q},r∗

4.1) và G (b) = P ∩ 1Kb với b ∈ H. Dễ dàng nhận thấy rằng ∧x∈supp(G(b))l (x) ≥ b.

Chú ý rằng supp (G (b)) ⊆ Kb và khi ∨i∈I (b ∧ ci) = b ∧ ∨i∈I ci thì vế phải của

biểu thức có thể viết lại như sau,

jω∗

G(b)(cid:17)

(P ∩1Kb)(b)(cid:19)

b ∧ r∗

(b) .e

G (b) .ejω∗

(P ∩1Kb)

= ∨ b∈H

∨ b∈H

(cid:18) (cid:16)

Dễ dàng nhận thấy rằng b ≤ ∧x∈supp(G(b))l (x), do đó ta có

G(b)(cid:17)

l (x)

∧

b ∧ r∗

G (b) .ejω∗

≤ ∨ b∈H

∨ b∈H

∧ x∈supp(G(b)) (cid:18)(cid:18)

∨ Q∈CFG(b) (cid:19) (cid:16)

l (x)

∧

= ∨ b∈H

∨ Q∈CFG(b)

∧ x∈supp(G(b)) (cid:18)(cid:18)

(cid:18)(cid:18) (cid:19)(cid:19) (cid:19) (cid:18) (cid:16)

≤

l (x)

∧

rQ (b) .ejωQ(b) rQ (b) .ejωQ(b)(cid:17)(cid:19) rQ (b) .ejωQ(b)(cid:17)(cid:19)

∧ x∈supp(Q)

∨ Q∈CFG(b)

∨ b∈H G(b)(cid:54)=1∅

(cid:19) (cid:16)

Và ta có:

l (x)

∧

rQ (b) .ejωQ(b)(cid:17)(cid:19)

∧ x∈supp(Q)

∨ Q∈CFG(b)

∨ b∈H G(b)(cid:54)=1∅

(cid:18)(cid:18) (cid:19) (cid:16) (4.1)

l (x)

∧

rQ (b) .ejωQ(b)(cid:17)(cid:19)

∧ x∈supp(Q)

∨ Q∈CF −

G(b)

∨ b∈H G(b)(cid:54)=1∅

(cid:18)(cid:18) (cid:19) (cid:16) (4.2)

≤

l (x) ∧ rQ (b) .ejωQ(b)(cid:17)

∧ x∈supp(Q)

∨ Q∈CF −

G(b)

∨ b∈H G(b)(cid:54)=1∅

(cid:16) (4.3)

l (x) ∧ rQ (b) .ejωQ(b)(cid:17)

∧ x∈supp(Q)

G(b)

∨ Q∈CF − (cid:90) ∧

(cid:16) (4.4)

ldrP (b).ejωP (b)

(4.5)

l(x)

= 0.

∧ rQ (b) .ejωQ(b)

∧ x∈supp(Q)

∨ Q∈CFG(b)

(cid:18)(cid:18) (cid:19) (cid:19)

Chú ý rằng: ∨ b∈H G(b)=1∅

jωGbQ

(b) .e

Khi CFG(b) = {1∅} và r (1∅) .ejω(1∅) = 0 thì có thể đặt bQ = ∧x∈supp(Q)l (x).

với Q ∈ CF − X . Rõ ràng có supp(Q) ⊆ CFbQ = và l (x) ≥ bQ. (b) Do đó ta có rQ (b) .ejωQ(b) = rGbQ

Xét vế trái:

l (x) ∧ rQ (b) .ejωQ(b)(cid:17)

ldrP (b).ejωP (b) = ∨

Q∈CF − P

(cid:90) ∧ (cid:16)

∧ x∈supp(Q) (cid:18)(cid:18)

l (x)

= ∨

∧ rQ (b) .ejωQ(b)

∧ x∈supp(Q)

Q∈CF − P

(cid:19) (cid:19)

Ta có bQ = ∧x∈supp(Q)l (x), nên

l (x)

= ∨

∧ rQ (b) .ejωQ(b)

∧ x∈supp(Q)

∨ Q∈CF − P

Q∈CF − P

jω∗

(b)(cid:17)

bQ ∧ rQ (b) .ejωQ(b)(cid:17) (cid:16)

GbQ

(b) .e

≤ ∨

bQ ∧ r∗

GbQ

jω∗

(b)(cid:17)

Q∈CF − P (cid:16)

GbQ

(b) .e

b ∧ r∗

GbQ

≤ ∨ b∈H

(cid:18)(cid:18) (cid:19) (cid:19) (cid:16)

jω∗

(P ∩1Kb) (b)(cid:19)

b ∧ r∗

(b) .e

(P ∩1Kb)

= ∨ b∈H

(cid:18)

Định lý được chứng minh.

jω(P ∩1Kb)(b)(cid:19)

(b) .e

b ∧ r

Định lý 4.5. Cho một dàn phần dư đầy đủ U, một không gian độ đo mờ phức (C, CF, r, ω)

P ldrP (b).ejωP (b) = ∨

(P ∩1Kb)

b∈H

với X = Dom (C) và ánh xạ l : X → H với X ∩ 1Kb ∈ CF và b ∈ H. (cid:18) Ta có: (cid:82) ∧

Chứng minh.

Tương tự như chứng minh trong Định lý 4.4, vế phải của biểu thức trên có thể

viết như sau:

jω(P ∩1Kb)(b)(cid:19)

(b) .e

b ∧ r

(P ∩1Kb)

∨ b∈H

(cid:18) (4.6)

jω(P ∩1Kb)(b)(cid:19)(cid:33)

(l(x))

∧

(cid:33) (cid:32)(cid:32)

(b) .e

≤ ∨ b∈H

∧ x∈supp(P ∩1Kb)

(cid:18) r (4.7)

≤ ∨

(P ∩1Kb) l (x) ∧ r(Q) (b) .ejω(Q)(b)(cid:17)

∧ x∈sup(Q)

Q∈CF − X (cid:90) ∧

(cid:16) (4.8)

ldrP (b).ejωP (b)

(4.9)

jω(P ∩1Kb)(b)

P với b ∈ H và P ∩1Kb (cid:54)= 1∅. = 0. Giả sử bây giờ có b(Q) =

(4.10)

∧x∈supp(Q)l (x) thì vế trái của biểu thức trên có thể được viết như sau:

Khi P ∩1Kb ∈ CF là CF - đo được thì P ∩1Kb ∈ CF − Nếu P ∩ 1Kb = 1∅, thì r(P ∩1Kb) (b) .e

ldrP (b).ejωP (b) = ∨

l (x) ∧ rQ (b) .ejωQ(b)(cid:17) (cid:16)

Q∈CF − X

∧ x∈supp(Q) (cid:18)

(cid:90) ∧

= ∨

∧ rQ (b) .ejωQ(b)

∧ x∈supp(Q)

Q∈CF − X

(cid:19)

= ∨

l (x) b(Q) ∧ rQ (b) .ejωQ(b)(cid:17)

Q∈CF − X

(cid:16)

jω(cid:18)

P thì: (cid:19)(b)

P ∩1KbQ

(cid:19)(b)(cid:33)

jω(cid:18)

P ∩1KbQ

≤ ∨

b(Q) ∧ rQ (b) .ejωQ(b)(cid:17)

b(Q) ∧ r(P ∩1KbQ) (b) .e

∨ Q∈CF − X

Q∈CF − X (cid:32)

(cid:19)(b)(cid:33)

jω(cid:18)

P ∩1KbQ

b ∧ r(P ∩1KbQ) (b) .e

≤ ∨ b∈H

Rõ ràng khi có Q ⊆ P ∩ 1Kb và Q ∈ CF − rQ (b) .ejωQ(b) ≤ r(P ∩1KbQ) (b) .e Nên: (cid:32) (cid:16)

4.2.3.3 Các tính chất của tích phân mờ phức

Định lý được chứng minh.

Trong mục này luận án trình bày một số định lý cùng với điều kiện của nó trong

tích phân mờ phức.

P drP (p).ejωP (p) là một độ đo mờ phức trên

D ∈ CF (X) với C ⊆ D, CG ∈ A lg (D) và C là rõ thì ánh xạ η : CG → H được xác định bởi hàm sau: ηP (p) .ejτP (p) = (cid:82) (cid:12) (D, CG).

Định lý 4.6. Cho không gian độ đo mờ phức (C, CF, r, ω) với X = Dom (C). Nếu có

Chứng minh:

C = CF −)

Nếu P = 1∅ thì (có thể coi CF −

η1∅ (p) .ejτ 1∅(p) = ∨

1∅ (x) (cid:12) rQ (b) .ejωQ(b)(cid:17)

Q∈CF −

∧ x∈supp(Q)

0 = 0

= ∨

Q∈CF −

∧ x∈supp(Q)

(cid:16)

C (x) (cid:12) rQ (x) .ejωQ(x)(cid:17) (cid:16)

ηC (p) .ejτC (p) = ∨

Q∈CF −

∧ x∈supp(Q)

= C (x) (cid:12) rC (x) .ejωC (x) = 1 (cid:12) 1 = 1

Trong đó C là tập mờ phức rõ

Do đó, ηP (p) .ejτP (p) = 1.

Cho P ⊆ Q là hai tập mờ phức-CG-độ đo, thì có

ηP (p) .ejτP (p) = ∨

Q∈CF −

∧ x∈supp(G)

≤ ∨

= ηQ (x) .ejτQ(x)

P (x) (cid:12) rG (x) .ejωG(x)(cid:17) Q (x) (cid:12) rG (x) .ejωG(x)(cid:17) (cid:16)

Q∈CF −

∧ x∈supp(G)

(cid:16)

(D, CG).

Khi P (x) ≤ Q (x) với x ∈ X. Từ đó ta kết luận η là một độ đo mờ phức trên

Bổ đề 4.8. Cho dàn có thứ tự tuyến tính đầy đủ U. Với b ∈ H, ta có

jω∗

(P ∩1Kb)(a)

(b) .e

ldrP (b).ejωP (b) ≤ b ∨ r∗

(P ∩1Kb)

(cid:90) (cid:12)

Chứng minh.

Với b ∈ H, ta có:

ldrP (b).ejωP (b) = ∨

l (x) (cid:12) rQ (b) .ejωQ(b)(cid:17)

∧ x∈supp(Q)

(cid:90) (cid:12) (cid:16)

Q∈CF − P 

l (x) (cid:12) rQ (b) .ejωQ(b)(cid:17) (cid:16)



∧ x∈supp(Q)

Q∈CF − P Q⊆P ∩1Kb

  ∨   ∨

 

l (x) (cid:12) rQ (b) .ejωQ(b)(cid:17)

(cid:16)

∧ x∈supp(Q)

Y ∈CF − P Q(cid:54)⊂P ∩1Kb

≤

rQ (b) .ejωQ(b) ∨ b

∨ Q∈CF − P Q⊆P ∩1Kb

rQ (b) .ejωQ(b) ∨ b

∨ Q∈CF Q⊆P ∩1Kb

jω∗

(M ∩1CFa )(a)

= r∗

∨ a

(M ∩1CFa ) (a) .e

  ∨  

∧ x∈supp(Q)

∨ Y ∈CF − P Q(cid:54)⊂P ∩1Kb

Trong đó có bất đẳng thức (cid:0)l (x) (cid:12) rQ (b) .ejωQ(b)(cid:1) ≤ b

Khi Q (cid:54)⊂ P ∩ 1Kb và Supp(Q) ⊆ Supp(P ) thì l(x) < b.

∧ x∈supp(Q) Cho dàn phần dư đầy đủ U và b ∈ H. Giả sử rằng U là liên tục dưới trong b nếu

∨b∗∈[0,b[ b∗ = b,với [0, b[= {b ∗ |b∗ ∈ H và b∗ ≤ b}.

f drM (a).ejωM (a) = 1 khi và chỉ khi

(M ∩1Fa )(a)

= 1 với a ∈ L\ {1}.

Do đó, (cid:0)l (x) (cid:12) rQ (b) .ejωQ(b)(cid:1) ≤ b.

Bổ đề 4.9. Giả sử rằng dàn phần dư có thứ tự tuyến tính đầy đủ U là liên tục cận dưới 0 thì biểu thức (cid:82) (cid:12) jω∗ r∗ (M ∩1Fa ) (a) .e

P ldrP (b).ejωP (b) = 1, thì dựa vào Bổ đề 4.3, ta có:

Chứng minh: Nếu (cid:82) (cid:12)

jω∗

(P ∩1Kb)(b)

(b) .e

= 1

b ∨ r∗

(P ∩1Kb)

jω∗

(P ∩1Kb)(b)

(b) .e

= 1.

(P ∩1Kb)

jω∗

(P ∩1Kb)(b)

(b) .e

= 1 với b ∈ H\ {1}, thì dựa trên tính chất liên

Do đó nếu b ∈ H\ {1}, thì r∗

(P ∩1Kb)

Và nếu r∗

tục của U trong 1, có thể viết:

jω∗

(P ∩1Kb)(b)(cid:19)

(b) .e

b ∧ r∗

(P ∩1Kb)

ldrP (b).ejωP (b) = ∨ b∈H

(cid:18) (cid:90) (cid:12)

jω∗

(P ∩1Kb)(b)(cid:19)

b ∧ r∗

(b) .e

≥ ∨

(P ∩1Kb)

b∈H\{1}

b = 1.

= ∨

(b ∧ 1) = ∨

b∈H\{1}

(cid:18)

4.3. Đề xuất mô hình hệ suy diễn mờ phức M-CFIS-FKG

Như đã đề cập tới trong phần mở đầu, giới hạn của mô hình M-CFIS-R là thời

gian tính toán với bộ dữ liệu testing còn khá cao. Bên cạnh đó, nếu trong trường hợp

các bản ghi trong bộ dữ liệu testing không có trong bộ cơ sở luật thì khó có thể suy

luận ra đầu ra của bản ghi đó. Do đó, một mô hình hệ suy diễn mờ phức Mamdani

mới với đồ thị tri thức mờ (viết tắt M-CFIS-FKG) được NCS giới thiệu trong mục này

với mục đích cải thiện những hạn chế trong mô hình M-CFIS-R.

4.3.1. Ý tưởng xây dựng mô hình

Với mục đích là cải thiện tốc độ tính toán của quá trình suy diễn trong bộ dữ

liệu Testing, NCS mở rộng mô hình hệ M-CFIS-R theo cách như sau. Bộ dữ liệu đầu

tiên được chia thành 3 phần với tên gọi Training, Validation và Testing. Với bộ dữ liệu

Training, NCS thực hiện tính dữ liệu phần thực và phần ảo. Bằng cách áp dụng mô

hình M-CFIS-R, NCS thu được bộ cơ sở luật mờ phức được thu gọn và hiệu quả. Sau

đó, NCS đi thực hiện xây dựng đồ thị tri thức mờ (FKG) từ bộ cơ sở luật và biểu diễn

nó bởi ma trận kề (thể hiện ở mục 4.3.2 và Hình 4.1). Với bộ dữ liệu Testing, NCS đi

xây dựng Thuật toán tìm kiếm suy diễn nhanh (FISA) để thu được đầu ra từ đồ thị tri

thức mờ (thể hiện ở mục 4.3.3 và Hình 4.2). Cuối cùng, NCS đưa ra một ví dụ số để

minh họa cho mô hình đề xuất (thể hiện ở mục 4.3.4).

g n i n i a r T h n ì r t

á u Q

: 1 . 4

h n ì H

Hình 4.2: Quá trình Testing

4.3.2. Xây dựng đồ thị tri thức mờ

Trong mục này, luận án trình bày cách xây dựng Đồ thị tri thức mờ (FKG) từ

hệ cơ sở luật mờ phức. Cho hệ cơ sở luật mờ phức (Bảng 4.1) với X1, X2, ..., Xm là các

Bảng 4.1: Hệ cơ sở luật mờ phức

Xm−1

X1 High

X2 High

... ... Very high Medium Medium ... Medium

...

Xm High Low ...

... Medium Medium ... Medium Medium

Low

Medium ...

Low

Label 1 2 ... 2 3

Rule R1 R2 ... Rk−1 Rk

Rule label

...

1, 2,... C

High Medium

High Medium Low

Low Very High High Medium Low

thuộc tính của bộ dữ liệu.

Chúng tôi sẽ dần dần xây dựng FKG cho từng luật mờ Rt. Với t = 1, k. Với

mỗi cặp thuộc tính (Xi, Xj) , 1 ≤ i < j ≤ m trong luật Rt, ta xây dựng cạnh như sau

V alue (Xi) → V alue (Xj) với V alue (Xi) là biến ngôn ngữ ứng với thuộc tính Xi. Với

mỗi cặp giá trị (Xi, Label) , 1 ≤ i ≤ m, mỗi cạnh V alue (Xi) → Labelt được xây dựng

đồ thị với Labelt là nhãn của luật thứ t. Đối với các bài toán thực tế, số lượng các biến

ngôn ngữ tùy thuộc vào các biến đầu vào thực tế và phân bố của chúng. Dòng cuối

cùng của Bảng 4.1 chỉ ra một ví dụ về biến ngôn ngữ đối với từng thuộc tính của mô

Hình 4.3: Biểu diễn của luật mờ phức

hình đề xuất. Biểu diễn đồ thị tri thức các luật mờ được chỉ rõ trong Hình 4.3 sau:

ij là trọng số của cạnh V alue (Xi) → V alue (Xj) trong luật t với t = 1, k,

1 ≤ i < j ≤ m, thì At

ij được tính toán theo công thức:

Cho At

ij =

|Xi quan hệ với Xj trong luật thứ t | |R|

(4.11)

il biểu diễn mối quan hệ của thuộc tính Xi với nhãn l trong đó

t = 1, k, 1 ≤ i < j ≤ m, l = 1, C. Thì giá trị Bt

il được tính theo công thức sau:

Trọng số Bt

∗

At ij

il =

| Xi quan hệ với nhãn l trong luật thứ t| |R|

(cid:32) (cid:33) (cid:88) (4.12)

Biểu diễn đồ thị của các luật mờ phức được chỉ rõ trong Hình 4.3, sau đó sẽ

chuyển thành đồ thị FKG như Hình 4.4 và lưu trữ trong một ma trận liền kề.

4.3.3. Thuật toán suy diễn nhanh trên đồ thị tri thức mờ

Điểm khác biệt giữa mô hình M-CFIS-FKG và M-CFIS-R được thể hiện ở

trong quá trình Testing. Bằng việc sử dụng Đồ thị tri thức mờ để biểu diễn luật, quá

Hình 4.4: Đồ thị tri thức mờ

trình Testing gán các nhãn đối với từng bộ dữ liệu đầu vào Testing Hình 4.2. Đối với

mỗi bộ dữ liệu Testing đầu vào, sẽ được thực hiện mờ phức hóa để chuyển các biến

đầu vào giá trị rõ thành các biến đầu vào giá trị mờ phức thông qua việc sử dụng hàm

thuộc mờ phức. Sau đó các giá trị ngôn ngữ sẽ được xác định dựa trên hàm thuộc đầu

vào tương ứng đối với mỗi thuộc tính trong bộ dữ liệu đầu vào. Cuối cùng, thuật toán

tìm kiếm suy diễn nhanh FISA (Fast Inference Search Algorithm) được thực hiện

tính toán trên đồ thị tri thức mờ FKG để có thể đưa ra nhãn tương ứng với từng luật

mờ theo cách như sau.

Đầu tiên các giá trị ngôn ngữ tương ứng với mỗi nhãn trong từng luật trên đồ

thị tri thức mờ FKG được tính toán theo công thức sau:

Cil =

Bt il

(cid:88) (4.13)

il biểu diễn mối quan hệ của thuộc tính Xi với nhãn l. Ý tưởng của gán nhãn (công thức 4.14) dựa trên khái niệm suy luận xấp xỉ , điều đó có nghĩa là các giá

Với giá trị Bt

trị ngôn ngữ của từng bản ghi mới trong bộ dữ liệu Testing được tính toán suy luận

xấp xỉ theo từng thuộc tính tương ứng trong đồ thị FKG, với mục đích tìm ra nhãn

tương ứng phù hợp nhất. Với mỗi bản ghi mới thì nhãn tương ứng với từng luật được

tính bởi toán tử MIN-MAX như sau:

Dl = mini=1,k(Cil) + maxi=1,k(Cil)

(4.14)

Nhãn kết luận cuối cùng của bản ghi mới được xác định bằng luật MAX theo

quy tắc như sau:

Label = p ⇐⇒ Dp = maxl=1,C(Dl)

(4.15)

Thuật toán FISA sẽ mô tả cách thức gán nhãn đầu ra cho từng bản ghi trong bộ

dữ liệu testing.

Algorithm 2 Thuật toán FISA

Bt il

Input Dữ liệu testing Data, Đồ thị tri thức mờ Output Nhãn đầu ra của Dữ liệu testing 1: Xây dựng dữ liệu phần thực và phần ảo 2: Thực hiện mờ hóa để xây dựng các giá trị biến ngôn ngữ 3: Với từng bản ghi thứ t trong bộ dữ liệu 4: Với từng nhãn l 5: Với từng thuộc tính i 6: Tính toán: Cil = (cid:80) t 7: Tính: Dl = mini=1,k(Cil) + maxi=1,k(Cil) 8: Xác định nhãn đầu ra theo quy tắc: Label = p nếu Dp = max l=1,C (Dl) 9: Gán nhãn và lặp lại các bước từ 1-8 đối với từng bản ghi mới cho đến khi kết thúc.

Trong đó, việc xây dựng dữ liệu dữ liệu phần thực và phần ảo tuân theo quy tắc

- Phần thực được xác định dùng chính các giá trị gốc đầu vào

- Phần ảo được tính toán theo công thức var.R (bản ghi) + var.A (thuộc tính)

trong đó: Var.R (bản ghi) là giá trị phương sai trên bản ghi thứ P còn Var.A (thuộc

tính) là giá trị phương sai trên thuộc tính Q.

Thuật toán FISA cho phép gán nhãn cho từng luật đầu vào sau khi mờ hoá dữ

liệu. Mô hình đề xuất được phân tích và cho kết quả thời gian thực hiện thuật toán với

tổng thời gian giảm hơn nhiều so với thuật toán MCFIS-R.

4.3.4. Ví dụ minh họa hệ suy diễn mờ phức M-CFIS-FKG

Trong mục này, luận án trình bày một ví dụ số được đưa ra để minh hoạ rõ cho

mô hình đề xuất.

Ví dụ: Cho bộ luật gồm có sáu luật mờ phức với hai nhãn (k = 1 và k = 2) như

R1: If x1 is Medium1 and x2 is High2 and x3 is High3 then k is 1

R2: If x1 is High1 and x2 is Low2 and x3 is Low3 then k is 2

R3: If x1 is Low1 and x2 is Medium2 and x3 is High3 then k is 1

R4: If x1 is Low1 and x2 is High2 and x3 is Medium3 then k is 1

R5: If x1 is High1 and x2 is Low2 and x3 is Medium3 then k is 2

R6: If x1 is Medium1 and x2 is Low2 and x3 is Low3 then k is 2

Bước 1. Xây dựng Đồ thị tri thức mờ

ij bằng công thức (4.11) được

Xem xét với luật R1, ta có thể tính được giá trị A1

= 1/6

12 =

|M edium1 → High2 | |R|

= 1/6

13 =

|M edium1 → High3 | |R|

= 1/6

23 =

|High2 → High3 | |R|

các giá trị như sau:

il đối với nhãn đầu ra theo công thức (4.12) như sau:

Sau đó, tính toán được giá trị B1

∗

11 = (cid:0)A1 B1

12 + A1

13 + A1 23

| Medium1 → 1 | |R|

1 6

1 12

(cid:17) (cid:1) ∗ (cid:16) 1 6

2l = 1/6 và B1

3l = 1/6.

Tương tự, ta tính được giá trị B1

ij, B1

il từ sáu luật như

Kết quả thu được ma trận kề chứa các giá trị tính toán A1

Rule At

23 Bt 13 At 12 At 1/6 1/6 1/6 1/12

1l Bt 1/6

2l Bt 3l 1/6

1/3 1/6 1/3 5/18 5/12 5/18

1/6 1/6 1/6

1/6

1/12

1/6

1/6 1/6 1/6 1/3 1/6 1/6

1/6 2/9

1/6 1/3

1/12 1/9

4 5

1/6 1/6 1/3

1/9

1/3

2/9

Đồ thị FKG cho sáu luật được mô tả trong Hình 4.5 sau đây.

Bước 2. Áp dụng thuật toán FISA đối với quá trình Testing

Trong quá trình Testing, mục đích cần phải gán được nhãn cho mỗi bản ghi

bằng sử dụng thuật toán FISA trên đồ thị FKG đã thu được. Ở ví dụ này minh hoạ việc

gán nhãn đối với bộ luật mờ phức sinh ra sau khi mờ hoá bộ dữ liệu Testing đầu vào.

1) Trường hợp 1: Giả sử gán nhãn cho sáu luật đầu vào mà có điều kiện tương

tự như với sáu luật mờ phức ban đầu. Điều đó có nghĩa các luật mới đều phù hợp với

100

Hình 4.5: Đồ thị FKG cho sáu luật

bộ luật cơ sở mờ phức ban đầu. Bộ sáu luật đầu vào được đặt tên tương ứng là Rule 1,

. . . , Rule 6.

Dựa theo công thức (4.13), ta thu được Cil đối với từng nhãn đầu ra l (1 or 2).

Xem xét luật R1, với nhãn đầu ra là l = 1 ta thu được:

C11 =

11 = B11 = 1/12,

(cid:88)

C21 =

21 = B21(rule R1) + B21(rule R4) = 1/6 + 1/6 = 1/3,

t (cid:88)

C31 =

31 = B31(rule R1) + B31(rule R3) = 1/6 + 1/6 = 1/3.

(cid:88)

C22 = 0, C32 = 0.

Với nhãn đầu ra l = 2, tính toán theo cách tương tự ta thu được C12 = 1/9,

Cuối cùng ta thu được kết quả các giá trị của Cil tương ứng với mỗi nhãn đầu

ra như sau:

Với nhãn 1:

101

Rule C11 C21 C31 1/3

1/12

1/3

1/3 1/3

1/12 1/3

1/3 1/12

3 4

1/12

Rule C12 C22 C32 0

1/9

1/2 13/12 1/2

1/9 0 0 1/2 13/12 1/9

4 5

1/9 13/12 1/2

Với nhãn 2:

Áp dụng toán tử trong công thức 4.14 để tính toán giá trị Dl đối với từng nhãn

đầu ra (l = 1, l = 2), cụ thể như sau:

Dl = min (C11, C21, C31) + max (C11, C21, C31) = 1/2 + 1/3 = 5/6

Dl = min (C12, C22, C32) + max (C12, C22, C32) = 1/9

Với luật 1:

Do Dl > D2 nên theo (4.15), nhãn đầu ra của luật 1 là 1.

Tương tự, ta thu được nhãn đầu ra của các luật 2, luật 3, luật 4, luật 5, luật 6

tương ứng là 2, 1, 1, 2, 2. Theo như kết quả cho thấy thì nhãn đầu ra của sáu luật đầu

vào khi được thực hiện thông qua thuật toán FISA có kết quả tương tự như với sáu luật

cơ sở ban đầu.

2) Trường hợp 2: Ở trường hợp này thuật toán FISA được sử dụng để gán các

nhãn đầu ra đối với từng mẫu bản ghi đầu vào với các bản ghi có thể không có sẵn

trong bộ sáu luật cơ sở ban đầu. Cụ thể như sau:

i) Giả sử có luật 1 như sau:

If x1 is Medium1 and x2 is High2 and x3 is Medium3 then Label =?

Dựa vào đồ thị tri thức của các luật chỉ rõ trong Hình 4.5 có thể chỉ ra rằng

không có cạnh nào nối từ nhãn ngôn ngữ Medium1 tới High2 và nối từ nhãn High2

tới Medium3. Tuy nhiên từng cạnh riêng tới nhãn vẫn có tồn tại trong đồ thị. Bằng

102

việc sử dụng mô hình suy diễn trong Suy luận xấp xỉ trong thuật toán FISA thì ta có

thể gán nhãn cho từng luật theo cách sau.

D1 = min(CM edium1,1, CHigh2,1, CM edium3,1) + max(CM edium1,1, CHigh2,1, CM edium3,1)

= 1/12 + 1/3 = 5/12

Với nhãn 1: ta có CM edium1,1 = 1/12 , CHigh2,1 = 1/3 , CM edium3,1 = 1/12 ,

D2 = min(CM edium1,2, CHigh2,2, CM edium3,2) + max(CM edium1,2, CHigh2,2, CM edium3,2)

= 0 + 1/9 = 1/9

Với nhãn 2, ta có: CM edium1,2 = 1/9, CHigh2,2 = 0, CM edium3,2 = 1/9

Do Dl > D2 nên suy ra nhãn của luật là 1.

ii) Xét luật 2 như sau:

If x1 is High1 and x2 is Medium2 and x3 is Low3 then Label =?

Với luật đang xét và trên đồ thị tri thức FKG diễn tả các luật cơ sở thì cũng

không có cạnh từ nhãn Medium2 tới Low3. Do đó, ta cần sử thuật toán suy luận xấp

xỉ trong FISA để gán nhãn cho luật mới này. Tính toán tương tự như luật trên ta thu

được D1 = 1/12, D2 = 19/18. Vì vậy mà nhãn đầu ra của luật mới này được gán bằng

iii) Xét trường hợp luật cuối cùng với trường hợp giả sử không có cạnh nào

trong đồ thị tri thức biểu diễn luật đó:

If x1 is Medium1 and x2 is Medium2 and x3 is Medium3 then Label =?

Trên đồ thị FKG, không có cạnh nào đi từ nhãn Medium1 tới Medium2 và cũng

không có cạnh nào nối từ nhãn Medium2 tới Medium3. Do đó phương pháp suy luận

xấp xỉ trong thuật toán FISA được dùng để gán nhãn đầu ra đối với trường hợp này.

Tính toán tương tự như trên thì thu được D1 = 1/6, D2 = 1/4. Do đó, nhãn đầu ra

được gán là 2.

Với ví dụ số về các trường hợp có thể xảy rađối với dữ liệu đầu vào đã minh họa

rõ về khả năng suy diễn đầu ra dựa trên đồ thị tri thức FKG và mô hình suy luận xấp

xỉ trong thuật toán FISA. Nó giúp cho chúng ta có thể suy luận một cách linh động,

mềm dẻo hơn đối với những trường hợp thiếu tri thức hay những hệ thống mà có quá

ít luật biểu diễn.

103

4.4. Thực nghiệm và đánh giá kết quả

4.4.1. Thực nghiệm

Việc đánh giá hiệu quả của mô hình đề xuất trong việc giải quyết bài toán hỗ

trợ ra quyết định như sau. Để việc đánh giá hiệu quả hơn thì trong nội dung này, mô

hình đề xuất được thực nghiệm với hai loại bộ dữ liệu (bộ dữ liệu hai nhãn và bộ dữ

liệu nhiều nhãn). Các bộ dữ liệu hai nhãn là hai bộ dữ liệu chuẩn Benchmark được lấy

từ kho dữ liệu chuẩn gồm (Bộ Breast Wisconsin, Bộ Diabetes) và một bộ dữ liệu thực

Liver. Bộ dữ liệu nhiều nhãn là bộ lấy từ kho dữ liệu chuẩn UCI bao gồm bộ dữ liệu

Wine, bộ Cardiotcography-CTG và bộ Arrthymia.

Trong thực nghiệm, mỗi bộ dữ liệu sẽ được chia làm bốn nhóm bao gồm bộ

dữ liệu Training, bộ dữ liệu Testing, bộ dữ liệu Validation và bộ dữ liệu New data. Bộ

dữ liệu New data là bộ dữ liệu bao gồm các bản ghi mới được sử dụng với mục đích

kiểm tra mô hình đề xuất trong trường hợp không có bản ghi nào xuất hiện trong phần

Training (dùng để đo độ tương thích và khả năng suy luận của mô hình đề xuất).

Bảng 4.2: Kịch bản 1

Dữ liệu Training Validation Testing New data

Số lượng bản ghi đối với mỗi nhãn 2/3 ∗ 2/3 ∗ 0.6∗(Số lượng bản ghi đối với mỗi nhãn) 2/3 ∗ 1/3 ∗ 0.6∗(Số lượng bản ghi đối với mỗi nhãn) 1/3 ∗ 0.6∗ (Số lượng bản ghi đối với mỗi nhãn) 0.4∗ (Số lượng bản ghi đối với mỗi nhãn)

Bảng 4.3: Kịch bản 2

Dữ liệu

Training

Validation

Testing

New data

Nếu số lượng bản ghi đối với mỗi nhãn/Tổng số bản ghi >5% 2/3*2/3*0.3*(Số lượng bản ghi đối với mỗi nhãn) 2/3*1/3*0.3* (Số lượng bản ghi đối với mỗi nhãn) 1/3*0.3* (Số lượng bản ghi đối với mỗi nhãn) 0.7* (Số lượng bản ghi đối với mỗi nhãn)

Nếu số lượng bản ghi đối với mỗi nhãn/Tổng số bản ghi >5% 2/3*2/3*0.05* (Số lượng bản ghi đối với mỗi nhãn) 2/3*1/3*0.05* (Số lượng bản ghi đối với mỗi nhãn) 1/3*0.05* (Số lượng bản ghi đối với mỗi nhãn) 0.7* (Số lượng bản ghi đối với mỗi nhãn)

Hai kịch bản chạy thực nghiệm được chỉ rõ trong Bảng 4.2 và 4.3.

104

Bảng 4.2 là kịch bản chạy thực nghiệm được sử dụng để đánh giá mô hình

M-CFIS-FKG với M-CFIS-R về độ chính xác cũng như thời gian chạy thực nghiệm

với từng bộ dữ liệu. Còn kịch bản trong Bảng 4.3 được sử dụng với mục đích dùng

để kiểm chứng khả năng suy luận của mô hình đề xuất trong trường hợp kích thước

của bộ dữ liệu mới nhiều hơn rất nhiều so với các bộ dữ liệu Training, Testing và

Validation. Bên cạnh đó, một số nhãn đầu ra có thể có hoặc có rất ít trong bộ dữ liệu

Training. Điều này sẽ kiểm chứng cách thức mô hình sinh ra từ bộ dữ liệu Training để

(a) Bộ WBCD

(b) Bộ Diebetes

Hình 4.6: Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có 2 nhãn

thực hiện suy luận với dữ liệu mới.

Đối với mỗi bộ dữ liệu hai nhãn và nhiều nhãn, Hình 4.6 và 4.7 mô tả cách

nhìn trực quan về cách phân chia các nhãn đầu ra tương ứng với các bộ dữ liệu, trong

đó Hình 4.6 dành cho các bộ dữ liệu hai nhãn và Hình 4.7 dành cho các bộ dữ liệu

có nhiều nhãn. Tiêu chí đánh giá thực nghiệm theo hai kịch bản là dựa trên thời gian

thực hiện và độ chính xác của mô hình so sánh.

4.4.2. Kết quả thực nghiệm

4.5.2.1 Kết quả thực nghiệm trên các bộ dữ liệu 2 nhãn

Đối với các bộ dữ liệu hai nhãn, kết quả thực nghiệm so sánh mô hình đề xuất

M-CFIS-FKG với mô hình M-CFIS-R được thực hiện so sánh trên hai tiêu chí đánh

105

(a) Bộ Wine

(b) Bộ CTG

Hình 4.7: Phân bố dữ liệu với từng nhãn đối với bộ dữ liệu có nhiều nhãn

giá gồm thời gian thực hiện và độ chính xác. Cụ thể như sau:

Hình 4.8 minh họa thực nghiệm so sánh về độ chính xác và thời gian tính toán

của hai mô hình trên bộ dữ liệu WBCD. Như đã chỉ rõ trong hình 4.8(a) thì ta có thể

thấy không có nhiều sự khác biệt về độ chính xác giữa hai kịch bản thực nghiệm. Với

kịch bản thực nghiệm thứ nhất, độ chính xác của mô hình M-CFIS-FKG thấp hơn chút

so với mô hình M-CFIS-R (khoảng 13.93%). Còn với kịch bản thực nghiệm thứ hai

thì độ chính xác của mô hình M-CFIS-FKG chỉ thấp hơn khoảng 3.44%. Tuy nhiên,

thời gian thực hiện tính toán của mô hình M-CFIS-FKG lại thấp hơn nhiều so với mô

106

hình M-CFIS-R trên cả hai kịch bản thực nghiệm (trung bình giảm gần 97% tổng thời

gian thực hiện). Hơn nữa, đối với bộ dữ liệu mới, tổng thời gian thực hiện của mô hình

M-CFIS-R (ví dụ 1.98s đối với kịch bản thứ nhất và 2.44s đối với kịch bản thứ hai)

cao hơn nhiều so với tổng thời gian thực hiện của mô hình M-CFIS-FKG (tương ứng

là 0.05s đối với kịch bản thứ nhất và 0.1s đối với kịch bản thứ hai). Điều đó thể hiện

cho thấy mô hình đề xuất M-CFIS-FKG có khả năng suy luận xấp xỉ tốt hơn đối với

(a) Độ chính xác

(b) Thời gian thực hiện

Hình 4.8: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu WBCD

những bản ghi không có sẵn trong bộ Training.

Hình 4.9 thể hiện kết quả thực nghiệm so sánh giữa hai mô hình M-CFIS-R và

M-CFIS-FKG trên bộ dữ liệu Diabetes. Như thể hiện trong hình 4.9(a), độ chính xác

của mô hình đề xuất M-CFIS-FKG nhỏ hơn chút so với mô hình M-CFIS-R trên cả hai

kịch bản chạy thực nghiệm (cụ thể trung bình khoảng 6.89% đối với kịch bản thứ nhất

và 3.82% đối với kịch bản thứ hai). Còn về thời gian thực hiện thì tổng thời gian thực

107

hiện của mô hình M-CFIS-FKG vẫn thấp hơn so với mô hình M-CFIS-R. Đặc biệt

trong kịch bản thực nghiệm thứ hai, thời gian thực nghiệm của mô hình M-CFIS-R

cao gấp 2.31 lần so với M-CFIS-FKG mà với độ chính xác gần như nhau (76.43% đối

với M-CFIS-R và 74.43% đối với M-CFIS-FKG – mô tả trong hình 4.9(a)). Như vậy,

ta có thể thấy M-CFIS-FKG thực hiện tốt hơn đối với dữ liệu mới trong kịch bản thực

(a) Độ chính xác

(b) Thời gian thực hiện

Hình 4.9: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Diebetes

nghiệm thứ hai.

Kết quả thực nghiệm đối với bộ dữ liệu thực Liver được mô tả rõ trong Hình

4.10. Rõ ràng là đối với kịch bản thực nghiệm thứ nhất, độ chính xác của M-CFIS-

FKG thấp hơn 4.27% so với M-CFIS-R nhưng thời gian tính toán thì trung bình giảm

khoảng 3.77 lần. Còn trong kịch bản thực nghiệm thứ hai, mô hình M-CFIS-FKG

được cho là hiệu quả hơn so với M-CFIS-R với độ chính xác thấp hơn khoảng 2.23%

nhưng tổng thời gian thực hiện lại giảm tới 4.1 lần. Hơn nữa, trong trường hợp có

nhiều dữ liệu mới trong kịch bản thứ hai, mô hình M-CFIS-FKG cho kết quả gần như

108

tương đương, độ chính xác thấp hơn 1.14% với thời gian chạy giảm 33.56% so với mô

(a) Độ chính xác

(b) Thời gian thực hiện

Hình 4.10: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Liver

4.5.2.2 Kết quả thực nghiệm trên các bộ dữ liệu nhiều nhãn

hình M-CFIS-R.

Đối với các bộ dữ liệu nhiều nhãn, kết quả thực nghiệm được chỉ rõ trong các

hình 4.11- 4.13. Đối với các bộ dữ liệu nhiều nhãn, độ phân bố dữ liệu trong từng

nhóm dữ liệu cũng khác hơn so với các bộ dữ liệu có hai nhãn, điều đó cũng dẫn đến

kết quả thực nghiệm khác so với các bộ dữ liệu có hai nhãn.

Độ chính xác và thời gian tính toán của thuật toán M-CFIS-R và M-CFIS-FKG

trên bộ dữ liệu Wine được minh họa rõ trong Hình 4.11. Ở hình 4.11(a), độ chính xác

của mô hình M-CFIS-FKG chỉ thấp hơn chút so với của mô hình M-CFIS-R, ngoại

trừ đối với dữ liệu mới trong kịch bản hai. Kết quả trung bình là thấp hơn 7.8% và

5.3% tương ứng với kịch bản thực nghiệm thứ nhất và thứ hai. Giống như kết quả thực

109

(a) Độ chính xác

(b) Thời gian thực hiện

Hình 4.11: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Wine

nghiệm đối với các bộ dữ liệu khác thì thời gian tính toán của mô hình M-CFIS-FKG

thấp hơn nhiều so với thời gian chạy mô hình M-CFIS-R. Đặc biệt trong trường hợp

có nhiều dữ liệu mới trong kịch bản chạy thực nghiệm thứ hai thì độ chính xác của

M-CFIS-FKG chỉ thấp hơn 0.37% với thời gian thực hiện giảm tới 2.88 lần.

Đối với bộ dữ liệu ảnh chụp tim thai CTG, độ chính xác và tổng thời gian thực

hiện tính toán của hai mô hình được mô tả rõ trong Hình 4.12, và có cùng chung kết

quả thực nghiệm như đối với các bộ dữ liệu trên. Mô hình M-CFIS-FKG được cho là

tốt hơn mô hình M-CFIS-R trong trường hợp chạy thực nghiệm đối với kịch bản hai,

tức là đối với trường hợp có nhiều dữ liệu mới (độ chính xác thấp hơn 1.27% nhưng

tổng thời gian thực hiện thì thấp hơn 2.49).

Đối với bộ dữ liệu rối loạn nhịp tim Arrhythmia, sự phân bố dữ liệu trong kịch

bản hai cũng chịu ảnh hưởng nhiều như với các bộ dữ liệu nhiều nhãn khác.

Như đã mô tả rõ trong hình 4.7(c), rất nhiều nhãn không có trong bộ dữ liệu

110

(a) Độ chính xác

(b) Thời gian thực hiện

Hình 4.12: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu CTG

Training, nhưng vẫn giữ nguyên trong bộ dữ liệu mới để kiểm chứng cho vấn đề suy

luận xấp xỉ ra nhãn đầu ra cuối cùng của mô hình đề xuất. Trong trường hợp này thì

độ chính xác của mô hình M-CFIS-FKG cao hơn M-CFIS-R (khoảng 1.94%) trong

khi thời gian thực hiện giảm đi khoảng 3.88 lần. Điều đó có nghĩa là mô hình đề xuất

M-CFIS-FKG thực sự hiệu quả trong việc suy luận trong trường hợp có nhiều thông

tin mới không sẵn có trong bộ dữ liệu Traning và thậm chí cả trong quá trình Testing.

Như vậy, với kịch bản thực nghiệm thứ nhất trên tất cả các bộ dữ liệu, số lượng

dữ liệu trong các nhãn đầu ra đối với từng bộ dữ liệu là tương đương nhau (cụ thể

trong Bảng 4.2). Trong trường hợp này, các nhãn đều được phân bố đồng đều trong

các bộ dữ liệu Training, Testing và New data. Điều này cũng góp phần làm giảm tổng

thời gian thực hiện của mô hình M-CFIS-FKG. Bên cạnh đó, kết quả về độ chính xác

của mô hình M-CFIS-FKG và M-CFIS-R trên các bộ dữ liệu có nhiều nhãn đầu ra

cũng nhỏ hơn nhiều so với các bộ dữ liệu có hai nhãn. Điều đó chứng minh được tính

111

(a) Độ chính xác

(b) Thời gian thực hiện

Hình 4.13: So sánh mô hình M-CFIS-R và M-CFIS-FKG trên bộ dữ liệu Arrhythmia

hiệu quả của mô hình đề xuất M-CFIS-FKG đối với các bộ dữ liệu có nhiều nhãn đầu

ra.

Sự khác nhau giữa các bộ dữ liệu hai nhãn và nhiều nhãn được thể hiện ở sự

phân bố các nhãn trong bộ dữ liệu New data trong kịch bản thực nghiệm thứ hai. Trong

kịch bản này, đặc biệt trong bộ dữ liệu New data chứa nhiều nhãn đầu ra không có hay

ít có xuất hiện trong hai bộ dữ liệu Training và Testing. Chính vì đó mà thực nghiệm

trên bộ dữ liệu này sẽ chứng minh được khả năng suy luận xấp xỉ của mô hình đề xuất.

Trong một số trường hợp thì có thể nói mô hình M-CFIS-FKG mới này có khả năng

suy luận, khám phá thông tin đối với cả các thông tin mới từ các bản ghi không quen

thuộc.

Bằng kết quả thực nghiệm đối với tất cả các bộ dữ liệu theo kịch bản thực

nghiệm thứ hai, mô hình M-CFIS-FKG đã chứng tỏ khả năng phân loại mẫu gần

chính xác tương đương với mô hình M-CFIS-R (thậm chí có bộ dữ liệu còn có độ

112

chính xác cao hơn, ví dụ như ở bộ dữ liệu Arrhythmia) với thời gian chạy trung bình

thấp (trung bình giảm khoảng 6.45 lần). Điều này chứng tỏ mô hình M-CFIS-FKG

hoạt động hiệu quả trong quá trình suy luận.

Kết quả thực nghiệm của mô hình M-CFIS-KFG trên cả hai kịch bản thực

nghiệm về mặt thời gian tính toán và độ chính xác của mô hình đã chứng minh được

tính hiệu quả của mô hình đề xuất trong việc giảm khá nhiều thời gian tính toán mô

hình với độ chính xác được coi là chấp nhận được. Đặc biệt mô hình có ý nghĩa thực

tiễn đối với những trường hợp thiếu thông tin dữ liệu trong kho dữ liệu mẫu.

4.5. Kết Chương 4

Trong nội dung chương này, luận án đưa ra một số chú ý và thuật toán mới đối

với Hệ suy diễn mờ phức (CFIS) mà có nhiều ứng dụng quan trọng trong việc giải

quyết các vấn đề hỗ trợ ra quyết định trong thế giới thực. Mô hình Hệ suy diễn mờ

phức Mamdani trong Chương 3 (M-CFIS-R) còn nhiều hạn chế như thời gian tính

toán còn nhiều và khả năng suy luận chưa được cao, nhất là khi xử lí đối với các bộ

dữ liệu mới. Do đó, trong nội dung chương này NCS đã nghiên cứu và phát triển tiếp

mô hình M-CFIS-R, cụ thể như sau:

Trước tiên NCS đề xuất mở rộng mô hình M-CFIS-R: bao gồm Hệ suy diễn

mờ phức Sugeno (S-CFIS-R) và Hệ suy diễn mờ phức Tsukamoto (T-CFIS-R), độ đo

mờ phức và tích phân mờ phức. Đặc biệt, độ đo mờ phức và tích phân mờ phức cũng

cung cấp một số lý thuyết cũng như định lý cơ bản trong các ngữ cảnh khác nhau.

Thêm nữa, để khắc phục những hạn chế về mặt thời gian tính toán và khả năng

suy luận đối với mô hình M-CFIS-R thì NCS cũng đề xuất xây dựng Đồ thị tri thức

mờ (FKG) từ bộ cơ sở luật trong quá trình Training. Sau đó đồ thị tri thức mờ đó được

dùng để biểu diễn các nhãn ngôn ngữ và mối quan hệ giữa các thành phần đó trong

cơ sở luật. Kết quả thu được là một ma trận kề của đồ thị FKG và có thể thực hiện suy

luận trên đồ thị đó. Khi có một bản ghi mới được đưa vào trong bộ dữ liệu Testing, thì

bộ dữ liệu đó sẽ được mờ hoá và gán nhãn. Dựa vào đồ thị FKG thì từng thành phần

của bản ghi mới này sẽ được thực hiện thông qua cơ chế suy luận xấp xỉ gần đúng

(thuật toán FISA) để lựa chọn luật phù hợp một cách nhanh chóng nhất bằng cách so

113

khớp các bản ghi trong tập dữ liệu Testing với các luật mờ phức trong Bộ cơ sở luật

mờ phức đã thu được. Sau đó, việc lấy nhãn của bản ghi được thực hiện thông qua

toán tử Max-min. Cơ chế này sẽ giúp không những chỉ tăng tốc độ kiểm tra mà còn

giúp cho quá trình suy luận trong trường hợp có nhiều bản ghi mới mà không có sẵn

trong bộ dữ liệu Training.

Để chứng minh tính hiệu quả của mô hình M-CFIS-FKG đề xuất so với mô

hình M-CFIS-R, NCS thực nghiệm trên các bộ dữ liệu chuẩn UCI và dữ liệu Bệnh

gan thực trên hai kịch bản đánh giá. Kịch bản thứ nhất được dùng để đánh giá hiệu

suất của thuật toán dựa trên thời gian tính toán và độ chính xác. Với mục đích kiểm

tra khả năng suy luận của thuật toán trong trường hợp kích thước của dữ liệu mới lớn

hơn nhiều kích thước trong ba quá trình Training, Validation và Testing thì kịch bản

thứ hai được đưa vào thực nghiệm kiểm thử. Bên cạnh đó, còn có trường hợp có một

số nhãn trong dữ liệu mới không có hoặc có ít các bản ghi có trong dữ liệu Training.

Điều này có thể đánh giá được cách mà mô hình sinh ra từ dữ liệu Training để xử

lý đối với trường hợp dữ liệu mới. Kết quả thực nghiệm đã chỉ rõ độ chính xác của

mô hình M-CFIS-FKG trong kịch bản thứ nhất thấp hơn mô hình M-CFIS-R (khoảng

13.93%) và 3.44% đối với kịch bản thứ hai. Thời gian tính toán là một lợi thế của M-

CFIS-FKG, trong tất cả các trường hợp và trên hai kịch bản thì thời gian thực hiện của

M-CFIS-FKG đều thấp hơn so với M-CFIS-R (trung bình giảm khoảng 97%). Với các

bộ dữ liệu đa nhãn, khả năng suy luận được thể hiện rõ với mô hình M-CFIS-FKG đề

xuất. Tóm lại, mô hình M-CFIS-FKG phân loại mẫu với độ chính xác gần như tương

đương với mô hình M-CFIS-R (thậm chí còn cao hơn trong bộ dữ liệu Arrhythmia) và

với thời gian chạy thấp (trung bình khoảng 6.45 lần). Điều này chứng tỏ rằng mô hình

M-CFIS-FKG thực hiện hiệu quả hơn trong quá trình suy luận.

Các kết quả nghiên cứu ở Chương 4 được công bố trong công trình [A4], phần

“Danh mục các công trình” của luận án.

114

Chương 4. KẾT LUẬN

Những kết quả chính của luận án

Luận án tham gia vào dòng nghiên cứu về vấn đề Hỗ trợ ra quyết định đối với

các lớp bài toán có dữ liệu có tính chu kì, định kì và có yếu tố bổ sung. Cụ thể luận án

đã tập trung vào một số vấn đề còn tồn tại thiếu sót của các hệ thống đã có và đưa ra

được một số đóng góp chính như sau:

Kết quả của luận án bao gồm:

Thứ nhất, luận án đề xuất các phép toán t-chuẩn, t-đối chuẩn dựa trên tập mờ

phức.

Phép toán t-chuẩn và t-đối chuẩn được coi là phần quan trọng đối với việc phát

triển các phép toán trong lý thuyết tập mờ phức. Cho nên, với định hướng phát triển

thêm về lý thuyết tập mờ phức thì luận án đề xuất thêm về toán tử t-chuẩn và t-đối

chuẩn. Ngoài ra, để chứng minh tính hiệu quả của phép toán đề xuất với việc giải

quyết các vấn đề trong hệ hỗ trợ ra quyết định, ví dụ số minh họa cũng được thực hiện

nhằm áp dụng phép toán t-chuẩn và t-đối chuẩn mờ phức cũng được đưa ra trong nội

dung luận án.

Thứ hai, luận án đề xuất mô hình Hệ suy diễn mờ phức Mamdani (M-CFIS).

Với ý tưởng từ hệ logic mờ phức của Ramot, luận án chọn phương pháp suy

diễn đơn giản nhất hệ FIS Mamdani làm thành phần điều khiển Module suy diễn mờ

phức trong hệ logic mờ phức của Ramot. Mô hình M-CFIS luận án đề xuất là sự kết

hợp của hệ FIS Mamdani và hệ logic mờ phức của Ramot dựa trên nền tảng lý thuyết

của tập mờ phức. Trong đó, mô hình cũng chỉ ra rõ những thành phần, các phép toán

được sử dụng trong mô hình Hệ suy diễn mờ phức Mamdani. Thử nghiệm đối với các

bộ dữ liệu mẫu lấy từ kho dữ liệu UCI và dữ liệu thực lấy từ bệnh viện Gang thép

và Đa khoa Thái Nguyên cũng chứng minh cho thấy mô hình đề xuất cải thiện hơn

mô hình hệ suy diễn mờ Mamdani trên các chỉ số đánh giá độ chính xác, Recall và

Precision.

115

Thứ ba, đề xuất mô hình M-CFIS-R.

Nhận xét thấy mô hình hệ M-CFIS đề xuất còn nhiều hạn chế trong bộ luật cơ

sở, quá trình giảm luật còn thô sơ chỉ giảm luật trùng lặp và yếu. Bộ luật cơ sở đó

vẫn còn có thể còn có chứa các luật dư thừa nên luận án đề xuất xây dựng hệ thống

M-CFIS-R là hệ thống cải tiến của M-CFIS trong hệ cơ sở luật. Trong hệ thống M-

CFIS-R, các độ đo tương tự mờ phức được đề xuất kết hợp với tính toán hạt để thực

hiện phương thức tinh giảm luật mờ trong mô hình hệ suy diễn mờ phức Mamdani

M-CFIS. Kết quả thực nghiệm trên cả bộ dữ liệu chuẩn và dữ liệu thực cũng cho thấy

phương thức tinh giảm luật đề xuất trong hệ M-CFIS-R đã giảm thiểu được số lượng

luật và nâng cao độ chính xác của mô hình mới so với mô hình cũ M-CFIS.

Thứ tư, luận án đề xuất một số mở rộng của mô hình M-CFIS-R.

Với hạn chế còn tồn tại của hệ thống M-CFIS-R là chỉ thực hiện với mô hình

hệ FIS đơn giản Mamdani nên luận án đề xuất phát triển với các mô hình mờ khác

là Sugeno và Tsukamoto. Thêm nữa, nhằm bổ sung cho lý thuyết độ đo dựa trên lý

thuyết tập mờ phức, luận án cũng đưa ra lý thuyết thêm về độ đo mờ phức và tích phân

mờ phức dựa trên nền tảng lý thuyết tập hợp.

Cuối cùng, luận án đề xuất cải tiến mô hình M-CFIS-R bằng đề xuất xây dựng

mô hình M-CFIS-FKG. Nếu mô hình M-CFIS-R là mô hình cải tiến của M-CFIS

trong giai đoạn Training thì mô hình M-CFIS-FKG mà mô hình cải tiến của M-FIS và

M-FIS-R trong giai đoạn Testing. Phương thức biểu diễn luật mờ trên đồ thị tri thức

mờ được giới thiệu sử dụng để cải tiến quá trình Testing. Thêm nữa, phương pháp suy

diễn xấp xỉ thực hiện suy luận trên đồ thị tri thức mờ được giới thiệu sử dụng trong

mô hình M-CFIS-FKG đối với trường hợp dữ liệu trong bộ Testing có ít hoặc không

có trong bộ Training. Hiệu quả của mô hình đề xuất trong hệ hỗ trợ ra quyết định đã

được chứng minh thông qua thực nghiệm trên các bộ dữ liệu hai nhãn và nhiều nhãn

với hai kịch bản thực nghiệm (kịch bản thứ nhất nhằm đánh giá mô hình mới đề xuất

M-CFIS-FKG về độ chính xác cũng như thời gian thực hiện còn kịch bản thứ hai nhằm

kiểm chứng khả năng suy luận của mô hình trong trường hợp kích thước của bộ dữ

liệu mới nhiều hơn rất nhiều so với các bộ dữ liệu đã có).

Bên cạnh các kết quả nghiên cứu đã đạt được, những nghiên cứu trong luận án

vẫn còn tồn tại một số điểm hạn chế như:

– Tính chu kì, định kì hay các thông tin bổ sung thể hiện trong dữ liệu mờ phức

còn đơn giản. Việc tác động giữa dữ liệu không gian và yếu tố thời gian/chu kì

thời gian còn chưa được thực hiện.

116

– Luận án mới chỉ thực nghiệm trên các bộ dữ liệu số, còn dữ liệu không gian chưa

được thực hiện.

– Việc xây dựng hệ luật trong mô hình còn đơn giản, chưa áp dụng các cơ chế học

trong đó mà chỉ xây dựng hệ luật từ bộ dữ liệu đầu vào.

– Việc đánh giá hiệu năng của hệ luật cơ sở chỉ dừng lại ở mức tối ưu cục bộ, đơn

giản chưa thực hiện được tối ưu toàn cục.

– Một số phép toán và độ đo trên tập mờ phức trong nghiên cứu đang ở mức cơ

bản, còn chưa quan tâm nhiều đến toàn bộ không gian của thành phần pha. Các

mở rộng dựa trên nền các phép toán cổ điển được coi như là một tiền đề cho sự

phát triển.

Hướng phát triển của luận án

Trong tương lai, định hướng phát triển tiếp theo của luận án có thể thực hiện

theo các hướng nghiên cứu sau:

– Tiếp tục nghiên cứu và khắc phục những mặt hạn chế của các độ đo tương tự đã

đề xuất.

– Tiếp tục nghiên cứu, đề xuất toán tử hợp thành trên tập mờ phức và áp dụng các

toán tử đề xuất vào trong chính mô hình hệ hỗ trợ ra quyết định.

– - Tiếp tục cải tiến mô hình hệ suy diễn mờ phức nhằm nâng cao chất lượng của

mô hình như: o Tích hợp các phương pháp khác nhau lựa chọn các đặc trưng và

luật suy diễn cho quá trình học. o Thể hiện trọng số luật trong mô hình o Cải

tiến các toán tử/độ đo sử dụng trong mô hình phù hợp hơn với một số bài toán

chuyên biệt như bài toán chuẩn đoán bệnh, bài toán dự báo nhiệt độ, . . .

– Tiếp tục nghiên cứu, đề xuất các thuật toán học như học chuyển giao, học cộng

tác ... vào trong quá trình tinh giảm luật mờ với mục tiêu tối ưu hóa hệ luật.

– Tiếp tục nghiên cứu, đề xuất các phương pháp biểu diễn hệ luật mờ phức, phương

pháp suy diễn mới nhằm mục đích nâng cao khả năng tìm kiếm trên đồ thị tri

thức mờ.

– Thử nghiệm các mô hình đề xuất trong luận án với nhiều bộ dữ liệu phức tạp

hơn trong các lĩnh vực khác nhau trong cuộc sống như: y tế, kinh tế , địa lý...

117

– Áp dụng, triển khai và tích hợp các nghiên cứu đã đề xuất cho các hệ thống trong

thực tiễn như chăm sóc sức khỏe, dự báo bão, . . .

118

DANH MỤC CÁC CÔNG TRÌNH CỦA LUẬN ÁN

A1. Tran Thi Ngan, Luong Thi Hong Lan, Mumtaz Ali, Dan Tamir, Le Hoang Son,

Tran Manh Tuan, Naphtali Rishe, Abe Kandel (2018), “Logic Connectives of Complex

Fuzzy Sets”, Romanian Journal of Information Science and Technology, Vol. 21,

No. 4, pp. 344-358 (ISSN:1453-8245, SCIE, 2019 IF = 0.760), DOI = http://www.romjist.ro/abstract-

606.html

A2. Ganeshsree Selvachandran, Shio Gai Quek, Luong Thi Hong Lan, Le Hoang

Son, Nguyen Long Giang, Weiping Ding, Mohamed Abdel-Basset, Victor Hugo

C. de Albuquerque (2021), “A New Design of Mamdani Complex Fuzzy Inference

System for Multi-attribute Decision Making Problems”, IEEE Transactions on Fuzzy

Systems, Vol. 29, No.4, pp. 716-730 (ISSN:1063-6706, SCI, 2019 IF = 9.518),

DOI = http://dx.doi.org/10.1109/TFUZZ.2019.2961350

A3. Tran Manh Tuan, Luong Thi Hong Lan, Shuo-Yan Chou, Tran Thi Ngan, Le

Hoang Son, Nguyen Long Giang, Mumtaz Ali (2020), “M-CFIS-R: Mamdani Complex

Fuzzy Inference System with Rule Reduction Using Complex Fuzzy Measures in

Granular Computing”, Mathematics, Vol. 8, No. 5, pp. 707 – 731 (ISSN: 2227-

7390, SCIE, 2019 IF = 1.747),

DOI = https://doi.org/10.3390/math8050707.

A4. Luong Thi Hong Lan, Tran Manh Tuan, Tran Thi Ngan, Le Hoang Son, Nguyen

Long Giang, Vo Truong Nhu Ngoc, Pham Van Hai (2020), “A New Complex

Fuzzy Inference System with Fuzzy Knowledge Graph and Extensions in Decision

Making”, IEEE Access, Vol. 8, pp. 164899 - 164921 (ISSN: 2169-3536, SCIE,

2019 IF = 3.745), DOI = http://dx.doi.org/10.1109/ACCESS.2020.3021097.

119

Chương 4. Tài liệu tham khảo

[1] L. A. Zadeh, “Fuzzy sets,” Information and control, vol. 8, no. 3, pp. 338–353,

1965.

[2] G. Mapari and A. Naidu, “Study of fuzzy set theory and its applications,” IOSR

Journal of Mathematics, vol. 12, no. 4, pp. 148–154, 2016.

[3] T. Sooraj, R. Mohanty, and B. Tripathy, “Hesitant fuzzy soft set theory and

its application in decision making,” in Artificial Intelligence and Evolutionary

Computations in Engineering Systems, pp. 315–322, Springer, 2017.

[4] J. C. R. Alcantud and V. Torra, “Decomposition theorems and extension

principles for hesitant fuzzy sets,” Information Fusion, vol. 41, pp. 48–56,

2018.

[5] M.-Q. Wu, T.-Y. Chen, and J.-P. Fan, “Divergence measure of t-spherical

fuzzy sets and its applications in pattern recognition,” IEEE Access, vol. 8,

pp. 10208–10221, 2019.

[6] B. Paik and S. K. Mondal, “A distance-similarity method to solve fuzzy sets

and fuzzy soft sets based decision-making problems,” Soft Computing, vol. 24,

no. 7, pp. 5217–5229, 2020.

[7] L. Tiwari, R. Raja, V. Sharma, and R. Miri, “Fuzzy inference system for

efficient lung cancer detection,” in Computer Vision and Machine Intelligence

in Medical Image Analysis, pp. 33–41, Springer, 2020.

[8] B. Kapadia and A. Jain, “Detection of diabetes mellitus using fuzzy inference

system,” Studies in Indian Place Names, vol. 40, no. 53, pp. 104–110, 2020.

[9] A. M. Sagir and S. Sathasivam, “A novel adaptive neuro fuzzy inference system

based classification model for heart disease prediction.,” Pertanika Journal of

Science & Technology, vol. 25, no. 1, 2017.

120

[10] A. Bakhshipour, H. Zareiforoush, and I. Bagheri, “Application of decision trees

and fuzzy inference system for quality classification and modeling of black

and green tea based on visual features,” Journal of Food Measurement and

Characterization, pp. 1–15, 2020.

[11] E. Pourjavad and A. Shahin, “The application of mamdani fuzzy inference

system in evaluating green supply chain management performance,”

International Journal of Fuzzy Systems, vol. 20, no. 3, pp. 901–912, 2018.

[12] N. Priyadarshi, F. Azam, A. K. Sharma, and M. Vardia, “An adaptive neuro-

fuzzy inference system-based intelligent grid-connected photovoltaic power

generation,” in Advances in Computational Intelligence, pp. 3–14, Springer,

2020.

[13] A. C. Adoko and S. Yagiz, “Fuzzy inference system-based for tbm field

penetration index estimation in rock mass,” Geotechnical and Geological

Engineering, vol. 37, no. 3, pp. 1533–1553, 2019.

[14] J.-S. Jang, “Anfis: adaptive-network-based fuzzy inference system,” IEEE

transactions on systems, man, and cybernetics, vol. 23, no. 3, pp. 665–685,

1993.

[15] D. Karaboga and E. Kaya, “Adaptive network based fuzzy inference system

(anfis) training approaches: a comprehensive survey,” Artificial Intelligence

Review, vol. 52, no. 4, pp. 2263–2293, 2019.

[16] S. Subbulakshmi, G. Marimuthu, and N. Neelavathy, “Application of s-anfis

method in coronary artery disease,” Malaya Journal of Matematik (MJM),

no. 1, 2019, pp. 535–538, 2019.

[17] R. Razavi, A. Sabaghmoghadam, A. Bemani, A. Baghban, K.-w. Chau,

and E. Salwana, “Application of anfis and lssvm strategies for estimating

thermal conductivity enhancement of metal and metal oxide based nanofluids,”

Engineering Applications of Computational Fluid Mechanics, vol. 13, no. 1,

pp. 560–578, 2019.

[18] G. K. Tairidis, N. Stojanovic, D. Stamenkovic, and G. E. Stavroulakis, “Neuro-

fuzzy techniques and natural risk management. applications of anfis models in

floods and comparison with other models,” in Natural Risk Management and

Engineering, pp. 169–189, Springer, 2020.

121

[19] P. Sihag, N. Tiwari, and S. Ranjan, “Prediction of unsaturated hydraulic

conductivity using adaptive neuro-fuzzy inference system (anfis),” ISH Journal

of Hydraulic Engineering, vol. 25, no. 2, pp. 132–142, 2019.

[20] A. Azad, M. Manoochehri, H. Kashi, S. Farzin, H. Karami, V. Nourani, and

J. Shiri, “Comparative evaluation of intelligent algorithms to improve adaptive

neuro-fuzzy inference system performance in precipitation modelling,” Journal

of Hydrology, vol. 571, pp. 214–224, 2019.

[21] Y. K. Semero, J. Zhang, and D. Zheng, “Emd–pso–anfis-based hybrid approach

for short-term load forecasting in microgrids,” IET Generation, Transmission

& Distribution, vol. 14, no. 3, pp. 470–475, 2019.

[22] P. Hájek and V. Olej, “Adaptive intuitionistic fuzzy inference systems of takagi-

sugeno type for regression problems,” in IFIP International Conference on

Artificial Intelligence Applications and Innovations, pp. 206–216, Springer,

2012.

[23] P. Hajek and V. Olej, “Defuzzification methods in intuitionistic fuzzy inference

systems of takagi-sugeno type: The case of corporate bankruptcy prediction,”

in 2014 11th International Conference on Fuzzy Systems and Knowledge

Discovery (FSKD), pp. 232–236, IEEE, 2014.

[24] A. Hernandez-Aguila, M. Garcia-Valdez, and O. Castillo, “A proposal for an

intuitionistic fuzzy inference system,” in 2016 IEEE International Conference

on Fuzzy Systems (FUZZ-IEEE), pp. 1294–1300, IEEE, 2016.

[25] E. Egrioglu, E. Bas, O. C. Yolcu, and U. Yolcu, “Intuitionistic time series fuzzy

inference system,” Engineering Applications of Artificial Intelligence, vol. 82,

pp. 175–183, 2019.

[26] C. Luo, C. Tan, X. Wang, and Y. Zheng, “An evolving recurrent interval

type-2 intuitionistic fuzzy neural network for online learning and time series

prediction,” Applied Soft Computing, vol. 78, pp. 150–163, 2019.

[27] E. Bas, U. Yolcu, and E. Egrioglu, “Intuitionistic fuzzy time series functions

approach for time series forecasting,” Granular Computing, pp. 1–11, 2020.

122

[28] P. H. Thong et al., “Some novel hybrid forecast methods based on picture fuzzy

clustering for weather nowcasting from satellite image sequences,” Applied

Intelligence, vol. 46, no. 1, pp. 1–15, 2017.

[29] P. Van Viet, P. Van Hai, et al., “Picture inference system: a new fuzzy inference

system on picture fuzzy set,” Applied Intelligence, vol. 46, no. 3, pp. 652–669,

2017.

[30] L. H. Son, “Measuring analogousness in picture fuzzy sets: from picture

distance measures to picture association measures,” Fuzzy Optimization and

Decision Making, vol. 16, pp. 359–378, 2017.

[31] L. H. Son, “Generalized picture distance measure and applications to picture

fuzzy clustering,” Applied Soft Computing, vol. 46, no. C, pp. 284–295, 2016.

[32] P. H. Thong et al., “A novel automatic picture fuzzy clustering method based

on particle swarm optimization and picture composite cardinality,” Knowledge-

Based Systems, vol. 109, pp. 48–60, 2016.

[33] P. H. Thong et al., “Picture fuzzy clustering for complex data,” Engineering

Applications of Artificial Intelligence, vol. 56, pp. 121–130, 2016.

[34] L. H. Son, “A novel kernel fuzzy clustering algorithm for geo-demographic

Information Sciences—Informatics and Computer Science, analysis,”

Intelligent Systems, Applications: An International Journal, vol. 317,

no. C, pp. 202–223, 2015.

[35] P. Van Viet, H. T. M. Chau, P. Van Hai, et al., “Some extensions of membership

graphs for picture inference systems,” in 2015 seventh international conference

on knowledge and systems engineering (KSE), pp. 192–197, IEEE, 2015.

[36] D. Ramot, R. Milo, M. Friedman, and A. Kandel, “Complex fuzzy sets,” IEEE

Transactions on Fuzzy Systems, vol. 10, no. 2, pp. 171–186, 2002.

[37] H. Garg and D. Rani, “Some results on information measures for complex

intuitionistic fuzzy sets,” International Journal of Intelligent Systems, vol. 34,

no. 10, pp. 2319–2363, 2019.

[38] J.-P. Fan, R. Cheng, and M.-Q. Wu, “Extended edas methods for multi-

criteria group decision-making based on iv-cfswaa and iv-cfswga operators

123

with interval-valued complex fuzzy soft information,” IEEE Access, vol. 7,

pp. 105546–105561, 2019.

[39] S. Faizi, Multi-Criteria Decision Making Techniques Based on Some

Extensions of Fuzzy Set. PhD thesis, University of Management and

Technology, Lahore, 2019.

[40] H. Garg and D. Rani, “Robust averaging–geometric aggregation operators for

complex intuitionistic fuzzy sets and their applications to mcdm process,”

Arabian Journal for Science and Engineering, vol. 45, no. 3, pp. 2017–2033,

2020.

[41] K. Ullah, T. Mahmood, Z. Ali, and N. Jan, “On some distance measures of

complex pythagorean fuzzy sets and their applications in pattern recognition,”

Complex & Intelligent Systems, vol. 6, no. 1, pp. 15–27, 2020.

[42] Y. Al-Qudah and N. Hassan, “Complex multi-fuzzy soft expert set and its

application,” Int. J. Math. Comput. Sci, vol. 14, pp. 149–176, 2019.

[43] P. K. Singh, “Bipolar δ-equal complex fuzzy concept lattice with its

application,” Neural Computing and Applications, pp. 1–18, 2019.

[44] D. Ramot, M. Friedman, G. Langholz, and A. Kandel, “Complex fuzzy logic,”

IEEE Transactions on Fuzzy Systems, vol. 11, no. 4, pp. 450–461, 2003.

[45] J. Man, Z. Chen, and S. Dick, “Towards inductive learning of complex

fuzzy inference systems,” in NAFIPS 2007-2007 Annual Meeting of the North

American Fuzzy Information Processing Society, pp. 415–420, IEEE, 2007.

[46] Z. Chen, S. Aghakhani, J. Man, and S. Dick, “Ancfis: A neurofuzzy architecture

employing complex fuzzy sets,” IEEE Transactions on Fuzzy Systems, vol. 19,

no. 2, pp. 305–322, 2010.

[47] Y. Liu and F. Liu, “An adaptive neuro-complex-fuzzy-inferential modeling

mechanism for generating higher-order tsk models,” Neurocomputing, vol. 365,

pp. 94–101, 2019.

[48] O. Yazdanbakhsh and S. Dick, “Fancfis: Fast adaptive neuro-complex fuzzy

inference system,” International Journal of Approximate Reasoning, vol. 105,

pp. 417–430, 2019.

124

[49] E. H. Mamdani, “Application of fuzzy algorithms for control of simple dynamic

plant,” in Proceedings of the institution of electrical engineers, vol. 121,

pp. 1585–1588, IET, 1974.

[50] T. Takagi and M. Sugeno, “Fuzzy identification of systems and its applications

to modeling and control,” IEEE transactions on systems, man, and cybernetics,

no. 1, pp. 116–132, 1985.

[51] Y. Li and Y.-T. Jang, “Complex adaptive fuzzy inference systems,” in Soft

Computing in Intelligent Systems and Information Processing. Proceedings of

the 1996 Asian Fuzzy Systems Symposium, pp. 551–556, IEEE, 1996.

[52] A. Deshmukh, A. Bavaskar, P. Bajaj, and A. Keskar, “Implementation of

complex fuzzy logic modules with vlsi approach,” International Journal on

Computer Science and Network Security, vol. 8, pp. 172–178, 2008.

[53] O. Yazdanbakhsh and S. Dick, “Forecasting of multivariate time series via

complex fuzzy logic,” IEEE Transactions on Systems, Man, and Cybernetics:

Systems, vol. 47, no. 8, pp. 2160–2171, 2017.

[54] M. Yeganejou and S. Dick, “Inductive learning of classifiers via complex fuzzy

sets and logic,” in 2017 IEEE International Conference on Fuzzy Systems

(FUZZ-IEEE), pp. 1–6, IEEE, 2017.

[55] O. Yazdanbakhsh and S. Dick, “A systematic review of complex fuzzy sets and

logic,” Fuzzy Sets and Systems, vol. 338, pp. 1–22, 2018.

[56] C. Li and T.-W. Chiang, “Complex neurofuzzy arima forecasting—a new

approach using complex fuzzy sets,” IEEE Transactions on Fuzzy Systems,

vol. 21, no. 3, pp. 567–584, 2012.

[57] H. Bustince, E. Barrenechea, M. Pagola, J. Fernandez, Z. Xu, B. Bedregal,

J. Montero, H. Hagras, F. Herrera, and B. De Baets, “A historical account

of types of fuzzy sets and their relationships,” IEEE Transactions on Fuzzy

Systems, vol. 24, no. 1, pp. 179–194, 2015.

[58] J. Buckley and Y. Qu, “Fuzzy complex analysis i: differentiation,” Fuzzy Sets

and Systems, vol. 41, no. 3, pp. 269–284, 1991.

[59] J. J. Buckley, “Fuzzy complex analysis ii: integration,” Fuzzy Sets and Systems,

vol. 49, no. 2, pp. 171–179, 1992.

125

[60] Z. Guang-Quan, “Fuzzy limit theory of fuzzy complex numbers,” Fuzzy Sets

and Systems, vol. 46, no. 2, pp. 227–235, 1992.

[61] Z. Guangquan, “Fuzzy distance and limit of fuzzy numbers [j],” Fuzzy Systems

and Mathematics, vol. 1, 1992.

[62] A. Azam, B. Fisher, and M. Khan, “Common fixed point theorems in complex

valued metric spaces,” Numerical Functional Analysis and Optimization,

vol. 32, no. 3, pp. 243–253, 2011.

[63] G. Zhang, T. S. Dillon, K.-Y. Cai, J. Ma, and J. Lu, “Operation properties

and δ-equalities of complex fuzzy sets,” International journal of approximate

reasoning, vol. 50, no. 8, pp. 1227–1249, 2009.

[64] A. U. M. Alkouri and A. R. Salleh, “Linguistic variable, hedges and several

distances on complex fuzzy sets,” Journal of Intelligent & Fuzzy Systems,

vol. 26, no. 5, pp. 2527–2535, 2014.

[65] M. Guido, A. Mangia, G. Faa, et al., “Chronic viral hepatitis: the histology

report,” Digestive and Liver Disease, vol. 43, pp. S331–S343, 2011.

[66] F. Camastra, A. Ciaramella, V. Giovannelli, M. Lener, V. Rastelli, A. Staiano,

G. Staiano, and A. Starace, “A fuzzy decision system for genetically modified

plant environmental risk assessment using mamdani inference,” Expert Systems

with Applications, vol. 42, no. 3, pp. 1710–1716, 2015.

[67] B. Gayathri and C. Sumathi, “Mamdani fuzzy inference system for

breast cancer risk detection,” in 2015 IEEE International Conference on

Computational Intelligence and Computing Research (ICCIC), pp. 1–6, IEEE,

2015.

[68] S. Thakur, S. Raw, R. Sharma, and P. Mishra, “Detection of type of thalassemia

disease in patients: A fuzzy logic approach,” International Journal of Applied

Pharmaceutical Sciences and Research, vol. 1, no. 02, pp. 88–95, 2016.

[69] P. Mamoria and D. Raj, “Comparison of mamdani fuzzy inference system for

multiple membership functions,” International Journal of Image, Graphics and

Signal Processing, vol. 8, no. 9, p. 26, 2016.

126

[70] M. D. RU ˇZI ´C, J. Skenderovi´c, and K. T. LESI ´C, “Application of the mamdani fuzzy inference system to measuring hrm performance in hotel companies–a

pilot study,” 2016.

[71] P. K. Borkar, M. Jha, M. Qureshi, and G. Agrawal, “Performance assessment

of heat exchanger using mamdani based adaptive neuro-fuzzy inference system

(m-anfis) and dynamic fuzzy reliability modeling. 2014,” International Journal

of Innovative Research in Science, Engineering and Technology (An ISO 3297:

2007 Certified Organization), vol. 3, no. 9, 2014.

[72] Y. Chai, L. Jia, and Z. Zhang, “Mamdani model based adaptive neural fuzzy

inference system and its application,” International Journal of Computational

Intelligence, vol. 5, no. 1, pp. 22–29, 2009.

[73] E. P. Klement and R. Mesiar, Logical, algebraic, analytic and probabilistic

aspects of triangular norms. Elsevier, 2005.

[74] H. T. Nguyen, C. L. Walker, and E. A. Walker, A first course in fuzzy logic.

CRC press, 2018.

[75] R. R. Yager and D. P. Filev, “Unified structure and parameter identification of

fuzzy models,” IEEE Transactions on Systems, Man, and Cybernetics, vol. 23,

no. 4, pp. 1198–1205, 1993.

[76] H. Ishibuchi, K. Nozaki, N. Yamamoto, and H. Tanaka, “Selecting fuzzy if-then

rules for classification problems using genetic algorithms,” IEEE Transactions

on fuzzy systems, vol. 3, no. 3, pp. 260–270, 1995.

[77] J. Yen and L. Wang, “Simplifying fuzzy rule-based models using

orthogonal transformation methods,” IEEE Transactions on Systems, Man, and

Cybernetics, Part B (Cybernetics), vol. 29, no. 1, pp. 13–24, 1999.

[78] L. Wang and R. Langari, “Building sugeno-type models using fuzzy

discretization and orthogonal parameter estimation techniques,” IEEE

Transactions on Fuzzy Systems, vol. 3, no. 4, pp. 454–458, 1995.

[79] G. E. Tsekouras, “Fuzzy rule base simplification using multidimensional

scaling and constrained optimization,” Fuzzy sets and systems, vol. 297, pp. 46–

72, 2016.

127

[80] W. Pedrycz, “From fuzzy rule-based systems to granular fuzzy rule-based

systems: a study in granular computing,” in Combining Experimentation and

Theory, pp. 151–162, Springer, 2012.

[81] H. Bellaaj, R. Ketata, and M. Chtourou, “A new method for fuzzy rule base

reduction,” Journal of Intelligent & Fuzzy Systems, vol. 25, no. 3, pp. 605–613,

2013.

[82] J. L. S. L. P. Heim, S. Hellmann and T. Stegemann, “Multitask tsk fuzzy system

modeling by jointly reducing rules and consequent parameters,” Transactions

on Systems, vol. 25, no. 3, pp. 605–613, 2019.

[83] G. Wang and X. Li, “Generalized lebesgue integrals of fuzzy complex valued

functions,” Fuzzy Sets and Systems, vol. 127, no. 3, pp. 363–370, 2002.

[84] L.-C. Jang and H.-M. Kim, “On choquet integrals with respect to a

fuzzy complex valued fuzzy measure of fuzzy complex valued functions,”

International Journal of Fuzzy Logic and Intelligent Systems, vol. 10, no. 3,

pp. 224–229, 2010.

[85] L.-C. Jang and H.-M. Kim, “Some properties of choquet integrals with respect

to a fuzzy complex valued fuzzy measure.,” Int. J. Fuzzy Logic and Intelligent

Systems, vol. 11, no. 2, pp. 113–117, 2011.

[86] S.-q. Ma, D.-j. Peng, and D.-y. Li, “Fuzzy complex value measure and fuzzy

complex value measurable function,” in Fuzzy Information and Engineering,

pp. 187–192, Springer, 2009.

[87] S.-q. Ma, F.-c. Chen, and Z.-q. Zhao, “Choquet type fuzzy complex-valued

integral and its application in classification,” in Fuzzy Engineering and

Operations Research, pp. 229–237, Springer, 2012.

[88] S.-q. Ma, M.-q. Chen, and Z.-q. Zhao, “The complex fuzzy measure,” in Fuzzy

Information & Engineering and Operations Research & Management, pp. 137–

145, Springer, 2014.

[89] S. Ma and S. Li, “Complex fuzzy set-valued complex fuzzy measures and their

properties,” The Scientific World Journal, vol. 2014, 2014.

128

[90] S.-q. Ma and S.-g. Li, “Complex fuzzy set-valued complex fuzzy integral

and its convergence theorem,” in Fuzzy Systems & Operations Research and

Management, pp. 143–155, Springer, 2016.

[91] S. Ma, D. Peng, and Z. Zhao, “Generalized complex fuzzy set-valued

integrals and their properties,” in 2016 12th International Conference on

Natural Computation, Fuzzy Systems and Knowledge Discovery (ICNC-FSKD),

pp. 906–910, IEEE, 2016.

[92] R. T. Ngan, M. Ali, D. E. Tamir, N. D. Rishe, A. Kandel, et al., “Representing

complex intuitionistic fuzzy set by quaternion numbers and applications to

decision making,” Applied Soft Computing, vol. 87, p. 105961, 2020.

[93] S. Dai, L. Bi, and B. Hu, “Distance measures between the interval-valued

complex fuzzy sets,” Mathematics, vol. 7, no. 6, p. 549, 2019.

[94] K. Mondal, S. Pramanik, and B. C. Giri, “Some similarity measures for madm

under a complex neutrosophic set environment,” in Optimization Theory Based

on Neutrosophic and Plithogenic Sets, pp. 87–116, Elsevier, 2020.

[95] A. Z. LOTFI, “The key roles of information granulation and fuzzy logic in

human reasoning, concept formulation and computing with words,” in FUZZ-

IEEE’96—Fifth IEEE International Conference on Fuzzy Systems, pp. 8–11.

[96] T. Lin, “Granular computing, announcement of the bisc special interest group

on granular computing [z]. 1997.”

[97] Y. Yao and N. Zhong, “Granular computing using information tables,” in Data

mining, rough sets and granular computing, pp. 102–124, Springer, 2002.

[98] J. T. Yao, A. V. Vasilakos, and W. Pedrycz, “Granular computing: perspectives

and challenges,” IEEE Transactions on Cybernetics, vol. 43, no. 6, pp. 1977–

1989, 2013.

[99] J. T. Yao, A. V. Vasilakos, and W. Pedrycz, “Granular computing: perspectives

and challenges,” IEEE Transactions on Cybernetics, vol. 43, no. 6, pp. 1977–

1989, 2013.

[100] P. Artiemjew, “Natural versus granular computing: Classifiers from granular

structures,” in International Conference on Rough Sets and Current Trends in

Computing, pp. 150–159, Springer, 2008.

129

[101] S. Butenkov, A. Zhukov, A. Nagorov, and N. Krivsha, “Granular computing

models and methods based on the spatial granulation,” Procedia Computer

Science, vol. 103, no. C, pp. 295–302, 2017.

[102] F. M. Bianchi, S. Scardapane, A. Rizzi, A. Uncini, and A. Sadeghian, “Granular

computing techniques for classification and semantic characterization of

structured data,” Cognitive Computation, vol. 8, no. 3, pp. 442–461, 2016.

[103] N. Krivsha, V. Krivsha, Z. Beslaneev, and S. Butenkov, “Greedy algorithms

for granular computing problems in spatial granulation technique,” Procedia

Computer Science, vol. 103, pp. 303–307, 2017.

[104] W. Zhang, G. Wang, W. Liu, and J. Fang, “An introduction to fuzzy

mathematics,” Xi’an Jiaotong University Press, Xi’an, 1991.

[105] H. Q. Truong, L. T. Ngo, and W. Pedrycz, “Granular fuzzy possibilistic c-means

clustering approach to dna microarray problem,” Knowledge-Based Systems,

vol. 133, pp. 53–65, 2017.

[106] P. Heim, S. Hellmann, J. Lehmann, S. Lohmann, and T. Stegemann, “Relfinder:

Revealing relationships in rdf knowledge bases,” in International Conference

on Semantic and Digital Media Technologies, pp. 182–187, Springer, 2009.

[107] T. Yu, J. Li, Q. Yu, Y. Tian, X. Shun, L. Xu, L. Zhu, and H. Gao, “Knowledge

graph for tcm health preservation: design, construction, and applications,”

Artificial Intelligence in Medicine, vol. 77, pp. 48–52, 2017.

[108] L. Shao, Y. Duan, X. Sun, Q. Zou, R. Jing, and J. Lin, “Bidirectional value

driven design between economical planning and technical implementation

based on data graph, information graph and knowledge graph,” in 2017

IEEE 15th International Conference on Software Engineering Research,

Management and Applications (SERA), pp. 339–344, IEEE, 2017.

[109] Z. Wang, J. Zhang, J. Feng, and Z. Chen, “Knowledge graph embedding by

translating on hyperplanes.,” in Aaai, vol. 14, pp. 1112–1119, Citeseer, 2014.

[110] J. Qiu, Q. Du, K. Yin, S.-L. Zhang, and C. Qian, “A causality mining

and knowledge graph based method of root cause diagnosis for performance

anomaly in cloud applications,” Applied Sciences, vol. 10, no. 6, p. 2166, 2020.

130

[111] L. He and P. Jiang, “Manufacturing knowledge graph: a connectivism to

answer production problems query with knowledge reuse,” IEEE Access, vol. 7,

pp. 101231–101244, 2019.

[112] R. Lijuan, L. Jun, and G. Wei, “Multi-source knowledge embedding research

of knowledge graph,” in 2019 IEEE 3rd International Conference on Circuits,

Systems and Devices (ICCSD), pp. 163–166, IEEE, 2019.

[113] J. Long, Z. Chen, W. He, T. Wu, and J. Ren, “An integrated framework

of deep learning and knowledge graph for prediction of stock price trend:

An application in chinese stock exchange market,” Applied Soft Computing,

p. 106205, 2020.

[114] X. Chen, S. Jia, and Y. Xiang, “A review: Knowledge reasoning over knowledge

graph,” Expert Systems with Applications, vol. 141, p. 112948, 2020.

[115] S. Yoo and O. Jeong, “Automating the expansion of a knowledge graph,” Expert

Systems with Applications, vol. 141, p. 112965, 2020.

[116] H. Liu, Y. Li, R. Hong, Z. Li, M. Li, W. Pan, A. Glowacz, and H. He,

“Knowledge graph analysis and visualization of research trends on driver

behavior,” Journal of Intelligent & Fuzzy Systems, vol. 38, no. 1, pp. 495–511,

2020.

[117] H. Wang, C. Shah, P. Sathaye, A. Nahata, and S. Katariya, “Service application

knowledge graph and dependency system,” in 2019 34th IEEE/ACM

International Conference on Automated Software Engineering Workshop

(ASEW), pp. 134–136, IEEE, 2019.

[118] E. Petrova, P. Pauwels, K. Svidt, and R. L. Jensen, “Towards data-driven

sustainable design: decision support based on knowledge discovery in disparate

building data,” Architectural Engineering and Design Management, vol. 15,

no. 5, pp. 334–356, 2019.

[119] L. Shi, S. Li, X. Yang, J. Qi, G. Pan, and B. Zhou, “Semantic health

knowledge graph: Semantic integration of heterogeneous medical knowledge

and services,” BioMed research international, vol. 2017, 2017.

131

[120] X. Tao, T. Pham, J. Zhang, J. Yong, W. P. Goh, W. Zhang, and Y. Cai, “Mining

health knowledge graph for health risk prediction,” World Wide Web, pp. 1–22,

2020.