intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Tóm tắt luận án Tiến sĩ ngành Máy tính: Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:27

35
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục tiêu của đề tài là nghiên cứu các lý thuyết về tập mờ phức, logic mờ phức và các độ đo dựa trên tập mờ phức; nghiên cứu và phát triển hệ suy diễn dựa trên tập mờ phức; nghiên cứu các kĩ thuật áp dụng để giảm luật, tối ưu hóa luật mờ trong hệ suy diễn mờ phức; nghiên cứu cách biểu diễn luật dựa trên đồ thị tri thức để giảm thời gian tính toán suy diễn đối với tập thử nghiệm và xử lý với các trường hợp bộ dữ liệu mới không có trong tập dữ liệu huấn luyện.

Chủ đề:
Lưu

Nội dung Text: Tóm tắt luận án Tiến sĩ ngành Máy tính: Một số mở rộng của hệ suy diễn mờ phức cho bài toán hỗ trợ ra quyết định

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ------------------------------- LƯƠNG THỊ HỒNG LAN MỘT SỐ MỞ RỘNG CỦA HỆ SUY DIỄN MỜ PHỨC CHO BÀI TOÁN HỖ TRỢ RA QUYẾT ĐỊNH Chuyên ngành: Khoa học máy tính Mã số: 9 48 01 01 TÓM TẮT LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH Hà nội - 2021
  2. Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam Người hướng dẫn khoa học 1: PGS.TS. Lê Hoàng Sơn Người hướng dẫn khoa học 2: PGS.TS. Nguyễn Long Giang Phản biện 1: Phản biện 2: Phản biện 3: Luận án được bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp tại Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam vào hồi … giờ, ngày ….. tháng ….. năm 20…. Có thể tìm hiểu luận án tại: - Thư viện Học viện Khoa học và Công nghệ - Thư viện Quốc gia Việt Nam
  3. MỞ ĐẦU Tập mờ (FS) được Zadel đề xuất năm 1965 [1] được coi là một trong những công cụ hữu hiệu để giải quyết các bài toán có tính chất bất định, không tường minh, rõ ràng. Rất nhiều những nghiên cứu mở rộng của FS đã được giới thiệu trong vài năm gần đây [2-6] và được ứng dụng nhiều trong bài toán hệ hỗ trợ ra quyết định. Một trong những kĩ thuật quan trọng dựa trên lý thuyết FS và ứng dụng trong việc giải quyết các bào toán của hệ hỗ trợ ra quyết định là Hệ suy diễn mờ (FIS). FIS hiện đã và đang được ứng dụng rộng rãi trong nhiều bài toán phân loại/dự báo và các bài toán của hệ hỗ trợ ra quyết định như lựa chọn nhân sự, lựa chọn nhà cung cấp, hỗ trợ ra chiến lược phát triển công ty... Bên cạnh đó, trong một vài ứng dụng khác thì hệ FIS được sử dụng để tạo ra một tập hợp các luật mờ nhằm mục đích phát hiện, dự báo hoặc phân loại các đối tượng như phát hiện ung thư phổi, phát hiện bệnh đái tháo đường, dự đoán bị bệnh tim ...[7-13]. Một phiên bản mở rộng của FIS nhúng vào mạng nơ ron và kết hợp với học dựa trên phương pháp gradient có tên gọi là Hệ suy diễn mờ nơ ron thích nghi (ANFIS) [14] và cho kết quả tốt trong vấn đề dự báo bệnh mạch vành, ước tính sự tăng cường độ dẫn nhiệt của kim loại và oxit kim loại.. [15-21]. Gần đây, cùng với sự gia tăng của các vấn đề ra quyết định dựa trên các dữ liệu có sự thay đổi về thời gian hay các dữ liệu có yếu tố chu kì, định kì thì khái niệm tập mờ phức ra đời (CFS) với hàm thuộc bao gồm cả thành phần biên độ và thành phần pha [36]. CFS được áp dụng trong nhiều nghiên cứu, tập trung chủ yếu vào các vấn đề như các toán tử tổng hợp mờ mới, thông tin mềm mờ phức, độ đo khoảng cách mờ phức và mạng các khái niệm mờ phức [37-43]. Ưu điểm của CFS là khả năng mô hình hóa các hiện tượng và sự kiện theo thời gian, theo giai đoạn để từ đó có thể cho thấy tổng thể chúng trong một ngữ cảnh nhất định. Ví dụ như để xác nhận chẩn đoán huyết áp của bệnh nhân là “cao” hay “thấp” thì một bệnh nhân được đo 30 lần rồi ghi lại giá trị tương ứng với mỗi lần đo, sau đó giá trị trung bình và phương sai được tính toán đối với giá trị huyết áp đo được. Từ đó huyết áp của bệnh nhân có thể tính được dễ dàng bằng cách lấy giá trị trung bình và phương sai của các lần đo (sử dụng ý nghĩa của mờ hóa của hệ FIS trên tập CFS), ví dụ như là huyết áp thấp với giá trị trung bình và phương sai cho giá trị nhỏ. Còn nếu như huyết áp chỉ đo tại một thời điểm và đưa ra quyết định thì có thể dẫn đến quyết định về huyết áp của bệnh nhân không chính xác. Một ví dụ khác về vấn đề chẩn đoán bệnh: nếu chỉ dựa vào các giá trị thuộc tính bệnh mà không xét tới các thuộc tính khác thì làm cho kết quả chẩn đoán không được chính xác, do kết luận bệnh không chỉ phụ thuộc vào mỗi một giá trị thuộc tính bệnh mà còn cần phải xét tới các yếu tố liên quan tới bệnh đó. Hơn nữa, cũng có nhiều kịch bản, dữ liệu trong thực tế liên quan đến yếu tố pha, trong dữ liệu có xu hướng tuần hoàn, chẳng hạn như lượng mưa được ghi lại trong một vùng hoặc sóng âm thanh do một nhạc cụ tạo ra. Do đó, hiển nhiên rằng số phức cũng phải có một vị trí trong hệ thống suy luận mờ. Do đó, đây là động cơ chính của luận án này. Các hệ suy diễn thường như Mamdani, Sugeno, Tsukamoto hay các mô hình ANFIS thỉ chỉ có khả năng xử lý những hiện tượng mà không có yếu tố chu kì, yếu tố định kì. Khi xử lý đối với dữ liệu có yếu tố chu kì, định kì, dữ liệu có yếu tố thay đổi theo thời gian thì các hệ FIS hay ANFIS đều đưa ra hai phương thức xử lý chung: (1) Bỏ qua thông tin liên quan đến yếu tố thành phần pha; (2) Biểu diễn thành phần biên độ và pha riêng biệt với nhau thành 2 thành phần riêng biệt bằng cách sử dụng 2 tập mờ. Điều này sẽ làm cho thông tin bị mất mát và kết quả thu được không có độ tin cậy cao (nếu các thông tin về thành phần pha bị bỏ qua), làm sai lệch thông tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và pha được xử lý riêng biệt), thời gian tính toán sẽ tăng thêm do số lượng các bộ cần được xử lý tăng thêm. Hệ suy diễn mờ phức được cho là một công cụ hiệu quả đối với việc giải quyết các vấn đề không chắc chắn và có yếu tố định kỳ, chu kì. Hệ suy diễn mờ phức đầu tiên được giới thiệu Ramot [44] được gọi là Hệ 1
  4. logic mờ phức được phát triển từ hệ thống logic mờ thông thường nhưng thay thế tập mờ và phép kéo theo mờ bởi biến đổi phức tương ứng của nó. Một nghiên cứu khác bởi Man và cộng sự [45] dựa trên sự kết hợp giữa phương pháp học quy nạp với hệ suy diễn trong tập phức. Một phiên bản học nhúng khác với mạng mờ nơ ron trên tập CFS với tên gọi Hệ thống suy diễn mờ phức nơ ron thích nghi (ANCFIS) được giới thiệu bởi Chen và cộng sự [46]. Sau đó 2 cải tiến của ANCFIS với mục đích làm gia tăng tốc độ tính toán cũng được đưa ra trong [47- 48]. Tuy nhiên các hệ phát triển trên lý thuyết tập mờ phức đều không phải là hệ thống phức thực sự. Từ những nghiên cứu về hệ mờ phức đã có thì hệ mờ phức vẫn còn tồn tại một số hạn chế như sau: - Các hệ suy diễn mờ phức chưa đưa ra được quy trình tổng thể xây dựng hệ suy diễn mờ phức cho hệ hỗ trợ ra quyết định. - Các hệ luật trong các hệ suy diễn mờ phức đã có chỉ sinh ra dựa trên kinh nghiệm, dựa trên tư duy logic suy diễn mà chưa đề cập đến vấn đề tối ưu hệ luật suy diễn mờ phức. - Các hệ suy diễn chưa được nghiên cứu để áp dụng đối với bộ dữ liệu mới mà không có trong dữ liệu huấn luyện khi sinh mô hình suy diễn. - Các toán tử t-chuẩn và t-đối chuẩn mờ phức còn chưa được quan tâm nghiên cứu tìm hiểu và ứng dụng trong hệ hỗ trợ ra quyết định. Mục tiêu nghiên cứu của luận án. Luận án tập trung nghiên cứu tìm hiểu và áp dụng hệ suy diễn mờ phức đối với bài toán hệ hỗ trợ ra quyết định, cụ thể như sau: 1) Nghiên cứu các lý thuyết về tập mờ phức, logic mờ phức và các độ đo dựa trên tập mờ phức. 2) Nghiên cứu và phát triển hệ suy diễn dựa trên tập mờ phức 3) Nghiên cứu các kĩ thuật áp dụng để giảm luật, tối ưu hóa luật mờ trong hệ suy diễn mờ phức. 4) Nghiên cứu cách biểu diễn luật dựa trên đồ thị tri thức để giảm thời gina tính toán suy diễn đối với tập thử nghiệm và xử lý với các trường hợp bộ dữ liệu mới không có trong tập dữ liệu huấn luyện. Bố cục của luận án gồm bốn chương nội dung chính, phần Mở đầu, Kết luận và danh mục các tài liệu tham khảo. Phần Mở đầu trình bày tổng quan về vấn đề nghiên cứu, lý do chọn đề tài, đối tượng, mục tiêu và nội dung nghiên cứu của luận án. Phần Kết luận tổng kết những kết quả đã đạt được của luận án và hướng phát triển, hướng nghiên cứu trong tương lai. Các chương nội dung chính được tổ chức như sau: Chương 1 trình bày các khái niệm cơ bản, kiến thức nền sẽ được sử dụng trong các chương tiếp theo. Mở đầu, mục 1.2 và 1.3 về lý thuyết tập mờ, tập mờ phức, độ đo mờ và độ đo mờ phức và các nghiên cứu liên quan về hệ suy diễn dựa trên tập mờ phức trong những năm gần đây. Trên cơ sở đó, luận án phân tích các vấn đề còn tồn tại, nêu rõ các động lực nghiên cứu của luận án: sử dụng hệ suy diễn mờ phức đối với việc giải quyết bài toán hỗ trợ quá trình ra quyết định. Thêm vào đó, các bộ dữ liệu thực nghiệm trong luận án cùng với các thước đo dùng để đánh giá thực nghiệm cũng được trình bày chi tiết trong chương đầu tiên này. Các đóng góp chính của luận án được trình bày trong chương 2, chương 3 và chương 4. Chương 2 trình bày hai kết quả nghiên cứu chính: thứ nhất là định nghĩa các phép toán t- chuẩn, t-đối chuẩn mờ phức; thứ hai là phát triển hệ suy diễn Mamdani trên tập mờ phức. Cuối chương là kết quả thực nghiệm và nhận xét so sánh của hệ suy diễn đã đề xuất trên các bộ dữ liệu thực nghiệm với hệ suy diễn mờ phức Mamdani. Vấn đề tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani là nội dung được đề cập và xem xét đến trong nội dung của chương 3. Xuất phát từ lý thuyết về tính toán hạt, luận án đề xuất ra các độ đo mờ phức và độ đo mờ phức kết hợp với tính toán hạt để tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani đã đề xuất 2
  5. trong chương 2 (hệ suy diễn mờ phức M-CFIS-R). Ví dụ số và kết quả thực nghiệm cũng đã chứng minh được tính hiệu quả của vấn đề giảm luật và tối ưu hóa hệ luật trong hệ suy diễn mờ phức Mamdani. Nếu trong chương 3 luận án chỉ đi tập trung vào vấn đề giảm luật, tối ưu luật trong phần training thì chương 4 chúng tôi lại tập trung vào cải tiến đối với bộ testing bằng cách áp dụng lý thuyết về đồ thị tri thức mờ. Thêm nữa, luận án cũng đề xuất một số khái niệm dựa trên lý thuyết tập hợp như độ đo mờ phức và tích phân mờ phức. Cuối cùng, phần kết luận nêu những đóng góp của luận án, hướng phát triển và những vấn đề quan tâm của tác giả. CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT 1.1. Giới thiệu Lý thuyết tập mờ nói chung và tập mờ phức nói riêng được coi là một trong những công cụ toán học hiệu quả để biểu diễn và xử lý nhưng khái niệm không chắc chắn. 1.2. Vấn đề Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định Quy trình chung của phương pháp sử dụng hệ mờ trong các hệ hỗ trợ ra quyết định Hình 1.1 Hệ suy diễn mờ trong Hệ hỗ trợ ra quyết định Ban đầu dựa trên dữ liệu mẫu huấn luyện, một quy trình sinh luật được áp dụng để tạo ra hệ các luật mờ. Hệ luật này là trung tâm tập hợp các quy luật, kiến thức trích rút ra từ tập dữ liệu huấn luyện. Tiếp theo, với mỗi đầu vào mới được áp dụng với từng luật và tính toán các đầu ra. Một quy trình tổng hợp kết quả từ các luật để cho ra một giá trị chung. Cuối cùng, ở bước ra quyết định thì giá trị này được điều chỉnh, chuẩn hóa để đưa ra quyết định cuối cùng. 1.3. Tổng quan về các nghiên cứu liên quan 1.3.1. Hệ suy diễn mờ Hệ suy diễn mờ (FIS) là một khung tính toán phổ biến dựa trên khái niệm lý thuyết tập mờ thường được áp dụng khi xây dựng các quá trình hỗ trợ ra quyết định. Có ba kiểu hệ suy diễn mờ, đó là Hệ suy diễn Mamdani, Hệ suy diễn Sugeno (hay còn gọi là Takagi – Sugeno), Hệ suy diễn Tsukamoto 1.3.2. Các hệ phát triển dựa trên tập mờ phức 1.3.2.1 Hệ suy diễn mờ phức của Ramot Hệ thống mờ phức do Ramot đề xuất bao gồm 3 giai đoạn: Module mờ hóa, Suy diễn mờ và Giải mờ. Ở đây tác giả bỏ qua thành phần pha mà chỉ quan tâm đến thành phần biên độ của tập mờ phức trong giai đoạn giải mờ. 1.3.2.2. Hệ CANFIS do nhóm tác giả Li và Jang đề xuất Li và Jang [53] đã giới thiệu một hệ suy diễn mờ dựa trên tập mờ phức với tên gọi là Hệ suy diễn mờ nơron thích nghi phức CANFIS (Complex Neuro-Fuzzy Inference System). Tuy nhiên, hệ thống này không hoàn toàn đúng ý nghĩa trên miền phức, bởi việc sử dụng các hàm thuộc mờ loại 1 riêng cho phần thực và phần ảo của từng giá trị biến đầu vào. Chính điều đó làm giảm đi ý nghĩa của hệ thống suy diễn trên tập mờ phức. 3
  6. 1.3.2.3. Hệ ANCFIS do Chen và cộng sự đề xuất Kiến trúc của hệ ANCFIS do nhóm tác giả Chen và cộng sự đề xuất năm 2010 [46] gần giống với kiến trúc mạng nơ ron giá trị phức. Mô hình ANCFIS sử dụng phép tích vô hướng cho giai đoạn tổng hợp đầu ra và coi các tín hiệu đầu vào có giá trị phức như là giá trị thực, do đó nó thu được một giá trị vô hướng cho phép tích vô hướng. Điều này sẽ không thể xảy ra nếu các đầu vào thực sự được coi là các giá trị phức tạp, vì tích số chấm của hai số phức là một số phức và không phải là một giá trị vô hướng. Do đó, hệ thống ANCFIS không thực sự phức tạp vì các đầu ra của hệ thống sẽ không đại diện cho tính tuần hoàn của các phần tử. 1.3.2.4. Một số hệ suy diễn khác dựa trên tập mờ phức Bên cạnh các nghiên cứu đã có thì tập mờ phức cũng được nhiều nhóm nghiên cứu và phát triển. Nhóm tác giả Malekzadeh và Akbarzadeh [54] đưa ra đề xuất hệ suy diễn dựa trên tập mờ phức với tên gọi là hệ suy diễn mờ thích nghi giá trị phức(CANFIS) là một hệ thống lai giữa tập mờ phức và mạng nơ ron mờ. Tuy nhiên, trong nghiên cứu này không đưa ra phương pháp giải mờ đầu ra giá trị phức thành đầu ra rõ, và chỉ chọn duy nhất giá trị phần thực của đầu ra chứ không đề cập tới giá trị của thành phần pha. Deshmukh và cộng sự [55] lại đề xuất một hệ logic mờ phức và áp dụng chúng để thiết kế bộ vi xử lý mờ sử dụng công nghệ VLSI. Tuy nhiên, nhóm tác giả không thực hiện suy diễn luật và không đưa ra module giải mờ phù hợp trong hệ thống của mình. 1.3.3. Các vấn đề còn tồn tại cần giải quyết của hệ CFIS hiện nay Từ các nghiên cứu về hệ suy diễn phát triển từ tập mờ phức, các hệ suy diễn phát triển dựa trên tập mờ phức đã có chưa thực sự đúng với ý nghĩa của hệ thống phức thực sự. Để xử lý với dữ liệu chuỗi thời gian hay có các hiện tượng tuần hoàn, biến đổi theo thời gian thì các hệ FIS hay ANFIS đều đưa ra 2 phương thức chung như sau: (1) bỏ qua thông tin liên quan đến yếu tố thành phần pha; (2) biểu diễn thành phần biên độ và pha riêng biệt với nhau thành 2 thành phần riêng biệt bằng cách sử dụng 2 tập mờ. Điều này sẽ làm cho mất mát thông tin trong quá trình suy diễn và kết quả thu được không đáng tin cậy (nếu các thông tin về thành phần pha bị bỏ qua), làm sai lệch thông tin và giảm hiệu năng tính toán (nếu thông tin về biên độ và pha được xử lý riêng biệt), thời gian tính toán sẽ tăng thêm do số lượng các bộ cần được xử lý tăng thêm. 1.4. Cơ sở lý thuyết 1.4.1. Tập mờ Khái niệm tập mờ được giáo sư Lotfi A.Zadel đưa ra vào năm 1965 [1] với mục đích là mô tả những khái niệm “tập hợp chưa rõ ràng” trong nghiên cứu những yếu tố chưa bất định. 1.4.2. Tập mờ phức Tập mờ phức được đặc trưng bởi một hàm thuộc giá trị phức  A  x  mà phạm vi giá trị của nó là đường tròn đơn vị trong không gian phức, và có dạng:  A  x   rA  x .e j  x , j  1 A (0.1) Trong đó: rA  x  là biên độ và  A  x  pha, và cả 2 đều là các hàm có giá trị thực với điều kiện rA  x    0,1 và  A  x   (0, 2 ] . 1.4.3. Các phép toán trên tập mờ phức 1.4.3.1 Phần bù của tập mờ phức Cho A và B là hai tập mờ phức với:  A ( x)  rA ( x)e jA ( x ) và B ( x)  rB ( x)e jB ( x ) , Phần bù của tập mờ phức A ( kí hiệu A ) được xác định:  A  ( x,  A ( x)) | x U   ( x, rA ( x)e j A ( x ) ) | x U  (1.4) Với rA ( x)  1  rA ( x) và A ( x)  2  A ( x) . 4
  7. 1.4.3.2. Phép hợp và phép giao của hai tập mờ phức  Phép hợp hai tập mờ phức A và B (kí hiệu A  B ): A  B  ( x,  A B ( x)) | x U   ( x, rA B ( x)e jAB ( x ) ) | x U  (1.5)  ( x,  rA ( x)  rB ( x)  e jAB ( x ) ) | x U  Với phép  có thể là phép t-đối chuẩn, ví dụ như rA B ( x)  max rA ( x), rB ( x)  Phép giao hai tập mờ phức A và B (kí hiệu A  B ) được xác định bởi: A  B  ( x,  A B ( x)) | x U   ( x, rA B ( x)e jAB ( x ) ) | x U  (1.6)  ( x,  rA ( x)  rB ( x) e jAB ( x ) ) | x U  Với rA B ( x)  min rA ( x), rB ( x) và  A B ( x)  min  A ( x), B ( x)  Trong đó phép  biểu diễn hàm t-chuẩn, ví dụ như toán tử Min hoặc phép nhân đại số. 1.4.4. Logic mờ phức Hệ logic mờ phức sử dụng luật được xây dựng dựa trên tập mờ phức để tạo ra một hệ logic mờ phức. Một luật chính là biểu diễn của một quan hệ kéo theo mờ phức giữa hai tiền đề mờ phức không có điều kiện p và q, trong đó tiền đề p được mô tả là cụm “X là A” còn q được mô tả bởi “Y là B”. Hàm kéo theo của logic mờ phức:  A B  x, y    A  x    B  y  (1.14) 1.4.5. Độ đo mờ và độ đo mờ phức Định nghĩa: [44] Một độ đo mờ phức kí hiệu  :  F * U   F * U     0,1 đối với A, B và C  F * U  nếu thỏa mãn các tính chất sau: o   A, B   0,   A, B   0 khi và chỉ khi A  B o   A, B     B, A (1.16) o   A, B     A, C     C , B  Với F U  là tập các tập mờ phức trong U * 1.5. Dữ liệu thực nghiệm 1.5.1. Bộ dữ liệu chuẩn Để minh họa cho những mô hình đề xuất, luận án sử dụng các bộ dữ liệu chuẩn lấy từ kho dữ liệu học máy UCI bao gồm: Bộ dữ liệu ung thư vú Breast Wisconsin Dataset (WBCD), bệnh tiểu đường Diebetes, bộ dữ liệu đo chất lượng rượu (Wine Quality), bộ dữ liệu Hình ảnh tim thai CardiotocoGraphy- CTG và bộ dữ liệu Rối loạn nhịp tim (Arrhythmia). 1.5.2. Bộ dữ liệu thực Thông tin về dữ liệu bệnh gan được được trích từ hồ sơ bệnh án liên quan đến kết quả xét nghiệm (sinh hóa máu và công thức máu) và chẩn đoán bệnh từ các bác sĩ tại Bệnh viện Gang Thép và Bệnh viện Đa khoa Thái Nguyên. . 1.5.3. Các độ đo đánh giá thực nghiệm Các độ đo được sử dụng để đánh giá mô hình hệ suy diễn mờ phức đối với hệ hỗ trợ ra quyết định gồm có: Độ chính xác (Accuracy), độ đo Precision, độ đo Recall và tổng thời gian thực hiện. 1.6. Kết luận chương Chương 1 trình bày một số khái niệm nền tảng về lý thuyết tập mờ phức và hệ suy diễn mờ và hệ suy diễn mờ phức đã có, tổng quan về nghiên cứu về hệ suy diễn dựa trên tập mờ phức. Các nội dung trong chương 1 sẽ là các kiến thức nền và sử dụng trong các chương tiếp sau của luận án. 5
  8. Chương 2. XÂY DỰNG HỆ SUY DIỄN MỜ PHỨC DẠNG MAMDANI (M-CFIS) 2.1. Mở đầu Luận án đề xuất Hệ suy diễn mờ phức theo mô hình Mamdani cùng với chi tiết các thành phần cũng như các bước thực hiện, các toán tử trong mô hình và đồng thời cũng đề xuất các toán tử t-chuẩn, t-đối chuẩn mờ phức. Đề xuất toán tử t-chuẩn và t- đối chuẩn mờ phức. 2.2. Đề xuất toán tử t-chuẩn và t-đối chuẩn mờ phức 2.2.1. Toán tử t-chuẩn và t-đối chuẩn Phần này trình bày định nghĩa tổng quát về phép toán t-chuẩn và t-đối chuẩn 2.2.2. Toán tử t-chuẩn và t-đối chuẩn mờ phức Định nghĩa 2.3. Cho ánh xạ J : 0,1  0,1  0,1 với  0,1 là mặt phẳng đơn vị phức chứa tập hợp các số phức. Phép J được gọi là phép t-chuẩn mờ phức nếu các điều kiện sau thỏa mãn đối với mọi giá trị p, q, r   0,1 , p, q, r tương ứng là các hàm thuộc mờ phức p  p1e j1 , q  q1e j2 , r  r1e j3 (1) J  p, q   J  q, p  , (2) J  p, q   J  q, r  , nếu q  r (3) J  J  q, r    J  p, J  q, p  , r  , (4) J  p,1  p Định nghĩa 2.4. Cho ánh xạ J * :  0,1   0,1   0,1 với  0,1 là mặt phẳng đơn vị phức chứa tập hợp các số phức. Phép J * được gọi là phép t-đối chuẩn phức nếu các điều kiện sau thỏa mãn đối với mọi giá trị p, q, r   0,1 , p, q, r tương ứng là các hàm thuộc mờ phức p  p1e j1 , q  q1e j2 , r  r1e j3 (1) J *  p, q   J *  q , p  , (2) J *  p, q   J *  q, r  , nếu q  r (3) J *  J *  q, r    J *  p, J *  q, p  , r  , (4) J *  p,0   p Định nghĩa 2.5. Nếu hàm t-chuẩn mờ phức J  p, q  liên tục và J  p, p   p với mọi p   0,1 thì nó được gọi là hàm toán tử t-chuẩn mờ phức Archimedean. Nếu một toán tử t-chuẩn mờ phức Archimedean tăng chặt với mọi p, q   0,1 thì nó được gọi là toán tử t-chuẩn mờ phức Archimedean chặt. Định nghĩa 2.6. Nếu hàm t-đối chuẩn mờ phức J *  p, q  liên tục và J *  p, p   p với mọi p   0,1 thì nó được gọi là hàm toán tử t-đối chuẩn mờ phức Archimedean. Nếu một toán tử t-đối chuẩn mờ phức Archimedean tăng chặt với mọi p, q   0,1 thì nó được gọi là toán tử t-đối chuẩn mờ phức Archimedean chặt. Định lý 2.1. Toán tử T-chuẩn J và T-đối chuẩn J * phải thỏa mãn các tính chất phân phối sau: (1) J  p, J *  q, r    J *  J  p, q  , J  p, r   , (2) J *  p, J  q, r    J  J *  p, q  , J *  p, r   . Định lý 2.2. Toán tử T- chuẩn J và T- đối chuẩn J * phải thỏa mãn các tính nuốt (tính chất được suy rộngctừ lý thuyết tập hợp) như sau: (1) J  J *  p, q  , p   p, (2) J *  J  p, q  , p   p. Định lý 2.3. Toán tử T- chuẩn J và T- đối chuẩn J * phải thỏa mãn các tính lũy đẳng sau: (1) J  p, q   p (2) J *  p, q   p Định nghĩa 2.7. Cho  : 0,1  0,1  0,1 ,  được gọi là hàm phủ định nêú nó thỏa mãn tính chất sau: (1) N  0   1, N 1  0 (2) N  p   N  q  khi p  q 6
  9. Định nghĩa 2.8. Hàm phủ định  được coi là chặt nếu nó thỏa mãn điều kiện: (1)  là hàm liên tục (2) và giảm chặt tức là N  p   N  q  nếu p  q với mọi p, q   0,1 Định nghĩa 2.9. Hàm phủ định  được coi là mạnh nếu nó là chặt và thỏa mãn điều kiện N  N  p    p với mọi p  0,1 Định lý 2.4. Toán tử t-chuẩn J , toán tử t-đối chuẩn J * và toán tử phủ định phải thỏa mãn luật loại trừ trung bình sau: (1) J  p, N  p    0, (2) J *  p, N  p    1 Định lý 2.5. Toán tử t-chuẩn J , toán tử t-đối chuẩn J * và toán tử phủ định N phải thỏa mãn luật De Morgan sau: (1) N  J  p, q    J *  N  p  , N  q   (2) N  J *  p, q    J  N  p  , N  q   Mệnh đề 2.2. Nếu toán tử phủ định N là chặt thì các luật trong định lý 2.4 đều thỏa mãn   Mệnh đề 2.3. Nếu toán tử phủ định N là chặt thì J  p, q   N J *  N  p  , N  q   , và  J *  p, q   N J  N  p  , N  q    2.2.3. Ví dụ minh họa hỗ trợ ra quyết định Trong phần này, luận án trình bày về ứng dụng toán tử t-chuẩn và t-đối chuẩn trong quá trình hỗ trợ ra quyết định và minh họa trên bộ dữ liệu bệnh Viêm gan Liver thu thập ở Bệnh viện Ganh thép Thái Nguyên và Bệnh viện đa khoa Thái Nguyên, quá trình gồm các bước sau: Bước 1. Giả sử vấn đề hỗ trợ ra quyết định với m phương án   i  1, 2,..., m  và n tiêu chí  k  k  1, 2,..., n  . Người ra quyết định đi xây dựng ma trận ra quyết định    yik mn trong đó yik thể hiện mức độ mà người ra quyết định thích phương án  i đối với tiêu chí  k . Trọng số của tiêu chí được diễn tả bởi  j    các số mờ phức CFNs  k   k e k ,  k  1, 2,..., n  , với  k là thành phần biên độ hay mức độ thích của người ra quyết định đối với tiêu chí  k và  k là thành phần pha. Bước 2. Biến đổi ma trận quyết định    yik mn thành ma trận chuẩn hóa D   ik mn , với yik ik  , i  1,..., m; k  1,..., n max yik i Bước ,k 3. Sử dụng các toán tử trong ví dụ 2.3 để tính toán t-chuẩn mờ phức Lukasiewicz Bước 4: Tổng hợp các cấp độ mức độ thuộc phức. Bước 5: Xem xét điểm cao nhất là ứng cử viên cho thứ hạng tốt nhất. 7
  10. 2.3. Hệ suy diễn mờ phức Mamdani (M-CFIS) 2.3.1. Đề xuất hệ suy diễn mờ phức Mamdani Hình 2.1. Mô hình hệ suy diễn Mamdani dựa trên tập mờ phức 2.3.2. Các lựa chọn sử dụng trong hệ suy diễn mờ phức Mamdani 2.3.2.1. Hàm thuộc mờ phức Trong mô hình Hệ suy diễn mờ phức dạng Mamdani đề xuất hàm thuộc mờ phức có dạng như sau:   x   r  x .ei  x với thành phần pha   x    0, 2  and thành phần biên độ r  x    0,1 . 2.3.2.2. Các toán tử sử dụng trong Hệ Mamdani CFIS Trong nghiên cứu của chúng tôi, các toán tử được xác định như sau: 1. Toán tử T- chuẩn Minimum được sử dụng để tính toán độ mạnh của luật mờ phức với phép AND được dùng để liên kết các điều kiện của luật. 2. Toán tử T-đối chuẩn Maximum được sử dụng để tính toán độ mạnh của luật mờ phức với phép OR được dùng để liên kết các điều kiện luật. 3. Luật kéo theo Mamdani được dùng để tính toán kết quả của mỗi luật mờ phức sử dụng phép tích vô hướng có dạng như sau:    x  B  y   i 2  A   A B  x, y    rA  x  .rB  y   .e .  2 2  2.3.2.3. Vec tơ tổ hợp đối với tập mờ phức Trong mô hình mờ phức Mamdani đề xuất phép toán tổ hợp là phép tích vô hướng giữa các vector giá trị phức có dạng như sau: wp . Ap  x   wp . Ap  x   rp' e  i 'p r Ap  xe  i Ap  x    rp' rAp  x  e  i  'p  Ap  x       rp' rAp  x  cos  'p   Ap  x   i sin  'p   Ap  x    2.3.2.4. Tổng hợp đầu ra cuối cùng Hàm đầu ra như sau: D  y   1  y    2  y   ...   k  y  với  p  y  là các hàm giá trị phức. Điều này đảm bảo rằng hệ suy diễn mờ phức thực sự, trong đó thành phần pha được xem xét trong tất cả các bước của quá trình ra quyết định 8
  11. 2.3.3. Cấu trúc của hệ suy diễn mờ phức Mamdani Quá trình tính toán kết quả đầu ra thông qua mô hình hệ suy diễn mờ phức Mamdani cũng bao gồm 6 bước. Cụ thể từng bước như sau: Bước 1: Xác định tập các luật mờ phức Bộ luật mờ phức có dạng như sau: CFR1: If xm1,1 is A1,1 O1,1 xm1,2 is A1,2 O1,2 … O1, n1 1 xm1,n1  is 𝐴1,𝑛1 then y is C1 CFR2: If xm 2,1 is A2,1 O2,1 xm 2,2 is A2,2 O2,2 … O2, n2 1 xm 2,n2  is A2,n2 then y is C 2 … … … … CFRk: If xm k ,1 is Ak ,1 Ok ,1 xm k ,2 is Ak ,2 Ok ,2 … Ok , nk 1 xm k ,nk  is Ak , nk then y is C k Trong đó: (a) m  p, q  1, 2,..., n với 1  m  p,1  m  p, 2   ...  m  p, n p   n     (b)  Ap ,q xm p ,q   rAp ,q xm p ,q  e   i Ap ,q xm p ,q  , với rAp ,q :  0,1 và  Ap ,q :   0,2  . iC p  y  (c) C p  y   rC p  y  e , với rC p :  0,1 và C p :   0, 2  . (d) T0 là toán tử T-chuẩn và S 0 là toán tử S-chuẩn (ví dụ như T-đối chuẩn) tương ứng với 𝑇0 . (e) f p :  0, 2  p   0, 2  , với f p  2 ,2 ,...,2   2 n i p (f)  p   p e , where    Trong đó:  p  f p Ap ,1 xm p,1 , Ap ,2 xm p,2 , Ap ,3 xm p ,3 ,..., Ap ,n     p  x    . m p,np (i) Op , q  and khi và chỉ khi N p , q  T0 (ii) O p , q  or khi và chỉ khi N p ,q  S0 Bước 2: Mờ hóa dữ liệu đầu vào Trong bước này mỗi giá trị đầu vào được mờ hóa bởi hàm thuộc mờ    phức có dạng sau:  Ap ,q am p ,q   rAp ,q am p ,q  e   i Ap ,q am p ,q  với p, q i p Bước 3: Xác định độ mạnh của luật Tính toán độ mạnh của từng luật mờ phức wp   p e . Trong đó:  p  N p ,n p 1 ...N  N r p ,2 p ,1  x    , r  x    , r  x   ..., r Ap ,1 m p ,1 Ap ,2 m p ,2 Ap ,3 m p ,3 Ap ,n p  x    m p ,np  p  f p A  p ,1  x    , m p ,1 Ap ,2  x    ,  x    ,...,  x    m p ,2 Ap ,3 m p ,3 Ap ,n p m p,np Bước 4: Tính toán các kết quả đầu ra y của luật mờ phức   Dạng của hàm đầu ra đối với mỗi luật mờ phức CFR p như sau:  p  y   U 0  p , rC p  y  e   ig0  p ,C p  y  Bước 5: Tổng hợp kết quả đầu ra của các luật mờ phức Phân bố đầu ra được định nghĩa như sau: D  y   1  y    2  y   ...   k  y  Bước 6: Giải mờ kết quả đầu ra Chọn hàm  : F  ,  , giá trị đầu ra được xác định bởi: yop    D    y D  y  dy Ví dụ chúng ta có thể chọn xấp xỉ   D    sử dụng luật hình thang đối với mọi  D  y  dy  f F ,  . 2.4. Thử nghiệm và đánh giá kết quả Chúng tôi thực nghiệm so sánh mô hình đề xuất M-CFIS với mô hình hệ suy diễn mờ Mamdani (M- FIS) trên bộ dữ liệu chuẩn UCI và bộ dữ liệu thực Liver lấy từ Bệnh viện Gang thép và đa khoa Thái Nguyên được chỉ rõ trong hình 2.2, 2.3 và 2.4. Ta có thể nhận thấy mô hình hệ suy diễn mờ phức M-CFIS hiệu quả 9
  12. hơn hệ suy diễn mờ Mamdani trên cả 2 tiêu chí đánh giá: Độ chính xác, Precision và Recall. Bởi đối với vấn đề chẩn đoán bệnh, các thuộc tính bệnh luôn có tác động qua lại lẫn nhau, có mối liên hệ lẫn nhau nên khi sử dụng yếu tố bổ sung là mối quan hệ giữa các thuộc tính bệnh sẽ làm tăng hiệu quả của chẩn đoán bệnh chứ không xét riêng lẻ từng thuộc tính như tập mờ thông thường. Tuy nhiên khi đưa thêm vào các yếu tố bổ sung thì thời gian thực hiện của mô hình M-CFIS lại nhiều hơn M-FIS do còn phải tính toán thêm với thành phần pha Hình 2.2. Kết quả chạy thực nghiệm trên bộ WBCD Hình 2.3. Kết quả chạy thực nghiệm trên bộ Diebetes Hình 2.4. Kết quả chạy thực nghiệm trên bộ dữ liệu thực Liver 2.5. Kết luận chương Chương 2 trình bày kết quả nghiên cứu của luận án về hướng tiếp cận dựa trên tập mờ phức. Thứ nhất, luận án đề xuất toán tử t-chuẩn, t-đối chuẩn dựa trên lý thuyết tập mờ phức và ứng dụng toán tử đề xuất đối với vấn đề hỗ trợ ra quyết định. Thêm nữa, một hệ suy diễn dựa trên tập mờ phức theo mô hình Mamdani được đề xuất. Đó là mô hình kết hợp giữa ly thuyết tập mờ phức và mô hình hệ logic mờ phức. Trong mô hình cũng trình bày chi tiết các bước thực hiện cũng như toán tử sử dụng trong Hệ suy diễn đề xuất Chương 3. TINH GIẢM HỆ LUẬT TRONG HỆ SUY DIỄN MỜ PHỨC MAMDANI (M- CFIS-R) 3.1. Giới thiệu Hệ thống đề xuất M-CFIS ở chương 2 còn hạn chế ở chính hệ cơ sở luật vì việc giảm luật chỉ thực hiện dựa vào việc tính toán độ mạnh và yếu của luật. Và hệ luật thu được trong M-CFIS có thể vẫn còn dư thừa nếu chỉ giảm luật trùng, luật yếu. Để khắc phục nhược điểm này, trong nội dung chương này luận án trình bày cải tiến tối ưu hóa hệ luật của M-CFIS bằng việc áp dụng tính toán hạt kết hợp với các độ đo đề xuất. 10
  13. 3.2. Đề xuất độ đo tương tự mờ phức 3.2.1. Độ đo tương tự mờ phức Cosine Định nghĩa 3.1. Cho hai tập mờ phức S1  rS1  x  e và S 2  rS2  x  e jS1 ( x ) jS2 ( x ) trong S với mọi x  X , biên độ và pha của hàm thuộc mờ phức đều thuộc khoảng [0,1]. Độ đo tương tự mờ phức Cosine (kí hiệu CFCSM) giữa hai tập mờ phức S1 và S 2 được định nghĩa theo công thức sau: 1 n a1a2  b1b2 CCFS   n k 1  a    b 2   a 2   b 2 2 (3.1) 1 1 2 2  Với a1  Re rS1  x  e jS1 ( x ) ;  b1  Im rS1  x  e jS1 ( x ) ; a 2   Re rS2  x  e jS2 ( x ) ; b 2   Im rS2  x  e jS2 ( x )  Định nghĩa 3.2. Độ đo tương tự Cosine mờ phức có trọng số (WCNCSM) Cho hai tập mờ phức S1  rS1  x  e và S 2  rS2  x  e jS1 ( x ) jS2 ( x ) trong S với mọi x  X . Một độ đo tương tự Cosine mờ phức có trọng số giữa hai tập mờ phức S1 và S 2 được định nghĩa như sau: n a1a2  b1b2 n CWCFS   k với   j  1 (3.2)  a1    b1    a2    b2  2 2 2 2 k 1 j 1 3.2.2. Độ đo tương tự mờ phức Dice Định nghĩa 3.3. Cho hai tập mờ phức S1  rS1  x  e và S 2  rS2  x  e jS1 ( x ) jS2 ( x ) trong S với mọi x  X . Độ đo tương tự mờ phức Dice (kí hiệu CFDSM) giữa hai tập mờ phức S1 và S 2 được định nghĩa theo công thức sau: 1 n 2 a1b1a2b2 DCFS   n k 1 a1b1  a2b2 (3.3)  Với a1  Re rS1  x  e jS1 ( x ) ;  b1  Im rS1  x  e jS1 ( x ) ; a 2   Re rS2  x  e jS2 ( x ) ; b 2   Im rS2  x  e jS2 ( x )  Định nghĩa 3.4. Độ đo tương tự mờ phức Dice có trọng số (WCFDSM) Cho hai tập mờ phức S1  rS1  x  e và S 2  rS2  x  e jS1 ( x ) jS2 ( x ) trong S với mọi x  X . Một độ đo tương tự mờ phức Dice có trọng số giữa hai tập mờ phức S1 và S 2 được định nghĩa như sau: n  2 a1b1a2b2  n (3.4) DWCFS   k   với   j  1 k 1  a1b1  a2b2  j 1 3.2.3. Độ đo tương tự mờ phức Jaccard Định nghĩa 3.5. Cho hai tập mờ phức S1  rS1  x  e và S 2  rS2  x  e jS1 ( x ) jS2 ( x ) trong với mọi x  X Độ đo tương tự mờ phức Jaccard (kí hiệu CFJSM) giữa hai tập mờ phức S1 và S 2 có thể được xác định như sau: 1 n a1b1a2b2 J CFS   n k 1  a1b1  a2b2   a1b1 . a2b2   (3.5)  Với a1  Re rS1  x  e jS1 ( x ) ;  b1  Im rS1  x  e jS1 ( x ) ; a 2   Re rS2  x  e jS2 ( x ) ; b 2   Im rS2  x  e jS2 ( x )  Định nghĩa 3.6. Độ đo tương tự mờ phức Jaccard có trọng số (WCFJSM) Cho hai tập mờ phức S1  rS1  x  e và S 2  rS2  x  e jS1 ( x ) jS2 ( x ) trong S với mọi x  X . Một độ đo tương tự mờ phức Jaccard có trọng số giữa hai tập mờ phức S1 và S 2 được định nghĩa như sau: n  a1b1a2b2  n 3.6 JWCFS   k   với   j  1 k 1   a1b1  a2b2   a1b1 . a2b2    j 1   11
  14. Hình 3.1. Giai đoạn Training của mô hình đề xuất 3.3. Đề xuất mô hình hệ suy diễn M-CFIS-R 3.3.1. Ý tưởng xây dựng mô hình Mô hình M-CFIS-R đề xuất chia làm 2 phần chính: Phần Training (Hình 3.1): được sử dụng để huấn luyện, sinh ra các luật mờ và tối ưu hệ luật mờ sử dụng tính toán hạt kết hợp với độ đo mờ phức. Phần Testing: được sử dụng để kiểm tra việc thực hiện suy diễn trên hệ luật mờ mới đã được tối ưu trong phần Training. 3.3.2. Phần Training. 3.3.2.1. Chọn dữ liệu phần thực và phần ảo. Từ bộ dữ liệu Training, chúng tôi xây dựng dữ liệu dành cho phần thực và phần ảo như sau: Phần dữ liệu thực : chính là giá trị dữ liệu ban đầu; Phần dữ liệu ảo trên mỗi bản ghi P của thuộc tính Q được tính bằng công thức sau : var.P(dòng)+ var.Q(cột) với Var.P(dòng) là giá trị phương sai trên dòng P và Var.Q(cột) là giá trị phương sai theo cột Q. 3.3.2.2. Thuật toán phân cụm mờ FCM Trong phần này, thuật toán toán phân cụm mờ FCM được sử dụng để phân cụm dữ liệu trong mỗi thuộc tính thành từng nhóm khác nhau, mỗi nhóm tương ứng với một nhãn ngôn ngữ . 3.3.2.3 Độ đo mờ phức tính toán hạt Kết quả thu được của 3 độ đo tương tự mờ phức là ba ma trận tương quan (kí hiệu D1 , D 2 , D 3 ). Sau đó, mức độ tương tự cuối cùng giữa các luật mờ phức được xác định như sau: Fij  a1Dij1  a2 Dij2  a3 Dij3 Đối với mỗi nhãn, tính các giá trị a1 (l ), a2 (l ),..., ae (l ) để từ đó tính được giá trị độ tương tự giữa các luật mờ phức cuối cùng tương ứng với mỗi nhãn Fij (l ) . Các hệ số tương ứng với mỗi nhãn được tính bằng Dt / l Dt / l D / t t công thức sau: at (l )   ij i 1 j i 1 Dt / l 12
  15. Đối với mỗi luật ứng với nhãn khác thì giá trị Fij  0 . Cuối cùng, chúng tôi thu được hệ cơ sở luật mờ phức chính là ma trận F . Một hệ cơ sở luật mờ phức mới được đưa ra bằng cách loại bỏ những luật có độ tương đồng cao trong nhóm luật và tiếp theo sẽ thực hiện đánh giá hiệu quả của hệ luật mới này. Trong trường hợp mà hiệu quả của cơ sở luật mờ phức mà kém hơn thì ta quay trở lại bước trước để tính lại độ đo tương tự mờ phức và tính toán hạt tiếp cho hệ cơ sở luật mới này. Quá trình này lặp lại cho đến khi hiệu quả của hệ cơ sở luật mới này cao hơn bộ luật gốc hoặc độ chính xác của luật đối với bất kì nhãn nào bằng 1. 3.3.3. Phần Testing Trong phần Testing, quá trình suy diễn tương tự như M-CFIS được thực hiện để kiểm tra hiệu năng của hệ thống với bộ luật mờ phức mới thu được từ giai đoạn Traning. 3.4. Thử nghiệm và đánh giá kết quả 3.4.1. Kết quả thực nghiệm trên bộ dữ liệu UCI Áp dụng phương pháp 3-fold cross-validation, các giá trị chỉ số độ đo thực nghiệm so sánh mô hình đề xuất M-CFIS-R với mô hình M-CFIS được thể hiện rõ trong hình 3.3 và 3.4. (a) (b) (c) (d) (e) Hình 3.3. Kết quả thực nghiệm trên Bộ dữ liệu WBCD Hình 3.3 mô tả rõ kết quả thực hiện chạy mô hình M-CFIS và M-CFIS-R trên bộ dữ liệu WBCD. Độ chính xác, giá trị Recall và giá trị Precision của mô hình M-CFIS-R trên bộ dữ liệu Training và Testing đều cao hơn mô hình M-CFIS. Thời gian thực hiện của hai mô hình này là tương đương nhau với số lượng luật trung bình của M-CFIS-R ít hơn 36 luật so với M-CFIS. Qua đó, có thể dễ dàng nhận thấy là số lượng luật của mô hình M-CFIS-R thấp hơn khá nhiều so với mô hình M-CFIS. 13
  16. (b) (c) (a) 200 Số lượng luật 100 106 101 0 M-CFIS M-CFIS-R (d) (e) Hình 3.4. Kết quả thực nghiệm trên Bộ dữ liệu Diebetes Hình 3.4 thể hiện các chỉ số so sánh đối với mô hình M-CFIS-R đều cao hơn so với mô hình M-CFIS trên 1% với độ lệch chuẩn khá nhỏ. Nhưng tổng thời gian tính toán của M-CFIS-R cao hơn M-CFIS 0.02 trên dữ liệu Training và 0.086 trên dữ liệu Testing. Trong khi đó tổng số lượng luật của M-CFIS-R chỉ ít hơn 5 luật so với mô hình M-CFIS và có độ lệch chuẩn là 0.94. 3.4.2. Kết quả thực nghiệm trên bộ dữ liệu thực Kết quả so sánh đánh giá hiệu năng của mô hình M-CFIS-R đề xuất với mô hình M-CFIS được thể hiện rõ trong hình 3.5. (a) (b) (c) 900 850 Số lượng luật 800 839 750 770 700 M-CFIS M-CFIS-R (d) (e) Hình 3.5. Kết quả thực nghiệm trên Bộ dữ liệu Liver Hình 3.5 chỉ rõ các chỉ số kết quả thực hiện của 2 mô hình so sánh M-CFIS-R và M-CFIS trên bộ dữ liệu bệnh Gan của bệnh viện Gang thép và bệnh viện Đa khoa Thái Nguyên. Chúng ta có thể thấy rõ độ chính 14
  17. xác, , các chỉ số Precision và Recall khi chạy mô hình M-CFIS-R trên bộ dữ liệu Training và Testing đều cao hơn M-CFIS. Cho dù chỉ số Recall khi thực hiện mô hình M-CFIS trên bộ dữ liệu Testing nhỏ hơn 0.4% so với mô hình M-CFIS nhưng với độ lệch chuẩn nhỏ (chỉ 0.03). Điều này có thể dễ lí giải bởi nguyên nhân do sự giảm số luật chỉ rõ trong hình 3.5 (e). Đối với bộ dữ liệu bệnh Liver, số lượng luật trong M-CFIS-R ít hơn so với M-CFIS 69 luật. Đó cũng chính là lí do mà tổng thời gian thực hiện của C-FIS-R nhiều hơn M-CFIS. 3.5. Kết luận chương Trong nội dung chương 3, luận án đề xuất một hệ thống M-CFIS-R, trong đó có sự kết hợp giữa các độ đo tương tự mờ phức Cosine, độ đo tương tự mờ phức Dice và độ đo tương tự mờ phức Jaccard với kĩ thuật tính toán hạt. Mục đích của hệ thống nhằm giảm luật thu được hệ luật trong hệ M-CFIS mà không giảm đi hiệu quả của mô hình. Tuy nhiên, hệ M-CFIS-R vẫn chỉ dừng lại ở tối ưu cục bộ chứ chưa đạt được tối ưu toàn cục do thuật toán chỉ thực hiện đánh giá hiệu quả của hệ luật mới trên mô hình Training thì dừng lại. Chương 4. MỞ RỘNG HỆ SUY DIỄN MỜ PHỨC MAMDANI VỚI ĐỒ THỊ TRI THỨC (M- CFIS-FKG) 4.1. Mở đầu Trong chương 3, luận án đã đưa ra cải tiến của M-CFIS được gọi là M-CFIS-R, tuy nhiên, ngoài những ưu điểm thì hệ thống M-CFIS-R vẫn còn tồn tại một số hạn chế sau: (1) Dữ liệu được kiểm tra trong phần Testing bằng cách kiểm tra đối với từng luật trong hệ luật. Điều này dẫn đến chi phí thời gian tính toán khá cao. (2) Đối với dữ liệu trong phần Testing mà không chứa các bản ghi được suy ra bởi luật trong hệ luật thì khi đó khó có thể đưa ra được kết quả do trong hệ luật không có. (3) Mô hình M-CFIS-R hoạt động dựa trên mô hình suy luận Mamdani, cần được phát triển lên mô hình hệ suy diễn Sugeno và Tsukamoto.(4) những khái niệm độ đo hay tích phân mờ phức khác cũng cần được nghiên cứu và xem xét. Chính vì những lí do đó mà trong nội dung chương 4, luận án đưa ra cách tiếp cận mới dựa trên đồ thị tri thức để khắc phục những hạn chế của mô hình M-CFIS-R trong chương 3 mà NCS đã đưa ra. 4.2. Một số mở rộng của mô hình M-CFIS-R 4.2.1. Hệ suy diễn mờ phức Sugeno và Tsukamoto  Hệ suy diễn mờ phức Sugeno: Hệ suy diễn mờ phức Sugeno được mô tả qua các bước sau: Bước 1. Sinh luật mờ phức. Một luật CFRi được biểu diễn như sau: CFRi : If xm,1 is Ai ,1 Oi ,1 xm ,2 is Ai ,2 Oi ,2 … Oi , ni 1 xm,ni is Ai , ni then f i ; Trong đó: Ai ,1 ,..., Ai , ni là tập mờ phức và là các biến đầu vào của mô hình; Oi ,1 ,..., Oi ,ni 1 là các toán tử t- chuẩn và t-đối chuẩn tùy thuộc vào ứng dụng và f i là hàm tuyết tính của kết quả đầu ra tương ứng với mỗi luật mờ phức. Bước 2: Mờ phức hóa. Thực hiện quá trình mờ phức hóa mỗi giá trị đầu vào bởi hàm thuộc mờ phức. Bước 3: Tổng hợp độ mạnh của luật. Mỗi luật mờ phức có một giá trị độ mạnh của luật, kí hiệu bởi w m và được tính toán bởi: w m   m e j  m ;  Bước 4: Tính toán giá trị đầu ra của các luật sử dụng công thức: zm  f m am,1 , am,2 ,..., am,nm  i m i g0 ( m , m ) Bước 5: Tổng hợp kết quả cuối cùng. Cho zm  vm e và wm  zm  ( mvm ) e với mọi m. Khi đó, kết quả đầu ra được tính toán bằng công thức tính tổng hợp trọng số sau: 15
  18. k w  z  w2  z2  ...  wk  zk w m  zm yop  1 1  m 1 w1  w2  ...  wk k w m 1 m  Hệ suy diễn mờ phức Tsukamoto: Quy trình suy diễn của mô hình hệ suy diễn mờ phức Tsukamoto cũng tương tự như đối với mô hình hệ suy diễn mờ phức Sugeno. Mỗi kết quả trong mỗi luật trong mô hình hệ suy diễn mờ phức Tsukamoto được xác định bởi một hàm đơn điệu trên tập mờ phức. Do đó kết quả suy luận của mỗi luật sẽ thu được dựa vào các giá trị dự đoán. Cuối cùng, kết quả cũng được tính toán bằng công thức trung bình trọng số (tương tự như với S-CFIS-R). 4.2.2. Độ đo mờ phức dựa trên lý thuyết tập hợp Định nghĩa 4.1. Cho một tập mờ phức không rỗng C trên không gian nền X . Một tập con CF của CF (C ) được coi là phép đại số của tập mờ phức trên C nếu nó thỏa mãn các điều kiện sau: (1) 1 , C  CF , (2) Nếu P  CF , thì C \ P  CF (3) Nếu P, Q  CF , thì P  Q  CF Định nghĩa 4.2. Cho một không gian đo được mờ phức  C , CF  . Một ánh xạ r : CF  H được định nghĩa là độ đo mờ phức trên  C , CF  nếu thỏa mãn các điều kiện sau: (1) r 1  .e j 1   0 và r  C  .e jC   1 (2) rD  x .e jD  x  rE  x .e jE  x với x  X , với D, E  X và D  E Định nghĩa 4.3. Cho không gian độ đo mờ phức  C , CF  ,  D, CG  và một ánh xạ k : CF  CG . Ánh xạ k được gọi là một phép đẳng cấu giữa  C , CF  và  D, CG  nếu các điều kiện sau được thỏa mãn: (1) k là một song ánh với k 1   1 (2) k  P  Q   k  P   k  Q  và k  C \ P   D \ k  P  với P, Q  CF (3) Tồn tại một song ánh l : Dom  C   Dom  D  với P  x   k  P   l  x   , P  CF và x  Dom  C  Định nghĩa 4.4. Cho không gian độ đo mờ phức (C, CF , r ,  ) và ( D, CG, r * , * ) . Một ánh xạ k : CF  CG được gọi là ánh xạ đẳng cấu giữa hai không gian (C, CF , r ,  ) và ( D, CG, r * , * ) nếu điều kiện sau được thỏa mãn: (1) k là một ánh xạ đẳng cấu giữa hai không gian độ đo mờ phức  C , CF  và  D, CF  . (2) r  P  .e    r *  k  P   .e   với P  CF j P j P * Định nghĩa 4.5. Một không gian mờ phức (C, CF , r ,  ) được gọi là không gian đẳng cấu nếu thoả mãn các tính chất sau: (1) P  CF , thì l   P   CF , (2) r  P  .e j  P   r  l   P   .e  j l   P   với P  CF và với hoán vị l trên Dom C .   4.2.3. Tích phân mờ phức Định nghĩa 4.6. Cho một không gian độ đo mờ phức  C , CF , r ,   với X  Dom(C ) , một ánh xạ l : X  H và CF - độ đo P . Tích phân mờ phức- của k trên P được tính theo công thức sau: P fdrP  x  .e j P  x     QCFP xsupp Q  l  x  rQ  q  .e jQ  q   với CF P   CFP \ 1  4.3.3.1. Tích phân mờ phức Định nghĩa 4.7. Cho không gian độ đo mờ phức  C , CF  và X  Supp  C  , một phép đại số của các tập SP trên X là một biểu diễn rõ của phép đại số CF khi và chỉ khi có Q  CF với P  SP thỏa mãn các điều kiện sau: supp  Q   P và nếu supp  Q *  P với Q*  CF , thì Q*  Q . 16
  19. 4.3.3.2. Liên hệ với tích phân Sugeno Định lý 4.4. Cho dàn thặng dư có thể chia hoàn toàn U , một không gian độ đo mờ phức  C , CF , r ,   với  j  P1Kb   b *  X  Dom  C  và một ánh xạ l : X  H . Thì ta có: P ldrP  b .e P  b  b  r P 1Kb   b  .e j  b  *  H   Với  r * ,  *  là độ đo mờ phức trong trên  C , CF  C   . 4.3.3.3. Các tính chất của tích phân mờ phức Định lý 4.6. Cho không gian độ đo mờ phức  C , CF , r ,   với X  Dom  C  . Nếu có D  CF  X  với C  D, CG  A lg  D  và C là rõ thì ánh xạ  : CG  H được xác định bởi hàm sau: P  p  .e j P  p   PdrP  p .e jP  p  là một độ đo mờ phức trên  D, CG  . 4.3. Đề xuất mô hình hệ suy diễn mờ phức M-CFIS-FKG 4.3.1. Ý tưởng xây dựng mô hình Với mục đích cải thiện tốc độ tính toán của quá trình suy diễn trong bộ dữ liệu Testing, mô hình M- CFIS-R được mở rộng theo cách sau: Bộ dữ liệu đầu tiên được chia thành 3 phần với tên gọi Training, Hình 4.1. Quá trình Training 17
  20. Hình 4.2. Quá trình Testing Validation và Testing. Với bộ dữ liệu Training, thực hiện tính dữ liệu phần thực, phần ảo và áp dụng mô hình M-CFIS-R để thu được bộ cơ sở luật mờ phức được thu gọn. Sau đó, NCS đi thực hiện xây dựng đồ thị tri thức mờ (FKG) từ bộ cơ sở luật và biểu diễn nó bởi ma trận. Với bộ dữ liệu Testing, NCS đi xây dựng Thuật toán tìm kiếm suy diễn nhanh (FISA) để thu được đầu ra từ đồ thị tri thức mờ. 4.3.2. Xây dựng đồ thị tri thức mờ Cho hệ cơ sở luật mờ phức với X1, X2, …Xm là các thuộc tính của bộ dữ liệu. Chúng tôi xây dựng FKG cho từng luật mờ Rt , với t  1, k . Với mỗi cặp thuộc tính  X , X  , 1  i  j  m trong luật R , ta xây i j t dựng cạnh Value  X i   Value  X j  với Value  X i  là biến ngôn ngữ ứng với thuộc tính X i . Với mỗi cặp giá trị  X i , Label  ,1  i  m , mỗi cạnh Value  X i   Labelt được xây dựng đồ thị với Labelt là nhãn của luật thứ t. Cho Aijt là trọng số của cạnh Value  X i   Value  X j  trong luật t với t  1, k , 1  i  j  m , thì Aijt : X i relation with X j in rule t Aijt  (1) R Trọng số Bilt biểu diễn mối quan hệ của thuộc tính X i với nhãn l trong đó t  1, k , 1  i  j  m , l  1, C . Thì giá trị Bilt được tính theo công thức sau   X relation with label l in rule t Bilt    Aijt  * i (2)   R Ví dụ với 6 luật mờ phức sau: R1: If x1 is Medium1 and x2 is High2 and x3 is High3 then k is 1 R2 : If x1 is High1 and x2 is Low2 and x x3 is Low3 then k is 2 R3 : If x1 is Low1 and x2 is Medium2 and x3 is High3 then k is 1 R4 : If x1 is Low1 and x2 is High2 and x3 is Medium3 then k is 1 R5 : If x1 is High1 and x2 is Low2 and x3 is Medium3 then k is 2 R6 : If x1 is Medium1 and x2 is Low2 and x3 is Low3 then k is 2 Áp dụng các bước tính toán trên, ta thu được đồ thị FKG của 6 luật như sau: 18
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2