Giải pháp tối ưu tập luật mờ TSK trích xuất từ máy học Véc-tơ hỗ trợ hồi quy: Đề tài khoa học và công nghệ cấp cơ sở

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN

BÁO CÁO TỔNG KẾT

ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ

CẤP CƠ SỞ

MỘT SỐ GIẢI PHÁP TỐI ƯU TẬP LUẬT MỜ TSK

TRÍCH XUẤT TỪ MÁY HỌC VÉC-TƠ HỖ TRỢ

HỒI QUY

Mã số: T2018-………

Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài

Nguyễn Đức Hiển

Đà Nẵng, 12/2018

MC LC

MC LC .............................................................................................................................. i

DANH MC HÌNH VẼ ....................................................................................................... iii

DANH MC BẢNG BIỂU .................................................................................................. iv

DANH MC CÁC TỪ VIẾT TẮT ....................................................................................... v

THÔNG TIN KẾT QUẢ NGHIÊN CỨU ............................................................................ vi

MỞ ĐẦU ............................................................................................................................... 1

1. Tổng quan ...................................................................................................................... 1

2. Tính cấp thiết của đề tài ................................................................................................. 2

3. Mục tiêu đề tài ............................................................................................................... 2

4. Cách tiếp cận và phương pháp nghiên cứu .................................................................... 2

5. Đối tượng và phạm vi nghiên cứu ................................................................................. 3

6. Nội dung nghiên cứu ..................................................................................................... 3

Chương 1. TRÍCH XUẤT MÔ HÌNH MỜ HƯỚNG DỮ LIỆU DỰA TRÊN MÁY HỌC

VÉC-TƠ HỖ TRỢ ................................................................................................................. 5

1.1. Cơ bản về logic mờ ................................................................................................. 5

1.1.1. Lý thuyết tập mờ ................................................................................................. 5

1.1.2. Luật mờ “IF-THEN” ........................................................................................... 7

1.1.3. Mô hình mờ hướng dữ liệu .................................................................................. 9

1.1.4. Mô hình mờ Mamdani ....................................................................................... 10

1.1.5. Mô hình mờ TSK .............................................................................................. 12

1.2. Máy học véc-tơ hỗ trợ ........................................................................................... 15

1.2.1. Lý thuyết máy học Véc-tơ hỗ trợ ...................................................................... 15

1.2.2. Máy học Véc-tơ hỗ trợ cho vấn đề tối ưu hóa hồi qui ...................................... 17

1.3. Trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ trợ ........................................ 20

Chương 2. CÁC GIẢI PHÁP TỐI ƯU HÓA TẬP LUẬT MỜ TRÍCH XUẤT TỪ DỮ

LIỆU DỰA VÀO MÁY HỌC VÉC-TƠ HỖ TRỢ ............................................................ 26

2.1. Kỹ thuật gom cụm k-Means .................................................................................. 26

2.2. Rút gọn tập luật mờ TSK trích xuất được bằng kỹ thuật gom cụm ...................... 28

2.3. Tối ưu hóa tham số các hàm thành viên ............................................................... 28

2.4. Lựa chọn giá trị tham số epsilon ........................................................................... 28

2.5. Thuật toán đề xuất ................................................................................................. 29

2.6. Tổ chức thực nghiệm ............................................................................................ 32

2.6.1. Mô tả thực nghiệm ............................................................................................ 32

2.6.2. Bài toán hồi quy phi tuyến ................................................................................ 33

2.6.3. Bài toán dự báo dữ liệu chuỗi thời gian hỗn loạn Mackey-Glass ..................... 36

2.6.4. Hệ thống Lorenz ................................................................................................ 39

Chương 3. MÔ HÌNH TÍCH HỢP NHIỀU GIAI ĐOẠN CHO BÀI TOÁN DỰ BÁO DỮ

LIỆU CHUỐI THOÀI GIAN .............................................................................................. 43

3.1. Đề xuất mô hình mờ dự báo dữ liệu chuỗi thời gian ............................................ 43

3.1.1. Lựa chọn dữ liệu đầu vào .................................................................................. 44

3.1.2. Phân cụm dữ liệu đầu vào ................................................................................. 44

3.2. Mô hình thực nghiệm dự báo dữ liệu chuỗi thời gian tài chính ............................ 46

3.2.1. Mô hình thực nghiệm ........................................................................................ 46

3.2.2. Thông số đánh giá mô hình ............................................................................... 47

3.2.3. Lựa chọn nguồn dữ liệu ..................................................................................... 48

3.2.4. Lựa chọn dữ liệu đầu vào .................................................................................. 49

3.2.5. Kết quả thực nghiệm mô hình dự báo giá cổ phiếu ........................................... 50

KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................. 57

TÀI LIỆU THAM KHẢO ...................................................................................................... i

iii

DANH MC HÌNH VẼ

Hình 1.1. Đồ thị của 3 hàm thành viên phổ biến: (a) tam giác, (b) hình thang, (c)

Gauss .......................................................................................................................... 6

Hình 1.2. Cấu trúc cơ bản của một mô hình mờ ........................................................ 9

Hình 1.3. Hình ảnh phân lớp với SVM .................................................................... 16

Hình 1.4. Sự tương đương giữa SVM và Mô hình mờ TSK ................................... 21

Hình 1.5. Sơ đồ khối của thuật toán trích xuất mô hình mờ TSK từ máy học véc-tơ

hỗ trợ ......................................................................................................................... 25

Hình 2.1. Mối quan hệ giữa số lượng véc-tơ hỗ trợ và tham số 𝜀 (giá trị của 𝜀 tương

ứng theo thứ tự các hình vẽ là 0.5, 0.2, 0.1 và 0.01) ................................................ 29

Hình 2.2. Thuật toán fm-SVM* trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ

trợ có lựa chọn giá trị tham số tối ưu ........................................................................ 30

Hình 2.3. Phân bố các hàm thành viên mờ: (a) trường hợp 50 luật ứng với 𝜀=0.0

và (b) trường hợp 6 luật ứng với 𝜀=0.1 (chưa tối ưu hóa phân bố hàm thanh viên

bằng k-Means) .......................................................................................................... 34

Hình 2.4. Kết quả mô hình đã tối ưu hóa phân bố các hàm thành viên bằng cách kết

họp kỹ thuật phân cụm k-Means (RMSE = 0.0183) ................................................. 35

Hình 2.5. Kết quả dự đoán trên 200 mẫu dữ liệu xác thực của thực nghiệm 2.5.3

(trường hợp RMSE = 0.0092) .................................................................................. 38

Hình 2.6. (a) Kết quả mô hình đã tối ưu hóa (RMSE = 0.0043), (b)(c)(d) Phân bố

các hàm thành viên tương ứng với x(t-1), y(t-1) và z(t-1) ....................................... 41

Hình 3.1. Mô hình nhiều giai đoạn cho bài toán dự báo dữ liệu chuỗi thời gian .... 43

Hình 3.2. Mô hình dự đoán giá cổ phiếu kết hợp SOM và fm-SVM* .................... 46

DANH MC BẢNG BIỂU

Bảng 2.1. Tập 6 luật trích xuất được từ mô hình đã tối ưu hóa ............................... 34

Bảng 2.2. So sánh kết quả các mô hình qua thông số RMSE ................................. 35

Bảng 2.3. Diễn dịch ngôn ngữ cho các luật ở Bảng 2.1 .......................................... 36

Bảng 2.4. Tập 9 luật trích xuất được từ 800 mẫu dữ liệu huấn luyện của thực

nghiệm 2.5.3 ............................................................................................................. 37

Bảng 2.5. So sánh kết quả các mô hình qua thông số RMSE ................................. 39

Bảng 2.6. Tập luật trích xuất được từ 1000 mẫu dữ liệu huấn luyện ...................... 40

Bảng 2.7. So sánh kết quả các mô hình qua thông số RMSE ................................. 42

Bảng 3.1. Các thông số đo lường ............................................................................. 47

Bảng 3.2. Nguồn dữ liệu thực nghiệm ...................................................................... 49

Bảng 3.3. Thể hiện các thuộc tính lựa chọn và công thức tính của chúng. .............. 50

Bảng 3.4. Kết quả thử nghiệm trên mô hình SVM nguyên thủy .............................. 51

Bảng 3.5. Kết quả thử nghiệm trên mô hình RBN ................................................... 51

Bảng 3.6. Kết quả thử nghiệm trên mô hình SOM+SVM. ....................................... 52

Bảng 3.7. Kết quả thử nghiệm trên mô hình SOM+ANFIS ..................................... 52

Bảng 3.8. Kết quả thử nghiệm trên mô hình SOM+fm-SVM .................................. 53

Bảng 3.9. Kết quả thử nghiệm trên mô hình SOM+fm-SVM*. ............................... 54

Bảng 3.10. Tập 5 luật trong 1 phân cụm trích xuất từ dữ liệu huấn luyện của cổ

phiếu S&P500. .......................................................................................................... 55

Đề tài khoa học và công nghệ cấp cơ sở: Một số giải pháp tối ưu tập luật mờ TSK trích xuất từ máy học Véc-tơ hỗ trợ hồi quy

Mục tiêu nghiên cứu đề tài là tìm hiểu, tổng hợp, đề xuất và thực nghiệm một số giải pháp nhằm rút gọn, tối ưu hóa tập luật mờ TSK trích xuất được từ máy học véc- tơ hỗ trợ.

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi