
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ
CẤP CƠ SỞ
MỘT SỐ GIẢI PHÁP TỐI ƯU TẬP LUẬT MỜ TSK
TRÍCH XUẤT TỪ MÁY HỌC VÉC-TƠ HỖ TRỢ
HỒI QUY
Mã số: T2018-………
Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài
Nguyễn Đức Hiển
Đà Nẵng, 12/2018

i
MC LC
MC LC .............................................................................................................................. i
DANH MC HÌNH VẼ ....................................................................................................... iii
DANH MC BẢNG BIỂU .................................................................................................. iv
DANH MC CÁC TỪ VIẾT TẮT ....................................................................................... v
THÔNG TIN KẾT QUẢ NGHIÊN CỨU ............................................................................ vi
MỞ ĐẦU ............................................................................................................................... 1
1. Tổng quan ...................................................................................................................... 1
2. Tính cấp thiết của đề tài ................................................................................................. 2
3. Mục tiêu đề tài ............................................................................................................... 2
4. Cách tiếp cận và phương pháp nghiên cứu .................................................................... 2
5. Đối tượng và phạm vi nghiên cứu ................................................................................. 3
6. Nội dung nghiên cứu ..................................................................................................... 3
Chương 1. TRÍCH XUẤT MÔ HÌNH MỜ HƯỚNG DỮ LIỆU DỰA TRÊN MÁY HỌC
VÉC-TƠ HỖ TRỢ ................................................................................................................. 5
1.1. Cơ bản về logic mờ ................................................................................................. 5
1.1.1. Lý thuyết tập mờ ................................................................................................. 5
1.1.2. Luật mờ “IF-THEN” ........................................................................................... 7
1.1.3. Mô hình mờ hướng dữ liệu .................................................................................. 9
1.1.4. Mô hình mờ Mamdani ....................................................................................... 10
1.1.5. Mô hình mờ TSK .............................................................................................. 12
1.2. Máy học véc-tơ hỗ trợ ........................................................................................... 15
1.2.1. Lý thuyết máy học Véc-tơ hỗ trợ ...................................................................... 15
1.2.2. Máy học Véc-tơ hỗ trợ cho vấn đề tối ưu hóa hồi qui ...................................... 17
1.3. Trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ trợ ........................................ 20
Chương 2. CÁC GIẢI PHÁP TỐI ƯU HÓA TẬP LUẬT MỜ TRÍCH XUẤT TỪ DỮ
LIỆU DỰA VÀO MÁY HỌC VÉC-TƠ HỖ TRỢ ............................................................ 26
2.1. Kỹ thuật gom cụm k-Means .................................................................................. 26
2.2. Rút gọn tập luật mờ TSK trích xuất được bằng kỹ thuật gom cụm ...................... 28

ii
2.3. Tối ưu hóa tham số các hàm thành viên ............................................................... 28
2.4. Lựa chọn giá trị tham số epsilon ........................................................................... 28
2.5. Thuật toán đề xuất ................................................................................................. 29
2.6. Tổ chức thực nghiệm ............................................................................................ 32
2.6.1. Mô tả thực nghiệm ............................................................................................ 32
2.6.2. Bài toán hồi quy phi tuyến ................................................................................ 33
2.6.3. Bài toán dự báo dữ liệu chuỗi thời gian hỗn loạn Mackey-Glass ..................... 36
2.6.4. Hệ thống Lorenz ................................................................................................ 39
Chương 3. MÔ HÌNH TÍCH HỢP NHIỀU GIAI ĐOẠN CHO BÀI TOÁN DỰ BÁO DỮ
LIỆU CHUỐI THOÀI GIAN .............................................................................................. 43
3.1. Đề xuất mô hình mờ dự báo dữ liệu chuỗi thời gian ............................................ 43
3.1.1. Lựa chọn dữ liệu đầu vào .................................................................................. 44
3.1.2. Phân cụm dữ liệu đầu vào ................................................................................. 44
3.2. Mô hình thực nghiệm dự báo dữ liệu chuỗi thời gian tài chính ............................ 46
3.2.1. Mô hình thực nghiệm ........................................................................................ 46
3.2.2. Thông số đánh giá mô hình ............................................................................... 47
3.2.3. Lựa chọn nguồn dữ liệu ..................................................................................... 48
3.2.4. Lựa chọn dữ liệu đầu vào .................................................................................. 49
3.2.5. Kết quả thực nghiệm mô hình dự báo giá cổ phiếu ........................................... 50
KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................. 57
TÀI LIỆU THAM KHẢO ...................................................................................................... i

iii
DANH MC HÌNH VẼ
Hình 1.1. Đồ thị của 3 hàm thành viên phổ biến: (a) tam giác, (b) hình thang, (c)
Gauss .......................................................................................................................... 6
Hình 1.2. Cấu trúc cơ bản của một mô hình mờ ........................................................ 9
Hình 1.3. Hình ảnh phân lớp với SVM .................................................................... 16
Hình 1.4. Sự tương đương giữa SVM và Mô hình mờ TSK ................................... 21
Hình 1.5. Sơ đồ khối của thuật toán trích xuất mô hình mờ TSK từ máy học véc-tơ
hỗ trợ ......................................................................................................................... 25
Hình 2.1. Mối quan hệ giữa số lượng véc-tơ hỗ trợ và tham số 𝜀 (giá trị của 𝜀 tương
ứng theo thứ tự các hình vẽ là 0.5, 0.2, 0.1 và 0.01) ................................................ 29
Hình 2.2. Thuật toán fm-SVM* trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ
trợ có lựa chọn giá trị tham số tối ưu ........................................................................ 30
Hình 2.3. Phân bố các hàm thành viên mờ: (a) trường hợp 50 luật ứng với 𝜀=0.0
và (b) trường hợp 6 luật ứng với 𝜀=0.1 (chưa tối ưu hóa phân bố hàm thanh viên
bằng k-Means) .......................................................................................................... 34
Hình 2.4. Kết quả mô hình đã tối ưu hóa phân bố các hàm thành viên bằng cách kết
họp kỹ thuật phân cụm k-Means (RMSE = 0.0183) ................................................. 35
Hình 2.5. Kết quả dự đoán trên 200 mẫu dữ liệu xác thực của thực nghiệm 2.5.3
(trường hợp RMSE = 0.0092) .................................................................................. 38
Hình 2.6. (a) Kết quả mô hình đã tối ưu hóa (RMSE = 0.0043), (b)(c)(d) Phân bố
các hàm thành viên tương ứng với x(t-1), y(t-1) và z(t-1) ....................................... 41
Hình 3.1. Mô hình nhiều giai đoạn cho bài toán dự báo dữ liệu chuỗi thời gian .... 43
Hình 3.2. Mô hình dự đoán giá cổ phiếu kết hợp SOM và fm-SVM* .................... 46

iv
DANH MC BẢNG BIỂU
Bảng 2.1. Tập 6 luật trích xuất được từ mô hình đã tối ưu hóa ............................... 34
Bảng 2.2. So sánh kết quả các mô hình qua thông số RMSE ................................. 35
Bảng 2.3. Diễn dịch ngôn ngữ cho các luật ở Bảng 2.1 .......................................... 36
Bảng 2.4. Tập 9 luật trích xuất được từ 800 mẫu dữ liệu huấn luyện của thực
nghiệm 2.5.3 ............................................................................................................. 37
Bảng 2.5. So sánh kết quả các mô hình qua thông số RMSE ................................. 39
Bảng 2.6. Tập luật trích xuất được từ 1000 mẫu dữ liệu huấn luyện ...................... 40
Bảng 2.7. So sánh kết quả các mô hình qua thông số RMSE ................................. 42
Bảng 3.1. Các thông số đo lường ............................................................................. 47
Bảng 3.2. Nguồn dữ liệu thực nghiệm ...................................................................... 49
Bảng 3.3. Thể hiện các thuộc tính lựa chọn và công thức tính của chúng. .............. 50
Bảng 3.4. Kết quả thử nghiệm trên mô hình SVM nguyên thủy .............................. 51
Bảng 3.5. Kết quả thử nghiệm trên mô hình RBN ................................................... 51
Bảng 3.6. Kết quả thử nghiệm trên mô hình SOM+SVM. ....................................... 52
Bảng 3.7. Kết quả thử nghiệm trên mô hình SOM+ANFIS ..................................... 52
Bảng 3.8. Kết quả thử nghiệm trên mô hình SOM+fm-SVM .................................. 53
Bảng 3.9. Kết quả thử nghiệm trên mô hình SOM+fm-SVM*. ............................... 54
Bảng 3.10. Tập 5 luật trong 1 phân cụm trích xuất từ dữ liệu huấn luyện của cổ
phiếu S&P500. .......................................................................................................... 55