ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN
BÁO CÁO TỔNG KẾT
ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ
CẤP CƠ SỞ
MỘT SỐ GIẢI PHÁP TỐI ƯU TẬP LUẬT MỜ TSK
TRÍCH XUẤT TỪ MÁY HỌC VÉC-TƠ HỖ TRỢ
HỒI QUY
Mã số: T2018-………
Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài
Nguyễn Đức Hiển
Đà Nẵng, 12/2018
i
MC LC
MC LC .............................................................................................................................. i
DANH MC HÌNH VẼ ....................................................................................................... iii
DANH MC BẢNG BIỂU .................................................................................................. iv
DANH MC CÁC TỪ VIẾT TẮT ....................................................................................... v
THÔNG TIN KẾT QUẢ NGHIÊN CỨU ............................................................................ vi
MỞ ĐẦU ............................................................................................................................... 1
1. Tổng quan ...................................................................................................................... 1
2. Tính cấp thiết của đề tài ................................................................................................. 2
3. Mục tiêu đề tài ............................................................................................................... 2
4. Cách tiếp cận và phương pháp nghiên cứu .................................................................... 2
5. Đối tượng và phạm vi nghiên cứu ................................................................................. 3
6. Nội dung nghiên cứu ..................................................................................................... 3
Chương 1. TRÍCH XUẤT MÔ HÌNH MỜ HƯỚNG DỮ LIỆU DỰA TRÊN MÁY HỌC
VÉC-TƠ HỖ TRỢ ................................................................................................................. 5
1.1. Cơ bản về logic mờ ................................................................................................. 5
1.1.1. thuyết tập mờ ................................................................................................. 5
1.1.2. Luật mờ “IF-THEN” ........................................................................................... 7
1.1.3. Mô hình mờ hướng dữ liệu .................................................................................. 9
1.1.4. Mô hình mờ Mamdani ....................................................................................... 10
1.1.5. Mô hình mờ TSK .............................................................................................. 12
1.2. Máy học véc-tơ hỗ trợ ........................................................................................... 15
1.2.1. thuyết máy hc Véc-tơ hỗ trợ ...................................................................... 15
1.2.2. Máy hc Véc-tơ hỗ trợ cho vấn đề tối ưu hóa hồi qui ...................................... 17
1.3. Trích xuất mô hình mờ TSK từ máy học véc-tơ hỗ trợ ........................................ 20
Chương 2. CÁC GIẢI PHÁP TỐI ƯU HÓA TẬP LUẬT MỜ TRÍCH XUẤT TỪ DỮ
LIỆU DỰA VÀO MÁY HỌC VÉC-TƠ HỖ TRỢ ............................................................ 26
2.1. Kỹ thuật gom cụm k-Means .................................................................................. 26
2.2. Rút gọn tập luật mờ TSK trích xuất được bằng kỹ thuật gom cụm ...................... 28
ii
2.3. Tối ưu hóa tham số các hàm thành viên ............................................................... 28
2.4. Lựa chọn giá trị tham số epsilon ........................................................................... 28
2.5. Thuật toán đề xuất ................................................................................................. 29
2.6. Tổ chức thực nghiệm ............................................................................................ 32
2.6.1. Mô tả thực nghiệm ............................................................................................ 32
2.6.2. Bài toán hồi quy phi tuyến ................................................................................ 33
2.6.3. Bài toán dự báo dữ liệu chuỗi thời gian hỗn loạn Mackey-Glass ..................... 36
2.6.4. Hệ thống Lorenz ................................................................................................ 39
Chương 3. MÔ HÌNH TÍCH HỢP NHIỀU GIAI ĐOẠN CHO BÀI TOÁN DỰ BÁO DỮ
LIỆU CHUỐI THOÀI GIAN .............................................................................................. 43
3.1. Đề xuất mô hình mờ dự báo dữ liệu chuỗi thời gian ............................................ 43
3.1.1. Lựa chọn dữ liệu đầu vào .................................................................................. 44
3.1.2. Phân cụm dữ liệu đầu vào ................................................................................. 44
3.2. Mô hình thực nghiệm dự báo dữ liệu chuỗi thời gian tài chính ............................ 46
3.2.1. Mô hình thực nghiệm ........................................................................................ 46
3.2.2. Thông số đánh giá mô hình ............................................................................... 47
3.2.3. Lựa chọn nguồn dữ liệu ..................................................................................... 48
3.2.4. Lựa chọn dữ liệu đầu vào .................................................................................. 49
3.2.5. Kết quả thực nghiệm mô hình dự báo giá cổ phiếu ........................................... 50
KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................................. 57
TÀI LIỆU THAM KHẢO ...................................................................................................... i
iii
DANH MC HÌNH VẼ
Hình 1.1. Đồ th ca 3 hàm thành viên ph biến: (a) tam giác, (b) hình thang, (c)
Gauss .......................................................................................................................... 6
Hình 1.2. Cấu trúc cơ bản ca mt mô hình m ........................................................ 9
Hình 1.3. Hình nh phân lp vi SVM .................................................................... 16
Hình 1.4. S tương đương giữa SVM và Mô hình m TSK ................................... 21
Hình 1.5. Sơ đồ khi ca thut toán trích xut mô hình m TSK t máy hc véc-
h tr ......................................................................................................................... 25
Hình 2.1. Mi quan h gia s ng véc-tơ hỗ tr và tham s 𝜀 (giá tr ca 𝜀 tương
ng theo th t các hình v là 0.5, 0.2, 0.1 và 0.01) ................................................ 29
Hình 2.2. Thut toán fm-SVM* trích xut mô hình m TSK t máy hc véc-hỗ
tr có la chn giá tr tham s tối ưu ........................................................................ 30
Hình 2.3. Phân b các hàm thành viên mờ: (a) trường hp 50 lut ng vi 𝜀=0.0
và (b) trường hp 6 lut ng vi 𝜀=0.1 (chưa tối ưu hóa phân b hàm thanh viên
bng k-Means) .......................................................................................................... 34
Hình 2.4. Kết qu mô hình đã tối ưu hóa phân b các hàm thành viên bng cách kết
hp k thut phân cm k-Means (RMSE = 0.0183) ................................................. 35
Hình 2.5. Kết qu d đoán trên 200 mẫu d liu xác thc ca thc nghim 2.5.3
(trưng hp RMSE = 0.0092) .................................................................................. 38
Hình 2.6. (a) Kết qu mô hình đã tối ưu hóa (RMSE = 0.0043), (b)(c)(d) Phân b
các hàm thành viên tương ng vi x(t-1), y(t-1) và z(t-1) ....................................... 41
Hình 3.1. Mô hình nhiều giai đoạn cho bài toán d báo d liu chui thi gian .... 43
Hình 3.2. Mô hình d đoán giá cổ phiếu kết hp SOM và fm-SVM* .................... 46
iv
DANH MC BẢNG BIỂU
Bng 2.1. Tp 6 lut trích xut đưc t mô hình đã tối ưu hóa ............................... 34
Bng 2.2. So sánh kết qu các mô hình qua thông s RMSE ................................. 35
Bng 2.3. Din dch ngôn ng cho các lut Bng 2.1 .......................................... 36
Bng 2.4. Tp 9 lut trích xut đưc t 800 mu d liu hun luyn ca thc
nghim 2.5.3 ............................................................................................................. 37
Bng 2.5. So sánh kết qu các mô hình qua thông s RMSE ................................. 39
Bng 2.6. Tp lut trích xut đưc t 1000 mu d liu hun luyn ...................... 40
Bng 2.7. So sánh kết qu các mô hình qua thông s RMSE ................................. 42
Bng 3.1. Các thông s đo lường ............................................................................. 47
Bng 3.2. Ngun d liu thc nghim ...................................................................... 49
Bng 3.3. Th hin các thuc tính la chn và công thc tính ca chúng. .............. 50
Bng 3.4. Kết qu th nghim trên mô hình SVM nguyên thy .............................. 51
Bng 3.5. Kết qu th nghim trên mô hình RBN ................................................... 51
Bng 3.6. Kết qu th nghim trên mô hình SOM+SVM. ....................................... 52
Bng 3.7. Kết qu th nghim trên mô hình SOM+ANFIS ..................................... 52
Bng 3.8. Kết qu th nghim trên mô hình SOM+fm-SVM .................................. 53
Bng 3.9. Kết qu th nghim trên mô hình SOM+fm-SVM*. ............................... 54
Bng 3.10. Tp 5 lut trong 1 phân cm trích xut t d liu hun luyn ca c
phiếu S&P500. .......................................................................................................... 55