ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TỐNG THỊ HƢƠNG GIANG
MẠNG ANFIS VÀ ỨNG DỤNG CHO DỰ BÁO SẢN LƢỢNG TIÊU THỤ ĐIỆN NĂNG CỦA TỈNH BẮC GIANG
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Thái Nguyên, năm 2015
ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG TỐNG THỊ HƢƠNG GIANG
MẠNG ANFIS VÀ ỨNG DỤNG CHO DỰ BÁO SẢN LƢỢNG TIÊU THỤ ĐIỆN NĂNG CỦA TỈNH BẮC GIANG
: Khoa học máy tính
Chuyên ngành Mã số chuyên ngành: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC PGS. TS LÊ BÁ DŨNG
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Thái Nguyên, tháng 6 năm 2015
i
LỜI CAM ĐOAN
Tôi xin cam đoan tất cả các nội dung của luận văn này hoàn toàn được
hình thành và phát triển từ quan điểm của chính cá nhân tôi, dưới sự hướng
dẫn chỉ bảo của PGS.TS Lê Bá Dũng. Các số liệu kết quả có được trong luận
văn tốt nghiệp là hoàn toàn trung thực.
Học viên
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Tống Thị Hương Giang
ii
LỜI CẢMƠN
Để hoàn thành chương trình cao học và viết luận văn này, tôi đã nhận
được sự hướng dẫn, giúp đỡ và chỉ bảo nhiệt tình của quý thầy cô trường Đại
học Công nghệ thông tin và Truyền thông. Đặc biệt là những thầy cô ở Viện
công nghệ thông tin Hà Nội đã tận tình dạy bảo cho tôi trong suốt thời gian
học tập tại trường.
Tôi xin gửi lời cảm ơn sâu sắc đến PGS.TS Lê Bá Dũng đã dành nhiều
thời gian và tâm huyết hướng dẫn tôi hoàn thành luận văn này.
Mặc dù tôi đã cố gắng hoàn thiện luận văn bằng tất cả năng lực của
mình, song không thể tránh khỏi những thiếu sót, rất mong nhận được sự
đóng góp quý báu của quý thầy cô và các bạn.
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Tôi xin chân thành cảm ơn!
iii
MỤC LỤC
Trang
MỞ ĐẦU..........................................................................................................1
CHƢƠNG I. TỔNG QUAN VỀ MẠNG NƠ-RON NHÂN TẠO VÀ HỆ MỜ....................................................................................................................3 1.1. Cấu trúc và mô hình mạng nơron nhân tạo ................................................. 3 1.1.1. Mô hình một nơron sinh học .......................................................... 3 1.1.2. Mô hình một nơron nhân tạo .......................................................... 4 1.2. Cấu trúc và phương thức làm việc của mạng nơ-ron nhân tạo ................... 7 1.2.1. Mạng truyền thẳng ........................................................................... 8 1.2.2. Mạng hồi quy ................................................................................. 9 1.3. Các luật học .............................................................................................. 10 1.4. Hệ mờ và mạng nơron ............................................................................... 13 1.4.1. Kiến trúc của hệ mờ tổng quát. ...................................................... 13 1.4.2. Sự kết hợp giữa logic mờ và mạng neural .................................... 20 CHƢƠNG 2. MÔ HÌNH MẠNG ANFIS VÀ KHẢ NĂNG ỨNG DỤNG..23 2.1. Hệ suy luận mờ dựa trên mạng thích nghi ................................................ 23 2.1.1. Giới thiệu sơ lược về mô hình nơron - mờ .................................... 23 2.1.2. Luật mờ và hệ suy luận mờ ............................................................ 24 2.1.3. Mạng thích nghi ............................................................................. 26 2.1.4. Cấu trúc của ANFIS .................................................................... 27 2.2. Thuật toán ANFIS ..................................................................................... 29 2.2.1. Thuật toán học lan truyền ngược ................................................... 29 2.2.2. Thuật toán học lai ........................................................................ 36 2.3. Khả năng ứng dụng của mạng ANFIS ...................................................... 38
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
CHƢƠNG 3. ỨNG DỤNG MÔ HÌNH ANFIS CHO BÀI TOÁN DỰ BÁO SẢN LƢỢNG TIÊU THỤ ĐIỆN NĂNG VÀ THỬ NGHIỆM..................39 3.1. Bài toán dự báo điện năng ......................................................................... 39 3.1.1. Sự cần thiết của việc dự báo mức tiêu thụ điện năng .................... 39 3.1.2. Các phương pháp và mô hình dự báo điện năng trên thế giới ....... 40
iv
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
3.2. Ứng dụng mô hình mạng ANFIS trong bài toán dự báo sản lượng tiêu thụ điện năng của tỉnh Bắc Giang .......................................................................... 42 3.2.1. Xây dựng mô hình hệ thống ........................................................... 42 3.2.2. Thu thập số liệu .............................................................................. 47 3.2.3. Dự báo tiêu thụ điện năng ............................................................ 50 3.3. Chương trình thử nghiệm và kết quả ........................................................ 51 3.3.1. Huấn luyện mạng ........................................................................... 51 3.3.2. Cấu trúc của anfis ........................................................................... 53 3.3.3. Kết quả dự báo. ............................................................................ 54 KẾT LUẬN ..................................................................................................... 59 TÀI LIỆU THAM KHẢO ............................................................................. 61
v
DANH MỤC CÁC HÌNH VẼ
Hình 1.1. Mô hình một nơron sinh học
Hình 1.2. Mô hình một nơron nhân tạo
Hình 1.3. Đồ thị các dạng hàm truyền
Hình 1.4. Mạng truyền thẳng một lớp
Hình 1.5. Mô tả cấu trúc của mạng nơ-ron truyền thẳng nhiều lớp
Hình 1.6. Mạng hồi quy một lớp có nối ngược
Hình 1.7. Mạng hồi quy nhiều lớp có nối ngược
Hình 1.8. Sơ đồ học tham số có giám sát.
Hình 1.9. Sơ đồ học tham số không có giám sát.
Hình 1.10. Kiến trúc của hệ mờ tổng quát
Hình 1.11. Hệ mờ nhiều đầu vào - một đầu
Hình 1.12. Hàm thuộc hệ mờ một đầu vào - một luật
Hình 1.13. Hàm thuộc hệ mờ hai đầu vào - một luật
Hình 1.14. Mô hình hệ mờ - neural
Hình 2.1. Hệ thống suy luận mờ
Hình 2.2. Mạng thích nghi
Hình 2.3. Cấu trúc của ANFIS
Hình 2.4. Mạng 3 lớp lan truyền ngược
Hình 3.1.Cấu trúc ANFIS với hai đầu vào.
Hình 3.2. Thiết lập số liệu đầu vào cho bài toán
Hình 3.3.Lựa chọn hàm thành viên và kết quả dự báo của ANFIS
Hình 3.4. Cấu trúc của anfis với bài toán dự báo điện
Hình 3.5. Các luật được tạo ra bởi Anfis
Hình 3.6. Hệ luật mờ được sinh ra trong quá trình huấn luyện mạng
Hình 3.7. Mặt suy diễn của hệ ANFIS
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 3.8. Sai số của quá trình huấn luyện
vi
DANH MỤC CÁC TỪ VIẾT TẮT
Artificial Neural Network ANN Mạng nơron nhân tạo
Adaptive Neuro Fuzzy Insference System ANFIS Hệ suy luận mờ
Multi Input Multi Output MIMO Hệ mờ nhiều đầu vào - nhiều đầu ra
Multi Input Single Output MISO Hệ mờ nhiều đầu vào - một đầu ra
Mean Absolute Percentage Erro MAPE
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Least Square Error LSE Phương pháp ước lượng sai số bình phương cực tiểu
1
MỞ ĐẦU
Ngày nay, các mạng nơron nhân tạo (ANN) đã được ứng dụng thành
công, các nhà khoa học và các kĩ sư trong những năm gần đây đã có nhiều
nghiên cứu ứng dụng trong việc xấp xỉ hàm, nhận dạng và điều khiển, xử lý
ảnh, dự đoán chuỗi thời gian,…
Hệ mờ nơ ron là một sự kết hợp giữa logic mờ và và khả năng học
của mạng nơron. Một trong những sự kết hợp đó là hệ mờ nơron thích nghi
(ANFIS - Adaptive Neuro Fuzzy Inference System).Hệ thống này có khả
năng tối ưu hóa hệ mờ dựa trên các tập mẫu có sẵn.Các hệ mờ - nơron và
các công cụ thống kê là các phương pháp khác nhau được sử dụng trong
các bài toán dự báo như dự báo các chỉ số kinh tế, tài chính.Các mạng
nơron chứa một số lượng lớn các thông số đầu vào cho phép việc học bên
trong các quan hệ không tuyến tính hiện tại trong chuỗi thời gian, tăng
cường khả năng dự báo.
Trong những năm gần đây, nhiều bài toán dự báo được các chuyên gia
đã tin tưởng và sử dụng các hệ thống thông minh khác nhau, trong đó Mạng
Nơron nhân tạo và hệ suy luận mờ - nơron (ANFIS) cũng được ứng dụng
trong lĩnh vực này. Bài toán dự báo sản lượng điện tiêu thụ là một trong
những yêu cầu của sự phát triển kinh tế xã hội. Khu vực miền Bắc nói chung
và tỉnh Bắc Giang nói riêng cũng nằm trong xu thế phát triển và cần thiết phải
dự báo nhiều chỉ tiêu, trong đó có sản lượng điện tiêu thụ.
Trong luận văn này, em ước tính sản lượng điện tiêu thụ bằng cách sử
dụng hệ suy luận mờ dựa trên mạng thích nghi (ANFIS), luận văn bao gồm
các nội dung sau :
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Chương 1 : Tổng quan về mạng nơron nhân tạo và hệ mờ
2
Chương 2 : Mô hình mạng ANFIS và khả năng ứng dụng
Chương 3 : Ứng dụng mô hình ANFIS cho bài toán dự báo sản lượng
tiêu thụ điện năng và thử nghiệm.
Do các yêu cầu trên nên em chọn làm đề tài “Mạng ANFIS và ứng dụng
cho dự báo sản lượng tiêu thụ điện năng của tỉnh Bắc Giang” cho luận văn tốt
nghiệp của mình. Đề tài này, em trình bày một hệ thống suy luận mờ dựa trên
mạng thích nghi ANFIS để dự báo mức tiêu thụ điện lâu dài, dự báo nhu cầu
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
điện hàng năm, phục vụ cho phát triển kinh tế xã hội của tỉnh Bắc Giang.
3
CHƢƠNG I
TỔNG QUAN VỀ MẠNG NƠ-RON NHÂN TẠO VÀ HỆ MỜ
1.1. Cấu trúc và mô hình mạng nơron nhân tạo
1.1.1. Mô hình một nơron sinh học
Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não con người bao gồm khoảng 1011 nơron tham gia vào khoảng 1015 kết nối trên các
đường truyền. Mỗi đường truyền này dài khoảng hơn một mét. Các nơron có
nhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có
những khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử
lý và truyền các tín hiệu điện hóa trên các đường mòn nơron, các con đường
này tạo nên hệ thống giao tiếp của bộ não [1].
Hình 1.1. Cấu trúc của một nơron sinh học điển hình
Mỗi nơron sinh học có 3 thành phần cơ bản:
• Các nhánh vào hình cây ( dendrites)
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
• Thân tế bào (cell body)
4
• Sợi trục ra (axon)
Các nhánh hình cây truyền tín hiệu vào đến thân tế bào.Thân tế bào tổng
hợp và xử lý cho tín hiệu đi ra. Sợi trục truyền tín hiệu ra từ thân tế bào này
sang nơron khác. Điểm liên kết giữa sợi trục của nơron này với nhánh hình
cây của nơron khác gọi là synapse.Liên kết giữa các nơron và độ nhạy của
mỗi synapse được xác định bởi quá trình hóa học phức tạp.Một số cấu trúc
của nơron được xác định trước lúc sinh ra.Một số cấu trúc được phát triển
thông qua quá trình học.Trong cuộc đời cá thể, một số liên kết mới được hình
thành, một số khác bị hủy bỏ.
Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu đầu
vào, xử lý các tín hiệu này và cho ra một tín hiệu output. Tín hiệu output này
sau đó được truyền đi làm tín hiệu đầu vào cho các nơron khác.
Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơron
nhân tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não.
1.1.2. Mô hình một nơron nhân tạo
Mô hình toán học của mạng nơron sinh học được đề xuất bởi McCulloch
và Pitts, thường được gọi là nơron M-P, ngoài ra nó còn được gọi là phần tử
xử lý và được ký hiệu là PE (Processing Element) [1].
Mô hình nơron có m đầu vào x1, x2,..., xm, và một đầu ra yi như sau:
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 1.2. Mô hình một nơron nhân tạo
5
Giải thích các thành phần cơ bản:
Tập các đầu vào: Là các tín hiệu vào của nơron, các tín hiệu này
thường được đưa vào dưới dạng một vector m chiều.
Tập các liên kết (các trọng số): Mỗi liên kết được thể hiện bởi một
trọng số (thường được gọi là trọng số liên kết). Trọng số liên kết
giữa tín hiệu vào thứ j cho nơron i thường được ký hiệu là wij.
Thông thường các trọng số này được khởi tạo ngẫu nhiên ở thời
điểm khởi tạo mạng và được cập nhật liên tục trong quá trình học
mạng.
Bộ tổng (Hàm tổng): Thường dùng để tính tổng của tích các đầu vào
với trọng số liên kết của nó.
Ngưỡng: Ngưỡng này thường được đưa vào như một thành phần của
hàm truyền.
Hàm truyền: Hàm này dùng để giới hạn phạm vi đầu ra của mỗi
nơron. Nó nhận đầu vào là kết quả của hàm tổng và ngưỡng đã cho.
Thông thường, phạm vi đầu ra của mỗi nơron được giới hạn trong
đoạn [0,1] hoặc [-1,1]. Các hàm truyền rất đa dạng, có thể là các
hàm tuyến tính hoặc phi tuyến. Việc lựa chọn hàm truyền tùy thuộc
vào từng bài toán và kinh nghiệm của người thiết kế mạng.
Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa
một đầu ra.
Về mặt toán học, cấu trúc của một nơron i được mô tả bằng cặp biểu thức sau:
và (1.1)
trong đó: x1, x2, …xm là các tín hiệu đầu vào, còn wi1, wi2,…,wim là các trọng
là một số kết nối của nơron thứ i, neti là hàm tổng, f là hàm truyền,
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
ngưỡng, yi là tín hiệu đầu ra của nơron.
6
Như vậy, tương tự như nơron sinh học, nơron nhân tạo cũng nhận các
tín hiệu đầu vào, xử lý (nhân các tín hiệu này với trọng số liên kết, tính tổng
các tích thu được rồi gửi kết quả đến hàm truyền), và cho một tín hiệu đầu ra
(là kết quả của hàm truyền) [5].
Hàm truyền có thể có các dạng sau:
Hàm bước (1.2)
Hàm giới hạn chặt (hay còn gọi là hàm bước)
(1.3)
Hàm bậc thang
(1.4)
Hàm ngưỡng đơn cực
với λ>0 (1.5)
Hàm ngưỡng hai cực
với λ>0 (1.6)
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Đồ thị các dạng hàm truyền được biểu diễn như sau:
7
Hình 1.3. Đồ thị các dạng hàm truyền
1.2. Cấu trúc và phƣơng thức làm việc của mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo (Artificial Neural Network) là một cấu trúc
mạng được hình thành nên bởi số lượng các nơ-ron nhân tạo liên kết với
nhau.Mỗi nơ-ron có các đặc tính đầu vào, đầu ra và thực hiện một số chức
năng tính toán cục bộ [3].
Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng nơ-
ron có thể giải quyết được các lớp bài toán nhất định như: Bài toán xếp loại,
bài toán lập lịch, bài toán tìm kiếm, bài toán nhận dạng mẫu... Các bài toán
phức tạp cao, không xác định.Tuy nhiên, sự liên kết giữa một bài toán bất kỳ
trong thực tế với một giải pháp mạng nơ-ron lại là một việc không dễ dàng.
Xét một cách tổng quát, mạng nơ-ron là một cấu trúc xử lý song song
thông tin phân tán mang các đặc tính nổi bật sau:
- Là một mô hình tính toán dựa trên bản chất của nơ-ron
- Bao gồm một số lượng rất lớn các nơ-ron liên kết với nhau
- Mạng nơ-ron có khả năng học, khái quát hóa tập dữ liệu học thông
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
qua việc gán và hiệu chỉnh các trọng số liên kết
8
- Tổ chứctheo kiểu tập hợp mang lại cho mạng nơ-ron khả năng tính
toán rất lớn, trong đó không có nơ-ron nào mang thông tin riêng biệt
1.2.1. Mạng truyền thẳng
Mạng nơron truyền thẳng một lớp
Mô hình mạng nơ-ron truyền thẳng một lớp là mô hình liên kết cơ
bản và đơn giản nhất. Các nơ-rn tổ chức lại với nhau tạo thành một lớp,
đường truyền tín hiệu được truyền theo một hướng nhất định nào đó. Các
đầu vào được nối với các nơ-ron theo các trọng số khác nhau, sau quá trình
xử lý cho ra một chuỗi các tín hiệu ra. Mạng nơ-ron là mô hình LTU thì nó
được gọi là mạng Perception, còn mạng nơ-ron là mô hình LGU thì nó
được gọi là mạng Adaline [1].
1 y
1 x
2
2
x y
n
y Xm
Hình 1.4. Mạng truyền thẳng một lớp
Với mỗi giá trị đầu vào x = [ x1,x2,....,xn]T. Qua quá trình xử lý của
mạng ta sẽ thu được một bộ tương ứng các giá trị đầu ra là y = [y1,y2,...,yn]T
được xác định như sau:
, (1.7)
trong đó: m: số tín hiệu vào
n : số tín hiệu ra
T = [ wi1, wi2,...,win]T là véc tơ trọng số của nơ ron thứ i.
Wi
i : là ngưỡng của nơ ron thứ i.
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
fi : hàm kích hoạt của nơ ron thứ i
9
Mạng nơron truyền thẳng nhiều lớp.
Với mạng nơ-ron truyền thẳng một lớp ở trên khi phân tích một bài
toán phức tạp sẽ gặp rất nhiều khó khăn, để khắc phục vấn đề này người ta
đưa ra mô hình mạng nơ-ron truyền thẳng nhiều lớp bằng việc kết hợp với
một số lớp nơ-ron lại với nhau.Lớp nhận tín hiệu vào gọi là lớp vào, lớp đưa
ra tín hiệu ra của mạng được gọi là lớp ra.Các lớp ở giữa lớp vào và lớp ra
được gọi là các lớp ẩn [1].
lớp ẩn lớp ra
y2
y1
... ...
lớp vào x1 x2 ... ... ... ... xm yn Hình 1.5. Mạng nơron truyền thẳng nhiều lớp
Mạng hồi quy một lớp có nối ngược
X1 Y1
X2 Y2 1.2.2. Mạng hồi quy (
... ...
... XN
YM
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 1.6. Mạng hồi quy một lớp có nối ngƣợc
10
Mạng hồi quy nhiều lớp có nối ngược
X1 Y1
X2
...
...
Y2 ...
... XN
YM
Hình 1.7. Mạng hồi quy nhiều lớp có nối ngƣợc
1.3. Các luật học
Mạng nơ-ron có một số ưu điểm so với máy tính truyền thống. Cấu trúc
song song của mạng nơ-ron rất thích hợp cho nhưng ứng dụng đòi hỏi tốc độ
nhanh theo thời gian thực. Khả năng huấn luyện của mạng nơ-ron có thể khai
thác để phát triển hệ học thích nghi.Mặt khác, với khả năng tổng quát hóa của
mạng nơ-ron, nó có thể áp dụng để điều khiển nhiều tham số phức tạp đồng
thời từ đó giải quyết dễ dàng một số bài toán NP - đầy đủ (NP - Complete).
Các luật học đóng vai trò quan trọng trong việc xác định một mạng nơ-
ron nhân tạo. Một cách đơn giản về khái niệm học của mạng nơ-ron là cập
nhật trọng số trên cơ sở các mẫu. Theo nghĩa rộng thì học có thể được chia
thành hai loại: Học tham số và học cấu trúc [3, 4].
Trong luận văn chúng ta chỉ đề cập tới luật học tham số (Parameter
Learning): là các tham số về trọng số cập nhật kết nối giữa các nơ ron.
Các thủ tục học này nhằm tìm kiếm ma trận trọng số sao cho mạng có
khả năng đưa ra dự báo sát với thực tế. Dạng chung của luật học tham số có
thể được mô tả như sau:
(1.8)
trong đó:
là sự thay đổi trọng số liên kết từ nơ-ron j đến nơ-ron i.
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
xjlà tín hiệu vào nơ-ron j.
11
là tốc độ học, nằm trong khoảng (0,1).
r là hằng số học.
Vấn đề đặt ra ở đây là tín hiệu học r được sinh ra như thế nào để hiệu
chỉnh trọng số của mạng.
Có 2 phương pháp học:
+ Học có giám sát: Là quá trình học dựa vào sai số giữa đầu ra thực và
đầu ra mong muốn để làm cơ sở cho việc hiệu chỉnh trọng số. Sai số này
chính là hằng số học r. Luật học điển hình của nhóm này là luật học Delta của
Widrow (1962) nêu ra đầu tiên dùng xấp xỉ trọng số của Adaline dựa trên
nguyên tắc gradient.
Trong nhóm luật học này cũng cần kể đến luật học Perceptron của
Rosenblatt (1958). Về cơ bản luật học này thay đổi các giá trị trọng trong thời
gian học, còn Perceptron thì thêm hoặc bỏ trọng tùy theo giá trị sai số là dương hay âm
Một loạt các luật học khác cũng được dựa trên tư tưởng này.Luật oja là
cải tiến và nâng cấp của luật Delta.Luật truyền ngược là luật mở rộng của luật
Delta cho mạng nhiều lớp. Đối với mạng truyền thẳng thường sử dụng luật
truyền ngược để chỉnh trọng số với tín hiệu chỉ đạo từ bên ngoài và người ta
gọi mạng này là mạng lan truyền ngược.
Hình 1.8.Sơ đồ học tham số có giám sát.
+ Học không có giám sát: Luật học này sử dụng đầu ra của mạng làm
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
cơ sở để hiệu chỉnh các trọng số liên kết. Hay trong luật này chính là tín hiệu
12
ra của mạng. Điển hình là luật Hebb (1949) thường dùng cho các mạng tự liên
kết, luật LVQ (Learning Vector Quantization) dùng cho mạng tự tổ chức một
lớp thuộc lớp mạng ánh xạ đặc trưng của Kohonen.
Luật học Hebb là luật sinh học xuất phát từ tiên đề của Hebb cho rằng:
Giữa hai nơ-ron có quan hệ và có thay đổi thế năng mạng thì giữa chúng có
sự thay đổi trọng số liên kết. Nói cách khác, trọng số được điều chỉnh theo
mối tương quan trước và sau, nghĩa là:
(1.9)
trong đó:
: Là sự thay đổi trọng số liên kết từ nơ-ron j đến nơ-ron i.
là tín hiệu vào nơ-ron j.
là tín hiệu ra của nơ-ron i.
là tốc độ học, nằm trong khoảng (0,1).
Luật Hebb giải thích việc chỉnh trọng số trong phạm vi cục bộ của
mạng mà không cần tín hiệu chỉ đạo từ bên ngoài. Hopfield cũng cải tiến luật
Hebb cho các mạng tự liên kết thành 16 dạng khác nhau theo kiểu luật Hebb,
luật đối Hebb, luật Hopfield...
Như vậy, ứng với mỗi nhóm mạng thường áp dụng một luật học nhất
định. Nếu tồn tại hàng chục loại mạng khác nhau thì các luật học dùng trong
mạng nơ-ron có thể tăng lên rất nhiều lần.
Đối với mạng phản hồi thường sử dụng luật Hebb và các luật cải tiến
của nó để chỉnh trọng số mà không cần tín hiệu chỉ đạo từ bên ngoài.
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 1.9.Sơ đồ học tham số không có giám sát.
13
1.4. Hệ mờ và mạng nơron
1.4.1. Kiến trúc của hệ mờ tổng quát.
Một hệ mờ tiêu biểu có kiến trúc như hình vẽ
Cơ sở luật mờ
Tham khảo luật mờ
Đầu ra (số)
Đầu ra (tập mờ)
Đầu vào (tập mờ)
Bộ mờ hóa
Bộ suy diễn mờ
Bộ giải mờ
Hình 1.10. Kiến trúc của hệ mờ tổng quát Đầu vào (số)
Thành phần trung tâm của hệ mờ cơ sở luật mờ (fuzzy rule base). Cơ sở
luật mờ bao gồm các luật mờ if-then biểu diễn tri thức của chuyên gia trong
lĩnh vực nào đó. Trong trường hợp một hệ điều khiển mờ cụ thể thì cơ sở luật
mờ chính là tri thức và kinh nghiệm của các chuyên gia trong việc điều khiển
khi chưa áp dụng hệ mờ [2].
Thành phần quan trọng kế tiếp là bộ suy diễn mờ (fuzzy inference
engine). Nhiệm vụ của bộ phận này là kết hợp các luật trong cơ sở luật mờ, áp
dụng vào tập mờ đầu vào theo các phương pháp suy diễn mờ để xác định tập
mờ đầu ra.
Dữ liệu đầu vào của hệ điều khiển mờ là các tín hiệu do các bộ phận cảm
biến môi trường cung cấp sau khi đã số hóa nên có tính chất rõ (khái niệm rõ
ở đây có nghĩa là các tín hiệu đó không phải là các tập mờ, chứ không có
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
nghĩa là các tín hiệu không có nhiễu). Vì vậy cần phải có bộ mờ hóa (fuzzier)
14
để chuyển các dữ liệu số đầu vào thành các tập mờ để bộ suy diễn mờ có thể
thao tác được.
Dữ liệu đầu ra của bộ suy diễn mờ ở dạng các tập mờ sẽ được bộ giải mờ
(defuzzier) chuyển thành tín hiệu số trước khi truyền đến các cơ quan chấp
hành như tay máy, công tắc, van điều khiển...
Do các dữ liệu đầu vào và đầu ra được số hóa nên ta chỉ cần xem xét các
hệ mờ làm việc với các biến số. Trường hợp tổng quát, hệ mờ nhận một
vector n chiều ở đầu vào và cho ra một vector n chiều ở đầu ra. Hệ mờ như
thế được gọi là hệ mờ nhiều đầu vào - nhiều đầu ra (MIMO). Nếu m bằng 1,
ta có hệ mờ nhiều đầu vào - một đầu ra (MISO). Một hệ mờ nhiều đầu vào -
nhiều đầu ra có thể phân tích thành nhiều hệ nhiều đầu vào - một đầu ra. Do
đó ta chỉ cần tìm hiểu kĩ về hệ mờ nhiều đầu vào một đầu ra với các biến số.
Khi chỉ nói về hệ mờ nhiều - một thì ta sẽ ngầm hiểu là một hệ mờ nhiều đầu
vào - một đầu ra với các biến số. Kí hiệu U= , V R, trong đó Ui là
miền xác định của các biến vào i, i = 1..n và V là miền giá trị của biến ra y, ta
có mô hình hệ mờ nhiều đầu vào - một đầu ra như hình vẽ
x U1
y V x U1
Hệ mờ nhiều đầu vào - một đầu ra
…
x U1
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 1.11. Hệ mờ nhiều đầu vào - một đầu ra
15
a) Cơ sở luật mờ
Cơ sở luật mờ của hệ mờ n đầu vào - một đầu ra gồm m luật if-then mờ
có dạng :
If “x1 là Ak1” và “x2 là Ak2” và … và “xn là Akn”then “y là Bk”,
k=1..m (*)
Trong đó k là chỉ số của luật (luật thứ k trong tập luật), xi là các biến đầu
vào, Aki là các tập mờ trên Ui (i=1..n), y là biến đầu ra và Bk là tập mờ trên V
(k=1..m).
Các luật mờ dạng (*) được gọi là các luật If-then mờ chuẩn tắc. Các luật
mờ không chuẩn tắc có thể biến đổi để đưa về dạng chuẩn tắc tương đương.
Có nhiều phương pháp để xác định các luật mờ để đưa vào cơ sở luật
mờ. Các phương pháp thông dụng là nhờ các chuyên gia trong lĩnh vực áp
dụng, hoặc từ quan sát, thực nghiệm thống kê để có được các tập dữ liệu
mẫu đầu vào và ra tương ứng, từ đó dùng các kĩ thuật khai mỏ dữ liệu để
rút ra các luật.
b) Bộ suy diễn mờ
Phương pháp thiết kế bộ suy diễn trong trường hợp cơ sở luật mờ gồm m
luật if-then mờ chuẩn tắc, nhiều đầu vào và một đầu ra (MISO)
Các luật if-then trong thực tế thì thường được tính bằng công thức
Mamdani max-min hoặc max-tích (max-prod).
Ta xét kĩ kiến trúc bộ suy diễn mờ sử dụng phương pháp suy diễn max-
min. Khi chuyển qua phương pháp suy diễn max-tich thì chỉ cần thay min
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
bằng phép nhân trong các công thức.
16
Cho A, A’, B lần lượt là các tập mờ trên vũ trụ X, X, Y. Luật if A then
B được thể hiện như một quan hệ mờ R = A B trên X Y. Khi đó tập mờ
B’ suy ra từ A’ được xác định bởi :
(y) = max {min [ (x), (x,y)]} (1.10)
Trƣờng hợp một đầu vào và một luật
Ta có (y) = {min [ (x), (x,y)]}
= {min [ (x), (x), (y)]}
= min { {min [ (x), (x)]), (y)}
= min { (x), (y)}
= min { h , (y)}
Trong đó h là độ cao của tập mờ A’ A
B A’ A
h B ’ y x
Hình 1.12. Hàm thuộc hệ mờ một đầu vào - một luật
Trƣờng hợp hai đầu vào và một luật
Đây là trường hợp luật được phát biểu “Nếu x là A và y là B thì z là C”
Luật: Nếu x là A và y là B thì z là C
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Sự kiện: x là A’ và y là B’
17
-------------------------------
Kết luận: z là C’
Luật mờ với điều kiện có 2 mệnh đề như trên có thể biểu diễn ở dạng AxB => C
Suy luận tương tự trường hợp một đầu vào và một luật ta có :
(z) = min { , (z)} (1.11)
Mà A’ x B’ A x B = (A’ A ) x (B’ B) nên = min{ , }
Vậy (z) = min { , , (z)} (1.12)
Suy rộng ra cho trường hợp nhiều đầu vào Ai, i = 1..n và một luật
Luật : Nếu x1 là A1 và x2 là A2 và…và xn là An thì z là C
Sự kiện : x1 là A1’ và x2 là A2’ và …và xn là An’
------------------------------------------------------------
Kết luận : z là C’
(z) = min {( ), (z)} (1.13)
Minh họa :
C A’ A B’ B
h2 h1 C ’ z x y
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 1.13. Hàm thuộc hệ mờ hai đầu vào - một luật
18
Trƣờng hợp nhiều đầu vào và nhiều luật
Trong trường hợp nhiều đầu vào và nhiều luật, ta tính kết quả đầu ra cho
từng luật sau đó kết quả của hệ sẽ là các phép giao hoặc hợp các kết quả riêng
đó tùy theo bản chất của hệ là hội hay tuyển các luật.
Nếu trong một luật có dạng : “Nếu x là A hoặc y là B thì z là C” ta tách
thành hai luật riêng biệt “Nếu x là A thì z là C” và “ Nếu x là B thì z là C”
để tính.
c) Bộ mờ hóa
Mờ hóa là quá trình biến đổi một vector x = (x1, x2, …, xn) U Rn
thành một tập mờ A’ trên U. A’ sẽ là đầu vào cho bộ suy diễn mờ. Mờ hóa
phải thỏa các tiêu chuẩn sau:
Điểm dữ liệu x phải có độ cao thuộc vào A’
Vector x thu nhận từ môi trường ngoài có thể sai lệch do nhiễu nên
A’ phải phản ánh được tính gần đúng của dữ liệu thực.
Hiệu quả tính toán: đơn giản cho các tính toán trong bộ suy diễn.
Sau đây là một số phương pháp mờ hóa thông dụng
+ Mờ hóa đơn trị
Mỗi điểm dữ liệu x được xem như một tập mờ đơn trị tức là tập mờ A có
hàm thuộc xác định như sau:
1 if u (1.14) (u) = = x
0 if u + Mờ hóa Gaus
≠ x Mỗi giá trị x được biểu diễn thành một số mờ A’i. Tập A’ là tích đề-các của
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
các A’i
19
(1.15) (ui) =
+ Mờ hóa tam giác
Mỗi giá trị xi được biểu diễn thành một số mờ A’i. Tập A’ là tích đề-các của
các A’i
1 - if
(1.16) (ui) =
0 if >
d) Bộ giải mờ
Giải mờ (hay còn gọi là khử mờ) là quá trình xác định một điểm y từ một
tập mờ trên B’ trên V (B’ là đầu ra của bộ suy diễn mờ).Giải mờ phải thỏa
mãn tiêu chuẩn sau:
Điểm y là đại diện tốt nhất cho B’. Trực quan y là điểm có độ thuộc
cao nhất vào B’ ở trung tâm tập giá đỡ của B’.
Hiệu quả tính toán nhanh
Tính liên tục : khi B’ thay đổi ít thì y cũng thay đổi ít
Sau đây là một số phương pháp giải mờ thông dụng
- Phƣơng pháp lấy max
Phương pháp này chọn y là điểm có độ thuộc cao nhất vào B’
(y) = (v) y V| Xác định tập rõ H = (1.17)
Sau đó có thể chọn y trong H như sau :
Y bất kỳ
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Y là điểm cực biên (lớn nhất hoặc nhỏ nhất)
20
Y là trung điểm của H
- Phƣơng pháp lấy trọng tâm
Phương pháp này chọn y là điểm trọng tâm của tập B’
y = (1.18)
- Phƣơng pháp lấy trung bình tâm
Vì B’ thường là hợp hoặc giao của m tập mờ thành phần do vậy ta có thể
tính gần đúng giá trị y là bình quân có trọng số của tâm m tập mờ thành phần.
Giả sử xi và hi là tâm và độ cao của tập m thành phần B’i ta có :
y = (1.19)
Phương pháp này được ứng dụng nhiều nhất vì kết quả đầu ra y có xét
đến ảnh hưởng của tất cả các luật tương tự như phương pháp trọng tâm nhưng
độ phức tạp tính toán ít hơn.
1.4.2. Sự kết hợp giữa logic mờ và mạng neural
Khi khảo sát mạng nơron và logic mờ, ta thấy mỗi loại đều có điểm
mạnh, điểm yếu riêng của nó. Đối với logic mờ, ta dễ dàng thiết kế một hệ
thống mong muốn chỉ bằng các luật Nếu-thì (If - Then) gần với việc xử lý của
con người. Với đa số ứng dụng thì điều này cho phép tạo ra lời giải đơn giản
hơn trong khoảng thời gian ngắn hơn. Thêm nữa, ta dễ dàng sử dụng những
hiểu biết của mình về đối tượng để tối ưu hệ thống một cách trực tiếp [3].
Tuy nhiên, đi đôi với các ưu điểm hệ điều khiển mờ còn tồn tại một số
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
khuyết như việc thiết kế và tối ưu hóa hệ logic mờ đòi hỏi phải có một số kinh
21
nghiệm về điều khiển đối tượng, đối với những người mới thiết kế lần đầu
điều đó hoàn toàn không đơn giản. Mặt khác còn hàng loạt những câu hỏi
khác đặt ra cho người thiết kế mà nếu chỉ dừng lại ở tư duy logic mờ thì hầu
như chưa có lời giải, ví dụ : số tập mờ trong mỗi biến ngôn ngữ cần chọn bao
nhiêu là tối ưu? Hình dạng các tập mờ thế nào? Vị trí mỗi tập mờ ở đâu? Việc
kết hợp các tập mờ như thế nào? Trọng số của mỗi luật điều khiển bằng bao
nhiêu? Nếu như tri thức cần đưa vào hệ được thể hiện dưới dạng các tập dữ
liệu (điều này thường gặp khi thu thập và xử lý dữ liệu để nhận dạng đối
tượng) thì làm thế nào?...
Đối với mạng nơron, chúng có một số ưu điểm như xử lý song song nên
tốc độ xử lý rất nhanh. Mạng nơron có khả năng học hỏi, ta có thể huấn luyện
mạng để xấp xỉ một hàm phi tuyến bất ky, đặc biệt khi đã biết một tập dữ liệu
vào/ra…Song nhược điểm cơ bản của mạng nơron là khó giải thích rõ ràng
hoạt động của mạng nơron như thế nào. Do vậy việc chỉnh sửa trong mạng
nơron rất khó khăn.
Hai tiêu chí cơ bản trợ giúp cho người thiết kế ở logic mờ và ở mạng
nơron hiện trái ngược nhau
Tiêu chí Mạng nơron Logic mờ
Thể hiện tri thức Không tường minh, khó Tường minh, dễ kiểm chứng
giải thích và khó sửa đổi hoạt động và dễ sửa đổi
Khả năng học Có khả năng học thông qua Không có khả năng học,
các tập dữ liệu người thiết kế phải tự thiết
kế tất cả
Từ những phân tích trên, ta thấy nếu kết hợp logic mờ và mạng nơron, ta
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
sẽ có một hệ lai với ưu điểm của cả hai: logic mờ cho phép thiết kế hệ dễ
22
dàng, tường minh trong khi mạng nơron cho phép học những gì mà ta yêu cầu
về bộ điều khiển.
Nó sửa đổi các hàm phụ thuộc về hình dạng, vị trí và sự kết hợp,…hoàn
toàn tự động. Điều này làm giảm bớt thời gian cũng như làm giảm bớt chi phí
khi phát triển hệ.
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 1.14. Mô hình hệ mờ - neural
23
CHƢƠNG 2.
MÔ HÌNH MẠNG ANFIS VÀ KHẢ NĂNG ỨNG DỤNG
2.1. Hệ suy luận mờ dựa trên mạng thích nghi
2.1.1. Giới thiệu sơ lƣợc về mô hình nơron - mờ
Một mạng nơron với các trọng số được điều chỉnh có thể xem như là một
thiết bị điều khiển tự động nhờ vào tính chất hồi quy phi tuyến của các đối
tượng rời rạc. Tuy nhiên tri thức được lưu trữ trong mạng không rõ ràng,
không mô tả được những mối liên hệ giữa dữ liệu nhập và dữ liệu xuất, mà chỉ
có thể xác định các mối liên hệ này thông qua những tham số thích nghi của
mạng. Trái lại, một luật mờ nếu - thì lại có thể diễn tả được các mối liên hệ đó
dưới dạng ngôn ngữ tự nhiên, nhưng lại không có khả năng điều chỉnh luật
cho phù hợp. Hai vấn đề này được kết hợp lại tạo thành một hệ thống nơron -
mờ nhằm đạt được khả năng “đọc” và “học” cùng một lúc. Các luật thu được
từ hệ thống này có thể điều chỉnh phù hợp với dữ liệu phát sinh mô hình, và
đối với các ứng dụng điều khiển tự động, mô hình nơron - mờ có thể tích hợp
với các luật chuyên gia nhằm đưa ra những kết quả chính xác [3].
Bên cạnh các luật chuyên gia, các luật trích ra từ dữ liệu cũng là một hình
thức mô hình hóa hệ thống điều khiển tự động, chẳng hạn như trong Nhận
dạng, khai mỏ dữ liệu,…Mục tiêu đưa ra các luật này là nhằm giảm độ phức
tạp của vấn đề cũng như lượng dữ liệu liên quan đến vấn đề.Có rất nhiều
phương pháp phân tích dữ liệu để đưa ra hệ thống các luật để có thể thực hiện
một sự kết hợp tối ưu giữa logic mờ và mạng nơron.
Các nghiên cứu về mạng nơron đã bắt đầu từ thập niên 40 và logic mờ từ
thập niên 60, nhưng mô hình nơron - mờ là một lĩnh vực mới.Năm 1992,
Roger Jang đã đề xuất mô hình ANFIS nhằm đáp ứng việc xây dựng một tập
luật mờ nếu - thì với các hàm thành viên xấp xỉ dữ liệu nhập - xuất đích. Kết
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
quả là một hệ thống suy luận mờ dựa trên mạng thích nghi không chỉ thể hiện
24
tốt thông tin ngôn ngữ (các luật ngôn ngữ) từ các chuyên gia, mà còn phù hợp
với việc sử dụng dữ liệu dạng số để thu được mức độ thực hiện tốt hơn.
2.1.2. Luật mờ và hệ suy luận mờ
2.1.2.1. Luật mờ
Luật mờ là biểu thức điều kiện có dạng “NẾU A THÌ B”, trong đó A
và B là nhãn của các tập mờ được mô tả bằng cách xấp xỉ các hàm thành
viên. Nhờ vào dạng rút gọn, luật mờ thường được dùng để thiết lập những
phương thức lập luận không chính xác, nhằm thể hiện tính đa dạng trong tri
thức của con người. Ví dụ sau mô tả một sự kiện đơn giản là (đây là luật
mờ loại Mamdani) [4]:
Nếu nhiệt độ cao thì giá máy lạnh tăng.
Trong đó nhiệt độ và giá máy lạnh là các biến ngôn ngữ, cao và tăng là
các giá trị ngôn ngữ hoặc các nhãn được mô tả bởi các hàm thành viên.
Một dạng khác của luật mờ do Takagi và Sugeno đề xuất, có các tập
mờ chỉ xuất hiện trong phần giả thuyết của luật. Ví dụ (đây là luật mờ
loại Sugeno):
Nếu lưu lượng dòng chảy cao thì mực nước sông=k*lưu lượng dòng chảy
trong đó cao là phần giả thuyết được mô tả bởi hàm thành viên xấp xỉ.
Tuy nhiên, phần kết luận được định nghĩa bởi phương trình theobiến lưu
lượng dòng chảy.
Cả hai loại luật mờ trên đều được mở rộng trong cả hai lĩnh vực mô
hình hóa và điều khiển tự động. Bởi vì lợi ích của các nhãn ngôn ngữ và
các hàm thành viên mà một luật mờ có thể nắm bắt dễ dàng qui luật điều
khiển của con người.
2.1.2.2. Hệ suy luận mờ
Một cơ sở luật chứa các luật mờ nếu – thì
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Một hệ thống suy luận mờ gồm 5 khối cơ bản sau (Hình 2.1):
Một cơ sở dữ liệu định nghĩa các hàm thành viên của các tập mờ được
25
Một đơn vị thực hiện quyết định thực hiện phép toán suy luận trên
sử dụng trong các luật mờ
Một suy luận mờ chuyển đổi dữ liệu thô thành các mức độ kết nối với
các luật
Một suy luận khử mờ chuyển đổi các kết quả mờ của suy luận thành
biến ngôn ngữ
Cơ sở tri thức
Dữ liệu xuất
Cơ sở luật
Dữ liệu nhập
Cơ sở dữ liệu
Mờ hóa
Khử mờ hóa
dữ liệu thô
(thô )
Đơn vị thực hiện quyết định
(mờ )
(mờ )
(thô )
Hình 2.1. Hệ thống suy luận mờ
Thông thường cơ sở luật và cơ sở dữ liệu được dựa trên tri thức chuyên
gia. Các bước lập luận mờ (phép toán suy luận trên các luật mờ) được thực
1. So sánh giá trị đầu vào với hàm thành viên của phần giả thiết để có được
hiện bởi các hệ thống suy luận mờ (Hình 1.19):
giá trị thành viên (hay những độ đo tương tự) của những tập ngữ nghĩa (bước
2. Kết nối (qua toán tử chuẩn T-norm, thường là nhân hay lấy tối tiểu) giá trị
này được gọi là bước mờ hóa)
3. Tạo kết luận đang tính toán (có thể là mờ hay rõ) cho mỗi luật dựa vào
tạo thành viên của phần giả thiết để có được trọng số vào của luật.
4. Tổng hợp các giá trị kết luận này để tạo kết quả rõ (bước này được gọi là
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
trọng sổ của luật.
26
giải mờ).
Có một sốsuy diễn mờ được sử dụng trong lĩnh vực này, dựa vào loại của
lập luận mờ và loại sử dụng luật mờ if-then mà các hệ suy diễn mờ được chia ra
làm ba loại như sau:
Loại 1: Toàn bộ dữ liệu xuất là trung bình trọng số các dữ liệu xuất thô của
mỗi luật có được do ngưỡng kích hoạt của luật (toán tử tích hoặc min tổ hợp các
giả thuyết) và các hàm thành viên dữ liệu xuất.
Loại 2: Toàn bộ dữ liệu xuất thu được bằng cách dùng toán tử max cho các
dữ liệu xuất mờ đủ tiêu chuẩn (cực tiểu hóa độ ngưỡng kích hoạt và hàm thành
viên dữ liệu xuất của mỗi luật). Các ý tưởng khác nhau được đề xuất để chọn lựa
dữ liệu xuất thô cuối cùng dựa trên toàn bộ dữ liệu xuất mờ; một số trong chúng
là tâm của diện tích, đường phân giác của diện tích, trung bình cực đại, tiêu chuẩn
cực đại,…
Loại 3: Các luật mờ loại Takagi và Sugeno được sử dụng. Dữ liệu xuất của
mỗi luật là một tổ hợp tuyến tính các dữ liệu nhập, cộng với một số hạng không
đổi, và dữ liệu xuất cuối cùng chính là trung bình trọng số các dữ liệu xuất trong
mỗi luật.
2.1.3. Mạng thích nghi
vectơ nhập vectơ xuất
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 2.2. Mạng thích nghi
27
Một mạng thích nghi (Hình 2.2) là một mạng nhiều lớp lan truyền tiến, trong
đó mỗi nút thực hiện một chức năng riêng (hàm nút) trên tín hiệu vào cũng như
tập các tham số gắn liền với nút. Trạng thái tự nhiên của hàm nút có thể biến đổi
từ nút này qua nút khác, và sự lựa chọn của mỗi hàm nút dựa trên hàm ánh xạ
toàn cục nhập - xuất để mạng thích nghi được yêu cầu thực hiện. Chú ý rằng các
liên kết trong mạng thích nghi chỉ xác định hướng dữ liệu của tín hiệu giữa các
nút chứ không chứa trọng số [3].
Để phản ánh các khả năng thích nghi khác nhau, các nút hình tròn và hình
vuông được dùng trong mạng thích nghi. Một nút hình vuông (nút thích nghi) có
chứa tham số còn một nút hình tròn (nút cố định) thì không. Tập tham số của
mạng thích nghi là tập hợp của các tập tham số của mỗi nút thích nghi. Để thu
được ánh xạ nhập - xuất đích, các tham số này được cập nhật theo dữ liệu huấn
luyện đã cho và thủ tục học dựa trên gradient.
2.1.4. Cấu trúc của ANFIS
Hình dưới đây là một ví dụ về cấu trúc của ANFIS với 2 đầu vào và hai nhãn
ngôn ngữ cho mỗi đầu vào. Trường hợp tổng quát một mạng ANFIS với n đầu
vào và m nhãn ngôn ngữ cho mỗi đầu vào có 5 tầng. Các hàm nút trong một tầng
thuộc cùng một họ [7].
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Hình 2.3. Cấu trúc của ANFIS
28
Lớp 1: Tầng này gồm n*m nút thích nghi (nút hình vuông) với hàm
của nút là
(2.1)
Trong đó là đầu vào thứ i,
là nhãn ngôn ngữ thứ j của đầu vào i, (ví dụ như nhỏ, trung bình, lớn…). µAịj
là hàm thuộc của và nó chỉ rõ mức độ thuộc về . Thông thường ta
chọn hàm thuộc là hàm Chuông (Bell) hoặc hàm Gaussian với giá trị trả về
nằm trong đoạn [0,1].
(2.2)
Với {ak, bk, ck} hay {ak, ck} (0 ≤ k ≤ n*m-1) là tập tham số phi tuyến
của nút k. Khi những giá trị của tham số thay đổi, hình dạng của hàm thành
viên của nhãn ngôn Aij sẽ thay đổi theo.
Lớp 2: Mỗi nút trong lớp này có hình tròn và có nhãn là ∏. Nó chính là
tích của các tín hiệu đến và mỗi giá trị đầu ra của nút biểu diễn cường
độ của một luật (toán tử T - norm thực hiện phép AND tổng quát có thể
được sử dụng ở đây)
(2.3)
Lớp 3: Mỗi nút trong lớp này có hình tròn có nhãn là N. Nút thứ i được
tính là tỉ lệ của cường độ luật của nút thứ i so với tổng tất cả các cường
độ luật:
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
(2.4)
29
Để thuận tiện, giá trị đầu ra của nút này sẽ được gọi là giá trị đầu vào luật
được chuẩn hoá (normalized firing strengths)
Lớp 4: Mỗi lớp i trong lớp này là một nút hình vuông có chức năng
(2.5)
Trong đó, là đầu ra của lớp thứ ba,{pi, qi, ri}là tập các tham số, các
tham số trong lớp này sẽ được xem như là tham số kết luận.
Lớp 5:Là một lớp có một nút hình tròn, trong lớp này có ký hiệu ∑
là đầu ra bằng tổng của tất cả các tín hiệu đầu vào.
(2.6)
2.2. Thuật toán ANFIS
2.2.1. Thuật toán học lan truyền ngƣợc
Thuật toán lan truyền ngược (BP) được giới thiệu lần đầu vào năm
1970 bởi Werbos. Tập hợp các tham số được cập nhật suốt trong quá trình
huấn luyện dữ liệu bởi phương pháp độ dốc gradient. Hầu hết mạng nơron cơ
bản hiện nay được huấn luyện bởi thuật toán BP [1].
Lan truyền ngược là một phương pháp cho phép xác định tập trọng số tốt
nhất của mạng để giải một bài toán đã cho. Việc áp dụng phương pháp lan
truyền ngược là một quá trình lặp đi lặp lại nhiều lần hai tiến trình chính: lan
truyền tiến để thực hiện ánh xạ và lan truyền ngược sai số để cập nhật các
trọng số. Các trọng số của mạng là các hệ số của mô hình. Phương pháp giảm
gradient được dùng để cập nhật những hệ số này sao cho giảm thiểu được sai
số của mô hình.
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Xét lớp mạng 3 lớp như hình (2.3)
30
Hình 2.4. Mạng 3 lớp lan truyền ngược
Thuật toán: Đầu tiên ta cho lan truyền thẳng suốt trong mạng, qua các
phần tử nơron và được tiếp tục với các hàm kích hoạt của phần tử nơron. Các
mạng được nghiên cứu cùng với thuật toán học lan truyền ngược được gọi là
mạng lan truyền ngược [1].
Huấn luyện các cặp vào/ra.
{(x(k), d(k))}, k = 1,2,...,p
Thuật toán cung cấp một thủ tục cho việc thay đổi các vector trọng số
trong mạng, đầu ra của mạng được lan truyền ngược trở lại lớp đầu vào cho
đúng các mẫu. Cơ sở cho việc cập nhật các trọng số là phương pháp độ dốc
Gradient.
Với cặp vào ra (x(k), d(k)), thuật toán lan truyền ngược thực hiện các bước
như sau:
Đầu tiên, mẫu x(k) được lan truyền từ lớp đầu vào qua các lớp ẩn đi đến lớp đầu ra có kết quả là y(k). Sau đó, sai số giữa y(k) và d(k) được lan truyền
ngược trở lại từ lớp đầu ra tới lớp đầu vào để cập nhật trọng số. Hình (2.3)
diễn giải thuật toán lan truyền ngược. Kết quả có thể mở rộng sang mạng
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
nơron nhiều lớp.
31
Trên hình (2.3) có m phần tử nơron đầu vào, l phần tử nơron ở lớp ẩn, và
n phần tử nơron ở lớp đầu ra. Đường nét liền diễn tả lan truyền thẳng của các
tín hiệu, đường nét đứt diên tả lan truyền ngược của các sai số. Đầu tiên huấn
luyện vào cặp vào/ra ký hiệu (x,d) để cho đơn giản ta bỏ chỉ số k. Khi một
mẫu đầu vào x được đưa vào thì các phần tử trong mạng sẽ được tính như sau:
Đầu vào phần tử q của lớp ẩn sẽ được tính theo phương trình:
(2.7)
Phương trình đầu ra của q sẽ là: ) (2.8)
Đầu vào phần tử thứ i của lớp đầu ra sẽ là:
(2.9)
Phương trình đầu ra của phần tử nowron thứ i sẽ là:
(2.10)
Các chỉ số trên được tính toán cho sự lan truyền tiến của các tín hiệu đầu
vào xuyên suốt qua các lớp mạng nơron. Trước khi ta đề cập đến các tín hiệu
sai số của sự lan truyền ngược, ta sẽ định nghĩa một hàm mục tiêu như sau:
(2.11)
Sau đó, theo phương pháp độ dốc Gradient, các trọng số nối giữa lớp ẩn
và lớp đầu ra được cập nhật bởi , và nó được tính theo công thức sau:
(2.12)
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Sử dụng các công thức (1.20-1.22) và thay đổi luật với , ta có:
32
(2.13)
Trong đó, là tín hiệu sai số, chỉ số dưới thứ hai là điểm thứ i trong lớp
đầu ra. Sai số tín hiệu được định nghĩa bởi:
(2.14)
Trong đó, neti là đầu vào của phần tử nơron thứ i trong lớp đầu ra và
.
Bây giờ ta phải tính đầu ra zq của lớp ẩn:
Với trọng số nối giữa đầu vào và các lớp ẩn, ta sử dụng thay đổi luật
cùng phương pháp độ dốc Gradient, ta cập nhật trọng số để kết nối giữa phần
tử thứ j của lớp đầu vào với phần tử thứ q của lớp ẩn. Khi đó:
(2.15)
Từ công thức (2.11), thì mỗi sai số [di-yi], với i=1,2,...,n là một hàm của zq.
Đánh giá thay đổi luật ta có:
(2.16)
Sử dụng công thức (2.14), ta có thể viết lại công thức (2.24) như sau:
(2.17)
Ở đây, là sai số tín hiệu của phần tử thứ q của lớp ẩn và được định nghĩa
như dưới đây:
(2.18)
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Trong đó, netq là đầu vào phần tử thứ q của lớp ẩn.
33
Tín hiệu sai số của một phần tử trong lớp ẩn khác so với tín hiệu sai số
của một phần tử trong lớp đầu ra, như đã được chỉ ra trong công thức (2.18)
và (2.14). Do có sự khác nhau này, nên các thủ tục cập nhật các trọng số trên
được gọi là luật học delta tổng quát. Chúng ta xem xét công thức (2.18), sai số
tín hiệu của phần tử lớp ẩn q có thể được xác định trong các mẫu của các
tín hiệu sai số của các phần tử ở lớp ra thứ i (yi) cung ứng. Các hệ số là các
trọng số được sử dụng cho lan truyền thẳng, nhưng ở đây chúng truyền các tín
hiệu sai số ( ) ngược trở lại, đó chính là các đường nét đứt trong hình (2.3).
Điều này đã chứng tỏ được đặc điểm quan trọng của thuật toán lan truyền
ngược – luật cập nhật cục bộ, đây chính là tính toán trọng số thay đổi dựa vào
sự kết nối, và chúng ta chỉ cần giá trị ở hai đầu của kết nối này.
Sự đạo hàm ở trên có thể dễ dàng mở rộng cho mạng có nhiều hơn một
lớp ẩn, bằng cách sử dụng chuỗi luật liên tiếp. Trong trường hợp chung, với
số lớp tùy ý, thì sự lan truyền ngược được cập nhật luật ở dạng sau:
(2.19)
Ở đây, (output-i) và (input-j) quy vào hai đầu của sự kết nối từ phần tử
thứ j tới phần tử thứ i, xj là đầu vào cuối cùng kích hoạt từ một phần tử lớp ẩn,
hoặc từ một đầu vào bên ngoài.Ngoài ra, là tín hiệu học được định nghĩa
bởi công thức (2.14) với đầu ra hoặc lớp cuối cùng của các trọng số kết nối,
và được định nghĩa bởi công thức (2.18) cho tất cả các lớp khác. Khi hàm
sigmoid lưỡng cực được sử dụng làm hàm kích hoạt, đồng thời sử dụng (2.14)
và (2.18) ta có hàm y được xác định như sau:
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Khi đó ta có:
34
(2.20)
(2.21)
Thuật toán lan truyền ngƣợc Xem xét một mạng với Q lớp lan truyền ngược, q=1,2,...,Q; với qneti và qyi lần lượt là đầu vào và đầu ra của khối trong lớp thứ q. Mạng có m nơron đầu vào, l nơron ở lớp ẩn, và n nơron đầu ra. Với qwij là trọng số nối từ q-1wj đến qyi.
Đầu vào: các cặp huấn luyện {x(k), d(k) | k=1,2,...,p}, ở đó giá trị đầu vào
của phần tử cuối cùng bằng -1, tức là .
Bƣớc 0 (Đặt giá trị ban đầu)
Lựa chọn bước tính (Hằng số học) 0<η<1 và Emax (sai số lớn nhất
cho phép).
Chọn các trọng số ban đầu nối từ phần tử thứ j của lớp (q – 1) đến
phần tử thứ i của lớp q là qwij có giá trị nhỏ và ngẫu nhiên.
Cho sai số E = 0 và k = 1.
Bƣớc 1 (Vòng lặp huấn luyện)
(k) cho tất cả các i = 1,2,3,…,m. (2.22)
qyi= 1yi = xi
Áp dụng mẫu vào thứ k, cho lớp đầu vào q=1. Khi đó ta có:
Bƣớc 2 (Lan truyền thẳng)
Lan truyền tín hiệu thẳng xuyên suốt mạng cho mỗi i và q cho tới khi các
đầu ra của lớp đầu ra Qyi được thực hiện.
(2.23)
Bƣớc 3 (Đo lƣờng sai số đầu ra)
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Tính toán giá trị sai lệch và tín hiệu sai lệch cho lớp đầu ra như sau:
35
; (2.24)
(2.25)
Trong đó: là tín hiệu sai lệch của nơron thứ i cho lớp ra Q;
là đạo hàm của hàm truyền a(.) theo tổng trọng số của phần tử i của
lớp đầu ra là .
Bƣớc 4 (lan truyền ngƣợc sai số)
Các sai số lan truyền ngược với mục đích để cập nhật các trọng số và
tính toán các tín hiệu sai lệch cho các lớp xử lý:
; (2.26)
; với q=Q,Q-1,...,2 (2.27)
Trong đó:
là sai lệch tại thời điểm tính của giá trị trọng số liên kết cập
nhật mới và cũ, liên kết từ phần tử thứ j của lớp q-1 đến phần tử i
của lớp q.
là giá trị trọng số liên kết cập nhật mới từ phần tử thứ j của
lớp (q-1) đến phần tử i của lớp q.
là giá trị trọng số liên kết cũ từ phần tử thứ j của lớp (q-1) đến
phần tử i của lớp q.
là tín hiệu ra của phần tử j của lớp (q-1).
Số hóa bởi Trung tâm Học liệu – ĐHTN
http://www.lrc.tnu.edu.vn
Bƣớc 5 (Sau mỗi vòng lặp)
36
Kiểm tra xem đã lặp hết các giá trị mẫu huấn luyện chưa, nếu chưa quay
vòng hết (tức là k
chuyển sang bước 6.
Bƣớc 6 (Kiểm tra tổng sai số)
Kiểm tra sự khác nhau giữa tổng sai số và sai số cho phép:
Nếu tổng sai số nhỏ hơn sai số cho phép (tức là E quá trình huấn luyện, và ghi lại các giá trị trọng số cuối cùng. Trái lại, thì lại gán E=0, k=1 và bắt đầu một quá trình huấn luyện mới bằng cách nhảy tới bước 1. 2.2.2. Thuật toán học lai Mặc dù chúng ta có thể áp dụng phương pháp gradient để xác định các tham số trong mạng thích nghi, nhưng phương pháp này nhìn chung rất chậm và có thể bị rơi vào tình trạng cực tiểu địa phương.Ở đây, việc kết hợp phương pháp gradient và phương pháp ước lượng bình phương cực tiểu (LSE) được dùng để xác định và điều chỉnh các tham số của mạng [1, 3]. Để đơn giản, giả sử rằng mạng thích nghi đang xét chỉ có một đầu ra: output = F (2.28) F là hàm mạng, là vector đầu vào và S là tập các tham số của mạng.Ta có: (2.29) y = Từ mối quan hệ (2.29) ta thấy y là hàm tuyến tính của tham số . Gọi S1 là tập các tham số tầng thứ nhất, S2 là tập các tham số ở tầng thứ 4. S1 = [ci,j, si,j], với i, (0 ≤ i ≤ n-1), và j, (0 ≤ j ≤ m-1) (chỉ số tương đương với nhãn ngôn ngữ). ] với 0 ≤ k ≤ mn - 1 S2 = [ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn S = (2.30) S là hợp của hai tập S1 và S2 : 37 Do y là tuyến tính với các tham số trong S2, với mỗi giá trị cho trước của các phần tử trong tập S1, thay lần lượt các mẫu trong N mẫu dữ liệu huấn luyện vào (2.29) ta thu được : AX = B (2.31) ở đây X là vector chứa các phần tử trong S2 là các tham số chưa biết. Giả sử rằng (M là tham số), kích thước của A, X, B tương ứng là N x M, M x 1, N x 1. Do N (số mẫu dữ liệu dùng để huấn luện) thường lớn hơn M (số các tham số của tầng 4), nên không tìm được nghiệm chính xác X trong
(2.31). Thay vào đó, ta tìm phiên bản gần đúng của X là X* bằng phương pháp sai số bình phương cực tiểu LES. Nghĩa là tìm X sao cho đạt giá trị nhỏ nhất với là modul Euclide. Thông thường X* được xác định theo công thức (2.32) ở đây là ma trận chuyển vị của A và là ma trận giả nghịch đảo của A.Mặc dù công thức (2.32) rất ngắn gọn và tường minh nhưng chi phí tính toán để xử lý nghịch đảo ma trận lại quá. Do đó ta dùng phương pháp lặp tuần tự để tính X, phương pháp lặp tuần tự này rất hiệu quả khi M nhỏvà có thể dễ dàng sử dụng cho phương pháp học từng mẫu. Lấy vector hàng thứ i của ma trận A là và phần tử thứ i của B là , khi đó X được điều chỉnh dần từng bước theo các công thức: (2.33) Xi+1 = Si+1 = Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Trong đó Si thường được gọi là ma trận hiệp phương sai và ước lượng
bình phương cực tiểu X* bằng XN. Các điều kiện khởi tạo cho phương trình 38 , với là số dương lớn xác định (chọn = 106) và I (2.33) là X0 = 0 và S0= là ma trận đơn vị có kích thước M x M Như vậy các tham số trong ANFIS được cập nhật bằng việc kết hợp thuật toán gradient và ước lượng bình phương cực tiểu (thuật toán học lai).Trong thuật toán học lai, mỗi epoch là sự kết hợp của bước đi tiến và bước đi lùi. Ở bước đi tiến, S1 được cố định, dữ liệu vào được sử dụng để ước lượng cho mỗi nút đầu ra cho đến khi các ma trận A và B thỏa mãn (2.31). Kết quả là ta tìm được tập các tham số S2 bằng phương pháp LSE sau đó tiếp tục tính toán để tìm được tham số đầu ra.Trong bước đi lui, S2 là cố định, chúng ta sử dụng phương pháp truyền ngược gradient để cập nhật S1. 2.3. Khả năng ứng dụng của mạng ANFIS ANFIS được ứng dụng để giải quyết nhiều bài toán trong đó đặc biệt là những bài toán sau : - Bài toán dự báo + Dự báo các chỉ số kinh tế tài chính : chỉ số chứng khoán, lãi suất ngân hàng, giá vàng, giá xăng dầu,… + Dự báo các thông số địa lý, địa chất : mực nước ở các sông, hồ, ao,… + Dự báo thời tiết - Bài toán điều khiển + Điều khiển tay máy + Điều khiển con lắc ngược + Điều khiển vị trí động cơ một chiều Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn - Bài toán nhận dạng 39 CHƢƠNG 3.ỨNG DỤNG MÔ HÌNH ANFIS CHO BÀI TOÁN DỰ BÁO SẢN LƢỢNG TIÊU THỤ ĐIỆN NĂNG VÀ THỬ NGHIỆM 3.1. Bài toán dự báo điện năng 3.1.1. Sự cần thiết của việc dự báo mức tiêu thụ điện năng Bài toán dự báo sản lượng điện tiêu thụ là một trong những yêu cầu của sự phát triển kinh tế xã hội. Khu vực miền Bắc nói chung và tỉnh Bắc Giang nói riêng cũng nằm trong xu thế phát triển và cần thiết phải dự báo nhiều chỉ tiêu, trong đó có sản lượng điện tiêu thụ. Thời điểm giữa năm 2005 sản lượng điện tiêu thụ đột biến trong khi đó nguồn tài nguyên nước tại thời điểm đó bị thiếu hụt dẫn đến ảnh hưởng lớn đến nền kinh tế Việt Nam.Vì vậy dự báo sản lượngđiện đóng vai trò hết sức quan trọng đối với việc quy hoạch, đầu tư, phát triển nguồn điện và vận hành hệ thống điện.Nhu cầu tiêu thụ điện năng phụ thuộc vào khả năng phát triển của nền kinh tế quốc dân, nếu dự báo sản lượng quá thấp so với nhu cầu thực tế thì dẫn đến kết quả nguồn dự phòng thấp, không đáp ứng đầy đủ nhu cầu điện cho sản xuất công nghiệp và tiêu dùng, còn nếu dự báo sản lượng quá cao sẽ phải huy động các nguồn đắt tiền gây lãng phí cho nền kinh tế nước nhà [9]. Dự báo sản lượng dài hạn (khoảng 10-20 năm) nhằm mục đích cung cấp dữ liệu cho công tác quy hoạch và đầu tư phát triển HTĐ. Còn dự báo sản lượng ngắn hạn (trong vòng 30 ngày) có nhiệm vụ đảm bảo vận hành hệ thống điện an toàn và kinh tế. Đối với dự báo dài hạn có tính chất chiến lược thì chỉ nêu lên những phương hướng phát triển chủ yếu mà không yêu cầu xác định chỉ tiêu cụ thể. Các chức năng quan trọng trong kế hoạch vận hành HTĐ như phân phối nguồn một cách kinh tế, hiệu quả, lên kế hoạch bảo dưỡng và sửa chữa, thường được thực hiện nhờ việc dự báo sản lượng, vì vậy dự báo sản lượngđóng vai trò đặc biệt quan trọng đối với điều độ viên, những người Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn hoạch định kế hoạch, lên phương thức vận hành HTĐ. 40 Dự báo chính xác sản lượng cao điểm có hiệu quả lớn về kinh tế vào mùa lũ khi cần khai thác tối đa nguồn thủy điện, trong khi nước các hồ chứa đang xả thì các nguồn điện khác huy động chỉ nhằm mục đích an toàn, bù điện áp và phủ đỉnh. Nếu sai số dự báo sản lượng lúc cao điểm giảm 2%, Điều độ Quốc Gia (ĐĐQG) có thể tiết kiệm được khoảng 80 MW nguồn tuabin khí chạy dầu đắt tiền chạy phủ đỉnh lúc cao điểm, góp phần đáng kể vào việc tăng hiệu quả vận hành HTĐ và tiết kiệm được hàng trăm triệu đồng trên mỗi giờ cho ngành điện nói riêng và cho cả nền kinh tế Quốc dân nói chung. 3.1.2. Các phƣơng pháp và mô hình dự báo điện năng trên thế giới Năng lượng là một đầu vào quan trọng cho sự phát triển kinh tế xã hội của bất kỳ quốc gia nào. Sự tăng lên trong việc tiêu thụ năng lượng thực chất liên quan đến sự tăng trưởng trong nền kinh tế [7, 8] Các mô hình khác nhau đã được áp dụng để mô tả và dự báo trước sự gia tăng của nhu cầu về năng lượng. Chavez et al. (1999) sử dụng mô hình phân tích chuỗi thời gian Box-Jenkins (ARIMA) để xây dựng những mẫu dự báo cho những dự đoán của việc sản xuất và tiêu thụ năng lượng ở Asturias, miền Bắc Tây Ban Nha [7]. Theo một quan điểm thống kê, xu hướng trong hiện tại và tương lai gần về tiêu thụ năng lượng bằng cách xem xét hai yêu tố, cụ thể là sự gia tăng dân số và sự phát triển kinh tế đã được bàn luận bởi Kadoshin et al. Các nhà dự báo tập trung vào sự kết hợp của mạng lưới thần kinh nhân tạo (ANN) với các ứng dụng để dự đoán nhu cầu tiêu thụ khí ga hàng ngày bằng các tiện ích từ ga. Saab et al. (2001) đã nghiên cứu phương pháp mô hình đơn biến (mẫu biến số) khác nhau cho các dự báo tình hình tiêu thụ năng lượng hàng tháng ở Lebanon. 3 mô hình đơn biến đã được sử dụng là: tự hồi quy, tự hồi qui tích hợp trung bình trượt (ARIMA) và một cấu hình mới kết hợp giữa phần bình quân dịch chuyển AR với một bộ lọc có đường truyền cao. Một mô hình cung cấp dầu và khí đốt (OGSM ) đã được giải quyết và các dự đoán tình hình cung - cầu về dầu và khí đốt tự nhiên cho Canada đến năm 2020 đã được Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn trình bày (JaiPersaud và Uma Kumar, 2001). Chow (2001) đã thảo luận về 41 ngành tiêu thụ năng lượng tại Hồng Kông trong giai đoạn 1984-1997 và đặc biệt nhấn mạnh khu vực (ngành hoạt động) hộ gia đình. Ediger và Tatlldil (2002) đã sử dụng một kỹ thuật bán thống kê để lập các mô hình dự báo để dự đoán nhu cầu năng lượng chính trong Thổ Nhĩ Kỳ và phân tích về các mô hình tuần hoàn.Reddy và Balachandra (2003) tìm ra các yếu tố khác nhau ảnh hưởng đến nhu cầu năng lượng ở Ấn Độ và năng lượng tiên tiến cùng với viễn cảnh môi trường trong năm 2010. Điều này được thực hiện bằng cách phát triển một mô hình toán học tích hợp kết hợp nhiều yếu tố như GDP và tăng dân số [7]. Các mô hình được trình bày trong Siemek et al. (2003) ước tính nhu cầu khí đốt tự nhiên, dựa trên xu thế bình quân của phát triển kinh tế, mô hình này được coi như sản phẩm (sản lượng)/nhu cầu tự nhiên cực đại của các hãng (vận tải) năng lượng. Sự dự đoán này đã được tải lên với một số lỗi do sử dụng số liệu bình quân liên quan đến sự gia tăng của tổng sản phẩm quốc gia hàng năm. Gorucu et al. (2004) đào tạo các ANNs giải quyết (lựa chọn) các thông số tối ưu được sử dụng trong việc dự báo tiêu thụ khí đốt cho ứng dụng ngắn hạn. Gorucu và Gumrah (2004) dự báo tình hình tiêu thụ khí đốt trong ngắn hạn cho thủ đô Ankara, Thổ Nhĩ Kỳ bằng cách phân tích hồi quy đa biến. Gutierrez et al. (2005) đã kiểm tra việc ứng dụng một quá trình khuếch tán đổi mới Gompertz - type cho các mô hình ngẫu nhiên và nắm bắt quá trình phát triển của tình hình tiêu thụ khí đốt tự nhiên ở Tây Ban Nha. Sanchez-Ubeda và Berzosa (2007) đã dự báo tiêu thụ khí đốt công nghiệp cuối cùng trong phạm vi trung hạn (1-3 năm) với độ phân giải rất caodựa trên phương pháp phân rã. Dự báo đã được đưa ra bởi sự kết hợp của ba thành phần khác nhau: một là nắm bắt xu hướng của chuỗi thời gian, thành phần theo mùa và thành phần tạm thời. Parikh et al. (2007) đã ước tính được nhu cầu dự trù của sản phẩm dầu mỏ và khí tự nhiên ở Ấn Độ. Họ xem GDP và dân số là đầu vào của mô Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn hình dự toán NG của mình. Azadeh et al. dự báo tình hình tiêu thụ điện bởi sự 42 tích hợp của một mạng nơ ron, một chuỗi thời gian và ANOVA. Họ nhận thấy rằng ANN đã tốt hơn (hiệu quả hơn, cao hơn….)giá trị ước tính cho tổng số điện năng tiêu thụ.Azadeh et al. đã phát triển mạng lưới thần kinh nhân tạo và kết cấu (khung, sườn, khuôn khổ) thuật toán di truyền để dự đoán mức tiêu thụ năng lượng điện. Azadeh và Tarverdian đề xuất một phương pháp tích hợp (lồng ghép)dựa trên thuật toán di truyền, mô phỏng bằng máy và một kế hoạch thực nghiệm cho việc dự báo tiêu thụ năng lượng điện. Azadeh et al. trình bày một hệ thống tích hợp mờ, khai thác dữ liệu và một kết cấu chuỗi thời gian để ước tính và dự báo nhu cầu điện năng cho thay đổi theo mùa và theo tháng về tình hình tiêu thụ điện ở các nước đang phát triển như Trung Quốc và Iran. Azadeh et al. (2008b) đã sử dụng phương pháp mạng rơron nhân tạo (ANN) cho việc tiêu thụ điện hàng năm trong các ngành công nghiệp tiêu thụ điện năng ở mức cao.Azadeh et al. đã phát triển một thuật toán đã được tích hợp cho việc dự báo tiêu thụ năng lượng điện hàng tháng dựa trên một mạng nơron nhân tạo (ANN), mô phỏng bằng máy tính và một kế hoạch thực nghiệm sử dụng các phương pháp ngẫu nhiên.Azadeh et al. (2009) đã đề xuất ANFIS mô phỏng bằng máy mới để cải thiện việc dự đoán tình hình tiêu thụ điện. 3.2. Ứng dụng mô hình mạng ANFIS trong bài toán dự báo sản lƣợng tiêu thụ điện năng của tỉnh Bắc Giang 3.2.1. Xây dựng mô hình hệ thống Do sự thay đổi tự nhiên của nhu cầu thiêu thụ điện việc sử dụng phương pháp thông thường không thể cung cấp cho chúng ta kết quả chính xác. Do đó, ta sử dụng hệ suy luận mờ dựa trên mạng thích nghi (ANFIS) để giảm bớt vấn đề này. Kết cấu chính của phương pháp thông minh được giải thích như sau: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Các thuật toán có các bước cơ bản sau đây [7]: 43 Bƣớc 1: Xác định các yếu tố đầu vào của mô hình. Xem xét nghiên cứu trước đây, các biến số quan trọng nhất mà có tác động đáng kể đến mức tiêu thụ điện năng. Bƣớc 2: Thu thập một tập dữ liệu có sẵn trong tất cả các giai đoạn trước đây cho mỗi biến đầu vào và biến đầu ra. Ngoài ra, tất cả các dữ liệu đầu vào đượcchuẩn hoá. Bƣớc 3: Chia dữ liệu thành hai bộ, một bộ để ước lượng các mô hình, được gọi là tập dữ liệu đào tạo, và cái kia để đánh giá tính hợp lệ của các mô hình ước lượng, được gọi là tập hợp dữ liệu thử nghiệm (kiểm tra). Thông thường các tập dữ liệu đào tạo có 70% đến 90% của tất cả các dữ liệu và các dữ liệu còn lại được sử dụng cho các bộ dữ liệu thử nghiệm. Bƣớc 4: Bước này được áp dụng với tất cả các mô hình ANFIS hợp lý liên quan đến hai thông số chính. Bƣớc 5: Khả năng dự đoán của các mô hình được đánh giá ở bước này thông qua MAPE. Như là dữ liệu đầu vào được sử dụng để ước lượng mô hình có quy mô (tỷ lệ), khác nhau, phương pháp MAPE là phương pháp ưu tiên để ước tính sai sót tương đối.Xem xét giá trị của MAPE, các mạng ANFIS tốt nhất được chọn trong mỗi trường hợp để dự đoán mức tiêu thụ khí đốt. Bƣớc 6: Giá trị của các biến đầu vào trong thời gian tới được dự báo bởi việc sử dụng mô hình tự hồi qui. Bƣớc 7: Các giá trị sản lượng được đưa đến ANFIS đã chọn mà đãđược xác định ở bước 5. Cuối cùng, giá trị của tiêu thụ điện năng mỗi năm sau được tính bởi ANFIS đã chọn và các giá trị của các biến đầu vào mà đãđưa đến ANFIS. Cuối cùng, mức độ tiêu thụ điện năng được dự đoán giá trị cho mỗi năm tính theo quy mô ban đầu của nó và phù hợp để phân tích và sử dụng trong việc đưa ra quyết định [7]. Tầm quan trọng của đề xuất ANFIS cho việc dự đoán nhu cầu khí đốt Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn tự nhiên dài hạn là năm lần.Đầu tiên, nó sử dụng phương pháp trước khi xử 44 lý và sau khi chế biến để loại bỏ nhiễu có thể.Thứ hai, nó xác định mô hình ANFIS tốt nhất dựa trên MAPE tối thiểu.Thứ ba, xem xét tiêu chuẩn các biến đầu vào của việc dự toán nhu cầu điện dài hạn.Thứ tư, nó cung cấp một giải pháp chính xác hơn phương pháp trước đây (chẳng hạn như hồi quy thông thường) vì nó sử dụng ANFIS, trong đó sử dụng mô hình nơron thích nghi và logic mờ. Những bước này xử lý hiệu quả sự không chắc chắn, nhiễu, và phi tuyến tính trong tập dữ liệu nhất định (cho trước) và cung cấp các giải pháp tối ưu. Thứ năm, nó được áp dụng cho việc dự đoán tiêu thụ khí đốt trong những năm tới. Một phương pháp cụ thể trong việc phát triển Noron mờ là hệ suy luận mờ dựa trên mạng thích nghi (ANFIS), hệ suy luận nàyđã cho thấy kết quả đáng kể trong các hàm mô hình phi tuyến (Jang et al., 1997).ANFIS sử dụng một mạng lưới chuyển tiếp để tìm kiếm các quy tắc quyết định mờ cái mà hoạt động tốt trên một nhiệm vụ nhất định. Sử dụng một tập dữ liệu đầu vào-đầu ra nhất định, ANFIS tạo ra một hệ thống suy luận mờ (FIS) mà hàm thông số thành viên được điều chỉnh bằng cách sử dụng một thuật toán lan truyền ngược độc lập (một mình) hoặc kết hợp một thuật lan truyền ngược với một phương pháp bình phương cực tiểu. Điều này cho phép các hệ thống mờ nhận được thông tin qua những dữ liệu được mô hình hóa.Xem xét một mô hình mờ Takagi-Sugeno bậc nhất (lệnh đầu tiên) với hai đầu vào (x, y), một đầu ra; hệ thống có hai hàm thành viên cho mỗi đầu vào [8]. Một mô hình mờ bậc nhất Sugeno có hai quy tắc: •Quy tắc 1: Nếu x là A1 và y là B1, thì f1 = p1x + q1y + r1 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn • Quy tắc 2: Nếu x là A2 và y là B2, thì f2 = p2x + q2y + r2 45 Lớp 1: Khi đó, các chức năng của ANFIS là một cấu trúc nơron feed- forward năm lớp, và các hàm của các nút trong các lớp có thể được tóm tắt như sau: (3.1) O1,i = µAi (x) với i=1,2; (3.2) O1,i= µBi-2 (y) với i=3,4; Lớp 2: Trường hợp x hoặc y là đầu vào cho các nút, Ai hay Bi-2 là một tập mờ được liên kết với nút này. Ở lớp đầu tiên, với mỗi đầu vào, các lớp thành viên trong tập mờ tương ứng được ước tính (dự kiến,…). O1,ilà lớp thành viên của tập mờ (A1, A2, B1, B2). Ở lớp thứ hai, tất cả các quy luật tiềm ẩn giữa các yếu tố đầu vào được xây dựng bằng cách áp dụng điểm giao nhau mờ (AND). (3.3) O2,i = wi = µAi(x) x µBi (y), i=1,2; Lớp 3: Lớp thứ ba được sử dụng để ước tính tỷ lệ cường độ đốt cháy của những quy tắc thứ i với tổng tất cả các cường độ đốt cháy của quy luật. (dòng) i=1,2; (3.4) Lớp 4: ; (3.5) Khi là đầu ra của lớp 3 và { pi, qi, ri} là tập hợp tham số. Các thông số trong lớp này sẽ là các thông số kết quả. Lớp 5: Lớp cuối cùng tính tổng các đầu ra là tổng của tất cả các tín hiệu đến từ lớp 4. Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Tổng các đầu ra = ; (3.6) 46 Hình 3.1.Cấu trúc ANFIS với hai đầu vào. Hình 3.1 cho thấy cấu trúc của ANFIS.Tối ưu hóa giá trị của các tham số thích nghi rất quan trọng đối với việc hiệu suât của các hệ thống thích nghi. Jang et al. (1997) đã phát triển một thuật toán học lai cho ANFIS, thuật toán này nhanh hơn so với phương pháp lan truyền ngược cổ điển để ước tính giá trị chính xác của các thông số mẫu. Các thuật toán học lai ghép của ANFIS bao gồm hai giai đoạn luân phiên : (1) xuống dốc (giảm độ dốc), giai đoạn mà tính toán các tín hiệu lỗi đệ quy quay lui từ các lớp đầu ra đến các nút đầu vào, và (2) phương pháp bình phương tối thiểu giai đoạn mà phát hiện ra một tập hợp các thông số hiệu suất (tiếp theo) có tính khả thi. Ta nhận thấy rằng, đưa ra các giá trị cố định các yếu tố của các thông số giả thuyết (tiền đề), tổng sản lượng đầu ra có thể được thể hiện như một sự kết hợp tuyến tính của các thông số tiếp theo. Kiến trúc ANFIS không phải là duy nhất.Một số lớp có thể được kết hợp và vẫn cho kết quả tương tự.Trong kiến trúc ANFIS này, có hai lớp thích ứng (1, 4).Lớp 1 có ba thông số sửa đổi (có thể thay đổi được) {ai, bi và ci} liên quan đến đầu vào MFS. Các thông số này được gọi là các thông số tiền đề ( giả thuyết). Lớp 4 cũng có ba sửa đổi {pi, qi và ri} liên quan đến đa Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn thức đầu tiên. 47 Trong luận văn này, việc ước tính sản lượng điện tiêu thụ của tỉnh Bắc Giang được tính toán bằng cách sử dụng hệ suy luận mờ theo các bước như trên dựa trên mạng thích nghi (ANFIS). 3.2.2. Thu thập số liệu Như chúng ta đã biết hệ mờ Anfis sử dụng tập dữ liệu mẫu, trong luận văn này tác giả sử dụng tập dữ liệu sau trên cơ sở số liệu được cung cấp bởi Công ty Điện lực tỉnh Bắc Giang. Theo số liệu của cục thống kê tỉnh Bắc Giang tại tập “Niên giám thống kê tỉnh Bắc Giang 2014” ta có các giá trị thực tế các ngành kinh tế trong giai đoạn ở bảng 3.1. Cùng với kết quả vận hành cung cấp điện trên toàn tỉnh qua các năm của Công ty Điện lực Bắc Giang [9] ta có sự phân tích sự phát triển kinh tế và điện dùng như sau: Bảng 3.1. Điện năng, dân số, giá trị thực tế các ngành kinh tế Bắc Giang STT Năm Dân số Điện tiêu thụ
(GWh) 203,244,901
230,472,278
290,733,782
313,634,948
338,602,136
392,447,069
461,419,549
512,992,411
588,906,056
713,713,458
767,734,510
904,496,786
1,129,808,135
1,312,354,801
1,410,324,555 GDP
(tỷ)
2,321.00
3,245.00
4,892.00
4,998.00
6,576.00
7,565.00
8,861.00
10,549.00
13,496.00
17,315.00
19,515.00
24,345.00
30,338.00
31,243.00
33,111.00 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 1,499,213.00
1,522,807.00
1,536,401.00
1,550,981.00
1,563,500.00
1,579,265.00
1,594,300.00
1,518,771.00
1,554,573.00
1,555,720.00
1,567,557.00
1,579,546.00
1,588,523.00
1,581,656.00
1,568,696.00 48 Bảng 3.2 Nhu cầu điện cho các ngành kinh tế tỉnh Bắc Giang 2000-2014 2000 203,244,901 192,590,419 25,603,755 13.29 2001 230,472,278 216,878,835 56,647,657 26.12 12.61 121.25 2002 290,733,782 275,616,799 51,763,405 18.78 27.08 -8.62 2003 313,634,948 293,290,126 42,547,016 14.51 6.41 -17.80 2004 338,602,136 314,848,701 42,389,021 13.46 7.35 -0.37 2005 392,447,069 360,097,380 55,292,509 15.35 14.37 30.44 2006 461,419,549 428,379,565 78,213,686 18.26 18.96 41.45 2007 512,992,411 480,656,829 101,978,854 21.22 12.20 30.38 2008 588,906,056 552,636,902 123,881,109 22.42 14.98 21.48 2009 713,713,458 634,001,464 166,845,191 26.32 14.72 34.68 2010 767,734,510 654,420,268 220,365,964 33.67 3.22 32.08 2011 904,496,786 783,074,688 285,560,263 36.47 19.66 29.58 2012 1,129,808,135 995,232,390 404,351,715 40.63 27.09 41.60 2013 1,312,354,801 1,175,638,791 515,827,407 43.88 18.13 27.57 2014 1,410,324,555 1,230,945,358 650,242,059 48.25 23.18 30.93 Từ các số liệu đã tổng hợp ở trên, theo niên giám thống kê tỉnh Bắc Giang 2014, ta có hệ số tương quan giữa điện năng với các chỉ tiêu kinh tế Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn được thể hiện trong bảng sau: 49 Bảng 3.3 Hệ số tương quan giữa điện năng với các chỉ tiêu kinh tế Dân số
0,9806 GDP
0,981 SLCN
0,880 N-L-TS
0,874 Khác
0,879 r
Điện Như vậy giữa điện năng dân số và GDP có mức độ tương quan chặt chẽ, nên trong bài toán này ta chọn giá trị GDP và dân số để dự báo điện năng. Dữ liệu đầu vào cần 4 thông số: dân số, GDP, số liệu điện tiêu thụ của năm đó, số liệu điện tiêu thụ năm trước. Vậy ta thiết kế dữ liệu đầu vào là biến a: là mảng 2 chiều gồm 14 dòng dữ liệu, mỗi dòng gồm 4 cột. Ví dụ 1 dòng dữ diệu (dân số 2005, GDP2005, điện 2005, điện2004 ). Bảng 3.4.Tổng hợp dữ liệu đầu vào cho mạng ANFIS STT Năm Dân số
(nghìn) GDP
(tỷ) Điện tiêu thụ
(103xGWh) Điện tiêu thụ
năm trƣớc
(103xGWh) 1 2001 1523 3245 203245 230472 2 2002 1536 4892 230472 290734 3 2003 1551 4998 290734 313635 4 2004 1564 6576 313635 338602 5 2005 1579 7565 338602 392447 6 2006 1594 8861 392447 461420 7 2007 1519 10549 461420 512992 8 2008 1555 13496 512992 588906 9 2009 1556 17315 588906 713713 10 2010 1568 19515 713713 767735 11 2011 1580 24345 767735 904497 12 2012 1589 30338 904497 1129808 13 2013 1582 31243 1129808 1312355 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 14 2014 1569 33111 1312355 1410325 50 3.2.3. Dự báo tiêu thụ điện năng Các thuật toán đãđề xuất được áp dụng cho 14 bộ dữ liệu đó là bộ số liệu về GDP và dân số, lượng điện tiêu thụ của tỉnh Bắc Giang từ năm 2001- 2014. Các thuật toán đãđề xuất được áp dụng cho các tập hợp dữ liệu như sau: Bƣớc 1 Dân số và tổng sản phẩm quốc nội (GDP), số liệu điện tiêu thụ năm trướcđược coi là biến đầu vào của ANFIS trong nghiên cứu này. Bƣớc 2 Đối với các biến đầu vào (dân số và GDP) đãđược xác định ở bước 1 và các biến đầu ra (tiêu thụ điện), các dữ liệu có liên quan được rút ra từ được trình bày trong Bảng 3.1, 3.2 và 3.3 Bƣớc 3 14 dòng dữ liệu được chia thành 14 dữ liệu huấn luyện (2001- 2014).Theo đó, ngoại suy và dự đoán khả năng của ANN phải được tính toán; Do đó, các dữ liệu bộ dữ liệu để sử dụng cho thử nghiệm đã chọn của giai đoạn đó là gần hơn với các năm trước. Bƣớc 4: Hai thông số đãđược xem xét trong việc xây dựng và kiểm tra các mô hình ANFIS hợp lý. Các loại hàm thành viên và số lượng các biến ngôn ngữ là hai thông số nói trên. Sáu hàm thành viên khác nhau được xem xét trong việc xây dựng ANFIS, như sau: Các hàm thành viên được xây dựng bao gồm sự khác biệt giữa dsig, hàm thành viên kết hợp Gaussian (gauss2), hàm thành viên đường cong tích hợp gausian, hàm thành viên tích hợp khái quát hóa gbell, hàm thành viên tích hợp hình psig và hàm thành viên tích hợp hình thang Ngoài ra, số lượng của các biến ngôn ngữ được coi là từ 2 đến 20. Ta sử Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn dụng MATLAB để mô phỏng nghiên cứu này. 51 Bƣớc 5 Các cấu trúc được thể hiện dưới đây có MAPE tối thiểu trong tất cả các cấu trúc khác.Các cấu trúc với MAPE tối thiểu được hiển thị dưới đây.Bảng 3 trình bày các cấu trúc của các mô hình dài hạn. MF là viết tắt của hàm thành viên trong phương pháp ANFIS. Bƣớc 6 Để dự báo với phương pháp ANFIS, cần dự báo các biến độc lập dân số và GDP.Ngoài ra, nghiên cứu trước đây sử dụng chuỗi thời gian để dự báo các biến độc lập [7]. Việc dự báo trong tương lai cho mỗi biến độc lập được thực hiện theo mô hình tự hồi quy đó là một trong những mô hình chính trong lĩnh vực chuỗi thời gian. + Cấu trúc dữ liệu Do thiếu dữ liệu hàng năm AR (1) được coi là mô hình chuỗi thời gian. Do đó, mô hình chuỗi thời gian cho biếnđộc lập xi là: Xi = a Xi-1+b Bƣớc 7: Dự báo tiêu thụ điện trong tương lai Theo cấu trúc dữ liệu, các giá trị của các biến độc lập được nạp vào các ANFISđã chọn như các đầu vào, và sau đó là giá trị sản lượng thu được trong cùng thời kỳ. Sau đó tính toán các giá trị dự báo về tiêu thụ điện ở Bắc Giang. 3.3. Chƣơng trình thử nghiệm và kết quả Qua phân tích số liệu thống kê trong thời gian quá khứ về điện năng tiêu thụ và tốc độ tăng trưởng các thành phần kinh tế, đánh giá mối tương quan với điện năng cho thấy, điện năng tiêu thụ của tỉnh Bắc Giang có quan hệ chặt với tổng thu nhập quốc dân (GDP) và dân số. 3.3.1. Huấn luyện mạng Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Đầu tiên ta tải dữ liệu huấn luyện được thiết lập thành 1 biến a. 52 Hình 3.2. Thiết lập số liệu đầu vào cho bài toán Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Hình 3.3. Lựa chọn hàm thành viên và kết quả dự báo của ANFIS 53 3.3.2. Cấu trúc của anfis Hình 3.4. Cấu trúc của anfisvới bài toán dự báo điện Cấu trúc ANFIS cho bài toán dự báo điện ở đây có 3 đầu vào (input) và
một đầu ra (output), có 3 hàm thành viên cho mỗi đầu vào (input MF), sinh ra
27 luật (Rule) và 27 hàm thành viên cho mỗi đầu ra (output MF). Quá trình tính toán và mờ hóa trong cấu trúc này được thực hiện như sau:
Sử dụng mô hình mờ Sugeno. Khi đó cấu trúc ANFIS là một cấu trúc nơron
gồm 5 lớp, chúng ta có thể biểu thị nút thứ i trong lớp thứ k bằng (k,i) và hàm
nút của nó (dữ liệu xuất của nút) bằng Ok,i O1,i = µAi (x) với i= 1,2,3;
O1,i= µBi-3 (y) với i= 4,5,6;
O1,i= µCi-6 (y) với i= 7,8,9; Lớp 1:
Trong đó: Ai, Bi-3, Ci-6 là các nhãn ngôn ngữ của đầu vào thứ i. µAi , µBi-3 ,µCi-6 là hàm thuộc của các nhãn ngôn ngữ. Lớp 2: Ở lớp thứ 2, tất cả các quy luật tiềm ẩn giữa các yếu tố đầu vào được xây dựng bằng cách áp dụng điểm giao nhau mờ Lớp 3: , trong đó là đầu ra của lớp 3 O2,i = µAi (x) xµBi (x) với i= 1,2,3;
O3,i , trong đó là tập Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Lớp 4:
hợp các tham số 54 Lớp 5: Tổng các đầu ra Hình 3.5. Các luật đƣợc tạo ra bởi Anfis Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 55 Hình 3.7. Mặt suy diễn của hệ ANFIS Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Hình 3.8. Sai số của quá trình huấn luện mạng 56 3.3.3. Kết quả dự báo. Khi so sánh các kết quả dự báo với điện tiêu thụ thực tế qua các năm 2001 đến 2013, ta thấy kết quả dự báo tiệm cận gần đúng với các giá trị thu thập trong thời gian khảo sát. Bảng 3.5. Kết quả số liệu khảo sát và giá trị dự báo: Năm Điện tiêu thụ thực tế
(103xGWh) Điện tiêu thụ dự báo
(103xGWh) 230472 2001 2.37e+003 290734 2002 3.04e+003 313635 2003 2.82e+003 338602 2004 3.51e+003 392447 2005 4.4e+003 461420 2006 4.14e+003 512992 2007 4.37e+003 588906 2008 5.22e+003 713713 2009 7.08e+003 767735 2010 8.05e+003 904497 2011 9.11e+003 1129808 2012 1.13e+004 1312355 2013 1.31e+004 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 1410325 2014 1.41e+004 57 Đánh giá mô hình dự báo Hình 3.3 cho thấy mức độ chẩn đoán của hệ thống, các dữ liệu được đưa vào kiểm tra chính là các mẫu được huấn luyện và hệ thống đã đưa ra các đầu ra gần như sắp xỉ với các mẫu huấn luyện. Hình 3.8 đã chỉ ra sai số của quá trình huấn luyện mạng, điều đó cho thấy việc xấp xỉ hàm dự báo đảm bảo yêu cầu và mô hình ANFIS thể hiện được các hành vi về dữ liệu huấn luyện cũng như dữ liệu kiểm tra. Như vậy, kết quả mức điện dự báo rất gần với mức điện tiêu thụ trong thực tế.Kết quả dự báo của mô hình mạng ANFIS chỉ ra rằng mô hình đề xuất là phù hợp và chính xác để dự báo nhu cầu điện tiêu thụ. Để dự báo điện tiêu thụ cho các năm tiếp theo, ta cần số liệu dân số và GDP của các năm trong tương lai. Vì vậy cần xây dựng ANFIS có cấu trúc 1 đầu vào và 1 đầu ra dựa trên số liệu đã có để huấn luyện mạng dự báo dân số và DGP. Hai hàm dự báo được viết dưới đây nhằm dự báo dân số và chỉ số GDP của các năm tiếp theo. Hàm dự báo dân số: function kq=dudoan_dan(a) input_anfis; fis= genfis1([nam',x1'],3,'trimf'); outfis=anfis([nam',x1'],fis,5); kq=evalfis(a,outfis); end Hàm dự báo GDP: function kq=dudoan_gdp(a) Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn input_anfis; 58 fis= genfis1([nam',x2'],3,'trimf'); outfis=anfis([nam',x2'],fis,5); kq=evalfis(a,outfis); end Trong đó: - Biến “nam” có cấu trúc là mảng 1 chiều có 14 phần tử, giá trị gồm các năm từ 2001 đến 2014. - Biến “x1” là mảng 1 chiều, có 14 phần tử, giá trị các phần tử là dân số các năm từ 2001 đến 2014. - Biến “x2” là mảng 1 chiều, có 14 phần tử, giá trị các phần tử là GDP các năm từ 2001 đến 2014. Giả sử cần dự đoán chỉ số tiêu thụ điện năm 2015, ta gọi 2 hàm Danso2015= dubao_dien(2015); Gdp2015= dubao_gdp(2015); Kết quả được: Danso2015= 1597 (nghìn); Gdp2015= 32257 (tỷ); Dựa vào điện tiêu thụ năm cũ 2014. Áp dụng mạng Anfis đã huấn luyện trên ta được chỉ số tiêu thụ điện năm 2015 là: 152928 x103(GWh) Tương tự, ta có bảng dự báo kết quả điện thiêu thụ các năm 2015,2016,2017 như sau: Bảng 3.6. Dự báo điện các năm 2015, 2016, 2017 Năm Dân số dự báo
(nghìn) GDP dự báo
(tỷ) Điện tiêu thụ dự báo
(103xGWh) 32126 151625 1547 2015 32567 173561 1612 2016 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 33783 196438 1630 2017 59 KẾT LUẬN Trong luận văn này,tác giảđề cập đến một vấn đề đã và đang được nghiên cứu rộng rãi, đó là hệ suy diễn mờ trên cơ sở mạng thích nghi (ANFIS). Đây là một hệ được ứng dụng rất nhiều trong thực tế, đặc biệt là trong các lĩnh vực như dự đoán, phân lớp…Bài toán dự báo sản lượng điện tiêu thụ là một trong những yêu cầu của sự phát triển kinh tế xã hội. Khu vực miền Bắc nói chung và tỉnh Bắc Giang nói riêng cũng nằm trong xu thế phát triển và cần thiết phải dự báo nhiều chỉ tiêu, trong đó có sản lượng điện tiêu thụ. Trong quá trình tìm hiểu và nghiên cứu, được sự giúp đỡ nhiệt tình của PGS.TS Lê Bá Dũng cùng với sự cố gắng của bản thân thì luận văn đãđạt được những kết quả sau: + Nghiên cứu lý thuyết mạng Nơron bao gồm các loại mạng, kiến trúc của chúng, các thuật toán luyện mạng, phân tích được các khả năng hoạt động của chúng. Nghiên cứu lý thuyết lôgic mờ, các hệ mờ thường gặp nhằm làm sáng tỏ quá trình suy luận của một hệ mờ trong thực tế để áp dụng xây dựng một hệ mờ cho dự báo sản lượng tiêu thụ điện. + Tìm hiểu cấu trúc mạng ANFIS, các thuật toán huấn luyện và những ứng dụng rộng lớn trong thực tế đặc biệt là trong bài toán dự báo tiêu thụ điện. +Xây dựng mô hình mạng ANFIS cho bài toán dự báo lượng tiêu thụ điện năng với bađầu vào, một đầu ra. + Thu thập dữ liệu, tiền xử lý dữ liệu phục vụ việc huấn luyện và kiểm tra. +Cài đặt mô hình mạng ANFIS trên môi trường matlab Chương trình thực nghiệm chạy cho kết quả dự đoán khá chính xác.Để có kết quả dự báo chính xác hơn hướng nghiên cứu tiếp theo là: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn + Tiếp tục nghiên cứu xây dựng hệ ANFIS có nhiều đầu ra 60 +Phân tích dữ liệu loại bỏ những mẫu dữ liệu cực đoan để có được tập dữ liệu tốt phục vụ huấn luyện. Do thời gian và năng lực còn hạn chế, tác giả luận văn kính mong sự chỉ bảo và đóng góp ý kiến của các Thầy Cô và các bạn để luận văn đạt kết quả tốt hơn. Cuối cùng, tác giả xin chân thành cảm ơn PGS.TS. Lê Bá Dũng, Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn người đã tận tình hướng dẫn trong suốt thời gian thực hiện đề tài! 61 TÀI LIỆU THAM KHẢO * Tiếng Việt: [1] Nguyễn Đình Thúc,Mạng nơ ron - Kỹ thuật lan truyền ngược, Nhà xuất bản khoa học kỹ thuật, 2000. [2] Phan Xuân Minh, Nguyễn Doãn Phước, Lý thuyết điều khiển mờ, NXB Khoa học và kỹ thuật, 2002. [3] Bùi Công Cường, Nguyễn Doãn Phước, Hệ thống mạng Nơron mờ và ứng dụng, NXB Khoa học và Công nghệ, 2006. [4] Nguyễn Như Hiền, Lại Khắc Lãi, Hệ mờ và mạng nơ-ron trong kỹ thuật điều khiển, NXB Khoa học tự nhiên và Công nghệ, 2007 [5] Lê Bá Dũng, Bài giảng mạng Nơron và ứng dụng lớp Cao học Thái Nguyên, 2012. * Tiếng Anh: [6] C.T. Lin and C.S.G. Lee, Neural Fuzzy Systems, Prentice Hall, London, 1996. [7] Ali Azadeh, Morteza Saberi, Vahid Nadimi, Mino Iman, Alireza Behrooznia, An Integrated Intelligent Neuro-Fuzzy Algorithm for Long- Term Electricity Consumption: Case of Selected EU Countries, Acta Polytechnica Hungarica, Vol.7, No.4, 2010. [8]. Takagi, T., Sugeno, M. (1985) Fuzzy Identification of Systems and its Application to Modeling and Control. IEEE Transactions on Systems, Man and Cybernetics 15(1), 116-132. * Trang web: [9] http://www.bacgiangintrade.gov.vn/ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn [10] http://www.ebook.edu.vn/ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 62Năm
Điện nhận
(kWh)
Điện T. Phẩm
(kWh)
CN-XD
(kWh)
Tỷ trọng
CNXD(%)
hàng năm
Tốc độ
tăng
trƣởng
TP
Tốc độ
tăng
trƣởng
CN
Hình 3.6. Hệ luật mờ đƣợc sinh ra trong quá trình huấn luyện mạng