i
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ
TRUYỀN THÔNG
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
HỌC VIÊN: TRẦN XUÂN HƢNG
NGƢỜI HƢỚNG DẪN: TS. NGUYỄN CÔNG ĐIỀU
ĐỀ TÀI: CÁC PHƢƠNG PHÁP TÍNH TOÁN TRONG SỰ
BÁO CHUỖI THỜI GIAN MỞ
THÁI NGUYÊN, 2015
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn
ii
MỤC LỤC
MỞ ĐẦU .................................................................................................................... 1
CHƢƠNG 1 ................................................................................................................ 5
MỘT SỐ KHÁI NIỆM VỀ LÝ THUYẾT TẬP MỜ ................................................ 5
1.1 Lý thuyết tập mờ ................................................................................................ 5
1.1.1 Định nghĩa tập mờ ....................................................................................... 5
1.2.2 Suy luận xấp xỉ và suy diễn mờ ................................................................ 17
1.3.1 Bộ mờ hoá ................................................................................................ 22
1.3.2 Hệ luật mờ ............................................................................................... 22
1.3.4 Bộ giải mờ................................................................................................ 24
CHƢƠNG 2 .............................................................................................................. 26
MÔ HÌNH CHUỖI THỜI GIAN MỜ VÀ CÁC THUẬT TOÁN CƠ BẢN .......... 26
2.1 Các kiến thức cơ bản về chuỗi thời gian ........................................................... 26
2.1.2 Tính chất của chuỗi thời gian .................................................................... 26
2.1.2.1 Tính dừng ........................................................................................... 26
2.1.2.2 Tuyến tính........................................................................................... 27
2.1.2.3 Tính xu hướng .................................................................................... 28
2.1.2.4 Tính mùa vụ ........................................................................................ 28
2.1.3 Phân loại chuỗi thời gian ........................................................................... 28
2.1.3.1 Chuỗi thời gian tuyến tính .................................................................. 29
2.1.3.2 Chuỗi thời gian phi tuyến ................................................................... 29
2.1.3.3 Chuỗi thời gian đơn biến .................................................................... 29
2.1.3.4 Chuỗi thời gian đa biến ...................................................................... 30
2.1.3.5 Chuỗi thời gian hỗn loạn .................................................................... 30
2.1.4 Mô hình chuỗi thời gian ........................................................................... 31
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn
iii
2.2 Chuỗi thời gian mờ ......................................................................................... 31
2.2.1 Khái niệm ................................................................................................. 31
2.2.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ ................................ 32
2.3 Một số thuật toán trong mô hình chuỗi thời gian mờ ....................................... 33
2.3.1 Các phương pháp chia khoảng .................................................................. 33
2.3.1.1 Phương pháp lựa chọn ngẫu nhiên .................................................... 34
2.3.1.2 Phương pháp độ dài dựa trên sự phân bố giá trị ............................... 34
2.3.1.3 Phương pháp độ dài dựa trên giá trị trung bình ................................ 35
2.3.1.4 Phương pháp dựa trên mật độ ........................................................... 35
2.3.2 Mô hình thuật toán của Song và Chissom ..................................................... 35
2.3.3 Mô hình thuật toán của Chen ......................................................................... 36
2.3.4 Mô hình chuỗi thời gian mờ đơn giản của Singh .......................................... 37
2.3.5 Mô hình chuỗi thời gian mờ bậc cao của Singh ............................................. 40
CHƢƠNG 3 .............................................................................................................. 44
ỨNG DỤNG TRONG TÍNH TOÁN THỬ NGHIỆM ............................................ 44
3.1 Ứng dụng trong dự báo ................................................................................... 44
3.1.1 Dự báo mức tiêu thụ điện bằng mô hình đơn giản của Singh .................... 44
3.1.2 So sánh kết quả dự báo của phương pháp Singh đơn giản và bậc cao với các
phương pháp khác .............................................................................................. 51
3.2 Đồ thị so sánh kết quả . ................................................................................... 53
3.2.1 Đồ thị so sánh của Chen và Singh đơn giản ............................................... 53
3.2.2 Đồ thị so sánh Chen với Singh bậc cao ..................................................... 55
KẾT LUẬN .............................................................................................................. 56
PHỤ LỤC ................................................................................................................. 58
Chƣơng trình: .......................................................................................................... 58
Singh đơn giản ....................................................................................................... 58
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn
iv
Singh bậc cao ......................................................................................................... 62
Tài liệu tham khảo ................................................................................................... 69
DANH MỤC HÌNH VẼ
Hình 1.1 Hàm thuộc μA(x) có mức chuyển đổi tuyến tính. ............................................ 6
Hình 1.2 Hàm thuộc của tập B. ................................................................................... 7
Hình 1.3 Miền xác định và miền tin cậy của tập mờ A. ............................................... 8
Hình 1.4 Biểu diễn tập mờ chiều cao. ......................................................................... 9
Hình 1.5 Tập bù
của tập mờ A. ............................................................................... 10
Hình 1.6 Hợp hai tập mờ có cùng tập vũ trụ. ............................................................. 11
Hình 1.7 Giao hai tập mờ có cùng tập vũ trụ. ............................................................ 11
Hình 1.8 Biểu diễn theo biểu đồ Sagittal .................................................................... 16
Hình 1.9 Cấu hình cơ bản của hệ mờ ......................................................................... 22
DANH MỤC BẢNG
Bảng 1.1 Biểu diễn tập mờ A....................................................................................... 7
Bảng 1.2 Một số phép kéo theo mờ thông dụng .......................................................... 13
Bảng 2.1 Ánh xạ cơ sở ............................................................................................... 34
Bảng 3.1 Số liệu mức độ tiêu thụ điện tại trường Cao đẳng Y tế Phú Thọ .................. 44
Bảng 3.2 Phân bố giá trị trong từng khoảng .............................................................. 46
Bảng 3.3 Phân khoảng ............................................................................................... 47
Bảng 3.4 Mối quan hệ mờ .......................................................................................... 48
Bảng 3.5 Nhóm mối quan hệ mờ ............................................................................... 49
Bảng 3.6 Kết quả dự báo của Chen ............................................................................ 50
Bảng 3.7 Bảng so sánh kết quả dự báo ...................................................................... 51
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn
v
DANH MỤC BIỂU ĐỒ
Biểu đồ 3.1 Biểu đồ so sánh 1 .................................................................................... 54
Biểu đồ 3.2 Biểu đồ so sánh 2 .................................................................................... 55
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.ltc.tnu.edu.vn
1
MỞ ĐẦU
Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để
phân tích số liệu trong kinh tế, xã hội cũng như trong nghiên cứu khoa học.
Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều tác giả đã đề
xuất các công cụ phân tích chuỗi thời gian để trích xuất ra những thông tin
quan trọng tờ trong các dãy số liệu.
Trước đây, phương pháp chủ yếu để phân tích chuỗi thời gian là sử dụng
các công cụ của thống kê như hồi qui, phân tích Fourie và một vài công cụ
khác. Nhưng hiệu quả nhất có lẽ là phương pháp sử dụng mô hình ARIMA
của Box-Jenkins. Mô hình này đã cho một kết quả khá tốt trong phân tích dữ
liệu và đang được sử dụng rất rộng rãi trong thực tế. Tuy nhiên trong một số
lĩnh vực nhất là trong kinh tế, mô hình ARIMA chưa thể hiện tính hiệu quả vì
chuỗi số liệu diễn biến mang tính chất phi tuyến. Do đó để dự báo chuỗi thời
gian trong kinh tế, người ta phải có những cải biên như sử dụng mô hình
ARCH. Tuy vậy vẫn còn khá nhiều hạn chế khi áp dụng mô hình này khi
chuỗi số liệu ngắn và có nhiều biến động mang tính chất phi tuyến.
Để vượt qua được những khó khăn trên, gần đây nhiều tác giả đã sử dụng
mô hình chuỗi thời gian mờ. Khái niệm tập mờ được Zadeh đưa ra từ năm
1965 và ngày càng tìm được ứng dụng trong nhiều lĩnh vực khác nhau nhất là
trong điều khiển và trí tuệ nhân tạo. Trong lĩnh vực phân tích chuỗi thời gian,
Song và Chissom [1-3] đã đưa ra khái niệm chuỗi thời gian mờ không phụ
thuộc vào thời gian (chuỗi thời gian dừng) và phụ thuộc vào thời gian (không
dừng) để dự báo. Chen [4] đã cải tiến và đưa ra phương pháp mới đơn giản và
hữu hiệu hơn so với phương pháp của Song và Chissom. Trong phương pháp
của mình, thay vì sử dụng các phép tính tổ hợp Max-Min phức tạp, Chen đã
tính toán bằng các phép tính số học đơn giản để thiết lập các mối quan hệ mờ.
Phương pháp của Chen cho hiệu quả cao hơn về mặt sai số dự báo và giảm độ
phức tạp của thuật toán.
2
Từ các công trình ban đầu về chuỗi thời gian mờ được xuất hiện năm
1993, hiện nay mô hình này đang được sử dụng để dự báo trong rất nhiều lĩnh
vực của kinh tế hay xã hội như giáo dục để dự báo số sinh viên nhập trường
[2], [4] hay trong lĩnh vực dự báo thất nghiệp, dân số , chứng khoán và trong
đời sống như dự báo mức tiêu thụ điện, hay dự báo nhiệt độ của thời tiết...
Tuy nhiên xét về độ chính xác của dự báo, các thuật toán trên cho kết quả
chưa cao. Để nâng cao độ chính xác của dự báo, một số thuật toán cho mô
hình chuỗi thời gian mờ liên tiếp được đưa ra. Chen [5] đã sử dụng mô hình
bậc cao của chuỗi thời gian mờ để tính toán. Sah và Degtiarev thay vì dự báo
chuỗi thời gian đã sử dụng chuỗi thời gian là hiệu số bậc nhất để nâng cao độ
chính xác và làm giảm độ phi tuyến.
Trong thời gian gần đây có khá nhiều cải tiến được các nhà nghiên cứu
trên thế giới đưa ra để cải tiến độ chính xác của mô hình theo nhiều hướng
khác nhau. Chen (2002) dựa trên mô hình trước đây đã đưa ra mô hình chuỗi
thời gian mờ bậc cao và ứng dụng trong dự báo. Huarng (2001) đã nghiên cứu
ảnh hưởng của độ dài khoảng lên độ chính xác của mô hình và đã đề xuất ra
hai phương pháp chia khoảng là phân chia dựa trên phân bố và dựa trên giá trị
trung bình. Tiếp theo hướng phát triên này, Huarng và Yu (2006), Chen và
Chung (2006), Kuo (2008) đã tập trung vào việc phân chia khoảng để nâng
cao độ chính xác của mô hình. Chen và Chung (2006) đã sử dụng giải thuật
gen để điều chỉnh độ dài của khoảng cho mô hình bậc một và bậc cao của
chuỗi thời gian mờ. Li và Cheng (2008) đã sử dụng thuật toán c-mean mờ
cũng cho mục đích này. Cuối cùng là Kuo và các tác giả khác (2008) đã đề
xuất thuật toán dựa trên phương pháp tối ưu đám đông để cải tiến cách xây
dựng độ dài của khoảng.
Một hướng khác là sử dụng các cấu trúc khác nhau về mối quan hệ logic
mờ để xây dựng các luật dự báo. Yu (2005) đã chú ý đến tính lặp lại của các
tập mờ trong nhóm quan hệ logic mờ để gán tầm quan trọng của chúng bằng
3
các giá trị trọng số của mỗi lần lặp. Dieu N.C. (2010) đã chú ý đến yếu tố thời
gian trong nhóm quan hệ logic mờ của Yu và đề xuất khái niệm nhóm quan
hệ logic mờ phụ thuộc thời gian và ứng dụng trong dự báo.
Như đã trình bày ở trên, mô hình chuỗi thời gian mờ đang có nhiều
ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự báo của các phương
pháp đề xuất còn chưa cao. Do đó việc tìm tòi các mô hình có độ chính xác
cao hơn và thuật toán đơn giản hơn đang là một ưu tiên. Trong những năm
gần đây một số công trình đã được hoàn thành theo hướng nâng cao độ chính
xác và giảm khối lượng tính toán trong mô hình chuỗi thời gian mờ như các
công trình của Chen và Hsu, Huarng, Singh,... Mô hình chuỗi thời gian mờ
bậc cao đã được xem xét nhiều và được coi là một công cụ đắc lực để nâng
cao hiệu quả tính toán. Cách tiếp cận khác là sử dụng mô hình chuỗi thời gian
mờ bậc cao hai nhân tố đã được một số tác giả nghiên cứu hứa hẹn thu được
nhiều kết quả tốt. Trong số các phương pháp cải tiến, mô hình của Singh đáng
quan tâm chủ yếu đơn giản trong thuật toán nhưng cho hiệu quả cao trong
thực tế. Đặc biệt các thuật toán đưa ra trong mô hình này rất thuận tiện cho
việc lập trình.
Với mục tiêu tìm hiểu về việc sử dụng mô hình chuỗi thời gian mờ trong
dự báo, em đã lựa chọn đề tài “Các phƣơng pháp tính toán trong dự báo
chuỗi thời gian mờ” mà trọng tâm là các mô hình tính toán của Singh. Các
mô hình này đặt trọng tâm là xây dựng các công cụ tính toán khá đơn giản để
dự báo và mô hình được xét cả mô hình chuỗi thời gian mờ bậc nhất và bậc
cao. Sau đó em sử dụng các mô hình này để dự báo “mức độ tiêu thụ điện
tại trƣờng cao đẳng Y tế Phú Thọ” làm minh họa cho tính hiệu quả của các
mô hình đã đề xuất trong luận văn tốt nghiệp của mình.
Với Mục tiêu trên, nội dung của đề tài là tìm hiểu và nghiên cứu những
khái niệm, tính chất và thuật toán trong mô hình chuỗi thời gian mờ và đặt
trọng tâm vào tìm hiểu Các phƣơng pháp tính toán trong dự báo chuỗi
4
thời gian mờ của Singh và thử nghiệm tính hiệu quả của mô hình trong dự
báo mức độ tiêu thụ điện tại trƣờng cao đẳng Y tế Phú Thọ. Luận văn
được chia làm 3 chương:
Chương 1: Một số khái niệm về lý thuyết tập mờ.
Chương 2: Mô hình chuỗi thời gian mờ và các thuật toán cơ bản.
Chương 3: Ứng dụng trong tính toán thử nghiệm.
Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS
Nguyễn Công Điều, em xin bày tỏ lòng biết ơn chân thành của mình đối với
thầy. Em xin chân thành cảm ơn các thầy, cô giáo Viện Công nghệ thông tin,
Trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái
Nguyên đã tham gia giảng dạy, giúp đỡ em trong suốt quá trình học tập nâng
cao trình độ kiến thức.
Tuy nhiên vì điều kiện thời gian và khả năng có hạn nên luận văn không
thể tránh khỏi những thiếu sót. Em kính mong các thầy cô giáo và bạn đóng
góp ý kiến để đề tài được hoàn thiện hơn.
5
CHƢƠNG 1
MỘT SỐ KHÁI NIỆM VỀ LÝ THUYẾT TẬP MỜ
Trong các bộ môn toán cơ bản, suy luận logic nguyên thuỷ hay logic
rõ với hai giá trị đúng/sai hay 1/0 đã rất quen thuộc. Tuy nhiên, các suy
luận này không đáp ứng được hầu hết các bài toán phức tạp nảy sinh
trong thực tế như những bài toán trong lĩnh vực điều khiển tối ưu, nhận
dạng hệ thống,… mà các dữ liệu không đầy đủ, không được định nghĩa
một cách rõ ràng. Trong những năm cuối thập kỷ 20, một ngành khoa
học mới đã được hình thành và phát triển mạnh mẽ đó là hệ mờ. Đây là
hệ thống làm việc với môi trường không hoàn toàn xác định, với các
tham số, các chỉ tiêu kinh tế kỹ thuật, các dự báo về môi trường sản
xuất kinh doanh chưa hoặc khó xác định một cách thật rõ ràng, chặt chẽ.
Khái niệm logic mờ được giáo sư Lofti A.Zadeh đưa ra lần đầu tiên vào
năm 1965 tại Mỹ. Từ đó lý thuyết mờ đã được phát triển và ứng dụng
rộng rãi.
Chương này tập trung trình bày một số kiến thức cơ bản về hệ mờ có
liên quan tới mô hình chuỗi thời gian mờ sẽ được đề cập tới ở chương sau.
1.1 Lý thuyết tập mờ
1.1.1 Định nghĩa tập mờ
Tập mờ A xác định trên tập vũ trụ X là một tập mà mỗi phần tử của nó là một
cặp các giá trị (x,μA(x)), trong đó x X và μA là ánh xạ:
μA : X [0,1]
Ánh xạ μA đƣợc gọi là hàm thuộc hoặc hàm liên thuộc (hoặc hàm thành
viên - membership function) của tập mờ A. Tập X được gọi là cơ sở của tập
mờ A.
6
μA(x) là độ phụ thuộc, sử dụng hàm thuộc để tính độ phụ thuộc của một
phần tử x nào đó, có hai cách:
Tính trực tiếp nếu μA(x) ở dạng công thức tường minh.
Tra bảng nếu μA(x) ở dạng bảng.
Kí hiệu:
A = { (μA(x)/x) : x X }
Các hàm thuộc μA(x) có dạng “trơn” được gọi là hàm thuộc kiểu S. Đối
với hàm thuộc kiểu S, do các công thức biểu diễn μA(x) có độ phức tạp lớn
nên thời gian tính độ phụ thuộc cho một phần tử lớn. Trong kỹ thuật điều
khiển mờ thông thường, các hàm thuộc kiểu S thường được thay gần đúng
bằng một hàm tuyến tính từng đoạn.
Một hàm thuộc có dạng tuyến tính từng đoạn được gọi là hàm thuộc có
mức chuyển đổi tuyến tính.
Hình 1.1 Hàm thuộc μA(x) có mức chuyển đổi tuyến tính.
Hàm thuộc như trên với m1 = m2 và m3 = m4 chính là hàm thuộc của một tập
vũ trụ
Ví dụ 1.1
Một tập mờ B của các số tự nhiên nhỏ hơn 5 với hàm thuộc μB(x) có
dạng như Hình 1.2 định nghĩa trên tập vũ trụ X sẽ chứa các phần tử sau:
7
B = {(1,1),(2,1),(3,0.95),(4,0.7)}
Hình 1.2 Hàm thuộc của tập B.
Các số tự nhiên 1, 2, 3 và 4 có độ phụ thuộc như sau:
μB(1) = μB(2) = 1, μB(3) = 0.95, μB(4) = 0.7
Những số không được liệt kê đều có độ phụ thuộc bằng 0.
Ví dụ 1.2
Xét X là tập các giá trị trong thang điểm 10 đánh giá kết quả học tập
của học sinh về môn Toán, X = {1, 2, …, 10}. Khi đó khái niệm mờ về năng
lực học môn toán giỏi có thể được biểu thị bằng tập mờ A sau:
A = 0.1/4 + 0.2/5 + 0.4/6 + 0.7/7 + 0.9/8 + 1.0/9 +1.0/10
Trong trường hợp tập mờ rời rạc ta có thể biểu diễn tập mờ ở dạng
Bảng 1.1 Biểu diễn tập mờ A
bảng. Chẳng hạn, đối với tập mờ A ở trên ta có bảng như sau:
X 1 2 3 4 5 6 7 8 9 10
A 0 0 0 0.1 0.2 0.4 0.7 0.9 1.0 1.0
1.1.2 Một số khái niệm cơ bản của tập mờ
8
Miền xác định: Biên giới tập mờ A, ký hiệu là supp(A), là tập rõ gồm các
phần tử của X có mức độ phụ thuộc của x vào tập mờ A lớn hơn 0.
supp(A) = { x | μA(x) > 0 }
Miền tin cậy: Lõi tập mờ A, ký hiệu là core(A), là tập rõ gồm các phần tử của
X có mức độ phụ thuộc của x vào tập mờ A bằng 1.
core(A) = { x | μA(x) = 1}
Hình 1.3 Miền xác định và miền tin cậy của tập mờ A.
h(A)=Sup μA(x) x X
Độ cao tập mờ: Độ cao tập mờ A, ký hiệu: h(A), là mức độ phụ thuộc cao
nhất của x vào tập mờ A.
Một tập mờ có ít nhất một phần tử có độ phụ thuộc bằng 1 được gọi là tập mờ
chính tắc, tức là h(A) = 1, ngược lại một tập mờ A với h(A) < 1 được gọi là
tập mờ không chính tắc.
1.1.3 Biểu diễn tập mờ
Tập mờ A trên tập vũ trụ X là tập mà các phần tử x X với mức độ phụ thuộc
của x vào tập mờ A tương ứng. Có ba phương pháp biểu diễn tập mờ: phương
pháp ký hiệu, phương pháp tích phân và phương pháp đồ thị.
9
Phương pháp ký hiệu: Liệt kê các phần tử và các thành viên tương ứng theo
ký hiệu.
Cho X = {x1, x2, …,xn} là tập hữu hạn:
Phương pháp tích phân: với X là tập vô hạn ta thường dùng ký hiệu sau:
Lưu ý rằng các biểu thức trên chỉ có tính hình thức, các phép cộng +, phép
tổng và phép lấy tích phân đều không có nghĩa theo quy ước thông thường.
Tuy nhiên cách biểu diễn như vậy sẽ rất tiện dụng khi định nghĩa và thao tác
các phép tính trên các tập mờ sau này.
Phương pháp đồ thị:
Hình 1.4 Biểu diễn tập mờ chiều cao.
1.1.4 Các phép toán trên tập mờ
1.1.4.1 Phần bù của một tập mờ
Cho tập mờ A trên tập vũ trụ X, tập mờ bù của A là tập mờ , hàm thuộc
được tính từ hàm thuộc μA(x)
10
Hình 1.5 Tập bù
của tập mờ A.
a) Hàm thuộc của tập mờ A.
b) Hàm thuộc của tập mờ .
Một cách tổng quát để tìm từ μA(x), ta dùng hàm bù c :[0,1] [0,1] như
sau:
1.1.4.2 Hợp của các tập mờ
Cho tập mờ A, B trên tập vũ trụ X, tập mờ hợp của A và B là một tập mờ, ký
hiệu là C = A B .
Theo phép chuẩn ta có μC(x)từ các hàm thành viên μA(x), μB(x) như sau:
μC(x) = μA B(x) = max[μA(x), μB(x)], xX
11
Hình 1.6 Hợp hai tập mờ có cùng tập vũ trụ.
Một cách tổng quát ta dùng hàm hợp u : [0,1]x[0,1] [0,1]. Hàm thành viên
μC(x) có thể được suy từ hàm thành viên μA(x) , μB(x) như sau:
μC(x) = u(μA(x), μB(x))
1.1.4.3 Giao của các tập mờ
Cho A, B là hai tập mờ trên tập vũ trụ X, tập mờ giao của A và B cũng là một
tập mờ, ký hiệu: I = A B .
Theo phép giao chuẩn ta có μI(x) từ các hàm thành viên μA(x) , μB(x):
μI(x) = μA B(x) = min[μA(x), μB(x)], xX
Hình 1.7 Giao hai tập mờ có cùng tập vũ trụ.
Một cách tổng quát ta dùng hàm giao i : [0,1]x[0,1] [0,1]. Hàm thành viên
μI(x) có thể được suy từ hàm thành viên μA(x) , μB(x)như sau:
μI(x) = i(μA(x), μB(x))
12
1.1.4.4 Tích Descartes các tập mờ
Cho Ai là các tập mờ trên tập vũ trụ Xi, i = 1, 2, …, n. Tích Descartes của các
, là một tập mờ trên tập vũ tập mờ Ai , ký hiệu là A1 × A2 ×…× An hay
trụ X1 ×X2 ×…× Xn được định nghĩa như sau:
A1 × A2 ×…× An=
Ví dụ 1.3
Cho X1 = X2 = {1, 2, 3} và 2 tập mờ
A = 0,5/1 + 1,0/2 + 0,6/3 và B = 1,0/1 + 0,6/2
Khi đó:
A × B = 0,5/(1,1) + 1,0/(2,1) + 0,6/(3,1) + 0,5/(1,2) + 0,6/(2,2) + 0,6/(2,3)
Một ví dụ ứng dụng của tích Descartes là kết nhập (aggregation) các thông tin
mờ về các thuộc tính khác nhau của một đối tượng. Ví dụ trong các hệ luật
của các hệ trợ giúp quyết định hay hệ chuyên gia, hệ luật trong điều khiển
thường có các luật dạng sau đây:
Nếu x1 là A1 và x2 là A2 và… và xn là An thì y là B
Trong đó, các xi là các biến ngôn ngữ (vì giá trị của nó là các ngôn ngữ được
xem như là nhãn của các tập mờ) và Ai là các tập mờ trên tập vũ trụ Xi của
biến xi. Hầu hết các phương pháp giải liên quan đến các luật “nếu - thì” trên
đều đòi hỏi việc tích hợp các dữ liệu trong phần tiền tố “nếu” nhờ toán tử kết
nhập, một trong những toán tử như vậy là lấy tích Descartes A1 × A2 ×…×An .
1.1.4.5 Phép kéo theo
Cho (T, S, n) là một bộ ba DeMorgan với n là phép phủ định, phép kéo theo lS(x,y) hay xy được xác định trên khoảng [0,1]2 được định nghĩa bằng biểu thức sau đây:
ls(x,y) = S(T(x,y),n(x))
13
Bảng dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử dụng nhất :
Bảng 1.2 Một số phép kéo theo mờ thông dụng
STT
Tên
Biểu thức xác định
Early Zadeh
1
xy = max(1-x,min(x,y))
Lukasiewicz
2
xy = min(1,1- x+y)
3 Mandani
xy = min(x,y)
Larsen
4
xy = x.y
Standard Strict
5
xy =
Godel
6
xy =
7
Gaines
xy =
8
Kleene – Dienes
xy = max(1 –x,y)
9
Kleene – Dienes –Lukasiwicz xy = 1- x + y
10 Yager
xy = yx
1.1.4.6 Tính chất của các phép toán trên tập mờ
Như các phép toán trên tập rõ, các phép toán trên tập mờ cũng có một số tính
chất sau đối với các tập mờ A, B, C trên tập vũ trụ X:
Giao hoán:
A B= B A
14
A B= B A
Kết hợp:
A ( B C) = (A B) C
A (B C) = (A B) C
Phân bố:
A ( B C) =( A B) (A C)
A (B C) = (A B) (A C)
Đẳng trị:
A A = A
A A = A
Đồng nhất:
A X = A
A =
Hấp thụ:
A =
A X = X
Cuộn xoắn:
Bắc cầu:
A B, B C A C
1.2 Các quan hệ và suy luận xấp xỉ, suy diễn mờ
1.2.1 Quan hệ mờ
1.2.1.1 Định nghĩa quan hệ mờ
15
Quan hệ mờ R trên các tập X và Y là một tập mờ xác định trên tập tích của các
tập vũ trụ X ×Y . Các phần tử (x, y) của tập X ×Y có các mức độ thành viên lên
quan hệ khác nhau. Ta có:
µR:X × Y [0,1]
Mức độ thành viên µR (x, y) chỉ mức quan hệ giữa các phần tử x và y của các
tập vũ trụ X và Y lên quan hệ R hay mức độ quan hệ của các phần tử x và y
theo ý nghĩa quan hệ đã định.
Quan hệ mờ có thể được biểu diễn dưới các dạng: hàm thành viên, ma trận
quan hệ, biểu đồ Sagittal.
Ví dụ 1.4
Cho tập X gồm các thành phố NewYork – N, Paris – P:
X = N, P
Cho tập Y gồm các thành phố NewYork – N, Bắc kinh – B, London – L:
Y = N, B, L
Gọi R là quan hệ mờ “rất xa” giữa các thành phố của tập X và các thành phố
của tập Y, được biểu diễn theo hàm thành viên:
R(X, Y) =1/ 0.3/ Quan hệ có thể liệt kê như sau: Biểu diễn theo ma trận quan hệ: R = [r x, y] 16 Biểu diễn theo biểu đồ Sagittal: 1.2.1.2 Liên kết mờ Cho ba tập X, Y, Z, xét quan hệ mờ P trên tập X ×Y và quan hệ mờ Q trên tập Y × Z . Liên kết mờ J của P và Q được kí hiệu P*Q là quan hệ mờ trên tập tích X × Y × Z : µj: X×Y×Z[0,1] Hàm thuộc của liên kết mờ định bởi các hàm thuộc của các quan hệ thành phần µP và µQ qua các luật liên kết: Luật liên kết cực tiểu - Min: µJ (x, y, z) = Min[µP (x, y), µQ ( y, z)] Luật liên kết tích - Prod: µJ (x, y, z) = [µP (x, y) × µQ ( y, z)] Chú ý rằng khi dùng các luật liên kết khác nhau, kết quả liên kết mờ sẽ khác nhau. 17 1.2.1.3 Hợp thành mờ Định nghĩa: Cho ba tập X, Y, Z, xét quan hệ mờ P trên tập X ×Y và quan hệ mờ Q trên tập Y ×Z . Quan hệ mờ R trên tập X × Z được hợp thành từ các quan hệ P và Q, ký hiệu: R = P Q với: µR (x,z ) = Max µJ (x, y, z ) y Y Với luật liên kết cực tiểu ta có luật hợp thành Max – Min: µR (x,z ) = Max µJ (x, y, z ) y Y = MaxMin[µP(x, y), µQ( y, z)] y Y Với luật liên kết tích ta có luật hợp thành Max – Prod: µR (x,z )= Max µJ (x,y,z ) y Y = MaxMin[µP(x, y) × µQ( y, z)] y Y 1.2.1.4 Toán tử hợp thành Ta xây dựng toán tử hợp thành "" nhằm hợp thành các quan hệ mờ theo các ma trận quan hệ. Xét ma trận quan hệ mờ R trên tập tích X ×Y (R= [ rxy ] ), ma trận quan hệ mờ S trên tập tích Y × Z (S= [syz ] ). Ma trận quan hệ hợp thành T của R và S có thể tìm được từ các ma trận R và S qua một phép nhân ma trận đặc biệt: T = R S =[ txz] [ txz] = [ rxy ] [syz ] Lưu ý: Với luật hợp thành max – min: Phép nhân trong ma trận bình thường thay bởi phép toán cực tiểu và phép cộng trong ma trận bình thường thay bởi phép toán cực đại. Với luật hợp thành max – prod: phép nhân trong ma trận bình thường vẫn giữ chỉ thay phép cộng trong ma trận bình thường bởi phép toán cực đại. 1.2.2 Suy luận xấp xỉ và suy diễn mờ 18 Suy diễn mờ là suy diễn từ mệnh đề điều kiện. Luật suy diễn ở logic cổ điển dựa trên các mệnh đề hằng đúng. Các luật suy diễn này được tổng quát hóa ở logic mờ để ứng dụng cho các suy luận xấp xỉ. Có các luật suy diễn thường gặp: - Luật Modus Ponens - Luật Modus Tollens Các luật suy diễn này còn gọi là các luật suy diễn hợp thành vì sử dụng toán tử hợp thành trong suy diễn. 1.2.2.1 Luật suy diễn mờ Modus Ponens Suy diễn mờ từ luật Modus Ponens có dạng sau: Luật: Nếu U là A, thì V là B Sự kiện: U là A’ ------------------------------------- Kết luận: V là B’? Trong đó: U, V là các biến trên X, Y. A, A’ là các tập mờ trên X. B, B’ là các tập mờ trên Y. Từ mệnh đề “Nếu U là A, thì V là B” ta có quan hệ R : X ×Y [0,1] định bởi các tập mờ A và B như sau: µR (x, y) =J(µA (x), µB (y)) Trong đó J là một hàm kéo theo mờ. Tập mờ B’ có thể xác định từ quan hệ R và tập mờ A’ qua một phép hợp thành: B’ = A’ R (2.2) Vậy tập mờ đầu ra B’ được suy diễn từ phép hợp thành của tập mờ đầu vào A’ và quan hệ R. Hàm thành viên của B’ theo phép hợp thành tổng quát Sup i: 19 µB’ ( y) =Sup xX i[µA’(x), µA(x, y)] (2.3) = Sup xX i[µA’(x),J(µA(x),µB( y))] Để chọn hàm kéo theo J, luật suy diễn mờ Modus Ponens dựa vào luật suy diễn Modus Ponens cổ điển: [(A B A] B Trong biểu thức (2.2), theo luật suy diễn Modus Ponens cổ điển, nếu A’=A thì B’=B, biểu thức trở thành: B = A R Biểu thức (2.3) trở thành: = Sup xX i[µA’(x),J(µA(x),µB( y))] 1.2.2.2 Luật suy diễn mờ Modus Tollens Luật suy diễn mờ Modus Tollens hay luật suy diễn Modus Tollens tổng quát có dạng sau: Luật: Nếu U là A, thì V là B Sự kiện: V là B’ ------------------------------------ Kết luận: U là A’? Trong đó: U, V là các biến trên X, Y. A, A’ là các tập mờ trên X. B, B’ là các tập mờ trên Y. Từ mệnh đề “Nếu U là A, thì V là B” ta có quan hệ R : X × Y [0,1] định bởi các tập mờ A và B như sau: µR (x, y) =J(µA (x), µB (y)) Trong đó J là một hàm kéo theo mờ. Tập mờ A’ có thể xác định: 20 A’ = B’ R (2.4) Vậy tập mờ đầu ra A’ được suy diễn từ phép hợp thành của tập mờ đầu vào B’ và quan hệ R. Hàm thành viên của B’ theo phép hợp thành tổng quát Sup i: µA’ ( y) =Sup xY i[µB’(x), µR(x, y)] (2.5) = Sup xY i[µB’(x),J(µA(x),µB( y))] Để chọn hàm kéo theo J, luật suy diễn mờ Modus Tollens dựa vào luật suy diễn Modus Tollens cổ điển: Trong biểu thức (2.4) ở trên, theo luật suy diễn Modus Tollens cổ điển, nếu thì , biểu thức trở thành: Biểu thức (2.5) trở thành: c(µA (x) =Sup xY i[c(µB(y), J(µA(x),µB( y))] 1.2.2.3 Lập luận xấp xỉ đa điều kiện Nhìn chung ý tưởng của phương pháp lập luận xấp xỉ là thiết lập cách tính kết luận từ một tập các tri thức dạng luật (nếu - thì) và các sự kiện, dựa trên lý thuyết tập mờ. Tri thức càng đầy đủ thì kết luận được tính càng phù hợp với thực tiễn hơn. Lập luận xấp xỉ đa điều kiện có dạng sau: Luật i: Nếu U là Ai, thì V là Bi, i = 1 n Sự kiện: U là A’ ------------------------------------------------------ Kết luận: V là B’ 21 Trong đó U, V là các biến trên X, Y. Ai, A’ là các tập mờ trên X. Bi, B’ là các tập mờ trên Y. Từ mệnh đề “Nếu U là Ai, thì V là Bi,” ta có quan hệ : R1: X ×Y [0,1] định bởi các tập mờ Ai và Bi như sau: Trong đó J là một hàm kéo theo mờ. Tập hợp tất cả n luật ta có quan hệ R định bởi phép hội tất cả các quan hệ thành phần Ri: Tập mờ B’ có thể xác định từ quan hệ R và tập mờ A’ qua một phép hợp thành: Từ phép hợp thành tổng quát Sup i, hàm thành viên của B’ được tính: µB’ ( y) =Sup xX i[µA’(x), µR(x, y)] Với phép hợp thành max - min: µB’ ( y) = Maxx X Min[µA’(x), µR(x, y)] Với phép hợp thành max – prod: µB’ ( y) = Maxx X Min[µA’(x) × µR(x, y)] 1.3 Hệ mờ Kiến trúc cơ bản của một hệ mờ gồm 4 thành phần chính: Bộ mờ hoá, hệ luật mờ, động cơ suy diễn mờ và bộ giải mờ như hình 1.4 dưới đây: 22 Không làm mất tính tổng quát, ở đây ta chỉ xét hệ mờ nhiều đầu vào, một đầu ra ánh xạ tập compact S Rn vào R. Các thành phần của hệ mờ được miêu tả như sau. 1.3.1 Bộ mờ hoá Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác định trong S được cho bởi hàm thuộc : S [0,1]. Bộ phận này có chức năng chính dùng để chuyển một giá trị rõ x X thành một giá trị mờ trong S U (U là không gian nền). Có hai phương pháp mờ hoá như sau: Singleton fuzzifiter: Tập mờ A với x1 và hàm liên thuộc được định nghĩa như sau: No – Singleton fuzziffier: Với các hàm liên thuộc nhận giá trị lớn nhất là 1 tạo x = xi và giảm dần từ 1 đến 0 với các giá trị dịch chuyển x x1. 1.3.2 Hệ luật mờ Gồm nhiều mệnh đề dạng: IF Giả sử hệ luật gồm M luật Rj (j= 1, M ) dạng 23 THEN y is Bj Rj: IF x1 is A1 and x2 is A2 and… xn is Trong đó xi (i = 1,n) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ mờ - các biến ngôn ngữ, là các tập mờ trong các tập đầu vào X và Bj là các tập mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất nhỏ”, “Nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”) đặc trưng bởi các hàm thuộc và . Khi đó Rj là một quan hệ mờ từ các tập mờ đầu vào X = X1 × X2 ×….. × Xn tới các tập mờ đầu ra Y. 1.3.3 Động cơ suy diễn Đây là một bộ phận logic đưa ra quyết định sử dụng hệ trong không gian đầu vào X thành tập mờ trong không gian đầu ra Y. Khi Rj là một quan hệ mờ, thì Rj có thể là tập con của tích Decart j x A2 j X×Y = {( j) , y) : X, y Y}, với = (x1, x2, ….., xn)T. Vì vậy quan hệ Rj
j x….x An
j
j x A2 là một hàm ánh xạ từ tập mờ trong X tới tập mờ trong Y, A1
Bj được gọi là một dạng suy diễn mờ (để cho gọn, ta ký hiệu Aj = A1 x….x An Giả sử A là tập mờ trong X và là đầu vào của bộ suy diễn. Khi đó mỗi luật Rj tạo ra một tập mờ Bj trong Y như sau: Bj = A Rj = sup (A* Rj) Với * là một toán tử T – chuẩn được định nghĩa trong bảng 2.1. Do tính kết hợp, ta có thể định nghĩa: T2(x,y) = T (x,y) T3(x,y,z) = T (x, T2(y,z)) với 0 ≤ x, y, z ≤ 1 .............. Dùng quy nạp ta định nghĩa : 24 Tn(x1, x2,.... xn) = T (x1, Tn-1(x2,.... xn)) với 0 ≤ xi ≤ 1 Quan hệ Rj được định nghĩa thông qua hàm thuộc sau : Và hàm liên tục thuộc tập A là Do đó, hàm liên thuộc của tập mờ đầu ra được tính như sau 1.3.4 Bộ giải mờ Đây là một ánh xạ từ các tập mờ trong R thành các giá trị rõ ràng trong R. Có nhiều phép giải mờ, với mỗi một ứng dụng sẽ có một phương pháp giải mờ khác nhau tùy thuộc yêu cầu ứng dụng. Dưới đây sẽ liệt kê một số phương pháp giải mờ thông dụng. Phương pháp độ cao: Với j là chỉ số luật, là điểm có độ liên thuộc lớn nhất trong tập mờ đầu ra , và được tính theo công thức như sau: Phương pháp độ cao biến đổi: 25 Với là hệ số biến đổi của luật j. Phương pháp trọng tâm : Phương pháp tâm của các tập (Center – of –sets): phương pháp này mỗi luật được thay thế bởi tập singleton tâm cj Kết luận Chương 1 tập trung trình bày một số kiến thức cơ bản về hệ mờ như tập mờ, các phép toán trên tập mờ, quan hệ mờ, suy diễn mờ, bộ mờ hoá, bộ giải mờ,.... Đó là các kiến thức liên quan liên quan tới mô hình chuỗi thời gian mờ sẽ được đề cập tới ở chương 2 dưới đây. 26 CHƢƠNG 2 MÔ HÌNH CHUỖI THỜI GIAN MỜ VÀ CÁC THUẬT TOÁN CƠ BẢN Chương này giới thiệu các kiến thức cơ bản về chuỗi thời gian, chuỗi thời gian mờ. Bên cạnh đó trình bầy một số thuật toán trong mô hình chuỗi thời gian mờ: thuật toán bậc một (thuật toán cơ sở), thuật toán đơn giản, bậc cao 2.1 Các kiến thức cơ bản về chuỗi thời gian 2.1.1 Khái niệm Chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,…… xn} được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm n. Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian. 2.1.2 Tính chất của chuỗi thời gian Các tính chất đặc trưng của chuỗi thời gian là: tính dừng, tuyến tính, xu hướng, và thời vụ. Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất nhưng khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi tính chất được xử lý tách rời. 2.1.2.1 Tính dừng Tính chất này của quá trình ngẫu nhiên có liên quan đến giá trị trung bình và phương sai của dữ liệu quan sát, cả hai đều nên bất biến theo thời gian, và hiệp phương sai giữa quan sát xt và xt-d chỉ nên phụ thuộc vào khoảng cách giữa hai quan sát và không thay đổi theo thời gian. Ví dụ trong mối quan hệ dưới đây: Với t = 1,2. E{xt} = µ, t = 1, 2,... 27 Var(xt) = E{(xt - µ) } = k0, t= 1, 2,... Cov(xt, xt-d) = E{(xt - µ)(xt-d - µ )} = kd ..; d = ...-2, -1, 0, 1, 2,...; µ, k0, kd là những hằng số xác định. Về mặt thống kê, chuỗi thời gian có tính dừng khi quá trình ngẫu nhiên cơ bản là trạng thái đặc biệt của trạng thái cân bằng thống kê. Chẳng hạn hàm phân bổ kết nối của X(t) và X(t-) chỉ phụ thuộc vào mà không phụ thuộc vào t. Do đó, các mô hình có tính dừng của một chuỗi thời gian có thể dễ dàng xây dựng nếu quá trình vẫn còn trong trạng thái cân bằng ở t thời gian xung quanh một mức độ trung bình liên tục. 2.1.2.2 Tuyến tính Tính tuyến tính của một chuỗi thời gian chỉ ra hình dạng của chuỗi thời gian phụ thuộc vào trạng thái của nó, do đó các trạng thái hiện hành xác định các mô hình chuỗi thời gian. Nếu một chuỗi thời gian là tuyến tính, sau đó nó có thể được thể hiện bằng một hàm tuyến tính của các giá trị hiện tại và giá trị quá khứ. Ví dụ của thể hiện tuyến tính là các mô hình AR, MA, ARMA và ARIMA. Chuỗi thời gian phi tuyến có thể được đại diện bởi các mô hình phi tuyến hay song tuyến tính tương ứng. Chuỗi thời gian đại diện của mô hình tuyến tính: Xt thường mô tả một quá trình tuyến tính với i là một tập các hằng số thỏa mãn điều kiện: và |Zt| là một ồn trắng với giá trị trung bình 0 và biến . Dạng đa biến của một quá trình tuyến tính được xác định bởi mối quan hệ: 28 Xt = Trong đó: Ci là chuỗi các ma trận n×n với các phần tử có thể tính . tổng; Zt là ồn trắng với giá trị trung bình 0 và hiệp phương sai ma trận 2.1.2.3 Tính xu hướng Phân tích xu hướng là quan trọng trong dự báo chuỗi thời gian. Trong thực tế, nó được thực hiện bằng cách sử dụng kỹ thuật hồi quy tuyến tính và phi tuyến giúp xác định thành phần xu hướng không đơn điệu trong chuỗi thời gian. Ví dụ, để xác định các đặc tính của xu hướng hiện tại trong một chuỗi thời gian là tuyến tính, cấp số nhân, hoặc đa thức liên quan thì các hàm dưới đây được sử dụng cho phù hợp với dữ liệu thu thập được: xt = ) xt = exp( xt = 2.1.2.4 Tính mùa vụ Các tính chất mùa vụ của một chuỗi thời gian được thể hiện thông qua mô hình dao động định kỳ của nó. Tính chất này là phổ biến hơn trong chuỗi thời gian kinh tế và các quan sát được lấy từ cuộc sống thực, nơi mà các mô hình có thể lặp lại hàng giờ, hàng ngày, hàng tuần, hàng tháng, hàng năm, v.v. Vì vậy, mục đích chính của phân tích chuỗi thời gian theo mùa vụ là tập trung vào phát hiện của các thành phần biến động định kỳ của nó và giải thích của chúng. Trong kỹ thuật, chuỗi thời gian theo mùa được thấy trong các vấn đề của khí ga, điện, nước, và hệ thống phân phối khác, dự đoán nhu cầu tiêu dùng. 2.1.3 Phân loại chuỗi thời gian 29 Dựa vào các đặc tính của dữ liệu mà chuỗi thời gian được phân thành các loại sau: • Dừng và không dừng. • Theo mùa vụ và không theo mùa vụ. • Tuyến tính và phi tuyến. • Đơn biến và đa biến. • Hỗn loạn. Chuỗi thời gian trong thực tế có thể có 2 hoặc nhiều hơn các thuộc tính được liệt kê ở trên. 2.1.3.1 Chuỗi thời gian tuyến tính Chuỗi thời gian tuyến tính được tạo ra thông qua quan sát của các quá trình tuyến tính, một cách toán học, mô hình tuyến tính được định nghĩa: yt = Trong đó: 2.1.3.2 Chuỗi thời gian phi tuyến Nhiều chuỗi thời gian trong kỹ thuật đòi hỏi mô hình phi tuyến. Một số chúng được biểu diễn như mô hình song tuyến: xt = zt + 2.1.3.3 Chuỗi thời gian đơn biến Chuỗi thời gian đơn biến là chuỗi thời gian thu được bằng cách lấy mẫu một mô hình quan sát duy nhất, ví dụ như giá trị của một biến vật lý duy nhất hay của một tín hiệu phụ thuộc vào thời gian duy nhất tại các khoảng thời gian bằng nhau. Như vậy, trong chuỗi thời gian đơn biến thì thời gian là 30 một biến ngầm thường được thay thế bằng một biến chỉ số. Nếu mẫu dữ liệu được lấy cách đều thì biến chỉ số có thể bỏ qua. Trong trường hợp một chuỗi thời gian đơn biến có thể được biểu diễn chính xác bởi một mô hình toán học thì chuỗi thời gian đó được cho là xác định. Nếu không, nếu chuỗi thời gian chỉ có thể được biểu diễn bằng một hàm phân bố xác suất thì chuỗi thời gian được cho là không xác định hoặc ngẫu nhiên. 2.1.3.4 Chuỗi thời gian đa biến Chuỗi thời gian đa biến được sinh ra bằng cách quan sát đồng thời hai hay nhiều quá trình. Các giá trị quan sát thu được được thể hiện như là giá trị vector. Các loại quan sát này rất phổ biến trong kỹ thuật, nơi hai hay nhiều biến vật lý (nhiệt độ, áp suất, dòng chảy, .v.v) phải được lấy mẫu đồng thời để xây dựng mô hình của hệ thống động. Chuỗi thời gian đa biến được hiểu như là một tập các chuỗi thời gian xây dựng đồng thời , giá trị của mỗi phần của chuỗi vừa phụ thuộc vào chính chuỗi đó, vừa phụ thuộc vào giá trị của chuỗi khác. 2.1.3.5 Chuỗi thời gian hỗn loạn Các thành phần ngẫu nhiên của một chuỗi thời gian chủ yếu rơi vào một trong hai loại: Chúng thực sự ngẫu nhiên, nghĩa là các quan sát rút ra từ phân bổ xác suất cơ bản được đặc trưng bởi một hàm phân phối thống kê hoặc những thời điểm thống kê dữ liệu, chẳng hạn như trung bình, phương sai, ... Chúng là hỗn loạn, đặc trưng bởi giá trị xuất hiện được phân phối ngẫu nhiên và không định kỳ, nhưng thực tế kết quả từ một quá trình hoàn toàn xác định. 31 Các thuộc tính chính của chuỗi thời gian hỗn loạn là không có tính chu kỳ nhất định, tức là chúng có thể được biểu diễn bởi các giá trị có thể lặp lại ngẫu nhiên nhiều lần mà không thuộc bất kỳ chu kỳ nhất định nào. 2.1.4 Mô hình chuỗi thời gian Trong thống kê, hai mô hình hệ thống toán học cơ bản thường được sử dụng là: Mô hình xác định: Về mặt toán học, nó được xem như là mô hình phân tích biểu diễn bởi các quan hệ xác định giống như: xt = f(t) hoặc bởi biểu thức hồi quy: xt = f(xt-1, xt-2,...) Mô hình ngẫu nhiên: Về mặt thống kê, nó được xem như là hàm của các biến ngẫu nhiên. Mô hình toán học dùng cho phân tích chuỗi thời gian thông thường gồm: Mô hình hồi quy. Mô hình miền thời gian. Mô hình miền tần số. Trong đó mô hình miền thời gian bao gồm: Mô hình hàm chuyển. Mô hình trạng thái không gian. 2.2 Chuỗi thời gian mờ
2.2.1 Khái niệm Giả sử U là không gian nền. không gian nền này xác định một tập hợp các đối tượng cần ghiên cứu. Nếu A là một tập con rõ của U thì ta có thể xác định chính xác một hàm đặc trưng: 32 Nhưng với một tập mờ B trong không gian nền U thì phần tử x không xác định chính xác được. Khi đó ta có định nghĩa: A : U A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần [0.1] A (u) được gọi là độ thuộc của u vào tập mờ A. tử u nào của A thì hàm Giả sử Y(t) là chuỗi thời gian (t = 0, 1, 2,…) U là tập nền chứa khoảng giá trị của chuỗi thời gian từ nhỏ nhất đến lớn nhất. A : U Xác định hàm thuộc [0.1] của tập mờ A, còn tập A trên không gian nền U được viết như sau: A (u1) / u1, A (u2) / u2,…, A (un )/ un,: ui A (ui) là độ thuộc của ui vào tập A hay cách viết khác: A = {( U; i = 1, 2, …, n} A = 2.2.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ Định nghĩa 1: Y(t) (t =...0,1,2,...) là một tập con của R1. Y(t) là tập nền trên đó xác định các tập mờ fi(t). F(t) là tập chứa các tập fi(t) (i = 1,2,...). Khi đó ta gọi F(t) là chuỗi thời gian mờ xác định trên tập nền Y(t). Định nghĩa 2: Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t) và F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là ký hiệu của một toán tử xác định trên tập mờ. R(t-1, t) là mối quan hệ mờ. Ta cũng có thể ký hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng F(t-1) F(t). Nếu đặt F(t-1) = Ai và F(t) = Aj thì ta ký hiệu mối quan hệ logic mờ giữa chúng như sau: Ai Aj. Định nghĩa 3: Nhóm các mối quan hệ mờ. 33 Các mối quan hệ logic mờ có thể gộp lại thành một nhóm nếu trong ký hiệu trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải. Thí dụ nếu ta có các mối quan hệ: Ai Ak ; Ai Am thì ta có thể gộp chúng thành nhóm các mối quan hệ logic mờ sau: Ai Ak,Am Định nghĩa 4: Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t. Nếu R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng, còn ngược lại ta có chuỗi thời gian mờ không dừng. Định nghĩa 5: Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m) m>0 và là chuỗi thời gian mờ dừng. Khi đó mối quan hệ mờ có thể viết được F(t-1), F(t-2),…, F(t-m) F(t) và gọi đó là mô hình dự báo bậc m của chuỗi thời gian mờ. Định nghĩa 6: Nhóm quan hệ mờ bậc cao Để đơn giản, ta chỉ xét mối quan hệ mờ bậc 2 Ai1,Ai2 Aj. Giả sử đối với tập Ai1 có nhóm quan hệ mờ Ai1 Ak,Am và Ai2 có nhóm quan hệ mờ Ai2 Ap,Aq. Khi đó đối với mối quan hệ mờ bậc cao ta cũng xác định được nhóm quan hệ mờ bậc cao như sau: [Ai1,Ai2 ] Ak,Am Ap,Aq. Định nghĩa 7: Hàm hj phụ thuộc vào một tham số x được xác định : hj (x,Ap1, Ap2, ..., ) = Ap1, Ap2, ..., Apk j là một chỉ số nào đó mà với x >0 thì các chỉ số p1, p2, …. pk j và với x< 0 thì p1, p2, …. pk j 2.3 Một số thuật toán trong mô hình chuỗi thời gian mờ 2.3.1 Các phương pháp chia khoảng Chiều dài của khoảng thời gian trong các thuật toán mô hình chuỗi thời gian mờ ảnh hưởng rất lớn đến kết quả dự báo chuỗi thời gian mờ. Nếu chiều dài của khoảng thời gian là quá lớn thì sẽ không có biến động trong dự báo còn khi chiều dài là quá nhỏ, ý nghĩa của chuỗi thời gian mờ sẽ được giảm bớt. Vì vậy một điểm quan trọng trong việc lựa chọn chiều dài của khoảng 34 thời gian mờ là không nên quá lớn hay quá nhỏ. 2.3.1.1 Phương pháp lựa chọn ngẫu nhiên Song & Chissom và Chen đã đưa ra phương pháp chia khoảng ngẫu nhiên. Đặc trưng của phương pháp này là tự chọn độ dài khoảng (tự chọn số điểm chia) sao cho độ dài phù hợp với cách tính. 2.3.1.2 Phương pháp độ dài dựa trên sự phân bố giá trị Đặc trưng của phương pháp chia khoảng này là: dựa vào độ dài bảng cơ sở cho trước và sự tích lũy của hiệu các độ dài. Chọn độ dài của khoảng có sự tích lũy lớn nhất nhưng phải nhỏ hơn nửa số lượng tích lũy của các hiệu độ dài. Phương pháp này được thực hiện như sau: 1. Tính toàn bộ hiệu số tuyệt đối giữa các giá trị fi+1 và fi (I = 1, …, n- 1). Hiệu số bậc 1 và trung bình của hiệu số bậc 1. 2. Dựa vào trung bình của hiệu số bậc 1, xác định cơ sở độ dài của khoảng dựa vào bảng ánh xạ cơ sở. Phạm vi Cơ sở 0.1 – 1.0 0.1 1.1 – 10 1 11 – 100 10 101 - 1000 100 3. Lập bảng ghi lại sự phân bố tích lũy của sai phân cấp 1 35 4. Theo cơ sở xác định ở bước 2 và kết quả bước 3, chọn độ dài của khoảng có sự tích lũy lớn nhất nhưng phải nhỏ hơn nửa số lượng tích lũy của các hiệu độ dài của sự khác biệt. 2.3.1.3 Phương pháp độ dài dựa trên giá trị trung bình Đặc trưng của phương pháp chia khoảng này là: Dựa vào một nửa trung bình của hiệu số bậc 1 và bảng cơ sở cho trước để xác định độ dài cuả khoảng. Phương pháp này được thực hiện như sau: 1. Tính toán bộ hiệu số tuyệt đối giữa các giá trị trị fi+1 và fi (i = 1, …, n-1), Hiệu số bậc 1 và trung bình của hiệu số bậc 1. 2. Lấy 1 nửa giá trị trung bình của hiệu số độ dài ở bước 1. 3. Theo độ dài trong bước 2, xác định cơ sở cho độ dài của khoảng bằng cách dựa vào Bảng 2.1. 4. Làm trong độ dài theo bảng cơ sở để xác định độ dài của khoảng. 2.3.1.4 Phương pháp dựa trên mật độ Đặc trưng của phương pháp này là: Bước đầu tiên vẫn chia khoảng theo phương pháp ngẫu nhiên, sau đó tính toán mật độ các giá trị rơi vào tại mỗi khoảng để chia lại các khoảng giá trị trung bình. 2.3.2 Mô hình thuật toán của Song và Chissom Trong phần này, sử dụng khái niệm và phương pháp dự báo của chuỗi thời gian mờ được Song et. al. và Chissom đưa ra để xây dựng thuật toán dự báo cho chuỗi thời gian. Giả sử U là không gian nền: U = {u1, u2, …, un}. Tập A là mờ trên không gian nền U nếu A được xác định bởi hàm: A: U [0.1] 36 A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một phần tử u nào của A thì hàm A(u) được gọi là độ thuộc của u vào tập mờ A. Tập mờ A trên không gian nền U được viết như sau: Mô hình thuật toán gồm một số bước sau: Bước1: Xác định tập nền U trên đó các tập mờ được xác định. Bước 2: Chia các tập nền U thành một số các đoạn bằng nhau. Bước 3: Xác định các biến ngôn ngữ để diễn tả các tập mờ trên các khoảng đã chia của tập nền. Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian Bước 5: Chọn tham số w >1 thích hợp và tính Rw (t,t-1) và dự báo theo công
thức sau: F(t) = F(t - 1)*Rw(t, t - 1) Trong đó F(t) là giá trị dự báo mờ tại thời điểm t còn F(t-1) là giá trị dự báo mờ tại thời điểm t -1. Mối quan hệ mờ được tính như sau: Rw(t, t - 1) = FT(t – 2) × F(t - 1)FT(t - 3) × F(t - 2)…FT(t - w) × F(t – w + 1) Trong đó T là toán tử chuyển vị, dấu “×” là toán tử tích Cartesian còn w được gọi là “tham số cơ sở” mô tả số lượng thời gian trước thời điểm t. Bước 6: Giải mờ giá trị dự báo mờ. 2.3.3 Mô hình thuật toán của Chen Chen đã có một số cải tiến thay vì để tính mối quan hệ mờ bằng các phép tính Min – Max chỉ cần sử dụng các phép tính số học đơn giản. Thuật toán của Chen bao gồm một số bước sau: 37 Bƣớc 1: Xác định tập nền U trên các giá trị lịch sử của chuỗi thời gian Bƣớc 2: Chia tập U thành các khoảng đều nhau Bƣớc 3: Xác định các tập mờ Aj Bƣớc 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian Bƣớc 5: Xác định mối quan hệ mờ Aj → Ai Bƣớc 6: Xác định nhóm quan hệ mờ trên nguyên tắc cùng một vế trái và sau đó tinh mối quan hệ mờ Ri cho mỗi tập mờ Aj Bƣớc 7: Dự báo và giải mờ các kết quả 2.3.4 Mô hình chuỗi thời gian mờ đơn giản của Singh Singh đã đề ra thuật toán đơn giản dựa vào thông số thời gian w=3. Một vài ký hiệu sau sẽ được sử dụng: [*Aj ] là khoảng tương ứng uj mà hàm thuộc trong Aj đạt giá trị Supremum L[*Aj ] là giới hạn dưới của khoảng uj U[*Aj ] là giới hạn trên của khoảng uj l[*Aj ] là độ dài khoảng uj trong đó hàm thuộc của Aj đạt Supremum M[*Aj ] là giá trị trung bình của khoảng uj trong đó hàm thuộc của Aj đạt Supremum Đối với mối quan hệ mờ, ta sẽ ký hiệu: Ai là giá trị mờ tại thời điểm t Aj là giá trị mờ tại thời điểm t+1 Ei là giá trị của chuỗi thời gian tại thời điểm t Ei-1 là giá trị của chuỗi thời gian tại thời điểm t-1 Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-2 38 Fj là giá trị dự báo của chuỗi thời gian tại thời điểm t+1 Mô hình của Singh sử dụng 3 giá trị quá khứ t-2, t-1, t để đưa ra quy luật dự báo tại thời điểm t+1. Thuật toán bao gồm các bước sau: Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U =[fmin-f1, fmax+f2] trong đó f1, f2 là những giá trị dương nào đó. Bước 2: Chia đoạn U thành m khoảng con bằng nhau u1, u2,...um. Bước 3: Xây dựng các tập mờ Ai tương ứng với các khoảng con như trong trong bước 2 và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia. Bước 4: Mờ hoá các giá trị của chuỗi thời gian và thiết lập mối quan hệ mờ theo quy tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và Aj là giá trị mờ hoá tại thời điểm tiếp theo t+1 thì ta có mối quan hệ mờ Ai Aj như tại Định nghĩa 2. Ai là trạng thái hiện thời còn Aj là trạng thái tiếp theo. Bước 5: Các quy tắc dự báo Quy luật dự báo: Để dự báo thời điểm t+1 và tiếp theo ta theo thuật toán sau: For k = 3 to ... K (giá trị cuối của chuỗi thời gian) Nhận mối quan hệ mờ tại các thời diểm t và t+1 Ai Aj Tính: 39 Di = (Et – Et-1) - (Et-1 – Et-2) Xi =Ei + Di /2 XXi =Ei – Di /2 Yi =Ei + Di YYi =Ei – Di For i=1 to 4 If Xi ≥ L[*Aj ] and Xi ≤ U[*Aj ] Then P1 = Xi ; n=1 Else P1 = 0 ; n=0 Next I If XXi ≥ L[*Aj ] and XXi ≤ U[*Aj ] Then P2 = XXi ; m=1 Else P2 = 0 ; m=0 Next I If Yi ≥ L[*Aj ] and Yi ≤ U[*Aj ] Then P3 = Yi ; o=1 Else P3 = 0 ; o=0 Next I If YYi ≥ L[*Aj ] and YYi ≤ U[*Aj ] Then P4 = YYi ; q=1 Else P4 = 0 ; q=0 Next I 40 B=P1 + P2 + P3 + P4 If B = 0 Then Fj = M[*Aj ] Else Fj = (B + M[*Aj ])/ (m+n+o+q+1) Next k 2.3.5 Mô hình chuỗi thời gian mờ bậc cao của Singh Trong thuật toán bậc cao, một vài ký hiệu sau sẽ được sử dụng: [*Aj ] là khoảng tương ứng uj mà hàm thuộc trong Aj đạt giá trị Supremum L[*Aj ] là giới hạn dưới của khoảng uj U[*Aj ] là giới hạn trên của khoảng uj l[*Aj ] là độ dài khoảng uj trong đó hàm thuộc của Aj đạt Supremum M[*Aj ] là giá trị trung bình của khoảng uj trong đó hàm thuộc của Aj đạt Supremum Đối với mối quan hệ mờ, em sẽ ký hiệu: Ai là giá trị mờ tại thời điểm t Aj là giá trị mờ tại thời điểm t+1 Ei là giá trị của chuỗi thời gian tại thời điểm t Ei -1 là giá trị của chuỗi thời gian tại thời điểm t-1 Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-2 Fj là giá trị dự báo của chuỗi thời gian tại thời điểm t+1 Mô hình bậc cao của Singh sử dụng 3 giá trị quá khứ t-2, t-1, t để đưa ra quy luật dự báo tại thời điểm t+1. Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị 41 lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U = [fmin - f1,fmax - f2] trong đó f1, f1 là những giá trị dương nào đó. Bước 2: Chia đoạn U thành m khoảng con bằng nhau u1, u2,...um. Bước 3: Xây dựng các tập mờ Ai tương ứng với các khoảng con như trong trong bước 2 và sử dụng các hàm thuộc tam giác cho mỗi khoảng con của phép chia. Bước 4: Mờ hoá các giá trị của chuỗi thời gian và thiết lập mối quan hệ mờ theo quy tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và Aj là giá trị mờ hoá tại thời điểm tiếp theo t+1 thì ta có mối quan hệ mờ Ai Aj như tại Định nghĩa 2. Ai là trạng thái hiện thời còn Aj là trạng thái tiếp theo. Bước 5: Các quy tắc dự báo K=3 to … k ( giá trị cuối cùng của chuỗi thời gian) Nhận mối quan hệ mờ tại các thời diểm t và t+1 Ai Aj R=0 and S=0 Tính: Di = (Et – Et-1) - (Et-1 – Et-2) Xi=Ei + Di/2 XXi= Ei - Di/2 Yi = Ei + Di YYi = Ei - Di Pi = Ei + Di/4 42 PPi = Ei - Di/4 Qi = Ei+2*Di QQi = Ei - 2*Di Gi = Ei + Di/6 GGi = Ei - Di/6 Hi = Ei+ 3*Di HHi = Ei - 3*Di If Xi ≥ L[*Aj] And Xi ≤ U[*Aj] Then R=R+Xi And S=S+1 If XXi ≥ L[*Aj] And XXi ≤ U[*Aj] Then R=R+XXi And S=S+1 If Yi ≥ L[*Aj] And Yi ≤ U[*Aj] Then R=R+Yi And S=S+1 If YYi ≥ L[*Aj] And YYi ≤ U[*Aj] Then R=R+YYi And S=S+1 If Pi ≥ L[*Aj] And Pi ≤ U[*Aj] Then R=R+Pi And S=S+1 If PPi ≥ L[*Aj] And PPi ≤ U[*Aj] Then R=R+PPi And S=S+1 If Qi ≥ L[*Aj] And Qi ≤ U[*Aj] Then R=R+Qi And S=S+1 If QQi ≥ L[*Aj] And QQi ≤ U[*Aj] 43 Then R=R+QQi And S=S+1 If Gi ≥ L[*Aj] And Gi ≤ U[*Aj] Then R=R+Gi And S=S+1 If GGi ≥ L[*Aj] And GGi ≤ U[*Aj] Then R=R+GGi And S=S+1 If Hi ≥ L[*Aj] And Hi ≤ U[*Aj] Then R=R+Gi And S=S+1 If HHi ≥ L[*Aj] And HHi ≤ U[*Aj] Then R=R+HHi And S=S+1 Fj = (R+M(*Aj))/(S+1) 44 CHƢƠNG 3 ỨNG DỤNG TRONG TÍNH TOÁN THỬ NGHIỆM Trong chương này, em sẽ tính toán thử nghiệm trên mô hình thuật toán của Singh đơn giản và bậc cao . Đây là một mô hình khác của chuỗi thời gian mờ. Mô hình này được xây dựng dựa trên sự biến thiên của chuỗi số liệu và có cách tính khá đơn giản và rất dễ để lập trình. Sau đó mô hình thuật toán đơn giản và bậc cao của Singh sẽ được áp dụng trong bài toán dự báo điện năng tiêu thụ hàng tháng tại Trường Cao đẳng Y tế Phú Thọ thị xã Phú Thọ- tỉnh Phú Thọ. Thông qua kết quả sử dụng mô hình để thấy được hiệu quả dự báo của mô hình thuật toán của Singh đơn giản và bậc cao so sánh với thuật toán cơ bản của Chen 3.1 Ứng dụng trong dự báo Trong phần này, em sử dụng mô hình chuỗi thời gian mờ đơn giản và bậc cao của Singh trong dự báo mức tiêu thụ điện của trường Cao đẳng Y tế Phú Thọ 3.1.1 Dự báo mức tiêu thụ điện bằng mô hình đơn giản của Singh Xét bài toán dự báo cho chuỗi dữ liệu mức tiêu thụ điện của trƣờng Cao đẳng Y tế Phú Thọ, từ tháng 01/2012 đến 8/2014. Số liệu được đưa ra trong bảng dưới đây. Thời gian( Số điện tiêu Thời gian( Số điện tiêu thụ tháng/ năm) thụ(KW) tháng/ năm) 01/2012 15613 /2013 17156 02/2012 15093 6/2013 16058 3/2012 17691 7/2013 16550 45 4/2012 17300 8/2013 16299 5/2012 17323 9/2013 16131 6/2012 16975 10/2013 17335 7/2012 17050 11/2013 17105 8/2012 17823 12/2013 16333 9/2012 16888 01/2014 15667 10/2012 17041 02/2014 14165 11/2012 17084 3/2014 16462 12/2012 16786 4/2014 16248 01/2013 13766 5/2014 16889 02/2013 15477 6/2014 15823 3/2013 16787 7/2014 16905 4/2013 16938 8/2014 16411 Thuật toán cho chuỗi thời gian mờ bao gồm các bước sau đây và áp dụng cho số liệu tại bảng trên. Bƣớc 1: Xây dựng tập nền U. Dựa trên số liệu về mức độ tiêu thụ điện từ tháng 01/2012 đến 8/2014, ta có thể thấy Dmin=13766; Dmax =17823. Do đó ta sẽ đặt D1 = 66, D2 = 77 và khoảng U = [13700; 17900]. Trong luận văn này, em chia khoảng U = [13700; 17900] thành 14 khoảng bằng nhau : u1, u2, …, u14 với độ rộng là 300, như vậy các khoảng sẽ là: u1 = [13700; 14000], u2 46 = [14000; 14300], u3 = [14300; 14600], u4 = [14600; 14900], u5 = [14900; 15200], u6 = [15200; 15500], u7 = [15500; 15800], u8 = [15800; 16100], u9 = [16100;1 6400], u10 = [16400; 16700], u11 = [16700; 17000], u12 = [17000; 17300], u13 = [17300; 17600], u14 = [17600; 17900]. Bước 2: Xác định tập Ai tương ứng với từng khoảng ui đã xác định ở trên. Ta gán chúng với các biến ngôn ngữ. A1 = (thấp nhất), A2 = (rất rất thấp), A3 = (rất thấp), A4 = (thấp), A5 = (hơi thấp), A6 = (dưới trung bình), A7 = (trung bình), A8 = (trên trung bình), …, A13 = (rất rất cao), A14 = (cao nhất). Bước 3: Chia lại khoảng. Tính phân bổ của các giá trị chuỗi thời gian rơi vào các khoảng đã chia. Điều này thực hiện để biết các khoảng nào có nhiều giá trị rơi vào để có thể phân khoảng tiếp làm tăng độ chính xác khi dự báo. Bảng sau đây sẽ cho thấy sự phân bố các giá trị của chuỗi thời gian rơi vào từng khoảng: Khoảng Số lƣợng Khoảng Số lƣợng 13700 - 14000 15800 -16100 1 2 14000 - 14300 16100 – 16400 1 4 14300 - 14600 16400 – 16700 0 3 14600 - 14900 16700 – 17000 0 7 14900 - 15200 17000 – 17300 1 6 15200 - 15500 17300 – 17600 1 2 15500 - 15800 17600 – 17900 2 2 47 Xem xét bảng trên ta thấy sự phân bố các giá trị tại các khoảng khác nhau là không đều nhau. Có 32 giá trị trong 14 khoảng nên số lượng trung bình rơi vào mỗi khoảng là hơn 2. Nhưng có những khoảng rơi vào đến 6 hay 7 giá trị. Vì vậy phải chia những khoảng có nhiều giá trị thành những khoảng con để có thể phân bố đều lại các giá trị này. Vì vậy những khoảng nào có 3, 4 giá trị rơi vào ta chia tiếp làm 2 khoảng con, còn những đoạn nào có 6, 7 giá trị rơi vào ta tiếp tục chia thành 3 khoảng để sao cho mỗi khoảng con đó có xấp xỉ 2 giá trị rơi vào. Kết quả sẽ hình thành 20 khoảng sau: Khoảng Số lƣợng Khoảng Số lƣợng 1 2 u1 = [13700 – 14000] u11 = [16400 – 16550] 1 1 u2 = [14000 – 14300] u12 = [16550 –16700] 0 2 u3 = [14300 – 14600] u13 = [16700 – 16800] 0 2 u4 = [14600 – 14900] u14 = [16800 – 16900] 1 3 u5 = [14900 – 15200] u15 = [16900 – 17000] 1 3 u6 = [15200 – 15500] u16 = [17000 – 17100] 2 2 u7 = [15500 – 15800] u17 = [17100 – 17200] 2 1 u8 = [15800 – 16100] u18 = [17200 – 17300] 2 2 u9 = [16100 – 16250] u19 = [17300 – 17600] 2 2 u10 = [16250 – 16400] u20 = [17600 – 17900] 48 Xác định lại các tập mờ Ai tương ứng với từng khoảng. Các tập mờ Ai i = 1, 2, …, 20. Được định nghĩa thông qua các hàm thuộc để đơn giản có dạng nón nhận 3 giá trị 0, 0.5 và 1 và được viết như sau: A1 = 1/u1 + 0.5/u2 + 0/u3 + … + 0/u19 + 0/u20 A2 = 0.5/u1 + 1/u2 + 0.5/u3 + 0/u4 + … + 0/u19 + 0/u20 A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 + 0/u5 + … + 0/u19 + 0/u20 ………………………………………………………………. A18 = 0/u1 + 0/u2 +….+ 0/u16 + 0.5/u17 + 1/u18 + 0.5/u19 + 0/u20 A19 = 0/u1 + 0/u2 +….+ 0/u17 + 0.5/u18 + 1/u19 + 0.5/u20 A20 = 0/u1 + 0/u2 +….+ 0/u18 + 0.5/u19 + 1/u20 Bước 4: Xác định mối quan hệ mờ và nhóm quan hệ mờ xác định mối quan hệ mờ tại thời điểm t =1, 2, ..., 32. Có thể thấy ngay được các mối quan hệ đầu tiên như sau: A7 A5 A17 A8 A5 A20 A8 A11 A20 A18 A11 A10 A18 A19 A10 A9 A19 A15 A9 A19 A15 A16 A19 A17 49 A17 A10 A16 A20 A10 A7 A20 A14 A7 A2 A14 A16 A2 A11 A16 A16 A11 A9 A16 A13 A9 A14 A13 A1 A14 A8 A1 A6 A8 A15 A6 A13 A15 A11 A13 A15 A15 A17 Từ đây xác định nhóm các mối quan hệ mờ. Toàn thể các nhóm quan hệ mờ sẽ được thể hiện dưới Bảng 3.5. A7 A2, A5 A1 A6 A5 A20 A6 A13 A20 A14, A18 A17 A8, A10 A19 A15, A17 A8 A11, A15 A15 A11, A16, A17 A10 A7, A9 50 A16 A13, A16, A20 A9 A14, A19 A2 A11 A14 A16, A8 A11 A9 A13 A1, A15 A18 A19 Bƣớc 5: Dự báo Sử dụng thuật toán Chen để dự báo mức độ tiêu thụ điện tại trường Cao đẳng Y tế Phú Thọ, thị xã Phú Thọ - tỉnh Phú Thọ. Thời điểm Số điện tiêu
thụ Nhóm quan hệ
mờ Dự báo
Chen Giá
trị
mờ t=1 15613 t=2
t=3 16250
17750 15093
17691 t=4 15650 17300 t=5 16475 17323 t=6 16950 16975 t=7 17050 17050 t=8 15708 17823 t=9 15650 16888 t=10
t=11 17350
15708 17041
17084 t=12 15708 16786 t=13 16200 13766 t=14 16950 15477 t=15 13850 16787 t=16
t=17 16200
17050 16938
17156 A7
A5
A20
A18
A19
A15
A16
A20
A14
A16
A16
A13
A1
A6
A13
A15
A17 A2, A5
A20
A14, A18
A19
A15, A17
A11, A16, A17
A13, A16, A20
A14, A18
A16, A8
A13, A16, A20
A13, A16, A20
A1, A15
A6
A13
A1, A15
A11, A16, A17 51 t=18 17400 16058 t=19 16900 16550 t=20 16850 16299 t=21 16950 16131 t=22 16950 17335 t=23
t=24 16950
17400 17105
16333 t=25 16950 15667 t=26 16250 14165 t=27 17050 16462 t=28 16850 16248 t=29 15913 16889 t=30 17350 15823 t=31 16900 16905 t=32 16850 16411 A8
A11
A10
A9
A19
A17
A10
A7
A2
A11
A9
A14
A8
A15
A11 A8, A10
A11, A15
A9
A7, A9
A15, A17
A15, A17
A8, A10
A7, A9
A2, A5
A11
A9
A14, A19
A16, A8
A11, A15
A9 47.452 MSE Bảng 3.7 Bảng so sánh kết quả dự báo 3.1.2 So sánh kết quả dự báo của phƣơng pháp Singh đơn giản và bậc
cao với các phƣơng pháp khác Số điện Giá trị mờ Chen Singh đơn giản Singh bậc cao tiêu thụ A7 15613 A5 16250 15093 17250 A20 17750 17691 17250 17479 A18 15650 17300 17439 A19 16475 17323 52 16950 16935 17050 A15 16950 16975 17050 17750 A16 17050 17050 17701 16829 A20 15708 17823 16841 17050 A14 15650 16888 17050 17040 A16 17350 17041 17050 16750 A16 15708 17084 16738 13850 A13 15708 16786 13850 15350 A1 16200 13766 15304 16750 A6 16950 15477 16735 16950 A13 13850 16787 16950 17154 A15 16200 16938 17155 15950 A17 17050 17156 15899 16475 A8 17400 16058 16462 16325 A11 16900 16550 16320 16187 A10 16850 16299 16155 17450 A9 16950 16131 17517 17150 A19 16950 17335 17150 A17 16950 17105 53 16325 16325 15664 A10 16333 17400 15665 14150 A7 15667 16950 14087 16475 A2 14165 16250 16475 16175 A11 16462 17050 16175 16850 A9 16248 16850 16833 15993 A14 16889 15913 15952 16928 A8 15823 17350 16921 16475 A15 16905 16900 16492 A11 16411 16850 MSE 4.874 47.452 6.368 Hàng cuối cùng thể hiện sai số trung bình bình phương MSE được tính theo công thức: MSE = Trong đó fi là giá trị thực còn gi là giá trị dự báo. Ta có thể thấy chỉ số MSE của thuật toán Singh thấp hơn rất nhiều so với 2 chỉ số còn lại, điều này chứng tỏ độ chính xác của thuật toán singh đơn giản có sự tiến triển hơn, độ tin cậy cao hơn. 3.2 Đồ thị so sánh kết quả .
3.2.1 Đồ thị so sánh của Chen và Singh đơn giản 54 55 56 KẾT LUẬN Luận văn này chủ yếu nghiên cứu một số khái niệm, định nghĩa, các phép toán về tập mờ và mô hình chuỗi thời gian mờ. Từ đó tìm hiểu các thuật toán trong mô hình chuỗi thời gian mờ như: Mô hình thuật toán của Song và Chisssom [1], [2], [3], mô hình thuật toán của Chen [5], mô hình bậc cao của Singh trong dự báo. Tuy nhiên các mô hình trên cho kết quả dự báo chưa cao và phương pháp tính toán rất phức tạp. Do đó việc tìm tòi các mô hình có độ chính xác cao hơn và thuật toán đơn giản hơn đang là một ưu tiên. Trong những năm gần đây một số công trình đã được hoàn thành theo hướng nâng cao độ chính xác và giảm khối lượng tính toán trong mô hình chuỗi thời gian mờ như các công trình của Chen và Hsu, Huarng, Singh,.. Thuật toán này phát triển trên cơ sở thuật toán của Huarng [6] nhưng đã cải tiến khá nhiều, chủ yếu là chia lại khoảng từ tập nền và trong dự báo đã lấy thêm thông tin từ tốc độ tăng giảm của giá trị chuỗi thời gian để xác định điểm dự báo trong khoảng. Trong luận văn này em tập chung chủ yếu vào Chương 3, nói về mô hình thuật toán của Singh và singh bậc cao và tính toán thử nghiệm. Trong phần này em tìm hiểu kỹ về mô hình chuỗi thời gian mờ bằng thuật toán của singh[11] và singh bậc cao[13] Từ đó ứng dụng mô hình chuỗi thời gian mờ bằng thuật toán của singh và singh bậc cao trong bài toán dự báo số điện tiêu thụ tại trường cao đẳng y tế Phú Thọ. Qua đó so sánh các kết quả tính toán của các mô hình thuật toán để thấy được các lợi thế từ các mô hình. Các kết quả tính toán cho thấy độ chính xác của dự báo trong mô hình singh và Singh bậc cao tăng lên đáng kể so với cá thuật toán đã xây dựng trước đây như: thuật toán của Chen [5]. Điều này thể hiện thông qua chỉ số trung bình bình phương (MSE). Điều này cho thấy dự báo theo mô hình thuật toán Singh và singh bậc cao cho độ chính xác khá cao. Đạt được kết quả này 57 nhờ phân chia khoảng hợp lý hơn và sử dụng các thông tin thêm có sẵn của chuỗi thời gian để dự báo. Trong khi tính toán thử nghiệm em thấy mô hình thuật toán được ứng dụng tính toán trên phần mếm MS. Excel rất thuận tiện và đơn giản và lập trình Pascal. Chính vì vậy em đã sử dụng phần mềm MS. Excel và ngôn ngữ lập trình Pascal để tính toán thử nghiệm và ứng dụng dự báo số Điện tiêu thụ tại trường cao đẳng y tế phú thọ. Do thời gian có hạn cho nên trong đề tài này em mới chỉ ứng dụng cho việc dự báo số điện tiêu thụ tại trường cao đẳng y tế Phú Thọ, trong hướng phát triển của đề tài, sắp tới em sẽ ứng dụng rộng rãi hơn trong việc dự báo cho ngành ngề như: dự báo số lượng sinh viên nhập trường hàng năm của Trường CĐYT Phú Thọ hay số lượng người mắc bệnh đái tháo đường hàng năm tại tỉnh Phú Thọ. 58 Trong luận văn này em sử dụng ngôn ngữ lập trình pascal để tính toán thử nghiệm và ứng dụng trong dự báo số điện năng tiêu thụ tại trường cao đẳng Y tế Phú Thọ Thuật toán Singh đơn giản Dữ liệu đầu vào Hình PL1: bảng dữ liệu đầu vào Chương trình: Singh đơn giản Program Singh; uses crt; Var Di,Ei,E1,E2,X,XX,Y,YY,L,U,P1,P2,P3,P4,B,F, Dgiua:real; sse,sse_t:real; i,m,n,O,q,dem: integer; 59 taptin, fkq: TEXT; Begin Clrscr; Assign(taptin, 'dulieu.txt'); Assign(fkq, 'KQ.txt'); Rewrite(fkq); Write(fkq, 'Ei':10, 'E1':10,'L':10,'U':10, 'Di':10, 'Xi':10, 'xxi':10, 'Yi':10); Writeln(fkq, 'YYi':10, 'P1':10, 'n':10, 'P2':10, 'm':10, 'P3':10, 'O':10,
'p4':10, 'q':10, 'F':10, 'SSE':10); Reset(taptin); sse_t:=0; dem:=1; While not eof(taptin) do Begin Readln(taptin, Ei, E1, E2, L, U); P1:=X;
n:=1;
End Else P1:=0;
n:=0;
End; {P2}
If (xx>=L) AND (xx<=U) then {Tinh Di}
Di:=ABS(E1-E2);
X:=Ei+Di/2;
XX:=Ei-Di/2;
Y:=Ei+Di;
YY:=Ei-Di;
If dem>=2 then
Begin
If (x>=L) AND (x<=U) then
Begin
Begin
Begin P2:=xX;
m:=1; 60 End Else P2:=0;
m:=0;
End; {P3}
If (y>=L) AND (y<=U) then P3:=y;
o:=1;
End Else P3:=0;
o:=0;
End; {P4}
If (yy>=L) AND (yy<=U) then Begin
Begin
Begin
Begin P4:=yy; q:=1; End Else Begin P4:=0; q:=0; End; B:=P1+P2+P3+P4; Dgiua:=(U+L)/2; F:=(B+Dgiua)/(1+n+m+o+q); sse:=Ei*Ei - 2*Ei*F + F*F; sse_t:=sse_t + sse; End; dem:=dem+1; Write(fkq,Ei:10:1, E1:10:1, L:10:1, U:10:1 ); Write(fkq,di:10:1, x:10:1, xx:10:1, Y:10:1, YY:10:1, P1:10:1); Write(fkq, n:10, P2:10:1, m:10, P3:10:1, O:10, P4:10:1, q:10, F:10:1); Writeln(fkq, sse:10:1); 61 End; {Doc tap tin} writeln(fkq,dem:10, sse_t/(dem-2):10:1); Close(taptin); Close(fkq); Readln; End. Sau khi chạy chương trình thì sẽ xuất ra một file có tên là KQ.txt như sau: Dữ liệu vào của Singh bậc cao: Hình PL2: Kết quả của thuật toán Singh đơn giản 62 Chương trình Singh bậc cao Program Singh; uses crt; Var Di,Ei,E1,E2,X,XX,Y,YY,P,PP,Q,QQ,G,GG,H,HH,L,U,F,
R_tong,S_tong, Dgiua:real; sse,sse_t:real; R,S,dem: integer; R1,R2,R3,R4,R5,R6,R7,R8,R9,R10,R11,R12 :Real; S1,S2,S3,S4,S5,S6,S7,S8,S9,S10,S11,S12: Real; taptin, fkq: TEXT; Begin Clrscr; Assign(taptin, 'dulieu.txt'); Assign(fkq, 'KQ.txt'); Rewrite(fkq); Write(fkq, 'Ei':10, 'E1':10,'L':10,'U':10, 'Di':10, 'Xi':10, 'xxi':10, 'Yi':10); Write(fkq, 'YYi':10, 'Pi':10, 'PPi':10,'Qi':10, 'QQi':10, 'Gi':10,'GGi':10,'Hi':10,
'HHi':10); Write(fkq, 'R1':10, 'S1':10,'R2':10,'S2':10, 'R3':10, 'S3':10, 'R4':10, 'S4':10); Write(fkq, 'R5':10, 'S5':10,'R6':10,'S6':10, 'R7':10, 'S7':10, 'R8':10, 'S8':10); Write(fkq, 'R9':10, 'S9':10,'R10':10,'S10':10, 'R11':10, 'S11':10, 'R12':10,
'S12':10); Writeln(fkq,'F':10, 'SSE':10); Reset(taptin); sse_t:=0; dem:=1; R:=0; S:=0; While not eof(taptin) do 63 Begin Readln(taptin, Ei, E1, E2, L, U); {Tinh Di} Di:=ABS(E1-E2); X:=Ei+Di/2; XX:=Ei-Di/2; Y:=Ei+Di; YY:=Ei-Di; P:=Ei+Di/4; PP:=Ei-Di/4; Q:=Ei+2*Di; QQ:=Ei-2*Di; G:=Ei+Di/6; GG:=Ei-Di/6; H:=Ei+3*Di; HH:=Ei-3*Di; If dem>=2 then Begin If (X>=L) AND (X<=U) then Begin R1:=R+X; S1:=S+1; End Else Begin R1:=0 ; S1:=0; End; {R2} If (XX>=L) AND (XX<=U) then Begin 64 R2:=R+XX; S2:=S+1; End Else Begin R2:=0; S2:=0; End; {R3} If (Y>=L) AND (Y<=U) then Begin R3:=R+y; S3:=S+1; End Else Begin R3:=0; S3:=0; End; {R4} If (yy>=L) AND (yy<=U) then Begin R4:=R+YY; S4:=S+1; End Else Begin R4:=0; S4:=0; End; {R5} If (P>=L) AND (P<=U) then Begin 65 R5:=R+P; S5:=S+1; End Else Begin R5:=0; S5:=0; End; If (PP>=L) AND (PP<=U) then Begin R6:=R+PP; S6:=S+1; End Else Begin R6:=0; S6:=0; End; If (Q>=L) AND (Q<=U) then Begin R7:=R+Q; S7:=S+1; End Else Begin R7:=0; S7:=0; End; If (QQ>=L) AND (QQ<=U) then Begin R8:=R+QQ; S8:=S+1; End Else 66 Begin R8:=0; S8:=0; End; If (G>=L) AND (G<=U) then Begin R9:=R+G; S9:=S+1; End Else Begin R9:=0; S9:=0; End; If (GG>=L) AND (GG<=U) then Begin R10:=R+GG; S10:=S+1; End Else Begin R10:=0; S10:=0; End; If (H>=L) AND (H<=U) then Begin R11:=R+H; S11:=S+1; End Else Begin R11:=0; S11:=0; 67 End; If (HH>=L) AND (HH<=U) then Begin R12:=R+Q; S12:=S+1; End Else Begin R12:=0; S12:=0; R_Tong:=R1+R2+R3+R4+R5+R6+R7+R8+R9+R10+R11+R12; End;
S_Tong:=S1+S2+S3+S4+S5+S6+S7+S8+S9+s10+S11+S12;
Dgiua:=(U+L)/2;
F:=(R_Tong+Dgiua)/(1+S_Tong);
sse:=Ei*Ei - 2*Ei*F + F*F;
sse_t:=sse_t + sse;
End;
dem:=dem+1;
Write(fkq,Ei:10:1, E1:10:1, L:10:1, U:10:1 );
Write(fkq,Di:10:1, X:10:1, XX:10:1, Y:10:1, YY:10:1, P:10:1,PP:10:1);
Write(fkq,Q:10:1, QQ:10:1, G:10:1, GG:10:1, H:10:1, HH:10:1);
Write(fkq,R1:10:1,S1:10:1,R2:10:1,S2:10:1,R3:10:1,S3:10:1, R4:10:1,
S4:10:1, R5:10:1, S5:10:1);
Write(fkq,R6:10:1, S6:10:1, R7:10:1, S7:10:1, R8:10:1, S8:10:1);
Write(fkq,R9:10:1, S9:10:1, R10:10:1, S10:10:1, R11:10:1, S11:10:1,
R12:10:1, S12:10:1, F:10:1);
Writeln(fkq, sse:10:1);
End; {Doc tap tin}
writeln(fkq,dem:10, sse_t/(dem-2):10:1);
Close(taptin);
Close(fkq);
Readln;
End. 68 Kết quả của chƣơng trình Hình PL3: Kết quả của singh bậc cao 69 [1] Q. Song, B.S. Chissom, “Fuzzy Time Series and its Model”, Fuzzy set and system, vol. 54, pp. 269-277, 1993. [2] Q. Song, B.S. Chissom, “Forecasting Enrollments with Fuzzy Time Series – Part I,” Fuzzy set and system, vol. 54, pp. 1-9, 1993. [3] Q. Song, B.S. Chissom, “Forecasting Enrollments with Fuzzy Time Series – Part II,” Fuzzy set and system, vol. 62, pp. 1-8, 1994. [4] S.M. Chen, “Forecasting Enrollments based on Fuzzy Time Series,” Fuzzy set and system, vol. 81, pp. 311-319, 1996. [5] S. M. Chen, “Forecasting Enrollments based on hight-order Fuzzy Time Series”, Int. Journal: Cybernetic and Systems, N.33, pp. 1-16, 2002. [6] K.Huarng, “Effective lengths of interrvals to improve forecasting in fuzzy time series”, Fuzzy sets and Systems, V.123, pp 387-394, 2001. [7] Nguyễn Công Điều, “Nhóm quan hệ mờ phụ thuộc thời gian trong mô hình chuỗi
thời gian mờ” “Khoa học và công nghệ”, Viện hàn lâm khoa học công nghệ Việt
Nam . 56(6), trang 659-672, 2014. [8] Yu H.K, “Weighted fuzzy time series model for TAIEX forecasting” Phisica A, 349, 609-624, 2005. [9] Chen S.M., Chung N.Y, “ Forecasting enrollments of students by using fuzzy time
series and genetic algorithm”, Information and Management Sciences, 17(3),1-17,
2006 [10] Kuo L.H., et al. “ An improved method for forecasting enrollments based on
time series and particle swarm optimization” Expert System and fuzzy
Application. 36, 6108-6117, 2009. [11] Singh S.R. “A simple method of forecasting based on fuzzy time series”, Applied Mathematics and Computation, 186, 330-339, 2007 [12] Singh S.R. “A Robust method of forecasting based on fuzzy time series”, Applied Mathematics and Computation, 188, 472-484, 2007 [13] Singh S.R. “A computation method of forecasting based on fuzzy time series ”, Mathematics and Computer in Simulation, 79, 539–554, 2008Hình 1.8 Biểu diễn theo biểu đồ Sagittal
Hình 1.9 Cấu hình cơ bản của hệ mờ
Bảng 2.1 Ánh xạ cơ sở
Bảng 3.1 Số liệu mức độ tiêu thụ điện tại trường Cao đẳng Y tế Phú Thọ
Bảng 3.2 Phân bố giá trị trong từng khoảng
Bảng 3.3 Phân khoảng
Bảng 3.4 Mối quan hệ mờ
Bảng 3.5 Nhóm mối quan hệ mờ
Bảng 3.6 Kết quả dự báo của Chen
Biểu đồ 3.1 Biểu đồ so sánh 1
3.2.2 Đồ thị so sánh Chen với Singh bậc cao
Biểu đồ 3.2 Biểu đồ so sánh 2
PHỤ LỤC
Tài liệu tham khảo