Vũ Như Lân và Đtg<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
122(08): 95 - 101<br />
<br />
DỰ BÁO CHUỖI THỜI GIAN MỜ SỬ DỤNG ĐẠI SỐ GIA TỬ<br />
Vũ Như Lân1*, Nguyễn Tiến Duy2, Trịnh Thúy Hà3<br />
1Viện<br />
<br />
công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam<br />
2Đại học Kỹ thuật công nghiệp - ĐH Thái Nguyên,<br />
3Đại học Công nghệ thông tin &Truyền thông -ĐH Thái Nguyên<br />
<br />
TÓM TẮT<br />
Song, Chissom [1, 2] lần đầu tiên đã đưa ra khái niệm mới về chuỗi thời gian mờ. Tuy nhiên mô<br />
hình tính toán nhóm quan hệ mờ trong mô hình dự báo chuỗi thời gian mờ quá phức tạp và do đó<br />
độ chính xác của dự báo không cao. Chen [3] đã thay đổi cách tính toán nhóm quan hệ mờ bằng<br />
các phép tính số học đơn giản để có được kết quả dự báo tốt hơn. Đại số gia tử (ĐSGT) là một tiếp<br />
cận mới được các tác giả N.C.Ho và W. Wechler xây dựng vào những năm 1990, 1992[6,7] khi<br />
đưa ra một mô hình xử lí các giá trị ngôn ngữ của biến ngôn ngữ hoàn toàn khác biệt so với tiếp<br />
cận mờ. Bài báo là sự tiếp tục những nghiên cứu ứng dụng ĐSGT trong lĩnh vực dự báo chuỗi thời<br />
gian mờ, một lĩnh vực mới đang được nhiều nhà khoa học trên thế giới đi sâu nghiên cứu. Trên cơ<br />
sở chuỗi dữ liệu về số lượng sinh viên nhập học tại trường Đại học Alabama qua các năm 1971<br />
đến 1992, bài báo đề xuất phương pháp dự báo hoàn toàn mới dựa trên ĐSGT và so sánh với kết<br />
quả của Song, Chissom [1,2], Chen [3], Hwang [5]và Huarng [4]. Qua đó thấy rằng: sai số dự báo<br />
được đánh giá qua tiêu chuẩn bình phương trung bình (MSE) theo tiếp cận ĐSGT nhỏ hơn nhiều<br />
so với MSE trong mô hình dự báo chuỗi thời gian mờ củacác tác giả nêu trên.<br />
Từ khoá: Tập mờ, Chuỗi thời gian mờ, Quan hệ logic mờ, Đại số gia tử<br />
<br />
MỞ ĐẦU*<br />
Trong những năm gần đây, có rất nhiều tác<br />
giả trên thế giới quan tâm nghiên cứu mô hình<br />
dự báo chuỗi thời gian mờ do Song, Chissom<br />
đưa ra đầu tiên [1,2] và được Chen [3] cải<br />
tiến. Tuy nhiên, độ chính xác dự báo còn phụ<br />
thuộc vào quá nhiều yếu tố. Vì vậy cho đến<br />
nay, mô hình dự báo chuỗi thời gian mờ luôn<br />
được nhiều chuyên gia trên thế giới cải tiến<br />
để có được kết quả tốt hơn.<br />
Tiếp cận ĐSGT là tiếp cận khác biệt so với<br />
tiếp cận mờ và đã có một số ứng dụng thể<br />
hiện rõ tính đột phá trong một số lĩnh vực<br />
công nghệ của tiếp cận này so với tiếp cận mờ<br />
truyền thống. Có thể kể đến một số lĩnh vực<br />
ứng dụng có hiệu quả như điều khiển và, công<br />
nghệ thông tin [8]. Bên cạnh đó, ĐSGT cũng<br />
cần được nghiên cứu cho một lĩnh vực ứng<br />
dụng mới, đó là bài toán dự báo chuỗi thời<br />
gian mờ. Liệu ĐSGT có thể tiếp tục khẳng<br />
định được tính ưu việt của nó trong bài toán<br />
bài toán dự báo chuỗi thời gian mờ nêu trên<br />
hay không? Đó cũng chính là nội dung nghiên<br />
cứu trong bài báo này.<br />
*<br />
<br />
Tel: 0986 437050, E-mail: vnlan@ioit.ac.vn<br />
<br />
Bài báo được trình bày theo thứ tự sau đây:<br />
Sau mục 1 Mở đầu là Mục 2 giới thiệu về<br />
phương pháp dự báo chuỗi thời gian mờ của<br />
Song, Chissom [1,2] và Chen [3]. Mục 3 nêu<br />
một số nội dung quan trọng của ĐSGT cần<br />
thiết cho bài toán dự báo chuỗi thời gian mờ.<br />
Mục 4 trình bày mô hình dự báo chuỗi thời<br />
gian mờ sử dụng ĐSGT để ứng dụng cho bài<br />
toán dự báo số sinh viên nhập học của trường<br />
đại học Alabama và so sánh với các phương<br />
pháp của Song, Chissom và Chen.<br />
MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ<br />
Một số khái niệm cơ bản của mô hình dự<br />
báo chuỗi thời gian mờ<br />
Định nghĩa 2.1 [1,2]: Chuỗi thời gian mờ<br />
Giả sử Y(t), (t = ..., 0, 1, 2, ...), là tập các số<br />
thực và cũng là tập nền trên đó xác định các<br />
tập mờ f i(t), (i = 1, 2, ...). Biến t là thời gian.<br />
Nếu F(t) là một chuỗi các tập mờ của f i(t), (i<br />
= 1, 2, ...), thì F(t) được gọi là chuỗi thời gian<br />
mờ trên Y(t), (t = ..., 0, 1, 2, ...).<br />
Định nghĩa 2.2 [1,2]: Quan hệ mờ<br />
Nếu tồn tại quan hệ mờ R(t−1, t), sao cho F(t) =<br />
F(t−1)*R(t−1, t), trong đó dấu * kí hiệu toán tử<br />
nào đó, thì F(t) được suy ra từ F(t−1). Quan hệ<br />
giữa F(t) và F(t−1) được xác định bằng kí hiệu:<br />
95<br />
<br />
Vũ Như Lân và Đtg<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
F(t−1)F(t)<br />
<br />
(2.1)<br />
<br />
Toán tử * có thể là phép kết hợp MaxMin [1]<br />
hoặc MinMax [2] hay phép tính số học [3].<br />
Nếu F(t−1) = Ai and F(t) = Aj, quan hệ logic<br />
giữa F(t) and F(t−1) được kí hiệu bằng<br />
AiAj, trong đó Ai là vế trái và Aj là vế phải<br />
của quan hệ mờ mô tả tập mờ dự báo.<br />
Định nghĩa 2.3 [1, 2]: Nhóm quan hệ mờ<br />
Các quan hệ mờ với cùng một tập mờ bên vế<br />
trái có thể đưa vào một nhóm gọi là nhóm<br />
quan hệ mờ (NQHM). Giả sử có các quan hệ<br />
mờ sau: AiAj1; AiAj2;...; AiAjn<br />
Các quan hệ mờ trên có thể đưa vào một<br />
nhóm được kí hiệu như sau:<br />
AiAj1, Aj2, ..., Ajn<br />
<br />
(2.2)<br />
<br />
Tập mờ Ajk (k = 1, 2, ..., n) chỉ được xuất hiện<br />
1 lần bên vế phải.<br />
Mô hình dự báo Song và Chissom [1, 2]<br />
Bước 1. Xác định tập nền<br />
Bước 2. Chia miền xác định của tập nền<br />
thành những khoảng bằng nhau.<br />
Bước 3. Xây dựng các tập mờ trên tập nền<br />
Bước 4. Mờ hoá chuỗi dữ liệu<br />
Bước 5. Xác định các quan hệ mờ<br />
Bước 6. Dự báo bằng phương trình Ai = Ai−1*<br />
R, ở đây kí hiệu * là toán tử max-min<br />
Bước 7. Giải mờ các kết quả dự báo.<br />
Trong bước 5, quan hệ mờ R được xác định<br />
bằng biểu thức Ri = AsT×Aq, với mọi quan hệ<br />
mờ k,<br />
(2.3)<br />
Ở đây × là toán tử min, T là phép chuyển vị<br />
và ∪ là phép hợp.<br />
<br />
Luật dự báo chuỗi thời gian mờ<br />
Giả sử dữ liệu của chuỗi thời gian F(t-1) được<br />
mờ hoá bằng Aj, khi đó, đầu ra dự báo củaF(t)<br />
được xác định theo những nguyên tắc sau đây:<br />
1. Nếu tồn tại quan hệ một-một, kí hiệu là<br />
AjAk, và mức độ thuộc cao nhất của Ak tại<br />
khoảng uk, thì đầu ra dự báo của F(t) là điểm<br />
giữa của uk.<br />
2. Nếu Aj là trống, có nghĩa là Aj và Aj có<br />
mức độ thuộc cao nhất tại khoảng uj, thì đầu<br />
ra dự báo là điểm giữa của uj.<br />
3. Nếu tồn tại quan hệ một - nhiều, kí hiệu là<br />
AjA1, A2, ..., An, và mức độ thuộc cao nhất<br />
của A1, A2, ..., An tại các khoảng u1, u2, ..., un<br />
tương ứng, thì đầu ra dự báo được tính bằng<br />
trung bình các điểm giữa m1, m2, ..., mn của<br />
u1, u2, ..., un. Phương trình dự báo có dạng:<br />
(m1+m2+ ... +mn)/n.<br />
TÓM TẮT MÔ HÌNH TÍNH TOÁN CỦA<br />
ĐẠI SỐ GIA TỬ<br />
Gọi AX = (X, G, C, H, ) là một cấu trúc đại<br />
số, với X là tập nền của AX; G = {c, c+} là<br />
tập các phần tử sinh; C = {0, W, 1}, trong đó<br />
0, W và 1 tương ứng là cận trái, trung hòa và<br />
cận phải; H là tập các toán tử một ngôi được<br />
gọi là các gia tử; là biểu thị quan hệ thứ tự<br />
trên các giá trị ngôn ngữ. Gọi H là tập hợp<br />
các gia tử âm và H+ là tập hợp các gia tử<br />
dương của AX. Kí hiệu H = {h-1, h-2, …h-q},<br />
trong đó h-1< h-2< … < h-q và H+ = {h1, h2, …,<br />
hp}, trong đó h1< h2< … < hp.<br />
Định nghĩa 3.1 [7,8]: Độ đo tính mờ.<br />
fm: X [0, 1] gọi là độ đo tính mờ nếu thỏa<br />
mãn các điều kiện sau:<br />
fm(c)+fm(c+) = 1 và<br />
<br />
Mô hình dự báo Chen[3]<br />
<br />
<br />
<br />
Bước 1. Chia miền xác định của tập nền<br />
thành những khoảng bằng nhau.<br />
<br />
Với các phần tử 0, W và 1,<br />
fm(0) = fm(W) = fm(1) = 0<br />
<br />
Bước 2. Xây dựng các tập mờ trên tập nền<br />
<br />
Và với x, y X, hH,<br />
<br />
Bước 3. Mờ hoá chuỗi dữ liệu.<br />
Bước 4. Xác định các quan hệ mờ.<br />
Bước 5. Tạo lập nhóm quan hệ mờ.<br />
Bước 6. Giải mờ đầu ra dự báo.<br />
96<br />
<br />
122(08): 95 - 101<br />
<br />
hH<br />
<br />
fm(hx) = fm(x), với x X<br />
<br />
fm(hx) fm(hy )<br />
<br />
fm( x)<br />
fm( y )<br />
<br />
(3.1)<br />
(3.2)<br />
<br />
(3.3)<br />
<br />
Đẳng thức (3.3) không phụ thuộc vào các<br />
phần tử x, y và do đó ta có thể kí hiệu là (h)<br />
<br />
Vũ Như Lân và Đtg<br />
<br />
Tạp chí KHOA HỌC & CÔNG NGHỆ<br />
<br />
và đây là độ đo tính mờ của gia tử h. Tính<br />
chất của fm(x) và (h) như sau:<br />
fm(hx) = (h)fm(x), xX<br />
(3.4)<br />
p<br />
<br />
<br />
<br />
i q ,i 0<br />
p<br />
<br />
<br />
<br />
i q ,i 0<br />
q<br />
<br />
fm(hi c) fm(c) , với c {c, c+} (3.5)<br />
fm(hi x) fm( x)<br />
<br />
(hi ) và<br />
<br />
i 1<br />
<br />
(3.6)<br />
<br />
p<br />
<br />
(h ) , với , > 0<br />
i 1<br />
<br />
i<br />
<br />
và + = 1<br />
(3.7)<br />
Định nghĩa 3.2 [7,8]: Hàm dấu<br />
Hàm Sign: X{-1, 0, 1} là một ánh xạ được<br />
gọi là hàm dấu với h, h'H và c {c, c+}<br />
trong đó:<br />
Sign(c) = 1, Sign(c+) = +1<br />
(3.8)<br />
<br />
122(08): 95 - 101<br />
<br />
hoá (semantization), còn việc chuyển ngược<br />
lại từ đoạn [as, bs]sang [a, b] được gọi là phép<br />
giải nghĩa (desemantization). Trong nhiều<br />
ứng dụng của ĐSGT, đã sử dụng miền ngữ<br />
nghĩa là đoạn [as = 0, bs = 1], khi đó phép ngữ<br />
nghĩa hoá được gọi là phép chuẩn hoá<br />
(Semantization = Normalization) và phép giải<br />
nghĩa được gọi là phép giải chuẩn<br />
(Desemantization = Denormalization).<br />
<br />
MÔ HÌNH DỰ BÁO CHUỖI THỜI<br />
GIAN MỜ SỬ DỤNG ĐSGT<br />
Bước 1. Chia miền xác định của tập nền<br />
thành những khoảng bằng nhau.<br />
Bước 2. Xây dựng các nhãn ngữ nghĩa trên<br />
tập nền.<br />
Bước 3. Ngữ nghĩa hoá chuỗi dữ liệu.<br />
<br />
Bước 4. Xác định các quan hệ ngữ nghĩa theo<br />
Sign(hc)=Sign(c), nếu h là âm đối với c (3.9)<br />
Sign(hc)=+Sign(c), nếu h là dương đối với c (3.10) nhãn ngữ nghĩa.<br />
Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa<br />
Sign(h'hx) = Sign(hx), nếu h’hx ≠ hx và h' là<br />
theo nhãn ngữ nghĩa.<br />
âm đối với h<br />
(3.11)<br />
Sign(h'hx) = +Sign(hx), nếu h’hx ≠ hx và h' là<br />
Bước 6. Giải nghĩa đầu ra dự báo.<br />
dương đối với h<br />
(3.12)<br />
Bài toán được chọn để làm rõ hiệu quả dự báo<br />
Sign(h'hx) = 0 nếu h’hx = hx<br />
(3.13)<br />
của mô hình trên là bài toán dự báo số lượng<br />
Gọi fm là một độ đo tính mờ trên X, ánh xạ<br />
sinh viên nhập học tại trường Đại học<br />
ngữ nghĩa định lượng : X [0, 1], được<br />
Alabama trên cơ sở các số liệu có từ năm<br />
sinh ra bởi fm trên X, được xác định như sau:<br />
1971 đến năm 1992 tương tự bài toán dự báo<br />
<br />
của Song & Chissom [1, 2] và Chen [3] với<br />
(3.14)<br />
v(W) fm(c ),<br />
các bước như sau:<br />
(3.15)<br />
v(c ) fm(c ) fm(c )<br />
Bước 1: Xác định tập nền, chia miền xác định<br />
v(c ) fm(c ) 1 fm(c ) (3.16)<br />
của tập nền thành những khoảng bằng nhau.<br />
Tập nền U đã được Chen chọn có khoảng xác<br />
v(h j x) v( x) sign(h j x)<br />
(3.17)<br />
định: [Dmin−D1, Dmax−D2] với Dmin và<br />
j<br />
{ i sign ( j ) fm(hi x) (h j x) fm(h j x)}<br />
Dmax là số sinh viên nhập học thấp nhất và<br />
cao nhất theo dữ liệu lịch sử nhập học của<br />
1<br />
(h j x) [1 Sign(h j x)<br />
trường. Cụ thể Dmin = 13055 và Dmax =<br />
(3.18)<br />
2<br />
19337. Các biến D1 và D2 là các số dương<br />
sign(hp h j x)( )] { , }<br />
được chọn sao cho khoảng [Dmin−D1,<br />
j [-q^p], j 0.<br />
Dmax−D2] bao được số sinh viên nhập học<br />
thấp nhất và cao nhất trong tương lai. Sử dụng<br />
Giả sử rằng miền tham chiếu thông thường<br />
cách chọn của Chen, D1 = 55 và D2 = 663,<br />
của các biến ngôn ngữ X là đoạn [a, b] còn<br />
như vậy U = [13000, 20000]. Khoảng xác<br />
miền tham chiếu ngữ nghĩa Xs là đoạn [as, bs]<br />
định tập nền U được Chen và nhiều tác giả<br />
(0≤as