Giáo trình Một số ứng dụng mạng nơron xây dựng mô hình nhận dạng và dự báo: Phần 2

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:84

Thêm vào BST

Báo xấu

8
lượt xem 4
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nối tiếp nội dung phần 1, phần 2 cuốn giáo trình "Một số ứng dụng mạng nơron xây dựng mô hình nhận dạng và dự báo" trình bày các nội dung: Mạng nơron logic mờ TSK, một số ứng dụng mạng nơ ron trong nhận dạng và dự báo. Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Giáo trình Một số ứng dụng mạng nơron xây dựng mô hình nhận dạng và dự báo: Phần 2

Chương 3 MẠNG NƠRON LÔGIC MỔ TSK CTakaga - Sugeno - Kang) 3.1. LÔGIC MỜ 3.1.1. Khái niệm lôgic mờ Khái niệm “lôgic mờ” dùng để chỉ việc xử lý các thông tin mà giá trị lôgic không thể xác định rõ, hoặc biến thiên theo điều kiện bên ngoài. Chẳng hạn, với các mệnh đề "Nhiệt độ
c (xấp xỉ 3 ) hay không thì cũ n g không khẳng định là X = 2 hay X - 2,9 không thuộc c (không xấp xi 3). Khác với lôgic kinh điển chi có hai giá trị là 1 nếu X e c hoặc bang 0 nếu X Ể c , lôgic m ờ sẽ đưa ra quan niệm mới có vai trò làm rõ định nghĩa ch o tập m ờ . N ó i m ộ t cá ch k h á c , vớ i lôgic m ờ thì m ộ t g iá trị X n ào đ ó sê có th ể th u ộ c về tậ p c k h o á n g b ao n h iê u ph ần trăm ? đ iề u đó sẽ đ ư ợ c th ể hiện thông qua giá trị hàm liên thuộc n(x) tại điểm X đó sẽ bằng bao nhiêu. C h ẳ n g h ạ n có th ề nói n h ư sau: “ g iá trị X = 2,9 th u ộ c về tậ p c ch ín sáu p hần trăm ” hay “giá trị X = 2 thuộc về tập c bốn sáu phần trăm” và giá trị bao nhiêu phần trăm đó sê tuỳ thuộc vào cách xây dựng mô hình hàm liên thuộc như thế nào? Như vậy với ví dụ trên, cần có độ tin cậy của mệnh đề X = 2 ,9 e c phải ca o hơn độ tin cậy của m ệnh đề X = 2 € c. 3.1.2. Biểu thức giá trị mờ Đe tìm hiểu về biểu thức giá trị mờ, ta xét 3 dạng biểu thức mờ cơ bàn sau: - X n h ỏ h ơ n n h iề u so v ớ i A : X —co (3.1) 0 0 0 0 0 0 0 0 0. ol--------------------*----------- 1*-----L -4 -3 -2 -1 - 0 - 2 - H ìn h 3 .1 . H àm liê n thuộc c ủ a biểu thứ c m ờ X « A 51
Đối với biểu thức mờ X » A , hàm liên thuộc n*A(x) sẽ có dạng hình chuông như hình 3.2 với 0 < (x ) < 1, được định nghĩa: 1 khi X= A y = ^ A(x ) = ' (3.2) 0 khi |x - a | -> 00 H ìn h 3.2. H àm liên t h u ộ c h ìn h c h u ô n g c ủ a b iể u t h ứ c m ờ X » A Đối với biểu thức mờ X » A , hàm liên thuộc H-*A(x) sẽ có dạng như hình 3.3 v ới 0 < ịa ^ ( x ) < 1, được định nghĩa: í-» 1 khi X - A -> +00 y = n * A( x ) = (3.3) -> 0 khi X - A -> -00 H ìn h 3.3. H àm liên th u ộ c c ủ a b iể u t h ứ c m ờ X » A Các hàm liên thuộc đều có thể được mô tả dưới dạng rời rạc gồm một tập các giá trị liên thuộc. Đối với các hàm liên thuộc hình chuông, thuờng sử dụng hàm Gauss và được mô tả bằng phương trình: 1 (3.4) ^ c ,b ,a ( x ) : / \ x -c 1+ \ ơ / 52
Trong đó: b ,ơ € R và X, c là các vectơ. Ba thông số c, b và ơ có thể điều chỉnh linh hoạt, nên hình dạng của hàm liên thuộc sê được thay đổi bởi ba tham số là: Trọng tâm c, độ mở ơ và hệ số mũ b. Đe làm rõ về ảnh hưởng của các tham số đến hình dạng của hàm liên thuộc, xét ví dụ về tập m ờ c gôm các số thực gần bằng 3 c =|x e R|x a 3| s Hàm phụ thuộc ^3 (x ) tại điểm X nào đó phải có giá trị trong khoảng [0,1], tức là: 0 ^ , 3( x ) < l trong đó: (x ) — 1 khi |x - 3 | -> 0 và > (x ) — 0 khi |x - 3 | — 00 . > > Già sử chọn giá trị c = 3, độ mở ơ = 1, b = 1 thì hàm liên thuộc của tập c như sau: / 2 1 + ( M ) 2 1+ M ì V 1 H ìn h 3.4a. H ìn h d ạ n g c ủ a h à m liên th u ộ c n«3 (x) v ớ i b a đ ộ m ờ k h á c n h a u 53
H ìn h 3.4b. H ìn h d ạ n g h à m liên t h u ộ c n . 3 (x) v ớ i g iá trị k h á c n h a u h ệ s ố b Hình 3.4a mô tả hình dạng của hàm liên thuộc n*3(x) với hệ số mũ được chọn cố định b = 1 và giá trị độ mở ơ lần luợt thay đổi bằng 1, 2 và 3. Trên hình 3.4b, nếu chọn giá trị độ mở ơ cố định bằng ] và giá trị b thay đổi lần lượt bằng 0,5 thi hàm kích hoạt có dạng gần như hình tam giác, b = 1 có dạng hình chuông và b = 3 có dạng gần với hình thang. Một điểm chung trong các hàm n*3(x) là các điểm có giá trị càng gần trọng tâm thì sẽ có giá trị liên thuộc càng lớn (tiến tới 1), đối với các điểm có g iá trị cà n g xa trọ n g tâ m th ì có giá trị liên th u ộ c c à n g n h ỏ (tiến tớ i 0). 3.1.3. Quy tắc suy luận mờ và giá trị của quy tắc suy luận mờ Trong lý thuyết điều khiển, các quy tắc điều khiển thường được mô tả dưới dạng mệnh đề điều kiện IF ... THEN IF đầu vào là A THEN đầu ra là B (3.5) Đối với khái niệm điều khiển chính xác, cần chỉ rõ rằng nếu đại lượng đầu vào có giá trị cụ thể bao nhiêu thì đầu ra cũng bằng một giá trị cụ thể nào đó. N hư vậy một quy tắc suy luận chính xác sẽ có cấu trúc như sau: IF X= A THEN y = B (3.6) tức là khi giá trị X bằng A thì giá trị y sẽ bằng B. 54
Tuy nhiên một vấn đề đặt ra: Neu khi giá trị X “xấp xỉ” bàng A thì giá trị y sẽ bằng bao nhiêu? Và với các giá trị X lân cận quanh giá trị A với độ “xấp xỉ” khác nhau thì có thể tính được giá trị của y hay không? Khái niệm “lôgic mờ” sẽ trả lời được câu hỏi trên thông qua quy tắc suy luận mờ. Một quy tắc suy luận m ờ sẽ có cấu trúc như sau: IF X»A T H E N y as B (3.7) tứ c là n ếu X x ấp xỉ b ằn g A th ì y sẽ x ấp xỉ bằn g B. K hi X b ằn g A th ì sê có y băng B. Ở đây k h ái n iệ m “ x ấp x ỉ” sẽ đư ợ c biểu d iễn th ô n g q u a h àm liê n th u ộ c ^ U a (x ) v à thông qua giá trị của hàm liên thuộc. Với một giá trị đầu vào X bất kì, có thể đề xuất phương pháp tính được giá trị đầu ra y của quy tắc suy luận mờ như sau: y = B-H*A(x) (3-8) Trên thực tế. một hệ thống điều khiển hay nhận dạng không chi có duy nhất một quy tắc suy luận mờ mà thông thường sẽ bao gồm một tập hợp các quy tấc suy luận mờ. Như vậy đáp ứng đầu vào của hệ thống trong cùng lúc sẽ chịu tác động của nhiều quy tắc suy luận mờ. Ví dụ: hệ thống gồm có 4 quy tắc mờ R l, R2, R3, R4 như hình 3.5 R l: If X, is small and x 2 is small Then y = 3x, + 2 x 2 -4 R2: If Xị is small and x 2 is big Then y = 2xj -3 x 2 +5 R 3: If X, is b ig an d X, is big T h en y = - X ,- 4 x 2 + 3 R 4: If Xj is b ig an d x 2 is sm all T h en y = -2X] + 5 x 2 -3 Giả sử vectơ đầu vào là: X = ( x ,;x 2)' = (10;0,5)T. khi đó các giá trị liên thuộc tương ứng với các quy tắc sẽ được lần lượt tính toán bằng: 0,24; 0,8; 1,0; 0,3, tương ứng với các giá trị đầu ra là: yRi = 27; y R2 = 23,5; ỷ R = -9; yR 4 =-20,5. ì 55
“ T T I IF » u id T H E N y — 3X | + 2 x -> - 4 ' H s ■| S i * . 1— p ^ * « - 27 IF » in J T H E N y “ 2 )1| - 3 * 1 + 5 Ỳ Ỵ w „ I - 2 -V S and T H E N V — -X 1 - + Ĩ IF M l , ' 1 ^ 1 .. m -Q IF ỉi r t d T H E N y - - 2 X | + 5 x -> - 3 u t „ ' H i * , . - -2 0 .5 H ìn h 3.5. ĐỒ th ị h ệ th ố n g g ồ m c ó 4 q u y t ắ c m ờ Trong trường hợp này độ mạnh của luật được chọn chính bàng giá trị liên th u ộ c củ a X tro n g từ n g qu y tắc. G iá trị |ij(x) v à g iá trị đ ầu ra c ủ a toàn h ệ th ố n g đối vớ i m ộ t g iá trị X nào đó sẽ đ ư ợ c tín h d ự a trên ản h hướ ng (độ mạnh) của các quy tắc đối với giá trị X đó và được tính như sau: Z n ,(x )-y ,(x ) y =^ ----------- ito i=l = 0 ,2 4 .2 7 + 0 , 8.23, 5 + 1 , 0.(-9) + 0,3. (-20, 5) y 0 ,2 4 + 0,8 + 0,1 + 0,3 N trong nhiều trường hợp giá trị ^ Ị i l(x)được quy chuẩn bằng 1 nên ta có i«i y = ẳH i(x)yi(x) (3.10) i= 1 3.2. MẠNG TSK (TAKAGA - SUGENO - KANG) 3.2.1. Mô hình mạng TSK 3.2.1.1. Các luật suy luận TSK Mạng TSK ià mạng nơron lôgic mờ, dùng để mô phỏng các luật suy luận và điều khiển m ờ do ba tác giả người Nhật là Takaga, Sugeno và Kang đề xuất. Một quy tắc suy luận m ờ TSK có dạng như sau: 56
if X ss c then y « f ( x ) = a 0 + a,X, + ... + a Nx N (3.11) trongđó X = [ x , , x 2,..., x n ]T , c = [c ,, C2,..., C N]' G R N Quy tắc trong phương trình (3.11) có một vectơ đặc trưng c được gọi là trọ n g tâ m c ủ a qu y tắ c . N eu v e c tơ đ ầu v ào X cà n g g ần vớ i trọ n g tâ m này thì đầu ra của quy tắc sẽ càng gần với giá trị f(x) với f là một hàm tuyến tính ch o trư ớ c c ủ a v e c tơ đ ầ u vào (trư ờ n g hợ p đ ặc b iệ t, khi X = c th ì y = f(x)). Hiếu theo một cách khác, luật suy luận này dùng để tạo đáp ứng đầu ra khi số liệu đầu vào thuộc về lân cận của một điểm c = [c ,, C2,..., C N]T e R N nào đó. Đe có thể tạo ra một mô hình suy luận bao trùm được không gian số liệu đầu vào, có thể sử dụng hệ nhiều quy tắc suy luận: if X » c , th en y, w ^ ( x ) • ........................ ........... (3.12) if X « C M then y M « fM(x) Có thể thay các giá trị phụ thuộc mờ ở hệ trên bằng các hàm chính xác: ■y, = W .Ci(x )f,(x ) • ........................ (3.13) y M = w ,CM x ) f M ( (x) Trong đó w c ( là hệ số kích hoạt cùaluật mờ. K hi đó, ứ n g với m ỗi đ ầ u vào X, m ỗi qu y tắc suy lu ận sẽ đ ư a ra m ộ t đáp ứng yi. Để có thể tổng hợp lại và đưa ra được một đáp ứng duy nhất, các tác giả đ ã đề x u ấ t lấy tru n g b ìn h trọ n g số c ủ a các đ áp ứ n g riê n g lẻ. T ừ đó có: Ì w , C|(x )f,(x ) y = ± ^M— ------------
L I l l 'l l I H ìn h 3.6. Mô h ìn h h ệ n h iề u lu ậ t 3.2.1.2. Cấu trúc chung m ạng TSK Phát triển từ hệ suy luận các tác già Takaga, Sugeno và Kang đã đề xuất mô hình mạng TSK để mô phỏng hệ suy luận. Mạng này thuộc hệ thống các hệ suy luận mờ, ngày nay được áp dụng rộng rãi trong kỹ thuật. Để mô phỏng hoạt động của hệ thống ta có cấu trúc mạng được trình bày cụ thể như hình 3.7, cấu trúc gồm 5 lớp: H ìn h 3.7. C ấ u t r ú c m ạ n g TSK k in h đ iẻ n 58
Lớp thứ nhất bao gồm các khối M.jfxj) còn được gọi là khối mờ hoá cho thành phần thứ j của vectơ đầu vào X. Mỗi khối mờ hoá thường sử dụng hàm Gauss m ở rộng như biêu thức (3.15) (3.15) / \ 1 X o 1+ ơụ n V / được đặc trưng bới 3 tham số C jj.b jjjC T jj , trong đó: c là số trọng tâm, b là hệ số mũ, ơ là độ mở, i là số luật, j số kênh đầu vào. Hàm Gauss mở rộng này có tính chất là ( XJ) —■1 khi > ||xj — -> 0 CjjII và >0 khi ' 00 . x i ~ c« Lớp thứ hai là khối nhân, dùng để tính tích đầu ra của các khối m ờ hoá M x ) = n ^ j ( x j) (3 1 6 ) H Đầu ra cùa lớp thứ hai sẽ là các hệ số kích hoạt Hi (x ) của các kênh suy luận fj phía sau. Lớp thứ ba là khối tính các giá trị hàm fj đầu ra của mạng TSK, đây là các hàm tuyên tính. Lớp thứ tư là khối tính toán các thành phần tử số f| và mẫu số Ỉ2. f, - ĩ w , f (i)( x ) (3 .1 7 ) i=l M f2= ẼW , (3.18) i=l Lớp thứ năm là khối tính đáp ứng cuối cùng của mạng TSK M £w,f">(x) , _ j=l__________ __ (3.19) y =- M r Ịw . f> 1= 1 Trong cấu trúc này ta có lớp 2, 4 và 5 là các lớp tính toán và hoạt động cố định. Các lớp 1 và 3 là các lớp có các tham số có thể thay đổi thích nghi để xây dựng mô hình tối ưu. Lớp 1 đó là các tham số Cị, b,, ơị của các khối mờ hoá, trong lớp 3 đó là các hệ số ay cùa hàm tuyến tính. 59
3.2.13. Cải tiến cấu trúc kinh đién và thuật toán xây dụng mạng TSK Trong m ẫu truyền thống, độ mạnh của quy tắc mờ thứ i phụ thuộc khoảng cách giữa vectơ đầu vào và mẫu của quy tắc và được tính toán bằng: Mx)=rWxj)=ÍỊ— >1 j.| \ 2b„ (3.20) 1+ ơ„ Điều này đòi hỏi hệ số mũ và độ m ở được xác định cho mọi tín hiệu đầu vào. Những hệ số này là cần thiết để xác định dữ liệu theo từng chiều, nhưng tại cùng m ột thời điểm chúng làm phức tạp cấu trúc của mạng và làm tăng số lượng các tham số phi tuyến. Đe giảm số lượng các tham số phi tuyến ta sử dụng công thức xác định khoảng cách. Phương pháp được thế hiện dưới dạng tổng quát như sau: d 2(x ,c) = ( x - c ) T. S .( x - c ) (3.21) Trong đó s là m a trận xác định duơng, đối xứng. Có thể dễ dàng nhận ra rằng (3.21) là công thức tổng quát hom công thức xác định khoảng cách Eucildes kinh điển, trong đó s = I - ma trận đom vị. Với phương pháp này, mức độ kích hoạt của quy tắc thứ i có thể chỉ chứa một cặp hệ số m ũ và độ rộng cho mọi biến N. Hàm mờ hiệu chỉnh được xác định là: M * )= 7 - Vb, (3.22) x -c . 1+ Mầu hiệu chinh mạng TSK chỉ có M x (N + 2) tham số điều chỉnh phi tuyển. 60
Để điều chỉnh các tham số cùa mạng ta có thể chia các tham sô thành 2 nhóm: Tham so a,j của các hàm trong mạng TSK gọi là các tham sô tuyên tín h , v à c á c th a m số CjjbjjOj gọi là các tham số phi tu y ế n . T h u ậ t to á n đ iề u chinh được thực hiện như sau: 1. Hiệu chỉnh các tham số tuyến tính ajj các hàm của m ạng TSK tại các giá trị cố định các tham số phi tuyến. 2. Hiệu chỉnh các tham số phi tuyến tại các giá trị cố định các tham số tuyến tính. Các bước 1 và 2 được lặp lại nhiều lần cho đến khi thiết lập được các tham số của mạng. Tại N biến đầu vào và M quy tắc độc lập có M x (N + 1) tham số tuyến tính có thể điều chỉnh được của hàm TSK cho mỗi đầu ra. Trong bước 1, các tham số phi tuyến là cố định và với sự kích thích của hệ thống bởi vectơ X , tín hiệu đầu ra có thể viết dưới dạng: M r N y(x ) = X h ( x ) a l0-t-X a uxj (3.23a) i=J j= l Khi có p cặp mẫu { X j, dj} i = l ,. .. ,p , ta ký hiệu Wjj = Hị í tính cho mẫu đầu vào X(j). Các cặp mẫu này cho phép xây dựng được hệ p phương trình tuyến tính, từ đó có thể xác định được các thông số tuyến tính tối ưu (ứng với sai số nhỏ nhất). Hệ p phương trình tuyến tính được khái quát như sau: a io w vvll • W h X in •• W M 1 wv M 1 X I1 v a • W M,X d| a iN w1 2 W,2X2I . ■ W I2 * 2 N • ■ WM2 w M2X 2! • W M2X d2 X — a M0 W, 'p w .p x p . • • W lpXpN .• WMp w Mp Xpl • WMpx d _ p_ _a M N . (3.23b) Hoặc dưới dạng ma trận W *A = D (3.24) Ma trận w có kích thước là p x (N + l)M . Hệ phương trình này được xác lập bằng cách sử dụng ma trận nghịch đảo già của w . 61
A = w +X D (3.25) với w + là ma trận nghịch đảo giả của w , được tính bằng cách sử dụng thuật toán SVD. Sau khi cố định giá trị của các tham số phi tuyến, bước thứ 2 bắt đầu với việc tính giá trị đầu ra cần thiết bằng cách sử dụng mối quan hệ tuyến tính. Y= w XA (3.26) Có các giá trị đầu ra có thể xác định giá trị của các hàm mục tiêu. E = ịẳ ( y ( x ,) - d ,) 2 (3.27) £ /=I Các tham số phi tuyến được hiệu chỉnh bằng cách sử dụng phương pháp bước giảm cực đại: ỔE(t) C kj ( t + l ) = C kj ( t ) - T l c (3.28) ổckj ỠE(t) ơ kj(t + l) = ơ kj( t ) - T ia , lo (3.29) ổE(t) b kj(t + l) = bkj( t ) - T ib (3.30) ổbkj Các phương trình từ (3.28) đến (3.30) sừ dụng độ dốc cùa hàm mục tiêu E với các tham số phi tuyến, độ dốc đối với mẫu ca(i cùa biến thứ p và quy tắc thứ a có thể biểu diễn trong mối quan hệ sau: * = ẳ ~ ? t ệ f k [ Ễ w ., ( g „ < x , ) - e „ < x , ,) (3.31) otB /-1 Í Ỹ ' , , , a P Lm=l Z , w( i V i= i / với ga (x,) = a a0 + ^ a ajx lj tacó H 4bj X Waíx ( l - W J x ị s pjx (x r c aj) ÕWC ___________________ H (3.32) õ c ap d (x, ca ) Hàm dốc liên quan tới cla) là 62
4e,baW „ (l-W a) . £ s pj(x/j- c aj) aw, p ----------- 7------------72------ — ------------------------ Z W w (g a /-g w ) ap i= i i /=1 i> i d 2(x, c(r|) H y (3.33) Tương tự các hàm dốc quan hệ tới ơ i b như sau: ÕE V 2b" M W J1 -W J (3.34) ổơ„ - t Z w k/(ẽa/-gk/) . k =l L w/ j Vj= y | dE _ Ỷ 2e (/) d(Xp ca ) M ln (1 -W J Z W w ( g a/ - g k / ) (3.35) ổba “ h í M k=l ? Wj V -i=l 3.2.2. Khởi tạo tự động của các quy tắc suy luận mờ, thuật toán Gustafson - Kessel Một trong những vấn đề quan trọng nhất trong mạng TSK là xác định số lượng các quy tác có thể sử dụng được trong mẫu dữ liệu. Càng nhiều quy tắc có nghĩa là biểu diễn dữ liệu càng tốt, nhưng nó cũng làm tăng độ phức tạp của mạng, làm tăng chi phí xử lý dữ liệu. Mạng điều khiển quá phức tạp có thể dẫn tới giảm khả năng tổng quát hoá, làm giảm chất lượng hoạt động của mạng. Để giải quyết với nhiều đầu ra, có thể viết các đẳng thức tương tự cho mỗi đầu ra. Tuy nhiên, điều đó có nghĩa là làm tăng độ phức tạp của giải pháp. Vì vậy vấn đề quan trọng nhất là giảm số lượng các quy tắc suy luận bàng cách loại bỏ sự kết hợp với những vùng dữ liệu trống. Giải quyết vấn đề này, áp dụng thuật toán tự tổ chức mờ của dữ liệu bằng thuật toán Gustafson - Kessel để xác định vị trí của các mẫu. Ký hiệu các vectơ dừ liệu trong tập hợp là Xị e R N với i = l ,2 , .. ., p . Ta sẽ phân chia các vectơ này thành M nhóm, mỗi nhóm được đại diện bởi vectơ trọng tâm c = [ c M c 3,...,c jN] . Đặt u = , € R M là ma trận các xp 63
hệ số p h ụ th u ộ c Ujj - m ứ c độ p hụ th u ộ c củ a Xj (j = l,2 ,...p ) vào n h ó m th ứ i(i = . Thuật toán chia nhóm được thực hiện với hàm mục tiêu E được định nghĩa theo công thức: M p E = £ l < d 2(x j)Cj) (3.36) 1=1 j=i Một phân chia tốt sẽ có giá trị hàm E nhỏ. M Các thuật toán tối ưu hóa E được xây dựng với các ràng buộc ^ Ujj=1 i=l với j = 1, 2,..., p và 0 < V u ,j < p với i = 1, 2,..., M. Tham số m dùng để điều chỉnh tính mờ của các nhóm (thường thì m = 2). Hàm dCx^Cj) xác định k h o ản g cá ch g iữ a v e c tơ d ữ liệu Xj v à m ẫu Cj c ủ a n h ó m th ứ i. M ộ t tro n g những thuật toán mờ hiệu quả nhất là thuật toán Gustaffson - Kessel (G-K). Thuật toán G-K được thể hiện với các bước sau : 1. Khởi tạo tạm thời mộtcách ngẫu nhiên các trọng tâm c, với i= tính ma trận u . 2. Xác định vị trí các trọng tâm theo công thức c, =J~ Ị~ — (3.37) j-i 3. Tính các hiệp biến nhóm F(0 và ma trận s, (i = theo X < ( x J - c ,) ( x J - c 1)T r — _________________ (3.38) P s, = ^ d e t(F i).[Fi]-' (3.39* 4. Ước tính khoảng cách djj2(i = l,2 ...,p ) giữa vectơ đầu vào Xj và c m ẫu nhóm Cj dị = (xj - c i)T.Sỉ.(xj - c i) (3.40) 64
5. Xác định các ma trận đầu vào U jj(i = 1 ,2 ,...,M và j = l,2 ,...,p ) the quy tăc u,ij (3.41) Nếu d = 0 trong trường hợp i = I, lấy U = 1 và U = 0 cho I * i . ,J |J Lặp lại tới khi ||Ư - UM|| < e cho hai hước lặp lại liên tiếp. Hình 3.9 là một ví dụ về tổ chức không gian dữ liệu thành các nhóm dữ liệu bàng thuật toán G-K, trong đó các điểm trong một nhóm nam trên cùng một đường elip sẽ có giá trị liên thuộc bằng nhau. Thuật toán G-K được dùng để khởi tạo quá trình học của mạng nơron. Sau khi áp dụng thuật toán G-K, các vùng dữ liệu sẽ được thiết lập, đồng thời xác định được các giá trị liên thuộc ban đầu của các điêm dữ liệu trong các tập dữ liệu học. Quá trình học tiếp theo của mạng TSK sẽ điều chỉnh lại các giá trị liên thuộc của các điểm dữ liệu cũng như các giá trị tuyến tính ay đê kêt quả học được chính xác. 1 25 0 75 05 0 25 0 -0 2 5 - 0.25 0 0.25 0.5 0.75 1.25 H in h 3.9. P h â n b ố c á c n h ó m d ữ liệ u b à n g t h u ậ t t o á n G-K 65
3.2.3. Xác định sô lượng nhóm thông qua việc phôi hợp 6 chi sô thông kê Nhiệm vụ ước lượng số nhóm tập trung của số liệu và vị trí phân bô của các nhóm là một trong những vấn đề cơ bàn của các bài toán xử lý tín hiệu nói chung và xác suất thống kê nói riêng. Đã có rất nhiều các công trình nghiên cứu về nhiệm vụ này và các công trình nghiên cứu đã đề xuất nhiều công thức chỉ số thống kê khác nhau. Tuy nhiên, cũng theo các nghiên cứu thì mỗi chỉ số thống kê thường có tác dụng cho những trường hợp phân bố số liệu nhất định. Do đó các đánh giá vẫn chủ yếu là theo tính kinh nghiệm, chưa có kết luận khẳng định chính thức về sự vượt trộicủa chỉ số nào so với các chỉ số còn lại trong mọi trường hợp phân bố số liệu. Với thực tế như vậy, một hướng đề xuất mới hiện nay là cần sử dụng phôi hợp nhiều chỉ số đồng thời để nâng cao được độ tin cậy của việc ước lượng. Một số công trình trước đây đã sử dụng phối hợp đến 4 chì số, trong nội dung này chúng tôi đề xuất sử dụng thêm 2 chi số nữa tổng cộng là 6 chi số để ước lượng số nhóm trong phân bố số liệu. Thông qua một số ví dụ minh chứng hiệu quả cao hơn của việc sử dụng 6 chi số so với sử dụng 4 chi số. 6 chi số được lựa chọn là: 1. Chi số thế tích mờ của nhóm Vh M (3.42) 11 = 2. Chỉ số mật độ phân bố mờ trung bình D a (3.43) Với các tham số SSị (i = 1 ,2 ,...,M ) chỉ được tính toán cho các vectơ Xk, với phạm vi là độ lệch chuẩn của các đặc tính nhóm và được xác định như sau: S S | = ^ u jk cho từng biến k mà (xk - c , ) r. [ s (,>J .(xk - C j ) < l . 66
3. Chi số trung bình khoảng cách nhóm Dw 1 M, D = — Y - k=l_____ V (3.44) M tr 4. Chỉ số trung binh độ phăng của nhóm tA 1^ (3.45) M tr Trong đó tị = A / Ằn với x.jj là giá trị thứ j ma trận hiệp biến Fj, sắp .jn xếp theo thứ tự giảm dần, ví dụ: x n > >... > X Một phân chia tốt khi ,jN. chi số của Vh và t A đạt giá trị min, các chi số của D a và Dw đạt giá trị max. 5. Chi số PBM PBM (k) = L ầ i. D l (3.46) k El Trong đó: k là số trọng tâm; E| là tổng khoảng cách có trọng số từ mọi điểm số liệu đến một trọng tâm Co duy nhất. 1 E (3.47) c° n i-l X p S ỉ Ei = ẳ l l X. " Co|l (3.48) i=l p là số điểm dữ liệu Ek là tổng khoảng cách nội nhóm được định nghĩa bởi: E > -tíỉX lh -sí (3.49) i= V i «1 = với Uy là hệ sế phụ thuộc của vectơ X vào trọng tâm Cj và được tính bằng j Uij = M 1 (3.50) k=l a kj 67
Dk là khoảng cách lớn nhất giữa hai trọng tâm D, = max c, -c, (3.51) K i.j-1, ..k 1 ' ' J II Số trọng tâm tối ưu (một phân chia tốt) sẽ được tìm cho giá trị tương ứng với PBM đạt cực đại. 6. Chi số DN\ Có bộ mẫu {Xj} với i=l,2,...,p; có M là số trọng tâm, từ đó ta có ma trận các hệ số phụ thuộc mờ của vectơ Xi vào trọng tâm C j, tiếp sau ta tính được các đại lượng D,(U;C) = ìpấ K - < u (>T (3.52) ,=1 1 khi u„ > — ,J M với (Uu)T = (3.53) 0 khi u„ < — ỈJ M D(U;C) = X D j ( U, C) (3.54) j=i DC D(U, C) (3.55) M -l Sau đó ta tính chỉ số Lattice N ( ^ .£ ) = m in [ ( F ;° Í Ũ l- ( £ s £ ) ] (3.56) trong đó theo định nghĩa ta có Fi oFk = mi n [ maxCu^Uị ý) ] (3.57) F, s Fk = max [m in tu ^ u ^ )] (3.58) Từ các giá trị N ( F i , F k ) ta có: N M = maxN(F,,Fk) (3.59) i,k Cuối cùng ta có 0 DC = NM = 0 DN(U,C) = 2* DC*NM (3.60) Các trường hợp khác DC + N M 68
Một phân chia tốt sẽ có giá trị DN nhỏ. Để phối hợp sử dụng đồng thời 6 chi số này, chúng tôi đề xuất một còng thức gọi là “chi số tổng hợp”: a a = a,Vh - a 2D A - a , D w + a 4t A - a 5PBM + a 6DN (3.61) Xuất phát từ lý do như đã trình bày ở trên, mặt khác hiện nay cũng chưa có đề xuất nào mới về việc xác định thêm các chỉ số thống kê khác (ngoài 6 chỉ số th ố n g k ê nêu trên ), n ên c h ú n g tôi đề x u ấ t v iệ c p h ố i h ợ p 6 chi số để tính “chì số tổng hợp” a . Đồng thời chưa có kết luận chính thức nào trong các công trình nghiên cứu về hiệu quà của các chỉ số thống kê trong trường hợp tổng quát, vì vậy việc phối hợp các chi số tạm dựa trên nguyên tắc là các chi số có ảnh hưởng đồng đều. Do đó các hệ số a, của từng chỉ số thống kê được chọn là nghịch đảo của giá trị lớn nhất của chỉ số đó, để đảm bao trong công thức tính chi số tổng hợp mỗi chi số thống kê sê có khoảng giá tri biến thiên giống nhau là đoan [0,1]. Ví du a, = ------^— - (max đươc max{Vh} tính cho tất cả các chì số thống kê đang được xét), khi đó ta có aiVh € [0, 1]. Đồng thời, tiêu chí “số nhóm tốt” của mỗi chi số được ứng với giá trị min (Vh, tA và DN) hoặc giá trị max (Dw, Da và PBM ), vì vậy để thuận tiện cho việc tính toán và lựa chọn, nên thống nhất sử dụng tiêu chí giá tri của "chi số tổng hợp" đạt: "giá trị min ứng với số nhóm tốt". Đe có được giá trị a m thì các chì số in Vh, tA và DN lấy hệ số với dấu chỉ số Dw, D a và PBM lấy hệ số với dấu 3.2.4. Đặt giá trị ban đâu cho các hàm suy luận Sau khi số lượng trọng tâm đã được ước lượng và vị trí ban đầu của các trọng tâm được tính toán từ thuật toán G-K, ta cần khởi tạo các giá trị còn lại của các luật suy luận mờ. Một luật mờ có ba thông số cơ bản là một thông số Cj'Ma được xác định, do đó còn hai thông số cần phài tiếp tục khởi tạo. Một giá trị nhỏ của a cũng làm cho quy tắc “chính xác” hơn, nhưng giá trị lớn sẽ làm cho quy tắc trở nên linh hoạt và thiết thực hơn đối với phạm vi rộng của đầu vào. Giá trị của nó sẽ phụ 69