Kỹ thuật Điều khiển – Tự động hóa<br />
<br />
MỘT PHƯƠNG PHÁP TỔNG HỢP BỘ ĐIỀU KHIỂN CHO LỚP ĐỐI<br />
TƯỢNG PHI TUYẾN BẤT ĐỊNH HÀM TRÊN CƠ SỞ ĐIỀU KHIỂN<br />
TRƯỢT VÀ MẠNG NƠ RON RBF<br />
Ngô Trí Nam Cường*<br />
Tóm tắt: Bài báo đề xuất một phương pháp tổng hợp bộ điều khiển cho một lớp<br />
đối tượng phi tuyến bất định trên cơ sở điều khiển trượt và mạng nơ ron RBF nhằm<br />
làm giảm hiện tượng rung trên mặt trượt. Trọng số mạng nơ ron được cập nhật<br />
thích nghi theo một tiêu chuẩn tối ưu. Kết quả mô phỏng đã một lần nữa xác nhận<br />
bằng thực nghiệm hiệu quả của luật cập nhật và bộ điều khiển đề xuất đảm bảo hệ<br />
bám tín hiệu đầu vào mong muốn.<br />
Từ khóa: Điều khiển trượt; Mạng nơ ron RBF; Hệ phi tuyến bất định.<br />
<br />
1. ĐẶT VẤN ĐỀ<br />
Trong công nghiệp, giao thông vận tải và năng lượng thường gặp các đối tượng điều<br />
khiển phi tuyến có mô hình bất định hàm. Việc tổng hợp hệ thống điều khiển cho các đối<br />
tượng dạng này sao cho đầu ra của hệ bám theo được tín hiệu đặt mong muốn mà không phụ<br />
thuộc vào các thành phần bất định hàm đó cũng như chất lượng bám là tốt, không dao động<br />
hoặc nếu có thì cũng nằm trong phạm vi dao động cho phép là vấn đề thời sự hiện nay.<br />
Chúng thu hút sự chú ý của các nhà khoa học trong lĩnh vực điều khiển và tự động hóa.<br />
Trong các thập kỷ gần đây, có nhiều nghiên cứu để tổng hợp luật điều khiển cho các<br />
đối tượng phi tuyến bất định bằng các phương pháp khác nhau. Đặc biệt phương pháp tổng<br />
hợp luật điều khiển trên cơ sở ưu điểm của điều khiển trượt và mạng nơ ron đang được<br />
quan tâm, đã thu được nhiều kết quả, đơn cử [1, 2, 3]. Tuy vậy, các luật học của mạng nơ<br />
ron trong các công trình trên còn phụ thuộc vào mặt trượt S , trong khi đó tín hiệu điều<br />
khiển trên mặt trượt luôn dao động với tần số cao, do đó ảnh hưởng rất lớn đến quá trình<br />
hội tụ của thuật toán, thậm chí khi biên độ dao động của S lớn còn có thể gây mất ổn định<br />
của hệ thống, nhất là đối với các hệ bám. Dưới đây, bài báo đề xuất một phương pháp tổng<br />
hợp bộ điều khiển cho lớp đối tượng phi tuyến bất định trên cơ sở điều khiển trượt kết hợp<br />
mạng nơ ron RBF để khắc phục nhược điểm trên.<br />
2. TỔNG HỢP LUẬT ĐIỀU KHIỂN<br />
Giả sử động học của đối tượng điều khiển được mô tả bằng hệ phương trình:<br />
xi xi 1 , i 1, 2, , n 1<br />
<br />
xn f ( x) bu , b 0 (1)<br />
y x1<br />
T<br />
<br />
trong đó, x x1 , x2 ,, xn là véc tơ trạng thái; u là đầu vào, y là đầu ra và chúng<br />
đều có giá trị thực, f ( x) là hàm phi tuyến trơn bất định của mô hình, b là tham số động<br />
học của đối tượng đã biết. Với đối tượng đối tượng phi tuyến bất định nêu trên, luật điều<br />
khiển sau đây sẽ được thiết lập dưới dạng:<br />
u usmc u fb (2)<br />
với usmc là thành phần điều khiển được xây dựng trên cơ sở lý thuyết điều khiển trượt và<br />
u fb là thành phần điều khiển phản hồi trạng thái:<br />
<br />
<br />
88 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
u fb K x b (3)<br />
<br />
có K k1 , k2 , , kn với các hệ số k1 , k2 , , kn của một đa thức Hurwitz:<br />
<br />
P ( p ) p n kn p n1 k2 p k1 . (4)<br />
Tiếp đến, thay luật (2) cùng chú ý (3),(4) vào hệ (1), được:<br />
xi xi 1<br />
<br />
xn k1 x1 k2 x2 kn xn busmc f ( x) (5)<br />
y x1.<br />
Bởi vậy nếu đặt:<br />
0 1 ... 0 0 0 <br />
<br />
A , B , F ( x) <br />
0 0 1 0 0 <br />
<br />
k1 k2 kn b f ( x) <br />
thì công thức (5) ở trên viết lại được thành:<br />
x Ax Busmc F ( x)<br />
(6)<br />
y C x, C 1,0, ,0.<br />
Cấu trúc hệ thống điều khiển được thể hiện ở hình vẽ dưới đây, trong đó, ĐT là đối<br />
tượng điều khiển; SMC là bộ điều khiển trượt; M là mô hình; K là ma trận phản hồi; ND là<br />
khối nhận dạng.<br />
<br />
<br />
<br />
<br />
Hình 1. Sơ đồ cấu trúc rút gọn của hệ thống điều khiển kết hợp SMC và mạng RBF.<br />
2.1. Tổng hợp luật cập nhật trọng số mạng nơ ron<br />
Vấn đề đặt ra tiếp theo là xác định cấu trúc thuật toán của khối ND. Để bộ ND thực<br />
hiện chức năng nhận dạng véc tơ hàm phi tuyến bất định F ( x) trên cơ sở mạng nơ ron<br />
RBF. Kết quả nhận dạng này sẽ được ta ký hiệu bởi Fˆ ( x) với:<br />
Fˆ ( x) [0, ,0, fˆ ( x)]T .<br />
Giả sử đã có Fˆ ( x) . Thay kết Fˆ ( x) vào mô hình (6), khi đó do giữa F ( x) và Fˆ ( x) có<br />
sai số nên tương ứng ta sẽ không thu được x mà chỉ là x m có một sai lệch kéo theo so với<br />
x , tức là lúc này hệ (6) trở thành:<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018 89<br />
Kỹ thuật Điều khiển – Tự động hóa<br />
<br />
x m Ax m Busmc Fˆ ( x) (7)<br />
m m T<br />
trong đó, x m [ x1 , , xn ] . Nhiệm vụ chỉnh định mạng nơ ron là phải làm cho sai<br />
lệch trạng thái E x x m giữa (6) và (7) tiến về 0. Sai lệch này được biểu diễn bởi:<br />
<br />
E x x m AE F ( x) (8)<br />
với:<br />
F ( x) F ( x) Fˆ ( x) [0, ,0, f ( x) fˆ ( x)]T [0, ,0, f ( x)]T<br />
trong đó, f ( x) f ( x) fˆ ( x) là sai số nhận dạng. Vì f ( x) được giả thiết là hàm trơn,<br />
nên trong một miền compact và thông qua bộ cơ sở thích hợp, cùng các các trọng số lý<br />
tưởng w *i , nó luôn biểu diễn được bằng một mạng nơ ron RBF:<br />
m<br />
f ( x) wi* i ( x ) (9)<br />
i 1<br />
<br />
có x là tổ hợp các đầu vào của nơ ron thứ i .<br />
Chọn các hàm cơ sở:<br />
<br />
<br />
i ( x ) exp x ci<br />
2<br />
2 i2 . (10)<br />
<br />
Trong đó: ci là véc tơ có chiều bằng chiều của véc tơ x , i là độ trải rộng của hàm<br />
cơ sở thứ i , i =1,2… m .<br />
Khi đó, việc nhận dạng hàm bất định f ( x) với bộ hàm cơ sở này là tương đương với<br />
việc hiệu chỉnh trọng số wˆ i của:<br />
m<br />
fˆ ( x) wˆ i i ( x ) (11)<br />
i 1<br />
<br />
sao cho có được fˆ ( x) f ( x) , tức là f ( x) 0 , hay hệ (8) là ổn định. Ký hiệu:<br />
w i wi* wˆ i (12)<br />
rồi sử dụng ứng hàm Lyapunov sau có ma trận đối xứng xác định dương P nào đó:<br />
m<br />
V E T PE w i2 , (13)<br />
i 1<br />
<br />
ta sẽ có:<br />
m<br />
V E T PE E T PE 2 w i w i . (14)<br />
i 1<br />
<br />
Tiếp theo, thay (8) vào (14) sẽ được:<br />
m<br />
V E T ( AT P PA) E 2 E T PF ( x) 2 w i w i (15)<br />
i 1<br />
<br />
và cùng với (9),(11),(12) có:<br />
m m<br />
V E T ( AT P PA) E 2 E T P[0,. ,0, w i i ( x )]T 2 w i w i . (16)<br />
i 1 i 1<br />
<br />
<br />
<br />
<br />
90 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
Bởi vậy để có được V 0 là điều kiện hiệu chỉnh trọng số mạng nơ ron, ta cần có từ<br />
công thức (16) hai điều kiện sau:<br />
E T ( AT P PA) E 0 (17)<br />
và<br />
m m<br />
2 E T P[0, ,0, w i i ( x )]T 2 w i w i 0 . (18)<br />
i 1 i 1<br />
<br />
Xét điều kiện thứ nhất (17). Do A là Hurwitz nên phương trình Lyapunov:<br />
AT P PA Q<br />
với mọi ma trận đối xứng xác định dương cho trước Q luôn có nghiệm P cũng đối xứng<br />
xác định dương. Sử dụng ma trận P này cho hàm Lyapunov (13) ta sẽ có từ (17):<br />
E T QE 0 . (19)<br />
Tiếp theo, từ điều kiện thứ hai (18) ta có:<br />
w i E T Pni ( x )<br />
*<br />
trong đó Pn là vector cột thứ n của P . Cuối cùng, do wi const nên cùng với (12) ta<br />
có luật cập nhật trọng số wˆ i cho mạng nơ ron như sau:<br />
<br />
wˆ i E T Pni ( x ) . (20)<br />
2.2. Tổng hợp bộ điều khiển trượt<br />
Sau đây ta sẽ xây dụng luật điều khiển usmc của khối SMC. Trước tiên ta ký hiệu<br />
vector sai lệch giữa véc tơ trạng thái mong muốn x d ( yd , y d , , yd<br />
( n 1) T<br />
) và véc tơ<br />
trạng thái x của hệ (6) là:<br />
e xd x . (21)<br />
Khi đó với mặt trượt:<br />
s Se (22)<br />
có S s1 , , sn được chọn để từ s 0 suy ra được e 0 , cũng như khi sử dụng ứng<br />
hàm Lyapunov V s 2 , thì để có s 0 rõ ràng ta phải có V ss 0 . Hiển nhiên ta<br />
2<br />
<br />
sẽ có được điều kiện đủ này nếu có:<br />
s sgn( s ) , (23)<br />
với 0 tùy chọn. Như vậy, sau khi đạo hàm hai vế (22) thì cùng với (23) ta được:<br />
s Se S ( x d x ) sgn( s ) . (24)<br />
Cuối cùng, thay (6) vào (24) có:<br />
S x d Ax Busmc F ( x) sgn( s ) , (25)<br />
hay:<br />
1<br />
usmc <br />
SB<br />
SAx SF ( x) S x d sgn(s) . (26)<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018 91<br />
Kỹ thuật Điều khiển – Tự động hóa<br />
2.3. Kết hợp bộ điều khiển trượt và mạng nơ ron<br />
Bộ điều khiển trượt (26) có chứa thành phần bất định hàm f ( x) nên không sử dụng<br />
được trực tiếp. Khi thay nó bằng kết quả nhận dạng (11) theo luật cập nhật (20) từ mạng<br />
nơ ron thì cùng với (2) ta sẽ có bộ điều khiển kết hợp (2) gồm (26) có thêm cơ cấu nhận<br />
dạng và (3) cho hệ (1) như sau:<br />
1 m<br />
1<br />
SAx S [0, ,0, wˆ i i ( x )] S x d sgn( s ) K x . (27)<br />
T<br />
u<br />
SB i 1 b<br />
Định lý: Bộ điều khiển (27) với luật cập nhật (20) sẽ đưa được đầu ra y của hệ phi tuyến<br />
bất định hàm (1) bám tiệm cận theo được tín hiệu mẫu yd khả vi n lần.<br />
Chứng minh:<br />
Ta thấy ngay rằng bộ điều khiển (27) đã cho chính là:<br />
1 1<br />
u<br />
SB<br />
<br />
SAx SFˆ ( x) S x d sgn( s ) K x .<br />
b<br />
(28)<br />
<br />
Tiếp theo, do (26) là bộ điều khiển trượt cho hệ (6) ứng với mọi hàm bất định F ( x)<br />
trơn nên nó cũng đúng khi F ( x) trong (6) được thay bởi Fˆ ( x) . Lúc này (26) sẽ trở thành:<br />
1<br />
usmc <br />
SB<br />
<br />
SAx SFˆ ( x) S x d sgn( s ) <br />
và tất nhiên bộ điều khiển usmc đó sẽ làm cho đầu ra ym C x m của hệ rõ (7), là hệ<br />
tương ứng với (6), bám tiệm cận theo được tín hiệu mẫu yd khả vi n lần. Suy ra, khi<br />
được kết hợp thêm thành phần u fb cho trong công thức (3) thì nó trở thành bộ điều khiển<br />
(28) ở trên và bộ điều khiển này cũng sẽ làm đầu ra ym của hệ rõ tương ứng với hệ bất<br />
định (1) ban đầu, được hiểu là hệ:<br />
xim xim1 , i 1, 2, , n 1<br />
m ˆ<br />
xn f ( x) bu (29)<br />
<br />
ym x1m<br />
bám tiệm cận theo được yd , hay ym yd .<br />
Cuối cùng, do cơ cấu nhận dạng bằng mạng nơ ron với luật cập nhật (20) luôn làm cho<br />
sai lệch E x x m tiến tiệm cận về gốc nên nó cũng sẽ làm cho sai số đầu ra y và ym<br />
giữa hai hệ (1) và (29) tiến về 0, tức là có y ym . Kết hợp với kết luận trên ta đên được<br />
y ym yd và đó là đ.p.c.m.<br />
3. KẾT QUẢ MÔ PHỎNG<br />
Xét đối tượng có mô hình:<br />
x1 x2<br />
<br />
x2 2( x1 1) x2 ( x1 tanh( x1 )) 3u<br />
4<br />
(30)<br />
y x1.<br />
<br />
<br />
92 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
trong đó, f ( x) 2( x14 1) x2 ( x1 tanh( x1 )) được xem như hàm bất định của đối tượng.<br />
Sử dụng bộ điều khiển (27) cùng với luật cập nhật (20) có các tham số cụ thể là:<br />
k1 0.0002, k2 0.03, s1 2, s2 1, 0.1<br />
ta sẽ thu đươc kết quả mô phỏng bằng phần mềm Matlab-Simulink như thể hiện ở hình 2<br />
và 3, trong đó hình 2 là đồ thị hàm f ( x) cùng kết quả nhận dạng fˆ ( x ) của nó bằng<br />
mạng nơ ron RBF với luật cập nhật trọng số cho ở công thức (20), còn hình 3 là quỹ đạo<br />
đặt yd và tín hiệu đầu ra y của hệ khi sử dụng bộ điều khiển kết hợp (27).<br />
<br />
Hình 2 cho thấy kết quả nhận dạng fˆ ( x) cho hàm phi tuyến f ( x) hoàn toàn đúng<br />
như yêu cầu, tức là sai số nhận dạng đã tiệm cận về 0. Kết quả mô phỏng ở hình 3 khẳng<br />
định chất lượng điều khiển đã được đảm bảo, tức là đáp ứng của hệ thống y đã bám chặt<br />
theo được tín hiệu đặt mong muốn yd . Như vậy, những kết quả mô phỏng này đã lần nữa<br />
minh chứng bằng thực nghiệm tính hiệu quả của thuật toán điều khiển đề xuất.<br />
<br />
<br />
<br />
<br />
Hình 2. Kết quả nhận dạng. Hình 3. Đáp ứng của hệ thống.<br />
4. KẾT LUẬN<br />
Với công cụ của lý thuyết điều khiển trượt và mạng nơ ron RBF bài báo đã tổng hợp<br />
được hệ thống điều khiển cho đối tượng có phương trình động học (1). Xây dựng được<br />
thuật toán nhận dạng cho hàm phi tuyến bất định f ( x) trên cơ sở sử dụng công cụ mạnh<br />
của mạng nơ ron nhân tạo. Luật nhận dạng đơn giản, hiệu quả, dễ thực hiện trong kỹ thuật.<br />
Đặc biệt, phương pháp nhận dạng bài báo đề xuất có ứu điểm quá trình hiệu chỉnh luật<br />
nhận dạng chỉ diễn ra khi f ( x) thay đổi, nghĩa là khi có sai lệch E giữa đối tượng và mô<br />
hình mà không phụ thuộc vào yếu tố nào khác; luật cập nhật trọng số mạng nơ ron khắc<br />
phục được một số nhược điểm hiện có ở [1, 2, 3]. Đã thiết lập được luật điều khiển trượt<br />
đảm bảo hệ thống kín hoạt động trong chế độ trượt trên mặt trượt s 0 . Kết quả mô<br />
phỏng thể hiện tính đúng đắn của phương pháp.<br />
TÀI LIỆU THAM KHẢO<br />
[1].T. Zhang, S. S. Ge, and C. C. Hang, “Stable Adaptive Control for a Class of Nonlinear<br />
Systems Using a Modified Lyapunov Function,” IEEE Transactions on automatic<br />
control, Vol. 45, No. 1, January 2000,pp 129-131.<br />
[2]. L. X. Wang, “A Course in Fuzzy Systems and Fuzzy Control”, Englewood Cliffs, NJ,<br />
USA: Prentice-Hall, 1997.<br />
[3]. Mou Chen, Shuzhi Sam Ge,” Direct Adaptive Neural Control for a Class of Uncertain<br />
Nonaffine Nonlinear Systems Based on Disturbance Observer”, IEEE Transactuons<br />
on cyberynetics, vol. 43, no. 4, august, pp.1213 -1225.<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san FEE, 08 - 2018 93<br />
Kỹ thuật Điều khiển – Tự động hóa<br />
[4]. Ngô Trí Nam Cường ,” Một phương pháp nhận dạng và bù trừ các thành phần bất<br />
định cho một lớp đối tượng phi tuyến,” Tạp chí Nghiên cứu khoa học và công nghệ<br />
Quân sự, số 50, tháng 08 năm 2017, trang 53-61.<br />
[5].Utkin, Vadim, “Sliding Modes in Control and Optimization,” Springer – Verlag<br />
Berlin, Heidelberg 1992.<br />
[6]. James M. Ortega ,“Matrix Theory,” Plenum Press 1987.<br />
ABSTRACT<br />
A METHOD OF SYNTHESIZING ADAPTIVE CONTROLLER FOR A CLASS OF<br />
UNCERTAIN NONLINEAR PLANTS BASED ON THE THEORY OF SLIDING<br />
MODE CONTROL AND NEURAL RBF NETWORK<br />
The paper proposes a method for the systhesis of adaptive control system for<br />
a class of uncertain nonlinear plants based on the theory of sliding mode control<br />
and neural RBF network to reduce the vibration in the sliding surface. Weights of<br />
the neural network are updated to adapt to an optimal standard. The simulation<br />
result has once again verified by experiment the effectiveness of proposed weight<br />
updating and control law rules in assuring the tracking desirable input signals of<br />
the system.<br />
Keywords: Sliding mode control; RBF neural network; Uncertain nonlinear systems.<br />
<br />
<br />
Nhận bài ngày 01 tháng 7 năm 2018<br />
Hoàn thiện ngày 10 tháng 9 năm 2018<br />
Chấp nhận đăng ngày 20 tháng 9 năm 2018<br />
<br />
<br />
Địa chỉ: Công ty CP Systemtec, Phòng 2207 nhà CT1-B2 khu đô thị Xa La, phường Phúc La, Hà<br />
Đông, Hà Nội;<br />
*<br />
Email: ncuong792000@gmail.com.<br />
<br />
<br />
<br />
<br />
94 Ngô Trí Nam Cường, “Một phương pháp tổng hợp bộ điều khiển … và mạng nơ ron RBF.”<br />