8<br />
Journal of Transportation Science and Technology, Vol 19, May 2016<br />
<br />
<br />
THIẾT KẾ BỘ ĐIỀU KHIỂN BÁM ĐUỔI THÍCH NGHI MẠNG<br />
NƠ RON – MỜ CHO HỆ THỐNG TRỰC THĂNG 2 DOF<br />
DESIGN OF ADAPTIVE TRACKING CONTROLLER FUZZY–NEURAL<br />
NETWORK FOR 2 - DOF HELICOPTER SYSTEM<br />
Nguyễn Minh Tâm1, Đồng Văn Hướng2<br />
1,2<br />
Đại Học GTVT TP.HCM<br />
Tóm tắt: Trong bài báo này, một hệ thống điều khiển được đề xuất cho mô hình động không biết<br />
chính xác hoặc không biết cho trực thăng hai bậc tự do (DoF) để đạt được bám đuổi vị trí chính xác<br />
cao dựa trên mạng Nơ ron - Mờ. Trong hệ thống điều khiển đề xuất, một mạng Nơ ron - Mờ 4 lớp<br />
(NFN) được thiết kế để bắt chước hệ thống điều khiển lý tưởng và bộ bù trơn được thiết kế để bù sai<br />
số giữa bộ điều khiển lý tưởng với bộ điều khiển mạng nơ ron - mờ. Thuật toán điều chỉnh các tham số<br />
của bộ điều khiển được tìm thấy dựa trên lý thuyết ổn đinh Lyapunov, do đó ổn định của hệ thống có<br />
thể được đảm bảo. Cuối cùng, kết quả mô phỏng đối với trực thăng 2 DoF được cung cấp để kiểm<br />
chứng hiệu quả của phương pháp điều khiển ANFNC được đề xuất.<br />
Từ khóa: Trực thăng 2DoF, mạng Nơ ron - Mờ, hệ thống MIMO, hệ thống phi tuyến.<br />
Abstract: In this paper, a control system is proposed for the uncertain dynamic model or un -<br />
model for the 2 DoF helicopter to achieve the high-precision position tracking based on neural -<br />
fuzzy - network. In proposed control system, a four - layer neural fuzzy network (NFN) is designed to<br />
mimic an ideal controller and the smooth compensate controller is designed to compensate for the<br />
approximation error between the ideal controller and the neural fuzzy network controller. The tuning<br />
algorithms of the controller are derived in the Lyapunov stability theory. So, the stability of the<br />
system can be guaranteed. Finally, numerical simulations results of the 2 DoF helicopter are<br />
provided to verify the effectiveness and robustness of the proposed ANFNC control methodology.<br />
Keywords: 2 DoF helicopter, Neural - Fuzzy Network, MIMO system, nonlinear system.<br />
<br />
1. Giới thiệu Gần đây, nhiều kết quả nghiên cứu đã<br />
Máy bay trực thăng đã trở nên rất phổ thực hiện thành công bằng áp dụng mạng Nơ<br />
biến không những cho việc vận chuyển ron - Mờ (Neural – Fuzzy Network: NFN).<br />
khoảng cách ngắn bởi vì nó có khả năng hạ Trong đó, Hệ thống mạng Nơ ron – Mờ kết<br />
cánh và cất cánh ở các khu vực nhỏ mà còn hợp được khả năng suy luận mờ vào việc xử<br />
được áp dụng cho một loạt các dịch vụ, bao lý thông tin không chắc chắn [6] (suy luận<br />
gồm cả cứu hộ trên biển, chữa cháy, điều quy luật If - Then giống như con người và dễ<br />
khiển giao thông [1]. Động lực học của trực dàng kết hợp với kiến thức chuyên gia) và<br />
thăng là hệ thống phi tuyến cao, không ổn khả năng học của mạng [7] (có khả năng học<br />
định và rất khó để mô hình hóa [2]. Vì vậy, và tối ưu hóa) vào lĩnh vực điều khiển để đối<br />
việc nhận dạng và điều khiển trực thăng sử phó với hệ thống phi tuyến và mô hình động<br />
dụng các kỹ thuật điều khiển dựa trên mô lực học không chắc chắn.<br />
hình là vấn đề vô cùng thách thức. Bài báo này được tổ chức như sau: Mục<br />
Mạng NNs (Neural Networks: NNs) là 2 mô tả hệ thống, mục 3 đề xuất hệ thống<br />
một bộ xấp xỉ có vai trò quan trọng trong điều khiển ANFNC (Adaptive Neural -<br />
thực tế, thường được sử dụng để mô hình hóa Fuzzy Network Controller: ANFNC) cho<br />
hệ thống phi tuyến với độ chính xác tùy ý hệ thống trực thăng 2 DoF sử dụng mạng Nơ<br />
thông qua việc học và khả năng thích nghi ron – Mờ bốn lớp. Kết quả mô phỏng được<br />
của mạng. Tuy nhiên, tốc độ học của NNs đưa ra để kiểm chứng hiệu quả của bộ điều<br />
quá chậm, do tất cả các trọng lượng được cập khiển ANFNC đề xuất được trình bày ở mục<br />
nhật trong mỗi chu kỳ học. Vì vậy, hiệu quả 4. Kết luận được rút ra ở mục 5.<br />
của NNs nhiều lớp bị giới hạn trong các vấn 2. Mô tả hệ thống<br />
đề yều cầu học trực tuyến.<br />
9<br />
TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 19 - 05/2016<br />
<br />
<br />
Trực thăng 2 - DoF bao gồm một trực tưởng có thể được thiết kế dựa trên phương<br />
thăng gắn trên một nền cố định với hai cánh pháp phản hồi tuyến tính hóa [9] như sau:<br />
quạt được điều khiển bởi động cơ DC. Cánh u g 1 xd f K T e . (5)<br />
quạt phía trước điều khiển độ cao xung<br />
quanh trục Z “Pitch” đại diện bởi góc và Trong đó K [ K1 K2 ]T là ma trận hằng<br />
cánh quạt phía sau điều khiển hướng xung số xác định dương.<br />
quanh trục Y “Yaw” đại diện bởi góc . Thế bộ điều khiển lý tưởng (5) vào<br />
Làm như vậy có thể xem như là cấu trúc trực phương trình (1) ta có phương trình sai số.<br />
thăng 2 DoF tự do như miêu tả ở hình 1. e KT e 0 (6)<br />
Cuối cùng, mô hình động lực học của hệ Ở phương trình (7), nếu K được chọn<br />
thống trực thăng 2 DoF có thể được thiết lập lựa để tất cả nghiệm của đa thức<br />
sử dụng phương pháp Euler Lagrange theo P( ) I K1 K2 tương ứng theo đa<br />
[8] có dạng như sau: thức Hurwitz, tức là đa thức có nghiệm nằm<br />
Trục Yaw<br />
Fy<br />
φ >0, CW hoàn toàn ở nửa trái của mặt phẳng phức, thì<br />
e 0 khi t .<br />
Fp<br />
3. Hệ thống điều khiển ANFNC thích<br />
nghi<br />
ry<br />
Icm Fg 3.1. Cấu trúc của NFN bốn lớp<br />
rp<br />
θ >0, CCW<br />
Trục Pitch<br />
Gần đây, khái niệm kết hợp logic mờ<br />
vào một mạng nơ ron đã trở thành một lĩnh<br />
Hình 1. Sơ đồ cấu trúc của trực thăng 2 DoF.<br />
vực nghiên cứu khá phổ biến. Hệ thống Nơ<br />
x f gu (1) ron – Mờ (NFN) kết hợp được ưu điểm của<br />
Trong đó: hệ suy luận mờ dựa trên kiến thức của<br />
B p chuyên gia và khả năng tự học của mạng.<br />
2<br />
J eq p mheli lcm , x , u mp <br />
u Hình 2 giới thiệu cấu trúc của NFN bốn lớp,<br />
f bao gồm lớp đầu vào, lớp hàm thuộc, lớp quy<br />
By umy <br />
luật mờ và lớp đầu ra. Tín hiệu lan truyền<br />
J eq y mheli lcm 2 trong mỗi lớp của NFN được giới thiệu như<br />
k pp k py sau:<br />
2<br />
J eq p mheli lcm 2<br />
J eq p mhelilcm Lớp<br />
g<br />
unfn 1 unfn 2 unfn i<br />
đầu<br />
<br />
k yp k yy ra<br />
wik<br />
<br />
<br />
J eq y mheli lcm J eq y mhelilcm Lớp<br />
2 2<br />
l1 lk lp<br />
quy<br />
luật<br />
Vấn đề điều khiển là tìm ra luật điều<br />
khiển để điều khiển x có thể bám đuổi theo w kjb<br />
Lớp<br />
hàm<br />
giá trị mong muốn cho trước xd. Trước hết 11 1j 1z b1 bj bz r1 rj rz thuộc<br />
chúng ta định nghĩa sai số bám đuổi e(t) như Lớp<br />
sau: z1 zb zr đầu<br />
vào<br />
e(t ) xd (t ) x(t ) (2)<br />
Hình 2. Cấu trúc của mạng Nơ ron – Mờ bốn lớp.<br />
Định nghĩa hàm trượt tích phân:<br />
t Lớp đầu vào chuyển biến ngôn ngữ đầu<br />
s e K1e K 2 e(t )dt (3) vào zb | b 1, , r đến lớp tiếp theo.<br />
0<br />
Lớp hàm thuộc biểu diễn giá trị đầu vào<br />
Và véc tơ sai số bám đuổi hệ thống được thông qua hàm Gaussian được mô tả như sau:<br />
t <br />
định nghĩa sau đây:<br />
bj zb exp zb mbj <br />
2 j 2<br />
T (7)<br />
e ee <br />
T T b<br />
(4)<br />
Trong đó exp(·) là hàm<br />
Giả sử rằng các tham số của hệ thống (1)<br />
được biết chính xác. Thì bộ điều khiển lý mũ , mb và tb ( b 1, , r; j 1,<br />
j j<br />
z ) là trọng<br />
10<br />
Journal of Transportation Science and Technology, Vol 19, May 2016<br />
<br />
<br />
tâm và sai phương thuộc hàm Gaussian của uˆnfn ( s, wˆ ) wˆ T l (11)<br />
mỗi đầu vào thứ b và thành phần thứ j<br />
Với wˆ là giá trị ước lượng của w . Luật<br />
tương ứng với mỗi nút hàm thuộc. Ở đây có điều khiển của ANFNC được phát triển giả<br />
thể được coi như giai đoạn mờ hóa. sử thiết lập có dạng như sau:<br />
Đầu ra của mỗi nút trong lớp quy luật u ANFNC (t ) uˆnfn (s, w<br />
ˆ ) usc (s) (12)<br />
được xác định bởi toán tử mờ “AND” được<br />
ký hiệu bởi và được biểu diễn dưới dạng Trong đó bộ điều khiển mạng NFN uˆnfn<br />
toán học như sau: được sử dụng để xấp xỉ bộ điều khiển lý<br />
r tưởng u (t ) ; bộ điều khiển bù trơn usc thiết<br />
lk wkjb bj zb (8)<br />
b 1<br />
kế để bù, giảm sự sai lệch giữa bộ điều khiển<br />
Trong đó lk | k 1, miêu tả đầu ra thứ lý tưởng và bộ điều khiển NFN. Bằng cách<br />
,p<br />
thay thế (12) vào (1), phương trình động lực<br />
k của lớp quy luật, w kjb đại diện trọng lượng học của hệ thống có thể biểu diễn như sau:<br />
giữa lớp hàm thuộc và lớp quy luật. x f g uˆ ( s, wˆ ) usc ( s ) (13)<br />
Lớp cuối cùng là lớp đầu ra, các nút Bằng cách nhân hai vế (5) với g cộng<br />
trong các lớp này đại diện cho biến ngôn ngữ với (13) và sử dụng (2) với (3), phương trình<br />
đầu ra. Mỗi nút đầu ra ui (1, , n) được tính đặc tính của hệ thống thiết lập như sau:<br />
toán bằng tổng đại số của tất cả các tín hiệu e K1e K 2e g (u unfn usc ) s (14)<br />
và được biểu diễn như sau:<br />
p Định nghĩa unfn u uˆnfn , w w wˆ ,<br />
unfn i wik lk wl (9) sử dụng (10) thì:<br />
k 1<br />
Trong đó: unfn u uˆnfn wT l wˆ T l wl (15)<br />
w11 w12 w1 p Để tìm ra luật tìm kiếm các thông số<br />
thích nghi ta dựa vào lý thuyết ổn định<br />
w21 w22 w2 p <br />
w Lyapunov. Chọn hàm Lyapunov như sau:<br />
<br />
<br />
wn1 wn 2 wnp 1<br />
V s, w, E s 2 <br />
2<br />
g T<br />
21<br />
w w<br />
g 2<br />
22<br />
E (16)<br />
w1 wn R n p ,<br />
T<br />
w2<br />
Trong đó E (t ) E Eˆ (t ) là bộ ước<br />
T<br />
l l1 l2 l p R p1 lượng giới hạn sai số của bộ ước lượng. 1 và<br />
3.2. Hệ thống điều khiển ANFNC 2 là các hằng số dương. Bằng cách lấy vi<br />
Do các tham số của hệ thống (1) không phân phương trình (16) tương ứng theo thời<br />
biết chính xác hoặc không biết (Chẳng hạn gian và sử dụng (14) và (15), cuối cùng ta có:<br />
g T g<br />
như sự thay đổi tải, ma sát và nhiễu ngoài) V ( s, w, E ) ss w w EE<br />
21 22<br />
đối với các ứng dụng thực tế, vì vậy u ở (5)<br />
g g (17)<br />
không thể tính toán chính xác. Theo lý thuyết sg ( wT l usc ) wT w EE<br />
xấp xỉ thông thường [9] sẽ tồn tại một bộ 1 22<br />
<br />
điều khiển tối ưu NFN unfn ( s, w ) dưới dạng w<br />
gwT sl sg ( usc ) <br />
g<br />
EE.<br />
(9) có thể xấp xỉ bộ điều khiển (5) sao cho: 1 22<br />
u (t ) unfn<br />
<br />
( s, w ) wT l (10) Để đạt được V 0 các luật thích nghi<br />
Trong đó là sai số xấp xỉ và giả sử nó ANFNC được chọn lựa như sau:<br />
được giới hạn sao cho E . Bằng cách sử wˆ w 1s (t )l (18)<br />
dụng một bộ điều khiển NFN uˆnfn ( s, wˆ ) để usc Eˆ sgn( s (t ))sgn( g ) Eˆ sgn( s (t )) (19)<br />
xấp xỉ bộ điều khiển lý tưởng u (t ) có dạng Eˆ (t ) E (t ) 2 s(t ) sgn( g ) 2 s(t ) (20)<br />
như sau:<br />
11<br />
TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 19 - 05/2016<br />
<br />
<br />
Cuối cùng, hàm Lyapunov (17) có thể ổn định Lyapunov. Các tham số của bộ điều<br />
được viết lại: khiển được chọn lựa như sau 1 0.7 ,<br />
V ( s(t ), w, E ) s(t ) g E s(t ) g 2 0.5 , K1 I , K1 5I . Giá trị ban đầu<br />
(21)<br />
s(t ) g E 0. của hệ thống x [0 0.5]T và x [0 0]T và<br />
Tóm lại, Bộ điều khiển ANFNC được đầu vào của ANFNC là s1 , s2 1 1<br />
đưa ra ở (12), trong đó uˆnfn đưa ra ở (11) với được chia thành năm tập mờ với hàm thuộc<br />
các tham số wˆ được điều chỉnh bởi (18) và dạng hàm Gaussian. Do đó mạng NFN có<br />
u được tìm thấy ở (19) với các tham số Eˆ<br />
sc<br />
z 2 5 10 hàm thuộc, p 5 5 25 quy<br />
được điều chỉnh bởi (20). Bằng cách áp dụng luật và i 2 đầu ra. Kết quả mô phỏng của<br />
các luật thích nghi này, hệ thống ANFNC có hệ thống ANFNC với bộ điều khiển bù trơn<br />
thể đảm bảo hệ thống ổn định. khi E là hằng số và bộ điều khiển bù trơn đề<br />
Hệ thống điều khiển ANFNC thích nghi<br />
xuất được đưa ra ở hình 4 và 5 tương ứng.<br />
Trong đó hình 4, 5(a) là đặc tính bám đuổi<br />
Adaptive Law<br />
(Eq. 20) của hệ thống so với tín hiệu mong muốn<br />
Eˆ<br />
dạng sin và cos, hình 4, 5(b) là điện áp điều<br />
Smooth khiển và hình 4, 5(c) là sai số.<br />
Compensator<br />
(Eq. 19) Từ kết quả mô phỏng cho thấy đặc tính<br />
usc bám đuổi vị trí chính xác cao của trục Pitch<br />
xd<br />
+ ei<br />
d/dt<br />
ei<br />
Sliding si<br />
Fuzzy – + và Yaw có thể đạt được bằng cách sử dụng<br />
Neural +<br />
x - ei Function<br />
Network unfn bộ điều khiển ANFNC, trong đó NFN sử<br />
(Eq. 3)<br />
(Eq. 9) dụng để ước lương bộ điều khiển lý tưởng<br />
wˆ thông qua khả năng học trực tuyến. Ngoài ra<br />
Adaptive Law<br />
(Equation: Eq) (Eq. 18) bộ điều khiển bù trơn được đề xuất làm giảm<br />
hiện tương “Chattering” trong điện áp điều<br />
2 DoF u ANFNC unfn usc khiển so với bộ điều khiển bù trơn có E là<br />
Hellicopter<br />
(Eq. 1)<br />
hằng số được mô tả ở hình 4, 5(b) thông qua<br />
ước lương thích nghi sai số xấp xỉ giữa bộ<br />
Hình 3. Sơ đồ hệ thống điều khiển ANFNC trực thăng<br />
2 DoF.<br />
điều khiển lý tưởng và bộ điều khiển NFN.<br />
4. Kết quả mô phỏng<br />
Một hệ thống trực thăng 2 DoF được<br />
miêu tả ở hình 1 được sử dụng để kiểm<br />
chứng hiệu quả của sơ đồ điều khiển đề xuất<br />
như hình 3. Chi tiết các tham số của trực<br />
thăng 2 DoF được cho như sau: k pp 0.204 ,<br />
k yy 0.072 , k py 0.0068 , k yp 0.03 ,<br />
(a)<br />
Control<br />
<br />
<br />
<br />
<br />
50<br />
Beq p 5.4 104 , Beq y 0.8 ,<br />
PitchControl<br />
<br />
<br />
<br />
<br />
50<br />
<br />
mheli 0.318 , lcm 0.186 , jeq p 0.04 , 00<br />
Pitch<br />
<br />
<br />
<br />
<br />
jeq y 0.04 . Để kiểm tra hiệu quả của bộ -50<br />
-50<br />
00 5 10 15 20<br />
20<br />
điều khiển đề xuất, bằng cách so sánh giữa Time(sec)<br />
YawControl<br />
Control<br />
<br />
<br />
<br />
<br />
bộ điều khiển ANFNC và bộ điều khiển bù 50<br />
50<br />
trơn usc E sgn(s(t )) , với E 10 là hằng số 00<br />
thì so sánh bộ điều khiển đề xuất ANFNC<br />
Yaw<br />
<br />
<br />
<br />
<br />
-50<br />
-50<br />
với bộ điều khiển bù trơn usc Eˆ sgn( s(t )) , 00 55 10 15 20<br />
10 15 20<br />
Time(sec)<br />
Time(sec)<br />
trong đó Eˆ s(t ) là tham số ước lượng<br />
2 (b)<br />
thích nghi được tìm thấy dựa trên lý thuyết<br />
12<br />
Journal of Transportation Science and Technology, Vol 19, May 2016<br />
<br />
Control 1 5. Kết luận<br />
Pitch Control<br />
1<br />
<br />
0 Bài báo này đã ứng dụng thành công hệ<br />
thống ANFNC để điều khiển vị trí cho trực<br />
Pitch<br />
<br />
<br />
<br />
-1<br />
0 5 10 15 20 thăng 2 DoF nhằm đạt được đặc tính bám<br />
Time(sec) đuổi chính xác và bù trơn với bất kỳ sự thay<br />
Yaw Control<br />
<br />
<br />
<br />
<br />
1 đổi các tham số của tải, các tham số mô hình<br />
0 và nhiễu trong quá trình mô phỏng. Tất cả<br />
các luật học thích nghi của hệ thống ANFNC<br />
Yaw<br />
<br />
<br />
<br />
<br />
-1<br />
0<br />
0 5<br />
5 10<br />
10 15<br />
15 20<br />
20 được tìm thấy dựa trên lý thuyết ổn định<br />
Time(sec)<br />
Time(sec) Lyapunov để ổn định của hệ thống được đảm<br />
(c)<br />
Hình 4. Kết quả mô phỏng của bộ điều khiển ANFNC<br />
bảo <br />
với bộ điều khiển bù khi E là hằng số: (a) Đáp ứng Tài liệu tham khảo<br />
của hệ thống, (b) Điện áp điều khiển, (c) sai số của hệ<br />
thống điều khiển với E là hằng số. [1] R. Lozano (2010), Unmanned Aerial Vehicles<br />
Embedded Control, ISTE Ltd. and John Wiley<br />
& Sons Inc., London, Great Britain.<br />
[2] P. Castillo Garcia, R. Lozano, A.E. Dzul,<br />
(2005), Modelling and Control of Mini-Flying<br />
Machines, Springer-Verlag, England.<br />
[3] Rong-Jong Wai, Zhi-Wei Yang (2008), Adaptive<br />
Fuzzy Neural Network Control Design via a T–S<br />
Fuzzy Model for a Robot Manipulator Including<br />
Actuator Dynamics, IEEE Trans: Cybernetics,<br />
Vol. 38, No. 5. pp. 1326-1346<br />
[4] Shaocheng Tong, Shuai Sui, and Yongming Li,<br />
(a) (2015), Fuzzy Adaptive Output Feedback Control<br />
of MIMO nonlinear systems with partial tracking<br />
errors constrained, IEEE transactions on fuzzy<br />
systems, Vol. 23, No. 4. pp. 729 - 742<br />
[5] ThanhQuyen Ngo, Yaonan Wang, (2012),<br />
Robust Adaptive Neural-Fuzzy Network Tracking<br />
Control for Robot Manipulator, Int. J. of<br />
Computers, Communications & Control, Vol. VII<br />
(2012). pp. 341-352<br />
[6] H. K. Lam and F. H. F. Leung, (2007), Fuzzy<br />
controller with stability and performance rules for<br />
nonlinear systems, Fuzzy Sets Syst., Vol. 158,<br />
No. 2. pp. 147–163<br />
(b)<br />
[7] W. Gao and R. R. Selmic, (2006), Neural<br />
network control of a class of nonlinear systems<br />
with actuator saturation, IEEE Trans. Neural<br />
Netw., Vol. 17, No. 1. pp. 147 - 156<br />
[8] Elumalai Vinodh Kumar, (2015), Adaptive<br />
PSO for optimal LQR tracking control of 2<br />
DoF laboratory Helicopter, Elsevier, Applied<br />
Soft Comp, Vol. 20, No. 4. pp. 77-90<br />
[9] L. X. Wang, (1994), Adaptive Fuzzy Systems and<br />
Control: Design and Stability Analysis.<br />
Englewood Cliffs, NJ: Prentice-Hall, 1994.<br />
Ngày nhận bài: 07/04/2016<br />
(c) Ngày hoàn thành sửa bài: 28/04/2016<br />
Hình 5. Kết quả mô phỏng của bộ điều khiển ANFNC Ngày chấp nhận đăng: 05/05/2016<br />
với bộ bù trơn đề xuất khi E là tham số thích nghi: (a)<br />
Đáp ứng của hệ thống, (b) Điện áp điều khiển, (c) sai<br />
số của độ điều khiển đề xuất.<br />