Kỹ thuật điều khiển<br />
<br />
ĐIỀU KHIỂN PHI TUYẾN PHƯƠNG TIỆN NGẦM<br />
BẰNG MẠNG NƠ RON THÍCH NGHI<br />
Phan Hoài Nam1*, Lê Kỳ Biên2, Bùi Thị Thanh Tâm3<br />
<br />
Tóm tắt: Phương tiện ngầm (PTN) tự hành và điều khiển từ xa ngày càng trở nên<br />
phổ biến trong việc nghiên cứu, thăm dò và thực hiện các nhiệm vụ dưới nước. PTN<br />
là 1 đối tượng phi tuyến, hoạt động trong môi trường có nhiễu không rõ ràng. Bài<br />
báo phát triển một bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền tiến độc lập<br />
để đạt được kết quả bám tiệm cận trong điều kiện có các thành phần không tường<br />
minh trong mô hình và nhiễu loạn ngoài.<br />
Từ khóa: Mạng Nơ ron. Điều khiển phi tuyến, Phương tiện ngầm.<br />
<br />
1. ĐẶT VẤN ĐỀ<br />
Việc điều khiển PTN theo 1 quĩ đạo chính xác và bền vững với môi trường là<br />
một trong những bài toán quan trọng và cần thiết trong quá trình thiết kế chế tạo<br />
PTN. Một vài kết quả nghiên cứu trước đây dựa trên giả thiết mô hình động học<br />
tường minh lấy từ các kết quả kinh nghiệm [2]. Trong khi các bộ điều khiển này<br />
cần phải có được hiệu quả điều khiển tốt nhất, mô hình kinh nghiệm thường không<br />
chính xác, khó thực hiện, kết quả điều khiển mang lại đối với một mô hình không<br />
biết chính xác không cao. Các bộ điều khiển thích nghi [3] đã giải quyết được các<br />
vấn đề không tường minh trong mô hình và bộ điều khiển đã trở nên bền vững hơn.<br />
Các kết quả này cơ bản dựa trên giả thiết là các tham số động học không biết có<br />
thể tuyến tính hoá được. Kết quả trong [4] sử dụng phương pháp thích nghi kinh<br />
điển và bộ điều khiển chuyển mạch rời rạc để bù các thành phần phi tuyến đã tuyến<br />
tính hoá. Để so sánh với những kết quả điều khiển kiểu thích nghi kinh điển, các<br />
nghiên cứu [5] đã ứng dụng logic mờ và mạng nơ ron làm các phương thức cơ bản<br />
để xấp xỉ các thành phần động học không tường minh gồm cả các nhiễu loạn bổ<br />
sung (và không giả định là các thành phần này tuyến tính); tuy nhiên, sự tồn tại của<br />
nhiễu bên ngoài và sai số vốn có của hàm xấp xỉ làm cho kết quả bám cuối cùng bị<br />
chặn đều. Kết quả trình bày trong [6] sử dụng điều khiển chế độ trượt như 1 công<br />
cụ hỗ trợ để ước lượng sai số trạng thái tĩnh, các bộ điều khiển trượt cho kết quả<br />
bền vững tốt, song bộ điều khiển là rời rạc [7]. Công trình [8] các tác giả mới<br />
dừng lại nghiên cứu sử dụng bộ điều khiển mờ- thích nghi cho ngõ ra một dạng<br />
PTN tự hành. Nội dung của bài báo sẽ phát triển một bộ điều khiển bám liên tục<br />
cho một lớp PTN đa biến phi tuyến hoạt động trong môi trường có nhiễu.<br />
<br />
<br />
2. MÔ HÌNH ĐỘNG LỰC HỌC CỦA PTN<br />
<br />
<br />
<br />
<br />
200 P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến …nơ ron thích nghi.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
PTN hoạt động trong môi trường nước chịu tác động của nhiều yếu tố môi<br />
trường như dòng chảy, gió, sóng biển... nên một số thông số thủy động tính toán<br />
mô phỏng không chính xác. Sự tác động qua lại giữa các kênh điều khiển tương<br />
đối lớn ảnh hưởng đến chất lượng và tính ổn định của hệ thống. Việc đo lường đầy<br />
đủ các trạng thái rất khó khăn, vì thế xu hướng nghiên cứu thuật toán điều khiển<br />
thích nghi hồi tiếp ngõ ra cho đối tượng ngư lôi đang được phát triển mạnh [8].<br />
Gần đây mạng nơron và hệ mờ được sử dụng rộng rãi trong trong các sơ đồ điều<br />
khiển thích nghi và đạt được những kết quả đáng kể. Theo nghiên cứu của Fossen<br />
[1], phương trình động học của PTN được mô tả:<br />
J (1)<br />
trong đó, t 6 là véc tơ tốc độ thẳng và tốc độ góc trong hệ qui chiếu vật<br />
thể, t 6 làm véc tơ vị trí và tư thế trong hệ qui chiếu trái đất, và J 66<br />
là ma trận chuyển Jacobi giữa 2 hệ qui chiếu và được xác định bởi:<br />
J 033 <br />
1<br />
J (2)<br />
033 J 2 <br />
với J 1 và J 2 <br />
33 33<br />
được xác định bằng:<br />
<br />
<br />
<br />
cos cos sin cos +cos sin sin sin sin +cos cos sin <br />
J1 sin cos cos cos +sin sin sin cos s +sin sin cos <br />
<br />
sin cos sin cos cos <br />
Và:<br />
1 sin t cos tg <br />
<br />
<br />
J 2 0 cos sin ,<br />
<br />
0 sin / cos cos / cos <br />
Các véc tơ mô tả trạng thái của PTN như sau:<br />
<br />
<br />
x y z T ; u v w p q r T ,<br />
trong đó, x, y và z biểu diễn toạ độ Đề các của khối tâm PTN; , , và biểu<br />
diễn các hướng theo 3 trục PTN là nghiêng ngang, nghiêng dọc và góc hướng; u , v<br />
và w lần lượt là tốc độ dịch dọc, dịch ngang và lên xuống; p, q, r là vận tốc góc<br />
tương ứng.<br />
Với giả thiết rằng gốc hệ qui chiếu vật thể gắn với trọng tâm của PTN, bỏ qua<br />
gia tốc của trái đất tại điểm hệ đang hoạt động và khối lượng ảo là hằng số (độc lập<br />
với tần số sóng), phương trình động lực học của hệ có thể được biễu diễn dưới<br />
dạng véc tơ như sau:<br />
M C D g d t b (3)<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 201<br />
Kỹ thuật điều khiển<br />
<br />
<br />
ở đây. M <br />
66<br />
là ma trận quán tính (gồm cả khối lượng kèm),<br />
C là ma trận lực Coriolis và ảnh hưởng hướng tâm, D <br />
66 6 6<br />
là ma<br />
trận lực cản thuỷ động và lực ma sát, g là véctơ mô men và lực trọng<br />
6<br />
<br />
<br />
<br />
<br />
trường và sức nổi, d t là véc tơ nhiễu phi tuyến (như sóng, dòng chảy, …)<br />
6<br />
<br />
<br />
<br />
<br />
và b t là véc tơ ngoại lực và mô men tác động vào khối tâm của PTN trong<br />
6<br />
<br />
<br />
<br />
hệ qui chiếu vật thể. Mô hình động lực học của hệ còn có thể được biểu diễn theo<br />
hệ qui chiếu trái đất bằng cách áp dụng các phép biến đổi động học, giả thiết là các<br />
ma trận trong J không kỳ dị, ta có:<br />
M , C , D , g d t (4)<br />
<br />
3. XÂY DỰNG BỘ ĐIỀU KHIỂN<br />
Hệ thống tự động điều khiển ngư lôi thể hiện trên hình 1 bao gồm [8]:<br />
* Hệ thống chỉ đạo: nhận thông tin ban đầu để tạo ra quỹ đạo mong muốn bao<br />
gồm quỹ đạo theo hướng và độ sâu [1],[8].<br />
* Hệ thống dẫn đường: được trang bị khối dẫn đường quán tính INS, cảm biến<br />
áp suất, thiết bị đo tốc độ âm thanh ...để đo độ sâu, hướng và vị trí [1],[8].<br />
* Hệ thống điều khiển: So sánh hướng, độ sâu theo tín hiệu nhận được từ hệ<br />
thống dẫn đường với quỷ đạo mong muốn để tính toán tín hiệu điều khiển là góc<br />
quay các bánh lái và vây ổn định (các kênh điều khiển) [1],[8]..<br />
<br />
<br />
<br />
<br />
Hình 1. Sơ đồ hệ thống tự động điều khiển chuyển động PTN.<br />
Sai số hệ thống vòng hở đối với r t được biểu diễn như sau [1]:<br />
Mr f d S d , (5)<br />
Trong đó, f d M d J d d M d J d d Cd J d d Dd J d d g d<br />
1 1 1 1<br />
<br />
<br />
<br />
<br />
202 P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến …nơ ron thích nghi.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
<br />
S M J k1 e1 MJ M d J d d M J k1 e1 MJ M d J d d<br />
<br />
1 1 1 1 1 1<br />
<br />
<br />
<br />
<br />
M J k1 e1 M J e1 CJ C d J d d DJ Dd J d d g g d<br />
1 1 1 1 1 1<br />
<br />
<br />
<br />
Áp dụng lý thuyết xấp xỉ tổng quát để xấp xỉ hàm phụ không tường minh mạng<br />
f d W V d d <br />
T T<br />
nơ ron 3 lớp: (6)<br />
18 1 N 2 N 2 16<br />
trong đó, V t và W t tương ứng là các trọng số của mạng từ<br />
lớp 1-2 và từ 2-3, Các trọng số này là hằng số lý tưởng và hữu hạn; N2 là số nơ ron<br />
N 16<br />
của lớp ẩn, là hàm kích hoạt; d t là đầu vào của mạng nơ<br />
2<br />
19<br />
<br />
<br />
<br />
ron và là 1 tập compact chứa các giá trị quĩ đạo mong muốn hữu hạn và biết trước:<br />
T<br />
<br />
<br />
d 1, d , d , d<br />
T T T<br />
<br />
Từ (5), bộ điều khiển được thiết kế sử dụng mạng nơ ron truyền thẳng 3 lớp<br />
được bổ sung thêm thành phần phản hồi tích phân bền vững dấu sai số, bộ điều<br />
khiển có dạng:<br />
fˆd (7)<br />
Thành phần phản hồi được xác định: k s 1 e2 k s 1 e2 0 (8)<br />
trong đó, e2 , t là nghiệm phương trình:<br />
6<br />
<br />
<br />
<br />
k s 1 e2 sgn e2 , 0 0 (9)<br />
k s và là độ lợi điều khiển và là các giá trị hằng dương. Thành phần<br />
mạng truyền tiến của mạng nơ ron: fˆd Wˆ Vˆ d <br />
T T<br />
(10)<br />
N 2 16<br />
trong đó, Vˆ t và Wˆ t <br />
19 N 2<br />
là các ước lượng trọng số lý. Ước<br />
lượng trọng số của mạng trong (10) được cập nhật trực tuyến theo các phương<br />
trình:<br />
<br />
<br />
Wˆ proj 1ˆVˆ d e2<br />
T T<br />
(11)<br />
<br />
<br />
Vˆ proj 2d ˆ Wˆe<br />
' T<br />
2<br />
<br />
T<br />
<br />
(12)<br />
N 2 1 N 2 1<br />
trong đó, 1 và 2 <br />
19 19<br />
là các ma trận độ lợi điều khiển, các ma<br />
trận này là đối xứng, không đổi và xác định dương, còn ˆ ' <br />
N 2 1<br />
là đạo hàm<br />
riêng của ˆ Vˆ d .<br />
T<br />
<br />
<br />
<br />
Tiến hành thay bộ điều khiển trong (7) vào mạch vòng hở (5) ta nhận được sai<br />
số hệ thống bám vòng kín :<br />
Mr f d fˆd S d (13)<br />
Ước lượng sai lệch đối với trọng số mạng được xác định bằng<br />
V t V t Vˆ t và W t W t Wˆ t , trong đó V t <br />
19 N<br />
và 2<br />
<br />
<br />
<br />
<br />
W t <br />
N 16<br />
2<br />
. Sử dụng (6) và (10) để xác định đạo hàm của (13), ta được:<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 203<br />
Kỹ thuật điều khiển<br />
<br />
<br />
Mr Mr Wˆ ˆ ' V d W ˆ ' Vˆ d W ' V d W ˆ ' Vˆ d<br />
T T T T T T T T<br />
<br />
<br />
<br />
T T<br />
Wˆ ˆ ' V d S Wˆ ˆ Wˆ ' Vˆ d d <br />
T T T<br />
(14)<br />
<br />
ở đây, ˆ được tính toán trong (11) và (12), và đạo hàm của (8) xác định bởi<br />
phương trình: t k s 1 r sgn e2 (15)<br />
Thực hiện việc nhóm các thành phần, (14) có thể được viết lại:<br />
1 <br />
Mr Mr N N e2 k s 1 sgn e2 (16)<br />
2<br />
trong đó, N Wˆ , Vˆ , d , d , e1 , e2 , r , t và N Wˆ , Vˆ , d , d , t ,<br />
6 6<br />
<br />
<br />
<br />
<br />
1 <br />
N <br />
Mr proj 1ˆ ' Vˆ d e2 ˆ <br />
T T<br />
<br />
<br />
2<br />
<br />
ˆ ' Weˆ <br />
T<br />
Wˆ ˆ ' proj 2d S e2<br />
T T<br />
<br />
2 d<br />
(17)<br />
<br />
N Nd NB<br />
với N d d , d , t được xác định:<br />
6<br />
<br />
<br />
<br />
<br />
<br />
N d W ' V d d<br />
T T<br />
<br />
<br />
<br />
<br />
và thành phần N B Wˆ , Vˆ , d , d , t được tách ra sao cho:<br />
6<br />
<br />
<br />
<br />
<br />
<br />
NB NB NB<br />
1 2<br />
(18)<br />
với N B Wˆ , Vˆ , d , d , t , N B Wˆ , Vˆ , d , d , t ,<br />
6<br />
<br />
1 2<br />
<br />
<br />
<br />
<br />
N B W ˆ ' Vˆ d W ˆ ' V d<br />
T T T T<br />
<br />
1<br />
<br />
<br />
<br />
<br />
N B Wˆ ˆ ' V d W ˆ ' Vˆ d<br />
T T T T<br />
<br />
2<br />
<br />
<br />
<br />
Sỡ dĩ tách ra như vậy là vì các thành phần khác nhau trong (17) bị chặn khác<br />
nhau.<br />
Việc tách các thành phần trong (17,18) làm cơ sở cho việc xây dựng luật cập<br />
nhật trọng số của mạng nơ ron và phân tích tính ổn định của hệ [1]. Giới hạn trên<br />
của (17) được xác định: N <br />
(19)<br />
<br />
T<br />
Trong đó: <br />
e1 e2 r<br />
T T T<br />
(20)<br />
và là hàm dương toàn cục khả nghịch không tăng.<br />
Nd 1, NB 2 , N d 3<br />
Từ (14) và (15), đạo hàm của (22) bị chặn trên vì:<br />
N B 4 5 e2<br />
<br />
<br />
204 P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến …nơ ron thích nghi.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
Trong đó i , i 1,..., 5 là các hằng dương đã biết.<br />
<br />
4. KẾT QUẢ MÔ PHỎNG<br />
Với dữ liệu đầu vào của quĩ đạo mẫu là đường xoắn ốc có phương trình sau:<br />
T<br />
t t t 0 0 t <br />
d 2 sin 2 cos <br />
10 10 10 10 <br />
T<br />
với điều kiện đầu: d 0 1 2 0 0 0 0 . Tham số khởi tạo cho ma trận<br />
trọng số lý tưởng cho mạng nơ ron được chọn là: VˆNN rand 19, N 2 ,<br />
init<br />
<br />
<br />
Wˆ NN zeros N 2 1, 6 và số nơ ron trong lớp ẩn được chọn N 2 5 .<br />
init<br />
<br />
<br />
<br />
<br />
Hình 2. Mô hình mô phỏng PTN trên Matlab/Simulink.<br />
Độ lợi phản hồi được chọn là ma trận đường chéo có cấu trúc véc tơ như sau:<br />
T T<br />
k1 1 1 0.5 4 3 5 ; k s 103 4 5 7 8 8 7 <br />
T T<br />
0.3 0.3 0.5 0.3 0.3 0.1 ; 0.2 0.2 0.1 0.1 0.5 0.2<br />
Độ lợi mạng nơ ron truyền thẳng được chọn là 1 2000 I 66 , 2 500 I 66 .<br />
Mô hình toán mô phỏng trên matlab/simulink thể hiện trên hình 2.<br />
<br />
<br />
<br />
<br />
Hình 3. Sai số bám của các biến dịch dọc (x), dịch ngang (y) và lặn nổi (z).<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 205<br />
Kỹ thuật điều khiển<br />
<br />
<br />
<br />
<br />
Hình 4. Sai số bám của các biến góc nghiêng ngang (roll - ),<br />
nghiêng dọc (pitch - ) và góc hướng (yaw - ) theo thời gian.<br />
Trên hình 3 và hình 4 là kết quả sai số bám của các biến trạng thái. Từ kết quả<br />
ta có thể rút ra được các kết luận sau:<br />
- Bộ điều khiển nơ ron bám quĩ đạo cho dạng PTN 6 bậc tự do đã thực hiện bám<br />
tiệm cận theo quĩ đạo cho trước.<br />
- Khả năng bám dựa trên việc thích nghi với mô hình phi tuyến của PTN và khử<br />
bỏ được nhiễu môi trường.Từ giây 30 trở đi hệ gần như bám hoàn toàn theo quĩ<br />
đạo với nhiễu dòng chảy của môi trường trong giới hạn.<br />
- Giải thuật học trực tuyến của mạng nơ ron đa lớp cho phép PTN bám theo một<br />
quĩ đạo liên tục, quán tính (hệ có chứa thành phần lực quán tính do chuyển động<br />
theo quĩ đạo xoắn ốc).<br />
5. KẾT LUẬN<br />
Bài báo đã phát triển bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền thẳng<br />
độc lập cho một đối tượng phi tuyến hoạt động không rõ ràng. Kết quả nhận được<br />
đã minh chứng tính đúng đắn của thuật toán. Kết quả nghiên cứu làm tiền đề cho<br />
việc phát triển hệ điều khiển phi tuyến thích nghi ứng dụng hệ mờ - nơ ron với các<br />
hệ thống tương tự.<br />
<br />
TÀI LIỆU THAM KHẢO<br />
<br />
[1] T.I.Fossen, “Guidance and Control Of Ocean Vehicles,” John Wiley & Sons, 1994.<br />
[2] M. Santhakumar and T. Asokan, “Coupled, non-linear control system design<br />
for autonomous underwater vehicle (AUV)” in Proc. Int. Conf.on Control,<br />
Autom. Robot., and Vis., 17-20 2008, pp. 2309 –2313.<br />
[3] R. P. Kumar, A. Dasgupta, and C. S. Kumar, “A new tracking controller<br />
design for underwater vehicles using quadratic stabilization” J. Dyn.Syst.<br />
Meas. Contr., vol. 130, no. 2, 2008.<br />
<br />
<br />
206 P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến …nơ ron thích nghi.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
[4] L. Lapierre and B. Jouvencel, “Robust nonlinear path-following control of an<br />
AUV” IEEE J. Oceanic. Eng., vol. 33, no. 2, pp. 89–102, 2008.<br />
[5] L.-J. Zhang, X. Qi, and Y.-J. Pang, “Adaptive output feedback control based<br />
on DRFNN for AUV” IEEE J. Oceanic. Eng., vol. 36(9-10), pp. 716–722,<br />
2009.<br />
[6] G. Indiveri, M. Pino, M. Aicardi, and G. Casalino, “Nonlinear timeinvariant<br />
feedback control of an underactuated marine vehicle along a straight<br />
course” in Proc. IFAC Conf. on Manoeuvring and Control of Mar. Craft,<br />
2000, pp. 221–226.<br />
[7] G.N. Robert “Advance in Unmanned Marine Vehicles,” Control of<br />
Engineering Series 69 (1996) pp. 92-101.<br />
[8] Trương Duy Trung, Trần Đức Thuận, Nguyễn Quang Vịnh “Mô hình động<br />
học chuyển động của ngư lôi”, Tạp chí Nghiên cứu khoa học và công nghệ<br />
quân sự, (2012).<br />
<br />
ABSTRACT<br />
NONLINEAR CONTROL OF UNDERWATER VEHICLES<br />
USING AN ADAPTIVE NEURAL NETWORK<br />
<br />
Autonomous and remotely operated underwater vehicles such as ships and<br />
submarines are becoming a key component in search and recovery,<br />
exploration, surveillance, monitoring, and military applications. Underwater<br />
are nonlinear systems, works in unknown disturbance environment. This<br />
paper explores the development of a nonlinear controller for a fully actuated<br />
autonomous underwater vehicle (AUV) using an adaptive neural network to<br />
achieve asymptotic tracking results in the presence of complete model<br />
uncertainty and unknown disturbances.<br />
Keywords: Neural network, Nonlinear control, Underwater vehicles.<br />
<br />
Nhận bài ngày 20 tháng 07 năm 2015<br />
Hoàn thiện ngày 10 tháng 08 năm 2015<br />
Chấp nhận đăng ngày 07 tháng 09 năm 2015<br />
<br />
<br />
Địa chỉ: 1 Học viện Hải quân;<br />
2<br />
Viện Khoa học và Công nghệ quân sự;<br />
* Email: namphanhoai@gmail.com.<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 207<br />