Nghiên cứu khoa học công nghệ<br />
<br />
XÂY DỰNG THUẬT TOÁN XÁC ĐỊNH GIA TỐC PHÁP TUYẾN<br />
TỐI ƯU CHO MỘT LỚP THIẾT BỊ BAY TỰ DẪN<br />
TRONG KÊNH ĐỘ CAO<br />
Phạm Quang Hiếu1*, Nguyễn Thị Lê Na2, Trần Đức Thuận2<br />
Tóm tắt: Bài báo trình bày phương pháp tổng hợp gia tốc pháp tuyến tối ưu cho<br />
một lớp thiết bị bay trong kênh độ cao ở giai đoạn bay tự dẫn đến điểm gặp mục<br />
tiêu khi tính đến các yếu tố gây sai số động trên cơ sở ứng dụng lý thuyết điều khiển<br />
tối ưu và chứng minh một tính chất: Điều khiển tối ưu ngoài sự phụ thuộc vào trạng<br />
thái tốc độ quay đường ngắm, còn phụ thuộc vào gia tốc mục tiêu, gia tốc trọng<br />
trường và gia tốc dọc trục trong khoảng thời gian tương lai gần nhất định.<br />
Từ khóa: Tổng hợp hệ thống, Điều khiển thiết bị bay, Thiết bị bay.<br />
<br />
1. ĐẶT VẤN ĐỀ<br />
Tổng hợp luật tự dẫn là bài toán tổng hợp lực pháp tuyến tác động vào tâm khối<br />
thiết bị bay (TBB) để duy trì một tham số nào đó của quan hệ tương đối giữa mục<br />
tiêu (MT) và TBB. Căn cứ vào quy luật quay đường ngắm TBB - MT có thể chia<br />
nhóm phương pháp dẫn hai điểm thành: phương pháp dẫn đuổi, phương pháp dẫn<br />
thẳng, phương pháp dẫn tiếp cận song song, phương pháp dẫn tiếp cận tỉ lệ [1].<br />
Hầu hết các TBB bay tự dẫn sử dụng phương pháp dẫn tiếp cận tỉ lệ (TCTL). Việc<br />
nghiên cứu tổng hợp luật dẫn TCTL đã được nhiều công trình đề cập, kết quả công<br />
bố đã chứng minh phương pháp TCTL là một phương pháp dẫn tối ưu đảm bảo<br />
cực tiểu độ trượt khi TBB tiếp cận mục tiêu. Bên cạnh đó một số công trình [3, 5,<br />
6, 7] đã sử dụng lý thuyết điều khiển hiện đại để tìm luật tự dẫn cho TBB trên cơ<br />
sở phương pháp dẫn TCTL, tuy nhiên, các nghiên cứu này đã bỏ qua ảnh hưởng<br />
của các yếu tố như: sự thay đổi của tốc độ TBB, sự cơ động của MT và gia tốc<br />
trọng trường. Bài báo [4] đã ứng dụng lý thuyết điều khiển tối ưu để tìm luật dẫn<br />
cho lớp TBB có tốc độ thay đổi, nhưng luật dẫn đề xuất chưa đề cập đến khả năng<br />
cơ động của mục tiêu và tác động của gia tốc trọng trường. Công trình [2] đã đề<br />
xuất luật dẫn tối ưu theo phương pháp TCTL và có tính đến các yếu tố gây sai số<br />
động, tuy nhiên phương pháp giải bài toán của [2] chưa mang tính tổng quát, chỉ<br />
đúng cho một trường hợp khi mục tiêu không cơ động.<br />
Mục đích của bài báo là ứng dụng lý thuyết điều khiển tối ưu để tổng hợp luật<br />
dẫn cho một lớp TBB tự dẫn có tốc độ thay đổi đến điểm gặp MT khi tính đến các<br />
yếu tố gây sai số động. Trước tiên, bài báo trình bày bài toán điều khiển tối ưu cho<br />
hệ thống phi tuyến có tác động của nhiễu. Tiếp theo, tổng hợp luật tự dẫn với mô<br />
hình TBB có tốc độ thay đổi khi tính đến khả năng cơ động của mục tiêu, tác động<br />
của gia tốc trọng trường và gia tốc dọc trục trên cơ sở áp dụng bài toán điều khiển<br />
tối ưu trong điều kiện có tác động nhiễu.<br />
2. BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU HỆ THỐNG PHI TUYẾN<br />
CÓ TÁC ĐỘNG CỦA NHIỄU<br />
Xét một lớp hệ thống phi tuyến có tác động của nhiễu dưới dạng [8]:<br />
X f ( X ) BU CZ (1)<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 47, 02 - 2017 3<br />
Tên lửa & Thiết bị bay<br />
<br />
Bài toán yêu cầu tổng hợp luật điều khiển tối ưu cho hệ thống (1) để cực tiểu<br />
hóa hàm chỉ tiêu chất lượng J dạng toàn phương:<br />
tf<br />
1 1<br />
J X T (t f ).. X (t f ) ( X T QX U T RU )dt (2)<br />
2 t<br />
2<br />
0<br />
<br />
Trong đó: X là véc tơ biến trạng thái; U là biến điều khiển; Z là trạng thái<br />
nhiễu tác động; f ( X ) là hàm của biến trạng thái X; B là ma trận điều khiển; C là<br />
ma trận nhiễu; là ma trận trọng số có tính chất xác định dương; Q là ma trận<br />
trọng số theo biến trạng thái có tính chất xác định dương; R là ma trận trọng số<br />
theo biến điều khiển có tính chất xác định dương, t0 là thời gian bắt đầu điều khiển<br />
tối ưu; tf là thời gian kết thúc điều khiển tối ưu.<br />
Theo định lý trong [8]: Nếu X * (t ) là trạng thái tối ưu thỏa mãn cực tiểu hàm<br />
chỉ tiêu chất lượng dạng toàn phương (2) trên quỹ đạo của hệ thống phi tuyến (1),<br />
thì biến điều khiển tối ưu tương ứng là:<br />
U * (t ) R 1BT G ( X , t ) R 1BT K1 (t ) (3)<br />
Trong đó: G ( X , t ) là hàm của biến trạng thái X và thời gian t; K1 (t ) là nghiệm<br />
của phương trình:<br />
K X * (t ), t K X * (t ), t CZ , K (t ) 0<br />
1 1 1 (4)<br />
f<br />
<br />
<br />
<br />
Các ma trận X * (t ), t và X * (t ), t được xác định theo biểu thức:<br />
<br />
X *<br />
(t ), t GBR B (<br />
x<br />
1 T<br />
x f )T<br />
X X * (t )<br />
(5)<br />
X *<br />
(t ), t G<br />
x *<br />
X X (t )<br />
<br />
Nếu một hệ thống tuyến tính có f ( X ) AX , khi này hệ thống (1) có dạng:<br />
X AX BU CZ (6)<br />
Trong trường hợp này, biến điều khiển tối ưu tương ứng là:<br />
U * (t ) R 1BT K x (t ) X R 1BT K1 (t ) (7)<br />
Với K x (t ) và K1 (t ) là nghiệm của hệ phương trình vi phân:<br />
K x K x BR 1BT K x K x A AT K x Q, K x (t f ) (8)<br />
K1 ( K x BR 1BT AT ) K1 K x CZ , K1 (t f ) 0 (9)<br />
Từ các phương trình (8), (9) có các nhận xét sau:<br />
- Ma trận hệ số K x hoàn toàn có thể xác định trước bằng cách giải hệ phương<br />
trình (8) khi các ma trận A, B, Q không thay đổi trong quá trình điều khiển.<br />
- Vì điều kiện biên của (9) ở phía phải, nên để xác định K1 (t ) ở thời điểm t cần<br />
phải biết Z ở thời điểm tương lai trong khoảng (t, tf), tức là phải dự đoán Z.<br />
<br />
<br />
4 P. Q. Hiếu, N. T. L. Na, …, “Xây dựng thuật toán xác định gia tốc… trong kênh độ cao.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
3. TỔNG HỢP LUẬT DẪN THIẾT BỊ BAY TỐC ĐỘ THAY ĐỔI<br />
KHI TÍNH ĐẾN CÁC YẾU TỐ GÂY SAI SỐ ĐỘNG<br />
Xét mô hình động học tự dẫn của TBB ứng dụng trong quân sự khi tiến công<br />
mục tiêu cơ động, tương quan động hình học giữa TBB và MT trong mặt phẳng<br />
thẳng đứng được thể hiện trên hình 1.<br />
<br />
<br />
<br />
<br />
Hình 1. Tương quan hình học giữa TBB và MT trong mặt phẳng thẳng đứng.<br />
Theo [1]hệ phương trình động hình học trong mặt phẳng thẳng đứng như sau:<br />
D V cos( ) V cos( )<br />
M M T T (10)<br />
D VM sin( M ) VT sin(T ) (11)<br />
Tiến hành lấy đạo hàm hai vế phương trình (11) có:<br />
D D VM sin( M ) VM (M ) cos( M ) VT sin(T )<br />
(12)<br />
V ( ) cos( )<br />
T T T<br />
<br />
D D VM sin( M ) VM M cos( M ) VT sin(T )<br />
(13)<br />
VTT cos(T ) [VM cos( M ) VT cos(T )]<br />
Nếu vận tốc mục tiêu M và vận tốc thiết bị bay T thay đổi chậm và các góc<br />
, có giá trị nhỏ thì các số hạng VM sin( M ),VT sin(T ) ở vế phải của<br />
biểu thức (13) sẽ là các vô cùng bé bậc hai nên có thể bỏ qua. Từ (10) ta thay giá<br />
trị của biểu thức trong ngoặc [.] bằng D . Dễ dàng nhận thấy các tích VM M , VTT<br />
là các gia tốc pháp tuyến của mục tiêu và TBB, tức là WM VM M , WT VTT . Từ<br />
các nhận xét trên phương trình (13) sẽ có dạng sau:<br />
2 D D W cos( ) W cos( )<br />
M M T T (14)<br />
Trong đó: T và M tương ứng là vị trí của TBB và MT; D là khoảng cách giữa<br />
TBB và MT; góc nghiêng đường ngắm TBB - MT; T là góc nghiêng quỹ đạo<br />
TBB; M là góc nghiêng quỹ đạo MT; g là gia tốc trọng trường; WM , WT tương<br />
ứng là gia tốc pháp tuyến của MT và TBB; Wx là gia tốc dọc trục của TBB; WM ,<br />
WT tương ứng là các thành phần gia tốc MT và gia tốc TBB, vuông góc với đường<br />
ngắm; Wx là thành phần gia tốc dọc trục TBB, vuông góc với đường ngắm; g là<br />
thành phần gia tốc trọng trường, vuông góc với đường ngắm.<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 47, 02 - 2017 5<br />
Tên lửa & Thiết bị bay<br />
<br />
Trong trường hợp các góc M , T , có giá trị nhỏ, thì phương của gia tốc pháp<br />
tuyến của TBB và MT gần vuông góc với đường ngắm và ( cos( M ) 1 ,<br />
cos(T ) 1 ), khi đó, gia tốc pháp tuyến trong kênh độ cao sẽ là tổng:<br />
WT WT Wx g (15)<br />
Từ (14) và (15) có phương trình xấp xỉ như sau:<br />
2 D D W W W g <br />
M T x (16)<br />
Trong đó, là tốc độ góc quay đường ngắm trong mặt phẳng thẳng đứng, được<br />
ký hiệu là y ( y ). Nhiệm vụ của điều khiển dẫn theo thông tin tốc độ đường<br />
<br />
ngắm là tạo lực để có gia tốc pháp tuyến WT cho TBB sao cho tốc độ quay đường<br />
ngắm y tiến tới 0 và duy trì xung quanh giá trị không này. Khi vận tốc mục tiêu<br />
có giá trị nhỏ hơn nhiều lần tốc độ tên lửa (điều này hoàn toàn hợp lý đối với vấn<br />
đề dùng tên lửa đối hải bắn mục tiêu trên biển) thì tham số D có thể được xấp xỉ<br />
bằng tốc độ của thiết bị bay VT. Phương trình (16) khi này có dạng:<br />
D y 2VT y =WM WT Wx g (17)<br />
<br />
Đặt x1 y ; x2 y x1 ; u WT ; Z WM Wx g khi này phương trình<br />
(17) có thể được viết dưới dạng không gian trạng thái như sau:<br />
x1 x2<br />
<br />
2VT u Z (18)<br />
x2 D x1 D D<br />
Đối với các TBB tự dẫn có trong trang bị hiện nay, luật điều khiển chủ yếu<br />
được thực hiện theo phương pháp tiếp cận tỉ lệ, tức là u Kx1 . Trong công trình<br />
[2] tác giả đã tổng hợp luật dẫn tối ưu, song chỉ xét trong trường hợp đại lượng Z<br />
không biến đổi theo thời gian, tức là Z Const .<br />
Trong bài báo này, nhóm tác giả sẽ áp dụng luật điều khiển theo (7) để tổng hợp<br />
luật dẫn và áp dụng cho các trường hợp tổng quát hơn so với kết quả của nhóm tác<br />
giả [2].<br />
Vì cự ly D liên tục thay đổi. Đối với TBB tự dẫn khi cự ly D rút ngắn đến giới<br />
hạn, thì TBB sẽ chuyển động thẳng mà không theo nguyên lý tiếp cận tỉ lệ nữa. Ở<br />
đây chúng ta xét bài toán điều khiển tối ưu cho trường hợp cự ly giới hạn này, tức<br />
là trong phương trình thứ hai của (18) thay D bằng Dmin const . Vậy ma trận A,<br />
B, C trong hệ (6) sẽ là:<br />
0 1 0 0 <br />
A 2VT ; B 1 ; C 1 (19)<br />
0 <br />
Dmin Dmin Dmin <br />
Thay luật điều khiển (7) vào (6) nhận được:<br />
<br />
<br />
6 P. Q. Hiếu, N. T. L. Na, …, “Xây dựng thuật toán xác định gia tốc… trong kênh độ cao.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
X A BR 1BT K x X BR 1BT K1( t ) CZ<br />
(20)<br />
Để hệ hoạt động thì hệ tuyến tính (20) phải ổn định, tức là ma trận:<br />
A A BR 1BT K x (21)<br />
phải thỏa mãn tính chất Hurwitz, nghĩa là các nghiệm của phương trình đặc trưng:<br />
det( I A ) 0 (22)<br />
phải có phần thực là âm.<br />
Trong trường hợp các ma trận A, B, Q, R là các ma trận hằng và thời gian điều<br />
khiển tf đủ dài, thì phương trình vi phân (8) có thể thay bằng hệ phương trình đại<br />
số sau [8]:<br />
K x BR 1BT K x K x A AT K x Q 0 (23)<br />
Để phần thực các nghiệm của phương trình (22) có giá trị âm thì khi giải<br />
phương trình đại số bậc hai (23) cần phải lấy nghiệm K x (trong hai bộ nghiệm) đạt<br />
yêu cầu phần thực nghiệm phương trình (22) có giá trị âm.<br />
Đặt biến số:<br />
tf t (24)<br />
Khi t 0 thì t f , còn khi t t f thì 0 . Đây chính là tham số thời gian ngược<br />
với mốc thời điểm cuối quá trình điều khiển, khi này phương trình (9) sẽ có dạng:<br />
K ( ) K ( t ) K BR 1BT AT K K CZ<br />
1 1 x x x<br />
(25)<br />
<br />
AT K x BR 1BT K x K x CZ , K1( 0 ) 0<br />
<br />
Theo [8], ma trận nghiệm K x của phương trình (23) có tính đối xứng qua<br />
đường chéo chính. Vì vậy:<br />
AT K x BR 1BT AT (26)<br />
Do vậy, nghiệm của phương trình (22) cũng là nghiệm của phương trình:<br />
<br />
det I [AT K x BR 1BT ] 0 (27)<br />
Như vậy, phương trình (25) cũng có tính ổn định. Vì hệ phương trình vi phân<br />
(25) là tuyến tính nên theo [8], nếu biết nghiệm của nó ở thời điểm 1 và hàm<br />
Z( ) trong khoảng 1 , thì nghiệm của nó được xác định như sau:<br />
<br />
( 1 )<br />
K1( ) e .K1( 1 ) e ( ) K x CZ( )d (28)<br />
1<br />
<br />
Vì các nghiệm của phương trình đặc trưng của ma trận có phần thực âm nên<br />
định mức của ma trận e ( 1 ) có tính chất sau:<br />
lim e ( 1 ) 0 (29)<br />
( 1 )<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 47, 02 - 2017 7<br />
Tên lửa & Thiết bị bay<br />
<br />
Như vậy, với mọi giá trị ε dương nhỏ tùy ý thì luôn tìm được giá trị T để thỏa mãn:<br />
e ( 1 ) nếu ( 1 ) T (30)<br />
<br />
Khi đó nghiệm K1( ) được xấp xỉ như sau:<br />
( 1 T )<br />
K1( ) e ( ) K x CZ( )d (31)<br />
1<br />
<br />
Hoặc:<br />
<br />
K1( ) e ( ) K x CZ( )d (32)<br />
T<br />
Vì là biến thời gian ngược với thời gian theo (19) nên khi đó:<br />
( t T )<br />
K1( t ) e ( t ) K x CZ( )d (33)<br />
t<br />
<br />
Từ (33) cho thấy, để xác định được K1( t ) ở thời điểm t cần phải có thông tin về<br />
Z ( ) trong một khoảng thời gian không dài (T) trong tương lai.<br />
Từ biểu thức (7) và (33) cho thấy, để tổng hợp được điều khiển tối ưu trong thời<br />
điểm hiện tại cần phải biết tốc độ quay đường ngắm và gia tốc của nó cùng với các<br />
thông tin của mục tiêu, thành phần gia tốc trọng trường và thành phần gia tốc dọc<br />
trục chiếu lên đường ngắm trong khoảng thời gian trong tương lai.<br />
Trong trường hợp mục tiêu không cơ động, thành phần gia tốc trọng trường và<br />
gia tốc dọc trục không thay đổi thì luật điều khiển tối ưu của tác giả [2] trùng với<br />
luật tối ưu trong bài báo này, tức là kết quả của tác giả [2] chỉ là trường hợp riêng<br />
của luật dẫn này.<br />
4. KẾT LUẬN<br />
Từ các biến đổi toán học chặt chẽ cho thấy luật điều khiển tối ưu choTBB tiếp<br />
cận mục tiêu cơ động, ngoài thông tin về trạng thái đường ngắm cần phải có thông<br />
tin về mục tiêu, về gia tốc trọng trường và về gia tốc dọc trục TBB chiếu lên đường<br />
ngắm trong một khoảng thời gian tương lai hữu hạn. Để giải quyết vấn đề này phải<br />
có giải pháp xác định trạng thái tốc độ quay đường ngắm, giải pháp dự đoán các<br />
thông tin về gia tốc mục tiêu, gia tốc trọng trường và gia tốc dọc trục TBB chiếu<br />
lên đường ngắm trong một khoảng thời gian tương lai hữu hạn. Kết quả trong bài<br />
báo này có giá trị cho việc hiện đại hóa thuật toán điều khiển cho một số chủng<br />
loại tên lửa như tên lửa hành trình đối hải ở giai đoạn tự dẫn (giai đoạn cuối), tên<br />
lửa phòng không tầm ngắn, tên lửa không đối không.<br />
TÀI LIỆU THAM KHẢO<br />
[1]. Lê Anh Dũng, Nguyễn Hữu Độ, Nguyễn Xuân Căn, Huỳnh Lương Nghĩa, “Lý<br />
Thuyết bay và hệ thống điều khiển tên lửa phòng không”, tập 3, HVKTQS, 1999.<br />
[2]. Doãn Văn Minh, “Nghiên cứu tổng hợp thuật toán một phương pháp dẫn mới<br />
cho tên lửa phòng không tự dẫn”, Luận án Tiến sĩ Kỹ thuật, HVKTQS, 2014.<br />
<br />
<br />
8 P. Q. Hiếu, N. T. L. Na, …, “Xây dựng thuật toán xác định gia tốc… trong kênh độ cao.”<br />
Nghiên cứu khoa học công nghệ<br />
<br />
[3]. Nguyễn Thái Trung, “Cơ sở lý thuyết điều khiển tên lửa”, Học viện Hải quân,<br />
2008.<br />
[4] Trần Đức Thuận, Phạm Quang Hiếu, Nguyễn Văn Lâm, Nguyễn Thượng<br />
San,“Tổng hợp luật tự dẫn cho thiết bị bay có vận tốc thay đổi”, Tạp chí<br />
Nghiên cứu KH&CN quân sự, số 43, 2016.<br />
[5]. Bulent Ozkan, “Dynamic model, guidance and control of homming missiles”,<br />
Midle East Technical University, 2005.<br />
[6]. Lu-Ping Tsao, Ching-Showlin, “A New Optimal Guidance Law for Short-<br />
Range Homing Missiles”, Vol. 24, No. 6, (2000), pp. 422-426.<br />
[7]. Neil F. Palumbo, Ross A. Blauwkamp, Justin M. Lloyd, “Modern Homing<br />
Missile Guidance Theory and Techniques”, John Hopkins APL Technical<br />
Digest, Volume 29, Number 10 (2010).<br />
[8]. M. ATAHC и П. ФAЛБ, “Oптимальное управление”, Издательстово<br />
“ MАШИНОСТРОЕНИЕ, Москва, 1968.<br />
ABSTRACT<br />
SYNTHESIS A GUIDANCE LAW FOR VARIABLE SPEED<br />
FLIGHT VEHICLE AGAIN MANEUVERING OF TARGET<br />
In the paper, the guidance law to the collision in phase of homing for<br />
variable speed flight vehicle again the factors creating dynamic error is<br />
synthesized on optimal control theory and the property is proved: The<br />
optimal control depends on not only the status line of sight rotation speed but<br />
also the flight vehicle, gravitational acceleration and axial acceleration<br />
specified time period in the future.<br />
Keywords: System synthesis, Flight vehicle control, Flight vehicle.<br />
<br />
<br />
<br />
Nhận bài ngày 10 tháng 01 năm 2017<br />
Hoàn thiện ngày 20 tháng 01 năm 2017<br />
Chấp nhận đăng ngày 20 tháng 02 năm 2017<br />
<br />
1<br />
Địa chỉ: Khoa Tên lửa - Pháo tàu, Học viện Hải quân;<br />
2<br />
Viện Khoa học và Công nghệ quân sự.<br />
*<br />
Email: hieu.phamquang@gmail.com.<br />
<br />
<br />
<br />
<br />
Tạp chí Nghiên cứu KH&CN quân sự, Số 47, 02 - 2017 9<br />