MônMôn họchọc
LÝ THUYẾT ĐIỀU KHIỂN NÂNG CAO LÝ THUYẾT ĐIỀU KHIỂN NÂNG CAO
ê
Giảng viên: TS. Huỳnh Thái Hoàng Bộ môn Điều Khiển Tự Động Khoa Điện – Điện Tử Đại học Bách Khoa TP HCM Đại học Bách Khoa TP.HCM Email: hthoang@hcmut.edu.vn Homepage: http://www4.hcmut.edu.vn/~hthoang/
22 March 2011
© H. T. Hoàng - HCMUT
1
Chương 33gg Chương
ĐIỀU KHIỂN TỐI ƯU ĐIỀU KHIỂN TỐI ƯU
22 March 2011
© H. T. Hoàng - HCMUT
2
NộiNội dung
dung chương
chương 33
ố
ề
ể
ế
(cid:145) Giới thiệu (cid:145) Giới thiệu (cid:145) Tối ưu hóa tĩnh (cid:145) Tối ưu hóa động và phương pháp biến phân (cid:145) Điều khiển tối ưu liên tục dùng phương pháp biến phân (cid:145) Phương pháp qui hoạch động Bellman (cid:145) Điều khiển tối ưu toàn phương tuyến tính LQR (cid:145) Ước lượng trạng thái tối ưu (lọc Kalman) (cid:145) Điều khiển tối ưu LQG (cid:145) Điề khiể tối LQG
22 March 2011
© H. T. Hoàng - HCMUT
3
GIỚI THIỆU GIỚI THIỆU
22 March 2011
© H. T. Hoàng - HCMUT
4
Giới thiệu Giới thiệu
(cid:145) Điều khiển tối ưu là bài toán xác định luật điều khiển cho hệ thống (cid:145) Điều khiển tối ưu là bài toán xác định luật điều khiển cho hệ thống động cho trước sao cho tối thiểu hóa một chỉ tiêu chất lượng.
(cid:145) Điều khiển tối ưu được phát triển trên cơ sở toán học: phương pháp biến phân được phát triển bởi các nhà toán học như Bernoulli, Euler, Lagrange, Weiertrass,…
(cid:145) Từ những năm 1950, điều khiển tối ưu phát triển mạnh mẽ và trở (cid:145) Từ những năm 1950 điều khiển tối ưu phát triển mạnh mẽ và trở
thành một lĩnh vực độc lập. Các phương pháp điều khiển tối ưu quan trọng nhất là: (cid:142) Phương pháp quy hoạch động do Richard Bellman (1920-1984)
đưa ra trong thập niên1950.
(cid:142) Nguyên lý cực tiểu Pontryagin do Lev Pontryagin (1908-1988) (cid:142) Nguyên lý cực tiểu Pontryagin do Lev Pontryagin (1908 1988)
và các đồng sự đưa ra trong thập niên 1950.
(cid:142) Bài toán điều chỉnh toàn phương tuyến tính và lọc Kalman do
p
g
y
ọ
Rudolf Kalman (b. 1930) đưa ra trong những năm1960.
22 March 2011
© H. T. Hoàng - HCMUT
5
Phân loại bài toán điều khiển tối ưu Phân loại bài toán điều khiển tối ưu
(cid:145) Có nhiều bài toán điều khiển tối ưu, tùy theo: (cid:145) Có nhiều bài toán điều khiển tối ưu tùy theo:
(cid:142) Loại đối tượng điều khiển Miền thời gian liên tục hay rời rạc (cid:142) Miền thời gian liên tục hay rời rạc (cid:142) Chỉ tiêu chất lượng (cid:142) Bài toán tối ưu có ràng buộc hay không
(cid:145) Điều khiển tối ưu tĩnh: chỉ tiêu chất lượng không phụ thuộc thời gian
(cid:145) Điều khiển tối ưu động: chỉ tiêu chất lượng phụ thuộc thời gian (cid:142) Bài toán chỉnh toàn phương tuyến tính (Linear Quadractic (cid:142) Bài t á t
ế tí h (Li
Q d
hươ
ti
hỉ h t à Regulator – LQR)
(cid:142) Bài toán điều khiển tối ưu H2 2 (cid:142) …
22 March 2011
© H. T. Hoàng - HCMUT
6
Ứng dụng Ứng dụng
(cid:145) Trước khi máy tính số ra đời, chỉ có thể giải được một số ít bài toán (cid:145) Trước khi máy tính số ra đời chỉ có thể giải được một số ít bài toán
điều khiển tối ưu đơn giản
(cid:145) Máy tính số ra đời cho phép ứng dụng lý thuyết điều khiển tối ưu
g ụ g ý
y
y
p p vào nhiều bài toán phức tạp.
(cid:145) Ngày nay, điều khiển tối ưu được ứng dụng trong nhiều lĩnh vực:
(cid:142) Không gian (aerospace) (cid:142) Điều khiển quá trình (proccess control) (cid:142) Robot (cid:142) Robot (cid:142) Kỹ thuật sinh học (bioengineering) Kinh tế (cid:142) Kinh tế (cid:142) Tài chính (cid:142) …
22 March 2011
© H. T. Hoàng - HCMUT
7
TỐI ƯU HÓA TĨNH TỐI ƯU HÓA TĨNH
22 March 2011
© H. T. Hoàng - HCMUT
8
Tối ưu hóa tĩnh không ràng buộc Tối ưu hóa tĩnh không ràng buộc
(cid:145) Bài toán tối ưu tĩnh không ràng buộc: tìm m thông số thực (hay phức) (cid:145) Bài toán tối ưu tĩnh không ràng buộc: tìm m thông số thực (hay phức)
u1, u2,…, um sao cho hàm L(u1, u2,…, um) đạt cực tiểu:
( 1
m)
( ) L(u)=L(u1, u2,…, um) → min 2 trong đó u=[u1, u2,…, um]T
( )
ụ
ọ
ộ
(
)
(cid:145) Điểm u* được gọi là điểm cực tiểu cục bộ nếu L(u)≥L(u*) với mọi u
ự ợ gọ nằm trong lân cận ε của u*.
(cid:145) Điểm u* được gọi là điểm cực tiểu toàn cục nếu L(u)≥L(u*) với mọi u
22 March 2011
© H. T. Hoàng - HCMUT
9
Điều kiện cực trị không ràng buộc Điều kiện cực trị không ràng buộc
(cid:145) Giả sử L(u) khả đạo hàm theo u thì điều kiện cần và đủ để u* là (cid:145) Giả sử L(u) khả đạo hàm theo u, thì điều kiện cần và đủ để u là
điểm cực tiểu cục bộ là:
( *uuL ( ) = 0) u *uuu L > 0) (
⎧ ⎨ ⎨ ⎩
g trong đó:
uL ∂∂ 1 uL ∂∂
2
=
L =u u
L ∂ u ∂
M M uL ∂∂
m
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
2
2
2
∂
∂
∂
uuL ∂ 11
uuL ∂ 21
uuL ∂ 1
m
L
2
L
=
=
uu
L ∂ 2 u ∂
2 2
2 2
2 2
∂ ∂
M uuL ∂ ∂
∂ ∂
∂ ∂
M uuL ∂ ∂ 1
m
m
2
M uuL ∂ ∂ mm
L
⎡ ⎡ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎤ ⎥ ⎥ ⎥ ⎥ ⎦
22 March 2011
© H. T. Hoàng - HCMUT
10
Thí dụ 1 Tìm cực trị không ràng buộc –– Thí dụ 1 Tìm cực trị không ràng buộc
u 2 2 u
u 3 3 u
L L
+ +
+ +
+ +
+ +
2 =u 5)( u 5)( =u u 1
2 2
uu 2 2 uu 21
u 8 8 u 1
2
08
2 u
+
=+
.0
7222
−=
0
=
=
⇒
⇒
Lu u
L ∂ u ∂ ∂
u 4
03
2 =+
.0
3889
−=
u 2 1
2
⎧ 10 u ⎪ 1 ⎨ ⎨ ⎪ ⎪⎩ +
* ⎧ 1u ⎪ ⎨ ⎨ * * ⎪ ⎪⎩ 2u
(cid:145) Tìm cực trị hàm: (cid:145) Tìm cực trị hàm: (cid:145) Giải: (cid:145) Điều kiện cần có cực trị: L ∂ ⎤ ⎡ ⎥ ⎢ u ∂ 1 = ⎥ ⎢ L L ∂ ∂ ⎢ ⎥ ⎢ ⎥ ⎢ 2 ⎥ u ⎣∂ ⎦
2
2
2 2
=
=
0>uuL⇒ 0>L⇒
uuL⇒ L⇒
Luu L
2
4
10 ⎡ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎦
(cid:145) Xét vi phân bậc hai: (cid:145) Xét vi phân bậc hai: 2 L L ∂ ∂ 2 u uu u uu ∂ ∂∂ ∂ ∂∂ 1 1 1 1 2 2 L L ∂ ∂ 2 uu u ∂∂ ∂ 2 1
2
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
.0(
,
7222
3889
)
.0; −
là điểm cực tiểu.
⇒
* * ( ) −=uu 2 1
22 March 2011
© H. T. Hoàng - HCMUT
11
Thí dụ 1 Tìm cực trị không ràng buộc –– Thí dụ 1 Tìm cực trị không ràng buộc
7222 7222
3889 3889
) )
*u −=u 0( .0(
0; .0; −
250
200
150
100
L
50
0
4
u*
2
-50 6
4
0
2
0
-2
-2
-4
4 -4
u1 1
-6 -6
u2 u
22 March 2011
© H. T. Hoàng - HCMUT
12
Tối ưu hóa tĩnh có ràng buộc Tối ưu hóa tĩnh có ràng buộc
(cid:145) Bài toán tối ưu tĩnh có ràng buộc: tìm vector thông số u sao cho hàm (cid:145) Bài toán tối ưu tĩnh có ràng buộc: tìm vector thông số u sao cho hàm
L(x,u) đạt cực tiểu, đồng thời thỏa điều kiện f(x,u)=0 (
) L(x,u) → min f(x,u)=0
trong đó x=[x1, x2,…, xn]T u=[u1, u2,…, um]T
n
L :
m ℜ→ℜ×ℜ
n
p
f
m ℜ→ℜ×ℜ:
ộ (cid:145) L(x,u) gọi là hàm đánh giá và f(x,u) là điều kiện ràng buộc
( , ) gọ
f( , )
g
g
ệ
22 March 2011
© H. T. Hoàng - HCMUT
13
Hàm Hamilton Hàm Hamilton
(cid:145) Định nghĩa hàm Hamilton: (cid:145) Định nghĩa hàm Hamilton:
H
ux ,(
)
L
ux ,(
)
uxf ,(
)
=
T λ+
trong đó là vector hằng số, gọi là thừa số Larrange trong đó là vector hằng số gọi là thừa số Larrange
pℜ∈λ pℜ∈λ
Do ràng buộc f(x,u) = 0 nên cực tiểu của L(x,u) cũng chính là cực tiểu của H(x,u). tiểu của H(x u)
tiể khô
à
⇒ Biến đổi bài toán tìm cực tiểu hàm L(x,u) với ràng buộc f(x,u) = 0 thành bài toán tìm cực tiểu không ràng buộc hàm Hamilton H(x,u) thà h bài t á tì )
b ộ hà H ilt H(
(cid:145) Vi phân hàm Hamilton:
)
)
H ∂
H ∂
)
u
x
dH
,( ux
d
d
=
+
,( ux x ∂
,( ux u ∂
22 March 2011
© H. T. Hoàng - HCMUT
14
Thừa số Lagrange Thừa số Lagrange
(cid:145) Do ta cần tìm cực trị theo u nên có thể tự do chọn thừa số Lagrange (cid:145) Do ta cần tìm cực trị theo u nên có thể tự do chọn thừa số Lagrange
sao cho:
) )
) )
) )
H H ∂ ∂
L L ∂ ∂
H H
ux ,( (
) )
0 0
=
=
+
T T λ λ
=
x
ux ,( ,( ux x ∂
uxf ,( ,( uxf ∂ ∂ x ∂
ux ,( ,( ux x ∂
1 −
) )
) )
Tλ
−=
⇒
uxL ( ,( uxL ∂ ⎡∂ ⎡ ⎢ x ∂ ⎣
uxf uxf ,( ( ⎡∂⎤ ∂ ⎤ ⎡ ⎥ ⎢ x ∂ ⎦ ⎣
⎤ ⎤ ⎥ ⎦
Viết gọn lại:
ế
T λ
] 1− ] 1
[ [ L f x
x
22 March 2011
© H. T. Hoàng - HCMUT
15
−=
Độ dốc của hàm mục tiêu với điều kiện ràng buộc Độ dốc của hàm mục tiêu với điều kiện ràng buộc
) )
) )
L L ∂ ∂
L L ∂ ∂
(cid:145) Vi phân hàm mục tiêu: (cid:145) Vi hâ hà
tiê
dL dL
,( ( ux
d d
x
d d u
) )
+
=
)
)
(cid:145) Do f(x,u) = 0 nên: f( , )
d x x d d u u d
,( ,( d d uxf uxf
) )
0 0
1 −
+ + = =
,( ux ux ,( u ∂ ,( uxf ∂ u ∂ )
u
d
d
x
−=
⇒
,( ux ux ,( x ∂ ,( uxf ∂ x ∂ ,( uxf ) ∂ x x ∂ ∂
,( uxf ∂ u u ∂ ∂
⎤ ⎥ ⎦ ⎦
⎡ ⎢ ⎣ ⎣
(cid:145) Thay (2) vào (1), ta được:
1
−
)
)
)
)
L ∂
L ∂
dL dL
,( ux ux (
d u u d
u u
d d
−=) ) −=
+ +
,( uxf ∂ u ∂
,( ux u ∂
)
H ∂
)
,( uxf x ∂ L ∂
,(⇒ dL
⇒
ux
u
d
) )
(
=
,( ux ,( dL d u ) ) = +
ux ,( u∂ ∂
,( ux ⎡∂ ⎢ ⎢ x ∂ ⎣ ,( ) uxf ∂ u ∂ ∂
⎡ T λ ⎢⎣ ⎢⎣ ⎤ ⎥⎦ ⎥⎦
⎤ ⎥ ⎥ ⎦ ,( ux u ∂ ∂ ⇒Với điều kiện f(x,u)=0, độ dốc của L(x,u) theo u chính bằng Hu(x,u) ⇒ Điều kiện để L(x,u) đạt cực trị với ràng buộc f(x,u) 0 là: ⇒ Điều kiện để L(x u) đạt cực trị với ràng buộc f(x u)=0 là:
22 March 2011
© H. T. Hoàng - HCMUT
16
0) =uxuH ,(
Điều kiện cần cực trị có ràng buộc Điều kiện cần cực trị có ràng buộc
(cid:145) Kết hợp với điều kiện xác định hằng số Lagrange điều kiện cần để (cid:145) Kết hợp với điều kiện xác định hằng số Lagrange, điều kiện cần để
0)
,(
=uxf
L(x,u) đạt cực trị có ràng buộc là:
x
x
0) 0) = 0) = uxf ,( f ( x ,( uxf u
ux ,( ) ) ( ,( ux ) ,( ,( ) ) ux = = =
T Tλ L ux ,( ( L ) ) λ + T L ,( ux ) λ + u f uxf ,( ,( ) 0) =
H H H u λH λ ⎧ ⎧ ⎪ ⎨ ⎪⎩ ⎩
Tλ+
22 March 2011
© H. T. Hoàng - HCMUT
17
trong đó: H ux ,( ) L ux ,( ) f ux ,( ) =
Thí dụ 1 Tìm cực trị có ràng buộc –– Thí dụ 1 Tìm cực trị có ràng buộc
(cid:145) Tìm cực trị hàm:
2 2 =u 5)(L L u 5)( 1
2 2 2
2
ị hà Tì u 2 2 u 3 3 + + + + uu 2 2 21 u 8 8 1
u 6
02
=
+
=−
u 1
2
(cid:145) Giải:
(cid:145) Hàm Hamilton: Hà H il
Với điều kiện ràng buộc: f u )(
Tλ+
H u )( L u )( f u )( =
2 u 5)( = 1
2 2
2
2
22 March 2011
© H. T. Hoàng - HCMUT
18
u⇒ H u 2 u 3 u 6 )2 + + + + + + − uu 2 21 u 8 1 ( u λ 1
Thí dụ 1 Tìm cực trị có ràng buộc –– Thí dụ 1 Tìm cực trị có ràng buộc
(cid:145) Điều kiện cần để có cực trị: (cid:145) Điều kiện cần để có cực trị:
2
u 2 8 0 = + =++ λ u 10 1
H = 0)(uH u 0)( =
x
H
⇒
u 0)( =
2
u 4 63 0 = + ++ λ = u 2 1
)( H u ∂ u u ∂ ∂ 1 )( H u ∂ u ∂
u = 0)(uf 0)( f u =
⎧ ⎧ ⎪ ⎨ ⎪ ⎩ ⎩
2 2 f u )(
2
u 6 02 = + =− u 1
5353
.0−=λ
8412
.0
.0
(cid:145) Giải hệ phương trình, ta được: (cid:145) Giải hệ h ]T [ * −=u 4735
t ì h t đ
H u 2 u 3 u 6 )2 + + + + + + −
2 u 5)( u = 1
2 2
2
2
22 March 2011
© H. T. Hoàng - HCMUT
19
uu 2 21 u 8 1 u ( λ 1
Thí dụ 1 Tìm cực trị có ràng buộc –– Thí dụ 1 Tìm cực trị có ràng buộc
8412 8412
.0 0
[ [ * =u .0−=u 0
] ]T 4735 4735
250
200
150
100
50
0
L
4
2
-50 6
4
0
2
0
-2
-2
-4
4 -4
u* *
-6 -6
22 March 2011
© H. T. Hoàng - HCMUT
20
u1 1 u2 u
Thí dụ 2 Tìm cực trị có ràng buộc –– Thí dụ 2 Tìm cực trị có ràng buộc
2 2
2 2
(cid:145) Tìm cực trị hàm:
ị hà Tì uxL (L ),( ) ( ( x )2 )2 u ( ( )2 )2 = − + −
u
x
x
6
=
32 +
−
(cid:145) Giải:
(cid:145) Viết lại điều kiện ràng buộc:
Với điều kiện ràng buộc:
u
x
x
6
=
32 +
−
x⇔
x
u
6
0
32 +
=−−
(cid:145) Hàm Hamilton: (cid:145) Hà H ilt
uxH ),(
uxL ),(
uxf ),(
=
Tλ+
2 2
2 2
2 2
⇒
uxH ),(
(
x
)2
u (
)2
x
3
x
u
)
( λ
=
−
+
−
+
+
6 −−
22 March 2011
© H. T. Hoàng - HCMUT
21
ộ g ệ ạ
Thí dụ 2 Tìm cực trị có ràng buộc –– Thí dụ 2 Tìm cực trị có ràng buộc
(cid:145) Điều kiện cần để có cực trị: (cid:145) Điều kiện cần để có cực trị:
(2
3
0
x
x
=
−
2)2 +
λλ +
=
⇒
=
u (2
)2
0
=
−
λ =−
= 0),( uxH x uxH u 0),( uxf
0),(
=
⎧ ⎪ ⎪ ⎨ ⎪ ⎩
),( uxH ∂ x ∂ ),( uxH ∂ u ∂ uxf ( ),( uxf )
x x
3 3
x x
6 6
u u
0 0
=
2 + +
=−−
)22.8;68.1(),04.2;71.1(),92.0;53.4( )228;681()042;711()920;534(
(cid:145) Giải hệ phương trình, ta được ba nghiệm: −
−=ux ) ),( ( =ux
−
2
2
u ),(
)2
)2
u (
(
L x
−
=
+
(cid:145) Thay 3 nghiệm trên vào hàm mục tiêu ,ta
x − được các giá trị tương ứng là: 43.78; 0.087; 117.94. được các giá trị tương ứng là: 43 78; 0 087; 117 94
(cid:145) Kết luận: cực trị cần tìm là
(
)
,
)04.2;71.1(
* * =ux
2
2
2
uxH ),(
(
x
)2
u (
)2
x
3
x
u
)
=
−
+
−
+
+
6 −−
( λ
22 March 2011
© H. T. Hoàng - HCMUT
22
Thí dụ 3 Tìm cực trị có ràng buộc –– Thí dụ 3 Tìm cực trị có ràng buộc
2 2
(cid:145) Tìm cực trị hàm:
ị hà
Tì
L (L
x
u
=
+
2 3 2 x 3 + 1
2 2 2
Với các điều kiện ràng buộc:
x ),( u )
xf u ),( 0 =
2
(cid:145) Giải:
(cid:145) Hàm Hamilton: (cid:145) Hà H ilt
f 1 f x u ),( ),( x u x 4 + − 2 u 2 ++ x 2 1 x 1 ⎡ ⎢ ⎣ ⎤ =⎥ ⎦ ⎡ ⎢ ⎣ ⎤ =⎥ ⎦
T λ+
2 2
H L u ),( ),( u x ),( u x xf =
2 2 x 1
2 2 2
2
22 March 2011
© H. T. Hoàng - HCMUT
23
x⇒ H u ),( 3 x u 2( x )4 ( )2 = + + + + − + u ++ λ 1 x 1 λ 2 x 1
Thí dụ 3 Tìm cực trị có ràng buộc –– Thí dụ 3 Tìm cực trị có ràng buộc
(cid:145) Điều kiện cần để có cực trị: (cid:145) Điều kiện cần để có cực trị:
2
0
=
+
=
x 1
2 λλ + 2
1
6
x
0
=
+
=
2
λ 1
x
H x u ),( ∂ x ∂ 1 u ),( H x ∂ x ∂
H 0),( u x =
H H ∂ ∂
u 2
0
=
+
=
λ 2
⇒ H 0),( u ),( x =
u u u = 0),( xf
⎧ ⎪ ⎨ ⎨ ⎪ ⎩
2 u x ),( ( ) u ∂ ),( ),( x u
2
04
x
=
=−
+
f f 1 1 f
u
02
x ),( u
x 2 2 1 1 =++
=
2
x 1
ợ
.3
5714
1429
.7
1429
* −=u
g (cid:145) Giải hệ phương trình, ta được: .0
, 8514
5714
* =x
[ .5−=λ
]T
ệ p [ .1
]T
2
L L
),( ),( u u x x
=
2
u x
2 3 3 x x + + 2 2 ),( u x
2(
)4
(
+ + =
+
+
+
−
2 x x (cid:145) Do là hàm toàn phương nên cực trị tìm được là hàm toàn phương nên cực trị tìm được (cid:145) Do 1 1 3 )2 H x + + ở trên cũng chính là cực tiểu
λ 2
λ 1
2 2
2
22 March 2011
© H. T. Hoàng - HCMUT
24
u ++ u u 2 x 1 x 1 x 1
TỐI ƯU HÓA ĐỘNG TỐI ƯU HÓA ĐỘNG TỐI ƯU HÓA ĐỘNG TỐI ƯU HÓA ĐỘNG VÀ PHƯƠNG PHÁP BIẾN PHÂN VÀ PHƯƠNG PHÁP BIẾN PHÂN
22 March 2011
© H. T. Hoàng - HCMUT
25
Tối ưu hóa động không ràng buộc Tối ưu hóa động không ràng buộc
(cid:145) Bài toán tối ưu động không ràng buộc: tìm vector hàm x(t) sao cho (cid:145) Bài toán tối ưu động không ràng buộc: tìm vector hàm x(t) sao cho
x )( )( x
J J
L L
t t ), )
dt dt
min min
→ →
xx xx ,( ( &
0
T
n
)( t
x
trong đó:
=
ℜ∈
]
phiếm hàm J(x) đạt cực tiểu: = ∫ ft ∫t )( tx 2
[ )( tx 1
)( n tx
K
n
L :
n ℜ→ℜ×ℜ×ℜ
Chú ý: Phiếm hàm là hàm của hàm l
(functional = function of function) (f )
f f
ti
ti
ti
f
)( xJ
(cid:145) Phiếm hàm có cực tiểu cục bộ tại nếu J
x (( t
* t * (
))
x
J
(
≥
)(* tx )) )(* tx
)(tx
với mọi hàm nằm trong lân cận εcủa
x
t )(
x
* t )(
−
ε≤
22 March 2011
© H. T. Hoàng - HCMUT
26
Tìm cực trị phiếm hàm? Tìm cực trị phiếm hàm?
(cid:145) Nhắc lại cực trị hàm: (cid:145) Nhắ l i
t ị hà
(cid:190) Điều kiện cần: đạo hàm bậc 1 của hàm cần tìm cực trị bằng 0
⇒ điểm dừng ⇒ điểm dừng
(cid:190) Điểm dừng có đạo hàm bậc 2 xác định dương
ự
⇒ điểm cực tiểu
(cid:145) Cực trị phiếm hàm?
(cid:190) Khái niệm biến phân (variation): có thể hiểu là đạo hàm của (cid:190) Khái niệm biến phân (variation): có thể hiểu là “đạo hàm của
phiếm hàm”
(cid:190) Phương pháp biến phân (Calculus of Variation): dựa vào khái
ế
ế
niệm biến phân đưa ra điều kiện cực trị của phiếm hàm tương tự ề như điều kiện cực trị hàm
22 March 2011
© H. T. Hoàng - HCMUT
27
Khái niệm biến phân Khái niệm biến phân
x )(
J
(
x
)
J
x )(
(cid:145) Lượng gia của phiếm hàm: (cid:145) Lượng gia của phiếm hàm: =
J Δ
+
x δ
−
)(tx )(tx
)(txδ )(txδ
trong đó là biến phân của hàm trong đó là biến phân của hàm
)(tx )(tx x t )(
t )(
x δ+
tt
)(tx
Minh họa biến phân của hàm
x )( )( x
x )( )( x
x x
) )
J J
( (
x x
)] )]
(cid:145) Biến phân của phiếm hàm: J J J J δ Δ δ Δ
= =
= =
+ +
x x δ δ
−
lim lim x 0 δ →
J ([ lim ([ J lim x 0 δ →
22 March 2011
© H. T. Hoàng - HCMUT
28
Thí dụ tính biến phân phiếm hàm Thí dụ tính biến phân phiếm hàm
1
(cid:145) Cho phiếm hàm:
ế
xJ )(
2 tx )(
dt
∫= ∫
0
(cid:145) Biến phân của phiếm hàm được tính như sau: (cid:145) Biến phân của phiếm hàm được tính như sau: 1
1
2
2
txJ ([
)]
xJ (
)
xJ )(
(
)
dt
x )(
dt
Δ
=
+
x δ
−
=
x δ x +
−
∫
∫
0
0
1
1
1
2
2
[
x
2
(
2 ])
dt
x )(
dt
2[
(
2 ])
dt
=
+
xx x δδ +
−
=
xx x δδ +
∫
∫
∫
0 0
0 0
0 0
1
⇒
)( xJ
)( xJ
2[
(
2 ])
dt
δ
=
Δ
=
xx x + δδ
lim x 0 → δ
∫→ lim x 0 δ
0 0
1
⇒
)( xJ
2[
δ
dtxx ] δ
∫ ∫=
0
22 March 2011
© H. T. Hoàng - HCMUT
29
Công thức tính biến phân phiếm hàm dạng tích phân Công thức tính biến phân phiếm hàm dạng tích phân
(cid:145) Cho phiếm hàm dạng tích phân tổng quát:
ế
ổ ft
J J
x )( )( x
L L
x )( )( x
dt dt
∫ ∫=
t
0
ạ g (cid:145) Biến phân của phiếm hàm dạng tích phân được tính như sau:
ợ
p
p
p
ft
dt
)( x
J δ
=
∫ ∫
)( L x ∂ ⎡ ⎢ x x ∂ ⎣ ∂ ⎣
⎤ x δ ⎥ ⎦ ⎦
⎧ ⎨ ⎩ ⎩
⎫ ⎬ ⎭ ⎭
t0
22 March 2011
© H. T. Hoàng - HCMUT
30
Biến phân phiếm hàm bài toán tối ưu động không ràng buộc Biến phân phiếm hàm bài toán tối ưu động không ràng buộc
(cid:145) Phiếm hàm:
Phiế
hà
J J
x )( )(
L L
), t )
dt d
xx ,( ( & &
t
∫ ft ∫= f
0
(cid:145) Biến phân phiếm hàm:
p
p
ft
), t
), t
L ∂
L ∂
=
+
J δ
x δ
x δ &
t∫
0
xx ,( & x ∂
⎡ ⎢ ⎣ ⎣
⎤ dt ⎥ ⎦ ⎦
xx ,( & x ∂ &
t
(cid:145) Chú ý rằng:
t )(
)(
t (
)
x δ
x d δττδ
+
0
x &
t
0
= ∫ x ) δ =
x δ
0) =
t ( 0
ft (
), (cid:145) Thực hiện biến đổi tích phân (sử dụng công thức tích phân từng phần),
ụ g
g p
p
p
g
ệ
(
ự suy ra:
ft
), t
), t
L ∂
J J δ δ
= =
−
∫ ∫
Ld ∂ dt
xx ,( & x ∂
⎡ ⎢ ⎢ ⎣
⎤ x dt dt x δ δ ⎥ ⎥ ⎦
t
xx ,( & x ∂ &
0
22 March 2011
© H. T. Hoàng - HCMUT
31
Điều kiện cần để phiếm hàm đạt cực trị cục bộ Điều kiện cần để phiếm hàm đạt cực trị cục bộ
)(* tx )(tx
đạt cực trị cục bộ tại
)( xJ )( xJ
phân của phải bằng 0 tại
(cid:145) Điều kiện cần để phiếm hàm đạt cực trị cục bộ tại là biến (cid:145) Điều kiện cần để phiếm hàm là biến )(* tx )( xJ
Jδ )(
x = 0)(
*
xx= xx
(cid:145) Suy ra, điều kiện cần để bài toán tối ưu động không ràng buộc có
cực trị là: cực trị là:
t ),
t ),
L ∂
L ∂
⇔
0
−
=
−
0=
d dt dt
d dt dt
xx ,( & x x ∂ ∂
L ∂ x x ∂ ∂
L ∂ x x ∂ ∂ &
xx ,( & x x ∂ ∂ &
Phương trình trên được gọi là phương trình Euler-Lagrange.
(cid:145) Trường hợp đặc biệt khi L không phụ thuộc tường minh vào t, dạng (cid:145) Trường hợp đặc biệt khi L không phụ thuộc tường minh vào t dạng
ft
), t
−
J J δ δ
L L
c
−
=
x & &
Ld ∂ dt
⎤ x dt dt x δ δ ⎥ ⎥ ⎦
đơn giản của phương trình Euler-Lagrange là: xx ,( ), t L ∂ ⎡ & ∫ ∫ = = ⎢ ⎢ (c là hằng số) ( ố) là hằ x ∂ ⎣ t
xx ,( & x ∂ &
0
L L ∂ ∂ x ∂ &
22 March 2011
© H. T. Hoàng - HCMUT
32
Thí dụ 1 Tối ưu hóa động không ràng buộc –– Thí dụ 1 Tối ưu hóa động không ràng buộc
(cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: (cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: 2/ π [
2 tx )(
xJ )(
min
dt
)]
→
−
2 tx ( &
= ∫
(,1)0(
x
3)2/ =
0 0 = πx
Với điều kiện biên:
(cid:145) Giải:
2
2
(cid:145) Theo đề bài, ta có:
xL =
x &− (cid:145) Phương trình Euler-Lagrange:
−
⇒
2
x
2
−
0=+ x
( −
) 0 =
x &
x&&⇒
L ∂ x ∂
⎞ 0=⎟ ⎠
L ∂ x ∂ &
d dt (cid:145) Lời giải tổng quát:
⎛ ⎜ ⎝ ổ
d dt sin
)( tx
cos
t
=
Ct +
C 1
2
(cid:145) Thay điều kiện biên, suy ra:
1
=
C 1
= C ,3 2
(cid:145) Kết luận:
t
cos
t
sin3)(* tx =
+
22 March 2011
© H. T. Hoàng - HCMUT
33
Thí dụ 2 Tối ưu hóa động không ràng buộc –– Thí dụ 2 Tối ưu hóa động không ràng buộc
(cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: (cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu:
2
x
0)2(,1)0(
= x
=
xJ )(
1
dt
min
+
→
với điều kiện biên:
2 tx )( &
= ∫
0 0
(cid:145) Giải:
(cid:145) Phương trình Euler-Lagrange:
g
g
g
−
d dt
L ∂ x ∂
⎞ 0=⎟ ⎟ ⎠ ⎠
L ⎛ ∂ ⎜ ⎜ x ⎝ ∂ ⎝ & 1
2
1
+
−
x &&
x &
x &
xx &&&
2
1 1
+ +
x x &
⇒
⇒
0
=
0=x&&⇒
2
2
d d dt
1
+
1
⎞ ⎞ 0⎟ ⎟ 0 =⎟ ⎠
x &
⎛ ⎛ ⎜ ⎜ ⎜ ⎝ (cid:145) Lời giải tổng quát:
x x & + x & g q
g
tx )( )( tx
=
CtC CtC +
1 1
2 2
(cid:145) Thay điều kiện biên, suy ra:
C ,
1
−=
=
C 1
2
1 2
(cid:145) Kết luận: ế
2
)(* tx
t
1
−=
+
L
=
1 x &+
1 1 2
22 March 2011
© H. T. Hoàng - HCMUT
34
Tối ưu hóa động có ràng buộc Tối ưu hóa động có ràng buộc
(cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên (cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên
đoạn [t0, tf] sao cho phiếm hàm J(x) đạt cực tiểu:
J J
x )( )( x
t t ), )
dt dt
min min
L L
→ →
xx xx ,( ( &
0
0),
với điều kiện ràng buộc
= ∫ ft = ∫t =txxf ,( &
n
trong đó: trong đó:
và điều kiện biên: x(t0)=x0, x(tf)=xf
x )(x t t )(
= =
ℜ∈ ℜ∈
[ [ tx tx )( )( 1
tx tx )( )( 2
] ] Ttx n tx )( )(
n
L :
n ℜ→ℜ×ℜ×ℜ
n
p
n ℜ→ℜ×ℜ×ℜ:f
22 March 2011
© H. T. Hoàng - HCMUT
35
K
Hàm Hamilton và điều kiện cần để có cực trị Hàm Hamilton và điều kiện cần để có cực trị
(cid:145) Định nghĩa hàm Hamilton: (cid:145) Định nghĩa hàm Hamilton:
t ),
L
t ),
t ),
H
=
+
λ
T λ
, (
xx, &
xxf ,( &
xx ,( & p p
t ℜ∈)(λ t ℜ∈)(λ
t
0),
)( x
,(
L
J
t ),
dt
=txxf (cid:145) Do ràng buộc nên cực tiểu của &
,( xx &
t
0
t t
cũng chính là cực tiểu của là vector hàm gọi là thừa số Larrange trong đó là vector hàm, gọi là thừa số Larrange trong đó ∫= 1 dt
)( x
t ),
H
J
, ,( λxx &
t
0
), 0),
∫= 1 ( )
ộ g ự ⇒ Biến đổi bài toán tìm cực tiểu J(x) với ràng buộc
,(f ,( =txxf & thành bài toán tìm cực tiểu không ràng buộc phiếm hàm
(cid:145) Điều kiện cần để phiếm hàm có cực trị là:
)( xJ
,
,
), t
), t
H ∂
H ∂
λ
λ
0
−
=
ự p ệ ị )( xJ )(
xx ,( & x ∂
xx ,( & x ∂ &
d dt (Phương trình Euler-Lagrange của bài toán tối ưu động có ràng buộc)
22 March 2011
© H. T. Hoàng - HCMUT
36
Tối ưu hóa động có ràng buộc dạng tích phân Tối ưu hóa động có ràng buộc dạng tích phân
(cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên (cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên
đoạn [t0, tf] sao cho phiếm hàm J(x) đạt cực tiểu:
J J
L L
t t ), )
dt dt
min min
x x )( )(
→ →
xx xx ,( ( &
0
ft
), t
dt
q
=
với điều kiện ràng buộc
xxf ,( &
= ∫ ft ∫t ∫
t0
và điều kiện biên: x(t0)=x0, x(tf)=xf
g (cid:145) Hàm Hamilton và phương trình Euler-Lagrange trong trường hợp ràng g ợp p g g g g
(cid:190) Hàm Hamilton:
buộc tích phân như sau:
H
t ),
L
t ),
t ),
=
+
λ
T λ
, (
xx ,( &
xx, &
xxf ,( &
(cid:190) Phương trình Euler-Lagrange:
,
t ),
,
t ),
λ
λ
H ∂
−
0= 0
Hd ∂ dt
xx ,( & x ∂
xx ,( & x ∂ &
22 March 2011
© H. T. Hoàng - HCMUT
37
Trình tự giải bài toán tối ưu động có ràng buộc Trình tự giải bài toán tối ưu động có ràng buộc
(cid:145) Bước 1: Xác định hàm mục tiêu, điều kiện ràng buộc và điều kiện (cid:145) Bước 1: Xác định hàm mục tiêu điều kiện ràng buộc và điều kiện
ft
J J
biên từ yêu cầu của bài toán tối ưu hóa
x )( )( x
L L
), t t )
dt dt
xx xx ,( ( &
∫= ∫=
ft
0
t),
dt
q
=
0
txxf ,( ),
t =dt
Điều kiện ràng buộc hoặc
xxf ,( &
&
∫
t0
x
=)
x
f
x =t ( 0 ) Điều kiện biên và
0
t ),
t ),
L
,
t ),
λ
=
+
T T λ
( ft x (cid:145) Bước 2: Thành lập hàm Hamilton: xx ,( H &
xx ,( &
xxf ,( &
,
), t
), t
λ
λ
H ∂
H ∂
0
−
=
(cid:145) Bước 3: Viết phương trình Euler-Lagrange: xx xx ,( ,( , & & x x ∂ ∂ &
d dt (cid:145) Bước 4: Tìm nghiệm phương trình Euler-Lagrange thỏa điều kiện (cid:145) Bước 4: Tìm nghiệm phương trình Euler Lagrange thỏa điều kiện
22 March 2011
© H. T. Hoàng - HCMUT
38
ràng buộc và điều kiện biên
Thí dụ 1 Tối ưu hóa động có ràng buộc –– Thí dụ 1 Tối ưu hóa động có ràng buộc
(cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: (cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu:
4
xJ )(
dt
min
→
2 tx )( &
= ∫
0 4
3
dt
tx )(
=
x
∫ 0 0 x 0)4(,0)0(
=
=
với điều kiện ràng buộc:
(cid:145) Giải: (cid:145) Giải:
(cid:145) Hàm Hamilton:
,
t t ), )
txxL L ,( ( ), t )
λ λ
=
+
f txxf ,( ( ), ) t λ λ
xxH H ,( ( &
&
&
⇒
,
t ),
2 tx )(
tx )(
λ
+
λ
xxH ,( &
= &
22 March 2011
© H. T. Hoàng - HCMUT
39
và điều kiện biên:
Thí dụ 1 Tối ưu hóa động có ràng buộc –– Thí dụ 1 Tối ưu hóa động có ràng buộc
(cid:145) Phương trình Euler Lagrange: (cid:145) Phương trình Euler-Lagrange:
,
,
), t
), t
λ
λ
0
−
=
d dt
,( xxH ∂ & x ∂ &
λ⇒ −
} 0 =
{ )(2 tx &
,( xxH ∂ & x ∂ d dt 0)(2
=
tx&&λ⇒ −
(cid:145) Tìm nghiệm phương trình Euler-Lagrange:
)(
=tx&&⇒(1)
tx )(
=
+
c 1
&⇒
2 2
⇒
tx )( )( t
c
=
+
+
tc t 1
2
,
t ),
2 tx )(
tx )(
λ
+
λ
λ λ 2 λ λ t 2 λ t t 4
xxH ,( &
= &
22 March 2011
© H. T. Hoàng - HCMUT
40
(1)
Thí dụ 1 Tối ưu hóa động có ràng buộc –– Thí dụ 1 Tối ưu hóa động có ràng buộc
(cid:145) Xác định các hằng số dựa vào điều kiện ràng buộc và điều kiện biên: (cid:145) Xác định các hằng số dựa vào điều kiện ràng buộc và điều kiện biên:
⇒
0
x
)0(
0.
0.
c
0
=
+
+
=
2 =c
c 1
2
λ 4
x
)4(
0
=
4 λ
+
c 4 1 =
1 =c
4 4
4 4
⇒ ⇒
3
2
)( tx
dt
t
t
3
=
+
+
=
c 8 1
∫
−=λ
c 1 2
16 λ 3
⎤ ⎤ =⎥ ⎦
λ ⎡ ⎡ ⎢ 12 ⎣
0
0
9 8 9 8
2
(cid:145) Kết luận:
t
t
* tx )(
−=
+
9 32
9 8
c
)( tx
=
+
+
tc 1
2
λ 2λ 2 t 4
22 March 2011
© H. T. Hoàng - HCMUT
41
Thí dụ 2 Tối ưu hóa động có ràng buộc –– Thí dụ 2 Tối ưu hóa động có ràng buộc
x x
)( t t )( =
[ [ )( tx tx )( 1=
]Ttx ]tx (cid:145) Tìm vector hàm (cid:145) Tìm vector hàm sao cho phiếm hàm dưới đây sao cho phiếm hàm dưới đây )( )( 2 đạt cực tiểu:
2
2
)1 )1
x x
min min
J x J x )( )(
−
+ +
→ →
[ [ (5 (5
] ] dt dt
x x 1 1
2 2 2
∫ = ∫
0
f
t ),
x
=
+
−
=
x 1
2
x & 1
với điều kiện ràng buộc: 2 0 &xx ,(
;0)0( =
1)2( =
x 1
x 1
(cid:145) Giải: (cid:145) Giải:
(cid:145) Hàm Hamilton:
,
t t ), )
txxL L ,( ( ), t )
λ λ
=
+
f txxf ,( ( ), ) t λ λ
xxH H ,( ( &
&
&
2
⇒
,
t ),
(5[
)1
x
]
2
x
)
λ
=
−
+
+
( λ
+
−
x 1
2 2
x 1
2
xxH ,( &
x & 1
22 March 2011
© H. T. Hoàng - HCMUT
42
và điều kiện biên:
Thí dụ 2 Tối ưu hóa động có ràng buộc –– Thí dụ 2 Tối ưu hóa động có ràng buộc
(cid:145) Phương trình Euler Lagrange: (cid:145) Phương trình Euler-Lagrange:
⇒
2)1
0
+−
λλ &
=−
0
−
=
(10 1 x
0
−
=
⇒
0
=−λx 2 2
(1)
d dt d dt
H ∂ x ∂ 1 1 H ∂ x ∂
2
2
H ∂ x ∂ & 1 1 H ∂ x ∂ &
(cid:145) Tìm nghiệm phương trình Euler-Lagrange thỏa điều kiện ràng buộc:
(2)
ề
⇒
x 2 λ = ⎧ 2 ⎨ 22xλ x 2 &λ ⎩ = = & ⎩ Thay (3) vào (1):
(3) (2)
0
(10
x 1
x 2 =
2 2
(4)
Từ điều kiện ràng buộc, suy ra: ề (5)
=
+
2
x &
2
2
)
+
x − (6)
y ( )
x 1
2
x x 0)2 x 0)2 x + + = && & 1 1 1 1 2 2 x x ] ( λ + + & 1 2
x 4 = − & 2 x 2x x x 2 + + & 1 1 1 1 x x & && 1 1 x (4)2 x (4)2 − 1 1 (5[ x )1 − 10 0 = 1
+ + = +
(10 (10 x 4 && 1
4)1 +− x x ⎧ ⎧ ⎨ ⎩ x x (4)1 x x (4)1 + +− & 1 1 1 1 ,( xxH , t ), λ & x x 4 18 + − & 1 1
22 March 2011
© H. T. Hoàng - HCMUT
43
Thay (5) vào (4): ( ) ⇒
Thí dụ 2 Tối ưu hóa động có ràng buộc –– Thí dụ 2 Tối ưu hóa động có ràng buộc
t
t
679.2
679.1
−
556.0
=
+
+
tx )( 1
eC 1
eC 2
Nghiệm tổng quát của phương trình (6) N hiệ t ì h (6) át ủ hươ tổ
;0)0( =
1)2( =
x 1
x 1
⇒
.0 572 −= .0 0 = 0155 0155
556 .28 28
0 = C C 732 732
.0 0
556 556
1 1
+
=
C ⎧ 1 ⎨ ⎨ 2C C ⎩ ⎩
.02 + C C + 1
2
CC + ⎧ 1 ⎨ ⎨ .0 0047 0047 0 ⎩ ⎩
679.2
t
t
−
Thay điều kiện biên ề
⇒
572.0
e
.0
679.1 e 0155
556.0
−=
+
+
tx )( 1
(7)
x
+
2 2
Thay (7) vào (5):
679.2
t
t
−
2x 1 1
679.1 e 057.0
x = & 1 1 e 388.0)( =
+
+
⇒
tx 2
22 March 2011
© H. T. Hoàng - HCMUT
44
112.1
ĐIỀU KHIỂN TỐI ƯU LIÊN TỤC ĐIỀU KHIỂN TỐI ƯU LIÊN TỤC DÙNG PHƯƠNG PHÁP BIẾN PHÂN DÙNG PHƯƠNG PHÁP BIẾN PHÂN
22 March 2011
© H. T. Hoàng - HCMUT
45
Bài toán điều khiển tối ưu liên tục Bài toán điều khiển tối ưu liên tục
(*)
xf (( t
t )(
))
t (
),
u
=
(cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: (cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: x &
)( t t )(
),...,
T T )] )]
( t ), )( ( t txtx )(
x
2
trong đó: t đó : vector trạng thái thái t t
u
)( t
),...,
T )]
(
( t n tx ( ( m tu
: vector tín hiệu điều khiển
[ [ 1= [ tutu ), ( 1= x
2 x
=
x
x
=) )
)0( )0( (cid:145) Trạng thái đầu: , trạng thái cuối:
0
( ( ft
f
hái đầ hái T
(cid:145) Chỉ tiêu chất lượng:
J
ối ft
x (( t
))
L
x (( t
),
u
( t
),
t
)
dt
u φ )( =
f
∫ ∫+
t0
(cid:145) Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(t) sao cho: ft
J J
x (( t (( x t
)) ))
L L
x )(( t (( ), x t
u u
t )( ( ), t
t t
) )
dt dt
min min
u φ )( u φ )( =
→ →
f
∫ + ∫ +
t
0
(cid:145) Nghiệm x*(t) của phương trình vi phân (*) ứng với tín hiệu điều
22 March 2011
© H. T. Hoàng - HCMUT
46
ố ố ể khiển tối ưu u*(t) gọi là quỹ đạo trạng thái tối ưu.
Phân loại bài toán điều khiển tối ưu Phân loại bài toán điều khiển tối ưu
(cid:145) Khoảng thời gian xảy ra quá trình tối ưu là tf , có thể phân loại: (cid:145) Khoảng thời gian xảy ra quá trình tối ưu là t có thể phân loại:
(cid:142) Bài toán tối ưu có tf cố định, ví dụ:
(cid:131) Điều khiển đoàn tàu hỏa giữa 2 ga với lịch trình xác định sao Điều khiển đoàn tàu hỏa giữa 2 ga với lịch trình xác định sao cho năng lượng đoàn tàu tiêu thụ là thấp nhất;
(cid:131) Điều khiển quá trình chuyển đổi hóa học trong thời gian cho
(cid:142) Bài toán tối ưu có tf không cố định, ví dụ:
(cid:131) Điều khiển tên lửa lên độ cao xác định với thời gian nhanh (cid:131) Điều khiển tên lửa lên độ cao xác định với thời gian nhanh
trước với chi phí thấp nhất hấ ới hi hí hấ ớ
(cid:131) Điều khiển tàu biển đi được xa nhất với một nguồn năng
nhất
22 March 2011
© H. T. Hoàng - HCMUT
47
lượng cố định cho trước
Phân loại bài toán điều khiển tối ưu (tt) Phân loại bài toán điều khiển tối ưu (tt)
(cid:145) Các bài toán điều khiển tối ưu động có trạng thái đầu x0 cho trước. (cid:145) Các bài toán điều khiển tối ưu động có trạng thái đầu x cho trước
(cid:131) Điều khiển tên lửa lên độ cao lớn nhất; (cid:131) Điều khiển tàu biển đi được xa nhất với một nguồn năng
Trạng thái cuối quá trình tối ưu là xf =x(tf), có thể phân loại: (cid:142) Điểm cuối tự do, ví dụ:
(cid:131) Điều khiển tên lửa vào quỹ đạo với thời gian nhanh nhất. (cid:131) Điều khiển tên lửa vào quỹ đạo với thời gian nhanh nhất
lượng cố định cho trước l ớ ố đị h h (cid:142) Điểm cuối bị ràng buộc, ví dụ:
(cid:142) Điểm cuối cố định cho trước, ví dụ: (cid:131) Điều khiển ghép nối các con tàu ể g ép ố các co tàu (cid:131) Điều khiển hệ thống về trạng thái cân bằng
22 March 2011
© H. T. Hoàng - HCMUT
48
ều
Giải bài toán ĐK toán tối ưu dùng PP biến phân Giải bài toán ĐK toán tối ưu dùng PP biến phân
(cid:145) Bài toán điều khiển tối ưu động liên tục có thể phát biểu lại như sau: (cid:145) Bài toán điều khiển tối ưu động liên tục có thể phát biểu lại như sau:
ft
J
u )(
x (( t
))
L
x (( t
),
u
( t
),
t
)
dt
=
φ
f
0 0
t (
),
),
u
t
∫+ )
min t )( u x t )( &
x
x
0
xf (( t = với điều kiện =t 0 ) ( trong đó t0, tf, và cho trước
(cid:145) Kết hợp đ.kiện ràng buộc vào hàm mục tiêu dùng thừa số Lagrange:
ft
J J
u )( )( u
x (( (( t t x
)) ))
L L
x )(( (( ), t t x
u u
( t ), )( t
t t
) )
xf xf (( )(( ), t t
u u
( t t (
)) ))
)( t t )(
= =
φ φ
+ +
+ +
T λ λ
− −
[ [ )( t t )(
] ] dt dt
f
x x &
∫ ∫
0
(cid:145) Định nghĩa hàm Hamilton:
tH )(
t ),
t )(
t ),
ux ,(
uxf ,(
=
T λ+
L ft t
T
J
u )(
x (( t
))
[
)( tH
dt
=
φ
+
−
⇒
f
t x ])( &λ
∫
0
Jδ
0)( u =
⇒ Cần tìm u*(t) sao cho:
*
uu =
22 March 2011
© H. T. Hoàng - HCMUT
49
Điều kiện cần để có lời giải bài toán điều khiển tối ưu Điều kiện cần để có lời giải bài toán điều khiển tối ưu
(cid:145) Biến phân của phiếm hàm mục tiêu: (cid:145) Biến phân của phiếm hàm mục tiêu:
ft
)( t
dt
=
−
+
+
+
J δ
T λ
T & λ
u δ
+
]
[ T x λ δ
t
=
t
0
∫
∂ φ x ∂
H ∂ x ∂
H ∂ u ∂
⎡ ⎛ ⎜ ⎢ ⎝ ⎝ ⎣ ⎣
⎡ ⎛ ⎜ ⎢ ⎝ ⎝ ⎣ ⎣
t t
t t
0
t t = f =
⎤ ⎥ ⎦ ⎦ (cid:145) Chú ý là do điều kiện đầu cố định; nếu điểm
0)(
=uJδ
ể ầ
⎤ ⎞ ⎞ x x δ δ ⎟ ⎟ ⎥ ⎠ ⎠ ⎠ ⎠ ⎦ ⎦ =ftxδ ( 0) ( 0 =txδ 0) ≠ftxδ ) 0 ( cuối ràng buộc, nếu điểm cuối tự do (cid:145) Để với mọi cần có các điều kiện: uδ
)
t ( φ ∂
f
tT )(λ&
−=
0=
) )
T λ
=
( f ( t f
∂H ∂u ∂
ề H ∂ x∂ ∂
x∂ ∂
(cid:145) Lưu ý:
)
t ( φ ∂
f
(cid:190) Điều kiện chỉ cần đối với bài toán điểm cuối tự do.
) )
=
T ( ftλ t ( λ f
ự ệ
x∂
)(tλ
(cid:190)
ft
)) ))
[ [
được gọi là đồng trạng thái của hệ thống
t x (( ((
J J
+
=
−
φ φ
f
T T t dt d x ])( ])( λ &λ
t)(λ&
−=
(cid:190)
∫ ∫
tH H u )( )( )( )( được gọi là phương trình đồng trạng thái
0
H ∂H ∂ x∂
22 March 2011
© H. T. Hoàng - HCMUT
50
Trình tự giải bài toán điều khiển tối ưu Trình tự giải bài toán điều khiển tối ưu
u u
) )
t t )( )(
t t xf xf )(( (( ),
t t )( ( ),
t t
=
(cid:145) Bước 1: Viết PTTT mô tả đối tượng: (cid:145) Bước 1: Viết PTTT mô tả đối tượng:
x x&
(cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên từ yêu cầu thiết kế
(cid:190) Bài toán điểm cuối tự do: ể
ft
J
ố
u )(
x (( t
))
L
x (( t
),
u
( t
),
t
)
dt
=
φ
f f
∫ ∫+
min )(u u )( t t
0
x
x
=t 0 ) (
0
(cid:190) Bài toán điểm cuối ràng buộc:
Điều kiện đầu:
ft
ố ể
u )( )( u
u u
) )
J J
L L
t t x )(( (( ), x
t t ( ), )(
t t
dt dt
∫= ∫=
min min u )( t
0
x
x
x
x
=)
=t 0 ) (
0
( ft
f
22 March 2011
© H. T. Hoàng - HCMUT
51
Điều kiện đầu và điều kiện cuối
Trình tự giải bài toán điều khiển tối ưu Trình tự giải bài toán điều khiển tối ưu
tH )( )( tH
L L
ux ux ,( (
t t ), )
t )( )( t
uxf uxf ,( (
t t ), )
=
T λ+ λ+
(cid:145) Bước 3: Thành lập hàm Hamilton: (cid:145) Bước 3: Thành lập hàm Hamilton:
(cid:145) Bước 4: Viết điều kiện cần để có lời giải tối ưu:
t )( )( t
PT trạng thái: PT trạng thái:
xf xf t )(( (( ), t
u u
t )( ( ), t
t t
) )
= =
x x &
−=
tT )(λ&
PT đồng trạng thái:
H ∂ x∂ x∂
0=
Điều kiện dừng:
Điều kiện đầu:
x
H ∂ u ∂ =t 0 ) x (
0
x
x
=)
ft ( f
f f
)
t ( φ ∂
f
(Bài toán điểm cuối cố định) ệ Điều kiện cuối:
t (
)
=
T λ
f
hoặc (Bài toán điểm cuối tự do)
x∂
(cid:145) Bước 5: Giải hệ phương trình ở trên sẽ tìm được u*(t) và x*(t)
22 March 2011
© H. T. Hoàng - HCMUT
52
Thí dụ 1 Điều khiển tối ưu –– Thí dụ 1 Điều khiển tối ưu
ty )((2
tu )(
y
(cid:145) Đặc tính động học nhiệt độ lò sấy cho bởi phương trình: (cid:145) Đặc tính động học nhiệt độ lò sấy cho bởi phương trình: −=
−
) a +
ty )( &
0
trong đó y(t) là nhiệt độ phòng và ya = 250C là nhiệt độ môi trường; 25 C là nhiệt độ môi trường; trong đó y(t) là nhiệt độ phòng và ya u(t) là cường độ dòng nhiệt cấp lò sấy và t là thời gian (giờ)
(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) điều khiển nhiệt độ nhiệt độ lò sấy sao cho sau một giờ đạt đến càng gần nhiệt độ đặt yd = 750C ấ ầ càng tốt và tối thiểu năng lượng tiêu tốn.
(cid:145) Giải: (cid:145) Giải:
(cid:145) Bước 1: Thành lập phương trình trạng thái:
tx tx )( )(
ty ty )( )(
=
−
ế
ay y
tx )(2
tu )(
−=
+
⇒ Phương trình trạng thái của lò sấy là:
tx )( &
x
x
)1( )1(
y
)1( )1(
y
y
y
50 0
=
=
−
=
−
=
Đặt biến trạng thái: Đặt biến trạng thái:
⇒ Trạng thái cuối mong muốn: ố
f
a
d
a
22 March 2011
© H. T. Hoàng - HCMUT
53
ố
Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu
(cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên: (cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên:
ft
2
x
2 tu )(
dt
min
tx ([
)
]
uJ )(
=
−
+
→
ρ
f
f
∫
1 2
1 2
0
Theo yêu cầu thiết kế là trạng thái cuối x(tf ) càng gần xf =50 càng tốt, đồng thời tối thiểu năng lượng tiêu tốn, suy ra hàm mục tiêu:
;0
1
(Đây là bài toán tối ưu điểm cuối tự do) ố ố ể
=
=
ft
Điều kiện đầu:
H
trong đó ρlà trọng số tùy chọn (muốn trạng thái cuối càng gần xf thì chọn ρcàng lớn) chọn ρcàng lớn) x 0 (cid:145) Bước 3: Định nghĩa hàm Hamilton: (cid:145) Bước 3: Định nghĩa hàm Hamilton:
ux ,( ,
t ),
t ),
t )(
f
ux ,(
t ),
λ
=
+
λ
⇒
H
t ),
tx )(2)[
tu (
)]
=
+
−
+
λux ,( ,
t ( λ
L ux ,( 1 1 2 2 tu )( 2
22 March 2011
© H. T. Hoàng - HCMUT
54
Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu
(cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu (cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu
tx )(2
tu )(
−=
+
tx )( &
PT trạng thái: (1)
−=)(λ& t
⇒
)( t & λ =
)(2 t λ
H H∂ ∂ x ∂
(2) PT đồng trạng thái:
t 0)( 0)( =
)( λ tu )( λ +
⇒
0=
H ∂H ∂ u ∂
tx tx ( (
) )
0 0
=
Điều kiện dừng: Điề kiệ dừ (3)
= x x 0
0
)
( t φ ∂
f
(4) (4) Điều kiện đầu: Điề kiệ đầ
)(( )1((
) )50
)( ρ )1( xρλ =
−
⇒
) )
( ( t λ
=
f f
x ∂
H
t ),
tx )(2)[
tu (
)]
=
+
−
+
λux ,( ,
( t λ
1 1 2 2 tu )( 2
22 March 2011
© H. T. Hoàng - HCMUT
55
Điều kiện cuối: ( ) (5)
Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu
(cid:145) Bước 5: Giải phương trình vi phân (cid:145) Bước 5: Giải phương trình vi phân
(cid:190) Nghiệm phương trình (2):
)( =λ )(λ t
teC tC 2 2 1
(cid:190) Thay (6) vào (3):
)( tu
−=
(6) (6)
2 teC 1
(cid:190) Thay (7) vào (1), ta được: (cid:190) Thay (7) vào (1) ta được:
(7)
)(2
−=
teCtx 2 −
1
tx )( &
2
t
2
t
−
⇒
e
tx )(
−=
+
eC 2
C C 1 4
tu )(
(8)
tu t )( 0)( λ + = tx tx )( )(2 −= + )( )(2 t t & λ = λ &
22 March 2011
© H. T. Hoàng - HCMUT
56
(1) (3) (2)
Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu
(cid:190) Xác định các hằng số dựa vào điều kiện biên: (cid:190) Xác định các hằng số dựa vào điều kiện biên:
)1( )1(
50 50
− −
0)0( = ( ( xρ )1( )1( x = = ρ
) )
x ⎧ ⎨ λ λ ⎩ ⎩
0
−
=
2
C 1 C + 4 4
⇒
2
2
−
50
=
−
−
2 eCe + 2
C 1 4
⎞ ⎟ ⎠
⎛ ρ ⎜ ⎝
⎧ ⎪⎪ ⎪ ⎨ ⎨ ⎪ eC 1 ⎪ ⎩
=
2
2
−
e
e
4/)
−
+
⇒ ⇒
=
2
2
2
−
e
e
4/)
50 ρ 2 ( e ρ +− 5.12 ρ 2 ( e ρ +−
−
+
⎧ C ⎪⎪ 1 ⎨ ⎨ ⎪ C ⎪ ⎩
22 March 2011
© H. T. Hoàng - HCMUT
57
Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu
(cid:190) Kết luận: Tín hiệu điều khiển và quỹ đạo trạng thái tối ưu là:
)( tu
−=
2 teC 1
2
t
2
t
−
e
tx )(
−=
+
eC 2
C 1 4
22 March 2011
© H. T. Hoàng - HCMUT
58
ố ế ề ể
Thí dụ 2 Điều khiển tối ưu –– Thí dụ 2 Điều khiển tối ưu
(cid:145) Cho hệ thống xe – lò xo như hình (cid:145) Cho hệ thống xe lò xo như hình vẽ. Quan hệ vào ra của hệ thống mô tả bởi phương trình vi phân:
tky )(
tu )(
+
=
tym )( &&
( )
g ( ị ệ ệ ); y( )
(cid:145) Bài toán đặt ra là thiết kế luật điều khiển u(t) để điều khiển xe từ
trong đó u(t) là tín hiệu vào (lực điều khiển); y(t) là tín hiệu ra (vị trí ( ự xe); m = 1kg là khối lượng xe, k = 2 N/cm là độ cứng lò xo.
ê hái đứ hái đứ i ố ê i ị
(cid:145) Yêu cầu:
trạng thái đứng yên tại gốc tọa độ đến trạng thái đứng yên tại vị trí í độ đế cách gốc tọa độ 10cm trong khoảng thời gian 1 giây, đồng thời tối thiểu năng lượng tiêu tốn. g g
(cid:190) Hãy thành lập bài toán tối ưu cho yêu cầu thiết kế trên. (cid:190) Viết điều kiện cần để có lời giải tối ưu
22 March 2011
© H. T. Hoàng - HCMUT
59
y ập y
Thí dụ 2 Điều khiển tối ưu –– Thí dụ 2 Điều khiển tối ưu
(cid:145) Giải: (cid:145) Giải
(cid:145) Bước 1: Viết phương trình trạng thái của đối tượng
txty )( ( ), )( )(
=
(cid:190) Đặt các biến trạng thái ế
tx )( )( 1
2
ty )( )( &= &
(cid:190) Phương trình trạng thái mô tả đối tượng
tu )(
0 1 02
−
⎡ ⎡ ⎢ ⎣
⎤ ⎤ =⎥ ⎦
⎡⎤ ⎡ ⎤ ⎢ ⎥ ⎦ ⎣
0 ⎡ ⎤⎡ ⎤ ⎢ ⎥ 1 ⎣ ⎦ { B
A
t )(
t )(
x
)( )( tx tx ⎡ ⎡ ⎤ ⎤ & 1 1 +⎥ ⎢ )( )( tx tx & ⎦ ⎣ 2 2 32143421321 x&
t )(
t )(
tu )(
Ax
B
=
+
x &
22 March 2011
© H. T. Hoàng - HCMUT
60
Thí dụ 2 Điều khiển tối ưu –– Thí dụ 2 Điều khiển tối ưu
(cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên: (cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên:
(cid:190) Yêu cầu thiết kế là trạng thái xe tại thời điểm tf = 1 đứng yên tại vị trí 10cm (điểm cuối ràng buộc) đồng thời tối thiểu năng lượng tiêu ốtốn,
1
2 tu )(
dt
min
uJ )(
→
suy ra hàm mục tiêu:
1 ∫ = ∫ 2 0 2
)0( )0(
)0( )0(
)0( )0(
,0 0
y y
x x
(cid:190) Từ dữ kiện của đề bài, có thể xác định được điều kiện biên: = =
0)0( 0)0( = =
= =
= =
(Bài toán tối ưu điểm cuối ràng buộc) điểm cuối ràng buộc)
Điều kiện đầu: Điều kiện đầu:
)1(
y
)1(
,10
)1(
2 x
=
=
=
2
x x 1 x 1
y y & y 0)1( = &
(cid:145) Bước 3: Thành lập hàm Hamilton: (cid:145) Bước 3: Thành lập hàm Hamilton:
H
Điều kiện cuối:
,( , ux
t ),
t )(
,( uxf
t ),
), t =λ
T λ+
⇒
H
ux ,( ,
t ),
Ax
t )(
B
λ
=
+
T T λ
+
[ [ t )(
])( ] tu
,( L ux 1 1 2 2 tu )( 2
22 March 2011
© H. T. Hoàng - HCMUT
61
Thí dụ 2 (tt) Điều khiển tối ưu –– Thí dụ 2 (tt) Điều khiển tối ưu
(cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu (cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu
t )(
Ax
t )(
B
tu )(
=
+
PT trạng thái: (1)
x &
⇒
t )(
t )(
& λ
(2) (2) PT đồng trạng thái: ồ
A−=
λ
t)(λ&
−=
H ∂H ∂ x∂
tu )( )(
+
TλB TλB
t 0)( 0)( =
⇒
0= 0
∂H ∂ u ∂
Điều kiện dừng: Điề kiệ dừ (3) (3)
(4)
x
)0( =
Điều kiện đầu: Điề kiệ đầ ]T0;0 [
ề
(5)
x
)1( =
H
Điều kiện cuối: ố ]T0;10 [
ux ,( ,
t ),
Ax
t )(
B
λ
=
+
T T λ
+
[ [ t )(
])( ] tu
1 1 2 2 tu )( 2
22 March 2011
© H. T. Hoàng - HCMUT
62
Thí dụ 2 (tt) Điều khiển tối ưu –– Thí dụ 2 (tt) Điều khiển tối ưu
(cid:145) Bước 5: Giải phương trình vi phân (cid:145) Bước 5: Giải phương trình vi phân
A
t
(cid:190) Nghiệm phương trình (2): ( ( t −
−
A A
−
t )1( )1( t −
f f
t )( )( t
e
) )
e
)1( )1(
λ λ
=
) ) t ( ( t λ λ
=
λ λ
f
(cid:190) Nghiệm phương trình (3): T
(6) (6)
tu )(
t )(
TλB−=
−
tu )(
T e
(7)
B
)1(
−=
(cid:190) Thay (6) vào (7): (6) à (7) (cid:190) Th A t )1( λ−
(cid:190) Thay (8) vào (1), ta được:
(8)
A
−
t )(
(9)
Ax
t )(
BB
T e
)1(
=
−
t )1( λ−
x&
22 March 2011
© H. T. Hoàng - HCMUT
63
…..
PHƯƠNG PHÁP QUI HOẠCH ĐỘNG PHƯƠNG PHÁP QUI HOẠCH ĐỘNG PHƯƠNG PHÁP QUI HOẠCH ĐỘNG PHƯƠNG PHÁP QUI HOẠCH ĐỘNG
22 March 2011
© H. T. Hoàng - HCMUT
64
Nguyên lý tối ưu Bellman Nguyên lý tối ưu Bellman
(cid:145) Phương pháp qui hoạch động (DP – Dynamic Programing) do (cid:145) Phương pháp qui hoạch động (DP Dynamic Programing) do
(cid:145) Phương pháp qui hoạch động là một thuật toán xác định dãy giá trị
Bellman đề xuất (1957) g p p q y g g
(cid:145) Nguyên lý tối ưu: Mỗi đoạn cuối của quỹ đạo trạng thái tối ưu cũng
là một quỹ đạo trạng thái tối ưu. là một quỹ đạo trạng thái tối ưu
x2
Đoạn 2
{u(k)} tối ưu để tối thiểu chỉ tiêu chất lượng J.
xN
Đoạn 3
Đoạn 1
xk
x0
x1
Minh họa nguyên lý tối ưu Bellman
22 March 2011
© H. T. Hoàng - HCMUT
65
Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP
(cid:145) Tìm đường ngắn nhất đi từ A đến J, cho biết mạng lưới đường như (cid:145) Tìm đường ngắn nhất đi từ A đến J cho biết mạng lưới đường như
(cid:145) Nguyên lý tối ưu Bellman: tìm đường ngắn nhất ngược từ nút đích (cid:145) Nguyên lý tối ưu Bellman: tìm đường ngắn nhất ngược từ nút đích
hình vẽ.
22 March 2011
© H. T. Hoàng - HCMUT
66
đến nút đầu.
Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP
(cid:145) Phân bài toán tìm đường thành các bước từ 1 đến 5 (cid:145) Phân bài toán tìm đường thành các bước từ 1 đến 5 (cid:145) Ký hiệu Nki là nút thứ i ở bước k
N31 N
N21 N
N41
N11
N32
N51
N22
N42
N33
N23
22 March 2011
© H. T. Hoàng - HCMUT
67
Bước 1 Bước 2 Bước 3 Bước 4 Bước 5
Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP
(cid:142)
kiN
(cid:142)
ki , ,
) )
là khoảng cách ngắn nhất từ nút đến nút đích J
j j
kN 1+ là khoảng cách từ nút đến nút ,1+ k
(cid:145) Ký hiệu: (cid:145) Ký hiệu: (* k NJ ) ( ( ki NNd ki
k k
,1 j 1 j
+ +
(cid:145) Phương trình Bellman:
(
,
)
J
(
N
)
+
=
})
kiN ki { NNd ki
k
,1
j
k
,1
j
* NJ ( k
ki
* 1 k +
+
+
min j
(cid:145) Dễ thấy chính là đường đi ngắn nhất
g
)
* 1 NJ ( 11
22 March 2011
© H. T. Hoàng - HCMUT
68
ấ ễ ấ ắ
Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP
(cid:145) Giải PT Bellman qua 2 vòng:
(cid:190) Vòng ngược: đi ngược từ nút cuối về nút đầu tìm đoạn đường cuối (cid:190) Vò ối
ối ề út đầ tì từ út đ ờ đi đ
(cid:190) Vòng xuôi: đi từ nút đầu đến nút cuối → đường đi tối ưu
22 March 2011
© H. T. Hoàng - HCMUT
69
ngắn nhất
Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP
(cid:145) Vòng ngược:
0)
(
(cid:190) Bước 5: bắt đầu từ nút đích
=NJ 51
(cid:190) Bước 4: từ nút
* 5 42N
41N
)
)
(
,
3) =
+
=
51
41
51
4
(
)
)
)
,
+
=
=
ắ
NNd 41 NNd 42
* NJ ( 4 * * NJ ( 4
51
51
42
22 March 2011
© H. T. Hoàng - HCMUT
70
hoặc chỉ đơn giản đi đến nút đích vì không có lựa chọn nào khác. Đoạn đường ngắn nhất từ một nút ở bước 4 là: ấ * NJ ( 5 * * NJ ( 5
Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)
(cid:190) Bước 3: có nhiều lựa (cid:190) Bước 3: có nhiề lựa chọn, từ nút N3i phải chọn đường đi đến đích qua nút N4j nào tối ưu đoạn quỹ đạo * ?) cuối ? cuối iNJ iNJ ( ( ) 3 3 3 3
)
(
,
)
=
+
})
* NJ ( 3
3
i
{ NNd 3 i
* NJ ( 4
4
j
4
j
min j j
)
(
)
+
4
j
j
Từ
)
* iNJ ( 3 3
NNd , 3 i 41N 41 4
* ( NJ 4 4 42N 42 8
Quyết định đi đến
4
9 7 7
N41 (H) N42 (I) 42 N41 (H)
31N 32N 33N
22 March 2011
© H. T. Hoàng - HCMUT
71
6 7 6
Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)
32
(cid:190) Bước 2: tìm đưởng tối (cid:190) Bước 2: tìm đưởng tối ưu từ nút N2i đến nút đích N51 (tức nút J), sử dụng kết quả tối ưu đoạn cuối tìm được ở bước 3
* ) 4 =NJ ( 3 31 * * ( 7) NJ = 3 * NJ 6) ( = 3
33
)
(
,
)
=
+
})
* NJ ( 2
2
{ NNd 2 i
* NJ ( 3
3
j
3
j
i
min j
,
+
* NJ ( 3
Từ
)
* iNJ ( 2 2
ố ế
( NNd 2 i 31N 31 11
) 3 j 32N 32 11
) 3 j 33N 33 12
Quyết định đi đến
31N
32N
11
7 9 10 7
hoặc 31N 31 hoặc
32N
21N 22N 22 23N
31N
22 March 2011
© H. T. Hoàng - HCMUT
72
8 8 11 8
Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)
(cid:190) Bước 1: tìm đường tối (cid:190) Bước 1: tìm đường tối
21
22
) 11 = 7) 7) = = 8) =
* NJ ( 2 * NJ ( ( NJ 2 * ( NJ 2
23
ố
)
(
,
)
=
+
})
* NJ ( 1
11
{ NNd 11
* NJ ( 2
2
j
2
j
min j j
,
+
* NJ ( 2
Từ
)
* 1 NJ (
11
ưu từ nút N11 (tức nút A) đến nút đích N51 (tức nút J), sử dụng kết quả tối ế ưu đoạn cuối tìm được ở bước 2 bước 2
( NNd 11 21N 21 13
) 2 j 22N 22 11
) 2 j 23N 23 10
Quyết định đi đến
23N
11N
22 March 2011
© H. T. Hoàng - HCMUT
73
10
Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)
(cid:145) Vòng xuôi: đi từ bước 1 đến bước 5 đế rút ra đường đi tối ưu
,
+
)
11
7
(cid:145) Kết luận: * * ) NNd ( NJ ( , NNd ) ( NJ ) ) , ( + + Từ Từ j j 3 4 4 4 3 3 j 2 i 3 j i * * iNJ ) iNJ ( ( N N N N N →→→→ Đường đi tối ưu: tức A→D→E→H→J 3 2 2 3 31N 33N 32N 42N 41N 51 31 11 23 41 33 32 31 42 41 hoặc: tức A→D→F→I→J * N N N N N →→→→ ) ) ( NNd NJ ( 11 23 32 42 51 4 8 4 11 12 11 11 2 j j 11 2 2 * 1 NJ ( 23N 21N 22N 7 9 7 10 9 7 10 10 11 13 8 11 8 8
32N
31N 21N Từ 32N 22N 22 11N 23N 33N
22 March 2011
© H. T. Hoàng - HCMUT
74
6 7 6 Quyết định Quyết định ) đi đến đi đến Quyết định 31N N41 (H) 32N hoặc đi đến N42 (I) 31N 42 31 23N N41 (H) 31N hoặc
Bài toán điều khiển tối ưu động rời rạc Bài toán điều khiển tối ưu động rời rạc
))
(
k
(
(*)
x
(cid:145) Cho đối tượng mô tả bởi phương trình sai phân: (cid:145) Cho đối tượng mô tả bởi phương trình sai phân: k x ( )1 =+ kxkx ), ( ),...,
k )(
trong đó:
k u ), T )] : vector trạng thái
2
),...,
)( k
g
u
xf (( n kx ( ( m ku
[ 1= [ kuku ( ), ( 1= 2 x x )0( = (cid:145) Trạng thái đầu: , trạng thái cuối:
T )] : vector tín hiệu điều khiển x
N
x
(
=)
0
N N
(cid:145) Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(k) sao cho: 1 −N
J J
( (
,
) )
L L
x )(( k (( ), x k
u u
( (
k k
)) ))
min min
= =
xφ xφ N N
+ +
→ →
N
∑ ∑
0
=k
(
( , 0 ) ≠NN xφ , 0) =NN xφ
)(* kx )(kx
)(* ku )(ku
Chú ý: Bài toán tối ưu điểm cuối tự do
phụ thuộc
© H. T. Hoàng - HCMUT
75
Bài toán tối ưu điểm cuối cố định (cid:145) Ý tưởng giải bài toán điều khiển tối ưu rời rạc dùng nguyên lý tối ưu Bellman: tìm kiếm nghiệm Bellman: tìm kiếm nghiệm phụ thuộc theo chiều ngược theo chiều ngược hướng quỹ đạo từ điểm cuối xN đến điểm đầu x0 22 March 2011
PP qui hoạch động giải bài toán ĐK tối ưu rời rạc PP qui hoạch động giải bài toán ĐK tối ưu rời rạc
(cid:145) Đặt hàm mục tiêu tối ưu cho đoạn quỹ đạo t.thái cuối kể từ điểm x(k) (cid:145) Đặt hàm mục tiêu tối ưu cho đoạn quỹ đạo t thái cuối kể từ điểm x(k)
N
1 −
J
x ((
k
))
N
,
x
(
N
)
L
x ),(( i
u
i ))(
k
,0
N
)1
=
+
=
−
* k
∑
(
k
min N ),..., ( u
u
)1 −
ki =
⎧ ( φ ⎨ ⎩ ⎩
⎫ , ( ⎬ ⎭ ⎭
))
k
((* J k x (cid:145) Biểu diễn dưới dạng:
N
−1
J J
x (( (( x
k k
)) ))
L L
x k (( ), )(( x k
u ( ( u
k k
)) ))
N N
,
x x
( (
N N
) )
x i ),(( )(( x i
u u
i ))( ))( i
= =
+ +
( ( φ φ
+ +
* k
∑ ∑
min min N ),..., ( u
( u
k
)1 −
L L ki 1 +=
⎧ ⎨ ⎨ ⎩
⎫ ⎬ ⎬ ⎭
k
))
x ((
k
),
u
(
k
))
J
x ((
k
=
+
+
} }))1
* x⇒ J (( k
* 1 k +
{ { L min )(ku )( k
⇒
J
x ((
k
))
x ((
k
),
u
(
k
))
(
f
x ((
k
),
u
(
k
=
})))
* k
* J ++ 1 k
(PT Bellman)
{ L min )( k u
N
N
x
)
(
,
( φ=
min
=
{ }J
((* x J N
))0((* N )) (cid:145) Dễ thấy: và x J 0
(cid:145) Giải N phương trình Bellman theo thứ tự sẽ tìm được (cid:145) Giải N phương trình Bellman theo thứ tự sẽ tìm được
0 0
1 →Nk = Nk 1 →−
22 March 2011
© H. T. Hoàng - HCMUT
76
tín hiệu điều khiển tối ưu.
Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP
(cid:145) Đối tượng: (cid:145) Đối tượng:
( (
k k
x x
xf xf k )(( (( ), k
)) ))
u u
k k
( (
N
),
1
−
x
( (Nx
) )
=
,...,1,0 = ạ g
0 0
ạ g g
)1 )1 =+ =+ (* kku (cid:145) Yêu cầu thiết kế: Tìm tín hiệu điều khiển hệ )( )0( x thống từ trạng thái đầu đến trạng thái cuối sao cho tối thiểu chỉ tiêu chất lượng:
−N 1
J
, ,
) )
L
(( (( x
k
), ),
u
( (
k
)) ))
min
=
( ( xφ N φ
+
→
N N
∑ ∑
0
=k
(cid:145) Bước 1: Viết phương trình Bellman:
J J
x (( ((
k k
)) ))
x )(( k (( ), k
u
( (
k k
)) ))
( (
f f
x )(( k (( ), k
u
( (
k k
=
}))) })))
* k
* J J ++ + 1 k
{ { L L min i k )( u
J
N
))
N
,
Với
x
)
( φ=
(
k
,...,1,0
N
)1
=
−
((* x N
N
(cid:145) Bước 2: Giải phương trình Bellman qua 2 vòng:
)(kx
)(* ku
)(* ku
= Nk k 0
(cid:190) Vòng ngược: tìm phụ thuộc 1 →− 0 0x (cid:190) Vòng thuận: tính cụ thể từ điều kiện đầu N 1 −→=
22 March 2011
© H. T. Hoàng - HCMUT
77
Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt)
(cid:137) Vòng ngược: tìm phụ thuộc x(k) (k=N−1→ 0), gồm các bước: (cid:137) Vòng ngược: tì
(k) (k N 1→ 0)
)(* k )(ku
)1
)1
h th ộ á bướ ồ
x ((
x ((
))1
))1
),1
N
N
N
N
N
u
x
J
(
(
,
( φ+
−
=
−
−
( −Nx (cid:145) Tìm phụ thuộc là nghiệm bài toán tối ưu: { { L
})) }
(* −Nu * N
1 −
f
),1
u
(
N
))1
x
(
N
)
min )1 u N ( − x (( N
−
−
=
)(kx
(cid:145) Với :tìm phụ thuộc là nghiệm PT Bellman:
0
2 →−
= Nk
J J
với ràng buộc
x (( ((
k k
)) ))
x )(( k (( ), k
u
( (
k k
)) ))
( (
f f
x )(( k (( ), k
u
( (
k k
=
}))) })))
* k
* J J ++ + k 1
)(* ku { { L L min i k u )(
(.)
* 1+kJ
với là biểu thức hàm mục tiêu tối ưu tối ưu đoạn quỹ đạo
0 0
= =
)(* ku )(ku
(cid:153) Chú ý: để tìm , áp dụng PP tối ưu tĩnh, giải PT: (cid:153) Chú ý: để tìm áp dụng PP tối ưu tĩnh giải PT:
∂J k (.) ∂ ku )(
22 March 2011
© H. T. Hoàng - HCMUT
78
cuối đã tìm được ở bước trước đó.
Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt)
(cid:137) Vòng xuôi: xác định giá trị cụ thể . Thực hiện các bước sau đây (cid:137) Vòng xuôi: xác định giá trị cụ thể Thực hiện các bước sau đây
)(* ku )(kku
)(* ku
)(* ku
(cid:190) Thay vào mô hình toán của đối tượng để tính được trạng
với k=0,1,2,….N−1: )(kx (cid:190) Gán vào công thức đã tính ở vòng ngược để được giá trị cụ thể của )(* ku
x
x ((
k
),
u
* k (
))
22 March 2011
© H. T. Hoàng - HCMUT
79
thái tối ưu ở thời điểm (k+1) (k+1) thái tối ư ở thời điể )1 k f ( =+
Thí dụ 1 Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 Điều khiển tối ưu rời rạc dùng DP
(cid:145) Xét đối tượng là khâu quán tính bậc 1 có mô hình trạng thái: (cid:145) Xét đối tượng là khâu quán tính bậc 1 có mô hình trạng thái:
kx (
kx )(
ku )(
)1 =+
+
1 2
1 2 ố
(cid:145) Xác định tín hiệu điều khiển tối ưu để điều khiển hệ thống từ trạng
3
2 kx )( )( k
2 2 ku ( ( k
min i
)) ))
J J
→
+
ố ề ề ể ể
= ∑
0
=k
(cid:145) Giải:
(cid:145) Phương trình Bellman:
J
ể thái đầu x(0)=4 đến trạng thái cuối x(4)=0 sao cho: 2∑ ( (
x ((
k
))
k
),
u
(
k
))
(
f
x ((
k
),
u (
k
x ((
=
})))
* k
* J ++ k 1
⇒
J
kx ((
))
2 ku )(
J
ku (5.0)(5.0(
kx
=
+
+
+
(
)3
→=k 0
}))
* k
* k 1 +
{ L min u k )( { 2 kx min )( ku )(
J
0
=
* ))4((* x 4
22 March 2011
© H. T. Hoàng - HCMUT
80
với:
Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP
(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:
Vòng ngược: Với k = 3: Vòng ngược: Với k = 3: Phương trình Bellman:
2
2
J J
x ))3(( ))3(( x
)3( )3(
u u
=
+ +
0 0
=
})3( })3(
* 3
))4((*J (do ) (do ) J x ))4((4
{ { x x min min u )3(
u
x
x
)3(5.0)3(5.0 +
=
0)4( =
Điều kiện ràng buộc:
)3(
u
x
)3(*
−=
⇒ ⇒
J J
2 )3(2 )3(2
x x
= =
* x ))3(( ))3((3 x
22 March 2011
© H. T. Hoàng - HCMUT
81
Lời giải: (để thỏa mãn điều kiện ràng buộc)
Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP
(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:
Vòng ngược: Với k = 2: Vòng ngược: Với k = 2: Phương trình Bellman:
2
2
J
(( ))2(( )) x
)( )2(
u
=
+
+
* 2 2
* 3 3
2
2
2
J
x ))2((
)2(
u
=
+
+
⇒
* 2
2
2 2
2 2
J
)2( )2(
u
x
)2( )2(
x
u
))2( ))2(
=
+
2)2( 2)2( +
+
* ⇒ ))2((J⇒ x ))2(( 2
min i u )2(
1 2
1 2
})) }))3(( )2( )( J (( x })3(2)2( x ⎡ ⎡ ⎢ ⎣
⎤ ⎤ ⎥ ⎦
⎫ ⎪ ⎪ ⎬ ⎬ ⎪⎭
2
2
)2(
J
x
x
u
x ))2((
)2(
u )2()2(
=
+
+
⇒
* 2
3 2 2
{ { x min )2( u { x min )2( u ⎧ ⎪ ⎪ ⎨ ⎨ ⎪⎩ 3 ⎧ min ⎨ 2)2(u 2 ⎩ ⎩ u )2(
x
x
u
=
)2(3)2( +
)2(*
u
−=
⇒
J (.) ∂ 2 u )2( ∂
⎫ ⎬ ⎭ ⎭ )2( 3
2
x
x
2
⇒
x
J
x
2
)2(
x ))2((
)2(
=
−
* 2
)2( 3
1 2
)2( 3
⎛ −+ ⎜ ⎝
2 ⎞ +⎟ ⎠
⎛ ⎜ ⎝
⎞ ⎟ ⎠
⎤ ⎥ ⎦
⎡ ⎢ ⎣
2
J
x ))2((
x
)2(
=
* 2
⇒
4 4 3
22 March 2011
© H. T. Hoàng - HCMUT
82
Do
Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP
(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:
2
)1(
)1(
x ))1((
+
=
+
* 1
2
2
2
)1(
)1(
J
x
u
))1(( x
=
+
+
⇒
* 1
} }))2(( x ⎫ )2( x ⎬ ⎭
2
2 2
2 2
⇒
x ))1((
)1(
u
x
J
)1(
x )1((
u
))1(
+
=
+
+
* * 1
min u )1(
* J 2 4 3 4 14 1 ⎡ ⎡ ⎢ 2 3 ⎣
⎤ ⎤ ⎥ ⎦
⎫ ⎪ ⎪ ⎬ ⎬ ⎪⎭
2
2
(( ))1(( )) x
)( )1(
x
x
)()( )1()1( u
u
)( )1(
+
=
+
J⇒
* 1 1
4 3 3
2 3 3
4 3 3
x
)1(
u
x
)1(
=
+
u
)1(*
−=
⇒
8 3
Do:
Vòng ngược: Với k = 1: Vòng ngược: Với k 1: Phương trình Bellman: { { 2 J min x u )1( )1(u ⎧ min ⎨ ⎩ )1( u ⎧ ⎪ ⎪ ⎨ ⎨ ⎪⎩ ⎧ min ⎨ ⎨ ⎩ ⎩ u )1( 2 3
J (.)1 ∂ u )1( ∂
⎫ ⎬ ⎬ ⎭ ⎭ )1( 4
2
x
x
2
x
)1(
J
x ))1((
x
)1(
−
=
⇒
* 1
)1( 4
4 3
1 2
)1( 4
⎛ −+ ⎜ ⎝
2 ⎞ +⎟ ⎠
⎛ ⎜ ⎝
⎞ ⎟ ⎠
⎡ ⎢ ⎣
⎤ ⎥ ⎦
2
J
x ))1((
x
)1(
=
⇒
* 1
5 5 4
22 March 2011
© H. T. Hoàng - HCMUT
83
Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP
(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:
2
2
J
Vòng ngược: Với k 0: Vòng ngược: Với k = 0: Phương trình Bellman: u
x ))0((
)0(
J
)0(
=
+
+
* 0
2
2
2
⇒
)1(
)0(
)0(
x
J
))0(( x
u
x
=
+
+
* 0
min )0( u
}))1(( x ⎫ ⎬ ⎭
2
2
2
⇒
x
J
x ))0((
)0(
u
)0(
x )0((
u
))0(
=
+
+
+
* 0
min )0( u
* 1 5 4 5 15 1 ⎡ ⎡ ⎢ 2 4 ⎣
⎫ ⎪⎫ ⎪ ⎬ ⎪⎭
2
2
J⇒ J
x ))0(( ))0(( x
x x
)0( )0(
x x
u )0()0( )0()0( u
u u
)0( )0(
=
+ +
+ +
* 0 0
5 8
21 16
{ x min 1 10u < u < ⎧ ⎨ ⎩ ⎧ ⎪⎧ ⎪ ⎨ ⎪⎩ 21 ⎧ min min ⎨ ⎨ 16 ⎩ ⎩ u )0(
⎤ ⎤ ⎥ ⎦ ⎫ ⎬ ⎬ ⎭ ⎭
x
u
)0(
)0(
=
+
u
)0(
x
)0(*
−=
⇒
5 8 8
J (.) ∂ 0 )0(u∂ )0( u ∂
2
2
⇒
x
)0(
x
)0(
x
J
x ))0((
x
)0(
)0(
−
=
* 0
5 4
1 2
5 21 21 5 21
21 8 8 5 21
⎛ −+ ⎜ ⎝
2 ⎞ +⎟ ⎠
⎛ ⎜ ⎝
⎞ ⎟ ⎠
⎡ ⎢ ⎣
⎤ ⎥ ⎦
2
J
x ))0((
x
)0(
=
⇒
* 0
26 26 21
22 March 2011
© H. T. Hoàng - HCMUT
84
Do:
Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt)
(cid:137) Vòng xuôi: (cid:137) Vòng xuôi:
x
4)0( =
Điều kiện đầu:
u
x
)0(*
)0(
−=
−=
5 21
20 21
*
x
)1(
x )0((
u
))0(
4
=
+
=
−
1 1 2
1 1 2
20 20 21
32 32 21
⎞ ⎞ =⎟ ⎠
⎛ ⎛ ⎜ ⎝
x
Với k = 0:
u
)1(*
−=
−=
)1( )1( 4
8 8 21
*
x
)2(
x )1((
u
))1(
=
+
=
−
1 1 2
32 32 21
8 8 21
12 12 21
1 1 2
⎛ ⎛ ⎜ ⎝
⎞ ⎞ =⎟ ⎠
22 March 2011
© H. T. Hoàng - HCMUT
85
Với k = 1:
Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt)
(cid:137) Vòng xuôi: (cid:137) Vòng xuôi:
x
u
)2(*
−=
−=
)2( 3
4 21
*
)3(
))2(
x
)2(( x
u
=
+
=
−
1 2
12 21
4 21
4 21
1 2
⎞ =⎟ ⎠
⎛ ⎜ ⎝
u
)3(*
)3(
−= x
−=
Với k = 2:
4 21
*
x
)4(
x )3((
u
))3(
0
=
+
=
−
4 4 21
1 1 2
1 4 41 ⎛ ⎛ ⎜ 2 21 ⎝
⎞ ⎞ =⎟ ⎠
Với k = 3:
Kết luận: Chuổi tín hiệu ĐK tối ưu là:
*u
; −
; −
; −
4 4 21
20 20 21
8 8 21
4 4 21
⎧ ⎧ −= ⎨ ⎩
⎫ ⎫ ⎬ ⎭
2
J
J
x ))0((
x
)0(
=
=
=
min
* 0
26 26 21
416 416 21
22 March 2011
© H. T. Hoàng - HCMUT
86
Chỉ tiêu chất lượng tối ưu: ố ấ
Qui hoạch động giải bài toán ĐK tối ưu liên tục Qui hoạch động giải bài toán ĐK tối ưu liên tục
t )(
xf (( t
t (
),
),
u
)
t
=
)( )0(
x
x
x
(cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: (cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: x & = x Trạng thái đầu: , trạng thái cuối:
0 0
( ( f ) ft =)
f f
ạ g
x (( t
x (( t
min
dt )
))
t (
),
),
L
u
J
t
u φ )( =
→
+
f f
t
(cid:145) Đặt: Hàm mục tiêu tối ưu đoạn quỹ đạo cuối từ thời điểm ti, trạng
t
f
* ( tJ
( ) (*) , ạ g (cid:145) Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(t) sao cho: ft ∫ it ∫
x (( t
x (( t
x,
))
),
u
L
)
t
=
}dt )
i
i
f
t
∫+
thái xi đến thời điểm cuối tf, trạng thái cuối x(tf) là { ( t ), φ
min u )( t
i
(cid:145) Nếu tồn tại lời giải tối ưu của bài toán (*) thì hàm mục tiêu tối ưu đoạn quỹ (cid:145) Nếu tồn tại lời giải tối ưu của bài toán ( ) thì hàm mục tiêu tối ưu đoạn quỹ đạo cuối phải thỏa mãn phương trình Hamilton-Jacobi-Bellman:
T
, x,
) )
) )
ux ,( (
), t t )
f f
ux ,( (
−
=
+ +
}t }t ), )
{ { min i L L u )( t
* ( tJ ( ∂ t ∂
* , ( x, ( tJ x ∂
⎡∂ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎦
22 March 2011
© H. T. Hoàng - HCMUT
87
ĐIỀU CHỈNH TOÀN PHƯƠNG TUYẾN TÍNH ĐIỀU CHỈNH TOÀN PHƯƠNG TUYẾN TÍNH LQR) (Linear Quadratic Regulator –– LQR) (Linear Quadratic Regulator
22 March 2011
© H. T. Hoàng - HCMUT
88
Bài toán LQR liên tục Bài toán LQR liên tục
(*)
Bu
Ax
t )(
t )(
t )(
(cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: (cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: =
+
x &
T T )] )]
x
)( t t )(
),...,
( t ), )( ( t txtx )(
2
đó trong đó: t : vector trạng thái thái t t
u
)( t
),...,
T )]
(
2
: vector tín hiệu điều khiển
hỉ h hệ hố ( ) điề á đặ
[ [ 1= [ tutu ), ( 1= là ì x )0(
=
( t n tx ( ( m tu (cid:145) Bài toán đặt ra là tìm tín hiệu điều khiển u(t) điều chỉnh hệ thống từ ừ Bài í hiệ điề khiể x trạng thái đầu bất kỳ về trạng thái cuối x(tf) = 0 sao cho 0 tối thiểu chỉ tiêu chất lượng dạng toàn phương: ợ g ạ g
ft
T
T
T
J
g p
u )(
x
( t
)
Mx
( t
)
)( t
Qx
)( t
u
)( t
Ru
)( t
=
+
+
] dt
[ x
f
f
∫
1 2
1 2
t0 t
trong đó Q và M là các ma trận trọng số bán xác định dương
ọ g ậ ị
R là ma trận trọng số xác định dương g
(cid:145) Bài toán trên được gọi là bài toán điều chỉnh toàn phương tuyến tính.
22 March 2011
© H. T. Hoàng - HCMUT
89
Điều kiện cực trị bài toán LQR liên tục Điều kiện cực trị bài toán LQR liên tục
T
T
H
t )(
t )(
t )(
t )(
t )(
Qx
u
Ru
Ax
Bu
+
+
+
=
T λ
[ t )(
])( t
]
(cid:145) Hàm Hamilton: (cid:145) Hàm Hamilton: [ x
1 2 2
(cid:145) Điều kiện cần để có lời giải tối ưu:
t )( )(
Ax A
t )( )(
Bu B
t )( )(
=
+
(1) (1)
x & &
(2)
Q Qx
)( )( t
A
)( )( t
tT )( )( & λ
−=
−
λ
−=
H ∂ x∂ ∂
t )(
),
t (
xf t ((
u
=
), t ) (3)
Ru
)( t
−=
−
TλB
0)( t =
x &
H ∂ ∂u u ∂
tT )(λ&
−=
H ∂ ∂ x∂
tH )(
L
t )(
uxf ,(
t ),
0= 0 T t ), λ+
=
∂H ux ,( ∂u
22 March 2011
© H. T. Hoàng - HCMUT
90
Cách tìm lời giải tối ưu Cách tìm lời giải tối ưu
t )(
u
t )(
(cid:145) Rút u(t) từ (3): (cid:145) Rút u(t) từ (3): −−=
TλBR 1
(cid:145) Thay (4) vào (1), ta được (cid:145) Th (4) à (1) t đượ
1
−
(4)
t )(
(5)
Ax
t )(
BR
t )(
=
−
TλB
x &
T
1 −
t )(
t )(
ế(cid:145) Kết hợp (5) và (2), ta được phương trình vi phân:
x
A
BR
B
−
t )(
t )(
(6) (6)
Q
A
−
−
x& ⎡ ⎢ ⎢ & λ ⎣
⎤ =⎥ =⎥ ⎦
⎡ ⎢ ⎢ λ ⎣
⎤ ⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎦
(cid:145) Giải phương trình vi phân (6), tìm được x(t) và λ(t) (cid:145) Thay λ(t) vào (4) tìm được lời giải tối ưu
22 March 2011
© H. T. Hoàng - HCMUT
91
Lời giải bài toán LQR liên tục Lời giải bài toán LQR liên tục
u
)(* t )( t
(cid:145) Tín hiệu điều khiển tối ưu: Tí hiệ điề khiể tối
trong đó:
K
t )(
t )(
K xK t )()( t )()( t t −= T PBR 1 −=
T
1−
và P(t) là nghiệm bán xác định dương của phương trình vi phân Ricatti:
PA
QPA
PBR
T PB
+
+
−
P
M
=)
P − & = ( ft
(cid:145) Lời giải phương trình Ricatti:
(cid:190) Trường hợp hệ bậc 2: có thể giải bằng tay (cid:190) Trường hợp tổng quát: tham khảo thêm trong tài liệu
22 March 2011
© H. T. Hoàng - HCMUT
92
Bài toán LQR liên tục thời gian vô hạn Bài toán LQR liên tục thời gian vô hạn
t )(
t )(
t )(
Bu
Ax
(cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: (cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: =
+
x &
(cid:145) Chỉ tiêu chất lượng dạng toàn phương, trong đó thời điểm cuối tf=∞: (cid:145) Chỉ tiêu chất lượng dạng toàn phương trong đó thời điểm cuối t =∞:
∞
T
T
Qx
u
Ru
J
u )(
)( t
)( t
)( t
)( t
=
+
] dt
[ x
1 ∫ ∫ 02 2
)(* t
t )(
u
Kx
−=
(cid:145) Tín hiệu điều khiển tối ưu:
T
1−= PBRK
T T
1 1−
trong đó: và P là nghiệm bán xác định dương của phương trình đại số Ricatti:
0 0
PA PA
QPA QPA
PBR PBR
T T PB PB
+
+
−
=
(cid:145) Chú ý: trong trường hợp này K và P là không phụ thuộc thời gian
(cid:145) Giá trị cực tiểu của chỉ tiêu chất lượng:
J
)0(
)0(
ể ấ
xT
Px
=
min
22 March 2011
© H. T. Hoàng - HCMUT
93
Thí dụ 1 Điều khiển LQR liên tục –– Thí dụ 1 Điều khiển LQR liên tục
(cid:145) Cho hệ tuyến tính bậc 1 không ổn định mô tả bởi PTTT: (cid:145) Cho hệ tuyến tính bậc 1 không ổn định mô tả bởi PTTT:
=
+
tx tx )(2)(3)( tu &
(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu
( )
ệ ậ ị
∞
J
(
2 tx
))
dt
2 (5)( tu +
1 ∫ = ∫ 2 0 2
(cid:145) Giải:
1
T
−
chỉ tiêu chất lượng:
PA
PBR
T PB
+
−+
=
(cid:145) Phương trình đại số Ricatti:
⇒
⇒
P
P
P
.2.
.2.
P
0
01
.33. +
1 −+
=
− P 6
=−
1 1 5
QPA 4 2 4 P 5
⇒
0
663 663
.7P .7=P
T
065,3)663,7.(2.
=
(cid:145) Độ lợi hồi tiếp trạng thái:
=K⇒
1−= PBRK
tu )(
tKx )(
−=
(cid:145) Luật điều khiển tối ưu:
(chọn nghiệm xác định dương) (chọn nghiệm xác định dương)
⇒
tu )(
065,3
tx )(
1 5 −=
22 March 2011
© H. T. Hoàng - HCMUT
94
ố ể ề
Thí dụ 2 Điều khiển LQR liên tục –– Thí dụ 2 Điều khiển LQR liên tục
(cid:145) Cho hệ tuyến tính bậc 2 mô tả bởi PTTT:
2
x x& x ⎧ = x = ⎧ 1 2 ⎨ x u = & ⎩
ầ Thiết kế l ật điề khiể
(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu (cid:145) Yê
(t) để hệ kí ổ đị h à tối thiể
∞
J J
2 (2)(2( (2)(2( tu tu
)) ))
dt dt
+ +
2 tx tx 1 1
1 ∫ = ∫ 2 0
(cid:145) Giải:
10
0
chỉ tiêu chất lượng:
tu )( )( tu
)( tx 1 )( tx 2
)( tx ⎡ & 1 ⎢ ⎢ )( tx & ⎣ 2
⎤ =⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎣
⎤ +⎥ +⎥ ⎦
g (cid:145) Viết lại phương trình trạng thái: ạ p ạ g
⎡ ⎤ ⎢ ⎥ ⎢ ⎥ 1 ⎣ ⎦ { B
⎡ ⎤ ⎢ ⎥ ⎢ ⎥ 00 ⎣ ⎦ 321 A
(cid:145) Viết lại chỉ tiêu chất lượng:
∞
J
x
2 ( tu
))
dt
[ x 1
2
x 1 x
1 = ∫ 2
2
0 0
⎤ +⎥ ⎦ ⎦
ợ g ạ
2 { R R
02 ⎡ ⎡ ⎤ ] ⎢ ⎢ ⎥ 00 ⎣ ⎣⎦ ⎣ ⎦ ⎣ 321 Q
22 March 2011
© H. T. Hoàng - HCMUT
95
Thí dụ 2 Điều khiển LQR liên tục –– Thí dụ 2 Điều khiển LQR liên tục
1
T
−
0
(cid:145) Phương trình đại số Ricatti: (cid:145) Phương trình đại số Ricatti: T PB
QPA
PBR
PA
−
+
+
=
p
p
10 10
00 00
02 02
p 1
p 1
⇒
p
p
00
2
2 p 3
2
2 p 3
⎡ ⎡ ⎢ 01 ⎣
⎡ ⎡ ⎢ ⎣
⎤ ⎤ +⎥ ⎦
⎡ ⎡ ⎢ ⎣
⎤ ⎡⎤ ⎡ ⎥ ⎢ ⎣ ⎦
⎡ ⎡⎤ ⎤ ⎢ ⎥ ⎦ ⎣
p p
p p 1
p p 1
0
−
p
p
2
2 p 3
2
2 p 3
⎤ ⎤ +⎥ ⎦ ⎡ ⎡ ⎢ ⎣
⎤ ⎤ ⎥ 00 ⎦ p p 10 0 ⎤ ⎤⎡⎤ ⎡ ⎤ 1 ⎥ ⎢ ⎥ 1 2 ⎣ ⎦ ⎦
⎡ ⎡ [ ] 10 ⎢ ⎣
⎤ ⎤ =⎥ ⎦
0
0
0
02
p
p 1
⇒
0
p
p
0
00
1 2
2
p 1
2
2 2 2 pp 3 2
pp 2 3 2 p 3
⎡ ⎡ ⎢ ⎣
⎤ ⎤ −⎥ ⎦
⎤ ⎤ +⎥ ⎦
⎤ ⎤ +⎥ ⎦
⎡ ⎡ ⎢ ⎣
⎡ ⎡ ⎢ ⎣
⎡ ⎡ ⎢ ⎣
⎤ ⎤ =⎥ ⎦
p
2
−
−
2 2
p 1
pp 2 3
1 2
0
=
⇒
2 2
p
−
−
p 1
pp 3 2
2
2 2 p 3
1 2 1 2
1 2
⎡ ⎡ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎤ ⎥ ⎥ ⎥ ⎥ ⎦
22 March 2011
© H. T. Hoàng - HCMUT
96
Thí dụ 2 Điều khiển LQR liên tục –– Thí dụ 2 Điều khiển LQR liên tục
2
p
0
−
=
2 2
=
0 0
−
=
P⇒ P⇒
= =
2 2
pp pp 2 2 3 3
1 1 2 1 2
22 2
2 22
⎡ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎦
22 2 2 22
= =
p 1 p⇒ p ⇒ p 3
⎧ ⎪ ⎨ ⎨ ⎪ ⎩
p
0
2
−
=
2
2 p 3
1 2
⎧ ⎧ ⎪ ⎪⎪ p⇒ p ⇒ ⎨ ⎨ 1 1 ⎪ ⎪ ⎪ ⎩ ⎩
T
]2
1[=K⇒
K⇒
=
1−= PBRK
(cid:145) Độ lợi hồi tiếp trạng thái: 1 2
22 2
2 22
⎡ ⎡ [ ] 10 ⎢ ⎣
⎤ ⎤ ⎥ ⎦
(cid:145) Luật điều khiển tối ưu:
⇒
* )( )( tu
−=
−
* )( tu )(
Kx
)( t )(
−=
1[ [ −=
)( )( tx 1 1
)( )(2 tx 2 2
tx )( 1 )( 2 tx )(
⎡ ]2 ] ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎦
22 March 2011
© H. T. Hoàng - HCMUT
97
Thí dụ 3 Điều khiển LQR liên tục –– Thí dụ 3 Điều khiển LQR liên tục
(cid:145) Cho hệ tuyến tính bậc 2 mô tả bởi PTTT: (cid:145) Cho hệ tuyến tính bậc 2 mô tả bởi PTTT:
1
0
0
tu )(
1 1
−
tx )( 1 tx )( )( tx 2
tx )( & 1 tx tx )( )( & 2
⎡ ⎢ ⎣ ⎣
⎤ =⎥ ⎦ ⎦
⎤ +⎥ ⎦ ⎦
⎡ ⎤ ⎢ ⎥ 1 1 ⎦⎣ ⎣ ⎦ { B
⎡ ⎡ ⎤ ⎢ ⎢ ⎥ 2 2 − ⎣ ⎣⎦ ⎣ ⎦ ⎣ 43421 A
(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu (cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu
∞
J J
2 ( tu tu (
)] )]
dt dt
+ +
+ +
2 )(2[ tx tx )(2[ 1
2 )( tx tx )( 2
1 = ∫ = ∫ 2
0
(cid:145) Giải:
(cid:145) Viết lại chỉ tiêu chất lượng:
chỉ tiêu chất lượng:
∞
02
([
J
x
))
2 ( tu
dt
x 1
2
x 1 x
1 = ∫ 2
2
0 0
ợ g ạ
⎤ 1 +⎥ { ⎦ ⎦ R R
⎡ ⎡ ⎤ ] ⎢ ⎥ ⎢ 10 ⎣ ⎣⎦ ⎣ ⎦ ⎣ 321 Q
22 March 2011
© H. T. Hoàng - HCMUT
98
Thí dụ 3 Điều khiển LQR liên tục –– Thí dụ 3 Điều khiển LQR liên tục
1
T
−
0
(cid:145) Phương trình đại số Ricatti: (cid:145) Phương trình đại số Ricatti: T PB
QPA
PBR
PA
−
+
+
=
p
p
1 1
0 0
1 1
02 02
−
p 1
p 1
⇒
p
p
1
2
2
−
−
2
2 p 3
2
⎤ ⎤ +⎥ ⎦
⎡ ⎡ ⎢ 1 ⎣
0 0 ⎤ ⎡⎤ ⎡ −⎥ ⎢ ⎣ ⎦
⎡ ⎡ ⎢ ⎣
⎡ ⎡⎤ ⎤ ⎢ ⎥ ⎦ ⎣
⎤ ⎤ +⎥ ⎦
p p
p p 1
0
−
p
p
2
2 p 3
2
2 p 3
2 p 3 p p ⎡ ⎡ 1 ⎢ ⎣
⎡ ⎡ ⎤ ⎤ ⎢ ⎥ 10 ⎦ ⎣ p p 0 0 ⎤ ⎤⎡⎤ ⎡ ⎡ ⎡ ⎤ [ ] 10 ⎥ ⎢ ⎢ ⎥ 1 ⎣ ⎦ ⎦ ⎣
⎤ ⎤ =⎥ ⎦
02
p
⇒
0
p 1 p
p
2 2 2
p 2 p 2
p 3 2
− −
− −
− −
− −
10
p 2 p 3
2
p 2 p 3
2
p 1
2
p 3
2 2 2 pp 3 2
pp 2 3 2 p 3
⎡ ⎡ ⎢ ⎣
⎤ ⎤ −⎥ ⎦
⎡ ⎡ ⎢ ⎣
⎡ ⎡ ⎢ ⎣
⎤ ⎤ +⎥ ⎦
⎤ ⎤ +⎥ ⎦
⎡ ⎡ ⎢ ⎣
⎤ ⎤ =⎥ ⎦
2
p
p
2
p
−
0
⇒
2 −+ p 2 2 p
p 1 2 2
− p p
2 4 4
2 −
−
−
+ +
−
p − 3 1 1 + −+
2 2
2 2 pp pp 3 2 2 3
p p 3 3
p p 1 1
2 2
− p p 3 3
pp 2 3 2 p p 3 3
⎡ ⎢ ⎣ ⎣
⎤ =⎥ ⎦ ⎦
22 March 2011
© H. T. Hoàng - HCMUT
99
Thí dụ 3 Điều khiển LQR liên tục –– Thí dụ 3 Điều khiển LQR liên tục
2 2
0
p p 2 2
2 2 −+ −+ p −
⇒
⇒
0 0
=
403.2 = 732 .0 = .0 0 = 542 542
p 1 p 2 3p
⎧ ⎧ ⎪ ⎨ ⎪ ⎪ ⎩ ⎩
− − p − 1 p p 3 3 p
− 2
+ + −
2p p 0 0 = = 2 p pp = − 3 2 3 p pp 2 2 pp p − 3 2 2 2 2 3 1 0 −+ =
2
2 p p 1 1 p 4 3
− 2 p 3
⎧ ⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩
(chọn các nghiệm dương) g) g ệ
P⇒
=
403.2 403 2 732.0
732.0 732 0 542.0
⎡ ⎡ ⎢ ⎣
⎤ ⎤ ⎥ ⎦
(cid:145) Độ lợi hồi tiếp trạng thái: (cid:145) Độ lợi hồi tiếp trạng thái:
403.2
732.0
T
K⇒
=
1−= PBRK
.0
542
]
732.0[=K⇒
732.0
542.0
⎡ [ ] 10 ⎢ ⎣ ⎣
⎤ ⎥ ⎦ ⎦
(cid:145) Luật điều khiển tối ưu:
Kx
* )( tu
)( t
.0[
732
.0
−=
−=
)( tx 1 )( tx 2
⎡ ]542 ⎢ ⎣
⎤ ⎥ ⎦
* tu )(
.0
732
542.0)(
−=
−
⇒
tx 1
tx )( 2
22 March 2011
© H. T. Hoàng - HCMUT
100
Bài toán LQR rời rạc Bài toán LQR rời rạc
(cid:145) Cho đối tượng tuyến tính rời rạc mô tả bởi phương trình trạng thái: (cid:145) Cho đối tượng tuyến tính rời rạc mô tả bởi phương trình trạng thái: (*)
x
(
k
k )(
k )(
)1 =+
+
uB d
xA d
x
)( k k )(
),...,
( )( ), ( )( kxkx k k
2
đó trong đó: t t
u
)( k
),...,
Tk T )] )] : vector trạng thái thái t T )] : vector tín hiệu điều khiển
2
hỉ h hệ hố á đặ (k) điề
[ [ 1= [ kuku ( ), ( 1= là ì )0( x
=
( ( n kx ( m ku (cid:145) Bài toán đặt ra là tìm tín hiệu điều khiển u(k) điều chỉnh hệ thống từ ừ Bài í hiệ điề khiể x trạng thái đầu bất kỳ về trạng thái cuối x(N) = 0 sao cho 0 tối thiểu chỉ tiêu chất lượng dạng toàn phương: ợ g ạ g
N
1 −
T
T
T
J
g p
x
N
Mx
N
k )(
Qx
k )(
u
k )(
Ru
k )(
(
)
(
)
u )(
=
+
+
]
[ x
∑
1 2
1 2
=0k k 0 =
trong đó Q và M là các ma trận trọng số bán xác định dương
ọ g ậ ị
R là ma trận trọng số xác định dương g
22 March 2011
© H. T. Hoàng - HCMUT
101
Lời giải bài toán LQR rời rạc Lời giải bài toán LQR rời rạc
u
)(* k )( k
K K
−=
(cid:145) Tín hiệu điều khiển tối ưu: Tí hiệ điề khiể tối
trong đó:
K
)( k
(
k
)1
(
k
)1
=
+
+
+
)()( x k k )()( k k ] 1 − PBR
[ T PB d
B d
T d
A d
−
)( k
)1
)1
)1
P
k
k
k
k
(
(
(
(
P
)1 −+
=
+
+
+
+
QA +
và P(k) là nghiệm bán xác định dương của phương trình Ricatti: ( ( PBB
) ) 1 PBR
T PA d d
B d d
T d d
T d d
d d
d
( (
) d )
P
(N
M
=)
(cid:145) Nghiệm phương trình Ricatti rời rạc: lần lượt thay (cid:145) Nghiệm phương trình Ricatti rời rạc: lần lượt thay 0 0
k k
)1 )1 → →−
= N ( ( = N
vao phương trình Ricatti sẽ tìm được P(k)
22 March 2011
© H. T. Hoàng - HCMUT
102
Bài toán LQR rời rạc thời gian vô hạn Bài toán LQR rời rạc thời gian vô hạn
k )(
k )(
x
k
(
)1 =+
+
(cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái rời rạc: (cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái rời rạc: xA d
uB d
(cid:145) Chỉ tiêu chất lượng dạng toàn phương, trong đó thời điểm cuối N ∞: (cid:145) Chỉ tiêu chất lượng dạng toàn phương trong đó thời điểm cuối N=∞:
∞
T
T
J
k )(
Qx
k )(
u
k )(
Ru
k )(
u )(
=
+
]
[ x
∑
1 2
=0k k 0 =
)(* k
−=
(cid:145) Tín hiệu điều khiển tối ưu:
1−
trong đó: t đó
K K
+
=
u [ [ T T PBB PBB d d
)( k Kx ] ] T T PABR PABR d d
và P là nghiệm bán xác định dương của phương trình đại số Ricatti:
1 1
−
PAP
PB
=
−
+
+
) ) QAPBR
( ( T BPB d d
d
T d
T d
d
( (
) )
(cid:145) Chú ý: trong trường hợp này K và P là không phụ thuộc k
(cid:145) Giá trị cực tiểu của chỉ tiêu chất lượng:
J
xT
)0(
Px
)0(
=
min
22 March 2011
© H. T. Hoàng - HCMUT
103
Lời giải bài toán LQR thời gian vô hạn dùng Matlab Lời giải bài toán LQR thời gian vô hạn dùng Matlab
(cid:145) Nghiệm phương trình đại số Ricatti liên tục (continuous algebraic (cid:145) Nghiệm phương trình đại số Ricatti liên tục (continuous algebraic
Ricatti equation – care)
>> P=care(A,B,Q,R) Q ) (
(cid:145) Lời giải bài toán LQR (Linear quadratic Regulator – LQR) liên tục
>> K=lqr(A,B,Q,R)
(cid:145) Nghiệm phương trình đại số Ricatti rời rạc(discrete algebraic Ricatti i
ì h đ i ố i
l b i
i ời
(di
hi
h
i
equation – dare)
>> P dare(A,B,Q,R) >> P=dare(A B Q R)
(cid:145) Lời giải bài toán LQR (Linear quadratic Regulator – LQR) rời rạc
>> K=dlqr(A,B,Q,R)
22 March 2011
© H. T. Hoàng - HCMUT
104
BỘ LỌC KALMAN BỘ LỌC KALMAN BỘ LỌC KALMAN BỘ LỌC KALMAN
22 March 2011
© H. T. Hoàng - HCMUT
105
Bài toán ước lượng tối ưu Bài toán ước lượng tối ưu
(cid:145) Cho phân bố xác suất liên kết (X,Y), ước lượng X dựa trên các giá trị (cid:145) Cho phân bố xác suất liên kết (X,Y), ước lượng X dựa trên các giá trị
đo Y sao cho tối thiểu phương sai ước lượng:
ˆ 2
y y
T ()ˆ ()
)ˆ )
( (
yx | | yx
) )
dx dx
min min
YxXE YxXE −
=
=
xX xX −
pxX pxX −
→ →
YX
[ [
] ]
∫ ∫
+∞ ( ( ∞−
+∞
(cid:145) Lời giải:
y y
p xp
( (
| yx y |
) )
dx
=
=
=
[ [ ˆ YXEx
] ]
YX YX
∫ ∫
∞−
(cid:145) Bộ ước lượng tối ưu trong trường hợp quan hệ giữa Y là X là quan hệ
tuyến tính có nhiễu phân bố Gauss gọi là bộ lọc Kalman. tuyến tính có nhiễu phân bố Gauss gọi là bộ lọc Kalman
(cid:145) Nhắc lại các công thức xác suất thống kê: Cho X là biến ngẫu nhiên
có hàm mật độ phân bố xác suất là p(X) có hàm mật độ phân bố xác suất là (X)
+∞
(cid:190) Kỳ vọng:
xp
)( dxx
=
=
[ XE
]
μ X
X
Var
(
X
)
XE [(
T ()
X
)]
=
−
−
∫ ∞− =
(cid:190) Phương sai:
2 σ X
μ X
μ X
22 March 2011
© H. T. Hoàng - HCMUT
106
Lọc Kalman liên tục Lọc Kalman liên tục
w w
t )( )( t
+ +
(cid:145) Xét hệ tuyến tính liên tục: ế
í h li
é h
x x& t )( )( t ty )(
= =
Ax Ax B B t )( tu )( t )( )( tu + + C tx tv )( )( +
⎧ ⎧ ⎨ ⎨ ⎩
[ E
Q
Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường. Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường Giả sử nhiễu hệ thống và nhiễu đo lường có phân bố Gauss, không tương quan, có trung bình bằng 0 và phương sai là: T ww =]
TvvE [
R=]
N
N
B B
tu ( ( t
)] )]
L L
ty )([ )([ t
(ˆ ty ( t
)] )]
+ +
+ +
−
(cid:145) Bộ lọc Kalman liên tục:
& )(ˆ x t )( t )(ˆ ty
)(ˆ xA t [ )( A t [ )(ˆ C tx
= =
⎧ ⎧ ⎨ ⎩
L
TΠ
=
Trong đó L là độ lợi của bộ lọc Kalman: Trong đó L là độ lợi của bộ lọc Kalman: 1− NRC
T
CRC
T A
A
Q
0
với Π là nghiệm của phương trình Ricatti: với Π là nghiệm của phương trình Ricatti: ΠΠ Π +
Π
−
+
=
1 − N
N
22 March 2011
© H. T. Hoàng - HCMUT
107
Sơ đồ khối bộ lọc Kalman rời rạc Sơ đồ khối bộ lọc Kalman rời rạc
y(t) ( )
x(t)
u(t)
t )(
Ax
t )(
B
tu )(
=
+
C
x &
L
+ + −
)(ˆ tx
C C
B B
∫ ∫
+ ++ ++
)(ˆ ty
A
tu )(
ty )((
(ˆ ty
))
B
L
+
+
−
(cid:145) Bộ lọc Kalman:
x& )(ˆ t )(ˆ )(ˆ ty
)(ˆ t )(ˆ )(ˆ t
xA xC C
= =
⎧ ⎨ ⎨ ⎩ ⎩
L
=
TΠ
Trong đó:
T
1− NRC T A
A
CRC
Q
0
−
ΠΠ +
Π
Π
+
=
1 − N
N
22 March 2011
© H. T. Hoàng - www4.hcmut.edu.vn/~hthoang/
108
Lọc Kalman rời rạc Lọc Kalman rời rạc
w w
ku )( )( ku
k )( )( k
+ +
(cid:145) Xét hệ tuyến tính rời rạc: ế
k k ( ( x x ky )(
xA xA d kx )(
k )( )( k B B + + d kv )( +
)1 )1 =+ =+ C =
( )
g
ệ
d ( )
⎧ ⎧ ⎨ ⎩ g Trong đó: w(k) là nhiễu hệ thống; v(k) là nhiễu đo lường. g; Giả sử nhiễu hệ thống và nhiễu đo lường có phân bố Gauss, không tương quan, có trung bình bằng 0 và phương sai là:
[ E
Q
T T ww =]
TvvE [
R=]
N
N
)(ˆ )(ˆ k k
ku ( ( k
)] )]
ky ([ ([ k
(ˆ (ˆ ky k
)]1 )]1
+
+
)1 )1 −+
+
B B d
L L k
(cid:145) Bộ lọc Kalman rời rạc: (ˆ (ˆ k k [ [ x xA A d )(ˆ )(ˆ ky kx
)1 )1 =+ C =
⎧ ⎧ ⎨ ⎩
−
k )(
L
k )(
C
R
d Trong đó L là độ lợi của bộ lọc Kalman: Trong đó L là độ lợi của bộ lọc Kalman: k )( Π
Π
=
+
) 1
( T CC d
A d
d
T d
N
)( k
k
(
CRC
)( k
với Π là nghiệm của phương trình Ricatti: với Π là nghiệm của phương trình Ricatti: )( k Π Π
QA +
)1 =+
Π
−
A d
N
A d
T d
1 Π − N d
T d
T A d
22 March 2011
© H. T. Hoàng - HCMUT
109
Sơ đồ khối bộ lọc Kalman rời rạc Sơ đồ khối bộ lọc Kalman rời rạc
u(t) u(t)
x(t)
y(t) ( )
x
(
k
k )(
B
ku )(
)1 =+
+
d
xA d
d
dC
L
+ + −
)(ˆ tx
dB d
dC dC
1−z z
+ ++ +
)(ˆ ty
dA
)(ˆ k
ku (
)]
ky ([
(ˆ ky
)]1
+
+
)1 −+
+
B d
L k
(cid:145) Bộ lọc Kalman:
(ˆ x k )(ˆ ky ky )(
xA [ d )(ˆ kx )( kx
)1 =+ dC C =
⎧ ⎨ ⎨ ⎩ ⎩
−
Trong đó:
L
k )(
k )(
k )(
C
R
=
Π
Π
+
A d
d
T d
N
(
k
) 1 )( k CRC
)( k
Π
)1 =+
Π
( T CC d QA )( k +
−
Π
A d
T d
A d
N
T d
1 Π − N d
T A d
22 March 2011
© H. T. Hoàng - www4.hcmut.edu.vn/~hthoang/
110
BỘ ĐIỀU KHIỂN LQG BỘ ĐIỀU KHIỂN LQG (Linear Quadratic Gaussian) (Linear Quadratic Gaussian)
22 March 2011
© H. T. Hoàng - HCMUT
111
Bài toán điều khiển LQG (Linear Quadratic Gaussian) Bài toán điều khiển LQG (Linear Quadratic Gaussian)
t )(
w
+
(cid:145) Xét hệ tuyến tính liên tục bị tác động bởi nhiễu Gauss: (cid:145) Xét hệ tuyến tính liên tục bị tác động bởi nhiễu Gauss: x& t )( = ty )( =
Ax B t tu )( )( + C )( )( tx tv +
⎧ ⎨ ⎩
Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường. Giả sử nhiễu không tương quan, có trung bình bằng 0 và phương sai là:
[ [ E
Q Q]
T T ww =]
TvvE T [
R=]
N
N
x x
)0( )0(
= =
T
T
u )(
Ru
Qx
t )(
t )(
t )(
t )(
E
u
J
=
+
(cid:145) Bài toán đặt ra là tìm tín hiệu điều khiển u(t) điều chỉnh hệ thống từ x x trạng thái đầu bất kỳ về trạng thái cuối x(tf) = 0 sao cho bất kỳ về trạng thái cuối x(t ) = 0 sao cho trạng thái đầu 0 tối thiểu chỉ tiêu chất lượng dạng toàn phương: ∞1 [ 1 [ ∫ ∫ x 2
0
⎧ ⎧ ⎨ ⎩
⎫ ] ⎫ ] dt ⎬ ⎭
á đị h dươ
t ậ t
ố bá
đó Q là á
trong đó Q là các ma trận trọng số bán xác định dương t R là ma trận trọng số xác định dương
22 March 2011
© H. T. Hoàng - HCMUT
112
Nguyên lý tách rời Nguyên lý tách rời
(cid:145) Nguyên lý tách rời: Bài toán tối ưu LQG có thể giải bằng cách giải (cid:145) Nguyên lý tách rời: Bài toán tối ưu LQG có thể giải bằng cách giải
riêng bài toán điều khiển tối ưu tiền định và bài toán ước lượng trạng thái tối ưu.
LQG = LQR + Lọc Kalman
22 March 2011
© H. T. Hoàng - HCMUT
113
Lời giải bài toán điều khiển LQG Lời giải bài toán điều khiển LQG
(cid:145) Tín hiệu điều khiển tối ưu LQR: (cid:145) Tín hiệu điều khiển tối ưu LQR: )(* t
u
xK
)(ˆ t
−=
T
với độ lợi hồi tiếp trạng thái: với độ lợi hồi tiếp trạng thái:
1− PBRK = PBRK
T T
1 1−
trong đó P là nghiệm bán xác định dương của pt đại số Ricatti: QPA QPA
T T PB PB
PBR PBR
PA PA
0 0
+
−
+
=
(cid:145) Bộ lọc Kalman:
B
tu (
)]
L
ty )([
(ˆ ty
)]
+
+
−
x& )(ˆ t )(ˆ ty
)(ˆ xA [ t )(ˆ C tx
= =
⎧ ⎧ ⎨ ⎩
L
=
TΠ
với độ lợi ước lượng:
1− NRC
trong đó Π là nghiệm bán xác định dương của pt đại số Ricatti:
T
A
T A
CRC
Q
0
ΠΠ +
−
Π
Π
+
=
1 − N
N
22 March 2011
© H. T. Hoàng - HCMUT
114
Sơ đồ khối bộ điều khiển LQG liên tục Sơ đồ khối bộ điều khiển LQG liên tục
y(t) y(t)
r(t) r(t)
x(t) x(t)
u(t) u(t)
t )(
Ax
t )(
B
tu )(
=
+
x &
C
−
L L
+ − −
)(ˆ tx
B
C
∫
+ ++
)(ˆ ty
A
K K
(cid:145) Bộ điều khiển LQR
(cid:145) Bộ lọc Kalman
)(ˆ )(ˆ t
u
xK K
))
)( tu
)(( ty
(ˆ ty
B
L
+
+
−
T
)(ˆ t )(ˆ t
xA xC
= =
1
−
QPA QPA
PBR PBR
T PB PB
)(* )(* t −= 1−= PBRK T PA PA + +
+ +
− −
0= 0 =
T
CRC
Q
0
⎧ & ⎧ )(ˆ t x ⎨ )(ˆ ty ⎩ 1−RC TΠ L L Π NRC = T A A ΠΠ + −
Π
Π
+
=
1 − N
N
22 March 2011
© H. T. Hoàng - www4.hcmut.edu.vn/~hthoang/
115
THÍ DỤ THIẾT KẾ THÍ DỤ THIẾT KẾ ĐIỀU KHIỂN TỐI ƯU ĐIỀU KHIỂN TỐI ƯU Ể Ể Ề Ề
Ố Ố
22 March 2011
© H. T. Hoàng - HCMUT
116
Đối tượng điều khiển: hệ con lắc ngược Đối tượng điều khiển: hệ con lắc ngược
g [
(cid:145) Thông số hệ con lắc ngược (cid:145) Thông số hệ con lắc ngược M =1.0 kg: troïng löôïng xe m=0.1kg : troïng löôïng con laéc l = 1.0 m: chieàu daøi con laéc é à u : löïc taùc ñoäng vaøo xe [N] g : gia toác troïng tröôøng [m/s2] ï g g g ] x : vò trí xe [m] θ: goùc giöõa con laéc vaø phöông
thang ñöng [rad] thaúng ñöùng [rad]
(cid:145) Mô hình toán hệ con lắc ngược
u
ml
+
x =&&
mg (cos
cos sin θθ 2 ) θ
2& 2 (sin ) − θθ mmM −+
u u
cos cos
( (
) )
θ θ
−
+ +
sin sin & θθθ θθθ
=
θ&& &&
) (sin ) (cos ml (sin ) ml (cos gmM ) gmM θ + θ + 2 ( ) ml lmM (cos ) θ − +
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
117
PTTT phi tuyến của hệ con lắc ngược PTTT phi tuyến của hệ con lắc ngược
x x
, xx xx
= =
, θ θ
= =
, & θ θ
= =
= =
(cid:145) Đặt các biến trạng thái (cid:145) Đặt các biến trạng thái
x x 1
2
x x 3
4
x x &
(cid:145) Phương trình trạng thái phi tuyến
u
cos
(
sin
−
x 1
xx ) 1
2
gmMx ) + 1 ( (cos ml
2 x ml ) (cos + 1 ( ( ) ) lmM − +
x (sin 2 ) ) x 1 1
=
u
ml
sin
+
x 1
4
x & 1 x & 2 2 x & 3 x &
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
x 1 2 2
x 4 2 xx ) mg (sin − 1 2 mmM M (cos x ( −+
cos 1) )
⎡ ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣
⎤ ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦
(cid:145) Yêu cầu: Thiết kế bộ điều khiển giữ cân bằng con lắc quanh vị trí
thẳng đứng
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
118
PTTT tuyến tính của hệ con lắc ngược PTTT tuyến tính của hệ con lắc ngược
(cid:145) PTTT tuyến tính hóa quanh điểm cân bằng thẳng đứng (góc lệch θ (cid:145) PTTT tuyến tính hóa quanh điểm cân bằng thẳng đứng (góc lệch θ
nhỏ hơn 100)
001
g
000
−
=
+
100
000
g
−
x 1 1 x 2 x 3 x
4
x 1& 1 x & 2 x & 3 x 4&
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
0 mM mM + + Ml 0 m m M
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎡ ⎥ ⎥ ⎢ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎥ ⎢ ⎢ ⎣⎥ ⎦
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
0 ⎤ 1 1 ⎥ ⎥ ⎥ uMl ⎥ 0 ⎥ ⎥ 1 1 ⎥ M ⎦
(cid:145) Thay cụ thể thông số của hệ con lắc ngược: (cid:145) Thay cụ thể thông số của hệ con lắc ngược:
0
001
0
78.10
000
u
+
=
x 1 x 2 2 x 3
x
4
4
x & 1 x & 2 2 x & 3 x &
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣− 1
⎤ ⎥ ⎥ ⎥ ⎥ 100 ⎥ 000 ⎦ 444 3
⎤ ⎡ ⎥ ⎢ 1 − ⎢ ⎢ ⎥ ⎥ ⎢ ⎥ 0 ⎢ ⎥ 1 ⎣ ⎦ { B
0 98.0 444 2 A
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
119
Thiết kế bộ điều khiển LQR Thiết kế bộ điều khiển LQR
(cid:145) Giả thiết: (cid:145) Giả thiết:
(cid:190) Đặc tính động của hệ con lắc ngược có thể được mô tả bởi hệ phương trình biến trạng thái tuyến tính. Điều này chỉ đúng khi góc lệch θ nhỏ.
(cid:190) Hệ thống phản hồi trạng thái đầy đủ, nghĩa là có thể đo được 4 biến trạng thái (góc lệch θ, vận tốc góc, vị trí xe x, vận tốc xe ) biến trạng thái (góc lệch θ vận tốc góc vị trí xe x vận tốc xe )
(cid:190) Không có nhiễu tác động vào hệ thống.
(cid:145) Thiết kế dùng Matlab: (cid:145) Thiết kế dù M tl b (cid:190) >> K = lqr(A,B,Q,R) (cid:190) Tùy theo độ lớn tương đối giữa trọng số Q và R mà hệ thống có
đáp ứng quá độ và năng lượng tiêu tốn khác nhau.
(cid:190) Muốn trạng thái đáp ứng nhanh tăng thành phần Q tương ứng (cid:190) Muốn giảm năng lượng tăng R (cid:190) Muốn giảm năng lượng tăng R
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
120
Mô phỏng điều khiển LQR hệ con lắc ngược Mô phỏng điều khiển LQR hệ con lắc ngược
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
121
Kết quả mô phỏng điều khiển LQR hệ con lắc ngược Kết quả mô phỏng điều khiển LQR hệ con lắc ngược
0.5 0
θ θ&
0
] s / d a r [ , ] d a r [
-0.5
0
6
5
1
2
3
4
Q
=
1
0.5
x x&
] s / m m
[ , ]
0001 0010 0100 1000 1000
0
m
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦
[
-0.5
0
6
5
1
2
3
4
1=R
10
u
5
]
N
[
0
-5 -5
0
6
5
1
2
4
lắ đ
3 Time [s]
34
. 3620
. 10 7009
. 000 1
2
] ] . 4109
[ [ −K =
−
−
−
Góc lệch con lắc được Gó lệ h giữ cân bằng tốt, tuy nhiên vị trí xe dao động khá lớn
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
122
Kết quả mô phỏng điều khiển LQR hệ con lắc ngược Kết quả mô phỏng điều khiển LQR hệ con lắc ngược
0.5 0
0
θ θ&
-0.5
01
0
0
] s / d a r [ , ] d a r [
-1
0
6
5
1
2
3
4
Q
=
2
10 00
0 100
0 0
1
x x&
] s / m m
[ , ]
00 00
0 0
1 1
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦
0
m
[
-1
0
6
5
1
2
3
4
1=R
20
u
10
]
N
[
0
-10 -10
0
6
5
1
2
4
ố
3 Time [s]
)
70
. 1356
22
. 1091
10
. 000
] ] . 0514 11
[ [ −K =
−
−
−
Tăng trọng số q33 Tă (tương ứng với vị trí xe) ⇒ vị trí xe ít dao động hơn
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
123
Kết quả mô phỏng điều khiển LQR hệ con lắc ngược Kết quả mô phỏng điều khiển LQR hệ con lắc ngược
0.5
0
θ θ&
-0.5
01
0
0
] s / d a r [ , ] d a r [
-1
0
6
5
1
2
3
4
Q
=
2
10 00
0 100
0 0
1
x x&
] s / m m
[ , ]
00 00
0 0
1 1
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦
0
m
[
-1
0
6
5
1
2
3
4
1=R
20
u
10
]
N
[
0
Q
-10 10
0
6
5
1
2
4
3 Time [s]
70
. 1356
22
. 1091
10
. 000
] ] . 0514 11
[ [ −K =
−
−
−
Khuyết điểm của bộ điều khiển LQR là nếu có nhiễu đo lường thì chất lượng điều khiển bị ảnh hưởng đáng kể bị ảnh hưởng đáng kể
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
124
Thiết kế bộ điều khiển LQG Thiết kế bộ điều khiển LQG
(cid:145) Giả thiết: (cid:145) Giả thiết:
ệ
ị
(cid:190) Hệ thống hoạt động trong miền tuyến tính ợ g (cid:190) Giả sử chỉ đo được góc lệch và vị trí xe (cid:190) Có nhiễu tác động vào hệ thống. Nhiễu đo vị trí xe có phương
sai là 0.01; nhiễu đo góc lệch con lắc có phương sai 0.001
ể
⇒ Dùng lọc Kalman để ước lượng trạng thái và lọc nhiễu ễ
(cid:145) Thiết kế dùng Matlab: (cid:145) Thiết kế dùng Matlab: (cid:190) >> K = lqr(A,B,Q,R) (cid:190) >> L = lqe(A,G,C,QN,RN) %G là ma trận đơn vị
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
125
Thiết kế bộ điều khiển LQG Thiết kế bộ điều khiển LQG
0
0
10
0
0
Q Q
= =
00
100
0
70
. 1356
22
. 1091
10
. 000
. 0514 11
]
−K⇒ [ =
−
−
−
00
1
0
(cid:145) Bộ điều khiển LQR (cid:145) Bộ điều khiển LQR 01 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣
1=R
(cid:145) Bộ lọc Kalman
Q
000001 I
.0=N
.6 .21
5617 5437
.0 .0
L
=
⇒
=
NR
001.0 001 0 0
0 0 ⎤ ⎤ ⎥ 01.0 ⎦
⎡ ⎡ ⎢ ⎣
− − .0 0 .0
5713 5713 9568
1470 1470 0271
.0 0 .1
0571 ⎤ ⎥ 1876 ⎥ ⎥ ⎥ ⎥ ⎦
⎡ ⎢ ⎢ ⎢ ⎢ − ⎢ ⎣− (Do ta giả sử không có nhiễu hệ thống nên chọn QN rất bé. Hai thành (Do ta giả sử không có nhiễu hệ thống nên chọn Q rất bé Hai thành phần của RN chính là phương sai của nhiễu đo lường)
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
126
Mô phỏng điều khiển LQG hệ con lắc ngược Mô phỏng điều khiển LQG hệ con lắc ngược
22 March 2011
© H. T. Hoàng - ÐHBK TPHCM
127
MỘT SỐ CÔNG THỨC CẦN NHỚ MỘT SỐ CÔNG THỨC CẦN NHỚ MỘT SỐ CÔNG THỨC CẦN NHỚ MỘT SỐ CÔNG THỨC CẦN NHỚ
22 March 2011
© H. T. Hoàng - HCMUT
129
Nghiệm của phương trình vi phân bậc 1 Nghiệm của phương trình vi phân bậc 1
tax tax
+ +
0)( 0)( = =
(cid:145) Phương trình vi phân bậc 1 đồng nhất : (cid:145) Phương trình vi phân bậc 1 đồng nhất :
tx )( )( tx&
(cid:145) Nghiệm tổng quát:
atCe −
=)( tx
(cid:145) Hằng số C được xác định dựa vào điều kiện biên. á đị h d
à điề kiệ biê
ố C đ
Hằ
22 March 2011
© H. T. Hoàng - HCMUT
130
Nghiệm của phương trình vi phân bậc 1 (tt) Nghiệm của phương trình vi phân bậc 1 (tt)
(cid:145) Phương trình vi phân bậc 1 không đồng nhất : (cid:145) Phương trình vi phân bậc 1 không đồng nhất :
txtp )()(
tq )(
+
=
tx )( &
tqt )()(
Cdt +
μ
tx )(
= ∫
(cid:145) Nghiệm tổng quát:
t )(
μ dt
)( tp
trong đó:
)(μ t
∫= ∫ e
(cid:145) Hằng số C được xác định dựa vào điều kiện biên. (cid:145) Hằng số C được xác định dựa vào điều kiện biên
22 March 2011
© H. T. Hoàng - HCMUT
131
Nghiệm của phương trình vi phân bậc 2 Nghiệm của phương trình vi phân bậc 2
tcx tcx
+ +
+ +
0)( 0)( = =
(cid:145) Phương trình vi phân bậc 2 đồng nhất : (cid:145) Phương trình vi phân bậc 2 đồng nhất :
txa )( )( txa &&
txb )( )( txb &
(cid:145) Nghiệm tổng quát:
(cid:190) Trường hợp 1: (cid:190) Trường hợp 1:
ac ac
0 0
b b
> >
=Δ Δ tp 1
42 4 − tp 2
(
a )2/()
b Δ±−=
)( tx
+
=
p với 2,1
eC 2
eC 1
(cid:190) Trường hợp 2:
b
ac
0
=Δ
=
42 − pt
pt
)2/( a
p −= b
)( tx
=
+
với
eC 1
teC 2
(cid:190) Trường hợp 3:
b
ac
0
=Δ
42 −
<
t α
t α
)( tx
sin
cos
β
t β
=
eC 1
eCt + 2
)2/( a
Δ−=β
Với và
)2/( a
b−=α
(cid:145) Hằng số C1 và C2 được xác định dựa vào điều kiện biên.
22 March 2011
© H. T. Hoàng - HCMUT
132
Nghiệm của phương trình vi phân bậc 2 Nghiệm của phương trình vi phân bậc 2
)( tcx tcx )(
d d
+ +
+ +
= =
(cid:145) Phương trình vi phân bậc 2 không đồng nhất : (cid:145) Phương trình vi phân bậc 2 không đồng nhất :
)( txa txa )( &&
)( txb txb )( &
x
z +=
(cid:145) Nghiệm tổng quát:
d c
trong đó z(t) là nghiệm của phương trình vi phân đồng nhất:
tcz tcz
+ +
+ +
0)( 0)( = =
tza )( )( tza &&
tzb tzb )( )( &
(cid:145) Hằng số C1 và C2 được xác định dựa vào điều kiện biên.
22 March 2011
© H. T. Hoàng - HCMUT
133
Nghiệm của phương trình trạng thái Nghiệm của phương trình trạng thái
t )( )( t
Ax Ax
t )( )( t
B B
tu )( )( tu
= =
+ +
(cid:145) Phương trình vi phân bậc 1: (cid:145) Phương trình vi phân bậc 1:
x x &
x
x
Điều kiện đầu:
0
n
),...,
T )] )]
ℜ∈ ℜ∈
trong đó: trong đó:
2
( tx n tx (
x x A
=t 0 ) ( )( [ ( )( ), txtx ( t txtx )( [ )( t = = 1 nn ×ℜ∈
t
(cid:145) Nghiệm : (cid:145) Nghiệm :
)( t t )(
) )
( t t (
x
()( ()( t t t t x
Φ= Φ
) ) u τ B B
d )( )( d ττ
0
∫ ∫ Φ+ −Φ+
t
0
(cid:145) Trong đó:
t
te A=Φ )(
A
1 −
−
Cách 1:
e
s
t )( =Φ
AI ) −
t L =
{ (
}1
2
n
−
t A
Cách 2:
e
C
C
C
I
t )( =Φ
=
+
+
+
+
[
] A
[
] A
[
] 1 A
C 1
0
2
n
1 −
K
det(
0) =
− AIλ
thay các trị riêng λi của ma trận A (nghiệm của ) vào phương trình trên sẽ tính được các hệ số Ci
22 March 2011
© H. T. Hoàng - HCMUT
134
Nghiệm của phương trình trạng thái (tt) Nghiệm của phương trình trạng thái (tt)
(cid:145) Các trường hợp riêng của phương trình vi phân bậc 1: (cid:145) Các trường hợp riêng của phương trình vi phân bậc 1:
t )(
Ax
t )(
=
(cid:190) Nếu B=0:
x &
) )
t tA − ( (
t 0t 0
t )( )(
) )
t ( (
) )
x
()( t t ()( x
x
Φ= Φ
A= e
0
0
Ax Ax
t )( )( t
B B
= =
+ +
(cid:190) Nếu u=1: (cid:190) Nếu u=1:
t )( )( x x t&
t
)( t
)
( t
d
)
x
()( t t x
Φ=
−Φ+
ττ B
0
∫
t0 t
22 March 2011
© H. T. Hoàng - HCMUT
135
Tổng kết chương Tổng kết chương
á bài t á điề khiể tối
độ
Sau khi học xong chương 3, sinh viên phải có khả năng: (cid:145) Giải bài toán tối ưu động không ràng buộc và có ràng buộc (cid:145) Thành lập các bài toán điều khiển tối ưu động (cid:145) Thà h lậ (cid:145) Giải bài toán tối ưu động liên tục dùng phương pháp biến phân (cid:145) Giải bài toán tối ưu rời rạc dùng phương pháp qui hoạch động (cid:145) Giải bài toán tối ưu rời rạc dùng phương pháp qui hoạch động (cid:145) Thiết kế bộ điều khiển LQR, bộ lọc Kalman, bộ điều khiển LQG
22 March 2011
© H. T. Hoàng - HCMUT
136

