Điều khiển tối ưu: Lý thuyết điều khiển nâng cao

MônMôn họchọc

LÝ THUYẾT ĐIỀU KHIỂN NÂNG CAO LÝ THUYẾT ĐIỀU KHIỂN NÂNG CAO

ê

Giảng viên: TS. Huỳnh Thái Hoàng Bộ môn Điều Khiển Tự Động Khoa Điện – Điện Tử Đại học Bách Khoa TP HCM Đại học Bách Khoa TP.HCM Email: hthoang@hcmut.edu.vn Homepage: http://www4.hcmut.edu.vn/~hthoang/

22 March 2011

Chương 33gg Chương

ĐIỀU KHIỂN TỐI ƯU ĐIỀU KHIỂN TỐI ƯU

22 March 2011

NộiNội dung

dung chương

chương 33

ố

ề

ể

ế

(cid:145) Giới thiệu (cid:145) Giới thiệu (cid:145) Tối ưu hóa tĩnh (cid:145) Tối ưu hóa động và phương pháp biến phân (cid:145) Điều khiển tối ưu liên tục dùng phương pháp biến phân (cid:145) Phương pháp qui hoạch động Bellman (cid:145) Điều khiển tối ưu toàn phương tuyến tính LQR (cid:145) Ước lượng trạng thái tối ưu (lọc Kalman) (cid:145) Điều khiển tối ưu LQG (cid:145) Điề khiể tối LQG

22 March 2011

GIỚI THIỆU GIỚI THIỆU

22 March 2011

Giới thiệu Giới thiệu

(cid:145) Điều khiển tối ưu là bài toán xác định luật điều khiển cho hệ thống (cid:145) Điều khiển tối ưu là bài toán xác định luật điều khiển cho hệ thống động cho trước sao cho tối thiểu hóa một chỉ tiêu chất lượng.

(cid:145) Điều khiển tối ưu được phát triển trên cơ sở toán học: phương pháp biến phân được phát triển bởi các nhà toán học như Bernoulli, Euler, Lagrange, Weiertrass,…

(cid:145) Từ những năm 1950, điều khiển tối ưu phát triển mạnh mẽ và trở (cid:145) Từ những năm 1950 điều khiển tối ưu phát triển mạnh mẽ và trở

thành một lĩnh vực độc lập. Các phương pháp điều khiển tối ưu quan trọng nhất là: (cid:142) Phương pháp quy hoạch động do Richard Bellman (1920-1984)

đưa ra trong thập niên1950.

(cid:142) Nguyên lý cực tiểu Pontryagin do Lev Pontryagin (1908-1988) (cid:142) Nguyên lý cực tiểu Pontryagin do Lev Pontryagin (1908 1988)

và các đồng sự đưa ra trong thập niên 1950.

(cid:142) Bài toán điều chỉnh toàn phương tuyến tính và lọc Kalman do

ọ

Rudolf Kalman (b. 1930) đưa ra trong những năm1960.

22 March 2011

Phân loại bài toán điều khiển tối ưu Phân loại bài toán điều khiển tối ưu

(cid:145) Có nhiều bài toán điều khiển tối ưu, tùy theo: (cid:145) Có nhiều bài toán điều khiển tối ưu tùy theo:

(cid:142) Loại đối tượng điều khiển Miền thời gian liên tục hay rời rạc (cid:142) Miền thời gian liên tục hay rời rạc (cid:142) Chỉ tiêu chất lượng (cid:142) Bài toán tối ưu có ràng buộc hay không

(cid:145) Điều khiển tối ưu tĩnh: chỉ tiêu chất lượng không phụ thuộc thời gian

(cid:145) Điều khiển tối ưu động: chỉ tiêu chất lượng phụ thuộc thời gian (cid:142) Bài toán chỉnh toàn phương tuyến tính (Linear Quadractic (cid:142) Bài t á t

ế tí h (Li

Q d

hươ

hỉ h t à Regulator – LQR)

(cid:142) Bài toán điều khiển tối ưu H2 2 (cid:142) …

22 March 2011

Ứng dụng Ứng dụng

(cid:145) Trước khi máy tính số ra đời, chỉ có thể giải được một số ít bài toán (cid:145) Trước khi máy tính số ra đời chỉ có thể giải được một số ít bài toán

điều khiển tối ưu đơn giản

(cid:145) Máy tính số ra đời cho phép ứng dụng lý thuyết điều khiển tối ưu

g ụ g ý

p p vào nhiều bài toán phức tạp.

(cid:145) Ngày nay, điều khiển tối ưu được ứng dụng trong nhiều lĩnh vực:

(cid:142) Không gian (aerospace) (cid:142) Điều khiển quá trình (proccess control) (cid:142) Robot (cid:142) Robot (cid:142) Kỹ thuật sinh học (bioengineering) Kinh tế (cid:142) Kinh tế (cid:142) Tài chính (cid:142) …

22 March 2011

TỐI ƯU HÓA TĨNH TỐI ƯU HÓA TĨNH

22 March 2011

Tối ưu hóa tĩnh không ràng buộc Tối ưu hóa tĩnh không ràng buộc

(cid:145) Bài toán tối ưu tĩnh không ràng buộc: tìm m thông số thực (hay phức) (cid:145) Bài toán tối ưu tĩnh không ràng buộc: tìm m thông số thực (hay phức)

u1, u2,…, um sao cho hàm L(u1, u2,…, um) đạt cực tiểu:

( 1

( ) L(u)=L(u1, u2,…, um) → min 2 trong đó u=[u1, u2,…, um]T

( )

ụ

ọ

ộ

(

)

(cid:145) Điểm u* được gọi là điểm cực tiểu cục bộ nếu L(u)≥L(u*) với mọi u

ự ợ gọ nằm trong lân cận ε của u*.

(cid:145) Điểm u* được gọi là điểm cực tiểu toàn cục nếu L(u)≥L(u*) với mọi u

22 March 2011

Điều kiện cực trị không ràng buộc Điều kiện cực trị không ràng buộc

(cid:145) Giả sử L(u) khả đạo hàm theo u thì điều kiện cần và đủ để u* là (cid:145) Giả sử L(u) khả đạo hàm theo u, thì điều kiện cần và đủ để u là

điểm cực tiểu cục bộ là:

( *uuL ( ) = 0) u *uuu L > 0) (

⎧ ⎨ ⎨ ⎩

g trong đó:

uL ∂∂ 1 uL ∂∂

L =u u

L ∂ u ∂

M M uL ∂∂

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

∂

uuL ∂ 11

uuL ∂ 21

uuL ∂ 1

L ∂ 2 u ∂

2 2

∂ ∂

M uuL ∂ ∂

∂ ∂

M uuL ∂ ∂ 1

M uuL ∂ ∂ mm

⎡ ⎡ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎤ ⎥ ⎥ ⎥ ⎥ ⎦

22 March 2011

Thí dụ 1 Tìm cực trị không ràng buộc –– Thí dụ 1 Tìm cực trị không ràng buộc

u 2 2 u

u 3 3 u

L L

+ +

2 =u 5)( u 5)( =u u 1

2 2

uu 2 2 uu 21

u 8 8 u 1

2 u

7222

−=

⇒

Lu u

L ∂ u ∂ ∂

u 4

2 =+

3889

−=

u 2 1

⎧ 10 u ⎪ 1 ⎨ ⎨ ⎪ ⎪⎩ +

* ⎧ 1u ⎪ ⎨ ⎨ * * ⎪ ⎪⎩ 2u

(cid:145) Tìm cực trị hàm: (cid:145) Tìm cực trị hàm: (cid:145) Giải: (cid:145) Điều kiện cần có cực trị: L ∂ ⎤ ⎡ ⎥ ⎢ u ∂ 1 = ⎥ ⎢ L L ∂ ∂ ⎢ ⎥ ⎢ ⎥ ⎢ 2 ⎥ u ⎣∂ ⎦

2 2

0>uuL⇒ 0>L⇒

uuL⇒ L⇒

Luu L

10 ⎡ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎦

(cid:145) Xét vi phân bậc hai: (cid:145) Xét vi phân bậc hai: 2 L L ∂ ∂ 2 u uu u uu ∂ ∂∂ ∂ ∂∂ 1 1 1 1 2 2 L L ∂ ∂ 2 uu u ∂∂ ∂ 2 1

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

.0(

7222

3889

)

.0; −

là điểm cực tiểu.

⇒

* * ( ) −=uu 2 1

22 March 2011

Thí dụ 1 Tìm cực trị không ràng buộc –– Thí dụ 1 Tìm cực trị không ràng buộc

7222 7222

3889 3889

) )

*u −=u 0( .0(

0; .0; −

250

200

150

100

-50 6

-2

-4

4 -4

u1 1

-6 -6

u2 u

22 March 2011

Tối ưu hóa tĩnh có ràng buộc Tối ưu hóa tĩnh có ràng buộc

(cid:145) Bài toán tối ưu tĩnh có ràng buộc: tìm vector thông số u sao cho hàm (cid:145) Bài toán tối ưu tĩnh có ràng buộc: tìm vector thông số u sao cho hàm

L(x,u) đạt cực tiểu, đồng thời thỏa điều kiện f(x,u)=0 (

) L(x,u) → min f(x,u)=0

trong đó x=[x1, x2,…, xn]T u=[u1, u2,…, um]T

L :

m ℜ→ℜ×ℜ

m ℜ→ℜ×ℜ:

ộ (cid:145) L(x,u) gọi là hàm đánh giá và f(x,u) là điều kiện ràng buộc

( , ) gọ

f( , )

ệ

22 March 2011

Hàm Hamilton Hàm Hamilton

(cid:145) Định nghĩa hàm Hamilton: (cid:145) Định nghĩa hàm Hamilton:

ux ,(

)

ux ,(

)

uxf ,(

)

T λ+

trong đó là vector hằng số, gọi là thừa số Larrange trong đó là vector hằng số gọi là thừa số Larrange

pℜ∈λ pℜ∈λ

Do ràng buộc f(x,u) = 0 nên cực tiểu của L(x,u) cũng chính là cực tiểu của H(x,u). tiểu của H(x u)

tiể khô

⇒ Biến đổi bài toán tìm cực tiểu hàm L(x,u) với ràng buộc f(x,u) = 0 thành bài toán tìm cực tiểu không ràng buộc hàm Hamilton H(x,u) thà h bài t á tì )

b ộ hà H ilt H(

(cid:145) Vi phân hàm Hamilton:

)

H ∂

)

u

x

,( ux

,( ux x ∂

,( ux u ∂

22 March 2011

Thừa số Lagrange Thừa số Lagrange

(cid:145) Do ta cần tìm cực trị theo u nên có thể tự do chọn thừa số Lagrange (cid:145) Do ta cần tìm cực trị theo u nên có thể tự do chọn thừa số Lagrange

sao cho:

) )

H H ∂ ∂

L L ∂ ∂

H H

ux ,( (

) )

0 0

T T λ λ

ux ,( ,( ux x ∂

uxf ,( ,( uxf ∂ ∂ x ∂

ux ,( ,( ux x ∂

1 −

) )

Tλ

−=

⇒

uxL ( ,( uxL ∂ ⎡∂ ⎡ ⎢ x ∂ ⎣

uxf uxf ,( ( ⎡∂⎤ ∂ ⎤ ⎡ ⎥ ⎢ x ∂ ⎦ ⎣

⎤ ⎤ ⎥ ⎦

Viết gọn lại:

ế

T λ

] 1− ] 1

[ [ L f x

22 March 2011

−=

Độ dốc của hàm mục tiêu với điều kiện ràng buộc Độ dốc của hàm mục tiêu với điều kiện ràng buộc

) )

L L ∂ ∂

(cid:145) Vi phân hàm mục tiêu: (cid:145) Vi hâ hà

tiê

dL dL

,( ( ux

d d

x

d d u

) )

)

(cid:145) Do f(x,u) = 0 nên: f( , )

d x x d d u u d

,( ,( d d uxf uxf

) )

0 0

1 −

+ + = =

,( ux ux ,( u ∂ ,( uxf ∂ u ∂ )

u

x

−=

⇒

,( ux ux ,( x ∂ ,( uxf ∂ x ∂ ,( uxf ) ∂ x x ∂ ∂

,( uxf ∂ u u ∂ ∂

⎤ ⎥ ⎦ ⎦

⎡ ⎢ ⎣ ⎣

(cid:145) Thay (2) vào (1), ta được:

−

)

L ∂

dL dL

,( ux ux (

d u u d

u u

d d

−=) ) −=

+ +

,( uxf ∂ u ∂

,( ux u ∂

)

H ∂

)

,( uxf x ∂ L ∂

,(⇒ dL

⇒

ux

u

) )

(

,( ux ,( dL d u ) ) = +

ux ,( u∂ ∂

,( ux ⎡∂ ⎢ ⎢ x ∂ ⎣ ,( ) uxf ∂ u ∂ ∂

⎡ T λ ⎢⎣ ⎢⎣ ⎤ ⎥⎦ ⎥⎦

⎤ ⎥ ⎥ ⎦ ,( ux u ∂ ∂ ⇒Với điều kiện f(x,u)=0, độ dốc của L(x,u) theo u chính bằng Hu(x,u) ⇒ Điều kiện để L(x,u) đạt cực trị với ràng buộc f(x,u) 0 là: ⇒ Điều kiện để L(x u) đạt cực trị với ràng buộc f(x u)=0 là:

22 March 2011

0) =uxuH ,(

Điều kiện cần cực trị có ràng buộc Điều kiện cần cực trị có ràng buộc

(cid:145) Kết hợp với điều kiện xác định hằng số Lagrange điều kiện cần để (cid:145) Kết hợp với điều kiện xác định hằng số Lagrange, điều kiện cần để

=uxf

L(x,u) đạt cực trị có ràng buộc là:

0) 0) = 0) = uxf ,( f ( x ,( uxf u

ux ,( ) ) ( ,( ux ) ,( ,( ) ) ux = = =

T Tλ L ux ,( ( L ) ) λ + T L ,( ux ) λ + u f uxf ,( ,( ) 0) =

H H H u λH λ ⎧ ⎧ ⎪ ⎨ ⎪⎩ ⎩

Tλ+

22 March 2011

trong đó: H ux ,( ) L ux ,( ) f ux ,( ) =

Thí dụ 1 Tìm cực trị có ràng buộc –– Thí dụ 1 Tìm cực trị có ràng buộc

(cid:145) Tìm cực trị hàm:

2 2 =u 5)(L L u 5)( 1

2 2 2

ị hà Tì u 2 2 u 3 3 + + + + uu 2 2 21 u 8 8 1

u 6

=−

u 1

(cid:145) Giải:

(cid:145) Hàm Hamilton: Hà H il

Với điều kiện ràng buộc: f u )(

Tλ+

H u )( L u )( f u )( =

2 u 5)( = 1

2 2

22 March 2011

u⇒ H u 2 u 3 u 6 )2 + + + + + + − uu 2 21 u 8 1 ( u λ 1

Thí dụ 1 Tìm cực trị có ràng buộc –– Thí dụ 1 Tìm cực trị có ràng buộc

(cid:145) Điều kiện cần để có cực trị: (cid:145) Điều kiện cần để có cực trị:

u 2 8 0 = + =++ λ u 10 1

H = 0)(uH u 0)( =

⇒

u 0)( =

u 4 63 0 = + ++ λ = u 2 1

)( H u ∂ u u ∂ ∂ 1 )( H u ∂ u ∂

u = 0)(uf 0)( f u =

⎧ ⎧ ⎪ ⎨ ⎪ ⎩ ⎩

2 2 f u )(

u 6 02 = + =− u 1

5353

.0−=λ

8412

(cid:145) Giải hệ phương trình, ta được: (cid:145) Giải hệ h ]T [ * −=u 4735

t ì h t đ

H u 2 u 3 u 6 )2 + + + + + + −

2 u 5)( u = 1

2 2

22 March 2011

uu 2 21 u 8 1 u ( λ 1

Thí dụ 1 Tìm cực trị có ràng buộc –– Thí dụ 1 Tìm cực trị có ràng buộc

8412 8412

.0 0

[ [ * =u .0−=u 0

] ]T 4735 4735

250

200

150

100

-50 6

-2

-4

4 -4

u* *

-6 -6

22 March 2011

u1 1 u2 u

Thí dụ 2 Tìm cực trị có ràng buộc –– Thí dụ 2 Tìm cực trị có ràng buộc

2 2

(cid:145) Tìm cực trị hàm:

ị hà Tì uxL (L ),( ) ( ( x )2 )2 u ( ( )2 )2 = − + −

32 +

−

(cid:145) Giải:

(cid:145) Viết lại điều kiện ràng buộc:

Với điều kiện ràng buộc:

32 +

−

x⇔

32 +

=−−

(cid:145) Hàm Hamilton: (cid:145) Hà H ilt

uxH ),(

uxL ),(

uxf ),(

Tλ+

2 2

⇒

uxH ),(

(

u (

)

( λ

−

6 −−

22 March 2011

ộ g ệ ạ

Thí dụ 2 Tìm cực trị có ràng buộc –– Thí dụ 2 Tìm cực trị có ràng buộc

(cid:145) Điều kiện cần để có cực trị: (cid:145) Điều kiện cần để có cực trị:

−

2)2 +

λλ +

⇒

u (2

−

λ =−

= 0),( uxH x uxH u 0),( uxf

0),(

⎧ ⎪ ⎪ ⎨ ⎪ ⎩

),( uxH ∂ x ∂ ),( uxH ∂ u ∂ uxf ( ),( uxf )

x x

3 3

x x

6 6

u u

0 0

2 + +

=−−

)22.8;68.1(),04.2;71.1(),92.0;53.4( )228;681()042;711()920;534(

(cid:145) Giải hệ phương trình, ta được ba nghiệm: −

−=ux ) ),( ( =ux

−

u ),(

u (

(

L x

−

(cid:145) Thay 3 nghiệm trên vào hàm mục tiêu ,ta

x − được các giá trị tương ứng là: 43.78; 0.087; 117.94. được các giá trị tương ứng là: 43 78; 0 087; 117 94

(cid:145) Kết luận: cực trị cần tìm là

(

)

)04.2;71.1(

* * =ux

uxH ),(

(

u (

)

−

6 −−

( λ

22 March 2011

Thí dụ 3 Tìm cực trị có ràng buộc –– Thí dụ 3 Tìm cực trị có ràng buộc

2 2

(cid:145) Tìm cực trị hàm:

ị hà

Tì

L (L

2 3 2 x 3 + 1

2 2 2

Với các điều kiện ràng buộc:

x ),( u )

xf u ),( 0 =

(cid:145) Giải:

(cid:145) Hàm Hamilton: (cid:145) Hà H ilt

f 1 f x u ),( ),( x u x 4 + − 2 u 2 ++ x 2 1 x 1 ⎡ ⎢ ⎣ ⎤ =⎥ ⎦ ⎡ ⎢ ⎣ ⎤ =⎥ ⎦

T λ+

2 2

H L u ),( ),( u x ),( u x xf =

2 2 x 1

2 2 2

22 March 2011

x⇒ H u ),( 3 x u 2( x )4 ( )2 = + + + + − + u ++ λ 1 x 1 λ 2 x 1

Thí dụ 3 Tìm cực trị có ràng buộc –– Thí dụ 3 Tìm cực trị có ràng buộc

(cid:145) Điều kiện cần để có cực trị: (cid:145) Điều kiện cần để có cực trị:

x 1

2 λλ + 2

λ 1

H x u ),( ∂ x ∂ 1 u ),( H x ∂ x ∂

H 0),( u x =

H H ∂ ∂

u 2

λ 2

⇒ H 0),( u ),( x =

u u u = 0),( xf

⎧ ⎪ ⎨ ⎨ ⎪ ⎩

2 u x ),( ( ) u ∂ ),( ),( x u

=−

f f 1 1 f

x ),( u

x 2 2 1 1 =++

x 1

ợ

5714

1429

* −=u

g (cid:145) Giải hệ phương trình, ta được: .0

, 8514

5714

* =x

[ .5−=λ

ệ p [ .1

L L

),( ),( u u x x

u x

2 3 3 x x + + 2 2 ),( u x

(

+ + =

−

2 x x (cid:145) Do là hàm toàn phương nên cực trị tìm được là hàm toàn phương nên cực trị tìm được (cid:145) Do 1 1 3 )2 H x + + ở trên cũng chính là cực tiểu

λ 2

λ 1

2 2

22 March 2011

u ++ u u 2 x 1 x 1 x 1

TỐI ƯU HÓA ĐỘNG TỐI ƯU HÓA ĐỘNG TỐI ƯU HÓA ĐỘNG TỐI ƯU HÓA ĐỘNG VÀ PHƯƠNG PHÁP BIẾN PHÂN VÀ PHƯƠNG PHÁP BIẾN PHÂN

22 March 2011

Tối ưu hóa động không ràng buộc Tối ưu hóa động không ràng buộc

(cid:145) Bài toán tối ưu động không ràng buộc: tìm vector hàm x(t) sao cho (cid:145) Bài toán tối ưu động không ràng buộc: tìm vector hàm x(t) sao cho

x )( )( x

J J

L L

t t ), )

dt dt

min min

→ →

xx xx ,( ( &

)( t

x

trong đó:

ℜ∈

]

phiếm hàm J(x) đạt cực tiểu: = ∫ ft ∫t )( tx 2

[ )( tx 1

)( n tx

L :

n ℜ→ℜ×ℜ×ℜ

Chú ý: Phiếm hàm là hàm của hàm l

(functional = function of function) (f )

f f

)( xJ

(cid:145) Phiếm hàm có cực tiểu cục bộ tại nếu J

x (( t

* t * (

))

x

(

≥

)(* tx )) )(* tx

)(tx

với mọi hàm nằm trong lân cận εcủa

x

t )(

x

* t )(

−

ε≤

22 March 2011

Tìm cực trị phiếm hàm? Tìm cực trị phiếm hàm?

(cid:145) Nhắc lại cực trị hàm: (cid:145) Nhắ l i

t ị hà

(cid:190) Điều kiện cần: đạo hàm bậc 1 của hàm cần tìm cực trị bằng 0

⇒ điểm dừng ⇒ điểm dừng

(cid:190) Điểm dừng có đạo hàm bậc 2 xác định dương

ự

⇒ điểm cực tiểu

(cid:145) Cực trị phiếm hàm?

(cid:190) Khái niệm biến phân (variation): có thể hiểu là đạo hàm của (cid:190) Khái niệm biến phân (variation): có thể hiểu là “đạo hàm của

phiếm hàm”

(cid:190) Phương pháp biến phân (Calculus of Variation): dựa vào khái

ế

niệm biến phân đưa ra điều kiện cực trị của phiếm hàm tương tự ề như điều kiện cực trị hàm

22 March 2011

Khái niệm biến phân Khái niệm biến phân

x )(

(

x

)

x )(

(cid:145) Lượng gia của phiếm hàm: (cid:145) Lượng gia của phiếm hàm: =

J Δ

x δ

−

)(tx )(tx

)(txδ )(txδ

trong đó là biến phân của hàm trong đó là biến phân của hàm

)(tx )(tx x t )(

t )(

x δ+

)(tx

Minh họa biến phân của hàm

x )( )( x

x x

) )

J J

( (

x x

)] )]

(cid:145) Biến phân của phiếm hàm: J J J J δ Δ δ Δ

= =

+ +

x x δ δ

−

lim lim x 0 δ →

J ([ lim ([ J lim x 0 δ →

22 March 2011

Thí dụ tính biến phân phiếm hàm Thí dụ tính biến phân phiếm hàm

(cid:145) Cho phiếm hàm:

ế

xJ )(

2 tx )(

∫= ∫

(cid:145) Biến phân của phiếm hàm được tính như sau: (cid:145) Biến phân của phiếm hàm được tính như sau: 1

txJ ([

)]

xJ (

)

xJ )(

(

)

x )(

x δ

−

x δ x +

−

∫

[

(

2 ])

x )(

(

2 ])

xx x δδ +

−

xx x δδ +

∫

0 0

⇒

)( xJ

(

2 ])

xx x + δδ

lim x 0 → δ

∫→ lim x 0 δ

0 0

⇒

)( xJ

dtxx ] δ

∫ ∫=

22 March 2011

Công thức tính biến phân phiếm hàm dạng tích phân Công thức tính biến phân phiếm hàm dạng tích phân

(cid:145) Cho phiếm hàm dạng tích phân tổng quát:

ế

ổ ft

J J

x )( )( x

L L

x )( )( x

dt dt

∫ ∫=

ạ g (cid:145) Biến phân của phiếm hàm dạng tích phân được tính như sau:

ợ

)( x

J δ

∫ ∫

)( L x ∂ ⎡ ⎢ x x ∂ ⎣ ∂ ⎣

⎤ x δ ⎥ ⎦ ⎦

⎧ ⎨ ⎩ ⎩

⎫ ⎬ ⎭ ⎭

22 March 2011

Biến phân phiếm hàm bài toán tối ưu động không ràng buộc Biến phân phiếm hàm bài toán tối ưu động không ràng buộc

(cid:145) Phiếm hàm:

Phiế

hà

J J

x )( )(

L L

), t )

dt d

xx ,( ( & &

∫ ft ∫= f

(cid:145) Biến phân phiếm hàm:

), t

L ∂

J δ

x δ

x δ &

t∫

xx ,( & x ∂

⎡ ⎢ ⎣ ⎣

⎤ dt ⎥ ⎦ ⎦

xx ,( & x ∂ &

(cid:145) Chú ý rằng:

t )(

)(

t (

)

x δ

x d δττδ

x &

= ∫ x ) δ =

x δ

0) =

t ( 0

ft (

), (cid:145) Thực hiện biến đổi tích phân (sử dụng công thức tích phân từng phần),

ụ g

g p

ệ

(

ự suy ra:

), t

L ∂

J J δ δ

= =

−

∫ ∫

Ld ∂ dt

xx ,( & x ∂

⎡ ⎢ ⎢ ⎣

⎤ x dt dt x δ δ ⎥ ⎥ ⎦

xx ,( & x ∂ &

22 March 2011

Điều kiện cần để phiếm hàm đạt cực trị cục bộ Điều kiện cần để phiếm hàm đạt cực trị cục bộ

)(* tx )(tx

đạt cực trị cục bộ tại

)( xJ )( xJ

phân của phải bằng 0 tại

(cid:145) Điều kiện cần để phiếm hàm đạt cực trị cục bộ tại là biến (cid:145) Điều kiện cần để phiếm hàm là biến )(* tx )( xJ

Jδ )(

x = 0)(

xx= xx

(cid:145) Suy ra, điều kiện cần để bài toán tối ưu động không ràng buộc có

cực trị là: cực trị là:

t ),

L ∂

⇔

−

d dt dt

xx ,( & x x ∂ ∂

L ∂ x x ∂ ∂

L ∂ x x ∂ ∂ &

xx ,( & x x ∂ ∂ &

Phương trình trên được gọi là phương trình Euler-Lagrange.

(cid:145) Trường hợp đặc biệt khi L không phụ thuộc tường minh vào t, dạng (cid:145) Trường hợp đặc biệt khi L không phụ thuộc tường minh vào t dạng

), t

−

J J δ δ

L L

−

x & &

Ld ∂ dt

⎤ x dt dt x δ δ ⎥ ⎥ ⎦

đơn giản của phương trình Euler-Lagrange là: xx ,( ), t L ∂ ⎡ & ∫ ∫ = = ⎢ ⎢ (c là hằng số) ( ố) là hằ x ∂ ⎣ t

xx ,( & x ∂ &

L L ∂ ∂ x ∂ &

22 March 2011

Thí dụ 1 Tối ưu hóa động không ràng buộc –– Thí dụ 1 Tối ưu hóa động không ràng buộc

(cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: (cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: 2/ π [

2 tx )(

xJ )(

min

)]

→

−

2 tx ( &

= ∫

(,1)0(

3)2/ =

0 0 = πx

Với điều kiện biên:

(cid:145) Giải:

(cid:145) Theo đề bài, ta có:

xL =

x &− (cid:145) Phương trình Euler-Lagrange:

−

⇒

−

0=+ x

( −

) 0 =

x &

x&&⇒

L ∂ x ∂

⎞ 0=⎟ ⎠

L ∂ x ∂ &

d dt (cid:145) Lời giải tổng quát:

⎛ ⎜ ⎝ ổ

d dt sin

)( tx

cos

Ct +

C 1

(cid:145) Thay điều kiện biên, suy ra:

C 1

= C ,3 2

(cid:145) Kết luận:

cos

sin3)(* tx =

22 March 2011

Thí dụ 2 Tối ưu hóa động không ràng buộc –– Thí dụ 2 Tối ưu hóa động không ràng buộc

(cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: (cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu:

0)2(,1)0(

= x

xJ )(

min

→

với điều kiện biên:

2 tx )( &

= ∫

0 0

(cid:145) Giải:

(cid:145) Phương trình Euler-Lagrange:

−

d dt

L ∂ x ∂

⎞ 0=⎟ ⎟ ⎠ ⎠

L ⎛ ∂ ⎜ ⎜ x ⎝ ∂ ⎝ & 1

−

x &&

x &

xx &&&

1 1

+ +

x x &

⇒

0=x&&⇒

d d dt

⎞ ⎞ 0⎟ ⎟ 0 =⎟ ⎠

x &

⎛ ⎛ ⎜ ⎜ ⎜ ⎝ (cid:145) Lời giải tổng quát:

x x & + x & g q

tx )( )( tx

CtC CtC +

1 1

2 2

(cid:145) Thay điều kiện biên, suy ra:

C ,

−=

C 1

1 2

(cid:145) Kết luận: ế

)(* tx

−=

1 x &+

1 1 2

22 March 2011

Tối ưu hóa động có ràng buộc Tối ưu hóa động có ràng buộc

(cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên (cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên

đoạn [t0, tf] sao cho phiếm hàm J(x) đạt cực tiểu:

J J

x )( )( x

t t ), )

dt dt

min min

L L

→ →

xx xx ,( ( &

0),

với điều kiện ràng buộc

= ∫ ft = ∫t =txxf ,( &

trong đó: trong đó:

và điều kiện biên: x(t0)=x0, x(tf)=xf

x )(x t t )(

= =

ℜ∈ ℜ∈

[ [ tx tx )( )( 1

tx tx )( )( 2

] ] Ttx n tx )( )(

L :

n ℜ→ℜ×ℜ×ℜ

n ℜ→ℜ×ℜ×ℜ:f

22 March 2011

Hàm Hamilton và điều kiện cần để có cực trị Hàm Hamilton và điều kiện cần để có cực trị

(cid:145) Định nghĩa hàm Hamilton: (cid:145) Định nghĩa hàm Hamilton:

t ),

T λ

, (

xx, &

xxf ,( &

xx ,( & p p

t ℜ∈)(λ t ℜ∈)(λ

0),

)( x

t ),

=txxf (cid:145) Do ràng buộc nên cực tiểu của &

,( xx &

t t

cũng chính là cực tiểu của là vector hàm gọi là thừa số Larrange trong đó là vector hàm, gọi là thừa số Larrange trong đó ∫= 1 dt

)( x

t ),

, ,( λxx &

), 0),

∫= 1 ( )

ộ g ự ⇒ Biến đổi bài toán tìm cực tiểu J(x) với ràng buộc

,(f ,( =txxf & thành bài toán tìm cực tiểu không ràng buộc phiếm hàm

(cid:145) Điều kiện cần để phiếm hàm có cực trị là:

)( xJ

), t

H ∂

−

ự p ệ ị )( xJ )(

xx ,( & x ∂

xx ,( & x ∂ &

d dt (Phương trình Euler-Lagrange của bài toán tối ưu động có ràng buộc)

22 March 2011

Tối ưu hóa động có ràng buộc dạng tích phân Tối ưu hóa động có ràng buộc dạng tích phân

(cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên (cid:145) Bài toán tối ưu động có ràng buộc: tìm vector hàm x(t) xác định trên

đoạn [t0, tf] sao cho phiếm hàm J(x) đạt cực tiểu:

J J

L L

t t ), )

dt dt

min min

x x )( )(

→ →

xx xx ,( ( &

), t

q

với điều kiện ràng buộc

xxf ,( &

= ∫ ft ∫t ∫

và điều kiện biên: x(t0)=x0, x(tf)=xf

g (cid:145) Hàm Hamilton và phương trình Euler-Lagrange trong trường hợp ràng g ợp p g g g g

(cid:190) Hàm Hamilton:

buộc tích phân như sau:

t ),

T λ

, (

xx ,( &

xx, &

xxf ,( &

(cid:190) Phương trình Euler-Lagrange:

t ),

H ∂

−

0= 0

Hd ∂ dt

xx ,( & x ∂

xx ,( & x ∂ &

22 March 2011

Trình tự giải bài toán tối ưu động có ràng buộc Trình tự giải bài toán tối ưu động có ràng buộc

(cid:145) Bước 1: Xác định hàm mục tiêu, điều kiện ràng buộc và điều kiện (cid:145) Bước 1: Xác định hàm mục tiêu điều kiện ràng buộc và điều kiện

J J

biên từ yêu cầu của bài toán tối ưu hóa

x )( )( x

L L

), t t )

dt dt

xx xx ,( ( &

∫= ∫=

t),

q

txxf ,( ),

t =dt

Điều kiện ràng buộc hoặc

xxf ,( &

∫

x

x =t ( 0 ) Điều kiện biên và

t ),

T T λ

( ft x (cid:145) Bước 2: Thành lập hàm Hamilton: xx ,( H &

xx ,( &

xxf ,( &

), t

H ∂

−

(cid:145) Bước 3: Viết phương trình Euler-Lagrange: xx xx ,( ,( , & & x x ∂ ∂ &

d dt (cid:145) Bước 4: Tìm nghiệm phương trình Euler-Lagrange thỏa điều kiện (cid:145) Bước 4: Tìm nghiệm phương trình Euler Lagrange thỏa điều kiện

22 March 2011

ràng buộc và điều kiện biên

Thí dụ 1 Tối ưu hóa động có ràng buộc –– Thí dụ 1 Tối ưu hóa động có ràng buộc

(cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu: (cid:145) Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu:

xJ )(

min

→

2 tx )( &

= ∫

0 4

tx )(

∫ 0 0 x 0)4(,0)0(

với điều kiện ràng buộc:

(cid:145) Giải: (cid:145) Giải:

(cid:145) Hàm Hamilton:

t t ), )

txxL L ,( ( ), t )

λ λ

f txxf ,( ( ), ) t λ λ

xxH H ,( ( &

⇒

t ),

2 tx )(

tx )(

xxH ,( &

= &

22 March 2011

và điều kiện biên:

Thí dụ 1 Tối ưu hóa động có ràng buộc –– Thí dụ 1 Tối ưu hóa động có ràng buộc

(cid:145) Phương trình Euler Lagrange: (cid:145) Phương trình Euler-Lagrange:

), t

−

d dt

,( xxH ∂ & x ∂ &

λ⇒ −

} 0 =

{ )(2 tx &

,( xxH ∂ & x ∂ d dt 0)(2

tx&&λ⇒ −

(cid:145) Tìm nghiệm phương trình Euler-Lagrange:

)(

=tx&&⇒(1)

tx )(

c 1

&⇒

2 2

⇒

tx )( )( t

tc t 1

t ),

2 tx )(

tx )(

λ λ 2 λ λ t 2 λ t t 4

xxH ,( &

= &

22 March 2011

(1)

Thí dụ 1 Tối ưu hóa động có ràng buộc –– Thí dụ 1 Tối ưu hóa động có ràng buộc

(cid:145) Xác định các hằng số dựa vào điều kiện ràng buộc và điều kiện biên: (cid:145) Xác định các hằng số dựa vào điều kiện ràng buộc và điều kiện biên:

⇒

)0(

2 =c

c 1

λ 4

)4(

4 λ

c 4 1 =

1 =c

4 4

⇒ ⇒

)( tx

c 8 1

∫

−=λ

c 1 2

16 λ 3

⎤ ⎤ =⎥ ⎦

λ ⎡ ⎡ ⎢ 12 ⎣

9 8 9 8

(cid:145) Kết luận:

* tx )(

−=

9 32

9 8

)( tx

tc 1

λ 2λ 2 t 4

22 March 2011

Thí dụ 2 Tối ưu hóa động có ràng buộc –– Thí dụ 2 Tối ưu hóa động có ràng buộc

x x

)( t t )( =

[ [ )( tx tx )( 1=

]Ttx ]tx (cid:145) Tìm vector hàm (cid:145) Tìm vector hàm sao cho phiếm hàm dưới đây sao cho phiếm hàm dưới đây )( )( 2 đạt cực tiểu:

)1 )1

x x

min min

J x J x )( )(

−

+ +

→ →

[ [ (5 (5

] ] dt dt

x x 1 1

2 2 2

∫ = ∫

t ),

−

x 1

x & 1

với điều kiện ràng buộc: 2 0 &xx ,(

;0)0( =

1)2( =

x 1

(cid:145) Giải: (cid:145) Giải:

(cid:145) Hàm Hamilton:

t t ), )

txxL L ,( ( ), t )

λ λ

f txxf ,( ( ), ) t λ λ

xxH H ,( ( &

⇒

t ),

(5[

]

)

−

( λ

−

x 1

2 2

x 1

xxH ,( &

x & 1

22 March 2011

và điều kiện biên:

Thí dụ 2 Tối ưu hóa động có ràng buộc –– Thí dụ 2 Tối ưu hóa động có ràng buộc

(cid:145) Phương trình Euler Lagrange: (cid:145) Phương trình Euler-Lagrange:

⇒

2)1

+−

λλ &

=−

−

(10 1 x

−

⇒

=−λx 2 2

(1)

d dt d dt

H ∂ x ∂ 1 1 H ∂ x ∂

H ∂ x ∂ & 1 1 H ∂ x ∂ &

(cid:145) Tìm nghiệm phương trình Euler-Lagrange thỏa điều kiện ràng buộc:

(2)

ề

⇒

x 2 λ = ⎧ 2 ⎨ 22xλ x 2 &λ ⎩ = = & ⎩ Thay (3) vào (1):

(3) (2)

(10

x 1

x 2 =

2 2

(4)

Từ điều kiện ràng buộc, suy ra: ề (5)

x &

)

x − (6)

y ( )

x 1

x x 0)2 x 0)2 x + + = && & 1 1 1 1 2 2 x x ] ( λ + + & 1 2

x 4 = − & 2 x 2x x x 2 + + & 1 1 1 1 x x & && 1 1 x (4)2 x (4)2 − 1 1 (5[ x )1 − 10 0 = 1

+ + = +

(10 (10 x 4 && 1

4)1 +− x x ⎧ ⎧ ⎨ ⎩ x x (4)1 x x (4)1 + +− & 1 1 1 1 ,( xxH , t ), λ & x x 4 18 + − & 1 1

22 March 2011

Thay (5) vào (4): ( ) ⇒

Thí dụ 2 Tối ưu hóa động có ràng buộc –– Thí dụ 2 Tối ưu hóa động có ràng buộc

679.2

679.1

−

556.0

tx )( 1

eC 1

eC 2

Nghiệm tổng quát của phương trình (6) N hiệ t ì h (6) át ủ hươ tổ

;0)0( =

1)2( =

x 1

⇒

.0 572 −= .0 0 = 0155 0155

556 .28 28

0 = C C 732 732

.0 0

556 556

1 1

C ⎧ 1 ⎨ ⎨ 2C C ⎩ ⎩

.02 + C C + 1

CC + ⎧ 1 ⎨ ⎨ .0 0047 0047 0 ⎩ ⎩

679.2

−

Thay điều kiện biên ề

⇒

572.0

679.1 e 0155

556.0

−=

tx )( 1

(7)

2 2

Thay (7) vào (5):

679.2

−

2x 1 1

679.1 e 057.0

x = & 1 1 e 388.0)( =

⇒

tx 2

22 March 2011

112.1

ĐIỀU KHIỂN TỐI ƯU LIÊN TỤC ĐIỀU KHIỂN TỐI ƯU LIÊN TỤC DÙNG PHƯƠNG PHÁP BIẾN PHÂN DÙNG PHƯƠNG PHÁP BIẾN PHÂN

22 March 2011

Bài toán điều khiển tối ưu liên tục Bài toán điều khiển tối ưu liên tục

(*)

xf (( t

t )(

))

t (

u

(cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: (cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: x &

)( t t )(

),...,

T T )] )]

( t ), )( ( t txtx )(

x

trong đó: t đó : vector trạng thái thái t t

u

)( t

),...,

T )]

(

( t n tx ( ( m tu

: vector tín hiệu điều khiển

[ [ 1= [ tutu ), ( 1= x

2 x

x

=) )

)0( )0( (cid:145) Trạng thái đầu: , trạng thái cuối:

( ( ft

hái đầ hái T

(cid:145) Chỉ tiêu chất lượng:

ối ft

x (( t

))

x (( t

u

( t

)

u φ )( =

∫ ∫+

(cid:145) Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(t) sao cho: ft

J J

x (( t (( x t

)) ))

L L

x )(( t (( ), x t

u u

t )( ( ), t

t t

) )

dt dt

min min

u φ )( u φ )( =

→ →

∫ + ∫ +

(cid:145) Nghiệm x*(t) của phương trình vi phân (*) ứng với tín hiệu điều

22 March 2011

ố ố ể khiển tối ưu u*(t) gọi là quỹ đạo trạng thái tối ưu.

Phân loại bài toán điều khiển tối ưu Phân loại bài toán điều khiển tối ưu

(cid:145) Khoảng thời gian xảy ra quá trình tối ưu là tf , có thể phân loại: (cid:145) Khoảng thời gian xảy ra quá trình tối ưu là t có thể phân loại:

(cid:142) Bài toán tối ưu có tf cố định, ví dụ:

(cid:131) Điều khiển đoàn tàu hỏa giữa 2 ga với lịch trình xác định sao Điều khiển đoàn tàu hỏa giữa 2 ga với lịch trình xác định sao cho năng lượng đoàn tàu tiêu thụ là thấp nhất;

(cid:131) Điều khiển quá trình chuyển đổi hóa học trong thời gian cho

(cid:142) Bài toán tối ưu có tf không cố định, ví dụ:

(cid:131) Điều khiển tên lửa lên độ cao xác định với thời gian nhanh (cid:131) Điều khiển tên lửa lên độ cao xác định với thời gian nhanh

trước với chi phí thấp nhất hấ ới hi hí hấ ớ

(cid:131) Điều khiển tàu biển đi được xa nhất với một nguồn năng

nhất

22 March 2011

lượng cố định cho trước

Phân loại bài toán điều khiển tối ưu (tt) Phân loại bài toán điều khiển tối ưu (tt)

(cid:145) Các bài toán điều khiển tối ưu động có trạng thái đầu x0 cho trước. (cid:145) Các bài toán điều khiển tối ưu động có trạng thái đầu x cho trước

(cid:131) Điều khiển tên lửa lên độ cao lớn nhất; (cid:131) Điều khiển tàu biển đi được xa nhất với một nguồn năng

Trạng thái cuối quá trình tối ưu là xf =x(tf), có thể phân loại: (cid:142) Điểm cuối tự do, ví dụ:

(cid:131) Điều khiển tên lửa vào quỹ đạo với thời gian nhanh nhất. (cid:131) Điều khiển tên lửa vào quỹ đạo với thời gian nhanh nhất

lượng cố định cho trước l ớ ố đị h h (cid:142) Điểm cuối bị ràng buộc, ví dụ:

(cid:142) Điểm cuối cố định cho trước, ví dụ: (cid:131) Điều khiển ghép nối các con tàu ể g ép ố các co tàu (cid:131) Điều khiển hệ thống về trạng thái cân bằng

22 March 2011

ều

Giải bài toán ĐK toán tối ưu dùng PP biến phân Giải bài toán ĐK toán tối ưu dùng PP biến phân

(cid:145) Bài toán điều khiển tối ưu động liên tục có thể phát biểu lại như sau: (cid:145) Bài toán điều khiển tối ưu động liên tục có thể phát biểu lại như sau:

u )(

x (( t

))

x (( t

u

( t

)

0 0

t (

u

∫+ )

min t )( u x t )( &

x

xf (( t = với điều kiện =t 0 ) ( trong đó t0, tf, và cho trước

(cid:145) Kết hợp đ.kiện ràng buộc vào hàm mục tiêu dùng thừa số Lagrange:

J J

u )( )( u

x (( (( t t x

)) ))

L L

x )(( (( ), t t x

u u

( t ), )( t

t t

) )

xf xf (( )(( ), t t

u u

( t t (

)) ))

)( t t )(

= =

φ φ

+ +

T λ λ

− −

[ [ )( t t )(

] ] dt dt

x x &

∫ ∫

(cid:145) Định nghĩa hàm Hamilton:

tH )(

t ),

t )(

t ),

ux ,(

uxf ,(

T λ+

L ft t

u )(

x (( t

))

[

)( tH

−

⇒

t x ])( &λ

∫

Jδ

0)( u =

⇒ Cần tìm u*(t) sao cho:

uu =

22 March 2011

Điều kiện cần để có lời giải bài toán điều khiển tối ưu Điều kiện cần để có lời giải bài toán điều khiển tối ưu

(cid:145) Biến phân của phiếm hàm mục tiêu: (cid:145) Biến phân của phiếm hàm mục tiêu:

)( t

−

J δ

T λ

T & λ

u δ

]

[ T x λ δ

∫

∂ φ x ∂

H ∂ x ∂

H ∂ u ∂

⎡ ⎛ ⎜ ⎢ ⎝ ⎝ ⎣ ⎣

t t

t t = f =

⎤ ⎥ ⎦ ⎦ (cid:145) Chú ý là do điều kiện đầu cố định; nếu điểm

0)(

=uJδ

ể ầ

⎤ ⎞ ⎞ x x δ δ ⎟ ⎟ ⎥ ⎠ ⎠ ⎠ ⎠ ⎦ ⎦ =ftxδ ( 0) ( 0 =txδ 0) ≠ftxδ ) 0 ( cuối ràng buộc, nếu điểm cuối tự do (cid:145) Để với mọi cần có các điều kiện: uδ

)

t ( φ ∂

tT )(λ&

−=

) )

T λ

( f ( t f

∂H ∂u ∂

ề H ∂ x∂ ∂

x∂ ∂

(cid:145) Lưu ý:

)

t ( φ ∂

(cid:190) Điều kiện chỉ cần đối với bài toán điểm cuối tự do.

) )

T ( ftλ t ( λ f

ự ệ

x∂

)(tλ

(cid:190)

)) ))

[ [

được gọi là đồng trạng thái của hệ thống

t x (( ((

J J

−

φ φ

T T t dt d x ])( ])( λ &λ

t)(λ&

−=

(cid:190)

∫ ∫

tH H u )( )( )( )( được gọi là phương trình đồng trạng thái

H ∂H ∂ x∂

22 March 2011

Trình tự giải bài toán điều khiển tối ưu Trình tự giải bài toán điều khiển tối ưu

u u

) )

t t )( )(

t t xf xf )(( (( ),

t t )( ( ),

t t

(cid:145) Bước 1: Viết PTTT mô tả đối tượng: (cid:145) Bước 1: Viết PTTT mô tả đối tượng:

x x&

(cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên từ yêu cầu thiết kế

(cid:190) Bài toán điểm cuối tự do: ể

ố

u )(

x (( t

))

x (( t

u

( t

)

f f

∫ ∫+

min )(u u )( t t

x

=t 0 ) (

(cid:190) Bài toán điểm cuối ràng buộc:

Điều kiện đầu:

ố ể

u )( )( u

u u

) )

J J

L L

t t x )(( (( ), x

t t ( ), )(

t t

dt dt

∫= ∫=

min min u )( t

x

=t 0 ) (

( ft

22 March 2011

Điều kiện đầu và điều kiện cuối

Trình tự giải bài toán điều khiển tối ưu Trình tự giải bài toán điều khiển tối ưu

tH )( )( tH

L L

ux ux ,( (

t t ), )

t )( )( t

uxf uxf ,( (

t t ), )

T λ+ λ+

(cid:145) Bước 3: Thành lập hàm Hamilton: (cid:145) Bước 3: Thành lập hàm Hamilton:

(cid:145) Bước 4: Viết điều kiện cần để có lời giải tối ưu:

t )( )( t

PT trạng thái: PT trạng thái:

xf xf t )(( (( ), t

u u

t )( ( ), t

t t

) )

= =

x x &

−=

tT )(λ&

PT đồng trạng thái:

H ∂ x∂ x∂

Điều kiện dừng:

Điều kiện đầu:

x

H ∂ u ∂ =t 0 ) x (

x

ft ( f

f f

)

t ( φ ∂

(Bài toán điểm cuối cố định) ệ Điều kiện cuối:

t (

)

T λ

hoặc (Bài toán điểm cuối tự do)

x∂

(cid:145) Bước 5: Giải hệ phương trình ở trên sẽ tìm được u*(t) và x*(t)

22 March 2011

Thí dụ 1 Điều khiển tối ưu –– Thí dụ 1 Điều khiển tối ưu

ty )((2

tu )(

(cid:145) Đặc tính động học nhiệt độ lò sấy cho bởi phương trình: (cid:145) Đặc tính động học nhiệt độ lò sấy cho bởi phương trình: −=

−

) a +

ty )( &

trong đó y(t) là nhiệt độ phòng và ya = 250C là nhiệt độ môi trường; 25 C là nhiệt độ môi trường; trong đó y(t) là nhiệt độ phòng và ya u(t) là cường độ dòng nhiệt cấp lò sấy và t là thời gian (giờ)

(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) điều khiển nhiệt độ nhiệt độ lò sấy sao cho sau một giờ đạt đến càng gần nhiệt độ đặt yd = 750C ấ ầ càng tốt và tối thiểu năng lượng tiêu tốn.

(cid:145) Giải: (cid:145) Giải:

(cid:145) Bước 1: Thành lập phương trình trạng thái:

tx tx )( )(

ty ty )( )(

−

ế

ay y

tx )(2

tu )(

−=

⇒ Phương trình trạng thái của lò sấy là:

tx )( &

)1( )1(

50 0

−

Đặt biến trạng thái: Đặt biến trạng thái:

⇒ Trạng thái cuối mong muốn: ố

22 March 2011

ố

Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu

(cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên: (cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên:

2 tu )(

min

tx ([

)

]

uJ )(

−

→

∫

1 2

Theo yêu cầu thiết kế là trạng thái cuối x(tf ) càng gần xf =50 càng tốt, đồng thời tối thiểu năng lượng tiêu tốn, suy ra hàm mục tiêu:

(Đây là bài toán tối ưu điểm cuối tự do) ố ố ể

Điều kiện đầu:

trong đó ρlà trọng số tùy chọn (muốn trạng thái cuối càng gần xf thì chọn ρcàng lớn) chọn ρcàng lớn) x 0 (cid:145) Bước 3: Định nghĩa hàm Hamilton: (cid:145) Bước 3: Định nghĩa hàm Hamilton:

ux ,( ,

t ),

t )(

ux ,(

t ),

⇒

t ),

tx )(2)[

tu (

)]

−

λux ,( ,

t ( λ

L ux ,( 1 1 2 2 tu )( 2

22 March 2011

Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu

(cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu (cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu

tx )(2

tu )(

−=

tx )( &

PT trạng thái: (1)

−=)(λ& t

⇒

)( t & λ =

)(2 t λ

H H∂ ∂ x ∂

(2) PT đồng trạng thái:

t 0)( 0)( =

)( λ tu )( λ +

⇒

H ∂H ∂ u ∂

tx tx ( (

) )

0 0

Điều kiện dừng: Điề kiệ dừ (3)

= x x 0

)

( t φ ∂

(4) (4) Điều kiện đầu: Điề kiệ đầ

)(( )1((

) )50

)( ρ )1( xρλ =

−

⇒

) )

( ( t λ

f f

x ∂

t ),

tx )(2)[

tu (

)]

−

λux ,( ,

( t λ

1 1 2 2 tu )( 2

22 March 2011

Điều kiện cuối: ( ) (5)

Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu

(cid:145) Bước 5: Giải phương trình vi phân (cid:145) Bước 5: Giải phương trình vi phân

(cid:190) Nghiệm phương trình (2):

)( =λ )(λ t

teC tC 2 2 1

(cid:190) Thay (6) vào (3):

)( tu

−=

(6) (6)

2 teC 1

(cid:190) Thay (7) vào (1), ta được: (cid:190) Thay (7) vào (1) ta được:

(7)

)(2

−=

teCtx 2 −

tx )( &

−

⇒

tx )(

−=

eC 2

C C 1 4

tu )(

(8)

tu t )( 0)( λ + = tx tx )( )(2 −= + )( )(2 t t & λ = λ &

22 March 2011

(1) (3) (2)

Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu

(cid:190) Xác định các hằng số dựa vào điều kiện biên: (cid:190) Xác định các hằng số dựa vào điều kiện biên:

)1( )1(

50 50

− −

0)0( = ( ( xρ )1( )1( x = = ρ

) )

x ⎧ ⎨ λ λ ⎩ ⎩

−

C 1 C + 4 4

⇒

−

2 eCe + 2

C 1 4

⎞ ⎟ ⎠

⎛ ρ ⎜ ⎝

⎧ ⎪⎪ ⎪ ⎨ ⎨ ⎪ eC 1 ⎪ ⎩

−

4/)

−

⇒ ⇒

−

4/)

50 ρ 2 ( e ρ +− 5.12 ρ 2 ( e ρ +−

−

⎧ C ⎪⎪ 1 ⎨ ⎨ ⎪ C ⎪ ⎩

22 March 2011

Thí dụ 1 (tt) Điều khiển tối ưu –– Thí dụ 1 (tt) Điều khiển tối ưu

(cid:190) Kết luận: Tín hiệu điều khiển và quỹ đạo trạng thái tối ưu là:

)( tu

−=

2 teC 1

−

tx )(

−=

eC 2

C 1 4

22 March 2011

ố ế ề ể

Thí dụ 2 Điều khiển tối ưu –– Thí dụ 2 Điều khiển tối ưu

(cid:145) Cho hệ thống xe – lò xo như hình (cid:145) Cho hệ thống xe lò xo như hình vẽ. Quan hệ vào ra của hệ thống mô tả bởi phương trình vi phân:

tky )(

tu )(

tym )( &&

( )

g ( ị ệ ệ ); y( )

(cid:145) Bài toán đặt ra là thiết kế luật điều khiển u(t) để điều khiển xe từ

trong đó u(t) là tín hiệu vào (lực điều khiển); y(t) là tín hiệu ra (vị trí ( ự xe); m = 1kg là khối lượng xe, k = 2 N/cm là độ cứng lò xo.

ê hái đứ hái đứ i ố ê i ị

(cid:145) Yêu cầu:

trạng thái đứng yên tại gốc tọa độ đến trạng thái đứng yên tại vị trí í độ đế cách gốc tọa độ 10cm trong khoảng thời gian 1 giây, đồng thời tối thiểu năng lượng tiêu tốn. g g

(cid:190) Hãy thành lập bài toán tối ưu cho yêu cầu thiết kế trên. (cid:190) Viết điều kiện cần để có lời giải tối ưu

22 March 2011

y ập y

Thí dụ 2 Điều khiển tối ưu –– Thí dụ 2 Điều khiển tối ưu

(cid:145) Giải: (cid:145) Giải

(cid:145) Bước 1: Viết phương trình trạng thái của đối tượng

txty )( ( ), )( )(

(cid:190) Đặt các biến trạng thái ế

tx )( )( 1

ty )( )( &= &

(cid:190) Phương trình trạng thái mô tả đối tượng

tu )(

0 1 02

−

⎡ ⎡ ⎢ ⎣

⎤ ⎤ =⎥ ⎦

⎡⎤ ⎡ ⎤ ⎢ ⎥ ⎦ ⎣

0 ⎡ ⎤⎡ ⎤ ⎢ ⎥ 1 ⎣ ⎦ { B

A

t )(

x

)( )( tx tx ⎡ ⎡ ⎤ ⎤ & 1 1 +⎥ ⎢ )( )( tx tx & ⎦ ⎣ 2 2 32143421321 x&

t )(

tu )(

Ax

B

x &

22 March 2011

Thí dụ 2 Điều khiển tối ưu –– Thí dụ 2 Điều khiển tối ưu

(cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên: (cid:145) Bước 2: Xác định hàm mục tiêu và điều kiện biên:

(cid:190) Yêu cầu thiết kế là trạng thái xe tại thời điểm tf = 1 đứng yên tại vị trí 10cm (điểm cuối ràng buộc) đồng thời tối thiểu năng lượng tiêu ốtốn,

2 tu )(

min

uJ )(

→

suy ra hàm mục tiêu:

1 ∫ = ∫ 2 0 2

)0( )0(

,0 0

y y

x x

(cid:190) Từ dữ kiện của đề bài, có thể xác định được điều kiện biên: = =

0)0( 0)0( = =

= =

(Bài toán tối ưu điểm cuối ràng buộc) điểm cuối ràng buộc)

Điều kiện đầu: Điều kiện đầu:

)1(

,10

)1(

2 x

x x 1 x 1

y y & y 0)1( = &

(cid:145) Bước 3: Thành lập hàm Hamilton: (cid:145) Bước 3: Thành lập hàm Hamilton:

Điều kiện cuối:

,( , ux

t ),

t )(

,( uxf

t ),

), t =λ

T λ+

⇒

ux ,( ,

t ),

Ax

t )(

B

T T λ

[ [ t )(

])( ] tu

,( L ux 1 1 2 2 tu )( 2

22 March 2011

Thí dụ 2 (tt) Điều khiển tối ưu –– Thí dụ 2 (tt) Điều khiển tối ưu

(cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu (cid:145) Bước 4: Điều kiện cần để có nghiệm tối ưu

t )(

Ax

t )(

B

tu )(

PT trạng thái: (1)

x &

⇒

t )(

& λ

(2) (2) PT đồng trạng thái: ồ

A−=

t)(λ&

−=

H ∂H ∂ x∂

tu )( )(

TλB TλB

t 0)( 0)( =

⇒

0= 0

∂H ∂ u ∂

Điều kiện dừng: Điề kiệ dừ (3) (3)

(4)

x

)0( =

Điều kiện đầu: Điề kiệ đầ ]T0;0 [

ề

(5)

x

)1( =

Điều kiện cuối: ố ]T0;10 [

ux ,( ,

t ),

Ax

t )(

B

T T λ

[ [ t )(

])( ] tu

1 1 2 2 tu )( 2

22 March 2011

Thí dụ 2 (tt) Điều khiển tối ưu –– Thí dụ 2 (tt) Điều khiển tối ưu

(cid:145) Bước 5: Giải phương trình vi phân (cid:145) Bước 5: Giải phương trình vi phân

A

(cid:190) Nghiệm phương trình (2): ( ( t −

−

A A

−

t )1( )1( t −

f f

t )( )( t

) )

)1( )1(

λ λ

) ) t ( ( t λ λ

λ λ

(cid:190) Nghiệm phương trình (3): T

(6) (6)

tu )(

t )(

TλB−=

−

tu )(

T e

(7)

B

)1(

−=

(cid:190) Thay (6) vào (7): (6) à (7) (cid:190) Th A t )1( λ−

(cid:190) Thay (8) vào (1), ta được:

(8)

A

−

t )(

(9)

Ax

t )(

BB

T e

)1(

−

t )1( λ−

x&

22 March 2011

…..

PHƯƠNG PHÁP QUI HOẠCH ĐỘNG PHƯƠNG PHÁP QUI HOẠCH ĐỘNG PHƯƠNG PHÁP QUI HOẠCH ĐỘNG PHƯƠNG PHÁP QUI HOẠCH ĐỘNG

22 March 2011

Nguyên lý tối ưu Bellman Nguyên lý tối ưu Bellman

(cid:145) Phương pháp qui hoạch động (DP – Dynamic Programing) do (cid:145) Phương pháp qui hoạch động (DP Dynamic Programing) do

(cid:145) Phương pháp qui hoạch động là một thuật toán xác định dãy giá trị

Bellman đề xuất (1957) g p p q y g g

(cid:145) Nguyên lý tối ưu: Mỗi đoạn cuối của quỹ đạo trạng thái tối ưu cũng

là một quỹ đạo trạng thái tối ưu. là một quỹ đạo trạng thái tối ưu

Đoạn 2

{u(k)} tối ưu để tối thiểu chỉ tiêu chất lượng J.

xN

Đoạn 3

Đoạn 1

xk

x0

Minh họa nguyên lý tối ưu Bellman

22 March 2011

Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP

(cid:145) Tìm đường ngắn nhất đi từ A đến J, cho biết mạng lưới đường như (cid:145) Tìm đường ngắn nhất đi từ A đến J cho biết mạng lưới đường như

(cid:145) Nguyên lý tối ưu Bellman: tìm đường ngắn nhất ngược từ nút đích (cid:145) Nguyên lý tối ưu Bellman: tìm đường ngắn nhất ngược từ nút đích

hình vẽ.

22 March 2011

đến nút đầu.

Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP

(cid:145) Phân bài toán tìm đường thành các bước từ 1 đến 5 (cid:145) Phân bài toán tìm đường thành các bước từ 1 đến 5 (cid:145) Ký hiệu Nki là nút thứ i ở bước k

N31 N

N21 N

N41

N11

N32

N51

N22

N42

N33

N23

22 March 2011

Bước 1 Bước 2 Bước 3 Bước 4 Bước 5

Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP

(cid:142)

kiN

(cid:142)

ki , ,

) )

là khoảng cách ngắn nhất từ nút đến nút đích J

j j

kN 1+ là khoảng cách từ nút đến nút ,1+ k

(cid:145) Ký hiệu: (cid:145) Ký hiệu: (* k NJ ) ( ( ki NNd ki

k k

,1 j 1 j

+ +

(cid:145) Phương trình Bellman:

(

)

(

)

})

kiN ki { NNd ki

* NJ ( k

* 1 k +

min j

(cid:145) Dễ thấy chính là đường đi ngắn nhất

)

* 1 NJ ( 11

22 March 2011

ấ ễ ấ ắ

Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP

(cid:145) Giải PT Bellman qua 2 vòng:

(cid:190) Vòng ngược: đi ngược từ nút cuối về nút đầu tìm đoạn đường cuối (cid:190) Vò ối

ối ề út đầ tì từ út đ ờ đi đ

(cid:190) Vòng xuôi: đi từ nút đầu đến nút cuối → đường đi tối ưu

22 March 2011

ngắn nhất

Thí dụ tìm đường ngắn nhất dùng DP Thí dụ tìm đường ngắn nhất dùng DP

(cid:145) Vòng ngược:

(

(cid:190) Bước 5: bắt đầu từ nút đích

=NJ 51

(cid:190) Bước 4: từ nút

* 5 42N

41N

)

(

3) =

(

)

ắ

NNd 41 NNd 42

* NJ ( 4 * * NJ ( 4

22 March 2011

hoặc chỉ đơn giản đi đến nút đích vì không có lựa chọn nào khác. Đoạn đường ngắn nhất từ một nút ở bước 4 là: ấ * NJ ( 5 * * NJ ( 5

Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)

(cid:190) Bước 3: có nhiều lựa (cid:190) Bước 3: có nhiề lựa chọn, từ nút N3i phải chọn đường đi đến đích qua nút N4j nào tối ưu đoạn quỹ đạo * ?) cuối ? cuối iNJ iNJ ( ( ) 3 3 3 3

)

(

)

})

* NJ ( 3

{ NNd 3 i

* NJ ( 4

min j j

)

(

)

Từ

)

* iNJ ( 3 3

NNd , 3 i 41N 41 4

* ( NJ 4 4 42N 42 8

Quyết định đi đến

9 7 7

N41 (H) N42 (I) 42 N41 (H)

31N 32N 33N

22 March 2011

6 7 6

Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)

(cid:190) Bước 2: tìm đưởng tối (cid:190) Bước 2: tìm đưởng tối ưu từ nút N2i đến nút đích N51 (tức nút J), sử dụng kết quả tối ưu đoạn cuối tìm được ở bước 3

* ) 4 =NJ ( 3 31 * * ( 7) NJ = 3 * NJ 6) ( = 3

)

(

)

})

* NJ ( 2

{ NNd 2 i

* NJ ( 3

min j

* NJ ( 3

Từ

)

* iNJ ( 2 2

ố ế

( NNd 2 i 31N 31 11

) 3 j 32N 32 11

) 3 j 33N 33 12

Quyết định đi đến

31N

32N

7 9 10 7

hoặc 31N 31 hoặc

32N

21N 22N 22 23N

31N

22 March 2011

8 8 11 8

Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)

(cid:190) Bước 1: tìm đường tối (cid:190) Bước 1: tìm đường tối

) 11 = 7) 7) = = 8) =

* NJ ( 2 * NJ ( ( NJ 2 * ( NJ 2

ố

)

(

)

})

* NJ ( 1

{ NNd 11

* NJ ( 2

min j j

* NJ ( 2

Từ

)

* 1 NJ (

ưu từ nút N11 (tức nút A) đến nút đích N51 (tức nút J), sử dụng kết quả tối ế ưu đoạn cuối tìm được ở bước 2 bước 2

( NNd 11 21N 21 13

) 2 j 22N 22 11

) 2 j 23N 23 10

Quyết định đi đến

23N

11N

22 March 2011

Thí dụ tìm đường ngắn nhất dùng DP (tt) Thí dụ tìm đường ngắn nhất dùng DP (tt)

(cid:145) Vòng xuôi: đi từ bước 1 đến bước 5 đế rút ra đường đi tối ưu

)

(cid:145) Kết luận: * * ) NNd ( NJ ( , NNd ) ( NJ ) ) , ( + + Từ Từ j j 3 4 4 4 3 3 j 2 i 3 j i * * iNJ ) iNJ ( ( N N N N N →→→→ Đường đi tối ưu: tức A→D→E→H→J 3 2 2 3 31N 33N 32N 42N 41N 51 31 11 23 41 33 32 31 42 41 hoặc: tức A→D→F→I→J * N N N N N →→→→ ) ) ( NNd NJ ( 11 23 32 42 51 4 8 4 11 12 11 11 2 j j 11 2 2 * 1 NJ ( 23N 21N 22N 7 9 7 10 9 7 10 10 11 13 8 11 8 8

32N

31N 21N Từ 32N 22N 22 11N 23N 33N

22 March 2011

6 7 6 Quyết định Quyết định ) đi đến đi đến Quyết định 31N N41 (H) 32N hoặc đi đến N42 (I) 31N 42 31 23N N41 (H) 31N hoặc

Bài toán điều khiển tối ưu động rời rạc Bài toán điều khiển tối ưu động rời rạc

))

(

(*)

x

(cid:145) Cho đối tượng mô tả bởi phương trình sai phân: (cid:145) Cho đối tượng mô tả bởi phương trình sai phân: k x ( )1 =+ kxkx ), ( ),...,

k )(

trong đó:

k u ), T )] : vector trạng thái

),...,

)( k

u

xf (( n kx ( ( m ku

[ 1= [ kuku ( ), ( 1= 2 x x )0( = (cid:145) Trạng thái đầu: , trạng thái cuối:

T )] : vector tín hiệu điều khiển x

x

(

N N

(cid:145) Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(k) sao cho: 1 −N

J J

( (

) )

L L

x )(( k (( ), x k

u u

( (

k k

)) ))

min min

= =

xφ xφ N N

+ +

→ →

∑ ∑

(

( , 0 ) ≠NN xφ , 0) =NN xφ

)(* kx )(kx

)(* ku )(ku

Chú ý: Bài toán tối ưu điểm cuối tự do

phụ thuộc

Bài toán tối ưu điểm cuối cố định (cid:145) Ý tưởng giải bài toán điều khiển tối ưu rời rạc dùng nguyên lý tối ưu Bellman: tìm kiếm nghiệm Bellman: tìm kiếm nghiệm phụ thuộc theo chiều ngược theo chiều ngược hướng quỹ đạo từ điểm cuối xN đến điểm đầu x0 22 March 2011

PP qui hoạch động giải bài toán ĐK tối ưu rời rạc PP qui hoạch động giải bài toán ĐK tối ưu rời rạc

(cid:145) Đặt hàm mục tiêu tối ưu cho đoạn quỹ đạo t.thái cuối kể từ điểm x(k) (cid:145) Đặt hàm mục tiêu tối ưu cho đoạn quỹ đạo t thái cuối kể từ điểm x(k)

1 −

x ((

))

x

(

)

x ),(( i

u

i ))(

−

* k

∑

(

min N ),..., ( u

u

)1 −

ki =

⎧ ( φ ⎨ ⎩ ⎩

⎫ , ( ⎬ ⎭ ⎭

))

((* J k x (cid:145) Biểu diễn dưới dạng:

−1

J J

x (( (( x

k k

)) ))

L L

x k (( ), )(( x k

u ( ( u

k k

)) ))

N N

x x

( (

N N

) )

x i ),(( )(( x i

u u

i ))( ))( i

= =

+ +

( ( φ φ

+ +

* k

∑ ∑

min min N ),..., ( u

( u

)1 −

L L ki 1 +=

⎧ ⎨ ⎨ ⎩

⎫ ⎬ ⎬ ⎭

))

x ((

u

(

))

x ((

} }))1

* x⇒ J (( k

* 1 k +

{ { L min )(ku )( k

⇒

x ((

))

x ((

u

(

))

(

x ((

u

(

})))

* k

* J ++ 1 k

(PT Bellman)

{ L min )( k u

x

)

(

( φ=

min

{ }J

((* x J N

))0((* N )) (cid:145) Dễ thấy: và x J 0

(cid:145) Giải N phương trình Bellman theo thứ tự sẽ tìm được (cid:145) Giải N phương trình Bellman theo thứ tự sẽ tìm được

0 0

1 →Nk = Nk 1 →−

22 March 2011

tín hiệu điều khiển tối ưu.

Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP

(cid:145) Đối tượng: (cid:145) Đối tượng:

( (

k k

x x

xf xf k )(( (( ), k

)) ))

u u

k k

( (

−

x

( (Nx

) )

,...,1,0 = ạ g

0 0

ạ g g

)1 )1 =+ =+ (* kku (cid:145) Yêu cầu thiết kế: Tìm tín hiệu điều khiển hệ )( )0( x thống từ trạng thái đầu đến trạng thái cuối sao cho tối thiểu chỉ tiêu chất lượng:

−N 1

, ,

) )

(( (( x

), ),

u

( (

)) ))

min

( ( xφ N φ

→

N N

∑ ∑

(cid:145) Bước 1: Viết phương trình Bellman:

J J

x (( ((

k k

)) ))

x )(( k (( ), k

u

( (

k k

)) ))

( (

f f

x )(( k (( ), k

u

( (

k k

}))) })))

* k

* J J ++ + 1 k

{ { L L min i k )( u

))

Với

x

)

( φ=

(

,...,1,0

−

((* x N

(cid:145) Bước 2: Giải phương trình Bellman qua 2 vòng:

)(kx

)(* ku

= Nk k 0

(cid:190) Vòng ngược: tìm phụ thuộc 1 →− 0 0x (cid:190) Vòng thuận: tính cụ thể từ điều kiện đầu N 1 −→=

22 March 2011

Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt)

(cid:137) Vòng ngược: tìm phụ thuộc x(k) (k=N−1→ 0), gồm các bước: (cid:137) Vòng ngược: tì

(k) (k N 1→ 0)

)(* k )(ku

h th ộ á bướ ồ

x ((

))1

),1

u

x

(

( φ+

−

( −Nx (cid:145) Tìm phụ thuộc là nghiệm bài toán tối ưu: { { L

})) }

(* −Nu * N

1 −

),1

u

(

))1

x

(

)

min )1 u N ( − x (( N

−

)(kx

(cid:145) Với :tìm phụ thuộc là nghiệm PT Bellman:

2 →−

= Nk

J J

với ràng buộc

x (( ((

k k

)) ))

x )(( k (( ), k

u

( (

k k

)) ))

( (

f f

x )(( k (( ), k

u

( (

k k

}))) })))

* k

* J J ++ + k 1

)(* ku { { L L min i k u )(

(.)

* 1+kJ

với là biểu thức hàm mục tiêu tối ưu tối ưu đoạn quỹ đạo

0 0

= =

)(* ku )(ku

(cid:153) Chú ý: để tìm , áp dụng PP tối ưu tĩnh, giải PT: (cid:153) Chú ý: để tìm áp dụng PP tối ưu tĩnh giải PT:

∂J k (.) ∂ ku )(

22 March 2011

cuối đã tìm được ở bước trước đó.

Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Trình tự giải bài toán ĐK tối ưu rời rạc dùng DP (tt)

(cid:137) Vòng xuôi: xác định giá trị cụ thể . Thực hiện các bước sau đây (cid:137) Vòng xuôi: xác định giá trị cụ thể Thực hiện các bước sau đây

)(* ku )(kku

)(* ku

(cid:190) Thay vào mô hình toán của đối tượng để tính được trạng

với k=0,1,2,….N−1: )(kx (cid:190) Gán vào công thức đã tính ở vòng ngược để được giá trị cụ thể của )(* ku

x

x ((

u

* k (

))

22 March 2011

thái tối ưu ở thời điểm (k+1) (k+1) thái tối ư ở thời điể )1 k f ( =+

Thí dụ 1 Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 Điều khiển tối ưu rời rạc dùng DP

(cid:145) Xét đối tượng là khâu quán tính bậc 1 có mô hình trạng thái: (cid:145) Xét đối tượng là khâu quán tính bậc 1 có mô hình trạng thái:

kx (

kx )(

ku )(

)1 =+

1 2

1 2 ố

(cid:145) Xác định tín hiệu điều khiển tối ưu để điều khiển hệ thống từ trạng

2 kx )( )( k

2 2 ku ( ( k

min i

)) ))

J J

→

ố ề ề ể ể

= ∑

(cid:145) Giải:

(cid:145) Phương trình Bellman:

ể thái đầu x(0)=4 đến trạng thái cuối x(4)=0 sao cho: 2∑ ( (

x ((

))

u

(

))

(

x ((

u (

x ((

})))

* k

* J ++ k 1

⇒

kx ((

))

2 ku )(

ku (5.0)(5.0(

(

→=k 0

}))

* k

* k 1 +

{ L min u k )( { 2 kx min )( ku )(

* ))4((* x 4

22 March 2011

với:

Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP

(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:

Vòng ngược: Với k = 3: Vòng ngược: Với k = 3: Phương trình Bellman:

J J

x ))3(( ))3(( x

)3( )3(

u u

+ +

0 0

})3( })3(

* 3

))4((*J (do ) (do ) J x ))4((4

{ { x x min min u )3(

)3(5.0)3(5.0 +

0)4( =

Điều kiện ràng buộc:

)3(

)3(*

−=

⇒ ⇒

J J

2 )3(2 )3(2

x x

= =

* x ))3(( ))3((3 x

22 March 2011

Lời giải: (để thỏa mãn điều kiện ràng buộc)

Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP

(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:

Vòng ngược: Với k = 2: Vòng ngược: Với k = 2: Phương trình Bellman:

(( ))2(( )) x

)( )2(

* 2 2

* 3 3

x ))2((

)2(

⇒

* 2

2 2

)2( )2(

))2( ))2(

2)2( 2)2( +

* ⇒ ))2((J⇒ x ))2(( 2

min i u )2(

1 2

})) }))3(( )2( )( J (( x })3(2)2( x ⎡ ⎡ ⎢ ⎣

⎤ ⎤ ⎥ ⎦

⎫ ⎪ ⎪ ⎬ ⎬ ⎪⎭

)2(

x ))2((

)2(

u )2()2(

⇒

* 2

3 2 2

{ { x min )2( u { x min )2( u ⎧ ⎪ ⎪ ⎨ ⎨ ⎪⎩ 3 ⎧ min ⎨ 2)2(u 2 ⎩ ⎩ u )2(

)2(3)2( +

)2(*

−=

⇒

J (.) ∂ 2 u )2( ∂

⎫ ⎬ ⎭ ⎭ )2( 3

⇒

)2(

x ))2((

)2(

−

* 2

)2( 3

1 2

)2( 3

⎛ −+ ⎜ ⎝

2 ⎞ +⎟ ⎠

⎛ ⎜ ⎝

⎞ ⎟ ⎠

⎤ ⎥ ⎦

⎡ ⎢ ⎣

x ))2((

)2(

* 2

⇒

4 4 3

22 March 2011

Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP

(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:

)1(

x ))1((

* 1

)1(

))1(( x

⇒

* 1

} }))2(( x ⎫ )2( x ⎬ ⎭

2 2

⇒

x ))1((

)1(

x )1((

))1(

* * 1

min u )1(

* J 2 4 3 4 14 1 ⎡ ⎡ ⎢ 2 3 ⎣

⎤ ⎤ ⎥ ⎦

⎫ ⎪ ⎪ ⎬ ⎬ ⎪⎭

(( ))1(( )) x

)( )1(

)()( )1()1( u

)( )1(

J⇒

* 1 1

4 3 3

2 3 3

4 3 3

)1(

)1(*

−=

⇒

8 3

Do:

Vòng ngược: Với k = 1: Vòng ngược: Với k 1: Phương trình Bellman: { { 2 J min x u )1( )1(u ⎧ min ⎨ ⎩ )1( u ⎧ ⎪ ⎪ ⎨ ⎨ ⎪⎩ ⎧ min ⎨ ⎨ ⎩ ⎩ u )1( 2 3

J (.)1 ∂ u )1( ∂

⎫ ⎬ ⎬ ⎭ ⎭ )1( 4

)1(

x ))1((

)1(

−

⇒

* 1

)1( 4

4 3

1 2

)1( 4

⎛ −+ ⎜ ⎝

2 ⎞ +⎟ ⎠

⎛ ⎜ ⎝

⎞ ⎟ ⎠

⎡ ⎢ ⎣

⎤ ⎥ ⎦

x ))1((

)1(

⇒

* 1

5 5 4

22 March 2011

Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP –– Thí dụ 1 (tt) Điều khiển tối ưu rời rạc dùng DP

(cid:137)(cid:137) Vòng ngược: (cid:137)(cid:137) Vòng ngược:

Vòng ngược: Với k 0: Vòng ngược: Với k = 0: Phương trình Bellman: u

x ))0((

)0(

* 0

⇒

)1(

)0(

))0(( x

* 0

min )0( u

}))1(( x ⎫ ⎬ ⎭

⇒

x ))0((

)0(

x )0((

))0(

* 0

min )0( u

* 1 5 4 5 15 1 ⎡ ⎡ ⎢ 2 4 ⎣

⎫ ⎪⎫ ⎪ ⎬ ⎪⎭

J⇒ J

x ))0(( ))0(( x

x x

)0( )0(

x x

u )0()0( )0()0( u

u u

)0( )0(

+ +

* 0 0

5 8

21 16

{ x min 1 10u < u < ⎧ ⎨ ⎩ ⎧ ⎪⎧ ⎪ ⎨ ⎪⎩ 21 ⎧ min min ⎨ ⎨ 16 ⎩ ⎩ u )0(

⎤ ⎤ ⎥ ⎦ ⎫ ⎬ ⎬ ⎭ ⎭

)0(

)0(*

−=

⇒

5 8 8

J (.) ∂ 0 )0(u∂ )0( u ∂

⇒

)0(

x ))0((

)0(

−

* 0

5 4

1 2

5 21 21 5 21

21 8 8 5 21

⎛ −+ ⎜ ⎝

2 ⎞ +⎟ ⎠

⎛ ⎜ ⎝

⎞ ⎟ ⎠

⎡ ⎢ ⎣

⎤ ⎥ ⎦

x ))0((

)0(

⇒

* 0

26 26 21

22 March 2011

Do:

Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt)

(cid:137) Vòng xuôi: (cid:137) Vòng xuôi:

4)0( =

Điều kiện đầu:

)0(*

)0(

−=

5 21

20 21

)1(

x )0((

))0(

−

1 1 2

20 20 21

32 32 21

⎞ ⎞ =⎟ ⎠

⎛ ⎛ ⎜ ⎝

Với k = 0:

)1(*

−=

)1( )1( 4

8 8 21

)2(

x )1((

))1(

−

1 1 2

32 32 21

8 8 21

12 12 21

1 1 2

⎛ ⎛ ⎜ ⎝

⎞ ⎞ =⎟ ⎠

22 March 2011

Với k = 1:

Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt) Thí dụ giải bài toán ĐK tối ưu rời rạc dùng DP (tt)

(cid:137) Vòng xuôi: (cid:137) Vòng xuôi:

)2(*

−=

)2( 3

4 21

)3(

))2(

)2(( x

−

1 2

12 21

4 21

1 2

⎞ =⎟ ⎠

⎛ ⎜ ⎝

)3(*

)3(

−= x

−=

Với k = 2:

4 21

)4(

x )3((

))3(

−

4 4 21

1 1 2

1 4 41 ⎛ ⎛ ⎜ 2 21 ⎝

⎞ ⎞ =⎟ ⎠

Với k = 3:

Kết luận: Chuổi tín hiệu ĐK tối ưu là:

; −

4 4 21

20 20 21

8 8 21

4 4 21

⎧ ⎧ −= ⎨ ⎩

⎫ ⎫ ⎬ ⎭

x ))0((

)0(

min

* 0

26 26 21

416 416 21

22 March 2011

Chỉ tiêu chất lượng tối ưu: ố ấ

Qui hoạch động giải bài toán ĐK tối ưu liên tục Qui hoạch động giải bài toán ĐK tối ưu liên tục

t )(

xf (( t

t (

u

)

)( )0(

x

(cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: (cid:145) Cho đối tượng mô tả bởi phương trình trạng thái: x & = x Trạng thái đầu: , trạng thái cuối:

0 0

( ( f ) ft =)

f f

ạ g

x (( t

min

dt )

))

t (

u

u φ )( =

→

f f

(cid:145) Đặt: Hàm mục tiêu tối ưu đoạn quỹ đạo cuối từ thời điểm ti, trạng

* ( tJ

( ) (*) , ạ g (cid:145) Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(t) sao cho: ft ∫ it ∫

x (( t

x,

))

u

)

}dt )

∫+

thái xi đến thời điểm cuối tf, trạng thái cuối x(tf) là { ( t ), φ

min u )( t

(cid:145) Nếu tồn tại lời giải tối ưu của bài toán (*) thì hàm mục tiêu tối ưu đoạn quỹ (cid:145) Nếu tồn tại lời giải tối ưu của bài toán ( ) thì hàm mục tiêu tối ưu đoạn quỹ đạo cuối phải thỏa mãn phương trình Hamilton-Jacobi-Bellman:

, x,

) )

ux ,( (

), t t )

f f

ux ,( (

−

+ +

}t }t ), )

{ { min i L L u )( t

* ( tJ ( ∂ t ∂

* , ( x, ( tJ x ∂

⎡∂ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎦

22 March 2011

ĐIỀU CHỈNH TOÀN PHƯƠNG TUYẾN TÍNH ĐIỀU CHỈNH TOÀN PHƯƠNG TUYẾN TÍNH LQR) (Linear Quadratic Regulator –– LQR) (Linear Quadratic Regulator

22 March 2011

Bài toán LQR liên tục Bài toán LQR liên tục

(*)

Bu

Ax

t )(

(cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: (cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: =

x &

T T )] )]

x

)( t t )(

),...,

( t ), )( ( t txtx )(

đó trong đó: t : vector trạng thái thái t t

u

)( t

),...,

T )]

(

: vector tín hiệu điều khiển

hỉ h hệ hố ( ) điề á đặ

[ [ 1= [ tutu ), ( 1= là ì x )0(

( t n tx ( ( m tu (cid:145) Bài toán đặt ra là tìm tín hiệu điều khiển u(t) điều chỉnh hệ thống từ ừ Bài í hiệ điề khiể x trạng thái đầu bất kỳ về trạng thái cuối x(tf) = 0 sao cho 0 tối thiểu chỉ tiêu chất lượng dạng toàn phương: ợ g ạ g

g p

u )(

x

( t

)

Mx

( t

)

)( t

Qx

)( t

u

)( t

Ru

)( t

] dt

[ x

∫

1 2

t0 t

trong đó Q và M là các ma trận trọng số bán xác định dương

ọ g ậ ị

R là ma trận trọng số xác định dương g

(cid:145) Bài toán trên được gọi là bài toán điều chỉnh toàn phương tuyến tính.

22 March 2011

Điều kiện cực trị bài toán LQR liên tục Điều kiện cực trị bài toán LQR liên tục

t )(

Qx

u

Ru

Ax

Bu

T λ

[ t )(

])( t

]

(cid:145) Hàm Hamilton: (cid:145) Hàm Hamilton: [ x

1 2 2

(cid:145) Điều kiện cần để có lời giải tối ưu:

t )( )(

Ax A

t )( )(

Bu B

t )( )(

(1) (1)

x & &

(2)

Q Qx

)( )( t

A

)( )( t

tT )( )( & λ

−=

−

−=

H ∂ x∂ ∂

t )(

t (

xf t ((

u

), t ) (3)

Ru

)( t

−=

−

TλB

0)( t =

x &

H ∂ ∂u u ∂

tT )(λ&

−=

H ∂ ∂ x∂

tH )(

t )(

uxf ,(

t ),

0= 0 T t ), λ+

∂H ux ,( ∂u

22 March 2011

Cách tìm lời giải tối ưu Cách tìm lời giải tối ưu

t )(

u

t )(

(cid:145) Rút u(t) từ (3): (cid:145) Rút u(t) từ (3): −−=

TλBR 1

(cid:145) Thay (4) vào (1), ta được (cid:145) Th (4) à (1) t đượ

−

(4)

t )(

(5)

Ax

t )(

BR

t )(

−

TλB

x &

1 −

t )(

ế(cid:145) Kết hợp (5) và (2), ta được phương trình vi phân:

x

A

BR

B

−

t )(

(6) (6)

Q

A

−

x& ⎡ ⎢ ⎢ & λ ⎣

⎤ =⎥ =⎥ ⎦

⎡ ⎢ ⎢ λ ⎣

⎤ ⎥ ⎥ ⎦

⎡ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎦

(cid:145) Giải phương trình vi phân (6), tìm được x(t) và λ(t) (cid:145) Thay λ(t) vào (4) tìm được lời giải tối ưu

22 March 2011

Lời giải bài toán LQR liên tục Lời giải bài toán LQR liên tục

u

)(* t )( t

(cid:145) Tín hiệu điều khiển tối ưu: Tí hiệ điề khiể tối

trong đó:

K

t )(

K xK t )()( t )()( t t −= T PBR 1 −=

1−

và P(t) là nghiệm bán xác định dương của phương trình vi phân Ricatti:

PA

QPA

PBR

T PB

−

P

M

P − & = ( ft

(cid:145) Lời giải phương trình Ricatti:

(cid:190) Trường hợp hệ bậc 2: có thể giải bằng tay (cid:190) Trường hợp tổng quát: tham khảo thêm trong tài liệu

22 March 2011

Bài toán LQR liên tục thời gian vô hạn Bài toán LQR liên tục thời gian vô hạn

t )(

Bu

Ax

(cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: (cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái: =

x &

(cid:145) Chỉ tiêu chất lượng dạng toàn phương, trong đó thời điểm cuối tf=∞: (cid:145) Chỉ tiêu chất lượng dạng toàn phương trong đó thời điểm cuối t =∞:

∞

Qx

u

Ru

u )(

)( t

] dt

[ x

1 ∫ ∫ 02 2

)(* t

t )(

u

Kx

−=

(cid:145) Tín hiệu điều khiển tối ưu:

1−= PBRK

T T

1 1−

trong đó: và P là nghiệm bán xác định dương của phương trình đại số Ricatti:

0 0

PA PA

QPA QPA

PBR PBR

T T PB PB

−

(cid:145) Chú ý: trong trường hợp này K và P là không phụ thuộc thời gian

(cid:145) Giá trị cực tiểu của chỉ tiêu chất lượng:

)0(

ể ấ

xT

Px

min

22 March 2011

Thí dụ 1 Điều khiển LQR liên tục –– Thí dụ 1 Điều khiển LQR liên tục

(cid:145) Cho hệ tuyến tính bậc 1 không ổn định mô tả bởi PTTT: (cid:145) Cho hệ tuyến tính bậc 1 không ổn định mô tả bởi PTTT:

tx tx )(2)(3)( tu &

(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu

( )

ệ ậ ị

∞

(

2 tx

))

2 (5)( tu +

1 ∫ = ∫ 2 0 2

(cid:145) Giải:

−

chỉ tiêu chất lượng:

PBR

T PB

−+

(cid:145) Phương trình đại số Ricatti:

⇒

.2.

.33. +

1 −+

− P 6

=−

1 1 5

QPA 4 2 4 P 5

⇒

663 663

.7P .7=P

065,3)663,7.(2.

(cid:145) Độ lợi hồi tiếp trạng thái:

=K⇒

1−= PBRK

tu )(

tKx )(

−=

(cid:145) Luật điều khiển tối ưu:

(chọn nghiệm xác định dương) (chọn nghiệm xác định dương)

⇒

tu )(

065,3

tx )(

1 5 −=

22 March 2011

ố ể ề

Thí dụ 2 Điều khiển LQR liên tục –– Thí dụ 2 Điều khiển LQR liên tục

(cid:145) Cho hệ tuyến tính bậc 2 mô tả bởi PTTT:

x x& x ⎧ = x = ⎧ 1 2 ⎨ x u = & ⎩

ầ Thiết kế l ật điề khiể

(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu (cid:145) Yê

(t) để hệ kí ổ đị h à tối thiể

∞

J J

2 (2)(2( (2)(2( tu tu

)) ))

dt dt

+ +

2 tx tx 1 1

1 ∫ = ∫ 2 0

(cid:145) Giải:

chỉ tiêu chất lượng:

tu )( )( tu

)( tx 1 )( tx 2

)( tx ⎡ & 1 ⎢ ⎢ )( tx & ⎣ 2

⎤ =⎥ ⎥ ⎦

⎡ ⎢ ⎢ ⎣

⎤ +⎥ +⎥ ⎦

g (cid:145) Viết lại phương trình trạng thái: ạ p ạ g

⎡ ⎤ ⎢ ⎥ ⎢ ⎥ 1 ⎣ ⎦ { B

⎡ ⎤ ⎢ ⎥ ⎢ ⎥ 00 ⎣ ⎦ 321 A

(cid:145) Viết lại chỉ tiêu chất lượng:

∞

2 ( tu

))

[ x 1

x 1 x

1 = ∫ 2

0 0

⎤ +⎥ ⎦ ⎦

ợ g ạ

2 { R R

02 ⎡ ⎡ ⎤ ] ⎢ ⎢ ⎥ 00 ⎣ ⎣⎦ ⎣ ⎦ ⎣ 321 Q

22 March 2011

Thí dụ 2 Điều khiển LQR liên tục –– Thí dụ 2 Điều khiển LQR liên tục

−

(cid:145) Phương trình đại số Ricatti: (cid:145) Phương trình đại số Ricatti: T PB

QPA

PBR

PA

−

10 10

00 00

02 02

p 1

⇒

2 p 3

⎡ ⎡ ⎢ 01 ⎣

⎡ ⎡ ⎢ ⎣

⎤ ⎤ +⎥ ⎦

⎡ ⎡ ⎢ ⎣

⎤ ⎡⎤ ⎡ ⎥ ⎢ ⎣ ⎦

⎡ ⎡⎤ ⎤ ⎢ ⎥ ⎦ ⎣

p p

p p 1

−

2 p 3

⎤ ⎤ +⎥ ⎦ ⎡ ⎡ ⎢ ⎣

⎤ ⎤ ⎥ 00 ⎦ p p 10 0 ⎤ ⎤⎡⎤ ⎡ ⎤ 1 ⎥ ⎢ ⎥ 1 2 ⎣ ⎦ ⎦

⎡ ⎡ [ ] 10 ⎢ ⎣

⎤ ⎤ =⎥ ⎦

p 1

⇒

1 2

p 1

2 2 2 pp 3 2

pp 2 3 2 p 3

⎡ ⎡ ⎢ ⎣

⎤ ⎤ −⎥ ⎦

⎤ ⎤ +⎥ ⎦

⎡ ⎡ ⎢ ⎣

⎤ ⎤ =⎥ ⎦

−

2 2

p 1

pp 2 3

1 2

⇒

2 2

−

p 1

pp 3 2

2 2 p 3

1 2 1 2

1 2

⎡ ⎡ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎤ ⎥ ⎥ ⎥ ⎥ ⎦

22 March 2011

Thí dụ 2 Điều khiển LQR liên tục –– Thí dụ 2 Điều khiển LQR liên tục

−

2 2

0 0

−

P⇒ P⇒

= =

2 2

pp pp 2 2 3 3

1 1 2 1 2

22 2

2 22

⎡ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎦

22 2 2 22

= =

p 1 p⇒ p ⇒ p 3

⎧ ⎪ ⎨ ⎨ ⎪ ⎩

−

2 p 3

1 2

⎧ ⎧ ⎪ ⎪⎪ p⇒ p ⇒ ⎨ ⎨ 1 1 ⎪ ⎪ ⎪ ⎩ ⎩

1[=K⇒

K⇒

1−= PBRK

(cid:145) Độ lợi hồi tiếp trạng thái: 1 2

22 2

2 22

⎡ ⎡ [ ] 10 ⎢ ⎣

⎤ ⎤ ⎥ ⎦

(cid:145) Luật điều khiển tối ưu:

⇒

* )( )( tu

−=

−

* )( tu )(

Kx

)( t )(

−=

1[ [ −=

)( )( tx 1 1

)( )(2 tx 2 2

tx )( 1 )( 2 tx )(

⎡ ]2 ] ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎦

22 March 2011

Thí dụ 3 Điều khiển LQR liên tục –– Thí dụ 3 Điều khiển LQR liên tục

(cid:145) Cho hệ tuyến tính bậc 2 mô tả bởi PTTT: (cid:145) Cho hệ tuyến tính bậc 2 mô tả bởi PTTT:

tu )(

1 1

−

tx )( 1 tx )( )( tx 2

tx )( & 1 tx tx )( )( & 2

⎡ ⎢ ⎣ ⎣

⎤ =⎥ ⎦ ⎦

⎤ +⎥ ⎦ ⎦

⎡ ⎤ ⎢ ⎥ 1 1 ⎦⎣ ⎣ ⎦ { B

⎡ ⎡ ⎤ ⎢ ⎢ ⎥ 2 2 − ⎣ ⎣⎦ ⎣ ⎦ ⎣ 43421 A

(cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu (cid:145) Yêu cầu: Thiết kế luật điều khiển u(t) để hệ kín ổn định và tối thiểu

∞

J J

2 ( tu tu (

)] )]

dt dt

+ +

2 )(2[ tx tx )(2[ 1

2 )( tx tx )( 2

1 = ∫ = ∫ 2

(cid:145) Giải:

(cid:145) Viết lại chỉ tiêu chất lượng:

chỉ tiêu chất lượng:

∞

([

))

2 ( tu

x 1

x 1 x

1 = ∫ 2

0 0

ợ g ạ

⎤ 1 +⎥ { ⎦ ⎦ R R

⎡ ⎡ ⎤ ] ⎢ ⎥ ⎢ 10 ⎣ ⎣⎦ ⎣ ⎦ ⎣ 321 Q

22 March 2011

Thí dụ 3 Điều khiển LQR liên tục –– Thí dụ 3 Điều khiển LQR liên tục

−

(cid:145) Phương trình đại số Ricatti: (cid:145) Phương trình đại số Ricatti: T PB

QPA

PBR

PA

−

1 1

0 0

1 1

02 02

−

p 1

⇒

−

2 p 3

⎤ ⎤ +⎥ ⎦

⎡ ⎡ ⎢ 1 ⎣

0 0 ⎤ ⎡⎤ ⎡ −⎥ ⎢ ⎣ ⎦

⎡ ⎡ ⎢ ⎣

⎡ ⎡⎤ ⎤ ⎢ ⎥ ⎦ ⎣

⎤ ⎤ +⎥ ⎦

p p

p p 1

−

2 p 3

2 p 3 p p ⎡ ⎡ 1 ⎢ ⎣

⎡ ⎡ ⎤ ⎤ ⎢ ⎥ 10 ⎦ ⎣ p p 0 0 ⎤ ⎤⎡⎤ ⎡ ⎡ ⎡ ⎤ [ ] 10 ⎥ ⎢ ⎢ ⎥ 1 ⎣ ⎦ ⎦ ⎣

⎤ ⎤ =⎥ ⎦

⇒

p 1 p

2 2 2

p 2 p 2

p 3 2

− −

p 2 p 3

p 1

p 3

2 2 2 pp 3 2

pp 2 3 2 p 3

⎡ ⎡ ⎢ ⎣

⎤ ⎤ −⎥ ⎦

⎡ ⎡ ⎢ ⎣

⎤ ⎤ +⎥ ⎦

⎡ ⎡ ⎢ ⎣

⎤ ⎤ =⎥ ⎦

−

⇒

2 −+ p 2 2 p

p 1 2 2

− p p

2 4 4

2 −

−

+ +

−

p − 3 1 1 + −+

2 2

2 2 pp pp 3 2 2 3

p p 3 3

p p 1 1

2 2

− p p 3 3

pp 2 3 2 p p 3 3

⎡ ⎢ ⎣ ⎣

⎤ =⎥ ⎦ ⎦

22 March 2011

Thí dụ 3 Điều khiển LQR liên tục –– Thí dụ 3 Điều khiển LQR liên tục

2 2

p p 2 2

2 2 −+ −+ p −

⇒

0 0

403.2 = 732 .0 = .0 0 = 542 542

p 1 p 2 3p

⎧ ⎧ ⎪ ⎨ ⎪ ⎪ ⎩ ⎩

− − p − 1 p p 3 3 p

− 2

+ + −

2p p 0 0 = = 2 p pp = − 3 2 3 p pp 2 2 pp p − 3 2 2 2 2 3 1 0 −+ =

2 p p 1 1 p 4 3

− 2 p 3

⎧ ⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎩

(chọn các nghiệm dương) g) g ệ

P⇒

403.2 403 2 732.0

732.0 732 0 542.0

⎡ ⎡ ⎢ ⎣

⎤ ⎤ ⎥ ⎦

(cid:145) Độ lợi hồi tiếp trạng thái: (cid:145) Độ lợi hồi tiếp trạng thái:

403.2

732.0

K⇒

1−= PBRK

542

]

732.0[=K⇒

732.0

542.0

⎡ [ ] 10 ⎢ ⎣ ⎣

⎤ ⎥ ⎦ ⎦

(cid:145) Luật điều khiển tối ưu:

Kx

* )( tu

)( t

.0[

732

−=

)( tx 1 )( tx 2

⎡ ]542 ⎢ ⎣

⎤ ⎥ ⎦

* tu )(

732

542.0)(

−=

−

⇒

tx 1

tx )( 2

22 March 2011

100

Bài toán LQR rời rạc Bài toán LQR rời rạc

(cid:145) Cho đối tượng tuyến tính rời rạc mô tả bởi phương trình trạng thái: (cid:145) Cho đối tượng tuyến tính rời rạc mô tả bởi phương trình trạng thái: (*)

x

(

k )(

)1 =+

uB d

xA d

x

)( k k )(

),...,

( )( ), ( )( kxkx k k

đó trong đó: t t

u

)( k

),...,

Tk T )] )] : vector trạng thái thái t T )] : vector tín hiệu điều khiển

hỉ h hệ hố á đặ (k) điề

[ [ 1= [ kuku ( ), ( 1= là ì )0( x

( ( n kx ( m ku (cid:145) Bài toán đặt ra là tìm tín hiệu điều khiển u(k) điều chỉnh hệ thống từ ừ Bài í hiệ điề khiể x trạng thái đầu bất kỳ về trạng thái cuối x(N) = 0 sao cho 0 tối thiểu chỉ tiêu chất lượng dạng toàn phương: ợ g ạ g

1 −

g p

x

Mx

k )(

Qx

k )(

u

k )(

Ru

k )(

(

)

(

)

u )(

]

[ x

∑

1 2

=0k k 0 =

trong đó Q và M là các ma trận trọng số bán xác định dương

ọ g ậ ị

R là ma trận trọng số xác định dương g

22 March 2011

101

Lời giải bài toán LQR rời rạc Lời giải bài toán LQR rời rạc

u

)(* k )( k

K K

−=

(cid:145) Tín hiệu điều khiển tối ưu: Tí hiệ điề khiể tối

trong đó:

K

)( k

(

)()( x k k )()( k k ] 1 − PBR

[ T PB d

B d

T d

A d

−

)( k

P

(

P

)1 −+

QA +

và P(k) là nghiệm bán xác định dương của phương trình Ricatti: ( ( PBB

) ) 1 PBR

T PA d d

B d d

T d d

d d

( (

) d )

P

M

(cid:145) Nghiệm phương trình Ricatti rời rạc: lần lượt thay (cid:145) Nghiệm phương trình Ricatti rời rạc: lần lượt thay 0 0

k k

)1 )1 → →−

= N ( ( = N

vao phương trình Ricatti sẽ tìm được P(k)

22 March 2011

102

Bài toán LQR rời rạc thời gian vô hạn Bài toán LQR rời rạc thời gian vô hạn

k )(

x

(

)1 =+

(cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái rời rạc: (cid:145) Đối tượng tuyến tính mô tả bởi phương trình trạng thái rời rạc: xA d

uB d

(cid:145) Chỉ tiêu chất lượng dạng toàn phương, trong đó thời điểm cuối N ∞: (cid:145) Chỉ tiêu chất lượng dạng toàn phương trong đó thời điểm cuối N=∞:

∞

k )(

Qx

k )(

u

k )(

Ru

k )(

u )(

]

[ x

∑

1 2

=0k k 0 =

)(* k

−=

(cid:145) Tín hiệu điều khiển tối ưu:

1−

trong đó: t đó

K K

u [ [ T T PBB PBB d d

)( k Kx ] ] T T PABR PABR d d

và P là nghiệm bán xác định dương của phương trình đại số Ricatti:

1 1

−

PAP

PB

−

) ) QAPBR

( ( T BPB d d

T d

( (

) )

(cid:145) Chú ý: trong trường hợp này K và P là không phụ thuộc k

(cid:145) Giá trị cực tiểu của chỉ tiêu chất lượng:

xT

)0(

Px

)0(

min

22 March 2011

103

Lời giải bài toán LQR thời gian vô hạn dùng Matlab Lời giải bài toán LQR thời gian vô hạn dùng Matlab

(cid:145) Nghiệm phương trình đại số Ricatti liên tục (continuous algebraic (cid:145) Nghiệm phương trình đại số Ricatti liên tục (continuous algebraic

Ricatti equation – care)

>> P=care(A,B,Q,R) Q ) (

(cid:145) Lời giải bài toán LQR (Linear quadratic Regulator – LQR) liên tục

>> K=lqr(A,B,Q,R)

(cid:145) Nghiệm phương trình đại số Ricatti rời rạc(discrete algebraic Ricatti i

ì h đ i ố i

l b i

i ời

(di

equation – dare)

>> P dare(A,B,Q,R) >> P=dare(A B Q R)

(cid:145) Lời giải bài toán LQR (Linear quadratic Regulator – LQR) rời rạc

>> K=dlqr(A,B,Q,R)

22 March 2011

104

BỘ LỌC KALMAN BỘ LỌC KALMAN BỘ LỌC KALMAN BỘ LỌC KALMAN

22 March 2011

105

Bài toán ước lượng tối ưu Bài toán ước lượng tối ưu

(cid:145) Cho phân bố xác suất liên kết (X,Y), ước lượng X dựa trên các giá trị (cid:145) Cho phân bố xác suất liên kết (X,Y), ước lượng X dựa trên các giá trị

đo Y sao cho tối thiểu phương sai ước lượng:

ˆ 2

y y

T ()ˆ ()

)ˆ )

( (

yx | | yx

) )

dx dx

min min

YxXE YxXE −

xX xX −

pxX pxX −

→ →

[ [

] ]

∫ ∫

+∞ ( ( ∞−

+∞

(cid:145) Lời giải:

y y

p xp

( (

| yx y |

) )

[ [ ˆ YXEx

] ]

YX YX

∫ ∫

∞−

(cid:145) Bộ ước lượng tối ưu trong trường hợp quan hệ giữa Y là X là quan hệ

tuyến tính có nhiễu phân bố Gauss gọi là bộ lọc Kalman. tuyến tính có nhiễu phân bố Gauss gọi là bộ lọc Kalman

(cid:145) Nhắc lại các công thức xác suất thống kê: Cho X là biến ngẫu nhiên

có hàm mật độ phân bố xác suất là p(X) có hàm mật độ phân bố xác suất là (X)

+∞

(cid:190) Kỳ vọng:

)( dxx

[ XE

]

μ X

Var

(

)

XE [(

T ()

)]

−

∫ ∞− =

(cid:190) Phương sai:

2 σ X

μ X

22 March 2011

106

Lọc Kalman liên tục Lọc Kalman liên tục

w w

t )( )( t

+ +

(cid:145) Xét hệ tuyến tính liên tục: ế

í h li

é h

x x& t )( )( t ty )(

= =

Ax Ax B B t )( tu )( t )( )( tu + + C tx tv )( )( +

⎧ ⎧ ⎨ ⎨ ⎩

[ E

Q

Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường. Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường Giả sử nhiễu hệ thống và nhiễu đo lường có phân bố Gauss, không tương quan, có trung bình bằng 0 và phương sai là: T ww =]

TvvE [

R=]

B B

tu ( ( t

)] )]

L L

ty )([ )([ t

(ˆ ty ( t

)] )]

+ +

−

(cid:145) Bộ lọc Kalman liên tục:

& )(ˆ x t )( t )(ˆ ty

)(ˆ xA t [ )( A t [ )(ˆ C tx

= =

⎧ ⎧ ⎨ ⎩

L

TΠ

Trong đó L là độ lợi của bộ lọc Kalman: Trong đó L là độ lợi của bộ lọc Kalman: 1− NRC

CRC

T A

A

Q

với Π là nghiệm của phương trình Ricatti: với Π là nghiệm của phương trình Ricatti: ΠΠ Π +

−

1 − N

22 March 2011

107

Sơ đồ khối bộ lọc Kalman rời rạc Sơ đồ khối bộ lọc Kalman rời rạc

y(t) ( )

x(t)

u(t)

t )(

Ax

t )(

B

tu )(

C

x &

L

+ + −

)(ˆ tx

C C

B B

∫ ∫

+ ++ ++

)(ˆ ty

A

tu )(

ty )((

(ˆ ty

))

B

L

−

(cid:145) Bộ lọc Kalman:

x& )(ˆ t )(ˆ )(ˆ ty

)(ˆ t )(ˆ )(ˆ t

xA xC C

= =

⎧ ⎨ ⎨ ⎩ ⎩

L

TΠ

Trong đó:

1− NRC T A

A

CRC

Q

−

ΠΠ +

1 − N

22 March 2011

108

Lọc Kalman rời rạc Lọc Kalman rời rạc

w w

ku )( )( ku

k )( )( k

+ +

(cid:145) Xét hệ tuyến tính rời rạc: ế

k k ( ( x x ky )(

xA xA d kx )(

k )( )( k B B + + d kv )( +

)1 )1 =+ =+ C =

( )

ệ

d ( )

⎧ ⎧ ⎨ ⎩ g Trong đó: w(k) là nhiễu hệ thống; v(k) là nhiễu đo lường. g; Giả sử nhiễu hệ thống và nhiễu đo lường có phân bố Gauss, không tương quan, có trung bình bằng 0 và phương sai là:

[ E

Q

T T ww =]

TvvE [

R=]

)(ˆ )(ˆ k k

ku ( ( k

)] )]

ky ([ ([ k

(ˆ (ˆ ky k

)]1 )]1

)1 )1 −+

B B d

L L k

(cid:145) Bộ lọc Kalman rời rạc: (ˆ (ˆ k k [ [ x xA A d )(ˆ )(ˆ ky kx

)1 )1 =+ C =

⎧ ⎧ ⎨ ⎩

−

k )(

L

k )(

C

R

d Trong đó L là độ lợi của bộ lọc Kalman: Trong đó L là độ lợi của bộ lọc Kalman: k )( Π

) 1

( T CC d

A d

T d

)( k

(

CRC

)( k

với Π là nghiệm của phương trình Ricatti: với Π là nghiệm của phương trình Ricatti: )( k Π Π

QA +

)1 =+

−

A d

T d

1 Π − N d

T d

T A d

22 March 2011

109

Sơ đồ khối bộ lọc Kalman rời rạc Sơ đồ khối bộ lọc Kalman rời rạc

u(t) u(t)

x(t)

y(t) ( )

x

(

k )(

B

ku )(

)1 =+

xA d

L

+ + −

)(ˆ tx

dB d

dC dC

1−z z

+ ++ +

)(ˆ ty

)(ˆ k

ku (

)]

ky ([

(ˆ ky

)]1

)1 −+

B d

L k

(cid:145) Bộ lọc Kalman:

(ˆ x k )(ˆ ky ky )(

xA [ d )(ˆ kx )( kx

)1 =+ dC C =

⎧ ⎨ ⎨ ⎩ ⎩

−

Trong đó:

L

k )(

C

R

A d

T d

(

) 1 )( k CRC

)( k

)1 =+

( T CC d QA )( k +

−

A d

T d

A d

T d

1 Π − N d

T A d

22 March 2011

110

BỘ ĐIỀU KHIỂN LQG BỘ ĐIỀU KHIỂN LQG (Linear Quadratic Gaussian) (Linear Quadratic Gaussian)

22 March 2011

111

Bài toán điều khiển LQG (Linear Quadratic Gaussian) Bài toán điều khiển LQG (Linear Quadratic Gaussian)

t )(

w

(cid:145) Xét hệ tuyến tính liên tục bị tác động bởi nhiễu Gauss: (cid:145) Xét hệ tuyến tính liên tục bị tác động bởi nhiễu Gauss: x& t )( = ty )( =

Ax B t tu )( )( + C )( )( tx tv +

⎧ ⎨ ⎩

Trong đó: w(t) là nhiễu hệ thống; v(t) là nhiễu đo lường. Giả sử nhiễu không tương quan, có trung bình bằng 0 và phương sai là:

[ [ E

Q Q]

T T ww =]

TvvE T [

R=]

x x

)0( )0(

= =

u )(

Ru

Qx

t )(

u

(cid:145) Bài toán đặt ra là tìm tín hiệu điều khiển u(t) điều chỉnh hệ thống từ x x trạng thái đầu bất kỳ về trạng thái cuối x(tf) = 0 sao cho bất kỳ về trạng thái cuối x(t ) = 0 sao cho trạng thái đầu 0 tối thiểu chỉ tiêu chất lượng dạng toàn phương: ∞1 [ 1 [ ∫ ∫ x 2

⎧ ⎧ ⎨ ⎩

⎫ ] ⎫ ] dt ⎬ ⎭

á đị h dươ

t ậ t

ố bá

đó Q là á

trong đó Q là các ma trận trọng số bán xác định dương t R là ma trận trọng số xác định dương

22 March 2011

112

Nguyên lý tách rời Nguyên lý tách rời

(cid:145) Nguyên lý tách rời: Bài toán tối ưu LQG có thể giải bằng cách giải (cid:145) Nguyên lý tách rời: Bài toán tối ưu LQG có thể giải bằng cách giải

riêng bài toán điều khiển tối ưu tiền định và bài toán ước lượng trạng thái tối ưu.

LQG = LQR + Lọc Kalman

22 March 2011

113

Lời giải bài toán điều khiển LQG Lời giải bài toán điều khiển LQG

(cid:145) Tín hiệu điều khiển tối ưu LQR: (cid:145) Tín hiệu điều khiển tối ưu LQR: )(* t

u

xK

)(ˆ t

−=

với độ lợi hồi tiếp trạng thái: với độ lợi hồi tiếp trạng thái:

1− PBRK = PBRK

T T

1 1−

trong đó P là nghiệm bán xác định dương của pt đại số Ricatti: QPA QPA

T T PB PB

PBR PBR

PA PA

0 0

−

(cid:145) Bộ lọc Kalman:

B

tu (

)]

L

ty )([

(ˆ ty

)]

−

x& )(ˆ t )(ˆ ty

)(ˆ xA [ t )(ˆ C tx

= =

⎧ ⎧ ⎨ ⎩

L

TΠ

với độ lợi ước lượng:

1− NRC

trong đó Π là nghiệm bán xác định dương của pt đại số Ricatti:

A

T A

CRC

Q

ΠΠ +

−

1 − N

22 March 2011

114

Sơ đồ khối bộ điều khiển LQG liên tục Sơ đồ khối bộ điều khiển LQG liên tục

y(t) y(t)

r(t) r(t)

x(t) x(t)

u(t) u(t)

t )(

Ax

t )(

B

tu )(

x &

C

−

L L

+ − −

)(ˆ tx

B

C

∫

+ ++

)(ˆ ty

A

K K

(cid:145) Bộ điều khiển LQR

(cid:145) Bộ lọc Kalman

)(ˆ )(ˆ t

u

xK K

))

)( tu

)(( ty

(ˆ ty

B

L

−

)(ˆ t )(ˆ t

xA xC

= =

−

QPA QPA

PBR PBR

T PB PB

)(* )(* t −= 1−= PBRK T PA PA + +

+ +

− −

0= 0 =

CRC

Q

⎧ & ⎧ )(ˆ t x ⎨ )(ˆ ty ⎩ 1−RC TΠ L L Π NRC = T A A ΠΠ + −

1 − N

22 March 2011

115

THÍ DỤ THIẾT KẾ THÍ DỤ THIẾT KẾ ĐIỀU KHIỂN TỐI ƯU ĐIỀU KHIỂN TỐI ƯU Ể Ể Ề Ề

Ố Ố

22 March 2011

116

Đối tượng điều khiển: hệ con lắc ngược Đối tượng điều khiển: hệ con lắc ngược

g [

(cid:145) Thông số hệ con lắc ngược (cid:145) Thông số hệ con lắc ngược M =1.0 kg: troïng löôïng xe m=0.1kg : troïng löôïng con laéc l = 1.0 m: chieàu daøi con laéc é à u : löïc taùc ñoäng vaøo xe [N] g : gia toác troïng tröôøng [m/s2] ï g g g ] x : vò trí xe [m] θ: goùc giöõa con laéc vaø phöông

thang ñöng [rad] thaúng ñöùng [rad]

(cid:145) Mô hình toán hệ con lắc ngược

x =&&

mg (cos

cos sin θθ 2 ) θ

2& 2 (sin ) − θθ mmM −+

u u

cos cos

( (

) )

θ θ

−

+ +

sin sin & θθθ θθθ

θ&& &&

) (sin ) (cos ml (sin ) ml (cos gmM ) gmM θ + θ + 2 ( ) ml lmM (cos ) θ − +

22 March 2011

117

PTTT phi tuyến của hệ con lắc ngược PTTT phi tuyến của hệ con lắc ngược

x x

, xx xx

= =

, θ θ

= =

, & θ θ

= =

(cid:145) Đặt các biến trạng thái (cid:145) Đặt các biến trạng thái

x x 1

x x 3

x x &

(cid:145) Phương trình trạng thái phi tuyến

cos

(

sin

−

x 1

xx ) 1

gmMx ) + 1 ( (cos ml

2 x ml ) (cos + 1 ( ( ) ) lmM − +

x (sin 2 ) ) x 1 1

sin

x 1

x & 1 x & 2 2 x & 3 x &

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

x 1 2 2

x 4 2 xx ) mg (sin − 1 2 mmM M (cos x ( −+

cos 1) )

⎡ ⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣

⎤ ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦

(cid:145) Yêu cầu: Thiết kế bộ điều khiển giữ cân bằng con lắc quanh vị trí

thẳng đứng

22 March 2011

118

PTTT tuyến tính của hệ con lắc ngược PTTT tuyến tính của hệ con lắc ngược

(cid:145) PTTT tuyến tính hóa quanh điểm cân bằng thẳng đứng (góc lệch θ (cid:145) PTTT tuyến tính hóa quanh điểm cân bằng thẳng đứng (góc lệch θ

nhỏ hơn 100)

001

000

−

100

000

−

x 1 1 x 2 x 3 x

x 1& 1 x & 2 x & 3 x 4&

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

0 mM mM + + Ml 0 m m M

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎡ ⎥ ⎥ ⎢ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎥ ⎢ ⎢ ⎣⎥ ⎦

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

0 ⎤ 1 1 ⎥ ⎥ ⎥ uMl ⎥ 0 ⎥ ⎥ 1 1 ⎥ M ⎦

(cid:145) Thay cụ thể thông số của hệ con lắc ngược: (cid:145) Thay cụ thể thông số của hệ con lắc ngược:

001

78.10

000

x 1 x 2 2 x 3

x & 1 x & 2 2 x & 3 x &

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣− 1

⎤ ⎥ ⎥ ⎥ ⎥ 100 ⎥ 000 ⎦ 444 3

⎤ ⎡ ⎥ ⎢ 1 − ⎢ ⎢ ⎥ ⎥ ⎢ ⎥ 0 ⎢ ⎥ 1 ⎣ ⎦ { B

0 98.0 444 2 A

22 March 2011

119

Thiết kế bộ điều khiển LQR Thiết kế bộ điều khiển LQR

(cid:145) Giả thiết: (cid:145) Giả thiết:

(cid:190) Đặc tính động của hệ con lắc ngược có thể được mô tả bởi hệ phương trình biến trạng thái tuyến tính. Điều này chỉ đúng khi góc lệch θ nhỏ.

(cid:190) Hệ thống phản hồi trạng thái đầy đủ, nghĩa là có thể đo được 4 biến trạng thái (góc lệch θ, vận tốc góc, vị trí xe x, vận tốc xe ) biến trạng thái (góc lệch θ vận tốc góc vị trí xe x vận tốc xe )

(cid:190) Không có nhiễu tác động vào hệ thống.

(cid:145) Thiết kế dùng Matlab: (cid:145) Thiết kế dù M tl b (cid:190) >> K = lqr(A,B,Q,R) (cid:190) Tùy theo độ lớn tương đối giữa trọng số Q và R mà hệ thống có

đáp ứng quá độ và năng lượng tiêu tốn khác nhau.

(cid:190) Muốn trạng thái đáp ứng nhanh tăng thành phần Q tương ứng (cid:190) Muốn giảm năng lượng tăng R (cid:190) Muốn giảm năng lượng tăng R

22 March 2011

120

Mô phỏng điều khiển LQR hệ con lắc ngược Mô phỏng điều khiển LQR hệ con lắc ngược

22 March 2011

121

Kết quả mô phỏng điều khiển LQR hệ con lắc ngược Kết quả mô phỏng điều khiển LQR hệ con lắc ngược

0.5 0

θ θ&

] s / d a r [ , ] d a r [

-0.5

0.5

x x&

] s / m m

[ , ]

0001 0010 0100 1000 1000

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦

[

-0.5

1=R

]

[

-5 -5

lắ đ

3 Time [s]

. 3620

. 10 7009

. 000 1

] ] . 4109

[ [ −K =

−

Góc lệch con lắc được Gó lệ h giữ cân bằng tốt, tuy nhiên vị trí xe dao động khá lớn

22 March 2011

122

Kết quả mô phỏng điều khiển LQR hệ con lắc ngược Kết quả mô phỏng điều khiển LQR hệ con lắc ngược

0.5 0

θ θ&

-0.5

] s / d a r [ , ] d a r [

-1

10 00

0 100

0 0

x x&

] s / m m

[ , ]

00 00

0 0

1 1

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦

[

-1

1=R

]

[

-10 -10

ố

3 Time [s]

)

. 1356

. 1091

. 000

] ] . 0514 11

[ [ −K =

−

Tăng trọng số q33 Tă (tương ứng với vị trí xe) ⇒ vị trí xe ít dao động hơn

22 March 2011

123

Kết quả mô phỏng điều khiển LQR hệ con lắc ngược Kết quả mô phỏng điều khiển LQR hệ con lắc ngược

0.5

θ θ&

-0.5

] s / d a r [ , ] d a r [

-1

10 00

0 100

0 0

x x&

] s / m m

[ , ]

00 00

0 0

1 1

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎦

[

-1

1=R

]

[

-10 10

3 Time [s]

. 1356

. 1091

. 000

] ] . 0514 11

[ [ −K =

−

Khuyết điểm của bộ điều khiển LQR là nếu có nhiễu đo lường thì chất lượng điều khiển bị ảnh hưởng đáng kể bị ảnh hưởng đáng kể

22 March 2011

124

Thiết kế bộ điều khiển LQG Thiết kế bộ điều khiển LQG

(cid:145) Giả thiết: (cid:145) Giả thiết:

ệ

ị

(cid:190) Hệ thống hoạt động trong miền tuyến tính ợ g (cid:190) Giả sử chỉ đo được góc lệch và vị trí xe (cid:190) Có nhiễu tác động vào hệ thống. Nhiễu đo vị trí xe có phương

sai là 0.01; nhiễu đo góc lệch con lắc có phương sai 0.001

ể

⇒ Dùng lọc Kalman để ước lượng trạng thái và lọc nhiễu ễ

(cid:145) Thiết kế dùng Matlab: (cid:145) Thiết kế dùng Matlab: (cid:190) >> K = lqr(A,B,Q,R) (cid:190) >> L = lqe(A,G,C,QN,RN) %G là ma trận đơn vị

22 March 2011

125

Thiết kế bộ điều khiển LQG Thiết kế bộ điều khiển LQG

Q Q

= =

100

. 1356

. 1091

. 000

. 0514 11

]

−K⇒ [ =

−

(cid:145) Bộ điều khiển LQR (cid:145) Bộ điều khiển LQR 01 ⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦

⎡ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣

1=R

(cid:145) Bộ lọc Kalman

Q

000001 I

.0=N

.6 .21

5617 5437

.0 .0

L

⇒

001.0 001 0 0

0 0 ⎤ ⎤ ⎥ 01.0 ⎦

⎡ ⎡ ⎢ ⎣

− − .0 0 .0

5713 5713 9568

1470 1470 0271

.0 0 .1

0571 ⎤ ⎥ 1876 ⎥ ⎥ ⎥ ⎥ ⎦

⎡ ⎢ ⎢ ⎢ ⎢ − ⎢ ⎣− (Do ta giả sử không có nhiễu hệ thống nên chọn QN rất bé. Hai thành (Do ta giả sử không có nhiễu hệ thống nên chọn Q rất bé Hai thành phần của RN chính là phương sai của nhiễu đo lường)

22 March 2011

126

Mô phỏng điều khiển LQG hệ con lắc ngược Mô phỏng điều khiển LQG hệ con lắc ngược

22 March 2011

127

MỘT SỐ CÔNG THỨC CẦN NHỚ MỘT SỐ CÔNG THỨC CẦN NHỚ MỘT SỐ CÔNG THỨC CẦN NHỚ MỘT SỐ CÔNG THỨC CẦN NHỚ

22 March 2011

129

Nghiệm của phương trình vi phân bậc 1 Nghiệm của phương trình vi phân bậc 1

tax tax

+ +

0)( 0)( = =

(cid:145) Phương trình vi phân bậc 1 đồng nhất : (cid:145) Phương trình vi phân bậc 1 đồng nhất :

tx )( )( tx&

(cid:145) Nghiệm tổng quát:

atCe −

=)( tx

(cid:145) Hằng số C được xác định dựa vào điều kiện biên. á đị h d

à điề kiệ biê

ố C đ

Hằ

22 March 2011

130

Nghiệm của phương trình vi phân bậc 1 (tt) Nghiệm của phương trình vi phân bậc 1 (tt)

(cid:145) Phương trình vi phân bậc 1 không đồng nhất : (cid:145) Phương trình vi phân bậc 1 không đồng nhất :

txtp )()(

tq )(

tx )( &

tqt )()(

Cdt +

tx )(

= ∫

(cid:145) Nghiệm tổng quát:

t )(

μ dt

)( tp

trong đó:

)(μ t

∫= ∫ e

(cid:145) Hằng số C được xác định dựa vào điều kiện biên. (cid:145) Hằng số C được xác định dựa vào điều kiện biên

22 March 2011

131

Nghiệm của phương trình vi phân bậc 2 Nghiệm của phương trình vi phân bậc 2

tcx tcx

+ +

0)( 0)( = =

(cid:145) Phương trình vi phân bậc 2 đồng nhất : (cid:145) Phương trình vi phân bậc 2 đồng nhất :

txa )( )( txa &&

txb )( )( txb &

(cid:145) Nghiệm tổng quát:

(cid:190) Trường hợp 1: (cid:190) Trường hợp 1:

ac ac

0 0

b b

> >

=Δ Δ tp 1

42 4 − tp 2

(

a )2/()

b Δ±−=

)( tx

p với 2,1

eC 2

eC 1

(cid:190) Trường hợp 2:

=Δ

42 − pt

)2/( a

p −= b

)( tx

với

eC 1

teC 2

(cid:190) Trường hợp 3:

=Δ

42 −

t α

)( tx

sin

cos

t β

eC 1

eCt + 2

)2/( a

Δ−=β

Với và

)2/( a

b−=α

(cid:145) Hằng số C1 và C2 được xác định dựa vào điều kiện biên.

22 March 2011

132

Nghiệm của phương trình vi phân bậc 2 Nghiệm của phương trình vi phân bậc 2

)( tcx tcx )(

d d

+ +

= =

(cid:145) Phương trình vi phân bậc 2 không đồng nhất : (cid:145) Phương trình vi phân bậc 2 không đồng nhất :

)( txa txa )( &&

)( txb txb )( &

z +=

(cid:145) Nghiệm tổng quát:

d c

trong đó z(t) là nghiệm của phương trình vi phân đồng nhất:

tcz tcz

+ +

0)( 0)( = =

tza )( )( tza &&

tzb tzb )( )( &

(cid:145) Hằng số C1 và C2 được xác định dựa vào điều kiện biên.

22 March 2011

133

Nghiệm của phương trình trạng thái Nghiệm của phương trình trạng thái

t )( )( t

Ax Ax

t )( )( t

B B

tu )( )( tu

= =

+ +

(cid:145) Phương trình vi phân bậc 1: (cid:145) Phương trình vi phân bậc 1:

x x &

x

Điều kiện đầu:

),...,

T )] )]

ℜ∈ ℜ∈

trong đó: trong đó:

( tx n tx (

x x A

=t 0 ) ( )( [ ( )( ), txtx ( t txtx )( [ )( t = = 1 nn ×ℜ∈

(cid:145) Nghiệm : (cid:145) Nghiệm :

)( t t )(

) )

( t t (

x

()( ()( t t t t x

Φ= Φ

) ) u τ B B

d )( )( d ττ

∫ ∫ Φ+ −Φ+

(cid:145) Trong đó:

te A=Φ )(

A

1 −

−

Cách 1:

t )( =Φ

AI ) −

t L =

{ (

−

t A

Cách 2:

I

t )( =Φ

[

] A

[

] A

[

] 1 A

C 1

1 −

det(

0) =

− AIλ

thay các trị riêng λi của ma trận A (nghiệm của ) vào phương trình trên sẽ tính được các hệ số Ci

22 March 2011

134

Nghiệm của phương trình trạng thái (tt) Nghiệm của phương trình trạng thái (tt)

(cid:145) Các trường hợp riêng của phương trình vi phân bậc 1: (cid:145) Các trường hợp riêng của phương trình vi phân bậc 1:

t )(

Ax

t )(

(cid:190) Nếu B=0:

x &

) )

t tA − ( (

t 0t 0

t )( )(

) )

t ( (

) )

x

()( t t ()( x

x

Φ= Φ

A= e

Ax Ax

t )( )( t

B B

= =

+ +

(cid:190) Nếu u=1: (cid:190) Nếu u=1:

t )( )( x x t&

)( t

)

( t

)

x

()( t t x

Φ=

−Φ+

ττ B

∫

t0 t

22 March 2011

135

Tổng kết chương Tổng kết chương

á bài t á điề khiể tối

độ

Sau khi học xong chương 3, sinh viên phải có khả năng: (cid:145) Giải bài toán tối ưu động không ràng buộc và có ràng buộc (cid:145) Thành lập các bài toán điều khiển tối ưu động (cid:145) Thà h lậ (cid:145) Giải bài toán tối ưu động liên tục dùng phương pháp biến phân (cid:145) Giải bài toán tối ưu rời rạc dùng phương pháp qui hoạch động (cid:145) Giải bài toán tối ưu rời rạc dùng phương pháp qui hoạch động (cid:145) Thiết kế bộ điều khiển LQR, bộ lọc Kalman, bộ điều khiển LQG

22 March 2011

136