Moân hoïc Moân hoïc

HEÄ THOÁNG ÑIEÀU KHIEÅN THOÂNG MINH HEÄ THOÁNG ÑIEÀU KHIEÅN THOÂNG MINH

â Ñi à Khi å Tö Ñ ä

Giaûng vieân: TS. Huyønh Thaùi Hoaøng Boä moân Ñieàu Khieån Töï Ñoäng B ä Khoa Ñieän – Ñieän Töû Ñaïi hoïc Baùch Khoa TP.HCM Email: hthoang@hcmut.edu.vn Email: hthoang@hcmut edu vn Homepage: http://www4.hcmut.edu.vn/~hthoang

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

1

Chöông 5 Chöông 5

ĐIỀU KHIỂN THÍCH NGHI ĐIỀU KHIỂN THÍCH NGHI

VÀ ĐIỀU KHIỂN HỌC VÀ ĐIỀU KHIỂN HỌC

À Ề À Ề

Ể Ể

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

2

Noäi dung chöông 4 Noäi dung chöông 4

(cid:145) Điều khiển thích nghi hi (cid:145) Điều khiển học

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

3

Điề khiể hí h

ĐIỀU KHIỂN THÍCH NGHI ĐIỀU KHIỂN THÍCH NGHI

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

4

Sơ đồ khối hệ thống điều khiển thích nghi Sơ đồ khối hệ thống điều khiển thích nghi

(cid:145) Hệ thống điều khiển trong đó thông số (và cấu trúc) của bộ điều (cid:145) Hệ thố đó thô t ú ) ủ bộ điề khiển thay đổi trong quá trình vận hành nhằm đảm bảo chất lượng điều khiển khi có sự hiện diện của các yếu tố bất định hoặc biến đổi không biết trước gọi là hệ thống điều khiển thích nghi.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

5

t điề khiể ố ( à ấ

(cid:145) Đối tượng: (cid:145) Đối t

g

(cid:142) Tuyến tính hoặc phi tuyến g) (cid:142) SISO hoặc MIMO (vuông, không vuông) g, ( (cid:142) Hệ có bậc tương đối tổng quát (cid:142) Có nhiễu hệ thống, nhiễu đo lường ồ

(cid:145) Thông tin phản hồi:

(cid:142) Trạng thái (cid:142) Ngõ ra (cid:142) Ngõ ra

(cid:145) Cơ sở của thuật toán điều khiển thích nghi: p

y

(cid:142) Điều khiển hồi tiếp tuyến tính hóa (cid:142) Điều khiển trượt (cid:145) Thuật toán thích nghi: (cid:142) Liên tục hoặc rời rạc

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

6

Phân loại hệ thống điều khiển thích nghi Phân loại hệ thống điều khiển thích nghi

(cid:145) Đối tượng: hệ phi tuyến SISO mô tả bởi phương trình vi phân: (cid:145) Đối t

Đặt bài toán Đặt bài toán

ế SISO ô tả bởi h t ì h i hâ hệ hi t

u )( xg

+

x & y

xf )( )( xh

= =

⎧ ⎨ ⎨ ⎩

(cid:145) Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt (cid:145) Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

7

ym(t)

(cid:145) Nếu đối tượng có bậc tương đối bằng r, đối tượng có thể được mô tả (cid:145) Nế đối t ô tả

Đối tượng điều khiển Đối tượng điều khiển

ó thể đ đối bằ đối t

y r )( y

a a

b b

ó bậ t bằng phương trình sau:

x )( )( x

u u

= =

x + )( )( x +

(cid:145) Trong đó:

a

x )(

x )(

b

x )(

x )(

0

r hL f= =

r 1 1 − hLL f

g

L

với:

x )(

xf )(

,

,

f

(

x

),

f

x )(

.

=

φ

=

[

]T

1

f

n

K

K

x )( φ ∂ x ∂

x )( φ ∂ x ∂ 1

n

⎡ ⎡ ⎢ ⎣

⎤ ⎤ ⎥ ⎦

.

xf )(

x )(

φ

=

k L f

x )( x )(

xg )(.

x )(

=

φ

k LL g f

x )( ∂ φ x ∂ ∂ − φkL k )(1 1 L x )( φ ∂ f x ∂ ∂ φk L fL φ ∂ f x ∂

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

8

(cid:145) Luật điều khiển hồi tiếp tuyến tính hóa: (cid:145) L ật điề khiể hồi tiế t

Luật điều khiển hồi tiếp tuyến tính hóa Luật điều khiển hồi tiếp tuyến tính hóa

u

ế tí h hó

)(* x

a

x )(

=

+

[ −

])( tv

1 )(b x )( x b

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

9

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

10

Các giả thiết Các giả thiết

0= 0

(cid:145) Đặc tính động học của sai số bám:

Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa

s

s

e η& e +

(cid:145) Chọn hàm Lyapunov: hà L

V = V

1 21 2 se 2

(cid:145) Dễ dàng thấy ràng: (cid:145) Dễ dàng thấy ràng:

0≤ 0

0≥V eeV eeV = = &

s

s

2 ≤ s

e e = η −= η&

Ch

0 0

)( →tes )( →teo

khi khi

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

11

ố ằ ⇒ Hệ thống ổn định ∞→t ⇒ ⇒ ∞→t ⇒ y(t) bám theo ym(t) với sai số xác lập bằng 0

(cid:145) Điều khiển thích nghi trên cơ sở xấp xỉ luật điều khiển hồi tiếp tuyến ở ấ

Ý tưởng điều khiển thích nghi Ý tưởng điều khiển thích nghi

ỉ l ậ điề khiể hồi iế hi ê hí h ế

u u

Điề khiể tính hóa :

)(* x )( x

a a

x )( )( x

= =

+ +

[ [ −

])( ])( tv tv

1 x )(

b

(cid:145) Lý do: (cid:145) Lý do:

(cid:142) hàm a(x) và b(x) chưa biết (cid:142) hoặc hàm a(x) và b(x) đã biết nhưng thay đổi trong quá trình vận

(cid:145) Hai phương pháp điều khiển thích nghi: (cid:145) Hai phương pháp điều khiển thích nghi: (cid:142) Điều khiển thích nghi gián tiếp (cid:142) Điều khiển thích nghi trực tiếp

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

12

hành

Điều khiển thích nghi gián tiếp Điều khiển thích nghi gián tiếp

)(ˆ xa à)(ˆ

)(ˆb )( xb

( ) à b( ) dù ô hì h ế

Nhậ d (cid:145) Nhận dạng trực tuyến a(x) và b(x) dùng mô hình và , sau đó tính tín hiệu điều khiển theo nguyên lý chắc chắn tương đương.

x )(

)(ˆ x a

=

+

[ −

])( tv

uce

1 )(ˆ x b

)(ˆ xa

(cid:145) Mô hình và có thể là mô hình mờ, mạng thần kinh hoặc mô

)(ˆ xb

hình hộp đen phi tuyến tổng quát.

x )(

T ξθ= a a

)(ˆ a x )(ˆ )( x b

)( )( x

T b ξ ξθ= b b b

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

13

Các vector và là vector thông số của mô hình.

(cid:145) Các vector thông số và được cập nhật trực tuyến để tiệm cận

Điều khiển thích nghi gián tiếp (tt) Điều khiển thích nghi gián tiếp (tt)

ế ể

arg arg

ố tiến tới giá trị tối ưu:

x )( )( x

b b

x )( )( x

=

* θ θ b

Tξθ ξθ b b

b

min min θ Ω∈ b

sup sup xSx ∈

arg arg

x )( )( x

a a

x )( )( x

=

* θ θ a

Tξθ ξθ a a

min min Ω∈ θ a

a

sup sup xSx ∈

⎧ ⎨ ⎨ ⎩ ⎧ ⎨ ⎨ ⎩

⎫ ⎬ ⎬ ⎭ ⎫ ⎬ ⎬ ⎭

)( xbδ )(δ

)( xaδ )(δ

à ô hì h ối i ố iữ í h độ à đặ là h

a

G i (cid:145) Gọi và là sai số giữa mô hình tối ưu và đặc tính động học chính xác của đối tượng. Mô hình đúng của đối tượng có thể biểu diễn như sau:

x )(

x )(

x )(

T * = ξθ a a

δ+ a

b

x )(

x )(

x )(

T * = ξθ b b

δ+ b

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

14

(cid:145) Sai lệch giữa mô hình nhận dạng được và mô hình đúng của hệ thống:

Điều khiển thích nghi gián tiếp (tt) Điều khiển thích nghi gián tiếp (tt)

a

x )(

x )(

x )(

=

δ− a

)(ˆ x a )(ˆ x b

x )(

x )(

=

~ T )( t ξθ a a ~ T )( t ξθ b b

δ− b

)( t

)( t

=

t )(

t )(

=

trong đó:

)( x b ~ θ a ~ θ b

θ a θ b

* θ a * θ b

g g

u

u

(cid:145) Tín hiệu điều khiển là tổng gồm 2 thành phần: (cid:142) uce điều khiển hệ thống bám quỹ đạo chuẩn (cid:142) usi đảm bảo hệ thống ổn định u =

+

ce

si

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

15

g (cid:145) Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usi.

( xb

)

(cid:145)

Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp

0

b

bị chặn:

x )(

b

(

x

)

b

(

x

)

<

∞<

)(t

ym )(t (cid:145) Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc r y r )()( t m

ym&

(cid:145) Sai số cấu trúc giữa mô hình và đặc tính chính xác của đối tượng bị

và các đạo hàm ,..., có thể đo được.

chặn bởi các cận biết trước:

x )(

δ a

δ a

x L)( ∞∈

)( )( x

δ b b

δ b b

)( L)( x ∞∈ ∞

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

16

Trình tự thiết kế bộ điều khiển thích nghi: Trình tự thiết kế bộ điều khiển thích nghi:

(cid:145) Viết biểu thức mô tả động học sai số bám. ô ả độ (cid:145) Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và

Viế biể i ố bá hứ h

V&

(cid:145) Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ thuộc vào sai số thông số của mô hình)

sai số thông số). sai số thông số).

0

(cid:145) Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số ) khi sai số đạo hàm theo thời gian của hàm Lyapunov âm ( cấu trúc nằm trong giới hạn định trước.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

17

ố ố

Thiết kế bộ điều khiển thích nghi gián tiếp Thiết kế bộ điều khiển thích nghi gián tiếp

)(ˆ( x a

))

x

a

(

b

(

x

)) u

b

x )( u

(cid:145) Biểu thức mô tả động học sai số bám (cid:145) Biểu thức mô tả động học sai số bám )(ˆ( x b = −

+

s

s

ce

si

e e +η&

V

=

+

+

~ Q θθ a

a

~ Q θθ bb

(cid:145) Hàm Lyapunov:

1 2 1 2 se 2

1 ~1 T T a 2

1 ~1 T T b 2

bu

(

u

)

Q (

)

Q (

)

−=

+

+

+

V &

2 e η s

e s

si

e s

δδ − − b

a

ce

+ ξθ & aa

e sa

~ T θ a

ue sb

ce

~ T θ b b

+ ξθ & bb b

(cid:145) Luật thích nghi thông số:

eξ sa

θ & a

1−−= Q a 1−−= Q b

θ −= Q θ & b

euξ euξ b ce

s

u

u

sgn(

e

)

=

)

(cid:145) Thành phần điều khiển chế độ trượt:

si

( δδ + b

a

ce

s

1 b b

1

e

u

−≤

η&⇒ V e

] 0 ≤

2 s

[ δδ + b

a

s

ce

b b

⎛ ⎜ ⎝ ổ

⎞ ⎟ ⎠ ⇒ Hệ thống ổn định ố

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

18

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

19

Sơ đồ khối hệ thống điều khiển thích nghi gián tiếp Sơ đồ khối hệ thống điều khiển thích nghi gián tiếp

Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ

(cid:145) Đặc tính động học của hệ thống mô tả bởi các phương trình sau:

sgn(

(

|2

=

( ( tku )(

)|)( )

& th )( 1

th )( 1

aCth )) 1 2

D

thg )( 1

th 2

)

1 1 hA ( 1 1

( (

|)( |)(

2

=

))( ))( t

( ( sgn( (

h& th )( )( 2

th h )( )( 1

aCth h )) )) 2 1

D

thg | h |2 )( )( 1

th h 2

aC D 2

gh h 2

)

1 1 hA ( 2 2 A

A

min

) )

A A

= =

+ +

hA hA ( ( i i i i

h h i i

min i

max h max

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

20

Điều khiển thích nghi trực tiếp Điều khiển thích nghi trực tiếp

L ậ điề khiể hồi iế ế

x )(

u

a

)(* x

+

=

[ −

ở (cid:145) Luật điều khiển hồi tiếp tuyến tính hóa lý tưởng: ])( tv

b

(cid:145) Dùng mô hình phi tuyến để nhận dạng trực tiếp u*(x):

í h hó lý 1 )( )( x

)(ˆ x )( x u u

x )( )( x

T ξθ ξθ= u u

)(ˆ xu

(cid:145) Mô hình có thể là mô hình mờ, mạng thần kinh hoặc mô hình

)(xuξ là vector độ đúng của mệnh đề điều kiện của mô hình mờ, vector ngõ ra lớp ẩn của mạng thần kinh, hoặc vector hàm cơ sở vector ngõ ra lớp ẩn của mạng thần kinh, hoặc vector hàm cơ sở phi tuyến tổng quát.

hộp đen phi tuyến tổng quát. hộp đen phi tuyến tổng quát

uθ u

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

21

g là vector thông số của mô hình.

(cid:145) Vector thông số được cập nhật trực tuyến để tiệm cận tiến tới giá

Điều khiển thích nghi trực tiếp (tt) Điều khiển thích nghi trực tiếp (tt)

ố ế ế ể

* *

arg

trị tối ưu:

x )(

u

=

* * θ u

T T ξθ u u

sup x S ∈

min θ Θ∈ u

x

⎧ ⎧ ⎨ ⎩

⎫ ⎫ ⎬ ⎭

)( xuδ )(δ

là à l ậ điề khiể hồi iế i ố iữ

*

u

G i (cid:145) Gọi là sai số giữa mô hình tối ưu và luật điều khiển hồi tiếp ô hì h ối tuyến tính hóa lý tưởng. Luật điều khiển tuyến tính hóa có thể biểu diễn như sau:

x )(

x )(

x )(

T * = ξθ u u

δ+ u

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

22

(cid:145) Sai lệch giữa luật điều khiển nhận dạng được và luật điều khiển hồi (cid:145) S i lệ h iữ l ật điề khiể à l ật điề khiể hồi hậ d

Điều khiển thích nghi trực tiếp (tt) Điều khiển thích nghi trực tiếp (tt)

đ

*

tiếp tuyến tính hóa:

)(ˆ u x )( u x

x )( )( x

x )( )( x

x )( )( x

~ T = ξθ ξθ = u u

δ δ− u

t )(

t )(

=

u u ~ θ u

θ u

* θ u

(cid:145) Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usd. hệ thống ổn định sử dụng thêm thành phần điều khiển trượt u d

(cid:145) Tín hiệu điều khiển là tổng gồm 2 thành phần:

(cid:142) û xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa lý tưởng (cid:142) usd đảm bảo hệ thống ổn định

u

+= ˆ

sduu

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

23

trong đó:

(b(cid:145)

( xb

) )

Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp

0

b

(

bị chặn: bị hặ

x

)

b

(

x

)

b

(

x

)

<

∞<

(cid:145) Đạo hàm theo thời gian của b(x) bị chặn bởi cận biết trước

|

& |)( b x

x )(

bD

)(t

ym )(t (cid:145) Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc r y r )()( )( t m

ym&

(cid:145) Sai số cấu trúc giữa luật điều khiển nhận dạng và luật điều khiển hồi ể

và các đạo hàm ,..., có thể đo được. ể

ố ấ ồ ề ề ể

tiếp tuyến tính hóa bị chặn bởi cận biết trước:

x )( )(

δ δ u

δ δ u

x )( L)( ∞∈

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

24

Trình tự thiết kế bộ điều khiển thích nghi: Trình tự thiết kế bộ điều khiển thích nghi:

(cid:145) Viết biểu thức mô tả động học sai số bám. ô ả độ (cid:145) Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và

Viế biể i ố bá hứ h

V&

(cid:145) Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ thuộc vào sai số thông số của mô hình)

sai số thông số). sai số thông số).

0

(cid:145) Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số ) khi sai số đạo hàm theo thời gian của hàm Lyapunov âm ( cấu trúc nằm trong giới hạn định trước.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

25

ố ố

(cid:145) Biểu thức mô tả động học sai số bám (cid:145) Biểu thức mô tả động học sai số bám

bu

+

e η

−=

+

s

s

~ T b ξθ u u

b δ u

sd

e &

(cid:145) Hàm Lyapunov:

V

=

+

1 2 1 se b 2

Thiết kế bộ điều khiển thích nghi trực tiếp Thiết kế bộ điều khiển thích nghi trực tiếp

1 ~1 ~ ~ ~ T Q θθ u uu 2

) )

= −=

+ +

+ +

V V &

ue ue s

sd d

e e δ δ us

− ξθ ξθ & uu

e e su

~T θ Q ( ( θ Q u

2 e e s

2 e η s b

b & 22 b

(cid:145) Luật thích nghi thông số:

⇒ ⇒

1−= Q& ξQ θ u u u u

eξ su su

u

e

sgn(

e

)

+

(cid:145) Thành phần điều khiển chế độ trượt:

sd

s

s

D b 2 2 2b b

⎛ ⎜⎜ = δ u ⎝ ⎝

⎞ ⎟⎟ ⎠ ⎠

0

−≤

V &

g g

2 e sη b

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

26

ổ ⇒ Hệ thống ổn định ố

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

27

Sơ đồ khối hệ thống điều khiển thích nghi trực tiếp Sơ đồ khối hệ thống điều khiển thích nghi trực tiếp

á

( )

á h

á độ

u(t): moment tác động lên trục quay của cánh tay máy ủ φ(t): góc quay (vị trí) của cánh tay máy, J: moment quán tính của cánh tay máy (J = 0.05 kg.m2) M: khối lượng của cánh tay máy (M = 1.0kg) M: khối lượng của cánh tay máy (M = 1 0kg) m: khối lượng vật nặng (m = 0.1 kg) l: chiều dài cánh tay máy (l = 0.4 m) lC : khoảng cách từ trọng tâm cánh tay máy đến trục lC : khoảng cách từ trọng tâm cánh tay máy đến trục

quay (lC = 0.15 m)

B: hệ số ma sát nhớt (B = 0.2 kg.m2/s) g: gia tốc trọng trường (g = 9.81 m/s2) g: gia tốc trọng trường (g = 9 81 m/s2)

(cid:145) Phương trình vi phân mô tả cánh tay máy 1 bậc tự do:

2

(

J

ml

(

ml

)

sin

t )(

tu )(

+

+

+

+

φ

=

)() t φ &&

)( tB φ &

gMl C

Thí dụ điều khiển thích nghi trực tiếp cánh tay máy Thí dụ điều khiển thích nghi trực tiếp cánh tay máy

ụ (cid:145) Giả sử trong quá trình vận hành, thông số cánh tay máy (thí dụ y ( g y , ậ

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

28

g q như trọng lượng tải) thay đổi.

(cid:145) Phương trình vi phân mô tả cánh tay máy 1 bậc tự do:

2

(

J

ml

(

ml

)

sin

t )(

tu )(

+

+

+

+

φ

=

)() t φ &&

tB )( φ &

gMl C

(cid:145) Đặt:

ty )(

t )(

φ=

Phương trình ngõ ra cánh tay máy Phương trình ngõ ra cánh tay máy

x

)( t

[

(

T )]

T )]

=

=

([ ), ( t t φφ &

), txtx ( 1

2

(cid:145) Phương trình ngõ ra cánh tay máy: (cid:145) Phương trình ngõ ra cánh tay máy:

a

b

x )( u

x + )(

y =&&

)

cos

tBx )( 2

tx )( 1

a

=x )(

ml ( ( J

gMl + C 2 ml ) +

=x )( b )(b x

)

(

J

1 2ml +

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

29

Sơ đồ mô phỏng hệ thống điều khiển thích nghi trực tiếp cánh tay máy Sơ đồ mô phỏng hệ thống điều khiển thích nghi trực tiếp cánh tay máy

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

30

Thiết kế bộ điều khiển thích nghi trực tiếp Thiết kế bộ điều khiển thích nghi trực tiếp

(cid:145) Sử dụng mạng thần (cid:145) Sử d thầ kinh RBF với 9 hàm để cơ sở ở lớp ẩn xấp xỉ trực tiếp tín hiệu điều khiển hồi tiếp tuyến tính hóa lý tiếp tuyến tính hóa lý tưởng: )(ˆ u x

x )(

T ξθ= u u

]T

2

9

[ θθ u 1

u

θ u

K

x )( )( x

x )( )( x

x )( )( x

]T)( ] x )( x

ξ ξ u

[ [ = ξ= ξ u

1

ξ ξ u

2

ξ ξ u

9

K

2

[(

)

2 ])

+

x 1

x 2

μ 2

μ 1 i

i

( 2 σ i

)6.0 )6.0

e e

( iσ ( =iσ

ξ x )(ui =x )( ξ i

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

31

Vị trí tâm các hàm cơ sở

ĐIỀU KHIỂN HỌC ĐIỀU KHIỂN HỌC

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

32

Khái niệm điều khiển học Khái niệm điều khiển học

(cid:145) Hệ thống điều khiển học là hệ thống điều khiển có khả năng cải (cid:145) Hệ thố ải là hệ thố thiện chất lượng điều khiển trong tương lai, dựa vào thông tin kinh nghiệm mà hệ thống thu thập được trong quá khứ, thông qua tương tác vòng kín với đối tượng và môi trường.

(cid:145) Đặc điểm của hệ thống điều khiển học: (cid:145) Đặc điểm của hệ thống điều khiển học:

(cid:142) Hệ thống điều khiển học có khả năng tự chủ (autonomy), vì nó

điề khiể h điề khiể ó khả ă

(cid:142) Hệ thống điều khiển học có bộ nhớ vì thông tin quá khứ là yếu tố

có thể cải thiện chất lượng của chính nó.

then chốt để cải thiện chất lượng tương lai.

(cid:142) Để cải thiện chất lượng, hệ thống điều khiển học phải nhận thông (cid:142) Để ải thiệ tin phải hồi chất lượng dựa trên một hàm mục tiêu mà hệ thống tìm cực trị.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

33

hất l điề khiể h hải hậ thô hệ thố

(cid:145) Giống nhau: (cid:145) Giống nhau:

(cid:142) Cả hệ thống điều khiển thích nghi và điều khiển học đều có thể thực thi bằng cách sử dụng các thuật toán chỉnh định thông số (cid:142) Hai phương pháp điều khiển đều sử dụng thông tin phản hồi chất lượng thu thập được qua tương tác vòng kín với đối tượng và môi trường. môi trường

(cid:145) Khác nhau:

So sánh điều khiển học và điều khiển thích nghi So sánh điều khiển học và điều khiển thích nghi

(cid:142) Hệ thống điều khiển thích nghi không có bộ nhớ nên phải chỉnh

Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là (cid:142) Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là khả năng sử dụng thông tin kinh nghiệm trong quá khứ.

(cid:142) Hệ thống điều khiển học có bộ nhớ lưu trữ các cấu trúc và thông số điều khiển đã học trong quá khứ > không cần quá trình thích số điều khiển đã học trong quá khứ -> không cần quá trình thích nghi khi tình huống thay đổi lặp lại tình huống trong quá khứ.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

34

định lại thông số khi ngay cả khi tình huống cũ lặp lại. ố ố

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

35

Sơ đồ khối hệ thống điều khiển học Sơ đồ khối hệ thống điều khiển học

(cid:145) Tra bảng: (cid:145) Tra bảng:

(cid:142) Phân chia không gian tín hiệu vào thành các miền rời nhau sao cho tín hiệu ra có thể được xác định bằng cách "tra bảng" tương ứng với miền tín hiệu vào.

Thực thi hệ thống điều khiển học Thực thi hệ thống điều khiển học

(cid:142) Rất nhiều hệ thống điều khiển học được thực hiện theo cách này. (cid:142) Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu (cid:142) Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu vào tăng lên khi không gian trạng thái tăng lên hoặc số miền phân chia mỗi chiều không gian trạng thái tăng lên.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

36

(cid:145) Xấp xỉ hàm: (cid:145) Xấp xỉ hàm:

Thực thi hệ thống điều khiển học Thực thi hệ thống điều khiển học

(cid:142) Các hệ thống điều khiển học cao cấp hơn có thể phát triển dựa trên cấu trúc toán học có thể xấp xỉ một họ các hàm liên tục; cấu trúc này có thể cố định hay biến đổi và có nhiều thông số tự do. (cid:142) Thực thi hệ thống điều khiển học bằng cách xấp xỉ hàm có một

ể ố ổ ố ế ề

số ưu điểm hơn so với các tra bảng: số ưu điểm hơn so với các tra bảng:

ầ ể ể ễ

(cid:131) Thứ nhất, các hàm liên tục nói chung được mô tả một cách hiệu quả hơn thông qua các thông số tự do, và do đó, cách ấ xấp xỉ hàm cần ít bộ nhớ hơn để biểu diễn một hàm liên tục so với cách tra bảng.

(cid:131) Thứ hai, cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức (cid:131) Thứ hai cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức

(cid:145) Các cấu trúc xấp xỉ hàm được sử dụng phổ biến: mạng thần kinh

là nội suy giữa những điểm tín hiệu vào).

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

37

(MLP, RBF) và mô hình mờ (Mamdani, Takagi - Sugeno)

Thí dụ điều khiển học dùng mạng RBF Thí dụ điều khiển học dùng mạng RBF

B

kuv )()(

x k ( ky )(

)1 =+ Cx =

(cid:145) Đối tượng mô tả bởi mô hình toán học: (cid:145) Đối tượng mô tả bởi mô hình toán học: xA v k )()( + ⎧ ⎨ )( k ⎩

.0

665

)2

vA )(

=

vv ( 0.1

95.0 0.0

⎤ ⎥ ⎦

v

e

1

+

B

v )(

=

⎛ ⎜⎜ 3.0 ⎝ ⎝

⎞ ⎟⎟ 1.1 ⎠ ⎠

− v 0.0

⎡ ⎢ ⎣ ⎡ ⎢ ⎢ ⎢ ⎢ ⎣

⎤ ⎥ ⎥ ⎥ ⎥ ⎦

]01=C [

(cid:145) Trong đó v là biến hoạch định điểm làm việc, giả sử v thay đổi theo

kv (

)1

k )(1.0)(9.0

kv

+

=

μ+

rand

])1 ,0([

k =μ )(

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

38

qui luật sau:

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

(cid:145) Giả thiết chúng ta chỉ biết bậc của hệ thống (bậc 2) mà không biết (cid:145) Giả thiết hú biết ảnh hưởng của điểm làm việc đến đặc tính động học của hệ thống như thế nào (tức là không biết cụ thể A(v) và B(v) phụ thuộc vào v như thế nào) ế

(cid:145) Mục tiêu điều khiển là bám theo tín hiệu vào với đáp ứng quá độ

t hỉ biết bậ ủ hệ thố (bậ 2) à khô

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

39

cho trước. cho trước

(cid:145) Sơ đồ khối hệ thống điều khiển học trực tiếp: (cid:145) S đồ khối hệ thố

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

40

điề khiể h tiế t

(cid:145) Mô hình chuẩn:

)( =sGm

m

s

1625 1625

+

)( )( ku

−=

+

.0 0025 s 8.0 80 .0 0 + (cid:145) Luật điều khiển hồi tiếp trạng thái: )( kxK )( 11 11

)( )( kxK 22 22

)( )( krK 3 3 (cid:142) K1, K2: độ lợi hồi tiếp trạng thái, K3: độ lợi đầu vào

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

41

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

(cid:145) Mục đích của HT ĐK học là nhận dạng và lưu trữ vector thông số ị của bộ điều khiển như là hàm của biến hoạch định điểm làm việc. (cid:142) Mạng RBF: 1 ngõ vào v, 3 ngõ ra K1, K2, K3 (cid:142) 31 tế bào thần kinh ở lớp ẩn phân bố đều trong đoạn

0357

.1 ,

0357

]

.0[−

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

42

ộ ạ ệ

(cid:145) Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện ể

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

ố ỗ ấ ẫ

(( (( kv

)) ))

)) ))

)) ))

(( kvK ((

các tác vụ sau: (cid:142) Đo lường biến hoạch định điểm làm việc (cid:142) Đo lường biến hoạch định điểm làm việc (cid:142) Đọc độ lợi điều khiển từ ngõ ra mạng RBF:

K

=

])) ]T ))

(( kvK (( 2 2

3 3

[ [ (( kvK (( 1 1 (cid:142) Tính tín hiệu điều khiển hồi tiếp trạng thái

ku )(

−=

+

kxK )( 22

krK )( 3

kxK )( 11 (cid:142) Xuất tín hiệu điều khiển tác động vào đối tượng (cid:142) Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

43

của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF

(cid:145) Thuật toán cập nhật trọng số mạng RBF: RBF hậ

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

ố á ậ

kvK ((

))

Th ậ (cid:142) Bước 1: giá trị hiệu chỉnh độ lợi điều khiển ở ngõ ra của mạng

=

ref

ke )(

k )(

RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn và tín hiệu ra của hệ thống theo công thức: ke )()( k δ φα

)( k kx )(

y [ [

] T ] T )( kr k )(

)( k k )(φ 1=φ

)( k kx )( 2

(cid:142) Bước 2: các trọng số lớp ra của mạng RBF được cập nhật bằng

;31..1

i (

j

)3..1

))

=

=

Trong đó: αlà hệ số dương nhỏ ky )( =

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

44

thuật toán suy giảm độ dốc: th ật t á iả độ dố l l )1( )( =+ kvKz (( w w δη− i j ij ij Trong đó: zi là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn. Trong đó: z là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

(cid:145) Mô phỏng kết quả: ả

kế

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

45

Mô hỏ (cid:142) Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần (cid:142) Ba giá trị đầu tiên của μ(k) được gán bằng 0.1; 0.3; 0.6 (cid:142) Ba giá trị đầu tiên của μ(k) được gán bằng 0 1; 0 3; 0 6 (cid:142) Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1]

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

(cid:145) Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K1(v) hái K ( ) l ậ điề khiể Độ l i hồi iế

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

46

ả h Kế

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

(cid:145) Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K2(v) hái K ( ) l ậ điề khiể Độ l i hồi iế

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

47

ả h Kế

Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)

(cid:145) Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K3(v) hái K ( ) l ậ điề khiể Độ l i hồi iế

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

48

ả h Kế

(cid:145) Đối tượng: (cid:145) Đối tượng:

Thí dụ điều khiển học mờ Thí dụ điều khiển học mờ

g g

=

0 0

tên lửa một tầng có mô hình toán học đơn giản cho bởi tên lửa một tầng có mô hình toán học đơn giản cho bởi

M

mt

aρ M

d mt

m −

AC −

⎛ )( tu tu )( ⎜ ⎜ ⎝ ⎝

⎞ −⎟ ⎟ ⎠ ⎠

⎛ 2 )(5.0 )(5.0 tv tv ⎜ ⎜ ⎝

⎞ ⎟ ⎟ ⎠

⎛ R ⎜⎜ ⎜⎜ )( tyR ⎝ +

⎞ ⎟⎟ −⎟⎟ ⎠

(cid:145) Bài toán đặt ra là điều khiển vận tốc của tên lửa theo tín hiệu đặt

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

49

phương trình: )( tdv dt

(cid:145) Sơ đồ khối hệ thống điều khiển học mờ: (cid:145) S đồ khối hệ thố ờ

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

50

điề khiể h

(cid:145) Cơ chế học của hệ thống như sau: (cid:145) Cơ chế học của hệ thống như sau:

(cid:142) Quan sát dữ liệu vào ra của hệ thống điều khiển mờ. (cid:142) Đánh giá chất lượng của hệ thống điều khiển. (cid:142) Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

(cid:142) Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

51

mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn trong sơ đồ điều khiển). trong sơ đồ điều khiển)

(cid:145) Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ (cid:145) Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

/)]1

T

ky )( ( ke −

gồm các qui tắc Sugeno với mệnh đề kết luận là hằng số. (cid:142) Tín hiệu vào của bộ điều khiển PD mờ là:

ke )( = )( ke Δ ề

kr )( − )([ ke = ể

(cid:131) sai số (cid:131) biến thiên sai số:

(cid:142) Tín hiệu ra của bộ điều khiển là u(k). Các hệ số chuẩn hóa ở ngõ và ngõ ra của bộ điều khiển là KE, KD, và KU được chọn như sau:

10000

=EK

=DK

=UK

1 1 4000

1 1 2000

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

52

ố ẩ

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

(cid:145) Hàm liên thuộc của các tập mờ định nghĩa cho biến vào e(k) và Δe(k): (cid:145) Hà (k) à Δ (k) ờ đị h

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

53

liê th ộ h biế á tậ hĩ ủ à

(cid:145) Các qui tắc điều khiển có dạng: (cid:145) Cá i tắ điề khiể

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

54

ó d

(cid:145) Mô hình chuẩn:

=

2.0

sYm )( sR )(

s

2.0 +

(cid:145) Chất lượng của hệ thống được tính bằng sai lệch giữa tín hiệu ra của

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

k )(

y

k )(

ky )(

=

e m

m

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

55

mô hình chuẩn và tín hiệu ra của đối tượng:

(cid:145) Cơ chế học: (cid:145) Cơ chế học:

(cid:142) Nếu chất lượng mong muốn được thỏa mãn (em(k)≈0) thì cơ chế

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

(cid:142) Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em(k)

học sẽ không điều chỉnh bộ điều khiển mờ.

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

56

lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ

(cid:145) Mô hình ngược mờ: (cid:145) Mô hình ngược mờ:

(cid:142) Mô hình ngược mờ mô tả định tính đặc tính động học ngược của

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

(cid:142) Mô hình ngược được dùng để xác định sự thay đổi ở ngõ vào của đối tượng làm cho ngõ ra của đối tượng giống như ngõ ra của mô hình chuẩn. hình chuẩn

(cid:142) Tín hiệu vào mô hình ngược là: em(k) và Δem(k) p( ) (cid:142) Tín hiệu ra mô hình ngược là: p(k) g (cid:142) Các hệ số chuẩn hóa:

10000 10000

=EmK =EK

=PK =K

=DmK =K

1 4000

1 2000

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

57

đối tượng điều khiển.

(cid:145) Hệ qui tắc mô tả mô hình ngược mờ: (cid:145) Hệ qui tắc mô tả mô hình ngược mờ:

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

58

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

(cid:145) Khối điều chỉnh cơ sở tri thức: (cid:145) Khối điều chỉnh cơ sở tri thức:

(cid:142) Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

(cid:142) Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là

điều khiển tốt hơn.

(* ku

)1

ku (

kp )(

=

)1 +−

(cid:142) Muốn đạt được điều này ngõ ra của các qui tắc mờ tác động ở (cid:142) M ốn đạt được điề nà ngõ ra của các q i tắc mờ tác động ở thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là:

k )( )( k

( (

k k

kp )( )( kp

)1 )1 +− +

)( k kp )(

=

α α i

=α α i

)( kp p )( UK

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

59

p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi một lượng là p(k).

(cid:145) Kết quả điều khiển: (cid:145) Kết quả điều khiển:

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

60

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)

(cid:145) Sai số điều khiển: (cid:145) Sai số điều khiển:

10 June 2010

© H. T. Hoàng - ÐHBK TPHCM

61

Thí dụ điều khiển học mờ (tt) Thí dụ điều khiển học mờ (tt)