Moân hoïc Moân hoïc
HEÄ THOÁNG ÑIEÀU KHIEÅN THOÂNG MINH HEÄ THOÁNG ÑIEÀU KHIEÅN THOÂNG MINH
â Ñi à Khi å Tö Ñ ä
Giaûng vieân: TS. Huyønh Thaùi Hoaøng Boä moân Ñieàu Khieån Töï Ñoäng B ä Khoa Ñieän – Ñieän Töû Ñaïi hoïc Baùch Khoa TP.HCM Email: hthoang@hcmut.edu.vn Email: hthoang@hcmut edu vn Homepage: http://www4.hcmut.edu.vn/~hthoang
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
1
Chöông 5 Chöông 5
ĐIỀU KHIỂN THÍCH NGHI ĐIỀU KHIỂN THÍCH NGHI
VÀ ĐIỀU KHIỂN HỌC VÀ ĐIỀU KHIỂN HỌC
À Ề À Ề
Ể Ể
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
2
Noäi dung chöông 4 Noäi dung chöông 4
(cid:145) Điều khiển thích nghi hi (cid:145) Điều khiển học
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
3
Điề khiể hí h
ĐIỀU KHIỂN THÍCH NGHI ĐIỀU KHIỂN THÍCH NGHI
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
4
Sơ đồ khối hệ thống điều khiển thích nghi Sơ đồ khối hệ thống điều khiển thích nghi
(cid:145) Hệ thống điều khiển trong đó thông số (và cấu trúc) của bộ điều (cid:145) Hệ thố đó thô t ú ) ủ bộ điề khiển thay đổi trong quá trình vận hành nhằm đảm bảo chất lượng điều khiển khi có sự hiện diện của các yếu tố bất định hoặc biến đổi không biết trước gọi là hệ thống điều khiển thích nghi.
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
5
t điề khiể ố ( à ấ
(cid:145) Đối tượng: (cid:145) Đối t
ặ
g
(cid:142) Tuyến tính hoặc phi tuyến g) (cid:142) SISO hoặc MIMO (vuông, không vuông) g, ( (cid:142) Hệ có bậc tương đối tổng quát (cid:142) Có nhiễu hệ thống, nhiễu đo lường ồ
(cid:145) Thông tin phản hồi:
(cid:142) Trạng thái (cid:142) Ngõ ra (cid:142) Ngõ ra
(cid:145) Cơ sở của thuật toán điều khiển thích nghi: p
y
(cid:142) Điều khiển hồi tiếp tuyến tính hóa (cid:142) Điều khiển trượt (cid:145) Thuật toán thích nghi: (cid:142) Liên tục hoặc rời rạc
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
6
Phân loại hệ thống điều khiển thích nghi Phân loại hệ thống điều khiển thích nghi
(cid:145) Đối tượng: hệ phi tuyến SISO mô tả bởi phương trình vi phân: (cid:145) Đối t
Đặt bài toán Đặt bài toán
ế SISO ô tả bởi h t ì h i hâ hệ hi t
u )( xg
+
x & y
xf )( )( xh
= =
⎧ ⎨ ⎨ ⎩
(cid:145) Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt (cid:145) Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
7
ym(t)
(cid:145) Nếu đối tượng có bậc tương đối bằng r, đối tượng có thể được mô tả (cid:145) Nế đối t ô tả
Đối tượng điều khiển Đối tượng điều khiển
ó thể đ đối bằ đối t
y r )( y
a a
b b
ó bậ t bằng phương trình sau:
x )( )( x
u u
= =
x + )( )( x +
(cid:145) Trong đó:
a
x )(
x )(
b
x )(
x )(
0
r hL f= =
≠
r 1 1 − hLL f
g
L
với:
x )(
xf )(
,
,
f
(
x
),
f
x )(
.
=
φ
=
[
]T
1
f
n
K
K
x )( φ ∂ x ∂
x )( φ ∂ x ∂ 1
n
⎡ ⎡ ⎢ ⎣
⎤ ⎤ ⎥ ⎦
.
xf )(
x )(
φ
=
k L f
x )( x )(
xg )(.
x )(
=
φ
k LL g f
x )( ∂ φ x ∂ ∂ − φkL k )(1 1 L x )( φ ∂ f x ∂ ∂ φk L fL φ ∂ f x ∂
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
8
(cid:145) Luật điều khiển hồi tiếp tuyến tính hóa: (cid:145) L ật điề khiể hồi tiế t
Luật điều khiển hồi tiếp tuyến tính hóa Luật điều khiển hồi tiếp tuyến tính hóa
u
ế tí h hó
)(* x
a
x )(
=
+
[ −
])( tv
1 )(b x )( x b
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
9
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
10
Các giả thiết Các giả thiết
0= 0
(cid:145) Đặc tính động học của sai số bám:
Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa
s
s
e η& e +
(cid:145) Chọn hàm Lyapunov: hà L
ố
V = V
1 21 2 se 2
(cid:145) Dễ dàng thấy ràng: (cid:145) Dễ dàng thấy ràng:
0≤ 0
0≥V eeV eeV = = &
s
s
2 ≤ s
e e = η −= η&
Ch
0 0
)( →tes )( →teo
khi khi
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
11
ố ằ ⇒ Hệ thống ổn định ∞→t ⇒ ⇒ ∞→t ⇒ y(t) bám theo ym(t) với sai số xác lập bằng 0
(cid:145) Điều khiển thích nghi trên cơ sở xấp xỉ luật điều khiển hồi tiếp tuyến ở ấ
Ý tưởng điều khiển thích nghi Ý tưởng điều khiển thích nghi
ỉ l ậ điề khiể hồi iế hi ê hí h ế
u u
Điề khiể tính hóa :
)(* x )( x
a a
x )( )( x
= =
+ +
[ [ −
])( ])( tv tv
1 x )(
b
(cid:145) Lý do: (cid:145) Lý do:
(cid:142) hàm a(x) và b(x) chưa biết (cid:142) hoặc hàm a(x) và b(x) đã biết nhưng thay đổi trong quá trình vận
(cid:145) Hai phương pháp điều khiển thích nghi: (cid:145) Hai phương pháp điều khiển thích nghi: (cid:142) Điều khiển thích nghi gián tiếp (cid:142) Điều khiển thích nghi trực tiếp
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
12
hành
Điều khiển thích nghi gián tiếp Điều khiển thích nghi gián tiếp
)(ˆ xa à)(ˆ
)(ˆb )( xb
( ) à b( ) dù ô hì h ế
Nhậ d (cid:145) Nhận dạng trực tuyến a(x) và b(x) dùng mô hình và , sau đó tính tín hiệu điều khiển theo nguyên lý chắc chắn tương đương.
x )(
)(ˆ x a
=
+
[ −
])( tv
uce
1 )(ˆ x b
)(ˆ xa
(cid:145) Mô hình và có thể là mô hình mờ, mạng thần kinh hoặc mô
)(ˆ xb
hình hộp đen phi tuyến tổng quát.
x )(
T ξθ= a a
)(ˆ a x )(ˆ )( x b
)( )( x
T b ξ ξθ= b b b
aθ
bθ
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
13
Các vector và là vector thông số của mô hình.
(cid:145) Các vector thông số và được cập nhật trực tuyến để tiệm cận
Điều khiển thích nghi gián tiếp (tt) Điều khiển thích nghi gián tiếp (tt)
aθ
bθ
ế ể
arg arg
ố tiến tới giá trị tối ưu:
x )( )( x
b b
x )( )( x
=
−
* θ θ b
Tξθ ξθ b b
b
min min θ Ω∈ b
sup sup xSx ∈
arg arg
x )( )( x
a a
x )( )( x
=
−
* θ θ a
Tξθ ξθ a a
min min Ω∈ θ a
a
sup sup xSx ∈
⎧ ⎨ ⎨ ⎩ ⎧ ⎨ ⎨ ⎩
⎫ ⎬ ⎬ ⎭ ⎫ ⎬ ⎬ ⎭
)( xbδ )(δ
)( xaδ )(δ
à ô hì h ối i ố iữ í h độ à đặ là h
a
G i (cid:145) Gọi và là sai số giữa mô hình tối ưu và đặc tính động học chính xác của đối tượng. Mô hình đúng của đối tượng có thể biểu diễn như sau:
x )(
x )(
x )(
T * = ξθ a a
δ+ a
b
x )(
x )(
x )(
T * = ξθ b b
δ+ b
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
14
(cid:145) Sai lệch giữa mô hình nhận dạng được và mô hình đúng của hệ thống:
Điều khiển thích nghi gián tiếp (tt) Điều khiển thích nghi gián tiếp (tt)
a
ố
x )(
x )(
x )(
−
=
δ− a
)(ˆ x a )(ˆ x b
x )(
x )(
−
=
~ T )( t ξθ a a ~ T )( t ξθ b b
δ− b
)( t
)( t
=
−
t )(
t )(
=
−
trong đó:
)( x b ~ θ a ~ θ b
θ a θ b
* θ a * θ b
g g
u
u
(cid:145) Tín hiệu điều khiển là tổng gồm 2 thành phần: (cid:142) uce điều khiển hệ thống bám quỹ đạo chuẩn (cid:142) usi đảm bảo hệ thống ổn định u =
+
ce
si
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
15
g (cid:145) Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usi.
( xb
)
(cid:145)
Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp
0
b
bị chặn:
x )(
b
(
x
)
b
(
x
)
<
≤
≤
∞<
)(t
ym )(t (cid:145) Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc r y r )()( t m
ym&
(cid:145) Sai số cấu trúc giữa mô hình và đặc tính chính xác của đối tượng bị
và các đạo hàm ,..., có thể đo được.
chặn bởi các cận biết trước:
x )(
≤
δ a
δ a
x L)( ∞∈
)( )( x
≤
δ b b
δ b b
)( L)( x ∞∈ ∞
10 June 2010
© H. T. Hoàng - ÐHBK TPHCM
16
Trình tự thiết kế bộ điều khiển thích nghi: Trình tự thiết kế bộ điều khiển thích nghi:
(cid:145) Viết biểu thức mô tả động học sai số bám. ô ả độ (cid:145) Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và
Viế biể i ố bá hứ h
V&
(cid:145) Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ thuộc vào sai số thông số của mô hình)
sai số thông số). sai số thông số).
0 (cid:145) Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo
đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số
) khi sai số
đạo hàm theo thời gian của hàm Lyapunov âm (
cấu trúc nằm trong giới hạn định trước. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 17 ố ố Thiết kế bộ điều khiển thích nghi gián tiếp
Thiết kế bộ điều khiển thích nghi gián tiếp )) a ( b ( ))
u b + − − s s ce si e
e
+η& V = + + a (cid:145) Hàm Lyapunov: 1 2
1 2
se
2 1
~1
T
T
a
2 1
~1
T
T
b
2 bu ( u ) ⇒ ) ) −= − + + + V
& 2
e
η
s e
s si e
s δδ
−
−
b a ce +
ξθ
&
aa e
sa ~
T
θ
a ue
sb ce ~
T
θ
b
b +
ξθ
&
bb
b (cid:145) Luật thích nghi thông số: eξ
sa θ
&
a 1−−= Q
a
1−−= Q
b θ −= Q
θ
&
b euξ
euξ
b
ce s u u sgn( e ) = ) (cid:145) Thành phần điều khiển chế độ trượt: si (
δδ +
b a ce s 1
b
b 1 e u − −≤ − η&⇒
V
e ] 0
≤ 2
s [
δδ
+
b a s ce b
b ⎛
⎜
⎝
ổ ⎞
⎟
⎠
⇒ Hệ thống ổn định
ố 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 18 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 19 Sơ đồ khối hệ thống điều khiển thích nghi gián tiếp
Sơ đồ khối hệ thống điều khiển thích nghi gián tiếp (cid:145) Đặc tính động học của hệ thống mô tả bởi các phương trình sau: sgn( ( |2 = − − − &
th
)(
1 th
)(
1 aCth
))
1
2 D thg
)(
1 th
2 ) 1
1
hA
(
1
1 (
( |)(
|)( 2 = − − − h&
th
)(
)(
2 th
h
)(
)(
1 aCth
h
))
))
2
1 D thg
|
h
|2
)(
)(
1 th
h
2 aC
D
2 gh
h
2 ) 1
1
hA
(
2
2
A A − min )
) A
A =
= +
+ hA
hA
(
(
i
i
i
i h
h
i
i min
i max
h
max 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 20 Điều khiển thích nghi trực tiếp
Điều khiển thích nghi trực tiếp L ậ điề khiể hồi iế ế u a + = [
− ở
(cid:145) Luật điều khiển hồi tiếp tuyến tính hóa lý tưởng:
])(
tv b (cid:145) Dùng mô hình phi tuyến để nhận dạng trực tiếp u*(x): í h hó lý
1
)(
)(
x T
ξθ
ξθ=
u
u )(ˆ xu (cid:145) Mô hình có thể là mô hình mờ, mạng thần kinh hoặc mô hình )(xuξ
là vector độ đúng của mệnh đề điều kiện của mô hình mờ,
vector ngõ ra lớp ẩn của mạng thần kinh, hoặc vector hàm cơ sở
vector ngõ ra lớp ẩn của mạng thần kinh, hoặc vector hàm cơ sở
phi tuyến tổng quát. hộp đen phi tuyến tổng quát.
hộp đen phi tuyến tổng quát uθ
u 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 21 g là vector thông số của mô hình. (cid:145) Vector thông số được cập nhật trực tuyến để tiệm cận tiến tới giá Điều khiển thích nghi trực tiếp (tt)
Điều khiển thích nghi trực tiếp (tt) uθ ố ế ế ể *
* arg trị tối ưu: u = − *
*
θ
u T
T
ξθ
u
u min
θ
Θ∈
u x ⎧
⎧
⎨
⎩ ⎫
⎫
⎬
⎭ )( xuδ
)(δ là à l ậ điề khiể hồi iế i ố iữ * u G i
(cid:145) Gọi là sai số giữa mô hình tối ưu và luật điều khiển hồi tiếp
ô hì h ối
tuyến tính hóa lý tưởng. Luật điều khiển tuyến tính hóa có thể biểu
diễn như sau: T
*
= ξθ
u
u δ+
u 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 22 (cid:145) Sai lệch giữa luật điều khiển nhận dạng được và luật điều khiển hồi
(cid:145) S i lệ h iữ l ật điề khiể
à l ật điề khiể hồi
hậ d Điều khiển thích nghi trực tiếp (tt)
Điều khiển thích nghi trực tiếp (tt) đ * tiếp tuyến tính hóa: − ~
T
= ξθ
ξθ
=
u
u δ
δ−
u t
)( t
)( = − u
u
~
θ
u θ
u *
θ
u (cid:145) Sai số mô hình luôn tồn tại trong các ứng dụng thực tế. Để đảm bảo
hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usd.
hệ thống ổn định sử dụng thêm thành phần điều khiển trượt u d (cid:145) Tín hiệu điều khiển là tổng gồm 2 thành phần: (cid:142) û xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa lý tưởng
(cid:142) usd đảm bảo hệ thống ổn định u += ˆ sduu 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 23 trong đó: (b(cid:145) ( xb )
) Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp
Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp 0 b ( bị chặn:
bị hặ ) b ( ) b ( ) < ≤ ≤ ∞< (cid:145) Đạo hàm theo thời gian của b(x) bị chặn bởi cận biết trước | ≤ bD )(t ym
)(t
(cid:145) Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc r
y r
)()(
)(
t
m ym& (cid:145) Sai số cấu trúc giữa luật điều khiển nhận dạng và luật điều khiển hồi
ể và các đạo hàm ,..., có thể đo được. ể ố ấ ồ ề ề ể tiếp tuyến tính hóa bị chặn bởi cận biết trước: ≤ δ
δ
u δ
δ
u 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 24 Trình tự thiết kế bộ điều khiển thích nghi:
Trình tự thiết kế bộ điều khiển thích nghi: (cid:145) Viết biểu thức mô tả động học sai số bám.
ô ả độ
(cid:145) Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và Viế biể i ố bá hứ h V& (cid:145) Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu
khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ
thuộc vào sai số thông số của mô hình) sai số thông số).
sai số thông số). 0 (cid:145) Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo
đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số
) khi sai số
đạo hàm theo thời gian của hàm Lyapunov âm (
cấu trúc nằm trong giới hạn định trước. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 25 ố ố (cid:145) Biểu thức mô tả động học sai số bám
(cid:145) Biểu thức mô tả động học sai số bám bu + e
η −= + − s s ~
T
b
ξθ
u
u b
δ
u sd e
& (cid:145) Hàm Lyapunov: V = + 1 2
1
se
b
2 Thiết kế bộ điều khiển thích nghi trực tiếp
Thiết kế bộ điều khiển thích nghi trực tiếp )
) =
−= − +
+ +
+ − V
V
& ue
ue
s sd
d e
e
δ
δ
us −
ξθ
ξθ
&
uu e
e
su ~T
θ Q
(
(
θ Q
u 2
e
e
s 2
e
η
s
b b
&
22
b (cid:145) Luật thích nghi thông số: ⇒
⇒ 1−= Q&
ξQ
θ
u
u
u
u eξ
su
su u e sgn( e ) + (cid:145) Thành phần điều khiển chế độ trượt: sd s s D
b
2 2
2b
b ⎛
⎜⎜
= δ
u
⎝
⎝ ⎞
⎟⎟
⎠
⎠ 0 −≤ ≤ V
& g g 2
e
sη
b ⇒ 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 26 ổ ⇒ Hệ thống ổn định
ố 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 27 Sơ đồ khối hệ thống điều khiển thích nghi trực tiếp
Sơ đồ khối hệ thống điều khiển thích nghi trực tiếp á lê ( ) á h á độ u(t): moment tác động lên trục quay của cánh tay máy
ủ
φ(t): góc quay (vị trí) của cánh tay máy,
J: moment quán tính của cánh tay máy (J = 0.05 kg.m2)
M: khối lượng của cánh tay máy (M = 1.0kg)
M: khối lượng của cánh tay máy (M = 1 0kg)
m: khối lượng vật nặng (m = 0.1 kg)
l: chiều dài cánh tay máy (l = 0.4 m)
lC : khoảng cách từ trọng tâm cánh tay máy đến trục
lC : khoảng cách từ trọng tâm cánh tay máy đến trục quay (lC = 0.15 m) B: hệ số ma sát nhớt (B = 0.2 kg.m2/s)
g: gia tốc trọng trường (g = 9.81 m/s2)
g: gia tốc trọng trường (g = 9 81 m/s2) (cid:145) Phương trình vi phân mô tả cánh tay máy 1 bậc tự do: 2 ( J ml ( ml ) sin t
)( tu
)( + + + + φ = )()
t
φ
&& )(
tB
φ
& gMl
C Thí dụ điều khiển thích nghi trực tiếp cánh tay máy
Thí dụ điều khiển thích nghi trực tiếp cánh tay máy ụ
(cid:145) Giả sử trong quá trình vận hành, thông số cánh tay máy (thí dụ y ( g y , ậ 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 28 g q
như trọng lượng tải) thay đổi. (cid:145) Phương trình vi phân mô tả cánh tay máy 1 bậc tự do: 2 ( J ml ( ml ) sin t
)( tu
)( + + + + φ = )()
t
φ
&& tB
)(
φ
& gMl
C (cid:145) Đặt: ty
)( t
)( φ= Phương trình ngõ ra cánh tay máy
Phương trình ngõ ra cánh tay máy )(
t [ ( T
)] T
)] = = ([
),
(
t
t
φφ & ),
txtx
(
1 2 (cid:145) Phương trình ngõ ra cánh tay máy:
(cid:145) Phương trình ngõ ra cánh tay máy: a b y
=&& ) cos − − tBx
)(
2 tx
)(
1 a =x
)( ml
(
(
J gMl
+
C
2
ml
)
+ =x
)(
b
)(b x ) ( J 1
2ml
+ 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 29 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 30 Thiết kế bộ điều khiển thích nghi trực tiếp
Thiết kế bộ điều khiển thích nghi trực tiếp T
ξθ=
u
u =θ ]T 2 9 [
θθ
u
1 u θ
u K ξ
ξ
u [
[
=
ξ=
ξ
u 1 ξ
ξ
u 2 ξ
ξ
u 9 K 2 [( ) 2
]) − − + x
1 x
2 μ
2 μ
1
i i − (
2
σ
i )6.0
)6.0 e
e ( iσ
(
=iσ ξ x
)(ui
=x
)(
ξ
i 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 31 Vị trí tâm các hàm cơ sở 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 32 Khái niệm điều khiển học
Khái niệm điều khiển học (cid:145) Hệ thống điều khiển học là hệ thống điều khiển có khả năng cải
(cid:145) Hệ thố
ải
là hệ thố
thiện chất lượng điều khiển trong tương lai, dựa vào thông tin kinh
nghiệm mà hệ thống thu thập được trong quá khứ, thông qua tương
tác vòng kín với đối tượng và môi trường. (cid:145) Đặc điểm của hệ thống điều khiển học:
(cid:145) Đặc điểm của hệ thống điều khiển học: (cid:142) Hệ thống điều khiển học có khả năng tự chủ (autonomy), vì nó điề khiể h điề khiể ó khả ă (cid:142) Hệ thống điều khiển học có bộ nhớ vì thông tin quá khứ là yếu tố có thể cải thiện chất lượng của chính nó. then chốt để cải thiện chất lượng tương lai. (cid:142) Để cải thiện chất lượng, hệ thống điều khiển học phải nhận thông
(cid:142) Để ải thiệ
tin phải hồi chất lượng dựa trên một hàm mục tiêu mà hệ thống
tìm cực trị. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 33 hất l điề khiể h hải hậ thô hệ thố (cid:145) Giống nhau:
(cid:145) Giống nhau: (cid:142) Cả hệ thống điều khiển thích nghi và điều khiển học đều có thể
thực thi bằng cách sử dụng các thuật toán chỉnh định thông số
(cid:142) Hai phương pháp điều khiển đều sử dụng thông tin phản hồi chất
lượng thu thập được qua tương tác vòng kín với đối tượng và
môi trường.
môi trường (cid:145) Khác nhau: So sánh điều khiển học và điều khiển thích nghi
So sánh điều khiển học và điều khiển thích nghi (cid:142) Hệ thống điều khiển thích nghi không có bộ nhớ nên phải chỉnh Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là
(cid:142) Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là
khả năng sử dụng thông tin kinh nghiệm trong quá khứ. (cid:142) Hệ thống điều khiển học có bộ nhớ lưu trữ các cấu trúc và thông
số điều khiển đã học trong quá khứ > không cần quá trình thích
số điều khiển đã học trong quá khứ -> không cần quá trình thích
nghi khi tình huống thay đổi lặp lại tình huống trong quá khứ. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 34 định lại thông số khi ngay cả khi tình huống cũ lặp lại. ố ố 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 35 Sơ đồ khối hệ thống điều khiển học
Sơ đồ khối hệ thống điều khiển học (cid:145) Tra bảng:
(cid:145) Tra bảng: (cid:142) Phân chia không gian tín hiệu vào thành các miền rời nhau sao
cho tín hiệu ra có thể được xác định bằng cách "tra bảng" tương
ứng với miền tín hiệu vào. Thực thi hệ thống điều khiển học
Thực thi hệ thống điều khiển học (cid:142) Rất nhiều hệ thống điều khiển học được thực hiện theo cách này.
(cid:142) Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu
(cid:142) Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu
vào tăng lên khi không gian trạng thái tăng lên hoặc số miền
phân chia mỗi chiều không gian trạng thái tăng lên. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 36 ề (cid:145) Xấp xỉ hàm:
(cid:145) Xấp xỉ hàm: Thực thi hệ thống điều khiển học
Thực thi hệ thống điều khiển học (cid:142) Các hệ thống điều khiển học cao cấp hơn có thể phát triển dựa
trên cấu trúc toán học có thể xấp xỉ một họ các hàm liên tục; cấu
trúc này có thể cố định hay biến đổi và có nhiều thông số tự do.
(cid:142) Thực thi hệ thống điều khiển học bằng cách xấp xỉ hàm có một ể ố ổ ố ế ề số ưu điểm hơn so với các tra bảng:
số ưu điểm hơn so với các tra bảng: ầ ể ể ễ (cid:131) Thứ nhất, các hàm liên tục nói chung được mô tả một cách
hiệu quả hơn thông qua các thông số tự do, và do đó, cách
ấ
xấp xỉ hàm cần ít bộ nhớ hơn để biểu diễn một hàm liên tục
so với cách tra bảng. (cid:131) Thứ hai, cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức
(cid:131) Thứ hai cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức (cid:145) Các cấu trúc xấp xỉ hàm được sử dụng phổ biến: mạng thần kinh là nội suy giữa những điểm tín hiệu vào). 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 37 (MLP, RBF) và mô hình mờ (Mamdani, Takagi - Sugeno) Thí dụ điều khiển học dùng mạng RBF
Thí dụ điều khiển học dùng mạng RBF kuv
)()( .0 665 )2 − − vA
)( = vv
(
0.1 95.0
0.0 ⎤
⎥
⎦ v − e 1 + v
)( = ⎛
⎜⎜
3.0
⎝
⎝ ⎞
⎟⎟
1.1
⎠
⎠ −
v
0.0 ⎡
⎢
⎣
⎡
⎢
⎢
⎢
⎢
⎣ ⎤
⎥
⎥
⎥
⎥
⎦ ]01=C
[ (cid:145) Trong đó v là biến hoạch định điểm làm việc, giả sử v thay đổi theo kv
( )1 k
)(1.0)(9.0 kv + = μ+ rand ])1 ,0([ k =μ
)( 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 38 qui luật sau: Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) (cid:145) Giả thiết chúng ta chỉ biết bậc của hệ thống (bậc 2) mà không biết
(cid:145) Giả thiết hú
biết
ảnh hưởng của điểm làm việc đến đặc tính động học của hệ thống
như thế nào (tức là không biết cụ thể A(v) và B(v) phụ thuộc vào v
như thế nào)
ế (cid:145) Mục tiêu điều khiển là bám theo tín hiệu vào với đáp ứng quá độ t hỉ biết bậ ủ hệ thố (bậ 2) à khô 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 39 cho trước.
cho trước (cid:145) Sơ đồ khối hệ thống điều khiển học trực tiếp:
(cid:145) S đồ khối hệ thố Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 40 điề khiể h tiế t (cid:145) Mô hình chuẩn: )( =sGm m s 1625
1625 + )(
)(
ku −= + − .0
0025
s
8.0
80
.0
0
+
(cid:145) Luật điều khiển hồi tiếp trạng thái:
)(
kxK
)(
11
11 )(
)(
kxK
22
22 )(
)(
krK
3
3
(cid:142) K1, K2: độ lợi hồi tiếp trạng thái, K3: độ lợi đầu vào 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 41 Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) (cid:145) Mục đích của HT ĐK học là nhận dạng và lưu trữ vector thông số
ị
của bộ điều khiển như là hàm của biến hoạch định điểm làm việc.
(cid:142) Mạng RBF: 1 ngõ vào v, 3 ngõ ra K1, K2, K3
(cid:142) 31 tế bào thần kinh ở lớp ẩn phân bố đều trong đoạn 0357 .1 , 0357 ] .0[− 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 42 ộ ạ ệ (cid:145) Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện
ể Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) ố ỗ ấ ẫ ((
((
kv ))
)) ))
)) ))
)) ((
kvK
(( các tác vụ sau:
(cid:142) Đo lường biến hoạch định điểm làm việc
(cid:142) Đo lường biến hoạch định điểm làm việc
(cid:142) Đọc độ lợi điều khiển từ ngõ ra mạng RBF: = ]))
]T
)) ((
kvK
((
2
2 3
3 [
[
((
kvK
((
1
1
(cid:142) Tính tín hiệu điều khiển hồi tiếp trạng thái ku
)( −= − + kxK
)(
22 krK
)(
3 kxK
)(
11
(cid:142) Xuất tín hiệu điều khiển tác động vào đối tượng
(cid:142) Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 43 của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF
của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF (cid:145) Thuật toán cập nhật trọng số mạng RBF:
RBF
hậ Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) ố á ậ kvK
(( )) Th ậ
(cid:142) Bước 1: giá trị hiệu chỉnh độ lợi điều khiển ở ngõ ra của mạng = ref ke
)( k
)( RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn
RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn
và tín hiệu ra của hệ thống theo công thức:
ke
)()(
k
δ
φα − )(
k
kx
)( y
[
[ ] T
] T
)(
kr
k
)( )(
k
k
)(φ
1=φ )(
k
kx
)(
2 (cid:142) Bước 2: các trọng số lớp ra của mạng RBF được cập nhật bằng ;31..1 i
( j )3..1 )) = = Trong đó: αlà hệ số dương nhỏ
ky
)(
= 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 44 thuật toán suy giảm độ dốc:
th ật t á
iả
độ dố
l
l
)1(
)(
=+
kvKz
((
w
w
δη−
i
j
ij
ij
Trong đó: zi là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn.
Trong đó: z là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) (cid:145) Mô phỏng kết quả:
ả kế 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 45 Mô hỏ
(cid:142) Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần
(cid:142) Ba giá trị đầu tiên của μ(k) được gán bằng 0.1; 0.3; 0.6
(cid:142) Ba giá trị đầu tiên của μ(k) được gán bằng 0 1; 0 3; 0 6
(cid:142) Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1] Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) (cid:145) Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K1(v)
hái K ( )
l ậ điề khiể Độ l i hồi iế 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 46 ả h Kế Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) (cid:145) Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K2(v)
hái K ( )
l ậ điề khiể Độ l i hồi iế 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 47 ả h Kế Thí dụ điều khiển học dùng mạng RBF (tt)
Thí dụ điều khiển học dùng mạng RBF (tt) (cid:145) Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K3(v)
hái K ( )
l ậ điề khiể Độ l i hồi iế 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 48 ả h Kế (cid:145) Đối tượng:
(cid:145) Đối tượng: Thí dụ điều khiển học mờ
Thí dụ điều khiển học mờ g
g = 0
0 tên lửa một tầng có mô hình toán học đơn giản cho bởi
tên lửa một tầng có mô hình toán học đơn giản cho bởi M mt aρ
M d
mt m
− AC
− ⎛
)(
tu
tu
)(
⎜
⎜
⎝
⎝ ⎞
−⎟
⎟
⎠
⎠ ⎛
2
)(5.0
)(5.0
tv
tv
⎜
⎜
⎝ ⎞
⎟
⎟
⎠ ⎛
R
⎜⎜
⎜⎜
)(
tyR
⎝ + ⎞
⎟⎟
−⎟⎟
⎠ (cid:145) Bài toán đặt ra là điều khiển vận tốc của tên lửa theo tín hiệu đặt 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 49 phương trình:
)(
tdv
dt (cid:145) Sơ đồ khối hệ thống điều khiển học mờ:
(cid:145) S đồ khối hệ thố
ờ Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 50 điề khiể h (cid:145) Cơ chế học của hệ thống như sau:
(cid:145) Cơ chế học của hệ thống như sau: (cid:142) Quan sát dữ liệu vào ra của hệ thống điều khiển mờ.
(cid:142) Đánh giá chất lượng của hệ thống điều khiển.
(cid:142) Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) (cid:142) Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 51 mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn
trong sơ đồ điều khiển).
trong sơ đồ điều khiển) (cid:145) Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ
(cid:145) Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) /)]1 T ky
)(
(
ke
− − gồm các qui tắc Sugeno với mệnh đề kết luận là hằng số.
(cid:142) Tín hiệu vào của bộ điều khiển PD mờ là: ke
)(
=
)(
ke
Δ
ề kr
)(
−
)([
ke
=
ể (cid:131) sai số
(cid:131) biến thiên sai số: (cid:142) Tín hiệu ra của bộ điều khiển là u(k). Các hệ số chuẩn hóa ở ngõ
và ngõ ra của bộ điều khiển là KE, KD, và KU được chọn như sau: 10000 =EK =DK =UK 1
1
4000 1
1
2000 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 52 ố ẩ Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) (cid:145) Hàm liên thuộc của các tập mờ định nghĩa cho biến vào e(k) và Δe(k):
(cid:145) Hà
(k) à Δ (k)
ờ đị h 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 53 liê th ộ h biế á tậ hĩ ủ à (cid:145) Các qui tắc điều khiển có dạng:
(cid:145) Cá
i tắ điề khiể Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 54 ó d (cid:145) Mô hình chuẩn: = 2.0 sYm
)(
sR
)( s 2.0
+ (cid:145) Chất lượng của hệ thống được tính bằng sai lệch giữa tín hiệu ra của Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) k
)( y k
)( ky
)( = − e
m m 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 55 mô hình chuẩn và tín hiệu ra của đối tượng: (cid:145) Cơ chế học:
(cid:145) Cơ chế học: (cid:142) Nếu chất lượng mong muốn được thỏa mãn (em(k)≈0) thì cơ chế Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) (cid:142) Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em(k) học sẽ không điều chỉnh bộ điều khiển mờ. 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 56 lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ (cid:145) Mô hình ngược mờ:
(cid:145) Mô hình ngược mờ: (cid:142) Mô hình ngược mờ mô tả định tính đặc tính động học ngược của Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) (cid:142) Mô hình ngược được dùng để xác định sự thay đổi ở ngõ vào của
đối tượng làm cho ngõ ra của đối tượng giống như ngõ ra của mô
hình chuẩn.
hình chuẩn (cid:142) Tín hiệu vào mô hình ngược là: em(k) và Δem(k)
p( )
(cid:142) Tín hiệu ra mô hình ngược là: p(k)
g
(cid:142) Các hệ số chuẩn hóa: 10000
10000 =EmK
=EK =PK
=K =DmK
=K 1
4000 1
2000 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 57 đối tượng điều khiển. (cid:145) Hệ qui tắc mô tả mô hình ngược mờ:
(cid:145) Hệ qui tắc mô tả mô hình ngược mờ: 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 58 Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) (cid:145) Khối điều chỉnh cơ sở tri thức:
(cid:145) Khối điều chỉnh cơ sở tri thức: (cid:142) Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) (cid:142) Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là điều khiển tốt hơn. (*
ku )1 ku
( kp
)( − = )1
+− (cid:142) Muốn đạt được điều này ngõ ra của các qui tắc mờ tác động ở
(cid:142) M ốn đạt được điề nà ngõ ra của các q i tắc mờ tác động ở
thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là: k
)(
)(
k (
( k
k kp
)(
)(
kp )1
)1
+−
+ )(
k
kp
)( = α
α
i =α
α
i )(
kp
p
)(
UK 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 59 p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ
điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao
điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao
cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi
một lượng là p(k). (cid:145) Kết quả điều khiển:
(cid:145) Kết quả điều khiển: 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 60 Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt) (cid:145) Sai số điều khiển:
(cid:145) Sai số điều khiển: 10 June 2010 © H. T. Hoàng - ÐHBK TPHCM 61 Thí dụ điều khiển học mờ (tt)
Thí dụ điều khiển học mờ (tt))(ˆ(
x
a
x
x
x
)(
u
(cid:145) Biểu thức mô tả động học sai số bám
(cid:145) Biểu thức mô tả động học sai số bám
)(ˆ(
x
b
=
−
~
Q
θθ
a
~
Q
θθ
bb
Q
(
Q
(
Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ
Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ
(
(
tku
)(
)|)(
)
))(
))(
t
(
(
sgn(
(
x
)(
)(*
x
)(ˆ
x
)(
x
u
u
x
)(
)(
x
x
)(
sup
x
S
∈
x
)(
x
)(
x
)(
)(ˆ
u
x
)(
u
x
x
)(
)(
x
x
)(
)(
x
x
)(
)(
x
x
x
x
&
|)(
b
x
x
)(
x
)(
)(
x
)(
L)(
∞∈
1
~1
~
~
~
T
Q
θθ
u
uu
2
x
x
)(
u
x +
)(
Sơ đồ mô phỏng hệ thống điều khiển thích nghi trực tiếp cánh tay máy
Sơ đồ mô phỏng hệ thống điều khiển thích nghi trực tiếp cánh tay máy
(cid:145) Sử dụng mạng thần
(cid:145) Sử d
thầ
kinh RBF với 9 hàm
để
cơ sở ở lớp ẩn
xấp xỉ
trực tiếp tín
hiệu điều khiển hồi
tiếp tuyến tính hóa lý
tiếp tuyến tính hóa lý
tưởng:
)(ˆ
u
x
x
)(
x
)(
)(
x
x
)(
)(
x
x
)(
)(
x
]T)(
]
x
)(
x
ĐIỀU KHIỂN HỌC
ĐIỀU KHIỂN HỌC
B
x
k
(
ky
)(
)1
=+
Cx
=
(cid:145) Đối tượng mô tả bởi mô hình toán học:
(cid:145) Đối tượng mô tả bởi mô hình toán học:
xA
v
k
)()(
+
⎧
⎨
)(
k
⎩
B
K