MỞ ĐẦU
Tính cấp thiết của đề tài luận án
Các ứng dụng hiện nay của điều khiển dự báo thường yêu cầu các quá trình vận hành trong một dải làm việc lớn và gần với các điều kiện biên, đồng thời phải thỏa mãn các ràng buộc cũng như phải đạt được chất lượng gần tối ưu. Đây là những lí do mà điều khiển dự báo phi tuyến được quan tâm đặc biệt trong những năm gần đây với rất nhiều bước tiến ở cả lĩnh vực lý thuyết và ứng dụng. Ngoài ra, năng lực ngày càng tăng của các máy tính hiện có cũng như sự phát triển không ngừng của các phương pháp giải số dành riêng cho điều khiển dự báo phi tuyến đã mang đến khả năng ứng dụng của nó cả cho các hệ động học biến đổi nhanh. Điều này dẫn đến một loạt các sự phát triển mới đầy hấp dẫn, bên cạnh các thách thức mới trong lĩnh vực điều khiển dự báo hệ phi tuyến trong đó phải tính tới cả việc đưa ra được lời chứng minh tính thỏa mãn nguyên lý tách của hệ kín phản hồi đầu ra khi ghép chung bộ điều khiển dự báo phản hồi trạng thái phi tuyến với bộ quan sát trạng thái, cũng như phải xây dựng được thuật toán để giải bài toán tối ưu khi có ràng buộc về tín hiệu điều khiển, …. Các thách thức này cũng chính là động cơ thúc đẩy đề tài nghiên cứu của luận án.
Mục tiêu và nhiệm vụ của luận án
Mục tiêu của luận án là giải quyết bài toán "Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến", với hai nhiệm vụ chính, bao gồm:
− Sử dụng hàm mục tiêu có cấu trúc biến đổi trong việc xây dựng bộ điều khiển dự báo phản hồi trạng thái nhằm mở rộng tính linh hoạt của bộ điều khiển và hơn nữa là có thể chuyển được bài toán điều khiển có điều kiện ràng buộc cho tín hiệu điều khiển cũng như trạng thái về thành bài toán không ràng buộc. − Xây dựng bộ điều khiển dự báo phản hồi đầu ra cho hệ phi tuyến trên cơ sở sử dụng bộ quan sát trạng thái và khảo sát tính ổn định của hệ thu được.
Phạm vi và đối tượng nghiên cứu của luận án
Phạm vi của luận án là nghiên cứu và đưa ra các kết quả cho điều khiển dự báo hệ phi tuyến nói chung và hệ song tuyến (lớp hệ phi tuyến đặc biệt và phổ biến trong công nghiệp) nói riêng. Các bài toán rất phổ biến hiện nay trong điều khiển dự báo, chẳng hạn như bài toán ước lượng trạng thái hay bài toán ổn định hóa và bám ổn định quỹ đạo đặt cũng sẽ được giải quyết. Tính ổn định của hệ điều khiển dự báo phản hồi trạng thái và phản hồi đầu ra được luận án chứng minh dựa trên lý thuyết ổn định Lyapunov và ổn định ISS (Input-to-State Stability). Đặc biệt, với hệ song tuyến, khi được coi là vô số các hệ tuyến tính tham số hằng, thì lời giải của bài toán tối ưu trong điều khiển dự báo có xét đến điều kiện ràng buộc của tín hiệu điều khiển lại có thể được phát triển từ các kết quả quen thuộc của bài toán LQR (Linear Quadratic Regulator) hay phương pháp quy hoạch động của Bellman nhờ việc sử dụng hàm mục tiêu có tham số biến đổi.
Cấu trúc và những đóng góp của luận án
Luận án được bố cục với 4 chương chính: phần mở đầu, 4 chương trình bày các nội dung và kết quả nghiên cứu, phần cuối là kết luận và kiến nghị. Luận án đã có các đóng góp cụ thể như sau:
− Phát biểu được một tiêu chuẩn ổn định cho hệ điều khiển dự báo phản hồi trạng thái hệ phi tuyến mà ở đó hàm mục tiêu có cấu trúc biến đổi trong cửa sổ dự báo cũng như theo sự dịch chuyển của cửa sổ dự báo trên trục thời gian. − Xây dựng được bộ điều khiển dự báo phản hồi trạng thái cho hệ song tuyến và chứng minh được tính ổn định tiệm cận của hệ kín thu được.
1
− Xây dựng được thuật toán quan sát trạng thái tối ưu cho hệ phi tuyến và điều kiện đủ để bộ quan sát đó trở thành bộ quan sát có khoảng thời gian quan sát hữu hạn FTO (Finite Time Observer).
− Phát biểu được điều kiện cần và đủ để hệ song tuyến là quan sát đều và xây dựng thuật toán quan sát trạng thái tối ưu cho hệ song tuyến.
− Đưa ra điều kiện đủ để bộ điều khiển dự báo phản hồi đầu ra, xây dựng trên nền nguyên lý tách, làm hệ phi tuyến nói chung và hệ song tuyến nói riêng là ổn định tiệm cận (với bộ quan sát FTO) và ổn định ISS (khi luôn tồn tại sai lệch quan sát).
CHƯƠNG 1:
GIỚI THIỆU CHUNG
1.1 Động cơ thúc đẩy đề tài
1.1.1 Hệ điều khiển dự báo
,k k N+
i
,
1
Điều khiển dự báo dựa theo mô hình (Model Predictive Control - MPC), hay gọi tắt là điều khiển dự báo, đề cập đến một họ các phương pháp điều khiển sử dụng một mô hình toán học để dự báo tín hiệu ra của đối tượng (quá trình) trong tương lai. Tại mỗi thời điểm trích mẫu, thuật toán điều khiển dự báo sẽ tối ưu đáp ứng của hệ bằng cách tính toán ra dãy tín hiệu điều khiển tương lai. Chỉ có thành phần đầu tiên của dãy tín hiệu điều khiển tối ưu này được đưa tới đối tượng và toàn bộ chu trình tính toán sẽ được lặp lại tại các thời điểm trích mẫu tiếp theo [12,33,48]. Như vậy bộ điều khiển dự báo gồm có ba khâu chính:
−… N ,
=
k i +
− Khâu mô hình dự báo. Khâu này có nhiệm vụ xác định được dãy các giá trị đầu ra tương lai tính từ thời điểm hiện tại k . y dưới
col
…
thuộc cửa sổ dự báo hiện tại, tức là cửa sổ dự báo [ ) Kết quả đầu ra của khâu dự báo này là giá trị đầu ra tương lai 0,1, dạng các hàm phụ thuộc tín hiệu đầu vào tương lai trong cùng cửa sổ dự báo
u
J U với )
,
(
=U
(
)
− Khâu hàm mục tiêu. Đây là khâu xây dựng hàm mục tiêu: ,
u u , k
k N
k
1 + −
1 + để với nghiệm tối ưu của:
*
U
(1.2)
) U
=
U
J arg min ( NU ∈
ta sẽ có được chất lượng điều khiển mong muốn, trong đó NU là tập các giá trị tín hiệu điều khiển thích hợp.
col
…
u
,
,
− Khâu tối ưu hóa là khâu thực thi bài toán tối ưu (1.2) nhờ một phương pháp tối ưu hóa cụ thể. Trong số các giá trị tín hiệu điều khiển tối ưu tìm được trong cửa sổ dự báo hiện tại: * =U
* u u , k
* k
* k N
1 +
1 + −
(
)
*
u
,
Θ U… ,
thì chỉ có phần tử đầu tiên của nó: )
( I= Θ ,
1k + tiếp theo, chu trình trên được thực hiện lặp lại.
* k được sử dụng, trong đó I là ký hiệu của ma trận đơn vị và Θ là ma trận có tất cả các phần tử bằng 0. Tại thời điểm Với ưu điểm nổi trội là điều khiển được những hệ thống (quá trình) có các ràng buộc về tín hiệu điều khiển (và còn có thể cả về trạng thái) nên điều khiển dự báo đã được nghiên cứu, phát triển rất nhanh. Một tổng quan tương đối đầy đủ về các phương pháp điều khiển dự báo tuyến tính này đã được nghiên cứu sinh trình bày trong tài liệu [3].
Tuy nhiên, có thể thấy các phương pháp điều khiển dự báo nêu trên đều tập trung chủ yếu cho bài toán điều khiển dự báo tuyến tính, trong khi các đối tượng trong thực tế đều ít nhiều mang tính phi tuyến và hàm mục tiêu thường không ở dạng toàn phương cũng như các ràng buộc thường gặp là phi tuyến. Bởi vậy, điều khiển dự báo hệ phi tuyến đã được đặc biệt quan tâm và nghiên cứu nhiều trong những năm gần đây. Đó cũng chính là một trong những động cơ thúc đẩy nghiên cứu đề tài "Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến" của luận án.
2
1.1.2 Các hướng nghiên cứu của luận án
Luận án đã đặt ra hai hướng nghiên cứu chính, gồm:
− Xây dựng bộ điều khiển dự báo phản hồi đầu ra cho hệ phi tuyến trên cơ sở sử dụng bộ
quan sát trạng thái và khảo sát tính ổn định của hệ thu được.
− Sử dụng hàm mục tiêu có cấu trúc biến đổi trong việc xây dựng bộ điều khiển dự báo phản hồi trạng thái để chuyển bài toán điều khiển có điều kiện ràng buộc cho tín hiệu điều khiển cũng như trạng thái về thành bài toán không ràng buộc.
Thứ nhất là về hướng điều khiển phản hồi đầu ra. Mặc dù phát triển nhanh, song phần lớn các đóng góp mang tính lý thuyết của điều khiển dự báo hệ phi tuyến đều dựa trên giả thiết phải có đầy đủ thông tin về trạng thái bên trong của hệ. Giả thiết này thường không được thỏa mãn trong thực tế, do không thể đo được tất cả các biến trạng thái của đối tượng [17,36]. Một giải pháp cho vấn đề này là sử dụng một bộ quan sát trạng thái để ước lượng các biến trạng thái của đối tượng từ các tín hiệu vào/ra đo được rồi sau đó áp dụng các phương pháp điều khiển dự báo phản hồi trạng thái đã có, hay nói cách khác là chuyển bài toán phản hồi trạng thái thành bài toán phản hồi đầu ra [5].
Với những lý do trên, luận án sẽ tập trung giải quyết bài toán quan sát trạng thái và bài
A) Về phản hồi đầu ra
Hơn thế nữa, các phương pháp điều khiển phản hồi đầu ra dựa trên quan sát trạng thái cho các hệ phi tuyến nói chung và các hệ điều khiển dự báo nói riêng đều phải chỉ ra tính ổn định của hệ kín dựa trên nguyên lý tách. Thậm chí, các phương pháp điều khiển dự báo hệ tuyến tính cũng không đương nhiên thỏa mãn nguyên lý tách do sự có mặt của các điều kiện ràng buộc [18]. Theo các tài liệu [17,46] thì tính thỏa mãn nguyên lý tách có thể được chứng minh dựa trên ba xu hướng thiết kế sau:
1. Tách (separation) 2. Bộ điều khiển tách (controller separation) 3. Bộ quan sát tách (observer separation)
Việc lựa chọn một trong ba xu hướng thiết kế nêu trên nhằm tạo ra tính ổn định cho hệ thống điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cũng chính là một trong những động cơ thúc đẩy đề tài.
toán điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ phi tuyến.
Thứ hai là về khả năng chuyển bài toán điều khiển có ràng buộc thành bài toán điều khiển không ràng buộc thành bài toán điều khiển dự báo không ràng buộc nhờ sử dụng hàm mục tiêu có cấu trúc biến đổi.
Xét lại hàm mục tiêu (1.3), nay được viết lại thành:
T
T
U
E
J
Q
(
)
R U
(1.4)
=
+ E U
Q
R
col
diag Q
diag R
…
B) Về hàm mục tiêu có cấu trúc biến đổi
e
(
(
),
),
,
.
=
=
=E
)
N
( e e , k k
1 −
với , 1 + Khi đó có thể nhận thấy với mô hình dự báo phi tuyến, do E là hàm phi tuyến của U , nên hàm mục tiêu (1.4) này không còn ở dạng toàn phương theo U , thậm chí không phải là hàm lồi, do đó *U của bài toán tối ưu (1.2) tìm được nhờ các phương pháp tối chưa thể khẳng định được nghiệm ưu hóa sẽ là nghiệm toàn cục.
Để tìm nghiệm toàn cục của (1.2), ta cần tới phương pháp điều khiển tối ưu, chẳng hạn như phương pháp biến phân, hoặc quy hoạch động của Bellman [2], song các công thức tường minh *U theo phương pháp điều khiển tối ưu này lại mới chỉ dừng lại cho trường hợp không xác định ràng buộc, do đó không thể áp dụng được khi bài toán điều khiển dự báo có thêm các điều kiện ràng buộc cho tín hiệu điều khiển
ku hoặc trạng thái
kx .
Tuy nhiên, nếu nhìn lại cấu trúc hàm mục tiêu (1.4) ta sẽ thấy:
− Càng tăng R , điều kiện ràng buộc:
3
(1.5)
k
max
u≤u càng dễ được thỏa mãn.
− Nhưng càng tăng R chất lượng bám tín hiệu mẫu
kw đặt ở đầu vào càng xấu.
Bởi vậy một ý tưởng dung hòa xuất hiện ở đây là ngay ban đầu (khi k nhỏ) ta chọn R đủ
lớn để có U đủ nhỏ sao cho với nó có được điều kiện ràng buộc (1.5). Khi điều kiện ràng buộc
(
)
J U nhằm làm giảm sai lệch bám sau này. Tương tự ta cũng có
EQ trong
(1.5) đã được thỏa mãn, ta sẽ giảm R để thông qua đó làm tăng thêm sự tham gia của thành phần sai lệch bám TE thể chọn Q đủ nhỏ ban đầu, sau đó tăng dần Q theo k .
Với hai trường hợp thay đổi hai ma trận R hay Q theo thời gian k như trên, hàm mục tiêu
gốc ban đầu (1.4) trở thành: T
T
U
E
J
(
)
(1.6)
=
+ E U
Q k
R U k
và ta sẽ gọi hàm mục tiêu "linh hoạt" này là hàm mục tiêu có tham số biến đổi. Mở rộng hơn nữa, ta có thể thay (1.6) bởi hàm mục tiêu có cấu trúc biến đổi như sau:
J
g
u
(
)
e (
,
).
(1.7)
k i +
k i +
k i +
i
N 1 − ∑=U 0 =
e (
)
dưới dấu tổng thay đổi theo k một cách
g + k i
k i +
k i +
u Với hàm mục tiêu (1.7) có cấu trúc hàm , thích hợp, nghiệm bài toán tối ưu không ràng buộc:
J arg min (
* =U
U )
được tìm nhờ các phương pháp điều khiển tối ưu (chẳng hạn nhờ các công thức nghiệm tường minh của biến phân hay quy hoạch động) cũng sẽ vẫn thỏa mãn điều kiện (1.5) của bài toán điều khiển dự báo.
1.2 Cơ sở lý thuyết
1.2.1 Tính ổn định Lyapunov Định nghĩa 1.1: Xét hệ phi tuyến tự trị (không bị kích thích), không dừng, cân bằng tại gốc tọa độ
và có mô hình không bị kích thích:
x
f
0
f x (
0 ,
k =
với
k∀ ≥ .
(1.9)
k
+ = 1
0ε> bao giờ cũng tồn tại
(
)0,kδ ε
sao cho quỹ đạo trạng thái
x
k
k k 0 ( , ) , ) Khi đó hệ sẽ được gọi là: a) Ổn định tại 0k , nếu với mọi = Φf
(
k
0 ∈Ox
, trong đó
)0, x của nó, tức là nghiệm của (1.9), với điều kiện đầu
k
k ∀ ≥
⇒
.
)
k ε 0 0 = 0 . k→∞ tự do
O là một miền hở nào đó chứa gốc tọa độ, thỏa mãn:
(
,
0,kδ ε , ( k k k
, ) + =
1 k k
, ) 0 . 4 (
,z kβ thuộc lớp KL và một hàm ( )zγ
và mọi trạng thái đầu < ∞ k k ∞
, luôn có: k= 0 k . )
Hệ sẽ được gọi là ổn định ISS nếu tồn tại một hàm
thuộc lớp K sao cho với mọi tín hiệu bất định kd thỏa mãn
0x tùy ý, được hiểu là giá trị trạng thái của hệ khi
, , k k
− γ ≤ + ) ( k 0 0 (
β ) ) ( ∞ , ( ) = k k 1
+ f N g min k
, ) , = + ( ) N k N
1
−
∑
k
0
= N …u
,
0 1
− J B
0 0 N 1
− K N 1, = … : B g K , , . (1.12) = ( ) ( )
k B
+ ( ) k K 0 0 N K
− K inf
…u
,
,
0 ⎡
⎢
⎣ ⎤
⎥
⎦ ta có với mọi N ∈ N và
K
∑
k
0
= , ∗ =x ∗
0 Ngoài ra nếu tồn tại dãy giá trị tín hiệu điều khiển tối ưu , và ứng với nó là dãy , trong đó 0 B g K , , . ( ) ∗
k 0 0 N K
− ( ) Hệ quả sau đây của định lý 1.3 khẳng định rằng đoạn cuối của dãy giá trị tín hiệu điều khiển quỹ đạo trạng thái tối ưu
K
∑=
k
0
= là dãy giá trị tín hiệu điều khiển tối ưu ứng với trạng thái đầu ∗
0 K , , 2N ≥ , thì ứng với mỗi ∗
K ∗
−…u
= … , dãy
N
1,
N
1
∗x và cửa sổ dự báo N K−
. ,
0x và cửa sổ dự báo
giá trị tín hiệu điều khiển tối ưu với trạng thái đầu K Áp dụng phương pháp quy hoạch động vào bài toán điều khiển dự báo phản hồi trạng thái với cửa sổ dự báo vô hạn, tức là xét bài toán điều khiển tối ưu: cũng là dãy , ) = k i 1
+ + k i
+ k i
+ (1.13) g k i , , ) min = + k k i
+ k i
+ …
, ∞
∑
k
0
= →
k
1
+ , , . ( ) k k + =
1 , ≤ ≤ 3
2
g
và k k k k ( ) V B J k )
= )
= k
) V
( . Hơn nữa, giả sử tồn tại luật điều khiển k
) ( ,k k k ∗u x với
)
k k ,min 0 ) ∗
k k k )
ổn định tiệm cận theo nghĩa ở định nghĩa 1.1. 5 Thuật toán này được đưa ra bởi Wan và Kothare [50] để làm ổn định các đối tượng (quá
trình) được mô tả bởi mô hình tuyến tính bất định có các tham số nằm trong một siêu diện hoặc
mô hình tuyến tính bất định có cấu trúc. Khác với xu hướng thiết kế độc lập bộ điều khiển phản hồi trạng thái và bộ quan sát trạng
thái như ở [50] thì các kết quả được công bố trong [36,49] lại đại diện cho nhóm phương pháp
thiết kế bộ quan sát trạng thái trước rồi đưa sai lệch quan sát vào bài toán thiết kế bộ điều khiển
dự báo. Tư tưởng cơ bản của phương pháp thiết kế bộ điều khiển dự báo phản hồi đầu ra cho hệ
nêu trong [19] là thiết kế bộ điều khiển phản hồi trạng thái không liên tục có tính bền vững với
nhiễu, sau đó thiết kế bộ quan sát trạng thái với sai lệch quan sát đủ nhỏ để có thể coi nó là nhiễu
tác động lên hệ kín. Trong tất cả các phương pháp kể trên, khái niệm ổn định của hệ thống điều khiển dự báo
phản hồi trạng thái cũng như phản hồi đầu ra đều được hiểu theo nghĩa ổn định Lyapunov. Tài
liệu [47] đã đề xuất một phương pháp thiết kế bộ điều khiển dự báo phản hồi đầu ra cho hệ phi
tuyến có nhiễu và sử dụng khái niệm ổn định ISS để chứng minh tính ổn định tại (lân cận) gốc tọa
độ của hệ kín phản hồi đầu ra.. Chất lượng của hệ kín khi áp dụng các phương pháp thiết kế bộ điều khiển dự báo tuyến
tính bền vững đã nêu ở các mục 2.1.1 và 2.1.2 sang cho hệ phi tuyến sẽ ít nhiều bị giảm đi do sai
số của việc tuyến tính hóa là không tránh khỏi. Bên cạnh đó, nếu có thể tìm được một phép đổi trục để biểu diễn các hệ phi tuyến sang
dạng chuẩn thì ta có thể sử dụng các phương pháp ở mục 2.2.1 hoặc mục 2.2.2. Trong khi mục
2.2.1 đề xuất sử dụng bộ quan sát High Gain với ưu điểm của bộ quan sát này là khả năng loại bỏ
nhiễu [28] thì mục 2.2.2 lại đưa ra bộ quan sát mở rộng để tận dụng được thông tin của tín hiệu
điều khiển trong tương lai vốn chỉ có được ở điều khiển dự báo. Tuy nhiên ở cả hai phương pháp
trên, khả năng tồn tại phép đổi trục cũng như cách xác định phép đổi trục như thế nào để có thể
chuyển một hệ phi tuyến bất kỳ về dạng mô hình chuẩn vẫn còn là bài toán còn bỏ ngỏ. Luận án này sẽ đưa ra một phương pháp điều khiển dự báo phản hồi đầu ra theo nguyên lý
tách cho hệ phi tuyến. Dựa trên nền tảng của điều khiển dự báo là tối ưu hóa và giả thiết hệ là
quan sát đều, luận án đề xuất một bộ quan sát trạng thái tối ưu để kết hợp với bộ điều khiển phản
hồi trạng thái nhằm tạo ra một hệ thống phản hồi đầu ra ổn định. 6 Trước hết, tính ổn định tiệm cận của một lớp các bộ điều khiển dự báo phản hồi trạng thái
sử dụng hàm mục tiêu có cấu trúc biến đổi sẽ được khảo sát. Tiếp theo, một điều kiện đủ cho tính
ổn định của hệ ghép bộ điều khiển dự báo phản hồi trạng thái này với bộ quan sát trạng thái tối ưu
theo nguyên lý tách sẽ được chứng minh. Hơn nữa, luận án cũng sẽ chỉ ra các điều kiện đủ để bộ quan sát tối ưu trở thành bộ quan sát FTO, là bộ quan sát rất ít được đề cập đến trong điều khiển dự báo.
Tất cả các kết quả trên sẽ được áp dụng cho riêng hệ song tuyến. ( (3.1) Xét các đối tượng (quá trình) phi tuyến được mô tả bởi mô hình trạng thái không liên tục: k k + =
1 f trong đó là vector hàm phi tuyến khả vi hai lần và Xét hệ (3.1) ở thời điểm k hiện tại. Độ rộng của cửa sổ dự báo N là cố định và cho trước.
là dãy quỹ đạo mẫu mong muốn cho trước mà trạng thái của hệ cần …
, } ( , )⋅ ⋅ , k − = = ref
ku
− : k k / là biết trước nên mô hình (3.1) hoàn toàn viết lại được theo sai lệch
ref
k ( , ) , ). = + − = (3.3) k k 1
+ 1
+ ref
k ,k k N+ ) . Mô hình mô tả sai lệch bám (3.3) này cũng sẽ được sử dụng để dự báo các giá trị sai lệch bám
k i+e J g f (3.4) ) , = + ) k k N
+ k i
+ k i
+ k i
+ f f ( k ig + ),
⋅ ⋅ và ( k ig + ),
⋅ ⋅ có cấu trúc thay đổi theo i chứ không cố
kJ là hàm trong đó trong khoảng cửa sổ dự báo [
Như vậy với mô hình (3.3), bài toán điều khiển bám ổn định đã được chuyển về bài toán
điều khiển ổn định. Để tránh việc sử dụng quá nhiều ký hiệu, từ nay về sau, ta vẫn sử dụng ký
ku thay vì kv cho tín hiệu vào ở bài toán điều khiển bám. Khi đó, tương ứng với bài toán
hiệu
điều khiển bám, hàm mục tiêu cho việc xây dựng bộ điều khiển dự báo phản hồi trạng thái cũng
có cấu trúc phụ thuộc theo sai lệch ke tức là:
N
1
−
∑
i
0
=
( )
⋅ là các hàm xác định dương với ( )
⋅ là điều kiện ràng buộc cho điểm cuối. Đặc biệt trong hàm mục tiêu (3.4) thì
định như được giả thiết ở các công trình trước [23,47]. Chính vì lý do đó nên ta gọi
mục tiêu có cấu trúc biến đổi. * Ghép chung mô hình sai lệch (3.3) trên với hàm đo tổng các giá trị sai lệch thuộc khoảng dự
)+k k N vừa có, ta sẽ được bài toán tối ưu động có cấu trúc giống với bài toán quy hoạch báo [ , ku tại thời điểm k , như sau: động dạng chuẩn, phục vụ việc xác định tín hiệu điều khiển tối ưu ) , = k i 1
+ + k i
+ (3.7) f g , ) min. = + ) k k N
+ k i
+ k i
+ k i
+ …u
, k N k 1
+ − k i
+
N
1
−
∑
i
0
= Thậm chí vì nhiều lý do mà trong điều khiển dự báo người ta cần đến cả các bài toán tối ưu 7 có hàm mục tiêu kJ không bắt buộc ở dạng (3.4) mà tổng quát hơn sẽ là hàm nhiều biến: J f F … , , , , , ) = + ) k k k k N k N k N
+ 1
+ 1
+ 1
+ − 1
+ − … N … (3.8) i
), 0, , 1 , , , , = − F F
=
i i k N k N k i
+ k i
+ 1
+ − 1
+ − mà ở đó khi sử dụng ký hiệu:
e
e
( (3.9) F F=
0 là thành phần hàm con trong , thì iF có thể tách được thành dạng tổng: , ) F g
= + i F
i k i
+ k i
+ k i
+ 1
+ (3.10) , ) ⋅ i F
i k i
+ k i
+ k i
+ .
1
+ hoặc dạng tích:
e
F g
(
= (3.11)
Những hàm mục tiêu dạng (3.8) sẽ được gọi là hàm mục tiêu có cấu trúc biến đổi nếu như
kJ có cấu trúc biến đổi. Cụ thể hơn, khi ký B
i F
i k N
+ (3.12) nó thỏa mãn nguyên lý tối ưu đối với hàm mục tiêu
hiệu hàm Bellman tại i là:
)
+ =
k i 1
− , ) ) = + ] B
i B
i k i k i
+ k i
+ k i
+ 1
+ k i
+ 1
+ + (3.13) thì vẫn phải có được:
[
g g , ) = ⋅ [ ] B
i B
i k i k i
+ k i
+ k i
+ k i
+ 1
+ 1
+ + (3.14) nếu dạng tách được là (3.10), hoặc:
)
) min
u
k i
+ ) i k N
,
+ + nếu dạng tách được là (3.11). Kết luận trên sẽ được trình bày dưới dạng hệ quả 3.1 của định lý 1.3 như sau. k k N+
[ ,
)
(3.9). Nếu hàm
g +
) 0
,
+ ≥
k i
k i k i
+ kJ dạng tổng quát (3.8) được định nghĩa trong toàn bộ khoảng dự báo
k
iF là thành phần của kJ xác định trong khoảng con [
cho bởi
iF đó tách được theo một trong hai dạng (3.10) hoặc (3.11) và
thì hàm Bellman (3.12) tại i sẽ tương ứng thỏa mãn (3.13) hoặc (3.14). , N = ∞ thì khả năng ổn định của hệ kín là rất lớn [17], do
đó ta có thể biến đổi bài toán quy hoạch động (3.7) với cửa sổ dự báo hữu hạn thành bài toán có
cửa sổ dự báo vô hạn như sau: Với cửa sổ dự báo là vô hạn, tức , ) = k i k i
+ k i
+ (3.15) g B , ) ) min = + k k i
+ k i
+ k i
+ + …u
, k k N 1
+ − 1
+ +
N
1
−
∑
i
0
= B ) k ∞ :
] +e
(
N k N B g được giả định là hàm Bellman tại bước N trong cửa sổ dự báo vô hạn [ , trong đó , ). = + k i
+ k i
+ k i
+ ) min
…u
, k N
+ ∞
∑
i N
= ke
kV
(
, ) ,min i = :
0 V J của bài toán tối ưu (3.15) ở từng vòng lặp k đó. Như vậy, ở mỗi vòng lặp k thì Bộ điều khiển dự báo làm việc theo vòng lặp. Tại mỗi vòng lặp nó thực hiện tìm nghiệm bài
để chỉ giá trị
ke
kV
(
, ) ) = toán tối ưu (3.15). Để tiện cho việc trình bày sau này, ta sẽ sử dụng ký hiệu
kJ
chính là hàm Bellman của bài toán tối ưu động (3.15) ứng với
. k k B
, )
=
0 ,min 8 B ) +e
(
N k N
,N ∞ sao cho ở tất cả các vòng lặp k luôn có: V k
, ) trong (3.15) được chọn tương ứng với khoảng ≤ ≤ (3.16) α
1 ]
α
2 ( ( ) ) ( , thời gian còn lại [
) k k k g )) và hàm (3.17) g e u trong dấu tổng của kJ thỏa mãn:
*
e u e
(
(
,
k
k k k α≥
3 ( ) , ) k 1 α α α ∈ K , thì
3 2 ,
trong đó
định tiệm cận. =y
k k k Để sử dụng được bộ điều khiển dự báo phản hồi trạng thái ở mục 3.1 thì rõ ràng phải có
điều kiện là tất cả các biến trạng thái nằm bên trong hệ là đo được. Tuy nhiên trong nhiều ứng
dụng thực tế, thông tin về trạng thái của hệ không thể đo được đầy đủ mà chỉ có tín hiệu ra của hệ
là đo được: (3.19)
Do đó để áp dụng được các phương pháp điều khiển dự báo phản hồi trạng thái đã có, vector
ky đo được và vector tín hiệu vào
kx của hệ phải được ước lượng từ vector tín hiệu ra
trạng thái
ku đã biết nhờ sử dụng một bộ quan sát trạng thái thích hợp. ), , ( k Gộp các phương trình (3.1) và (3.19), ta có đối tượng (quá trình) phi tuyến không liên tục:
x (3.20) ( k
). + =
1
= k k 0x của k 0,1, 1 = M
−…
, ku , ky , của hệ. nó là xác định được từ M giá trị đo được … Để làm rõ hơn nữa định nghĩa trên, ta ký hiệu: M k
k
, ), 0,1, , 1 = = Φ − k … , , = (3.21)
là nghiệm phương trình sai phân trong mô hình (3.22) của hệ (phương trình thứ nhất), ứng với
dãy giá trị tín hiệu vào:
u }M −
1 (3.22) và 0x là trạng thái đầu. ku đã có trong U nên tín hiệu đầu ra của hệ (3.20) sẽ chỉ còn Với ký hiệu (3.21) này và do (cid:22) k
, ), ) ( , Φ = (3.23) k k k 0 0 phụ thuộc vào trạng thái đầu 0x và dãy tín hiệu đầu vào U cho ở công thức (3.22), tức là:
(
/ )
k
, ) . ) k 0,1, 1 = M
−…
, 0x bởi x thành: 9 Với các định nghĩa nêu trên, thì khi viết chung (3.23) cho cũng như thay / h / h x
( ,1) Φ (
Φ
( / x (cid:54) x
( ) = (3.25) T
U (cid:35) h M 1) x
( , − Φ ) T xU
( ) ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎠ T xU
( ) , thì hệ sẽ là quan sát được nếu tồn tại ít nhất
cho bởi (
trong đó U được xem là tham số của ánh xạ
một số nguyên dương M và một dãy tín hiệu điều khiển U theo (3.22) để ánh xạ
(3.25) là nội xạ (injective).
T xU
( ) còn có thêm tính chất là ánh xạ trơn, thì nó sẽ là nội xạ khi và chỉ khi (theo Nếu n [29]): . rank , = ∀ (3.26) Bởi vậy ta suy ra được các tiêu chuẩn sau: ( , ),
⋅ ⋅ ( , )
⋅ ⋅ sẽ quan sát được khi và chỉ khi tồn tại tham số 1) Hệ (3.20) với các vector hàm trơn ( , ),
⋅ ⋅ ( , )
⋅ ⋅ sẽ là quan sát đều khi và chỉ khi (3.26) đúng 2) Hệ (3.20) với các vector hàm trơn với mọi tham số U . k M+ i 1 − bộ quan sát có nhiệm vụ xác định trạng thái
0,1, = k i+y k i+u , ) , 1
thời điểm hiện tại
đó của hệ (3.20) từ M các giá trị tín hiệu vào ra
k k M+
trong cửa sổ quan sát [ ,
k M+x
cũng có
Sau khi đã có kx ở thời điểm k và hệ chuyển sang thời điểm tiếp theo 1k +x +
1, 0,1, k
với cửa sổ quan sát [
k
tới [
+ k M
1,
+
k M
+ k k M+ . Có thể thấy khi đã có Luận án đã xây dựng bộ quan sát trạng thái tối ưu làm việc theo nguyên tắc như sau. Tại
kx ở thời điểm k trước
M
−…
,
vừa đo được
kx thì dựa vào mô hình (3.20) của hệ ta . 1k + , chu trình quan
)
. Như vậy, bộ quan sát này sẽ
sát trên sẽ được lặp lại để có
k = …. Rõ ràng để có
1)
dịch chuyển tương ứng từng bước từ [ ,
)
+ ,
thể quan sát được theo nguyên tắc làm việc như vậy, hệ phải là quan sát đều và độ rộng M của
cửa sổ quan sát phải đủ lớn để ánh xạ T xU
( ) ở công thức (3.25) là nội xạ. Gọi ) , = k i 1
+ − 1
+ − ta sẽ có: u , ) = (cid:7)
x
k i
+ ) ) ) k k k i 1
+ i i u ), (cid:34)
, , (3.27) = k k k i … u , , , ) ( , ) = = (cid:7)
f x
(
k i
k i
1
1
+ −
+ −
(cid:7)
(
(
f x u u
f f
(cid:34)
,
(
k
(cid:7)
f x u u
,
(
k 1
+ 1
+ − … trong đó , , k i k 1
+ iε tại thời điểm k i+ : 10 Từ những giá trị trạng thái quan sát này ta có được sai lệch quan sát ) − =
ε γ
i i k i
+ k i
+ ) ( , ), ) = − γ
i (3.28) k i
+ ) , = γ
i + (
(
( , , ), ) . Suy ra hàm mô tả sai iγ ∈ K là hàm tùy chọn và k i
+ Q ) ( , = = (3.29) 1
+ ( )
) . M
1
−
ε
∑
i
i
0
= M
1
−
γ
∑
i
i
0
= iε cũng như hàm mục tiêu ( ) Sai lệch quan sát T P ) ) ) , , , (3.30) = γ
i 1
+ 1
+ 1
+ ) ( ) ( ) với P P= > tùy chọn. Khi đó với định nghĩa vector sai lệch quan sát ie như sau: , ) (3.31) = được viết ở dạng tổng quát. Tuy nhiên, trong ứng dụng, sẽ là đủ nếu ta sử dụng
đơn giản:
(cid:7)
(cid:7)
(
h x
(
k
i i+
1 Q ) ) , = 1
+ ( (3.32) T P P ) , , = = 1
+ 1
+ ) ( )
) . ( M
1
−
∑
i
0
= arg min ( ). = (3.33) Trước khi đi đến định lý 3.1 sau đây về khả năng bộ quan sát tối ưu trên trở thành bộ quan sát FTO, ta cần có giả thiết sau. a) Cửa sổ quan sát M là hữu hạn. b) Hàm : ( , )) 0, = a) (3.35) γ
l (cid:7)
*
k + −
k l l (3.36) (cid:68)h f thì ở đó cũng sẽ có Nếu định lý 3.1 đúng với mọi cửa sổ quan sát thì bộ quan sát tối ưu sẽ có tính chất là xác
định được chính xác trạng thái thực của đối tượng sau một khoảng thời gian hữu hạn. Khi đó, bộ
quan sát tối ưu trở thành bộ quan sát FTO. 11 Trong trường hợp định lý 3.1 không được thỏa mãn, chẳng hạn khi hệ có nhiễu tác động, thì
ta vẫn có khả năng nâng cao độ chính xác cho bộ quan sát tối ưu bằng cách mở rộng thêm cửa sổ
quan sát. Điều này được khẳng định ở định lý sau. ( , )⋅ ⋅ liên tục và quan sát đều, chuỗi (3.29) ứng với
x .
k= và
M = ∞ có minQ hữu hạn, thì ở đó sẽ có Dựa vào nguyên tắc làm việc của bộ quan sát trạng thái tối ưu được trình bày ở mục 3.2.2, thuật toán quan sát trạng thái tối ưu tổng quát sẽ có dạng cài đặt cụ thể như sau: m p … M i ,u y có độ dài M với các i
[ ] 0,1, 1. , , ∈ = − R R phần tử được ký hiệu là k i
+ u y , . 1M − giá trị vào ra đầu tiên của hệ (3.20) gồm
,
k i
+
Đưa những giá trị đo được này vào hai mảng đã khai báo theo thứ tự:
= k i
+ k i
+ :aT , 4) Lần lượt thực hiện các bước sau đây theo từng chu kỳ trích mẫu k M 1
+ − 1
+ − rồi gán vào mảng: k M 1
+ −
. M
[ 1]
− = k M
1
+ −
b) Giải bài toán tối ưu (3.33) để tìm trong đó thì giá trị khởi phát sẽ là *
1− 1M − các phép gán sau lần lượt với c) Dồn lại mảng dữ liệu bằng cách thực hiện 1]. i
[ + cửa sổ điều khiển tiếp theo cửa sổ điều khiển hiện tại thời điểm hiện tại k M N 1 1 k M+ − + + − k 1k + kết hợp với bộ quan sát tối ưu để trở thành bộ điều khiển dự báo phản hồi đầu ra. …u
, , k k M+ 1
− … … , , , , , *
k *
k M N *
k M
+ *
k M
+ 1
− + 1
+ − 0,1, + Bộ điều khiển phản hồi đầu ra ở hình 3.7 làm việc dọc theo trục thời gian ) ,k k M+ k = …, cùng
k M+
1.
−
thuộc về quá khứ, được sử ) . Cửa sổ điều khiển này chứa thời điểm hiện tại …u
, , k k M+ −
1 , , k M k N M
+ + + ) k k M+ −
1 12 với cửa sổ điều khiển [
,k k M N
+
Nó chia cửa sổ điều khiển thành hai đoạn, đoạn thứ nhất [
(cid:7)
*
x ở thời điểm k từ các giá trị vào ra đo được là
dụng để quan sát trạng thái
k
…y
, và
trong cửa sổ điều khiển thuộc về tương lai, . Đoạn thứ hai [ *
k M+u theo nguyên tắc điều khiển dự báo phản hồi được sử dụng để xác định tín hiệu điều khiển
trạng thái }M N
1
+ −
0 *
+u
{
k i
cửa sổ điều khiển hiện tại (xem hình 3.7): là nghiệm của bài toán tối ưu trong khoảng Bây giờ ta sẽ ký hiệu dãy giá trị , ) = k i k i
+ k i
+ g B (3.45) , ) ) min = + → k k i
+ k i
+ k i
+ M N
+ k M N
+ + 1
+ +
M N
1
+ −
∑
i
0
= ,k k N M kx là tùy ý nhưng cho trước.
+ + trong đó điểm trạng thái đầu ) ) được xem là cửa sổ dự báo thì giá Như vậy, nếu toàn bộ cửa sổ điều khiển [ *(
k k }M N
1
+ −
0 *
+u
{
k i ) *(
k k sẽ là tín hiệu điều khiển dự báo phản hồi trạng thái của
trị đầu tiên
bộ điều khiển dự báo ở thời điểm k . Khi đó hệ (3.20) cùng với bộ điều khiển dự báo phản hồi
trạng thái ( ( )). k (3.46) k *
k + =
1 , ) + + k M k N M
+ ) k cửa sổ điều khiển, tức là tín hiệu điều khiển phản hồi về không phải là Song vấn đề đặt ra ở đây là cửa sổ dự báo thật sự chỉ là khoảng con [
*(
k ) là ở thời điểm k M+ lại là + + }M N
1
+ − *
+u
{
k i
cũng sẽ là nghiệm tối ưu của
,k mà
u x ở thời điểm
}M N
1
+ −
0 ) , + }M N
1
+ − . Do đó ta cần phải chỉ ra được rằng nếu
*
+u
{
k i M trong đó. *
+u
{
k i *
+u
{
k i M ) ) là nghiệm tối ưu trong toàn bộ cửa sổ điều khiển thì nghiệm tối ưu cho toàn bộ cửa sổ điều khiển thì dãy con
k M k N M
tương ứng với khoảng con [
+
+
}M N
1
+ −
0 sẽ là nghiệm tối ưu của đoạn cửa sổ dự báo trong cửa sổ điều khiển. (cid:7)
*(
k *(
k *
k k Hệ quả 3.3 trên đây thực chất là sự mở rộng của hệ quả 1.1 cho trường hợp hàm mục tiêu có
cấu trúc biến đổi. Với nội dung hệ quả 3.3 ở trên thì việc kiểm tra tính thỏa mãn nguyên lý tách
của bộ điều khiển dự báo phản hồi đầu ra ở hình 3.7 sẽ thay được bằng việc kiểm tra tính ổn định
của hệ (3.46) khi bộ điều khiển Q
arg min ( i = (cid:7)
*
x
k (cid:7)
x
k k i
+ y arg min h f
(cid:68)
( )( ) (3.48) = − (cid:7)
x U
,
k
i M
1
−
γ
∑
i
i
0
= , , …u
{
, k , là các tham số đã biết. có …y
{ ,
k }
k M+ −
1 )
(
}
k i+ −
1 ) , i
) 0,
+ ≥ ∀
k i k M N
+ + k i
+ k i
+ =
Từ hệ quả 3.2 của lý thuyết điều khiển dự báo bằng phản hồi trạng thái cho hệ (3.45) với
cửa sổ dự báo là toàn bộ cửa sổ điều khiển (hình 3.7), ta đã được biết rằng khi
B +
g
, còn gọi là hàm
và hàm Bellman giả định tại điểm cuối
M N
i = ở các cửa sổ điều khiển
phạt, được chọn sao cho hàm Bellman (3.47) tại điểm đầu
0
k k M N
[ , ) + + V , k k k B=
, )
0 (3.49) ) k
, ) ( ) ≤ ≤ k k k α
1 α
2 , α α ∈ K
2 ) (3.50) là hàm hợp thức:
x
x
V
(
( với 1 thì bộ điều khiển tối ưu k ( ( *
k k k + =
1 *(
k
))
kx
kV
(
, )
ổn định tiệm cận. Khi đó 13 sẽ là hàm LF tương ứng của hệ, tức là: V k V ( ( )), ( ) k k k k α
, )
≤ −
3 )
1
+ − (
trong đó ) ) (cid:7)
*(
k *(
k *
k k ( = k *
k 1
+ Bây giờ ta sẽ kiểm tra tính thỏa mãn nguyên lý tách của hệ (3.46) khi thay bộ điều khiển
(cid:7)
*
x là nghiệm
k phản hồi trạng thái
của bộ quan sát tối ưu (3.48). Nói cách khác ta phải kiểm tra tính ổn định của hệ: i (3.51) arg min )( = − k i
+ )
) ,
( M
1
−
γ
∑
i
i
0
= ) k ) (cid:7)
*(
k *
k LF (3.50), thì bộ điều khiển phản hồi đầu ra
sát trạng thái thỏa mãn: ( ( )) ( ( (3.52) *
k k *
k α
2 α≤
1 ( ) ( )
)) . "≤ "= . Có thể thấy ngay là những bộ quan sát FTO đều thỏa mãn điều kiện (3.52), ở đó dấu " được thay cụ thể bằng dấu " ) k Mặc dù đã đưa ra được điều kiện đủ (3.52) cho tính ổn định theo nguyên lý tách của hệ kín,
song ta có thể thấy đây là điều kiện khá chặt. Bởi vậy để nới lỏng khả năng ứng dụng cho nó,
luận án đã đưa ra thêm một phát biểu bổ sung như sau.
Định lý 3.4: Nếu bộ điều khiển dự báo phản hồi trạng thái ( ( , ) = = *
k k k k k + =
1 kín phản hồi trạng thái mô tả bởi:
)
)
) / ( + = d ) ≤O
(
) d d có hàm
)k
(cid:7)
x
x
quan sát được
k
k
O là lân cận gốc, có kích thước cho bởi:
, γ∈ K O O
( ), có trong đó = ∀ ∈ ∞ ( , ) d x y là ký hiệu khoảng cách của hai phần tử ,x y . B Phần lớn tính phi tuyến của các quá trình công nghiệp, khi được biểu diễn dưới dạng không + (4.1) liên tục, đều xấp xỉ về được một trong hai dạng sau:
x u
(
)
k k k k + =
1 B + k hoặc:
x (4.2) k k k + =
1 14 Dựa trên các kết quả đóng góp của luận án ở chương 3, chương này sẽ phát triển thêm một
số kết quả về điều khiển dự báo phản hồi đầu ra dựa trên bộ quan sát tối ưu cho riêng lớp hệ song
tuyến mô tả bởi cả hai dạng (4.1) và (4.2), trong đó hàm mục tiêu xây dựng cho bộ điều khiển dự
báo là những hàm có tham số biến đổi. Để đơn giản về mặt ký hiệu, ta viết lại mô hình dự báo (4.2) thành:
x k B
k + =
1k trong đó ) kA=A k kB=B
k J (4.3)
x . Ta sẽ sử dụng hàm mục tiêu dạng toàn phương có tham số
( biến đổi: Q R Q + + T
k i
+ (4.5) + k i
+ k i
+ T
k N k N k N
+
+ + ( ) N
1
−
∑=
i
0
= i i 1 0, 1, 0,1, = −…
N
, −…
N
, = k iR + , t
k NQ + k iQ + ,
là các ma trận đối xứng bán xác định dương,
1
k NQ + là các ma trận đối xứng xác định dương được xem như là các tham số của hàm mục tiêu,
kT=
cùng với cửa sổ dự báo,
a
trong hàm phạt cần được với
và
thay đổi được theo k và i , tức là thay đổi dọc theo trục thời gian
cũng như theo i trong từng cửa sổ dự báo. Ngoài ra, ma trận
chọn phù hợp để đảm bảo được tính ổn định cho hệ kín. iL với ,1,0 1, i N= − … là nghiệm của các phương trình: − R a) Khi cửa sổ dự báo N là hữu hạn, nếu tồn tại N ma trận đối xứng xác định dương + − L Q
= + i L
i L
i L
i L
i k i
+ A
1
+ T
A
k i
+ B
1
+ k i
+ k i
+ T
B
k i
+ B
1
+ k i
+ T
B
k i
+ A
1
+ k i
+ ( ) 1 (4.7) K , thì dãy giá trị tín hiệu điều khiển: i
, = = (4.8) 0,1, x
i k i
+ − K R = − L
i i L
i T
+ B
k i
+ B
1
+ k i
+ T
B
k i
+ A
k i
1
+
+ ( ) 1 k i
+
sẽ làm cho hàm mục tiêu (4.5) đạt giá trị nhỏ nhất. (4.9) k NQ + = Θ , nếu tồn tại ma trận đối xứng xác b) Khi cửa sổ dự báo là vô hạn, tức là N = ∞ và R B B + − L Q
= + định dương L
i L
i T
B
k i
+ k i
+ k i
+ k i
+ k i
+ T
A
k i
+ T
B
k i
+ i A
k i
+ iL là nghiệm của phương trình:
) 1
− ( ⎤
⎥
⎦ K (4.10) = (4.11) 0 x
i k i
+ − R K L = − i L
i k i
+ T
+ B
k i
+ A
k i
+ B
i k i
+ T
B
k i
+ ( ) 1
sẽ làm cho hàm mục tiêu (4.5) đạt giá trị nhỏ nhất. (4.12) Từ định lý 4.1, luận án đi đến bộ điều khiển dự báo phản hồi trạng thái cho hệ song tuyến làm việc theo các bước của thuật toán sau. k = .
1) Gán
0
2) Cập nhật trạng thái kx . − K 0 i = và tính = − T
+ B
k R
k B
k k T
k 0 L
0 ( ) 1 k 1 3) Giải phương trình (4.10) với B A .
L
0
k= + và quay lại bước 2.
: kK=u k 4) Thực thi 15 Để đảm bảo bộ điều khiển thiết kế theo thuật toán 4.1 làm ổn định hệ song tuyến, luận án kQ R của hàm mục tiêu
(4.5) tương ứng là các ma trận đối xứng bán xác định dương và xác định dương, nếu các ma
0L tính theo (4.10) tại mọi thời điểm k là xác định dương, thì bộ điều khiển dự báo phản
trận
hồi trạng thái theo thuật toán 4.1 sẽ làm hệ ổn định tiệm cận. đưa ra định lý sau:
Định lý 4.2: Trong bài toán điều khiển dự báo hệ song tuyến (4.1) với ,k = + k k u
k 1
+ x k
( )
1
1 1
0 x k
0.25 ( )
1
0.5 , . = = A
k B
k ⎛
⎜
⎝ ⎞
⎟
⎠ 1
0 x k
( )
1
1 x k
0.25 ( )
1
0.5 ⎛
⎜
⎝ ⎞
⎟
⎠ ⎛
⎜
⎝ ⎞
⎟
⎠ B = có ⎞
⎟
⎠
u
k k I
0.2 Hình 4.1 mô phỏng đáp ứng thời gian của hai biến trạng thái của hệ với: = )1 4 .k
( kQ Q
= kR = kR như trên xuất phát từ lập luận như sau. Nếu chọn ku tới việc thay đổi hướng của kR giảm dần theo thời gian sẽ
Việc chọn
kx , kéo theo sẽ nâng cao
càng tăng được vai trò ảnh hưởng của
được chất lượng ổn định của hệ thống điều khiển. Lập luận này cũng sẽ được ta kiểm chứng ở
phần mô phỏng qua so sánh với trường hợp ma trận này không đổi, tức là khi =
1. kR R= 0.4 1.5 R decreasing
R constant R decreasing
R constant 0.2 1 1 x e t a 0 t
s 0.5 -0.2 0 5 10 15 20 30 35 40 45 50 0 25
k -0.4 u
l
o
r
t
n
o
c 1 -0.6 R decreasing
R constant 0.5 2 -0.8 x e t a t
s 0 -1 -0.5 -1.2 0 5 10 15 20 30 35 40 45 50 0 5 10 15 20 30 35 40 45 50 25
k 25
k và kR
kR không thay đổi (đường nét đứt). Tuy nhiên,
kR đồng nghĩa với việc cần nhiều nỗ lực điều .kR u≤u Rõ ràng bộ điều khiển làm hệ thống ổn định, không những thế đáp ứng thời gian khi k ,k max , hãy xác định hai ma trận 16 giảm (đường nét liền) tiến về gốc nhanh hơn khi
tín hiệu điều khiển trên hình 4.2 cho thấy giảm
khiển hơn để đưa hệ nhanh về ổn định so với khi giữ nguyên
Bài toán mở: Xét bài toán điều khiển hệ song tuyến (4.1) với bộ điều khiển nêu ở thuật toán 4.1.
Cho trước điều kiện ràng buộc
kQ R tương ứng cho hàm
mục tiêu (4.5). u≤u kR , đồng thời ta có thể xác định k max Mặc dù bài toán mở này chưa có lời giải đầy đủ, các kết quả ở ví dụ 4.1 đã gợi ý một quy
nhờ sử dụng 0 k = . Chọn kR thỏa mãn điều kiện
luật giảm
phương pháp lặp. Ta cải tiến thuật toán 4.1 và đi đến thuật toán sau đây. kR đối xứng xác định dương. Đồng 1) Gán 1η> . 1μ< thời chọn μ và η thỏa mãn 0 − K 0 = − 2) Cập nhật trạng thái kx . i = và tính R
k B
k T
+ B
k T
B
k A .
k 0 L
0 L
0 ) 1
và thực thi 3) Giải phương trình (4.10) với ku cho đối tượng; nếu max (
Rμ+ =
1 :
k u≤u
R
k
k
và quay lại bước 3. k 4) Tính thì gán 5) Gán , Xét hệ song tuyến được mô tả bởi:
x
B
+ k C . (4.20) k k A Để đơn giản về mặt ký hiệu, ta viết lại mô hình (4.20) thành: , + B
k k (4.21) k C
k k B trong đó (4.22) = = A
k B
k k k kC=C
k ), u và
(
) u .
(
) Để kiểm tra tính quan sát đều cho hệ song tuyến (4.20) hay (4.21), ta có định lý sau. nguyên dương M để có: … n rank , , , . (4.23) k k M 2 1
+ }
1
+ − 1
+ + C
k
C A
k
k
1
+
C A A
k
k
k
(cid:35) … C
k M k M A
k 2 A
1
+ − + − ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟ =
⎟
⎟
⎟
⎠ i ) ( , (cid:7)
k i A A A (cid:34) (cid:34) (cid:34) = + + + ( ) k k k i A
k B
k k 2 )
A B
k
1
+ 1
+ − + 1
+ ( k i
1
+ −
. k i
1
+ −
(cid:34)
+ )
A
k
B
+ k i k i 1
+ − i+ của cửa sổ quan sát, sẽ là: Suy ra sai lệch quan sát ie tại thời điểm k = − k i
+ (cid:34) (cid:34) (4.26) = − + + ) A
k k i 1
+ −
(cid:34) k i
+ k i
1
+ −
(cid:34) . + + + k i A
k k k i k i 2 1
+ − + 1
+ )
A B
k
k
1
+
C B
k i
+ 1
+ − Vậy ta có tổng bình phương các sai lệch quan sát trong toàn bộ cửa sổ quan sát là: 17 Q P (4.27) ) T
= E PE
k
k =P(cid:0) có P là ma trận đối xứng xác định dương tùy chọn, và: trong đó − = E
k với 0 0 k 0 k 1
+ 2 1
+ + 1
+ = − 2 C B
k
k
1
+
C A B
k
k
k
(cid:35) C B
k
k
1
+
(cid:35) k
+
(cid:35) C
k M C
k M k M 1
+ − 1
+ − 1
+ 1
+ − ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎠ 2 2 k
1
+
∏
j k M
= + − k
2
+
∏
j k M
= + − ⎛
⎜
⎝ ⎛
⎜
⎝ ⎞
A B
⎟
j
k
⎠ ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎝ . = G
,
k 2 1
+ + ⎞
A B
⎟
j
k
⎠
(cid:34) 0 0 C
k
C A
k
k
1
+
C A A
k
k
k
(cid:35) k (cid:34) 0 0 … C
k M k M A
k 2 A
1
+ − + − ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎠ (cid:34) 0 0 (cid:35) (cid:37) (cid:35) (cid:35) 0 C
k M k M 2 1
+ − + 1
+ − ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎠ 2 k
3
+
∏
j k M
= + − ⎛
⎜
⎝ ⎞
A B
⎟
j
k
⎠ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎠ Q G P P (4.28) ) = − + (
T
P
G G
k
k ) − P (4.29) T
G
k (
T
G G
P
k
k ) 1 Công thức (4.29) chính là nghiệm đúng của (4.27) nhận được nhờ phương pháp lặp Newton
– Raphson sau một bước tính và đã được nghiên cứu sinh trình bày trong [5]. Công thức này cho
phép ta xác định được trạng thái của hệ nhờ vào việc đo các giá trị của tín hiệu vào và ra trong
cửa sổ quan sát ,M với giả thiết rằng với giá trị M này thì hệ là quan sát đều. Dễ dàng chứng minh được 0 ) kG là nội xạ kéo theo điều kiện (3.36) của định lý 3.3 được thỏa
mãn. Từ đây, ta lại thấy nếu với mọi cửa sổ quan sát, hàm mục tiêu (4.28) có
Q
thì điều kiện (3.35) của định lý 3.3 cũng được thỏa mãn và do đó theo
min ( = k ,u y có độ dài M với các m r M i
, 0,1, 1. = ∈ ∈ − R R , k i
+ . k i
+ k i
+ i với i
[ ] i
[ ] = = 0,1, −…
M
, = )
[ ] , ( ( ) ) A
i i C
=C B
i và
2.
4) Lần lượt thực hiện các bước sau đây theo từng chu kỳ trích mẫu aT : 18 rồi gán vào mảng: , k M k M 1
+ − 1
+ − a) Trích mẫu
M
1]
[
− = k M 1
+ −
. M
[ k M 1
+ − 1] [ 1] = − − − , ) ) B
i C
M M − =
1 − = , 0
0
C B
1 1
(cid:35) 0
0
0
(cid:35) …
0
…
0
…
0
(cid:37) (cid:35) ⎞
⎟
⎟
⎟
⎟
⎟
⎟−
1]
⎠
0
C B
1 0
C A B
2 1 0
(cid:35) … 0 [0]
[1]
[2]
(cid:35)
M
[ 1] − C
M j M j M A B C
0 A B C
1 1
− 1
− 1
− ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎠ 2 2 2 2
∏
j M
= − 3
∏
j M
= − 1
∏
j M
= − ⎞
⎟
⎠ ⎛
⎜
⎝ ⎞
⎟
⎠ ⎛
⎜
⎝ ⎞
A B
⎟
j
2
⎠ ⎛
⎜
⎝ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎠ G . = C
0
C A
1 0
C A A
2 1 0
(cid:35) … M 2 A
0 − ⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
⎜
⎜
⎜
−⎜
⎜
⎜
⎜
⎜
⎝
⎛
⎜
⎜
⎜
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎠ − T P c) Tính d) Dồn lại mảng dữ liệu bằng cách thực hiện 1M − các phép gán lần lượt với =
i
[ ] : i
[ + . :
= :
= 1],
C
i C
i i 1
+ u a , = = k k 1
+ k
0.5 − (4.31) u
k 2 ⎞
⎟
⎠ ⎛
⎜
⎝ . + = = +
−
( )
k k k ( )
ax k
⎛
1
⎜
( )
u x k
⎝
k
1
( )
x
x k
1 2 0.5 Hệ sẽ là quan sát đều a∀ ≠ − .M M u k cả các mô phỏng sau đây, ta sử dụng tín hiệu vào P I ×
Trong tất
=
và trạng thái đầu . Hàm mục tiêu (4.27) được chọn với
k
( ) 1.5sin( ) = 1 , 1 .T
(
) =x
0 19 2 true x 1 1
estimated x 1 1 0 x -1 -2 5 10 15 20 25 30 35 40 45 50 0 2 true x 1 2
estimated x 2 2 0 x -1 -2 0 5 10 15 20 30 35 40 45 50 25
k Cho 0.25, a = hệ (4.31) thỏa mãn tính quan sát đều và hơn nữa, hệ là ổn định. Để khảo sát
các đặc tính của bộ quan sát, các mô phỏng cho trường hợp này được thực hiện cho cả trường hợp
tín hiệu ra đo được không bị lẫn nhiễu và tín hiệu ra đo được bị lẫn nhiễu. Ngoài ra, sai lệch giữa ( ) , , trong đó ( ( ) T
) =e
k e k
1 e k
2 − = (cid:7)
x k
2( ) 5.M = Hình 4.4 biểu diễn đáp ứng
cùng với với các biến trạng thái
và
x k của hệ. Khi không có nhiễu đo hoặc sai lệch mô hình, và vì trong ví dụ này,
nên ta thấy giá trị quan sát được trùng hoàn toàn với giá trị thực của biến trạng thái, thậm chí còn không phụ thuộc vào độ rộng của cửa sổ quan sát M . Điều này là phù hợp với
điều kiện đủ đã được nêu trong định lý 3.1. Khi này bộ quan sát tối ưu trở thành bộ quan sát FTO. Để khẳng định được tính ổn định của hệ điều khiển dự báo phản hồi đầu ra cho hệ song tuyến bằng lý thuyết và thực nghiệm, ta xét hệ song tuyến mô tả được dưới cả hai dạng sau: , + B k (4.33) , C k k / A và (4.34) , = C k
. = k k Thuật toán điều khiển phản hồi đầu ra khi kết hợp bộ điều khiển dự báo phản hồi trạng thái với cửa sổ dự báo vô hạn và bộ quan sát trạng thái tối ưu có cấu trúc như sau. , u y có độ dài M với các m p … M phần tử được ký hiệu là i
, i
[ ] 1. , = ∈ ∈ − R R 0,1,
1M − giá trị vào ra đầu tiên của hệ (4.20) gồm k i
+ k i
+ 2) Gán
i ,
. Đưa những giá trị đo được này vào hai mảng đã khai báo theo thứ tự:
= k i
+ / i 0,1, 1. 3) Xây dựng các ma trận và với = −…
M
, i
[ ] ( ) ( )
i
[ ] , =C
i C .
k i
+
/
=A
i A 20 4) Lần lượt thực hiện các bước sau đây theo từng chu kỳ trích mẫu aT : i M … , 1, , 1 = − = = C A A A(cid:34)
i
0
1 0 0 1
− G , . = = 1] E
0
(cid:35)
E −
M
1 ⎛
⎜
⎜
⎜
⎝ ⎛
⎜
⎜
⎜
⎝ ⎞
⎟
⎟
⎟
⎠ ⎞
⎟
⎟
⎟
⎠ − T b) Tính P −
(
dựa vào mô hình (4.34) và các số liệu đo và tính c) Tính , 0,1, 2 = −…
M
, i
, k i
+ k i
+ luật điều khiển phản hồi trạng thái theo (4.11). ∗
+u
k M . ∗
+u
k M k M+y
1M − các phép gán sau lần lượt với d) Đưa
vào điều khiển đối tượng và trích mẫu
e) Dồn lại mảng dữ liệu bằng cách thực hiện 2
i i
[ 1], =
i
[ ] : + =
. :
= :
= i
u i
f) Gán: 1] : , = − − A M
[ − − )
1] . C
M 1
− 1
− g) Gán :
=
1 0 L x trong công thức (4.10) của bộ điều khiển (4.11) ứng với i = là xác định )k 0 ( khiển dự báo phản hồi đầu ra thiết kế theo thuật toán 4.3, nếu tại mọi thời điểm k có:
a) Ma trận
dương. b) Đối tượng là quan sát đều tức là có cửa sổ dự báo M được chọn đủ lớn sao cho (4.25) được thỏa mãn. để có với vector c) Tồn tại ít nhất một chỉ số 0 l M≤ < le được xây dựng theo công thức (4.26), thì hệ kín sẽ ổn định tiệm cận. y x và (4.38) = + = ( )
k (
)
1 , 1 k k ( )
x k
1 2 1
+ u x
+
k
x
0.5 ( )
k
2
( )
k k ( )
x k
1.25
1
( )
u x k
−
1 2 ⎛
= ⎜
⎝ ⎞
⎟
⎠ T x , trong đó là vector trạng thái của hệ. Đối tượng (4.38) này đồng thời ( )
k =x
k ( )
x k
1 2 ( ) chuyển được về cả hai dạng (4.33) và (4.34) với: x k
2, / ( A B C C A , ) , ) ) . và = = = = (
)
1 , 1 k k k x u
k
0.5 − 1.25
0 0
0.5 − k
1, 1.25
u
k ⎛
⎜
⎝ ⎞
⎟
⎠ ⎛
= ⎜
⎝ ⎞
⎟
⎠ ⎛
⎜
⎝ ⎞
⎟
⎠ Chọn cửa sổ quan sát
và = = = Hàm mục tiêu của bộ quan sát là (4.36) với kR R= 5 5. P I ×= − 5M = . Ngoài ra hàm mục tiêu của bộ điều khiển có dạng (4.35) với
kQ Q I ×
Hình 4.8 và
1.
2 2
4.9 biểu diễn đáp ứng thời gian của các biến trạng thái thực của hệ kín khi không có nhiễu đầu ra
và có trung
(đường nét liền) và khi có nhiễu đầu ra với phân bố đều trong khoảng [ 0.1 , 0.1]
bình bằng 0 (đường nét đứt). Các đáp ứng trạng thái của hệ khi có nhiễu sai khác không đáng kể 21 so với khi có nhiễu và đều tiến về 0 sau một khoảng thời gian chứng tỏ hệ kín ổn định với bộ điều
khiển dự báo phản hồi đầu ra theo nguyên lý tách. Đồ thị của tín hiệu điều khiển được cho trên
hình 4.10. 50 3.5 without noise
with noise 40 without noise
with noise 3 30 2.5 20 2 2 1 10 x 1.5 x 0 1 -10 0.5 -20 0 -30 -0.5 5 10 15 20 25 30 35 0 5 10 15 20 25 30 35 0 k k 18 16 without noise
with noise 14 12 10 8 t
u
p
n
i
l
o
r
t
n
o
C 6 4 2 0 -2 0 5 10 15 20 25 30 35 k Trong chương này, một phương pháp điều khiển dự báo sử dụng phản hồi đầu ra theo nguyên lý tách cho hệ song tuyến đã được trình bày. … , = Việc thay đổi
( kR để đảm bảo điều kiện ràng buộc cho độ lớn của vector tín hiệu điều khiển
( ) T
)
còn có thể mở rộng cho các ràng buộc của từng thành phần của ku : u k
m k j m 1, 2, , , (4.39) u≤ = … . u k
1( ),
( )
u k
j j ,max … , , , Khi đó, với ma trận , ta có thể thay đổi từng giá trị của = k r
k
2, r
m k
, j kr
, , (
R diag r
k
1, ) j m 1, 2, , = … để có được (4.38). 22 Trong nhiều bài toán điều khiển, ngoài ràng buộc của tín hiệu điều khiển, người ta còn
, phải nằm trong một giới hạn cho
= Δ − k k k −
1 . (4.40) mong muốn số gia của tín hiệu điều khiển,
trước: u≤ Δ k max Phương pháp thiết kế bộ điều khiển dự báo với hàm mục tiêu có tham số biến đổi ở mục 4.1 vẫn
kuΔ như sau
được áp dụng nếu ta chuyển mô hình trạng thái (4.3) về dạng thích hợp với sai lệch k 1
+ Δ = + k A B
k
I B
k
I k
0 k k 1
− ⎛
⎜
⎝ ⎞
⎟
⎠ ⎛
⎜
⎝ ⎞
⎟
⎠ ⎛
⎜
⎝ ⎞
⎟
⎠ ⎛
⎜
⎝ ⎞
⎟
⎠ X + (cid:7)
(cid:7)
A X B
k
k
k hay:
+ =
1k
trong đó k , và . (cid:7)
A
k (cid:7)
B
k X
k A B
k
I B
k
I k
0 k −
1 ⎛
= ⎜
⎝ ⎞
⎟
⎠ ⎛
= ⎜
⎝ ⎞
⎟
⎠ ⎛
= ⎜
⎝ ⎞
⎟
⎠ Lúc này, hàm mục tiêu (4.5) trở thành: J X Q X R X Q X + Δ Δ + k k i
+ T
k i
+ k i
+ T
k i
+ k i
+ k i
+ T
k N k N k N
+
+ + ) trong đó N
1
−
(
∑=
i
0
=
k i+Q , k i+R sẽ được lựa chọn để thỏa mãn (4.40). Với bài toán điều khiển mà ở đó yêu cầu chất lượng lại là trạng thái ref
kx kx của hệ song tuyến
(4.1) bám ổn định theo được quỹ đạo mẫu là hằng số
cho trước, ta hoàn toàn vẫn sử dụng
được bộ điều khiển dự báo làm hệ ổn định đã phát biểu trong định lý 4.1 cũng như ở thuật toán
4.1 (không bị ràng buộc) và thuật toán 4.2 (khi có ràng buộc) như sau. Giả thiết ma trận ( )kB x luôn có hạng là m , trong đó m n≤ là số các tín hiệu đầu vào, tức
ku và n là bậc của hệ. Khi đó ở hệ tương đương (4.3) sẽ có T
kB B là ma
k luôn khả nghịch. Bởi vậy ở chế độ xác lập ta sẽ có: là số các phần tử của
trận vuông m m× 1
− ref A I . (4.41) = + = − ( ) ref
k B
k ref
k ref
k T
B B
k
k T
B
k A
k ref
k ( ) Đặt: = − = − e
k k ref
k e
k k ref
k cho hệ (4.3) là tương đương với bài toán điều (4.42) e
B
k e
k + =
1 0 e
k →x tức là tương đương với bài toán điều khiển sao cho
. Hiển nhiên cho bài toán điều khiển
ổn định này ta hoàn toàn sử dụng lại được nội dung định lý 4.1 cũng như thuật toán 4.1 (khi
không có điều kiện ràng buộc) hoặc thuật toán 4.2 (khi có điều kiện ràng buộc). ky của bám ổn định theo được tín hiệu ra mẫu Nội dung định lý 4.1 và thuật toán 4.1 (cho trường hợp bài toán không có ràng buộc), thuật
toán 4.2 (khi bài toán có thêm ràng buộc (4.6)) cũng hoàn toàn áp dụng được cho bài toán điều
ref
ky
khiển bám hệ song tuyến (4.1) để tín hiệu ra
cho trước, nhờ một sửa đổi nhỏ như sau. Trước tiên ta giả thiết rằng m r= , tức là hệ có số đầu vào bằng số đầu ra. Thêm nữa ta giả thiết rằng ở chế độ xác lập, khi đã có , tức là khi có: 23 ref A + = I − B
k ref
k ⇔ = = (cid:7)
A
k B
k
Θ A
k
C
k = ⎛
⎜
⎝ ⎞
⎟
⎠ 0
ref
k ⎛
⎜
⎜
⎝ ⎞
⎟
⎟
⎠ ref
k
ref
k ref
k
ref
k ref
k
ref
k ⎛
⎜
⎜
⎝ ⎞
⎟
⎟
⎠ ⎛
⎜
⎜
⎝ ⎞
⎟
⎟
⎠ I− (cid:7)
A
k A
k
C
k B
⎞
k
⎟Θ
⎠ là không suy biến. Với giả thiết trên ta có ngay được: 1
− I − (4.43) . = = (cid:7)
1
−
A
k B
k
Θ A
k
C
k ⎛
⎜
⎝ ⎞
⎟
⎠ ⎛
⎜
⎜
⎝ ⎞
⎟
⎟
⎠ ⎛
⎜
⎜
⎝ ⎞
⎟
⎟
⎠ ref
k
ref
k ⎛
⎜
⎜
⎝ ⎞
⎟
⎟
⎠ = − = − ref
k e
k k ref e
k
trong đó được xác định từ , ky theo (4.43), thì hệ sai số cũng sẽ là (4.42). (cid:7)
A (cid:7)
B = + (4.44) Các kết quả nghiên cứu mở rộng của luận án về điều khiển dự báo phản hồi đầu ra cho hệ phi tuyến có thể được tóm tắt như dưới đây: − Tiêu chuẩn ổn định cho hệ điều khiển dự báo phản hồi trạng thái hệ phi tuyến mà ở đó hàm
mục tiêu có cấu trúc biến đổi trong cửa sổ dự báo cũng như theo sự dịch chuyển của cửa sổ
dự báo trên trục thời gian (hệ quả 3.1 và 3.2). − Bộ điều khiển dự báo phản hồi trạng thái hệ song tuyến làm cho hệ kín thu được là ổn định tiệm cận (định lý 4.1 và 4.2). − Thuật toán quan sát trạng thái tối ưu cho hệ phi tuyến và điều kiện đủ để bộ quan sát đó trở thành bộ quan sát FTO (định lý 3.1 và 3.2). − Điều kiện cần và đủ để hệ song tuyến là quan sát đều và xây dựng thuật toán quan sát trạng thái tối ưu cho hệ song tuyến (định lý 4.3). − Điều kiện đủ để bộ điều khiển dự báo phản hồi đầu ra, xây dựng trên nền nguyên lý tách,
làm hệ phi tuyến nói chung và hệ song tuyến nói riêng là ổn định tiệm cận với bộ quan sát
FTO (hệ quả 3.3, định lý 3.3 và 4.4) và ổn định ISS (định lý 3.4). Như đã được đề cập ở chương 4, luận án đã nêu lên một bài toán mở cần được nghiên cứu
tiếp theo là xác định tham số hàm mục tiêu cho bộ điều khiển dự báo phản hồi trạng thái hệ song
tuyến để bộ điều khiển đó thỏa mãn được các điều kiện bị chặn của tín hiệu điều khiển. Ngoài ra, ở chương 3, mặc dù định lý 3.3 đã đưa ra điều kiện đủ (3.52) để hệ kín phản hồi
đầu ra là ổn định tiệm cận, song có thể thấy đây là một điều kiện khá chặt, khó thực thi trong ứng
dụng. Để mềm dẻo hơn, nghiên cứu sinh đã đưa ý tưởng kết hợp thêm phần chỉnh định thích nghi
để có bộ điều khiển dự báo thích nghi. Đây cũng sẽ là hướng nghiên cứu sau này của nghiên cứu
sinh. 241.2.2 Tính ổn định ISS
Khái niệm ổn định ISS liên quan tới hệ bất định, có mô hình không bị kích thích:
x
f x d
k
f
0 0
( ,
(1.10)
trong đó kd là tín hiệu bất định, tác động không mong muốn vào hệ. Khái niệm này được hiểu
như sau:
Định nghĩa 1.3: Xét hệ phi tuyến không dừng (1.10) cân bằng tại gốc, tức là:
0
,
= ∀ ≥
d
x
x
d
k
x d
,
k
0
1.2.3 Quy hoạch động của Bellman
Định lý 1.3 [23]: Xét bài toán quy hoạch động dạng chuẩn:
f x u
k
x
x u
(
,
k
→
u
,
x
x
⎧
⎪
⎨
J
⎪⎩
0x là trạng thái đầu cho trước, thì với ký hiệu:
trong đó
)
(
=
inf
u
…u
,
,
0
x
x
x u
,
k
u
∗
∗
u
−…u
,
, N
0
1
0x , thì ta có:
x
x
x u
,
k
∗
−…x
x
, N
1
(
)
∗
k B
+
K
tối ưu cũng là tối ưu với trạng thái đầu và cửa sổ dự báo thích hợp.
Hệ quả 1.1 [23]: Nếu
∗
−…u
u
, N
1
u
u
f x
(
u
x
(
u u
,
k
x
⎧
⎪
⎨
J
⎪⎩
ta có định lý về tính ổn định của hệ kín như sau.
Định lý 1.4 [23]: Xét bài toán điều khiển tối ưu (1.13) cho hệ thống được mô tả bởi:
x
0
( , ) =
0 0
,
,
x
x
f x u
f
k
α α α ∞∈ K sao cho:
Giả sử tồn tại các hàm 1
(
(
k α≥
x u
x
x
(
, )
,
α
α
k
3
1
2
(
x
x
x
)
(
∗u
trong đó
k
là phần tử đầu tiên của dãy giá trị tín hiệu điều khiển tối ưu, thì luật điều khiển này sẽ làm
cho hệ kín:
(
(
f x u x
,
+ =
k
1
CHƯƠNG 2:
TỔNG QUAN VỀ ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA
DỰA TRÊN QUAN SÁT TRẠNG THÁI
2.1 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ
tuyến tính
2.1.1 Điều khiển dự báo bền vững hệ tuyến tính sử dụng bộ quan sát tựa Luenberger
2.1.2 Điều khiển dự báo bền vững hệ tuyến tính sử dụng bộ quan sát Moving Horizon
2.2 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ
phi tuyến
2.2.1 Điều khiển dự báo hệ phi tuyến sử dụng bộ quan sát High Gain
2.2.2 Điều khiển dự báo hệ phi tuyến sử dụng bộ quan sát mở rộng
2.3 Đánh giá chung
2.3.1 Đánh giá các phương pháp điều khiển hiện có
2.3.2 Định hướng của luận án
CHƯƠNG 3:
ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA VỚI BỘ QUAN
SÁT TRẠNG THÁI TỐI ƯU CHO HỆ PHI TUYẾN
3.1 Điều khiển dự báo phản hồi trạng thái hệ phi tuyến
3.1.1 Phản hồi trạng thái với hàm mục tiêu có cấu trúc biến đổi
x
f x u
)
,
k
f
0 0
( , )
0
.=
w w
,
{
0
1
∞ =
w
{ }
Ký hiệu
l
0
phải bám theo.
Do
u
u
v
k
w w và
k
1
+
x w và
k
e
k
u
e
k
f e w v
+
k
w
k
f e v
(
k
k
u
e
(
(
e
u
/
f e
(
u
e
(
(
e
→
u
,
e
⎧
⎪
⎨
J
⎪
⎩
u
e
u
(
e
e u e
,
(
k
k
u
u
u
e
(
u
e
(
min
u
…u
,
,
k i
+
u
e
(
e
(
e
(
) min
u
k i
+
u
e
(
e
(
e
(
Hệ quả 3.1: Xét hàm
. Ký hiệu
u
e
(
3.1.2 Phân tích tính ổn định
u
/
f e
(
u
e
(
e
(
N k N
→
u
,
e
⎧
⎪
⎨
J
⎪
⎩
u
e
(
e
(
N k N
e
(
k
e
(
k
Hệ quả 3.2: Nếu hàm Bellman giả định
e
(
k
e
k
e
k
e
k
*(
u e của bộ điều khiển dự báo sẽ làm hệ sai lệch (3.3) ổn
k
3.2 Quan sát trạng thái hệ phi tuyến
h x u
(
,
).
3.2.1 Các vấn đề chung của quan sát trạng thái
y
f x u
k
h x u
,
k
Định nghĩa 3.1 [9,25,4]: Hệ (3.20) được gọi là quan sát được, nếu mọi giá trị trạng thái
x
f
U
x
0(
U
u u
,
{
0
1
u
h
y
x
(
x
(
f
U
f
U
h x u
k
(
h
= Φ
Tiêu chuẩn kiểm tra tính quan sát được
f
U
f
U
)
x
( ,0)
)
f
U
x
T
∂
U
x
∂
f
h
U để có (3.26).
f
h
3.2.2 Xây dựng bộ quan sát trạng thái tối ưu
u
(cid:7)
x là giá trị trạng thái quan sát được ở thời điểm k . Sử dụng ngay mô hình (3.20) của
k
hệ làm mô hình quan sát:
(cid:7)
f x
(
k i
(cid:7)
x
k i
+
1
+ −
(cid:7)
f x U
k
i
u
U
i
iU là ký hiệu dãy hữu hạn của i các phần tử:
u u
{
}.
,
=
k
1
+ −
y
u
u
U
i
y
k i
+
(cid:7) (cid:7)
h x
(
i
k
U
i
(cid:7)
h x
(
,
k i
+
(cid:7)
i
h f x
(
k
)1
)
u
U
i
(cid:7) (cid:7)
h x
(
i
k
U
i
(cid:7)
i
h f x
(
(
−
k
)
sẽ là:
y
(cid:22)
với
)
k i
1
+
+
k k M+
lệch quan sát trong toàn bộ cửa sổ quan sát [ ,
(cid:7)
x
(
k
(cid:7)
(cid:7)
h x U
k
i
i
(cid:7)
x trong các công thức (3.28) và (3.29)
)kQ
(
iγ ⋅ ∈ K dạng
(cid:7)
(cid:7)
h x
(
i
k
(cid:7)
(cid:7)
h x
(
k
i
U
i
U
i
U
i
T
0
(cid:7) (cid:7)
h x U
(
k
i
e
i
(cid:7)
x
(
k
(cid:7)
(cid:7)
h x
(
k
i
U
i
(cid:7)
(cid:7)
h x
(
k
i
U
i
U
i
e
i
(cid:7)
(cid:7)
h x
(
k
i
thì hàm mục tiêu (3.29) trở thành:
M
1
−
)
γ
∑
i
i
0
=
M
1
−
T
e
∑
i
i
0
=
(cid:7)
x cần xác định phải là nghiệm của bài toán tối ưu phi
k
Vậy giá trị trạng thái quan sát tối ưu
tuyến:
(cid:7)
*
x
k
(cid:7)
kQ
x
Giả thiết 3.2:
(cid:7)
(cid:7)
x .
x là lồi theo k
)kQ
(
Định lý 3.1: Nếu bài toán tối ưu (3.33) có nghiệm
(cid:7)
*
x thỏa mãn với ít nhất một chỉ số 0 l M≤ <
k
y
l
h f x U
(
l
(
b) hàm tích (
)
là nội xạ,
)( )
⋅
(cid:7)
*
x .
x
k=
k
f
Định lý 3.2: Nếu hệ (3.20) có
( , )⋅ ⋅h
(cid:7)
*
x
k
3.2.3 Cài đặt thuật toán quan sát tối ưu
Thuật toán 3.1: (Quan sát trạng thái tối ưu)
1) Chọn cửa sổ quan sát M và khai báo hai mảng dữ liệu đầu vào
u
y
i
, [ ]
y
∈
2) Xây dựng hàm mục tiêu (3.29) có sử dụng (3.27), (3.28) cho bài toán tối ưu (3.33).
3) Gán
i
=
u
k = và đo
0
M
−…
0,1,
2.
,
y
u
i
i
, [ ]
[ ]
=
u
k M
u
y
,
u
a) Trích mẫu
M
1]
[
− =
y
y
(cid:7)
*
x . Nếu sử dụng các phương pháp lặp để tìm nghiệm
k
(cid:7)
*
x
k
(cid:7)
x là tùy chọn.
(cid:7)
*
x
1k −
y
M
i
−…
2 :
0,1,
,
=
y
u
u
i
i
i
[ ] :
[
1], [ ] :
=
+
=
k= + rồi quay lại bước a).
k
d) Gán
:
1
3.3 Tính ổn định của hệ điều khiển dự báo phản hồi đầu ra theo nguyên lý
tách với hàm mục tiêu có cấu trúc biến đổi
Hình 3.7 dưới đây mô tả nguyên lý làm việc của bộ điều khiển dự báo phản hồi trạng thái
u
u
u
u
u
Hình 3.7: Nguyên tắc làm việc của bộ điều khiển dự báo phản hồi đầu ra theo nguyên lý tách.
u
y
u
f x
(
u
x
(
x
(
x
⎧
⎪
⎨
J
⎪⎩
u x của dãy
u x lấy từ bài toán tối ưu (3.45) tạo thành hệ kín:
x
f x u x
,
k
u
*
x
(
k M k M
Hệ quả 3.3: Nếu
u x được thay bằng
u x , trong đó
(cid:7)
*
x là nghiệm của:
k
)
y
u
U
i
u
x
(
x
(
x
(
k = …:
0,1,
x
)
(
x
u x của (3.46) sẽ làm hệ kín:
x
f x u x
,
k
x
x
(
*
f x u x
,
k
k
3α ∈ K .
u x lấy từ bộ điều khiển phản hồi đầu ra
u x , trong đó
(cid:7)
(
*
f x u x
,
k
k
y
(cid:68)
h f
(
(cid:7)
*
x
k
(cid:7)
x U
,
k
i
)
) .
(cid:7)
x
k
⎧
x
⎪
⎨
⎪
⎩
Định lý 3.3: Nếu bộ điều khiển dự báo phản hồi trạng thái
* (
u x làm hệ ổn định ứng với hàm
k
u x cũng sẽ làm hệ ổn định với mọi bộ quan
(cid:7)
*
f x u x
,
k
k
f x u x
,
k
* (
u x làm hệ ổn định tiệm cận và hệ
k
x
/
f x
(
f x u
k
(
f x u x
,
k
f x thỏa mãn điều kiện Lipschitz, thì hệ kín phản hồi đầu ra sử dụng trạng thái
e , trong đó ke là sai lệch quan sát, sẽ ổn định ISS với miền hấp dẫn
k
x y
e
(
γ ∞
e là ký hiệu chuẩn vô cùng của vector hàm và
x y
,
) max ( ,
x y
,
CHƯƠNG 4:
ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA VỚI BỘ QUAN
SÁT TRẠNG THÁI TỐI ƯU CHO HỆ SONG TUYẾN
x
x x
A
(
)
k
u x
A
(
)
k
u u
)
(
4.1 Điều khiển dự báo phản hồi trạng thái hệ song tuyến
4.1.1 Thiết kế bộ điều khiển dự báo phản hồi trạng thái cho hệ song tuyến với hàm
mục tiêu có tham số biến đổi
+A
x
k k
u
x và
)
(
x
u
x
x
x
k i k i
+
T
u
k i
+
Định lý 4.1: Xét hệ song tuyến (4.1) với mô hình dự báo (4.3). Khi đó:
T
A
k i
k i
+
+
L Q +
=
và ở bước đầu tiên có N
k N
N
u
−…
1
,
k i
+
với
⎡
L I
i
⎢
⎣
thì dãy giá trị tín hiệu điều khiển:
i
u
,
≥
k i
+
với
Thuật toán 4.1: (Điều khiển dự báo phản hồi trạng thái khi không có điều kiện ràng buộc)
x cho đối tượng rồi gán
0
4.1.2 Tính ổn định của hệ điều khiển dự báo phản hồi trạng thái
Ví dụ 4.1: Để minh họa thuật toán 4.1 và định lý 4.2 nói trên, ta sẽ thiết kế bộ điều khiển dự báo
có cửa sổ dự báo vô hạn làm ổn định hệ song tuyến bậc hai:
x
x
⎛
⎜
⎝
x
+A
k k
Hình 4.2: Tín hiệu điều khiển u cho ví dụ 4.1.
Hình 4.1: Đáp ứng thời gian của các biến trạng
thái 1x và 2x cho ví dụ 4.1.
Thuật toán 4.2: (Điều khiển dự báo phản hồi trạng thái khi có điều kiện ràng buộc)
kQ đối xứng bán xác định dương và
< ,
x . Nếu
kK=u
k
0
không thì gán
R
Rη=
:k
k
k= + và quay lại bước 2.
:
1
4.2 Quan sát trạng thái hệ song tuyến
4.2.1 Kiểm tra tính quan sát đều của hệ song tuyến
u u
(
)
k
+ =
k
1
y
=
u x
A
(
)
k
k
u x
(
)
k
x
u
x
k k
x
,
+ =
k
1
y
=
A
u
(
Định lý 4.3: Hệ song tuyến (4.20) hay (4.21) sẽ quan sát đều khi và chỉ khi tồn tại ít nhất một số
u
∀ =
U
u u
{
,
k
4.2.2 Thiết kế bộ quan sát trạng thái tối ưu cho hệ song tuyến
f x U tính theo (3.27) như sau:
u
(cid:7)
x
k
Hệ (4.20) hay (4.21) có các hàm
(cid:7)
x
k i
+
u
1
+
(
u
1
+ −
y
e
i
y
u
(cid:7)
x
k
)
B
k
(cid:7)
C
x
k i k i
+
+
(
C A
k i
+
(
C A
k i
+
(
C A
k i
+
u
1
+
k
u
1
+ −
(cid:7)
x
(
k
e
i
M
1
−
T
e
∑=
i
i
0
=
)
(
diag P
(cid:7)
x
k kG
b
k
y
y
y
b
k
y
u
u
k
1
+
u 2
k
+
(cid:35)
u
Nói cách khác:
(cid:7)
T
x
k
(cid:7)
x
(
k
(cid:7)
x
k
T
b
2
k
(cid:7)
x
k k
T
b
k
b .
k
Do hàm mục tiêu (4.28) có dạng toàn phương nên nghiệm tối ưu của nó sẽ là:
(cid:7)
∗ =
x
k
b .
k
x với mọi cửa sổ quan sát. Nói cách khác, bộ quan sát tối ưu cho hệ song
(cid:7)
Q ∗
x
)
(
=
k
(cid:7)
∗ =
x
k
(cid:7)
x
k
định lý 3.3 này,
tuyến với giá trị trạng thái quan sát được xác định theo (4.29) là bộ quan sát FTO.
Thuật toán 4.3: (Quan sát trạng thái tối ưu hệ song tuyến)
1) Chọn cửa sổ quan sát M và khai báo hai mảng dữ liệu đầu vào
i
y
, [ ]
u
y
i
u
…
[ ]
,
1M − giá trị vào ra đầu tiên của hệ (4.20) gồm
,
k i
+
Đưa những giá trị đo được này vào hai mảng đã khai báo theo thứ tự:
=
u
u
phần tử được ký hiệu là
k = và đo
0
2) Gán
−…
M
i
=
0,1,
2.
,
i
i
y
y
u
u
, [ ]
[ ]
=
3) Xây dựng các ma trận:
(
B
A i
u
u
u
u
y
,
,
y
y
(
B M
u
[
(
C M
u
1]
− =
b) Xác định các ma trận
)
(
A M
A
u
1] ,
[
− =
1
và từ đó là:
b
y
y
[0]
y
[1]
y
[2]
(cid:35)
M
[
u
u
u
u
b .
C A
M
1
−
(cid:7)
) 1
(
T
∗ =
x
P
k G G G
i
u
y
:
−…
M
2 :
0,1,
,
y
u
i
i
1], [ ] :
[
+
=
=
A A B
B
:
,
,
=
i
i
i
1
1
+
+
k= + rồi quay lại bước a).
k
:
1
e) Gán
x
Ví dụ 4.2: Để minh họa cho thuật toán 4.3 vừa nêu, ta sẽ thiết kế bộ quan sát trạng thái tối ưu cho
hệ song tuyến bậc hai, mô tả bởi:
( )
k
u x
⎞
k
2
⎟
( )
k
x
0.5
⎠
)
(
x
1 , 1
⎧
x
⎪
⎨
⎪
y
⎩
Hình 4.4: Trạng thái quan sát được so với trạng thái thực của hệ khi không có nhiễu đo.
trạng thái thực với trạng thái quan sát được sẽ được ký hiệu là
e
k
(cid:7)
x
.
k
x
k
Trường hợp không có nhiễu đo. Chọn cửa sổ quan sát
(cid:7)
x k
thời gian của hai biến trạng thái quan sát được 1( )
x k và 2( )
thực 1( )
(cid:7)
kQ
x
) 0
min (
=
(cid:7)
x
k
4.3 Tính ổn định của hệ song tuyến phản hồi đầu ra theo nguyên lý tách
x u
(
)
k
+ =
k
1
y
=
x x
A
(
)
k
k
u x
(
)
k
x
⎧
⎨
⎩
u x
)
(
k
u x
(
)
k
+⎧
x
⎪
k
1
⎨
y
⎪⎩
Với mô hình (4.33) thì ta đã xây dựng được bộ điều khiển dự báo phản hồi trạng thái làm
cho hệ ổn định như ở mục 4.1.1. Sử dụng mô hình (4.34) thì ta đã xây dựng được bộ quan sát
trạng thái tối ưu như ở mục 4.2.2.
Thuật toán 4.4: (Điều khiển phản hồi đầu ra theo nguyên lý tách)
1) Chọn cửa sổ quan sát M và khai báo hai mảng dữ liệu đầu vào
u
y
i
, [ ]
u
y
y
k = và đo
0
−…
M
0,1,
2
,
=
y
u
u
i
i
, [ ]
[ ]
=
u
u
y
b
b .
u
y
a) Xác định các ma trận:
E
C
E
,
i
0
và từ đó là:
[0]
(cid:35)
y
M
[
(cid:7)
) 1
T
∗ =
x
k G G G
P
(cid:7)
x
k M+
y
u
y
u
y
M
, [
)
1] ,
k M
+
(
u
C
−…
M
0,1,
,
:
y
u
i
1], [ ] :
[
+
=
C
A A C
,
i
i
i
1
1
+
+
∗
u
M
1] :
[
=
k M
+
(
M
A
:
[
=
M
k= + rồi quay lại bước a).
k
:
Định lý 4.4: Trong hệ điều khiển dự báo cho đối tượng song tuyến (4.33) và (4.34) bằng bộ điều
e
l = 0
Sau đây ta sẽ áp dụng thuật toán 4.4 để kiểm chứng tính ổn định của hệ điều khiển dự báo
phản hồi đầu ra là kết hợp giữa bộ điều khiển phản hồi trạng thái và bộ quan sát trạng thái tối ưu
cho một đối tượng song tuyến không ổn định.
Ví dụ 4.3: Xét đối tượng song tuyến bậc hai được mô tả bởi:
x
x
k
u
x
(
u
(
trạng thái
Hình 4.8: Đáp ứng thời gian của biến trạng
thái 1x cho ví dụ 4.3.
Hình 4.9: Đáp ứng thời gian của biến
2x cho ví dụ 4.3.
Hình 4.10: Tín hiệu điều khiển u cho ví dụ 4.3.
4.4 Tóm tắt chương và các mở rộng
4.4.1 Tóm tắt chương
4.4.2 Các mở rộng
Ràng buộc theo từng thành phần của tín hiệu điều khiển
u
Ràng buộc theo số gia của tín hiệu điều khiển
u
u
u
uΔ
u
x
k
u
x
u
uΔ
k
x
u
u
u
Điều khiển bám ổn định theo quỹ đạo trạng thái mẫu
x
u
x
u ⇒
x
k k
u
u
x
x
x
u và
ref
x
k→x
k
x
thì bài toán điều khiển bám ổn định
khiển ổn định cho hệ sai lệch:
e e
x
+A
k
k
e
u
k
Điều khiển bám ổn định theo tín hiệu đầu ra mẫu
ref
y
k→y
k
u
x
x
x
k k
ref
y
u
u
x
C
k k
⎧
x
⎪
⎨
y
⎪⎩
thì ma trận
⎛
= ⎜
⎝
x
y
y
u
0
ref
k
0
ref
k
Lại sử dụng ký hiệu mô tả sai lệch:
u
x
x
x
u
x
u
k
ref
k
ref
u và
k
ref
k
Khả năng ứng dụng cho hệ song tuyến liên tục
Mặc dù tất cả các thuật toán điều khiển dự báo cho hệ song tuyến được trình bày trong
chương này đều được xây dựng cho hệ song tuyến không liên tục (4.1), hay để đơn giản về mặt
ký hiệu, các hệ đó đã được viết thành (4.3), song chúng vẫn hoàn toàn áp dụng được cho cả
trường hợp hệ song tuyến liên tục, mô tả bởi:
x x
( )
x u
.
( )
x
d
dt
KẾT LUẬN VÀ KIẾN NGHỊ
Những vấn đề đã được giải quyết
Kiến nghị