
KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014
30
ỨNG DỤNG NGUYÊN LÍ BIẾN PHÂN EKELAND
TRONG BÀI TOÁN ĐIỀU KHIỂN TỐI ƢU
Nguyễn Thị Tâm, Lớp K60C, Khoa Toán – Tin
GVHD: TS. Nguyễn Như Thắng
Tóm tắt: Báo cáo trình bày một ứng dụng của nguyên lí biến phân Ekeland trong lí thuyết điều khiển
tối ưu. Cụ thể, chúng tôi sẽ thảo luận một mở rộng của nguyên lí cực tiểu Pontryagin cho điều khiển
tối ưu xấp xỉ.
Từ khóa: Phương pháp biến phân Ekerland, nguyên lí cực tiểu Pontryagin, hàm mục tiêu Bolza.
I. MỞ ĐẦU
Lí thuyết điều khiển tối ƣu xuất hiện từ những năm 50 của thế kỉ hai mƣơi với một
loạt các công trình tiêu biểu của các nhà toán học Xô Viết. Bài toán điều khiển tối ƣu là bài
toán tìm các quá trình tối ƣu cho các hệ điều khiển mô tả bởi các phƣơng trình toán học.
Nền tảng của lí thuyết điều khiển tối ƣu là nguyên lí cực đại (cùng với các các dạng
biến thể) và một loạt các công trình của các nhà toán học Xô Viết đứng đầu là L.C.
Pontryagin. Nguyên lí cực đại cổ điển là một biểu thức cực trị toán học mà từ đó ta có thể
đoán nhận đƣợc điều khiển là tối ƣu hay không, tức là cho ta một điều kiện cần của bài
toán điều khiển tối ƣu, chi tiết có thể xem trong [5]. Tuy nhiên, không phải lúc nào ta cũng
tìm đƣợc điều kiện cần của bài toán điều khiển tối ƣu. Mặt khác, theo nguyên lí cực đại cổ
điển dù có tìm ra điều kiện tối ƣu thì theo quan điểm kiến thiết, việc xây dựng thuật toán để
tìm các điều kiện tối ƣu cũng gặp rất nhiều khó khăn và có thể là không tìm ra cụ thể.
Để phần nào giải quyết hai vấn đề đó, trong báo cáo này chúng tôi áp dụng nguyên lí
Ekeland vào bài toán điều khiển tối ƣu để mở rộng nguyên lí cực đại Pontryagin cho
trƣờng hợp nghiệm tối ƣu xấp xỉ, tức là các điều kiện có giá trị ngay cả khi bài toán tối ƣu
ban đầu không có nghiệm chính xác. Vào đầu những năm 70, nhà toán học Ivar I. Ekeland
trong bài báo [1] đã đề xuất nguyên lí biến phân suy rộng, mà ngày nay thƣờng gọi là
nguyên lí biến phân Ekeland. Công trình này ngay lập tức nhận đƣợc sự quan tâm của cả
cộng đồng toán học lí thuyết và ứng dụng, và tính đến nay (4/2014) đã có 1403 lƣợt trích
dẫn (theo số liệu Google), còn theo cơ sở dữ liệu Hội toán học Mỷ có 473 bài báo khoa học
đã trích dẫn và 57 lƣợt trích dẫn từ ngƣời viết nhận xét. Một trong những điểm thú vị của
nguyên lí biến phân Ekeland là một mặt nó mở rộng nguyên lí biến phân cổ điển, nhƣng
mặt khác nó xây dựng khái niệm lời giải xấp xỉ thích hợp ngay cả khi lời giải chính xác
không tồn tại.
Nội dung chính của báo cáo đƣợc trích từ tài liệu [1]. Chúng tôi hi vọng nguyên lí
biến phân Ekeland sẽ là công cụ quan trọng chính, là bƣớc khởi đầu để nghiên cứu bài toán
điều khiển tối ƣu trong đạo hàm riêng.
II. NỘI DUNG
1. Kết quả tổng quan
Định nghĩa 1.1: Cho
X
là không gian topo Hausdorff. Hàm số
: {+ }X
đƣợc
gọi là nửa liên tục dƣới tại
0
x
khi và chỉ khi:

KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014
31
00
liminf ( ) ( ).
xx xx
Hàm
đƣợc gọi là nửa liên tục dƣới trên X nếu
là nửa liên tục tại mọi điểm của
X
.
Định lí 1.2 (Nguyên lí biến phân Ekeland): Cho
( , )Xd
là không gian metric đầy và
: {+ }X
là hàm nửa liên tục dưới và bị chặn dưới. Cho
0
và
uX
cho
trước sao cho:
X
( ) inf .
2
u
(1.1)
Khi đó, với
0
bất kì, tồn tại
uX
sao cho:
( ) ( ),uu
(1.2)
( , ) ,d u u
(1.3)
( ) ( ) ( , ),u u d u u
.uu
(1.4)
Chứng minh: Để đơn giản hóa kí hiệu ta đặt
1
( , ) ( , ).d u v d u v
Ta xác định thứ tự bộ phận trên
X
nhƣ sau:
( ) ( ) ( , ).u v u v d u v
Dễ dàng thấy đƣợc:
(i) Tính phản xạ:
uu
(ii) Tính phản đối xứng:
uv
và
v u u v
.
(iii) Tính bắc cầu :
uv
và
w u wv
,
với mọi
, ,w Xuv
.
Bây giờ, ta xây dựng
()
n
S
trong tập con của
X
nhƣ sau:
Với
1
uu
ta có tập:
11
{u X:u u };S
21
uS
sao cho
1
22
S
( ) inf 2
u
.
Bằng phƣơng pháp quy nạp ta có:
n
{u X:u u };
n
S
1nn
uS
sao cho
11
S
( ) inf 2
n
nn
u
.
Rõ ràng,
12
... ...
n
S S S
và
n
S
là các tập đóng, với mọi
n
. Thật vậy, cho
jn
xS
với
j
x x X
. Ta có
( ) ( ) ( , ).
j n j n
x u d x u
Mặt khác,
là nửa liên
tục dƣới và
d
liên tục nên ta suy ra
.
n
xS

KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014
32
Bây giờ, ta chứng minh đƣờng kính của các tập
n
S
tiến đến
0
(đƣợc kí hiệu là:
diam
0
n
S
). Thật vậy, cho điểm
n
xS
bất kì,
n
xu
suy ra
( ) ( ) ( , ).
nn
x u d x u
(1.5)
Mặt khác, vì
1nn
SS
nên
1n
xS
. Theo cách xác định của các tập
n
S
và chọn
1nn
uS
ta có:
( ) ( ) .
2
nn
ux
(1.6)
Từ (1.5) và (1.6) ta đƣợc:
( , ) 2 ,
n
n
d x u
với mọi
n
xS
,
Với diam
1
2n
n
S
. Do
n
S
là các tập đóng lồng nhau thắt dần có đƣờng kính tiến
dần đến 0 trong không gian metric đầy theo định lí Cantor các tập
n
S
có một điểm chung
duy nhất và điểm chung ấy thỏa mãn các điều kiện (1.2), (1.3) và (1.4).
Đặt:
1{u }.
n
nS
Chọn
1
uu
. Vì
1
uS
nên suy ra (1.2) là hiển nhiên.
Với
uu
, ta có
uu
(vì nếu
uu
thì
1
uS
với mọi
n
mâu thuẫn với tính duy
nhất của
u
) nghĩa là:
( ) ( ) ( , ).u u d u u
Ta đƣợc (1.4).
Ta chứng minh (1.3). Do
11
1
11
( , ) ( , ) 2
nn
j
n j j
jj
d u u d u u
.
Suy ra ta có:
1
1
( , ) lim 2 1 ( , ) .
nj
nn
nj
d u u d u u
Bổ đề 1.3 (Bất đẳng thức Gronwall): Cho hàm số liên tục không âm
:[a,b]u
thỏa mãn:
( ) ( ) ,
t
a
u t C Ku d
[a,b],t
trong đó
,CK
là các hằng số không âm. Khi đó,
()
( ) ,
K t a
u t Ce
[a,b].t
(1.7)
Chứng minh của bổ đề có thể tìm thấy trong [2, 5].

KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014
33
2. Nguyên lí cực tiểu Pontryagin
Xét hệ điều khiển xác định bởi phƣơng trình:
0
( ) ( ( ), ( ), ),( . . )
(0) n
dx t x t u t t h k n
dt
xx
(2.1)
trong đó
() n
xt
mô tả trạng thái của hệ điều khiển,
()ut
là hàm điều khiển
phụ thuộc thời gian
t
, và thuộc vào tập compact khả metric
K
. Cho
0T
và giả sử
rằng:
a)
và
12
' ( / , / ,..., / )
xn
x x x
là hàm liên tục trên
[0,T].
nK
b)
2
, ( , , ) (1 )x t x u c x
, với
c
là hằng số.
Cho trƣớc hàm điều khiển đo đƣợc
:[0,T] K.u
Điều kiện a) đảm bảo tồn tại
nghiệm duy nhất
X
của phƣơng trình vi phân (2.1) trên khoảng đủ nhỏ
[0, ]
. Từ điều
kiện b) và bất đẳng thức Gronwall (Bổ đề 1.3) ta đƣợc:
2
22
0
( ) ( 2 ) ,
cT
x t x cT e
(2.2)
Và do đó đảm bảo sự tồn tại nghiệm trên khoảng thời gian
[0,T]
. Hơn nữa, từ (2.2)
ta có:
dx ()
dt t
max
{ (t,x,u) (t,x,u) [0,T] B K},
(2.3)
trong đó,
B
là hình cầu bán kính
22
0
( 2 ) cT
x cT e
. Áp dụng định lí Ascoli, nhận
thấy họ các quỷ đạo
X
của hệ điều khiển (2.1) đồng liên tục và bị chặn, do đó nó compact
tƣơng đối trong topo đều.
Xét phiếm hàm mục tiêu Bolza
0
( ) ( ( )) ( , , ) ,
T
J u x T L x u t dt
ở đó
:n
thuộc lớp hàm
1
C
,
L
và
'x
L
liên tục trên
[0,T].
nK
Ta tìm
hàm điều khiển đo đƣợc
u
sao cho quỷ đạo tƣơng ứng
x
làm cực tiểu hóa
()Ju
trong số
tất cả các nghiệm của (2.1).
Định lí 2.1: Với mỗi
0,
tồn tại một phiếm hàm điều khiển đo được
u
có quỹ đạo
tương ứng là
x
, thỏa mãn:
U
( ) inf ( ) ,J u J u
(2.4)

KỈ YẾU HỘI NGHỊ SINH VIÊN NGHIÊN CỨU KHOA HỌC NĂM HỌC 2013-2014
34
( ( ), ( ), ), ( ) ( ( ), ( ), ) min ( ( ), ( ), ), ( ) ( ( ), ( ), ) ,
uK
x t u t t t L x t u t t x t u t t t L x t u t t
(2.5)
trong đó,
là nghiệm của phương trình vi phân tuyến tính:
() ' ( ( ), ( ), ). ( ) ' ( ( ), ( ), ).
( ) ' ( ( )),
tt
xx
t
x
dt x t u t t t L x t u t t
dt
T x T
(2.6)
trong đó,
'
t
x
là chuyển vị của
'x
.
Nhận xét: Nếu ở (2.4) ta cho
0
thì ta có thể lấy
0
trong (2.5). Nói cách khác,
nếu tồn tại một điều khiển tối ƣu, thì nguyên lí cực đại Pontryagin thỏa mãn. Hơn nữa,
định lí còn đúng ngay cả khi không có nghiệm tối ƣu.
Bổ đề 2.2: Giả sử
U
là tập hợp các hàm điều khiển đo được
: 0, .u T K
Trên
U
xét hàm khoảng cách:
1 2 1 2
( , ) 0, | ( ) ( )u u meas t T u t u t
(2.7)
Khi đó
( , )U
là một không gian metric đầy.
Chứng minh: Đầu tiên, ta kiểm tra
là khoảng cách. Lấy
1 2 3
,,u u u
bất kì trong
U
:
1 2 1 3 2 3
| ( ) ( ) | ( ) ( ) ( ) ( )t u t u t t u t u t u t u t
(2.8)
1 2 1 3 2 3
| ( ) ( ) | ( ) ( ) ( ) ( )meas t u t u t meas t u t u t meas u t u t
(2.9)
1 2 1 3 3 2
( , ) ( , ) ( , )u u u u u u
(2.10)
Lấy
nnN
u
là dãy Cauchy trong
U
. Ta có thể lấy ra một dãy con
k
nnN
u
sao cho
1
1
,2
kk
nn k
uu
. Ta sẽ chứng minh dãy con này hội tụ. Thật vậy, đặt:
1
1
| ( ) 2
pp
k n n k
pk
A t u t u
(2.11)
Ta có:
1
11
kkk
pk
measA pp
và
1kk
AA
Xác định
uU
nhƣ sau:
, ( ) ( )
k
kn
t A u t u t
(2.12)
Theo định nghĩa, dãy con
()
k
n k N
u
hội tụ tới
u
. Dãy
nnN
u
là Cauchy, nên nó hội tụ
đến
u