BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC
VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ − − − − − − − − − − − − − − − − − − −−
Lê Thị Ngọc Quỳnh
PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI THIỂU
LUẬN VĂN THẠC SĨ TOÁN HỌC
Hà Nội - 2020
BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC
VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ − − − − − − − − − − − − − − − − − − −−
Lê Thị Ngọc Quỳnh
PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI THIỂU
Chuyên ngành: Toán Giải tích
Mã số: 8 46 01 02
LUẬN VĂN THẠC SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC: GS. TSKH. ĐINH NHO HÀO
Hà Nội - 2020
LỜI CAM ĐOAN
Tôi xin cam đoan những gì viết trong luận văn là do sự tìm tòi, học hỏi của
bản thân và sự hướng dẫn tận tình của thầy Đinh Nho Hào. Mọi kết quả nghiên
cứu cũng như ý tưởng của tác giả khác, nếu có đều được trích dẫn cụ thể. Đề tài
luận văn này cho đến nay chưa được bảo vệ tại bất kỳ một hội đồng bảo vệ luận
văn thạc sĩ nào và cũng chưa hề được công bố trên bất kỳ một phương tiện nào.
Tôi xin chịu trách nhiệm về những lời cam đoan.
Hà Nội, tháng 11 năm 2020.
Học viên
Lê Thị Ngọc Quỳnh
LỜI CẢM ƠN
Đầu tiên, tôi xin được tỏ lòng biết ơn sâu sắc nhất của mình tới GS. TSKH.
Đinh Nho Hào, người trực tiếp hướng dẫn tôi tìm ra hướng nghiên cứu. Luận
văn này được hoàn thành dưới sự hướng dẫn tận tình của thầy trong một thời
gian dài. Thầy đã luôn quan tâm, giúp đỡ, động viên tôi trong suốt quá trình học
tập và nghiên cứu.
Tôi xin chân thành cảm ơn các thầy cô, anh chị, bạn bè của Viện Toán học
vì sự giúp đỡ, góp ý và tạo điều kiện trong quá trình học tập, nghiên cứu để tôi
thực hiện tốt luận văn của mình.
Tôi cũng xin trân trọng cảm ơn sự giúp đỡ và tạo điều kiện thuận lợi của cơ
sở đào tạo là Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và
Công nghệ Việt Nam trong quá trình thực hiện luận văn.
Đặc biệt, tôi xin cảm ơn gia đình, người thân và bạn bè đã luôn sát cánh,
động viên và khích lệ tôi trong suốt quá trình học tập và nghiên cứu.
Hà Nội, tháng 11 năm 2020.
Học viên
Lê Thị Ngọc Quỳnh
Mục lục
Lời cam đoan
Lời cảm ơn
Mục lục
MỞ ĐẦU 1
1 Một số kiến thức cơ sở 2
2 Phương pháp bình phương tối thiểu 11
2.1 Nghiệm bình phương tối thiểu của phương trình toán tử và một
số tính chất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Phân tích giá trị kỳ dị . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1 Toán tử compact . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2 Phổ của toán tử compact tự liên hợp . . . . . . . . . . . . 23
2.2.3 Phân tích giá trị kỳ dị . . . . . . . . . . . . . . . . . . . . 30
2.3 Tiêu chuẩn Picard . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 Ứng dụng của phương pháp bình phương tối thiểu 40
3.1 Phân tích giá trị kỳ dị cho ma trận . . . . . . . . . . . . . . . . . 40
3.2 Ứng dụng của phương pháp bình phương tối thiểu trong không
gian hữu hạn chiều . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3 Ứng dụng của phân tích kỳ dị trong nghiên cứu bài toán ngược . . 54
Kết luận 61
Tài liệu tham khảo 62
1
MỞ ĐẦU
Giải tích số hay còn gọi là phương pháp số là một môn khoa học thuộc
lĩnh vực Toán ứng dụng, nhằm mục đích nghiên cứu cách giải gần đúng các
phương trình, các bài toán xấp xỉ, các bài toán tối ưu, . . .. Trong việc giải gần
đúng nghiệm của phương trình, tôi xin đề cập trong luận văn này của mình
phương pháp bình phương tối thiểu cho việc giải hệ phương trình tuyến tính.
Bình phương tối thiểu tuyến tính là một kỹ thuật để xấp xỉ một nghiệm gần
đúng cho một hệ phương trình tuyến tính với các dữ kiện không chính xác cũng
như được ứng dụng rộng rãi trong thống kê. Hệ phương trình trong trường hợp
đang xét này thường là hệ mà có số phương trình lớn hơn số biến.
Các bài toán bình phương tối thiểu được chia thành hai loại: bình phương tối
thiểu tuyến tính và bình phương tối thiểu phi tuyến. Trong luận văn này, tôi chỉ
nghiên cứu về phương pháp bình phương tối thiểu cho hệ phương trình tuyến
tính. Cụ thể là, chúng tôi sẽ tập trung trình bày một cách hệ thống một số tính
chất của nghiệm bình phương tối thiểu, phương pháp phân tích giá trị kỳ dị và
một số ứng dụng trong đại số tuyến tính và giải bài toán ngược. Luận văn được
chia làm ba chương như sau:
Chương 1: Chương này chúng tôi sẽ nhắc lại một số định nghĩa, định lý và
tính chất quan trọng của Giải tích hàm phục vụ cho luận văn này.
Chương 2: Nội dung phần này trình bày định nghĩa, tính chất của nghiệm
bình phương tối thiểu, nghịch đảo suy rộng và chứng minh tiêu chuẩn Picard,
cái có mối liên hệ quan trọng với phương pháp bình phương tối thiểu và trong
việc phân tích giá trị kỳ dị.
Chương 3: Trong chương này, chúng tôi trình bày ứng dụng của phương pháp
bình phương tối thiểu trong đại số tuyến tính và bài toán ngược.
CHƯƠNG 1
Một số kiến thức cơ sở
Trong chương này chúng tôi trình bày một số khái niệm và tính chất quan
trọng của Giải tích hàm để hỗ trợ cho các phần sau. Một số tính chất và định lý
khác chưa được đề cập trong chương này thì chúng tôi sẽ nêu một cách xen kẽ
trong các chương tiếp theo.
Định nghĩa 1.0.1. [1], [2] Cho không gian vectơ X trên trường K = R. Một
ánh xạ được cho bởi
(cid:107).(cid:107) : X → K,
x (cid:55)→ (cid:107)x(cid:107)
được gọi là một chuẩn trên X nếu thỏa mãn các tính chất sau:
(i) (cid:107)x + y(cid:107) ≤ (cid:107)x(cid:107) + (cid:107)y(cid:107) với mọi x, y ∈ X.
(ii) (cid:107)αx(cid:107) = |α|(cid:107)x(cid:107)với mọi x ∈ X, α ∈ K.
(iii) (cid:107)x(cid:107) ≥ 0 với mọi x ∈ X và (cid:107)x(cid:107) = 0 nếu x = 0.
Khi đó không gian vectơ X với một chuẩn như ở trên sẽ được gọi là không
gian định chuẩn. Hơn nữa, không gian định chuẩn X sẽ được gọi là không gian
Banach nếu mọi dãy cơ bản (dãy Cauchy) trong X hội tụ tới một điểm trong X,
2
hay nói cách khác X là không gian định chuẩn đầy đủ.
3
Định nghĩa 1.0.2. [1], [2] Cho không gian vectơ X trên trường K (K = R hoặc C). Một ánh xạ được cho bởi
(cid:104).(cid:105) : X × X → K,
(x, y) (cid:55)→ (cid:104)x, y(cid:105)
được gọi là một tích vô hướng trên X nếu thỏa mãn các tính chất sau
(i) (cid:104)x, y(cid:105) = (cid:104)y, x(cid:105) với mọi x, y ∈ X.
(ii) (cid:104)x + y, z(cid:105) = (cid:104)x, z(cid:105) + (cid:104)y, z(cid:105) với mọi x, y, z ∈ X.
(iii) (cid:104)αx, y(cid:105) = α(cid:104)x, y(cid:105) với mọi x, y ∈ X và α ∈ K.
(iv) (cid:104)x, x(cid:105) ≥ 0 với mọi x ∈ X và (cid:104)x, x(cid:105) = 0 nếu x = 0.
Một không gian vectơ X trên trường K cùng với một tích vô hướng trên X như
trên được gọi là không gian tiền Hilbert. Từ đó ta có định nghĩa về không gian
Hilbert chính là một không gian tiền Hilbert mà đồng thời cũng là một không gian Banach với chuẩn (cid:107)x(cid:107) = (cid:112)(cid:104)x, x(cid:105), ∀x ∈ X.
Định nghĩa 1.0.3. [1], [2] Một tập M trong không gian metric X được gọi
là compact nếu mọi dãy trong M đều chứa một dãy con hội tụ tới một điểm
thuộc M . Từ đó ta có tính chất: một tập compact trong không gian metric thì sẽ
đóng và hoàn toàn bị chặn, nhưng mệnh đề ngược thì chưa chắc đúng, ví dụ đơn
giản như hình cầu đóng trong không gian định chuẩn vô hạn chiều thì không
compact. Tập M được gọi là compact tương đối (hay tiền compact) nếu như bao
đóng của nó là compact. Nói cách khác, M được gọi là compact tương đối nếu
mọi dãy trong M đều chứa một dãy con hội tụ trong không gian X. Tập M sẽ
được gọi là hoàn toàn bị chặn nếu với mọi ε > 0 cho trước, bao giờ cũng tồn tại
một phủ gồm hữu hạn các hình cầu mở (Si) với bán kính ε chứa M . Và ta có
tính chất là một tập hoàn toàn bị chặn thì sẽ bị chặn.
4
Định lý 1.0.4. [1] Định lý Heine-Borel: Một tập M trong không gian metric X
được gọi là compact nếu và chỉ nếu mọi phủ mở của M đều chứa một phủ con
k∈I Ak (cid:54)= ∅, và do đó X \ (cid:83)
k∈I(X \ Ak) = X \ (cid:83)
hữu hạn vẫn chứa M .
Chứng minh. Giả sử M có tính chất Heine-Borel. Xét một dãy bất kì (xn) ⊂ M . Với mỗi k = 1, 2, . . ., kí hiệu Ak = {xn : n ≥ k}. Cho Ak là bao đóng của Ak và Gk = X \ Ak. Với mỗi tập hữu hạn I ⊂ {1, 2, . . .}, rõ ràng (cid:84) k∈I Ak (cid:54)= ∅, cho nên (cid:84) k∈I Gk (cid:54)= ∅, tức là hợp các tập mở Gk (k ∈ I) không phủ được X. Vì điều này đúng với mọi họ hữu hạn {Gk, k ∈ I} nên theo tính chất Heine-Borel thì cả họ cũng không thể phủ được M . Vậy phải có x (cid:54)∈ Gk = X \ Ak, tức là x ∈ Ak ∀k = 1, 2, . . .. Từ đây dễ dàng suy ra một dãy con (xnk) hội tụ. Thật vậy, với mỗi k, vì x ∈ Ak nên hình cầu tâm x bán kính 1/k phải chứa một xnk ∈ (xn). Ta có d(xnk, x) ≤ 1/k → 0 khi k → ∞. Vậy M compact.
Để chứng minh phần đảo, giả sử M compact nhưng có một phủ mở {Gα}
không chứa một phủ con hữu hạn nào. Ta lấy một dãy bất kỳ các số dương
εn → 0. Vì M compact nên nó có thể phủ bằng một số hữu hạn hình cầu bán kính ε1. Trong số các hình cầu này ắt phải có một hình cầu, giả sử là S1 sao cho M1 = M (cid:84) S1 không thể phủ được bằng một số hữu hạn tập Gα (nếu không thì M sẽ phủ được bằng một số hữu hạn tập Gα). Tập M1 cũng compact (vì là tập
con đóng của một tập compact) nên có thể phủ được bằng một số hữu hạn các (cid:84) S2 hình cầu bán kính ε2, trong số đó có một cái, giả sử S2 sao cho M2 = M1 không thể phủ được bằng một số hữu hạn tập Gα. Tập M2 cũng là compact nên có thể phủ được bằng một số hữu hạn hình cầu bán kính ε3. Tiếp tục như thế, (cid:84) Sn (n = 1, 2, . . .). ta sẽ thu được một dãy hình cầu Sn và tập Mn = Mn−1 Ta lấy trong mỗi tập Mn một điểm xn. Dĩ nhiên Mn ⊂ Mn−1 ⊂ . . . ⊂ M nên xn ∈ M và vì M compact nên có một dãy con (xnk) hội tụ tới một điểm x0 ∈ M . Ta có x0 ∈ Gα0 nào đó và do Gα0 mở nên có một hình cầu K tâm x0 và nằm trọn trong Gα0. Gọi r là bán kính của K, ta chọn k0 đủ lớn
5
) < r/2 và εnk0
< r/4. Khi đó với mọi x ∈ Mnk0 + r/2 < r, chứng tỏ Mnk0
, x0) < 2εnk0
, d(x, x0) ≤ ⊂ K ⊂ Gα0, nghĩa ) + d(xnk0 có thể phủ bằng một tập Gα0, trái với cách xây dựng của nó. Vậy mọi
để d(x0, xnk0 d(x, xnk0 là Mnk0 phủ của M phải có một phủ con hữu hạn.
Định lý 1.0.5. [1] Định lý Hausdorff: Trong một không gian metric đầy đủ
(nghĩa là mọi dãy Cauchy đều hội tụ tới một điểm trong không gian ban đầu),
một tập là compact nếu và chỉ nếu nó đóng và hoàn toàn bị chặn.
Chứng minh.
1) Ta đã biết một tính chất là tập compact thì phải đóng. Bây giờ giả sử tập
M compact nhưng không hoàn toàn bị chặn. Thế thì có một ε > 0 nào
đó sao cho không thể nào phủ được M bằng một số hữu hạn hình cầu
bán kính ε. Lấy một điểm bất kỳ x1 ∈ M . Hình cầu tâm x1 bán kính ε không phủ được M , cho nên có ít nhất một điểm x2 ∈ M với khoảng cách d(x1, x2) ≥ ε. Hai hình cầu tâm x1 và x2 bán kính ε cũng không phủ được M , cho nên có ít nhất một điểm x3 ∈ M sao cho d(x1, x3) ≥ ε và d(x2, x3) ≥ ε. Tiếp tục cách đó ta sẽ được một dãy xn ∈ M với d(xn, xm) ≥ ε (n (cid:54)= m; n, m = 1, 2, . . .). Rõ ràng bất cứ dãy con nào của (xn) cũng không thể là dãy cơ bản, do đó không thể hội tụ. Như vậy mâu thuẫn với giả thiết M compact. Vậy M phải đóng và hoàn toàn bị chặn.
2) Ngược lại, giả sử tập M đóng và hoàn toàn bị chặn trong một không gian
đầy đủ X và xét một dãy vô hạn bất kì σ = (xn) ⊂ M . Vì tập M có
thể phủ được bằng một số hữu hạn hình cầu bán kính 1, nên một trong
các hình cầu này, chẳng hạn S1, phải chứa vô số phần tử của dãy σ. Gọi dãy con của dãy σ chứa trong S1 là σ1. Tập hợp M cũng có thể phủ được bằng một số hữu hạn hình cầu bán kính 1/2, nên một trong các hình cầu
này, giả sử S2, phải chứa vô số phần tử của σ1. Gọi dãy con của σ1 chứa trong S2 là σ2. Tiếp tục theo cách đó ta sẽ có các dãy σ1, σ2, σ3, . . . với
6
σ ⊃ σ1 ⊃ σ2 ⊃ ... và σk ⊂ Sk (k = 1, 2, . . .), trong đó Sk là hình cầu bán kính 1/k. Vì mỗi dãy σk có vô số phần tử nên có thể chọn trong σ1 một phần tử xn1, rồi trong σ2 một phần tử xn2 với n2 > n1, trong σ3 một phần tử xn3 với n3 > n2 và cứ thế tiếp tục quá trình. Dãy (xnk) là một dãy con của σ = (xn), và có thể thấy rằng đó là một dãy hội tụ trong X. Thật vậy với k < l thì σl ⊂ σk ⊂ Sk nên xnl, xnk cùng thuộc hình cầu Sk do đó d(xnl, xnk) < 2/k → 0 khi k, l → ∞, chứng tỏ rằng (xn) là một dãy cơ bản, tức hội tụ vì theo giả thiết X là không gian đủ. Tóm lại mọi dãy
(xn) ⊂ M đều chứa một dãy con hội tụ. Vì M là tập đóng nên giới hạn của dãy con này thuộc M . Vậy M là tập compact.
Định lý 1.0.6. Cho X, Y là các không gian định chuẩn. T là toán tử tuyến tính
đi từ X vào Y . Khi đó, T là compact nếu và chỉ nếu mọi dãy (xn) bị chặn trong X đều chứa một dãy con (xnk) sao cho dãy (T xnk) hội tụ trong Y .
Chứng minh.
(i) Giả sử (xn)n∈N ⊂ X bị chặn. Để T compact thì dãy (T xn)n∈N phải com- pact tương đối trong Y . Theo giả thiết, (xn)n∈N chứa dãy con (xnk) sao cho (T xnk) ⊂ (T xn)n∈N và (T xnk) hội tụ trong Y . Sử dụng định nghĩa về compact tương đối, ta suy ra T là toán tử compact.
(ii) Giả sử T compact. Lấy (xn)n∈N bị chặn trong X, suy ra dãy (T xn)n∈N compact tương đối trong Y . Do đó từ dãy (xn)n∈N, ta sẽ trích ra được một dãy con (xnk) mà (T xnk) ⊂ (T xn)n∈N và (T xnk) hội tụ trong Y .
Sau đây chúng tôi sẽ đưa ra một tiêu chuẩn để chứng minh một tập là com-
pact. Chúng tôi phát biểu lại Định lý Arzelà-Ascoli ở dạng đơn giản như sau: Cho D là tập con compact trong Rn. Xét (C 0(D), (cid:107).(cid:107)∞). Giả sử dãy hàm {fn}n∈N ⊂ C 0(D) thỏa mãn hai tính chất: (i) Bị chặn điểm trên D, tức với ∀x ∈ D, tập {fn(x)}n∈N là bị chặn;
7
(cid:107).(cid:107)∞−→ f khi n → ∞.
(ii) Đồng liên tục đều, tức ∀(cid:15) > 0, ∀x ∈ D, ∃δ = δ(x, (cid:15)) > 0 sao cho với ∀n ∈ N, ∀y ∈ B(x, δ) ∩ D ta luôn có |fn(y) − fn(x)| ≤ (cid:15). Khi ấy tồn tại dãy con {fϕ(n)}n∈N (trong đó ϕ : N → N là hàm tăng) và hàm f ∈ C 0(D) sao cho fϕ(n) Các bước chứng minh:
• Bước 1. Chỉ ra thực chất dãy hàm {fn}n∈N là đồng liên tục đều.
n→∞−→ um
• Bước 2. Lấy A = D ∩ Qn là tập con trù mật đếm được của D. Sử dụng
∞ đúng với mọi m ∈ N.
ϕ(n)
kỹ thuật "diagonal extraction" để chỉ ra có một dãy ϕ(n) chung cho mọi x ∈ A mà fϕ(n)(x) n→∞−→ f (x), ở đây f (x) là kết quả giới hạn dãy. Diagonal extraction: Giả sử có họ đếm được các dãy {um}m∈N, trong đó n }n∈N, thỏa mãn tính chất ∀m ∈ N dãy um có một dãy con dãy um = {um hội tụ đến điểm mà ta ký hiệu là um ∞. Khi ấy có thể chọn dãy chỉ số chung cho tất cả các dãy con mà vẫn đảm bảo kết quả hội tụ cho mỗi dãy, tức tồn tại hàm ϕ : N → N tăng sao cho um
• Bước 3. Mở rộng từ A lên D để có fϕ(n)(x) n→∞−→ f (x) với mọi x ∈ D, ở đây f (x) là kết quả giới hạn dãy. Tức dãy {fϕ(n)}n∈N là hội tụ điểm trên D.
• Bước 4. Chỉ ra f là liên tục đều và dãy {fϕ(n)}n∈N là hội tụ đều về f trên
D.
Định lý 1.0.7. [1], [2] Định lý Riesz trong không gian Hilbert: Mọi phiếm hàm tuyến tính liên tục f ánh xạ một không gian Hilbert X vào trường K (K = R hoặc C) đều biểu diễn được một cách duy nhất dưới dạng
f (x) = (cid:104)x, a(cid:105),
với mọi x ∈ X và a là phần tử thuộc X thỏa mãn (cid:107)f (cid:107) = (cid:107)a(cid:107).
Bây giờ, chúng tôi đề cập thêm về hệ trực chuẩn và bất đẳng thức Bessel.
8
∞ (cid:88)
Gọi (en)n∈N là một hệ trực chuẩn của không gian Hilbert X ( nghĩa là nó là một hệ trực giao và được chuẩn hóa (cid:107)en(cid:107) = 1 với mọi n ∈ N ). Khi đó, với mọi x ∈ X, ta có bất đẳng thức Bessel như sau
|(cid:104)x, en(cid:105)|2 ≤ (cid:107)x(cid:107)2 = (cid:104)x, x(cid:105).
n=1
Hệ (en)n∈N này sẽ được gọi là hệ trực chuẩn đầy đủ khi chỉ có vectơ 0 mới trực giao với tất cả các phần tử của hệ. Khi ấy, với mọi x ∈ X, ta có các đẳng
∞ (cid:88)
∞ (cid:88)
thức
x =
(cid:104)x, en(cid:105)en và (cid:107)x(cid:107)2 =
|(cid:104)x, en(cid:105)|2.
n=1
n=1
Đẳng thức cuối được gọi là đẳng thức Parseval. Tiếp theo, chúng tôi muốn nhắc
lại tính chất sau
∞ (cid:88)
Bổ đề 1.0.8. [1] Cho (en)n∈N là một hệ trực chuẩn của không gian Hilbert X.
Khi đó với mọi x ∈ X và n ∈ N, chuỗi
(cid:104)x, ei(cid:105)ei hội tụ và
i=1
∞ (cid:88)
(cid:104)x, ei(cid:105)ei
i=1
x − ⊥ en.
∞ (cid:88)
Chứng minh. Trước tiên chúng tôi chứng minh một tính chất của không gian
Hilbert: Chuỗi
ai, trong đó {ai}∞
i=1 ⊂ X là hệ trực giao, hội tụ khi và chỉ
i=1
∞ (cid:88)
n (cid:88)
n (cid:88)
khi chuỗi
(cid:107)ai(cid:107)2 hội tụ. Thật vậy lấy sn =
ai và σn =
(cid:107)ai(cid:107)2. Với
i=1
i=1
i=1
n > m, theo Định lý Pythagore ta có
(cid:107)sn − sm(cid:107)2 = (cid:107)am+1 + . . . + an(cid:107)2 = (cid:107)am+1(cid:107)2 + . . . + (cid:107)an(cid:107)2 = σn − σm.
Do đó (cid:107)sn − sm(cid:107) → 0 khi và chỉ khi σn − σm → 0. Nhưng do X là không gian Hilbert tức là không gian đầy đủ nên điều này có nghĩa là sn có giới hạn
9
∞ (cid:88)
khi và chỉ khi σn có giới hạn. Do đó chuỗi
ai hội tụ nếu và chỉ nếu chuỗi
i=1
∞ (cid:88)
(cid:107)ai(cid:107)2 < ∞.
i=1
∞ (cid:88)
∞ (cid:88)
Bây giờ, theo bất đẳng thức Bessel ta có
(cid:107)(cid:104)x, ei(cid:105)ei(cid:107)2 =
|(cid:104)x, ei(cid:105)|2 ≤ (cid:107)x(cid:107)2 < ∞,
i=1
i=1
∞ (cid:88)
cho nên theo tính chất ta vừa chứng minh phía trên, chuỗi
(cid:104)x, ei(cid:105)ei sẽ hội tụ.
i=1
n (cid:88)
n (cid:88)
Mặt khác, với mọi n > m ta có
(cid:104)x −
(cid:104)x, ei(cid:105)ei, em(cid:105) = (cid:104)x, em(cid:105) −
(cid:104)x, ei(cid:105)(cid:104)ei, em(cid:105)
i=1
i=1
= (cid:104)x, em(cid:105) − (cid:104)x, em(cid:105) = 0.
∞ (cid:88)
Cho n → ∞ ta sẽ được (cid:104)x −
(cid:104)x, ei(cid:105)ei, em(cid:105) = 0 với mọi m, nghĩa là
i=1
∞ (cid:88)
(cid:104)x, ei(cid:105)ei
i=1
x − ⊥ en với mọi n.
Trong phần nhắc lại kiến thức cơ sở này, chúng tôi cũng muốn đưa ra một bổ
đề sau
Bổ đề 1.0.9. Cho X là một không gian Hilbert. Khi đó, mỗi tập con lồi đóng
trong X luôn tồn tại duy nhất một phần tử có chuẩn nhỏ nhất.
Chứng minh. Gọi E là tập con lồi đóng trong X. Đặt λ = inf{(cid:107)x(cid:107) : x ∈ E}.
2 và y
2, ta có
Do (cid:107)x(cid:107) ≥ 0 nên λ ≥ 0 > −∞. Do đó λ tồn tại. Với bất kỳ x, y ∈ E, áp dụng đẳng thức hình bình hành cho x
(cid:107)x − y(cid:107)2 =
(cid:107)x(cid:107)2 +
(cid:107)y(cid:107)2 − (cid:107)
(cid:107)2.
1 4
1 2
1 2
x + y 2
10
Từ E là lồi ta suy ra
(x + y) phải thuộc E. Theo định nghĩa của λ ở trên, ta có
1 2
(cid:107)x − y(cid:107)2 ≤ 2(cid:107)x(cid:107)2 + 2(cid:107)y(cid:107)2 − 4λ2.
(∗)
Từ đây, nếu (cid:107)x(cid:107) = (cid:107)y(cid:107) = λ thì (cid:107)x − y(cid:107)2 ≤ 0, suy ra x = y. Như vậy ta chứng
minh được tính duy nhất của phần tử có chuẩn nhỏ nhất.
Tiếp theo, ta đi chứng minh tính tồn tại phần tử chuẩn nhỏ nhất. Từ định
nghĩa của λ suy ra tồn tại một dãy (yn) trong E thỏa mãn (cid:107)yn(cid:107) → λ khi n → ∞. Ta thay thế x, y lần lượt bởi yn, ym trong (∗), ta thu được
(cid:107)yn − ym(cid:107)2 ≤ 2(cid:107)yn(cid:107)2 + 2(cid:107)ym(cid:107)2 − 4λ2,
với mọi m, n. Cho m, n tiến tới vô cùng thì vế trái của bất đẳng thức trên sẽ
tiến tới 0. Suy ra (yn) là dãy Cauchy. Vì X là không gian Hilbert, tức không gian đầy đủ nên suy ra tồn tại x0 ∈ X sao cho yn → x0 khi n → ∞. Từ (yn) nằm trong E là một tập đóng nên x0 ∈ E. Từ tính liên tục của hàm chuẩn, ta
thu được
(cid:107)yn(cid:107) = λ.
(cid:107)x0(cid:107) = lim n→∞
Vì vậy E tồn tại duy nhất phần tử có chuẩn nhỏ nhất. Ta có điều phải chứng
minh.
CHƯƠNG 2
Phương pháp bình phương tối thiểu
Trong chương này, chúng tôi sẽ trình bày một số tính chất về nghiệm bình
phương tối thiểu, nghịch đảo suy rộng và chứng minh tiêu chuẩn Picard trên
các không gian Hilbert vô hạn chiều. Để thuận lợi cho việc theo dõi, trước hết
chúng tôi sẽ đi vào một số dẫn dắt đầu tiên trước khi vào vấn đề chính [3], [4],
[5].
Ta cần đi tìm nghiệm của phương trình
Ax = b.
Với A là ma trận cỡ m × n, m > n và x, b theo thứ tự là các vectơ cột với n và m phần tử. Để giải phương trình này, ta tìm x sao cho (cid:107)Ax − b(cid:107)2 đạt cực tiểu.
Ta kí hiệu [Ax]i là phần tử thứ i của vectơ Ax và bi là phần tử thứ i của vectơ b. Khi đó, ta có phân tích của đại lượng (cid:107)Ax − b(cid:107)2 như sau
(∗)
(cid:107)Ax − b(cid:107)2 = ([Ax]1 − b1)2 + . . . + ([Ax]m − bm)2.
Chính vì xuất phát từ lý do cần đi làm tối thiểu bình phương của chuẩn Ơclit (cid:107)Ax − b(cid:107)2 cho nên ta mới có tên gọi "phương pháp bình phương tối thiểu".
11
Ta biết: (cid:107)v(cid:107)2 = vT v, trong đó vT là ma trận chuyển vị của v. Do đó biểu
12
thức (∗) ở trên có thể được viết lại như sau
(cid:107)Ax − b(cid:107)2 = (Ax − b)T (Ax − b) = (Ax)T (Ax) − bT (Ax) − (Ax)T b + bT b
= (Ax)T (Ax) − 2(Ax)T b + bT b
(vì bT Ax = (Ax)T b).
Do đó để (cid:107)Ax − b(cid:107)2 đạt cực tiểu thì giá trị cực tiểu đó có thể đạt được tại không điểm của đạo hàm theo biến x của (cid:107)Ax − b(cid:107)2. Đạo hàm biểu thức trên theo
biến x ta suy ra được rằng nghiệm tối thiểu x ở đây sẽ là nghiệm của phương
trình sau
AT Ax = AT b.
Điều này tương đương với một hệ phương trình tuyến tính. Trong đó, ma trận AT A ở vế trái là một ma trận vuông, khả nghịch nếu như rankA = n, và ta gọi
A có hạng đầy đủ theo cột. Trong trường hợp này, hệ phương trình tuyến tính
có nghiệm duy nhất và được xác định như sau
x = (AT A)−1AT b.
Ở đây, ma trận (AT A)−1AT được gọi là ma trận giả nghịch đảo của ma trận A và trong phần trình bày phía sau ta sẽ kí hiệu là A+. Thông thường, ta không có nghịch đảo của A (A−1) do A sẽ thường được giả thiết là ma trận không vuông,
hoặc A suy biến.
Bây giờ, chúng tôi sẽ giới thiệu, chứng minh một số tính chất, định lý quan
trọng của phương pháp bình phương tối thiểu.
2.1 Nghiệm bình phương tối thiểu của phương trình toán
tử và một số tính chất
Trước hết, ta nhắc lại định lý phép chiếu trực giao trong không gian Hilbert:
Cho X là một không gian Hilbert. Lấy M là không gian con đóng của X. Khi
13
đó, tồn tại duy nhất một phép chiếu trực giao P đi từ X vào M sao cho
(cid:107)y − P y(cid:107) ≤ (cid:107)y − u(cid:107)
với mọi y ∈ X và mọi u ∈ M .
Trong phần này, ta giả sử X và Y là các không gian Hilbert và A thuộc
B(X, Y ) là không gian các toán tử tuyến tính liên tục từ X vào Y . Xét phương
trình tuyến tính
Ax = y,
trong đó y ∈ Y được cho trước. Nếu phương trình này không có nghiệm (theo
nghĩa thông thường), ta sẽ cố gắng đi tìm một vectơ x trong X để cho (cid:107)Ax − y(cid:107)
là nhỏ nhất, nghĩa là
(cid:107)Ax − y(cid:107) ≤ (cid:107)Au − y(cid:107),
với mọi u ∈ X. Vectơ x ở đây cũng chính là loại nghiệm mà ta sẽ đi nghiên cứu
trong phần này. Bây giờ, ta gọi Q là phép chiếu của Y lên R(A) ( ở đây R(A)
là bao đóng của tập ảnh của A). Từ định lý phép chiếu trực giao ở trên ta suy ra
(cid:107)Qy − y(cid:107) ≤ (cid:107)z − y(cid:107),
⊥
⊥
với y ∈ Y , Qy ∈ R(A) và với mọi z ∈ R(A). Cũng từ hệ quả của định lý
R(A)
⊥
. Ở đây, chúng ta để ý rằng R(A)
phép chiếu trực giao trong không gian Hilbert, với mọi y ∈ Y , ta có: y − Qy ∈ = R(A)⊥. Thật vậy, hiển nhiên có ⊂ R(A)⊥. Ngược lại, lấy x ∈ R(A)⊥, ta cần
R(A) ⊂ R(A) suy ra R(A)
⊥
⊥
⊥
chứng minh x ∈ R(A) . Rõ ràng, nếu lấy y ∈ R(A) thì theo định nghĩa bao
đóng của một tập hợp, tồn tại dãy (yn) trong R(A) mà yn → y khi n → ∞.Vì (yn) ⊂ R(A) suy ra (cid:104)x, yn(cid:105) = 0. Cho n → ∞ ta có được (cid:104)x, y(cid:105) = 0. Do đó x ∈ R(A) . Vì vậy R(A)
= R(A)⊥.
Định lý 2.1.1. [3] Cho y ∈ Y cho trước. Với x ∈ X, ba điều kiện sau tương
đương
14
(i) Ax = Qy.
(ii) (cid:107)Ax − y(cid:107) ≤ (cid:107)Au − y(cid:107) với mọi u ∈ X.
(iii) A∗Ax = A∗y với A∗ là toán tử liên hợp của A, nghĩa là (cid:104)Ax, y(cid:105) =
(cid:104)x, A∗y(cid:105).
⊥
⊥
Chứng minh.
(i) ⇒(ii) : Từ y − Qy ∈ R(A) suy ra Qy − y ∈ R(A)
= R(Q)⊥. Do
Au − Qy ⊥ Qy − y và do Ax = Qy, ta có
(cid:107)Au − y(cid:107)2 =(cid:107)Au − Qy(cid:107)2 + (cid:107)Qy − y(cid:107)2
=(cid:107)Au − Qy(cid:107)2 + (cid:107)Ax − y(cid:107)2 ≥ (cid:107)Ax − y(cid:107)2.
(ii) ⇒(iii) : Do Qy ∈ R(A), tồn tại một dãy (xn) ⊂ X sao cho Qy =
Axn. Do đó
lim n→∞
(cid:107)Axn − y(cid:107)2 ≥ (cid:107)Ax − y(cid:107)2.
(cid:107)Qy − y(cid:107)2 = lim n→∞
Mặt khác, theo Định lý Pythagore
(cid:107)Ax − y(cid:107)2 = (cid:107)Ax − Qy(cid:107)2 + (cid:107)Qy − y(cid:107)2.
.
⊥ Suy ra (cid:107)Ax−Qy(cid:107)2 = 0 hay Ax = Qy. Từ đó Ax−y = Qy−y ∈ R(A)
⊥
= N (A∗), với N (A∗) là hạch của A∗. Thật vậy, Mặt khác dễ thấy R(A) lấy y ∈ N (A∗) thì điều này tương đương với A∗y = 0 hay (cid:104)x, A∗y(cid:105) = 0 với mọi x ∈ X. Từ đó (cid:104)Ax, y(cid:105) = 0 với mọi x ∈ X, nghĩa là y ∈ R(A)⊥ =
⊥
R(A)
. Do đó Ax − y ∈ N (A∗), tức là A∗Ax = A∗y.
⊥
(iii) ⇒(i) : Ta có: Ax − y ∈ N (A∗), vì A∗Ax = A∗y. Suy ra
Ax − y ∈ R(A)
= R(Q)⊥.
15
Do đó 0 = Q(Ax−y) = QAx−Qy = Ax−Qy, nghĩa là Ax = Qy.
Định nghĩa 2.1.2. [3] Một vectơ x ∈ X mà thỏa mãn ba điều kiện tương đương
trong định lý trên thì được gọi là một nghiệm bình phương tối thiểu của phương
trình Ax = y.
Hệ quả 2.1.3. [3] Cho y ∈ Y . Khi đó, ta có hai hệ quả sau
(i) L(y) := {x ∈ X|A∗Ax = A∗y} (cid:54)= ∅ khi và chỉ khi y ∈ R(A) (cid:76) R(A)⊥.
(ii) Nếu y ∈ R(A) (cid:76) R(A)⊥ thì L(y) là một tập con lồi đóng khác rỗng của
X.
Chứng minh.
⊥ Ax − y ∈ N (A∗) = R(A)
(i) Lấy x ∈ L(y). Khi đó, theo Định lý 2.1.1, ta có
= R(A)⊥.
Suy ra
(cid:77)
y = Ax + (y − Ax) ∈ R(A)
R(A)⊥.
Ngược lại, nếu y ∈ R(A) (cid:76) R(A)⊥ thì y sẽ luôn biểu diễn được dưới dạng duy nhất y = y1 + y2, trong đó y1 ∈ R(A) và y2 ∈ R(A)⊥. Suy ra Qy = y1 và y1 = Ax với một số giá trị x ∈ X, suy ra Qy = Ax. Theo Định lý 2.1.1, x ∈ L(y), tức là L(y) (cid:54)= ∅.
(ii) Trước hết, theo phần (i) ta dễ thấy ∅ (cid:54)= L(y) ⊂ X. Để chứng minh L(y)
là tập lồi, ta lấy x1, x2 ∈ L(y) và λ ∈ [0, 1]. Ta có
A∗A(λx1 + (1 − λ)x2) =λA∗Ax1 + (1 − λ)A∗Ax2
=λA∗y + (1 − λ)A∗y = A∗y.
Vì thế λx1 + (1 − λ)x2 ∈ L(y), nghĩa là L(y) là tập lồi.
16
Cuối cùng, để chứng minh L(y) đóng, ta chỉ cần lấy một dãy (xn) ⊂ L(y) sao cho xn → x khi n → ∞. Từ A∗Axn = A∗y, cho n → ∞ thì ta sẽ thu được A∗Ax = A∗y, tức là x ∈ L(y). Do đó L(y) đóng và ta kết thúc toàn bộ chứng
minh.
Như vậy, theo Hệ quả 2.1.3, tập L(y) sẽ chứa nghiệm bình phương tối thiểu nếu như y ∈ R(A) (cid:76) R(A)⊥ và đồng thời khi đó L(y) cũng lồi, đóng trong X. Khi đó, theo Bổ đề 1.0.9 trong chương trước sẽ tồn tại duy nhất phần tử
x ∈ L(y) mà (cid:107)x(cid:107) = min{(cid:107)u(cid:107) : u ∈ L(y)}. Tới đây ta có định nghĩa sau
Định nghĩa 2.1.4. [3] Đặt D(A+) := R(A) (cid:76) R(A)⊥ và xây dựng ánh xạ
A+ : D(A+) → X,
y (cid:55)→ x
với x là nghiệm bình phương tối thiểu có chuẩn nhỏ nhất của phương trình Ax = y (như đã chứng minh ở trên là tồn tại và duy nhất). Khi đó, ánh xạ A+
được định nghĩa như ở trên được gọi là giả nghịch đảo hay nghịch đảo suy rộng
của A.
Ta có một số hệ quả liên quan tới ánh xạ giả nghịch đảo A+ như sau
Hệ quả 2.1.5. [3] Cho A+ là ánh xạ giả nghịch đảo của A. Khi đó
(i) D(A+) trù mật trong Y và D(A+) = Y nếu R(A) đóng.
(ii) Nếu R(A) đóng và tồn tại A−1 thì A+|R(A) = A−1.
(iii) R(A+) = N (A)⊥.
(iv) A+ là ánh xạ tuyến tính.
(v) A+ bị chặn (nghĩa là sup{(cid:107)A+y(cid:107) : y ∈ D(A+), (cid:107)y(cid:107) ≤ 1} < ∞) nếu và
chỉ nếu R(A) đóng.
17
(vi) Với mỗi y ∈ D(A+), vectơ A+y chính là nghiệm bình phương tối thiểu duy
nhất của phương trình Ax = y nằm trong N (A)⊥.
Chứng minh.
⊥ (i) Do R(A) là một tập con đóng của Y nên Y = R(A) (cid:76) R(A)
⊥
⊥ thế thì x + y ∈ R(A) (cid:76) R(A)
. Bây ⊥ ⊂ R(A) (cid:76) R(A)⊥. Thật vậy, giờ ta chứng minh rằng R(A) (cid:76) R(A) ta lấy x ∈ R(A), y ∈ R(A) . Ta sẽ chứng minh x + y ∈ R(A) (cid:76) R(A)⊥. Theo định nghĩa về tập đóng thì x + y ∈ R(A) (cid:76) R(A)⊥ tương đương với mệnh đề mọi lân cận Ux+y của x + y (đồng thời cũng là lân cận của x và y) thì
(cid:77)
R(A)⊥) (cid:54)= ∅.
Ux+y ∩ (R(A)
⊥
= R(A)⊥) nên theo định Vì x ∈ R(A) và y ∈ R(A)⊥ (do y ∈ R(A) nghĩa của tập đóng ta sẽ có Ux+y ∩ R(A) (cid:54)= ∅ và Ux+y ∩ R(A)⊥ (cid:54)= ∅. Suy ra
(cid:77)
R(A)⊥) (cid:54)= ∅.
Ux+y ∩ (R(A)
⊥
Do Ux+y là bất kỳ nên x + y ∈ R(A) (cid:76) R(A)⊥. Như vậy
(cid:77) (cid:77)
Y = R(A)
R(A)
⊂ R(A)
R(A)⊥ = D(A+).
Vậy D(A+) = Y hay D(A+) trù mật trong Y .
(ii) Vì R(A) đóng nên D(A+) = Y . Với mọi y ∈ R(A) luôn tồn tại duy nhất x+ ∈ X sao cho Ax+ = y (do giả thiết tồn tại A−1). Do đó x+ = A−1y = A+y. Vì vậy A+|R(A) = A−1.
(iii) Trước hết, ta chứng minh rằng R(A+) ⊂ N (A)⊥. Thật vậy, lấy x ∈ R(A+) (hiển nhiên x ∈ X) thì sẽ tồn tại y ∈ D(A+) để x = A+y.
Nhận thấy N (A) là không gian con đóng của X. Thật vậy, từ định nghĩa
N (A) = {x ∈ X : Ax = 0}, ta dễ dàng suy ra N (A) là một không gian
18
con, đồng thời mọi dãy con bất kì trong N (A) nếu hội tụ thì đều hội tụ tới
một điểm trong N (A), do đó N (A) là không gian con đóng của X.
Với mọi x ∈ X, ta có biểu diễn duy nhất là x = x1 + x2, trong đó x1 ∈ N (A) và x2 ∈ N (A)⊥. Khi đó, Ax1 = 0 và theo Định lý 2.1.1, ta có
Qy = AA+y = Ax = A(x1 + x2) = Ax1 + Ax2 = Ax2.
Suy ra Ax2 = Qy hay x2 chính là nghiệm bình phương tối thiểu của phương trình Ax = y. Do đó
(cid:107)A+y(cid:107)2 = (cid:107)x(cid:107)2 = (cid:107)x1(cid:107)2 + (cid:107)x2(cid:107)2 ≥ (cid:107)x1(cid:107)2 + (cid:107)A+y(cid:107)2.
Từ đó (cid:107)x1(cid:107)2 = 0, tức là x1 = 0. Suy ra x = x2, nghĩa là x ∈ N (A)⊥. Vì vậy ta đã chứng minh được rằng R(A+) ⊂ N (A)⊥.
Để chứng minh phần ngược lại N (A)⊥ ⊂ R(A+), ta lấy u ∈ N (A)⊥ và
lấy y := Au. Khi đó y = Au = QAu = Qy. Suy ra u là một nghiệm
bình phương tối thiểu của Ax = y.
Lúc này, ta gọi v là một nghiệm bình phương tối thiểu khác của Ax = y.
Khi đó Av = Qy = Au, suy ra A(v − u) = 0, nghĩa là v − u ∈ N (A).
Do đó
(cid:107)v(cid:107)2 = (cid:107)u(cid:107)2 + (cid:107)v − u(cid:107)2 ≥ (cid:107)u(cid:107)2.
Suy ra u chính là nghiệm bình phương tối thiểu có chuẩn nhỏ nhất của Ax = y, nghĩa là u = A+y hay u ∈ R(A+). Như vậy, N (A)⊥ ⊂ R(A+)
và kết hợp hai chiều chứng minh lại ta kết thúc hệ quả thứ ba.
(iv) Ta lấy bất kỳ y, y(cid:48) ∈ D(A+) = R(A) (cid:76) R(A)⊥. Bây giờ ta cần chứng và A+(λy) = λA+y với mọi λ ∈ K. minh A+(y + y(cid:48)) = A+y + A+y(cid:48)
(cid:48)
(cid:48)
(cid:48)
(cid:48)
Thật vậy, ta có
AA+y + AA+y
= Qy + Qy
= Q(y + y
) = AA+(y + y
).
19
Suy ra A+y + A+y(cid:48) − A+(y + y(cid:48)) ∈ N (A). Lại có A+y, A+y(cid:48), A+(y + y(cid:48)) đều thuộc R(A+) = N (A)⊥ là một không gian vectơ nên A+y + A+y(cid:48) − A+(y + y(cid:48)) ∈ N (A)⊥. Như vậy A+y + A+y(cid:48) − A+(y + y(cid:48)) ∈ N (A)⊥ ∩ N (A) = {0}. Suy ra A+(y + y(cid:48)) = A+y + A+y(cid:48).
Tương tự ta cũng chứng minh được rằng A+(λy) = λA+y với mọi λ ∈ K
và khi đó ta kết thúc chứng minh hệ quả này.
(v) Giả sử A+ bị chặn. Ta sẽ chứng minh R(A) đóng. Từ AA+y = Qy với mọi y ∈ D(A+) và D(A+) trù mật trong Y ( theo chứng minh phần trước), ta có thể thác triển ánh xạ A+ thành một toán tử tuyến tính bị chặn
(cid:98)A ∈ B(Y, X) sao cho A (cid:98)Ay = Qy với mọi y ∈ Y. Do đó R(A) = R(Q) ⊂ R(A). Suy ra R(A) = R(A), nghĩa là R(A) đóng.
Để chứng minh chiều ngược lại, ta sẽ xây dựng ánh xạ sau
(cid:98)A : N (A)⊥ → R(A)
u (cid:55)→ (cid:98)Au := Au.
Ta sẽ chỉ ra rằng ánh xạ này là song ánh. Thật vậy, lấy u1, u2 ∈ N (A)⊥ và giả sử (cid:98)Au1 = (cid:98)Au2. Khi đó u1 − u2 ∈ N (A). Lại có, u1, u2 ∈ N (A)⊥ mà N (A) và N (A)⊥ đều là các không gian vectơ nên u1 − u2 ∈ N (A)⊥ ∩ N (A) = {0}, nghĩa là u1 = u2. Do vậy (cid:98)A là đơn ánh. Hơn nữa, với cách xây dựng như trên thì dễ thấy rằng (cid:98)A là toàn ánh. Do vậy (cid:98)A là song ánh.
un = u. Khi đó
Hơn nữa, ta cũng nhận thấy rằng (cid:98)A tuyến tính liên tục. Thật vậy, ta lấy một dãy (un) ⊂ N (A)⊥ sao cho lim n→∞
un) = Au = (cid:98)Au.
lim n→∞
(cid:98)Aun = lim n→∞
Aun = A( lim n→∞
Suy ra (cid:98)A liên tục. Hơn nữa, do
(cid:98)A(u1 + u2) = A(u1 + u2) = Au1 + Au2 = (cid:98)Au1 + (cid:98)Au2
20
nên ta suy ra được (cid:98)A tuyến tính.
Tiếp theo, do R(A), N (A)⊥ lần lượt là các không gian con đóng của các
không gian Hilbert Y và X nên chúng cũng là không gian Hilbert và hiển
nhiên cũng là các không gian Banach. Theo Định lý Banach về ánh xạ
mở có đề cập rằng mọi toàn ánh tuyến tính liên tục giữa hai không gian
Banach đều là ánh xạ mở. Vì thế từ (cid:98)A là song ánh tuyến tính liên tục giữa hai không gian Banach nên (cid:98)A−1 tồn tại và cũng liên tục (theo hệ quả của Định lý Banach về ánh xạ mở). Mặt khác (cid:98)A−1 cũng tuyến tính nên (cid:98)A−1 sẽ bị chặn. Do đó tồn tại m > 0 sao cho
(cid:107)A+y(cid:107) = (cid:107) (cid:98)A−1( (cid:98)AA+y)(cid:107) ≤ m(cid:107)AA+y(cid:107) với mọi y ∈ D(A+) = Y.
Do đó với y ∈ Y , ta có (cid:107)y(cid:107) ≥ (cid:107)Qy(cid:107) = (cid:107)AA+y(cid:107) ≥ m−1(cid:107)A+y(cid:107). Ở đây
nên với bất kỳ y ∈ Y luôn tồn tại duy nhất u ∈ R(A) để
ta giải thích kỹ hơn chi tiết (cid:107)y(cid:107) ≥ (cid:107)Qy(cid:107). Thật vậy, do có biểu diễn Y = ⊥ R(A) (cid:76) R(A) (cid:107)y(cid:107)2 = (cid:107)u(cid:107)2 + (cid:107)u⊥(cid:107)2. Suy ra (cid:107)Qy(cid:107) = (cid:107)Qu(cid:107) = (cid:107)u(cid:107) ≤ (cid:107)y(cid:107).
Như vậy A+ ∈ B(Y, X) và (cid:107)A+(cid:107) ≤ m, tức là A+ bị chặn và ta chứng
minh xong hệ quả này.
(vi) Để chứng minh hệ quả này ta chỉ việc sử dụng trực tiếp định nghĩa. Ta đã biết, với y ∈ D(A+) = R(A) (cid:76) R(A)⊥ thì x = A+y được gọi là nghiệm bình phương tối thiểu có chuẩn nhỏ nhất và dĩ nhiên là duy nhất của phương trình Ax = y. Dễ thấy x ∈ R(A+) nên theo kết quả trong hệ quả thứ ba thì x ∈ N (A)⊥ và ta có điều phải chứng minh.
Phần tiếp theo, chúng tôi sẽ giới thiệu về phân tích giá trị kỳ dị, nhằm mục
đích chứng minh tiêu chuẩn Picard, một ứng dụng quan trọng trong phương
pháp bình phương tối thiểu cũng như bài toán về phân tích giá trị kỳ dị.
21
2.2 Phân tích giá trị kỳ dị
Mục đích của phần này là để trình bày sự phân tích giá trị kỳ dị cho các toán
tử compact trong không gian Hilbert. Sự phân tích này chỉ ra rằng các toán tử
compact có một phổ đơn và đồng thời cũng minh họa một cách cụ thể về tính
chất xấu của một phương trình do bị phụ thuộc vào sự tác động của các toán tử
compact ( những phương trình này thường được gọi là phương trình loại I ).
2.2.1 Toán tử compact
Cho X, Y là các không gian Hilbert và lấy T ∈ B(X, Y ). Toán tử T được
gọi là compact nếu và chỉ nếu T biến mỗi tập bị chặn trong X thành một tập
compact tương đối (hay tiền compact) trong Y . Ta ký hiệu là T ∈ B∞(X, Y ).
Nhận thấy, với T ∈ B(X, Y ) cho trước, nếu dim R(T ) = dim ImT hữu
hạn thì T ∈ B∞(X, Y ). Khi đó T được gọi là toán tử có hạng hữu hạn. Để chứng minh tính chất này, trước tiên ta lấy U ⊆ X bị chặn. Ta cần chứng tỏ
rằng T (U ) compact trong Y . Vì dim ImT < ∞ nên T (U ) nằm trong không
gian hữu hạn chiều. Ta đã biết tính chất là một tập trong không gian hữu hạn
chiều sẽ compact nếu và chỉ nếu nó đóng và bị chặn. Vì thế ở đây ta chỉ cần chỉ
ra T (U ) bị chặn nữa là xong. Ta nhận thấy rằng T (U ) ⊂ Y bị chặn, suy ra tồn
tại k > 0 sao cho với mọi x ∈ T (U ) thì (cid:107)x(cid:107) ≤ k. Do đó
T (U ) ⊆ B(0,k) = {y ∈ Y : (cid:107)y(cid:107) ≤ k}.
Mà T (U ) là tập đóng nhỏ nhất chứa T (U ) nên T (U ) ⊆ B(0,k), tức là T (U ) bị chặn. Do đó T (U ) compact trong Y và ta có được T ∈ B∞(X, Y ).
Bây giờ, chúng ta sẽ xét một định lý nhằm đưa ra các điều kiện tương đương
để việc chứng minh một toán tử là compact được thuận tiện hơn, thay vì việc ta
chỉ chứng minh bằng việc sử dụng định nghĩa.
22
Định lý 2.2.1. [3] Cho X, Y là các không gian Hilbert. Lấy T ∈ B(X, Y ).
Khi đó, các điều kiện sau là tương đương
(i) T là toán tử compact.
(cid:107)T − Tm(cid:107) = 0.
(ii) Tồn tại một dãy (Tm)m∈N trong B∞(X, Y ) sao cho lim m→∞
(iii) Tồn tại một dãy (Tm)m∈N các toán tử có hạng hữu hạn thỏa mãn
(cid:107)T − Tm(cid:107) = 0.
lim m→∞
Chứng minh.
(i) ⇒(ii) : Ta chỉ cần chọn Tm := T với mọi m ∈ N.
(i) ⇒(iii) : Lấy ε > 0 nhỏ tùy ý và U ⊆ X là một tập bị chặn. Đặt M := T (U )
thì M sẽ là compact trong Y do T là compact theo giả thiết (i). Theo Định
m (cid:91)
lý Hausdorff, tồn tại y1, y2, . . . , ym sao cho M được phủ bởi các hình cầu
mở Bε(yi), nghĩa là M ⊂
Bε(yi). Bây giờ ta xây dựng phép chiếu trực
i=1
giao như sau
Pε : Y → U := span{yi : i = 1, m},
ở đây ký hiệu span{yi : i = 1, m} dùng để chỉ không gian tuyến tính sinh bởi {yi : i = 1, m}. Ta đặt Tε := PεT . Khi đó Tε có hạng hữu hạn. Theo định lý về phép chiếu trực giao, với mọi x ∈ X thì
(cid:107)T x − Tεx(cid:107) = (cid:107)T x − PεT x(cid:107) ≤ inf{(cid:107)T x − yi(cid:107) : i = 1, m} ≤ ε.
(cid:107)T − Tm(cid:107) = 0.
Suy ra (cid:107)T − Tε(cid:107) ≤ ε. Vì điều này đúng với mọi ε > 0 đủ nhỏ nên rõ ràng ta đã chỉ ra được cách xây dựng dãy (Tm)m∈N các toán tử có hạng hữu hạn sao cho lim m→∞
23
(ii) ⇒(i), (iii) ⇒(i) : Để chứng minh hai phần này, ta cần chỉ ra rằng B∞(X, Y ) là không gian con đóng của B(X, Y ). Rõ ràng B∞(X, Y ) ⊆ B(X, Y ) và B∞(X, Y ) là một không gian con của B(X, Y ). Để chứng minh B∞(X, Y ) đóng, ta lấy U ⊆ X là một tập bị chặn và một dãy (Tm)m∈N trong B∞(X, Y ) sao cho Tm → T khi m → ∞. Theo định nghĩa tập compact Tm(U ) = thì Tm(U ) phải compact trong Y . Cho m → ∞ ta thu được lim m→∞ T (U ) sẽ compact trong Y . Suy ra T ∈ B∞(X, Y ) và do đó B∞(X, Y )
đóng. Dựa vào tính chất đóng này ta sẽ suy ra được rằng nếu có điều kiện
(ii) hoặc (iii) thì sẽ thu được điều kiện (i). Tới đây ta kết thúc toàn bộ chứng
minh của định lý.
2.2.2 Phổ của toán tử compact tự liên hợp
Cho X là không gian Hilbert trên trường vô hướng K = C. Gọi I là ánh xạ
đồng nhất trên X. Ta giả sử trong suốt phần này là X (cid:54)= {0}.
Định nghĩa 2.2.2. [3] Cho T ∈ B(X) (B(X) là không gian các toán tử tuyến tính liên tục từ X vào X). Khi đó một số λ ∈ C được gọi là một giá trị riêng
của T nếu tồn tại một vectơ x ∈ X, x (cid:54)= 0 sao cho T x = λx. Vectơ x này được
gọi là vectơ riêng ứng với giá trị riêng λ. Chiều của N (T − λI) được gọi là bội
của giá trị riêng λ.
Bổ đề 2.2.3. [3] Cho T ∈ B∞(X). Cho λ ∈ C, λ (cid:54)= 0. Khi đó ta có
(i) R(T − λI) đóng.
(ii) R(T − λI) = X nếu λ không là giá trị riêng của T .
Chứng minh. Đặt N := N (T − λI) và M := R(T − λI). Nhận thấy N
là không gian con đóng của X. Ta lấy y ∈ M . Theo định nghĩa bao đóng
(T − λI)xn, trong đó
của một tập hợp, ta luôn giả sử được rằng y = lim n→∞
24
(xn)n∈N là một dãy trong X. Vì X = N (cid:76) N ⊥ nên ta có thể viết xn dưới dạng xn = un + wn, với un ∈ N và wn ∈ N ⊥. Đặt yn := (T − λI)xn. Ta có
(n ∈ N).
yn = (T −λI)(un+wn) = (T −λI)un+(T −λI)wn = (T −λI)wn
(cid:107)wn(cid:107) =
(i) Để chứng minh phần này, trước hết chúng ta cần đi chứng minh (wn)n∈N bị chặn. Ta chứng minh bằng phương pháp phản chứng, giả sử rằng lim n→∞ ∞. Khi đó ta đặt vn := wn(cid:107)wn(cid:107)−1 (n ∈ N). Suy ra (cid:107)vn(cid:107) = 1 với mọi n ∈ N, tức là (vn)n∈N bị chặn. Do đó
(cid:107)wn(cid:107)−1(T − λI)wn.
lim n→∞
(T − λI)vn = lim n→∞
Ta lấy chuẩn ở hai vế trong đẳng thức trên, đồng thời sử dụng các điều kiện
(cid:107)(T − λI)vn(cid:107) = 0. λvn.
đã có ở phần lập luận phía trên, ta sẽ thu được lim n→∞ T vn = lim n→∞
(T − λI)vn = 0. Suy ra lim n→∞
Do đó lim n→∞
Từ Định lý 1.0.6 đã đề cập trong chương trước và do T là toán tử compact
nên không mất tính tổng quát, ta có thể giả sử luôn dãy (T vn)n∈N hội tụ.
Mặt khác
(cid:107)wn(cid:107)−1yn = (cid:107)wn(cid:107)−1(T −λI)wn = (T −λI)((cid:107)wn(cid:107)−1wn) = (T −λI)vn.
(cid:107)wn(cid:107)−1yn = 0.
Do đó theo chứng minh ở trên, ta suy ra được rằng lim n→∞ Như thế, dãy (λ−1((cid:107)wn(cid:107)−1yn + T vn))n∈N hội tụ.
λvn và
Đặt v := lim n→∞
λ−1((cid:107)wn(cid:107)−1yn + T vn). Sử dụng lim n→∞
T vn = lim n→∞ vn.
(cid:107)wn(cid:107)−1yn = 0 ở chứng minh trên, ta suy ra v = lim n→∞
(cid:107)vn(cid:107) = 1 (n ∈ N). Lại có
lim n→∞ Từ vn ∈ N ⊥ mà N ⊥ là không gian con đóng của X nên ta có v ∈ N ⊥ và (cid:107)v(cid:107) = lim n→∞
(T − λI)vn = 0.
(T − λI)v = lim n→∞
Suy ra v ∈ N (T − λI) = N . Do đó v ∈ N ∩ N ⊥ = {0}. Điều này
25
mâu thuẫn với (cid:107)v(cid:107) = 1. Vì vậy (wn)n∈N bị chặn. Khi đó do T là toán tử
compact nên tương tự như phần lập luận ở trên, ta có thể tiếp tục giả sử
(T wn)n∈N hội tụ. Từ đó ta có
(T wn − λwn).
y = lim n→∞
yn = lim n→∞
(T − λI)wn = lim n→∞
Vì thế dãy (wn)n∈N phải hội tụ tới một giá trị w ∈ N ⊥. Suy ra y = (T − λI)w ∈ M := R(T − λI).
Do đó ta đã chỉ ra được rằng M ⊆ M . Điều này chứng tỏ rằng M = M
hay M := R(T − λI) đóng.
(ii) Nếu λ không là giá trị riêng của T thì T − λI khả nghịch, tức là tồn tại (T − λI)−1. Đặt X0 := X và Xn := R((T − λI)n) với n ∈ N. Theo chứng minh phần (i) thì X1 đóng. Khi đó X1 là không gian con đóng của không gian Hilbert X nên X1 cũng là không gian Hilbert và dĩ nhiên nó
cũng là một không gian Banach.
Xét ánh xạ
X
(T − λI)−1 : X1 →
u (cid:55)→ (T − λI)−1u.
Vì X, X1 đều là các không gian Banach nên theo hệ quả của Định lý Banach về ánh xạ mở, (T − λI)−1 sẽ liên tục, hơn nữa (T − λI)−1 tuyến tính nên nó bị chặn. Quy nạp theo n, ta thu được Xn = (T −λI)−1(Xn+1) và Xn+1 ⊂ Xn. Do X1 đóng nên Xn đóng với mọi n ∈ N.
Giả sử X (cid:54)= X1 := R(T − λI). Bằng phương pháp quy nạp ta có Xn+1 (cid:36) Xn với mọi n ∈ N. Khi đó với mỗi n, ta chọn xn ∈ Xn ∩ X ⊥ n+1 và T xn sẽ tồn tại và hữu hạn. Do (cid:107)xn(cid:107) = 1. Theo tính compact của T , lim n→∞ đó theo Định lý Pythagore, với mọi n ∈ N, ta có
(cid:107)T xn(cid:107)2 = (cid:107)(T − λI)xn + λxn(cid:107)2
26
= (cid:107)(T − λI)xn(cid:107)2 + |λ|2(cid:107)xn(cid:107)2 ≥ |λ|2 > 0
T xn < ∞. Ta có điều phải chứng minh.
mâu thuẫn với việc tồn tại lim n→∞
Định nghĩa 2.2.4. [3] Cho T ∈ B(X). Khi đó
ρ(T ) := {λ ∈ C| T − λI là đơn ánh, (T − λI)−1 ∈ B(X)}
được gọi là tập giải của T và σ(T ) := C \ ρ(T ) được gọi là phổ của T .
Định lý 2.2.5. [3] Giả sử T : X → X là toán tử compact. Khi đó ta có các
tính chất sau
(i) Nếu dim X = ∞ thì σ(T ) = {0} ∪ {λ ∈ C| λ là giá trị riêng của T }.
(ii) Nếu dim X < ∞ thì σ(T ) = {λ ∈ C| λ là giá trị riêng của T }.
(iii) Mỗi giá trị riêng khác không của T đều có bội hữu hạn.
(iv) T có không quá đếm được số giá trị riêng và dãy các giá trị riêng này có
điểm tụ bằng 0.
Chứng minh.
(i) Ta lấy (en)n∈N là một dãy trực chuẩn trong X ( nghĩa là (cid:104)ei, ej(cid:105) = 0 với mọi i (cid:54)= j và (cid:107)en(cid:107)n∈N = 1 ). Đầu tiên ta sẽ chỉ ra rằng dãy (en)n∈N hội tụ yếu tới 0 khi n → ∞. Thật vậy, lấy T (cid:48) là phiếm hàm tuyến tính liên tục đi từ không gian Hilbert X vào trường số K (K = R hoặc C). Áp dụng Định lý Riesz đã đề cập ở chương trước, ta có biểu diễn T (cid:48)en = (cid:104)en, a(cid:105), với a là một vectơ cho trước trong X thỏa mãn (cid:107)T (cid:48)(cid:107) = (cid:107)a(cid:107). Lại có, theo bất đẳng
∞ (cid:88)
thức Bessel trong không gian Hilbert, ta có
(cid:107)a(cid:107)2 ≥
|(cid:104)a, en(cid:105)|2.
n=1
27
∞ (cid:88)
Suy ra chuỗi
|(cid:104)a, en(cid:105)|2 hội tụ. Do đó số hạng tổng quát của chuỗi
n=1
|(cid:104)a, en(cid:105)|2 sẽ hội tụ về 0 trên trường K, tức là (cid:104)a, en(cid:105) cũng hội tụ về 0 trên trường K. Vì thế, dãy (T (cid:48)en)n∈N hội tụ về 0 trên trường số K. Như vậy với mọi a ∈ X thì (cid:104)a, en(cid:105) → (cid:104)a, 0(cid:105) khi n → ∞. Do đó theo định nghĩa về sự hội tụ yếu ta suy ra dãy (en)n∈N hội tụ yếu tới 0.
T en = 0. Theo định nghĩa của phổ thì rõ ràng 0 ∈ σ(T ).
Vì T compact và theo chứng minh trên (en)n∈N hội tụ yếu tới 0 nên lim n→∞ Tiếp theo, giả sử 0 (cid:54)= λ ∈ C và λ không là giá trị riêng của T . Khi đó theo Bổ đề 2.2.3 ở trên, T − λI : X → X sẽ là một song ánh và bị chặn. Theo hệ quả của Định lý Banach về ánh xạ mở, ta suy ra (T − λI)−1 : X → X cũng bị chặn. Hơn nữa, ánh xạ này tuyến tính nên (T − λI)−1 ∈ B(X).
Suy ra λ ∈ ρ(T ). Vì vậy ta có điều cần chứng minh.
(ii) Do dim X < ∞ nên dim ImT = dim R(T ) < ∞, nghĩa là T là toán
tử có hạng hữu hạn. Theo định nghĩa của tập giải thì ρ(T ) bao gồm các giá trị λ ∈ C sao cho T − λI là đơn ánh, điều này tương đương với
N (T − λI) = {0}. Do đó phổ σ(T ) sẽ là tập hợp các giá trị λ thỏa mãn N (T − λI) (cid:54)= {0}. Vì vậy σ(T ) = {λ ∈ C : λ là giá trị riêng của T }.
(iii) Lấy 0 (cid:54)= λ ∈ C là một giá trị riêng của T . Giả sử dim N (T − λI) = ∞.
T en = 0.
Khi đó ta lấy (en)n∈N là một hệ trực chuẩn của N (T − λI). Theo chứng minh phần (i) thì lim n→∞
Tuy nhiên từ cách chọn dãy (en)n∈N thì (T − λI)en = 0 hay T en = λen. Do đó với mọi n ∈ N, ta có (cid:107)T en(cid:107) = (cid:107)λen(cid:107) = |λ|(cid:107)en(cid:107) = |λ| > 0, điều này mâu thuẫn với lập luận ở trên. Vậy dim N (T − λI) < ∞.
(iv) Ta chứng minh bằng phương pháp phản chứng. Giả sử rằng tồn tại một
λn = λ (cid:54)= 0. Ta lấy dãy (λn)n∈N gồm các giá trị riêng của T sao cho lim n→∞ (en)n∈N là một dãy trực chuẩn gồm các vectơ riêng tương ứng với dãy giá
28
trị riêng (λn)n∈N.
2
Vì T compact và dãy (en)n∈N bị chặn nên dãy (T en)n∈N hội tụ. Mặt khác (cid:107)T en − T em(cid:107)2 = (cid:107)λnen − λmem(cid:107)2 = |λn|2 + |λm|2. Áp dụng bất đẳng thức Cauchy ta có
,
(cid:107)T en − T em(cid:107)2 ≥
λm + λn 2
(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)
suy ra lim
(cid:107)T en − T em(cid:107)2 ≥ |λ|2 > 0. Suy ra dãy (T en)n∈N không hội
m,n→∞
tụ, điều này mâu thuẫn. Vì vậy ta có điều phải chứng minh.
Bổ đề 2.2.6. [3] Giả sử T : X → X là một toán tử tự liên hợp ( T = T ∗). Khi
đó
(i) (cid:104)T x, x(cid:105) ∈ R với mọi x ∈ X.
(ii) Mọi giá trị riêng của T đều là số thực.
Chứng minh.
(i) Từ giả thiết T = T ∗, với mọi x ∈ X, ta có
(cid:104)T x, x(cid:105) = (cid:104)x, T ∗x(cid:105) = (cid:104)x, T x(cid:105) = (cid:104)T x, x(cid:105).
Do đó (cid:104)T x, x(cid:105) ∈ R với mọi x ∈ X.
(ii) Ta gọi λ là một giá trị riêng của T và x ∈ X, x (cid:54)= 0 là vectơ riêng ứng với λ. Khi đó ta có (cid:104)T x, x(cid:105) = (cid:104)λx, x(cid:105) = λ(cid:107)x(cid:107)2. Theo chứng minh phần (i), (cid:104)T x, x(cid:105) ∈ R với mọi x ∈ X. Do đó λ(cid:107)x(cid:107)2 ∈ R với mọi x ∈ X. Theo cách chọn x (cid:54)= 0 nên (cid:107)x(cid:107)2 > 0. Vì thế để với mọi x ∈ X xảy ra λ(cid:107)x(cid:107)2 ∈ R thì λ ∈ R. Ta chứng minh xong bổ đề.
Định lý 2.2.7. [3] Giả sử T : X → X là một toán tử compact tự liên hợp. Khi
đó ít nhất một trong các giá trị (cid:107)T (cid:107), −(cid:107)T (cid:107) phải là một giá trị riêng của T .
29
(cid:107)T xn(cid:107) =
Chứng minh. Gọi (xn)n∈N là dãy trong X thỏa mãn (cid:107)xn(cid:107) = 1 và lim n→∞ (cid:110) (cid:107)T v(cid:107)
. Từ đó suy ra dãy
(cid:111) (cid:107)v(cid:107) : v ∈ X, v (cid:54)= 0
(cid:107)T (cid:107) (n ∈ N). Ta đã biết (cid:107)T (cid:107) = sup (xn)n∈N tồn tại. Sử dụng tính tự liên hợp của T , tức là T = T ∗, ta có
(cid:107)T 2xn − (cid:107)T xn(cid:107)2xn(cid:107)2 =(cid:107)T 2xn(cid:107)2 − 2(cid:104)T 2xn, (cid:107)T xn(cid:107)2xn(cid:105) + (cid:107)T xn(cid:107)4(cid:107)xn(cid:107)2
=(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)2(cid:104)T 2xn, xn(cid:105) + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)2(cid:104)T xn, T ∗xn(cid:105) + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)2(cid:104)T xn, T xn(cid:105) + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)4 + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − (cid:107)T xn(cid:107)4 ≤(cid:107)T (cid:107)2(cid:107)T xn(cid:107)2 − (cid:107)T xn(cid:107)4.
(cid:107)T xn(cid:107) = (cid:107)T (cid:107) ta suy ra
Từ giả thiết lim n→∞
(∗)
(cid:107)T 2xn − (cid:107)T xn(cid:107)2xn(cid:107) = 0.
lim n→∞
Vì T compact nên hợp thành T 2 cũng compact. Do đó theo Định lý 1.0.6 của
chương trước, với (xn)n∈N là một dãy bị chặn trong X ta luôn có thể trích ra được một dãy con (xnk) (k ∈ N) sao cho dãy (T 2xnk) (k ∈ N) hội tụ trong X. Giả sử T 2xnk → T 2z khi k → ∞. Khi đó từ đẳng thức (∗) ở trên, ta có
T 2z = (cid:107)T (cid:107)2z,
(cid:107)z(cid:107) = 1.
xnk = z,
lim k→∞
Suy ra T 2 có một giá trị riêng là (cid:107)T (cid:107)2. Do đó
(T − (cid:107)T (cid:107)I)(T + (cid:107)T (cid:107)I)z = (T 2 − (cid:107)T (cid:107)2I)z = 0.
Vì vậy T có một giá trị riêng là −(cid:107)T (cid:107) nếu (T + (cid:107)T (cid:107)I)z = 0 và có một giá trị
riêng là (cid:107)T (cid:107) nếu (T + (cid:107)T (cid:107)I)z (cid:54)= 0. Ta có điều phải chứng minh.
30
2.2.3 Phân tích giá trị kỳ dị
Cho X, Y là các không gian Hilbert không tầm thường trên trường C.
Bổ đề 2.2.8. [3] Giả sử T : X → Y là toán tử tuyến tính. Khi đó các mệnh đề
sau tương đương
(i) T là toán tử hạng hữu hạn.
m (cid:88)
(ii) Tồn tại m ∈ N, một hệ trực chuẩn f1, . . . , fm trong Y và một hệ các vectơ độc lập tuyến tính e1, . . . , em trong X sao cho với mọi x ∈ X, ta có
T x =
(cid:104)x, ej(cid:105)fj.
j=1
Chứng minh.
(i) ⇒(ii) : Đặt m := dim R(T ), khi đó m < ∞. Ta chọn các vectơ trực chuẩn := T ∗fj, j = 1, m. Khi đó với mỗi
f1, . . . , fm trong R(T ) và đặt ej x ∈ X, ta có
m (cid:88)
m (cid:88)
m (cid:88)
T x =
(cid:104)T x, fj(cid:105)fj =
(cid:104)x, T ∗fj(cid:105)fj =
(cid:104)x, ej(cid:105)fj.
j=1
j=1
j=1
Từ dim R(T ) = m < ∞ suy ra e1, . . . , em độc lập tuyến tính.
(ii) ⇒ (i) : Từ giả thiết ta suy ra dim R(T ) = m < ∞. Vậy T là toán tử hạng
hữu hạn.
Bây giờ chúng ta đi đến định lý phổ cho một toán tử compact tự liên hợp.
Định lý này là một sự khái quát của việc chéo hóa một ma trận đối xứng và
đồng thời cũng là trường hợp đặc biệt của định lý phổ cho các toán tử bị chặn.
Định lý 2.2.9. [3] Cho T là một toán tử compact tự liên hợp, λn (n ∈ N với N = {1, . . . , n} hoặc N = N) là các giá trị riêng khác 0 đôi một phân biệt
31
của T . Khi đó với mỗi x ∈ X, tồn tại x0 ∈ N (T ) sao cho
(cid:88) (cid:88)
T x =
x = x0 +
Pnx,
λnPnx,
n∈N
n∈N
mn(cid:88)
trong đó Pn là phép chiếu trực giao của X lên N (T − λnI) xác định bởi
(cid:104)x, un
Pnx =
j (cid:105)un j ,
j=1
j )j=1,mn là một tập trực chuẩn trong
ở đây mn là chiều của N (T − λnI) và (un N (T − λnI) (n ∈ N ).
Chứng minh. Từ Định lý 2.2.5, mỗi giá trị riêng khác 0 của một toán tử compact
trên không gian Hilbert X luôn có bội hữu hạn nên mn < ∞ với mọi n ∈ N . Ta nhận thấy N (T − λnI) là một không gian con đóng của X nên theo định lý về phép chiếu trực giao trong không gian Hilbert, với mỗi n ∈ N sẽ tồn tại
mn(cid:88)
phép chiếu trực giao Pn : X → N (T − λnI) được xác định bởi
(cid:104)x, un
Pnx =
j (cid:105)un j ,
j=1
j )j=1,mn là một hệ trực chuẩn trong N (T − λnI). Khi đó
ở đây (un
(cid:91)
{un
U :=
}
1 , . . . , un mn
n∈N
j ) là hệ trực chuẩn nên theo
là một hệ trực chuẩn trong X. Lấy x ∈ X. Vì (un
mn(cid:88)
(cid:88)
|(cid:104)x, un
j (cid:105)|2 ≤ (cid:107)x(cid:107)2. Do đó theo Bổ đề 1.0.8
j=1
n∈N
bất đẳng thức Bessel ta có
mn(cid:88)
(cid:88)
(cid:104)x, un
j (cid:105)un
j hội tụ, nghĩa là vectơ
j=1
n∈N
trong chương trước, ta suy ra chuỗi
mn(cid:88)
(cid:88) (cid:88)
y :=
(cid:104)x, un
Pnx được xác định. Đặt M := N (T − λnI) thì
j (cid:105)un
j =
j=1
n∈N
n∈N
32
y ∈ M . Từ đó x − y ∈ M ⊥. Vì Pnx ∈ N (T − λnI) nên
(cid:88) (cid:88) (cid:88)
T y = T (
Pnx) =
(T Pnx) =
λnPnx.
n∈N
n∈N
n∈N
Để kết thúc chứng minh, ta cần chỉ ra T x = T y là xong. Điều này tương đương với x − y ∈ N (T ) hay M ⊥ ⊂ N (T ). Thật vậy, dễ thấy T (M ) ⊂ M, T (M ⊥) ⊂ M ⊥. Gọi T1 : M ⊥ → M ⊥ là hạn chế của T xuống M ⊥. Do T compact, tự liên hợp nên T1 cũng là một toán tử compact, tự liên hợp. Giả sử T1 (cid:54)= 0. Theo Định lý 2.2.7, T1 sẽ có một giá trị riêng λ (cid:54)= 0. Rõ ràng λ cũng là một giá trị riêng của T , suy ra tồn tại x ∈ M ⊥ \ {0} thỏa mãn x ∈ N (T − λI) ⊂ M . Vì thế x ∈ M ∩ M ⊥ = {0}, mâu thuẫn với cách chọn x. Như vậy T1 = 0, suy ra M ⊥ ⊂ N (T ). Ta có điều phải chứng minh.
Trước khi đến với một định lý quan trọng tiếp theo của phần này, chúng tôi
xin nhắc lại một số tính chất của T ∈ B(X, Y )
1. N (T ∗) = R(T )⊥.
⊥
2. N (T ) = R(T ∗)⊥.
3. R(T )
= R(T )⊥ = N (T ∗), suy ra R(T ) = N (T ∗)⊥ và R(T ∗) = N (T )⊥.
Định lý 2.2.10. [3] Giả sử A : X → Y là toán tử compact. Khi đó tồn tại một tập chỉ số J (J = {1, . . . , n} hoặc J = N), các hệ trực chuẩn (ej)j∈J ,(fj)j∈J tương ứng của X, Y và dãy (σj)j∈J các số thực dương thỏa mãn các điều kiện
σj = 0 nếu J = N.
(i) (σj)j∈J là đơn điệu không tăng và lim j∈J
(ii) Aej = σjfj, A∗fj = σjej với mọi j ∈ J.
(iii) Với mọi x ∈ X, tồn tại x0 ∈ N (A) thỏa mãn
(cid:88) (cid:88)
Ax =
x = x0 +
(cid:104)x, ej(cid:105)ej,
σj(cid:104)x, ej(cid:105)fj.
j∈J
j∈J
33
(cid:88) (iv) Với mọi y ∈ Y , ta có A∗y =
σj(cid:104)y, fj(cid:105)ej.
j∈J
Chứng minh.
(i) Do A là compact nên toán tử T := A∗A : X → X cũng compact. Hơn nữa (A∗A)∗ = A∗A nên T là toán tử tự liên hợp. Như vậy theo Định lý 2.2.9 sẽ tồn tại tập chỉ số N (N = {1, . . . , k} hoặc N = N) và một dãy (λn)n∈N là các giá trị riêng khác 0 đôi một phân biệt của T . Nhận thấy (λn)n∈N là dãy các giá trị riêng thực, theo Bổ đề 2.2.6. Ta lấy (λj)j∈J là một dãy các giá trị riêng không tăng trích từ dãy (λn)n∈N . Chọn (ej)j∈J là dãy trực chuẩn gồm các vectơ riêng tương ứng với dãy giá trị riêng (λj)j∈J của T . Nhận thấy với mọi x ∈ X thì (cid:104)x, T x(cid:105) = (cid:104)x, A∗Ax(cid:105) = (cid:104)Ax, Ax(cid:105) ≥ 0.
Do đó T là toán tử không âm. Như vậy nếu λj là một giá trị riêng ứng với một vectơ riêng x ∈ X, x (cid:54)= 0 thì từ (cid:104)x, T x(cid:105) ≥ 0, ta suy ra (cid:104)x, λjx(cid:105) ≥ 0, suy ra λj ≥ 0. Mà theo cách xây dựng ở trên thì λj (cid:54)= 0 với mọi j ∈ J nên mọi giá trị riêng λj (j ∈ J) của T đều dương. Do đó ta có thể đặt
σj := (cid:112)λj fj := σ−1
j Aej.
Như vậy (σj)j∈J là dãy số dương không tăng. Theo Định lý 2.2.5, với A là toán tử compact thì A sẽ có không quá đếm được số giá trị riêng và dãy
σj = 0.
các giá trị riêng này có điểm tụ bằng 0. Do đó lim j∈J=N
Vì (ej)j∈J là một hệ trực chuẩn gồm các vectơ riêng ứng với các giá trị riêng (λj)j∈J nên ta dễ dàng chứng minh được rằng (fj)j∈J cũng là một
hệ trực chuẩn. Thật vậy
|(cid:107)Aej(cid:107)
j Aej(cid:107) = |σ−1 (cid:107)fj(cid:107) = (cid:107)σ−1 j (cid:113)
(cid:113)
(cid:104)Aej, Aej(cid:105) = σ−1
(cid:104)ej, A∗Aej(cid:105)
= σ−1 j
j
34
(cid:113)
(cid:104)ej, λjej(cid:105) = σ−1
(cid:112)λj(cid:107)ej(cid:107)
= σ−1 j
j
= σ−1
j σj = 1.
j (cid:104)Aei, Aej(cid:105)
Lại có với i, j ∈ J, i (cid:54)= j thì
(cid:104)fi, fj(cid:105) = (cid:104)σ−1 = σ−1
i σ−1 i σ−1
j (cid:104)ei, λjej(cid:105)
= σ−1
i Aei, σ−1 i σ−1 i σ−1
j Aej(cid:105) = σ−1 j (cid:104)ei, A∗Aej(cid:105) = σ−1 j λj(cid:104)ei, ej(cid:105) = 0 (Do (ej)j∈J là hệ trực chuẩn).
Do đó (fj)j∈J là hệ trực chuẩn.
(ii) Tính chất này dễ dàng được suy ra từ định nghĩa của σj, ej, fj.
(iii) Với x ∈ N (A) thì Ax = 0. Điều này tương đương với A∗Ax = A∗0 = 0 hay x ∈ N (A∗A). Vậy N (T ) = N (A). Áp dụng Định lý 2.2.9 cho toán
(cid:88) (cid:88)
(cid:104)x, ej(cid:105)ej. Ở đây chúng ta chú ý rằng chuỗi
j∈J
j∈J (cid:88)
tử compact tự liên hợp T cùng các dữ kiện (λj)j∈J là dãy các giá trị riêng khác 0 đôi một phân biệt của T và (ej)j∈J là dãy trực chuẩn của X, ta suy ra rằng với mọi x ∈ X, tồn tại x0 ∈ N (T ) = N (A) thỏa mãn x = (cid:104)x, ej(cid:105)ej được xác x0 +
định. Thật vậy, theo bất đẳng thức Bessel ta có được
|(cid:104)x, ej(cid:105)|2 ≤ (cid:107)x(cid:107)2.
j∈J Áp dụng Bổ đề 1.0.8 trong chương trước suy ra chuỗi
(cid:88)
(cid:104)x, ej(cid:105)ej hội tụ
j∈J
hay được xác định.
Ta có
(cid:88) (cid:88) (cid:88)
Ax = Ax0 +
A((cid:104)x, ej(cid:105)ej) =
(cid:104)x, ej(cid:105)Aej =
σj(cid:104)x, ej(cid:105)fj.
j∈J
j∈J
j∈J
Như vậy ta chứng minh xong điều kiện (iii).
(cid:88) (iv) Ta đang dừng lại ở Ax =
σj(cid:104)x, ej(cid:105)fj. Nhận thấy Ax có dạng một
j∈J
35
chuỗi và nó được xác định. Thật vậy, do (fj)j∈J là hệ trực chuẩn nên sử dụng bất đẳng thức Bessel ta có được (cid:107)Ax(cid:107) ≤ σ1(cid:107)x(cid:107). Vì thế Ax được xác định. Nhận thấy A : X → Y là toán tử compact nên A∗ : Y → X
cũng là toán tử compact. Khi đó ta xét toán tử
T (cid:48) := AA∗ : Y → Y,
j∈J
(cid:88) ở đây T (cid:48) compact và tự liên hợp. Tiếp tục chứng minh như đã làm với toán tử A : X → Y , ta thu được kết quả là: Với mọi y ∈ Y , tồn tại y0 ∈ N (A∗) (cid:104)y, fj(cid:105)fj. Ở đây do (fj)j∈J là hệ trực chuẩn nên theo sao cho y = y0 +
bất đẳng thức Bessel ta có
(cid:88)
|(cid:104)y, fj(cid:105)|2 ≤ (cid:107)y(cid:107)2.
j∈J
Khi đó lại áp dụng Bổ đề 1.0.8 trong chương trước ta suy ra y được xác định. Tác động A∗ vào hai vế của phương trình biểu diễn y ở trên, ta có
(cid:88)
(cid:104)y, fj(cid:105)A∗fj
A∗y = A∗y0 +
j∈J
(cid:88)
=
σj(cid:104)y, fj(cid:105)ej.
(Do A∗fj = σjej)
j∈J
Chú ý thêm ở đây là (cid:107)A∗y(cid:107) ≤ σ1(cid:107)y(cid:107) nên A∗y được xác định. Ta có toàn bộ điều phải chứng minh.
Định nghĩa 2.2.11. [3] Cho A : X → Y là toán tử compact với biểu diễn
(cid:88)
Ax =
σj(cid:104)x, ej(cid:105)fj (∗)
j∈J
(cid:88) trong đó x = x0 +
(cid:104)x, ej(cid:105)ej với x0 ∈ N (A); (ej)j∈J và (fj)j∈J lần lượt là
j∈J
các hệ trực chuẩn của X và Y ; J là tập chỉ số (J = {1, . . . , n} hoặc J = N),
36
(σj)j∈J là dãy số thực dương không tăng hội tụ về 0 khi J = N. Khi đó các số σj(j ∈ J) được gọi là các giá trị kỳ dị của A. Họ {(σj, ej, fj)|j ∈ J} được gọi là một hệ kỳ dị của A và biểu diễn (∗) là một phân tích giá trị kỳ dị của A.
2.3 Tiêu chuẩn Picard
Kết quả chính của phần này là một tiêu chuẩn để giải quyết các phương trình
tuyến tính bị tác động bởi toán tử compact.
Định lý 2.3.1. [3] Cho A : X → Y là toán tử compact giữa hai không gian
Hilbert X và Y . Gọi {(σj, ej, fj)} là một hệ kỳ dị của A. Khi đó với một phần tử y ∈ Y cho trước, các điều kiện sau tương đương
(i) y ∈ R(A).
(cid:88) (ii) y ∈ R(A) và
|(cid:104)y, fj(cid:105)|2 < ∞.
σ−2 j
j∈J
Chứng minh.
(i) ⇒ (ii) : Giả sử y ∈ R(A), suy ra y ∈ R(A). Ta lấy x ∈ X thỏa mãn
Ax = y. Khi đó theo Định lý 2.2.10 và sử dụng thêm bất đẳng thức
Bessel, ta có
(cid:88) (cid:88)
|(cid:104)y, fj(cid:105)|2 =
|(cid:104)Ax, fj(cid:105)|2
σ−2 j
σ−2 j
j∈J
j∈J (cid:88)
=
|(cid:104)x, A∗fj(cid:105)|2
σ−2 j
j∈J (cid:88)
=
|(cid:104)x, σjej(cid:105)|2
σ−2 j
j∈J (cid:88)
=
|(cid:104)x, ej(cid:105)|2 ≤ (cid:107)x(cid:107)2 < ∞.
j∈J
37
n (cid:88)
(ii) ⇒ (i) : Ta chỉ xét trường hợp J = N. Đặt xn :=
σ−1 j (cid:104)y, fj(cid:105)ej với
j=1
(cid:88)
n ∈ J = N. Khi đó từ giả thiết
|(cid:104)y, fj(cid:105)|2 < ∞, ta suy ra với mọi
σ−2 j
j∈J
m, n ∈ J, m ≥ n thì
m (cid:88)
(cid:107)xn − xm(cid:107)2 =
|(cid:104)y, fj(cid:105)|2 < ∞.
σ−2 j
j=n+1
xn, ta có
n (cid:88)
Do đó dãy (xn)n∈J là dãy Cauchy. Đặt x := lim n→∞
A(
σ−1 j (cid:104)y, fj(cid:105)ej)
Ax = lim n→∞
j=1
n (cid:88)
Aejσ−1
j (cid:104)y, fj(cid:105)
= lim n→∞
j=1
∞ (cid:88)
=
σjfjσ−1
j (cid:104)y, fj(cid:105)
j=1 ∞ (cid:88)
=
(cid:104)y, fj(cid:105)fj.
j=1
∞ (cid:88)
Theo bất đẳng thức Bessel, với (fj)j∈J là một hệ trực chuẩn trong Y thì
(cid:107)Ax(cid:107) ≤ (cid:107)y(cid:107). Đặt z := y − Ax = y −
(cid:104)y, fj(cid:105)fj. Khi đó ta có
j=1
∞ (cid:88)
(cid:107)z(cid:107)2 = (cid:107)y −
(cid:104)y, fj(cid:105)fj(cid:107)2
j=1
∞ (cid:88)
∞ (cid:88)
= (cid:107)y(cid:107)2 + (cid:107)
(cid:104)y, fj(cid:105)fj(cid:107)2 − 2(cid:104)y,
(cid:104)y, fj(cid:105)fj(cid:105)
j=1
j=1 ∞ (cid:88)
∞ (cid:88)
= (cid:107)y(cid:107)2 + (cid:107)
(cid:104)y, fj(cid:105)fj(cid:107)2 − 2
|(cid:104)y, fj(cid:105)|2
j=1
j=1
∞ (cid:88)
∞ (cid:88)
= (cid:107)y(cid:107)2 +
|(cid:104)y, fj(cid:105)|2 − 2
|(cid:104)y, fj(cid:105)|2
j=1
j=1
38
∞ (cid:88)
= (cid:107)y(cid:107)2 −
|(cid:104)y, fj(cid:105)|2.
j=1
∞ (cid:88)
Do (fj)j∈J là một hệ trực chuẩn trong Y nên áp dụng Bổ đề 1.0.8, với mọi y ∈ Y , ta sẽ có
z = y −
(cid:104)y, fj(cid:105)fj ⊥ fj ∀j ∈ N
j=1
j∈J
(cid:88) suy ra (cid:104)z, fj(cid:105) = 0 ∀j ∈ N. Khi đó theo biểu diễn (iv) đã chứng minh ở σj(cid:104)z, fj(cid:105)ej = 0. Suy ra z ∈ N (A∗). Lại Định lý 2.2.10, ta có A∗z =
∞ (cid:88)
có y ∈ R(A) nên y ∈ N (A∗)⊥. Vì vậy
0 = (cid:104)z, y(cid:105) = (cid:107)y(cid:107)2 −
|(cid:104)y, fj(cid:105)|2 = (cid:107)z(cid:107)2.
j=1
∞ (cid:88)
Suy ra z = 0. Do đó y =
(cid:104)y, fj(cid:105)fj = Ax ∈ R(A). Ta có điều phải
j=1
chứng minh.
* Ý nghĩa của tiêu chuẩn Picard:
• Từ chứng minh tiêu chuẩn Picard có thể chỉ ra trực tiếp một nghiệm
cho bài toán Ax = y. Cách làm như sau
∞ (cid:88)
– Gọi (σj, ej, fj)j∈J là hệ kỳ dị của A.
– y ∈ R(A) viết ở dạng y =
(cid:104)y, fj(cid:105)fj.
j=1
(cid:88) – Khi đó x =
σ−1 j (cid:104)y, fj(cid:105)ej chính là một nghiệm thỏa mãn
j∈J
Ax = y.
Công thức trên tuy hữu dụng về mặt lý thuyết nhưng khó vận dụng
trong thực hành vì hệ kỳ dị hoặc không biết hoặc rất khó để tính.
39
• Phân tích giá trị kỳ dị giúp ta hiểu rõ hơn vì sao bài toán Ax = y
đặt không chỉnh. Thật vậy xét trường hợp X, Y là các không gian
√
√
σkfk, xk = x + (
√
√
σk)−1 → ∞ khi k → ∞.
Hilbert với số chiều đếm được, gọi (σj, ej, fj)j∈J là hệ kỳ dị của A σk)−1ek. Khi đó với và xét chẳng hạn yk = y + ∀k ∈ N, Axk = yk và (cid:107)yk − y(cid:107) = σk → 0 khi k → ∞. Tuy nhiên, (cid:107)xk − x(cid:107) = ( Do đó ta khắc phục điều này bằng cách xét họ chính quy hóa {Rα} với tham số chính quy hóa α thỏa mãn:
– Tính ổn định: ∀α, Rα : Y → X là liên tục;
– Tính chính xác: (cid:107)RαAx − x(cid:107) → 0 khi α → 0.
Chi tiết cách xây dựng {Rα} xem trong tài liệu tham khảo [3] các
chương 5,6,7.
CHƯƠNG 3
Ứng dụng của phương pháp bình phương
tối thiểu
Trong chương này, chúng tôi sẽ trình bày một số ứng dụng của phương pháp
bình phương tối thiểu trong đại số tuyến tính và trong giải bài toán ngược. Trước
hết, trong chương trước, chúng tôi đã giải thích mối liên hệ của phương pháp
bình phương tối thiểu và phương pháp phân tích giá trị kỳ dị trong trường hợp
cho các toán tử. Tới chương này, đối tượng chúng ta làm việc là các ma trận.
Như vậy, để mô tả phương pháp bình phương tối thiểu trong đại số tuyến tính,
chúng tôi sẽ giới thiệu phương pháp phân tích giá trị kỳ dị cho ma trận [3], [4].
3.1 Phân tích giá trị kỳ dị cho ma trận
Với M = (mij) ∈ Rm,n, u, v ∈ Rk, α1, . . . , αl ∈ R, u1, . . . , ul ∈ Rk. Sử
dụng một số ký hiệu sau
1. In: ma trận đơn vị cấp n.
2. M T : ma trận chuyển vị của ma trận M .
3. (cid:107)u(cid:107): chuẩn Ơclit của u .
40
4. uT v: tích vô hướng Ơclit của u và v.
41
5. (cid:107)M (cid:107): chuẩn của ma trận M , được xác định bởi
(cid:107)M (cid:107) := max{(cid:107)M x(cid:107) : x ∈ Rn, (cid:107)x(cid:107) ≤ 1}.
6. (cid:107)M (cid:107)F : chuẩn Frobenius của M , được xác định bởi
(cid:88)
(cid:107)M (cid:107)F := (
|mij|2)1/2.
i,j
7. (cid:104)u1, . . . , ul(cid:105): không gian tuyến tính sinh bởi u1, . . . , ul.
8. diag(α1, . . . , αl): ma trận đường chéo trong Rp,l với α1, . . . , αl nằm trên
đường chéo và p ≥ l.
9. (u1| . . . |ul): ma trận trong Rk,l với các cột u1, . . . , ul.
Bây giờ ta sẽ đi đến một kết quả quan trọng của phần này.
Định lý 3.1.1. [3] Cho A ∈ Rm,n. Khi đó tồn tại ma trận U ∈ Rm,m, V ∈ Rn,n
và các số thực σ1 ≥ . . . σn ≥ 0 sao cho
A = U DV T ,
U T U = U U T = Im,
V T V = V V T = In,
ở đây D = diag(σ1, . . . , σn) ∈ Rm,n.
Chứng minh. Trước hết ta chứng minh rằng AT A ∈ Rn,n là ma trận đối xứng và nửa xác định dương. Thật vậy, do (AT A)T = AT (AT )T = AT A nên AT A đối xứng. Lấy x ∈ Rn là một vectơ bất kỳ. Khi đó xT (AT A)x = (Ax)T (Ax) = (cid:107)Ax(cid:107)2 ≥ 0. Suy ra AT A là nửa xác định dương. Do vậy tất cả các giá trị riêng của AT A đều không âm. Từ đó suy ra tồn tại các số thực không âm σ1 ≥ . . . ≥ σn ≥ 0 sao cho σ2 n là các giá trị riêng của AT A. Ta gọi 1, . . . , σ2 1, . . . , σ2 (vi)i=1,n là họ các vectơ riêng trực chuẩn ứng với các giá trị riêng σ2 n của AT A. Ta lấy r ≤ n sao cho σr > 0, σr+1 = . . . = σn = 0. Khi đó
42
nếu đặt V1 := (v1| . . . |vr) ∈ Rn,r, V2 := (vr+1| . . . |vn) ∈ Rn,n−r, V := (v1| . . . |vn) ∈ Rn,n và D1 := diag(σ1, . . . , σr) ∈ Rr,r thì ta thu được
D−1
r ), V T
1 = diag(σ−1
1 , . . . , σ−1
D−1
1 AT AV1 = D2 1, 2 AT AV2 = 0, AV2 = 0.
1 AT AV1D−1
1 V T
1 = Ir, V T
1 ∈ Rm,r. Khi đó nếu chọn ma trận U2 ∈ Rm,m−r thỏa mãn
Đặt U1 := AV1D−1 U := (U1|U2) ∈ Rm.m và U T U = U U T = Im, ta sẽ nhận được
U T
D1 0
1 AV2
U T AV =
:= D.
=
U T
0
0
1 AV1 U T 2 AV1 U T
2 AV2
Suy ra AV = (U T )−1D = U D. Do đó A = (U D)V −1 = U DV T .
Ở đây, chúng tôi muốn giải thích chi tiết hơn về cách tính để có được các kết
quả như trên. Thật vậy, do (vi)i=1,n là hệ trực chuẩn nên ta có
0 nếu i (cid:54)= j
vT i vj = (cid:104)vi, vj(cid:105) =
1 nếu i = j.
1 AT AV1 = D2
1. Tương 2 AT AV2 = 0 hay
1 )T AV1
1 AT AV1
Do đó thực hiện phép nhân ma trận chúng ta có được V T tự, với chú ý rằng σr+1 = . . . = σn = 0, ta cũng có V T (AV2)T AV2 = 0. Vì vậy AV2 = 0. 1 ∈ Rm,r, ta có Với U1 := AV1D−1
= (D−1
= D−1
1 AV1 = (AV1D−1 U T 1 )T V T = (D−1 1 )T D2 1 1 D2 1
= D1.
43
Theo cách chọn ở trên, U := (U1|U2) ∈ Rm,m, U T U = U U T = Im. Do đó
(cid:18) (cid:19)
U T
U T 1
1 U2
= Im hay
U1|U2
= Im.
U T
2 U2
1 U1 U T 2 U1 U T
U T 2
2 AV1)D−1
2 (AV1D−1
2 U1 = 0, suy ra U T
1 ) = 0 hay (U T
1 = 0. Do 2 AV1 = 0. Cuối cùng, vì (vi)i=1,n là hệ trực chuẩn nên ta thu được
Do đó U T vậy U T V T V = V V T = In.
Chú ý 3.1.2.
1) Số r mà ta chọn trong chứng minh của Định lý 3.1.1 chính là rankA.
2) Như ta đã biết, các giá trị riêng của AT A xác định duy nhất, do đó các số
thực σ1, . . . , σn là xác định duy nhất.
Tiếp theo ta có định nghĩa sau
Định nghĩa 3.1.3. [3] Cho A ∈ Rm,n (m ≥ n). Phân tích trong Định lý 3.1.1
được gọi là một phân tích giá trị kỳ dị của ma trận A và các số σ1, . . . , σn được gọi là các giá trị kỳ dị của ma trận A.
Sau đây, chúng tôi sẽ đưa ra những tính chất đơn giản của giá trị kỳ dị.
Hệ quả 3.1.4. [3] Giả sử A ∈ Rm,n và lấy A = U DV T là một phân tích giá trị kỳ dị của A. Ở đây U = (u1| . . . |um) ∈ Rm,m, V = (v1| . . . |vn) ∈ Rn,n, D = diag(σ1, . . . , σr, 0, . . . , 0) và σ1 ≥ . . . ≥ σr > 0. Khi đó
i vi, AAT ui = σ2
i ui với 1 ≤ i ≤ r.
(i) AT Avi = σ2
(ii) Avi = σiui, AT ui = σivi với 1 ≤ i ≤ r.
(iii) rankA = r.
(iv) (cid:104)v1, . . . , vr(cid:105) = N (A)⊥, (cid:104)vr+1, . . . , vn(cid:105) = N (A).
44
(v) (cid:104)u1, . . . , ur(cid:105) = R(A), (cid:104)ur+1, . . . , um(cid:105) = R(A)⊥.
. (vi) (cid:107)A(cid:107) = σ1 = (cid:107)AT (cid:107), (cid:107)A+(cid:107) =
1 σr
r ), rankB = rankC = r.
1, . . . , σ2
Hệ quả 3.1.5. [3] Giả sử A ∈ Rm,n, rankA = r. Khi đó tồn tại các ma trận B ∈ Rm,r, C ∈ Rr,n và các số thực σ1 ≥ . . . ≥ σr > 0 sao cho A = BC, BT B = Ir, CC T = diag(σ2
Chứng minh. Không mất tính tổng quát, ta có thể giả sử m ≥ n. Lấy A = U DV T là một phân tích giá trị kỳ dị. Trong đó U = (u1| . . . |um) ∈ Rm,m, V = (v1| . . . |vn) ∈ Rn,n, D = diag(σ1, . . . , σr, 0, . . . , 0). Khi đó nếu ta đặt B := (u1| . . . |ur), C1 := (v1| . . . |vr), C := diag(σ1, . . . , σr)C T 1 thì chúng ta sẽ thu được điều phải chứng minh.
Kết quả tiếp theo trong phần này chúng ta quan tâm đến nhiễu của giá trị
riêng của một ma trận đối xứng. Chúng ta cần đưa ra kết quả này để hiểu được
các giá trị kỳ dị của một ma trận sẽ bị ảnh hưởng như thế nào bởi các nhiễu
(nhỏ). Ta ký hiệu
:= {V ⊂ Rn : V là một không gian con, dim V ≥ j}.
V n j
Định lý 3.1.6. [3] Cho C ∈ Rn,n là một ma trận đối xứng với các giá trị riêng
λ1 ≥ . . . ≥ λn. Khi đó với k ∈ {1, . . . , n} thì
xT Cx.
λk = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
min x∈V,(cid:107)x(cid:107)=1
n−k+1
xT Cx = max V ∈V n k
Chứng minh.
(i) Đầu tiên chúng ta đi chứng minh đẳng thức thứ nhất
xT Cx.
λk = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
n−k+1
Ta gọi v1, . . . , vn là một hệ trực chuẩn gồm các vectơ riêng ứng với các giá
45
trị riêng λ1, . . . , λn. Ta lấy V ∈ V n n−k+1, suy ra dim V ≥ n − k + 1. Đặt U := (cid:104)v1, v2, . . . , vk(cid:105). Rõ ràng dim U = k nên sử dụng công thức trong
đại số tuyến tính, ta có
dim(U +V ) = dim U +dim V −dim(U ∩V ) ≥ k+(n−k+1)−dim(U ∩V ).
k (cid:88)
Vì dim(U + V ) ≤ n nên dim(V ∩ U ) ≥ 1. Ta lấy
x =
αivi ∈ (V ∩ (cid:104)v1, . . . , vk(cid:105))
i=1
i vj = 0 nếu i (cid:54)= j và vT
i vj = 1 nếu i = j. Do
với (cid:107)x(cid:107) = 1. Để ý rằng vT
k (cid:88)
k (cid:88)
k (cid:88)
k (cid:88)
đó ta có
xT Cx = xT (Cx) = (
αivT
αivi) = (
αivT
αiCvi)
i )(C
i )(
i=1
i=1
i=1 k (cid:88)
k (cid:88)
i=1 k (cid:88)
= (
α2
αivT
αiλivi) =
i )(
i λi.
i=1
i=1
i=1
k (cid:88)
k (cid:88)
Lại có (cid:107)x(cid:107)2 = 1 nên (cid:107)
αivi(cid:107)2 = 1. Do đó
|αi|2(cid:107)vi(cid:107)2 = 1 hay
i=1
i=1
k (cid:88)
α2
i = 1. Từ giả thiết λ1 ≥ . . . ≥ λn, suy ra
i=1
k (cid:88)
k (cid:88)
α2
α2
xT Cx =
i λi ≥
i λk = λk.
i=1
i=1
n (cid:88)
xT Cx. Tiếp theo ta lấy x =
αivi ∈
Suy ra λk ≤ min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
n−k+1
i=k
U
(cid:48) := (cid:104)vk, . . . , vn(cid:105) với (cid:107)x(cid:107) = 1. Vì dim U (cid:48) = n−k+1 nên U (cid:48) ∈ V n
n−k+1.
46
n (cid:88)
Tương tự như chứng minh trên, ta sẽ thu được
xT Cx =
α2
i λi ≤ λk.
i=k
xT Cx. Vậy ta đã chứng minh được đẳng
Do đó λk ≥ min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
n−k+1
thức đầu tiên.
xT Cx, ta thay ma trận C
min x∈V,(cid:107)x(cid:107)=1
(ii) Tiếp theo, để chứng minh λk = max V ∈V n k bởi −C với các giá trị riêng thỏa mãn −λ1 ≤ . . . ≤ −λn. Lấy V ∈ V n k , suy ra dim V ≥ k. Chứng minh tương tự như đối với quá trình đã thực hiện
n (cid:88)
cho đẳng thức thứ nhất ở phần (i), xét U := (cid:104)vk, . . . , vn(cid:105) (dim U = n −
k+1), ta thu được dim(U ∩V ) ≥ 1. Do đó tồn tại x =
αivi ∈ (U ∩V )
i=k
k (cid:88)
và (cid:107)x(cid:107) = 1. Tương tự chứng minh phần (i), ta dễ dàng chỉ ra được rằng n (cid:88)
α2
α2
i = 1 và
i = 1. Khi đó ta nhận được
i=1
i=k
n (cid:88)
xT (−C)x =
α2
i (−λi) ≥ −λk.
i=k
k (cid:88)
xT (−C)x. Với mỗi x =
trong
αivi
i=1
Suy ra −λk ≤ max V ∈V n k
V (cid:48) := (cid:104)v1, . . . , vk(cid:105) ∈ V n
min x∈V,(cid:107)x(cid:107)=1 k và (cid:107)x(cid:107) = 1, ta có
k (cid:88)
xT Cx =
α2
i (−λi) ≤ −λk.
i=1 xT (−C)x. Từ đó suy ra
min x∈V (cid:48),(cid:107)x(cid:107)=1
Do đó −λk ≥ max V (cid:48)∈V n k
xT (−C)x
min x∈V,(cid:107)x(cid:107)=1
−λk = max V ∈V n k
xT Cx.
min x∈V,(cid:107)x(cid:107)=1
hay λk = max V ∈V n k
47
Kết hợp (i) và (ii) ta có điều phải chứng minh của định lý.
Định lý 3.1.7. [3] Cho C, F ∈ Rn,n là các ma trận đối xứng. Ta gọi λ1 ≥ . . . ≥ λn, ϕ1 ≥ . . . ≥ ϕn và µ1 ≥ . . . ≥ µn tương ứng là các giá trị riêng của C, F và C + F . Khi đó với mọi k ∈ {1, . . . , n} thì
(i) λk + ϕn ≤ µk ≤ ϕ1 + λk.
(ii) |λk − µk| ≤ (cid:107)F (cid:107).
Chứng minh. Ta lấy v1, . . . , vn là hệ trực chuẩn gồm các vectơ riêng ứng với các giá trị riêng của ma trận C.
n−k+1, theo kết quả của Định lý 3.1.6 ta có
(i) Với mỗi V ∈ V n
xT (C + F )x.
µk = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
n−k+1
Do đó
xT (C + F )x
µk ≤ max
x∈V,(cid:107)x(cid:107)=1
≤ max
xT Cx + max
xT F x.
x∈V,(cid:107)x(cid:107)=1
x∈V,(cid:107)x(cid:107)=1
n−k+1, ta có
Áp dụng điều này cho không gian V := (cid:104)vk, . . . , vn(cid:105) ∈ V n
xT Cx ≤ λk. Do đó
max x∈V,(cid:107)x(cid:107)=1
µk ≤ λk + max
xT F x = λk + ϕ1
x∈V,(cid:107)x(cid:107)=1
(*) hay µk ≤ λk + ϕ1.
xT (C + F )x suy ra với V (cid:48) ∈ V n k
min x∈V,(cid:107)x(cid:107)=1
Lại có, từ µk = max V ∈V n k
xT (C + F )x
µk ≥ min
x∈V (cid:48) ,(cid:107)x(cid:107)=1
≥ min
xT Cx + min
xT F x
x∈V (cid:48) ,(cid:107)x(cid:107)=1
x∈V (cid:48) ,(cid:107)x(cid:107)=1
48
= min
xT Cx + ϕn.
x∈V (cid:48) ,(cid:107)x(cid:107)=1
xT Cx ≥
k thì min
x∈V (cid:48),(cid:107)x(cid:107)=1
Áp dụng cho không gian V (cid:48) := (cid:104)v1, . . . , vk(cid:105) ∈ V n
(**)
λk. Do đó µk ≥ λk + ϕn.
Từ (∗) và (∗∗) ta suy ra điều phải chứng minh.
(ii) Từ (i) ta có
µk − λk ≤ |ϕ1|
λk − µk ≤ −ϕn ≤ |ϕn|.
Theo định nghĩa (cid:107)F (cid:107) := max{(cid:107)F x(cid:107) : x ∈ Rn, (cid:107)x(cid:107) ≤ 1} nên nếu lấy
xi (cid:54)= 0 với (cid:107)xi(cid:107) ≤ 1 là một vectơ riêng ứng với giá trị riêng ϕi bất kỳ của ma trận F thì
(cid:107)F (cid:107) = max{(cid:107)F xi(cid:107)} = max{(cid:107)ϕixi(cid:107)} = max{|ϕi|(cid:107)xi(cid:107)}.
Suy ra |ϕ1|, |ϕn| ≤ (cid:107)F (cid:107). Do đó |λk − µk| ≤ (cid:107)F (cid:107).
Định lý 3.1.8. [3] Cho A ∈ Rm,n và lấy σ1 ≥ . . . ≥ σn là các giá trị kỳ dị của A. Khi đó với mọi k ∈ {1, . . . , n} ta có
(cid:107)Ax(cid:107).
σk = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
min x∈V,(cid:107)x(cid:107)=1
n−k+1
(cid:107)Ax(cid:107) = max V ∈V n k
1 ≥ . . . ≥ σ2
Chứng minh. Ta đặt C := AT A ∈ Rn,n. Ta đã biết σ2 n là các giá trị riêng của AT A và σ1 ≥ . . . ≥ σn là các giá trị kỳ dị của A. Áp dụng Định lý 3.1.6 cho ma trận C, ta có
xT Cx.
σ2 k = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
min x∈V,(cid:107)x(cid:107)=1
n−k+1
xT Cx = max V ∈V n k
49
Suy ra
xT AT Ax
σ2 k = min V ∈V n
min x∈V,(cid:107)x(cid:107)=1
max x∈V,(cid:107)x(cid:107)=1
xT AT Ax = max V ∈V n k
n−k+1
hay
(cid:107)Ax(cid:107)2.
σ2 k = min V ∈V n
min x∈V,(cid:107)x(cid:107)=1
max x∈V,(cid:107)x(cid:107)=1
(cid:107)Ax(cid:107)2 = max V ∈V n k
n−k+1
(cid:107)Ax(cid:107).
Vậy σk = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
min x∈V,(cid:107)x(cid:107)=1
n−k+1
(cid:107)Ax(cid:107) = max V ∈V n k
Bây giờ để thuận tiện hơn, ta sẽ ký hiệu giá trị kỳ dị của một ma trận C ∈
Rm,n bởi σ1(C), . . . , σn(C) và ta luôn giả sử σ1(C) ≥ . . . ≥ σn(C).
Định lý 3.1.9. [3] Cho A, F ∈ Rm.n. Khi đó với mọi k ∈ {1, . . . , n} thì
|σk(A) − σk(A + F )| ≤ (cid:107)F (cid:107).
Chứng minh.
Áp dụng Định lý 3.1.8, ta có
(cid:107)Ax(cid:107)
σk(A) = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
n−k+1
(cid:107)(A + F )x(cid:107).
σk(A + F ) = min V ∈V n
max x∈V,(cid:107)x(cid:107)=1
n−k+1
Suy ra
(cid:12)(cid:107)Ax(cid:107) − (cid:107)(A + F )x(cid:107)(cid:12) (cid:12) (cid:12)
|σk(A) − σk(A + F )| ≤ min V ∈V n
n−k+1
≤ max
max x∈V,(cid:107)x(cid:107)=1 (cid:12)(cid:107)Ax(cid:107) − (cid:107)(A + F )x(cid:107)(cid:12) (cid:12) (cid:12)
x∈V,(cid:107)x(cid:107)=1
(cid:107)F x(cid:107) = (cid:107)F (cid:107).
≤ max (cid:107)x(cid:107)=1
(cid:107)(A + F )x − Ax(cid:107) = max (cid:107)x(cid:107)=1
50
3.2 Ứng dụng của phương pháp bình phương tối thiểu trong
không gian hữu hạn chiều
Trong chương trước, chúng ta đã nghiên cứu về nghiệm bình phương tối
thiểu cho một phương trình tuyến tính đối với toán tử trong không gian Hilbert
vô hạn chiều. Trong phần này, chúng ta sẽ tiếp tục nghiên cứu về nghiệm bình
phương tối thiểu đối với phương trình tuyến tính của các ma trận thực trong
không gian hữu hạn chiều. Ta sẽ sử dụng một số kết quả và ký hiệu tương ứng
giữa hai chương để người đọc dễ theo dõi mối liên hệ giữa chúng
Chương trước Chương này
Toán tử A Ma trận A
⊥
Toán tử liên hợp A∗ Ma trận chuyển vị AT
R(A)
⊥ = R(A)⊥ = N (A∗) R(A)
= R(A)⊥ = N (AT )
Toán tử giả nghịch đảo A+ Ma trận giả nghịch đảo A+
Q : Y → R(A) là phép chiếu trực giao.
Trong chương này, với A ∈ Rm,n thì
(AT A)−1AT nếu rankA = n,
A+ =
AT (AAT )−1 nếu rankA = m.
Ta xét phương trình
Ax = y
với A ∈ Rm,n, y ∈ Rm cho trước. Giả sử phương trình này không có nghiệm. Mục tiêu của ta là đi tìm một vectơ x ∈ Rn sao cho chuẩn Ơclit (cid:107)Ax − y(cid:107) đạt
giá trị nhỏ nhất. Lúc này ta gọi x là nghiệm bình phương tối thiểu của phương
trình Ax = y.
Định lý 3.2.1. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó
51
(i) Bài toán
min{(cid:107)Ax − y(cid:107) : x ∈ Rn} (∗)
luôn có nghiệm x.
(ii) Nghiệm của bài toán (∗) là xác định duy nhất nếu và chỉ nếu N (A) = {0}.
(iii) Nghiệm của bài toán (*) chính là nghiệm của phương trình
AT Ax = AT y.
Chứng minh. Do A : Rn → Rm nên suy ra R(A), N (A) lần lượt là các không
gian vectơ con của các không gian Hilbert hữu hạn chiều và vì thế chúng là các không gian đóng. Vì vậy R(A) = R(A). Do đó Rm = R(A) ⊕ R(A)⊥. Suy ra với mọi y ∈ Rm, ta có biểu diễn duy nhất y = y1 + y2 với y1 ∈ R(A), y2 ∈ R(A)⊥ và (cid:104)y1, y2(cid:105) = 0.
(i) Ta có (cid:107)Ax − y(cid:107)2 = (cid:107)Ax − y1 − y2(cid:107)2 = (cid:107)Ax − y1(cid:107)2 + (cid:107)y2(cid:107)2 ≥ (cid:107)y2(cid:107)2. Ở đây, ta đã áp dụng Định lý Pythagore với điều kiện Ax − y1 ∈ R(A), y2 ∈ R(A)⊥. Như vậy x sẽ là một nghiệm của (∗) nếu x là một nghiệm của
phương trình Ax = y1. Do y1 ∈ R(A) nên x tồn tại. Vậy bài toán (∗) có
nghiệm.
(ii) Từ ý (i) ta suy ra bài toán (∗) có nghiệm duy nhất khi và chỉ khi phương
trình Ax = y1 có nghiệm duy nhất hay N (A) = {0}.
(iii) Ta gọi x là một nghiệm của (∗). Vì y1 = Ax ∈ R(A) nên y − Ax ∈ R(A)⊥ = N (AT ), suy ra AT (y − Ax) = 0 hay AT y = AT Ax. Vậy x là nghiệm của phương trình AT Ax = AT y.
Định nghĩa 3.2.2. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó một vectơ x ∈ Rn được
gọi là nghiệm bình phương tối thiểu của phương trình Ax = y nếu x là nghiệm của phương trình AT Ax = AT y.
52
Theo kết quả trong trường hợp vô hạn chiều, ta thừa nhận
L(y) := {x ∈ Rn : x là nghiệm bình phương tối thiểu của Ax = y}
là một tập lồi, đóng, khác rỗng trong Rn. Như vậy tồn tại duy nhất một phần tử x∗ ∈ L(y) thỏa mãn
(cid:107)x∗(cid:107) = min{(cid:107)x(cid:107) : x ∈ L(y)}.
Định nghĩa 3.2.3. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó một nghiệm bình
phương tối thiểu x của phương trình Ax = y được gọi là một nghiệm chuẩn tối
thiểu nếu và chỉ nếu
(cid:107)x(cid:107) = min{(cid:107)x(cid:107) : x ∈ L(y)}.
Trong chương này, việc sử dụng các ký hiệu cũng tương tự như trong trường hợp vô hạn chiều ở chương trước. Nghĩa là D(A+) := R(A)⊕R(A)⊥ (D(A+) = Rm) và
A+ : D(A+) → Rn,
y (cid:55)→ x
trong đó x là nghiệm chuẩn tối thiểu của phương trình Ax = y.
Định lý 3.2.4. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó vectơ x := A+y là nghiệm
chuẩn tối thiểu duy nhất của phương trình Ax = y.
Chứng minh. Trong chương trước, chúng ta đã chứng minh được rằng với mọi y ∈ D(A+) thì vectơ x = A+y là nghiệm bình phương tối thiểu có chuẩn nhỏ
nhất và cũng là tồn tại duy nhất của phương trình Ax = y. Trong chương này, do D(A+) = Rm nên vectơ x := A+y sẽ là nghiệm bình phương tối thiểu có
chuẩn nhỏ nhất, tức là nghiệm chuẩn tối thiểu duy nhất của Ax = y.
53
Bây giờ, giả sử ma trận A ∈ Rm,n có phân tích giá trị kỳ dị là A = U DV T như trình bày phần trước. Trong đó U = (u1| . . . |um) ∈ Rm,m, V = (v1| . . . |vn) ∈ Rn,n, D = diag(σ1, . . . , σr, 0, . . . , 0) với σ1 ≥ . . . ≥ σr > 0 và (uj), (vj) lần lượt là các hệ trực chuẩn trong Rm, Rn được chọn như trong trình bày phần trước. Khi đó nếu x+ là nghiệm chuẩn tối thiểu ( hiểu là nghiệm
r (cid:88)
bình phương tối thiểu có chuẩn nhỏ nhất) của phương trình Ax = y thì từ định lý vừa chứng minh ở trên, ta có thể biểu diễn công thức của x+ như sau
x+ = A+y =
σ−1 j (cid:104)y, uj(cid:105)vj.
j=1
Ở đây, để hiểu rõ về phân tích này, chúng ta cần tham khảo Định lý 3.3.1 ở phần
bên dưới trong trường hợp tổng quát vô hạn chiều.
Từ phân tích trên, chúng ta nhận thấy rằng khi giá trị kỳ dị càng nhỏ thì
nghiệm sẽ càng nhạy cảm hơn với sai số. Đồng thời từ công thức trên chúng ta
có thể thấy được rằng phương pháp phân tích giá trị kỳ dị (hay còn gọi tắt là
SV D) chính là một công cụ giải số rất hữu hiệu cho các hệ phương trình đại số
tuyến tính.
Ví dụ 3.2.5. Giải phương trình Ax = y, trong đó
1
1
A =
y =
0
1
−1 1
1 2 4
Phương trình này vô nghiệm. Ta tìm nghiệm x+ = A+y.
√
√
2.
Qua tính toán, ta thu được các giá trị kỳ dị của A là σ1 =
3, σ2 =
54
v1 =
, v2 = 0 1 1 . 0
√
√
√
3
2
1/
1/
1/
√
6 √
.
, u2 =
, u3 =
u1 =
3
1/
6
√
0 √
−2/ √
3
1/
−1/
2
1/
6
Suy ra
−3/2
x+ = A+y = σ−1
1 (cid:104)y, u1(cid:105)v1 + σ−1
2 (cid:104)y, u2(cid:105)v2 =
.
7/3
3.3 Ứng dụng của phân tích kỳ dị trong nghiên cứu bài toán
ngược
Ta vẫn xét A : X → Y là toán tử compact giữa hai không gian Hilbert
X, Y . Gọi (σj, ej, fj)j∈J là một hệ kỳ dị của A.
Để giải phương trình Ax = y, đầu tiên chúng ta đã đưa ra định nghĩa về nghiệm suy rộng x+ = A+y trong phần trình bày ở chương trước. Chúng ta
hiểu rằng đây cũng chính là việc đi giải ngược một bài toán. Chính vì vậy, để
thấy rõ hơn mối liên hệ của phân tích giá trị kỳ dị trong giải bài toán ngược,
chúng ta sẽ đi vào một kết quả quan trọng sau.
Định lý 3.3.1. [3] Cho A : X → Y là một toán tử compact giữa hai không
55
∞ (cid:88)
∞ (cid:88)
gian Hilbert X, Y và (σj, ej, fj)j∈J là một hệ kỳ dị của A. Khi đó
A+y =
σ−1 j (cid:104)Qy, fj(cid:105)ej =
j (cid:104)y, fj(cid:105)ej, y ∈ D(A+). σ−1
j=1
j=1
Chứng minh. Nhận thấy Qy ∈ R(A) vì y ∈ D(A+). Do đó theo tiêu chuẩn
∞ (cid:88)
Picard chứng minh ở chương trước, ta có
|(cid:104)Qy, fj(cid:105)|2 < ∞.
σ−2 j
j=1
Vì fj ∈ R(A) với mọi j ∈ N nên
(cid:104)Qy, fj(cid:105) = (cid:104)y, Qfj(cid:105) = (cid:104)y, fj(cid:105).
∞ (cid:88)
∞ (cid:88)
Từ đó ta suy ra các chuỗi
σ−1 j (cid:104)Qy, fj(cid:105)ej,
σ−1 j (cid:104)y, fj(cid:105)ej
j=1
j=1
∞ (cid:88)
hội tụ. Do ej ∈ N (A)⊥, suy ra vectơ
x :=
σ−1 j (cid:104)Qy, fj(cid:105)ej
j=1
∞ (cid:88)
∞ (cid:88)
cũng thuộc N (A)⊥. Hơn nữa
Ax =
(cid:104)Qy, fj(cid:105)fj = Qy
σ−1 j (cid:104)Qy, fj(cid:105)Aej =
j=1
j=1
: j ∈ N} = R(A) (theo Định lý 2.2.10). Vì do Qy ∈ R(A) và span{fj vậy x là một nghiệm bình phương tối thiểu của Ax = y trong N (A)⊥ hay x = A+y.
Tiếp theo, chúng tôi sẽ trình bày ví dụ một cách chi tiết để người đọc hình
56
dung rõ hơn về ứng dụng của phân tích kỳ dị trong giải bài toán ngược.
Xét
A : (L2([0, 1]), (cid:107).(cid:107)2) → (L2([0, 1]), (cid:107).(cid:107)2),
x (cid:55)→ Ax
trong đó
Ax : [0, 1] → R (cid:90) t
t (cid:55)→
x(s)ds.
0
Ta sẽ chỉ ra rằng A được xác định, tuyến tính và liên tục. Trước hết ta xét bổ đề
sau
Bổ đề 3.3.2. Cho a < b, u ∈ L2([a, b]). Khi đó
(cid:90) b (cid:90) b
√
≤
b − a(cid:107)u(cid:107)L2([a,b]).
a
a
(cid:12)u(t)(cid:12) (cid:12) (cid:12) dt ≤ (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) u(t)dt (cid:12) (cid:12)
Chứng minh. Bất đẳng thức đầu tiên là cơ bản. Ta chứng minh bất đẳng thức
thứ hai (cid:90) b
√
b − a(cid:107)u(cid:107)L2([a,b]).
a
(cid:12)u(t)(cid:12) (cid:12) (cid:12) dt ≤
Thật vậy theo bất đẳng thức H¨older thì
(cid:90) b (cid:90) b
a
a (cid:115)
(cid:12) .1dt (cid:12)u(t)(cid:12) (cid:12) (cid:12) dt = (cid:12)u(t)(cid:12) (cid:12)
(cid:115) (cid:90) b (cid:90) b
≤
2 dt.
12dt
a
a
(cid:12)u(t)(cid:12) (cid:12) (cid:12)
√
=
b − a(cid:107)u(cid:107)L2([a,b]).
57
Trở lại bài toán, ta có với x ∈ L2([0, 1]) thì
(cid:90) t
Ax(t) =
x(s)ds ∀t ∈ [0, 1] ,
0
từ đó sử dụng Bổ đề 3.3.2 ta có
(cid:33)2 (cid:90) 1 (cid:90) 1 (cid:32)(cid:90) t
(Ax(t))2dt =
x(s)ds
dt
0
0
0 (cid:90) 1
≤
(cid:107)x(cid:107)2
L2([0,t])tdt
0 (cid:90) 1
≤
(cid:107)x(cid:107)2
L2([0,1])tdt
=
L2([0,1]) < ∞.
0 1 (cid:107)x(cid:107)2 2
Vì x ∈ L2([0, 1]) nên Ax ∈ L2([0, 1]), điều này có nghĩa là A được xác định.
0 (Ax(t))2dt ≤ 1
2(cid:107)x(cid:107)2
Dễ thấy A(α1x1 + α2x2) = α1Ax1 + α2Ax2 ∀α1, α2 ∈ R, ∀x1, x2 ∈ L2([0,1]) với
L2([0, 1]). Do đó A tuyến tính. Ngoài ra từ (cid:82) 1 mọi x ∈ L2([0, 1]), suy ra
(cid:107)Ax(cid:107)L2([0,1]) ≤
(cid:107)x(cid:107)L2([0,1])
1 √ 2
. với mọi x ∈ L2([0, 1]). Vậy A liên tục và (cid:107)A(cid:107) ≤ 1√ 2
Tóm lại việc định nghĩa A đã rõ ràng, ngoài ra A còn là tuyến tính liên tục. Ta có bài toán ngược như sau: Cho y ∈ L2([0, 1]), liệu có tồn tại x ∈ L2([0, 1])
mà Ax = y? Dựa trên kiến thức đã trình bày trong luận văn, ta có thể giải bài
toán bình phương tối thiểu tương ứng. Cụ thể hơn, ta sẽ chỉ ra A compact, từ đó tính A∗, hệ kỳ dị của A và A+.
Chứng minh A compact:
Ta lấy dãy (xn)n trong L2([0, 1]) bị chặn, nghĩa là tồn tại M > 0 sao cho (cid:107)xn(cid:107)L2([0,1]) ≤ M với mọi n ∈ N. Ta sẽ chỉ ra dãy (Axn)n có dãy con hội tụ
58
bằng cách áp dụng Định lý Arzelà-Ascoli.
Xét x tùy ý thuộc L2([0, 1]) mà (cid:107)x(cid:107)L2([0,1]) ≤ M , ta có
(cid:90) t2 (cid:90) t1
x(s)ds −
x(s)ds
0
0 (cid:90) t2
(cid:12)Ax(t1) − Ax(t2)(cid:12) (cid:12) (cid:12) = (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)
=
x(s)ds
t1
(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) √
≤
t1 − t2(cid:107)x(cid:107)L2([t2,t1])
√
≤
t1 − t2(cid:107)x(cid:107)L2([0,1]) √
≤ M
t1 − t2
với mọi 0 ≤ t2 < t1 ≤ 1. Do x là tùy ý thuộc L2([0, 1]) sao cho (cid:107)x(cid:107)L2([0,1]) ≤ M , ta suy ra dãy (Axn)n là đồng liên tục đều, nói riêng Axn ∈ C 0([0, 1]), ∀n. Ngoài ra từ bất đẳng thức trên, cho t2 = 0 và 0 < t1 = t ≤ 1, ta nhận được
√
|Ax(t)| ≤ M
t ≤ M,
chú ý là Ax(0) = 0. Suy ra dãy (Axn)n bị chặn điểm (thậm chí bị chặn đều) bởi Axn(0) = 0, ∀n còn |Axn(t)| ≤ M, ∀0 < t ≤ 1, ∀n. Theo Định lý Arzelà- Ascoli, (Axn)n có dãy con hội tụ về một hàm thuộc C 0([0, 1]) theo chuẩn (cid:107).(cid:107)∞. Hiển nhiên kết quả hội tụ thuộc C 0([0, 1]) nên cũng thuộc L2([0, 1]); và dãy hội tụ theo chuẩn (cid:107).(cid:107)∞ của C 0([0, 1]) thì cũng hội tụ theo chuẩn (cid:107).(cid:107)2 của L2([0, 1]).
Ta tính liên hợp A∗:
Bổ đề 3.3.3.
(cid:90) 1 (cid:90) t (cid:90) 1 (cid:90) 1
f (t)
g(s)dsdt =
g(s)
f (t)dtds,
0
0
0
s
trong đó f, g là các hàm khả tích trên [0, 1].
Chứng minh. Ta dùng Định lý Fubini.
59
Để ý rằng tập
T = {(s, t) ∈ R2 : 0 ≤ t ≤ 1, 0 ≤ s ≤ t}
được viết lại tương đương
T = {(s, t) ∈ R2 : 0 ≤ s ≤ 1, s ≤ t ≤ 1}.
Áp dụng Định lý Fubini, ta có điều phải chứng minh.
Bây giờ ta dùng bổ đề trên để tính A∗. Ta có với x ∈ X = L2([0, 1]) và
z ∈ Y = L2([0, 1]) thì
(cid:90) 1 (cid:90) t (cid:90) 1 (cid:90) 1
z(t)
x(s)dsdt =
x(s)
z(t)dtds.
(cid:104)Ax, z(cid:105)L2([0,1]) =
0
0
0
s
s z(t)dt với mọi s ∈ [0, 1].
Suy ra A∗z(s) = (cid:82) 1
Cuối cùng ta tính hệ kỳ dị của A:
Xét σ > 0 mà A∗Ax = σ2x. Điều này có nghĩa là
(cid:90) 1 (cid:90) τ
σ2x(t) =
x(s)dsdτ, ∀t ∈ [0, 1] . (1)
t
0
Từ (1) ta có x(1) = 0. Đạo hàm hai vế của (1) theo t, ta được
(cid:90) t
σ2x(cid:48)(t) = −
x(s)ds, ∀t ∈ [0, 1] . (2)
0
Từ (2) ta có x(cid:48)(0) = 0. Đạo hàm hai vế của (2) theo t, ta được
σ2x(cid:48)(cid:48)(t) = −x(t), ∀t ∈ [0, 1] . (3)
Phương trình (3) là phương trình vi phân cơ bản, nghiệm của nó có dạng
(cid:19) (cid:19)
x(t) = α cos
+ β sin
,
t ∈ [0, 1] .
(cid:18) t σ (cid:18) t σ
60
(cid:19)
=
= 0, suy ra
+ kπ (k ∈ Z). Do σ > 0 nên
Từ x(1) = 0 ta có cos Từ x(cid:48)(0) = 0 ta có β = 0. (cid:18) 1 σ
1 σ
π 2
2
=
.
ta lấy
+ jπ (j ∈ N), hay σj =
π 2
π(2j + 1)
1 σj
(cid:32) (cid:33)
, t ∈ [0, 1] thì
Xét ej(t) = αj cos
t σj
(cid:33) (cid:32) (cid:90) 1/σj (cid:90) 1
.
dt
v=t/σj= α2
cos2
cos2 vdv =
(cid:107)ej(cid:107)2
j σj
L2([0,1]) = α2 j
α2 j 2
t σj
0
0
√
2. Từ đó
Do vậy, để đảm bảo (cid:107)ej(cid:107)L2([0,1]) = 1, ta có thể lấy αj =
(cid:32) (cid:33) (cid:32) (cid:33)
√
(t) =
2 sin
, t ∈ [0, 1].
fj(t) = A
ej σj
t σj
Vậy hệ kỳ dị của A là
(cid:32) (cid:33) (cid:32) (cid:33)
√
√
2 cos
2 sin
.
σj =
, ej(t) =
, fj(t) =
2 π(2j + 1)
t σj
t σj
∞ (cid:88)
Cuối cùng với y ∈ D(A+), Định lý 3.3.1 nói rằng:
A+y =
σ−1 j (cid:104)y, fj(cid:105)L2([0,1])ej
j=1
trong đó σj, ej, fj được xác định như trên.
61
KẾT LUẬN CHUNG
Trong luận văn này, chúng tôi đã trình bày một số vấn đề như sau:
- Hệ thống lại một số kiến thức cơ sở của Giải tích hàm thông qua việc nhắc
lại những định nghĩa, tính chất quan trọng để phục vụ cho luận văn.
- Trình bày một số định nghĩa, tính chất của nghiệm bình phương tối thiểu,
nghịch đảo suy rộng, đồng thời chứng minh và đưa ra được ý nghĩa quan trọng
của tiêu chuẩn Picard.
- Trình bày phương pháp phân tích giá trị kỳ dị cho ma trận thực cũng như
đưa ra một số ứng dụng của phương pháp bình phương tối thiểu trong đại số
tuyến tính và giải bài toán ngược.
Tài liệu tham khảo
[1] Hoàng Tụy, Hàm thực và Giải tích hàm, Nhà xuất bản Giáo dục Việt
Nam, 2017.
[2] Phạm Kỳ Anh - Trần Đức Long, Giáo trình Hàm thực và Giải tích
hàm, Nhà xuất bản Đại học Quốc gia Hà Nội, 2001.
[3] J. Baumeister, Stable Solution of Inverse Problems, Friedr. Vieweg &
Sohn, Braunschweig/Wiesbaden, 1987.
[4] H. Engl, M. Hanke, and A. Neubauer. Regularization of Inverse Prob-
lems. Kluwer Acadademics, Dordrecht, Netherlands, 1996.
[5] A. Kirsch, An Introduction to the Mathematical Theory of Inverse
62
Problems, 2011.