BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC

VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ − − − − − − − − − − − − − − − − − − −−

Lê Thị Ngọc Quỳnh

PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI THIỂU

LUẬN VĂN THẠC SĨ TOÁN HỌC

Hà Nội - 2020

BỘ GIÁO DỤC VIỆN HÀN LÂM KHOA HỌC

VÀ ĐÀO TẠO VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ − − − − − − − − − − − − − − − − − − −−

Lê Thị Ngọc Quỳnh

PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI THIỂU

Chuyên ngành: Toán Giải tích

Mã số: 8 46 01 02

LUẬN VĂN THẠC SĨ TOÁN HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC: GS. TSKH. ĐINH NHO HÀO

Hà Nội - 2020

LỜI CAM ĐOAN

Tôi xin cam đoan những gì viết trong luận văn là do sự tìm tòi, học hỏi của

bản thân và sự hướng dẫn tận tình của thầy Đinh Nho Hào. Mọi kết quả nghiên

cứu cũng như ý tưởng của tác giả khác, nếu có đều được trích dẫn cụ thể. Đề tài

luận văn này cho đến nay chưa được bảo vệ tại bất kỳ một hội đồng bảo vệ luận

văn thạc sĩ nào và cũng chưa hề được công bố trên bất kỳ một phương tiện nào.

Tôi xin chịu trách nhiệm về những lời cam đoan.

Hà Nội, tháng 11 năm 2020.

Học viên

Lê Thị Ngọc Quỳnh

LỜI CẢM ƠN

Đầu tiên, tôi xin được tỏ lòng biết ơn sâu sắc nhất của mình tới GS. TSKH.

Đinh Nho Hào, người trực tiếp hướng dẫn tôi tìm ra hướng nghiên cứu. Luận

văn này được hoàn thành dưới sự hướng dẫn tận tình của thầy trong một thời

gian dài. Thầy đã luôn quan tâm, giúp đỡ, động viên tôi trong suốt quá trình học

tập và nghiên cứu.

Tôi xin chân thành cảm ơn các thầy cô, anh chị, bạn bè của Viện Toán học

vì sự giúp đỡ, góp ý và tạo điều kiện trong quá trình học tập, nghiên cứu để tôi

thực hiện tốt luận văn của mình.

Tôi cũng xin trân trọng cảm ơn sự giúp đỡ và tạo điều kiện thuận lợi của cơ

sở đào tạo là Học viện Khoa học và Công nghệ, Viện Hàn lâm Khoa học và

Công nghệ Việt Nam trong quá trình thực hiện luận văn.

Đặc biệt, tôi xin cảm ơn gia đình, người thân và bạn bè đã luôn sát cánh,

động viên và khích lệ tôi trong suốt quá trình học tập và nghiên cứu.

Hà Nội, tháng 11 năm 2020.

Học viên

Lê Thị Ngọc Quỳnh

Mục lục

Lời cam đoan

Lời cảm ơn

Mục lục

MỞ ĐẦU 1

1 Một số kiến thức cơ sở 2

2 Phương pháp bình phương tối thiểu 11

2.1 Nghiệm bình phương tối thiểu của phương trình toán tử và một

số tính chất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2 Phân tích giá trị kỳ dị . . . . . . . . . . . . . . . . . . . . . . . 21

2.2.1 Toán tử compact . . . . . . . . . . . . . . . . . . . . . . 21

2.2.2 Phổ của toán tử compact tự liên hợp . . . . . . . . . . . . 23

2.2.3 Phân tích giá trị kỳ dị . . . . . . . . . . . . . . . . . . . . 30

2.3 Tiêu chuẩn Picard . . . . . . . . . . . . . . . . . . . . . . . . . 36

3 Ứng dụng của phương pháp bình phương tối thiểu 40

3.1 Phân tích giá trị kỳ dị cho ma trận . . . . . . . . . . . . . . . . . 40

3.2 Ứng dụng của phương pháp bình phương tối thiểu trong không

gian hữu hạn chiều . . . . . . . . . . . . . . . . . . . . . . . . 50

3.3 Ứng dụng của phân tích kỳ dị trong nghiên cứu bài toán ngược . . 54

Kết luận 61

Tài liệu tham khảo 62

1

MỞ ĐẦU

Giải tích số hay còn gọi là phương pháp số là một môn khoa học thuộc

lĩnh vực Toán ứng dụng, nhằm mục đích nghiên cứu cách giải gần đúng các

phương trình, các bài toán xấp xỉ, các bài toán tối ưu, . . .. Trong việc giải gần

đúng nghiệm của phương trình, tôi xin đề cập trong luận văn này của mình

phương pháp bình phương tối thiểu cho việc giải hệ phương trình tuyến tính.

Bình phương tối thiểu tuyến tính là một kỹ thuật để xấp xỉ một nghiệm gần

đúng cho một hệ phương trình tuyến tính với các dữ kiện không chính xác cũng

như được ứng dụng rộng rãi trong thống kê. Hệ phương trình trong trường hợp

đang xét này thường là hệ mà có số phương trình lớn hơn số biến.

Các bài toán bình phương tối thiểu được chia thành hai loại: bình phương tối

thiểu tuyến tính và bình phương tối thiểu phi tuyến. Trong luận văn này, tôi chỉ

nghiên cứu về phương pháp bình phương tối thiểu cho hệ phương trình tuyến

tính. Cụ thể là, chúng tôi sẽ tập trung trình bày một cách hệ thống một số tính

chất của nghiệm bình phương tối thiểu, phương pháp phân tích giá trị kỳ dị và

một số ứng dụng trong đại số tuyến tính và giải bài toán ngược. Luận văn được

chia làm ba chương như sau:

Chương 1: Chương này chúng tôi sẽ nhắc lại một số định nghĩa, định lý và

tính chất quan trọng của Giải tích hàm phục vụ cho luận văn này.

Chương 2: Nội dung phần này trình bày định nghĩa, tính chất của nghiệm

bình phương tối thiểu, nghịch đảo suy rộng và chứng minh tiêu chuẩn Picard,

cái có mối liên hệ quan trọng với phương pháp bình phương tối thiểu và trong

việc phân tích giá trị kỳ dị.

Chương 3: Trong chương này, chúng tôi trình bày ứng dụng của phương pháp

bình phương tối thiểu trong đại số tuyến tính và bài toán ngược.

CHƯƠNG 1

Một số kiến thức cơ sở

Trong chương này chúng tôi trình bày một số khái niệm và tính chất quan

trọng của Giải tích hàm để hỗ trợ cho các phần sau. Một số tính chất và định lý

khác chưa được đề cập trong chương này thì chúng tôi sẽ nêu một cách xen kẽ

trong các chương tiếp theo.

Định nghĩa 1.0.1. [1], [2] Cho không gian vectơ X trên trường K = R. Một

ánh xạ được cho bởi

(cid:107).(cid:107) : X → K,

x (cid:55)→ (cid:107)x(cid:107)

được gọi là một chuẩn trên X nếu thỏa mãn các tính chất sau:

(i) (cid:107)x + y(cid:107) ≤ (cid:107)x(cid:107) + (cid:107)y(cid:107) với mọi x, y ∈ X.

(ii) (cid:107)αx(cid:107) = |α|(cid:107)x(cid:107)với mọi x ∈ X, α ∈ K.

(iii) (cid:107)x(cid:107) ≥ 0 với mọi x ∈ X và (cid:107)x(cid:107) = 0 nếu x = 0.

Khi đó không gian vectơ X với một chuẩn như ở trên sẽ được gọi là không

gian định chuẩn. Hơn nữa, không gian định chuẩn X sẽ được gọi là không gian

Banach nếu mọi dãy cơ bản (dãy Cauchy) trong X hội tụ tới một điểm trong X,

2

hay nói cách khác X là không gian định chuẩn đầy đủ.

3

Định nghĩa 1.0.2. [1], [2] Cho không gian vectơ X trên trường K (K = R hoặc C). Một ánh xạ được cho bởi

(cid:104).(cid:105) : X × X → K,

(x, y) (cid:55)→ (cid:104)x, y(cid:105)

được gọi là một tích vô hướng trên X nếu thỏa mãn các tính chất sau

(i) (cid:104)x, y(cid:105) = (cid:104)y, x(cid:105) với mọi x, y ∈ X.

(ii) (cid:104)x + y, z(cid:105) = (cid:104)x, z(cid:105) + (cid:104)y, z(cid:105) với mọi x, y, z ∈ X.

(iii) (cid:104)αx, y(cid:105) = α(cid:104)x, y(cid:105) với mọi x, y ∈ X và α ∈ K.

(iv) (cid:104)x, x(cid:105) ≥ 0 với mọi x ∈ X và (cid:104)x, x(cid:105) = 0 nếu x = 0.

Một không gian vectơ X trên trường K cùng với một tích vô hướng trên X như

trên được gọi là không gian tiền Hilbert. Từ đó ta có định nghĩa về không gian

Hilbert chính là một không gian tiền Hilbert mà đồng thời cũng là một không gian Banach với chuẩn (cid:107)x(cid:107) = (cid:112)(cid:104)x, x(cid:105), ∀x ∈ X.

Định nghĩa 1.0.3. [1], [2] Một tập M trong không gian metric X được gọi

là compact nếu mọi dãy trong M đều chứa một dãy con hội tụ tới một điểm

thuộc M . Từ đó ta có tính chất: một tập compact trong không gian metric thì sẽ

đóng và hoàn toàn bị chặn, nhưng mệnh đề ngược thì chưa chắc đúng, ví dụ đơn

giản như hình cầu đóng trong không gian định chuẩn vô hạn chiều thì không

compact. Tập M được gọi là compact tương đối (hay tiền compact) nếu như bao

đóng của nó là compact. Nói cách khác, M được gọi là compact tương đối nếu

mọi dãy trong M đều chứa một dãy con hội tụ trong không gian X. Tập M sẽ

được gọi là hoàn toàn bị chặn nếu với mọi ε > 0 cho trước, bao giờ cũng tồn tại

một phủ gồm hữu hạn các hình cầu mở (Si) với bán kính ε chứa M . Và ta có

tính chất là một tập hoàn toàn bị chặn thì sẽ bị chặn.

4

Định lý 1.0.4. [1] Định lý Heine-Borel: Một tập M trong không gian metric X

được gọi là compact nếu và chỉ nếu mọi phủ mở của M đều chứa một phủ con

k∈I Ak (cid:54)= ∅, và do đó X \ (cid:83)

k∈I(X \ Ak) = X \ (cid:83)

hữu hạn vẫn chứa M .

Chứng minh. Giả sử M có tính chất Heine-Borel. Xét một dãy bất kì (xn) ⊂ M . Với mỗi k = 1, 2, . . ., kí hiệu Ak = {xn : n ≥ k}. Cho Ak là bao đóng của Ak và Gk = X \ Ak. Với mỗi tập hữu hạn I ⊂ {1, 2, . . .}, rõ ràng (cid:84) k∈I Ak (cid:54)= ∅, cho nên (cid:84) k∈I Gk (cid:54)= ∅, tức là hợp các tập mở Gk (k ∈ I) không phủ được X. Vì điều này đúng với mọi họ hữu hạn {Gk, k ∈ I} nên theo tính chất Heine-Borel thì cả họ cũng không thể phủ được M . Vậy phải có x (cid:54)∈ Gk = X \ Ak, tức là x ∈ Ak ∀k = 1, 2, . . .. Từ đây dễ dàng suy ra một dãy con (xnk) hội tụ. Thật vậy, với mỗi k, vì x ∈ Ak nên hình cầu tâm x bán kính 1/k phải chứa một xnk ∈ (xn). Ta có d(xnk, x) ≤ 1/k → 0 khi k → ∞. Vậy M compact.

Để chứng minh phần đảo, giả sử M compact nhưng có một phủ mở {Gα}

không chứa một phủ con hữu hạn nào. Ta lấy một dãy bất kỳ các số dương

εn → 0. Vì M compact nên nó có thể phủ bằng một số hữu hạn hình cầu bán kính ε1. Trong số các hình cầu này ắt phải có một hình cầu, giả sử là S1 sao cho M1 = M (cid:84) S1 không thể phủ được bằng một số hữu hạn tập Gα (nếu không thì M sẽ phủ được bằng một số hữu hạn tập Gα). Tập M1 cũng compact (vì là tập

con đóng của một tập compact) nên có thể phủ được bằng một số hữu hạn các (cid:84) S2 hình cầu bán kính ε2, trong số đó có một cái, giả sử S2 sao cho M2 = M1 không thể phủ được bằng một số hữu hạn tập Gα. Tập M2 cũng là compact nên có thể phủ được bằng một số hữu hạn hình cầu bán kính ε3. Tiếp tục như thế, (cid:84) Sn (n = 1, 2, . . .). ta sẽ thu được một dãy hình cầu Sn và tập Mn = Mn−1 Ta lấy trong mỗi tập Mn một điểm xn. Dĩ nhiên Mn ⊂ Mn−1 ⊂ . . . ⊂ M nên xn ∈ M và vì M compact nên có một dãy con (xnk) hội tụ tới một điểm x0 ∈ M . Ta có x0 ∈ Gα0 nào đó và do Gα0 mở nên có một hình cầu K tâm x0 và nằm trọn trong Gα0. Gọi r là bán kính của K, ta chọn k0 đủ lớn

5

) < r/2 và εnk0

< r/4. Khi đó với mọi x ∈ Mnk0 + r/2 < r, chứng tỏ Mnk0

, x0) < 2εnk0

, d(x, x0) ≤ ⊂ K ⊂ Gα0, nghĩa ) + d(xnk0 có thể phủ bằng một tập Gα0, trái với cách xây dựng của nó. Vậy mọi

để d(x0, xnk0 d(x, xnk0 là Mnk0 phủ của M phải có một phủ con hữu hạn.

Định lý 1.0.5. [1] Định lý Hausdorff: Trong một không gian metric đầy đủ

(nghĩa là mọi dãy Cauchy đều hội tụ tới một điểm trong không gian ban đầu),

một tập là compact nếu và chỉ nếu nó đóng và hoàn toàn bị chặn.

Chứng minh.

1) Ta đã biết một tính chất là tập compact thì phải đóng. Bây giờ giả sử tập

M compact nhưng không hoàn toàn bị chặn. Thế thì có một ε > 0 nào

đó sao cho không thể nào phủ được M bằng một số hữu hạn hình cầu

bán kính ε. Lấy một điểm bất kỳ x1 ∈ M . Hình cầu tâm x1 bán kính ε không phủ được M , cho nên có ít nhất một điểm x2 ∈ M với khoảng cách d(x1, x2) ≥ ε. Hai hình cầu tâm x1 và x2 bán kính ε cũng không phủ được M , cho nên có ít nhất một điểm x3 ∈ M sao cho d(x1, x3) ≥ ε và d(x2, x3) ≥ ε. Tiếp tục cách đó ta sẽ được một dãy xn ∈ M với d(xn, xm) ≥ ε (n (cid:54)= m; n, m = 1, 2, . . .). Rõ ràng bất cứ dãy con nào của (xn) cũng không thể là dãy cơ bản, do đó không thể hội tụ. Như vậy mâu thuẫn với giả thiết M compact. Vậy M phải đóng và hoàn toàn bị chặn.

2) Ngược lại, giả sử tập M đóng và hoàn toàn bị chặn trong một không gian

đầy đủ X và xét một dãy vô hạn bất kì σ = (xn) ⊂ M . Vì tập M có

thể phủ được bằng một số hữu hạn hình cầu bán kính 1, nên một trong

các hình cầu này, chẳng hạn S1, phải chứa vô số phần tử của dãy σ. Gọi dãy con của dãy σ chứa trong S1 là σ1. Tập hợp M cũng có thể phủ được bằng một số hữu hạn hình cầu bán kính 1/2, nên một trong các hình cầu

này, giả sử S2, phải chứa vô số phần tử của σ1. Gọi dãy con của σ1 chứa trong S2 là σ2. Tiếp tục theo cách đó ta sẽ có các dãy σ1, σ2, σ3, . . . với

6

σ ⊃ σ1 ⊃ σ2 ⊃ ... và σk ⊂ Sk (k = 1, 2, . . .), trong đó Sk là hình cầu bán kính 1/k. Vì mỗi dãy σk có vô số phần tử nên có thể chọn trong σ1 một phần tử xn1, rồi trong σ2 một phần tử xn2 với n2 > n1, trong σ3 một phần tử xn3 với n3 > n2 và cứ thế tiếp tục quá trình. Dãy (xnk) là một dãy con của σ = (xn), và có thể thấy rằng đó là một dãy hội tụ trong X. Thật vậy với k < l thì σl ⊂ σk ⊂ Sk nên xnl, xnk cùng thuộc hình cầu Sk do đó d(xnl, xnk) < 2/k → 0 khi k, l → ∞, chứng tỏ rằng (xn) là một dãy cơ bản, tức hội tụ vì theo giả thiết X là không gian đủ. Tóm lại mọi dãy

(xn) ⊂ M đều chứa một dãy con hội tụ. Vì M là tập đóng nên giới hạn của dãy con này thuộc M . Vậy M là tập compact.

Định lý 1.0.6. Cho X, Y là các không gian định chuẩn. T là toán tử tuyến tính

đi từ X vào Y . Khi đó, T là compact nếu và chỉ nếu mọi dãy (xn) bị chặn trong X đều chứa một dãy con (xnk) sao cho dãy (T xnk) hội tụ trong Y .

Chứng minh.

(i) Giả sử (xn)n∈N ⊂ X bị chặn. Để T compact thì dãy (T xn)n∈N phải com- pact tương đối trong Y . Theo giả thiết, (xn)n∈N chứa dãy con (xnk) sao cho (T xnk) ⊂ (T xn)n∈N và (T xnk) hội tụ trong Y . Sử dụng định nghĩa về compact tương đối, ta suy ra T là toán tử compact.

(ii) Giả sử T compact. Lấy (xn)n∈N bị chặn trong X, suy ra dãy (T xn)n∈N compact tương đối trong Y . Do đó từ dãy (xn)n∈N, ta sẽ trích ra được một dãy con (xnk) mà (T xnk) ⊂ (T xn)n∈N và (T xnk) hội tụ trong Y .

Sau đây chúng tôi sẽ đưa ra một tiêu chuẩn để chứng minh một tập là com-

pact. Chúng tôi phát biểu lại Định lý Arzelà-Ascoli ở dạng đơn giản như sau: Cho D là tập con compact trong Rn. Xét (C 0(D), (cid:107).(cid:107)∞). Giả sử dãy hàm {fn}n∈N ⊂ C 0(D) thỏa mãn hai tính chất: (i) Bị chặn điểm trên D, tức với ∀x ∈ D, tập {fn(x)}n∈N là bị chặn;

7

(cid:107).(cid:107)∞−→ f khi n → ∞.

(ii) Đồng liên tục đều, tức ∀(cid:15) > 0, ∀x ∈ D, ∃δ = δ(x, (cid:15)) > 0 sao cho với ∀n ∈ N, ∀y ∈ B(x, δ) ∩ D ta luôn có |fn(y) − fn(x)| ≤ (cid:15). Khi ấy tồn tại dãy con {fϕ(n)}n∈N (trong đó ϕ : N → N là hàm tăng) và hàm f ∈ C 0(D) sao cho fϕ(n) Các bước chứng minh:

• Bước 1. Chỉ ra thực chất dãy hàm {fn}n∈N là đồng liên tục đều.

n→∞−→ um

• Bước 2. Lấy A = D ∩ Qn là tập con trù mật đếm được của D. Sử dụng

∞ đúng với mọi m ∈ N.

ϕ(n)

kỹ thuật "diagonal extraction" để chỉ ra có một dãy ϕ(n) chung cho mọi x ∈ A mà fϕ(n)(x) n→∞−→ f (x), ở đây f (x) là kết quả giới hạn dãy. Diagonal extraction: Giả sử có họ đếm được các dãy {um}m∈N, trong đó n }n∈N, thỏa mãn tính chất ∀m ∈ N dãy um có một dãy con dãy um = {um hội tụ đến điểm mà ta ký hiệu là um ∞. Khi ấy có thể chọn dãy chỉ số chung cho tất cả các dãy con mà vẫn đảm bảo kết quả hội tụ cho mỗi dãy, tức tồn tại hàm ϕ : N → N tăng sao cho um

• Bước 3. Mở rộng từ A lên D để có fϕ(n)(x) n→∞−→ f (x) với mọi x ∈ D, ở đây f (x) là kết quả giới hạn dãy. Tức dãy {fϕ(n)}n∈N là hội tụ điểm trên D.

• Bước 4. Chỉ ra f là liên tục đều và dãy {fϕ(n)}n∈N là hội tụ đều về f trên

D.

Định lý 1.0.7. [1], [2] Định lý Riesz trong không gian Hilbert: Mọi phiếm hàm tuyến tính liên tục f ánh xạ một không gian Hilbert X vào trường K (K = R hoặc C) đều biểu diễn được một cách duy nhất dưới dạng

f (x) = (cid:104)x, a(cid:105),

với mọi x ∈ X và a là phần tử thuộc X thỏa mãn (cid:107)f (cid:107) = (cid:107)a(cid:107).

Bây giờ, chúng tôi đề cập thêm về hệ trực chuẩn và bất đẳng thức Bessel.

8

∞ (cid:88)

Gọi (en)n∈N là một hệ trực chuẩn của không gian Hilbert X ( nghĩa là nó là một hệ trực giao và được chuẩn hóa (cid:107)en(cid:107) = 1 với mọi n ∈ N ). Khi đó, với mọi x ∈ X, ta có bất đẳng thức Bessel như sau

|(cid:104)x, en(cid:105)|2 ≤ (cid:107)x(cid:107)2 = (cid:104)x, x(cid:105).

n=1

Hệ (en)n∈N này sẽ được gọi là hệ trực chuẩn đầy đủ khi chỉ có vectơ 0 mới trực giao với tất cả các phần tử của hệ. Khi ấy, với mọi x ∈ X, ta có các đẳng

∞ (cid:88)

∞ (cid:88)

thức

x =

(cid:104)x, en(cid:105)en và (cid:107)x(cid:107)2 =

|(cid:104)x, en(cid:105)|2.

n=1

n=1

Đẳng thức cuối được gọi là đẳng thức Parseval. Tiếp theo, chúng tôi muốn nhắc

lại tính chất sau

∞ (cid:88)

Bổ đề 1.0.8. [1] Cho (en)n∈N là một hệ trực chuẩn của không gian Hilbert X.

Khi đó với mọi x ∈ X và n ∈ N, chuỗi

(cid:104)x, ei(cid:105)ei hội tụ và

i=1

∞ (cid:88)

(cid:104)x, ei(cid:105)ei

i=1

 x −   ⊥ en.

∞ (cid:88)

Chứng minh. Trước tiên chúng tôi chứng minh một tính chất của không gian

Hilbert: Chuỗi

ai, trong đó {ai}∞

i=1 ⊂ X là hệ trực giao, hội tụ khi và chỉ

i=1

∞ (cid:88)

n (cid:88)

n (cid:88)

khi chuỗi

(cid:107)ai(cid:107)2 hội tụ. Thật vậy lấy sn =

ai và σn =

(cid:107)ai(cid:107)2. Với

i=1

i=1

i=1

n > m, theo Định lý Pythagore ta có

(cid:107)sn − sm(cid:107)2 = (cid:107)am+1 + . . . + an(cid:107)2 = (cid:107)am+1(cid:107)2 + . . . + (cid:107)an(cid:107)2 = σn − σm.

Do đó (cid:107)sn − sm(cid:107) → 0 khi và chỉ khi σn − σm → 0. Nhưng do X là không gian Hilbert tức là không gian đầy đủ nên điều này có nghĩa là sn có giới hạn

9

∞ (cid:88)

khi và chỉ khi σn có giới hạn. Do đó chuỗi

ai hội tụ nếu và chỉ nếu chuỗi

i=1

∞ (cid:88)

(cid:107)ai(cid:107)2 < ∞.

i=1

∞ (cid:88)

∞ (cid:88)

Bây giờ, theo bất đẳng thức Bessel ta có

(cid:107)(cid:104)x, ei(cid:105)ei(cid:107)2 =

|(cid:104)x, ei(cid:105)|2 ≤ (cid:107)x(cid:107)2 < ∞,

i=1

i=1

∞ (cid:88)

cho nên theo tính chất ta vừa chứng minh phía trên, chuỗi

(cid:104)x, ei(cid:105)ei sẽ hội tụ.

i=1

n (cid:88)

n (cid:88)

Mặt khác, với mọi n > m ta có

(cid:104)x −

(cid:104)x, ei(cid:105)ei, em(cid:105) = (cid:104)x, em(cid:105) −

(cid:104)x, ei(cid:105)(cid:104)ei, em(cid:105)

i=1

i=1

= (cid:104)x, em(cid:105) − (cid:104)x, em(cid:105) = 0.

∞ (cid:88)

Cho n → ∞ ta sẽ được (cid:104)x −

(cid:104)x, ei(cid:105)ei, em(cid:105) = 0 với mọi m, nghĩa là

i=1

∞ (cid:88)

(cid:104)x, ei(cid:105)ei

i=1

 x −   ⊥ en với mọi n.

Trong phần nhắc lại kiến thức cơ sở này, chúng tôi cũng muốn đưa ra một bổ

đề sau

Bổ đề 1.0.9. Cho X là một không gian Hilbert. Khi đó, mỗi tập con lồi đóng

trong X luôn tồn tại duy nhất một phần tử có chuẩn nhỏ nhất.

Chứng minh. Gọi E là tập con lồi đóng trong X. Đặt λ = inf{(cid:107)x(cid:107) : x ∈ E}.

2 và y

2, ta có

Do (cid:107)x(cid:107) ≥ 0 nên λ ≥ 0 > −∞. Do đó λ tồn tại. Với bất kỳ x, y ∈ E, áp dụng đẳng thức hình bình hành cho x

(cid:107)x − y(cid:107)2 =

(cid:107)x(cid:107)2 +

(cid:107)y(cid:107)2 − (cid:107)

(cid:107)2.

1 4

1 2

1 2

x + y 2

10

Từ E là lồi ta suy ra

(x + y) phải thuộc E. Theo định nghĩa của λ ở trên, ta có

1 2

(cid:107)x − y(cid:107)2 ≤ 2(cid:107)x(cid:107)2 + 2(cid:107)y(cid:107)2 − 4λ2.

(∗)

Từ đây, nếu (cid:107)x(cid:107) = (cid:107)y(cid:107) = λ thì (cid:107)x − y(cid:107)2 ≤ 0, suy ra x = y. Như vậy ta chứng

minh được tính duy nhất của phần tử có chuẩn nhỏ nhất.

Tiếp theo, ta đi chứng minh tính tồn tại phần tử chuẩn nhỏ nhất. Từ định

nghĩa của λ suy ra tồn tại một dãy (yn) trong E thỏa mãn (cid:107)yn(cid:107) → λ khi n → ∞. Ta thay thế x, y lần lượt bởi yn, ym trong (∗), ta thu được

(cid:107)yn − ym(cid:107)2 ≤ 2(cid:107)yn(cid:107)2 + 2(cid:107)ym(cid:107)2 − 4λ2,

với mọi m, n. Cho m, n tiến tới vô cùng thì vế trái của bất đẳng thức trên sẽ

tiến tới 0. Suy ra (yn) là dãy Cauchy. Vì X là không gian Hilbert, tức không gian đầy đủ nên suy ra tồn tại x0 ∈ X sao cho yn → x0 khi n → ∞. Từ (yn) nằm trong E là một tập đóng nên x0 ∈ E. Từ tính liên tục của hàm chuẩn, ta

thu được

(cid:107)yn(cid:107) = λ.

(cid:107)x0(cid:107) = lim n→∞

Vì vậy E tồn tại duy nhất phần tử có chuẩn nhỏ nhất. Ta có điều phải chứng

minh.

CHƯƠNG 2

Phương pháp bình phương tối thiểu

Trong chương này, chúng tôi sẽ trình bày một số tính chất về nghiệm bình

phương tối thiểu, nghịch đảo suy rộng và chứng minh tiêu chuẩn Picard trên

các không gian Hilbert vô hạn chiều. Để thuận lợi cho việc theo dõi, trước hết

chúng tôi sẽ đi vào một số dẫn dắt đầu tiên trước khi vào vấn đề chính [3], [4],

[5].

Ta cần đi tìm nghiệm của phương trình

Ax = b.

Với A là ma trận cỡ m × n, m > n và x, b theo thứ tự là các vectơ cột với n và m phần tử. Để giải phương trình này, ta tìm x sao cho (cid:107)Ax − b(cid:107)2 đạt cực tiểu.

Ta kí hiệu [Ax]i là phần tử thứ i của vectơ Ax và bi là phần tử thứ i của vectơ b. Khi đó, ta có phân tích của đại lượng (cid:107)Ax − b(cid:107)2 như sau

(∗)

(cid:107)Ax − b(cid:107)2 = ([Ax]1 − b1)2 + . . . + ([Ax]m − bm)2.

Chính vì xuất phát từ lý do cần đi làm tối thiểu bình phương của chuẩn Ơclit (cid:107)Ax − b(cid:107)2 cho nên ta mới có tên gọi "phương pháp bình phương tối thiểu".

11

Ta biết: (cid:107)v(cid:107)2 = vT v, trong đó vT là ma trận chuyển vị của v. Do đó biểu

12

thức (∗) ở trên có thể được viết lại như sau

(cid:107)Ax − b(cid:107)2 = (Ax − b)T (Ax − b) = (Ax)T (Ax) − bT (Ax) − (Ax)T b + bT b

= (Ax)T (Ax) − 2(Ax)T b + bT b

(vì bT Ax = (Ax)T b).

Do đó để (cid:107)Ax − b(cid:107)2 đạt cực tiểu thì giá trị cực tiểu đó có thể đạt được tại không điểm của đạo hàm theo biến x của (cid:107)Ax − b(cid:107)2. Đạo hàm biểu thức trên theo

biến x ta suy ra được rằng nghiệm tối thiểu x ở đây sẽ là nghiệm của phương

trình sau

AT Ax = AT b.

Điều này tương đương với một hệ phương trình tuyến tính. Trong đó, ma trận AT A ở vế trái là một ma trận vuông, khả nghịch nếu như rankA = n, và ta gọi

A có hạng đầy đủ theo cột. Trong trường hợp này, hệ phương trình tuyến tính

có nghiệm duy nhất và được xác định như sau

x = (AT A)−1AT b.

Ở đây, ma trận (AT A)−1AT được gọi là ma trận giả nghịch đảo của ma trận A và trong phần trình bày phía sau ta sẽ kí hiệu là A+. Thông thường, ta không có nghịch đảo của A (A−1) do A sẽ thường được giả thiết là ma trận không vuông,

hoặc A suy biến.

Bây giờ, chúng tôi sẽ giới thiệu, chứng minh một số tính chất, định lý quan

trọng của phương pháp bình phương tối thiểu.

2.1 Nghiệm bình phương tối thiểu của phương trình toán

tử và một số tính chất

Trước hết, ta nhắc lại định lý phép chiếu trực giao trong không gian Hilbert:

Cho X là một không gian Hilbert. Lấy M là không gian con đóng của X. Khi

13

đó, tồn tại duy nhất một phép chiếu trực giao P đi từ X vào M sao cho

(cid:107)y − P y(cid:107) ≤ (cid:107)y − u(cid:107)

với mọi y ∈ X và mọi u ∈ M .

Trong phần này, ta giả sử X và Y là các không gian Hilbert và A thuộc

B(X, Y ) là không gian các toán tử tuyến tính liên tục từ X vào Y . Xét phương

trình tuyến tính

Ax = y,

trong đó y ∈ Y được cho trước. Nếu phương trình này không có nghiệm (theo

nghĩa thông thường), ta sẽ cố gắng đi tìm một vectơ x trong X để cho (cid:107)Ax − y(cid:107)

là nhỏ nhất, nghĩa là

(cid:107)Ax − y(cid:107) ≤ (cid:107)Au − y(cid:107),

với mọi u ∈ X. Vectơ x ở đây cũng chính là loại nghiệm mà ta sẽ đi nghiên cứu

trong phần này. Bây giờ, ta gọi Q là phép chiếu của Y lên R(A) ( ở đây R(A)

là bao đóng của tập ảnh của A). Từ định lý phép chiếu trực giao ở trên ta suy ra

(cid:107)Qy − y(cid:107) ≤ (cid:107)z − y(cid:107),

với y ∈ Y , Qy ∈ R(A) và với mọi z ∈ R(A). Cũng từ hệ quả của định lý

R(A)

. Ở đây, chúng ta để ý rằng R(A)

phép chiếu trực giao trong không gian Hilbert, với mọi y ∈ Y , ta có: y − Qy ∈ = R(A)⊥. Thật vậy, hiển nhiên có ⊂ R(A)⊥. Ngược lại, lấy x ∈ R(A)⊥, ta cần

R(A) ⊂ R(A) suy ra R(A)

chứng minh x ∈ R(A) . Rõ ràng, nếu lấy y ∈ R(A) thì theo định nghĩa bao

đóng của một tập hợp, tồn tại dãy (yn) trong R(A) mà yn → y khi n → ∞.Vì (yn) ⊂ R(A) suy ra (cid:104)x, yn(cid:105) = 0. Cho n → ∞ ta có được (cid:104)x, y(cid:105) = 0. Do đó x ∈ R(A) . Vì vậy R(A)

= R(A)⊥.

Định lý 2.1.1. [3] Cho y ∈ Y cho trước. Với x ∈ X, ba điều kiện sau tương

đương

14

(i) Ax = Qy.

(ii) (cid:107)Ax − y(cid:107) ≤ (cid:107)Au − y(cid:107) với mọi u ∈ X.

(iii) A∗Ax = A∗y với A∗ là toán tử liên hợp của A, nghĩa là (cid:104)Ax, y(cid:105) =

(cid:104)x, A∗y(cid:105).

Chứng minh.

(i) ⇒(ii) : Từ y − Qy ∈ R(A) suy ra Qy − y ∈ R(A)

= R(Q)⊥. Do

Au − Qy ⊥ Qy − y và do Ax = Qy, ta có

(cid:107)Au − y(cid:107)2 =(cid:107)Au − Qy(cid:107)2 + (cid:107)Qy − y(cid:107)2

=(cid:107)Au − Qy(cid:107)2 + (cid:107)Ax − y(cid:107)2 ≥ (cid:107)Ax − y(cid:107)2.

(ii) ⇒(iii) : Do Qy ∈ R(A), tồn tại một dãy (xn) ⊂ X sao cho Qy =

Axn. Do đó

lim n→∞

(cid:107)Axn − y(cid:107)2 ≥ (cid:107)Ax − y(cid:107)2.

(cid:107)Qy − y(cid:107)2 = lim n→∞

Mặt khác, theo Định lý Pythagore

(cid:107)Ax − y(cid:107)2 = (cid:107)Ax − Qy(cid:107)2 + (cid:107)Qy − y(cid:107)2.

.

⊥ Suy ra (cid:107)Ax−Qy(cid:107)2 = 0 hay Ax = Qy. Từ đó Ax−y = Qy−y ∈ R(A)

= N (A∗), với N (A∗) là hạch của A∗. Thật vậy, Mặt khác dễ thấy R(A) lấy y ∈ N (A∗) thì điều này tương đương với A∗y = 0 hay (cid:104)x, A∗y(cid:105) = 0 với mọi x ∈ X. Từ đó (cid:104)Ax, y(cid:105) = 0 với mọi x ∈ X, nghĩa là y ∈ R(A)⊥ =

R(A)

. Do đó Ax − y ∈ N (A∗), tức là A∗Ax = A∗y.

(iii) ⇒(i) : Ta có: Ax − y ∈ N (A∗), vì A∗Ax = A∗y. Suy ra

Ax − y ∈ R(A)

= R(Q)⊥.

15

Do đó 0 = Q(Ax−y) = QAx−Qy = Ax−Qy, nghĩa là Ax = Qy.

Định nghĩa 2.1.2. [3] Một vectơ x ∈ X mà thỏa mãn ba điều kiện tương đương

trong định lý trên thì được gọi là một nghiệm bình phương tối thiểu của phương

trình Ax = y.

Hệ quả 2.1.3. [3] Cho y ∈ Y . Khi đó, ta có hai hệ quả sau

(i) L(y) := {x ∈ X|A∗Ax = A∗y} (cid:54)= ∅ khi và chỉ khi y ∈ R(A) (cid:76) R(A)⊥.

(ii) Nếu y ∈ R(A) (cid:76) R(A)⊥ thì L(y) là một tập con lồi đóng khác rỗng của

X.

Chứng minh.

⊥ Ax − y ∈ N (A∗) = R(A)

(i) Lấy x ∈ L(y). Khi đó, theo Định lý 2.1.1, ta có

= R(A)⊥.

Suy ra

(cid:77)

y = Ax + (y − Ax) ∈ R(A)

R(A)⊥.

Ngược lại, nếu y ∈ R(A) (cid:76) R(A)⊥ thì y sẽ luôn biểu diễn được dưới dạng duy nhất y = y1 + y2, trong đó y1 ∈ R(A) và y2 ∈ R(A)⊥. Suy ra Qy = y1 và y1 = Ax với một số giá trị x ∈ X, suy ra Qy = Ax. Theo Định lý 2.1.1, x ∈ L(y), tức là L(y) (cid:54)= ∅.

(ii) Trước hết, theo phần (i) ta dễ thấy ∅ (cid:54)= L(y) ⊂ X. Để chứng minh L(y)

là tập lồi, ta lấy x1, x2 ∈ L(y) và λ ∈ [0, 1]. Ta có

A∗A(λx1 + (1 − λ)x2) =λA∗Ax1 + (1 − λ)A∗Ax2

=λA∗y + (1 − λ)A∗y = A∗y.

Vì thế λx1 + (1 − λ)x2 ∈ L(y), nghĩa là L(y) là tập lồi.

16

Cuối cùng, để chứng minh L(y) đóng, ta chỉ cần lấy một dãy (xn) ⊂ L(y) sao cho xn → x khi n → ∞. Từ A∗Axn = A∗y, cho n → ∞ thì ta sẽ thu được A∗Ax = A∗y, tức là x ∈ L(y). Do đó L(y) đóng và ta kết thúc toàn bộ chứng

minh.

Như vậy, theo Hệ quả 2.1.3, tập L(y) sẽ chứa nghiệm bình phương tối thiểu nếu như y ∈ R(A) (cid:76) R(A)⊥ và đồng thời khi đó L(y) cũng lồi, đóng trong X. Khi đó, theo Bổ đề 1.0.9 trong chương trước sẽ tồn tại duy nhất phần tử

x ∈ L(y) mà (cid:107)x(cid:107) = min{(cid:107)u(cid:107) : u ∈ L(y)}. Tới đây ta có định nghĩa sau

Định nghĩa 2.1.4. [3] Đặt D(A+) := R(A) (cid:76) R(A)⊥ và xây dựng ánh xạ

A+ : D(A+) → X,

y (cid:55)→ x

với x là nghiệm bình phương tối thiểu có chuẩn nhỏ nhất của phương trình Ax = y (như đã chứng minh ở trên là tồn tại và duy nhất). Khi đó, ánh xạ A+

được định nghĩa như ở trên được gọi là giả nghịch đảo hay nghịch đảo suy rộng

của A.

Ta có một số hệ quả liên quan tới ánh xạ giả nghịch đảo A+ như sau

Hệ quả 2.1.5. [3] Cho A+ là ánh xạ giả nghịch đảo của A. Khi đó

(i) D(A+) trù mật trong Y và D(A+) = Y nếu R(A) đóng.

(ii) Nếu R(A) đóng và tồn tại A−1 thì A+|R(A) = A−1.

(iii) R(A+) = N (A)⊥.

(iv) A+ là ánh xạ tuyến tính.

(v) A+ bị chặn (nghĩa là sup{(cid:107)A+y(cid:107) : y ∈ D(A+), (cid:107)y(cid:107) ≤ 1} < ∞) nếu và

chỉ nếu R(A) đóng.

17

(vi) Với mỗi y ∈ D(A+), vectơ A+y chính là nghiệm bình phương tối thiểu duy

nhất của phương trình Ax = y nằm trong N (A)⊥.

Chứng minh.

⊥ (i) Do R(A) là một tập con đóng của Y nên Y = R(A) (cid:76) R(A)

⊥ thế thì x + y ∈ R(A) (cid:76) R(A)

. Bây ⊥ ⊂ R(A) (cid:76) R(A)⊥. Thật vậy, giờ ta chứng minh rằng R(A) (cid:76) R(A) ta lấy x ∈ R(A), y ∈ R(A) . Ta sẽ chứng minh x + y ∈ R(A) (cid:76) R(A)⊥. Theo định nghĩa về tập đóng thì x + y ∈ R(A) (cid:76) R(A)⊥ tương đương với mệnh đề mọi lân cận Ux+y của x + y (đồng thời cũng là lân cận của x và y) thì

(cid:77)

R(A)⊥) (cid:54)= ∅.

Ux+y ∩ (R(A)

= R(A)⊥) nên theo định Vì x ∈ R(A) và y ∈ R(A)⊥ (do y ∈ R(A) nghĩa của tập đóng ta sẽ có Ux+y ∩ R(A) (cid:54)= ∅ và Ux+y ∩ R(A)⊥ (cid:54)= ∅. Suy ra

(cid:77)

R(A)⊥) (cid:54)= ∅.

Ux+y ∩ (R(A)

Do Ux+y là bất kỳ nên x + y ∈ R(A) (cid:76) R(A)⊥. Như vậy

(cid:77) (cid:77)

Y = R(A)

R(A)

⊂ R(A)

R(A)⊥ = D(A+).

Vậy D(A+) = Y hay D(A+) trù mật trong Y .

(ii) Vì R(A) đóng nên D(A+) = Y . Với mọi y ∈ R(A) luôn tồn tại duy nhất x+ ∈ X sao cho Ax+ = y (do giả thiết tồn tại A−1). Do đó x+ = A−1y = A+y. Vì vậy A+|R(A) = A−1.

(iii) Trước hết, ta chứng minh rằng R(A+) ⊂ N (A)⊥. Thật vậy, lấy x ∈ R(A+) (hiển nhiên x ∈ X) thì sẽ tồn tại y ∈ D(A+) để x = A+y.

Nhận thấy N (A) là không gian con đóng của X. Thật vậy, từ định nghĩa

N (A) = {x ∈ X : Ax = 0}, ta dễ dàng suy ra N (A) là một không gian

18

con, đồng thời mọi dãy con bất kì trong N (A) nếu hội tụ thì đều hội tụ tới

một điểm trong N (A), do đó N (A) là không gian con đóng của X.

Với mọi x ∈ X, ta có biểu diễn duy nhất là x = x1 + x2, trong đó x1 ∈ N (A) và x2 ∈ N (A)⊥. Khi đó, Ax1 = 0 và theo Định lý 2.1.1, ta có

Qy = AA+y = Ax = A(x1 + x2) = Ax1 + Ax2 = Ax2.

Suy ra Ax2 = Qy hay x2 chính là nghiệm bình phương tối thiểu của phương trình Ax = y. Do đó

(cid:107)A+y(cid:107)2 = (cid:107)x(cid:107)2 = (cid:107)x1(cid:107)2 + (cid:107)x2(cid:107)2 ≥ (cid:107)x1(cid:107)2 + (cid:107)A+y(cid:107)2.

Từ đó (cid:107)x1(cid:107)2 = 0, tức là x1 = 0. Suy ra x = x2, nghĩa là x ∈ N (A)⊥. Vì vậy ta đã chứng minh được rằng R(A+) ⊂ N (A)⊥.

Để chứng minh phần ngược lại N (A)⊥ ⊂ R(A+), ta lấy u ∈ N (A)⊥ và

lấy y := Au. Khi đó y = Au = QAu = Qy. Suy ra u là một nghiệm

bình phương tối thiểu của Ax = y.

Lúc này, ta gọi v là một nghiệm bình phương tối thiểu khác của Ax = y.

Khi đó Av = Qy = Au, suy ra A(v − u) = 0, nghĩa là v − u ∈ N (A).

Do đó

(cid:107)v(cid:107)2 = (cid:107)u(cid:107)2 + (cid:107)v − u(cid:107)2 ≥ (cid:107)u(cid:107)2.

Suy ra u chính là nghiệm bình phương tối thiểu có chuẩn nhỏ nhất của Ax = y, nghĩa là u = A+y hay u ∈ R(A+). Như vậy, N (A)⊥ ⊂ R(A+)

và kết hợp hai chiều chứng minh lại ta kết thúc hệ quả thứ ba.

(iv) Ta lấy bất kỳ y, y(cid:48) ∈ D(A+) = R(A) (cid:76) R(A)⊥. Bây giờ ta cần chứng và A+(λy) = λA+y với mọi λ ∈ K. minh A+(y + y(cid:48)) = A+y + A+y(cid:48)

(cid:48)

(cid:48)

(cid:48)

(cid:48)

Thật vậy, ta có

AA+y + AA+y

= Qy + Qy

= Q(y + y

) = AA+(y + y

).

19

Suy ra A+y + A+y(cid:48) − A+(y + y(cid:48)) ∈ N (A). Lại có A+y, A+y(cid:48), A+(y + y(cid:48)) đều thuộc R(A+) = N (A)⊥ là một không gian vectơ nên A+y + A+y(cid:48) − A+(y + y(cid:48)) ∈ N (A)⊥. Như vậy A+y + A+y(cid:48) − A+(y + y(cid:48)) ∈ N (A)⊥ ∩ N (A) = {0}. Suy ra A+(y + y(cid:48)) = A+y + A+y(cid:48).

Tương tự ta cũng chứng minh được rằng A+(λy) = λA+y với mọi λ ∈ K

và khi đó ta kết thúc chứng minh hệ quả này.

(v) Giả sử A+ bị chặn. Ta sẽ chứng minh R(A) đóng. Từ AA+y = Qy với mọi y ∈ D(A+) và D(A+) trù mật trong Y ( theo chứng minh phần trước), ta có thể thác triển ánh xạ A+ thành một toán tử tuyến tính bị chặn

(cid:98)A ∈ B(Y, X) sao cho A (cid:98)Ay = Qy với mọi y ∈ Y. Do đó R(A) = R(Q) ⊂ R(A). Suy ra R(A) = R(A), nghĩa là R(A) đóng.

Để chứng minh chiều ngược lại, ta sẽ xây dựng ánh xạ sau

(cid:98)A : N (A)⊥ → R(A)

u (cid:55)→ (cid:98)Au := Au.

Ta sẽ chỉ ra rằng ánh xạ này là song ánh. Thật vậy, lấy u1, u2 ∈ N (A)⊥ và giả sử (cid:98)Au1 = (cid:98)Au2. Khi đó u1 − u2 ∈ N (A). Lại có, u1, u2 ∈ N (A)⊥ mà N (A) và N (A)⊥ đều là các không gian vectơ nên u1 − u2 ∈ N (A)⊥ ∩ N (A) = {0}, nghĩa là u1 = u2. Do vậy (cid:98)A là đơn ánh. Hơn nữa, với cách xây dựng như trên thì dễ thấy rằng (cid:98)A là toàn ánh. Do vậy (cid:98)A là song ánh.

un = u. Khi đó

Hơn nữa, ta cũng nhận thấy rằng (cid:98)A tuyến tính liên tục. Thật vậy, ta lấy một dãy (un) ⊂ N (A)⊥ sao cho lim n→∞

un) = Au = (cid:98)Au.

lim n→∞

(cid:98)Aun = lim n→∞

Aun = A( lim n→∞

Suy ra (cid:98)A liên tục. Hơn nữa, do

(cid:98)A(u1 + u2) = A(u1 + u2) = Au1 + Au2 = (cid:98)Au1 + (cid:98)Au2

20

nên ta suy ra được (cid:98)A tuyến tính.

Tiếp theo, do R(A), N (A)⊥ lần lượt là các không gian con đóng của các

không gian Hilbert Y và X nên chúng cũng là không gian Hilbert và hiển

nhiên cũng là các không gian Banach. Theo Định lý Banach về ánh xạ

mở có đề cập rằng mọi toàn ánh tuyến tính liên tục giữa hai không gian

Banach đều là ánh xạ mở. Vì thế từ (cid:98)A là song ánh tuyến tính liên tục giữa hai không gian Banach nên (cid:98)A−1 tồn tại và cũng liên tục (theo hệ quả của Định lý Banach về ánh xạ mở). Mặt khác (cid:98)A−1 cũng tuyến tính nên (cid:98)A−1 sẽ bị chặn. Do đó tồn tại m > 0 sao cho

(cid:107)A+y(cid:107) = (cid:107) (cid:98)A−1( (cid:98)AA+y)(cid:107) ≤ m(cid:107)AA+y(cid:107) với mọi y ∈ D(A+) = Y.

Do đó với y ∈ Y , ta có (cid:107)y(cid:107) ≥ (cid:107)Qy(cid:107) = (cid:107)AA+y(cid:107) ≥ m−1(cid:107)A+y(cid:107). Ở đây

nên với bất kỳ y ∈ Y luôn tồn tại duy nhất u ∈ R(A) để

ta giải thích kỹ hơn chi tiết (cid:107)y(cid:107) ≥ (cid:107)Qy(cid:107). Thật vậy, do có biểu diễn Y = ⊥ R(A) (cid:76) R(A) (cid:107)y(cid:107)2 = (cid:107)u(cid:107)2 + (cid:107)u⊥(cid:107)2. Suy ra (cid:107)Qy(cid:107) = (cid:107)Qu(cid:107) = (cid:107)u(cid:107) ≤ (cid:107)y(cid:107).

Như vậy A+ ∈ B(Y, X) và (cid:107)A+(cid:107) ≤ m, tức là A+ bị chặn và ta chứng

minh xong hệ quả này.

(vi) Để chứng minh hệ quả này ta chỉ việc sử dụng trực tiếp định nghĩa. Ta đã biết, với y ∈ D(A+) = R(A) (cid:76) R(A)⊥ thì x = A+y được gọi là nghiệm bình phương tối thiểu có chuẩn nhỏ nhất và dĩ nhiên là duy nhất của phương trình Ax = y. Dễ thấy x ∈ R(A+) nên theo kết quả trong hệ quả thứ ba thì x ∈ N (A)⊥ và ta có điều phải chứng minh.

Phần tiếp theo, chúng tôi sẽ giới thiệu về phân tích giá trị kỳ dị, nhằm mục

đích chứng minh tiêu chuẩn Picard, một ứng dụng quan trọng trong phương

pháp bình phương tối thiểu cũng như bài toán về phân tích giá trị kỳ dị.

21

2.2 Phân tích giá trị kỳ dị

Mục đích của phần này là để trình bày sự phân tích giá trị kỳ dị cho các toán

tử compact trong không gian Hilbert. Sự phân tích này chỉ ra rằng các toán tử

compact có một phổ đơn và đồng thời cũng minh họa một cách cụ thể về tính

chất xấu của một phương trình do bị phụ thuộc vào sự tác động của các toán tử

compact ( những phương trình này thường được gọi là phương trình loại I ).

2.2.1 Toán tử compact

Cho X, Y là các không gian Hilbert và lấy T ∈ B(X, Y ). Toán tử T được

gọi là compact nếu và chỉ nếu T biến mỗi tập bị chặn trong X thành một tập

compact tương đối (hay tiền compact) trong Y . Ta ký hiệu là T ∈ B∞(X, Y ).

Nhận thấy, với T ∈ B(X, Y ) cho trước, nếu dim R(T ) = dim ImT hữu

hạn thì T ∈ B∞(X, Y ). Khi đó T được gọi là toán tử có hạng hữu hạn. Để chứng minh tính chất này, trước tiên ta lấy U ⊆ X bị chặn. Ta cần chứng tỏ

rằng T (U ) compact trong Y . Vì dim ImT < ∞ nên T (U ) nằm trong không

gian hữu hạn chiều. Ta đã biết tính chất là một tập trong không gian hữu hạn

chiều sẽ compact nếu và chỉ nếu nó đóng và bị chặn. Vì thế ở đây ta chỉ cần chỉ

ra T (U ) bị chặn nữa là xong. Ta nhận thấy rằng T (U ) ⊂ Y bị chặn, suy ra tồn

tại k > 0 sao cho với mọi x ∈ T (U ) thì (cid:107)x(cid:107) ≤ k. Do đó

T (U ) ⊆ B(0,k) = {y ∈ Y : (cid:107)y(cid:107) ≤ k}.

Mà T (U ) là tập đóng nhỏ nhất chứa T (U ) nên T (U ) ⊆ B(0,k), tức là T (U ) bị chặn. Do đó T (U ) compact trong Y và ta có được T ∈ B∞(X, Y ).

Bây giờ, chúng ta sẽ xét một định lý nhằm đưa ra các điều kiện tương đương

để việc chứng minh một toán tử là compact được thuận tiện hơn, thay vì việc ta

chỉ chứng minh bằng việc sử dụng định nghĩa.

22

Định lý 2.2.1. [3] Cho X, Y là các không gian Hilbert. Lấy T ∈ B(X, Y ).

Khi đó, các điều kiện sau là tương đương

(i) T là toán tử compact.

(cid:107)T − Tm(cid:107) = 0.

(ii) Tồn tại một dãy (Tm)m∈N trong B∞(X, Y ) sao cho lim m→∞

(iii) Tồn tại một dãy (Tm)m∈N các toán tử có hạng hữu hạn thỏa mãn

(cid:107)T − Tm(cid:107) = 0.

lim m→∞

Chứng minh.

(i) ⇒(ii) : Ta chỉ cần chọn Tm := T với mọi m ∈ N.

(i) ⇒(iii) : Lấy ε > 0 nhỏ tùy ý và U ⊆ X là một tập bị chặn. Đặt M := T (U )

thì M sẽ là compact trong Y do T là compact theo giả thiết (i). Theo Định

m (cid:91)

lý Hausdorff, tồn tại y1, y2, . . . , ym sao cho M được phủ bởi các hình cầu

mở Bε(yi), nghĩa là M ⊂

Bε(yi). Bây giờ ta xây dựng phép chiếu trực

i=1

giao như sau

Pε : Y → U := span{yi : i = 1, m},

ở đây ký hiệu span{yi : i = 1, m} dùng để chỉ không gian tuyến tính sinh bởi {yi : i = 1, m}. Ta đặt Tε := PεT . Khi đó Tε có hạng hữu hạn. Theo định lý về phép chiếu trực giao, với mọi x ∈ X thì

(cid:107)T x − Tεx(cid:107) = (cid:107)T x − PεT x(cid:107) ≤ inf{(cid:107)T x − yi(cid:107) : i = 1, m} ≤ ε.

(cid:107)T − Tm(cid:107) = 0.

Suy ra (cid:107)T − Tε(cid:107) ≤ ε. Vì điều này đúng với mọi ε > 0 đủ nhỏ nên rõ ràng ta đã chỉ ra được cách xây dựng dãy (Tm)m∈N các toán tử có hạng hữu hạn sao cho lim m→∞

23

(ii) ⇒(i), (iii) ⇒(i) : Để chứng minh hai phần này, ta cần chỉ ra rằng B∞(X, Y ) là không gian con đóng của B(X, Y ). Rõ ràng B∞(X, Y ) ⊆ B(X, Y ) và B∞(X, Y ) là một không gian con của B(X, Y ). Để chứng minh B∞(X, Y ) đóng, ta lấy U ⊆ X là một tập bị chặn và một dãy (Tm)m∈N trong B∞(X, Y ) sao cho Tm → T khi m → ∞. Theo định nghĩa tập compact Tm(U ) = thì Tm(U ) phải compact trong Y . Cho m → ∞ ta thu được lim m→∞ T (U ) sẽ compact trong Y . Suy ra T ∈ B∞(X, Y ) và do đó B∞(X, Y )

đóng. Dựa vào tính chất đóng này ta sẽ suy ra được rằng nếu có điều kiện

(ii) hoặc (iii) thì sẽ thu được điều kiện (i). Tới đây ta kết thúc toàn bộ chứng

minh của định lý.

2.2.2 Phổ của toán tử compact tự liên hợp

Cho X là không gian Hilbert trên trường vô hướng K = C. Gọi I là ánh xạ

đồng nhất trên X. Ta giả sử trong suốt phần này là X (cid:54)= {0}.

Định nghĩa 2.2.2. [3] Cho T ∈ B(X) (B(X) là không gian các toán tử tuyến tính liên tục từ X vào X). Khi đó một số λ ∈ C được gọi là một giá trị riêng

của T nếu tồn tại một vectơ x ∈ X, x (cid:54)= 0 sao cho T x = λx. Vectơ x này được

gọi là vectơ riêng ứng với giá trị riêng λ. Chiều của N (T − λI) được gọi là bội

của giá trị riêng λ.

Bổ đề 2.2.3. [3] Cho T ∈ B∞(X). Cho λ ∈ C, λ (cid:54)= 0. Khi đó ta có

(i) R(T − λI) đóng.

(ii) R(T − λI) = X nếu λ không là giá trị riêng của T .

Chứng minh. Đặt N := N (T − λI) và M := R(T − λI). Nhận thấy N

là không gian con đóng của X. Ta lấy y ∈ M . Theo định nghĩa bao đóng

(T − λI)xn, trong đó

của một tập hợp, ta luôn giả sử được rằng y = lim n→∞

24

(xn)n∈N là một dãy trong X. Vì X = N (cid:76) N ⊥ nên ta có thể viết xn dưới dạng xn = un + wn, với un ∈ N và wn ∈ N ⊥. Đặt yn := (T − λI)xn. Ta có

(n ∈ N).

yn = (T −λI)(un+wn) = (T −λI)un+(T −λI)wn = (T −λI)wn

(cid:107)wn(cid:107) =

(i) Để chứng minh phần này, trước hết chúng ta cần đi chứng minh (wn)n∈N bị chặn. Ta chứng minh bằng phương pháp phản chứng, giả sử rằng lim n→∞ ∞. Khi đó ta đặt vn := wn(cid:107)wn(cid:107)−1 (n ∈ N). Suy ra (cid:107)vn(cid:107) = 1 với mọi n ∈ N, tức là (vn)n∈N bị chặn. Do đó

(cid:107)wn(cid:107)−1(T − λI)wn.

lim n→∞

(T − λI)vn = lim n→∞

Ta lấy chuẩn ở hai vế trong đẳng thức trên, đồng thời sử dụng các điều kiện

(cid:107)(T − λI)vn(cid:107) = 0. λvn.

đã có ở phần lập luận phía trên, ta sẽ thu được lim n→∞ T vn = lim n→∞

(T − λI)vn = 0. Suy ra lim n→∞

Do đó lim n→∞

Từ Định lý 1.0.6 đã đề cập trong chương trước và do T là toán tử compact

nên không mất tính tổng quát, ta có thể giả sử luôn dãy (T vn)n∈N hội tụ.

Mặt khác

(cid:107)wn(cid:107)−1yn = (cid:107)wn(cid:107)−1(T −λI)wn = (T −λI)((cid:107)wn(cid:107)−1wn) = (T −λI)vn.

(cid:107)wn(cid:107)−1yn = 0.

Do đó theo chứng minh ở trên, ta suy ra được rằng lim n→∞ Như thế, dãy (λ−1((cid:107)wn(cid:107)−1yn + T vn))n∈N hội tụ.

λvn và

Đặt v := lim n→∞

λ−1((cid:107)wn(cid:107)−1yn + T vn). Sử dụng lim n→∞

T vn = lim n→∞ vn.

(cid:107)wn(cid:107)−1yn = 0 ở chứng minh trên, ta suy ra v = lim n→∞

(cid:107)vn(cid:107) = 1 (n ∈ N). Lại có

lim n→∞ Từ vn ∈ N ⊥ mà N ⊥ là không gian con đóng của X nên ta có v ∈ N ⊥ và (cid:107)v(cid:107) = lim n→∞

(T − λI)vn = 0.

(T − λI)v = lim n→∞

Suy ra v ∈ N (T − λI) = N . Do đó v ∈ N ∩ N ⊥ = {0}. Điều này

25

mâu thuẫn với (cid:107)v(cid:107) = 1. Vì vậy (wn)n∈N bị chặn. Khi đó do T là toán tử

compact nên tương tự như phần lập luận ở trên, ta có thể tiếp tục giả sử

(T wn)n∈N hội tụ. Từ đó ta có

(T wn − λwn).

y = lim n→∞

yn = lim n→∞

(T − λI)wn = lim n→∞

Vì thế dãy (wn)n∈N phải hội tụ tới một giá trị w ∈ N ⊥. Suy ra y = (T − λI)w ∈ M := R(T − λI).

Do đó ta đã chỉ ra được rằng M ⊆ M . Điều này chứng tỏ rằng M = M

hay M := R(T − λI) đóng.

(ii) Nếu λ không là giá trị riêng của T thì T − λI khả nghịch, tức là tồn tại (T − λI)−1. Đặt X0 := X và Xn := R((T − λI)n) với n ∈ N. Theo chứng minh phần (i) thì X1 đóng. Khi đó X1 là không gian con đóng của không gian Hilbert X nên X1 cũng là không gian Hilbert và dĩ nhiên nó

cũng là một không gian Banach.

Xét ánh xạ

X

(T − λI)−1 : X1 →

u (cid:55)→ (T − λI)−1u.

Vì X, X1 đều là các không gian Banach nên theo hệ quả của Định lý Banach về ánh xạ mở, (T − λI)−1 sẽ liên tục, hơn nữa (T − λI)−1 tuyến tính nên nó bị chặn. Quy nạp theo n, ta thu được Xn = (T −λI)−1(Xn+1) và Xn+1 ⊂ Xn. Do X1 đóng nên Xn đóng với mọi n ∈ N.

Giả sử X (cid:54)= X1 := R(T − λI). Bằng phương pháp quy nạp ta có Xn+1 (cid:36) Xn với mọi n ∈ N. Khi đó với mỗi n, ta chọn xn ∈ Xn ∩ X ⊥ n+1 và T xn sẽ tồn tại và hữu hạn. Do (cid:107)xn(cid:107) = 1. Theo tính compact của T , lim n→∞ đó theo Định lý Pythagore, với mọi n ∈ N, ta có

(cid:107)T xn(cid:107)2 = (cid:107)(T − λI)xn + λxn(cid:107)2

26

= (cid:107)(T − λI)xn(cid:107)2 + |λ|2(cid:107)xn(cid:107)2 ≥ |λ|2 > 0

T xn < ∞. Ta có điều phải chứng minh.

mâu thuẫn với việc tồn tại lim n→∞

Định nghĩa 2.2.4. [3] Cho T ∈ B(X). Khi đó

ρ(T ) := {λ ∈ C| T − λI là đơn ánh, (T − λI)−1 ∈ B(X)}

được gọi là tập giải của T và σ(T ) := C \ ρ(T ) được gọi là phổ của T .

Định lý 2.2.5. [3] Giả sử T : X → X là toán tử compact. Khi đó ta có các

tính chất sau

(i) Nếu dim X = ∞ thì σ(T ) = {0} ∪ {λ ∈ C| λ là giá trị riêng của T }.

(ii) Nếu dim X < ∞ thì σ(T ) = {λ ∈ C| λ là giá trị riêng của T }.

(iii) Mỗi giá trị riêng khác không của T đều có bội hữu hạn.

(iv) T có không quá đếm được số giá trị riêng và dãy các giá trị riêng này có

điểm tụ bằng 0.

Chứng minh.

(i) Ta lấy (en)n∈N là một dãy trực chuẩn trong X ( nghĩa là (cid:104)ei, ej(cid:105) = 0 với mọi i (cid:54)= j và (cid:107)en(cid:107)n∈N = 1 ). Đầu tiên ta sẽ chỉ ra rằng dãy (en)n∈N hội tụ yếu tới 0 khi n → ∞. Thật vậy, lấy T (cid:48) là phiếm hàm tuyến tính liên tục đi từ không gian Hilbert X vào trường số K (K = R hoặc C). Áp dụng Định lý Riesz đã đề cập ở chương trước, ta có biểu diễn T (cid:48)en = (cid:104)en, a(cid:105), với a là một vectơ cho trước trong X thỏa mãn (cid:107)T (cid:48)(cid:107) = (cid:107)a(cid:107). Lại có, theo bất đẳng

∞ (cid:88)

thức Bessel trong không gian Hilbert, ta có

(cid:107)a(cid:107)2 ≥

|(cid:104)a, en(cid:105)|2.

n=1

27

∞ (cid:88)

Suy ra chuỗi

|(cid:104)a, en(cid:105)|2 hội tụ. Do đó số hạng tổng quát của chuỗi

n=1

|(cid:104)a, en(cid:105)|2 sẽ hội tụ về 0 trên trường K, tức là (cid:104)a, en(cid:105) cũng hội tụ về 0 trên trường K. Vì thế, dãy (T (cid:48)en)n∈N hội tụ về 0 trên trường số K. Như vậy với mọi a ∈ X thì (cid:104)a, en(cid:105) → (cid:104)a, 0(cid:105) khi n → ∞. Do đó theo định nghĩa về sự hội tụ yếu ta suy ra dãy (en)n∈N hội tụ yếu tới 0.

T en = 0. Theo định nghĩa của phổ thì rõ ràng 0 ∈ σ(T ).

Vì T compact và theo chứng minh trên (en)n∈N hội tụ yếu tới 0 nên lim n→∞ Tiếp theo, giả sử 0 (cid:54)= λ ∈ C và λ không là giá trị riêng của T . Khi đó theo Bổ đề 2.2.3 ở trên, T − λI : X → X sẽ là một song ánh và bị chặn. Theo hệ quả của Định lý Banach về ánh xạ mở, ta suy ra (T − λI)−1 : X → X cũng bị chặn. Hơn nữa, ánh xạ này tuyến tính nên (T − λI)−1 ∈ B(X).

Suy ra λ ∈ ρ(T ). Vì vậy ta có điều cần chứng minh.

(ii) Do dim X < ∞ nên dim ImT = dim R(T ) < ∞, nghĩa là T là toán

tử có hạng hữu hạn. Theo định nghĩa của tập giải thì ρ(T ) bao gồm các giá trị λ ∈ C sao cho T − λI là đơn ánh, điều này tương đương với

N (T − λI) = {0}. Do đó phổ σ(T ) sẽ là tập hợp các giá trị λ thỏa mãn N (T − λI) (cid:54)= {0}. Vì vậy σ(T ) = {λ ∈ C : λ là giá trị riêng của T }.

(iii) Lấy 0 (cid:54)= λ ∈ C là một giá trị riêng của T . Giả sử dim N (T − λI) = ∞.

T en = 0.

Khi đó ta lấy (en)n∈N là một hệ trực chuẩn của N (T − λI). Theo chứng minh phần (i) thì lim n→∞

Tuy nhiên từ cách chọn dãy (en)n∈N thì (T − λI)en = 0 hay T en = λen. Do đó với mọi n ∈ N, ta có (cid:107)T en(cid:107) = (cid:107)λen(cid:107) = |λ|(cid:107)en(cid:107) = |λ| > 0, điều này mâu thuẫn với lập luận ở trên. Vậy dim N (T − λI) < ∞.

(iv) Ta chứng minh bằng phương pháp phản chứng. Giả sử rằng tồn tại một

λn = λ (cid:54)= 0. Ta lấy dãy (λn)n∈N gồm các giá trị riêng của T sao cho lim n→∞ (en)n∈N là một dãy trực chuẩn gồm các vectơ riêng tương ứng với dãy giá

28

trị riêng (λn)n∈N.

2

Vì T compact và dãy (en)n∈N bị chặn nên dãy (T en)n∈N hội tụ. Mặt khác (cid:107)T en − T em(cid:107)2 = (cid:107)λnen − λmem(cid:107)2 = |λn|2 + |λm|2. Áp dụng bất đẳng thức Cauchy ta có

,

(cid:107)T en − T em(cid:107)2 ≥

λm + λn 2

(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)

suy ra lim

(cid:107)T en − T em(cid:107)2 ≥ |λ|2 > 0. Suy ra dãy (T en)n∈N không hội

m,n→∞

tụ, điều này mâu thuẫn. Vì vậy ta có điều phải chứng minh.

Bổ đề 2.2.6. [3] Giả sử T : X → X là một toán tử tự liên hợp ( T = T ∗). Khi

đó

(i) (cid:104)T x, x(cid:105) ∈ R với mọi x ∈ X.

(ii) Mọi giá trị riêng của T đều là số thực.

Chứng minh.

(i) Từ giả thiết T = T ∗, với mọi x ∈ X, ta có

(cid:104)T x, x(cid:105) = (cid:104)x, T ∗x(cid:105) = (cid:104)x, T x(cid:105) = (cid:104)T x, x(cid:105).

Do đó (cid:104)T x, x(cid:105) ∈ R với mọi x ∈ X.

(ii) Ta gọi λ là một giá trị riêng của T và x ∈ X, x (cid:54)= 0 là vectơ riêng ứng với λ. Khi đó ta có (cid:104)T x, x(cid:105) = (cid:104)λx, x(cid:105) = λ(cid:107)x(cid:107)2. Theo chứng minh phần (i), (cid:104)T x, x(cid:105) ∈ R với mọi x ∈ X. Do đó λ(cid:107)x(cid:107)2 ∈ R với mọi x ∈ X. Theo cách chọn x (cid:54)= 0 nên (cid:107)x(cid:107)2 > 0. Vì thế để với mọi x ∈ X xảy ra λ(cid:107)x(cid:107)2 ∈ R thì λ ∈ R. Ta chứng minh xong bổ đề.

Định lý 2.2.7. [3] Giả sử T : X → X là một toán tử compact tự liên hợp. Khi

đó ít nhất một trong các giá trị (cid:107)T (cid:107), −(cid:107)T (cid:107) phải là một giá trị riêng của T .

29

(cid:107)T xn(cid:107) =

Chứng minh. Gọi (xn)n∈N là dãy trong X thỏa mãn (cid:107)xn(cid:107) = 1 và lim n→∞ (cid:110) (cid:107)T v(cid:107)

. Từ đó suy ra dãy

(cid:111) (cid:107)v(cid:107) : v ∈ X, v (cid:54)= 0

(cid:107)T (cid:107) (n ∈ N). Ta đã biết (cid:107)T (cid:107) = sup (xn)n∈N tồn tại. Sử dụng tính tự liên hợp của T , tức là T = T ∗, ta có

(cid:107)T 2xn − (cid:107)T xn(cid:107)2xn(cid:107)2 =(cid:107)T 2xn(cid:107)2 − 2(cid:104)T 2xn, (cid:107)T xn(cid:107)2xn(cid:105) + (cid:107)T xn(cid:107)4(cid:107)xn(cid:107)2

=(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)2(cid:104)T 2xn, xn(cid:105) + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)2(cid:104)T xn, T ∗xn(cid:105) + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)2(cid:104)T xn, T xn(cid:105) + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − 2(cid:107)T xn(cid:107)4 + (cid:107)T xn(cid:107)4 =(cid:107)T 2xn(cid:107)2 − (cid:107)T xn(cid:107)4 ≤(cid:107)T (cid:107)2(cid:107)T xn(cid:107)2 − (cid:107)T xn(cid:107)4.

(cid:107)T xn(cid:107) = (cid:107)T (cid:107) ta suy ra

Từ giả thiết lim n→∞

(∗)

(cid:107)T 2xn − (cid:107)T xn(cid:107)2xn(cid:107) = 0.

lim n→∞

Vì T compact nên hợp thành T 2 cũng compact. Do đó theo Định lý 1.0.6 của

chương trước, với (xn)n∈N là một dãy bị chặn trong X ta luôn có thể trích ra được một dãy con (xnk) (k ∈ N) sao cho dãy (T 2xnk) (k ∈ N) hội tụ trong X. Giả sử T 2xnk → T 2z khi k → ∞. Khi đó từ đẳng thức (∗) ở trên, ta có

T 2z = (cid:107)T (cid:107)2z,

(cid:107)z(cid:107) = 1.

xnk = z,

lim k→∞

Suy ra T 2 có một giá trị riêng là (cid:107)T (cid:107)2. Do đó

(T − (cid:107)T (cid:107)I)(T + (cid:107)T (cid:107)I)z = (T 2 − (cid:107)T (cid:107)2I)z = 0.

Vì vậy T có một giá trị riêng là −(cid:107)T (cid:107) nếu (T + (cid:107)T (cid:107)I)z = 0 và có một giá trị

riêng là (cid:107)T (cid:107) nếu (T + (cid:107)T (cid:107)I)z (cid:54)= 0. Ta có điều phải chứng minh.

30

2.2.3 Phân tích giá trị kỳ dị

Cho X, Y là các không gian Hilbert không tầm thường trên trường C.

Bổ đề 2.2.8. [3] Giả sử T : X → Y là toán tử tuyến tính. Khi đó các mệnh đề

sau tương đương

(i) T là toán tử hạng hữu hạn.

m (cid:88)

(ii) Tồn tại m ∈ N, một hệ trực chuẩn f1, . . . , fm trong Y và một hệ các vectơ độc lập tuyến tính e1, . . . , em trong X sao cho với mọi x ∈ X, ta có

T x =

(cid:104)x, ej(cid:105)fj.

j=1

Chứng minh.

(i) ⇒(ii) : Đặt m := dim R(T ), khi đó m < ∞. Ta chọn các vectơ trực chuẩn := T ∗fj, j = 1, m. Khi đó với mỗi

f1, . . . , fm trong R(T ) và đặt ej x ∈ X, ta có

m (cid:88)

m (cid:88)

m (cid:88)

T x =

(cid:104)T x, fj(cid:105)fj =

(cid:104)x, T ∗fj(cid:105)fj =

(cid:104)x, ej(cid:105)fj.

j=1

j=1

j=1

Từ dim R(T ) = m < ∞ suy ra e1, . . . , em độc lập tuyến tính.

(ii) ⇒ (i) : Từ giả thiết ta suy ra dim R(T ) = m < ∞. Vậy T là toán tử hạng

hữu hạn.

Bây giờ chúng ta đi đến định lý phổ cho một toán tử compact tự liên hợp.

Định lý này là một sự khái quát của việc chéo hóa một ma trận đối xứng và

đồng thời cũng là trường hợp đặc biệt của định lý phổ cho các toán tử bị chặn.

Định lý 2.2.9. [3] Cho T là một toán tử compact tự liên hợp, λn (n ∈ N với N = {1, . . . , n} hoặc N = N) là các giá trị riêng khác 0 đôi một phân biệt

31

của T . Khi đó với mỗi x ∈ X, tồn tại x0 ∈ N (T ) sao cho

(cid:88) (cid:88)

T x =

x = x0 +

Pnx,

λnPnx,

n∈N

n∈N

mn(cid:88)

trong đó Pn là phép chiếu trực giao của X lên N (T − λnI) xác định bởi

(cid:104)x, un

Pnx =

j (cid:105)un j ,

j=1

j )j=1,mn là một tập trực chuẩn trong

ở đây mn là chiều của N (T − λnI) và (un N (T − λnI) (n ∈ N ).

Chứng minh. Từ Định lý 2.2.5, mỗi giá trị riêng khác 0 của một toán tử compact

trên không gian Hilbert X luôn có bội hữu hạn nên mn < ∞ với mọi n ∈ N . Ta nhận thấy N (T − λnI) là một không gian con đóng của X nên theo định lý về phép chiếu trực giao trong không gian Hilbert, với mỗi n ∈ N sẽ tồn tại

mn(cid:88)

phép chiếu trực giao Pn : X → N (T − λnI) được xác định bởi

(cid:104)x, un

Pnx =

j (cid:105)un j ,

j=1

j )j=1,mn là một hệ trực chuẩn trong N (T − λnI). Khi đó

ở đây (un

(cid:91)

{un

U :=

}

1 , . . . , un mn

n∈N

j ) là hệ trực chuẩn nên theo

là một hệ trực chuẩn trong X. Lấy x ∈ X. Vì (un

mn(cid:88)

(cid:88)

|(cid:104)x, un

j (cid:105)|2 ≤ (cid:107)x(cid:107)2. Do đó theo Bổ đề 1.0.8

j=1

n∈N

bất đẳng thức Bessel ta có

mn(cid:88)

(cid:88)

(cid:104)x, un

j (cid:105)un

j hội tụ, nghĩa là vectơ

j=1

n∈N

trong chương trước, ta suy ra chuỗi

mn(cid:88)

(cid:88) (cid:88)

y :=

(cid:104)x, un

Pnx được xác định. Đặt M := N (T − λnI) thì

j (cid:105)un

j =

j=1

n∈N

n∈N

32

y ∈ M . Từ đó x − y ∈ M ⊥. Vì Pnx ∈ N (T − λnI) nên

(cid:88) (cid:88) (cid:88)

T y = T (

Pnx) =

(T Pnx) =

λnPnx.

n∈N

n∈N

n∈N

Để kết thúc chứng minh, ta cần chỉ ra T x = T y là xong. Điều này tương đương với x − y ∈ N (T ) hay M ⊥ ⊂ N (T ). Thật vậy, dễ thấy T (M ) ⊂ M, T (M ⊥) ⊂ M ⊥. Gọi T1 : M ⊥ → M ⊥ là hạn chế của T xuống M ⊥. Do T compact, tự liên hợp nên T1 cũng là một toán tử compact, tự liên hợp. Giả sử T1 (cid:54)= 0. Theo Định lý 2.2.7, T1 sẽ có một giá trị riêng λ (cid:54)= 0. Rõ ràng λ cũng là một giá trị riêng của T , suy ra tồn tại x ∈ M ⊥ \ {0} thỏa mãn x ∈ N (T − λI) ⊂ M . Vì thế x ∈ M ∩ M ⊥ = {0}, mâu thuẫn với cách chọn x. Như vậy T1 = 0, suy ra M ⊥ ⊂ N (T ). Ta có điều phải chứng minh.

Trước khi đến với một định lý quan trọng tiếp theo của phần này, chúng tôi

xin nhắc lại một số tính chất của T ∈ B(X, Y )

1. N (T ∗) = R(T )⊥.

2. N (T ) = R(T ∗)⊥.

3. R(T )

= R(T )⊥ = N (T ∗), suy ra R(T ) = N (T ∗)⊥ và R(T ∗) = N (T )⊥.

Định lý 2.2.10. [3] Giả sử A : X → Y là toán tử compact. Khi đó tồn tại một tập chỉ số J (J = {1, . . . , n} hoặc J = N), các hệ trực chuẩn (ej)j∈J ,(fj)j∈J tương ứng của X, Y và dãy (σj)j∈J các số thực dương thỏa mãn các điều kiện

σj = 0 nếu J = N.

(i) (σj)j∈J là đơn điệu không tăng và lim j∈J

(ii) Aej = σjfj, A∗fj = σjej với mọi j ∈ J.

(iii) Với mọi x ∈ X, tồn tại x0 ∈ N (A) thỏa mãn

(cid:88) (cid:88)

Ax =

x = x0 +

(cid:104)x, ej(cid:105)ej,

σj(cid:104)x, ej(cid:105)fj.

j∈J

j∈J

33

(cid:88) (iv) Với mọi y ∈ Y , ta có A∗y =

σj(cid:104)y, fj(cid:105)ej.

j∈J

Chứng minh.

(i) Do A là compact nên toán tử T := A∗A : X → X cũng compact. Hơn nữa (A∗A)∗ = A∗A nên T là toán tử tự liên hợp. Như vậy theo Định lý 2.2.9 sẽ tồn tại tập chỉ số N (N = {1, . . . , k} hoặc N = N) và một dãy (λn)n∈N là các giá trị riêng khác 0 đôi một phân biệt của T . Nhận thấy (λn)n∈N là dãy các giá trị riêng thực, theo Bổ đề 2.2.6. Ta lấy (λj)j∈J là một dãy các giá trị riêng không tăng trích từ dãy (λn)n∈N . Chọn (ej)j∈J là dãy trực chuẩn gồm các vectơ riêng tương ứng với dãy giá trị riêng (λj)j∈J của T . Nhận thấy với mọi x ∈ X thì (cid:104)x, T x(cid:105) = (cid:104)x, A∗Ax(cid:105) = (cid:104)Ax, Ax(cid:105) ≥ 0.

Do đó T là toán tử không âm. Như vậy nếu λj là một giá trị riêng ứng với một vectơ riêng x ∈ X, x (cid:54)= 0 thì từ (cid:104)x, T x(cid:105) ≥ 0, ta suy ra (cid:104)x, λjx(cid:105) ≥ 0, suy ra λj ≥ 0. Mà theo cách xây dựng ở trên thì λj (cid:54)= 0 với mọi j ∈ J nên mọi giá trị riêng λj (j ∈ J) của T đều dương. Do đó ta có thể đặt

σj := (cid:112)λj fj := σ−1

j Aej.

Như vậy (σj)j∈J là dãy số dương không tăng. Theo Định lý 2.2.5, với A là toán tử compact thì A sẽ có không quá đếm được số giá trị riêng và dãy

σj = 0.

các giá trị riêng này có điểm tụ bằng 0. Do đó lim j∈J=N

Vì (ej)j∈J là một hệ trực chuẩn gồm các vectơ riêng ứng với các giá trị riêng (λj)j∈J nên ta dễ dàng chứng minh được rằng (fj)j∈J cũng là một

hệ trực chuẩn. Thật vậy

|(cid:107)Aej(cid:107)

j Aej(cid:107) = |σ−1 (cid:107)fj(cid:107) = (cid:107)σ−1 j (cid:113)

(cid:113)

(cid:104)Aej, Aej(cid:105) = σ−1

(cid:104)ej, A∗Aej(cid:105)

= σ−1 j

j

34

(cid:113)

(cid:104)ej, λjej(cid:105) = σ−1

(cid:112)λj(cid:107)ej(cid:107)

= σ−1 j

j

= σ−1

j σj = 1.

j (cid:104)Aei, Aej(cid:105)

Lại có với i, j ∈ J, i (cid:54)= j thì

(cid:104)fi, fj(cid:105) = (cid:104)σ−1 = σ−1

i σ−1 i σ−1

j (cid:104)ei, λjej(cid:105)

= σ−1

i Aei, σ−1 i σ−1 i σ−1

j Aej(cid:105) = σ−1 j (cid:104)ei, A∗Aej(cid:105) = σ−1 j λj(cid:104)ei, ej(cid:105) = 0 (Do (ej)j∈J là hệ trực chuẩn).

Do đó (fj)j∈J là hệ trực chuẩn.

(ii) Tính chất này dễ dàng được suy ra từ định nghĩa của σj, ej, fj.

(iii) Với x ∈ N (A) thì Ax = 0. Điều này tương đương với A∗Ax = A∗0 = 0 hay x ∈ N (A∗A). Vậy N (T ) = N (A). Áp dụng Định lý 2.2.9 cho toán

(cid:88) (cid:88)

(cid:104)x, ej(cid:105)ej. Ở đây chúng ta chú ý rằng chuỗi

j∈J

j∈J (cid:88)

tử compact tự liên hợp T cùng các dữ kiện (λj)j∈J là dãy các giá trị riêng khác 0 đôi một phân biệt của T và (ej)j∈J là dãy trực chuẩn của X, ta suy ra rằng với mọi x ∈ X, tồn tại x0 ∈ N (T ) = N (A) thỏa mãn x = (cid:104)x, ej(cid:105)ej được xác x0 +

định. Thật vậy, theo bất đẳng thức Bessel ta có được

|(cid:104)x, ej(cid:105)|2 ≤ (cid:107)x(cid:107)2.

j∈J Áp dụng Bổ đề 1.0.8 trong chương trước suy ra chuỗi

(cid:88)

(cid:104)x, ej(cid:105)ej hội tụ

j∈J

hay được xác định.

Ta có

(cid:88) (cid:88) (cid:88)

Ax = Ax0 +

A((cid:104)x, ej(cid:105)ej) =

(cid:104)x, ej(cid:105)Aej =

σj(cid:104)x, ej(cid:105)fj.

j∈J

j∈J

j∈J

Như vậy ta chứng minh xong điều kiện (iii).

(cid:88) (iv) Ta đang dừng lại ở Ax =

σj(cid:104)x, ej(cid:105)fj. Nhận thấy Ax có dạng một

j∈J

35

chuỗi và nó được xác định. Thật vậy, do (fj)j∈J là hệ trực chuẩn nên sử dụng bất đẳng thức Bessel ta có được (cid:107)Ax(cid:107) ≤ σ1(cid:107)x(cid:107). Vì thế Ax được xác định. Nhận thấy A : X → Y là toán tử compact nên A∗ : Y → X

cũng là toán tử compact. Khi đó ta xét toán tử

T (cid:48) := AA∗ : Y → Y,

j∈J

(cid:88) ở đây T (cid:48) compact và tự liên hợp. Tiếp tục chứng minh như đã làm với toán tử A : X → Y , ta thu được kết quả là: Với mọi y ∈ Y , tồn tại y0 ∈ N (A∗) (cid:104)y, fj(cid:105)fj. Ở đây do (fj)j∈J là hệ trực chuẩn nên theo sao cho y = y0 +

bất đẳng thức Bessel ta có

(cid:88)

|(cid:104)y, fj(cid:105)|2 ≤ (cid:107)y(cid:107)2.

j∈J

Khi đó lại áp dụng Bổ đề 1.0.8 trong chương trước ta suy ra y được xác định. Tác động A∗ vào hai vế của phương trình biểu diễn y ở trên, ta có

(cid:88)

(cid:104)y, fj(cid:105)A∗fj

A∗y = A∗y0 +

j∈J

(cid:88)

=

σj(cid:104)y, fj(cid:105)ej.

(Do A∗fj = σjej)

j∈J

Chú ý thêm ở đây là (cid:107)A∗y(cid:107) ≤ σ1(cid:107)y(cid:107) nên A∗y được xác định. Ta có toàn bộ điều phải chứng minh.

Định nghĩa 2.2.11. [3] Cho A : X → Y là toán tử compact với biểu diễn

(cid:88)

Ax =

σj(cid:104)x, ej(cid:105)fj (∗)

j∈J

(cid:88) trong đó x = x0 +

(cid:104)x, ej(cid:105)ej với x0 ∈ N (A); (ej)j∈J và (fj)j∈J lần lượt là

j∈J

các hệ trực chuẩn của X và Y ; J là tập chỉ số (J = {1, . . . , n} hoặc J = N),

36

(σj)j∈J là dãy số thực dương không tăng hội tụ về 0 khi J = N. Khi đó các số σj(j ∈ J) được gọi là các giá trị kỳ dị của A. Họ {(σj, ej, fj)|j ∈ J} được gọi là một hệ kỳ dị của A và biểu diễn (∗) là một phân tích giá trị kỳ dị của A.

2.3 Tiêu chuẩn Picard

Kết quả chính của phần này là một tiêu chuẩn để giải quyết các phương trình

tuyến tính bị tác động bởi toán tử compact.

Định lý 2.3.1. [3] Cho A : X → Y là toán tử compact giữa hai không gian

Hilbert X và Y . Gọi {(σj, ej, fj)} là một hệ kỳ dị của A. Khi đó với một phần tử y ∈ Y cho trước, các điều kiện sau tương đương

(i) y ∈ R(A).

(cid:88) (ii) y ∈ R(A) và

|(cid:104)y, fj(cid:105)|2 < ∞.

σ−2 j

j∈J

Chứng minh.

(i) ⇒ (ii) : Giả sử y ∈ R(A), suy ra y ∈ R(A). Ta lấy x ∈ X thỏa mãn

Ax = y. Khi đó theo Định lý 2.2.10 và sử dụng thêm bất đẳng thức

Bessel, ta có

(cid:88) (cid:88)

|(cid:104)y, fj(cid:105)|2 =

|(cid:104)Ax, fj(cid:105)|2

σ−2 j

σ−2 j

j∈J

j∈J (cid:88)

=

|(cid:104)x, A∗fj(cid:105)|2

σ−2 j

j∈J (cid:88)

=

|(cid:104)x, σjej(cid:105)|2

σ−2 j

j∈J (cid:88)

=

|(cid:104)x, ej(cid:105)|2 ≤ (cid:107)x(cid:107)2 < ∞.

j∈J

37

n (cid:88)

(ii) ⇒ (i) : Ta chỉ xét trường hợp J = N. Đặt xn :=

σ−1 j (cid:104)y, fj(cid:105)ej với

j=1

(cid:88)

n ∈ J = N. Khi đó từ giả thiết

|(cid:104)y, fj(cid:105)|2 < ∞, ta suy ra với mọi

σ−2 j

j∈J

m, n ∈ J, m ≥ n thì

m (cid:88)

(cid:107)xn − xm(cid:107)2 =

|(cid:104)y, fj(cid:105)|2 < ∞.

σ−2 j

j=n+1

xn, ta có

n (cid:88)

Do đó dãy (xn)n∈J là dãy Cauchy. Đặt x := lim n→∞

A(

σ−1 j (cid:104)y, fj(cid:105)ej)

Ax = lim n→∞

j=1

n (cid:88)

Aejσ−1

j (cid:104)y, fj(cid:105)

= lim n→∞

j=1

∞ (cid:88)

=

σjfjσ−1

j (cid:104)y, fj(cid:105)

j=1 ∞ (cid:88)

=

(cid:104)y, fj(cid:105)fj.

j=1

∞ (cid:88)

Theo bất đẳng thức Bessel, với (fj)j∈J là một hệ trực chuẩn trong Y thì

(cid:107)Ax(cid:107) ≤ (cid:107)y(cid:107). Đặt z := y − Ax = y −

(cid:104)y, fj(cid:105)fj. Khi đó ta có

j=1

∞ (cid:88)

(cid:107)z(cid:107)2 = (cid:107)y −

(cid:104)y, fj(cid:105)fj(cid:107)2

j=1

∞ (cid:88)

∞ (cid:88)

= (cid:107)y(cid:107)2 + (cid:107)

(cid:104)y, fj(cid:105)fj(cid:107)2 − 2(cid:104)y,

(cid:104)y, fj(cid:105)fj(cid:105)

j=1

j=1 ∞ (cid:88)

∞ (cid:88)

= (cid:107)y(cid:107)2 + (cid:107)

(cid:104)y, fj(cid:105)fj(cid:107)2 − 2

|(cid:104)y, fj(cid:105)|2

j=1

j=1

∞ (cid:88)

∞ (cid:88)

= (cid:107)y(cid:107)2 +

|(cid:104)y, fj(cid:105)|2 − 2

|(cid:104)y, fj(cid:105)|2

j=1

j=1

38

∞ (cid:88)

= (cid:107)y(cid:107)2 −

|(cid:104)y, fj(cid:105)|2.

j=1

∞ (cid:88)

Do (fj)j∈J là một hệ trực chuẩn trong Y nên áp dụng Bổ đề 1.0.8, với mọi y ∈ Y , ta sẽ có

z = y −

(cid:104)y, fj(cid:105)fj ⊥ fj ∀j ∈ N

j=1

j∈J

(cid:88) suy ra (cid:104)z, fj(cid:105) = 0 ∀j ∈ N. Khi đó theo biểu diễn (iv) đã chứng minh ở σj(cid:104)z, fj(cid:105)ej = 0. Suy ra z ∈ N (A∗). Lại Định lý 2.2.10, ta có A∗z =

∞ (cid:88)

có y ∈ R(A) nên y ∈ N (A∗)⊥. Vì vậy

0 = (cid:104)z, y(cid:105) = (cid:107)y(cid:107)2 −

|(cid:104)y, fj(cid:105)|2 = (cid:107)z(cid:107)2.

j=1

∞ (cid:88)

Suy ra z = 0. Do đó y =

(cid:104)y, fj(cid:105)fj = Ax ∈ R(A). Ta có điều phải

j=1

chứng minh.

* Ý nghĩa của tiêu chuẩn Picard:

• Từ chứng minh tiêu chuẩn Picard có thể chỉ ra trực tiếp một nghiệm

cho bài toán Ax = y. Cách làm như sau

∞ (cid:88)

– Gọi (σj, ej, fj)j∈J là hệ kỳ dị của A.

– y ∈ R(A) viết ở dạng y =

(cid:104)y, fj(cid:105)fj.

j=1

(cid:88) – Khi đó x =

σ−1 j (cid:104)y, fj(cid:105)ej chính là một nghiệm thỏa mãn

j∈J

Ax = y.

Công thức trên tuy hữu dụng về mặt lý thuyết nhưng khó vận dụng

trong thực hành vì hệ kỳ dị hoặc không biết hoặc rất khó để tính.

39

• Phân tích giá trị kỳ dị giúp ta hiểu rõ hơn vì sao bài toán Ax = y

đặt không chỉnh. Thật vậy xét trường hợp X, Y là các không gian

σkfk, xk = x + (

σk)−1 → ∞ khi k → ∞.

Hilbert với số chiều đếm được, gọi (σj, ej, fj)j∈J là hệ kỳ dị của A σk)−1ek. Khi đó với và xét chẳng hạn yk = y + ∀k ∈ N, Axk = yk và (cid:107)yk − y(cid:107) = σk → 0 khi k → ∞. Tuy nhiên, (cid:107)xk − x(cid:107) = ( Do đó ta khắc phục điều này bằng cách xét họ chính quy hóa {Rα} với tham số chính quy hóa α thỏa mãn:

– Tính ổn định: ∀α, Rα : Y → X là liên tục;

– Tính chính xác: (cid:107)RαAx − x(cid:107) → 0 khi α → 0.

Chi tiết cách xây dựng {Rα} xem trong tài liệu tham khảo [3] các

chương 5,6,7.

CHƯƠNG 3

Ứng dụng của phương pháp bình phương

tối thiểu

Trong chương này, chúng tôi sẽ trình bày một số ứng dụng của phương pháp

bình phương tối thiểu trong đại số tuyến tính và trong giải bài toán ngược. Trước

hết, trong chương trước, chúng tôi đã giải thích mối liên hệ của phương pháp

bình phương tối thiểu và phương pháp phân tích giá trị kỳ dị trong trường hợp

cho các toán tử. Tới chương này, đối tượng chúng ta làm việc là các ma trận.

Như vậy, để mô tả phương pháp bình phương tối thiểu trong đại số tuyến tính,

chúng tôi sẽ giới thiệu phương pháp phân tích giá trị kỳ dị cho ma trận [3], [4].

3.1 Phân tích giá trị kỳ dị cho ma trận

Với M = (mij) ∈ Rm,n, u, v ∈ Rk, α1, . . . , αl ∈ R, u1, . . . , ul ∈ Rk. Sử

dụng một số ký hiệu sau

1. In: ma trận đơn vị cấp n.

2. M T : ma trận chuyển vị của ma trận M .

3. (cid:107)u(cid:107): chuẩn Ơclit của u .

40

4. uT v: tích vô hướng Ơclit của u và v.

41

5. (cid:107)M (cid:107): chuẩn của ma trận M , được xác định bởi

(cid:107)M (cid:107) := max{(cid:107)M x(cid:107) : x ∈ Rn, (cid:107)x(cid:107) ≤ 1}.

6. (cid:107)M (cid:107)F : chuẩn Frobenius của M , được xác định bởi

(cid:88)

(cid:107)M (cid:107)F := (

|mij|2)1/2.

i,j

7. (cid:104)u1, . . . , ul(cid:105): không gian tuyến tính sinh bởi u1, . . . , ul.

8. diag(α1, . . . , αl): ma trận đường chéo trong Rp,l với α1, . . . , αl nằm trên

đường chéo và p ≥ l.

9. (u1| . . . |ul): ma trận trong Rk,l với các cột u1, . . . , ul.

Bây giờ ta sẽ đi đến một kết quả quan trọng của phần này.

Định lý 3.1.1. [3] Cho A ∈ Rm,n. Khi đó tồn tại ma trận U ∈ Rm,m, V ∈ Rn,n

và các số thực σ1 ≥ . . . σn ≥ 0 sao cho

A = U DV T ,

U T U = U U T = Im,

V T V = V V T = In,

ở đây D = diag(σ1, . . . , σn) ∈ Rm,n.

Chứng minh. Trước hết ta chứng minh rằng AT A ∈ Rn,n là ma trận đối xứng và nửa xác định dương. Thật vậy, do (AT A)T = AT (AT )T = AT A nên AT A đối xứng. Lấy x ∈ Rn là một vectơ bất kỳ. Khi đó xT (AT A)x = (Ax)T (Ax) = (cid:107)Ax(cid:107)2 ≥ 0. Suy ra AT A là nửa xác định dương. Do vậy tất cả các giá trị riêng của AT A đều không âm. Từ đó suy ra tồn tại các số thực không âm σ1 ≥ . . . ≥ σn ≥ 0 sao cho σ2 n là các giá trị riêng của AT A. Ta gọi 1, . . . , σ2 1, . . . , σ2 (vi)i=1,n là họ các vectơ riêng trực chuẩn ứng với các giá trị riêng σ2 n của AT A. Ta lấy r ≤ n sao cho σr > 0, σr+1 = . . . = σn = 0. Khi đó

42

nếu đặt V1 := (v1| . . . |vr) ∈ Rn,r, V2 := (vr+1| . . . |vn) ∈ Rn,n−r, V := (v1| . . . |vn) ∈ Rn,n và D1 := diag(σ1, . . . , σr) ∈ Rr,r thì ta thu được

D−1

r ), V T

1 = diag(σ−1

1 , . . . , σ−1

D−1

1 AT AV1 = D2 1, 2 AT AV2 = 0, AV2 = 0.

1 AT AV1D−1

1 V T

1 = Ir, V T

1 ∈ Rm,r. Khi đó nếu chọn ma trận U2 ∈ Rm,m−r thỏa mãn

Đặt U1 := AV1D−1 U := (U1|U2) ∈ Rm.m và U T U = U U T = Im, ta sẽ nhận được

   

U T

D1 0

1 AV2

U T AV =

:= D.

    =    

U T

0

0

1 AV1 U T 2 AV1 U T

2 AV2

Suy ra AV = (U T )−1D = U D. Do đó A = (U D)V −1 = U DV T .

Ở đây, chúng tôi muốn giải thích chi tiết hơn về cách tính để có được các kết

quả như trên. Thật vậy, do (vi)i=1,n là hệ trực chuẩn nên ta có

0 nếu i (cid:54)= j

 

vT i vj = (cid:104)vi, vj(cid:105) =

1 nếu i = j.

1 AT AV1 = D2

1. Tương 2 AT AV2 = 0 hay



1 )T AV1

1 AT AV1

Do đó thực hiện phép nhân ma trận chúng ta có được V T tự, với chú ý rằng σr+1 = . . . = σn = 0, ta cũng có V T (AV2)T AV2 = 0. Vì vậy AV2 = 0. 1 ∈ Rm,r, ta có Với U1 := AV1D−1

= (D−1

= D−1

1 AV1 = (AV1D−1 U T 1 )T V T = (D−1 1 )T D2 1 1 D2 1

= D1.

43

Theo cách chọn ở trên, U := (U1|U2) ∈ Rm,m, U T U = U U T = Im. Do đó

    (cid:18) (cid:19)

U T

U T 1

1 U2

= Im hay

U1|U2

  = Im.      

U T

2 U2

1 U1 U T 2 U1 U T

U T 2

2 AV1)D−1

2 (AV1D−1

2 U1 = 0, suy ra U T

1 ) = 0 hay (U T

1 = 0. Do 2 AV1 = 0. Cuối cùng, vì (vi)i=1,n là hệ trực chuẩn nên ta thu được

Do đó U T vậy U T V T V = V V T = In.

Chú ý 3.1.2.

1) Số r mà ta chọn trong chứng minh của Định lý 3.1.1 chính là rankA.

2) Như ta đã biết, các giá trị riêng của AT A xác định duy nhất, do đó các số

thực σ1, . . . , σn là xác định duy nhất.

Tiếp theo ta có định nghĩa sau

Định nghĩa 3.1.3. [3] Cho A ∈ Rm,n (m ≥ n). Phân tích trong Định lý 3.1.1

được gọi là một phân tích giá trị kỳ dị của ma trận A và các số σ1, . . . , σn được gọi là các giá trị kỳ dị của ma trận A.

Sau đây, chúng tôi sẽ đưa ra những tính chất đơn giản của giá trị kỳ dị.

Hệ quả 3.1.4. [3] Giả sử A ∈ Rm,n và lấy A = U DV T là một phân tích giá trị kỳ dị của A. Ở đây U = (u1| . . . |um) ∈ Rm,m, V = (v1| . . . |vn) ∈ Rn,n, D = diag(σ1, . . . , σr, 0, . . . , 0) và σ1 ≥ . . . ≥ σr > 0. Khi đó

i vi, AAT ui = σ2

i ui với 1 ≤ i ≤ r.

(i) AT Avi = σ2

(ii) Avi = σiui, AT ui = σivi với 1 ≤ i ≤ r.

(iii) rankA = r.

(iv) (cid:104)v1, . . . , vr(cid:105) = N (A)⊥, (cid:104)vr+1, . . . , vn(cid:105) = N (A).

44

(v) (cid:104)u1, . . . , ur(cid:105) = R(A), (cid:104)ur+1, . . . , um(cid:105) = R(A)⊥.

. (vi) (cid:107)A(cid:107) = σ1 = (cid:107)AT (cid:107), (cid:107)A+(cid:107) =

1 σr

r ), rankB = rankC = r.

1, . . . , σ2

Hệ quả 3.1.5. [3] Giả sử A ∈ Rm,n, rankA = r. Khi đó tồn tại các ma trận B ∈ Rm,r, C ∈ Rr,n và các số thực σ1 ≥ . . . ≥ σr > 0 sao cho A = BC, BT B = Ir, CC T = diag(σ2

Chứng minh. Không mất tính tổng quát, ta có thể giả sử m ≥ n. Lấy A = U DV T là một phân tích giá trị kỳ dị. Trong đó U = (u1| . . . |um) ∈ Rm,m, V = (v1| . . . |vn) ∈ Rn,n, D = diag(σ1, . . . , σr, 0, . . . , 0). Khi đó nếu ta đặt B := (u1| . . . |ur), C1 := (v1| . . . |vr), C := diag(σ1, . . . , σr)C T 1 thì chúng ta sẽ thu được điều phải chứng minh.

Kết quả tiếp theo trong phần này chúng ta quan tâm đến nhiễu của giá trị

riêng của một ma trận đối xứng. Chúng ta cần đưa ra kết quả này để hiểu được

các giá trị kỳ dị của một ma trận sẽ bị ảnh hưởng như thế nào bởi các nhiễu

(nhỏ). Ta ký hiệu

:= {V ⊂ Rn : V là một không gian con, dim V ≥ j}.

V n j

Định lý 3.1.6. [3] Cho C ∈ Rn,n là một ma trận đối xứng với các giá trị riêng

λ1 ≥ . . . ≥ λn. Khi đó với k ∈ {1, . . . , n} thì

xT Cx.

λk = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

min x∈V,(cid:107)x(cid:107)=1

n−k+1

xT Cx = max V ∈V n k

Chứng minh.

(i) Đầu tiên chúng ta đi chứng minh đẳng thức thứ nhất

xT Cx.

λk = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

n−k+1

Ta gọi v1, . . . , vn là một hệ trực chuẩn gồm các vectơ riêng ứng với các giá

45

trị riêng λ1, . . . , λn. Ta lấy V ∈ V n n−k+1, suy ra dim V ≥ n − k + 1. Đặt U := (cid:104)v1, v2, . . . , vk(cid:105). Rõ ràng dim U = k nên sử dụng công thức trong

đại số tuyến tính, ta có

dim(U +V ) = dim U +dim V −dim(U ∩V ) ≥ k+(n−k+1)−dim(U ∩V ).

k (cid:88)

Vì dim(U + V ) ≤ n nên dim(V ∩ U ) ≥ 1. Ta lấy

x =

αivi ∈ (V ∩ (cid:104)v1, . . . , vk(cid:105))

i=1

i vj = 0 nếu i (cid:54)= j và vT

i vj = 1 nếu i = j. Do

với (cid:107)x(cid:107) = 1. Để ý rằng vT

k (cid:88)

k (cid:88)

k (cid:88)

k (cid:88)

đó ta có

xT Cx = xT (Cx) = (

αivT

αivi) = (

αivT

αiCvi)

i )(C

i )(

i=1

i=1

i=1 k (cid:88)

k (cid:88)

i=1 k (cid:88)

= (

α2

αivT

αiλivi) =

i )(

i λi.

i=1

i=1

i=1

k (cid:88)

k (cid:88)

Lại có (cid:107)x(cid:107)2 = 1 nên (cid:107)

αivi(cid:107)2 = 1. Do đó

|αi|2(cid:107)vi(cid:107)2 = 1 hay

i=1

i=1

k (cid:88)

α2

i = 1. Từ giả thiết λ1 ≥ . . . ≥ λn, suy ra

i=1

k (cid:88)

k (cid:88)

α2

α2

xT Cx =

i λi ≥

i λk = λk.

i=1

i=1

n (cid:88)

xT Cx. Tiếp theo ta lấy x =

αivi ∈

Suy ra λk ≤ min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

n−k+1

i=k

U

(cid:48) := (cid:104)vk, . . . , vn(cid:105) với (cid:107)x(cid:107) = 1. Vì dim U (cid:48) = n−k+1 nên U (cid:48) ∈ V n

n−k+1.

46

n (cid:88)

Tương tự như chứng minh trên, ta sẽ thu được

xT Cx =

α2

i λi ≤ λk.

i=k

xT Cx. Vậy ta đã chứng minh được đẳng

Do đó λk ≥ min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

n−k+1

thức đầu tiên.

xT Cx, ta thay ma trận C

min x∈V,(cid:107)x(cid:107)=1

(ii) Tiếp theo, để chứng minh λk = max V ∈V n k bởi −C với các giá trị riêng thỏa mãn −λ1 ≤ . . . ≤ −λn. Lấy V ∈ V n k , suy ra dim V ≥ k. Chứng minh tương tự như đối với quá trình đã thực hiện

n (cid:88)

cho đẳng thức thứ nhất ở phần (i), xét U := (cid:104)vk, . . . , vn(cid:105) (dim U = n −

k+1), ta thu được dim(U ∩V ) ≥ 1. Do đó tồn tại x =

αivi ∈ (U ∩V )

i=k

k (cid:88)

và (cid:107)x(cid:107) = 1. Tương tự chứng minh phần (i), ta dễ dàng chỉ ra được rằng n (cid:88)

α2

α2

i = 1 và

i = 1. Khi đó ta nhận được

i=1

i=k

n (cid:88)

xT (−C)x =

α2

i (−λi) ≥ −λk.

i=k

k (cid:88)

xT (−C)x. Với mỗi x =

trong

αivi

i=1

Suy ra −λk ≤ max V ∈V n k

V (cid:48) := (cid:104)v1, . . . , vk(cid:105) ∈ V n

min x∈V,(cid:107)x(cid:107)=1 k và (cid:107)x(cid:107) = 1, ta có

k (cid:88)

xT Cx =

α2

i (−λi) ≤ −λk.

i=1 xT (−C)x. Từ đó suy ra

min x∈V (cid:48),(cid:107)x(cid:107)=1

Do đó −λk ≥ max V (cid:48)∈V n k

xT (−C)x

min x∈V,(cid:107)x(cid:107)=1

−λk = max V ∈V n k

xT Cx.

min x∈V,(cid:107)x(cid:107)=1

hay λk = max V ∈V n k

47

Kết hợp (i) và (ii) ta có điều phải chứng minh của định lý.

Định lý 3.1.7. [3] Cho C, F ∈ Rn,n là các ma trận đối xứng. Ta gọi λ1 ≥ . . . ≥ λn, ϕ1 ≥ . . . ≥ ϕn và µ1 ≥ . . . ≥ µn tương ứng là các giá trị riêng của C, F và C + F . Khi đó với mọi k ∈ {1, . . . , n} thì

(i) λk + ϕn ≤ µk ≤ ϕ1 + λk.

(ii) |λk − µk| ≤ (cid:107)F (cid:107).

Chứng minh. Ta lấy v1, . . . , vn là hệ trực chuẩn gồm các vectơ riêng ứng với các giá trị riêng của ma trận C.

n−k+1, theo kết quả của Định lý 3.1.6 ta có

(i) Với mỗi V ∈ V n

xT (C + F )x.

µk = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

n−k+1

Do đó

xT (C + F )x

µk ≤ max

x∈V,(cid:107)x(cid:107)=1

≤ max

xT Cx + max

xT F x.

x∈V,(cid:107)x(cid:107)=1

x∈V,(cid:107)x(cid:107)=1

n−k+1, ta có

Áp dụng điều này cho không gian V := (cid:104)vk, . . . , vn(cid:105) ∈ V n

xT Cx ≤ λk. Do đó

max x∈V,(cid:107)x(cid:107)=1

µk ≤ λk + max

xT F x = λk + ϕ1

x∈V,(cid:107)x(cid:107)=1

(*) hay µk ≤ λk + ϕ1.

xT (C + F )x suy ra với V (cid:48) ∈ V n k

min x∈V,(cid:107)x(cid:107)=1

Lại có, từ µk = max V ∈V n k

xT (C + F )x

µk ≥ min

x∈V (cid:48) ,(cid:107)x(cid:107)=1

≥ min

xT Cx + min

xT F x

x∈V (cid:48) ,(cid:107)x(cid:107)=1

x∈V (cid:48) ,(cid:107)x(cid:107)=1

48

= min

xT Cx + ϕn.

x∈V (cid:48) ,(cid:107)x(cid:107)=1

xT Cx ≥

k thì min

x∈V (cid:48),(cid:107)x(cid:107)=1

Áp dụng cho không gian V (cid:48) := (cid:104)v1, . . . , vk(cid:105) ∈ V n

(**)

λk. Do đó µk ≥ λk + ϕn.

Từ (∗) và (∗∗) ta suy ra điều phải chứng minh.

(ii) Từ (i) ta có

µk − λk ≤ |ϕ1|

λk − µk ≤ −ϕn ≤ |ϕn|.

Theo định nghĩa (cid:107)F (cid:107) := max{(cid:107)F x(cid:107) : x ∈ Rn, (cid:107)x(cid:107) ≤ 1} nên nếu lấy

xi (cid:54)= 0 với (cid:107)xi(cid:107) ≤ 1 là một vectơ riêng ứng với giá trị riêng ϕi bất kỳ của ma trận F thì

(cid:107)F (cid:107) = max{(cid:107)F xi(cid:107)} = max{(cid:107)ϕixi(cid:107)} = max{|ϕi|(cid:107)xi(cid:107)}.

Suy ra |ϕ1|, |ϕn| ≤ (cid:107)F (cid:107). Do đó |λk − µk| ≤ (cid:107)F (cid:107).

Định lý 3.1.8. [3] Cho A ∈ Rm,n và lấy σ1 ≥ . . . ≥ σn là các giá trị kỳ dị của A. Khi đó với mọi k ∈ {1, . . . , n} ta có

(cid:107)Ax(cid:107).

σk = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

min x∈V,(cid:107)x(cid:107)=1

n−k+1

(cid:107)Ax(cid:107) = max V ∈V n k

1 ≥ . . . ≥ σ2

Chứng minh. Ta đặt C := AT A ∈ Rn,n. Ta đã biết σ2 n là các giá trị riêng của AT A và σ1 ≥ . . . ≥ σn là các giá trị kỳ dị của A. Áp dụng Định lý 3.1.6 cho ma trận C, ta có

xT Cx.

σ2 k = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

min x∈V,(cid:107)x(cid:107)=1

n−k+1

xT Cx = max V ∈V n k

49

Suy ra

xT AT Ax

σ2 k = min V ∈V n

min x∈V,(cid:107)x(cid:107)=1

max x∈V,(cid:107)x(cid:107)=1

xT AT Ax = max V ∈V n k

n−k+1

hay

(cid:107)Ax(cid:107)2.

σ2 k = min V ∈V n

min x∈V,(cid:107)x(cid:107)=1

max x∈V,(cid:107)x(cid:107)=1

(cid:107)Ax(cid:107)2 = max V ∈V n k

n−k+1

(cid:107)Ax(cid:107).

Vậy σk = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

min x∈V,(cid:107)x(cid:107)=1

n−k+1

(cid:107)Ax(cid:107) = max V ∈V n k

Bây giờ để thuận tiện hơn, ta sẽ ký hiệu giá trị kỳ dị của một ma trận C ∈

Rm,n bởi σ1(C), . . . , σn(C) và ta luôn giả sử σ1(C) ≥ . . . ≥ σn(C).

Định lý 3.1.9. [3] Cho A, F ∈ Rm.n. Khi đó với mọi k ∈ {1, . . . , n} thì

|σk(A) − σk(A + F )| ≤ (cid:107)F (cid:107).

Chứng minh.

Áp dụng Định lý 3.1.8, ta có

(cid:107)Ax(cid:107)

σk(A) = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

n−k+1

(cid:107)(A + F )x(cid:107).

σk(A + F ) = min V ∈V n

max x∈V,(cid:107)x(cid:107)=1

n−k+1

Suy ra

(cid:12)(cid:107)Ax(cid:107) − (cid:107)(A + F )x(cid:107)(cid:12) (cid:12) (cid:12)

|σk(A) − σk(A + F )| ≤ min V ∈V n

n−k+1

≤ max

max x∈V,(cid:107)x(cid:107)=1 (cid:12)(cid:107)Ax(cid:107) − (cid:107)(A + F )x(cid:107)(cid:12) (cid:12) (cid:12)

x∈V,(cid:107)x(cid:107)=1

(cid:107)F x(cid:107) = (cid:107)F (cid:107).

≤ max (cid:107)x(cid:107)=1

(cid:107)(A + F )x − Ax(cid:107) = max (cid:107)x(cid:107)=1

50

3.2 Ứng dụng của phương pháp bình phương tối thiểu trong

không gian hữu hạn chiều

Trong chương trước, chúng ta đã nghiên cứu về nghiệm bình phương tối

thiểu cho một phương trình tuyến tính đối với toán tử trong không gian Hilbert

vô hạn chiều. Trong phần này, chúng ta sẽ tiếp tục nghiên cứu về nghiệm bình

phương tối thiểu đối với phương trình tuyến tính của các ma trận thực trong

không gian hữu hạn chiều. Ta sẽ sử dụng một số kết quả và ký hiệu tương ứng

giữa hai chương để người đọc dễ theo dõi mối liên hệ giữa chúng

Chương trước Chương này

Toán tử A Ma trận A

Toán tử liên hợp A∗ Ma trận chuyển vị AT

R(A)

⊥ = R(A)⊥ = N (A∗) R(A)

= R(A)⊥ = N (AT )

Toán tử giả nghịch đảo A+ Ma trận giả nghịch đảo A+

Q : Y → R(A) là phép chiếu trực giao.

Trong chương này, với A ∈ Rm,n thì

(AT A)−1AT nếu rankA = n,

 

A+ =

AT (AAT )−1 nếu rankA = m.



Ta xét phương trình

Ax = y

với A ∈ Rm,n, y ∈ Rm cho trước. Giả sử phương trình này không có nghiệm. Mục tiêu của ta là đi tìm một vectơ x ∈ Rn sao cho chuẩn Ơclit (cid:107)Ax − y(cid:107) đạt

giá trị nhỏ nhất. Lúc này ta gọi x là nghiệm bình phương tối thiểu của phương

trình Ax = y.

Định lý 3.2.1. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó

51

(i) Bài toán

min{(cid:107)Ax − y(cid:107) : x ∈ Rn} (∗)

luôn có nghiệm x.

(ii) Nghiệm của bài toán (∗) là xác định duy nhất nếu và chỉ nếu N (A) = {0}.

(iii) Nghiệm của bài toán (*) chính là nghiệm của phương trình

AT Ax = AT y.

Chứng minh. Do A : Rn → Rm nên suy ra R(A), N (A) lần lượt là các không

gian vectơ con của các không gian Hilbert hữu hạn chiều và vì thế chúng là các không gian đóng. Vì vậy R(A) = R(A). Do đó Rm = R(A) ⊕ R(A)⊥. Suy ra với mọi y ∈ Rm, ta có biểu diễn duy nhất y = y1 + y2 với y1 ∈ R(A), y2 ∈ R(A)⊥ và (cid:104)y1, y2(cid:105) = 0.

(i) Ta có (cid:107)Ax − y(cid:107)2 = (cid:107)Ax − y1 − y2(cid:107)2 = (cid:107)Ax − y1(cid:107)2 + (cid:107)y2(cid:107)2 ≥ (cid:107)y2(cid:107)2. Ở đây, ta đã áp dụng Định lý Pythagore với điều kiện Ax − y1 ∈ R(A), y2 ∈ R(A)⊥. Như vậy x sẽ là một nghiệm của (∗) nếu x là một nghiệm của

phương trình Ax = y1. Do y1 ∈ R(A) nên x tồn tại. Vậy bài toán (∗) có

nghiệm.

(ii) Từ ý (i) ta suy ra bài toán (∗) có nghiệm duy nhất khi và chỉ khi phương

trình Ax = y1 có nghiệm duy nhất hay N (A) = {0}.

(iii) Ta gọi x là một nghiệm của (∗). Vì y1 = Ax ∈ R(A) nên y − Ax ∈ R(A)⊥ = N (AT ), suy ra AT (y − Ax) = 0 hay AT y = AT Ax. Vậy x là nghiệm của phương trình AT Ax = AT y.

Định nghĩa 3.2.2. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó một vectơ x ∈ Rn được

gọi là nghiệm bình phương tối thiểu của phương trình Ax = y nếu x là nghiệm của phương trình AT Ax = AT y.

52

Theo kết quả trong trường hợp vô hạn chiều, ta thừa nhận

L(y) := {x ∈ Rn : x là nghiệm bình phương tối thiểu của Ax = y}

là một tập lồi, đóng, khác rỗng trong Rn. Như vậy tồn tại duy nhất một phần tử x∗ ∈ L(y) thỏa mãn

(cid:107)x∗(cid:107) = min{(cid:107)x(cid:107) : x ∈ L(y)}.

Định nghĩa 3.2.3. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó một nghiệm bình

phương tối thiểu x của phương trình Ax = y được gọi là một nghiệm chuẩn tối

thiểu nếu và chỉ nếu

(cid:107)x(cid:107) = min{(cid:107)x(cid:107) : x ∈ L(y)}.

Trong chương này, việc sử dụng các ký hiệu cũng tương tự như trong trường hợp vô hạn chiều ở chương trước. Nghĩa là D(A+) := R(A)⊕R(A)⊥ (D(A+) = Rm) và

A+ : D(A+) → Rn,

y (cid:55)→ x

trong đó x là nghiệm chuẩn tối thiểu của phương trình Ax = y.

Định lý 3.2.4. [3] Cho A ∈ Rm,n, y ∈ Rm. Khi đó vectơ x := A+y là nghiệm

chuẩn tối thiểu duy nhất của phương trình Ax = y.

Chứng minh. Trong chương trước, chúng ta đã chứng minh được rằng với mọi y ∈ D(A+) thì vectơ x = A+y là nghiệm bình phương tối thiểu có chuẩn nhỏ

nhất và cũng là tồn tại duy nhất của phương trình Ax = y. Trong chương này, do D(A+) = Rm nên vectơ x := A+y sẽ là nghiệm bình phương tối thiểu có

chuẩn nhỏ nhất, tức là nghiệm chuẩn tối thiểu duy nhất của Ax = y.

53

Bây giờ, giả sử ma trận A ∈ Rm,n có phân tích giá trị kỳ dị là A = U DV T như trình bày phần trước. Trong đó U = (u1| . . . |um) ∈ Rm,m, V = (v1| . . . |vn) ∈ Rn,n, D = diag(σ1, . . . , σr, 0, . . . , 0) với σ1 ≥ . . . ≥ σr > 0 và (uj), (vj) lần lượt là các hệ trực chuẩn trong Rm, Rn được chọn như trong trình bày phần trước. Khi đó nếu x+ là nghiệm chuẩn tối thiểu ( hiểu là nghiệm

r (cid:88)

bình phương tối thiểu có chuẩn nhỏ nhất) của phương trình Ax = y thì từ định lý vừa chứng minh ở trên, ta có thể biểu diễn công thức của x+ như sau

x+ = A+y =

σ−1 j (cid:104)y, uj(cid:105)vj.

j=1

Ở đây, để hiểu rõ về phân tích này, chúng ta cần tham khảo Định lý 3.3.1 ở phần

bên dưới trong trường hợp tổng quát vô hạn chiều.

Từ phân tích trên, chúng ta nhận thấy rằng khi giá trị kỳ dị càng nhỏ thì

nghiệm sẽ càng nhạy cảm hơn với sai số. Đồng thời từ công thức trên chúng ta

có thể thấy được rằng phương pháp phân tích giá trị kỳ dị (hay còn gọi tắt là

SV D) chính là một công cụ giải số rất hữu hiệu cho các hệ phương trình đại số

tuyến tính.

Ví dụ 3.2.5. Giải phương trình Ax = y, trong đó

 

1

1

A =

y =

0

1

           

−1 1

  1       2       4

Phương trình này vô nghiệm. Ta tìm nghiệm x+ = A+y.

2.

Qua tính toán, ta thu được các giá trị kỳ dị của A là σ1 =

3, σ2 =

54

 

v1 =

  , v2 =    0   1  1   . 0

     

3

2

1/

1/

1/

6 √

.

, u2 =

, u3 =

u1 =

3

1/

6

0 √

−2/ √

                             

3

1/

−1/

      2

1/

6

Suy ra

 

−3/2

x+ = A+y = σ−1

1 (cid:104)y, u1(cid:105)v1 + σ−1

2 (cid:104)y, u2(cid:105)v2 =

    .

7/3

3.3 Ứng dụng của phân tích kỳ dị trong nghiên cứu bài toán

ngược

Ta vẫn xét A : X → Y là toán tử compact giữa hai không gian Hilbert

X, Y . Gọi (σj, ej, fj)j∈J là một hệ kỳ dị của A.

Để giải phương trình Ax = y, đầu tiên chúng ta đã đưa ra định nghĩa về nghiệm suy rộng x+ = A+y trong phần trình bày ở chương trước. Chúng ta

hiểu rằng đây cũng chính là việc đi giải ngược một bài toán. Chính vì vậy, để

thấy rõ hơn mối liên hệ của phân tích giá trị kỳ dị trong giải bài toán ngược,

chúng ta sẽ đi vào một kết quả quan trọng sau.

Định lý 3.3.1. [3] Cho A : X → Y là một toán tử compact giữa hai không

55

∞ (cid:88)

∞ (cid:88)

gian Hilbert X, Y và (σj, ej, fj)j∈J là một hệ kỳ dị của A. Khi đó

A+y =

σ−1 j (cid:104)Qy, fj(cid:105)ej =

j (cid:104)y, fj(cid:105)ej, y ∈ D(A+). σ−1

j=1

j=1

Chứng minh. Nhận thấy Qy ∈ R(A) vì y ∈ D(A+). Do đó theo tiêu chuẩn

∞ (cid:88)

Picard chứng minh ở chương trước, ta có

|(cid:104)Qy, fj(cid:105)|2 < ∞.

σ−2 j

j=1

Vì fj ∈ R(A) với mọi j ∈ N nên

(cid:104)Qy, fj(cid:105) = (cid:104)y, Qfj(cid:105) = (cid:104)y, fj(cid:105).

∞ (cid:88)

∞ (cid:88)

Từ đó ta suy ra các chuỗi

σ−1 j (cid:104)Qy, fj(cid:105)ej,

σ−1 j (cid:104)y, fj(cid:105)ej

j=1

j=1

∞ (cid:88)

hội tụ. Do ej ∈ N (A)⊥, suy ra vectơ

x :=

σ−1 j (cid:104)Qy, fj(cid:105)ej

j=1

∞ (cid:88)

∞ (cid:88)

cũng thuộc N (A)⊥. Hơn nữa

Ax =

(cid:104)Qy, fj(cid:105)fj = Qy

σ−1 j (cid:104)Qy, fj(cid:105)Aej =

j=1

j=1

: j ∈ N} = R(A) (theo Định lý 2.2.10). Vì do Qy ∈ R(A) và span{fj vậy x là một nghiệm bình phương tối thiểu của Ax = y trong N (A)⊥ hay x = A+y.

Tiếp theo, chúng tôi sẽ trình bày ví dụ một cách chi tiết để người đọc hình

56

dung rõ hơn về ứng dụng của phân tích kỳ dị trong giải bài toán ngược.

Xét

A : (L2([0, 1]), (cid:107).(cid:107)2) → (L2([0, 1]), (cid:107).(cid:107)2),

x (cid:55)→ Ax

trong đó

Ax : [0, 1] → R (cid:90) t

t (cid:55)→

x(s)ds.

0

Ta sẽ chỉ ra rằng A được xác định, tuyến tính và liên tục. Trước hết ta xét bổ đề

sau

Bổ đề 3.3.2. Cho a < b, u ∈ L2([a, b]). Khi đó

(cid:90) b (cid:90) b

b − a(cid:107)u(cid:107)L2([a,b]).

a

a

(cid:12)u(t)(cid:12) (cid:12) (cid:12) dt ≤ (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) u(t)dt (cid:12) (cid:12)

Chứng minh. Bất đẳng thức đầu tiên là cơ bản. Ta chứng minh bất đẳng thức

thứ hai (cid:90) b

b − a(cid:107)u(cid:107)L2([a,b]).

a

(cid:12)u(t)(cid:12) (cid:12) (cid:12) dt ≤

Thật vậy theo bất đẳng thức H¨older thì

(cid:90) b (cid:90) b

a

a (cid:115)

(cid:12) .1dt (cid:12)u(t)(cid:12) (cid:12) (cid:12) dt = (cid:12)u(t)(cid:12) (cid:12)

(cid:115) (cid:90) b (cid:90) b

2 dt.

12dt

a

a

(cid:12)u(t)(cid:12) (cid:12) (cid:12)

=

b − a(cid:107)u(cid:107)L2([a,b]).

57

Trở lại bài toán, ta có với x ∈ L2([0, 1]) thì

(cid:90) t

Ax(t) =

x(s)ds ∀t ∈ [0, 1] ,

0

từ đó sử dụng Bổ đề 3.3.2 ta có

(cid:33)2 (cid:90) 1 (cid:90) 1 (cid:32)(cid:90) t

(Ax(t))2dt =

x(s)ds

dt

0

0

0 (cid:90) 1

(cid:107)x(cid:107)2

L2([0,t])tdt

0 (cid:90) 1

(cid:107)x(cid:107)2

L2([0,1])tdt

=

L2([0,1]) < ∞.

0 1 (cid:107)x(cid:107)2 2

Vì x ∈ L2([0, 1]) nên Ax ∈ L2([0, 1]), điều này có nghĩa là A được xác định.

0 (Ax(t))2dt ≤ 1

2(cid:107)x(cid:107)2

Dễ thấy A(α1x1 + α2x2) = α1Ax1 + α2Ax2 ∀α1, α2 ∈ R, ∀x1, x2 ∈ L2([0,1]) với

L2([0, 1]). Do đó A tuyến tính. Ngoài ra từ (cid:82) 1 mọi x ∈ L2([0, 1]), suy ra

(cid:107)Ax(cid:107)L2([0,1]) ≤

(cid:107)x(cid:107)L2([0,1])

1 √ 2

. với mọi x ∈ L2([0, 1]). Vậy A liên tục và (cid:107)A(cid:107) ≤ 1√ 2

Tóm lại việc định nghĩa A đã rõ ràng, ngoài ra A còn là tuyến tính liên tục. Ta có bài toán ngược như sau: Cho y ∈ L2([0, 1]), liệu có tồn tại x ∈ L2([0, 1])

mà Ax = y? Dựa trên kiến thức đã trình bày trong luận văn, ta có thể giải bài

toán bình phương tối thiểu tương ứng. Cụ thể hơn, ta sẽ chỉ ra A compact, từ đó tính A∗, hệ kỳ dị của A và A+.

Chứng minh A compact:

Ta lấy dãy (xn)n trong L2([0, 1]) bị chặn, nghĩa là tồn tại M > 0 sao cho (cid:107)xn(cid:107)L2([0,1]) ≤ M với mọi n ∈ N. Ta sẽ chỉ ra dãy (Axn)n có dãy con hội tụ

58

bằng cách áp dụng Định lý Arzelà-Ascoli.

Xét x tùy ý thuộc L2([0, 1]) mà (cid:107)x(cid:107)L2([0,1]) ≤ M , ta có

(cid:90) t2 (cid:90) t1

x(s)ds −

x(s)ds

0

0 (cid:90) t2

(cid:12)Ax(t1) − Ax(t2)(cid:12) (cid:12) (cid:12) = (cid:12) (cid:12) (cid:12) (cid:12) (cid:12)

=

x(s)ds

t1

(cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) (cid:12) √

t1 − t2(cid:107)x(cid:107)L2([t2,t1])

t1 − t2(cid:107)x(cid:107)L2([0,1]) √

≤ M

t1 − t2

với mọi 0 ≤ t2 < t1 ≤ 1. Do x là tùy ý thuộc L2([0, 1]) sao cho (cid:107)x(cid:107)L2([0,1]) ≤ M , ta suy ra dãy (Axn)n là đồng liên tục đều, nói riêng Axn ∈ C 0([0, 1]), ∀n. Ngoài ra từ bất đẳng thức trên, cho t2 = 0 và 0 < t1 = t ≤ 1, ta nhận được

|Ax(t)| ≤ M

t ≤ M,

chú ý là Ax(0) = 0. Suy ra dãy (Axn)n bị chặn điểm (thậm chí bị chặn đều) bởi Axn(0) = 0, ∀n còn |Axn(t)| ≤ M, ∀0 < t ≤ 1, ∀n. Theo Định lý Arzelà- Ascoli, (Axn)n có dãy con hội tụ về một hàm thuộc C 0([0, 1]) theo chuẩn (cid:107).(cid:107)∞. Hiển nhiên kết quả hội tụ thuộc C 0([0, 1]) nên cũng thuộc L2([0, 1]); và dãy hội tụ theo chuẩn (cid:107).(cid:107)∞ của C 0([0, 1]) thì cũng hội tụ theo chuẩn (cid:107).(cid:107)2 của L2([0, 1]).

Ta tính liên hợp A∗:

Bổ đề 3.3.3.

(cid:90) 1 (cid:90) t (cid:90) 1 (cid:90) 1

f (t)

g(s)dsdt =

g(s)

f (t)dtds,

0

0

0

s

trong đó f, g là các hàm khả tích trên [0, 1].

Chứng minh. Ta dùng Định lý Fubini.

59

Để ý rằng tập

T = {(s, t) ∈ R2 : 0 ≤ t ≤ 1, 0 ≤ s ≤ t}

được viết lại tương đương

T = {(s, t) ∈ R2 : 0 ≤ s ≤ 1, s ≤ t ≤ 1}.

Áp dụng Định lý Fubini, ta có điều phải chứng minh.

Bây giờ ta dùng bổ đề trên để tính A∗. Ta có với x ∈ X = L2([0, 1]) và

z ∈ Y = L2([0, 1]) thì

(cid:90) 1 (cid:90) t (cid:90) 1 (cid:90) 1

z(t)

x(s)dsdt =

x(s)

z(t)dtds.

(cid:104)Ax, z(cid:105)L2([0,1]) =

0

0

0

s

s z(t)dt với mọi s ∈ [0, 1].

Suy ra A∗z(s) = (cid:82) 1

Cuối cùng ta tính hệ kỳ dị của A:

Xét σ > 0 mà A∗Ax = σ2x. Điều này có nghĩa là

(cid:90) 1 (cid:90) τ

σ2x(t) =

x(s)dsdτ, ∀t ∈ [0, 1] . (1)

t

0

Từ (1) ta có x(1) = 0. Đạo hàm hai vế của (1) theo t, ta được

(cid:90) t

σ2x(cid:48)(t) = −

x(s)ds, ∀t ∈ [0, 1] . (2)

0

Từ (2) ta có x(cid:48)(0) = 0. Đạo hàm hai vế của (2) theo t, ta được

σ2x(cid:48)(cid:48)(t) = −x(t), ∀t ∈ [0, 1] . (3)

Phương trình (3) là phương trình vi phân cơ bản, nghiệm của nó có dạng

(cid:19) (cid:19)

x(t) = α cos

+ β sin

,

t ∈ [0, 1] .

(cid:18) t σ (cid:18) t σ

60

(cid:19)

=

= 0, suy ra

+ kπ (k ∈ Z). Do σ > 0 nên

Từ x(1) = 0 ta có cos Từ x(cid:48)(0) = 0 ta có β = 0. (cid:18) 1 σ

1 σ

π 2

2

=

.

ta lấy

+ jπ (j ∈ N), hay σj =

π 2

π(2j + 1)

1 σj

(cid:32) (cid:33)

, t ∈ [0, 1] thì

Xét ej(t) = αj cos

t σj

(cid:33) (cid:32) (cid:90) 1/σj (cid:90) 1

.

dt

v=t/σj= α2

cos2

cos2 vdv =

(cid:107)ej(cid:107)2

j σj

L2([0,1]) = α2 j

α2 j 2

t σj

0

0

2. Từ đó

Do vậy, để đảm bảo (cid:107)ej(cid:107)L2([0,1]) = 1, ta có thể lấy αj =

(cid:32) (cid:33) (cid:32) (cid:33)

(t) =

2 sin

, t ∈ [0, 1].

fj(t) = A

ej σj

t σj

Vậy hệ kỳ dị của A là

(cid:32) (cid:33) (cid:32) (cid:33)

2 cos

2 sin

.

σj =

, ej(t) =

, fj(t) =

2 π(2j + 1)

t σj

t σj

∞ (cid:88)

Cuối cùng với y ∈ D(A+), Định lý 3.3.1 nói rằng:

A+y =

σ−1 j (cid:104)y, fj(cid:105)L2([0,1])ej

j=1

trong đó σj, ej, fj được xác định như trên.

61

KẾT LUẬN CHUNG

Trong luận văn này, chúng tôi đã trình bày một số vấn đề như sau:

- Hệ thống lại một số kiến thức cơ sở của Giải tích hàm thông qua việc nhắc

lại những định nghĩa, tính chất quan trọng để phục vụ cho luận văn.

- Trình bày một số định nghĩa, tính chất của nghiệm bình phương tối thiểu,

nghịch đảo suy rộng, đồng thời chứng minh và đưa ra được ý nghĩa quan trọng

của tiêu chuẩn Picard.

- Trình bày phương pháp phân tích giá trị kỳ dị cho ma trận thực cũng như

đưa ra một số ứng dụng của phương pháp bình phương tối thiểu trong đại số

tuyến tính và giải bài toán ngược.

Tài liệu tham khảo

[1] Hoàng Tụy, Hàm thực và Giải tích hàm, Nhà xuất bản Giáo dục Việt

Nam, 2017.

[2] Phạm Kỳ Anh - Trần Đức Long, Giáo trình Hàm thực và Giải tích

hàm, Nhà xuất bản Đại học Quốc gia Hà Nội, 2001.

[3] J. Baumeister, Stable Solution of Inverse Problems, Friedr. Vieweg &

Sohn, Braunschweig/Wiesbaden, 1987.

[4] H. Engl, M. Hanke, and A. Neubauer. Regularization of Inverse Prob-

lems. Kluwer Acadademics, Dordrecht, Netherlands, 1996.

[5] A. Kirsch, An Introduction to the Mathematical Theory of Inverse

62

Problems, 2011.