3
Mục lục
Mở đầu 1
Danh sách ký hiệu 2
1 Bài toán giá trị riêng bậc hai 3
1.1 Bài toán giá trị riêng tiêu chuẩn . . . . . . . . . 3 . . . . . . .
1.1.1 Khái niệm . . . . . . . . . . . . . . . . 3 . . . . . . .
1.1.2 Một số thuật toán tìm giá trị riêng . . . 4 . . . . . . .
1.1.3 Bài toán giá trị riêng suy rộng . . . . . 9 . . . . . . .
1.2 Bài toán giá trị riêng bậc hai . . . . . . . . . . 13 . . . . . . .
1.2.1 Khái niệm . . . . . . . . . . . . . . . . 13 . . . . . . .
1.2.2 Tuyến tính hóa bài toán giá trị riêng bậc hai 15 . . . . .
1.2.3 Bộ ba Jordan của Q(λ ) . . . . . . . . . . . 18 . . . . .
1.2.4 Một số tính chất của bài toán giá trị riêng bậc hai 19 . .
1.3 Một số ứng dụng khác của bài toán giá trị riêng bậc hai 21 . . .
1.3.1 Biểu diễn nghiệm của phương trình vi phân tuyến
tính cấp hai . . . . . . . . . . . . . . . 21 . . . . . . .
1.3.2 Bài toán hạn chế bình phương nhỏ nhất 22 . . . . . . .
1.3.3 Một vài ví dụ . . . . . . . . . . . . . . 23 . . . . . . .
2 Giải số bài toán giá trị riêng bậc hai 26
2.1 Phương pháp số cho bài toán đặc . . . . . . . . 26 . . . . . . .
2.1.1 Phương pháp Newton . . . . . . . . . . 26 . . . . . . .
4
2.1.2 Phân tích Schur thực suy rộng . . . . . . . . . . . . 28
2.2 Phương pháp số cho bài toán thưa . . . . . . . . . . . . . . 29
2.3 Ví dụ số . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Kết luận 35
Tài liệu tham khảo 36
1
Mở đầu
Trong chương trình đại học sinh viên chỉ được giới thiệu bài toán giá trị
riêng bậc một tiêu chuẩn. Trong khi đó, có rất nhiều bài toán, đặc biệt là trong
lĩnh vực cơ học, được qui về bài toán giá trị riêng bậc hai, ta có thể đưa về bài
toán giá trị riêng suy rộng bậc một, nhưng mặt khác có thể nghiên cứu độc
lập. Trong luận văn này chúng tôi sẽ tìm hiểu và trình bày "Bài toán giá trị
riêng bậc hai". Ngoài phần mở đầu và kết luận, luận văn này gồm hai chương.
Chương 1: Bài toán giá trị riêng bậc hai. Chương này chúng tôi trình bày
khái niệm về bài toán giá trị riêng bậc hai, tính chất và ứng dụng của bài toán
giá trị riêng bậc hai.
Chương 2: Giải số bài toán giá trị riêng bậc hai. Chương này trình bày một
vài phương pháp giải bài toán giá trị riêng bậc hai. Chúng tôi chia bài toán
ra hai loại dựa trên kích thước bài toán và dạng dữ liệu. Bài toán đặc (thông
thường) và cỡ của bài toán nhỏ. Còn bài toán thưa là bài toán có kích cỡ lớn
nhưng dữ liệu dạng thưa. Căn cứ vào đặc điểm của từng bài toán, phương
pháp giải cũng có nhiều khác biệt. Chúng tôi trình bày phương pháp Newton
và phương pháp phân tích Schur cho bài toán đặc và phương pháp dựa trên
không gian con Krylov cho bài toán thưa. Ngoài ra có thêm một vài ví dụ số
để minh họa cho các phương pháp trên.
Luận văn được hoàn thành tại Trường Đại học Khoa học - Đại học Thái
Nguyên. Em muốn gửi lời biết ơn sâu sắc nhất tới thầy giáo TS. Nguyễn
Thanh Sơn đã giúp đỡ, hướng dẫn tận tình và đầy trách nhiệm để em hoàn
thành luận văn này. Tôi cũng xin được gửi lời cảm ơn chân thành tới các thầy
giáo, cô giáo của Trường Đại học Khoa học - Đại học Thái Nguyên, gia đình
1
tôi và các bạn lớp cao học toán K9Y đã tạo điều kiện thuận lợi cho tôi trong
quá trình học cao học và thực hiện bản luận văn này. Trong quá trình viết luận
văn không tránh khỏi sai sót rất mong nhận được sự góp ý chân thành của độc
giả.
Thái Nguyên, ngày 10 tháng 11 năm 2017
Tác giả luận văn
Phí Thị Nho
2
Danh sách ký hiệu
Trong toàn luận văn, ta dùng những ký hiệu với các ý nghĩa xác định trong
bảng dưới đây:
ma trận A.
chuyển vị của ma trận thực A.
A AT A∗ = (A)T liên hợp phức của ma trận A.
A liên hợp của số phức của ma trận A.
ker(A) nhân của ma trận A.
span(A) không gian con sinh bởi các cột của ma trận A.
A > 0 (A ≥ 0) ma trận A xác định dương (nửa xác định dương).
deg(P) bậc của đa thức P.
det(A) định thức của ma trận A.
rank(B) hạng của ma trận B.
QEP bài toán giá trị riêng bậc hai.
||x|| chuẩn Ơclit.
gradien của P.
∇P K j(x, A) không gian con Krylov .
3
Chương 1
Bài toán giá trị riêng bậc hai
Nội dung chính của chương này là định nghĩa, tính chất và một số ứng
dụng của bài toán giá trị riêng bậc hai. Tuy nhiên, chúng tôi cũng dành một
thời lượng đáng kể cho việc trình bày bài toán giá trị riêng tiêu chuẩn và bài
toán giá trị riêng suy rộng. Lí do chính là ta có thể chuyển một bài toán giá
trị riêng bậc hai về bài toán giá trị riêng bậc một để giải. Thêm vào đó, nhiều
phương pháp giải số bài toán bậc hai cũng xuất phát từ những ý tưởng tương
tự cho bài toán bậc một. Khi viết chương này chúng tôi đã tham khảo các tài
liệu [1–3].
1.1 Bài toán giá trị riêng tiêu chuẩn
1.1.1 Khái niệm
Định nghĩa 1.1.1. Cho một ma trận vuông A ∈ Rn×n. Tìm đại lượng vô hướng λ ∈ R và véc tơ x ∈ Rn, x (cid:54)= 0, sao cho:
Ax = λ x (1.1)
hay
(A − λ I)x = 0 (1.2)
có một nghiệm không tầm thường. Cho cặp (λ , x) là một nghiệm của (1.1)
hoặc (1.2) tương ứng thì
(1) λ được gọi là một giá trị riêng của A;
4
(2) x được gọi là một véc tơ riêng của A;
(3) (λ , x) được gọi là cặp riêng của A;
(4) Đặt σ (A) của tất cả các giá trị riêng của A được gọi là phổ của A;
(5) Tất cả các véc tơ riêng có cùng giá trị riêng λ cùng với véc tơ 0 tạo thành một không gian con tuyến tính của R gọi là không gian riêng của λ ;
(6) Một nghiệm không tầm thường y của y∗A = λ y∗ được gọi là véc tơ riêng trái tương ứng với λ . Một véc tơ riêng trái của A là một véc tơ riêng phải của AT tương ứng với các giá trị riêng λ , ta viết : AT y = λ y.
1.1.2 Một số thuật toán tìm giá trị riêng
• Cơ sở trực giao cho không gian Krylov
Cho không gian con Krylov K j(x) = K j(x, A) ta có thể lấy
{x, Ax, ..., A( j−1)x},
làm hệ sinh. Tuy nhiên các vectơ Akx hội tụ đến vectơ riêng tương ứng với giá trị riêng có modul lớn nhất của A nên chúng sẽ sớm có xu hướng phụ thuộc
tuyến tính. Do đó quá trình trực giao hoá Gram-Schmidt được áp dụng cho
các vectơ trong cơ sở này để tìm một cơ sở trực chuẩn của không gian Krylov. Giả sử {q1, q2, ..., qi} là cơ sở trực chuẩn cho K i(x), ở đây i ≤ j. Chúng
ta xây dựng vectơ q j+1 bằng cách trực chuẩn hóa A jx với q1, q2, ..., q j
i A jx,
j ∑ i=1
y j := A jx − qiq∗
và sau đó chuẩn hóa các vectơ kết quả
q j+1 = y j/||y j||.
5
Ta được {q1, q2, ..., q j+1} là một cơ sở trực chuẩn của K j+1(x), gọi chung là cơ sở Arnoldi. Các vectơ được gọi là vectơ Arnoldi tương ứng. Các vectơ qi
có thể được tính như sau
K j+1(x, A) = ℜ([x, Ax, ..., A jx]), (q1 = x/||x||),
(Aq1 = αq1 + β q2, β (cid:54)= 0),
= ℜ([q1, Aq1, ..., A jq1]) = ℜ([q1, αq1 + β q2, A(αq1 + β q2), ..., A j−1(αq1 + β q2)]), = ℜ([q1, q2, Aq2, ..., A j−1q2]), ... = ℜ([q1, q2, ..., q j−1, Aq j]).
Vì vậy, thay vì trực chuẩn hoá A jq1 với q1, q2, ..., q j, chúng ta có thể trực chuẩn hoá Aq j với q1, q2, ..., q j để có được q j+1. Điều này có lợi về mặt tính toán vì sẽ giúp giảm số phép tính cần thực hiện. Các thành phần r j của Aq j trực chuẩn với q1, q2, ..., q j được cho bởi
i Aqi).
j ∑ i=1
(1.3) qi(q∗ r j = Aq j −
Nếu r j = 0 thì thủ tục dừng lại. Điều đó có nghĩa là chúng ta đã tìm thấy một không gian con bất biến, cụ thể là span{q1, q2, ..., q j}. Nếu ||r j|| > 0 ta có được q j+1
. q j+1 = r j ||r j||
Do q j+1 và r j cùng phương, ta có
j+1Aq j
j+1r j = ||r j|| = q∗ q∗
(1.4)
i Aq j thì (1.3) - (1.4) có thể được viết
Phương trình cuối cùng được suy ra từ việc q j+1 trực chuẩn với tất cả các vectơ Arnoldi trước đó. Đặt hij = q∗
j+1 ∑ i=1
(1.5) Aq j = qihij.
6
3:
4:
Tìm một cơ sở trực giao của không gian Krylov
5:
Algorithm 1 Thuật toán Arnoldi Require: A ∈ R. Ensure: Một cơ sở trực giao cho K x x 1: Tính q1 = (cid:107)x2(cid:107) 2: for j = 1, . . . do r := Aq j for i = 1, . . . , j do
i r; r := r − qihi j;
6:
7:
8:
hi j := q∗
end for h j+1, j := (cid:107)r(cid:107); if h j+1 j = 0 then
9:
10:
11:
(cid:1) , H ∈ R( j+1)× j return (cid:0)q1, q2, ..., q j
12: end for 13: return (q1, q2, ..., qk+1) , H ∈ R(k+1)×k 14: Thuật toán Arnoldi dừng lại nếu h j+1 j = 0.
; end if q j+1 = r h j+1 j
Định nghĩa Qk = [q1, q2, ..., qk] thì phương trình (1.5) được viết như sau
(1.6) AQk = QkHk + [0, . . . 0, qk+1hk+1k] .
Phương trình (1.6) được gọi là quan hệ Arnoldi.
• Cơ sở Lanczos
Cơ sở Lanczos được xây dựng giống như cơ sở Arnoldi nhưng áp dụng cho ma trận Hermite hoặc đối xứng thực. Bằng cách nhân trái (1.6) với Q∗ k
chúng ta được
kAQk = Q∗
kQkHk = Hk.
Q∗
7
Nếu A là Hermite thì Hk cũng là Hermite và do đó là ba đường chéo. Chúng ta ký hiệu ma trận ba đường chéo này là Tk. Do tính đối xứng phương trình
(1.3) được đơn giản hoá như sau
jAq j) (cid:124) (cid:123)(cid:122) (cid:125) α j∈R
j−1Aq j) (cid:125) (cid:123)(cid:122) β j−1∈F
(1.7) r j = Aq j − qi (q∗ −q j−1 (q∗ = Aq j − α jq j − β j−1q j−1. (cid:124)
j+1(Aq j − α jq j − β j−1q j−1)
Tương tự như trên, chúng ta nhân từ bên trái (1.7) với q j+1 để có được
j+1r j = q∗ j+1Aq j = β j.
||r j|| = q∗ = q∗
Từ đây suy ra β j ∈ R, do đó
(1.8) β jq j+1 = r j, β j = ||r j||.
Từ (1.7) - (1.8) ta nhận được
Aq j = β j−1q j−1 + α jq j + β jq j+1.
Thu thập các phương trình với j = 1, ..., k chúng ta có
α1 β1
β1 α2 β2
(1.9) AQk = Qk +βk[0, ..., 0, qk+1].
β2 α3 . . . . . . . . . βk−1 βk−1 αk
(cid:125) (cid:124) (cid:123)(cid:122) Tk
Như vậy, Tk ∈ Rk×k là đối xứng thực. Đẳng thức (1.9) được gọi là quan hệ Lanczos.
Thuật toán Lanczos được trình bày trong Thuật toán 2 này có ba vectơ q, r
và v được sử dụng.
Cho (λi, si) là một cặp riêng của Tm, tức là
(1.10) T si = λisi.
8
Khi đó, AQmsi = QmTmsi = λiQmsi. Vì vậy, giá trị riêng của Tm cũng là giá trị riêng của A. Các vectơ riêng của A tương ứng với giá trị riêng λi là
(1.11) yi = Qmsi.
Ta có thuật toán sau
1: Cho A ∈ Fn×n là Hermitian. Thuật toán này sẽ tìm mối quan hệ Lanczos (1.9), nghĩa là một cơ sở trực giao Qm = [q1, .., qm] cho K m(x) trong đó m là chỉ số nhỏ nhất sao cho K m(x) = K m+1(x), và (các yếu tố không tầm thường của) các ma trận ba đường chéo Tm .
2: q := x/||x||; Q1 = [q]; 3: r := Aq; 4: α1 := q∗r; 5: r := r − α1q; 6: β1 := ||r||; 7: for j = 2, 3, ... do
8:
9:
10:
11:
12:
13:
Algorithm 2 Thuật toán Lanczos cơ bản để tìm một cơ sở trực giao cho không gian Krylov K m(x).
14:
v = q; q := r/β j−1; Q j := [Q j−1, q]; r := Aq − β j−1v; α j := q∗r; r := r − α jq; β j := ||r||; if β j = 0 then
15:
trả lại (Q ∈ Fn× j; α1, ..., α j; β1, ..., β j−1);
16: end for
end if
Sau khi tính được các cơ sở trực giao V của một không gian con Krylov
của ma trận A, thay vì tính giá trị riêng của A, ta tính giá trị riêng của ma trận
9
V T AV có cỡ bé hơn ma trận A ban đầu. Người ta đã chứng minh được rằng các giá trị riêng của V T AV xấp xỉ rất tốt các giá trị riêng của A theo thứ tự
giảm dần của mô đun. Cụ thể, xin xem trong tài liệu [1].
1.1.3 Bài toán giá trị riêng suy rộng
• Chùm ma trận chính qui và dạng chính tắc Weierstrass
Định nghĩa 1.1.2. Ma trận A − λ B, ở đó A, B là những ma trận cỡ m × n, được gọi là chùm ma trận hoặc tổng quát hơn là một λ ma trận bậc một, trong đó
λ là tham số.
Định nghĩa 1.1.3. Nếu A, B là ma trận vuông cỡ n × n và det(A − λ B) không đồng nhất bằng không, chùm A − λ B được gọi là chính qui. Nếu không, nó
được gọi là suy biến. Khi A − λ B là chính qui, P(λ ) = det(A − λ B) được gọi
là đa thức đặc trưng của A − λ B. Các giá trị riêng của A − λ B được xác định
bởi
(1) Nghiệm của P(λ ) = 0
(2) ∞ (với bội n − deg(P)) nếu deg(P) < n
Ví dụ 1.1.4. Cho
1 0 0 2 0 0
A − λ B = − λ 0 1 0 0 0 0 0 0 0 0 0 1
Ta có
P(λ ) = det(A − λ B)
= (1 − 2λ )(1 − 0λ )(0 − λ )
= (2λ −1)λ .
, 0, và ∞. Vậy các giá trị riêng là: 1 2
10
Mệnh đề 1.1.5. Cho A − λ B là chùm ma trận chính qui cỡ n × n. Nếu B không suy biến, mọi giá trị riêng của A − λ B là hữu hạn và trùng với các giá trị riêng của AB−1 hoặc B−1A. Nếu B là suy biến, A − λ B có giá trị riêng ∞
bội n − rank(B). Nếu A không suy biến, giá trị riêng của A − λ B trùng với nghịch đảo của các giá trị riêng của A−1B hoặc BA−1, trong đó một giá trị riêng không của A−1B tương ứng với một giá trị riêng ∞ của A − λ B.
Chứng minh. Nếu B không suy biến thì B−1tồn tại và det(B), det(B−1) đều
khác không. Ta có
det(AB−1 − λ I) = det((A − λ B)B−1)
= det(A − λ B)det(B−1).
Theo đó
det(AB−1 − λ I) = 0 ⇔ det(A − λ B) = 0,
tức là tập giá trị riêng của A − λ B và AB−1 là trùng nhau. Khẳng định cho B−1A được chứng minh tương tự.
Trong trường hợp B suy biến, giả sử rank(B) = k < n. Kí hiệu phân tích
giá trị riêng kì dị của B là
B = UΣV T ,
trong đó Σ là ma trận chéo chỉ có k phần tử đường chéo chính khác không và
U,V là các ma trận trực giao. Khi đó
det(A − λ B) = det(A − λUΣV T )
= det(U(U T AV − λ Σ)V T ) = det(U)det(U T AV − λ Σ)det(V T ) = ±det(U T AV − λ Σ),
do định thức của ma trận trực giao chỉ có thể bằng ±1. Khi đó rõ ràng det(U T AV − λ Σ) là một đa thức bậc k nên ∞ là giá trị riêng bội n − k.
11
Cuối cùng, nếu A không suy biến thì A−1 tồn tại. Ta có ngay
det(A − λ B) = det(A(I − λ A−1B)) = det(A)det(I − λ A−1B).
, Nếu giả sử λ (cid:54)= 0, đặt µ = 1 λ
A−1B) det(A − λ B) = det(A)det(I − 1 µ
= −µdet(A)det(A−1B − µI).
là giá trị riêng của
1 Hay λ là giá trị riêng của A − λ B khi và chỉ khi µ = λ A−1B. Khẳng định cho BA−1 được chứng minh tương tự.
Định nghĩa 1.1.6. Cho λ (cid:48) là một giá trị riêng hữu hạn của chùm chính qui A − λ B. x (cid:54)= 0 là một véc tơ riêng phải nếu (A − λ (cid:48)B)x = 0 hoặc tương đương Ax = λ (cid:48)Bx. Nếu λ (cid:48) = ∞ là một giá trị riêng và Bx = 0 thì x là véc tơ riêng phải. Một véc tơ riêng trái của A − λ B là một véc tơ riêng phải của (AT − λ BT ).
Ví dụ 1.1.7. Xét dao động tắt dần của chất điểm trong hệ lò xo. Có hai chùm
ma trận phát sinh tự nhiên từ bài toán này. Thứ nhất, có bài toán giá trị riêng
(cid:35) (cid:34) −M−1B −M−1K Ax = x = λ x. I 0
Khi
(cid:35) (cid:34) (cid:35) (cid:34) −B −K M 0 x. x = λ I 0 0 I
Đây là một công thức tốt hơn nếu M là điều kiện rất xấu, do đó M−1B và
M−1K là khó tính chính xác .
Thứ hai, nó rất phổ biến để xem xét các trường hợp B = 0 (không tắt dần)
do đó phương trình vi phân ban đầu là
M ¨x(t) + Kx(t) = 0.
12
Các cách giải của dạng
xi(t) = eλitxi(0),
i eλitMxi(0) + eλitKxi(0) = 0, λ 2
ta có
hoặc
λ 2 i Mxi(0) + Kxi(0) = 0.
Nói cách khác, −λ 2 i là một giá trị riêng và xi(0) là véc tơ riêng phải của chùm K − λ M. Khi ta giả thiết M không suy biến, đây cũng là một giá trị riêng và véc tơ riêng phải của M−1K. Định nghĩa tiếp theo cho thấy làm thế nào để
tổng quát khái niệm về sự tương đồng với ma trận chùm.
Định nghĩa 1.1.8. Cho PL và PR là ma trận không suy biến. Khi đó, chùm A − λ B và PLAPR − λ PLBPR được gọi là tương đương.
Nhận xét 1.1.9. Đây là một mở rộng khái niệm ma trận tương đương.
Mệnh đề 1.1.10. Chùm ma trận chính qui tương đương A − λ B và PLAPR − λ PLBPR có cùng giá trị riêng, x là một véc tơ riêng phải của A − λ B nếu và chỉ nếu P−1 R x là một véc tơ riêng phải của PLAPR − λ PLBPR, y là véc tơ riêng trái của A − λ B nếu và chỉ nếu (PT L )−1y là một véc tơ riêng trái của
PLAPR − λ PLBPR.
Chứng minh. Mệnh đề được chứng minh nhờ ba lập luận sau đây
R x = 0.
det(A − λ B) = 0 nếu và chỉ nếu det(PL(A − λ B))PR = 0.
L y)T PL(A − λ B)PR = 0.
(A − λ B)x = 0 nếu và chỉ nếu PL(A − λ B)PRP−1 yT (A − λ B) = 0 nếu và chỉ nếu (P−T
Định lí sau sẽ khái quát công thức về dạng chính tắc Jordan cho ma trận
đơn. Đối với chùm ma trận chính qui, nó được gọi là dạng chính tắc Weier-
strass.
13
Định lí 1.1.11. Cho A − λ B là chính qui, khi đó tồn tại Pm ma trận khả nghịch sao cho
PL(A − λ B)PR = diag(Jn1(λ1) − λ In1, ..., Jnk(λnk) − λ Ink, Nm1, ..., Nmr).
Ở đó, Jniλi là một khối Jordan cỡ ni × ni với giá trị riêng λi,
λi
1 . . . , Jni(λi) = . . . . . . . . . 1 λi
và Nmi là một khối Jordan cho λ = ∞ với bội mi
1 λ . . . Nmi = = Imi − λ Jmi(0). . . . . . . . . . λ 1
1.2 Bài toán giá trị riêng bậc hai
1.2.1 Khái niệm
Định nghĩa 1.2.1. Cho các ma trận thực vuông M,C, K cỡ n × n. Kí hiệu
Q(λ ) = Mλ 2 +Cλ + K.
và gọi đó là một λ - ma trận bậc hai (hay vắn tắt là λ - ma trận). Bài toán giá trị riêng bậc hai là bài toán tìm số λ ∈ C sao cho có véc tơ khác không x ∈ Cn
để cho
(Mλ 2 +Cλ + K)x = 0. (1.12)
Ngoài ra, ta cũng xét bài toán tìm y, λ sao cho
y∗(Mλ 2 +Cλ + K) = 0, (1.13)
14
trong đó ∗ là kí hiệu liên hợp phức. Các véc tơ x, y lần lượt là các véc tơ riêng phải và véc tơ riêng trái tương ứng với các giá trị riêng λ . Bài toán giá trị
riêng bậc hai được gọi là đối xứng nếu M,C, K là các ma trận đối xứng. Đặt m(x) = x∗Mx, c(x) = x∗Cx, k(x) = x∗Kx với x ∈ Cn khác không.
Nếu bài toán giá trị riêng bậc hai đối xứng thì đây là hàm có giá trị thực.
Cũng giống như bài toán giá trị riêng tiêu chuẩn, bội đại số của một giá trị riêng λ0 là bậc α của nghiệm λ0 của đa thức det(Q(λ )). Bội hình học của γ của λ0 là số chiều của hạt nhân ker(Q(λ0)). Giá trị riêng được gọi là đơn nếu α = γ = 1 và được gọi là nửa đơn nếu α = γ. Giá trị riêng được gọi là
khuyết nếu nó không phải nửa đơn.
Véc tơ x1 được gọi là một véc tơ riêng suy rộng tương ứng với giá trị riêng
λ0 nếu x1 là nghiệm của phương trình
(1.14) Q(λ0)x1 = −Q(cid:48)(λ0)x0,
với x0 là một véc tơ riêng ứng với λ0, Q(cid:48)(λ0) là đạo hàm của Q theo từng phần tại λ0.
Ta có thể chỉ ra một giá trị riêng nửa đơn thì sẽ không có véc tơ riêng suy
rộng đi kèm. Ta cũng biết rằng nếu giá trị riêng khuyết thì số véc tơ riêng
tương ứng sẽ không lấp đủ bội đại số của nó. Khái niệm véc tơ riêng suy rộng
được định nghĩa như sau.
Định nghĩa 1.2.2. Các véc tơ x0, x1, ..., xm−1 được gọi là một xích Jordan có độ dài m của Q(λ ) tương ứng giá trị riêng λ0 nếu m đẳng thức sau được thỏa
mãn
Q(λ0)x0 =0, Q(λ0)x1 + Q(cid:48)(λ0)x0 =0,
Q(cid:48)(cid:48)(λ0)x0 =0, Q(λ0)x2 + Q(cid:48)(λ0)x1 + 1 2
· · · · · ·
15
Q(λ0)xm−1 + Q(cid:48)(λ0)xm−2 + Q(cid:48)(cid:48)(λ0)xm−3 =0, 1 2
với x0 (cid:54)= 0 là một véc tơ riêng tương ứng với λ0. Khi đó, các véc tơ
x1, x1, ..., xm−1,
được gọi là các véc tơ riêng suy rộng.
• Có thể coi véc tơ riêng x0 là một xích Jordan có độ dài Nhận xét 1.2.3.
1. Vì thế khái niệm này mở rộng khái niệm véc tơ riêng thông thường.
Chú ý 1.2.4. Các véc tơ riêng suy rộng không nhất thiết độc lập tuyến tính. Nói riêng, có thể có vài véc tơ riêng suy rộng ứng λ0 bằng 0.
• Bài toán đối xứng (1.12) QEP được gọi là hyperbolic Định nghĩa 1.2.5.
nếu
c(x)2 > 4m(x)k(x), ∀x (cid:54)= 0, x ∈ Cn
• Bài toán QEP được gọi là tựa hyperbolic nếu
c(x)2 > 4m(x)k(x),
với mọi x là véc tơ riêng của Q(λ ).
• Bài toán QEP được gọi là elliptic nếu
c(x)2 < 4m(x)k(x),
với mọi giá trị riêng của Q(λ ).
1.2.2 Tuyến tính hóa bài toán giá trị riêng bậc hai
Định nghĩa 1.2.6. Cho λ - ma trận bậc hai cỡ n × n
Q(λ ) = Mλ 2 +Cλ + K. (1.15)
16
Một λ - ma trận bậc một A − λ B được gọi là một tuyến tính hóa của (1.15)
nếu tồn tại 2 λ - ma trận E(λ ), F(λ ) cỡ 2n × 2n có định thức là hằng số khác
không sao cho
(cid:34) (cid:35) Q(λ ) 0 =E(λ )(A − λ B)F(λ ). 0 In
Bổ đề 1.2.7. Tập các giá trị riêng của Q(λ ) và A − λ B là trùng nhau.
Chứng minh. Thật vậy, λ0 là một giá trị riêng của Q(λ ) khi và chỉ khi det(Q(λ0)) = 0. Ta có
det(Q(λ0)) = det(Q(λ0))det(In)
(cid:32) (cid:34) (cid:35) (cid:33)
= det 0 Q(λ 0) 0 In
= det(E(λ0)(A − λ0B)F(λ0))
= det(E(λ0))det(A − λ0B)det(F(λ0)),
do giả thiết det(E(λ0)) (cid:54)= 0, det(F(λ0)) (cid:54)= 0, det(Q(λ0)) = 0 khi và chỉ khi det(A − λ0B) = 0.
Tuyến tính hóa luôn tồn tại và không duy nhất. Người ta cố gắng chọn
những tuyến tính hóa sao cho nó bảo toàn các tính chất của λ -ma trận ban
đầu hoặc thuận lợi cho quá trình tính toán. Sau đây là hai dạng tuyến tính hóa
phổ biến.
(cid:34) (cid:35) (cid:34) (cid:35) N 0 N 0 − λ L1 : −K −C 0 M
và
(cid:34) (cid:35) (cid:34) (cid:35) C M −K 0 , − λ L2 : 0 N N 0
17
trong đó N là một ma trận không suy biến cỡ n × n. Ta có thể chỉ ra, chẳng hạn dạng L1, ma trận E(λ ) và F(λ ) như sau
(cid:35) (cid:34) (C + λ M)N−1 −I , E(λ ) = N−1 0
(cid:34) I (cid:35) 0 , F(λ ) = I λ I
Để thấy rõ hơn mối liên hệ giữa giá trị riêng, véc tơ riêng của bài toán
QEP và tuyến tính hóa của nó. Đặt u = λ x, khi đó bài toán QEP được đưa về
dạng
λ Mu + λCx + Kx = 0,
hay
(cid:34) (cid:35) (cid:34) (cid:35) (cid:34) (cid:35) (cid:34) (cid:35) I x x 0 I 0 = 0. − λ u u −K −C 0 M
Phát biểu sau đây sẽ khẳng định việc chọn bất kì N
Bổ đề 1.2.8. Bài toán giá trị riêng L1, L2 là bất biến đối với N
(cid:34) (cid:35) N 0 Chứng minh. Xét bài toán L1, do N khả nghịch nên ma trận 0 M
cũng khả nghịch và
(cid:34) (cid:35)−1 (cid:35) (cid:34) N−1 N 0 0 = . 0 M 0 M−1
Khi đó, bài toán giá trị riêng L1 tương đương với bài toán
(cid:34) (cid:35)−1 (cid:34) (cid:35) N N 0 0 − λ I, −K −C 0 M
hay
18
(cid:34) (cid:35) I 0 − λ I. (1.16) −M−1K −M−1C
Rõ ràng bài toán giá trị riêng (1.16) không phụ thuộc vào việc chon N. Việc chứng minh cho L2 được thực hiện tương tự.
1.2.3 Bộ ba Jordan của Q(λ )
Nhắc lại rằng một phân tích Jordan của ma trận A là
A = XJX −1. (1.17)
với J là ma trận chéo khối J = (J1, · · ·, Jk) và Ji, i = 1, k, là các khối Jordan
λi
1 . . . ∈ Rmi×mi. Ji =
. . . . . . 1 λi
Ma trận không suy biến X chứa các véc tơ riêng và các véc tơ riêng suy rộng
của A.
Mở rộng khái niệm này nâng lên cho một λ - ma trận bậc hai, ta thu được khái niệm bộ ba Jordan. Giả sử det(M) (cid:54)= 0. Giả sử J = diag(J1, · · ·, Jk) với Ji, i = 1, · · ·, k là các khối Jordan cỡ mi và m1 + · · · + mk = 2n. Ta gọi
mi−1],
0, · · ·, xi
Xi = [xi
là ma trận cỡ n × mi có các cột lập thành một xích Jordan độ dài mk ứng với giá trị riêng λi. Tiếp theo, ta đặt
X = [X1, · · ·, Xk] ∈ Rn×2n.
Khi đó, cặp (X, J) được gọi là một cặp Jordan của Q(λ ) và thỏa mãn ma trận
(cid:34) (cid:35) X , XJ
19
là không suy biến và
MXJ2 +CXJ + KX = 0. (1.18)
Xích Jordan trái được xây dựng tương tự cho ma trận Y cỡ 2n × n định nghĩa
như sau
(cid:34) X (cid:35)−1 (cid:34) (cid:35) 0 Y = M−1. XJ I
Nếu mối giá trị riêng đều là nửa đơn, chuyển vị của những hàng của Y lập
nên tập các véc tơ riêng trái của Q(λ ). Cuối cùng bộ ba (X, J,Y ) được gọi là
một bộ ba Jordan. Người ta đã chỉ ra
(1.19) XY M = 0 và XJY M = I.
1.2.4 Một số tính chất của bài toán giá trị riêng bậc hai
Mệnh đề 1.2.9. Giả sử các ma trận M,C, K là thực. Khi đó mọi nghiệm của bài toán giá trị riêng bậc hai đều là số thực hoặc là các cặp số phức liên hợp
nhau. Hơn nữa nếu x là véc tơ riêng phải tương ứng với λ thì x cũng là véc tơ
riêng phải ứng với λ .
Chứng minh. Theo định nghĩa, tồn tại véc tơ khác không x ∈ C, số λ ∈ C sao
cho
(Mλ 2 +Cλ + K)x = 0. (1.20)
Do đó định thức
P(λ ) := det(Mλ 2 +Cλ + K) = 0.
Do M,C, K thực nên P(λ ) là một đa thức của λ có hệ số thực. Khẳng định
thứ nhất được suy ra từ tính chất của nghiệm của đa thức hệ số thực.
20
Để chứng minh khẳng định thứ hai, ta lấy liên hợp hai vế của (1.20) với
2
lưu ý M,C, K là các ma trận thực, ta thu được
(Mλ +Cλ + K)x = 0.
Đây cũng là điều cần chứng minh.
Mệnh đề 1.2.10. Các bài toán giá trị riêng bậc hai đối xứng và đồng thời là hyperbolic hoặc tựa hyperbolic đều có giá trị riêng thực.
Chứng minh. Xét phương trình bậc hai với ẩn là λ Giả sử x là một véc tơ
riêng ứng với λ
x∗Mxλ 2 + x∗Cxλ + x∗Kx = 0. (1.21)
. λ = (1.22) Nghiệm của phương trình này có thể biểu thị dưới dạng −c(x) ± (cid:112)c(x)2 − 4m(x)k(x) 2m(x)
Khi đó, kết luận của mệnh đề được suy ra từ tính không âm của đại lượng c(x)2 − 4m(x)k(x).
Mệnh đề 1.2.11. Bài toán QEP đối xứng, elliptic chỉ có giá trị riêng phức.
Chứng minh. Kết luận này được suy ra trực tiếp từ định nghĩa và dạng biểu
diễn (1.22) của giá trị riêng.
Một trường hợp riêng thú vị của mệnh đề trên được phát biểu như sau
Hệ quả 1.2.12. Giả sử M, K là các ma trận đối xứng xác định dương, C là phản đối xứng, tức là CT = −C. Khi đó, bài toán QEP chỉ có giá trị riêng
thuần ảo.
Chứng minh. Ta có, với x ∈ C thì
c(x) = x∗Cx = x∗CT x = −x∗Cx = −c(x).
21
Điều đó suy ra c(x) là số thuần ảo. Hơn nữa, bình phương của một số thuần
ảo là một số âm. Do đó, kết hợp với giả thiết m(x), k(x) dương và dạng biểu
diễn (1.22) của giá trị riêng, ta suy ra điều cần chứng minh.
Định nghĩa 1.2.13. Cho ma trận M,C đối xứng xác định dương, K đối xứng nửa xác định dương. Điều kiện tắt dần (over damping) được định nghĩa là
((x∗Cx)2 − 4(x∗Mx)(x∗Kx)) > 0 . (1.23) min ||x||2=1
Một hệ cơ học được miêu tả dưới dạng hệ phương trình vi phân có các ma
trận hệ số M,C, K thỏa mãn điều kiện (1.23) được gọi là hệ tắt dần.
Mệnh đề 1.2.14. Hệ tắt dần chỉ có các giá trị riêng thực, âm.
Chứng minh. Dễ thấy, một hệ tắt dần là hyperbolic. Áp dụng mệnh đề 1.2.10
ta suy ra rằng các giá trị riêng của nó là thực. Dấu của nó là âm được suy ra
từ việc áp dụng định lí Viete cho phương trình bậc hai (1.2.13).
1.3 Một số ứng dụng khác của bài toán giá trị riêng bậc
hai
1.3.1 Biểu diễn nghiệm của phương trình vi phân tuyến tính cấp
hai
Xét phương trình vi phân tuyến tính cấp hai
M ¨q(t) +C ˙q(t) + Kq(t) = f (t). (1.24)
Phương trình này là mô hình toán học cho nhiều hiện tượng và đặc biệt được
sử dụng nhiều trong cơ học cấu trúc. Trong (1.24), M,C, K là các ma trận thực
cỡ n × n.
Giả sử M không suy biến và (X, J,Y ) là bộ ba Jordan của Q(λ ). Từ đẳng
thức (1.18), ta có thể kiểm tra được rằng
q(t) = XeJta, (1.25)
22
với a ∈ R2n là một véc tơ hằng bất kì là nghiệm tổng quát của phương trình
thuần nhất tương ứng với (1.24). Thật vậy
(1.26) ˙q(t) = XJeJta, ¨q(t) = XJ2eJta.
Thay (1.25), (1.26) vào (1.24) với f (t) ≡ 0,
M ¨q(t) +C ˙q(t) + Kq(t) = (MXJ2 +CXJ + KX)eJta = 0
(cid:90) t
Tiếp theo, ta chỉ ra
0
e−JsY f (s)ds qp(t) = XeJt
(cid:90) t
là một nghiệm riêng của (1.24). Thật vậy
0 (cid:90) t
e−JsY f (s)ds ˙qp(t) = XJeJt
0
e−JsY f (s)ds + XJY f (t). ¨qp(t) = XJ2eJt
(cid:90) t
Vì thế, kết hợp (1.25) và (1.26), ta thu được
0
e−JsY f (s)ds + MXJY f (t) M ¨qp(t) +C ˙q(t) + Kqp(t) = (MXJ2 +CXJ + KX)eJt
= f (t).
(cid:90) t
Do vậy, nghiệm tổng quát của (1.24) là
0
q(t) = XeJt(a + e−JsY f (s)ds).
1.3.2 Bài toán hạn chế bình phương nhỏ nhất
Cho A ∈ Rn×n là ma trận đối xứng, b ∈ Rn. Xét bài toán bình phương tối
thiểu có ràng buộc
min{xT Ax − 2bT x : xT x = α 2}. (1.27)
23
Bài toán này có thể được đưa về một bài toán giá trị riêng bậc hai bằng cách
áp dụng phương pháp nhân tử Lagrange. Cho
φ (x, λ ) = xT Ax − 2bT x − λ (xT x − α 2).
Đạo hàm ϕ theo x, và λ sinh ra các phương trình
Ax − λ x = b, α 2 = xT x. (1.28)
Ta cần tìm nghiệm λ nhỏ nhất của các phương trình này để giải bài toán
(1.27). Giả sử λ không là một giá trị riêng của A. Ta đặt
y = (A − λ I)−2b = (A − λ I)−1x.
Khi đó (1.28) tương đương với:
bT y − α 2 = 0, (1.29)
(A − λ I)2y = b. (1.30)
Từ ( 1.29) ta có :
bT y α 2 = 1. Bằng cách khai triển (1.30) ta thu được bài toán giá trị riêng bậc hai đối xứng
)y = 0. (λ 2I − 2λ A + A2 − α −2bbT (cid:17) (cid:16) (1.31)
Nghiệm của (1.27) là
x = (A − λ I)−1 b, (1.32)
trong đó λ là giá trị riêng nhỏ nhất của (1.32).
1.3.3 Một vài ví dụ
Ví dụ 1.3.1. Cho λ ma trận bậc hai
Q1(λ ) = Mλ 2 + Dλ + K,
24
với
0.5 1.75 1 1 0.2
, K = . M = , D = 1.5 7.5 2 1 1 2.5 1 5.0 0.2 1
Dễ thấy cả ba ma trận hệ số M, D, K là các ma trận đối xứng, xác định dương.
Ngoài ra, ta kiểm tra được nó thỏa mãn điều kiện tắt dần. Do vậy, hệ cơ học được miêu tả bởi Q1λ là một hệ tắt dần.
Sử dụng phần mềm MATLAB, câu lệnh
[X, λ ] = polyeig(K, D, M),
ta tính được các giá trị riêng, lấy xấp xỉ 4 chữ số thập phân sau dấu phẩy là
λ1 = −4.7586, λ2 = −2.6614, λ3 = −1.6266,
λ4 = −1.1556, λ5 = −0.2713, λ6 = −0.0264.
và ma trận các véc tơ riêng 0.2415 −0.9901 −0.6870 0.9141 0.6933 −0.5228
−0.9700 −0.1268 −0.2213 0.2623 −0.2549 0.6165 0.0273
0.0601 −0.6921 0.3092 −0.6740 −0.5887 Như vậy, điều này đã minh họa cho mệnh đề 1.2.14 về giá trị riêng của
một hệ tắt dần. Ngoài ra, có thể kiểm tra thấy 3 véc tơ riêng đầu tiên độc lập
tuyến tính. Các véc tơ riêng khác đều biểu thị tuyến tính qua 3 véc tơ này.
Ta sẽ xét một tuyến tính hóa bảo toàn tính đối xứng của Q(λ ) nói trên
được định nghĩa như sau
(cid:34) (cid:35) (cid:34) (cid:35) K 0 K . , E1 = A1 = K D −M
và một tuyến tính hóa khác không bảo toàn tính đối xứng
(cid:34) (cid:35) (cid:34) (cid:35) K K 0 . A2 = , E2 = M −K −D
25
Bằng cách sử dụng các lệnh eig(A1, E1), và eig(A2, E2), ta thu được tập các giá trị riêng λ1, λ2, λ3, λ4, λ5, λ6, như đề cập ở trên.
Ví dụ 1.3.2. Xét λ -ma trận bậc hai
Q2(λ ) = Mλ 2 + Dλ + K,
−1.5 1 0
với M, D giống như ở ví dụ 1 và K cho bởi 1 1 3 . 0 1 −1
Dễ thấy cả 3 ma trận đều đối xứng và ta có thể kiểm tra Q2(λ ) thỏa mãn điều kiện hyperbolic. Tuy nhiên, do K không nửa xác định dương nên Q2(λ )
là một hệ hyperbolic nhưng không phải hệ tắt dần. Bằng cách tương tự như ví dụ 1.3.1, ta tính được các giá trị riêng của Q2(λ ) và các tuyến tuyến tính hóa
của chúng như sau:
λ1 = −4.6886, λ2 = −4.0610, λ3 = 0.7556,
λ4 = −0.5652, λ5 = 0.2132, λ6 = −2.1540.
Điều này minh họa cho mệnh đề 1.2.10
26
Chương 2
Giải số bài toán giá trị riêng bậc hai
Trong chương này, chúng tôi trình bày một số phương pháp số giải bài
toán giá trị riêng bậc hai. Chúng tôi chia bài toán ra hai loại dựa theo dạng dữ
liệu. Nếu bài toán có cỡ nhỏ đến vừa và dạng đặc, tức là số phần tử 0 trong
các ma trận không đáng kể, chúng tôi trình bày phương pháp dựa theo phân
tích Schur của ma trận và phương pháp Newton giải phương trình phi tuyến.
Để viết chương này, ngoài tài liệu chính [5], chúng tôi còn tham khảo các tài
liệu [2–4]
2.1 Phương pháp số cho bài toán đặc
2.1.1 Phương pháp Newton
Để áp dụng phương pháp Newton giải phương trình phi tuyến cho bài toán
QEP, ta đưa nó về một bài toán trong không gian n + 1 chiều như sau
(cid:34) (cid:35) (cid:34) (cid:35) x P := = 0. (2.1) Q(λ )x vT x − 1 λ
Đạo hàm Fre’chet của P được tính bằng
(cid:35)
. ∇P = (2.2) (cid:34) Q(λ ) Q(cid:48)(λ )x vT 0
.
27
Nhắc lại rằng phần chính của phương pháp Newton cho phương trình phi
tuyến (cid:34) (cid:35) x P = 0, λ
là dãy lặp (cid:34) (cid:35) (cid:34) (cid:35) (cid:34) (cid:35) xs xs = . − (∇P)−1P (2.3) λs
xs+1 λs+1 Sử dụng (2.1) và (2.2) và kí hiệu Qs = Q(λs) và Q(cid:48) λs s = Q(cid:48)(λs), (2.3) được đưa
về dạng
(cid:35) (cid:34) (cid:35) (cid:34) (cid:35)
= − . (2.4) xs+1 − xs λs+1 − λs (cid:34) Qs Q(cid:48) sxs vT 0 s Qsxs vT s xs − 1
s xs = 1. Khi đó (2.4) trở thành
Giả sử xs được chuẩn tắc hóa đối với vs, tức là vT
sxs,
Qsxs+1 = −(λs+1 − λs)Q(cid:48) (2.5)
vT s xs+1 = 1.
, ta viết lại (2.5) dưới dạng thuật toán như sau. Đặt us+1 = xs+1 (−λs+1 + λs)
1: k = 0;
3:
2: while (k < N; ||Xk+1 − Xk|| > ε) do Giải Qsuk+1 = QsXk tìm uk+1;
4:
Algorithm 3 Thuật toán Newton cho QEP. Require: M,C, K, x0, λ0, ε, N. Ensure: (X, λ ).
5:
6:
; Tính λk+1 = λk − V T k Xk (V T k uk+1)
7: end while 8: X = Xk; λ = λk;
Tính Xk+1 = Cuk+1; k = k + 1;
28
Trong thuật toán trên C là một ma trận chuẩn tắc hóa bất kì
Để kết thúc mục này, chúng tôi trình bày một số cách chọn dãy vs. Cách đơn giản nhất là chọn vs là một trong các véc tơ đơn vị ei. Nó có nghĩa là giữ thành phần i của véc tơ xs luôn là hằng số. Trong trường hợp ta cần tính một và i cặp riêng, ta nên chọn vs sao cho nó trực giao với các véc tơ đã tính trước
đó; điều này giúp thuật toán không hội tụ tới những véc tơ đã tính được.
2.1.2 Phân tích Schur thực suy rộng
Phân tích Schur được biết đến là một cách rất hữu hiệu để tìm các giá trị
riêng của một ma trận. Trường hợp đơn giản nhất là trên phân tích Schur phức
của một ma trận đơn A. Khi đó, các giá trị riêng của ma trận đơn A được hiển
thị trên đường chéo chính của dạng Schur T của A. Với T là ma trận phức, tam giác trên thỏa mãn T = QHAQ, và Q là ma trận phức, trong đó QH là liên hợp phức của Q.
Trong trường hợp A- ma trận thực bậc một, ta có kết quả sau đây
Mệnh đề 2.1.1. Giả sử A, B ∈ Rn×n. Khi đó, luôn tồn tại các ma trận trực giao Q, và Z sao cho QT AZ = φ là tựa tam giác trên và QT BZ = ψ là tam
giác trên.
Trong trường hợp det(B) (cid:54)= 0, các phần tử trên đường chéo chính của ψ
khác không. Khi đó, các giá trị riêng của λ - ma trận A − λ B được tính như
sau. Ta xem xét đường chéo của ma trận tựa chéo trên của φ là dạng khối,
φi, i = 1, ..., k, trong đó φi là một phần tử (hay ma trận cỡ 1 × 1) hoặc φi là ma trận cỡ 2 × 2 nếu có phần tử phía dưới đường chéo chính khác không. Ta
gọi ψi là ma trận khối con của ψ có cùng vị trí với φi trong φ . Theo đó, các
nếu ma trận đó là cỡ 1 × 1 và sẽ là hai giá trị giá trị riêng của A − λ B sẽ là φi ψi riêng của λ -ma trận cỡ 2 × 2 φi − λ ψi. Kĩ thuật này có tên là phân tích QZ.
Để áp dụng kĩ thuật này cho bài toán QEP, ta chỉ cần áp dụng nó cho một
dạng tuyến tính hóa A − λ B của nó.
29
2.2 Phương pháp số cho bài toán thưa
Khi cỡ của bài toán QEP lớn thì các phương pháp trình bày ở mục 2.1 sẽ
trở nên đắt đỏ. Trong mục này, chúng ta trình bày một phương pháp dựa trên
không gian con Krylov, phù hợp cho bài toán cỡ lớn. Mục này được viết dựa
trên việc tham kháo tài liệu [6].
Trước tiên, để bắt đầu chúng tôi nhắc lại sơ lược phương pháp Arnoldi
cho bài toán giá trị riêng suy rộng (λ A + B)x = 0. Bởi phần chính của phương pháp này là xây dựng một cơ sở trực chuẩn {q1, ..., qk} cho không gian con
Krylov
Kk(A−1B, q1) = span{q1, A−1Bq, ..., (A−1B)k−1qk}.
Kí hiệu Qk = [q1, ..., qk], khi đó hình chiếu của A−1B lên Kk(A−1B, q1) là ma trận Hk = QT k (A−1B)Qk = [hi j]. Đây là một ma trận Hessenberg, tức là hi j = 0 ∀i, j sao cho i − j ≥ 2. Khi đó, ta có mối quan hệ
(A−1B)Qk = QkHk + hk+1,kqk+1eT k ,
trong đó ek ∈ Rk là véc tơ đơn vị thứ k. Nếu (θ0, u) với ||u|| = 1 là một cặp riêng của −Hk thì (θ0, x) với x = Qku có thể được coi là một xấp xỉ của một cặp riêng của ma trận A−1B. Cặp (θ0, x) được gọi là cặp Ritz bao gồm giá trị Ritz và véc tơ Ritz. Thặng dư của việc xấp xỉ này là
(θ0A + B)x = hk+1,kukAqk+1.
Do hk+1,k sẽ giảm khi k tăng và hơn nữa uk cùng giảm nên thặng dư này sẽ dần về 0. Điều này dẫn đến sự hội tụ của phương pháp.
Ta sẽ áp dụng phương pháp này với bài toán QEP. Do bài toán liên quan
đến số hạng chứa ma trận K, nên ta sẽ áp dụng thuật toán Arnoldi để xây dựng ma trận Hessenberg Hk của M−1C. Sau đó ta tiếp tục tính hình chiếu của M−1K lên không gian Krylov này:
k M−1KQk.
Gk = QT
30
Khi đó, ta xét bài toán QEP chiếu
Lk(λ ) = Iλ 2 + Hkλ + Gk.
Nếu θ0, u là một cặp riêng của Lk(λ ), tức là
(Iθ 2 + Hkθ + Gk)u = 0,
thì ta có thể sử dụng (θ0, x = Qku) là một cặp riêng xấp xỉ của L(λ ). Ta cũng
gọi chúng là một cặp Ritz. Xét thặng dư tương ứng
2 +Cθ0 + K)x
rk = (Mθ0
k u + ∆ku
= A(Qkθ 2 + QkHkθ0 + QkGk)u + + θ0hk+1, kAq+1eT
= θ0hk+1, kukAqk+1 + ∆ku,
trong đó uk là thành phần thứ k của u và
∆k = KQk − MQkGk.
Trong khi số hạng thứ nhất của ∆k sẽ nhỏ dần khi k tăng, số hạng thứ hai
không nhất thiết nhỏ. Do đó ta có thể viết
||rk|| ≈ ||∆ku|| ≤ ||∆k|| ≤ ||M||||M−1K||.
Do đó, áp dụng trực tiếp phương pháp Arnoldi sẽ chỉ đạt được thặng dư ở mức ||∆ku||. Lí do là vì không gian Krylov không chứa thông tin về ma trận M−1K và do đó hình chiếu Gk sẽ không chứa đủ thông tin. Để khắc phục điều này, ta sẽ sử dụng một chiến lược trượt và nghịch đảo để giảm bớt ảnh hưởng
của ∆k.
Xét một giá trị riêng của Q(λ ) gần nhất với một giá trị σ nào đó. Ta chọn luôn λ0 = σ là xấp xỉ ban đầu của giá trị riêng cần tìm và x0 là véc tơ riêng
(cid:48)
tương ứng nào đó. Sử dụng phép biến đổi trượt và nghịch đảo
, = µ 1 λ (cid:48) = 1 λ − λ0
31
dẫn đến
Q(λ ) = M(λ (cid:48) + λ0)2 +C(λ (cid:48)+0) + K = Mλ (cid:48)2 + (2λ0M +C)λ (cid:48) + Q(λ0).
Tiếp theo, ta tìm giá trị lớn nhất theo mô đun của bài toán trượt và nghịch đảo
(cid:98)Q(µ) = µ 2Q(λ ) = (cid:98)Mµ 2 + (cid:98)Cµ + (cid:98)K,
với
(cid:98)M = Q(λ0), (cid:98)C = 2λ0M +C, (cid:98)K = M.
Giả sử λ0 (cid:54)= 0, ta có thể viết
. (cid:98)K = (cid:98)C −C 2λ0
Cuối cùng, áp dụng thuật toán Arnoldi trình bày ở phần trước vào (cid:98)Q(µ) và xấp xỉ (cid:98)Q(µ) bởi (cid:98)Qk(µ) = Iµ 2 + Hkµ + Gk với Hk là hình chiếu của (cid:98)M−1 (cid:98)C sinh bởi thuật toán Arnoldi và Gk là hình chiếu của (cid:98)M−1 (cid:98)K, tức là
k (cid:98)M−1
Gk = QT (cid:98)KQk.
k (cid:98)M−1CQk.
Gk = , với (cid:98)Gk = QT Khi đó, ta dễ dàng kiểm tra thấy (Hk − (cid:99)Gk) 2λ 0 Ta có kết quả sau đây về thặng dư của phép xấp xỉ.
0 . Khi đó
Mệnh đề 2.2.1. Giả sử µ0 là giá trị riêng có mô đun lớn nhất của (cid:98)Qk(µ) với u = (u1, ..., uk)T là một véc tơ riêng có độ dài đơn vị tương ứng. Đặt x1 = Qku và λ1 = λ0 + µ −1
1 +Cλ1 + K)x1|| ≤
1 − λ 2 λ 2 0 2|λ0|
||(Mλ 2 hk+1,kuk||Q(λ0)qk+1||
1 − λ 2 λ 2 0 2|λ0|
+ (2.6) ||∆ku||,
trong đó ∆k = CQk − Q(λ0)Qk (cid:99)Gk.
32
Chứng minh mệnh đề này được trình bày chi tiết trong [6].
Cũng giống như phần trước, số hạng thứ nhất của vế phải của (2.6) sẽ
giảm khi k tăng trong khi không có gì đảm bảo số hạng thứ hai sẽ giảm nếu
không có một chiến lược đặc biệt. Ở đây ta sẽ cập nhật biên độ của phép tịnh
tiến cho đến khi giá trị riêng tìm được thỏa mãn |λ − σ | ≤ η với η > 0 cho
trước. Điều đó dẫn đến thuật toán sau đây.
1: for l = 1, 2, · · · , đến khi hội tụ do
2:
3:
Algorithm 4 Lặp trượt và nghịch đảo Arnoldi. Require: σ , η, dự đoán x, số bước lặp tối đa m, đặt λ0 = σ ; Ensure: Một cặp riêng (µ, u) lớn nhất theo modul
4:
5:
6:
x ||x||2 (cid:98)M = Q(λ0), (cid:98)C = 2λ0M +C, (cid:98)K = M, q1 = . for j = 1, 2, · · · , m do
7:
8:
(cid:98)q = (cid:98)M−1 (cid:98)Cq; for i = 1, · · · , j do
i (cid:98)q; (cid:98)q1 = (cid:98)q − qihi j; i ( (cid:98)M−1 (cid:98)Kq j); g ji = qT
i ( (cid:98)M−1 (cid:98)Kqi);
9:
10:
11:
12:
hi j = qT gi j = qT
13:
; end for h j+1, j = ||(cid:98)q||2; if h j+1, j > 0, then q j+1 = (cid:98)q h j+1, j
14:
else
15:
16:
break.
end if Tính cặp riêng lớn nhất (µ0, u) của Iµ 2 + H jµ + G j = 0.
17:
18:
33
γ1 = h j+1, j|u j||| (cid:98)Mq j+1||;
19:
20:
|λ 2 (CQ j − (cid:98)MQ j(H j − 2λ0G j))|u|;
21:
λ1 = λ0 + µ −1 0 ; 1 − λ 2 |λ 2 0 | 2|λ0| 1 − λ 2 0 | γ2 = 2|λ0| if γ1 ≤ 0.1γ2 then
22:
break.
23:
24:
25:
end if
26:
end for x = Qku; if |λ1 − σ | < η then
27:
λ0 = λ1;
28: end for
end if
2.3 Ví dụ số
Trong mục này, chúng tôi sẽ sử dụng phương pháp Newton để tính cặp
riêng của bài toán giá trị riêng bậc hai. Để thực hiện, chúng tôi sử dụng phần
mềm MATLAB.
Để tiện so sánh, chúng tôi sử dụng lại bài toán ở ví dụ 1.3.1, tiểu mục
1.3.3.
Chúng tôi chọn x0 = [1 − 1 1]T , λ0 = −10, vs = [1 1 0]T với mọi s. Chúng
tôi sử dụng tiêu chuẩn dừng
|λs+1 − λs| < tol = 10−6
Và cuối cùng ma trận C được chọn là ma trận đơn vị.
Sau 8 bước lặp, chúng tôi thu được giá trị riêng
λ = −4.758617077184492.
34
So với giá trị riêng được tính trực tiếp bằng phần mềm MATLAP
λ1 = −4.758617077184495
thì đây là kết quả rất chính xác. Cũng với chương trình này, ta thu được véc tơ riêng tương ứng có giá trị rất lớn (khoảng 1021). Tuy nhiên, cũng bằng
MATLAB, chúng ta kiểm tra được rằng véc tơ này và véc tơ cột thứ nhất của
X trong ví dụ 1.3.1 ở tiểu mục 1.3.3 là phụ thuộc tuyến tính. Điều đó tức là
chương trình đã xác định đúng không gian riêng tương ứng. Để giảm giá trị của véc tơ, ta có thể sử dụng ma trận C với chuẩn khoảng 10−3. Khi đó, sau 8 bước lặp, chuẩn của véc tơ thu được sẽ giảm đi 10−24 lần và làm cho các
giá trị thành phần của véc tơ thuận mắt hơn. Cũng cần nói thêm rằng thuật
toán hội tụ đến giá trị riêng có trị tuyệt đối lớn nhất vì nó gần giá trị khởi động λ0 = −10 nhất. Khi chúng tôi chọn λ0 = −10−3, thuật toán hội tụ đến −0.026425971910232 là xấp xỉ của λ6 = −0.026425971912474 sau 4 bước
lặp.
35
Kết luận
Trong luận văn này, chúng tôi đã tập trung vào trình bày các khía cạnh lý
thuyết gồm khái niệm và các tính chất và khía cạnh tính toán bao gồm một số
phương pháp số giải bài toán giá trị riêng bậc hai. Lý thuyết bài toán giá trị
riêng bậc một cũng được hệ thống hóa một cách cẩn thận.
36
Tài liệu tham khảo
Tiếng Việt
[1] Nguyễn Văn Tần (2015), Về một số thuật toán tính giá trị riêng của ma
trận cỡ lớn, Luận văn thạc sĩ Toán học, trường Đại học Khoa học - Đại học
Thái Nguyên, Thái Nguyên.
Tiếng Anh
[2] J.W. Demmel (1997), Applied Numerical Linear Algebra, SIAM,
Philadelphia.
[3] G.H. Golub and C.F. Van Loan (1996), Matrix Computations, The Johns
Hopkins Universsity Press, Baltimore, Maryland.
[4] A. Ruhe (1973), “Algorithms for the nonlinear eigenvalue problem”,
SIAM Journal on Numerical Analysis, 10(4), pp. 674-689.
[5] F. Tiseur and K. Meerbergen (2001), “The quadratic eigenvalue problem",
SIAM Review, 43(2), pp. 235- 286.
[6] Q. Ye (2006), “An iterated shift-and-invert Arnoldi algorithm for
quadratic matrix eigenvalue problems", Applied Mathathematics and Com-
putations. 172, pp. 818- 827.