129
CHƯƠNG 5. PHÂN TÍCH TƯƠNG QUAN VÀ HI QUI
5.1 NHNG KHÁI NIM M ĐẦU
Trong thc tế nghiên cu khí tượng, khí hu có không ít nhng vn đề
được đặt ra trong đó cn phi xác định được qui lut biến đổi ca các hin tượng
khí quyn. Tuy nhiên, hin tượng khí quyn li được phn ánh thông qua các
đặc trưng yếu t khí quyn mà chúng, đến lượt mình, li ph thuc vào s biến
đổi ca các nhân t bên ngoài. Mun nm được qui lut biến đổi ca các hin
tượng khí quyn cn thiết phi xác định s liên h gia các đặc trưng yếu t khí
quyn (được xem là biến ph thuc) vi tp hp các nhân t nh hưởng mà
người ta gi là các biến độc lp. Điu đó cũng có nghĩa là, v phương din thng
kê, thông thường ta cn phi gii quyết mt s vn đề sau đây:
1) Xác định s phân b không gian ca các đặc trưng yếu t khí tượng, khí hu,
tc là nghiên cu qui lut ph thuc vào to độ không gian ca các biến khí
quyn.
2) Xác định qui lut, tính cht din biến theo thi gian ca các đặc trưng yếu t
khí quyn.
3) Xác định mi quan h ràng buc để t đó tìm qui lut liên h gia các đặc
trưng yếu t khí quyn vi nhau theo không gian và thi gian.
Mt trong nhng phương pháp gii quyết các vn đề đó là phương pháp
phân tích tương quan và hi qui mà ni dung ca nó có th được chia thành:
1) Tương quan và hi qui theo không gian: Là xét mi quan h gia hai hay
nhiu biến khí quyn vi nhau ca cùng mt yếu t, cùng thi gian (đồng
thi) nhưng khác nhau v v trí không gian.
2) Tương quan và hi qui theo thi gian: Là xét mi quan h gia hai hay nhiu
biến khí quyn vi nhau ca cùng mt yếu t, cùng mt địa đim nhưng khác
nhau v thi gian.
130
3) Tương quan và hi qui ph biến: Là xét mi quan h gia hay nhiu biến khí
quyn ca mt hoc nhiu yếu t, có th khác nhau v không gian, thi gian
hoc c khôngthi gian.
V phương din toán hc, căn c vào dng thc ca biu thc biu din,
người ta chia s quan h tương quan làm bn dng:
1) Tương quan và hi qui tuyến tính mt biến: Xét mi quan h tương quan và
hi qui tuyến tính gia mt bên là biến ph thuc vi mt bên là mt biến
độc lp.
2) Tương quan và hi qui phi tuyến mt biến: Xét mi quan h tương quan và
hi qui phi tuyến gia mt bên là biến ph thuc vi mt bên là mt biến độc
lp.
3) Tương quan và hi qui tuyến tính nhiu biến: Xét mi quan h tương quan và
hi qui tuyến tính gia mt bên là biến ph thuc vi mt bên là tp hp
nhiu biến độc lp.
4) Tương quan và hi qui phi tuyến nhiu biến: Xét mi quan h tương quan và
hi qui phi tuyến gia mt bên là biến ph thuc vi mt bên là tp hp
nhiu biến độc lp.
Thông thường để gii quyết các bài toán tương quan và hi qui trong khí
tượng, khí hu cn phi tiến hành các bước sau:
1) Xác lp được dng thc ca mi liên h tương quan, tc là tìm ra dng hi
qui thích hp: Tuyến tính hay phi tuyến, nếu là phi tuyến thì c th là dng
nào.
2) Đánh giá được mc độ cht ch ca các mi liên h theo nghĩa quan h tương
quan.
3) Bng phương pháp nào đó, xác lp biu thc gii tích ca phương trình hi
qui xp x mi liên h tương quan, tc là xây dng hàm hi qui. Trong khí
tượng, khí hu phương pháp ph biến đểy dng hàm hi qui là phương
pháp bình phương ti thiu.
4) Đánh giá độ chính xác và kh năng s dng ca phương trình hi qui.
131
5.2 TƯƠNG QUAN TUYN TÍNH
5.2.1 H s tương quan tng th
Xét hai biến ngu nhiên X1 và X2. Khi đó phương sai ca tng (hiu) hai
biến được xác định bi:
D[X1 ± X2] = M[(X1 ± X2) M(X1 ± X2)]2 = M[(X1 MX1)± (X2 MX2)]2 =
= M[(X1 MX1)2] + M[(X2 MX2)2] ± 2M[(X1 MX1)(X2 MX2)]=
= D[X1] + D[X2] ± 2 M[(X1 MX1)(X2 MX2)]=
=
μ11 + μ22 + ± 2μ12
trong đó μ12mômen tương quan gia X1 và X2, μ11μ22 tương ng là
phương sai ca X1 và X2. Nếu X1 và X2 không tương quan vi nhau thì:
D[X1 ± X2] = D[X1] + D[X2], suy ra μ12 = 0.
Do vy, người ta dùng μ12 làm thước đo mc độ tương quan gia X1 và X2.
μ12mt đại lượng có th nguyên (bng tích th nguyên ca X1 và X2) nên
để thun tin trong vic so sánh, phân tích thay cho μ12 người ta dùng đại lượng
vô th nguyên:
ρ12 =
μ
μμ
12
11 22
(5.2.1)
được gi là h s tương quan gia hai biến X1 và X2. Người ta gi ρ12 là h s
tương quan tng th hay h s tương quan lý thuyết và là mt hng s.
H s tương quan có các tính cht sau đây:
1) H s tương quan nhn giá tr trên đon [1;1]: 1 ρ12 1.
Tht vy, ta có:
DX
DX
X
DX
1
1
2
2
±
=X
DX MX
DX
X
DX MX
DX
1
1
1
1
2
2
2
2
2
±−
=
132
= D X
DX
1
1
+D X
DX
2
2
±2M X
DX MX
DX
X
DX MX
DX
1
1
1
1
2
2
2
2
= 11
21
1
1
2
2
12
12
DX DX DX DX DX DX
μ
= 2 ± 2
μ
μμ
12
11 22
= 2(1 ± ρ12) 0
Hay 1 ± ρ12 0 đpcm
2) Điu kin cn và đủ để ρ12 =1 là X1 và X2 có quan h hàm tuyến tính.
Điu kin đủ:
Gi s ta có quan h hàm tuyến tính gia X1 và X2: X2 = a + bX1, vi a, b
là các h s hng s. Khi đó:
μ12 = M[(X1MX1)(X2MX2)] = M[(X1MX1)(a + bX1abMX1)]=
= M[b(X1 MX1)2] = bμ11
μ22 =M[(X2MX2)2]=M[(a + bX1abMX1)2] = b2M[(X1MX1)2] = b2μ11
Vy ρ12 = μ
μμ
12
11 22
= b
b
μ
μ
11
211
2 = b
b=10
10
khi b
khi b
>
−<
Điu kin cn:
T h thc D X
DX
X
DX
1
1
2
2
±
= 2(1 ± ρ12) ta có:
Nếu (1 ± ρ12) = 0 thì X
DX
X
DX
1
1
2
2
±
= C = Const
T đó suy ra X2 = ±μ
μ
22
11
X1 + C μ22 , tc là gia X2 và X1 tn ti quan
h hàm tuyến tính.
Do tính cht này nên h s tương quan được xem là đại lượng đặc trưng
cho mc độ tương quan tuyến tính gia hai biến.
133
5.2.2 H s tương quan mu
Cho hai biến khí quyn X1, X2 vi n cp tr s quan sát:
{xt1, xt2} = {(x11, x12), (x21, x22),..., (xn1, xn2)}
Khi đó mômen tương quan mu - ước lượng ca mômen tương quan tng
th μ12 - gia X1 và X2 được xác định bi:
R
12 = 1
112 2
1
nxxxx
tt
t
n
()( )−−
=
= ()( )xxxx
112 2
−−
(5.2.2)
và h s tương quan mu:
r
12 =
1
11
112 2
1
11
2
1
22
2
1
nxxxx
nxx nxx
tt
t
n
t
t
n
t
t
n
()( )
()( )
−−
−−
=
==
∑∑
= l
ll
12
11 22
(5.2.3)
trong đó: l12 = ()( )xxxx
tt
t
n
112 2
1
−−
=
= nR12 là tng ca tích các độ lch ca
X
1 và X2 so vi trung bình ca chúng.
l
11 =
()
xx
t
t
n
11
2
1
=
= n s1
2 - tng bình phương các độ lch ca
X
1 so vi trung bình ca nó.
l
22 =
()
xx
t
t
n
22
2
1
=
= n s2
2- tng bình phương các độ lch ca
X
2 so vi trung bình ca nó.
xnxt
t
n
11
1
1
=
=
, xnxt
t
n
22
1
1
=
=
- trung bình ca X1 và X2
H s tương quan mu r12ước lượng ca h s tương quan tng th ρ12.
Nếu ρ12 là mt hng s thì trái li r12 là mt đại lượng ngu nhiên. Năm 1915
R.A.Fisher [3,5,6] đã tìm ra biu thc chính xác ca hàm mt độ xác sut ca h
s tương quan mu r12 trong trường hp phân b đồng thi ca X1 và X2