
129
CHƯƠNG 5. PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI
5.1 NHỮNG KHÁI NIỆM MỞ ĐẦU
Trong thực tế nghiên cứu khí tượng, khí hậu có không ít những vấn đề
được đặt ra trong đó cần phải xác định được qui luật biến đổi của các hiện tượng
khí quyển. Tuy nhiên, hiện tượng khí quyển lại được phản ánh thông qua các
đặc trưng yếu tố khí quyển mà chúng, đến lượt mình, lại phụ thuộc vào sự biến
đổi của các nhân tố bên ngoài. Muốn nắm được qui luật biến đổi của các hiện
tượng khí quyển cần thiết phải xác định sự liên hệ giữa các đặc trưng yếu tố khí
quyển (được xem là biến phụ thuộc) với tập hợp các nhân tố ảnh hưởng mà
người ta gọi là các biến độc lập. Điều đó cũng có nghĩa là, về phương diện thống
kê, thông thường ta cần phải giải quyết một số vấn đề sau đây:
1) Xác định sự phân bố không gian của các đặc trưng yếu tố khí tượng, khí hậu,
tức là nghiên cứu qui luật phụ thuộc vào toạ độ không gian của các biến khí
quyển.
2) Xác định qui luật, tính chất diễn biến theo thời gian của các đặc trưng yếu tố
khí quyển.
3) Xác định mối quan hệ ràng buộc để từ đó tìm qui luật liên hệ giữa các đặc
trưng yếu tố khí quyển với nhau theo không gian và thời gian.
Một trong những phương pháp giải quyết các vấn đề đó là phương pháp
phân tích tương quan và hồi qui mà nội dung của nó có thể được chia thành:
1) Tương quan và hồi qui theo không gian: Là xét mối quan hệ giữa hai hay
nhiều biến khí quyển với nhau của cùng một yếu tố, cùng thời gian (đồng
thời) nhưng khác nhau về vị trí không gian.
2) Tương quan và hồi qui theo thời gian: Là xét mối quan hệ giữa hai hay nhiều
biến khí quyển với nhau của cùng một yếu tố, cùng một địa điểm nhưng khác
nhau về thời gian.

130
3) Tương quan và hồi qui phổ biến: Là xét mối quan hệ giữa hay nhiều biến khí
quyển của một hoặc nhiều yếu tố, có thể khác nhau về không gian, thời gian
hoặc cả không−thời gian.
Về phương diện toán học, căn cứ vào dạng thức của biểu thức biểu diễn,
người ta chia sự quan hệ tương quan làm bốn dạng:
1) Tương quan và hồi qui tuyến tính một biến: Xét mối quan hệ tương quan và
hồi qui tuyến tính giữa một bên là biến phụ thuộc với một bên là một biến
độc lập.
2) Tương quan và hồi qui phi tuyến một biến: Xét mối quan hệ tương quan và
hồi qui phi tuyến giữa một bên là biến phụ thuộc với một bên là một biến độc
lập.
3) Tương quan và hồi qui tuyến tính nhiều biến: Xét mối quan hệ tương quan và
hồi qui tuyến tính giữa một bên là biến phụ thuộc với một bên là tập hợp
nhiều biến độc lập.
4) Tương quan và hồi qui phi tuyến nhiều biến: Xét mối quan hệ tương quan và
hồi qui phi tuyến giữa một bên là biến phụ thuộc với một bên là tập hợp
nhiều biến độc lập.
Thông thường để giải quyết các bài toán tương quan và hồi qui trong khí
tượng, khí hậu cần phải tiến hành các bước sau:
1) Xác lập được dạng thức của mối liên hệ tương quan, tức là tìm ra dạng hồi
qui thích hợp: Tuyến tính hay phi tuyến, nếu là phi tuyến thì cụ thể là dạng
nào.
2) Đánh giá được mức độ chặt chẽ của các mối liên hệ theo nghĩa quan hệ tương
quan.
3) Bằng phương pháp nào đó, xác lập biểu thức giải tích của phương trình hồi
qui xấp xỉ mối liên hệ tương quan, tức là xây dựng hàm hồi qui. Trong khí
tượng, khí hậu phương pháp phổ biến để xây dựng hàm hồi qui là phương
pháp bình phương tối thiểu.
4) Đánh giá độ chính xác và khả năng sử dụng của phương trình hồi qui.

131
5.2 TƯƠNG QUAN TUYẾN TÍNH
5.2.1 Hệ số tương quan tổng thể
Xét hai biến ngẫu nhiên X1 và X2. Khi đó phương sai của tổng (hiệu) hai
biến được xác định bởi:
D[X1 ± X2] = M[(X1 ± X2) − M(X1 ± X2)]2 = M[(X1 − MX1)± (X2 − MX2)]2 =
= M[(X1 − MX1)2] + M[(X2 − MX2)2] ± 2M[(X1 − MX1)(X2 − MX2)]=
= D[X1] + D[X2] ± 2 M[(X1 − MX1)(X2 − MX2)]=
=
μ11 + μ22 + ± 2μ12
trong đó μ12 là mômen tương quan giữa X1 và X2, μ11 và μ22 tương ứng là
phương sai của X1 và X2. Nếu X1 và X2 không tương quan với nhau thì:
D[X1 ± X2] = D[X1] + D[X2], suy ra μ12 = 0.
Do vậy, người ta dùng μ12 làm thước đo mức độ tương quan giữa X1 và X2.
Vì μ12 là một đại lượng có thứ nguyên (bằng tích thứ nguyên của X1 và X2) nên
để thuận tiện trong việc so sánh, phân tích thay cho μ12 người ta dùng đại lượng
vô thứ nguyên:
ρ12 =
μ
μμ
12
11 22
(5.2.1)
và được gọi là hệ số tương quan giữa hai biến X1 và X2. Người ta gọi ρ12 là hệ số
tương quan tổng thể hay hệ số tương quan lý thuyết và là một hằng số.
Hệ số tương quan có các tính chất sau đây:
1) Hệ số tương quan nhận giá trị trên đoạn [−1;1]: −1 ≤ ρ12 ≤ 1.
Thật vậy, ta có:
DX
DX
X
DX
1
1
2
2
±
⎡
⎣
⎢⎤
⎦
⎥=X
DX MX
DX
X
DX MX
DX
1
1
1
1
2
2
2
2
2
−⎡
⎣
⎢⎤
⎦
⎥
⎛
⎝
⎜
⎜
⎞
⎠
⎟
⎟±−
⎡
⎣
⎢⎤
⎦
⎥
⎛
⎝
⎜
⎜
⎞
⎠
⎟
⎟
⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥=

132
= D X
DX
1
1
⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥+D X
DX
2
2
⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥±2M X
DX MX
DX
X
DX MX
DX
1
1
1
1
2
2
2
2
−⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥
⎛
⎝
⎜
⎜
⎞
⎠
⎟
⎟−⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥
⎛
⎝
⎜
⎜
⎞
⎠
⎟
⎟
⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥
= 11
21
1
1
2
2
12
12
DX DX DX DX DX DX
+± μ
= 2 ± 2
μ
μμ
12
11 22
= 2(1 ± ρ12) ≥ 0
Hay 1 ± ρ12 ≥ 0 ⇒ đpcm
2) Điều kiện cần và đủ để ρ12 =1 là X1 và X2 có quan hệ hàm tuyến tính.
Điều kiện đủ:
Giả sử ta có quan hệ hàm tuyến tính giữa X1 và X2: X2 = a + bX1, với a, b
là các hệ số hằng số. Khi đó:
μ12 = M[(X1−MX1)(X2−MX2)] = M[(X1−MX1)(a + bX1−a−bMX1)]=
= M[b(X1 −MX1)2] = bμ11
μ22 =M[(X2−MX2)2]=M[(a + bX1−a−bMX1)2] = b2M[(X1−MX1)2] = b2μ11
Vậy ρ12 = μ
μμ
12
11 22
= b
b
μ
μ
11
211
2 = b
b=10
10
khi b
khi b
>
−<
⎧
⎨
⎩
Điều kiện cần:
Từ hệ thức D X
DX
X
DX
1
1
2
2
±
⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥= 2(1 ± ρ12) ta có:
Nếu (1 ± ρ12) = 0 thì X
DX
X
DX
1
1
2
2
±
⎡
⎣
⎢
⎢
⎤
⎦
⎥
⎥ = C = Const
Từ đó suy ra X2 = ±μ
μ
22
11
X1 + C μ22 , tức là giữa X2 và X1 tồn tại quan
hệ hàm tuyến tính.
Do tính chất này nên hệ số tương quan được xem là đại lượng đặc trưng
cho mức độ tương quan tuyến tính giữa hai biến.

133
5.2.2 Hệ số tương quan mẫu
Cho hai biến khí quyển X1, X2 với n cặp trị số quan sát:
{xt1, xt2} = {(x11, x12), (x21, x22),..., (xn1, xn2)}
Khi đó mômen tương quan mẫu - ước lượng của mômen tương quan tổng
thể μ12 - giữa X1 và X2 được xác định bởi:
R
12 = 1
112 2
1
nxxxx
tt
t
n
()( )−−
=
∑ = ()( )xxxx
112 2
−−
(5.2.2)
và hệ số tương quan mẫu:
r
12 =
1
11
112 2
1
11
2
1
22
2
1
nxxxx
nxx nxx
tt
t
n
t
t
n
t
t
n
()( )
()( )
−−
−−
=
==
∑
∑∑
= l
ll
12
11 22
(5.2.3)
trong đó: l12 = ()( )xxxx
tt
t
n
112 2
1
−−
=
∑ = nR12 là tổng của tích các độ lệch của
X
1 và X2 so với trung bình của chúng.
l
11 =
()
xx
t
t
n
11
2
1
−
=
∑= n s1
2 - tổng bình phương các độ lệch của
X
1 so với trung bình của nó.
l
22 =
()
xx
t
t
n
22
2
1
−
=
∑= n s2
2- tổng bình phương các độ lệch của
X
2 so với trung bình của nó.
xnxt
t
n
11
1
1
=
=
∑, xnxt
t
n
22
1
1
=
=
∑- trung bình của X1 và X2
Hệ số tương quan mẫu r12 là ước lượng của hệ số tương quan tổng thể ρ12.
Nếu ρ12 là một hằng số thì trái lại r12 là một đại lượng ngẫu nhiên. Năm 1915
R.A.Fisher [3,5,6] đã tìm ra biểu thức chính xác của hàm mật độ xác suất của hệ
số tương quan mẫu r12 trong trường hợp phân bố đồng thời của X1 và X2 là