
1
CHƯ Ơ NG 8. TƯ Ơ NG QUAN VÀ HỒ I QUY
Trong các chư ơ ng trư ớ c, ta đề cập chủyế u các phư ơ ng pháp nghiên cứ u một biế n đơ n lẻ , hoặc các
biến ngẫ u nhiên độ c lập.
Trong chư ơ ng này, ta sẽ nói đế n mối liên hệgiữa hai biến ngẫu nhiên vớ i hai phư ơ ng pháp: tư ơ ng
quan và hồi quy.
1. TƯ Ơ NG QUAN
Mục tiêu củ a phân tích tư ơ ng quan là đo lư ờ ng cư ờ ng độ của mối quan hệgiữa hai biến và .
Trong phân tích này, và đư ợ c xem là hai biến ngẫ u nhiên “ngang nhau”-không phân biệt biến
độ c lập và biến phụthuộc.
Tư ơ ng quan tuyế n tính giữa hai biến và là khái niệm thểhiệnmứ c độ mối liên hệtuyến tính
giữa và .
1.1.Hệsố tư ơ ng quan
Giảsửvà là hai biến ngẫu nhiên, với trung bình và phư ơ ng sai lầ n lư ợ t là , , , .
Hệsố tư ơ ng quan thểhiệ n cư ờ ng độ và chiề u hư ớ ng tuyến tính giữa và ;
đư ợ c gọi là hệsố tư ơ ng quan củ a tổng thể. Ta có − 1 ≤ ≤ 1.
< 0 thì giữa và có mối liên hệnghịch, nghĩa là khi một biến giả m đi thì biến kia sẽ
tăng lên và ngư ợ c lại.
> 0 thì giữa và có mối liên hệthuận, nghĩa là khi biế n này tăng thì biến kia cũng tăng
và ngư ợ c lại.
= 0 thì giữa và không có mối liên hệtuyên tính.
Trịtuyệ t đố i của càng lớn thì mối liên hệtuyến tính giữa và càng chặt chẽ.
Trong thực tế, ta không biết và phả i ư ớ c lư ợ ng nó từdữliệu mẫu thu thậ p đư ợ c.
Gọi(,),(,),…,(,)là mẫu gồm n cặp giá trịquan sát thu thập ngẫu nhiên từvà .
Hệsố tư ơ ng quan tổ ng thể đư ợ c ư ớ c lư ợ ng từhệsố tư ơ ng quan mẫ u (còn đư ợ c gọi là hệsố
tư ơ ng quan Pearson):
=∑( − )( − )
( − 1)
Ví dụ:Số lư ợ ng vềthời gian quảng cáo trên truyền hình và lư ợ ng sản phẩm tiêu thụ ở một công ty
sản xuấ t đồ chơ i trẻ em:
Thời gian quảng cáo trong tuần
(phút)
28
37
44
36
47
35
26
29
33
32
31
28

2
Lư ợ ng tiêu thụtrong tuần
(1000 sản phẩm)
41
32
49
42
38
33
27
24
35
30
34
25
Gọi và lầ n lư ợ t là thời gian quảng cáo trên truyền hình (phút) và lư ợ ng sản phẩm tiêu thụtrong
tuần (1000 sản phẩm).
Áp dụng công thức trên ta có = 0.63882
1.2.Kiể m đị nh giảthuyết vềmối liên hệ tư ơ ng quan
Bên cạnh việc thểhiện mứ c độ chặt chẽcủa mối liên hệ, vấ n đề chủyế u là dùng r để xét xem có
hay không mối liên hệ tư ơ ng quan giữ a hai biến,, tức là kiể m đị nh giảthuyết cho rằng hệsố
tư ơ ng quan củ a tổng thểbằng không.
Giảsửcó mẫu n cặp quan sát chọn ngẫu nhiên từ,có phân phối chuẩn.
Gọi r là hệsố tư ơ ng quan mẫ u.
Kiể m đị nh giảthuyế t tư ơ ng quan về tổng thể như sau:
: = 0 ( ô ó ê ệ ữ à )
: ≠ 0 ( ó ê ệ ữ à )
Giá trịkiể m đị nh
=| |
1 −
− 2
Quy tắc quyế t đị nh ởmức ý nghĩa bác bỏnếu>( ), /
Với( ), / là tra bảng phân phối Student với bậc tựdo ( − 2) với mức ý nghĩa / 2.
Kiể m đị nh hai phía trên đây sử dụng khi không biế t trư ớ c chiề u hư ớ ng của mối liên hệ.
Nếu có thể xác đị nh đư ợ c chiề u hư ớ ng của mối liên hệ, ta thực hiện kiể m đị nh một phía,bên trái
hoặc bên phải: : > 0 hoặc: < 0.
Ta làm hoàn toàn tư ơ ng tự như kiể m đị nh hai phía, chỉ lư u ý trong tra bảng phân phối Student giá
trị( ),thay vì ( ), / .
2. HỒ I QUY ĐƠ N GIẢ N
2.1. Lý thuyết Keynes vềtiêu dùng
2.1.1. Lý thuyết củ a Keynes đãđặ t ra mối quan hệgiữa tiêu dùng và thu nhập
= ( ).
Ví dụ:Kết quả điề u tra vềthu nhập (triệ u đồ ng/tháng) và tiêu dùng (triệ u đồ ng/tháng) cho bởi
bảng giá trịsau:

3
Thu nhập
5
10
15
Tiêu dùng
2.038
4.038
6.038
Minh họa các sốliệu trên hình vẽ, quan hệgiữa tiêu dùng và thu nhập= ( ), là mối quan hệ
tuyến tính.
Dependent Variable: TIEUDUNG
Method: Least Squares
Date: 12/11/09 Time: 15:34
Sample: 1 3
Included observations: 3
Variable
Coefficient
Std. Error
t-Statistic
Prob.
THUNHAP
0.400000
1.60E-16
2.50E+15
0.0000
C
0.038000
1.73E-15
2.20E+13
0.0000
R-squared
1.000000
Mean dependent var
4.038000
Adjusted R-squared
1.000000
S.D. dependent var
2.000000
S.E. of regression
1.13E-15
Sum squared resid
1.28E-30
F-statistic
6.23E+30
Durbin-Watson stat
1.114255
Prob(F-statistic)
0.000000
Khi đó ta có quan hệ ở dạng
= 0.038 + 0.4
Ý nghĩa củ a phư ơ ng trình này như sau:
Nếu= 0 thì = 0.038, điề u này có ý nghĩa rằ ng ngư ờ i không có thu nhập vẫn tiêu dùng
ởmức tối thiểu là 0.038 triệ u đồ ng/tháng.
Hệsố 0.4 (hay khuynh hư ớ ng tiêu dùng theo thu nhập) cho biết, nế u tăng thu nhậ p lên
1 triệu/tháng thì tiêu dùng tăng lên 0.4 triệ u đồ ng/tháng. Tức là mứ c tăng tiêu dùng không
nhanh bằng mứ c tăng thu nhậ p.
Vềtrung bình, khi thu nhậ p tăng thì tỷlệgiữa thu nhập và tiêu dùng ()ngày càng giảm
2.038
5>4.038
10 >6.038
15
Như vậ y có một tỷlệlớ n hơ n thu nhậ p đư ợ c đư a vào tiế t kiệ m khi ngư ờ i ta giàu lên.
Một cách tổng quát, hàm mô tảtốt nhấ t khuynh hư ớ ng tiêu dùng theo thu nhập của Keynes có dạng
tuyến tính
= + ( > 0, ∈(0,1)
Ví dụ:Sốliệu vềtiêu dùng trung bình và thu nhập khảdụng theo giá cố đị nh của nền kinh tếMỹ
trong 10 năm từ 1970-1979

4
Đơ n vị : tỷdollars
Năm
Thu nhập khảdụng
Tiêu dùng trung bình
1970
751.6
672.1
1971
779.2
696.8
1972
810.3
737.1
1973
864.7
767.9
1974
857.5
762.8
1975
874.9
779.4
1976
906.8
823.1
1977
942.9
864.3
1978
988.8
903.2
1979
1015.7
927.6
Dependent Variable: TIEUDUNGTRUNGBINH
Method: Least Squares
Date: 12/11/09 Time: 15:40
Sample: 1 10
Included observations: 10
Variable
Coefficient
Std. Error
t-Statistic
Prob.
THUNHAPKHADUNG
0.979267
0.031607
30.98253
0.0000
C
-67.58065
27.91071
-2.421316
0.0418
R-squared
0.991735
Mean dependent var
793.4300
Adjusted R-squared
0.990702
S.D. dependent var
84.96543
S.E. of regression
8.193028
Akaike info criterion
7.221301
Sum squared resid
537.0056
Schwarz criterion
7.281818
Log likelihood
-34.10650
F-statistic
959.9172
Durbin-Watson stat
1.566424
Prob(F-statistic)
0.000000
Mặc dù dữliệu xem ra thểhiện khá tốt quy luật tuyến tính.
Như ng rõ ràng mối quan hệ có tính xác đị nh đó là không đủ để mô tảthực tiễn, vì còn rất nhiều
yếu tốkhác ả nh hư ở ng đế n tiêu dùng (như giớ i tính, tuổ i tác, tâm lý…)
Nói chung, chúng ta không có tham vọ ng đư a hế t tất cảmọi yếu tố ả nh hư ở ng tới tiêu dùng vào mô
hình mà chỉnhững yếu tốquan trọng, thiết yếu nhất.
Vì vậ y, để có thểbiểu diễn quy luật tiêu dùng trên thếgiới thực, ta cầ n đư a thêm vào mô hình tuyến
tính trên một thành phần khác nữa mang tính ngẫu nhiên, thểhiện sự tác độ ng tổng hợp của các
nhân tốnhỏ, không ổ n đị nh tới tiêu dùng.

5
Tức là những yếu tốlàm cho quan sát thật vềtiêu dùng và thu nhập bịlệch khỏi xu thế ổ n đị nh,
tuyến tính nêu trên.
Tức là ta muốn biểu diễn mối quan hệgiữa các cặp dữliệ u quan sát đư ợ c vềthu nhập và tiêu dùng
{,}như sau:
= + + , = 1, 2,…,
Trong đó (,)= ( , ) lầ n lư ợ t là tiêu dùng và thu thập thực tếcủa mẫu quan sát thứ.Xét vế
phải củ a phư ơ ng trình này ta có:
- Thành phần thứnhất+là quy luậ t xác đị nh, mà ta cầ n ư ớ c lư ợ ng.
- Thành phần thứhai là nhiễu (tức là bao gồm sự tác độ ng tổng hợp của mọi yếu tố
khác của hoàn cảnh, có tính ngẫu nhiên, làm quan sát bịlệch khỏ i khuynh hư ớ ng hay ổn
đị nh).
Cảhai phần này, tính xu thế-xác đị nh và yếu tốngẫ u nhiên đư ợ c gộp lạ i trong phư ơ ng trình trên
để mô tảlý thuyết tiêu dùng của Keynes.
2.1.2. Ư ớ c lư ợ ng quy luật tiêu dùng
Ta muốnư ớ c lư ợ ng xu thếtiêu dùng bằng quy luật tuyến tính:
= +
trong đó là ư ớ c lư ợ ng về tiêu dùng, khi cho trư ớ c quan sát thu nhập ;
và là các tham số ư ớ c lư ợ ng của các tham sốtổng thể , chư a biế t,.
Mứ c độ tốtcủa việ c ư ớ c lư ợ ng đư ợ c đo lư ờ ng qua số dư
= −
Tổng bình phư ơ ng các sai số , ký hiệu là ESS
=(−)= − −
Một cách tổng quát, chúng ta muốn rằng tổng bình phư ơ ng sai số phầ n dư là nhỏ nhất theo phư ơ ng
pháp bình phư ơ ng cự c tiểu:
, = − − → min( , )
Sửdụng cực trị có điề u kiệnta có