Bài tập học môn Kinh tế lượng

Chia sẻ: thehell

Bài 1: Thống kế số liệu tỷ lệ lạm phát tại 5 nước trong giai đoạn 1960 - 1980 như sau. a. Vẽ đồ thị phân tán về tỷ lệ lạm phát cho mỗi quốc gia theo thời gian. Và cho nhận xét tổng quát ...

Bạn đang xem 20 trang mẫu tài liệu này, vui lòng download file gốc để xem toàn bộ.

Nội dung Text: Bài tập học môn Kinh tế lượng

Bài 1

Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như
sau :
ĐVT:%
Nam US Anh Nhat Duc Phap
1960 1.5 1 3.6 1.5 3.6
1961 1.1 3.4 5.4 2.3 3.4
1962 1.1 4.5 6.7 4.5 4.7
1963 1.2 2.5 7.7 3 4.8
1964 1.4 3.9 3.9 2.3 3.4
1965 1.6 4.6 6.5 3.4 2.6
1966 2.8 3.7 6 3.5 2.7
1967 2.8 2.4 4 1.5 2.7
1968 4.2 4.8 5.5 18 4.5
1969 5 5.2 5.1 2.6 6.4
1970 5.9 6.5 7.6 3.7 5.5
1971 4.3 9.5 6.3 5.3 5.5
1972 3.6 6.8 4.9 5.4 5.9
1973 6.2 8.4 12 7 7.5
1974 10.9 16 24.6 7 14
1975 9.2 24.2 11.7 5.9 11.7
1976 5.8 16.5 9.3 4.5 9.6
1977 6.4 15.9 8.1 3.7 9.4
1978 7.6 8.3 3.8 2.7 9.1
1979 11.4 13.4 3.6 4.1 10.7
1980 13.6 18 8 5.5 13.3
Nguồn tin : khoa tóan thống kê – ĐHKT

a. Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời
gian . Cho nhận xét tổng quát về lạm phát của 5 nước ?
25 20


20 16


15 12




DUC
ANH



10 8


5 4


0 0
1956 1960 1964 1968 1972 1976 1980 1984 1956 1960 1964 1968 1972 1976 1980 1984
NAM NAM



28 16

24 14

20 12

16 10
NHAT




PHAP


12 8

8 6

4 4

0 2
1956 1960 1964 1968 1972 1976 1980 1984 1956 1960 1964 1968 1972 1976 1980 1984
NAM NAM



14

12

10

8
US




6

4

2

0
1956 1960 1964 1968 1972 1976 1980 1984
NAM
Nhận xét: NHìn chung tỷ lệ lạm phát của có đều có xu hướng tăng
lên, nhưng trong đó Đức và Nhật chỉ tăng chậm.

b. Lạm phát nước nào biến thiên nhiều hơn giải thích ?

ANH DUC NHAT PHAP US
Mean 8.547619 4.638095 7.347619 6.714286 5.123810
Median 6.500000 3.700000 6.300000 5.500000 4.300000
Maximum 24.20000 18.00000 24.60000 14.00000 13.60000
Minimum 1.000000 1.500000 3.600000 2.600000 1.100000
Std. Dev. 6.321046 3.458248 4.632992 3.579146 3.694984
Skewness 0.941799 2.852530 2.603757 0.653541 0.784310
Kurtosis 2.866323 11.83415 10.29502 2.214858 2.672861

Jarque-Bera 3.120083 96.76612 70.29363 2.034298 2.246638
Probability 0.210127 0.000000 0.000000 0.361625 0.325199

Sum 179.5000 97.40000 154.3000 141.0000 107.6000
Sum Sq. Dev. 799.1124 239.1895 429.2924 256.2057 273.0581

Observations 21 21 21 21 21


Từ bảng tính các thống kê mô tả, ta thấy độ lệch chuẩn lạm phát của
nước Anh là lớn nhất ( = 6.321046) do đó lạm phát của nước Anh biến
thiên nhiều nhất.



c. Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng
quốc gia theo giả định
(Lamphat)i = 1 + 2 (Thoigian)i + Ui
Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra
kết luận tổng quát về tác động lạm phát tại từng quốc gia ?
Vẽ đồ thị ?


- Ước lượng mô hình hồi qui US:
Dependent Variable: US
Method: Least Squares
Date: 05/10/10 Time: 21:02
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.

C -0.164502 0.734285 -0.224030 0.8251
NAMMOHINH 0.528831 0.062811 8.419444 0.0000

R-squared 0.788624 Mean dependent var 5.123810
Adjusted R-squared 0.777499 S.D. dependent var 3.694984
S.E. of regression 1.742926 Akaike info criterion 4.039401
Sum squared resid 57.71804 Schwarz criterion 4.138879
Log likelihood -40.41371 F-statistic 70.88704
Durbin-Watson stat 1.131804 Prob(F-statistic) 0.000000



US = -0.1645021645 + 0.5288311688*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của
nước Mỹ tăng lên 0.52883%.
Tỷ lệ lạm phát tăng nhanh tác động mạnh mẽ đến nền kinh tế, làm
cho giá cả các mặt hàng tăng lên nhanh chóng…
US vs. NAM
14

12

10

8

6
US




4

2

0

-2
1956 1960 1964 1968 1972 1976 1980 1984
NAM

- Ước lượng mô hình hồi qui Anh:
Dependent Variable: ANH
Method: Least Squares
Date: 05/10/10 Time: 21:03
Sample: 1960 1980
Included observations: 21
Variable Coefficient Std. Error t-Statistic Prob.

C 0.322944 1.612211 0.200311 0.8434
NAMMOHINH 0.822468 0.137908 5.963871 0.0000

R-squared 0.651809 Mean dependent var 8.547619
Adjusted R-squared 0.633483 S.D. dependent var 6.321046
S.E. of regression 3.826801 Akaike info criterion 5.612328
Sum squared resid 278.2437 Schwarz criterion 5.711806
Log likelihood -56.92945 F-statistic 35.56776
Durbin-Watson stat 1.141176 Prob(F-statistic) 0.000010


ANH = 0.3229437229 + 0.8224675325*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của
nước Anh tăng lên 0.823%.
ANH vs. NAM
25


20


15
ANH




10


5


0
1956 1960 1964 1968 1972 1976 1980 1984
NAM

- Ước lượng mô hình hồi qui Nhật:
Dependent Variable: NHAT
Method: Least Squares
Date: 05/10/10 Time: 21:09
Sample: 1960 1980
Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.
C 5.215152 1.919155 2.717421 0.0137
NAMMOHINH 0.213247 0.164164 1.298984 0.2095

R-squared 0.081565 Mean dependent var 7.347619
Adjusted R-squared 0.033226 S.D. dependent var 4.632992
S.E. of regression 4.555374 Akaike info criterion 5.960885
Sum squared resid 394.2773 Schwarz criterion 6.060364
Log likelihood -60.58929 F-statistic 1.687359
Durbin-Watson stat 1.175297 Prob(F-statistic) 0.209493



NHAT = 5.215151515 + 0.2132467532*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của
nước Nhật tăng lên 0.21324%.

NHAT vs. NAM
28

24

20

16
NHAT




12

8

4

0
1956 1960 1964 1968 1972 1976 1980 1984
NAM

- Ước lượng mô hình hồi qui Đức:
Dependent Variable: DUC
Method: Least Squares
Date: 05/10/10 Time: 21:20
Sample: 1960 1980
Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.
C 3.593939 1.468324 2.447648 0.0243
NAMMOHINH 0.104416 0.125600 0.831332 0.4161

R-squared 0.035098 Mean dependent var 4.638095
Adjusted R-squared -0.015687 S.D. dependent var 3.458248
S.E. of regression 3.485266 Akaike info criterion 5.425359
Sum squared resid 230.7945 Schwarz criterion 5.524837
Log likelihood -54.96626 F-statistic 0.691114
Durbin-Watson stat 2.328057 Prob(F-statistic) 0.416112



DUC = 3.593939394 + 0.1044155844*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước
Đức tăng lên 0.104415%.
DUC vs. NAM
20


16


12
DUC




8


4


0
1956 1960 1964 1968 1972 1976 1980 1984
NAM

- Ước lượng mô hình hồi qui Phap:
Dependent Variable: PHAP
Method: Least Squares
Date: 05/10/10 Time: 21:21
Sample: 1960 1980
Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C 1.853247 0.832871 2.225130 0.0384
NAMMOHINH 0.486104 0.071244 6.823112 0.0000

R-squared 0.710166 Mean dependent var 6.714286
Adjusted R-squared 0.694912 S.D. dependent var 3.579146
S.E. of regression 1.976933 Akaike info criterion 4.291363
Sum squared resid 74.25703 Schwarz criterion 4.390842
Log likelihood -43.05931 F-statistic 46.55486
Durbin-Watson stat 0.961869 Prob(F-statistic) 0.000002



PHAP = 1.853246753 + 0.4861038961*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát
của nước Pháp tăng lên 0.48610%.
PHAP vs. NAM
16

14

12

10
PHAP




8

6

4

2

0
1956 1960 1964 1968 1972 1976 1980 1984
NAM

d. Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo
tỉ lệ lạm phát của Mỹ
(Lamphat)i = 1 + 2 (lamphat-USA)i + Ui
Đọc và đánh giá từng mô hình ước lượng ? Đưa ra kết luận
tổng quát về tác động lạm phát tại từng quốc gia so với lạm phát
của USA ?


- Anh và US:
Dependent Variable: ANH
Method: Least Squares
Date: 05/10/10 Time: 21:22
Sample: 1960 1980
Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C 3.942998 1.029230 3.831018 0.0011
ANHLP 1.344882 0.199758 6.732569 0.0000

R-squared 0.704636 Mean dependent var 8.547619
Adjusted R-squared 0.689091 S.D. dependent var 6.321046
S.E. of regression 3.524566 Akaike info criterion 5.447784
Sum squared resid 236.0287 Schwarz criterion 5.547263
Log likelihood -55.20174 F-statistic 45.32748
Durbin-Watson stat 0.439091 Prob(F-statistic) 0.000002

ANH = 3.942998281 + 1.344882282*ANHLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Anh
sẽ tăng lên 1.345%
- Nhật và US:
Dependent Variable: NHAT
Method: Least Squares
Date: 05/10/10 Time: 21:22
Sample: 1960 1980
Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C 5.795073 0.866538 6.687612 0.0000
NHATLP 0.698147 0.177928 3.923768 0.0009

R-squared 0.447610 Mean dependent var 7.347619
Adjusted R-squared 0.418536 S.D. dependent var 4.632992
S.E. of regression 3.532831 Akaike info criterion 5.452469
Sum squared resid 237.1370 Schwarz criterion 5.551947
Log likelihood -55.25092 F-statistic 15.39596
Durbin-Watson stat 0.534453 Prob(F-statistic) 0.000912



NHAT = 5.795072835 + 0.6981471192*NHATLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của
Nhật sẽ tăng lên 0.7%.
-Đức va US:
Dependent Variable: DUC
Method: Least Squares
Date: 05/10/10 Time: 21:23
Sample: 1960 1980
Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C 4.860462 0.627216 7.749263 0.0000
DUCLP 0.457815 0.142581 3.210916 0.0046

R-squared 0.351757 Mean dependent var 4.638095
Adjusted R-squared 0.317639 S.D. dependent var 3.458248
S.E. of regression 2.856691 Akaike info criterion 5.027598
Sum squared resid 155.0530 Schwarz criterion 5.127076
Log likelihood -50.78978 F-statistic 10.30998
Durbin-Watson stat 1.202348 Prob(F-statistic) 0.004600



DUC = 4.860462352 + 0.4578146464*DUCLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của
Đức sẽ tăng lên 0.46%.
-Pháp Và US:
Dependent Variable: PHAP
Method: Least Squares
Date: 05/10/10 Time: 21:25
Sample: 1960 1980
Included observations: 21

Variable Coefficient Std. Error t-Statistic Prob.

C 6.251776 1.212106 5.157778 0.0001
PHAPLP 0.290800 0.574747 0.505961 0.6187

R-squared 0.013294 Mean dependent var 6.714286
Adjusted R-squared -0.038637 S.D. dependent var 3.579146
S.E. of regression 3.647635 Akaike info criterion 5.516428
Sum squared resid 252.7996 Schwarz criterion 5.615906
Log likelihood -55.92249 F-statistic 0.255996
Durbin-Watson stat 0.273299 Prob(F-statistic) 0.618704



PHAP = 6.25177575 + 0.2907996784*PHAPLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của
Pháp sẽ tăng lên 0.29%.
Nhận xét chung:
Từ kết quả trên ta thấy tỉ lệ lạm phát của Anh chịu ảnh hưởng nhiều bởi
tỉ lệ lạm phát của Hoa Kì ( tăng lên 1.345%) , còn tỉ lệ lạm phát của Nhật
( 0.7%) và Đức (0.46%), Pháp ( 0.29%) ít chịu ảnh hưởng bởi tỉ lệ lạm
phát của Hoa Kì.


Bài tập 2 :
Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ
liệu từ 8 sinh viên khác nhau trong một lớp . Bảng dữ liệu gốc được
trình bài như sau :

Sinh Điểm Điểm điểm
viên tóan khoa học Anh Văn
1 13.5 9.9 13.3
2 13.7 6.8 10
3 7 5.5 8.9
4 7.4 5.7 2.4
5 13.2 10.3 8.2
6 7.3 1.8 6.3
7 5.2 5.2 7.7
8 8.4 6.9 2.9

Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn
Anh văn và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể
dựa vào điểm môn Khoa học và của sinh viên có thể dự đóan điểm của
môn Anh văn hay không - Cũng như dựa vào điểm môn Tóan của sinh
viên có thể dự đóan điểm của môn Anh văn hay không ?
Cho từng cặp môn học tương ứng , anh chị :

a. Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? -
Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết
luận tổng quát ?
Điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh
văn hay không:
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/11/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.

C 3.762656 3.422463 1.099400 0.3137
DIEMKHOAHOC 0.568114 0.489567 1.160442 0.2900

R-squared 0.183299 Mean dependent var 7.462500
Adjusted R-squared 0.047182 S.D. dependent var 3.605130
S.E. of regression 3.519055 Akaike info criterion 5.566580
Sum squared resid 74.30247 Schwarz criterion 5.586440
Log likelihood -20.26632 F-statistic 1.346627
Durbin-Watson stat 1.325655 Prob(F-statistic) 0.289950



DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC

Khi điểm khoa học tăng lên một điểm thì về trung bình điểm môn
anh văn sẽ tăng lên 0.56 điểm.

Điểm môn Tóan của sinh viên có thể dự đóan điểm của môn Anh văn
hay không:
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/11/10 Time: 21:13
Sample: 1 8
Included observations: 8

Variable Coefficient Std. Error t-Statistic Prob.

C 1.691257 3.486802 0.485045 0.6448
DIEMTOAN 0.609907 0.348935 1.747907 0.1311

R-squared 0.337396 Mean dependent var 7.462500
Adjusted R-squared 0.226962 S.D. dependent var 3.605130
S.E. of regression 3.169724 Akaike info criterion 5.357484
Sum squared resid 60.28290 Schwarz criterion 5.377344
Log likelihood -19.42994 F-statistic 3.055180
Durbin-Watson stat 2.104833 Prob(F-statistic) 0.131069




DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN

Khi điểm toán tăng lên một điểm thì về trung bình điểm môn anh
văn sẽ tăng lên 0.6 điểm.
 Kết Luận tổng quát: Ta thấy hệ số tương quan của 2 mô hình thấp
(R2 dân số tăng lên-> gia đình sẽ đông con hơn->nghèo->không chăm
sóc đầy đủ cho con cái->tỷ lệ tử vong tăng.
Biểu đồ phân tán giữa CM và FLR:




CM va PGNP
320

280

240

200
CM




160

120

80

40

0
0 4000 8000 12000 16000 20000
PGNP

-Phù hợp với lời gải thích ban đầu.
CM va TFR
320

280

240

200
CM




160

120

80

40

0
1 2 3 4 5 6 7 8 9
TFR


- Không phù hợp với lời giải thích ban đầu vì : qua biểu đồ cho thấy khi
tỷ lệ sinh tăng ( giảm ) tỷ lệ tử cũng tăng ( giảm ) theo. Đây là mối quan
hệ tỉ lệ thuận

CM và FLR
320

280

240

200
CM




160

120

80

40

0
0 20 40 60 80 100
FLR


Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của
trẻ sơ sinh càng thấp và ngược lại. Phù hợp với lời giải thích ban đầu.
2. Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP .
Nhận xét các thông tin chính từ mô hình nầy như ý nghĩa thống kê
của hệ số hồi qui, hệ số xác định R2 .


Dependent Variable: CM
Method: Least Squares
Date: 05/11/10 Time: 23:05
Sample: 1 64
Included observations: 64

Variable Coefficient Std. Error t-Statistic Prob.

C 157.4244 9.845583 15.98935 0.0000
PGNP -0.011364 0.003233 -3.515661 0.0008

R-squared 0.166217 Mean dependent var 141.5000
Adjusted R-
squared 0.152769 S.D. dependent var 75.97807
S.E. of regression 69.93413 Akaike info criterion 11.36374
Sum squared resid 303228.5 Schwarz criterion 11.43120
Log likelihood -361.6396 F-statistic 12.35987
Durbin-Watson
stat 1.931458 Prob(F-statistic) 0.000826


CM = 157.4244406 - 0.01136445358*PGNP
Khi GNP bình quân đầu người tăng lên 1USD thì Tỷ lệ tử vong của
trẻ sơ sinh giảm 1.1%.
Hệ số R2=16.62% là không tốt vì không giải thích được các biến
đưa vào mô hình. Hay nói cách khác tỉ lệ tử vong của trẻ sơ sinh ít chịu
ảnh hưởng bởi GNP bình quân đầu người mà phụ thuộc vào nhiều nhân
tố khác nữa.

3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và
PGNP. Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống
kê của hệ số , hệ số xác định R2.


Dependent Variable: CM
Method: Least Squares
Date: 05/11/10 Time: 23:06
Sample: 1 64
Included observations: 64

t-
Variable Coefficient Std. Error Statistic Prob.

22.7410
C 263.6416 11.59318 9 0.0000
-
10.6292
FLR -2.231586 0.209947 7 0.0000
-
2.81870
PGNP -0.005647 0.002003 3 0.0065

Mean dependent 141.500
R-squared 0.707665 var 0
Adjusted R- 75.9780
squared 0.698081 S.D. dependent var 7
Akaike info 10.3469
S.E. of regression 41.74780 criterion 1
10.4481
Sum squared resid 106315.6 Schwarz criterion 1
73.8325
Log likelihood -328.1012 F-statistic 4
Durbin-Watson 0.00000
stat 2.186159 Prob(F-statistic) 0

CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
Trong điều kiện các yếu tố khác không đổi, khi GDP đấu người
tăng lên 1 USD thì tỷ lệ tử vong của trẻ sơ sinh tăng giảm đi 5%.
Hệ số R2 = 70.76% được xem là không tốt vì không giải thích được
tất cả các biến đưa vào mô hình.

4 . So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì
về hệ số hồi qui tìm được của biến PGNP , nếu phải chọn hệ số
PGNP của mô hình nào để giải thích tác động của PGNP lên CM ?
Tại sao?

CM = 157.4244406 - 0.01136445358*PGNP
CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
- Nhận xét: hệ số hồi quy của biến PGNP của mô hình đơn > hệ số hồi
quy PGNP cảu mô hình đa biến.
- Chọn mô hình 2 vì: ta thấy hệ số của FLR < α nên ta bác bỏ H0 tức hệ
số FLR có ý nghĩa thống kê. ( Kiếm định hệ số Prob )

5. Hồi qui CM cho tất cả các biến trong tập dữ liệu ? Nhận xét
va cho ý kiến của anh chị?


Dependent Variable: CM
Method: Least Squares
Date: 05/11/10 Time: 23:17
Sample: 1 64
Included observations: 64

Variable Coefficient Std. Error t-Statistic Prob.

C 168.3067 32.89165 5.117003 0.0000
FLR -1.768029 0.248017 -7.128663 0.0000
PGNP -0.005511 0.001878 -2.934275 0.0047
TFR 12.86864 4.190533 3.070883 0.0032

R-squared 0.747372 Mean dependent var 141.5000
Adjusted R-
squared 0.734740 S.D. dependent var 75.97807
S.E. of regression 39.13127 Akaike info criterion 10.23218
Sum squared resid 91875.38 Schwarz criterion 10.36711
Log likelihood -323.4298 F-statistic 59.16767
Durbin-Watson
stat 2.170318 Prob(F-statistic) 0.000000

CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP +
12.86863633*TFR
- Trong điều kiện các yếu tố khác không đổi thì khi FLR tăng lên 1% thì
về trung bình CM giảm 1.768%, PGNP tăng lên 1usd thì về trung bình CM
giảm 0.0055%, TFR tăng lên 1% thì về trung bình CM cũng tăng lên
12.8686%.
- R2 = 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này
khá cao, có ý nghĩa thống kê hơn cả các mô hình trên.




Bài 4 :Ta có tập dữ liệu sau:

obs AGE ALC EDU EDU HEX INC MOR PHY POV TOB URB
D C 1 2 C C T S C
1 0.122 1.9 0.565 0.122 1620 1067 934.9 142 0.189 114.5 0.675
3
2 0.034 3.86 0.825 0.211 1667 1818 396.2 127 0.107 128.9 0.417
7
3 0.123 3.08 0.724 0.174 1473 1279 771.5 184 0.132 107.1 0.764
5
4 0.149 1.78 0.555 0.108 1552 1047 1022.8 136 0.19 125.8 0.397
6
5 0.106 3.19 0.735 0.196 2069 1606 766 235 0.114 102.8 0.957
5
6 0.09 3.09 0.786 0.23 1664 1481 625.7 196 0.101 112.4 0.817
2
7 0.133 2.8 0.703 0.207 1945 1808 888.4 275 0.08 111 0.926
9
8 0.114 3.17 0.686 0.175 1691 1427 880.2 185 0.119 144.5 0.659
2
9 0.122 5.34 0.671 0.275 3872 1816 1120.5 552 0.186 122.1 1
8
10 0.177 3.12 0.667 0.149 1886 1374 1065.6 191 0.135 124.2 0.908
2
11 0.1 2.48 0.564 0.146 1755 1254 814.3 159 0.166 128.8 0.648
3
12 0.097 2.97 0.738 0.203 1693 1381 554.2 212 0.099 69.8 0.763
4
13 0.112 2.43 0.737 0.158 1288 1112 708.7 118 0.126 100.7 0.2
0
14 0.12 2.77 0.665 0.162 1864 1473 886.5 199 0.11 121.6 0.825
8
15 0.119 2.19 0.664 0.125 1625 1244 876.3 142 0.097 135.3 0.681
6
16 0.145 2.09 0.715 0.139 1758 1259 966.1 136 0.101 109.4 0.434
4
17 0.134 1.95 0.733 0.17 1820 1377 900.3 162 0.101 115.7 0.534
5
18 0.12 1.85 0.531 0.111 1404 1082 935 149 0.176 182.4 0.461
4
19 0.101 2.63 0.577 0.139 1716 1127 825.4 173 0.186 125 0.692
4
20 0.133 2.57 0.687 0.144 1641 1188 979.4 165 0.13 127.9 0.361
7
21 0.106 2.84 0.674 0.204 1732 1586 833.6 303 0.098 121.9 0.929
4
22 0.136 3.04 0.722 0.2 2289 1638 955.4 300 0.096 117.2 0.906
0
23 0.114 2.6 0.68 0.143 1996 1360 866.2 174 0.104 126.6 0.799
8
24 0.125 2.68 0.731 0.174 1888 1408 830.2 203 0.095 113 0.666
7
25 0.12 2.06 0.548 0.123 1519 9187 944.6 117 0.239 115.3 0.305
26 0.137 2.27 0.635 0.139 1858 1324 1000.4 179 0.122 129.2 0.66
4
27 0.121 2.95 0.744 0.175 1494 1097 815 136 0.123 103.6 0.242
4
28 0.136 2.41 0.734 0.155 1766 1328 928.5 156 0.107 105.1 0.476
1
29 0.103 5.19 0.755 0.144 1946 1448 772.3 155 0.087 146.7 0.826
8
30 0.116 4.91 0.723 0.182 1417 1496 849.1 179 0.085 201.1 0.563
4
31 0.129 2.83 0.674 0.183 1702 1721 940.7 219 0.095 116.9 1
1
32 0.098 2.75 0.689 0.176 1385 1091 672.8 161 0.176 88 0.489
4
33 0.128 2.67 0.663 0.179 2412 1605 969.9 287 0.134 115.9 0.912
0
34 0.115 2.13 0.548 0.132 1380 1161 846.3 168 0.148 156.3 0.554
7
35 0.13 2.55 0.664 0.148 1872 1205 821.6 157 0.126 103.2 0.384
2
36 0.123 2.26 0.67 0.137 1833 1322 920.6 182 0.103 126.7 0.789
8
37 0.124 1.91 0.66 0.151 1644 1223 900.8 138 0.134 124.2 0.588
2
38 0.134 2.63 0.756 0.179 1654 1262 889.7 189 0.107 118.6 0.677
2
39 0.146 2.25 0.647 0.136 1894 1343 1043.9 214 0.105 115.8 0.848
7
40 0.146 2.92 0.611 0.154 2054 1390 997.6 223 0.103 133.4 0.926
6
41 0.105 2.5 0.537 0.134 1341 1058 812.6 146 0.166 125.4 0.605
6
42 0.139 2.33 0.679 0.14 1617 1116 932.6 130 0.169 104.4 0.291
1
43 0.123 1.95 0.562 0.126 1671 1124 906.8 176 0.165 128.7 0.671
3
44 0.095 2.82 0.626 0.169 1577 1348 722.2 160 0.147 115.9 0.813
3
45 0.08 1.53 0.8 0.199 1203 1049 550.1 171 0.103 66.5 0.774
3
46 0.119 3.12 0.71 0.19 1481 1211 871.4 232 0.121 144.5 0.232
7
47 0.105 2.55 0.624 0.191 1498 1454 794.1 194 0.118 134.6 0.722
2
48 0.117 2.71 0.776 0.19 1660 1387 782.8 196 0.098 96.5 0.816
6
49 0.136 1.68 0.56 0.104 1542 1019 1003.8 156 0.15 109.1 0.365
3
50 0.13 3.19 0.696 0.148 1862 1315 868.8 172 0.087 107 0.665
4
51 0.084 2.86 0.779 0.172 1453 1322 642.9 125 0.079 125.7 0.292
3


Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số
- INCC : Thu nhập đầu người tính bằng USD
- POV : Tỉ lệ của những người dân trong nước sống dưới
mức nghèo khó
- EDU1 : Tỉ lệ dân số đã học trung học
- EDU2 : Tỉ lệ dân số đã học trung học và đại học.
- ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người.
- TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao
- HEXC : Chi tiêu y tế bình quân đầu người (USD)
- URB : Tỉ lệ dân số sống tại các khu vực thành thị
- AGED : Tỉ lệ dân số có độ tuồi trên 65
- PHYS : Các cán bộ y tế trên 1000.000 dân

Yêu cầu :
1. Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích,
hãy lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể
và chỉ ra hướng tác động nầy?

- Thu nhập (INCC): nếu không có thu nhập sẽ dẫn đến nghèo đói,
bệnh tật không có tiền mua thuốc…
- Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó
(POV): Không có thu nhập, nghèo đói -> thiều ăn, bệnh tật….
- Tỷ lệ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã
học trung học và đại học càng cao thi trình độ dân trí của người dân càng
cao, mới tiếp thu được những kiến thức tiến bộ về sức khỏe, y tế, khoa
học….từ đó có thể giảm bớt được tỉ lệ tử vong chung.

- Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người(ALCC): Uống
rượu sẽ dẫn đến tai nạn, bệnh tật-> tử vong
- Hút thuốc(TOBC): Dẫn tới các căn bênh về đường hô hấp
-Chi tiêu y tế: Khi bị bệnh cẫn phải tới bênh viên nhưng nếu chi
tiêu cho y tế thấp sẽ dẫn đến không có thuốc chữa bệnh-> tử vong.
- Tỉ lệ dân số sống tại các khu vực thành thị(URB): Dân số sống ở
thành thị sẽ mắc phải sống trong môi trường ô nhiễm, tiếng ồn-> mắc
một số căn bệnh.
- Tỉ lệ dân số có độ tuồi trên 65(AGED): Những người cao tuổi khả
năng chống lại bệnh tật, thời tiết kém-> dễ tử vong.
- Các cán bộ y tế(PHYS): Cán bộ y tế mà ít, kém chất lượng cũng
sẽ dẫn đến tỷ lệ tử vong chung.


2. Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến
giải thích đang có? Thực hiện kiểm định cho mức ý nghĩa tổng
quát – Nhận xét sự thích hợp ? Kiểm định mức ý nghĩa đối với
từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị
có thể muốn bỏ qua.


Dependent Variable: MORT
Method: Least Squares
Date: 05/11/10 Time: 23:30
Sample: 1 51
Included observations: 51

t-
Variable Coefficient Std. Error Statistic Prob.

0.27700
C 46.59555 168.2097 9 0.7832
12.8027
AGED 4126.895 322.3451 2 0.0000
-
2.33536
ALCC -25.91511 11.09681 6 0.0246
0.34941
EDU1 68.77913 196.8405 5 0.7286
-
2.15020
EDU2 -1180.217 548.8868 1 0.0376
2.16508
HEXC 0.073889 0.034127 8 0.0364
0.77555
INCC 0.004511 0.005817 1 0.4426
2.42904
PHYS 0.640384 0.263636 4 0.0197
1.78206
POV 549.8647 308.5540 9 0.0823
4.15973
TOBC 1.470480 0.353504 2 0.0002
-
0.91054
URB -32.45556 35.64423 2 0.3680

Mean dependent 855.005
R-squared 0.948570 var 9
Adjusted R- 137.966
squared 0.935713 S.D. dependent var 0
Akaike info 10.1359
S.E. of regression 34.98117 criterion 2
10.5525
Sum squared resid 48947.30 Schwarz criterion 9
73.7759
Log likelihood -247.4660 F-statistic 2
Durbin-Watson 0.00000
stat 1.597995 Prob(F-statistic) 0


MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC +
68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC +
0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV +
1.470480259*TOBC - 32.45555872*URB
Ta thấy hệ số Prob(F-statistic) < α nên ta bác bỏ H0 có nghĩa là có ít
nhất 1 biến có ý nghĩa thống kê trong mô hình này.
Nhận xét sự thích hợp:
Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và
xác định các biến mà anh chị có thể muốn bỏ qua.
Qua kiểm đinh hệ số Prob ta thấy tất cả các biến trong mô hình đếu
có ý nghĩa thống kê, chỉ trừ 3 biến EDU1> α , INCC> α , URB> α là không
có ý nghĩa thống kê nên đây là các biến ta có thể bỏ qua.
3. Đầu tiên hãy thực hiện một kiểm định WALD đối với việc bỏ tất
cả những biến nầy. Sau đó, bỏ tất cả chúng và ước lượng lại mô
hình . hãy đánh giá chất lượng của phép hồi qui mới nầy ?

Mô hình thu hẹp:

Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 10:56
Sample: 1 51
Included observations: 51

Coeffici
Variable ent Std. Error t-Statistic Prob.

73.7683
C 6 94.44515 0.781071 0.4390
0.08981
HEXC 6 0.027059 3.319302 0.0018
-
843.880
EDU2 0 352.4100 -2.394597 0.0211
-
25.2588
ALCC 8 10.23731 -2.467337 0.0177
4167.31
AGED 9 307.4568 13.55416 0.0000
0.47965
PHYS 4 0.193828 2.474637 0.0174
452.765
POV 5 161.4134 2.805006 0.0075
1.56351
TOBC 2 0.286509 5.457105 0.0000
0.94690 Mean dependent 855.005
R-squared 3 var 9
Adjusted R- 0.93825 137.966
squared 9 S.D. dependent var 0
34.2814 Akaike info 10.0501
S.E. of regression 0 criterion 8
50534.2 10.3532
Sum squared resid 1 Schwarz criterion 1
-
248.279 109.547
Log likelihood 7 F-statistic 9
Durbin-Watson 1.61003 0.00000
stat 5 Prob(F-statistic) 0



Mô hình đầy đủ:

Dependent Variable: MORT
Method: Least Squares
Date: 05/11/10 Time: 23:30
Sample: 1 51
Included observations: 51

t-
Variable Coefficient Std. Error Statistic Prob.

0.27700
C 46.59555 168.2097 9 0.7832
12.8027
AGED 4126.895 322.3451 2 0.0000
-
2.33536
ALCC -25.91511 11.09681 6 0.0246
0.34941
EDU1 68.77913 196.8405 5 0.7286
-
2.15020
EDU2 -1180.217 548.8868 1 0.0376
HEXC 0.073889 0.034127 2.16508 0.0364
8
0.77555
INCC 0.004511 0.005817 1 0.4426
2.42904
PHYS 0.640384 0.263636 4 0.0197
1.78206
POV 549.8647 308.5540 9 0.0823
4.15973
TOBC 1.470480 0.353504 2 0.0002
-
0.91054
URB -32.45556 35.64423 2 0.3680

Mean dependent 855.005
R-squared 0.948570 var 9
Adjusted R- 137.966
squared 0.935713 S.D. dependent var 0
Akaike info 10.1359
S.E. of regression 34.98117 criterion 2
10.5525
Sum squared resid 48947.30 Schwarz criterion 9
73.7759
Log likelihood -247.4660 F-statistic 2
Durbin-Watson 0.00000
stat 1.597995 Prob(F-statistic) 0


Ta có : UuR2= 0.9485
RR2= 0.9469


(Uur 2 − R 2) / m
F= (1 − Rur 2) /(n − k ) = 0.414239
Vậy F(tính toán) Chi-Square(2)  bác bỏ Ho  có hiện tượng phương sai sai số thay
đổi mô hình câu 1 không có ý nghĩa thống kê.




Bài tập 8 :
Dữ l iệu sau đây cho thấy về thu nhập cá nhân và chi tiêu cho đi
lại trong nước năm 199… cho 50 tiểu bang vả Thủ đô của USA .
Các Biến trong tập dữ liệu nầy là :
- Exptrav : Chi tiêu cho đi lại tính bằng tỉ USD
- Income : Thu nhập cá nhân tính bằng tỉ USD
- POP : Dân số tính bằng triệu người

EXPTRA INCOME POP EXPTRA INCOME POP
V V
1.142 9.3 0.47 6.122 76.6 3.564
1.03 11.2 0.576 4.831 61.2 3.63
3.169 17.1 0.579 3.567 64.1 3.794
1.085 13.8 0.598 5.525 71.3 3.945
0.828 10.9 0.637 3.682 71.6 4.181
0.836 15.3 0.698 4.848 71.3 4.29
0.834 12.8 0.716 4.492 94.9 4.524
1.434 14.6 0.841 4.922 118.5 4.958
0.708 21.2 1 4.453 99.9 5.044
1.462 19.3 1.1 6.779 93.9 5.094
1.408 25.1 1.124 6.215 102.4 5.235
5.866 27.4 1.166 5.318 114.5 5.259
1.483 23.3 1.24 4.22 109.6 5.706
12.539 31.6 1.382 7.452 146.9 6.018
1.751 31.7 1.613 9.076 140.2 6.473
2.695 26.4 1.616 9.186 132.9 6.902
1.371 29.4 1.818 7.884 129.8 6.952
2.712 30 1.86 11.134 211.2 7.859
2.745 38.8 2.426 7.498 194.7 9.46
2.457 50.3 2.535 8.546 217.9 11.061
2.236 38.9 2.64 13.804 263.6 11.686
2.746 51.6 2.821 10.06 256 12.03
3.795 59 3.035 28.629 283.4 13.726
2.698 55 3.233 20.215 345 18.022
3.458 92.3 3.278 19.95 450.6 18.153
42.48 683.5 31.217

Yêu cầu :
1. Thực hiện mô hình đơn giản xác định rằng Exptrav là một
hàm tuyến tính theo Income ?

Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 14:43
Sample: 1 51
Included observations: 51

Coeffici
Variable ent Std. Error t-Statistic Prob.

0.49812
C 0 0.535515 0.930170 0.3568
0.05557
INCOME 3 0.003293 16.87558 0.0000

0.85319 Mean dependent 6.34070
R-squared 9 var 6
Adjusted R- 0.85020 7.53834
squared 3 S.D. dependent var 3
2.91761 Akaike info 5.01783
S.E. of regression 1 criterion 4
417.110 5.09359
Sum squared resid 3 Schwarz criterion 1
-
125.954 284.785
Log likelihood 8 F-statistic 0
Durbin-Watson 2.19492 Prob(F-statistic) 0.00000
stat 8 0

EXPTRAV = 0.4981199552 + 0.05557310647*INCOME
2. Vẽ đồ thị phần dư ( u) của mô hình hồi qui câu 1 theo
income. Dựa trên đồ thị trên anh chị có kết luận gì về
phương sai của sai số thay đổi ?
INCOME vs. RESID
700

600

500

400
INCOME




300

200

100

0
-8 -4 0 4 8 12 16
RESID

3. Vẽ đồ thị bình phương phần dư (u2) của mô hình hồi qui câu 1 theo
income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai
số thay đổi ?
INCOME vs. U2
700

600

500

400
INCOME




300

200

100

0
0 40 80 120 160
U2




3. hãy tiến hành kiểm định hiện tượng phương sai của sai số
thay đổi trong mô hình câu 1 với mức ý nghĩa = 10% theo các
cách thức đã đuợc giới thiệu . Các kết luận có mâu thuẩn
nhau hay không ?
Kiểm định White:

White Heteroskedasticity Test:

2.53763 0.08961
F-statistic 3 Prob. F(2,48) 4
4.87682 Prob. Chi- 0.08730
Obs*R-squared 0 Square(2) 0


Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/16/10 Time: 14:59
Sample: 1 51
Included observations: 51

Coeffici
Variable ent Std. Error t-Statistic Prob.

-
1.68956
C 1 5.950486 -0.283937 0.7777
0.12698
INCOME 6 0.073163 1.735656 0.0890
-
0.00013
INCOME^2 2 0.000127 -1.039498 0.3038

0.09562 Mean dependent 8.17863
R-squared 4 var 4
Adjusted R- 0.05794 26.0025
squared 2 S.D. dependent var 4
25.2379 Akaike info 9.35160
S.E. of regression 8 criterion 0
30573.8 9.46523
Sum squared resid 8 Schwarz criterion 7
-
235.465 2.53763
Log likelihood 8 F-statistic 3
Durbin-Watson 2.14729 0.08961
stat 4 Prob(F-statistic) 4


n.R2=4.876820 > Chi-Square(2) = 0.210720 --- bác bỏ Ho --phương
sai thay đổi

kiểm định Goldseld - Quant
giả thiết: Ho: e1=e2=…=en
H1: ei # ej

Chia mẫu thành ba nhóm
Nhóm 1: từ n1 – n17
Nhóm 2: từ n18 –n34 (loại bỏ)
Nhóm 3 : từ n35 – n51
Ước lượng phương trình hồi quy nhóm 1và 3


Nhóm 1:

Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 21:55
Sample: 1 17
Included observations: 17

Variable Coefficient Std. Error t-Statistic Prob.

C -1.765089 1.793694 -0.984052 0.3407
INCOME 0.204605 0.084089 2.433181 0.0279

R-squared 0.282996 Mean dependent var 2.331824
Adjusted R-squared 0.235195 S.D. dependent var 2.914951
S.E. of regression 2.549216 Akaike info criterion 4.819579
Sum squared resid 97.47750 Schwarz criterion 4.917604
Log likelihood -38.96642 F-statistic 5.920371
Durbin-Watson stat 2.587301 Prob(F-statistic) 0.027949


Ta có: RSS1 = 97,4775


Nhóm 3:
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 22:00
Sample: 35 51
Included observations: 17

Variable Coefficient Std. Error t-Statistic Prob.

C -0.763340 1.862588 -0.409827 0.6877
INCOME 0.059705 0.006856 8.708565 0.0000

R-squared 0.834873 Mean dependent var 12.84976
Adjusted R-squared 0.823864 S.D. dependent var 9.949654
S.E. of regression 4.175722 Akaike info criterion 5.806583
Sum squared resid 261.5498 Schwarz criterion 5.904608
Log likelihood -47.35595 F-statistic 75.83910
Durbin-Watson stat 2.250119 Prob(F-statistic) 0.000000




Ta có RSS2 = 261,5498
Fc=97.4775/261.5498 = 0.373
Tra bảng phân phối Fisher với mức ý nghĩa 10% F(15;32)=1,72
Ta có Fc < F  bác bỏ Ho ---có hiện tượng phương sai thay đổi



4. Nếu phần dư ở mô hình 1 có hiện tuợng phương sai của sai số
thay đổi hãy sử dụng thủ tục bình phương có trọng số theo
White để ước lượng lại phương trình hồi qui ?
`
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 15:10
Sample: 1 51
Included observations: 51
Weighting series: E2_MU_CAN

Coeffici
Variable ent Std. Error t-Statistic Prob.

-
0.19971
C 5 0.784310 -0.254638 0.8001
0.05886
INCOME 0 0.002715 21.67839 0.0000

Weighted Statistics

0.90557 Mean dependent 8.80375
R-squared 9 var 4
Adjusted R- 0.90365 16.3414
squared 2 S.D. dependent var 1
4.05343 Akaike info 5.67543
S.E. of regression 6 criterion 3
805.086 5.75119
Sum squared resid 7 Schwarz criterion 1
-
142.723 469.952
Log likelihood 5 F-statistic 6
Durbin-Watson 2.29115 0.00000
stat 0 Prob(F-statistic) 0

Unweighted
Statistics

0.84798 Mean dependent 6.34070
R-squared 7 var 6
Adjusted R- 0.84488 7.53834
squared 4 S.D. dependent var 3
2.96895 431.920
S.E. of regression 6 Sum squared resid 3
Durbin-Watson 2.10154
stat 8


EXPTRAV = -0.1997152197 + 0.05886047842*INCOME
5. Hãy kiểm định White về hiện tượng phương sai của sai số
thay đổi trong mô hình của câu 5 với mức ý nghĩa = 10%



giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:

F-statistic 5.527501 Prob. F(4,46) 0.001017
Obs*R-squared 16.55572 Prob. Chi-Square(4) 0.002357



Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 05/16/10 Time: 22:19
Sample: 1 51
Included observations: 51

Variable Coefficient Std. Error t-Statistic Prob.

C -13.29557 375.3913 -0.035418 0.9719
WGT 246.7482 1257.745 0.196183 0.8453
WGT^2 -374.0439 1135.303 -0.329466 0.7433
INCOME*WGT 1.643537 2.944241 0.558221 0.5794
INCOME^2*WGT^2 -0.000408 0.000364 -1.122599 0.2674

R-squared 0.324622 Mean dependent var 15.78601
Adjusted R-squared 0.265893 S.D. dependent var 57.33304
S.E. of regression 49.12296 Akaike info criterion 10.71942
Sum squared resid 111001.0 Schwarz criterion 10.90882
Log likelihood -268.3453 F-statistic 5.527501
Durbin-Watson stat 2.649477 Prob(F-statistic) 0.001017



nR2=2.352386 > Chi-Square(4) = 1.063623--- bác bỏ Ho --phương sai
thay đổi

Bài tập 9 :
Dữ liệu nầy nói về doanh số và tồn kho của công nghiệp một
quốc gia Châu Au trong giai đọan 1950-1991 :

YEAR SALES INVENTORIES
1950 38596 59822
1951 43356 70242
1952 44840 72377
1953 47987 76122
1954 46443 73175
1955 51694 79516
1956 54063 87304
1957 55879 89052
1958 54021 87055
1959 59729 92097
1960 60827 94719
1961 61159 95580
1962 65662 101049
1963 68995 105463
1964 73682 111504
1965 80283 120929
1966 87187 136824
1967 90918 145681
1968 98794 156611
1969 105812 170400
1970 108352 178594
1971 117023 188991
1972 131227 203227
1973 153881 234406
1974 178201 287144
1975 182412 288992
1976 204386 318345
1977 229786 350706
1978 260755 400929
1979 298328 452636
1980 328112 510124
1981 356909 547169
1982 348771 575486
1983 370501 591858
1984 411427 651527
1985 423940 665837
1986 431786 664654
1987 459107 711745
1988 496334 767387
1989 522344 813018
1990 540788 835985
1991 533838 828184
---------------------------------------------

Sales : Doanh Số của ngành công nghiệp (triệu $ )
Inventories : Giá trị tồn kho của ngành công nghiệp (triệu $ )

Yêu cầu :

a.Thực hiện một mô hình đơn giản xác định rằng số sales là một
hàm tuyến tính theo Inventories.

Dependent Variable: SALES
Method: Least Squares
Date: 05/16/10 Time: 15:23
Sample: 1950 1991
Included observations: 42

Coeffici
Variable ent Std. Error t-Statistic Prob.

-
911.691
C 4 1165.337 -0.782342 0.4386
0.64284
INVENTORIES 5 0.002889 222.5282 0.0000

0.99919 Mean dependent 199479.
R-squared 3 var 4
Adjusted R- 0.99917 166654.
squared 3 S.D. dependent var 0
4793.43 Akaike info 19.8343
S.E. of regression 9 criterion 3
9.19E+0 19.9170
Sum squared resid 8 Schwarz criterion 8
-
414.521 49518.7
Log likelihood 0 F-statistic 9
Durbin-Watson 1.37493 0.00000
stat 1 Prob(F-statistic) 0


SALES = -911.691393 + 0.6428449796*INVENTORIES

b.Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo Inventories. Dựa
vào đồ thị trên anh chị có ý kiến gì vế tương quan chuỗi ?
900000
800000

700000
600000
INVENTORIES




500000
400000
300000

200000
100000
0
-25000 -15000 -5000 500010000
RESID

c. Hãy trình bày kiểm định Durbin – Watson xem phần dư của
phương trình trên có tương quan chuỗi bậc nhất hay không ?

Giả thiết: Ho: p =0
H1: p # 0
Theo kết quả chạy hồi qui ở câu a ta có: d = 1.374931
với mức ý nghĩa 5%, tra bảng Durbin – Watson với n = 40, k=1 ta có:
dL = 1.442
dU = 1.544
d < dL  bác bỏ Ho, tức là có hiẹn tượng tự tương quan chuỗi bậc
nhất


d. Hãy giải thích các hậu quả của tương quan chuổi bậc nhất với
hàm ước lượng OLS . Đề nghị giải pháp khắc phục tương quan
chuỗi trong phép hồi qui nói trên nếu có ?

Hậu quả của tương quan chuỗi bậc nhất với hàm ước lượng OLS :
- phương sai ước lượng được của các ước lượng bình phương bé nhất
thông thường là không chệch.
- kiểm định t và F nói chung không đáng tin cậy.
- Kết quả là R2 được tính toán như đã biết có thể là đo lượng không đáng
tin cậy cho R2 thực.
- cho các phương sai và các sai số chuẩn của dự toán đã tính được cũng có
thể không hiệu quả.
Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui
nói trên:
Khi cấu trúc tự tương quan là đã biết vì các nhiễu của các Ut không
quan sát được nên tính chất của tương quan chuổi thường là vấn đề suy
đoán hoặc là do những đồi hỏi cấp bách của thực tiển.trong thực hành
người ta thường sử dụng mô hình tự hồi quy bậc nhất
Khi cấu trúc tự tương quan là chưa biết thì ta sử dụng phương pháp
sai phân cấp 1,ước lượng p dựa theo thống kê d_Durbin_Watson, thủ tục
Cochrane_Orcutt để ước lượng p, thủ tục Cochrane_Orcutt 2 bước để
ước lượng p, phương pháp d_Durbin_Watson 2 bước để ước lương p và
các
Kkhắc phục
Ước lượng p dựa trên thống kê Durbin – Watson
p^= 1 - d/2 = 1 - 1.374931/2 = 1 - 0.6874655 = 0.3125345
Phương trình hồi qui SALES phụ thuộc vào INVENTORIES:
SALES = b`1 + b`2*INVENTORIES + et
Với b`1 = b1*(1-p) = -911.691393*(1-0.3125345) = -626.7563793
b`2 = b2 = 0.6428449796
Hay : SALES = -626.7563793 + 0.6428449796* INVENTORIES
Bài Tập 10 :
Một quan sát thú vị về việc thuê bao truyền hình cáp , người ta
đưa ra những dữ liệu sau đây :

AGE AIR HOME INST SUB SVC TV Y
11.83 13 350 14.95 105 10 16 9839
11.42 11 255.631 15 90 7.5 15 10606
7.33 9 31 15 14 7 11 10455
6.92 10 34.84 10 11.7 7 22 8958
26 12 153.434 25 46 10 20 11741
8.83 8 26.621 15 11.217 7.66 18 9378
13.08 8 18 15 12 7.5 12 10433
5.58 7 9.324 15 6.428 7 17 10167
12.42 8 32 10 20.1 5.6 10 9218
4.92 6 28 15 8.5 6.5 6 10519
4.08 6 8 17.5 1.6 7.5 8 10025
4.25 9 5 15 1.1 8.95 9 9714
10.67 7 15.204 10 4.355 7 7 9294
17.58 7 97.889 24.95 78.91 9.49 12 9784
8.08 7 93 20 19.6 7.5 9 8173
0.17 6 3 9.95 1 10 13 8967
13.25 5 2.6 25 1.65 7.55 6 10133
12.67 5 18.284 15.5 13.4 6.3 11 9361
5.25 6 55 15 18.708 7 16 9085
15 6 1.7 20 1.352 5.6 6 10067
17 5 270 15 170 8.75 15 8908
6.83 6 46.54 15 15.388 8.73 9 9632
5.67 6 20.417 5.95 6.555 5.95 10 8995
7 5 120 25 40 6.5 10 7787
11.25 7 46.39 15 19.9 7.5 9 8890
2.92 4 14.5 9.95 2.45 6.25 6 8041
2.17 5 9.5 20 3.762 6.5 6 8605
7.08 4 81.98 18 24.882 7.5 8 8639
12.17 4 39.7 20 21.187 6 9 8781
13.08 4 4.113 10 3.487 6.85 11 8551
0.17 6 8 10 3 7.95 9 9306
7.67 5 99.75 9.95 42.1 5.73 8 8346
10.33 4 33.379 15 20.35 7.5 8 8803
12.25 5 35.5 17.5 23.15 6.5 8 8942
2 4 34.775 15 9.866 8.25 11 8591
13.08 6 64.84 10 42.608 6 11 9163
1 6 30.556 20 10.371 7.5 8 7683
4 5 16.5 14.95 5.164 6.95 8 7924
4.67 4 70.515 9.95 31.15 7 10 8454
3 4 42.04 20 18.35 7 6 8429
Trong đó:
- SUB : số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ
thống cáp truyền hình
- Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang
qua
- Inst : phí lắp đặt ( USD/Lần)
- SVC : Phí dịch vụ cho mỗi hệ thống (USD/tháng )
- TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh
/hệ thống cáp )
- Age : thời gian hệ thống đã họat động ( năm )
- Air : số kêng truyền hình mà hệ thống nhận được từ hệ thống
cáp
- Y : thu nhập bình quân đầu người (USD/ người )

1. Hãy phân tích quan hệ kỳ vọng của số đăng ký thuê bao
(SUB) với các nhân tố ảnh hưởng có sẳn trong dữ
liệu ?
Dependent Variable: SUB
Method: Least Squares
Date: 05/25/10 Time: 13:22
Sample: 1 40
Included observations: 40

Variable Coefficient Std. Error t-Statistic Prob.

C -6.807726 26.65981 -0.255355 0.8001
AGE 1.193511 0.502651 2.374434 0.0237
AIR -5.111142 1.518459 -3.366005 0.0020
HOME 0.405549 0.035003 11.58599 0.0000
INST -0.526420 0.476074 -1.105751 0.2771
SVC 2.038732 2.126968 0.958516 0.3450
TV 0.756508 0.687811 1.099877 0.2796
Y 0.001655 0.003469 0.477101 0.6365

R-squared 0.887748 Mean dependent var 24.50850
Adjusted R-squared 0.863193 S.D. dependent var 33.53720
S.E. of regression 12.40453 Akaike info criterion 8.050857
Sum squared resid 4923.914 Schwarz criterion 8.388633
Log likelihood -153.0171 F-statistic 36.15343
Durbin-Watson stat 2.182694 Prob(F-statistic) 0.000000

SUB = -6.807725633 + 1.193511207*AGE - 5.111142311*AIR +
0.40554886*HOME - 0.5264195572*INST + 2.038732364*SVC +
0.7565077307*TV + 0.001655168974*Y

Phân tích quan hệ kỳ vọng của số đăng ký thuê bao: Trong điều kiện
các yếu tố khác không thay đổi:
+ Age: khi thời gian hoạt động của hệ thống tăng thêm 1 năm thì về trung
bình sẽ tăng thêm 1.19 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng
thêm 1 kênh thì về trung bình sẽ giảm 5.1 thuê bao
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua
tăng thêm 1 hộ thì về trung bình sẽ tăng thêm 0.4 thuê bao
+ Inst : phí lắp đặt ( USD/Lần) giảm 1 USD/Lần thì về trung bình sẽ
tăng thêm 0.526 thuê bao
+ SVC: Phí dịch vụ cho mỗi hệ thống (USD/tháng ) tăng thêm 1
USD/tháng thì về trung bình sẽ tăng thêm 2.039 thuê bao
+ TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ
thống cáp ) tăng thêm 1 kênh thì về trung bình sẽ tăng thêm 0.756 thuê bao
+ Y : thu nhập bình quân đầu người (USD/ người ) tăng thêm 1
USD/Người thì về trung bình sẽ tăng thêm được 0.00165 thuê bao.



2. Có ý kiến cho rằng mô hình ở câu 1 cần phải bổ sung
thêm các biến độc lập là bình phương các biến độc
lập . Anh chị cần có kiểm định nào để chấp nhận ý
kiến nầy ?
+ ước lượng mô hình với các biến bổ sung:
Dependent Variable: SUB
Method: Least Squares
Date: 05/25/10 Time: 13:31
Sample: 1 40
Included observations: 40

Variable Coefficient Std. Error t-Statistic Prob.

C -488.2440 264.2862 -1.847406 0.0766
AGE -1.357140 1.462274 -0.928102 0.3622
AGE2_MU 0.139275 0.073366 1.898355 0.0693
AIR 18.71175 5.239156 3.571519 0.0015
AIR2_MU -1.582278 0.373179 -4.239994 0.0003
HOME 0.439400 0.083881 5.238396 0.0000
HOME2_MU 0.000221 0.000284 0.777523 0.4441
INST 0.391969 2.124189 0.184526 0.8551
INST2_MU -0.021041 0.065512 -0.321175 0.7507
SVC 12.14427 19.19417 0.632706 0.5327
SVC2_MU -0.778979 1.285439 -0.606002 0.5500
TV -0.661471 2.654203 -0.249216 0.8052
TV2_MU 0.048444 0.101687 0.476402 0.6379
Y 0.084534 0.052575 1.607864 0.1204
Y2_MU -4.55E-06 2.83E-06 -1.603944 0.1213

R-squared 0.949466 Mean dependent var 24.50850
Adjusted R-squared 0.921167 S.D. dependent var 33.53720
S.E. of regression 9.416297 Akaike info criterion 7.602757
Sum squared resid 2216.666 Schwarz criterion 8.236087
Log likelihood -137.0551 F-statistic 33.55130
Durbin-Watson stat 2.246892 Prob(F-statistic) 0.000000




Kiểm định WALD:
giả thiết: Ho: R2 = 0
H1: R2 # 0

Wald Test:
Equation: Untitled

Test Statistic Value df Probability

F-statistic 4.336042 (7, 25) 0.0029
Chi-square 30.35229 7 0.0001
Null Hypothesis Summary:

Normalized Restriction (= 0) Value Std. Err.

C(3) 0.139275 0.073366
C(5) -1.582278 0.373179
C(7) 0.000221 0.000284
C(8) 0.391969 2.124189
C(11) -0.778979 1.285439
C(13) 0.048444 0.101687
C(15) -4.55E-06 2.83E-06

Restrictions are linear in coefficients.


Theo kết quả của bảng trên: F(7;25)= 3.5 < 4.336042; 0.0029
Đề thi vào lớp 10 môn Toán |  Đáp án đề thi tốt nghiệp |  Đề thi Đại học |  Đề thi thử đại học môn Hóa |  Mẫu đơn xin việc |  Bài tiểu luận mẫu |  Ôn thi cao học 2014 |  Nghiên cứu khoa học |  Lập kế hoạch kinh doanh |  Bảng cân đối kế toán |  Đề thi chứng chỉ Tin học |  Tư tưởng Hồ Chí Minh |  Đề thi chứng chỉ Tiếng anh
Theo dõi chúng tôi
Đồng bộ tài khoản