CƠ SỞ ĐÁNH GIÁ MÔ HÌNH
CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP OLS
GIẢ THIẾT
NỘI DUNG
KHUYẾT TẬT
MỤC
5.1 và 5.5
(
,
,...,
X
XXUE / 3 i
i 2
i
ki 0)
Mô hình đinh dạng đúng
Mô hình định dạng sai (chỉ định sai)
cov(
ji UX ,
i 0)
5.2
Phương sai sai số đồng đều
Phương sai sai số thay đổi
var(
/
,
,...,
X
XXU 2 i
i
i 3
2 ki )
Đa cộng tuyến
5.4
...
0
X 33 i
k
X ki
Các biến độc lập không có tương quan tuyến tính
X 22 i 1
5.3
Sai số ngẫu nhiên phân phối chuẩn
Sai số ngẫu nhiên không phân phối chuẩn
)
2NUi ,0(~
1
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
5.1.1. NGUYÊN NHÂN
5.1.2. HẬU QUẢ
5.1.3. PHÁT HIỆN
5.1.4. KHẮC PHỤC
2
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
NGUYÊN NHÂN
3
Nguyên nhân 1: Mô hình thiếu biến quan trọng
X
...
X
...
X
. Z
-Biến Z có tác động đến Y
1
2
i
Y i
3
3
i
m
mi
k
ki
u i
i
X
X
...
X
...
X
Mô hình đúng: X 2
Y i
1
2
i
3
3
i
m
mi
k
ki
v i
Mô hình sai: 2
cov(
0)
cov(
0),
ZX , 2
vX 2
- Biến Z có tương quan với ít nhất một biến độc lập
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
NGUYÊN NHÂN
4
X
...
1
2
u i
ki
X 2 3 i XXUE /
(
3
...
,..., X
,
...
Y X ... 3 i k i , ,..., nếu thỏa mãn: thì sẽ có: i i 2 X 1 22 i
X mi m X ki 0) X 33 i
i ,..., ) X ki
/( XXYE 3 i
X m
mi
mi
2 i
k
X ki
Nguyên nhân 2: Dạng hàm sai
...
/( XYE i 2 i
,..., ) X ki
X 22 i 1
X 33 i
X ki
k
2 uX 2 i i
)
)
...
/( XYE 2 i i
,..., ) X ki
. log( X 2 2 i 1
. log( X 3 3 i
. log( ) X ki k
u i
nhưng các phương trình sau lại không thỏa mãn:
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
NGUYÊN NHÂN
5
Nguyên nhân 3: Tính tác động đồng thời của số liệu
Nguyên nhân 4: Sai số do đo lường số liệu
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
HẬU QUẢ
6
- Ước lượng OLS sẽ là ước lượng chệch
- Các suy diễn thống kê không còn đáng tin cậy
* Xem thêm giáo trình (trang 205 209)
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
PHÁT HIỆN
7
-
,ˆ Y
RSS
)
Kiểm định Ramsey
1 R (
2 1
X
Y i
1 2
i
u i
RSS
)
-
Bước 1: Hồi quy mô hình ban đầu thu được
2 R (
2 2
2
v i
ˆ X Y 1 2 i 1 i i
Y i Mở rộng:
2
m
1
...
Y i
1
i
ˆ Y im
v i
ˆ Y X 2 1 i i
Bước 2: Hồi quy mô hình phụ thu được
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
PHÁT HIỆN
8
-
0
: ... m
1
0
2 : ... m
2 1
Kiểm định Ramsey
Bước 3: Kiểm định cặp giả thiết sau: H H0: MH (1) không thiếu biến 0 H1: MH (1) thiếu biến H 1
2
2
1
F
F
2
RSS ( RSS
RSS m /) 2 /( n ) mk
2
2
(
R R
2 R m /) 1 /() mkn
)
1(
+ Tiêu chuẩn KĐ
,
:
+ Miền bác bỏ với mức ý nghĩa α
mknmFFFW
5.2. PHƯƠƯƠNG SAI C 5.2. PH
A SAI SỐỐ THAY Đ
THAY ĐỔỔII
NG SAI CỦỦA SAI S (HETEROSCEDASTICITY) (HETEROSCEDASTICITY)
5.2.1. Bản chất của hiện tượng PSSS thay đổi
5.2.2. Hậu quả của hiện tượng PSSS thay đổi
5.2.3. Phương pháp phát hiện PSSS thay đổi
5.2.4. Khắc phục hiện tượng PSSS thay đổi
9
BBảản n chchấấtt ccủủaa PSSS
PSSS thay
thay đđổổii
Xét mô hình hồi quy 2 biến:
X
U
(1)
Y i
2
1
2
i
i
Giả thiết: Phương sai của sai số ngẫu nhiên đồng
đều, không thay đổi hay thuần nhất
Var U (
)
2 ( i
)
i
Trong thực tế PSSS có thể thay đổi Var U (
Var U i )( (
)
j
)
i
j
)
Var U (
)(
i
)
Var Y ( i
i
Ta có:
10
5.2.1. Nguyên nhânnhân ccủủaa hihiệệnn ttượượngng 5.2.1. Nguyên
Do bản chất của các hiện tượng kinh tế:
- Số liệu theo không gian có quy mô khác nhau
Như quan sát các doanh nghiệp có quy mô quá lớn - quá nhỏ
- Số liệu theo thời gian qua các giai đoạn có mức biến động khác nhau
Như giai đoạn kinh tế ổn định - giai đoạn khủng hoảng
- Mối quan hệ sẵn có hiện tượng PSSS thay đổi
Như mối quan hệ của thu nhập – chi tiêu, chỉ số thị trường
chứng khoán
11
Nguyên nhânnhân ccủủaa hihiệệnn ttượượngng Nguyên
tượng kinh tế
Do số liệu không phản ảnh đúng bản chất của hiện
hoàn thiện nên sai số ngày càng ít
Do kỹ thuật thu thập, xử lý dữ liệu ngày càng được
Do hành vi của con người có sự tiếp thu từ quá khứ
12
Do định dạng không đúng dạng hàm của mô hình.
5.2.2. HHậậuu ququảả ccủủaa hihiệệnn ttượượngng PSSS 5.2.2.
PSSS thay
thay đđổổii
Các ước lượng OLS là các ước lượng tuyến tính không
chệch và vững song không còn hiệu quả nhất
Var
)
ˆ( 2
Các ước lượng của phương sai bị chệch 2 i n
2 x i
i
1
Var U (
)
2
(
i )
Var
)
i
2 i
ˆ ( 2
2 n
2 x i
i
1
13
II. II. HHậậuu ququảả ccủủaa hihiệệnn ttượượngng PSSS
PSSS thay
thay đđổổii
)
...
)
)
)
Cov
ˆ( )
2
(
T X X
)
... ...
ˆ ˆ Cov , ( 1 k ˆ ˆ Cov , ( 2 k ...
)
...
)
ˆ Var ) ( 1 ˆ ˆ Cov ) , ( 2 1 ... ˆ ˆ Cov ) , ( k 1
ˆ ˆ ( Cov , 2 1 ˆ Var ( 2 ... ˆ ˆ ( Cov , k 2
ˆ Var ( k
Khoảng tin cậy của các hệ số hồi quy sẽ rộng hơn, các kiểm định T, F mất hiệu lực và các dự báo sẽ không còn chính xác.
14
55..22..33.Ph.Phươương ng pháppháp phátphát hihiệệnn PSSS
PSSS thay
thay đđổổii
Nhóm phương pháp phân tích định tính Cách chuẩn đoán dựa vào thông tin tiên nghiệm về hiện tượng kinh tế (xem xét mối quan hệ các biến)
Các số liệu chéo thường chứa đựng hiện tượng
PSSS thay đổi
Dựa vào thông tin trên mẫu (sử dụng phần dư
ei
15
Quan sát đồ thị của các phần dư
ˆ iY
- Bước 1: Hồi quy mô hình (1) tìm được các phần dư ei - Bước 2: Vẽ đồ thị của các phân dư ei theo Xi, Yi, hoặc theo các quan sát - Bước 3: Căn cứ vào các đồ thị để chuẩn đoán về hiện tượng PSSS thay đổi
16
Nhóm phương pháp phân tích định lượng • Ý tưởng chung:
Var U (
)
)
i
2 i2 ( i
Ui ei : |ei| e2
i
• Xem xét mối liên hệ của Ui với các biến trong mô hình: phương sai sai số thay đổi do yếu tố nào gây ra
17
(3)
U
X
X
2
3
Y i
i 3
1
2
i
i
Kiểm định White - Xét mô hình: - Thủ tục kiểm định: + Bước 1: Hồi quy mô hình (3) tìm được các phần dư ei
X
X
X
X
(4)
e i
2
1
2
i
3
3
i
4
2 i 2
5
2 i 3
6
X X 2 i
3
i
v i
+ Bước 2: Hồi quy mô hình sau
Trong đó: vi là SSNN thoả mãn mọi giả thiết của OLS
0
+ Bước 3: Kiểm định cặp giả thiết ...
:
6
j
0(
2,...,6)
H 0 H 1
: 2 j
18
PSSS trong MH (3) đồng đều PSSS trong MH (3) thay đổi
Kiểm định White
2
:
m (
W
* Tiêu chuẩn kiểm định:
2 2
)
Miền bác bỏ mức ý nghĩa α:
(cid:0)
F
F k (
1,
n k
)
)
2 1) R k /( 2 n k )/( R (1 Miền bác bỏ mức ý nghĩa α:
F F F k (
:
1,
n k
)
W
* Tiêu chuẩn kiểm định:
19
Với m là số hệ số góc của MH (4),k=m+1 Sử dụng phương pháp mức xác suất p-value
X
X
U
(3)
2
3
i 3
1
2
i
i
Kiểm định White - Xét mô hình: Y i Hàm hồi quy phụ của kiểm định có các dạng: * Dạng đầy đủ có tích chéo (cross):
X
X
X
(4)
2
4
5
3
1
2
i
2 i 3
2 i 2
X X 2 i
3
i
v i
X e i 3 i 6 * Dạng đầy đủ không có tích chéo (no cross):
.
.
.
.
2 ie
1
2
3
4
5
2
i
2 2
i
3 i
2 3 i
i
X
X
X
v
X * Dạng rút gọn:
i
3 i
i
e
. . X 3 1 2
2 vX 3 i
i
i
e
. . X 1 2 3 i 2
2 vX 2 i
20
- Trong mô hình hồi quy phụ bắt buộc phải có hệ số chặn và có thể không có các số hạng chéo nhưng cũng có thể có bậc cao hơn.
5.2.4. KhKhắắcc phphụụcc PSSS 5.2.4.
PSSS thay
thay đđổổii
2
X U
(6)
1. Trường hợp đã biết Var(Ui) = σi Xét mô hình: Y i
2
1
i
i
Khắc phục
*
i
(6)
X
(7)
1
2
Y i
2
* 1
* i
v i
Y i i
1 i
X U i i
i
i
)
Var
Var U (
)
1( i
)
Var v ( i
i
U 1 ( ) 2 i
i
2 i 2 i
21
Trong đó: vi là yếu tố ngẫu nhiên thoả mãn mọi giả thết của OLS.
2
X U
2. Trường hợp chưa biết Var(Ui) = σi Xét mô hình: Y (8) i
2
1
i
i
2
Có thể đưa ra các giả thiết về σi
GT
1:
X
2 i
GT
2 :
2 i
i
2
GT
3 :
)
2 i
E Y ( i
2 i X
least squares – GLS)
22
Phương pháp bình phương nhỏ nhất tổng quát (General
2
2 i
iX
Giả thiết 1: Kiểm tra giả thiết
Nếu giả thiết 1 đúng thì chia 2 vế của MH cho Xi
*
i
(
X
0)
X
(9)
1
2
i
Y i
1
1
i
2
v i
Y i X
1 X
U X
i
i
i
i
)
Var
(
)
Var U (
)
(
i
)
Var v ( i
i
U X
1 X
i
2 i
2 X i 2 X i
23
2 i
iX
Giả thiết 2: Kiểm tra giả thiết
iX
Nếu giả thiết 2 đúng thì chia 2 vế của MH cho
*
X
(
X
0)
X
X
(10)
1
2
i
i
Y i
1
1
i
2
2
i
v i
Y i X
1 X
U i X
i
i
i
i
)
Var
(
)
Var U (
)
(
i
)
Var v ( i
i
1 X
X X
U i X
i
i
i
24
)
2 i
iE Y (
2
Giả thiết 3: Kiểm tra giả thiết 2ˆ iY thay thế Sử dụng
ˆ iY
Nếu giả thiết 3 đúng thì chia 2 vế của MH cho
*
i
i
0)
X
X
(11)
1
2
ˆ( Y i
Y i
1
i 1
2
2
i
v i
Y i ˆ Y i
1 ˆ Y i
X U ˆ ˆ Y Y i i
2
i
)
Var
(
)
Var U (
)
(
i
)
Var v ( i
i
U ˆ Y i
1 ˆ 2 Y i
ˆ Y i ˆ 2 Y i
25
Ngoài 3 giả thiết nêu trên, nếu nguyên nhân do
mô hình có dạng hàm sai:
Đổi dạng hàm:
ln
ln
X U
1
i
i
ln
X U i
Y i Y i
2 2 ln
i X U
Y i
1 2
1
i
i
26
5.3. 5.3. KiKiểểmm đđịịnhnh gigiảả thithiếếtt vvềề phânphân phphốốii xácxác susuấấtt ccủủaa saisai ssốố ngngẫẫuu nhiên nhiên
Trong các mô hình hồi quy ta luôn giả thiết các sai số ngẫu nhiên có phân phối chuẩn. Tuy nhiên trong thực tế giả thiết này có thể bị vi phạm.
Khi giả thiết này bị vi phạm thì các ước lượng điểm thu được từ phương pháp OLS vẫn là các ước lượng tuyến tính, không chệch, tốt nhất. Tuy nhiên các suy diễn thống kê sẽ mất chính xác.
27
Kiểm định cặp giả thiết H0: Các sai số ngẫu nhiên có phân phối chuẩn H1: Các sai số ngẫu nhiên không phân phối chuẩn + Bước 1: Hồi quy mô hình đã cho tìm được ei + Bước 2: Tìm hệ số bất đối xứng S (Skewness) và hệ
số nhọn K (Kurtoris) của các phần dư:
n
n
n
n
3
4
(
3 ) /
n
/
n
(
4 ) /
n
/
n
e i
e i
e i
e i
e i
e i
i
1
i
1
i
1
i
1
S
,
K
S
S
S
S
3 e
3 e
4 e
4 e
2
2
+ Tiêu chuẩn kiểm định
2
( K 3) (cid:0) JB n (2)
2
+ Miền bác bỏ mức ý nghĩa :
JB JB :
W
S 6 24
(2)
28
5.4. ĐA CỘNG TUYẾN (MULTICOLLINEARITY)
5.4.1. Bản chất của hiện tượng đa cộng tuyến
5.4.2. Hậu quả của hiện tượng đa cộng tuyến
5.4.3. Phát hiện đa cộng tuyến
5.4.4. Khắc phục hiện tượng đa cộng tuyến
29
I. Bản chất của đa cộng tuyến
Xét mô hình hồi quy k biến:
X
X
...
Y i
2
1
2
i
3
i 3
k
X U ki
i
Đa cộng tuyến là hiện tượng xảy ra đối với mô hình
hồi quy bội khi các biến độc lập có quan hệ cộng
tuyến với nhau:
- Đa cộng tuyến hoàn hảo (Perfect Multi)
- Đa cộng tuyến không hoàn hảo (Inperfect Multi)
30
Đa cộng tuyến hoàn hảo
Là hiện tượng mà giữa các biến độc lập của mô hình có
...
X
X
X
0(1)
quan hệ thoả mãn điều kiện sau: k 3
i 3
i 2
ki
2 trong đó:
...
0
2 3
2 2
2 k
Giả sử: λ2 ≠0:
X
...
X
X
X
i 2
i 3
ki
4
i
3 2
k 2
4 2 tức là X2i phụ thuộc hàm số vào các biến độc lập còn lại
31
Đa cộng tuyến không hoàn hảo
Là hiện tượng mà giữa các biến độc lập của mô hình có
X
...
X
0(2)
2
i 3
2
i
V i
ki
...
quan hệ thoả mãn điều kiện sau: X k 3 Trong đó: Vi là sai số ngẫu nhiên 2 0 3
2 k
2 2 Giả sử: λ2 ≠0:
X
X
X
...
X
i 2
i 3
4
i
ki
V i
3 2
4 2
k 2
1 2
32
tức là X2i phụ thuộc tương quan với các biến độc lập còn lại.
Nguyên nhân của đa cộng tuyến
Do bản chất các biến độc lập đã có sẵn quan hệ cộng
tuyến với nhau
Do số liệu mẫu không ngẫu nhiên hoặc kích thước mẫu
không đủ lớn nên không đại diện tốt nhất cho tổng thế
Do quá trình xử lý số liệu đã được làm trơn
Do chỉ định mô hình sai
33
II. Hậu quả của hiện tượng đa cộng tuyến
Xét mô hình hồi quy 3 biến:
Y i
1 2
X 2 i
3
X U i 3 i
Hậu quả của đa cộng tuyến: -Hoàn hảo:
X
0)
1
i
i 3
i 2
x 2
x ( 3 i
r 23
r = 32
0)
X - Không hoàn hảo: x V ( 3 i i
x 2 i
r 1 23
r 32
34
n
n
n
n
(
)(
)
(
)(
)
x y 2 i
i
2 x 3 i
x y 3 i
i
x x 2 i 3
i
i
1
i
1
i
1
i
1
ˆ 2
n
n
n
0 0
2
x
)(
x
)
(
)
(
2 i 2
2 i 3
x x 2 i
3
i
i
1
i
1
i
1
n
n
n
n
(
)(
x
)
(
)(
)
x y 3 i
i
2 2
i
x y 2 i
i
x x 2 i 3
i
i
1
i
1
i
1
i
1
ˆ 3
n
n
n
2
0 0
x
)(
)
(
)
(
2 i 2
2 x 3 i
x x 2 3 i
i
i
1
i
1
i
1
2
Var
)
ˆ( 2
n
x
(1
)
2 2
i
2 r 23
i
1
2
Var
)
ˆ( 3
n
x
(1
)
2 i 3
2 r 2 3
35
i
1
+ Phương sai và hiệp phương sai của các hệ số hồi quy ước
lượng tăng lên.
+ Các khoảng tin cậy sẽ rộng hơn và kiểm định T có thể mất
ý nghĩa.
+ Hệ số R2 có thể khá cao + các giá trị giá trị thống kê của
kiểm định T khá nhỏ Kiểm định T và F có thể cho kết luận
mâu thuẫn.
+ Mô hình trở lên nhạy cảm với sự thay đổi của số liệu.
+ Dấu của các hệ số hồi quy ước lượng được có thể không phù
hợp với lý thuyết kinh tế.
36
Chú ý:
- Trong thực tế đa cộng tuyến hoàn hảo gần như không
bao giờ xảy ra vì nó chỉ tồn tại về mặt lý thuyết trong các
mô hình hồi quy bội chỉ xem xét hiện tượng đa cộng tuyến
không hoàn hảo.
- Đối với mô hình hồi quy bội bao giờ cũng có đa cộng
tuyến xem xét mức độ nghiêm trọng của đa cộng tuyến.
- Nói chung khi có đa cộng tuyến không hoàn hảo các
ước lượng nhận được vẫn có tính chất không chệch nên vẫn có
thể dùng để dự báo.
37
III. Phát hiện đa cộng tuyến (không hoàn hảo)
1. Căn cứ các lý thuyết kinh tế
Căn cứ vào nội dung kinh tế của các biến độc lập có trong mô hình để xem xét khả năng có tồn tại hiện tượng đa cộng tuyến
2. Căn cứ vào các kết luận của kiểm định T và F
Nếu các kết luận mâu thuẫn với nhau thì đó có thể là dấu hiệu của đa cộng tuyến.
3. Căn cứ vào hệ số tương quan của các biến độc lập
38
4. Dùng hồi quy phụ
- Bước 1: Hồi quy mô hình phụ sau
...
...
X ji
X 1 2 2 i
1 j
X j
1 i
X 1 j j
1 i
k
X V R j i
2 k 2 ) ( j
ki
Mô hình hồi quy phụ giữa các biến độc lập trong mô
hình hồi quy gốc.
- Bước 2: Kiểm định cặp giả thiết
mô hình không có đa cộng tuyến
mô hình có đa cộng tuyến
39
IV. Khắc phục đa cộng tuyến
1. Tăng kích thước mẫu hoặc lấy mẫu mới
2. Bỏ bớt biến độc lập ra khỏi mô hình nếu có thể
3. Giảm đa cộng tuyến bằng hồi quy đa thức
4. Đổi dạng hàm
40
• Đổi sang dạng hàm mũ (Hàm Cobb – Douglass)
2
3
iU
K L e
ln
ln
ln
K
ln
Q i
i i
1
Q i
2
1
i
3
K U i
i
• Đổi sang dạng hàm sai phân bậc 1:
X
X
U
Y t
2
1
2
t
3
t 3
t
(
X
X
)
(
X
X
)
)
Y Y t t
1
2
2
t
2 1 t
3
t 3
U U ( t
t
1
3 1 t
X
X
* Y t
2
* t 2
3
* t 3
V t
41
Các thuộc tính tốt của một mô hình
Tính tiết kiệm: Mô hình chứa một lượng tối thiểu các biến số
Tính thống nhất: Với cùng một bộ số liệu ta chỉ có một kết quả
vẫn phản ánh được bản chất quan hệ kinh tế.
Tính thiết thực: Biến độc lập phải giải thích được sự thay đổi cơ
duy nhất.
Tính vững về mặt lý thuyết: Các kết quả ước lượng được phải
bản của biến phụ thuộc.
Khả năng dự báo cao: Thông qua mô hình có thể dự báo tương
phù hợp với lý thuyết và thực tiễn kinh tế.
42
đối chính xác về biến phụ thuộc.