1
CHƯƠNG 7
HIỆN TƯỢNG PHƯƠNG SAI
CỦA SAI SỐ (SỐ DƯ) THAY ĐỔI
(HETEROSCEDASTICITY)
2
1. Hiu bn cht hu quca
phương sai sai sthay đi
2. Biết cách phát hin phương sai
sai sthay đi bin pháp
khc phc
MC
TIÊU
PHƯƠNG SAI THAY ĐỔI
NỘI DUNG
3
Bản chất hiện tượng phương sai sai số thay đổi
1
Hậu quả
2
3
Cách khắc phục phương sai sai số thay đổi
4
Cách phát hiện phương sai sai số thay đổi
7.1 Bản chất
Xét ví dụ mô hình hồi qui 2 biến trong đó
biến phụ thuộc
Y
là tiết kiệm của hộ gia
đình và biến giải thích
X
là thu nhập khả
dụng của hộ gia đình
4
7.1 Bản chất
5
X
1
X
2
X
n
X
Y
0
(a)
X
1
X
2
X
n
X
Y
0
(b)
Hình 7.1: (a) Phương sai của sai số không đổi và(b) Phương sai của sai số
thay đổi
7.1 Bản chất
Hình 7.1a cho thấy tiết kiệm trung bình có
khuynh hướng tăng theo thu nhập. Tuy
nhiên mức độ dao động giữa tiết kiệm của
từng hộ gia đình so với mức tiết kiệm trung
bình không thay đổi tại mọi mức thu nhập.
Đây là trường hợp của phương sai sai số
(nhiễu) không đổi, hay phương sai bằng
nhau.
E(u
i2
) =
2
6
1
2
3
4
5
6
2
7.1 Bản chất
Trong hình 7.1b, mức độ dao động giữa
tiết kiệm của từng hộ gia đình so với mức
tiết kiệm trung bình thay đổi theo thu
nhập. Đây trường hợp phương sai của
sai số thay đổi.
E(u
i2
) =
i2
7
Giải thích
Những người thu nhập cao, nhìn
chung, sẽ tiết kiệm nhiều hơn so với
người thu nhập thấp nhưng sự biến
động của tiết kiệm sẽ cao hơn.
Đối với người thu nhập thấp, họ chỉ
còn để lại một ít thu nhập để tiết kiệm.
Phương sai sai số của những hộ gia đình
thu nhập cao thể lớn hơn của
những hộ thu nhập thấp.
8
Do tích lũy kinh nghiệm sai số theo thời gian ngày
càng giảm
Do bản chất của hiện tượng kinh tế
Công cụ về thu thập xử số liệu cải thiện dẫn đến
sai số đo lường tính toán giảm
Trong mẫu có các outlier (giá trị rất nhỏ hoặc rất lớn
so với các giá trị quan sát khác)
hình hồi quy không đúng (dạng hàm sai, thiếu
biến quan trọng, chuyển đổi dữ liệu không đúng)
9
7.1 Nguyên nhân của phương sai thay đổi
Hiện tượng phương sai thay đổi thường gặp
khi thu thập số liệu chéo (theo không gian).
VD khảo sát doanh thu, chi phí quảng cáo của
các công ty khác nhau trong cùng lĩnh vực kinh
doanh. Do quy mô, thương hiệu các công ty
khác nhau nên doanh thu của các công ty
quy khác nhau ứng với mức chi quảng cáo
sẽ biến động khác nhau.
10
7.1 Nguyên nhân của phương sai thay đổi
1. Ước lượng OLS vẫn tuyến tính, không
chệch
2. Tuy nhiên, chúng sẽ không còn
phương sai nhỏ nhất nữa, nghĩa là,
chúng sẽ không còn hiệu qu nữa.
3. Ước lượng phương sai của ước lượng
OLS, nhìn chung, sẽ bị chệch.
11
7.1 Hậu quả của phương sai thay đổi
5. Do đó, các khoảng tin cậy kiểm định
giả thuyết thông thường dựa trên phân
phối
t
F
sẽ không còn đáng tin cậy
nữa. Do vậy, nếu chúng ta áp dụng các
kỹ thuật kiểm định giả thuyết thông
thường sẽ cho ra kết quả sai.
Chẳng hạn thống kê t xác định bởi công thức
12
7.1 Hậu quả của phương sai thay đổi
)
ˆ
(
ˆ
2
*
22
SE
t
7
8
9
10
11
12
3
Do sử dụng ước lượng của
nên không đảm bảo t tuân theo quy luật
phân phối t-student =>kết quả kiểm định
không còn tin cậy
6. Kết quả dự báo không còn hiệu quả nữa khi
sử dụng các ước lượng OLS phương sai
không nhỏ nhất.
13
7.1 Hậu quả của phương sai thay đổi
)( i
SE
)
ˆ
(
i
SE
Phương pháp định tính
1. Dựa vào bản chất vấn đề nghiên cứu
2. Xem xét đồ thị của phần dư
Phương pháp định lượng
1. Kiểm định Park
2. Kiểm định Glejser
3. Kiểm định Goldfeld – Quandt
4. Kiểm định White
14
7.2 Phương pháp phát hiện phương sai thay đổi
VD: nghiên cứu quan hệ giữa chi tiêu tiêu
dùng so với thu nhập, phương sai phần
dư của chi tiêu tiêu dùng có xu hướng
tăng theo thu nhập. Do đó đối với các
mẫu điều tra tương tự, người ta có
khuynh hướng giả định phương sai của
nhiễu thay đổi
15
1. Dựa vào bản chất vấn đề nghiên cứu
2. Xem xét đồ thị của phần
16
Biến
phụ
thuộc
Biến độc lập
Đường hồi qui ước lượng
2. Xem xét đồ thị của phần
Hình a cho
thấy
biến đổi
của các
e
i2
không
có tính
hệ
thống
Hình b,c,d
cho
thấy các
e
i2
thay
đổi khi
Y tăng
17
u
Y
(a)
u
Y
(b)
u
Y
(c)
u
Y
(d)
3. Kiểm định Park
Park cho rằng
i
2
là một hàm số nào đó
của biến giải thích
X
i
2
=
B
1
+
B
2
ln|
X
i
|+
v
i
trong đó
v
i
là phần sai số ngẫu nhiên.
i
2
chưa biết, Park đề nghị sử dụng lne
i2
thay cho
i
2
và chạy mô hình hồi qui sau
lne
i2
=
B
1
+ B
2
ln|X
i
|
+ v
i
(*)
e
i2
được thu thập từ mô hình hồi qui gốc
18
13
14
15
16
17
18
4
3. Kiểm định Park
Các bước của kiểm định Park:
1) Chạy hàm hồi qui gốc Y
i
=b
1
+b
2
X
i
+ U
i
2) Từ hàm hồi qui, tính , phần e
i
lne
i2
3. Chạy hàm hồi qui (*), s dụng biến giải
thích của hàm hồi qui ban đầu. Nếu
nhiều biến giải thích, chạy hồi qui cho từng
biến giải thích đó. Hay, chạy hồi qui
hình với biến giải thích
19
i
Y
ˆ
i
Y
ˆ
3. Kiểm định Park
4) Kiểm định giả thuyết H
0
: β
2
= 0,tức, không
phương sai của sai số thay đổi. Nếu giả
thuyết H
0
bị bác bỏ, hình gốc
phương sai của sai số thay đổi.
5) Nếu giả thuyết H
0
được chấp nhận,
B
1
trong hình (*) có thể được xem g trị
chung của phương sai của sai số không
đổi,
2
.
20
4. Kiểm định Glejser
Tương tự như kiểm định Park: Sau khi thu
thập được phần dư từ hình hồi qui
gốc, Glejser đề nghị chạy hồi qui | e
i
|
theo biến X nào quan hệ chặt chẽ
với
i2
.
Glejser đề xuất một số dạng hàm hồi qui
sau:
|
e
i
| =
B
1
+ B
2
X
i
+ v
i
21
iii
vXBBe ++=
21
i
i
i
v
X
BBe +
1
+=
21
4. Kiểm định Glejser
Nếu giả thuyết H
0
:
β
2
= 0 bị bác bỏ thì
thể hiện tượng phương sai sai số thay
đổi.
22
i
i
i
v
X
BBe +
1
+=
21
iii
vXBBe ++=
21
iii
vXBBe ++=
2
21
4. Kiểm định Glejser
Kiểm định Glejser một số vấn đ như
kiểm định Park như sai số
v
i
trong các
hình hồi qui giá trị kỳ vọng khác không,
tương quan chuỗi.
4 hình đầu cho kết quả tốt khi s
dụng OLS
2 hình sau (phi tuyến tính tham số)
không sử dụng OLS được
Do vậy, kiểm định Glejser được dùng để
chẩn đoán đối với những mẫu lớn.
23
5. Kiểm định Goldfeld - Quandt
Xét hình hồi qui sau:
Y
i
=b
1
+b
2
X
i
+ u
i
Giả s
i2
quan hệ dương với biến X theo
cách sau:
i2
=
2
X
i2
trong đó
2
hằng số.
Các bước thực hiện kiểm định Goldfeld -
Quandt như sau:
1. Sắp xếp các quan sát theo thứ tự tăng dần
về giá trị của biến X.
24
19
20
21
22
23
24
5
5. Kiểm định Goldfeld - Quandt
2. Bỏ qua quan sát ở giữa theo cách sau:
Đối với mô hình 2 biến:
c = 4 nếu cỡ mẫu khoảng n = 30;
c = 10 nếu cỡ mẫu khoảng n = 60.
và chia số quan sát còn lại thành 2
nhóm, trong đó mỗi nhóm có (n – c)/2
quan sát.
25
5. Kiểm định Goldfeld - Quandt
3. Sử dụng phương pháp OLS để ước lượng
tham số của các hàm hồi qui đối với (n
c)/2 quan sát đầu cuối; tính RSS
1
RSS
2
tương ứng.
Bậc tự do tương ứng (k các
tham số được ước lượng kể cả hệ s
chặn).
26
k
2
cn
5. Kiểm định Goldfeld - Quandt
4. Tính tỷ số
tuân theo phân phối
F
với bậc tự do tử
số mẫu số
27
dfRSS
dfRSS
λ/
/
=
1
2
2
2kcn
Nếu > F mức ý nghĩa α thì bác bỏ giả
thuyết H
0
, nghĩa là phương sai của sai số
thay đổi.
6. Kiểm định White
White đã đề nghị một phương pháp không
cần đòi hỏi
u
phân phối chuẩn.
Xét hình hồi qui sau:
Y
i
=b
1
+b
2
X
2i
+b
3
X
3i
+ u
i
Bước 1:
Ước lượng hình trên bằng
OLS, thu được các phần e
i
.
Bước 2:
Ước lượng một trong các mô hình
sau
e
i2
=
1
+
2
X
2i
+
3
X
3i
+
4
X
2i2
+
5
X
3i2
+ v
2i
(1)
28
6. Kiểm định White
hay
e
i2
=
1
+
2
X
2i
+
3
X
3i
+
4
X
2i2
+
5
X
3i2
+
6
X
2i
X
3i
+ V
2i
(2)
(1) (2) thể số cao hơn nhất
thiết phải hệ số chặn bất kể hình
gốc có hay không.
R
2
hệ số xác định bội, thu được t(1) với
hình không số hạng chéo hay (2)
với mô hình có số hạng chéo.
29
6. Kiểm định White
Bước 3
Đặt GT Ho:
2
=
3
=
4
=
5
= 0 (1)
2
=
3
=
4
=
5
=
6
= 0 (2)
Tương đương H
0
: phương sai của sai số không
đổi.
nR
2
phân phối xấp xỉ
2
(df), với df bằng
số hệ số của hình (1) (2) không kể
hệ số chặn.
30
25
26
27
28
29
30