22/8/2015<br />
<br />
Các giả định của hồi quy tuyến tính cổ điển<br />
Chính vì thế, các giả định về biến giải thích Xt và<br />
số hạng nhiễu ut có ý nghĩa rất quan trọng cho<br />
việc giải thích các giá trị ước lượng của hồi quy.<br />
Ta đã biết, các hạng nhiễu ut (không thể quan<br />
sát được) là các hạng nhiễu ngẫu nhiên. Do<br />
hạng nhiễu ut cộng với một số hạng phi ngẫu<br />
nhiên Xt để tạo ra Yt, vậy Yt sẽ là một biến ngẫu<br />
nhiên.<br />
<br />
Kiểm định và chọn mô hình<br />
Lê Minh Tiến<br />
<br />
1<br />
<br />
Các giả định của hồi quy tuyến tính cổ điển<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Các giả định của hồi quy tuyến tính cổ điển<br />
<br />
Theo Gujarati (2003), nếu mục tiêu của ta chỉ là<br />
ước lượng các hệ số βj thì chỉ cần phương pháp<br />
OLS là đủ. Nhưng, như ta đã biết, các mục tiêu<br />
của phân tích hồi quy không chỉ dừng lại ở việc<br />
có được các giá trị ước lượng βj^ mà còn phải<br />
suy diễn (dự báo khoảng) về các giá trị thực βj<br />
thực sự có nghĩa thống kê hay không. Chính vì<br />
vậy, chúng ta cần biết cụ thể về bản chất của<br />
hàm hồi quy tổng thể.<br />
<br />
(1)<br />
(2)<br />
(3)<br />
(4)<br />
(5)<br />
(6)<br />
(7)<br />
(8)<br />
(9)<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
4<br />
<br />
2<br />
<br />
Giả dịnh<br />
Mô hình tuyến tính<br />
Mô hình được xác định<br />
đúng<br />
Xt có thể biến thiên<br />
Giá trị kỳ vọng của hạng<br />
nhiễu bằng không<br />
Xt và ut không tương<br />
quan<br />
Không có đa cộng tuyến<br />
Phương sai không đổi<br />
Không có tương quan<br />
chuỗi<br />
Hạng nhiễu phân phối<br />
chuẩn<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Các giả định của hồi quy tuyến tính cổ điển<br />
<br />
<br />
<br />
<br />
<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Không thỏa mãn do<br />
<br />
Yt = β1+β2Xt + ut<br />
<br />
Sai dạng mô hình<br />
<br />
Var(Xt) ≠ 0<br />
<br />
Sai dạng mô hình<br />
Sai dạng mô hình<br />
<br />
E(ut) = 0<br />
Cov(Xt,ut) = 0<br />
Σ(δiXit + δjXjt-) ≠ 0, i ≠ j<br />
Var(ut) = σ2<br />
Cov(ut,us) = 0, t ≠ s<br />
ut ~ N(μ,σ2)<br />
<br />
Tự hồi quy<br />
Đa cộng tuyến<br />
Phương sai thay đổi<br />
Tự tương quan<br />
Outliers<br />
5<br />
<br />
Các kiểm định<br />
<br />
Cụ thể, chúng ta không chỉ xác định dạng hàm<br />
của mô hình hồi quy, mà còn đưa ra các giả định<br />
về cách mà Yt được tạo ra như thế nào. PRM<br />
cho thấy Yt phụ thuộc vào cả Xt và ut. Cho nên,<br />
nếu ta không biết Xt và ut được tạo ra như thế<br />
nào, thì ta sẽ không có cách nào suy diễn được<br />
Yt cũng như các hệ số βj.<br />
<br />
Biểu diễn dạng toán<br />
<br />
3<br />
<br />
Nhiễu phân phối chuẩn (GT 9)<br />
Sai dạng mô hình (các GT 1, 2, 3, 4)<br />
Kì vọng nhiễu khác 0 (GT 5)<br />
Không có đa cộng tuyến (GT 6), phương sai<br />
không đổi (GT 7), không có tương quan chuỗi<br />
(GT 8): các giả thiết này được xét riêng<br />
<br />
6<br />
<br />
1<br />
<br />
22/8/2015<br />
<br />
Các thuộc tính của một mô hình tốt<br />
<br />
Các thuộc tính của một mô hình tốt<br />
<br />
Trong thực tế, có thể ta không bao giờ biết được<br />
mô hình thực (đúng) là như thế nào, mà chỉ hy<br />
vọng tìm được mô hình có thể biểu diễn thực tế<br />
một cách gần đúng có thể chấp nhận được.<br />
Việc đánh giá một mô hình có đúng đắn, phù<br />
hợp với bản chất của vấn đề nghiên cứu hay<br />
không cần dựa theo tiêu chuẩn nào đó.<br />
<br />
Tính bền vững về mặt lý thuyết (theoretical<br />
consistency):<br />
mô hình phải phù hợp với cơ sở lý thuyết nền tảng.<br />
một mô hình có giá trị R2 cao nhưng dấu của hệ số<br />
hồi quy sai thì cũng không được đánh giá là mô hình<br />
tốt.<br />
<br />
Có khả năng dự báo tốt (predictive power):<br />
Một mô hình tốt là mô hình có khả năng cho kết quả<br />
dự báo càng sát với thực tế càng tốt.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
7<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Các thuộc tính của một mô hình tốt<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Các tiêu chuẩn để đánh giá một mô hình tốt theo<br />
quan điểm của A.C. Harvey được vận dụng khá<br />
rộng rãi bao gồm:<br />
Tính tiết kiệm (parsimony):<br />
<br />
10<br />
<br />
Sơ đồ chung gồm các bước sau:<br />
Bước 1: xác định số biến độc lập<br />
Bước 2: kiểm tra các giả định<br />
Bước 3: chọn dạng hàm<br />
Bước 4: chọn mô hình theo các tiêu chuẩn<br />
<br />
mô hình càng đơn giản càng tốt.<br />
Điều này không có nghĩa là mô hình ít biến là tốt, mô<br />
hình đơn giản nhưng phải chứa các biến chủ yếu ảnh<br />
hưởng đến biến phụ thuộc để giải thích bản chất của<br />
vấn đề đang nghiên cứu.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
8<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Các thuộc tính của một mô hình tốt<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Tính đồng nhất (identifiability):<br />
<br />
11<br />
<br />
Bước 1: xác định số biến độc lập có trong mô<br />
hình<br />
<br />
với một tập dữ liệu đã cho, các tham số ước lượng<br />
được phải duy nhất.<br />
<br />
Tính thích hợp (goodness of fit):<br />
Các biến độc lập càng giải thích được nhiều sự thay<br />
đổi của biến phụ thuộc càng tốt, tức là R2 (hoặc R2adj)<br />
càng cao càng tốt. Tuy nhiên, không nên chỉ căn cứ<br />
vào R2 (hoặc R2adj) để xem mô hình có phù hợp<br />
không.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
9<br />
<br />
Có 2 hướng tiếp cận để xác định biến:<br />
Từ đơn giản đến tổng quát (Simple to General): bổ sung biến<br />
độc lập từ từ vào mô hình. Quá trình bổ sung biến độc lập<br />
vào mô hình thực chất là việc xem xét có bỏ sót biến quan<br />
trọng hay không.<br />
Từ tổng quát đến đơn giản: xét mô hình hồi quy có đầy đủ<br />
các biến độc lập đã được xác định. Sau đó thực hiện kiểm<br />
định loại những biến không quan trọng ra khỏi mô hình.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
12<br />
<br />
2<br />
<br />
22/8/2015<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
!<br />
<br />
Giá trị của hàm hợp lý Log-Likelihood (L):<br />
<br />
Thông thường, biến được xem xét để loại ra<br />
khỏi mô hình là biến:<br />
không có cơ sở lý thuyết khẳng định là biến quan<br />
trọng cần giữ lại<br />
p-value tương ứng của biến này trong mô hình hồi<br />
quy có giá trị lớn<br />
hệ số tương quan riêng phần của biến này với biến<br />
phụ thuộc có giá trị tuyệt đối thấp.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
13<br />
<br />
n<br />
n<br />
1<br />
L ln 2 ln 2 ui2<br />
2<br />
2<br />
2<br />
Trong phần mềm Eviews, giá trị của hàm loglikelihood được ước lượng bằng công thức:<br />
n<br />
RSS <br />
L 1 ln 2 ln <br />
<br />
2<br />
n <br />
Giá trị của L càng lớn chứng tỏ mô hình càng phù<br />
hợp.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
16<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Bước 2: kiểm tra các giả định của mô hình cổ<br />
điển<br />
<br />
Tiêu chuẩn AIC (Akaike Info Criterion):<br />
RSS 2 k / n<br />
AIC <br />
.e<br />
n <br />
trong đó k là số tham số trong mô hình hồi quy.<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
đa cộng tuyến<br />
phương sai thay đổi<br />
tự tương quan<br />
nhiễu phân phối chuẩn<br />
Khắc phục các giả định bị vi phạm<br />
<br />
Phần mềm Eviews ước lượng giá trị AIC bằng biểu<br />
thức:<br />
2 L 2k<br />
AIC <br />
<br />
n<br />
<br />
<br />
<br />
n<br />
<br />
Giá trị AIC càng nhỏ chứng tỏ mô hình hồi quy càng<br />
phù hợp.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
14<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
17<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Bước 3: chọn dạng hàm<br />
<br />
Tiêu chuẩn Schwarz Info Criterion:<br />
<br />
Dựa vào cơ sở lý thuyết kinh tế<br />
Dựa vào kết quả thực nghiệm, so sánh các dạng hàm<br />
khác nhau<br />
<br />
Bước 4: chọn mô hình theo các tiêu chuẩn<br />
thông dụng<br />
Ngoài việc sử dụng giá trị R2 (hoặc R2adj ) để so sánh<br />
giữa các mô hình, ta còn có thể sử dụng một số tiêu<br />
chuẩn khác như sau:<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
15<br />
<br />
RSS k / n<br />
SIC <br />
.n<br />
n <br />
Ước lượng của SIC trong Eviews được tính bằng<br />
công thức:<br />
2L k<br />
SIC <br />
.ln n<br />
n n<br />
Giá trị SBC càng nhỏ chứng tỏ mô hình hồi quy càng<br />
phù hợp.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
18<br />
<br />
3<br />
<br />
22/8/2015<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
Tiêu chuẩn Hannan and Quin Criterion (HQC):<br />
Ước lượng của HQ trong Eviews được tính bằng<br />
công thức:<br />
2 L 2k<br />
HQ <br />
.ln ln n <br />
n<br />
n<br />
Giá trị HQ càng nhỏ chứng tỏ mô hình hồi quy càng<br />
phù hợp.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Nhiễu không tuân theo<br />
phân phối chuẩn<br />
Nguyên nhân<br />
Hậu quả<br />
Kiểm định – nhận diện<br />
Khắc phục<br />
<br />
19<br />
<br />
22<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Nguyên nhân<br />
<br />
Khi so sánh các tiêu chuẩn của mô hình này với<br />
mô hình khác, trong một số tình huống, một mô<br />
hình có thể tốt hơn theo một tiêu chuẩn nào đó<br />
thì cũng tốt hơn theo các tiêu chuẩn khác.<br />
Tổng quát thì một mô hình có thể tốt hơn theo<br />
tiêu chuẩn này nhưng lại không tốt hơn theo tiêu<br />
chuẩn kia. Khi đó nguyên tắc chung là nên chọn<br />
mô hình nào có nhiều tiêu chí có giá trị nhỏ hơn<br />
so với các mô hình khác.<br />
<br />
Do bản chất của số liệu<br />
Do số liệu có các outlier<br />
Do sai dạng mô hình<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
20<br />
<br />
23<br />
<br />
Cách tiếp cận để lựa chọn mô hình<br />
<br />
Hậu quả<br />
<br />
Nếu chú ý đến độ phức tạp của mô hình thì<br />
người ta thường chú ý tới tiêu chuẩn SIC, còn<br />
trong phân tích chuỗi thời gian người ta hay sử<br />
dụng tiêu chuẩn AIC.<br />
Lưu ý rằng, việc so sánh các tiêu chuẩn giữa<br />
các mô hình đòi hỏi biến phụ thuộc có cùng<br />
dạng trong mô hình hồi quy.<br />
<br />
Các ước lượng j^ không tuân theo phân phối<br />
chuẩn và do đó các thống kê t và F không tuân<br />
theo phân phối Student và Fisher tương ứng<br />
Khi đó nếu kích thước mẫu là nhỏ thì các suy<br />
diễn thống kê là không đáng tin cậy<br />
Tuy nhiên với mẫu kích thước lớn thì các suy<br />
diễn thống kê vẫn có giá trị.<br />
<br />
Nếu biến phụ thuộc xuất hiện dưới các dạng khác<br />
nhau thì phải thực hiện quy đổi về dạng tương<br />
đương.<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
21<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
24<br />
<br />
4<br />
<br />
22/8/2015<br />
<br />
Phát hiện bằng đồ thị phần dư<br />
<br />
Khắc phục<br />
<br />
Mặc dù ta không biết được các hạng nhiễu ui<br />
nhưng ta ước lượng được phần dư là đại diện<br />
cho chúng.<br />
Nếu đồ thị tần suất của phần dư quá lệch về<br />
bên phải hoặc bên trái, quá nhọn hoặc quá dẹt,<br />
thì đó là các dấu hiệu cho rằng hạng nhiễu của<br />
mô hình là không tuân theo phân phối chuẩn.<br />
<br />
Lấy logarit giúp giảm bớt độ bất đối xứng, làm<br />
cho phân phối của biến gần với phân phối<br />
chuẩn hơn.<br />
Loại bỏ các outlier.<br />
Xác định đúng dạng hàm<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
25<br />
<br />
28<br />
<br />
Phát hiện bằng kiểm định Jacque-Bera (JB)<br />
Kiểm định JB dựa trên ý tưởng: biến ngẫu nhiên<br />
phân phối chuẩn sẽ có S=0 và K=3. Do đó biến<br />
ngẫu nhiên nào có S quá khác 0 hoặc K quá<br />
khác 3 thì đấy là dấu hiệu cho rằng biến đó<br />
không tuân theo phân phối chuẩn.<br />
Kiểm định JB sẵn có trên Eviews.<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
Sai dạng mô hình<br />
Nguyên nhân<br />
Hậu quả<br />
Kiểm định – nhận diện<br />
Khắc phục<br />
<br />
26<br />
<br />
29<br />
<br />
Phát hiện bằng kiểm định Jacque-Bera (JB)<br />
<br />
Nguyên nhân dẫn đến sai dạng mô hình<br />
<br />
H0 : ui có phân phối chuẩn<br />
Quy trình kiểm định JB trên Eviews như sau:<br />
Bước 1: hồi quy gốc thu được các phần dư ei<br />
Bước 2: View/Residual Tests/HistogramNormality Test<br />
Bước 3: Nếu p-value(JB)< hoặc JB > 2;2 thì<br />
bác bỏ H0<br />
<br />
3 trường hợp hay gặp phải trên thực tế là:<br />
Bỏ sót biến giải thích quan trọng hoặc thừa biến<br />
giải thích không cần thiết<br />
Sử dụng sai dạng hàm<br />
Sai sót trong việc đo lường<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
27<br />
<br />
Bài giảng Kinh tế lượng © Tien M. Le<br />
<br />
30<br />
<br />
5<br />
<br />