Mô hình hồi qui đơn giản
y = β0 + β1x + u
Economics 20 - Prof. Anderson 1
Dự báo sử dụng mô hình chuỗi thời gian (Time Series Models for Forecasting)
Ôn tập phương pháp hồi qui
Review of Regression
Nguyễn Ngọc Anh Trung tâm Nghiên cứu Chính sách và Phát triển
Nguyễn Việt Cường Đại học Kinh tế Quốc dân
Economics 20 - Prof. Anderson 2
Hồi qui là gì?
Là một công cụ quan trọng nhất của các nhà nghiên cứu kinh tế Hồi qui là phương pháp mô tả và đánh giá mối quan hệ giữa một biến (gọi là biến phụ thuộc, thường ký hiệu là y) với một hay nhiều biến khác (gọi là biến độc lập, x1, x2, ... , xk )
Economics 20 - Prof. Anderson 3
So sánh hồi qui và tương quan
Trong quan hệ tương quan, hai biến y và x là tương đương nhau. Trong mô hình hồi qui, chúng ta coi biến độc lập và biến phụ thuộc là hoàn toàn khác nhau. Biến y được giả thiết là có tính ngẫu nhiên, còn biến x được giả thiết là cố định (nhận giá trị cố định)
Economics 20 - Prof. Anderson 4
So sánh hồi qui và tương quan
Mô hình hồi qui cho phép chúng ta ước lượng (estimate) và suy diễn thống kê (inferences) các tham số của tổng thể. Trong kinh tế lượng, mục tiêu của chúng ta là ước lượng tác động nhân quả của việc X thay đổi một đơn vị đối với Y.
Economics 20 - Prof. Anderson 5
Mô hình hồi qui đơn giản Nếu so sánh, thì ở giác độ tổng quan việc ước lượng mô hình hồi qui cũng giống như ước lượng con số trung bình. Trong mô hình hồi qui, việc suy diễn thống kê bao gồm các việc sau Ước lượng (Estimation): (cid:132) Làm thế nào để ước lượng Kiểm định giả thuyết (Hypothesis testing): (cid:132) Tham số ước lượng được có khác 0 hay không? Xây dựng khoảng tin cậy : (cid:132) Xây dựng khoảng tin cậy cho tham số được ước
lượng
Economics 20 - Prof. Anderson 6
Mô hình hồi qui đơn giản
Mô hình chỉ bao gồm một biến độc lập k=1. Trong mô hình này biến y chỉ phụ thuộc vào một biến x Mô hình có thể có nhiều biến x, nhưng ta sẽ xét trường hợp này sau. Mô hình hồi qui đơn giản có thể sử dụng trong một số trường hợp : (cid:132) Lạm phát và thất nghiệp (cid:132) Lợi nhuận của chứng khoán quan hệ thế nào với
rủi ro
(cid:132) Mô phỏng quan hệ giữa giá chứng khoán và cổ tức
Economics 20 - Prof. Anderson 7
Mô hình hồi qui đơn giản : Ví dụ
• Giả sử ta có số liệu như :
Year, t
Excess return on market index = rmt - rft 13.7 23.2 6.9 16.8 12.3
Excess return = rXXX,t – rft 17.8 39.0 12.8 24.2 17.2
1 2 3 4 5 • Chúng ta muốn tìm hiểu mối quan hệ giữa x và y
Economics 20 - Prof. Anderson 8
Biểu đồ rời rạc
45
40
X X X
35
30
d n u f
n o
25
20
15
10
n r u t e r s s e c x E
5
0
0
5
10
15
20
25
Excess return on market portfolio
Economics 20 - Prof. Anderson 9
Tìm đường phù hợp nhất
Chúng ta có thể sử dụng phương trình
y= α+ βx
để ước lượng đường thẳng “tốt” nhất. βlà độ dốc của đường thẳng Đường thẳng này còn gọi làđườ ng hồi qui của tổng thể (population regression line) Ta không biết αvà β, nên phải ước lượng Đường thẳng như vậy hoàn toàn mang tính xác định (deterministic) có hợp lý không?
Economics 20 - Prof. Anderson 10
Một số ký hiệu và thuật ngữ
Viết dạng tổng quát hơn, với mô hình hồi qui tuyến tính giản đơn, ta có y = α+ βx+ u, Đây được gọi là mô hình hồi qui tuyến tính của tổng thể Chúng ta thường gọi y là biến phụ thuộc và x là biến độc lập/biến kiểm soat. αlà intercept, βlà slope (độ dốc) u là sai số của đường hồi qui tổng thể
Economics 20 - Prof. Anderson 11
Tại sao lại có sai số u
- Chúng ta có thể bỏ sót những yếu tố có tác động đến yt - Việc đo lường/ghi nhận số liệu đối với biến số yt có thể có sai - Những tác động ngẫu nhiênđố i với biến số yt mà chúng ta không thể mô hình hóa được
Economics 20 - Prof. Anderson 12
Biểu diễn mô hình trên bằng hình ảnh
Economics 20 - Prof. Anderson 13
Một số giả thiết
Trung bình của các sai số trong mô hình hồi qui bằng 0.
E(u) = 0 Đây không phải là một giả thiết quá nặng nề, do chúng tao luôn có thể dùng αđể chuẩn hóa trung bình/kỳ vọng toán của u, E(u) về không.
Economics 20 - Prof. Anderson 14
Giả thiết của mô hình hồi qui
Chúng ta cần phải đưa ra giả thiết về mối quan hệ giữa u và x Chúng ta muốn giả thiết rằng, những thông tin mà chúng ta biết về x sẽ không cho chúng ta biết gì về u, và như vậy, u và x là hoàn toàn không có quan hệ với nhau E(u|x) = E(u) = 0, và điều này dẫn tới E(y|x) = β0 + β1x
Economics 20 - Prof. Anderson 15
E(u|x) = E(u) = 0
Economics 20 - Prof. Anderson 16
Phương pháp bình phương cực tiểu
Ý tưởng cơ bản của việc hồi qui là để ước lượng các tham số của tổng thể trên cơ sở một mẫu số liệu Gọi {(xi,yi): i=1, …,n} là một mẫu ngẫu nhiên, có cỡ là n mà ta thu được từ tổng thể Với mỗi quan sát trong mẫu này, ta sẽ có yi = α+ βxi + ui
Economics 20 - Prof. Anderson 17
Đường hồi qui của tổng thể, điểm số liệu và các sai số
y y4
. {
E(y|x) = α+βx u4
u3
. }
y3 y2
u2
. {
u1
. }
y1
x
x2
x1
x4
x3
Economics 20 - Prof. Anderson 18
Ước lượng với phương pháp bình phương cực tiểu
Để ước lượng với phương pháp bình phương cực tiểu, chúng ta cần thấy rằng, giả thiết chính của chúng ta là E(u|x) = E(u) = 0, và điều này có nghĩa là
Cov(x,u) = E(xu) = 0
Tại sao? Từ lý thuyết cơ bản về xác suất ta có Cov(X,Y) = E(XY) – E(X)E(Y)
Economics 20 - Prof. Anderson 19
Ước lượng với phương pháp bình phương cực tiểu
Với ý tưởng là tìm đường phù hợp nhất, chúng ta có thể xây dựng bài toán cực tiểu Tức là chúng ta muốn tìm các tham số sao cho biểu thức dưới đây đạt giá trị cực tiểu :
Economics 20 - Prof. Anderson 20
n
n
2
2
•
y
)
=
ˆ ˆ( βα +
−
( ˆ u
)
i
i
x i
(
)
∑
∑
i
i
1 =
1 =
2
(
y
)
0
−=
ˆ ˆ x βα −−
=
t
t
∑
L ∂ ˆ α∂
t
2
)
0
−=
ˆ ˆ x βα −−
=
( yx t
t
t
∑
t
L ∂ ˆ β∂
• .
Economics 20 - Prof. Anderson 21
Ước lượng với phương pháp bình phương cực tiểu
Chúng ta có thể sử dụng đạo hàm để giải bài toán cực tiểu này, chúng ta nếu lấy đạo hàm bậc 1, theo α va β và giải các phương trình thu. Qua đó ta có thể ước lượng được các tham số của mô hình hồi qui.
N
()
)
−
−
YYX i
i
i
1 =
∑
ˆ β
=
=
X N
X
ˆ α
ˆ Y β
−=
2
S XY 2 S X
X
X
(
)
−
i
i
1 =
( ∑
SXY = đồng phương sai của (X, Y) SX2 = phương sai của (X)
Economics 20 - Prof. Anderson 22
Tóm tắt về ước lượng tham số beta (slope estimate)
Ước lượng về độ dốc là đồng phương sai tính trên mẫu giữa y và x, chia cho phương sai mẫu của x. Nếu x và y có tương quan thuận (dương) với nhau, thì ước lượng có dấu dương Nếu x và y có tương quan nghịch (âm) với nhau, thì ước lượng có dấu âm Chúng ta chỉ cần x biến thiên trong
Economics 20 - Prof. Anderson 23
OLS
Về mặt trực giác, OLS là việc ước lượng đường thẳng qua các điểm số liệu trong mẫu sao cho tổng khoảng cách bình phương sai số là nhỏ nhất, nên có tên là bình phương cực tiểu. Sai số, û, chính là ước lượng cho sai số u và là sự sai khác giữa đường ước lượng (đường hồi qui trên mẫu) và các điểm số liệu.
Economics 20 - Prof. Anderson 24
Đường hồi qui mẫu, điểm số liệu và các sai số ước lượng
y y4
. {
û4
ˆ y
x
=
ˆ ˆ ββ + 1
0
û3
. }
.
y3 y2
{
û2
û1
} .
y1
x
x2
x1
x4
x3
Economics 20 - Prof. Anderson 25
u
y t
t
ˆ y
=
x += βα + t βα ˆ ˆ x +
t
t
• Đường hồi qui tổng thể là mô hình mà chúng ta cho rằng đã tạo ra số liệu, và các tham số thực là αvà β. Hồi qui tổng thể Hồi qui mẫu và chúng ta biết rằng
.
ˆ u
y
ˆ y
=
−
t
t
t
• Chúng ta sử dụng đường hồi qui mẫu để suy diễn về
đường mô hình của tổng thể
• Chúng ta cũng muốn biết là các ước lượng αvà β
có phải là cácướ c lượng tôt hay không
Economics 20 - Prof. Anderson 26
Tính chất của OLS
Tổng các sai số (residual) OLS là bằng 0 Như vậy, trung bình mẫu các sai số OLS cũng bằng 0 Đồng phương sai mẫu giữa các biến độc lập và sai số OLS cũng bằng 0 Đường OLS sẽ chạy xuyên qua điểm trung bình của số liệu
Economics 20 - Prof. Anderson 27
Biểu diễn bằng đại số, ta có
n
ˆ u
i
n
∑
i
and 0
thus,
ˆ u
=
0 =
i
∑
1 = n
i
1 =
n
0
=
ˆ ux i
i
∑
i
1 =
y
x
=
ˆ ˆ ββ + 1
0
Economics 20 - Prof. Anderson 28
Tính chất của ước lượng OLS
$α $β
Tuyến tính (linear)
Không trệch (unbiased) $β
$β
$β Hiệu quả nhất (best)
$α
$β
Best Linear Unbiased Estimator
Economics 20 - Prof. Anderson 29
Sử dụng STATA để ước lượng OLS
Thực hiện hồi qui trong STATA rất giản đơn. Và để ước lượng mô hình hồi qui y theo x thì ta chỉ cần đánh lệnh reg y x
Economics 20 - Prof. Anderson 30
Ước lượng sử dụng STATA
regress testscr str, robust
Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------- | Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------- str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 -------------------------------------------------------------------------
Economics 20 - Prof. Anderson 31
Mức độ phù hợp của mô hình (Goodness-of-Fit)
coi môi quan thich và phân
sát gôm là 2 có không giai duoc
phân thich
:
Chúng
ta
co se
somôt
đinh
nghia
nhu
sau
:
+
i
i
i
2
y
y
Tông binh
phuong khoang cach
(SST)
−
i
2
ˆ y
y
Phân tông binh
phuong duoc giai
thich
(SSE)
−
i
Phan tông binh
phuong con
du
(SSR)
Chúng ta thcó Phân duoc giai ˆ ˆ y y u = ) ( ∑ ( ) ∑ ∑ 2 ˆ u i co Ta
SSR
SST =
SSE +
Economics 20 - Prof. Anderson 32
Chứng minh rằng SST = SSE + SSR
2
2
y
y
ˆ y
ˆ y
y
−
=
−
+
−
)
(
] )
i
i
i
i
2
+
∑ =
) (
y [ ˆ u
i
i
2
ˆ u
y
ˆ y
+
=
−
−
+
)
)
(
2 i
i
i
( ∑ ∑ SSR
y
=
2 +
+
i
tavà
biêt
y
−
∑ SSE ) 0 =
y ) ( ˆ ˆ yu i
i
[ ( ∑ ] ) ˆ y y − ( ∑ ˆ ˆ 2 yu i ( ∑ ˆ ˆ yu − i ∑ rang
Economics 20 - Prof. Anderson 33
Mức độ phù hợp của mô hình (Goodness-of-Fit)
Chúng ta đánh giá thế nào về đường hồi qui mà ta ước lượng? Có phù hợp với số liệu hay không?
Có thể tính tỷ lệ tổng bình phương khoảng cách (SST) được giải thích bởi mô hình, và gọi tỷ lệ này là R-bình phương của mô hình hồi qui.
R2 = SSE/SST = 1 – SSR/SST Nằm trong khoảng 0-1. Càng lớn càng tốt!!!!
Economics 20 - Prof. Anderson 34
Phân phối mẫu của ước lượng OLS
ˆβ. Đây được gọi
1
ˆβ. Chúng ta muốn
1
Ước lượng OLS được tính toán dựa trên một mẫu số liệu, một mẫu số liệu khác sẽ cho ta một giá trị khác của là tính bất định theo mẫu của
• đánh giá mức độ bất định của
1
• Sử dụng
ˆβ ˆβ để tiến hành kiểm định giả thuyết như β1 = 0
1
• Xây dựng khoảng tin cậy cho β1
• Tất cả những điều này đòi hỏi chúng ta phải xem xét tới phân phối mẫu (sampling distribution) của ước lượng OLS. Để làm được điều này, ta phải xem xét Phân phối của ước lượng OLS
Economics 20 - Prof. Anderson 35
ˆβ
1
Hàm phân phối của
ˆβ cũng có phân phối mẫu .
Cũng giống như trung bình mẫu, Y ,
1
ˆβ ) là bao nhiêu
• Vậy kỳ vọng toán của E( 1
ˆβ ) = β1, thì ước lượng OLS là ước lượng
• Nếu như E( 1
ˆβ )? (cho chúng ta biết được mức
• Phương sai của
1
không trệch – Còn muốn gì hơn?! ˆβ - var( 1 độ bất định của ước lượng)
• Phân phối của
ˆβ trong các mẫu nhỏ là phân phối gì ?
1
• Vấn đề này rất khó!!!!!
ˆβ ở các mẫu lớn là phân phối gì ?
• Phân phối của
1
ˆβ có phân bổ là phân bổ chuẩn
• Với các mẫu lớn,
1
(normally distributed).
Economics 20 - Prof. Anderson 36
Tính không trệch của OLS (Unbiasedness)
Giả thiết rằng mô hình tổng thể là tuyến tính theo tham số có dạng y = β0 + β1x + u Giả thiết rằng chúng ta sử dụng một mẫu có qui mô n, {(xi, yi): i=1, 2, …, n}, được lấy từ mô hình tổng thể. Như vậy ta có thể biểu diễn mô hình mẫu là yi = β0 + β1xi + ui Giả thiết E(u|x) = 0 và như vậy E(ui|xi) = 0 Giả thiết rằng xi có biến thiên
Economics 20 - Prof. Anderson 37
Tính không trệch của OLS (Unbiasedness)
Để xét tính không trệch của ước lượng, chúng ta viết lại dưới dạng tham số của tổng thể. Viết một công thức đơngiản là
) yx
(
i
∑
, where
=
ˆ β 1
x i s
− 2 x
2
s
x
≡
−
(
)
2 x
x i
∑
Economics 20 - Prof. Anderson 38
Tính không trệch của OLS (Unbiasedness)
x
x
u
x
−
+
=
−
=
)
i
i
i
i
i
0
x
x
x
x
−
−
i
i
i
)( ββ + 1 ) β 1
( ∑ x ( ∑ + =
∑ ∑ +
−
i
i
x
x
−
−
(
) xx
i
i
i
β 0
β 1
∑
x
+
−
i
) yx ) β 0 ) ux ) x + ) i ux
( ( x ( ∑ x ( ∑ ( ∑
Economics 20 - Prof. Anderson 39
Tính không trệch của OLS (Unbiasedness)
,0
x
−
=
x i
2
x
−
=
−
) be rewritten
as
∑ ∑ ,so
thus
s
+
2 x
i
β 1
) ( ) ( ( ∑ x xx x i i i numerator the can ) ∑ ux
and , ) ux
− (
i
( x i ∑
+
ˆ ββ = 1 1
x i s
− 2 x
Economics 20 - Prof. Anderson 40
Tính không trệch của OLS (Unbiasedness)
that
let d
x
=
−
(
) so ,
i
x i
1
, then
+
ˆ ββ = 1
i
ud i
i
∑
s
2 x
⎛ ⎜ ⎝
⎞ ⎟ ⎠
1
E
=
+
( uEd
)
i
i
β 1
) ( ˆ ββ = 1 1
∑
s
2 x
⎞ ⎟ ⎠
⎛ ⎜ ⎝
Economics 20 - Prof. Anderson 41
Tính không trệch của OLS (Unbiasedness)
Các ước lượng OLS của tham số β1 và β0 là không trệch Việc chứng minh tính không trêch, dựa trên 04 giả thiết. Nếu một giả thiết mà không đúng, thì ước lượng OLS sẽ không phải là không trệch Lưu ý rằng, tính không trệch là tính chất của phép ước lượng (estimator) – còn trong một mẫu cụ thể, thì ước lượng thu được có thể nhiều ít khác với tham số thực tế
Economics 20 - Prof. Anderson 42
Phương sai của ước lượng OLS
Chúng ta biết rằng hàm phân bổ (sampling distribution) của ước lượng nằm xung quanh tham số thực Muốn biết xem hàm phân bổ này có độ phân tán như thế nào Đưa thêm một giả thiết nữa về phương sai Giả thiết là Var(u|x) = σ2 (Homoskedasticity)
Economics 20 - Prof. Anderson 43
Phương sai của ước lượng OLS
Var(u|x) = E(u2|x)-[E(u|x)]2 E(u|x) = 0, so σ2 = E(u2|x) = E(u2) = Var(u) Như vậy, σ2 cũng là phương sai không điều kiện, và được gọi phương sai của sai số σ, được gọi là sai số chuẩn của sai số Có thể nói rằng : E(y|x)=β0 + β1x và Var(y|x) = σ2
Economics 20 - Prof. Anderson 44
Trường hợp phương sai đồng nhât (Homoskedastic)
y
f(y|x)
.
E(y|x) = β0 + β1x
.
x2
x1
Economics 20 - Prof. Anderson 45
Phương sai không đồng nhât (Heteroskedastic) f(y|x)
y
.
E(y|x) = β0 + β1x
.
.
x
x2
x1
x3
Economics 20 - Prof. Anderson 46
Phương sai của ước lượng OLS
1
=
+
Var
Var
β 1
ud i
i
( ˆ β 1
)
∑
s
2 x
⎛ ⎜ ⎝
⎞ ⎟ ⎠
⎛ ⎜⎜ ⎝
⎞ =⎟⎟ ⎠
2
2
1
1
=
Var
d
( u
)
)
ud i
i
2 Var i
i
( ∑
∑
s
s
2 x
2 x
⎛ ⎜ ⎝
⎞ ⎟ ⎠
⎛ ⎜ ⎝
⎞ ⎟ ⎠
2
2
2
1
1
=
d
d
=
2 2 = σσ i
2 i
∑
∑
s
2 x
2 x
⎛ ⎜ ⎝
⎞ ⎟ ⎠
⎛ ⎜ ⎝
2
2 σ
1
s
Var
2 σ
=
=
2 x
⎞ ⎟ s ⎠ )1 ( ˆ β
s
s
2 x
2 x
⎛ ⎜ ⎝
⎞ ⎟ ⎠
Economics 20 - Prof. Anderson 47
Phương sai của ước lượng OLS
Phương sai của sai số, σ2 càng lơn, thì phương sai của ước lượng càng lớn
xi biến thiên càng nhiều, thì phương sai
của ước lượng càng nhỏ Do đó, mẫu lớn sẽ làm giảm phương sai của ước lượng Vấn đề là phương sai của sai số chúng ta lại không biết
Economics 20 - Prof. Anderson 48
Ước lượng phương sai của sai số
Chúng ta không biết phương sai của sai, σ2, của sai số là bao nhiêu vì chúng ta không quan sát được sai số, ui
Chúng ta chỉ quan sát được , ûi
Chúng ta có thể sử dụng ûi để ước lượng phương sai của sai số
Economics 20 - Prof. Anderson 49
Ước lượng phương sai của sai số
ˆ u
y
−
0
ˆ ˆ ββ − 1
i
i
+
=
x i )
0
0
i
x i
x i
u
=
−
−
−
of
is
2 σ
SSR
ˆ u
/
=
=
2 ˆ σ
−
( n
)2
2 i
∑
2
= ˆ ˆ ( u ββ ββ + − − 1 1 ) ( ) ( ˆ ˆ ββββ − 0 0 1 1 i Then, an unbiased estimator 1 −
( n
)
Economics 20 - Prof. Anderson 50
Ước lượng phương sai của sai số
of
the regression
=
2 ˆ ˆ σσ =
sd
that
recall
s
then we have
if
1
2
se
x
)
Standard error ( ) ˆ σβ = x ˆ we substitute for σσ , ˆ of β 1 ) 2
the standard error ) ( ( ˆ ( ∑ − /ˆ x σβ = i 1
Economics 20 - Prof. Anderson 51
Tóm tắt về phân phối mẫu của
ˆβ
1
Nếu các giả thiết của OLS là đúng thì
1
• E( 1
]
)
μ x
u i
ˆβ) =
×
∝
• var( 1
ˆβ có: • Hàm phân phối mẫu của ˆβ là ước lượng không trệch) ˆβ) = β1 (tức là, 1 X var[( − 1 1 i . 4 n n σ X
)
ˆ Eβ − 1
~ N(0,1) (CLT)
• Khi mẫu lớn ,
var(
)
ˆ( β 1 ˆ β 1
• .
Economics 20 - Prof. Anderson 52
Kiểm định giả thuyết và sai số chuẩn của
ˆ β 1
Mục tiêu của việc kiểm định trong mô hình hồi qui là sử dụng số liệu để kiểm định một giả thuyết về tổng thể như β1 = 0, và đưa ra kết luận liệu giả thuyết có đúng hay không
Giả thuyết trống và giả thuyết thay thế hai phía
H0: β1 = β1,0 vs. H1: β1 ≠ β1,0
Trong đó β1,0 là một giá trị giả thuyết
Giả thuyết trống và giả thuyết thay thế một phía :
H0: β1 = β1,0 vs. H1: β1 < β1,0
Economics 20 - Prof. Anderson 53
Phương pháp kiểm định: Xây dựng thống kê t hoặc z, tính p- value, hoặc so sánh với giá trị tới hạn của hàm phân phối N(0,1))
• Nói chúng ta có: • t = (ước lượng – giá trị muốn kiểm định)/sai số chuẩn của ước
lượng
Y
Khi kiểm định về trung bình của Y: ta có t =
/
μ− Y ,0 n
s Y
t =
,
• Khi kiểm định β1, ta có
ˆ − β β 1 1,0 ˆ( SE ) β 1
Economics 20 - Prof. Anderson 54
ˆβ Công thức tính SE( )1
n
2 ˆ v i
∑
2
n
1 −
i
1 =
=
×
×
2
2
2 ˆˆ σ = β 1
n
estimator of (estimator of
)
1 n
1 n
2 σ v 2 σ X
2
(
)
X
X
−
i
∑
1 n
i
1 =
⎡ ⎢ ⎣
⎤ ⎥ ⎦
.
(
X
−
Trong đó ˆiv =
i
ˆ X u ) i
•
ˆβ) trông phức tạp, nhưng STATA tính rất nhanh và
• OK. SE( 1
ta không phải nhớ các công thức này .
Economics 20 - Prof. Anderson 55
Ví dụ
Ước lượng của mô hình hồi qui: Test score = 698.9 – 2.28×STR STATA cũng cho ta ước lượng độ lệch chuẩn của con số ước lượng là
ˆβ ) = 0.52
SE( 0
SE( 1
ˆβ ) = 10.4 Ta có thể tính các kiểm định thống kê cho
1
ˆβ với giả thuyết Ho:
β1,0 = 0
−
=
= –4.38
t-statistic testing β1,0 = 0 =
2.28 0 − 0.52
ˆ − β β 1 1,0 ˆ( SE ) β 1
• Ở mức ý nghĩa 1% giá trị là 2.58, nên ta có thể bác bỏ giả
thuyết trông với mức ý nghĩa 1%.
• Ta cũng có thể tính giá trị p-value …. Nhưng STATA làm hộ
hêt rồi !
Economics 20 - Prof. Anderson 56
Ước lượng sử dụng STATA
regress testscr str, robust
Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------- | Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------- str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 -------------------------------------------------------------------------
Economics 20 - Prof. Anderson 57
Tóm tắt: kiểm định H0: β1 = β1,0 v. H1: β1 ≠ β1,0,
• Tính kiểm định thống kê t (t-statistic)
ˆ − β β 1 1,0
t =
=
ˆ − β β 1 1,0 ˆ( SE ) β 1
2 ˆ σ ˆ β 1
• Bác bỏ giả thuyết trống với mức ý nghía 5% nếu |t| > 1.96 • Bác bỏ giả thuyết trống nếu p<5% • Việc kiểm định này dựa trên mẫu khoảng ít nhất là 30 quan
sát.
Economics 20 - Prof. Anderson 58
Đọc kết quả STATA
regress testscr str, robust
Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------- | Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------- str | -2.279808 .5194892 -4.38 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 ------------------------------------------------------------------------- Y = 698.9 – 2.28×STR, , R2 = .05,
(10.4) (0.52) t (β1 = 0) = –4.38, p-value = 0.000 (2-sided) Khoảng tin cậy 95% của β1 là (–3.30, –1.26) Economics 20 - Prof. Anderson
59