Mô hình hồi qui đơn giản

y = β0 + β1x + u

Economics 20 - Prof. Anderson 1

Dự báo sử dụng mô hình chuỗi thời gian (Time Series Models for Forecasting)

Ôn tập phương pháp hồi qui

Review of Regression

Nguyễn Ngọc Anh Trung tâm Nghiên cứu Chính sách và Phát triển

Nguyễn Việt Cường Đại học Kinh tế Quốc dân

Economics 20 - Prof. Anderson 2

Hồi qui là gì?

Là một công cụ quan trọng nhất của các nhà nghiên cứu kinh tế Hồi qui là phương pháp mô tả và đánh giá mối quan hệ giữa một biến (gọi là biến phụ thuộc, thường ký hiệu là y) với một hay nhiều biến khác (gọi là biến độc lập, x1, x2, ... , xk )

Economics 20 - Prof. Anderson 3

So sánh hồi qui và tương quan

Trong quan hệ tương quan, hai biến y và x là tương đương nhau. Trong mô hình hồi qui, chúng ta coi biến độc lập và biến phụ thuộc là hoàn toàn khác nhau. Biến y được giả thiết là có tính ngẫu nhiên, còn biến x được giả thiết là cố định (nhận giá trị cố định)

Economics 20 - Prof. Anderson 4

So sánh hồi qui và tương quan

Mô hình hồi qui cho phép chúng ta ước lượng (estimate) và suy diễn thống kê (inferences) các tham số của tổng thể. Trong kinh tế lượng, mục tiêu của chúng ta là ước lượng tác động nhân quả của việc X thay đổi một đơn vị đối với Y.

Economics 20 - Prof. Anderson 5

Mô hình hồi qui đơn giản Nếu so sánh, thì ở giác độ tổng quan việc ước lượng mô hình hồi qui cũng giống như ước lượng con số trung bình. Trong mô hình hồi qui, việc suy diễn thống kê bao gồm các việc sau Ước lượng (Estimation): (cid:132) Làm thế nào để ước lượng Kiểm định giả thuyết (Hypothesis testing): (cid:132) Tham số ước lượng được có khác 0 hay không? Xây dựng khoảng tin cậy : (cid:132) Xây dựng khoảng tin cậy cho tham số được ước

lượng

Economics 20 - Prof. Anderson 6

Mô hình hồi qui đơn giản

Mô hình chỉ bao gồm một biến độc lập k=1. Trong mô hình này biến y chỉ phụ thuộc vào một biến x Mô hình có thể có nhiều biến x, nhưng ta sẽ xét trường hợp này sau. Mô hình hồi qui đơn giản có thể sử dụng trong một số trường hợp : (cid:132) Lạm phát và thất nghiệp (cid:132) Lợi nhuận của chứng khoán quan hệ thế nào với

rủi ro

(cid:132) Mô phỏng quan hệ giữa giá chứng khoán và cổ tức

Economics 20 - Prof. Anderson 7

Mô hình hồi qui đơn giản : Ví dụ

• Giả sử ta có số liệu như :

Year, t

Excess return on market index = rmt - rft 13.7 23.2 6.9 16.8 12.3

Excess return = rXXX,t – rft 17.8 39.0 12.8 24.2 17.2

1 2 3 4 5 • Chúng ta muốn tìm hiểu mối quan hệ giữa x và y

Economics 20 - Prof. Anderson 8

Biểu đồ rời rạc

45

40

X X X

35

30

d n u f

n o

25

20

15

10

n r u t e r s s e c x E

5

0

0

5

10

15

20

25

Excess return on market portfolio

Economics 20 - Prof. Anderson 9

Tìm đường phù hợp nhất

Chúng ta có thể sử dụng phương trình

y= α+ βx

để ước lượng đường thẳng “tốt” nhất. βlà độ dốc của đường thẳng Đường thẳng này còn gọi làđườ ng hồi qui của tổng thể (population regression line) Ta không biết αvà β, nên phải ước lượng Đường thẳng như vậy hoàn toàn mang tính xác định (deterministic) có hợp lý không?

Economics 20 - Prof. Anderson 10

Một số ký hiệu và thuật ngữ

Viết dạng tổng quát hơn, với mô hình hồi qui tuyến tính giản đơn, ta có y = α+ βx+ u, Đây được gọi là mô hình hồi qui tuyến tính của tổng thể Chúng ta thường gọi y là biến phụ thuộc và x là biến độc lập/biến kiểm soat. αlà intercept, βlà slope (độ dốc) u là sai số của đường hồi qui tổng thể

Economics 20 - Prof. Anderson 11

Tại sao lại có sai số u

- Chúng ta có thể bỏ sót những yếu tố có tác động đến yt - Việc đo lường/ghi nhận số liệu đối với biến số yt có thể có sai - Những tác động ngẫu nhiênđố i với biến số yt mà chúng ta không thể mô hình hóa được

Economics 20 - Prof. Anderson 12

Biểu diễn mô hình trên bằng hình ảnh

Economics 20 - Prof. Anderson 13

Một số giả thiết

Trung bình của các sai số trong mô hình hồi qui bằng 0.

E(u) = 0 Đây không phải là một giả thiết quá nặng nề, do chúng tao luôn có thể dùng αđể chuẩn hóa trung bình/kỳ vọng toán của u, E(u) về không.

Economics 20 - Prof. Anderson 14

Giả thiết của mô hình hồi qui

Chúng ta cần phải đưa ra giả thiết về mối quan hệ giữa u và x Chúng ta muốn giả thiết rằng, những thông tin mà chúng ta biết về x sẽ không cho chúng ta biết gì về u, và như vậy, u và x là hoàn toàn không có quan hệ với nhau E(u|x) = E(u) = 0, và điều này dẫn tới E(y|x) = β0 + β1x

Economics 20 - Prof. Anderson 15

E(u|x) = E(u) = 0

Economics 20 - Prof. Anderson 16

Phương pháp bình phương cực tiểu

Ý tưởng cơ bản của việc hồi qui là để ước lượng các tham số của tổng thể trên cơ sở một mẫu số liệu Gọi {(xi,yi): i=1, …,n} là một mẫu ngẫu nhiên, có cỡ là n mà ta thu được từ tổng thể Với mỗi quan sát trong mẫu này, ta sẽ có yi = α+ βxi + ui

Economics 20 - Prof. Anderson 17

Đường hồi qui của tổng thể, điểm số liệu và các sai số

y y4

. {

E(y|x) = α+βx u4

u3

. }

y3 y2

u2

. {

u1

. }

y1

x

x2

x1

x4

x3

Economics 20 - Prof. Anderson 18

Ước lượng với phương pháp bình phương cực tiểu

Để ước lượng với phương pháp bình phương cực tiểu, chúng ta cần thấy rằng, giả thiết chính của chúng ta là E(u|x) = E(u) = 0, và điều này có nghĩa là

Cov(x,u) = E(xu) = 0

Tại sao? Từ lý thuyết cơ bản về xác suất ta có Cov(X,Y) = E(XY) – E(X)E(Y)

Economics 20 - Prof. Anderson 19

Ước lượng với phương pháp bình phương cực tiểu

Với ý tưởng là tìm đường phù hợp nhất, chúng ta có thể xây dựng bài toán cực tiểu Tức là chúng ta muốn tìm các tham số sao cho biểu thức dưới đây đạt giá trị cực tiểu :

Economics 20 - Prof. Anderson 20

n

n

2

2

y

)

=

ˆ ˆ( βα +

( ˆ u

)

i

i

x i

(

)

i

i

1 =

1 =

2

(

y

)

0

−=

ˆ ˆ x βα −−

=

t

t

L ∂ ˆ α∂

t

2

)

0

−=

ˆ ˆ x βα −−

=

( yx t

t

t

t

L ∂ ˆ β∂

• .

Economics 20 - Prof. Anderson 21

Ước lượng với phương pháp bình phương cực tiểu

Chúng ta có thể sử dụng đạo hàm để giải bài toán cực tiểu này, chúng ta nếu lấy đạo hàm bậc 1, theo α va β và giải các phương trình thu. Qua đó ta có thể ước lượng được các tham số của mô hình hồi qui.

N

()

)

YYX i

i

i

1 =

ˆ β

=

=

X N

X

ˆ α

ˆ Y β

−=

2

S XY 2 S X

X

X

(

)

i

i

1 =

( ∑

SXY = đồng phương sai của (X, Y) SX2 = phương sai của (X)

Economics 20 - Prof. Anderson 22

Tóm tắt về ước lượng tham số beta (slope estimate)

Ước lượng về độ dốc là đồng phương sai tính trên mẫu giữa y và x, chia cho phương sai mẫu của x. Nếu x và y có tương quan thuận (dương) với nhau, thì ước lượng có dấu dương Nếu x và y có tương quan nghịch (âm) với nhau, thì ước lượng có dấu âm Chúng ta chỉ cần x biến thiên trong

Economics 20 - Prof. Anderson 23

OLS

Về mặt trực giác, OLS là việc ước lượng đường thẳng qua các điểm số liệu trong mẫu sao cho tổng khoảng cách bình phương sai số là nhỏ nhất, nên có tên là bình phương cực tiểu. Sai số, û, chính là ước lượng cho sai số u và là sự sai khác giữa đường ước lượng (đường hồi qui trên mẫu) và các điểm số liệu.

Economics 20 - Prof. Anderson 24

Đường hồi qui mẫu, điểm số liệu và các sai số ước lượng

y y4

. {

û4

ˆ y

x

=

ˆ ˆ ββ + 1

0

û3

. }

.

y3 y2

{

û2

û1

} .

y1

x

x2

x1

x4

x3

Economics 20 - Prof. Anderson 25

u

y t

t

ˆ y

=

x += βα + t βα ˆ ˆ x +

t

t

• Đường hồi qui tổng thể là mô hình mà chúng ta cho rằng đã tạo ra số liệu, và các tham số thực là αvà β. Hồi qui tổng thể Hồi qui mẫu và chúng ta biết rằng

.

ˆ u

y

ˆ y

=

t

t

t

• Chúng ta sử dụng đường hồi qui mẫu để suy diễn về

đường mô hình của tổng thể

• Chúng ta cũng muốn biết là các ước lượng αvà β

có phải là cácướ c lượng tôt hay không

Economics 20 - Prof. Anderson 26

Tính chất của OLS

Tổng các sai số (residual) OLS là bằng 0 Như vậy, trung bình mẫu các sai số OLS cũng bằng 0 Đồng phương sai mẫu giữa các biến độc lập và sai số OLS cũng bằng 0 Đường OLS sẽ chạy xuyên qua điểm trung bình của số liệu

Economics 20 - Prof. Anderson 27

Biểu diễn bằng đại số, ta có

n

ˆ u

i

n

i

and 0

thus,

ˆ u

=

0 =

i

1 = n

i

1 =

n

0

=

ˆ ux i

i

i

1 =

y

x

=

ˆ ˆ ββ + 1

0

Economics 20 - Prof. Anderson 28

Tính chất của ước lượng OLS

$α $β

Tuyến tính (linear)

Không trệch (unbiased) $β

$β Hiệu quả nhất (best)

Best Linear Unbiased Estimator

Economics 20 - Prof. Anderson 29

Sử dụng STATA để ước lượng OLS

Thực hiện hồi qui trong STATA rất giản đơn. Và để ước lượng mô hình hồi qui y theo x thì ta chỉ cần đánh lệnh reg y x

Economics 20 - Prof. Anderson 30

Ước lượng sử dụng STATA

regress testscr str, robust

Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------- | Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------- str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 -------------------------------------------------------------------------

Economics 20 - Prof. Anderson 31

Mức độ phù hợp của mô hình (Goodness-of-Fit)

coi môi quan thich và phân

sát gôm là 2 có không giai duoc

phân thich

:

Chúng

ta

co se

somôt

đinh

nghia

nhu

sau

:

+

i

i

i

2

y

y

Tông binh

phuong khoang cach

(SST)

i

2

ˆ y

y

Phân tông binh

phuong duoc giai

thich

(SSE)

i

Phan tông binh

phuong con

du

(SSR)

Chúng ta thcó Phân duoc giai ˆ ˆ y y u = ) ( ∑ ( ) ∑ ∑ 2 ˆ u i co Ta

SSR

SST =

SSE +

Economics 20 - Prof. Anderson 32

Chứng minh rằng SST = SSE + SSR

2

2

y

y

ˆ y

ˆ y

y

=

+

)

(

] )

i

i

i

i

2

+

∑ =

) (

y [ ˆ u

i

i

2

ˆ u

y

ˆ y

+

=

+

)

)

(

2 i

i

i

( ∑ ∑ SSR

y

=

2 +

+

i

tavà

biêt

y

∑ SSE ) 0 =

y ) ( ˆ ˆ yu i

i

[ ( ∑ ] ) ˆ y y − ( ∑ ˆ ˆ 2 yu i ( ∑ ˆ ˆ yu − i ∑ rang

Economics 20 - Prof. Anderson 33

Mức độ phù hợp của mô hình (Goodness-of-Fit)

Chúng ta đánh giá thế nào về đường hồi qui mà ta ước lượng? Có phù hợp với số liệu hay không?

Có thể tính tỷ lệ tổng bình phương khoảng cách (SST) được giải thích bởi mô hình, và gọi tỷ lệ này là R-bình phương của mô hình hồi qui.

R2 = SSE/SST = 1 – SSR/SST Nằm trong khoảng 0-1. Càng lớn càng tốt!!!!

Economics 20 - Prof. Anderson 34

Phân phối mẫu của ước lượng OLS

ˆβ. Đây được gọi

1

ˆβ. Chúng ta muốn

1

Ước lượng OLS được tính toán dựa trên một mẫu số liệu, một mẫu số liệu khác sẽ cho ta một giá trị khác của là tính bất định theo mẫu của

• đánh giá mức độ bất định của

1

• Sử dụng

ˆβ ˆβ để tiến hành kiểm định giả thuyết như β1 = 0

1

• Xây dựng khoảng tin cậy cho β1

• Tất cả những điều này đòi hỏi chúng ta phải xem xét tới phân phối mẫu (sampling distribution) của ước lượng OLS. Để làm được điều này, ta phải xem xét Phân phối của ước lượng OLS

Economics 20 - Prof. Anderson 35

ˆβ

1

Hàm phân phối của

ˆβ cũng có phân phối mẫu .

Cũng giống như trung bình mẫu, Y ,

1

ˆβ ) là bao nhiêu

• Vậy kỳ vọng toán của E( 1

ˆβ ) = β1, thì ước lượng OLS là ước lượng

• Nếu như E( 1

ˆβ )? (cho chúng ta biết được mức

• Phương sai của

1

không trệch – Còn muốn gì hơn?! ˆβ - var( 1 độ bất định của ước lượng)

• Phân phối của

ˆβ trong các mẫu nhỏ là phân phối gì ?

1

• Vấn đề này rất khó!!!!!

ˆβ ở các mẫu lớn là phân phối gì ?

• Phân phối của

1

ˆβ có phân bổ là phân bổ chuẩn

• Với các mẫu lớn,

1

(normally distributed).

Economics 20 - Prof. Anderson 36

Tính không trệch của OLS (Unbiasedness)

Giả thiết rằng mô hình tổng thể là tuyến tính theo tham số có dạng y = β0 + β1x + u Giả thiết rằng chúng ta sử dụng một mẫu có qui mô n, {(xi, yi): i=1, 2, …, n}, được lấy từ mô hình tổng thể. Như vậy ta có thể biểu diễn mô hình mẫu là yi = β0 + β1xi + ui Giả thiết E(u|x) = 0 và như vậy E(ui|xi) = 0 Giả thiết rằng xi có biến thiên

Economics 20 - Prof. Anderson 37

Tính không trệch của OLS (Unbiasedness)

Để xét tính không trệch của ước lượng, chúng ta viết lại dưới dạng tham số của tổng thể. Viết một công thức đơngiản là

) yx

(

i

, where

=

ˆ β 1

x i s

− 2 x

2

s

x

(

)

2 x

x i

Economics 20 - Prof. Anderson 38

Tính không trệch của OLS (Unbiasedness)

x

x

u

x

+

=

=

)

i

i

i

i

i

0

x

x

x

x

i

i

i

)( ββ + 1 ) β 1

( ∑ x ( ∑ + =

∑ ∑ +

i

i

x

x

(

) xx

i

i

i

β 0

β 1

x

+

i

) yx ) β 0 ) ux ) x + ) i ux

( ( x ( ∑ x ( ∑ ( ∑

Economics 20 - Prof. Anderson 39

Tính không trệch của OLS (Unbiasedness)

,0

x

=

x i

2

x

=

) be rewritten

as

∑ ∑ ,so

thus

s

+

2 x

i

β 1

) ( ) ( ( ∑ x xx x i i i numerator the can ) ∑ ux

and , ) ux

− (

i

( x i ∑

+

ˆ ββ = 1 1

x i s

− 2 x

Economics 20 - Prof. Anderson 40

Tính không trệch của OLS (Unbiasedness)

that

let d

x

=

(

) so ,

i

x i

1

, then

+

ˆ ββ = 1

i

ud i

i

s

2 x

⎛ ⎜ ⎝

⎞ ⎟ ⎠

1

E

=

+

( uEd

)

i

i

β 1

) ( ˆ ββ = 1 1

s

2 x

⎞ ⎟ ⎠

⎛ ⎜ ⎝

Economics 20 - Prof. Anderson 41

Tính không trệch của OLS (Unbiasedness)

Các ước lượng OLS của tham số β1 và β0 là không trệch Việc chứng minh tính không trêch, dựa trên 04 giả thiết. Nếu một giả thiết mà không đúng, thì ước lượng OLS sẽ không phải là không trệch Lưu ý rằng, tính không trệch là tính chất của phép ước lượng (estimator) – còn trong một mẫu cụ thể, thì ước lượng thu được có thể nhiều ít khác với tham số thực tế

Economics 20 - Prof. Anderson 42

Phương sai của ước lượng OLS

Chúng ta biết rằng hàm phân bổ (sampling distribution) của ước lượng nằm xung quanh tham số thực Muốn biết xem hàm phân bổ này có độ phân tán như thế nào Đưa thêm một giả thiết nữa về phương sai Giả thiết là Var(u|x) = σ2 (Homoskedasticity)

Economics 20 - Prof. Anderson 43

Phương sai của ước lượng OLS

Var(u|x) = E(u2|x)-[E(u|x)]2 E(u|x) = 0, so σ2 = E(u2|x) = E(u2) = Var(u) Như vậy, σ2 cũng là phương sai không điều kiện, và được gọi phương sai của sai số σ, được gọi là sai số chuẩn của sai số Có thể nói rằng : E(y|x)=β0 + β1x và Var(y|x) = σ2

Economics 20 - Prof. Anderson 44

Trường hợp phương sai đồng nhât (Homoskedastic)

y

f(y|x)

.

E(y|x) = β0 + β1x

.

x2

x1

Economics 20 - Prof. Anderson 45

Phương sai không đồng nhât (Heteroskedastic) f(y|x)

y

.

E(y|x) = β0 + β1x

.

.

x

x2

x1

x3

Economics 20 - Prof. Anderson 46

Phương sai của ước lượng OLS

1

=

+

Var

Var

β 1

ud i

i

( ˆ β 1

)

s

2 x

⎛ ⎜ ⎝

⎞ ⎟ ⎠

⎛ ⎜⎜ ⎝

⎞ =⎟⎟ ⎠

2

2

1

1

=

Var

d

( u

)

)

ud i

i

2 Var i

i

( ∑

s

s

2 x

2 x

⎛ ⎜ ⎝

⎞ ⎟ ⎠

⎛ ⎜ ⎝

⎞ ⎟ ⎠

2

2

2

1

1

=

d

d

=

2 2 = σσ i

2 i

s

2 x

2 x

⎛ ⎜ ⎝

⎞ ⎟ ⎠

⎛ ⎜ ⎝

2

2 σ

1

s

Var

2 σ

=

=

2 x

⎞ ⎟ s ⎠ )1 ( ˆ β

s

s

2 x

2 x

⎛ ⎜ ⎝

⎞ ⎟ ⎠

Economics 20 - Prof. Anderson 47

Phương sai của ước lượng OLS

Phương sai của sai số, σ2 càng lơn, thì phương sai của ước lượng càng lớn

xi biến thiên càng nhiều, thì phương sai

của ước lượng càng nhỏ Do đó, mẫu lớn sẽ làm giảm phương sai của ước lượng Vấn đề là phương sai của sai số chúng ta lại không biết

Economics 20 - Prof. Anderson 48

Ước lượng phương sai của sai số

Chúng ta không biết phương sai của sai, σ2, của sai số là bao nhiêu vì chúng ta không quan sát được sai số, ui

Chúng ta chỉ quan sát được , ûi

Chúng ta có thể sử dụng ûi để ước lượng phương sai của sai số

Economics 20 - Prof. Anderson 49

Ước lượng phương sai của sai số

ˆ u

y

0

ˆ ˆ ββ − 1

i

i

+

=

x i )

0

0

i

x i

x i

u

=

of

is

2 σ

SSR

ˆ u

/

=

=

2 ˆ σ

( n

)2

2 i

2

= ˆ ˆ ( u ββ ββ + − − 1 1 ) ( ) ( ˆ ˆ ββββ − 0 0 1 1 i Then, an unbiased estimator 1 −

( n

)

Economics 20 - Prof. Anderson 50

Ước lượng phương sai của sai số

of

the regression

=

2 ˆ ˆ σσ =

sd

that

recall

s

then we have

if

1

2

se

x

)

Standard error ( ) ˆ σβ = x ˆ we substitute for σσ , ˆ of β 1 ) 2

the standard error ) ( ( ˆ ( ∑ − /ˆ x σβ = i 1

Economics 20 - Prof. Anderson 51

Tóm tắt về phân phối mẫu của

ˆβ

1

Nếu các giả thiết của OLS là đúng thì

1

• E( 1

]

)

μ x

u i

ˆβ) =

×

• var( 1

ˆβ có: • Hàm phân phối mẫu của ˆβ là ước lượng không trệch) ˆβ) = β1 (tức là, 1 X var[( − 1 1 i . 4 n n σ X

)

ˆ Eβ − 1

~ N(0,1) (CLT)

• Khi mẫu lớn ,

var(

)

ˆ( β 1 ˆ β 1

• .

Economics 20 - Prof. Anderson 52

Kiểm định giả thuyết và sai số chuẩn của

ˆ β 1

Mục tiêu của việc kiểm định trong mô hình hồi qui là sử dụng số liệu để kiểm định một giả thuyết về tổng thể như β1 = 0, và đưa ra kết luận liệu giả thuyết có đúng hay không

Giả thuyết trống và giả thuyết thay thế hai phía

H0: β1 = β1,0 vs. H1: β1 ≠ β1,0

Trong đó β1,0 là một giá trị giả thuyết

Giả thuyết trống và giả thuyết thay thế một phía :

H0: β1 = β1,0 vs. H1: β1 < β1,0

Economics 20 - Prof. Anderson 53

Phương pháp kiểm định: Xây dựng thống kê t hoặc z, tính p- value, hoặc so sánh với giá trị tới hạn của hàm phân phối N(0,1))

• Nói chúng ta có: • t = (ước lượng – giá trị muốn kiểm định)/sai số chuẩn của ước

lượng

Y

Khi kiểm định về trung bình của Y: ta có t =

/

μ− Y ,0 n

s Y

t =

,

• Khi kiểm định β1, ta có

ˆ − β β 1 1,0 ˆ( SE ) β 1

Economics 20 - Prof. Anderson 54

ˆβ Công thức tính SE( )1

n

2 ˆ v i

2

n

1 −

i

1 =

=

×

×

2

2

2 ˆˆ σ = β 1

n

estimator of (estimator of

)

1 n

1 n

2 σ v 2 σ X

2

(

)

X

X

i

1 n

i

1 =

⎡ ⎢ ⎣

⎤ ⎥ ⎦

.

(

X

Trong đó ˆiv =

i

ˆ X u ) i

ˆβ) trông phức tạp, nhưng STATA tính rất nhanh và

• OK. SE( 1

ta không phải nhớ các công thức này .

Economics 20 - Prof. Anderson 55

Ví dụ

Ước lượng của mô hình hồi qui: Test score = 698.9 – 2.28×STR STATA cũng cho ta ước lượng độ lệch chuẩn của con số ước lượng là

ˆβ ) = 0.52

SE( 0

SE( 1

ˆβ ) = 10.4 Ta có thể tính các kiểm định thống kê cho

1

ˆβ với giả thuyết Ho:

β1,0 = 0

=

= –4.38

t-statistic testing β1,0 = 0 =

2.28 0 − 0.52

ˆ − β β 1 1,0 ˆ( SE ) β 1

• Ở mức ý nghĩa 1% giá trị là 2.58, nên ta có thể bác bỏ giả

thuyết trông với mức ý nghĩa 1%.

• Ta cũng có thể tính giá trị p-value …. Nhưng STATA làm hộ

hêt rồi !

Economics 20 - Prof. Anderson 56

Ước lượng sử dụng STATA

regress testscr str, robust

Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------- | Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------- str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 -------------------------------------------------------------------------

Economics 20 - Prof. Anderson 57

Tóm tắt: kiểm định H0: β1 = β1,0 v. H1: β1 ≠ β1,0,

• Tính kiểm định thống kê t (t-statistic)

ˆ − β β 1 1,0

t =

=

ˆ − β β 1 1,0 ˆ( SE ) β 1

2 ˆ σ ˆ β 1

• Bác bỏ giả thuyết trống với mức ý nghía 5% nếu |t| > 1.96 • Bác bỏ giả thuyết trống nếu p<5% • Việc kiểm định này dựa trên mẫu khoảng ít nhất là 30 quan

sát.

Economics 20 - Prof. Anderson 58

Đọc kết quả STATA

regress testscr str, robust

Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------- | Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------- str | -2.279808 .5194892 -4.38 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 ------------------------------------------------------------------------- Y = 698.9 – 2.28×STR, , R2 = .05,

(10.4) (0.52) t (β1 = 0) = –4.38, p-value = 0.000 (2-sided) Khoảng tin cậy 95% của β1 là (–3.30, –1.26) Economics 20 - Prof. Anderson

59