KINH TẾ LƯỢNG

CHƯƠNG II HỒI QUY 2 BIẾN

1

2.1. Giới thiệu 2.1.1. Khái niệm về hồi quy

2

Phân tích hồi quy là tìm quan hệ phụ thuộc của một biến, được gọi là biến phụ thuộc vào một hoặc nhiều biến khác, được gọi là biến độc lập nhằm mục đích ước lượng hoặc tiên đoán giá trị kỳ vọng của biến phụ thuộc khi biết trước giá trị của biến độc lập.

3

2.1.2. Sự khác nhau giữa các dạng quan hệ • Quan hệ tất định và quan hệ thống kê : Shcn = dài x rộng Cùng diện tích và kỹ thuật nuôi tôm => năng suất khác nhau • Hồi quy và quan hệ nhân quả Có thể hồi quy số vụ trộm theo số nhân viên cảnh sát hoặc ngược lại Quan hệ nhân quả chỉ ra rằng số cảnh sát tăng do số vụ trộm tăng. •Hồi quy và tương quan Phân tích tương quan chỉ cho thấy độ mạnh yếu của mối quan hệ tuyến tính giữa hai biến số

4

2.2.Mô hình hồi quy tổng thể và hồi quy mẫu 2.2.1. Mô hình hồi quy tổng thể (PRF) Ví dụ 2.1. Hồi quy tiêu dùng Y theo thu nhập X. Xét sự phụ thuộc chi tiêu của một gia đình vào thu nhập ở một địa phương có tổng cộng 40 hộ gia đình. Ta được số liệu cho ở bảng sau:

160

180

100

120

140

80

Bảng 2.1. Chi tiêu và thu nhập của hộ gia đình: 200 X

Y

55

65

79

80

102

110

120

60

70

84

93

107

115

136

65

74

90

95

110

120

140

70

80

94

103

116

130

144

75

85

98

108

118

135

145

88

113

125

140

115

325

462

445

707

678

750

685

E(Y/Xi)

65

77

89

101

113

115

137

5

Mô hình hồi quy tổng thể: E(Y/Xi) = f(Xi) =   Xi  : là hệ số chặn – tung độ gốc 2 : hệ số góc - hệ số đo độ dốc đường hồi quy Ví dụ ở hộ gia đình có mức chi tiêu 130 ta có: 130 = 1 + 2.180 + 15 115

Mô hình hồi quy tổng thể ngẫu nhiên:

ui:sai số ngẫu nhiên của tổng thể ứng với quan sát thứ i ui: đại diện những nhân tố còn lại ảnh hưởng đến chi tiêu

6

Yi = 1 + 2Xi + ui

Sai số ngẫu nhiên hình thành từ nhiều nguyên

nhân:

- Bỏ sót biến giải thích.

- Sai số khi đo lường biến phụ thuộc.

- Các tác động không tiên đoán được.

7

- Dạng mô hình hồi quy không phù hợp.

Haøm hoài quy toång theå Yi = 1 + 2Xi + ui

Yi = 1 + 2Xi + ui

160 0 140

120

E(Y/Xi)=  1 +  2 Xi

ui ?

Tiêu dùng Y

100

80

Yi

 

Y = E(Y/Xi)

60

40

 

0

Xi

0

80

100

140

160

200

220

180

120 0

8

Hình 2.1. Mô hình hồi quy tổng thể tuyến tính

X

ˆ Y i

2

i

1

1

2.2.2. Mô hình hồi quy mẫu (SRF) Mô hình hồi quy mẫu: ˆ ˆ  

2

: ước lượng cho 1.

: Ước lượng cho 2.

: Ước lượng cho E(Y/Xi) Trong đó ˆ ˆ iYˆ

Y

ˆ  ˆ 

X

e

i

1

2

i

i

9

Mô hình hồi quy mẫu ngẫu nhiên

)

D X

(

Y

,

140

(PRF)

g n ù d u ê i T

120

(SRF)

E(Y/Xi)

ui

100

Yi

ei

Yi

80

2

60

1

 2

40

 1

Xi

0

0

80

100

120

140

1600

180

200

210

220

Thu nhập khả dụng, X (XD)

Hình 2.1. Mô hình hồi quy tổng thể và mẫu tuyến tính

10

2.2.3. Mô hình hồi quy tuyến tính (LRF)

Y

1  

2

iu

1 X

Hồi quy tuyến tính chỉ yêu cầu tuyến tính trong các tham số, không yêu cầu tuyến tính trong biến số. * Mô hình

2

Y



)

 1

1(  2

 iuX

11

là mô hình tuyến tính trong các tham số nhưng phi tuyến theo biến số. * Mô hình

là mô hình phi tuyến trong các tham số nhưng tuyến tính trong biến số. Hồi quy tuyến tính theo OLS chỉ chấp nhận dạng mô hình tuyến tính trong tham số.

 i XuE

 0i

2 

2.3. Ước lượng các hệ số của mô hình hồi quy theo phương pháp bình phương tối thiểu-OLS 2.3.1.Các giả định của mô hình hồi quy tuyến tính cổ điển Giả thiết 1:Các biến giải thích là phi ngẫu nhiên tức là các giá trị của chúng được cho trước hoặc được xác định. Giả thiết 2: Kỳ vọng của yếu tố ngẫu nhiên ui bằng 0, tức là: Giả thiết 3: Các ui có phương sai bằng nhau (phương sai thuần nhất) 

 Xu var j

 Xu var i

i

i

i

12

cov

,

,

i

j

j

i

j

i

i

 XXuu

 XXuuE j

Giả thiết 4: Không có tự tương quan giữa các ui:  0   Giả thiết 5: Không tự tương quan giữa ui với Xi: Cov (ui,Xi) = 0

Định lý Gauss-Markov

13

Với các giả định của mô hình hồi quy tuyến tính cổ điển, mô hình hồi quy tuyến tính theo phương pháp bình phương tối thiểu là ước lượng tuyến tính không thiên lệch tốt nhất

14

Giả thiết bổ sung (Gujarati, 1995): Giả thiết 7: Mô hình là tuyến tính theo tham số. Giả thiết 8: Số quan sát n lớn hơn số tham số của mô hình. Giả thiết 9: Giá trị của X không được đồng nhất (bằng nhau) ở tất cả các quan sát. Giả thiết 10: Mô hình được xác định đúng. Giả thiết 11: Không tồn tại đa cộng tuyến hoàn hảo giữa các biến giải thích.

i

,1

n

X

e

Y

i

2

i

i

1

i

i

 

)

min

0

e i e 1

 

 

) 2 )

 

0 0

e 2 e 3

ˆ  ˆ  ˆ Y Y ˆ Y Y  1 1 ˆ Y Y  2 2 ˆ YY  3 3

Y 1 Y 2 Y 3

ˆ( .ˆ  X  2 1 1 ˆ( .ˆ  X   2 1 ˆ( .ˆ  X   2

1

3

15

2.3.2. Nội dung của phương pháp Cho n quan sát của 2 đại lượng (Yi, Xi) Mô hình hồi quy mẫu ngẫu nhiên

n

n

2 => 0: Phương pháp bình phương bé nhất ˆ ˆ  

X

 Y

2

2 i

2

1

i

i

i

1

i

1

2.3.2. Nội dung của phương pháp Tại sao chúng ta không tìm ∑e => 0? => tìm ∑ei  e

n

e

2 i

n

n

  

  

ˆ



2



2

e

0

 Y

i

 1

2

i

i

 1i

 1i

1

  1i ˆ  n

e

2 i

n

n

  

  

ˆ



2



2

0

 Y

 XXˆ

i

 1

2

i

i

Xe i

i

  1i ˆ 

 1i

 1i

16

2

Điều kiện để phương trình trên đạt cực trị là:

X

ˆ  1

ˆ  2

. YXn .

XY i

i

1 

i

ˆ

2

2

X

.( Xn

)

2 i

Y n   n 

i

1 

n

xy i

i

2.3.2. Nội dung của phương pháp Giải hệ phương trình trên, chúng ta thu được:

2

 

 XXx i i  YY y i i

x

2 i

 ˆ  1i n 

1i 

17

đặt

Stt 1 2 3 4 5 6 sum

Xi 1 4 2 5 5 7 24

Yi 10 6 9 5 4 2 36

XiYi 10 24 18 25 20 14 111

X^2 1 16 4 25 25 49 120

18

Ví dụ 2.2: quan sát sự biến động của nhu cầu gạo Y (tấn/tháng) vào đơn giá X (ngàn đồng/kg) ta được các số liệu cho ở bảng. Hãy lập mô hình hôi quy mẫu biễu diễn mối phụ thuộc về nhu cầu vào đơn giá gạo

X

ˆ Y i

ˆ ˆ   2

1

i

X

4

Y

6

36 6

.

YXnXY  . i

i

24 6 n 

i



375,1

ˆ  2

 1 n

 111 6.4.6 2 )4.(6  120

2

X

Xn .(

)

2 i

i

 1



X



375,1(6

4).

5.11

ˆ  1

ˆ Y  2

19

Giả sử mô hình hồi quy mẫu là:

,15,11

375

.

X

ˆ Y i

i

1

Như vậy, mô hình hồi quy mẫu

2

=> X và Y có quan hệ nghịch biến ˆ * = 11,5: nhu cầu tối đa là 11,5 tấn/tháng ˆ * = -1,375: khi giá tăng 1000 đồng/kg thì nhu cầu

trung bình sẽ giảm 1,375 tấn/tháng với các yếu tố khác

20

trên thị trường không đổi.

n

2

1

X

2 i

2.4. Phương sai, sai số chuẩn của các ước lượng, hệ số xác định R2, hệ số tương quan r 2.4.1. Phương sai và sai số chuẩn của các ước lượng Ước lượng

var

2 

Phương sai

 ˆ  1

ˆ 

ˆ 

 ˆ  var 2

 i  1 n n

2 x i

2 ix

2   n 

i

 1

i

1 

n

X

2 i

i

SE

SE

2 )ˆ( 

1)ˆ( 

1  n

2 ix

 

2 x i

 n

21

i

1 

Sai số chuẩn

n

e

2 i

2

ˆ 

i  n

1 

2

22

Var(ei) được dùng để ước lượng cho 2 và dùng ước lượng không chệch là:

2.4.2. Hệ số xác định R2 và hệ số tương quan r Thước đo độ phù hợp của mô hình đối với dữ liệu là R2

Y

SRF

Yi

 ˆ eYY i i i

Yi

 yYY i i

ˆ ˆ  yYY i i

Y

23

Xi

X

n

2 R

1 

ESS TSS

RSS TSS

24

 2 e i  1 i 1 n  2 y i

1  i

TSS (Total Sum of Squares): Tổng bình phương tất cả các sai lệch giữa giá trị thực tế của Y với giá trị trung bình của nó. ESS (Explained Sum of Squares): Tổng bình phương tất cả các sai lệch giữa giá trị của Y được tính theo mô hình với giá trị trung bình của nó. RSS (Residual Sum of Squares): Tổng bình phương tất cả các sai lệch giữa giá trị thực tế với giá trị lý thuyết theo mô hình của Y.

n

ˆ

x

2 2

2 i

2

i

1

R

n

y

2 i

i

1

Trong mô hình 2 biến, người ta chứng minh được rằng

=> Có thể nói R2 phản ánh tỷ lệ mô hình lý thuyết

phản ánh thực tế. * Tính chất của R2 - 0≤ R2 ≤1. Với R2=0 thể hiện X và Y độc lập thống

25

kê. R2 =1 thể hiện X và Y phụ thuộc tuyến tính hoàn hảo.

- R2 không xét đến quan hệ nhân quả.

n

xy i

i

i

1

r

n

n

x

2 i

2 i

 y

i

1

i

1

26

Hệ số tương quan r: Hệ số tương quan r đo lường mức độ phụ thuộc tuyến tính giữa 2 đại lượng X và Y.

Tính chất của r: - r > 0: giữa X và Y có quan hệ đồng biến

r-> ± 1: X và Y có quan hệ tuyến tính chặt chẽ r-> 0: X và Y có quan hệ tuyến tính không chặt chẽ r < 0: X và Y có quan hệ nghịch biến - Hệ số tương quan có tính chất đối xứng: rXY = rYX - r độc lập với gốc toạ độ và các tỷ lệ. Nghĩa là: với a,

X

aX

b

* i

*

Y

cY

i 

d

i

i

c > 0, b, d là hằng số, và:

27

Thì : rXY = rX*Y*

- Nếu X, Y độc lập theo quan điểm thống kê thì hệ số

2

tương quan giữa chúng bằng 0.

n

i

yx i

 1i

2

  

R

r

2 Y,X

n

n

y

2 i

2 i

    x

 1i

 1i

25,6

75,0

X

i

- r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ thuộc tuyến tính. r không có ý nghĩa để mô tả quan hệ phi tuyến.

28

rXY = ± R ˆ VD:  Y i Với R2 = 0,81 => r = ± 0,9 = 0,9

ˆ,ˆ,ˆ 2  2

1

2.5. Phân bố xác suất của các ước lượng Giả thiết 6: ui có phân phối N(0, 2) Với các giả thiết nêu trên, các ước lượng có

các tính chất sau:

- Chúng là các ước lượng không chệch - Có phương sai cực tiểu - Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ

~ˆ  N

(

)

1

2  , 1ˆ 1 

~ˆ  N

(

)

2

2  , 2ˆ 2 

29

với giá trị thực của phân phối

t

SE

)

ˆ;

ˆ(

 i

(

n

1,2



)2/

)ˆ(  i

  i

i

i

i

i

30

2.6. Khoảng tin cậy của các tham số Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa  (độ tin cậy 1-) như sau

*  

H

0

2

2

H

:

*  

1

2

2

t

2.7. Kiểm định giả thiết về hệ số hồi quy :

t t

Có 3 cách để kiểm định giả thiết: Cách 1: Kiểm định t ˆ *   2 2 )ˆ( SE  2

31

Quy tắc quyết định  nt Nếu thì bác bỏ H0. )2/ ,2 ( (  nt Nếu thì ta không thể bác bỏ H0. )2/ ,2

f(t)

/

/

-t

t

/

/

-4

-3

-2

-1

1

2

3

4

0 t

32

SE

ˆ;

)

 t ( n 1,2

 i

)2/

 i

ˆ(  i

i

i

i

Cách 2: Phương pháp khoảng tin cậy Giả sử ta tìm được khoảng tin cậy của i là: )ˆ(   i

i

i

 

) )

 i  i

ˆ(  i ˆ(  i

* i * i

i

i

với mức ý nghĩa  trùng với mức ý nghĩa của gt H0

33

Quy tắc quyết định ˆ; - Nếu chấp nhận H0 ˆ; - Nếu bác bỏ H0

t

i

ˆ *   i i )ˆ( SE  i

( TP

t

p

Cách 3: Phương pháp P-value

) i 

Tính

34

Quy tắc quyết định - Nếu p ≤  : Bác bỏ H0 - Nếu p > : Chấp nhận H0 (Phương pháp này thường dùng khi tiến hành trên máy vi tính)

0

0

:H 0 :H 1

 2  2

Quy tắc thực hành-Trị thống kê t trong các phần mềm kinh tế lượng Mức ý nghĩa hay được dùng trong phân tích hồi quy là =5%. Giả thiết:

t 

ˆ  2 )ˆ( 

SE

2

2t 2t

trị thống kê trở thành:

35

Quy tắc quyết định Nếu thì bác bỏ H0. Nếu thì ta không thể bác bỏ H0.

2.8. Kiểm định sự phù hợp của mô hình – Dự báo 2.8.1. Kiểm định sự phù hợp của mô hình Kiểm định giả thiết H0: R2 = 0 với mức ý nghĩa  hay

độ tin cậy 1 - 

)2

F

2

2 nR (  1

 R

Xét thống kê

36

Quy tắc quyết định - Nếu F > F(1,n-2): Bác bỏ H0 - Nếu F ≤ F(1,n-2): Chấp nhận H0

F

Thống kê F =0,05

Miền bác bỏ

Miền chấp nhận

37

F(1,n-2)

X

ˆ Y i

ˆ ˆ   1 2

i

2.8.2. Dự báo Cho trước giá trị X = X0, hãy dự báo giá trị trung bình và giá trị cá biệt của Y với mức ý nghĩa  hay độ tin cậy 1 - .

X

ˆ Y 0

ˆ ˆ   1 2

0

38

* Dự báo điểm

XYE

(

/

)

ˆ( Y

ˆ; Y

)

0

0

 0

 0

0

* Dự báo giá trị trung bình của Y

SE

 0

)ˆ( ntY 0 (

1,2

)2/

SE

)ˆ( Y

Var

)ˆ( Y

0

0

2

(

X

)

2

Var

)ˆ( Y

(ˆ 

)

0

1 n

X 0 2 ìx

 

39

Với:

Y

ˆ( Y

ˆ; Y

)

0

0

' 0

0

' 0

* Dự báo giá trị cá biệt của Y

SE

Y (

'  0

0

)ˆ ntY 0 (

1,2

)2/

SE

Y (

)ˆ Y

Var

Y (

)ˆ Y

0

0

0

0

2

)

1(ˆ 2 

)

)ˆ YYVar ( 0 0

(1  n

XX  0  2 ìx

40

Với:

Ví dụ 2.3: Với số liệu và kết quả ở ví dụ 2.2 a. Tìm khoảng tin cậy của 1, 2 với =0,05 b. Hãy xét xem nhu cầu của loại hàng trên có phụ thuộc vào đơn giá của nó không với =0,05.

c. Hãy dự báo nhu cầu trung bình và nhu cầu cá biệt

41

của loại hàng trên khi đơn giá ở mức 6.000 đồng/kg với độ tin cậy 95%.

xi -3 0 -2 1 1 3 0

yi 4 0 3 -1 -2 -4 0

xi^2 9 0 4 1 1 9 24

yi^2 16 0 9 1 4 16 46

Stt 1 2 3 4 5 6 Sum Average

Xi 1 4 2 5 5 7 24 4

Yi 10 6 9 5 4 2 36 6

,15,11

375

.

X

ˆ Y i

i

42

Mô hình hồi quy mẫu:

SE

t

SE

t

)2/

 n 1,2

)2/

SE

( n  1,2  t

( t

a. Ta có

2

(

 1,2 n

)2/

)ˆ(  1 )ˆ( SE  2

ˆ  1 ˆ  2

(

 n 1,2

)2/

n

x

ˆ 2  2

2 i

2 24.)

2

i

 1

Bài giải: )ˆ( ˆ   1 1 1 )ˆ( ˆ  2 2

,0

9864

R

n

 375,1( 46

y

2 i

i

 1

n

2

1(

R

)

y

2 i

 ,01(

46).

,0

15625

ˆ 2 =>

i  1 2

n

9864  26

43

Mà:

Var

ˆ 2 

,0

15625

,0

1303

)ˆ(  1

120 24.6

2 i 2 x i

 X  n 

Var

SE

3609

)ˆ(  1

,0)ˆ(   1

2

,0

Var

,0

0065

)ˆ(  2

15625 24

x

2 i

SE

Var

,0

0806

ˆ   

)ˆ(  2

)ˆ(  2

44

SE

,2

776

x

,0

3609

,1

0019

 1

t n (

1,2

 

)2/

SE

,2

776

x

,0

0806

,0

2237

 2

t n (

1,2

)2/

)ˆ( 1  )ˆ(  2

,10

4981

 

,12

5019

1 

,1

5987



,1

1513

 2

45

b. Kiểm định giả thiết 2 = 0 H0: 2 = 0 C1: Sử dụng kết quả ở câu a, với  = 0,05, 2 không

0

thuộc khoảng tin cậy => bác bỏ H0

t



,17

0379

,1 ,0

 375 0806

ˆ *   2 2 )ˆ( SE  2

C2:

t

,17

0379

t

,2

776

,0,4

025

=>

46

=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc vào đơn giá

2

(

F

12,290

n  1( 

)2 R

R 2 )

 ,0)26( ,01( 

9864 9864 )

C3: sử dụng kiểm định F đối với mô hình hai biến

Mà F0,05(1,4) = 7,71 < Ftt

47

=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc vào đơn giá

,15,11

25,3

6

x

XYE /

(

)6

t

)ˆ(

ˆ n  Y 0 ,2

(

)2/

YSE . 0

2

2

)

(ˆ 2 

 ,0)

1562 (

052,0)

)ˆ( YVar 0

(1  n

1 6

 )46( 24

XX  0  ix 2

SE

)ˆ( Y

Var

)ˆ( Y

,0

2283

0

0

XYE /

(

)6

,2(

6162

,3;

8838

)

48

c. Dự báo ˆ Y  375 -Dự báo điểm: (tấn/tháng) 0 - Dự báo giá trị trung bình của Y

Y

t

.

ˆ Y 0

n

0

0

2

0 Var

(

Y

( )ˆ Y

,2   

)2/ Var

Y ( SE )ˆ( Y

)ˆ Y ˆ  

,0

20835

0

0

0

SE

(

Y

)ˆ Y

Var

(

Y

)ˆ Y

,0

4565

0

0

0

0

,1(

9828

,4;

5172

)

0 Y

- Dự báo giá trị cá biệt của Y

49

Vậy, khi đơn giá là 6.000 đồng/kg ở một tháng nào đó thì nhu cầu sẽ dao động từ 2-4,5 tấn.