Chương 10 TƯƠNG QUAN, HỒI QUI TUYẾN TÍNH

www.nguyenngoclam.com

190

I.TƯƠNG QUAN TUYẾN TÍNH

1. Khái niệm:  được gọi là đại lượng đo lường mối tương quan tuyến tính của 2 đại lượng ngẫu nhiên X và Y nếu:

-1   1 *  < 0: X, Y có mối liên hệ nghịch *  > 0: X, Y có mối liên hệ thuận *  = 0: X, Y không có mối liên hệ. *: càng lớn thì X, Y có mối liên hệ càng chặt chẽ.

191

I.TƯƠNG QUAN TUYẾN TÍNH

2. Hệ số tương quan mẫu: Chọn ngẫu nhiên n cặp quan sát (xi, yi) từ hai tổng thể X,Y. Ta có hệ số tương quan Pearson:

x(

y)(x

)y

i

i

n  1i 

r

x(

2 )x

y(

2 )y

i

i

n  1i 

n  1i 

Trường hợp |r| ≥ 0,8 chúng ta có thể kết luận X, Y có mối tương quan tuyến tính chặt chẽ. Để đảm bảo tính chính xác này, chúng ta có thể thực hiện kiểm định giả thuyết

192

I.TƯƠNG QUAN TUYẾN TÍNH

Ví dụ, nghiên cứu mối quan hệ giữa số tiền chi tiêu và thu nhập của họ. Ta có số liệu sau:

Thu nhập X Chi tiêu Y Thu nhập X Chi tiêu Y

9.098 5.492 11.307 5.907

9.138 5.540 11.432 6.124

9.094 5.305 11.449 6.186

9.282 5.507 11.697 6.224

9.229 5.418 11.871 6.496

9.347 5.320 12.018 6.718

9.525 5.538 12.523 6.921

9.756 5.692 12.053 6.471

10.282 5.871 12.088 6.394

10.662 6.157 12.215 6.555

193

11.019 6.342 12.494 6.755

I.TƯƠNG QUAN TUYẾN TÍNH

194

I.TƯƠNG QUAN TUYẾN TÍNH

H

0

:

0

0

:

3. Kiểm định tương quan tuyến tính: X,Y ~ N:   

H 1

t

• Giả trị kiểm định:

  r 2

n

)2

195

1( /() r ,2  nt

2/

t • Bác bỏ giả thuyết H0:

I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

1. Khái niệm hồi qui: Ví dụ, Nghiên cứu mối liên hệ giữa chi tiêu Y và thu nhập X của hộ gia đình: 200 120

140

100

160

180

220

240

260

80

X

Y

55

65

79

102

110

120

80

135

137

150

60

70

84

107

115

136

93

137

145

152

65

74

90

110

120

140

95

140

155

175

70

80

94

116

130

144

103

152

165

178

75

85

98

118

135

145

108

157

175

180

88

125

140

113

160

189

185

115

162

191

101

65

77

89

113

125

137

149

161

173

E(Y/Xi)

196

I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

• E(Y/X) = f(X) : Phương trình hồi qui • E(Y/X) =  + X: Phương trình hồi qui tuyến tính • Y =  + X + U : Giá trị thực của Y Trong đó: • X: biến giải thích (độc lập); • Y: biến được giải thích (phụ thuộc) • : Tham số chặn • : Tham số của biến • U: Yếu tố ngẫu nhiên • X,Y không có mối quan hệ hàm số mà có mối quan hệ

nhân quả và thống kê

197

I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

Đường hồi qui thực nghiệm:

200

180

160

140

120

100

80

60

40

20

0

80

100

120

140

160

189

200

220

240

260

198

I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

2. Xây dựng mô hình hồi qui mẫu: Ta cần ước lượng , , giả sử đó là a,b. Chọn n cặp quan sát (xi,yi) từ X,Y:

y

bx

a 

i

e i

i

bx

a 

: Giá trị thực tế : Giá trị lý thuyết

i

i

Ta cần tìm a, b sao cho 02 giá trị trên càng gần càng tốt. Phương pháp bình phương bé nhất (OLS):

2

2

SSE

e

y(

y(

min

a 

2 i

i

)yˆ i

i

)bx i

n  1i 

n  1i 

n  1i 

x(

y)(x

)y

xbya 

b

 i 2 )x

x(

i 

i

199

I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

Ví dụ, nghiên cứu mối quan hệ giữa số tiền chi tiêu và thu nhập của họ. Ta có số liệu sau:

Thu nhập X Chi tiêu Y Thu nhập X Chi tiêu Y

9.098 5.492 11.307 5.907

9.138 5.540 11.432 6.124

9.094 5.305 11.449 6.186

9.282 5.507 11.697 6.224

9.229 5.418 11.871 6.496

9.347 5.320 12.018 6.718

9.525 5.538 12.523 6.921

9.756 5.692 12.053 6.471

10.282 5.871 12.088 6.394

10.662 6.157 12.215 6.555

200

11.019 6.342 12.494 6.755

I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

201

I.HỒI QUI TUYẾN TÍNH ĐƠN GIẢN

202

II.HỒI QUI TUYẾN TÍNH BỘI

E(Y/X1,X2,…, Xk) =  + 1X1 + 2X2 + …+ kXk Y =  + 1X1 + 2X2 + …+ kXk + U 1. Xây dựng mô hình hồi qui mẫu: Mục tiêu là ta cần ước lượng , 1, 2,… k, giả sử đó là a,b1,b2,…bk,. Chọn n cặp quan sát (x1i, x2i,… xki,yi) từ X và Y:

y

xb

...

e

xba 



i

i11

i22

ki

i

xb

...

xba 



: Giá trị thực tế : Giá trị lý thuyết

i

i11

i22

xb k xb k

ki

2

y(

xba

...

min



i

i11

)xb ki

k

n  1i 

203

II.HỒI QUI TUYẾN TÍNH BỘI

Ví dụ, Tốc độ tăng nền kinh tế (Y) phụ thuộc vào tốc độ tăng của nông nghiệp (X1), tốc độ tăng trưởng của kim ngạch xuất khẩu (X2) và tỷ lệ lạm phát (X3) được thu thập ở 48 nước:

Y(%) 1,3 1,0 0,4 4,9 9,8 -2,1 2,0 5,8 5,2 -1,1 0,2 1,1 -12,0 -1,6 0,5 2,2

NN(%) 3,4 1,4 0,1 1,8 5,6 2,2 2,3 3,0 2,9 -2,3 0,3 1,4 4,8 -0,4 1,9 -3,5

XK(%) -2,7 -6,0 -3,6 13,6 27,3 2,6 -9,5 4,4 9,2 -6,3 12,0 -7,2 -5,5 -2,5 1,6 4,7

LP(%) 13,0 10,5 15,9 3,2 5,4 5,2 8,7 1,4 3,0 14,9 20,3 19,8 8,6 11,3 19,0 1,9

Y(%) 8,0 6,5 0,2 7,8 2,5 -0,2 6,1 2,9 4,1 -5,0 2,1 7,7 9,3 -1,7 5,8 3,9

NN(%) 3,1 3,3 0,1 5,3 2,3 3,1 10,3 -0,6 2,3 1,2 2,7 3,0 3,3 2,0 4,7 -3,9

XK(%) 10,9 -0,6 8,4 10,4 4,9 7,9 -19,0 5,4 8,7 -2,0 5,6 2,0 6,2 -1,7 -0,2 -2,5

LP(%) 37,3 8,9 29,5 8,1 22,6 20,2 -1,3 7,5 9,5 1,1 11,2 8,9 7,5 18,2 2,1 3,4

Y(%) 5,6 6,9 -4,6 -2,6 1,1 4,6 -0,6 8,2 4,1 12,6 4,1 0,6 2,0 0,0 -2,6 -3,4

NN(%) 3,9 1,3 0,8 1,7 3,9 3,0 2,5 1,9 0,9 7,9 2,8 2,8 0,5 0,4 -1,3 7,9

XK(%) 6,4 11,6 -9,8 -6,6 3,8 -3,5 2,0 3,8 1,3 11,7 -0,9 -2,1 -3,1 6,9 3,4 -7,9

LP(%) 13,9 6,4 21,5 6,7 7,7 8,6 11,5 7,8 5,6 3,8 9,9 23,3 33,5 32,6 7,7 45,4

204

II.HỒI QUI TUYẾN TÍNH BỘI

205

II.HỒI QUI TUYẾN TÍNH BỘI

2. Ý nghĩa các tham số của Hồi qui: • Dấu của i: Cho biết mối quan hệ thuận nghịch giữa Y và Xi • Độ lớn của i: Cho biết mức độ tác động mạnh, yếu của Xi đến Y • : Có ý nghĩa tùy từng trường hợp cụ thể.

3. Ước lượng hệ số i: Ước lượng sự ảnh hưởng của Xi đến Y ta(

b(

t



,1kn

2/

)S bi

 i

i

,1kn

)S a2/





206

II.HỒI QUI TUYẾN TÍNH BỘI

4. Kiểm định từng tham số hồi qui: Kiểm định Y có phụ thuộc vào biến xi hay không:

0

i

t

t

H BB

,1kn

2/

0



b S

0

bi

 i  i

:H  0  :H  1

5. Hệ số xác định: R2 là hệ số nhằm xác định sự biến động của Y phụ thuộc bao nhiêu % vào sự biến động của X1, X2, … Xk.

2

2

2

2

y(

)y

y(

yˆ(

)y

yˆ(

e

)y

i

i

)yˆ i

i

2 i

2

SST

SSR

SSE

R 

1 

SSR SST

i SSE SST

207

II.HỒI QUI TUYẾN TÍNH BỘI

6. Hệ số xác định đã điều chỉnh:

SSR

2

2

R

)(R1(1



SST

1n  ) 1kn 

)1kn/(  )1n/(  7. Kiểm định sự phù hợp của mô hình:

...

0

:H 0

 1

2

k

2

R

F

.

2

MSR MSE

)1k(n k

R1 

FF 

SSE 

),1kn(,k

SSR k/ )1k(n/  H BB 0



208

II.HỒI QUI TUYẾN TÍNH BỘI

Tóm tắt kết quả hồi qui

Tốc độ tăng kinh tế - KT(%)

Biến độc lập

ĐVT

Hệ số

P

Tốc độ tăng nông nghiệp (NN)

%

0,501

0,019

Tốc độ tăng xuất khẩu (XK)

%

0,268

0,000

Lạm phát (LP)

%

-0,105 0,055

Hệ số tự do

2,033

0,047

R2=0,37; Sig.F=0,0001, n=48

209

II.HỒI QUI TUYẾN TÍNH BỘI

Trình tự giải thích kết quả Hồi qui: • Khẳng định mô hình có ý nghĩa. Thông qua giá trị Sig.F • Trình bày mức độ ảnh hưởng của các biến độc lập đến biến phụ thuộc • Kiểm tra mức ý nghĩa thống kê của từng biến độc lập, giải thích sự ảnh hưởng của từng biến độc lập đến biến phục thuộc. Chú ý đến dấu, dấu kỳ vọng và độ lớn của hệ số hồi qui.

210

III.MỘT SỐ DẠNG HÀM

Các trường hợp mở rộng: • Biến độc lập là biến định tính: Mô hình hồi qui với biến giả • Biến phụ thuộc là biến định tính: Phân tích nhân tố • Trường hợp phương trình hồi qui phi tuyến tính đối với biến.

211

III.MỘT SỐ DẠNG HÀM

1. Một biến độc lập định tính: Hồi qui với biến giả. 1.1.Biến giả có 2 phạm trù: Xây dựng mô hình so sánh tiền lương của công nhân làm việc trong khu vực tư nhân và quốc doanh.

E(Y/D) =  + D • Y: Tiền lương • D = 1: Công nhân khu vực tư nhân • D = 0: Công nhân khu vực quốc doanh

E(Y/D=0) =  : Lương công nhân khu vực quốc doanh E(Y/D=1) = +: Lương công nhân khu vực tư nhân

212

III.MỘT SỐ DẠNG HÀM

Ví dụ:

28

32

35

27

25

37

29

34

33

30

Lương (trđ/năm)

Khu vực

0

1

1

0

0

1

0

1

1

0

D4,68,27 

213

III.MỘT SỐ DẠNG HÀM

1.2.Biến giả có 3 phạm trù: Mô hình so sánh lương công nhân khu vực tư nhân, liên doanh và quốc doanh.

E(Y/D1,D2) =  + 1D1 +2D2 • D1 = 1: Công nhân khu vực tư nhân D1 = 0: Công nhân khu vực khác • D2 = 1: Công nhân khu vực liên doanh D2 = 0: Công nhân khu vực khác E(Y/D1=1,D2=0) =  + 1: Lương CN khu vực TN E(Y/D1=0,D2=1) =  + 2: Lương CN khu vực LD : Lương CN khu vực QD E(Y/D1=0,D2=0) = 

214

III.MỘT SỐ DẠNG HÀM

1.3.Một biến giả và 1 biến định lượng: E(Y/X,D) =  + 1D1 +2X • D = 1: Công nhân khu vực tư nhân • D = 0: Công nhân khu vực quốc doanh • X : Bậc thợ của công nhân

Lương trung bình công nhân khu vực tư nhân

E(Y/X,D=0) =  + 2X:

Lương trung bình công nhân khu vực quốc doanh

E(Y/X,D=1) = (+1) + 2X:

215

III.MỘT SỐ DẠNG HÀM

2. Hàm log – log: Xét hàm Cobb – Douglas:

Y

UeLK 2

1 

lnYln

Kln



ULln 

 1

2

• Y: Sản lượng • K: Vốn • L: Lao động • 1+2: Đo lường hiệu quả theo qui mô

• 1+2=1: Hiệu quả không đổi theo qui mô • 1+2<1: Hiệu quả giảm theo qui mô • 1+2=1: Hiệu quả tăng theo qui mô

216

III.MỘT SỐ DẠNG HÀM

Ý nghĩa của hệ số 1, 2





 1

YK

 2

YL

YdY KdK

YdY LdL

• 1: Hệ số co giãn riêng phần của sản lượng theo vốn. Đo lường % biến động của sản lượng nếu vốn tăng lên 1% đơn vị. • 2: Hệ số co giãn riêng phần của sản lượng theo lao động. Đo lường % biến động của sản lượng nếu lao động tăng lên 1% đơn vị.

217

III.MỘT SỐ DẠNG HÀM

Ví dụ: Nông nghiệp của Đài Loan 1957 – 1972: • lnY = -3,34 + 0,49lnK + 1,50lnL • Y: GNP (triệu USD) • K: Vốn (triệu USD) • L: Ngày công lao động (triệu ngày)

Ví dụ: Hàm cầu lượng cà phê: • lnQ = 0,78 - 0,25lnPcà phê + 0,38lnPtrà • Q: Lượng cà phê sử dụng mỗi ngày (cân Anh) • Pcà phê: Giá cà phê/cân Anh • Ptrà: Giá trà/cân Anh

218

III.MỘT SỐ DẠNG HÀM

3. Mô hình log – lin:

Yln

UX





YdY dX

• : Đo lường 100% thay đổi của Y khi X tăng lên 1 đơn vị

Ví dụ: GDP đầu người giai đoạn 1969 – 1983 • ln(GDP) = 6,9636 + 0,0269t • GDP tăng trưởng 2,69% mỗi năm • t=0 (1969): GDP 1.057 tỷ USD

219

III.MỘT SỐ DẠNG HÀM

4. Mô hình lin - log:

Y



UXln 



dY XdX

• : Đo lường 1% thay đổi của Y khi x tăng lên 1%

Ví dụ: Mô hình GNP và lượng cung tiền: • Y = -16.329 + 2.584,8lnX • Y: GNP (tỷ USD) • X: Lượng cung tiền (tỷ USD) • Nếu cung tiền tăng 1% thì GNP tăng 25,848 tỷ USD

220

III.MỘT SỐ DẠNG HÀM

5. Mô hình nghịch đảo:

Y

xU

Y





1 X

Đường cong phillips: • Y: Tỷ lệ thay đổi của tiền lương • Y: Tỷ lệ thất nghiệp Ví dụ: Dữ liệu của Anh 1950 – 1966 • Y = -1,4282 + 8,7243 (1/X) • Khi tỷ lệ thất nghiệp tăng đến vô hạn, % giảm trong tiền lương sẽ không vượt quá 1,43%

221

www.nguyenngoclam.com

222