Chương 6: HỒI QUY VÀ TƯƠNG QUAN

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

1. Mối

liên hệ giữa các hiện tượng KT-XH với

1.1. Mối liên hệ giữa các hiện tượng KT-XH

phương pháp hồi quy và tương quan

2. Liên hệ tương quan tuyến tính giữa hai tiêu

2 2 loloạạii liênliên hhệệ

thức

3. Liên hệ tương quan phi tuyến tính giữa hai tiêu

thức

LiênLiên hhệệ hhààmm ssốố

LiênLiên hhệệ tương

quan tương quan

4. Liên hệ tương quan tuyến tính giữa nhiều tiêu

thức (hồi quy bội)

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

Liên hệ tương quan:

Liên hệ hàm số:

Mối liên hệ không hoàn toàn chặt chẽ giữa các hiện tượng nghiên cứu.

Mối liên hệ hoàn toàn chặt chẽ và được biểu hiện dưới dạng một hàm số y = f(x)

Ví dụ?

nghĩa là sự biến đổi của x hoàn toàn quyết định

sự thay đổi của y

Thường không biểu hiện rõ trên từng đơn vị cá biệt, do đó cần nghiên cứu hiện tượng số lớn.

Không chỉ thấy được trên toàn bộ tổng thể mà còn thấy được trên từng đơn vị riêng biệt.

liên hệ tương

Phương pháp dùng nghiên cứu mối quan là phương pháp hồi qui và tương quan.

Ví dụ: S = v.t

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

Thực chất của PP hồi quy và tương quan

1.2. Nhiệm vụ chủ yếu của PP HQ&TQ

Nhiệm vụ tổng quát:

– Xác định mô hình/hàm số

– Xác định mức độ chặt chẽ của mối liên hệ tương

quan

Là phương pháp toán học được vận dụng trong thống kê để biểu hiện và phân tích mối liên hệ tương quan giữa các hiện tượng kinh tế xã hội.

1

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

B2: Xác định hình thức, tính chất của mối liên hệ.

Nhiệm vụ cụ thể: Xác định phương trình hồi quy gồm 4 bước

- -

Hình thức: thuận hay nghịch Tính chất: Tuyến tính hay phi tuyến tính

B1: Dựa vào phân tích lý luận để giải thích sự tồn tại thực tế và bản chất của mối liên hệ:

- -

Các tiêu thức nghiên cứu có liên hệ không Xác định tiêu thức nguyên nhân, tiêu thức kết quả

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan

Stt

Thu nhập (x)

Nhu cầu hàng hóa (y)

B3: Xác định mô hình hồi quy biểu diễn mối liên hệ.

VD trang 201.

1

1,0

1

2

2,5

2

B4: Tính toán các tham số, giải thích ý nghĩa các tham

số.

3

3,0

2

Khảo sát ngẫu nhiên 10 khách hàng ta thu được dữ liệu sau:

4

3,5

2

b/ Đánh giá mức độ chặt chẽ của mối

liên hệ tương

5

4,0

3

quan

6

5,0

3

7

6,5

4

- Hệ số tương quan - Tỷ số tương quan.

8

7,0

6

9

9,0

6

10

10,0

7

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

ü

• Ta thấy khi thu nhập tăng nhu cầu về hàng hóa dịch vụ tăng. Tuy nhiên mức độ tăng không hoàn toàn.

Mối quan hệ giữa thu nhập và cầu hàng hóa

Đường gấp khúc trên đồ thị có xu hướng tăng dần.

• Ta xem xét mối

liên hệ tuyến tính giữa 2 tiêu thức x và y bằng cách xây dựng mô hình toán học

a ó h g n à h u ầ C

8 7 6 5 4 3 2 1 0

• Dùng đồ thị quan sát và cho nhận xét

1.0

2.5

3.0

3.5

4.0

5.0

6.5

7.0

9.0

Đướng gấp khúc vươn theo hướng từ bên trái phía dưới sang bên phải phía trên

10.0

Thu nhập bình quân

2

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

Trong đường hồi qui lý thuyết : yx = a + bx

Mối quan hệ giữa thu nhập và cầu hàng hóa

Thì:

8

7

•Trên đồ thị, đường gấp khúc được gọi là đường hồi quy thực nghiệm, hình thành từ tài liệu đã cho. Đường này chưa phản ánh rõ mối liên hệ giữa 2 tiêu thức

x: Trị số của tiêu thức nguyên nhân

6

5

yx: Trị số của tiêu thức kết quả y được tính theo phương trình hồi quy

4

3

Đường thẳng đi theo cùng hướng với đường gấp khúc gọi là đường hồi quy lý thuyết được biểu hiện dưới dạng 1 hàm số yx = a + bx

a ó h g n à h u ầ C

2

a: Tham số tự do nói lên ảnh hưởng của các nguyên nhân khác ngoài x đối với y

1

b : Hệ số hồi qui nói lên ảnh hưởng của x đối với y, cụ thể mỗi khi x tăng 1 đơn vị thì y tăng bình quân b đơn vị.

0 1.0

2.5

3.0

4.0

6.5

9.0

10.0

Có vô số đường thẳng được vẽ. Chọn 1 đường thẳng cực tiểu hóa được tổng các độ lệch bình phương các chênh lệch giữa giá trị thực tế yt với giá trị yx

5.0 7.0 3.5 Thu nhập bình quân

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

Phương pháp xác định các tham số của PT hồi quy

Xác định các tham số

Cách 1 : Tính a, b từ hệ phương trình

Xác định a,b dựa vào phương pháp bình phương nhỏ nhất.

Phương pháp bình phương nhỏ nhất?

∑y = na + b∑x ∑xy = a∑x + b∑x2

Tối thiểu hoá tổng bình phương các độ lệch giữa giá trị thực tế yt và giá trị điều chỉnh của biến phụ thuộc yx.

2

S

(

y

y

)

min

=

-

=

t

x

å

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

Stt

x

y

x.y

x2

(x-x)

(y-y)

(x-x)2

(y-y)2

(x-x).(y-y)

• Từ bảng tính toán trên thay số liệu vào phương

trình được hệ sau:

36 = 10 a + 51.5 b 36 = 10 a + 51.5 b 238 = 51.5 a + 341.75 b 238 = 51.5 a + 341.75 b

• Giải hệ PT ta tìm được a = 0.06195; b = 0.687 • Vậy, phương trình hồi quy có dạng • yx = 0.06195 + 0.687 x

17.2 10.8 1.0 1.0 1.0 1.0 1.0 (2.6) 6.8 (4.2) 2.0 2.5 5.0 6.3 2.0 (1.6) 7.0 2.6 4.2 (2.7) 3.0 3.0 6.0 9.0 2.0 (1.6) 4.6 2.6 3.4 (2.2) 4.0 3.5 7.0 12.3 2.0 (1.6) 2.7 2.6 2.6 (1.7) 5.0 4.0 12.0 16.0 3.0 (0.6) 1.3 0.4 0.7 (1.2) 6.0 5.0 15.0 25.0 3.0 (0.6) 0.0 0.4 0.1 (0.2) 7.0 6.5 26.0 42.3 4.0 0.4 1.8 0.2 0.5 1.4 8.0 7.0 42.0 49.0 6.0 2.4 3.4 5.8 4.4 1.9 9.0 9.0 54.0 81.0 6.0 2.4 14.8 5.8 9.2 3.9 7.0 3.4 23.5 4.9 10.0 10.0 70.0 100.0 11.6 16.5

-

51.5

36.0

238.0

341.75

-

76.525

38.4

52.6

3

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

• a = 0.06195 là mức độ xuất phát đầu tiên của

Cách 2 : Tính a, b từ công thức trong sách trang 206

đường hồi quy lý thuyết, không phụ thuộc vào x, nói lên ảnh hưởng của các nhân tố khác tới nhu cầu hàng hóa

Kết quả tương tự

• b = 0.687 là hệ số hồi quy, nói lên ảnh hưởng của tiêu thức nguyên nhân x đối với tiêu thức kết quả y.

• Có nghĩa là: Nếu thu nhập bình quân 1 tháng tăng lên 1 triệu thì nhu cầu hàng hóa tăng thêm 0.687

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

• Hệ số tương quan (rxy)

Tác dụng của r

Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính (xem xét giữa tiêu thức nguyên nhân và tiêu thức kết quả có mối liên hệ với nhau đến chứng mực nào).

x

x

y

y

-

´

-

(

)

)

– Xác định cường độ của mối liên hệ – Xác định phương hướng của mối liên hệ

i

i

å

Trong đó độ lệch chuẩn được tính

r

=

xy

2

2

x

x

.

(

y

y

)

-

-

(

)

i

i

å

( å

2

x

x

(

)

• r > 0 : liên hệ tương quan thuận • r < 0 : liên hệ tương quan nghịch

=

d x

. yx

- n

r

=

xy

y

y

y

- Dùng nhiều trong phân tích và dự đoán TK

(

) 2

=

d y

x

- n

r

b

.

=

xy

xy - . dd x d d

y

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức

• Tiếp theo ví dụ tại bảng 6.1, ta tính rxy

Tính chất của r : -1 ≤ rxy ≤ 1

97,0

=

=

=

=

r xy

15,58,23 - 766,2

6,3 ´ 959,1

26,5 42,5

´

xy yx . - . ss y x

• Trong đó:

+ rxy > 0 : Giữa x và y có mối liên quan thuận + rxy = ± 1 : Giữa x và y có mối liên hệ hàm số + rxy = 0 : Giữa x và y không có mối liên hệ

tương quan tuyến tính

x

x

,76

525

(

)

,2

766

d

=

=

=

- n

10

+ rxy càng tiến gần tới ± 1 : Mối liên hệ giữa x và

y càng chặt chẽ.

y

y

(

)

,1

959

d

=

=

=

- n

4,38 10

4

2 x 2 y

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

Lập bảng để tính các trị số: ∑x; ∑y; ∑xy; ∑x2; ∑x3; ∑x4…

Phương trình parabol bậc 2

yx = a + bx + cx2

Xác định a,b,c:

PT barabon bậc 2 được dùng trong trường hợp khi tiêu thức nguyên nhân tăng (giảm) với lượng đều nhau thì tiêu thức kết quả biến động với lượng không đều.

∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3)

Ví dụ: Liên hệ giữa tuổi nghề và năng suất lao động; lượng phân bón và năng suất thu hoạch; thu nhập và cầu hàng hóa…

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

70

60

• Ví dụ: Có tài liệu về tuổi nghề và năng suất lao

động tại Công ty X như sau:

50

40

Series1

Poly. (Series1)

30

3

6

9

12

15

18

21

24

27

30

33

36

Tuổi nghề (Năm)

20

10

0

12

23

35

44

51

55

58

60

57

52

47

38

NSLĐ (SP)

1

2

3

4

5

6

7

8

9

10

11 12

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

x (tuổi nghề)

y (NSLĐ)

x*x

x*y

x*x*x

x*x*y

x*x*x*x

y*y

∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3)

532 = 12a + 234b + 5850c 11448 = 234a + 5850b + 164268c 288324 = 5850a + 164268b + 4917510c

yx = -4,5 + 5,5x – 0,1x2

5

3 12 9 36 27 108 81 144 6 23 36 138 216 828 1296 529 9 35 81 315 729 2835 6561 1225 12 44 144 528 1728 6336 20736 1936 15 51 225 765 3375 11475 50625 2601 18 55 324 990 5832 17820 104976 3025 21 58 441 1218 9261 25578 194481 3364 24 60 576 1440 13824 34560 331776 3600 27 57 729 1539 19683 41553 531441 3249 30 52 900 1560 27000 46800 810000 2704 33 47 1089 1551 35937 51183 1185921 2209 36 38 1296 1368 46656 49248 1679616 1444 5850 234 532 11448 164268 288324 4917510 26030

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

Phương trình hypebol

ba .+= .+= ba

yx yx

1 1 x x

Phương trình hypebol được dùng trong trường hợp trị số của tiêu thức nguyên nhân tăng thì trị số của tiêu thức kết quả giảm với tốc độ không đều

Ví dụ: liên hệ giữa sản lượng và giá thành đơn vị sản phẩm, liên hệ giữa mức tiêu thụ hàng hóa với tỷ suất phí lưu thông…

y

na

b

=

+

å

1 x

Xác định a, b dựa vào hệ phương trình sau:

.

b

ay =

1 x

1 å å + x

1 2 x

ì å ïï í ï å ï î

12

VD: Nghiên cứu mối liên hệ giữa mức tiêu thụ hàng hóa với tỷ suất phí lưu thông

10

10

9.2

8.1

8

7.9

7.8

75

90

120

150

180

220

300

450

600

800

7

Mức tiêu thụ (triệu)

6.1

6

TSPLT

5.8

5.3

5

4

10.0

9.2

8.1

7.8

7.9

7.0

6.1

5.8

5.3

5.0

2

Tỷ suất phí lưu thông (%)

0

75

90

120

150

180

220

300

450

600

800

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

Tỷ số tương quan (η) - êta

2

2

2

(

y

y

)

y

y

-

å

Trong đó :

=

=

-

2 d y

n

å n

å n

æ ç ç è

ö ÷ ÷ ø

2

Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan phi tuyến tính (giống như ý nghĩa của hệ số tương quan r).

(

y

y

)

-

x

å

=

2 d )( xy

n

=

-

2 ddd xy (

2 xy

2 y

)

1

h

=

=

=

-

Quan hệ giữa ba loại phương sai

2 d xy 2 d y

2 2 - dd xy )( y 2 d y

2 d xy )( 2 d y

6

3. LH tương quan phi tuyến tính giữa 2 tiêu thức

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

Tính chất của (η) - êta

Trong thực tế không phải chỉ có tiêu thức x ảnh hưởng đến y, sự thay đổi của y sẽ được giải thích toàn diện hơn khi nếu đặt trong mối quan hệ với nhiều tiêu thức nguyên nhân. Đây là phương pháp phân tích hồi quy bội.

Tỷ số tương quan có giá trị nằm trong khoảng [0 ; 1]

Phương trình hồi quy:

0 ≤ η ≤ 1

Y

a

=

+

+

... ++

xa 11

xa 22

0

nn xa

Trong đó:

x1, x2,…,xn: là các nhân tố ảnh hưởng, có liên hệ tương quan với y

Nếu η = 0 : x, y không có mối liên hệ tương quan Nếu η = 1 : x, y có liên hệ hàm số Nếu η càng gần 1 thì liên hệ tương quan càng chặt chẽ

• a1, a2, …, an: là hệ số hồi quy • a0: giá trị ước lượng của tiêu thức y khi x=0

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

• Xác định hệ số a dựa vào hệ phương trình

• Với 2 tiêu thức nguyên nhân (x, z). • Phương trình hồi quy tuyến tính có dạng

y

a

x

=

0

x 1

2

x 2

n

n

bx

cz

a +=

+

Yxz

a

a

=

å ... ++

yx 1

a 0

å x + 1

a 1

2

n

xx 1 n

Với a = a0; b = a1; c = a2. Các tham số a; b; c được tính từ hệ PT sau:

a

x

... ++ å a

x

a

=

+

+

... ++

0

2

a 1

xx 21

2

2 2

n

xx 2

n

ana + 1 å å

å a + å 2 x + 1 å

xx 21 å

å å

y

na

z

b

=

a

a

a

=

+

+

... ++

yx n

0

x n

a 1

xx 1

n

2

xx 2

n

2 x n

n

å å å yx 2 ........ å

å

å

å

å

2

xy

a

x

zx

=

2

yz

a

xz

c

z

=

+

å å å

åå x c + + åå bx + + åå bz +

å c å

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

• Với 3 tiêu thức nguyên nhân (x, z, v). • Phương trình hồi quy tuyến tính có dạng

Hệ số tương quan bội: Đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính đa biến.

Công thức:

bx

cz

dv

a +=

+

+

Yxzv

R R

= =

1 1 - -

xxy xxy 21 21

x ... ... x n n

2 2 d d ( xxy x ... ( ... ) ) xxy x n n 21 21 2 2 d d y y

2

2 ) )

= =

x n n 2

å å y ( y ( y y - - xx x ... xx ... 1 1 - - 21 21 å å 2 y ( y ( ) y y ) - -

7

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

Có giá trị nằm trong khoảng [0 ; 1]

• Cụ thể, trường hợp có liên hệ tương quan giữa 3 tiêu thức x, y, z (trong đó y là tiêu thức kết quả), hệ số tương quan bội sẽ là:

• Tính chất của hệ số tương quan bội • •

0 ≤ Ryx1x2…xn ≤ 1

• Nếu R = 0 : Giữa y và các x1, x2,…, xn không có

)

R

1

=

-

xyz

liên hệ tuyến tính.

2 d xz ( y 2 d y

• Nếu R = 1 : Giữa y và các x1, x2,…, xn có liên hệ

2

y

y

-

hàm số.

1

=

-

) 2

(

i y

xy y )

-

å ( å

• R càng gần 1, mối liên hệ giữa y và các x1,

x2,…, xn càng chặt chẽ.

4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)

• Hệ số tương quan riêng giữa x và y (loại trừ

ảnh hưởng của z)

-

r xy

r zx

=

r xy

z )(

-

( 1

)

2 r xy

2 r xz

-

r zy

r xz

=

r zy

x )(

-

( 1

r ´ yx ( ) 1 -´ r ´ xyz ( ) 1 -´

)2

2 r xy

r xz

8