Chương 6: HỒI QUY VÀ TƯƠNG QUAN
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
1. Mối
liên hệ giữa các hiện tượng KT-XH với
1.1. Mối liên hệ giữa các hiện tượng KT-XH
phương pháp hồi quy và tương quan
2. Liên hệ tương quan tuyến tính giữa hai tiêu
2 2 loloạạii liênliên hhệệ
thức
3. Liên hệ tương quan phi tuyến tính giữa hai tiêu
thức
LiênLiên hhệệ hhààmm ssốố
LiênLiên hhệệ tương
quan tương quan
4. Liên hệ tương quan tuyến tính giữa nhiều tiêu
thức (hồi quy bội)
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
Liên hệ tương quan:
Liên hệ hàm số:
Mối liên hệ không hoàn toàn chặt chẽ giữa các hiện tượng nghiên cứu.
Mối liên hệ hoàn toàn chặt chẽ và được biểu hiện dưới dạng một hàm số y = f(x)
Ví dụ?
nghĩa là sự biến đổi của x hoàn toàn quyết định
sự thay đổi của y
Thường không biểu hiện rõ trên từng đơn vị cá biệt, do đó cần nghiên cứu hiện tượng số lớn.
Không chỉ thấy được trên toàn bộ tổng thể mà còn thấy được trên từng đơn vị riêng biệt.
liên hệ tương
Phương pháp dùng nghiên cứu mối quan là phương pháp hồi qui và tương quan.
Ví dụ: S = v.t
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
Thực chất của PP hồi quy và tương quan
1.2. Nhiệm vụ chủ yếu của PP HQ&TQ
Nhiệm vụ tổng quát:
– Xác định mô hình/hàm số
– Xác định mức độ chặt chẽ của mối liên hệ tương
quan
Là phương pháp toán học được vận dụng trong thống kê để biểu hiện và phân tích mối liên hệ tương quan giữa các hiện tượng kinh tế xã hội.
1
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
B2: Xác định hình thức, tính chất của mối liên hệ.
Nhiệm vụ cụ thể: Xác định phương trình hồi quy gồm 4 bước
- -
Hình thức: thuận hay nghịch Tính chất: Tuyến tính hay phi tuyến tính
B1: Dựa vào phân tích lý luận để giải thích sự tồn tại thực tế và bản chất của mối liên hệ:
- -
Các tiêu thức nghiên cứu có liên hệ không Xác định tiêu thức nguyên nhân, tiêu thức kết quả
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
1. Mối liên hệ giữa các hiện tượng KT-XH với PP hồi quy và tương quan
Stt
Thu nhập (x)
Nhu cầu hàng hóa (y)
B3: Xác định mô hình hồi quy biểu diễn mối liên hệ.
VD trang 201.
1
1,0
1
2
2,5
2
B4: Tính toán các tham số, giải thích ý nghĩa các tham
số.
3
3,0
2
Khảo sát ngẫu nhiên 10 khách hàng ta thu được dữ liệu sau:
4
3,5
2
b/ Đánh giá mức độ chặt chẽ của mối
liên hệ tương
5
4,0
3
quan
6
5,0
3
7
6,5
4
- Hệ số tương quan - Tỷ số tương quan.
8
7,0
6
9
9,0
6
10
10,0
7
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
ü
• Ta thấy khi thu nhập tăng nhu cầu về hàng hóa dịch vụ tăng. Tuy nhiên mức độ tăng không hoàn toàn.
Mối quan hệ giữa thu nhập và cầu hàng hóa
Đường gấp khúc trên đồ thị có xu hướng tăng dần.
• Ta xem xét mối
liên hệ tuyến tính giữa 2 tiêu thức x và y bằng cách xây dựng mô hình toán học
a ó h g n à h u ầ C
8 7 6 5 4 3 2 1 0
• Dùng đồ thị quan sát và cho nhận xét
1.0
2.5
3.0
3.5
4.0
5.0
6.5
7.0
9.0
Đướng gấp khúc vươn theo hướng từ bên trái phía dưới sang bên phải phía trên
10.0
Thu nhập bình quân
2
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Trong đường hồi qui lý thuyết : yx = a + bx
Mối quan hệ giữa thu nhập và cầu hàng hóa
Thì:
8
7
•Trên đồ thị, đường gấp khúc được gọi là đường hồi quy thực nghiệm, hình thành từ tài liệu đã cho. Đường này chưa phản ánh rõ mối liên hệ giữa 2 tiêu thức
x: Trị số của tiêu thức nguyên nhân
6
5
yx: Trị số của tiêu thức kết quả y được tính theo phương trình hồi quy
4
3
Đường thẳng đi theo cùng hướng với đường gấp khúc gọi là đường hồi quy lý thuyết được biểu hiện dưới dạng 1 hàm số yx = a + bx
a ó h g n à h u ầ C
2
a: Tham số tự do nói lên ảnh hưởng của các nguyên nhân khác ngoài x đối với y
1
b : Hệ số hồi qui nói lên ảnh hưởng của x đối với y, cụ thể mỗi khi x tăng 1 đơn vị thì y tăng bình quân b đơn vị.
0 1.0
2.5
3.0
4.0
6.5
9.0
10.0
Có vô số đường thẳng được vẽ. Chọn 1 đường thẳng cực tiểu hóa được tổng các độ lệch bình phương các chênh lệch giữa giá trị thực tế yt với giá trị yx
5.0 7.0 3.5 Thu nhập bình quân
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Phương pháp xác định các tham số của PT hồi quy
Xác định các tham số
Cách 1 : Tính a, b từ hệ phương trình
Xác định a,b dựa vào phương pháp bình phương nhỏ nhất.
Phương pháp bình phương nhỏ nhất?
∑y = na + b∑x ∑xy = a∑x + b∑x2
Tối thiểu hoá tổng bình phương các độ lệch giữa giá trị thực tế yt và giá trị điều chỉnh của biến phụ thuộc yx.
2
S
(
y
y
)
min
=
-
=
t
x
å
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
Stt
x
y
x.y
x2
(x-x)
(y-y)
(x-x)2
(y-y)2
(x-x).(y-y)
• Từ bảng tính toán trên thay số liệu vào phương
trình được hệ sau:
36 = 10 a + 51.5 b 36 = 10 a + 51.5 b 238 = 51.5 a + 341.75 b 238 = 51.5 a + 341.75 b
• Giải hệ PT ta tìm được a = 0.06195; b = 0.687 • Vậy, phương trình hồi quy có dạng • yx = 0.06195 + 0.687 x
17.2 10.8 1.0 1.0 1.0 1.0 1.0 (2.6) 6.8 (4.2) 2.0 2.5 5.0 6.3 2.0 (1.6) 7.0 2.6 4.2 (2.7) 3.0 3.0 6.0 9.0 2.0 (1.6) 4.6 2.6 3.4 (2.2) 4.0 3.5 7.0 12.3 2.0 (1.6) 2.7 2.6 2.6 (1.7) 5.0 4.0 12.0 16.0 3.0 (0.6) 1.3 0.4 0.7 (1.2) 6.0 5.0 15.0 25.0 3.0 (0.6) 0.0 0.4 0.1 (0.2) 7.0 6.5 26.0 42.3 4.0 0.4 1.8 0.2 0.5 1.4 8.0 7.0 42.0 49.0 6.0 2.4 3.4 5.8 4.4 1.9 9.0 9.0 54.0 81.0 6.0 2.4 14.8 5.8 9.2 3.9 7.0 3.4 23.5 4.9 10.0 10.0 70.0 100.0 11.6 16.5
-
51.5
36.0
238.0
341.75
-
76.525
38.4
52.6
3
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
• a = 0.06195 là mức độ xuất phát đầu tiên của
Cách 2 : Tính a, b từ công thức trong sách trang 206
đường hồi quy lý thuyết, không phụ thuộc vào x, nói lên ảnh hưởng của các nhân tố khác tới nhu cầu hàng hóa
Kết quả tương tự
• b = 0.687 là hệ số hồi quy, nói lên ảnh hưởng của tiêu thức nguyên nhân x đối với tiêu thức kết quả y.
• Có nghĩa là: Nếu thu nhập bình quân 1 tháng tăng lên 1 triệu thì nhu cầu hàng hóa tăng thêm 0.687
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
• Hệ số tương quan (rxy)
Tác dụng của r
Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính (xem xét giữa tiêu thức nguyên nhân và tiêu thức kết quả có mối liên hệ với nhau đến chứng mực nào).
x
x
y
y
-
´
-
(
)
)
– Xác định cường độ của mối liên hệ – Xác định phương hướng của mối liên hệ
i
i
å
Trong đó độ lệch chuẩn được tính
r
=
xy
2
2
x
x
.
(
y
y
)
-
-
(
)
i
i
å
( å
2
x
x
(
)
• r > 0 : liên hệ tương quan thuận • r < 0 : liên hệ tương quan nghịch
=
d x
. yx
- n
r
=
xy
y
y
y
- Dùng nhiều trong phân tích và dự đoán TK
(
) 2
=
d y
x
- n
r
b
.
=
xy
xy - . dd x d d
y
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức
• Tiếp theo ví dụ tại bảng 6.1, ta tính rxy
Tính chất của r : -1 ≤ rxy ≤ 1
97,0
=
=
=
=
r xy
15,58,23 - 766,2
6,3 ´ 959,1
26,5 42,5
´
xy yx . - . ss y x
• Trong đó:
+ rxy > 0 : Giữa x và y có mối liên quan thuận + rxy = ± 1 : Giữa x và y có mối liên hệ hàm số + rxy = 0 : Giữa x và y không có mối liên hệ
tương quan tuyến tính
x
x
,76
525
(
)
,2
766
d
=
=
=
- n
10
+ rxy càng tiến gần tới ± 1 : Mối liên hệ giữa x và
y càng chặt chẽ.
y
y
(
)
,1
959
d
=
=
=
- n
4,38 10
4
2 x 2 y
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
Lập bảng để tính các trị số: ∑x; ∑y; ∑xy; ∑x2; ∑x3; ∑x4…
Phương trình parabol bậc 2
yx = a + bx + cx2
Xác định a,b,c:
PT barabon bậc 2 được dùng trong trường hợp khi tiêu thức nguyên nhân tăng (giảm) với lượng đều nhau thì tiêu thức kết quả biến động với lượng không đều.
∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3)
Ví dụ: Liên hệ giữa tuổi nghề và năng suất lao động; lượng phân bón và năng suất thu hoạch; thu nhập và cầu hàng hóa…
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
70
60
• Ví dụ: Có tài liệu về tuổi nghề và năng suất lao
động tại Công ty X như sau:
50
40
Series1
Poly. (Series1)
30
3
6
9
12
15
18
21
24
27
30
33
36
Tuổi nghề (Năm)
20
10
0
12
23
35
44
51
55
58
60
57
52
47
38
NSLĐ (SP)
1
2
3
4
5
6
7
8
9
10
11 12
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
x (tuổi nghề)
y (NSLĐ)
x*x
x*y
x*x*x
x*x*y
x*x*x*x
y*y
∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3)
532 = 12a + 234b + 5850c 11448 = 234a + 5850b + 164268c 288324 = 5850a + 164268b + 4917510c
yx = -4,5 + 5,5x – 0,1x2
5
3 12 9 36 27 108 81 144 6 23 36 138 216 828 1296 529 9 35 81 315 729 2835 6561 1225 12 44 144 528 1728 6336 20736 1936 15 51 225 765 3375 11475 50625 2601 18 55 324 990 5832 17820 104976 3025 21 58 441 1218 9261 25578 194481 3364 24 60 576 1440 13824 34560 331776 3600 27 57 729 1539 19683 41553 531441 3249 30 52 900 1560 27000 46800 810000 2704 33 47 1089 1551 35937 51183 1185921 2209 36 38 1296 1368 46656 49248 1679616 1444 5850 234 532 11448 164268 288324 4917510 26030
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
Phương trình hypebol
ba .+= .+= ba
yx yx
1 1 x x
Phương trình hypebol được dùng trong trường hợp trị số của tiêu thức nguyên nhân tăng thì trị số của tiêu thức kết quả giảm với tốc độ không đều
Ví dụ: liên hệ giữa sản lượng và giá thành đơn vị sản phẩm, liên hệ giữa mức tiêu thụ hàng hóa với tỷ suất phí lưu thông…
y
na
b
=
+
å
1 x
Xác định a, b dựa vào hệ phương trình sau:
.
b
ay =
1 x
1 å å + x
1 2 x
ì å ïï í ï å ï î
12
VD: Nghiên cứu mối liên hệ giữa mức tiêu thụ hàng hóa với tỷ suất phí lưu thông
10
10
9.2
8.1
8
7.9
7.8
75
90
120
150
180
220
300
450
600
800
7
Mức tiêu thụ (triệu)
6.1
6
TSPLT
5.8
5.3
5
4
10.0
9.2
8.1
7.8
7.9
7.0
6.1
5.8
5.3
5.0
2
Tỷ suất phí lưu thông (%)
0
75
90
120
150
180
220
300
450
600
800
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
Tỷ số tương quan (η) - êta
2
2
2
(
y
y
)
y
y
-
å
Trong đó :
=
=
-
2 d y
n
å n
å n
æ ç ç è
ö ÷ ÷ ø
2
Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan phi tuyến tính (giống như ý nghĩa của hệ số tương quan r).
(
y
y
)
-
x
å
=
2 d )( xy
n
=
-
2 ddd xy (
2 xy
2 y
)
1
h
=
=
=
-
Quan hệ giữa ba loại phương sai
2 d xy 2 d y
2 2 - dd xy )( y 2 d y
2 d xy )( 2 d y
6
3. LH tương quan phi tuyến tính giữa 2 tiêu thức
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
Tính chất của (η) - êta
Trong thực tế không phải chỉ có tiêu thức x ảnh hưởng đến y, sự thay đổi của y sẽ được giải thích toàn diện hơn khi nếu đặt trong mối quan hệ với nhiều tiêu thức nguyên nhân. Đây là phương pháp phân tích hồi quy bội.
Tỷ số tương quan có giá trị nằm trong khoảng [0 ; 1]
Phương trình hồi quy:
0 ≤ η ≤ 1
Y
a
=
+
+
... ++
xa 11
xa 22
0
nn xa
Trong đó:
x1, x2,…,xn: là các nhân tố ảnh hưởng, có liên hệ tương quan với y
Nếu η = 0 : x, y không có mối liên hệ tương quan Nếu η = 1 : x, y có liên hệ hàm số Nếu η càng gần 1 thì liên hệ tương quan càng chặt chẽ
• a1, a2, …, an: là hệ số hồi quy • a0: giá trị ước lượng của tiêu thức y khi x=0
•
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
• Xác định hệ số a dựa vào hệ phương trình
• Với 2 tiêu thức nguyên nhân (x, z). • Phương trình hồi quy tuyến tính có dạng
y
a
x
=
0
x 1
2
x 2
n
n
bx
cz
a +=
+
Yxz
a
a
=
å ... ++
yx 1
a 0
å x + 1
a 1
2
n
xx 1 n
Với a = a0; b = a1; c = a2. Các tham số a; b; c được tính từ hệ PT sau:
a
x
... ++ å a
x
a
=
+
+
... ++
0
2
a 1
xx 21
2
2 2
n
xx 2
n
ana + 1 å å
å a + å 2 x + 1 å
xx 21 å
å å
y
na
z
b
=
a
a
a
=
+
+
... ++
yx n
0
x n
a 1
xx 1
n
2
xx 2
n
2 x n
n
å å å yx 2 ........ å
å
å
å
å
2
xy
a
x
zx
=
2
yz
a
xz
c
z
=
+
å å å
åå x c + + åå bx + + åå bz +
å c å
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
• Với 3 tiêu thức nguyên nhân (x, z, v). • Phương trình hồi quy tuyến tính có dạng
Hệ số tương quan bội: Đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính đa biến.
Công thức:
bx
cz
dv
a +=
+
+
Yxzv
R R
= =
1 1 - -
xxy xxy 21 21
x ... ... x n n
2 2 d d ( xxy x ... ( ... ) ) xxy x n n 21 21 2 2 d d y y
2
2 ) )
= =
x n n 2
å å y ( y ( y y - - xx x ... xx ... 1 1 - - 21 21 å å 2 y ( y ( ) y y ) - -
7
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
Có giá trị nằm trong khoảng [0 ; 1]
• Cụ thể, trường hợp có liên hệ tương quan giữa 3 tiêu thức x, y, z (trong đó y là tiêu thức kết quả), hệ số tương quan bội sẽ là:
• Tính chất của hệ số tương quan bội • •
0 ≤ Ryx1x2…xn ≤ 1
• Nếu R = 0 : Giữa y và các x1, x2,…, xn không có
)
R
1
=
-
xyz
liên hệ tuyến tính.
2 d xz ( y 2 d y
• Nếu R = 1 : Giữa y và các x1, x2,…, xn có liên hệ
2
y
y
-
hàm số.
1
=
-
) 2
(
i y
xy y )
-
å ( å
• R càng gần 1, mối liên hệ giữa y và các x1,
x2,…, xn càng chặt chẽ.
4. LH tương quan tuyến tính giữa nhiều tiêu thức (hồi quy bội)
• Hệ số tương quan riêng giữa x và y (loại trừ
ảnh hưởng của z)
-
r xy
r zx
=
r xy
z )(
-
( 1
)
2 r xy
2 r xz
-
r zy
r xz
=
r zy
x )(
-
( 1
r ´ yx ( ) 1 -´ r ´ xyz ( ) 1 -´
)2
2 r xy
r xz
8