Chương 6: HỒI QUY VÀ TƯƠNG QUAN<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với<br />
phương pháp hồi quy và tương quan<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
1.1. Mối liên hệ giữa các hiện tượng KT-XH<br />
<br />
2. Liên hệ tương quan tuyến tính giữa hai tiêu<br />
thức<br />
<br />
2 loại liên hệ<br />
loạ<br />
<br />
3. Liên hệ tương quan phi tuyến tính giữa hai tiêu<br />
thức<br />
4. Liên hệ tương quan tuyến tính giữa nhiều tiêu<br />
thức (hồi quy bội)<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
Liên hệ hàm số:<br />
<br />
Liên hệ hàm số<br />
<br />
Liên hệ tương quan<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
Liên hệ tương quan:<br />
<br />
Mối liên hệ hoàn toàn chặt chẽ và được biểu hiện dưới<br />
dạng một hàm số y = f(x)<br />
<br />
Mối liên hệ không hoàn toàn chặt chẽ giữa các hiện<br />
tượng nghiên cứu.<br />
<br />
nghĩa là sự biến đổi của x hoàn toàn quyết định<br />
sự thay đổi của y<br />
<br />
Ví dụ?<br />
<br />
Không chỉ thấy được trên toàn bộ tổng thể mà còn<br />
thấy được trên từng đơn vị riêng biệt.<br />
<br />
Thường không biểu hiện rõ trên từng đơn vị cá biệt,<br />
do đó cần nghiên cứu hiện tượng số lớn.<br />
Phương pháp dùng nghiên cứu mối liên hệ tương<br />
quan là phương pháp hồi qui và tương quan.<br />
<br />
Ví dụ: S = v.t<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
Thực chất của PP hồi quy và tương quan<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
1.2. Nhiệm vụ chủ yếu của PP HQ&TQ<br />
<br />
– Xác định mô hình/hàm số<br />
<br />
Nhiệm vụ tổng quát:<br />
<br />
– Xác định mức độ chặt chẽ của mối liên hệ tương<br />
<br />
Là phương pháp toán học được vận dụng<br />
trong thống kê để biểu hiện và phân tích mối<br />
liên hệ tương quan giữa các hiện tượng kinh<br />
tế xã hội.<br />
<br />
quan<br />
<br />
1<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
Nhiệm vụ cụ thể: Xác định phương trình hồi<br />
quy gồm 4 bước<br />
B1: Dựa vào phân tích lý luận để giải thích sự<br />
tồn tại thực tế và bản chất của mối liên hệ:<br />
-<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
B2: Xác định hình thức, tính chất của mối liên hệ.<br />
-<br />
<br />
Hình thức: thuận hay nghịch<br />
Tính chất: Tuyến tính hay phi tuyến tính<br />
<br />
Các tiêu thức nghiên cứu có liên hệ không<br />
Xác định tiêu thức nguyên nhân, tiêu thức kết quả<br />
<br />
1. Mối liên hệ giữa các hiện tượng KT-XH với PP<br />
hồi quy và tương quan<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
Stt<br />
<br />
1,0<br />
<br />
1<br />
<br />
2<br />
<br />
2,5<br />
<br />
2<br />
<br />
3<br />
<br />
3,0<br />
<br />
2<br />
<br />
4<br />
<br />
3,5<br />
<br />
2<br />
<br />
5<br />
<br />
4,0<br />
<br />
3<br />
<br />
5,0<br />
<br />
3<br />
<br />
7<br />
<br />
6,5<br />
<br />
4<br />
<br />
8<br />
<br />
7,0<br />
<br />
6<br />
<br />
9,0<br />
<br />
6<br />
<br />
10<br />
<br />
b/ Đánh giá mức độ chặt chẽ của mối liên hệ tương<br />
quan<br />
<br />
1<br />
<br />
9<br />
<br />
B4: Tính toán các tham số, giải thích ý nghĩa các tham<br />
số.<br />
<br />
Nhu cầu<br />
hàng hóa<br />
(y)<br />
<br />
6<br />
<br />
B3: Xác định mô hình hồi quy biểu diễn mối liên hệ.<br />
<br />
Thu nhập<br />
(x)<br />
<br />
10,0<br />
<br />
7<br />
<br />
VD trang 201.<br />
Khảo sát ngẫu nhiên<br />
10 khách hàng ta thu<br />
được dữ liệu sau:<br />
<br />
- Hệ số tương quan<br />
- Tỷ số tương quan.<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
• Ta thấy khi thu nhập tăng nhu cầu về hàng hóa<br />
dịch vụ tăng. Tuy nhiên mức độ tăng không<br />
hoàn toàn.<br />
<br />
.0<br />
<br />
9.<br />
0<br />
<br />
10<br />
<br />
7.<br />
0<br />
<br />
6.<br />
5<br />
<br />
5.<br />
0<br />
<br />
4.<br />
0<br />
<br />
3.<br />
5<br />
<br />
3.<br />
0<br />
<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
<br />
2.<br />
5<br />
<br />
• Dùng đồ thị quan sát và cho nhận xét<br />
<br />
Cầu hàng hóa<br />
<br />
• Ta xem xét mối liên hệ tuyến tính giữa 2 tiêu<br />
thức x và y bằng cách xây dựng mô hình toán<br />
học<br />
<br />
ü<br />
<br />
Mối quan hệ giữa thu nhập và cầu hàng<br />
hóa<br />
<br />
1.<br />
0<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
Đường gấp khúc<br />
trên đồ thị có xu<br />
hướng tăng dần.<br />
Đướng gấp khúc<br />
vươn theo hướng từ<br />
bên trái phía dưới<br />
sang bên phải phía<br />
trên<br />
<br />
Thu nhập bình quân<br />
<br />
2<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
Mối quan hệ giữa thu nhập và cầu hàng hóa<br />
<br />
8<br />
7<br />
<br />
•Trên đồ thị, đường gấp khúc được<br />
gọi là đường hồi quy thực nghiệm,<br />
hình thành từ tài liệu đã cho. Đường<br />
này chưa phản ánh rõ mối liên hệ<br />
giữa 2 tiêu thức<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
Trong đường hồi qui lý thuyết : yx = a + bx<br />
Thì:<br />
x: Trị số của tiêu thức nguyên nhân<br />
<br />
Cầu hàng hóa<br />
<br />
6<br />
<br />
Đường thẳng đi theo cùng hướng với<br />
đường gấp khúc gọi là đường hồi quy<br />
lý thuyết được biểu hiện dưới dạng 1<br />
hàm số yx = a + bx<br />
<br />
5<br />
4<br />
3<br />
2<br />
1<br />
<br />
0<br />
<br />
.0<br />
<br />
9.<br />
<br />
0<br />
5.<br />
<br />
10<br />
<br />
0<br />
4.<br />
<br />
5<br />
<br />
5<br />
3.<br />
<br />
0<br />
<br />
0<br />
3.<br />
<br />
7.<br />
<br />
5<br />
2.<br />
<br />
6.<br />
<br />
0<br />
1.<br />
<br />
0<br />
<br />
Thu nhập bình quân<br />
<br />
Có vô số đường thẳng được vẽ.<br />
Chọn 1 đường thẳng cực tiểu hóa<br />
được tổng các độ lệch bình phương<br />
các chênh lệch giữa giá trị thực tế yt<br />
với giá trị yx<br />
<br />
yx: Trị số của tiêu thức kết quả y được tính theo phương trình<br />
hồi quy<br />
a: Tham số tự do nói lên ảnh hưởng của các nguyên nhân khác<br />
ngoài x đối với y<br />
b : Hệ số hồi qui nói lên ảnh hưởng của x đối với y, cụ thể mỗi<br />
khi x tăng 1 đơn vị thì y tăng bình quân b đơn vị.<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
Phương pháp xác định các tham số của PT hồi quy<br />
<br />
Xác định các tham số<br />
<br />
Xác định a,b dựa vào phương pháp bình phương nhỏ<br />
nhất.<br />
Phương pháp bình phương nhỏ nhất?<br />
Tối thiểu hoá tổng bình phương các độ lệch giữa giá trị<br />
thực tế yt và giá trị điều chỉnh của biến phụ thuộc yx.<br />
<br />
Cách 1 : Tính a, b từ hệ phương trình<br />
<br />
∑y = na + b∑x<br />
∑xy = a∑x + b∑x2<br />
<br />
S = å ( yt - y x ) 2 = min<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
x<br />
<br />
y<br />
<br />
(x-x)<br />
<br />
(y-y)<br />
<br />
(x-x)2<br />
<br />
(y-y)2<br />
<br />
1.0<br />
<br />
1.0<br />
<br />
1.0<br />
<br />
1.0<br />
<br />
1.0<br />
<br />
(4.2)<br />
<br />
(2.6)<br />
<br />
17.2<br />
<br />
6.8<br />
<br />
10.8<br />
<br />
2.0<br />
<br />
2.5<br />
<br />
2.0<br />
<br />
5.0<br />
<br />
6.3<br />
<br />
(2.7)<br />
<br />
(1.6)<br />
<br />
7.0<br />
<br />
2.6<br />
<br />
3.0<br />
<br />
2.0<br />
<br />
6.0<br />
<br />
9.0<br />
<br />
(2.2)<br />
<br />
(1.6)<br />
<br />
4.6<br />
<br />
2.6<br />
<br />
3.4<br />
<br />
4.0<br />
<br />
3.5<br />
<br />
2.0<br />
<br />
7.0<br />
<br />
12.3<br />
<br />
(1.7)<br />
<br />
(1.6)<br />
<br />
2.7<br />
<br />
2.6<br />
<br />
2.6<br />
<br />
5.0<br />
<br />
4.0<br />
<br />
3.0<br />
<br />
12.0<br />
<br />
16.0<br />
<br />
(1.2)<br />
<br />
(0.6)<br />
<br />
1.3<br />
<br />
0.4<br />
<br />
0.7<br />
<br />
6.0<br />
<br />
5.0<br />
<br />
3.0<br />
<br />
15.0<br />
<br />
25.0<br />
<br />
(0.2)<br />
<br />
(0.6)<br />
<br />
0.0<br />
<br />
0.4<br />
<br />
0.1<br />
<br />
7.0<br />
<br />
6.5<br />
<br />
4.0<br />
<br />
26.0<br />
<br />
42.3<br />
<br />
1.4<br />
<br />
0.4<br />
<br />
1.8<br />
<br />
0.2<br />
<br />
0.5<br />
<br />
8.0<br />
<br />
7.0<br />
<br />
6.0<br />
<br />
42.0<br />
<br />
49.0<br />
<br />
1.9<br />
<br />
2.4<br />
<br />
3.4<br />
<br />
5.8<br />
<br />
4.4<br />
<br />
9.0<br />
<br />
9.0<br />
<br />
6.0<br />
<br />
54.0<br />
<br />
81.0<br />
<br />
3.9<br />
<br />
2.4<br />
<br />
14.8<br />
<br />
5.8<br />
<br />
9.2<br />
<br />
10.0<br />
<br />
10.0<br />
<br />
7.0<br />
<br />
70.0<br />
<br />
100.0<br />
<br />
4.9<br />
<br />
3.4<br />
<br />
23.5<br />
<br />
11.6<br />
<br />
16.5<br />
<br />
51.5<br />
<br />
36.0<br />
<br />
-<br />
<br />
-<br />
<br />
38.4<br />
<br />
• Từ bảng tính toán trên thay số liệu vào phương<br />
trình được hệ sau:<br />
<br />
4.2<br />
<br />
3.0<br />
<br />
52.6<br />
<br />
Stt<br />
<br />
x.y<br />
<br />
x2<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
238.0 341.75<br />
<br />
76.525<br />
<br />
(x-x).(y-y)<br />
<br />
36 = 10 a + 51.5 b<br />
238 = 51.5 a + 341.75 b<br />
<br />
• Giải hệ PT ta tìm được a = 0.06195; b = 0.687<br />
• Vậy, phương trình hồi quy có dạng<br />
• yx = 0.06195 + 0.687 x<br />
<br />
3<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
• a = 0.06195 là mức độ xuất phát đầu tiên của<br />
đường hồi quy lý thuyết, không phụ thuộc vào x,<br />
nói lên ảnh hưởng của các nhân tố khác tới nhu<br />
cầu hàng hóa<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
Cách 2 : Tính a, b từ công thức trong sách trang<br />
206<br />
Kết quả tương tự<br />
<br />
• b = 0.687 là hệ số hồi quy, nói lên ảnh hưởng<br />
của tiêu thức nguyên nhân x đối với tiêu thức<br />
kết quả y.<br />
• Có nghĩa là: Nếu thu nhập bình quân 1 tháng<br />
tăng lên 1 triệu thì nhu cầu hàng hóa tăng thêm<br />
0.687<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
• Hệ số tương quan (rxy)<br />
<br />
Tác dụng của r<br />
<br />
Ý nghĩa : Đánh giá trình độ chặt chẽ của mối liên hệ tương quan<br />
tuyến tính (xem xét giữa tiêu thức nguyên nhân và tiêu thức kết quả<br />
có mối liên hệ với nhau đến chứng mực nào).<br />
<br />
r xy =<br />
<br />
å ( x - x )´ ( y - y )<br />
å (x - x ) . å ( y - y )<br />
i<br />
<br />
rxy =<br />
<br />
Trong đó độ lệch<br />
chuẩn được tính<br />
<br />
i<br />
<br />
2<br />
<br />
i<br />
<br />
– Xác định cường độ của mối liên hệ<br />
– Xác định phương hướng của mối liên hệ<br />
<br />
2<br />
<br />
i<br />
<br />
xy - x . y<br />
d x .d y<br />
<br />
rxy = b .<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
dx<br />
dy<br />
<br />
dx =<br />
dy =<br />
<br />
(x - x ) 2<br />
<br />
• r > 0 : liên hệ tương quan thuận<br />
• r < 0 : liên hệ tương quan nghịch<br />
<br />
n<br />
<br />
(y - y )2<br />
<br />
- Dùng nhiều trong phân tích và dự đoán TK<br />
<br />
n<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
<br />
Tính chất của r : -1 ≤ rxy ≤ 1<br />
+ rxy > 0 : Giữa x và y có mối liên quan thuận<br />
+ rxy = ± 1 : Giữa x và y có mối liên hệ hàm số<br />
+ rxy = 0 : Giữa x và y không có mối liên hệ<br />
tương quan tuyến tính<br />
+ rxy càng tiến gần tới ± 1 : Mối liên hệ giữa x và<br />
y càng chặt chẽ.<br />
<br />
2. Liên hệ tương quan tuyến tính giữa 2 tiêu thức<br />
• Tiếp theo ví dụ tại bảng 6.1, ta tính rxy<br />
rxy =<br />
<br />
xy - x . y 23,8 - 5,15 ´ 3,6 5,26<br />
=<br />
=<br />
= 0,97<br />
s x .s y<br />
2,766 ´1,959<br />
5,42<br />
<br />
• Trong đó:<br />
dx =<br />
d<br />
<br />
y<br />
<br />
=<br />
<br />
(x - x ) 2<br />
n<br />
<br />
( y - y )2<br />
n<br />
<br />
=<br />
<br />
76 , 525<br />
= 2 , 766<br />
10<br />
<br />
=<br />
<br />
38 , 4<br />
= 1, 959<br />
10<br />
<br />
4<br />
<br />
3. LH tương quan phi tuyến tính giữa 2 tiêu thức<br />
<br />
3. LH tương quan phi tuyến tính giữa 2 tiêu thức<br />
Lập bảng để tính các trị số: ∑x; ∑y; ∑xy; ∑x2;<br />
∑x3; ∑x4…<br />
<br />
Phương trình parabol bậc 2<br />
yx = a + bx + cx2<br />
Xác định a,b,c:<br />
∑y = na + b∑x + c∑x2 (1)<br />
∑xy = a∑x + b∑x2 + c∑x3 (2)<br />
∑x2y = a∑x2 + b∑x3 + c∑x4 (3)<br />
<br />
PT barabon bậc 2 được dùng trong trường hợp<br />
khi tiêu thức nguyên nhân tăng (giảm) với lượng<br />
đều nhau thì tiêu thức kết quả biến động với<br />
lượng không đều.<br />
Ví dụ: Liên hệ giữa tuổi nghề và năng suất lao<br />
động; lượng phân bón và năng suất thu hoạch;<br />
thu nhập và cầu hàng hóa…<br />
<br />
3. LH tương quan phi tuyến tính giữa 2 tiêu thức<br />
70<br />
<br />
• Ví dụ: Có tài liệu về tuổi nghề và năng suất lao<br />
động tại Công ty X như sau:<br />
<br />
60<br />
50<br />
40<br />
<br />
Tuổi<br />
nghề<br />
(Năm)<br />
<br />
3<br />
<br />
6<br />
<br />
9<br />
<br />
12 15 18 21 24 27 30 33 36<br />
<br />
Series1<br />
<br />
30<br />
<br />
Poly. (Series1)<br />
<br />
20<br />
10<br />
<br />
NSLĐ<br />
(SP)<br />
<br />
12 23 35 44 51 55 58 60 57 52 47 38<br />
<br />
0<br />
1<br />
<br />
3. LH tương quan phi tuyến tính giữa 2 tiêu thức<br />
x (tuổi nghề)<br />
<br />
y (NSLĐ)<br />
<br />
x*x<br />
<br />
3<br />
<br />
12<br />
<br />
6<br />
<br />
23<br />
<br />
x*y<br />
<br />
x*x*x<br />
<br />
9<br />
<br />
36<br />
<br />
x*x*y<br />
27<br />
<br />
x*x*x*x<br />
108<br />
<br />
y*y<br />
81<br />
<br />
144<br />
<br />
36<br />
<br />
138<br />
<br />
216<br />
<br />
828<br />
<br />
1296<br />
<br />
529<br />
<br />
9<br />
<br />
35<br />
<br />
81<br />
<br />
315<br />
<br />
729<br />
<br />
2835<br />
<br />
6561<br />
<br />
1225<br />
<br />
12<br />
<br />
44<br />
<br />
144<br />
<br />
528<br />
<br />
1728<br />
<br />
6336<br />
<br />
20736<br />
<br />
51<br />
<br />
225<br />
<br />
765<br />
<br />
3375<br />
<br />
11475<br />
<br />
50625<br />
<br />
55<br />
<br />
324<br />
<br />
990<br />
<br />
5832<br />
<br />
17820<br />
<br />
104976<br />
<br />
3025<br />
<br />
21<br />
<br />
58<br />
<br />
441<br />
<br />
1218<br />
<br />
9261<br />
<br />
25578<br />
<br />
194481<br />
<br />
3364<br />
<br />
24<br />
<br />
60<br />
<br />
576<br />
<br />
1440<br />
<br />
13824<br />
<br />
34560<br />
<br />
331776<br />
<br />
3600<br />
<br />
27<br />
<br />
57<br />
<br />
729<br />
<br />
1539<br />
<br />
19683<br />
<br />
41553<br />
<br />
531441<br />
<br />
3249<br />
<br />
30<br />
<br />
52<br />
<br />
900<br />
<br />
1560<br />
<br />
27000<br />
<br />
46800<br />
<br />
810000<br />
<br />
47<br />
<br />
1089<br />
<br />
1551<br />
<br />
35937<br />
<br />
51183<br />
<br />
1185921<br />
<br />
2209<br />
<br />
36<br />
<br />
38<br />
<br />
1296<br />
<br />
1368<br />
<br />
46656<br />
<br />
49248<br />
<br />
1679616<br />
<br />
1444<br />
<br />
234<br />
<br />
532<br />
<br />
5850<br />
<br />
11448<br />
<br />
164268<br />
<br />
288324<br />
<br />
4917510<br />
<br />
5<br />
<br />
6<br />
<br />
7<br />
<br />
8<br />
<br />
9<br />
<br />
10 11 12<br />
<br />
3. LH tương quan phi tuyến tính giữa 2 tiêu thức<br />
∑y = na + b∑x + c∑x2 (1)<br />
∑xy = a∑x + b∑x2 + c∑x3 (2)<br />
∑x2y = a∑x2 + b∑x3 + c∑x4 (3)<br />
<br />
2704<br />
<br />
33<br />
<br />
4<br />
<br />
2601<br />
<br />
18<br />
<br />
3<br />
<br />
1936<br />
<br />
15<br />
<br />
2<br />
<br />
26030<br />
<br />
532 = 12a +<br />
234b +<br />
5850c<br />
11448 = 234a + 5850b + 164268c<br />
288324 = 5850a + 164268b + 4917510c<br />
yx = -4,5 + 5,5x – 0,1x2<br />
<br />
5<br />
<br />