PH LC A: TÍNH TOÁN H S HI QUY
Cao Văn Trường _ QG10_1051170069 Trang 1
PH LC A: TÍNH TOÁN H S HI QUY
hình phát sinh (P) thu hút (A) chuyến đi được xây dng các m
hi quy tuyến tính 3 biến vi các biến s ng dân s, s ợng lao động và s
ng hc sinh sinh viên. C th kết qu tính toán như sau:
Mô hình phát sinh chuyến đi:
Pi = ai*Population + bi*Workers + ci*Students
Mô hình thu t chuyến đi:
Aj = xj*Population + yj*Workers + zj*Students
Trong đó: Population : Dân s
Workers : S lao động
Students : S HSSV
ai, bi, ci, xj, yj, zj là tham s, h s hồi quy tươngng.
Các d liệu đầu vào s dngm hi quy được trình bày trong Bng 1.
Bng 1. D liệu đầu vào hàm hi quy
Zone
Các biến số
Phát sinh chuyến đi năm 2014
Thu hút chuyến đi năm 2014
Dân số
Lao
động
HSSV
HBW
HBO
NHB
HBS
HBO
NHB
1
15427
3350
4203
1190
5269
623
4203
1190
1020
2
24207
3910
1755
653
4518
1198
1755
653
1905
3
21868
3792
5952
1224
2448
233
5952
1224
2507
4
15691
4465
4898
2418
1582
220
4898
2418
1846
5
10144
2718
1487
635
2365
388
1487
635
494
6
15577
4646
4750
2575
3829
660
4750
2575
1848
7
17903
3100
4305
1786
1939
306
4305
1786
2449
8
20776
3056
6295
916
3148
1259
6295
916
4063
9
36178
7830
9775
4245
5488
569
9775
4245
3313
10
20072
5613
7168
2434
2816
382
7168
2434
2339
11
16157
3415
1887
980
4214
539
1887
980
1519
Tổng
214000
45895
52475
19056
37616
6378
52475
19056
23304
Vi các d liu trên s dng công c Microsofl Excel đ tính toán hi quy
cho tng giá tr ca tng chuyến đi phát sinh(P) và thu hút (A).
Kết qu tính toán ca m hi quy cho chuyến đi Phát sinh vi mục đích
HBW như sau:
Bng 2: Kết qu hi quy Phát sinh chuyến đi với mục đích HBW trong Excel
PH LC A: TÍNH TOÁN H S HI QUY
Cao Văn Trường _ QG10_1051170069 Trang 2
Regression Statistics
Multiple R (R)
0.979238
R Square (R2)
0.958907
Adjusted R
Square
0.823634
Standard Error
481.5898
Observations
( Số mẫu n)
11
ANOVA
df
SS
MS
F
Significance F
Regression
(k) 3
ESS 43296957
14432319
62.22738
2.06E-05
Residual
(n-k) 8
RSS 1855430
231928.7
Total
11
TSS=ESS+RSS
45152387
Coefficients
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
Lower 95.0%
Upper 95.0%
Intercept
0
#N/A
#N/A
#N/A
#N/A
#N/A
#N/A
#N/A
Dân số
-0.07706
0.033757
-2.2829
0.051836
-0.15490576
0.00078001
-0.154905764
0.00078
Lao động
0.595462
0.173266
3.436699
0.008867
0.19591068
0.995013946
0.195910683
0.995014
HSSV
0.169772
0.09496
1.787828
0.111609
-0.04920606
0.388750652
-0.049206065
0.388751
PH LC A: TÍNH TOÁN H S HI QUY
Cao Văn Trường _ QG10_1051170069 Trang 3
Bảng m tắt kết quả nh toán SUMMARY OUTPUT:
Hàm hi quy có dng Pi = ai*Populationi + bi*Workersi + ci*Studentsi
Regression Statistics: Các thông s ca hình hồi quy
Multiple R: H s tương quan bi (0<=R<=1). R= 0.979238 cho thy mc
độ cht ch ca mi liên h tương quan bi.
R Square: H s xác định. Vi R2=
=
=0.958907 trong 100%
s biến động ca biến ph thuc P (s chuyến đi phát sinh với mục đích HBW) thì
95,89 % s biến động do các biến độc lp Population, Workers, Students nh
hưởng, còn li là do sai s ngu nhiên.
Adjusted R: H s xác định mu điu chnh. h s xác định nh đến
độ ln hay nh ca bc t do df. Cho thy mc ảnh hưởng ca việc tăng thêm biến
s.
Standard Error: Sai s chun ca P do hi quy là 910.
Observation: S quan sát hay dung ng mu 11. Đây chính là số Zone
ni vùng.
Bảng phân ch phương sai ANOVA (Analysis of variance):
Regression: Do hồi quy. Số lượng c biến độc lập k =3 ( Population,
Workers, Students)
Residual: Do ngu nhn. Giá tr này được c định bng hiu s mu quan
sát n và s biến độc lp k. Vy n-k = 11-3 = 8.
Total: Tng ca Regression và Residual = 3+8 = 11.
Df (Degree of freedom): S bc t do.
SS (Sum of Square): Tng bình phương ca mc động (sai lch) gia các
giá tr quan sát ca Y (ký hiu là Y
i
) gtr bình quân ca chúng.
MS (Mean of Square): Phương sai hay s bình quân ca tng bình phương
sai lch k trên
TSS ( Total Sum of Square)= ESS+TSS= 45152387 Tng bình phương
ca tt c các mc sai lch gia các giá tr quan sát P
i
giá tr bình quân ca
chúng
PH LC A: TÍNH TOÁN H S HI QUY
Cao Văn Trường _ QG10_1051170069 Trang 4
Do hi quy Regression ESS (Explained Sum of Square)= 43296957 là
tng bình phương c sai lch gia các giá tr ca biến ph thuc P (s chuyến đi
phát sinh vi mục đích HBW) nhn được t m hi quy mu (ký hiu P*
i
). Độ
ln ca ESS phn ánh mc độ giao đng ca c giá tr bit ca mô hình vi
giá tr trung bình mu hàm hi quy.
ESS=Σi (P * i P 2
Do ngu nhiên Residual RSS (Residual Sum of Square) là tng bình
phương ca tt c các sai lch gia các giá tr quan sát ca P (P
i
) các giá tr
nhận được tm hi quy P*i
RSS ie2 i
P -P * i2 1855430
Ta th kim tra chéo như sau:
TSS = ESS + RSS = 45152387
R
2
= ESS/ TSS= 0.958907
F-stat: Tiêu chun F dùng m căn c để kim định độ tin cy v mt
khoa hc (thng kê) ca toàn b phương trình hi quy.
Significance F: F lý thuyết.
Bảng phân ch hồi quy:
- Coefficients: Ct giá tr ca các h s hàm hi quy: β1 = -0.07706,
β2 = 0.595462, β3 = 0.169772 với β1, β2 , β3 : các hệ số ước ợng, các hệ số hồi
quy này phản ánh mức độ ảnh hưởng của từng biến độc lập ( Dân số, Lao động,
HSSV) đến biến phụ thuốc P1 (số chuyến đi phát sinh với mục đích HBW).
Trong quá trình phỏng vấn khảo sát thực tế, số chuyến đi khảo sát không
nhiều và kết quả khảo sát phải qua 1 bước hiệu chỉnh nên kết quả hồi quy này xuất
hiện sai số và các giá trị mang dấu (-) nhưng các sai số này có thể chấp nhận được.
- Intercept: H s t do. H s này cho thy xut phát đim ca đưng hi
quy. Tuy nhiên đây ta không xét đến h s t do này.
Standard Error: (se) độ lch chun ca mu theo biến
t-stat: Tiêu chun t dùng làm căn c để kim định độ tin cy v mt khoa hc
PH LC A: TÍNH TOÁN H S HI QUY
Cao Văn Trường _ QG10_1051170069 Trang 5
(thng kê) ca đ co giãn a
i
( a1= -2.2829, a2= 3.436699 , a3= 1.787828) tc là
ca mi liên h gia các biến s đc lp ( Dân s, Lao đng, HSSV) m ph
thuc P (s chuyến đi phát sinh với mục đích HBW).
P-value: Xác sut để t > t-stat, dùng kim định độ tin tin cy v mt khoa hc
(thng kê) ca đ co giãn a
i
tc là ca mi liên h gia c biến s đc lp ( Dân
s, Lao đng, HSSV) m ph thuc P (s chuyến đi phát sinh với mục đích
HBW).
Lower 95%, Upper 95%, Lower 98%, Upper 98%: cn dưới và cn trên
ca khong ước lượng cho các tham s vi độ tin cy 95% độ tin cy 98%.
Nhn xét: Da vào bng kết qu trên ta phương trình hi quy cho chuyến
đi Pt sinh vi mục đích HBW n sau:
P1 = -0.07706*Dân s + 0.595462*Lao động + 0.169772*HSSV
Như vy vi d liu d báo m 2020 ca Zone 1 : Dân s = 15859, Lao
động = 3444, HSSV = 4321 thì giá tr d báo ca P1 được tính như sau:
P1 = -0.07706*15859 + 0.595462*3444 + 0.169772*4321= 1562 (chuyến
đi/ngày)
Tc s chuyến đi phát sinh với mục đích HBW của Zone 1 m dự báo
2020 s là 1520 chuyến đi/ngày.
Ngoài ra, da vào bng kết qu hi quy ( Bng 2) ta cũng thấy:
Nếu S lao động và S HSSV không đổi thì c tăng Dân số 1 ni s m
cho S chuyến đi Phát sinh với mục đích HBW giảm đi 0.07706 chuyến đi. Điều
này trái vi thc thế. Trong trường hp này s chuyến đi khảo sát được không nhiu
và s ng mu thng kê n nh nên sai s có th chp nhận được.
Nếu Dân s S HSSV không đổi thì c tăng S Lao động lên 1 người s
làm cho S chuyến đi Phát sinh với mục đích HBW tăng lên 0.595462 chuyến đi.
Điu này chng t mức độ ảnh hưởng ca S Lao động lên S chuyến đi Phát sinh
vi mục đích HBW là rất ln.
Nếu Dân s S lao động không đổi thì c tăng Số HSSV lên 1 người s
làm cho S chuyến đi Phát sinh với mục đích HBW ng lên 0.169772 chuyến đi.