Lab 2. D O B NG PH NG PHÁP H I QUI ƯƠ
Biên so n: TS. Nguy n Văn Ng c
File chap5.sav ch a d li u v bán hàng. D li u s đ c phân ra làm 2 th i đo n: ượ
luy n t p và đ ki m tra. D li u c a th i đo n ki m tra đôi khi còn đ c g i là m u đ ượ
dành (hold-out sample).
1. Xây d ng đ th
Trong th i đo n luy n t p xây d ng mônh b n hãy ch n 100 quan sát đ u tiên c a chu i
sales. Ch n trong Menu Data:
Data
Select Cases
Hình 1. H p tho i “Ch n s quan sát
B n y ch n Based on time or case range (D a trên th i gian ho c s quan t), sau đó
nh p vào t Range... . H p tho i Select Cases: Range (Ch n vùng quan t) đ c m ra. ượ
1
Hình 2. H p tho i “Ch n vùng quan sát”
Bây gi xem xét chu i c a chúng ta. Ch n trong Menu Graphs:
Graphs
Sequence
Sequence number
96
91
86
81
76
71
66
61
56
51
46
41
36
31
26
21
16
11
6
1
SALES
260
250
240
230
220
210
200
190
nh 3. D li u v bán hàng (th i đo n luy n t p).
2. S d ng th thu t Curve Estimation
Đ th c giá tr c a bi n ế sales, đ c xây d ng cho 100 quan sát đ u tiên tăng liên t c, đ cượ
bi t là v cu i. ng chu i t t ng quan d ng: m i m t g tr g n đúng v i giá tr ươ ươ
2
đ ng tr c đó, d ng nh chu i “b nh . Ph ng pháp d o đ n gi n nh t cho chu i ướ ườ ư ươ ơ
y là xác đ nh m t đ ng cong x p x v i gtr c a chu i. ườ
Th thu t Curve Estimation dùng đ làm đi u đó: xác đ nh ph ng pháp t t nh t xây d ng ươ
đ ng cong đi qua chu i d li u và cho bi t nó phù h p đ n m c đ o. Th thu t này s t oườ ế ế
ra 4 chu i th i gian m i: d báo b ng mô hình, sai s , gi i h n trên và gi i h n d i c a đ tin ướ
c y cho các giá tr d o. Có th xây d ng đ th các chu i y, đ nh chúng xác đ nh xem mô
nh ch y t t t i m c nào.
Ch n d ng đ ng cong b ườ c hai và l p ph ng. ươ
B n hãy th c l ng c h s cho đ ng b c hai và đ ng l p ph ng cho 100 quan ướ ượ ườ ườ ươ
t đ u tiên c a chu i. Sau đó m ti p cho th i đo n ki m tra so sánh 2 mônh. ế
Phân tích h i qui đ c s d ng trong th thu t ượ Curve Estimation đ c l ng các tham ướ ượ
s c a đ ng cong. Đ ch n đ ng b c hai, g n v i chu i ườ ườ sales, b n y ch n trong Menu
Analyze:
Analyze
Regression
Curve Estimation
nh 4. H p tho i c l ng đ ng cong. Ướ ượ ườ
B n hãy ch n bi n ế sales đ ao khung danh ch ưDependent(s) (các bi n ph thu c).ế
Trong nhóm Independent (Các bi n đ c l p) hãy ch n ế Time (Th i gian). Trong nhóm Models
b n hãy đánh d u ch n Linear, Quadratic Cubic. Đ có th so sánh giá tr c a c mô hình
3
v i các gtr quan t c a chu i sales, hãy nh p o t Save. H p tho i Curve Estimation
Save đ c m ra nh hình 5.ượ ư
Hình 5. H p tho i “Curve Estimation: save”.
Đ u tiên chúng ta xem xétc giá tr d o, t o ra b i các mônh b c hai và l p ph ng, ươ
cho nên trong nhóm Save ta ch n Predicted values (Các giá tr d o). Trong ph n d i c a H p ướ
tho i ch ra giai đo n luy n t p (Estimation Period) đã ch n các quan sát t 1 đ n 100. Đ d o ế
t t c c gtr c a chu i (cho đ n gtr cu i cùng), y ch n trong nhóm ế Predict Cases (d
o quan t) y ch n Predict from estimation period through last case (D o t th i đo n
luy n t p đ n quan sát cu i cùng). Nh p lên t ế Continue, đ tr v H p tho i chính Curve
Estimation. Hãy ch c ch n r ng các tùy ch n Include constant in equation (Đ a constant vào môư
nh) và Plot models (Xây d ng đ th cho mô hình) đã đ c đánh d u. Nh p vào t ượ OK.
Cng ta hãy xem xét các d li u th ng tnh bày tron g hình 6.
Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3
SALES QUA .462 97 41.73 .000 206.517 .0593 .0021
SALES CUB .877 96 227.80 .000 185.507 2.4952 -.0579 .0004
The following new variables are being created:
Name Label
FIT_1 Fit for SALES from CURVEFIT, MOD_2 QUADRATIC
FIT_2 Fit for SALES from CURVEFIT, MOD_2 CUBIC
nh 6. c l ng đ ng cong b c hai và đ ng l p ph ng.Ướ ượ ườ ườ ươ
Ph ng tnh đ ng cong b c 2 có d ng:ươ ườ
sales case case= + × + ×206 517 0 0593 0 0021 2
. ( . ) ( . )
Trong đó: case s quan t. H s đ ng tr c s h ng bình ph ng g tr nh ướ ươ
đ ng cong g n v i đ ng th ng.ườ ườ
4
V i đ ng cong b c 3, ngoài b0, b1 b2, hình y còn h s b3 đ ng tr c s ườ ướ
h ng l p ph ng. H ươ s b3 nh.
Phương tnh t t hơn là phương trình b c 3:
( ) ( ) ( )
sales case case case= + × + × + ×185 507 2 4925 0 0579 0 0004
2 3
. . . .
3. Xây d ng các đ th
Th thu t Curve Estimation t o ra các giá tr d báo b i 2 mô hình và đ c ghi trong bi n ượ ế
m i fit_1fit_2. Tn hình 7 th hi n đ th c a chu i ban đ u và chu i d o. Tr c khi g i ướ
th thu t Graph/Sequence đ v đ th , b n ch quên vào Data/Select Cases và b t tùy ch n All
cases.
Sequence number
145
137
129
121
113
105
97
89
81
73
65
57
49
41
33
25
17
9
1
700
600
500
400
300
200
100
SALES
QUADR
CUBIC
Hình 7. Các gtr ban đ uc mô hình d o
4. H i qui v i ch báo phòng ng a
Th thu t Curve Estimation th c hi n phân tích h i qui. Bi n đ c l p mà chúng ta đã s ế
d ngth i gian. Th thu t Curve Estimation ch n ra đ ng cong phù h p nh t v i d ng đ th ườ
c a chu i th i gian và không đ t ra câu h i t i sao nó l i có d ng nh v y. Rõ ràng n u chúng ư ế
tam t chu i có quan h v i chu i mà chúng ta đang quan tâm, thì ch t l ng d báo đôi khi ượ
th đ c nâng lên. Đ n gi n nh t là s d ng thông tin c a chu i t ng t , n u nó cho phép d ượ ơ ươ ế
o c giá tr t ng lai c a chu i mà chúng ta quan tâm, thì nga là chúng ta đang s d ng ươ ch
o png ng a.
5