
Lab 2. D BÁO B NG PH NG PHÁP H I QUIỰ Ằ ƯƠ Ồ
Biên so n: TS. Nguy n Văn Ng cạ ễ ọ
File chap5.sav ch a d li u v bán hàng. D li u s đ c phân ra làm 2 th i đo n:ứ ữ ệ ề ữ ệ ẽ ượ ờ ạ
luy n t p và đ ki m tra. D li u c a th i đo n ki m tra đôi khi còn đ c g i là m u đệ ậ ể ể ữ ệ ủ ờ ạ ể ượ ọ ẫ ể
dành (hold-out sample).
1. Xây d ng đ thự ồ ị
Trong th i đo n luy n t p xây d ng mô hình b n hãy ch n 100 quan sát đ u tiên c a chu iờ ạ ệ ậ ự ạ ọ ầ ủ ỗ
sales. Ch n trong Menu ọData:
Data
Select Cases
Hình 1. H p tho i “Ch n s quan sát”ộ ạ ọ ố
B n hãy ch n ạ ọ Based on time or case range (D a trên th i gian ho c s quan sát), sau đóự ờ ặ ố
nh p vào nút ấRange... . H p tho i ộ ạ Select Cases: Range (Ch n vùng quan sát) đ c m ra.ọ ượ ở
1

Hình 2. H pộ tho iạ “Ch nọ vùng quan sát”
Bây giờ xem xét chu iỗ c aủ chúng ta. Ch nọ trong Menu Graphs:
Graphs
Sequence…
Sequence number
96
91
86
81
76
71
66
61
56
51
46
41
36
31
26
21
16
11
6
1
SALES
260
250
240
230
220
210
200
190
Hình 3. D li u v bán hàng (th i đo n luy n t p).ữ ệ ề ờ ạ ệ ậ
2. S d ng th thu t Curve Estimationử ụ ủ ậ
Đồ th các giá tr c a bi n ị ị ủ ế sales, đ c xây d ng cho 100 quan sát đ u tiên tăng liên t c, đ cượ ự ầ ụ ặ
bi t là v cu i. Rõ ràng là chu i có t t ng quan d ng: m i m t giá tr g n đúng v i giá trệ ề ố ỗ ự ươ ươ ỗ ộ ị ầ ớ ị
2

đ ng tr c đó, d ng nh chu i có “b nh ”. Ph ng pháp d báo đ n gi n nh t cho chu iứ ướ ườ ư ỗ ộ ớ ươ ự ơ ả ấ ỗ
này là xác đ nh m t đ ng cong x p x v i giá tr c a chu i.ị ộ ườ ấ ỉ ớ ị ủ ỗ
Th thu t ủ ậ Curve Estimation dùng đ làm đi u đó: xác đ nh ph ng pháp t t nh t xây d ngể ề ị ươ ố ấ ự
đ ng cong đi qua chu i d li u và cho bi t nó phù h p đ n m c đ nào. Th thu t này s t oườ ỗ ữ ệ ế ợ ế ứ ộ ủ ậ ẽ ạ
ra 4 chu i th i gian m i: d báo b ng mô hình, sai s , gi i h n trên và gi i h n d i c a đ tinỗ ờ ớ ự ằ ố ớ ạ ớ ạ ướ ủ ộ
c y cho các giá tr d báo. Có th xây d ng đ th các chu i này, đ nh chúng xác đ nh xem môậ ị ự ể ự ồ ị ỗ ể ờ ị
hình ch y t t t i m c nào.ạ ố ớ ứ
Ch n d ng đ ng cong bọ ạ ườ ậc hai và l p ph ng.ậ ươ
B n hãy th c l ng các h s cho đ ng b c hai và đ ng l p ph ng cho 100 quanạ ử ướ ượ ệ ố ườ ậ ườ ậ ươ
sát đ u tiên c a chu i. Sau đó làm ti p cho th i đo n ki m tra và so sánh 2 mô hình.ầ ủ ỗ ế ờ ạ ể
Phân tích h i qui đ c s d ng trong th thu t ồ ượ ử ụ ủ ậ Curve Estimation đ c l ng các thamể ướ ượ
s c a đ ng cong. Đ ch n đ ng b c hai, g n v i chu i ố ủ ườ ể ọ ườ ậ ầ ớ ỗ sales, b n hãy ch n trong Menuạ ọ
Analyze:
Analyze
Regression
Curve Estimation…
Hình 4. H p tho i “ c l ng đ ng cong”.ộ ạ Ướ ượ ườ
B n hãy ch n bi n ạ ọ ế sales và đ a vào khung danh sách ưDependent(s) (các bi n ph thu c).ế ụ ộ
Trong nhóm Independent (Các bi n đ c l p) hãy ch n ế ộ ậ ọ Time (Th i gian). Trong nhóm ờModels
b n hãy đánh d u ch n ạ ấ ọ Linear, Quadratic và Cubic. Đ có th so sánh giá tr c a các mô hìnhể ể ị ủ
3

v i các giá tr quan sát c a chu i ớ ị ủ ỗ sales, hãy nh p vào nút ấSave…. H p tho i ộ ạ Curve Estimation
Save đ c m ra nh hình 5.ượ ở ư
Hình 5. H p tho i “Curve Estimation: save”.ộ ạ
Đ u tiên chúng ta xem xét các giá tr d báo, t o ra b i các mô hình b c hai và l p ph ng,ầ ị ự ạ ở ậ ậ ươ
cho nên trong nhóm Save ta ch n ọPredicted values (Các giá tr d báo). Trong ph n d i c a H pị ự ầ ướ ủ ộ
tho i ch ra giai đo n luy n t p (Estimation Period) đã ch n các quan sát t 1 đ n 100. Đ d báoạ ỉ ạ ệ ậ ọ ừ ế ể ự
t t c các giá tr c a chu i (cho đ n giá tr cu i cùng), hãy ch n trong nhóm ấ ả ị ủ ỗ ế ị ố ọ Predict Cases (dự
báo quan sát) tùy ch n ọPredict from estimation period through last case (D báo t th i đo nự ừ ờ ạ
luy n t p đ n quan sát cu i cùng). Nh p lên nút ệ ậ ế ố ấ Continue, đ tr v H p tho i chính ể ở ề ộ ạ Curve
Estimation. Hãy ch c ch n r ng các tùy ch n ắ ắ ằ ọ Include constant in equation (Đ a constant vào môư
hình) và Plot models (Xây d ng đ th cho mô hình) đã đ c đánh d u. Nh p vào nút ự ồ ị ượ ấ ấ OK.
Chúng ta hãy xem xét các d li u th ng kê trình bày tronữ ệ ố g hình 6.
Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3
SALES QUA .462 97 41.73 .000 206.517 .0593 .0021
SALES CUB .877 96 227.80 .000 185.507 2.4952 -.0579 .0004
The following new variables are being created:
Name Label
FIT_1 Fit for SALES from CURVEFIT, MOD_2 QUADRATIC
FIT_2 Fit for SALES from CURVEFIT, MOD_2 CUBIC
Hình 6. c l ng đ ng cong b c hai và đ ng l p ph ng.Ướ ượ ườ ậ ườ ậ ươ
Ph ng trình đ ng cong b c 2 có d ng:ươ ườ ậ ạ
sales case case= + × + ×206 517 0 0593 0 0021 2
. ( . ) ( . )
Trong đó: case – s quan sát. H s đ ng tr c s h ng bình ph ng có giá tr nh –ố ệ ố ứ ướ ố ạ ươ ị ỏ
đ ng cong g n v i đ ng th ng.ườ ầ ớ ườ ẳ
4

V i đ ng cong b c 3, ngoài b0, b1 và b2, mô hình này còn có h s b3 đ ng tr c sớ ườ ậ ệ ố ứ ướ ố
h ng l p ph ng. Hạ ậ ươ ệ số b3 nhỏ.
Phương trình t tố hơn là phương trình b cậ 3:
( ) ( ) ( )
sales case case case= + × + × + ×185 507 2 4925 0 0579 0 0004
2 3
. . . .
3. Xây d ng các đ thự ồ ị
Thủ thu t ậCurve Estimation t o ra các giá tr d báo b i 2 mô hình và đ c ghi trong bi nạ ị ự ở ượ ế
m i ớfit_1 và fit_2. Trên hình 7 th hi n đ th c a chu i ban đ u và chu i d báo. Tr c khi g iể ệ ồ ị ủ ỗ ầ ỗ ự ướ ọ
th thu t ủ ậ Graph/Sequence đ v đ th , b n ch quên vào ể ẽ ồ ị ạ ớ Data/Select Cases và b t tùy ch n ậ ọ All
cases.
Sequence number
145
137
129
121
113
105
97
89
81
73
65
57
49
41
33
25
17
9
1
700
600
500
400
300
200
100
SALES
QUADR
CUBIC
Hình 7. Các giá tr ban đ u và các mô hình d báoị ầ ự
4. H i qui v i ch báo phòng ng aồ ớ ỉ ừ
Th thu t ủ ậ Curve Estimation th c hi n phân tích h i qui. Bi n đ c l p mà chúng ta đã sự ệ ồ ế ộ ậ ử
d ng là th i gian. Th thu t ụ ờ ủ ậ Curve Estimation ch n ra đ ng cong phù h p nh t v i d ng đ thọ ườ ợ ấ ớ ạ ồ ị
c a chu i th i gian và không đ t ra câu h i t i sao nó l i có d ng nh v y. Rõ ràng là n u chúngủ ỗ ờ ặ ỏ ạ ạ ạ ư ậ ế
ta có m t chu i có quan h v i chu i mà chúng ta đang quan tâm, thì ch t l ng d báo đôi khi cóộ ỗ ệ ớ ỗ ấ ượ ự
th đ c nâng lên. Đ n gi n nh t là s d ng thông tin c a chu i t ng t , n u nó cho phép dể ượ ơ ả ấ ử ụ ủ ỗ ươ ự ế ự
báo các giá tr t ng lai c a chu i mà chúng ta quan tâm, thì nghĩa là chúng ta đang s d ng ị ươ ủ ỗ ử ụ chỉ
báo phòng ng aừ.
5