Nguy n Duy Tâm - http://sites.google.com/site/tam0505/
ễ
1
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Con ng
ườ
i – T m nhìn m i ớ
ầ
2
N guyen D uy Tam http://sites.google.com /site/tam 0505/
G i I TH I U T G i I TH I U T
Ớ Ớ
Ệ Ệ
ƯƠ ƯƠ
N G QUA N – H I QUY N G QUA N – H I QUY
Ồ Ồ
ng quan
ể
ạ
i c a h i quy
1. T ươ 2. H i quy ồ 3. Quy trình xây d ng mô hình trên SPSS ự 4. Các lo i ki m đ nh trong mô hình ị 5. Ý nghĩa h s h i quy ệ ố ồ 6. D báo v i mô hình h i quy ồ ớ 7. X lí các l ỗ ủ ồ
ự ử
3
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Là m i quan h tuy n tính gi a hai bi n (X và Y)
ữ
ệ
ế
ế
ố
(rXY)
4
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Hệ số tươni quan Hệ số tươni quan
“r” H s t
Đ m nh c a m i quan h (m nh, y u, ho c không có quan
ộ ạ
ệ
ế
ạ
ặ
h )ệ
Các lo i quan h ạ
ệ
ồ
ế
ế
c chi u
ị
ế
ề
▪ Đ ng bi n – X và Y bi n thiên cùng chi u ề ▪ Ngh ch bi n – X và Y bi n thiên ng ượ –1 đ n 1 ế
ệ ố ươ ủ ng quan… ố
ế Kho ng bi n thiên c a r t ừ ế -1.0 0.0 +1.0 Strong Negative No Rel. Strong Positive
•Go to website!
–playing with scatterplots
5
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ủ ả
Th c hành v i đ th phân tán Th c hành v i đ th phân tán
ớ ồ ị ớ ồ ị
ự ự
r = .__ __
r = .__ __
r = .__ __
r = .__ __
6
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ự
ựTh c hành trên SPSS Th c hành trên SPSS
Click here
7
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ự
ựTh c hành trên SPSS Th c hành trên SPSS
Nh n xét m i quan h
ậ
ố
ệ
8
N guyen D uy Tam http://sites.google.com /site/tam 0505/
XÁC Đ NH H S T XÁC Đ NH H S T
NG QUAN NG QUAN
Ệ Ố ƯƠ Ệ Ố ƯƠ
Ị Ị
9
N guyen D uy Tam http://sites.google.com /site/tam 0505/
XÁC Đ NH H S T XÁC Đ NH H S T
NG QUAN NG QUAN
Ệ Ố ƯƠ Ệ Ố ƯƠ
Ị Ị
10
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Ki M Đ NH M I QUAN H TUY N TÍNH Ki M Đ NH M I QUAN H TUY N TÍNH
Ố Ố
Ể Ể
Ệ Ệ
Ế Ế
Ị Ị
Ki m đ nh m i quan
ố
ị ế
ữ
ể h tuy n tính gi a các ệ bi n.ế
1. H0: rxy =0: hai bi n ế
ụ
ộ
không có m i quan h ệ ố tuy n tính ph thu c ế nhau
ệ
ố
2. H1: rxy <>0: hai bi n ế có m i quan h tuy n ế tính ph thu c nhau
ụ
ộ
11
N guyen D uy Tam http://sites.google.com /site/tam 0505/
HỒI QUY trực tiếp HỒI QUY trực tiếp
Path Diagram of A Linear Regression Analysis
X1
error
YY
X2
=
+
+
+
+
k
Y i
b x 1 1
b x 2 2
b x 3 3
e i
x3
12
N guyen D uy Tam http://sites.google.com /site/tam 0505/
HỒI QUY tổni hợp HỒI QUY tổni hợp
A Path Analysis Decomposition of Effects into Direct, Indirect, Spurious, and Total Effects
Error
E rror
X2
C
Y 3
A
X 1
F
E
Các lo i quan h h i quy
ệ ồ
ạ
B
Y 2
D
Tr c ti p Y3: C,E, F
ự
ế
Error
Y 1
Gián ti p Y3: BE, BDF
ế
Error
ự
T ng tác đ ng = Tr c ộ ổ ti p + gián ti p ế
ế
Direct Ef f ect s: Paths C, E, F
Spurious ef fect s are due t o common (ant ecedent ) causes
I ndirect Ef f ect s: Paths AC, BE, D F
T ot al Ef f ects: Sum of Direct and Indirect Ef f ect s
13
N guyen D uy Tam http://sites.google.com /site/tam 0505/
H I QUY T H I QUY T
NG TÁC NG TÁC
Ồ Ồ
ƯƠ ƯƠ
Interaction Analysis
X 1
A
C
Y
B
H s tác đ ng t
ng tác: C
ệ ố
ộ
ươ
X 2
ng tác l n nhau cùng tác
ươ
ẫ
X1 và X2 t đ ng lên Y.
ộ
Y= K + aX1 + BX2 + CX1*X2
14
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Các lo i quan h gi a bi n ph thu c và bi n đ c l p Các lo i quan h gi a bi n ph thu c và bi n đ c l p
ế ộ ậ ế ộ ậ
ệ ữ ệ ữ
ụ ụ
ộ ộ
ế ế
ạ ạ
ỉ ế
ị ả
ậ
1. Quan h tuy n tính (linear) ệ 2. Quan h logarithmic ệ 3. Quan h hàm ngh ch đ o (inverse) ệ 4. Quan h parapol (quadratic) ệ 5. Quan h hàm b c 3 (cubic) ệ 6. Quan h hàm mũ (Power) ệ 7. Quan h logistic ệ 8. Quan h hàm tăng tr ệ 9. Quan h san b ng hàm mũ (exponential) ệ
H i quy ch xét đ i ố ồ v i h i quy tuy n ế ớ ồ tinh (đ i v i tham ố ớ s ). Nh ng m i ố ữ ố quan h phi tuy n ế ệ đ u ph i chuy n ể ả ề v quan h tuy n ế ệ ề tính) ng (growth) ưở
15
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ằ
i quan h tuy n tính (linear) ế MM i quan h tuy n tính (linear) ế
ố ố
ệ ệ
16
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Quan h logarithmic Quan h logarithmic
ệ ệ
17
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Quan heä nihòch ñaûo (inverse – Quan heä nihòch ñaûo (inverse – hypecpol) hypecpol)
18
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Quan heä haøm baäc hai (Quadratic) Quan heä haøm baäc hai (Quadratic)
19
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Quan heä haøm baäc 3 (cubic) Quan heä haøm baäc 3 (cubic)
20
N guyen D uy Tam http://sites.google.com /site/tam 0505/
NGHIÊN C U CÁC NHÂN T TÁC Đ NG Đ N M C L NGHIÊN C U CÁC NHÂN T TÁC Đ NG Đ N M C L
Ư ƯƠ Ư ƯƠ
Ộ Ộ
Ố Ố
Ứ Ứ
Ế Ế
NG Hi N T I Ạ Ệ NG Hi N T I Ạ Ệ
nh ng nhân i c a ế ệ ộ ả ữ ệ ạ ủ
BÀI T P: EMPLOYEE DATA.SAV. Yêu c u: Hãy xây d ng mô hình h i quy mô t ồ ự (m i quan h ) tác đ ng đ n m c l ứ ươ ườ
MH1: Lifeexpf = a + b1*calories + b2*gdp_gap MH2: Lifeexpf = a + b1*calories + b2*Ln(gdp_gap) MH3: Xây d ng mô hình h i quy v i Lifeexpf là bi n ph ụ ồ
Ậ ầ ng hi n t ố i lao đ ng trong công ty theo 2 mô hình sau. t ố ng ộ
ế ớ
21
N guyen D uy Tam http://sites.google.com /site/tam 0505/
i là bi n đ c l p thu c và t ộ ự t c các bi n còn l ấ ả ế ạ ộ ậ ế
MÔ HÌNH 1 MÔ HÌNH 1
22
N guyen D uy Tam http://sites.google.com /site/tam 0505/
B NG K T Qu B NG K T Qu
Ả Ả
Ế Ế
Ả Ả
KI M Đ NH T NG TH
KI M Đ NH T NG TH
Ổ
Ể
Ị
Ể
Ổ
Ể
Ị
Ể
G a thi ỉ 1. H0: Mô hình không có kh ả i thích giá tr th c
t ế
ị ự ả
năng gi tế 2. Gi ế
t H1: Mô hình có i thích ể ả c a m c ứ ị ự ế ủ
23
N guyen D uy Tam http://sites.google.com /site/tam 0505/
thi ả th s d ng đ gi ể ử ụ giá tr th c t ngươ l
B NG K T Qu B NG K T Qu
Ả Ả
Ế Ế
Ả Ả
KI M Đ NH H S H I QUY
KI M Đ NH H S H I QUY
ệ ố ồ
ể
ị
ệ ố ồ
ể
ị
Gi thi ả h i quy th I ồ
t đ i v i h s ế ố ớ ệ ố
ứ 1. H0: bi = 0 (bi n Xi không
2. H1: bi <> 0 (bi n Xi tác
ộ
ế tác đ ng vào Y) ế
24
N guyen D uy Tam http://sites.google.com /site/tam 0505/
đ ng vào Y) ộ
Ý NGHĨA H S H I QUY Ý NGHĨA H S H I QUY
Ệ Ố Ồ Ệ Ố Ồ
Ph
Lifeexpf = 32,77 + 0,012*calories + 0*gdp_gap
ng trình h i quy mô hình 1 đ c vi ươ ồ ượ ế t nh sau: ư
ố
1. B1: Trong đi u ki n các nhân t ề ệ ừ ượ
khác không đ i (2 n ổ c này có l ố ế ướ ướ ượ
c ng c kia 1 calories thì
ng calories) thì n u n ơ ướ ơ c này cao h n n i dân n c kia là 0,012 ườ ướ ơ ướ
gi ng nhau tr l calories n p vào hàng ngày h n h n n ạ tu i th c a ng ọ ủ ổ tu i.ổ
2. B2: N u ch n ế mô hình
25
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ọ α=5%, Ta đ xu t lo i bi n ề ấ ế gdp_gap ra kh i ỏ ạ
B NG K T Qu B NG K T Qu
Ả Ả
Ế Ế
Ả Ả
H s R
ệ ố 2 và R2 hi u ch nh
ệ
ỉ
H S GI I THÍCH R ả 2
ệ ố
ả
R2 là kh năng gi ả ế
i thích 2 =
i thích
c a mô hình. N u R ủ 0,706 80,4%) thì mô hình có kh năng gi ả ả c 70,6% giá tr th c t đ ượ
. ị ự ế Chú ý: mô hình h i quy đa ồ bi n đ c l p (h i quy b i) ế ộ ồ
ộ ậ 2
ệ
đ ể ỉ i thích c a ủ
26
N guyen D uy Tam http://sites.google.com /site/tam 0505/
hi u ch nh ta dùng R nêu kh năng gi ả ả mô hình. (69,8%)
D BÁO B NG MÔ HÌNH H I QUY D BÁO B NG MÔ HÌNH H I QUY
Ồ Ồ
Ự Ự
Ằ Ằ
I CÓ
ạ
ộ
ạ LINEAR
ƯỜ
T I H P THO I REGRESSION - SAVE
Ự Ề
D BÁO CHO 3 NG ĐI U KI N SAU Ệ Việt Nam Idp_iap Calories
PA1
1000
2400
PA2
1200
2500
PA3
1500
2700
ng án
ậ ữ ệ ủ
ươ
ứ
Nh p d li u c a 3 ph trên vào quan sát th 110-111- 112
27
N guyen D uy Tam http://sites.google.com /site/tam 0505/
K T Qu D BÁO K T Qu D BÁO
Ả Ự Ả Ự
Ế Ế
28
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Xây d ng mô hình 3 và d báo tu i th BQ c a ph n cho 3 ph
ng án c a
ụ ữ
ủ
ự
ự
ổ
ọ
ươ
ủ
Vi
t nam và năm 2008
ệ
29
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Gi Gi
Ả Ả
THI T C A MÔ HÌNH H I QUY B I Ộ THI T C A MÔ HÌNH H I QUY B I Ộ
Ế Ủ Ế Ủ
Ồ Ồ
1. Các bi n đ c l p ế
i thích) đ
c bi
t
1. Ph n d (resid) có ng sai không
ộ ậ ượ
ế
(gi tr
ả cướ
2. Các bi n đ c l p ộ ậ ế ng quan không t ươ v i nhau [cov(xi,xj) ớ =0]
3. Các sai s gi a giá tr ị
ố ữ
ầ ư ph ươ đ i. Var(resid) = ổ constant 2. Ph n d (resid) gi a ầ ư ữ giá tr d báo và giá ị ự tuân theo tr th c t ị ự ế phân ph i chu n. ẩ ố
ự ế
ng
30
N guyen D uy Tam http://sites.google.com /site/tam 0505/
và giá tr d th c t ị ự báo (ph n d , resid, ầ ư ui) không t t ự ươ quan v i nhau ớ
[cov(ui,uj) =0]
Ki M Đ NH CÁC L I C A MÔ HÌNH Ki M Đ NH CÁC L I C A MÔ HÌNH
Ỗ Ủ Ỗ Ủ
Ể Ể
Ị Ị
đ nh v s liên h tuy n tính gi a hai
ề ự
ữ
ệ
ế
bi n (đ th scatter) ồ ị
2. Kh năng tuân theo phân ph i chu n c a
ẩ ủ
ố
3. Hi n t 4. Hi n t 5. Hi n t
1. Gi ả ị ế ả ầ ư ệ ượ ệ ượ ệ ượ
ph n d (residual) ng quan ng t t ự ươ ng đa c ng tuy n ế ộ ng sai thay đ i ng ph ổ ươ
31
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Gi Gi
ả ị ả ị
đ nh v s liên h tuy n tính (đ th scatter) ế đ nh v s liên h tuy n tính (đ th scatter) ế
ồ ị ồ ị
ề ự ề ự
ệ ệ
Bi n đ c l p X có th gi
ộ ậ
ế
ế ộ
ế
ố
ớ
i thích cho bi n ph ụ ể ả thu c Y khi X có m i liên h tuy n tính v i X. ệ 1. Đ th Scatter gi a X và Y có m i liên h nào đó v i nhau ớ 2. Đ th ph n d (resid) gi a ph n d và giá tr d báo ữ
ữ ệ
ố ầ ư ị ự
32
N guyen D uy Tam http://sites.google.com /site/tam 0505/
bi n thiên ng u nhiên ồ ị ồ ị ế ầ ư ẫ
M i liên ố h tuy n ế ệ tính
33
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Gi Gi ả ị ả ị đ nh v s liên h tuy n tính (đ th scatter) ế đ nh v s liên h tuy n tính (đ th scatter) ế ồ ị ồ ị ề ự ề ự ệ ệ
K ieåm tra ñ oà th ò p h aân taù n p h aàn d ö K ieåm tra ñ oà th ò p h aân taù n p h aàn d ö (scatter) (scatter)
B1: Tính giá tr ị ầ ư
ẩ
ế
ph n d và giá tr ị d báo chu n hoá. ự B2: V đ th phân ẽ ồ ị tán v i tr c hoành là ớ ụ Zpr và tr c tung là ụ ZRE. (Có th thêm ể ng xu vào đ ườ ng đ ki m tra h ể ể ướ m i liên h tuy n ệ ố tính)
N guyen D uy Tam http://sites.google.com /site/tam 0505/
34
K ieåm ñ òn h p h aàn d ö coù p h aân p h oái K ieåm ñ òn h p h aàn d ö coù p h aân p h oái ch u aån (q u y trìn h ) ch u aån (q u y trìn h )
KHÔNG CÓ M I LIÊN H
CÓ M I LIÊN H (CUBIC)
ố
ệ
ố
ệ
N guyen D uy Tam http://sites.google.com /site/tam 0505/
35
Ki m đ nh ph n d có phân ph i chu n Ki m đ nh ph n d có phân ph i chu n
ầ ư ầ ư
ố ố
ể ể
ẩ ẩ
ị ị
Ta có th ki m tra kh năng tuân theo phân ph i
ể ể
ả
ố
ẩ ủ
chu n c a resid thông qua hai đ th ồ ị 1. Đồ thị tần số Histogram 2. Đồ thị Q-Q plot
36
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Ki m đ nh ph n d có phân ph i chu n Ki m đ nh ph n d có phân ph i chu n
ầ ư ầ ư
ố ố
ể ể
ẩ ẩ
ị ị
Đ TH HISTOGRAM
Đ TH HISTOGRAM
ồ
ị
ồ
ị
37
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Ki m đ nh ph n d có phân ph i chu n Ki m đ nh ph n d có phân ph i chu n
ầ ư ầ ư
ố ố
ể ể
ẩ ẩ
ị ị
Đ TH Q-Q PLOT
Đ TH Q-Q PLOT
ồ
ị
ồ
ị
38
N guyen D uy Tam http://sites.google.com /site/tam 0505/
Kieåm ñònh hieän töôïni phöôni sai Kieåm ñònh hieän töôïni phöôni sai khoâni ñoåi khoâni ñoåi
Là hi n t
ng các
39
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ệ ượ sai s (resid) có ố ng quan m i t ố ươ v i giá tr d báo ị ự ớ (Y^).
Kieåm ñònh hieän töôïni phöôni sai thay Kieåm ñònh hieän töôïni phöôni sai thay ñoåiñoåi
NG
ệ ố ƯƠ
ị
QUY TRÌNH
KI M Đ NH H S T ể QUAN
B1: Ch y h i quy, l y ph n ầ ấ
B2: T o bi n tr tuy t đ i c a ị ệ ố ủ
ệ ố ươ ể
ồ ạ d (resid) ư ế ạ resid (ABS_resid). B3. Ki m đ nh h s t ị ữ
ph ươ H1: Ng
ng quan gi a bi n ABS_resid ế v i t ng bi n đ c l p ế ớ ừ ng H0: Không có hi n t
40
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ộ ậ ệ ượ ng sai thay đ i ổ i c l ượ ạ
Kieåm ñònh hieän töôïni töï töôni quan Kieåm ñònh hieän töôïni töï töôni quan (autocorrelation) (autocorrelation)
Là hi n t có m i t
ệ ượ ố ươ
e
-e
1
i
i
ei
ng các thành ph n trong ph n d ầ ư ầ εi ,εj) <> 0] ng quan v i nhau [cov( ớ = Tương quan bậc 1:
2
p
r
+
+
+
+
r
r
...
e
e
e
e
+ r
i
i
1
i
2
pi
ei
= Tương quan bậc p:
0
-1
1
Tương quan nghịch
Tương quan nghịch
41
N guyen D uy Tam http://sites.google.com /site/tam 0505/
- - -
K ieåm ñ òn h h ieän töôïn g töï töôn g q u an K ieåm ñ òn h h ieän töôïn g töï töôn g q u an (au tocorrelation ) (au tocorrelation )
Durbin Watson d
-
tests first order
autocorrelation of residuals
n
-
-
(
)
2
e t
-
1
d
=(cid:229)
= 1
i
)r
e t e t ( = 12
-
d
N guyen D uy Tam http://sites.google.com /site/tam 0505/
42
K ieåm ñ òn h h ieän töôïn g töï töôn g q u an K ieåm ñ òn h h ieän töôïn g töï töôn g q u an (au to) (au to)
N guyen D uy Tam http://sites.google.com /site/tam 0505/
43
K ieåm ñ òn h h ieän töôïn g töï töôn g q u an K ieåm ñ òn h h ieän töôïn g töï töôn g q u an (au to) (au to)
CÁCH PHÁT HI Nệ
CÁCH PHÁT HI Nệ
N guyen D uy Tam http://sites.google.com /site/tam 0505/
44
K ieåm ñ òn h h ieän töôïn g ñ a coän g tu yeán K ieåm ñ òn h h ieän töôïn g ñ a coän g tu yeán (collin ear) (collin ear)
Có th phát hi n hi n t
ng đa c ng tuy n d a
ể
ệ ượ
ế ự
ộ
ệ vào các cách sau
1. Đ ch p nh n Tolerance = 1-R 2
ộ ấ
ậ
k
=
=
VIF
2
1. H s phóng đ i ph
ng sai
ệ ố
ạ
ươ
1 Tolerance
1
1 Rk
1. Ma tr n h s t ậ
ệ ố ươ
ng quan gi a các bi n ế ữ
N guyen D uy Tam http://sites.google.com /site/tam 0505/
45
-
K ieåm ñ òn h h ieän töôïn g ñ a coän g tu yeán K ieåm ñ òn h h ieän töôïn g ñ a coän g tu yeán (collin ear) (collin ear)
N guyen D uy Tam http://sites.google.com /site/tam 0505/
46
ọ ọ
ế ế
ườ ườ
i i
ủ ụ ủ ụ Th t c ch n b i n n h an h (d àn h ch o n g Th t c ch n b i n n h an h (d àn h ch o n g ườ ườ l i b i n l i b i n
ế )) ế
c (stepwise
1. Th t c đ a vào d n (forward sellection) ầ 2. Th t c lo i tr d n (Backward elimination) ạ ừ ầ 3. Th t c ch n t ng b ọ ừ
ướ
ủ ụ ư ủ ụ ủ ụ sellection)
N guyen D uy Tam http://sites.google.com /site/tam 0505/
47
Th t c đ a vào d n Th t c đ a vào d n
ủ ụ ư ủ ụ ư
ầ ầ
t: D a trên h s t ắ ậ ự ệ ố ươ ị
ộ ậ ế
c đ a vào tr
ộ ớ ừ c. ướ c đ a vào:
Đi u ki n đ 1. Th a mãn đi u ki n th ng kê F (FIN: th ng đê đ a vào) 2. Th a mãn đi u ki n xác su t đ a vào (PIN: xác su t đ đ a ấ ư
ư ố ố
Nguyên t ng quan thu n (ngh ch) l n ớ gi a bi n ph thu c v i t ng bi n đ c l p. Bi n nào l n ớ ế ụ ế ữ nh t đ ấ ượ ư ề ỏ ỏ vào)
N guyen D uy Tam http://sites.google.com /site/tam 0505/
48
ệ ượ ư ệ ề ệ ề ấ ể ư
Th t c đ a vào d n Th t c đ a vào d n
ủ ụ ư ủ ụ ư
ầ ầ
N guyen D uy Tam http://sites.google.com /site/tam 0505/
49
Th t c đ a vào d n Th t c đ a vào d n
ủ ụ ư ủ ụ ư
ầ ầ
N guyen D uy Tam http://sites.google.com /site/tam 0505/
50
ừ ầ ừ ầ
ủ ụ ủ ụ
ạ ạ Th t c lo i tr d n Th t c lo i tr d n
Nguyên t
ấ ả ứ ế
t: T t c các bi n vào mô hình. Và căn c vào bi n ạ ấ ầ
ề
i mô hình (FOUT: th ng đê l ắ nào có m i t ố ươ Đi u ki n đ ệ ượ 1. Không tho mãn đi u ki n ả ế ng quan th p nh t lo i ra d n ấ c lo i tr : ạ ừ ề ệ ở ạ ố
2. Không tho mãn đi u ki n
đ a vào) ư
l ệ ở ạ ề ả i mô hình (POUT: xác su t đ ấ ể
N guyen D uy Tam http://sites.google.com /site/tam 0505/
51
đ a vào) ư
ừ ầ ừ ầ
ủ ụ ủ ụ
ạ ạ Th t c lo i tr d n Th t c lo i tr d n
N guyen D uy Tam http://sites.google.com /site/tam 0505/
52
ừ ầ ừ ầ
ủ ụ ủ ụ
ạ ạ Th t c lo i tr d n Th t c lo i tr d n
N guyen D uy Tam http://sites.google.com /site/tam 0505/
53
ủ ụ ự ủ ụ ự
ừ ừ
ọ ọ
ướ ướ
Th t c l a ch n t n g b Th t c l a ch n t n g b
c c
Nguyên t
t: Theo trình t ắ ộ
ự ư ầ t forward sellection, sau đó, xét bi n này có th t n t , đ a d n vào m t bi n theo nguyên i hay ế ể ồ ạ ế
ự ư ợ
Chú ý: đ tránh tr đ a ra, c n thi ư
N guyen D uy Tam http://sites.google.com /site/tam 0505/
54
t l p FIN>FOUT ho c PIN < POUT t ắ t backward elimination. không theo nguyên t ắ ng h p th c hi n liên t c (đ a vào rùi ụ ườ ể ế ậ ầ ệ ặ
ủ ụ ự ủ ụ ự
ừ ừ
ọ ọ
ướ ướ
Th t c l a ch n t n g b Th t c l a ch n t n g b
c c
N guyen D uy Tam http://sites.google.com /site/tam 0505/
55
ủ ụ ự ủ ụ ự
ừ ừ
ọ ọ
ướ ướ
Th t c l a ch n t n g b Th t c l a ch n t n g b
c c
N guyen D uy Tam http://sites.google.com /site/tam 0505/
56
trong mô hình trong mô hình
S d ng bi n gi ử ụ S d ng bi n gi ử ụ
ế ế
ả ả
S d ng bài t p ớ ự
ử ụ ự
ậ Employee data.sav xây d ng mô hình h i ồ i ng theo s năm kinh nghi m và gi ớ ứ ươ ệ ố
quy v i d báo m c l tính. Salary = a + b1*gender + b2*prevexp (*)
1. B1: Mã hóa bi n gi ớ 2. B2: Xây d ng mô hình h i quy (*), và gi
i tính thành nh ng giá tr s ữ ế ị ố
i thích ý nghĩa c a ự ả ủ
Hãy cho bi
ồ các h s h i quy ệ ố ồ
t v n đ nào di n ra đ i v i mô hình này??? ế ấ ố ớ ề ễ
N guyen D uy Tam http://sites.google.com /site/tam 0505/
57
What’s problem???
trong mô hình trong mô hình
S d ng bi n gi ử ụ S d ng bi n gi ử ụ
ế ế
ả ả
N guyen D uy Tam http://sites.google.com /site/tam 0505/
58
trong mô hình trong mô hình
S d ng bi n gi ử ụ S d ng bi n gi ử ụ
ế ế
ả ả
Quy t ế 1. Đ i v i bi n norminal, luôn s d ng bi n gi
: t s d ng bi n gi ả ắ ử ụ
2. Đ i v i bi n ordinal có thang đo d
đ đ a vào mô ế ử ụ ả ể ư
ướ ế
ồ
i 5, luôn s d ng bi n ử ụ ng h p thang đo ợ ng ườ ư ế ượ ể ị
ồ
lương (salary) theo trình độ học vấn (edu) và số năm kinh nghiệm (exp).
59
N guyen D uy Tam http://sites.google.com /site/tam 0505/
ố ớ ế hình h i quy ồ ế ố ớ gi đ đ a vào mô hình h i quy. Trong tr ả ể ư 5 tr lên, ta có th xem bi n ordinal nh bi n đ nh l t ế ở ừ đ đ a vào mô hình h i quy. ể ư Sử dụng bài tập trinh do hoc van.sav để dự báo mức