Nguy n Duy Tâm - http://sites.google.com/site/tam0505/

1

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Con ng

ườ

i – T m nhìn m i ớ

2

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

G i I TH I U T G i I TH I U T

Ớ Ớ

Ệ Ệ

ƯƠ ƯƠ

N G QUA N – H I QUY N G QUA N – H I QUY

Ồ Ồ

ng quan

i c a h i quy

1. T ươ 2. H i quy ồ 3. Quy trình xây d ng mô hình trên SPSS ự 4. Các lo i ki m đ nh trong mô hình ị 5. Ý nghĩa h s h i quy ệ ố ồ 6. D báo v i mô hình h i quy ồ ớ 7. X lí các l ỗ ủ ồ

ự ử

3

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

 Là m i quan h tuy n tính gi a hai bi n (X và Y)

ế

ế

(rXY)

4

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Hệ số tươni quan Hệ số tươni quan

 “r” H s t

 Đ m nh c a m i quan h (m nh, y u, ho c không có quan

ộ ạ

ế

h )ệ

 Các lo i quan h ạ

ế

ế

c chi u

ế

▪ Đ ng bi n – X và Y bi n thiên cùng chi u ề ▪ Ngh ch bi n – X và Y bi n thiên ng ượ –1 đ n 1 ế

ệ ố ươ ủ ng quan… ố

ế  Kho ng bi n thiên c a r t ừ ế -1.0 0.0 +1.0 Strong Negative No Rel. Strong Positive

•Go to website!

–playing with scatterplots

5

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

ủ ả

Th c hành v i đ th phân tán Th c hành v i đ th phân tán

ớ ồ ị ớ ồ ị

ự ự

r = .__ __

r = .__ __

r = .__ __

r = .__ __

6

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

ựTh c hành trên SPSS Th c hành trên SPSS

Click here

7

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

ựTh c hành trên SPSS Th c hành trên SPSS

Nh n xét m i quan h

8

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

XÁC Đ NH H S T XÁC Đ NH H S T

NG QUAN NG QUAN

Ệ Ố ƯƠ Ệ Ố ƯƠ

Ị Ị

9

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

XÁC Đ NH H S T XÁC Đ NH H S T

NG QUAN NG QUAN

Ệ Ố ƯƠ Ệ Ố ƯƠ

Ị Ị

10

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Ki M Đ NH M I QUAN H TUY N TÍNH Ki M Đ NH M I QUAN H TUY N TÍNH

Ố Ố

Ể Ể

Ệ Ệ

Ế Ế

Ị Ị

 Ki m đ nh m i quan

ị ế

ể h tuy n tính gi a các ệ bi n.ế

1. H0: rxy =0: hai bi n ế

không có m i quan h ệ ố tuy n tính ph thu c ế nhau

2. H1: rxy <>0: hai bi n ế có m i quan h tuy n ế tính ph thu c nhau

11

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

HỒI QUY trực tiếp HỒI QUY trực tiếp

Path Diagram of A Linear Regression Analysis

X1

error

YY

X2

=

+

+

+

+

k

Y i

b x 1 1

b x 2 2

b x 3 3

e i

x3

12

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

HỒI QUY tổni hợp HỒI QUY tổni hợp

A Path Analysis Decomposition of Effects into Direct, Indirect, Spurious, and Total Effects

Error

E rror

X2

C

Y 3

A

X 1

F

E

Các lo i quan h h i quy

ệ ồ

B

Y 2

D

Tr c ti p Y3: C,E, F

ế

Error

Y 1

Gián ti p Y3: BE, BDF

ế

Error

T ng tác đ ng = Tr c ộ ổ ti p + gián ti p ế

ế

Direct Ef f ect s: Paths C, E, F

Spurious ef fect s are due t o common (ant ecedent ) causes

I ndirect Ef f ect s: Paths AC, BE, D F

T ot al Ef f ects: Sum of Direct and Indirect Ef f ect s

13

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

H I QUY T H I QUY T

NG TÁC NG TÁC

Ồ Ồ

ƯƠ ƯƠ

Interaction Analysis

X 1

A

C

Y

B

H s tác đ ng t

ng tác: C

ệ ố

ươ

X 2

ng tác l n nhau cùng tác

ươ

X1 và X2 t đ ng lên Y.

Y= K + aX1 + BX2 + CX1*X2

14

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Các lo i quan h gi a bi n ph thu c và bi n đ c l p Các lo i quan h gi a bi n ph thu c và bi n đ c l p

ế ộ ậ ế ộ ậ

ệ ữ ệ ữ

ụ ụ

ộ ộ

ế ế

ạ ạ

ỉ ế

ị ả

1. Quan h tuy n tính (linear) ệ 2. Quan h logarithmic ệ 3. Quan h hàm ngh ch đ o (inverse) ệ 4. Quan h parapol (quadratic) ệ 5. Quan h hàm b c 3 (cubic) ệ 6. Quan h hàm mũ (Power) ệ 7. Quan h logistic ệ 8. Quan h hàm tăng tr ệ 9. Quan h san b ng hàm mũ (exponential) ệ

H i quy ch xét đ i ố ồ v i h i quy tuy n ế ớ ồ tinh (đ i v i tham ố ớ s ). Nh ng m i ố ữ ố quan h phi tuy n ế ệ đ u ph i chuy n ể ả ề v quan h tuy n ế ệ ề tính) ng (growth) ưở

15

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

i quan h tuy n tính (linear) ế MM i quan h tuy n tính (linear) ế

ố ố

ệ ệ

16

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Quan h logarithmic Quan h logarithmic

ệ ệ

17

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Quan heä nihòch ñaûo (inverse – Quan heä nihòch ñaûo (inverse – hypecpol) hypecpol)

18

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Quan heä haøm baäc hai (Quadratic) Quan heä haøm baäc hai (Quadratic)

19

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Quan heä haøm baäc 3 (cubic) Quan heä haøm baäc 3 (cubic)

20

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

NGHIÊN C U CÁC NHÂN T TÁC Đ NG Đ N M C L NGHIÊN C U CÁC NHÂN T TÁC Đ NG Đ N M C L

Ư ƯƠ Ư ƯƠ

Ộ Ộ

Ố Ố

Ứ Ứ

Ế Ế

NG Hi N T I Ạ Ệ NG Hi N T I Ạ Ệ

nh ng nhân i c a ế ệ ộ ả ữ ệ ạ ủ

 BÀI T P: EMPLOYEE DATA.SAV.  Yêu c u: Hãy xây d ng mô hình h i quy mô t ồ ự (m i quan h ) tác đ ng đ n m c l ứ ươ ườ

 MH1: Lifeexpf = a + b1*calories + b2*gdp_gap  MH2: Lifeexpf = a + b1*calories + b2*Ln(gdp_gap)  MH3: Xây d ng mô hình h i quy v i Lifeexpf là bi n ph ụ ồ

Ậ ầ ng hi n t ố i lao đ ng trong công ty theo 2 mô hình sau. t ố ng ộ

ế ớ

21

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

i là bi n đ c l p thu c và t ộ ự t c các bi n còn l ấ ả ế ạ ộ ậ ế

MÔ HÌNH 1 MÔ HÌNH 1

22

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

B NG K T Qu B NG K T Qu

Ả Ả

Ế Ế

Ả Ả

KI M Đ NH T NG TH

KI M Đ NH T NG TH

 G a thi ỉ 1. H0: Mô hình không có kh ả i thích giá tr th c

t ế

ị ự ả

năng gi tế 2. Gi ế

t H1: Mô hình có i thích ể ả c a m c ứ ị ự ế ủ

23

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

thi ả th s d ng đ gi ể ử ụ giá tr th c t ngươ l

B NG K T Qu B NG K T Qu

Ả Ả

Ế Ế

Ả Ả

KI M Đ NH H S H I QUY

KI M Đ NH H S H I QUY

ệ ố ồ

ệ ố ồ

 Gi thi ả h i quy th I ồ

t đ i v i h s ế ố ớ ệ ố

ứ 1. H0: bi = 0 (bi n Xi không

2. H1: bi <> 0 (bi n Xi tác

ế tác đ ng vào Y) ế

24

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

đ ng vào Y) ộ

Ý NGHĨA H S H I QUY Ý NGHĨA H S H I QUY

Ệ Ố Ồ Ệ Ố Ồ

 Ph

 Lifeexpf = 32,77 + 0,012*calories + 0*gdp_gap

ng trình h i quy mô hình 1 đ c vi ươ ồ ượ ế t nh sau: ư

1. B1: Trong đi u ki n các nhân t ề ệ ừ ượ

khác không đ i (2 n ổ c này có l ố ế ướ ướ ượ

c ng c kia 1 calories thì

ng calories) thì n u n ơ ướ ơ c này cao h n n i dân n c kia là 0,012 ườ ướ ơ ướ

gi ng nhau tr l calories n p vào hàng ngày h n h n n ạ tu i th c a ng ọ ủ ổ tu i.ổ

2. B2: N u ch n ế mô hình

25

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

ọ α=5%, Ta đ xu t lo i bi n ề ấ ế gdp_gap ra kh i ỏ ạ

B NG K T Qu B NG K T Qu

Ả Ả

Ế Ế

Ả Ả

H s R

ệ ố 2 và R2 hi u ch nh

H S GI I THÍCH R ả 2

ệ ố

 R2 là kh năng gi ả ế

i thích 2 =

i thích

c a mô hình. N u R ủ 0,706  80,4%) thì mô hình có kh năng gi ả ả c 70,6% giá tr th c t đ ượ

. ị ự ế  Chú ý: mô hình h i quy đa ồ bi n đ c l p (h i quy b i) ế ộ ồ

ộ ậ 2

đ ể ỉ i thích c a ủ

26

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

hi u ch nh ta dùng R nêu kh năng gi ả ả mô hình. (69,8%)

D BÁO B NG MÔ HÌNH H I QUY D BÁO B NG MÔ HÌNH H I QUY

Ồ Ồ

Ự Ự

Ằ Ằ

I CÓ

ạ LINEAR

ƯỜ

T I H P THO I REGRESSION - SAVE

Ự Ề

D BÁO CHO 3 NG ĐI U KI N SAU Ệ Việt Nam Idp_iap Calories

PA1

1000

2400

PA2

1200

2500

PA3

1500

2700

ng án

ậ ữ ệ ủ

ươ

Nh p d li u c a 3 ph trên vào quan sát th 110-111- 112

27

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

K T Qu D BÁO K T Qu D BÁO

Ả Ự Ả Ự

Ế Ế

28

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Xây d ng mô hình 3 và d báo tu i th BQ c a ph n cho 3 ph

ng án c a

ụ ữ

ươ

Vi

t nam và năm 2008

29

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Gi Gi

Ả Ả

THI T C A MÔ HÌNH H I QUY B I Ộ THI T C A MÔ HÌNH H I QUY B I Ộ

Ế Ủ Ế Ủ

Ồ Ồ

1. Các bi n đ c l p ế

i thích) đ

c bi

t

1. Ph n d (resid) có ng sai không

ộ ậ ượ

ế

(gi tr

ả cướ

2. Các bi n đ c l p ộ ậ ế ng quan không t ươ v i nhau [cov(xi,xj) ớ =0]

3. Các sai s gi a giá tr ị

ố ữ

ầ ư ph ươ đ i. Var(resid) = ổ constant 2. Ph n d (resid) gi a ầ ư ữ giá tr d báo và giá ị ự tuân theo tr th c t ị ự ế phân ph i chu n. ẩ ố

ự ế

ng

30

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

và giá tr d th c t ị ự báo (ph n d , resid, ầ ư ui) không t t ự ươ quan v i nhau ớ

[cov(ui,uj) =0]

Ki M Đ NH CÁC L I C A MÔ HÌNH Ki M Đ NH CÁC L I C A MÔ HÌNH

Ỗ Ủ Ỗ Ủ

Ể Ể

Ị Ị

đ nh v s liên h tuy n tính gi a hai

ề ự

ế

bi n (đ th scatter) ồ ị

2. Kh năng tuân theo phân ph i chu n c a

ẩ ủ

3. Hi n t 4. Hi n t 5. Hi n t

1. Gi ả ị ế ả ầ ư ệ ượ ệ ượ ệ ượ

ph n d (residual) ng quan ng t t ự ươ ng đa c ng tuy n ế ộ ng sai thay đ i ng ph ổ ươ

31

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Gi Gi

ả ị ả ị

đ nh v s liên h tuy n tính (đ th scatter) ế đ nh v s liên h tuy n tính (đ th scatter) ế

ồ ị ồ ị

ề ự ề ự

ệ ệ

 Bi n đ c l p X có th gi

ộ ậ

ế

ế ộ

ế

i thích cho bi n ph ụ ể ả thu c Y khi X có m i liên h tuy n tính v i X. ệ 1. Đ th Scatter gi a X và Y có m i liên h nào đó v i nhau ớ 2. Đ th ph n d (resid) gi a ph n d và giá tr d báo ữ

ữ ệ

ố ầ ư ị ự

32

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

bi n thiên ng u nhiên ồ ị ồ ị ế ầ ư ẫ

 M i liên ố h tuy n ế ệ tính

33

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Gi Gi ả ị ả ị đ nh v s liên h tuy n tính (đ th scatter) ế đ nh v s liên h tuy n tính (đ th scatter) ế ồ ị ồ ị ề ự ề ự ệ ệ

K ieåm  tra ñ oà th ò p h aân  taù n  p h aàn  d ö  K ieåm  tra ñ oà th ò p h aân  taù n  p h aàn  d ö  (scatter) (scatter)

 B1: Tính giá tr ị ầ ư

ế

ph n d và giá tr ị d báo chu n hoá. ự  B2: V đ th phân ẽ ồ ị tán v i tr c hoành là ớ ụ Zpr và tr c tung là ụ ZRE. (Có th thêm ể ng xu vào đ ườ ng đ ki m tra h ể ể ướ m i liên h tuy n ệ ố tính)

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

34

K ieåm  ñ òn h  p h aàn  d ö coù  p h aân  p h oái  K ieåm  ñ òn h  p h aàn  d ö coù  p h aân  p h oái  ch u aån  (q u y trìn h ) ch u aån  (q u y trìn h )

KHÔNG CÓ M I LIÊN H

CÓ M I LIÊN H (CUBIC)

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

35

Ki m đ nh ph n d có phân ph i chu n Ki m đ nh ph n d có phân ph i chu n

ầ ư ầ ư

ố ố

ể ể

ẩ ẩ

ị ị

 Ta có th ki m tra kh năng tuân theo phân ph i

ể ể

ẩ ủ

chu n c a resid thông qua hai đ th ồ ị 1. Đồ thị tần số Histogram 2. Đồ thị Q-Q plot

36

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Ki m đ nh ph n d có phân ph i chu n Ki m đ nh ph n d có phân ph i chu n

ầ ư ầ ư

ố ố

ể ể

ẩ ẩ

ị ị

Đ TH HISTOGRAM

Đ TH HISTOGRAM

37

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Ki m đ nh ph n d có phân ph i chu n Ki m đ nh ph n d có phân ph i chu n

ầ ư ầ ư

ố ố

ể ể

ẩ ẩ

ị ị

Đ TH Q-Q PLOT

Đ TH Q-Q PLOT

38

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

Kieåm ñònh hieän töôïni phöôni sai Kieåm ñònh hieän töôïni phöôni sai khoâni ñoåi khoâni ñoåi

 Là hi n t

ng các

39

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

ệ ượ sai s (resid) có ố ng quan m i t ố ươ v i giá tr d báo ị ự ớ (Y^).

Kieåm ñònh hieän töôïni phöôni sai thay Kieåm ñònh hieän töôïni phöôni sai thay ñoåiñoåi

NG

ệ ố ƯƠ

QUY TRÌNH

KI M Đ NH H S T ể QUAN

B1: Ch y h i quy, l y ph n ầ ấ

B2: T o bi n tr tuy t đ i c a ị ệ ố ủ

ệ ố ươ ể

ồ ạ d (resid) ư ế ạ resid (ABS_resid). B3. Ki m đ nh h s t ị ữ

ph ươ H1: Ng

ng quan gi a bi n ABS_resid ế v i t ng bi n đ c l p ế ớ ừ ng H0: Không có hi n t

40

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

ộ ậ ệ ượ ng sai thay đ i ổ i c l ượ ạ

Kieåm ñònh hieän töôïni töï töôni quan Kieåm ñònh hieän töôïni töï töôni quan (autocorrelation) (autocorrelation)

 Là hi n t có m i t

ệ ượ ố ươ

e

-e

1

i

i

ei

ng các thành ph n trong ph n d ầ ư ầ εi ,εj) <> 0] ng quan v i nhau [cov( ớ = Tương quan bậc 1:

2

p

r

+

+

+

+

r

r

...

e

e

e

e

+ r

i

i

1

i

2

pi

ei

= Tương quan bậc p:

0

-1

1

Tương quan nghịch

Tương quan nghịch

41

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

- - -

K ieåm  ñ òn h  h ieän  töôïn g  töï töôn g  q u an   K ieåm  ñ òn h  h ieän  töôïn g  töï töôn g  q u an   (au tocorrelation ) (au tocorrelation )

Durbin Watson d

-

tests first order

autocorrelation of residuals

n

-

-

(

)

2

e t

-

1

d

=(cid:229)

= 1

i

)r

e t e t ( = 12

-

d

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

42

K ieåm  ñ òn h  h ieän  töôïn g  töï töôn g  q u an   K ieåm  ñ òn h  h ieän  töôïn g  töï töôn g  q u an   (au to) (au to)

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

43

K ieåm  ñ òn h  h ieän  töôïn g  töï töôn g  q u an   K ieåm  ñ òn h  h ieän  töôïn g  töï töôn g  q u an   (au to) (au to)

CÁCH PHÁT HI Nệ

CÁCH PHÁT HI Nệ

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

44

K ieåm  ñ òn h  h ieän  töôïn g  ñ a coän g  tu yeán   K ieåm  ñ òn h  h ieän  töôïn g  ñ a coän g  tu yeán   (collin ear) (collin ear)

 Có th phát hi n hi n t

ng đa c ng tuy n d a

ệ ượ

ế ự

ệ vào các cách sau

1. Đ ch p nh n Tolerance = 1-R 2

ộ ấ

k

=

=

VIF

2

1. H s phóng đ i ph

ng sai

ệ ố

ươ

1 Tolerance

1

1 Rk

1. Ma tr n h s t ậ

ệ ố ươ

ng quan gi a các bi n ế ữ

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

45

-

K ieåm  ñ òn h  h ieän  töôïn g  ñ a coän g  tu yeán   K ieåm  ñ òn h  h ieän  töôïn g  ñ a coän g  tu yeán   (collin ear) (collin ear)

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

46

ọ ọ

ế ế

ườ ườ

i  i

ủ ụ ủ ụ Th  t c ch n  b i n  n h an h  (d àn h  ch o n g Th  t c ch n  b i n  n h an h  (d àn h  ch o n g ườ ườ l i b i n   l i b i n

ế  )) ế

c (stepwise

1. Th t c đ a vào d n (forward sellection) ầ 2. Th t c lo i tr d n (Backward elimination) ạ ừ ầ 3. Th t c ch n t ng b ọ ừ

ướ

ủ ụ ư ủ ụ ủ ụ sellection)

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

47

Th t c đ a vào d n Th t c đ a vào d n

ủ ụ ư ủ ụ ư

ầ ầ

t: D a trên h s t ắ ậ ự ệ ố ươ ị

ộ ậ ế

c đ a vào tr

ộ ớ ừ c. ướ c đ a vào:

 Đi u ki n đ 1. Th a mãn đi u ki n th ng kê F (FIN: th ng đê đ a vào) 2. Th a mãn đi u ki n xác su t đ a vào (PIN: xác su t đ đ a ấ ư

ư ố ố

 Nguyên t ng quan thu n (ngh ch) l n ớ gi a bi n ph thu c v i t ng bi n đ c l p. Bi n nào l n ớ ế ụ ế ữ nh t đ ấ ượ ư ề ỏ ỏ vào)

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

48

ệ ượ ư ệ ề ệ ề ấ ể ư

Th t c đ a vào d n Th t c đ a vào d n

ủ ụ ư ủ ụ ư

ầ ầ

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

49

Th t c đ a vào d n Th t c đ a vào d n

ủ ụ ư ủ ụ ư

ầ ầ

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

50

ừ ầ ừ ầ

ủ ụ ủ ụ

ạ ạ Th  t c lo i tr  d n Th  t c lo i tr  d n

 Nguyên t

ấ ả ứ ế

t: T t c các bi n vào mô hình. Và căn c vào bi n ạ ấ ầ

i mô hình (FOUT: th ng đê l ắ nào có m i t ố ươ  Đi u ki n đ ệ ượ 1. Không tho mãn đi u ki n ả ế ng quan th p nh t lo i ra d n ấ c lo i tr : ạ ừ ề ệ ở ạ ố

2. Không tho mãn đi u ki n

đ a vào) ư

l ệ ở ạ ề ả i mô hình (POUT: xác su t đ ấ ể

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

51

đ a vào) ư

ừ ầ ừ ầ

ủ ụ ủ ụ

ạ ạ Th  t c lo i tr  d n Th  t c lo i tr  d n

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

52

ừ ầ ừ ầ

ủ ụ ủ ụ

ạ ạ Th  t c lo i tr  d n Th  t c lo i tr  d n

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

53

ủ ụ ự ủ ụ ự

ừ ừ

ọ ọ

ướ ướ

Th  t c l a ch n  t n g  b Th  t c l a ch n  t n g  b

c c

 Nguyên t

t: Theo trình t ắ ộ

ự ư ầ t forward sellection, sau đó, xét bi n này có th t n t , đ a d n vào m t bi n theo nguyên i hay ế ể ồ ạ ế

ự ư ợ

 Chú ý: đ tránh tr đ a ra, c n thi ư

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

54

t l p FIN>FOUT ho c PIN < POUT t ắ t backward elimination. không theo nguyên t ắ ng h p th c hi n liên t c (đ a vào rùi ụ ườ ể ế ậ ầ ệ ặ

ủ ụ ự ủ ụ ự

ừ ừ

ọ ọ

ướ ướ

Th  t c l a ch n  t n g  b Th  t c l a ch n  t n g  b

c c

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

55

ủ ụ ự ủ ụ ự

ừ ừ

ọ ọ

ướ ướ

Th  t c l a ch n  t n g  b Th  t c l a ch n  t n g  b

c c

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

56

trong mô hình trong mô hình

S d ng bi n gi ử ụ S d ng bi n gi ử ụ

ế ế

ả ả

 S d ng bài t p ớ ự

ử ụ ự

ậ Employee data.sav xây d ng mô hình h i ồ i ng theo s năm kinh nghi m và gi ớ ứ ươ ệ ố

quy v i d báo m c l tính. Salary = a + b1*gender + b2*prevexp (*)

1. B1: Mã hóa bi n gi ớ 2. B2: Xây d ng mô hình h i quy (*), và gi

i tính thành nh ng giá tr s ữ ế ị ố

i thích ý nghĩa c a ự ả ủ

 Hãy cho bi

ồ  các h s h i quy ệ ố ồ

t v n đ nào di n ra đ i v i mô hình này??? ế ấ ố ớ ề ễ

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

57

What’s problem???

trong mô hình trong mô hình

S d ng bi n gi ử ụ S d ng bi n gi ử ụ

ế ế

ả ả

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

58

trong mô hình trong mô hình

S d ng bi n gi ử ụ S d ng bi n gi ử ụ

ế ế

ả ả

 Quy t ế 1. Đ i v i bi n norminal, luôn s d ng bi n gi

: t s d ng bi n gi ả ắ ử ụ

2. Đ i v i bi n ordinal có thang đo d

đ đ a vào mô ế ử ụ ả ể ư

ướ ế

i 5, luôn s d ng bi n ử ụ ng h p thang đo ợ ng ườ ư ế ượ ể ị

lương (salary) theo trình độ học vấn (edu) và số năm kinh nghiệm (exp).

59

N guyen D uy Tam  ­ http://sites.google.com /site/tam 0505/

ố ớ ế hình h i quy ồ ế ố ớ gi đ đ a vào mô hình h i quy. Trong tr ả ể ư 5 tr lên, ta có th xem bi n ordinal nh bi n đ nh l t ế ở ừ đ đ a vào mô hình h i quy. ể ư  Sử dụng bài tập trinh do hoc van.sav để dự báo mức