BÀI 8 BÀI 8
PHÂN TÍCH H I QUY B I Ộ PHÂN TÍCH H I QUY B I Ộ
Ồ Ồ
MÔ HÌNH H I QUY B I Ộ Ồ MÔ HÌNH H I QUY B I Ộ Ồ
ồ ồ
ộ ộ
ị ị ủ ủ
ộ Y Y ((bi n đ nh bi n đ nh ế ế ụ ế ộ ế ụ . Phân tích h i quy c a , …, Xpp. Phân tích h i quy c a ồ ồ
Mô hình h i quy b i g m 1 bi n ph thu c ồ Mô hình h i quy b i g m 1 bi n ph thu c ồ ộ ậ XX11, …, X ngượ )) và nhi u bi n đ c l p và nhi u bi n đ c l p ngượl ế ề l ộ ậ ế ề là tìm d ng ph thu c hàm gi a chúng. Y theo Xii là tìm d ng ph thu c hàm gi a chúng. ữ ộ ụ ạ Y theo X ạ ữ ộ ụ
H I QUY TUY N TÍNH B I Ộ H I QUY TUY N TÍNH B I Ộ
Ồ Ồ
Ế Ế
H i quy tuy n tính c a Y theo X H i quy tuy n tính c a Y theo X ủ ủ ế ế ồ ồ có d ng:ạ , …, Xpp có d ng:ạ 11, …, X
e e ố ố : sai s ng u nhiên. ẫ ii: sai s ng u nhiên. ẫ
2 2
e e e s ) = 0 và và D(D(e ii) = 0 ) = s ii) =
e e ng quan nhau ng quan nhau cov(e cov( : các h s h i quy, trong đó ββkk: các h s h i quy, ệ ố ồ trong đó ệ ố ồ Đi u ki n c a mô hình ề ệ ủ Đi u ki n c a mô hình ề ệ ủ ớ E(E(e - - e có phân ph i chu n v i ẩ ố i i có phân ph i chu n v i ớ ẩ ố ấ ).). ng sai thu n nh t ph ((ph ầ ươ ng sai thu n nh t ấ ầ ươ t - Các sai s không t ự ươ t - Các sai s không t ự ươ ố ố
ộ ậ ộ ậ
không t kk không t ế ế
i i , , e ) = 0 jj) = 0 ng quan tuy n tính - Các bi n đ c l p X - Các bi n đ c l p X ế ươ ế ng quan tuy n tính ế ươ ế ).). không đa c ng tuy n tính ớv i nhau ( ộ ớ không đa c ng tuy n tính v i nhau ( ộ : Analyze\Regression\Linear … SPSS: Analyze\Regression\Linear … SPSS
Ộ Ộ
Ế Ế
ng các bi n đ c l p có ng các bi n đ c l p có ộ ậ ộ ậ ế ế
ệ ượ ệ ượ ng quan v i nhau. ng quan v i nhau.
ĐA C NG TUY N TÍNH ĐA C NG TUY N TÍNH Đa c ng tuy n tính là hi n t ế ộ Đa c ng tuy n tính là hi n t ộ ế s t ự ươ s t ự ươ
ớ ớ
H S T H S T
NG QUAN RIÊNG NG QUAN RIÊNG
Ệ Ố ƯƠ Ệ Ố ƯƠ
ng đa c ng tuy n tính, ta dùng h s t ng đa c ng tuy n tính, ta dùng h s t
ế ế
ộ ộ
ế ế
ng ng ng th t s c a các bi n đa c ng ng th t s c a các bi n đa c ng
ệ ố ươ ệ ố ươ ộ ế ộ ế
ậ ự ủ ậ ự ủ
N u có hi n t ệ ượ N u có hi n t ệ ượ quan riêng đ đánh giá nh h ể ưở quan riêng đ đánh giá nh h ể ưở ộ tuy n tính lên bi n ph thu c. tuy n tính lên bi n ph thu c. ộ
ả ả ụ ụ
ế ế
ế ế
ậ
ổ
ỉ ố ơ ể ề ươ
ư
ổ
ớ
ng quan v i nhau. ng quan th t s v i ậ ươ
ự ớ
Nh n xét. ng quan 1. Tu i và Ch s c th đ u t v i Cholesterol. Nh ng Tu i và Ch s c ỉ ố ơ ớ th cũng có t ươ ể 2. Tu i có t ổ Cholesterol.
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ng quan ng quan ộ ậ ươ ộ ậ ươ
ồ ồ
i thích s bi n thiên c a i thích s bi n thiên c a ự ế ự ế ệ ố ệ ố ủ ủ
ằ ằ
ị ị
ng quan: các bi n đ c l p t . Phân tích t B1B1. Phân tích t ế ươ ng quan: các bi n đ c l p t ế ươ tuy n tính v i bi n ph thu c đ a vào mô hình. ộ ư ụ ế ớ ế tuy n tính v i bi n ph thu c đ a vào mô hình. ộ ư ế ớ ế ụ B2B2. Ki m đ nh ANOVA s phù h p mô hình h i quy s phù h p mô hình h i quy . Ki m đ nh ị ANOVA ợ ự ể ự ợ ị ể = bb = bb HH00: : bb = 0. = …… = pp = 0. 22 = 11 = – gi ị RR22 – gi Tính h s xác đ nh ả Tính h s xác đ nh ả ị bi n d báo qua h i quy. ồ ế ự bi n d báo qua h i quy. ồ ế ự . c l B3B3. Ướ ượ c l Ướ ượ bình ph ươ bình ph ươ 0 hay không => ph 0 hay không => ph ng pháp ng các h s h i quy b ng ph ng các h s h i quy b ng ph ng pháp ng bé nh t, ki m đ nh xem các h s b ng ng bé nh t, ki m đ nh xem các h s b ng ồ ồ ươ ươ ệ ố ằ ệ ố ằ ng trình h i quy tuy n tính m u ẫ ng trình h i quy tuy n tính m u ẫ ệ ố ồ ệ ố ồ ể ấ ể ấ ươ ươ ế ế
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ủ ủ
ế ế
ỗ ỗ
ng Tolerance và nhân t ng Tolerance và nhân t
ộ ậ ộ ậ
ộ ộ ủ ủ
ưỡ ưỡ
ố ố
ỗ ỗ
ộ ộ ữ ữ
ộ ậ ộ ậ
i. ạ i. ạ
ế ế
ệ ố ươ ệ ố ươ
ặ ặ
ng quan riêng th p ho c ng quan riêng th p ho c ng VIF > 10) thì nên lo i các bi n đó ra ng VIF > 10) thì nên lo i các bi n đó ra
ố ố
ấ ấ ế ế
ạ ạ
- N u các bi n đ c l p có h s t ộ ậ ế - N u các bi n đ c l p có h s t ộ ậ ế nhân t ườ nhân t ườ kh i mô hình h i quy. ỏ kh i mô hình h i quy. ỏ
ế ế VIF l n (th ớ VIF l n (th ớ ồ ồ
. Ki m tra tính đa c ng tuy n tính c a mô hình qua: B4B4. Ki m tra tính đa c ng tuy n tính c a mô hình qua: ế ể ế ể - - T ng quan riêng gi a bi n ph thu c và m i bi n đ c l p. T ộ ậ ụ ế ươ ng quan riêng gi a bi n ph thu c và m i bi n đ c l p. ụ ộ ậ ế ươ VIF c a m i bi n đ c l p đ i - Ng ố ế VIF c a m i bi n đ c l p đ i - Ng ố ế v i các bi n đ c l p còn l ớ v i các bi n đ c l p còn l ớ
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ả ả
ề ề ả ả
ằ ằ ệ ệ
ươ ươ ẫ ẫ
B5B5. Kh o sát m u ph n d . Kh o sát m u ph n d ầ ư ẫ ẫ ầ ư - V đ th scatter các đi m đ kh o sát đi u ẽ ồ ị ể ể - V đ th scatter các đi m đ kh o sát đi u ẽ ồ ị ể ể ki n kỳ v ng b ng 0 và ph ng sai không đ i. ọ ươ ổ ki n kỳ v ng b ng 0 và ph ng sai không đ i. ọ ươ ổ - Ki m đ nh tính chu n c a m u ph n d . ể ầ ư ẫ ẩ ủ ị - Ki m đ nh tính chu n c a m u ph n d . ể ẫ ẩ ủ ị ầ ư ng quan b ng Durbin-Watson. t - Ki m đ nh tính t ằ ự ươ ị ể t - Ki m đ nh tính t ng quan b ng Durbin-Watson. ằ ể ự ươ ị . Dùng ph ng trình h i quy tuy n tính m u đ d B6B6. Dùng ph ể ự ế ồ ng trình h i quy tuy n tính m u đ d ồ ể ự ế báobáo
Ự
ồ
ế
TH C HÀNH Bài toán: trong file Cholesterol.sav, hãy phân tích h i quy tuy n tính b i c a mô hình sau: ộ ủ ế - Bi n ph thu c: ộ Cholesterol ụ - Các bi nế đ c l p:
ộ ậ Tu i, ch s BMI
ỉ ố
ổ
NG PHÁP STEPWISE NG PHÁP STEPWISE
ƯƠPH ƯƠ PH
ồ ồ ả ử ả ử
ặ ặ
ộ ậ ộ ậ
ồ ồ ừ ừ
ế ế ơ ở ơ ở ề ề
ả ả ấ ấ
ộ ậ ộ ậ ươ ươ ệ ệ ợ ợ ố ự ố ự ế ế ỏ ỏ
s mô hình phân tích h i quy g m bi n ph Gi ụ ế ồ s mô hình phân tích h i quy g m bi n ph Gi ế ồ ụ ộ ậ XXkk, k=1..p và p bi n đ c l p thu c ộthu c ộ YY và p bi n đ c l p . Bài toán đ t ra , k=1..p. Bài toán đ t ra ế ế ộ ậ là xác đ nh m t t p con c a các bi n đ c l p dùng ế ủ ộ ậ ị là xác đ nh m t t p con c a các bi n đ c l p dùng ế ủ ộ ậ ị đ d báo tuy n tính cho Y. ế ể ự đ d báo tuy n tính cho Y. ế ể ự ướ ( (Stepwise c ) giúp ta Stepwise) giúp ta h i quy t ng b ươPh ng pháp ươ c h i quy t ng b ng pháp Ph ướ ch n ra mô hình phù h p b ng cách đ a vào hay lo i ạ ư ằ ợ ọ ch n ra mô hình phù h p b ng cách đ a vào hay lo i ợ ư ọ ạ ằ ra các bi n đ c l p th t s có ý nghĩa. ậ ự ra các bi n đ c l p th t s có ý nghĩa. ậ ự i x lý d a ng pháp Stepwise, ng Trên c s ph ự ườ ử i x lý d a ng pháp Stepwise, ng Trên c s ph ự ườ ử vào các đi u ki n đ m b o c a mô hình đ l a ch n ọ ể ự ả ủ vào các đi u ki n đ m b o c a mô hình đ l a ch n ọ ể ự ả ủ ng là mô hình có h s mô hình phù h p nh t (th ệ ố ườ ng là mô hình có h s mô hình phù h p nh t (th ệ ố ườ cao, sai s d báo phân tán nh và ít bi n đ c RR22 cao, sai s d báo phân tán nh và ít bi n đ c ộ ộ l p).ậl p).ậ
Ự
ng CO ộ Hàm l ế
2 ầ ờ ng than đá, T ng s l
ộ ậ Th i gian, ph n trăm hòa tan, l ượ
ng ng hòa tan, S ố ố ượ ổ