BÀI 8 BÀI 8

PHÂN TÍCH H I QUY B I Ộ PHÂN TÍCH H I QUY B I Ộ

Ồ Ồ

MÔ HÌNH H I QUY B I Ộ Ồ MÔ HÌNH H I QUY B I Ộ Ồ

ồ ồ

ộ ộ

ị ị ủ ủ

ộ Y Y ((bi n đ nh bi n đ nh ế ế ụ ế ộ ế ụ . Phân tích h i quy c a , …, Xpp. Phân tích h i quy c a ồ ồ

Mô hình h i quy b i g m 1 bi n ph thu c ồ  Mô hình h i quy b i g m 1 bi n ph thu c ồ ộ ậ XX11, …, X ngượ )) và nhi u bi n đ c l p và nhi u bi n đ c l p ngượl ế ề l ộ ậ ế ề là tìm d ng ph thu c hàm gi a chúng. Y theo Xii là tìm d ng ph thu c hàm gi a chúng. ữ ộ ụ ạ Y theo X ạ ữ ộ ụ

H I QUY TUY N TÍNH B I Ộ H I QUY TUY N TÍNH B I Ộ

Ồ Ồ

Ế Ế

H i quy tuy n tính c a Y theo X  H i quy tuy n tính c a Y theo X ủ ủ ế ế ồ ồ có d ng:ạ , …, Xpp có d ng:ạ 11, …, X

e e ố ố : sai s ng u nhiên. ẫ ii: sai s ng u nhiên. ẫ

2 2

e e e s ) = 0 và và D(D(e ii) = 0 ) = s ii) =

e e ng quan nhau ng quan nhau cov(e cov( : các h s h i quy, trong đó ββkk: các h s h i quy, ệ ố ồ trong đó ệ ố ồ Đi u ki n c a mô hình ề ệ ủ  Đi u ki n c a mô hình ề ệ ủ ớ E(E(e - - e có phân ph i chu n v i ẩ ố i i có phân ph i chu n v i ớ ẩ ố ấ ).). ng sai thu n nh t ph ((ph ầ ươ ng sai thu n nh t ấ ầ ươ t - Các sai s không t ự ươ t - Các sai s không t ự ươ ố ố

ộ ậ ộ ậ

không t kk không t ế ế

i i , , e ) = 0 jj) = 0 ng quan tuy n tính - Các bi n đ c l p X - Các bi n đ c l p X ế ươ ế ng quan tuy n tính ế ươ ế ).). không đa c ng tuy n tính ớv i nhau ( ộ ớ không đa c ng tuy n tính v i nhau ( ộ : Analyze\Regression\Linear … SPSS: Analyze\Regression\Linear …  SPSS

Ộ Ộ

Ế Ế

ng các bi n đ c l p có ng các bi n đ c l p có ộ ậ ộ ậ ế ế

ệ ượ ệ ượ ng quan v i nhau. ng quan v i nhau.

ĐA C NG TUY N TÍNH ĐA C NG TUY N TÍNH Đa c ng tuy n tính là hi n t ế ộ  Đa c ng tuy n tính là hi n t ộ ế s t ự ươ s t ự ươ

ớ ớ

H S T H S T

NG QUAN RIÊNG NG QUAN RIÊNG

Ệ Ố ƯƠ Ệ Ố ƯƠ

ng đa c ng tuy n tính, ta dùng h s t ng đa c ng tuy n tính, ta dùng h s t

ế ế

ộ ộ

ế ế

ng ng ng th t s c a các bi n đa c ng ng th t s c a các bi n đa c ng

ệ ố ươ ệ ố ươ ộ ế ộ ế

ậ ự ủ ậ ự ủ

N u có hi n t ệ ượ  N u có hi n t ệ ượ quan riêng đ đánh giá nh h ể ưở quan riêng đ đánh giá nh h ể ưở ộ tuy n tính lên bi n ph thu c. tuy n tính lên bi n ph thu c. ộ

ả ả ụ ụ

ế ế

ế ế

ỉ ố ơ ể ề ươ

ư

ng quan v i nhau. ng quan th t s v i ậ ươ

ự ớ

Nh n xét. ng quan 1. Tu i và Ch s c th đ u t v i Cholesterol. Nh ng Tu i và Ch s c ỉ ố ơ ớ th cũng có t ươ ể 2. Tu i có t ổ Cholesterol.

CÁC B CÁC B

C PHÂN TÍCH C B N C PHÂN TÍCH C B N

ƯỚ ƯỚ

Ơ Ả Ơ Ả

ng quan ng quan ộ ậ ươ ộ ậ ươ

ồ ồ

i thích s bi n thiên c a i thích s bi n thiên c a ự ế ự ế ệ ố ệ ố ủ ủ

ằ ằ

ị ị

ng quan: các bi n đ c l p t . Phân tích t B1B1. Phân tích t ế ươ ng quan: các bi n đ c l p t ế ươ tuy n tính v i bi n ph thu c đ a vào mô hình. ộ ư ụ ế ớ ế tuy n tính v i bi n ph thu c đ a vào mô hình. ộ ư ế ớ ế ụ B2B2. Ki m đ nh ANOVA s phù h p mô hình h i quy s phù h p mô hình h i quy . Ki m đ nh ị ANOVA ợ ự ể ự ợ ị ể = bb = bb HH00: : bb = 0. = …… = pp = 0. 22 = 11 = – gi ị RR22 – gi Tính h s xác đ nh ả Tính h s xác đ nh ả ị bi n d báo qua h i quy. ồ ế ự bi n d báo qua h i quy. ồ ế ự . c l B3B3. Ướ ượ c l Ướ ượ bình ph ươ bình ph ươ 0 hay không => ph 0 hay không => ph ng pháp ng các h s h i quy b ng ph ng các h s h i quy b ng ph ng pháp ng bé nh t, ki m đ nh xem các h s b ng ng bé nh t, ki m đ nh xem các h s b ng ồ ồ ươ ươ ệ ố ằ ệ ố ằ ng trình h i quy tuy n tính m u ẫ ng trình h i quy tuy n tính m u ẫ ệ ố ồ ệ ố ồ ể ấ ể ấ ươ ươ ế ế

CÁC B CÁC B

C PHÂN TÍCH C B N C PHÂN TÍCH C B N

ƯỚ ƯỚ

Ơ Ả Ơ Ả

ủ ủ

ế ế

ỗ ỗ

ng Tolerance và nhân t ng Tolerance và nhân t

ộ ậ ộ ậ

ộ ộ ủ ủ

ưỡ ưỡ

ố ố

ỗ ỗ

ộ ộ ữ ữ

ộ ậ ộ ậ

i. ạ i. ạ

ế ế

ệ ố ươ ệ ố ươ

ặ ặ

ng quan riêng th p ho c ng quan riêng th p ho c ng VIF > 10) thì nên lo i các bi n đó ra ng VIF > 10) thì nên lo i các bi n đó ra

ố ố

ấ ấ ế ế

ạ ạ

- N u các bi n đ c l p có h s t ộ ậ ế - N u các bi n đ c l p có h s t ộ ậ ế nhân t ườ nhân t ườ kh i mô hình h i quy. ỏ kh i mô hình h i quy. ỏ

ế ế VIF l n (th ớ VIF l n (th ớ ồ ồ

. Ki m tra tính đa c ng tuy n tính c a mô hình qua: B4B4. Ki m tra tính đa c ng tuy n tính c a mô hình qua: ế ể ế ể - - T ng quan riêng gi a bi n ph thu c và m i bi n đ c l p. T ộ ậ ụ ế ươ ng quan riêng gi a bi n ph thu c và m i bi n đ c l p. ụ ộ ậ ế ươ VIF c a m i bi n đ c l p đ i - Ng ố ế VIF c a m i bi n đ c l p đ i - Ng ố ế v i các bi n đ c l p còn l ớ v i các bi n đ c l p còn l ớ

CÁC B CÁC B

C PHÂN TÍCH C B N C PHÂN TÍCH C B N

ƯỚ ƯỚ

Ơ Ả Ơ Ả

ả ả

ề ề ả ả

ằ ằ ệ ệ

ươ ươ ẫ ẫ

B5B5. Kh o sát m u ph n d . Kh o sát m u ph n d ầ ư ẫ ẫ ầ ư - V đ th scatter các đi m đ kh o sát đi u ẽ ồ ị ể ể - V đ th scatter các đi m đ kh o sát đi u ẽ ồ ị ể ể ki n kỳ v ng b ng 0 và ph ng sai không đ i. ọ ươ ổ ki n kỳ v ng b ng 0 và ph ng sai không đ i. ọ ươ ổ - Ki m đ nh tính chu n c a m u ph n d . ể ầ ư ẫ ẩ ủ ị - Ki m đ nh tính chu n c a m u ph n d . ể ẫ ẩ ủ ị ầ ư ng quan b ng Durbin-Watson. t - Ki m đ nh tính t ằ ự ươ ị ể t - Ki m đ nh tính t ng quan b ng Durbin-Watson. ằ ể ự ươ ị . Dùng ph ng trình h i quy tuy n tính m u đ d B6B6. Dùng ph ể ự ế ồ ng trình h i quy tuy n tính m u đ d ồ ể ự ế báobáo

ế

TH C HÀNH Bài toán: trong file Cholesterol.sav, hãy phân tích h i quy tuy n tính b i c a mô hình sau: ộ ủ ế - Bi n ph thu c: ộ Cholesterol ụ - Các bi nế đ c l p:

ộ ậ Tu i, ch s BMI

ỉ ố

NG PHÁP STEPWISE NG PHÁP STEPWISE

ƯƠPH ƯƠ PH

ồ ồ ả ử ả ử

ặ ặ

ộ ậ ộ ậ

ồ ồ ừ ừ

ế ế ơ ở ơ ở ề ề

ả ả ấ ấ

ộ ậ ộ ậ ươ ươ ệ ệ ợ ợ ố ự ố ự ế ế ỏ ỏ

s mô hình phân tích h i quy g m bi n ph Gi ụ ế ồ s mô hình phân tích h i quy g m bi n ph  Gi ế ồ ụ ộ ậ XXkk, k=1..p và p bi n đ c l p thu c ộthu c ộ YY và p bi n đ c l p . Bài toán đ t ra , k=1..p. Bài toán đ t ra ế ế ộ ậ là xác đ nh m t t p con c a các bi n đ c l p dùng ế ủ ộ ậ ị là xác đ nh m t t p con c a các bi n đ c l p dùng ế ủ ộ ậ ị đ d báo tuy n tính cho Y. ế ể ự đ d báo tuy n tính cho Y. ế ể ự ướ ( (Stepwise c ) giúp ta Stepwise) giúp ta h i quy t ng b ươPh ng pháp ươ c h i quy t ng b ng pháp  Ph ướ ch n ra mô hình phù h p b ng cách đ a vào hay lo i ạ ư ằ ợ ọ ch n ra mô hình phù h p b ng cách đ a vào hay lo i ợ ư ọ ạ ằ ra các bi n đ c l p th t s có ý nghĩa. ậ ự ra các bi n đ c l p th t s có ý nghĩa. ậ ự i x lý d a ng pháp Stepwise, ng Trên c s ph ự ườ ử i x lý d a ng pháp Stepwise, ng  Trên c s ph ự ườ ử vào các đi u ki n đ m b o c a mô hình đ l a ch n ọ ể ự ả ủ vào các đi u ki n đ m b o c a mô hình đ l a ch n ọ ể ự ả ủ ng là mô hình có h s mô hình phù h p nh t (th ệ ố ườ ng là mô hình có h s mô hình phù h p nh t (th ệ ố ườ cao, sai s d báo phân tán nh và ít bi n đ c RR22 cao, sai s d báo phân tán nh và ít bi n đ c ộ ộ l p).ậl p).ậ

ng CO ộ Hàm l ế

2 ầ ờ ng than đá, T ng s l

ộ ậ Th i gian, ph n trăm hòa tan, l ượ

ng ng hòa tan, S ố ố ượ ổ

TH C HÀNH Bài toán: Trong file HamluongCO2.sav, phân tích h i ồ quy tuy n tính c a mô hình: ủ ế - Bi n ph thu c: ụ ượ - Các bi n đ c l p: ế d u, l ượ ầ Hydrogen tiêu thụ.