BÀI 7 BÀI 7 PHÂN TÍCH H I QUY Đ N PHÂN TÍCH H I QUY Đ N
Ơ Ơ
Ồ Ồ
Ụ
ỤM C ĐÍCH M C ĐÍCH
ươ ươ
Phân tích h i quy là ph ng pháp phân tích th ng kê ồ ố Phân tích h i quy là ph ng pháp phân tích th ng kê ồ ố (bi n d bi n ph thu c đ d đoán giá tr c a ị ủ bi n ph thu c ự ộ (bi n d ế ụ ế ể ự đ d đoán giá tr c a ộ ự ế ụ ế ị ủ ể ự (bi n dùng đ d báo). bi n đ c l p báo) theo các bi n đ c l p ể ự ế ế ộ ậ (bi n dùng đ d báo). báo) theo các ể ự ế ế ộ ậ D đoán chi u cao c a con cái theo các y u t Ví dụVí dụ:: D đoán chi u cao c a con cái theo các y u t ủ ề ủ ề ế ố ế ố ự ự
nh : ưnh : ư
ệ ệ ng quan ng quan đ l a ch n mô đ l a ch n mô - Chi u cao b , m ề ẹ ố - Chi u cao b , m ề ẹ ố ng - Ch đ dinh d ưỡ ế ộ ng - Ch đ dinh d ưỡ ế ộ - Các môn th thao t p luy n … ậ - Các môn th thao t p luy n … ậ ươ ươ ể ự ể ự ọ ọ
ể ể phân tích t ựD a vào ự phân tích t D a vào hình h i quy phù h p. hình h i quy phù h p. ợ ợ ồ ồ
MÔ HÌNH H I QUY Đ N Ồ MÔ HÌNH H I QUY Đ N Ồ
Ơ Ơ
ồ ồ
ế ế
ị ị
ế ế
Mô hình h i quy đ n g m 1 bi n ph thu c ồ Mô hình h i quy đ n g m 1 bi n ph thu c ồ ngượ )) và 1 bi n đ c l p ngượl và 1 bi n đ c l p ủ l ủ tìm d ng ph thu c hàm gi a chúng (d a vào đ th scatter). ồ ị ộ ụ ạ tìm d ng ph thu c hàm gi a chúng (d a vào đ th scatter). ộ ồ ị ụ ạ
ộ Y Y ((bi n đ nh bi n đ nh ơ ế ụ ơ ế ộ ụ ộ ậ XX. Phân tích h i quy c a Y theo X là . Phân tích h i quy c a Y theo X là ồ ồ ộ ậ ữ ữ
ự ự
Phi tuy nế
Tuy n tính ế
NG Đ NG Đ
C L ƯỚ ƯỢ C L ƯỚ ƯỢ
ƯỜ ƯỜ
NG H I QUY Ồ NG H I QUY Ồ
ng bé nh t ấ ng bé nh t ấ
Phi tuy nế
Tuy n tính ế
Dùng ph ươ Dùng ph ươ c l đ ể ướ ượ đ c l ể ướ ượ ng pháp c l ướ ượ ng pháp c l ướ ượ ng các h s trong đ ệ ố ng các h s trong đ ệ ố ng bình ph ươ ng bình ph ươ ng h i quy. ồ ườ ng h i quy. ườ ồ
H I QUY TUY N TÍNH Đ N Ế H I QUY TUY N TÍNH Đ N Ế
Ơ Ơ
Ồ Ồ
Mô hình h i quy tuy n tính c a Y theo X có d ng: Mô hình h i quy tuy n tính c a Y theo X có d ng: ủ ủ ế ế ạ ạ ồ ồ
e e ệ ố ồ ệ ố ồ ố ố : h s h i quy, trong đó ββ00, β, β11: h s h i quy, trong đó : sai s ng u nhiên. ẫ ii: sai s ng u nhiên. ẫ
2 2
e e e s ) = 0 và và D(D(e ii) = 0 ) = s ii) =
ề ề ớ E(E(e có phân ph i chu n v i ố i i có phân ph i chu n v i ớ ố ươ ươ
e e ng quan nhau ng quan nhau cov(e cov( Đi u ki n c a mô hình ệ ủ Đi u ki n c a mô hình ệ ủ - - e ẩ ẩ ổ ).). ng sai không đ i ph ((ph ng sai không đ i ổ t - Các sai s không t ự ươ t - Các sai s không t ự ươ ố ố
i i , , e
SPSS
) = 0 jj) = 0
: Analyze\Regression\Linear … SPSS: Analyze\Regression\Linear …
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ộ ậ ộ ậ
ươ ươ
ng quan tuy n tính v i ớ ế ng quan tuy n tính v i ớ ế
. Phân tích t B1B1. Phân tích t bi n ph thu c Y và ph bi n ph thu c Y và ph
ng quan: bi n đ c l p X t ế ng quan: bi n đ c l p X t ế ng sai sai s không đ i. ổ ố ươ ng sai sai s không đ i. ổ ươ ố
ươ ươ ộ ộ
ụ ụ
ế ế
RP = 0.966
RP = 0.872
ng sai thu n
Ph
ầ
ươ
ng sai không thu n nh t ấ
ầ
Ph ươ nh tấ
Dùng các phép bi n đ i s li u
ổ ố ệ
ế
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ANOVA s phù h p mô hình h i quy s phù h p mô hình h i quy ợ ợ
ự ự
ồ ồ
i thích s bi n thiên c a bi n d báo i thích s bi n thiên c a bi n d báo
– gi ị RR22 – gi ị
ả ả
ự ế ự ế
ủ ủ
ự ự
ế ế
B2B2. Ki m đ nh . Ki m đ nh ị ANOVA ể ị ể HH00: β: β11 = 0 = 0 H s xác đ nh ệ ố H s xác đ nh ệ ố qua h i quy. ồ qua h i quy. ồ
ậ
ế
ế
ộ
Nh n xét: -Mô hình đ t ra là ặ phù h p. ợ -Bi n đ c l p x có ế ộ ậ i thích đ n th gi ể ả 93.3% s bi n thiên ự ế c a bi n ph thu c ụ ủ y1
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ệ ố ồ ệ ố ồ
ươ ươ
ng ng ng ng
ng các h s h i quy b ng ph ng các h s h i quy b ng ph ể ể
ằ ằ ệ ố ằ ệ ố ằ
ươ ươ ươ ươ
. ng pháp bình ph B3B3. ng pháp bình ph bé nh t, ki m đ nh xem các h s b ng 0 hay không => ph bé nh t, ki m đ nh xem các h s b ng 0 hay không => ph trình h i quy tuy n tính m u ẫ trình h i quy tuy n tính m u ẫ
c l Ướ ượ c l Ướ ượ ấ ấ ồ ồ
ị ị ế ế
ậ
ề
Nh n xét: -Các h s h i quy đ u khác 0. -Ph
ệ ố ồ ng trình đ
ng h i quy thu đ
c là
ươ
ườ
ồ
ượ
Y1 = 2.298 + 1.802 X
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ề ề
ể ể
ệ ệ
ể ể
ả ả
ả ả ẽ ồ ị ẽ ồ ị ằ ằ
B4B4. Kh o sát m u ph n d . Kh o sát m u ph n d ầ ư ẫ ẫ ầ ư - V đ th scatter các đi m đ kh o sát đi u ki n kỳ - V đ th scatter các đi m đ kh o sát đi u ki n kỳ v ng b ng 0 và ph ng sai không đ i. ươ ọ ổ v ng b ng 0 và ph ng sai không đ i. ươ ọ ổ - Ki m đ nh tính chu n c a m u ph n d . ầ ư ẫ ẩ ủ ị - Ki m đ nh tính chu n c a m u ph n d . ị ẫ ẩ ủ ầ ư ng quan b ng Durbin-Watson. t - Ki m đ nh tính t ự ươ ị ng quan b ng Durbin-Watson. t - Ki m đ nh tính t ự ươ ị
ể ể ể ể
ằ ằ
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
c c ướ B1 -> B4 ướ ư ư ề ề
ạ ượ ạ ượ ể ự ể ự
c trên, ta thu đ
ọ
c thì ta đ a ra đ u đ t đ B1 -> B4 đ u đ t đ B5B5. N u các b . N u các b ế c thì ta đ a ra ế mô hình h i quy sau cùng và nó đ d báo (n u mô ế ồ mô hình h i quy sau cùng và nó đ d báo (n u mô ồ ế hình có hi u qu cao) ệ hình có hi u qu cao) ệ ả ả
Ví d : ụ -V i các minh h a trong các b ớ quy gi a X và Y1 r t hi u qu v i ph ấ
ướ ả ớ
ữ
c mô hình h i ồ ượ ng trình h i quy là ồ
ươ
ệ Y1 = 2.298 + 1.802 X
ơ ị i. c l ượ ạ
ơ
ị
ủ
ự
ự
ị
ị
-Ý nghĩa h s h i quy: giá tr c a X tăng lên 1 đ n v thì trung ệ ố ồ ị ủ bình, giá tr c a Y1 tăng lên 1.802 đ n v và ng ị ủ -D báo: v i giá tr quan sát c a X = 5 thì d báo giá tr trung bình ớ mà Y1 nh n là 11.308 ậ
Ự
ủ
ồ
ế ộ Cholesterol
ế
TH C HÀNH Bài toán: trong file Cholesterol.sav, hãy phân tích h i quy tuy n tính c a mô hình sau: - Bi n ph thu c: ụ - Bi nế đ c l p: ộ ậ Tu iổ
H I QUY PHI TUY N Đ N H I QUY PHI TUY N Đ N
Ế Ơ Ế Ơ
Ồ Ồ
ự ươ ự ươ
ế ế
ọ ọ ế ế
ả ế ả ế
ườ ườ ộ ộ ề ề ế ế
ng quan Trong phân tích h i quy đ n, n u s t ế ồ ơ Trong phân tích h i quy đ n, n u s t ng quan ế ồ ơ gi a bi n ph thu c và bi n đ c l p không ph i là ả ộ ậ ế ộ ụ ữ gi a bi n ph thu c và bi n đ c l p không ph i là ế ả ộ ậ ộ ụ ữ ế .. h i quy phi tuy n d ng tuy n tính thì g i là ồ ạ h i quy phi tuy n d ng tuy n tính thì g i là ế ồ ạ Nói chung, h i quy phi tuy n r t ph c t p. Thông ứ ạ ế ồ Nói chung, h i quy phi tuy n r t ph c t p. Thông ứ ạ ế ồ ng ta dùng các phép đ i bi n cho c bi n ph th ụ ổ ng ta dùng các phép đ i bi n cho c bi n ph th ổ ụ thu c và bi n đ c l p đ chuy n v mô hình h i ồ ể ộ ậ thu c và bi n đ c l p đ chuy n v mô hình h i ộ ậ ồ ể quy tuy n tính, g i là ế ọ quy tuy n tính, g i là ọ
ấ ấ ế ế ể ể .. ếtuy n tính hóa mô hình ế tuy n tính hóa mô hình ế s ta xây d ng mô hình h i quy phi tuy n ế ồ ả ử s ta xây d ng mô hình h i quy phi tuy n ế ồ ả ử Gi Ví dụVí dụ::Gi ự ự
ế ếTuy n tính hóa mô hình Tuy n tính hóa mô hình : Đ t ặ: Đ t ặ
M T S D NG TUY N TÍNH HÓA M T S D NG TUY N TÍNH HÓA
Ộ Ố Ạ Ộ Ố Ạ
Ế Ế
ụ ụ ế ế ộ Y Y ộ
SPSS
Xét mô hình h i quy phi tuy n gi a bi n ph thu c ế ồ ữ Xét mô hình h i quy phi tuy n gi a bi n ph thu c ế ồ ữ . M t s d ng tuy n tính hóa: ộ ậ XX. M t s d ng tuy n tính hóa: và bi n đ c l p ộ ố ạ và bi n đ c l p ộ ố ạ ộ ậ ế ế ế ế
: Analyze\Regression\Curve Estimation … SPSS: Analyze\Regression\Curve Estimation …
CÁC B CÁC B
C PHÂN TÍCH C B N C PHÂN TÍCH C B N
ƯỚ ƯỚ
Ơ Ả Ơ Ả
ộ ộ ồ ồ ể ể ể ể
ọ ọ ế ế ế ế ụ ụ ụ ụ ộ ậ ộ ậ
ồ ồ ự ự
ệ ố ệ ố ằ ằ i thích s bi n thiên c a ả i thích s bi n thiên c a ả ự ế ự ế ủ ủ
. Dùng bi u đ Scatter đ tìm ki u ph thu c phi B1B1. Dùng bi u đ Scatter đ tìm ki u ph thu c phi ể ể tuy n gi a bi n ph thu c và bi n đ c l p => ch n ộ ữ ế tuy n gi a bi n ph thu c và bi n đ c l p => ch n ộ ữ ế mô hình. mô hình. B2B2. Ki m đ nh . Ki m đ nh ANOVA s phù h p mô hình h i quy s phù h p mô hình h i quy ể ợ ị ANOVA ể ợ ị HH00: Các h s h i quy b ng 0. : Các h s h i quy b ng 0. ệ ố ồ ệ ố ồ – gi ị RR22 – gi ị ồ ồ ệ ố ồ ệ ố ồ ể ể ị ị
ế ế
ạ ạ ẫ ẫ ầ ầ
ả ả ng t ng t ự ự ồ ồ
Tính h s xác đ nh Tính h s xác đ nh bi n d báo qua h i quy. ế ự bi n d báo qua h i quy. ế ự . c l B3B3. ng các h s h i quy và ki m đ nh xem các Ướ ượ ng các h s h i quy và ki m đ nh xem các c l Ướ ượ ng trình h i quy phi h s b ng 0 hay không => Ph ồ ươ ệ ố ằ ng trình h i quy phi h s b ng 0 hay không => Ph ồ ươ ệ ố ằ tuy n m u theo mô hình đã ch n. ọ ẫ tuy n m u theo mô hình đã ch n. ọ ẫ . Kh o sát m u ph n d . Các mô hình d ng 1 thì B4B4. Kh o sát m u ph n d . Các mô hình d ng 1 thì ư ư trong h i quy tuy n tính; các mô hình d ng t ạ ế ươ trong h i quy tuy n tính; các mô hình d ng t ạ ế ươ 2 thì dùng d ng tuy n tính hóa đ kh o sát ph n d . ầ ư ể 2 thì dùng d ng tuy n tính hóa đ kh o sát ph n d . ể ầ ư ế ế ả ả ạ ạ
Ự
ứ ậ
ế
ồ
ng CO2
ượ
ế