1
H
H
i
iquy
quy v
và
àtương
tương quan
quan
2.00
3.00
4.00
5.00
6.00
150.0 155.0 160.0 165.0 170.0 175.0
Chiu cao (cm)
FEV (lít)
M
M
C TIÊU
C TIÊU
Đánh giá sliên quan gia hai biếnđnh
lưng thông qua biuđ
Xây dng phiên giiđưng hi quy
Tính phiên giiđưc hstương quan
Kimđnh đưng hi quy
T
T
I SAO C
I SAO C
N?
N?
Dđoán các giá trca các biến phthuc (y)
da trên các giá trca các đc lp (x1,
x2,xk.).
ví d: dđoán huyết áp da trên tui, cân nng, ....
Phân tích mi quan hgia các biếnđc lp
biến phthuc:
ví d: mi quan hgia mcđmtrong máu và
tui
MÔ HÌNH H
MÔ HÌNH H
I QUI
I QUI
Biuđchmđim thhin quan hgiachiu cao
dung tích thgng sc(FEV)
2.00
3.00
4.00
5.00
6.00
150.0 155.0 160.0 165.0 170.0 175.0
Chiu cao (cm)
FEV (lít)
MÔ HÌNH H
MÔ HÌNH H
I QUI (
I QUI (ti
tiế
ếp
p)
)
Nhn xét ?
2.00
3.00
4.00
5.00
6.00
150.0 155.0 160.0 165.0 170.0 175.0
Chiu cao (cm)
FEV (lít)
FEV tăng cùng vi Chiu cao
Vy FEV tăng nhưthếo?
Tăng bao nhiêu khi chiu cao tăng thêm xcm?
MÔ HÌNH H
MÔ HÌNH H
I QUI (
I QUI (ti
tiế
ếp
p)
)
hình tuyến nh
y= a+ bx + e
Trong đó
y = biến phthuc
x = biếnđc lp
a= giao đim
b= đdc
e= giá trsai sx
y
a
b
y= a+ bx + e
2
C
CÁ
ÁC BƯ
C BƯ
C TI
C TI
N H
N HÀ
ÀNH XÂY
NH XÂY
D
D
NG ĐƯ
NG ĐƯ
NG H
NG H
I QUI
I QUI
1. Đánh giá các githuyết
2. Xác đnh các hs
3. Đánh giá các hshi quy
4. Sdng đưc lưng/dđóan
Đ
ĐÁ
ÁNH GI
NH GIÁ
ÁC
CÁ
ÁC GI
C GI
THUY
THUY
T
T
Biến x, y là biến ngu nhiên
Giá trca biến y có phân bchun
Tp hp các giá trca y có
phương sai nhưnhau
X
XÁ
ÁC Đ
C Đ
NH C
NH CÁ
ÁC H
C H
S
S
Các hsđưcưc lưng:
trên mt mu rút ra tqun th
tính tóan các giá trthng kê mu
xây dng phương tnh đưng thng tt nht
tđưc mi quan hgia hai biến?
Vyđưng thng tt
nht đưng nào?
w
w
w
ww w w w
w
w w
w
w w
w
x
y
ĐƯ
ĐƯ
NG (H
NG (H
I QUI)
I QUI)
TRUNG BÌNH T
TRUNG BÌNH T
I THI
I THI
U
U
mtđưng thng mà tđó tng
bình phương trung tiđưng thng
trung bình nhnht (ti thiu)
ĐƯ
ĐƯ
NG (H
NG (H
I QUI)
I QUI)
TRUNG BÌNH T
TRUNG BÌNH T
I THI
I THI
U
U
3
3
w
w
w
w
41
1
4
(1,2)
2
2
(2,4)
(3,1.5)
Tng bình phương = (2 - 1)2+(4 - 2)2 +(1.5 - 3)2+
(4,3.2)
(3.2 - 4)2= 6.89
Tng bình phương = (2 -2.5)2+ (4 - 2.5)2 + (1.5 - 2.5)2+ (3.2 - 2.5)2= 3.99
2.5
Hãy so sánh hai đường thng
Tng bình phương càng
nhthì đưng thng phù
hp vi bsliu tt
hơn.
T
TÍ
ÍNH H
NH H
S
S
H
H
I QUI
I QUI
Tính các hshi quy tmu
åå
åå å
å
å
=
=
=
= =
=
=
-
-
=
-
--
=
n
i
n
i
i
i
n
i
n
i
n
i
ii
ii
n
i
i
n
i
ii
n
x
x
n
yx
yx
xx
yyxx
b
1
1
2
2
1
1 1
1
2
1
)(
))((
)(
))((
xbya -=
Đưng hi quy
xbby
ˆ10 +=
Đưng hi quy qun th
exy ++= ba
3
Chiu cao FEV ca 20 sinh viên
V
VÍ
ÍD
D
3.60162.0
3.20161.3
3.42161.2
2.85161.2
3.19160.4
3.54157.0
3.54154.0
FEVheight
Biến phthuc, Y
Biếnđc lp, X
T
TÍ
ÍNH TAY
NH TAY
Sy2
Sx2
SxySxSx
...........................
38.028.42209577635724776
0.713.42916722545905485
10.05.42500624139505079
(y-y)2
(x-x)2
y2
x2
xyyx
Lp bng sliu
ĐƯ
ĐƯ
NG H
NG H
I QUI
I QUI
;86,3
38,165
=
=
y
x
n = 20.
xbxay 0744,045,8
ˆ+-=+=
å=6,3307xå=1,77y
å=2,547587
2
xå=0,12797xy
å=8,306
2
y
20
)6,3307(
2,547587
20
)1,77)(6,3307(
0,12797
2
-
-
=b= 0,0744. 38,165*0744,086,3 -=a= -8,45
Đưng hi quy tmi quan hgia FEV
chiu cao slà:
FEV=
FEV=-
-8,45 + 0,0744*
8,45 + 0,0744*chi
chi
u
ucao
cao
Tính đưng hi qui bng MS EXCEL
Tools > Data Analysis > Regression >
[bôi đen khang y và khang x] > OK
ĐƯ
ĐƯ
NG H
NG H
I QUI
I QUI
K
K
T QU
T QU
T
T
EXCEL
EXCEL
0.12600.02280.00723.03090.02450.0744X Variable 1
0.0856-16.97860.0521-2.07984.0611-8.4465Intercept
Upper 95%Lower 95%P-valuet StatSECoef.
9.438719Total
0.34726.249318Residual
0.00729.18653.18943.18941Regression
Sig. FFMSSSdf
ANOVA
20Observations
0.5892Standard Error
0.3011Adjusted R Square
0.3379R Square
0.5813Multiple R
Regression Statistics
SUMMARY OUTPUT
xy 0744,045,8
ˆ+-=
PHIÊN GI
PHIÊN GI
I ĐƯ
I ĐƯ
NG H
NG H
I QUI
I QUI
2.00
3.00
4.00
5.00
6.00
150.0 155.0 160.0 165.0 170.0 175.0
Chiu cao (cm)
FEV (lít)
heightFEV 0744,045,8 +-=
Đây giá trđdc, vi mi mt cm cao
lên thì FEV stăng 0,0744 lít
giá trđim ct
4
Đ
ĐÁ
ÁNH GI
NH GIÁ
Á ĐƯ
ĐƯ
NG H
NG H
I QUI
I QUI
Phương pháp bình phương ti thiu scho
chúng ta đưng hi qui kckhi không mi
quan htuyến tính gia x và
Chúng ta cn phiđánh giá xem đưng hi qui
phi tt nht hay không?
Chúng ta đánh giá đdc (slope) cađưng hi
qui (ít khi đánh giá đim ctIntercept)
Đ
ĐÁ
ÁNH GI
NH GIÁ
Á Đ
Đ
D
D
C
C
Khi không mi quan htuyến tính gia
hai biến, đưng hi qui snm ngang
q
q
q
q
q
q
q
qq
q
q
q
q
các giá tr(x) khác nhau cho
kết qukhác nhau (y)
đdc khác không (0)
q
q
q
q
q
qq
q
q
q
q
Kh. Có mi quan htuyến tính
các giá tr(x) khác nhau cho kết
qukhông khác nhau (y)
đdc bng không (0)
mi quan htuyến tính
Chúng ta thsuy lunbtb bng cách kim
đnh:
H0: b= 0
H1: b0 (or < 0,or > 0)
The test statistic is
Nếu sai s phân bchun thì thng kê này scó
phân bt-student vi df=n-2
b
s
b
tb-
=
sai schun ca b.
å-
=2
2
)( xx
s
s
i
b
trong đó
KI
KI
M Đ
M Đ
NH Đ
NH Đ
D
D
C
C
( )
åå ---
-
=2222 )()(
2
1xxbyy
n
sii
Kimđnh githuyết thng vmi quan
htuyết tính gia chiu cao dung tích
thgng sc ca các sinh viên trưng y,
sdng a= 5%.
V
VÍ
ÍD
D
•đtính t, chúng ta cn:
b=0,0744
sb=0,025
vùng bác bt > t.025 or t < -t.025 with n= n-2 =
18; khang, t.025 = 2,1
kết lun: đdcđưng hi qui khác 0 ý
nghĩa TK, đưng hi qui ttt nht.
031,3
025
00744,0 =
-
=
-
=.
s
b
t
b
b
V
VÍ
ÍD
D
Ki
Ki
m
mđ
đ
nh
nh đ
đ
d
d
c
c:
: k
kế
ết
t
qu
qu
t
t
EXCEL
EXCEL
0.12600.02280.00723.03090.02450.0744X Variable 1
0.0856-16.97860.0521-2.07984.0611-8.4465Intercept
Upper 95%Lower 95%P-valuet StatSECoef.
9.438719Total
0.34726.249318Residual
0.00729.18653.18943.18941Regression
Sig. FFMSSSdf
ANOVA
20Observations
0.5892Standard Error
0.3011Adjusted R Square
0.3379R Square
0.5813Multiple R
Regression Statistics
SUMMARY OUTPUT
đbng chng đkết
lun chiu cao khnăng
dđoán FEV
5
Ph
Ph
n
n2
2
Đđo lưng đmnh ca mi quan h
tuyến tính chúng ta dùng hsxác đnh
SST
SSR
yy
yy
R=
-
-
=
å
å
2
2
2
)(
)
ˆ
(
H
H
s
s
x
xá
ác
cđ
đ
nh
nh
H
H
s
s
x
xá
ác
cđ
đ
nh
nh
Sbiến thiên ca các giá trquan sát
giá trtrung bình:
Tng biến thiên ca y (SST)
hình hi qui (SSR)
còn l
i, chư
a gi
i
Sai s(SSE)
gi
im
tph
n
H
H
s
s
x
xá
ác
cđ
đ
nh
nh
x1x2
y1
y2
y
Hai đim sliu (x1,y1) và (x2,y2)
=-+- 2
2
2
1)yy()yy( 2
2
2
1)yy
ˆ
()yy
ˆ
(-+- 2
22
2
11 )y
ˆ
y()y
ˆ
y( -+-+
Tng biến thiên y = Biến thiên gii bng
đưng hi qui
+ Phn chưa gii (sai s)
biến thiên ca y = SSR + SSE
H
H
s
s
x
xá
ác
cđ
đ
nh
nh
R2 đo lưng tlbiến thiên ca y đưc lý gii bng
sbiến thiên ca x
åå
åå
å-
-
=
-
=
n
y
y
n
x
xb
yy
SSR
R
i
i
i
i
i
2
2
2
22
2
2
)(
)(
(
)(
R2 giá trt0 đến 1
R2= 1: lý tưng, đưng hi qui trùng vi các đim s
liu.
R2= 0: không mi liên hgia x và y.
V
Ví
íd
d
:
:
3379,0
)(
)(
(
2
2
2
22
2=
-
-
=
åå
åå
n
y
y
n
x
xb
R
i
i
i
i