ƯƠ Ồ Ế T NG QUAN VÀ H I QUY TUY N TÍNH
ẽ ả ồ ể
ế ố ượ ệ ố ươ ượ ủ
ữ ả ự ươ i s t ng quan gi a hai bi n s ế ố ị ng quan c a hai bi n s đ nh l ụ ươ ế ế ộ ố
ủ ả ồ
ệ ố ể ố ặ ng quan, h s góc, đi m ch n ẩ ố i ý nghĩa c a sai s chu n h i quy. ẩ ủ ệ ố ươ ị ứ ứ ủ ể ố ố ụ ể ị Mục tiêu: ứ ủ ề ọ Sau khi nghiên c u ch đ h c viên có kh năng: ồ ử ụ V phân tán đ và s d ng phân tán đ đ lí gi ượ ứ ng c công th c và tính đ Trình bày đ c h s t ộ ủ ồ ượ ự ng trình h i quy tuy n tính c a bi n s ph thu c theo m t c ph Xây d ng đ ế ố ộ ậ bi n s đ c l p. Trình bày công th c và lí gi Trình bày công th c c a sai s chu n c a h s t và giá tr tiên đóan th và áp d ng trong ki m đ nh và ng các s th ng kê trên. ướ ượ c l
ụ
ọ
M c tiêu: Sau khi nghiên c u bài này h c viên có kh năng: ươ ả ả ự ứ ượ ế ố ị ệ ữ ượ ng pháp mô t s quan h gi a hai bi n s đ nh l ng: đ ồ Nêu đ ệ ố ươ ị c 2 ph ng quan th và h s t
ệ ữ ế ố ằ ồ c m i quan h gi a hai bi n s b ng phân tán đ
ệ ố ươ ế ữ ng quan gi a hai bi n ủ ệ ố ươ ng quan, tính h s t ớ ơ ố s (trong tr
ế ố ử ụ ầ ồ
Trình bày và lí gi ượ Nêu đ ả ườ ng h p s li u đ n gi n) v i máy tính c m tay ự Xây d ng ph ả ố ả ượ i đ c ý nghĩa c a h s t ợ ố ệ ươ ế ệ ố ữ ươ ủ ằ ị ể ầ ng trình h i quy gi a hai bi n s s d ng máy tính c m tay ế ồ ng trình h i quy tuy n tính b ng không. thuy t h s góc c a ph Ki m đ nh gi
ượ ế ươ ế ố ị ể ế ng pháp t ng quan và h i quy tuy n tính đ xác đ nh m i liên h ươ ế ụ ệ ồ ố ế ố ả ự ệ ố ườ ẳ ậ ng và t p trung ệ ố ị ự ặ ng s ch t ng quan (correlation) đo l ươ ế ng t ph ừ ế bi n t nh t và cho phép tiên đoán bi n s này t ng th ng mô t s liên h t
trọng lượng cơ thể (kg)
Thể tích huyết tương (lít)
Ðối tượng
1
58,0
2,75
2
70,0
2,86
3
74,0
3,37
4
63,5
2,76
5
62,0
2,62
6
70,5
3,49
7
71,0
3,05
8
66,0
3,12
1. Giới thiệu ệ ữ ế Trong bài này chúng ta quan tâm đ n liên h gi a hai bi n s đ nh l ủ ế ồ ch y u đ n ph ế ườ ươ ữ tuy n tính (linear) gi a hai bi n liên t c. T ế ẽ ủ ch c a m i liên h trong khi h i quy tuy n tính (linear regression) cho bi ấ trình đ ố s khác. Bảng 9.1 Thể tích huyết tương và trọng lượng cơ thể của 8 người đàn ông khỏe mạnh
3.5
3.3
3.1
2.9
2.7
g n ô ö t t á e y u h h c í t å e h t
2.5
55
60
65
70
75
troïng löôïng cô theå
Hình 9.1 Phân tán đồ của thể tích huyết tương và trọng lượng cơ thể cùng với đường hồi
quy tuyến tính
–
–
–
–
–
–
(a) Không tương quan
––––
–
–
–
(c) Tương quan dương không hoàn toàn
(d) Tương quan dương hoàn toàn
–
–
–
––––
(f) Tương quan âm hoàn toàn
(e) Tương quan âm không hoàn toàn
ệ ế ố (b) m i liên h không tuy n tính
Hình 9.2 phân tán đồ minh họa các giá trị khác nhau của hê số tương quan. Trong đây cũng có các đường hồi quy.
ơ ể ể ọ ng c th và th tích huy t t ế ố ị ượ ự ả ỏ ữ ể ử ụ ể ế ươ ủ ng c a 8 ng ọ ượ ng tr ng l ệ ố ươ ể 2. Tương quan ế ươ B ng 9.1 trình bày tr ng l ạ kh e m nh. Đ đánh giá s liên quan gi a hai bi n s đ nh l ồ và th tích huy t t ng chúng ta có th s d ng phân tán đ hay h s t ườ i đàn ông ơ ể ượ ng c th ng quan r:
ể ệ ệ ồ ị ụ ể ệ ế ố ộ ậ ồ ủ ằ ụ ế ươ ể ệ ớ ể ộ ệ ạ ộ ế ố ng l n có liên quan ượ Phân tán đồ ồ ị ủ Phân tán đ là đ th th hi n các giá tr c a các quan sát b ng kí hi u trên h to đ ụ ồ g m hai tr c: tr c hoành th hi n cho bi n s đ c l p và tr c tung th hi n bi n s ụ ph thu c. Hình 9.1 trình bày phân tán đ c a th tích huy t t ọ ế đ n tr ng l ơ ể ng c th cao.
ồ ố ủ ế ố ồ ể ệ ằ ạ ộ ệ ữ ế ế ố ồ ạ ả ậ ệ ạ ướ ệ ị ế ạ ượ ư ế ẳ ủ ườ ự ươ ế ố ượ ế ệ ọ
ế ươ ữ ể ể ọ ị ng và tr ng l ượ ng ế ệ ữ Hình d ng c a phân tán đ th hi n m i liên h gi a hai bi n s . N u phân tán đ có ạ ự d ng m t đám mây n m ngang thì không có s liên h gi a hai bi n s (hình 9.2 a). ừ ướ ế i bên trái lên phía trên bên ph i thì hai N u phân tán đ có hình d ng ellipse đi t d ừ ế ế ố ồ bi n s có liên h thu n (hình 9.2 c và d). N u phân tán đ có hình d ng ellipse đi t ế ố ả ố i bên ph i thì hai bi n s có liên h ngh ch (hình 9.2 e phía trên bên trái xu ng phía d ố ị ệ ắ ụ ắ ủ và f). Tr c ng n c a ellipse càng ng n thì m i liên h càng m nh và n u ellipse b ộ ườ ố ươ ng quan đ c xem nh là hoàn toàn (hình 9.2 bi n thành m t đ ng th ng thì m i t ẳ ạ ả ồ ạ ng th ng thì d và f). N u hình d ng c a phân tán đ không ph i là d ng ellipse hay đ ế ư ố hai bi n s cũng có m i liên h nh ng s t c g i là không tuy n ng quan này đ tính (hình 9.2 b). ụ Áp d ng lí lu n trên chúng ta có th xác đ nh gi a th tích huy t t ơ ể c th có t ậ ậ ươ ng quan tuy n tính, thu n và không hoàn toàn.
ệ ố ươ
x
y
(
yx )(
)
r
2
2
x
x
y
y
(
)
(
)
ượ ệ ế ể ng có quan h tuy n tính thì chúng ta có th đo l ng quan ế ố ị ộ ệ ố ươ ơ ng quan m t cách chính xác h n b ng cách tính h s t ấ ủ ệ ố ươ ể ệ ằ ả ứ ứ ườ ng m c ng quan (correllation ư H s t ế N u hai bi n s đ nh l ộ ươ đ t coefficient), r. Công th c tính r th hi n b n ch t c a h s t ng quan nh sau: (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ể ử ụ ứ ễ ơ ng quan d dàng h n Chúng ta có th s d ng công th c tính h s ệ ố ệ ố ươ ể Đ tính h s t ư ươ t ng quan nh sau:
i
i
2
2
x
y
i
i
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x y ( yx )( ) n x y n ( (cid:0) (cid:0) (cid:0) r (cid:0) (cid:0) (cid:0) (cid:0) xy /) s s n 1 (cid:0) (cid:0) x x y y ( ) ( )
ọ ế ố ể ộ
ứ ữ ồ ọ ế ụ ng), y là bi n s ph thu c (th tích huy t ệ ố ng ng. Phân tán đ minh h a nh ng h s ng), ng quan khác nhau đ
ướ c tiên chúng ta hãy tính trung bình và đ ộ ẩ ủ ế ố ộ ậ ượ Trong đó x là bi n s đ c l p (tr ng l ‘ x và ‘ y là các s trung bình t ố ươ ươ t ươ ươ c trình bày trong hình 9.2. t ể ứ ử ụ S d ng công th c này đ tính toán r, tr ế ố ệ l ch chu n c a bi n s x và y:
ượ ọ Tr ng l ng c th : ơ ể ‘ x=66.875 s=5.4166 n=8
ế ươ ể Th tích huy t t ng ‘ x=3.0025 s=0.31121 n=8
ủ ế ố ‘ x=201.91 s=34.849 n=8
ệ ố ươ
n
y
(
r
758.0
xy /) s
n
1
311.0
8 7
x
y
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Tích c a hai bi n s Sau đó hãy tính toán h s t xn s ng quan. .1 086375 417.5
ủ ệ ố ươ i ý nghĩa c a h s t ng quan:
ệ ố ươ ạ ả Lí gi H s t ằ ng quan luôn luôn n m trong đo n [1,1]
ỏ ế ươ ế ố ứ ng ch ng t ị ằ ế ế ệ ố ươ ế ng quan r d ế ố ồ hai bi n s là đ ng bi n; h s t ệ ố ươ hai bi n s là ngh ch bi n; h s t ng quan r âm ng quan b ng zero n u hai bi n không
ữ ứ ộ ệ ế ồ ể ệ ố ủ ị ế ố ng quan r nói lên m c đ liên quan gi a hai bi n s . ấ t ỏ ẽ
ể ủ ế ố ng c a h s t ng quan (r ế ồ ườ 2) th hi n t l ể ệ ỉ ệ ế ế ố ộ ậ ự ế ủ ế ệ ả ằ ụ i thích b ng s bi n thiên c a bi n s đ c l p (n u m i liên h này là ươ c gi
ế ố ữ ệ ề ố ế ế ố ệ ữ ữ ố
ố ả ướ ệ ớ ế ế 0,1 đ n 0,3 là quan h y u, t 0,3 đ n 0,5 quan h c, quan h v i r t ệ ế ọ ữ ệ ư ấ ự ế ố ề ấ ế ệ ả ệ ố ươ H s t ỏ ứ ch ng t liên h . ệ ệ ố ủ ệ ố ươ ị ố Tr s tuy t đ i c a h s t ằ ệ ố ủ ị ế N u tr tuy t đ i c a r b ng 1 (r=1 hay r=1), quan h hoàn toàn tuy n tính nghĩa là t ườ ằ ả c các đi m n m trên đ ng h i quy (Hình 9.2 d và 9.2f). N u tr tuy t đ i c a r nh ố ệ ơ ng h i quy (hình 9.2 c và 9.2e). h n 1 s có các đi m s li u phân tán chung quanh đ ủ ệ ố ươ bi n thiên c a bi n s ph Bình ph ố ộ ượ thu c đ nhân qu )ả ế N u r=0, không có m i liên h tuy n tính gi a hai bi n s . Ði u này có nghĩa là (1) ệ ế ặ không có m i liên h gì gi a hai bi n s ho c (hình 9.2a) (2) m i liên h gi a hai bi n ế ố s không ph i là tuy n tính (hình 9.2b) ừ ừ Theo quy ự ươ ệ ạ trung bình và trên 0,5 là quan h m nh. Ði u quan tr ng là s t bi n s cho th y s liên h nh ng không nh t thi ệ ng quan gi a hai t có nghĩa là cá quan h 'nhân qu '.
ồ ẳ ng th ng mô t ệ ự ng trình đ ư ươ ươ ố ươ ng pháp không cùng cho m t k t qu , y th ộ ế ở ụ ế ế ả ố ộ ậ ụ ầ ế ươ ượ ộ ọ ng và tr ng l ơ ể ng c th .
ố ằ
3. Hồi quy tuyến tính ế ườ ả ế ế n u bi n x tăng thì bi n y H i quy tuy n tính cho ph ế ọ ể ư ế ng quan, vi c l a ch n bi n nào đ làm bi n y tăng nh th nào. Không gi ng nh t ượ ọ ộ ế ọ ườ c g i là quan tr ng b i vì hai ph ng đ ả ế ố là bi n s ph thu c (dependent variable) và x là bi n s đ c l p hay gi i thích (independent or explanatory variable). Trong thí d này, rõ ràng chúng ta c n quan tâm ể ự ụ s ph thu c th tích huy t t ồ ươ ng trình h i quy là Ph y = a + bx ể ộ ố ươ ủ ẳ ng th ng hay h s (coefficient) c a ph ng trình (Hình
ể ả c tính sao cho c c ti u hóa bình ph ượ ố ệ ề ươ ự ẳ ớ ườ ng th ng. Nó đ i đ ộ ố i thi u (least squares fit) (Hình 9.4). Ð d c b đôi khi đ ớ ệ ố ươ ấ ộ ườ ứ ằ ng quan. Khi không có s ồ ằ ng quan, b b ng zero, t ớ ng ng v i m t đ ươ ng kho ng cách theo ọ ợ c g i là phù h p bình ệ ố ồ ượ ọ c g i là h s h i ự ng th ng h i quy n m ngang đi qua ặ a: là đi m ch n (intercept) hay h ng s (constant) ệ ố ủ ườ b: là đ d c (slope) c a đ 9.3). ị ố ớ ượ Giá tr đ i v i a và b đ ứ ể ừ các đi m s li u t chi u đ ng t ể ố ph ng t quy (regression coefficient). Nó có cùng d u v i h s t ươ ẳ ươ t ể đi m y.
y
2)
x
(cid:0) (cid:0) (cid:0) s x y ( ) (cid:0) (cid:0) b r (cid:0) (cid:0) s yx )( x x (
và
a = ‘ y - b‘ x
y
b
1
a
x
Hình 9.3 Giao điểm và độ dốc của phương trình hồi quy y = a + bx. Giao điểm a là điểm mà đường thẳng cắt trục y và cho giá trị y ở x = 0. Ðộ dốc b là mức tăng của y tương ứng với sự gia tăng một đơn vị của x.
b = 8,96/205,38 = 0,0435
Trong thí d nàyụ
a = 3,0025 - 0,04354 · 66,875 = 0,0907 ể
Và:
Thể tích huyết tương = 0,0907 + 0,0435 × trọng lượng c v trên Hình 9.1.
ế ươ ủ ự ụ ộ ọ ượ ơ ể ượ ng vào tr ng l ng c th đ c mô t ả Do đó s ph thu c c a th tích huy t t b ngằ
x = 60, y = 0,0907 + 0,0435 · 60 = 2,7032
ượ ẽ ằ ủ ườ ể ẳ c v b ng cách tính t a đ c a hai đi m c a đ ng th ng. Thí d ụ ạ ộ ủ ườ ể ạ ị ượ ẽ và đ ồ ườ Ð ng h i quy đ chúng ta có th tính to đ c a đ ọ ộ ủ ẳ ng th ng t i giá tr x = 60 và x = 70
x = 70, y = 0,0907 + 0,0435 · 70 = 3,1386
Và
ườ ể ể ẳ ả ồ ng th ng h i quy ph i đi qua đi m (60, 2.7) và (70, 3.1). Hi n nhiên
ể ả ư ậ Nh v y đ ẳ ườ đ ng th ng ph i đi qua đi m ( ‘ x,‘ y) = (66.9 , 3.0)
4. Kiểm định và ước lượng trong tương quan và hồi quy
ề ươ ầ ư ệ Khái ni m v ph ng sai ph n d
3.5
3.3
3.1
2.9
2.7
g n ô ö t t á e y u h h c í t å e h t
2.5
55
60
65
70
75
troïng löôïng cô theå
Hình 9.4 Ðường thẳng hồi quy tuyến tính, y = a + bx, được làm phù hợp bằng bình phương tối thiểu, a và b được tính để cực tiểu hóa tổng bình phương của các độ lệch thẳng đứng (vẽ bằng các đường thẳng đứng) của các điểm đối với đường thẳng, mỗi độ lệch bằng hiệu số giữa số y quan sát và tiểm tương ứng trên đường thẳng a + bx
ị ủ ằ ớ ả ẳ ứ ộ ệ ộ ườ ố ể ệ ng trình h i quy. Con s th hi n m c đ phân tán c a s ố ồ ồ ượ ẳ ọ ươ ng th ng h i quy đ ộ ng th ng nên chúng có m t ủ ố ẩ ủ ồ c g i là sai s chu n c a h i quy (standard error
2
2
ẩ ủ ồ ượ ứ ố Do các giá tr c a các quan sát không n m trên m t đ kho ng cách áo v i ph ườ li u quanh đ of regression). Sai s chu n c a h i quy đ c tính theo công th c sau:
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
y
y
ay
bx
(
)
(
)
(cid:0) (cid:0)
s
(cid:0) (cid:0)
n
2
ố
2 ượ
ư ể
n ẩ ủ ồ Sai s chu n c a h i quy còn đ
2
2
2
2
c tri n khai thêm nh sau
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
bx
y
y
b
x
x
y
)
(
)
(
)
(
(
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
s
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
n
(
)2
xby ) n )2 (
2
2
2
2
2 sb
2 y
2 x
y
y
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s s r s n y y s ( ) 1( ) 1 ( ) (cid:0) (cid:0) (cid:0) (cid:0) n n 1 n 1 n n n 1 2 r 2 r 2 1 2
2
(cid:0) (cid:0) (cid:0) (cid:0) y y s ( ) (cid:0) 1 n r 2
2
ẩ ủ ố ệ ộ ệ ớ ườ ể ộ ự ẳ s là đ l ch chu n c a các đi m s li u so v i đ ng th ng, có (n2) đ t do.
.0
6780
.0
205
38.
(cid:0)s
.0
2189
0436 6
(cid:0) (cid:0) (cid:0)
2
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
s
s
(
)
2 311.0(
.0
0436
417.5
)
.0
21855
2 y
22 sb x
(cid:0) (cid:0)
n n
1 2
18 28
2
ặ ho c
y
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 0.218321 s s n 1 311.0 265.07 (cid:0) 1 n r 2
ể ể ồ ế ụ ươ ộ ẽ ắ ộ ể ng thì chúng ta không th tiên đoán m t cách chính xác: chúng ta s m c m t sai s ế ng trình h i quy đ tiên đoán th tích huy t ố
2
ố ồ ủ ượ ọ ươ ề Đi u này có nghĩa là n u ta áp d ng ph ươ t trung bình là 0.218. ươ Bình ph ng c a sai s h i quy đ c g i là ph ầ ư ng sai ph n d :
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
s
s
s
n
(
)
(
)1
2 y
22 sb x
2 y
(cid:0) (cid:0)
n n
1 n
1 2
r 2
ị ể ệ ố ươ ng quan
ng quan, có hai ph ng pháp ki m đ nh h s t ộ ươ ế ị ị ệ ố ươ ng quan ộ ng quan r = 0 và m t r ế ể ệ ố ươ ả thuy t Ho: h s t ệ ố ươ ng quan r = (v i ớ r 0) „
2
thuy t Ho: h s t ể ị ượ ị ộ c dùng đ xem r có khác zero m t cách có ý nghĩa hay không. Nói ự ự ng quan quan sát đ ố ơ ở ủ c có ph i là th c s ứ ướ ượ ng sai s ả c l ỉ ẩ ủ Ki m đ nh ý nghĩa h s t ệ ố ươ Khi chúng ta đã có h s t ươ ể ể ng pháp đ ki m đ nh gi này. M t ph ả ể ươ ph ng pháp ki m đ nh gi ượ ể Ki m đ nh t đ ị ể ự ươ cách khác đi, ki m đ nh này đ xem s t ự ệ ờ này ch do tình c . Vi c ki m đ nh này d a trên c s c a công th c chu n c a r: s.e.(r) = (1r ể ị ể 2)/(n2)
s
res .(.
)
2
1 n
r 2
y
y
(
)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
t
r
n
,
fd .
.
2
2 2 r
n 1
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
2
2
ụ ể ể ữ ể ả ị ế ươ ng quan gi a th tích huy t t ọ ng và tr ng ế ệ ố ươ ế Thí d đ ki m đ nh gi ơ ể ằ ượ l thuy t h s t ng c th b ng không, chúng ta ti n hành các tính toán sau:
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 0.265 res .(. ) (cid:0) (cid:0) 1 n r 2 76.01 28
t
76.0
,86.2
fd .
6.
2
28 76.01
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ậ ệ ữ ể
ở ứ ng c th
ộ ớ ủ ố ươ ự ố ộ ố ớ ỉ ứ ể ạ ư ng quan và s các quan sát. L u ng quan y u có th có ý nghĩa th ng kê n u nó d a trên m t s l n quan sát, ộ ế ự ươ c m c ý nghĩa n u ch có m t ít ng quan m nh có th không đ t đ ế ủ ự ề m c 5% xác nh n ý nghĩa c a s liên h gi a th tích huy t Ði u này có ý nghĩa ươ ơ ể ượ ọ ng và tr ng l t ộ ủ ả ứ ố ươ ụ M c ý nghĩa ph thu c c a c vào đ l n c a m i t ế ể ế ằ ý r ng t ạ ượ trong khi s t quan sát.
r ị ể ế ị ng quan r = 0) (v i ớ r
„ ứ ệ ố ươ ổ c tiên chúng ta tìm hi u v phép bi n đ i z c a Fisher. Fisher đã ch ng minh z(r) ể ướ ọ ể Ki m đ nh z đ ki m đ nh gi ể Tr ố (đ c là hàm s z c a h s t ả thuy t Ho: h s t ề ủ ế ủ ệ ố ươ ng quan r):
rz )(
ln
r r
1 2
1 1
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ố ườ ớ ộ ệ ẩ ẽ s có phân ph i bình th ng v i trung bình là z(
r ệ ố ươ ể ể ư ậ ị Nh v y đ ki m đ nh h s t ng quan r = (cid:214) 1/(n3) r ) và đ l ch chu n là (v i ớ r ả 0), chúng ta ph i tính: „
rz )(
ln
1 2
1 1
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
r r (cid:0) (cid:0)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (z ) ln (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 1 2 1 1 ư ố ẽ ở ế r (chúng ta l u ý n u ủ r = 0 thì hàm s z c a s tr thành ị không xác đ nh) (cid:0) (cid:0) r rz )( ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) z r n rz )( ( ) 3 (cid:0) n /(1 )3
ế ươ ữ ể ụ ả ử ả c h s t X tìm đ ượ ể ệ ố ươ ng và ng quan chúng ta đã tìm ra có ả ệ ố ươ ị ượ ng c th là 0.4, hãy ki m đ nh xem h s t ng quan đ ng quan gi a th tích huy t t ệ ố ươ c báo cáo do tác gi X hay không:
và s tác gi Thí d gi ơ ể ọ ượ tr ng l ơ ự ự ớ th c s l n h n h s t Chúng ta tính đ c:ượ
ln
rz )(
ln
.0
9962
1 2
1 1
1 2
76.01 76.01
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
r r (cid:0) (cid:0)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ln (cid:0)z ( ) ln .0 4236 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 1 2 1 1 1 2 4.01 4.01
(cid:0) (cid:0) (cid:0) r rz )( ( ) .0 9962 .0 4236 (cid:0) (cid:0) (cid:0) z .1 280 (cid:0) (cid:0) n /(1 )3 )38/(1 và
ả ộ ị ậ ượ ệ ố ươ ố ứ ể ằ ằ ủ c giá tr p > 0.05 vì v y chúng ta ự ng quan c a chúng ta tìm ra th c ơ ẩ Tra b ng phân ph i chu n m t đuôi chúng ta tính đ ố không có b ng ch ng th ng kê đ cho r ng h s t ự ớ s l n h n 0.4.
ố ồ ươ ẩ ủ ng trình h i quy
ươ ề ả ng dùng ph ng t ồ ừ ộ ự ượ ỉ ị ố ẫ m t m u ch là ng cho ph ướ ượ c l
ị ư nh các giá tr th ng kê các đ u có kh năng b ươ c tính t ng ố ẫ ủ ể ị ng m u c a giá tr giao đi m và đ d c c a đ ướ ượ c l ệ ữ ủ ẫ ộ ể ả ừ ẩ ố ố c l ượ ị ụ ể ộ
ể ị ẩ ủ ố ướ ượ c l Sai s chu n c a các ườ ẳ ồ Đ ng th ng h i quy cũng t ươ ố ng trình h i quy đ sai s và ph ộ ự ự ủ ồ trình h i quy th c s c a toàn b dân s . ị ộ ố ủ ườ ẳ Giá tr a và b là các ng th ng ế ồ ị ố ộ ả ố h i quy mô t m i liên h tuy n tính gi a x và y trong toàn b dân s . Do đó chúng b ế ẩ ằ ườ ấ ng b ng sai s chu n. các bi n thiên l y m u và đ chính xác c a chúng có th đo l ướ ượ ậ ủ ể ễ T sai s chu n chúng ta có th d dàng tính đ ng c kho ng tin c y c a các ớ này hay ki m đ nh chúng có khác v i m t giá tr c th nào hay không Sai s chu n c a a
2
ẩ ủ ố ượ ứ Sai s chu n c a a đ c tính theo công th c sau
s
aes .(.
)
2
1 n
x x
x
(
)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ả ậ ủ
kho ng tin c y c a a : a ± tc × s.e.(a)
2
ị ớ a Và đ ki m đ nh a có khác so v i ể ể (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t n , fd . . 2 a aes .(. )
s.e.(a)
. 2819 0
. 3197 1
1 8
. 966 . 205 38
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ụ ở
ể ằ ặ
c × s.e.(a) = 0.0857 ± 2.45 × 1.3197 = 3.148 – 3.319
ụ ả ả
ướ ể ộ ủ ng trình h i quy c a th tích huy t t c đây đã báo cáo ph ồ ể ể ị ể ị ị ể ằ ặ ớ ể trên ta có Áp d ng vào thí d ủ ậ Kho ng tin c y 95% c a đi m ch n a b ng: ậ Kho ng tin c y 95% : a ± t ế ươ ươ ứ M t nghiên c u tr ng ặ ớ theo cân n ng v i giá tr đi m ch n a là 2.1. Có th ki m đ nh giá tr đi m ch n trong ị nghiên c u c a chúng ta có khác v i giá tr 2.1 đã báo cáo hay không b ng phép ki m t: ặ ứ ủ (cid:0) (cid:0) (cid:0) (cid:0) .0 1158 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t n ,53.1 fd . . 2 a aes .(. ) 0857 .1 .2 3197 .2 0301 3197 .1
ả ể ế ể ế ự ệ ề ư ậ ỏ ả thuy t Ho và nh v y ị ể ố t có ý nghĩa th ng kê v giá tr đi m
s
ặ ủ ố ố ẩ ủ ẩ ủ ượ ứ tra b ng ta có p >0.05 (p = 0.177) chúng ta không th bác b gi ậ chúng ta có th k t lu n không có s khác bi ứ ứ ủ ch n c a nghiên c u c a chúng ta và nghiên c u đã báo cáo. Sai s chu n c a b Sai s chu n c a b đ c tính theo công th c sau
bes .(.
)
x
x
(
2)
(cid:0) (cid:0) (cid:0)
ả ậ ủ
kho ng tin c y c a b : b ± tc × s.e.(b)
ị ớ b Và đ ki m đ nh b có khác so v i ể ể (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) n t 2 . , fd . )
ườ ươ ể ồ ế ươ b bes .(. Thí d :ụ ụ Áp d ng vào tr ặ ng theo cân n ng ợ ng h p ph s ủ ng trình h i quy c a th tích huy t t .0
2189
(cid:0) (cid:0) (cid:0)
bes .(.
)
.0
0153
2
(cid:0) (cid:0)
38.205
x
x
(
)
c:
ị ệ ớ s chúng ta mu n ki m đ nh xem b có khác bi t có ý nghĩa v i zero hay không. ượ ả ử ể ố ế ị ta đ ể Gi ả Ki m đ nh này cho k t qu
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t 85.2 b bes .(. ) .0 .0 0436 0153
ị ế ư ả ủ ậ ố ị ể ể ế ệ ố ươ ể ế ươ ng quan có kác không ng tăng có ý ượ ố ớ ọ
ả ử ế ươ ể s có tài li u cho r ng khi tr ng l ươ ể ứ ố ể ử ụ ể (cid:0) (cid:0) (cid:0) 03.0 .0 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) n t ,88.0 fd . 2 . ư ế ả L u ý k t qu này gi ng nh k t qu c a ki m đ nh h s t ớ hay không. V i giá tr 2,85 chúng ta có th k t lu n th tích huy t t ơ ể ng c th . nghĩa (P<0,05) đ i v i tr ng l ể ằ ượ ọ ệ ng tăng 1 kg thì th tích huy t t ng tăng 0.03 Gi ế ươ ủ ồ ặ ng trình h i quy c a th tích huy t t ng theo cân n ng là 0.03) L (nói cách khác ph ệ ủ ệ ố và chúng ta mu n ki m tra h s góc trong nghiên c u c a chúng ta có khác tài li u nêu trên hay không chúng ta cũng có th s d ng phép ki m t: .0 .0 b bes .(. 0136 0153 0436 .0 0153 )
ả ể ệ ề ệ ố ỏ ả ủ ự ế ươ t v h s góc c a ph ư ậ thuy t Ho và nh v y ồ ng trình h i quy
ằ
c × s.e.(b) = 0.0436 ± 2.45 × 0.0153 = 0.006 – 0.081
ả ả tra b ng ta có p >0.05 (p = 0.41) chúng ta không th bác b gi ậ ể ế chúng ta có th k t lu n không có s khác bi ệ ớ ủ c a chúng ta v i tài li u nêu trên. ậ ủ ệ ố Kho ng tin c y 95% c a h s góc b b ng: ậ Kho ng tin c y 95% : b ± t
ươ ồ ị ể ng trình h i quy đ tiên đoán giá tr y ể ử ụ ượ ọ ị ặ ộ ị Tiên đoán ố ộ ố Trong m t s tình hu ng, có th s d ng ph ệ ủ t c a x đ cho m t giá tr đ c bi c g i là x'. Giá tr tiên đoán là:
2
y' = a + bx' ẩ ủ ố Và sai s chu n c a nó là
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
s
yes .(.
)'
1
2
(cid:0) (cid:0) (cid:0) (cid:0)
1 n
) x
xx '( x (
)
ầ ể ả ớ ọ ố ể ậ ố ệ ượ ị ế ẽ ủ ạ ế ấ i thi u khi x' g n v i trung bình x. Nói chung ph i th n tr ng khi ở ạ ng h i quy đ tính các giá tr ngoài ph m vi c a x trong s li u g c, b i ở c làm phù ngoài ph m vi mà nó đ t s đúng
ừ ả ộ ự ớ ẩ ố ố Sai s chu n này t ồ ườ ử ụ s d ng đ ệ vì quan h tuy n tính không nh t thi h p.ợ ậ ủ ả Kho ng tin c y c a tiên đoán: ớ y' ± tc × s.e.(y') v i tc tra t b ng t (student) v i n2 đ t do
0,0832 + 0,0436 × 66 = 2,96 lít
ự ể ố ờ ng th tích huy t t ừ ọ ề ơ ể ụ ể ế ươ tr ng l ng t n nhi u th i gian và do đó trong ượ ng c th . Thí d th tích plasma ủ ộ ụ Trong thí d này, s đo l ộ ố ườ m t s tr ế ươ huy t t ườ ể ng h p, có th tiên đoán t ặ ườ i đàn ông n ng 66 kg là ợ ng c a m t ng
ằ ẩ ố Và sai s chu n b ng
2
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
66(
)9.66
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
s
yes .(.
)'
1
218.0
1
l 23.0
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
1 n
1 8
38.205
) x
xx '( x (
)
ậ ị
s.e.(y') ượ ừ ả ớ ộ ự ả ủ Kho ng tin c y 95% c a giá tr tiên đoán y' là y – tc· v i tớ c đ b ng t (hai đuôi) v i n2 đ t c tra t do
ả ươ ế ề ả ứ ế ả ấ ồ ị ng pháp h i quy tuy n tính. Gi ườ ế ả ố ườ ư ẳ ẩ ể ằ ủ c đo l ườ ở ể ế ế thi ứ thi ẳ ạ ớ ườ ủ ng b ng đ l ch chu n s c a các đi m s li u so v i đ ả trên. S thay đ i thang đo có th thích h p n u các gi ố ệ ợ ươ ệ ế t th nh t là ộ t th hai là đ phân ng. Gi ộ ố ng th ng là nh nhau trong su t đo n th ng. Ð phân tán ư ẳ ng th ng nh đã thuy t trên không ế ng 19). Các quan h phi tuy n ế ng nh phi tuy n tính (xem Ch 5. Giả thiết Có hai gi t n n t ng trong ph thi ố ớ ấ ứ đ i v i b t c giá tr x nào, y có phân ph i bình th ể tán c a các đi m quanh đ ượ ộ ệ đ ị đ nh nghĩa ỏ th a hay quan h d ả ượ c th o lu n đ ự ệ ườ ậ ở ươ ch ổ ư ng 10.
6. Bài tập
ứ ệ ữ ố ả ố ố ấ ế ố ố ụ ế ế ộ ữ
Bài t p1:ậ ể ộ i thích x là M t nhà nghiên c u tìm hi u m i liên h gi a hai bi n s : bi n s gi ằ ườ ượ ng l ng chì trong máu tính b ng µm /100mL và bi n s ph thu c y: s b t th ế ể ễ nhi m s c th trong 100 t bào (Forni et al., 1995) trên 30 n công nhân nhà máy ư ậ ượ c nh sau: acquy. S li u ghi nh n đ
ắ ố ệ ‘ x = 36.37; ‘ y = 5,97; S xy=6974,237; S x2 = 42986,28 ; S y2 = 1502,20.
ệ ố ươ ng quan r
ệ ố ươ ng quan này có th c s khác không hay không? ồ ự ự ườ ủ ố ấ ễ ể ắ ế ng trình h i quy c a s b t th ng nhi m s c th trong 100 t bào theo
ẩ ủ ộ ố ủ ộ ố ủ ể ế ả ị ươ ươ ồ ồ a. H ãy tính h s t ị ể b. Ki m đ nh h s t ươ ế t ph c. Vi ượ ng chì trong máu. l ố d. Tính sai s chu n c a đ d c c a ph thuy t: đ d c c a ph e. Ki m đ nh gi ng trình h i quy. ằ ng trình h i quy b ng zero (hai đuôi)
ị ố ừ ự ư ể ả
Bài làm bài t p 1ậ ể a. T các thông tin k trên chúng ta có th xây d ng b ng các giá tr th ng kê nh sau: n=30; S xy=6974,237
ụ ướ ượ c l ng ế ượ ế ễ ộ ậ Bi n đ c l p: ng chì trong máu L ộ ế thu c: Bi n ph ể ắ ố ộ S đ t bi n nhi m s c th
Trung bình 36.67 5.97
ẩ ộ ệ đ l ch chu n 9.5513 3.8639
ổ ươ ng đ ộ 51.435 20.808 Căn T ng bình ph l chệ
97.5
r
.0
37995
n
1
237. .9
30/ 5513
67.36 8639 .3
30 29
x
y
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ng quan r n 6974 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ xy /) ( s ượ ệ ố ươ c h s t xn y s
ị ể
ế ế
ố thuy t Ho: r=0; đ i thuy t Ha: r<>0 ớ ộ ự do = 28;
c=2,05
ớ ạ ị i h n: t
2
2
b. Ki m đ nh r=0 ả ự Xây d ng gi ị ể ử ụ S d ng ki m đ nh t 2 đuôi v i đ t ể Ta có th xác đ nh t t Tính giá tr tị
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) res .(. ) ,0 0306 175,0 (cid:0) 1 n r 2 38,01 28
(cid:0) (cid:0) (cid:0) t 20,2 r res .(. ) 385,0 175,0
ả ộ ự do ta có p <0,05
ế ớ ậ
ứ ớ thuy t Ho v i m c ý nghĩa p<0,05 hay nói khác đi có s t ự ươ ng ế ữ ượ ố ượ ế ng chì trong máu và s l ộ ng đ t bi n.
ươ
ệ ố
y
x
ả Tìm p: tra b ng t (b ng student) v i 28 đ t ặ ự c= 2.05 ta k t lu n p <0.05 Ho c d a vào t > t ỏ ả ậ ế K t lu n: Bác b gi ố quan có ý nghĩa th ng kê gi a l ồ c. Ph ng trình h i quy: H s góc b: s (cid:0) (cid:0) (cid:0) b r 38.0 .0 1537 s .3 .9 8639 5513
ồ ươ ủ ố ượ ườ ể ễ ượ ấ ng b t th ắ ng nhi m s c th theo l ng chì
ố ượ ườ ế ượ ng NST (/100 t bào) = 0,3338 + 0,1537 x l ng chì trong máu
ố
và a = ‘ y b‘ x = 5,97 0,1537×36,37 = 0,3338 ư ậ Nh v y ph ng trình h i quy c a s l trong máu là: ấ S l ng b t th (µg/100mL) ẩ ủ ộ ố d. Sai s chu n c a đ d c: ằ ẩ Đ l ch chu n h i quy b ng:
2
2
ộ ệ ồ
2
s
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y ( ) .20 808 .3 6374 (cid:0) (cid:0) 1 n r 2 .01 30 37995 2
bes .(.
)
.0
0707
2
.3 6374 435.51
x
x
(
)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ố ẩ ủ ộ ố
ị ư ậ ể
ế thuy t Ho: b=0: Ha: b<>0
ớ ộ ự Nh v y sai s chu n c a đ d c là 0.0707 e. Ki m đ nh b=0 ả ự Xây d ng gi ị ể ử ụ S d ng ki m đ nh t 2 đuôi v i đ t do = 28
c=2,05
ớ ạ ị ể i h n: t
(cid:0) (cid:0) (cid:0) (cid:0) t 17,2 Ta có th xác đ nh t t Tính giá tr tị ,0 ,0 b 0 bes .(. ) 1537 0707
ả ộ ự do ta có p <0,05
ế
ớ ậ ớ ỏ ả ế ả Tìm p: tra b ng t (b ng student) v i 28 đ t ặ ự Ho c d a vào t > t c= 2.05 ta k t lu n p <0.05 ậ ế K t lu n: Bác b gi ứ thuy t Ho v i m c ý nghĩa p<0,05
ể ồ ị ồ ứ ứ ầ ộ ề ề ứ ộ ố ẻ ổ ị ệ ủ ứ ẻ ầ ồ ủ ự ể ằ ổ ậ và ghi nh n ươ ượ c ng (đ ư ả ế Bài t p 2:ậ ợ ử M t nhà nghiên c u nghiên c u tr em b h ng c u li m th đ ng h p t ủ chi u cao c a đ a tr 5 tu i b b nh h ng c u và m c đ c t hoá c a x ố ể tính b ng thang đi m d a trên 20 đi m c t hoá c a bàn tay và c tay). K t qu nh sau:
ứ ộ ố ứ ộ ố ề Chi u cao M c đ c t hoá ề Chi u cao M c đ c t hoá
111.6 47 107.9 53
109.8 42 113.2 51
105.0 31 102.1 41
107.0 33 105.0 37
104.2 33 99.0 26
108.9 52 101.7 18
103.3 45 100.3 29
104.5 47 107.9 51
108.3 42 114.5 41
99.7 50 106.0 34
108.1 41
ụ ưở ế ng thành x b ng bi n s ố ớ ả ươ ế ố ả ằ ng (mô t ứ
ữ ả ế ố ề
ự ươ ng quan gi a chi u cao và m c đ c t hoá ậ ề
ủ ế ồ ố
ữ ề ươ ng trình h i quy c a chi u cao theo đi m c t hoá ố ẩ ủ ộ ố ủ ươ ồ
ề ứ ộ ố ứ ộ ố ng quan thu n gi a m c đ c t hoá và chi u cao hay không? ể ng trình h i quy. ầ ộ ố ủ ườ ươ ề tr em bình th ứ ả ộ ố ủ ở ẻ ị ồ ơ ở ẻ ầ ấ ậ ẻ ị b ch m tr V i m c tiêu là xem có ph i tr ể ạ i thích) có liên quan đ n r i lo n phát tri n chi u cao (bi n s đáp ng) hãy tính: gi ệ ố ươ a. H s t ả b. Có ph i có s t t ph c. Vi d. Tính sai s chu n c a đ d c c a ph Ở ẻ ồ ị ồ ng trình h i quy e. ươ ề ng chi u cao theo m c đ c t hoá là 0.4 cm/đi m c t hoá. Có ph i đ d c c a ph trình ng (không b h ng c u li m) đ d c c a ph ố ể ộ ố ườ ề tr bình th tr b h ng c u li m th p h n ng?
ố ố ố ệ ư ừ
Bài làm bài t p 2ậ ể a. T các s li u trên ta có th tính các s th ng kê nh sau: n=21; S xy/n=4283.2
ụ ướ ượ c l ng ậ l p: ph ộ thu c: ộ ế Bi n đ c ứ ộ ố M c đ c t hoá ế Bi n ề Chi u cao
Trung bình 40.19 106.1
ẩ ộ ệ đ l ch chu n 9.5217 4.276
ổ ươ ng đ ộ 42.582 19.123 Căn T ng bình ph l chệ
19.40
1.106
r
.0
49105
n
1
2. 5217
276.4
21 20
x
y
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ xy /) ( s ượ ệ ố ươ c h s t xn y s ng quan r n 4283 .9
ị ể
ộ
2
2
b. Ki m đ nh r=0 ố ế ế ả ự Xây d ng gi thuy t Ho: r=0; đ i thuy t Ha: r>0 ớ ộ ự ị ể ử ụ S d ng ki m đ nh t m t đuôi v i đ t do = 19 ị ớ ạ c =1.73 i h n t ta có giá tr t t Tính giá tr tị
(cid:0) (cid:0) ,01 (cid:0) (cid:0) (cid:0) (cid:0) res .(. ) ,0 03994 ,0 19985 (cid:0) 1 n r 2 49105 19
(cid:0) (cid:0) (cid:0) t ,2 457 r res .(. ) ,0 ,0 49105 19985
ộ ự do ta có p <0,025
ừ ả t > t
ậ
ứ ộ ố ươ ữ
ớ c = 1.73 nên p < 0.05 ứ ớ ế ỏ ả thuy t Ho v i m c ý nghĩa p<0,025 ề ậ ng quan thu n gi a m c đ c t hoá và chi u cao ồ ng trình h i quy:
ệ ố
y
x
ả Tìm p: tra b ng t (b ng student) v i 19 đ t ặ Ho c tính t ế K t lu n: Bác b gi ư ậ Nh v y có t ươ c. Ph H s góc b: s (cid:0) (cid:0) (cid:0) b r .0 49105 .0 2205 s .4 276 5217 .9
ươ ứ ộ ố ủ ồ ng trình h i quy c a chi u cao theo m c đ c t hóa bàn tay là
ề ố ể
và a = ‘ y b‘ x = 106.1 0,2205× 40,19 = 97,24 ư ậ Nh v y ph ề Chi u cao (cm) = 97,1 + 0,222 × Ði m c t hóa d. Sai s chu n c a đ d c:
ẩ ủ ộ ố ố
2
2
ộ ệ ằ ẩ ồ Đ l ch chu n h i quy b ng:
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y 123.19 123.19 .0 19985 .3 8217 ( ) (cid:0) (cid:0) 1 n .01 21 49105 2
r 2 ẩ ủ ộ ố ố
bes .(.
)
,0
08975
2
.3 .42
8217 582
x
x
(
)
Sai s chu n c a đ d c b: s (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ng trình ở ẻ ồ ả i câu h i trên chúng ta ph i ki m đ nh gi ở ẻ ế ộ ố thuy t đ d c ph ườ ị ể ng trình ươ ng = 0.4 tr em bình th
ề ớ ộ ố thuy t Ho: b=0.4: Ha: b<0.5
ớ ộ ự do = 19
c=1.73
ớ ạ ị i h n: t
ả ỏ ể ả ờ e. Đ tr l ằ ươ ầ tr h ng c u li m b ng v i đ d c ph ế ả ự Xây d ng gi ử ụ ị ể S d ng ki m đ nh t 1 đuôi v i đ t ể Ta có th xác đ nh t t Tính giá tr tị (cid:0) (cid:0) (cid:0) 2205 (cid:0) (cid:0) (cid:0) t 00,2 b bes ) .(. .04,0 ,0 08975
ả ộ ự do ta có p <0,05
ớ ậ ế
ỏ ả ứ ộ ố ưở ề ở ẻ ồ ề ế ớ ng chi u cao so v i m c đ c t hoá ể ế thuy t Ho. Chúng ta có th k t ấ tr h ng câu li m th p ườ ả Tìm p: tra b ng t (b ng student) v i 19 đ t ặ ự Ho c d a vào t > t c= 1.73 ta k t lu n p <0.05 ậ ị ế K t lu n: Giá tr t nói trên giúp chúng ta bác b gi ứ ộ ậ lu n m c đ tăng tr ẻ ơ h n tr bình th ng (p<0,05)
ạ ặ ộ ố ượ ằ ố ng nh m tìm m i ả ượ ệ ữ ư ậ Bài t p 3:ậ ề ứ M t nhà nghiên c u đo đ c chi u cao và cân n ng trên 8 đ i t ế ế ố liên h gi a hai bi n s trên. K t qu đ c ghi nh n nh sau:
ề Chi u cao (cm) 172.9 162.7 165.3 162.7 150 155.1 162.7 152.6
ặ Cân n ng (kg) 68.5 50.8 58 55.8 42.2 44.4 50.3 42.2
ề ữ ệ ố ươ ng quan gi a chi u cao và cân n ng?
ặ ượ ớ ơ c là l n h n giá tr 0,75 là h s ệ ố ng quan tính đ ườ ượ ị c báo cáo trong y văn.
ươ ủ ề t ph ng trình h i quy c a cân n ng d a trên chi u cao.
ặ ọ ủ ả ậ ủ ộ ườ ng tiên đoán c a m t ng ề i có chi u a. Hãy tính h s t ả ệ ố ươ ị b. Theo anh ch , có ph i h s t ặ ề ữ ươ ng đ ng quan gi a cân n ng và chi u cao th t ự ồ ế c. Vi ượ d. Hãy tính kho ng tin c y 95% c a tr ng l cao 160 cm.
ố ố ố ệ ư ừ
Bài làm bài t p 3ậ ể a. T các s li u trên ta có th tính các s th ng kê nh sau: n=8; S xy/n=8326.9
ế ụ ướ ượ c l ng ộ Bi n đ c ậ l p: ế Bi n ph ộ thu c:
ề Chi u cao Cân n ngặ
Trung bình 160.5 51.525
ẩ ộ ệ đ l ch chu n 7.4943 9.0637
ổ ươ ng đ ộ 19.828 23.98 Căn T ng bình ph l chệ
525.51
r
.0
96134
n
1
5.160 .9
0637
8 7
x
y
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ xy /) ( s ượ ệ ố ươ c h s t xn y s ng quan r n 8326 9. 4943 .7
ể ớ ơ ị ng quan tính đ c r = 0,96 có l n h n giá tr 0,75, ta có th s ể ử ượ ế ổ
ộ ị thuy t Ho: z(r)=z(0,75); Ha: z(r)>z(0.75) ị ớ ạ c=1.64 i h n z
ệ ố ươ ị b. Ð xác đ nh h s t ộ ể ị ụ d ng ki m đ nh z (m t đuôi) và phép bi n đ i Fisher z(r)= ln[(1+r)/(1r)]/2 ế ả ự Xây d ng gi ể ử ụ S d ng ki m đ nh z m t đuôi; giá tr t Tính giá tr zị
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) z ,0( 96134 ) ln ln ,1 9633 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) r r 1 2 1 1 1 2 ,01 ,01 96134 96134
1
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) z )75,0( ln ln ,0 97296 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) r r 1 2 1 1 1 2 75,01 75,01
zes .(.
)
,0
447
(cid:0) (cid:0) (cid:0)
n z
3 )
(cid:0) (cid:0) (cid:0) rz )( ( ,1 9633 ,0 97296 (cid:0) (cid:0) (cid:0) (cid:0) z ,2 215 (cid:0) ,0 99034 ,0 447 n /(1 )3 5/1
ả
c = 1.64 chúng ta k lu n p <0.05 ớ ơ ố ệ ượ
ỏ ả ế ậ ứ ệ ố ươ ng quan thuy t Ho v i m c ý nghĩa p<0,025 nghĩa là h s t ứ c báo cáo trong y văn (p <0.025)
ượ ươ ồ
ệ ố
y
x
Tìm p: tra b ng z ta có p =P(|z|>2,19) <0,025 ặ ự Ho c d a vào z > z ậ ế ế K t lu n: Bác b gi c trong nghiên c u này cao h n s li u đ tìm đ c. Ph ng trình h i quy: Ta có ‘ x =160,5; ‘ y=51,525 H s góc b: s (cid:0) (cid:0) (cid:0) b r .0 96134 163,1 s .9 .7 0637 4943
ươ ủ ề ồ ứ ộ ố ng trình h i quy c a chi u cao theo m c đ c t hóa bàn tay là
ượ ủ ậ ọ ủ ộ ườ và a = ‘ y b‘ x = 51,525 1,163 × 160,5 = 135,1 ư ậ Nh v y ph ặ Cân n ng (kg) = 135.1 + 1,163 × Chi u cao ả d.Kho ng tin c y 95% c a tr ng l ề ng tiên đoán c a m t ng i cao 160 cm.
2
2
ộ ệ ằ ẩ ồ Đ l ch chu n h i quy b ng:
2
(cid:0) (cid:0) .01 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y ( ) 98.23 98.23 .0 11242 .2 6958 (cid:0) (cid:0) 1 n r 2 96134 28
2
2
ố ẩ ủ Sai s chu n c a tiên đoán:
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
160
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
s
(cid:0) (cid:0)
yes .(.
)'
1
.2
6958
1
,2
8601
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
1 n
1 8
5,160 828
.19
) x
xx '( x (
)
(cid:0) (cid:0)
ọ ề ượ ng tiên đoán là: ng v i chi u cao là 160, tr ng l
ớ ặ
ả ượ ủ ọ ng tiên đoán là:
ừ ả ớ ộ ự b ng t (hai đuôi) v i n2 đ t c tra t do
ế Ứ Cân n ng (kg) = 135.1 + 1,163 × 160 = 50,98 ậ ậ Vì v y kho ng tin c y 95% c a tr ng l y – tc· v i tớ c đ 50.98 – 2.8601 = 43,97 đ n 57,99 kg s.e.(y') ượ 2.45 ·
ẻ ơ ủ ầ ổ ạ i trung ổ ng (kg) và tu i thai (tu n tu i) c a 515 tr s sinh sinh t ượ ả Bài t p 4:ậ ậ Ghi nh n tr ng l ế tâm y t ọ ượ ệ huy n X đ c trình bày trong b ng sau:
ầ ổ ộ ổ Tu n tu i 2.53.0 3.03.5 3.54.0 T ng c ng
3436 14 1 0 15
3638 42 20 9 71
3840 60 138 71 269
4042 20 81 59 160
ộ ổ T ng c ng 136 240 139 515
ọ
ữ ậ ượ ọ ổ ệ ố ươ ự ươ
ự ế ươ ủ ồ
ng s sinh. ơ ổ ng trình h i quy c a cân n ng so sinh d a trên tu n tu i. ẻ ơ ổ ng quan gi a tu i thai và tr ng l ữ ng quan thu n gi a tu i thai và tr ng l ặ ọ ơ ượ ng s sinh hay không? ầ ủ ượ ổ ủ ả ậ ng tiên đoán c a tr s sinh có tu i thai
ậ ả ệ ố ủ ủ ươ ồ ng trình h i quy. Lí ướ ượ c l ả ng kho ng tin c y 95% c a h s góc c a ph ậ a. Hãy tính h s t ả b. Có ph i có s t c. Vi t ph d. Hãy tính kho ng tin c y 95% c a tr ng l là 40 tu n.ầ e. Hãy ả gi i kho ng tin c y nói trên.
Bài làm bài t p 4ậ a.
ử ụ ỗ ị ủ ấ ả ộ t c các quan sát trong m t ị ể ư ủ S d ng giá tr trung bình c a m i nhóm là giá tr c a t ố ệ nhóm, ta có th trình bày s li u nh sau:
ầ ộ ổ ổ Tu n tu i 2.75 3.75 T ng c ng 3.25
14 1 0 35 15
37 71 42 20 9
60 138 71 39 269
41 160 20 81 59
ộ ổ T ng c ng 136 240 139 515
ầ ử ụ ứ ố ớ S d ng máy tính c m tay v i ch c năng th ng kê đ tính
ứ ể 2.75 + 35 · 1 · ể (cid:229) xy = 35 · ộ ố ạ ổ ổ ồ ‘ x, sx, ‘ y, sy. 14 · ớ ủ S d ng ch c năng nh c a máy tính đ tính t ng 3.5 = 65 818.25 (g m t ng c ng 12 s h ng) ử ụ 3.25 + .....+ 41 · 59 ·
ừ ố ệ ố ố ư
ể a. T các s li u trên ta có th tính các s th ng kê nh sau: n=515; (cid:229) xy = 65818.25 ; (cid:229) xy/n=127.80
ậ l p: ộ thu c: ướ ượ c l ng ế ổ ộ Bi n đ c ầ Tu i thai (tu n) ụ ế Bi n ph ặ Cân n ng (kg)
39.229 3.2529 Trung bình
1.4873 0.36571 ẩ ộ ệ đ l ch chu n
ổ ươ 19.828 23.98 ng đ ộ Căn T ng bình ph l chệ
2529
r
.0
35365
n
80.127 .1
229.39 .0
.3 36571
4873
515 514
1
x
y
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ng quan r n (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ xy /) ( s ượ ệ ố ươ c h s t xn y s
ị ể
ả ế ự ươ ữ ọ thuy t Ho: r=0 (không có s t ổ ng quan gi a tu i thai và tr ng l ượ ng
ọ ượ ổ ậ ng quan thu n)
ng s sinh và tu i thai có t ị ộ ớ ộ ự ố ớ do. Phân ph i t v i 513 đ t do có ẩ
ớ ạ ố c xem là phân ph i chu n. c = 1.64 i h n: t
2
2
b. Ki m đ nh r=0 ự Xây d ng gi ơ s sinh): ươ ơ Ha: r>0 (tr ng l ử ụ ộ ự ể S d ng ki m đ nh t (m t đuôi) v i 513 đ t ể ượ th đ ị Giá tr t t Tính giá tr tị
(cid:0) (cid:0) ,01 (cid:0) (cid:0) (cid:0) (cid:0) res .(. ) ,0 0017056 ,0 0413 (cid:0) 1 n r 2 35365 513
(cid:0) (cid:0) (cid:0) t 563,8 r res .(. ) ,0 35365 ,0 0413
ớ ả ả ự ộ ự do ta có p <0,0001
ậ
ỏ ả
c) chúng ta có th k t lu n có s t
ọ ậ ớ ữ ặ ự ế ậ ư ậ ế c = 1.64, ta k t lu n p <0.05 ứ ế thuy t Ho v i m c ý nghĩa p<0,0001 ượ ổ ậ ậ ọ ng quan thu n gi a tu i thai và tr ng l ớ ạ ượ ể ế ư ườ ơ i h n (t ng s sinh (p<0.05). L u ý: trong tr ơ ỉ ự ế ậ ớ ế ệ ượ ể ị ị ọ ng trình máy tính) đ xác đ nh đ
ươ ồ ươ
ệ ố
y
x
Tìm p: tra b ng t (b ng student) v i vô c c đ t Ho c d a vào t = 8.563 > t K t lu n: Bác b gi ự ươ ế ơ Nh v y có s t ng s sinh (p <0.001). N u ự ữ ự ươ chúng ta d a vào t t ng quan thu n gi a ổ ả ệ ợ ng h p này vi c tra b ng tu i thai và tr ng l ậ ạ ị ớ ạ ị ể i h n. Vì v y đ tìm ra giá tr p cho k t lu n m nh h n so v i ch d a vào giá tr t t ố ả ế ề t báo cáo khoa h c, chúng ta nên tra b ng th ng kê n u đi u ki n cho phép, khi vi ặ ử ụ (ho c s d ng ch c giá tr p. c. Ph ng trình h i quy: Ta có ‘ x =39,229; ‘ y=3,2529 H s góc b: s (cid:0) (cid:0) (cid:0) b r .0 035365 .0 08696 s .0 .1 36571 4873
ươ ủ ặ ng trình h i quy c a cân n ng theo tu i thai là
ổ
ượ ậ ọ ẻ ơ ủ ầ ớ ổ ng tiên đoán c a tr s sinh v i 40 tu n tu i thai.
2
2
ủ ằ ộ ệ ẩ và a = ‘ y b‘ x = 3,2529 0,08696 × 39,2229 = 0,1585 ổ ồ ư ậ Nh v y ph ặ Cân n ng (kg) = 0,1585 + 0,08696 × tu i thai ả d. Kho ng tin c y 95% c a tr ng l ồ Đ l ch chu n h i quy b ng:
2
(cid:0) (cid:0) .01 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y ( ) .8 2912 .8 2912 .0 0413 .0 34242 (cid:0) (cid:0) 1 n r 2 35365 2 515
2
2
ố ẩ ủ Sai s chu n c a tiên đoán:
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
40
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
s
(cid:0) (cid:0)
yes .(.
)'
1
.0
34242
1
.0
34283
2
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
1 n
1 515
229.39 719
.33
) x
xx '( x (
)
(cid:0) (cid:0)
ọ ổ ầ Ứ ượ ng tiên đoán là:
ớ ặ
ả ủ ượ ọ ng tiên đoán là:
c=1.96
ừ ả ớ ộ ự ư ự b ng t (hai đuôi) v i n2=513 (xem nh là vô c c) đ t do. t
ế s.e.(y') ượ c tra t 1.96 · 0.34283 = 2.648 đ n 3.992 kg
ủ ệ ố ủ ố ồ ặ ổ ng v i tu i thai tính theo tu n là 40, tr ng l Cân n ng (kg) = 0.1585 + 0.08696 × 40 = 3.3199 ậ ậ Vì v y kho ng tin c y 95% c a tr ng l y' – tc· v i tớ c đ 3.3199 – ả ậ e. Kho ng tin c y 95% c a h s góc ươ ẩ ủ ệ ố Sai s chu n c a h s góc c a ph ng trình h i quy cân n ng theo tu i thai
s
bes .(.
)
.0
001032
2
.0 331
34242 79.
x
x
(
)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ồ ả ậ ặ ươ ủ ộ ố ổ ng trình h i quy cân n ng theo tu i thai
c=1.96
s.e.(b) ượ ừ ả ộ ự ự ư ớ b ng t (hai đuôi) v i n2=513 (xem nh là vô c c) đ t do. t
ế ầ ổ 0.001032 = 0.08494 đ n 0.08898 kg/tu n tu i thai. c tra t 1.96 ·
ư ứ ộ ớ ẽ ằ ả ổ ậ ọ ậ ả ừ ổ i c a kho ng tin c y trên nh sau:V i m c đ tin c y 95%, khi tu i thai tăng ế là 84,94 gram đ n ậ Vì v y kho ng tin c y 95% c a đ d c ph là: b – tc· v i tớ c đ 0.08696 – ả ủ Lí gi ầ thêm 1 tu n tu i, tăng tr ng trung bình s n m trong kho ng t 88,98 gram.

