ộ CHƯƠNG TRÌNH MÔN HỌC: THỐNG KÊ Y HỌC ắ (Môn b t bu c)
Mục tiêu môn học:
ả ố ọ
ế ị ượ Ứ ụ ệ ấ ẩ ọ ệ Sau khi hoàn thành môn h c th ng kê y h c, sinh viên có kh năng: ng d ng đ ề c khái ni m xác su t trong vi c ch n đoán và ra quy t đ nh đi u trị
ơ ả ệ ố ượ ử ụ ượ c các khái ni m th ng kê c b n đ c s d ng trong các báo i thích đ ứ cáo y t
ươ ả ể ố ệ ế ộ đ trình bày s li u y t m t cách ế ả Gi ặ ọ ế ho c bài báo nghiên c u khoa h c ố ọ ự ượ ng pháp th ng kê mô t c ph Ch n l a đ ụ thuy t ph c và rõ ràng
ể ể ị ả ế ế ượ Ch n l a test th ng kê phù h p đ ki m đ nh gi thuy t và ti n hành đ c các ả ợ ầ
ọ ự ơ ủ ố ụ ế ượ ố ớ ọ ầ ộ ớ ố c các test th ng kê v i ứ ầ có ch c năng ả s h u m t máy tính c m tay ọ ờ ọ ủ ố ố test th ng kê đ n gi n v i máy tính c m tay. ả ọ Vì m c tiêu c a môn h c là h c viên có kh năng ti n hành đ ở ữ máy tính c m tay, các h c viên ph i ọ h c c a môn th ng kê y h c th ng kê trong gi
Nội dung
ố ế S ti t
STT Tên bài h cọ ổ T ng s ố Lý Th cự hành Thuyế t
ạ ươ ấ Ð i c ng xác su t (XS) 4 2 2 1
ấ ậ ộ ề ệ ị 4 2 2 2 ầ Xác su t có đi u ki n Ð nh lu t c ng XS, ứ nhân XS; Công th c XS toàn ph n
Ứ ụ ề ẩ ị ng d ng XS trong ch n đoán và đi u tr 4 2 2 3
ố ố 4 2 2 4 ườ ố ố ấ Các phân ph i xác su t: phân ph i Poisson, ng phân ph i Bernoulli và phân ph i bình th
ệ ni m s 4 2 2 5 ế bi n ố ề v ố ệ ằ ố Khái ắ t và trình bày s li u b ng th ng kê và Tóm t ồ bi u để
ỉ ệ ẫ m u 4 2 2 6 ả ng kho ng tin ị ể Nguyên t c ki m đ nh So ị ế Bi n thiên t l ủ ỉ ệ ậ c y c a t l ỉ ệ ằ sánh 2 t l ướ ượ c l ắ ể b ng ki m đ nh z
ẫ ị 4 2 2 6 ể ắ ặ ủ ể ị ế Bi n thiên c a trung bình m u ki m đ nh t ắ ặ b t c p ki m đ nh z và t không b t c p
ể ị ươ Ki m đ nh chi bình ph ng 4 2 2 8
ể ộ ề ng sai m t chi u đ so sánh 4 2 2 9 ề ươ Phân tích ph nhi u trung bình
ươ ế ơ 4 10 T ồ ng quan và h i quy đ n bi n 2 2
1
ế ấ ả ầ
ả Phương pháp giảng dạy: ử ụ ế Thuy t trình s d ng Ph n b ng và máy chi u qua đ u Làm bài t pậ ậ Th o lu n nhóm
ạ ậ bài t p ki m tra
Lượng giá: ượ ượ ỗ ơ ế ọ ế ể ề ự ỏ ọ L L ị ọ ng giá đào t o sau m i đ n v h c trình: ầ ng giá k t thúc khi h t h c ph n: Thi câu h i nhi u l a ch n
ồ ả ế công ượ ườ ạ ọ ố ấ ng Ð i h c Y D c, 2001
ả
ỗ ị
ệ ả
Tài liệu học tập: Sách giáo khoa: ỗ Ð Văn Dũng. Xác su t và sinh th ng kê căn b n. TP H Chí Minh, Khoa Y t ộ c ng, Tr Sách tham kh o chính: Kirwood B. Essentials of Medical Statistic. London, Blackwell Scientific Publications, 1988 (Ð Văn Dũng biên d ch) Tài li u tham kh o: DawsonSaunders B, Trapp RG. Basic clinical biostatistics. London, Prentice Hall International, 1990 Jekel JF, Elmore JG, Katz DL. Epidemiology, Biostatistics and Preventive Medicine. Philadelphia, W.B. Saunders company, 1996.
2
THỐNG KÊ VÀ VAI TRÒ CỦA THỐNG KÊ TRONG Y HỌC
ậ ọ ề ệ
ố ề ố ữ ả ố ệ i s li u. ố ộ ố ỉ ể ọ ổ ế ư ế ứ ượ ằ ọ ẽ ư ậ ố ọ
ế ở ư ầ ố ố ẻ ớ ư ề ệ ơ ầ ố ứ ạ ụ ộ ở ộ ố ể ạ ố Th ng kê là khoa h c v vi c thu th p, phân tích và lí gi ọ ị ộ ậ ằ Nh ng quan sát trên sinh viên đ u xác nh n r ng th ng kê “Th ng kê là m t môn h c b sinh viên ghét nh t” ấ 1. M t nhà th ng kê y h c n i ti ng cũng ch có th t ủ ằ ể ự i r ng: an 2 T i sao ạ ố "sinh viên y khoa có th không thích th ng kê, nh ng n u là bác sĩ, h s thích" ầ ườ sinh viên y khoa không nh n th c đ i th y c r ng th ng kê là quan tr ng nh các ng ủ ọ c a h ? ả ở B i vì trong các tình hu ng đ n gi n, th ng kê có v nh không c n thi t b i vì chúng ố ể ể ta có th hi u rõ mà không c n th ng kê. Nh ng v i ngh nghi p là bác sĩ hay chuyên ơ ẽ ế công c ng, tình hu ng s ph c t p h n, th ng kê tr thành m t công c then viên y t ữ ư ậ ố ch t. Nh v y khi nào th ng kê là h u ích và nó có th làm gì cho b n.
ổ ậ ệ ế ự ớ ạ c ti n hành t ậ ủ ả ế ư ậ ề ạ ườ i tr ớ ậ ườ ượ i các th c nghi m đ ộ ủ ể ầ
ề ả ứ ậ ạ ấ ạ ả ứ ế ự ế ẫ ậ ố ầ
ạ ử ụ ế ế ạ ể ắ ế ượ ừ ố ế trong cu c s ng hàng ngày: n u b n s d ng máy chi u qua ệ t ph i b t máy b ng nút nào b n có th c m đi n cho máy chi u và ơ c máy chi u. Trong các tình hu ng đ n ự ả ậ ế ư ườ ế 1. Những tình huống không cần dùng đến thống kê ng ph thông? Trong v t lí, các Hãy nh l ề ắ ắ ọ h c sinh ghi nh n chu kì dao đ ng c a con l c v i các chi u dài con l c khác nhau và ề ố ữ ể ế so sánh k t qu và nh v y là đ đ có th k t lu n v m i liên quan gi a chi u dài và ắ ợ ố ế ng h p này. chu kì con l c. Th ng kê không c n thi t trong tr ẽ ả ứ ạ ả ự ậ ướ ế ọ Trong bài th c t p v hoá h c, khi th mi ng kim lo i Natri vào n c, ph n ng s ể ượ ề ầ ệ ậ ệ ẩ i r t nhi u l n và x y ra mãnh li c th c hi n l p đi l p l t. Ph n ng này có th đ ể ị ạ ả ằ cho k t qu h ng đ nh. Chúng ta có th rút ra k t lu n là kim lo i Natri ph n ng m nh ứ ệ ả ờ ớ ướ c mà không c n ph i vi n d n th ng kê. và t c th i v i n ộ ố ươ ề Đi u này cũng t ng t ằ ầ ế đ u và không bi ậ ể ki m tra t ng nút cho đ n khi b t sáng đ ầ ố ả gi n, th ng kê d t. ng nh không c n thi
ể ố
ộ ắ ễ ể ằ ố t và trình bày m t cách d hi u các thông tin b ng s
ả ể ụ ử ụ ế ề ụ ữ ườ ph n mãn kinh hay không và cho phép đo l
ộ ừ ụ ử ụ nhóm s d ng các nhóm khác nhau – thí d , so sánh k t cu c t ượ ử ụ ố c ph m đ i ch ng.
ế ứ ọ ệ ụ ể ượ ả ẩ ụ ố ớ c kh năng m t bi n c x y ra đ i v i m t b nh nhân c th thí d , ứ ộ ượ ủ Th ng kê có th làm gì ? Cho phép tóm t ế ả ị ị ộ thuy t – thí d s d ng đi u tr hormone thay th có làm gi m Ki m đ nh m t gi ồ ứ ở ơ ơ nguy c nh i máu c tim ng m c ậ ắ ủ ế ộ ắ đ ch c ch n c a k t lu n. ừ So sánh thông tin t ạ ẩ ượ d Tiên đoán đ ử t c ph m có ho t tính và nhóm s d ng d ố ả ng đ ộ vong trong vòng 5 năm – và c m c đ chính xác c a tiên đoán ế ướ ượ c l
ộ ố ả ụ ọ ả ướ ượ ấ ố c l ị ạ ng càng chính xác càng t ả ả ề ả ứ ế ề ấ ể ạ ề ng quá th p, ti n đ n bù s v ướ ượ c l ế ậ ể ơ ấ ả ả ườ ở ế ể ở ơ ấ ẽ ữ ả ả i có nguy c th p s không mua b o hi m ho c s mua b o hi m 2. Các tình huống trong đó thống kê là quan trọng ể ộ Xem xét m t thí d khác. M t công ty mu n bán b o hi m nhân th cho các khách hàng ủ c a mình và công ty đó ph i t xác su t khách hàng đó ờ ị ử vong hay b tai n n trong các kho ng th i gian ti p theo và các kho n ph i đ n bù b t ả ả ẽ ượ ướ ượ ế ươ t quá kho n phí b o c l ng ng. N u công ty t ớ ẽ ế ượ ể c. N u công ty ng quá cao, công ty s không th c nh tranh v i hi m thu đ ả ể ả t l p phí b o hi m khác nhau cho các các công ty b o hi m khác. Công ty ph i thi ấ ể ả i có nguy c th p ph i đóng phí b o hi m th p b i vì n u không khách hàng, ng ặ ẽ ể ườ nh ng ng các công ty khác.
3
ế ượ ể ướ ượ ng đ c xác su t b t ả c l ườ vong hay tai ế ườ t i này bi ấ ị ử i khách hàng trong khi ng ế ề ả
ườ t đ c nhóm ng ứ ư ể ả ẻ ệ ạ i, ngh nghi p, v.v d b các nguy c ở ệ ư ổ ạ ự ườ ơ ệ ủ ườ ữ ở ượ ể i nam và 1000 ng ứ ề ự ể ẽ ị ơ ử ự ệ ế ố t v v nguy c t
ượ ự ệ ừ vong và b nh t t và ơ ử ng. Ngoài ra n u nguy c t ơ ự ể ả ủ ưở ả ộ ơ ơ ử ng đ n nguy c t
ự ắ ủ ướ ượ ệ ơ ộ ế ể ắ ộ ả ữ Nh ng làm th nào m t công ty b o hi m ố ơ ạ ủ t h n chính b n thân ng n n c a khách hàng t ơ rõ v b n thân mình h n ai h t. ể ế ượ ố ừ ố ở i nào, th ng kê qu c gia, các công ty b o hi m có th bi B i vì t ề ơ ễ ị ệ ạ ớ i tính, tu i, tình tr ng s c kho hi n t theo gi ậ ữ ử ậ ể ệ nam và n , không vong t và tai n n. Nh ng đ so sánh nguy c b nh t b nh t t và t ể ơ ắ ắ ả đ n gi n nh th c nghi m so sánh chu kì c a con l c dài và ng n, không th so sánh ộ ử i n b i vì không th nào tìm đ t c m t nhóm vong 1000 ng ạ ẻ ệ ố ề ổ ườ i đàn ông và đàn bà có cùng phân b v tu i, tình tr ng s c kho , ngh nghi p; ng ứ ả ả ớ ệ ủ ở này ch không ph i b n thân gi t c a các y u t B i vì có th là chính s khác bi i ệ ậ ệ ề ề vong và b nh t t. tính s ch u trách nhi m cho s khác bi ướ ượ ệ ế ể ố ề c l c nguy ng đ Đi u đáng m ng là th ng kê có th xét đ n các s khác bi ơ ế ở ố ượ ơ ử ậ ủ nam cao h n vong c t t c a các đ i t ở ữ ệ ề ế ị t v nguy c này có ph i là do tình n , nó có th giúp chúng ta quy t đ nh s khác bi ế ố ờ không rõ, do chúng ta không c (chance) hay không. Tình c là tác đ ng c a các y u t ườ ề ế ư ế ố di truy n, môi tr vong nh y u t ng, thói có thông tin, nh h ể ướ ượ ệ ả ố c l quen v sinh, tính khí. Th ng kê do đó có th t này là ng kh năng s khác bi ứ ộ ố ng. c l t m c đ không ch c ch n c a do c h i và nghĩa là th ng kê có th cho bi
ể ố
ư ườ ụ ệ ắ ệ
ướ ượ c đ ng tr ứ nghiên c u trên m t s l n đ i t ng
ễ c – thí d vi c m c b nh ộ ố ớ ượ ố ượ ể c ki m soát
ữ ữ ư Khi nào th ng kê có th có ích? ế ố Nh ng bi n c không l Thông tin có đ ế ố Nh ng y u t ế ố Nh ng y u t ượ ừ c t có liên quan không d dàng đ có liên quan là ch a rõ
ộ ệ ơ ử ng nguy c t ấ ố vong và b nh t ấ ấ ề ườ ứ i h n các b nh nhân. Th hai, ng ườ i bác sĩ s ch có th bi c thông tin v ế ả ề ớ ẽ t và ng ườ ườ ứ ườ ậ ế ệ ị ệ ệ ả ệ ậ ự t d a trên kinh nghi m ườ ứ i bác sĩ đó ể i bác sĩ không th đánh giá ề ể ế ượ t đ ế ẽ ấ i và s m t thông tin n u ợ ệ ơ ng h p t h n các tr ơ ử ể ổ ề ự t đi u tr này có ph i th c ư ế ố ủ ả khác nh ớ ườ ướ ượ ế i bác sĩ c l N u m t ng ự ứ ủ c a mình ch không d a trên th ng kê ít nh t có ba v n đ . Th nh t, ng ộ ố ớ ạ ệ ỉ ế ượ c m t s gi ch bi t đ ộ ẽ ỉ các thông tin m t cách khách quan: ng ị ế ở ạ ườ ệ ả ề ị ố ệ i b nh tr l hi u qu đi u tr n u k t qu đi u tr t ợ ộ ặ ệ ỏ ệ ng h p b nh đ c bi b nh nhân b cu c, bác sĩ s nh các tr ị ộ ồ ề ệ ng. Th ba, n u có m t phác đ đi u tr có th thay đ i nguy c t b nh thông th ườ ể ế ớ i bác sĩ không th bi t, v i kinh nghi m ng vong và b nh t ộ ưở ả ự ng này là do tác đ ng c a các y u t s là có hi u qu hay không hay nh h ưỡ ổ tu i, gi i, dinh d ng
ố ệ ể ư ướ ộ ộ ơ ả ả ờ l ệ ố ứ ể ế ố ư ườ ữ ơ ử ề ơ ố vong cao h n ng
ườ ế ể ở ơ ử ượ ế ố ủ ể ườ ụ ỉ ng và ki m soát b i vì nó ch ph ụ vong ph ế ầ c và h u h t ng và đ dài c a con l c. Nguy c t ượ ượ c đ không th đo l ắ ng đ ế ố ề ề 3. Tại sao 2 nhóm tình huống này là khác nhau ế ầ ề ầ c. Chu kì dao Các bi n c trong nhóm đ u ti n h u nh hoàn toàn có th tiên li u tr ấ ả ứ ủ ắ ố ấ ể ộ ằ ộ đ ng c a con l c là m t h ng s b t k biên đ dao đ ng. Natri luôn luôn ph n ng r t ỉ ầ ệ ớ ướ i ch c n kinh t v i n mãnh li c. Trong các tình hu ng đ n gi n, đ có câu tr ặ ơ ủ ệ nghi m là đ . Trong nhóm tình hu ng th hai, các bi n c khó tiên li u h n và m c dù ế ố ườ ng khác cũng i n nh ng có nhi u y u t i nam có nguy c t quan tr ng.ọ ứ ấ ễ ố Các bi n c trong nhóm th nh t d dàng đo l ộ ố ộ ộ ọ ế ố thu c vào m t s các y u t tr ng l ấ ộ ế ố ộ , m t vài y u t thu c vào r t nhi u y u t ể ể này đ u không th ki m soát. các y u t
4
ệ ứ ụ ữ ườ ơ ẫ ạ ể ị ộ ế ườ ộ
ế ố ệ ổ ơ ủ ể ự ể ộ ố ớ ế ườ ố ớ ườ ệ i ph n trung niên, không ư i đàn ông i v n s ng. Chúng ta không th d a vào kinh ấ i có th cung c p i.Dù v y, th ng kê v i m t s l n ng ậ ơ ử ng nguy c t ể ạ ẫ ố vong. ị ộ ố ướ ượ c l
Các bi n c trong nhóm th hai khó tiên li u h n. M t ng ế ắ m c b nh m n tính v n có th b ch t trong năm ti p theo nh ng m t ng ớ l n tu i h n b cao huy t áp có th l nghi m c a m t s ng thông tin giúp
ạ ố ắ ơ ệ
ề ừ ệ nhi u b nh nhân
ơ
ữ ụ ữ ể ệ ả ỏ ộ ế ố ả tình c m T i sao th ng kê cho thông tin đúng đ n h n kinh nghi m Thông tin t ơ Có thông tin chính xác h n và khách quan h n Gi m thi u sai l ch – thí d nh ng b nh nhân b cu c hay nh ng y u t ậ ưở ế ế ả ệ không nh h ng đ n k t lu n
ươ ứ ạ ủ Ph ng pháp phân tích giúp chúng ta rút ra ý nghĩa c a các thông tin ph c t p
ộ ế ẩ ệ công c ng tham gia vào công vi c phòng b nh, ch n đoán m t s ờ ậ ệ ủ ố i khuyên cho ng ệ ượ ề ệ ệ ị ạ ộ ữ ế ầ
ậ
i dân tiên l ẩ t cho nh ng ho t đ ng này là: t do nguyên nhân gì? ứ ủ ấ
ệ ấ ị ộ ệ ữ ệ ẩ ề ệ ả ệ ả ị 4. Tại sao thống kê cần thiết cho y khoa và y tế công cộng? ộ ố Các chuyên viên y t ế ườ ư ệ ng c a các bi n c . Bác sĩ b nh t t cũng nh cho l ữ ả cũng ph i tham gia vào vi c phòng b nh, ch n đoán, đi u tr cho b nh nhân. Nh ng thông tin c n thi ệ ệ Phòng b nh: B nh t ệ Ch n đoán: B nh nhân có nh ng tri u ch ng và d u hi u gì c a bênh ệ Đi u tr : Đi u tr nào là có hi u qu cho m t b nh nh t đ nh và có hi u qu cho b nh
ả ẽ ễ ư ư ấ ị ộ ệ ị ề nhân nào ộ ệ ữ ả ệ ắ T v n: M t b nh nhân b m t b nh nào đó (nh nhi m HIV) s có kh năng m c ớ i.
ề ề ữ ế ố ộ ấ và ph n l n nh ng y u t ụ ệ ở ế ố ầ ớ môi tr ậ c, thí d b nh có th gây ra b i y u t ề ươ ứ ề ậ ị ế ố ữ ở ườ ể ng, b i tác ế ố ệ ệ b nh nhân (di truy n, hành vi v sinh, các ấ ớ ứ t, đáp ng v i đi u tr và các tri u ch ng, d u hi u b nh t ề ộ ệ ộ ệ ệ xã h i). T ế ố ế ự nhiên c a b nh ph thu c vào nhi u bi n s .
ụ ế ứ ộ ư ượ ụ ệ ấ ụ ế ườ ạ ộ ươ ủ ế ả ọ ộ công c ng t ị ế ầ ấ ể ị ấ ộ ề ố ữ ườ ư ậ ố ử ụ ố i nói d i tr i nói d i và nh ng ng ph i nh ng b nh lí gì trong 5 năm t ụ Nh ng thông tin này ph thu c r t nhi u vào nhi u y u t ượ này không tiên đoán đ ẩ nhân vi sinh v t (vi khu n, virus), các y u t ự ế ố ng t y u t ủ ệ ễ di n ti n t ạ ố ấ ầ ố t. Tuy nhiên do th ng kê là m t công c h t s c m nh Th ng kê rõ ràng là r t c n thi ộ ề ẽ c hu n luy n m t i l m d ng trong khi h ch a đ m nên nó đã b r t nhi u ng ầ ng lai c n ph i tìm cách đ y đ . M t bác sĩ hay m t chuyên viên y t ữ ạ ớ ể hi u th u đáo v th ng kê khi s d ng nó đ tránh b x p vào cùng lo i v i nh ng ủ ơ ườ ng tráo nh theo cách nhìn nh n c a nhà văn Mark Twain (“lies, damned lies, and statistics”)
Tài liệu tham khảo 1. Sinclair S. Making doctors: an institutional apprenticeship. Oxford: Berg, 1997. 2. Bland JM. Medical students may not like statistics, but as doctors they will. BMJ 1998;316:1674. http://bmj.com/cgi/content/full/316/7145/1674
5
6
MỘT SỐ KHÁI NIỆM CĂN BẢN VỀ XÁC SUẤT
ả ứ
ị
ấ ợ ủ ượ ậ ự ợ c t p giao và h p c a 2 t p h p xác đ nh
ổ ợ ể c hai công th c chuy n v và t h p
ư ậ ứ ề ị
ấ ấ Mục tiêu ủ ề ọ Sau khi nghiên c u ch đ , h c viên có kh năng: ụ ề Trình bày 2 đ nh nghĩa v xác su t và đ a ra các ví d ị Xây d ng đ ị ệ ượ t đ Trình bày và phân bi ệ ủ Trình bày đ nh nghĩa c a xác su t có đi u ki n ấ ứ ứ ộ Trình bày công th c c ng xác su t và công th c nhân xác su t
1. Ðịnh nghĩa về xác suất
ị ầ ấ ấ ươ
EP (
(cid:0))
f n
ữ ườ ố ng đ i ầ ụ ệ ấ ố ấ ẽ ấ ầ ố ố ộ ổ ấ ươ ố ấ ươ ế ấ ươ ử ế ố ế ố ề ầ ố ủ ầ ầ ng đ i c a bi n c E s ế ấ ủ ỉ ằ 1.1 Ð nh nghĩa xác su t theo t n su t t ề ng đ i. Thí d m nh đ Theo ngôn ng thông th ng, xác su t chính là t n su t t ề ầ ẳ ị ầ kh ng đ nh xác su t sinh con trai là 0,515 có nghĩa là khi th ng kê nhi u l n sinh, t n ấ ả ầ ỉ ằ ấ ươ ng đ i là t n su t x y ra ng đ i sinh con trai s x p x b ng 0,515 (t n su t t su t t ố ầ ế ố ượ ậ c l p bi n c quan tâm chia cho t ng s l n th ). Nói cách khác, n u m t quá trình đ ẽ ả ạ i n nhi u l n, và n u có f l n x y ra bi n c E, t n su t t l ấ x p x b ng xác su t c a E.
(1)
ượ ề ầ ấ ồ ặ ấ ấ ả ặ ấ ấ
ụ ệ ầ ệ ự Thí d : Buffon th c hi n 4040 l n tung đ ng ti n và quan sát đ c 2048 l n xu t hi n ỉ ố ả ấ ươ ầ ặ ấ m t s p. T n su t t ng đ i x y ra m t s p là . Xác su t x y ra m t s p cũng x p x ằ b ng 0,507.
ử ế ụ ế ố ế ố ố ậ
ộ ề ể ả ộ ồ ả ấ ặ ặ ặ ộ ệ ớ ế ồ ề ệ ự ể ấ ặ ấ ệ ọ ấ c. Ng ề ế ụ ườ ặ ử ủ ồ
ắ ấ ự ng t ặ ệ ặ ấ ắ ượ ọ ọ ẫ ệ ế ắ ặ ố ế ụ ặ
ế ế ố ộ ầ ử ầ ử ở ệ ồ , 0 ph n t ồ ầ ử hay 1 ph n t ế ộ ừ ể ặ
ể ả ố ắ ặ ổ ắ ộ ế ụ ắ ố ể ố ể ồ ủ
ế ố ố ậ ượ ọ Ac (đ ấ ở ề ẵ ế ố ặ ẻ ắ ớ ế ố ồ ặ ế ố ế ố ặ 1.1 Phép th , k t c c, bi n c , bi n c đ i l p ế ẳ Khi chúng ta gieo m t đ ng ti n lên m t m t ph ng có th x y ra m t trong hai k t ử ệ ụ c c: xu t hi n m t s p ho c xu t hi n m t ng a v i k t qu không th tiên đoán ặ ử ượ i ta g i vi c gieo đ ng ti n là phép th (experiment) và s xu t hi n m t đ ấ x p hay m t ng a c a đ ng ti n là các k t c c (outcome). ươ ệ ể , khi chúng ta tung con xúc x c, có th xu t hi n các m t 1, 2, 3, 4, 5, 6 thì T ử ấ ẫ ệ c g i là phép th ng u nghiên và vi c xu t hi n m t 1, xu t vi c tung con xúc x c đ ế ế ụ ượ ệ hi n m t 2, 3, 4, 5 và 6 đ c g i các k t c c ng u nhiên. N u chúng ta quan tâm đ n ặ ế ố ẵ bi n c ra m t xúc x c ch n thì bi n c (event) này bao g m 3 k t c c: ra m t 2, ra ậ ặ ế ụ ợ ặ là các k t c c. B i vì m t 4 và ra m t 6. Nói khác đi bi n c là t p h p mà các ph n t ợ ầ ử ể ậ nên vi c ra t p h p có th có bao g m toàn b các ph n t ể ụ ộ ừ ắ ặ m t m t xúc x c nào đó (thí d ra m t 2) v a có th xem là k t cu c v a có th xem là ế ố ế ố ơ ấ ượ ọ ế ố c g i là bi n c s c p. bi n c : bi n c đó đôi khi đ ế ụ ệ ắ ế t , có k t c c sau có th x y ra {1,1,1} (ba N u chúng ta tung 3 con xúc x c phân bi ố ể ế con xúc x c ra m t 1); {1,1,2}; {1,1,3};....; {6,6,5}; {6,6,6}. Bi n c có t ng s đi m ể ị ự ươ ủ chúng ta có th đ nh ng t c a 3 con xúc x c =18 bao g m m t k t c c {6,6,6}. T ế ế ố ổ ế ố ổ nghĩa bi n c t ng s đi m c a ba con xúc x c <=10, bi n c t ng s đi m là 11; bi n ố ổ ố ể c t ng s đi m >=12. ộ ỗ ố ớ Đ i v i m i bi n c A có m t bi n c đ i l p (complementary event ) c đ c là ụ ủ ử ế ụ . Tr v thí d c a phép th tung không A) bao g m các k t c c không có tính ch t A ế ế ố ặ ế ố ố ậ . Bi n con súc s c 6 m t, bi n c đ i l p v i bi n c ra m t ch n là bi n c ra m t l ặ ố ố ậ c đ i l p cho bi n c ra m t >=2 là bi n c ra m t 1.
7
ả ế ụ ồ
ồ ấ ườ ậ ệ ả ị ặ ệ ấ ả ng cho phép chúng ta ặ ặ ặ ặ ặ đ nh vi c xu t hi n k t c c ra m t 1, ra m t 2, ra m t 3, ra m t 4, ra m t 5, ra m t ế ụ ồ ế ụ ả ọ
ấ ổ ể ị
P E (
) (cid:0)
m N
ạ ừ ẫ ế ụ ử ẫ ể ả ế ụ ế ố ấ ả ậ ợ ọ ệ 1.2 K t c c đ ng kh năng ắ Khi chúng ta gieo con xúc x c đ ng nh t, c m nh n thông th ấ ế ụ gi ư 6 có xác xu t nh nhau. Khi đó ta g i các k t c c này là k t c c đ ng kh năng. 1.4 Ð nh nghĩa xác su t c đi n ế ấ N u phép th ng u nhiên có th x y ra theo N k t c c lo i tr l n nhau và có xác su t ố ế ố ư nh nhau và g i m là s các k t c c thu n l i cho bi n c E, xác su t x y ra bi n c E, ẽ ằ ượ c kí hi u là P(E), s b ng m chia cho N đ
ố ố ế ụ
ặ ặ ầ ắ ế ụ ặ ớ ặ ể ả ế ụ (2) ể ượ ọ c g i là s các k t c c có th và m s các k t c c thu n l ế ặ ế ữ ồ ậ ợ i. ặ ế ụ ấ ả ử ẵ ắ ế ặ ố ượ ạ c l i) và đ ng xác su t. Gi ố ế ể ả ồ ố ế ế ặ ặ ế ụ ế ố ấ ả ặ ẵ
ệ ệ ổ ậ ủ ệ ệ ợ ẫ ậ ườ ữ ủ ệ ữ ố ổ
ướ ể ệ ạ ớ c tiên chúng ta l p m t b ng chéo đ phân lo i các b nh nhân theo gi ề ừ i tính và ả ừ ề đ bài vào b ng này ạ ố ở i (các các ô còn l ủ ả ườ
N còn đ ặ ụ Thí d : N u chúng ta tung con xúc x c (xí ng u) có 6 m t: m t 1, m t 2, m t 3, m t 4, ạ ừ ẫ m t 5, m t 6 thì có th x y ra v i 6 k t c c khác nhau. Nh ng k t c c này lo i tr l n s ta quan nhau (n u ra m t 1 thì không ra m t 2 và ng tâm đ n bi n c con xúc x c ra m t ch n. Bi n c này có th x y ra theo 3 cách, nói khác đi bi n c này bao g m 3 k t c c. Khi đó xác su t x y ra bi n c ra m t ch n là 3/6=0.5 ố ụ Thí d : Khoa ph i và khoa Th n c a b nh vi n Ch R y có 50 b nh nhân trong s này ữ có 35 b nh nhân n . Có 12 b nh nhân c a khoa Th n trong đó có là 8 ng i là n . Có ủ ệ ổ ữ ở ệ bao nhiêu b nh nhân n khoa ph i? Có bao nhiêu trong s nh ng b nh nhân c a 2 ằ ở ữ khoa Ph i. khoa này là n hay n m ộ ả ậ Tr ị ậ ổ ề theo khoa đi u tr (Ph i hay Th n) và đi n các thông tin đã cho t ủ ả ố ậ (các s in đ m c a b ng). T các thông tin này chúng ta tính các s ố s in th ng) c a b ng chéo Bảng 1. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện Chợ rẫy
ổ ố T ng s Khoa Ph iổ Khoa Th nậ
Nam 11 4 15
Nữ 27 8 35
ổ ố T ng s 38 12 50
ố ệ ữ ủ ữ ổ ế ượ ố ệ c s b nh n c a khoa ph i là 27 và s b nh nhân n i.
ấ
ổ ằ ở ụ ử ụ ọ ấ ộ
ườ ằ ở i n m khoa Ph i P(Khoa Ph i): ộ ế ừ ả T b ng chéo chúng ta bi t đ ổ ườ hay n m khoa ph i là 46 ng ố ệ ủ ả Thí d : S d ng s li u c a b ng trên hãy tính các xác su t: i b t kì tính xác su t ng 1. Ch n m t ng ố ố ế ườ ấ ộ ể i cho 38;
ổ ậ ợ N: S k t cu c có th là 50; m: s các k t cu c thu n l P (Khoa Ph i) =
ộ ọ ấ ườ i đó là nam P(Nam)
2. Ch n m t ng ố ế ổ ườ ấ i b t kì tính xác su t ng ố ộ ể ế ộ ậ ợ i cho 15;
N: S k t cu c có th là 50; m: s các k t cu c thu n l P (Nam) = ệ ố ề
ệ ọ ị ệ ả ờ ứ ở ộ ơ ượ ườ ườ ơ Khái ni m v nguy c và s chênh (odds) ộ ễ ọ M t khái ni m quan tr ng trong d ch t ệ ắ m c b nh trong kho ng th i gian nghiên c u l ơ h c là nguy c . Nguy c đ m t nhóm ng ỉ ị c đ nh nghĩa là t ầ i lúc đ u i ng
8
ư ậ ấ ủ ườ ị ắ ờ ệ ị ệ ả ộ ị ắ ệ ấ ễ ố .
ể ượ c xem là xác su t c a m t ng ầ ề i sao xác su t và th ng kê có m t vai trò then ch t trong các nghiên c u d ch t ữ ấ ặ ộ ố ố ẽ ấ ộ ứ ị ề ặ ạ ụ ề ấ ầ ử ụ ể ế ộ ư xác su t theo m t bi u th c tuy n tính c n s d ng các phép bi n đ i đ m ổ ế ế ả ề
ộ ế ố ế ố ố ằ ệ c kí hi u là Odds(A) b ng xác su t c a bi n c A chia ủ ấ ủ ế ố ệ không b b nh. Nh v y còn có th đ i b m c b nh ứ ớ trong kho ng th i gian nghiên c u v i đi u ki n lúc đ u không b m c b nh. Đó là lí do ộ ạ t ọ ậ ợ Nh ng chúng ta s th y xác su t là m t hàm s có đ c tính thu n l i v m t toán h c, ị thí d nh nguyên lí c ng tính. Tuy nhiên xác su t có mi n xác đ nh là đo n [0;1] nên ấ ổ ể ở ứ ể đ mô t ị ộ r ng mi n xác đ nh. M t trong các phép bi n đ i đó là s chênh (odds) ấ ủ ượ ộ ố S chênh c a m t bi n c A đ cho xác su t c a bi n c không A.
Odds(A)= =
ị ủ ố ượ ủ ạ ớ ố ị ế ố ở ộ ọ ộ ặ ố ế ố ị
ề ề c m r ng so v i mi n xác đ nh c a xác Mi n xác đ nh c a s chênh là đo n [0;∞) đ ủ ấ su t. S chênh cũng có m t đ c tính khác quan tr ng là s chênh c a bi n c không A ả ủ ố ằ b ng ngh ch đ o c a s chênh bi n c A. Odds(Ac) = = 1: = 1:Odds
ố ặ ọ ủ ố ệ ặ ộ ể ử ụ ộ ộ ố
ụ ử ượ ặ ấ ồ ấ ấ ề ượ c m t s p, P(s p) = = 0,5. S chênh đ ế ụ ấ ố ặ ấ ự ấ ấ ộ ằ ệ ượ ử ặ M c dù lí do chính đ s d ng s chênh là đ c tính toán h c c a nó, s chênh cũng là m t khái ni m quen thu c trong cu c s ng hàng ngày. ả ồ Thí d : Khi ta gieo đ ng ti n chúng ta chúng ta có 2 k t c c s p và ng a đ ng kh ặ ấ c m t s p, năng. Khi đó xác su t đ Odds(s p) = = . Th c ra trong dân gian cách nói xác su t ra m t s p là 0,5 không quen thu c b ng cách nói là vi c đ c m t ng a là 1 ăn 1 thua (hay 5 năm 5 thua).
» ế ấ ấ ố ỉ ừ 1 nên s chênh và xác su t là x p x . T ấ ượ ứ ể ế Khi bi n c A hi m (P(A)<0,1) thì 1P(A) ố s chênh chúng ta cũng có th tính đ ố c xác su t theo công th c sau:
P(A) =
ị ấ ủ
ở ầ ấ ề ệ ủ ượ ỉ ụ ẫ ề ử ứ ữ ể ế ệ ứ ụ ệ ể ệ ằ ử ng ng u nhiên mà còn đ ể ể ậ ướ ắ ư ệ ậ ạ ượ ề ể ể ổ ơ i đ ư ở ả ử ượ ự ệ ệ ữ ề ử ụ đ ế
ớ ộ ố ọ ệ ệ ử ủ ườ ề ắ ắ ế ể ế ậ ệ ư ả ử ụ ng này đ ấ ủ ậ ộ ườ ủ ườ ủ ộ ổ ị ữ ườ ng v c hay sau th nghi m chúng ta đ u ph i s d ng m t s đo l ấ ượ ố c g i là xác su t ch ệ ề ch xác su t c a m nh đ là m t con s ữ i. Tuy v y nh ng ng ộ ố ở ủ ừ ủ ậ ằ ả ị ươ ủ ề ể ơ ở ủ ư ị ủ đ nh. Đ nh nghĩa ch quan là c s c a ph ệ ạ ọ 1.3 Ð nh nghĩa xác su t ch quan ầ ề ướ Khái ni m v xác su t ch quan l n đ u tiên đ ng b i Von Newman, c đ x ấ ệ Morgenstern, Ramsey và Savage. Theo khái ni m này, xác su t không ch áp d ng cho ệ ượ ử ụ ệ ượ ề c s d ng cho các m nh đ (proposition). Có các hi n t ề ằ ệ ậ ạ ượ c (thí d m nh đ nh ng m nh đ có th ki m ch ng b ng th nghi m l p l i đ ử ể ượ ẫ c ki m ch ng sau khi th nghi m ki m tra “chi c nh n vàng này là th t” có th đ ắ ề ệ ự ủ ệ ặ ử c th nghi m, tính chân th c c a m nh đ là không ch c vàng b ng l a). M c dù tr ề ệ ế ượ ệ ử ch n nh ng sau th nghi m chúng ta luôn luôn bi c m nh đ này là đúng hay sai. t đ ệ ử ằ ứ Tuy nhiên có nh ng m nh đ không th ki m ch ng b ng th nghi m l p l c (thí ẽ ư ệ ụ d nh m nh đ “s d ng vitamine A b sung s làm gi m nguy c ung th ” không ế ế ứ th ể ch ng minh c dù chúng ta có th c hi n đ n 10 th nghi m lâm sàng b i vì k t ả ố ệ ệ ử ả ủ qu c a 10 th nghi m này không cho k t qu gi ng h t nh nhau). V i nh ng m nh ề ề ề ướ đ này thì tr ủ ứ ộ m c đ không ch c ch n c a m nh đ và s đo l ố ỗ ủ quan. Khuy t đi m c a các ti p c n này ậ i ng h nó ch quan và thay đ i theo nh n đ nh c a t ng ng ọ ậ ấ ậ l p lu n r ng dù có ch p nh n tính ch quan hay không, trong cu c s ng và khoa h c ủ ủ ng pháp này là nó minh nhi u qu đ nh c a chúng ta là ch quan và u đi m c a ph ươ ả ị ủ ủ ạ b ch hoá tính ch quan c a các gi ng ố pháp Bayes (Bayes method) trong th ng kê h c hi n đ i.
9
ộ ậ ng xác đ nh và khác nhau. Nh ng đ i t ợ ượ ọ ố ượ ậ ợ ợ ệ ằ ị ườ ượ ố ượ ữ ng ữ c kí hi u b ng ch in và có ng đ ữ ề ầ ử ủ ậ c a t p h p. T p h p th ồ ả ể ể ị ằ 2. Nhắc lại về lí thuyết tập hợp ồ M t t p h p là g m nhi u nh ng đ i t này đ c g i là ph n t th bi u th b ng gi n đ Venn.
Hình 1. Giản đồ Venn (Venn diagrams)
ắ ế ụ ớ ộ ợ ự ộ ậ ộ ế ư ậ ể ả ầ ử ế ố ế k t cu c nh v y chúng ta có xây d ng các bi n
ướ ế ố ỉ c, các bi n c ch có ộ ầ ử ộ ế ụ ượ ọ là m t k t c c đ
ư ế ố ơ ấ c g i là bi n c s c p) ế ố ượ ọ ấ ả ể c g i là bi n c toàn th khi t ế ụ ề t c các k t c c đ u ầ ử ủ
ế ố ế ố c a bi n c này) ặ ẵ
ể ể c a ử ụ ộ ụ ụ ệ ợ ị , ta có th Thí d khi ta tung con xúc x c có th x y ra 6 k t cu c (1, 2, 3, 4, 5, 6). Do bi n c (event) là m t t p h p v i các ph n t ố c sau: E1={1}; E2={2}; E3={3}; E4={4}; E5={5}; E6={6} (nh đã quy m t ph n t S={1, 2, 3, 4, 5, 6} (bi n c này đ là các ph n t ế ố A= {2,4,6}: A là bi n c ra m t ch n. ầ ử ủ X và kí hi u xệ Kí hi u ệ x X đ ch đ nh x là m t ph n t ỉ ằ ị ỉ X đ ch r ng x không ể ầ ử ỉ thu c t p h p X. Áp d ng thí d trên và s d ng kí hi u ch đ nh ph n t vi ộ ậ tế
1 E1; 1 S; 1 E2 ; 1 A
ộ ậ ủ ệ ằ ậ ợ ữ ồ ˙ B )g m nh ng ph n ầ ủ ậ ợ Ph n giao c a hai t p h p A và B là m t t p h p (kí hi u b ng A ử t ầ ợ chung c a hai t p h p.
ầ ợ ủ ậ ằ ợ ữ ồ ¨ B) g m nh ng ph n t ầ ử ậ ặ ợ
ợ ậ ẵ ủ ặ ụ ế ậ ợ ậ ắ ặ Ph n h p c a hai t p h p A và B là t p h p (kí hiêu b ng A ặ có m t trong t p h p A ho c có m t trong t p h p B. ợ ủ Thí d : N u A là t p h p c a các m t ch n c a con xúc x c.
A= {2,4,6}
ặ ằ ặ ớ ế ậ ợ ơ N u B là t p h p các m t l n h n ho c b ng 3
B = {3,4,5,6} A¨ B = {2,3,4,5,6} A˙ B = {4,6}
10
ư ể ể ề ặ ặ ộ
4. Nhắc lại về đại số mệnh đề ộ ệ M t m nh đ (proposition) là m t phát bi u ho c đúng ho c sai nh ng không th cùng đúng và cùng sai.
ề ể ể ệ ụ
ế
ự ố ụ ấ
ấ
ứ ề ể ầ i: Hai phát bi u đ u (a và b) là m nh đ và phát bi u th ba (c) không ệ ỉ ộ
Thí d : Trong 3 phát bi u sau, phát bi u nào là m nh đ a. 42 chia h t cho 7 ấ b. Trái đ t là hành tinh duy nh t trong vũ tr có s s ng ữ ậ c. Mua hai vé xem đá banh tr n đ u gi a Manchester United và Leed United ệ ể ả ờ Tr l ả ph i là m nh đ mà ch là m t m nh l nh. ừ ệ ề ệ ề ộ ằ và thì chúng ta có m t m nh đ thì ệ ệ ế ợ ỉ
ề ệ ệ ụ ệ ề ệ ề Khi chúng ta k t h p hai m nh đ con b ng t ề ế m nh đ này ch đúng n u hai m nh đ con đ u đúng: ề ệ
ế
ố
ả ờ ệ ệ ệ ề ộ ỉ ề i: M nh đ (a) là đúng còn m nh đ (b) sai vì ch có m t m nh đ con ố ề ố i (91 là s nguyên t ) sai.
ạ ằ ừ ề ệ ệ ề ộ hay thì chúng ta có m t m nh đ thì ế ợ ỉ ề ề ệ ệ ề
ụ ệ ề ề ệ
ế
ố
ệ ề ệ ệ ề ề ả ề i: M nh đ (a) là đúng vì c hai m nh đ con đ u đúng. M nh đ (b) đúng vì có ệ ủ ề ề ề Thí d : Trong hai m nh đ sau, m nh đ nào là m nh đ đúng. ế 42 chia h t cho 7 và 100 chia h t cho 10 ố 2 + 2 = 4 và 91 là s nguyên t ề Tr l ệ ủ c a nó là đúng. M nh đ con còn l Khi chúng ta k t h p hai m nh đ con b ng t ế m nh đ này ch sai n u hai m nh đ con đ u sai: ề ệ Thí d : Trong hai m nh đ sau, m nh đ nào là m nh đ đúng. ế 42 chia h t cho 7 và 100 chia h t cho 10 ố 2 + 2 = 4 và 91 là s nguyên t ả ờ Tr l ộ m t m nh đ con c a nó là đúng (2+2 = 4).
ấ ầ ự ế ỉ nh ng t ề ả c xây d ng n n t ng tiên đ t ờ ế ủ ế ọ ự ể ủ ộ ẽ ề ề ươ ấ ự ằ ọ ủ ự ụ ả ế ớ i th c hay không. Nhà toán h c Nga ấ ự ấ ế ự ườ ề ể ư
ệ ử ế ợ ố ọ ế ể ế ụ ủ ả ế ấ
ộ ớ ế ấ ỗ ộ ố ố c g i là xác su t gán cho m i bi n c A thu c l p M m t con s không ọ ấ
ế ố ơ
ể ằ ấ ả i t c ạ ừ ươ ấ ủ ự ế ố 1, A2,… là lo i tr t ổ
j, thì P(A1 A2 …) = P(A1) + P(A2) + ấ ỗ ẫ ng h l n nhau thì xác su t c a s xu t ấ ơ ẻ 1 hay A2 hay .. b ng t ng c a các xác su t đ n l ). ố ề ứ ằ ơ ả ượ ứ ọ c g i là nguyên lí 5. Nến tảng tiên đề của lí thuyết xác suất ư ượ Vào đ u th k 20, lí thuy t xác su t đã đ ự các ngành khác c a toán h c. Nh đó s phát tri n c a lí thuy t xác su t d a trên các ữ ặ ỉ tiên đ này ch ph thu c vào tính ch t ch logic (logic correctness) dù r ng nh ng ị Kolmogorov là đ nh lí c a nó có ph n ánh th gi ủ ệ ườ i đã có công xây d ng trình bày các bài toán xác su t theo các khái ni m c a lí ng ượ ế thuy t đo l c trình ng và các tiên đ đ xây d ng lí thuy t xác su t do ông đ a ra đ bày sau đây: ậ N u chúng ta kí hi u S là t p h p các k t c c c a phép th (còn g i là bi n c toàn ố ộ ớ th ), M là m t l p các bi n c và M tho 3 tính ch t sau: (i) S M; (ii) n u ế A M, thì Ac M; (iii) n u ế A1, A2, . . . M, thì A1 A2 M. ượ ố Hàm s P đ âm và có 2 tính ch t sau: ị ấ ủ 1. P(S) = 1 (Xác su t c a bi n c toàn th b ng đ n v ) 2. N u ế A1, A2, . . . M và Ai Aj = Ø cho t ế … (N u các bi n c A hi n Aệ ủ Tiên đ th hai là c b n cho các ch ng minh trong th ng kê và đ ộ c ng tính (principle of additivity)
11
ả ổ ợ ứ ự i tích t ị ề ủ ử ệ ạ ạ ệ ố ề ệ ợ ị ỉ ọ ự h p (Combinatorics) là lãnh v c toán nghiên c u v các bài toán ch n l a, trong h th ng h u h n. Trong ph m vi c a tài li u này chúng ta ổ ợ ỉ h p 6. Giải tích tổ hợp Gi ữ hoán v và các toán t ch trình bày các khái ni m v hoán v (arrangment), ch nh h p (permutation) và t (combination).
ắ ạ ề
ố ượ ọ ừ ượ ừ 6.1 Nh c l i v giai th a (factorial) ớ Giai th a c a n (v i n là s nguyên) đ c đ c là n giai th a và đ ệ c kí hi u là n!
ườ ể ế ộ ộ t m t cách v n t t tích m t chu i các ch s ữ ố i ta có th vi ứ ệ ằ ỗ ắ ắ 2 3 4 5 6 7 b ng kí hi u 7!
ế ụ ằ ừ ủ n!=n.(n1).(n2)...1 ướ c, 0! =1. Theo quy ừ ệ ờ Nh kí hi u giai th a ng ể ể ệ ụ liên ti p. Thí d : Th hi n bi u th c 1 ứ ể ể ệ Thí d : Th hi n bi u th c 3 4 5 6 7 b ng
ứ ế ị ạ ể ứ ắ ố có 3 v trí đ treo 3 b c tranh A, B, C. S cách s p x p 3 b c tranh vào 3 v ị ậ c tính theo cách l p lu n sau:
ể ấ ả
ể ọ ể ọ ậ ứ ứ
ạ i, v y ậ ở ị ị ị ị ể ộ ỉ ỉ 6.2 Hoán v ị ế Tr m y t ể ượ trí có th đ ố V trí s 1 có th ch n 1 trong 3 b c tranh đ treo, nh v y có t ố V trí s 2 có th ch n 1 trong 2 b c tranh còn l ấ ố V trí s 3 ch còn duy nh t m t tranh đ treo, v y ư ậ ọ t c 3 cách ch n ọ ậ ở ị v trí này có 2 cách ch n ọ v trí này ch có 1 cách ch n
· ắ ế ị 3 = 3!
ế ắ ổ ị ượ ọ c g i là ủ ị ố ứ S cách s p x p 3 b c tranh vào 3 v trí = 1 ố ộ M t cách t ng quát s cách s p x p n đ i t ố ượ ố s cách hoán v (arrangments) c a n đ i t 2 · ố ượ ng vào n v trí khác nhau còn đ ằ ng b ng n!.
ỉ ợ ổ ợ
ỉ ừ ố ượ ố ượ ng cho tr ể ọ ợ n đ i t ế ế ướ ế ế ng đ ượ ọ h p ề ọ ệ c. Vi c ch n ng t ứ ự ự ọ l a c g i là ch nh h p (Permutation) n u chúng ta đ ý đ n th t ứ ự ự ổ ợ l a h p (Combination) n u chúng ta không quan tâm đ n th t
ạ ụ ả ử ổ ợ ẽ ượ h p s đ c minh ho trong thí d sau. Gi ố ạ ệ ệ ố ượ
ị ị ả ế ệ ầ ố ả ướ ọ ộ ạ ố ồ ể ọ
AB DA BD DC
ộ ợ ố ợ ỉ ỉ ạ AC EA BE EC t kê 6.3. Ch nh h p và t ợ ổ ợ h p đ u là cách ch n k đ i t Ch nh h p và t ượ ỉ ố ượ các đ i t ọ c g i là t ch n và đ ch n. ọ ề ỉ ợ Khái ni m v ch nh h p và t s chúng ta có 5 đ i t ng phân bi t (distinguishable objects) là các lo i thu c A (antibiotic), B ả ử ể ề s đ đi u (beta agonist), C (corticosteroid), D (bronchoDilator) và E (expectorant). Gi ạ ố tr cho b nh nhân b hen ph qu n chúng ta c n ph i ch n 2 lo i thu c và hai lo i ố ờ thu c này không dùng đ ng th i (m t thu c dùng tr c, m t thu c dùng sau). Khi đó ở ư ố ượ nh sau: t kê các cách đ ch n 2 lo i thu c đ CA BA BC AE EB DB DE CE ọ ự ệ trên đ ỉ ộ ệ c li AD CB CD ED ượ ọ c g i là m t ch nh h p. S các ch nh h p này đ ượ ọ ượ c c kí ố ượ ư ợ ng ch n 2 nh sau:
ng ch n 2 (permuations of 5 objects taken 2) và đ ố ỉ ứ ấ ứ ợ ậ ể ố ượ ố ượ ố ượ ầ ọ ở ỗ M i cách ch n l a li ố ượ ọ ố g i là s ch nh h p 5 đ i t ậ ệ 5P2. L p lu n đ tính s ch nh h p 5 đ i t hi u là ể ọ Đ ch n đ i t ọ ể Đ ch n đ i t ọ ọ ng đ u tiên chúng ta có 4 cách ng th nh t chúng ta có 5 cách ch n ng th hai sau khi ch n đ i t
ch nọ Do đó 5P2 = 5 · 4 = =
12
nPr (s ch nh h p n đ i t ng có phân bi
n
ộ ứ ố ố ỉ ọ ợ ệ ọ ọ ố ượ ứ ự ượ đ t th t ng ch n r) là s cách ể c ch n (đ giao các ng ch n ra r đ i t ậ ệ ị ổ M t cách t ng quát, công th c tính ố ượ ố ượ trong n đ i t ụ nhi m v hay nh n lãnh các v trí khác nhau) là: (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Pr (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) n ! rn )1 rn rn ( )! nn ( () ( 1 )1 1 (3)
ị ộ ệ ụ ả ử ể ề ế ờ ầ ồ ả ấ ổ ợ ả s đ đi u tr cho b nh nhân b hen ph qu n ổ ố ổ ằ ố ỉ ấ ượ ị ủ ợ ị ồ ườ ợ ng h p này t ư ổ ợ ồ h p AC cũng đ ng nh t nh t h p CA và s t ọ ố ượ c ch n. ng đ
n
ọ ậ ọ ố ổ ợ ứ nCr (s t ố ượ ng có không phân bi ố ố ượ ng ch n r) là s cách trong n ẽ ứ ự ượ c ch n (và s nh n lãnh đ h p n đ i t ệ t th t ộ ị ọ ệ ụ Chúng ta hãy xét m t thí d khác. Gi ố ọ ạ chúng ta c n ph i ch n 2 lo i thu c và cho dùng đ ng th i. Trong tr ư ổ ợ ợ h p BA, t h p AB đ ng nh t nh t ố ố ợ h p b ng s ch nh h p chia s s hoán v c a 2 đ i t Do đó 5C2 = 5C2 /2! = = ổ ộ M t cách t ng quát, công th c tính ố ượ ng ch n ra r đ i t đ i t ộ cùng m t nhi m v hay cùng m t v trí ) là: (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Cr (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) rn rn r 1 r n ! rrn ! )! ( ( () ( )1 1 nn ( )1 )1 1
n
r hay ệ kí hi u là C ọ ừ ấ ch p hay cho t c g i là t ạ ề ầ ớ Tuy nhiên ph n l n tài li u hi n đ i đ u quy ể đ tránh r m rà.
ổ ợ ể ượ ư ợ ụ ổ ợ ệ L u ý: T h p và ch nh h p có th đ c kí hi u khác. Thí d t (4) ấ h p n l y r còn đ ượ c (cid:0) (cid:0) ỉ n (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) r ệ ổ ợ . M t s tài li u nêu rõ t h p là t ậ ượ ổ ợ ậ ộ ố l y do đó nCr đ ệ ệ h p không l p ch p r c a n đ i t ướ ổ ợ c t ừ ặ ổ ợ h p không l p và dùng t ủ ố ươ ặ ng. ặ ổ ợ h p không l p h p có nghĩa là t ườ
ấ ộ ả ế công c ng có n=23 gi ng viên và nhân viên, hãy tính xác su t P trong b ộ ộ ườ
ộ ề i trùng ngày sinh. ả ị ườ ể ơ ấ ộ ỗ ộ ỉ ư ẫ i ng u nhiên là nh nhau. Khi đó m t nhóm n ng ọ ủ ỉ ấ ộ ườ ườ 6.4 Bài toán ngày sinh nh tậ B môn Y t ấ môn ít nh t có 2 ng ả Đ đ n gi n, chúng ta hãy gi ủ su t là ngày sinh c a m t ng có 365n cách x y ra ngày sinh c a n ng ườ ả ợ cho n ng ấ ấ nh t 2 ng đ nh là m t năm ch có 365 ngày và m i ngày đ u có xác ườ ẽ i s ể i đó. Cách ch n trong 365 ngày sinh đ gán ọ i khác nhau chính là ch nh h p 365 ch n n. do đó Xác su t trong b môn ít ườ i có ngày sinh hoàn toàn khác nhau. i trùng ngày sinh = 1 – xác su t n ng
ấ ộ ế ấ ộ ườ công c ng có ít nh t 2 ng i trùng
ấ ườ ậ ng ng i gia tăng thì xác su t có ít nh t 2 ng ườ ố ụ ể ườ i cùng ngày sinh nh t cũng ư Thay n=23, chúng ta có xác su t trong b môn Y t ngày sinh là 0,5 ố ượ Khi s l gia tăng. Đáp s c th cho các tr ấ ợ ượ ng h p đ c trình bày nh sau:
S ng ố ườ i 9 23 42 50
ấ ườ XS có ít nh t có 2 ng i trùng ngày sinh 0,0946 0,5073 0,9140 0,9704
ố S chênh 0,1045 1,0296 10,6320 32,7537
ỉ ệ T l cá 1:10 1:1 10:1 33:1
13
Bài tập
ị ậ
ổ ệ ượ ọ ơ ấ ộ ộ ệ ả ử ế ệ ệ ả c trình bày trong b ng ấ s n u ta ch n m t nhân viên trong b nh vi n., tính xác su t:
ơ
ng ề ưỡ ổ ừ ế 26 đ n 35 ng tu i t
P E (
) (cid:0)
m N
ấ Bài t p đ nh nghĩa xác su t 1. M t b nh vi n có c c u nhân viên theo tu i và công tác đ 1. Gi a nhân viên đó là bác sĩ ớ ổ b nhân viên đó là bác sĩ l n h n 35 tu i ề ưỡ c nhân viên đó là đi u d ộ d nhân viên đó là m t đi u d Theo công th cứ 1a.
ố ố ớ ậ ợ ế ố i.
ọ ẫ ệ ế ố ộ ể ậ ợ ộ ư ậ ố ế ố ậ ợ ế ố i m = 105.
ộ
ấ ự ượ ươ ộ ổ ọ ớ ơ c m t bác sĩ l n h n 35 tu i là 75/1766 = 0,042 = ta có xác su t ch n đ
ề ưỡ ưỡ ề ọ ượ ượ ổ ừ ng là 1220 /1766 = 0,691 = 69,1% ế ng tu i t c m t nhân viên đi u d c m t nhân viên đi u d 26 đ n 35 = (375+442)/1766 ể V i N là s các bi n c có th và m s các bi n c thu n l ố ế ể ế ọ ự Khi ch n ng u nhiên vi c ch n l c có th k t cu c theo 1766 cách khác nhau (S bi n ố ấ ệ c có th N=1766). Trong vi c tính xác su t nhân viên đó là bác sĩ, bi n c thu n l i là ế ố ọ ượ c m t trong 105 bác sĩ. Nh v y s bi n c thu n l bi n c ch n đ ọ ượ c m t bác sĩ là 105/1766=0,059 = 5,9% Ta có xác su t ch n đ ấ 1b. T ng t 4,2% ộ ấ 1c. Xác su t ch n đ ộ ấ 1d. Xác su t chon đ = 817/1766 = 0,463 = 46,3%
ậ ề ậ ợ ệ ề Bài t p v t p h p và m nh đ
ủ ệ
ổ
ệ
ả
B ng 1. Nhân viên c a b nh vi n phân theo tu i và công tác
ổ ố Công tác A1 T ng s £ A4 >35 25 A2 26 30 A3 31 35
B1. Bác sĩ 0 5 25 75 105
ụ ụ ệ B2. Ph c v phòng thí nghi m 20 30 35 35 120
ưỡ ụ ụ B3. Ph c v dinh d ng 3 6 6 10 25
ụ ụ ồ ơ ệ B4. Ph c v h s b nh án 7 15 8 12 42
ụ ụ ề ưỡ B5. Ph c v đi u d ng 200 375 442 203 1220
ượ B6. D c sĩ 1 12 8 3 24
B7. Quang tuy nế 4 10 19 12 45
ụ ụ ề ị B8. Ph c v đi u tr 5 25 15 10 55
ữ 35 50 25 130 B9. Nh ng ngành khác 20
ổ ố T ng s 260 513 608 385 1766
ự ả ằ ờ ữ ữ ậ ợ i thích b ng l ậ i nh ng t p h p sau đây. Nh ng t p ố ệ ủ ả 1. D a vào s li u c a b ng 1. Gi ợ h p đó có bao nhiêu ph n t ầ ử :
14
ề ề
ộ ạ ể ệ ệ ỗ Aedes
Bài gi
ả ậ ợ i thích các t p h p
ấ ưỡ ữ ậ ổ ng >35 tu i. n(A4
ề ưỡ ổ ừ ữ ế ậ 26 đ n 30. n(B5 ng tu i t
ườ ưỡ ữ ấ ợ ˙ B3) = 10 ˙ A2) = 375 ổ ng hay trên 35 tu i. i nhân viên c p d
ổ ừ ưỡ ữ ấ ở ợ ng tu i t 31 tr lên.
ề ệ ề ề ệ ệ ệ ộ
ủ ề ề ệ ệ ỗ ệ ệ ể A4˙ B3 ; B5˙ A2 ; B3¨ A4 ; (A4¨ A3)˙ B3 ệ ệ 2. Trong các m nh đ sau, m nh đ nào là đúng 2+2 là 4 hay Darwin là con khỉ B nh AIDS do m t lo i virus gây ra và b nh AIDS có th lây lan qua mu i aegypti iả 1. Gi A4˙ B3 là t p h p nh ng nhân viên c p d ợ B5˙ A2 là t p h p nh ng đi u d ợ B3¨ A4 là t p h p nh ng ng ậ n(B3¨ A4)=385 +25 10 = 400 (A4¨ A3)˙ B3 là t p h p nh ng nhân viên c p d ậ N{(A4¨ A3)˙ B3}=16 ủ ề 2. M nh đ (a) là m nh đ hay. M nh đ này đúng do m t m nh đ con c a nó là đúng (2+2 =4), ộ ề ệ ề M nh đ (b) là m nh đ và. M nh đ này sai do m t m nh đ con c a nó (b nh AIDS có th lây lan qua mu i Aedes aegypti ) là sai.
ợ ậ ề ỉ ổ ợ
ệ ạ ậ ộ ế ằ t r ng có 7 ệ ả h p Bài t p v ch nh h p, t ế ị ệ ắ 1. M t nhân viên v t lí tr li u s p k ho ch làm vi c trong ngày. Anh ta bi công vi c ph i làm trong ngày đó.
ể ế ể ố ệ a. N u anh ta có th ti n hành công vi c theo ý mu n, thì anh ta có th có bao ế nhiêu cách s p x p?
ệ ổ ổ ỉ ỉ ế ắ ế ề b. N u anh ta quy t đ nh ngh bu i chi u và ch làm 3 công vi c vào bu i sáng ế ị ắ ế
ộ ư ủ ệ ẫ ỉ ố ẫ ẫ ỏ ọ ấ ể ể ẫ
ườ ệ s trong phòng thí nghi m có 3 công vi c khác nhau ph i làm và có 5 ng i làm ệ ỏ thì anh ta có bao nhiêu cách s p x p? 2. M t nhân viên mu n làm xét nghi m 4 m u máu nh ng bà ta ch có đ hóa ch t đ ệ xét nghi m cho 3 m u mà thôi. H i có bao nhiêu cách ch n 3 m u máu trong 4 m u đ làm xét nghi m?ệ ả ệ ả ử 3. Gi ườ ể ệ vi c đó. H i có bao nhiêu cách đ giao 3 công vi c này cho 5 ng i?
Bài gi
ậ ế ườ ắ ệ ể · 6 · 1= 5040 cách. ị ệ ế 3 ·
ỉ ế 5 · 4 · ủ ờ ế ệ ả ừ 7 công c s p x p khác nhau. ệ ọ ẽ ượ ắ c ch n s đ ọ ệ ư ậ ố ế
ể ắ 3 · 5 = 210 1 = 7 · 3 · 2 · 5 · 6 · 2 · 4 ·
ườ ẫ ấ ẫ ậ ố ọ
ể ệ ẫ ẫ 4 m u máu l y 3 m u, 3 m u máu này ọ c làm xét nghi m). V y s cách ch n 3 1 / (1 · 1) = ọ ừ i nhân viên này mu n ch n t ệ ề ượ t (đ u đ 4C3 = 4!/(43)!3! = 4 · ệ 2 · 3 · 3 · 2 · iả ố i nhân viên v t lí tr li u này mu n liên k t 7 công vi c khác nhau 1a. Do ng ế ạ ể ờ vào 7 th i đi m khác nhau trong k ho ch công tác, anh ta có th có s p x p 2 · ệ công vi c theo 7!=7 ể 1b. N u anh ta ch còn có đ th i gian đ làm 3 công vi c, anh ta ph i t ượ vi c ch n ra 3, 3 công vi c này sau khi đ ạ ế Nh v y, s k ho ch anh ta có th s p x p là: 7P3 = 7!/(73)! = 7 · 1 / 4 · 6 · cách. ố 2. Ng sau khi ch n là không phân bi m u máu đ xét nghi m là 4
15
ọ ườ ườ ệ ẽ i ch n ra 3, và 3 ng
5P3 = 5!/(53)! = 5 ·
i này s có nh ng công vi c khác nhau. S 3 · 1 / 3 · ữ 4 · ố 1 = 2 · 2 · ừ 3. T 5 ng ể ạ ế k ho ch có th phân công là: 60
16
XÁC SUẤT CÓ ĐIỀU KIỆN - ĐỊNH LUẬT NHÂN XÁC SUẤT
ủ ề ọ ứ ả
ề ị
ấ ấ Mục tiêu Sau khi nghiên c u ch đ , h c viên có kh năng: ệ ủ Trình bày đ nh nghĩa c a xác su t có đi u ki n ấ ứ ứ ộ Trình bày công th c c ng xác su t và công th c nhân xác su t
ể ồ ế ế ề
ể ể ượ ọ ệ ệ ề ặ ấ c kí hi u P(đ c tính quan tâm|Đi u ki n) 1. Xác suất có điều kiện ộ ố ế ụ ị ạ ế ụ ế ụ N u các k t c c có th không bao g m toàn th các k t c c (khi m t s k t c c b h n ấ ệ ấ ch ) thì xác su t có th đ c g i là xác su t có đi u ki n. ệ ượ ề Xác su t có đi u ki n đ Bảng 2. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện X
ổ ố T ng s Khoa Ph iổ Khoa Th nậ
Nam 11 4 15
Nữ 27 8 35
ổ ố T ng s 38 12 50
ổ ậ ệ ệ ệ ệ ủ ủ ượ ộ ằ ở ọ ổ i là nam và n m ổ ấ ấ
ằ ở ấ ổ ộ i là nam và n m ở ườ ề ọ ổ ế ạ ấ
ụ Ở khoa Ph i và khoa Th n c a b nh vi n X có 50 b nh nhân và phân Thí d : ườ ể ả ố ủ ặ c trình bày trong b ng. Ch n m t ng b c a các đ c đi m c a b nh nhân này đ i ả ườ ấ ấ khoa Ph i P(Nam và Khoa Ph i) có ph i là b t kì, xác su t ng ề ệ xác su t có đi u ki n hay không? Hãy tính xác su t này. ườ ấ khoa Ph i P(Nam và Khoa Ch n m t ng ế ụ ệ Ph i) – không ph i là xác su t có đi u ki n b i vì các k t c c không có h n ch (ai cũng có th đ
i b t kì, Xác su t ng ả ọ c ch n). ộ ể ể ượ ố ế ậ ợ ố ộ ế i cho 11;
ườ ấ ộ ằ ở ả ổ i này n m khoa Ph i có ph i là
ấ ọ ụ ề ườ ộ ố ế ụ ị ạ ỉ ề ế ụ ổ ọ ượ ệ ấ khoa Ph i là xác su t có đi u ki n ỉ ư ậ c ch n và nh v y k t c c ch ệ ể N: S k t cu c có th là 50; m: s các k t cu c thu n l ổ P (Nam và Khoa Ph i) = ọ ườ i nam, xác su t ng Thí d : Ch n m t ng ấ ệ ấ xác su t có đi u ki n hay không? Hãy tính xác su t này. ằ ở ườ i này n m i nam, xác su t ng Ch n m t ng ệ ế ở b i vì s k t c c b h n ch (ch có b nh nhân nam đ ố có th là 1 trong s 15 b nh nhân nam)
ố
ổ ộ ề ộ ườ ố ế ấ ể ằ ở i cho 11; ườ ớ i này n m i này là nam gi i = P
)
(
(
)
ABP | )
(
m N
BAn An ( )
NBAn /) NAn /)
(
BAP ( AP ( )
c
ượ ề ệ ặ ư ệ ể ậ ợ ừ ề ế ụ i (m) và k t c c có th (N ớ ệ ế ụ ỏ ề ỏ ớ ề c kí hi u P(đ c tính quan tâm|Đi u ki n) và đi u c). Trong thí dụ ằ ở ặ i và đ c tính là n m khoa ằ ậ ể ệ i. Th hi n nh n xét b ng công ậ ợ ế Nc: S k t cu c có th là 15; m: s các k t cu c thu n l ệ ớ khoa Ph i v i đi u ki n ng Xác su t ng ổ (Khoa Ph i|Nam) = ệ ệ ấ L u ý: Xác su t có đi u ki n đ ậ ợ ả ế ụ ả ki n này ph i đúng cho c k t c c thu n l ề ế ụ i v a đòi h i đi u ki n là nam gi trên 11 k t c c thu n l ệ ể ổ ph i và 15 k t c c có th đòi h i đi u ki n là nam gi th c:ứ (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
(5)
ố ế ụ ố ế ụ ả ề ệ ặ
ộ ệ ấ ệ ậ ở ọ n(A˙ B ) là s k t c c tho đi u ki n A và đ c tính B và n(A) s k t c c tho đi u ả ề ki n Aệ ụ Thí d : Ch n m t b nh nhân ữ khoa Th n, tính xác su t b nh nhân này là n .
17
ấ ệ ề ữ
ậ ễ ả ứ ế Th ổ ệ
ữ ấ ế ừ ườ vong c a nh ng ng ầ vong. Xác su t t ấ ấ ợ ử ng h p t ả ề ắ ỹ ủ ế ộ ố http://www.who.int/csr/sars/country/2003_05_17/en/), S ca b nh SARS (H i ớ ngày 1/10/2002 đ n ngày 17/5/2003 là 7761 v i ắ ủ i m c SARS là xác su t có ệ vong và 7761 ca b nh đ u m c SARS).
Đây là xác su t có đi u ki n. P(n |khoa Th n) = = = = 0,75 ụ ố Thí d : Theo b n báo cáo “S ca nghi nhi m SARS tích lu ” c a T Ch c Y t i (ớ Gi ọ ứ ch ng Hô h p c p tính tr m tr ng) t ấ ử 623 tr ề đi u ki n: ( c 623 ca t ử ử vong|SARS)=
ề ộ ệ ườ ữ ở vong nh ng ng i m c m t b nh c ụ ể ế
ườ ệ P(t ệ Xác su t có đi u ki n này (Xác su t t ỉ ấ ố ỉ ệ ữ ấ ắ ấ ử ắ ủ ệ ượ ọ c g i là t su t ch t/m c c a b nh đó (casefatality rate). ườ ộ ấ nh ng ng ườ ị ố i ng u nhiên t ườ i ừ ệ ệ i b s t rét là 23%. M t ng ườ ả ữ ấ i có d u hi u lách to là 20%, nh ng ng ộ i này không có d u hi u lách to. Tính kh năng ng ữ ẫ ườ ị ố i này b s t rét?
th nào đó) đ ụ Thí d : Trong m t dân s , t l ừ ừ ố v a s t rét v a lách to là 18%, nh ng ng ườ ố dân s đó, ng i: ả Bài gi
ố ố
ố
P(s t rét|lách không to) = P(s t rét và lách không to) / P(lách không to) ố = [P(s t rét) P(s t rét và lách to)]/ P(lách không to) = (0.230.18)/0.8 = 0.05/0.8 =0.0625
ừ ươ ự ứ 2. Ðịnh luật nhân xác suất ể ng trình (5) ta có th xây d ng công th c: T ph
(6)
P(A|B)
ấ ị
ắ ủ ụ ế ấ ế ế ệ ấ ệ ế P(A˙ B) = P(A) · P(B|A) P(A˙ B) = P(B˙ A) =P(B) · ượ ọ ứ c g i là đ nh lí nhân xác su t. Công th c này đ ệ ắ ấ Thí d : N u xác su t m c b nh lao, P(Lao) = 0,001 và xác su t ch t/m c c a b nh Lao, P(ch t|Lao) = 0,1. Xác su t ch t vì b nh lao:
· · ế P(Ch t | Lao) = 0,001 0,1 = 0,0001
ế P(Lao và Ch t) = P(Lao) ộ ậ
Tính đ c l p ữ ộ ấ ộ ọ ượ ọ ệ ế ố ộ ậ ế ế ặ
ậ M t trong nh ng khái ni m quan tr ng trong lí thuy t xác su t là tính đ c l p (independence). Hai bi n c A và B đ c g i là đ c l p n u P(B|A) = P(B), ho c suy ra ừ t (6) n u
ế P(A˙ B) = P(A) · P(B) (7)
ổ ệ ủ ị
ớ ệ ế ộ ậ ề ấ ố ứ i). ượ ạ c l
ấ ươ ươ ấ ố ng giao thông trên dân s chung = P(ch n th ng giao thông)
ươ ườ ươ ấ ấ ở ố i hút thu c lá = P(ch n th ng giao thông | ng giao thông ng
ế ố ộ ậ ươ ố ng giao thông và hút thu c lá là hai bi n c đ c l p.
sả ử
ươ ươ ấ ấ ố ng giao thông trên dân s chung = P(ch n th ng giao thông) ấ ủ ấ ề Ý nghĩa c a đ nh nghĩa theo xác su t có đi u ki n là xác su t c a B không thay đ i dù ộ ậ ể ươ ừ ng trình (7) chúng ta có th suy ra là tính đ c l p có hay không có đi u ki n A. T ph ớ ộ ậ có tính ch t đ i x ng (n u A đ c l p v i B thì B đ c l p v i A và ng Thí d : ụ sả ử Gi ấ ị Xác su t b ch n th =0,01 ấ ị Xác su t b ch n th ố hút thu c lá) = 0,01 ấ Khi đó ch n th Gi ấ ị Xác su t b ch n th =0,01
18
ệ ượ ấ ươ ươ ấ ị ấ i nghi n r u = P(ch n th ng giao thông | ở ườ ng ng giao thông
ế ố ộ ậ ệ ượ u là hai bi n c không đ c l p ng giao thông và nghi n r
ế ố ộ ậ ớ
ế ố ượ ọ ộ ế ố ả ưở ế ả ng đ n c A và B (y u t này đ c g i là y u t ế ố nh h Xác su t b ch n th ệ ượ u) = 0,03 nghi n r ấ ươ Khi đó ch n th ế ố Khi bi n c A không đ c l p v i bi n c B thì: A => B ho cặ B => A ho cặ Có m t y u t gây nhi u).ễ
c) (A và B không đ c l p) ộ ậ
ế ạ ừ ượ
ề ậ ưở ế ố ể ứ Do đó n u chúng ta có th ch ng minh P(B) ≠ P(B|A) ≠ P(B|A ệ và chúng ta lo i tr đ c các m nh đ ệ ằ B => A (b ng cách bi n lu n v th i gian) Y u t ng đ n c A và B gây nhi u nh h
ề ề ờ ế ả ệ ủ ễ ả ớ
ượ ử ụ ứ ườ ứ ậ ị ng đ c s d ng trong nghiên c u xác đ nh nguyên nhân hay
Nghĩa là chúng ta có ch ng c (evidence) c a m nh đ A=>B. ậ Đây là cách l p lu n th ơ ế ố nguy c . y u t ạ ừ ủ ế ố
ế ờ ả ờ ườ ọ ồ x y ra đ ng th i ng ế ố i ta g i bi n c A
ờ ị ễ ả ả Tính lo i tr c a 2 bi n c ế ố N u hai bi n c A và B không bao gi ạ ừ ẫ và B lo i tr l n nhau. Thí d b nh nhân không bao gi ễ ả ệ ế ố ạ ừ ẫ ặ ụ ệ ả ế ố ẵ ặ b nhi m sán d i và sán d i heo cùng lúc nên ệ vi c nhi m sán d i bò và sán d i heo là 2 bi n c lo i tr l n nhau. Trong th u nghi m ế ố tung xúc x c, bi n c ra m t ch n và bi n c ra m t 3 là bi n c lo i tr l n nhau.
ố ạ ừ ẫ ắ ầ ư ế C n l u ý hai bi n c lo i tr ế ố ụ ấ ố ộ ậ ệ ế ố ụ ả ử ế ố ạ ừ ẫ ế ả ộ
l n nhau không ph i là 2 bi n c đ c l p mà ự th c ch t là 2 bi n c ph thu c l n nhau. Bi n c A x y ra ph thu c vào vi c không ế ố ả x y ra bi n c B và ng ộ ẫ i. ượ ạ c l
3. Công thức cộng xác suất tổng quát ậ ệ ệ ổ ươ ủ ủ ượ ườ ấ ụ Ở khoa Ph i và khoa Th n c a b nh vi n X có 50 b nh nhân và phân Thí d : ặ ả ở ầ ể đ u ch ng. ổ ằ ở ườ ấ khoa Ph i P(Nam ệ c trình bày trong b ng i là nam hay n m ố ủ ệ b c a các đ c đi m c a b nh nhân này đ ộ ọ Ch n m t ng i b t kì, hãy tính xác su t ng hay Khoa Ph i):ổ
P(Nam hay Khoa Ph i)=ổ
ổ ổ ổ P(Nam hay Khoa Ph i)= = P(Ph i)+P(Nam)P(Ph i và Nam)
ộ ổ M t cách t ng quát, n u A ¨ B ≠ Ø thì chúng ta có
ế P(A¨ B) = P(A) + P(B) – P(A˙ B) (8)
ế ạ ừ ẫ ể ượ ấ ả c xác su t x y ra ế ố ự
N u hai bi n c A và B lo i tr l n nhau thì chúng ta có th tính đ ộ A hay B d a trên nguyên lí c ng tính: P(A¨ B) = P(A) + P(B)
ứ ế ổ ứ ộ ố ấ ổ ệ ữ ế ố ấ ỳ ộ Đây là công th c c ng xác su t t ng quát. Sau đây là t ng k t công th c nhân và c ng xác su t tu theo m i quan h gi a 2 bi n s A và B
ữ ệ ậ ị ậ ộ ị ế Quan h gi a bi n ấ Đ nh lu t Nhân xác su t ấ Đ nh lu t C ng xác su t
19
ố c A và B P(A˙ B)
ặ =P(A)· P(B|A) P(A¨ B) = P(A) + P(B) – P(A˙ B)
ệ Không đ c bi t ậ ộ (không đ c l p và ạ ừ không lo i tr )
ộ ậ Đ c l p = P(A)· P(B) = P(A) + P(B) – P(A)· P(B)
Lo i trạ ừ = 0 = P(A) + P(B)
ấ ủ ụ ố ố ấ ả ế ụ
C
C
4. Công thức xác suất toàn phần và định lí Bayes ố ế ế ế N u bi n c B ph thu c vào bi n c A – P(B) ≠ P(B|A) – thì xác su t c a bi n c B c là bi n c đ i l p ế ố ố ậ ế ố ộ ph thu c vào xác su t c a bi n c A. Khi đó xác su t x y ra B (A ế ố ủ c a bi n c A và đ ộ ấ ủ ượ ọ c đ c là không A) C (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) BAP B BP ( ) ( ) AP ( ) ABPAP ( ) ) ( | ABPAP ) ( ( | ) (9)
ọ ượ ầ ộ ấ ư ườ ố · ụ ấ ư ấ ố · ấ ố ố ứ Công th c này đ ứ ụ d ng công th c này trong tr ấ Xác su t ung th = Xác su t hút thu c lá không hút thu c lá c g i là công th c xác su t toàn ph n (law of total probability). Áp ng h p ung th ph thu c vào hút thu c lá chúng ta có: ấ ư xác su t ung th khi hút thu c lá + Xác su t xác su t ung th khi không hút thu c lá.
)
|
BAP |
(
)
c
)
( ) ABPAP ) (
ABPAP ( ) c ABPAP | )
(
(
(
)
|
)
ố ớ ứ ề ẫ ứ ợ ố ư ệ Tính xác su t A trên đi u ki n B P(A|B) và thay m u s v i công th c xác ấ ầ su t toàn ph n ta đ (cid:0) (cid:0) (cid:0) (cid:0) ấ ượ c BAP ( BP ( (9)
ả ị ứ c g i là đ nh lí Bayes. Lí gi i công th c này trong tr ổ ườ ứ Công th c này đ ố ườ ượ ọ ơ ư ấ ộ ấ ừ ố ừ ư ớ ỉ ệ ớ i này b ung th ph i b ng v i t l ợ ườ ng h p ố i hút thu c lá khi ư v i xác su t v a hút thu c v a ung th ế t ng ổ ư hút thu c lá tăng nguy c ung th ph i nh sau. Xác su t m t ng ổ ằ ị bi ư ổ ấ ị ph i trong xác su t b ung th ph i.
ế ử ế ủ ng không quan tâm đ n chi ti ỉ ị ủ ế ị ắ ử ụ ườ ượ ng nào đó đ ể ỉ ặ ắ ủ ế ổ ố ể ấ ố ế ố ề ế ị ấ ố ề
ị ủ ở c xác đ nh b i k t c c c a phép th ng u nhiên đ ượ ế ố ử ệ ữ ế ụ ủ ng đ ượ ư ệ ế ố ượ ẫ c ượ ằ c kí hi u b ng ch in hoa ụ c kí hi u là X(e). Các thí d ề ế ố ẫ
ố ồ ữ ố ộ 5. Biến số ngẫu nhiên ế Khi chúng ta ti n hành phép th , chúng ta th t c a bi n ở ế ụ ủ ộ ạ ượ ố c xác đ nh b i k t c c c a c mà ch quan tâm giá tr c a m t đ i l ế phép th . Thí d , khi chúng ta gieo 3 con xúc x c, có th chúng ta không quan tâm đ n ắ con xúc x c nào ra m t m y mà ch quan tâm đ n t ng s đi m c a 3 con xúc x c. ỉ ượ Hay khi chúng ta mua vé s , chúng ta ch quan tâm đ n s ti n mà chúng ta trúng đ c ả ổ ố (hay s ti n b m t) sau khi đã có k t qu x s . ị ạ ượ ng mà giá tr c a nó đ Đ i l ẫ ẫ ế ố ườ ọ g i là bi n s ng u nhiên. Bi n s ng u nhiên th ố ủ ẫ ế (nh X, Y,..). Bi n s ng u nhiên X c a bi n c e đ ồ khác v bi n s ng u nhiên g m: ườ ặ ụ ộ Thí d : M t ng ả ế ố ể ườ ử ẽ ộ ố ư ậ ộ ế ồ ồ ộ ố ườ ặ ẽ ượ i đ t s đ ườ ặ ẽ ị ấ i đ t s b m t 1 đ ng. Nh v y có 99 k t c c t ế ụ ươ ứ ế ụ ươ ứ ị ủ ế ế ư ậ ị ố ề ượ ượ ể ớ ti n thu đ c”. Ta có th tính đ ế i ta ti n hành i đ t m t con s g m 2 ch s . Sau đó ng ế ữ ố quay s đ có k t qu là m t s 2 ch s . Nh v y phép th s có 100 k t ớ ế ặ ố ượ c đ t, cu c là con s 00,01,02,03,...,99. N u k t cu c trùng v i con s đ ố ượ ặ ớ ộ c đ t, ng c 70 đ ng. N u k t cu c không trùng v i con s đ ớ ị ng ng ng v i giá tr 1 ẫ ế ố ng ng v i giá tr 70. 1 và 70 là các giá tr c a bi n s ng u và 1 k t c c t nhiên X “s c P(X=1)=0,99 và P(X=70)=0,01
20
ườ ễ ố ị Theo dõi 100 ng ư i nghi n chích ma tuý ch a b nhi m HIV, s ng ườ ị i b ệ ế ố nhi m HIV sau 1 năm là bi n s ng u nhiên
ễ ề ử ệ ố ệ ố ẫ Đi u tr cho 15 ca b nh SARS, s ca t ế vong trong s 15 ca b nh này là bi n
ứ ế ố ố ẫ M t gia đình có 1 đ a con, s con trai trong gia đình này là bi n s ng u ị ố ẫ s ng u nhiên ộ nhiên.
ủ ề ộ ườ ề ườ ẫ Đo chi u cao c a m t ng i, chi u cao ng ế ố i này là bi n s ng u nhiên
ế ẽ ế ỗ ế ụ ộ
ụ ề ử ẫ i v i ví d v phép th quay s (g m 2 ch s ) đ ử ẫ ấ ơ ề ố ề i s ti n ng ượ c”. Gi i đó thu đ
70 · N
ế ố ầ 0,01 – 1 · ỗ ầ ườ ố ề 0,99 = N · ườ ư ậ ượ ơ 6. Vọng trị ị ế t, chúng ta s gán cho m i k t c c m t giá tr N u chúng ta không quan tâm đ n chi ti ẽ ử ộ ủ ọ ị ọ ế ố c a bi n s ng u nhiên và khi đó chúng ta s gán cho phép th m t giá tr g i là v ng ố ồ ầ ữ ố ượ ư ở ạ ớ ị c đ a ra trong ph n tr . Hãy tr l ẫ ế ụ ươ ớ ứ ế ụ ế ố ng ng v i 1 và bi n s ng u nhiên. Phép th này có nhi u k t c c và các k t c c t ả ử ộ ị ủ ơ ơ ườ s m t ng 70 là giá tr c a bi n s ng u nhiên “s ti n thu đ i ch i trò ch i ườ ầ ượ ề ầ c sau N l n ch i: này r t nhi u l n (N l n) thì ng (0,70 – 0,99) = 0,29 · N · N · ị c i đó b thu đ Nh v y trung bình m i l n ch i ng
ượ ọ ị ủ ộ ọ ơ ế ố ề ầ ọ N)/N=0,29 đ ngồ ị ủ c g i là v ng tr c a trò ch i. M t cách t ng quát v ng tr c a phép th i nhi u l n và v ng tr ổ ử ượ ậ ạ c l p l ử ị ẫ ượ ế ố ủ ẫ ệ (0,29 · ọ ố Con s này đ là trung bình c a bi n s ng u nhiên n u phép th đ ủ c a bi n s ng u nhiên X đ ế c kí hi u là E(X)
E(X)=X(e1)P(e1) + X(e2)P(e2) +...
Bài tập
ị ậ ộ
ố ớ ư ộ ồ i có phân ph i nhóm máu và gi i tính nh sau: ấ Ð nh lu t nhân và c ng xác su t ườ 1. Trong m t nhóm g m 502 ng
ớ Gi i tính
ổ ố Nhóm máu Nam T ng s Nữ
O 113 113 226
A 103 103 206
B 25 25 50
AB 10 10 20
ổ ố 251 T ng s 251 502
ộ ế ừ ườ ườ ấ ẫ ườ ượ c ch n ng u nhiên t i đ ấ i này. Tính xác su t ng ườ ấ nhóm ng i này có nhóm máu A? Xác su t ng i này i này có nhóm máu ấ ườ
ứ
ộ ậ ượ ạ ượ ườ ệ ộ ấ ọ ừ ộ ệ m t b nh vi n là nam là 0,6. Xác su t m t ừ ệ ọ ộ ệ b nh ở ấ ệ khoa ọ 1a. N u m t ng ườ có nhóm máu O? xác su t ng i này có nhóm máu AB? B? Xác su t ng ớ ớ 1b. Gi i tính và nhóm máu có đ c l p v i nhau không? Ch ng minh. ộ ệ ấ ệ 2. Xác su t m t b nh nhân đ c ch n t ệ ẫ ở khoa ngo i là 0,2. M t b nh nhân đ b nh nhân nam và c ch n ng u nhiên t ế ằ ệ t r ng đó là b nh nhân nam. Tính xác su t b nh nhân đó i ta bi vi n và ng ngo i.ạ
21
ọ ệ ượ ố ủ ộ ệ ộ ệ
ọ ượ
ệ ộ ệ ộ ố ủ ở ẻ ỉ c tính t l tr em d tiêm ch ng ươ ấ ệ ườ c ch n ng u nhiên là ng ứ ỉ ệ ấ ướ
ấ ệ ẫ ố ướ ẫ ấ ả ổ ng pháp l y m u PPS (probability proportionate to size) g m 2 b ỉ ồ ắ ệ ướ i 2 tu i trong t nh X ồ c. ọ t c các xã trong t nh r i ch n trong danh sách đó 30 xã.
ẻ ướ ượ ứ ỗ ọ ổ i 2 tu i trong m i xã đ ể ề c ch n đ đi u tra v ề ủ ứ ẻ
ẻ ướ ẻ ướ
i 2 tu i và xã B có 40 tr d ộ ứ ỉ ướ ẻ ướ ổ ấ ọ ổ i 2 tu i. ổ ủ i 2 tu i c a xã A đ c 1 đã ch n xã A, tính xác su t m t đ a tr d ượ c ứ
ả ử s trong t nh có xã A có 100 tr d ế ọ ư ế ứ ế ọ c ch n đ a vào nghiên c u hay không, tính xác ượ t xã A có đ ổ ủ ứ ấ ượ i 2 tu i c a xă A đ
ư ọ ư ứ ọ ư ộ ứ ấ c ch n đ a vào nghiên c u c ch n đ a vào nghiên c u là 0,1, tính xác su t m t đ a tr ẻ ẻ ướ ấ s xác su t xã B đ ượ ọ ư ổ ủ ứ ẫ c ch n ng u nhiên là 3. Trong dân s c a m t b nh vi n, xác su t m t b nh nhân đ xác su tấ ố có b nh tim là 0,35. Xác su t b nh nhân b nh tim là hút thu c lá là 0,86. Tính m t b nh nhân đ i hút thu c lá và m c b nh tim? 4. M t nhà nghiên c u mu n ằ b ng ph ướ B c 1: lên danh sách t ẫ ọ ướ B c 2: ch n ng u nhiên 7 đ a tr d ủ tình hình tiêm ch ng c a đ a tr đó. Gi a. N u trong b ch n đ a vào nghiên c u b. N u chúng ta không bi ộ ứ su t m t đ a tr d c. Gi ướ d ượ c ch n đ a vào nghiên c u ả ử i 2 tu i c a xã B đ
Bài gi
P E (
) (cid:0)
m N
iả 1a. Theo công th cứ
ố ớ ố ế ố ế ố i.
ọ ẫ ể ườ ấ ư ậ ườ c ng ố ế i ta có th có 502 k t cu c khác nhau (S bi n ế ố ế ố ế i có nhóm máu O, bi n c i có nhóm máu O. Nh v y có 226 bi n c ậ ợ ậ ợ
ậ ợ ể V i N là s các bi n c có th và m s các bi n c thu n l ườ ộ ộ Khi ch n ng u nhiên m t ng ệ ố c có th N=502). Trong vi c tính xác su t ng ượ thu n l ợ ng h p này. thu n l ườ ấ i này có nhóm máu O là = 226/502=0,45
ể ế ố ọ i là bi n c ch n đ ườ i trong tr Xác su t ng ự ươ ng t T
i này có nhóm máu A là = 206/502=0,41 i này có nhóm máu B là = 50/502=0,10 i này có nhóm máu O là = 20/502=0,04
ườ ườ ườ ộ ậ ứ ố ế ớ Xác su t ng Xác su t ng Xác su t ng Bi n c A đ c l p v i bi n c B khi (A|B)=P(A) hay ch ng minh P(B| ấ ấ ấ ố ư ậ ớ ớ ở ế 1b. A)=P(B). Nh v y Nhóm máu và gi i tính là đ c l p v i nhau b i vì:
ố ệ ụ ở ộ ậ P(máu O | Nam)=113/251= 0,45 = P(máu O) P(máu A | Nam)=103/251= 0,41 = P(máu A) P(máu B | Nam)=25/251= 0,10 = P(máu B) P(máu AB | Nam)=10/251= 0,04 = P(máu AB) ớ Áp d ng công th c P(A|B)=P(A(B)/P(B); v i A là bi n c b nh nhân ệ ứ ế ố ệ ạ ế 2. khoa Ngo i và B là bi n c b nh nhân là b nh nhân nam ta có:
ạ
ạ ụ ứ 3.
ố ệ ệ ệ ố
ệ ứ ẻ P(ngo i|nam)=P(ngo i(nam)/P(nam)= 0,2/0,6 = 0,33 Áp d ng công th c P(A(B) = P(A).P(B|A) = P(B).P(B|A) ta có P(hút thu c(b nh tim)=P(b nh tim) x P(hút thu c|b nh tim) = 0,35 x 0,86 = 0,301 4. Ta kí hi u đ a tr quan tâm là m
22
ọ ấ ẻ ướ ướ ổ ủ i 2 tu i c a xã A
ộ ứ ọ ọ ấ ổ ủ ẻ ọ · · ọ ọ ứ ọ P(ch n A)
ế c ch n đ a vào nghiên c u = P(ch n m| ch n A) = 7/100 = 0,07 ư ứ ế c ch n đ a vào nghiên c u hay không, ư ượ c ch n đ a vào nghiên c u = ọ P (ch n m| ch n A) = 0,07 ượ ổ ủ i 2 tu i c a xã A đ ọ ướ ư ẻ ấ ọ · · i 2 tu i c a xã B đ ọ ọ ọ ọ ứ c ch n đ a vào nghiên c u 7 / 40 = P (ch n m| ch n B) = 0,1 a. N u trong b c 1 đã ch n xã A, xác su t m t đ a tr m d ọ ư ượ ọ ứ đ ượ ế t xã A có đ b. N u chúng ta không bi ộ ứ ướ xác su t m t đ a tr m d ọ P(ch n m và ch n A) = P(ch n A) ộ ứ c. Xác su t m t đ a tr m d ọ = P(ch n m và ch n B) = P(ch n B) 0,0175
23
Ứ Ụ Ấ Ẩ Ề Ế Ị Ị NG D NG XÁC SU T TRONG RA QUY T Ð NH CH N ÐOÁN VÀ ÐI U TR
ủ ề ọ
ườ ủ ộ ậ ủ ị ng ph n ánh tính đúng c a m t th thu t ch n đoán đ nh tính: tính ạ ả ệ ị ẩ ậ ng, giá tr tiên đoán âm.
ỉ ệ ệ ị ậ ượ ườ ẩ ắ hi n m c ả ứ ậ ủ ệ ượ t đ c tính đúng và tính tin c y c a th thu t ch n đoán. ủ ả ẩ ươ t, giá tr tiên đoán d ị ủ ể ệ ườ ượ ị
c các đo l ủ ạ i. ế ị ự ả ố ủ ng tính giá tr c a th thu t ch n đoán và t l ng th hi n tính giá tr còn l ộ ệ các tình hu ng c a m t b nh, xây d ng cây quy t đ nh c a b nh đó.
ủ ệ ở ấ ủ ơ ộ ế ị ọ ậ nhánh t n, ọ ự ượ ị ố ư Mục tiêu Sau khi nghiên c u ch đ h c viên có kh năng: 1. Phân bi 2. Trình bày 4 đo l nh y c m, tính chuyên bi ấ 3. Khi đ c cung c p 2 đo l ị ố trong dân s , xác đ nh đ ự 4. D a trên mô t ự 5. D a trên cây quy t đ nh có xác su t c a các nhánh c h i và kì v ng ch n l a đ ề c đi u tr t i u.
ộ ứ ủ ủ ư ề ủ ả ả ươ ộ ệ i k t qu âm tính hay d ủ ế ộ ệ ợ ọ ự ế ằ ủ t, mô hình hoá tình hu ng c a m t b nh nhân hay ch n l a ph ấ ử ụ c phân tích b ng cách s d ng lí thuy t xác su t.
ệ ứ ượ ử ụ ề ộ ề ạ ớ ử ụ ườ ề ng pháp này và ng ệ ả ậ ẩ ẩ ớ ươ ậ ọ ự ệ ẹ ữ ệ ả ầ ả ể ượ ể ượ ứ ủ ứ ệ ạ 1. Mở đầu ẩ ậ ộ ố ấ M t s v n đ c a y khoa, nh đánh giá m c đ chính xác c a m t th thu t ch n ả ế ộ ệ ng tính c a k t qu xét nghi m trên m t b nh đoán, lí gi ươ ố ệ nhân chuyên bi ng ị ể ượ ề pháp đi u tr thích h p, có th đ ế ị ụ ọ ấ ế Vi c ng d ng lí thuy t xác su t trong phân tích y khoa (còn g i là ra quy t đ nh trong ộ ổ ể ướ ệ ng phát tri n. M t t ng y khoa) hi n nay đang đ c s d ng r ng rãi và có chi u h ữ ử ụ ấ quan cho th y có t i 7% bài báo v ngo i khoa hay y khoa gia đình s d ng nh ng i ta càng ngày càng s d ng nhi u trong vi c đánh giá các kĩ ph ọ ự thu t ch n đoán m i, ch n l a kĩ thu t ch n đoán có tính hi u qu trên chi phí hay ề ả ị ch n l a các gi i pháp đi u tr có hi u qu trên chi phí cho b nh nhân. Nh ng bác sĩ ơ ả ủ ộ ữ ể lâm sàng cũng c n ph i hi u nh ng nguyên lí c b n c a n i dung này đ có th chăm ế ữ ụ ố ơ t h n hay ng d ng nh ng ki n th c thu l m đ sóc cho b nh nhân c a mình t c trên ự các t p chí chuyên ngành vào th c hành y khoa.
ị ố ọ ậ ả ế ườ ượ ng đ c g i là đúng n u nó ph n ánh chân th t giá tr nó mu n đo
ự ự ng. ụ ậ ặ ề ề ố ượ ố ượ ng có cân n ng th c s là 60 kg. Ði u tra viên A cân đ i t ế ệ ề
ị ự ụ ệ ế ộ ng không b nhi m HIV. N u m t xét nghi m HIV trên đ i t ố ượ ng
ượ ạ ủ ở ộ ủ c đánh giá tính đúng qua hai khía c nh: Tính đúng c a nó trên các c g i là đ nh y c m) và tính đúng c a nó
ườ ệ ấ i b nh (hay còn là xác su t ng tính trên nh ng ng
ươ ệ ườ ệ i không b nh (hay còn là xác
ệ
ươ ng
ệ ệ ế ế ả ả 2. Ðo lường tính đúng (accuracy) của một thủ thuật chẩn đoán ộ M t phép đo l ườ l ộ ố ượ ng đó Thí d : M t đ i t ả ả ế ậ và ghi nh n k t qu là 60 kg. Ði u tra viên B cân đ i t ng đó và ghi nh n k t qu là ự ề 50 kg. Ta nói phép cân do đi u tra viên A th c hi n là đúng và phép cân do đi u tra viên ệ B th c hi n là không đúng. ộ ố ượ ễ Thí d : M t đ i t ả ươ ệ ế ng tính thì xét nghi m đó là không đúng. đó ra k t qu d ậ ẩ ộ ủ M t th thu t ch n đoán đ ạ ả ượ ọ ị ệ ố ượ ở ng b b nh (đ trên các đ i t ượ ọ ệ ộ ị ệ ố ượ c g i là đ chuyên bi t). ng không b b nh (đ đ i t ỉ ệ ươ ữ ạ ư ậ ả ộ d Nh v y đ nh y c m là t l ở ườ ị ệ ệ ả ế i b b nh) ng ng tính k t qu xét nghi m d ữ ỉ ệ ộ ư ậ âm tính trên nh ng ng Nh v y đ chuyên bi t là t l ấ ế ệ ở ườ ệ ả su t k t qu xét nghi m âm tính i không b nh) ng ế N u chúng ta kí hi u T+ : k t qu xét nghi m d T : k t qu xét nghi m âm
24
ị ệ
ộ ườ ị ệ i b b nh D+: ng ườ i không b b nh D : ng ạ ả ộ Thì đ nh y c m = P(T+ | D+) ệ và đ chuyên bi t = P(T|D)
ọ ớ ấ ệ ư ử ụ ị ộ ả ạ ủ ướ ả ả ố ộ ấ ệ ữ ế
ấ ế ệ ộ t ế ề ộ ệ ấ ượ ệ ệ ng tính thì xác su t ng ượ ọ ườ i c g i là ươ c kí hi u là P(D+|T+) và còn đ ươ
ộ ệ ườ ế ệ ả ấ ượ ệ ệ ấ i này c kí hi u là P(D|T) và còn
ả ị ị i bác sĩ lâm sàng ph i xác đ nh giá tr tiên đoán ạ ng có th đ
ố ể ượ ể ượ ế ẩ t có đ nh y c m: P(T+| D+) = 99% và đ ườ ụ c bi ạ ả ử ụ ể ọ ề ả ộ ệ ụ ữ ự ự ị ớ ễ ả ử ộ ộ t: P(T| D) = 90%. M t phòng khám thai s d ng test này đ sàng l c cho c xét nghi m v i test Elisa này và có s chúng ụ ữ ượ i ph n th c s b nhi m HIV (gi ườ ở ụ ữ
ệ ụ ữ ế ả ươ t r ng t l ượ ỉ ệ ươ ươ ph n mang thai là là 1%). ả ử ụ ng và giá tr tiên đoán âm, chúng ta c n ph i s d ng ự ng pháp d a ị ự ng pháp d a theo t l ầ và ph 3. Ra quyết định y khoa ộ c khi m t xét nghi m đ a vào s d ng, nhà s n xu t cùng v i các khoa h c gia Tr ệ t ph i xác đ nh tính đúng c a xét nghi m đó và công b đ nh y c m và đ chuyên bi ự ố ớ ủ c a xét nghi m. Tuy nhiên đ i v i m t bác sĩ lâm sàng, nh ng xác su t này không th c ọ ố ự s có nhi u ý nghĩa mà h mu n bi ả ủ ọ ế a. N u m t b nh nhân c a h n u k t qu xét nghi m là d ắ ệ này m c b nh là bao nhiêu. Xác su t này đ ị giá tr tiên đoán d ng ế ủ ọ ế b. N u m t b nh nhân c a h n u k t qu xét nghi m là âm tính thì xác su t ng ự ự ắ th c s không m c b nh là bao nhiêu. Xác su t này đ ị ượ ọ đ c g i là giá tr tiên đoán âm. ụ ể ộ M t tình hu ng c th mà trong đó ng ươ c minh ho trong thí d sau: d ộ M t test elisa đ ch n đoán HIV đ ộ chuyên bi các ph n đ n khám ti n s n. M t ph n đ ấ ế ng tính. Tính xác su t ng k t qu d ỉ ệ ệ ễ ế ằ hi n nhi m HIV ta bi ể ươ ị Ð tính đ c giá tr tiên đoán d ộ m t vài thao tác tính toán. Có hai cách: ph theo xác su t.ấ
ươ ỉ ệ ự ng pháp d a theo t l
ụ i thí d trên và gi ả ử s có t ỉ ệ ệ ấ ả ễ ệ ẽ ụ ữ ế t c 10.000 ph n đ n khám thai và đ hi n nhi m HIV là 1% chúng ta s có 100 ph n ự ự ị ễ ế ậ ả ệ ễ ệ ạ Ph ượ ở ạ c Chúng ta tr l ụ ữ ớ xét nghi m v i test Elisa này. Do t l ả ụ ữ th c s b nhi m HIV trong 10.000 ph n này. L p b ng 2 x 2 theo k t qu xét nghi m và tình tr ng nhi m b nh nh sau:
ụ ữ
ế
ễ
ạ
ả
ư ệ
ả ớ ỉ ệ ệ
ả ề ả
B ng 2. B ng 2 x 2 theo k t qu xét nghi m và tình tr ng nhi m HIV trên 10.000 ph n khám ti n s n (v i t l
ễ hi n nhi m là 1%).
ễ ổ ố Nhi m HIV Không nhi mễ T ng s
Test +
Test
ổ ố T ng s 100 9.900 10.000
ộ ở ạ ả ễ i b nhi m s có 100 x 99% = 99 ng ế ả ươ ườ ộ ở ườ ẽ ễ ả ườ i ị i không b ả i có k t qu âm tính. Thay các k t qu trên vào ườ ị ẽ B i vì đ nh y c m là 99% nên trong 100 ng ệ t là 90% nên trong 9.900 ng ng tính. B i vì đ chuyên bi có k t qu d ế ế nhi m s có 9.900 x 90% = 8.910 ng B ng 2 ta đ ượ c
ụ ữ
ế
ệ
ễ
ả
ạ
ả ớ ỉ ệ ệ
B ng 3. B ng 2 x 2 theo k t qu xét nghi m và tình tr ng nhi m HIV trên 10.000 ph n khám ti n s n (v i t l
ả ả ề ả
ễ hi n nhi m là 1%).
ễ ổ ố Nhi m HIV Không nhi mễ T ng s
25
Test + 99
Test 8.910
ổ ố T ng s 100 9.900 10.000
ượ ề c: ố ọ ế
ụ ữ
ố ạ
ệ
ả ớ ỉ ệ ệ
ử ụ ả ề ả S d ng phép toán s h c, đi n vào các ô còn tr ng ta đ ễ ả B ng 4. B ng 2 x 2 theo k t qu xét nghi m và tình tr ng nhi m HIV trên 10.000 ph n khám ti n s n (v i t l
ễ hi n nhi m là 1%).
ễ ổ ố Nhi m HIV Không nhi mễ T ng s
Test + 99 990 1.089
Test 1 8.910 8.911
ổ ố T ng s 100 9.900 10.000
ị ươ
ộ ườ ụ ữ ư ậ ư ậ ng = P (D+|T+) = 99/1089 = 0,09 = 9% ế ệ ụ ấ ế ự ự ỉ ấ ng tính thì xác su t ng
ụ ả ườ i này b nhi m HIV th c s ch th p có 9%. ậ ể
ặ ệ ả ộ ể ự ễ ấ ố ị t là hi n nhi m th p thì giá tr tiên đoán ư ủ
ệ ế ng c a test cũng th p. ố ễ ệ ư ủ ở ộ ấ ố ả ấ ạ ị ả hi n nhi m th p, m t k t qu xét nghi m là ch a đ b i vì nó ệ ầ i m t xét nghi m ộ ế ẩ ng th p. Mu n ch n đoán c n ph i làm l ơ ế ộ Nh v y giá tr tiên đoán d i ph n mang thai n u k t qu xét nghi m là Nh v y, trong thí d trên, m t ng ễ ươ ị d ộ ố ế ừ T thí d này chúng ta có th rút ra m t s k t lu n: ạ ộ a. M c dù test có th có tính đúng khá cao (đ nh y c m là 99% và đ chuyên bi ỉ ệ ệ 90%) nh ng n u th c hi n trên dân s có t l ấ ươ d ỉ ệ ệ b. Trong dân s có t l ươ có giá tr tiên đoán d thu c nhóm c ch khác.
ứ ầ ấ ự ươ ng pháp d a theo công th c xác su t toàn ph n
ượ ở ứ ể ầ ấ c trình bày công th c (19) có th trình bày theo Ph ứ Công th c xác su t toàn ph n đ ứ công th c sau:
ủ ụ ẩ P(A)=P(A và B) + P(A và không B) ậ Áp d ng vào các th thu t ch n đoán ta có:
ớ ứ ầ ả ườ ể ể ườ ệ ệ P(T+)=P(T+ và D+) + P(T+ và D) ể ễ ế i có k t qu xét nghi m d ng có th ng i đó có xét nghi m d ộ ướ ạ i d ng sau: m t ệ ươ ng và có b nh ươ ệ ệ
ượ ầ ấ c
ụ ị ng = P(D+|T+) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ể Hay đ d nh , chúng ta có th phát bi u công th c toàn ph n d ươ ng hay có xét nghi m d ng mà không b nh . ứ Áp d ng công th c xác su t toàn ph n ta đ ươ Giá tr tiên đoán d DP ( ) (cid:0) (cid:0) (cid:0) (cid:0) TDP ( | ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) DP ( T ) T ) DP ( T ) (cid:0) (cid:0) (cid:0) (cid:0) DP ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ) | DP ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Pr (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) DTP ev sens spec TP ( DP ) ( DTP | ) ( DP ( DTP ) T ) DTP ( | DP ( ) ( DTP ( | DP ( )] ) 1[ ( | DTP ) 1[ DP ( ) ( | )] Pr 1( ) ev 1( sens ev ) Pr
V i ớ
và ỉ ệ ắ ệ Prev: t l m c b nh ộ ạ ả Sens: đ nh y c m ệ ộ Spec: đ chuyên bi t.
26
ứ ụ ươ ị
c giá tr tiên đoán d ằ ng là 9%. ề ệ ệ ố ố ừ ộ ạ ả ệ ượ Áp d ng công th c trên chúng ta cũng tính đ ậ ể Ngoài ra chúng ta có th xác tính s chênh h u nghi m b ng s chênh ti n nghi m nhân ớ ộ v i đ nh y c m và chia cho 1 tr đ chuyên bi t.
(cid:0) (cid:0) (cid:0) DP ( ) (cid:0) (cid:0) (cid:0) TDP ( | ) (cid:0) T ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) TDP TDP T D DTP DTP ( ( | | ) ) TP ( T ) TDP ( | ) DP ( TP ( ) ) ( ( | | ) ) DP ( DP ( ) )
TP ( DP ( ) sens (cid:0) (cid:0) (cid:0) (cid:0) Odds Odds D ( TD | ) ( ) (cid:0) spec 1
ằ ệ ố ớ ộ ề ộ ệ ầ ị ệ ườ ượ ượ ỏ ẫ ề
ả ế ị ọ ậ ư ế ố ầ c quy t đ nh đúng đ n, chúng ta c n ph i mô hình hoá các tình hu ng ệ c g i là cây quy t đ nh (decision tree). Vi c ướ ự ế ị ằ c sau:
4. Mô hình cây quyết định ắ ế ị Vi c ra quy t đ nh y khoa nh m giúp đánh giá m t cá nhân có m c m t b nh nào đó ả ư ủ ư ộ hay không. Nh ng đ i v i m t bác sĩ lâm sàng, đi u này là ch a đ , mà c n ph i ra xác ộ ệ ụ ươ ố ư ị ề i u cho b nh nhân này. Thí d , m t b nh c ph đ nh đ ng pháp đi u tr nào là t ẽ ử ế ị ả ậ ẩ i bác sĩ có ph i quy t đ nh s x trí c ch n đoán là có s i túi m t và ng nhân đ ệ ị ả ồ ậ ắ ỏ b nh nhân này nh th nào: ph u thu t c t b túi m t hay đi u tr b o t n. ắ ể ọ ự ượ Ð ch n l a đ ệ ậ ượ ị ủ ề đi u tr c a b nh nhân b ng kĩ thu t đ ồ xây d ng bao g m 5 b ẽ ướ
ể ả ề c 1: V các nhánh ồ ố ế ị ỗ ố ố ạ ể ễ ụ ệ ị ỏ ệ ậ ằ ậ ệ ề ậ ề ố ứ ế ị ị ị ả ồ ổ ậ ệ ể ư ố ị B ể ệ ở ệ b nh Cây quy t đ nh bao g m có nhi u nhánh th hi n các tình hu ng có th x y ra ượ ữ ế i có th di n ti n theo các tình hu ng khác nhau n a (đ nhân, và m i tình hu ng l c ể ố kí hi u b ng các nhánh con). Thí d b nh nhân b s i túi m t có th có hai tình hu ng: ể ị ả ồ ạ ph u thu t túi m t hay đi u tr b o t n (2 nhánh chính), vi c đi u tr b o t n l i có th ứ ế ậ ặ di n ti n theo các tình hu ng: n đ nh không tri u ch ng, b đau qu n m t, bi n ch ng nhi m trùng, b ung th túi m t. Chúng ta có th mô hình hoá các tình hu ng theo cây nh sau (Hình 1).
ẫ ễ ễ ư ướ ẽ c 2: V các nút
ả ố ể ố ở ụ ẫ ố ộ ố ể ở ờ ợ ờ ễ ế ị ệ ố ổ ị ể ự ủ ọ ụ ế ể ế ị ượ ượ ố ở ọ c g i là nút quy t đ nh và đ ể ọ ự ượ ọ ế ị ể ố ệ ằ ấ ế ơ ộ ượ ơ ộ ử ừ B ộ ố Tuy nhiên cách x y ra các tình hu ng (các nhánh) không hoàn toàn gi ng nhau: có m t ư ế ị ố ậ s tình hu ng có th quy t đ nh b i bác sĩ (thí d nh nên ph u thu t hay ch đ i) và ả ư ế ườ có m t s tình hu ng không th quy t đ nh b i con ng i (thí d nh n u ch thì x y ậ ứ ặ ứ ra các tình hu ng, n đ nh không tri u ch ng, đau qu n m t, bi n ch ng nhi m trùng ấ ượ ố ư c). Ði m xu t phát c a các hay ung th , và các tình hu ng này không th l a ch n đ ệ ượ c kí hi u c quy t đ nh b i bác sĩ đ tình hu ng đ ấ ằ b ng hình vuông và đi m xu t phát các tình hu ng không th ch n l a đ c g i là nút ơ ộ c kí hi u b ng hình tròn. Trong lí thuy t xác su t mà chúng ta đã nghiên c h i và đ ứ c u, nút c h i chính là phép th và các nhánh t ế ố nút c h i chính là các bi n c .
27
Phẫu thuật ngay
1.000
0.004
Không triệu chứng
0.815
0.000
Sỏi mật Không triẹu chứng
0.150
Ðau quặn mật 0.004
Chôø
0.030
Biến chứng nhiễm trùng 0.130
Ung thư
0.005
1.000
ế ị
ị ỏ
ố
ệ
ệ
ậ
Hình 1. Cây quy t đ nh mô hình hoá các tình hu ng cho b nh nhân b s i túi m t không tri u ch ngứ
ậ ướ ơ ộ ấ ả c 3: Ghi nh n xác su t x y ra các nhánh c h i
ừ ơ ộ ậ ố nút c h i, chúng ta ghi nh n xác su t x y ra tình hu ng đó. Thí d ị ả ồ ấ ả ệ ứ ấ ờ ợ ậ ư ễ
B ụ ỗ Trên m i nhánh t ệ ề ế n u đi u tr b o t n và ch đ i thì xác su t không có tri u ch ng = P(không tri u ứ ch ng) = 0,815, P (đau qu n m t) = 0,150, P (nhi m trùng) = 0,030, P(ung th ) = 0,005. ướ ặ ế ố ẫ ậ c 4: Gán bi n s ng u nhiên cho các nhánh t n
ậ ế ố ị ủ ế các nhánh t n (nhánh không chia ra nhánh nào khác) chúng ta gán cho các nhánh này vong ụ ấ ử ủ ố B Ở ế ử ẫ các giá tr c a bi n s ng u nhiên. Trong thí d trên n u chúng ta quan tâm đ n t vong c a các tình hu ng này. thì chúng ta gán bi n s ng u nhiên X là xác su t t
ị ướ ế ị ế ố ọ ẫ ị ủ
c 5: Xác đ nh v ng tr c a các nhánh quy t đ nh ọ ấ ọ ị ị ừ ế ị nút quy t đ nh theo B Sau đó chúng ta hãy xác đ nh v ng tr cho các nút ch n xu t phát t ứ công th c sau:
E(X)=X(e1)P(e1) + X(e2)P(e2) +...
ủ ệ ế ố ợ ị ệ ề ự ươ 5. Chọn lựa điều trị thích hợp ố ể ọ ự Sau khi chúng ta đã mô hình hóa các tình hu ng c a b nh nhân, chúng ta có th ch n l a ể ấ ả ằ đi u tr thích h p b ng cách so sánh xác su t x y ra bi n c quan tâm. Chúng ta có th th c hi n theo hai ph ng pháp:
ọ ứ ử ụ
ử ị ả ồ ề ề ị ị ủ ẫ vong) khi đi u tr b o t n và khi đi u tr ph u
ị ử ậ ọ ằ vong b ng 0,0040
ị ẫ ị ả ồ ị ử ọ ị S d ng công th c tính v ng tr ế ố ọ Chúng ta tính v ng tr c a bi n s X (t thu t:ậ ề Đi u tr ph u thu t, v ng tr t ề Đi u tr b o t n, v ng tr t vong =
· ử ệ ứ P(t vong | không tri u ch ng) ệ P(không tri u ch ng) +
ử ặ ậ P (t ứ ậ · vong | đau qu n m t ) ặ P(đau qu n m t) +
· ử ễ X(t P(nhi m trùng) +
vong | P(ung th )ư
ễ vong | nhi m trùng) ung th ) ư · 0,815 + 0,004 · ử X (t = 0,000 · 0,150 + 0,130 · 0,030 + 1,000 · 0,005
28
ọ ế ử ề ọ ơ ị ả ồ ế ị ẽ ệ ậ ẫ ậ ậ
ấ ủ ờ ể ả ả i gi ệ ố ể ở ế i. Tuy nhiên khi cây quy t ậ thành thu t c h th ng hoá đ tr ở = 0,0000 + 0,0006 + 0,0039 + 0,0050 = 0,0095 ị ủ ị ủ Do v ng tr c a bi n X (t vong) khi đi u tr b o t n là 0,0095 cao h n v ng tr c a ẫ ế bi n X khi ph u thu t là 0,0040 nên chúng ta quy t đ nh s ph u thu t cho b nh nhân ị ỏ b s i túi m t. ư ậ ậ L p lu n nh trên giúp chúng ta hi u rõ b n ch t c a l ứ ạ ệ ị đ nh quá ph c t p thì vi c tính toán c n ph i đ ệ toán. Khi đó, vi c tính toán tr thành t ả ượ ầ ị ự ộ đ ng và ít b sai sót.
ậ ử ụ
ắ ể ụ ườ ế ị i ta áp d ng quy t c sau:
ỗ ẫ ị ủ ị ế ố
ậ ị ủ ọ ậ ấ ị ủ ọ nút đó. V ng tr c a nút c ọ ư ế ơ ộ ằ ượ ừ nhánh t n cùng lên trên, chúng ta ghi nh n v ng tr c a nút c h i b ng c t ấ ơ ị ủ ố ơ ộ
ế ế ụ ị ủ ậ
ọ ọ ể ừ ế ị nút ch n đ ra quy t đ nh.
ụ ụ
ậ Ở ọ ị ử ủ ử ứ ễ ọ ệ ị nhánh t n cùng ghi nh n các v ng tr : nhánh không tri u ch ng, v ng tr t vong là 0,004, nhánh nhi m trùng c a t vong vong ặ ư ế ị ấ ướ c: ọ ị ử vong là 1,000.
ị ủ ị ử ờ ọ
0,030 + 1,000 · 0,005
ế ị ị ủ ể ấ nút ch n đ ra quy t đ nh. Xu t phát t ấ ừ ậ ớ ọ ọ ị ử ẫ ồ ừ ờ ớ vong là 0,004 và nhánh ch v i ẫ ọ ế ị ị ử ế ị
ấ ử ẫ ợ ng h p trên, chúng ta dùng xác su t t ế ợ ạ ừ ế ự ng t ọ ẽ ế ợ ấ ợ S d ng thu t toán Đ phân tích cây quy t đ nh, ng ậ 1. Gán t n cùng m i nhánh giá tr c a nhánh đó (giá tr bi n s ng u nhiên mà chúng ta quan tâm) 2. Ði ng ừ ọ ổ t ng các tích s xác su t và v ng tr c a nhánh xu t phát t ộ h i cũng chính là v ng tr c a nhánh đ a đ n nút c h i đó. 3.Ti p t c cho đ n khi g p nút quy t đ nh ủ 4. So sánh kì v ng c a các nhánh xu t phát t Áp d ng vào thí d trên ta có các b ậ 1. ậ là 0,000, nhánh đau qu n m t, v ng tr t ị ử ọ là 0,130, nhánh ung th có v ng tr t ủ ờ ọ Ở vong c a nhánh = v ng tr c a nút ch nhánh ch , v ng tr t 2. = 0,000 · 0,150 + 0,130 · 0,815 + 0,004 · = 0,0000 + 0,0006 + 0,0039 + 0,0050 = 0,0095 4. So sánh v ng tr c a các nhánh xu t phát t nút quy t đ nh g m nhánh ph u thu t v i v ng tr t ọ v ng tr t Ở ườ tr ể ử ụ Chúng ta cũng có th s d ng ích l ướ ậ nhiên quan tâm. Khi đó các b i ích thì nhánh quy t đ nh đ ta quan tâm đ n l ậ vong là 0,0095. Do đó chúng ta quy t đ nh ph u thu t. ế ố vong làm bi n s ng u nhiên quan tâm. ẫ ậ i (utility) c a các nhánh t n cùng làm bi n ng u ngo i tr n u chúng ta chúng i cao nh t. ủ ậ ươ c l p lu n cũng t ượ ế ị c ch n s là nhánh có ích l
ạ ế ạ ồ ộ c đánh giá tình tr ng c ả ượ ậ ườ ng tuy n phó giáp tr ng và n ng đ ả ườ ượ i đ ế ng. K t qu đ Bài tập ươ 1. Tám m i ng ế ươ calci huy t t ộ ồ
ả
c ghi nh n trong b ng 2 x 2. ế
ườ
ạ
ế
ở
ố ượ
B ng 5. N ng đ Calcium trong huy t thanh và tình tr ng c
ng tuy n phó giáp
80 đ i t
ng
ườ ế Không c ế ng tuy n C ng tuy n phó giáp ườ phó giáp
Ca HT Cao 12 3
Ca HT bình th ngườ 8 57
ộ ệ ủ ị ị t , giá tr tiên đoán + và giá tr tiên đoán âm c a xét
ớ ệ ệ ố ữ ặ ỉ i nghi ng b b nh D v i P(D+) = 0,3 cho làm xét nghi m T. Xét nghi m T i (T+) ch có ờ ị ệ ng tính (T+) ho c âm tính (T). Trong s nh ng ng ố ữ ệ ườ ạ ả ộ Hãy tính đ nh y c m, đ chuyên bi ệ nghi m này. ườ ộ 2. M t ng ả ươ ẽ ả ề ế s tr v k t qu d ị ệ 80% là b b nh D; còn trong s nh ng ng ườ i T() có 90% không có b nh này.
29
ả ườ ả ề i này xét nghi m tr v là T+ là bao nhiêu?
U=60,2
Töû vong: 0,55
U=90,1
P(Vôõ phình)=0,29
Taøn taät: 0,15
U=100
Khoâng Phaãu thuaät
Thaønh coâng: 0,30
U=100
P(Khoâng vôõ)=0,71
U=0
P(Töû vong)=0,02
Ngöôøi phuï nöõ vôùi phình maïch tình cô
U=75
Phaãu thuaät
P(Taøn taät)=0,06
U=100
P(Thaønh coâng)=0,92
ộ ộ ữ ộ ệ ệ ệ ườ ạ ờ ộ ự ặ ậ ọ c phát hi n phình m ch m t cách tình c . Ng ậ ớ ử vong, tàn t ạ ả ẫ ế ị ặ ạ ệ ặ c trình bày trong hình sau (giá tr ghi ị ợ ủ ậ ố ệ a. Kh năng ng ạ ủ b. Tính đ nh y và đ chuyên c a xét nghi m T. ổ ượ i này 3. M t b nh nhân n 45 tu i đ ẫ t hay thành công có hai l a ch n: ho c là ph u thu t v i các kh năng là t ị ỡ ậ ớ ho c không ph u thu t v i các kh năng b v phình m ch ho c không b v phình ở ị m ch. Cây quy t đ nh cho b nh nhân này đ nhánh t n cùng là giá tr l ả ị ỡ ượ i ích c a tình hu ng.):
ự ọ ả ị ụ ợ ề ệ Hãy l a ch n gi i pháp đi u tr ph h p cho b nh nhân này.
Bài gi
ộ
ộ ạ ả ệ t = P(T|D) =
12/20 = 60% 57/60 = 95% 12/15 = 80% 57/65 = 88%
ệ ườ ả ề i này xét nghi m tr v là T+ là bao nhiêu?
ủ ệ ộ
ệ ộ
ệ ộ
ế ị ề ệ ợ ồ ị
ề ể ự ị ủ ợ
ấ ọ nhánh t n cùng v ng tr c a nhánh là l ậ ủ i ích c a nhánh ậ ị ủ ọ ậ ượ ừ c t ị ủ ủ ấ ọ ọ ố ấ ủ ị ủ ọ
iả 1. Ð nh y c m = P(T+|D+) = Ð chuyên bi ị Giá tr tiên đoán + = P(D+|T+) = ị Giá tr tiên đoán = P(D|T) = ả 2.a Kh năng ng P(T+ và D+) = P(T+) x P(D+|T+) = 0,8 x P(T+) P(T và D+) = P(T) x P(D+|T) = [1P(T+)] x [1P(D|T) ] = [1P(T+)] x 0,1 = 0,1 0,1 x P(T+) P(D+)= P(T+ và D+) + P(T và D+) = 0,8 x P(T+) + 0,1 0,1 x P(T+) = 0,7 x P(T+) + 0,1 = 0,3 P(T+)= 2/7 ạ ộ 2.b Tính đ nh y và đ chuyên c a xét nghi m T ạ ủ Tính đ nh y c a xét nghi m T P(T+|D+) = P(D và T+)/P(D) = 0,8 x P(T+)/P(D+) = 0,8 x (2/7) / (3/10) = 0,8 x 2 x 10 / (7 x 3) = 16/21 = 76,2% ủ Tính đ chuyên c a xét nghi m T P(T|D) = P(D và T)/P(D) = P(T) x P(D|T) /P(D) = (5/7) x 0,9 / (7/10) = 0,9 x 5 x 10 / (7 x 7) = 45/49 = 91,8% ọ 3. Vi c phân tích cây v n đ đ l a ch n quy t đ nh đi u tr thích h p bao g m: Ở 1. nhánh t n cùng lên trên, chúng ta ghi nh n v ng tr c a nhánh 2. Ði ng ị ổ ằ b ng t ng các tích s xác su t và v ng tr c a các nhánh con c a nó (v ng tr ủ c a nhánh = ( xác su t c a nhánh con x v ng tr c a nhánh con) Ta đ c:ượ
30
U=60,2
Töû vong: 0,55
76,6
U=90,1
P(Vôõ phình)=0,29
Taøn taät: 0,15
93,3
U=100
Thaønh coâng: 0,30
Khoâng Phaãu thuaät
U=100
P(Khoâng vôõ)=0,71
U=0
P(Töû vong)=0,02
Ngöôøi phuï nöõ vôùi phình maïch tình cô
96,5
U=75
Phaãu thuaät
P(Taøn taät)=0,06
U=100
P(Thaønh coâng)=0,92
ậ ế ế ụ ọ
ế ị ừ ể ọ ọ
nút ch n đ ra quy t đ nh. ậ ừ ớ ọ ẫ ị ợ i ích ố ơ ị ợ ủ ậ ẫ 3.Ti p t c cho đ n khi g p nút ch n. ị ủ ấ 4. So sánh v ng tr c a các nhánh xu t phát t ả ẽ ư ậ Nh v y chúng ta s quy t đ nh ph i ph u thu t phòng ng a v i v ng tr l là 96,5 t ế ị i ích c a không ph u thu t là 93,3 ọ t h n v ng tr l
31
Ố Ấ PHÂN PH I XÁC SU T
ủ ề ọ
ả ổ ế ị ứ ố ố ố ấ ứ c 3 phân ph i xác su t ph bi n: phân ph i nh th c, phân ph i Poisson ườ ệ ượ t đ ố ng.
ị ứ ượ ố ố ấ c cung c p các
ẩ ở ố ố ị ấ ộ m t giá tr b t kì, đ ượ c ấ ủ ượ c phân ph i xác su t c a phân ph i chu n ố ả ẩ
ề ộ ạ ượ ộ ặ ố ng có phân ph i bình ư c a dân s có m t đ c tr ng nh t đ nh v m t đ i l ố ố ố ủ ượ ườ ẩ ấ Mục tiêu Sau khi nghiên c u ch đ , h c viên có kh năng: Phân bi và phân ph i bình th ấ ủ Tính xác su t c a phân ph i nh th c và phân ph i poisson khi đ tham số ị Xác đ nh đ ử ụ ố ủ phép s d ng b ng s c a phân ph i chu n. ố ỉ ệ ủ Tính t l th ấ ị ả c cung c p các tham s và b ng s c a phân ph i chu n. ng khi đ
ế ượ ế ng đ ỉ ả ế ị ụ ế ế ố ố ị ạ ượ ẫ ặ ử ề ồ ỉ ố ồ ể ệ ế ố ồ ử ề ế ộ ề ố ồ ấ ồ ế ố ử ấ ế ố ấ c đ ấ ấ ủ ụ ụ ư 1. Phân phối xác suất ở ế ư c xác đ nh b i k t Nh đã trình bày,n u chúng ta ch quan tâm đ n giá tr đ i l ử ụ ủ bi n c là bi n s ng u nhiên. Thí d n u chúng ta c c c a phép th ,chúng ta mô t ế ạ tung 3 đ ng ti n mà ch quan tâm đ n s đ ng tiên ra m t ng a thì chúng ta t o ra bi n ể ỉ ế ẫ ố s ng u nhiên X là s đ ng ti n ng a. Khi đó chúng ta có th kí hi u (X=1) đ ch bi n ử ấ ử ấ ố ồ c g m các k t cu c có s đ ng ti n ng a là 1 (g m 3 bi n c S p S p Ng a; S p ố ượ ượ ọ ấ ủ ử c g i là phân ph i Ng a S p; Ng a S p S p). Xác su t c a bi n c này đ ấ ủ ố xác su t c a X. Áp d ng vào thí d trên chúng ta có phân ph i xác su t c a X nh sau:
xi f(xi)=P(X=xi) F(xi)=P(X £ x) ậ ố ế ố S bi n c thu n iợ l
0 1 1/8 1/8
1 3 3/8 4/8
2 3 3/8 7/8
3 1 1/8 1
ả ữ ố ế nh ng giá tr ị ớ ng ng c a nó.
ế ố ờ ạ ấ ủ ủ ố ờ ạ ấ ượ ọ ẫ ỹ ủ ượ ệ ế ọ c g i là hàm kh i (mass function) c a X kí ố c g i là hàm phân ph i ủ
ố ệ c kí hi u là F(x) ấ ủ ế ố ờ ạ ặ ấ ủ ị ộ ả Ð nh nghĩa: Phân ph i xác su t c a bi n s r i r c là m t b ng mô t ủ ấ ủ ỹ ươ ứ c a bi n s r i r c cùng v i xác su t và xác su t tích lu t ố ẫ ế ố Xác su t c a các bi n s ng u nhiên X đ ấ hi u là f(x). Xác su t tích lu c a bi n s ng u nhiên X đ ượ (distribution function) c a X và đ ố Hai đ c tính c b n c a phân ph i xác su t c a bi n s r i r c:
1
(1) 0 £ (2) S
ố ộ ố ấ ờ ạ ượ ử ụ ẽ ả ị ứ ố ấ ố ề ậ ố ườ ầ ơ ả ủ P(X=x) £ P(X=x) = 1 c s d ng r ng rãi nh t là phân ph i nh th c và Có hai phân ph i xác su t r i r c đ phân ph i Poision. Chúng ta s th o lu n v hai phân ph i này và phân ph i bình th ng trong các ph n sau.
ộ ậ ự ệ ấ ớ ử ả ử ế ấ ộ ử ầ
n k t c c. Trong đó s k t c c có x l n thành
nCr
ố ế ụ ế ụ ự ệ ẽ ầ ầ ầ 2. Phân phối nhị thức ử ồ ỗ s chúng ta th c hi n n phép th đ ng nh t và đ c l p v i nhau, m i Bài toán: Gi ỗ ầ ấ ạ ớ phép th có 2 k t cu c là thành công hay th t b i v i xác su t thành công trong m i l n ấ th là p. Hãy tính xác su t có x l n thành công. ử Khi th c hi n n l n th chúng ta s có 2 công là = px(1p)nx và s k t c c có x l n thành công là ố ế ụ
32
xn
)
x
p
XP (
)
1(
()
pC x
n
ậ ử ấ ầ ầ (cid:0) Vì v y, xác su t có x l n thành công sau n l n th là x (cid:0) (cid:0) (cid:0)
x
xn
)
x
p
xf )(
XP (
)
1(
()
pC x
n
ố ủ ụ ượ ọ ố c g i là hàm kh i xác ấ ị ứ ấ ộ Do xác su t này ph thu c vào x nên nó là hàm s c a x và đ su t nh th c (binomial probability mass function) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ộ ế ỉ ệ ấ ị s trong m t dân s nh t đ nh, t l ầ ả ử ả ủ ầ ầ ậ
ể ư ầ ể ậ ầ
ư ậ ầ ư ậ ộ ầ
3
)35(
f
C
)3(
XP (
)3
52,0
48,0
32,0
3
5
ấ ả ấ ể ị ứ ồ ử ồ ệ ầ ỗ ầ ử ế ộ ầ ấ ị ứ ậ ộ ượ ử ầ ấ ổ ố ụ Thí d : gi sinh con trai là 52%. N u chúng ta xem ấ ể ế xét k t qu c a 5 l n sinh. Đ tính xác su t trong 5 l n sinh này có đúng 3 l n sinh là con trai có th l p lu n nh sau: Ð trong 5 l n sinh có 3 l n sinh con trai, có 5C3 = 5!/[3!x2!] = 10 cách khác nhau (đó là TGTTG, TTTGG, TGGTT, TTGTG, TTGGT, TGTGT, GTTTG, GGTTT, GTGTT, 3(10,52)2= 0,2304 x 0,1406 = ủ GTTGT). Xác su t x y ra c a m t cách nh v y = 0,52 0,032. Nh v y xác su t trong 5 l n sinh có 3 l n sinh là con trai là 10 x 0,032 = 0,32. ấ ử Chúng ta cũng có th xem 5 l n sinh là th nghi m nh th c g m 5 l n th đ ng nh t và m i l n th có hai k t cu c (sinh con trai và sinh con gái ) và xác su t sinh con trai là ụ 0,52 không thay đ i trong các l n th . Áp d ng hàm m t đ xác su t nh th c ta đ c (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)
ố ằ ụ ấ ố
ố ớ ị ứ ườ
ẻ ướ ẫ ỡ ộ i 5 tu i b suy dinh du ng. Trong m t m u 10 tr d ẻ ướ i ả ử s có 30% tr d ấ ổ ị ưỡ ị ể Thí d : Cho r ng 10% thanh niên trong dân s là hút thu c lá. Đ tính xác su t có đúng ậ ộ ể ử ụ 2 thanh niên hút thu c lá trong nhóm 10 thanh niên chúng ta có th s d ng hàm m t đ ấ ợ ấ xác su t nh th c v i n = 10, x = 2, and p = 0,1. Trong tr ng h p này xác su t là 0,1937. ụ Thí d : Gi 5, tính xác su t có đúng 4 b suy dinh d ng.
3. Phân phối Poisson
l ộ ơ ấ ị ờ s trong m t đ n v th i gian trung bình có ộ ơ ị ờ ầ m t đ n v th i gian ế ụ ệ có x l n xu t hi n k t c c này.
ấ ị ờ đ nh m t đ n v th i gian đ
ả ị ớ ấ ả ệ ế ụ ộ ố ớ ử ờ th i gian là ị ứ ớ ể ượ ự ệ ệ
ử ồ ử ầ l n xu t hi n k t c c quan ấ ử ờ th i gian v i N là m t s vô l /N. ộ ầ ử i d ng: Th c hi n th nghi m nh th c v i N l n l /N. Áp d ngụ ỗ ầ ấ ả ấ ậ ộ ượ ứ ả ử Bài toán: Gi tâm. Hãy tính xác su t trong ượ ộ ơ c chia thành N phân t Gi ế ụ cùng l n. Khi đó xác su t x y ra k t c c quan tâm trong m t phân t ặ ướ ạ c đ t d Khi đó bài toán có th đ ộ ế ấ th đ ng nh t và xác su t x y k t cu c quan tâm trong m i l n th là ị ứ công th c hàm m t đ xác su t nh th c ta đ c
xN
x
(
)
x
xN
(
)
N
(cid:0)
x
x
(cid:0)
(
)
x
N (cid:0)
x
x
(cid:0)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) xN NN ( )1 ( )1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x p xf )( XP ( ) 1( ) 1 pC x (cid:0) (cid:0) (cid:0) (cid:0) N N ... x ! (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 1 (cid:0) (cid:0) N N Nx ! e x !
(cid:0)
x
Xf (
)
e x !
(cid:0) (cid:0) (cid:0)
U
ổ ạ ố ể ế ầ ớ ạ ị ủ ố i đ nh nghĩa c a s e (c s ơ ố ữ ể ắ đ n m v ng các phép bi n đ i đ i s k trên c n nh l ủ c a logarithm Neper)
e
1
lim U
1 U
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) =2,7183
33
l ộ ơ ế ụ ệ l n xu t hi n k t c c quan ầ t đ n v th i gian
ấ ị ờ ấ ế ụ ớ ộ ố đ nh m t đ n v th i gian đ ả ị ớ ấ ả
ộ ượ ị ờ ử ờ th i gian là ệ ị ứ ớ ử ầ ấ
xNt
x
(
)
x
xNt
(
)
Nt
(cid:0)
(cid:0)
(cid:0)
x
x
(
)
(
)
t
x
Nt (cid:0)
Nt (cid:0)
x
xx tN Nx !
x et ) x !
ậ ộ ỗ ầ ụ ử ị ờ ầ s trong m t đ n v th i gian trung bình có ệ ấ ơ ị ờ có x l n xu t hi n k t c c này. ử ờ th i gian v i N là m t s vô ế ử ờ th i gian. Xác su t x y ra k t l /N. Khi đó bài toán có th đ ể ể ượ c phát bi u ấ ả ử ồ i d ng: Th c hi n th nghi m nh th c v i Nt l n th đ ng nh t và xác su t x y l /N. Áp d ng công th c hàm m t đ xác su t ấ ứ ượ ả ử Bài toán: Gi tâm. Hãy tính xác su t trong ộ ơ Gi c chia thành N phân t ơ ư ậ cùng l n. Nh v y trong t đ n v th i gian có Nt phân t ụ c c quan tâm trong m t phân t ướ ạ ệ ự d ế ộ k t cu c quan tâm trong m i l n th là ị ứ nh th c ta đ c (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Nt Nt Nt x ( )1 ( )1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x p xf )( XP ( ) 1( ) 1 pC x (cid:0) (cid:0) (cid:0) (cid:0) N N ... x ! (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ( t (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 1 1 (cid:0) (cid:0) (cid:0) (cid:0) N N x !
ố ố ầ
(cid:0)
(cid:0)
(
x et )
x
Xf (
)
x !
ộ ế ị ờ ả ộ ấ ế l t i trong m t kho ng th i gian (t đ n v th i gian) khi đã bi ấ ơ ị ờ ệ ế ố ố ứ (cid:0) ệ ổ ượ c dùng làm mô hình cho s l n xu t hi n các M t cách t ng quát, phân ph i Poisson đ ờ ậ ợ ố , trung bi n s thu n l ộ ơ ấ ố ầ bình s l n xu t hi n bi n c trong m t đ n v th i gian. Hàm kh i xác su t Poisson ượ c trình bày công th c sau đ t (cid:0) (cid:0)
ố ủ ủ ố ệ ộ ấ là tham s c a phân ph i và là s l n xu t hi n trung bình c a bi n c trong m t ấ ị ố ầ ộ
ệ ấ s s l n nh p vi n trong ngày c p c u ấ ị ố ệ ứ ở ộ ệ m t b nh vi n có phân ph i ớ ố ầ ầ
ườ
ợ ấ ứ ng h p c p c u. ợ ấ ứ ng h p c p c u nào.
ườ ợ ấ ứ ườ ầ v i ớ l ế ố ờ ả kho ng th i gian nh t đ nh (hay trong m t không gian nh t đ nh) và e=2,7183. ậ ả ử ố ầ ụ Thí d : Gi ệ ậ Poisson v i s l n nh p vi n trung bình là 3 l n/ngày. Tính xác su tấ a. Vào ngày 12 tháng 8 năm 2003, có đúng 2 tr b. Vào ngày 12 tháng 8 năm 2003, có 1 tr ộ c. Trong m t tu n có 7 tr ng h p c p c u.
ỉ ấ T su t
l ấ ệ ủ ế ố ượ ọ ộ ơ , còn đ
ị ờ ớ ớ là đ i l ậ ộ ắ ố ủ ạ ượ ố ầ ế ậ l ộ ơ ế ấ
ị ờ ố ầ c g i là S l n xu t hi n trung bình c a bi n c trong m t đ n v th i gian, ấ l ỉ ấ ng có t su t (rate) hay m t đ m c m i (incidence rate). Khác v i xác su t, ố ơ ấ ể ị đ n v . Qua hàm kh i c a phân ph i Poisson có th nh n xét n u trung bình s l n xu t ệ ủ ố ầ ị ờ ố ệ ủ thì trung bình s l n xu t hi n c a t hi n c a bi n c trong m t đ n v th i gian là ơ đ n v th i gian là l t.
ố ụ ư ọ ượ ể ế ơ ố ạ ọ ỏ ế ừ 2,1kg đ n < 2,2 kg, v.v). Khi đó bi n liên t c s tr ể ụ ẽ ở ế ờ ạ ố ụ ủ ng c a ư ề ụ ng s sinh thành nhi u nhóm nh (thí d nh ế thành ấ ủ ng pháp phân ph i xác su t c a bi n r i r c cho
ữ
ườ ượ ố ẽ ơ ọ c g i là hàm m t đ (density
ầ ủ ệ ườ ầ ở ụ c bao quanh b i tr c x và hai đ ng cong, đ ẳ ng th ng ố ớ ở ướ ườ i đ ẽ 4. Phân phối xác suất của biến liên tục ả ử ấ ủ s ta mu n tìm phân ph i xác su t c a bi n liên t c (thí d nh tr ng l Gi ẻ ơ ượ tr s sinh), ta có th phân lo i tr ng l ế ừ 2,0kg đ n < 2,1 kg, t t ế ố ờ ạ ươ bi n s r i r c và ta có th dùng ph ế ố ạ lo i bi n s này. ỏ ơ ạ ế i chia thành nh ng nhóm nh h n, phân ph i s tinh vi h n và: N u chúng ta l ậ ộ ơ ấ ẽ ở Ða giác t n su t s tr thành đ ng cong tr n và đ ệ function) c a phân ph i v i kí hi u là f(x) ượ Ph n di n tích d vuông góc đi qua a và b s là P (a < X ≤ b).
34
ầ ở ướ ườ ằ ở bên trái c a đ ng cong n m
ủ ườ ệ ệ ấ i đ ẫ ỏ ơ ng th ng vuông góc đi qua cượ £ x) hay F(x) đ d ế ố ố ằ ế ủ ẫ ẳ Ph n di n tích x là xác su t bi n s ng u nhiên nh h n hay b ng x, kí hi u là P(X ọ g i hàm phân ph i (distribution function) c a bi n ng u nhiên X
ườ ụ ấ ấ ố ồ ị ố ng là phân ph i xác su t liên t c ph bi n nh t. Hình 2 là đ th ấ ổ ế ộ ệ ườ ẩ ớ 5. Phân phối bình thường ố Phân ph i bình th ủ c a phân ph i xác su t bình th ng v i trung bình là 0 và đ l ch chu n là 1.
ấ ườ ố Hình 1. Phân ph i xác su t bình th ng
(cid:0)
ườ ố ố Phân ph i bình th ậ ộ ng là phân ph i có hàm m t đ :
2 ) /
(cid:0) 22
(cid:0) (cid:0) (cid:0) e x ( f x ( ) 1 (cid:0) (cid:0) 2
2 là ph
ươ ủ và s ế ố ể ể ệ ố ẩ ộ ệ ng sai là đ l ch chu n và ớ ườ ng v i trung s V i ớ m ươ ph bình là m ố ớ s là trung bình c a phân ph i v i ố ng sai c a phân ph i. Đ th hi n bi n s X có phân ph i bình th 2 còn có th s d ng kí hi u ệ ể ử ụ
ng sai 2) ườ ặ ủ ươ và ph X ~ ,s N(m ố Phân ph i bình th ng có 4 đ c tính quan tr ng sau:
ậ ộ ấ ậ ở ậ ộ ả M t đ cao nh t t p trung ị m quanh giá tr ọ , càng xa giá tr ị m hàm m t đ càng gi m
m ậ ộ ế ớ ở Hàm m t đ ti n t i zero ị các giá tr cách xa
m ẳ ứ ng th ng đ ng đi qua
ừ ứ ố ng ng m ườ hàm m t đ c a phân ph i bình th ườ ườ ộ ệ i ta ch ng minh đ ẩ s và đ l ch chu n ườ ng v i trung bình là ớ ộ ệ ừ ẩ ế ượ c n u ố ấ , xác su t giá ẩ ộ ệ ế trung bình – 1,96 đ l ch chu n đ n trung bình + 1,96 đ l ch chu n ậ ộ ố ứ Hàm m t đ đ i x ng qua đ ộ ủ ậ Ngoài ra t ế ố bi n s có phân ph i bình th ị ế ố ằ tr bi n s n m t là 95%.
X~N(m ,s 1,96s m + 1,96s ) = 0,95
ằ ả – 2) => P(m
ỉ
ườ ẩ ố 1,96s
ố ng chu n hay còn g i là phân ph i chu n là phân ph i bình th ườ
ng ẩ
ộ ệ ẩ ị ủ
ế ố
Hay nói khác đi, ch có 5% giá tr c a bi n s X n m ngoài kho ng
ọ
ố
Phân ph i bình th
có trung bình là zero và đ l ch chu n =1. 2/2 ze (cid:0) (cid:0) zf
)( 1
(cid:0)
2 ụ ẩ ố ườ ng có th ể ượ ọ
c g i là tr c z. Phân ph i bình th
ớ
ế ư
ế ế ẩ ẫ ố
ụ
L u ý: trong phân ph i chu n, tr c x đ
ạ
ố
bi n thành phân ph i chu n n u ta t o bi n ng u nhiêu m i z = (x m )/s . 35 £ ố ườ ụ
ụ ng, tính P(Z
ệ ố ụ ướ ườ
i đ ng cong, trên tr c Z, ữ ượ ấ ấ ọ ố ố ườ c ch n b t kì trong dân s có phân ph i bình th ng có giá ị ừ ộ
2,71).
Thí d : Cho m t phân ph i bình th
ằ
ẩ
ộ
Thí d : Cho m t phân ph i chu n, tìm di n tích n m d
ằ
n m gi a z=1 và z=2.
ụ
Thí d : tính xác su t Z đ
ế
2,55 đ n +2,55.
tr t ặ ườ ố
, không có m t phân ph i nào là phân ph i bình th ộ
ể ượ ỉ ố
ườ
ấ
c coi là x p x bình th ố
ườ ữ
ng thì chúng ta có th có nh ng suy lu n xác su t ti n l ứ ạ ệ ử ụ
ườ ẻ ơ ề ộ
ng m t cách
ế
ng. Khi đó, n u dùng
ấ ệ ợ
ể
ậ
i
ươ
ữ
ng pháp ph c t p khác. Nh ng phân
ườ ưở
ượ
ng
ng tr s sinh, chi u cao ng i tr ố 6. Ứng dụng phân phối bình thường
ự ế
M c dù trong th c t
ề
chính xác, có nhi u phân ph i có th đ
ố
mô hinh phân ph i bình th
ữ
ơ ấ
ề
h n r t nhi u so v i vi c s d ng nh ng ph
ọ
ỉ
ố ượ
ng là tr ng l
ph i đ
thành, th ớ
ấ
c coi là x p x bình th
ươ
ng s thông minh. ng chu n c a 1750 tr em h c sinh nhà tr Hoa ộ ố ộ ỉ ệ ấ ị dân s có m t thu c tính nh t đ nh ố ộ ng t l
ố ộ ố ườ ườ ấ ộ ệ
i này có th ỏ ơ ả ử ọ ố ồ ượ ủ s tr ng l ườ ộ ẩ
ở
ố
thành ph H chí Minh có phân ph i chu n
ẩ
ấ
i đàn ông
ở ữ ng c a đàn ông
ộ ệ
ượ ẫ ọ ọ c ch n ng u nhiên có tr ng l ệ ố ủ ồ ấ ủ ắ ố ớ ừ ố Ướ ượ
c l
a.
ẩ
ươ
ụ
ng s thông minh trong m t dân s có trung bình =100 và đ l ch chu n
Thí d :Th
ươ
ẫ
ọ
15. Ch n ng u nhiên m t ng
ng
i trong dân s này, tính xác su t ng
ố
s thông minh nh h n 120.
P(IQ<120) = P(Z<(120100)/15) = P(Z<1,33) =0,9082
ụ
Thí d : Gi
và có trung bình là 56 kg và đ l ch chu n 10 kg. Tính xác su t m t ng
ượ
đ
gi a 40 kg và 68 kg.
ng
P(40 < TL < 68) = P(1,6 < Z < 1,2) = P(Z< 1,2) – P(Z <1,6)
ị
ụ
Áp d ng quy t c: mu n tìm P(Z P(Z c:ượ ta có P(Z< 1,6) = 1 P(Z<|1,6|)
Ta đ
P(40 < TL < 68) = P(1,6 < Z < 1,2) = P(Z< 1,2) – P(Z <1,6) = 0,8849 – (1 – 0,9452) = 0,8301 36 ở ố ồ ướ ườ ổ
thành ph H Chí Minh có bao ng c tính ả ị
ượ ố ồ
ụ
đ nh
thí d trên, hãy
ơ
ớ
ng l n h n 80 kg. ậ ố ặ ơ ấ
ả ẩ
ụ
Thí d : Trong thành ph H chí minh có c th y 1.000.000 đàn ông trên 20 tu i. Ch p
ở
ậ
i có
nh n gi
ọ
tr ng l
P(TL > 80) = P(Z> (8056)/10) = P(Z>2,4) = 1 P(Z<2,4) = 10,9918 = 0,0082
Vì v y s đàn ông n ng h n 80 kg = 1.000.000 x 0,00820 = 8200 ng ườ
i ẩ ọ ụ ứ ượ ườ ng có tr ng l ặ ẻ i, đ a tr 32 tháng bình th
ộ ứ ưỡ ườ ổ ứ
ch c y t
ớ ộ ệ
ề
ng v dinh d ế ế ớ
th gi
ẩ
ng hay không? ỏ ặ ả ẻ ứ ệ ượ ổ i câu h i này chúng ta ph i xét hi n t ng đ a tr 32 tháng n ng 13 kg có ph ọ ặ ế ượ ẹ ơ ng 13 kg hay nh h n nên cân n ng này ấ ng. ấ ả ề ẻ ưỡ ỏ ướ ườ
ả ứ
ươ ng v dinh d
ệ ượ ng hay không?
ẻ ứ ặ ng t nh câu h i tr c đó, chúng ta ph i xét hi n t ng đ a tr 32 tháng n ng 9 ẹ ơ ượ ẻ ẻ ọ ậ
ng 9 kg hay nh h n. Vì v y ả
ưỡ ng. ượ
ướ ườ ấ m ộ ị ố
ụ
ị ể ằ m ề
ườ ng và giá tr n m trong kho ng 1,96s ữ ơ ị ể
ị ằ
ả
ứ –
ườ
ớ
ườ ươ ấ ị ớ
ị ẩ
ớ ườ ng. ng ng v i |Z|<1,96 là giá tr bình th
ố ườ ườ ộ ng huy t có phân ph i bình th
ả ườ ế ị ng v i trung bình là 100 mg% và đ
ng huy t là bao nhiêu? ớ
ủ ườ
ng c a đ
ớ ế ươ ứ ườ ườ ị ng ng v i 1,96 < Z < 1,96 hay ng huy t t ủ
ng c a đ · ườ ừ ế b. Ch n đoán cho cá nhân
ẻ
ng trung
Thí d : Theo t
ả
bình là 14 kg v i đ l ch chu n là 1,5 kg. M t đ a tr 32 tháng n ng 13 kg có ph i là
ấ
b t bình th
ể ả ờ
Ð tr l
ế
bi n hay không.
P(TL <13) = P(Z < 0,66) = 1 – P(Z>0,66) = 1 – 0,7454 = 0,2546
ẻ
Vì có đ n 25,46% tr 32 tháng có tr ng l
ườ
ả
không ph i là b t th
ặ
Ð a tr 32 tháng n ng 9 kg có ph i là b t th
ự
ư
T
ổ ế
kg có ph bi n hay không.
P(TL <9) = P(Z < 2,66) = 1 – P(Z>2,66) = 1 – 0,9961 = 0,0039
ỉ
Nghĩa là trong 1000 tr ch có kho ng 4 tr có tr ng l
ẻ
ứ
c xem là suy dinh d
đ a tr này đ
ườ
ự
ấ ả
ơ
ế
ị ố
c n u xác su t x y ra m t tr s nào đó hay c c đoan h n tr s đó
Ng
i ta quy
ỏ ơ
ứ ư ủ
ấ
ị ố
ố
c a phân ph i bình
ng. Áp d ng tính ch t th t
nh h n 5% thì tr s đó là b t th
1,96s
ả
ế
ườ
là giá
ng, đi u này có th phát bi u là n u giá tr nào n m ngoài kho ng
th
–
ả
ể
ị
ị ấ
ng. Phát bi u
tr b t th
là giá tr bình th
ầ
ộ ị ố ế
ế
theo cách khác n u kho ng cách gi a m t tr s đ n giá tr trung bình l n h n 1,96 l n
ị
ộ ệ
đ l ch chu n (t
ng. Và giá tr
ng ng v i |Z|>1,96) thì giá tr đó là b t bình th
ươ ứ
t
ế
ụ ế
Thí d : n u đ
ỏ
ẩ
ệ
l ch chu n là 10 mg%. H i kho ng giá tr bình th
ả
Kho ng giá tr bình th
100 1,96 · ng huy t < 100 + 1,96 80120 mg% 10 hay t 10 < đ Bài tập ậ ố ị ỉ ệ ử
t s b nh nhân b viêm màng não có t l ủ ệ
vong là 10%. Trong khoa lây c a b nh ấ ệ ả ử ệ
ệ ố ườ ị ế
i b ch t ườ ị ế
i b ch t Bài gi ế ủ ử ể ễ ộ ử ồ ử ớ ỗ ộ ệ
ấ
ấ ạ ớ ộ ậ
ấ ỗ ầ ử ố ầ ị ứ
Bài t p phân ph i nh th c
1. Gi
ị
ệ
vi n, hi n có 10 b nh nhân b viêm màng não. Tính xác su t:
a. Không có ai s ng sót
ấ
b. Có ít nh t hai ng
c. Có đúng 3 ng
i:ả
ư
Có th xem di n ti n c a m t b nh nhân viêm màng não là m t phép th . Nh
ế
ậ
v y quan sát 10 phép th đ ng nh t và đ c l p v i nhau, m i phép th có 2 k t
ộ
cu c là thành công hay th t b i v i xác su t thành công trong m i l n th là 0,9.
ọ
G i X là s l n thành công ta có 37 x xn ) x p xf
)( XP
( ) 1( () pC
x n (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ấ ấ ố ằ ố ầ ấ a. Xác su t không có ai s ng sót = Xác su t s thành công b ng 0 = P(X=0)=
= 10C0 p0(1p)(100) =10C10 . 0,90.0,110 =10!/(0!10!).0,110=1/(1010)
ườ ỉ
Xác su t là 1 ph n m i t . b. Ta có ấ P(X=0)+P(X=1)+P(X=2)+P(X=3)+.......+P(X=10) = 1
ườ ố ừ ế i s ng. Do đó, xác su t có 0 đ n 8 ng ấ
ấ ườ ị ế
ườ ị ế It nh t hai ng
ít nh t hai ng i b ch t nghĩa là là có t
i b ch t là: P(X=0)+P(X=1)+.......+P(X=8) = 1 P(X=9)P(X=10) 10C10 p10(1p)(1010) = 0,910 = 0,3486 ớ i b ch t b ng: 1 0,3486 0,3874 = 0,264 ườ ị ế ấ ườ ố V i P(X=10) =
Và P(X=9) = 10C9 p9(1p)(109) = 0,99 = 0,3874
ườ ị ế ằ
ấ
ấ
Nên xác su t có ít nh t 2 ng
i b ch t là = Xác su t có 7 ng
c. Xác suât có đúng 3 ng i s ng: P(X=7) = 10C7 p7(1p)(107) = 120 . 0,97 . 0,13 = 0,0574. ậ ố ỗ ộ ở ầ ế ố ố ế ằ t r ng s chu t trung bình trong m i h gia đình ộ
C n th là 1,4 con. N u s chu t ấ ở ộ ơ
ấ ị ộ
ố m t gia đình nh t đ nh có: ộ ộ
ộ ở Bài t p phân ph i Poisson
Bi
tuân theo phân ph i Poisson, tính xác su t
ộ
a. Không có con chu t nào?
b. Có m t con chu t?
c. Có t 3 con chu t tr lên? Bài gi (cid:0) x ử ụ ừ
i:ả
ứ
a. S d ng công th c (cid:0) (cid:0) e (cid:0) xf
)( x
! P(X=x) = 0 / 0! = 0,247 ượ c P(X=0) = 0,247 x 1,4 = 1,4 và x = 0 ta đ v i ớ l
b. P(X=1) = 0,247 x 1,41 / 1! = 0,346
c. Vì P(X=0)+P(X=1)+P(X=2)+P(X‡ 3) =1
Ta có P(X(3) = 1 P(X=0) P(X=1) P(X=2)
V i ớ P(X=0) = 0,247 x 1,40 / 0! = 0,247
P(X=1) = 0,247 x 1,41 / 1! = 0,346
P(X=2) = 0,247 x 1,42 / 2! = 0,242 Nên P(X ‡ 3) = 1 0,247 0,346 0,242 = 0,165 ườ ẫ ng
ế ố ố ấ ằ ỉ ị
t kê 10 bi n s ng u nhiên mà anh ch nghĩa r ng nó là phân ph i x p x bình ố ấ ượ ế ỉ ườ
ấ ộ ệ ẩ ộ ừ ế ẫ ớ ọ ị c ch n ng u nhiên có giá tr cholesterol (a) t
ữ ỏ ơ ố
Phân ph i bình th
ệ
1. Hãy li
ườ
ng.
th
ớ
ế
2. N u hàm l
ng v i trung
ng cholesterol huy t thanh là phân ph i x p x bình th
bình là 200mg/100 ml và đ l ch chu n là 20 mg/100ml. Tính xác su t m t cá nhân
ơ
ượ
180 đ n 200 mg/100ml (b) l n h n
đ
225 mg/100 ml (c) nh h n 150 mg/100ml (d) gi a 190 và 210 mg/100 ml. 38 Bài gi ỉ ườ ủ ề ượ ế ố
ọ Nh ng bi n s có phân ph i x p x bình th
ưở ườ ữ
ng thành, tr ng l ng tr s sinh, hemoglobin máu, Hct, đ ố ấ
ẻ ơ
ổ ậ ụ ữ ủ ị ướ ể
c ti u. (200200)/20} 200) = P{(180200)/20 < Z £
1) = P(Z £ 0) = 0,8413 0,5 0) = P(0 < Z £ 1) P(Z £ iả
ng là : chi u cao c a đàn
1.
ế
ng huy t,
ông tr
ế
chu vi vòng cánh tay, nh p tim, tu i d y thì c a ph n , cholesterol huy t thanh,
ỉ ọ
t tr ng n
2.a. P(180 < cholesterol £
= P(1 < Z £
= 0,3413 225) = 1 P{Z £ (225200)/20} 2.b. P(cholesterol > 225) = 1P(cholesterol £
1,25) = 1 0,8944 = 0,1056 150) = P{Z £ (150200)/20} = P{Z £ 2,5}= P{Z >2,5}= 2.c. 2,5}=10,9938=0,0062 2.d. (210200)/20} 210) = P{(190200)/20 < Z £
0,5) P(Z £ 0,5) = P(Z £ 0,5) = P(Z £ 0,5) P(Z >0,5)= = 1 P(Z £
P(cholesterol £
1P{Z £
P(190 < cholesterol £
= P(0,5 < Z £
P(Z £ 0,5) 1 + P(Z £ 0,5)=2 x 0,6915 1 = 0,3830. 39 Ố Ố
Ế Ố
TH NG KÊ, BI N S VÀ PHÂN PH I ứ ả
ố ệ ế ố ủ ề ọ
ố
ế ố ị ượ ị ế ố ị ị
ệ ượ
t đ ng và đ nh tính trong có có bi n s nh giá, ị . ị ị c các lo i bi n s : đ nh l
ứ ự
ượ ả
ượ ấ
ồ ị ố ầ
ồ ể ạ ượ
ố ệ ng
ị ể ố ệ
c b ng phân ph i t n su t cho s li u đ nh tính và đ nh l
ợ
c các lo i bi u đ hay đ th thích h p đ trình bày s li u đ nh tính và ố ố ắ ị ộ ệ ị ế ư c các s th ng kê tóm t ẩ
t nh trung bình, trung v , y u v , đ l ch chu n, Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năng:
ủ
Trình bày đ nh nghĩa c a th ng kê, s li u, thông tin và bi n s
ạ
Phân bi
danh đ nh hay th t
Xây d ng đ
ự
L a ch n đ
ượ
ị
đ nh l
Tính đ
ươ
ph ự
ọ
ng
ượ
ng sai. ọ ậ ề ươ ng pháp khoa h c dùng đ thu th p, tóm t ố ệ ượ ử ụ ằ ứ ng pháp th ng kê đ
ằ ứ ừ ng ch không nh m nghiên c u t ng cá nhân đ n l . ố
ắ
t, trình bày và phân tích s
ứ
ộ
ể
c s d ng trong nghiên c u nh m đ so sánh m t
ơ ẻ
ặ ạ ượ ệ ậ ở các ng ượ
ả
ng khác nhau hay c do vi c quan sát hay thu th p đ c tính hay đ i l
ở ờ
th i gian khác nhau.
ọ
ủ ậ ượ ố ệ ớ i tính c a các h c viên trong l p, s li u ghi nh n đ c là: ữ 10.2 13.7 10.4 14.9 11.5 12.0 11.0 13.3 12.9 12.1 9.4 13.2 10.8 11.7 10.6 10.5 13.7 11.8 14.1 10.3 13.6 12.1 12.9 11.4 12.7 10.6 11.4 11.9 9.3 13.5 14.6 11.2 11.7 10.9 10.4 12.0 12.9 11.1 8.8 10.2 11.6 12.5 13.4 12.1 10.9 11.3 14.7 10.8 13.3 11.9 11.4 12.5 13.0 11.6 13.1 9.7 11.2 15.1 10.7 12.9 13.4 12.3 11.0 13.1 12.2 11.8 10.9
ố ệ ụ ụ ủ ứ ế ả ộ ộ ư 1. Một số định nghĩa
ố
Th ng kê là ph
ươ
li u. Ph
ố ượ
nhóm đ i t
ế
ố ệ
S li u: K t qu có đ
ố ượ
đ i t
ụ
ớ
Thí d : Quan sát gi
ữ ữ ữ
Nam, nam, n , n , n , nam, n , v.v
ồ
Thí d : M t nhà nghiên c u đo n ng đ hemoglobin c a 70 thai ph có k t qu nh
sau: 14.6
ố
ố ệ
ườ ộ ặ ạ ượ
ộ ổ ủ ườ ủ ầ ườ i khác, qu n áo c a m t ng ng ậ
ấ ị
ng nh t đ nh. Ghi nh n
ế
ữ
i khác n a thì k t 11.1
13.5
ữ
ượ ọ
và nh ng con s này đ
ầ ư
ả
C n l u ý s li u ph i liên k t v i m t đ c tính hay đ i l
ở
ớ
gi
i tính
ượ
ả
qu này đ
ử ụ
ng pháp th ng kê chúng ta có th tóm t
S d ng ph
hemoglobin trung bình=11,98 và đ l ch chu n b ng 1.42. S li u đ
bày hay phân tích b ng ph c g i là s li u.
ế ớ
i này, tu i c a ng
ố ệ
ả
c không ph i là s li u.
ươ ắ ố ệ ể ố ử ụ ố ệ ộ ệ ẩ t s li u trên s d ng n ng đ
ượ ộ
ồ
ắ
t, trình c tóm t ằ
ẽ ở ươ ằ ố ng pháp th ng kê s tr thành thông tin. ố ữ ặ ổ ừ ể ườ ng hay nh ng đ c tính có th thay đ i t ng i này sang ạ ượ
ể ể ể ệ th i đi m này sang th i đi m khác.
ặ
ằ ờ
ạ ượ
ượ ể ể ệ
ế ố ị ộ ặ ế
ườ
ư ậ
ng nó đ c g i là bi n s đ nh l ế
ể ệ
ng. N u nó nh m th hi n m t đ c tính no đ ộ ạ
ng hay đ c tính. N u nó th hi n m t đ i
ượ
ế
c 2. Biến số và các loại biến số
ữ
Bi n s là nh ng đ i l
ừ ờ
i khác hay t
ng
ế ố
Nh v y bi n s có th th hi n đ i l
ượ
ượ ọ
l
ế ố ị
ọ
g i là bi n s đ nh tính. 40 ế ố ị ế ố ứ ự ế ố ị ượ ạ
c chia làm 3 lo i: bi n s th t ế
, bi n s danh đ nh và bi n ế ớ ị ứ ự ượ
đ c. ế ố ị
ế ộ ể ắ
xã h i (giàu, khá, trung bình, nghèo, r t nghèo) là bi n s th ế ố ứ ự
là bi n s đ nh tính v i các giá tr có th s p x p th t
ạ
ườ ế ố ơ ườ ườ ệ ấ
i khá, ng ế ố ứ
ườ
ơ
i i khá h n ng b i vì ng t h n ng ề
i giàu có đi u ki n kinh t t ữ ỏ ượ i, khá, trung bình, kém), tiên l ng (t ố
t, ử ấ ế ế ớ ượ ư i đ ụ
vong).
ạ
ế ạ Th gi
ườ ế ộ c trình bày nh sau, theo
ế
ng, tăng huy t áp đ 1, tăng huy t ổ ứ
ủ
ế
ị
ế ố ứ ự ế ộ Bi n s đ nh tính
ế ố ị
Bi n s đ nh tính còn đ
ị
ố
s nh giá.
Bi n s th t
ụ
Thí d : tình tr ng kinh t
ự ở
t
ơ
trung bình, trung bình h n nghèo, v.v
ọ ự ủ ọ
Nh ng thí d khác là h c l c c a h c sinh (gi
khá, x u, t
ế
Theo phân lo i tăng huy t áp c a T ch c Y t
ớ
phân lo i huy t áp v i các giá tr huy t áp bình th
ộ
áp đ 2, tăng huy t áp đ 3 là bi n s th t £ ế ườ ươ 89 ng ng: Huy t áp bình th £ ộ ươ ng 104 179 hay HA tâm tr ế
Tăng huy t áp đ 1: ộ ươ ng >114 180 hay HA tâm tr ế
Tăng huy t áp đ 2: ‡ ộ ươ ng ị ố ị ủ ể ể ị ọ ặ ễ ế ố ị
ộ 115 mmHg
ị ằ
ể ắ ị t
ế ố ị ế ừ ộ ậ ự ừ ấ theo m t tr t t t i. ụ ượ ạ
c l
ộ ố ế ố ị ộ ủ ạ ị ư ố ế ị ị ỉ ị
ế ố
ố ố
ữ ưỡ ưỡ ượ ọ ế ố ị
c g i là bi n s nh giá (binary variable) ế ố ể ớ ị ệ ặ ậ ố ệ ố ệ ữ
ữ ử ệ ằ i tính và
ể
c Nam là 1 và N là 2. Tuy nhiên vi c mã hóa này là áp đ t và chúng ta hoàn toàn có th
ở
c Nam là 1 và N là 0. Vi c mã hóa ch nh m giúp vi c nh p s li u và x lí s li u tr ậ ố ệ ả ố ườ
ượ ọ ế ạ ị ể ằ ệ ấ ầ ể
i ta có th
c g i là mã
ố ượ
c ả ả ị HA tâm thu £ 139 và HA tâm tr
HA tâm thu £
HA tâm thu ‡
HA tâm thu ‡ 180 và HA tâm tr
ế
Tăng huy t áp đ 3:
ế ố
Bi n s danh đ nh là bi n s đ nh tính mà giá tr c a nó không th bi u th b ng s mà
ả
ằ
ể
ph i bi u di n b ng m t tên g i (danh: tên) và các giá tr này không th s p đ t theo
ế
ộ ậ ự ừ ấ
th p đ n cao.
m t tr t t
ộ ớ
ụ
ế ố ị
Thí d : Bi n s dân t c v i các giá tr : Kinh, Khmer, Hoa, Chăm,… là bi n s đ nh tính
ế
ể ắ
vì chúng ta không th s p x p các giá tr này t
th p đ n cao hay
ng
M t s thí d khác c a bi n s danh đ nh là tình tr ng hôn nhân (có 4 giá tr : đ c thân,
có gia đình, li d , góa) nhóm máu (A, B, AB và O).
ụ
Đôi khi bi n s danh đ nh ch có 2 giá tr : thí d nh s ng hay ch t; có hút thu c lá hay
ữ
ng; nam hay n . Nh ng
ng hay không suy dinh d
không hút thu c lá; có suy dinh d
ế ố
ạ
ộ
bi n s thu c lo i này đ
Mã hoá
ả ế
ể ệ
ệ
Trong phân tích th ng kê, đ ti n vi c nh p s li u hay lí gi
i k t qu , ng
ệ
ố
ị ủ
ánh x (mapping) các giá tr c a bi n đ nh tính vào các con s . Vi c này đ
ặ
hóa và c n hi u r ng vi c mã hóa này hoàn toàn có tính ch t áp đ t và các con s đ
dùng trong mã hóa không ph n ánh b n ch t c a bi n s danh đ nh. ế ố
ữ ệ
ế ố ấ ủ ỉ
ả ứ ằ ả ơ ớ
Gi
quy
quy
nên d dàng h n ch không nh m ph n ánh b n ch t c a bi n s đó. ấ ủ
ị
i tính là bi n s danh đ nh và có hai giá tr là nam và n . Chúng ta có th mã hóa gi
ướ
ướ
ễ ượ ng ằ ượ ộ ạ ượ ể ệ
ng nh m th hi n m t đ i l
ụ ở
ế ố ể ố
ị
ng và do đó có giá tr là nh ng con s .
ổ ữ
ườ ườ i này 20 tu i, ng ổ
i kia 32 tu i, ườ ế ề ặ ng huy t, hemoglobin, hematocrite, chi u cao, cân n ng, thu ế ố ị
Bi n s đ nh l
ế ố ị
Bi n s đ nh l
ổ
ụ
Thí d : tu i là bi n s liên t c b i vì ta có th nói ng
v.v.
ụ
ữ
Nh ng thí d khác là đ
ậ
nh p, v.v 41 ặ ậ ể ả ả ng có th trình bày thành b ng và b ng này ố ầ ấ ả 3. Phương pháp trình bày số liệu bảng
ạ ượ
ố ệ
S li u ghi nh n các đ c tính hay đ i l
ượ ọ
c g i là b ng phân ph i t n su t.
đ ố ầ ế ố ị ố ệ ủ ộ
ủ ừ
ộ ộ ả
ả ộ ộ ệ ế ố
ị ủ ủ ị ườ ệ ầ ọ ớ ng m m non 23 tháng 11, Huy n Hóc ố ầ
ả
ế ố
ố ấ ủ
Phân ph i t n su t c a bi n s đ nh tính
ấ
ố ầ
ướ ạ
ể ượ
ế ố ờ ạ
i d ng m t phân ph i t n su t.
c trình bày d
S li u c a bi n s r i r c có th đ
ị ờ ạ ủ
ấ
ệ
ấ
ầ
ỉ
ấ
Phân ph i t n su t là m t b ng ch ra t n su t xu t hi n c a t ng giá tr r i r c c a
ố ầ
ư ậ
ấ ồ
bi n s (B ng 1). Nh v y b ng phân ph i t n su t g m 2 c t, m t c t li
t kê các giá
ấ ươ ứ
ầ
ộ ộ
tr c a bi n s và m t c t trình bày t n su t t
ng ng c a các giá tr đó.
ườ
ớ ơ
ủ
Table 1. Phân ph i gi
ng tr
i tính c a 69 h c sinh l p c m th
môn ầ S trố ẻ Ph n trăm Gi iớ Nam 45 65% Nữ 24 35% ổ ố T ng s 69 100% ả ả ố ầ ở
i tính. B i vì gi ệ ị
ứ ủ ứ t kê 2 giá tr này ớ
i tính có 2 giá tr nam và n
ầ
ầ c t th nhì ta ghi t n su t t
ộ ị ữ
ấ ươ
ng ng c a các
ụ ở
ư ố ầ ấ ộ ươ ệ ệ ụ
ỡ ẻ ủ ớ
ấ ủ
B ng trên là b n phân ph i t n su t c a gi
ở ộ ộ Ở ộ
ị
nên ta li
m t c t.
ấ
ố ầ
ả
giá tr này. Ðôi khi b ng phân ph i t n su t có thêm c t ph n trăm nh trong thí d
ề ả
ả
trên. B ng 2 là m t thí d khác v b ng phân ph i t n su t.
ẻ
ng pháp đ đ c a 600 tr trong b nh vi n
Table 2. Ph ươ ng pháp đ ỡ Ph
đẻ Số
sinh Ph nầ
trăm Sinh th ngườ 478 79,7 Sinh forceps 65 10,8 Sinh mổ 57 9,5 ổ ố T ng s 600 100,0 ỉ i ta không ghi con s th c t
ả ầ ố ự ế ủ ầ
ố ố ượ ủ ộ ấ
c a t n su t mà ch ghi
ng c a toàn b phân ố
ườ
ng h p h p này, ph i ghi rõ s đ i t
ộ ợ
ụ ậ
ố ả
Ðôi khi trong b ng phân ph i ng
nh n ph n trăm. Trong tr
ố ố ượ
ph i (s đ i t ườ
ợ
ng toàn b trong thí d trên là 600) ượ ố ầ ế ố ị ng ế ụ ể ệ t kê t ể ế ố
ườ ị ủ
i. ả ự ấ ư
ng nh sau: ế ố
ấ ả
t c các giá tr c a bi n s .
ị ủ
ế ố ị
ủ ố ệ ị ự ể ạ ụ ề ủ ủ ả ỗ ả
ạ ượ ầ ư
ố ạ
ỗ ẵ ừ ể ạ ằ ả ả ớ ướ ế ả ị ị ấ ủ
Phân ph i t n su t c a bi n s đ nh l
ế ố
N u bi n s là bi n s liên t c chúng ta không th li
ế ố ạ
ợ
ng h p này chúng ta có th nhóm (làm tròn) giá tr c a bi n s l
Trong tr
ượ
ố ầ
ướ
ụ ể
C th các b
c xây d ng b ng phân ph i t n su t cho bi n s đ nh l
ị ự
ạ
1 Tìm ph m vi (giá tr c c ti u và giá tr c c đ i) c a s li u. Trong thí d v
ế
ụ ữ ạ
hemoglobin c a 70 ph n ph m vi là 8,8 đ n 15,1
ớ ộ ộ
ố ệ
2. Chia ph m vi s li u ra làm n kho ng v i đ r ng c a m i kho ng là d. C n l u ý
ư
ả
ộ ộ
ng ch n nh 1, 2, 5, 10 hay 0,5, 0,2 và s các
đ r ng m i kho ng d nên là đ i l
ả
ụ
512 (trung bình là 78). Trong thí d trên ta có th chia ph m vi ra làm
kho ng n nên t
ị
ơ
ề ộ
ả
8kho ng v i chi u r ng kho ng b ng 1 đ n v . Khi đó các kho ng là: 88,9; 99,9; 10
10,9; 1111,9; 1212,9; 1313,9; 1414,9; 1515,9.
ợ
3. Ð m các giá tr thích h p vào kho ng đã đ nh tr c 42 Ð mế Hemoglobin
(g/100ml) 88,9 1 99,9 111 1010,9 1111 1111 1111 1111,9 1111 1111 1111 1111 1212,9 1111 1111 1111 1313,9 1111 1111 111 1414,9 1111 1515,9 1 ụ ữ ủ ả ố ầ ế ố ấ ớ ị ủ ả ế ố
ộ ứ ể ị ả
ế ợ ự
4. Xây d ng b ng phân ph i t n su t v i bi n s và các kho ng giá tr c a bi n s và
ầ
ớ
ấ ươ
ầ
t n su t t
ng ng v i các kho ng giá tr đó. Chúng ta cũng có th thêm vào c t ph n
ầ
ộ
trăm và c t ph n trăm tích lũy (n u thích h p)
Table 3. Hemoglobin c a 70 ph n ầ Hemoglobin Ph nầ
trăm T nầ
su tấ Ph n trăm tích
lũy 88,9 1 1.43 1.43 99,9 3 4.29 5.71 1010,9 14 20.00 25.71 1111,9 19 27.14 52.86 1212,9 14 20.00 72.86 1313,9 13 18.57 91.43 1414,9 5 7.14 98.57 1515,9 1 1.43 100.00 ẻ ớ ơ ố ố ườ ủ ẻ ố ụ ư ế ủ ể ẻ ế ố ờ ạ ủ ế ể
ế ố ả ấ ủ ố ầ ả ng nhà tr 23 tháng 11, Hóc môn. Thí d nh n u biên s là chu vi vòng cánh tay c a tr chúng ta có th làm tròn chu vi
vòng cánh tay đ n 1 cm. Khi đó ta có th xem thang đo c a bi n s là r i r c và trình
bày b ng phân ph i t n su t c a bi n s (b ng 2).
Table 4. Phân ph i s đo vòng cánh tay c a 69 tr l p c m th ầ Vòng cánh tay T nầ
su tấ Ph nầ
trăm Ph n trăm tích
lũy 13 <14 2 2.78 2.78 14 <15 31 43.06 45.83 15 <16 27 37.50 83.33 16 <17 9 12.50 95.83 17 <18 0 12.50 95.83 43 18 <19 2 2.78 98.61 19 <20 1 1.39 100.00 ệ ố ệ ố ị ằ ả ỏ ố ệ ị ế
ượ
ố ả ả ạ ố ể
ng có th tóm t
: th ng kê mô t ố
ả ế
ữ
ắ ơ
t h n n a
ướ
ng
khuynh h ế ố ứ ự
ả
ả 4. Các số thống kê mô tả
Vi c trình bày s li u b ng b ng là th a mãn cho các bi n s đ nh tính (c bi n s
danh đ nh và bi n s th t ). Tuy nhiên các s li u đ nh l
ố ố
ằ
b ng các s th ng kê mô t
ố
ậ
t p trung và th ng kê mô t ị
. Có hai lo i th ng kê mô t
tính phân tán. ả ố ướ ậ ng t p trung ố ạ ụ ế ố ậ ị ng t p trung có th là trung bình (mean), trung v (median) ị ế ố ệ ể
ể
t giá tr tiêu bi u cho s li u. ướ
ố
ố ạ ụ ấ ể
ố ố
ấ ơ ử ụ
ử ụ ế
ế
ế ụ ế ạ ơ ố Th ng kê mô t
khuynh h
ả
Th ng kê mô t
khuynh h
ế
ữ
và y u v (mode). Nh ng th ng kê này cho bi
ả ử
ạ
5 đ i t
ố ị
ố ượ
ẽ
ử ụ
Thí d : có hai lo i thu c h áp A và B. Gi
ng sau khi s d ng thu c h áp A s
s có 5 đ i t
ố ạ
ử ụ
ố ượ
ở
ẽ
có huy t áp 110 115 120 125 130 và
ng khác sau khi s d ng thu c h áp B s có
ủ
ế
ể
t tác d ng c a thu c A là
huy t áp 120 125 130 135 140. Con s tiêu bi u nh t đ cho bi
ế
huy t áp trung bình sau khi s d ng thu c A và là 120. Con s huy t áp trung bình này th p h n
huy t áp trung bình sau khi s d ng thu c B cho bi ố
ố
t thu c A có tác d ng m nh h n.
‘ x (đ c là x g ch) là t ng các giá tr c a s li u
ị ủ ố ệ
ổ ạ ọ ủ ố ệ ệ
c kí hi u là ượ
Trung bình c a s li u, đ
ố ầ
chia cho s l n quan sát (N). i x x
N ủ ố ượ ng là 120, 125, 130, 135, 150. ụ ố ệ
ế ẽ ế
ề
Thí d : S li u v huy t áp tâm thu c a 5 đ i t
Huy t áp tâm thu trung bình s là 132 (cid:0) (cid:0) 120 125 135 150 i x 132 x
N 130
5
ệ (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ể ự ế ố ị ị ế ố ị ượ ể ứ ự
ế ứ ự ắ ị ng.
ế
c g i là trung v . N u ộ ố ọ
Do không th th c hi n các phép toán s h c trên các bi n s đ nh tính (danh đ nh và
ố ệ ủ
ỉ
th t ) chúng ta ch có th tính trung bình cho s li u c a bi n s đ nh l
ị ứ ở ữ ượ ọ
gi a đ
N u chúng ta s p x p s li u theo th t
, giá tr đ ng
ị
ủ
ị
có hai giá tr cùng đ ng ị
gi a, trung bình c ng c a hai giá tr này là trung v . ế ng là 120, 125, 130, ề
ị ủ ủ
ố ượ
ị ứ ở ữ ằ ố ệ gi a và b ng 130
ể ườ ủ ị ẽ ị ề
i là 153, 155, 160, 162, 165, 161. Ð tính
ế ố ệ
c tiên chúng ta ph i s p x p s li u này: 153, 155, 160, 161, 162,
ở ữ
gi a, trung v s là (160+161)/2 = 160,5 ế ố ệ
ứ ở ữ
ụ ố ệ Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t
ế
135, 150. Trung v c a huy t áp tâm thu là giá tr đ ng
ề
S li u v chi u cao (cm) c a 6 ng
ả ắ
ị ướ
trung v , tr
165. Do có hai giá tr 160 và 161 cùng
cm
ấ
i ta ch n con s th ng kê tiêu bi u là y u v (mode). Y u v là giá tr xu t ế ố ượ ng là 120, 125, 130, ợ ế ể ế ủ
ị
ng h p này không có y u v .
ị ủ
ể ế ế ể ị ị ị ấ ầ ệ ườ
ổ ế ọ
Ðôi khi ng
hi n ph bi n nh t (có t n su t cao nh t). ể
ộ ố ệ
ị
ế ố
ộ ế
ậ ể ị
ế
ủ ố ố ề ặ
i ta th ế
ợ ườ ỉ ng h p đ c bi t ế ố ị ượ ế ị ị ế ố ị
ố ỉ ằ ườ ườ ữ ặ ở ố ố
ấ
ấ
ề
ụ ố ệ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t
ườ
135, 150. Trong tr
ố ủ
ọ
Ði m s c a 5 h c sinh là 5, 5, 6, 7, 9. Y u v c a đi m s là 5.
ị
ụ ể
Trong m t s li u c th , có th không có y u v , có th có m t y u v ho c hai hay
ể
ườ
ườ
nhi u y u v . Ðây là khuy t đi m chính c a s th ng kê này. Do v y ng
ng
ệ
ặ
ch dùng trong các tr
ể ử ụ
Có th s d ng trung bình, trung v hay y u v cho bi n s đ nh l
ượ
l
khi đó ng ng. Khi bi n s đ nh
ấ
ng (hình chuông) thì ba con s này x p x b ng nhau và
ọ
ng tính trung bình b i vì trung bình có nh ng đ c tính toán h c ố
ng có phân ph i bình th
ườ
i ta th 44 ạ ế ố ệ ị ệ ể ả ố ị ị ị ộ ề ượ ụ ệ ờ ệ ượ
ệ ồ ệ
c đi u tr theo m t phác đ di
ể ừ
ậ
c theo dõi và ghi nh n th i gian k t
ờ Ở ệ ứ
ệ ừ ờ ả ứ ố ế
ư
ệ ự ệ ẩ
t vi khu n
ử
khi s
10 b nh nhân th i gian này
ị ế
ề
ự ả ố ị ủ ố ệ
ộ ớ ư ể ậ ở cách là m t bác sĩ lâm sàng t
ể ẽ ả ừ ố ệ
ố ằ
ụ ố ệ ị ệ ạ ố ẽ ị ả ưở ể ấ ị ố ệ
c g i là s ngo i lai (outlier) và làm s li u b l ch. Nhìn chung, khi s li u b l ch
ư
ả
ề
ng r t nhi u và không ph n ánh giá tr tiêu bi u nh ố ạ
ị
Thí d : B nh nhân b loét d dày tá tràng đ
ị ệ
ề
Helicobacter. Sau đi u tr , b nh nhân đ
ắ ầ ả
ụ
d ng thu c đ n lúc b t đ u c i thi n tri u ch ng đau.
ề
lúc đi u tr đ n
(ngày ) là nh sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. B nh nhân có th i gian t
ị
ớ
ứ
ấ
lúc gi m tri u ch ng là 30 ngày trên th c ch t là b nh nhân không đáp ng v i đi u tr .
ị
Trung v và trung bình c a s li u là 2 và 5 ngày. Con s trung v ph n ánh chân th c
ộ
ơ
h n b i vì v i t
s li u trên có th nh n xét r ng m t
ệ
b nh nhân tiêu bi u s gi m đau sau 2 ngày dùng thu c. Con sôs 30 trong thí d trên
ượ ọ
ị ệ
đ
ố
thì con s trung bình s b nh h
ị
con s trung v . ộ
m nh. Tuy nhiên n u s li u b l ch thì con s trung v ph n ánh giá tr tiêu bi u m t
cách chính xác h n.ơ ả ố ụ ố ạ ượ ử ụ ố ố ạ ệ ế
c s d ng trên 5 b nh nhân và huy t áp tâm thu sau khi dùng thu c
c s d ng trên 5 b nh nhân và có huy t áp sau ế
ả ạ
ố ố ạ
ư ệ
ả ủ ố ệ ươ ủ ế ở ố
ng (b i vì trung bình c a hai s li u là b ng nhau) nh ng k t qu c a thu c B phân ng đ
ơ ề ở ố ệ
Thí d : Thu c h áp A đ
ượ ử ụ
là 110, 115, 120, 125 và 130. Thu c h áp B đ
ư ậ
ử ụ
s d ng thu c là 100, 110, 120, 130, 140. Nh v y hai thu c h áp này có hi u qu h áp là
ằ
ươ
t
tán h n và đi u này làm thu c B tr nên kém an toàn. ứ ầ ố ả ố tính phân tán:
ọ
tính phân tán có t m quan tr ng th hai sau con s mô t khuynh h ướ
ng Th ng kê mô t
ả
Th ng kê mô t
ậ
t p trung. 2 n ộ ệ ứ ố ế ắ
t t t là SD hay s) là con s đánh giá m c đ ộ ẩ
ượ ứ Ð l ch chu n (standard deviation vi
phân tán và đ c tính theo công th c: i 1 (cid:0) ( (cid:0) (cid:0) s (cid:0) (cid:0) x
i
N x
)
1 ả ả ớ ị ộ ệ
ệ ẩ
ộ ệ ư ậ
ể ượ ụ ể ẩ ở
ể ự ạ ượ ể ự ư ặ ố ượ ng là 120, 125, 130, 135, 150. Trung ộ ệ ằ ẩ ủ
ế
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t
bình c a huy t áp là 132 và đ l ch chu n b ng 2 n ủ ố ệ
Nh v y đ l ch chu n ph n ánh kho ng cách trung bình c a s li u so v i giá tr tiêu
ỉ
ế ố ị
ng b i vì chúng
bi u. Khái ni m đ l ch chu n ch có th áp d ng cho bi n s đ nh l
ệ
ố ọ
ta có th th c hi n các phép toán s h c trên các đ i l
ng nh ng không th th c hi n
ế ố ị
trên các giá tr c a bi n s đ nh tính là các đ c tính.
ề ệ
ị ủ
ụ ố ệ
ế
ủ i 1 2 2 2 2 2 (cid:0) ( (cid:0) (cid:0) s (cid:0) (cid:0) x
i
N x
)
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 120( )132 125( )132 132( )130 135( )132 150( )132 (cid:0) (cid:0) 15 (cid:0) (cid:0) (cid:0) (cid:0) 144 49 324 (cid:0) (cid:0) (cid:0) (cid:0) 5,132 5,11 n 2 ủ ộ ệ 94
530
4
4
ươ
nguyên là bình ph
ệ
ể ượ ươ
ượ ươ
ươ ề ặ ừ
ng sai v m t t
ng sai (variance) có th đ ủ
ng c a sai bình ph
c kí hi u và Var hay s2 và đ ẩ
ng c a đ l ch chu n.
ứ
c tính theo công th c Ph
Ph
sau: s x n ( 2
) / ( )
1 x
i 1
ủ ố ệ (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) i
ạ
Ph m vi c a s li u là t
nh t.ấ ấ ả ị ủ ố ệ ừ ỏ ị t c các giá tr c a s li u t ị ớ
ấ ế
giá tr nh nh t đ n giá tr l n 45 ủ ề ế ố ượ ạ ng là 120, 125, 130, 135, 150. Ph m ụ ố ệ
ế ố ủ ế Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t
ế
vi c a bi n s huy t áp là 120 đ n 150. ố ụ ố ạ ượ ử ụ ệ ế ố ạ ệ
ượ ử ụ ế
c s d ng trên 5 b nh nhân và huy t áp tâm thu sau khi dùng thu c
c s d ng trên 5 b nh nhân và có huy t áp sau ố ơ ạ ỉ ừ ố
ổ ừ 100140 trong khi đó ph m v c a s li u thu c A ch t
v (interquartile): N u chúng ta chia s li u s p theo th t 110130.
ứ ự
ị ố
ố ệ ắ
ầ Thí d : Thu c h áp A đ
là 110, 115, 120, 125 và 130. Thu c h áp B đ
ạ
ố ệ ủ
ử ụ
s d ng thu c là 100, 110, 120, 130, 140. S li u c a thu c B có tính phân tán cao h n do ph m
ị ủ ố ệ
vi thay đ i t
ứ ị
ả
ầ
i s li u đ ầ ế ứ ị ị
v là kho ng cách c a trung v ph n trên và trung v ph n d ứ ị ướ
ị ủ ề
làm 2 ph n đ u
ầ
i. Trung
v trên (upper quartile) và trung v c a phân ủ
ượ ọ
c g i là t
ị ướ ố ượ
ng là 120, 125, 130, 135, 150. S li u
ầ ồ ố ệ
ị
c chia làm 2 ph n: ph n 1 g m 120, 125, 130 và ph n 2 g m 130, 135, và 150. Trung v ầ
ị ủ v là 125135. ầ ướ
ị ủ ả
Kho ng t
nhau, kho ng t
ị ủ
v c a ph n trên c a s li u đ
ướ ố ệ ượ ọ
d
ề ả
ủ ố ệ
c g i là trung v d
ế
ầ i (lower quartile).
ủ
Thí d : S li u v huy t áp tâm thu (mmHg) c a 5 đ i t
này đ
ủ
c a ph n trên là 125 trung v c a ph n d ồ
ứ ị
ạ
i là 135, do đó ph m t
ầ ố ệ
ứ ị
v là trung v c a ph n s li u trên và ph n s li u d
ưở
ả ả ả ở ị ị
ng b i các giá tr ngo i lai nh
ứ ị
ị ố
ườ ị ả
ư ủ ể ả ỉ ướ
ầ ố ệ
i,
ư
ạ
v ch có th áp ộ ệ
ượ ng hay th t ế ố ạ ố ụ ố ệ
ượ
ầ
ấ ủ
Do b n ch t c a kho ng t
ư
ứ ị
cũng gi ng nh trung v , kho ng t
v không b nh h
ợ
ẩ
trong tr
ng h p c a đ l ch chu n. Cũng nh trung v , kho ng t
ế ố ị
ụ
ứ ự
d ng cho bi n s đ nh l
.
ẩ
ả
ộ ệ
Có 3 th ng kê mô t
tính phân tán: đ l ch chu n, kho ng t
ượ
ả
ố
tính phân tán đ
Vi c l a ch n th ng kê mô t
ả
tính phân tán cho các lo i bi n s .
B ng 6. Ch n l a các th ng kê mô t ứ ị ả ạ ủ ố ệ
v và ph m vi c a s li u. ả c trình bày trong b ng 2. ố
ệ ự
ả ọ
ọ ự ườ ắ ị ứ ộ ố Tr ợ
ng h p t giá tr tiêu Th ng kê m c đ phân tác ố
Th ng kê tóm t
bi uể ộ ệ ẩ ố
ố
Phân ph i cân đ i Trung bình (mean) Ð l ch chu n (standard
deviation) ị ệ ố ứ ị Th ng kê b l ch ị
Trung v (median) v (interquartile) ạ ả
Kho ng t
Ph m vi (Range) ề ế ố ế ả ả
i k t qu : ử ọ
ỏ
Câu h i: Phân tích trên máy tính v bi n s hemoglobin cho k t qu sau. Hãy th đ c
ả ế
và lí gi
Variable | Obs Mean Std. Dev. Min Max
-----------+-----------------------------------------------------
hemoglobin | 70 11.98429 1.416122 8.8 15.1 ằ ệ ị ệ ố ượ ủ ẫ ậ
ng sau khi ph u thu t ượ ắ ế ừ ỏ ế ớ ụ ề ố ệ
c s p x p t ả ằ ị ệ
ườ ừ ậ ấ ố ị ứ ị ờ
Thí d v s li u b l ch: Th i gian n m vi n c a 17 đ i t
(đ
nh đ n l n) là:
3 4 4 6 8 8 8 10 10 12 14 14 17 25 27 37 42
ệ
ố
Phân ph i này b l ch nên con s th i gian n m vi n trung bình là 14,6 không ph i con
ợ
ố
s phù h p đo l
ng trung tâm. Ð đánh giá T phân ph i này ta nh n th y trung v là
10; t ố ờ
ể
i là 8. v trên là 17 và t ứ ị ướ
v d ể ố ị ệ ị ệ ườ ươ ợ ử ớ ố ệ
ủ ị ố ệ ọ ắ ơ ố ề ạ ng h p b l ch d
ả
ườ
ng đ
ầ ệ ử ụ ể ủ ơ ố ầ ườ ườ ệ ỉ Logarithm
ộ
ng là s
M t cách khác đ đ i phó v i s l ch b l ch, trong tr
ị
ụ
d ng logarithm (hay g i t
t là log) c a giá tr s li u thay vì dùng b n thân giá tr .
ượ ử ụ
ạ
c s d ng
Có nhi u lo i logarithms khác nhau. Logarithm c s 10 là lo i th
ự
ố ộ
ứ ể
trong quá kh đ nhân hay chia các con s m t cách nhanh chóng. G n đây do s phát
ở
tri n c a các máy vi tính và máy tính c m tay, vi c s d ng logarithms c s 10 tr nên
ọ
ơ ố
ị
ng ch dùng logarithms c s e (e=2,71) hay còn g i
b phôi pha. Hi n này ng i ta th 46 ọ nhiên do lo i logarithms này có m t s đ c tính toán h c đáng quý. ượ ườ ủ ộ ố ặ
ệ
c kí hi u ln(x).
ư ạ
ộ ố
ặ ng đ
ọ là logarithms t
ự
Logarithms t
ự
Logarithms t ự
nhiên c a m t s x th
nhiên có các đ c tính toán h c chính nh sau: ớ ln(xy)=ln(x) + ln(y)
ln(x/y)=ln(x)ln(y)
ln(xn)=ln(xx...x)=ln(x)+ln(x)+...+ln(x)=nln(x)
ỏ
ln(1+x)(x (v i x nh ) ằ ế ế ử ụ t ln(x) và mu n bi t x b ng bao nhiêu chúng ta s d ng hàm ị ệ ng h p s li u b l ch d ng, ng ườ
ố ệ ủ ố ệ
ể ấ
ệ ố ủ ủ ệ ở ạ
l ươ
ị ờ
ằ
ệ
ệ ụ ề ờ
ờ
ủ ủ
ằ ằ
ằ ấ ấ
ủ ố
ớ ệ ằ ầ ờ ố ị ị ộ ố ơ ố
ế
N u chúng ta đã bi
ọ
antilog(x) hay còn g i là hàm exp(x).
ườ
ợ ố ệ
Trong tr
i ta l y log c a s li u và tính trung bình
ằ
ượ ọ
ủ
c g i là
c a log s li u. Sau đó tính giá tr th i gian n m vi n tiêu bi u (con s này đ
ố ệ
ấ
trung bình nhân geometric mean) b ng cách l y antilog c a trung bình c a log s li u.
Tr
i thí d v th i gian n m vi n c a 17 b nh nhân. Sau khi l y log chúng ta có
trung bình c a log th i gian n m vi n b ng 2,41 và l y antilog c a s này chúng ta có
ủ
trung bình nhân c a th i gian n m vi n là 11,13. Con s này g n v i giá tr trung v là
10 h n con s trung bình c ng là 14,6 ể ồ ồ ị ể ượ ướ ạ ặ ặ ồ c trình bày d ệ ệ ố ấ ồ ị
ể ụ ụ ả ồ ướ ạ ể ể ồ ụ ế ồ ế ố
ặ
ế ố ướ ạ ể ặ i d ng t ồ ị
Bi u đ và đ th
ể
ố ệ
i d ng đ th ho c bi u đ . M c dù không có
S li u cũng có th đ
ọ
ớ
i tuy t đ i hoàn toàn rõ r t, nói chung đ th (graph) có tính ch t toán h c
ranh gi
ơ
ề
nhi u h n, trong đó có tr c hoành và tr c tung còn bi u đ (chart) là hình nh mang tính
ư
ấ ượ
ch t t
ng tr ng.
ế ờ ạ
ế
i d ng bi u đ hình thanh (bar chart
N u bi n s là bi n r i r c, có th trình bày d
ố
ế ố
ế
ể
hình 1) ho c bi u đ hình bánh (pie chart). N u bi n s là bi n liên t c, thì phân ph i
ầ
ổ ứ ồ
ủ
ch c đ (histogram hình 2) ho c đa giác t n
c a bi n s có th trình bày d
su t.ấ ể ồ 50 40 45 30 20 24 10 0 Nam Nö õ ể ồ ả ố ớ ủ ữ ọ ườ phân b gi i tính c a nh ng h c sinh trong tr ầ
ng m m Figure 2. Bi u đ hình thanh (bar chart) mô t
non 23/11, Hóc môn ồ ể ố ủ ể ể ằ ồ s phân b c a bi n s r i r c. Bi u đ ữ ồ
ế ố ị ủ ề ẽ i ta v các thanh có chi u cao t l ầ ư ữ ả ố Bi u đ hình thanh
ồ
ả ự
ế ố ờ ạ
Bi u đ hình thang là bi u đ nh m mô t
ớ ừ
ế ố Ứ
ị ủ
ụ
ị
hình thanh g m có tr c hoành trên đó xác đ nh nh ng giá tr c a bi n s . ng v i t ng
ị
ấ ủ
ỉ ệ ớ ầ
ườ
giá tr c a bi n s ng
v i t n su t c a giá tr đó.
C n l u ý luôn luôn có kho ng tr ng gi a các thanh. ụ ư ự ề ể Chúng ta cũng có th xây d ng các thanh theo chi u ngang nh trong ví d sau 47 S inh mo å 57 S inh fo rce ps 65 S inh thö ô øng 478 0 100 200 300 400 500 ươ ẻ ạ ệ ệ Figure 3. Ph ủ
ng pháp sinh c a 600 tr sanh t i b nh vi n X trong năm 1998 2 0 0 0 át a u s àn a 1 0 0 0 T 0 m u ø c h ö õ c a áp 1 c a áp 2 - 3 ñ a ïi h o ï e d u m a t ộ ọ ấ ủ ứ ẹ Figure 4. Trình đ h c v n c a các bà m trong nghiên c u ế ố ứ ự ề ầ ư ế ố ị ủ ả ượ ẵ ế , đi u c n l u ý là các giá tr c a bi n s ph i đ c s p x p th ứ ố ớ
Ð i v i bi n s th t
ụ
ự
theo tr c hoành.
t ể ồ ể ồ ể ế ố ờ ạ ể ị ủ c chia làm nhi u cung t ố ủ
ả ự
s phân b c a bi n s r i r c. Bi u đô
ế
ớ
ươ ứ
ề
ng ng v i các giá tr c a bi n c dùng đ mô t
ượ
ỉ ệ ớ ầ ấ ủ Bi u đ hình bánh
ượ
Bi u đ hình bánh cũng đ
ộ
hình bánh là m t vòng tròn đ
ố ộ ớ ủ
s . Ð l n c a cung t l ị ế ố
v i t n su t c a giá tr bi n s . Nö õ 35% Nam 65% 48 ể ồ ả ố ớ ủ ữ ọ ườ phân b gi i tính c a nh ng h c sinh trong tr ầ
ng m m Figure 5. Bi u đ hình bánh (pie chart) mô t
non 23/11, Hóc môn S in h m oå S in h forc e p s S in h th öô øn g ể ệ ể ồ ươ ứ ủ ẻ ng pháp sinh c a 600 đ a tr sinh t ạ ệ
i b nh Figure 6. Bi u đ hình bánh th hi n ph
vi n Xệ ầ ổ ứ ồ ấ ơ ồ ộ 2 0 1 5 y c n e u 1 0 q e
r F 5 0 8 9 1 0 1 4 1 5 1 6 1 1 1 3 1 2
h e m o g l o b i n ượ ả phân b ụ ứ ồ
ố
ế ầ
ứ ồ ch c đ , ng
ữ ườ
ả ấ ủ ị ị ả
ẽ Ứ ữ ả ỗ ị ộ ủ
ữ
ườ
ớ
trên tr c hoành. ng v i m i kho ng giá tr ng
ở
ấ ủ ả ậ ủ ổ ứ ồ ữ ằ ch c đ cũng th T ch c đ , đa giác t n su t, s đ h p.
ố
ấ
ổ
c dùng trong mô t
T ch c đ (histogram) và đa giác t n su t (polyline) đ
ề
ị
ể ẽ ổ
ủ
i ta chia biên đ c a giá tr làm nhi u
c a bi n s liên t c. Ð v t
ầ
ị
ả
kho ng giá tr và tính t n su t c a nh ng kho ng giá tr đó. Nh ng kho ng giá tr này
ụ
ị ở
ể
ượ
i ta v nh ng hình
đ
c bi u th
ị
ả
ị
ỉ ệ ớ ầ
ệ
ậ
ữ
ch nh t có di n tích t l
v i t n su t c a kho ng giá tr đó. B i vì các kho ng giá tr
ằ
ườ
ụ
ng n m
này n m sát nhau trên tr c hoành, các hình ch nh t c a t
sát nhau. 49 2 0 1 5 y c n e u 1 0 q e
r F 5 0 8 9 1 0 1 4 1 5 1 6 1 1 1 3 1 2
h e m o g l o b i n ấ ủ ủ ầ ụ ữ
Figure 7. Ða giác tu n su t c a hemoglobin c a 70 ph n . 1 5 1 0 5 0 8 9 1 0 1 4 1 5 1 6 1 1 1 3 1 2
h e m o g l o b i n ầ ấ ườ ườ ể ố ng v t i ta th
ậ ư ủ ể ẽ ề ấ ể
ố ủ ẽ ổ ứ ồ
ủ
ể ẽ
ch c đ và n i các trung đi m c a các
Ð v đa giác t n su t, ng
ổ ứ
ẹ
ườ
ấ
ầ
ữ
ạ
c nh trên c a các hình ch nh t. Ða giác t n su t th
ch c
ng không đ p nh các t
ộ ồ ị ể ễ
ầ
ư
ồ ư
đ nh ng nó có u đi m là có th v nhi u đa giác t n su t trên cùng m t đ th đ d
so sánh các phân ph i c a chúng. 50 ụ ữ ủ ầ ấ ườ ụ ữ ơ ỏ ng đ ) so v í 42 ph n trung bình và ườ Figure 8. Ða giác t n su t hemoglobin c a 28 ph n nghèo (đ
khá (đ ng xanh) hem 16 15 14 13 12 11 10 9 8 ộ ủ ơ ồ ở Figure 9. S đ hình h p c a hemoglobin ụ ữ
70 ph n . ượ ử ụ ể c s d ng đ mô t
ồ ứ ị ườ ạ ữ
ứ ị ướ
v d ộ
i là t ạ
ọ ủ ơ ồ ộ ố ề ứ ị ướ ớ ị ự ể ị ự ạ ơ ồ ộ
ố ủ
ả ự
s phân ph i c a
Ngoài ra còn có s đ h p (boxplot) cũng đ
ẳ
ạ
ậ
ơ ồ ộ
ượ
ế ố ị
ng (xem hình 8). S đ h p g m m t hình ch nh t và 2 đo n th ng
bi n s đ nh l
ằ
ộ
ướ
ứ
đ ng. Hình h p có c nh trên là t
i. Ð ng n m trong
v trên, c nh d
ị ứ ị
ị
ườ
ộ
hình h p là đ
v trên
ng đi qua trung v . Hai thanh d c c a s đ h p n i li n giá tr t
ớ
v i giá tr c c đ i va t i v i giá tr c c ti u. v d ọ ự ơ ồ ể ả ố ệ ể ồ ị ế ố ằ
ề ặ
ủ ệ
ượ ể
ự
c s d ng đ so sánh s khác bi
ế ố ị
ng (bi n s đ nh l
ệ ể
ạ ượ
ụ ử ụ ượ ồ c s
c trình bày trong 5. So sánh các nhóm
ặ
M c dù trên kinh đi n, bi u đ hình thanh nh m trình bày s li u đ nh tính, nó cũng
ủ ế
ượ ử ụ
ị
t v đ c tính (ch y u là bi n s nh giá) hay
đ
ả
ể ượ ử
trung bình đ i l
ng) c a các nhóm. B ng cũng có th đ
ả
ể
ụ
d ng cho m c đích này. Vi c so sánh s d ng bi u đ hay b ng đ
ố ệ
Table 5. Ch n l a s đ thanh hay b ng đ trình bày s li u ế ố ầ Bi n s c n so sánh ượ Danh đ nhị Th tứ ự ị
Nh giá ị
Ð nh l ng ế
ố
S bi n
ố
s
phân
lo iạ ề ề ề 1 ả
ể ả
ể ả
ể B ng 1 chi u
ơ
ồ
Bi u đ thanh đ n B ng 1 chi u
ơ
ồ
Bi u đ thanh đ n ả
B ng 2 chi u
ồ
ể
Bi u đ thanh
ch ngồ ề
B ng 2 chi u
ồ
Bi u đ
thanh
chùm, thanh ph nầ
trăm ề ả ề ả ề ề 2 B ng 3 chi u B ng 3 chi u ả
ể ả
ể B ng 2 chi u
ồ
Bi u đ thanh chùm B ng 2 chi u
ồ
Bi u đ thanh chùm 51 ụ ộ ố ọ ề ể ố ệ
ề ữ
ỉ ấ ỡ ẻ ứ ự ệ ề ẫ
ồ ờ ế ố ễ ế ả ơ ề
ỡ ẻ ệ ử ụ ế ố ạ ố M t s thí d sau minh h a v cách trình bày s li u đ so sánh gi a các nhóm:
Table 6. Nghiên c u th c nghi m ng u nhiên v cách đ đ và t su t lây truy n HIV
trong th i kì chu sinh (n=370) (Ngu n: The European Mode of Delivery Collaboration,
ị
Lancet, 27/3/1999) Ðây là b ng 2 chi u so sánh bi n s nguy c lây nhi m (bi n nh
giá) theo hai bi n s phân lo i: cách đ đ và vi c s d ng thu c phòng. Cách đ đỡ ẻ Dùng ZDV1 Không dùng ZDV ườ ạ Ð ng âm đ o 0.043 0.195 ổ ấ M l y thai 0.008 0.039 1 ZDV: Zidovudin 300 mg u ng ngày 2 l n t
300 mg m i 3 gi ầ ừ ố ể ạ ầ ế
36 tu n thai cho đ n lúc chuy n d và ể ạ ờ ỗ trong lúc chuy n d 25% 19.5% 20% Ñö ô øng aâm ñaïo 15% Mo å laáy thai 10% 4.3% 3.9% 5% 0.8% 0% Duøng ZDV† Kho âng duøng ZDV 80% S DD Naëng S DD Vö øa 60% S DD nhe ï 40% 20% 0% 05 611 1217 1823 2435 3648 ỡ ẻ ự ứ ề ề ẫ ệ
ể ờ ồ ỉ ấ
Figure 10. Nghiên c u th c nghi m ng u nhiên v cách đ đ và t su t lây truy n HIV
trong th i kì chu sinh (n=370). Bi u đ hình thanh chùm (clustered bar) ỉ ệ ưỡ tr em Thái lan nông thôn và thành th theo tu i và đ ng ổ
ạ ị
ố ế suy dinh d
ồ
ể
ế ố ứ ự ở ẻ
ồ
ế ố ạ ổ ộ ộ
Figure 11. T l
ọ
ầ
tr m tr ng Bi u đ hình thanh ch ng (stacked bar) so sánh bi n s tình tr ng dinh
ưỡ
d ng (bi n s th t ) theo m t bi n s phân lo i nhóm tu i. 52 Gaùnh naëng beänh taät theo nhoùm tuoâæ 100% 90% 80% BENH KHA 70% UNG THU 60% TM 50% TU TU 40% TAI NAN NT KHAC 30% C HU SINH 20% 10% 0% 0-4 5-14 15-29 30-49 50-59 60+ ừ ồ ế ố ộ ể
ồ ầ
ơ ầ ử ế ố ơ ấ ử
vong trong t ng nhóm
ạ
ị
vong (bi n s danh đ nh) theo m t bi n s phân lo i ổ
ứ ạ ệ ướ xã ch ng và xã can thi p tr ở
ẻ
ng tr em
ế ố ứ
ạ ưỡ ề ế ố ự
c và sau th c
ng theo hai bi n s phân ệ ự
ạ ế ố ờ ế ố Figure 12. Bi u đ thanh ph n trăm (percent bar chart) c c u t
ể
tu i. Bi u đ so sánh c c u t
ổ
là l a tu i.
ưỡ
Table 7. Tình tr ng dinh d
ả
hi n d án (B ng 3 chi u so sánh bi n s tình tr ng dinh d
lo i: bi n s xã và bi n s th i gian) 1997 2000 ạ ưỡ Tình tr ng dinh d ng Xã ch ngứ Xã can thi pệ Xã ch ngứ Xã can thi pệ ưỡ Suy dinh d ộ
ng đ 3 4 (2%) 0 (0%) 1 (1%) 2 (3%) ưỡ Suy dinh d ộ
ng đ 2 21 (9%) 7 (7%) 1 (1%) 5 (7%) ưỡ Suy dinh d ộ
ng đ 1 60 (25%) 26 (28%) 22 (31%) 24 (34%) Bình th ngườ 153 (64%) 61 (65%) 43 (60%) 45 (63%) ổ ố T ng s 238 (100%) 94 (100%) 72 (100%) 71 (100%) ớ ố ế ế ế ố
t các bi n s sau: gi i tính, nhóm máu, huy t áp, có cao huy t áp, s ng hay ộ ạ ế ạ ạ ế ử ạ ủ ộ
ể
ệ ườ ủ ệ ộ ưỡ
ng ệ
ẹ ự
ữ ữ ẹ ệ ế ố ế ế ố ủ
ậ ạ ộ ị ế ố ộ ậ ạ ẽ ế ố ạ ậ ộ ị ể ẩ ủ
ườ ể
ườ ế ươ ầ
ồ ư ể ẫ ộ ử ụ
ủ
ng c a m t m u g m 8 ng ộ ệ
ủ
ng c a 8 ng Bài tập
ế
1. Cho bi
ế ố
ộ
ch t, đ suy tim theo phân lo i c a h i tim m ch NewYork thu c lo i bi n s nào?
ề
i đi u d
2. N u b n th c hi n th nghi m đ đánh giá tác đ ng c a vi c ng
khuyên cho bú s a m lên thành công c a vi c bú s a m . .
ộ
ạ ẽ
a. Bi n s k t cu c nào b n s ghi nh n? Bi n s đó thu c lo i nào? Nó có các giá tr
nào?
a. Bi n s đ c l p nào b n s ghi nh n? Bi n s đó thu c lo i nào? Nó có các giá tr
nào?
ế
3. S d ng máy tính c m tay đ tính trung bình và đ l ch chu n c a th tích huy t
ươ
t
i này là nh sau:
i. Th tích huy t t
2,75 2,86 – 3,37 – 2,76 – 2,62 – 3,49 – 3,05 – 3,12. 53 ộ ố ụ ữ ạ ừ ở ế
1935 đ n 1944 ỏ ấ
ử ụ ừ ả ổ ượ
4. M t s ph n sinh trong giai đo n t
c
ề ổ ắ ầ ậ
ph ng v n v tu i b t đ u l p gia đình. Phân ph i t n su t v tu i b t đ u l p gia
ượ
đình, s d ng t ng kho ng hai năm tu i, đ Uganda đã có gia đình, đ
ề ổ ắ ầ ậ
ấ
ở ướ
d ố ầ
c trình bày i; ầ ầ Kho ngả T n su t ấ
ấ T n su t lũy tích 910.9 5 5 1112.9 11 16 1314.9 18 34 1516.9 28 62 1718.9 8 70 1920.9 7 77 2122.9 4 81 2324.9 5 86 2526.9 2 88 2728.9 0 88 2930.9 1 89 3132.9 0 89 3334.9 1 90 ỏ ố ầ ấ
c ph ng v n
ướ
ẽ ổ ứ ồ ủ ầ ể ổ
c 19 tu i
ấ
ch c đ c a phân ph i t n su t
ử ụ
ố ệ
ng cong t n suât tích lũy cho s li u này và s d ng chúng đ tính trung v và t v trên, d i.
ộ ủ ả ị ệ
ố ừ ả b ng này? ố ầ
ấ
c phân ph i t n su t này b l ch ph i?
ủ
c trung bình c a phân ph i t Bài gi ị ồ ế ố ế ế ố ớ i tính, s ng hay ch t, có cao huy t áp hay không ạ ủ ộ ạ ộ ng: huy t áp ế
ệ ườ ủ ử ệ ề
i đi u d ẹ ể ươ ộ ẹ
ế ố ế
ể ữ
ể ọ
ộ ượ ị ữ
ng án đ ch n bi n s k t cu c và bi n s đ c l p:
ế ố ế
ằ ộ
ủ
ệ
ế ố ộ ậ
ẹ
ẹ ượ ế
ế
ế ị
ị ẹ
ư ế ẹ ớ ị ẹ ậ ồ c ng c ghi nh n bao g m ng
ẹ
ẻ ề ẹ
i m có đ
ị ố ộ ậ
ụ ứ ườ
ế ượ
ớ ụ ữ ượ
a. Có bao nhiêu ph n đ
ụ ữ ậ
b. Có bao nhiêu ph n l p gia đình tr
ử ụ
ố ệ
c. S d ng s li u này, v t
ẽ ườ
d. V đ
ướ
ứ ị
ị
ố
ẽ ơ ồ
e.V s đ hình h p c a phân ph i
ế ượ
d. Làm sao chúng ta bi
t đ
ượ
e. Làm sao chúng ta tính đ
iả
1. Bi n s nh giá bao g m: gi
ế ố
Bi n s danh đinh: nhóm máu
ế ố ứ ự
: đ suy tim theo phân lo i c a h i tim m ch NewYork.
Bi n s th t
ươ
ế ố ị
Bi n s đ nh l
ưỡ
ể
ệ
ể ự
2. Đ th c hi n th nghi m đ đánh giá tác đ ng c a vi c ng
ng
ề
khuyên cho bú s a m lên thành công c a vi c bú s a m có th có nhi u
ph
ớ ơ
ờ
ng v i đ n
a. Bi n s k t cu c có th là: th i gian m cho con bú (bi n đ nh l
ị
ẻ
ị
c cho bú m hay không (bi n nh giá có giá tr là
v tính b ng tháng); tr có đ
ượ
ị
ẻ
có hay không); tr có đ
c bú m đúng cách hay không (bi n nh giá có giá tr là
ị
ẻ ượ
c nuôi nh th nào (danh đ nh v i 3 giá tr : bú m hoàn
có hay không); tr đ
ẹ
toàn, bú m không hoàn toàn, không bú m ).v.v
ượ
a. Bi n s đ c l p đ
ưỡ
d ề
ế
ườ
i đi u
ị
ng giáo d c s c kho v bú m hay không (bi n nh giá v i 2 giá tr có và 54 ệ ườ ượ ụ ứ c thông đi p giáo d c s c kho t ổ ạ ấ ứ ậ
ẹ
i m nh n đ
ị
ớ ơ ỉ ấ ấ ượ
ị ấ ể ắ ằ ườ ể ẩ ủ ể ể ử ụ
ế ươ ộ ệ
ị ộ ầ
ẫ
ng c a m t m u g m 8 ng c ượ ‘ x=3.0571 s=0.29176 n=7 ỏ ấ
c ph ng v n
ổ
ướ
c 19 tu i
ẽ ổ ứ ồ ủ ố ầ ử ụ ẻ ừ
ườ
ờ
ng
i
không); th i gian ng
ẻ
ế
ị
ưỡ
ề
ng (đ nh l
ng v i đ n v là bu i); lo i hình tham v n s c kho (bi n
đi u d
ớ
ứ ự ớ
th t
v i 3 giá tr : ch cung c p thông tin; cung c p thông tin cùng v i trình
ẹ
ễ
ễ
di n; cung c p thông tin, trình di n và có ki m tra đ ch c r ng ng
i m đã
hi u)ể
3. S d ng máy tính c m tay đ tính trung bình và đ l ch chu n c a th tích
ườ ớ
ồ
ủ
huy t t
i v i các giá tr : 2,75 2,86 – 3,37 – 2,76
– 2,62 – 3,49 – 3,05 – 3,12, ta đ
4.
ụ ữ ượ
a. Có 90 ph n đ
ụ ữ ậ
b. Có 70 ph n l p gia đình tr
ố ệ
c. S d ng s li u này, v t ấ
ch c đ c a phân ph i t n su t 3 0 2 5 2 0 Tần suất 1 0 5 0 9 -1 0 .9 1 1 -1 2 .9 1 3 -1 4 .9 1 5 -1 6 .9 1 7 -1 8 .9 1 9 -2 0 .9 2 1 -2 2 .9 2 3 -2 4 .9 2 5 -2 6 .9 2 7 -2 8 .9 2 9 -3 0 .9 3 1 -3 2 .9 3 3 -3 4 .9 ử ụ ể ầ ướ ứ ị ố ệ
ườ
d. Đ ng cong t n suât tích lũy cho s li u này và s d ng chúng đ tính trung
v trên, d i. ị
v và t 55 100 90 80 70 7 5 60 50 5 0 40 30 2 5 20 10 0 0 9 11 13 15 1 7 19 2 1 2 3 25 2 7 29 31 33 35 34 10 ộ ủ ố
e.V s đ hình h p c a phân ph i ẽ ơ ồ
age ể ế ố ị ệ ả ự
ể
ể ố
ả ử ụ ế ế ổ ứ ồ
ệ
ch c đ
t phân ph i này là l ch ph i d a vào t
f. Chúng ta có th bi
ự
ộ
e. Do phân ph i này b l ch chúng ta không th tính trung bình m t cách tr c
ổ
ti p mà ph i s d ng phép bi n đ i logarithem đ tính trung bình nhân 56 Ự Ế Ỉ Ệ Ủ Ẫ S BI N THIÊN M U C A T L ả ử ụ ể ố ị ượ ươ ủ ề ọ
ng pháp chính s d ng trong phân tích th ng kê: ki m đ nh và ướ
c ứ
c hai ph ệ ố ượ ủ ẩ ố ị c đ nh nghĩa c a sai s chu n và phân bi ộ ệ
ẩ
t sai s chu n và đ l ch ủ ế ẫ c ý nghĩa c a bi n thiên m u ứ ượ
ượ ứ ố ẩ ủ ỉ ệ ậ ủ ỉ ệ ả 1. Mục tiêu
Sau khi nghiên c u ch đ h c viên có kh năng:
Nêu đ
ngượ
l
Trình bày đ
chu nẩ
ậ
Nh n th c đ
Trình bày đ c công th c tính sai s chu n c a t l và kho ng tin c y c a t l . ặ ữ ị ự ườ ườ i này sang ng ế ố ị
ườ
ng ỉ ạ ự ị
i khác. Trong s li u đ nh tính không có s đo l
ộ ng) mà ch có s phân lo i m t đ i t ườ ộ ố ượ
ể ạ
ộ
ng thu c vào m t trong hai lo i:
ề ố ố
ặ ệ
i s ng hay b nh ạ
i ta có th phân lo i các đ c tính v l ư
t nh : ỏ ố ố ố ươ ệ ễ ng tính, âm tính
ờ ệ
ề ử ồ ệ ơ ị ư ạ ố ượ ử ứ ng theo ể
ố ồ ơ ị ố
ế ữ ề ả ọ ỏ ị ả ế ố ị ượ c chia nhóm đ t o ra bi n s đ nh tính:
ặ
ố ượ
ng cũng đ
ỉ ị
ng đ nh l
ố ể ạ
ệ ươ ề ả 2. Biến số định tính, biến số nhị giá
ổ
Bi n s đ nh tính (qualitative variable categorical variable) là nh ng đ c tính thay đ i
ố ệ
ừ
t
ng (đ nh
ượ
l
ứ
Trong nghiên c u quan sát ng
ậ
t
a. Thói quen hút thu c lá: không hút, b hút, đang hút thu c lá
b. Thói quen ăn u ng: ăn chay, không ăn chay
c. Xét nghi m máu phát hi n nhi m HIV: d
d. Đo ECG phát hi n ti n s nh i máu c tim: Không, nghi ng , xác đ nh
e. Ung th trong 10 năm theo dõi hay không: Có, không
ệ
Trong nghiên c u th nghi m lâm sàng, có th phân lo i đ i t
ế
f. S ng còn h n 1 năm sau khi b nh i máu: s ng, ch t
g. K t qu lâm sàng sau đi u tr kháng sinh viêm h ng, amydale: ch a kh i, thuyên
ớ
gi m, không b t
ườ
Ðôi khi các đo l
ố
a. U ng r u: không, u ng th nh tho ng, u ng đ u, nghi n n ng ‡ ườ 140 mg/100mL) hay không ố ượ ế ố ị ể ườ
ượ c mô t ậ ấ ả ằ
ề ố ố
ỏ thanh niên b hút thì chúng ta bi ượ ố ế ượ
t đ
ế
c khi bi ị ủ
b ng (s giá tr c a
ố
s chúng ta thu th p thông tin v thói quen hút thu c
ỉ ầ ỉ ệ
ố ủ
c phân ph i c a
ỉ ệ
t hai t l
ị ẽ ỉ ậ
ị ế ố ế ố
ế
ỉ
c g i là bi n s nh giá (binary variable). Nh v y, vì bi n s nh giá ch có 2 ế ố
ầ ố ỉ ệ ộ ị
(ho c m t con s ph n trăm).
ượ b ng m t con s t l
ộ ề ể
thanh niên không hút thu c là có th tính đ
ế ố ị
ư ậ
ộ
ưỡ
ng đ
ố ẻ ượ ộ
ố ồ ế
ề ẻ ị ố
ẻ
c ti n hành trên 1503 tr
c đi u tra có 494 tr b suy i thành ph H Chí Minh. Trong s tr đ ưỡ ỉ ệ ẻ ị ưỡ ổ ạ
i 5 tu i t
ẹ
ng nh cân.
tr b suy dinh d ẹ
ng nh cân = ưỡ ẻ ị ế
ng: có (đ
ng huy t lúc đói
b. Ti u đ
ố ủ
ư
c trình bày phân ph i c a bi n s đ nh tính đ
Nh đã đ
ụ
ầ
ả ử
ế ố
bi n s 1) t n su t. Thí d , gi
ỏ
ị
lá (có 3 giá tr không hút, b hút và hút thu c) trên thanh niên, chúng ta ch c n t l
ỉ ệ
thanh niên hút thu c lá và t l
ỉ ệ
ố ệ
s li u này (t l
kia).
Trong bài này chúng ta s ch t p trung chú ý đ n bi n s đ nh tính có 2 giá tr . Bi n s
ọ
ượ
này đ
ị
ặ
ả ằ
ỉ ầ
giá tr nên ch c n mô t
ụ
Thí d : Vào quý 3, 1994, m t cu c đi u tra dinh d
ướ
em d
dinh d
T l
ầ
Trình bày theo cách khác, ph n trăm tr em b suy dinh d ng là 32,9 % ườ ể ộ ậ ậ ư ạ ố ợ
ố ệ ả ủ 4. Ðại cương về mẫu và phương pháp lấy mẫu
ứ
Trong nghiên c u, chúng ta th
ố ượ
ị
đ nh các đ i t ng nh ng chúng ta l ấ
ố ệ
ỉ
ng ch có th thu th p s li u trên m t t p h p nh t
ế
i mu n khái quát hóa k t qu c a các s li u và 57 ợ ố ơ ớ ậ ượ ậ
ố ụ
c thu th p s li u đ ế ứ ả ủ ẫ
ụ ượ ọ ộ
ố ệ
ố ố ượ
ố ộ
ng
ứ
ọ
c g i là m u (sample) hay dân s nghiên c u (study
c g i là dân ố ợ ả ậ ố ượ ứ
ng mà chúng ta mu n các thành qu nghiên c u ẫ ượ ố ụ
ụ
c áp d ng vào
ứ ố ượ ậ
c g i là m u): t p h p các đ i t ặ
ng có các đ c tính hay ậ ng đ ợ
ọ
ứ
c thu th p trong quá trình nghiên c u.
ọ ư ụ ệ ấ ố ủ
ớ ố ụ ả ẫ ố ố ệ ủ
ề ỡ ẫ ứ
ộ ế ị ươ ệ ế ố ố ượ ự c r ng n u s đ i t ớ ơ ế ỉ ệ ưỡ ở ẻ ướ
d ng tr ẫ
ả
ướ ượ
c l
suy dinh d
ẻ i 5 tu i
ưở ồ
ỉ ệ ẻ ế ư ề (n u 1000 tr ế ả ế
ồ
ủ ề ế ủ ẫ áp d ng chúng cho m t dân s r ng l n h n. Trong th ng kê, t p h p các đ i t
ượ
đ
ố
population). Dân s mà chúng ta mu n áp d ng k t qu c a nghiên c u đ
ố ụ
s m c tiêu (target population)
Dân s m c tiêu: t p h p các đ i t
ượ
đ
ố
Dân s nghiên c u (còn đ
ượ
ạ ượ
đ i l
ị
ể
ể
Có th nói đi m m u ch t c a nghiên c ú khoa h c là làm sao vi c áp d ng có giá tr
ế
ệ
các k t qu nghiên c u (v i các s li u c a m u) lên dân s m c tiêu. Mu n cho vi c
ữ
ả
ệ
ụ
áp d ng có giá tr m t trong nh ng đi u ki n tiên quy t là c m u (sample size) ph i
ả
ạ
ủ ớ
ng pháp m u ph i có tính đ i di n.
đ l n và ph
ậ
ề
ẫ
ằ
ượ ằ
ng trong m u càng nhi u
B ng tr c giác chúng ta c m nh n đ
ậ
ụ ế
ỡ ẫ
ng chúng ta càng có tính tin c y cao h n. Thí d n u
(c m u càng l n) thì
ế
ổ ở
ố
TP H Chí Minh. N u
chúng ta mu n bi n t l
ượ ắ
ỉ ề
c l m.
ng vào t l
tính đ
chúng ta ch đi u tra trên 10 tr thì chúng ta không tin t
ẻ ướ
ệ
ạ
ẻ
i 5
này đ i di n cho các tr
Nh ng n u chúng ta đi u tra 1000 tr
d
ậ
ả
ượ
ả
ủ
c. Ðó là c m nh n
c a TP H Chí Minh) thì chúng ta khá tin vào k t qu kh o sát đ
ự
tr c giác c a chúng ta v bi n thiên c a m u. ộ ề s chúng ta ti n hành m t cu c đi u tra t l p ệ suy dinh d ằ ỉ ệ
suy dinh d
ố
ng trong dân s này là
ể ề ượ ộ
ưỡ
ố
ọ ẫ ố ố ẻ
ưỡ
ng trên dân s tr em.
ộ
ọ
ế
. N u chúng ta ch n m t
ưỡ
ng này
ợ
ườ
ng h p suy dinh d ằ
ằ ưỡ ỉ ệ
c phát hi n là suy dinh d 1, p2, p3,....) t ệ
ẽ ồ ẻ ượ
c nghiên c u b ng cách chia s tr
đ
ượ
ỉ ệ
c kí hi u b ng p. Nói chung t l
này đ
ố p
trong dân s ẫ
ứ ề
ẫ m u (p ộ ứ
ị
ố ệ ể p ố ẻ
ứ
ỉ ệ
ệ
ẫ
ế
và n u chúng ta có nhi u m u
ươ
ớ
ng ng v i các m u khác
ố
ố ằ
trong dân s đích, là m t tham s h ng đ nh và chúng ta mu n
ộ
ỉ ệ
trong m u luôn luôn dao đ ng và là s li u đ chúng ta có
ề ỉ ệ ế
ể ậ ố 5. Kí hiệu
ế
ả ử
Gi
ỉ ệ
Chúng ta kí hi u t l
ẫ
ẻ
cách ng u nhiên n tr trong dân s đó nh m tìm hi u v tình hình suy dinh d
ậ
ứ
ẻ
ợ
thì t p h p n tr em này đ
c g i là dân s nghiên c u (hay m u). Trong tr
ỡ ẫ
này c m u là n.
ưỡ
ng trên n tr
Chúng ta tính t l
ượ
ng cho n. T l
đ
ấ ớ ỉ ệ
trong m u p s không đ ng nh t v i t l
ẽ
ề ỉ ệ ẫ
nghiên c u chúng ta s có nhi u t l
i ạ p
ố
ỉ ệ
nhau. Tóm l
là t l
ẫ
t trong khi đó, p là t l
bi
ế
th rút ra các k t lu n v t l trong dân s đích . 6. Biến thiên mẫu nhị thức p ỉ ệ ưỡ ộ s trong dân s đích có t l ng ẻ ố
ử ụ ẻ ấ ậ ạ ế suy dinh d
ị ứ
ố
ng. Chúng ta không l p l ế
ượ
ở
i tính toán
ỡ ẫ ươ ứ ưỡ ẻ ả ả ử
Gi
ồ
g m n tr em và s d ng phân ph i nh th c chúng ta tính đ
ẻ ị
đó có x tr b suy dinh d
ượ
ấ
tính xác su t kh o sát đ ưỡ
c x tr suy dinh d ẫ
ấ
= 30. N u chúng ta l y m t m u
c xác su t trong n tr em
ả
ư
đây nh ng k t qu
ng ng là 5, 20, và 50. n khi c m u t 58 ư ừ ế ưỡ b suy dinh d c quan tâm) có ậ ưỡ ỉ ệ ng (đây là bi n c đ
ở ng suy dinh d ậ
ấ ố ẻ ị
ng t p trung chung quanh t l ố ể ả
ố
ướ
ỡ ẫ p ố ư ủ ớ ề ưỡ ố ượ
ế
ố
dân s đích = 0,3
ưỡ
ấ ố ẻ ị
ố
ng có th không cân đ i
ố ứ
ấ
5) thì phân ph i xác su t có tính đ i x ng và có
ấ
ầ
ng t n su t ế ố ắ ưỡ ố ẻ ị
ườ
ng.
ệ p ế ố
ố
ớ ỉ ệ
ng m u, kí hi u là p, s b ng v i t l
ắ ẽ ằ
ng chúng ta không may m n nh ị ủ ố p ườ ể ng m c đ dao đ ng c a p chung quan
ọ ằ ề ẫ ằ ủ ẫ
suy dinh d
ườ
. Tuy nhiên thông th
ộ
ứ ộ
ế
p )2 s b ng v i
ẽ ằ ng thì trung bình c a (p (cid:0) ớ p (1p )/n
ủ ỉ ệ ươ ủ ậ ng sai c a t l c g i là ph và căn b c hai c a nó đ
ườ ượ ọ
(standard error of a proportion) và nó đo l
ọ ứ ộ
ủ ế ọ
ượ
c g i là sai
ố
ng m c đ sai s trung
ỉ ệ
p c a chúng ta khác t chúng ta hi v ng t l ề ặ leä tæ cuûa
(S.E.) chuaån soá Sai (cid:0) ữ ế ọ T k t qu trên chúng ta có nh n xét nh sau:
Phân ph i xác su t s tr
khuynh h
ỏ
Khi c m u nh , phân ph i xác su t s tr b suy dinh d
‡
ỡ ẫ
nh ng khi c m u đ l n (khi n
ấ ằ
hình chuông úp. Ði u này cho th y r ng bi n s X (s tr b suy dinh d
ẽ ệ
ậ
ả
x y ra bi n c quan tâm) s ti m c n phân ph i bình th
ỉ ệ
ấ
ế
suy
N u chúng r t may m n, t l
ư
ủ
ưỡ
ố
ng c a dân s đích
dinh d
ỉ ệ ủ
ậ
ẫ ẽ
c a m u s dao đ ng (phân tán) chung quanh giá tr c a dân s đich. Chúng
v y và t l
ta dùng (p p )2 đ đo l
. Và chúng ta có thể
ủ
ộ
ố
ồ
ẫ
ấ
ứ
ch ng minh b ng toán h c r ng n u chúng ta l y nhi u m u ng u nhiên g m n đ i
ượ
t
Con s ố p (1p )/n đ
ẩ ủ ỉ ệ
ố
s chu n c a t l
ủ
bình c a p, nói cách khác, nó cho chúng ta bi
ớ
v i (bao nhiêu, tính v m t trung bình.
(cid:0)
)-(1
n
ứ
t theo ngôn ng toán h c hình th c Vi , ) (cid:0) (cid:0) ) 3,0 p p ~ N(p
ụ ớ ỡ ẫ ỉ ệ ưỡ ố suy dinh d ng trong dân s đích = 0,3 thì sai số ẩ ủ ỉ ệ Thí d v i c m u n = 1000 và t l
chu n c a t l quan sát là: soá Sai chuaån leä tæ cuûa
(S.E.) ,0 0145 -(1
n -(1
)
3,0
1000 (cid:0) (cid:0) (cid:0) ầ ế ưỡ ố ng trong dân s là 30% suy dinh d ố suy dinh d ừ ể ầ ể ổ ộ ẩ ươ
ỡ ẫ ừ
ả ẩ ẩ ố ố
ẩ ả ố ớ ỉ ệ
N u chúng ta trình bày theo ph n trăm thì v i t l
ưỡ
ẩ ủ ỉ ệ
ng là 1,45%.
thì sai s chu n c a t l
ầ
ể
ỉ ệ
ậ
trong qu n th đích quá g n 0% hay 100%, sai
Chúng ta có th có nh n xét: tr khi t l
ố
ợ
ắ
ố
ố
ng đ i ít thay đ i. M t quy t c tính r (rule of thumb)đ ánh ch ng sai s
s chu n t
ỡ ẫ
ẩ
chu n: c m u 100 thì sai s chu n là 5%, c m u 400 sai s chu n vào kho ng 2 % và
ỡ ẫ
c m u 10000 thì sai s chu n vào kho ng 0,5%. (cid:0) (cid:0) ) ) p p 121,0 )
121,0 ợ ử ụ ẫ
c a m u p đ ố p
c a dân s
ẻ
s kh o sát 1241 tr ỉ ệ ủ
, s d ng t l
ệ
ượ
em, phát hi n đ
ẩ ủ ỉ ệ
ố ế ỉ ệ ủ
t t l
ả
ưỡ
suy dinh d ể ướ ượ
c l
ng
ẻ ị
c 150 tr b suy dinh
ưỡ
ng
suy dinh d ng là 0,121 và sai s chu n c a t l ườ
Trong tr
ng h p không bi
ụ ả ử
ẩ
ố
sai s chu n.Thí d gi
ỉ ệ
ẹ
ưỡ
d
ng nh cân. T l
là: S.E. 0.009 -(1
n
ư ậ ỉ ệ -(1
n
ưỡ -(1
1241
ớ (cid:0) (cid:0) (cid:0) (cid:0) ẩ ố Nh v y t l suy dinh d ng là 12,1% v i sai s chu n là 0,9% ố ẫ
ự trong m t m u ng u nhiên, chúng ta mong mu n có
(th c) c a dân s n m trong đó. Chúng ta có ộ
ị ỉ ệ
c m t kho ng các giá tr mà giá tr t l
ấ ộ ỉ ệ
ị
ử ụ ả ỉ ố ằ
ủ ườ ị ứ ố 7. Khoảng tin cậy 95% của tỉ lệ
Khi chúng ta quan sát m t t l
ả
ộ
ượ
đ
ể
th tính đ ẫ
ủ
c kho ng này s d ng tính x p x bình th ng c a phân ph i nh th c. ượ
p ~ N(p , ) 59 (cid:0) (cid:0) ứ ấ ố ườ ằ ấ ạ ị Theo tính ch t th 4 c a phân ph i bình th ng, xác su t giá tr p n m trong ph m vi 96,1 (cid:0) (cid:0) ủ
)-(1 (cid:0)
n ể ằ ườ ợ ng h p nghiên ) ) p p ầ
ả ằ ế
là 95%. N u không yêu c u chính xác, ta có th cho r ng 95% các tr
ị p
ứ
c u giá tr n m trong kho ng: p p 96,1 96,1 -(1 p
n -(1 p
n (cid:0) (cid:0) (cid:0) (cid:0) – ế ượ ượ ả ị đ n ế
1,96 · c vi t là p · ủ · ậ
ậ ướ ớ ạ ọ
hay còn đ
95% (95% confident interval). Hai biên c a kho ng tin c y (p + 1,96
ậ
i h n tin c y trên và gi S.E. Kho ng giá tr này đ
ả
ớ ạ
i h n tin c y d ậ
ả
c g i là kho ng tin c y
S.E và p 1,96
i (upper confident limit S.E ) đ c g i là gi - ) - ) p p ư ế ỉ ệ ằ ậ ẽ ứ ả ầ ượ ọ
and lower confident limit)
L u ý n u chúng ta tính t l b ng ph n trăm thì công th c khho ng tin c y s là p p 96,1 96,1 (100 p
n (100 p
n (cid:0) (cid:0) (cid:0) (cid:0) đ n ế
ả ệ · p ‡ 5.
ẻ ướ ệ ậ ủ ỉ ệ
ượ
ng đ ứ
theo công th c trên là n
ề
c phát hi n khi đi u tra 1241 tr d ổ
i 3 tu i. Gi ạ ố ỉ ệ ưỡ suy dinh d - ) p 1,12 )
1,12 ụ ể ả
ng là p= 150/1241 =
ả
5 nên chúng ta có th áp d ng kho ng ng là 150 = n
ưỡ ủ ỉ ệ ậ ề
ụ
Ði u ki n áp d ng kho ng tin c y c a t l
ả ử
ưỡ
ẻ
Gi
s có 150 tr suy dinh d
ệ
ử ế
ẻ
s n u 1241 tr này đ i di n cho dân s đích thì t l
ưỡ
ố ẻ
12,1%. Vì s tr suy dinh d
suy dinh d
tin c y 95% c a t l · p ‡
ư
ng nh sau: p 96,1 96,1%1,12 %8,1%1,12 (100 p
n (100
-
1241 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ưỡ ế
10,3% đ n 13,9%. ả ả
ả suy dinh d
ặ c l ậ ộ ố
ắ
nào. ớ ằ ấ ậ ẽ ậ ậ ả ả ộ ỉ ệ
ng b t kì m t t l
ả
ằ
ố
c a dân s đích n m ngoài kho ng tin c y 95%. Do
ượ
c tính toán s có 1 kho ng tin c y không ứ ừ
ậ ủ ỉ ệ
ng là t
Kho ng tin c y c a t l
ậ
ố
ậ
ậ
Kho ng tin c y 95% (ho c kho ng tin c y 90% theo m t s nhà th ng kê) là kĩ thu t
ứ ộ
ấ ể ể ệ
ổ ế
ắ ủ ướ ượ
ố
th ng kê ph bi n nh t đ th hi n m c đ không ch c ch n c a
ng và nên
ấ
ướ ượ
ả
ử ụ
c l
s d ng kho ng tin c y khi
ỉ ệ ủ
Nên nh r ng có xác su t 5% t l
đó trung bình c m i 20 kho ng tin c y đ
ch a giá tr t l ứ ỗ
ị ỉ ệ ự
th c. ế ể ể ệ ỉ ệ ề ả
và kho ng ậ ỉ ệ ủ
c a hai hay nhi u nhóm chúng ta có th th hi n t l
ở
ộ ụ ượ 8. Trình bày khoảng tin cậy
N u chúng ta có t l
ồ ị
ằ
tin c y b ng đ th . M t thí d đ c trình bày sau: 60 50% 50% 40% 40% 30% 30% 20% 20% 10% 10% 0% 0% Muø chöõ (n=23) Caáp 1,2 (n=748) Caáp 3 (n=340) ÑH, CÑ (n=130) ỉ ệ ẹ ả ạ ọ suy dinh d ộ
ậ
ng nh cân (thanh đ c) và kho ng tin c y 95% (đo n th ng d c) theo trình đ
ọ ưỡ
ữ ọ ế ấ ẳ
ặ ạ ọ ọ ế ấ ẹ ẳ ặ
Hình 2. T l
ọ ấ ủ
h c v n c a m (mù ch , h c đ n c p 1 hay 2, h c đ n c p 3, h c Cao Ð ng ho c đ i h c). ộ ổ ề ưỡ ẹ ủ ữ ng trên 1241 tr d
ẻ ấ ộ
ưỡ ẻ ị ẹ ọ
ng (r=7), Trong nhóm có m h c c p 1,2 (n=748) có 98 tr ẻ ị ưỡ ạ ọ
ả ủ ừ ở
ậ ưỡ
ỉ ệ
ng. T l
ằ
ưỡ ặ ạ ẻ
ẻ ướ
ạ
i 3 tu i, phân lo i tr
ẻ ị
ẹ
ườ
i m . Trong nhóm tr có m mù ch (n=28) có 7 tr b
b suy dinh
ng và trong nhóm
ưỡ
suy dinh d
ng
ồ
ể
c trình bày b ng bi u đ thanh
ượ
c
ng quan sát đ
suy dinh d ườ ứ ẳ ậ ả ả ấ ớ ẻ ấ ậ ẽ ẹ
ằ
ữ ớ ỡ ẫ ể
ậ
ẹ ọ ấ
ỏ ỡ ẫ ẹ ẻ ằ ấ ộ
Trong m t cu c đi u tra tình tr ng dinh d
theo trình đ văn hóa c a ng
suy dinh d
ẹ ọ ấ
ưỡ
d
ng, trong nhóm có m h c c p 3 (n=340) có 33 tr b suy dinh d
ẻ ị
ẹ ọ
có m h c đ i h c tr lên (n=130) có 12 tr b suy dinh d
ẻ ượ
ớ
đ
cùng v i kho ng tin c y 95% c a t ng nhóm tr
ể ệ ỉ ệ
ơ
ư
đ n nh trong hình 19, trong đó thanh đ c th hi n t l
ể ệ
ng th ng đ ng th hi n kho ng tin c y 95%.
và đ
ỡ ẫ
ấ
ậ
ằ
Chúng ta có th nh n xét r ng kho ng tin c y s h p nh t khi c m u là l n nh t
ẽ ộ
ả
ớ ỡ ẫ
(nhóm tr có m h c c p 1 và c p 2 v i c m u b ng 748) và kho ng tin c y s r ng
nh t khi c m u nh (nhóm tr có m mù ch v i c m u b ng 23). ế ề ề ộ ưỡ ượ ế ỉ c ti n hành trên 37.766 tr d ế
ổ ở
i 6 tu i ệ c a Vi ẻ ả ủ ạ ố
ẻ ướ
ớ ỡ ẫ
ặ
c x p lo i là suy dinh d ố ệ
ng. S li u v ẩ
ượ ế
ả ưỡ Bài tập
ừ
T tháng 8 đ n tháng 10 năm 1994, cu c đi u tra qu c gia v thi u Vitamin A và suy
ạ
ề
dinh d
20 t nh thành đ i
ng. Ði u tra đ
ế ủ
ộ ỉ
ệ
t nam v i c m u trung bình cho m t t nh
di n cho 7 vùng sinh thái kinh t
ứ
ẻ
ộ ệ
ổ ướ
i 2 đ l ch
vào kho ng 1500 tr . Trong nghiên c u này, tr có cân n ng theo tu i d
ề
ưỡ
ổ ượ
ặ
ẩ
chu n so v i cân n ng chu n c a tu i đ
m t s t nh đ
dinh d ớ
ở ộ ố ỉ
ng c trình bày trong b ng sau: 61 1 3 6 2 8 5 4 7 10 16 9
12 13
19 Hà n iộ 14
1820 11 1715
21
23 22
25
24 26 27 28 Hoàng Sa 29 30 Huế 31 32
ả
Qu ng Nam 34 41 Bình đ nhị 40 36 Daklak 37 43 Ninh thu nậ 46 ồ 47
Đ ng Tháp 39 ồ ồ 45
44 TP H Chí Minh An Giang Đ ng nai
49 50
53 ế 55 CT 59 B n tre
56
Sóc trăng 60 61 ườ Tr ng Sa 62 ố ẻ ượ ố ẻ T nhỉ S tr đ ọ
c sàng l c S tr SDD ả ẵ Qu ng nam Ðà n ng 1503 711 Binh Ð nhị 1510 708 Ninh Thu nậ 1520 707 ắ ắ
Ð c L c 1488 705 ồ TP H Chí Minh 1503 494 Sông Bé 1488 579 ồ Ð ng Nai 1500 542 ồ Ð ng Tháp 1498 758 An Giang 1512 556 ế B n Tre 1503 522 ầ ơ C n Th 1563 622 Sóc Trăng 1490 590 Minh H iả 1492 573 ưỡ ng ưỡ m i t nh. suy dinh d
ưỡ ở ỗ ỉ
ng
ả ậ ợ t c các t l ng và kho ng tin c y theo cách thích h p. i th ng kê các k t lu n. ả ẽ ư ế ạ ẻ ở ỗ ỉ
ủ
ưỡ ế ề ề ỉ ỉ ế
m i t nh, theo b n k t qu s nh th nào?
ng c a 4 t nh mi n Trung và 6 t nh mi n Tây. ổ ề ạ ữ ể ạ ở ẻ tr em, b n có th có nh ng cách phân ế
ạ
ố ệ
ả ệ ị ạ ệ
ệ
ự
Các nhóm th c hi n các công vi c sau:
ở ỗ ỉ
ỉ ệ
m i t nh.
suy dinh d
1. Tính t l
ỉ ệ
ậ
ả
2. Tính kho ng tin c y 95% cho t l
ỉ ệ
ồ ấ ả
ẽ ể
suy dinh d
3. V bi u đ t
ế
ả
ậ
ố
4. Lí gi
ỉ ề
ả ử
s chúng ta ch đi u tra 50 tr
5. Gi
ả ỉ ệ
6. So sánh k t qu t l
suy dinh d
Cách so sánh đó có gì không n hay không?
ưỡ
7. N u b n đánh giá v tình tr ng dinh d
ế ợ
t l
tích s li u nào khác hay không? Cho bi
ề ỉ ệ
8.Gi ự
i sao có s khác bi t đ a lí v t l i thích t ng
ủ ừ
i ích c a t ng cách
ưỡ
suy dinh d ng. 63 iả
ỉ ệ ưỡ ậ ủ ỉ ệ ả ưỡ ở ỉ Bài gi
1. T l suy dinh d ng, kho ng tin c y c a t l suy dinh d ng 13 t nh phía Nam ẵ ắ ồ
ồ ế
ầ 60 60.0 50 50.0 40 40.0 30 30.0 20 20.0 10 10.0 0 0.0 Ñaéc Laéc TP Hoà Binh
Ñònh Ninh
Thuaän Soâng
Beù Ñoàng
Nai Ñoàng
Thaùp An
Giang Beán Tre Caàn
Thô Soùc
Traêng Minh
Haûi Quaûng
nam Ñaø
naüng Chí
Minh T nhỉ
ả
Qu ng nam Ðà n ng
Binh Ð nhị
Ninh Thu nậ
ắ
Ð c L c
ồ
TP H Chí Minh
Sông Bé
Ð ng Nai
Ð ng Tháp
An Giang
B n Tre
ơ
C n Th
Sóc Trăng
Minh H iả S trố ẻ S SDD
1503
1510
1520
1488
1503
1488
1500
1498
1512
1503
1563
1490
1492 ố
711
708
707
705
494
579
542
758
556
522
622
590
573 T lỉ ệ
SDD
47.3
46.9
46.5
47.4
32.9
38.9
36.1
50.6
36.8
34.7
39.8
39.6
38.4 ớ ạ
Gi
i h n
tin c yậ
iướ
d
44.8
44.4
44.0
44.9
30.5
36.4
33.7
48.1
34.4
32.3
37.4
37.1
35.9 ớ ạ
Gi
i h n
tin c yậ
trên
49.8
49.4
49.0
49.9
35.3
41.4
38.5
53.1
39.2
37.1
42.2
42.1
40.9 SE
1.29
1.28
1.28
1.29
1.21
1.26
1.24
1.29
1.24
1.23
1.24
1.27
1.26 suy dinh d 13 t nh thành phía Nam năm 1994 và kho ng tin c y 64 Ỉ Ệ Ắ Ể Ị
NGUYÊN T C KI M Ð NH SO SÁNH HAI T L ả ượ ể ị ả ạ ộ thuy t không (Ho) có đ t yêu c u hay không ứ ụ
ụ ả ỉ ệ ứ
ứ
ượ ự ể
ứ ủ
ị ệ ố
ậ ẫ
2 m u
ậ ủ
ả
ạ ượ
ệ ữ
ầ ể
ầ ầ ạ Mục tiêu:
ủ ề ọ
Sau khi nghiên ch đ , h c viên có kh năng:
ệ
ắ ủ
c nguyên t c c a vi c ki m đ nh ý nghĩa
Nêu đ
ầ
ế
Đánh giá m t gi
ỉ ệ ở
Trình bày và ng d ng công th c z đ so sánh 2 t l
c công th c c a kho ng tin c y c a hi u s 2 t l
Trình bày và ng d ng đ
Trình bày đ
ệ ượ
t đ
Phân bi c s liên h gi a ki m đ nh ý nghĩa và kho ng tin c y
ạ
c 2 lo i sai l m: sai l m lo i I và sai l m lo i II ử ư ệ ị ể ề
ị ớ ố ợ ộ ượ ệ ỏ ố c phân
ạ
c đi u tr v i LPam hay CMF (m t ph i h p g m 3 lo i
ố
c đ nh nghĩa là s teo nh trên m t n a c a di n tích kh i ộ ử ủ
ả ố ệ ượ ố ờ 1. Thí dụ:
ộ
ượ
Trong m t th nghi m lâm sàng đ đi u tr ung th vú đã di căn, b nh nhânh đ
ồ
ẫ
nhóm ng u nhiên đ đ
ứ
thu c). Ðáp ng kh i u đ
ể
u trong th i gian t ệ
ể ượ
ề
ự
ị
ố
ầ
i thi u là 2 tu n. S li u đ c trình bày trong b ng sau: ị ổ ố Ði u trề CMF LPam T ng s Có ủ
ứ
Ðáp ng c a
kh i uố 49
(52,7%) 18
(19,8%) 67
(36,4%) Không 44 73 117 93 91 184 ố ệ
ổ
T ng s b nh
nhân ứ ể ằ ể ử ụ
ế ố ơ ạ ể ế
ể
ớ ố ệ
V i s li u trên, chúng ta có th s d ng ki m đ nh ý nghĩa đ xem b ng ch ng đ k t
ứ ộ
ậ
lu n CMF t ị
t h n LPam m nh đ n m c đ nào. ươ ứ ủ ể ả ậ 2. Nguyên tắc của kiểm định ý nghĩa
Nguyên lí c a ph ề
ng pháp ph n ch ng là n u chúng ta có th suy lu n (cid:222) (cid:222) ả ả A không x y ra} B không x y ra} thì {B x y ra ệ ề ủ ị ủ ị ủ ề ‘ A là ph đ nh c a m nh đ A, ta có th vi
ể ế
ệ t (cid:222) ủ
‘ A }
ấ ườ ụ ậ ộ ệ ẩ
ụ ứ ứ
ờ ệ ả ử ứ
ị ị ắ ệ ộ ử ủ ệ ệ ườ ậ ng và chúng ta lo i b căn nguyên t c ru t. Có th chúng ta không nh n th c đ ắ
ư ễ ậ ế
ả
n u {A
Kí hi u ệ ‘ B là ph đ nh c a m nh đ B,
‘ B} thì {B (cid:222)
ế
n u {A
ằ
ứ
ng xuyên ng d ng trong ch n đoán y khoa (dù r ng
Ðây là suy lu n chúng ta r t th
ộ
ụ
ậ
chúng ta ng d ng nó m t cách có ý th c hay vô th c).Thí d : m t b nh nhân nh p
ữ ộ
ụ
s chúng ta nghi ng b nh nhân b t c ru t và chúng ta
vi n vì b đau b ng d d i. Gi
ệ
ệ
ế ệ
t b nh nhân có trung ti n bình
khai thác b nh s c a b nh nhân. B nh nhân cho bi
ạ ỏ
ứ ượ
ể
ộ
th
c
ư
quá trình suy lu n nh ng nó đã di n ra nh sau: ế ệ ị ắ ộ ệ ộ ệ
ệ
N u b nh nhân b t c ru t thì b nh nhân s không đi trung ti n.
ị ắ
ườ
Do b nh nhân trung ti n bình th ng nên b nh nhân không b t c ru t. ươ ự ắ ủ ươ ệ
ắ ủ ị ẽ
ệ
ư ng t nh nguyên t c c a ph ả
ng pháp ph n ứ ể
Nguyên t c c a ki m đ nh ý nghĩa t
ch ng. Ðó là: (cid:222) (cid:222) ế ế ế ả ả ả T hi m x y ra} thì { T x y ra ế ố ấ ủ ứ ế N u {Ho
ệ
Kí hi u theo công th c xác su t c a bi n c T là P(T), ta vi Ho hi m x y ra }
t: (cid:222) (cid:222) ế ả P(Ho) nh }ỏ P(T) nh } thì { T x y ra
ể ừ ị ướ N u {Ho
Phân tích t ng b ỏ
ướ ủ
c c a quá trình ki m đ nh ý nghĩa chúng ta có các b c: 65 ự ả 1. Xây d ng gi ế
thuy t Ho (cid:222) ị ọ ự ậ ừ ệ ỗ P(T) Ho ậ ượ c ể
ị ố
ấ ủ ượ ọ c g i là giá tr p ủ ỏ ị
ỏ ả ệ
ậ ế ế ỏ ợ
2. Ch n l a ki m đ nh thích h p Vi c tìm chu i suy lu n t
ủ ố ệ
3. Tính giá tr th ng kê T c a s li u thu th p đ
ố
4. Tính xác su t c a th ng kê T kí hi u là P(T) và đ
5. Và n u P(T) đ nh chúng ta k t lu n P(Ho) nh và chúng ta bác b gi ế
thuy t Ho ả ế ộ ế ề
ẳ ả ị ự
ớ ủ ấ ứ ộ ằ ườ
ượ ạ ệ ỉ ệ ướ
tr
ệ ề ỉ ệ ữ
t v t l ằ
ệ
thuy t không (null hypothesis) là m t m nh đ âm tính cho r ng
ế
thuy t
trên đã trình bày, kh ng đ nh gi
ườ
ố
ng
ả ị
đ nh r ng không
ng âm tính: gi
ố
ở
c đ i di n b i hai dân s nghiên c tiên chúng ta s ch n l p tr
ố
gi a hai dân s đích mà đã đ ẫ ư ế ả ỉ ệ ư ẽ ị
ề
thuy t không là hai đi u tr này có
ớ
ứ
đáp ng v i ụ ề
ng đ ị
ươ
ng. Nói khác đi các b nh nhân ung th vú s có t l
ố ớ ệ
ề ớ ứ thuy t không
2.1. Gi
ố
ả
Trong th ng kê, gi
ư ở
ệ ố
không có s liên h th ng kê nào và nh
ể
ị
ầ
không là bu c đ u tiên c a b t c m t ki m đ nh ý nghĩa th ng kê nào. Trong tr
ẽ ọ ậ
ợ
h p so sánh 2 t l
ự
có s khác bi
ứ
c u (m u).
Trong thí d đi u tr ung th vú, chúng ta xem gi
ệ
ả ươ
hi u qu t
ị ằ
đi u tr b ng nhau đ i v i CMF và LPam.
Ho: p 1=p 2 Hay
ứ
ỉ ệ
Hp: t l ả ộ ệ ấ ố ớ
thuy t không nh sau: đ i v i m t b nh nhân b t kì, ỉ ệ
ớ
đáp ng v i CMF = t l
ể
ế
ị ớ đáp ng v i LPam
ư
ằ ứ ề ấ Chúng ta cũng có phát bi u gi
xác su t đáp ng đi u tr v i CMF và LPam là b ng nhau. ỉ ệ ầ ọ ể ể ị 2.2. Ch n ki m đ nh ý nghĩa đ so sánh hai t l ph n trăm (cid:222) ị ị ỗ ả ầ ế ậ ừ Ho P(B) thuy t không chúng ta c n xác đ nh chu i suy lu n t ả ấ ả ự ệ ề ỉ ệ
t v t l thuy t không là đúng, c h i (xác su t) x y ra s khác bi ượ ơ ộ
t đã quan sát đ ư ế ỏ ằ ệ
ụ ề
ị ự ố
ệ ươ
t t ng t ặ ề ệ c là bao nhiêu?
ặ
ấ ả
ứ ơ ố ệ ớ Sau khi xác đ nh gi
ỏ
ặ
ằ
b ng cách đ t ra câu h i:
ế
ế
N u gi
ơ ự
ớ
ự
hay l n h n s khác bi
ợ
ườ
ng h p thí d v ung th vú, chúng ta đ t ra câu h i, n u thu c CMF
ự
ả ề
ệ
ớ
t nhi u h n s li u đã quan sát (đó là đáp ng v i CMF là 52,7% và v i ố ệ ế ề ằ ố ị thuy t không cho r ng s b nh nhân đi u tr thu c LPam đ ượ
ẫ ề ệ ồ ộ ị ố
ườ ệ
ứ ỉ ệ ế ề ợ ố ấ ỉ ng ứ ở
ứ ở ẽ
ẽ ẫ
ẫ ộ ườ
1p2 s có phân ph i x p x bình th
ị
1p2 s dao đ ng chung quanh giá tr 0 hai m u p
hai m u p (cid:0) (cid:0) đáp ng
đáp ng
ệ ố ỉ ệ ố ươ
t
ng t
ụ ể
C th trong tr
và LPam có hi u qu đi u tr cùng b ng 36%, xác su t x y ra s khác bi
ho c khác bi
LPam là 19,8%) là bao nhiêu?
ả
ư ậ
Nh v y, gi
c xem là
ồ
ẫ
ộ
m t m u g m 19 b nh nhân và b nh nhân đi u tr thu c CMF là m t m u g m 93
ố
ả
ệ
b nh nhân c hai đ u có t l
ng h p này lí thuy t th ng
đáp ng là 36,4%. Trong tr
kê cho r ng:ằ
ệ ố ủ ỉ ệ
Hi u s c a t l
ệ ố ủ ỉ ệ
Hi u s c a t l
ẩ ủ
Sai s chu n c a hi u s hai t l là S.E. -(1 )( ( ) 364,0 636,0 071,0 %1,7 1
93 1
)
91 1
n
1 1
n
2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ườ ệ ố ượ c ệ ố ệ ng hi u s quan sát đ
ượ ườ ẩ ố ượ ố ọ t (hi u s ) quan sát đ c đo l ng theo sai s chu n đ c g i là th ng kê ỉ ố ố
2.3. Tính ch s th ng kê đo l
ự
S khác bi
z: 66 7,52 8,19 Z 63,4 leä tæ soá hieäu
quan
saùt
chuaån
cuûa
hieäu
soá soá sai 1,7 9,32
1,7 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ấ ủ ỉ ố ố ố ố ấ ớ ị
ng, ta có xác đ nh xác su t có đ ị ộ ằ ườ
ấ ị ề ố ặ ử ụ
ả ố ớ
ặ ằ
ư ượ
ầ
ố ặ ả ẩ 1,645) =0,1 1,282) =0,2 0,674) =0,5 P(|Z| ‡
P(|Z| ‡ 3,291)=0,001 2,576) =0,01 1,960) =0,05 ắ ạ ể ế ấ ớ ế ị ụ
ự ự ượ ự ả ấ c s khác bi 2.4. Tính xác su t c a ch s th ng kê Z
ơ
c th ng kê Z l n h n
Ð i v i phân ph i bình th
ụ
ộ
ho c b ng m t giá tr Z0 nh t đ nh b ng cách s d ng m t ph n m m th ng kê (thí d
nh EpiInfo; Excel hay Stata), ho c tham kh o b ng phân ph i chu n. Ho c chúng ta
ự ế
có th s d ng tr c ti p các thông tin sau:
P(|Z| ‡
P(|Z| ‡
ỏ
i là n u Z càng l n thì xác su t P càng nh .
ớ
ệ
ỏ ơ ể ử ụ
P(|Z| ‡
P(|Z| ‡
ầ
Ði m c n nh c l
ề
Trong thí d trên v i Z=4,63 thì ta có P<0,001. Nói cách khác, n u đi u tr CMF và L
ư
ệ ớ
ư
Pam th c s có hi u qu nh nhau thì xác su t có đ
t l n nh chúng ta
đã quan sát là nh h n 1/1000. ậ ậ ế ớ ứ ằ ỏ ả
ở ứ ậ
ố ệ ứ ẽ t có ý nghĩa th ng kê ằ
ố ơ ự ự ứ ự
thuy t Ho v i m c ý nghĩa 0,001. Hay nói r ng s
ằ
ạ
m c 0,001. Do đó có b ng ch ng m nh m cho r ng
ớ ệ
t h n so v i b nh nhân nhóm L ế
2.5. K t lu n
ế
Vì v y chúng ta k t lu n bác b gi
khác bi
ệ
các b nh nhân nhân nhóm CMF th c s có đáp ng t
Pam 3. Phương pháp tắt để tính z ị ổ ố Ði u trề CMF LPam T ng s a1 a0 Có 49 18 67 b1 b0 ủ
ứ
Ðáp ng c a
kh i uố Không 44 73 117 93 91 184 ố ệ
ổ
T ng s b nh
nhân 2 2 ỉ ố ữ ủ ệ ệ ằ ố và sai s chu n c a hi u s 2 t l ố
ẩ
ấ ủ ố
ả ứ ầ ỉ ệ
ỉ ệ
Ngoài cách tính z b ng t s gi a hi u s 2 t l
,
ệ
chúng ta có th tính z theo công th c sau (kí hi u 4 t n su t c a 4 ô trong b ng 2 x 2
ầ ượ
l n l ể
t là a, b, c, d): ) 49( 73 184 Z 64,4 ba
01
a a (
)( ) ( 44
117 )18
93 91 67 0 ba
10
a
)(
1 b
0 N
b
)(
1 0 b
0 a
1 b
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ư ơ ươ
ế ượ ả ầ
c b n ch t c a ph ể ể
ng pháp này là không th hi n đ
ả ồ
ươ ấ ủ
ế ế ề ấ ẫ
ể
t đ tính z và có u đi m là có th tính nhanh h n và ít nh m l n
ươ
ể ệ
ng
ng pháp đ u cho k t qu đ ng nh t nhau n u không có ố ắ ể
Ðây là ph
ng pháp t
ủ
ươ
ể
ơ
h n. Khuy t đi m c a ph
ị
ả
pháp ki m đ nh z. C hai ph
ố
ệ
sai s do vi c làm tròn s . ể ượ ằ ủ ớ
ườ ứ
ứ ệ , ng ể
ể
t ủ ằ
ủ ằ
ằ
i ta có th nói r ng s khác bi
ế ở ứ ể
ắ ộ ố
ỏ ậ ộ ề
ờ ậ ố ọ ỉ ưỡ ặ ố 4. Biện luận giá trị của p
ơ
ớ
ị
c xem là đ l n đ xem r ng không có đ b ng ch ng đ bác
Giá tr p l n h n 0,1 đ
ằ
ế
ỏ ả
i ta cho r ng p<0,05 là có đ b ng ch ng đ cho
thuy t Ho. Theo thông l
b gi
ệ có ý
ự
ườ
ế
ả
ằ
r ng gi
thuy t Ho là không đúng. Khi đó, ng
‡ 0,05 thì ch pấ
ườ ử ụ
ố
i s d ng quy t c là n u p
m c 5%. M t s ng
nghĩa th ng kê
ế
nh n Ho và n u p<0,05 thì bác b Ho. Tuy nhiên đi u này hoàn toàn không có m t căn
ượ
ứ
ng. Vì v y chúng ta nên bác
c khoa h c hay th ng kê nào mà ch do thói quen th i th
ấ
ữ
ỏ ệ
ng ý nghĩa 5%. M t khác, nh ng phân tích th ng kê cho th y
b vi c “mê tín” vào ng 67 ử ụ ụ ư ể ơ ị ế ấ ứ ứ
ử ụ
ị ự ự ủ ấ
ưỡ
ứ ỉ ế ằ ưỡ ọ
ộ
i m t ng t r ng p ở ướ
d chúng ta nên s d ng m c ý nghĩa th p h n, thí d nh 0,01 hay 0,001, trong ki m đ nh
ả
thuy t. Và dù s d ng b t c ng
ng ý nghĩa nào, trong báo cáo khoa h c chúng ta
gi
ả
ph i báo cáo giá tr th c s c a p, ch không ch vi
ng nào
đó. ị ả ầ ả ể ế thuy t không ph i là không có sai l m: dù r ng chúng ta có 20 gi ế ế ằ
ể ầ ế ệ ự ị
ề ế
ỏ ẽ ẫ
ị
ể ơ ầ ả
ơ ị
ế ể ể ề ị ị ề
ố ệ
ố ấ
ạ ườ ệ ẽ ố ơ ẽ ầ ụ ậ ỏ
ng thì các gi ưở
ậ ố ệ ự ạ
ể ướ ể ị c khi thu th p s li u. ứ ầ
ụ ự ứ ệ ộ ệ ằ ộ ở ơ nhóm anturane là 6 th p h n m t cách có ý nghĩa so v i t vong ớ ử
ứ ở
ề ậ ế ế ủ ấ
ở ư ậ ố ử ẽ 5. Sự lạm dụng của test thống kê
ả
Ki m đ nh gi
ệ
ệ
thuy t hoàn toàn đúng thì trên trung bình, vi c ti n hành 20 ki m đ nh s d n đ n vi c
ế
ộ
thuy t. Và n u chúng ta th c hi n nhi u ki m đ nh h n thì
bác b (sai l m) m t gi
ơ
chúng ta có nhi u nguy c b sai l m h n.
ể
ế
Sau khi đã có s li u, n u chúng ta ti n hành r t nhi u ki m đ nh đ xem ki m đ nh
ố ệ
ọ
nào là có ý nghĩa th ng kê ng
i ta g i đó là n o vét s li u (data dredging) thì nguy
ọ
ữ
ơ
cho khoa h c.
c sai l m s tăng cao và nh ng phát hi n s gây r i h n là làm sáng t
ế
ả
ầ
Vì v y đây là s l m d ng c n phê phán nghiêm túc. Trên lí t
thuy t
ả ượ
nghiên c u c n ki m đ nh ph i đ
c phát bi u tr
ặ
M t thí d : trong nghiên c u anturane, m c dù không có s khác bi
anturane và placebo nói chung, báo cáo có "phát hi n" r ng trong vòng 6 tháng đ u s t
vong
là 24 (p=0,001). Tuy nhiên b i vì trong thi
so sánh s t ữ
t có ý nghĩa gi a
ầ ố ử
nhóm placebo
ệ
ế
t k c a nghiên c u không đ c p đ n vi c
ra nên tránh các so sánh nh v y trong báo cáo. vong trong vòng 6 tháng, l ậ ủ ỉ ệ ả ng kho ng tin c y c a hi u s
ể ị ướ ượ
c l
ứ ằ ượ ỉ ế ả ắ ắ ệ ố
ằ
ng b ng
ế ề ộ ớ ủ ự
t v đ l n c a s khác
ứ ể
ệ
t đó. Công th c đ tính ư
ả
i gi
ứ ộ
ệ ố ư ậ ủ 6. Khoảng tin cậy 95% của hai hiệu số
ị
ế
ỉ ể
N u ch ki m đ nh so sánh hai t l
mà không
ậ
ẫ
ỉ ệ
hai t l
thì v n ch a hoàn ch nh. Chúng ta nh n th c r ng p có ích đ đ nh l
ậ
ứ
ạ
ố
ch ng ch ng l
thuy t Ho, kho ng tin c y cho chúng ta bi
ề ộ ớ ự
ể ệ
ệ
t và th hi n m c đ không ch c ch n v đ l n s khác bi
bi
ả
kho ng tin c y c a hi u s nh sau: (cid:0) (cid:0) (cid:0) hai cuûa soá chuaån cuûa 95% caäy
ệ saùt
quan
1,96
ủ hieäu
soá
ả hieäu
ậ soá sai
ệ ề ỉ ệ ử
t v t l t soá
hieäu
ộ
vong sau m t %7,3%7,0%2,2%5,1%1,1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) tin
Khoaûng
ử
Trong th nghi m anturane, kho ng tin c y 95% c a khác bi
năm là:
96,1%)1,4%6,5( 0 cho r ng không có s khác bi
c l ằ ể ả ữ ệ ề ệ ườ ả ằ
ỉ ệ ử
vong 0,7% trong nhóm anturane và gi m t l
t
ừ
ả ậ ậ ằ
nhóm anturane. Có th nh n xét r ng n u kho ng tin c y 95% đi t ự
ỉ ệ ử
t
ng h p: tăng t l
ể
ứ ị ươ ị ế
ư ậ
ữ ưỡ ệ ằ ng thì nó có ch a giá tr 0 và nh v y có nghĩa là chúng ta không bác b
t gi a hai t l
ậ ự
ượ ạ ế ả ị t v hi u qu gi a anturane và placebo n m đâu đó
vong
ị
giá tr âm
ỏ
ậ
ng tin c y 5%) và
ẽ
ị ỉ ệ ớ
(v i ng
ứ
i n u kho ng tin c y không ch a giá tr 0 thì giá tr p s Chúng ta có th nói r ng s khác bi
ợ
ữ
gi a 2 tr
ở
3,7%
ế
đ n giá tr d
ế
ả
thuy t H
gi
ị
khi đó giá tr p>0,05. Ng
<0,05 ố ấ ằ ụ ẹ ở ậ ệ ộ ị ứ
t và t ế ể ướ
vong
ệ ệ ị ố ố ệ ị ượ ặ ớ ề
ề ượ ệ ầ ứ ơ ế ố ủ
ạ ứ ệ Bài tập
ữ
c đây cho th y r ng thu c ch n kênh calci tác d ng nhanh làm
1. Nh ng nghiên c u tr
ứ ượ
ử
ệ
c
các b nh nhân b suy tim mãn tính. M t nghiên c u đ
gia tăng b nh t
ạ
ữ
ả ủ
ti n hành đ xem xét hi u qu c a Amlodipine trên nh ng b nh nhân b suy tim m n
ứ
tính. Trong nghiên c u này 1153 b nh nhân b suy tim mãn tính và phân s t ng máu
ị
ỏ ơ
c đi u tr mù đôi ho c là v i amolodipine (571) hay placebo (582
nh h n 30% đ
ỳ
ị ẵ
ớ
ệ
c phân t ng tu theo có hay
b nh nhân) cùng v i đi u tr s n có. Các b nh nhân đ
ả
ế ố ế
ế
không b thi u máu c tim. Bi n s k t qu chính (primary outcome) c a nghiên c u là
ậ
ấ c nguyên nhân nào hay nh p vi n do các bi n c tim m ch.
ử
t ị
vong do b t 68 ế ế i thi s anh ch là ng ề ứ
ộ ị
ị ằ ả ử
ằ ử t ử
ệ
ố ở ế ố
bi n s nào (t
ộ ấ
ế ẽ
ế ệ ậ ả ố ẽ ằ ầ ở t ơ ở ế
nhóm không thi u máu c tim?
ớ
ế ừ ế ị
6 đ n 33 tháng v i trung v là 13,8 tháng), k t qu đ ả ượ
c ờ
ư ị
ườ
a. Gi
t k nghiên c u cho th nghi m lâm sàng này, anh ch
vong do b t kì
cho r ng đi u tr b ng amlodipine s có tác đ ng t
ạ
nguyên nhân nào nh p vi n do bi n c tim m ch hay x y ra m t trong 2 bi n có
ế
ả ố ở
ế
trên)? Anh chi cho r ng amlodipine s có k t qu t
phân t ng nào ( nhóm thi u
ơ
máu c tim hay
ộ
Sau m t th i gian theo dõi (t
ậ
ghi nh n nh sau: ấ ả ệ ế ơ T t c b nh nhân Nhóm thi u máu c tim Nhóm không thi uế
máu ố ế
k t ế
Bi n s
quả Placebo
(n=582) amlodipine
(n=571) Placebo
(n=370) amlodipine
(n=362) Placebo
(n=212) amlodipine
(n=209) Ch tế 192 160 126 123 66 37 ơ 35
10
7
10 13
8
9
12 21
8
4
8 2
3
1
6 14
2
3
2 15
11
10
18 Phù ph iổ
ướ
ế
Thi u
t
i
máu n ngặ
ồ
Nh i máu c
tim
ị
Nh p nhanh
ấ
th t hay rung
th tấ ộ ổ T ng c ng 246 222 168 164 78 58 ợ ể ử ụ ị ở ả ả ệ ơ ử vong các b nh nhân b suy tim ơ ả ậ ề ế ố ệ ạ ở ị ệ ả ế ả ề
ậ ệ ế ạ ố ử
ố ế
ơ ả
ị
ở
các b nh nhân b suy tim mãn hay ơ ử ệ ả ở ị các b nh nhân b suy tim vong ơ ề
ế
ề ơ ử ệ ả ở ị các b nh nhân b suy tim vong ị ề ệ ứ ừ ậ S d ng test ý nghĩa phù h p đ đánh giá:
ị ằ
ề
b. Có ph i đi u tr b ng amlodipine gi m nguy c t
mãn hay không?
ị ằ
ả
b. Có ph i đi u tr b ng amlodipine gi m nguy c nh p vi n vì các bi n c tim m ch
các b nh nhân b suy tim mãn hay không?
ị ằ
ả
b. Có ph i đi u tr b ng amlodipine gi m nguy c x y ra bi n c k t qu chính (t
ệ
vong hay nh p vi n vì các bi n c tim m ch)
không?
ả
ị ằ
c. Có ph i đi u tr b ng amlodipine gi m nguy c t
mãn và có thi u máu c tim hay không?
ị ằ
ả
d. Có ph i đi u tr b ng amlodipine gi m nguy c t
ế
ơ
mãn và không b thi u máu c tim hay không?
ả ủ
ể ế
e. Chúng ta có th k t lu n gì v hi u qu c a amlodipine t nghiên c u này? 69 70 NGUYÊN LÍ KIỂM ĐỊNH ả ượ ự ậ ị ệ ữ
ầ ể
ầ ạ ả
ạ ầ Mục tiêu:
ủ ề ọ
Sau khi nghiên ch đ , h c viên có kh năng:
Trình bày đ
ệ ượ
t đ
Phân bi c s liên h gi a ki m đ nh ý nghĩa và kho ng tin c y
ạ
c 2 lo i sai l m: sai l m lo i I và sai l m lo i II ủ ể ể ị ấ ọ
ế ố ủ ấ ư ậ
ể
ị
ọ ỉ
ụ ứ ộ ế ế ạ
Lo i thi ứ
t k nghiên c u ề ị ữ Liên hệ
gi a hai
bi n sế ố ế ố ủ Thang đo c a bi n s Hai nhóm
ị ồ
ề
đi u tr g m
các cá nhân
khác nhau ề
Nhi u đi u
tr trên cùng
các đ iố
ngượ
t Ba (hay
nhiêù)
nhóm đi uề
ị ồ
tr g m các
cá nhân
khác nhau ướ
c và
Tr
sau m tộ
đi u trề
ị
(ho c 2ặ
ị ở
ề
đi u tr )
trên cùng
các đ iố
ngượ
t ượ ươ ttest không
ắ ặ
b t c p Phân tích
ng sai
ph ttest b tắ
c pặ ồ
H i quy
ế
tuy n tính
ngươ
và t ừ
ẫ
ng (m u rút t
có phân
ườ
ng và
ng sai hai nhóm Phân tích
ươ
ng sai
ph
ngườ
đo l
ậ ạ
l p l
i ị
Ð nh l
ộ
ố
m t dân s
ố
ph i bình th
ươ
ph
ấ
ồ
đ ng nh t quan
pearson ị ị Ð nh tính Danh đ nh test
McNemar Cochrance
Q c 2 b ng 2 x
ả
n c 2 b ng 3 x
ả
n ệ ố ủ
H s c a
ả
b ng n x m
(phi, OR,
RR) ị Friedman t Kruskal
Wallis ượ
ng h sệ ố
ươ
ng quan
Spearman ứ ự
Ð nh tính Th t
ị
ế
(hay bi n đ nh l
ườ
ng)
không bình th ị
ể
Ki m đ nh
ạ
ắ
s p h ng
có d uấ
Wilcoxon ị
ể
Ki m đ nh
ắ
ổ
t ng s p
h ngạ
Mann
Whitney 1. Chọn lựa kiểm định phù hợp
ư
ế
ả
ị
thuy t là nh nhau). Các
Nh v y nguyên lí c a ki m đ nh ý nghĩa (hay ki m đ nh gi
ừ ả
ệ ự
ế
ệ ự
ki m đ nh ch khác nhau vi c l a ch n th ng kê xu t phát t
0. Vi c l a
thuy t H
gi
ế ế ủ
ch n này ph thu c vào bi n s c a v n đ quan tâm và thi
t k c a nghiên c u.
ể ố
ề
ợ ọ ự ả ị B ng 10. Ch n l a ki m đ nh phù h p ề ể ng v ki m đ nh ý nghĩa (significance testing) đ ị
ố ở ướ
c kh i x
ả ượ
ớ ố ưở
ở
ệ ỉ ệ ố
ộ
ả ử
s chúng ta mu n đánh giá xem m t lo i thu c m i có c i thi n t l ế ơ ị
ượ ề ộ ớ ố ng đ ề
ỉ ằ ồ
ộ
ạ
ị ớ
cđi u tr v i m t lo i thu c m i và m t nhóm t
ử
ệ ằ
c và phát hi n r ng t
ề
ớ ượ
ng đ
ớ
ư ị ằ ỉ ả ơ ị
ố ế ầ ấ t 2 l n v t l t ấ ự
ỉ ệ ố ộ 2. Kiểm định ý nghĩa; Kiểm định giả thuyết
ng b i R A Fisher.
Ý t
ạ
s ng còn 1
Gi
ộ
ệ
ứ
năm sau khi b nh i máu c tim hay không. Chúng ta ti n hành m t nghiên c u các b nh
ươ
ị ớ
ươ
c đi u tr v i
nhân đ
ộ
ị ớ
ố
ả ượ
ề
gi
vong trong nhóm đi u tr v i thu c m i ch b ng m t
d
ả ứ ẹ
ử
ộ ế
n a so v i nhóm đi u tr b ng placebo. Đây là m t k t qu h a h n nh ng có khi ch là
ằ
ộ ế
ỏ
m t k t qu do c may? Chúng ta hãy xem xét câu h i này b ng cách tính giá tr p. Giá
ự
ư
ề ỉ ệ ử
ệ
ị
tr p chính là xác su t có ít nh t s khác bi
vong n u nh thu c th c
ự
s ng còn.
s không có tác đ ng gì lên t l 71 ạ ứ ứ ườ ấ ằ i gi ả ế ủ
ộ ỉ ố
ế ớ ố
ỉ ệ ố ng s c m nh c a ch ng c ch ng l
ố thuy t là thu c không tác đ ng gì lên t l
ứ ẩ ả ể ế
ộ ặ i gi thuy t đ ế ượ
ắ ể
ắ ạ ộ i 0,02 nó ch ra m t cách m nh m r ng gi ờ ả
ả
thuy t không th ế
ể
ả ẽ ng xuyên b l c l ộ ứ ề ị ể ế ề
i giá tr p thu c v nhà nghiên c u. Thí d
thuy t không mà d n t ụ
ẫ ớ
i ị
ế ị ự ả
ị
ộ
ạ
Fisher th y r ng giá tr p là m t ch s đo l
ụ
s ng còn).
thuy t Ho (trong thí d này, gi
ử ụ
ổ
ậ ằ
Ông ta c vũ s d ng P < 0.05 (5% ý nghĩa) làm m c tiêu chu n đ k t lu n r ng có
ớ ố
ệ ố
ạ
ằ
ắ
c ki m đinh, m c dù không có m t quy t c tuy t đ i
b ng c ch ng l
ế ượ
ể
ữ
ằ
c
“N u p n m gi a 0,1 và 0,9 ch c ch n không có lí do gì đ nghi ng gi
thuy t đ
ế
ẽ ằ
ể
ỉ
ướ
ế
ki m đinh. N u nó d
ự ế
ự ệ
ị ạ ố ế
ườ
ượ
i thích đ
. Chúng ta s không th
c cho s ki n th c t
gi
i n u
ướ ở
ưỡ
ọ
ng quy
0,05”
chúng ta ch n m t ng
c
ộ
ả
ằ
ệ
ọ
Đi u quan tr ng, Fisher cho r ng vi c lí gi
ỏ ả
ẫ ớ
ả
giá tr p kho ng 0,05 d n t
i không th tin hay bác b gi
ệ
ộ
quy t đ nh m t th c nghi m khác. {P(B ) th p ấ (cid:222) ế
N u A
{ Ho (cid:222) (cid:222) B (cid:219)
Tkê S } (cid:219) P(A) th p}ấ
ưỡ (cid:222)
ng {P(Tkê S ) < ng ỏ
bác b Ho} ấ ề ủ ế ế ố ớ thuy t” (hypothesis tests) và thay th cho quan đi m ch
ạ
ị ế ả i gi ế ứ
ế ị ọ
ề ứ
ậ ằ ạ ầ ể ả ủ ả ế
ấ ự
ả
ầ ạ ả ậ ộ ự
ỏ ả
thuy t không n u gi
ầ ế
ị ớ ự
ậ ề ế ả ấ ạ ạ ắ
ả ế ố
ả ả c h n ch . Đi u này không ph i là xa l ầ
ế
ị ỡ ẫ ể ế ả ế ậ
ủ
ả
i ch quan c a Fisher, Neyman và Pearson đ xu t cách ti p c n
Không thích cách lí gi
ủ
ể
ả
ể
ị
ượ
c g i là “ki m đ nh gi
đ
ằ
ủ
ạ
thuy t không b ng cách
quan v s c m nh c a giá tr p làm ch ng c ch ng l
ạ
ti p c n khách quan d a vào cây quy t đ nh. Neyman và Pearson cho r ng có hai lo i
ế ậ ủ
ệ
i k t qu c a th c nghi m. Cách ti p c n c a
sai l m có th ph m ph i trong khi lí gi
ế
ế
ế
thuy t
Fisher t p trung vào sai l m lo i m t: xác su t bác b gi
ạ
ấ
không th c ra là đúng. Neyman và Pearson cũng quan tâm đ n sai l m lo i II: xác su t
ị
ự
ế
ả
ch p nh n gi
thuy t th c
thuy t không (và không ch u dùng đi u tr m i) trong khi gi
ơ
ặ
ắ
ầ
ằ
ự
s là sai. B ng cách s p đ t các nguy c sai l m lo i I và lo i II, s các sai l m m c
ạ ớ
ề
ả ẽ ượ ạ
i k t qu s đ
ph i trong khi lí gi
v i ai đã
ứ
ừ
t ng tính c m u cho các nghiên c u có ki m đ nh gi thuy t. ỉ ậ ế ế ể ử ụ ố ế ể ả ỉ ả vong” mà ph i ch rõ nguy c t ớ
ớ ả
ỉ ượ
ơ ử
ứ ọ ố
ể
ả
ề ự
vong 60%” Nhà nghiên c u có quy n t
ầ ể ế ụ ể ố
ả ượ ế ị
ầ ự ề c th c hi n tr ướ
ộ ế ị ệ
ự ắ ạ
ế ậ ủ
ả ế ế i k t qu nghiên c u t tr ệ
ượ ạ ớ ế ấ ừ ủ ị Đ s d ng cách ti p c n NeymanPearson chúng ta ph i ch rõ đ i thuy t (alternative
ố
ơ
c phát bi u đ n gi n: “thu c
hypothesis). Nói cách khác đ i thuy t không th ch đ
ố
ơ ử
ả
m i làm gi m nguy c t
vong gi m bao nhiêu: “thu c
ắ
ơ ử
ả
do ch n quy t c
m i làm gi m nguy c t
ơ
ạ
ơ
ằ
quy t đ nh b ng cách phát bi u c th đ i thuy t, nguy c sai l m lo i I, và nguy c
ứ
ư
c khi nghiên c u. Do đó trong
sai l m lo i II, nh ng đi u này ph i đ
ể
cách ti p c n c a NeymanPearson chúng ta xây d ng m t nguyên t c ra quy t đ nh đ
ỉ
ứ ừ ướ
ả
ứ
giúp lí gi
c khi ti n hành nghiên c u và vi c phân tích ch
ế
ậ
ơ
ậ
ả
ỏ
ả
c l
thuy t không và, ng
đ n gi n là bác b hay ch p nh n gi
i v i cách ti p c n
ứ ụ ể
ộ
ả
ố ắ
ủ
i giá tr p trong t ng m t nghiên c u c th .
ch quan c a Fisher, không c g ng lí gi 72 Phaùt bieån H 0 ; H a Tính soá thoáng keâ
(z; t; chi 2 ; F) Khoâng nhoû Khoâng nhoû Xaùc suaát sai
laàm loaïi 1 Xaùc suaát sai
laàm loaïi 2 tra baûng tính p Thöïc hieän nghieân
cöùu vôùi côõ maãu
lôùn hôn Nhoû Nhoû Baùc boû giaû thuyeát Chaáp nhaän giaû
thuyeát ề ứ ạ ể
i không tìm hi u rõ ràng ý t ơ ế
ấ ủ ỏ ế ằ ả ầ ả ớ ơ ế ậ ủ ế ậ ủ ự ư ươ ầ
ử ụ
ng và s d ng ph n
Đi u đáng ti c các nhà nghiên c u l
ậ
ế
thô s nh t c a cách ti p c n này cho r ng gi
c bác b n u p<
ề
ạ
ầ
0,05 (v i nguy c sai l m lo i 1 là 5%). Đi u này d n đ n c m nh n sai l m là cách
ti p c n c a NeymanPearson t ưở
ẽ ượ
ế
thuy t không s đ
ậ
ế
ẫ
nh cách ti p c n c a Fisher. ng t ộ ả ỏ ả thuy t Ho là đúng. ầ
ầ ạ
ạ ế thuy t Ho sai. thuy t Ho trong khi gi ắ ờ ứ ố
ế ậ
ể ị ườ ế ậ thuy t Ho, ng ầ ắ
ứ
ứ ạ ớ ộ ứ ạ ể ị
ằ ể ề ộ ị ị ế
ả
ể
có th ch c ch n. Do v y, khi nhà
ầ
i nghiên c u có th b sai l m
ỏ ả
ớ
ộ
ầ
0, nhà nghiên c u cũng có th b sai l m (sai l m lo i hai cũng v i m t xác
ể
i ta có th xác đ nh
ạ ầ
ố
ượ ườ
ấ ư ể ầ ầ ộ
c xác su t sai l m lo i m t nh ng không th tính đ c xác su t sai l m lo i hai. ấ
ườ ủ ể ệ ị ạ
ử ụ
ố ự ủ ệ ấ ầ ạ ị ể
ượ ỡ ẫ ố 3. Sai lầm loại một và sai lầm loại hai
ế
thuy t Ho trong khi gi
Sai l m lo i m t: bác b gi
ế
ỏ ả
Sai l m lo i hai: Không bác b gi
ứ
ườ
i ta không bao gi
Trong nghiên c u th ng kê ng
ỏ ả
ế
nghiên c u đi đ n k t lu n bác b gi
ấ
ộ
(sai l m lo i m t v i m t xác su t nào đó). Khi nhà nghiên c u không bác b gi
thuy t Hế
ớ
ấ
su t nào đó). M t đi u nên nh là b ng ki m đ nh th ng kê ng
ượ
đ
ố
ự
i ta còn s d ng khái ni m năng l c (power) c a ki m đ nh th ng kê.
Ðôi khi ng
ự ủ
Năng l c c a ki m đ nh th ng kê = 1 xác su t sai l m lo i 2. Khái ni m năng l c c a
th ng kê hay đ c dùng trong tính c m u. 73 ố ộ ả ạ ệ ỉ ệ ố ộ
s chúng ta mu n đánh giá m t lo i thu c m i có c i thi n t l ị ơ ộ ằ ứ ỉ ố ồ
ẽ ự ớ
ệ
ướ ượ
c l ố ệ ề
ề ệ
ượ ằ
ị ớ ở ơ
ng t s nguy c – nguy c t
ơ ử
c đi u tr v i thu c m i chia cho nguy c t vong ơ ế ỉ ố ớ
ả ơ ử ớ ế ỉ ố
ố ố
ụ ậ ừ ố ệ ể Cho r ng chân lí đã có s n. Chúng ta s d ng s li u đ suy lu n t giá tr c a t s ị ủ ỉ ố ằ
ơ ở ự ư ư ố ả ậ ủ ỉ ố
ả ị ợ
ữ ứ ệ ậ ự
ị ủ ứ ố ự ị ỏ ơ ỉ ố
hay nh h n t s nguy c ng t ơ 4. So sánh các tiếp cận cổ điển (chủ nghĩa tần suất) và Bayes trong suy luận
thống kê
ố
ả ử
s ng còn m t năm
Gi
ử
sau khi b nh i máu c tim b ng m t th nghi m lâm sàng có nhóm ch ng placebo.
ơ ử
vong
Chúng ta s th c hi n đi u này b ng cách
ố
nhóm đ i
trong b nh nhân đ
ứ
ch ng. N u t s nguy c là 0,5, thu c m i gi m nguy c t
vong 50%, n u t s nguy
ớ
ơ
c là 1 thì thu c m i không có tác d ng.
ấ ủ ố ầ ượ ỉ ố
ế ơ ươ
c t s nguy c t
ả
thuy t Ho là đúng. chúng ta đã phát hi n n u gi Th ng kê t n su t ch nghĩa
ử ụ
ẵ
ế
dân s có th c (nh ng ch a bi
nguy c
t)
ố
ơ
ả
Kho ng tin c y 95% cho chúng ta kho ng giá tr h p lí c a t s nguy c dân s ;
ượ ẽ
ầ
Chúng ta th c hi n nghiên c u 100 l n thì 95% nh ng kho ng tin c y tính đ
c s
ch a giá tr c a dân s
ấ
Giá tr p là xác su t có đ
ế
ệ Th ng kê Bayes ủ ủ ớ ườ
Ng
ể ế
ể ệ ắ ầ
ấ ề ỉ ố ơ ố ể ề ế ẽ ố ỉ ậ
i theo ch nghĩa Bayes có cách ti p c n ch quan. Chúng ta b t đ u v i quan
ẽ
ấ ủ ỉ ố ố ệ
ơ ự ố ệ ẵ ố đi m chúng ta v t s nguy c và th hi n nó theo phân ph i xác su t Chúng ta s
dùng s li u đ đi u ch nh ý ki n đó (chúng tá s rút ra phân ph i xác su t c a t s
nguy c d a trên s li u và phân ph i có s n) ả ưở ơ ả
Kho ng tin t ứ ỉ ệ ể ị ẳ
c dùng đ rút ra các kh ng đ nh xác su t v t s ấ ề ỉ ố vong ệ ơ
ự ươ
Có s t ng t ự ị ư
nh (1 đ ẩ
ng t
ả ị
ế ự ỏ ủ ề ậ ng 95% (95% credible interval) là kho ng có 95% c may có ch a t
ố
ơ
ố
s nguy c dân s .
ể ượ
ố ậ
Phân ph i h u nghi m có th đ
ụ
ố
ấ
ơ ử
nguy c – thí d , xác su t thu c làm tăng nguy c t
ệ ử ụ
ố
ự ữ
gi a th ng kê Bayes và vi c s d ng test trong ch n đoán b nh,
ộ
ư ộ
ủ
ươ
ạ
ể
ươ
nh đ nh y, giá tr p t
trong đó power c a ki m đ nh t
ư ỉ ố ộ
ế
ươ
ươ
nh t s đ kh dĩ d
ng t
chuyên) và t
ng. Khi đó n u k t qu là bác b Ho,
ố
ệ
ệ
ố
s chênh h u nghi m c a m nh đ b ng s chênh ti n nghi m x ế ề ổ ể ươ ự ư ế ậ ự
ng t
ả
ề ằ
ệ
ế ậ ng t ệ
ả
ị ề
ả
ủ
ế
nh cách ti p c n c a ế
N u chúng ta không có ý ki n ti n nghi m (chúng ta xem các kho ng giá tr đ u có kh
ả ủ
năng ngang nhau) thì k t qu c a các ti p c n c đi n t
Bayes. 74 ậ ưở ề ệ ố ng 95% (95% credible interval)
ệ
ế ượ ụ ả
ự ư
ươ
nh kho ng tin t
ng t
Kho ng tin c y 95% t
ủ
ấ ậ
ư
ự
ươ
ộ
nh xác su t h u nghi m c a m nh đ thu c làm tăng
Giá tr p (m t bên) t
ng t
ả
ố
ả
ả ử ằ
ơ ử
c k t qu là thu c có tác d ng b o
s r ng chúng ta có đ
vong (gi ả
ị
nguy c t
v )ệ ủ ế ề ệ ế ế ậ ậ
ề ệ ẽ
ơ ồ ề ả ả
Dù v y hai cách ti p c n này s cho k t qu khác nhau ý ki n ti n nghi m c a chúng
ta v m nh đ không ph i là m h 75 Ự Ế Ủ Ắ Ặ Ể Ị S BI N THIÊN C A TRUNG BÌNH KI M Ð NH TTEST B T C P ả ủ ề ọ ậ ẫ ủ
ấ ủ ố ố ứ
ẫ
ứ ượ ự ế
c s bi n thiên c a trung bình m u m u
ườ
c các tính ch t c a phân ph i bình th ng và so sánh phân ph i bình ườ ớ ố
ứ ướ ượ ậ ủ ươ ả ng kho ng tin c y c a trung bình theo ph ng pháp z và c l ươ ượ ể ể ể ị c công th c ki m đ nh m t trung bình theo phép ki m z và phép ki m t. ứ
ắ ặ ắ ặ ự ứ ệ ệ ể Mục tiêu
Sau khi nghiên c u ch đ h c viên có kh năng:
Nh n th c đ
ượ
Trình bày đ
th
ng v i phân ph i t
Trình bày công th c
ph
ng pháp t
ộ
Trình bày đ
Trình bày khái ni m b t c p trong nghiên c u và th c hi n phép ki m t b t c p ố ứ ẫ ố ệ ậ ừ ể ượ ử ụ c s d ng cho các bi n s k t qu ị ưỡ ng và tính t l ươ ộ
ặ ượ
ỏ ơ ng đó. M c dù s d ng ph ị ưỡ
ủ ố ủ ơ ề ỉ ệ ự
d a
ợ
ỉ ệ
thích h p
ả
ế ố ế
ơ
ị ớ
ỉ ệ ố ượ
ng có giá tr l n h n
đ i t
ử ụ
ợ ệ
ng pháp này là h p l
, nó không
ữ
ị
ượ ề ự
c v s phân ph i c a các giá tr và h n n a ệ ể ượ ắ ằ ượ ị ng có th đ ề ỉ ệ ộ ệ các đ i t ế ế ỏ ơ t b ng cách tính
ố ượ
ng
ẽ ị ớ
ậ ơ
ươ ủ ế ả ng pháp rút ra các k t lu n v trung bình c a bi n s đ nh tính. ả ơ ố ế ố ị
ấ
ố ừ ộ ộ
ề ượ ậ ẫ ơ ẽ
c rút ra t
ố ự ị
ẫ ẽ ế ặ ế
t chúng ta s quan tâm đ n: ố
ố ệ ủ
ủ ự ự ủ
ả ẫ ậ ắ
ể ướ ớ ị ị c hay không ộ
ắ ặ ằ
ố ệ ươ ữ ụ 1. Giới thiệu
ậ
ươ
ng pháp suy lu n th ng kê v t l
Trong hai bài qua,chúng ta đã nghiên c u ph
ố
ươ
ẫ
ng pháp th ng kê cho t l
trên s li u thu th p t
các m u ng u nhiên. Ph
ế ố
ị
cho phân tích bi n s nh giá. Chúng cũng có th đ
ằ
ị
là đ nh l
ng b ng cách xác đ nh m t ng
(hay nh h n) giá tr ng
ượ ầ
ử ụ
c đ y đ các thông tin có đ
s d ng đ
ưỡ
ể
ệ ặ
ng có th là tùy ti n.
vi c đ t ra ng
ố ủ ố ệ
ế
t phân ph i c a s li u đ nh l
Chúng ta đã bi
c tóm t
ố
ẩ
toán trung bình và đ l ch chu n. Hai con s này cho thông tin v t l
ị ưỡ
ng. Trong bài này và bài k ti p chúng ta s
có giá tr l n h n (hay nh h n) giá tr ng
ậ
ề
th o lu n ph
ẫ
ộ
ầ
Trong ph n này chúng ta s xem xét m t tình hu ng đ n gi n nh t trong đó m t m u
m t dân s xác đ nh và chúng ta mu n k t lu n v trung
ng u nhiên đ n đ
ệ
bình th c s c a dân s d a trên s li u c a m u. Ð c bi
1. G n kho ng tin c y cho trung bình c a m u
ự ự
2. Ki m đ nh xem trung bình th c s có b ng v i m t giá tr cho tr
3. Áp d ng nh ng ph ng pháp này cho s li u b t c p ẩ ủ ế ố ộ ệ ượ ố m m ộ ệ ằ ộ ố ị 2. Kí hiệu
Chúng ta kí hi u trung bình và đ l ch chu n c a bi n s x trong dân s đích đ
hi u b ng . Ð i v i m t dân s đích xác đ nh thì trung bình c kí
ẩ
và đ l ch chu n s ủ ệ
và s
ố ớ
ệ
ổ
ố
c a dân s là không đ i.
ứ
ế ẫ ọ ng đ
ẫ ộ ệ ẩ ố ượ
ủ
ẽ ượ ế
ứ
ị
c các giá tr trung bình ề
ẩ ố
ượ
c ch n ng u nhiên trong dân s đó và tính
N u chúng ta nghiên c u n đ i t
trung bình ‘ x và đ l ch chu n s c a m u nghiên c u này. N u chúng ta ti n hành ch n
ọ
ế
‘ x và đ l ch
ộ ệ
ậ
ẫ
nhi u m u khác nhau, chúng ta s ghi nh n đ
chu n s khác nhau. Dân số m Trung bình M uẫ
‘ x s ộ ệ s ẩ
Ð l ch chu n 3. Biến thiên mẫu 76 ố ủ ườ ươ i có phân ph i c a huy t áp tâm tr ng nh ư ộ ệ ố
Chúng ta có dân s đích g m 250 ng
ớ
trong hình a v i trung bình ồ
m = 78,2 mmgHg và đ l ch chu n ế
ẩ s =9,4mmHg. ố ủ ươ ố ồ ng trong dân s g m 250 ng ườ (cid:0) =78,2 i { t
á
a
u
s
n
à
a
T 28
24
20
16
12
8
4
0 5
0 7
0 1
0
0 Huye át aùp taâm trö ô ng (mmHg ) ế
(a) Phân ph i c a huy t áp tâm tr
mmgHg, (cid:0) =9,4mmHg} t
á
a
u
s n
ø
a
T 10
8
6
4
2
0 5
0 7
0 1
0
0 Huyeát aùp taâm trö ô ng (mmHg ) ố ấ ỡ ẫ ẫ
ẫ ẫ ế (b) Phân ph i l y mãu cho 30 trung bình m u , c m u = 10 {trung bình (trung
bình m u)=78,23 mmHg, s.d.(trung bình m u)=3,01 mmgHg, s.e. (lí
thuy t)=9,4/=2,97} t
á
a
u
s
n
à
a
t 12
10
8
6
4
2
0 5
0 7
0 1
0
0 Huyeát aùp taâm trö ô ng (m mHg ) ố ấ ỡ ẫ ẫ ẫ (cid:0) =78,2 =trung bình ẫ ẫ ế (c) Phân ph i l y m u cho 30 trung bình m u, c m u = 20 {
m u)=78,14 mmHg, s.d.(trung bình m u)=2,07 mmgHg, s.e. (lý
thuy t)=9,4/=2,10} ươ ượ ử ụ ỗ ầ ố ệ ể ẫ ng trình máy tính đ ươ ủ ườ ươ ủ ế ộ
M t ch
tâm tr ng c a 10 ng ế
c s d ng đ rút ng u nhiên ra m i l n s li u huy t áp
ẫ ‘ x c a huy t áp tâm tr
ậ ạ
i ng. L p l i và tính trung bình m u 77 ố ủ ‘ x đ
ượ
ẫ ủ ể ễ
ể
c bi u di n trên hình b.
‘ x c a 30 m u v i c m u là 20. Phân
ớ ỡ ẫ i đ
ượ c s d ng đ tính
ể
c bi u di n trên hình c. ổ ừ ẫ ẫ m u này sang m u khác ị ậ ẽ ệ
ấ
s xu t hi n m ề ơ ị ẫ
ớ ỡ ẫ
30 m u (v i c m u là 10) chúng ta có phân ph i c a
ạ ượ ử ụ
ươ
Ch
ng trình này l
‘ x này đ
ố ủ
ễ
ph i c a 30
ậ
ố
ừ
T phân ph i này chúng ta có nh n xét:
1. Giá tr ị ‘ x và s thay đ i t
ố m
2. Giá tr ị ‘ x phân b đ i x ng chung quanh giá tr trung bình dân s
ố ố ứ
.
ị ầ m
ị m
3. Giá tr ị ‘ x t p trung chung quanh giá tr
. Nói cách khác giá tr g n
nhi u h n các giá tr xa . ư ẫ ủ ự
ộ ộ
ứ ẩ ộ ệ ằ
ủ ỡ ẫ ượ ộ ệ
ẩ ủ ‘ x còn đ ố
c g i là phân ph i m u c a trung bình.
ủ ‘ x chung quanh giá tr ị m
.Có thể
ế
ẩ ủ ‘ x b ng đ l ch chu n dân s chia cho
ố
c kí ộ ệ
ố
c g i là sai s chu n c a ẩ ủ ‘ x và đ ệ ủ ‘ x (cid:0) / Vi ,) s ể ệ ự ế ư ủ ố X~N(m
ằ
ố ự ế ườ ố ủ ‘ x (nh trong hình b và c) đ
ượ ọ
S phân ph i c a
ố
ủ
Ð r ng c a phân ph i nói lên tính bi n thiên c a
ằ
ằ
ch ng minh b ng toán r ng đ l ch chu n c a
ượ ọ
căn c a c m u. Ð l ch chu n c a
hi u là S.E. c a
(cid:0) x cuûa
ES
n
.
.
ứ
ế
ữ ủ
ọ
t theo ngôn ng c a toán h c hình th c
,s
2) => ‘ X ~ N (m
th hi n s bi n thiên c a giá tr c a t ng cá th trong dân s , trong
Nên l u ý r ng
ẩ s
khi đó sai s chu n ể
ị ủ ừ
ẫ ‘ x.
ủ
ng s bi n thiên c a trung bình m u /(cid:214) n đo l ấ ậ ủ ườ ể ế ể ử ụ
ề m ậ
không quá 1,96 đ l ch chu n c a ả ị ẫ
ng c a trung bình m u
ợ ‘ x
ườ
ng h p
ợ m
ườ
ng h p
ọ
c g i là ự ư ậ ươ ậ ả ậ
ọ ạ ộ nh v y kho ng tin c y 99% là
ủ
ộ ệ ẩ ủ ậ ả ế ố
ố
ở
dân s đích. ở ẫ m u = 11,50 Ñoä leäch chuaån 84,0 ủ ệ ẫ ố ộ ố ớ 5. Ước lượng khoảng tin cậy của một trung bình
ố ệ
Chúng ta có th s d ng tính ch t phân ph i ti m c n bình th
ố m
‘ x đ k t lu n v trung bình c a dân s
ủ
ế ằ
. Chúng ta bi
t r ng 95% các tr
ẩ ủ ‘ x, vì v y trong 95% các tr
ậ
ộ ệ
ằ
n m cách
‘ x –
‘ x –
ả
ằ
ượ
1,96 x S.E) đ
1,96 x S.E. Kho ng giá tr này (
n m trong kho ng
‘ x –
ả
2,58 x S.E.
kho ng tin c y 95%. T
ng t
ẫ
ụ ữ ượ
ế
c ch n m t cách ng u nhiên trong dân
Ti n hành đo đ c hemoglobin c a 25 ph n đ
ố
s đích ta có trung bình và đ l ch chu n c a bi n s hemoglobin là 11,50 và 0,84. Tính
ủ
kho ng tin c y 95% c a trung bình hemoglobin
Trung bình hemoglobin
Ð sai l ch t i đa c a trung bình m u so v i trung bình dân s 1,96 96,1 33,0 n 25 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ư ậ ủ ậ ả ố ở ơ
ở
dân s đích (chính xác h n, kho ng tin c y 95%
ả
ố ẽ ằ
dân s đích) s n m trong kho ng: Nh v y trung bình c a hemoglobin
ủ
ủ
c a trung bình c a hemoglobin
(11,50 – 0,33 ; 11,50 + 0,33) = (11,17 ; 11,83) 6. Sử dụng phân phối t ế ‘ x –
1,96 x s
c s và dùng s đ s ượ
mà ch bi
ộ ế ượ s
t đ
c
ị ắ ữ ậ ợ ứ
ầ ể ậ ả ộ ớ ớ ấ ố ậ do nh h n c ớ
ợ ỡ ẫ ộ ự
ằ ườ
ị ộ ơ ộ ự ườ ẫ ằ /(cid:214) n. Tuy
ằ
ả
ủ
ậ
c tính b ng
t kho ng tin c y 95% c a trung bình đ
Chúng ta bi
ỉ ế ượ
ể ướ
ự ế
t đ
c
chúng ta không bi
nhiên trên th c t
ự
ố
ư
ượ
. Nh ng khi đó chúng ta b m c thêm m t sai s khác n a, vì v y trên th c
ng cho
l
‘ x – 1,96 x s/(cid:214) n ch a ( trong ít h n 95% các tr
ề
ườ
ơ
ả
ế
ng h p và đi u này có nghĩa
t
kho ng
ơ
ừ ố
ừ ố
ả
là đ có kho ng tin c y 95% c n ph i nhân SE v i m t th a s mà th a s này l n h n
ể
ả
ừ ố
ể
ả
ừ ố
1,96. Th a s này có th có tìm th y trong b ng phân ph i t. Ð có th a s cho kho ng
ỡ
ị
ả
ọ
i ta đ c b ng t v i giá tr p hai đuôi = 0,05 và đ t
tin c y 95% ng
ng h p c m u b ng 25 thì đ t
m u m t đ n v . Trong tr ỏ ơ
do b ng 25 1 = 24 . 78 Ñoä leäch chuaån 84,0 ụ ẫ ụ ữ ả ồ ị ủ
ừ ố ệ ộ ớ ụ
ớ
Áp c ng cho thí d m u g m 25 giá tr hemoglobin c a ph n , chúng ta tra b ng t v i
ộ ự
do và v i p hai đuôi = 0,05 chúng ta có th a s 2,064 và đ sai l ch là
25 đ t 2,064 064,2 35,0 n 25 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ả ậ ẽ ậ ử ụ ể ố ợ ả
ườ ể ả ỉ ằ ỉ ậ
ớ ỡ ẫ ả
ề ỏ và kho ng tin c y 95% s là:
(11,50 – 0,35 ; 11,50 + 0,35) = (11,15 ; 11,85)
ỉ
ậ
ằ
ườ
ng h p kho ng tin c y s d ng phân ph i t ch
Chúng ta có th nh n xét r ng trong tr
ố
ử ụ
ậ
ng không đáng k . Nói chung 2
khác kho ng tin c y s d ng phân ph i bình th
ủ ớ
ỡ ẫ
ấ
kho ng tin c y này là x p x b ng nhau khi c m u đ l n (trên 30) và ch khác nhau
nhi u v i c m u nh 7. Kiểm định giả thuyết cho một trung bình ệ ể ủ ả
ụ ữ ị
ở
ng ẫ ạ
ộ ở ộ ụ ồ
ạ ế ặ
ỏ
ọ c ch n m t cách ng u nhiên ộ ệ ủ
ẩ ủ ố ệ ủ ằ ủ
ứ ố ệ ơ thuy t trung bình hemoglobin c a dân s
ượ ạ
c l
ấ
ph n xã này th p h n 12 g/100ml. ộ ỏ ả ở ả ị ả ể
ừ ế ở ụ ữ
ể ả ờ
ế ả ậ ứ ằ ậ
thuy t là 12g/100 ml hay không. T k t qu đã trình bày
ủ
ằ
ố ệ
ế ế ả thuy t nên chúng ta nói r ng s li u không phù h p v i gi ậ ỉ ả ớ ượ ị ứ ộ
ị
ng đ nh l ế ả ồ thuy t bao g m:
ộ ủ ế ồ thuy t Ho: n ng đ hemoglobin c a ph n xã này là 12 g/100ml ườ ể ợ ợ ọ ợ ị ế ẫ ả ẩ ủ ồ
ẫ ố ố ụ ữ
ị
ể
ng h p này ki m đ nh phù h p là ki m đ nh t
ộ
ẫ
ủ
thuy t Ho đúng thì trung bình n ng đ hemoglobin c a m u
(cid:214) 25 = 0,168 và
ằ (cid:0) (cid:0) ườ ế ế ả ố ợ ố thuy t Ho đúng. Trong tr ng h p này phân ph i t s ẽ -x 5,11 12 t 98,2 (cid:0) 5,0
168,0 n /84,0 25 / (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ố m
ố
ộ
ề
Ðôi khi chúng ta mu n ki m đ nh m t gi
.
thuy t đ c hi u v trung bình c a dân s
ườ
ộ
ế
Thí d n ng đ hemoglobin
i ph n kh e m nh là 12 g/100ml. Chúng ta ti n
ụ ữ ượ
m t xã ta có
hành đo đ c hemoglobin c a 25 ph n đ
ế ố
ố
trung bình và đ l ch chu n c a bi n s hemoglobin là 11,50 và 0,84. Chúng ta mu n
ố
ế
ả
ớ
ợ
xem s li u c a chúng ta có phù h p v i gi
ằ
i, s li u này cho b ng ch ng r ng
xã này là 12 g/100 ml hay không hay ng
hemoglobin
ồ
i câu h i này chúng ta có th xem kho ng tin c y 95% có bao g m
M t cách đ tr l
giá tr gi
trên, chúng ta có
ể ấ
ế
th th y r ng kho ng tin c y 95% c a trung bình là 11,15 đ n 11,85 không ch a giá
ị ả
ợ
ớ
tr gi
thuy t trung bình
ế
ỏ ả
hemoglobin là 12 g/100ml. Vì v y chúng ta bác b gi
thuy t này.
ả
ư
ế
ỏ ả
i pháp nêu ch giúp chúng ta bác b gi
Tuy nhiên gi
thuy t nh ng không cho chúng ta
ế
ủ ố ệ
ợ
ợ
ượ
ượ
ị
c m c đ phù h p (hay không phù h p) c a s li u so v i gi
ng đ
đ nh l
thuy t.
ể
ể ử ụ
ườ
ộ
ể
Ð có m t đo l
ng, chúng ta có th s d ng ki m đ nh ý nghĩa và xem
ị
xét giá tr p (pvalue).
ướ ể ể
ị
c đ ki m đ nh gi
Các b
ả
ị
ẳ
Kh ng đ nh gi
ự
ị
ể
L a ch n ki m đ nh phù h p: Trong tr
ế
ộ
m t m u. Nghĩa n u gi
ớ
ẽ
s có phân ph i t v i trung bình là 12, sai s chu n c a m u b ng 0,84/
ộ ự
do là 251 = 24
đ t
ị
Tính giá tr phân ph i t n u gi
b ng:ằ
-x
SE ả ấ ẩ ộ ự ớ ố ẽ ế
t p>0,005 và p<0,01 (n u chúng ta s d ng máy tính chúng ta s bi
ấ ả ế ế ả ả
do. Tra b ng
ử ụ
t chính
ế
thuy t Ho đúng thì xác su t x y ra k t ỏ ơ ố ệ ế ả ấ ớ ợ ế
thuy t Ho ả
ỏ ả ự
Tính p=xác su t x y ra t=2,98 d a trên b ng phân ph i t v i 24 đ t
ế
ế
chúng ta bi
ề
ơ
xác h n v p. p =0,0065). Nói khác đi, n u gi
ả ư
ẽ
qu nh trên s nh h n 0,01
ằ
ự
D a trên k t qu này chúng ta cho r ng s li u này r t ít phù h p v i gi
và chúng ta bác b gi ế
thuy t Ho. 79 ố ề ứ ế ố ố ơ ề ữ ự ế ừ ồ
ộ ẽ ủ
ệ
ệ ườ
chúng ta th
ầ ứ ố ệ ứ ề
ắ ặ
ớ ố ệ ồ ứ ế ế ố ủ ự ế ộ ằ ẫ ầ ử ủ ạ ỏ ộ
ụ ệ ắ ặ
ự ế ọ ố ằ ặ ệ ượ ữ
ề ố ọ ự ố ể ườ ố ượ ệ
ố ượ i ta còn có th dùng chính đ i t ạ ừ ế ố
ng gi ng nhau ng t k nghiên c u nh m lo i b m t ngu n g c c a s bi n thiên
ủ
c a m u) nh m m c tiêu là làm tăng đ chính xác c a
ề ọ
ữ
ự
c th c hi n b ng cách ch n nh ng c p gi ng nhau v m i
ặ
ng di n ngo i tr bi n s mà chúng ta mu n quan tâm. Ngoài cách ch n l a 1 c p
ớ
ắ ặ
ng b t c p v i ụ ề ế ế ắ ặ t k b t c p bao g m: ổ ủ ụ ữ ồ
ướ ng pháp ươ ng pháp này chúng ta ghi nh n ổ ủ ậ ướ
ắ ặ ử ụ ươ ị c tính tu i thai c a ph n mang thai: siêu âm
c tính
ể
ể
ng pháp và s d ng ki m đ nh t b t c p đ so ề
ỏ
ẻ ươ ể ọ ỗ ặ ứ ươ
ụ ứ
ng pháp giáo d c s c kh e v ph
ự
ồ
ng t
ỗ ặ ộ ủ ả ấ
ộ ẻ ể ượ ụ ọ c giáo d c theo cách 1 và ch n m t tr đ ụ
ụ ứ ẽ ượ ỏ ở ẻ ế ả
ng pháp ch i
ề ổ
nhau v tu i,
ẫ
ọ
xã h i c a gia đình. Trong m i c p ch n ng u
c giáo d c theo cách
ằ
c ti n hành b ng ộ ẻ ượ
này s đ hai nhóm tr ị ế ố ị ả t k b t c p, b ng cho thi
ể
ầ ướ
ầ
ệ ố ượ
ỗ ặ ế ế ế ắ ặ
ấ ủ
ố ả ằ ử ụ ủ ố ệ
ố ệ ố ư ủ ể ị ủ ệ ượ ệ ạ ổ ừ ế ấ
ng c a b nh nhân suy hô h p mãn tính tăng carbonic th
i ch a có ph
30% đ n 100%) và hi n t ườ
ươ
ế ằ ệ ể ả ệ ạ ấ ấ ề ậ ướ ề ị 8. Kiểm định t bắt cặp
ậ
V a r i chúng ta nghiên c u v suy lu n th ng kê cho trung bình c a bi n s x trong
ế
ng quan tâm nhi u h n đ n vi c so sánh gi a hai
m t dân s . Trên th c t
ứ
ơ
hay nhi u h n các nhóm. Trong ph n sau chúng ta s nghiên c u vi c so sánh 2 trung
ấ ắ
bình b t c p nghĩa là so sánh trung bình khi s li u quan sát trong nhóm th nh t b t
ặ
c p v i s li u quan sát trong nhóm th hai.
ằ
Vi c b t c p trong thi
(s bi n thiên gi a các ph n t
phân tích. Và đi u này đ
ươ
ph
ồ
g m hai đ i t
chính nó.
ộ ố
M t s thí d v thi
ươ
ả ử
s chúng ta có hai ph
a. Gi
ể
ỏ
ố
hay h i ngày kinh cu i. Ð so sánh hai ph
ỗ
ụ ữ ằ
tu i thai c a m i ph n b ng hai ph
ố ệ
sánh 2 nhóm s li u này.
ươ
ố
b. Chúng ta mu n so sánh hai ph
ề ặ
răng. Chúng ta có th ch n ra nhi u c p, m i c p g m 2 đ a tr t
ế
ộ ọ
trình đ h c v n và hoàn c nh kinh t
nhiên m t tr đ đ
ả
ế
2. So sánh k t qu giáo d c s c kh e
ể
ắ ặ
ki m đ nh t b t c p.
ệ
ể
Ð phân tích bi n s đ nh l
c đ u tiên là ph i tính hi u
ự
ế
ố ủ
s c a hai quan sát cho m i c p (c n đ ý đ n d u c a hi u s ). N u không có s khác
ữ
ệ
ươ
ệ
ng
t gi a hai s li u thì trung bình c a hi u s ph i b ng 0 (zero). S d ng ph
bi
ằ
ở
ể
pháp ki m đ nh s trung bình nh đã nêu
trên đ xem trung bình c a hi u s có b ng
không hay không.
Thí d :ụ
ỉ ệ ử
vong
ng kèm (t l
t
Tiên l
ị ữ
ề
ư
ng pháp đi u tr h u
trong 3 năm thay đ i t
ả
ế ộ
ả
thuy t r ng ch đ ăn gi m
hi u. Tilapur và Mir (Am J Med 1984; 77:987) gi
ườ
carbonhydrate có th c i thi n tình tr ng hô h p. 8 ng
i suy hô h p mãn tính (+tim
ế ộ
ị ằ
ớ
ớ
l n, gan l n, phù và tăng áp ph i) đi u tr b ng ch đ ăn 600 Kcal và ghi nh n PaO2
và PaCO2 tr ổ
c và sau đi u tr . PaO2 PaCO2 Tr cướ Sau Hi u sệ ố Tr cướ Sau Hi u sệ ố 70
59
53
54
44
58 82
66
65
62
74
77 12
7
12
8
30
19 49
68
65
57
76
62 45
54
60
60
59
54 4
14
5
3
17
8 1
2
3
4
5
6 80 7
8 64
43 68
59 4
16 49
53 47
50 2
3 Trung bình 55.6 69.1 13.5 59.9 53.6 6.3 ệ
l ch 9.2 7.9 8.2 9.6 5.9 6.5 ộ
Ð
chu nẩ ị ố ị ể ộ
ớ s chúng ta mu n ki m đ nh phân áp oxy đ ng m ch tr
ướ ị ự ướ
ề
c và sau đi u tr có thay
ư
c nh sau:
ỗ ả ị ề
ằ ế ế ắ ặ ể ọ ị t k b t c p và đ so sánh bi n s đ nh ể
ớ ắ ặ ộ ự ữ ị ng gi a hai nhóm, chúng ta s s d ng ki m đ nh t b t c p v i 81=7 đ t ế ố ị
do. ể
ạ
ả ử
Gi
ẽ ế
ổ
đ i hay không, chúng ta s ti n hành ki m đ nh v i các b
ổ
ủ
ế
ướ
thuy t Ho: Sau đi u tr PaO2 c a m i cá nhân không thay đ i,
B c 1: Xây d ng gi
ệ ố ủ
nói khác đi trung bình hi u s c a PaO2 b ng zero
ợ
ướ
B c 2: Ch n ki m đ nh phù h p: Vì đây là thi
ượ
ể
ẽ ử ụ
l
ướ
B c 3: ệ ố ộ ệ ẩ ủ ệ ố ủ ị Tính trung bình c a hi u s , đ l ch chu n c a hi u s và giá tr t d s t ;5,13 ;2,8 66,4 d s n d
/ (cid:0) (cid:0) (cid:0) (cid:0) ướ
B c 4: ả ộ ự ượ do ta đ c p<0,005và p > 0,002 (chính xác ta có p = 0,0023)
ứ
ỏ ả ớ
ư ậ ướ ớ ư ậ
thuy t Ho v i m c ý nghĩa p <0,005 và nh v y ế ộ ề ế
ự ệ ố Tra b ng t v i 7 đ t
B i 5: Nh v y chúng ta bác b gi
ị
PaO2 đã tăng có ý nghĩa th ng kê sau khi th c hi n ch đ đi u tr . ộ ồ ẫ ẫ ề ề ủ ẻ ồ ầ ề ở ổ ị ệ Bài tập
ằ
ố ệ
1. Sau đây là s li u v chi u cao (tính b ng cm) c a m t m u ng u nhiên g m 20 tr
trai 2 tu i b b nh h ng c u li m 84,4
85,4
82,5
85,4 ề ả ị ẩ ủ
ố 85,0
89,8
81,3
86,3
ố
ủ ơ
ố ầ
thành ph C n Th .
83,4
80,6
80,0
78,5
84,1
89,0
81,9
85,5
ủ
ẻ
ố ệ ứ
ố ề ẽ ấ ủ ố ầ ẽ ả ề
câu a và b hãy phác th o (v phác) phân ph i t n su t c a chi u ự ữ ệ c tính sai s chu n c a trung bình m u. Trình bày s khác bi
ẫ ẩ ủ
ề ố
ẩ ủ ố
ồ ị ủ ẻ ả ố câu d. ườ ủ ả ậ ị ự
ng. Tính kho ng tin c y 95% c a giá tr trung bình th c ố
ủ ườ ư ạ ả ố ng. ề
i kho ng tin c y nh ng s d ng phân ph i t hay vì phân ph i bình th
ẽ ầ ậ
ố ướ ẻ ơ c tính chi u cao tr chính xác h n, chúng ta s c n tăng hay ử ụ
ề
ậ ả ả ả ậ ầ 87,0
89,2
85,0
80,7
ề
ộ ệ
a. Tính trung bình và đ l ch chu n c a chi u cao c a tr trong dân s nghiên c u này
ườ
ng, s li u chi u cao c a dân s này s
đ nh chi u cao có phân ph i bình th
b. Gi
ị
ả
ủ ế
ằ
n m ch y u trong kho ng giá tr nào?
ạ ố ệ
ự ế
ể
i s li u trên th c t
c. Ki m tra l
ả ở
ế
ử ụ
d. S d ng k t qu
ẻ
ủ
cao c a tr .
ẩ
ẫ
Ướ
e.
t gi a sai s chu n
ộ ệ
và đ l ch chu n c a chi u cao c a tr . Phác th o phân ph i m u trên cùng đ th các
ẽ ở
ạ
b n v
ử ụ
f. S d ng phân ph i bình th
ố
ẻ
ự ủ
s c a chi u cao c a các tr này (trung bình dân s ).
ố
g. Tính l
ế
h. N u chúng ta mu n
ố
gi m kho ng tin c y 95%? Mu n v y chúng ta c n ph i làm gì? 81 ơ ơ ả ậ ả ả ậ ẽ ộ ổ ề ế ủ i cho bi ế ế ớ
th gi ồ ầ ề ề ẻ ủ ẻ
ị ệ t chi u cao trung bình c a tr trai 2 tu i là 86,5 cm. T
ằ ể ệ ng hay không?
ể ị ồ ẻ ề ầ ị ằ ị ườ
ẻ
ự
ị
ng. Giá tr p b ng bao nhiêu? Lí gi ề
ẻ
ả
i giá tr p ự ệ ạ t. ự
i sao có s khác bi
ẫ ệ ằ ả
ộ
ị ủ ườ
ệ ạ ạ ậ
t, th o lu n các lí do t
ử
ộ
ỗ ệ ự
ả ề
ố ắ
ớ
ố ộ
ạ ớ ỗ ề
ầ ễ ạ ỏ ề ị ị ể
ố ưở ế ả ố ờ ẫ ử
ế ờ
ể ả ố ả
ng đáng k lên k t qu . ằ
đ nh r ng th t ả ị
ế ả ẹ
i. Kho ng tin c ïy 99% s r ng h n hay h p h n kho ng tin c y 95%. Tính kho ng tin
ậ
c y 95%
ừ
ổ ứ
j. T ch c y t
ấ
ậ
ả
kho ng tin c y chúng ta có cho r ng chi u cao c a tr em b b nh h ng c u li m th p
ơ
h n tr trai bình th
k. Th c hi n ki m đ nh t đ so sánh chi u cao tr trai b h ng c u li m và tr trai bình
ườ
th
ệ
ế
l. N u có s khác bi
ệ
i ta th c hi n m t th nghi m lâm sàng ng u nhiên, mù đôi, b t chéo nh m so
2. Ng
ố
ố ạ
sánh hi u qu đi u tr c a m t lo i thu c h áp đã có (propranolol) v i m t lo i thu c
ạ
ị ớ
ượ
ạ
c đi u tr v i m i lo i thu c h áp trong 8
h áp m i (thu c X). M i b nh nhân đ
ề
ợ
ở
ầ
không đi u tr đ tránh lo i b tác
tu n, và hai đ t đi u tr này cách nhau b i 2 tu n l
ử
ủ
ị ủ
ả ề
ụ
d ng kéo dài c a thu c này nh h
ng lên k t qu đi u tr c a thu c kia (th i gian r a
ố
ạ
ứ ự
dùng 2 lo i thu c này là ng u nhiên và do có th i gian r a trôi, chúng ta
trôi) . Do th t
ưở
ứ ự ử ụ
gi
s d ng thu c không có nh h
ư
ệ
ủ
ế
K t qu theo dõi huy t áp c a 10 b nh nhân này nh sau: ệ ế B nh nhân Huy t áp tâm thu ằ ề ự Propranolo Thu c Xố ạ ệ ứ
ả ủ ế 1 150 130 ậ ủ 2 148 131 ủ ả
ệ ố 3 107 144 ậ 4 159 144 ế 5 171 113 ể ế
ẫ
ổ ể ế
25 tr 6 110 128 ươ 7 140 112 8 138 112 ệ
t
a. Có b ng ch ng v s khác bi
ố
ề
v hi u qu c a hai lo i thu c
lên huy t áp tâm thu hay không?
b. Tính kho ng tin c y c a trung
ạ
ế
bình hi u s huy t áp c a hai lo i
thu c.ố
c. Chúng ta có th k t lu n gì?
ấ
3.Ti n hành l y m u huy t thanh
ệ
ở
ẻ ướ
i 5 tu i đ tìm hi u
d
ế ớ
ư
ể
giá kháng th ng ng k t v i não
ầ ử ụ
ng pháp pha
mô c u s d ng ph
ả ư
ế
loãng. K t qu nh saub:
1:8 1:16 1:8 9 143 116 1:8 1:8 1:64 10 126 134 1:1
1:32
1:1
1:8 1:16
1:4
1:4 ệ ườ ử ụ 1:1
1:16
1:1
ị ượ i ta tính đ ệ ố ng, hi u giá kháng th s ố ố ệ ằ ố ệ
ế ể
i sao?
ị ầ ớ ử ụ ủ ệ ả ả c trên s d ng log c a ngh ch đ o hi u giá. Có ph i ph n l n các giá ị
i các b ướ
ả ạ ủ ủ ệ ả ậ ủ
ậ ủ ố ệ ụ ạ ả ấ 1:8
1:8
1:8
1:8
1:32
1:8
1:128 1:2
1:4
ệ
ả ủ
c hi u giá trung bình là 16,2 và
a. S d ng ngh ch đ o c a hi u giá, ng
ể ẽ
ẩ
ườ
ả ử ệ
ộ ệ
s hi u giá có phân ph i bình th
đ l ch chu n là 27.0. Gi
ả
ả
ủ ế
ằ
n m ch y u trong kho ng s li u nào? Ki m tra có ph i đa s s li u n m trong
ạ
ả
kho ng giá tr đó hay không? N u không, t
ậ ạ
b. L p l
ị ằ
tr n m trong kho ng đã tính hay không? T i sao?
ể
c. Tính kho ng tin c y 95% c a trung bình c a log c a hi u giá kháng th .
ả
d. Aùp d ng hàm mũ (antilog) cho kho ng tin c y c a log. S li u này là gì? T i sao
chúng ta ph i l y log trong phân tích này? 82 83 Ắ Ặ Ể Ị SO SÁNH HAI TRUNG BÌNH KI M Ð NH T KHÔNG B T C P ứ ủ ề ọ ả ệ ố ả ể ể ằ ị ả ị ủ ể Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năng
ậ ủ
1. Tính kho ng tin c y c a hi u s hai trung bình
ế
ả
2. Ki m đ nh gi
thuy t hai trung bình là b ng nhau theo phép ki m t và phép ki m z
ượ
c các gi
3. Trình bày đ ể
ể
đ nh c a 2 phép ki m t và phép ki m z. ầ ứ c chúng ta đã nghiên c u ph ộ ậ
ố ệ ừ ộ ẫ ẫ ặ ủ ượ
ệ ố ướ ươ
ố ự
ng trong m t dân s , d a trên s li u t
ộ ế ố ủ ả ự c sau c a m t bi n s c a cùng dân s . Trên th c t
ủ ố
ố ử ụ ệ ự ườ
ắ ặ
ữ ố
ấ ủ ẫ ứ ấ ủ ẫ
ẳ
ẫ ươ ứ ẽ ầ ng pháp ệ ố ả ằ ả ị 1. Giới thiệu
ề
ố
ướ
ng pháp suy lu n th ng kê v trung bình
Trong ph n tr
ế ố ị
ộ
ủ
m t m u ng u nhiên
c a m t bi n s đ nh l
ự ế
ủ
,
ho c trung bình c a hi u s tr
ẫ
ệ
ng ph i th c hi n vi c so sánh trung bình c a hai dân s s d ng m u
chúng ta th
ọ ừ
hai dân s khác nhau và không có s liên
không b t c p. Ðó là hai m u chúng ta ch n t
ệ
ộ
ứ
ạ
ệ
h gì gi a các quan sát, ch ng h n quan sát th nh t c a m u m t không có liên h gì
ớ
v i quan sát th nh t c a m u hai.
Trong ph n này chúng ta s nghiên c u hai ph
ậ ủ
1. Tính kho ng tin c y c a hi u s hai trung bình và
ế
thuy t hai trung bình là b ng nhau
2. Ki m đ nh gi
ắ ặ
ứ ể
ụ ẫ
ng d ng cho hai m u không b t c p. 2. Kí hiệu ệ ế ố 1 và trong dân s th hai là ố ứ
ố ấ
ị m 1
2. Hi n nhiên là v i hai dân s xác đ nh, các ộ ệ ớ
2 là không đ i.ổ
ẫ ẩ ủ
ể
1 và s
ọ ộ ệ
m 2 và s
ẩ
ố ượ ố ng đ ẽ c ch n ng u nhiên trong dân s 2, chúng ta s tính đ c trung bình ẫ
ẫ ẫ Chúng ta kí hi u trung bình và đ l ch chu n c a bi n s x trong dân s th nh t là
và s
ố ứ
ố s
trung bình m 1, m 2 và các đ l ch chu n dân s
ượ
ố
ứ
ế
c ch n ng u nhiên trong dân s 1 và n2 đ i
N u chúng ta nghiên c u n1 đ i t
‘ x1 và độ
ượ
ọ
ố
ượ
t
ng đ
ủ
ẩ 2 c a m u 2.
ủ
ệ
l ch chu n s ượ
ẩ 1 c a m u 1 và trung bình ‘ x2 và đ l ch chu n s
ộ ệ Trung bình Dân s 1ố
m 1 Dân s 2ố
m 2 M u 1ẫ
‘ x1 M u 2ẫ
‘ x2 1 2 s s ộ ệ ẩ
Ð l ch chu n s1 s2 ạ ự ệ ữ ộ ưỡ
ng
ứ ế
c ti n hành tu i tr
ẹ ổ ượ ả
2 làng_.
i 7 tu i đ ỉ ượ ổ ẻ ẩ 2max) trên các nam thanh niên t ứ ấ ứ
ố ừ ạ ộ ượ ưỡ ổ ạ
ở ổ
tu i thi u nhi và kh năng ho t
ở
ượ
Ở ộ
ế
m t
ổ
ướ
ấ ả ẻ
c b
t c tr em d
ng và giàu protein (Atole: 163 KCal + 6,4 g protein/180
ượ
ự
ng
ưỡ
ng
ế
i làng và ti n
ế
14 đ n
ấ
ng trong lúc mang thai và ít nh t ệ
ở ạ
c ch m d t vào năm 1977. Vào năm 1988, các nhà nghiên c u tr l
ự ạ
ổ
c b sung dinh d
ả ư ụ
ng đ
ế ầ 3. Thí dụ
ể
Ð đánh giá s liên h gi a tình tr ng dinh d
ể ự ở ổ ưở
ộ
ng thành, m t nghiên c u đ
đ ng th l c
ấ ả
t c các bà m mang thai hay cho con bú và t
làng, t
ượ
ự
ẩ
sung th c ph m giàu năng l
ẹ
ở
mL) và
c b sung th c ph m nghèo năng l
làng khác các bà m và tr em ch đ
và không có protein (Fresco: 59 KCal + 0 g protein/180 mL). Can thi p dinh d
ượ
đ
hành đo đ c t c đ tiêu th oxy c c đ i (VO
ố ượ
18 tu i (đây là các đ i t
ộ ờ
trong 3 năm đ u cu c đ i). K t qu nh sau can n VO2max (L/phút) Nhóm
thi pệ ộ ệ Trung bình m uẫ ẩ
Ð l ch chu n 84 44 Atole 2,62 0,54 Fresco 42 2,24 0,54 ừ ố ệ ự ạ ở ể ế ề ố ụ ộ hai nhóm ưỡ ậ
T s li u này chúng ta có th k t lu n gì v t c đ tiêu th oxy c c đ i
ệ
can thi p dinh d ng. ố ả ử ượ ổ ồ ộ ng đ
ổ ưỡ c b sung dinh d ng đ ố ượ
ượ
ỡ ẫ ả ử ế ồ ề
ố ượ
ệ
s chúng ta ti n hành nhi u l n vi c rút ra c m u g m 44 nam thanh niên t ề
ề ầ
ừ
dân s P2 và chúng ta tính hi u s trung bình (
ỳ ệ ố ố ủ ặ ổ ệ ố
‘ x1 ‘ x2) có các đ c tính sau thay đ i tu theo gi ớ
ưỡ
ng v i
c b sung dinh d
ớ
ng v i Fresco.
ừ
dân
‘ x1 ‘ x2).
ả ủ 4. Phân phối mẫu của hiệu số hai trung bình
ộ
s chúng ta có m t dân s P1 g m nhi u đ i t
Gi
ồ
ố
Atole và m t dân s P2 g m nhi u đ i t
Gi
ố
ố
s P1 và 42 nam thanh niên t
Phân ph i c a các hi u s trung bình (
ị
đ nh c a chúng ta: ủ ươ ố ằ ng sai c a 2 dân s b ng nhau ổ ừ ẫ ẽ ẫ m u này sang m u khác ( ‘ x1, s1,‘ x2, s2 cũng thay đ i tổ ừ ẫ ẫ ố ố ứ ị ệ ố m 1 m 2) là hi u s trung ự ủ ẽ
ố a. Ph
1. Giá tr ị ‘ x1 ‘ x2 s thay đ i t
m u này sang m u khác)
2. Giá tr ị ‘ x1 ‘ x2 s phân ph i đ i x ng chung quanh giá tr (
bình th c c a dân s P1 và P2: ổ ế ẽ ơ ị 3. Các giá tr g n ( ớ m 1 m 2) (cid:0) ẽ ượ ứ ố ị ầ m 1 m 2) s ph bi n h n các giá tr xa v i (
ẩ ủ ‘ x1 ‘ x2) s đ c tính theo công th c: 4. Sai s chu n c a ( SE ( ) 1
n 1
n
1 2 (cid:0) (cid:0) ế ọ Vi ứ
t theo ngôn ng toán h c hình th c 2) => (‘ X1 ‘ X2)~(m 1 m 2 , ) X1~N(m 1,s ữ
2) và X2~N(m 2,s ố ủ ươ ng sai c a 2 dân s khác nhau ổ ừ ẫ ẽ ẫ ‘ x1, s1,‘ x2, s2 cũng thay đ i tổ ừ m u này sang m u khác ( ẫ ẫ ệ ố ố ố ứ ị m 1 m 2) là hi u s trung ự ủ ẽ
ố b. Ph
1. Giá tr ị ‘ x1 ‘ x2 s thay đ i t
m u này sang m u khác)
2. Giá tr ị ‘ x1 ‘ x2 s phân ph i đ i x ng chung quanh giá tr (
bình th c c a dân s P1 và P2: ẽ ổ ế ơ ị 3. Các giá tr g n ( ớ m 1 m 2) ố ẽ ượ ứ 4. Sai s chu n c a ( c tính theo công th c: (cid:0) 2
2 SE ( ) n 2
1
n
1 2 ị ầ m 1 m 2) s ph bi n h n các giá tr xa v i (
ẩ ủ ‘ x1 ‘ x2) s đ
(cid:0) (cid:0) (cid:0) 1 2 ế Vi ứ
t theo ngôn ng toán h c hình th c
2) => (‘ X1 ‘ X2)~(m 1 m 2 , )
ử ụ X1~N(m 1,s
ứ ể ứ ệ ủ
ng sai c a t ng (hay hi u) c a ế ố ộ ậ ẽ ằ ủ ổ ữ
ọ
2) và X2~N(m 2,s
ươ
Công th c này có th ch ng minh s d ng đ nh lí: ph
ủ
2 bi n s đ c l p s b ng t ng c a hai ph ươ ươ ươ Ph ng sai c a ( ủ ‘ x1 ‘ x2) ủ ổ
ị
ế ố
ươ
ng sai c a 2 bi n s đó.
ủ ‘ x1 ) + Ph ng sai c a ( ng sai c a ( ủ ‘ x2) = Ph
= 85 6. Kiểm định giả thuyết để so sánh hai trung bình ế ể ể ị ế ố ổ ỳ ị ườ ậ ố thuy t là hai trung bình dân s ,
ệ ố
ả
thuy t Ho đúng thì hi u s trung bình m u s
ẩ
i giá tr 0 và có sai s chu n thay đ i tu theo gi ố m 1 và m 2, b ngằ
ẫ ẽ
ả ố
ả
Chúng ta có th mu n ki m đ nh gi
nhau hay nói khác đi (m 1 m 2)=0. N u gi
ế
ạ
có phân ph i bình th
ng, t p trung t
đ nhị (cid:0) ươ ố ằ ủ a. Ph ng sai c a 2 dân s b ng nhau SE ( ) 1
n 1
n
1 2 (cid:0) (cid:0) ệ ố ẫ ẽ ủ ị Khi đó, Giá tr Z c a hi u s trung bình m u s : 2 2 2 (cid:0) (cid:0) x ( ) ( ) x
1 (cid:0) (cid:0) Z x
SE (cid:0) (cid:0) ( ) 1
n x
1
1
n
1 s ễ ự ể ị ộ m t cách chính xác, chúng ta s )1 ( 2
2 2 s n
n n
1
( )1
)1 (
( n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Tuy nhiên trên th c ti n do chúng ta không th xác đ nh
2
s
1
)1 s ể ế ẽ đ thay th cho . Khi đó chúng ta s có giá ả ử ụ
ph i s d ng
tr t ị 2 2 2 (cid:0) (cid:0) x ( ) ( ) x
1 (cid:0) (cid:0) t x
SE (cid:0) s ( ) 1
n x
1
1
n
1 ộ ự v i nớ 1+n22 đ t do (1) (cid:0) (cid:0) 2
2 ươ ủ ố b . Ph ng sai c a 2 dân s khác nhau SE ( ) n 2
1
n
1 2 (cid:0) (cid:0) ệ ố ẫ ẽ ủ ị Khi đó, Giá tr Z c a hi u s trung bình m u s : 2 2
2 2
1
n
1 2 (cid:0) (cid:0) ( ) ) x
1 (cid:0) (cid:0) Z x
(
1
(cid:0) x
2
(cid:0) x
SE (cid:0) ( ) n 2, nên chúng ta ph i s d ng s ự ư ậ ậ ở ự ng t nh l p lu n trên, trên th c ti n do chúng ta không bi s s ế ả ử ụ ễ
ế
1 thay th cho ế ượ
t đ
1 và s2 thay th cho c chính
2 và chúng ươ
Cũng t
1 và s
xác s
ta có giá tr t:ị 2 2 2
s
2
n 2 2
s
1
n
1 (cid:0) (cid:0) x ( ) ) ( x
1 x
1 (cid:0) (cid:0) t x
SE (cid:0) ) ( 2 (2) 2
s
2
n 2 2
s
1
n
1 4
2 4
s
1
2
nn
(
1
1 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) fd
. . (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) )1 )1 s
2
nn
(
2 (cid:0) (cid:0) v i ớ (3) 86 ệ ươ ng sai khác nhau t
ườ ằ ử ụ
do khi s d ng gi
ố
do c a phân ph i t khi ph đ nh 2 ph
ng sai không b ng nhau th ả ị
ươ
ố ầ ớ ủ ng gi ầ
ả ị
đ nh n u c m u c a 2 nhóm đ u trên 20 thì đ t ỉ ầ ể ẩ ả ươ ứ ể
ượ ọ ể ị ứ
c g i là công th c ki m đ nh z ố
ươ
ộ ự
ứ
ng đ i
Vi c công th c tính đ t
ỉ
ủ
ớ
ộ ự
ng ch tính
khó nh nên đ t
ề
ườ
ố
i ta
toán các ph n m m th ng. Khi phân tích th ng kê v i máy tính c m tay, ng
ế ỡ ẫ ủ
ẽ
ộ ự
ề
ườ
do c a t s trên 30 (xem
th
ố
ả
ầ
ả
b ng 1). Khi đó có th không c n tra b ng t mà ch c n tra b ng phân ph i chu n. Do
ớ
ằ
ị
đó, đôi khi công th c ki m đ nh t cho 2 trung bình khi ph
ng sai không b ng nhau v i
ỡ ẫ ớ còn đ
c m u l n
Bảng 3. Độ tự do của t khi phương sai không bằng nhau tương ứng với phương sai nhóm
và cỡ mẫu của 2 nhóm khác nhau 1 ộ ệ ẩ
Đ l ch chu n nhóm 1: s 1 1 1 2 2 2 1 ỡ ẫ C m u nhóm 1: n 10 20 20 10 20 20 2 ộ ệ ẩ
Đ l ch chu n nhóm 2: s 1 1 1 1 1 1 2 ỡ ẫ C m u nhóm 2: n 10 10 20 10 10 20 ộ ự Đ t do 18 18 38 13 28 28 ứ ứ ứ ể ể
ỉ ử ụ ề ng. Tuy nhiên công th c (1) s d ng khi có th gi ử ụ
ể ử ụ ứ
ả ứ ế ố ầ
ể ả ị
ỡ ẫ ủ
ử ụ ươ
ề ớ
ứ ườ ươ ợ ng h p n u 2 ph
ụ ể ộ ự ứ ứ
ạ
ị
i, chúng ta có 2 công th c đ ki m đ nh 2 trung bình: công th c (1) và công th c
Tóm l
ố
ượ
ả
c khi bi n s c n so sánh có phân ph i
(2). C hai công th c này đ u ch s d ng đ
ằ
ườ
bình th
ng sai b ng
đ nh là 2 ph
ỉ ơ
nhau và công th c (2) ch đ n gi n đ s d ng khi c m u c a 2 nhóm đ u l n. Trong
ế
tr
ng sai không b ng nhau, chúng ta s d ng công th c (2) và tính
toán c th đ t ằ
do theo công th c (3). ụ ự ạ ở ộ ử ụ ố ả hai nhóm thanh niên, gi ế
thuy t ượ ư ạ ở ự ằ ố nhóm Atole b ng trung bình t c đ s ộ ử ự ạ ở 7. Thí dụ về tính toán kiểm định so sánh 2 trung bình
1. Trong thí d so sánh t c đ s d ng oxy c c đ i
c đ a ra là
Ho đ
ố
Ho: trung bình t c đ s d ng oxy c c đ i
ụ
d ng oxy c c đ i ộ ử ụ
nhóm Fresco ả ị ằ ở ề ớ đ nh (a) ph ề
ng sai b ng nhau và (b) c m u 2 nhóm đ u l n đ u ộ ỡ ẫ
ể ươ ị ở m A = m F
ả
ươ
B i vì c hai gi
ể ọ ử ụ
đúng, chúng ta có th ch n s d ng m t trong 2 ph ng pháp ki m đ nh trên: ể ử ụ ị ả ị ươ đ nh ph ằ
ng sai b ng nhau 2 2 ị ố 2a. Ki m đ nh s d ng gi
3a. Tính giá tr th ng kê s ( )1 43 2 2
2 s 54,0 n
n n
1
( 2
s
1
)1 (
( )1
)1 54,0
)1 44( 41
42( 54,0
)1 n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ớ ộ ự
ộ ự
ể ả ố ớ
do
v i 84 đ t
do khá l n nên chúng
4a. Vì đ t
ẩ
ta có th tra b ng phân ph i chu n ả
z thay cho b ng t. Ta có P(|Z|‡ 3,26)=0,0012 ế ự ế ể ả ể ế ằ t r ng p <0,01 và N u chúng ta không th tính tr c ti p p, tra b ng chúng ta có th bi
p>0,001 87 ố ệ
ộ ử ụ ẻ ằ ố ớ
ể
ỏ
ở ổ
ng b ng Atole tu i nhà tr làm tăng t c đ s d ng oxy t ế
5a. Khi đó chúng ta có th bác b Ho v i p=0,0011, hay nói khác đi s li u cho phép k t
ố
ệ
ậ
i
lu n can thi p dinh d
ở ổ ưở
tu i tr
đa ưỡ
ng thành (p=0,0011). ể ử ụ ị ả ị ươ ằ đ nh ph ng sai không b ng nhau ị ố 2b. Ki m đ nh s d ng gi
3b. Tính giá tr th ng kê 2 2
2 2
1
n
1 2 (cid:0) (cid:0) (cid:0) ( ) ) 62,2( )24,2 x
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t ) 26,3 x
(
1
(cid:0) x
2
(cid:0) x
SE 38,0
1165
,0 ,0 01357 (cid:0) ( ) n ủ ể ằ ở
b i vì c m u c a 2 nhóm đ u l n chúng ta có th cho r ng đ t ớ ề ớ
ố ả ể
ể ử ụ ộ ự ứ ủ ể ở ộ ự
do c a t cũng
ẽ
ặ
ố
ế
ố
do c a phân ph i t trên đ tính đ t ị ỡ ẫ ủ
ẩ
ả
khá l n và có th tra b ng phân ph i chu n z thay cho b ng t. N u mu n ch t ch
chúng ta có th s d ng cong th c đã trình bày
ằ
b ng 83,8.
4b. Tính giá tr p: P(|Z|‡ 3,26)=0,0012 ậ ố ệ
ộ ử ụ ở ổ ằ ố tu i nhà tr làm tăng t c đ s d ng oxy t ệ
ưở ế
5b. K t lu n:
ậ
ế
Chúng ta có th bác b Ho v i p=0,0011, hay nói khác đi s li u cho phép k t lu n can
ở ổ
ố
ẻ
thi p dinh d
tu i
i đa
tr ớ
ỏ
ể
ưỡ
ng b ng Atole
ng thành (p=0,0012). ả ị ở ỏ trên đòi h i 2 gi đ nh: ẫ ủ ệ ố ẫ ẫ ố ườ 7. Ðiều kiện sử dụng test Z
ư
Test Z nh trình bày
ẫ ủ
ố
1. Phân ph i m u c a trung bình m u và phân ph i m u c a hi u s trung bình m u có
ỉ
ố ấ
phân ph i x p x bình th ng. 2 có th đ 1 và s ẩ ộ ệ ể ượ ướ ượ
c ộ
ng m t c l ẫ 1 và s2. ộ ệ
ứ ị ủ ố ệ ố ỉ ớ ỡ ẫ ớ ườ ả ng ngay c khi giá tr c a s ị
ậ
ố ố ố s
ự ự ộ ệ
ẩ
2. Ð l ch chu n th c s (đ l ch chu n dân s )
ẩ
cách chính xác b ng đ l ch chu n m u s
Chính xác ra, gi
ườ
ố
ph i bình th
ố ủ
ẫ ẽ ệ
ph i c a trung bình m u s ti m c n phân ph i bình th
ệ
li u trong dân s không có phân ph i bình th ằ
ế
ấ
ả ị
đ nh th nh t ch đúng n u giá tr c a s li u trong dân s có phân
ớ ạ
i h n trung tâm, v i c m u l n thì phân
ng. Tuy nhiên theo đ nh lí gi
ố
ị ủ ố
ườ
ng. 1 và s2. cũng 1 và s
ủ ớ s ng khá chính xác ướ ượ
c l ủ ậ ế
ỡ ẫ
ườ ủ ổ ứ ồ ừ ạ ỡ ẫ
ch c đ không quá không bình th 20 tr lên) và hình d ng c a t ổ ứ ồ ỡ ẫ ớ
ứ
2 n u c m u l n.
đ nh th hai, s
ỗ
ươ
ng pháp z nói chung đáng tin c y khi c m u đ l n (c m u c a m i
ở
ng. Ngoài
ầ
ng, chúng ta c n
ườ ấ
ch c đ chúng ta th y phân ph i b l ch d
ố ở ạ ầ
ể ố ị ệ
ố ế ả ổ ố ề ả ị
V gi
ậ
Vì v y, ph
nhóm t
ế
ra n u phân tích trên t
ph i dùng bi n đ i log đ phân ph i tr l ươ
i g n gi ng phân ph i bình th ng. ở ẫ ẽ ị ạ ử ụ
trên s b vi ph m và khi đó s d ng ườ ả ị
ỏ ả
đ nh nêu
ậ
ng là không đáng tin c y.
ổ ứ ồ ị ấ
ch c đ cho th y các giá tr là t
ố ườ t v i phân ph i bình th ươ
ể ử ụ
ố ệ ớ
ể ở ị ử ụ
ẫ 2. Tuy nhiên ph
1 và s ử ụ
ươ ấ
ẩ ẩ
ng pháp này đòi h i thêm m t gi s đ nh là hai đ
ươ ằ ớ ộ
ả ị
ậ
. Vì v y ph
ớ ỏ
ị
ỉ ố ủ ộ ệ ẩ 8. Phương pháp với mẫu nhỏ
ộ
ế
N u m t trong haim u nh , c hai gi
ỉ
ấ
x p x bình th
ố ố ứ
ế
ng đ i đ i x ng
Tuy nhiên n u chúng ta phân tích t
ươ
ng
ng, chúng ta có th s d ng ph
và không quá khác bi
ả ừ
ế
phép ki m đ nh z nêu
trên. Ðó là s d ng phân ph i t và trong đó
pháp bi n c i t
ố
ậ
ộ ệ
ộ ệ
ch p nh n sai s thêm vào khi s d ng đ l ch chu n m u s1 và s2 thay vì đ l ch
1 và s
ự s
ộ
chu n th c
ự s
ẩ
ằ
ệ
ng pháp
l ch chu n th c
2 là b ng nhau và b ng v i giá tr chung
ơ
ỏ
này đòi h i hai đ l ch chu n không quá khác nhau (t s c a chúng không l n h n 2). 88 ươ ự ư ể ư ị ỉ ở ị ng t nh ki m đ nh z nh ng ch khác ứ
công th c ẩ ứ ủ
ể
Công th c c a ki m đ nh t cũng t
ố
ủ
c a sai s chu n: 2 (cid:0) (cid:0) SE s ( ) 1
n 1
n
1 2 2
2 2
s
1
)1 2 (cid:0) (cid:0) (cid:0) s ( )1 (cid:0) s vôùi (cid:0) (cid:0) (cid:0) n
n n
1
( (
( )1
)1 n
1 s ứ ủ ộ ệ ướ ượ
c l ng c a đ l ch chu n chung và đ ộ ẩ
ủ ộ ệ ộ ệ ứ 2 2 2 ẫ ố
ị ẩ
ị ườ ố ộ ệ
ượ ọ
c g i là đ l ch
Trong công th c trên s là
ớ
ẩ
ẩ
chu n g p (pooled standard deviation) và trung bình c a hai đ l ch chu n s1 và s2 v i
ệ ố
h s là m u s trong công th c tính đ l ch chu n.
ể ể
i ta tính giá tr t
Ð ki m đ nh ý nghĩa th ng kê ng (cid:0) (cid:0) x ( ) ( ) x
1 (cid:0) (cid:0) t x
SE (cid:0) s ( ) 1
n x
1
1
n
1 2 2
2 2
s
1
)1 2 (cid:0) (cid:0) (cid:0) s ( )1 (cid:0) s vôùi (cid:0) (cid:0) (cid:0) n
n n
1
( (
( )1
)1 n
1 ử ụ ằ ộ ự ườ ườ ọ ớ ợ ầ
ề
ng h p này ng do. Trong tr ố
ả
ồ
r i tính P(|t|>to) b ng cách s d ng các ph n m m máy tính hay tra b ng phân ph i
student v i (n1+n22) đ t
i ta g i đây là test t không
ắ ặ
b t c p. ậ ủ ể ả ử ụ ứ ằ ố Ð tính kho ng tin c y c a hi u s ( ệ ố m 1 m 2) b ng th ng kê t ta s d ng công th c: x t s ( ) ( ) x
1 2 1
n 1
n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) ị ở ượ ừ ả ố giá tr t đây cũng đ c tra t b ng phân ph i student. ị ị ế ươ ươ ư ậ ng đ
ố ố
ể ử ụ
ng. Nh v y chúng ta có th s d ng th ng kê z hay t trong ệ ố ị ệ ỉ ủ
ở
thi
ề ề ề
ẫ ủ ể ố ế ế
ệ
ườ ủ
ắ ặ
ụ
ộ ệ ỡ ẫ
ằ ủ ớ
ộ ệ ẫ ẩ ố ườ ỉ ị ề
ng (trong tr ả ấ
ộ ệ ệ ẫ ẫ ầ ư ể ố ố ỡ ẫ
ầ ụ
ườ ụ
ồ ươ ấ ố ỏ
ả ử 9. So sánh kiểm định z và kiểm định t
ố ị
ể
ể
ng trong th ng kê các bi n s đ nh
Ki m đ nh z và ki m đ nh t hoàn toàn t
ượ
ả
ướ ượ
l
ng kho ng tin
c l
ể
ậ
c y c a trung bình, c a hi u s 2 trung bình, ki m đ nh ý nghĩa trong so sánh 2 trung
ắ ặ
t k có b t c p và không b t c p. Chúng ch khác nhau v đi u ki n áp
bình
ụ
d ng. Ði u ki n áp d ng c a th ng kê z là c m u đ l n (đ trung bình m u có phân
ệ
ầ
ẩ
ố
ng và đ l ch chu n m u g n b ng đ l ch chu n dân s ). Ði u ki n
ph i bình th
ườ
ố ủ
ố
ụ
áp d ng th ng kê t là phân ph i c a các giá tr ph i x p x bình th
ng
ẩ ủ
ề
ợ
h p so sánh 2 m u nó c n thêm đi u ki n là hai đ l ch chu n c a 2 m u không quá
khác nhau).
Khi chúng ta không th áp d ng th ng kê z hay th ng kê t, thí d nh khi c m u nh
ặ
ng sai không đ ng nh t ta c n ph i s
và phân ph i không bình th
ng ho c hai ph
ố
ể
ụ
d ng các phép ki m phi tham s . ậ ả ệ
ả ứ ủ ẽ ậ ủ
đ n, chúng ta s có các công th c kho ng tin c y 95% c a hi u s ( ả ị 5. Khoảng tin cậy của hiệu số hai trung bình
ậ
ậ
ử ụ
S d ng l p lu n chúng ta đã trình bày cho vi c tính các kho ng tin c y c a trung bình
ệ ố m 1 m 2) tuỳ
ỉ ệ ơ
và t l
theo các gi đ nh: ả ị ươ ằ a. Gi đ nh ph ng sai 2 nhóm b ng nhau ậ ủ ể ả ử ụ ứ ằ ố Ð tính kho ng tin c y c a hi u s ( ệ ố m 1 m 2) b ng th ng kê t ta s d ng công th c: 89 x t s ( ) ( ) c x
1 2 1
n 1
n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) ị ớ ạ ủ ộ ự v i tớ c là giá tr t i h n c a phân ph i t ố ở 1+n2 2 đ t n do s ( )1 2 2
2 s n
n n
1
( 2
s
1
)1 (
( )1
)1 n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) v i ớ ả ị ươ b. Gi đ nh ph ng sai 2 nhóm không b ng nhau ả ươ ủ ằ ằ
ệ ố m 1 m 2) khi ph ng sai c a 2 nhóm không b ng nhau đ ượ
c ậ ủ
Kho ng tin c y c a hi u s (
tính theo công th c:ứ x t ( ) ( ) c x
1 2 2
s
2
n 2
s
1
n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) 2 ị ớ ạ ủ ớ ộ ự ố v i tớ c là giá tr t i h n c a phân ph i t v i đ t do 2
s
2
n 2
s
1
n
1 2 4
2 2 4
s
1
2
nn
(
1
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) fd
. . (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) )1 )1 s
2
nn
(
2 (cid:0) (cid:0) ỡ ẫ ộ ự ầ ả do cũng khá ỉ ầ ụ ộ ự
ở
do (b i vì đ t
ị ớ ạ ủ
i h n c a t. 2 2 i h n c a z thay cho giá tr t
ả ưỡ ụ ệ ạ ộ ể ự
ng lên kh năng ho t đ ng th l c, ủ ả ủ ớ
Khi c m u đ l n chúng ta không c n ph i tính đ t
ớ
l n) mà ch c n áp d ng giá tr t
ứ
Áp d ng trong nghiên c u v can thi p dinh d
ậ
kho ng tin c y 95% c a VO ị ớ ạ ủ
ề
2max là: 2 2
s
2
n 2
s
1
n
1 2 2 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x ( 96,1) ) 62,2( 96,1)24,2 ( ) ( x
1 54,0
44 54,0
42 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) L 38,0 96,1 ) 38,0 23,0 ñeán
15,0 61,0 / min ( 54,0
44 54,0
42 ả ậ ệ ố ủ ố ộ
ằ ố
ệ ấ
ằ ưỡ ệ i đa
ng b ng Atole và nhóm can thi p b ng Fresco ế ả Kho ng tin c y 95% trên có ý nghĩa: Xác su t hi u s c a trung bình t c đ oxy t
các nam thanh niên can thi p dinh d
ằ
n m trong kho ng 0,38 đ n 0,61 lít/phút là 95%. ổ ượ ổ ừ ẻ ẻ ồ ng u nhiên t 14 tu i đ
ằ ọ ừ ẫ
ỗ ứ c ch n t
ủ ẫ
ố ừ ộ
m t
c đo ẻ ượ
đ ả Bài tập
1. M u g m 143 tr gái và 127 tr trai tu i t
ứ
dân s nông thôn. M c Hemoglobin (Hb) tính b ng g/dL c a m i đ a tr
ườ
l ế
ng và cho k t qu sau: ớ Gi i tính n Hemoglobin (g/dL) ộ ệ Trung bình m uẫ ẩ
Ð l ch chu n Nam 143 11,35 1,41 Nữ 127 11,01 1,32 ủ ồ ế ệ ố
ể ở ẻ
ự ộ
ằ ố ị ẻ
ệ ề ồ tr em nam và tr em n ? N u không
ớ
i ữ
ộ
t v n ng đ Hb theo gi ố a. Hi u s quan sát c a trung bình n ng đ Hb
làm ki m đ nh th ng kê, chúng ta có cho r ng có s khác bi
tính trong dân s này không? 90 ố ẫ ng sai s chu n c a hi u s c a hai trung bình m u. Nó có ý nghĩa gì? V ẽ Ướ ượ
c l ố ể ệ ượ ẫ
ố c đ tính kho ng tin c y 95% cho hi u s th c s ố ự ự ậ ẻ ữ ử ụ
ẻ ả
ể ế ố ằ ạ ế ủ ứ ữ t gi a hai gi ớ
i, ị ể ế ả ị ị thuy t không là gì? Giá tr p đ ượ
c ế
ư ế
ả
i nh th nào?
ả ở ẻ ẻ ữ ậ ả ậ
tr nam và tr n . Hai kho ng tin c y ủ
ả ậ ể ầ ử ộ ồ ể ề ị ừ ử ụ
c dùng Ivermectin hay viên placebo. Tr ể ề ầ ữ ề ượ
ặ ượ ầ ễ
d ng Ivermectin đ đi u tr nhi m
ướ
c
ằ
c đo và b ng nhau
ố ệ ủ
c đo và s li u c a ổ ượ ể
ả ừ ệ ố ủ
ẩ ủ
b.
ệ ố ủ
phác phân ph i m u hi u s c a trung bình.
ậ
ẩ
c. S d ng sai s chu n tính đ
ừ ề
ữ
đi u này?
gi a tr em nam và tr em n . Chúng ta có th k t lu n gì t
ệ
ự
ứ
d. n u chúng ta mu n có s c m nh c a b ng ch ng cho s khác bi
ẽ
chúng ta s làm gì?
e. Ti n hành ki m đ nh ý nghĩa và tính giá tr p. Gi
lí gi
f. Tính kho ng tin c y 95% c a Hb trung bình
này có trùng nhau không? Th o lu n.
ị
g. Chúng ta có c n ki m đ nh t trong phân tích này hay không?
ộ
ệ
2. Trong m t th nghi m c ng đ ng s
ượ
ổ ở
5 tu i tr lên đ
onchocercam, dân làng t
ặ
ồ
ị
khi đi u tr , th tích h ng c u đ c (packed cell volume PCV) đ
gi a hai nhóm. Sáu tháng sau khi đi u tr , th tích h ng c u đ c đ
đàn ông t ồ
ị
c trình bày trong b ng sau: 2529 tu i đ Ivermectin (n=16) 39 35 38 42 37 52 40 45 39 31 34 45 44 42 40
43 Placebo (n=14) 40 41 35 36 32 38 38 44 43 46 33 35 31 33 ố ẩ ệ ủ ữ ố ằ ộ ệ
ế 2 nhóm. Hi u s quan sát gi a trung
ự ở
hai nhóm. N u không làm ki m đ nh th ng kê, chúng ta có cho r ng có s ở t v PCV ể
hai nhóm can thi p và placebo hay không? ầ ệ
ế ể ị ể ể ở
ệ ề
ị
ệ ệ ố ữ
t đ đánh giá hi u s gi a hai trung bình?
ề ườ ệ ả ị ợ
ng h p ể ố ị i giá tr p. ị
ệ ố ị
ả ữ ủ ậ ể ế ậ ừ ố ệ
ườ ướ ủ ố ượ ộ ộ ồ ướ
ườ ế ở ườ ng cung quăng trong m t 100 ml n
tháng m i và trong 10 ngày liên ti p c c a m t h n
ộ
tháng m i m t. K t qu c trong
ả
ế a. Tính trung bình và đ l ch chu n c a PCV
ị
bình PCV
khác bi
ể
b. Ki m đ nh ý nghĩa nào c n thi
ề
c. Ði u ki n đ ki m đ nh này có giá tr là gì? Ði u ki n đó có tho trong tr
này hay không?
ả
d. Ki m đ nh th ng kê và tính giá tr p. Lí gi
e. Tính kho ng tin c y 95% c a hi u s PCV trung bình gi a nhóm ivermectin và nhóm
placebo.
f. T s li u này chúng ta có th rút ra k t lu n gì?
ế
i ta đ m s l
3. Ng
ế ở
ả
b y ngày liên ti p
ở ả
ượ
b ng sau:
c trình bày
đ Tháng m iườ 25 41 10 22 7 36 14 7 3 9 5 2 2 3 13 5 10 Tháng m iườ
m tộ ỗ ị ể ẩ ủ ố ượ
ự ệ ắ
ng lăng quăng b t trong m i tháng
t gi a hai tháng hay không? ữ
ể ợ ế
ị
ng cung quăng, lúc đó ki m đ nh t có thích h p không? n u ể
ấ
ế ẫ ử ụ ị
ậ ủ ả ủ ủ ệ ấ ả ố ủ ố i ý nghĩa c a s đó. ủ ấ ộ ệ
a. Tính trung bình và đ l ch chu n c a s l
ợ
b. Ki m đ nh t có thích h p đ so sánh s khác bi
ủ ố ượ
c. L y logarithm c a s l
ả ế
ả
ể
có ti n hành ki m đ nh và lí gi
i k t qu .
ệ ố
d. tính kho ng tin c y c a hi u s trung bình (v n s d ng thang đo log)
ủ
e. L y antilog c a hi u s quan sát c a trung bình c a log, lí gi
L y antilog c a k 91 ằ ệ ộ ệ ượ ượ ủ
ạ ạ ề ị ằ ị ế ệ
ư
c các bác sĩ (ch a đ
ạ ọ
c các bác sĩ đã có b ng sau đ i h c đi u tr . K t qu nh sau: ủ ể ệ ờ ằ
c s d ng đ so sánh th i gian n m vi n trung bình c a hai nhóm ị ủ ị ủ ả ố i giá tr c a p ể ế ậ ệ
4. M t b nh vi n so sánh n m vi n trung bình c a hai nhóm b nh nhân: nhóm 1 bao
ộ
ạ ọ
ệ
ồ
c đ o t o sau đ i h c) đi u tr và m t
g m các b nh nhân đ
ả ư
ề
ượ
nhóm 2 đ
n1 = 1820; ‘ x1 = 12,6; s1= 1
n2 = 1250; ‘ x2 = 12,3; s2= 3
ượ ử ụ
ị
ể
Ki m đ nh nào đ
ệ
b nh nhân.
ị
ể
Ki m đ nh th ng kê và tính giá tr c a p. Lí gi
ừ ố ệ
T s li u này chúng ta có th rút ra k t lu n gì? 92 Ộ Ố Ố Ấ Ọ Ữ Ẫ M T S NH NG PHÂN PH I L Y M U QUAN TR NG. ủ ề ọ ả ệ ượ ự ấ ủ ể ố ị t đ ẫ ệ ố ẫ ố ứ
c s khác bi
ướ ượ
c l
ấ ủ
c công th c tính phân ph i xác su t c a trung bình m u, hi u s trung ố
ệ ủ
t c a phân ph i xác su t c a giá tr cá th và phân ph i
ấ
ng l y m u
ứ
ệ ố ỉ ệ ủ ỉ ệ ẫ Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năng:
Phân bi
ấ ủ
xác su t c a các
ượ
Trình bày đ
ẫ
bình m u, t l và hi u s t l c a m u. ọ ố ẫ ừ ố ề ầ ử trong dân s đ u có dân s theo cách sao cho m i ph n t ấ ư ẫ ẫ ẫ
ộ
ẫ
ề
ươ ạ ng pháp l y m u còn đ
ẫ ầ ử ươ ạ ấ ẫ
ừ
ố
trong dân s có N ph n t
ọ
ượ
i. Trong ph
ẫ
ẫ ầ ử
ượ ọ
ươ
ẫ
ượ ể ư ả c rút ch n đ đ a vào m u v n có kh năng đ ể ệ ẫ ỡ
ọ
sao cho m i cách l y m u c
ơ
ẫ
ẫ
c g i là m u ng u nhiên đ n.
ạ
ẫ
ấ
ng pháp l y m u có hoàn l
i và
ộ
ạ
sau khi
ng pháp l y m u hoàn l
i,m t ph n t
ộ
ư ậ
ọ
c rút ch n thêm nh v y, m t
ề
ươ
ơ ầ
ng pháp
ộ
ọ
ọ ồ ẽ
c ch n m t
c rút ch n r i s không đ
ầ ẫ ố ộ i đa 1 l n.
ế ố ượ ủ ố
có th làm đ i di n cho dân s 1, 2, 3 hay nhi u h n l n. Trong ph
ượ
ầ ử ượ
ữ
đ
i, nh ng ph n t
ể ượ ư
có th đ
ố ồ
ẫ
ẫ ẫ ẫ ộ ng.
ỡ ng huy t lúc đói c a 150 đ i t
ể ọ
ng pháp rút ch n ng u nhiên đ n đ ch n ra m t m u ng u nhiên có c
ẫ ườ ẫ 1. Lấy mẫu ngẫu nhiên đơn
ấ
M u xác su t là m u rút t
ấ ượ ư
c đ a vào m u.
m t xác su t đ
ượ
ỡ ẫ
M u có c m u n đ
c rút t
ấ ự
ộ
n đ u có m t xác su t l a ch n nh nhau, m u đó đ
ẫ
c chia theo 2 lo i: ph
Ph
ấ
l y m u không hoàn l
ượ
ọ
đ
ạ
ầ ử
ph n t
ạ
ẫ
ấ
l y m u không hoàn l
ầ ữ
ầ ử
c đ a vào m u t
l n n a. Do đó m t ph n t
ườ
ộ
ả ử
ụ
s trong m t dân s g m m u đ
Thí d : Gi
ơ
ọ
ươ
Hãy dùng ph
ế
ằ
m u b ng 10. Tính đ ng huy t trung bình trong m u đó. ố ủ ấ ả ừ ẫ ẫ
các m u ng u nhiên có c ỡ ẫ ượ
c tính t
ủ ố ấ c g i là phân ph i l y m u (c a trung bình). ị
t c các giá tr (trung bình) đ
ượ ọ
ị ư ộ ệ ẫ
ể ườ ẩ ị i ta có th tính các giá tr khác nh đ l ch chu n, t ỉ v.v.
ế ể ể ố ượ ấ ả
c t ẫ ỡ
ướ ớ ố t c các m u c n có th có và sau đó tính
ấ
t c l n thì không th li t kê t ộ ố ớ ố
ẫ ư
ỉ ứ ữ ẫ ố 2.Phân phối lấy mẫu
Phân ph i c a t
ằ
m u b ng nhau đ
Ngoài tính giá tr trung bình, ng
ệ
l
ữ ạ
N u dân s là h u h n ta có th tìm đ
ế
ể ệ
ạ
phân ph i. Nh ng n u dân s là vô h n hay có kích th
ể
ả
c các m u, ch có th nghiên c u phân ph i trên m t s l n nh ng m u mà thôi. ố ả ử ổ ủ ứ ồ ạ ủ ộ
ộ ỡ ẫ
ứ ứ ầ ỏ ổ 2 = 8.
ẫ ủ ổ ố s ươ ể ế ạ ở ộ ộ ự
i, có th có đ n 25 m u. Sau đó ta có th xây d ng
ầ
m t c t và t n ẫ
ế
ấ ả
t c các giá tr c a ể
t kê t ị ủ ‘ x ệ ở ộ ấ 3. Phân phối của trung bình của mẫu
ẻ
ụ
Thí d :Gi
s chúng ta có m t dân s có c m u N = 5, bao g m tu i c a năm đ a tr
ư
ẻ
ệ
là b nh nhân ngo i trú c a m t trung tâm s c kh e tâm th n. Tu i các đ a tr là nh
S xi /N =
sau: x1 = 6, x2 = 8, x3 = 10, x4 = 12, x5 = 14. Tu i trung bình c a dân s này là
ng sai
10 và có ph
ọ
N u chúng ta ch n m u có hoàn l
ẫ ủ ‘ x b ng cách li
ố ấ
ệ
ằ
phân ph i l y m u c a
ấ
c t kia.
su t xu t hi n ể ượ Và khi đó chúng ta có th tính đ c trung bình c a ủ ‘ x m ‘ x = 250 / 25 = 10
2 = 4 s và 93 ị ớ ạ ạ ố s ươ và ph m s ừ ẫ
ươ ườ ố ớ ấ
ớ
ộ
i h n trung tâm: Cho m t dân s v i b t kì hình dn g phân ph i nào v i
2 , phân ph i l y m u c a
ủ
ỡ
ố ấ
m u c n c a
2/n,
ớ
ng v i trung bình là ẫ ủ ‘ x, tính t
và ph ng sai là ng sai là
ố ấ
ỉ
30). ố ấ ườ ố ỉ ị ng thì đ nh lí trên đúng, ệ ỡ ẫ ớ ề ầ Ð nh lí gi
trung bình là m
ố
ẽ
dân s này s có phân ph i x p x bình th
ỡ ẫ ‡
ỡ ẫ ớ
khi c m u l n (c m u
L u ý:ư
ị ủ
. Khi các giá tr c a phân ph i đã là phân ph i x p x bình th
không c n đi u ki n c m u l n. 94 ẫ ạ ừ ộ ố ữ
ố ấ ố i t
ẽ
m u c n c a dân s này s có phân ph i x p x bình th s ủ
ng sai là [(Nn)/(N1)] ạ
ỉ
ỡ ẫ ‡
2/n, khi c m u l n (c m u
ỡ ẫ ớ
ườ
ạ ườ ỉ ố ấ
ẫ ủ
m t dân s h u h n, phân ph i l y m u c a
ớ
ườ
ng v i trung bình
ệ ố
30). H s (Nn)/(N
i ta không quan ỡ
ừ ẫ
ươ
ọ
ệ ố ệ ố ệ
ừ ố ữ
ơ ượ
ế ủ ẫ
. khi m u c n là m u không hoàn l
‘ x, tính t
ỡ
là (và ph
ng ng
1) đ
c g i là h s hi u ch nh dân s h u h n. Thông th
ố
ỡ ẫ ớ
tâm đ n h s này tr khi c m u l n h n 5% quy mô c a dân s . ế ươ ớ ọ ỉ ề
t chi u dài x ng s là phân ph i x p x bình th ườ
ỡ ẫ ố ấ
ấ ẩ ẫ ừ ng v i trung bình là
ố dân s ế
ộ ệ
ớ ơ 4. Ứng dụng
N u chúng ta bi
185,6 mm và đ l ch chu n 12,7 mm. Tính xác su t m u có c m u 10 rút ra t
này có trung bình l n h n 190.
Bài gi i:ả ẫ ủ ọ ẽ ủ ườ ươ
Phân ph i l y m u c a trung bình c a chi u dài x
ẩ ề
ộ ệ ỉ
x bình th ố ấ
ng s s có phân ph i x p
(cid:214) 10 = 4,02. ớ ng ng v i z = (190185,6)/4,02 =1,09. ầ ố ấ
ớ
ươ ứ
ọ
ươ
ề
ng s 190 t
Giá tr chi u dài x
ế
ố
T b ng phân ph i chu n, ta bi
ộ ng v i trung bình là 185,6 mm và đ l ch chu n = 12.7/
ị
ừ ả
ẫ ỡ ẫ ệ
ớ ấ ơ ả
ẩ
t di n tích ph n bên ph i 1,09 là 0,1379 hay xác
su t m t m u có c m u 10 có trung bình l n h n 190 là 0,1379. ữ ẻ ị ộ ố
ữ ộ
ẻ ố ồ ố ồ
ị ả ử
s chúng ta có hai dân s m t dân s g m nh ng đ a tr
ỏ ố ấ ế ng lúc nh và m t dân s g m nh ng tr không b suy dinh d
ng s thông minh c a hai dân s này là x p x bình th
ộ ố
ẫ ấ ố ồ ủ ế ế ả ỗ ữ ấ (cid:0) (cid:0) ệ ề
ệ ệ ề ứ
b suy dinh
ố ủ
ưỡ
ng. Phân ph i c a
ỉ
ườ
ẩ
ộ ệ
ng và có đ l ch chu n
ườ
ươ
ỗ
i trong m i dân s và tính th
ng
‘ x1 = 92, ‘ x2 = 105. N u không có s
ự
ượ ự
ể
c s
ệ ố ‘ x1 ‘ x2 ) gi a hai trung bình m u.
ẫ
ữ ơ ủ
t nhi u h n c a hi u s ( ( ) ( x
1 2 1 z (cid:0) 2
1 2
2 n n
1 2 (cid:0) (cid:0) (cid:0) 5. Phân phối của hiệu số của hai trung bình mẫu
ụ
Thí d : Gi
ưỡ
d
ươ
ủ
th
ả
kho ng 20. N u chúng ta l y m t m u g m 15 ng
ố
s thôngminh c a m i nhóm có k t qu nh sau
khác bi
khác bi
ụ
Áp d ng công th c:
) (cid:0) ư
ẻ
t v trí thông minh gi a hai nhóm tr em. Tính xác su t có th quan sát đ
ặ
t này ho c khác bi
ứ
x
2
(cid:0) (cid:0) ấ ố ượ ự t v trung bình dân s , xác su t có đ c s khác bi ệ
t ữ ượ
Ta tính đ
c z = 1,78
ự
ế
Do đó n u không có s khác bi
ố ‡
gi a trung bình dân s ệ ề
13 là 0,0375. 6. Phân phối của tỉ lệ của mẫu p ế ụ ế ọ t trong dân s t l mù màu ẫ
là 0,08. N u chúng ta ch n ng u ố ế
ố ượ ấ ể ỉ ệ ế ố ỉ ệ
ng , xác su t đ t l mù màu p lên đ n 0,15. (cid:0) (cid:0) (cid:0) z Thí d : N u chúng ta bi
nhiên trong dân s 150 đ i t
Theo công th c:ứ
p
(cid:0) (cid:0) (cid:0) 1(
n ‡ ả ấ ượ c p 0,08 ố
c z= 3,15. Tra b ng phân ph i chu n ta có xác su t quan sát đ
ư ậ ộ ự ệ ượ ế ẫ ậ ộ ượ
Ta tính đ
là 0,0008. Do v y tìm đ ẩ
c m t m u nh v y là m t s ki n hi m. 7. Phân phối của hiệu số của hai tỉ lệ mẫu ườ ố ỉ ệ ẻ ẻ ẫ ấ p 1 = 10%. Giả
ị
ế ằ
tr em trai b béo phì
t r ng t l
p 2 = 10%, tìm xác su t m t m u g m 250 tr trai
ồ
ộ ẻ ụ
ộ
Thí d : Trong m t dân s ng
i ta bi
ị
ỉ ệ ẻ
ử
tr em gái b béo phì
s cũng có t l
1 p2 ‡
ị
ẽ
và 200 tr gái s cho giá tr p 0,06. 95 Theo công th cứ 2 1 2
(cid:0) 1 1 2 2 2 (cid:0) (cid:0) (cid:0) (cid:0) ) ) (cid:0) z p
(cid:0) (
(cid:0) (cid:0)
(
(cid:0) (cid:0) (cid:0) ) ) (cid:0) 1(
n p
1
1(
n
1 ượ ậ ấ Ta tính đ c z = 2,11. V y xác su t này là 0,0174. Bài tập ậ ố ấ ẫ ỉ ọ ớ ế ươ ề
t chi u dài x ng s là phân ph i x p x bình th ẫ ẩ ừ ế
ộ ệ ố ấ
ấ ườ
ỡ ẫ ng v i trung bình
dân ế ế ơ
ớ
ộ ệ ở ườ
ng ộ ẫ ấ ạ
ỏ
i đàn ông kh e m nh là
ườ
i đàn ông ế ộ ẻ ị ả ử ồ
ở ữ
gi a 115 và 125 microgram/100 ml.
ố ộ ẻ ưỡ ố ồ ố ồ
ị ỉ ố ấ ủ ườ ố ủ
ẩ ỗ ồ ẫ ấ ế ườ ưỡ
ươ
ả
ươ i trong m i dân s và tính th ỗ ả ế ế ủ ấ ữ ể ề ệ ệ ề
ệ ơ ủ
t nhi u h n c a hi u s ( ẻ
t v trí thông minh gi a hai nhóm tr em. Tính xác su t có th quan sát đ
ặ
t này ho c khác bi ố ộ ổ ẩ ủ ề ấ ả vùng d
ơ ế
ẫ dân s ẫ
ệ t gi a trung bình m u ( ế ọ ừ
c ch n t
ẫ ‘ xnu ‘ xnam ) s l n h n 10?
ơ
ẫ
ọ
mù màu là 0,08. N u chúng ta ch n ng u nhiên t trong dân s t l mù màu lên đ n 0,15. ế
ế
ế ỉ ệ ẻ ỉ ng , xác su t đ t l
d phòng t nh C n th cho bi ấ ể ỉ ệ
ơ
ầ
ọ t t l
ẫ ẻ ố ộ ấ ỉ ệ ủ ể ổ
ướ ế ằ ườ ữ i ta bi ẻ
t r ng 10% nh ng tr em trai b béo phì. Gi
ồ ị
ẻ ấ ẫ ộ ả ử
s cũng
ẽ
ẻ 1 p2 ‡ ố
ị
0,06. Bài gi ọ ẽ ươ ủ ủ
ớ ườ ẩ ố ỉ ẫ
ề
ng s s có phân
ộ ệ
ng v i trung bình là 185,6 mm và đ l ch chu n = Bài t p phân ph i l y m u
1. N u chúng ta bi
là 185,6 mm và đ l ch chu n 12,7 mm. Tính xác su t m u có c m u 10 rút ra t
ố
s này có trung bình l n h n 190.
ẩ ủ ắ
2. N u trung bình và đ l ch chu n c a s t huy t thanh
ẫ
120 và 15 microgram/100 ml, tính xác su t m t m u ng u nhiên g m 50 ng
ắ
có trung bình s t huy t thanh
ữ
ứ
3. Gi
ng lúc
s chúng ta có hai dân s m t dân s g m nh ng đ a tr b suy dinh d
ữ
ỏ
ố
nh và m t dân s g m nh ng tr không b suy dinh d
ng s
ng. Phân ph i c a th
ộ ệ
thông minh c a hai dân s này là x p x bình th
ng và có đ l ch chu n kho ng 20.
ộ
ố
ố
N u chúng ta l y m t m u g m 15 ng
ng s
‘ x1 = 92, ‘ x2 = 105. N u không có s
ư
ự
thôngminh c a m i nhóm có k t qu nh sau
ượ ự
khác bi
c s
ệ ố ‘ x1 ‘ x2 ) gi a hai trung bình m u.
ẫ
ữ
khác bi
ộ ệ
ữ
4. Trong m t dân s nam thanh niên và n thanh niên 17 tu i, trung bình và đ l ch
ư
ướ ươ
ở
ng b vai là nh sau: nam 9,7 và 6,0;
i x
chu n c a chi u dày n p g p da
ộ
ố
ữ ượ
ồ
ữ
n 15,6 và 9,5. M t m u ng u nhiên đ n g m 40 nam và 35 n đ
ữ
ấ ự
ẽ ớ
này. Tính xác su t s khác bi
ế
ố ỉ ệ
5. N u chúng ta bi
ố ượ
ố
trong dân s 150 đ i t
ủ
ế ự
tr em 1218 tháng tiêm ch ng
6. Trung tâm y t
ồ
ơ
ẫ
ệ
ủ
phòng ch ng đ 6 b nh EPI là 90%. Ch n m t m u ng u nhiên đ n g m 200 tr trong
ẫ
ủ
ạ
ứ
l a tu i này và ki m tra tình tr ng tiêm ch ng. Tính xác su t t l
tiêm ch ng trong m u
i 85%.
này d
ộ
7. Trong m t dân s ng
ẻ
có 10% tr em gái b béo phì, tìm xác su t m t m u g m 250 tr trai và 200 tr gái s
cho giá tr pị
iả
ố ấ
1.
Phân ph i l y m u c a trung bình c a chi u dài x
ấ
ph i x p x bình th
12.7/(cid:214) 10 = 4,02. ề ươ ươ ứ ớ ị
Do đó, giá tr chi u dài x ọ
ng s 190 t ng ng v i z = (190185,6)/4,02 =1,09. 1,09) = 1 0,8621 = 0,1379 ị ế ắ ườ ố i h n trung tâm, giá tr trung bình s t huy t thanh trung
ng (trung bình là 120 và ẩ P (‘ x >190) = P (z >1,09) = 1 P(z £
ớ ạ
ị
2.
Theo đ nh lí gi
bình ‘ x c a 50 ng
ườ
ủ
ẽ
i đàn ông s có phân ph i bình th
(cid:214) 50 = 2,12.
ộ ệ
đ l ch chu n = 15/
Khi đó 96 125) = P{(115 120)/2.12 < z £ (125 120)/2.12)} = P( P (115 < ‘ x £
2,36) 2,36 < z £ (cid:0) (cid:0) ( ) ( x
1 2 1 z x
2
(cid:0) (cid:0) 2
2 ệ ố ữ ề ẫ = 0,9909 0,0091 = 0,9818
ố ủ ố 3. Theo th ng kê v phân ph i c a hi u s gi a hai trung bình m u, ta có (cid:0) (cid:0) (cid:0) (cid:0) n )
2
1
n
1 2 (cid:0) ẩ ố ủ ươ ệ ở ố ng s trí tu nhóm 1 ươ ệ ở ố ng s trí tu nhóm 2 = m 1 n u hai
ế ệ ề nhóm tr có gì khác bi ẫ ủ ươ ệ ở ố ẻ ng s trí tu nhóm 1 (nhóm tr em suy ng) = 92, dinh d ẫ ủ ươ ệ ở ố ẻ ớ
ố
có phân ph i chu n. V i
m 1 là trung bình dân s c a th
m 2 là trung bình dân s c a th
ố ủ
ẻ
ệ
t v trí tu .
‘ x1 là trung bình m u c a th
ưỡ
‘ x2 là trung bình m u c a th ng s trí tu nhóm 2 (nhóm tr không b ị suy dinh d ng) = 105. 1 s ươ ủ ươ ố ở ng sai c a th ng s thông minh nhóm 1, 2 2 2 = 202 = 400. s s ố ở ủ ưỡ
2 ph
2 ph ng s thông minh nhóm 2, ng sai c a th 1 = n2 = 15. ươ
n1 là c m u c a nhóm 1,
n2 là c m u c a nhóm 2, n ươ
ỡ ẫ ủ
ỡ ẫ ủ
c z = 1,78. Ta tính đ ượ
P (‘ x1 ‘ x2 <13) = P (z < 1,78) = 0,0375
ế ệ ề ự ấ ố ượ ự t v trung bình dân s , xác su t có đ c s khác ệ ữ nu nam nu nam
(cid:0) 2
nam ệ ố ữ ề ẫ ố Do đó n u không có s khác bi
ố ‡
13 là 0,0375.
bi
t gi a trung bình dân s
ố ủ
4. Theo th ng kê v phân ph i c a hi u s gi a hai trung bình m u, ta có
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x x ( ) (cid:0) z (
(cid:0) )
2
nu (cid:0) n
nu n
nam ẩ ớ
ố
có phân ph i chu n. V i ề ế ấ ữ
nhóm n = 15,6 ề ế ấ nhóm nam = 9,7 ề ế ấ ẫ ở m nu là trung bình dân s c a chi u dày n p g p da
ở
ố ủ
m nam là trung bình dân s c a chi u dày n p g p da
ở
ố ủ
‘ xnu là trung bình mẫu của chiều dày nếp gấp da ở nhóm nữ
‘ xnam là trung bình m u c a chi u dày n p g p da
ủ nhóm nam, ‘ xnu 2 ‘ xnam = 10 nu ph 2 s ươ ủ ế ề ấ ở ữ ng sai c a chi u dày n p g p da nhóm n = 9,52 = 90,25 nam ph s ủ ế ấ ở ng sai c a chi u dày n p g p da nhóm nam = 62 = 36 ươ
ỡ ẫ ủ ề
ữ Ta tính được z = 2,20 ỡ ẫ ủ nnu là c m u c a nhóm n = 35,
nnam là c m u c a nhóm nam =40, ượ ự ỡ ướ ệ ề ớ ư t chi u dày l p m d c s khác bi i da trung bình gi ã nam và P (‘ x1 ‘ x2 >13) = P (z > 2,20) = 0,0375 = 1 0,9861 =0,0139
ấ
Xác su t có đ
ữ
n > 10 là 0,0139. 97 ề ố ố ỉ ệ ủ ẫ
c a m u, ta có 5. Theo th ng kê v phân ph i t l
(cid:0) (cid:0) (cid:0) z p
(cid:0) (cid:0) (cid:0) 1(
n ố ườ ng. ố = 0,08 ẫ mù màu trong trong dân s
mù màu trong m u = 0,15 có phân ph i bình th
p : t l
ỉ ệ
v i ớ
ỉ ệ
p: t l
ỡ ẫ
n: c m u = 150 Ta tính đ c z= 3,15. 3,15) = 1 0,9992 = 0,0008. ượ
P(p > 0.15) = P(z > 3,15) = 1 P(z £
ấ ế ấ z p
(cid:0) (cid:0) 1(
n ề ố ố ỉ ệ ủ ẫ
c a m u, ta có Xác su t này là r t hi m
6. Theo th ng kê v phân ph i t l
(cid:0) (cid:0) (cid:0) (cid:0) ố ườ ng. ố = 0,90 ủ
ủ ẫ tiêm ch ng trong dân s
tiêm ch ng trong m u = 0,85 có phân ph i bình th
p : t l
ỉ ệ
v i ớ
ỉ ệ
p: t l
ỡ ẫ
n: c m u = 200 ượ c z= 2,36 Ta tính đ
Do đó: 1/100. P(pâ £
ố 0.85) = P(z £
ề 2,36) = 0,0091 »
ẫ
ố ỉ ệ ủ
c a m u, ta có 7. Theo th ng kê v phân ph i t l 2 1 2
(cid:0) 1 1 2 2 2 (cid:0) (cid:0) (cid:0) (cid:0) ) ) (cid:0) z p
(cid:0) (
(cid:0) (cid:0)
(
(cid:0) (cid:0) (cid:0) ) ) (cid:0) 1(
n p
1
1(
n
1 ố ườ ớ
ng v i ố béo phì trong dân s nam = 0,10 ố ữ
ồ
ồ ữ béo phì trong dân s n = 0,10
ẫ
béo phì trong m u g m 250 nam
ẫ
béo phì trong m u g m 200 n , pâ1 pâ2 = 0,06 có phân ph i bình th
p 1: t l
ỉ ệ
v i ớ
p 2: t l
ỉ ệ
ỉ ệ
p1: t l
ỉ ệ
p2: t l
n1 là c m u c a nhóm nam = 250
n2 là c m u c a nhóm n = 200 ỡ ẫ ủ
ỡ ẫ ủ
0,06} = P(z ‡ ữ
2,11) = 1 P(z £ Do đó P{(p1 p2 )‡ 2,11) = 1 0,9826 = 0,0174 98 99 ƯỚ ƯỢ
C L NG ượ ả
ậ ủ ề ọ
ủ
ượ ọ ả ng pháp ướ ượ
c l ủ
ậ
ng kho ng tin c y trung bình c a ẫ ộ ả ậ ượ
ươ
ươ ng kho ng tin c y hi u s hai trung bình
ả
ả ậ ỉ ệ ủ
ậ ủ ỉ ố ỉ ố ố ơ Mục tiêu:
ứ
Sau khi nghiên c u ch đ , h c viên có kh năng:
ả
c ý nghĩa c a kho ng tin c y 95%
Trình bày đ
ươ
ự
Trình bày và l a ch n đ
c ph
m t m u
Trình bày đ
Trình bày ph
Trình bày ph ng pháp
ướ ượ
c l
ướ ượ
c l ươ
c ph
ng pháp
ng pháp ệ ố
ướ ượ
c l
ẫ
ng kho ng tin c y t l
c a m u
ng kho ng tin c y c a t s nguy c và t s s chênh ả ầ ế ệ ứ t m t s ố ể ườ ụ
ẩ ế ọ ữ
ườ ườ
ẻ ầ ế ỉ ệ
t t l tiêm ch ng ho c t l ộ ố
ủ
ế
ng huy t trung bình c a
ượ
ng trung bình
t tr ng l
ặ ỉ ệ
ủ ằ ươ ủ
ng đ có th ch n đoán ti u đ
ể
ượ . ố
ậ ị ủ ươ
ề c tính đ
ườ ể
ể
ủ
ế
ng trình y t
ố
ộ c các đ c tính (các tham s ) đó c a dân s , ph
ấ ả ượ
ng t ủ
ng pháp chính xác
ự
ố
t c các giá tr c a toàn b dân s . Tuy v y đi u này là không th c ấ ể ế ế ề ị ườ ủ ấ ả ọ
t c m i
ề ờ
ng huy t trung bình. Ði u này gây lãng phí v th i ế ề
ể
ề ậ ệ ụ ươ ấ ể ả
ố ộ
ạ ỉ ệ ng di n áp d ng: M t bác sĩ nh n th y có t l
ư tai bi n cho toàn b dân s ử ụ
ả ạ
ề
ườ
ệ ử ụ ế
ỉ ệ
tai bi n
ố
ộ
ấ ả ọ
t c m i ườ ế
ố
ạ ứ ợ i. Nh ng đi u này là không thích h p v ph ng di n đ o đ c. ng nh tăng cao. Ð đo đ c t l
ể ử ụ
ể
ệ
ầ ủ ề ươ
ộ ố ượ ọ ạ ị
i ta c n ph i đo đ c các giá tr trên m t ph n c a dân s , đ ộ
c g i là m t ố ố ự ề ậ i ta suy l n v dân s d a trên ượ ừ ộ ế ả
ậ
ố
c t c ố c l ằ
ị ằ
ng đi m là m t giá tr b ng s duy nh t nh m đ
ả ộ
ố Ướ ượ ố ươ ứ c l ứ ả ằ ườ
ố
dân s đó.
ướ ượ
c l
c tính b ng hai cách:
ằ
ấ
ị ố
c l ể
ng đi m và
ể ướ
c tính
ộ
ị
ng kho ng bao g m 2 tr s xác đ nh m t
ộ
ớ
ố ượ ướ ượ
ng, v i m t
c ưở ng nào đó.
ữ ươ ể ượ ọ ọ ướ ượ
c l ệ ế ừ ộ ẫ ậ ố ế ẫ ẫ ớ ẫ
ả ự ẫ ầ ả ố 1. Giới thiệu
ọ
Trong công vi c hàng ngày và trong nghiên c u khoa h c, ta c n ph i bi
ặ
ầ
ế ườ
ư
nh ng đ c tính c a dân s . Thí d nh chúng ta c n bi
t đ
ầ
ể
i bình th
ng, c n bi
ng
ự
ẻ ơ
ủ
c a tr s sinh đ đáng giá s phát tri n c a tr , c n bi
ặ
ng giá các ch
đ t vòng nh m l
ặ
ể ướ
Ð
ấ
nh t là đo l
ế ở
b i vì:
t
ữ
ạ
Nh ng h n ch v tài nguyên: chúng ta không th ti n hành l y máu c a t
ườ
ệ
i Vi
ng
t nam đ tính giá tr đ
ự
gian, nhân l c và ti n b c.
Tính không kh thi v ph
khi s d ng thu c X d
ố
ầ
c n ph i kéo dài vi c s d ng thu c đ có th s d ng thu c này cho t
ề
ư
ng
ầ
ườ
Do đó, ng
ẫ
ế
m u và ti n hành suy lu n th ng kê.
ị
ậ
Ð nh nghĩa: Suy lu n th ng kê là quá trình trong đó ng
ừ
ẫ
ữ
ả
m t m u rút ra t
nh ng k t qu thu đ
ể ượ ướ
ố ủ
ư
ố
Nh ng tham s c a dân s có th đ
ả Ướ ượ
ướ ượ
ể
ng kho ng.
c l
ồ
ủ
tham s t
ng ng c a dân s .
ả
kho ng mà chúng ta cho r ng kho ng này có ch a tham s đ
ộ
đ tin t
ệ
ướ ượ
ộ
ng là tính không sai l ch
c l
ng pháp
M t trong nh ng tiêu chí đ đánh giá ph
ươ
ộ
ệ
c g i là
ng đ
ng pháp
(còn g i là tính không ch ch unbiasedness). M t ph
ủ ấ
ề
ố
ị ủ
ằ
ị ướ ượ
c l
không sai l ch n u trung bình c a r t nhi u giá tr
ng b ng giá tr c a tham s .
ỏ
ẫ
ẫ
ệ ấ
m t khung m u và
Suy lu n th ng kê chính xác đòi h i vi c l y m u ng u nhiên t
ố ụ
ặ
ệ ấ
khung m u này trùng v i dân s m c tiêu. N u vi c l y m u không ng u nhiên ho c
ế
ữ
ố ụ
ớ
n u khung m u không trùng v i dân s m c tiêu, chúng ta c n ph i d a vào nh ng
ậ ứ
lu n c không ph i là th ng kê. 100 2. Ước lượng trung bình của dân số Ướ ượ
c l ể
ng đi m: ủ ủ ẫ ằ ể ượ ướ ượ
c
ẫ ố m ) có th đ
ủ ớ ạ ủ c l
ằ
ứ ẫ ượ ủ Trung bình c a dân s (
lí gi
Trung bình c a m u đ ị
ng b ng trung bình c a m u (theo đ nh
ố
ậ
i h n trung tâm, trung bình c a m u n m t p trung quanh trung bình c a dân s ).
c tính theo công th c sau: x i x n (cid:0) (cid:0) ả Ướ ượ
c l ng kho ng ‡ ỉ ả ng kho ng khi m u l n (n
ụ
ườ ẫ ớ
ể ừ ộ i h n trung tâm ch cho phép
ỉ 30)
ng. Khi đó có th áp d ng hai ớ ạ
c rút ra t ướ ượ
c l
ố ấ
m t phân ph i x p x bình th ươ ỡ ẫ ớ ấ ứ
ươ ố ườ ố ấ ủ ng pháp
ươ ế ặ
ng z có th s d ng b t c khi nào có c m u l n ho c
ả
ng sai c a dân s r t ít khi x y ể ử ụ
ợ
ng h p bi t ph ướ ượ
c l
ủ
ng sai c a dân s (tr Ð nh lí gi
ẫ
ượ
ng pháp:
ươ
Ph
ế ượ
c ph
t đ ố ủ ụ ể ấ ố ướ ượ
c l ng pháp ng t có th áp d ng khi nào phân ph i c a dân s là x p x ỉ Ph
ườ ớ ạ ườ ợ ủ i h n trung tâm, trong 95% các tr ủ ẫ ướ ng h p trung bình c a dân s không
ể ướ
ố
c ố
c đ ư ả ươ ị
hay m u đ
ph
bi
ra).
ươ
bình th
ng.
ươ
Ph
ng pháp z
ị
Theo đ nh lí gi
cách xa quá trung bình c a m u 1,96 ( SE (SE=sai s chu n). Do đó các b
ượ
l ẩ
ng pháp này là nh sau: ặ ừ ộ ệ ặ
(ho c bi ế ướ
t tr c ho c tính t ẩ
đ l ch chu n ậ
ng kho ng tin c y 95% theo ph
Tính trung bình m u ẫ ‘ x
ố s
ẩ ủ
Tính đ l ch chu n c a dân s ẫ ộ ệ
ỡ ẫ ủ ớ m u khi c m u đ l n) s ẩ ố Tính SE (sai s chu n) = ả ng kho ng tin c y 1,96 · SE /(cid:214) n
ậ ‘ x – Ướ ượ
c l
ng pháp t ể ướ ượ ỡ ẫ
ậ ả ng chính xác SE vì c m u nh
c l
ể ướ ượ
c l
ng pháp z đ ỏ
ộ
ng kho ng. Tuy v y có m t ế ằ ế
t SE và không th
ươ
ể
ạ ượ
t r ng đ i l ng ươ
Ph
ế
N u chúng ta không bi
(<30), chúng ta không th dùng ph
ị
đ nh lí cho bi
(cid:0) (cid:0) x s n / ố ộ ị ự ọ
ả ậ ượ
ộ
ng kho ng có đ tin c y 100(1 ố
ố
c g i là phân ph i t hay phân ph i
a ) theo ố
có m t phân ph i xác đ nh. Phân ph i này đ
ể ướ ươ
ị
student. D a trên đ nh lí này ta có th
c l
cách sau: n 2 2 ộ ệ ẫ Tính trung bình m u ẫ ‘ x
ẩ ủ
Tính đ l ch chu n c a m u s = (cid:214) s2 s x x n ( ) / ( )
1 i i 1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ả Ướ ượ
c l ng kho ng tin c y ậ ‘ x – t(1a s/(cid:214) n /2) ·
ả
=0,05 và ta ph i tra b ng phân ph i student
ỡ ẫ a ả ố ng v i đ tin c y 95% thì ớ ộ
ớ ế
N u ta
ể
đ tìm t ậ
ướ ượ
c l
ộ ự
(10,05/2) = t0,975 v i (n1) đ t do (n là c m u). 101 ủ ệ ố ủ ng hi u s c a trung bình c a hai nhóm A và B theo 2 cách z và t tùy
ả ị ế ỏ ỏ ể ướ ượ
c l
ố ệ ủ ầ
đ nh c n thi t hay không. ả ị ươ ầ 3. Ước lượng khoảng tin cậy của hiệu số hai trung bình
Ta có th
theo s li u c a ta th a mãn có th a mãn nh ng gi
ể ử ụ
Ð s d ng ph ữ
đ nh: ố ng ượ ộ ệ c đ l ch chu n dân s ng pháp z c n hai gi
. Trung bình ‘ x1 và ‘ x2 có phân ph i bình th
ể
. Có th tính đ
ệ ẩ
ế ề ề ả ớ ộ ươ ậ ả ầ ườ
ố s 1 và s 2
ỡ ẫ ủ ớ
ỏ
C hai đi u ki n này đ u th a mãn n u hai c m u đ l n.
a ) theo ph ng kho ng v i đ tin c y 100(1 ng pháp t ta c n theo các ể ướ ượ
Ð
c l
cướ
b ừ ố ệ ướ ặ ẩ ố s 1 và s 2 (t s li u có tr c ho c suy ra t ừ ộ
đ Tính trung bình m u ẫ ‘ x1 và ‘ x2
Tính đ l ch chu n dân s ộ ệ
ẫ 1 và s2 khi c m u đ l n)
ả
ng kho ng theo công th c: (cid:0) (cid:0) 1
1 1
2 ỡ ẫ ủ ớ
ứ ẩ
ệ
l ch chu n m u s
Ướ ượ
c l
(cid:0) x z ( ) x
1 2 1
( / 2 ) n n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) ươ ầ ả ị ể ử ụ
Ð s d ng ph 2 ng pháp t c n hai gi
ườ ố đ nh:
ng và ớ ộ ả ậ ươ ầ ng kho ng v i đ tin c y 100(1 a ) theo ph ng pháp t ta c n theo các . x1 và x2 có phân ph i bình th
1 = s
. s
ể ướ ượ
Ð
c l
cướ
b ẫ ộ ệ
ươ Tính trung bình m u ẫ ‘ x1 và ‘ x2
ẩ ủ
Tính đ l ch chu n c a m u s1 và s2
ộ
ng sai g p s2
Tính ph 2 2 2
s
2 2
s
1
)
1 2 (cid:0) (cid:0) (cid:0) ( )
1 (cid:0) s (cid:0) (cid:0) (cid:0) n
n n
1
( (
( )
1
)
1 2 2 n
1
ả ứ Ướ ượ
c l ng kho ng theo công th c: (cid:0) 2 1
( / 2 ) 2 (cid:0) (cid:0) (cid:0) (cid:0) x t ( ) x
1 s
n s
n
1 ườ c l i ta có th c n
ệ ể ầ ướ ượ
ủ ữ
ng nh ng t l
ầ nh t l
ạ ổ ượ ủ tr em trong di n tu i đ ph
c tiêm ch ng đ y đ 6 lo i vaccine, t ỉ ệ ư ỉ ệ ụ
ỉ ộ ệ 4. Ước lượng tỉ lệ dân số
ế
ộ
ự
Trong lãnh v c y t
công c ng ng
ữ
ỉ ệ ẻ
ặ
n có đ t vòng, t l
ệ ử
vong do m t b nh nào đó v.v.
t
l ỉ ệ ằ i ta có th ể ướ ượ
c l ng t l ố p
trong dân s b ng cách tính t l ỉ ệ ể
ng đi m: ng
ấ ươ ườ
ố ẫ Ướ ượ
c l
ầ
(hay t n su t t ủ
ng đ i) c a m u p. p ả ị ứ ướ ượ c l ả ả
ng kho ng là n
ậ ể ử ụ
đ nh đ có th s d ng công th c
i ta có th ể ướ ượ
c l ng kho ng tin c y 100(1 và
a ) c a tủ ỉ ể
ả
Ướ ượ
ng kho ng: Gi
c l
n(1p ) đ u l n h n 5. Khi đó ng
ườ
ơ
ề ớ
ệ
theo quy trình sau:
l ỉ ệ ỉ ệ ẫ m u p. ả
ướ ượ
c l
ướ ượ
c l ố
ể
trong dân s p dùng t l
ng đi m t l
ứ
ng kho ng theo công th c: (cid:0) (cid:0) 1( )2/ (cid:0) (cid:0) p z p 1( np
/) 102 ườ ổ ể
ậ ườ
ễ ườ , ng i ta ít khi ỉ ệ
ng t s c a hai t l ( ươ ả
t v
đây trình bày công th c ề ướ ượ
ng
c l
ng trình bày thêm v
ố
ướ ượ
ng tham s
c l
ủ ỉ ố
ơ
ng kho ng c a t s nguy c RR
ủ
ả
ế ề ướ ượ
ng kho ng c a
c l
ủ
ả
ứ ướ ượ
ng kho ng c a
c l ả ế ệ ả ắ 5. Ước lượng tỉ số tỉ lệ (tỉ số nguy cơ)
ứ
ố
i ta th
Trong nh ng sách th ng kê c đi n, ng
ị
ủ
ệ ố
ả
. Tuy v y, trong d ch t
kho ng c a hi u s hai t l
ỉ ố ủ
ỉ ệ ướ ượ
ườ ướ ượ
c l
c l
ng
này mà th
ủ ỉ ố ố
ả
ướ ượ
c l
ng kho ng c a t s s chênh OR). Chi ti
hay
ứ ạ Ở
ố
ỉ ố
ữ
ng đ i ph c t p.
nh ng t s này t
i thích.
RR và OR mà không gi
ố ệ
N u chúng ta kí hi u các s li u trong b ng 2 x 2 theo quy t c sau: ễ ơ ễ ổ ố Ph i nhi m ơ
Không ph i nhi m T ng s B nhệ A1 A0 M1 Không b nhệ B1 B0 M0 ổ ố T ng s N1 N0 N RR (cid:0) a
0
N a
1 :
N
1 0 ậ ủ ả a. Ướ ượ
c l ng kho ng tin c y c a RR theo: ỉ ố ơ 1. Tính t s nguy c se RR [ln( )] 1
N 1
a
1 1
N
1 1
a
0 0 (cid:0) (cid:0) (cid:0) (cid:0) ẩ ủ ố 2. Tính sai s chu n c a ln(RR): 96,1 1
N 1
1
1
aNa
1 1 0 0 ef RR e [ln( )] (cid:0) (cid:0) (cid:0) (cid:0) ừ ố ủ ố
3. Tính th a s sai s (error factor) c a RR: 1
N 1
1
1
aNa
1 1 0 0 RR 96,1
e (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ứ ả ậ ủ
4. Tính kho ng tin c y c a RR theo công th c: 0 ậ ủ ả b. Ướ ượ
c l ng kho ng tin c y c a OR theo: OR a
1 :
b
1 a
b
0 ba
01
ba
10 (cid:0) (cid:0) ỉ ố ơ 5. Tính t s nguy c se OR [ln( )] 1
a 1
a
1 1
b
1 0 1
b
0 (cid:0) (cid:0) (cid:0) (cid:0) ẩ ủ ố 6. Tính sai s chu n c a ln(OR): 96,1 1
a 1
a
1 1
b
1 0 1
b
0 ef OR e [ln( )] (cid:0) (cid:0) (cid:0) (cid:0) ừ ố ủ ố
7. Tính th a s sai s (error factor) c a OR: 96,1 1
a 1
a
1 1
b
1 0 1
b
0 OR e (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ứ ả ậ ủ
8. Tính kho ng tin c y c a OR theo công th c: ị ờ ổ ố T ng s ị
ầ ờ Ăn th t trong th i gian
ầ
g n đây Không ăn th t trong
th i gian g n đây Nhóm b nhệ 50 11 61 Nhóm ch ngứ 16 41 57 ổ ố T ng s 66 52 118 103 ạ ướ ứ ộ ở ế ố ả ị Papua New Guinea đ xem ăn th t có ph i là y u t ể
ậ ả ứ
ệ
c tính toán trên chúng ta hãy xem xét m t nghiên c u b nh ch ng
ơ ủ
nguy c c a viêm
c trình bày trong b ng 2. Quy trình ượ ượ
c đ ả ể
Đ minh ho các b
ế
ượ
c ti n hành
đ
ạ ử
ộ
ru t ho i t
ể ướ ượ
c l
đ ố ệ
hay không. S li u thu th p đ
ư
ng kho ng OR nh sau: · 11) = 11,65 ng đi m OR = 50
ấ 41/(16 ·
ườ ạ ử ấ ầ ộ ị ơ ị
i ăn th t có nguy c b viêm ru t ho i t g p 16 l n Ướ ượ
c l
ỉ ố
ườ ị ể
1.
T s chênh OR = 16 cho th y ng
ng i không ăn th t. se OR [ln( )] ,0 445 1
a 1
50 1
16 1
11 1
41 1
a
1 1
b
1 0 1
b
0 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 2. Tính 96,1 1
a 96,1 ,0 445 1
a
1 1
b
1 0 1
b
0 ef OR e e [ln( )] 39,2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ừ ố ố
3. Th a s sai s , 96,1 1
a 1
a
1 1
b
1 0 1
b
0 OR e 65,11 39,2 )9,27;9,4( (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ủ ả ậ
4. Kho ng tin c y 95% c a OR= ư ậ ớ ộ ứ ế ằ ng 95%, ta cho r ng kho ng t ưở
ớ ộ ơ ị ả
ằ
ớ ạ ử ầ ấ ị Nh v y v i đ tin t
ưở
ự
s . Nói cách khác v i đ tin t
ế
ộ
ru t ho i t ừ
ng 95% ta cho r ng ng
ầ
ấ
cao g p 4,9 l n đ n g p 27,9 l n so v i ng ự
4,9 đ n 27,9 có ch a OR th c
ị
ườ
i ăn th t có nguy c b viêm
ườ
i không ăn th t. ị ệ ủ ị ườ ướ ề ng giáp tr ị ớ
c và sau khi đi u tr v i ệ
ả ư ố Bài tập về kiểm định và ước lượng
1. Theo dõi nh p tim c a 12 b nh nhân b b nh c
ế
thu c kháng giáp ta có k t qu nh sau: 1 2 3 4 5 6 7 8 9 10 11 12 B nhệ
nhân 115 120 110 100 95 110 120 115 100 120 110 90 cướ
ị M tr
đi u trề 100 100 90 100 90 100 100 90 90 100 100 100 ị M sau
đi u trề ố ủ ệ ị ườ ng giáp hay không? Ướ
c ậ ủ ị ủ ả ả ả
ỏ
H i: thu c kháng giáp có làm gi m nh p tim c a b nh nhân c
ố
ụ
ượ
ng kho ng tin c y c a tác d ng làm gi m nh p c a thu c.
l Bài gi ệ ộ ố ượ ạ ng, ta s ử
ắ ặ ố ớ ạ
ị ướ ổ ị ủ ế ệ ố ạ ậ ạ ả i:ả
ử
ầ
ớ
Vì đây là th nghi m lâm sàng v i 2 l n đo đ c trên cùng m t đ i t
ề
ệ
ử
ụ
d ng test t b t c p. Ð i v i th nghi m lâm sàng d ng này, ta quan tâm nhi u
ề
ị
ệ ố ủ
ự
s thay đ i, đó chính là hi u s c a nh p tim sau và nh p tim tr
c khi đi u tr và
ệ ố
ta quan tâm đ n trung bình c a hi u s này có khác zerohay không.
L p l i b ng trên và thêm hàng tính hi u s m ch ta có: 1 2 3 4 5 6 7 8 9 10 11 12 B nhệ
nhân 115 120 110 100 95 110 120 115 100 120 110 90 cướ
ị M tr
đi u trề M sau 100 100 90 100 90 100 100 90 90 100 100 100 104 ị đi u trề ố 15 20 20 0 5 10 20 25 10 20 10 +10 Hi u sệ
d ả ệ ố ạ ế ằ Gi thuy t Ho : Trung bình c a hi u s m ch (d) b ng zero d = 10,1
ứ ủ ủ
‘ d = 12,1 x 12 1 0
, t 4 1
, 12 1
,
2 91
, s n / 10 1
, / 12 ẩ ủ
ị Ta có trung bình c a d =
ộ ệ
đ l ch chu n c a d s
và ta tính giá tr t theo công th c:
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ị ấ ệ ố ủ ả ộ ự do, ta có t > ỏ ả ể ề ở
ế ớ hàng 121 = 11 đ t
ứ
thuy t H0 v i m c ý nghĩa p < 0,01. /2) · ậ ứ L y tr tuy t đ i c a t và tra b ng t hai chi u
3,106, có nghĩa là ta có th bác b gi
Ð ng kho ng tin c y 95% ta dùng công th c: ả
s/(cid:214) n ả ậ 6,7 = 18,8 : 5,4 ưở ả ố ị t(1a
do t = 2,201 và kho ng tin c y là:
10,1/(cid:214) 12 = 12,1 –
ằ
ng 95%, ta nói r ng thu c kháng giáp làm gi m nh p tim
ộ Tóm l
ừ
t ạ ố ả ư ế ể ướ ượ
c l
‘ x –
ộ ự
ớ
v i 11 đ t
2,20 ·
12,1 –
ạ ớ ộ
i v i đ tin t
ế
ị
5 đ n19 nh p trong m t phút.
ệ
ủ
ụ
ắ ầ
ờ
2. Theo dõi th i gian b t đ u có tác d ng c a hai lo i thu c A và B trên hai nhóm b nh
nhân ta có k t qu nh sau: 1 = 15; ‘ x1 = 68,4 ; s1 = 16,5) ố Thu c A: 44;51;52;55;60;62;66;68;69;71;71;76;82;91;108 (n 2 = 12; ‘ x2 = 83,4 ; s2 = 17,6) ố ờ ỏ Ướ ượ
c l ả
ng kho ng ụ
ệ ố ờ ố
ụ ủ ậ Thu c B: 52;64;68;74;79;83;84;88;95;97;101;116 (n
ạ
ủ
H i th i gian tác d ng c a hai lo i thu c có khác nhau hay không?
tin c y 95% c a hi u s th i gian tác d ng. Bài gi ị ố ủ ụ ờ ờ ố 2 2 2
s
1
)
1 2 ố ủ
ế ướ ế ụ
ể ể ươ ả ị ộ 2
ng sai g p s
2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s )
1 ( ,
11 17 6 3421 3800 i:ả
Ðây là bài toán so sánh hai giá tr trung bình.
Ta có H0 : Th i gian tác d ng trung bình trong dân s c a thu c A = Th i gian
ố
tác d ng trung bình trong dân s c a thu c B
c h t ta tính ph
thuy t tr
Ð ki m đ nh gi
2
2
2 (cid:0) (cid:0) (cid:0) (cid:0) s ,
288 8 (cid:0) (cid:0) (cid:0) (cid:0) n
n n
1
( (
( 1
)
)
1 ,
14 16 5
14 11 25 n
1 ậ 1 2 2 2 2 V y s = = 17
và ta tính t = (cid:0) x x ( ) 15 15 (cid:0) (cid:0) (cid:0) (cid:0) t 2 28
, 43 3
, (cid:0) (cid:0) 288 8
,
15 ,
288 8
12 s
n s
n
1 0 v i m c ý nghĩa p < 0,05.
ụ ị ấ ệ ố ủ ộ ự do, ta ớ ả
ể
ậ ề ở
hàng 151+121 = 25 đ t
ứ
ế
thuy t H
ử ụ
ệ ố ờ
ng kho ng tin c y 95% c a hi u s th i gian tác d ng ta s d ng L y tr tuy t đ i c a t và tra b ng t hai chi u
ỏ ả
có t > 2,06 có nghĩa là ta có th bác b gi
ủ
ả
ể ướ ượ
Ð
c l
công th c:ứ 105 2 2 (cid:0) 2 1( )2/ 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x t ( ) 15 06,2 3,43 15 6,28:4,16,13 x
1 s
n s
n
1 ộ ưỡ ưỡ ạ ng dinh d ắ
ơ ượ ẻ ề
ở ầ
C n Th đ
ế
ưở ề
ế
ưỡ ả ượ ủ ẻ ế ừ
ẻ
ng tr em t
12
ế
ạ
gia
c ti n hành trên 1200 tr và tìm xem tình tr ng kinh t
c trình bày trong ng c a tr hay không. K t qu đ ng đ n dinh d ộ
3. M t cu c đi u tra c t ngang v tình tr ng suy dinh d
ế
đ n 36 tháng
ả
đình có nh h
ả
b ng sau: Table 9. Tình tr ng suy dinh d ng c a tr theo tình tr ng kinh t xã hôij c a gia đình Guinea ổ ố Nghèo Trung bình tr lênở T ng s 126 246 372 Suy dinh d ngưỡ 196 632 828 Không suy dinh d ngưỡ ổ ố 322 878 1200 T ng s ủ ỉ ệ ở ẻ ậ
ng kho ng tin c y 95% c a t l ng tr em nghèo? Ướ ượ
c l ố suy dinh d
ưỡ ưỡ
ở ẻ ủ
ng đ i (RR) c a suy dinh d tr em nghèo? ng ủ ả
ơ ươ
ả ậ
ng kho ng tin c y 95% c a RR. a.
b. Tính nguy c t
c. Bài gi ỉ ệ ưỡ ở ẻ Ướ ượ
c l
iả
a. Ướ ượ
c l ể
ng đi m t l suy dinh d ng tr nghèo: ủ ỉ ệ ậ ưỡ ở ẻ p1 = 126/322 = 0,391 = 39,1%
ả
ng kho ng tin c y 95% (z = 1,96) c a t l suy dinh d ng ỡ ẫ
tr ngho (c m u Ướ ượ
c l
n = 322): ) 391,0 p
1 p
1 (cid:0) z 391,0 96,1 p
1 1( )2/ )391,01(
322 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 1(
n
027,0 053,0 338,0 ,0: 444 391,0 96,1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ưở ỉ ệ ưỡ ở ẻ ỉ ng 95%, t l suy dinh d ng ầ
tr em nghèo t nh C n 391,0
ớ ộ
ạ
i, v i đ tin t
Tóm l
ế
ừ
ơ
33,8% đ n 44,4%.
th là t
ơ ươ
b. Nguy c t ố ủ ưỡ ở ẻ ng đ i c a suy dinh d ng tr em nghèo 0 RR : : 40,1 a
n 126
322 246
878 126
322 878
246 a
1
n
1 0 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ưỡ ữ ấ ớ ẻ ễ ị ng g p 1,4 lân so v i nh ng tr ẻ ả ủ ứ ậ ở .
ng kho ng tin c y 95% c a RR theo công th c trình bày trên ộ
Ướ ượ
c l ưở ơ ị ng 95% ta cho tr em nghèo b nguy c suy dinh Nói cách khác tr em nghèo d b suy dinh d
em thu c gia đình trung bình hay khá gi
ả
c.
1,18 : 1,66
ớ ộ
ầ ầ ẻ
ữ ẻ ặ Nói cách khác v i đ tin t
ế
ấ
ưỡ
d ớ
ng cao g p 1,16 l n đ n 1,68 l n so v i nh ng tr em trung bình ho c khá. 106 107 Ề ƯƠ SO SÁNH NHI U TRUNG BÌNH PHÂN TÍCH PH NG SAI ụ ả ậ ứ ươ ứ
ượ ủ ề ọ
ủ ươ c ý nghĩa c a ph ng pháp phân tích ph ề
ng sai trong so sánh nhi u ừ ố ệ ươ ượ ủ ề ị ơ s li u đ nh l ng sai t ng c a 3 hay nhi u h n các ề ệ ộ ớ ề c các khái ni m: phân tích ph ng sai m t chi u, v i hai chi u, ba ượ
ạ ề ố ươ
ặ
ế ố ố
ộ ố ị ẫ ộ M c tiêu
Sau khi nghiên c u ch đ h c viên có kh năng:
Nh n th c đ
ố
s trung bình.
ả
ự
Xây d ng b ng phân tích ph
nhóm
Trình bày đ
ặ
chi u; quy ho ch có l p và không có l p, quy ho ch cân đ i và không cân đ i.
So sánh đ ậ
ượ ế ố
c y u t tác đ ng ng u nhiên và y u t tác đ ng c đ nh. ớ ệ ơ ậ ứ ữ ố ệ ả ầ ụ ườ ợ
ữ ố ộ ậ ự ữ ư ườ ị ằ ể ố
ể
ữ
ề ạ ầ
ừ ở ế ộ
ự ề ặ ỉ ắ ố ề ặ ư
ng nh có th
ộ
ế ổ
t gi a các nhóm tu i là nh nhau dù là nam hay n . Tho t đ u, d
ạ
ễ ả ể ợ ạ
ở ứ ộ ố ớ
ể i m t k t qu có ý nghĩa sai l c. Thí d
ượ ộ ế
ẽ
ế
c ti n hành s có ý nghĩa t. ươ ả
ươ ng pháp khác đ c g i là phân tích ph ấ ệ ươ ượ c trình bày sau. Ph ờ ế ườ ẩ ế ườ ọ ị ầ ế ả ấ ợ ơ ệ
ở ươ ệ ẽ ả ắ ng sai (analysis of variance). Ý nghĩa
ề
ứ ạ
ng pháp khá ph c t p. Vi c tính toán m t nhi u
ầ
ề
ượ
c ti n hành nh các gói ph n m m máy tính chu n. Vì lí do
ủ ế
ớ
ụ
ạ
i đ c có đ ki n
ươ
ả ế
i k t qu . Dù v y trong ch
ng này
t và lí gi
ườ
ng h p đ n gi n nh t, đó là phân
t c a vi c tính toán trong tr
ủ
ữ
ng sai m t chi u, b i vì nó s giúp ích cho vi c n m v ng căn b n c a ớ ị ế ủ
ề
ệ ủ
ng pháp và quan h c a nó v i ki m đ nh t.
ộ ượ ươ ề ằ ể
ợ
ng sai m t chi u thích h p khi các nhóm so sánh đ ở
ữ ụ ư ấ
c mô t ả
ươ ế ố ữ
ề
, thí d nh tu i và gi ư ổ
ạ ế ố ươ ộ
c xác b ng b i m t
(factor), thí d nh so sánh trung bình gi a các giai c p khác nhau hay gi a các
ệ
ợ
và thích h p khi vi c
ượ
ễ
c
ng pháp d dàng đ
. ườ ứ ố ở
ng sai b i vì ng c phân tích ph ươ
ự ế
ổ ầ
ể ữ ụ
ộ ể
đ
ở
ỉ ấ ệ
ế ạ
ộ ể ề ả ồ ộ ộ ữ ổ ớ ồ
ổ ủ ư ổ ớ ủ ứ ớ ộ
ở
ng sai c a nhóm tu i và gi
ố
ứ ấ ợ ự
ế ễ ở ộ ể
ơ
ả ự ệ ự ự ở
ị ơ ấ ệ ổ i thi u
1. Gi
ứ ạ
ườ
ng có nh ng t p h p s li u ph c t p ch a h n hai nhóm và trong phân tích
Th
ủ
ườ
i ta có
ng ph i so sánh nh ng trung bình c a các nhóm thành ph n. Thí d , ng
th
ộ
ề
ộ
ượ
ể
th mu n phân tích các s đo hemoglobin đ
c thu th p trên m t cu c đi u tra c ng
ồ
ả
ớ
i tính hay không và xem có ph i là s khác
đ ng đ xem nó có khác nhau theo tu i và gi
ể
ổ
ệ
bi
ề
làm đi u này b ng cách dùng m t lo t các ki m đ nh t, so sánh t ng 2 nhóm m t. Ði u
này không ch r c r i v m t th c ti n mà còn vô lí v m t lí thuy t, b i vì ti n hành
ụ
ể ẫ ớ
ị
m t s l n các ki m đ nh ý nghĩa có th d n t
ị
ể
m c 5%
có th trông đ i 1 trong 20 (5%) các ki m đ nh đ
ệ
ự
ngay c khi không có s khác bi
ượ ọ
ộ
M t ph
ủ
c a tên này đ
ờ
ng đ
th i gian và th
ấ
ươ
ng này nh n m nh đ n các nguyên lí v i m c đích giúp ng
này, ch
ậ
ạ
ỉ
ứ ể
th c đ ch đ nh d ng phân tích c n thi
ả
cũng trình bày chi ti
ộ
tích ph
ươ
ph
Phân tích ph
ế ố
y u t
ươ
ượ
ộ
ng sai hai chi u đ
dân t c khác nhau. Phân tích ph
ớ
ụ
ự
i tính. Ph
chia nhóm d a trên 2 y u t
ở ộ
ằ
ề
c phân lo i chéo b ng nhi u hai y u t
m r ng đ so sánh các nhóm đ
ộ ế ố ượ
i ta mu n so sánh các m c khác nhau
M t y u t
ạ ừ
ủ
c a nó hay b i vì nó gây cho s bi n thiên c n lo i tr . Xem thí d sau. Sau khi khám
ườ
i
phá t su t b nh m ch vành thay đ i đáng k gi a các nhóm dân t c khác nhau, ng
ề
ta ti n hành m t cu c đi u tra đ xem đi u này có ph i là do n ng đ lipid trung bình
ộ
khác nhau gi a các nhóm dân t c khác nhau. B i vì n ng đ lipid thay đ i theo gi
i tính
ươ
ầ
và tu i, do đó c n phân tích ph
i tính cũng nh nhóm dân
ặ
ả
ổ
ộ
i tính không ph i là m i quan tâm chính c a nghiên c u này.
t c, m c dù tu i và gi
ệ ư
ệ
ị
t
Vi c đ a vào phân tích chúng có hai l
i ích. Th nh t, ki m đ nh ý nghĩa s khác bi
ự
ẽ
ạ
ủ
ữ
gi a các nhóm ch ng t c tr nên m nh m (powerful) h n, nghĩa là d khi n cho s
ủ
ứ
t th c s tr thành có ý nghĩa. Th nhì, nó đ m b o s so sánh các nhóm ch ng
khác bi
ớ
ộ
t c không b sai l ch do c c u nhóm tu i và gi ả
i tính. 108 ế ố ằ ề ư ự ộ
ả ể
ng t ọ
ệ ộ
ở ồ ả ố
ơ ế ệ ầ ố ệ
ổ
ế
ứ ạ
ọ ự ự ươ ụ ượ
b ng cách dùng m t kĩ
c phân thành nhi u y u t
ồ
ơ
nh ng t ng quát h n g i là h i quy b i (multiple regression). C hai
ộ ổ
ơ
ư
ề
ng pháp đ u cho k t qu gi ng h t nhau nh ng b i vì h i quy b i t ng quát h n
ơ
ợ
ườ
ng h p đ n
c và chúng có ả
ng trình máy tính có đ Cũng có th phân tích s li u đ
ậ ươ
thu t t
ươ
ph
nên nó c n tính toán ph c t p h n. Vì th nó không hi u qu trong các tr
ượ
ộ
ậ
ả
gi n. Dù v y, s l a ch n ph thu c vào ch
ễ ử ụ
d s d ng hay không. ề ươ ộ
ng sai m t chi u ượ ề ộ ng sai m t chi u (oneway analysis of variance) đ
ư ộ ố ồ ộ
ả ồ ươ
ế ố ố ệ ượ ộ ụ
ạ ệ
ề
ề
c g i là m t chi u b i vì s li u đ ộ
c phân tích theo m t bi n s , trong tr ạ ệ ở
ầ ề ồ 2. Phân tích ph
ể
ươ
c dùng đ so sánh
Phân tích ph
ệ
ủ
ủ
trung bình c a m t s nhóm, thí d nh ng n ng đ hemoglobin trung bình c a b nh
ầ
ủ
ng pháp phân tích
nhân c a các lo i b nh h ng c u li m khác nhau (b ng 8.1a). Ph
ợ
ườ
ượ ọ
đ
ng h p
này là lo i b nh h ng c u li m. ệ ử ụ ươ ề 1, N2, …, Nk. S đ i t
t c các nhóm là N ộ
ng sai m t chi u
ủ s chúng ta mu n so sánh trung bình c a k nhóm. Hãy kí hi u s đ i t ố ố ượ ượ ổ ấ ả ố ệ ượ ng trong
ố ố
j. T ng s đ i
ư 2.1. Kí hi u s d ng cho phân tích ph
ố
ả ử
Gi
ỗ
m i nhóm là N
ượ
ng trong t
t ng trong nhóm j đ
1+ N2+ …+ Nk = N. S li u đ ệ ố ố ượ
ệ
c kí hi u là N
c trình bày nh sau Nhóm 1 Nhóm 2 Nhóm k Nhóm ố ệ
S li u X11
X21
.
.
XN11 X11
X21
.
.
XN22 X1k
X2k
.
.
XNkk N N k N
1 2 ố
đ i N1 N2 Nk ố
S
ngượ
t X X X i i ik 1 2 i i i X X X k 1 2 1
N 1
N 1
N k 1 2 N N k N
1 2 Trung bình (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 2 2 2 X X X X X X ( ) ( ) ( ) i ik k i
1 1 2 2 i i i 1 1 1 s s 2
k 2
s
1 2
2 N N N 1 1 1 k 1 2 ngươ (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Ph
sai (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ệ ử ụ ố ượ ị c s . S đ u xác đ nh đ i t ị ủ ố ượ ứ ướ ố ố ầ
21 là giá tr c a đ i t ố ứ
ổ ị ủ ố ượ ứ ng trong nhóm
ộ
ng th 2 trong nhóm 1. M t
ng th i trong nhóm j. Chúng ta cũng s d ng kí ử ụ
‘ X là trung bình chung. ế ươ ộ ủ ổ
ằ
c th hi n b ng t ng bình ph
ượ ọ ắ
c g i t ng toàn b các đ
ng toàn b ủ ổ ộ ự t là t ng bình ph
ộ do c a t ng bình ph ộ
ộ
ươ
ổ
ổ
ươ
ng toàn b chúng là t ng ố ườ Trong kí hi u này chúng ta s d ng 2 c
ị
và s th hai xác đ nh nhóm. Do đó X
ij là giá tr c a đ i t
cách t ng quát X
hi uệ ‘ X1, ‘ X2,…,‘ Xk, làm trung bình c a các nhóm 1, 2,.., k và
ủ
ộ ủ ố ệ
ể ệ
ượ
Bi n thiên toàn b c a s li u đ
ớ
ệ
l ch c a quan sát so v i trung bình chung và đ
(total sum of square – total SS). Đ t
ố
ng 1.
s các đ i t 109 ầ ủ ổ ươ ộ N N N j j j k k k 2 2 2 ể ử ụ ứ ể ượ ng toàn b
ươ
ộ ộ ươ ớ ộ
c chia
ng toàn b có th đ
ng n i b nhóm (withingroup SS) và ươ 2.2 Phân tích thành ph n c a t ng bình ph
ổ
ạ ố ể
Có th s d ng đ i s đ ch ng minh t ng bình ph
ầ
thành 2 ph n đ c l p v i nhau: t ng bình ph
ổ
t ng bình ph ộ ậ
ổ
ữ
ng gi a các nhóm (betweengroup SS). ij ij j j j i j i j i 1 1 1 1 1 1 N N j j k k k 2 2 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) X X X X X X ( ) ( ) ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ij ij j j j j i j i 1 1 1 1 1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) X X X X X ( ) ( ) ) XN
(
j (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) N N N N j k k 1 2 2 2 2 2 ả ng toàn b . ở ế
ươ ộ Ở ế
ổ ổ
v trái là t ng bình ph
ộ ộ
ượ ổ ng n i b nhóm và s h ng th nhì là t ng bình ph
ể ượ ứ
ộ ộ ầ
ữ
ừ ươ
ố ạ
ươ ươ ng n i b nhóm có th đ c t ng bình ph ủ
v ph i, s h ng đ u c a tiên là
ng gi a các nhóm.
ng sai ố ạ
ươ
c tính t ph ố ạ
S h ng
ổ
t ng bình ph
ậ
ể
Có th nh n xét đ
ủ ừ
c a t ng nhóm ij j i ik k i
1 1 2 2 i j i i i 1 1 1 1 1 N j k 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) X X X X X X X X ( ) ( ) ( ) ... ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ij j 2
Ns
(
k k 2
Ns
(
k k 2
Ns
(
1 1 j i 1 1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) X X ( ) )1 )1 ... )1 (cid:0) (cid:0) ộ ự ươ ộ ổ ộ ự ng toàn b chúng là t ng s các đ i t
ộ ậ ầ do
ế ộ ự
t đ t
do này cũng đ c chia thành 2 thành ph n đ c l p và c ng tính, đ t ừ ộ ộ ự ố ố
ộ
m t (k1) và đ t ố ườ
ng
ộ ự
do ng gi a các nhóm b ng s nhóm tr ươ
ộ ộ ươ ằ 2.3 Phân tích đ t
Chúng ta đã bi
1 (N1). Đ t
ủ ự ổ
do c a s t ng bình ph
ủ ổ
c a t ng bình ph ủ ổ
do c a t ng bình ph
ượ
ằ
ữ
ng n i b nhóm b ng (Nk). ươ ươ ộ ự ộ ộ ộ ộ ộ ự ộ ộ
ữ ổ
ươ
ươ ữ do n i b nhóm chúng ta có
w). Khi chúng ta
do gi a các nhóm chúng ta có trung
ớ ổ
b). Khác v i t ng ươ ng gi a các nhóm (between group mean squares MS
ấ ộ ươ w) là ươ
ng và đ t
ứ ủ ủ ố s
ng sai dân s
b) là ố s
ng sai dân s ươ
ị ế ọ ớ ng không có tính ch t c ng tính.
ư
ướ ượ
ộ ộ
c l
2. V i gi
ế
ả
ớ
thuy t Ho :
ệ
ướ ượ
c l
ng không ch ch c a ph
b cùng v i MS thuy t Ho đúng thì MS ẽ ớ ế
ủ ủ ậ ng không
m 1 = m 1 =…= m k, trung bình bình
2. Vì
w có chung giá tr kì v ng và có phân
ữ
thuy t Ho sai, có nghĩa là trung bình gi a các nhóm không
ể ể
ọ
b s l n h n kì v ng c a MS
w. Vì v y đ ki m
ỉ ố ườ ả ố ng.
2.4 Trung bình bình ph
ng n i b nhóm cho đ t
Khi chúng ta chia t ng bình ph
ng n i b nhóm (within group mean squares MS
trung bình bình ph
ổ
ng gi a các nhóm cho đ t
chia t ng bình ph
ữ
bình bình ph
ộ ự
bình ph
do, trung bình bình ph
ể
Có th ch ng minh trung bình bình ph ong n i b nhóm (MS
ệ
ươ
ch ch c a ph
ữ
ư
ph ong gi a các nhóm (MS
ả
ế
ậ
v y n u gi
ố
ph i F. Tuy nhiên n u gi
ằ
b ng nhau, thì giá tr kì v ng c a MS
ị
đ nh gi ả
ọ
ơ
i ta tính xem t s này có phân ph i F hay không. ế
ị
ế
thuy t Ho ng ộ ề ượ ộ ố ng sai m t chi u (oneway analysis of variance) đ
ư ồ ộ
ả ụ
ề ồ
ở ượ ộ ộ ạ ệ
ề
c g i là m t chi u b i vì s li u đ c phân tích theo m t chi u, trong tr ủ
ọ
ạ ệ ề ở ả ề ả ế
B ng 7(b) và k t qu trình bày c trình bày ở 2.5 Thí dụ
ể
ươ
c dùng đ so sánh
Phân tích ph
ệ
ủ
ủ
trung bình c a m t s nhóm, thí d nh ng n ng đ hemoglobin trung bình c a b nh
ươ
ầ
ng pháp phân tích
nhân c a các lo i b nh h ng c u li m khác nhau (b ng 8.1a). Ph
ợ
ườ
ề
ố ệ
ượ
đ
ng h p
ồ
này là lo i b nh h ng c u li m.
ố ệ
ệ
Vi c tính toán s li u h ng c u li m đ
ủ ả
c a b ng phân tích ph ượ
ả
trong B ng 7(c). ầ
ầ
ồ
ươ
ng sai 110 ộ ả ế ượ ứ ư ượ ọ ỗ ộ ự trong b ng trình bày l ệ ể ươ do và đ
ự ng bi n thiên cho m i đ t
ị ng (mean square MS). Ki m đ nh ý nghĩa cho s khác bi ự ươ ng gi a các nhóm (between groups) và trong n i b ồ t quan sát đ ỉ ữ ươ ạ ệ ố ượ ộ
ữ
ộ ng v i s bi n thiên gi a các đ i t ệ ữ ạ ệ
ươ
ng đ
ượ ạ ế
i n u chúng là do s khác bi
c l ượ ươ ự ự
ằ ế ự
ề
ầ
ớ ự ế
ự
ng đ ự ế
ị
ể
c so sánh b ng ki m đ nh F, đôi khi còn đ ị ố ự ơ ự ệ ế ả ỉ ở ẫ ố ở ử ố ầ do ẽ
do: (k1) đ t
ượ ậ ộ ự ặ ộ ự
ả
ố ồ ủ ỗ ệ
thuy t trung tính cho r ng s khác bi
ố
ố
ộ ự
s và (Nk) đ t
t
do
c l p b ng theo các c p đ t
ỉ ộ ự
s và các kh i g m nhi u hàng ch đ t ẫ ố
ể ầ ề
ứ
ố ự ộ ị ầ
ớ
ớ ộ ự ả ứ ể ộ ự
ể ở ữ ộ ộ ự
do ch không có hàng cho 38 đ t
ủ
ơ ả
ắ ồ
ạ ệ ữ ệ ề ầ ồ ố ớ ệ ấ ấ ấ ố ớ ệ c g i là trung
C t th t
ữ
t gi a các
bình bình ph
ộ ộ
ữ
nhóm d a trên trung bình bình ph
ượ
ệ
các nhóm (within groups). N u s khác bi
c trong n ng đ hemoglobin
ờ ự ế
ồ
ủ
c a các lo i b nh h ng c u li m khác nhau ch là tình c , s bi n thiên gi a các nhóm
ng trong cùng m t lo i b nh.
cũng t
ẽ ớ
Ng
t th c s thì s bi n thiên gi a các nhóm s l n
ượ
ơ
ọ
h n. Trung bình bình ph
c g i là
ỉ ố ươ
ể
ng sai (varianceratio).
ki m đ nh t s ph
ổ
ố
Trong đó N là t ng s các quan sát và k là s các nhóm.
ả ấ
ế
ỉ ằ
ớ
ự ự ữ
F ph i x p x b ng 1 n u không có s khác bi
t th c s gi a các nhóm và l n h n 1
ờ
ệ
ự
ế
ằ
t ch là do tình c ,
t. Theo gi
n u có s khác bi
ố
ộ
ỉ ố
ớ
t s này s tuân theo phân ph i F mà không gi ng v i các phân ph i khác, nó có m t
ể
ủ
ộ ự
ặ
m u s . Ði m ph n trăm c a
do
c p đ t
ỉ ộ ự
ộ ủ ả
ở ả
ố
B ng A4. C t c a b ng ch đ t
phân ph i F đ
ố
ủ ử ố
do c a t
do c a m u s . trong m i kh i này
ộ
ữ
có nh ng hàng khác nhau cho m c ph n trăm khác nhau. Ði m ph n trăm là m t đuôi
ơ
ở
ể
b i vì ki m đ nh d a trên phân ph i F l n h n m t.
ầ
ể
ả
do (2,38). B ng đi m ph n trăm có hàng
Trong B ng 7(c), F=50,26/0,95=52,9 v i đ t
ậ
cho 30 và 40 đ t
do. Dù v y chúng ta có th nói
ủ
ể
ằ
r ng đi m 0,1% c a F(2,38)
gi a 8,77 và 8,25 (là đi m 0,1% c a F(2,30) và F(2,40)).
ộ
ớ
Rõ ràng 52,9 l n h n c hai. Do đó n ng đ hemoglobin khác nhau m t cách có ý nghĩa
ộ
ồ
gi a các b nh nhân m c các lo i b nh h ng c u li m khác nhau (P<0,001). N ng đ
trung bình th p nh t là bênh nhân có Hb SS, trung bình đ i v i b nh nhân có Hb S/ß
thalassaemia và cao nh t đ i v i b nh nhân có Hb SC. ả ị ầ đ nh:
ả ị ườ ứ ả ố ị ấ
đ nh c n cho ki m đ nh F. Th nh t là s li u ph i phân ph i bình th ể
ữ ể ả ộ ệ
ằ ẩ
ậ ườ ẩ ng.
ể
ể
ng nh ng các đ l ch chu n không b ng nhau có ủ
ng b ng căn b c hai c a trung bình bình ph
ự
ậ ể ế ườ ả ọ ợ 2.6 Gi
ố ệ
Có hai gi
ố
ộ
ứ
Th nhì là đ l ch chu n gi a các cá th trong cùng m t nhóm ph i gi ng nhau. Có th
ươ
ướ ượ
ng (MS) trong các nhóm. Có th
c l
ỏ
ộ ệ
ố
b qua s phân ph i không bình th
ể
th gây h u qu nghiêm tr ng. Trong tr ằ
ư
ổ ố ệ
ng h p này có th bi n đ i s li u. ị ố ệ ớ ể ẫ ự ở ộ ề ộ ị ả ị ể
ằ
ộ ự ư
ủ ể ầ ớ ủ
ươ
ng sai m t chi u là s m r ng c a ki m đ nh t hai m u. Khi ch có hai
ị ươ
ị
ế
ng
ươ
ng ẫ
ỉ
ươ
ng giá tr t t
ằ
do cũng b ng bình ph ố
ớ ộ ự ủ ể ầ ố 2.7 M i liên h v i ki m đ nh t hai m u
Phân tích ph
ể
ẫ
m u, nó cho k t qu y nh là ki m đ nh t. Giá tr F b ng bình ph
ứ
ng và đi m ph n trăm c a phân ph i F v i (1,N2) đ t
ủ
c a đi m ph n trăm c a phân ph i t v i N2 đ t do. 111 t trong n ng đ hemoglobin gi a các b nh
Anionwo et al. (1981) British Medical ố ệ (a) S li u ạ HbSS HbSC HbS/beta
thalassemia ệ
Lo i b nh
ầ
ồ
h ng c u
li mề ố ệ
S li u 7,2; 7,7; 8,0; 8,1;
8,3; 8,4; 8,4; 8,5;
8,6; 8,7; 9,1; 9,1;
9,1; 9,8; 10,1; 10,3 8,1; 9,2; 10,0;
10,4; 10,6; 10,9;
11,1; 11,9; 12,0;
12,1 10,7; 11,3; 11,5;
11,6; 11,7; 11,8;
12,0; 12,1; 12,3;
12,6; 12,6; 13,3;
13,3; 13,8; 13,9 16 10 15 ố ố
S đ i
ượ
ng N
t
i 8,712 10,630 12,3 Trung bình
‘ Xi 0,844 1,284 0,942 ộ ệ
Đ l ch
chu n (sẩ
i) j j 1 k 2 (cid:0) ố (b) Tính toán
________________________________________________________________________
_
N = S Ni = 16 + 10 + 15 = 41, s nhóm (k) = 3
k (cid:0) XN
j (cid:0) (cid:0) (cid:0) (cid:0) 10.4927 X N 2,430
41 SS X ) 92,99 b XN
(
j j j 1 (cid:0) (cid:0) (cid:0) (cid:0) d.f. = k1 = 2 d.f.= N - k = 41-3 = 38 SSw = =15 · 0,8442 + 9 · 1,2842 + 14 · 0,9422 = 37,95 d.f.= N-1 = 40 SS = SSb + SSw=137,87 ả ươ (c) B ng phân tích ph ng sai ế ồ Ngu n bi n thiên SS d.f. MS = F= ữ Gi a các nhóm 99,92 2 49,96 50.03 , P<0,001 Trong các nhóm 37,95 38 0,996 ộ ổ T ng c ng 137,87 40 112 ề ươ ng sai hai chi u ườ ề i ta dùng phân tích ph ạ ố ệ ư ụ ổ c phân lo i theo hai chi u thí d nh theo tu i và gi
ố ươ
ề
ế ố ằ ế ố ằ ố ề ạ ặ ạ ố ế
ộ ế ạ ỉ ẽ ượ 3. Phân tích ph
ố ệ
ng sai hai chi u (two way analysis of variance) khi s li u
Ng
ạ
ớ
ượ
i tính. S li u là quy ho ch
đ
ạ
cân đ i (balanced design) n u s các quan sát trong các nhóm là b ng nhau và quy ho ch
không cân đ i (unbalanced design) n u s các quan sát trong các nhóm không b ng nhau.
ỗ
Qui ho ch cân đ i có hai lo i có l p (with replication) n u có nhi u quan sát trong m i
ạ
nhóm và không có l p (without replication) n u ch có m t quan sát. Ba lo i quy ho ch
này s đ ặ
c trình bày riêng. ạ ố ặ ồ ủ ủ ộ ỗ
ụ ị ằ ế
ượ ả ự
ề ộ ố ớ ề ớ ở ộ ạ ủ ề
c phân lo i theo hai chi u, b i ch ng t c và gi ố ở ổ ớ ề ươ ươ i tính. Phân tích ph ng sai 2 chi u chia t ng bình ph ệ ữ ươ ủ ự
ng do s khác bi ủ ủ ế ủ ố ề
do c a nó là s các ch ng chu t tr m t và b ng 2. ổ ộ
ộ ừ ộ
ủ ằ
ớ ớ ộ
i tính, đó là tác đ ng chính c a gi i tính. Ð ộ ừ ộ ằ ằ ủ ữ ng do s t
ệ ả ủ ớ ộ ệ
ủ ằ
ư ự ầ ng ph n d là s khác bi ữ
ệ
ố ủ ố ủ ố ớ ủ ằ ố ộ
t gi a các con chu t trong cùng nhóm
i tính (2) và s quan do b ng 24, tích s c a s ch ng (3) s gi ừ ộ
ươ ộ ộ ị ể
ủ ươ ớ ể
ầ
ng ph n d nh ượ
ươ
ươ ự ệ ề ả ộ ị
ằ
c ki m đ nh đ ý nghĩa b ng cách dùng ki m đ nh F
ư
ư
ng c a nó v i trung bình bình ph
ượ
c
ng sai m t chi u. Th c nghi m này không thu đ c mô t
ả 4. Quy ho ch cân đ i có l p
ộ
ộ
ả
ệ
B ng 8.2 trình bày k t qu th c nghi m trên 3 ch ng chu t m i ch ng g m 5 chu t
ưở
ự
ng. M c đích là tìm xem các
đ c và 5 chu t cái đ
c đi u tr b ng hormone tăng tr
ủ
ư
ị
ứ
ớ
ộ
ủ
ch ng chu t và gi
i tính chu t có đáp ng v i đi u tr nh nhau hay không. S đo c a
ứ
ọ
đáp ng là tăng tr ng sau 7 ngày.
ữ
ượ
ố ệ
Nh ng s li u này đ
i tính. Quy
ạ
ỗ
ặ
ho ch là cân đ i có l p (balanced with replication) b i vì có 5 quan sát trong m i nhóm
ủ
ch nggi
ng thành 4 thành
ph nầ
ổ
t gi a các ch ng. Ði u này là tác đ ng chính (main
(i) T ng bình ph
ủ
ộ ự
effect) c a y u tó, ch ng. Ð t
ệ
ự
ươ
ng do s khác bi
t gi
(ii) T ng bình ph
ớ
ố
ủ
ự
i tính tr m t.
do c a nó b ng 1, b ng s các gi
t
ự ươ
ự ươ
ớ
ươ
ổ
i tính. S t
ng tác (interaction) gi a ch ng và gi
ng
(iii) T ng bình ph
ủ
ượ ạ
ớ
ố
ự
i
i hay ng
t do ch ng không gi ng nhau trên c hai gi
c l
tác có nghĩa là s khác bi
ố
ằ
ộ ự
ố
ự
do b ng tích s
i tính không gi ng nhau trên 3 ch ng chu t. Ð t
t do gi
s khác bi
ộ
ộ ự
do c a 2 tác đ ng chính b ng 2 x 1=1
đ t
ươ
ổ
(iv) t ng bình ph
ộ ự
ớ
i tính. Ð t
ch nggi
ỗ
sát trong m i nhóm tr m t (4).
Tác đ ng chính và t
ng tác đ
ể
đ so sánh trung bình bình ph
ượ
trong phân tích ph
đ
ế
k t qu có ý nghĩa. t đáp ng v i hormone sinh tr ng trên 3 ch ng chu t khác nhau (m i ch ng (a) Tăng tr ng trung bình (tính theo gram) v i đ l ch chu n trong ngo c (n=5 trong m i nhóm), ớ Gi i tính ch ng Aủ ch ng Bủ ch ng Củ Nam 11,9(0,9) 12,1(0,7) 12,2(0,7) Nữ 12,3(1,1) 11,8(0,6) 13,1(0,9) ươ ề ạ ặ ằ (b)Phân tích ph ng sai hai chi u: quy ho ch cân b ng có l p ế ồ Ngu n bi n thiên SS d.f. MS = F= 113 ộ Tác đ ng chính Ch ngủ 2,63 1,32 2 1,9,P>0,1 ớ Gi i tính 1,16 1,16 1 1,7,P>0,1 ươ
ủ ng
T
Ch ng x Gi tác
ớ
i 1,65 0,83 2 1,2,>0,1 Ph n dầ ư 16,86 0,70 24 ộ ổ T ng c ng 22,30 29 ạ ặ ố ị ổ ượ ươ ư ươ ươ ng ph n d trong phân tích ph ầ
ụ ụ ữ ườ ươ
ế ả thi ộ
ng pháp áp d ng trên m t ph n . Trong tr
t là do s bi n thiên tình c và trung bình bình ph
ủ ợ
ươ
ng đ
ộ ờ
ư ể ươ ầ ữ ổ ượ ế ắ ầ ư
ươ ự ệ ả
ọ
ng pháp. Tác đ ng chính do s khác bi ở ứ ươ 5. Quy ho ch cân đ i không l p
ể
ả
ụ ữ
Năm ph
ng pháp đ xác đ nh tu i thai đ
c so sánh trên 10 ph n trong b ng 8.3.
ổ
ỉ
ộ
ở
Không có t ng bình ph
ng sai b i vì ch có m t quan
ộ
ươ
ư ậ
sát cho m t ph
ng
ng h p nh v y, t
ự ế
ượ
ượ
c gi
tác đ
c dùng làm
ướ ượ
ị
ng ph n d đ tính giá tr F c a tác đ ng chính. Tác
ng trung bình bình ph
c l
ụ ữ ể
ề
ộ
đ ng chính do tu i thai khác nhau gi a 10 ph n hi n nhiên có ý nghĩa. B n thân đi u
ả
ồ
ộ
c quan tâm l m nh ng nó là m t ngu n bi n thiên quan tr ng c n ph i
này không đ
ữ
ộ
ế
t gi a các
tính đ n trong khi so sánh các ph
m c 5% (F=757,85/202,81= 3,74, d.f.=[4,36]).
ng pháp là có ý nghĩa
ph ươ ầ ế ươ ụ ể ổ ể ộ
t các hi u s t o nên tác đ ng có ý nghĩa. Thí d , ph
ơ
ộ ớ
ố ớ ươ
ươ ươ ủ ự
ng pháp d a
ng pháp khác.
ng pháp trong ả ươ ươ ự ệ ng pháp d a trên ngày thai máy và các ố ữ
ộ ự c ng pháp kě kinh cu i ổ
ng
Phân chia t ng bình ph
ệ ố ạ
C n xem xét chi ti
ố
trên ngày thai máy cho con s trung bình cao h n đáng k so v i các ph
Có th phân chia t ng bình ph
ng c a tác đ ng chính đ i v i các ph
B ng 9(c) thành:
ổ
ng các hi u s gi a ph
(i) T ng bình ph
ổ
ươ
ph
do.
ng pháp khác. T ng này có 1 đ t
ả
B ng 9. Tu i thai tính theo ngày c a 10 ph n đ
(last mentrual period LMP), khám âm đ o (Vaginal examination VE), ngày thai máy (date of
quickening DOQ), siêu âm (Ultra sound US) và oxydase diamine máu (Diamine oxidase DAO). (a) s li u ố ượ Ð i t ng LMP VE DOQ DAO US 1 275 273 288 273 244 270,6 2 292 283 284 285 329 294,6 3 281 274 298 270 252 275,0 4 284 275 271 272 258 272,0 5 285 294 307 278 275 287,8 6 283 279 301 276 279 283,6 7 290 265 298 291 295 287,8 8 294 277 295 290 271 285,4 9 300 304 293 279 271 289,4 10 284 297 352 292 284 301,8 114 Trung bình 286,4 282,1 298,7 280,6 275,8 ươ ề ặ
ươ ượ ư ầ ng sai hai chi u: quy ho ch cân đ i không có l p (trung bình bình
ng ph n d trong ạ
ố
ướ ượ
c l
ng trung bình bình ph c dùng làm ng tác đ (b) Phân tích ph
ươ
ươ
ng t
ph
ị
ể
ki m đ nh F) ế ồ Ngu n bi n thiên SS d.f. MS = F= ố ượ Ð i t ng 4437,6 9 493,07 2,43, P<0,05 ươ Ph ng pháp 3031,4 4 757,85 3,74, P<0,05 ươ T ng tác 7301,0 36 202,81 ộ ổ T ng c ng 14770,0 49 ổ ươ ươ (c) Phân chia t ng bình ph ng theo ph ng pháp ế ồ Ngu n bi n thiên SS d.f. MS = F= ươ ng pháp 2415,1 1 2415,10 11,91,P<0,001 ớ
DOQ so v i các ph
khác ệ ữ t gi a LMP, VE, US và 616,3 3 205,43 1,01,P>0,1 Khác bi
DAO Kĩ thu tậ 3031,4 4 ố ổ ạ ươ ộ ự ể ệ ệ ố ươ
ng ng còn l i có 3 đ t do, th hi n các hi u s trong s 4 ph ị ỗ ằ ể ể ườ ự ị ấ ự ớ ươ ư ng pháp này. ự
ượ ằ ệ
c chia theo các ph ng pháp khác, nh ng không có s khác bi
ươ
ằ ộ ậ c ki m đ nh b ng ki m đ nh F theo cách bình th
ng. S phân chia
ể
ng pháp d a trên ngày thai máy khác đáng k (P<0,001) v i các
t có ý nghĩa trong 4 ph
ươ
ợ
ườ
ả ượ ự ấ ự
ng h p này là 4. S phân chia ph
c d a trên n n t ng do, trong tr
t nh t ph i đ ề ả
ươ ố ệ ờ ng pháp t ng pháp khác nhau, và thành
ụ
ệ
tiên nghi m (a
ươ ph nả
ng (ii) T ng bình ph
pháp khác (LMP, VE, US, DAO).
ầ ượ
M i thành ph n đ
ươ
này cho th y ph
ươ
ph
ổ
ư
L u ý r ng t ng bình ph
ng đã đ
ộ ự
ầ
các thành ph n đ c l p b ng đ t
ự
ố
ộ
thu c vào s so sánh quan tâm và t
ế
ướ
priori) tr
c khi phân tích s li u. Ti n hành phân chia nh ph
ế
tuy n tính (method of linear contrasts). ị ẫ ộ ệ ớ ể ươ ề ạ ng sai hai chi u quy ho ch cân đ i không có l p là m ng pháp phân tích ph
ủ ươ
ắ ặ ề ố
ị ủ
ổ ể
ộ ể ế ị
ng trên m t cá th . Trong tr ộ
ườ
ng h p này, có 5 bi n: tu i thai đ
ộ ụ ữ ế ậ ng pháp khác nhau trên m t ph n . Hai cách ti p c n cho k t qu t ở
ượ
ế
c đo
ằ
ượ ướ
c tính b ng
c
ự
ả ươ
ế ng t ươ ế ằ ị Quan h v i ki m đ nh t m t m u
ặ
Ph
ẫ
ộ
r ng c a ki m đ nh t b t c p m t m u, so sánh các giá tr c a nhi u bi n đ
ợ
ườ
l
ươ
các ph
ị
ỉ
khi ch có 2 bi n và giá tr F b ng giá tr t bình ph ng. ạ ứ ễ ả
ộ ố ệ t s li u v nhi m giun móc và m c hemoglobin, đ
ở
Ðông châu Phi. S li u đ ớ i tính và m t đ nhi m giun móc. Có th th y r ng đ i v i m i gi ề
, gi ể ấ ằ
ề ễ
ễ ượ
ượ
ố ớ
ố ớ
ậ ỗ
ộ
ạ ở ữ ấ ơ ở ễ ố
6. Quy ho ch không cân đ i
ắ ố ệ
ề
B ng 10(a) tóm t
ễ
ề
ộ
m t cu c đi u tra v nhi m kí sinh trùng
ậ ộ
ế ố
hai y u t
ả
ộ
ồ
n ng đ hemoglobin gi m khi nhi m giun móc càng nhi u, và đ i v i m t m c đ
nhi m giun móc, hemoglobin trung bình ậ
c thu th p trong
ạ
c phân lo i theo
ớ
i tính,
ộ
ứ
nam. Dù v y quy ho ch này là n th p h n 115 ố ề ỗ ộ ể ậ ộ ễ ệ ế i trong m i nhóm không b ng nhau. Ði u này có nghĩa là
ả ố
i s ằ
i tính và m t đ nhi m giun khi n cho vi c lí gi ậ ộ ệ
ả ễ ồ ở ữ nam và n ố ệ ườ
ố ở
không cân đ i b i vì s ng
ớ
ủ
không th tách tác đ ng c a gi
ự ế
ể ế
li u không th ti n hành tr c ti p.
ộ
B ng 10. N ng đ hemoglobin (g%) theo m t đ nhi m giun móc
(a) S li u Nam Nữ ậ ộ ễ Số s.d. s.d. Số M t đ nhi m giun
móc Hb trung
bình Hb trung
bình Âm tính 22 35 12,3 1,8 11,1 1.1 Th pấ 20 27 11,9 1,2 10,8 1,3 Trung bình 17 14 10,7 1,6 9,5 1,9 Cao 15 11 9,0 1,4 8,6 1,7 ươ ề ạ (b) Phân tích ph ố
ng sai hai chi u: quy ho ch không cân đ i ế ồ Ngu n bi n thiên SS d.f. MS = F= ớ Gi i tính 20,94 1 20,94 9,9,P<0,01 ề ỉ 176,68 3 58,89 27,8, P<0,001 M t đ giun móc đi u ch nh
theo gi ậ ộ
iớ ươ T ng tác 3 3,24 1,08 0,5, P>0,1 Ph n dầ ư 324,28 153 2,12 ộ ổ T ng c ng 525,14 160 ổ ể ươ ả ế ầ
ng sai đ
ớ ệ ự ươ ổ ễ ươ ộ ệ ề ự ữ ổ
ỉ ồ
ữ ớ
ệ
t gi
ẽ ồ
t m t đ
ng do m t đ nhi m giun. T ng này đánh giá quan h
ậ ộ
t gi
ứ
ễ ề ớ ố ớ ố ớ ậ ộ ễ ng sai tr ồ ợ ượ
ủ
ng án khác, tác đ ng c a nhi m giun móc đ
ng h p đó nó g m c s bi n thiên do khác bi ự ệ ớ ộ
t còn l
ạ ộ
ậ ộ ữ ự ụ ự ậ ướ ớ ớ c. ượ ể ứ
ạ ộ
ể ự ệ ậ ử
ả ỏ i gi
ố
ệ
ọ ự
ươ ụ ư
ủ ng trình phân tích ph ỏ
ị ạ ạ ố ỏ ỉ ớ
ế ố ộ ậ
ề
ươ
đ c l p v i
T ng bình ph
ng không th chia thành các thành ph n quy v 2 y u t
ầ
ượ
ả
c c i ti n. Ð u tiên tính
nhau và trong B ng 10(b) trình bày phân tích ph
ố
ươ
ổ
ừ
ự
i tính có phân ph i giun móc
i tính. Tr khi hai gi
t ng bình ph
ng do s khác bi
ậ ộ
ả ộ ố ế
ổ
ố
ng s g m c m t s bi n thiên do s khác bi
gi ng nhau, t ng bình ph
ệ
ậ ộ
giun. Sau đó tính t ng bình ph
ớ
ễ
gi a n ng đ hemoglobin và m t đ nhi m giun có đi u ch nh cho s khác bi
i
ộ
ả
ậ ộ
tính gi a các nhóm m t đ nhi m giun. C hai tác đ ng chính đ u có ý nghĩa, m c ý
i tính (F=9,9, d.f.=[1,153]) và 0,1% đ i v i m t đ nhi m giun
nghĩa 1% đ i v i gi
ự ươ
ng tác không có ý nghĩa.
(F=27,8, d.f=[3,153]). S t
ướ
ươ
ươ
ễ
ộ
c phân tích ph
c,
Theo ph
ệ ồ
ữ
ả ự ế
ườ
t n ng đ hemoglobin gi a
trong tr
ề
ạ
ẽ
ủ
ữ
i sau khi đi u
i tính s là s khác bi
nam và n . Sau đó tác đ ng chính c a gi
ằ
ữ ố ớ
ệ
ỉ
t m t đ giun gi a nam và n . Ð i v i quy ho ch không cân b ng
ch nh cho s khác bi
ả
ẫ
ế
ầ
c n ti n hành phân tích theo c hai cách. Dù v y, trong thí d này, s xem xét đã d n
ế ằ
i tính tr
đ n r ng nên tính t
ề
ổ ế
ố ệ
S li u không cân đ i ph bi n và không th tránh đ
c trong cu c nghiên c u đi u
ự
tra. Dù v y, th nghi m lâm sàng và th c nghi m labo nên d trù đ có quy ho ch cân
ố
ườ ờ
ề
đ i. Không ph i m i d trù đ u thành công thí d nh có ng
i r i kh i vùng trong khi
ề
ầ
ươ
ệ
ử
th nghi m. Các ch
ng sai c a các ph n m m máy tính nh có
ị
ộ ố
ể
th dùng cho các quy ho ch cân đ i hay quy ho ch ch có m t s nh các giá tr b 116 ế ườ ươ ồ ộ ng trình h i quy b i có ợ
ươ ữ
ố ể khuy t (missing value); trong nh ng tr
ế ế
th dùng cho thi t k không cân đ i (xem Ch ng h p này các ch
ng 10). ẫ ộ ố ị ộ ạ ế ố ề ộ
ổ ạ ệ ổ ế
ồ ị ớ ứ
ượ ạ
c l ỉ ệ ẻ ủ
ứ
i, các m c riêng l
ộ ộ ơ
ầ
c a nó có các giá tr nh t đ nh; gi
ẫ
ủ
ự ế
ạ
ị ị ở ườ c đ ngh t ng ng ỉ ị ị ừ
ế
i ch là đ i di n cho ngu n bi n thiên gi a các dung d ch đ ữ ườ ồ
ộ ữ
ẫ
i là m t tác đ ng ng u nhiên. Trong thí d ẽ
ượ ở
c pha b i m t ng ị ộ ữ
ở
c pha b i các ng ươ ể ẫ ố ộ ố ị
ặ ư ạ ạ ộ ề
ề ề
ạ ặ ạ ơ ượ ề ế ng đ
ả ề
ộ
ầ ươ ặ ớ ng đ ứ ư ế ầ ề
ư
ng ph n d nh đã nói
ượ
ả ớ
ng tác ch không ph i v i trung bình bình ph ộ
ượ ộ ẫ
ẽ ươ ươ ư ầ ộ ố ị
ng ph n d , và tác đ ng c đ nh s đ
ể ố ị
ứ ạ ườ ọ ươ ữ ề ng tác. Ðây là nh ng đi m ph c t p. Ng ng t ả 7. Tác đ ng c đ nh và ng u nhiên
ẫ
ố ị
ể
có th chia làm hai lo i, tác đ ng c đ nh (ph bi n h n) và tác đ ng ng u
Y u t
ộ
ư ớ
ế
i tính, nhóm tu i, và lo i b nh h ng c u li m là các tác đ ng
nhiên. Các y u tó nh gi
ấ ị
ở
ố ị
i tính
c đ nh (fixed effects) b i vì các m c riêng l
ữ
ộ
ẻ ủ
c a c a tác đ ng ng u nhiên
luôn luôn là nam hay n . Ng
ẫ
ượ ự
c s quan tâm mà ch là m t m u đ i di n cho s bi n thiên.
(random effects) không đ
ụ
ề
ứ
ự ế
Thí d , xét m t nghiên c u đi u tra s bi n thiên natri và sucrose trong dung d ch ORS
ượ
ườ ượ ề
i pha 8 dung d ch. Trong
c pha
đ
i đ
nhà, trong đó có 10 ng
ượ
ợ
ườ
ườ
ệ
ạ
c
ng h p này 10 ng
tr
ụ
ườ
ở
ộ
pha b i nh ng ng
i khác nhau. Con ng
ệ ướ
ộ
ể
ườ
ế
i có ý nghĩa không, chúng ta s quan tâm đ n vi c
này và đ xem tác đ ng con ng
c
ộ
ồ
ộ ớ ủ ự ế
ượ
ườ
ị
l
i và
ng đ l n c a s bi n thiên n ng đ gi a các dung d ch đ
ượ ọ
ườ
ượ
ữ
ự ế
c g i làì
i khác nhau. Chúng đ
s bi n thiên gi a các dung d ch đ
ầ ủ ự ế
thành ph n c a s bi n thiên (components of variation).
ị
ng pháp ki m đ nh ý nghĩa gi ng nhau trong tác đ ng c đ nh và ng u nhiên trong
Ph
ố
quy ho ch m t chi u và trong quy ho ch hai chi u không có l p, nh ng không gi ng
ề
nhau trong quy ho ch hai chi u (hay nhi u chi u h n) có l p. Trong quy ho ch hai
ươ
ố ị
ả
ặ
c so sánh
chi u có l p, n u c hai tác đ ng đ u c đ nh, trung bình bình ph
ư
ộ
ế
ớ
ở
v i trung bình bình ph
trên. M t khác n u c hai tác đ ng
ươ
ươ
ẫ
ề
ng
đ u là ng u nhiên, trung bình bình ph
c so sánh v i trung bình bình ph
ươ
ộ
ươ
ng ph n d . N u m t tác đ ng là
t
ớ
ẽ
ộ
ẫ
c so sánh v i
ng u nhiên và m t là c đ nh, nó s là cách khác: tác đ ng ng u nhiên đ
ớ
c so sánh v i trung bình
trung bình bình ph
ươ
ế
bình ph
i đ c quan tâm nhi u đ n
ế
t nên tham kh o Huitson (1980).
chi ti ộ ầ ế ứ ứ ễ ị ộ ứ ộ
ế ắ
ễ ứ ị ữ ự
ố
ụ ữ ọ
ồ
ổ ừ ữ
ụ ữ ố ụ ữ
ớ ổ
ữ ướ ư ế
ẻ ạ ự ề ỉ ồ ễ ế ầ ở ị ả 8. Bài tập
ộ
ề
M t nghiên c u quan tam đ n tác đ ng đi u hoà th n kinh lên ch c năng mi n d ch.
ệ
ề ố
ấ ả
Irwin và c ng s (năm 1987) đã xu t b n m t nghiên c u c t ngang v m i liên h
ố ượ
ờ
ộ
ữ
gi a các bi n c quan tr ng trong cu c đ i và ch c năng mi n d ch. Đ i t
ng bao
ị
ề
ồ
g m nh ng ph n có ch ng đang đi u tr vì ung thu ph i di căn; nh ng ph n có
ồ
ồ
ch ng ch t vì ung th ph i t
c đó và nh ng ph n s ng v i ch ng
16 tháng tr
ộ
đang kho m nh. D a trên thang đo đánh giá tái đi u ch nh xã h i (Social readjustment
ấ £ 54); s có đi m
ể
ể
ố
ụ ữ
rating scale) ông chia các ph n làm 3 nhóm: nhóm có đi m th p (
‡ 100). Đ ng th i ông ta cũng đánh giá ch c
ờ
ứ
ể
trung bình (5599) và nhóm có đi m cao (
ả
ụ ữ
ả
năng mi n d ch và thang đo đánh giá tr m c m Hamilton
3 nhóm ph n nŕy. K t qu
ượ
đ c trình bày trong b ng sau: ể ề ỉ ộ
Thang đi m đánh giá tái đi u ch nh xã h i ỉ ề ề ỉ ề Thang đo Nhóm tái đi u ch nh
ấ
ộ
xã h i th p
(n=13) ỉ
Nhóm tái đi u ch nh
ộ
xã h i trung bình
(n=12) Nhóm tái đi u ch nh
ộ
xã h i cao
(n=12) ổ Tu i (năm) x=54.8 s=9.5 x=55.3 s=6.3 x=57.8 s=9.4 ể x=5.3 s=5.2 x=14.7 s=7.5 x=12.0 s=6.8 ả
ầ
Đi m tr m c m
Hamilton 117 ế x=40.2 s=25.7 x=15.6 s=6.4 x=18.1 s=10.0 bào tiêu
nhiên (lytic ạ
Ho t tính t
ệ ự
t t
di
unit) ố ượ
l
ng x=1.8 s=0.5 x=2.2 s=0.5 x=2.5 s=0.8 S
lymphocyte
(103/mL) ầ ự ề ể ộ ỉ ả i k t qu đã phân tích ệ ể
1. Đi m tr m c m gi a c a 3 nhóm (d a theo đi m đánh giá tái đi u ch nh xã h i) có
khác bi
2. S l ữ ủ
ả
ả ế
t hay không? Lý gi
ủ
ng lymphoctye c a 3 nhóm có khác bi t hay không? Bài gi ả ầ ệ
ố ượ
i ả
ể
1. So sánh đi m tr m c m ướ ự ả ế
thuy t Ho: ụ ữ ằ ể B
Ho: Đi m tr m c m c a 3 nhóm ph n b ng nhau c 1: Xây d ng gi
ầ
ọ ả
ể ủ
ị ướ ợ c 2: Ch n ki m đ nh phù h p ươ ươ ể ợ ị ng pháp phân tích ph ố ớ ố ớ
ớ ạ ộ ự B
Ki m đ nh phù h p là ph
kê F v i (s nhóm 1, s quan sát s nhóm) = (2,34) đ t ố
ng sai (ANOVA) v i th ng
i h n= 3,32 do ; F t ướ ố ả ố
ậ c 3: L p b ng ANOVA và Tính th ng kê F
ư ươ ả ậ B
Chúng ta l p thành b ng phân tích ph ng sai nh sau: ế ồ Ngu n bi n thiên SS d.f. MS=SS/d.f. MS gi a các nhóm ữ
F=
MS bên trong nhóm ữ 6,91 , P=0,003 Gi a các nhóm 580,18 2 295,09 Trong các nhóm 1451,87 34 42,70 ộ ổ T ng c ng 137,85 40 ứ ể ị ở trên có th tính theo công th c sau: SS X 2) b XN
(
j j j 1 ữ Các giá tr
Gi a các nhóm
k (cid:0) (cid:0) (cid:0) (cid:0) =13 · 5,32+12 · 14,72+12 · 122 389,32/37=550,18 d.f. = k1 = 2
MSb = SS/d.f.
Trong các nhóm SSw = =13 x 5.22+ 12 x 7,52 + 12 x 6,82 = 1451,87 d.f.= N k = 373 = 34 MSw = SS/d.f.
ị ố
Và giá tr th ng kê F
F = MSb/MSw= 295,09/42,70 = 6,91 ướ ấ ủ ị ố B c 4: tính xác su t c a giá tr th ng kê F 118 ị ự ể ự
c giá tr p= 0,003. Chúng ta cũng có th d a ể ả D a vào máy tính chúng ta tính đ
ượ
vào b ng th ng kê F đ tìm đ ượ
c p <0,005 ướ ậ ỏ ả ủ ằ B
ị ứ ế ỏ ầ ằ ả ể
ụ ữ ố
ế
c 5: K t lu n
ể ế
Vì giá tr p nh nên chúng ta bác b gi
thuy t Ho. Do đó có đ b ng ch ng đ k t
ậ ằ
lu n r ng trung bình đi m tr m c m theo thang đánh giá Hamilton là không b ng nhau
ố ớ ả
đ i v i c 3 nhóm ph n . ố ượ ế 2. So sánh s l ng t
ả ự ướ bào lympho
ế
thuy t Ho: ằ ở ả c 3 nhóm bào lympho trung bình b ng nhau ả ấ ả t c trung bình đ u b ng nhau ề
ằ
m 3) m 3 hay m 2 „
ợ
ị m 2 hay m 1 „
ể
ọ c 2: Ch n ki m đ nh phù h p ươ ươ ể ợ ị ng pháp phân tích ph ớ ố ố ớ
ớ ạ ộ ự c 1: Xây d ng gi
B
ế
ố ượ
ng t
Ho: S l
(Ho: m 1 = m 2 = m 3)
Ha: Không ph i t
(Ha:m 1 „
ướ
B
Ki m đ nh phù h p là ph
kê F v i (s nhóm 1, s quan sát s nhóm) = (2,34) đ t ố
ng sai (ANOVA) v i th ng
i h n= 3,32 do ; F t ướ ố ả ố
ậ c 3: L p b ng ANOVA và Tính th ng kê F
ư ươ ậ ả B
Chúng ta l p thành b ng phân tích ph ng sai nh sau: ế ồ ữ Ngu n bi n thiên SS d.f. MS=SS/d.f. MS gi a các nhóm F=
MS bên trong nhóm ữ 4,11 , P=0,0252 Gi a các nhóm 3,09 2 1,55 Trong các nhóm 12,79 34 0,38 ộ ổ T ng c ng 137,85 40 ứ ể ị ở trên có th tính theo công th c sau: SS X 2) b XN
(
j j j 1 ữ Các giá tr
Gi a các nhóm
k (cid:0) (cid:0) (cid:0) (cid:0) = 13 · 1,82+12 · 2,22+12 · 2,52 – 79,82/37=550,18 dfb = k1 = 2
MSb = SS/d.f.
Trong các nhóm
SSw = =13 x 0,52+ 12 x 0,52 + 12 x 0,82 = 12,79
dfw= N k = 373 = 34
MSw = SS/d.f.
ị ố
Và giá tr th ng kê F
F = MSb/MSw= 1,55/0,38 = 4,11 ị ố ướ ấ ủ c 4: tính xác su t c a giá tr th ng kê F ự ị ể ự
c giá tr p= 0,0252. Chúng ta cũng có th d a ể ả B
D a vào máy tính chúng ta tính đ
ượ
vào b ng th ng kê F đ tìm đ ượ
c p <0,05 ậ ướ ố
ế
c 5: K t lu n B 119 ị ỏ ả ứ ế ỏ
ố ượ ế ủ ằ
ố ớ ả ằ
bào lympho trong máu không b ng nhau đ i v i c 3 nhóm ph ể ế
thuy t Ho. Do đó có đ b ng ch ng đ k t
ụ Vì giá tr p nh nên chúng ta bác b gi
ậ ằ
ng t
lu n r ng s l
ữ
n (p<0,05). 120 Ể Ị ƯƠ KI M Ð NH CHI BÌNH PH NG ủ ề ọ ứ ả Mục tiêu
Sau khi nghiên c u ch đ , h c viên có kh năng: · ự ượ ả ự ả ố ế ố ị ữ Xây d ng đ c b ng d trù n ể
m đ mô t m i liên quan gi a hai bi n s đ nh tính cho b ng d trù n c 2 · ự ả ế ố ị ề ự ữ ử ụ ể ị m v s liên quan gi a hai bi n s đ nh S d ng ki m đ nh
tính c 2 ả ị ợ ệ ề ị Trình bày các gi đ nh v tính h p l ể
cho ki m đ nh McNemar đ ki m đ nh s liên quan gi a hai bi n s đ nh tính ế ố ị ể ể ự ữ ị ị c 2
ể
ử ụ
S d ng ki m đ nh
ế ế ắ ặ
t k b t c p.
trong thi ị ế ủ ố ệ ố ố ế ố
ự ượ
ố ệ ả ở
ượ ế ị ả
ạ ế ố ạ ợ ủ ả
ế ố ị ự
ượ ộ
ế ố ả
ượ ị ủ
ế ố ị 1. Giới thiệu
ươ
ng Th ng kê, bi n s và
ch
Trình bày s li u c a các bi n đ nh tính đ
c mô t
ắ
ế
phân ph i. Khi có hai bi n đ nh tính, s li u đ
c s p x p trong b ng d trù
ế ố ạ
ộ
ạ
(contigency table). Các ph m trù cho m t bi n s t o thành hàng và các ph m trù cho
ộ
ượ ư
c đ a vào m t ô thích h p c a b ng d trù tùy
bi n s khác t o thành c t. Cá nhân đ
ờ
theo giá tr c a hai bi n s . B ng d trù cũng đ
ng r i
c dùng cho các bi n s đ nh l
ạ
r hay bi n s đ nh l ượ
ự
ị ượ
ng liên t c khi các giá tr đ c phân nhóm. ị ươ ượ ệ ữ ể ể ị ng ( ụ
c 2 ) đ ể
ế ố ự
ố ủ ự ế ố ộ
ộ ủ ạ ạ ộ ố ế ố
ả ề ế ự
ộ
ỉ ệ ở ế ố ượ ể ọ ị ỉ
ị ằ
c bi u th b ng t l ) Ki m đ nh chi bình ph
c dùng đ ki m đ nh xem có s liên h gi a các
bi n s hàng và bi n s c t hay không hay nói cách khác, s phân ph i c a các cá nhân
ụ
trong các ph m trù c a m t bi n s có ph thu c vào s phân ph i trong các ph m trù
ủ
c a bi n kia hay không. Khi b ng ch có hai hàng và hai c t đi u này có nghĩa là so sánh
phân ph i c a bi n s nh giá (đ
hai nhóm hay còn g i là so
sánh hai t l ố ủ
ỉ ệ
. ạ ụ ể ắ ị ư ệ . Trong m t th nghi m lâm sàng đ đi u tr ung th vú đã di căn, b nh nhânh đ i thí d đã nêu trong ch
ể ề
ị ớ ệ
ố ợ ề ồ ộ ộ ử ủ ự ệ ố ỏ ỉ
ươ
ng Nguyên t c ki m đ nh so sánh hai t
ượ
ị
c
ạ
c đi u tr v i LPam hay CMF (m t ph i h p g m 3 lo i
ố
ị
c đ nh nghĩa là s teo nh trên m t n a c a di n tích kh i ố ệ ờ ố
ố
i thi u là 2 tu n. S li u nh sau:
ố ầ
ệ ư
ư 2. Bảng 2 x 2 (so sánh hai tỉ lệ)
ử ụ
Chúng ta s d ng l
ử
ộ
ệ
l
ể ượ
ẫ
phân nhóm ng u nhiên đ đ
ượ
ứ
thu c). Ðáp ng kh i u đ
ể
u trong th i gian t
ủ
B ng 11. Ðáp ng kh i u c a 184 b nh nhân ung th vú v i đi u tr b ng CMF và LPAM ị ổ ố Ði u trề CMF LPam T ng s Có ủ
ứ
Ðáp ng c a
kh i uố 49
(52,7%) 18
(19,8%) 67
(36,4%) Không 44 73 117 93 91 184 ố ệ
ổ
T ng s b nh
nhân ể ứ ằ ạ ố ơ ị
t h n LPam m nh đ n m c đ nào. ả ố ệ ỉ ệ ự ể ử ụ
ế
i s li u b ng d trù là tính toán t l ầ
ợ ỉ ệ ứ ề ị
ư ậ ủ ứ ầ ầ
ệ
hay ph n trăm
đáp ng là 52,7% trong nhóm đi u tr CMF, 19,8% trong nhóm
ứ ể ệ ế ị
ờ
t là ch là do tình c . ỉ
ươ ượ ề ế ằ ằ ệ
ể
c ti n hành b ng ki m đ nh chi bình ph
ả
ố ự
ị
ạ ớ ọ ị ế ộ ớ ố ệ
ể ế
ể
V i s li u trên, chúng ta có th s d ng ki m đ nh ý nghĩa đ xem b ng ch ng đ k t
ứ ộ
ậ
lu n CMF t
ả
ướ
B c đ u tiên trong vi c lí gi
thích h p. Do đó t l
ộ
placebo và 36,4% toàn b . Sau đó chúng ta c n quy t đ nh nh v y có đ ch ng c đ
ả ơ
xem CMF có hi u qu h n LPam hay s khác bi
ng (chi square test) nh m so
Ði u này đ
ự
ố
sánh s quan sát trong m t trong b n ph m trù trong b ng d trù v i v ng tr n u không 121 2 ố ệ ề ệ ả ằ ả ữ
ệ ứ ự
ế
ị ươ ứ ớ ư
ng t
ứ ư ậ
ữ ườ ị i trong nhóm LPam đáp ng v i đi u tr . T
i và 91 * 117/184 = 57,9 ng ả ứ
ệ
ổ
t v hi u qu gi a CMF và LPam. T ng s 67/184 b nh nhân đáp ng
ằ
ỉ ệ
đáp ng trong hai nhóm cũng b ng
ườ
i trong nhóm CMF và 91 * 67/184 =
ẽ
ị
nh v y s có 93 *
ọ
i không đáp ng. Nh ng v ng tr này
ố ộ ươ
ổ
ng
ọ
c b ng cách tính (quan sát v ng c trình bày trong b ng 13.1(b). Chúng cũng t o t ng s hàng và t ng s c t t
ư ị ố
ươ
ị
ọ ng có đ
ộ ự ả ỗ có s khác bi
và n u CMF và LPam có hi u qu b ng nhau, t l
ẽ
giá tr trên và chúng ta s có 93 * 67/184 =33,9 ng
ề
ườ
33,1 ng
ườ
117/184 = 59,1 ng
ạ ổ
ươ
đ
ượ
ị
ự
t
nh tr s quan sát. Giá tr chi bình ph
tr )ị 2/v ng tr cho m i ô trong b ng d trù và c ng chúng l ố
ằ
ạ
i. ( ) 2 (cid:0) do töï vôùi baûng 2 x 2 , fd
. ñoä 1. (cid:0) (cid:0) (cid:0) (cid:0) EO
E
ượ
c g i là giá tr
ớ ọ ượ ị ủ
ớ ị c 2 c a Pearson. N u hi u s gi a s quan sát đ
ệ
ờ ế
ể ự
ả ụ ộ ị c và
ể
t này là do tình c . Ði m
ộ · ượ
ộ ự ố ữ ố
ị c 2 càng l n và ít có th s khác bi
ệ
ố c 2 đ
2 đ t c trình bày trong b ng A5. Giá tr này ph thu c vào đ
ằ
do b ng 1. 2 2 2 2 ị
Giá tr này đ
ọ
v ng tr càng l n, giá tr
ủ
ầ
ph n trăm c a phân ph i
ả
ự
t
do và trong b ng 2
Trong thí d nàyụ 49( )9,33 18( )1,33 44( )1,59 73( )9,57 2 (cid:0) 9,33 1,59 9,57 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 73,6 89,6 86,3 4,21 1,33
94,3 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ơ ủ do. Do đó xác su t c a s ệ ố c 2 m t đ t
ộ ộ ự
ỏ ơ ứ ế
ậ ằ ể ế ấ ủ ự
ờ
t quan sát đ
đáp ng do tình c nh h n 0,001 (0,1%), n u không có
ệ ề ệ
t v hi u qu gi a CMF và LPam. Do đó có th k t lu n r ng CMF có
ả ố ơ
t h n.
ế ố (a) S quan sát ể
ớ
21,4 l n h n 10,83, đi m 0,001 c a phân ph i
ượ ề ỉ ệ
c v t l
khác bi
ự
ả ữ
s khác bi
ệ
hi u qu t
ả
B ng 13.1 K t qu th nghi m CMF và LPam trên b nh nhân ung th vú. ổ ố ị LPam T ng s Ði u trề CMF Có 18
(19,8%) 67
(36,4%) 49
(52,7%) 73 117 Không 44 ị ọ
(a) V ng tr 91 184 93 ố ệ
ổ
T ng s b nh
nhân ổ ố ị LPam T ng s Ði u trề CMF 33,1 67 Có 33,9 57,9 117 Không 59,1 91 184 93 ố ệ
ổ
T ng s b nh
nhân ủ 2 s h i nh h n 2 c a MantelHaenzen
ợ
ng h p ch có m t b ng 2 x 2 giá tr c a
ỡ ẫ ộ ả ỉ ẽ ơ ị ủ c MH ỏ ơ c 2 c a Pearson
ủ 2 (cid:0) 1 (cid:0) 2
MH N (cid:0) Công th c ứ c
ườ
Khi tr
ỳ
tu theo c m u;
N (cid:0) 122 ủ ể ệ ỉ · ươ ể ị ị
ng, ki m đ nh chi bình ph
ụ ờ ệ ố ớ ả
ng đ i v i b ng 2
ệ ọ ỉ ư ể
c c i ti n nh hi u ch nh tính liên t c, th ng đ 2 có
c g i là hi u ch nh tính liên ườ
ứ ượ
ư Công th c ứ c
ườ
ố
Gi ng nh ki m đ nh bình th
ỉ
ể ượ ả ế
th đ
ụ ủ
t c c a Yates (Yates' continuity correction). Công th c nh sau (| | 2 1
2 (cid:0) , fd
. 1. EO
E (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ỏ ơ ệ ố ủ ị ấ ủ ỏ 2 2 2 49( 1,33( )5,0 1,59( )5,0 73( 2 (cid:0) 44
1,59 )5,09,57
9,57 ụ cho giá tr ị c 2 nh h n, |O E| có nghĩa là giá tr tuy t đ i c a OE hay nói cách khác, giá
ị ủ
tr c a OE b qua d u c a nó.
ị ủ c 2 là Trong thí d này giá tr c a
2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) )5,09,33
9,33
44,6 61,3 29,6 68,3 18
1,33
0,20 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ị ườ ớ ể ng ị ươ và ki m đ nh chi bình ph ớ ề ự ng đ so sánh hai t l
ươ ể
ươ
ng đ ỉ ỉ ỉ ả ệ ệ ụ ố ư ừ
ệ trên. Ki m đ nh bình th ể ư ể ả
ả ề
ễ ệ
ể ứ ụ ể ị
ố ể
ng đ i (RR) nên th ụ
ơ
ườ
ng đ
ể ở ộ ể ị ượ ử ụ
c s d ng trong các nghiên c u d ch t
c 2 có th m r ng đ so sánh nhi u t l
ề ỉ ệ
ể ị
và dùng cho b ng d ớ ể ả ị ng m t đ t ươ
ố ể
ả ầ
ể ươ ứ ầ ớ ủ
ố ớ ệ ộ ị ể
ề ỉ ệ ươ ệ ơ ớ ở ồ ị
do l n h n b i vì chúng bao g m vi c so sánh nhi u t l ể
ộ ự
ng có đ t So sánh v i ki m đ nh bình th
ự
ể
ỉ ệ
ị
ườ
ể
ả
ng cho b ng d
Ki m đ nh bình th
c 2 = z2. Ði u này đúng v i c khi có
trù 2 ·
ớ ả
ấ
ng v i nhau và
2 th c ch t là t
ặ
ệ
ệ
ề
ớ
ụ
ệ
hay không có hi u ch nh tính liên t c, v i đi u ki n là nó cùng hi u ch nh ho c không
2 v i (không hi u ch nh tính liên t c) =
ớ
ụ
ỉ
cùng hi u ch nh. T thí d trong B ng 11, z
ị c 2 = 21,4 đã đ
ườ
ị
ể
ở
ượ
c tính
4,632= 21,4 gi ng h t nh giá tr
ng
ượ ử
ườ
ơ
ậ
ệ ố ơ
ậ
ễ
có u đi m là d tính kho ng tin c y h n cho hi u s h n và vì v y th
ng đ
c s
ơ
ể ướ ượ
ử
ị ủ
ệ
ụ
ng nguy c
c l
d ng đ so sánh hi u qu đi u tr c a th nghi m lâm sàng hay đ
c 2 d áp d ng h n và có th ng d ng đ tính kho ng tin c y c a
ậ ủ
ả
quy trách. Ki m đ nh
ễ
ứ
ơ ươ
quan
nguy c t
ự
ả
sát. Ngoài ra ki m đ nh
ơ
trù l n h n và
ộ ộ ự
ằ
ư
L u ý r ng đi m ph n trăm trong B ng A5 cho ki m đ nh chi bình ph
ườ
ng.
ng ng v i đi m ph n trăm hai đuôi trong b ng A2 c a phân ph i bình th
do t
(Khái ni m ki m đ nh m t đuôi hay hai đuôi không dùng đ i v i ki m đ nh chi bình
ph
(multiple
comparison).) ợ ệ ặ ệ ộ ị (validity)
ử ụ
ỏ ề
ị ụ
ị ươ ể ườ ỏ ể
ả ụ ỉ · ề ả ị ố ủ ả ể
ị
ấ ể
ỏ ị ố
ả ớ ị ở ữ ể
ị ổ ổ
ặ ằ ệ ấ ả ả ớ ị ọ ề ớ ơ ị Tính h p l
ấ
ỉ
Nên luôn luôn s d ng hi u ch nh tính liên t c m c dù chúng có tác đ ng nhi u nh t
ấ
ọ
ng (và ki m đ nh bình
khi v ng tr nh . Khi chúng r t nh ki m đ nh chi bình ph
ệ
ỉ ố
ấ
ả
t, ngay c khi có hi u ch nh tính liên t c và khi đó nên
th
ng) không ph i là x p x t
ị ử ụ
2. Cochran (1954) đ ngh s d ng
dùng ki m đ nh chính xác (exact test) cho b ng 2
ổ
ố
ở ữ
ỏ ơ
ki m đ nh chính xác khi t ng s c a b ng nh h n 20 hay khi nó
gi a 20 và 40 và s
ợ ệ
ươ
ỏ ơ
ị
ị ọ
nh nh t trong b n giá tr v ng tr nh h n 5. Do đó ki m đ nh chi bình ph
ng h p l
ấ ể
ố
khi t ng s ph i l n h n 40 b t k các giá tr v ng tr hay khi t ng v ng tr
gi a 20
và 40 v i đi u ki n t ơ
ọ
ị ọ
t c các giá tr v ng tr ph i l n h n ho c b ng 5. · B ng 12. Kí hi u t ng quát cho b ng d trù 2 2 ị ổ ố Ði u trề CMF LPam T ng s Có a1 a0 m1 Không b1 b0 m0 ổ ố ệ
T ng s b nh n1 n0 N 123 nhân ứ 2 2 1 0 ượ ự ư ệ ả ả · ằ
c kí hi u b ng các kí t
ả ơ ế
ứ ể ự
ươ ng nhanh h n cho b ng 2 nh trong b ng 13.2 thì công
ư
2 nh sau: Công th c tính nhanh
ố
N u các s trong b ng d trù đ
th c đ tính chi bình ph
2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ) 184 49( 73 44 )18 ba
10 (cid:0) (cid:0) (cid:0) (cid:0) 4,21 (cid:0) (cid:0) (cid:0) 67 117 93 91 baN
(
01
mmnn
01 ế ả ố ứ ượ ừ
c t ồ
công th c tính nhanh hoàn toàn đ ng ế
ấ ớ ứ N u không có sai s làm tròn, k t qu có đ
nh t v i công th c tính 2 2 ứ c 2 kinh đi n.ể
ủ Công th c tính nhanh cho 2 1 1 0 0 1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) N N ( )1 ( c 2 c a Mantel Haenszel là:
)
(
) )1 ( ba
10 (cid:0) (cid:0) (cid:0) ba
01
mmnn
01 mnNa
1
1
mmnn
01 2 2 0 ứ ể ệ ụ ỉ Công th c tính nhanh cho ủ
2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) N (| | )2/ 184 )92 ba
01 (cid:0) (cid:0) (cid:0) (cid:0) 0,20 (cid:0) (cid:0) (cid:0) c 2 c a Yates đ hi u ch nh tính liên t c là:
N
73
117 49(|
67 44
93 |18
9 1
ự ư ư ba
10
mmnn
1
0
ươ ế ị ở ế ế ố ng t ả
K t qu này t nh nh giá tr đã tính trên, n u không xét đ n sai s làm tròn. 2 ụ ể ị ả ớ ơ ng có th đ c áp d ng cho b ng l n h n, nói chung là b ng r ươ
ệ ố ể ượ
ả ố ộ 3. Bảng lớn
ả
Ki m đ nh chi bình ph
x c, trong đó r kí hi u s hàng trong b ng và c là s c t. ) 2 (cid:0) r c , fd
. . ( )1 ( )1 EO
(
E (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ỉ ệ ự ả · ụ
ề ỉ ủ ươ ể ị ơ ị
ấ
ị ướ
ằ ị ằ
ị ọ
ế ể ượ ế ợ ạ ị ấ
ứ ệ ả ặ t 2 x c hay r x 2 s ng h p đ c bi ợ
ử ụ ư ầ ả ậ ở ọ · ị
ể ắ ị ả ạ ừ
ể
Và không có hi u ch nh tính liên t c hay ki m đ nh chính xác cho b ng d trù ngo i tr
ẽ
ả
ng s
2. Cochran (1954) đã đ ngh r ng x p x c a ki m đ nh chi bình ph
b ng 2
ợ ệ ế
ố
ị
ị ọ
i 5 và không có giá tr v ng tr nào
h p l
n u có ít h n 20% s các giá tr v ng tr d
ộ
ộ
ỏ ơ
t qua h n ch này b ng cách k t h p các hàng (hay các c t)
nh h n m t. Có th v
ị ọ
có giá tr v ng tr th p.
ẽ
ườ
Không có công th c tính nhanh cho b ng r x c (tr
ỗ
ượ
ph n sau). Ph i tính v ng tr cho m i ô. S d ng các lí lu n y nh trong
đ
ọ
ườ
tr cuûa (cid:0)E (cid:0) c xét
ợ
ng h p b ng 2
Toång 2. Qui t c chung đ tính v ng tr là:
coät
Toång
cuûa
haøng
soá
chung
Toång ầ ư ươ ị ằ
ạ n u đ
ụ c áp d ng cho s th c t
ỉ ụ
ả ỉ ệ ỉ ợ ệ ế ượ
ng ch h p l
ờ ượ
đ c áp d ng nó cho b ng ch có t l ố ự ế
hay ầ ể
C n l u ý r ng ki m đ nh chi bình ph
trong các ph m trù khác nhau. Không bao gi
ph n trăm mà thôi. 124 B ng 13. So sánh các ngu n n c chính đ c s d ng b i gia đình trong 3 làng Tây phi Ổ Ố LÀNG A LÀNG B LÀNG C T NG S NGU N Ồ
CƯỚ
N 20(40,0%) 32(53,3%) 18(45,0%) 70(46,7%) Sông 18(36,0%) 20(33,3%) 12(30,0%) 70(33,3%) Ao hồ 12(24,0%) 8(13,3%) 10(25,0%) 30(20,0%) Su iố ổ ố T ng s 50(100,0%) 60(100,0%) 40(100,0%) 150(100,0%) c chính đ c s d ng b i gia đình trong 3 làng Tây phi (v ng LÀNG A LÀNG B LÀNG C T NGỔ SỐ NGU N Ồ
CƯỚ
N 23,3 28,0 18,7 70 Sông 16,7 20,0 13,3 50 Ao hồ 10,0 12,0 8,0 30 Su iố ổ ố 50 60 40 150 T ng s 50/150 = 23,3 70 · 40/150 = 18,7 ế ề ả ủ ồ ướ ả ướ ố c sông, n
ướ ầ
ử ụ ướ ụ ệ ế ầ ệ ộ ữ ố ở
c chính trong 3 xã
Tây
ướ
c ao,
ủ ế
ồ
c sông ch y u, 36% n
c ao h ,
ả ố
ệ
ế
t trong vi c lí gi
i s
ự
ế
ế
c gi ng. N u không có s
ướ
c sông là gi ng nhau ầ
ướ
dùng n ử ụ
ủ ả
ự
ệ
t gi a các làng, ng
ỗ Thí dụ
ộ
ả
B ng 13 trình bày k t qu c a cu c đi u tra so sánh ngu n n
ố
châu Phi. Trong b ng trình bày s và ph n trăm các gia đình dùng, n
hay su i. Thí d trong làng A, 40% s d ng n
24,0% s d ng gi ng. Vi c tính toán các ph n trăm là c n thi
li u c a b ng d trù. Nói chung, 70 trong 150 h dùng n
ỉ ệ
ằ
ườ
ể
i ta có th cho r ng t l
khác bi
ướ ố
ị ủ ố ộ
ọ
trong m i làng. Do đó v ng tr c a s h dùng n c s ng là 70 ·
ằ 60/150= 28,0
ụ 70 ·
ị
ọ
V ng tr có th đ
ướ ố
dùng n ể ượ ụ ọ ị ủ ắ
c tính b ng cách áp d ng quy t c chung. Thí d v ng tr c a h ộ toång toång cuûa coät
(B) 70 60 0,28 150 (cid:0) (cid:0) (cid:0) (cid:0) c s ng trong làng B là:
haøng
(soâng)
cuûa
chung
toång
soá 2 ộ ả ị ủ ọ ượ ả V ng tr c a toàn b b ng đ c trình bày trong B ng 14. ) 2 (cid:0) (cid:0) (cid:0) (cid:0) ( ( ( EO
(
E
323
20 ,
323
32 ,
028 028
718
18 ,
718 (cid:0) (cid:0) (cid:0) (cid:0) ( ( (
716
18 ,
716 20 ,
020 ,
313 (cid:0) (cid:0) (cid:0) 2
/),
2
/),
2
/), 2
/),
2
/),
020
2
/), 2
/),
2
/),
312
12
2
/), ( ( ( 0810 ,
08 ,
010
0128 ,
012 (cid:0) (cid:0) (cid:0)
010
12
53,3
r c df )1 ( ( )1 422 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 125 ỏ ơ ể ế ể ủ c 2 4 đ t
ộ ự ố ộ ướ ữ ệ ề ậ ằ
do), có th k t lu n r ng không có
ồ
c khá nhau ở
B i vì 3,53 nh h n 5,39 (đi m 25% c a
ầ
ự
t ý nghĩa gi a các làng v ph n trăm s h dùng các ngu n n
s khác bi
(P>0,25) 2 2 ể ươ ụ ả ả
ộ ỉ
ứ ọ ở ng đ
ỉ ệ ể ệ
t gi a c t l ượ
c áp d ng cho b ng 2 x c, đó là b ng ch có 2 hàng trình
ơ
ả
th hi n b i c c t trong b ng. Công th c cô đ ng h n 4. Công thức ngắn gọn cho bảng 2 x c
ị
Ki m đ nh chi bình ph
ữ
ệ
ự
bày s khác bi
ợ
ườ
ng h p này
trong tr N ([ ) ] 2 (cid:0) c , fd
. . 1 r
n
/
RNR ( 2
NR
/
) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) B ng 15. T l hi n nhi m Schistosoma mansoni theo ngh nghi p ề ệ ợ ủ ố Ng dânư Nông dân Ngh nghi p
Buôn bán th th công ổ
t ng s S. Manosi ươ D ng tính 22(62,9%) 21 (48,8%) 17 (29,3%) 15 (51,7%) 75 (45,5%) 13 22 41 14 90 Âm tính ổ ố 35 43 58 29 165 T ng s 2/n đ ể ệ ổ ượ ỗ ộ ố ổ ứ ả ộ ộ
ị ủ
c tính
S r2/n). N là t ng s toàn b và R là t ng
ổ
ẽ
'c t' và 'hàng' s ầ ả ộ ở ộ ể ề ở m t vùng nông thôn
ề ụ ệ 2 2 2 2 2 ễ
ọ ắ ộ
ố
Trong đó n th hi n t ng s cho c t và r là giá tr c a ô trên trong c t đó. r
ộ
ủ
ổ
ả
cho m i c t trong b ng và t ng c a chúng là (
ừ ộ
ố ớ ả
ố ả
s c hàng trên. (đ i v i b ng có 2 c t ch không ph i hai hàng, t
ỗ
ổ
đ i ch cho nhau trong ph n trình bày trên.)
Thí dụ
ỉ
ả
ế
B ng 15 trình bày k t qu cu c đi u tra
Trung Phi đ so sánh t
ệ ệ
hi n nhi m Schistosoma mansoni trong các ngh nghi p khác nhau. Áp d ng công
l
ứ
th c ng n g n cho (r /n) / / / 29 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 43 17 ,
984 58
,
767 15
36 /
,
83 22
35
,
13
83
2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) c 2:
21
,
10
26 2
NR
/ ) 2 (cid:0) (cid:0) (cid:0) 05,11 3. fd
. (cid:0) (cid:0) (cid:0) (cid:0) 75
/
165
09,34
(
,
,
1652
83
09
36
34
90
75
ở ứ
ấ
i buôn bán so v i nông dân và th th công. ự ợ ể ơ ằ
ộ ủ ề ư ở ễ
m c 2,5%, g i ý r ng có th có s liên h gi a nguy c nhi m
ấ ở i ng dân, th p ệ ữ
ườ
ng ợ ủ ề
Ði u này có ý nghĩa
ệ
ệ
ắ
b nh và ngh nghi p. Su t m c toàn b c a S. mansoni cao
ớ
ườ
ng ộ ậ ệ ể ộ ị ộ hay không, m t nhà ọ ộ 5. Bài tập
ạ ử
Ð xem vi c ăn th t có liên quan hay đ c l p đ n viêm ru t ho i t
ượ ố ệ
khoa h c đã ti n hành m t nghiên c u b nh ch ng thu đ c s li u nh sau: ế
ứ
ầ ứ ệ
ờ ư
ạ ử ở Table 10. S liên h gi a ăn th t trong th i gian g n đ u và viêm ru t ho i t Papua New ế
ự ị ổ ố T ng s ị
ầ ờ ờ
Ăn th t trong th i
ầ
gian g n đây Không ăn th t trong
th i gian g n đây Nhóm b nhệ 50 11 61 Nhóm ch ngứ 16 41 57 ổ ố T ng s 66 52 118 126 ườ ạ ử ầ ấ ộ ớ ị ơ ị
i ăn th t có nguy c b viêm ru t ho i t tăng g p 11 l n so v i ng ể ả ự ả ơ ườ
i
ố ứ ủ ế ẫ ấ
Ta th y ng
không ăn thit. Tuy nhiên đ đ m b o r ng s gia tăng nguy c này không ph i do sai s
ng u nhiên ta ti n hành tính giá tr ả ằ
ị c 2 và tính m c ý nghĩa c a nó. Bài gi ả ế ế ộ ị i:ả
1. Gi hay ạ ử ở ị ằ ộ ộ ạ ử
thuy t Ho: ăn th t không có liên quan đ n viêm ru t ho i t
ơ
Nguy c viêm ru t ho i t ạ
nhóm ăn th t b ng nguy c viêm ru t ho i ơ
ị
nhóm không ăn th t ử ở
t ứ ị ớ ị ớ ạ i h n là 3,84 v i m c ý nghĩa 5% do, giá tr t ượ c 2 v i 1 đ t
ộ ự
ớ
ư c tính nh sau: ớ ươ ứ ơ
ỏ ả ị ớ ạ
i h n 3,84 t
ế thuy t Ho. Tuy niên do đ l ả i ta tính giá tr p (pvalue) . Tra b ng ệ
ị ị
ậ ể ớ
ể ượ
c 2, ta tìm đ
ỏ ả ứ
ng ng v i m c ý nghĩa 0,05
ạ
ứ
ng hoá s c m nh
ươ
ượ
ng
c p t
ớ
ế
thuy t Ho v i ượ ộ ế ẫ ẫ ự ề ọ
ể
2. Ch n ki m đ nh
3. Giá tr ị c 2 đ
Vì giá tr ị c 2 = 34,72 l n h n giá tr t
ể
nên chúng ta có th bác b gi
ủ ự
ườ
c a s liên h , ng
ứ
ớ
ng v i giá tr 34,72 <0,001. Vì v y ta có th báo cáo: bác b gi
p<0,0001.
ề
ẻ ướ
ẻ ườ ệ ử ụ
ổ ở
ủ ẩ ộ
c ti n hành trong m t m u ng u nhiên
ộ ủ ứ
ậ
i 7 tu i
khu v c Tây Nguyên. Ði u tra ghi nh n dân t c c a đ a
ẩ
ng ng mùng có t m permethrin, mùng không t m permethrin hay
ớ ế ả ư ộ
2. M t cu c đi u tra vi c s d ng mùng đ
ồ
ứ
g m các đ a tr d
ứ
ẻ
và đ a tr th
tr
ủ
không ng mùng, v i k t qu nh sau: Nhóm dân t cộ Không mùng Mùng không t mẩ Mùng t mẩ
permethrin Êđê 3 88 165 ơ M nông 43 73 76 Stiêng 29 16 26 ộ ự ụ ệ ử ụ ể ả ướ ầ ứ ế ố ầ ế ố
ầ ế ố ả
ầ
ố ề
ằ ộ ệ ề ử ụ
ươ ể ề ố t v s d ng mùng trong các dân t c khác nhau này là
ng pháp th ng kê nào đ đánh giá đi u này?
ể ạ
ơ ộ
ế ề ố ứ ệ ằ ị ị ệ ữ
ủ
ứ
a. M c tiêu c a nghiên c u là xem xét s liên h gi a dân t c và vi c s d ng ùng. Ð
ệ
ự
ầ
ố ệ
c đ u tiên c n th c hi n là gì?
kh o sát các s li u này, b
ử ụ
ế ố
i thích? Nên s d ng
b. Các bi n s nào là bi n s đáp ng, bi n s nào là bi n s gi
ầ
ố
ộ
ph n trăm theo hàng hay ph n trăm theo c t? Tính các s ph n trăm này. Các s ph n
ấ
trăm cho th y đi u gì?
ự
c. B n có nghĩ r ng s khác bi
do c h i hay không? Dùng ph
ể
d. Ti n hành ki m đ nh ý nghĩa đ xem có b ng ch ng v m i liên h hay không. Giá
tr p là bao nhiêu? ể ể ị ự ệ ạ c 2 mà b n đã th c hi n. ị ủ
ậ ượ ể ế
ể ệ ữ ự ộ ệ t gi a các nhóm dân t c? S khác bi t đó ở e. Hãy ki m tra tính giá tr c a ki m đ nh
ề
c đi u gì?
f. Chúng ta có th k t lu n đ
ề ự
g. Chúng ta có th nói thêm gì v s các bi
đâu? 127 128 ƯƠ Ồ Ế T NG QUAN VÀ H I QUY TUY N TÍNH ẽ ả
ồ ể ượ ứ
ồ
ượ
ượ ươ ế ố
ữ
ả ự ươ
ng quan gi a hai bi n s
i s t
ế ố ị
ượ
ng quan c a hai bi n s đ nh l
ộ
ộ
ủ ủ
ế ố ụ ồ ng
ế
ng trình h i quy tuy n tính c a bi n s ph thu c theo m t bi n ả ủ ồ ố
i ý nghĩa c a sai s chu n h i quy.
ố ệ ố ể ặ ẩ
ẩ ủ ệ ố ươ
ị ứ
ứ ủ
ể ụ ể ị ố ố Mục tiêu:
ủ ề ọ
Sau khi nghiên c u ch đ h c viên có kh năng:
ử ụ
V phân tán đ và s d ng phân tán đ đ lí gi
ệ ố ươ
ứ
c h s t
c công th c và tính đ
Trình bày đ
ế
ự
Xây d ng đ
c ph
ố ộ ậ
s đ c l p.
Trình bày công th c và lí gi
Trình bày công th c c a sai s chu n c a h s t
giá tr tiên đóan th và áp d ng trong ki m đ nh và ng quan, h s góc, đi m ch n và
ướ ượ
ng các s th ng kê trên.
c l ụ ọ ả
ả ự M c tiêu:
Sau khi nghiên c u bài này h c viên có kh năng:
ươ ế ố ị ệ ữ ượ c 2 ph Nêu đ ng pháp mô t s quan h gi a hai bi n s đ nh l ng: đ th ồ ị ệ ố ươ và h s t ệ ữ ố ồ c m i quan h gi a hai bi n s b ng phân tán đ ế ố ằ
ệ ố ươ ng quan, tính h s t ế
ữ
ng quan gi a hai bi n ơ ố
s (trong tr ế ố ử ụ ầ ồ ứ
ượ
ng quan
Trình bày và lí gi
ượ
ủ ệ ố ươ
Nêu đ
ớ
ả
ườ
ng h p s li u đ n gi n) v i máy tính c m tay
ự
Xây d ng ph
ả ả ượ
i đ
c ý nghĩa c a h s t
ợ ố ệ
ươ
ế ệ ố ủ ể ị ữ
ươ ằ thuy t h s góc c a ph Ki m đ nh gi ầ
ng trình h i quy gi a hai bi n s s d ng máy tính c m tay
ế
ồ
ng trình h i quy tuy n tính b ng không. ượ ế ươ ế ố ị
ể ế ng pháp t ng quan và h i quy tuy n tính đ xác đ nh m i liên h ươ
ế ụ ệ ố ồ
ệ ố ế ố ả ự ườ ẳ ấ ậ
ng và t p trung
ệ
ố
ị
ự
ặ
ng s ch t
ng quan (correlation) đo l
ươ
ế
ng
t ph
ừ ế
bi n t nh t và cho phép tiên đoán bi n s này t ng th ng mô t s liên h t trọng lượng cơ thể
(kg) Thể tích huyết tương
(lít) Ðối
tượng 1 58,0 2,75 2 70,0 2,86 3 74,0 3,37 4 63,5 2,76 5 62,0 2,62 6 70,5 3,49 7 71,0 3,05 8 66,0 3,12 1. Giới thiệu
ệ ữ
ế
Trong bài này chúng ta quan tâm đ n liên h gi a hai bi n s đ nh l
ủ ế
ồ
ch y u đ n ph
ế
ườ
ươ
ữ
tuy n tính (linear) gi a hai bi n liên t c. T
ế
ẽ ủ
ch c a m i liên h trong khi h i quy tuy n tính (linear regression) cho bi
trình đ
ố
s khác.
Bảng 9.1 Thể tích huyết tương và trọng lượng cơ thể của 8 người đàn ông khỏe mạnh 129 g
n
ô
ö
t
t
á
e
y
u
h
h
c
í
t
å
e
h
t troïng löôïng cô theå – – – – – – (a) Không tương quan –––– – – – (c) Tương quan dương
không hoàn toàn (d) Tương quan dương hoàn
toàn – – – –––– (f) Tương quan âm hoàn toàn (e) Tương quan âm
không hoàn toàn ệ ế ố (b) m i liên h không tuy n tính 130 ơ ể ể ọ ng c th và th tích huy t t ế ố ị ượ
ự ả
ỏ i đàn ông
ơ ể
ng c th ữ
ể ử ụ ể
ế ươ ể ồ 2. Tương quan
ế ươ
B ng 9.1 trình bày tr ng l
ạ
kh e m nh. Đ đánh giá s liên quan gi a hai bi n s đ nh l
và th tích huy t t ủ
ng c a 8 ng
ọ
ượ
ng tr ng l
ệ ố ươ
ng chúng ta có th s d ng phân tán đ hay h s t ườ
ượ
ng quan r: ệ ể ệ ể ệ ồ ị
ụ ộ ể ể ệ
ớ ằ
ụ
ế ươ ế ố ộ ậ
ồ ủ ệ ạ ộ
ế ố
ng l n có liên quan ơ ể
ng c th cao. ố ượ
ủ ồ ể ệ ế ố ồ ằ ệ ữ ố ạ ả ồ ệ ạ ậ ướ ệ ố ị ế ố
ệ ế ạ ư ẳ ắ ủ
ng th ng thì m i t ườ ả ượ ọ ệ ư ự ươ ẳ
ế ố ng quan này đ ế ươ ữ ể ọ ị ng và tr ng l ượ
ng ế Phân tán đồ
ồ
ị ủ
Phân tán đ là đ th th hi n các giá tr c a các quan sát b ng kí hi u trên h to đ
ồ
ụ
g m hai tr c: tr c hoành th hi n cho bi n s đ c l p và tr c tung th hi n bi n s
ụ
ph thu c. Hình 9.1 trình bày phân tán đ c a th tích huy t t
ọ
ế
đ n tr ng l
ế
ạ
ệ ữ
Hình d ng c a phân tán đ th hi n m i liên h gi a hai bi n s . N u phân tán đ có
ế
ộ
ạ
ự
d ng m t đám mây n m ngang thì không có s liên h gi a hai bi n s (hình 9.2 a).
ế
ừ ướ
i bên trái lên phía trên bên ph i thì hai
d
N u phân tán đ có hình d ng ellipse đi t
ừ
ế
ế ố
ồ
bi n s có liên h thu n (hình 9.2 c và d). N u phân tán đ có hình d ng ellipse đi t
ả
phía trên bên trái xu ng phía d
i bên ph i thì hai bi n s có liên h ngh ch (hình 9.2 e
ụ
ị ế
ố
ắ
và f). Tr c ng n c a ellipse càng ng n thì m i liên h càng m nh và n u ellipse b bi n
ố ươ
ượ
ộ ườ
c xem nh là hoàn toàn (hình 9.2 d và f).
thành m t đ
ng quan đ
ế
ạ
ồ
ủ
ạ
ế
N u hình d ng c a phân tán đ không ph i là d ng ellipse hay đ
ng th ng thì hai bi n
ố
c g i là không tuy n tính (hình 9.2
s cũng có m i liên h nh ng s t
b).
ụ
Áp d ng lí lu n trên chúng ta có th xác đ nh gi a th tích huy t t
ơ ể
c th có t ậ
ể
ậ
ươ
ng quan tuy n tính, thu n và không hoàn toàn. ệ ố ươ x y ( yx
)( ) r 2 2 x x y y ( ) ( ) ượ ế ệ ể ườ ng có quan h tuy n tính thì chúng ta có th đo l ng m c đ ng quan
ế ố ị
ộ ệ ố ươ ứ ộ
ng quan (correllation ng quan m t cách chính xác h n b ng cách tính h s t
ấ ủ ệ ố ươ ơ
ể ệ ằ
ả ứ ư H s t
ế
N u hai bi n s đ nh l
ươ
t
coefficient), r. Công th c tính r th hi n b n ch t c a h s t ng quan nh sau: (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ể ử ụ ứ ễ ơ ng quan d dàng h n Chúng ta có th s d ng công th c tính h s ệ ố ệ ố ươ
ể
Đ tính h s t
ư
ươ
t ng quan nh sau: i i 2 2 x y i i (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x y ( yx
)( ) n x y n ( (cid:0) (cid:0) (cid:0) r (cid:0) (cid:0) (cid:0) (cid:0) xy
/)
s s n 1 (cid:0) (cid:0) x x y y ( ) ( ) ế ể ố ộ ọ ế ượ
ươ ứ ữ ồ ọ ế
ụ
ng), y là bi n s ph thu c (th tích huy t
ệ ố
ng ng. Phân tán đ minh h a nh ng h s ng),
ng quan khác nhau đ c trình bày trong hình 9.2. ướ ộ ệ
c tiên chúng ta hãy tính trung bình và đ l ch ứ
ế ố ẩ ủ ố ộ ậ
Trong đó x là bi n s đ c l p (tr ng l
‘ x và ‘ y là các s trung bình t
ố
ươ
t
ươ
ươ
t
ể
ử ụ
S d ng công th c này đ tính toán r, tr
chu n c a bi n s x và y: ượ ọ
Tr ng l ng c th : ơ ể ‘ x=66.875 s=5.4166 n=8 ế ươ ể Th tích huy t t ng ‘ x=3.0025 s=0.31121 n=8 ủ ế ố ‘ x=201.91 s=34.849 n=8 ệ ố ươ Tích c a hai bi n s
Sau đó hãy tính toán h s t ng quan. 131 y n ( 086375 r 758.0 xy
/)
s xn
s n 1 .1
417.5 311.0 8
7 x y (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ả ủ ệ ố ươ ng quan: i ý nghĩa c a h s t ỏ ế ươ ạ
ế ố ị ằ ế ế ệ ố ươ
ế ồ
hai bi n s là đ ng bi n; h s t
ệ ố ươ ằ
ng quan luôn luôn n m trong đo n [1,1]
ứ
ng quan r d
ng ch ng t
ế ố hai bi n s là ngh ch bi n; h s t ng quan r âm
ng quan b ng zero n u hai bi n không ộ ữ ứ
ệ ế ể ệ ố ủ ế ồ ị ế ố
ng quan r nói lên m c đ liên quan gi a hai bi n s .
ấ
t
ỏ ẽ ồ ể
ủ ế ố ng c a h s t ng quan (r ườ
2) th hi n t l
ể ệ ỉ ệ ế
ế ố ộ ậ ự ế ủ ế ệ ả ằ ụ
i thích b ng s bi n thiên c a bi n s đ c l p (n u m i liên h này là ươ
c gi ế ố ữ ệ ề ố ế
ế ố ệ ữ ữ ố ệ
ế ố
ả
ướ ệ ế ệ ớ ế ế c, quan h v i r t ừ
ệ ạ ọ ệ ư ấ ự ế ệ ấ Lí gi
ệ ố ươ
H s t
ệ ố ươ
H s t
ỏ
ứ
ch ng t
liên h . ệ
ệ ố ươ
ệ ố ủ
ị ố
Tr s tuy t đ i c a h s t
ằ
ệ ố ủ
ị
ế
N u tr tuy t đ i c a r b ng 1 (r=1 hay r=1), quan h hoàn toàn tuy n tính nghĩa là t
ườ
ằ
ả
c các đi m n m trên đ
ng h i quy (Hình 9.2 d và 9.2f). N u tr tuy t đ i c a r nh
ố ệ
ơ
h n 1 s có các đi m s li u phân tán chung quanh đ
ng h i quy (hình 9.2 c và 9.2e).
ủ
ệ ố ươ
bi n thiên c a bi n s ph
Bình ph
ố
ộ ượ
thu c đ
nhân qu )ả
ế
N u r=0, không có m i liên h tuy n tính gi a hai bi n s . Ði u này có nghĩa là (1)
ế
ặ
không có m i liên h gì gi a hai bi n s ho c (hình 9.2a) (2) m i liên h gi a hai bi n
ố
s không ph i là tuy n tính (hình 9.2b)
Theo quy
ề
trung bình và trên 0,5 là quan h m nh. Ði u quan tr ng là s t
ố
s cho th y s liên h nh ng không nh t thi ệ
ừ
0,3 đ n 0,5 quan h
0,1 đ n 0,3 là quan h y u, t
ữ
ế
ự ươ
ng quan gi a hai bi n
ả
t có nghĩa là cá quan h 'nhân qu '. ẳ ế ườ ươ ng th ng mô t ệ ự ng trình đ
ư ươ ộ ế ế
ế
ả
ố ộ ồ
ư ế
ọ
ố ụ ầ ọ ộ ế ươ ượ ng và tr ng l ơ ể
ng c th . ằ ố 3. Hồi quy tuyến tính
ế
ả ế
H i quy tuy n tính cho ph
n u bi n x tăng thì bi n y tăng
ố
ể
ọ
ế
nh th nào. Không gi ng nh t
ng quan, vi c l a ch n bi n nào đ làm bi n y là
ộ ế
ọ
ượ
ươ
ở
ườ
c g i là
ng pháp không cùng cho m t k t qu , y th
quan tr ng b i vì hai ph
ng đ
ả
ậ
ế
ụ
i thích
bi n s ph thu c (dependent variable) và x là bi n s đ c l p hay gi
(independent or explanatory variable). Trong thí d này, rõ ràng chúng ta c n quan tâm
ự ụ
ể
s ph thu c th tích huy t t
ồ
ươ
ng trình h i quy là
Ph
y = a + bx
ể
ộ ố ườ ươ ủ ủ ẳ ng th ng hay h s (coefficient) c a ph ng trình (Hình ượ ươ ự ể ả ị ố ớ
ừ ố ệ ớ ườ ượ ọ ể ợ các đi m s li u t ng th ng. Nó đ i đ ượ ề
i thi u (least squares fit) (Hình 9.4). Ð d c b đôi khi đ ng kho ng cách theo
ươ
ng
c g i là phù h p bình ph
ệ ố ồ
ọ
c g i là h s h i quy
ự ươ
ng quan. Khi không có s t
ng
ể ươ ứ ộ ườ ằ ặ
a: là đi m ch n (intercept) hay h ng s (constant)
ệ ố
b: là đ d c (slope) c a đ
9.3).
Giá tr đ i v i a và b đ
ứ
chi u đ ng t
ể
ố
t
(regression coefficient). Nó có cùng d u v i h s t
ằ
quan, b b ng zero, t c tính sao cho c c ti u hóa bình ph
ẳ
ộ ố
ớ ệ ố ươ
ồ
ẳ
ng th ng h i quy n m ngang đi qua đi m y. ấ
ớ
ng ng v i m t đ y 2) x (cid:0) (cid:0) (cid:0) s x y ( ) (cid:0) (cid:0) b r (cid:0) (cid:0) s yx
)(
x
x ( 132 và a = ‘ y - b‘ x y b 1 a x b = 8,96/205,38 = 0,0435 Trong thí d nàyụ a = 3,0025 - 0,04354 · 66,875 = 0,0907
ọ Và: Thể tích huyết tương = 0,0907 + 0,0435 × trọng lượng
c v trên Hình 9.1. ế ươ ự ụ ể ượ ơ ể ượ ả ằ ộ ủ
Do đó s ph thu c c a th tích huy t t ng vào tr ng l ng c th đ c mô t b ng x = 60, y = 0,0907 + 0,0435 · 60 = 2,7032 ượ ẳ c v b ng cách tính t a đ c a hai đi m c a đ ng th ng. Thí d ụ ẽ ằ
ạ ộ ủ ườ ể ộ ủ
ạ ị ượ ẽ
và đ
ồ
ườ
Ð ng h i quy đ
chúng ta có th tính to đ c a đ ọ
ẳ
ng th ng t ủ ườ
ể
i giá tr x = 60 và x = 70 x = 70, y = 0,0907 + 0,0435 · 70 = 3,1386 Và ả ườ ể ẳ ồ ng th ng h i quy ph i đi qua đi m (60, 2.7) và (70, 3.1). Hi n nhiên ể ả ư ậ
Nh v y đ
ẳ
ườ
đ ng th ng ph i đi qua đi m ( ể
‘ x,‘ y) = (66.9 , 3.0) 133 4. Kiểm định và ước lượng trong tương quan và hồi quy ề ươ ầ ư ệ
Khái ni m v ph ng sai ph n d g
n
ô
ö
t
t
á
e
y
u
h
h
c
í
t
å
e
h
t troïng löôïng cô theå ị ủ ằ ẳ
ứ ộ
ồ ươ
ồ ớ
ẳ ượ ủ ẩ ọ ộ
ộ ườ
ng th ng nên chúng có m t
ủ ố ệ
ồ
ng trình h i quy. Con s th hi n m c đ phân tán c a s li u
c g i là sai s chu n c a h i quy (standard error of ng th ng h i quy đ 2 2 ẩ ủ ồ ượ ứ Do các giá tr c a các quan sát không n m trên m t đ
ố ể ệ
ả
kho ng cách áo v i ph
ố
ườ
quanh đ
regression).
ố
Sai s chu n c a h i quy đ c tính theo công th c sau: (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ố ư ể 2 2 2 2 c tri n khai thêm nh sau bx y y b x x y ) ( ) ( ) ( ( s n ( )2 xby
)
n
)2
( 2 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 2 2 2
sb 2
y 2
x y y 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s s r s n y y s ( ) 1( ) 1 ( ) (cid:0) (cid:0) (cid:0) (cid:0) n
n 1
n 1
n n
n 1
2 r
2 r
2 1
2 2 (cid:0) (cid:0) (cid:0) (cid:0) y y s ( ) (cid:0) 1
n r
2 2 ẩ ủ ố ệ ộ ệ ớ ườ ể ộ ự ẳ s là đ l ch chu n c a các đi m s li u so v i đ ng th ng, có (n2) đ t do. .0 6780 .0 205 38. (cid:0)s .0 2189 0436
6 (cid:0) (cid:0) (cid:0) 2 2 s s ( ) 2
311.0( .0 0436 417.5 ) .0 21855 2
y 22
sb
x n
n 1
2 18
28 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ặ
ho c 134 2 y (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 0.218321 s s n 1 311.0 265.07 (cid:0) 1
n r
2 ể ể ồ ế ụ ươ
ộ ẽ ắ ộ ể ng thì chúng ta không th tiên đoán m t cách chính xác: chúng ta s m c m t sai s ế
ng trình h i quy đ tiên đoán th tích huy t
ố 2 ố ồ ủ ượ ọ ươ ề
Đi u này có nghĩa là n u ta áp d ng ph
ươ
t
trung bình là 0.218.
ươ
Bình ph ng c a sai s h i quy đ c g i là ph ầ ư
ng sai ph n d : 2 s s 2
sb s n ( ) ( )1 2
y 2
x 2
y n
n 1
n 1
2 r
2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ị ể ệ ố ươ ng quan ệ ố ươ ng quan, có hai ph ng pháp ki m đ nh h s t ộ ị ị
ệ ố ươ
ng quan
ộ
ng quan r = 0 và m t r ươ
ả
ế
ệ ố ươ ế ị ể
ệ ố ươ
thuy t Ho: h s t
ng quan r = (v i ớ r 0) „ 2 ể ể
ng pháp đ ki m đ nh gi
ả
ể
ươ
ng pháp ki m đ nh gi
ể ượ ị ượ ng quan quan sát đ
ơ ở ủ ả
ứ ướ ượ ờ ỉ ự ự
ng sai s c l ẩ ủ Ki m đ nh ý nghĩa h s t
Khi chúng ta đã có h s t
ươ
này. M t ph
thuy t Ho: h s t
ph
ể
ộ
c dùng đ xem r có khác zero m t cách có ý nghĩa hay không. Nói
Ki m đ nh t đ
ể
ự ươ
ị
ể
c có ph i là th c s này
cách khác đi, ki m đ nh này đ xem s t
ể
ố
ự
ị
ệ
ch do tình c . Vi c ki m đ nh này d a trên c s c a công th c
2)/(n2)
chu n c a r: s.e.(r) = (1r s res
.(. ) 2 1
n r
2 y y ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t r n , fd
. . 2 2
2
r n
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 2 2 ụ ể ể ữ ể ả ị ế ươ ng quan gi a th tích huy t t ọ
ng và tr ng ế ệ ố ươ
ế Thí d đ ki m đ nh gi
ơ ể ằ
ượ
l thuy t h s t
ng c th b ng không, chúng ta ti n hành các tính toán sau: (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 0.265 res
.(. ) (cid:0) (cid:0) 1
n r
2 76.01
28 t 76.0 ,86.2 fd
. 6. 2 28
76.01 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ậ ệ ữ ể ở ứ
ng c th ộ ớ ủ
ố ươ ự ố
ộ ố ớ
ỉ ứ ể ạ ộ ư
ng quan và s các quan sát. L u
ng quan y u có th có ý nghĩa th ng kê n u nó d a trên m t s l n quan sát,
ế
ự ươ
c m c ý nghĩa n u ch có m t ít ng quan m nh có th không đ t đ ề
ế
ủ ự
Ði u này có ý nghĩa
m c 5% xác nh n ý nghĩa c a s liên h gi a th tích huy t
ượ
ọ
ươ
ơ ể
ng và tr ng l
t
ộ ủ ả
ứ
ố ươ
ụ
M c ý nghĩa ph thu c c a c vào đ l n c a m i t
ế
ể
ế
ằ
ý r ng t
ạ ượ
trong khi s t
quan sát. r ị ể ế ị ng quan r = 0) (v i ớ r ủ „
ứ ệ ố ươ
ổ
c tiên chúng ta tìm hi u v phép bi n đ i z c a Fisher. Fisher đã ch ng minh z(r) ể
ướ
ọ ủ ệ ố ươ ể
Ki m đ nh z đ ki m đ nh gi
ể
Tr
ố
(đ c là hàm s z c a h s t ả
thuy t Ho: h s t
ế
ề
ng quan r): rz
)( ln r
r 1
2 1
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ố ườ ớ ộ ệ ẩ ẽ
s có phân ph i bình th ng v i trung bình là z( r ệ ố ươ ể ể ư ậ ị Nh v y đ ki m đ nh h s t ng quan r = r ) và đ l ch chu n là
(cid:214) 1/(n3)
(v i ớ r
ả
0), chúng ta ph i tính: „ 135 rz
)( ln 1
2 1
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) r
r
(cid:0)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (z ) ln (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 1
2 1
1 ư ố ẽ ở ế r
(chúng ta l u ý n u ủ r
= 0 thì hàm s z c a s tr thành ị không xác đ nh) (cid:0) (cid:0) r rz
)( ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) z r n rz
)( ( ) 3 (cid:0) n /(1 )3 ả ế ươ ữ ể s tác gi ượ ệ ố ươ
c h s t ng quan gi a th tích huy t t X tìm đ
ng c th là 0.4, hãy ki m đ nh xem h s t ọ
ng và tr ng
ự ự ơ ệ ố ươ ượ ệ ố ươ
ả ể
ng quan đ ị
c báo cáo do tác gi ng quan chúng ta đã tìm ra có th c s
X hay không: và
ụ ả ử
Thí d gi
ơ ể
ượ
l
ớ
l n h n h s t
Chúng ta tính đ c:ượ ln rz
)( ln .0 9962 1
2 1
1 1
2 76.01
76.01 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) r
r
(cid:0)
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ln (cid:0)z
( ) ln .0 4236 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 1
2 1
1 1
2 4.01
4.01 (cid:0) (cid:0) (cid:0) r rz
)( ( ) .0 9962 .0 4236 (cid:0) (cid:0) (cid:0) z .1 280 (cid:0) (cid:0) n /(1 )3 )38/(1 và ả ộ ị ậ ố
ứ ể ằ ằ ủ c giá tr p > 0.05 vì v y chúng ta
ự
ng quan c a chúng ta tìm ra th c ơ ượ
ẩ
Tra b ng phân ph i chu n m t đuôi chúng ta tính đ
ệ ố ươ
ố
không có b ng ch ng th ng kê đ cho r ng h s t
ự ớ
s l n h n 0.4. ố ồ ươ ẩ ủ ng trình h i quy ồ ị ố ỉ ồ ừ ộ ươ ẫ
m t m u ch là ươ
ng trình h i quy đ ề
ị
ả
nh các giá tr th ng kê các đ u có kh năng b sai
ướ ượ
ng trình
ng cho ph
c l ự ự ủ ng dùng ph
ự ư
ng t
ượ
c tính t
ố
ẫ ủ ể ị ng m u c a giá tr giao đi m và đ d c c a đ ộ
ướ ượ
c l
ệ ữ ủ ẫ ố ộ ể
ả ừ ố ộ ố ủ ườ
ẳ
ng th ng
ị
ố
ộ
ả ố
m i liên h tuy n tính gi a x và y trong toàn b dân s . Do đó chúng b
ẩ
ằ
ườ
ấ
ng b ng sai s chu n.
ướ ượ
ậ ủ
ng
c kho ng tin c y c a các c l ượ
ị ụ ể ộ 2 ẩ
ể
ị
ẩ ủ
ẩ ủ ố
ố ượ ứ ướ ượ
c l
Sai s chu n c a các
ẳ
ườ
Đ ng th ng h i quy cũng t
ươ
ố
s và ph
ồ
h i quy th c s c a toàn b dân s .
ị
Giá tr a và b là các
ế
ồ
h i quy mô t
ế
các bi n thiên l y m u và đ chính xác c a chúng có th đo l
ể ễ
T sai s chu n chúng ta có th d dàng tính đ
ớ
này hay ki m đ nh chúng có khác v i m t giá tr c th nào hay không
Sai s chu n c a a
Sai s chu n c a a đ c tính theo công th c sau s aes
.(. ) 2 1
n x
x x ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ả ậ ủ kho ng tin c y c a a :
a ± tc × s.e.(a) ị ớ a
Và đ ki m đ nh a có khác so v i ể ể
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t n , fd
. . 2 a
aes
.(. ) 136 2 s.e.(a) .
2819
0 .
3197
1 1
8 .
966
.
205
38 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ụ ở ặ ằ ụ
ả
ả ể
c × s.e.(a) = 0.0857 ± 2.45 × 1.3197 = 3.148 – 3.319 ướ ể ộ ủ
ng trình h i quy c a th tích huy t t c đây đã báo cáo ph ồ
ể ể ị ể ị ị ể
ằ ặ
ớ ể trên ta có
Áp d ng vào thí d
ủ
ậ
Kho ng tin c y 95% c a đi m ch n a b ng:
ậ
Kho ng tin c y 95% : a ± t
ế ươ
ươ
ứ
M t nghiên c u tr
ng
ặ
ớ
theo cân n ng v i giá tr đi m ch n a là 2.1. Có th ki m đ nh giá tr đi m ch n trong
ị
nghiên c u c a chúng ta có khác v i giá tr 2.1 đã báo cáo hay không b ng phép ki m t: ặ
ứ ủ
(cid:0) (cid:0) (cid:0) (cid:0) .0 1158 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t n ,53.1 fd
. . 2 a
aes
.(. ) 0857
.1 .2
3197 .2
0301
3197
.1 ả ể ế ự ệ ỏ ả
ố ị ể ề ư ậ
thuy t Ho và nh v y
ặ
t có ý nghĩa th ng kê v giá tr đi m ch n ể ế
ứ ủ ứ s ẩ ủ
ẩ ủ ố
ố ượ ứ tra b ng ta có p >0.05 (p = 0.177) chúng ta không th bác b gi
ậ
chúng ta có th k t lu n không có s khác bi
ủ
c a nghiên c u c a chúng ta và nghiên c u đã báo cáo.
Sai s chu n c a b
Sai s chu n c a b đ c tính theo công th c sau bes
.(. ) x x ( 2) (cid:0) (cid:0) (cid:0) ả ậ ủ kho ng tin c y c a b :
b ± tc × s.e.(b) ị ớ b
Và đ ki m đ nh b có khác so v i ể ể
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) n t 2 . , fd
. ) 2189 bes
.(. ) .0 0153 2 38.205 x x ( ) ườ ươ ể ồ ế ươ b
bes
.(.
Thí d :ụ
ụ
Áp d ng vào tr ặ
ng theo cân n ng ợ
ng h p ph
s ủ
ng trình h i quy c a th tích huy t t
.0 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) c: ệ ớ ị t có ý nghĩa v i zero hay không. ượ
ả ử
s chúng ta mu n ki m đ nh xem b có khác bi
ể ố
ế ị ta đ
ể
Gi
ả
Ki m đ nh này cho k t qu
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) t 85.2 b
bes
.(. ) .0
.0 0436
0153 ị ế ư ả ủ ậ ố
ị ể
ể ế ệ ố ươ
ể ế ươ ng quan có kác không
ng tăng có ý ượ ố ớ ọ ả ử ế ươ ể ơ ể
ng c th .
ể
ằ
ượ
ọ
ng tăng 1 kg thì th tích huy t t
ồ
ế ươ
ủ
ng trình h i quy c a th tích huy t t
ệ ố s có tài li u cho r ng khi tr ng l
ươ
ể ệ ố ể ử ụ (cid:0) (cid:0) (cid:0) 03.0 .0 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) n t ,88.0 fd
. 2 . ả
ư ế
L u ý k t qu này gi ng nh k t qu c a ki m đ nh h s t
ớ
hay không. V i giá tr 2,85 chúng ta có th k t lu n th tích huy t t
nghĩa (P<0,05) đ i v i tr ng l
ệ
ng tăng 0.03
Gi
ặ
L (nói cách khác ph
ng theo cân n ng là 0.03)
ứ ủ
và chúng ta mu n ki m tra h s góc trong nghiên c u c a chúng ta có khác tài li u nêu
ể
trên hay không chúng ta cũng có th s d ng phép ki m t:
.0
.0 b
bes
.(. 0136
0153 0436
.0 0153 ) ả ể
ệ ề ệ ố ỏ ả
ủ ự ế
ươ t v h s góc c a ph ư ậ
thuy t Ho và nh v y
ồ
ng trình h i quy tra b ng ta có p >0.05 (p = 0.41) chúng ta không th bác b gi
ể ế
ậ
chúng ta có th k t lu n không có s khác bi
ệ
ớ
ủ
c a chúng ta v i tài li u nêu trên. 137 ủ ệ ố ằ c × s.e.(b) = 0.0436 ± 2.45 × 0.0153 = 0.006 – 0.081 ả
ả ậ
Kho ng tin c y 95% c a h s góc b b ng:
ậ
Kho ng tin c y 95% : b ± t ươ ồ ị ể
ng trình h i quy đ tiên đoán giá tr y ể ử ụ
ượ ọ ị ặ ộ ị Tiên đoán
ố
ộ ố
Trong m t s tình hu ng, có th s d ng ph
ệ ủ
t c a x đ
cho m t giá tr đ c bi c g i là x'. Giá tr tiên đoán là: 2 y' = a + bx'
ẩ ủ
ố
Và sai s chu n c a nó là s yes
.(. )' 1 2 1
n )
x xx
'(
x
( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ố ả ầ i thi u khi x' g n v i trung bình x. Nói chung ph i th n tr ng khi s ọ
ố ể
ể ồ ậ
ố ệ
ượ ở
ợ ế ẽ ạ ấ ở ử
ẩ
ạ
ng h i quy đ tính các giá tr ngoài ph m vi c a x trong s li u g c, b i vì
c làm phù h p. ủ
ngoài ph m vi mà nó đ ớ
ị
t s đúng ả ừ ả ộ ự ớ ố
Sai s chu n này t
ườ
ụ
d ng đ
ế
ệ
quan h tuy n tính không nh t thi
ậ ủ
Kho ng tin c y c a tiên đoán:
ớ
y' ± tc × s.e.(y') v i tc tra t b ng t (student) v i n2 đ t do 0,0832 + 0,0436 × 66 = 2,96 lít ự ể ố ờ ng th tích huy t t ừ ọ ề
ơ ể ụ ể ng t n nhi u th i gian và do đó trong
ượ
ng c th . Thí d th tích plasma ủ ộ ụ
Trong thí d này, s đo l
ộ ố ườ
m t s tr
ế ươ
huy t t ườ
ế ươ
ể
ng h p, có th tiên đoán t
tr ng l
ặ
ườ
i đàn ông n ng 66 kg là ợ
ng c a m t ng 2 2 ẩ ằ ố Và sai s chu n b ng 66( )9.66 s yes
.(. )' 1 218.0 1 l
23.0 2 1
n 1
8 38.205 )
x xx
'(
x
( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ậ ị s.e.(y')
ượ ừ ả ớ ộ ự ả
ủ
Kho ng tin c y 95% c a giá tr tiên đoán y' là
tc·
y –
v i tớ c đ b ng t (hai đuôi) v i n2 đ t c tra t do ả ươ ế ề ả ế ấ thi ả
ng pháp h i quy tuy n tính. Gi
ứ ứ
ộ ườ ố ườ ư ẳ ộ
ẳ ư ể ẩ ể ế ố ệ
ợ
ươ ế
ệ ế ng 19). Các quan h phi tuy n đ ả 5. Giả thiết
ế
ồ
t th nh t là
t n n t ng trong ph
thi
Có hai gi
ế
ả
ị
ố ớ ấ ứ
t th hai là đ phân tán
thi
ng. Gi
đ i v i b t c giá tr x nào, y có phân ph i bình th
ượ
ạ
ẳ
ố
ể
ủ
c
ng th ng là nh nhau trong su t đo n th ng. Ð phân tán đ
c a các đi m quanh đ
ị
ớ ườ
ủ
ộ ệ
ằ
ườ
ng th ng nh đã đ nh
ng b ng đ l ch chu n s c a các đi m s li u so v i đ
đo l
ự
ỏ
ả
ở
thuy t trên không th a
nghĩa
trên. S thay đ i thang đo có th thích h p n u các gi
ệ ườ
ượ
hay quan h d
c
ậ ở ươ
ch
th o lu n ổ
ế
ư
ng nh phi tuy n tính (xem Ch
ng 10. 6. Bài tập ệ ữ ứ ể ộ ố ế ố
ộ ế ố ụ ằ Bài t p1:ậ
ế ố ả
M t nhà nghiên c u tìm hi u m i liên h gi a hai bi n s : bi n s gi
ố ấ
chì trong máu tính b ng µm /100mL và bi n s ph thu c y: s b t th ượ
ng
i thích x là l
ắ
ễ
ườ
ng nhi m s c 138 ố ệ ữ bào (Forni et al., 1995) trên 30 n công nhân nhà máy acquy. S li u ghi ế
ể
th trong 100 t
ư
ậ ượ
c nh sau:
nh n đ ‘ x = 36.37; ‘ y = 5,97; S xy=6974,237; S x2 = 42986,28 ; S y2 = 1502,20. ệ ố ươ ng quan r ệ ố ươ
ng quan này có th c s khác không hay không?
ồ ự ự
ườ ủ ố ấ ễ ể ắ ế ể
ế ng trình h i quy c a s b t th ng nhi m s c th trong 100 t bào theo ẩ ủ ộ ố ủ
ộ ố ủ ế ể ả ị ươ
ươ ồ
ồ a. H ãy tính h s t
ị
b. Ki m đ nh h s t
ươ
c. Vi
t ph
ượ
ng chì trong máu.
l
ố
d. Tính sai s chu n c a đ d c c a ph
thuy t: đ d c c a ph
e. Ki m đ nh gi ng trình h i quy.
ằ
ng trình h i quy b ng zero (hai đuôi) ị ố ự ừ ư ể ả Bài làm bài t p 1ậ
ể
a. T các thông tin k trên chúng ta có th xây d ng b ng các giá tr th ng kê nh sau:
n=30; S xy=6974,237 ướ ượ
c l ng ph ế
ượ ế ễ ậ
ộ
l p:
Bi n đ c
ng chì trong máu
L ộ
ụ
ế
thu c:
Bi n
ể
ắ
ố ộ
S đ t bi n nhi m s c th Trung bình 36.67 5.97 ẩ
ộ ệ
đ l ch chu n 9.5513 3.8639 ổ ươ ng đ ộ 51.435 20.808 Căn T ng bình ph
l chệ 97.5 r .0 37995 n 1 237.
.9 30/
5513 67.36
8639
.3 30
29 x y (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ng quan r
n
6974 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ
xy
/)
(
s ượ ệ ố ươ
c h s t
xn
y
s ị ể ế ế ố
thuy t Ho: r=0; đ i thuy t Ha: r<>0
ớ ộ ự do = 28; c=2,05 ớ ạ ị i h n: t 2 2 b. Ki m đ nh r=0
ả
ự
Xây d ng gi
ị
ể
ử ụ
S d ng ki m đ nh t 2 đuôi v i đ t
ể
Ta có th xác đ nh t t
Tính giá tr tị (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) res
.(. ) ,0 0306 175,0 (cid:0) 1
n r
2 38,01
28 (cid:0) (cid:0) (cid:0) t 20,2 r
res
.(. ) 385,0
175,0 ả ộ ự do ta có p <0,05 ớ
ậ ứ ớ thuy t Ho v i m c ý nghĩa p<0,05 hay nói khác đi có s t ự ươ
ng ữ ượ ố ượ ế ng chì trong máu và s l ộ
ng đ t bi n. ươ ệ ố ả
Tìm p: tra b ng t (b ng student) v i 28 đ t
ế
ặ ự
c= 2.05 ta k t lu n p <0.05
Ho c d a vào t > t
ỏ ả
ế
ậ
ế
K t lu n: Bác b gi
ố
quan có ý nghĩa th ng kê gi a l
ồ
ng trình h i quy:
c. Ph
H s góc b: 139 y x s (cid:0) (cid:0) (cid:0) b r 38.0 .0 1537 s .3
.9 8639
5513 ủ ố ượ ườ ể ễ ượ ồ ươ ấ
ng b t th ắ
ng nhi m s c th theo l ng chì ượ ố ượ ườ ế bào) = 0,3338 + 0,1537 x l ng chì trong máu ng NST (/100 t ố và
a = ‘ y b‘ x = 5,97 0,1537×36,37 = 0,3338
ư ậ
Nh v y ph
ng trình h i quy c a s l
trong máu là:
ấ
S l
ng b t th
(µg/100mL)
ẩ ủ ộ ố
d. Sai s chu n c a đ d c:
ằ
ẩ
Đ l ch chu n h i quy b ng: 2 2 ộ ệ ồ 2 s (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y ( ) .20 808 .3 6374 (cid:0) (cid:0) 1
n r
2 .01
30 37995
2 bes
.(. ) .0 0707 2 .3
.51 6374
435 x x ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ố ẩ ủ ộ ố ị ư ậ
ể ế thuy t Ho: b=0: Ha: b<>0 ớ ộ ự do = 28 c=2,05 ớ ạ ị i h n: t (cid:0) (cid:0) (cid:0) (cid:0) t 17,2 Nh v y sai s chu n c a đ d c là 0.0707
e. Ki m đ nh b=0
ả
ự
Xây d ng gi
ử ụ
ị
ể
S d ng ki m đ nh t 2 đuôi v i đ t
ể
Ta có th xác đ nh t t
Tính giá tr tị
,0
,0 b
0
bes
.(.
) 1537
0707 ả ộ ự do ta có p <0,05 ế ớ
ậ
ớ ỏ ả ế ả
Tìm p: tra b ng t (b ng student) v i 28 đ t
ặ ự
c= 2.05 ta k t lu n p <0.05
Ho c d a vào t > t
ậ
ế
K t lu n: Bác b gi ứ
thuy t Ho v i m c ý nghĩa p<0,05 ứ ứ ầ ộ
ề ẻ
ổ ị ệ ể ồ
ộ ố ị ồ
ồ ề
ứ ủ ứ ẻ ầ ự ủ ể ằ ổ ậ
và ghi nh n
ươ
ượ
c
ng (đ
ư
ả
ế Bài t p 2:ậ
ợ ử
M t nhà nghiên c u nghiên c u tr em b h ng c u li m th đ ng h p t
ủ
chi u cao c a đ a tr 5 tu i b b nh h ng c u và m c đ c t hoá c a x
ố
ể
tính b ng thang đi m d a trên 20 đi m c t hoá c a bàn tay và c tay). K t qu nh
sau: ứ ộ ố ứ ộ ố ề
Chi u cao M c đ c t hoá ề
Chi u cao M c đ c t hoá 111.6 47 107.9 53 109.8 42 113.2 51 105.0 31 102.1 41 107.0 33 105.0 37 104.2 33 99.0 26 108.9 52 101.7 18 103.3 45 100.3 29 104.5 47 107.9 51 140 108.3 42 114.5 41 99.7 50 106.0 34 108.1 41 ớ ụ ả ằ ế ố ả
i b ng bi n s gi ươ
ế ố ng (mô t
ứ ạ
ề ự ươ ng quan gi a chi u cao và m c đ c t hoá
ậ ề ưở
ng thành x
ề
ứ ộ ố
ứ ộ ố
ng quan thu n gi a m c đ c t hoá và chi u cao hay không?
ể ủ ế ồ ố ẩ ủ ộ ố ủ ươ ồ ng trình h i quy. ộ ố ủ ườ ươ ề ầ ữ
ươ
ề
ng trình h i quy c a chi u cao theo đi m c t hoá
ố
tr em bình th
ứ ả ộ ố ủ ở ẻ ị ồ ơ ở ẻ ấ ầ ả ẻ ị ậ
V i m c tiêu là xem có ph i tr b ch m tr
ế ố
ể
thích) có liên quan đ n r i lo n phát tri n chi u cao (bi n s đáp ng) hãy tính:
ữ
ệ ố ươ
a. H s t
ả
b. Có ph i có s t
c. Vi
t ph
d. Tính sai s chu n c a đ d c c a ph
Ở ẻ
ồ
ị ồ
ng trình h i quy
e.
ươ
ề
chi u cao theo m c đ c t hoá là 0.4 cm/đi m c t hoá. Có ph i đ d c c a ph
ng
trình ng (không b h ng c u li m) đ d c c a ph
ố
ộ ố
ể
ườ
ề
tr bình th tr b h ng c u li m th p h n ng? ố ố ố ệ ư ừ Bài làm bài t p 2ậ
ể
a. T các s li u trên ta có th tính các s th ng kê nh sau:
n=21; S xy/n=4283.2 ụ ướ ượ
c l ng ậ
l p: ph ộ
thu c: ộ
ế
Bi n đ c
ứ ộ ố
M c đ c t hoá ế
Bi n
ề
Chi u cao Trung bình 40.19 106.1 ẩ
ộ ệ
đ l ch chu n 9.5217 4.276 ổ ươ ng đ ộ 42.582 19.123 Căn T ng bình ph
l chệ 19.40 1.106 r .0 49105 n 1 2.
5217 276.4 21
20 x y (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ
xy
/)
(
s ượ ệ ố ươ
c h s t
xn
y
s ng quan r
n
4283
.9 ị ể ế ộ ố
ế
thuy t Ho: r=0; đ i thuy t Ha: r>0
ớ ộ ự
do = 19 2 2 b. Ki m đ nh r=0
ả
ự
Xây d ng gi
ị
ể
ử ụ
S d ng ki m đ nh t m t đuôi v i đ t
ị ớ ạ c =1.73
ta có giá tr t t
i h n t
Tính giá tr tị (cid:0) (cid:0) ,01 (cid:0) (cid:0) (cid:0) (cid:0) res
.(. ) ,0 03994 ,0 19985 (cid:0) 1
n r
2 49105
19 (cid:0) (cid:0) (cid:0) t ,2 457 r
res
.(. ) ,0
,0 49105
19985 ả ộ ự ớ do ta có p <0,025 ừ t > t c = 1.73 nên p < 0.05
ế
ớ
ỏ ả
ậ ậ ặ
ế
ư ậ ứ ộ ố ươ ữ ả
Tìm p: tra b ng t (b ng student) v i 19 đ t
Ho c tính t
K t lu n: Bác b gi
Nh v y có t ứ
thuy t Ho v i m c ý nghĩa p<0,025
ề
ng quan thu n gi a m c đ c t hoá và chi u cao 141 ồ ươ ng trình h i quy: ệ ố y x c. Ph
H s góc b:
s (cid:0) (cid:0) (cid:0) b r .0 49105 .0 2205 s .4
276
5217
.9 ứ ộ ố ồ ươ ủ ng trình h i quy c a chi u cao theo m c đ c t hóa bàn tay là ề
ố ể ố và
a = ‘ y b‘ x = 106.1 0,2205× 40,19 = 97,24
ư ậ
Nh v y ph
ề
Chi u cao (cm) = 97,1 + 0,222 × Ði m c t hóa
ẩ ủ ộ ố
d. Sai s chu n c a đ d c:
ằ
ẩ
Đ l ch chu n h i quy b ng: 2 2 ộ ệ ồ 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y 123.19 123.19 .0 19985 .3 8217 ( ) (cid:0) (cid:0) 1
n .01
21 49105
2 r
2
ẩ ủ ộ ố ố bes
.(. ) ,0 08975 2 .3
.42 8217
582 x x ( ) Sai s chu n c a đ d c b:
s (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ỏ ả ươ ng trình ở ẻ
tr ả
ươ ớ ộ ố ế ộ ố
thuy t đ d c ph
ườ ể
ng trình ng = 0.4 tr em bình th ế thuy t Ho: b=0.4: Ha: b<0.5 ớ ộ ự do = 19 c=1.73 ớ ạ ị i h n: t ể ả ờ
ị
i câu h i trên chúng ta ph i ki m đ nh gi
e. Đ tr l
ầ
ở ẻ
ằ
ề
ồ
h ng c u li m b ng v i đ d c ph
ả
ự
Xây d ng gi
ử ụ
ị
ể
S d ng ki m đ nh t 1 đuôi v i đ t
ể
Ta có th xác đ nh t t
Tính giá tr tị (cid:0) (cid:0) (cid:0) 2205 (cid:0) (cid:0) (cid:0) t 00,2 b
bes
)
.(. .04,0
,0 08975 ả ộ ự do ta có p <0,05 ớ
ậ ế ỏ ả
ộ ố ưở ứ ề ộ ở ẻ ồ ề ế
ớ
ng chi u cao so v i m c đ c t hoá ể ế
thuy t Ho. Chúng ta có th k t
ấ
tr h ng câu li m th p ườ ả
Tìm p: tra b ng t (b ng student) v i 19 đ t
ặ ự
Ho c d a vào t > t
c= 1.73 ta k t lu n p <0.05
ậ
ị
ế
K t lu n: Giá tr t nói trên giúp chúng ta bác b gi
ứ
ậ
lu n m c đ tăng tr
ẻ
ơ
h n tr bình th ng (p<0,05) ạ ố ượ ằ ố ng nh m tìm m i liên ư ế Bài t p 3:ậ
ề
ứ
ộ
M t nhà nghiên c u đo đ c chi u cao và cân n ng trên 8 đ i t
ả ượ
ế ố
ệ ữ
h gi a hai bi n s trên. K t qu đ ặ
ậ
c ghi nh n nh sau: ề Chi u cao (cm) 172.9 162.7 165.3 162.7 150 155.1 162.7 152.6 ặ
Cân n ng (kg) 68.5 50.8 58 55.8 42.2 44.4 50.3 42.2 ề ữ ệ ố ươ ng quan gi a chi u cao và cân n ng? ớ ơ c là l n h n giá tr 0,75 là h s ệ ố ng quan tính đ
ượ
ườ ặ
ượ
ị
c báo cáo trong y văn. ả ệ ố ươ
ặ
ng quan gi a cân n ng và chi u cao th
ồ
ế ươ ủ ề t ph ặ
ọ ủ ậ ng đ
ự
ượ ng trình h i quy c a cân n ng d a trên chi u cao.
ủ ả ộ ườ ng tiên đoán c a m t ng ề
i có chi u cao a. Hãy tính h s t
ị
b. Theo anh ch , có ph i h s t
ề
ữ
ươ
t
c. Vi
d. Hãy tính kho ng tin c y 95% c a tr ng l
160 cm. 142 ố ố ố ệ ừ ư Bài làm bài t p 3ậ
ể
a. T các s li u trên ta có th tính các s th ng kê nh sau:
n=8; S xy/n=8326.9 ụ ướ ượ
c l ng ậ
l p: ph ộ
thu c: ộ
ế
Bi n đ c
ề
Chi u cao ế
Bi n
Cân n ngặ Trung bình 160.5 51.525 ẩ
ộ ệ
đ l ch chu n 7.4943 9.0637 ổ ươ ng đ ộ 19.828 23.98 Căn T ng bình ph
l chệ 525.51 r .0 96134 n 1 5.160
.9 0637 8
7 x y (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ
xy
/)
(
s ượ ệ ố ươ
c h s t
xn
y
s ng quan r
n
8326
9.
4943
.7 ể ơ ớ ị ng quan tính đ c r = 0,96 có l n h n giá tr 0,75, ta có th s ể ử ị ượ
ế ổ ộ ị thuy t Ho: z(r)=z(0,75); Ha: z(r)>z(0.75)
ị ớ ạ c=1.64 i h n z ệ ố ươ
ị
b. Ð xác đ nh h s t
ộ
ể
ụ
d ng ki m đ nh z (m t đuôi) và phép bi n đ i Fisher z(r)= ln[(1+r)/(1r)]/2
ế
ả
ự
Xây d ng gi
ể
ử ụ
S d ng ki m đ nh z m t đuôi; giá tr t
Tính giá tr zị (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) z ,0( 96134 ) ln ln ,1 9633 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) r
r 1
2 1
1 1
2 ,01
,01 96134
96134 1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) z )75,0( ln ln ,0 97296 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) r
r 1
2 1
1 1
2 75,01
75,01 zes
.(. ) ,0 447 (cid:0) (cid:0) (cid:0) n
z 3
) (cid:0) (cid:0) (cid:0) rz
)( ,1 9633 ,0 97296 ( (cid:0) (cid:0) (cid:0) (cid:0) z ,2 215 (cid:0) ,0
99034
,0
447 n /(1 5/1 )3 c = 1.64 chúng ta k lu n p <0.05 ả ỏ ả ệ ố ươ ng quan ế ậ
ớ
ứ
ơ ố ệ ượ c báo cáo trong y văn (p <0.025) ượ
ươ ồ ệ ố y x Tìm p: tra b ng z ta có p =P(|z|>2,19) <0,025
ặ ự
Ho c d a vào z > z
ậ
ế
ế
K t lu n: Bác b gi
thuy t Ho v i m c ý nghĩa p<0,025 nghĩa là h s t
ứ
c trong nghiên c u này cao h n s li u đ
tìm đ
c. Ph
ng trình h i quy:
Ta có ‘ x =160,5; ‘ y=51,525
H s góc b:
s (cid:0) (cid:0) (cid:0) b r .0 96134 163,1 s .9
.7 0637
4943 ươ ồ ứ ộ ố ủ ề ng trình h i quy c a chi u cao theo m c đ c t hóa bàn tay là ề ượ ủ ậ ọ ủ ộ ườ và
a = ‘ y b‘ x = 51,525 1,163 × 160,5 = 135,1
ư ậ
Nh v y ph
ặ
Cân n ng (kg) = 135.1 + 1,163 × Chi u cao
ả
d.Kho ng tin c y 95% c a tr ng l ng tiên đoán c a m t ng i cao 160 cm. 143 2 2 ộ ệ ẩ ằ ồ Đ l ch chu n h i quy b ng: 2 (cid:0) (cid:0) .01 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y ( ) 98.23 98.23 .0 11242 .2 6958 (cid:0) (cid:0) 1
n r
2 96134
28 2 2 ố ẩ ủ
Sai s chu n c a tiên đoán: 160 5,160 s yes
.(. )' 1 .2 6958 1 ,2 8601 2 1
n 1
8 828.19 )
x xx
'(
x
( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ọ ề ượ ng tiên đoán là: ng v i chi u cao là 160, tr ng l ớ
ặ ả ượ ủ ọ ng tiên đoán là: ừ ả ớ ộ ự b ng t (hai đuôi) v i n2 đ t c tra t do ế Ứ
Cân n ng (kg) = 135.1 + 1,163 × 160 = 50,98
ậ
ậ
Vì v y kho ng tin c y 95% c a tr ng l
tc·
y –
v i tớ c đ
50.98 – 2.8601 = 43,97 đ n 57,99 kg s.e.(y')
ượ
2.45 · ọ ượ ẻ ơ ủ ạ ổ ổ
ng (kg) và tu i thai (tu n tu i) c a 515 tr s sinh sinh t i trung tâm ế ượ ả Bài t p 4:ậ
ậ
Ghi nh n tr ng l
ệ
huy n X đ
y t ầ
c trình bày trong b ng sau: ầ ộ ổ ổ
Tu n tu i 2.53.0 3.03.5 3.54.0 T ng c ng 3436 14 1 0 15 3638 42 20 9 71 3840 60 138 71 269 4042 20 81 59 160 ổ ộ T ng c ng 136 240 139 515 ọ ữ
ậ ệ ố ươ
ự ươ ượ
ọ ổ ế ươ ự ủ ồ ng trình h i quy c a cân n ng so sinh d a trên tu n tu i. ổ
ng quan gi a tu i thai và tr ng l
ữ
ng quan thu n gi a tu i thai và tr ng l
ặ
ọ ượ ủ ả ậ ng s sinh.
ơ
ổ
ẻ ơ ơ
ượ
ng s sinh hay không?
ầ
ủ ổ ng tiên đoán c a tr s sinh có tu i thai ủ ệ ố ủ ậ ươ ng kho ng tin c y 95% c a h s góc c a ph ồ
ng trình h i quy. Lí gi ả
i ậ a. Hãy tính h s t
ả
b. Có ph i có s t
c. Vi
t ph
d. Hãy tính kho ng tin c y 95% c a tr ng l
là 40 tu n.ầ
ả
ướ ượ
e. Hãy
c l
ả
kho ng tin c y nói trên. ử ụ ị ủ ấ ả ộ
t c các quan sát trong m t ỗ
ư ị
ể Bài làm bài t p 4ậ
a.
ủ
S d ng giá tr trung bình c a m i nhóm là giá tr c a t
ố ệ
nhóm, ta có th trình bày s li u nh sau: ầ ộ ổ ổ
Tu n tu i 2.75 3.25 3.75 T ng c ng 35 15 14 1 0 144 42 20 9 37 71 39 269 60 138 71 20 81 59 41 160 ộ ổ T ng c ng 136 240 139 515 ầ ử ụ ứ ố ớ
S d ng máy tính c m tay v i ch c năng th ng kê đ tính ử ụ ổ 2.75 + 35 · 1 · ể
ồ ố ạ ổ ‘ x, sx, ‘ y, sy.
ể
14 ·
(cid:229) xy = 35 ·
ớ ủ
ứ
S d ng ch c năng nh c a máy tính đ tính t ng
3.25 + .....+ 41 ·
ộ
3.5 = 65 818.25 (g m t ng c ng 12 s h ng) 59 · ừ ố ệ ố ố ư ể
a. T các s li u trên ta có th tính các s th ng kê nh sau:
n=515; (cid:229) xy = 65818.25 ; (cid:229) xy/n=127.80 ướ ượ
c l ng ậ
l p: ộ
thu c: ế
ổ ộ
Bi n đ c
ầ
Tu i thai (tu n) ụ
ế
Bi n
ph
ặ
Cân n ng (kg) Trung bình 39.229 3.2529 ẩ
ộ ệ
đ l ch chu n 1.4873 0.36571 ổ ươ 19.828 23.98 ng đ ộ Căn T ng bình ph
l chệ 2529 r .0 35365 n 80.127
.1 229.39
.0 .3
36571 4873 515
514 1 x y (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ng quan r
n (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) và tính đ
xy
/)
(
s ượ ệ ố ươ
c h s t
xn
y
s ị ể ả ế ự ươ ữ ọ thuy t Ho: r=0 (không có s t ổ
ng quan gi a tu i thai và tr ng l ượ
ng ọ ơ ổ ậ ớ ươ
ộ ự ớ ộ ự ng quan thu n)
ố
do. Phân ph i t v i 513 đ t do có th ể ộ
ẩ ố ượ
ng s sinh và tu i thai có t
ị
ử ụ
c xem là phân ph i chu n. c = 1.64 ớ ạ i h n: t 2 2 b. Ki m đ nh r=0
ự
Xây d ng gi
ơ
s sinh):
Ha: r>0 (tr ng l
ể
S d ng ki m đ nh t (m t đuôi) v i 513 đ t
ượ
đ
ị
Giá tr t t
Tính giá tr tị (cid:0) (cid:0) ,01 (cid:0) (cid:0) (cid:0) (cid:0) res
.(. ) ,0 0017056 ,0 0413 (cid:0) 1
n r
2 35365
513 (cid:0) (cid:0) (cid:0) t 563,8 r
res
.(. ) ,0
35365
0413
,0 ớ ả ự ộ ự do ta có p <0,0001 ậ ỏ ả ế
c = 1.64, ta k t lu n p <0.05
ứ
ế
thuy t Ho v i m c ý nghĩa p<0,0001
ượ
ổ ớ
ữ ậ ọ ể ế ườ ổ ọ ậ
ả
ậ ư
ớ ỉ ự ạ ơ ị ả
Tìm p: tra b ng t (b ng student) v i vô c c đ t
ặ ự
Ho c d a vào t = 8.563 > t
ế
ậ
K t lu n: Bác b gi
ự ươ
ư ậ
Nh v y có s t
ng quan thu n gi a tu i thai và tr ng l
ự
ậ
ớ ạ
i h n (t
chúng ta d a vào t t
ơ
ượ
ng s sinh (p<0.05). L u ý: trong tr
tu i thai và tr ng l
ậ
ế
tìm ra giá tr p cho k t lu n m nh h n so v i ch d a vào giá tr t t ế
ơ
ng s sinh (p <0.001). N u
ữ
ự ươ
ng quan thu n gi a
c) chúng ta có th k t lu n có s t
ể
ợ
ệ
ng h p này vi c tra b ng đ
ế
ị ớ ạ
i h n. Vì v y n u 145 ả ố t báo cáo khoa h c, chúng ta nên tra b ng th ng kê (ho c s ặ ử ể ị ọ
ượ ị ế
ng trình máy tính) đ xác đ nh đ c giá tr p. ồ ệ ố y x ệ
ề
đi u ki n cho phép, khi vi
ươ
ụ
d ng ch
ươ
c. Ph
ng trình h i quy:
Ta có ‘ x =39,229; ‘ y=3,2529
H s góc b:
s (cid:0) (cid:0) (cid:0) b r .0 035365 .0 08696 s .0
.1 36571
4873 ươ ủ ặ ng trình h i quy c a cân n ng theo tu i thai là ổ ượ ủ ậ ọ ẻ ơ ầ ổ ớ ng tiên đoán c a tr s sinh v i 40 tu n tu i thai. 2 2 ủ
ằ ộ ệ ẩ và
a = ‘ y b‘ x = 3,2529 0,08696 × 39,2229 = 0,1585
ổ
ồ
ư ậ
Nh v y ph
ặ
Cân n ng (kg) = 0,1585 + 0,08696 × tu i thai
ả
d. Kho ng tin c y 95% c a tr ng l
ồ
Đ l ch chu n h i quy b ng: 2 (cid:0) (cid:0) .01 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s y y ( ) .8 2912 .8 2912 .0 0413 .0 34242 (cid:0) (cid:0) 1
n r
2 35365
2 515 2 2 ố ẩ ủ
Sai s chu n c a tiên đoán: 40 229 s yes
.(. )' 1 .0 34242 1 .0 34283 2 1
n 1
515 .39
719 .33 )
x xx
'(
x
( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ổ ọ ầ ng tiên đoán là: ớ
ặ ả ủ ượ ọ ng tiên đoán là: c=1.96 ừ ả ớ ộ ự ự ư b ng t (hai đuôi) v i n2=513 (xem nh là vô c c) đ t do. t ế s.e.(y')
ượ
c tra t
1.96 · 0.34283 = 2.648 đ n 3.992 kg s ủ ệ ố
ủ ố ồ ặ ổ ượ
Ứ
ng v i tu i thai tính theo tu n là 40, tr ng l
Cân n ng (kg) = 0.1585 + 0.08696 × 40 = 3.3199
ậ
ậ
Vì v y kho ng tin c y 95% c a tr ng l
y' –
tc·
v i tớ c đ
3.3199 –
ả
ậ
e. Kho ng tin c y 95% c a h s góc
ươ
ẩ ủ ệ ố
Sai s chu n c a h s góc c a ph ng trình h i quy cân n ng theo tu i thai bes
.(. ) .0 001032 2 .0
331 34242
79. x x ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ồ ả ươ ủ ộ ố ặ ổ ng trình h i quy cân n ng theo tu i thai là: c=1.96 ừ ả s.e.(b)
ượ ộ ự ự ư ớ b ng t (hai đuôi) v i n2=513 (xem nh là vô c c) đ t do. t ế ầ c tra t
1.96 · 0.001032 = 0.08494 đ n 0.08898 kg/tu n tu i thai. ứ ư ậ ả ộ ả ủ
ầ ớ
ẽ ằ ế ả ổ ọ ổ
i c a kho ng tin c y trên nh sau:V i m c đ tin c y 95%, khi tu i thai tăng
là 84,94 gram đ n 88,98 ậ
ậ
Vì v y kho ng tin c y 95% c a đ d c ph
b –
tc·
v i tớ c đ
0.08696 –
ổ
ậ
Lí gi
ừ
thêm 1 tu n tu i, tăng tr ng trung bình s n m trong kho ng t
gram. 146 147 Ứ Ắ CÔNG TH C TÓM T T: P E
( ) (cid:0) ấ ứ
1. Công th c xác su t: m
N
ấ ủ
ừ ế ố ể ậ ợ i. rP n ố
ố ượ ế ố
ố ượ ố ượ ế ố
trong n đ i t
ữ ề ợ ữ ệ ọ
t (giao nh ng công vi c khác nhau, đ ng khác nhau ch n ra r đ i t
ượ ưở
c h ng, r đ i t
ng nh ng quy n l ng này sau đó là
i khác nhau, ị P(E), xác su t c a bi n c E, N các bi n c có th và m s các bi n c thu n l
ố
2. S cách t
ệ
phân bi
ượ ặ ở ữ
c đ t
đ nh ng v trí khác nhau v.v.): (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) n (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) !
r n n 1
)
r ( )! ( n n
(
n
r
) ( 1
1
) n ố ố ượ ng này sau đó là ố ượ
ưở ề ợ ộ 1
ọ
ệ ừ
3. S cách t
không phân bi ng khác nhau ch n ra r đ i t
c giao m t công vi c, cùng h ng, r đ i t
ộ
ng m t quy n l i v.v.): (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) Cr (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) rn rn 1
r r ố ượ
trong n đ i t
ượ
ệ
t (cùng đ
n
!
rrn
!
)! ( ( () nn
(
)1 )1
1 ( )1 1 ấ ậ ị 4. Ð nh lu t nhân xác su t: P(A|B) (cid:0) ) (cid:0) P A B
( ) | P(A˙ B) = P(A) ·
P(B|A)
P(A˙ B) = P(B˙ A) =P(B) ·
P A B
(
P B
( ) ấ ứ ộ
5. Công th c c ng xác su t: P(A¨ B) =P(A)+P(B)P(A˙ B)
ử ệ ế ố ấ ả ẽ ồ
ư 6. Quá trình g m n th nghi m Bernoulli, có xác su t x y ra bi n c quan tâm là p s có
ố
phân ph i nh sau:
P(X=x) = nCxpx(1p)(nx) ấ ả ử ệ ầ ế ố
P(X=r) xác su t x y ra đúng r bi n c quan tâm sau n l n th nghi m. (cid:0) x ố ủ ế ệ ấ ố ố ầ
ộ ớ
ấ ị ờ ả
ố ư ố l
ộ
là s l n xu t hi n trung bình c a bi n c trong m t
Phân ph i Poisson v i tham s
ấ ị
kho ng th i gian nh t đ nh (hay trong m t không gian nh t đ nh) và e=2,7183, có phân
ph i nh sau (cid:0) e t ) (cid:0) (cid:0) (cid:0) x XP
( ) xf
)( t (cid:0)
(
x
!
ế ấ ị ệ ấ ả ộ ờ ố ấ ị ấ
P(X=x) xác su t xu t hi n x bi n c trong m t kho ng th i gian nh t đ nh (hay không
gian nh t đ nh). m ườ ộ ệ ế ố ng x có trung bình ẩ s
và đ l ch chu n thành x z (cid:0) ổ
7. Phép bi n đ i phân ph i bình th
ẩ
ố
phân ph i chu n:
(cid:0) (cid:0) (cid:0) , ) m u:
ẫ ắ ặ ị ố ủ ỉ ệ ẫ
8. Phân ph i c a t l
ố
9. Phân ph i trung bình m u: Phép ki m đ nh t m t m u và t b t c p m ố ủ ẫ X~B(n,p ) => p ~ N(p
ộ
ẫ
ể
2) => ‘ X ~ N (m ,s ,) s Phân ph i c a trung bình m u: X~N(
» s 148 (cid:0) (cid:0) x ( ) (cid:0) t s n / ứ ể ẫ ộ ị Công th c ki m đ nh t m t m u: d 2) => ‘ d ~ N (0,) s ố ủ ệ ố s Phân ph i c a trung bình hi u s : d~N(0,
d » sd t s n d
d / (cid:0) ị Công th c ki m đ nh t b t c p: ứ
ể
ệ ố ắ ặ
ẫ ể ị 9. Phân ph i hi u s trung bình m u; Phép ki m đ nh t
9a. Khi ph ằ
ng sai b ng nhau 2) và X2~N(m 2,s 2) => (‘ X1 ‘ X2)~(m 1 m 2 , ) ố
ươ
X1~N(m 1,s s ( )1 2 2
2 s p n
n n
1
( 2
s
1
)1 (
( )1
)1 n
1 2 » (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) s 2 2 2 (cid:0) (cid:0) x ( ) ( ) x
1 (cid:0) (cid:0) t x
SE (cid:0) s ( ) 1
n x
1
1
n
1 1 2 2) => (‘ X1 ‘ X2)~(m 1 m 2 , ) ị
ể
ứ
công th c ki m đ nh:
do = n
1 + n2 2
Ð t
ng sai khác nhau 9b. Khi ph 2 » 2) và X2~N(m 2,s
s2 1 2 1 2 2 2 s ộ ự
ươ
X1~N(m 1,s
s1 ; s
1» (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x x ( ) ( ) (cid:0) t 2 (cid:0) s
n s
n
1 ứ ể ị ộ ự ộ ự ầ Công th c ki m đ nh :
ứ
Ð t ứ ạ
do = do công th c ph c t p không c n tính đ t ế
do n u n ề ớ
1 và n2 đ u l n 2 ủ ả 10. Công th c ứ c 2 c a Pearson cho b ng 2 x 2 2 1 0 (cid:0) (cid:0) ) ba
10 (cid:0) (cid:0) baN
(
01
mmnn
01 2 2 ủ ả ứ
Công th c tính 2 1 0 1 0 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) N c 2 c a Mantel Haenszel cho b ng 2 x 2
N
) )1 ( ( )1 ( ( ) ba
10 (cid:0) (cid:0) (cid:0) mnNa
1
1
mmnn
01 ba
01
mmnn
01 1
ủ ỉ ố ậ ả ơ
Kho ng tin c y 95% c a t s nguy c : 1
N 1
1
1
aNa
1 1 0 0 RR 96,1
e (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ứ ứ ỗ (công th c chu i Taylor – công th c Woolf) ủ ỉ ố ố ậ ả Kho ng tin c y 95% c a t s s chênh: 1
a 1
a
1 1
b
1 0 1
b
0 OR 96,1
e (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ứ ứ ỗ (công th c chu i Taylor – công th c Woolf) 11. ANOVA 149 b F (cid:0) MS
MS w k 2 X ) XN
(
j j 2 2 2 X X ) ) j 1 XN
(
1 1 2 XN
(
3 3 MS b SS
b
nhoùm
1- soá soá nhoùm
1- XN
(
2
soá X
)
1-
nhoùm (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) j 2
j w n 2 2
n 2 2
2 n 2
s
1
n
1 2 (cid:0) (cid:0) n s ( )1 (cid:0) (cid:0) (cid:0) MS (cid:0) (cid:0) (cid:0) (cid:0) SS
w
töôïng
- soá ñoái soá nhoùm soá nhoùm n n ... n
1 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) n s s ( )1 )1 ( n
1 (cid:0) (cid:0) (cid:0) (cid:0) ...
soá n
)1
n
nhoùm (
n n ... 2 ươ 12. T ng quan y n ( r xy
/)
s xn
s n 1 x y (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) res
.(. ) (cid:0) (cid:0) (cid:0) 1
n r
2 và ; ế ử ụ ủ ế ổ N u s d ng phép bi n đ i z c a Fisher 1 rz
)( ln zes
.(. ) r
r 1
2 1
1 n 3 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ẩ ủ ẽ ố thì sai s chu n c a z s là: s y bes
.(. ) x x ( 2) 2) x 2 (cid:0) (cid:0) (cid:0) s x y ( ) (cid:0) (cid:0) (cid:0) b r (cid:0) (cid:0) (cid:0) (cid:0) s yx
)(
x
x ( và s aes
.(. ) 2 1
n x
x x ( ) a xby (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ả ậ ủ ng kho ng tin c y c a r, b và a Ướ ượ
c l
z(r) ± zc × se(z) = z(r) ± zc ×(cid:214) [1/(n3)]
b ± tc × s.e.(b)
a ± tc × s.e.(a) ị ể , b và a
ớ r
i
= [z(r) z(r )] /(cid:214) [1/(n3)] 2 Ki m đ nh r, b, a có kh ác v
z = [z(r) z(r )] /s.e.(r)
t = (b b ) /s.e.(b)
t = (a a ) /s.e.(a)
Tiên đoán
y' = a + bx' 2 xx
' s s yes
.(. )' 1 1 2 2 1
n 1
n )
x xx
'(
x
( ) x x ( ) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ả ừ ả ộ ự ớ ậ ủ
Kho ng tin c y c a tiên đoán:
ớ
y' ± tc × s.e.(y') v i tc tra t b ng t (student) v i n2 đ t do 150 151 Ậ Ổ Ợ BÀI T P T NG H P ố ố ế ử ỏ ạ ắ ể ệ ệ ế ằ ẫ ộ ệ ỉ
t r ng t
ệ
nam là 40%. Rút ch n ng u nhiên m t b nh nhân trong b nh ố ọ
ớ
i và hút thu c lá? (1,5 đi m). ộ ố ế ố ế ở ầ ấ ể
ế ả
, s ch t vì 5 tai bi n s n khoa hàng năm
ợ ế ả ế ơ
ng h p nào ch t vì tai bi n s n khoa (gi C n Th là 7.
ả ử
s ư ể ỏ ủ ệ ọ t r ng tr ng l t nam có trung bình là 2800 gram và đ
ượ ẹ
ẻ ơ
ấ ở
Vi
ộ ẻ ế ằ
ẩ ọ ộ
ng <2500 gram? (1,5 ể ự ệ ề ườ ượ
ố ượ ố ượ ầ ậ
ữ
ng gi a ng
i m p
ng béo phì vào thu t v tiêu hao năng l
ng g y và 9 đ i t ứ
ượ
ư ụ ữ ầ ượ ờ (MJ/day) trong nhóm ph n g y và béo ng trong 24 gi Bài tập 1
ộ ủ
ố
ộ
ưở
ng khoa s t rét mu n x p c 3 cán b trong s 5 cán b c a mình đi công
1. Bác sĩ tr
ế
ườ
ế
i bác sĩ này có th có bao nhiêu cách s p x p?
tác ngo i tuy n. H i ng
ệ
ộ ệ
2. Trong m t b nh vi n có 200 b nh nhân, trong đó có 80 b nh nhân nam. Bi
ở
ố
ệ
hút thu c lá trong
l
ấ ệ
ệ
vi n. Tính xác su t b nh nhân này là nam gi
ủ
3. Theo th ng kê c a B Y t
ườ
Tính xác su t vào năm 1999, không có tr
ứ
ẻ
tình hình chăm sóc s c kh e bà m và tr em cũng nh cũ)? (1,5 đi m)
ượ
ng c a tr s sinh
4. Bi
ệ
l ch chu n là 250 gram. Tính xác su t m t tr em sinh có tr ng l
gram)
ằ
ộ
5. M t nghiên c u nh m tìm hi u s khác bi
ế
ườ ố
và ng
i m đ
c ti n hành trên 13 đ i t
ượ ố ệ
đ
c s li u nh sau:
ả
B ng 1. Tiêu hao năng l
(Prentice et al., 1986) G yầ (n=13) 6,13 7,05 7,48 7,48 7,53 7,58 7,90 8,08 8,09 8,11 8,40 10,15 10,88 (n=9) 8,79 9,19 9,21 9,68 9,69 9,97 11,51 11,85 12,79 ủ ng 1) c a m c tiêu hao năng l
ươ
2) ph n béo. Tính ph ẩ
ẩ ộ ệ
ộ ệ ứ
ụ ữ ụ ữ
ở
ượ
ph n
ộ
ng sai g p. (1.5 ị ả ữ ượ ế ự thuy t s tiêu hao năng l ằ
ụ ữ ầ
ng gi a 2 nhóm ph n g y và béo là b ng ả ệ ố ượ ữ ậ ng kho ng tin c y 95% hi u s tiêu hao năng l ng gi a hay nhóm ph n ụ ữ ượ ủ ệ ườ
ươ ệ ạ ổ ừ ư ế ấ
ng c a b nh nhân suy hô h p mãn tính tăng carbonic th
i ch a có ph 30% đ n 100%) và hi n t ệ ằ ệ ạ ấ ệ ủ ứ
ớ ế
ớ ự ấ ể ả
ườ
ế ộ ề ấ
ị ằ ế ộ ậ ổ ớ ướ ề ạ ạ ượ ủ ế ả ứ
ướ ề ạ ộ Béo
phì
a. Tính trung bình (‘ x1) và đ l ch chu n (s
gày và trung bình (‘ x2) và đ l ch chu n (s
đi m)ể
ể
b. Ki m đ nh gi
nhau.(0.5 đi m)ể
Ướ ượ
c.
c l
(1 đi m).ể
ỉ ệ ử
t
ng kém (t l
6. Tiên l
ị
ề
ng pháp đi u tr
vong trong 3 năm thay đ i t
ả
ế ộ
ữ
h u hi u. Tilapur và Mir (Am J Med 1984; 77:987) cho r ng ch đ ăn gi m
carbonhydrate có th c i thi n tình tr ng hô h p. Các nhà nghiên c u này ti n hành
ệ
th c nghi m trên 8 ng
i suy hô h p mãn tính (có d u hi u c a tim l n, gan l n, phù
và tăng áp ph i) v i ch đ đi u tr b ng ch đ ăn 600 Kcal và ghi nh n PaO2 (phân
ị
ộ
ộ
áp oxy đ ng m ch) và PaCO2 (phân áp carbon dioxide đ ng m ch) tr
c và sau đi u tr .
ả
c trình bày trong B ng 1. Hãy so sánh trung bình c a phân áp
K t qu nghiên c u đ
oxy đ ng m ch tr ị
c và sau khi đi u tr . ộ ộ ạ ố ượ
ng ế ộ ề ả ạ
ị ớ ả
ướ B ng 1. Phân áp Oxy đ ng m ch và phân áp CO2 đ ng m ch trên 8 đ i t
ế ộ
tr c và sau ch đ đi u tr v i ch đ ăn gi m carbonhydrate ố ượ Đ i t ng Pa02 tr cướ Pa02 sau Hi u sệ ố PaC02 sau Hi u sệ ố PaC02
cướ
tr 1 70 82 12 45 4 49 152 2 59 66 7 68 54 14 3 53 65 12 65 60 5 4 54 62 8 57 60 3 5 44 74 30 76 59 17 6 58 77 19 62 54 8 7 64 68 4 49 47 2 8 43 59 16 53 50 3 ằ ể ủ ế ứ ườ ế ồ ế ậ ị ả ủ ươ ượ ế ng. K t qu c a nghiên c u đ ở ị hai nhóm, nhóm có tăng catecholamine và nhóm không tăng catecholamine. 7. Nh m tìm hi u vai trò c a catecholamine trong cao huy t áp vô căn, de Champlain
(Circ Res 1976; 38:109) nghiên c u 22 bênh nhân cao huy t áp vô căn (g m 13 ng
i có
ườ
ộ
ồ
ng), ghi nh n nh p tim, huy t áp tâm thu,
n ng đ catecholamine cao và 9 bình th
ả
ứ
ế
c trình bày trong b ng 2. Hãy so sánh
huy t áp tâm tr
nh p tim
Bảng 5. Trung bình và độ lệch chuẩn của Luợng catecholamine huyết thanh, nhịp tim,
huyết áp tâm thu và huyết áp tâm trung ở 13 bệnh nhân cao huyết áp tăng catecholamine
và 9 bệnh nhân cao huyết áp không tăng catecholamine Tăng
catecholamine Không tăng ố ệ S b nh nhân 13 9 thanh ế
catecholamine huy t
(ug/mL) Nh p timị ế Huy t áp tâm thu ế ươ Huy t áp tâm tr ng ‘ x=0.484 s=0.133
‘ x=90.7 s=11.5
‘ x=171.3 s=13.7
‘ x=103.0 s=8.3 ‘ x=0.206 s=0.060
‘ x=77.8 s=13.2
‘ x=147.4 s=9.9
‘ x=95.6 s=12.9 ứ ể ố ồ ề ệ ứ ằ ậ ệ
3 nhóm b nh nhân. 8. Anionwo et al. (1981, BMJ; 282:283) mu n tìm hi u xem m c hemoglobin trong 3
nhóm b nh h ng càu li m có khác nhau hay không b ng cách ghi nh n m c hemoglobin
ở
Bảng 7. Phân tích phương sai một chiều: sự khác biệt trong nồng độ hemoglobin giữa các
bệnh nhân bị các loại bệnh hồng cầu liềm khác nhau. Số liệu từ Anionwo et al. (1981)
British Medical Journal, 282, 283-6 ố ệ (a) S li u ể Trung bình s.d. ề ồ
ệ
ạ
Lo i b nh h ng
ầ
c u li m ố ệ
S b nh
nhân
(ni) (si) ị ủ
Giá tr c a các cá th
hemoglobin g%
(x) (‘ xi) Hb SS 16 8,712 0,844 7,2; 7,7; 8,0; 8,1; 8,3; 8,4;
8,4; 8,5; 8,6; 8,7; 9,1; 9,1;
9,1; 9,8; 10,1; 10,3 S/b 10 10,630 1,284 Hb
thalassaemia 8,1; 9,2; 10,0; 10,4; 10,6;
10,9; 11,1; 11,9; 12,0; 12,1 153 Hb SC 15 13,300 0,942 10,7; 11,3; 11,5; 11,6; 11,7;
11,8; 12,0; 12,1; 12,3; 12,6;
12,6; 13,3; 13,8; 13,8; 13,9 ể ể ồ ộ ợ ố ở ử ụ
ệ ị
ị ồ ề ầ Hãy s d ng ki m đ nh th ng kê phù h p đ so sánh n ng đ Hemoglobin trung bình
3 nhóm b nh nhân b h ng c u li m. Bài giải bài tập 1 3C5 5 3 ố ượ ắ ố ộ ị ế
1. S cách s p x p 3 trong 5 đ i t ng vào cùng m t v trí là (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0)C 10 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) !5
!3)!35( 12345
12312 · ớ ớ ố i và hút thu c lá)=P(nam gi ố
P(hút thu c lá|nam gi i)=0.4 0,.4 ớ ·
i) x (cid:0) (cid:0) ế ố ấ ả ự ờ 2. P(nam gi
= 0.16
ộ
3. Vì xác su t x y ra x bi n c trong m t khu v c không gian và th i gian tuân (cid:0) e (cid:0) (cid:0) (cid:0) P X x ( ) f x
( ) x ! ố theo phân ph i Poisson x(cid:0)(cid:0) (cid:0) (cid:0) x P zP zP 2.1 zP
( )2.1 .0 1151 (cid:0) 250 l ậ ấ ả ế ố ế ố ế ố = 7 (cid:0) (cid:0) e !7 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x XP
( xf
)( ) 0.000912 2500) x
! 4. < l = P( (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) V y xác su t x y ra 0 bi n c n u s bi n c trung bình là
7e
!0
ượ
ng
2500 2800 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ọ
P(tr ng
2500
(cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ượ ở ẩ ộ ệ ng ph ụ ứ
ủ
‘ x2) và đ l ch chu n (s
ụ ữ
ộ ệ
2) ph n béo. 2 ộ ệ ộ 5. a. trung bình (‘ x1) và đ l ch chu n (s
1) c a m c tiêu hao năng l
ẩ
ữ
n gày và trung bình (
‘ x1=8.0662 s1=1.2381 n1=13
‘ x2=10.298 s2=1.3979 n2=9
ẩ
Đ l ch chu n g p 12 .1 .18 3979 s ( )1 2 2
2 s 304.1 n
n n
1
( 2
s
1
)1 (
( )1
)1 2
2381
1
12 8 n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) ự ướ ả ế
thuy t Ho:
ở ượ ụ ữ ằ ượ ng nhóm ph n gày b ng tiêu hao năng l ng ở b. B
c 1: Xây d ng gi
ứ
Ho: M c tiêu hao năng l
nhóm ph n béo ướ ợ ể ị ụ ữ
ọ 1+n22) = 20 đ t ể ị ị ộ ự c 2: Ch n ki m đ nh phù h p
B
ớ
Ki m đ nh phù h p là ki m đ nh t v i (n do ể
ướ ơ
ố c 3: Tính th ng kê t 2 ượ ộ ệ ẩ ộ B
chúng ta đã tính đ c đ l ch chu n g p 12 .1 .18 3979 s ( )1 2 2
2 s 304.1 n
n n
1
( 2
s
1
)1 (
( )1
)1 2
2381
1
12 8 n
1 2 (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x ( ) 298.10 .8 0662 t 946.3 n s /1 2
/1 304.1 12/1 8/1 x
1
n
1 2 ố Sau đó chúng ta tính th ng kê t (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) 154 ị ố ướ ấ ủ c 4: tính xác su t c a giá tr th ng kê t ế ử ụ ị ả
c giá tr p= 0,000798 (n u s d ng b ng ượ ẽ ượ
c p <0,001) B
ử ụ
S d ng máy vi tính chúng ta tính đ
ố ố
s th ng kê chúng ta s tìm đ
ướ ậ ế
c 5: K t lu n ỏ ằ ị
ủ ỏ ả
ế ằ ụ ữ ứ
ứ ế
thuy t Ho cho r ng m c tiêu hao năng
ậ ở
ph n béo có m c tiêu hao năng 2 2 ng c a 2 nhóm b ng nhau. Ta k t lu n
ng cao h n (p<0.001).
ậ ủ ệ ố ơ
ả ượ B
Vì giá tr p là nh nên chúng ta bác b gi
ượ
l
ượ
l
c. Tính kho ng tin c y c a hi u s tiêu hao năng l ng (cid:0) 2 1( )2/ (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) (cid:0) x t ( ) .10( 298 .8 09.2)088 .1 304 12/1 8/1 x
1 s
n s
n
1 (cid:0) (cid:0) (cid:0) (cid:0) 2
45.3
ậ
ụ ữ ầ ừ 24.1
ứ ượ
ng ằ
ỗ ế ơ ể
0.97 đ n 3.45 MJ m i ngày. 97.0
21.2
ớ
ộ
ậ
V y v i m c đ tin c y là 95% chúng ta có th cho r ng tiêu hao năng l
ụ ữ
ủ
c a ph n béo h n ph n g y t
6. Bài t p 6ậ ướ ự ả c 1: Xây d ng gi ướ ề ổ B
Ho: Phân áp oxy đ ng m ch tr ế
thuy t Ho:
ạ
ị ọ ị
c và sau đi u tr không thay đ i
ợ ướ ộ
ể c 2: Ch n ki m đ nh phù h p ắ ặ ể ớ ị ị ộ ự B
Ki m đ nh phù h p là ki m đ nh t b t c p v i 7 đ t do ể
ướ ơ
ố ệ ố ủ ẩ ủ c 3: Tính th ng kê t
ộ ệ
ề ướ ạ ố B
ộ
Tính trung bình và đ l ch chu n c a bi n s d (hi u s c a phân áp oxy đ ng
m ch tr ế ố
ị ể
c và sau đi u tr ) đ tính th ng kê t d s t ;5,13 ;2,8 66,4 d (cid:0) (cid:0) (cid:0) (cid:0) ướ ị ố ấ ủ ộ ự ị ị ố
ớ ươ ứ ị c 4: tính xác su t c a giá tr th ng kê t
ử ụ
ng ng v i giá tr t = 4.63 do, 2).
do chúng ta đánh công ộ ự
ị ở
ượ ế ả ộ B
Đ tính xác su t c a giá tr th ng kê t ta s d ng hàm tdist(giá tr t, đ t
C th đ tính p t
th c "=tdist(4.63, 7, 2) vào m t ô. K t qu ta đ 7 đ t
c giá tr p= 0.002397687. ể
ụ ể ể
ứ
ướ ậ ế
c 5: K t lu n ỏ ả ế ị thuy t Ho nghĩa ệ ề ạ ộ B
ỏ ơ
Vì giá tr p= 0.002397687 nh h n 0.05 nên chúng ta bác b gi
ị
ả
là phân áp oxy đ ng m ch có c i thi n sau khi đi u tr .
Bài t p 7ậ
ướ ự ả ế
thuy t Ho: ị ở ệ ị nhóm b nh nhân có tăng catecholamine = nh p tim ệ ở B
c 1: Xây d ng gi
Ho: Trung bình nh p tim
trung bình nhóm b nh nhân không tăng catecholamine
ợ
ọ ể ị ướ 1+n22) = 20 đ t ể ị ị ộ ự c 2: Ch n ki m đ nh phù h p
B
ớ
Ki m đ nh phù h p là ki m đ nh t v i (n do ơ
ố ể
ướ ộ ệ ả ẩ ộ ướ c 3: Tính th ng kê t
c tiên chúng ta ph i tính đ l ch chu n g p B
Tr 2
2 2
s
1
)1 (cid:0) (cid:0) (cid:0) s )1 ( (cid:0) (cid:0) 21.12 s p (cid:0) (cid:0) (cid:0) n
1
( (
( )1
)1 n
1 n
2
n
2 155 ộ ộ ệ ể ễ ươ ươ ẩ
ỗ ứ
ủ ầ ư
ố ớ ọ ng sai
ủ
do c a ng sai đó) ố (cid:0) (cid:0) (cid:0) t 44.2 (cid:0) s ớ
(Đ d nh công th c tính đ l ch chu n g p chúng ta c n l u ý ph
ộ ự
ủ
ộ
ng sai c a m i nhóm v i tr ng s là đ t
g p là trung bình c a ph
ươ
ph
Sau đó chúng ta tính th ng kê t
x
)
2
/1 x
(
1
n
/1
1 n
2 ị ố ướ ấ ủ c 4: tính xác su t c a giá tr th ng kê t ị ế ử ụ
c giá tr p= 0,024123071 (n u s d ng ẽ ượ
c p <0,05) B
ử ụ
S d ng máy vi tính chúng ta tính đ
ả
ượ
b ng s th ng kê chúng ta s tìm đ
ậ
ướ ố ố
ế
c 5: K t lu n ị ỏ ả ế thuy t Ho nghĩa ệ ề ị t v nh p tim trung bình. B
ỏ ơ
Vì giá tr p= 0,024123071 nh h n 0,05 nên chúng ta bác b gi
ự
ệ
ữ
là gi a hai nhóm b nh nhân có s khá bi
Bài t p 8ậ
ướ ả ự c 1: Xây d ng gi ở ề ệ ằ 3 nhóm b nh HC li m b ng nhau B
ồ
Ho: Trung bình N ng đ hemoglobin
ể ế
thuy t Ho:
ộ
ị ướ ợ ọ c 2: Ch n ki m đ nh phù h p ươ ể ợ ị ớ ng pháp phân tích ph ố ớ ố ố
ng sai (ANOVA) v i th ng
ớ ạ
ộ ự B
ươ
Ki m đ nh phù h p là ph
kê F v i (s nhóm, s quan sát s nhóm) = (2,38) đ t i h n= 3,32 do ; F t ướ ố ả ố
ậ c 3: L p b ng ANOVA và Tính th ng kê F
ư ươ ậ ả B
Chúng ta l p thành b ng phân tích ph ng sai nh sau: ế ồ ữ Ngu n bi n thiên SS d.f. MS=SS/d.f. MS gi a các nhóm F= MS bên trong nhóm ữ 50.03 , P<0,001 Gi a các nhóm 99,92 2 49,96 Trong các nhóm 37,95 38 1,00 ộ ổ T ng c ng 137,85 40 ứ ể ị ở trên có th tính theo công th c sau: ữ 2(S x)2/N (xi‘ x)2= S nixi SSb= S 8,71252+10 · 10,63002+15 · 12,3002 430,22/41=99,92 Các giá tr
Gi a các nhóm
ni·
= 16 ·
dfb = k1 = 2
MSb = SS/d.f. 2 =15 x 0,84452 + 9 x 1,28412 + 14 x 0,9419 = 37,96 Trong các nhóm (ni 1)si SSw = S
dfw= N k = 413 = 38
MSw = SS/d.f.
ị ố
Và giá tr th ng kê F
F = MSb/MSw ướ ấ ủ ị ố B c 4: tính xác su t c a giá tr th ng kê F 156 11. Chúng ta cũng có thể ể ả ượ
ượ ị
c giá tr p= 2.26 x 10
c p <0,001 ự
D a vào máy tính chúng ta tính đ
ố
ự
d a vào b ng th ng kê F đ tìm đ
ậ
ướ ỏ ả ế ỏ B
ị ấ
ề ệ
ố ầ ị ế
c 5: K t lu n
ệ
thuy t Ho nghĩa là ba nhóm b nh nhân b nh
Vì giá tr r t nh nên chúng ta bác b gi
ắ
ồ
h ng c u li m có giá tr hemoglobin trung bình khác nhau có ý nghĩa th ng kê.ttest b t
c pặ 157 ầ ằ ọ ạ ế ưở ượ
ụ ế
ử ụ ậ
xã nh n đ
ị ị ỏ ụ ứ
ấ
ố ỏ
c 5 t m poster khác nhau nh m giáo d c s c kh e cho
ể
ố
ng tr m mu n ch n 3 t m poster đ treo
ườ
ệ
i bác ắ ế ố ỉ ệ ế ằ ộ ồ
nam trong m t dân s là 0,5 (P(nam)=0,5). Trong c ng đ ng ố ộ ộ ố
ườ ấ ể
i ta bi
nam hút thu c lá là 40% (P(hút thu c|nam)=0,4).
ấ ườ ồ
i b t kì trong c ng đ ng.Tính xác su t ng ườ nam và có i đó là ng i ườ ấ
ố
i đó là có hút thu c. Tính xác su t i. Bi ế ằ
t r ng ng
ấ ườ ớ t r ng xác su t hút thu c lá trong dân s chung là 0,3. ườ
ố
ỉ ố ộ ố
ậ ườ ở qu n Tân Bình, ng
ộ ậ ộ
ố ộ
ọ ộ ộ ấ ấ ả ợ ộ ượ ủ ệ ọ t nam có trung bình là 2800 gram và đ t r ng tr ng l ộ ở
Vi
ộ ẻ ẻ ơ
ấ ượ ọ ng <2500 gram? ằ ộ ứ ượ
ữ
ệ ướ ế Bài tập 2
ộ
ạ
1. M t tr m y t
ườ
i dân có s d ng d ch v y t
ng
. Bác sĩ tr
ờ
lên 3 v trí khác nhau: phòng ch , phòng khám b nh và phòng tiêm thu c. H i ng
sĩ này có th có bao nhiêu cách s p x p?
ườ
ộ
2. Ng
t r ng t l
ỉ ệ
này, t l
ọ
a. Ch n m t ng
ố
hút thu c lá ?
ọ
ộ
ẫ
b. Ch n ng u nhiên m t ng
ế ằ
i? Bi
i đó là nam gi
ng
ộ
ả
ộ
i ta
3. Trong m t cu c kh o sát m t đ chu t và ch s b chét
ấ
ấ
ỉ ố ọ
th y ch s b chét trung bình (s con b chét trung bình trên m t con chu t) là 1,3. L y
ọ
ộ
m t con chu t b t kì trong đ t kh o sát đó, tính xác su t con chu t đó có đúng 2 con b
chét?
ế ằ
4. Bi
ng c a tr s sinh
ẩ
ệ
l ch chu n là 250 gram. Tính xác su t m t tr em sinh có tr ng l
5. M t nghiên c u đ
ự
xét có s khác bi ụ
c ti n hành trên 12 phi công vũ tr (Bungo et al. 1985) nh m xem
ụ
c khi du hành và sau chuy n bay vũ tr : ế
ị
t gi a nh p tim tr ị ướ ị Nh p tim tr c khi du hành Nh p tim sau khi du hành 1 71 61 2 65 59 3 52 47 4 68 65 5 69 69 6 49 50 7 49 51 8 57 60 9 51 57 10 55 64 11 58 67 12 57 69 ị ệ ướ ụ ộ ệ
c khi du hành vũ tr . Tính trung bình và đ l ch ể
ị ế ụ ổ c và sau khi du hành vũ tr là không thay đ i? thuy t: nh p tim tr
ậ
ả ướ
ủ ệ ố ị ướ ố
a. Tính hi u s nh p tim sau và tr
ệ ố
chu n c a hi u s này (1 đi m).
ả
b. Ki m đ nh gi
c. ẩ ủ
ị
ể
ướ ượ
ng kho ng tin c y 95% c a hi u s nh p tim tr
c l ụ
c và sau khi du hành vũ tr ? 158 ỏ ắ ệ ờ Ngày thi: 6 tháng 5 năm 2004
(70 câu h i tr c nghi m, th i gian làm bài 90 phút) ộ ồ ử ề ấ ặ Tung m t đ ng ti n, xác su t ra m t ng a là 1.
a. 0,25
b. 50
c. 0,3
d. 0,5 ữ ệ ệ ạ ọ ộ ệ
Trong khoa tim m ch có 20 b nh nhân nam và 30 b nh nhân n . Ch n m t b nh
ấ ữ 2.
ấ ệ
nhân b t kì xác su t b nh nhân đó là n là
a. 0,25
b. 0,15
c. 0,375
d. 0,60 ộ ế ườ ử ụ ể ề c ti n hành trong đó ng ị
i ta s d ng artesunate đ đi u tr ứ ượ
M t nghiên c u đ
ị ố ắ ố ệ ấ ượ ắ ố
c c t s t trong
ị ố
cho b nh nhân b s t rét là: 3.
ệ
ệ
cho 1200 b nh nhân b s t rét do P. falciparum. Có 990 b nh nhân đ
ờ
ờ
vòng 48 gi
. Xác su t artesunate c t s t trong vòng 48 gi
a. 92.5%
b. 80%
c. 82,5%
d. 99% ố ọ ấ ế ẫ ọ Ch n m t v trí b t kì trong b ng s ng u nhiên. Bi t con s đ c ch n là con ỏ ơ ộ ị
ằ ố ố ả
ố ượ
4.
ấ
ố
s nh h n hay b ng 7. Tính xác su t con s đó là con s 2 hay 4 hay 6.
a. 0,375
b. 0,676
c. 0,625
d. 0,324 ị ệ ị ệ ớ ộ Trong khoa n i B có 20 b nh nhân nam (10 b b nh kh p và 10 b b nh tim) và ộ ệ ị ệ ị ệ ệ ọ ệ
ớ ị ệ
ữ ệ ữ
ấ ệ ữ ớ ớ 5.
30 b nh nhân n (10 b b nh kh p và 20 b b nh tim). Ch n m t b nh nhân b b nh
kh p, xác su t b nh nhân này là n = P(n | b nh kh p): 159 a. 0,50
b. 0,75
c. 0,7
d. 0,60 ẻ ồ Đi u tra c t ngang trên 250 tr g m 200 tr trong gia đình ít con và 50 tr trong ẻ
ườ ưỡ ề Ở các gia đình ít con có 20 tr ẻ ị
ng h p tr b suy dinh d ườ ưỡ ợ
ấ ị
ng. Xác su t b suy dinh d ẻ
ở
ng và
ưỡ
ng ng h p suy dinh d
ưỡ ề ợ
ề
tr c a gia đình nhi u con P(suy dinh d ng| gia đình nhi u con) = ắ
ề
6.
gia đình nhi u con.
ề
các gia đình có nhi u con có 8 tr
ở ẻ ủ
a. 0,112
b. 0,16
c. 0,10
d. 0,14 ẻ ồ Đi u tra c t ngang trên 250 tr g m 200 tr trong gia đình ít con và 50 tr trong ẻ
ườ ưỡ ề Ở các gia đình ít con có 20 tr ẻ ị
ng h p tr b suy dinh d ưỡ ườ ng h p suy dinh d ợ
ấ ị
ng. Xác su t b suy dinh d ẻ
ở
ng và
ưỡ
ng ợ
ưỡ
ng| gia đình ít con) = ắ
ề
7.
gia đình nhi u con.
ề
các gia đình có nhi u con có 8 tr
ở ẻ ủ
tr c a gia đình ít con P(suy dinh d
a. 0,10
b. 0,112
c. 0,14
d. 0,16 ộ ị ệ ị ệ ớ Trong khoa n i B có 40 b nh nhân nam (30 b b nh kh p và 10 b b nh tim) và ệ
ớ ệ ị ệ ộ ệ ị ệ ọ ữ
ấ ệ ị ệ
ữ ệ ữ ớ 8.
60 b nh nhân n (40 b b nh kh p và 20 b b nh tim). Ch n m t b nh nhân b b nh
ớ
kh p, xác su t b nh nhân này là n = P(n | b nh kh p):
a. 0,57
b. 0,75
c. 0,67
d. 0,7 ố ấ ử ử ế ế ấ ố vong và s t xu t huy t) ế ế ấ ố ấ
vong) x P (t ử
ố ử
ố ấ ấ
Xác su t t
vong do s t su t huy t = P (t
9.
ố
ử
vong) x P (s t su t huy t)
a. P(t
ế ử
ố
ấ
b. P(s t xu t huy t | t
ấ
ế
ấ
ố
c. P(s t xu t huy t) x P (t
ế ử
ế
ấ
ố
d. P(s t xu t huy t) x P(s t xu t huy t | t vong | s t xu t huy t)
ế
vong | s t xu t huy t)
vong) ễ ẹ ị ừ ử trong t ạ ẻ ị
ữ ễ
ẹ ấ ẻ ị
ử ẹ ế ễ ế
ấ ứ
N u bà m b nhi m HIV, xác su t đ a tr b nhi m t
cung và trong
10.
ể
ẻ
ấ ứ
ễ
khi chuy n d là 0,2, xác su t tr b nhi m do bú s a m là 0,1. Tính xác su t đ a tr
ị
ễ
ờ ị
ồ
đ ng th i b nhi m HIV trong t
cung và b nhi m HIV trong khi bú m (n u hai xác
ộ ậ
ấ
su t này là đ c l p)
a. 0,15
b. 0,02 160 c. 0.28
d. 0,3 ộ ậ Nh ng bi n c nào sau đây là đ c l p ữ
ượ
ủ ế ố
ơ
u x gan
ở
ệ ắ ệ
ắ ệ
ễ ổ
ễ ả 11.
ố
a. U ng r
ở
b. Tiêm ch ng b nh s i m c b nh s i
ậ
c. Tu i tính theo canchi –m c b nh th n
ả
d. Nhi m sán (d i) bò – Nhi m sán (d i) heo ễ ừ ẹ ị ử trong t ạ ấ ẻ ị ế
N u bà m b nhi m HIV, xác su t đ a tr b nhi m t
ể ễ ẻ ị
ữ
ị ễ
ẹ
ễ ẹ ế ử ễ
ộ ậ ấ ấ ứ
cung và trong
12.
ẻ
ấ ứ
ễ
khi chuy n d là 0,2, xác su t tr b nhi m do bú s a m là 0,1. Tính xác su t đ a tr
ị
ị
b nhi m HIV do b nhi m HIV trong t
cung hay b nhi m HIV trong khi bú m (n u
hai xác su t này là đ c l p)
a. 0,15
b. 0,02
c. 0,3
d. 0.28 ố ố Trong dân s t nh X, xác su t hút thu c lá = P (hút thu c lá) = 0,3. Bi ấ ế ằ
ư ổ ở ườ ấ
ố ư ổ ở ườ i hút thu c lá là 0,4% và xác su t ung th ph i t r ng xác
i không ng ố ư ổ ố ỉ
13.
ấ
su t ung th ph i
ng
hút thu c lá là 0,04%. Tính P(ung th ph i):
a. 0,440%
b. 0,148%
c. 30,4%
d. 0,120% ằ Xác su t b b nh lao b ng ố
ố ấ ị ệ
ố
ố
ố
ố ố
ố 14.
a. P(lao và hút thu c lá ) + P(lao và không hút thu c lá)
b. P(lao và hút thu c lá ) x P(lao và không hút thu c lá)
c. P(lao hay hút thu c lá ) + P(lao hay không hút thu c lá)
d. P(lao hay hút thu c lá ) x P(lao hay không hút thu c lá) ử ế ệ ễ ườ ị
ườ ệ ệ
i b nhi m HIV phát hi n 98
ễ
i không nhi m HIV có 1 ế
ợ
ợ ạ ủ ế
ộ ẩ Ti n hành th nghi m Elisa ti n hành trên 100 ng
ử
ng h p (+). Ti n hành th nghi m Elisa trên 100 ng
ng h p (+). Đ nh y c a test Elisa trong ch n đoán HIV là: 15.
ườ
tr
ườ
tr
a. 98%
b. 98,5%
c. 2%
d. 99% Đ chuyên bi ộ
ấ ả ả ươ 16.
a. Xác su t test cho k t qu đúng ộ
ệ ủ
t c a m t test là:
ở ườ
ế
ng ế
i có k t qu d ng 161 ệ ế
ế
ế ấ
ấ
ấ ả
ả
ả b. Xác su t test cho k t qu đúng
c. Xác su t test cho k t qu đúng
d. Xác su t test cho k t qu đúng ở ườ
ng
ở ườ
ng
ở ườ ệ
ng ả
ế
i có k t qu âm
i không b nh
i b nh ạ ử ụ ễ
ử ệ ộ
ế ị
ấ ễ ụ ữ ệ
ụ
ọ
ử
S d ng th nghi m Elisa trong sàng l c tình tr ng nhi m HIV trên 10000 ph
ạ
ỉ ệ ụ ữ
ph n mang thai b nhi m HIV là 1%). Th nghi m có đ nh y là
ườ
ệ
t là 97% Xác su t ph n th c s không nhi m HIV n u ng
i
ả ử ệ ế 17.
ễ
ữ
n mang thai (t l
ụ ữ ự ự
ộ
99% và đ chuyên bi
ph n này có k t qu th nghi m Elisa HIV âm tính là:
a. 0.9
b. 99,9%
c. 99,99%
d. 99% ế ị ỗ ố ượ ả ở Trong cây quy t đ nh m i tình hu ng đ c mô t ộ
b i m t 18.
a. cây
b. nhánh
c. cành
d. nút ậ ể
Cây quy t đ nh là kĩ thu t đ giúp các bác sĩ lâm sàng ỏ ệ ử ế ệ ả ẩ
ọ ự
ệ
ệ ị ể ẩ
ề ự ề ả ng pháp đi u tr đ không x y ra sai sót chuyên ế ị
19.
ệ
a. ch n đoán b nh sau khi h i b nh s , thăm khám lâm sàng và có k t qu xét nghi m
ợ
ị
ề
b. ch n l a đi u tr phù h p
ế ị
c. trong vi c ra quy t đ nh ch n đoán
ươ
ệ ế ợ
d. th c hi n vi c k t h p nhi u ph
môn ể ệ ế ị ươ ể ự ề ị Trong cây quy t đ nh, nút th hi n ph ệ
ng án đi u tr mà bác sĩ có th th c hi n ơ ộ 20.
ượ ọ
c g i là:
đ
ị
a. nút đi u trề
ế ị
b. nút quy t đ nh
c. nút nguy c ơ
d. nút c h i ạ ọ ố ọ Trong hi u thu c có 10 lo i thu c kháng sinh. Có bao nhiêu cách ch n 3 l
ệ ệ
ử ạ ể ố ể ố
i 3 trung tâm ki m nghi m khác nhau: 21.
thu c đ đem g i t
a. 840
b. 120
c. 30
d. 720 ằ ọ ợ ỉ Ch nh h p 6 ch n 3 b ng 22.
a. 10 162 b. 120
c. 20
d. 60 ứ ầ ọ ọ Có 8 h c viên mu n trình đ c ọ
ử ướ ề ươ
ệ ố
ổ ả ọ
ể ọ ng nghiên c u khoa h c. C n ch n 3 h c viên
ử
ọ
c bu i b o v . Có bao nhiêu cách ch n 3 h c viên đ trình bày th . 23.
ể
đ trình bày th tr
a. 56
b. 720
c. 10
d. 336 ế ố ị Bi n s nào là bi n s nh giá ổ
ổ ầ ế ố
24.
ạ
a. Tình tr ng hôn nhân
b. Tu i mãn kinh
ầ
c. Tu i có kinh l n đ u
d. Nam hay nữ ế ố ị ế ố Bi n s nào sau đây là bi n s đ nh tính 25.
ề
a. Chi u cao
ố
b. Có hút thu c lá hay không
c. Tu iổ
d. Cân n ngặ ế ố ế ố ị ượ ng Bi n s nào sau đây là bi n s đ nh l
ị ưỡ ng hay không ng hemoglobin 26.
a. Có b suy dinh d
b. Dân t cộ
ượ
c. Hàm l
d. Tôn giáo ố ệ ủ Tính trung bình c a dãy s li u: 145 ; 112 ; 158 ; 134 ; 124 27.
a. 135,6
b. 133,6
c. 136,6
d. 134,6 ố ệ ố ệ ủ Tính trung bình c a dãy s li u s li u: 1; 3; 4; 7; 6; 8; 9. 28.
a. 6
b. 5.4
c. 6.5
d. 7 163 ố ệ ố ệ ẩ ủ ộ ệ Tính đ l ch chu n c a dãy s li u s li u: 25; 28; 26; 38; 40. 29.
a. 11,05
b. 7,05
c. 13,05
d. 9,05 ố ệ ẫ ố ệ Cho 2 dãy s li u A: 10; 20; 30; 40; 50 và dãy s li u B: 30; 40; 50; 60; 70. D y ẩ ớ ơ ượ ộ ệ 30.
ộ ệ
ố ệ
s li u nào có đ l ch chu n l n h n:
ộ ệ
ằ
ẩ
a. đ l ch chu n b ng nhau
ố ệ
b. s li u B
ố ệ
c. s li u A
d. Không tính đ ẩ
c đ l ch chu n ộ ể ệ ứ ự ữ ẫ ệ ờ
ượ ứ
ử ụ ệ
c chia ng u nhiên và s d ng 2 lo i ờ ệ
ố Ở ứ ườ ủ
ộ ệ ườ ứ ủ i dùng thu c B là: 9; 12; 14; 15; 17; 19; 19; 22; 29; 30. Hãy
ệ
ẩ ủ
i dùng 31. M t nghiên c u th c nghi m đ so sánh th i gian không có tri u ch ng gi a 2
ạ
ỗ
nhóm b nh nhân hen (m i nhóm 10 b nh nhân) đ
ệ
thu c:
nhóm A th i gian không có tri u ch ng (theo ngày) là: 16; 16; 20; 22; 28; 30;
ố
30; 30; 34; 40 và c a 10 ng
ờ
tính trung bình và đ l ch chu n c a th i gian không có tri u ch ng c a 10 ng
ố
thu c A:
̃
a. x=24,3 s=7,89 n=10
̃
b. x=26.6 s=6,23 n=10
̃
c. x=26.6 s=7,89 n=10
̃
d. x=24,3 s=6,23 n=10 ố ệ Cho dãy s li u x: 10,4; 12,1; 13,7; 11,4; 14,6; 11,1; 10,9; 12,5; 10,7; 13,5. Hãy ộ ệ ẩ ủ ố ệ ̃
̃
̃
̃ 32.
tính trung bình và đ l ch chu n c a s li u trên
a. x=12,09 ; s = 2,23
b. x=12,09 ; s = 1,44
c. x=12,20 ; s = 1,44
d. x=12,20 ; s = 1,44 ố ệ Cho dãy s li u x: 10,4; 12,1; 13,7; 12,4; 14,6; 12,1; 10,9; 12,5; 10,7; 13,5. Hãy ộ ệ ẩ ủ ố ệ ̃
̃
̃
̃ 33.
tính trung bình và đ l ch chu n c a s li u trên
a. x=12,29 ; s = 1,37
b. x=12,20 ; s = 1,44
c. x=12,20 ; s = 1,37
d. x=12,29 ; s = 1,44 ị ủ ố ệ ố ệ
Tính trung v c a dãy s li u s li u: 1; 3; 4; 7; 6; 8; 9. 34.
a. 6.5
b. 7
c. 6
d. 5.4 164 ọ ượ ủ ể
Đ th thích h p đ trình bày tr ng l ẻ ơ
ng c a tr s sinh là: ồ ị
ợ
35.
ể
ồ
a. Bi u đ hình thanh
ể
ồ
b. Bi u đ hình chuông
ể
ồ
c. Bi u đ hình bánh
ổ ứ ồ
d. T ch c đ ổ ủ ị ệ ệ ể ố
Đ th thích h p đ trình bày phân ph i tu i c a các b nh nhân b b nh lao là ồ ị
ợ
36.
ồ
ể
a. Bi u đ hình chuông
ổ ứ ồ
b. T ch c đ
ể
ồ
c. Bi u đ hình thanh
ồ
ể
d. Bi u đ hình bánh ố ủ ể ợ ớ Đ th thích h p đ trình bày phân b c a gi ẻ ơ
i tính tr s sinh là: ồ ị
37.
ấ
ầ
a. Đa giác t n su t
ổ ứ ồ
b. T ch c đ
ể
ồ
c. Bi u đ hình thanh
ồ
ể
d. Bi u đ hình chuông ế ố ị ể ượ Đ th thích h p đ trình bày bi n s đ nh l ng là: ồ ị
ợ
38.
ồ
ể
a. Bi u đ hình chuông
ổ ứ ồ
b. T ch c đ
ể
ồ
c. Bi u đ hình thanh
ồ
ể
d. Bi u đ hình bánh ấ ể ị ử ệ ố ị Đ tính xác su t có 2 b nh nhân b t ể ử ụ ệ
ứ ủ ngườ ề
vong do s t rét khi đi u tr 200 b nh nhân
39.
ố
ố
s t rét có th s d ng công th c c a phân ph i
a. Bình th
ị ứ
b. Nh th c
c. Chu nẩ
d. Poisson ỏ ể ệ ữ ệ ố ổ c ấ ữ ộ ệ ể ỏ ế ượ
t đ ượ
ấ
ứ
c xác su t ch a kh i cho m t b nh nhân) có th dùng công th c ngườ 40.
Đ tính xác su t ch a kh i 8 b nh nhân trong trong t ng s 10 b nh nhân đ
ị
ề
đi u tr (khi bi
ố
ủ
c a phân ph i
a. Chu nẩ
b. Poisson
c. Bình th
ị ứ
d. Nh th c 165 e3= 41.
a. 0,0201
b. 0,4521
c. 0,0497
d. 0,3219 ợ ở ệ
c phát hi n. Tính Pháp hàng năm có 3 tr
ườ ệ
ng h p b nh CJD đ
ượ ợ ườ
ệ
ng h p b nh CJD đ ượ
ệ
c phát hi n: 42.
Trung bình
ấ
xác su t trong năm 1995 có 7 tr
a. 0.43
b. 0.02
c. 0.05
d. 0.07 ượ ẻ ơ ộ ệ ủ ẩ ng c a tr s sinh có trung bình là 3000 gram và đ l ch chu n là 250 ọ
Tr ng l
ươ ứ ớ ng ng v i 2750 gram là: 43.
gram. z t
a. 1
b. 2
c. 2
d. 1 ộ ệ ẩ ủ ng c a tr s sinh có trung bình là 3000 gram và đ l ch chu n là 500 ọ
Tr ng l ượ ẻ ơ
ọ ng lúc sanh > 3250 gram là ượ
44.
ấ ẻ
gram. Xác su t tr em có tr ng l
a. 0,3085
b. 0,1587
c. 0,0668
d. 0,1762 ệ ề i nghi n chích ma tuý có 48 ng Đi u tra 110 ng ườ ị
i b viêm gan siêu vi C,
ố ệ ả ườ
ủ ỉ ệ viêm gan siêu vi C trong dân s nghi n chích ma tuý là : 45.
ậ
kho ng tin c y 95% c a t l
a. 0,344 0,563
b. 0,315 0,563
c. 0,315 0,529
d. 0,344 0,529 ộ ỏ ố ả ấ
ậ ủ ỉ ệ ố ả
c có kho ng 27
hút thu c lá c a nam thanh niên ậ ượ
ứ
46. M t nhà nghiên c u ph ng v n 100 thanh niên và ghi nh n đ
ủ
thanh niên hút thu c lá. Kho ng tin c y 95% c a t l
là:
a. 0,15 0,39
b. 0,20 0,34
c. 0,18 0,36
d. 0,16 0,38 166 ọ ộ ứ ấ ậ ượ ậ ả
tu i v thành niên. Kho ng tin c y 95% c a t l ọ
c có 12 h c
ủ ỉ ệ
đã có ệ
ụ ở ọ h c sinh c p 3 là: ấ
ỏ
47. M t nhà nghiên c u ph ng v n 110 h c sinh c p 3 và ghi nh n đ
ụ ở ổ ị
sinh đã có các quan h tình d c
ấ
ệ
quan h tình d c
a. 4,1% 17,7%
b. 5,1% 16,7%
c. 4,6% 17,1%
d. 5,6% 16,1% ộ ệ ủ ẩ Đ ng huy t trung bình c a 120 tr s sinh là 80 mg% và đ l ch chu n là 10 ủ ườ ẻ ơ ủ ẻ ơ
ế ế
ậ ườ
ả ng huy t trung bình c a tr s sinh là: 48.
mg%. Kho ng tin c y 95% c a đ
a. 72,8 – 87,2
b. 78,5 81,5
c. 78,2 – 81,8
d. 72,0 88 ộ ệ ủ ượ ọ
Tr ng l ng trung bình c a 81 tr s sinh thi u tháng là 2,3 kg và đ l ch
ượ ẻ ơ
ọ ẻ ơ ủ ủ ế ả ậ ế
ng trung bình c a tr s sinh thi u 49.
ẩ
chu n là 0,5 kg. Kho ng tin c y 95% c a tr ng l
tháng là:
a. 2,09 2,51
b. 2,19 2,41
c. 2,09 2,41
d. 2,19 2,51 ỏ ộ ậ ượ ả
c có kho ng 23 ố ủ ỉ ệ ấ
ậ ả ứ
50. M t nhà nghiên c u ph ng v n 100 thanh niên và ghi nh n đ
ố
thanh niên hút thu c lá. Kho ng tin c y 95% c a t l
hút thu c lá là:
a. 0,15 0,38
b. 0,15 0,31
c. 0,15 0,39
d. 0,15 0,34 ố ượ ườ ỏ ệ
i kh i b nh và ươ
ườ ươ Ứ
ị ị
ng pháp đi u tr A cho 40 đ i t
ỏ ệ
i có 8 ng ề
ườ
i kh i b nh. Tính chi bình ph ng có 15 ng
ng: ụ
51.
ng d ng ph
ề
đi u tr B cho 50 ng
a. 1,60
b. 7,61
c. 5,40
d. 1,76 ộ ứ ả ủ ệ ố ớ ư ộ ổ
ng c a vi c u ng estrogen t ng
ợ ử
ng h p s ử
ườ ợ cung. Trong 183 ng
ị
ng h p không b ung th có 19 tr ươ ưở
ư
ườ ị
i b ung th có 55 tr
ườ
ư
ể ế ườ
ợ ử ụ
ng h p s d ng
ậ ng, chúng ta có th k t lu n: ế
ử ụ ư ộ ưở ế ả ạ ử ứ ệ
52. M t nghiên c u b nh ch ng đánh giá nh h
ạ
ợ
h p v i ung th n i m ch t
ụ
d ng estrogen, trong 164 tr
ị
ể
ử ụ
estrogen. S d ng ki m đ nh chi bình ph
ề
ậ
a. Các k t lu n trên đ u sai
b. S d ng estrogen có nh h ng đ n ung th n i m c t cung 167 ng đ n ung th n i m c t cung ử ụ
ỉ ệ ưở
ệ ế
ằ ơ ỉ ệ ư ộ
ơ ạ ử
ễ ứ c. S d ng estrogen không nh h
ễ
d. T l ả
ph i nhi m trong nhóm b nh b ng t l ph i nhi m trong nhóm ch ng ườ ng có 6 ng ỏ ệ
i kh i b nh và ươ
ườ ề
ườ ươ Ứ
ị ố ượ
ị
ng pháp đi u tr A cho 20 đ i t
ị
ỏ ệ
i có 13 ng i kh i b nh. Giá tr chi bình ph ng: ụ
ng d ng ph
53.
ề
đi u tr B cho 20 ng
a. 4,91
b. 1,60
c. 7,61
d. 1,76 ủ ẫ ộ S li u t ườ ứ ự ữ ẫ
ộ ụ
ố ườ ị ườ ỵ ứ
ể ể
ị
i b stress có 30 ng i ị i b đ t qu . Trong s 100 ng
ươ ườ ị ộ ỵ i b đ t qu : Hãy tính giá tr chi bình ph ng: ố ệ ừ ộ
m t nghiên c u theo dõi trong 10 năm c a m t m u ng u nhiên 200
54.
ổ ừ
40 – 49 đ ki m đ nh s liên quan gi a ch ng đ t q y (stroke) và
i đàn ông tu i t
ng
ườ ị ộ
ố
ổ
stress. Trong t ng s 100 ng
ị
không b stress có 10 ng
a. 10,50
b. 12,50
c. 1,05
d. 0,15 ộ ườ ứ ề ượ 2029 đ i đàn ông tu i t ờ ầ ượ ườ ổ ừ
i này l n l sau khi tiêm,s li u c a 9 ng c tiêm
t là (1,0 1,0), ộ ự ủ do = 8, ế
t: trung bình c a d=0,067 và Sd=0,071 và t gi
ị ủ
ể i h n là 2,306 (đ t
ệ ố ớ ạ
ị ể ấ Trong m t nghiên c u v Digoxin, 9 ng
55.
ố ệ ủ
ố
Digoxin. B n và tám gi
(1,3 1,3), (0,9 0,7), (1,0 1,0), (1,0 0,9), (0,9 0,8), (1,3 1,2), (1,1 1,0), (1,0 1,0).
Cho bi
phép ki m 2 bên). Tính giá tr c a phép ki m t (l y giá tr tuy t đ i):
a. 3,83
b. 2,83
c. 2,38
d. 8,32 ẩ ủ ườ ng huy t c a 15 tuân th ch đ ăn đ c ể ộ ệ ả ế ủ
ế
thuy t Ho: đ ế
ể ằ ườ
ầ ủ ườ ộ ệ
Trung bình và đ l ch chu n c a đ
ị
ẩ
t là 90 và đ l ch chu n là 12. Ki m đ nh gi
ế ủ ế ộ
ặ
ng huy t trung bình
ng huy t trung bình c a qu n th b ng 100mg%. ằ
i này b ng v i đ ớ ườ
ị ố
ấ ệ ố ủ ể 56.
ệ
bi
ủ
c a nhóm ng
ị ủ
Giá tr c a phép ki m t là (l y tr s tuy t đ i c a t)
a. 2,54
b. 3,23
c. 2,12
d. 2,80 ộ ệ ứ ự ữ ể ứ
ử ụ ờ
ượ ệ ẫ ệ
c chia ng u nhiên và s d ng 2 lo i ệ
ố Ở ứ ờ ườ i dùng thu c B là: 9; 12; 14; 15; 17; 19; 19; 22; 29; 30. ệ
ố
ậ ủ
ẩ ấ ể ộ ệ ế ế ộ ờ ợ 57. M t nghiên c u th c nghi m đ so sánh th i gian không có tri u ch ng gi a 2
ạ
ỗ
nhóm b nh nhân hen (m i nhóm 10 b nh nhân) đ
nhóm A th i gian không có tri u ch ng (theo ngày) là: 16; 16; 20; 22; 28; 30;
thu c:
30; 30; 34; 40 và c a 10 ng
N u đ l ch chu n g p = 7,39. K t lu n phù h p nh t đ so sánh Th i gian không có 168 ệ ệ ệ ứ ở ươ ươ 2 nhóm b nh nhân b nh hen:
nhóm A t ng nhóm B (giá tr t i h n = 1.96) ị ớ ạ ơ ị ớ ạ
i h n = 2.1)
ị ớ ạ ươ ươ ng nhóm B (giá tr t i h n = 2.1) ứ ở
ứ
ứ ở
ứ ở ng đ
ớ
ng đ
ơ ệ
ệ
ệ
ệ ị ớ ạ ớ ằ nhóm A t
nhóm A cao h n so v i nhóm B (giá tr t i h n b ng tri u ch ng
ờ
a. Th i gian không tri u ch ng
ờ
b. Th i gian không tri u ch ng A cao h n so v i nhóm B (giá tr t
ờ
c. Th i gian không tri u ch ng
ờ
d. Th i gian không tri u ch ng
1.96) ị ằ ề ế ố ứ ể ứ
ố ợ ể ị ằ ề ố i ti u D trên 25 b nh nhân. Trong nhóm đi u tr b ng thu c A ế ề ố ế
ệ
ớ ộ ệ
ả ẩ
ớ ộ ệ
ị
ể ệ ề ộ ạ ẩ
ị ượ ằ t v đ h áp trung bình b ng ki m đ nh t. Giá tr t tính đ c là ộ
58. M t nhà nghiên c u đi u tr huy t áp b ng thu c c ch men chuy n A trên 20
ệ
b nh nhân và thu c l
ả
ị
huy t áp tâm thu gi m 20 mmHg v i đ l ch chu n là 10 mmHg. Trong nhóm đi u tr
ế
ằ
b ng thu c D, huy t áp tâm thu gi m 30 mmHg v i đ l ch chu n là 13 mmHg. So
ự
sánh s khác bi
a. 7,97
b. 3,27
c. 2,83
d. 5,27 ộ ệ ể ự ươ ấ ủ ứ
ự ng ể ớ ấ ườ ấ
ả ủ
ng pháp hu n
ươ
ệ
ượ
c hu n luy n theo ph
ủ
t là: 13; 18; 20; 18; 14; 15; 15; 15; 17; 20 và c a 10
ế ằ
ng pháp B là: 9; 12; 13; 11; 10; 9; 18; 20; 9; 10. Bi t r ng ể ủ
ộ ệ ộ ệ ủ ẩ ộ ệ
59. M t nghiên c u th c nghi m đ so sánh hi u qu c a 2 ph
luyên lên kĩ năng th c hành c a sinh viên. 10 sinh viên đ
ầ ượ
pháp A có đi m kĩ năng l n l
ươ
ệ
ng
i hu n luy n v i ph
ẩ ủ
ộ ệ
trung bình và đ l ch chu n c a đi m kĩ năng c a 10 sinh viên trong nhóm A là 16,5 và
2,46 trong nhóm B là: x=12.1 s=3,9. Hãy tính đ l ch chu n g p (sp) c a 2 đ l ch
chu n:ẩ
a. sp=4,32
b. sp=6,83
c. sp=3,26
d. sp=6,51 ụ ữ ệ ướ ụ ữ
c ti u c a ph n béo ph và ph n ng corticoid /24h trong n ượ ụ ữ ể ủ
ệ ượ
i ta thu đ ể
Đ so sánh l
ườ
ườ
ng , ng ẩ c : Nhóm ph n béo ph : n1 = 120 , l
ộ ệ ng corticoid
ườ ng: ượ αớ ượ
ụ ữ
ẩ
ủ ườ = 0.05 , ng ộ ệ
ng corticoid trung bình /24h : 4.5 mg/24h , đ l ch chu n =1.5mg/24h.
ng corticoid trung bình /24h c a hai nhóm có ế ượ
t l
ẩ ộ 60.
bình th
trung bình /24h : 6.3mg/24h , đ l ch chu n =1.7mg/24h và nhóm ph h bình th
n2 = 148 , l
ố
i ta mu n bi
V i
ị ộ ệ
khác nhau không. Giá tr đ l ch chu n g p (sp) là:
a. sp= 1.65
b. sp= 1.4
c. sp= 1.6
d. sp= 1.57 ế ủ ườ
ả ượ ươ ả ng huy t c a 3 nhóm công nhân khác nhau (m i nhóm 20 công
c trình bày trong b ng sau trung bình và ph ể ể ị ẻ ử ụ ự
ầ ươ ở ệ ề
t v
ớ
ng sai, c n tra b ng F v i 3 nhóm tr s d ng phân tích ph ng trung bình ộ ự ỗ
Theo dõi đ
61.
ủ ừ
ế
ng sai c a t ng nhóm
nhân). K t qu đ
ầ ượ
t là (97, 54), (102, 46), (108, 50). Đ ki m đ nh Ho: không có s khác bi
l n l
ả
ượ
ọ
tr ng l
a. 3,60 đ t do 169 ộ ự
b. 1,59 đ t
ộ ự
c. 2,57 đ t
ộ ự
d. 2, 59 đ t do
do
do ọ ẻ 3 nhóm tr (m i nhóm 20 tr ) có Theo dõi tr ng l
ượ ẻ
ủ ươ ư ổ ở
ng vào lúc 12 tháng tu i
ng và ph ượ
ng lúc sinh khác nhau. Tr ng l ượ
ị ượ ng sai c a m i nhóm nh sau (8,4
ng t v tr ng l ẻ ử ụ ươ ả ầ ệ ề ọ
ự
ớ
ng sai, c n tra b ng F v i ỗ
62.
ỗ
ọ
ọ
tr ng l
ể ể
– 2,3), (9,3 – 1,3), 10,1 – 1,5). Đ ki m đ nh Ho: không có s khác bi
ở
trung bình
ộ ự
a. 2, 59 đ t
ộ ự
b. 2,57 đ t
ộ ự
c. 1,59 đ t
ộ ự
d. 3,60 đ t 3 nhóm tr s d ng phân tích ph
do
do
do
do ữ ủ ế ườ Ở ộ i ta ghi nh n huy t áp tâm thu c a nh ng ng ớ ườ i đàn
ộ ệ ế ậ
ườ
20 đ n <30 tu i có 34 ng ườ ẩ ộ ệ ồ
ớ ừ
30<40 g m 30 ng
i t
ườ ớ
ồ
40<50 g m 30 ng
ươ i v i HATT trung bình là 142, đ l ch
ộ
i có trung bình 146 và đ
i v i trung bình là 150 và đ l ch
ủ ầ ư ế ẩ ộ ng sai ph n d MS trong nhóm) c a huy t áp tâm thu ừ
ng sai g p (ph m t phòng khám ng
63.
ổ
ừ
ông. Trong nhóm t
ằ
chu n b ng 20. Trong nhóm nam gi
ẩ
ệ
l ch chu n 20. Trong nhóm t
ươ
chu n 20. Ph
là
a. 320,0
b. 460
c. 400
d. 420 ắ ậ ườ 3 nhóm (m i nhóm 10 tr ) đ ệ
i ta làm tr c nghi m tâm lí v n đ ng c Ng
ệ ộ
ở
ậ ố ầ ắ ỗ ẻ ượ
ộ ệ
ị ố ệ ầ ượ
ớ
ươ ứ ị ị ng ng v i giá tr F này là ỗ
64.
ầ
ấ
hu n luy n theo 3 cách khác nhau và ghi nh n s l n m c sai l m trung bình (Đ l ch
ẩ
chu n) trong m i nhóm. S li u l n l
t là 7,4 (3) – 8,3 (2,5) – 10,6 (3,5) . Giá tr F =
2,97. Giá tr p value trong t
a. <0,01
b. <0,001
c. >0,05
d. <0,05 ế ậ ế ng quan r = 0,55 ta k t lu n: ươ
ươ
ươ
ươ 65.
a. T
b. T
c. T
d. T ệ ố ươ
N u h s t
ị
ạ
ng quan ngh ch m nh
ạ
ậ
ng quan thu n, m nh
ế
ị
ng quan ngh ch, y u
ế
ậ
ng quan thu n, y u ế ậ ế ng quan r = 0,90 ta k t lu n: ươ
ươ
ươ 66.
a. T
b. T
c. T ệ ố ươ
N u h s t
ế
ị
ng quan ngh ch, y u
ậ
ế
ng quan thu n, y u
ạ
ậ
ng quan thu n, m nh 170 ươ ạ ị d. T ng quan ngh ch m nh ế ậ ế ệ ố ươ ng quan r = 0,45 ta k t lu n: ươ
ươ
ươ
ươ ị 67.
a. T
b. T
c. T
d. T N u h s t
ậ
ứ ộ ạ
ng quan m c đ m nh, thu n
ị
ứ ộ ừ
ng quan m c đ v a , ngh ch
ị
ứ ộ ạ
ng quan m c đ m nh, ngh ch
ứ ộ ế
ng quan m c đ y u, ngh ch ị ề ệ ượ ệ ộ ả ủ
t đ và nh p tim) c a 6 b nh nhân đ c trình bày trong b ng sau
ế
t ộ ệ ẩ ủ ị
ệ ố ươ ệ ố ươ ủ t đ là 38,4 và 0,75 và h s t ộ ệ
ng quan là 0,75. H s góc c a ph ệ ộ
ị ệ t là: ố ệ
68.
S li u v (nhi
ầ ượ
t là (39,2 – 80), (39,0 95), (38,8 – 88), (38,4 – 80), (37,6 – 70), (37,4 – 75). Bi
l n l
ẩ
trung bình và đ l ch chu n c a nh p tim là 81,3 và 8,98. trung bình và đ l ch chu n
ủ
c a nhi
ng trình
ồ
h i quy nh p tim theo thân nhi
a. 0,62
b. 264
c. 9
d. 33 ệ ố ươ ổ ẩ ủ
ồ ộ ệ
ươ ộ ệ ế
N u h s t
ổ ặ ng quan c a cân n ng và tháng tu i là 0,6 đ l ch chu n c a
ng trình h i quy ặ ặ
ẩ ủ
ẽ ệ ố ằ ổ ủ
69.
tháng tu i là 10 tháng và đ l ch chu n c a cân n ng là 2000 g. Ph
ủ
c a cân n ng (Y) theo tháng tu i (X) s có h s góc b ng
a. 150
b. 10
c. 120
d. Không tính đ c.ượ ượ ươ ồ ườ ộ ứ c ph ng ượ ế bào) theo l ấ
ng b t th
ng NST = 0,14 +
ớ ồ ộ ằ
ng chì máu (tính b ng (g/100ml). M t ng
ố ấ
ượ ườ ố ượ
ng trình h i quy tiên đoán s l
ấ
ườ
ng chì trong máu : B t th
ườ ị
ễ
i b nhi m chì v i n ng đ 0
ế
bào là ộ
ng NST/100 t c tiên đoán có s b t th 70. M t nghiên c u tìm đ
ắ
ể
ễ
nhi m s c th (trên 100 t
ượ
0,90 x l
(g/100ml đ
a. 0,14
b. 0,90
c. 6,2
d. 1,04 01. D 02. D 03. C 04. A 05. A 06. B 07. A 08. A 09. C 10. B 171 11. C 12. D 13. B 14. A 15. A 16. C 17. C 18. B 19. B 20. B
21. D 22. B 23. A 24. D 25. B 26. C 27. D 28. B 29. B 30. A
31. C 32. B 33. A 34. C 35. D 36. B 37. C 38. B 39. B 40. D
41. C 42. B 43. A 44. A 45. D 46. C 47. B 48. C 49. B 50. B
51. C 52. B 53. A 54. B 55. B 56. B 57. B 58. C 59. C 60. C
61. C 62. B 63. C 64. C 65. A 66. D 67. B 68. C 69. C 70. A 172 SỬ DỤNG MÁY TÍNH CẦM TAY ứ ươ ng th c tính toán ch y u: ph ươ
ố ươ ố
ươ
ng th c tính th ng kê và ph ị trung bình và đ l ch chu n ệ đ ầ
h i quy ượ ng. ươ ườ ươ ỉ ủ ế
ứ
ng th c tính toán
ồ
ứ
ứ
ươ
ng th c h i quy. Ph
ng th c tính
ủ ố ệ
ộ ệ
ẩ c a s li u đ nh
ố
ố ượ
ng hóa m i quan h (xác
c s d ng khi mu n l
ầ
ộ ố
ầ ư
C n l u ý m t s máy tính c m
ứ
ng th c tính
ng và ph ượ ử ụ
ế ố ị
ứ
ng th c tính toán thông th ố 1. Các phương thức tính toán:
ầ
Máy tính c m tay th ng kê có 3 ph
ườ
ứ
ng, ph
thông th
ượ ử ụ
ố
đ
c s d ng khi c n tính
th ng kê
ươ
ượ
ồ
l
ng và ph
ng pháp
ệ ố ươ
ị
ữ hai bi n s đ nh l
ng quan) gi a
đ nh h s t
ờ
ọ
tay khoa h c đ i cũ ch có 2 ph
th ng kê. ố ụ ử ụ ố ớ ề
ạ ộ ươ ể ế ể ứ ư ạ ệ
ể ệ ạ ớ ứ ả
ươ ố
i http://world.casio.com/edu.e/). Đ i v i máy tính lo i Casio, khi
ố ạ
ươ ể ỏ ữ ở ph ng th c th ng kê trên màn hình tinh th l ng có ch SD,
ữ ể ỏ ủ ệ ư ở ch s n và s n1. Đ i v i máy tính lo i Casio, khi
ể ỏ ạ
ố ớ
ặ ữ ạ
ố ớ
ữ ữ
ể ỏ ươ ố ở ở ng th c th ng kê trên màn hình tinh th l ng có ch SD, ph ph ữ ể ỏ
ươ ươ ệ ệ ở ng hi u khác: thu c nhi u th ề
trên phím ộ
ừ STAT s 2. Các loại máy tính:
ệ
Có nhi u hi u máy tính khác nhau, nhìn chung đ i v i m c đích s d ng cho th ng kê
có ba lo i máy tính chính:
ể ệ
ạ
ủ
Máy tính c a th
ng hi u Casio có 2 dòng: Là lo i máy tính có m t dòng đ hi n
ả ủ
ộ
ứ
bi u th c và m t dòng đ hi n k t qu c a bi u th c nh lo i máy tính Casio fx
500MS; Casio fx100MS; Casio fx115MS; Casio fx570MS; Casio fx991MS (tham
ở
kh o thêm t
ứ ồ
ng th c h i quy
ph
trên màn hình tinh th l ng có ch REG.
MODE cùng v iớ
ươ
ng hi u Casio có 1 dòng: Là lo i máy tính có phím
Máy tính c a th
ế
ư
ặ
ộ ố
m t s phím đ c tr ng nh phím
ạ
ộ ố
đ th ng kê trên màn hình tinh th l ng có ch SD ho c ch LR. Đ i v i máy tính lo i
ươ
ứ
Casio, khi
ng
ứ ồ
th c h i quy trên màn hình tinh th l ng có ch LR.
ộ
Máy tính có 1 dòng thu c các th
nh Sharp, Karke, Truly, v.v. Các máy tính này có t
ở ế ộ ố ố ớ ạ ng hi u khác nhau
ON và các phím
ể ỏ
ch đ th ng kê trên màn hình tinh th l ng có ư
và s. Đ i v i máy tính lo i này, khi
ữ ch STAT. ứ ườ ả ở ề ươ ng. ể ư ề ạ ng th c tính toán bình th
ươ ườ ủ
ằ ệ
ấ ư ế ng b ng cách nh n phím ấ ủ ộ
ụ ố ớ ể ư ề ạ ệ ư ỉ ẫ ộ ươ
ng b ng cách nh n phím ủ
ằ
ụ ố ớ 3. Sử dụng máy tính ở phương thức tính toán thông thường
Chúng ta ph i tr v ph
ố ớ
ng hi u Casio có 2 dòng: chúng ta có th đ a v d ng tính
Đ i v i máy tính c a th
ỉ ẫ
ằ
toán b ng th
MODE và m t phím ti p theo nh ch d n
ệ
xu t hi n trên màn hình c a máy tính. (Thí d đ i v i máy tính Casio fx 500MS thì
nh n ấ MODE 1)
ố ớ
ng hi u Casio có 1 dòng: chúng ta có th đ a v d ng tính
Đ i v i máy tính c a th
ế
ấ
ườ
ằ
toán b ng th
MODE và m t phím ti p theo nh ch d n ghi
trên thân máy. (Thí d đ i v i máy tính Casio fx 85 Sw thì nh n ố ớ ệ ạ ộ ứ ở ỉ ươ
ng th c tính toán bình th ph ứ ố ể ỏ
ằ ườ ứ ng b ng cách nh n phím ng th c tính toán thông th ấ MODE 0)
ở ộ
ở
ng hi u khác, khi m máy (kh i đ ng
ở
ườ
ng. Do đó, ch khi máy tính đang
ữ
ng th c tính toán th ng kê (trên màn hình tinh th l ng có ch STAT) thì chúng
2nd Funct
ấ Đ i v i các máy tính 1 dòng thu c các lo i th
ươ
máy) thì máy tính
ươ
ở
ph
ả ở ề ươ
ớ
ta m i ph i tr v ph
ồ
ON.
r i phím ừ ộ Phím c ng tr nhân chia ứ ườ ậ ử ụ ở ươ
ph ng th c tính toán thông th ng; hãy t p s d ng các phím +, , · , và ‚ Sau khi đã
ằ ị b ng cánh tính các giá tr sau: 173 2896 + 375 + 6413 = 23.65 + 2.10 + 18.74 + 6.43 = = = 3.1 = = 73 – 16 + 23 + 4 – 85
5.2 ·
17.4 ·
18 ‚
3
135.62 ‚ 10.57 Phím xoá: ả ủ ế ằ ẩ ộ ị ớ
xoá k t qu c a máy tính nh m chu n b cho m t phép tính m i AC ố ạ ử ậ
S a sai khi nh p các s h ng ỏ ể ể ị ố ớ
ữ ứ ể ể ấ ế
ế
ể ậ
ậ ế ậ ố ộ
ẫ ệ ấ ể ử ụ
Đ i v i máy tính 2 dòng, chúng ta có th s d ng con tr đ di chuy n đ n v trí
ầ ử
ả
ố
c n s a ch a trong bi u th c, nh p vào con s đúng và nh n phím = đ có k t qu .
ố
ộ ố ạ
ố ớ
Đ i v i máy tính m t dòng, n u nh p m t s h ng sai trong khi tính toán, có th xoá s
ạ
h ng đó trong khi v n ti p t c vi c tính toán thì nh n C và sau đó nh p s đúng vào
ử ế ụ
ử ậ ụ ế ố ộ ế ụ ử S a sai khi nh p các toán t
ử
ử (thí d n u gõ sai phím – trong khi mu n c ng) thì không
ệ
ỉ ầ
cũ mà ch c n gõ toán t
đúng (phím +) và ti p t c vi c ậ
ế
N u nh p sai toán t
ả
ầ
c n ph i xoá toán t
tính toán. ứ ự ư ấ ặ
u tiên và d u ngo c
ị Th t
Tính toán các giá tr sau: 6 = ề ự ế
ướ ẽ ượ
c tính s là 33. Đi u này có nghĩa là phép toán 5 x 6 s đ
ả
ể ế ề ả ở ặ ấ ẽ
ẽ ượ ộ
ế
ặ ấ ặ
ứ ư ế ộ ệ
c th c hi n
c c ng v i 3 đ có k t qu 33. Đi u này x y ra b i vì trong
ộ ư
c N u có d u ngo c thì phép toán trong d u ngo c có đ u
) và phép
ộ ư
(ừ ). N u m c đ u tiên b ng nhau thì ừ ẽ ả
c và k t qu 30 s đ
ướ
i ta quy
ấ
ơ
) có u tiên h n phép c ng (
trái sang ph i.
16 · ả
7 + 2 · 5 + 14 · 7 = ươ 3 + 5 ·
ả ượ
K t qu đ
ớ
ế
tr
ặ
ấ
ườ
ọ
toán h c ng
(·
ế
ấ
tiên cao nh t. Trong d u ngo c hay n u không có d u ngo c thì phép nhân
chia (‚
ằ
+) và tr
ệ
vi c tính toán s đi t
Thí d ụ
ươ
ng đ Cũng t ng nh 7 ) + (2 · 5) + (14 · 7) = ư
(16 · ị Tính toán các giá tr sau: 6 = 6) = (6 + 4) = 6 =
(2 + 15 + 8) ·
5 = 5) = 6 = 4 = 4) = 3 + 5 ·
3 + (5 ·
(3 + 5) ·
(6 + 5) ·
6 + 4 ‚
6 + (4 ‚
(6 + 4) ‚
3 ·
24 ‚
(3 ·
24 ‚
3) ·
(24 ‚ 4 = 174 ặ ồ ề ụ ấ
Chúng ta có th dùng nhi u d u ngo c l ng vào nhau. Thí d ể
((17+33) · 1317 ‚ (41 + 6)) = Phím hàm số ố ổ ế , x2, log, ln, ex x) ố ượ ượ ứ ố ụ
c th hi n b ng phím hàm s ph khi ch c năng đó không đ c ghi ượ ụ ứ ộ ố
trên m t phím mà đ ồ (cid:214)
Các phím hàm s ph bi n bao g m
ằ
phía trên phím (thí d ch c năng e ớ ả
ln 5 = ). Ng ố ố
ượ ạ ố ớ
ụ ể ậ
c l
ố ấ ả ấ ể ệ
M t s hàm s đ
ặ
ở
ở
c ghi
ậ
ử ụ
ố ố ớ
Khi s d ng phím hàm s , đ i v i máy tính 2 dòng ta ph i nh p hàm s r i m i nh p
ụ ể
ố ố
ấ
i đ i v i máy tính 1
đ i s (thí d đ tính ln(5) ta nh n các phím
ậ
ướ
ố ố
dòng ta ph i nh p đ i s vào tr
c và sau đó nh n phím hàm s (thí d đ tính ln(5) ta
5 ln = ).
nh n các phím
ố ố ố ồ ướ ấ ậ ớ
c sau đó nh n phím hàm s r i m i ế
ậ ố
ố ố ứ ụ ể ố ố
1.5 ta nh p ậ 5 ^ 1.5 = (hay 5 xy 1.5 =) N u hàm s có 2 đ i s thì nh p đ i s 1 vào tr
nh p đ i s th 2. Thí d đ tính 5
ể ử ụ ứ ể Chúng ta có th s d ng phím ch c năng đ tính: ơ ố ủ log c s 10 c a 100: log 100 100 log ủ ậ căn b c 2 c a 4 √ 4 4 √ ự ơ ố ủ log t nhiên (log c s e) c a 5 ln 5 5 ln ơ ố ủ mũ c s e (antilog) c a 2.1 shift ex 2.1 2.1 ex exp(ln4 + ln9) ln 4 + ln 9 = và ex = 4 ln + 9 ln = và ex ứ ạ ứ ể ằ ể ử ụ
ướ
ứ ứ
ằ ứ ể ấ ậ ồ ả ầ ượ ế ằ (8 + 9)) b ng cách nh n t là 85 và 4.443 (8 + 9) = ln cho k t qu l n l ể ậ Chúng ta cũng có th s d ng phím ch c năng cho các bi u th c ph c t p b ng cách
ụ
ấ
c nh n d u b ng r i nh p phím ch c năng. Thí d :
tính toán các bi u th c tr
ấ 5 ·
ln(5 ·
ứ
Bài t p: Hãy tính các bi u th c sau: ủ
ủ ậ
căn b c 2 c a 25
ậ
căn b c 2 c a 97.49
ủ
ự
log t
nhiên c a 176
132 + 42 + 72
1/17 + 1/12 ệ ọ ế ệ ế ả · ể ị ế ọ 1008
ề ạ ư ể ả
ớ
ấ ể ằ ể
ữ ố
ậ
ng b ng cách chuy n d u th p phân v bên trái 8 ch s : 1008 = 00000000002.5 · 1008 = 0.000000025 Kí hi u khoa h c:
N u chúng ta tính:
ẽ ấ
1/40000000 (1 chia 40 tri u) chúng ta s th y máy tính cho k t qu : 2.5 –08. Đây là
ệ
cách máy tính bi u th k t qu theo kí hi u khoa h c. Nó có nghĩa là 2.5
ế
ệ
N u chúng ta ch a quen v i kí hi u này chúng ta có th chuy n nó v d ng bình
ề
ườ
th
Thí dụ
2.5 ·
ế
N u chúng ta tính 175 ả ậ ế ượ c k t qu 9.2141942 10. Đây là cách máy · ể 25672 ·
ị 400 chúng ta s nh n đ
ố ể ằ ể ẽ
1010
ố ề ạ ườ ấ
ng b ng cách chuy n d u ậ ể
ả 1010 = 92141942000
ọ ộ · 8973 ·
tính bi u th con s 9.2141942
Chúng ta cũng có th chuy n con s này v d ng bình th
ữ ố
ề
th p phân v bên ph i 10 ch s :
1010 = 9.2141942000 ·
9.2141942 ·
ệ
ố
ậ
ể
Đ nh p vào m t con s theo kí hi u khoa h c chúng ta dùng phím EXP
Thí d ụ
ế ố ố ậ
N u mu n nh p con s 1.946 103 Chúng ta nh p ậ 1.946 EXP 3 +/ · ể ậ ố Đ nh p con s 1.36 1015 Chúng ta nh p ậ 1.36 EXP 15 ể ứ ứ ể ứ ể ạ ể Bi u th c sai
ụ
Thí d chúng ta chia 1 cho 0
1 ‚
0 chúng ta có bi u th c sai.
ể
Đ xoá bi u th c sai chúng ta nh n ứ
i bi u th c đúng. ấ AC và tính l ố ả ử ụ ủ ứ
ệ ươ
ươ ộ ằ ư ố ớ
ố ể ư ề ạ
ỉ ẫ ệ ủ ụ ố ớ ể ỏ ấ ổ ợ ữ
ố ệ ể ắ ầ
ằ ệ ể ư ề ạ ư ỉ ẫ ộ ươ
ng b ng cách nh n phím ủ
ằ
ụ ố ớ
ữ ể ắ ầ ố ể ỏ
ườ ố ệ ả ớ 4. Sử dụng máy tính để tính thống kê
ng th c tính th ng kê
Chúng ta ph i s d ng ph
ng hi u Casio có 2 dòng: chúng ta có th đ a v d ng tính
Đ i v i máy tính c a th
ấ
ế
ấ
toán th ng kê b ng cách nh n phím
MODE và m t phím ti p theo nh ch d n xu t
ấ
hi n trên màn hình c a máy tính. (Thí d đ i v i máy tính Casio fx 500MS thì nh n
ố
MODE 2). Khi đó trên màn hình tinh th l ng có ch SD. Đ b t đ u tính toán th ng kê
ả
ớ
ộ ẫ ố ệ
cho m t d y s li u m i chúng ta ph i xóa các s li u cũ b ng cách nh n t
h p phím:
Shift Mode 1 (Scl) =
ố ớ
ng hi u Casio có 1 dòng: chúng ta có th đ a v d ng tính
Đ i v i máy tính c a th
ế
ấ
ườ
ằ
MODE và m t phím ti p theo nh ch d n ghi
toán b ng th
ấ MODE 3). Khi đó trên
trên thân máy. (Thí d đ i v i máy tính Casio fx 85 Sw thì nh n
ộ ẫ ố ệ
màn hình tinh th l ng có ch SD. Đ b t đ u tính toán th ng kê cho m t d y s li u
ằ
m i chúng ta th ố ớ ươ ạ ộ
ứ ở ế
ồ ươ ấ ứ ế ồ ạ ứ ng ( ứ ằ
ươ
ng th c th ng kê ( ấ Shift – AC =
ng ph i xoá s li u cũ b ng cách nh n
ở
ệ
ở ộ
ng hi u khác, khi m máy (kh i đ ng
Đ i v i các máy tính 1 dòng thu c các lo i th
ể
ố
ườ
ươ
ng. N u mu n chuy n sang
ph
ng th c tính toán bình th
máy) thì máy tính
nd Funct r i phím ON. Khi đó trên
ố
ng pháp tính toán th ng kê, chúng ta nh n phím 2
ph
ể ỏ
ố
ở ươ
ữ
ng th c tính toán th ng kê
ph
màn hình tinh th l ng có ch STAT. N u chúng ta đã
ạ
ố ệ
ả
ớ
ộ ẫ ố ệ
ố
ồ
i mu n tính toán cho m t d y s li u m i, chúng ta ph i xoá s li u
r i và chúng ta l
2nd Funct – ON) r i l
ườ
ở ề
ươ
ng th c tính thông th
cũ b ng cách tr
i vào
v ph
2nd Funct – ON m t l n n a).
ộ ầ ữ
ố
ph
ậ ừ
ằ ậ ố ệ ị ố ệ ấ ọ ậ ố ệ ả ử ố s chúng ta có 5 con s 12, 24, 3, 15 và 7 thì cách chúng ta nh p s li u nh ư Chúng ta nh p s li u b ng cách nh p t ng giá tr s li u và nh n phím M+ (còn g i là
phím DATA –DT).
ụ
Thí d : gi
sau: 12 M+ 24 M+ 3 M+ 15 M+ 176 M+
ậ ủ ố ệ ị ố ằ ươ ệ ố ọ ự ẫ ở ướ ụ ể ệ ấ ộ ệ ẩ ấ ấ 7
ể
ấ
Sau khi nh p xong chúng ta có th xem các giá tr th ng kê c a s li u b ng cách nh n
ệ
ủ
ố
ng hi u
vào các phím có các kí hi u th ng kê trên thân máy. Riêng đ i máy c a th
ệ
ộ
trên màn
Casio có 2 dòng. SVPAM vi c ch n l a các phím ph thu c vào h
ng d n
ư ể
ụ
ế ố ố
hìnhhãy đ hi n ra bi n s th ng kê hãy nh n vào phím
Shift 2 (Svar). Thí d nh đ
Shift 2 (Svar) 1 (‘ x) và đ tính đ l ch ch n nh n vào
ể
tính trung bình nh n vào phím
ổ ợ
t h p phím Shift 2 (Svar) 2 (s n1) ệ ủ ị ố ụ ạ ộ Cách kí hi u c a các giá tr th ng kê ph thu c vào lo i máy: ố ạ Th ng kê trung bình ẩ ố ộ ệ
đ l ch chu n dân s Lo i máy tính khác
‘ x
s n ẩ ẫ ộ ệ
đ l ch chu n m u s Máy tính Casio
‘ x
s n
s n1 ổ T ng quan sát ổ ị
T ng các giá tr ổ ươ T ng bình ph ị
ng giá tr n
(cid:229) x
(cid:229) x2 n
(cid:229) x
(cid:229) x2 ạ ườ ấ ồ ả
ng chúng ta ph i nh n phím ố ể ị ớ
SHIFT r i m i
ấ SHIFT 1 đ có giá tr trung bình ố ớ ỉ ầ ạ ố ụ ể ấ ố ớ
Đ i v i máy tính lo i Casio: thông th
ụ ể
ấ
nh n phím th ng kê (thí d đ xem trung bình ta nh n
là 12.2)
ấ
Đ i v i các máy tính lo i khác chúng ta ch c n nh n vào phím th ng kê. Thí d đ
‘ x (cũng là phím x>M)
xem trung bình ta nh n vào phím ố ệ ậ ố ệ ậ ạ
i
ề ố ậ ạ ố ệ ụ ế i, Thí d n u chúng ta có s li u ơ ẻ ư ở trên ho c nh p s li u l p l nh ể
ơ ệ ậ ố ệ ậ ạ
ể ậ ố ệ ậ ạ ể
ng ti n h n n u chúng ta có nhi u s li u l p l ặ
ề ố ệ ậ ạ
i). đ nh p s li u l p l i (cách này
i chúng Nh p s li u l p l
Đôi khi s li u có nhi u s l p l
2, 2, 2, 2, 3, 5, 5, 5, 6, 9, 12, 15, 17, 17, 20
ậ
Chúng ta có th nh p theo ki u đ n l
ế
ườ
th
ta nh n:ấ ố ượ ị ậ ủ
Giá tr c a con s đ c nh p (thí d nh ụ ư 2) · ấ ặ ấ
Sau đó nh n phím (ho c nh n nút ấ ủ ị shift và nút ; cho máy Casio 2 dòng)
ụ 4) ượ ụ ầ
Sau đó t n su t c a giá tr này (thí d là
Sau đó nh n ấ M+
ố ệ
Áp d ng cho dãy s li u trên chúng ta đ c: Máy Casio 2 dòng 2 ; 4 M+ (nh nấ 2 shift ; 4 M+) Máy tính 1 dòng
2 · 4 M+ 3 M+
5 · 3 M+ (nh nấ 5 shift ; 3 M+) 3 M+ 3 M+
5 · 6 M+ 6 M+ 9 M+ 9 M+ 177 12 M+ 12 M+ 2 M+ (nh nấ 17 shift ; 2 M+) 2 M+ 15 M+
17 · 15 M+
17 · 20 M+ 20 M+ ố ộ ệ d y s li u trên chúng ta có s quan sát n= 15; trung bình ‘ x = 8.13 và đ l ch chu n
ẩ Ở ẫ ố ệ
= 6.39 178 PHỤ LỤC: BẢNG SỐ THỐNG KÊ th nhì c a z ố ẻ ứ
s l
0.04
0,5160
0,5557
0,5948
0,6331
0,6700 z
0.00
0.0 0,5000
0.1 0,5398
0.2 0,5793
0.3 0,6179
0.4 0,6554 0.01
0,5040
0,5438
0,5832
0,6217
0,6591 0.02
0,5080
0,5478
0,5871
0,6255
0,6628 0.03
0,5120
0,5517
0,5910
0,6293
0,6664 ủ
0.05
0,5199
0,5596
0,5987
0,6368
0,6736 0.06
0,5239
0,5636
0,6026
0,6406
0,6772 0.07
0,5279
0,5675
0,6064
0,6443
0,6808 0.08
0,5319
0,5714
0,6103
0,6480
0,6844 0.09
0,5359
0,5753
0,6141
0,6517
0,6879 0.5 0,6915
0.6 0,7257
0.7 0,7580
0.8 0,7881
0.9 0,8159 0,6950
0,7291
0,7611
0,7910
0,8186 0,6985
0,7324
0,7642
0,7939
0,8212 0,7019
0,7357
0,7673
0,7967
0,8238 0,7054
0,7389
0,7704
0,7995
0,8264 0,7088
0,7422
0,7734
0,8023
0,8289 0,7123
0,7454
0,7764
0,8051
0,8315 0,7157
0,7486
0,7794
0,8078
0,8340 0,7190
0,7517
0,7823
0,8106
0,8365 0,7224
0,7549
0,7852
0,8133
0,8389 1.0 0,8413
1.1 0,8643
1.2 0,8849
1.3 0,9032
1.4 0,9192 0,8438
0,8665
0,8869
0,9049
0,9207 0,8461
0,8686
0,8888
0,9066
0,9222 0,8485
0,8708
0,8907
0,9082
0,9236 0,8508
0,8729
0,8925
0,9099
0,9251 0,8531
0,8749
0,8944
0,9115
0,9265 0,8554
0,8770
0,8962
0,9131
0,9279 0,8577
0,8790
0,8980
0,9147
0,9292 0,8599
0,8810
0,8997
0,9162
0,9306 0,8621
0,8830
0,9015
0,9177
0,9319 1.5 0,9332
1.6 0,9452
1.7 0,9554
1.8 0,9641
1.9 0,9713 0,9345
0,9463
0,9564
0,9649
0,9719 0,9357
0,9474
0,9573
0,9656
0,9726 0,9370
0,9484
0,9582
0,9664
0,9732 0,9382
0,9495
0,9591
0,9671
0,9738 0,9394
0,9505
0,9599
0,9678
0,9744 0,9406
0,9515
0,9608
0,9686
0,9750 0,9418
0,9525
0,9616
0,9693
0,9756 0,9429
0,9535
0,9625
0,9699
0,9761 0,9441
0,9545
0,9633
0,9706
0,9767 2.0 0,9773
2.1 0,9821
2.2 0,9861
2.3 0,9893
2.4 0,9918 0,9778
0,9826
0,9865
0,9896
0,9920 0,9783
0,9830
0,9868
0,9898
0,9922 0,9788
0,9834
0,9871
0,9901
0,9925 0,9793
0,9838
0,9875
0,9904
0,9927 0,9798
0,9842
0,9878
0,9906
0,9929 0,9803
0,9846
0,9881
0,9909
0,9931 0,9808
0,9850
0,9884
0,9911
0,9932 0,9812
0,9854
0,9887
0,9913
0,9934 0,9817
0,9857
0,9890
0,9916
0,9936 2.5 0,9938
2.6 0,9953
2.7 0,9965
2.8 0,9974
2.9 0,9981 0,9940
0,9955
0,9966
0,9975
0,9982 0,9941
0,9956
0,9967
0,9976
0,9983 0,9943
0,9957
0,9968
0,9977
0,9983 0,9945
0,9959
0,9969
0,9977
0,9984 0,9946
0,9960
0,9970
0,9978
0,9984 0,9948
0,9961
0,9971
0,9979
0,9985 0,9949
0,9962
0,9972
0,9980
0,9985 0,9951
0,9963
0,9973
0,9980
0,9986 0,9952
0,9964
0,9974
0,9981
0,9986 3.0 0,9987
3.1 0,9990
3.2 0,9993
3.3 0,9995
3.4 0,9997 0,9987
0,9991
0,9993
0,9995
0,9997 0,9987
0,9991
0,9994
0,9996
0,9997 0,9988
0,9991
0,9994
0,9996
0,9997 0,9988
0,9992
0,9994
0,9996
0,9997 0,9989
0,9992
0,9994
0,9996
0,9997 0,9989
0,9992
0,9994
0,9996
0,9997 0,9989
0,9992
0,9995
0,9996
0,9997 0,9990
0,9993
0,9995
0,9996
0,9998 0,9990
0,9993
0,9995
0,9997
0,9998 ố ố ẩ ả ấ ủ
B ng A1 Hàm phân ph i xác su t c a phân ph i chu n F(z) = P(Z £ z) 179 3.5 0,9998
3.6 0,9998
3.7 0,9999
3.8 0,9999
3.9 1,0000 0,9998
0,9999
0,9999
0,9999
1,0000 0,9998
0,9999
0,9999
0,9999
1,0000 0,9998
0,9999
0,9999
0,9999
1,0000 0,9998
0,9999
0,9999
0,9999
1,0000 0,9998
0,9999
0,9999
0,9999
1,0000 0,9998
0,9999
0,9999
0,9999
1,0000 0,9998
0,9999
0,9999
1,0000
1,0000 0,9998
0,9999
0,9999
1,0000
1,0000 0,9998
0,9999
0,9999
1,0000
1,0000 180 ủ ố ể ầ ả ườ ẩ B ng A2 Ði m ph n trăm c a phân ph i bình th ng chu n ể ầ Ði m ph n trăm ộ
M t bên
0.00
0.25
0.52
0.84
1.28
1.64
2.05
2.33
2.58
2.88
3.09 Hai bên
0.67
0.84
1.04
1.28
1.64
1.96
2.33
2.58
2.81
3.09
3.29 Giá tr Pị
0.5
0.4
0.3
0.2
0.1
0.05
0.02
0.01
0.005
0.002
0.001 3.72 3.89 0.0001 181 ủ ố ể ả ầ B ng A3 Ði m ph n trăm c a phân ph i t 0.25 0.1 0.05 0.025 0.005 0.0025 0.001 0.0005 ộ
P m t bên
0.01 P hai bên 0.5 0.2 0.1 0.05 0.02 0.01 0.005 0.002 0.001 d.f.
d.f.=1
d.f.=2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40 1.00
0.82
0.76
0.74
0.73
0.72
0.71
0.71
0.70
0.70
0.70
0.70
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.69
0.68
0.68
0.68
0.68
0.68
0.68
0.68
0.68 3.08
1.89
1.64
1.53
1.48
1.44
1.41
1.40
1.38
1.37
1.36
1.36
1.35
1.35
1.34
1.34
1.33
1.33
1.33
1.33
1.32
1.32
1.32
1.32
1.32
1.31
1.31
1.31
1.31
1.31
1.30 6.31
2.92
2.35
2.13
2.02
1.94
1.89
1.86
1.83
1.81
1.80
1.78
1.77
1.76
1.75
1.75
1.74
1.73
1.73
1.72
1.72
1.72
1.71
1.71
1.71
1.71
1.70
1.70
1.70
1.70
1.68 12.71
4.30
3.18
2.78
2.57
2.45
2.36
2.31
2.26
2.23
2.20
2.18
2.16
2.14
2.13
2.12
2.11
2.10
2.09
2.09
2.08
2.07
2.07
2.06
2.06
2.06
2.05
2.05
2.05
2.04
2.02 31.82
6.96
4.54
3.75
3.36
3.14
3.00
2.90
2.82
2.76
2.72
2.68
2.65
2.62
2.60
2.58
2.57
2.55
2.54
2.53
2.52
2.51
2.50
2.49
2.49
2.48
2.47
2.47
2.46
2.46
2.42 63.66
9.92
5.84
4.60
4.03
3.71
3.50
3.36
3.25
3.17
3.11
3.05
3.01
2.98
2.95
2.92
2.90
2.88
2.86
2.85
2.83
2.82
2.81
2.80
2.79
2.78
2.77
2.76
2.76
2.75
2.70 127.32
14.09
7.45
5.60
4.77
4.32
4.03
3.83
3.69
3.58
3.50
3.43
3.37
3.33
3.29
3.25
3.22
3.20
3.17
3.15
3.14
3.12
3.10
3.09
3.08
3.07
3.06
3.05
3.04
3.03
2.97 318.29
22.33
10.21
7.17
5.89
5.21
4.79
4.50
4.30
4.14
4.02
3.93
3.85
3.79
3.73
3.69
3.65
3.61
3.58
3.55
3.53
3.50
3.48
3.47
3.45
3.43
3.42
3.41
3.40
3.39
3.31 636.58
31.60
12.92
8.61
6.87
5.96
5.41
5.04
4.78
4.59
4.44
4.32
4.22
4.14
4.07
4.01
3.97
3.92
3.88
3.85
3.82
3.79
3.77
3.75
3.73
3.71
3.69
3.67
3.66
3.65
3.55 182 60
120
vô c c†ự 0.68
0.68
0.67 1.30
1.29
1.28 1.67
1.66
1.64 2.00
1.98
1.96 2.39
2.36
2.33 2.66
2.62
2.58 2.91
2.86
2.81 3.23
3.16
3.09 3.46
3.37
3.29 ị ủ ố ở ự ộ ự ị ủ ẩ ố vô c c đ t do chính là giá tr c a phân ph i chu n bình ườ †Giá tr c a phân ph i t
th ng. 183 ả ủ ể ầ ố ươ ể ộ c dùng trong phân ng sai, đ
ị ươ ể ị d.f.1 1 2 3 4 5 6 8 9 10 20 40 60 120 vô c cự 7 d.f.2 P 0.05 161 199 216 225 230 234 239 241 242 248 251 252 253 254 237 1 0.025 648 799 864 900 922 937 957 963 969 993 1006 1010 1014 1018 948 1 0.01 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6209 6286 6313 6340 6366 1 0.005 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24837 25146 25254 25358 25466 1 0.05 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.45 19.47 19.48 19.49 19.50 2 0.025 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.45 39.47 39.48 39.49 39.50 2 0.01 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99.39 99.40 99.45 99.48 99.48 99.49 99.50 2 0.05 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.66 8.59 8.57 8.55 8.53 3 0.025 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.17 14.04 13.99 13.95 13.90 3 0.01 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 26.69 26.41 26.32 26.22 26.13 3 0.005 55.55 49.80 47.47 46.20 45.39 44.84 44.43 44.13 43.88 43.68 42.78 42.31 42.15 41.99 41.83 3 0.05 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.80 5.72 5.69 5.66 5.63 4 0.025 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.56 8.41 8.36 8.31 8.26 4 0.01 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.02 13.75 13.65 13.56 13.46 4 0.005 31.33 26.28 24.26 23.15 22.46 21.98 21.62 21.35 21.14 20.97 20.17 19.75 19.61 19.47 19.32 4 0.001 74.13 61.25 56.17 53.43 51.72 50.52 49.65 49.00 48.47 48.05 46.10 45.08 44.75 44.40 44.05 4 0.05 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.56 4.46 4.43 4.40 4.37 5 0.025 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.33 6.18 6.12 6.07 6.02 5 0.01 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.55 9.29 9.20 9.11 9.02 5 0.005 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 12.90 12.53 12.40 12.27 12.14 5 0.001 47.18 37.12 33.20 31.08 29.75 28.83 28.17 27.65 27.24 26.91 25.39 24.60 24.33 24.06 23.79 5 0.05 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 3.87 3.77 3.74 3.70 3.67 6 0.025 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.17 5.01 4.96 4.90 4.85 6 0.01 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.40 7.14 7.06 6.97 6.88 6 0.005 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 9.59 9.24 9.12 9.00 8.88 6 0.001 35.51 27.00 23.71 21.92 20.80 20.03 19.46 19.03 18.69 18.41 17.12 16.44 16.21 15.98 15.75 6 0.05 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.44 3.34 3.30 3.27 3.23 7 0.025 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.47 4.31 4.25 4.20 4.14 7 ượ
ng sai. Tính ki m đ nh hai bên b ng cách nhân đôi giá tr P
ủ ử ố ằ
ẫ ố ủ B ng A4 Ði m ph n trăm c a phân ph i F
ị
ể
ả
Các b ng trình bày ki m đ nh m t bên đ so sánh 2 ph
tích ph
d.f.1= d.f. c a t s ; d.f.2 = d.f. c a m u s 184 d.f.1 1 2 3 4 5 6 7 8 9 10 20 40 60 120 vô c cự d.f.2 P 7 0.01 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.16 5.91 5.82 5.74 5.65 7 0.005 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 7.75 7.42 7.31 7.19 7.08 7 0.001 29.25 21.69 18.77 17.20 16.21 15.52 15.02 14.63 14.33 14.08 12.93 12.33 12.12 11.91 11.70 8 0.05 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.15 3.04 3.01 2.97 2.93 8 0.025 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.00 3.84 3.78 3.73 3.67 8 0.01 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.36 5.12 5.03 4.95 4.86 8 0.005 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 6.61 6.29 6.18 6.06 5.95 8 0.001 25.41 18.49 15.83 14.39 13.48 12.86 12.40 12.05 11.77 11.54 10.48 9.92 9.73 9.53 9.33 9 0.05 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 2.94 2.83 2.79 2.75 2.71 9 0.025 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.67 3.51 3.45 3.39 3.33 9 0.01 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 4.81 4.57 4.48 4.40 4.31 9 0.005 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 5.83 5.52 5.41 5.30 5.19 9 0.001 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11 9.89 8.90 8.37 8.19 8.00 7.81 10 0.05 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.77 2.66 2.62 2.58 2.54 10 0.025 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.42 3.26 3.20 3.14 3.08 10 0.01 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.41 4.17 4.08 4.00 3.91 10 0.005 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.27 4.97 4.86 4.75 4.64 10 0.001 21.04 14.90 12.55 11.28 10.48 9.93 9.52 9.20 8.96 8.75 7.80 7.30 7.12 6.94 6.76 12 0.05 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.54 2.43 2.38 2.34 2.30 12 0.025 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.07 2.91 2.85 2.79 2.72 12 0.01 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 3.86 3.62 3.54 3.45 3.36 12 0.005 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.53 4.23 4.12 4.01 3.90 12 0.001 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48 7.29 6.40 5.93 5.76 5.59 5.42 14 0.05 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.39 2.27 2.22 2.18 2.13 14 0.025 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 2.84 2.67 2.61 2.55 2.49 14 0.01 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.51 3.27 3.18 3.09 3.00 14 0.005 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60 4.06 3.76 3.66 3.55 3.44 14 0.001 17.14 11.78 9.73 8.62 7.92 7.44 7.08 6.80 6.58 6.40 5.56 5.10 4.94 4.77 4.60 16 0.05 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.28 2.15 2.11 2.06 2.01 16 0.025 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.68 2.51 2.45 2.38 2.32 16 0.01 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.26 3.02 2.93 2.84 2.75 16 0.005 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 3.73 3.44 3.33 3.22 3.11 16 0.001 16.12 10.97 9.01 7.94 7.27 6.80 6.46 6.20 5.98 5.81 4.99 4.54 4.39 4.23 4.06 185 d.f.1 1 2 3 4 5 6 7 8 9 10 20 40 60 120 vô c cự d.f.2 P 18 0.05 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.19 2.06 2.02 1.97 1.92 18 0.025 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.56 2.38 2.32 2.26 2.19 18 0.01 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.08 2.84 2.75 2.66 2.57 18 0.005 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.03 3.50 3.20 3.10 2.99 2.87 18 0.001 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56 5.39 4.59 4.15 4.00 3.84 3.67 20 0.05 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.12 1.99 1.95 1.90 1.84 20 0.025 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.46 2.29 2.22 2.16 2.09 20 0.01 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 2.94 2.69 2.61 2.52 2.42 20 0.005 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.32 3.02 2.92 2.81 2.69 20 0.001 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24 5.08 4.29 3.86 3.70 3.54 3.38 25 0.05 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.01 1.87 1.82 1.77 1.71 25 0.025 5.69 4.29 3.69 3.35 3.13 2.97 2.85 2.75 2.68 2.61 2.30 2.12 2.05 1.98 1.91 25 0.01 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.70 2.45 2.36 2.27 2.17 25 0.005 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64 3.54 3.01 2.72 2.61 2.50 2.38 25 0.001 13.88 9.22 7.45 6.49 5.89 5.46 5.15 4.91 4.71 4.56 3.79 3.37 3.22 3.06 2.89 30 0.05 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 1.93 1.79 1.74 1.68 1.62 30 0.025 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.20 2.01 1.94 1.87 1.79 30 0.01 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.55 2.30 2.21 2.11 2.01 30 0.005 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34 2.82 2.52 2.42 2.30 2.18 30 0.001 13.29 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39 4.24 3.49 3.07 2.92 2.76 2.59 40 0.05 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 1.84 1.69 1.64 1.58 1.51 40 0.025 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.07 1.88 1.80 1.72 1.64 40 0.01 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.37 2.11 2.02 1.92 1.80 40 0.005 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12 2.60 2.30 2.18 2.06 1.93 40 0.001 12.61 8.25 6.59 5.70 5.13 4.73 4.44 4.21 4.02 3.87 3.15 2.73 2.57 2.41 2.23 60 0.05 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.75 1.59 1.53 1.47 1.39 60 0.025 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 1.94 1.74 1.67 1.58 1.48 60 0.01 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.20 1.94 1.84 1.73 1.60 60 0.005 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90 2.39 2.08 1.96 1.83 1.69 60 0.001 11.97 7.77 6.17 5.31 4.76 4.37 4.09 3.86 3.69 3.54 2.83 2.41 2.25 2.08 1.89 120 0.05 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.66 1.50 1.43 1.35 1.25 120 0.025 5.15 3.80 3.23 2.89 2.67 2.52 2.39 2.30 2.22 2.16 1.82 1.61 1.53 1.43 1.31 186 d.f.1 1 2 3 4 5 6 7 8 9 10 20 40 60 120 vô c cự d.f.2 P 120 0.01 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.03 1.76 1.66 1.53 1.38 120 0.005 8.18 5.54 4.50 3.92 3.55 3.28 3.09 2.93 2.81 2.71 2.19 1.87 1.75 1.61 1.43 120 0.001 11.38 7.32 5.78 4.95 4.42 4.04 3.77 3.55 3.38 3.24 2.53 2.11 1.95 1.77 1.54 vc 0.05 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.57 1.39 1.32 1.22 1.00 vc 0.025 5.02 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05 1.71 1.48 1.39 1.27 1.00 vc 0.01 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 1.88 1.59 1.47 1.32 1.00 vc 0.005 7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.74 2.62 2.52 2.00 1.67 1.53 1.36 1.01 vc 0.001 10.83 6.91 5.42 4.62 4.10 3.74 3.47 3.27 3.10 2.96 2.27 1.84 1.66 1.45 1.01 187 2 ầ ả ể ủ Giá tr Pị d.f. 0.5 0.25 0.05 0.1 0.025 0.01 0.005 0.001 0.45 1.32 3.84 2.71 5.02 6.63 7.88 10.83 1 1.39 2.77 5.99 4.61 7.38 9.21 10.60 13.82 2 2.37 4.11 7.81 6.25 9.35 11.34 12.84 16.27 3 3.36 5.39 9.49 7.78 11.14 13.28 14.86 18.47 4 4.35 6.63 11.07 9.24 12.83 15.09 16.75 20.51 5 5.35 7.84 12.59 10.64 14.45 16.81 18.55 22.46 6 6.35 9.04 14.07 12.02 16.01 18.48 20.28 24.32 7 7.34 10.22 15.51 13.36 17.53 20.09 21.95 26.12 8 8.34 11.39 16.92 14.68 19.02 21.67 23.59 27.88 9 99.33 109.14 118.50 124.34 129.56 135.81 140.17 149.45 100 ỉ ệ ể ị ướ ể ể ị (ki m đ nh
ầ
ể
ị ệ ể ặ ộ ơ ố c
B ng A5 Ði m ph n trăm c a phân ph i
· 2 hay c 2 Mantel Haenzel) hay trong
c 2 b ng 2
ả
d.f.=1 khi so sánh hai t l
ị
ể
ủ
ng, đi m ph n trăm c a ki m đ nh 2 đuôi. Có th làm ki m đ nh
đánh giá khuynh h
ộ
m t đuôi b ng cách chia đôi giá tr P (không th dùng khái ni m m t ho c hai đuôi cho
ộ ự
đ t ằ
ớ
do l n h n) 34735 78219 18131 92594 94235 11721 53806 52733 19665 26574 05728 81270 81641
35621 57344 02606 21961 07539 71006 51935 83322 29423 27142 85686 44342 09145
78629 40478 63628 13640 82315 41919 90964 82448 48074 41423 40836 79588 64174
08462 33570 21715 90409 33199 71764 56738 50619 59743 76495 81334 12020 73947
24014 71381 58732 29417 32050 89880 61392 61573 33128 62969 40939 89200 60756
37124 23597 73007 26705 94330 45206 74130 55905 66409 06851 10401 77370 79931
92775 68533 86784 28870 61590 99165 31797 03780 47408 29291 88999 81583 54406
26426 54602 71259 56747 36957 82629 23159 70407 88383 47691 95014 60902 46232
21487 46012 10948 49446 32178 50727 30892 19248 56504 72663 45070 55686 14624
17745 94929 23861 66784 15825 39009 50060 67336 31511 52316 25839 92967 57622
30495 18694 23722 03685 19700 96192 00151 08091 84548 27850 38503 66775 20398
32372 52818 46875 87319 85180 75405 74269 19501 48521 51843 72300 84055 29993
75451 26763 60571 94992 38611 28142 47473 55362 35318 85379 35938 73876 63602
11762 41680 66807 37812 79865 79427 41731 68471 81021 64385 51734 10187 71142
83884 49794 55501 97110 45306 77600 40130 45029 52682 14441 47791 80935 84251
14269 65406 78705 90654 43192 14170 85702 09650 02333 54434 27017 56578 75149
36343 48319 66650 94373 62872 93369 06342 13734 06577 61311 66067 65470 06779
15496 11053 73309 95443 76374 91922 87184 64769 20045 00059 09817 41361 33022
85104 28594 44846 60598 60749 44268 80423 58992 86707 39003 74184 84599 76744
79670 63423 00315 14875 11492 85727 52774 15725 61539 26867 88297 89560 91783
01898 64946 58151 25072 60705 10247 61850 54819 03372 27480 02607 31817 04231
44069 23863 80350 41791 51294 85320 50969 88518 65089 74666 22634 16628 26606
63055 89602 08803 81492 62758 76960 50273 52443 65284 26315 65822 66697 61693 ố ẫ ả B ng A6. S ng u nhiên 188 83321 19962 73527 34635 78648 28633 32031 01370 76576 08634 16212 44914 31187
77054 69898 92184 66259 60345 77074 68009 45901 15502 11268 87119 23661 95880
69907 87164 66650 93954 44440 69031 77532 68923 16217 66085 50724 82314 30987
90287 37202 91124 50480 94422 48102 32066 47136 53534 51891 48612 45191 47777
87558 35054 94824 89447 82164 60059 61863 79891 34078 46344 66598 81489 30743
01580 47873 85392 57121 13681 84955 71158 70995 72485 54632 67880 73891 05757
04455 74718 28303 90358 27153 95274 14366 13901 50283 70153 95076 66796 25177
52083 34394 08739 49470 66296 14183 20924 25128 04890 84576 47494 66048 84214
46752 74230 42172 94075 34968 45259 17032 93902 37647 89517 70775 03838 18491
56551 15908 58391 82674 70615 37303 81149 91201 08470 30825 54441 94465 63508
12880 25154 61576 61751 81850 76738 73447 45267 97964 33313 89353 60036 36412
32612 04635 48102 38869 56136 42105 43699 90397 11968 28889 42463 58364 19592
67080 19279 63450 66826 19313 03230 48711 16457 53530 40581 67423 82437 41400 189ớ ọ
ẩ ủ
ố ủ
ượ
ọ
ẻ
ẻ
ầ
ố ồ
ộ ệ
ướ
ươ
ẩ
Hình 3. Phân ph i c a ph n trăm so v i tr ng l
H ng D ng 15, Q11, Thành ph H Chí Minh (trung bình=92, đ l ch chu n =10)
T uổi lập g ia đìn h ở p hụ nữ
1 5
ổi
u
T
T ần s uất
T uổi lập g ia đìn h
m
ă
r
t
h
P
ần
T uổi
30%
13%
10%
9%
ệ
ả
ậ
ỉ
Hình 4. Tỉ l
ưỡ ở
ng
Hình 5. Biểu đồ minh hoạ mối liên quan giữa sai lầm loại 1, sai lầm loai 2, cỡ mẫu và
khoảng cách giữa Ho - Ha. Đường phân phối màu đậm bên trái thể hiện giả thuyết Ho,
đường màu nhạt bên phải thể hiện giả thuyết Ha. Vùng diện tích màu đậm là xác suất sai
lầm loại 1 và vùng diện tích màu nhạt thể hiện xác suất sai lầm loại 2. Chúng ta có thể nhận
xét với cùng cỡ mẫu, nguy cơ sai lầm loại 2 càng tăng nếu Ha càng gần Ho. Cần phải tăng
cỡ mẫu để phân biệt được Ha và Ho (giảm nguy cơ sai lầm loại 2) khi Ha gần Ho
ố
x
(
62,2
t
326,0
38,0
1165
,0
s
(
)
54,0
24,2
1
42
1
44
x
1
1
n
1
)
1
n
2
Bảng 4. Sự liên hệ giữa ăn thịt trong thời gian gần đầu và viêm ruột hoại tử ở Papua New
Guinea (OR=11,6)
ạ
ưỡ
ủ
ạ
ế
ủ
ẻ
(OR=11,6)
ả
ươ
ự
ộ
ệ
ồ
ữ
ộ
ệ
ề
ng sai m t chi u: s khác bi
ồ
ố ệ ừ
ề
ị
B ng 7. Phân tích ph
ầ
ạ ệ
nhân b các lo i b nh h ng c u li m khác nhau. S li u t
Journal, 282, 2836
ứ
ớ
ưở
ủ
ủ
ỗ
ộ
ệ
ự
ả
B ng 8. S khác bi
ự
ồ
g m 5 đ c và 5 cái).
ớ ộ ệ
ẩ ở
ọ
ỗ
ặ
ụ ữ ượ ướ
ươ
ủ
ổ
ố
ằ
c tính b ng 5 ph
ạ
ố ệ
ớ ề
ị ằ
ứ
ả
ả ử
ư
ệ
ệ
2 c a Yates đ hi u ch nh tính liên t c
ụ
ệ ổ
ự
ả
ả
ồ ướ
ả
ượ ử ụ
ở
ở
ồ ướ
ượ ử ụ
ở
ở
ọ
ả
B ng 14. So sánh các ngu n n
tr )ị
ả
ỉ ệ ệ
ễ
ề
ệ
ệ ữ
ộ
ị
ầ
Guinea (OR=11,6)
3.5
3.3
3.1
2.9
2.7
2.5
55
60
65
70
75
Hình 9.1 Phân tán đồ của thể tích huyết tương và trọng lượng cơ thể cùng với đường hồi
quy tuyến tính
Hình 9.2 phân tán đồ minh họa các giá trị khác nhau của hê số tương quan. Trong đây cũng
có các đường hồi quy.
Hình 9.3 Giao điểm và độ dốc của phương trình hồi quy y = a + bx. Giao điểm a là điểm mà
đường thẳng cắt trục y và cho giá trị y ở x = 0. Ðộ dốc b là mức tăng của y tương ứng với
sự gia tăng một đơn vị của x.
3.5
3.3
3.1
2.9
2.7
2.5
55
60
65
70
75
Hình 9.4 Ðường thẳng hồi quy tuyến tính, y = a + bx, được làm phù hợp bằng bình phương
tối thiểu, a và b được tính để cực tiểu hóa tổng bình phương của các độ lệch thẳng đứng
(vẽ bằng các đường thẳng đứng) của các điểm đối với đường thẳng, mỗi độ lệch bằng hiệu
số giữa số y quan sát và tiểm tương ứng trên đường thẳng a + bx
y
y
ay
bx
(
)
(
)
s
n
2
2
ượ
n
ẩ ủ ồ
Sai s chu n c a h i quy còn đ
d
s
n
/
ấ ủ
Ố
Ọ
Ả
Ề
Đ THI B MÔN H C: TH NG KÊ CĂN B N
Ớ
Ộ
Ọ
Ế
L P: CAO H C, CK1 Y T CÔNG C NG
Ọ
NĂM H C: 20032004
Ọ
Ố
Ả
Ề
ĐÁP ÁN Đ THI B MÔN H C: TH NG KÊ CĂN B N
Ớ
Ộ
Ọ
Ế
L P: CAO H C, CK1 Y T CÔNG C NG
Ọ
NĂM H C: 20032004

