NGUYÊN LÍ KIỂM ĐỊNH
ả
ượ ự ậ ị
ệ ữ ầ ể ầ ạ ả ạ ầ Mục tiêu: ủ ề ọ Sau khi nghiên ch đ , h c viên có kh năng: Trình bày đ ệ ượ t đ Phân bi c s liên h gi a ki m đ nh ý nghĩa và kho ng tin c y ạ c 2 lo i sai l m: sai l m lo i I và sai l m lo i II
ủ ể ể ị ấ ọ ư ậ ể ị ọ ỉ ụ ứ ộ
ế ế
ạ Lo i thi
ứ t k nghiên c u
ề
ị
ữ
Liên hệ gi a hai bi n sế ố
ế ố
ủ
Thang đo c a bi n s
Hai nhóm ị ồ ề đi u tr g m các cá nhân khác nhau
ề Nhi u đi u tr trên cùng các đ iố ngượ t
Ba (hay nhiêù) nhóm đi uề ị ồ tr g m các cá nhân khác nhau
ướ Tr c và sau m tộ ị đi u trề (ho c 2ặ ị ở ề đi u tr ) trên cùng các đ iố ngượ t
ượ
ươ
ttest không ắ ặ b t c p
Phân tích ng sai ph
ttest b tắ c pặ
ồ H i quy ế tuy n tính ngươ và t
ừ ẫ ng (m u rút t có phân ườ ng và ng sai hai nhóm
Phân tích ươ ng sai ph ngườ đo l ậ ạ l p l i
ị Ð nh l ố ộ m t dân s ố ph i bình th ươ ph ấ ồ đ ng nh t
quan pearson
ị
ị
Ð nh tính Danh đ nh
test McNemar
Cochrance Q
c 2 b ng 2 x ả n
c 2 b ng 3 x ả n
ệ ố ủ H s c a ả b ng n x m (phi, OR, RR)
ị
Friedman
t
Kruskal Wallis
ượ ng
h sệ ố ươ ng quan Spearman
ứ ự Ð nh tính Th t ị ế (hay bi n đ nh l ườ ng) không bình th
ị ể Ki m đ nh ạ ắ s p h ng có d uấ Wilcoxon
ể ị Ki m đ nh ắ ổ t ng s p h ngạ Mann Whitney
1. Chọn lựa kiểm định phù hợp ế ư ả ị thuy t là nh nhau). Các Nh v y nguyên lí c a ki m đ nh ý nghĩa (hay ki m đ nh gi ừ ả ệ ự ệ ự ế ki m đ nh ch khác nhau vi c l a ch n th ng kê xu t phát t 0. Vi c l a thuy t H gi ế ế ủ ế ố ủ ấ t k c a nghiên c u. ch n này ph thu c vào bi n s c a v n đ quan tâm và thi ể ố ề ợ ọ ự ả ị B ng 10. Ch n l a ki m đ nh phù h p
ề ể ng v ki m đ nh ý nghĩa (significance testing) đ c kh i x ở ướ ả ượ ớ ị ố ố ưở ở ệ ỉ ệ ố ộ ả ử s chúng ta mu n đánh giá xem m t lo i thu c m i có c i thi n t l ế ơ ị ồ ượ ề ị ớ ươ ươ ạ ộ ố ớ ộ 2. Kiểm định ý nghĩa; Kiểm định giả thuyết ng b i R A Fisher. Ý t ạ s ng còn 1 Gi ứ năm sau khi b nh i máu c tim hay không. Chúng ta ti n hành m t nghiên c u các ề ượ ệ c đi u b nh nhân đ cđi u tr v i m t lo i thu c m i và m t nhóm t ộ ng đ ng đ
ử ớ ư ề ộ ế ệ ằ ị ằ ả c và phát hi n r ng t ề ơ ầ ấ ế ấ ự ố ị ớ ả ứ ẹ ằ ề ỉ ệ ử t ỏ t 2 l n v t l ố
ệ ỉ ệ ố s ng còn. ườ ả ượ d ớ ộ ế ị ự ự ấ ằ ứ ứ ạ i gi ế ị ụ ỉ ố ế ng s c m nh c a ch ng c ch ng l ố ớ ố ỉ ệ ố ủ ộ ả thuy t là thu c không tác đ ng gì lên t l ứ ẩ ể ế ộ ế ượ ả ặ thuy t đ i gi ể ắ ắ ạ ộ i 0,02 nó ch ra m t cách m nh m r ng gi ờ ả ả thuy t không th ế ể ả ẽ ng xuyên b l c l ộ
ộ ề ứ ề ị ỏ ả ể ế i giá tr p thu c v nhà nghiên c u. Thí d thuy t không mà d n t ụ ẫ ớ i ị ế ị ự ỉ ằ ị ớ tr v i gi vong trong nhóm đi u tr v i thu c m i ch b ng ộ ử m t n a so v i nhóm đi u tr b ng placebo. Đây là m t k t qu h a h n nh ng có khi ị ỉ ch là m t k t qu do c may? Chúng ta hãy xem xét câu h i này b ng cách tính giá tr ư vong n u nh p. Giá tr p chính là xác su t có ít nh t s khác bi ộ thu c th c s không có tác đ ng gì lên t l ả ạ ộ Fisher th y r ng giá tr p là m t ch s đo l s ng còn). thuy t Ho (trong thí d này, gi ử ụ ậ ằ ổ Ông ta c vũ s d ng P < 0.05 (5% ý nghĩa) làm m c tiêu chu n đ k t lu n r ng có ớ ố ắ ệ ố ạ ằ c ki m đinh, m c dù không có m t quy t c tuy t đ i b ng c ch ng l ể ế ượ ữ ằ c thuy t đ “N u p n m gi a 0,1 và 0,9 ch c ch n không có lí do gì đ nghi ng gi ể ế ẽ ằ ỉ ướ ế ki m đinh. N u nó d ự ế ự ệ ị ạ ố ế ườ ượ i thích đ . Chúng ta s không th c cho s ki n th c t gi i n u ướ ở ưỡ ọ 0,05” c chúng ta ch n m t ng ng quy ả ệ ọ ằ Đi u quan tr ng, Fisher cho r ng vi c lí gi ẫ ớ ả giá tr p kho ng 0,05 d n t i không th tin hay bác b gi ệ ộ quy t đ nh m t th c nghi m khác.
Không
(cid:219)
N uế A (cid:222) B {P( B ) thấ p (cid:222) P(A) thấ p}
(cid:222)
(cid:219)
(cid:222)
{ Ho Tkê S } {P( Tkê S ) < ngư ngỡ bác bỏ Ho}
ấ ề ủ i ch quan c a Fisher, Neyman và Pearson đ xu t cách ti p c n đ ế ế ậ ủ ể thuy t” (hypothesis tests) và thay th cho quan đi m ch quan v ố ớ ạ ả ạ ế ế i gi ứ ế ị ế ầ ằ ạ ả ế ả ủ ế ệ ế ấ ầ thuy t không n u gi ầ ế ạ ế ị ớ ề ế ế ả thuy t không (và không ch u dùng đi u tr m i) trong khi gi thuy t th c s ả ằ ạ ạ ố ắ ả ế ế ả c h n ch . Đi u này không ph i là xa l i k t qu s đ ị ơ ặ ả ẽ ượ ạ ứ ỡ ẫ ể ế ả ị ượ ủ ả c thích cách lí gi ề ả ị ể ọ g i là “ki m đ nh gi ậ ằ ị ứ ủ s c m nh c a giá tr p làm ch ng c ch ng l thuy t không b ng cách ti p c n ạ ự khách quan d a vào cây quy t đ nh. Neyman và Pearson cho r ng có hai lo i sai l m có ự ậ ả ể ủ th ph m ph i trong khi lí gi i k t qu c a th c nghi m. Cách ti p c n c a Fisher ế ả ỏ ả ộ ạ ậ t p trung vào sai l m lo i m t: xác su t bác b gi thuy t không ự ấ ấ th c ra là đúng. Neyman và Pearson cũng quan tâm đ n sai l m lo i II: xác su t ch p ự ự ậ nh n gi ả ắ ầ ầ là sai. B ng cách s p đ t các nguy c sai l m lo i I và lo i II, s các sai l m m c ph i ừ ạ ớ ề trong khi lí gi v i ai đã t ng tính c m u cho các nghiên c u có ki m đ nh gi thuy t.
ể ử ụ ế ậ ế ỉ ả ỉ ượ ố ể ể ế ả ố Đ s d ng cách ti p c n NeymanPearson chúng ta ph i ch rõ đ i thuy t (alternative ố ơ c phát bi u đ n gi n: “thu c hypothesis). Nói cách khác đ i thuy t không th ch đ
ỉ ớ ả ơ ử ố ả ơ ử ứ vong” mà ph i ch rõ nguy c t ơ ử ằ ớ ế ị ầ ự ứ ề ệ ả ề ự vong 60%” Nhà nghiên c u có quy n t ể ụ ể ố ế ầ ả ượ c th c hi n tr ự ạ ế ắ
i k t qu nghiên c u t ấ c l ủ ủ ị ả vong gi m bao nhiêu: m i làm gi m nguy c t ọ do ch n quy “thu c m i làm gi m nguy c t ơ ạ ắ t c quy t đ nh b ng cách phát bi u c th đ i thuy t, nguy c sai l m lo i I, và nguy ướ ư ơ c khi nghiên c u. Do đó c sai l m lo i II, nh ng đi u này ph i đ ế ậ ộ ủ trong cách ti p c n c a NeymanPearson chúng ta xây d ng m t nguyên t c ra quy t ế ả ứ ừ ướ ả ế ể ị ứ ệ c khi ti n hành nghiên c u và vi c phân tr đ nh đ giúp lí gi ượ ạ ớ ậ ế ả ỏ ả ỉ ơ i v i cách tích ch đ n gi n là bác b hay ch p nh n gi thuy t không và, ng ộ ừ ả ố ắ ậ ế i giá tr p trong t ng m t nghiên ti p c n ch quan c a Fisher, không c g ng lí gi ứ ụ ể c u c th .
Phaùt bieån H
0 ; H
a
Tính soá thoáng keâ (z; t; chi
2 ; F)
Khoâng nhoû
Khoâng nhoû
Xaùc suaát sai laàm loaïi 1
Xaùc suaát sai laàm loaïi 2
tra baûng tính p
Thöïc hieän nghieân cöùu vôùi côõ maãu lôùn hôn
Nhoû
Nhoû
Baùc boû giaû thuyeát
Chaáp nhaän giaû thuyeát
ế ưở ứ ạ ậ ằ ơ ể i không tìm hi u rõ ràng ý t ả thuy t không s đ ế ế ầ ả ơ ế ậ ủ ế ậ ủ ự ư ươ ử ụ ề ng và s d ng Đi u đáng ti c các nhà nghiên c u l ỏ ẽ ượ ấ ủ ầ ế ph n thô s nh t c a cách ti p c n này cho r ng gi c bác b ầ ậ ề ạ ớ ế ẫ n u p< 0,05 (v i nguy c sai l m lo i 1 là 5%). Đi u này d n đ n c m nh n sai l m nh cách ti p c n c a Fisher. ng t là cách ti p c n c a NeymanPearson t
ả ỏ ả thuy t Ho là đúng.
ạ ạ ầ ầ ế thuy t Ho sai. thuy t Ho trong khi gi
ờ ứ ố ế ậ ể ị ườ ế ậ thuy t Ho, ng ầ ắ ứ ứ ạ ớ ộ ứ ạ ể ị ằ ề ể ộ ị ế ả ể ắ có th ch c ch n. Do v y, khi nhà ầ i nghiên c u có th b sai l m ỏ ả ớ ộ ầ 0, nhà nghiên c u cũng có th b sai l m (sai l m lo i hai cũng v i m t xác ể i ta có th xác đ nh ườ ấ ư ể ầ ầ ố ượ ộ c xác su t sai l m lo i m t nh ng không th tính đ ị c xác su t sai l m lo i hai.
ạ ố ủ ệ ể ạ ử ụ ố ầ ị ệ ấ ầ ạ ượ 3. Sai lầm loại một và sai lầm loại hai ế ộ thuy t Ho trong khi gi Sai l m lo i m t: bác b gi ế ỏ ả Sai l m lo i hai: Không bác b gi ườ ứ i ta không bao gi Trong nghiên c u th ng kê ng ế ỏ ả nghiên c u đi đ n k t lu n bác b gi ấ ộ (sai l m lo i m t v i m t xác su t nào đó). Khi nhà nghiên c u không bác b gi thuy t Hế ớ ấ su t nào đó). M t đi u nên nh là b ng ki m đ nh th ng kê ng ấ ượ đ ườ ự i ta còn s d ng khái ni m năng l c (power) c a ki m đ nh th ng kê. Ðôi khi ng ự ủ ự ể Năng l c c a ki m đ nh th ng kê = 1 xác su t sai l m lo i 2. Khái ni m năng l c ỡ ẫ ố ủ c a th ng kê hay đ ị c dùng trong tính c m u.
Hình 5. Biểu đồ minh hoạ mối liên quan giữa sai lầm loại 1, sai lầm loai 2, cỡ mẫu và khoảng cách giữa Ho - Ha. Đường phân phối màu đậm bên trái thể hiện giả thuyết Ho, đường màu nhạt bên phải thể hiện giả thuyết Ha. Vùng diện tích màu đậm là xác suất sai lầm loại 1 và vùng diện tích màu nhạt thể hiện xác suất sai lầm loại 2. Chúng ta có thể nhận xét với cùng cỡ mẫu, nguy cơ sai lầm loại 2 càng tăng nếu Ha càng gần Ho. Cần phải tăng cỡ mẫu để phân biệt được Ha và Ho (giảm nguy cơ sai lầm loại 2) khi Ha gần Ho
ộ ố ả ử ệ ỉ ệ ố ả ạ ố ớ ị s chúng ta mu n đánh giá m t lo i thu c m i có c i thi n t l ằ ử ồ ẽ ự ỉ ố ng t s nguy c – nguy c ề ề ơ ử ệ ơ ử ố ớ ơ vong vong 50%, n u t s ế ỉ ố ố ị ớ ố ụ ứ ơ
4. So sánh các tiếp cận cổ điển (chủ nghĩa tần suất) và Bayes trong suy luận thống kê ộ Gi s ng còn m t ơ ệ ứ ộ năm sau khi b nh i máu c tim b ng m t th nghi m lâm sàng có nhóm ch ng ơ ệ ướ ượ ằ placebo. Chúng ta s th c hi n đi u này b ng cách c l ử ở ớ ượ nhóm c đi u tr v i thu c m i chia cho nguy c t t vong trong b nh nhân đ ế ỉ ố ả ơ ố đ i ch ng. N u t s nguy c là 0,5, thu c m i gi m nguy c t ớ nguy c là 1 thì thu c m i không có tác d ng. ủ ố ầ ấ
ố ệ
ậ ừ
ể
giá tr c a t
ị ủ ỉ
Th ng kê t n su t ch nghĩa ẵ ự
ố
ơ ở
Cho r ng chân lí đã có s n. Chúng ta s d ng s li u đ suy lu n t ư
ế
t)
ử ụ ư dân s có th c (nh ng ch a bi ả ậ
ủ ỉ ố ả
ị ợ ữ
ứ
ệ
ậ
ự ị ủ
ứ
ố
ự
ị
ỏ ơ ỉ ố hay nh h n t s nguy c
ng t
ơ
ằ ố s nguy c ố ơ ả Kho ng tin c y 95% cho chúng ta kho ng giá tr h p lí c a t s nguy c dân s ; ượ ẽ ầ Chúng ta th c hi n nghiên c u 100 l n thì 95% nh ng kho ng tin c y tính đ c s ch a giá tr c a dân s ấ Giá tr p là xác su t có đ ế ệ
ượ ỉ ố c t s nguy c t ế ả
ơ ươ thuy t Ho là đúng.
chúng ta đã phát hi n n u gi
ố
Th ng kê Bayes
ủ
ủ
ớ
ườ Ng ể
ắ ầ ấ
ề ỉ ố
ể ệ
ố
ơ
ể ề
ố ệ
ế
ẽ
ố
i theo ch nghĩa Bayes có cách ti p c n ch quan. Chúng ta b t đ u v i quan ẽ ấ ủ ỉ
ẵ
ố
ế ậ đi m chúng ta v t s nguy c và th hi n nó theo phân ph i xác su t Chúng ta s ỉ dùng s li u đ đi u ch nh ý ki n đó (chúng tá s rút ra phân ph i xác su t c a t ố ệ ố s nguy c d a trên s li u và phân ph i có s n)
ơ ự ưở
ả
ơ
ả Kho ng tin t
ứ ỉ
ệ
ể
ị
ấ ề ỉ ố
ẳ c dùng đ rút ra các kh ng đ nh xác su t v t s vong
ệ
ơ ự ươ Có s t
ng t
ự ư
ị
nh (1 đ
ẩ ng t ả
ế
ỏ
ng 95% (95% credible interval) là kho ng có 95% c may có ch a t ơ ố ố s nguy c dân s . ể ượ ố ậ Phân ph i h u nghi m có th đ ụ ố ấ ơ ử nguy c – thí d , xác su t thu c làm tăng nguy c t ệ ử ụ ố ự ữ gi a th ng kê Bayes và vi c s d ng test trong ch n đoán b nh, ư ộ ộ ươ ạ ủ nh đ nh y, giá tr p t ế ươ ng t ng. Khi đó n u k t qu là bác b Ho, ố ệ
ủ
ệ
ề
ươ ể ị trong đó power c a ki m đ nh t ự ư ỉ ố ộ ươ chuyên) và t nh t s đ kh dĩ d ậ ố s chênh h u nghi m c a m nh đ b ng s chênh ti n nghi m x
ế
ề
ổ ể ươ
ư
ự
ế
ậ
ậ
ự ng t ả ề ằ ệ ế
ng t
ệ ả ị ề ả ủ ế nh cách ti p c n c a
ế N u chúng ta không có ý ki n ti n nghi m (chúng ta xem các kho ng giá tr đ u có kh ả ủ năng ngang nhau) thì k t qu c a các ti p c n c đi n t Bayes.
ả
ưở
ng 95% (95% credible interval) ệ
ủ
ề
ệ
ố
Kho ng tin c y 95% t Giá tr p (m t bên) t
ượ
ả
ố
ươ ươ vong (gi
ự ư ả nh kho ng tin t ng t ấ ậ ư ự nh xác su t h u nghi m c a m nh đ thu c làm ng t ụ ế ả ử ằ c k t qu là thu c có tác d ng
s r ng chúng ta có đ
ả
ậ ộ ị ơ ử tăng nguy c t ệ b o v )
ế ậ ủ ế ế ề ệ ậ ề ệ ẽ ơ ồ ề ả ả Dù v y hai cách ti p c n này s cho k t qu khác nhau ý ki n ti n nghi m c a chúng ta v m nh đ không ph i là m h