NGUYÊN LÍ KIỂM ĐỊNH

ượ ự ậ ị

ệ ữ ầ ể ầ ạ ả ạ ầ Mục tiêu: ủ ề ọ Sau khi nghiên ch  đ , h c viên có kh  năng: ­  Trình bày đ ệ ượ t đ ­ Phân bi c s  liên h  gi a ki m đ nh ý nghĩa và kho ng tin c y  ạ c 2 lo i sai l m: sai l m lo i I và sai l m lo i II

ủ ể ể ị ấ ọ ư ậ ể ị ọ ỉ ụ ứ ộ

ế ế

ạ Lo i thi

ứ t k  nghiên c u

Liên hệ  gi a hai   bi n sế ố

ế ố

Thang đo c a bi n s

Hai nhóm  ị ồ   ề đi u tr  g m các cá nhân  khác nhau

ề   Nhi u đi u tr  trên cùng   các đ iố   ngượ t

Ba (hay  nhiêù)  nhóm đi uề   ị ồ tr  g m các   cá nhân  khác nhau

ướ Tr c và sau m tộ   ị  đi u trề (ho c 2ặ   ị ở  ề đi u tr )  trên cùng  các đ iố   ngượ t

ượ

ươ

t­test không  ắ ặ b t c p

Phân tích  ng sai ph

t­test b tắ   c pặ

ồ H i quy   ế   tuy n tính ngươ   và t

ừ  ẫ ng (m u rút t     có   phân ườ   ng   và   ng   sai   hai   nhóm

Phân tích  ươ ng sai ph ngườ   đo l ậ ạ l p l i

ị Ð nh l ố ộ m t   dân   s ố ph i   bình   th ươ ph ấ ồ đ ng nh t

quan  pearson

Ð nh tính ­ Danh đ nh

test  McNemar

Cochrance  Q

c 2 b ng 2 x ả n

c 2 b ng 3 x ả n

ệ ố ủ   H  s  c a ả b ng n x m (phi, OR,  RR)

Friedman

t

Kruskal­ Wallis

ượ   ng

h  sệ ố  ươ ng quan Spearman

ứ ự Ð nh tính ­Th  t ị ế (hay   bi n   đ nh   l ườ ng) không bình th

ị ể Ki m đ nh ạ   ắ s p h ng có d uấ   Wilcoxon

ể ị Ki m đ nh ắ   ổ t ng s p h ngạ   Mann­ Whitney

1. Chọn lựa kiểm định phù hợp ế ư ả ị  thuy t là nh  nhau). Các Nh  v y nguyên lí c a ki m đ nh ý nghĩa (hay ki m đ nh gi   ừ ả ệ ự ệ ự   ế ki m đ nh ch  khác nhau vi c l a ch n th ng kê xu t phát t 0. Vi c l a  thuy t H  gi ế ế ủ ế ố ủ ấ t k  c a nghiên c u. ch n này ph  thu c vào bi n s  c a v n đ  quan tâm và thi ể ố ề ợ ọ ự ả ị B ng 10. Ch n l a ki m đ nh phù h p

ề ể ng v  ki m đ nh ý nghĩa (significance testing) đ c kh i x ở ướ ả ượ ớ ị ố ố ưở ở ệ ỉ ệ ố ộ ả ử  s  chúng ta mu n đánh giá xem m t lo i thu c m i có c i thi n t  l ế ơ ị ồ ượ ề ị ớ ươ ươ ạ ộ ố ớ ộ 2. Kiểm định ý nghĩa; Kiểm định giả thuyết   ng b i R A Fisher. Ý t ạ    s ng còn  1 Gi ứ năm sau khi b  nh i máu c  tim hay không. Chúng ta ti n hành m t nghiên c u các   ề   ượ ệ c đi u b nh nhân đ cđi u tr  v i m t lo i thu c m i và m t nhóm t ộ ng đ ng đ

ử ớ ư ề ộ ế ệ ằ ị ằ ả c và phát hi n r ng t ề ơ ầ ấ ế ấ ự ố ị ớ ả ứ ẹ ằ ề ỉ ệ ử t ỏ t 2 l n v  t  l ố

ệ ỉ ệ ố  s ng còn. ườ ả ượ  d ớ ộ ế ị ự ự ấ ằ ứ ứ ạ i gi ế ị ụ ỉ ố ế ng s c m nh c a ch ng c  ch ng l ố ớ ố ỉ ệ ố ủ ộ ả thuy t là thu c không tác đ ng gì lên t  l ứ ẩ ể ế ộ ế ượ ả ặ thuy t đ i gi ể ắ ắ ạ ộ i 0,02 nó ch  ra m t cách m nh m  r ng gi ờ ả ả  thuy t không th ế ể ả ẽ ng xuyên b  l c l ộ

ộ ề ứ ề ị ỏ ả ể ế i giá tr  p thu c v  nhà nghiên c u. Thí d  thuy t không mà d n t ụ  ẫ ớ   i ị ế ị ự ỉ ằ   ị ớ tr  v i gi  vong trong nhóm đi u tr  v i thu c m i ch  b ng ộ ử m t n a so v i nhóm đi u tr  b ng placebo. Đây là m t k t qu  h a h n nh ng có khi   ị  ỉ ch  là m t k t qu  do c  may? Chúng ta hãy xem xét câu h i này b ng cách tính giá tr ư   vong n u nh p. Giá tr  p chính là xác su t có ít nh t s  khác bi ộ thu c th c s  không có tác đ ng gì lên t  l ả  ạ ộ Fisher th y r ng giá tr  p là m t ch  s  đo l  s ng còn). thuy t Ho (trong thí d  này, gi   ử ụ ậ ằ ổ   Ông ta c  vũ s  d ng P < 0.05 (5% ý nghĩa) làm m c tiêu chu n đ  k t lu n r ng có ớ ố ắ ệ ố   ạ ằ c ki m đinh, m c dù không có m t quy t c tuy t đ i b ng c  ch ng l ể ế ượ   ữ ằ c  thuy t đ “N u p  n m gi a 0,1 và 0,9 ch c ch n không có lí do gì đ  nghi ng  gi ể  ế ẽ ằ ỉ ướ ế ki m đinh. N u nó d ự ế ự ệ ị ạ ố ế   ườ ượ i thích đ . Chúng ta s  không th c cho s  ki n th c t gi i n u ướ ở ưỡ ọ  0,05” c  chúng ta ch n m t ng ng quy  ả ệ ọ ằ Đi u quan tr ng, Fisher cho r ng vi c lí gi ẫ ớ ả giá tr  p kho ng 0,05 d n t i không th  tin hay bác b  gi ệ ộ quy t đ nh m t th c nghi m khác.

Không

(cid:219)

N uế   A  (cid:222) B    {P( B )  thấ p (cid:222)   P(A)  thấ p}

(cid:222)

(cid:219)

(cid:222)

{ Ho  Tkê  S   }  {P( Tkê  S ) <  ngư ngỡ   bác  bỏ  Ho}

ấ ề ủ i ch  quan c a Fisher, Neyman và Pearson đ  xu t cách ti p c n đ ế ế ậ ủ ể thuy t” (hypothesis tests) và thay th  cho quan đi m ch  quan v ố ớ ạ ả ạ ế ế i gi ứ ế ị ế ầ ằ ạ ả ế ả ủ ế ệ ế ấ ầ thuy t không n u gi ầ ế ạ ế ị ớ ề ế ế ả thuy t không (và không ch u dùng đi u tr  m i) trong khi gi thuy t th c s ả ằ ạ ạ ố ắ ả ế ế ả c h n ch . Đi u này không ph i là xa l i k t qu  s  đ ị ơ ặ ả ẽ ượ ạ ứ ỡ ẫ ể ế ả ị ượ   ủ ả c thích cách lí gi ề  ả ị ể ọ g i là “ki m đ nh gi ậ   ằ ị ứ ủ s c m nh c a giá tr  p làm ch ng c  ch ng l  thuy t không b ng cách ti p c n ạ ự   khách quan d a vào cây quy t đ nh. Neyman và Pearson cho r ng có hai lo i sai l m có ự ậ ả ể ủ th  ph m ph i trong khi lí gi   i k t qu  c a th c nghi m. Cách ti p c n c a Fisher ế ả ỏ ả ộ ạ ậ   t p trung vào sai l m lo i m t: xác su t bác b  gi  thuy t không ự ấ   ấ th c ra là đúng. Neyman và Pearson cũng quan tâm đ n sai l m lo i II: xác su t ch p ự ự  ậ nh n gi ả   ắ ầ ầ là sai. B ng cách s p đ t các nguy c  sai l m lo i I và lo i II, s  các sai l m m c ph i ừ   ạ ớ ề trong khi lí gi  v i ai đã t ng tính c  m u cho các nghiên c u có ki m đ nh gi thuy t.

ể ử ụ ế ậ ế ỉ ả ỉ ượ ố ể ể ế ả ố Đ  s  d ng cách ti p c n Neyman­Pearson chúng ta ph i ch  rõ đ i thuy t (alternative   ố   ơ c phát bi u đ n gi n: “thu c hypothesis). Nói cách khác đ i thuy t  không th  ch  đ

ỉ ớ ả ơ ử ố ả ơ ử ứ vong” mà ph i ch  rõ nguy c  t ơ ử ằ ớ ế ị ầ ự ứ ề ệ ả ề ự  vong 60%” Nhà nghiên c u có quy n t ể ụ ể ố ế ầ ả ượ c th c hi n tr ự ạ ế ắ

i k t qu  nghiên c u t ấ c l ủ ủ ị ả    vong gi m bao nhiêu: m i làm gi m nguy c  t ọ    do ch n quy “thu c m i làm gi m nguy c  t ơ ạ ắ   t c quy t đ nh b ng cách phát bi u c  th  đ i thuy t, nguy c  sai l m lo i I, và nguy ướ ư ơ   c khi nghiên c u. Do đó c  sai l m lo i II, nh ng đi u này ph i đ ế   ậ ộ ủ trong cách ti p c n c a Neyman­Pearson chúng ta xây d ng m t nguyên t c ra quy t ế ả ứ ừ ướ ả ế ể ị ứ ệ   c khi ti n hành nghiên c u và vi c phân  tr đ nh đ  giúp lí gi ượ ạ ớ ậ ế ả ỏ ả ỉ ơ   i v i cách tích ch  đ n gi n là bác b  hay ch p nh n gi  thuy t không và,  ng ộ ừ ả ố ắ ậ ế   i giá tr  p trong t ng m t nghiên ti p c n ch  quan c a Fisher, không c  g ng lí gi ứ ụ ể c u c  th .

Phaùt bieån H

0 ; H

a

Tính soá thoáng keâ (z; t; chi

2 ; F)

Khoâng nhoû

Khoâng nhoû

Xaùc suaát sai laàm loaïi 1

Xaùc suaát sai laàm loaïi 2

tra baûng tính p

Thöïc hieän nghieân cöùu vôùi côõ maãu lôùn hôn

Nhoû

Nhoû

Baùc boû giaû thuyeát

Chaáp nhaän giaû thuyeát

ế ưở ứ ạ ậ ằ ơ ể i không tìm   hi u rõ ràng ý t ả  thuy t không s  đ ế ế ầ ả ơ ế ậ ủ ế ậ ủ ự ư ươ ử ụ   ề ng và s  d ng Đi u đáng ti c các nhà nghiên c u l ỏ  ẽ ượ ấ ủ ầ ế ph n thô s  nh t c a cách ti p c n này cho r ng gi c bác b ầ   ậ ề ạ ớ ế ẫ n u p< 0,05 (v i nguy c  sai l m lo i 1 là 5%). Đi u này d n đ n c m nh n sai l m  nh  cách ti p c n c a Fisher. ng t là cách ti p c n c a Neyman­Pearson t

ả ỏ ả thuy t Ho là đúng.

ạ ạ ầ ầ ế thuy t Ho sai. thuy t Ho trong khi gi

ờ ứ ố ế ậ ể ị ườ ế ậ thuy t Ho, ng ầ ắ ứ ứ ạ ớ ộ ứ ạ ể ị ằ ề ể ộ ị ế ả ể ắ  có th  ch c ch n. Do v y, khi nhà   ầ   i nghiên c u có th  b  sai l m ỏ ả  ớ ộ ầ   0, nhà nghiên c u cũng có th  b  sai l m (sai l m lo i hai ­ cũng v i m t xác ể   i ta có th  xác đ nh ườ ấ ư ể ầ ầ ố ượ ộ c xác su t sai l m lo i m t nh ng không th  tính đ ị c xác su t sai l m lo i hai.

ạ ố ủ ệ ể ạ ử ụ ố ầ ị ệ ấ ầ ạ ượ 3. Sai lầm loại một và sai lầm loại hai ế ộ  thuy t Ho trong khi gi Sai l m lo i m t: bác b  gi ế ỏ ả Sai l m lo i hai: Không bác b  gi ườ ứ i ta không bao gi Trong nghiên c u th ng kê ng ế ỏ ả nghiên c u đi đ n k t lu n bác b  gi ấ ộ (sai l m lo i m t ­ v i m t xác su t nào đó). Khi nhà nghiên c u không bác b  gi thuy t Hế ớ ấ su t nào đó). M t đi u nên nh  là  b ng ki m đ nh th ng kê ng ấ ượ đ ườ ự i ta còn s  d ng khái ni m năng l c (power) c a ki m đ nh th ng kê. Ðôi khi ng   ự ủ ự   ể Năng l c c a ki m đ nh th ng kê = 1 ­ xác su t sai l m lo i 2. Khái ni m năng l c ỡ ẫ ố ủ c a th ng kê hay đ ị c dùng trong tính c  m u.

Hình 5. Biểu đồ minh hoạ mối liên quan giữa sai lầm loại 1, sai lầm loai 2, cỡ mẫu và khoảng cách giữa Ho - Ha. Đường phân phối màu đậm bên trái thể hiện giả thuyết Ho, đường màu nhạt bên phải thể hiện giả thuyết Ha. Vùng diện tích màu đậm là xác suất sai lầm loại 1 và vùng diện tích màu nhạt thể hiện xác suất sai lầm loại 2. Chúng ta có thể nhận xét với cùng cỡ mẫu, nguy cơ sai lầm loại 2 càng tăng nếu Ha càng gần Ho. Cần phải tăng cỡ mẫu để phân biệt được Ha và Ho (giảm nguy cơ sai lầm loại 2) khi Ha gần Ho

ộ ố ả ử ệ ỉ ệ ố ả ạ ố ớ ị s  chúng ta mu n đánh giá m t lo i thu c m i có c i thi n t  l ằ ử ồ ẽ ự ỉ ố ng t  s  nguy c  – nguy c ề ề ơ ử ệ ơ ử ố ớ ơ  vong   vong 50%, n u t  s ế ỉ ố ố ị ớ ố ụ ứ ơ

4. So sánh các tiếp cận cổ điển (chủ nghĩa tần suất) và Bayes trong suy luận thống kê ộ   Gi  s ng còn m t ơ ệ ứ   ộ năm   sau   khi   b   nh i   máu   c   tim   b ng  m t   th   nghi m   lâm   sàng   có   nhóm  ch ng ơ  ệ ướ ượ ằ placebo. Chúng ta s  th c hi n đi u này b ng cách  c l ử ở ớ ượ  nhóm c đi u tr  v i thu c m i chia cho nguy c  t t    vong trong b nh nhân đ ế ỉ ố  ả ơ ố đ i ch ng. N u t  s  nguy c  là 0,5, thu c m i gi m nguy c  t ớ nguy c  là 1 thì thu c m i không có tác d ng. ủ ố ầ ấ

ố ệ

ậ ừ

giá tr  c a t

ị ủ ỉ

Th ng kê t n su t ch  nghĩa ẵ ự

ơ ở

­ Cho r ng chân lí đã có s n. Chúng ta s  d ng s  li u đ  suy lu n t ư

ế

t)

ử ụ ư  dân s  có th c (nh ng ch a bi ả ậ

­

ủ ỉ ố ả

ị ợ ữ

ự ị ủ

ỏ ơ ỉ ố  hay nh  h n t  s  nguy c

ng t

ơ

ằ ố s  nguy c   ố   ơ ả  Kho ng tin c y 95% cho chúng ta kho ng giá tr  h p lí c a t  s  nguy c  dân s ; ượ ẽ  ầ Chúng ta th c hi n nghiên c u 100 l n thì 95% nh ng kho ng tin c y tính đ c s ch a giá tr  c a dân s ấ ­ Giá tr  p là xác su t có đ ế ệ

ượ ỉ ố c t  s  nguy c  t ế ả

ơ ươ  thuy t Ho là đúng.

chúng ta đã phát hi n  n u gi

Th ng kê Bayes

ườ ­ Ng ể

ắ ầ ấ

ề ỉ ố

ể ệ

ơ

ể ề

ố ệ

ế

i theo ch  nghĩa Bayes có cách ti p c n ch  quan. Chúng ta b t đ u v i quan   ẽ  ấ ủ ỉ

ế ậ đi m chúng ta v  t  s  nguy c  và th  hi n nó theo phân ph i xác su t Chúng ta s ỉ dùng s  li u đ  đi u ch nh ý ki n đó (chúng tá s  rút ra phân ph i xác su t c a t ố ệ ố s  nguy c  d a trên s  li u và phân ph i có s n)

ơ ự ưở

ơ

ả ­ Kho ng tin t

ứ ỉ

­

ấ ề ỉ ố

ẳ c dùng đ  rút ra các kh ng đ nh xác su t v  t  s  vong

ơ ự ươ ­ Có s  t

ng t

ự ư

nh  (1­ đ

ẩ ng t ả

ế

ng 95% (95% credible interval) là kho ng có 95% c  may có ch a t ơ ố ố s  nguy c  dân s . ể ượ ố ậ Phân ph i h u nghi m có th  đ ụ ố ấ ơ ử nguy c  – thí d , xác su t thu c làm tăng nguy c  t ệ ử ụ ố ự ữ  gi a th ng kê Bayes và vi c s  d ng test trong ch n đoán b nh,   ư ộ ộ  ươ ạ ủ  nh  đ  nh y, giá tr  p t ế ươ ng t   ng. Khi đó n u k t qu  là bác b  Ho, ố ệ

ươ ể ị trong đó power c a ki m đ nh t ự ư ỉ ố ộ ươ chuyên) và   t  nh  t  s  đ  kh  dĩ d ậ ố s  chênh h u nghi m c a m nh đ  b ng s  chênh ti n nghi m x

ế

ổ ể ươ

ư

ế

ự ng t ả ề ằ ệ ế

ng t

ệ ả  ị ề ả ủ   ế  nh  cách ti p c n c a

ế N u chúng ta không có ý  ki n ti n nghi m (chúng ta xem các kho ng giá tr  đ u có kh ả ủ năng ngang nhau) thì k t qu  c a các ti p c n c  đi n t Bayes.

ưở

ng 95% (95% credible interval) ệ

­ Kho ng tin c y 95% t ­ Giá tr  p (m t bên) t

ượ

ươ ươ  vong (gi

ự ư ả  nh  kho ng tin t ng t ấ ậ ư ự    nh  xác su t h u nghi m c a m nh đ  thu c làm ng t ụ   ế ả ử ằ c k t qu  là thu c có tác d ng

s  r ng chúng ta có đ

ậ ộ ị ơ ử tăng nguy c  t ệ b o v )

ế ậ ủ ế ế ề ệ ậ ề ệ ẽ ơ ồ ề ả ả Dù v y hai cách ti p c n này s  cho k t qu  khác nhau ý ki n ti n nghi m c a chúng ta v  m nh đ  không ph i là m  h