1
Phng pháp c tính c mu
cho mt nghiên cu y hc
Nguyn Vn Tun
Mt công trình nghiên cu thưng da vào mt mu (sample). Mt trong nhng
câu hi quan trng nht trưc khi tin hành nghiên cu cn bao nhiêu mu hay bao
nhiêu i tưng cho nghiên cu. i tưng” ây ơn v cn bn ca mt nghiên
cu, là s bnh nhân hay s tình nguyn viên. c tính s lưng i tưng cn thit cho
mt công trình nghiên cu óng vai trò cc quan trng, th yu t quyt
nh s thành công hay tht bi ca nghiên cu. Nu s lưng i tưng không  thì kt
lun rút ra t công trình nghiên cu không  chính xác cao, thm chí không th kt
lun ưc. Ngưc li, nu s lưng i tưng quá nhiu hơn s cn thit thì tài
nguyên, tin bc và thi gian s b hao phí. Do ó, vn  then cht trưc khi nghiên cu
phi ưc nh cho ưc mt s i tưng va  cho m!c tiêu ca nghiên cu. S
lưng i tưng “va ” tùy thuc vào loi hình nghiên cu và hai thông s chính:
Phương pháp thit k nghiên cu và tiêu chí lâm sàng (outcome measure).
H s nh hưng (effect size);
Sai lm mà nhà nghiên cu chp nhn, c! th là sai lm loi I và II (power);
Không bit [hay chưa quyt nh] ưc thit k nghiên cu và không có s liu v
hai thông s trên thì không th nào ưc tính c" mu. Kinh nghim ca ngưi vit cho
thy rt nhiu ngưi khi tin hành nghiên cu thưng không ý nim v các s liu
này, cho nên khi n tham vn các chuyên gia v thng hc, h ch# nhn câu tr li:
“không th tính ưc”! Trong bài y tôi s bàn qua hai thông s trên trình bày mt
s ví d! nghiên cu lâm sàng c! th v ưc tính c" mu.
1. Thit k nghiên cu và tiêu chí lâm sàng
1.1 Thit k nghiên cu
Thông tin th nht trong qui trình ưc tính c" mu th loi nghiên cu, bi
yu t này nh hưng n phương pháp phân tích thng kê và vì th phương pháp ưc
tính c" mu. th phân bit các th loi nghiên cu này da vào hai tiêu chí: thi gian
$c tính. V thi gian, các nghiên cu thu thp d liu ti mt thi im hin ti
(present) ưc gi cross-sectional study (nghiên cu tiêu biu mt thi im); các
nghiên cu có nh hưng theo dõi tình trng sc khe ca i tưng trong mt thi gian,
tc thu thp d liu tng i tưng nhiu ln (hin ti tương lai) ưc gi là
2
prospective (hay longitudinal) study (nghiên cu theo thi gian); các nghiên cu ưc
tin hành hin ti nhưng nh hưng tìm hiu quá kh (past) ưc gi retrospective
study.
Nghiên cu ti mt thi im hay cross-sectional study (ưc dch theo ngh%a en
“nghiên cu c&t ngang”). ây mt thit k các nhà nghiên cu chn mt qun
th mt cách ngu nhiên nhưng tiêu biu cho mt cng 'ng, ti mt thi im nào ó.
Nói cách khác, nhà nghiên cu thu thp d liu ch# mt ln duy nht ca các i tưng
ngay ti thi im ó (hin ti). M!c ích chính ca các nghiên cu này là tìm hiu t# l
hin hành (prevalence) ca mt bnh nào ó, hay tìm hiu mi tương quan gia mt yu
t nguy cơ và mt bnh.
Nghiên cu i chng hay case-control study. Trong các nghiên cu này, m!c
ích chính tìm hiu mi liên h gia mt (hay nhiu) yu t nguy cơ (risk factors) và
mt bnh rt c! th.  tin hành nghiên cu này, nhà nghiên cúu b&t u b(ng mt
nhóm bnh nhân và mt nhóm i tưng không bnh (i chng), i ngưc thi
gian” tìm hiu nhng yu t nguy cơ mà c hai nhóm phơi nhim trong quá kh.
Nghiên cu xuôi thi gian (longitudinal studies hay prospective study). Ngưc
li vi nghiên cu i chng (trưng hp nhà nghiên cu bit ai m&c bnh ai không
m&c bnh), vi các nghiên cu theo thi gian nhà nghiên cu b&t u b(ng mt nhóm
không m&c bnh, theo dõi mt thi gian sau  quan sát ai m&c bnh hay không m&c
bnh trong thi gian ó. Ngưc li vi nghiên cu i chng (trưng hp nhà nghiên
cu i ngưc v quá kh  tìm hiu ai b phơi nhim yu t nguy cơ), vi các nghiên
cu theo thi gian, nhà nghiên cu bit ngay t lúc ban u ai b phơi nhim hay không
phơi nhim yu t nguy cơ. M!c ích ca các nghiên cu xuôi thi gian thưng ưc
tính t# l phát sinh (incidence) bnh trong mt thi gian (iu y khác vi m!c ích ca
nghiên cu ti mt thi im là ưc tính t# l hin hành tc prevalence ca bnh).
Ngoài ra, các nghiên cu theo thi gian còn cho phép nhà nghiên cu tìm hiu mi liên
h gia mt hay nhiu yu t nguy cơ và nguy cơ phát sinh bnh tt. Khác vi nghiên
cu cross-section ch# ghi nhn s kin ti mt thi im, các nghiên cu longitudinal
phi theo dõi i tưng trong mt thi gian có th là nhiu nm tháng.
1.2 Tiêu chí lâm sàng
Sau khi ã xác nh th loi nghiên cu, nhà nghiên cu cn phi quyt nh chn
mt tiêu chí lâm sàng chính (primary outcome measure)  cn c vào ó ưc tính c"
mu. Quyt nh chn tiêu chí lâm sàng mt quyt nh va mang tính lâm sàng, va
mang tính khoa hc. Bi vì m!c tiêu ti hu ca nghiên cu y khoa là em li li ích cho
bnh nhân hay cng 'ng, cho nên tiêu chí ưc chn phi ý ngh%a thc t i vi
3
bnh nhân. Ch)ng hn như trong vic th*m nh hiu qu ca các phương pháp truy tìm
ung thư, thì t# l phát hin ung thư iu tr không phi tiêu chí ý ngh%a thc t,
nhưng t# l t+ vong thi gian sng sót sau khi truy tìm ung thư mi tiêu chí ý
ngh%a lâm sàng thc t. M$c khác, tiêu chí phi áp ng các tiêu chu*n khoa hc v
 tin cy  chính xác. Nu mt nghiên cu m!c tiêu tìm hiu hiu qu ca mt
loi thuc phòng chng bnh xơ va ng mch, thì  cholesterol trong máu không th
ưc xem là tiêu chí ý ngh%a lâm sàng, áp ng yêu cu khoa hc tính. Do ó,
vic chn mt tiêu chí lâm sàng cho nghiên cu cn phi cân nh&c rt c*n thn.
Quyt nh chn tiêu chí lâm sàng mt quyt nh quan trng, bi nh
hưng n c" mu rt ln. Ch)ng hn như trong các nghiên cu loãng xương, các nhà
nghiên cu th so sánh mt  xương hay t# l gãy xương gia hai nhóm can thip 
bit hiu qu ca thuc. Nu chn mt  xương làm tiêu chí lâm sàng ts lưng c"
mu th s con s vài trm bnh nhân, nhưng nu chn t# l y xương con s c"
mu có th lên n vài ch!c ngàn i tưng.
2. Khái nim v “h s nh hưng” (effect size)
H s nh hưng, nói mt cách ơn gin, mt ch# s v  nh hưng ca mt
thut can thip. phn nh mc  khác bit, h s nh hưng cho phép chúng ta tránh
khi cách din dch gii hn bi ngôn ng nh phân (như “có hay không nh
hưng?”), tp trung vào mt cách din dch mang tính khoa hc hơn (như “mc 
nh hưng cao hay thp c" nào?”) Ba trưng hp ơn gin sau ây s minh ha cho khái
nim v h s nh hưng:
Trng hp 1: Trong mt nghiên cu g'm 50 bnh nhân cao huyt áp ưc iu
tr b(ng mt thuc trong nhóm beta-blocker. Trưc khi iu tr, huyt áp tâm thu (SBP)
trung bình cho c nhóm là 140 mmHg  lch chu*n là 22 mmHg. Sau khi iu tr,
huyt áp tâm thu gim xung còn 125 mmHg.
Trng hp 2: Mt nghiên cu khác th*m nh hiu qu ca mt thuc chng
loãng xương trong nhóm bisphosphonate. Nghiên cu ưc tin hành trên 50 bnh nhân.
Trưc khi iu tr, mt  xương c, xương ùi (femoral neck bone mineral density, vit
t&t BMD) trung bình 0.68 g/cm2 vi  lch chu*n 0.12 g/cm2. Sau 6 tháng iu tr,
BMD trung bình cho c nhóm tng lên 0.72 g/cm2 vi  lch chu*n 0.13 g/cm2.
Trng hp 3: Mt nghiên cu bnh chng (case-control study) nh(m th*m
nh nh hưng ca thói quen hút thuc lá n  glucose trong máu. Nhóm hút thuc
g'm 30 ngưi  glucose trung bình 130 mg/dL vi  lch chu*n 35 mg/dL.
4
Nhóm không hút thuc g'm 70 ngưi  glucose trung bình 110 mg/dL vi 
lch chu*n 50 mg/dL.
Trong trưng hp 1, chúng ta th ưc tính mc  nh hưng b(ng cách ly
huyt áp sau khi iu tr tr cho huyt áp trưc khi iu tr: d1 = 125 – 140 = -15 mmHg.
Tương t, nh hưng ca thuc bisphosphonate cho trưng hp 2 d2 = 0.72 0.68 =
0.04 g/cm2. trưng hp 3,  nh hưng ca hút thuc th ưc tính b(ng d3 =
130 – 110 = 20 mg/dL.
Khó khn trong cách ưc tính  nh hưng trên ây không th so sánh trc
tip ưc  nh hưng, bi ơn v o lưng khác nhau. Và, quan trng hơn na, 
dao ng (phn nh b(ng  lch chu*n) gia 3 trưng hp c-ng rt khác nhau. Phương
pháp so sánh trc tip nh hưng tưng hoán chuyn sao cho c ba trưng hp
cùng mt ơn v o lưng.  t ưc m!c ích y, cách ơn gin nht là ly  nh
hưng chia cho  lch chu*n. T# sy có tên ting Anh là effect size (có khi còn gi là
standardized difference) tôi tm dch h s nh hưng. Công thc chung cho ưc
tính h s nh hưng (s vit t&t b(ng ES) là:
1 0
0
x x
ES
s
= [1]
Trong ó:
1
x
là s trung bình ca nhóm can thip;
0
là s trung bình ca nhóm i chng; và
0
s
 lch chu*n ca nhóm i chng.
H s nh hưng ca 3 trưng hp trên là:
Trưng hp 1: ES1 = -15 / 22 = 0.68
Trưng hp 2: ES2 = 0.04 / 0.12= 0.33
Trưng hp 3: ES3 = 20 / 50 = 0.40
Nên nh r(ng  lch chu*n cùng ơn v o lưng vi  nh hưng trung bình, cho
nên h s nh hưng không có ơn v. Nói cách khác, ơn v o lưng  nh hưng bây
gi lch chu*n. Ch)ng hn như trong trưng hp 1, thuc beta-blocker tác d!ng
gim huyt áp tâm thu khong 0.68  lch chu*n, còn trong trưng hp 2, thuc
bisphosphonate tng mt  xương ch# 0.33  lch chu*n. Vì có cùng ơn v so sánh, có
th nói [ơn gin] r(ng h s nh hưng ca thuc beta-blocker cao hơn thuc
bisphosphonate.
5
Theo mt qui ưc [không có cơ s khoa hc my], mt h s nh hưng b(ng 0.2
ưc xem “thp”, 0.5 “trung bình”, >0.8 “cao” [1]. Mt h s nh hưng 0.2
tương ương vi  khác bit v chiu cao ca mt em 15 tu,i mt em 16 tu,i.
Mt h s nh hưng 0.5 tương ương vi  khác bit v chiu cao ca mt em 14
tu,i và mt em bé 18 tu,i. Mt h s nh hưng 0.8 tương ương vi  khác bit v ch#
s thông minh (IQ) ca mt sinh viên nm th nht và mt tin s%.
3. Sai lm loi I, II và khái nim v “power”
3.1 Sai lm loi I và II
Thng hc mt phương pháp khoa hc m!c ích phát hin, hay i tìm
nhng cái có th gp chung li b(ng c!m t “chưa ưc bit” (unknown). Cái chưa ưc
bit ây nhng hin tưng chúng ta không quan sát ưc, hay quan sát ưc nhưng
không y . Cái chưa bit th mt *n s (như chiu cao trung bình ngưi Vit
Nam, hay trng lưng mt phn t+), hiu qu ca mt thut iu tr, t# l lưu hành
(prevalence), t# l phát sinh (incidence) ca bnh, v.v… Chúng ta th o chiu cao,
hay tin hành xét nghim  bit hiu qu ca thuc, nhưng các nghiên cu như th ch#
ưc tin hành trên mt nhóm i tưng, ch không phi toàn b qun th ca dân s.
Vn  s+ d!ng kt qu ca mt nhóm i tưng  suy lun cho mt qun th ln
hơn. M!c ích ca ưc tính c" mu là tìm s lưng i tưng sao cho suy lun ó t 
chính xác cao nht và y  nht.
. mc  ơn gin nht, nhng cái chưa bit này th xut hin dưi hai hình
thc: ho$c có, ho$c không. Ch)ng hn như mt thut iu tr hay không hiu
qu chng y xương. Bi không ai bit hin tưng mt cách y , chúng ta phi
$t ra gi thit. Gi thit ơn gin nht là gi thit o (hin tưng không t'n ti, hiu
Ho) và gi thit chính (hin tưng t'n ti, kí hiu Ha).
Chúng ta s+ d!ng các phương pháp kim nh thng (statistical test) như kim
nh t, F, z, χ2, v.v… ánh giá kh nng ca gi thit. Kt qu ca mt kim nh
thng th ơn gin chia thành hai giá tr: ho$c ý ngha thng (statistical
significance), ho$c không ý ngha thng kê (non-significance). ý ngh%a thng
ây thưng da vào tr s P: thông thưng, nu P < 0.05, chúng ta phát biu kt qu
ý ngh%a thng kê; nu P > 0.05 chúng ta nói kt qu không có ý ngh%a thng kê. C-ng
th xem có ý ngh%a thng kê hay không có ý ngh%a thng kê như có tín hiu hay không
có tín hiu. Hãy tm $t hiu T+ là kt quý ngh%a thng kê, và T- kt qu kim
nh không có ý ngh%a thng kê.