
1
Phng pháp c tính c mu
cho mt nghiên cu y hc
Nguyn Vn Tun
Mt công trình nghiên cu thưng da vào mt mu (sample). Mt trong nhng
câu hi quan trng nht trưc khi tin hành nghiên cu là cn bao nhiêu mu hay bao
nhiêu i tưng cho nghiên cu. “i tưng” ây là ơn v cn bn ca mt nghiên
cu, là s bnh nhân hay s tình nguyn viên. c tính s lưng i tưng cn thit cho
mt công trình nghiên cu óng vai trò cc kì quan trng, vì nó có th là yu t quyt
nh s thành công hay tht bi ca nghiên cu. Nu s lưng i tưng không thì kt
lun rút ra t công trình nghiên cu không có chính xác cao, thm chí không th kt
lun gì ưc. Ngưc li, nu s lưng i tưng quá nhiu hơn s cn thit thì tài
nguyên, tin bc và thi gian s b hao phí. Do ó, vn then cht trưc khi nghiên cu
là phi ưc tính cho ưc mt s i tưng va cho m!c tiêu ca nghiên cu. S
lưng i tưng “va ” tùy thuc vào loi hình nghiên cu và hai thông s chính:
• Phương pháp thit k nghiên cu và tiêu chí lâm sàng (outcome measure).
• H s nh hưng (effect size);
• Sai lm mà nhà nghiên cu chp nhn, c! th là sai lm loi I và II (power);
Không bit [hay chưa quyt nh] ưc thit k nghiên cu và không có s liu v
hai thông s trên thì không th nào ưc tính c" mu. Kinh nghim ca ngưi vit cho
thy rt nhiu ngưi khi tin hành nghiên cu thưng không có ý nim gì v các s liu
này, cho nên khi n tham vn các chuyên gia v thng kê hc, h ch# nhn câu tr li:
“không th tính ưc”! Trong bài này tôi s bàn qua hai thông s trên và trình bày mt
s ví d! nghiên cu lâm sàng c! th v ưc tính c" mu.
1. Thit k nghiên cu và tiêu chí lâm sàng
1.1 Thit k nghiên cu
Thông tin th nht trong qui trình ưc tính c" mu là th loi nghiên cu, bi vì
yu t này có nh hưng n phương pháp phân tích thng kê và vì th phương pháp ưc
tính c" mu. Có th phân bit các th loi nghiên cu này da vào hai tiêu chí: thi gian
và $c tính. V thi gian, các nghiên cu thu thp d liu ti mt thi im hin ti
(present) ưc gi là cross-sectional study (nghiên cu tiêu biu mt thi im); các
nghiên cu có nh hưng theo dõi tình trng sc khe ca i tưng trong mt thi gian,
tc thu thp d liu tng i tưng nhiu ln (hin ti và tương lai) ưc gi là

2
prospective (hay longitudinal) study (nghiên cu theo thi gian); và các nghiên cu ưc
tin hành hin ti nhưng có nh hưng tìm hiu quá kh (past) ưc gi là retrospective
study.
Nghiên cu ti mt thi im hay cross-sectional study (ưc dch theo ngh%a en
là “nghiên cu c&t ngang”). ây là mt thit k mà các nhà nghiên cu chn mt qun
th mt cách ngu nhiên nhưng tiêu biu cho mt cng 'ng, ti mt thi im nào ó.
Nói cách khác, nhà nghiên cu thu thp d liu ch# mt ln duy nht ca các i tưng
ngay ti thi im ó (hin ti). M!c ích chính ca các nghiên cu này là tìm hiu t# l
hin hành (prevalence) ca mt bnh nào ó, hay tìm hiu mi tương quan gia mt yu
t nguy cơ và mt bnh.
Nghiên cu i chng hay case-control study. Trong các nghiên cu này, m!c
ích chính là tìm hiu mi liên h gia mt (hay nhiu) yu t nguy cơ (risk factors) và
mt bnh rt c! th. tin hành nghiên cu này, nhà nghiên cúu b&t u b(ng mt
nhóm bnh nhân và mt nhóm i tưng không bnh (i chng), và “i ngưc thi
gian” tìm hiu nhng yu t nguy cơ mà c hai nhóm phơi nhim trong quá kh.
Nghiên cu xuôi thi gian (longitudinal studies hay prospective study). Ngưc
li vi nghiên cu i chng (trưng hp nhà nghiên cu bit ai m&c bnh và ai không
m&c bnh), vi các nghiên cu theo thi gian nhà nghiên cu b&t u b(ng mt nhóm
không m&c bnh, và theo dõi mt thi gian sau quan sát ai m&c bnh hay không m&c
bnh trong thi gian ó. Ngưc li vi nghiên cu i chng (trưng hp nhà nghiên
cu i ngưc v quá kh tìm hiu ai b phơi nhim yu t nguy cơ), vi các nghiên
cu theo thi gian, nhà nghiên cu bit ngay t lúc ban u ai b phơi nhim hay không
phơi nhim yu t nguy cơ. M!c ích ca các nghiên cu xuôi thi gian thưng là ưc
tính t# l phát sinh (incidence) bnh trong mt thi gian (iu này khác vi m!c ích ca
nghiên cu ti mt thi im là ưc tính t# l hin hành – tc prevalence – ca bnh).
Ngoài ra, các nghiên cu theo thi gian còn cho phép nhà nghiên cu tìm hiu mi liên
h gia mt hay nhiu yu t nguy cơ và nguy cơ phát sinh bnh tt. Khác vi nghiên
cu cross-section ch# ghi nhn s kin ti mt thi im, các nghiên cu longitudinal
phi theo dõi i tưng trong mt thi gian có th là nhiu nm tháng.
1.2 Tiêu chí lâm sàng
Sau khi ã xác nh th loi nghiên cu, nhà nghiên cu cn phi quyt nh chn
mt tiêu chí lâm sàng chính (primary outcome measure) cn c vào ó mà ưc tính c"
mu. Quyt nh chn tiêu chí lâm sàng là mt quyt nh va mang tính lâm sàng, va
mang tính khoa hc. Bi vì m!c tiêu ti hu ca nghiên cu y khoa là em li li ích cho
bnh nhân hay cng 'ng, cho nên tiêu chí ưc chn phi có ý ngh%a thc t i vi

3
bnh nhân. Ch)ng hn như trong vic th*m nh hiu qu ca các phương pháp truy tìm
ung thư, thì t# l phát hin ung thư và iu tr không phi là tiêu chí có ý ngh%a thc t,
nhưng t# l t+ vong và thi gian sng sót sau khi truy tìm ung thư mi là tiêu chí có ý
ngh%a lâm sàng và thc t. M$c khác, tiêu chí phi áp ng các tiêu chu*n khoa hc v
tin cy và chính xác. Nu mt nghiên cu có m!c tiêu tìm hiu hiu qu ca mt
loi thuc phòng chng bnh xơ va ng mch, thì cholesterol trong máu không th
ưc xem là tiêu chí có ý ngh%a lâm sàng, dù nó áp ng yêu cu khoa hc tính. Do ó,
vic chn mt tiêu chí lâm sàng cho nghiên cu cn phi cân nh&c rt c*n thn.
Quyt nh chn tiêu chí lâm sàng là mt quyt nh quan trng, bi vì nó có nh
hưng n c" mu rt ln. Ch)ng hn như trong các nghiên cu loãng xương, các nhà
nghiên cu có th so sánh mt xương hay t# l gãy xương gia hai nhóm can thip
bit hiu qu ca thuc. Nu chn mt xương làm tiêu chí lâm sàng thì s lưng c"
mu có th s là con s vài trm bnh nhân, nhưng nu chn t# l gãy xương con s c"
mu có th lên n vài ch!c ngàn i tưng.
2. Khái nim v “h s nh hưng” (effect size)
H s nh hưng, nói mt cách ơn gin, là mt ch# s v nh hưng ca mt
thut can thip. Vì phn nh mc khác bit, h s nh hưng cho phép chúng ta tránh
khi cách din dch gii hn bi ngôn ng nh phân (như “có hay không có nh
hưng?”), và tp trung vào mt cách din dch mang tính khoa hc hơn (như “mc
nh hưng cao hay thp c" nào?”) Ba trưng hp ơn gin sau ây s minh ha cho khái
nim v h s nh hưng:
Trng hp 1: Trong mt nghiên cu g'm 50 bnh nhân cao huyt áp ưc iu
tr b(ng mt thuc trong nhóm beta-blocker. Trưc khi iu tr, huyt áp tâm thu (SBP)
trung bình cho c nhóm là 140 mmHg và lch chu*n là 22 mmHg. Sau khi iu tr,
huyt áp tâm thu gim xung còn 125 mmHg.
Trng hp 2: Mt nghiên cu khác th*m nh hiu qu ca mt thuc chng
loãng xương trong nhóm bisphosphonate. Nghiên cu ưc tin hành trên 50 bnh nhân.
Trưc khi iu tr, mt xương c, xương ùi (femoral neck bone mineral density, vit
t&t là BMD) trung bình là 0.68 g/cm2 vi lch chu*n 0.12 g/cm2. Sau 6 tháng iu tr,
BMD trung bình cho c nhóm tng lên 0.72 g/cm2 vi lch chu*n 0.13 g/cm2.
Trng hp 3: Mt nghiên cu bnh – chng (case-control study) nh(m th*m
nh nh hưng ca thói quen hút thuc lá n glucose trong máu. Nhóm hút thuc lá
g'm 30 ngưi có glucose trung bình là 130 mg/dL vi lch chu*n 35 mg/dL.

4
Nhóm không hút thuc lá g'm 70 ngưi có glucose trung bình là 110 mg/dL vi
lch chu*n 50 mg/dL.
Trong trưng hp 1, chúng ta có th ưc tính mc nh hưng b(ng cách ly
huyt áp sau khi iu tr tr cho huyt áp trưc khi iu tr: d1 = 125 – 140 = -15 mmHg.
Tương t, nh hưng ca thuc bisphosphonate cho trưng hp 2 là d2 = 0.72 – 0.68 =
0.04 g/cm2. Và trưng hp 3, nh hưng ca hút thuc lá có th ưc tính b(ng d3 =
130 – 110 = 20 mg/dL.
Khó khn trong cách ưc tính nh hưng trên ây là không th so sánh trc
tip ưc nh hưng, bi vì ơn v o lưng khác nhau. Và, quan trng hơn na,
dao ng (phn nh b(ng lch chu*n) gia 3 trưng hp c-ng rt khác nhau. Phương
pháp so sánh trc tip nh hưng lí tưng là hoán chuyn sao cho c ba trưng hp có
cùng mt ơn v o lưng. t ưc m!c ích này, cách ơn gin nht là ly nh
hưng chia cho lch chu*n. T# s này có tên ting Anh là effect size (có khi còn gi là
standardized difference) mà tôi tm dch là h s nh hưng. Công thc chung cho ưc
tính h s nh hưng (s vit t&t b(ng ES) là:
1 0
0
x x
ES
s
−
= [1]
Trong ó:
•
1
x
là s trung bình ca nhóm can thip;
•
0
x
là s trung bình ca nhóm i chng; và
•
0
s
là lch chu*n ca nhóm i chng.
H s nh hưng ca 3 trưng hp trên là:
• Trưng hp 1: ES1 = -15 / 22 = 0.68
• Trưng hp 2: ES2 = 0.04 / 0.12= 0.33
• Trưng hp 3: ES3 = 20 / 50 = 0.40
Nên nh r(ng lch chu*n có cùng ơn v o lưng vi nh hưng trung bình, cho
nên h s nh hưng không có ơn v. Nói cách khác, ơn v o lưng nh hưng bây
gi là lch chu*n. Ch)ng hn như trong trưng hp 1, thuc beta-blocker có tác d!ng
gim huyt áp tâm thu khong 0.68 lch chu*n, còn trong trưng hp 2, thuc
bisphosphonate tng mt xương ch# 0.33 lch chu*n. Vì có cùng ơn v so sánh, có
th nói [ơn gin] r(ng h s nh hưng ca thuc beta-blocker cao hơn thuc
bisphosphonate.

5
Theo mt qui ưc [không có cơ s khoa hc my], mt h s nh hưng b(ng 0.2
ưc xem là “thp”, 0.5 là “trung bình”, và >0.8 là “cao” [1]. Mt h s nh hưng 0.2
tương ương vi khác bit v chiu cao ca mt em bé 15 tu,i và mt em bé 16 tu,i.
Mt h s nh hưng 0.5 tương ương vi khác bit v chiu cao ca mt em bé 14
tu,i và mt em bé 18 tu,i. Mt h s nh hưng 0.8 tương ương vi khác bit v ch#
s thông minh (IQ) ca mt sinh viên nm th nht và mt tin s%.
3. Sai lm loi I, II và khái nim v “power”
3.1 Sai lm loi I và II
Thng kê hc là mt phương pháp khoa hc có m!c ích phát hin, hay i tìm
nhng cái có th gp chung li b(ng c!m t “chưa ưc bit” (unknown). Cái chưa ưc
bit ây là nhng hin tưng chúng ta không quan sát ưc, hay quan sát ưc nhưng
không y . Cái chưa bit có th là mt *n s (như chiu cao trung bình ngưi Vit
Nam, hay trng lưng mt phn t+), hiu qu ca mt thut iu tr, t# l lưu hành
(prevalence), t# l phát sinh (incidence) ca bnh, v.v… Chúng ta có th o chiu cao,
hay tin hành xét nghim bit hiu qu ca thuc, nhưng các nghiên cu như th ch#
ưc tin hành trên mt nhóm i tưng, ch không phi toàn b qun th ca dân s.
Vn là s+ d!ng kt qu ca mt nhóm i tưng suy lun cho mt qun th ln
hơn. M!c ích ca ưc tính c" mu là tìm s lưng i tưng sao cho suy lun ó t
chính xác cao nht và y nht.
. mc ơn gin nht, nhng cái chưa bit này có th xut hin dưi hai hình
thc: ho$c là có, ho$c là không. Ch)ng hn như mt thut iu tr có hay không có hiu
qu chng gãy xương. Bi vì không ai bit hin tưng mt cách y , chúng ta phi
$t ra gi thit. Gi thit ơn gin nht là gi thit o (hin tưng không t'n ti, kí hiu
Ho) và gi thit chính (hin tưng t'n ti, kí hiu Ha).
Chúng ta s+ d!ng các phương pháp kim nh thng kê (statistical test) như kim
nh t, F, z, χ2, v.v… ánh giá kh nng ca gi thit. Kt qu ca mt kim nh
thng kê có th ơn gin chia thành hai giá tr: ho$c là có ý ngha thng kê (statistical
significance), ho$c là không có ý ngha thng kê (non-significance). Có ý ngh%a thng kê
ây thưng da vào tr s P: thông thưng, nu P < 0.05, chúng ta phát biu kt qu có
ý ngh%a thng kê; nu P > 0.05 chúng ta nói kt qu không có ý ngh%a thng kê. C-ng có
th xem có ý ngh%a thng kê hay không có ý ngh%a thng kê như là có tín hiu hay không
có tín hiu. Hãy tm $t kí hiu T+ là kt qu có ý ngh%a thng kê, và T- là kt qu kim
nh không có ý ngh%a thng kê.

