Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun 1
Lâm sàng thng kê
Phân tích các bin không th hoán chuyn
Nguyn Vn Tun
Trong hai bài trc, tôi t cách hoán chuyn s liu sao cho tuân theo lut
phân phi chun (Normal distribution)  tin cho vic ng dng các phơng pháp phân
tích nh kim nh t, phân tích phơng sai (analysis of variance). Tuy nhiên cng
trng hp chúng ta không th hoán chuyn s liu bng các hàm thông dng nh logarít
hay hàm m. Trong trng hp này, chúng ta có hai phơng án  phân tích:
Phơng án th nht s dng các phơng pháp phân tích phi thông s (non-
parametric methods). Nh tên gi, các phơng pháp phi tham s không òi hi các bin
s phi tuân theo lut phân phi chun, cách tính cng tơng i ơn gin hơn các
phơng pháp tham s. Phn ln các phơng pháp này hoán chuyn các bin liên tc
(contonuous measurement) thành các bin th hng (rank), và phân tích trên các bin th
hng này. Chng hn nh bin {79, 23, 5, 7, 56, } trc khi phân tích s c hoán
chuyn thành s th hng nh {5, 3, 1, 2, 4}. Nh thy qua d ơn gin trên, phơng
cách hoán chuyn t s liên tc sang s th hng trên có thy nên tình trng mt thông
tin (loss of information). Nhng may mn thay, trong nhiu trng hp, vn  mt
thông tin không gây nh hng ln n vic kim nh các gi thit khoa hc.
Nu chúng ta mun kim nh s liu t hai nhóm !c lp, thay s dng kim
nh t, phơng pháp phi tham s tơng ơng phơng pháp Wilcoxon (còn gi
Wilcoxon’s rank sum test, hay khi còn gi Wilcoxon-Mann-Whitney test). Nu
hơn hai nhóm, thay s dng phân tích phơng sai, phơng pháp phi tham s tơng
ơng là kim nh Kruskal-Wallis (còn gi là Kruskal-Wallis test).
Phơng án th hai là ng dng phơng pháp bootstrap (mà tôi ã gii thích trong
bài tr li v cách c tính khong tin cy 95% cho s trung v trc ây).
1. Kim nh Wilcoxon
Phơng pháp kim nh Wilcoxon th minh ho bng m!t d ơn gin nh
sau: gi d chúng ta có s liu t 2 nhóm (A và B) nh sau:
Nhóm A (2 i tng): 4, 12
Nhóm B (3 i tng): 14, 10, 17
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun 2
chúng ta mun bit xem hai nhóm y khác bit hay không. Vi phơng pháp
kim nh Wilcoxon, chúng ta s hoán chuyn s liu thành hng (rank). Trc kt,
chúng ta tp hp s liu hai nhóm thành m!t vector, sp xp theo t t" t s thp nht
n cao nht nh sau:
Nhóm A + B: 4, 10, 12, 14, 17
Hng (rank): 1, 2, 3, 4, 5
Chú ý rng nh#ng ch# s c m thu!c nhóm B. chúng ta thy t$ng s hng c%a
nhóm B là:
S = 2 + 4 + 5 = 11 [1]
T$ng s hng ó ý ngh&a gì? Trc khi tr li câu hi ó, chúng ta dành vài
phút suy ngh&. tt c 5 o lng; trong ó, nhóm B 3 o lng. Do ó, nu3 o
lng c%a nhóm B hoàn toàn thp hơn 2 o lng nhóm A, thì tng s hng (sum of
ranks) c%a nhóm B phi giá tr ti thiu là: 1 + 2 + 3 = 6. Ngc li, nu 3 o lng
c%a nhóm B hoàn toàn cao hơn 2 o lng nhóm A, thì t$ng s hng c%a nhóm B phi
giá tr ti a là 3 + 4 + 5 = 12.
Nói chung, nu chúng ta
1
n
i tng trong nhóm A
2
n
i tng trong
nhóm B, ti thiu tng s hng c%a nhóm B là:
(
)
1 2
1
n n
+
, ti a tng s hng c%a
nhóm B là:
(
)
2 2
1 2
1
2
n n
n n
+
. Bn c th thay th
1
n
= 2 và
2
n
= 3  kim tra kt
qu trên.
Nu hai nhóm không khác nhau, Wilcoxon (tng ch% tch Hip h!i khoa hc
thng kê M& trong thp niên 1950s) ch' ra rng s hng trung bình c%a nhóm B là:
(
)
2 1 2
1
T
n n n
µ
+ +
= [2]
Chú ý rng trong công thc trên phi tuân theo th t"
2 1
n n
>
. Và phơng sai là:
(
)
1 2 1 2
2
1
12
T
n n n n
σ
+ +
= [3]
(Nói cách khác, ! lch chun là:
2
T T
σ σ
=).
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun 3
nu s i tng c%a hai nhóm tơng i y % (nh trên 10 chng hn), thì
ch' s thng kê
T
T
S
T
µ
σ
= tuân theo lut phân phi chun. Nói cách khác, nu hai nhóm
không khác nhau, thì 95% tr s c%a T s dao !ng trong khong -2 n 2. Tc là, nu T
thp hơn -2 hay cao hơn 2, chúng ta bng chng  phát biu rng ! khác bit gi#a
hai nhóm có ý ngh&a thng kê.
M!t cách khác c nh khong tin cy 95% c%a
T
µ
nh sau:
T
µ
±1.96×
T
σ
.
Nu t$ng s hng S nm trong khong tin cy 95%, chúng ta do  phát biu rng
hai nhóm không khác nhau; nu S nm ngoài khong tin cy 95%, ó tín hiu cho thy
hai nhóm khác nhau có ý ngh&a thng kê.
2. Kim nh Wilcoxon: mt ví d
Ví d 1: S liu sau ây (do m!t bn c cung cp) v m!t nghiên cu so sánh t'
l thi sodium qua ng nc tiu (fractional excretion FE) gi#a hai nhóm bnh
nhân, tm gi nhóm 1 nhóm 2. S liu FE (trích d(n  minh ha cho d) c%a
hai nhóm nh sau:
Bng 1. T l thi sodium (tính bng phn trm) qua ng nc tiu ca 25 i
tng
Nhóm 1 (g)m 10 bnh nhân):
1.51, 0.07, 0.21, 0.29, 0.04, 0.03, 0.11, 0.00, 0.05, 0.00
Nhóm 2: (g)m 15 bnh nhân):
0.08, 0.41, 11.60, 0.09, 0.00, 0.44, 0.03, 0.21, 0.28,0.36,
0.73, 0.05, 0.23, 0.06, 0.14
Chúng ta mun kim nh gi thit FE c%a hai nhóm tơng ơng nhau. M!t phơng
pháp “chun”  xét nghim gi nh này là kim nh t (t-test). Nhng biu ) sau ây
cho thy s liu rt ri rc. Phn ln (75%) bnh nhân có phn trm FE thp hơn 0.30%,
m!t bnh nhân giá tr FE cao nht (11.6%). Trong tt c các m hoán chuyn
nh arsine, logarít, hàm m, v.v… u không th chun hóa (normalize) s liu. Do ó,
phơng pháp kim nh t không th ng dng trong trng hp này.
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun 4
Histogram of fe
fe
Frequency
0 2 4 6 8 10 12
0 2 4 6 8 10 12 14
Biu  1. Phân phi c%a FE trong hai nhóm bnh nhân
Nh  cp trong phn u, m!t phơng pháp thay th cho kim nh t kim
nh Wilcoxon trong nhóm các phơng pháp phi tham s. Gi nh chính c%a phơng
pháp Wilcoxon i tng c%a hai nhóm c chn m!t cách ng(u nhiên !c lp
nhau. Phơng pháp Wilcoxon không òi hi s liu FE phi tuân theo lut phân phi
chun.
Phơng pháp nh toán c%a kim nh Wilcoxon th mô t bng các bc c
th nh sau:
Bc 1: t$ng hp s liu c%a hai nhóm trong Bng 1 vi nhau thành m!t nhóm
chung:
1.51, 0.07, 0.21, 0.29, 0.04, 0.03, 0.11, 0.00, 0.05, 0.00
0.08, 0.41, 11.60, 0.09, 0.00, 0.44, 0.03, 0.21, 0.28,0.36,
0.73, 0.05, 0.23, 0.06, 0.14
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun 5
Bc 2: sp xp các giá tr t thp nht n cao nht, cho hng (rank), tính
t$ng s c%a hng:
0.00 0.00 0.00 0.03 0.03 0.04 0.05 0.05 0.06 0.07 0.08 0.09
0.11 0.14 0.21 0.21 0.23 0.28 0.29 0.36 0.41 0.44 0.73 1.51
11.60
cho hng nh sau:
FE Hng Hng liên
kt
0.00 1 2
0.00 1 2
0.00 1 2
0.03 2 4.5
0.03 2 4.5
0.04 3 6
0.05 4 7.5
0.05 4 7.5
0.06 5 9
0.07 6 10
0.08 7 11
0.09 8 12
0.11 9 13
0.14 10 14
0.21 11 15.5
0.21 11 15.5
0.23 12 17
0.28 13 18
0.29 14 19
0.36 15 20
0.41 16 21
0.44 17 22
0.73 18 23
1.51 19 24
11.60 20 25
Tng s nhóm 2 221.5
Chú ý: s liu tô m là thu!c nhóm 2.
Chúng ta chú ý trong bng trên, có 2 loi hng: hng ơn ginhng liên kt (tied
rank). Hng ơn gin s hng t thp nht n cao nht, theo ó các i tng
vi FE 0 chúng ta cho hng 1, và i tng vi FE bng 11.6 có hng 20.