Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
1
Lâm sàng thng kê
c tính khong tin cy 95%
cho mt bin s ã hoán chuyn sang ơn v logarít
Hi: “Nhiu bin s lâm sàng không tuân theo lut phân phi Gaussian, do ó
cách tính khong tin cy 95% theo phng pháp thông thng không th áp dng. Nu
phi bin i bin s sang logarít thì cách tính khong tin cy 95% s nh th nào?”
Rt nhiu bin s lâm sàng (và trong sinh hc nói chung) nh lng ng trong
máu,  cholesterol trong máu, nhiu ch s sinh hc khác không tuân theo lut phân
phi chun. Trong trng hp y, phơng pháp t bin s thng s trung v
(median), các im t phân v 25% 75% (tc 25th quartile 75th quartile).
Nhng cng trng hp phân tích, chúng ta cn phi hoán chuyn các bin s y
sang mt ơn v khác sao cho tuân theo lut phân phi chun. Mt trong nhng hàm s
hoán chuyn logarít. Khi mt bin s ã hoán chuyn sang mt ơn v khác thì tt c
các s trung bình  lch chun cng thay i, cách din dch cng thay i. Bài vit
này s trình y mt cách nh rt ơn gin  duy trì ý ngha sinh hc ban u ca bin
s.
Hãy ly mt ví d c th. Chúng ta o lng  SHBG 50 bnh nhân nam tui
60 tr lên, và kt qu nh sau:
53.6, 87.1, 35.2, 40.7, 74.5, 35.6, 82.9, 50.2, 33.8, 40.6,
110.5, 147.6, 35.8, 52.5, 72.5, 90.5, 37.8, 76.0, 48.5, 44.7,
53.2, 32.6, 39.3, 49.4, 34.6, 99.3, 46.4, 73.2, 57.7, 24.9,
45.5, 46.7, 45.9, 50.8, 69.2, 57.2, 30.0, 31.5, 50.8, 46.6,
70.8, 64.4, 34.2, 51.9, 49.8, 78.3, 52.1, 33.4, 35.5, 67.4
Mt vài ch s thng kê cho bin s SHBG có th c tính nh sau:
S trung bình 55.46
lch chun 23.42
Trung v 50
Nu tính theo lut phân phi chun, khong tin cy 95% ca SHBG là: 55.46–1.96×23.42
= 9.55 101.37 mmol/L. Nhng trc khi chp nhn s! hp lí ca khong tin cy y,
chúng ta phi xem qua phân phi ca bin SHBG (Biu  1) di ây.
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
2
Histogram of shbg
shbg
Frequency
20 40 60 80 100 120 140
0
2
4
6
8
10
12
Biu  1: Phân phi ca bin SHBG
Nh th thy, phn ln bnh nhân  SHBG thp hơn 80 mmol/L, rt ít bnh
nhân vi SHBG cao hơn 80 mmol/L. Nói cách khác, phân phi ca SHBG xiên lch v
nhng giá tr thp, không cân i, tc không tuân theo lut phân phi chun (Normal
distribution). Do ó, khong tin cy 95% s trung bình v"a c tính trên không ý
ngha vì ã vi ph#m mt qui lut thng kê hc.
Cách kh$c phc” cho tình tr#ng này là hoán chuyn SHBG sang mt ơn v sao
cho tuân theo lut phân phi chun.  lch v mt phía (phía trái) chúng ta có th áp
dng hàm s logarít  hoán chuyn. Ch%ng h#n nh thay vì 53.6, chúng ta chuyn thành
log(53.6) = 3.98. Tip tc hoán chuyn nh th, chúng ta s có mt dãy s mi nh sau:
3.982 4.467 3.561 3.706 4.311 3.572 4.418 3.916 3.520 3.704 4.705 4.995 3.578 3.961
4.284 4.505 3.632 4.331 3.882 3.800 3.974 3.484 3.671 3.900 3.544 4.598 3.837 4.293
4.055 3.215 3.818 3.844 3.826 3.928 4.237 4.047 3.401 3.450 3.928 3.842 4.260 4.165
3.532 3.949 3.908 4.361 3.953 3.509 3.570 4.211
Bây gi chúng ta th& xem phân phi ca log(SHBG) (Biu  2):
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
3
Histogram of log(shbg)
log(shbg)
Frequency
3.5 4.0 4.5 5.0
0
5
10
15
Biu  2: Phân phi ca bin log(SHBG)
Phân phi này v'n cha tho áng, v'n còn xiên lch. Chúng ta  ý thy giá tr cao
nht ca log(SHBG) khong 5, cho nên chúng ta th áp dng mt hàm s hoán
chuyn mi: log(SHBG + 5). Ch%ng h#n nh nu SHBG = 53.6, thì log(SHBG+5) =
log(53.6 + 5) = 4.07. Giá tr mi này cho 50 bnh nhân và biu ( phân phi nh sau:
4.071 4.523 3.694 3.822 4.376 3.704 4.476 4.011 3.658 3.820 4.749 5.028 3.709 4.052
4.350 4.559 3.757 4.394 3.980 3.906 4.064 3.627 3.791 3.996 3.679 4.647 3.940 4.359
4.138 3.398 3.922 3.945 3.930 4.022 4.307 4.130 3.555 3.597 4.022 3.944 4.328 4.240
3.669 4.041 4.004 4.422 4.045 3.648 3.701 4.282
Histogram of log(shbg + 5)
log(shbg + 5)
Frequency
3.5 4.0 4.5 5.0
0
2
4
6
8
10
Biu  3: Phân phi ca bin log(SHBG+5)
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
4
Bây gi thì chúng ta ã thành công hoán chuyn SHBG sang phân phi chun. Do ó, chúng
ta có th c tính s trung bình và  lch chun cho bin s mi:
Trung bình log(SHBG+5): 4.041
lch chun (SD) ca log(SHBG+5): 0.3427
Nh vy, khong tin cy 95% ca bin s mi là: 4.041-1.96×0.3427 = 3.369 n
4.041+1.96×0.3427 = 4.712.
Vn  )t ra là chúng ta cn phi hoán chuyn ngc l#i ơn v mmol/L, mt ơn v
logarít rt khó hiu khó din dch. hoán chuyn ngc l#i, chúng ta t#m gi
log(SHBG+5) = y, và mc tiêu là chúng ta tìm SHBG:
Log(SHBG + 5) = y
Do ó,
SHBG +5 = ey
Hay, c th hơn:
SHBG = ey – 5
Do ó, s trung bình và khong tin cy 95% SHBG có th c tính nh sau:
Trung bình SHBG: e4.041 – 5 = 51.86 mmol/L
Và khong tin cy 95%: e3.369 – 5 = 24.05 n e4.712 – 5 = 106.3 mmol/L.
Chúng ta có th so sánh kt qu c tính “sai” và kt qu c tính “úng” nh sau:
*c tính không hoán chuyn
*c tính d!a vào hoán
chuyn logarít
S trung bình 55.46 51.86
Khong tin cy 95% CI 23.42 – 101.37 24.05 – 106.3
Nhìn vào Biu ( 1, chúng ta s thy ngay r+ng các c s d!a vào hoán chuyn logarít hp
hơn nhng c s không hoán chuyn, chúng phn nh y  hơn s! phân phi ca
SHBG.
d trên ây cho thy trc khi phân tích b+ng bt c mô hình nào, chúng ta cn phi xem
xét cn thn phân phi ca bin s. Bi vì phn ln các phơng pháp phân tích thng kê d!a
vào gi nh lut phân phi chun, vi ph#m gi nh này cng ngha là kt qu không có ý
ngha khoa hc cao.
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
5
Ghi chú:
Các tính toán trên ây có th th!c hin b+ng máy tính cm tay hay Excel. Nhng i vi b#n
c quen s& dng ngôn ng thng kê R, thì các tính toán và biu ( trên c th!c hin b+ng
các mã sau ây. (B#n c có th c$t tt cdán vào R  t! mình kim nghim).
# nhp s liu 50 bnh nhân vào bin có tên là shbg
shbg <- c(53.6, 87.1, 35.2, 40.7, 74.5, 35.6, 82.9, 50.2, 33.8, 40.6,
110.5, 147.6, 35.8, 52.5, 72.5, 90.5, 37.8, 76.0, 48.5,
44.7, 53.2, 32.6, 39.3, 49.4, 34.6, 99.3, 46.4, 73.2, 57.7,
24.9, 45.5, 46.7, 45.9, 50.8, 69.2, 57.2, 30.0, 31.5, 50.8,
46.6, 70.8, 64.4, 34.2, 51.9, 49.8, 78.3, 52.1, 33.4,
35.5, 67.4)
# c tính s trung bình,  lch chun và 95% CI
mean(shbg)
sd(shbg)
lower95 <- mean(shbg) – 1.96*sd(shbg)
upper95 <- mean(shbg) + 1.96*sd(shbg)
# v biu  1
hist(shbg, breaks=15)
# hoán chuyn sang log(shbg+5)
logshbg <- log(shbg +5)
# v biu  3
hist(logshbg)
# tính s trung bình, sd, 95% CI
m <- mean(logshbg)
stdev <- sd(logshbg)
lower95 <- mean(logshbg) – 1.96*sd(logshbg)
upper95 <- mean(logshbg) + 1.96*sd(logshbg)
# hoán chuyn ngc v shbg
exp(m) – 5
exp(lower95) – 5
exp(upper95) – 5