
Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
1
Lâm sàng thng kê
c tính khong tin cy 95%
cho mt bin s ã hoán chuyn sang ơn v logarít
Hi: “Nhiu bin s lâm sàng không tuân theo lut phân phi Gaussian, do ó
cách tính khong tin cy 95% theo phng pháp thông thng không th áp dng. Nu
phi bin i bin s sang logarít thì cách tính khong tin cy 95% s nh th nào?”
Rt nhiu bin s lâm sàng (và trong sinh hc nói chung) nh lng ng trong
máu, cholesterol trong máu, và nhiu ch s sinh hc khác không tuân theo lut phân
phi chun. Trong trng hp này, phơng pháp mô t bin s thng là s trung v
(median), và các im t phân v 25% và 75% (tc là 25th quartile và 75th quartile).
Nhng cng có trng hp phân tích, chúng ta cn phi hoán chuyn các bin s này
sang mt ơn v khác sao cho tuân theo lut phân phi chun. Mt trong nhng hàm s
hoán chuyn là logarít. Khi mt bin s ã hoán chuyn sang mt ơn v khác thì tt c
các s trung bình và lch chun cng thay i, cách din dch cng thay i. Bài vit
này s trình bày mt cách tính rt ơn gin duy trì ý ngha sinh hc ban u ca bin
s.
Hãy ly mt ví d c th. Chúng ta o lng SHBG 50 bnh nhân nam tui
60 tr lên, và kt qu nh sau:
53.6, 87.1, 35.2, 40.7, 74.5, 35.6, 82.9, 50.2, 33.8, 40.6,
110.5, 147.6, 35.8, 52.5, 72.5, 90.5, 37.8, 76.0, 48.5, 44.7,
53.2, 32.6, 39.3, 49.4, 34.6, 99.3, 46.4, 73.2, 57.7, 24.9,
45.5, 46.7, 45.9, 50.8, 69.2, 57.2, 30.0, 31.5, 50.8, 46.6,
70.8, 64.4, 34.2, 51.9, 49.8, 78.3, 52.1, 33.4, 35.5, 67.4
Mt vài ch s thng kê cho bin s SHBG có th c tính nh sau:
S trung bình 55.46
lch chun 23.42
Trung v 50
Nu tính theo lut phân phi chun, khong tin cy 95% ca SHBG là: 55.46–1.96×23.42
= 9.55 và 101.37 mmol/L. Nhng trc khi chp nhn s! hp lí ca khong tin cy này,
chúng ta phi xem qua phân phi ca bin SHBG (Biu 1) di ây.

Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
2
Histogram of shbg
shbg
Frequency
20 40 60 80 100 120 140
0
2
4
6
8
10
12
Biu 1: Phân phi ca bin SHBG
Nh có th thy, phn ln bnh nhân có SHBG thp hơn 80 mmol/L, và rt ít bnh
nhân vi SHBG cao hơn 80 mmol/L. Nói cách khác, phân phi ca SHBG xiên lch v
nhng giá tr thp, không cân i, tc là không tuân theo lut phân phi chun (Normal
distribution). Do ó, khong tin cy 95% và s trung bình v"a c tính trên không có ý
ngha vì ã vi ph#m mt qui lut thng kê hc.
Cách “kh$c phc” cho tình tr#ng này là hoán chuyn SHBG sang mt ơn v sao
cho tuân theo lut phân phi chun. Vì lch v mt phía (phía trái) chúng ta có th áp
dng hàm s logarít hoán chuyn. Ch%ng h#n nh thay vì 53.6, chúng ta chuyn thành
log(53.6) = 3.98. Tip tc hoán chuyn nh th, chúng ta s có mt dãy s mi nh sau:
3.982 4.467 3.561 3.706 4.311 3.572 4.418 3.916 3.520 3.704 4.705 4.995 3.578 3.961
4.284 4.505 3.632 4.331 3.882 3.800 3.974 3.484 3.671 3.900 3.544 4.598 3.837 4.293
4.055 3.215 3.818 3.844 3.826 3.928 4.237 4.047 3.401 3.450 3.928 3.842 4.260 4.165
3.532 3.949 3.908 4.361 3.953 3.509 3.570 4.211
Bây gi chúng ta th& xem phân phi ca log(SHBG) (Biu 2):

Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
3
Histogram of log(shbg)
log(shbg)
Frequency
3.5 4.0 4.5 5.0
0
5
10
15
Biu 2: Phân phi ca bin log(SHBG)
Phân phi này v'n cha tho áng, vì v'n còn xiên lch. Chúng ta ý thy giá tr cao
nht ca log(SHBG) là khong 5, cho nên chúng ta có th áp dng mt hàm s hoán
chuyn mi: log(SHBG + 5). Ch%ng h#n nh nu SHBG = 53.6, thì log(SHBG+5) =
log(53.6 + 5) = 4.07. Giá tr mi này cho 50 bnh nhân và biu ( phân phi nh sau:
4.071 4.523 3.694 3.822 4.376 3.704 4.476 4.011 3.658 3.820 4.749 5.028 3.709 4.052
4.350 4.559 3.757 4.394 3.980 3.906 4.064 3.627 3.791 3.996 3.679 4.647 3.940 4.359
4.138 3.398 3.922 3.945 3.930 4.022 4.307 4.130 3.555 3.597 4.022 3.944 4.328 4.240
3.669 4.041 4.004 4.422 4.045 3.648 3.701 4.282
Histogram of log(shbg + 5)
log(shbg + 5)
Frequency
3.5 4.0 4.5 5.0
0
2
4
6
8
10
Biu 3: Phân phi ca bin log(SHBG+5)

Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
4
Bây gi thì chúng ta ã thành công hoán chuyn SHBG sang phân phi chun. Do ó, chúng
ta có th c tính s trung bình và lch chun cho bin s mi:
Trung bình log(SHBG+5): 4.041
lch chun (SD) ca log(SHBG+5): 0.3427
Nh vy, khong tin cy 95% ca bin s mi là: 4.041-1.96×0.3427 = 3.369 n
4.041+1.96×0.3427 = 4.712.
Vn )t ra là chúng ta cn phi hoán chuyn ngc l#i ơn v mmol/L, vì mt ơn v
logarít rt khó hiu và khó din dch. hoán chuyn ngc l#i, chúng ta t#m gi
log(SHBG+5) = y, và mc tiêu là chúng ta tìm SHBG:
Log(SHBG + 5) = y
Do ó,
SHBG +5 = ey
Hay, c th hơn:
SHBG = ey – 5
Do ó, s trung bình và khong tin cy 95% SHBG có th c tính nh sau:
Trung bình SHBG: e4.041 – 5 = 51.86 mmol/L
Và khong tin cy 95%: e3.369 – 5 = 24.05 n e4.712 – 5 = 106.3 mmol/L.
Chúng ta có th so sánh kt qu c tính “sai” và kt qu c tính “úng” nh sau:
*c tính không hoán chuyn
*c tính d!a vào hoán
chuyn logarít
S trung bình 55.46 51.86
Khong tin cy 95% CI 23.42 – 101.37 24.05 – 106.3
Nhìn vào Biu ( 1, chúng ta s thy ngay r+ng các c s d!a vào hoán chuyn logarít hp
lí hơn là nhng c s không hoán chuyn, vì chúng phn nh y hơn s! phân phi ca
SHBG.
Ví d trên ây cho thy trc khi phân tích b+ng bt c mô hình nào, chúng ta cn phi xem
xét cn thn phân phi ca bin s. Bi vì phn ln các phơng pháp phân tích thng kê d!a
vào gi nh lut phân phi chun, vi ph#m gi nh này cng có ngha là kt qu không có ý
ngha khoa hc cao.

Chng trình hun luyn y khoa – YKHOA.NET Training – Nguyn Vn Tun
5
Ghi chú:
Các tính toán trên ây có th th!c hin b+ng máy tính cm tay hay Excel. Nhng i vi b#n
c quen s& dng ngôn ng thng kê R, thì các tính toán và biu ( trên c th!c hin b+ng
các mã sau ây. (B#n c có th c$t tt c mã và dán vào R t! mình kim nghim).
# nhp s liu 50 bnh nhân vào bin có tên là shbg
shbg <- c(53.6, 87.1, 35.2, 40.7, 74.5, 35.6, 82.9, 50.2, 33.8, 40.6,
110.5, 147.6, 35.8, 52.5, 72.5, 90.5, 37.8, 76.0, 48.5,
44.7, 53.2, 32.6, 39.3, 49.4, 34.6, 99.3, 46.4, 73.2, 57.7,
24.9, 45.5, 46.7, 45.9, 50.8, 69.2, 57.2, 30.0, 31.5, 50.8,
46.6, 70.8, 64.4, 34.2, 51.9, 49.8, 78.3, 52.1, 33.4,
35.5, 67.4)
# c tính s trung bình, lch chun và 95% CI
mean(shbg)
sd(shbg)
lower95 <- mean(shbg) – 1.96*sd(shbg)
upper95 <- mean(shbg) + 1.96*sd(shbg)
# v biu 1
hist(shbg, breaks=15)
# hoán chuyn sang log(shbg+5)
logshbg <- log(shbg +5)
# v biu 3
hist(logshbg)
# tính s trung bình, sd, 95% CI
m <- mean(logshbg)
stdev <- sd(logshbg)
lower95 <- mean(logshbg) – 1.96*sd(logshbg)
upper95 <- mean(logshbg) + 1.96*sd(logshbg)
# hoán chuyn ngc v shbg
exp(m) – 5
exp(lower95) – 5
exp(upper95) – 5

