Chương trình hun luyn y khoa – YKHOA.NET Training – Nguyn Văn Tun
1
Lâm sàng thng kê
Ước tính khong tin cy 95%
cho mt biến s đã hoán chuyn sang đơn v logarít
Hi: “Nhiu biến s lâm sàng không tuân theo lut phân phi Gaussian, do đó
cách tính khong tin cy 95% theo phương pháp thông thưng không th áp dng. Nếu
phi biến đổi biến s sang logarít thì cách tính khong tin cy 95% s như thế nào?”
Rt nhiu biến s lâm sàng (và trong sinh hc nói chung) như lượng đường trong
máu, độ cholesterol trong máu, nhiu ch s sinh hc khác không tuân theo lut phân
phi chun. Trong trường hp y, phương pháp t biến s thường s trung v
(median), các đim t phân v 25% 75% (tc 25th quartile 75th quartile).
Nhưng cũng trường hp phân tích, chúng ta cn phi hoán chuyn các biến s y
sang mt đơn v khác sao cho tuân theo lut phân phi chun. Mt trong nhng hàm s
hoán chuyn logarít. Khi mt biến s đã hoán chuyn sang mt đơn v khác thì tt c
các s trung bình độ lch chun cũng thay đổi, cách din dch cũng thay đổi. Bài viết
này s trình y mt cách nh rt đơn gin để duy trì ý nghĩa sinh hc ban đầu ca biến
s.
Hãy ly mt d c th. Chúng ta đo lường độ SHBG 50 bnh nhân nam tui
60 tr lên, và kết qu như sau:
53.6, 87.1, 35.2, 40.7, 74.5, 35.6, 82.9, 50.2, 33.8, 40.6,
110.5, 147.6, 35.8, 52.5, 72.5, 90.5, 37.8, 76.0, 48.5, 44.7,
53.2, 32.6, 39.3, 49.4, 34.6, 99.3, 46.4, 73.2, 57.7, 24.9,
45.5, 46.7, 45.9, 50.8, 69.2, 57.2, 30.0, 31.5, 50.8, 46.6,
70.8, 64.4, 34.2, 51.9, 49.8, 78.3, 52.1, 33.4, 35.5, 67.4
Mt vài ch s thng kê cho biến s SHBG có th ước tính như sau:
S trung bình 55.46
Độ lch chun 23.42
Trung v 50
Nếu tính theo lut phân phi chun, khong tin cy 95% ca SHBG là: 55.46–1.96×23.42
= 9.55 101.37 mmol/L. Nhưng trước khi chp nhn s hp lí ca khong tin cy y,
chúng ta phi xem qua phân phi ca biến SHBG (Biu đồ 1) dưới đây.
Chương trình hun luyn y khoa – YKHOA.NET Training – Nguyn Văn Tun
2
Histogram of shbg
shbg
Frequency
20 40 60 80 100 120 140
0
2
4
6
8
10
12
Biu đồ 1: Phân phi ca biến SHBG
Như th thy, phn ln bnh nhân độ SHBG thp hơn 80 mmol/L, rt ít bnh
nhân vi SHBG cao hơn 80 mmol/L. Nói cách khác, phân phi ca SHBG xiên lch v
nhng giá tr thp, không cân đối, tc không tuân theo lut phân phi chun (Normal
distribution). Do đó, khong tin cy 95% và s trung bình va ước tính trên không ý
nghĩa vì đã vi phm mt qui lut thng kê hc.
Cách khc phc” cho nh trng y là hoán chuyn SHBG sang mt đơn v sao
cho tuân theo lut phân phi chun. độ lch v mt phía (phía trái) chúng ta có th áp
dng hàm s logarít để hoán chuyn. Chng hn như thay vì 53.6, chúng ta chuyn thành
log(53.6) = 3.98. Tiếp tc hoán chuyn như thế, chúng ta s có mt dãy s mi như sau:
3.982 4.467 3.561 3.706 4.311 3.572 4.418 3.916 3.520 3.704 4.705 4.995 3.578 3.961
4.284 4.505 3.632 4.331 3.882 3.800 3.974 3.484 3.671 3.900 3.544 4.598 3.837 4.293
4.055 3.215 3.818 3.844 3.826 3.928 4.237 4.047 3.401 3.450 3.928 3.842 4.260 4.165
3.532 3.949 3.908 4.361 3.953 3.509 3.570 4.211
Bây gi chúng ta th xem phân phi ca log(SHBG) (Biu đồ 2):
Chương trình hun luyn y khoa – YKHOA.NET Training – Nguyn Văn Tun
3
Histogram of log(shbg)
log(shbg)
Frequency
3.5 4.0 4.5 5.0
0
5
10
15
Biu đồ 2: Phân phi ca biến log(SHBG)
Phân phi này vn chưa tho đáng, vn còn xiên lch. Chúng ta để ý thy gtr cao
nht ca log(SHBG) khong 5, cho nên chúng ta th áp dng mt hàm s hoán
chuyn mi: log(SHBG + 5). Chng hn như nếu SHBG = 53.6, t log(SHBG+5) =
log(53.6 + 5) = 4.07. Giá tr mi này cho 50 bnh nhân và biu đồ phân phi như sau:
4.071 4.523 3.694 3.822 4.376 3.704 4.476 4.011 3.658 3.820 4.749 5.028 3.709 4.052
4.350 4.559 3.757 4.394 3.980 3.906 4.064 3.627 3.791 3.996 3.679 4.647 3.940 4.359
4.138 3.398 3.922 3.945 3.930 4.022 4.307 4.130 3.555 3.597 4.022 3.944 4.328 4.240
3.669 4.041 4.004 4.422 4.045 3.648 3.701 4.282
Histogram of log(shbg + 5)
log(shbg + 5)
Frequency
3.5 4.0 4.5 5.0
0
2
4
6
8
10
Biu đồ 3: Phân phi ca biến log(SHBG+5)
Chương trình hun luyn y khoa – YKHOA.NET Training – Nguyn Văn Tun
4
Bây gi thì chúng ta đã thành công hoán chuyn SHBG sang phân phi chun. Do đó, chúng
ta có th ước tính s trung bình và độ lch chun cho biến s mi:
Trung bình log(SHBG+5): 4.041
Độ lch chun (SD) ca log(SHBG+5): 0.3427
Như vy, khong tin cy 95% ca biến s mi là: 4.041-1.96×0.3427 = 3.369 đến
4.041+1.96×0.3427 = 4.712.
Vn đề đặt ra là chúng ta cn phi hoán chuyn ngược li đơn v mmol/L, mt đơn v
logarít rt khó hiu khó din dch. Để hoán chuyn ngược li, chúng ta tm gi
log(SHBG+5) = y, và mc tiêu là chúng ta tìm SHBG:
Log(SHBG + 5) = y
Do đó,
SHBG +5 = ey
Hay, c th hơn:
SHBG = ey – 5
Do đó, s trung bình và khong tin cy 95% SHBG có th ước tính như sau:
Trung bình SHBG: e4.041 – 5 = 51.86 mmol/L
Và khong tin cy 95%: e3.369 – 5 = 24.05 đến e4.712 – 5 = 106.3 mmol/L.
Chúng ta có th so sánh kết qu ước tính “sai” và kết qu ước tính “đúng” như sau:
Ước tính không hoán chuyn
Ước tính da vào hoán
chuyn logarít
S trung bình 55.46 51.86
Khong tin cy 95% CI 23.42 – 101.37 24.05 – 106.3
Nhìn vào Biu đồ 1, chúng ta s thy ngay rng các ước s da vào hoán chuyn logarít hp
hơn nhng ước s không hoán chuyn, chúng phn nh đầy đủ hơn s phân phi ca
SHBG.
d trên đây cho thy trước khi phân tích bng bt c mô hình nào, chúng ta cn phi xem
xét cn thn phân phi ca biến s. Bi vì phn ln các phương pháp phân tích thng kê da
vào gi định lut phân phi chun, vi phm gi định này cũng nghĩa là kết qu không có ý
nghĩa khoa hc cao.
Chương trình hun luyn y khoa – YKHOA.NET Training – Nguyn Văn Tun
5
Ghi chú:
Các tính toán trên đây có th thc hin bng máy tính cm tay hay Excel. Nhưng đối vi bn
đọc quen s dng ngôn ng thng kê R, thì các tính toán và biu đồ trên được thc hin bng
các mã sau đây. (Bn đọc có th ct tt c mã và dán vào R để t mình kim nghim).
# nhp s liu 50 bnh nhân vào biến có tên là shbg
shbg <- c(53.6, 87.1, 35.2, 40.7, 74.5, 35.6, 82.9, 50.2, 33.8, 40.6,
110.5, 147.6, 35.8, 52.5, 72.5, 90.5, 37.8, 76.0, 48.5,
44.7, 53.2, 32.6, 39.3, 49.4, 34.6, 99.3, 46.4, 73.2, 57.7,
24.9, 45.5, 46.7, 45.9, 50.8, 69.2, 57.2, 30.0, 31.5, 50.8,
46.6, 70.8, 64.4, 34.2, 51.9, 49.8, 78.3, 52.1, 33.4,
35.5, 67.4)
# ước tính s trung bình, độ lch chun và 95% CI
mean(shbg)
sd(shbg)
lower95 <- mean(shbg) – 1.96*sd(shbg)
upper95 <- mean(shbg) + 1.96*sd(shbg)
# v biu đồ 1
hist(shbg, breaks=15)
# hoán chuyn sang log(shbg+5)
logshbg <- log(shbg +5)
# v biu đồ 3
hist(logshbg)
# tính s trung bình, sd, 95% CI
m <- mean(logshbg)
stdev <- sd(logshbg)
lower95 <- mean(logshbg) – 1.96*sd(logshbg)
upper95 <- mean(logshbg) + 1.96*sd(logshbg)
# hoán chuyn ngược v shbg
exp(m) – 5
exp(lower95) – 5
exp(upper95) – 5