intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Lâm sàng thống kê: Chương 2,3 - Nguyễn Văn Tuấn

Chia sẻ: To Thi Ly | Ngày: | Loại File: PDF | Số trang:10

134
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Một trong những hàm số hoán chuyển là lagarit. Khi một biến số đã hoán chuyển sang một đơn vị khác thì tất cả các số tung bình và độ lệch chuẩn cũng thay đổi, cách diễn dịch cũng thay đổi.

Chủ đề:
Lưu

Nội dung Text: Lâm sàng thống kê: Chương 2,3 - Nguyễn Văn Tuấn

  1. Lâm sàng th ng kê Ư c tính kho ng tin c y 95% cho m t bi n s ã hoán chuy n sang ơn v logarít H i: “Nhi u bi n s lâm sàng không tuân theo lu t phân ph i Gaussian, do ó cách tính kho ng tin c y 95% theo phương pháp thông thư ng không th áp d ng. N u ph i bi n i bi n s sang logarít thì cách tính kho ng tin c y 95% s như th nào?” R t nhi u bi n s lâm sàng (và trong sinh h c nói chung) như lư ng ư ng trong máu, cholesterol trong máu, và nhi u ch s sinh h c khác không tuân theo lu t phân ph i chu n. Trong trư ng h p này, phương pháp mô t bi n s thư ng là s trung v (median), và các i m t phân v 25% và 75% (t c là 25th quartile và 75th quartile). Nhưng cũng có trư ng h p phân tích, chúng ta c n ph i hoán chuy n các bi n s này sang m t ơn v khác sao cho tuân theo lu t phân ph i chu n. M t trong nh ng hàm s hoán chuy n là logarít. Khi m t bi n s ã hoán chuy n sang m t ơn v khác thì t t c các s trung bình và l ch chu n cũng thay i, cách di n d ch cũng thay i. Bài vi t này s trình bày m t cách tính r t ơn gi n duy trì ý nghĩa sinh h c ban u c a bi n s . Hãy l y m t ví d c th . Chúng ta o lư ng SHBG 50 b nh nhân nam tu i 60 tr lên, và k t qu như sau: 53.6, 87.1, 35.2, 40.7, 74.5, 35.6, 82.9, 50.2, 33.8, 40.6, 110.5, 147.6, 35.8, 52.5, 72.5, 90.5, 37.8, 76.0, 48.5, 44.7, 53.2, 32.6, 39.3, 49.4, 34.6, 99.3, 46.4, 73.2, 57.7, 24.9, 45.5, 46.7, 45.9, 50.8, 69.2, 57.2, 30.0, 31.5, 50.8, 46.6, 70.8, 64.4, 34.2, 51.9, 49.8, 78.3, 52.1, 33.4, 35.5, 67.4 M t vài ch s th ng kê cho bi n s SHBG có th ư c tính như sau: S trung bình 55.46 l ch chu n 23.42 Trung v 50 N u tính theo lu t phân ph i chu n, kho ng tin c y 95% c a SHBG là: 55.46–1.96×23.42 = 9.55 và 101.37 mmol/L. Nhưng trư c khi ch p nh n s h p lí c a kho ng tin c y này, chúng ta ph i xem qua phân ph i c a bi n SHBG (Bi u 1) dư i ây. Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 1
  2. Histogram of shbg 12 10 8 Frequency 6 4 2 0 20 40 60 80 100 120 140 shbg Bi u 1: Phân ph i c a bi n SHBG Như có th th y, ph n l n b nh nhân có SHBG th p hơn 80 mmol/L, và r t ít b nh nhân v i SHBG cao hơn 80 mmol/L. Nói cách khác, phân ph i c a SHBG xiên l ch v nh ng giá tr th p, không cân i, t c là không tuân theo lu t phân ph i chu n (Normal distribution). Do ó, kho ng tin c y 95% và s trung bình v a ư c tính trên không có ý nghĩa vì ã vi ph m m t qui lu t th ng kê h c. Cách “kh c ph c” cho tình tr ng này là hoán chuy n SHBG sang m t ơn v sao cho tuân theo lu t phân ph i chu n. Vì l ch v m t phía (phía trái) chúng ta có th áp d ng hàm s logarít hoán chuy n. Ch ng h n như thay vì 53.6, chúng ta chuy n thành log(53.6) = 3.98. Ti p t c hoán chuy n như th , chúng ta s có m t dãy s m i như sau: 3.982 4.467 3.561 3.706 4.311 3.572 4.418 3.916 3.520 3.704 4.705 4.995 3.578 3.961 4.284 4.505 3.632 4.331 3.882 3.800 3.974 3.484 3.671 3.900 3.544 4.598 3.837 4.293 4.055 3.215 3.818 3.844 3.826 3.928 4.237 4.047 3.401 3.450 3.928 3.842 4.260 4.165 3.532 3.949 3.908 4.361 3.953 3.509 3.570 4.211 Bây gi chúng ta th xem phân ph i c a log(SHBG) (Bi u 2): Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 2
  3. Histogram of log(shbg) 15 10 Frequency 5 0 3.5 4.0 4.5 5.0 log(shbg) Bi u 2: Phân ph i c a bi n log(SHBG) Phân ph i này v n chưa tho áng, vì v n còn xiên l ch. Chúng ta ý th y giá tr cao nh t c a log(SHBG) là kho ng 5, cho nên chúng ta có th áp d ng m t hàm s hoán chuy n m i: log(SHBG + 5). Ch ng h n như n u SHBG = 53.6, thì log(SHBG+5) = log(53.6 + 5) = 4.07. Giá tr m i này cho 50 b nh nhân và bi u phân ph i như sau: 4.071 4.523 3.694 3.822 4.376 3.704 4.476 4.011 3.658 3.820 4.749 5.028 3.709 4.052 4.350 4.559 3.757 4.394 3.980 3.906 4.064 3.627 3.791 3.996 3.679 4.647 3.940 4.359 4.138 3.398 3.922 3.945 3.930 4.022 4.307 4.130 3.555 3.597 4.022 3.944 4.328 4.240 3.669 4.041 4.004 4.422 4.045 3.648 3.701 4.282 Histogram of log(shbg + 5) 10 8 Frequency 6 4 2 0 3.5 4.0 4.5 5.0 log(shbg + 5) Bi u 3: Phân ph i c a bi n log(SHBG+5) Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 3
  4. Bây gi thì chúng ta ã thành công hoán chuy n SHBG sang phân ph i chu n. Do ó, chúng ta có th ư c tính s trung bình và l ch chu n cho bi n s m i: Trung bình log(SHBG+5): 4.041 l ch chu n (SD) c a log(SHBG+5): 0.3427 Như v y, kho ng tin c y 95% c a bi n s m i là: 4.041-1.96×0.3427 = 3.369 n 4.041+1.96×0.3427 = 4.712. V n t ra là chúng ta c n ph i hoán chuy n ngư c l i ơn v mmol/L, vì m t ơn v logarít r t khó hi u và khó di n d ch. hoán chuy n ngư c l i, chúng ta t m g i log(SHBG+5) = y, và m c tiêu là chúng ta tìm SHBG: Log(SHBG + 5) = y Do ó, SHBG +5 = ey Hay, c th hơn: SHBG = ey – 5 Do ó, s trung bình và kho ng tin c y 95% SHBG có th ư c tính như sau: Trung bình SHBG: e4.041 – 5 = 51.86 mmol/L Và kho ng tin c y 95%: e3.369 – 5 = 24.05 n e4.712 – 5 = 106.3 mmol/L. Chúng ta có th so sánh k t qu ư c tính “sai” và k t qu ư c tính “ úng” như sau: Ư c tính không hoán chuy n Ư c tính d a vào hoán chuy n logarít S trung bình 55.46 51.86 Kho ng tin c y 95% CI 23.42 – 101.37 24.05 – 106.3 Nhìn vào Bi u 1, chúng ta s th y ngay r ng các ư c s d a vào hoán chuy n logarít h p lí hơn là nh ng ư c s không hoán chuy n, vì chúng ph n nh y hơn s phân ph i c a SHBG. Ví d trên ây cho th y trư c khi phân tích b ng b t c mô hình nào, chúng ta c n ph i xem xét c n th n phân ph i c a bi n s . B i vì ph n l n các phương pháp phân tích th ng kê d a vào gi nh lu t phân ph i chu n, vi ph m gi nh này cũng có nghĩa là k t qu không có ý nghĩa khoa h c cao. Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 4
  5. Ghi chú: Các tính toán trên ây có th th c hi n b ng máy tính c m tay hay Excel. Nhưng i v i b n c quen s d ng ngôn ng th ng kê R, thì các tính toán và bi u trên ư c th c hi n b ng các mã sau ây. (B n c có th c t t t c mã và dán vào R t mình ki m nghi m). # nh p s li u 50 b nh nhân vào bi n có tên là shbg shbg
  6. Mu n bi t thêm cách s d ng R cho phân tích th ng kê, các b n có th tham kh o cu n sách “Phân tích s li u và t o bi u b ng R” c a tôi, do Nhà xu t b n Khoa h c K thu t phát hành u năm 2007. Nguy n Văn Tu n Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 6
  7. Lâm sàng th ng kê Kho ng tin c y 95% c a trung v Nguy n Văn Tu n H i: “Em o m t bi n s lâm sàng, nhưng vì bi n s này không tuân theo lu t phân ph i chu n, nên em ph i dùng s trung v mô t bi n s . Em mu n bi t cách tính kho ng tin c y 95% c a nó. Tìm trong sách giáo khoa không th y sách nào ch cách tính này. Mong th y ch cách tính kho ng tin c y 95% c a s trung v .” ây là m t v n thú v ! i v i các bi n không tuân theo lu t phân ph i chu n, chúng ta không th s d ng s trung bình và l ch chu n mô t bi n. Thay vào ó, chúng ta ph i áp d ng các phương pháp th ng kê phi tham s (non-parametric statistics) tính. M t trong nh ng ch s mô t trung bình c a bi n là s trung v (median). úng như b n c vi t, các sách giáo khoa không mô t cách tính kho ng tin c y 95% c a s trung v . ơn gi n vì … không có công th c nào tính. Tuy nhiên, trong ba th p niên tr l i ây, v i s phát tri n c a máy tính, m t cu c cách m ng th ng kê ã x y ra. Phương pháp cách m ng ó có tên là “bootstrap method” do nhà th ng kê h c Bradley Efron phát tri n vào năm 1979. Phương pháp bootstrap ã ư c ng d ng r ng rãi trong nhi u lĩnh v c khoa h c, và n nay có th xem là m t phương pháp chu n. Trong bài này, tôi s “l i d ng” câu h i gi i thi u phương pháp này. Vì ph i s d ng máy tính, cho nên b n c c n ph i bi t qua m t ngôn ng th ng kê, ch ng h n như R ti n vi c theo dõi. Chúng ta s b t u b ng m t ví d c th . Phương pháp ư c tính s trung v Ví d 1. S li u v ch s au (pain index) 11 b nh nhân th p kh p như sau: 0.05, 0.15, 0.35, 0.25, 0.20, 0.05, 0.10, 0.05, 0.30, 0.05, và 0.25 (Chú ý ch s càng cao, au càng nghiêm tr ng). S trung bình c a 11 b nh nhân là 0.163 và l ch chu n 0.112. Vì s trung bình th p hơn 2 l n l ch chu n, chúng ta có th k t lu n r ng bi n s này không tuân theo lu t phân ph i chu n. Cách tính median có th ti n hành qua hai bư c ơn gi n sau ây: • Bư c 1: S p x p d li u theo th t t th p nh t n cao nh t: 0.05, 0.05, 0.05, 0.05, 0.10, 0.15, 0.20, 0.25, 0.25, 0.30, 0.35 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 1
  8. Chú ý: hàng th 2 (s trong ngo c) là s th t t th p n cao. • Bư c 2: Xác nh s gi a. Vì có 11 b nh nhân, s gi a ph i là s hàng th 6. S hàng th 6 là 0.15 và ây chính là s trung v : 0.05, 0.05, 0.05, 0.05, 0.10, 0.15, 0.20, 0.25, 0.25, 0.30, 0.35 Phương pháp bootstrap V n bây gi là xác nh kho ng tin c y 95% c a s trung v . Nói cách khác, n u nghiên c u ư c l p l i 1000 l n, và m i l n ch n 11 i tư ng, thì kho ng tin c y c a s trung v ra sao. Phương pháp bootstrap r t có ích gi i quy t v n . Phương pháp này ư c ti n hành như sau: • Bư c 1: B t u b ng m u g c x1, x2, x3, …, xn. Trong ví d trên: 0.05, 0.05, 0.05, 0.05, 0.10, 0.15, 0.20, 0.25, 0.25, 0.30, 0.35 • Bư c 2: Ch n ng u nhiên n cá nhân t m u g c v i qui trình l y m u có hoàn l i (replacement sample). M i l n ch n m u, tính s trung v và t m g i s này là mi. C n gi i thích thêm ây v phương pháp l y m u có hoàn l i có nghĩa là m t cá nhân có th ư c hơn m t l n trong m t l n ch n m u. Ch ng h n như t qu n th 2, 3, 4, 5, l y m u có hoàn l i có nghĩa là l n ch n m u th nh t có th là 2, 4, 5, 2 (t c i tư ng th hai ư c ch n hai l n); l n th hai có th là 4, 4, 2, 2, 5 (t c i tư ng th hai và th tư ư c ch n hai l n); l n th ba có th là 2, 5, 2, 3; v.v... • Bư c 3: L p l i bư c hai N l n (N thư ng là 1000 hay 10000 hay th m chí 1 tri u – tùy theo nhu c u). Trong trư ng h p trên, 10 m u u tiên có th là: M u 1: 0.05 0.05 0.10 0.05 0.20 0.20 0.05 0.25 0.10 0.10 0.30 0.10 M u 2: 0.05 0.25 0.30 0.05 0.30 0.30 0.05 0.05 0.25 0.05 0.35 0.25 M u 3: 0.35 0.10 0.05 0.25 0.05 0.05 0.20 0.25 0.15 0.25 0.10 0.15 M u 4: 0.05 0.05 0.10 0.25 0.15 0.05 0.20 0.05 0.10 0.25 0.05 0.10 M u 5: 0.30 0.25 0.05 0.25 0.25 0.05 0.20 0.05 0.25 0.05 0.05 0.20 M u 6: 0.05 0.25 0.10 0.05 0.05 0.15 0.25 0.05 0.05 0.05 0.05 0.05 M u 7: 0.05 0.15 0.25 0.05 0.05 0.30 0.20 0.25 0.30 0.05 0.35 0.20 M u 8: 0.05 0.05 0.20 0.05 0.10 0.05 0.05 0.10 0.20 0.10 0.05 0.05 M u 9: 0.05 0.05 0.10 0.25 0.20 0.25 0.25 0.20 0.35 0.25 0.35 0.25 M u 10: 0.05 0.05 0.05 0.25 0.35 0.25 0.25 0.15 0.20 0.20 0.15 0.20 v.v… Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 2
  9. (Chú ý: s phía sau có nghĩa là s trung v cho t ng m u) • Bư c 4: n ây chúng ta có N s trung v . S p x p N s t th p n cao và ánh s : 1, 2, 3, …, N. Ch n s trung v h ng 2.5% và 97.5% c a N s trung v , và ó chính là kho ng tin c y 95%. Ch ng h n như n u N = 1000 l n, thì kho ng tin c y 95% chính là s trung v hàng th 25 và 975. Các bư c tính toán trên có th th c hi n b ng ngôn ng R (hay m t ngôn ng hay ph n m m nào mà b n c quen thu c) r t d dàng. i v i R, các mã s d ng (và gi i thích kèm theo) như sau: # nh p các s li u g c vào m t vector có tên là x x
  10. Vì phương pháp bootstrap òi h i có máy tính, và do ó, ngư i s d ng ph i am hi u m t ngôn ng hay ph n m m th ng kê. Trong bài này, tôi s d ng ngôn ng R th c hi n phương pháp bootstrap, vì R là m t ngôn ng tương i d s d ng nhưng r t linh ho t tính toán các v n khó trong th c t nghiên c u lâm sàng. B n c mu n bi t thêm v ngôn ng R có th tìm c cu n sách “Phân tích s li u và t o bi u b ng R” c a tôi, do Nhà xu t b n Khoa h c K thu t phát hành u năm 2007. Trong ó có ph n hư ng d n cách ch n m u như s d ng trong bài vi t này. Thu t ng s d ng trong bài vi t Ti ng Vi t Ti ng Anh Th ng kê phi tham s Non-parametric statistics Trung v Median Kho ng tin c y 95% 95% confidence interval Chương trình hu n luy n y khoa – YKHOA.NET Training – Nguy n Văn Tu n 4
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2