intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Thống kê y học - Bài 13: Ước lượng

Chia sẻ: Nguyễn Bình Minh | Ngày: | Loại File: DOC | Số trang:8

192
lượt xem
16
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Thống kê y học - Bài 13: Ước lượng cung cấp các kiến thức giúp người học có thể trình bày được ý nghĩa của khoảng tin cậy 95%, trình bày và lựa chọn được phương pháp ước lượng khoảng tin cậy trung bình của một mẫu, trình bày được phương pháp ước lượng khoảng tin cậy hiệu số hai trung bình,... Mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Thống kê y học - Bài 13: Ước lượng

  1. ƯỚC LƯỢNG Mục tiêu: Sau khi nghiên cứu chủ đề, học viên có khả năng: ­ Trình bày được ý nghĩa của khoảng tin cậy 95% ­ Trình bày và lựa chọn được phương pháp ước lượng khoảng tin cậy trung bình của   một mẫu ­ Trình bày được phương pháp ước lượng khoảng tin cậy hiệu số hai trung bình ­ Trình bày phương pháp ước lượng khoảng tin cậy tỉ lệ của mẫu ­ Trình bày phương pháp ước lượng khoảng tin cậy của tỉ số nguy cơ và tỉ số số chênh 1. Giới thiệu Trong công việc hàng ngày và trong nghiên cứu khoa học, ta cần phải biết một số  những đặc tính của dân số. Thí dụ như chúng ta cần biết đường huyết trung bình của   người bình thường để có thể  chẩn đoán tiểu đường, cần biết trọng lượng trung bình  của trẻ sơ sinh để đáng giá sự phát triển của trẻ, cần biết tỉ lệ tiêm chủng hoặc tỉ lệ  đặt vòng nhằm lượng giá các chương trình y tế. Ðể   ước tính được các đặc tính (các tham số) đó của dân số, phương pháp chính xác   nhất là đo lường tất cả các giá trị của toàn bộ dân số. Tuy vậy điều này là không thực  tế bởi vì: ­ Những hạn chế về tài nguyên: chúng ta không thể tiến hành lấy máu của tất cả mọi  người Việt nam để tính giá trị đường huyết trung bình. Ðiều này gây lãng phí về  thời   gian, nhân lực và tiền bạc. ­ Tính không khả thi về phương diện áp dụng: Một bác sĩ  nhận thấy có tỉ  lệ  tai biến   khi sử dụng thuốc X dường như tăng cao. Ðể đo đạc tỉ lệ tai biến cho toàn bộ dân số  cần phải kéo dài việc sử  dụng thuốc để  có thể  sử  dụng thuốc này cho tất cả  mọi  người. Nhưng điều này là không thích hợp về phương diện đạo đức. Do đó, người ta cần phải đo đạc các giá trị trên một phần của dân số, được gọi là một   mẫu và tiến hành suy luận thống kê. Ðịnh nghĩa: Suy luận thống kê là quá trình trong đó người ta suy lận về dân số dựa trên  những kết quả thu được từ một mẫu rút ra từ dân số đó. Nhưng tham số  của dân số  có thể  được  ước tính bằng hai cách:  ước lượng điểm và   ước lượng khoảng.  Ước lượng điểm là một giá trị  bằng số  duy nhất nhằm để   ước  tính tham số tương ứng của dân số. Ước lượng khoảng bao gồm 2 trị số xác định một  khoảng mà chúng ta cho rằng khoảng này có chứa tham số được ước lượng, với một   độ tin tưởng nào đó. Một trong những tiêu chí để  đánh giá phương pháp  ước lượng là tính không sai lệch  (còn gọi là tính không chệch ­ unbiasedness). Một phương pháp ước lượng được gọi là  không sai lệch nếu trung bình của rất nhiều giá trị ước lượng bằng giá trị của tham số. Suy luận thống kê chính xác đòi hỏi việc lấy mẫu ngẫu nhiên từ  một khung mẫu và   khung mẫu này trùng với dân số mục tiêu. Nếu việc lấy mẫu không ngẫu nhiên hoặc  
  2. nếu khung mẫu không trùng với dân số  mục tiêu, chúng ta cần phải dựa vào những  luận cứ không phải là thống kê. 2. Ước lượng trung bình của dân số Ước lượng điểm: Trung bình của dân số (µ) có thể được ước lượng bằng trung bình của mẫu (theo định   lí giới hạn trung tâm, trung bình của mẫu nằm tập trung quanh trung bình của dân số).   Trung bình của mẫu được tính theo công thức sau: xi x n      Ước lượng khoảng Ðịnh lí giới hạn trung tâm chỉ  cho phép  ước lượng khoảng khi mẫu lớn (n  ≥ 30) hay mẫu được rút ra từ một phân phối xấp xỉ bình thường. Khi đó có thể áp dụng  hai phương pháp: ­  Phương pháp ước lượng z có thể  sử dụng bất cứ khi nào có cỡ mẫu lớn hoặc   biết được phương sai của dân số  (trường hợp biết phương sai của dân số  rất ít khi  xảy ra). ­ Phương pháp ước lượng t có thể áp dụng khi nào phân phối của dân số là xấp   xỉ bình thường. Phương pháp z Theo định lí giới hạn trung tâm, trong 95% các trường hợp trung bình của dân số không   cách xa quá trung bình của mẫu 1,96 ( SE (SE=sai số chuẩn). Do đó các bước để ước   lượng khoảng tin cậy 95% theo phương pháp này là như sau: ­ Tính trung bình mẫu x ­ Tính độ lệch chuẩn của dân số  σ (hoặc biết trước hoặc tính từ độ lệch chuẩn   mẫu khi cỡ mẫu đủ lớn) ­ Tính SE (sai số chuẩn) = σ/√n ­ Ước lượng khoảng tin cậy x ±  1,96 ×  SE Phương pháp t Nếu chúng ta không biết SE và không thể   ước lượng chính xác SE vì cỡ  mẫu nhỏ  (
  3. ­ Tính độ lệch chuẩn của mẫu s = √s2 n s2 ( xi x ) 2 / ( n 1) i 1 ­ Ước lượng khoảng tin cậy x ±  t(1­α/2) ×  s/√n Nếu ta ước lượng với độ tin cậy 95% thì α =0,05 và ta phải tra bảng phân phối student  để tìm t(1­0,05/2) = t0,975 với (n­1) độ tự do (n là cỡ mẫu). 3. Ước lượng khoảng tin cậy của hiệu số hai trung bình Ta có thể   ước lượng hiệu số của  trung bình của hai nhóm A và B theo 2 cách z và t   tùy theo số liệu của ta thỏa mãn có thỏa mãn những giả định cần thiết hay không. ­ Ðể sử dụng phương pháp z cần hai giả định: . Trung bình x1 và  x2 có phân phối bình thường . Có thể tính được độ lệch chuẩn dân số σ1 và  σ2 Cả hai điều kiện này đều thỏa mãn nếu hai cỡ mẫu đủ lớn. Ðể   ước lượng khoảng với độ  tin cậy 100(1­ α)   theo phương pháp t ta cần theo các   bước ­ Tính trung bình mẫu x1 và  x2 ­ Tính độ  lệch chuẩn dân số  σ1 và σ2 (từ  số  liệu có trước hoặc suy ra từ  độ  lệch chuẩn mẫu s1 và s2  khi cỡ mẫu đủ lớn) ­ Ước lượng khoảng theo công thức: 1 1 1 2 (x1 x2 ) z (1 /2) n1 n2 ­ Ðể sử dụng phương pháp t cần hai giả định: . x1 và x2 có phân phối bình thường và . σ1 = σ2 Ðể   ước lượng khoảng với độ  tin cậy 100(1­ α)   theo phương pháp t ta cần theo các   bước ­ Tính trung bình mẫu x1 và  x2 ­ Tính độ lệch chuẩn của mẫu s1 và s2 ­ Tính phương sai gộp s2 (n1 1) s12 ( n2 1) s22 s2 ( n1 1) ( n2 1) ­ Ước lượng khoảng theo công thức: s2 s2 (x1 x2 ) t (1 /2) n1 n2
  4. 4. Ước lượng tỉ lệ dân số Trong lãnh vực y tế  công cộng người ta có thể  cần  ước lượng những tỉ  lệ  như  tỉ  lệ  phụ  nữ  có đặt vòng, tỉ  lệ  trẻ  em trong diện tuổi  được tiêm chủng đầy đủ  6 loại   vaccine, tỉ lệ tử vong do một bệnh nào đó v.v. Ước lượng điểm: người ta có thể  ước lượng tỉ lệ trong dân số  π bằng cách tính tỉ lệ  (hay tần suất tương đối) của  mẫu  p. Ước lượng khoảng: Giả định để có thể sử dụng công thức ước lượng khoảng là nπ và  n(1­π) đều lớn hơn 5. Khi đó người ta có thể ước lượng khoảng tin cậy 100(1­ α) của  tỉ lệ theo quy trình sau: ­ ước lượng điểm tỉ lệ trong dân số p dùng tỉ lệ mẫu  p. ­ ước lượng khoảng theo công thức: p z (1 / 2) p (1 p ) / n 5. Ước lượng tỉ số tỉ lệ (tỉ số nguy cơ) Trong nhứng sách thống kê cổ  điển, người ta thường trình bày thêm về   ước lượng  khoảng của hiệu số hai tỉ lệ. Tuy vậy, trong dịch tễ, người ta ít khi ước lượng tham số  này mà thường  ước lượng tỉ  số  của hai tỉ  lệ  (ước lượng khoảng của tỉ số nguy cơ ­   RR hay  ước lượng khoảng của tỉ  số số  chênh ­ OR). Chi tiết về   ước lượng khoảng   của những tỉ số này tương đối phức tạp. Ở đây trình bày công thức ước lượng khoảng  của RR và OR mà không giải thích. Nếu chúng ta kí hiệu các số liệu trong bảng 2 x 2 theo quy tắc sau: Phơi nhiễm Không phơi nhiễm Tổng số Bệnh A1 A0 M1 Không bệnh B1 B0 M0 Tổng số N1 N0 N a. Ước lượng khoảng tin cậy của RR theo: a1 a 0 RR : 1. Tính  tỉ số nguy cơ N1 N 0   1 1 1 1 se[ln( RR )] a1 N1 a0 N0 2. Tính sai số chuẩn của ln(RR):  1 1 1 1 1, 96 a1 N1 a0 N 0 3. Tính thừa số sai số (error factor) của RR:  ef [ln( RR)] e 1 1 1 1 1, 96 a1 N1 a0 N0 4. Tính khoảng tin cậy của RR theo công thức: RR e
  5. b. Ước lượng khoảng tin cậy của OR theo: a1 a 0 a1b0 OR : 5. Tính  tỉ số nguy cơ b1 b0 a 0 b1   1 1 1 1 se[ln(OR)] a1 b1 a0 b0 6. Tính sai số chuẩn của ln(OR):  1 1 1 1 1, 96 a1 b1 a0 b0 7. Tính thừa số sai số (error factor) của OR:  ef [ln(OR)] e 1 1 1 1 1, 96 a1 b1 a0 b0 8. Tính khoảng tin cậy của OR theo công thức: OR e Bảng 4. Sự liên hệ giữa ăn thịt trong thời gian gần đầu và viêm ruột hoại tử ở Papua New Guinea (OR=11,6) Ăn thịt trong thời gian  Không ăn thịt trong  Tổng số gần đây thời gian gần đây Nhóm bệnh 50 11 61 Nhóm chứng 16 41 57 Tổng số 66 52 118 Để minh hoạ các bước tính toán trên chúng ta hãy xem xét một nghiên cứu bệnh chứng   được tiến hành  ở  Papua New Guinea để  xem ăn thịt có phải là yếu tố  nguy cơ  của  viêm ruột hoại tử hay không. Số liệu thu thập được được trình bày trong bảng 2. Quy   trình để ước lượng khoảng OR như sau: 1. Ước lượng điểm OR = 50 ×  41/(16 ×  11) = 11,65 Tỉ số chênh OR = 16 cho thấy người ăn thịt có nguy cơ bị viêm ruột hoại tử gấp 16 lần  người không ăn thịt.  1 1 1 1 1 1 1 1 se[ln(OR )] 0,445 a1 b1 a0 b0 50 16 11 41 2. Tính  1 1 1 1 1, 96 a1 b1 a0 b0 3. Thừa số sai số,  ef [ln(OR)] e e1,96 0 , 445 2,39 1 1 1 1 1, 96 a1 b1 a0 b0 4. Khoảng tin cậy 95% của OR= OR e 11,65 2,39 ( 4,9;27,9) Như vậy với độ  tin tưởng 95%, ta cho rằng khoảng từ 4,9 đến 27,9 có chứa OR thực  sự. Nói cách khác với độ  tin tưởng 95% ta cho rằng người ăn thịt có nguy cơ  bị  viêm   ruột hoại tử cao gấp 4,9 lần đến gấp 27,9 lần so với người không ăn thịt.
  6. Bài tập về kiểm định và ước lượng 1. Theo dõi nhịp tim của 12 bệnh nhân bị bệnh cường giáp trước và sau khi điều trị với   thuốc kháng giáp ta có kết quả như sau: Bệnh  1 2 3 4 5 6 7 8 9 10 11 12 nhân M   trước  115 120 110 100 95 110 120 115 100 120 110 90 điều trị M   sau  100 100 90 100 90 100 100 90 90 100 100 100 điều trị Hỏi: thuốc kháng giáp có làm giảm nhịp tim của bệnh nhân cường giáp hay không?  Ước lượng khoảng tin cậy của tác dụng làm giảm nhịp của thuốc. Bài giải: Vì đây là thử nghiệm lâm sàng với 2 lần đo đạc trên cùng một đối tượng, ta sử  dụng test t bắt cặp. Ðối với thử nghiệm lâm sàng dạng này, ta quan tâm nhiều   sự thay đổi, đó chính là hiệu số của nhịp tim sau và nhịp tim trước khi điều trị  và ta quan tâm đến trung bình của hiệu số này có khác zerohay không. Lập lại bảng trên và thêm hàng tính hiệu số mạch ta có: Bệnh  1 2 3 4 5 6 7 8 9 10 11 12 nhân M   trước  115 120 110 100 95 110 120 115 100 120 110 90 điều trị M   sau  100 100 90 100 90 100 100 90 90 100 100 100 điều trị Hiệu   số  ­15 ­20 ­20 0 ­5 ­10 ­20 ­25 ­10 ­20 ­10 +10 d Giả thuyết Ho : Trung bình của hiệu số mạch (d) bằng zero Ta có trung bình của d = d = ­12,1 độ lệch chuẩn của d sd = 10,1 và ta tính giá trị t theo công thức: x 12 ,1 0 12 ,1 t 4,1 s / n 10,1 / 12 2 ,91 Lấy trị tuyệt đối của t và tra bảng t hai chiều ở hàng 12­1 = 11 độ tự do, ta có t   > 3,106, có nghĩa là ta có thể bác bỏ giả thuyết H0 với mức ý nghĩa p 
  7. ­12,1 ±  2,20 ×  10,1/√12 = ­12,1 ±   6,7 = ­18,8 : ­ 5,4 Tóm lại với độ tin tưởng 95%, ta nói rằng thuốc kháng giáp làm giảm nhịp tim   từ 5 đến19 nhịp trong một phút. 2. Theo dõi thời gian bắt đầu có tác dụng của hai loại thuốc A và B trên hai nhóm bệnh   nhân ta có kết quả như sau: Thuốc A: 44;51;52;55;60;62;66;68;69;71;71;76;82;91;108  (n1  = 15;  x1  = 68,4 ; s1  =  16,5) Thuốc B: 52;64;68;74;79;83;84;88;95;97;101;116 (n2 = 12; x2 = 83,4 ; s2 = 17,6) Hỏi thời gian tác dụng của hai loại thuốc có khác nhau hay không? Ước lượng khoảng   tin cậy 95% của hiệu số thời gian tác dụng. Bài giải: Ðây là bài toán so sánh hai giá trị trung bình. Ta có H0 : Thời gian tác dụng trung bình trong dân số của thuốc A = Thời gian   tác dụng trung bình trong dân số của thuốc B Ðể kiểm định giả thuyết trước hết ta tính phương sai gộp s2 2 (n1 1) s12 (n2 1) s22 14 16,52 11 17,6 2 3800 3421 s 288,8 (n1 1) (n2 1) 14 11 25 Vậy s =  = 17 và ta tính t = ( x1 x2 ) 15 15 t 2 ,28 s2 s2 288,8 288,8 43,3 n1 n2 15 12 Lấy trị tuyệt đối của t và tra bảng t hai chiều ở hàng 15­1+12­1 = 25 độ tự do,  ta có t > 2,06 có nghĩa là ta có thể  bác bỏ  giả  thuyết H0 với mức ý nghĩa p 
  8. Không suy dinh dưỡng 196 632 828 Tổng số 322 878 1200 a. Ước lượng khoảng tin cậy 95% của tỉ lệ suy dinh dưỡng ở trẻ em nghèo? b. Tính nguy cơ tương đối (RR) của suy dinh dưỡng ở trẻ em nghèo? c. Ước lượng khoảng tin cậy 95% của RR. Bài giải a. Ước lượng điểm tỉ lệ suy dinh dưỡng ở trẻ nghèo: p1 = 126/322 = 0,391 = 39,1% Ước lượng khoảng tin cậy 95% (z = 1,96) của tỉ  lệ suy dinh d ưỡng  ở tr ẻ ngho (c ỡ  mẫu n = 322): p1 (1 p1 ) 0,391 (1 0,391) p1 z (1 / 2) 0,391 1,96 n 322 0,391 1,96 0,027 0,391 0,053 0,338 : 0,444 Tóm lại, với độ tin tưởng 95%, tỉ lệ suy dinh dưỡng  ở trẻ em nghèo tỉnh  Cần  thơ là từ 33,8% đến 44,4%. b. Nguy cơ tương đối của suy dinh dưỡng ở trẻ em nghèo a1 a 0 126 246 126 878 RR : : 1,40 n1 n0 322 878 322 246 Nói cách khác trẻ em nghèo dễ bị suy dinh dưỡng gấp 1,4 lân so với những trẻ  em thuộc gia đình trung bình hay khá giả. c. Ước lượng khoảng tin cậy 95% của  RR theo công thức trình bày ở trên 1,18 : 1,66 Nói cách khác với độ  tin tưởng 95% ta cho trẻ  em nghèo bị  nguy cơ  suy dinh  dưỡng cao gấp 1,16 lần đến 1,68 lần so với những trẻ em trung bình hoặc khá.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2