Bài giảng Thống kê y học - Bài 13: Ước lượng
lượt xem 16
download
Bài giảng Thống kê y học - Bài 13: Ước lượng cung cấp các kiến thức giúp người học có thể trình bày được ý nghĩa của khoảng tin cậy 95%, trình bày và lựa chọn được phương pháp ước lượng khoảng tin cậy trung bình của một mẫu, trình bày được phương pháp ước lượng khoảng tin cậy hiệu số hai trung bình,... Mời các bạn cùng tham khảo.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Thống kê y học - Bài 13: Ước lượng
- ƯỚC LƯỢNG Mục tiêu: Sau khi nghiên cứu chủ đề, học viên có khả năng: Trình bày được ý nghĩa của khoảng tin cậy 95% Trình bày và lựa chọn được phương pháp ước lượng khoảng tin cậy trung bình của một mẫu Trình bày được phương pháp ước lượng khoảng tin cậy hiệu số hai trung bình Trình bày phương pháp ước lượng khoảng tin cậy tỉ lệ của mẫu Trình bày phương pháp ước lượng khoảng tin cậy của tỉ số nguy cơ và tỉ số số chênh 1. Giới thiệu Trong công việc hàng ngày và trong nghiên cứu khoa học, ta cần phải biết một số những đặc tính của dân số. Thí dụ như chúng ta cần biết đường huyết trung bình của người bình thường để có thể chẩn đoán tiểu đường, cần biết trọng lượng trung bình của trẻ sơ sinh để đáng giá sự phát triển của trẻ, cần biết tỉ lệ tiêm chủng hoặc tỉ lệ đặt vòng nhằm lượng giá các chương trình y tế. Ðể ước tính được các đặc tính (các tham số) đó của dân số, phương pháp chính xác nhất là đo lường tất cả các giá trị của toàn bộ dân số. Tuy vậy điều này là không thực tế bởi vì: Những hạn chế về tài nguyên: chúng ta không thể tiến hành lấy máu của tất cả mọi người Việt nam để tính giá trị đường huyết trung bình. Ðiều này gây lãng phí về thời gian, nhân lực và tiền bạc. Tính không khả thi về phương diện áp dụng: Một bác sĩ nhận thấy có tỉ lệ tai biến khi sử dụng thuốc X dường như tăng cao. Ðể đo đạc tỉ lệ tai biến cho toàn bộ dân số cần phải kéo dài việc sử dụng thuốc để có thể sử dụng thuốc này cho tất cả mọi người. Nhưng điều này là không thích hợp về phương diện đạo đức. Do đó, người ta cần phải đo đạc các giá trị trên một phần của dân số, được gọi là một mẫu và tiến hành suy luận thống kê. Ðịnh nghĩa: Suy luận thống kê là quá trình trong đó người ta suy lận về dân số dựa trên những kết quả thu được từ một mẫu rút ra từ dân số đó. Nhưng tham số của dân số có thể được ước tính bằng hai cách: ước lượng điểm và ước lượng khoảng. Ước lượng điểm là một giá trị bằng số duy nhất nhằm để ước tính tham số tương ứng của dân số. Ước lượng khoảng bao gồm 2 trị số xác định một khoảng mà chúng ta cho rằng khoảng này có chứa tham số được ước lượng, với một độ tin tưởng nào đó. Một trong những tiêu chí để đánh giá phương pháp ước lượng là tính không sai lệch (còn gọi là tính không chệch unbiasedness). Một phương pháp ước lượng được gọi là không sai lệch nếu trung bình của rất nhiều giá trị ước lượng bằng giá trị của tham số. Suy luận thống kê chính xác đòi hỏi việc lấy mẫu ngẫu nhiên từ một khung mẫu và khung mẫu này trùng với dân số mục tiêu. Nếu việc lấy mẫu không ngẫu nhiên hoặc
- nếu khung mẫu không trùng với dân số mục tiêu, chúng ta cần phải dựa vào những luận cứ không phải là thống kê. 2. Ước lượng trung bình của dân số Ước lượng điểm: Trung bình của dân số (µ) có thể được ước lượng bằng trung bình của mẫu (theo định lí giới hạn trung tâm, trung bình của mẫu nằm tập trung quanh trung bình của dân số). Trung bình của mẫu được tính theo công thức sau: xi x n Ước lượng khoảng Ðịnh lí giới hạn trung tâm chỉ cho phép ước lượng khoảng khi mẫu lớn (n ≥ 30) hay mẫu được rút ra từ một phân phối xấp xỉ bình thường. Khi đó có thể áp dụng hai phương pháp: Phương pháp ước lượng z có thể sử dụng bất cứ khi nào có cỡ mẫu lớn hoặc biết được phương sai của dân số (trường hợp biết phương sai của dân số rất ít khi xảy ra). Phương pháp ước lượng t có thể áp dụng khi nào phân phối của dân số là xấp xỉ bình thường. Phương pháp z Theo định lí giới hạn trung tâm, trong 95% các trường hợp trung bình của dân số không cách xa quá trung bình của mẫu 1,96 ( SE (SE=sai số chuẩn). Do đó các bước để ước lượng khoảng tin cậy 95% theo phương pháp này là như sau: Tính trung bình mẫu x Tính độ lệch chuẩn của dân số σ (hoặc biết trước hoặc tính từ độ lệch chuẩn mẫu khi cỡ mẫu đủ lớn) Tính SE (sai số chuẩn) = σ/√n Ước lượng khoảng tin cậy x ± 1,96 × SE Phương pháp t Nếu chúng ta không biết SE và không thể ước lượng chính xác SE vì cỡ mẫu nhỏ (
- Tính độ lệch chuẩn của mẫu s = √s2 n s2 ( xi x ) 2 / ( n 1) i 1 Ước lượng khoảng tin cậy x ± t(1α/2) × s/√n Nếu ta ước lượng với độ tin cậy 95% thì α =0,05 và ta phải tra bảng phân phối student để tìm t(10,05/2) = t0,975 với (n1) độ tự do (n là cỡ mẫu). 3. Ước lượng khoảng tin cậy của hiệu số hai trung bình Ta có thể ước lượng hiệu số của trung bình của hai nhóm A và B theo 2 cách z và t tùy theo số liệu của ta thỏa mãn có thỏa mãn những giả định cần thiết hay không. Ðể sử dụng phương pháp z cần hai giả định: . Trung bình x1 và x2 có phân phối bình thường . Có thể tính được độ lệch chuẩn dân số σ1 và σ2 Cả hai điều kiện này đều thỏa mãn nếu hai cỡ mẫu đủ lớn. Ðể ước lượng khoảng với độ tin cậy 100(1 α) theo phương pháp t ta cần theo các bước Tính trung bình mẫu x1 và x2 Tính độ lệch chuẩn dân số σ1 và σ2 (từ số liệu có trước hoặc suy ra từ độ lệch chuẩn mẫu s1 và s2 khi cỡ mẫu đủ lớn) Ước lượng khoảng theo công thức: 1 1 1 2 (x1 x2 ) z (1 /2) n1 n2 Ðể sử dụng phương pháp t cần hai giả định: . x1 và x2 có phân phối bình thường và . σ1 = σ2 Ðể ước lượng khoảng với độ tin cậy 100(1 α) theo phương pháp t ta cần theo các bước Tính trung bình mẫu x1 và x2 Tính độ lệch chuẩn của mẫu s1 và s2 Tính phương sai gộp s2 (n1 1) s12 ( n2 1) s22 s2 ( n1 1) ( n2 1) Ước lượng khoảng theo công thức: s2 s2 (x1 x2 ) t (1 /2) n1 n2
- 4. Ước lượng tỉ lệ dân số Trong lãnh vực y tế công cộng người ta có thể cần ước lượng những tỉ lệ như tỉ lệ phụ nữ có đặt vòng, tỉ lệ trẻ em trong diện tuổi được tiêm chủng đầy đủ 6 loại vaccine, tỉ lệ tử vong do một bệnh nào đó v.v. Ước lượng điểm: người ta có thể ước lượng tỉ lệ trong dân số π bằng cách tính tỉ lệ (hay tần suất tương đối) của mẫu p. Ước lượng khoảng: Giả định để có thể sử dụng công thức ước lượng khoảng là nπ và n(1π) đều lớn hơn 5. Khi đó người ta có thể ước lượng khoảng tin cậy 100(1 α) của tỉ lệ theo quy trình sau: ước lượng điểm tỉ lệ trong dân số p dùng tỉ lệ mẫu p. ước lượng khoảng theo công thức: p z (1 / 2) p (1 p ) / n 5. Ước lượng tỉ số tỉ lệ (tỉ số nguy cơ) Trong nhứng sách thống kê cổ điển, người ta thường trình bày thêm về ước lượng khoảng của hiệu số hai tỉ lệ. Tuy vậy, trong dịch tễ, người ta ít khi ước lượng tham số này mà thường ước lượng tỉ số của hai tỉ lệ (ước lượng khoảng của tỉ số nguy cơ RR hay ước lượng khoảng của tỉ số số chênh OR). Chi tiết về ước lượng khoảng của những tỉ số này tương đối phức tạp. Ở đây trình bày công thức ước lượng khoảng của RR và OR mà không giải thích. Nếu chúng ta kí hiệu các số liệu trong bảng 2 x 2 theo quy tắc sau: Phơi nhiễm Không phơi nhiễm Tổng số Bệnh A1 A0 M1 Không bệnh B1 B0 M0 Tổng số N1 N0 N a. Ước lượng khoảng tin cậy của RR theo: a1 a 0 RR : 1. Tính tỉ số nguy cơ N1 N 0 1 1 1 1 se[ln( RR )] a1 N1 a0 N0 2. Tính sai số chuẩn của ln(RR): 1 1 1 1 1, 96 a1 N1 a0 N 0 3. Tính thừa số sai số (error factor) của RR: ef [ln( RR)] e 1 1 1 1 1, 96 a1 N1 a0 N0 4. Tính khoảng tin cậy của RR theo công thức: RR e
- b. Ước lượng khoảng tin cậy của OR theo: a1 a 0 a1b0 OR : 5. Tính tỉ số nguy cơ b1 b0 a 0 b1 1 1 1 1 se[ln(OR)] a1 b1 a0 b0 6. Tính sai số chuẩn của ln(OR): 1 1 1 1 1, 96 a1 b1 a0 b0 7. Tính thừa số sai số (error factor) của OR: ef [ln(OR)] e 1 1 1 1 1, 96 a1 b1 a0 b0 8. Tính khoảng tin cậy của OR theo công thức: OR e Bảng 4. Sự liên hệ giữa ăn thịt trong thời gian gần đầu và viêm ruột hoại tử ở Papua New Guinea (OR=11,6) Ăn thịt trong thời gian Không ăn thịt trong Tổng số gần đây thời gian gần đây Nhóm bệnh 50 11 61 Nhóm chứng 16 41 57 Tổng số 66 52 118 Để minh hoạ các bước tính toán trên chúng ta hãy xem xét một nghiên cứu bệnh chứng được tiến hành ở Papua New Guinea để xem ăn thịt có phải là yếu tố nguy cơ của viêm ruột hoại tử hay không. Số liệu thu thập được được trình bày trong bảng 2. Quy trình để ước lượng khoảng OR như sau: 1. Ước lượng điểm OR = 50 × 41/(16 × 11) = 11,65 Tỉ số chênh OR = 16 cho thấy người ăn thịt có nguy cơ bị viêm ruột hoại tử gấp 16 lần người không ăn thịt. 1 1 1 1 1 1 1 1 se[ln(OR )] 0,445 a1 b1 a0 b0 50 16 11 41 2. Tính 1 1 1 1 1, 96 a1 b1 a0 b0 3. Thừa số sai số, ef [ln(OR)] e e1,96 0 , 445 2,39 1 1 1 1 1, 96 a1 b1 a0 b0 4. Khoảng tin cậy 95% của OR= OR e 11,65 2,39 ( 4,9;27,9) Như vậy với độ tin tưởng 95%, ta cho rằng khoảng từ 4,9 đến 27,9 có chứa OR thực sự. Nói cách khác với độ tin tưởng 95% ta cho rằng người ăn thịt có nguy cơ bị viêm ruột hoại tử cao gấp 4,9 lần đến gấp 27,9 lần so với người không ăn thịt.
- Bài tập về kiểm định và ước lượng 1. Theo dõi nhịp tim của 12 bệnh nhân bị bệnh cường giáp trước và sau khi điều trị với thuốc kháng giáp ta có kết quả như sau: Bệnh 1 2 3 4 5 6 7 8 9 10 11 12 nhân M trước 115 120 110 100 95 110 120 115 100 120 110 90 điều trị M sau 100 100 90 100 90 100 100 90 90 100 100 100 điều trị Hỏi: thuốc kháng giáp có làm giảm nhịp tim của bệnh nhân cường giáp hay không? Ước lượng khoảng tin cậy của tác dụng làm giảm nhịp của thuốc. Bài giải: Vì đây là thử nghiệm lâm sàng với 2 lần đo đạc trên cùng một đối tượng, ta sử dụng test t bắt cặp. Ðối với thử nghiệm lâm sàng dạng này, ta quan tâm nhiều sự thay đổi, đó chính là hiệu số của nhịp tim sau và nhịp tim trước khi điều trị và ta quan tâm đến trung bình của hiệu số này có khác zerohay không. Lập lại bảng trên và thêm hàng tính hiệu số mạch ta có: Bệnh 1 2 3 4 5 6 7 8 9 10 11 12 nhân M trước 115 120 110 100 95 110 120 115 100 120 110 90 điều trị M sau 100 100 90 100 90 100 100 90 90 100 100 100 điều trị Hiệu số 15 20 20 0 5 10 20 25 10 20 10 +10 d Giả thuyết Ho : Trung bình của hiệu số mạch (d) bằng zero Ta có trung bình của d = d = 12,1 độ lệch chuẩn của d sd = 10,1 và ta tính giá trị t theo công thức: x 12 ,1 0 12 ,1 t 4,1 s / n 10,1 / 12 2 ,91 Lấy trị tuyệt đối của t và tra bảng t hai chiều ở hàng 121 = 11 độ tự do, ta có t > 3,106, có nghĩa là ta có thể bác bỏ giả thuyết H0 với mức ý nghĩa p
- 12,1 ± 2,20 × 10,1/√12 = 12,1 ± 6,7 = 18,8 : 5,4 Tóm lại với độ tin tưởng 95%, ta nói rằng thuốc kháng giáp làm giảm nhịp tim từ 5 đến19 nhịp trong một phút. 2. Theo dõi thời gian bắt đầu có tác dụng của hai loại thuốc A và B trên hai nhóm bệnh nhân ta có kết quả như sau: Thuốc A: 44;51;52;55;60;62;66;68;69;71;71;76;82;91;108 (n1 = 15; x1 = 68,4 ; s1 = 16,5) Thuốc B: 52;64;68;74;79;83;84;88;95;97;101;116 (n2 = 12; x2 = 83,4 ; s2 = 17,6) Hỏi thời gian tác dụng của hai loại thuốc có khác nhau hay không? Ước lượng khoảng tin cậy 95% của hiệu số thời gian tác dụng. Bài giải: Ðây là bài toán so sánh hai giá trị trung bình. Ta có H0 : Thời gian tác dụng trung bình trong dân số của thuốc A = Thời gian tác dụng trung bình trong dân số của thuốc B Ðể kiểm định giả thuyết trước hết ta tính phương sai gộp s2 2 (n1 1) s12 (n2 1) s22 14 16,52 11 17,6 2 3800 3421 s 288,8 (n1 1) (n2 1) 14 11 25 Vậy s = = 17 và ta tính t = ( x1 x2 ) 15 15 t 2 ,28 s2 s2 288,8 288,8 43,3 n1 n2 15 12 Lấy trị tuyệt đối của t và tra bảng t hai chiều ở hàng 151+121 = 25 độ tự do, ta có t > 2,06 có nghĩa là ta có thể bác bỏ giả thuyết H0 với mức ý nghĩa p
- Không suy dinh dưỡng 196 632 828 Tổng số 322 878 1200 a. Ước lượng khoảng tin cậy 95% của tỉ lệ suy dinh dưỡng ở trẻ em nghèo? b. Tính nguy cơ tương đối (RR) của suy dinh dưỡng ở trẻ em nghèo? c. Ước lượng khoảng tin cậy 95% của RR. Bài giải a. Ước lượng điểm tỉ lệ suy dinh dưỡng ở trẻ nghèo: p1 = 126/322 = 0,391 = 39,1% Ước lượng khoảng tin cậy 95% (z = 1,96) của tỉ lệ suy dinh d ưỡng ở tr ẻ ngho (c ỡ mẫu n = 322): p1 (1 p1 ) 0,391 (1 0,391) p1 z (1 / 2) 0,391 1,96 n 322 0,391 1,96 0,027 0,391 0,053 0,338 : 0,444 Tóm lại, với độ tin tưởng 95%, tỉ lệ suy dinh dưỡng ở trẻ em nghèo tỉnh Cần thơ là từ 33,8% đến 44,4%. b. Nguy cơ tương đối của suy dinh dưỡng ở trẻ em nghèo a1 a 0 126 246 126 878 RR : : 1,40 n1 n0 322 878 322 246 Nói cách khác trẻ em nghèo dễ bị suy dinh dưỡng gấp 1,4 lân so với những trẻ em thuộc gia đình trung bình hay khá giả. c. Ước lượng khoảng tin cậy 95% của RR theo công thức trình bày ở trên 1,18 : 1,66 Nói cách khác với độ tin tưởng 95% ta cho trẻ em nghèo bị nguy cơ suy dinh dưỡng cao gấp 1,16 lần đến 1,68 lần so với những trẻ em trung bình hoặc khá.
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Thống kê y học - Bài tập tổng hợp
8 p | 358 | 53
-
Bài giảng Thống kê y học - Bài 15: Kiểm định chi bình phương
8 p | 247 | 31
-
Bài giảng Bài tập thống kê - dịch tễ - BS. Nguyễn Văn Thịnh
19 p | 236 | 26
-
Bài giảng Thống kê y học - Bài 1: Thống kê và vai trò của thống kê trong y học
5 p | 233 | 25
-
Bài giảng Thống kê y học - Bài 4: Ứng dụng xác suất trong ra quyết định chẩn đoán và điều trị
9 p | 317 | 25
-
Bài giảng Thống kê y học - Bài 17: Công thức tóm tắt
5 p | 195 | 22
-
Lâm sàng thống kê: Bài 1. Độ lệch chuẩn hay sai số chuẩn - Nguyễn Văn Tuấn
8 p | 362 | 18
-
Bài giảng Thống kê y học - Bài 14: So sánh nhiều trung bình - Phân tích phương sai
15 p | 95 | 16
-
Bài giảng Thống kê y học - Bài 5: Phân phối xác suất
9 p | 183 | 15
-
Bài giảng Thống kê y học - Bài 7: Sự biến thiên mẫu của tỉ lệ
9 p | 122 | 12
-
Bài giảng Thống kê y học - Bài 10: Sự biến thiên của trung bình - Kiểm định T-TEST bắt cặp
9 p | 105 | 12
-
Bài giảng Thống kê y học - Bài 2: Một số khái niệm căn bản về xác suất
11 p | 112 | 10
-
Bài giảng Thống kê y học - Bài 12: Một số những phân phối lấy mẫu quan trọng
7 p | 76 | 10
-
Bài giảng Thống kê y học - Bài 11: So sánh hai trung bình - Kiểm định t không bắt cặp
10 p | 101 | 10
-
Bài giảng Thống kê y học - Bài 8: Nguyên tắc kiểm định - So sánh hai tỉ lệ
6 p | 85 | 10
-
Bài giảng Thống kê y học - Bài 3: Xác suất có điều kiện - Định luật nhân xác suất
7 p | 168 | 9
-
Bài giảng Thống kê y học - Bài 9: Nguyên lí kiểm định
6 p | 124 | 9
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn