YOMEDIA
ADSENSE
Bài giảng Ước lượng từ mẫu ra quần thể nghiên cứu - Hoàng Thị Hải Vân
100
lượt xem 10
download
lượt xem 10
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Mời các bạn tham khảo bài giảng Ước lượng từ mẫu ra quần thể nghiên cứu của Hoàng Thị Hải Vân sau đây để có thể phân biệt được tham số mẫu và tham số quần thể; phân biệt được ước lượng điểm và ước lượng khoảng; ứng dụng được kỹ thuật ước lượng điểm và ước lượng khoảng để tính toán và phiên giải kết quả.
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Ước lượng từ mẫu ra quần thể nghiên cứu - Hoàng Thị Hải Vân
- ƯỚC LƯỢNG TỪ MẪU RA QUẦN THỂ NGHIÊN CỨU Hoàng Thị Hải Vân Bộ môn Thống kê Tin học Y học Viện Đào tạo YHDP&YTCC Trường ĐH Y Hà Nội hoangthihaivan@hmu.edu.vn Mục tiêu bài học Kết thúc bài học, học viên có khả năng: 1. Phân biệt được tham số mẫu và tham số quần thể 2. Phân biệt được ước lượng điểm và ước lượng khoảng 3. Ứng dụng được kỹ thuật ước lượng điểm và ước lượng khoảng để tính toán và phiên giải kết quả www.ipmph.edu.vn 1
- Khái niệm cỡ mẫu và quần thể Quần thể với cỡ N P, µ, σ Chọn mẫu p, s Mẫu với cỡ n www.ipmph.edu.vn QuÇn thÓ ®Ých Thèng kª suy luËn Lùa chän KÕt luËn ngo¹i suy QuÇn thÓ Tham sè quÇn thÓ MÉu x¸c suÊt nghiªn cøu (µ, σ, P...) ¦íc l−îng - NgÉu nhiªn ®¬n • ®iÓm - NgÉu nhiªn hÖ thèng Suy luËn • kho¶ng - MÉu ph©n tÇng th«ng kª - MÉu chïm Chän (ChØ ¸p - MÉu nhiÒu bËc mÉu dông cho MÉu kh«ng x¸c suÊt mÉu x¸c KiÓm ®Þnh - MÉu kinh nghiÖm suÊt víi gi¶ thuyÕt - MÉu thuËn tiÖn cì mÉu ®ñ lín) - MÉu chØ tiªu MÉu Gi¸ trÞ p - MÉu cã môc ®Ých. Tham sè mÉu BiÕn sè ( X , s, p...) C¸c test Thèng kª thèng kª m« t¶ M« t¶ c¸c tham sè mÉu (tr×nh bµy kÕt qu¶ nghiªn c−ó) www.ipmph.edu.vn 2
- Phân biệt thống kê mô tả và thống kê suy luận Thống kê mô tả: • là mô tả kết quả thu được từ mẫu nghiên cứu • biểu thị độ lớn, sự phân bố của các tham số của mẫu nghiên cứu như , độ lệch chuẩn, các tỷ lệ, bảng, biểu, đồ thị sự phân bố theo các biến số khác nhau như tuổi, giới, địa dư... Thống kê suy luận: • là quá trình ngoại suy kết quả nghiên cứu từ mẫu ra quần thể nghiên cứu. • bao gồm 2 phương pháp: ước lượng và kiểm định www.ipmph.edu.vn Ph©n biÖt −íc l−îng vµ kiÓm ®Þnh Ước lượng: • ngoại suy từ tham số mẫu ra tham số quần thể: • từ trung bình của mẫu ( X ) sang TB quần thể (µ) • từ tỷ lệ của mẫu (p) sang tỷ lệ của quần thể (P) • từ OR, RR, r của mẫu ra quần thể. Kiểm định giả thuyết: • so sánh 2 hoặc nhiều quần thể NC từ sự khác biệt của 2 hoặc nhiều mẫu rút ra từ chính quần thể đó. • kiểm định mối tương quan của quần thể dựa theo mối tương quan thu được từ mẫu www.ipmph.edu.vn 3
- Ước lượng điểm • Cho một giá trị trung bình: Giá trị trung bình quần thể chính là giá trị trung bình của mẫu • Cho một tỷ lệ: tỷ lệ của quần thể chính là tỷ lệ mẫu nghiên cứu www.ipmph.edu.vn Ước lượng khoảng • Khoảng giá trị của các cá thể trong quần thể được tính từ giá trị của mẫu nghiên cứu www.ipmph.edu.vn 4
- Ví dụ về mối liên quan giữa mẫu và quần thể • Ví dụ 1. Trong một lớp cao học chỉ có 6 sinh viên, trong kỳ thi cuối khóa các học sinh này đạt được điểm như sau. Sinh 1 2 3 4 5 6 viên Điểm 9 8 8 7 7 7 • Điểm trung bình của 6 sinh viên này là: 7.6 www.ipmph.edu.vn Ví dụ về mối liên quan giữa mẫu và quần thể Nếu coi 6 sinh viên này là một quần thể nghiên cứu và chọn cỡ mẫu nghiên cứu bằng 2 ta có Mẫu số Sinh Điểm Trung bình viên thi mẫu 1 1, 2 9, 8 8,5 2 1, 3 9, 8 8,5 3 1, 4 9, 7 8,0 4 1, 5 9, 7 8,0 5 1, 6 9, 7 8,0 6 2, 3 8, 8 8,0 7 2, 4 8, 7 7,5 8 2, 5 8, 7 7,5 www.ipmph.edu.vn 5
- Ví dụ về mối liên quan giữa mẫu và quần thể Mẫu số Sinh Điểm thi Trung viên bìnhmẫu 9 2, 6 8, 7 7,5 10 3, 4 8, 7 7,5 11 3, 5 8, 7 7,5 12 3, 6 8, 7 7,5 13 4, 5 7, 7 7,0 14 4, 6 7, 7 7,0 15 4, 7 7, 6 6,5 16 5, 6 7, 7 7,0 Nhận xét: giá trị trung bình của các mẫu rất khác nhau giữa các mẫu và các giá trị này cũng khác so với giá trị trung bình quần thể là 7,6 www.ipmph.edu.vn Sai số chuẩn và độ chính xác Thông thường các nghiên cứu chỉ lựa chọn một cỡ mẫu nhất định từ quần thể để tiến hành nghiên cứu Nếu cỡ mẫu rất nhỏ chúng ta không thể suy luận (ước lượng) giá trị trung bình của quần thể một cách chính xác. Tuy nhiên với cỡ mẫu rất lớn chúng ta có thể suy luận (ước lượng) được giá trị của quần thể gần giống giá trị của mẫu Khái niệm sai số chuẩn được đưa ra nhằm đo lường độ chính xác của mẫu so với quần thể www.ipmph.edu.vn 6
- Sai số chuẩn và độ chính xác Giá trị sai số chuẩn liên quan trực tiếp với cỡ mẫu Sai số chuẩn đối với các biến liên tục có độ lệch chuẩn được sử dụng để đo lường độ phân tán có công thức tính như sau: SD SE = n Khi cỡ mẫu càng lớn thì sai số chuẩn càng nhỏ và điều đó chứng tỏ giá trị trung bình càng chính xác (càng gần với giá trị quần thể) Sai số chuẩn chỉ ra rằng: Nếu ta tiến hành lấy 100 mẫu ngẫu nhiên khác nhau từ cùng một quần thể thì 95% giá trị trung bình của các mẫu này nằm trong khoảng: “giá trị trung bình quần thể ±1,96*SE” www.ipmph.edu.vn 68,5% 95% 99,7% -3 σ -2 σ -1σ µ=0 1σ 2σ 3σ 68.5% giá trị nằm trong khoảng µ±1SD của giá trị trung bình 95% giá trị nằm trong khoảng µ± 2 SD của giá trị trung bình 99.7% giá trị nằm trong khoảng µ±3 SD của giá trị trung bình 68.5% giá trị TB mẫu nằm trong khoảng µ±1SE của giá trị TB QT 95% giá trị TB mẫu nằm trong khoảng µ± 1.96 SE của giá trị TB QT 99.7% giá trị TB mẫu nằm trong khoảng µ±3 SE của giá trị TB QT www.ipmph.edu.vn 7
- Khoảng tin cậy 95% • Giá trị trung bình mẫu = ? Giá trị TB QT-1.96*SE Gía trị TB QT Gía trị TBQT+1.96*SE • Như vậy 95% các giá trị trung bình mẫu nằm trong khoảng này • Ý nghĩa: Khi không biết giá trị trung bình quần thể, chúng ta có thể tính toán khoảng tin cậy xung quanh giá trị trung bình mẫu và từ đó ước lượng ra giá trị trung bình quần thể www.ipmph.edu.vn Khoảng tin cậy 95% Giá trị TB mẫu-1.96*SE Gía trị TB mẫu Gía trị TB mẫu+1.96*SE • 95% các khoảng này sẽ chứa đựng giá trị quần thể mẫu www.ipmph.edu.vn 8
- Khoảng tin cậy 95% Khoảng tin cậy cho 1 giá trị trung bình có nghĩa là: cứ mỗi lần một cỡ mẫu ngẫu nhiên rút ra từ quần thể ta thu được một giá trị trung bình với một khoảng tin cậy nhất định. Nếu việc này được lặp đi lặp lại nhiều lần thì khoảng giá trị đó sẽ bao gồm cả giá trị thực sự của quần thể trong đó với một mức độ tin cậy nhất định (ví dụ 95%, hay 99%...) www.ipmph.edu.vn Khoảng tin cậy 95% Xác suất: Giả sử 10% quần thể bị cao huyết áp, nếu ta lấy ngẫu nhiên một người trong quần thể đó thì ta có thể kết luận như thế nào về khả năng mắc CHA của người đó? Trả lời: 10% khả năng người đó bị cao huyết áp Tương tự như vậy, chúng ta biết rằng 95% các khoảng tin cậy của các giá trị trung bình mẫu có bao hàm giá trị trung bình quần thể. Nếu chúng ta lẫy một mẫu bất kỳ trong quần thể và tính toán khoảng tin cậy của cỡ mẫu này, chúng ta có thể kết luận như thế nào? Trả lời: 95% khả năng giá trị trung bình quần thể sẽ nằm trong khoảng tin cậy đó www.ipmph.edu.vn 9
- Khoảng tin cậy 95% • Công thức chung tính khoảng tin cậy là: Ước lượng điểm ±1.96*SE • Phương pháp tính SE rất khác nhau tuỳ thuộc vào bản chất của số liệu (biến liên tục hoặc biến định tính…) www.ipmph.edu.vn 95% khoảng tin cậy cho một giá trị trung bình 95% khoảng tin cậy của giá trị trung bình: SD 95%CI = Mean ± 1.96*SE với SE = n Ví dụ: Cân nặng trung bình của một cỡ mẫu 30 người là 70kg, SD=5.04kg. Tính 95% khoảng tin cậy của giá trị tring bình? Ta có: mean=70kg, SD=5.04kg, n=30 SD 5.04 SE = = = 0.92kg n 30 95%CI=70±1.96*0.92=68.2 – 71.8kg Vậy 95% cân nặng của các cá thể trong quần thể nằm trong khoảng từ 68.2kg đến 71.8kg www.ipmph.edu.vn 10
- 95% khoảng tin cậy cho một tỷ lệ • Công thức cơ bản sử dụng cho ước lượng khoảng là: PQ p ± Zα / 2 n • Ví dụ: Một nghiên cứu tiến hành với cỡ mẫu 300 trẻ trong số đó, 123 em trả lời là đã thường xuyên đi khám răng miệng tối thiểu hai lần một năm. Ta có ước lượng được khoảng mà tỷ lệ quần thể rơi vào đó với 95% độ tin cậy như sau: www.ipmph.edu.vn • Áp dụng công thức p .q p .q p − 1,96 → p + 1,96 n n • Ta có: 41 * 59 41 * 59 41 − 1,96 → 41 + 1,96 300 300 • 35,4% - 46,6% • Vậy, với độ tin cậy 95%, ta có thể tin tưởng là tỷ lệ học sinh thường xuyên đi khám răng miệng tối thiểu hai lần một năm của quần thể học sinh trong trường nằm trong khoảng từ 35,4% đến 46,6%. www.ipmph.edu.vn 11
- 95% khoảng tin cậy cho một tỷ suất • Thường áp dụng cho tỷ lệ mới mắc hay tỷ suất mới mắc • Rate =x/n trong đó x là số ca mới mắc và n là số người năm x • 95%CI (rate) = Rate ± 1.96*SE với SE = n www.ipmph.edu.vn 95% khoảng tin cậy cho một tỷ suất • Ví dụ: Một nghiên cứu thuần tập theo dõi dọc về bệnh ung thư ruột kết tại Vĩnh Phúc với 185,693 người tham gia trong vòng 5 năm. Khi kết thúc nghiên cứu có 675 ca bệnh được phát hiện. Hãy tính tỷ lệ mới mắc trong 100,000 dân và khoảng tin cậy 95% www.ipmph.edu.vn 12
- 95% khoảng tin cậy cho một tỷ suất • Ta có: x=675, n=185,693*5=928,465 người năm • Tỷ lệ mới mắc điểm là: – (675/927,465)*100,000 = 72.7 trên 100,000 người năm x 675 • SE của tỷ lệ: SE = = x100,000 = 2.80 n 928,465 • Giới hạn dưới của 95%CI = 72.7-1.96*2.80=67.2 • Giới hạn trên của 95%CI=72.2+1.96*2.80=78.2 www.ipmph.edu.vn 95% khoảng tin cậy cho một tỷ suất • Kết luận: Tỷ lệ mới mắc ung thư ruột kết tại Vĩnh Phúc là 72.7 người trên 100,000 người năm với 95% độ tin cậy giới hạn trong khoảng 67.2 đến 78.2 người trên 100,000 người năm. Do đó, chúng ta 95% tin tưởng rằng tỷ lệ mới mắc ung thư ruột kết thật nằm trong khoảng này. www.ipmph.edu.vn 13
- 95% khoảng tin cậy của nguy cơ tương đối (RR) • 95% khoảng tin cậy của nguy cơ tương đối (RR): • Tính RR • Tính ln(RR) 1 1 1 1 • Tính SE (lnRR) SE (ln RR) = − + − a n1 c n2 • 95%CI (lnRR) = ln(RR) ± 1.96*SE (lnRR) • 95%CI RR = e ln RR −1.96*SE (ln RR ) − e ln RR +1.96*SE (ln RR ) www.ipmph.edu.vn 95% khoảng tin cậy cho nguy cơ tương đối (RR) Nguy cơ tương đối (RR) được tính bằng tỷ lệ mới mắc của những người có Bệnh Tổng tiếp xúc với yếu tố nguy cơ Có Không (phơi nhiễm)/tỷ lệ mới mắc Có a b a+b=n1 của những người không tiếp phơi xúc với yếu tố nguy cơ nhiễm (không phơi nhiễm) Không c d a+d=n2 phơi RR=[a/(a+b)]/[c/(c+d)] nhiễm Tổng a+c b+d n Vì RR có phân bố không chuẩn nên phải chuyển dạng sang ln để có phân bố chuẩn, từ đó mới tính 95%CI www.ipmph.edu.vn 14
- 95% khoảng tin cậy cho nguy cơ tương đối (RR) Một nghiên cứu lựa chọn ngẫu nhiên 200 ca đẻ tại Kết quả Tổng thành thị cho thấy có 20 Đẻ non Không trẻ (10%) đẻ non so với đẻ non một nghiên cứu lựa chọn Nông a=13 b=67 a+b=n1 ngẫu nhiên 80 ca đẻ tại thôn =80 một vùng nông thôn có 13 Thành c=20 d=180 a+d=n2 trẻ đẻ non (16.3%). Câu thị =200 hỏi đặt ra là liệu nguy cơ Tổng a+c=33 b+d=2 n 47 đẻ non đối với trẻ ở nông thôn có cao hơn so với ở thành thị hay không? www.ipmph.edu.vn 95% khoảng tin cậy cho nguy cơ tương đối (RR) Ta có: • RR=[a/(a+b)]/[c/(c+d)]=[13/80]/[20/200]=1.6250 • ln(RR)=ln(1.6250)=0.4855 1 1 1 1 1 1 1 1 SE (ln RR) = − + − = − + − = 0.109 = 0.331 a n1 c n 2 13 80 20 200 • 95%CI của ln(RR)=0.4855±1.96*0.331=-0.1633 đến 1.1343 • 95%CI của RR= e −0.1633 − e1.1343 =0.85 đến 3.11 www.ipmph.edu.vn 15
- 95% khoảng tin cậy cho nguy cơ tương đối (RR) • Kết luận: Nguy cơ tương đối của trẻ sinh non ở miền núi là 1.63 (95%CI 0.85, 3.11). Chúng ta 95% tin tưởng rằng nguy cơ của trẻ ở miền núi bị sinh non có thể gấp 0.85 đến 3.11 lần trẻ sinh ở thành thị. www.ipmph.edu.vn 95% khoảng tin cậy của tỷ suất chênh (OR) • 95% khoảng tin cậy của tỷ suất chênh (OR): • Tính OR • Tính ln(OR) • Tính SE (lnOR) 1 1 1 1 SE (ln OR) = + + + a b c d • 95%CI (lnOR) = ln(OR) ± 1.96*SE (lnOR) • 95%CI OR = e ln OR −1.96*SE (ln OR ) − e ln OR +1.96*SE (ln OR ) www.ipmph.edu.vn 16
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn