Bài giảng Phương pháp nghiên cứu khoa học - Các phương pháp chọn mẫu điều tra

Chia sẻ: Zcsdf Zcsdf | Ngày: | Loại File: PDF | Số trang:27

0
66
lượt xem
19
download

Bài giảng Phương pháp nghiên cứu khoa học - Các phương pháp chọn mẫu điều tra

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Các phương pháp chọn mẫu điều tra nhằm giới thiệu chung về chọn mẫu, mẫu ngẫu nhiên đơn, mẫu ngẫu nhiên hệ thống, mẫu phân tầng, mẫu cụm, tính cỡ mẫu. Điều tra mẫu là các thông tin được thu thập từ một nhóm (mẫu) các thực thể nằm trong một quần thể lớn hơn của các thực thể đó.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Phương pháp nghiên cứu khoa học - Các phương pháp chọn mẫu điều tra

  1. TS. Phạm Việt Cường Bộ môn Thống kê Đại học Y tế Công Cộng 1 1.  Giới thiệu chung về chọn mẫu 2.  Mẫu ngẫu nhiên đơn 3.  Mẫu ngẫu nhiên hệ thống 4.  Mẫu phân tầng 5.  Mẫu cụm 6.  Tính Cỡ mẫu 2 •  Điều tra trên mẫu là gì? –  các thông tin được thu thập từ một nhóm (mẫu) các thực thể nằm trong một quần thể lớn hơn của các thực thể đó. •  Tại sao các cuộc điều tra có chọn mẫu được sử dụng nhiều (so với việc sử dụng toàn bộ toàn bộ quần thể hay tổng điều tra dân số) + Tiết kiệm thời gian (ảnh hưởng lên tính thời sự của số liệu, sự thay đổi của thông tin thu thập theo thời gian) + Tiền bạc + Tăng độ xác thực?? 3 1
  2. Điều tra mẫu •  Nghiên cứu không thực nghiệm/nghiên cứu quan sát •  Nghiên cứu cắt ngang. •  Điều tra mô tả: ước lượng/đo lường mức độ của một tập hợp các biến trong một quần thể xác định   1. ước lượng thông số quần thể   2. Thử nghiệm/ kiểm định giả thuyết (mục tiêu thứ cấp). 4 Ưu điểm Nhược điểm •  Chọn mẫu làm giảm nhu •  Luôn có sai số chọn mẫu cầu về nguồn lực •  Việc chọn mẫu có thể •  Đạt được kết quả một tạo ra cảm giác “bị phân biệt” trong quần thể cách nhanh chóng hơn •  Đối với những sự kiện ít •  Thông qua việc chọn xảy ra, những mẫu nhỏ mẫu có thể thu thập có thể không xác định được các số liệu chính được đầy đủ những xác hơn trường hợp/sự kiện quan tâm bệnh cho NC 5 •  Tổng các lỗi do điều tra = Lỗi (sai số)do chon mẫu (sampling error)+ Lỗi (sai số)không do chọn mẫu (non-sampling error) •  Tổng điều tra : không có lỗi (sai số)do chọn mẫu, nhưng lỗi không do chọn mẫu tương đối cao •  Điều tra : có một số lỗi (sai số)do chọn mẫu (nhưng kiểm soát được), nhưng có ít các lỗi (sai số) không do chọn mẫu. 6 2
  3. •  Quần thể (population) – tổng các phần tử trong nghiên cứu •  hay Quần thể đích (target population) – là một quần thể lý tưởng cho việc đáp ứng các mục tiêu của cuộc điều tra. •  Phần tử (element)– một đơn vị phân tích của cuộc điều tra •  Đơn vị liệt kê (listing units): khi không chọn phần tử •  Đại diện – không sai chệch (unbiased) 7 •  Thông số mẫu hay thống kê mẫu (sample statistic): các con số, chỉ số thống kê được tính từ mẫu dùng để ước lượng giá trị thực/thông số quần thể •  Tham số quần thể (population parameter) •  Khung mẫu: Danh sách quần thể nghiên cứu (đơn vị chọn mẫu, đơn vị phân tích) mà mẫu được chọn •  Đơn vị chọn mẫu •  Chọn mẫu nhiều giai đoạn –  đơn vị chọn mẫu đầu tiên (primary sampling unit) –  đơn vị chọn mẫu thứ hai (secondary sampling unit) –  đơn vị chọn mẫu cuối cùng (ultimate)-đơn vị liệt kê (listing units) –  Đơn vị chọn mẫu cuối cùng có thể không phải là phần tử. Ví dụ hộ gia đình chứ không phải trẻ (
  4. •  Tất cả các cá thể (nhân tố/phần tử) trong quần thể đều có cơ hội/ xác suất được chọn lựa. •  Cơ hội không nhất thiết là phải giống nhau. •  Cần thiết phải có một khung mẫu cụ thể của các cá thể hay từ cụm các cá thể, mà từ đó mẫu được chọn ra. •  Mẫu xác xuất là mẫu đại diện của quần thể lớn cho phép tăng cường tính giá trị ngoại suy của nghiên cứu thông qua các tính toán Thống kê •  Sử dụng mẫu xác suất khi ta muốn tăng cường tính giá trị ngoại suy của nghiên cứu. •  Cần các thông tin có tính giá trị cao từ điều tra, nhất là khi ra các quyết định liên quan đến các vấn đề đang tranh luận. 10 •  Mẫu đại diện của quần thể (representative of population): hiểu theo nhiều nghĩa –  Không có sai chệch (unbiased) –  Tính xác thực (accuracy: tính giá trị và độ tin cậy) cao của đại lượng thống kê mẫu (sample statistic) •  Cách làm tăng tính đại diện: –  Cố gắng đảm bảo tất cả các cá thể (nhân tố/ phần tử) trong quần thể đều có cơ hội/xác suất được chọn lựa như nhau. –  Tăng cỡ mẫu (tăng độ chính xác: precision) 11 1.  Các trường hợp trong mẫu được chọn từ quần thể nào? 2.  Phương pháp nào dùng để chọn các trường hợp mẫu từ quần thể trên? 3.  Các trường hợp mẫu được nghiên cứu có đại diện cho quần thể mà mẫu được chọn từ đó không? 4.  Các phát hiện từ mẫu này có có thể suy ra cho các quần thể lớn hơn quần thể mà từ đó mẫu được chọn hay không? 12 4
  5. – Đại diện (representative or unbiased). – Có thể đo lường được xác suất chọn – Kích thước mẫu – Tính bao phủ – Có định hướng mục đích – Khả thi – Tiết kiệm và chi phí hiệu quả (cost efficiency) 13 Simple Random Sampling 14 •  Tất cả các mẫu có cùng kích thước đều có cơ hội được chọn như nhau. •  Tất cả các đơn vị mẫu trong khung mẫu đều có cơ hội được chọn như nhau •  Chọn lựa ngẫu nhiên từ khung mẫu có thể thực hiện được thông qua –  bắt thăm (lottery method), –  sử dụng bảng số ngẫu nhiên, hoặc sử dụng máy vi tính. •  Phương pháp đơn giản nhưng it khi được sử dụng đơn độc trong các cuộc điều tra lớn. (Khung mẫu?) •  Quan trọng vì làm nền tảng cho các PP chọn mẫu khác dựa vào 15 5
  6. •  Trong một quần thể có N phần tử thì sẽ có “A” khả năng có được những mẫu có kích thước n •  A = N!/n!(N-n)! •  Ví dụ: với N = 25, n = 5 ta có A = 25!/(5!)(25-5)! = 53.130 mẫu với n = 5. •  Vậy chọn mẫu ngẫu nhiên đơn kích thước n từ một quần thể N, là chọn mẫu trong đó mỗi mẫu của “A” mẫu có một xác suất chọn tương tự như nhau và là 1/ “A”. •  Từng phần tử mẫu n trong bất cứ mẫu nào cho trước cũng có xác suất chọn ngang nhau và bằng n/N. 16 •  Thông qua bắt thăm (lottery method) –  Số của các cá thể được viết vào “thăm” –  Cho vào hộp trộn kỹ và chọn đủ số mẫu cần thiết –  Giả thuyết: Tất cả các “thăm” đều được trộn một cách kỹ càng •  Ví dụ bốc thăm tại chọn mẫu điều tra nền Chí Linh. –  Cỡ cụm trong tự nhiên (thôn, xóm, làng, tổ, đội) lớn hơn kích thước cụm (Ví dụ 25 hộ so với 130) –  Chia mảng của thôn với kích thước mỗi mảng tương đương với 25 HH –  Chọn ngẫu nhiên một mảng trong thôn theo cách bốc thăm. 17 •  Sử dụng bảng số ngẫu nhiên –  Qui ước cách sử dụng chọn số theo bảng số. Ví dụ bắt đầu từ 4 cột số ở góc trên bên trái và đi từ trên xuống dưới và khi hết lại bắt đầu từ 4 cột số liên tục bên phải.,vv. –  Chọn (tập hợp) số có các chữ số nằm trong khoảng giá trị của quần thể. Ví dụ trong khoảng 0001-1917. (tài liệu phát tay Kalton) –  Dừng lại khi chọn đủ số cá thể của mẫu nghiên cứu. (loại bỏ các số trùng lắp khi chọn từ bảng số ngẫu nhiên) 18 6
  7. Mẫu ngẫu nhiên đơn Ưu điểm Nhược điểm •  Vì mọi đơn vị trong quần •  Nếu khung mẫu lớn, thể có một cơ hội được phương pháp này không chọn vào mẫu như nhau, thực thi. mẫu được đảm bảo là đại •  Mẫu có thể chứa không diện và chỉ bị ảnh hưởng đủ các cá thể ở các nhóm bởi sai số chọn mẫu nhỏ trong quần thể mà •  Có thể tính toán những người nghiên cứu quan ước lượng (estimates) tâm một cách dễ dàng 19 Systematic Random Sampling 20 Mẫu ngẫu nhiên hệ thống •  Xác định khoảng cách mẫu k=N/n (làm tròn lên và xuống) •  Sự lựa chọn của mọi đơn vị thứ k trong quần thể hay khung mẫu, •  l/k là tỉ lệ chọn mẫu •  Đơn vị mẫu đầu tiên được chọn ngẫu nhiên từ k đơn vị mẫu đầu tiên. •  Lưu ý –  Khi k được làm tròn lên –  Khi k được làm tròn xuống 21 7
  8. Mẫu ngẫu nhiên hệ thống Các cách chọn mẫu hệ thống •  Chọn mẫu sau khi xây dựng khung mẫu •  Chọn mẫu cùng lúc với xây dựng khung mẫu. •  Xác định số bắt đầu ngẫu nhiên –  trong khoảng cách mẫu k. –  ngoài khoảng cách mẫu k. 22 Mẫu ngẫu nhiên hệ thống •  N= 70, n = 10, khoảng cách mẫu k = 70/10 = 7 •  Chọn ngẫu nhiên từ 1-7 một số, ví dụ 3. –  1 2 3 4 5 6 7 •  Chọn ra đơn vị thứ k đối với mỗi cá thể trong danh sách mẫu bắt đầu từ số ngẫu nhiên được chọn •  Ví dụ: 3+7 = 10, 10+7 = 17 •  Cá thể thứ 3, 10 và 17 được chọn vào mẫu 23 Mẫu ngẫu nhiên hệ thống 1 2 3* 4 5 6 7 8 9 10 11* 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70  n=6, k=11,6 = 12, số ngẫu nhiên được chọn là 11, số cá thể thứ 6 được chọn vào mẫu là cá thể thứ 1 trong khung mẫu 24 8
  9. Mẫu ngẫu nhiên hệ thống Ưu điểm Nhược điểm •  Dễ chọn mẫu •  Có thể gây sai số nếu có một sự thay đổi theo chu •  Có thể xác định khung kỳ xảy ra đồng thời với mẫu hợp lý một cách dễ chọn mẫu dàng •  Mẫu được dàn trải trong toàn bộ quần thể tham chiếu (reference population) 25 1.  Khung mẫu không hoàn chỉnh (thiếu đơn vị mẫu) 2.  Các đơn vị mẫu cụm 3.  Không có các đơn vị mẫu được chọn trong cuộc điều tra 4.  Các đơn vị mẫu bị lặp lại trong khung Cách giải quyết khi không có khung mẫu phù hợp trong thực tế: –  Sử dụng danh sách của các tập hợp phần tử (elements) mẫu mà ta mong muốn chọn cho nghiên cứu sau đó lấy mẫu của các đơn vị tập hợp này. Khung mẫu sau đó sẽ được xây dụng bên trong các đơn vị được chọn và các phần tử sẽ được chọn trong khung mẫu này. –  Ví dụ sử dụng danh sách hộ gia đình khi không có danh sách của các cá thể 26 27 9
  10. •  Phụ thuộc vào nguồn lực (thời gian, nhân lực, tài chính) •  Độ chính xác mong muốn •  Kỳ vọng của nhà nghiên cứu 28 •  z : hệ số tin cậy •  p : tỷ lệ dự đoán  từ các nghiên cứu trước hoặc 50% •  d : độ chính xác tuyệt đối  + x đơn vị Ví dụ: một nghiên cứu cắt ngang, để đánh giá tỷ lệ thừa cân của trẻ 6-12 tuổi tại tỉnh X. Tỷ lệ của một nghiên cứu khác là 15%. p=.15 z=1.96 ~ mức chính xác 95% d=0.05 ~ độ chính xác +5% Cần có tối thiểu 196 trẻ 6-12 tuổi để nghiên cứu 29 •  Tỷ lệ thấp –  Sử dụng công thức tính cỡ mẫu với độ chính xác tương đối •  Non-Response/không đáp ứng –  Cộng thêm một tỷ lệ nhất định để đảm bảo cỡ mẫu tối thiểu. •  “Tính ngược” –  Không nên 30 10
  11. •  Mẫu cho quần thể nhỏ (lớn hơn không đáng kể so với mẫu) •  Mẫu cho quần thể không quá lớn so với mẫu (f>1/10) •  Mẫu cho quần thể lớn hơn rất nhiều (quần thể vô hạn) (f
  12. 34 •  Quần thể được chia thành từng bộ phận hoặc tầng độc lập và sau đó được gộp lại để ước lượng tham số của quần thể •  Một tầng là một bộ phận của quần thể có ít nhất một đặc điểm chung •  Ví dụ: nam và nữ, các nhóm tuổi 35 •  Mẫu phân tầng làm giảm sai số chọn mẫu •  Mẫu phân tầng đảm bảo số lượng quan sát trong từng tầng •  Ước lượng từ mẫu phân tầng sẽ chính xác hơn từ mẫu ngẫu nhiên nếu: –  Có ựu tương đồng trong từng tầng –  Có sự biến thiên đủ lớn giữa các tầng 36 12
  13. •  Tổng số quần thể sẽ là với là cỡ mẫu trong tầng l •  Trung bình chung sẽ là: •  Với là phân số mẫu của tầng thứ l 37 Chọn mẫu phân tầng yêu cầu 2 bước: •  Xác định các tầng thích hợp •  Sử dụng cách chọn ngẫu nhiên đơn/hệ thống để chọn các đơn vị mẫu trong từng tầng Trong mỗi tầng, một mẫu ngẫu nhiên đơn với kích cỡ là được chọn để ước lượng trung bình trong tầng 38 Phương sai của mẫu phân tầng được tính tóan Nếu phân số mẫu nhỏ thì phương sai sẽ là: 39 13
  14. •  Phân bố mẫu khác tỷ lệ (cùng cỡ mẫu cho các tầng) •  Phân bố mẫu cùng tỷ lệ (xác xuất chọn) n/N. Tự cân bằng •  Các tầng cùng cỡ mẫu tính theo mức độ chính xác cho quần thể lớn (mỗi NC tiến hành trên một tầng) 40 •  Cỡ mẫu được chia thành từng phần tương ứng với tỷ lệ của quần thể •  Chọn theo cách ngẫu nhiên đơn, hoặc ngẫu nhiên hệ thống các đơn vị cần thiết •  Không cần gán trọng số cho tầng vì đây là lọai đã phân bổ theo trọng số (seft-weight) 41 Khối lớp Số HS Tỷ lệ Mẫu 10 678 0,37 89 11 600 0,33 78 12 560 0,30 73 Tổng 1838 1 240 42 14
  15. •  Đảm bảo cỡ mẫu cần thiết cho mỗi tầng •  Chọn số lượng mẫu trong mỗi tầng là như nhau •  Cần gán trọng số (weight) khi phân tích để đảm bảo nguyên tắc tất cả các đối tượng đều có cơ hội như nhau để được trọng vào mẫu 43 Khối lớp Số HS Tỷ lệ Mẫu 10 678 0,37 80 11 600 0,33 80 12 560 0,30 80 Tổng 1838 1 240 44 Mẫu phân tầng Ưu điểm Nhược điểm •  Mọi đơn vị trong tầng đều có cơ •  Khung mẫu của toàn quần thể phải hội được chọn như nhau được xây dựng riêng biệt cho mỗi •  Tỉ lệ chọn mẫu giống nhau trong tầng tất cả các tầng đảm bảo tính đại •  Thay đổi tỷ lệ chọn mẫu giữa các diện tương ứng của các đặc tầng để đảm bảo đủ số lượng của điểm đã được phân tầng trong các nhóm nhỏ trong NC sẽ ảnh mẫu. hưởng đến tính đại diện tương •  Đảm bảo tính đại diện của các ứng của các nhóm nhỏ trong tổng nhóm nhỏ cần nghiên cứu thể mẫu. 45 15
  16. •  Tính cỡ mẫu chung, sau đó phân bổ theo tầng –  Ứớc lượng chung cho quần thể –  So sánh các tầng •  Tính riêng cho từng tầng –  Ước lượng cho từng tầng –  So sánh các tầng 46 47 •  Quần thể được coi là tập hợp của nhiều nhóm nhỏ: –  Phường/xã; trường/lớp học, hộ gia đình… •  Các cụm thường có một số đặc điểm chung •  Việc lập danh sách mẫu cho quần thể gặp nhiều khó khăn (quần thể lớn) 48 16
  17. Vùng 1 Vùng 2 Vùng 3 Vùng 5 Vùng 4 49 •  Điểm mạnh –  Đơn giản vì không cần danh sách của các đơn vị mẫu trong quần thể –  Không phải đi lại nhiều/đỡ tốn nguồn lực •  Điểm yếu –  Thiết chính xác nếu như các cụm tương đồng nhau  phương sai mẫu lớn hơn phương sai quần thể. –  Khó khăn trong việc đo lường sai số mẫu 50 Đánh giá tỷ lệ tiêm vacxin: •  Không cần danh sách quần thể •  Toàn bộ các làng/xã •  Chọn ngẫu nhiên 30 cụm •  Mỗi cụm 7 trẻ: 30x7=210 17
  18. Cần –  Bản đồ của –  Phân bố quần thể (theo làng hoặc địa bàn) –  Phân bố tuổi (12-23 tháng: 3%) Làng Dân số 12-23 tháng A 53000 1600 B 7300 220 C 106000 3200 D 13000 400 E 26500 800 F 6600 200 G 40000 1200 H 6600 200 I 53000 1600 J 13200 400 52 Tại thực địa Đi ra giữa làng, chọn một hướng ngẫu nhiên Số lượng hộ theo hướng đó   VD: 21 Chọn hộ đầu tiên để vào Chọn các hộ tiếp theo “nguyên tắc” cho đến khi đủ 7 trẻ 53 Chọn mẫu cụm đơn giản (1 giai đọan) •  Chỉ cần xác định những người sống trong những cụm được lựa chọn (VD: một số nhóm các hộ gia đình) •  Chọn số lượng cụm cần thiết •  Chọn toàn bộ số đối tượng trong cụm 54 18
  19. Các cụm để chọn mẫu Mỗi cụm trong 20 cụm dưới đây là một Hộ gia đình với số lượng các thành viên trong hộ khác nhau 55 Các cụm để chọn mẫu 20 Hộ gia đình 1 2 3 9 4 8 6 7 5 10 20 13 11 15 12 19 14 18 17 16 56 Bảng số ngẫu nhiên để chọn mẫu cụm (A) (B) (C) (D) (E) (F) 40 27 7 41 23 34 18 16 19 50 3 15 59 52 21 8 58 5 Đi dọc xuống theo danh sách và 49 36 33 13 17 25 chọn 2 số ngẫu nhiên đầu tiên 26 10 12 47 24 22 giữa số 1 và tổng 2 2 48 56 28 1 54 số cụm 53 55 39 4 45 9 37 38 42 11 30 60 44 43 29 35 14 46 6 32 51 20 57 31 57 19
  20. Chọn ngẫu nhiên 2 cụm và xác định đối tượng nghiên cứu 2 và 18 được chọn từ bảng số ngẫu nhiên 2 1 2 3 9 4 8 6 7 5 10 20 13 11 15 12 19 14 18 17 16 58 18 Chọn tất cả những người có trong các cụm đã được lựa chọn 4 1 3 2 5 6 7 8 9 59 •  Giai đoạn 1 •  Chọn các cụm ở giai đoạn đầu tiên với xác suất tương ứng với kích thước (PPS) và chọn ở giai đoạn hai một số lượng như nhau mỗi cụm, lựa chọn bằng phương pháp chọn mẫu ngẫu nhiên đơn hoặc hệ thống 60 20

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản