
55
CHỌN MẪU VÀ TÍNH CỠ MẪU
I. NGHIÊN CỨU CẮTNGANG
1.1. Tính cỡ mẫu:
Nghiên cứu cắt ngang thướng được sử dụng để ước lượng một số trung bình (biến
số liên tục) hay một tỉ lệ (biến số rời) cho nghiên cứu cắtngang
Công thức tính cỡ mẫu nhằm ước lượng:
- Một số trungbình:
trong đó : độ lệch chuẩn
d: sai số biên của ước lượng
- Một tỷ lệ:
trong đó p: tỉ lệ ước tính của vấn đề cần khảo sát
d: sai số biên của ước lượng
Ví dụ 1: Cần phải có cỡ mẫu là bao nhiêu để xác định tỉ lệ đàn ông Việt nam hút thuốc
lá, biết rằng kết quả từ một nghiên cứu trước đây cho thấy tỉ lệ này là 20% và chúng ta
mong muốn kết quả tìm thấy có giá trị nằm trong khoảng 5% giá trị thật
p = 0,2, 1-p = 0,8,
= 0,05=> n = 1,962 x 0,2 x 0,8/ 0,052 = = 245,8 = 246 người
(*)Lưu ý:
Đây là cỡ mẫu được tính cho nghiên cứu KHÔNG sử dụng phương pháp chọn mẫu
cụm. Nếu chọn mẫu cụm => phải tính “hệ số thiết kế” (designeffect)
Đây là cỡ mẫu cần có để phân tích. Nếu tỉ lệ tham gia NC thấp, ví dụ chỉ 75% thì
cỡ mẫu cần có phải tăng lên = 246/0,75 =328
Nếu không có thông tin gì về giá trị p, thì giá trị 0,5 có thể sử dụng để có cỡ mẫu
MỤC TIÊU: Sau khi học xong bài này, sinh viên có thể
1.
Tính được cỡ mẫu cho nghiên cứu cắtngang
2.
Tính được cỡ mẫu cho nghiên cứubệnh-chứng
3.
Phân biệt được các cách chọn mẫu và quyết định được phương pháp chọn mẫu thích hợp
cho từng thiết kế nghiên cứu khácnhau

TT. Cộng Đồng 1
lớn nhất.
Ví dụ 2: Cần phải có cỡ mẫu là bao nhiêu để ước tính trung bình của đường kính động
mạch chủ bụng của người Việt nam, biết rằng kết quả từ một nghiên cứu trước đây cho
thấy độ lệch chuẩn là 5 và chúng ta mong muốn kết quả tìm thấy có giá trị nằm trong
khoảng 5% giá trị thật (tức là sai số khoảng 0,75)
= 5,
= 0,75
=> n = 1,96 x 5/ (0,75)2 = 170,7 = 171 người
Nếu tỉ lệ tham gia NC chỉ 80% thì cỡ mẫu cần có phải tăng lên = 16/0,8 = 214 người
* Cách xác định “hệ số thiết kế” (design effect)
1. Xácđịnh bằng nghiên cứu pilot
2. Nghiên cứu có từ trước có cùng cách chọn mẫu
Tính bằngcôngthức: Design effect = 1 + (m-1) *
Trong đó:
m: độ lớn trung bình của 1cụm
: hệ số tương quan (intra-class correlationcoefficient)
Có thể là 1 con số âm rất nhỏ (khi cấu trúc trong từng cụm rất khác nhau) hoặc =1 (khi
cấu trúc trong từng cụm thuần nhất)
1.2. Chọn mẫu:
Chọn dân số nghiên cứu: Cần xác định dân số đích và dân số nghiên cứu (dân số
lấy mẫu) thích hợp để tránh sai lệch do chọn mẫu (selectionbias).
Ví dụ: Thực hiện nghiên cứu cắt ngang với dân số nghiên cứu là bệnh nhân trong bệnh
viện sẽ không phản ánh chính xác được tỉ suất hiện mắc của bệnh (tỉ suất hiện mắc thật
sự có thể cao hơn hay thấphơn)
1.2.1. Phương pháp chọnmẫu:
Do kết luận rút ra được từ mẫu khảo sát sẽ được dùng để suy luận cho dân số (mà
từ đó mẫu được lấy ra) nên mẫu được chọn cần phải đảm bảo tính đại diện, và vì vậy
cần phải được thực hiện theo các kỹ thuật thích hợp để tránh các sai lệch có thể xảyra.
Có 2 phương pháp chọn mẫu: chọn mẫu có xác suất (Probability sampling
method) và chọn mẫu không có xác suất (non-probability sampling method). Cách tốt
nhất để bảo đảm một mẫu sẽ cho ra các suy diễn chính xác và đáng tin cậy là dùng các
mẫu được chọn bằng phương pháp có xác suất.
Một mẫu (được chọn bằng phương pháp) có xác suất là 1 mẫu được rút ra từ dân
số theo cách mà tất cả các thành phần của dân số đều có 1 xác suất (đã biết trước) được
chọn vào mẫu.

57
1.2.2. Các phương pháp lấy mẫu có xác suất:
✓ Chọn mẫu ngẫu nhiên đơn (simple randomsampling)
✓ Chọn mẫu ngẫu nhiên hệ thống (systematic randomsampling)
✓ Chọn mẫu phân tầng (stratifiedsampling)
✓ Chọn mẫu cụm (clustersampling)
✓ Chọn mẫu nhiều giai đoạn (multi-stagesampling)
Chọn mẫu ngẫu nhiên đơn (Simple random sampling -SRS):
Là phương pháp chọn mẫu mà mọi đơn vị lấy mẫu đều được chọn vào mẫu nghiên
cứu với xác suất bằng nhau và độc lập với việc chọn đơn vị lấy mẫukhác
Các bước cần thiết để chọn mẫu ngẫu nhiên đơn giản:
B1.Lập danh sách chọn mẫu (khung chọn mẫu - sampling frame), trong đó các đối tượng
trong dân số đã được đánh số thứ tự.
B2.Rút thăm các số nguyên ngẫu nhiên cho đủ cỡ mẫu bằng cách:
+ Dùng bảng số ngẫu nhiên sau khi đã xác định vị trí khởi đầu một cách ngẫu
nhiên
trên bảng.
hoặc + Dùng phím bấm số ngẫu nhiên trên các máy tính cầmtay

TT. Cộng Đồng 1
hoặc + Dùng chương trình vi tính cho ra số lượng số ngẫu nhiên cầnthiết.
Ưu điểm của phương pháp chọn mẫu ngẫu nhiên đơngiản:thực hiện đơngiản
Khuyếtđiểm
+ Có thể không có được danh sách các đơn vị lấymẫu
+ Có thể tốn kém nhiều do mẫu nghiên cứu bị trảirộng
+ Có thể kém hiệu quả ở một số dân số nhấtđịnh
Chọn mẫu ngẫu nhiên hệ thống (Systematic randon sampling):
Là phương pháp chọn ngẫu nhiên một nhóm gồm nhiều đơn vị lấy mẫu cách nhau
một khoảng cách mẫu (k).
Các bước cần thiết để chọn mẫu ngẫu nhiên hệ thống:
+ Tính khoảng cách mẫu k = N/n
+ Chọn ngẫu nhiên một số i (số đầu tiên), 1 i k
+ Chọn một nhóm gồm các đơn vị lấy mẫu i, i+k, i+2k, v.v

59
Chọn mẫu phân tầng (Stratifiedsampling):
Là phương pháp chọn mẫu với nhều cá thể đại diện được chọn từ các tầng (strata)
riêng biệt của dân số.
Sử dụng khi:
+ Các tầng có khác nhau về biến số quantâm
+ Bản thân sự khác biệt này là mục tiêu của nghiêncứu
Yếu tố phân tầng thường là tuổi, phái tính, độ nặng của bệnh, tình trạng hút thuốc
- không hút thuốc v.v… Việc chọn mẫu phân tầng thường theo tỉ lệ tương xứng
(proportional stratified sampling) nhưng đôi khi có thể không tương xứng
(disproportional stratified sampling).
Ưu điểm của phương pháp chọn mẫutầng: mẫu đại diện hơn, chính xáchơn
Khuyếtđiểm
+ Trên thực tế đôi khi không tìm được tính chất để phântầng
+ Về mặt kinh tế, cũng gây tốn kém tương đương với cch chọn mẫu ngẫu nhiênđơn
Chọn mẫu cụm (Cluster sampling):
Là phương pháp chọn mẫu mà trong đó một hoặc nhiều đợn vị lấy mẫu (listing
units) được phối hợp sử dụng, nói cách khác đây là phương pháp chọn mẫu mà khung
chọn mẫu bao gồm nhiều cụm, mỗi cụm gồm nhiều đối tượng trong một địa phương
(hay địa điểm) nhất định. Khác với tầng (bao gồm những đơn vị lấy mẫu thuần nhất về
1 tính chất), cấu trúc của 1 cụm càng phải nên đa dạng về tínhchất.
Sử dụng khi:
+ Không thể có danh sách tất cả các đối tượng trong dânsố

