72
ĐỀ TÀI KHOA HỌC
SỐ: 03-2004
NGHIÊN CỨU CÁC NGUYÊN TẮC XÁC ĐỊNH
CỠ MẪU VÀ PHÂN BỔ MẪU ỨNG DỤNG VÀO THỰC TIỄN
ĐIỀU TRA THỐNG KÊ Ở NƢỚC TA
1. Cấp đề tài : Tổng cục
2. Thời gian nghiên cứu : 2003-2004
3. Đơn vị chủ trì : Viện Khoa học Thống kê
4. Đơn vị quản lý : Viện Khoa học Thống kê
5. Chủ nhiệm đề tài : CN. Lê Văn Duỵ
6. Những ngƣời phối hợp nghiên cứu:
PGS.TS. Tăng Văn Khiên
CN. Vũ Văn Tuấn
Ths. Nguyễn Văn Đoàn
CN. Phan Đắc Lộc
TS. Phùng Chí Hiền
CN. Cao Nhƣ Nguyệt
CN. Nguyễn Văn Minh
CN. Phan Ngọc Trâm
CN. Đỗ Văn Huân
CN. Trần Thị Thanh Hƣơng
7. Kết quả bảo vệ: Loại giỏi
73
PHẦN MỘT
CƠ SỞ LÝ LUẬN VỀ XÁC ĐỊNH CỠ MẪU VÀ PHÂN BỔ MẪU
I. XÁC ĐỊNH CỠ MẪU
1.1. Các nguyên tắc xác định cỡ mẫu cơ bản
Việc xác định cỡ mẫu của một cuộc điều đƣợc xác định dựa vào hai
nguyên tắc cơ bản sau:
a. Phải dựa vào mc độ biến động (đƣợc biểu hiện thông qua phƣơng
sai) của chỉ tiêu cần đƣợc nghiên cứu của cuộc điều tra. Mức độ biến động
này càng lớn cỡ mẫu càng lớn, ngƣợc lại mức độ biến động của chỉ tiêu
đƣợc nghiên cứu càng nhỏ, cỡ mẫu cần thiết cho điều tra cũng nhỏ theo.
b. Phải dựa vào mức độ sai số cho phép. Khi sử dụng thông tin,
ngƣời dùng tin hiểu biết thống thƣờng đòi hỏi chỉ tiêu cần đƣợc nghiên
cứu chỉ mắc một sai số nhất định. Điều này cũng tính chất quyết định
đến cỡ mẫu cần cho cuộc điều tra. Mức độ sai số cho phép càng lớn cỡ
mẫu càng nhỏ. Ngƣợc lại, mức độ sai số cho phép nhỏ cỡ mẫu phải lớn.
c. Số lƣợng các chỉ tiêu thống cần thu thập. Số lƣợng các chỉ tiêu
thống cần thu thập qua cuộc điều tra ít, cỡ mẫu thể lớn, ngƣợc lại số
lƣợng các chỉ tiêu thống kê cần thu thập qua cuộc điều tra nhiều cỡ mẫu
cần phải nhỏ. Làm ngƣợc lại sẽ ảnh hƣởng tới chất lƣợng của cuộc điều tra.
d. Cấp độ mức độ chi tiết của thông tin cần đƣa ra, tức thông
tin sẽ đại diện cho tới cấp độ nào (ví dụ tới cấp tỉnh/ thành phố hay tới cấp
huyện,...) hoặc mức độ chi tiết đến đâu? Cấp độ mức độ thông tin càng
chi tiết, cỡ mẫu càng phải lớn có nhƣ vậy mới đáp ứng đƣợc yêu cầu đặt ra.
1.2. Phƣơng pháp xác định cỡ mẫu cơ bản
Trên phƣơng diện thuyết, xác định cỡ mẫu dựa vào mức độ biến
động của chỉ tiêu cần nghiên cứu tạo ra một bài toán cơ bản đƣợc trình bày
dƣới đây.
+ Đối với chọn mẫu ngẫu nhiên đơn giản có hoàn lại (chọn lặp):
74
Trong trƣờng hợp chọn mẫu có hoàn lại, bình phƣơng sai số của tiêu
thức đƣợc nghiên cứu dạng dạng:
n
S
xD
2
2)(
. Thay giá trị này vào
công thức (1.5) rồi giải phƣơng trình ta có công thức tính cỡ mẫu nhƣ sau:
2
22
d
Su
n
; (1.6)
+ Đối với chọn mẫu ngẫu nhiên đơn giản không hoàn lại (chọn
không lặp):
Bình phƣơng sai số của chọn mẫu ngẫu nhiên đơn giản trong trƣờng
hợp chọn không hoàn lại dạng:
)
11
()( 22
Nn
SxD
. Thay giá trị của
)x(D
-
2
vào phƣơng trình xác định cỡ mẫu ta có:
0)
11
(222 d
Nn
Su
. Giải
phƣơng trình này với ẩn số là n thu đƣợc kết quả sau:
222
22
NdSu
SNu
n
; (1.7)
+ Đối với chọn mẫu ngẫu nhiên phân t:
a. Trong trƣờng hợp chọn mẫu ngẫu nhiên phân tổ không hoàn lại
chế phân bổ mẫu phân bổ tỷ lệ với quy thì phƣơng sai chung của
mẫu có dạng:
k
i
ii
mSW
Nn
xD 22 11
, với k là số tổ
Thay D2 công thức này vào phƣơng trình (1.5) rồi giải với ẩn số
n ta sẽ công thức xác định cỡ mẫu cho trƣờng hợp "mẫu phân tổ với
chế chọn ngẫu nhiên không hoàn lại phân bổ mẫu tlệ thuận với quy
mô tổ". Sau khi giải phƣơng trình có công thức xác định cỡ mẫu nhƣ sau:
k
i
ii
k
i
ii
SW
N
u
d
SW
n
1
2
2
2
1
2
1
, ; (1.8)
75
b. Trong trƣờng hợp chọn mẫu ngẫu nhiên phân tổ không hoàn lại và
chế phân bổ mẫu phân bNeyman thì phƣơng sai chung của mẫu có
dạng:
Thay D2 ở công thức này vào phƣơng trình (1.5) rồi giải với ẩn số
n sẽ công thức xác định cỡ mẫu cho trƣờng hợp "mẫu phân tổ với
chế chọn ngẫu nhiên không hoàn lại phân bổ mẫu theo kiểu Neyman".
Sau khi giải phƣơng trình có công thức xác định cỡ mẫu nhƣ sau:
k
i
ii
k
i
ii
SW
N
u
d
SW
n
1
2
2
2
2
1
1
; (1.9)
II. PHÂN BỔ MẪU
Trong điều tra chọn mẫu hai trƣờng hợp cần tiến hành phân bổ
mẫu, đó là khi áp dụng điều tra chọn mẫu phân tổ hoặc khi áp dụng điều tra
chọn mẫu phân tầng. Sau đây các nguyên tắc cần chú ý khi tiến hành
phân bổ mẫu và một số phƣơng pháp phân bổ mẫu cơ bản.
2.1. Các nguyên tắc phân bổ mẫu cho các tổ
Về phƣơng diện thuyết, việc phân bổ mẫu cho các tổ phụ thuộc
vào mức đbiến động của chỉ tiêu cần nghiên cứu từng tổ. Mặt khác
còn phụ thuộc vào dung lƣợng thông tin từng thoặc từng đơn vị điều tra.
Với do đó việc phân bổ mẫu cũng những nguyên tắc nhất định. Sau
đây là những nguyên tắc cơ bản thƣờng đƣợc sử dụng khi phân bổ số lƣợng
đơn vị mẫu cho các tổ.
a. Dựa vào mức độ biến động của chỉ tiêu cần thu thập trong từng
tổ. Với nguyên tắc này, tổ nào có sự biến động lớn, tổ đó cần đƣợc phân bổ
số lƣợng đơn vị mẫu nhiều hơn.
b. Dựa vào tầm quan trọng của từng thể, từng nhóm thể đối
với thông tin cần cho ra để phân bổ mẫu.
76
Với một chủ đề thông tin cần thu thập, các đơn vị điều tra thƣờng có
dung lƣợng thông tin khác nhau. đơn vị mang nhiều dung lƣợng thông
tin hơn, ngƣợc lại đơn vrất ít lƣợng thông tin . Trong điều kiện nhƣ
vậy, thƣờng ngƣời ta dựa vào dung lƣợng thông tin để phân tổ tổng thể ra
thành các tổ dung lƣợng thông tin khác nhau. Trên cơ sở đó, phân bổ cỡ
mẫu cho các tổ theo nguyên tắc các tổ dung lƣợng thông tin phong phú
tỷ lệ chọn mẫu phải cao, thậm chí có khi phải chọn hết.
c. Dựa vào nhu cầu thông tin của các cấp lãnh đạo.
d. Dựa vào số lượng các đơn vị thể tính đồng đều của các đơn
vị thể trong mỗi tổ: Số lƣợng càng lớn thì số đơn vị mẫu thể giảm
tƣơng đối; Tính đồng đều của các đơn vị thể càng cao thì phân bổ cỡ
mẫu có thể giảm đi.
2.2. Các phƣơng pháp phân bổ mẫu cho các t
Về mặt luận, ngƣời ta thƣờng nhắc đến các kiểu phân bổ mẫu
bản phân bổ mẫu tỷ lệ thuận với quy mô, phân bmẫu tỷ lệ nghịch với
quy mô, phân bổ mẫu Neyman, phân bổ mẫu tối ƣu.
2.2.1. Phân bổ mẫu tỷ lệ thuận với quy
Công thức phân bổ mẫu tỷ lệ thuận với quy mô có dạng:
nWn
N
N
ni
i
i**
với i=1,2,...,M ; (1.10)
Trong đó M stổ; n mẫu chung của tổng thể ni cỡ mẫu
của tổ i , N là quy mô tổng thể; Ni quy mô của tổ i; Wi là tỷ trọng của tổ i
trong tổng thể.
Phƣơng pháp phân bổ mẫu tlệ thuận với quy thƣờng đƣợc áp
dụng khi quy của các tổ tƣơng đối đồng đều, phƣơng sai chi phí cho
các tổ không quá khác biệt nhau khi không biết trƣớc phƣơng sai cũng
nhƣ chi phí cho một đơn vị mẫu.
Phân bổ mẫu tlệ thuận với quy một số ƣu quy trình phân
bổ mẫu đơn giản. Mặt khác rất phù hợp với suy nghĩ thông thƣờng của mọi
ngƣời nên dễ đƣợc chấp nhận. Quy trình ƣớc lƣợng đơn giản. Đối với các
chỉ tiêu tƣơng đối, không cần phải quyền số h khi ƣớc lƣợng chúng.