Các phương pháp lấy mẫu và xử lý mẫu<br />
<br />
Mai Thị Hương<br />
<br />
<br />
Trường Đại học Khoa học Tự nhiên<br />
Luận văn ThS. Chuyên ngành: Lý thuyết xác suất và thống kê toán học<br />
Mã số: 60 46 15<br />
Người hướng dẫn: PGS.TS. Đào Hữu Hồ<br />
Năm bảo vệ: 2013<br />
<br />
Abstract: Trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô gồm hữu hạn phần tử.<br />
Các ước lượng, tính chất và phương sai của ước lượng của trung bình tổng thể, tổng thể, tỷ số…<br />
Ở chương này đưa ra những khái niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái<br />
niệm ước lượng không chệch, tính vững của ước lượng. Đề cập đến lấy mẫu ngẫu nhiên phân<br />
tầng và lấy mẫu hệ thống, được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn<br />
giản. Ngoài ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên đơn<br />
giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng. Nghiên cứu mẫu chùm với các chùm cùng cỡ,<br />
không cùng cỡ và kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước. Tiến hành<br />
lấy mẫu con, đưa ra các kết quả cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề<br />
cập tới mẫu cặp phân tầng và ước lượng hồi quy.<br />
Keywords: Toán học; Lý thuyết xác suất; Thống kê toán học; Phương pháp lấy mẫu; Xử lý mẫu.<br />
Content:<br />
LỜI NÓI ĐẦU<br />
<br />
Trong nghiên cứu thống kê toán học, mẫu đại diện là thông tin duy nhất<br />
mà nhà thống kê có được, trên cơ sở đó chúng ta phân tích, xử lý, rút ra các kết<br />
luận cần thiết. Do đó việc lấy mẫu không thể thiếu trong nghiên cứu thống kê.<br />
Các điểm chính của lấy mẫu là tạo ra một nhóm nhỏ từ tổng thể mang đầy đủ<br />
các thông tin của tổng thể. Tức là, chúng ta muốn có một nhóm nhỏ giống các<br />
nhóm lớn. Với ý nghĩ đó, một trong những tính năng chúng ta tìm kiếm trong<br />
một mẫu là mức độ đại diện - như thế nào thì rút được mẫu đại diện cho tổng<br />
thể ? Mẫu cần có các tính chất chặt chẽ như thế nào để giống tổng thể?<br />
Lấy mẫu có ưu điểm nổi bật. Đó là giảm chi phí và số liệu được thu thập<br />
nhanh.<br />
- Giảm chi phí: Nó rõ ràng là ít tốn kém vì chỉ nghiên cứu dữ liệu của một<br />
tập con của tổng thể, chứ không phải là toàn bộ tổng thể. Hơn nữa, dữ liệu<br />
được thu thập trong một mẫu được lựa chọn một cách cẩn thận có độ chính<br />
xác cao như toàn bộ tổng thể.<br />
- Tốc độ: việc quan sát thu thập và tóm tắt của một mẫu dễ dàng hơn và<br />
nhanh hơn so với cả tổng thể. Điều tra toàn bộ tổng thể bằng cách liệt kê là<br />
không thực tế hoặc không thể. Như vậy, cuộc điều tra dựa trên mẫu có sự linh<br />
hoạt hơn về các loại thông tin có thể đạt được.<br />
Lấy mẫu được ứng dụng rộng rãi trong tất cả các lĩnh vực khoa học và xã<br />
hội mà có sự nghiên cứu và ứng dụng của thống kê toán học. Ở Việt Nam, lấy<br />
mẫu cũng được sử dụng trong rất nhiều ngành. Song cũng tồn tại một thực tế<br />
rằng không ít trường hợp ở Việt Nam mẫu được lấy ra không đại diện trung<br />
thực và khách quan cho tổng thể, chẳng hạn cả vùng trồng rau Thanh Trì Hà<br />
Nội người ta chỉ lấy một mẫu gồm 3 quan sát để kiểm tra xem có dư thừa độc tố<br />
trong rau hay không, hoặc để kiểm tra an toàn thực phẩm của hoa quả Trung<br />
Quốc nhập qua biên giới phía Bắc, bộ phận kiểm tra chỉ lấy ra 8 quả trong số<br />
hàng chục ngàn quả, v. . . .; Do đó dẫn đến các kết luận trái ngược nhau giữa 2<br />
cơ quan khoa học của thành phố hoặc kết luận trái ngược với thực tế xảy ra.<br />
Bàn về việc lấy mẫu đại diện ở nước ta là việc làm vượt quá tầm và khả<br />
năng của tác giả cũng như vượt ra ngoài khuôn khổ của luận văn này.<br />
Dựa trên cuốn chuyên khảo “Sampling techniques” của William G. Cochran<br />
<br />
<br />
4<br />
và một số bài báo, một số bình luận, nhận xét trên trang mạng Bách khoa toàn<br />
thư mở (Wikipedia), luận văn “Các phương pháp lấy mẫu và xử lý mẫu”<br />
đã trình bày tổng quan về các phương pháp lấy mẫu đối với một lô (một tổng<br />
thể) gồm hữu hạn phần tử và xử lý thống kê các đại lượng liên quan của lô.<br />
Luận văn gồm 4 chương:<br />
- Chương 1 trình bày các kết quả của mẫu ngẫu nhiên đơn giản từ một lô<br />
gồm hữu hạn phần tử. Các ước lượng, tính chất và phương sai của ước lượng<br />
của trung bình tổng thể, tổng thể, tỷ số. . . Ở chương này đưa ra những khái<br />
niệm cơ bản mà ta sẽ dùng ở các chương tiếp theo như: khái niệm ước lượng<br />
không chệch, tính vững của ước lượng.<br />
- Chương 2 đề cập đến lấy mẫu ngẫu nhiên phân tầng và lấy mẫu hệ thống,<br />
được trình bày theo mạch chính giống như lấy mẫu ngẫu nhiên đơn giản. Ngoài<br />
ra còn có những so sánh giữa mẫu ngẫu nhiên phân tầng và mẫu ngẫu nhiên<br />
đơn giản, mẫu hệ thống với mẫu ngẫu nhiên phân tầng.<br />
- Chương 3 đề cập đến mẫu chùm với các chùm cùng cỡ, không cùng cỡ và<br />
kết hợp giữa mẫu chùm và các mẫu đã đề cập ở hai chương trước.<br />
- Chương 4: Lấy mẫu con và lấy mẫu cặp. Lấy mẫu con đưa ra các kết quả<br />
cho mẫu hai giai đoạn và mẫu ba giai đoạn. Lấy mẫu cặp chỉ đề cập tới mẫu<br />
cặp phân tầng và ước lượng hồi quy.<br />
Qua đây, tác giả xin được bày tỏ lời cảm ơn sâu sắc đến người thầy, người<br />
hướng dẫn luận văn của mình, PGS.TS Đào Hữu Hồ, người đã đưa ra đề tài và<br />
tận tình hướng dẫn trong suốt quá trình làm luận văn của tác giả. Đồng thời<br />
tác giả cũng gửi lời cảm ơn tới những đồng nghiệp, những người bạn đã giúp<br />
đỡ tác giả trong quá trình hoàn thành luận văn.<br />
Do thời gian và trình độ còn hạn chế, chắc chắn bản luận văn không thể<br />
tránh khỏi những thiếu sót, tác giả rất mong được sự chỉ bảo tận tình của các<br />
thầy cô, đồng nghiệp và các bạn, tác giả xin chân thành cảm ơn!<br />
Hà Nội, ngày ... tháng 01 năm 2013<br />
Tác giả<br />
<br />
<br />
<br />
Mai Thị Hương<br />
<br />
<br />
<br />
<br />
5<br />
TÀI LIỆU THAM KHẢO<br />
<br />
Tiếng Việt<br />
<br />
1. Đào Hữu Hồ (2008), “Xác suất thống kê”, in lần thứ 11, Nhà xuất bản<br />
Đại học Quốc Gia Hà Nội.<br />
<br />
2. Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), “Thống kê toán<br />
học”, Nhà xuất bản Đại học Quốc Gia Hà Nội.<br />
<br />
3. Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), “Cơ sở lý thuyết xác suất”,<br />
Nhà xuất bản Đại học Quốc Gia Hà Nội.<br />
<br />
Tiếng Anh<br />
<br />
4. Brooks, S. (1955). The estimation of an optimum subsampling number.<br />
Jour. Amer. Stat. Assoc, 50, 398 – 415.<br />
<br />
5. Cochran, W. G (1942). Sampling theory when the sampling units are of<br />
unequal sizes. Jour. Amer. Stat. Assoc.<br />
<br />
6. Cornell, F. G (1947). A stratified random sample of a small finite popu-<br />
lation. Jour. Amer. Stat. Assoc.<br />
<br />
7. Dalenius, T., and Hodges, J. L., Jr (1959). Minimum variance stratifica-<br />
tion. Jour. Amer. Stat. Assoc.<br />
<br />
8. Das, A. C (1950). Two-dimensional systematic sampling and the associ-<br />
ated stratified and random sampling. Sankhya.<br />
<br />
9. Evans, W. D. (1951). On stratification and optimum allocations. Jour.<br />
Amer. Stat. Assoc, 46, 95 – 104.<br />
<br />
10. Finney, D. J (1948). Random and systematic sampling in timber surveys.<br />
Forestry.<br />
<br />
11. Hansen, M. H., and Hurwitz, W. N (1943). On the theory of sampling<br />
from finite populations. Ann. Math. Stat.<br />
<br />
<br />
<br />
96<br />
12. Horvitz, D. G., and Thompson, D. J. (1952). A generalization of sampling<br />
without replacement from a finite universe. Jour. Amer. Stat. Assoc, 47,<br />
663 – 685.<br />
<br />
13. Lahiri, D. B. (1951). A method for sample selection providing unbiased<br />
ratio estimates. Bull. Int. Stat. Inst., 33, 2, 133 – 140.<br />
<br />
14. Lohr, SharonL. (1999). Sampling: Design and analysis, Duxbury, ISBN 0<br />
– 534 – 35361 – 4.<br />
<br />
15. Rao, J. N. K. (1973). On double sampling for stratification and analytical<br />
surveys. Biometrika, 60, 125 – 133.<br />
<br />
16. Robert M. Groves, etalia (2010). Survey methodology. ISBN 0 – 471 –<br />
48348 – 6.<br />
<br />
17. Stephan, F. F. (1941). Stratification in representative sampling. Jour.<br />
Marketing, 6, 38 – 46.<br />
<br />
18. Stuart, A. (1954). A simple presentation of optimum sampling results.<br />
Jour. Roy. Stat. Soc, B16, 239 – 241.<br />
<br />
19. William G. Cochran “Sampling techniques” (1977), third edition. JOHN<br />
WILEY & SONS, INC.<br />
<br />
20. Yates, F., and Grundy, P. M. (1953). Selection without replacement from<br />
withinstrata with probability proportional to size. Jour. Roy. Stat. Soc,<br />
B15, 253 – 261.<br />
<br />
21. Trang web: Wikipedia, the free encyclopedia:<br />
<br />
• Sampling (Statistics) (12/2012).<br />
• Sampling techniques<br />
• Paula Lagapes Barreiro Justo Puerto Albandoz<br />
• Population and Sample Sampling Techniques, univ. of Seville.<br />
• Jamie Mcentosh (2/2008): Probability sampling techniques.<br />
<br />
<br />
<br />
<br />
97<br />