1
PHN II: THNG KÊ
Thống toán bộ môn toán học nghiên cứu quy luật của các hiện
tượng ngẫu nhiên tính chất số lớn trên sở thu nhập xử các
số liệu thống (các kết quả quan sát). Nội dung chủ yếu của thống
toán xây dựng các phương pháp thu nhập x các số liệu thống
nhằm rút ra các kết luận khoa học thực tiễn, dựa trên những
thành tựu của thuyết xác suất.
Việc thu thập, sắp xếp, trình y các số liệu của tổng thể hay của một
mẫu được gọi thống tả. n việc sử dụng các thông tin của
mẫu để tiến hành các suy đoán, kết luận về tng thể gọi thống
suy diễn.
Thống được ứng dụng vào mọi lĩnh vực. Một s ngành đã phát triển
thống ứng dụng chuyên u trong ngành như thống trong hội
học, trong y khoa, trong giáo dục học, trong tâm học, trong kỹ thuật,
trong sinh học, trong phân tích hóa học, trong th thao, trong hệ thống
thông tin địa, trong xử hình ảnh…
2
Chương I: THUYẾT MẪU
Chương II: THUYẾT ƯC LƯỢNG
Chương III: KIỂM ĐỊNH GIẢ THIẾT THỐNG
Chương IV: PHÂN TÍCH PHƯƠNG SAI ( chỉ trong BTL)
Chương V: THUYẾT HỒI QUY ĐƠN ( lược)
I.1. Một số khái niệm:
Tổng thể thống tập hợp các phần t thuộc đối tượng
nghiên cứu, cần được quan t, thu thập phân tích theo
một hoặc một s đặc trưng nào đó. c phần tử tạo thành
tổng thể thống kê được gọi đơn vị tổng thể.
Mẫu một số đơn vị được chọn ra từ tổng thể theo một
phương pháp lấy mẫu nào đó. c đặc tng mẫu được sử
dụng để suy rộng ra các đặc trưng của tổng thể nói chung.
Đặc điểm thống (dấu hiệu nghiên cứu) các tính chất
quan trọng liên quan trực tiếp đến nội dung nghiên cứu
khảo sát cần thu thập dữ liệu trên các đơn vị tổng thể; Người
ta chia làm 2 loại: đặc điểm thuộc tính đặc điểm số lượng.
3
Chương I: LÝ THUYẾT MẪU
4
Trong thực tế, phương pháp nghiên cứu toàn bộ tổng thể
chỉ áp dụng được với các tập hợp qui nhỏ, còn chủ
yếu người ta áp dụng phương pháp nghiên cứu không
toàn bộ, đặc bit phương pháp chọn mẫu.
Nếu mẫu được chọn ra một cách ngẫu nhiên xử bằng
các phương pháp xác suất thì thu được kết luận một ch
nhanh chóng, đỡ tốn kém vẫn đảm bảo độ chính xác
cần thiết.
2 phương pháp để lấy một mẫu n phần tử : lấy
hoàn lại lấy không hoàn lại. Nếu kích thước mẫu rất
so với kích thước tổng thể thì hai phương pháp y được
coi là cho kết quả như nhau.
Về mặt thuyết, ta giả định rằng các phần tử được lấy
vào mẫu theo phương thức hoàn lại mỗi phần tử của
tổng thể đều được lấy vào mẫu với khả năng như nhau.
Việc sử dụng bất kz phương pháp thống nào cũng chỉ đúng đắn
khi tổng thể nghiên cứu thỏa mãn những giả thiết toán học cn
thiết của phương pháp. Việc sử dụng sai dữ liệu thống thể tạo
ra những sai lầm nghiêm trng trong việc tả diễn giải. Bằng
việc chọn ( hoặc bác bỏ, hay thay đổi) một giá trị nào đó, hay việc
bỏ đi các giá trị quan t quá lớn hoặc quá nhỏ cũng một cách
làm thay đổi kết quả; đôi khi những kết quả thú vị khi nghiên cứu
với mẫu nhỏ lại không còn đúng với mẫu lớn.
Dữ liệu cấp dữ liệu người m nghiên cứu thu thập trực
tiếp từ đối tượng nghiên cứu hoặc thuê các công ty, các tổ
chức khác thu thập theo yêu cầu của mình.
Dữ liệu thứ cấp dữ liệu thu thập từ những nguồn sẵn,
thường đã qua tổng hợp, xử . Dữ liệu th cấp thường ưu
điểm thu nhập nhanh, ít tốn kém công sức chi phí so với
việc thu thập dữ liệu cấp; tuy nhiên dữ liệu y thường ít
chi tiết đôi khi không đáp ứng được yêu cầu nghiên cứu.
5