BÀI 5 BÀI 5 KHÁI NIỆM PHƯƠNG PHÁP MẪU
Ệ
TS. Nguyễn Mạnh Thế TS N ễ M h Thế
v1.0012107210
1
TÌNH HUỐNG KHỞI ĐỘNG
ố ì
1-2 2-3 3-4 4-5 5-6 6-7
Thu nhập
10 8 5 7 3 2 10 2
7
3
8
5
Số người Số người
Tình huống Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng) ở huyện Đông Anh, ta có bảng số liệu mẫu sau: ở huyện Đông Anh ta có bảng số liệu mẫu sau:
Cần phải tính thu nhập bình quân đầu người và độ chênh lệch thu nhập để xác định mức sống của người dân và mức lệch thu nhập để xác định mức sống của người dân và mức độ đồng đều về thu nhập trong vùng.
Câu hỏi gợi mở
Câu 1: Thu nhập bình quân đầu người là bao nhiêu?
Câu 2: Độ chênh lệch thu nhập là bao nhiêu? Câu 2: Độ chênh lệch thu nhập là bao nhiêu?
v1.0012107210
Câu 3: Độ chênh lệch bình quân hiệu chỉnh? 2
TÌNH HUỐNG KHỞI ĐỘNG
Kết luận
n
X
X G(X , X ,..., X ) n
1
2
i
1 n i 1
được gọi là trung bình mẫu.
2. Thống kê:
2
2
S
S
X)
i
(X
n1 1 n i 1
được gọi là độ lệch chuẩn mẫu được gọi là độ lệch chuẩn mẫu. 3. Thống kê:
n
2
S S '
2 S S '
X) X)
i
(X (X
1 n 1 i 1
được gọi là độ lệch chuẩn mẫu hiệu chỉnh.
3
v1.0012107210
1. Thống kê: g
MỤC TIÊU
• Cơ sở lý thuyết mẫu;
• Tổng thể nghiên cứu;
• Mẫu ngẫu nhiên;
• Thống kê; kê
Thố
• Mẫu ngẫu nhiên hai chiều; • Mẫu ngẫu nhiên hai chiều;
• Quy luật phân phối xác suất
ậ p
p
Q y của một số thống kê.
4
v1.0012107210
1. CỞ SỞ LÝ THUYẾT MẪU
Bài toán: Cần nghiên cứu tính chất định tính hoặc định lượng của các phần tử trong một tập hợp nào đó. à đó
ộ ậ h
Ta có hai phương pháp thực hiện nghiên cứu:
Khái niệm phương pháp mẫu:
Nghiên cứu bộ phận
Nghiên cứu toàn bộ
• Ta lấy ra một • Ta lấy ra một
tập con và tập con và nghiên cứu toàn bộ các phần tử trong tập con đó.
lớn về kinh tế, có • Chi phí Chi phí lớn về kinh tế có thể phá hủy toàn bộ tập hợp cần nghiên cứu.
• Không thể nghiên cứu được
• Đưa ra kết luận cho các phần tử trong tập hợp nghiên cứu.
toàn bộ.
Đây là phương pháp nghiên cứu Đây là phương pháp nghiên cứu mẫu (Sampling).
Vậy ta thấy nghiên cứu toàn bộ Vậy ta thấy nghiên cứu toàn bộ tập hợp là không khả thi.
5
v1.0012107210
2. TỔNG THỂ NGHIÊN CỨU
Tổng thể là tập hợp các phần tử cần nghiên cứu tính chất định tính hoặc định lượng, số phần tử trong tổng thể gọi là cỡ của tổng thể, ký hiệu là N. lượng số phần tử trong tổng thể gọi là cỡ của tổng thể ký hiệu là N
a) Biến định lượng
b) Biến định tính
Mã hóa: Lấy giá trị của biến định lượng làm mã của biến.
Mã hoá: Gán tính chất định tính của biến ứng với các số nguyên.
Vậy khi nghiên cứu tổng thể ta luôn có thể giả sử là các các phần tử có dấu hiệu định lượng.
6
v1.0012107210
Định nghĩa:
2. TỔNG THỂ NGHIÊN CỨU (tiếp theo)
là số lần giá trị xi
1
iN
Mô tả tổng thể Mô tả tổng thể
Cho tổng thể với các phần tử { xuất hiện trong tổng thể, ta có: g
N
}. Với n ... N
x , x ,..., x 2 N N 1 1
2 2
k k
g ệ
f i
(i 1...k), f i
N i N N
xi fi
x1 x2 … xk f1 f2 … fk
Dễ thấy:
Đặt được gọi là tần suất của xi trong tổng thể:
... 1 f 1 f 2 f k
2
2
m
s
(m)
(x m)
N x i
i
f x i
i
i
f x i
2 i
k k i 1
k k i 1
1 1 k k N i 1
1 1 N N N i 1
Trung bình tổng thể: Phương sai tổng thể:
v1.0012107210
7
3. MẪU NGẪU NHIÊN
Các phương pháp lấy mẫu; • Các phương pháp lấy mẫu;
• Định nghĩa mẫu ngẫu nhiên;
• Mô tả mẫu ngẫu nhiên:
Theo biều đồ tần suất; Theo tổ chức đồ.
v1.0012107210
8
3.1. CÁC PHƯƠNG PHÁP LẤY MẪU
Mục đích M đí h
• Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải
nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu, từ nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu từ
đó rút ra kết luận cho tổng thể.
• Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu • Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu
nhiên (random sample).
Các phương pháp lấy mẫu Các phương pháp lấy mẫu
• Cách chọn mẫu ngẫu nhiên đơn giản:
Chọn mẫu ngẫu nhiên có hoàn lại; Chọn mẫu ngẫu nhiên có hoàn lại;
Chọn mẫu ngẫu nhiên không hoàn lại.
• Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực
hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần.
v1.0012107210
9
3.2. ĐỊNH NGHĨA MẪU NGẪU NHIÊN
ẫ ẫ ẫ ộ ỡ là h ê h ê ộ ậ ủ b ế
n
1
gọi là giá trị cụ thể của mẫu ngẫu nhiên x , x ,..., x 2
n
1
;
Một mẫu ngẫu nhiên cỡ n của biến ngẫu nhiên X là một tập các biến á b ế ngẫu nhiên X1, X2,… Xn độc lập và có cùng phân phốí với biến ngẫu nhiên X. Trong đó mỗi Xk là một quan sát về biến ngẫu nhiên X. Quan sát Xk nhận giá trị xk Khi đó bộ giá trị X , X ,..., X 2 Ví dụ: Ví dụ:
Khi gieo con xúc xắc 5 lần ta được một mẫu ngẫu nhiên (X1, X2, X3, X4, X5) với các giá trị của mỗi lần gieo là (3, 5, 2, 3, 1). ỗ
v1.0012107210
10
3.3. MÔ TẢ MẪU NGẪU NHIÊN
xi
x1 x2 … xk
ni
n1 n2 … nk
n
Với ni là số lần giá trị xi xuất hiện trong mẫu. Với n là số lần giá trị x xuất hiện trong mẫu Ta có
... n k
n 2
n 1
Biểu đồ tần suất: iể đồ ầ ấ
Đặt
gọi là tần suất của xi trong mẫu.
f i
, f i
n i i n
ẫu Ta có bảng biểu diễn tần suất mẫu:
a có bả g b ểu d ễ tầ suất
xi fi fi
x1 x2 … xk f1 f2 … fk fk
f1
f2
n 1
n 2
... n k
trong đó:
...
1
f 1
f 2
f k
n n
11
v1.0012107210
ẫ
3.3. MÔ TẢ MẪU NGẪU NHIÊN (tiếp theo)
khoảng a0- a1 a1- a2 … ak-1- ak
ni
n1 n2 … nk
oả g (ai-1, ai] ni là số giá trị mẫu rơi vào khoảng (ai-1, ai] ẫu ơ ào i à số g á t ị
n
n 1
n 2
... n k
Mỗi khối chữ nhật có: • Chiều cao:
y
i
n i n.h i
• Độ dài: • Độ dài:
h i
a i
i 1
a
12
v1.0012107210
Tổ chức đồ: ổ hứ đồ
PROPERTIES Allow user to leave interaction: Show ‘Next Slide’ Button: Completion Button Label:
Anytime Don't show Next Slide
4. THỐNG KÊ
á h í h á iá ị hố h h ẫ ẫ
Cách tính các giá trị thống kê đặc trưng mẫu cho mẫu thu gọn kê đặ Nếu mẫu cho dưới dạng khoảng ta chọn mỗi khoảng điểm đại diện
lúc đó ta có mẫu thu gọn.
i
i 1 2
a a i x , i 1,2,...,k
x ix
n in
in .x i
2 2 in .x i
x
A n
x1 x
n1 n
n1x1 n x
2
2
s
(x)
B n
2
'2
2
s
s
n n 1
n2 . ni . n nk nkxk nkxk n
n2x2 . nixi . n x A
n x 2 n1x1 2 n2x2 . nixi . n x 2 B
Khoảng Khoảng giá trị mẫu a0 – a1 a a a1 – a2 . ai-1 – ai . a ak-1 – ak a
x2 . xi . xk x
Lập một bảng tính như sau:
v1.0012107210
15
4. THỐNG KÊ (tiếp theo)
Thu nhập
1-2
2-3
3-4
4-5
5-6
6-7
Số người
10
8
5
7
3
2
Ví dụ: Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng), ta có bảng số liệu mẫu sau: ẫ l ệ
2
2 x, s , s , s, s x s s s ' s '
Tính các giá trị đặc trưng mẫu.
v1.0012107210
16
4. THỐNG KÊ (tiếp theo)
ix
in
n .x i
i
2 n .x i
i
Khoảng thu thu nhập
1-2 2-3 2-3 3-4 4-5 5-6 6-7
1,5 2,5 2 5 3,5 4,5 5,5 , 6,5
10 8 8 5 7 3 2
15 20 20 17,5 31,5 16,5 , 13
22,5 50 50 61,25 141,75 90,75 , 84,5
Bài giải: Ta lập bảng tính sau lậ bả í h
n =35 113,5 450,75
x 113.5 / 35 3,243
2 2
2 2
s
450,75 / 35 (3,243) (3 2 3)
/ 3
0
2,363 2 363
s '
2, 43 1,559
s
2,363 1,573
2
2 s '
s
2,363 2, 43
35 35 34
n n 1
17
v1.0012107210
5. MẪU NGẪU NHIÊN HAI CHIỀU
1
1
2
2
i đì h t
iá t ị
ẫ
Lấy mẫu điều tra thu nhập và tiêu dùng (triệu đồng/tháng) của 10 hộ gia đình ta thu được giá trị mẫu: th đượ (2; 1.4), (2, 1.5), (3; 1.8), (4; 1.8), (2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4), (2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4), (4; 3.5), (5; 3.7).
18
v1.0012107210
Khái niệm: Khái niệm: Một mẫu ngẫu nhiên cỡ n của véc tơ ngẫu nhiên (X, Y) là một tập các véc tơ ngẫu nhiên (X1, Y1), (X2, Y2)… (Xn, Yn) n n độc lập và có cùng phân phốí với biến ngẫu nhiên (X, Y). Trong đó mỗi véc tơ (Xi, Yi) là một quan sát thứ i về véc tơ ngẫu nhiên (X, Y). ngẫu nhiên (X Y) Ký hiệu (xi, yi) là giá trị của mẫu (Xi, Yi) ( i = 1, 2,.., n) Bộ giá trị {(x1, y1), (x2, y2)… (xn, yn)} gọi là giá trị cụ thể của Bộ giá trị {(x1, y1), (x2, y2)… (xn, yn)} gọi là giá trị cụ thể của (X1, Y1), (X2, Y2)… (Xn, Yn). Ví dụ:
5.1. PHƯƠNG PHÁP MÔ TẢ MẪU
Dạng 1: Lập một bảng hai dòng như sau: Dạng 1: Lập một bảng hai dòng như sau:
xi
x1 x2 … xn
y
y
yi y
y1 y2 … yn y
Dạng 2: Ta thu gọn mẫu và biểu diễn dưới dạng bảng chữ nhật như sau:
y1
y2
… yj …
ai
yh
yi xi x1 x1 x2 … xi … xk bj
n11 n11 n21 … ni1 n … nk1 b1
n12 n12 n22 … ni2 n … nk2 b2
... n1j ... ... n1j ... ... n2j ... ... nij n ... ... nkj ... j bj
n1h n1h n2h ... nih n ... nkh bh
a1 a1 a2 … ai a .... ak n
Ta có:
h
k
k
h
à và
b
a i
n ij
j
n ij
n
n ij
j 1
i 1
i 1 j 1
19
v1.0012107210
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU
Véc tơ ngẫu nhiên hai chiều • Véc tơ ngẫu nhiên hai chiều
gọi gọi
(X, Y) (X Y)
là trung bình mẫu của véc tơ ngẫu
nhiên (X, Y), trong đó nhiên (X Y) trong đó
và và
là các là các
X X
Y Y
trung bình mẫu của biến ngẫu nhiên
thành phần X và Y. thà h hầ X à Y
• Giá trị thống kê mẫu của mẫu ngẫu
nhiên hai chiều là
. (x, y)
20
v1.0012107210
Trung bình mẫu:
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU (tiếp theo)
Hệ số tương quan mẫu ệ ố ẫ
n
trong đó thống kê
R
XY
X Y k k k k
XY (X)(Y) X YS S S S
1 k 1n
Giá trị của hệ số tương quan mẫu đối với mẫu cụ thể:
là r
{(x , y ),(x , y ),...,(x , y )} 2
n
n
1
1
2
n
k
h
y xy
( )(y) (x)(y)
xy xy
r
l
n x y n x y i ij
j
x y x y l
1 n
1 n
l 1
i 1 j 1
s s X Y
n
2 2
s
(x) ( )
x
x
X
2 2 l
l
1 1 x n l 1
n1 1 n l 1
2
s
(y)
y
y
Y
2 l
y
l
n1 1 n l 1
n1 n 1 n l 1
21
v1.0012107210
Định nghĩa. Hệ số tương quan mẫu của mẫu ngẫu nhiên hai chiều ký hiệu là R được xác định bởi: hai chiều ký hiệu là R được xác định bởi:
6. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ
ố
ẫ
â
à
X
Định nghĩa Phân phối xác suất của một thống kê được gọi là phân phối mẫu.
23
v1.0012107210
Ví dVí dụ: Phân phối xác suất của được gọi là phân phối mẫu của thống kê trung bình mẫu. phối mẫu của thống kê trung bình mẫu.
6.1. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1
Cho X~A(p) Xét mẫu ngẫu nhiên
rút ra từ X.
(X , X ,..., X ) 2 n
1
X p
có quy luật phân phối N(0,1)
U
n
p(p 1) p(p 1)
đủ lớ
f p
Định lý 1: Thống kê khi n đủ lớn. khi
U
n
p(p 1)
trong đó
, với k là số lần mẫu nhận giá trị 1.
f
k n
24
v1.0012107210
Chú ý: Thống kê U cũng có thể viết lại dưới dạng
6.2. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1
và
(X , X ,..., X ) 2 n
1
(Y , Y ,..., Y ) m
1
2
Cho X~A(p1) và Y~A(p2) Xét hai mẫu ngẫu nhiên rút ra từ X và Y.
có quy luật phân phối N(0,1) có quy luật phân phối N(0 1)
U U
2
1
(p X Y (p p ) p ) 1 1 2 2 p (1 p ) 2 m
p (1 p ) 1 n
Định lý 2: Thống kê Định lý 2: Thống kê
và
có thể được thay bằng
và
X
Y
1f
2f
trong đó trong đó
,
f f 1
; f ; f 2
k 1 1 n
k 2 2 m
với k1 là số lần mẫu ngẫu nhiên của X nhận giá trị 1, k2 là số lần mẫu ngẫu nhiên của Y nhận giá trị 1.
25
v1.0012107210
Chú ý:
6.3. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN
.
Cho mẫu ngẫu nhiên (X1, X2, …Xn) được rút ra từ biến ngẫu nhiên X có quy luật phân phối chuẩn N ,
2
có phân phối chuẩn
N
X
Định lý 3: Thống kê trung bình mẫu
2 , X X
...
X
X
n ~ N(0,1)
U
2
2
2
...
2 2 X
n
n 2 2 n
X
• Thống kê
có quy luật phân bố student với n-1 bậc tự do.
T
n
' S
'2
2
có quy luật phân phối khi bình phương với n-1 bậc
X
2
(n 1)S (n 1)S
• Thống kê tự do.
26
v1.0012107210
Định lý 4: ý ị
6.4. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN
),
ẫ Y ~ N(
)
Xét mẫu ngẫu nhiên Xét mẫu ngẫu nhiên
rút ra từ X rút ra từ X
và mẫu ngẫu nhiên
rút ra từ Y.
hiê độ lậ X à Y Ch h i biế Cho hai biến ngẫu nhiên độc lập X và Y 2 2 , X ~ N( , 1 1 2 2 (X , X ,..., X ) (X X X ) 2 n 1 (Y , Y ,..., Y ) m
1
2
X Y (
)
2
U
1
2 2
2 1
m m
n n
có quy lụât phân phối chuẩn N(0,1).
X Y (
1
2
Định lý 5: Thống kê
T
) nm(n m 2) n m
nS mS
2 X
2 Y
có quy luật phân phối student với n + m – 2 bậc tự do.
Các thống kê U và T sẽ được sử dụng trong phần ước lượng và kiểm định tiếp theo. lượ
đị h tiế th
à kiể
27
v1.0012107210
Định lý 6: Thống kê
TÓM TẮT CUỐI BÀI
Nội dung chính
1. Khái niệm mẫu ngẫu nhiên và tổng thể nghiên cứu.
2. Các phương pháp lấy mẫu.
ẫ
3. Thống kê và các thống kê đặc trưng của mẫu. 3 Thống kê và các thống kê đặc trưng của mẫu
4. Quy luật phân phối xác suất của một số thống kê. 4 Quy luật phân phối xác suất của một số thống kê
28
v1.0012107210
PROPERTIES Allow user to leave interaction: Show ‘Next Slide’ Button: Completion Button Label:
Anytime Don't show Next Slide