2/16/2019
1
LÝ THUYẾT MẪU
1
Chương 5
Phương pháp mẫu
Tổng thể (population)
Mẫu (Sample)
Tham số (parameter)
Thống (statistic)
2
Nội dung
Trong thuyết mẫu hay thống suy diễn ta
thường dùng các đặc trưng của mẫu (statistic) để
ước tính các đặc trưng của tổng thể (parameter)
Nếu ta lấy mẫu cỡ ntừ tổng thể thì điều sẽ xảy
ra? Trung bình mẫu sẽ quy luật phân phối ?Tỷ
lệ mẫu quy luật ?
Để ước tính trung nh tổng thể ta dùng đặc trưng
nào của mẫu?Tương tự cho c tham số khác như
tỷ lệ phương sai?
Phải hiểu quy luật phân phối của mẫu
(sampling distribution)
3
Tổng thể Mẫu TQ
Mẫu
cụ
thể
Kích
thước N n n
Trung
bình
Phương
sai
Độ lệch
chuẩn
Tỷ lệ A
Tóm tắt tổng thể mẫu
4
EX
2VX
VX
p P A
X
*
;;SSS
F
x
22
2*
;;s s s
*
;;sss
f
Các thuật ngữ
Tham số (Parameters) các đại lượng số đặc trưng
của tổng thể.Đây các giá trị cố định.
Thống (Statistics) các đại lượng đặc trưng của
mẫu. Chúng biến đổi từ mẫu này sang mẫu khác
nhìn chung các biến ngẫu nhiên. Ta cố gắng xác định
quy luật phân phối xác suất của các biến ngẫu nhiên
này. Từ đó tìm ra cách suy diễn cho tổng thể.
Sai số chuẩn (Standard error) độ lệch chuẩn của một
thống mẫu
Độ lệch chuẩn (Standard deviation) liên quan đến một
mẫu
5
Phân phối của trung bình mẫu
Một bể lớn từ trại giống đang được chuyển đến hồ.
Ta muốn biết chiều dài trung bình của trong bể. Thay
đo chiều dài của toàn bộ trong bể ta chọn ngẫu nhiên
một mẫu sử dụng trung bình mẫu để ước lượng cho
trung bình tổng thể.
Đặt trung bình mẫu
𝑋. Giá trị của
𝑋 ngẫu nhiên do
phụ thuộc vào mẫu được chọn ra.
Trung bình mẫu
𝑋được gọi một thống .
Trung bình của tổng thể cố định,ta hiệu μ.
Phân phối của trung bình mẫu cũng phân phối của biến
ngẫu nhiên
𝑋.
Thông thường, phân phối của trung bình mẫu rất phức tạp
ngoại trừ trường hợp cỡ mẫu rất nhỏ hoặc rất lớn.
Phương pháp chọn mẫu ngẫu nhiên, không hoàn lại.
6
2/16/2019
2
dụ minh họa
Tổng thể trọng lượng của sáu quả ngô (kg)được
trưng bày trong một gian hàng trò chơi "đoán trọng
lượng" của hội chợ.Bạn được yêu cầu đoán trọng
lượng trung bình của sáu quả ngô bằng cách lấy một
mẫu ngẫu nhiên không hoàn lại từ tổng thể.
7
Quả
A
B
C
D
E
F
Trọng
lượng
(kg)
19
14
15
9
10
17
Trung bình tổng thể: μ=14 (kg)
Chọn mẫu cỡ n=2
Sample
Weight
𝑋Probability
A, B
19, 14
16.5 1/15
A, C
19, 15
17.0 1/15
A, D 19, 9 14.0 1/15
A, E
19, 10
14.5 1/15
A, F
19, 17
18.0 1/15
B, C
14, 15
14.5 1/15
B, D 14, 9 11.5 1/15
B, E
14, 10
12.0 1/15
B, F
14, 17
15.5 1/15
8
𝑋9.5
11.5
12.0
12.5
13.0
13.5
14.0
14.5
15.5
16.0
16.5
17.0
18.0
P
1/15
1/15
2/15
1/15
1/15
1/15
1/15
2/15
1/15
1/15
1/15
1/15
1/15
Sample
Weight
𝑋Probability
C, D 15, 9 12.0 1/15
C, E
15, 10
12.5 1/15
C, F
15, 17
16.0 1/15
D, E 9, 10 9.5 1/15
D, F 9, 17 13.0 1/15
E, F
10, 17
13.5 1/15
Bảng phân phối xác suất của trung bình mẫu:
14
EX
Chọn mẫu cỡ n=5
Sample Weight
𝑋Probability
A, B, C, D, E 19, 14, 15, 9, 10 13.4 1/6
A, B, C, D, F 19, 14, 15, 9, 17 14.8 1/6
A, B, C, E, F
19, 14, 15, 10, 17
15.0 1/6
A, B, D, E, F 19, 14, 9, 10, 17 13.8 1/6
A, C, D, E, F 19, 15, 9, 10, 17 14.0 1/6
B, C, D, E, F 14, 15, 9, 10, 17 13.0 1/6
9
𝑋13.0 13.4 13.8 14.0 14.8 15.0
P1/6 1/6 1/6 1/6 1/6 1/6
14
EX
Tổng hợp
Nếu cỡ mẫu lớn thì?
Cần chọn mẫu cỡ bao nhiêu?
Trung bình mẫu quy luật phân phói như thế nào?
Xu hướng trung tâm của trung bình mẫu ?
Mức độ biến động của trung bình mẫu so với xu
hướng trung tâm?
10
Phân phối xác suất của thống mẫu
Bị ảnh hưởng bởi:
Cỡ mẫu
Phân phối của tổng thể
Cách thức chọn mẫu
11
Tổng thể tham số tổng thể
Kích thước N, gồm các phần tử cùng một dấu
hiệu nghiên cứu X
X: bnn gốc của tổng thể
PPXS của Xcũng ppxs của tổng thể
Các tham số tổng thể tham số đặc trưng của
bnn X
12
2
;;

E X V X p P X
2/16/2019
3
Mẫu ngẫu nhiên tổng quát
Định nghĩa.Tập hợp nbiến ngẫu nhiên độc lập X1, X2,
, Xnthành lập từ biến ngẫu nhiên gốc Xđược gọi
mẫu ngẫu nhiên cỡ n (kích thước n)
hiệu: W=(X1, X2,, Xn) trong đó Xi các bnn
Xi cùng quy luật phân phối với X
Một phép thử với mẫu ngẫu nhiên một mẫu cụ thể
gồm n quan sát. w=(x1,x2,,xn)
13
2
ii
E X E X V X V X

Các đặc trưng mẫu (statistic)
Trung bình mẫu:
Phương sai mẫu:Tỷ lệ mẫu:
14
𝑆2=1
𝑛 1
𝑖=1
𝑛𝑋𝑖
𝑋2
𝑆2=1
𝑛
𝑖=1
𝑛𝑋𝑖
𝑋2
𝑆 2 =1
𝑛
𝑖=1
𝑛𝑋𝑖𝜇 2
𝑋 = 𝑋1+𝑋2+...+𝑋𝑁
𝑛
Y
Fn
Tính chất các thống mẫu
Trung bình mẫu:
Phương sai mẫu:
Tỷ lệ mẫu:
15
2
E X V X X
nn


*2 2
ES
22
1n
ES n
22
ES
1

pp
E F p V F n
Thực hành tính thống mẫu
Điều tra thời gian sử dụng internet trong tuần của 90
sinh viên một trường ta được bảng số liệu sau:
Hãy tính các thống mẫu sau:
a) Trung bình mẫu,phương sai mẫu (đã hiệu chỉnh),
phương sai mẫu chưa hiệu chỉnh?
b) Tỷ lệ sinh viên trong mẫu thời gian sử dụng trên 5
giờ một tuần?
16
Thời gian (giờ) 3 4 5 6 7 8
Số sv 7 8 17 24 20 14
Cách 1_Lập bảng
17
xinixini(xi)2ni
…. …. …. ….
…. …. …. ….
Tổng
i
n
ii
xn
2
ii
xn
ii
xn
xn
2
22
ii
xn
sx
n

2
2
1
n
ss
n
i
nn
Cách 1_Lập bảng
18
xinixini(xi)2ni
3 7 21 63
4 8 32 128
517 85 425
624 144 864
720 140 980
814 112 896
Tổng
90 534 3356
2/16/2019
4
Cách 1_Lập bảng
Cỡ mẫu:
Trung bình mẫu:
Phương sai mẫu chưa hiệu chỉnh:
Phương sai mẫu đã hiệu chỉnh:
19
90
i
nn
534 5,9333
90
ii
xn
xn
2
22
... 2,0844
ii
xn
sx
n
2
22,1078
1

n
ss
n
2,1078 1, 4518s
Độ lệch mẫu đã hiệu
chỉnh:
Cách 2__dùng máy tính 570ES
1. Shift + 9 + 3 + = + =: Reset máy
2. Shift + Mode + + 4 + 1: bật tần số (frequency on)
3. Mode + 3 + 1: vào tính thống 1biến (stat1-var)
4. Khi này ta bảng sau:
20
X FREQ
1
2
3
Cách 2__dùng máy tính 570ES
Ta nhập vào như sau:
Nhấn AC để thoát.
21
X FREQ
1 3 7
2 4 8
3 5 17
4 6 24
5 7 20
6 8 14
Cách 2_dùng máy tính 570ES
6. Lấy số liệu thống : Shift + 1 + 5 (4) Chọn Var
Ta bảng sau:
Tương ứng:
1: cỡ mẫu 2: trung bình mẫu
3. Độ lệch chuẩn mẫu.
4. Độ lệch chuẩn mẫu hiệu chỉnh.
22
1: n
2:
3:
x
4:
sx
x
Không
phải
phương
sai
dụ 1
Lượng xăng hao phí của một ô đi từ Ađến Bsau 30 lần
chạy kết quả cho trong bảng.
23
Lượng xăng
hao phí
Số
lần
tương
ứng
9,6 9,8 3
9,8 10 5
10 10,2 10
10,2 10,4 8
10,4 10,6 4
a) Tính trung bình mẫu
b) Tính độ lệch chuẩn
mẫu
c) Tính độ lệch chuẩn
mẫu hiệu chỉnh
phỏng phân phối mẫu
http://onlinestatbook.com/stat_sim/sampling_dis
t/index.html
http://www.jbstatistics.com/sampling-
distributions/
https://newonlinecourses.science.psu.edu/stat41
4/node/132/
https://shiny.rit.albany.edu/stat/
24
2/16/2019
5
Phân phối xác suất của thống mẫu
A. Biến ngẫu nhiên gốc phân phối chuẩn
B. Biến ngẫu nhiên gốc phân phối B(1,p)
C. Hai tổng thể phân phối chuẩn
D. Hai tần suất của hai tổng thể
25
1. Tổng thể phân phối chuẩn
Cho tổng thể phân phối chuẩn.
Biến nn gốc X~N(µ; σ2)
Ta :
26
2
22
22
22
~ , ~ 0;1
~1
*1
~ ~ 1
Xn
X N N
n
Xn
tn
S
n S n S
Z n Z n





2. Tổng thể phân phối nhị thức
Gọi p tỷ lệ một tính chất A nào đó của tổng thể.
Khi này ppxs của bnn gốc X:B(1;p) hay A(p)
Lấy mẫu nn cỡ n, gọi F tỷ lệ mẫu.
Ta :
27
1
~ ; ~ 0;1
1
p p F p n
F N p N
npp




3. Hai tổng thể phân phối chuẩn
Cho hai tổng thể 2bnn gốc:
Ta tiến hành lấy 2mẫu độc lập:
Các thống mẫu tương ứng:
28
22
~ ; ; ~ ;
X X Y Y
X N Y N
1 2 1 2
W , ,..., W , ,...,
nm
n X X X m Y Y Y
1 2 1 2
22
... ...
nm
XY
X X X Y Y Y
XY
nm
SS

3. Hai tổng thể phân phối chuẩn
Ta :
Do đó:
29
22
22
~ ; ; ~ ;
~;
XY
XY
XY
XY
X N Y N
nm
X Y N nm







22 ~ 0;1
XY
XY
XY
N
nm


3. Hai tổng thể phân phối chuẩn
Nếu chưa biết 2phương sai nhưng mẫu lớn m>30,
n>30 thì:
30
22 0;1
XY
XY
XY
ZN
SS
nm

