TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH
CHƯƠNG 5:
ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỀ
THAM SỐ TỔNG THỂ
Nội dung chính
5.1 Phân phối của các tham số mẫu (Bài giảng video)
5.2 Lý thuyết về ước lượng và kiểm định
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)
5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
2
EM3230 Thống kê ứng dụng
Nội dung chính
5.1 Phân phối của các tham số mẫu (Bài giảng video)
5.2 Lý thuyết về ước lượng và kiểm định (Bài giảng video)
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)
5.4 Ước lượng tỷ lệ cho một tổng thể
5.5 Ước lượng phương sai tổng thể
5.6 Xác định cỡ mẫu cho bài toán ước lượng
5.7 Ước lượng trên hai mẫu (Bài giảng video)
3
EM3230 Thống kê ứng dụng
Mục tiêu của chương
Sau khi học xong chương này người học có thể:
§ Nắm được những vấn đề cơ bản về phân phối của hai đại lượng chính của mẫu là trung bình
mẫu và tỷ lệ mẫu
§ Hiểu ý nghĩa của hệ số hiệu chỉnh tổng thể hữu hạn trong việc điều chỉnh độ lệch chuẩn của
trung bình mẫu và tỷ lệ mẫu
§ Nắm được các khái niệm: Khoảng tin cậy, độ tin cậy, mức ý nghĩa alpha, và mối liên hệ giữa
tham số mẫu và tham số tổng thể
§ Biết cách xác định ước lượng khoảng và kiểm định cho trung bình
§ Hiểu phân phối Student và biết cách tra bảng xác suất phân phối student
§ Biết cách xác định cỡ mẫu khi cần hạn chế sai số do lấy mẫu
§ Biết cách xác định ước lượng khoảng và kiểm định đối với các chênh lệch trung bình và tỷ lệ
của hai tổng thể
4
EM3230 Thống kê ứng dụng
5.1 Phân phối của tham số mẫu
5.1.1 Giới thiệu chung về phân phối của tham số mẫu
5.1.2 Phân phối của trung bình mẫu
5.1.3 Phân phối của tỷ lệ mẫu
5
EM3230 Thống kê ứng dụng
5.1.1 Giới thiệu chung về phân phối của tham số mẫu
§ Lẫy mẫu ngẫu nhiên từ tổng thể. Có nhiều cách lấy mẫu khác nhau
§ Tham số thống kê tính được từ các mẫu cũng sẽ là biến số ngẫu nhiên
Trung bình mẫu/ tỷ lệ mẫu tuân theo quy luật phân phối nào?
Tổng thể có phân phối chuẩn/ nhị thức
6
EM3230 Thống kê ứng dụng
5.1.1 Giới thiệu chung về phân phối của tham số mẫu
§ Phân phối của tham số mẫu là phân phối xác suất của các giá trị có thể có của tham số
mẫu (trung bình, phương sai) khi nó được tính toán từ những mẫu ngẫu nhiên có cùng
kích thước mẫu được lấy ra từ tổng thể nhất định
§ Từ tổng thể X ta lấy ra 1 mẫu ngẫu nhiên kích thước n.
§ Gọi !𝑋 là trung bình mẫu thì !𝑋 cũng là một biến ngẫu nhiên. Giá trị của nó thay đổi theo
cách chọn mẫu.
§ Quy luật phân phối của trung bình mẫu phụ thuộc vào quy luật phân phối của tổng thể
X và kích thước mẫu n.
7
EM3230 Thống kê ứng dụng
5.1 Phân phối của trung bình mẫu
Giá trị trung bình của tất cả trung bình mẫu cùng kích thước lấy ra từ một tổng thể bằng đúng giá
trị trung bình tổng thể, được coi là ước lượng không chệch của trung bình tổng thể.
Độ lệch chuẩn của trung bình mẫu: Do tổng thể bao gồm các giá trị cá biệt nên độ biến thiên rất
rộng, trong khi đó, các giá trị trung bình mẫu đã tính bù trừ nên ít dao động hơn so với giá trị
trung bình của trung bình mẫu, khi cỡ mẫu càng lớn, sự bù trừ càng tăng, do đó, độ lệch chuẩn
của trung bình mẫu càng nhỏ.
à Cần Hệ số hiệu chỉnh tổng thể hữu hạn (Finite Population Correction Factor)
8
EM3230 Thống kê ứng dụng
5.1 Phân phối của trung bình mẫu
Hệ số hiệu chỉnh tổng thể hữu hạn - FPC
# $
𝑵"𝒏
v Khi n/N=<0.05 𝜎 !" =
𝜎 !" =
𝑵"𝟏
∗ 𝑵"𝒏 𝑵"𝟏
# $
v Khi n/N > 0.05 𝑭𝑷𝑪 =
9
EM3230 Thống kê ứng dụng
5.1 Phân phối của trung bình mẫu
X~ N(µ; 𝛔2) : (X~ N(µ; 𝛔2/n)
X~ N(µ; 𝛔2) : Áp dụng định lý giới hạn trung tâm
(CLT- Center Limit Theory)
Định lý giới hạn trung tâm
Khi kích thước mẫu n đủ lớn, phân phối của trung bình mẫu sẽ có dạng xấp xỉ
chuẩn bất kể quy luật phân phối của tổng thể X như thế nào.
10
EM3230 Thống kê ứng dụng
CLT
§ Định lý giới hạn trung tâm
11
EM3230 Thống kê ứng dụng
5.1 Phân phối của trung bình mẫu
Hệ quả của định lý giới hạn trung tâm
Ø Với kích thước mẫu n đủ lớn (≥30) thì trung bình mẫu sẽ phân phối chuẩn bất
kể quy luật phân phối XS của tổng thể như thế nào
Ø Nếu phân phối tổng thể là tương đối đối xứng thì phân phối của trung bình mẫu
sẽ có dạng phân phối xấp xỉ chuẩn với kích thước mẫu ≥5
Ø Nếu phân phối của tổng thể phân phối chuẩn thì trung bình mẫu sẽ phân phối
chuẩn với bất kỳ kích thước mẫu nào
12
EM3230 Thống kê ứng dụng
5.1 Phân phối của trung bình mẫu
Ví dụ:
Gọi X là thời gian ngừng máy trong 1 ca sản xuất.
X tuân theo quy luật phân phối chuẩn với trung bình là 12 phút, độ lệch chuẩn 2 phút.
Điều tra ngẫu nhiên 36 ca làm việc. Tính xác suất để thời gian ngừng máy trung bình
X~ N(µ; 𝛔2) : %X~ N(µ; 𝛔2/n)
P X (
11)
P Z (
)
3) 1
F
(3) 1 0,9986
<
=
<
=
( P Z <-=- =-
11 12 - 2 / 36
của 36 ca nhỏ hơn 11 phút.
13
EM3230 Thống kê ứng dụng
5.2 Phân phối của tỷ lệ mẫu
§ Giả sử tổng thể có kích thước N trong đó có M đơn vị mang dấu hiệu A mà
chúng ta quan tâm. Gọi p là tỷ lệ tổng thể :
p =
M N
§
Lấy ngẫu nhiên một mẫu kích thước n từ tổng thể trên, trong đó có X đơn vị
mang dấu hiệu A. Gọi px là tỷ lệ mẫu
p
=
x
X n
§
px là một biến ngẫu nhiên, nhận các giá trị khác nhau với các mẫu cùng kích
thước n lấy ra từ tổng thể nhất định.
14
EM3230 Thống kê ứng dụng
5.2 Phân phối của tỷ lệ mẫu
§
Phân phối của tỷ lệ mẫu px có thể được gọi là phân phối của tỷ lệ mẫu khi lấy mẫu có hòan trả thì phân phối của tỷ lệ mẫu có dạng nhị thức với 𝞵=np và 𝛔2=np(1-p)
§ Tuy nhiên có thể sử dụng phân phối xấp xỉ chuẩn khi cỡ mẫu n≥30 và np &nq ≥5.
Với X là số lượt thực hiện thành công phép thử, thì ta có thể vận dụng phân phối
p
X
µ
Z
=
=
=
=
X np - (1 p np
)
/ np
/ ) /
(1
p
xp p
- (1
p
)
-
X n np n - n -
- d 𝜎
- n
chuẩn hóa:
§
px~ N(p;p(1-p)/n)
15
EM3230 Thống kê ứng dụng
5.2 Phân phối của tỷ lệ mẫu
Ví dụ: Điều tra một mẫu ngẫu nhiên gồm 50 hộ gia đình về tình hình tham gia bảo hiểm phi
nhân thọ. Câu hỏi điều tra là bạn hay bất kỳ thành viên nào khác trong gia đình bạn có
tham gia đóng bảo hiểm phi nhân thọ hay không.
Tính xác suất để tỷ lệ trả lời có là 40%. Biết tỷ lệ tổng thể là 0,3.
Gọi p là tỷ lệ hộ gia đình có thành viên tham gia bảo hiểm của tổng thể p=0,3
Ta có n =50 là đủ lớn nên tỷ lệ mẫu px~ N(p;p(1-p)/n)
)4,0
ZP (
)
ZP (
1182
,0
3818
>
=
>
=
>
5,0)56,1 =
-
j
,05,0)56,1( =
-
=
pP x (
3,04,0 - 064,0
px~ N(0,3;0,0042) , µ = 0,3 ; 𝛔= 0.0042=0,064
16
EM3230 Thống kê ứng dụng
5.2 Phân phối của tỷ lệ mẫu
Hệ số hiệu chỉnh tổng thể hữu hạn – FPC cho sai số chuẩn của tỷ lệ mẫu
Khi n/N=<0.05
𝝈𝒑𝒙 =
𝒑(𝟏 − 𝒑) 𝒏
.
𝝈𝒑𝒙 =
Khi n/N > 0.05 𝑭𝑷𝑪 =
𝒑(𝟏 − 𝒑) 𝒏
𝑵 − 𝒏 𝑵 − 𝟏
𝑵&𝒏 𝑵&𝟏
17
EM3230 Thống kê ứng dụng
Nội dung chính
5.1 Phân phối của các tham số mẫu (Bài giảng video)
5.2 Lý thuyết về ước lượng và kiểm định
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)
5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
18
EM3230 Thống kê ứng dụng
5.2 Lý thuyết về ước lượng và kiểm định
5.2.1. Lý thuyết về ước lượng
5.2.2. Lý thuyết về kiểm định
19
EM3230 Thống kê ứng dụng
5.2.1 Lý thuyết về ước lượng
§
Trên thực tế, rất khó để biết toàn bộ thông tin về tổng thể mà phải dựa vào điều tra chọn mẫu,
§
Thống kê suy diễn là việc sử dụng các thông tin trên mẫu để rút ra kết luận về các đặc điểm của
tổng thể.
§ Ước lượng là một công cụ của thống kê suy diễn.
§ Ước lượng thống kê là việc xác định các tham số của tổng thể từ các tham số mẫu.
§ Có 2 loại ước lượng:
§ Ước lượng điểm (Point estimation) và
§ Ước lượng khoảng (Confidence interval)
20
EM3230 Thống kê ứng dụng
5.2.1 Lý thuyết về ước lượng
Mẫu ngẫu nhiên
Tổng thể
Trung bình tổng thể nằm trong khoảng (45;55) với độ tin cậy 95%
Trung bình mẫu
Trung bình µ chưa biết
Ước lượng điểm của trung bình tổng thể bằng 50
50X =
Mẫu
© 1984-1994 T/Maker Co.
21
EM3230 Thống kê ứng dụng
5.2.1 Lý thuyết về ước lượng
§ Ước lượng điểm
Ước lượng tham số của tổng thể Giá trị thống kê mẫu
Trung bình
x
Tỷ lệ
xp
Phương sai
2s
Sự khác biệt
x 1
x- 2
µ p 2s 2µ µ-
1
22
EM3230 Thống kê ứng dụng
5.2.1 Lý thuyết về ước lượng
§ Ước lượng khoảng
v Là quá trình xác định 1 khoảng các giá trị mà tham số của tổng thể sẽ rơi vào trong khoảng đó
với một độ tin cậy nhất định.
v Khoảng tin cậy là khoảng các giá trị mà 1 tham số tổng thể rơi vào trong khoảng đó với 1 độ tin
cậy nhất định.
v Độ tin cậy là xác suất để tham số chưa biết của tổng thể rơi vào khoảng tin cậy
v Các giá trị L (lower limit/ bound) và U (Upper limit/ bound) được gọi là giới hạn dưới (cận dưới)
+ Sai số
- Sai số
và giới hạn trên (cận trên) của ước lượng
Ước lượng điểm
(U) Cận trên của khoảng tin cậy
(L) Cận dưới của khoảng tin cậy
Độ rộng/ Bề rộng của khoảng tin cậy
23
EM3230 Thống kê ứng dụng
5.2.1 Lý thuyết về ước lượng
§ Ước lượng khoảng: Một số thuật ngữ
v Độ tin cậy (Confidence level): được ký hiệu dưới dạng xác suất 1-a hoặc dạng % là 100(1- a)%.
v Giá trị tới hạn (Critical value), nếu Z là một biến phân phối chuẩn hóa thì ta có hai giá trị tới hạn
là Z a /2 và -Z a /2 tuân theo định nghĩa
f(Z)
P(-Za /2
1-a
a
Độ tin cậy
|Za/2|
80%
0,2
1,28
85%
0,15
1,44
90%
0,1
1,645
0.5
0.5
a/2
a/2
95%
0,05
1,96
98%
0,02
2,33
Z
0
-Za/2
Za/2
99%
0,01
2,58
24
EM3230 Thống kê ứng dụng
5.2.2 Lý thuyết về kiểm định
1) Đặt giả thuyết về tham số tổng thể
2) Một số nguyên tắc liên quan đến việc đặt giả thuyết
3) Logic của bài toán kiểm định
4) Xác suất sai lầm loại I và loại II
5) Mức ý nghĩa của kiểm định – Significance level
6) Kiểm định một bên và hai bên
7) Giá trị tới hạn – Critical value
8) Cách tiếp cận p-value
25
EM3230 Thống kê ứng dụng
(1) Đặt giả thuyết về tham số tổng thể
Tôi cho rằng trọng lượng
TB của sản phẩm là nhỏ
§ Giả thuyết là một phát biểu, một nhận
hơn 455 g.
định, một đề xuất, một tuyên bố về tham
số của tổng thể
§
Kiểm định giả thuyết là kiểm tra tính hợp
lý của một tuyên bố về tổng thể.
§ Đặt giả thuyết là bước đầu tiên trong thủ
tục kiểm định
§
H0: µ≥455
H1: µ< 455
Luôn phải có 1 cặp giả thuyết H0 (giả
thuyết không- Null Hypothesis) và H1
(giả thuyết đối – Alternative Hypothesis)
§ Hai quyết định/ kết quả của kiểm định:
Bác bỏ H0 hoặc KHÔNG bác bỏ H0
26
EM3230 Thống kê ứng dụng
(2) Nguyên tắc đặt giả thuyết
Giả thuyết H0: Giả thuyết H1
• thường mô tả trạng thái ban đầu • mô tả trạng thái đối ngược của giả thiết H0
của hiện tượng
• không có dấu bằng, có liên hệ, thể hiện
• Luôn phải có dấu bằng, không có
nghi vấn của người nghiên cứu
≠ , >, <
liên hệ
=, ≤ , ≥
• không có dữ liệu chứng minh
• đòi hỏi dữ liệu,bằng chứng để chứng minh
(Để chứng minh H1 đúng thì nhà nghiên
cứu phải thu thập dữ liệu để bác bỏ H0)
27
EM3230 Thống kê ứng dụng
(2) Nguyên tắc đặt giả thuyết
§ Nếu bác bỏ H0 thì có bằng chứng thống kê rằng giả thuyết đối H1 là đúng
§ Nếu không có bằng chứng bác bỏ H0 tức là thất bại trong việc chứng minh H1 là đúng,
§ Tuy nhiên thất bại trong việc chứng minh H1 là đúng không có nghĩa là H0 đúng.
28
EM3230 Thống kê ứng dụng
(3) Logic của bài toán kiểm định
§ Khối lượng quy định là 455g
§ Trung bình mẫu lấy ra kiểm tra đạt 454.99g, hoặc 430g.
Sự khác biệt quá lớn hoặc quá nhỏ: Không cần kiểm định
§ Trung bình mẫu đạt 453.2 g, chưa đủ rõ ràng để ra quyết định à CẦN KIỂM ĐỊNH
bằng cách:
§ Tính toán giá trị kiểm định thống kê căn cứ vào số liệu mẫu
§ Sử dụng phân phối của giá trị kiểm định để quyết định giá trị kiểm định này có cho
phép bác bỏ H0 hay không?
30
EM3230 Thống kê ứng dụng
(4) Xác suất sai lầm loại I và loại II
Sai số do điều tra/ sai số ngẫu nhiên à 2 loại sai lầm.
H0 đúng
H0 sai
Bác bỏ
Sai lầm loại I (a)
Chấp nhận
Sai lầm loại II (b)
§ Giá trị a cho phép xác định diện tích vùng bác bỏ H0
§ Nếu giá trị kiểm định tính toán được từ các thông tin của mẫu rơi vào vùng này thì ta sẽ quyết
định bác bỏ H0.
§ Khi a tăng, khả năng bác bỏ H0 giảm nên khả năng phạm sai lầm loại I nhỏ đi nhưng khả năng
mắc sai lầm loại II tăng lên (trong trường hợp cỡ mẫu không đổi)
31
EM3230 Thống kê ứng dụng
(5) Mức ý nghĩa của kiểm định – Significance level
§ Alpha- a: giá trị xác suất phạm sai lầm loại I: cần ấn định trước khi tiến hành kiểm định
§
a phụ thuộc vào mức độ tổn thất người làm kiểm định có thể “chịu đựng” nếu sai lầm loại I xảy
ra
§
a .100% khả năng phạm phải lỗi đã bác bỏ H0 khi thực tế nó đúng.
§
a - mức ý nghĩa của kiểm định
§
Ta tin rằng (1-a) .100% là ta đã quyết định đúng (Độ tin cậy)
33
EM3230 Thống kê ứng dụng
(6) Kiểm định một bên và hai bên
§ Kiểm định 2 bên là loại kiểm định được sử dụng để xác định xem liệu tham số tổng thể khác biệt
(¹) một cách đáng kể so với giá trị giả thuyết hay không. KĐ 2 bên có 2 miền bác bỏ nằm ở 2
bên của của phân phối.
H0:µ = µ0
H1: µ ≠ µ0
34
EM3230 Thống kê ứng dụng
(7) Kiểm định một bên và hai bên
Kiểm định 1 bên
§
KĐ bên trái: KĐ xem liệu tham số của tổng thể có nhỏ hơn một cách đáng kể so với giá trị giả
thuyết không?
§
KĐ bên phải: KĐ xem liệu tham số của tổng thể có lớn hơn một cách đáng kể so với giá trị giả
thuyết không?
H0:µ ³ µ0
H1: µ < µ0
H0:µ £ µ0
H1: µ > µ0
35
EM3230 Thống kê ứng dụng
(8) Giá trị tới hạn – Critical value
§ Giá trị a giúp xác định vùng diện tích bác bỏ H0, và vùng chấp nhận H0.
§ Giá trị tới hạn chính là biên giới giữa hai vùng chấp nhận và bác bỏ H0
Vùng chưa
đủ bằng
chứng bác
bỏ H0
Bác bỏ
Giá trị tới hạn
Vùng chưa
đủ bằng
chứng bác
bỏ H0
Bác bỏ
Bác bỏ
Giá trị
tới hạn
Giá trị
tới hạn
Vùng chưa
đủ bằng
chứng bác
bỏ H0
Bác bỏ
Giá trị tới hạn
36
EM3230 Thống kê ứng dụng
(9) Cách tiếp cận p-value
§ p-value: Xác suất tới hạn. Xác suất để tìm ra 1 quan sát mà từ đó thấy được H0 là đúng,
§
§
p - value < a (mức rủi ro có thể chấp nhận được): có cơ sở để bác bỏ H0
p - value ³ a (mức rủi ro có thể chấp nhận được): xác suất “quyết định bác bỏ H0 là
quyết định SAI LẦM” rất cao, chưa có cơ sở để bác bỏ H0
§ Cách tính xác suất tới hạn
Kiểm định hai bên: p - value = 2. P(z³|zstat|) =2.(1-F(z))
Kiểm định bên phải: p - value = P(z³ zstat)
Kiểm định bên trái: p - value = P(z £ zstat)
37
EM3230 Thống kê ứng dụng
(9) Cách tiếp cận p-value
38
EM3230 Thống kê ứng dụng
Nội dung chính
5.1 Phân phối của các tham số mẫu (Bài giảng video)
5.2 Lý thuyết về ước lượng và kiểm định
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)
5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
39
EM3230 Thống kê ứng dụng
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể
5.3.1. Ước lượng trên một tổng thể
5.3.1.1 Ước lượng trung bình một tổng thể
5.3.1.2 Ước lượng tỷ lệ một tổng thể
5.3.1.3 Ước lượng phương sai một tổng thể
5.3.2. Kiểm định trên một tổng thể
5.3.2.1 Kiểm định trung bình một tổng thể
5.3.2.2 Kiểm định tỷ lệ một tổng thể
5.3.2.3 Kiểm định phương sai một tổng thể
40
EM3230 Thống kê ứng dụng
Phân loại các bài toán kiểm định tham số
Biết s
Chưa biết s, mẫu lớn
KĐ trung bình
Chưa biết s, mẫu nhỏ
KĐ trên 1 tổng thể
KĐ tỷ lệ
KĐ phương sai
Biết s
Chưa biết s, mẫu lớn
KĐ trung bình
ị
Chưa biết s, mẫu nhỏ
KĐ trên 2 tổng thể
KĐ tỷ lệ
i
KĐ phương sai
ố
s
m
a
h
t
h
n
đ
m
ể
K
ANOVA 1 yếu tố
KĐ trên k tổng thể (k³2)
ANOVA 2 yếu tố
41
EM3230 Thống kê ứng dụng
5.3.1. Ước lượng trên một tổng thể
5.3.1.1 Ước lượng trung bình một tổng thể
f(Z)
1-a
a) Trong trường hợp mẫu lớn (n≥30)
P(-Z
α/2
α
/2
a/2
a/2
0.
5
0.
5
Z
0
-Za/2
Za/2
P(-Z <
<
Z )=1-α
α/2
α
/
2
X-μ
𝜎/
δ
/ n
𝜎/
P(-Z *δ/ n
=1
)
-α
𝜎/
α
/2
α/2
𝜎/
P(-X-Z *δ/ n <-μ<-X+Z *δ
/ n )=1-
𝜎/
α
α/2
α
P(X-Z
*
<μ
)=1-α
α/2
α/2
𝜎
δ
n
/2
𝜎
δ
n
Sai số (biên)
Sai số (biên)- Margin of error
Ước lượng
điểm
42
EM3230 Thống kê ứng dụng
+ Sai số
- Sai số
5.3.1.1 Ước lượng trung bình tổng thể
Ước lượng điểm
(U) Cận trên của
khoảng tin cậy
(L) Cận dưới của
khoảng tin cậy
Độ rộng/ Bề rộng của
khoảng tin cậy
a) Trong trường hợp mẫu lớn (n≥30)
Tổng quát
Độ tin cậy 95%
Độ tin cậy 99%
Biết s
U,L =x±2,575
U,L =x±1,96
U,L =x±Z
μ
α/2
μ
μ
σ
n
σ
n
σ
n
Chưa biết s
n-1
n-1
n-1
U,L =x±t
μ
α/2
U,L =x±t
μ
U,L =x±t
μ
0,025
0,005
s
n
s
n
s
n
.
’
$
≈ ̅𝑥 ± 𝑍!
"
44
EM3230 Thống kê ứng dụng
5.3.1.1 Ước lượng trung bình tổng thể
b) Trong trường hợp mẫu nhỏ (n<30)
Tổng quát
Độ tin cậy 95%
Độ tin cậy 99%
U,L =x±2,575
U,L =x±1,96
μ
Biết s
U,L =x±Z
μ
α/2
μ
σ
n
σ
n
σ
n
n-1
n-1
n-1
Chưa biết s
U,L =x±t
μ
U,L =x±t
μ
U,L =x±t
μ
α/2
0,025
0,005
s
n
s
n
s
n
45
EM3230 Thống kê ứng dụng
5.3.1.1 Ước lượng trung bình tổng thể
Ví dụ 1 (mẫu lớn):
Trong một nghiên cứu về năng suất canh tác một sản phẩm nông nghiệp với
cỡ mẫu n=36, có trung bình =50 và độ lệch chuẩn là 8 tạ/ha. Ước lượng
khoảng tin cậy trung bình tổng thể với độ tin cậy 95%.
t
50
,2
0301
50
,2
7068
µ
x
±=
=
±
=
±
n
025
,0,1
-
s
n
8
36
,47
2932
,52
7068
££ µ
Như vậy chúng ta tin cậy 95% rằng trung bình tổng thể nằm trong khoảng từ
47,2932 tạ/ha đến 52,7068 tạ/ha.
46
EM3230 Thống kê ứng dụng
5.3.1.1 Ước lượng trung bình tổng thể
Ví dụ 2 (mẫu nhỏ)
Kiểm tra trọng lượng 25 sản phẩm của 1 lô hàng. Sau khi tập hợp dữ liệu mẫu này
ta có TB mẫu= 2,5kg và độ lệch chuẩn là s=0,061. Ước lượng trọng lượng trung
0, 061
2,5 0, 02087
2,5 1,711
±
=
±
U Lµ =
,
25
,2
49582
,2
5287
££ µ
bình của sản phẩm trong lô với độ tin cậy 90%.
Với độ tin cậy 90%, trọng lượng trung bình của sản phẩm trong lô hàng (tổng thể)
nằm trong khoảng từ 2,49582kg đến 2,5287kg.
47
EM3230 Thống kê ứng dụng
5.3.1. Ước lượng trên một tổng thể
5.3.1.2 Ước lượng tỷ lệ tổng thể
Điều kiện: Cỡ mẫu lớn
§ np >=5 và n(1-p) >=5
§ hoặc npx>=5 và n(1-px)>=5 (khi không biết p)
p
)
p
p
)
p
x
x
x
x
p
Z
p
Z
-
p
<<
+
x
x
2/
2/
a
a
1(
-
n
1(
-
n
p là tỷ lệ tổng thể, px là tỷ lệ mẫu
48
EM3230 Thống kê ứng dụng
5.3.1.2 Ước lượng tỷ lệ tổng thể
Ví dụ:
Chọn một mẫu ngẫu nhiên 100 người và thấy 25% số người này thuận tay trái trong
25,0
96,1
25,0
96,1
-
p
<<
+
)25,01(25,0
-
100
)25,01(25,0
-
100
,0
1651
,0
3349
<< p
ăn uống, ước lượng tỷ lệ người thuận tay trái cho tổng thể với độ tin cậy 95%.
Như vậy chúng ta tin cậy 95% rằng tỷ lệ những người thuận tay trái trong ăn uống
là từ 16,51 đến 33,49 %.
49
EM3230 Thống kê ứng dụng
5.3.1.3 Ước lượng phương sai tổng thể
Giả định:
Tổng thể có phân phối chuẩn
2
2
n
s
s
Khoảng tin cậy (1-a)100% của phương sai tổng thể.
(
)
1
)
1
<
2
s
<
1,
/ 2
/ 2
-
2
c
n
-
a
(
n
-
2
c
n
1,1
- -
a
50
EM3230 Thống kê ứng dụng
5.3.2. Kiểm định trên một tổng thể
5.3.2.1. KĐGT về trung bình tổng thể
5.3.2.2. KĐGT về tỷ lệ tổng thể
=
=
Z stat
tstat
µ0-
n
x
s
0µ-
n
x
s
0µ-
n
x
Z stat s
=
2
(
n
s
=
2
c
n
Z
=
stat
stat
(1
) /
n
-
)1
-
2
s
0
p p
-
0
p
0
p
0
5.3.2.3. KĐGT về phương sai tổng thể
51
EM3230 Thống kê ứng dụng
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Các bước kiểm định
Bước 1: Lặp cặp giả thuyết và nhận diện bài toán KĐ hai bên, bên trái hay bên phải
Bước 2: Lựa chọn mức ý nghĩa a
Bước 3: Tính đại lượng kiểm định (giá trị thống kê) của chỉ tiêu kiểm định: zstat, tstat, zqs, tqs,
hoặc ztt, ttt
Bước 4:
§ Cách 1: (giá trị tới hạn): Xác định miền bác bỏ và miền chấp nhận thông qua các giá trị
tới hạn za, za/2, ta, ta/2…
§ Cách 2: (xác suất tới hạn): Từ giá trị thống kê tính toán được của chỉ tiêu kiểm định,
tính p-value
Bước 5: So sánh giá trị thống kê với miền bác bỏ hoặc p-value với a để rút ra kết luận
52
EM3230 Thống kê ứng dụng
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Trường hợp biết phương sai tổng thể
KĐ 2 phía KĐ bên trái KĐ bên phải
Cặp giả thuyết H0:µ=µ0
H1: µ≠µ0 H0:µ³µ0
H1: µ<µ0 H0:µ£µ0
H1: µ>µ0
µ0-
n
x
Z stat s
=
Đại lượng kiểm
định
Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2
53
EM3230 Thống kê ứng dụng
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Trường hợp KHÔNG biết phương sai tổng thể, mẫu lớn
MẪU LỚN KĐ 2 phía KĐ bên trái KĐ bên phải
=
Z stat
Cặp giả thuyết H0:µ=µ0
H1: µ≠µ0 H0:µ³µ0
H1: µ<µ0 H0:µ£µ0
H1: µ>µ0
x
s
0µ-
n
Đại lượng
kiểm định
Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2
54
EM3230 Thống kê ứng dụng
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Trường hợp KHÔNG biết phương sai tổng thể, mẫu nhỏ
MẪU NHỎ KĐ 2 phía KĐ bên trái KĐ bên phải
=
tstat
Cặp giả thuyết H0:µ=µ0
H1: µ≠µ0 H0:µ³µ0
H1: µ<µ0 H0:µ£µ0
H1: µ>µ0
x
s
0µ-
n
Đại lượng
kiểm định
Miền bác bỏ t<- tn-1,a t> tn-1,a t> tn-1,a/2 hoặc
t<- tn-1,a/2
55
EM3230 Thống kê ứng dụng
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Ví dụ
Một ông ty công bố trọng lượng trung bình của một sản phẩm mà mình phân phối trên thị trường là
368 g? Công ty cũng ấn định s=15 g.
Chọn một mẫu 25 hộp, cho thấy !𝑿 =363.5.
Kiểm định xem liệu trọng lượng trung bình của sản phẩm có khác trọng lượng đã công bố với mức ý
nghĩa =0,05
Cặp giả thuyết
H0: µ= 368
H1: µ¹ 368
Xác định dạng bài toán:
- Bài toán biết phương sai tổng thể
368 g.
56
EM3230 Thống kê ứng dụng
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Đại lượng kiểm định:
5,1
=Z
-=
5.363
15
368
-
25
Quyết định:
H0: µ = 368
H1: µ ¹ 368
a= 0.05 à Za/2 = 1.96
n = 25
Miền bác bỏ:
Z£-1.96 hoặc Z³ 1.96
Không có bằng chứng bác bỏ H0 với a=5%
Bác bỏ
Bác bỏ
0.025
0.025
Z
-1.96
1.96
0
Kết luận: Với mức ý nghĩa 5%, không có bằng
chứng chứng tỏ trọng lượng trung bình của sản
phẩm khác 368 g
-1.50
57
EM3230 Thống kê ứng dụng
5.3.2.2. KĐGT về tỷ lệ tổng thể
Kiểm tra điều kiện mẫu đủ lớn
§ np ³5 và np(1-p) ³5
KĐ 2 phía KĐ bên trái KĐ bên phải
H0: p = p0
H1: p ≠ p0
H0: p ³ p0
H1: p < p0
H0: p £ p0
H1: p > p0
Z
=
stat
Cặp giả thuyết
(1
) /
n
-
p p
-
0
p
0
p
0
Đại lượng
kiểm định
Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2
58
EM3230 Thống kê ứng dụng
5.3.2.2. KĐGT về tỷ lệ tổng thể
Ví dụ
Một công ty nghiên cứu marketing tuyên bố tỷ lệ trả lời trong các cuộc điều tra là
4%. Một mẫu khảo sát 500 khách hàng, kết quả là 25 khách hàng trả lời. Hãy kiểm
định về tỷ lệ tổng thể với a= 0.05, xem tuyên bố có hợp lý không?
59
EM3230 Thống kê ứng dụng
5.3.2.2. KĐGT về tỷ lệ tổng thể
§ Cặp giả thuyết cần kiểm định
§ H0: p = 0.04
§ H1: p # 0.04
p
-
§ Mức ý nghĩa: 𝞪 = 0.05,
1.1411
@=
=
Z
stat
p
)
)
§
n = 500: Đáp ứng điều kiện mẫu đủ lớn.
Sp
(
1
p
-
n
0.05 0.04
-
(
0.04 1 0.04
-
500
Sử dụng đại lượng kiểm định Z
§ Giá trị tới hạn ± 1.96. Miền bác bỏ: Z<-1.96 hoặc Z> 1.96.
§
Zstat không thuộc miền bác bỏ à Không có bằng chứng bác bỏ H0 với a= 0.05.
§ Kết luận: Với mức ý nghĩa 5%, không có đủ bằng chứng bác bỏ H0 rằng tỷ lệ phản hồi từ
các cuộc điều tra là 4%.
60
EM3230 Thống kê ứng dụng
5.3.2.3. KĐGT về phương sai tổng thể
KĐ 2 phía KĐ bên trái KĐ bên phải TH Mẫu lớn
n≥30,biết s
2
2
2
2
(
n
s
=
2
c
n
stat
Cặp giả thuyết H0:s2=s0
2
H1: s2≠s0 H0:s2=s0
2
H1: s2s0
)1
-
2
s
0
ñ
2
n
,1
2/
2
acc -
n
Đại lượng kiểm
định
ñ
2
n
,1
2
acc -
n
2
n
2
< n
acc
1(;1
)
-
-
2
n
2
--<
acc
n
,1
2/
Miền bác bỏ
61
EM3230 Thống kê ứng dụng
Phân phối Chi-square
62
EM3230 Thống kê ứng dụng
Phân phối Chi-square
63
EM3230 Thống kê ứng dụng
5.3.2 Kiểm định giả thuyết trên một tổng thể
5.3.2.1 KĐGT về trung bình tổng thể
5.3.2.2 KĐGT về tỷ lệ tổng thể
Biết 𝜎
5.3.2.3 KĐGT về phương sai tổng thể
H0: µ = µ0
H1: µ ≠ µ0
Z
=
stat
H0: p = p0
H1: p ≠ p0
H0: p £ p0
H1: p > p0
(1
) /
n
-
p p
-
0
p
0
p
0
Chưa biết 𝜎, mẫu lớn
Z stat
Z stat
H0:µ ³ µ0
H1: µ < µ0
2
(
n
s
0
=
2
c
n
tstat
tstat
0
H0:µ £ µ0
H1: µ > µ0
stat
H0: s2 = s2
H1: s2 ≠ s2
0
H0: s2 £ s2
0
Chưa biết 𝜎, mẫu nhỏ
H1: s2 > s2
0
)1
-
2
s
0
x
µ0-
x
µ0-
Z stat s
=
Z stat s
=
n
n
H0: p ³ p0
x
0µ-
x
0µ-
H1: p < p0
=
=
n
s
s
n
x
0µ-
x
0µ-
H0: s2 ³ s2
=
=
0
H1: s2 < s2
n
s
s
n
64
EM3230 Thống kê ứng dụng
Nội dung chính
5.1 Phân phối của các tham số mẫu (Bài giảng video)
5.2 Lý thuyết về ước lượng và kiểm định
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)
5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
65
EM3230 Thống kê ứng dụng
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể
5.4.1. Ước lượng chênh lệch của 2 tổng thể
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
5.4.1.2 Ước lượng chênh lệch tỷ lệ của 2 tổng thể
5.4.2. Kiểm định trên hai tổng thể
5.4.2.1. Kiểm định chênh lệch trung bình của 2 tổng thể
5.4.2.2. Kiểm định chênh lệch tỷ lệ của 2 tổng thể
66
EM3230 Thống kê ứng dụng
5.4.1. Ước lượng chênh lệch trên hai tổng thể
Biết phương sai
2 tổng thể
Lấy mẫu độc lập
Mẫu lớn
n1 ³30
và n2 ³30
Không biết
phương sai 2
tổng thể
Giả định Phương
sai 2 tổng thể
bằng nhau
Ước lượng
chênh lệch
Trung bình
của 2 tổng thể
Lấy mẫu cặp
Mẫu nhỏ
n1 £30
và/ hoặc n2 £30
Giả định Phương
sai 2 tổng thể
không bằng nhau
Ước lượng
chênh lệch
TỶ LỆ
của 2 tổng thể
67
EM3230 Thống kê ứng dụng
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
(1) Trường hợp lấy mẫu độc lập
2
2
2
U,L
=x -x
1
z
+
±
α/2
μ -μ
1
2
2
σ
1
n
σ
n
1
2
(a) Biết phương sai của hai tổng thể
68
EM3230 Thống kê ứng dụng
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
(1) Trường hợp lấy mẫu độc lập
(b1) Không biết phương sai của hai tổng thể, MẪU LỚN
2
Áp dụng định lý giới hạn trung tâm
U,L
=x -x
1
z
+
±
α/2
μ -μ
1
2
2
S
1
n
2
S
2
n
1
2
69
EM3230 Thống kê ứng dụng
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
(1) Trường hợp lấy mẫu độc lập
(b2) Không biết phương sai của hai tổng thể, MẪU NHỎ
2
U,L
=x -
1
x
df
t *S
+
±
-μ
p
μ
1
2
α/2
1
n
1
n
1
2
2
(n -1)S +(n -1
1
1
2
)S
2
=
S
p
2
n +n -2
2
df
n
=
1
1
+n -2
2
(b2.1) Giả định hai tổng thể có phương sai bằng nhau
70
EM3230 Thống kê ứng dụng
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
(1) Trường hợp lấy mẫu độc lập
(b2) Không biết phương sai của hai tổng thể, MẪU NHỎ
2
S
2
S
1
2
2
U,
L
=x -x
1
t *
+
± df
μ -μ
1
2
α 2
/
n
n
1
2
2
2
S
2
S
1
2
+
n
n
1
2
df
=
2
2
æ
ç
ç
è
2
S
ö
÷
÷
ø
2
S
1
2
n
n
+
ö
÷
÷
ø
1
1
-
ö
÷
÷
ø
2
1
-
æ
ç
ç
è
n
1
æ
ç
ç
è
n
2
(b2.2) Giả định hai tổng thể có phương sai KHÔNG bằng nhau
71
EM3230 Thống kê ứng dụng
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
(2) Trường hợp lấy mẫu cặp
Dấu hiệu nhận diện mẫu cặp:
- 2 mẫu có cỡ mẫu giống nhau
- Có đặc điểm tương đồng trừ đặc điểm đang được quan tâm nghiên cứu, tức là các
yếu tố ngoại lai được kiểm soát
$
∑()*
𝑆𝑑 =
= &𝒅 ± 𝒕𝜶/𝟐
U,Lµd
𝒏&𝟏.𝑺𝒅
𝒏
𝑑( − ̅𝑑 2
𝑛 − 1
Tạo biến chênh lệch d= x1-x2 ; di=x1i-x2i
72
EM3230 Thống kê ứng dụng
5.4.1.2 Ước lượng tỷ lệ của 2 tổng thể
Kiểm tra điều kiện cỡ mẫu lớn
n1.𝒑𝟏³𝟓; 𝒏𝟏. (𝟏 − 𝒑𝟏) ³5
n2.𝒑𝟐³𝟓; 𝒏𝟐. (𝟏 − 𝒑𝟐) ³5
+
p1-p2=(𝒑𝟏 − 𝒑𝟐) ±za/2 .
-)(/&-))
$)
𝒑𝟐(𝟏&𝒑𝟐)
𝒏𝟐
Ước lượng khoảng của chênh lệch giữa 2 tỷ lệ của hai tổng thể
73
EM3230 Thống kê ứng dụng
5.4.2 Kiểm định giả thuyết trên hai tổng thể
Biết phương sai
2 tổng thể
Lấy mẫu độc lập
Mẫu lớn
n1 ³30
và n2 ³30
Không biết
phương sai 2
tổng thể
Giả định Phương
sai 2 tổng thể
bằng nhau
Kiểm định
chênh lệch
Trung bình của
2 tổng thể
Lấy mẫu cặp
Mẫu nhỏ
n1 £30
và/ hoặc n2 £30
Giả định Phương
sai 2 tổng thể
không bằng nhau
Kiểm định
chênh lệch
TỶ LỆ
của 2 tổng thể
74
EM3230 Thống kê ứng dụng
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(1) Hai mẫu độc lập, BIẾT PHƯƠNG SAI
KĐ 2 phía KĐ bên trái KĐ bên phải
-
-
0
=
Z stat
Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0
x
x
d
1
2
2
2
ss
1
2
+
n
n
1
2
Đại lượng kiểm
định
Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2
75
EM3230 Thống kê ứng dụng
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(2) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu lớn
KĐ 2 phía KĐ bên trái KĐ bên phải
-
-
x
1
2
0
=
Z stat
Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0
+
x
2
s
1
n
1
d
2
s
2
n
2
Đại lượng kiểm
định
Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2
76
EM3230 Thống kê ứng dụng
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(3) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu nhỏ
§ Trường hợp 1: Giả định được phương sai 2 tổng thể bằng nhau
KĐ 2 phía KĐ bên trái KĐ bên phải
-
-
x
1
t
=
(
s
stat
2
2
2
s
=
p
Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0
s
+
n
1
(
(
(
)1
)1
2
s
)1
+
1
)1
+-
-
-
p
-
n
1
n
2
n
2
x
2
1
n
1
d
0
1
n
2
Đại lượng kiểm
định
Miền bác bỏ t<- tn1+n2-2;a t> tn1+n2-2;a t> tn1+n2-2;a/2 hoặc
t<- tn1+n2-2;a/2
77
EM3230 Thống kê ứng dụng
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(3) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu nhỏ
§ Trường hợp 2: Không giả định được phương sai 2 tổng thể bằng nhau
KĐ 2 phía KĐ bên trái KĐ bên phải
2
-
-
+
x
1
2
0
=
2
s
1
n
1
2
s
2
n
2
t stat
df
=
2
2
Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0
+
+
x
2
s
1
n
1
d
2
s
2
n
2
æ
çç
è
2
ö
s
1
÷÷
n
ø
1
1
-
ö
÷÷
ø
2
ö
s
2
÷÷
n
ø
2
1
-
æ
çç
è
n
1
æ
çç
è
n
2
Đại lượng kiểm
định
Miền bác bỏ t<- tdf;a t> tdf;a t> tdf;a/2 hoặc
t<- tdf;a/2
78
EM3230 Thống kê ứng dụng
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(4) Mẫu cặp
§ Tạo biến chênh lệch d=x1-x2 với các giá trị của biến d là di=x1i-x2i
§ Đưa về bài toán kiểm định trung bình một tổng thể
§ Nếu mẫu lớn, chỉ tiêu kiểm định là z
§ Nếu mẫu nhỏ, chỉ tiêu kiểm định là t
$
∑23/
t
=
Z
=
stat
stat
𝑆𝑑 =
d
s
d
0-
n
𝑑𝑖 − ̅𝑑 2
𝑛 − 1
d
s
d
0-
n
d
d
§ Miền bác bỏ (xem lại phần 7.2)
Cặp giả thuyết H0: µd=d0
H1: µd ≠ d0 H0: µd ³d0
H1: µd < d0 H0: µd £ d0
H1: µd > d0
79
EM3230 Thống kê ứng dụng
5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể
§ Kiểm tra điều kiện mẫu đủ lớn
KĐ 2 phía KĐ bên trái KĐ bên phải
(
p
p
)
)
-
-
-
s
1
s
2
2
Z
=
stat
=
ps
p
1(
p
)(
)
-
+
s
s
2
)
+
+
X
1
(
n
1
X
n
2
Cặp giả thuyết H0: p1=p2
H1: p1≠p2 H0: p1≥p2
H1: p1p2
p
(
1
1
n
1
p
1
n
2
ps ước lượng chung cho tỷ lệ của 2 mẫu kết hợp
Đại lượng kiểm
định
Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2
80
EM3230 Thống kê ứng dụng
5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể
Ví dụ:
Một công ty vừa mới thực hiện một chương trình quảng cáo trên TV để khuếch trương cho một trong
các sản phẩm của họ.
i. Một mẫu ngẫu nhiên 240 người đã được lấy ra trước khi chương trình quảng cáo được thực
hiện, có 60 người đã từng sử dụng sản phẩm của công ty.
ii. Một mẫu ngẫu nhiên khác 360 người, được lấy ra sau khi chương trình quảng cáo được thực
hiện, có 117 người đã sử dụng sản phẩm đó của công ty.
Hãy kiểm định xem liệu có bằng chứng về sự tăng lên đáng kể số người sử dụng sản phẩm của
công ty, với mức ý nghĩa a=0.05
81
EM3230 Thống kê ứng dụng
5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể
1. Cặp giả thuyết cần kiểm định
H0: p1≥p2
H1: p1
2. Mức ý nghĩa: a=0,05
,0
295
=
=
=
ps
2
)
+
+
117
60
+
240
360
+
X
1
(
n
1
X
n
2
3. Đại lượng kiểm định
(
p
p
)
)
-
-
-
s
1
s
2
2
Z
97,1
=
=
-=
stat
-
295
/1)(
,0
/1
)360
25,0(
,01(295
-
0)325,0
-
240
+
p
1(
p
)(
)
-
+
s
s
p
(
1
1
n
1
p
1
n
2
4. a=0,05, Za= 1,645 àMiền bác bỏ là Z<-1.645; Zstat<- Za có cơ sơ bác bỏ H0
KL: Với mức ý nghĩa 5%, có thể kết luận tỷ lệ người sử dụng sản phẩm của công ty có tăng lên
sau chương trình quảng cáo
82
EM3230 Thống kê ứng dụng
5.4.2 Kiểm định giả thuyết trên hai tổng thể
-
-
-
-
0
x
1
2
0
=
=
Z stat
Z stat
+
x
x
d
1
2
2
2
ss
1
2
+
n
n
1
2
x
2
s
1
n
1
d
2
s
2
n
2
Biết phương sai
2 tổng thể
-
-
x
1
t
=
stat
s
+
p
x
2
1
n
1
d
0
1
n
2
Lấy mẫu độc lập
Mẫu lớn
n1 ³30
và n2 ³30
Không biết
phương sai 2
tổng thể
Giả định Phương
sai 2 tổng thể
bằng nhau
Kiểm định
chênh lệch
Trung bình của
2 tổng thể
Lấy mẫu cặp
Z
=
stat
Mẫu nhỏ
n1 £30
và/ hoặc n2 £30
d
s
d
0-
n
d
Giả định Phương
sai 2 tổng thể
không bằng nhau
t
=
stat
d
s
d
0-
n
d
(
p
p
)
)
-
-
-
s
1
s
2
2
-
-
Z
=
x
1
2
0
stat
=
Kiểm định
chênh lệch
TỶ LỆ
của 2 tổng thể
t stat
p
1(
p
)(
)
-
+
s
s
+
p
(
1
1
n
1
p
1
n
2
x
2
s
1
n
1
d
2
s
2
n
2
83
EM3230 Thống kê ứng dụng
Nội dung chính
5.1 Phân phối của các tham số mẫu (Bài giảng video)
5.2 Lý thuyết về ước lượng và kiểm định
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)
5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
87
EM3230 Thống kê ứng dụng
5.5.1 Xác định cỡ mẫu cho bài toán ước lượng
(1) Xác định cỡ mẫu khi ước lượng trung bình tổng thể
§ Sai số của ước lượng
𝒔
𝝈
𝜺 = 𝒁𝜶/𝟐
𝜺 = 𝒁𝜶/𝟐
𝒏
𝒏
§ Độ rộng của khoảng tin cậy: 2e
§ Công thức ước lượng n để sai số không vượt quá e
𝒏 = (
)2
𝒏 = (
𝒁𝜶/𝟐.𝒔
𝜺
)2
𝒁𝜶/𝟐.𝝈
𝜺
§ Kiểm tra điều kiện n/N
§ Nếu n/N £ 0.05: Không cần điều chỉnh
§ Nếu n/N ³ 0.05: Điều chỉnh n thành n*
n*=
n.N
n+(N-1)
88
EM3230 Thống kê ứng dụng
5.5.1 Xác định cỡ mẫu cho bài toán ước lượng
(2) Xác định cỡ mẫu khi ước lượng tỷ lệ tổng thể
§ Công thức ước lượng n để sai số không vượt quá e
§ Khi ước lượng được tỷ lệ của tổng thể p
𝟐 . 𝒑(𝟏 − 𝒑)
𝒁𝜶
𝟐
𝒏 =
𝜺𝟐
§ Khi không biết p, lấy theo trường hợp thận trọng nhất p=0.5
𝟐
𝟎. 𝟐𝟓 ∗ 𝒁𝜶
𝟐
𝒏 =
𝜺𝟐
§ Kiểm tra điều kiện n/N
§ Nếu n/N £ 0.05: Không cần điều chỉnh
n*=
§ Nếu n/N ³ 0.05: Điều chỉnh n thành n*
n.N
n+(N-1)
89
EM3230 Thống kê ứng dụng
5.5.2 Xác định cỡ mẫu cho bài toán kiểm định
Nội dung thảo luận theo nhóm trên lớp
90
EM3230 Thống kê ứng dụng
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
Nội dung thảo luận theo nhóm trên lớp
91
EM3230 Thống kê ứng dụng
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
CHÚC CÁC BẠN HỌC TỐT
1-a
a
Độ tin cậy
|Za/2|
80%
0,2
1,28
85%
0,15
1,44
90%
0,1
1,645
0.5
0.5
a/2
a/2
95%
0,05
1,96
98%
0,02
2,33
Z
0
-Za/2
Za/2
99%
0,01
2,58
24
EM3230 Thống kê ứng dụng
5.2.2 Lý thuyết về kiểm định
1) Đặt giả thuyết về tham số tổng thể
2) Một số nguyên tắc liên quan đến việc đặt giả thuyết
3) Logic của bài toán kiểm định
4) Xác suất sai lầm loại I và loại II
5) Mức ý nghĩa của kiểm định – Significance level
6) Kiểm định một bên và hai bên
7) Giá trị tới hạn – Critical value
8) Cách tiếp cận p-value
25
EM3230 Thống kê ứng dụng
(1) Đặt giả thuyết về tham số tổng thể
Tôi cho rằng trọng lượng
TB của sản phẩm là nhỏ
§ Giả thuyết là một phát biểu, một nhận
hơn 455 g.
định, một đề xuất, một tuyên bố về tham số của tổng thể
§
Kiểm định giả thuyết là kiểm tra tính hợp lý của một tuyên bố về tổng thể.
§ Đặt giả thuyết là bước đầu tiên trong thủ
tục kiểm định
§
H0: µ≥455 H1: µ< 455
Luôn phải có 1 cặp giả thuyết H0 (giả thuyết không- Null Hypothesis) và H1 (giả thuyết đối – Alternative Hypothesis)
§ Hai quyết định/ kết quả của kiểm định: Bác bỏ H0 hoặc KHÔNG bác bỏ H0
26
EM3230 Thống kê ứng dụng
(2) Nguyên tắc đặt giả thuyết
Giả thuyết H0: Giả thuyết H1
• thường mô tả trạng thái ban đầu • mô tả trạng thái đối ngược của giả thiết H0
của hiện tượng
• không có dấu bằng, có liên hệ, thể hiện
• Luôn phải có dấu bằng, không có
nghi vấn của người nghiên cứu ≠ , >, <
liên hệ =, ≤ , ≥
• không có dữ liệu chứng minh
• đòi hỏi dữ liệu,bằng chứng để chứng minh (Để chứng minh H1 đúng thì nhà nghiên cứu phải thu thập dữ liệu để bác bỏ H0)
27
EM3230 Thống kê ứng dụng
(2) Nguyên tắc đặt giả thuyết
§ Nếu bác bỏ H0 thì có bằng chứng thống kê rằng giả thuyết đối H1 là đúng
§ Nếu không có bằng chứng bác bỏ H0 tức là thất bại trong việc chứng minh H1 là đúng,
§ Tuy nhiên thất bại trong việc chứng minh H1 là đúng không có nghĩa là H0 đúng.
28
EM3230 Thống kê ứng dụng
(3) Logic của bài toán kiểm định
§ Khối lượng quy định là 455g
§ Trung bình mẫu lấy ra kiểm tra đạt 454.99g, hoặc 430g.
Sự khác biệt quá lớn hoặc quá nhỏ: Không cần kiểm định
§ Trung bình mẫu đạt 453.2 g, chưa đủ rõ ràng để ra quyết định à CẦN KIỂM ĐỊNH
bằng cách:
§ Tính toán giá trị kiểm định thống kê căn cứ vào số liệu mẫu
§ Sử dụng phân phối của giá trị kiểm định để quyết định giá trị kiểm định này có cho
phép bác bỏ H0 hay không?
30
EM3230 Thống kê ứng dụng
(4) Xác suất sai lầm loại I và loại II
Sai số do điều tra/ sai số ngẫu nhiên à 2 loại sai lầm.
H0 đúng
H0 sai
Bác bỏ
Sai lầm loại I (a)
Chấp nhận
Sai lầm loại II (b)
§ Giá trị a cho phép xác định diện tích vùng bác bỏ H0 § Nếu giá trị kiểm định tính toán được từ các thông tin của mẫu rơi vào vùng này thì ta sẽ quyết
định bác bỏ H0.
§ Khi a tăng, khả năng bác bỏ H0 giảm nên khả năng phạm sai lầm loại I nhỏ đi nhưng khả năng
mắc sai lầm loại II tăng lên (trong trường hợp cỡ mẫu không đổi)
31
EM3230 Thống kê ứng dụng
(5) Mức ý nghĩa của kiểm định – Significance level
§ Alpha- a: giá trị xác suất phạm sai lầm loại I: cần ấn định trước khi tiến hành kiểm định
§
a phụ thuộc vào mức độ tổn thất người làm kiểm định có thể “chịu đựng” nếu sai lầm loại I xảy
ra
§
a .100% khả năng phạm phải lỗi đã bác bỏ H0 khi thực tế nó đúng.
§
a - mức ý nghĩa của kiểm định
§
Ta tin rằng (1-a) .100% là ta đã quyết định đúng (Độ tin cậy)
33
EM3230 Thống kê ứng dụng
(6) Kiểm định một bên và hai bên
§ Kiểm định 2 bên là loại kiểm định được sử dụng để xác định xem liệu tham số tổng thể khác biệt
(¹) một cách đáng kể so với giá trị giả thuyết hay không. KĐ 2 bên có 2 miền bác bỏ nằm ở 2
bên của của phân phối.
H0:µ = µ0 H1: µ ≠ µ0
34
EM3230 Thống kê ứng dụng
(7) Kiểm định một bên và hai bên
Kiểm định 1 bên
§
KĐ bên trái: KĐ xem liệu tham số của tổng thể có nhỏ hơn một cách đáng kể so với giá trị giả
thuyết không?
§
KĐ bên phải: KĐ xem liệu tham số của tổng thể có lớn hơn một cách đáng kể so với giá trị giả
thuyết không?
H0:µ ³ µ0 H1: µ < µ0
H0:µ £ µ0 H1: µ > µ0
35
EM3230 Thống kê ứng dụng
(8) Giá trị tới hạn – Critical value
§ Giá trị a giúp xác định vùng diện tích bác bỏ H0, và vùng chấp nhận H0.
§ Giá trị tới hạn chính là biên giới giữa hai vùng chấp nhận và bác bỏ H0
Vùng chưa đủ bằng chứng bác bỏ H0
Bác bỏ
Giá trị tới hạn
Vùng chưa đủ bằng chứng bác bỏ H0
Bác bỏ
Bác bỏ
Giá trị tới hạn
Giá trị tới hạn
Vùng chưa đủ bằng chứng bác bỏ H0
Bác bỏ
Giá trị tới hạn
36
EM3230 Thống kê ứng dụng
(9) Cách tiếp cận p-value
§ p-value: Xác suất tới hạn. Xác suất để tìm ra 1 quan sát mà từ đó thấy được H0 là đúng,
§
§
p - value < a (mức rủi ro có thể chấp nhận được): có cơ sở để bác bỏ H0 p - value ³ a (mức rủi ro có thể chấp nhận được): xác suất “quyết định bác bỏ H0 là quyết định SAI LẦM” rất cao, chưa có cơ sở để bác bỏ H0
§ Cách tính xác suất tới hạn
Kiểm định hai bên: p - value = 2. P(z³|zstat|) =2.(1-F(z))
Kiểm định bên phải: p - value = P(z³ zstat)
Kiểm định bên trái: p - value = P(z £ zstat)
37
EM3230 Thống kê ứng dụng
(9) Cách tiếp cận p-value
38
EM3230 Thống kê ứng dụng
Nội dung chính
5.1 Phân phối của các tham số mẫu (Bài giảng video)
5.2 Lý thuyết về ước lượng và kiểm định
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)
5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
39
EM3230 Thống kê ứng dụng
5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể
5.3.1. Ước lượng trên một tổng thể
5.3.1.1 Ước lượng trung bình một tổng thể
5.3.1.2 Ước lượng tỷ lệ một tổng thể
5.3.1.3 Ước lượng phương sai một tổng thể
5.3.2. Kiểm định trên một tổng thể
5.3.2.1 Kiểm định trung bình một tổng thể
5.3.2.2 Kiểm định tỷ lệ một tổng thể
5.3.2.3 Kiểm định phương sai một tổng thể
40
EM3230 Thống kê ứng dụng
Phân loại các bài toán kiểm định tham số
Biết s
Chưa biết s, mẫu lớn
KĐ trung bình
Chưa biết s, mẫu nhỏ
KĐ trên 1 tổng thể
KĐ tỷ lệ
KĐ phương sai
Biết s
Chưa biết s, mẫu lớn
KĐ trung bình
ị
Chưa biết s, mẫu nhỏ
KĐ trên 2 tổng thể
KĐ tỷ lệ
i
KĐ phương sai
ố s m a h t h n đ m ể K
ANOVA 1 yếu tố
KĐ trên k tổng thể (k³2)
ANOVA 2 yếu tố
41
EM3230 Thống kê ứng dụng
5.3.1. Ước lượng trên một tổng thể 5.3.1.1 Ước lượng trung bình một tổng thể
f(Z)
1-a
a) Trong trường hợp mẫu lớn (n≥30)
P(-Z α/2 α /2 a/2 a/2 0.
5 0.
5 P(-Z < < Z )=1-α α/2 α / 2 X-μ
𝜎/
δ
/ n 𝜎/ P(-Z *δ/ n =1
) -α 𝜎/ α /2 α/2 𝜎/ P(-X-Z *δ/ n <-μ<-X+Z *δ
/ n )=1-
𝜎/ α α/2 α P(X-Z * <μ )=1-α α/2 α/2 𝜎
δ
n /2
𝜎
δ
n Sai số (biên) Sai số (biên)- Margin of error EM3230 Thống kê ứng dụng Ước lượng điểm (U) Cận trên của
khoảng tin cậy (L) Cận dưới của
khoảng tin cậy Độ rộng/ Bề rộng của
khoảng tin cậy a) Trong trường hợp mẫu lớn (n≥30) Biết s U,L =x±2,575 U,L =x±1,96 U,L =x±Z
μ α/2 μ μ σ
n σ
n σ
n Chưa biết s n-1 n-1 n-1 U,L =x±t
μ α/2 U,L =x±t
μ U,L =x±t
μ 0,025 0,005 s
n s
n s
n . ’
$ ≈ ̅𝑥 ± 𝑍!
" EM3230 Thống kê ứng dụng b) Trong trường hợp mẫu nhỏ (n<30) U,L =x±2,575 U,L =x±1,96 μ Biết s
U,L =x±Z
μ α/2 μ σ
n σ
n σ
n n-1 n-1 n-1 Chưa biết s
U,L =x±t
μ U,L =x±t
μ U,L =x±t
μ α/2 0,025 0,005 s
n s
n s
n EM3230 Thống kê ứng dụng Trong một nghiên cứu về năng suất canh tác một sản phẩm nông nghiệp với cỡ mẫu n=36, có trung bình =50 và độ lệch chuẩn là 8 tạ/ha. Ước lượng khoảng tin cậy trung bình tổng thể với độ tin cậy 95%. t 50 ,2 0301 50 ,2 7068 µ x
±= = ± = ± n 025 ,0,1
- s
n 8
36 ,47 2932 ,52 7068 ££ µ Như vậy chúng ta tin cậy 95% rằng trung bình tổng thể nằm trong khoảng từ 47,2932 tạ/ha đến 52,7068 tạ/ha. EM3230 Thống kê ứng dụng Ví dụ 2 (mẫu nhỏ) Kiểm tra trọng lượng 25 sản phẩm của 1 lô hàng. Sau khi tập hợp dữ liệu mẫu này ta có TB mẫu= 2,5kg và độ lệch chuẩn là s=0,061. Ước lượng trọng lượng trung 0, 061 2,5 0, 02087 2,5 1,711
± = ± U Lµ =
, 25 ,2 49582 ,2 5287 ££ µ bình của sản phẩm trong lô với độ tin cậy 90%. Với độ tin cậy 90%, trọng lượng trung bình của sản phẩm trong lô hàng (tổng thể) nằm trong khoảng từ 2,49582kg đến 2,5287kg. EM3230 Thống kê ứng dụng Điều kiện: Cỡ mẫu lớn § np >=5 và n(1-p) >=5 § hoặc npx>=5 và n(1-px)>=5 (khi không biết p) p ) p p ) p x x x x p Z p Z - p
<< + x x 2/ 2/ a a 1(
-
n 1(
-
n p là tỷ lệ tổng thể, px là tỷ lệ mẫu EM3230 Thống kê ứng dụng Chọn một mẫu ngẫu nhiên 100 người và thấy 25% số người này thuận tay trái trong 25,0 96,1 25,0 96,1 - p
<< + )25,01(25,0
-
100 )25,01(25,0
-
100 ,0 1651 ,0 3349 << p ăn uống, ước lượng tỷ lệ người thuận tay trái cho tổng thể với độ tin cậy 95%. Như vậy chúng ta tin cậy 95% rằng tỷ lệ những người thuận tay trái trong ăn uống là từ 16,51 đến 33,49 %. EM3230 Thống kê ứng dụng Giả định: Tổng thể có phân phối chuẩn 2 2 n s s Khoảng tin cậy (1-a)100% của phương sai tổng thể. < 2
s < 1, / 2 / 2 -
2
c
n
- a a EM3230 Thống kê ứng dụng 5.3.2.1. KĐGT về trung bình tổng thể 5.3.2.2. KĐGT về tỷ lệ tổng thể = = Z stat tstat µ0-
n x
s 0µ-
n x
s 0µ-
n x
Z stat s
= 2 ( n s = 2
c
n Z
=
stat stat (1 ) / n - )1
-
2
s
0 p p
-
0
p
0 p
0 5.3.2.3. KĐGT về phương sai tổng thể EM3230 Thống kê ứng dụng Các bước kiểm định Bước 1: Lặp cặp giả thuyết và nhận diện bài toán KĐ hai bên, bên trái hay bên phải Bước 2: Lựa chọn mức ý nghĩa a Bước 3: Tính đại lượng kiểm định (giá trị thống kê) của chỉ tiêu kiểm định: zstat, tstat, zqs, tqs,
hoặc ztt, ttt
Bước 4: § Cách 1: (giá trị tới hạn): Xác định miền bác bỏ và miền chấp nhận thông qua các giá trị tới hạn za, za/2, ta, ta/2… § Cách 2: (xác suất tới hạn): Từ giá trị thống kê tính toán được của chỉ tiêu kiểm định, tính p-value Bước 5: So sánh giá trị thống kê với miền bác bỏ hoặc p-value với a để rút ra kết luận EM3230 Thống kê ứng dụng KĐ 2 phía KĐ bên trái KĐ bên phải Cặp giả thuyết H0:µ=µ0
H1: µ≠µ0 H0:µ³µ0
H1: µ<µ0 H0:µ£µ0
H1: µ>µ0 µ0-
n x
Z stat s
= Đại lượng kiểm
định Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2 EM3230 Thống kê ứng dụng MẪU LỚN KĐ 2 phía KĐ bên trái KĐ bên phải = Z stat Cặp giả thuyết H0:µ=µ0
H1: µ≠µ0 H0:µ³µ0
H1: µ<µ0 H0:µ£µ0
H1: µ>µ0 x
s 0µ-
n Đại lượng
kiểm định Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2 EM3230 Thống kê ứng dụng MẪU NHỎ KĐ 2 phía KĐ bên trái KĐ bên phải = tstat Cặp giả thuyết H0:µ=µ0
H1: µ≠µ0 H0:µ³µ0
H1: µ<µ0 H0:µ£µ0
H1: µ>µ0 x
s 0µ-
n Đại lượng
kiểm định Miền bác bỏ t<- tn-1,a t> tn-1,a t> tn-1,a/2 hoặc
t<- tn-1,a/2 EM3230 Thống kê ứng dụng Một ông ty công bố trọng lượng trung bình của một sản phẩm mà mình phân phối trên thị trường là
368 g? Công ty cũng ấn định s=15 g.
Chọn một mẫu 25 hộp, cho thấy !𝑿 =363.5.
Kiểm định xem liệu trọng lượng trung bình của sản phẩm có khác trọng lượng đã công bố với mức ý
nghĩa =0,05 Cặp giả thuyết Xác định dạng bài toán: - Bài toán biết phương sai tổng thể EM3230 Thống kê ứng dụng Đại lượng kiểm định: 5,1 =Z -= 5.363
15 368
-
25 Quyết định: Không có bằng chứng bác bỏ H0 với a=5% Z Kết luận: Với mức ý nghĩa 5%, không có bằng
chứng chứng tỏ trọng lượng trung bình của sản
phẩm khác 368 g EM3230 Thống kê ứng dụng Kiểm tra điều kiện mẫu đủ lớn § np ³5 và np(1-p) ³5 KĐ 2 phía KĐ bên trái KĐ bên phải H0: p = p0
H1: p ≠ p0 H0: p ³ p0
H1: p < p0 H0: p £ p0
H1: p > p0 Z
=
stat Cặp giả thuyết (1 ) / n - p p
-
0
p
0 p
0 Đại lượng
kiểm định Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2 EM3230 Thống kê ứng dụng Một công ty nghiên cứu marketing tuyên bố tỷ lệ trả lời trong các cuộc điều tra là 4%. Một mẫu khảo sát 500 khách hàng, kết quả là 25 khách hàng trả lời. Hãy kiểm định về tỷ lệ tổng thể với a= 0.05, xem tuyên bố có hợp lý không? EM3230 Thống kê ứng dụng § Cặp giả thuyết cần kiểm định § H0: p = 0.04 § H1: p # 0.04 p - § Mức ý nghĩa: 𝞪 = 0.05, 1.1411 @= = Z
stat p ) ) § n = 500: Đáp ứng điều kiện mẫu đủ lớn. Sp
(
1
p
-
n 0.05 0.04
-
(
0.04 1 0.04
-
500 Sử dụng đại lượng kiểm định Z § Giá trị tới hạn ± 1.96. Miền bác bỏ: Z<-1.96 hoặc Z> 1.96. § Zstat không thuộc miền bác bỏ à Không có bằng chứng bác bỏ H0 với a= 0.05. § Kết luận: Với mức ý nghĩa 5%, không có đủ bằng chứng bác bỏ H0 rằng tỷ lệ phản hồi từ EM3230 Thống kê ứng dụng KĐ 2 phía KĐ bên trái KĐ bên phải TH Mẫu lớn
n≥30,biết s 2 2 2 2 ( n s = 2
c
n stat Cặp giả thuyết H0:s2=s0
2
H1: s2≠s0 H0:s2=s0
2
H1: s2 )1
-
2
s
0 ñ 2
n ,1 2/ 2
acc -
n Đại lượng kiểm
định ñ 2
n ,1 2
acc -
n 2
n 2
< n
acc
1(;1
)
-
- 2
n 2
--<
acc
n
,1
2/ Miền bác bỏ EM3230 Thống kê ứng dụng EM3230 Thống kê ứng dụng EM3230 Thống kê ứng dụng 5.3.2.1 KĐGT về trung bình tổng thể 5.3.2.2 KĐGT về tỷ lệ tổng thể Biết 𝜎 5.3.2.3 KĐGT về phương sai tổng thể Z
=
stat (1 ) / n - p p
-
0
p
0 p
0 Chưa biết 𝜎, mẫu lớn Z stat
Z stat 2 ( n s = 2
c
n tstat
tstat stat )1
-
2
s
0 EM3230 Thống kê ứng dụng 5.1 Phân phối của các tham số mẫu (Bài giảng video) 5.2 Lý thuyết về ước lượng và kiểm định 5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video) 5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video) 5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định 5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh EM3230 Thống kê ứng dụng 5.4.1. Ước lượng chênh lệch của 2 tổng thể 5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể 5.4.1.2 Ước lượng chênh lệch tỷ lệ của 2 tổng thể 5.4.2. Kiểm định trên hai tổng thể 5.4.2.1. Kiểm định chênh lệch trung bình của 2 tổng thể 5.4.2.2. Kiểm định chênh lệch tỷ lệ của 2 tổng thể EM3230 Thống kê ứng dụng Biết phương sai
2 tổng thể Lấy mẫu độc lập Mẫu lớn
n1 ³30
và n2 ³30 Không biết
phương sai 2
tổng thể Giả định Phương
sai 2 tổng thể
bằng nhau Lấy mẫu cặp Mẫu nhỏ
n1 £30
và/ hoặc n2 £30 Giả định Phương
sai 2 tổng thể
không bằng nhau EM3230 Thống kê ứng dụng (1) Trường hợp lấy mẫu độc lập 2
2 2 U,L =x -x
1 z + ± α/2 μ -μ
1 2 2
σ
1
n σ
n 1 2 (a) Biết phương sai của hai tổng thể EM3230 Thống kê ứng dụng (1) Trường hợp lấy mẫu độc lập (b1) Không biết phương sai của hai tổng thể, MẪU LỚN 2 Áp dụng định lý giới hạn trung tâm α/2 μ -μ
1 2 2
S
1
n 2
S
2
n 1 2 EM3230 Thống kê ứng dụng (1) Trường hợp lấy mẫu độc lập (b2) Không biết phương sai của hai tổng thể, MẪU NHỎ 2 U,L =x -
1 x df
t *S + ± -μ p μ
1 2 α/2 1
n 1
n 1 2 2
(n -1)S +(n -1
1 1 2
)S
2 = S
p 2
n +n -2 2 df n = 1 1
+n -2
2 (b2.1) Giả định hai tổng thể có phương sai bằng nhau EM3230 Thống kê ứng dụng (1) Trường hợp lấy mẫu độc lập (b2) Không biết phương sai của hai tổng thể, MẪU NHỎ 2
S 2
S 1 2 2 U, L =x -x
1 t * + ± df μ -μ
1 2 α 2
/ n n 1 2 2 2
S 2
S 1 2 + n n 1 2 df = 2 2 æ
ç
ç
è
2
S ö
÷
÷
ø
2
S 1 2 n n + ö
÷
÷
ø
1
1
- ö
÷
÷
ø
2
1
- æ
ç
ç
è
n
1 æ
ç
ç
è
n
2 (b2.2) Giả định hai tổng thể có phương sai KHÔNG bằng nhau EM3230 Thống kê ứng dụng (2) Trường hợp lấy mẫu cặp Dấu hiệu nhận diện mẫu cặp: - 2 mẫu có cỡ mẫu giống nhau - Có đặc điểm tương đồng trừ đặc điểm đang được quan tâm nghiên cứu, tức là các yếu tố ngoại lai được kiểm soát $
∑()* 𝑆𝑑 = = &𝒅 ± 𝒕𝜶/𝟐 U,Lµd 𝒏&𝟏.𝑺𝒅
𝒏 𝑑( − ̅𝑑 2
𝑛 − 1 Tạo biến chênh lệch d= x1-x2 ; di=x1i-x2i EM3230 Thống kê ứng dụng Kiểm tra điều kiện cỡ mẫu lớn n1.𝒑𝟏³𝟓; 𝒏𝟏. (𝟏 − 𝒑𝟏) ³5 n2.𝒑𝟐³𝟓; 𝒏𝟐. (𝟏 − 𝒑𝟐) ³5 + p1-p2=(𝒑𝟏 − 𝒑𝟐) ±za/2 . -)(/&-))
$) 𝒑𝟐(𝟏&𝒑𝟐)
𝒏𝟐 Ước lượng khoảng của chênh lệch giữa 2 tỷ lệ của hai tổng thể EM3230 Thống kê ứng dụng Biết phương sai
2 tổng thể Lấy mẫu độc lập Mẫu lớn
n1 ³30
và n2 ³30 Không biết
phương sai 2
tổng thể Giả định Phương
sai 2 tổng thể
bằng nhau Lấy mẫu cặp Mẫu nhỏ
n1 £30
và/ hoặc n2 £30 Giả định Phương
sai 2 tổng thể
không bằng nhau EM3230 Thống kê ứng dụng KĐ 2 phía KĐ bên trái KĐ bên phải - - 0 = Z stat Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0 x
x
d
1
2
2
2
ss
1
2
+
n
n
1
2 Đại lượng kiểm
định Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2 EM3230 Thống kê ứng dụng KĐ 2 phía KĐ bên trái KĐ bên phải - - x
1 2 0 = Z stat Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0 + x
2
s
1
n
1 d
2
s
2
n
2 Đại lượng kiểm
định Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2 EM3230 Thống kê ứng dụng § Trường hợp 1: Giả định được phương sai 2 tổng thể bằng nhau KĐ 2 phía KĐ bên trái KĐ bên phải - - x
1 t = ( s stat 2 2
2 s = p Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0 s + n
1
( (
( )1
)1 2
s
)1
+
1
)1
+- -
- p -
n
1 n
2
n
2 x
2
1
n
1 d
0
1
n
2 Đại lượng kiểm
định Miền bác bỏ t<- tn1+n2-2;a t> tn1+n2-2;a t> tn1+n2-2;a/2 hoặc
t<- tn1+n2-2;a/2 EM3230 Thống kê ứng dụng § Trường hợp 2: Không giả định được phương sai 2 tổng thể bằng nhau KĐ 2 phía KĐ bên trái KĐ bên phải 2 - - + x
1 2 0 = 2
s
1
n
1 2
s
2
n
2 t stat df = 2 2 Cặp giả thuyết H0:µ1-µ2=d0
H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0
H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0
H1: µ1-µ2 > d0 + + x
2
s
1
n
1 d
2
s
2
n
2 æ
çç
è
2
ö
s
1
÷÷
n
ø
1
1
- ö
÷÷
ø
2
ö
s
2
÷÷
n
ø
2
1
- æ
çç
è
n
1 æ
çç
è
n
2 Đại lượng kiểm
định Miền bác bỏ t<- tdf;a t> tdf;a t> tdf;a/2 hoặc
t<- tdf;a/2 EM3230 Thống kê ứng dụng § Tạo biến chênh lệch d=x1-x2 với các giá trị của biến d là di=x1i-x2i § Đưa về bài toán kiểm định trung bình một tổng thể § Nếu mẫu lớn, chỉ tiêu kiểm định là z § Nếu mẫu nhỏ, chỉ tiêu kiểm định là t $
∑23/ t = Z = stat stat 𝑆𝑑 = d
s d
0-
n 𝑑𝑖 − ̅𝑑 2
𝑛 − 1 d
s d
0-
n d d § Miền bác bỏ (xem lại phần 7.2) Cặp giả thuyết H0: µd=d0
H1: µd ≠ d0 H0: µd ³d0
H1: µd < d0 H0: µd £ d0
H1: µd > d0 EM3230 Thống kê ứng dụng § Kiểm tra điều kiện mẫu đủ lớn KĐ 2 phía KĐ bên trái KĐ bên phải ( p p ) ) - - - s
1 s 2 2 Z = stat = ps p 1( p )( ) - + s s 2
) +
+ X
1
(
n
1 X
n
2 Cặp giả thuyết H0: p1=p2
H1: p1≠p2 H0: p1≥p2
H1: p1 p
(
1
1
n
1 p
1
n
2 ps ước lượng chung cho tỷ lệ của 2 mẫu kết hợp Đại lượng kiểm
định Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc
Z<- Za/2 EM3230 Thống kê ứng dụng Một công ty vừa mới thực hiện một chương trình quảng cáo trên TV để khuếch trương cho một trong các sản phẩm của họ. i. Một mẫu ngẫu nhiên 240 người đã được lấy ra trước khi chương trình quảng cáo được thực hiện, có 60 người đã từng sử dụng sản phẩm của công ty. ii. Một mẫu ngẫu nhiên khác 360 người, được lấy ra sau khi chương trình quảng cáo được thực hiện, có 117 người đã sử dụng sản phẩm đó của công ty. Hãy kiểm định xem liệu có bằng chứng về sự tăng lên đáng kể số người sử dụng sản phẩm của công ty, với mức ý nghĩa a=0.05 EM3230 Thống kê ứng dụng 1. Cặp giả thuyết cần kiểm định H0: p1≥p2 H1: p1 2. Mức ý nghĩa: a=0,05 ,0 295 = = = ps 2
) +
+ 117
60
+
240
360
+ X
1
(
n
1 X
n
2 3. Đại lượng kiểm định ( p p ) ) - - - s
1 s 2 2 Z 97,1 = = -= stat -
295 /1)( ,0 /1 )360 25,0(
,01(295
- 0)325,0
-
240
+ p 1( p )( ) - + s s p
(
1
1
n
1 p
1
n
2 4. a=0,05, Za= 1,645 àMiền bác bỏ là Z<-1.645; Zstat<- Za có cơ sơ bác bỏ H0
KL: Với mức ý nghĩa 5%, có thể kết luận tỷ lệ người sử dụng sản phẩm của công ty có tăng lên sau chương trình quảng cáo EM3230 Thống kê ứng dụng - - - - 0 x
1 2 0 = = Z stat Z stat + x
x
d
1
2
2
2
ss
1
2
+
n
n
1
2 x
2
s
1
n
1 d
2
s
2
n
2 Biết phương sai
2 tổng thể - - x
1 t = stat s + p x
2
1
n
1 d
0
1
n
2 Lấy mẫu độc lập Mẫu lớn
n1 ³30
và n2 ³30 Không biết
phương sai 2
tổng thể Giả định Phương
sai 2 tổng thể
bằng nhau Lấy mẫu cặp Z = stat Mẫu nhỏ
n1 £30
và/ hoặc n2 £30 d
s d
0-
n d Giả định Phương
sai 2 tổng thể
không bằng nhau t = stat d
s d
0-
n d ( p p ) ) - - - s
1 s 2 2 - - Z = x
1 2 0 stat = t stat p 1( p )( ) - + s s + p
(
1
1
n
1 p
1
n
2 x
2
s
1
n
1 d
2
s
2
n
2 EM3230 Thống kê ứng dụng 5.1 Phân phối của các tham số mẫu (Bài giảng video) 5.2 Lý thuyết về ước lượng và kiểm định 5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video) 5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video) 5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định 5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh EM3230 Thống kê ứng dụng § Sai số của ước lượng 𝒔 𝝈 𝜺 = 𝒁𝜶/𝟐 𝜺 = 𝒁𝜶/𝟐 𝒏 𝒏 § Độ rộng của khoảng tin cậy: 2e § Công thức ước lượng n để sai số không vượt quá e 𝒏 = ( 𝒏 = ( 𝒁𝜶/𝟐.𝒔
𝜺 𝒁𝜶/𝟐.𝝈
𝜺 § Kiểm tra điều kiện n/N § Nếu n/N £ 0.05: Không cần điều chỉnh § Nếu n/N ³ 0.05: Điều chỉnh n thành n* n*= n.N
n+(N-1) EM3230 Thống kê ứng dụng § Công thức ước lượng n để sai số không vượt quá e § Khi ước lượng được tỷ lệ của tổng thể p 𝟐 . 𝒑(𝟏 − 𝒑)
𝒁𝜶
𝟐 𝒏 = 𝜺𝟐 § Khi không biết p, lấy theo trường hợp thận trọng nhất p=0.5 𝟐
𝟎. 𝟐𝟓 ∗ 𝒁𝜶
𝟐 𝒏 = 𝜺𝟐 § Kiểm tra điều kiện n/N § Nếu n/N £ 0.05: Không cần điều chỉnh n*= § Nếu n/N ³ 0.05: Điều chỉnh n thành n* n.N
n+(N-1) EM3230 Thống kê ứng dụng Nội dung thảo luận theo nhóm trên lớp EM3230 Thống kê ứng dụng Nội dung thảo luận theo nhóm trên lớp EM3230 Thống kê ứng dụngZ
0
-Za/2
Za/2
Ước lượng
điểm
42
+ Sai số
- Sai số
5.3.1.1 Ước lượng trung bình tổng thể
Tổng quát
Độ tin cậy 95%
Độ tin cậy 99%
44
5.3.1.1 Ước lượng trung bình tổng thể
Tổng quát
Độ tin cậy 95%
Độ tin cậy 99%
45
5.3.1.1 Ước lượng trung bình tổng thể
Ví dụ 1 (mẫu lớn):
46
5.3.1.1 Ước lượng trung bình tổng thể
47
5.3.1. Ước lượng trên một tổng thể
5.3.1.2 Ước lượng tỷ lệ tổng thể
48
5.3.1.2 Ước lượng tỷ lệ tổng thể
Ví dụ:
49
5.3.1.3 Ước lượng phương sai tổng thể
(
)
1
)
1
(
n
-
2
c
n
1,1
- -
50
5.3.2. Kiểm định trên một tổng thể
51
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
52
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Trường hợp biết phương sai tổng thể
53
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Trường hợp KHÔNG biết phương sai tổng thể, mẫu lớn
54
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Trường hợp KHÔNG biết phương sai tổng thể, mẫu nhỏ
55
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
Ví dụ
H0: µ= 368
H1: µ¹ 368
368 g.
56
5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể
H0: µ = 368
H1: µ ¹ 368
a= 0.05 à Za/2 = 1.96
n = 25
Miền bác bỏ:
Z£-1.96 hoặc Z³ 1.96
Bác bỏ
Bác bỏ
0.025
0.025
-1.96
1.96
0
-1.50
57
5.3.2.2. KĐGT về tỷ lệ tổng thể
58
5.3.2.2. KĐGT về tỷ lệ tổng thể
Ví dụ
59
5.3.2.2. KĐGT về tỷ lệ tổng thể
các cuộc điều tra là 4%.
60
5.3.2.3. KĐGT về phương sai tổng thể
61
Phân phối Chi-square
62
Phân phối Chi-square
63
5.3.2 Kiểm định giả thuyết trên một tổng thể
H0: µ = µ0
H1: µ ≠ µ0
H0: p = p0
H1: p ≠ p0
H0: p £ p0
H1: p > p0
H0:µ ³ µ0
H1: µ < µ0
0
0
H0:µ £ µ0
H1: µ > µ0
H0: s2 = s2
H1: s2 ≠ s2
0
H0: s2 £ s2
0
Chưa biết 𝜎, mẫu nhỏ
H1: s2 > s2
0
x
µ0-
x
µ0-
Z stat s
=
Z stat s
=
n
n
H0: p ³ p0
x
0µ-
x
0µ-
H1: p < p0
=
=
n
s
s
n
x
0µ-
x
0µ-
H0: s2 ³ s2
=
=
0
H1: s2 < s2
n
s
s
n
64
Nội dung chính
65
5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể
66
5.4.1. Ước lượng chênh lệch trên hai tổng thể
Ước lượng
chênh lệch
Trung bình
của 2 tổng thể
Ước lượng
chênh lệch
TỶ LỆ
của 2 tổng thể
67
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
68
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
U,L
=x -x
1
z
+
±
69
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
70
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
71
5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể
72
5.4.1.2 Ước lượng tỷ lệ của 2 tổng thể
73
5.4.2 Kiểm định giả thuyết trên hai tổng thể
Kiểm định
chênh lệch
Trung bình của
2 tổng thể
Kiểm định
chênh lệch
TỶ LỆ
của 2 tổng thể
74
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(1) Hai mẫu độc lập, BIẾT PHƯƠNG SAI
75
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(2) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu lớn
76
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(3) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu nhỏ
77
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(3) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu nhỏ
78
5.4.2.1 KĐGT về chênh lệch hai TB tổng thể
(4) Mẫu cặp
79
5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể
80
5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể
Ví dụ:
81
5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể
82
5.4.2 Kiểm định giả thuyết trên hai tổng thể
Kiểm định
chênh lệch
Trung bình của
2 tổng thể
Kiểm định
chênh lệch
TỶ LỆ
của 2 tổng thể
83
Nội dung chính
87
5.5.1 Xác định cỡ mẫu cho bài toán ước lượng
(1) Xác định cỡ mẫu khi ước lượng trung bình tổng thể
)2
)2
88
5.5.1 Xác định cỡ mẫu cho bài toán ước lượng
(2) Xác định cỡ mẫu khi ước lượng tỷ lệ tổng thể
89
5.5.2 Xác định cỡ mẫu cho bài toán kiểm định
90
5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh
91
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
CHÚC CÁC BẠN HỌC TỐT