BÀI 7 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Ê Ả
Ố
Ế
Ể
TS. Nguyễn Mạnh Thế TS N ễ M h Thế
v1.0012107210
1
TÌNH HUỐNG KHỞI ĐỘNG BÀI
ỳ ọ g) (với một giá trị cho trước của kỳ vọng). ( ộ g
0
Trường hợp đã biết:
(X
)
0
U
Hình 1. Miền tiêu chuẩn đối với phân phối chuẩn. phân phối chuẩn
Tình huống Tình huống Kết luận Kết luận Công ty Hoàng Lâm sản xuất mỳ chính theo dây chuyền của Đức. Theo tiêu • Kiểm định so sánh kỳ vọng của biến ngẫu nhiên có phân phối chuẩn chuẩn thì trọng lượng các gói mỳ chính được đóng trên một máy tự động là 453g. Nghi ngờ máy tự động làm việc không còn đủ chính xác, công ty Hoàng Lâm tiến hành kiểm tra ngẫu nhiên 81 gói ta thấy trọng lượng trung bình là 448g. Với mức ý nghĩa 0.05 có thể cho rằng trọng lượng các gói mỳ bình là 448g. Với mức ý nghĩa 0.05 có thể cho rằng trọng lượng các gói mỳ chính không đạt tiêu chuẩn hay không? Biết rằng trọng lượng gói mỳ chính là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 36g.
• Với mức ý nghĩa a cho trước, ta có miền bác bỏ:
với
/ 2 / 2
ị 2 Bài toán 1: H : 0 H : 1 0 Tiêu chuẩn kiểm định: Tiê đị h h ẩ kiể Câu hỏi gợi mở n ~ N(0,1)
/ 2 / 2
P U U P U U ú
; ; U ố
í
ộ
ê
x
0
kỳ vọng của biến X thực sự
n W
0
U qs q
Câu 1: Trọng lượng trung bình của 01 gói mỳ Câu 1: Trọng lượng trung bình của 01 gói mỳ chính theo điều tra là bao nhiêu? Câu 2: Để bác bỏ giả thuyết “dây chuyền vẫn hoạt ; U ; / 2 / 2 ỳ ẩ động tốt, trọng lượng mỳ chính đúng tiêu chuẩn” thì tiêu chuẩn kiểm định phải không nằm trong Nếu giá trị g khoảng nào?
2
v1.0012107210
Câu 3: Dây chuyền còn hoạt động tốt không?
TÌNH HUỐNG KHỞI ĐỘNG BÀI (tiếp theo)
• Kiểm định so sánh kỳ vọng của biến ngẫu nhiên có phân phối chuẩn
ỳ ọ g) (với một giá trị cho trước của kỳ vọng). (
ộ g
Trường hợp
đã biết:
Kết luận Kết luận
0
(X
)
0
U
n ~ N(0,1)
Hình 1. Miền tiêu chuẩn đối với phân phối chuẩn. phân phối chuẩn
ị 2 Bài toán 1: H : 0 H : 1 0 h ẩ kiể Tiêu chuẩn kiểm định: Tiê đị h
• Với mức ý nghĩa a cho trước, ta có miền bác bỏ:
với
; ; U
/ 2 / 2
; U ; / 2 / 2
P U U P U U
/ 2 / 2
x
0
Nếu giá trị
kỳ vọng của biến X thực sự
n W
0
U q qs
3
v1.0012107210
MỤC TIÊU
• Miền bác bỏ;
Khái niệm giả thuyết thống kê ê
ố
ế
• Các bước làm bài toán kiểm định.
• Tham số kỳ vọng;
Kiểm định
• Tham số phương sai; i
ố hươ
Th
tham số
• Tham số tỉ lệ.
; • Kiểm định giả thuyết phân phối;
g
p
p
y
ị
Một số tiêu chuẩn
ộ
kiểm định
• So sánh nhiều tỉ lệ;
phi tham số
Kiểm định tính độc lập. • Kiểm định tính độc lập.
4
v1.0012107210
1. KHÁI NIỆM GIẢ THUYẾT THỐNG KÊ
iệ
hái
Khái niệm: Giả thuyết thống kê là một mệnh đề về tham số của tổng thể. Ký hiệu H0 là giả thuyết của tham số tổng thể, đi kèm với giả thuyết là mệnh Ký hiệu H là giả thuyết của tham số tổng thể đi kèm với giả thuyết là mệnh đề đối lập được gọi là đối thuyết, ký hiệu là H1.
Bài toán kiểm định giả thuyết thống kê gồm một cặp giả thuyết H0 và đối thuyết H1.
• Sai lầm loại I: Bác bỏ giả thuyết H0 nhưng thực tế H0 là đúng.
α là xác suất mắc sai lầm loại 1. α là xác suất mắc sai lầm loại 1
g ự
ậ g
p
ạ
y
• Sai lầm loại II: Chấp nhận giả thuyết H0 nhưng thực tế H0 là sai.
0
0
β là xác suất mắc sai lầm loại 2.
5
v1.0012107210
được gọi là mức ý nghĩa, thường được lấy nhỏ: 0,05; 0,02; 0,01.
1.1. MIỀN BÁC BỎ
Để giải quyết bài toán kiểm định giả thuyết ta xây dựng một thống kê.
G gọi là tiêu chuẩn thống kê.
được gọi
X
T G(X
1
... X ) n
c c
iả th ết H
hậ
W W
bác bỏ giả thuyết H0. W chấp nhận giả thuyết H0. hấ
6
v1.0012107210
Định nghĩa 1: Thống kê là một tiêu chuẩn 2 thống kê nếu giá trị của nó được dùng để xem xét bác bỏ hay chấp nhận giả thống kê nếu giá trị của nó được dùng để xem xét bác bỏ hay chấp nhận giả thuyết H0. Định nghĩa 2: Miền này được dùng cùng với tiêu chuẩn thống kê T và giá trị cụ thể tqs của tiêu chuẩn đó để đưa ra kết luận về giả thuyết H0. qst qst t
1.2. CÁC BƯỚC LÀM BÀI TOÁN KIỂM ĐỊNH
Xác định tham số kiểm định, đặt giả thuyết và đối thuyết
Bước 1
Xác định tiêu chuẩn và giá trị tiêu chuẩn với giá trị mẫu đã cho Xác định tiêu chuẩn và giá trị tiêu chuẩn với giá trị mẫu đã cho
Bước 2 Bước 2
Xác định miền bác bỏ W
Bước 3
Bước 4 Bước 4
So sánh giá trị của tiêu chuẩn thống kê với miền bác bỏ, kết luận bác bỏ hay chấp nhận giả thuyết l ậ bá bỏ h iả th ết hấ
hậ
7
v1.0012107210
2. KIỂM ĐỊNH THAM SỐ
Kiểm định bằng xác suất ý nghĩa xác suất ý nghĩa
Kiểm định bằng khoảng tin cậy khoảng tin cậy
Kiểm định bằng miền tiêu chuẩn (miền bác bỏ)
Kiể đị h iả th ết kì
Kiểm định giả thuyết hai phía Kiểm định giả thuyết hai phía
Kiểm định giả thuyết một phía Kiểm định giả thuyết một phía
Ta coi tất cả các biến ngẫu nhiên được xét tới đều có phân phối chuẩn.
ẫ
ẩ
8
v1.0012107210
• Kiểm định giả thuyết kì vọng • Kiểm định giả thuyết phương sai Kiểm định giả thuyết xác suất • Kiểm định giả thuyết xác suất
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG
Trường hợphợp đãđã biếtbiết Trường
Nếu giả thuyết H0 là đúng thì:
0
(X
)
0
U
n ~ N(0,1)
0
H H : 0 H : 1
Giả thuyết H0 bị bác bỏ nếu
/2
P{ | U | u }
Ta có miền bác bỏ
) )
; (u ; ( /2 /2
) ; -u ) ; ( W ( /2 /2 Trong đó uα/2 thỏa mãn điều kiện:
) 1
/ 2
/ 2
(u 0
Với mẫu cụ thể giá trị của tiêu
chuẩn thống kê U là: chuẩn thống kê U là:
x
0
u
n
qs
9
v1.0012107210
BàiBài toántoán 11..
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
ói
tiê
ì hí h đượ đó
á 453
h ẩ thì t ể
lượ H : 0 H : 1
ó hâ
ẫ (1,96;
hiê )
ói W (
Ví dụ:
Giải: Gọi X là trọng lượng gói mì chính Theo tiêu chuẩn thì trọng lượng các gói mì chính được đóng Th Giả thiết cần kiểm định trên một máy tự động là 453g. Kiểm tra ngẫu nhiên 81 gói ta 453 thấy trọng lượng trung bình là 448g. Ta có X ~ N(μ,σ2) trong đó σ=36, với mức ý nghĩa α=0,05. Ta có X ~ N(μ σ2) trong đó σ=36 với mức ý nghĩa α=0 05 Với mức ý nghĩa 0,05 có thể cho rằng trọng lượng các gói mì Tra bảng phân phối chuẩn ta tính được: chính không đạt tiêu chuẩn hay không? , uα/2 = u0 025 = 1,96 0,025 α/2 ì hí h là biế Biết ằ lượ Biết rằng trọng lượng gói mì chính là biến ngẫu nhiên có phân t Vậy miền bác bỏ là: ; -1,96) phối chuẩn với độ lệch chuẩn là 36g. Ta có:
x 448 81 1,25 u qs 448 453 448 453 36
qsu u
1,25 W 1 25 W
Kiểm tra ta thấy . Kiểm tra ta thấy Vậy ta chấp nhận giả thuyết H0, tức là trọng lượng các gói mì chính không đạt tiêu chuẩn .
v1.0012107210
10
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
Bài toán kiểm định một phía
0
Bài toán 2
0
H H : 0 H : 1
ể
Để bác bỏ giả thuyết H0 thì giá trị của thống kê U phải đủ lớn để
P{U u }
0 (u ) 1
Trong đó uu thỏa T đó thỏa mãnmãn:: thỏthỏ ãã
Ta có miền bác bỏ: ) ). ; W (u ; (
v1.0012107210
11
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
Ví dụ: Năng suất trung bình của một giống lúa ở các năm trước là 32,5 (tạ/ha). Năm nay người ta đưa vào phương pháp chăm sóc mới và hy vọng (tạ/ha). Năm nay người ta đưa vào phương pháp chăm sóc mới và hy vọng năng suất cao hơn năm trước. Điều tra trên 15 thửa ruộng thu được kết quả sau:
33,7 35,4 32,7 36,3 37,3 32,4 30,0
32,4 31,7 34,5 42,0 33,9 38,1 35,0 33,8 (tạ/ha)
Với mức ý nghĩa 1% có thể chấp nhận hy vọng đó hay không? Biết rằng năng suất lúa là biến ngẫu nhiên có phân phối chuẩn với phương sai là 10.
v1.0012107210
12
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
Giải: Gọi X là năng suất lúa, ta có X ~ N(μ,σ2) trong đó σ2=10. Ta cần kiểm định giả thiết: 32,5
32,5 H : 0 H : 1
0
0,01 nên 1 0,01 0, 99
W (2,33;
Với mẫu cụ thể đã cho ta tính được
) x
, 34,613
Với mức ý nghĩa: Tra bảng phân phối chuẩn ta có u0 01 = 2 33 Tra bảng phân phối chuẩn ta có u0,01 = 2,33 Vậy miền bác bỏ là:
0
q qs
x 34,613 32,5 Ta có: u n 15 2,587
10 10
qsu
2,587 W
Vậy bác bỏ giả thuyết H0 tức là năng suất lúa đã tăng lên. Vậ bá bỏ giả th ết H tứ là năng s ất lúa đã tăng lên
v1.0012107210
13
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
0
0
H : 0 H : 1
Bài toán 3:
P{U {
h Để bác bỏ giả thuyết H0 thì giá trị của thống kê U phải đủ nhỏ, tồntồn tạitại giágiá trịtrị uuαα sao cho: u } }
Miền bác bỏ: W ( Miền bác bỏ: W ( ; u ) ; u )
v1.0012107210
14
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
Ví dụ:
Theo tiêu chuẩn thì trọng lượng các bao gạo do một máy tự động Theo tiêu chuẩn thì trọng lượng các bao gạo do một máy tự động đóng là 50kg. Sau một thời gian hoạt động người ta nghi ngờ máy hoạt động không bình thường làm cho trọng lượng các bao gạo giảm đi.
Lấy ngẫu nhiên 90 bao và cân thử thu được trọng lượng trung bình là 48,5kg. bình là 48 5kg
Với mức ý nghĩa 5%, có thể kết luận về điều nghi ngờ trên?
ẫ
Biết rằng trong lượng bao gạo là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 2kg.
v1.0012107210
15
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
50
50
0H : 1H :
Giải: Gọi X là trọng lượng bao gạo X ~ N(μ,σ2) và σ = 2 Ta cần kiểm định
0,05
mức ý nghĩa: mức ý nghĩa: 0,05 0 05 (u ) 1 0,05 0,95. (u ) 1 0 05 0 95 0
g p p ,
0,05 ; -1,65).
Tra bảng phân phối chuẩn ta có u0,05 = 1,65 Vậy miền bác bỏ là: W (
x x
Với mẫu đã cho ta có: ẫ x 48,5
n
90 90
7,11 7 11
u qs
48,5 50 48,5 50 2
0 0
Giá trị của tiêu chuẩn thống kê là: Giá t ị ủ tiê kê là h ẩ thố
qsu W u W
Kiểm tra ta thấy vậy ta bác bỏ giả thuyết H0. Kiểm tra ta thấy vậy ta bác bỏ giả thuyết H0
v1.0012107210
16
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
X
0 0
Trường hợp chưa biết biế h h ờ
T T
n, n
' S
Xét thống kê Xét thống kê nếu giả thuyết H0 là đúng thì T có quy luật nếu giả thuyết H là đúng thì T có quy luật
bậc tự do phân phối student với n-1 bậc tự do. p â p ố stude t ớ
0
0 0
H : 0 H : 1 1
Bài toán 1
/2
t
P |T| trong đó phân vị
tìm từ bảng phân phối student.
n 1 / 2
Ta bác bỏ giả thuyết H0 nếu giá trị tuyệt đối của thống kê T đủ lớn, tức là: ứ là
n-1 t W ( W (
(t (t
) )
) )
; ;
n 1 n-1 /2
n 1 n-1 /2
; -t ; t với mẫu cụ thể giá trị của tiêu chuẩn thống kê
0 0
t
n
qs
x x s '
miền bác bỏ là: miền bác bỏ là:
v1.0012107210
17
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
Ví dụ:
á t ướ th bì h ủ hậ t ô ă
Trong các năm trước thu nhập trung bình của công nhân là 15 T hâ là 15 (triệu/năm), năm nay điều tra thu nhập của 25 công nhân ta có
số liệu sau: số liệu sau:
Thu nhập 10-12 12-14 14-16 16-18 18-20
Số công nhân 2 4 10 6 3
Với mức ý nghĩa 5% hãy kiểm định xem thu nhập trung bình của công nhân năm nay có khác so với năm trước hay không? Biết rằng thu nhập của công nhân là biến ngẫu nhiên có phân Biết rằng thu nhập của công nhân là biến ngẫu nhiên có phân phối chuẩn.
v1.0012107210
18
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
15
15 15
Giải: Gọi X là thu nhập của công nhân X ~ N(μ,σ2) N(μ,σ ) Giải: Gọi X là thu nhập của công nhân X
2 x 15,32, s'
4, 893, s' 2,212
Ta kiểm định 0H : H 1H : Ta có:
W (- ; -2,06)
(2,06;
).
Vậy ta có miền bác bỏ:
t
2,06.
24 0,025
Với mẫu đã cho ta có: ó ớ ẫ
t
25
0,723.
qs
15 32 15 15,32 15 2,212
W, W,
Giá trị tiêu chuẩn thống kê:
qst t
Ta thấy do đó chưa bác bỏ được giả thuyết H0. Ta thấy do đó chưa bác bỏ được giả thuyết H0.
v1.0012107210
19
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
0
H : 0 H : 1 1
0 0
Bài toán 2:
; ;
) )
n 1 ( W (t
Miền bác bỏ:
0
0
Bài toán 3:
H : 0 H : H : 1
W (-
; -t
n 1 1 )
Tương tự ta có miền bác bỏ
n 1 t t
phân vị phân vị tìm từ bảng phân phối student. tìm từ bảng phân phối student.
v1.0012107210
20
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
Ví dụ:
ớ à ứ ờ ố ă ấ ă à í
Mức xăng hao phí cho một xe ôtô chạy trên đoạn đường AB ở năm trước là 50 lít. Năm nay do đoạn đường bị xuống cấp và mức xăng hao phí tăng lên. Điều tra 30 chuyến xe chạy trên đoạn đường AB ta ệ có số liệu sau:
Mức xăng hao phí 49-49,5 49,5-50 50-50,5 50,5-51 51-51,5
Số chuyến Số chuyến 5 5 7 7 10 10 6 6 2 2
g p p g p Với mức ý nghĩa 1% hãy kết luận về điều nghi ngờ trên. Biết rằng mức xăng hao phí là biến ngẫu nhiên có phân phối chuẩn.
v1.0012107210
21
2.1. KIỂM ĐỊNH GIẢ THUYẾT KỲ VỌNG (tiếp theo)
50
50
H : 0 H : 1
Giải: Gọi X là mức xăng hao phí, X ~ N(μ,σ2) Ta kiểm định Ta kiểm định
2,46. tra bảng phân phối student ta có 29 t 0,01
2 , x 50,133; s'
;
, 0,339; s' 0,583.
;
,
Với mẫu cụ thể đã cho, tính toán ta được: ể ẫ
t
30
1,254
qs
50,133 50 0,538
Giá trị của tiêu chuẩn thống kê:
qst W
Ta thấy do đó chưa có cơ sở để bác bỏ giả thuyết H0.
v1.0012107210
22
2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI
2 2
.
H : H : 0
2 2 0
2
*2
2
2
Cho biến ngẫu nhiên X ~ N(μ,σ2). Giả thuyết Cho biến ngẫu nhiên X ~ N(μ σ2) Giả thuyết Trường hợp kỳ vọng µ đã biết
S
(X
)
i
1 n
nS *
2 0
Xét thông kê , trong đó
Khi đó có phân phối khi bình phương với n bậc tự do. *2
.
2 qs
ns 2 0
2
2 0
Với mẫu cụ thể ta có :
H : Bài toán 1: 0 2 2 H : H : 0 1 0
Mức ý nghĩa cho trước ta có miền bác bỏ:
)
;
)
W (0;
(
/ 2,n
2 1- /2,n
2
2 2
2 2 0
Miền bác bỏ:
W (
;
)
,n
2
2
2 0
2
2 0
Bài toán 2:
Miền bác bỏ:
)
W (0;
,n
2 1
2
23
2 0
H : 0 H : 1 H : 0 H : 1
v1.0012107210
Bài toán 3:
2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI (tiếp theo)
'2
2
~ (n 1)
2
(n 1)S
2 0 0
'2
Với mẫu cụ thể giá trị của tiêu chuẩn thống kê là:
2 qs
(n 1)s
2 2 0
2
Trường hợp kỳ vọng µ chưa biết Trường hợp kỳ vọng µ chưa biết Ta có thống kê:
2 0
2 2
2 2 0
Miền bác bỏ:
)
;
(
)
2 1- /2,n-1
2
/ 2,n 1
2
Bài toán 1
0
2 0
2
H : 0 H H : 1 W (0; H : H : H : Miền bác bỏ:
) )
,n-1 n 1
2 0 1 ; ; ( W (
2
2
2 0
Bài toán 2 Bài toán 2
2
2 0
H : 0 H : H : 1
24
Miền bác bỏ:
)
W (0;
,n-1
2 1
v1.0012107210
Bài toán 3
2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI (tiếp theo)
Lấy ngẫu nhiên 20 chai nước do một máy đóng chai tự động đóng ta thu được độ lệch chuẩn mẫu là s 2 = 0,0153 (l2). Máy được gọi ta thu được độ lệch chuẩn mẫu là s’2 = 0 0153 (l2) Máy được gọi là đạt chuẩn nếu độ phân tán không sai khác 0,01(l2).
Với mức ý nghĩa 5% hãy kiểm định xem máy đóng chai có đạt Với mức ý nghĩa 5% hãy kiểm định xem máy đóng chai có đạt chuẩn hay không? Biết rằng thể tích nước trong chai là biến ngẫu nhiên có phân phối chuẩn.
25
v1.0012107210
Ví dụ: Ví d
2.2. KIỂM ĐỊNH GIẢ THUYẾT PHƯƠNG SAI (tiếp theo)
0, 01
2
Ta cần kiểm định
, 0, 01
2
H : 0 H : 1 1 Mức ý nghĩa =0,05
32, 9, 32 9
8, 91. 8 91
Tra bảng phân phối khi bình phương ta có: T bả ó
hối khi bì h hươ
hâ
t
2 2 0,025,19
2 2 0,975,19
W (0; 8,91)
(32,9;
).
Miền bác bỏ:
2
2
29,07.
0,0153(l ). Ta có: do đó giá trị tiêu chuẩn thống kê: ị
s ' g
g
qs qs
(19 1)0,0153 0,01 0 01
qs W. Kiểm tra ta thấy Vậy ta chưa có cơ sở bác bỏ giả thuyết H0 tức là máy đóng chai vẫn đạt chuẩn. tức là máy đóng chai vẫn đạt chuẩn.
26
v1.0012107210
Giải: Gọi X là thể tích nước trong chai ta có X ~ N(μ σ2) N(μ,σ ) Giải: Gọi X là thể tích nước trong chai, ta có X
2.3. KIỂM ĐỊNH GIẢ THUYẾT CHO XÁC SUẤT (TỶ LỆ)
Cho biến ngẫu nhiên X~A(p). Với p chưa biết.
Lấy mẫu cỡ n từ biến ngẫu nhiên y, gọi m là số lần mẫu nhận giá trị 1.
Ta có T ó
iả th ết H
ất hiệ biế
ất
f f
là tần suất xuất hiện biến cố 1. Ta đưa ra giả thuyết H0: p = p0 . là tầ ố 1 T đư
m m n
Xét thống kê Xét thống kê
, khi đó U ~ N(0;1). khi đó U ~ N(0;1)
U U
n n
(f p ) 0 0 p (1 p ) 0
0
ụ
g
g
ị
Với mẫu cụ thể ta có giá trị của thống kê U là: ups ps
0
0
Miền bác bỏ:
W (
; u
)
(u
;
)
/ / 2
/ / 2
1 1
0 0
H : p p H : p p H : p p
với
) 1
/ 2
/ 2
(u 0
0 0
0 0
Bài toán 1
Miền bác bỏ: Miề bá bỏ
với ới
), )
0 (u ) 1 ) 1 (
W (u ; (
1
0
H : p p H : p p
0 0
0 0
Bài toán 2 Bài t á 2
Miền bác bỏ: Miền bác bỏ:
W ( W (
; u ). ; u )
1
0
H : p p p p H : p p
27
v1.0012107210
Bài toán 3 Bài toán 3
2.3. KIỂM ĐỊNH GIẢ THUYẾT CHO XÁC SUẤT (TỶ LỆ) (tiếp theo)
Những năm trước nhà máy áp dụng công nghệ A sản xuất cho tỷ lệ phế phẩm là 6%. Năm nay người ta nhập công nghệ B để sản xuất, lấy ngẫu nhiên 100 sản phẩm thấy có 5 phế phẩm.
Có thể cho rằng tỷ lệ phế phẩm của công nghệ B nhỏ hơn công Có thể cho rằng tỷ lệ phế phẩm của công nghệ B nhỏ hơn công nghệ A hay không? Hãy kết luận với mức ý nghĩa 5%.
28
v1.0012107210
Ví dụ:
2.3. KIỂM ĐỊNH GIẢ THUYẾT CHO XÁC SUẤT (TỶ LỆ) (tiếp theo)
Gọi p là tỷ lệ phế phẩm của công nghệ B.
0
Ta cần kiểm định
1
H : p 0,06 H : p 0,06
mức ý nghĩa = 0,05, tra bảng phân phối chuẩn ta có u0,05 = 1,65 Ta có miền bác bỏ: W (- ; -1,65). Ta có n =100; m = 5, do đó f = m/n = 0,05. Tính giá trị tiêu chuẩn thống kê ta thu được:
(0,05 0,06) (0 05 0 06)
u
100
0, 42.
qs
0,06(1 0,06)
W. W.
Kiểm tra ta thấy Vậy chấp nhận giả thuyết H0. Kiểm tra ta thấy Vậy chấp nhận giả thuyết H0.
qsu u
29
v1.0012107210
Giải:Giải:
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG
2) ; Y ~ N(μ2,σ2 hiê (X X
2) X ) hậ
iá t ị (
ẫ
.
Cho hai biến ngẫu nhiên độc lập X ~ N(μ1,σ1 Mẫu ngẫu nhiên (X1,X2,…Xn) nhận giá trị (x1,x2,…,xn) ) Mẫ Mẫu ngẫu nhiên (Y1,Y2,…Ym) nhận giá trị (y1,y2,…,ym). Ta cần kiểm định giả thuyết: Ta cần kiểm định giả thuyết: H : 1
H : 0
2
30
v1.0012107210
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo)
(X
Y)
)
(
2
Ta có thống kê
có phân phối chuẩn N(0,1)
U
1 2 2 2 2 1 2 n m
(X Y) (X Y)
Nế
U U
.
• Nếu giả thuyết H0 là đúng khi đó khi đó iả th ết H là đú
2 2 1 2 n m
(x
y)
.
u
• Với mẫu cụ thể giá trị của tiêu chuẩn thống kê là qs
2 2 1 2 n m
Trường hợp đã biết: g ợp
Bài toán 3:
Bài toán 2:
Bài toán 1:
1
2
1
2
1
2
1
2
1
2
1
2
H : 0 H : H 1 Miền bác bỏ:
u u
; ;
/ 2
/ 2
W= W
H : 0 H H : 1 Miền bác bỏ: W= - ; u W= ; u
H : 0 H H : 1 Miền bác bỏ: W= u ; W
; u
31
v1.0012107210
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo)
Hai trường A và B cùng học môn toán, khảo sát kết quả thi hết Hai trường A và B cùng học môn toán khảo sát kết quả thi hết môn ta thu được kết quả sau: Trường A: n = 64; Trường B: m = 68;
ằ
ể
ẫ
Biết rằng điểm thi của hai trường là biến ngẫu nhiên có phân phối chuẩn với độ lêch chuẩn tương ứng là σ1=1,09 và , σ2=1,12. σ2 Với mức ý nghĩa 1% có thể cho rằng kết quả thi của trường B cao hơn trường A hay không?
32
v1.0012107210
Ví dụ: í d
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo)
Hai trường A và B cùng học môn toán, khảo sát kết quả thi hết Hai trường A và B cùng học môn toán khảo sát kết quả thi hết môn ta thu được kết quả sau: Trường A: n = 64; Trường B: m = 68;
ằ
ể
ẫ
Biết rằng điểm thi của hai trường là biến ngẫu nhiên có phân phối chuẩn với độ lêch chuẩn tương ứng là σ1=1,09 và , σ2=1,12. σ2 Với mức ý nghĩa 1% có thể cho rằng kết quả thi của trường B cao hơn trường A hay không?
33
v1.0012107210
Ví dụ: í d
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo)
2
ị
2 ; 1 1 Ta cần kiểm định
2,33.
; 2,33)
W (
2 Với mức ý nghĩa đã cho, tra bảng phân phối chuẩn, ta có 0,01u Miền bác bỏ: Tính giá trị của tiêu chuẩn thống kê ta được kê t đượ Tí h iá t ị ủ tiê
h ẩ thố
7,32 7,66
u
31, 43
qs
2 2
2 2
1 09 1,09 64
1 12 1,12 68
q
W, W,
y vậy ta bác bỏ giả thuyết H0, kết quả thi ở ậy
0,
g qsu qsu trường B cao hơn trường A.
34
v1.0012107210
Giải: Gọi X và Y là kết quả thi của hai trường A và B, Giải: Gọi X và Y là kết quả thi của hai trường A và B 2 ); Y~N( ; ). X ~ N( 2 2 H : 1 0 32.7x H : 1 1 .66,7y
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo)
2
X Y
, 1 2 = σ2. Xét thống kê:
T
chưa biết
2 = σ2
nS mS nS mS
2 y n m 2
n m n m nm
2 x
khi đó T ~ T(n + m – 2). Với mẫu cụ thể, ta tính giá trị của tiêu chuẩn thống kê T: Với mẫu cụ thể ta tính giá trị của tiêu chuẩn thống kê T:
x
y
t
.
q qs
ns ms
2 2 y n m 2
n m nm
2 2 x
Trường hợp phương sai Giả sử rằng σ1
Bài toán 3:
Bài toán 2:
Bài toán 1:
1
2
1
2
1
2
1 1
2 2
1 1
2 2
1 1
2 2
t
;
;
W=
;
n m 2 / / 2
n m 2 / / 2
n m 2 / / 2
n m 2 t / / 2
H : 0 H : 1 1 Miền bác bỏ: W= - ; t
H : 0 H : 1 1 Miền bác bỏ: W= t
H : 0 H : 1 1 Miền bác bỏ:
35
v1.0012107210
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo)
Điều tra thu nhập (tính theo $) trong một tháng của công nhân ở hai nhà máy sản xuất thiết bị điện tử A và B ta thu được số liệu sau:
Nhà máy A: 91,5 94,18 92,18 95,39 91,79 89,07 94,72 89,21. Nhà máy B: 89,19 90,95 90,46 93,21 97,19 97,04 91,07 92,75.
Với mức ý nghĩa 5% có thể cho rằng thu nhập trung bình của công nhân Với mức ý nghĩa 5% có thể cho rằng thu nhập trung bình của công nhân trong hai nhà máy A và B là như nhau hay không? Biết rằng thu nhập của công nhân trong hai nhà máy có phân phối chuẩn.
36
v1.0012107210
Ví dụ: Ví dụ:
2.4. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI KỲ VỌNG (tiếp theo)
. Ta cần kiểm định:
X ~ N(
); N(
)
2 ; 1 1
; 1
2 2
1
H : 2 0 1 H : 2 2
x 92,255; s x 92 255; s
7,77. 7 77
4 998; y 92 733; s 4,998; y 92,733; s
2 x
2 y
Ta có n = 8; m = 8, Ta có n = 8; m = 8 Với mức ý nghĩa α=0,05 tra bảng phân phối Student ta được:
t t
2,14. 2 14
8 8 2 8 8 2 0,025
14 14 t t 0,025
(2,14;
W (
).
Ta có miền bác bỏ: ; -2,14) Với mẫu đã cho, tính toán ta được giá trị tiêu chuẩn thống kê:
92,255 92,733
t
0,353.
qst W,
qs
qs qs
8 4 998 8 7 77 8 8 8.4,998 8.7,77 8 8 8.8
8 8 2
Vậy chấp nhận H0, tức là công nhân hai nhà máy có thu nhập như nhau. Vậy chấp nhận H tức là công nhân hai nhà máy có thu nhập như nhau
37
v1.0012107210
Giải: Gọi X và Y là thu nhập của công nhân trong hai nhà máy A và B
2.5. KIỂM ĐỊNH GIẢ THUYẾT CHO 2 XÁC SUẤT
,
,
) (X , X ,..., X ) , ( n n 2 2
1 1
(Y , Y ,..., Y ) m
1
2
ẫ
ẫ
Cho hai biến ngẫu nhiên X ~ A(p1), Y ~ A(p2) Xét hai mẫu ngẫu nhiên rút từ X và Y tương ứng là: và Gọi k1 số lần mẫu ngẫu nhiên của X nhận giá trị 1 Gọi k2 số lần mẫu ngẫu nhiên của Y nhận giá trị 1
k k
1 1
2 2
1
2
Đặt Đặt
,
,
là các tần suất mẫu. là các tần suất mẫu
f f
f f
f f
1
2
k k n m
n
k k m
p2 và các đối thuyết Ta cần kiểm định giả thuyết H0: p1 = p2 và các đối thuyết Ta cần kiểm định giả thuyết H0: p1 p H : p 1 1
p ; H : p 1 1
p ; H : p 1 1
2
2
2
38
v1.0012107210
2.5. KIỂM ĐỊNH GIẢ THUYẾT CHO 2 XÁC SUẤT
f f 1
U
f(1 f)
Xét thống kê . Thống kê U có phân phối N(0,1)
f f 2 1 1 n m
Bài toán 1. , miền bác bỏ
Bài toán 2. , miền bác bỏ
Bài toán 3. , miền bác bỏ
39
v1.0012107210
2.5. KIỂM ĐỊNH GIẢ THUYẾT CHO 2 XÁC SUẤT (tiếp theo)
p
2
1900; k1
hiê
ù
ô
Vậy giá trị tiêu chuẩn thống kê: 0, 092
0,125
u
3, 48.
,
qs qs
0,111(1 0,111)
1 1900
1 2600
vậy miền bác bỏ là:
W,
W (- ; -1,65).
Với mức ý nghĩa 0 05 tra bảng ta được u Với mức ý nghĩa 0,05, tra bảng ta được u0,05 = 1,65, 1 65 qsu Ta bác bỏ giả thuyết H0, tức là tình trạng bỏ học ở vùng A là ít Ta bác bỏ giả thuyết H0, tức là tình trạng bỏ học ở vùng A là ít nghiêm trọng hơn vùng B.
40
v1.0012107210
Giải: Ví dụ: Gọi p1 và p2 là tỷ lệ học sinh bỏ học ở vùng nông thôn A và B. Điều tra hiện tượng học sinh bỏ học ở hai vùng nông thôn A và B Điều tra hiện tượng học sinh bỏ học ở hai vùng nông thôn A và B Ta cần kiểm định: Ta cần kiểm định: H H : p 0 1 ta thu được số liệu sau: H : p p 1 1 2 Vùng A. Điều tra 1900 em có 175 em bỏ học; 0,092. 175, tần suất f1 Ta có n Ta có n = 1900; k1 = 175, tần suất f1 = 0,092. Vùng B. Điều tra 2600 em có 325 em bỏ học; m = 2600; k2 = 325, tần suất f2 = 0,125. Có ý kiến cho rằng tình trạng học sinh bỏ học ở vùng nông thôn A f = 0,111. là ít là ít nghiêm trọng hơn vùng nông thôn B. thô B hơ t Với mức ý nghĩa 1% hãy kiểm định ý kiến đó?
2.6. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI PHƯƠNG SAI
2).
Cho hai biến ngẫu nhiên độc lập X ~ N(μ1,σ1
2) ; Y ~ N(μ2,σ2
Bài toán 1:
Mẫu ngẫu nhiên (X1,X2,…Xn) nhận giá trị (x1,x2,…,xn) Mẫu ngẫu nhiên (X1,X2, X ) nhận giá trị (x1,x2, ,x ) Miền bác bỏ:
Mẫu ngẫu nhiên (Y1,Y2,…Ym) nhận giá trị (y1,y2,…,ym).
Ta có giả thuyết H0: σ1= σ2.
Bài toán 2
Các đối thuyết:
.
1
; H : 1
1
2
2
2
; H : 1
Xét thống kê
, thống kê F có phân phối Fisher với n-1
F
H : 1 1 ' 2 2 S / Miền bác bỏ: 1 x 2 ' 2 S / 2 y
và m 1 bậc tự do. và m-1 bậc tự do.
.
Nếu giả thuyết H0 là đúng thì
Bài toán 3: F
Với mẫu cụ thể giá trị của thống kê F là: là
hể iá ị ủ
ới
ẫ
' 2 S x ' 2 S y y kê
f qs
hố Miền bác bỏ:
' 2s s x ' 2 s y
41
v1.0012107210
2.6. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI PHƯƠNG SAI (tiếp theo)
ể
ể
Hai máy A và B cùng gia công một loại chi tiết. Người ta muốn kiểm tra xem hai máy có độ chính xác của hai máy và để làm điều đó người ta tiến hành lấy mẫu và thu được kết quả sau:
Máy A: Má A
135 138 136 140 138 135 139 135 138 136 140 138 135 139
Máy B:
140 135 140 138 135 138 140
Với mức ý nghĩa 5% hãy kiểm tra xem hai máy có độ chính xác như nhau hay không? Biết kích thước chi tiết là biến ngẫu nhiên có phân phối chuẩn. nhiên có phân phối chuẩn.
42
v1.0012107210
Ví dụ:
2.6. KIỂM ĐỊNH GIẢ THUYẾT CHO HAI PHƯƠNG SAI (tiếp theo)
) )
X ~ N( X N( Y ~ N(
2 2 ; 1 1 2 ; ). 1 1
Ta cần kiểm định: Ta cần kiểm định:
2 2 2
2 1
2 2
H : H : 0 0 H : 1
Mức ý nghĩa là 5% và cỡ mẫu n = 7, m = 7, tra bảng phân phối F được
0,2; f
4,995.
f 0,975,6,6
0,025,6,6
1 0,2
W (0; 0,2)
(4,995;
).
3, 905; s
5
' 2 y
3, 905 / 5 3 905 / 5
0, 781 0 781
' 2 s x qsf f
Vậy chấp nhận giả thuyết H0, tức là độ chính xác hai
Vậy miền bác bỏ Với mẫu tính toán ta được: Giá trị tiêu chuẩn thống kê: Giá trị tiêu chuẩn thống kê: Ta thấy W. qsf y máy là như nhau.
43
v1.0012107210
Giải: Gọi X là kích thước chi tiết của máy A, Giải: Gọi X là kích thước chi tiết của máy A Y là kích thước chi tiết của máy B, 2 1 1
3. MỘT SỐ TIÊU CHUẨN KIỂM ĐỊNH PHI THAM SỐ
Kiểm định giả thuyết về phân phối
của biến ngẫu nhiên:
So sánh nhiều tỷ lệ:
Kiểm tra tính độc lập
X độc lập với Y
X không độc lập với Y
44
v1.0012107210
3.1. KIỂM ĐỊNH GIẢ THUYẾT PHÂN PHỐI CỦA BIẾN NGẪU NHIÊN
)
,...,
)
r , 1
, 2 1 F (x, ,..., 0 2 r các là các tham số của phân phối . á là á th ố ủ
hối
hâ
,...,
r
.
1...k 1 k
iS ; i S ; i
i
i
Cho biến ngẫu nhiên X có hàm phân phối F(x) Ta có bài toán kiểm định sau: H0 : X có phân phối F (x, 0 H1 : X không có phân phối T Trong đó đó , 2 1 Xét mẫu ngẫu nhiên (X1, X2,…Xn) với giá trị mẫu (x1,x2,…xn). Chia miền giá trị của X thành k miền không giao nhau Chia miền giá trị của X thành k miền không giao nhau Ký hiệu ni là số giá trị mẫu rơi vào khoảng (S1,S2…Sk), ni được gọi là tần số thực nghiệm. Nếu giả thuyết H0 là đúng thì khi đó X có phân phối xác định là F0 do đó ta tính được các xác suất: p Đặt Đặ
ố lý h ế
E
n .p ,(i 1,2...k),
P X S , i 1,2,..,k. Ei được gọi là tần số lý thuyết. E đ i là ầ
i
i
i
45
v1.0012107210
3.1. KIỂM ĐỊNH GIẢ THUYẾT PHÂN PHỐI CỦA BIẾN NGẪU NHIÊN (tiếp theo)
,...,
, 1 2
r
2 2
2
(n i
E ) E ) i
có phân phối khi bình phương với
k ( k
E
i 1
i
ó
W ( W (
;
) ),
,k-1
và so
2 qs
Trường hợp tham số đã biết:
Xét thống kê k-1 bậc tự do. 2 2 T Ta có miền bác bỏ: iề bá bỏ Với mẫu cụ thể ta tính giá trị của tiêu chuẩn thống kê sánh với miền bác bỏ sánh với miền bác bỏ. Ví dụ: Quan sát biến ngẫu nhiên X ta thu được số liệu mẫu sau:
Giá trị X Giá t ị X
0-1 0 1
1-3 1 3
3-6 3 6
6-7 6 7
7-10 7 10
Số lần
3
4
2
5
4
Với mức ý nghĩa 5% hãy kiểm định xem biến ngẫu nhiên X có phân phối đều trên [0; 10] hay không?
46
v1.0012107210
3.1. KIỂM ĐỊNH GIẢ THUYẾT PHÂN PHỐI CỦA BIẾN NGẪU NHIÊN (tiếp theo)
,...,
, 1 2
r
2
(n i
E )2 2 E ) i
k ( k
E
i 1
i
W ( W (
;
) ),
,k-1
2 2
2 qs
Giá trị X Giá t ị X
0-1 0 1
1-3 1 3
3-6 3 6
6-7 6 7
7-10 7 10
Số lần
3
4
2
5
4
47
v1.0012107210
3.1. KIỂM ĐỊNH GIẢ THUYẾT PHÂN PHỐI CỦA BIẾN NGẪU NHIÊN (tiếp theo)
,...,
2 2
2
, 1 2 H1: X không có phân phối đều trên [0; 10]. E ) E ) i
(n i
k ( k
E
i 1
i
ẫ
W ( W (
;
,k-1
Ta có các khoảng S1 = (0,1), n1 = 3; S2 = (1; 3), n2 = 4; S3 = (3; 6), n3 = 2; S4 = (6; 7), n4 = 5; S5 = ( 7-10), n5 = 4. 2 2 Cỡ Cỡ mẫu n = 18. 18 ) ), Các xác suất tương ứng:
1 /10; p 1 /10; p
2 qs 2 /10 1 / 5 2 /10 1 / 5.
P 1 X 3 P 1 X 3 3 /10.
2
4
3
5
0-1 0 1
Giá trị X Giá t ị X
7-10 7 10
6-7 6 7
3-6 3 6
1-3 1 3
5
4
18.3 /10 5, 4;
4 3 18.1 / 5 3,6; E
Số lần
2 3
2 18.1 /10 1, 8; E
18.3 /10 5, 4.
5
9, 488,
2 0,05,4
p p P 0 X 1 P 0 X 1 1 1 /10; p p 3 /10; p ợ Tương tự ta tính được g ự Các tần số lý thuyết: 18.1 /10 1, 8; E E 1 E 4 Tra bảng phân phối khi bình phương ta được: miền bác bỏ là miền bác bỏ là ) ). So sánh ta thấy do đó ta chưa bác bỏ giả thuyết H0.
48
W (9 488; W (9,488; 2 qs W,
v1.0012107210
Giải: Ta cần kiểm định H0: X có phân phối đều trên [0; 10], r
3.1. KIỂM ĐỊNH GIẢ THUYẾT PHÂN PHỐI CỦA BIẾN NGẪU NHIÊN (tiếp theo)
,...,
r
chưa biết
, Trường hợp các tham số 1 2 Ta cũng tiến hành các bước tương tự như trước nhưng các xác suất
sẽ phụ thuộc vào các tham số vì vậy ta thay các tham số bằng
i
P(X S ) i
bằng , thay σ2
, ta thay
x
, r 2
2 2; 1
.
ay
),
ố
ố
a
a
.
1 / x 1 / x
3s
x
p ố ũ
p các ước lượng điểm tương ứng. Ta cũng xét tiêu chuẩn thống kê như trong trường hợp trước nhưng lưu ý Ta cũng xét tiêu chuẩn thống kê như trong trường hợp trước nhưng lưu ý rằng tiêu chuẩn thông kê bây giờ có phân phối khi bình phương với k-r-1 bậc tự do. Phân phối chuẩn: Tham số bằng s’2. Phân phối Posson: Tham số λ (r = 1) được thay bằng x Phân phối Posson: Tham số λ (r = 1) được thay bằng x Phân phối nhị thức: Tham số p (r = 1) được thay bằng tần suất f = m/n. bằ g Phân phối mũ: Tham số λ (r = 1), thay tham số λ bằng ( Phân phối đều trên [a; b]: (r = 2). Tham số a được thay bằng Tham số b được thay bằng
, .
x
3s
49
v1.0012107210
3.1. KIỂM ĐỊNH GIẢ THUYẾT PHÂN PHỐI CỦA BIẾN NGẪU NHIÊN (tiếp theo)
Quan sát biến ngẫu nhiên X ta thu được giá trị mẫu như sau: Quan sát biến ngẫu nhiên X ta thu được giá trị mẫu như sau:
Giá trị X
1-3 3-5 5 -7 7-9 9-11
3 6 4 7 2
ni
Với mức ý nghĩa 5% có thể cho rằng biến ngẫu nhiên X có phân phối chuẩn hay không?
50
v1.0012107210
Ví dụ:
3.1. KIỂM ĐỊNH GIẢ THUYẾT PHÂN PHỐI CỦA BIẾN NGẪU NHIÊN (tiếp theo)
Giải: Ta cần kiểm định bài toán sau:
hố h ẩ
khô
(
H0: X có phân phối chuẩn N(μ,σ2) H1: X không có phân phối chuẩn N(μ,σ2) 2) ó hâ
4; 4;
(5; 7), n (5; 7) n 3
6; S 6; S 3
(9;
3; S 3; S 2
Ta có miền giá trị của X là R do đó ta phải gộp các khoảng lại Giá trị X ( S ( S 1 ni S 4
(7; 9), n 4 Với mẫu đã cho ta tính được:
ợ
6, 5 6,25.
Vậy
x 5,91;
2 s '
1-3 3-5 5 -7 7-9 9-11 ; 3), n ; 3) n (3; 5), n (3; 5) n 1 2 3 6 4 7 2 7; S 2. ), n 5 5 2 x 5,91; s ' 5,9 ; s 6,25.
2
Từ đó ta có các giá trị kì vọng sau:
E
3, 982; E
6, 05;
2 qs
1
2 2 (4 6,578) 6,578
;
,
; 3, 894;
,
E
2 6,578; E
3 3
4 4
3,9
E
1, 496
5
2 2 (3 3,982) 3,982 2 2 (7 3 894) (7 3,894) 3,894
2 2 (6 6,05) 6,05 2 2 (2 1 496) (2 1,496) 1,496
Mức ý nghĩa 5% và số tham số là r = 2, tra bảng ta được: Mức ý nghĩa 5% và số tham số là r = 2 tra bảng ta được:
2 0,052 5,99, 5 99
Vậy miền bác bỏ là W=(5,99; +∞). So sánh ta thấy chưa bác bỏ giả thuyết H0.
51
v1.0012107210
3.2. SO SÁNH NHIỀU TỶ LỆ
ấ
ứ
à
p
... p k
j j
2 p , i p i j
1
Giả sử k biến ngẫu nhiên (X1,X2…Xk) độc lập cùng phân phối 0-1 các xác suất tương ứng là (p1,p2…pk). H : p Ta kiểm định bài toán sau: 0 1 H : p H : p i
2
k
Xét mẫu n quan sát về biến ngẫu nhiên, ta có bảng số liệu mẫu: Trong đó: Trong đó:
v v
n n
i
n ; u n ; u si
s
si
…
…
X1
Xi
Xk
s 1
i 1
u1
n)
; vi là cỡ mẫu của biến
1
k
…
0 n11 E11 E
… n1i E1i E
n1k E1k E
u2
i
E
; s 1,2, i 1,2,..,k
2~ (k 1)
…
si
1 n21 E21
… n2i E2i
n2k E1k
... v (v v 2 ngẫu nhiên Xi u .v Đặt s n n
…
…
n
v1
vi
Vk
2
2
k
(n
2
E ) si
si
Ta viết giá trị Esi ngay cạnh giá trị của nsi trong bảng số liệu. trong bảng số liệu Thống kê:
E
s 1 i 1
si
52
W (
;
).
Với mức ý nghĩa tra bảng phân phối khi bình phương ta tìm được giá trị phân vị
, và tính được miền bác bỏ
,k-1
2
v1.0012107210
2 ,k 1
3.2. SO SÁNH NHIỀU TỶ LỆ (tiếp theo)
3
ả
à
1 ể
á
Có ba nhà máy cùng sản xuất một loại sản phẩm, người ta tiến hành kiểm tra sản phẩm của ba nhà máy thu được số liệu sau: p
à p
Ví dụ:
3
1
j Nhà máy B
Nhà máy C
ẩ ủ H : p 0 1 H : p Nhà máy A i 12
15,77 18
13,14 16
17,09
46
304
88
Phế phẩm Chính phẩm
2
2
88 86, 86 88 86 86
112 112,91 2 350 350 104 104, 23 104 104 23
130 130 16 15, 77 16 15 77
C
2 p , i Chất lượng Nhà máy j Với số liệu đã cho tính toán ta được các Esi được ghi trong bảng. Ta có: 86,86 104 104,23 2 120 120 12 13,14 12 13 14
100 100
2 qs
13,14
86, 86
15, 77
104, 23
2
2
p
112 112, 91 112 112 91
0,174
g ỷ ệ p
ý g Với mức ý nghĩa 5% có thể cho rằng tỷ lệ phế phẩm của ba nhà 18 17, 09 18 17 09 máy là như nhau hay không?
17, 09
, 5, 99, ,
2 0,05,2 0 05 2
112, 91 Mức ý nghĩa 5% , k = 3, tra bảng ta thu được: và tính được miền bác bỏ W=(5,99; +∞) 2 So sánh ta thấy do đó chấp nhận giả thuyết H0. qs W,
53
v1.0012107210
Giải: Gọi p1,p2,p3 là tỷ lệ phế phẩm của ba nhà máy A, B, C. 2 ố ệ Ta cần kiểm định:
3.3. KIỂM TRA TÍNH ĐỘC LẬP
Cho hai biến ngẫu nhiên X và Y với giả thiết: Cho hai biến ngẫu nhiên X và Y với giả thiết:
…
y1
… yj
ys
yj xi
x1
n11
… n1j
… n1s
b1
H0: X độc lập với Y. H1: X không độc lập với Y. H1: X không độc lập với Y. Xét một mẫu ngẫu nhiên hai chiều
(X , Y ),(X , Y ),...,(X , Y ) n n 2 2
n n
2 2
1 1
1 1
(E11) (E11)
(E1j) (E1j)
(E1s) (E1s)
rút ra từ véc tơ ngẫu nhiên (X, Y),
…
…
giá trị mẫu
(x , y ), (x , y ),...., (x , y ) 2 n
n
2
1
Thu gọn giá trị mẫu ta có bảng
1 ẫ
…
ni1
xi
… nij
nis
bi
biểu diễn sau:
(Ei1) (E )
(Eij) (E )
(Eis) (E )
…
…
Trong đó nij là số lần cặp giá trị Trong đó n là số lần cặp giá trị (xi,yj) xuất hiện trong giá trị mẫu,
s
r
xr x
… nrs n 1 … n j … n nr1
… nrj
br b
b b
n , j 1,2,..., s;
j 1 2
n ,i 1,2,..,r i 1 2
j
ij
a i
ij
i 1
j 1
j
(Er1)
(Ers)
Đặt
, ta viết giá trị của
E ij ij
a .b i n
…
a1
(Erj) … aj
as
n 54
Eij vào trong ngoặc bên cạnh của ô (i;j).
v1.0012107210
3.3. KIỂM TRA TÍNH ĐỘC LẬP (tiếp theo)
2
r
s
(n ij
E ) ij
2
Thống kê
x
2~ x ((r 1).(s 1))
1 n n
E E
i 1 j 1 i 1 j 1
ij
Miền bác bỏ là:
;
).
W (x
,(r-1)(s-1)
2
Tình trạng hôn
Chưa kết hôn
Ly hôn
Goá
nhân vợ chồng
lần nào
Chưa kết hôn
180
34
36
250
lần nào
(129,61)
(66,42)
(53,97)
Ly hôn Ly hôn
58 58
76 76
54 54
188 188
hĩ 5% ó hể h
(97,47)
(49,95)
(40,58)
Goá
43
34
27
104
ộ ập
(53,92)
(27,63)
(22,45)
281
144
117
542
55
v1.0012107210
Ví dụ: Nghiên cứu tình trạng hôn nhân Nghiên cứu tình trạng hôn nhân trước ngày cưới của 542 cặp vợ chồng ta có bảng số liệu. Với mức ý nghĩa 5% có thể cho Với ứ ý rằng tình trạng hôn nhân của g ợ vợ và chồng là độc lập với nhau hay không?
3.3. KIỂM TRA TÍNH ĐỘC LẬP (tiếp theo)
2
s
r
E ) ij
(n ij
2
Thống kê
x
1 n n
i 1 j 1 i 1 j 1
2~ x ((r 1).(s 1)) Giải: H0: Tình trạng hôn nhân của chồng độc lập với vợ; E E ij
H1: Tình trạng hôn nhân của chồng không độc lập với vợ.
Miền bác bỏ là:
).
;
W (x
Tình trạng hôn
Chưa kết hôn
Ly hôn
Goá
2 ,(r-1)(s-1) Ta tính toán các Eij và viết vào á E T tí h t á à iết à bảng số liệu.
lần nào
Tiếp đó, ta tính giá trị tiêu chuẩn thống kê như sau:
nhân vợ chồng g
ị
,
p
Chưa kết hôn
180
34
36
250
2
2
lần nào
(129,61)
(66,42)
(53,97)
2 qs
Ly hôn Ly hôn
58 58
76 76
54 54
188 188
hĩ 5% ó hể h
(97,47)
(49,95)
2
2
2
Goá
34
104
(40,58) Ta có s = r = 3 và miền bác bỏ: 43 27 W (9,48; + ) W (9 48; + ) (53,92)
(22,45)
2
2
80.
(27,63) 2 qs W So sánh, ta thấy 144
542
(34 66.42) 66.42 (34 27.63) ộ ập 27.63 (27 22.45) 22.45
281 117 Do đó ta bác bỏ giả thuyết H0. Do đó ta bác bỏ giả thuyết H
56
v1.0012107210
Ví dụ: g Nghiên cứu tình trạng hôn nhân Nghiên cứu tình trạng hôn nhân trước ngày cưới của 542 cặp vợ (58 97.47) (180 129.61) chồng ta có bảng số liệu. 129.61 97.47 Với mức ý nghĩa 5% có thể cho Với ứ ý 2 2 (43 53.92) rằng tình trạng hôn nhân của 53.92 (76 49.95) (36 53.97) g ợ vợ và chồng là độc lập với nhau 53.97 49.95 hay không? (54 40.58) 40.58
TÓM TẮT CUỐI BÀI
thuyết thống kê.
• Kiểm định tham số và các bài toán kiểm định tham số. • Kiểm định phi tham số và các bài toán kiểm định phi tham số. ố đị h hi th
ố à á bài t á kiể
đị h hi th
Kiể
Các nội dung chính: • Khái niệm kiểm định giả thuyết thống kê và phương pháp kiểm định giả
trong các nghiên cứu xã hội học khác.
• Có thể kết hợp các bài toán về Ước lượng và các bài toán về kiểm định giả
thuyết thống kê. Đây là hai bài rất quan trọng.
57
v1.0012107210
Lưu ý: Lưu ý: • Đây là một kỹ thuật được dùng rất phổ biến trong thống kê cũng như
PROPERTIES Allow user to leave interaction: Show ‘Next Slide’ Button: Completion Button Label:
Anytime Don't show Next Slide

