PHẠM XUÂN ðỒNG TÓM TẮT
BÀI GIẢNG TOÁN V XÁC SUẤT THỐNG KÊ Hà Nội, 2011−−−− 2012
1
MỤC LỤC
Trang
$1. KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT
3
$2. CÁC ðỊNH LÝ VỀ PHÉP TOÁN XÁC SUẤT
9
$3. BIẾN NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT
13
$4. BIẾN NGẪU NHIÊN HAI CHIỀU VÀ PHÂN PHỐI XÁC SUẤT ðỒNG
17
THỜI
$5. KỲ VỌNG VÀ PHƯƠNG SAI
21
$6. COVARIANCE VÀ HỆ SỐ TƯƠNG QUAN
25
NỘI DUNG KIỂM TRA GIỮA KỲ
$7. MỘT SỐ PHÂN PHỐI XÁC SUẤT THƯỜNG GẶP
29
$8. MẪU NGẪU NHIÊN VÀ PHÂN PHỐI MẪU CỦA CÁC THỐNG KÊ
33
THƯỜNG GẶP
$9. BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH
37
$10. BÀI TOÁN ƯỚC LƯỢNG TỶ LỆ
41
$11. KIỂM ðỊNH GIẢ THUYẾT VỀ TRUNG BÌNH
45
$12. KIỂM ðỊNH GIẢ THUYẾT VỀ TỶ LỆ
51
$13. HỒI QUY TUYẾN TÍNH ðƠN
55
58
$14. KHOẢNG TIN CẬY VÀ KIỂM ðỊNH GIẢ THIẾT CÁC HỆ SỐ ðƯỜNG
HỒI QUY – BÀI TOÁN DỰ ðOÁN
$15. TỔNG KẾT VÀ CÁC BÀI TẬP TỔNG HỢP
63
BÀI TẬP THEO 14 MỤC CHƯƠNG TRÌNH MÔN TOÁN V (XSTK)
$16.
67
PHỤ LỤC 1: TÍNH BẰNG MÁY TÍNH CASIO
$17.
68
PHỤ LỤC 2: BẢNG TRA THƯỜNG SỬ DỤNG.
$18.
69
2
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$1. KHÁI NIỆM CƠ BẢN VỀ XÁC SUẤT
PHẠM XUÂN ðỒNG
MỞ ðẦU
Thống kê là khoa học và cách thức quen thuộc ñể trình bày sự hiểu biết của con người bằng dữ liệu thực nghiệm. Trong lý thuyết thống kê, tính ngẫu nhiên và sự không chắc chắn ñược lấy từ các mô hình của lý thuyết xác suất. Vì mục ñích của khoa học thống kê là ñể tìm ra thông tin "ñúng nhất" theo dữ liệu có sẵn nên có thể thấy thống kê ñược ứng dụng thực tế rất rộng trong nhiều lĩnh vực xã hội, sản suất,…
Giáo trình “Xác suất và Thống kê dành cho kỹ sư và các nhà khoa học” của nhóm tác giả Ronal, Raymond, Sharon trình bày các ñặc tính của lý thuyết thống kê và phân tích dữ liệu trên nền tảng những vấn ñề cơ bản của xác suất và các phân phối xác suất, ñể dẫn ñến những kết luận về thống kê. Những yếu tố xác suất cho phép chúng ta xác ñịnh ñược sự “tin cậy” trong những kết luận của mình. ðó cũng là lý do học xác suất trước khi học thống kê suy luận. Sử dụng các phương pháp thống kê ñòi hỏi phải thu thập dữ liệu như là “nguồn vật liệu” ban ñầu. Tuy nhiên từ ñó ñể ñưa ra những kết luận còn có một khoảng cách khá lớn. Chính vì thế, thống kê suy luận tạo ra những công cụ phân tích, vượt qua khỏi việc chỉ ñưa thông tin mô tả về dữ liệu, ñã rút ra các kết luận hoặc các suy luận về hệ thống sinh ra dữ liệu ñó. Từ ñó mới có thể hiểu ñược bản chất của dữ liệu, ước lượng và dự ñoán dữ liệu có thể sinh ra. 1.1 PHÉP THỬ NGẪU NHIÊN, KHÔNG GIAN MẪU, BIẾN CỐ. I. PHÉP THỬ NGẪU NHIÊN, KHÔNG GIAN MẪU. + Phép thử ngẫu nhiên là một quá trình sinh ra một tập dữ liệu mà không thể dự báo trước ñược sự xẩy ra của mỗi dữ liệu (mặc dù có thể biết toàn bộ tập dữ liệu ñó). + Tập hợp tất cả kết quả có thể của một phép thử ñược gọi là không gian mẫu, ký hiệu S hoặc Ω. + Mỗi kết quả trong không gian mẫu gọi là một phần tử của không gian mẫu, hoặc là một ñiểm mẫu. + Mô tả không gian mẫu bằng liệt kê (nếu hữu hạn phần tử) hoặc bằng một mệnh ñề, quy tắc (nếu có thuộc tính chung hoặc vô hạn). Có thể dùng sơ ñồ cây liệt kê những phần tử của không gian mẫu ñể có nhiều thông tin hơn. Ví dụ 1 Tìm không gian mẫu S của phép thử là tung một ñồng xu. Giải: Những kết quả không gian mẫu là S = {ngửa, sấp} Ví dụ 2 Tìm không gian mẫu của phép thử là tung một xúc xắc. Giải: Nếu ta quan tâm ñến số chấm xuất hiện của mặt trên, không gian mẫu là S1 = {1, 2, 3, 4, 5, 6} Nếu ta chỉ quan tâm tới số chấm xuất hiện chẵn hoặc lẻ, không gian mẫu ñơn giản là S2 = {chẵn, lẻ}.
3
Ví dụ 3 Tìm không gian mẫu của một phép thử là tung một ñồng xu. Nếu xuất hiện mặt sấp thì tung nó lần thứ hai, còn xuất hiện mặt ngửa, thì tung một con xúc xắc lên. Giải: Không gian mẫu liệt kê theo sơ ñồ cây như sau: Ω = {SS, SN, N1, N2, N3, N4, N5, N6} Ví dụ 4 Một lô hàng có 6 sản phẩm, trong ñó có 2 phế phẩm. Lấy ngẫu nhiên lần lượt 3 sản phẩm. Tìm không gian mẫu của phép thử. Giải: Cách 1: Gọi T = ”thành phẩm” , X = ”phế phẩm”. không gian mẫu là: S1 = {TTT, TTX, TXX} (quan tâm ñến kết quả cuối cùng, không xét quá trình lấy: 3 ñiểm mẫu) Cách 2: Gọi Ti = ”lần thứ i lấy ñược thành phẩm”, Xi = ” lần thứ i lấy ñược phế phẩm ” với i =1, 2, 3. Không gian mẫu: S2={T1T2T3, T1T2X3, T1X2T3, X1T2T3, T1X2X3, X1T2X3, X1X2T3} (quan tâm ñến quá trình nên xét ñến thứ tự xẩy ra kết quả: 7 ñiểm mẫu) Chú ý 1: Có nhiều hơn một không gian mẫu mô tả kết quả của một phép thử. ðiều mong muốn là sử dụng một không gian mẫu cho thông tin nhiều nhất. Cách tìm không gian mẫu: ðặt tên các loại phần tử có mặt hoặc các bước hình thành phép thử. Sau ñó mô tả ñiểm mẫu theo kết quả xẩy ra trong phép thử. II. BIẾN CỐ + Biến cố là một tập con của không gian mẫu. + Dùng A, B, C, A1 , A2,… ñể ký hiệu cho biến cố. + Một tập con của S không chứa bất kỳ một phần tử nào gọi là biến cố không thể, ký hiệu ∅. + Tập hợp là toàn bộ không gian mẫu S gọi là biến cố chắc chắc. 1.2 PHÉP TOÁN VÀ QUAN HỆ CÁC BIẾN CỐ
Phép toán các biến cố giúp ta nhận ñược thông tin về biến cố mới thông qua các biến cố trong một phép thử, tức là một biến cố phức hợp ñược biểu diễn qua các biến cố ñơn giản hơn, ñã có trong S.
Giả sử A và B là hai biến cố trong một phép thử, hay là tập con của không gian mẫu S.
1. Phần bù của một biến cố A trong S là tập con gồm tất cả những phần tử của S mà không nằm trong A. Ký hiệu phần bù của A là A hoặc A' .
2. Giao của hai biến cố A và B, ký hiệu A B∩ hoặc AB, là biến cố chứa tất cả những phần tử chung của A và B . (hay ñồng thời trong A và B)
3. Hợp của hai biến cố A và B, ký hiệu A B∪ hoặc A B+ , là biến cố chứa tất cả những phần tử mà thuộc A hoặc thuộc B hoặc thuộc cả hai. (hay ít nhất trong A hoặc B)
4. Hai biến cố A và B là xung khắc, hay rời nhau nếu A B∩ = ∅ , tức là A và B không có phần tử chung
Ví dụ 5 Cho không gian mẫu S ={1,2,3,4,5,6} và A ={2,4,6}, B ={4,5,6} là các tập con của S.
Tìm A , A∪B , A B∩ Chú ý 2: 1) Biểu ñồ Venn ñể mô tả các phép toán và quan hệ giữa 2 biến cố.
4
2) Hằng ñẳng thức:
∩ = , A S A
AA = ,
SAA =∪
∩ = , A ∩ ∅ = ∅ ,
, A A∩ = ∅
∪ = ∪ , A B B A
B C
A
( B C
A C
* A∪A=A, A∪S=S, A∪∅=A, A A A 3) Tính chất : * Giao hoán A B B * Kết hợp: (A∪B)∪C = A∪(B∪C), ( ) ( * Phân phối:
(
)
∩ = ∩ . A C A A B ) ) ∩ ∩ = ∩ ∩ . A A C ( ( (
B C )
)
)
(
A B ∩ ∪ = ∩ ∪ ∩ ,
A B ) ∪ ∩ = ∪ ∩ ∪
n
A
...
...
...
...
4) ðịnh lý De Morgan:
,
∪∪=∩∩
∩∩=∪∪
A n
A n
A n
A 1
A 1
A 1
A 1
BA ∪ (d)
BA ∪
Ví dụ 6 Dùng biểu ñồ Venn gạch chéo miền chứa biến cố (a) A B∩ (b) A B∩ (c)
Ví dụ 7 Dùng biểu ñồ Venn gạch chéo miền chứa biến cố
A B
C
A
B C
(a) (
)
(
)
∩ ∪ (b)
∩ ∪ (c) A B C
CBA ∪∪
∩ ∩ (d)
Ví dụ 8 Lấy ra 4 sản phẩm trong kho có nhiều phế phẩm. Hãy ñặt tên các ñiểm mẫu và biểu diễn các biến cố sau qua các ñiểm mẫu.
A = ”có nhiều nhất một phế phẩm”. B = ”có ít nhất 1 phế phẩm”.
Giải: Gọi biến cố
=iC ”có i phế phẩm trong 4 sản phẩm lấy ra” với i = 0, 1 , 2, 3, 4.
CA
C
C
C
C
Ta có:
,
∪=
=∪∪∪=
CB 1
0
4
3
2
0 C 1 Ví dụ 9 Hai xạ thủ BA, cùng bắn vào một mục tiêu mỗi người 1 viên ñạn. Hãy ñặt tên các ñiểm mẫu và biểu diễn các biến cố sau qua các ñiểm mẫu.
M = ”mục tiêu bắn trúng”, N = ”mục tiêu bắn trượt”, H = ”chỉ một viên bắn trúng”.
Giải: Gọi biến cố A = ”Xạ thủ A bắn trúng”, B = ”Xạ thủ B bắn trúng”.
AB
ABBAH
,
,
∪
∪
=∪=
∪
=
BABAN =∪=
=* iA
,
∪ = ∪ =
ABBABAM Ví dụ 10 Hai cầu thủ bóng rổ A, B mỗi người lần lượt ném 2 quả bóng vào rổ. Hãy ñặt tên các ñiểm mẫu và biểu diễn các biến cố sau qua các ñiểm mấu. X = ”số bóng trúng rổ của 2 cầu thủ bằng nhau”, Y = ”số bóng trúng rổ của 2 cầu thủ bằng 3” Giải: Cách 1: Gọi biến cố ”người B ném i quả * * BA 1 2
”người A ném i quả bóng trúng rổ”, * * BA 1 1
* * BA 2 2
* * BA 0 0
=* iB * BAY ∪ 2
* bóng trúng rổ” với i = 0,1,2 thì X 1 Cách 2: Gọi biến cố Ai = ”người A ném quả bóng thứ i trúng rổ”, Bi = ”người B ném quả bóng thứ i trúng rổ” với i = 1,2. X =
BBAA∪ 2 2
BBAA∪ 2 2
BBAA∪ 2
BBAA∪ 2
BBAA 2
2
2
1
1
1
1
1
1
2
1
1
1
1
BBAA∪ 2
1
1
2
Y =
BBAA 2
1
1
2
BBAA∪ 2 2
1
1
BBAA∪ 2 2
1
1
BBAA∪ 2 2
1
1
5
Ví dụ 11 Ba xạ thủ A, B, C cùng bắn vào một mục tiêu. Hãy ñặt tên các ñiểm mẫu và biểu diễn các biến cố sau : H = ”có ñúng hai xạ thủ bắn trúng” , T = ”ít nhất một xạ thủ bắn trúng” , D = ”cả ba xạ thủ bắn trượt”
,
,
)
CBAT ∪∪=
H
BCACBACAB
.
=
∪
∪
CBATD .==
(ðS: Chú ý 3: 1) Có nhiều cách chọn các ñiểm mẫu của phép thử như sau: + Chọn số viên trúng của từng người : Ai = ” có i viên bắn trúng” với i = 0, 1, 2. + Chọn lần bắn trúng của từng người : Ai = ” lần bắn thứ i trúng” với i = 1, 2. + Chọn thuộc tính bắn trúng, trượt chung của hai người :
BABABAAB ,
BBAA ,
. , ,
, , + Chọn thuộc tính bắn trúng, trượt của từng người :
và suy ra thuộc tính bắn trượt BA,
+ Chọn thuộc tính bắn trúng của từng người : BA, 2) Khi phép thử có nhiều bước thực hiện thì dùng sơ ñồ cây sẽ cho ñiểm mẫu nhiều thông tin hơn thì mô tả biến cố mới sẽ ñơn giản hơn, nhưng cũng có thể dài hơn. 1.3 ðẾM CÁC ðIỂM MẪU I. QUY TẮC NHÂN:
Nếu một công việc chia ra k giai ñoạn, giai ñoạn 1 có n1 cách , giai ñoạn 2 có n2 cách ,...,
giai ñoạn k có nk cách thực hiện, thì có n1n2…nk cách thực hiện xong công việc. II. QUY TẮC CỘNG:
,310
301
,202
,211
220
Nếu một công việc ñược chia ra k trường hợp ñể thực hiện, trường hợp 1 có n1 cách, trường hợp 2 có n2 cách ,..., trường hợp k có nk cách thực hiện và không có bất kỳ một cách thực hiện nào ở trường hợp này lại trùng với cách thực hiện ở trường hợp khác, thì có n1 + n2 +…+ nk cách thực hiện xong công việc. Ví dụ 12 Một thiết bị ñược tạo bởi 2 bộ phận. Bộ phận 1 có 3 loại, bộ phận 2 có 5 loại. Hỏi thiết bị trên có bao nhiêu loại. (ðS: 15) Ví dụ 13 Có bao nhiêu số có 3 chữ số có tổng bằng 4.
.
4=a 2=a
: có 2 số : có 4 số 103, 112, 121, 130. Vậy có 1+2+3+4=10 số.
3=a 1=a
: có 1 số 400 . : có 3 số
Giải: Số cần tìm là abc + Nếu + Nếu . + Nếu + Nếu III. HOÁN VỊ
1.2)...1
n . !
nn .(
Ta thường quan tâm ñến không gian mẫu mà các phần tử là tất cả những cách sắp thứ tự hoặc chỉ sắp xếp của một nhóm ñối tượng. Những sắp xếp khác nhau ñược gọi là các hoán vị. Những hoán vị xuất hiện khi sắp xếp các phần tử theo một vòng tròn ñược gọi là những hoán vị vòng quanh. Hai hoán vị vòng quanh ñược coi là khác nhau nếu các phần tử ñứng trước hoặc ñứng sau một phần tử trong hai cách sắp xếp theo chiều kim ñồng hồ là khác nhau. 1. ðịnh nghĩa: Một hoán vị là một sắp xếp toàn bộ hoặc một bộ phận của một tập phần tử. 2. ðịnh lý 1.1 : (a) Số những hoán vị của n phần tử phân biệt là .
=
−
=
Pn
(b) Số những hoán vị của k phần tử phân biệt trong n phần tử (gọi là chỉnh hợp chập k của n) là
.
.
n
nn .(
1 )....(
)1
=
−
k +−
=
Ak n
n
)!
(
n ! k −
6
)!1
( −n
(c) Số những hoán vị của n phần tử phân biệt ñược sắp xếp theo một vòng tròn là
(d) Số những hoán vị phân biệt của n phần tử mà trong ñó n1 phần tử thuộc kiểu thứ nhất, n2
.
phần tử thuộc kiểu thứ hai, ... , nk phần tử thuộc kiểu thứ k là .
n ! ⋯ !
!
kn
nn ! 1
2
Ví dụ 14 Có 5 người xin làm 2 việc A, B. Hỏi có bao nhiêu cách xếp mỗi người một việc? (ðS:
20
)
2 5 =A
Ví dụ 15 Có bao nhiêu xếp sắp 4 người vào một bàn ăn có 4 chỗ ngồi? (ðS: 4!) Ví dụ 16 Có bao nhiêu cách sắp khác nhau ñể tạo thành một xâu ñèn của cây thông Noel có 3 bóng ñèn ñỏ, 4 bóng ñèn vàng, và 2 bóng ñèn xanh vào 9 ñui ñèn? (ðS:
)!2!4!3/(!9
1260
)
=
IV. PHÂN HOẠCH
Ta thường quan tâm ñến số cách phân hoạch một tập gồm n phần tử thành r tập con (nhóm) ñược gọi là các ngăn. Một phân hoạch ñược hoàn thành khi giao của mọi cặp trong r tập con là tập rỗng ∅ và hợp của tất cả những tập con là tập ban ñầu. Thứ tự của các phần tử bên trong một ngăn là không quan trọng. Nếu ta quan tâm ñến số cách chọn k phần tử từ n phần tử mà không quan tâm ñến thứ tự, gọi là các tổ hợp. Một tổ hợp thực chất là một phân hoạch có hai ngăn, một ngăn chứa k phần tử ñược chọn còn ngăn kia chứa (n − k) phần tử còn lại. ðịnh lý 1.2: (a) Số cách phân hoạch một tập gồm n phần tử thành r ngăn mà có n1 phần tử trong ngăn thứ nhất, n2 phần tử trong ngăn thứ hai,..., là
,...,
n r
.
+
... + +
= . n
C
=
=
n r
n , trong ñó 1
n 2
n n 1 2, n
n ! ⋯ !
!
n r
n n ! 1 2
(b) Số các tổ hợp ñược tạo ra khi lấy k phần tử cùng một lúc từ n phần tử phân biệt là
.
.
=
k C n
!(
)!
n ! k n k −
Ví dụ 17 Có bao nhiêu ñường chéo trong thập giác lồi ? (ðS:
10
45
10
35
)
=
−
=
2 −C 10
C
CCC .
1260
)
.
=
=
Ví dụ 18 Một ñồn có 9 người, bố trí 2 người trực, 3 người chốt ở ñiểm A, 4 người chốt ở ñiểm 4,3,2 B. Hỏi có bao nhiêu cách phân công. (ðS: 9
2 9
4 4
3 7
1.4. XÁC SUẤT CỦA MỘT BIẾN CỐ.
Ta chỉ xét những phép thử mà không gian mẫu có hữu hạn phần tử. ðối với mọi ñiểm trong không gian mẫu, ta gán một xác suất sao cho tổng tất cả các xác suất bằng 1. ðể tìm xác suất của một biến cố A, ta lấy tổng tất cả những xác suất ñược gán cho các ñiểm mẫu trong A. Tổng này ñược gọi là xác suất của A và ký hiệu là P(A). 1. ðịnh nghĩa: Xác suất của một biến cố A là tổng của khối lượng của toàn bộ ñiểm mẫu trong A.
Bởi vậy: 0 ≤ P(A) ≤ 1, P(∅) = 0, P(S) = 1.
7
Ví dụ 19 Một con súc sắc ñược ñổ chì sao cho khả năng xuất hiện một chấm chẵn gấp 2 lần khả năng xuất hiện một chấm lẻ. Nếu E là biến cố số chấm nhỏ hơn 4 xuất hiện trong một lần tung xúc xắc, hãy tìm P(E)? Giải: Không gian mẫu là S = {1, 2, 3, 4, 5, 6}. Ta gán một xác suất w cho mỗi số chấm lẻ và một xác suất 2w cho mỗi số chấm chẵn. Do tổng của các xác suất phải bằng 1, ta có 9w = 1 hay w = 1/9. Từ ñó, các xác suất 1/9 và 2/9 ñược gán cho mỗi số chấm chẵn và lẻ tương ứng.
(
)
.
Do ñó: E = {1, 2, 3} và
1 =++=EP 9
2 9
1 9
4 9
Ví dụ 20 Trong Ví dụ 20 cho A là biến cố ñể xuất hiện số chấm chẵn và cho B là biến cố ñể xuất hiện số chấm chia hết cho 3. Hãy tìm P(A∪B) và P(AB). Giải: ðối với các biến cố A = {2, 4, 6} và B = {3, 6}, ta có
A∪B = {2, 3, 4, 6} và AB = {6}.
Bằng cách gán xác suất 1/9 cho mỗi số chấm lẻ và 2/9 cho mỗi số chấm chẵn, ta có
(
)
)
(
và
.
=ABP
2 =+++=∪ BAP 9
2 9
2 9
1 9
7 9
2 9
2. ðịnh lý 1.3 Nếu một phép thử có thể dẫn ñến bất kỳ một trong N kết quả phân biệt ñồng khả năng, và trong ñó có ñúng n kết quả thuận lợi cho biến cố A, thì xác suất của biến cố A là
AP (
=)
.
.
n N
Ví dụ 21 Trong tay cầm 5 cây bài, hãy tìm xác suất ñể trong ñó có 2 cây Át và 3 cây J. (ðS:9,23.10-6)
Ví dụ 22 Xếp ngẫu nhiên 5 người vào 5 chỗ. Tính xác suất ñể hai người A, B ngồi cạnh nhau (a) trong một bàn dài. (b) trong một bàn tròn. (ðS: (a): 0,4 (b): 0,5) Giải: (a) Gọi X = ”A,B ngồi cạnh nhau trong một bàn dài”. Số ñiểm mẫu xếp 5 người vào 5 chỗ là: N = 5!=120. Xếp 5 người có A,B ngồi cạnh nhau qua 2 bước: + Coi A,B cạnh nhau là chỗ kép thì xếp 5 người có 4! cách. + Xếp A,B trong chỗ kép có 2! cách. Số ñiểm mẫu thuận lợi cho X là: nX = 4!.2!=48. nên P(X) = 48/120 = 0,4. (b) Y = ”A,B ngồi cạnh nhau trong một bàn tròn”. Số trường hợp có thể xếp 5 người vào 5 chỗ là 5!=120. Xếp 5 người có A, B ngồi cạnh nhau qua 3 bước: + Xếp A có 5 cách. + Xếp B theo A có 2 cách + Xếp 3 người còn lại 3!=6 cách. Số ñiểm mẫu thuận lợi cho Y là: nY = 5.2.6=60 nên P(Y)=60/120=0,5.
Ví dụ 23 Một bình có 10 viên bi, trong ñó 6 bi ñỏ, 4 bi xanh. Lấy ngẫu nhiên 3 viên bi. Tính xác suất của biến cố: (a) A = ”Không có quá 1 viên bi xanh” , (b) B = ”Có ít nhất 1 xanh, 1 ñỏ”.
C
C
(b)
BP (
)
/)
8,0
ðS: (a)
AP ( )
/)
,0
6666
=
+
=
=
+
=
1 CC ( . 6
2 4
2 CC . 6
1 4
3 10
0 CC ( . 4
3 6
1 CC 4
2 6
3 10
8
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$2. CÁC ðỊNH LÝ VỀ PHÉP TOÁN XÁC SUẤT
PHẠM XUÂN ðỒNG
MỞ ðẦU Từ quan hệ giữa các biến cố qua các phép toán hợp, giao, phần bù, chúng ta tìm quy tắc tính xác suất của những biến cố phức hợp. ðiều này rất có ích, giúp cho chúng ta tính ñược xác suất của một biến cố chưa biết thông qua các biến cố ñã biết. 2.1 QUY TẮC CỘNG. 1. ðịnh lý 2.1 Nếu A và B là hai biến cố tùy ý thì
P A B
(
)
P A ( )
P B (
)
P AB (
)
+
=
+
−
. .
. .
Hệ quả 1 Nếu A và B là 2 biến cố xung khắc thì
P A B
(
)
P A ( )
P B (
)
+
=
+
.
...
)
)
)
... + +
... + +
+
+
=
.
Hệ qủa 2 Nếu A1, … An xung khắc với nhau thì . P A ( ) n
A n
P A ( 2
P A ( 1
P A ( 1
A 2
P S
( ) 1
)
)
)
)
... + +
... + +
=
+
=
Hệ quả 3 Nếu A1, … An là một phân hoạch của không gian mẫu S, thì: . +
= .
P A ( n
A n
P A ( 1
A 2
P A ( 2
P A ( 1
P A B C
P ABC
P B (
P C (
)
(
)
)
)
P AC (
)
P BC (
)
(
)
+ +
−
+
=
+
−
−
+
2. ðịnh lý 2.2 Với 3 biến cố A, B, C ta có: . P AB P A ( ) (
. .
.
AP (
AP ) (
+
1) =
3. ðịnh lý 2.3 Nếu A và A là hai biến cố phần bù của nhau thì . Ví dụ 1 Trong kỳ thi 2 môn Toán và tiếng Anh, xác suất ñể Paula thi ñỗ môn toán là 2/3 và xác suất ñể cô ta thi ñỗ môn tiếng Anh là 4/9, xác xuất ñể thi ñỗ cả 2 môn là 1/4. Tính xác suất ñể Paula (a) thi ñỗ ít nhất một môn. (b) không ñỗ môn nào. (c) thi trượt ít nhất một môn. (d) thi ñỗ ñúng một môn. Giải: * Gọi tên biến cố ñã biết (hay các ñiểm mẫu): Gọi M = “thi ñỗ môn toán” , E = “thi ñỗ môn tiếng Anh”⇒ Biến cố ñỗ cả 2 môn là ME * Gọi tên biến cố cần tìm: A = “thi ñỗ ít nhất một môn” B = “không ñỗ môn nào” C = “thi trượt ít nhất một môn”. D = “thi ñỗ ñúng một môn”.
P
ME
MP (
)
EP (
)
(
)
,
,
=
=
=
* Xác ñịnh các xác suất ñã biết:
2 3
4 9
1 4
* Thiết lập phép toán giữa biến cố cần tìm với các biến cố ñã biết:
A M E
=
+
, D M E M E
= , C M E ME
=
=
+
=
+ , B M E A = * Áp dụng công thức tính xác suất :
P M E
P A ( )
(
)
(
(
)
P ME (
)
=
+
=
P M P E ) +
−
=
=
31 36
P C (
5 / 36
)
P ME (
4 + − 9 3 / 4
= −
2 3 =
,
P D⇒
PDP )
(
(
)
(
) 11 / 18
+
=
) 1 = và D, ME xung khắc nhau nên
P A P B ) 1 ( ( ) = − Do A D ME + = Chú ý 1:
1 4 AP ME ) ( = S = {ít nhất một} ∪ {không có}
9
2.2 XÁC SUẤT CÓ ðIỀU KIỆN.
Xác suất của biến cố B xẩy ra khi biết biến cố A nào ñó ñã xảy ra ñược gọi là xác suất có ñiều kiện , ký hiệu là P(B|A), thường ñược ñọc là “ xác suất ñể B xảy ra với ñiều kiện A ñã xảy ra” hoặc ñơn giản là “xác suất của B với ñiều kiện A”. 1. ðịnh nghĩa Xác suất có ñiều kiện của B với ñiều kiện A, ký hiệu P(B|A), ñược xác ñịnh như sau:
.
P B A ) |
(
nếu P(A) > 0 .
=
P AB ( ) P A ) (
BAP
AP ( )
)
(
)
(
|
=
=
hoặc
2. ðịnh nghĩa Hai biến cố A và B ñược gọi là ñộc lập với nhau khi và chỉ khi . Trong trường hợp ngược lại ta nói A và B phụ ABP BP | ) ( thuộc nhau.
ABP (
78,0
)
=
Ví dụ 2 Xác suất ñể một chuyến bay khởi hành ñúng giờ là P(A) = 0,83, xác suất ñể nó ñến ñúng giờ là P(B) = 0,82, xác suất ñể nó khởi hành và ñến ñều ñúng giờ là . Tính xác suất ñể một chiếc máy bay: (a) ñến ñúng giờ biết rằng nó ñã khởi hành ñúng giờ; (b) khởi hành ñúng giờ biết rằng nó ñã ñến ñúng giờ. (c) Xác suất ñể một máy bay ñến ñúng giờ, biết rằng nó ñã khởi hành không ñúng giờ Giải: (a) Xác suất ñể một máy bay ñến ñúng giờ biết rằng nó ñã khởi hành ñúng giờ là:
ABP ) |
(
94,0
=
=
=
ABP ( ) AP ) (
78,0 83,0
(b) Xác suất ñể một máy bay khởi hành ñúng giờ biết rằng nó ñã ñến ñúng giờ là:
BAP |
)
(
95,0
=
=
=
78,0 82,0
ABP ( ) BP ) ( (c) Xác suất ñể một máy bay ñến ñúng giờ, biết rằng nó ñã khởi hành không ñúng giờ là:
ABP | )
(
=
BAP ( ) AP ) (
AP
AB
Ta có:
1)(
AP (
83,01)
17,0
và (
AB )
(
)
(
)
−=
−=
=
+
=
A A B SB B =
= .
+
)
(
Vậy
nên
,0
235
=ABP |
=
BAP ( )
ABP ( )
BP )(
⇒ BAP (
82,0)
78,0
04,0
+
=
=
−
=
04,0 17,0
Chú ý 2:
BAP ( )
BP )(
ABP ) (
=
−
Ví dụ 3 Trong một thí nghiệm nhằm nghiên cứu mối liên hệ giữa bệnh cao huyết áp với thói quen hút thuốc lá, số liệu thu thập ñược từ 180 người như sau:
Nghiện thuốc
Không hút thuốc 21 48
Hút thuốc nhưng không nghiện 36 26
30 19
Huyết áp cao Bình thường Nếu chọn ngẫu nhiên một trong những người này, hãy tìm xác suất ñể người ñó bị cao
huyết áp, biết rằng người ñó nghiện thuốc; Giải: Gọi A = “huyết áp cao” , B = “nghiện thuốc” , C = “không hút thuốc”.
(
,0
4833
(
,0
2722
,
=AP )
=
=
=BP )
=
+ 30
+ 48
26
21
36
49 180
21 +
36 +
30 +
+
)
(
BAP |
(
)
nên
=ABP
=
=
+ 30 180
87 180 19 ABP ( ) BP ) (
30 49
10
ABP (
).
(
)
|
=
.
BPAP ).
ABP (
)
(
)
(
=
.
,...,
2.3 QUY TẮC NHÂN 1. ðịnh lý 2.4 Nếu trong một phép thử, các biến cố A và B có thể cùng xảy ra thì ABPAP ( ) 2. ðịnh lý 2.5 Hai biến cố A và B là ñộc lập với nhau khi và chỉ khi . 3. ðịnh lý 2.6 Nếu trong một phép thử, các biến cố
có thể xảy ra thì
AA , 1 2
...
(
)
).
(
|
)...
(
|
)
=
.
.
k
AAAP k 1
2
AAPAP ( 1
1
2
kA AAAAP ... k 1
2
1 −
,...,
...
(
)
(
(
)...
)
=
.
Nếu các biến cố
ñộc lập thì .
kA
AA , 1 2
AP ( k
AAAP k 1
2
APAP ). 2 1
Ví dụ 4 Trong một cuộc thi Olympic Toán, ban tổ chức chọn 1/5 số sinh viên ñạt giải. Trong ñó giải nhất chiếm 5% số giải. Tìm xác suất ñể một người tham gia cuộc thi ñược giải Nhất. Giải: Gọi A = “ñạt giải” , B = “ñạt giải Nhất”. P(A)= 0,2 , P(B|A) = 0,05 . Vậy xác suất ñể một người tham gia cuộc thi ñạt giải Nhất là: P(B) = P(AB) = P(A).P(B|A) = 0,2 . 0,05 = 0,01. Chú ý: Giải thích tại sao có tính chất P(B) = P(AB). Ví dụ 5 Trong lô hàng có 100 sản phẩm, trong ñó có 80 sản phẩm loại A. Lấy ngẫu nhiên 3 sản phẩm lần lượt từng chiếc không hoàn lại . Tính xác suất ñể 3 sản phẩm ñều loại A. HD: Gọi Ai = “lần lấy thứ i ñược sản phẩm loại A”, A = “ 3 sản phẩm ñều loại A”.
⇒
AP ( )
).
(
(
(
)
/
)
.
.
508,0
.
=
=
=
=
AAAA 1 3
2
AAAPAAPAP / 2
1
3
1
2
1
80 100
79 99
78 98
3
⇒
512,0
AP )(
()
).
(
=
=
=
.
Ví dụ 6 Trong một kho hàng, xác suất lấy ñược sản phẩm loại A là 0,8. Lấy ngẫu nhiên 3 sản phẩm lần lượt từng chiếc không hoàn lại . Tính xác suất ñể 3 sản phẩm ñều loại A. HD: Gọi Ai = “lần lấy thứ i ñược sản phẩm loại A”, A = “ 3 sản phẩm ñều loại A”. AAAA 8,0) = 1 3
APAPAP ( 3
2
1
2
XXP
BAP (
AP ) (
AP ) (
/)
/)
(
+
+
=
=
Chú ý 3: Với mẫu nhỏ thì cách chọn sau phụ thuộc vào các chọn trước, khi ñó tính theo xác suất có ñiều kiện. Với mẫu lớn thì xác suất mỗi lần chọn có thể coi không ñổi, thường gặp ở dãy Becnuli, mỗi lần chọn ñộc lập nhau. Ví dụ 7 Một hộp chứa 3 bi trắng, 7 bi ñỏ và 10 bi xanh. Hộp thứ 2 chứa 5 bi trắng, 2 bi ñỏ và 3 bi xanh. Ta lấy ngẫu nhiên từ mỗi hộp một viên bi. (a) Tìm xác suất ñể viên lấy ra là cùng màu. (b) Khi hai viên bi lấy ra là cùng màu, hãy tìm xác suất ñể hai viên bi ñó là màu xanh. HD: a) ABP ( / )
. b)
TTA = 21
DD 1
2
XX 1
2
1
2
0
(
)
iP B ≠ với mọi
k
2.4 QUY TẮC BAYES 1. ðịnh lý 2.7 (ðịnh lý xác suất ñầy ñủ) Nếu các biến cố B1, B2, …, Bk là một phân hoạch của không gian mẫu S, trong ñó i = 1,2, …, k thì với biến cố A bất kì của S ta có: k
AP ( )
.
=
(
|
)
.
=
BAPBP∑ ()
i∑ ABP ) (
i
i
i
1 =
i
1 =
11
0
(
)
(
)
2. ðịnh lý 2.8 (Quy tắc Bayes) Nếu các biến cố B1,B2, …, Bk là một phân hoạch của không gian mẫu S, trong ñó iP B ≠ với mọi i = 1, 2, …, k, thì với biến cố A bất kì của S mà P A ≠ , ta có 0
.
(
|
, với i = 1, 2, …, k .
=
P B A ) i
P B A ) ( i P A ) (
)
(
Chú ý: Phân biệt sự khác nhau giữa
P B A và |
P A B | )
1(
1
Tỉ lệ A có mặt trong 1B
Tỉ lệ 1B có mặt trong A.
Ví dụ 8 Trong một dây chuyền sản xuất, ba máy B1, B2, và B3 tạo ra 30%, 45%, và 25% sản phẩm tương ứng. Theo số liệu kiểm tra cho biết tỷ lệ phế phẩm do mỗi máy tương ứng là 2%, 3% và 2%. Chọn ngẫu nhiên 1 sản phẩm. (a) Tính xác suất ñể nó là phế phẩm. (b) Nếu sản phẩm lấy ra là phế phẩm, thì xác suất ñể sản phẩm ñó thuộc máy B3 là bao nhiêu? Giải: (a) Gọi A là biến cố sản phẩm ñược chọn là phế phẩm , B1: sản phẩm ñược làm bởi máy B1 , B2: sản phẩm ñược làm bởi máy B2, B3: sản phẩm ñược làm bởi máy B3. Ta có P(B1) = 0,3 , P(B2) = 0,45 , P(B3) = 0,25 P(A|B1) = 0,02 , P(A|B2) = 0,03 , P(A|B3) = 0,02 ,
Áp dụng ñịnh lý xác suất ñầy ñủ, ta có xác suất ñể
sản phẩm ñó là phế phẩm là: P(A) = P(B1).P(A|B1)+ P(B2)P(A|B2) + P(B3)P(A|B3) = 0,3×0,02 + 0,45×0,03 + 0,25×0,02 = 0,006 + 0,0135 + 0,005= 0,0245 (b) Sử dụng Quy tắc Bayes ta có
|
(
)
3
(
|
0,2041
=
=
=
P B A ) 3
P B P A B ( ) 3 P A ( )
0,005 0,0245
Ví dụ 9 Túi thứ nhất có 4 quả bóng trắng và 3 quả bóng ñen, túi thứ hai có 3 quả bóng trắng và 5 quả bóng ñen. Lấy ngẫu nhiên một quả bóng từ túi thứ nhất bỏ sang túi thứ hai. Tính xác suất ñể một quả bóng ñược lấy ra từ túi thứ hai có màu ñen. Giải: Gọi D1, T1 là biến cố lấy ñược 1 quả bóng ñen, trắng từ túi thứ nhất bỏ sang túi thứ hai, A là biến cố lấy ñược 1 quả bóng ñen từ túi thứ hai. Ta có: P(D1) = 3/7 , P(T1) = 4/7 , P(A|D1) = 6/9 , P(A|T1)= 5/9
Áp dụng ñịnh lý xác suất ñầy ñủ, ta có xác suất ñể một quả bóng ñược lấy ra từ túi thứ
hai có màu ñen là:
AP ( )
(
(
|
)
)
(
(
|
)
.
.
=
+
=
+
=
DAPDP ) 1
1
TAPTP 1
1
3 7
6 9
4 7
5 9
38 63
12
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$3. BIẾN NGẪU NHIÊN VÀ PHÂN PHỐI XÁC SUẤT
PHẠM XUÂN ðỒNG
Từ các kết cục của phép thử ngẫu nhiên, chúng ta có thể mô tả các ñiểm mẫu của không
MỞ ðẦU gian mẫu bằng ñịnh tính hoặc ñịnh lượng, như ví dụ sau: Ví dụ 1 Ba quả bóng ñược lấy lần lượt theo cách không hoàn lại từ một bình chứa 4 quả bóng ñỏ và 2 quả bóng trắng. Hãy mô tả không gian mẫu qua: (a) biến cố ð = “lấy bóng ñỏ” , T = “lấy bóng trắng”. (b) biến ngẫu nhiên X là số bóng ñỏ.
X 3 2 1
Không gian mẫu ððð ððT, ðTð , Tðð ðTT, TðT, TTð
Việc số hóa các ñiểm mẫu tạo thuận lợi cho mô tả cũng như sử dụng các công cụ khác
của Toán học hiệu quả hơn. 3.1 BIẾN NGẪU NHIÊN
1. Biến ngẫu nhiên là một hàm số ñặt tương ứng mỗi phần tử trong không gian mẫu với một số thực.
Tên biến ngẫu nhiên viết chữ in hoa, ví dụ X. Các giá trị của nó viết chữ thường, ví dụ x.
2. Biến ngẫu nhiên ñược gọi là rời rạc nếu tập các kết cục có thể xảy ra của nó là ñếm ñược. Biến ngẫu nhiên ñược gọi là liên tục nếu tập giá trị của nó là một khoảng thực nào ñó. Trong thực tế, biến ngẫu nhiên liên tục biểu diễn các dữ liệu ño ñược như chiều cao, cân nặng, nhiệt ñộ, khoảng cách. Còn biến ngẫu nhiên rời rạc biểu diễn các dữ liệu ñếm ñược như số sản phẩm bị lỗi trong một mẫu gồm k sản phẩm hay số tai nạn giao thông trong một năm ở một tỉnh nào ñó. 3.2 PHÂN PHỐI XÁC SUẤT RỜI RẠC.
xfx ,(
))
(
là một hàm xác suất hay
xf
x
1. Hàm phân phối xác suất: Tập hợp các cặp có thứ tự phân phối xác suất của biến ngẫu nhiên rời rạc X nếu với mỗi kết cục có thể có x , ta có: xf )(
XP (
)
1)( =
=
=
3)
. 1)
.
0)( ≥xf
2) ∑
x
Ví dụ 2 Một kiện hàng gồm 8 chiếc máy vi tính giống nhau trong ñó có 3 chiếc bị lỗi. Một trường học mua ngẫu nhiên 2 trong những chiếc máy vi tính này, tìm phân phối xác suất của X là số chiếc bị lỗi Giải: * ðặt tên biến ngẫu nhiên: Gọi X là số máy vi tính bị lỗi trường học ñó mua. * Tập giá trị biến ngẫu nhiên: X = {0, 1, 2} * Tính xác suất của biến X tại mỗi giá trị:
13
2 5
1 5
0 5
f
f
f
,
,
.
)0(
XP (
)0
)1(
XP (
)1
)2(
XP (
)2
=
=
=
=
=
=
=
=
=
=
=
=
10 28
15 28
3 28
0 CC 3 2 C 8
1 CC 3 2 C 8
2 CC 3 2 C 8
* Hàm phân phối xác suất:
x
0
1
2
f(x)
3 28
15 28
3
10 28 Ví dụ 3 Một người bắn ba viên ñạn ñộc lập nhau vào một mục tiêu với xác suất bắn một viên trúng mục tiêu là 0,6. (a) Gọi X là số viên ñạn bắn trúng mục tiêu. Tìm phân phối xác suất f (x) của X. (b) Gọi Y là số viên ñạn ñã bắn cho ñến khi trúng mục tiêu hoặc hết ñạn thì dừng lại. Tìm phân phối xác suất g(y) của Y. Giải: (a) Ta thấy X = {0, 1, 2, 3}. Gọi Ai = “lần thứ i bắn trúng mục tiêu”. f
064
4,0
)0(
,0
)
(
=
=
=
2
2
C
f
(
)1(
)
4,0.6,0.
,0
288
=
∪
∪
=
=
AAAP 1 3 AAAP 3 1
2
AAA 3 2
1
AAA 2 3
1
1 3
C
f
)2(
(
)
2 4,0.6,0.
,0
432
=
∪
∪
=
=
AAAP 3 1
2
AAA 3
1
2
AAA 2 1 3
2 3
3
C
f
)3(
(
)
6,0.
,0
216
=
=
=
AAAP 3 1
2
3 3
x
0
1
3
2 0,432
f (x)
0,064
0,288
0,216
g
)1(
AP (
6,0
=
(b) Y = {1, 2, 3}. Ta có:
) 1 =
2
g
g
)2(
(
)
6,0.4,0
24,0
)3(
(
)
(
)
4,0
16,0
=
=
=
=
∪
=
=
=
,
AAP 2 1
AAAP 1 3
2
AAA 3 2
1
AAP 2 1
y
0
1
2 0,16
g (y)
0,6
0,24
Ví dụ 4 Một lô hàng có 10 sản phẩm trong ñó có 2 phế phẩm. Lấy ngẫu nhiên ñồng thời 3 sản phẩm. Gọi X là số phế phẩm ñược lấy ra. Tìm phân phối xác suất f (x) của X. 3 Giải: Ta có X = {0, 1, 2}. Số cách lấy 3 sản phẩm trong 10 sản phẩm là
x
3
f x ( )
C C − . Phân phối xác suất của X là
phế phẩm trong 3 sản phẩm là
=
8.x
2
10C , số cách lấy x x x 3 − C C . 2 8 3 C 10
Ví dụ 5 Một hộp ñựng 6 sản phẩm trong ñó có 2 phế phẩm. Người ta kiểm tra từng sản phẩm không hoàn lại cho tới khi thấy phế phẩm thì thôi. Gọi X là số sản phẩm ñược kiểm tra. Tìm phân phối xác suất của X. Giải: Gọi Ai = “lần kiểm tra thứ i thấy phế phẩm”. Ta có X = {1, 2, 3, 4, 5}.
f
f
)1(
)
)2(
(
)
).
(
|
)
.
,
,
=
=
=
=
=
=
=
AP ( 1
AAP 2 1
AAPAP ( 1
2
1
4 6
2 5
4 15
2 6
1 3
f
f
f
)3(
(
)
)4(
(
)
)5(
(
)
,
,
=
=
=
=
=
=
AAAP 3 1
2
AAAAP 2 4
1
3
AAAAAP 2 5
1
3
4
1 15
1 5
2 15
Hàm phân phối xác suất:
x
1
3
4
5
2
3 / 15
2 / 15
f (x)
5 / 15
4 / 15
1 / 15
14
x
2. Hàm phân phối tích lũy F(x) của biến ngẫu nhiên rời rạc X với phân phối xác suất f (x) là: tf )(
xF )(
XP (
)
, với
.
.
=
≤
=
x +∞<<∞−
∑
xt ≤
P X b
(
)
bF )(
aF )(
(
)
F b ( )
F a ( )
(
)
Hệ quả: .
,
.
bXaP <
≤
=
−
P a X b <
<
=
−
−
=
P
2,0(
)5,1
Ý nghĩa: Từ tổng các giá trị xác suất trong miền (−∞, x] sẽ tính ñược xác suất trong miền [ , ]a b bất kỳ trong khoảng ñó. Ví dụ 6 Tìm hàm phân phối tích lũy của biến ngẫu nhiên X trong Ví dụ 2. Tính
< X
≤
x
0
,
<
xF )(
Giải:
=
1 2
0 x <≤ x <≤
0, 1, x
1
2
,
>
28/10 28/25
P
X
P
X
F
F
2,0(
)5,1
XP (
)1
hoặc
(0,2
1,5)
(1,5)
(0, 2)
<
≤
=
=
=
<
≤
=
−
=
=
15 28
25 10 − 28 28
15 28
3. Biểu ñồ xác suất.
Vẽ các ñiểm (x, f (x)) và nối các ñiểm này ñến trục Ox bởi một ñường nét ñứt (hoặc liền nét), ta ñược một biểu ñồ hình cây. Thay vì vẽ các ñiểm (x, f (x)), ta cũng có thể vẽ các hình chữ nhật sao cho ñáy của chúng có bề rộng bằng nhau và mỗi giá trị x ñược ñặt chính giữa ñáy, còn chiều cao của chúng bằng xác suất tương ứng ñược cho bởi f (x), các ñáy ñược vẽ sao cho không có khoảng trống giữa các hình chữ nhật, ñược gọi là một biểu ñồ xác suất.
Biểu ñồ xác suất hình bên mô tả kết quả thi tuyển sinh ñại học năm 2004. Trục Ox là giá trị ñiểm thi x của 3 môn, lấy từ 0 ñến 30 (ñơn vị 0,5). Trục Oy ghi f (x) (ñơn vị %) là tỷ lệ thí sinh ñạt ñiểm thi x. 3.3 PHÂN PHỐI XÁC SUẤT LIÊN TỤC.
Mặc dù không thể trình bày phân phối xác suất của biến ngẫu nhiên liên tục dưới dạng bảng nhưng chúng ta có thể mô tả nó bằng một công thức, ñó là một hàm của các giá trị số của biến ngẫu nhiên liên tục X mà ta kí hiệu là , ñược gọi là hàm mật ñộ xác suất hay ñơn )(xf giản là hàm mật ñộ của X. Do ñó ta sử dụng diện tích mô tả xác suất và xác suất là một số dương nên hàm mật ñộ phải nằm trên toàn bộ trục x . Hình sau là các hàm mật ñộ ñiển hình và xác suất trên khoảng (a, b)
)(xf
của biến ngẫu nhiên liên tục X, xác ñịnh trên tập các số thực R,
1. Hàm mật ñộ xác suất nếu:
b
+∞
xf
Rx
)( dxxf
3)
(
)
dxxf )(
. 1)
.
= 1
bXaP <
<
,0)( ≥
∈∀
∫=
2) ∫
a
∞−
15
Ví dụ 7 Giả sử sai số của nhiệt ñộ phản ứng (ñơn vị 0C) trong một thí nghiệm là biến ngẫu
2
kx
x
,
2
1
xf )(
=
nhiên liên tục X có hàm mật ñộ xác suất
<<− x
,0
)2,1(
−∉
(a) Tìm hằng số k. (b) Tìm P(0 < X ≤ 1). (ðS: k = 1/3)
2. Hàm phân phối tích lũy F(x) của biến ngẫu nhiên liên tục X với hàm mật ñộ f(x) là:
x
x
f
dt
xF )(
XP (
)
t )(
.
.
, với
-
=
≤
=
∞<<∞ x
∫
∞−
dF
x )(
Hệ quả: . P( a < X < b ) = F(b) – F(a) và
xf )(
(nếu ñạo hàm tồn tại) .
=
dx
x
,0
1
<
xF )(
Ví dụ 8 Cho ñại lượng ngẫu nhiên X có hàm phân phối tích lũy là
=
x
1
,
1
−
≥
k 3 x
x
,0
1
Tìm hệ số k và hàm mật ñộ xác suất. 1
<
x <
Giải:
xF )(
=
x
1
,
1
−
≥
k 3 x
+∞
+∞
dx
k
1
dxxf )(
f x ( ) ⇔ = dF x ( ) dx x , 1 ≥ = 0 , k 3 4 x
=
=
−=
=
∫
∫
∞+ 1
k 3 4 x
k 3 x
1
∞−
Theo tính chất hàm mật ñộ xác suất, ta có
Ví dụ 9 Thời hạn sử dụng (ñơn vị: ngày) của một loại thuốc nào ñó là biến ngẫu nhiên có hàm mật ñộ như sau:
x
,
0
>
3
(
xf )(
=
x
20000 x 100 ) + 0
,
0
≤
Tìm xác suất ñể một chai thuốc nói trên sẽ có thời hạn sử dụng (a) ít nhất là 200 ngày. (b) từ 80 ñến 120 ngày.
Giải: Gọi X là thời hạn sử dụng thuốc. (a) Xác suất ñể một chai thuốc nói trên sẽ có thời hạn sử dụng ít nhất là 200 ngày là
+∞
+∞
dx
XP (
)200
dxxf )(
,0
1111
=
≥
=
=
−=
∫
∫
3
2
∞+ 200
(
)
(2
20000 x )100 +
20000 x 100 +
200
200
120
120
P
X
dx
dx
80(
)120
xf )(
,0
1020
≤
≤
=
=
−=
=
∫
∫
3
2
120 80
(
(2
20000 x 100 ) +
20000 x )100 +
80
80
(b) Xác suất ñể một chai thuốc nói trên sẽ có thời hạn sử dụng từ 80 ñến 120 ngày là
16
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$4. BIẾN NGẪU NHIÊN HAI CHIỀU
VÀ PHÂN PHỐI XÁC SUẤT ðỒNG THỜI
PHẠM XUÂN ðỒNG
MỞ ðẦU Trong một phép thử có những kết cục xẩy ra nhiều biến ngẫu nhiên cùng một lúc. Việc nghiên cứu có thể riêng rẽ với từng biến ngẫu nhiên như phần trước, cũng có thể xét quan hệ giữa hai hay nhiều biến ngẫu nhiên ñồng thời, ta gọi là biến ngẫu nhiên hai chiều hay nhiều chiều.
4.1 PHÂN PHỐI XÁC SUẤT ðỒNG THỜI CỦA HAI BIẾN NGẪU NHIÊN RỜI RẠC.
ðịnh nghĩa: Hàm f(x, y) là phân phối xác suất ñồng thời của các biến ngẫu nhiên rời rạc X và Y nếu:
y
yxf ,(
XP (
Yx ,
)
yxf ,(
)
= 1)
=
=
=
x
y
YXP
[(
,
)
yxf ,(
)
. 1) yxf ,( ,0) yx ,( ) 3) . ≥ ∀ 2) ∑∑
Công thức tính xác suất trên miền A trong mặt phẳng Oxy: .
A ] ΣΣ=∈ A
2
.
Ví dụ 1 Hai chiếc ruột bút bi ñược chọn ngẫu nhiên từ 1 hộp gồm 3 ruột bút xanh, 2 ruột bút ñỏ, 3 ruột bút vàng. Gọi X là số ruột bút xanh, Y là số ruột bút ñỏ ñược chọn, tìm (a) phân phối xác suất ñồng thời f (x, y). (b) P[(X, Y) ∈ A] với A = {(x, y) | x + y ≤ 1}. Giải: (a) Cặp giá trị (x, y) có thể là: (0, 0), (0, 1), (1, 0), (1, 1), (0, 2) và (2, 0) Số cách chọn 2 ruột bút từ 8 chiếc là
yx
8C = 28. Số cách chọn x ruột bút xanh từ 3 chiếc và y y . Ta có phân phối CCC . 2
−−2 3
x 3
yx
−−
2 3
x 3
yxf ,(
)
ruột bút ñỏ từ 2 chiếc và (2−x− y) ruột bi vàng từ 3 chiếc là
=
y CCC 2 2 C 8
xác suất ñồng thời là với x = 0, 1 ,2; y = 0, 1, 2; 0 ≤ x + y ≤ 2. Bảng
phân phối xác suất:
X 0 1 2 Y
+
=
+
0 1 2 3 / 28 3 / 14 1 / 28 9 / 28 3 / 14 0
9 28
9 14
3 28
(b) P[(X, Y)∈A] = P(X + Y ≤ 1) = f(0, 0) + f(0,1) + f (1, 0) = . 3 / 28 0 0 3 14
4.2 HÀM MẬT ðỘ ðỒNG THỜI CỦA HAI BIẾN NGẪU NHIÊN LIÊN TỤC.
ðịnh nghĩa: Hàm f (x, y) ñược gọi là hàm mật ñộ ñồng thời của các biến ngẫu nhiên liên tục X và Y nếu:
+∞
+∞
∞−
∞−
dxdy . 1) yxf ,( ,0) yx ,( ) yxf ,( ) ≥ ∀ = 1 2) ∫ ∫
∫∫=∈ A ]
A
YXP dxdy 3) [( , ) yxf ,( ) với A là miền tùy ý trong mặt phẳng Oxy .
Ví dụ 2 Một công ty kẹo phân phối các hộp kẹo sôcôla tổng hợp với các loại nhân kem, nhân bơ cứng và nhân quả hạch ñược phủ cả sôcôla ñen và sôcôla trắng. Chọn ngẫu nhiên một hộp,
17
x
,
2(
y )3
Dyx ,( )
0{
0,1
}1
+
=∈
x ≤≤
y ≤≤
yxf ,(
)
=
2 5
0
,
∉
Tìm P[(X, Y) ∈ A] , A = {(x, y) | 0 < x <
< y <
}.
,
1 2
Dyx ,( ) 1 1 4 2 2/1
2/1
x
dxdy
2(
y )3
gọi X, Y lần lượt là tỷ lệ sôcôla trắng nhân kem và sôcôla ñen nhân kem. Giả sử hàm mật ñộ ñồng thời của X, Y là:
Giải: P[(X, Y) ∈ A] = P(0 < X <
,
< Y <
)
=
+
∫
∫
1 2
1 4
1 2
0
2/1
2/1
2
2
x
=
2
2 5 1 2
dy
dy
.
+
+
=
+
+
=
+
= ∫
= ∫
1 10
1 2
3 4
1 4
3 16
13 160
−
y 10
4/1 y 3 10
x 5
xy 6 5
1 10
y 3 5
=
x
1 2 0
=
4/1
4/1
1 4
4.3 PHÂN PHỐI BIÊN DUYÊN. ðịnh nghĩa: Phân phối biên duyên của X và Y , nếu X, Y là các biến ngẫu nhiên rời rạc, là
xg )(
yxf ,(
)
và
yh )(
yxf ,(
)
.
∑=
∑=
y
x
∞
∞
dy
dx
nếu X, Y là các biến ngẫu nhiên liên tục, là .
xg )(
yxf ,(
)
và
yh )(
yxf ,(
)
.
=
=
∫
∫
∞−
∞−
Ví dụ 3 Tìm phân phối biên duyên của X và Y với (X, Y) cho trong Ví dụ 1 Giải: Cộng các cột, các hàng của bảng phân phối xác suất, thì pp biên duyên của X,Y là:
X
1
2
0
Y
0 1 2 pp biên duyên của X
9 / 28 3 / 14 0 15/28
3 / 28 0 0 3/28
pp biên duyên của Y 15/28 12/28 1/28 1
3 / 28 3 / 14 1 / 28 10/28
*
x g(x)
0 10/28
1 15/28
2 3/28
y h(y)
0 15/28
1 12/28
2 1/28
2
f
y
,0(
)
+
+
=
= f(0, 0) + f(0, 1) + f(0, 2)=
.
Hoặc tính từng cột: P(X = 0) = g(0) = ∑
3 28
3 14
1 28
5 14
y
0
=
]1,0[∉x
Ví dụ 4 Tìm g(x) và h(y) với hàm mật ñộ ñồng thời trong Ví dụ 2. : g(x) = 0 Giải: * Nếu ∞
1
3
dy
x
dy
xg )(
yxf ,(
)
:
.
* Nếu
2(
y )3
]1,0[∈x
=
=
+
∫
= ∫
2 5
x 4 + 5
0
x
∞− ]1,0[
+
xg )(
Ta có :
=
,5/)3 ,0 :
* Nếu
4( ]1,0[∉y
x x ∉ =yh )(
1
∈ ]1,0[ 0 ∞
dx
x
dx
yh )(
yxf ,(
)
2(
y )3
* Nếu
:
]1,0[∈y
=
=
+
=
∫
∫
y )31(2 + 5
2 5
0
y
]1,0[
+
yh )(
Ta có :
=
x 0
,5/)6 y ,
∞− y ∈ ]1,0[ ∉
2(
18
Ví dụ 5 Biến ngẫu nhiên (X,Y), trong ñó X là sự thay ñổi nhiệt ñộ, Y là tỷ lệ thay ñổi quang phổ mà một nguyên tử tạo ra, có hàm mật ñộ ñồng thời như sau:
2
xy
D
yx
y
x
)
yxf ,(
,{(
0|)
}1
với
=
=
<<<
, ,
Giải : * Nếu
]1,0[∉x
1
Dyx 10 ,( ) ∈ Dyx 0 ,( ) ∉ Tìm hàm mật ñộ biên duyên g(x), h(y). : g(x) = 0 . ∞
2
3
3
dy
xy
dy
xy
x
x
xg )(
yxf ,(
)
10
1(
)
:
* Nếu
]1,0[∈x
=
=
=
=
−
∫
∫
y y
1 x
= =
10 3
10 3
x
∞−
3
4
x
x
x
,
1(
)
]1,0[
−
∈
y
yh )(
xg )(
. Tương tự
Ta có :
=
=
y y
5 0
, ,
]1,0[ ]1,0[
∈ ∉
x
,
0
]1,0[
∉
10 3
4.4 PHÂN PHỐI XÁC SUẤT CÓ ðIỀU KIỆN.
)
ABP | )
(
, P(A) > 0 .
.
=
Nhắc lại: Xác suất có ñiều kiện của biến cố B với ñiều kiện biến cố A xẩy ra: ABP ( AP ( )
ðịnh nghĩa: Giả sử X và Y là hai biến ngẫu nhiên rời rạc hoặc liên tục. Phân phối xác suất
)
xyf |
(
)
,
xg )(
0
có ñiều kiện của biến ngẫu nhiên Y với ñiều kiện X = x là .
.
=
>
yxf ,( xg )(
Phân phối có ñiều kiện của biến ngẫu nhiên X với ñiều kiện Y = y là
)
yxf |
(
)
yh )(
0
,
.
.
=
>
yxf ,( yh )(
YbXaP
yxf |
(
)
(
)
|
Hệ quả: Xác suất ñể biến ngẫu nhiên rời rạc X lấy giá trị trong khoảng (a,b) khi ñã biết biến ngẫu nhiên rời rạc Y = y là: . y . , trong ñó tổng ñược lấy trên =
<
<
∑=
x
tất cả các giá trị của X nằm giữa a và b.
b
YbXaP
y
dx
(
|
)
yxf |
(
)
Khi X và Y liên tục thì .
.
<
<
=
∫=
a
2
y
x
)
,
0
0,2
1
x <<
y <<
yxf ,(
)
Ví dụ 6 Cho hàm mật ñộ ñồng thời
=
31( + 4 0
,
yx ,(
)
)2,0(
)1,0(
∉
×
X
Y
|
<
<
=
Tìm g(x), h(y), f(x | y) và P(
).
1 4
1 2
1 3
1
2
3
Giải: Theo ñịnh nghĩa ta có: ∞ x
y
)
dy
dy
xg )(
yxf ,(
)
0,
2
=
=
=
+
=
x <<
∫
∫
y y
1 0
= =
31( + 4
xy 4
xy 4
x 2
∞−
0 2
∞
2
2
2
2
y
x
y
)
3
dx
dx
yh )(
yxf ,(
)
0,
.1
=
=
=
+
=
y <<
∫
∫
x x
2 0
= =
31( + 4
x 8
2 yx 8
31 + 2
∞−
2/1
)
dx
P
X
Y
yxf |
(
)
0,
2
|
.
và
Do ñó:
<
<
=
=
=
=
x <<
∫
0 x 2
yxf ,( yh )(
1 2
1 3
x 2
3 64
1 4
=
4/1
4.5 ðỘC LẬP THỐNG KÊ.
ðịnh nghĩa: Các biến ngẫu nhiên X và Y ñược gọi là ñộc lập thống kê khi và chỉ khi:
yxf ,(
)
yhxg ). )(
(
.
. , với ∀ (x,y) nằm trong miền giá trị của (X, Y).
=
19
yxf |
(
)
xg )(
Chú ý: Nếu f(x | y) không phụ thuộc vào y thì
=
Nếu f(x,y) ≠ g(x)h(y) thì biến ngẫu nhiên X và Y không ñộc lập thống kê. Liên hệ với 2 biến cố A, B ñộc lập nhau ⇔ P(A|B) = P(A) ⇔ P(AB) = P(A).P(B)
Ví dụ 7 Cho phân phối xác suất ñồng thời
0
1
2
X Y
0,12 0,08
0,18 0,12
0,3 0,2
Xf (
)3
với X = 0,1,2
=
=
− 1 3 Yx (a) Tính | (b) Hỏi X, Y có ñộc lập thống kê không?
2
xf (
)3|
Giải: (a) Ta có
nên
=
h
xf
)3(
)3,(
08,0
12,0
2,0
4,0
=
+
+
=
= ∑
xf )3,( h )3(
=x 0 0 0,2
x f(x | 3)
1 0,3
2 0,5
*
(b)
y h(y)
3 0,4
0 0,2 yxf ,(
)
1 0,3 yhxg ). ( )(
)
x g(x) Kiểm tra ta thấy
− 1 0,6 nên X, Y ñộc lập thống kê.
=
2 0,5 yx ,( ∀
4.6 HÀM CỦA CÁC BIẾN NGẪU NHIÊN.
Biết X là một biến ngẫu nhiên với phân phối xác suất f(x) và giả sử Y = u(X) là phép ñặt tương ứng một một giữa biến X và Y. Chúng ta mong muốn tìm phân phối xác suất của Y.
(Xu
)
Y =
ywf ( [
yg )(
)]
ðịnh lý: Cho X là biến ngẫu nhiên với phân phối xác suất là f (x). Giả sử xác ñịnh phép biến ñổi một một giữa các giá trị của X và Y sao cho y = u(x) giải ñược duy nhất nghiệm x tính theo y, gọi là x = w(y). Khi ñó phân phối xác suất của Y là: (a) .
. , X là biến ngẫu nhiên rời rạc
=
yg )(
Jywf [ (
)]
(b) .
. , X là biến ngẫu nhiên liên tục,
gọi là Jacobian của phép
=
J w y′= ( )
ywf
y
ñổi biến Chứng minh (a) : Phép tương ứng một một chỉ ra rằng mỗi giá trị x chỉ liên quan ñến một và chỉ một giá trị y và ngược lai. Từ phân phối xác suất rời rạc, rõ ràng rằng biến ngẫu nhiên Y nhận giá trị y khi biến ngẫu nhiên X nhận giá trị w(y). Suy ra là phân phối xác suất của Y là: (
yg )(
YP (
)).
))
)
(
(
(
ywXP =
=
=
=
=
Ví dụ 8 Cho X là biến ngẫu nhiên hình học với phân phối xác suất là
x
1 −
xf )(
x ,
3,2,1
,....
Tìm phân phối xác suất của biến
=
=
.2X
Y =
3 4
1 4
Giải: Do biến ngẫu nhiên X chỉ nhận các giá trị dương, nên phép tương ứng một một giữa x
y
1 −
2
y
x
x
y
f
y
y
.
yg )(
(
)
,
,...9,4,1
và y là
Do ñó
=⇔=
=
=
=
3 4
1 4
x
x
/ 12,
(1,5)
∈
f x ( )
Ví dụ 9 Cho X là biến ngẫu nhiên liên tục với phân phối xác suất
x
0,
(1,5)
∉
=
Y
.3
2 −
y
Tìm phân phối xác suất của biến ngẫu nhiên 3
Giải: Hàm ngược của
= x
2 −
J w y′=
( ) 1 / 2. =
y
.
,
)7,1(
−∈
=
yg )(
Do ñó hàm mật ñộ của Y là
=
= X từ ñó chúng ta có ,2/)3 y 2/)3 1 3 + 48 2
= y ( + y ( + 12
y
)7,1(
,0
−∉
là x
20
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$5. KỲ VỌNG VÀ PHƯƠNG SAI
PHẠM XUÂN ðỒNG
MỞ ðẦU Nếu biết phân phối xác suất của biến ngẫu nhiên X thì các thông tin về biến ngẫu nhiên ñó tương ñối ñầy ñủ. Thực tế thường biết rất ít về chúng và xác ñịnh biến ñó qua một số mẫu quan sát. Do ñó những ñặc trưng quan trọng về vị trí tập trung xác suất và ñộ phân tán của X là những phác họa ban ñầu về biến ngẫu nhiên X. Qua ví dụ sau sẽ thấy rõ hơn ý nghĩa các số ñặc trưng xác suất.
Kiểm tra ngẫu nhiên 100 hộp sữa có khối lượng như sau.
x (gam) m (số hộp)
495 19
490 15
505 22
510 16
500 28 Tính khối lượng trung bình của các hộp sữa ñó. 490
15
510
16
×
×
25,500
Giải: Ta có khối lượng trung bình hộp sữa là:
(gam)
=x
=
... ++ 100
n
∑
mx i
i
n
i
1 =
xf (
Tổng quát:
. Với n ñủ lớn thì tần suất
dần ñến hàm
x
x
=
=
∑
i =)
i
n
m i n
)(xf
i 1 = nên
.
phân phối xác suất
x
xf
x )(
m i n ∑→
x
5.1 KỲ VỌNG TOÁN HỌC. 1. ðịnh nghĩa: Cho X là một biến ngẫu nhiên với phân phối xác suất là f(x). Giá trị trung xf bình hay kỳ vọng của X là .
nếu X là biến ngẫu nhiên rời rạc,
XE (
.
x )(
)
=µ
∑=
x
+∞
xf
XE (
)
dxx )(
và .
. nếu X là biến ngẫu nhiên liên tục.
=µ
=
∫
∞−
2. Ý nghĩa: Trong thực tiễn thì các giá trị biến ngẫu nhiên X luôn biến ñổi nhưng giá trị thường ổn ñịnh nên µ là giá trị ñại diện cho X . Do ñó E(X) còn gọi là tâm của phân ( XE=µ ) phối xác suất.
b
b
aXE (
)
XaE (
)
+
=
+
YXE
)
XE (
)
YE )(
±
=
±
YX ,
YXE ( ).
YEXE ). )(
(
=
3. ðịnh lí : (1) Nếu a và b là hai hằng số, thì . (2) . (3) Nếu
( ñộc lập, thì .
. . .
Ví dụ 1 Tung 3 ñồng xu giống nhau. Gọi X là số mặt ngửa, ta có phân phối xác suất của X là: 1 3 / 8
2 3 / 8
3 1 / 8
)
Tính
0 1 / 8 và nêu ý nghĩa của µ.
xf
)
XE (
x )(
.0
.1
2
.3
5,1
Giải:
=
+
+
+
=
x f (x) ( XE=µ = ∑
1 8
3 8
3 8
1 8
x
Kết quả này nói nên rằng tung ngẫu nhiên ba ñồng xu nhiều lần, về trung bình, nhận
ñược 1,5 mặt ngửa trong mỗi lần tung.
21
Ví dụ 2 Một vị thanh tra chất lượng kiểm tra một lô hàng gồm 7 sản phẩm trong ñó có chứa 4 chính phẩm và 3 phế phẩm. Ông ta lấy ra một mẫu gồm 3 sản phẩm. (a) Hãy tìm giá trị trung bình của số chính phẩm trong mẫu. (b) Biết giá tiền của 1 chính phẩm là 3 triệu và 1 phế phẩm là 0,2 triệu. Hãy tính số tiền trung bình của mẫu lấy ra ñó Giải: (a) Gọi X là số chính phẩm trong mẫu. Ta có X = {0, 1, 2, 3}
x
−
xf )(
Phân phối xác suất của X là
nên bảng phân phối xác suất là:
=
x 3 CC 4 3 3 C 7
x f (x)
0 1 / 35
1 12 / 35
xf x
Ta có giá trị trung bình của số chính phẩm trong mẫu là
( ) 12 / 7 1, 714
≈
3 4 / 35 =
2 18 / 35 ∑ E X ) ( =
x
X
X
X
3(2,0
Xg (
6,0
8,2
)
)
Như vậy, nếu một mẫu cỡ 3 ñược chọn một cách ngẫu nhiên nhiều lần từ một lô hàng gồm 4 chính phẩm và 3 phế phẩm thì về trung bình trong mỗi mẫu sẽ chứa 1,7 chính phẩm. (b) Gọi g(X) là số tiền của mẫu lấy ra, ta có
+
−
=
+
E
X
XgE ((
))
8,2(
)6,0
.8,2
XE (
.8,2
(triệu)
Do
=
+
=
6,0) +
=
+
4,56,0 =
3 = 12 7
Ví dụ 3 Gọi X là một biến ngẫu nhiên của tuổi thọ tính theo giờ của một thiết bị ñiện tử nào ñó có hàm mật ñộ xác suất là
x
,
100
>
xf )(
.
=
x
20000 3 x ,0
100
≤
Hãy tính tuổi thọ trung bình của thiết bị ñiện tử loại này.
+∞
+∞
xf
x
dx
dxx )(
200
Giải:
(giờ)
=µ
=
−=
=
∫
∫
∞+ 100
20000 x
20000 3 x
100
∞−
Do ñó, có thể nói rằng loại thiết bị ñiện tử này có tuổi thọ trung bình là 200 giờ. Ví dụ 4 Một nhà cái tổ chức trò cá cược Lô ðề theo luật chơi như sau: Người chơi bỏ ra số tiền a ñể chọn ngẫu nhiên một số có 2 chữ số. Nếu số ñó trùng với 2 chữ số cuối cùng của giải ñặc biệt xổ số của ngày hôm ñó thì ñược nhận số tiền là 70a . Hỏi số tiền trung bình người ñó nhận ñược của nhà cái sau một lần chơi . Giải: Gọi X là số tiền người ñó nhận ñược sau một lần chơi. Ta có X = {70 a, − a}. Do xác suất trúng 2 chữ số cuối cùng là 0,01 và không trúng là 0,99 nên phân phối xác suất của X là
a
a
XE (
)
a 01,0.70
99,0).
29,0
%29
x f (x) xf x )(
Do ñó
=
−=
70 a 0,01 a ( −+
− a 0,99 −=
= ∑
x
Kết luận: số tiền trung bình người ñó mất sau một lần chơi là 29% số tiền bỏ ra.
x
Ví dụ 5 Trong một lô hàng có tỷ lệ chính phẩm là 0,8. Một người muốn mua sản phẩm ñó nên chọn ñến khi nào có ñược hàng chính phẩm thì thôi. Theo quy ñịnh, mỗi người chỉ ñược chọn nhiều nhất 3 lần. Hãy tìm số lần chọn trung bình ñể có hàng chính phẩm. Giải: Gọi X là số lần chọn cho ñến khi có hàng chính phẩm hoặc hết 3 lần chọn. Ta có bảng phân phối xác suất của X là 1
3
2
f (x)
0,8
0,04 xf
XE (
)
0,16 Ta có số lần chọn trung bình ñể có hàng chính phẩm là:
x 24,1)( =
= ∑
x
22
5.2 PHƯƠNG SAI .
( XE=µ
ðể ñánh giá ñộ phân tán của biến ngẫu nhiên X xung quanh giá trị trung bình
XE (
XE (
0
) giữa X với giá trị kỳ vọng µ . Nếu lấy giá trị trung với mọi X nên không có ý nghĩa gì. Vì thế
µ−X =µ−µ=µ−
) =µ−
)
ta ñưa ra khái niệm sai số (ñộ lệch) bình của sai số thì ) phải lấy giá trị trung bình của bình phương của sai số (gọi tắt là phương sai). 1. ðịnh nghĩa : Cho X là biến ngẫu nhiên với phân phối xác suất f(x) và trung bình là µ. Phương sai của một biến ngẫu nhiên X, là kì vọng của bình phương ñộ lệch giữa X và ( XE=µ
, tức là:
2
XE [(
2 ])
)
xf )(
.
. nếu X là rời rạc,
2 =σ
µ−
=
∑ µ− x (
x
2
x
XE [(
2 ])
)
dxxf )(
và .
. nếu X liên tục.
2 =σ
µ−
=
µ−
∫
+∞ ( ∞−
Căn bậc hai của phương sai là σ , ñược gọi là ñộ lệch chuẩn của X. Con số
ñược gọi là ñộ lệch của giá trị quan sát khỏi giá trị trung bình.
µ−x
2. Ý nghĩa: Phương sai biểu thị ñộ phân tán của X xung quanh giá trị trung bình µ. Trong thực tế phương sai thể hiện ñộ chính xác, ñộ ñồng ñều hoặc mức ñộ ổn ñịnh của một sản phẩm. 3. ðịnh lí:
2
2
2
a
a
(1) Nếu a và b là các hằng số, thì .
.
=
σ
b
2 =σ X
2 σ + aX
2
2
XE (
)
(2) Phương sai của biến ngẫu nhiên X là .
.
2 =σ
µ−
+∞
2
2
2
2
2
xfx )(
dxxfx )(
. với X rời rạc, .
. với X liên tục
Hay .
µ−
2 =σ
µ−
=σ ∑
∫
x
∞−
DX
DY
(
(3) .
. với X, Y ñộc lập
YXD ± )
=
+
Ví dụ 6 Gọi X là biến ngẫu nhiên biểu thị số xe ôtô ñược sử dụng cho mục ñích kinh doanh chính thức trong một ngày làm việc nào ñó. Phân phối xác suất của X tại công ty A là
x
1
2
3 0,3
f (x)
0,3
0,4
và tại công ty B là
x
1
2
0 0,2
3 0,3
4 0,1
f (x)
0,1
0,3
2
2
2
xf
xfx )(
XE (
XE (
0,2
6,4
x )(
)
)
(
)
6,0
,
Giải: Tính:
=
=
=
2 =µ−
= ∑
∑
Hãy so sánh phương sai của biến ngẫu nhiên X tại công ty A và B. 2 , XEA =σ
=µ A
x
x
2
2
2
xf
XE (
)
x )(
0,2
XE (
)
xfx )(
6,5
(
)
6,1
,
,
=
=
=
2 =µ−
∑
= ∑
2 XEB =σ
=µ B
x
x Kết luận: phương sai của số ôtô ñược sử dụng cho những mục ñích kinh doanh chính thức tại công ty B là lớn hơn công ty A. Tức là mức ñộ sử dụng số ô tô trung bình (µ = 2) của công ty A ổn ñịnh hơn công ty B
23
(2
xf )(
=
x x
Ví dụ 7 Nhu cầu hàng tuần ñối với Pepsi, theo ñơn vị 1000 lít, tại một chuỗi các cửa hàng ở một ñịa phương nào ñó, là một biến ngẫu nhiên liên tục X với hàm mật ñộ xác suất như sau x ),1 − ,0
)2,1( ∈ )2,1( ∉
Hãy tìm giá trị trung bình và phương sai của g(X) = 6X + 2.
2
2
+∞
+∞
2
2
2
xf
xx
dx
dx
x
x
dx
XE (
)
dxx )(
(2
)1
XE (
)
xfx )(
2
(
)1
Giải:
,
=µ
=
=
−
=
=
=
−
=
∫
∫
∫
∫
5 3
17 6
1
1
∞−
∞−
2
XE (
)
nên
2 =σ
2 =µ−
−
17 6
5 3
1 18
2 =
2
XE
XgE ((
))
XE 6(
)2
(6
2)
12
6
2
,
Ta có:
=
+
=
=+
σ
σ=
=
X
2 =σ X
2 Xg (
)
2 6
2
+
Ví dụ 8 Hai chiếc ruột bút bi ñược chọn ngẫu nhiên từ một hộp gồm 3 ruột bút xanh, 2 ruột bút ñỏ, 3 ruột bút ñen. Gọi X là số ruột bút xanh, Y là số ruột bút ñỏ ñược chọn. (a) Tìm giá trị trung bình số ruột bút xanh và ruột bút ñỏ. (b) Tìm ñộ lệch chuẩn của X, Y. Giải: (a) Cặp giá trị (x, y) = {(0, 0), (0, 1), (1, 0), (1, 1), (0, 2) , (2, 0)} Hay x = 0, 1, 2; y = 0, 1, 2; 0 ≤ x + y ≤ 2. Số cách chọn 2 chiếc ruột bút bi trong 8 chiếc là:
2 8C
yx
Số cách chọn x ruột bút xanh trong 3 chiếc và y ruột bút ñỏ trong 2 chiếc là
x CCC y 2
3
−−2 3
yx
−−
2 3
x 3
yxf ,(
)
Ta có phân phối xác suất ñồng thời là :
=
y CCC 2 2 C 8
0
1
2
X Y 0 1 2
3 / 28 3 / 14 1 / 28
9 / 28 3 / 14 0
3 / 28 0 0
.
x g(x)
0 10 / 28
1 15 / 28
2 3 / 28
y h(y)
0 15 / 28
1 12 / 28
2 1 / 28
xg
x )(
75,0
Ta có :
,
yh y ( )
0,5
=
=
=µ ∑
X
∑
x
y
(b)
2
2
2
XE (
)
xgx )(
XE (
)
,0
6339
=σ⇒=
= ∑
X
2 =µ− X
x
2
2
YE (
)
2 yhy )(
YE (
)
,0
5669
=σ⇒=
= ∑
Y
2 =µ− Y
27 28 4 7
y
µ = Y
24
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$6. COVARIANCE VÀ HỆ SỐ TƯƠNG QUAN
PHẠM XUÂN ðỒNG
y
x
. với X , Y rời rạc
yxf ,(
XE [(
)(
)(
)]
)
)
(
6.1 COVARIANCE 1. ðịnh nghĩa: Cho X và Y là các biến ngẫu nhiên với phân phố xác suất ñồng thời f(x, y). Covariance của X và Y là : Y . =
µ−
µ−
µ−
µ−
σ
=
∑∑
XY
X
Y
X
Y
x
y
+∞
+∞
x
y
dxdy
..
XE [(
Y )(
)]
(
)(
)
yxf ,(
)
. với X , Y liên tục
σ
=
µ−
µ−
=
µ−
µ−
Y
X
XY
X
Y
∫ ∫
∞−
∞−
XYE (
)
, ñược xác ñịnh bởi: .
. hay
σ
=
µµ− YX
XY
Y
xyf
yx ,(
)
2. Ý nghĩa: Covariance của hai biến ngẫu nhiên cho ta biết mối liên hệ của hai biến ngẫu nhiên và dấu của covariance cho biết mối quan hệ giữa hai biến ngẫu nhiên phụ thuộc là thuận hay là nghịch. 3. ðịnh lí: Covariance của các biến ngẫu nhiên X và Y với các giá trị trung bình tương ứng là X µµ , . .
. với X, Y rời rạc
σ
=
∑∑
µµ− X
Y
XY
x
y
+∞
+∞
xyf
dxdy
yx ,(
)
.
. với X, Y liên tục
σ
=
XY
µµ− YX
∫ ∫
∞−
∞−
xy
x
0,
yxf ,(
)
=
x y 0,1 ≤≤ ≤≤ miền còn lại
,0
Ví dụ 1 Tỉ lệ X các nam vận ñộng viên và tỉ lệ Y các nữ vận ñộng viên ñiền kinh hoàn thành bài thi trong cuộc thi marathon ñược mô tả bằng hàm mật ñộ ñồng thời sau 8
2
3
y
y
x
y 1(4
)
,
]1,0[
yh )(
xg )(
,
Giải: Hàm mật ñộ biên duyên:
=
=
x x
y
]1,0[ ]1,0[
∈ ]1,0[
,
− 0
∈ ∉
∉
Hãy tìm covariance của X và Y. 4
x
1
1
, ,0 1
2
4
2
2
x
dx
y
y
dy
XE (
)
4
YE )(
4
1(
)
=
=
=
−
=
2 yx
dydx
XYE (
)
8
Nên
,
,
=
=µ X
=µ Y
= ∫ ∫
∫
∫
4 5
8 15
8 9
0 0
0
0
XYE (
)
.
σ
=
−
=
Từ ñó
=µµ− YX
XY
4 9
4 5
8 15
4 225
Hoặc không tính qua ppb.duyên:
x
1
+∞
+∞
+∞
2
xg
xf
dydx
x
ydydx
yx ,(
)
8
XE (
)
dxx )(
=
=
=
=
=µ X
∫
∫ ∫
∫ ∫
4 5
∞−
0 0 1 1
+∞
∞− +∞
∞− +∞
2
yh
dy
yf
dxdy
x
ydxdy
y )(
yx ,(
)
8
=µ
=
=
=
=
YEy )(
∫
∫ ∫
∫ ∫
8 15
y
0
∞−
∞−
∞−
Ví dụ 2 Hai anh A, B ném bóng rổ ñộc lập nhau, có xác suất trúng rổ lần lượt là 0,8 , 0,6. Anh A ném lần lượt 2 quả, anh B ném 1 quả. Gọi X và Y là số bóng trúng rổ của anh A và B. Hãy tìm phân phối xác suất ñồng thời của X, Y và tính XYσ và giải thích.
XYσ . Nhận xét giá trị
25
Y
2 4,0.2,0
XP (
016
,0
,0
)
(
Giải: Ta có X = {0, 1, 2} , Y = {0, 1}. Gọi Ai = ”anh A ném bóng lần thứ i trúng rổ”, với i = 1,2, B = ” anh B ném bóng trúng rổ” Phân phối xác suất của X, Y là: )0
,
=
=
=
=
=
Y
4,0.8,0.2,0.2
,1
)0
)
.
,….
BAAP . 1 2 128,0 =
=
=
=
∪
=
AAP 2 1
BAA 2
1
XP ( (( ) Bảng phân phối xác suất ñồng thời là:
X
0
1
2
Y
0 1
0,016 0,024
0,128 0,192
0,256 0,384
Phân phối xác suất biên duyên là : 2 0,64
0 0,04
1 0,32
x g(x)
y h(y)
0 0,4
1 0,6
xg
yh
XE (
)
YE )(
y )(
6,0
,
,
=
x 6,1)( =
=
=
∑
∑
=µ X
=µ y
x xyf
XYE (
)
yx ,(
)
96,0
)
YEXE )( ).
(
0
y XYE (
nên
=
σ
=
−
=
= ∑∑
XY
y
)
(
XYE (
YEXE ). )(
0
.
=
σ⇒
=
XY
thì X, Y có thể ñộc lập hoặc không ñộc lập.
0=
σ XY
x Giải thích : Do X, Y ñộc lập nên Chú ý : ðiều ngược lại không ñúng, tức là 6.2 HỆ SỐ TƯƠNG QUAN 1. ðịnh nghĩa: Cho X và Y là các biến ngẫu nhiên với covariance
XYσ và các ñộ lệch chuẩn
tương ứng là
.
ρ
=
Xσ và
Yσ . Hệ số tương quan của X và Y là .
XY
σ XY σσ X
Y
1
2. Ý nghĩa: Mặc dù covariance của hai biến ngẫu nhiên cung cấp thông tin về mối liên hệ giữa hai biến ngẫu nhiên, nhưng ñộ lớn của σσσσXY không cho ta biết về mức ñộ quan hệ của hai biến ngẫu nhiên, bởi vì σXY còn phụ thuộc vào ñơn vị ño của cả X và Y . Hệ số tương quan ρXY là một phiên bản của covariance mà không phụ thuộc vào ñơn vị ño và ñược sử dụng rộng rãi trong thống kê.
. Khi
thì
.
1 ρ≤−
0=
0=
≤
σ XY
ρ XY
XY
Hệ số tương quan thoả mãn bất ñẳng thức Khi
thì X, Y có sự phụ thuộc tuyến tính, tức là Y ≡ a + bX,
1±=
ρ XY
Ví dụ 3 Cho biến ngẫu nhiên hai chiều X, Y có phân phối xác suất ñồng thời là :
0
1
2
0,2 0,1
0,3 0,1
0,1 0,2
X Y 0 1
Tính hệ số tương quan của X, Y
Giải : Ta có phân phối biên duyên
0 0,3 ,
,
0 0,6 ,
,
2 0,3 yh
1 0,4 YE )(
XE (
)
y )(
4,0
66,0
1 0,4 52,0
=
=
x 1)( =
=
x g(x) ∑ xg
∑
y h(y) 2 =σ X
2 =σY
=µ X
=µ y
y
x
02635
,0=
ρ XY
26
NỘI DUNG ÔN TẬP GIỮA KỲ MÔN TOÁN V
A. Xác suất của một biến cố và phân phối xác suất của biến ngẫu nhiên.
+ Tính xác suất của một biến cố
+ Tính xác suất theo quy tắc cộng, quy tắc nhân, quy tắc Bayes, công thức xác suất ñầy ñủ.
+ Tìm phân phối xác suất của biến ngẫu nhiên rời rạc một chiều hoặc hai chiều.
B. Biến ngẫu nhiên
+ Biến ngẫu nhiên một chiều: hàm phân phối tích lũy, tính xác suất
+ Biến ngẫu nhiên hai chiều: phân phối ñồng thời, phân phối biên duyên, tính xác suất
C. Các số ñặc trưng biến ngẫu nhiên
+ Kỳ vọng và tính chất.
+ Phương sai, ñộ lệch chuẩn và tính chất.
ðỀ LUYỆN TẬP
ðề số 1
Câu 1 Một thị trấn có hai chiếc xe cứu hoả hoạt ñộng ñộc lập, xác suất ñể một chiếc xe sẵn sàng hoạt ñộng khi có tín hiệu báo cháy là 0,96.
(a) Tìm xác suất ñể không có chiếc xe cứu hoả nào sẵn sàng hoạt ñộng khi có tín hiệu báo cháy.
(b) Tìm xác suất ñể có một chiếc xe cứu hoả nào sẵn sàng hoạt ñộng khi có tín hiệu báo cháy.
Câu 2 Một hộp có 4 quả bóng ñen và 2 quả bóng xanh. Lấy ngẫu nhiên lần lượt 3 quả bóng theo phương thức có hoàn lại. Tìm phân phối xác suất của số quả bóng xanh.
Câu 3 Giả sử số lượng xe ôtô X ñến cửa hàng rửa xe vào khoảng thời gian từ 4 giờ chiều ñến 5 giờ chiều của một ngày thứ sáu khô ráo, là một biến ngẫu nhiên có phân phối xác suất như sau:
x
0
1
2
3
4
5
6
7
P(X = x)
1 9
1 12
1 8
1 8
1 4
1 9
1 12
1 9
)
g X (
ðặt
5
x= 2
+ là số tiền (ñơn vị tính 10.000 ñ), mà người chủ cửa hàng phải trả cho nhân công rửa xe. Người công nhân rửa xe hy vọng sẽ kiếm ñược bao nhiêu tiền trong khoảng thời gian nói trên?
27
ðề số 2
Câu 1 Trong hộp 1 có 2 bi trắng, 6 bi ñen và hộp 2 có 5 bi trắng , 2 bi ñen và 3 bi ñỏ. Lấy ngẫu nhiên mỗi hộp một viên bi. Tìm xác suất ñể 2 viên bi lấy ra cùng màu.
Câu 2 Cho hàm mật ñộ của biến ngẫu nhiên X :
k
(2
x x )(
1)
1
2
,
−
−
x ≤ ≤
f x ( )
x
x
0
,
1,
2
<
>
=
(a) Xác ñịnh hằng số k.
P
(b) Tính
(0
1,5)
.
X<
<
Câu 3 Giả sử rằng X biểu thị số lần có sự cố về năng lượng ở một khu nào ñó trong một năm có xác suất là
x
0
1
2
3
P(X = x)
0,4
0,3
0,2
0,1
Hãy tìm giá trị trung bình và phương sai của biến ngẫu nhiên
ðề số 3
Câu 1 Khả năng sống sót ñến năm 20 tuổi của Tom là 0,7. Khả năng sống sót ñến năm 20 tuổi của Nancy là 0,9. Biết rằng khả năng này của hai người là ñộc lập nhau, tìm xác suất ñể :
(a) cả hai người không sống sót ñược ñến năm 20 tuổi.
(b) một trong hai người sống sót, biết rằng người kia không sống sót ñến năm 20 tuổi.
Câu 2 Giả sử X là biến ngẫu nhiên chỉ số lần xuất hiện mặt ngửa trừ ñi số lần xuất hiện mặt sấp khi tung một ñồng xu 3 lần. Liệt kê các phần tử của không gian mẫu S khi tung ñồng xu 3 lần và ứng với mỗi ñiểm mẫu xác ñịnh giá trị x của X. Tìm phân phối xác suất của biến ngẫu nhiên X với giả thiết ñồng xu ñược làm sao cho khả năng xuất hiện mặt ngửa gấp 2 lần khả năng xuất hiện mặt sấp.
Câu 3 Hai chuyên gia về chất lượng ñồ trang sức kiểm tra lô ñồ trang sức và ấn ñịnh phân loại chất lượng cho mỗi món ñồ theo thang ñiểm gồm ba mức. ðặt X là mức ñiểm mà chuyên gia A cho và Y là mức ñiểm mà chuyên gia B cho. Phân phối ñồng thời của X và Y ñược cho trong bảng dưới ñây
1
2
3
X Y 1 2 3
0,1 0,1 0,03
0,15 0,35 0,1
0,2 0,05 0,2
Hãy tính
Yµ µ . ,X
28
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$7. MỘT SỐ PHÂN PHỐI XÁC SUẤT THƯỜNG GẶP
PHẠM XUÂN ðỒNG
7.1 MỘT SỐ PHÂN PHỐI XÁC SUẤT RỜI RẠC I. Phân phối ñều rời rạc: Nếu biến ngẫu nhiên X nhận các giá trị x1, x2,…, xk và xác suất của mỗi giá trị là bằng nhau, thì phân phối ñều rời rạc là :
x
kxf );(
,
xx ,
,...,
.
.
=
kx
1=
2
1 k
Kí hiệu f(x; k) thay cho f(x) ñể nói nên rằng phân phối ñều phụ thuộc vào tham số k.
Ví dụ 1 Tung một con xúc xắc, tìm phân phối xác suất của biến ngẫu nhiên X là số chấm xuất hiện. Tính số chấm trung bình xuất hiện và ñộ lệch chuẩn của nó. Giải: Mỗi một phần tử của không gian mẫu S ={ 1, 2, 3, 4, 5, 6} xuất hiện với xác suất ñều
x
xf
,
)6,(
6,5,4,3,2,1
bằng 1/6. Do ñó, ta có phân phối ñều với
=
=
1 6 941
25
36
+++
+
+
2
2
XE (
)
và
=µ
2 =σ
µ−
=
−
=
654321 +++++ 6
7 2
16 6
7 2
35 12
2 =
II. Phân phối nhị thức. (a) Phép thử Bernoulli có tính chất sau: + Một thí nghiệm gồm n phép thử cùng loại ñược lặp ñi lặp lại. + Mỗi phép thử chỉ có 2 biến cố xẩy ra gọi là biến cố thành công (ta quan tâm) và biến cố thất bại. Xác suất thành công trong mỗi phép thử ñều bằng nhau và ñược kí hiệu là p. + Các phép thử là ñộc lập.
Ứng dụng rõ ràng nhất là việc kiểm tra các sản phẩm của một dây chuyền sản xuất, mỗi
lần kiểm tra hoặc thử thì cho biết ñó là chính phẩm hay phế phẩm.
x
xn −
pnxb
n
x
,...,2,1,0
;(
)
,
,
.
.
=
=
(b) Phân phối nhị thức: Cho phép thử Bernoulli với biến cố thành công xuất hiện trong một lần thực hiện có xác suất là p và biến cố thất bại có xác suất là q = 1– p. Phân phối xác suất của biến ngẫu nhiên X , biểu thị số lần thành công trong n phép thử ñộc lập, là x qpC n
x
x
khác nhau, nên cộng các xác suất của mỗi ñiểm mẫu thì kết quả là
Chứng minh: Trước tiên, ta thấy xác suất ñể có x thành công và n – x thất bại xuất hiện theo một thứ tự xác ñịnh là pxqn – x , vì các phép thử là ñộc lập nên có thể nhân xác suất của các biến cố sơ cấp với nhau. Số ñiểm mẫu trong không gian mẫu của quá trình Bernoulli có x lần thành công và n – x lần thất bại là số cách chia n thành 2 nhóm x và n – x phần tử nên bằng nC . Do các cách chia này ñôi một nC nhân với pxqn – x.
b
)4,0;15;5(
1859
XP (
)5
,0
Ví dụ 2 Xác suất ñể một bệnh nhân sống sót sau khi mắc một loại bệnh hiếm thấy về máu là 0,4. Nếu biết rằng ñã có 15 người mắc loại bệnh này, tìm xác suất ñể (a) có ñúng 5 người sống sót. (b) có ít nhất 10 người sống sót; Giải: Gọi X là số người sống sót. (a)
=
=
=
9
XP (
1)10
XP (
)10
(b)
(Bảng A.1 trang 427)
≥
−=
<
xb
,01)4,0;15;(
9662
,0
0338
−=
=
−= ∑ 1
0
=x
29
k
kx −
x
b
k
,
;(*
III. Phân phối Nhị thức âm: Cho phép thử Bernoulli với biến cố thành công xuất hiện trong một lần thực hiện có xác suất là p và biến cố thất bại có xác suất là q = 1– p. Phân phối xác suất của biến ngẫu nhiên X , biểu thị số phép thử cần phải thực hiện ñể có ñược lần thứ k biến cố thành công xuất hiện, là pkx , )
,...2
kk ,
,1
=
=
+
+
1)
k
k
kx −
kx −
1 −
q
và lần thứ x là p nên xác suất cần tìm là:
k 1 − qpC x 1 −
k 1 − pC x 1 −
k
1) k k ,
2,...
+
+
k 1 − . qpC x 1 − Chứng minh: Nếu ở lần thực hiện phép thử thứ x có xuất hiện biến cố thành công thứ k, x − phép thử ñã có thì trước ñó trong ( 1k − biến cố thành công và x – k biến cố thất bại. Do các phép thử ñộc lập nên xác suất của x − lần trước là với ( x 1, = Ví dụ 3 Một người tung ba ñồng xu nhiều lần, tìm xác suất ñể người này hai lần thu ñược toàn mặt ngửa hoặc toàn mặt sấp ngay ở lần tung thứ năm. Giải: Xác suất ñể tung 3 ñồng xu thu ñược toàn mặt ngửa hoặc toàn mặt sấp là p = 1/ 4 vì mỗi trường hợp có xác suất là (1/2)3 = 1/8. Sử dụng phân phối nhị thức âm với x = 5, k = 2 và p
2
b
,2;5(*
)
,0
1055
= C
=
=1/4, ta có:
1 4
1 4
1 4
3 4
27 256
3 =
x
1 −
pq
x
..3,2,1
)
,
=
=
.
IV. Phân phối Hình học: Nếu một phép thử ñược lặp ñi lặp lại một cách ñộc lập và xác suất xuất hiện biến cố thành công trong mỗi phép thử là p và biến cố thất bại là q = 1 – p, thì phân phối xác suất của biến ngẫu nhiên X, biểu thị số phép thử phải thực hiện ñến khi một biến cố thành công xuất hiện, là . pxg ;( Chú ý: Phân phối hình học là trường hợp ñặc biệt của phân phối nhị thức âm (k = 1), tức là phân phối xác suất của số phép thử cần phải thực hiện ñể biến cố thành công xuất hiện lần ñầu tiên.
g
99,0.01,0
)01,0;5(
0096
,0
4 =
=
Ví dụ 4 Một quy trình sản xuất, người ta biết rằng trung bình cứ 100 sản phẩm có 1 phế phẩm, tính xác suất ñể kiểm tra ngẫu nhiên lần lượt từng sản phẩm thì thấy phế phẩm ở lần kiểm tra thứ năm. Giải: Sử dụng phân phối hình học với x = 5, p = 0,01, ta có:
V. Phân phối siêu bội: Phân phối xác suất của biến ngẫu nhiên X , biểu thị số phần tử thành công trong mẫu cỡ n ñược chọn ngẫu nhiên từ N phần tử trong ñó có k phần tử ñược ñặt tên là thành công và N – k phần tử
x
n
knNxh ),
;(
,
,
2,1,0
,...,
=
=
ñược ñặt là thất bại, là .
.
xn x − CC k kN − n C N
Ví dụ 5 Mỗi lô gồm 40 sản phẩm ñược coi là chấp nhận ñược nếu chứa không quá 3 phế phẩm. Biện pháp lấy mẫu là chọn ngẫu nhiên 5 sản phẩm trong lô ñể kiểm tra và loại lô hàng nếu có một phế phẩm. Tính xác suất ñể có ñúng 1 phế phẩm ñược tìm thấy trong mẫu nếu trong lô hàng có 3 phế phẩm? Giải: Sử dụng phân phối siêu bội với n = 5, N = 40, k = 3 và x =1 ta tìm ñược xác suất nhận
4 37
h
)3,5,40;1(
,0
3011
=
=
ñược một phế phẩm là
1 CC 3 5 C 40
VI. Phân phối Poisson: Phân phối xác suất của biến ngẫu nhiên Poisson X, biểu thị số biến cố sơ cấp xuất hiện trong một khoảng thời gian cho trước hoặc một vùng ñịnh trước ñược ký
t
x
λ−
e
t
)
x
xp ,(
,
,...2,1,0
71828
t ) =λ
=
,2≈e
hiệu t, là .
. ,
.
( λ x !
trong ñó λ là số biến cố xuất hiện trung bình trong một ñơn vị thời gian hoặc vùng, và
30
Ví dụ 6 Trong suốt phép thử ở phòng thí nghiệm, trung bình số hạt phóng xạ ñi qua một máy ñếm trong một phần nghìn giây là 4. Xác suất ñể 6 hạt ñi vào máy ñếm trong vòng một phần nghìn giây cho trước là bao nhiêu? Giải: Sử dụng phân phối Poisson với x = 6 và λt =4, từ Bảng A2 ta tìm ñược
6
4
−
6
5
e
,0
8893
,0
7851
,0
1042
=
−
=
p
xp
xp
)4;6(
)4;(
)4;(
=
−
=
∑
∑
4 !6
x
x
0
0
=
=
7.2 MỘT SỐ PHÂN PHỐI XÁC SUẤT LIÊN TỤC
x
BA ,
[
]
,
∈
BAxf
,(
)
,
.
[
,
=
]A B là .
x
1 AB − 0
BA ,
[
]
,
∉
VII. Phân phối liên tục ñều: Hàm mật ñộ của biến ngẫu nhiên liên tục ñều X trên khoảng
Ví dụ 7 Giả sử rằng một phòng họp lớn của một công ty xác ñịnh chỉ có thể ñược sử dụng không quá 4h. Trên thực tế thời gian sử dụng phòng họp trong thời gian dài hay ngắn ñều xảy ra thường xuyên. Do ñó có thể coi thời gian sử dụng phòng họp X là biến ngẫu nhiên ñều trên khoảng [0, 4]. (a) Tìm hàm mật ñộ xác suất của X . (b) Tính xác suất ñể thời gian sử dụng phòng họp của một cuộc họp nào ñó kéo dài ít nhất 3h.
x
,
]4,0[
∈
xf )(
Giải: (a) Hàm mật ñộ của biến X có phân phối ñều trên [0, 4] là
=
x
1 4 ,0
]4,0[
∉
4
XP (
)3
(b)
≥
=
=
1 ∫ dx 4
1 4
3
VIII. Phân phối chuẩn
µ , phương
(a) ðịnh nghĩa: Hàm mật ñộ của biến ngẫu nhiên chuẩn X, với trung bình sai
là
2σ
1
x
)[(2/1(
2]
−
/) σµ−
e
xn ;(
,
,
) =σµ
x +∞<<−∞
e
,3
14159
...
,
,2
71828
...
=π
=
.
,
.
2
σ
π
1
Khi
gọi là phân phối chuẩn hóa n(z; 0,1).
,0 =σ=µ
ðồ thị ñường cong chuẩn, là một ñường cong có dạng hình quả chuông, miêu tả xấp xỉ nhiều hiện tượng xảy ra trong tự nhiên, trong công nghiệp và trong nghiên cứu. Phân phối chuẩn thường ñược nhắc ñến như là phân phối Gaussian, ñể tưởng nhớ ñến Karl Friedrich Gauss (1777 - 1855).
(b) Công thức tính xác suất của biến ngẫu nhiên chuẩn.
x
x
2
2
x
)[(2/1(
2 ]
−
/) σµ−
dx
dx
e
)
xn ;(
.
.
<
xX <
=
, ) σµ
=
xP ( 1
2
∫
∫
1 2
π
σ
x 1
x 1
X
Z
=
Phép chuyển
ñưa biến ngẫu nhiên chuẩn X bất kỳ thành một biến ngẫu nhiên chuẩn
µ− σ
(
)
thì Z sẽ nhận các giá trị trong
hóa Z. Do ñó, nếu X nhận các giá trị trong khoảng
1 xx ,
2
z
X
x
Z
z
(
)
)
zP (
)
khoảng
nên
,
với
.
<
<
=
<
<
x = 1
x = 2
z 1
2
1 zz ,
2
xP ( 1
2
1
2
µ− σ
µ− σ
Ví dụ 8 Một loại pin có tuổi thọ trung bình là 3 năm và ñộ lệch tiêu chuẩn là 0,5 năm. Giả sử tuổi thọ của pin có phân phối chuẩn, tìm xác suất ñể pin có tuổi thọ ít hơn 2,3 năm.
31
Giải: Ta tìm xác suất
P X (
2,3)
P Z (
)
P Z (
1,4)
0,0808
<
=
<
=
< −
=
2,3 3 − 0,5
800
778
800
834
P
X
P
Z
)834
778
(
(
)
<
<
=
<
<
P
Z
Ví dụ 9 Một loại bóng ñèn thắp sáng có tuổi thọ tuân theo phân phối chuẩn với trung bình bằng 800h và ñộ lệch tiêu chuẩn là 40h. Tìm xác suất ñể bóng ñèn có tuổi thọ từ 778h ñến 834h. Giải: Gọi X là tuổi thọ của bóng ñèn. Ta tìm xác suất : − 40 8023
− 40 ,0 5111
)85,0
2912
,0
,0
55,0( −
=
<
<
=
−
= IX. Phân phối mũ : Biến ngẫu nhiên liên tục X có phân phối mũ, với tham số β, nếu hàm
x / β−
e
khi
x
,
0
>
0>β
xf )(
mật ñộ của nó ñược cho bởi .
. , trong ñó
=
khi
x
1 β 0
,
0
≤
7.3 KỲ VỌNG VÀ PHƯƠNG SAI CỦA CÁC PHÂN PHỐI XÁC SUẤT THƯỜNG GẶP
STT
Phân phối xác suất
Kỳ vọng
Phương sai
k
k
2
(
)
=µ
2 =σ
µ−
1
ix
ix
x
,...,
xx ,
kxf );(
kx
2
1=
1 ∑ k 1 i =
1 ∑ k 1 i =
np=µ
npq
2
=σ 2
x
n
x
;(
,
,...,
2,1,0=
x qpC n
3
k
pkx ,
;(*
,
x
k
kk ,
,1
,...2
=
+
+
phân phối ñều rời rạc 1 = , k phân phối nhị thức xn − , pnxb =) phân phối nhị thức âm k kx 1 − − b qpC ) = x 1 −
1
2 =σ
=µ
4
1 −
xpq
)
,
=
..3,2,1=x
1 p
p− 2 p
n
1
−
2 =σ
=µ
5
knNxh
x
n
,(
,
,...,
,
=),
2,1,0=
k N
k N
nN − N 1 −
nk N
phân phối hình học pxg ;( phân phối siêu bội xn x − CC kN k − n C N
x
λ−
e
t
)
xp ,(
phân phối Poisson
t ) =λ
tλ=µ
6
tλ=σ 2
t λ ( x !
,...2,1,0=x phân phối ñều liên tục
2
(
x
[
BA ,
]
,
∈
=µ
7
2 =σ
BAxf
,(
,
)
=
BA + 2
AB − ) 12
x
1 AB − 0
[
BA ,
]
,
∉
phân phối chuẩn
x
)[(2/1(
2]
−
/) σµ−
e
xn ;(
,
) =σµ
8
µ
2σ
e
1 2 πσ ,3 14159
,
,2
71828
...
...
=π
=
,
x +∞<<∞−
x / β−
e
x
,
0
>
2
2
β=µ
xf )(
phân phối mũ
=
9
β=σ
x
1 β 0
,
0
≤
32
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$8. MẪU NGẪU NHIÊN
VÀ PHÂN PHỐI MẪU CỦA CÁC THỐNG KÊ THƯỜNG GẶP
PHẠM XUÂN ðỒNG
MỞ ðẦU:
Chúng ta ñã làm quen với biến ngẫu nhiên trong xác suất, ñược xét trong mô hình với ñiều kiện lý tưởng, chỉ có một quy luật xảy ra mà không bị nhiễu bởi các yếu tố khác. Do ñó khi nói biến ngẫu nhiên X có hàm phân phối f(x) thì có nghĩa là các quan sát cho các giá trị của phân phối f(x), ñồng thời trung bình, phương sai của X cũng là trung bình, phương sai của tất cả các quan sát.
Trong thực tế, các biến ngẫu nhiên như lượng mưa trong một năm, năng suất lúa tại một vùng, chất lượng của sản phẩm ñóng hộp,… cho những quan sát mà sự hiểu biết của chúng ta không ñủ ñể có thể dự ñoán ñược kết quả riêng rẽ xẩy ra, cũng như không biết diễn biến theo quy luật nào. Tuy nhiên những kết quả tính theo trung bình của một số lượng lớn những quan sát lại thấy có tính ổn ñịnh thống kê.
Khi nghiên cứu một ñối tượng, chúng ta không thể có ñược tất cả các quan sát (tổng thể) về nó vì nhiều lý do, chẳng hạn: do số lượng quá lớn, do có thể phá hủy ñối tượng sau khi quan sát,…Vì vậy chúng ta chỉ có thông tin ñầy ñủ một số các quan sát (một mẫu). ðể tránh các kết luận sai lầm liên quan ñến tổng thể thì tốt nhất nên lựa chọn mẫu ngẫu nhiên sao cho các quan sát ñược thực hiện ñộc lập và ngẫu nhiên.
Nếu ta thực hiện quan sát lần thứ i (i =1, 2,.., n) từ tổng thể f(x), thì biến ngẫu nhiên Xi nhận giá trị bằng số xi . Các giá trị ñó thu ñược bằng cách lặp lại thí nghiệm n lần ñộc lập trong cùng ñiều kiện như nhau sẽ cho các biến X1 , X2 , …, Xn ñộc lập và mỗi biến có cùng phân phối f(x). Khi ñó, nếu hàm phân phối xác suất ñồng thời thỏa mãn: f(x1, x2,…, xn)= f(x1) f(x2) …f(xn) thì gọi (X1 , X2 , …, Xn) là mẫu ngẫu nhiên cỡ n từ tổng thể f(x).
Mục tiêu của lý thuyết thống kê là từ những số liệu dạng bảng số của mẫu ngẫu nhiên, nghiên cứu khả năng thu ñược những kết quả tin cậy, rút ra ñược kết luận khách quan về tổng thể và xây dựng phương pháp ñể rút ra kết luận ñó (gọi là phương pháp mẫu).
8.1 TỔNG THỂ , MẪU VÀ THỐNG KÊ. 1. Tổng thể: là tất cả các quan sát có thể có của một ñối tượng mà chúng ta quan tâm.
Số lượng các quan sát trong tổng thể gọi là cỡ của tổng thể.
Một số tổng thể có cỡ lớn ñển nỗi về mặt lý thuyết chúng ta ñã giả thuyết chúng là vô hạn.
2. Một mẫu : là một tập con của một tổng thể. Chú ý: Mẫu ngẫu nhiên (X1 , X2 , …, Xn) là n lần quan sát bất kỳ về ñối tượng X. Còn (x1, x2, …, xn) là số liệu lấy ñược khi quan sát mẫu ngẫu nhiên ñó, còn gọi là mẫu thực nghiệm. 3. Thống kê : là hàm của các biến ngẫu nhiên tạo thành mẫu ngẫu nhiên
X
(
,
,...,
gọi là thống kê
ˆ Θ =
Cho mẫu ngẫu nhiên (X1 , X2 , …, Xn) thì
)n
g X X 1
2
8.2 MỘT SỐ THỐNG KÊ QUAN TRỌNG
Hai tham số chính µ và σ2, ñể ño vị trí tâm và tính biến thiên của phân phối xác suất. ðây là các tham số tổng thể không ñổi và không bị ảnh hưởng hay tác ñộng do các kết quả của một mẫu ngẫu nhiên. Một số thống kê quan trọng sau ñây cũng là những biến ngẫu nhiên mô tả
33
qua các giá trị ño tương ứng của một mẫu ngẫu nhiên (X1 , X2 , …, Xn).
Thống kê ñược dùng nhiều nhất ñể ño tâm của một tập các số liệu ñược bố trí theo trật tự ñộ lớn là trung bình mẫu, median mẫu (trung vị ) và mode. Còn ño sự phân tán là phương sai mẫu, ñộ lệch tiêu chuẩn mẫu, khoảng biến thiên.
Cho (X1 , X2 , …, Xn) biểu diễn một mẫu ngẫu nhiên có cỡ n, khi ñó:
n
X
i
X
1. Trung bình mẫu (kỳ vọng mẫu) .
.
∑ i 1 == n
Chú ý: Thống kê X có giá trị
x
= ∑ khi X1, X2,.. nhận giá trị x1, x2, …
x i
1 n n = i 1
X
(
~ X
2. Median mẫu .
X
n 1)/2 + X +
n
/2
n ( /2) 1 +
, nếu n lẻ . , nếu n chẵn
=
2
với
,...,
X ñược sắp xếp theo thứ tự tăng dần
n
X X , 1
2
3. Mode M là giá trị của mẫu mà xảy ra thường xuyên nhất hoặc có tần số lớn nhất
Mode có thể không tồn tại, khi tất cả các quan sát xảy ra cùng tần số và khi nó tồn tại
không nhất thiết là giá trị duy nhất khi có nhiều giá trị xảy ra cùng với tần số lớn nhất
n
2
X
X
(
)
−
∑
i
2
i
1 =
S
4. Phương sai mẫu .
.
=
n
1
−
n
n
n
2
2
n
X
X
X
n X
(
)
−
−
∑
∑
∑
2 i
i
2 i
2
i
i
1 =
1 =
ðịnh lý: .
.
S
=
=
n
n n (
1
−
−
i 1 = 1) 5. ðộ lệch tiêu chuẩn mẫu ký hiệu bằng S là căn số bậc hai dương của phương sai mẫu. 6. Khoảng biến thiên của một mẫu ngẫu nhiên X1, X2, …, Xn ñược xác ñịnh bằng thống kê X(n)−X(1) trong ñó X(n) và X(1) tương ứng là các giá trị quan sát lớn nhất và nhỏ nhất trong mẫu.
∧ P
7. Tỉ lệ mẫu : .
. với X là số lần thành công trong n phép thử.
=
X n
X m
996 2
998 10
1004 21
1000 24
1002 35
Ví dụ 1 Khối lượng hộp sữa X (gam) của một dây chuyền ñóng hộp cho bởi số liệu sau: 1006 8 (a) Xác ñịnh cỡ mẫu (b) Tính trung bình mẫu, median mẫu, mode M (c) Phương sai mẫu, ñộ lệch tiêu chuẩn mẫu, khoảng biến thiên. (d) Gọi hộp sữa là chuẩn nếu khối lượng là 1000 ± 5 (gam) . Tính tỉ lệ hộp sữa ñạt chuẩn. 8.3 CÁC HÀM PHÂN PHỐI XÁC SUẤT CỦA THỐNG KÊ. I. PHÂN PHỐI LẤY MẪU CỦA GIÁ TRỊ TRUNG BÌNH. 1. ðịnh nghĩa: Phân phối xác suất của một thống kê ñược gọi là phân phối lấy mẫu. Phân phối lấy mẫu quan trọng ñầu tiên xem xét là phân phối mẫu của giá trị trung bình X Giả sử một biến ngẫu nhiên của n quan sát ñược lấy từ một tổng thể tuân theo phân phối chuẩn có giá trị trung bình µ và phương sai σ2. Mỗi quan sát Xi (i = 1, 2, …, n) của mẫu ngẫu nhiên khi ñó sẽ có cùng phân phối chuẩn như tổng thể ñang xét. Vì thế, về bản chất có thể sinh
34
2
X
X
X
+
...
2 2 + σ σ
µ µ
µ
n
1
2
X
Ta có:
nên
=
=
=
= , µ
µ X
2 σ X
ra X là phân phối chuẩn. ... + + n
+ + + n
... + + 2 n
2 σ σ = n
2. ðịnh lý giới hạn trung tâm: Nếu X là giá trị trung bình của một mẫu ngẫu nhiên có kích thước n lấy từ tổng thể có giá trị trung bình µ và phương sai hữu hạn σ2, khi ñó giới hạn
là phân phối chuẩn chuẩn hóa
N z (
; 0 , 1)
phân phối của thống kê
Z
=
khi n → ∞ .
µ n
− /
X σ
30
n <
Chú ý: Phép xấp xỉ chuẩn ñối với X nói chung sẽ tốt nếu n ≥≥≥≥ 30 không kể hình dạng của tổng thể. Nếu , mức xấp xỉ sẽ chỉ tốt nếu tổng thể không quá khác so với phân phối chuẩn và như ñã nêu ở trên. Nếu tổng thể ñược xác ñịnh là chuẩn, thì phân phối lấy mẫu của X sẽ cho phép một phân phối chuẩn chính xác, cho dù cỡ của mẫu nhỏ.
Ví dụ 2 Một công ty ñiện sản xuất các loại bóng ñiện có tuổi thọ tuân theo phân phối chuẩn, với giá trị trung bình bằng 800 giờ và ñộ lệch tiêu chuẩn 40 giờ. (a) Tìm xác suất của biến ngẫu nhiên 16 bóng ñèn có tuổi thọ trung bình chưa ñến 775 giờ. (b) Tìm xác suất của biến ngẫu nhiên tuổi thọ bóng ñèn chưa ñến 775 giờ.
Có nhận xét gì về 2 yêu cầu trên.
Giải: (a) Gọi X là tuổi thọ của bóng ñèn. Phân phối X là phân phối chuẩn với
n
800
/
10
,
=
=
P X (
775)
P Z (
)
P Z (
2,5)
0,0062
<
=
<
=
< −
=
X
σ σ= , X
Xµ µ=
X
775 800 − 40 / 16 40
.
800
và
Xµ =
Xσ =
775)
P X (
P Z (
P Z (
)
< −
0,625) 0,266 =
<
=
<
=
(b) Phân phối X là phân phối chuẩn với Xác suất ñể bóng ñèn có tuổi thọ X chưa ñến 775 giờ là : 775 800 − 40
2
2 1σ và
X−
Nhận xét: Hai biến ngẫu nhiên có cùng phân phối xác suất chuẩn, nhưng khác nhau ở chỗ tính XS của một thống kê là hàm n biến ngẫu nhiên (X1 , X2 , …, Xn) và tính XS của một biến ngẫu nhiên X (tuổi thọ của bóng ñèn). Do ñộ lệch chuẩn khác nhau nên xác suất không bằng nhau. 3. Phân phối mẫu của sự sai khác giữa hai giá trị trung bình ðịnh lý: Nếu các mẫu ñộc lập có kích thước n1 và n2 ñược lấy ngẫu nhiên từ hai tổng thể, rời 2σ tương ứng, khi rạc hoặc liên tục, có các giá trị trung bình µ1 và µ2, các phương sai , ñó phân phối của các thống kê mẫu của các sự sai khác giữa hai giá trị trung bình, 2 và ñược phân phối xấp xỉ chuẩn có giá trị trung bình và phương sai bằng:
=
X 1 µ µ − 2
1
X Xµ
−
1
2
X
X
)
(
)
−
Z
có phân phối xấp xỉ phân
. Khi ñó thống kê:
=
=
σ −
2 X X 1
2
2 2 σ σ 2 1 + n n 2 1
/
)
/
)
+
− 1 2 ( σ 1
2 n 1
( − µ µ 1 2 2 ( σ 2
n 2
phối chuẩn hóa n(z; 0,1).
II. PHÂN PHỐI MẪU CỦA PHƯƠNG SAI MẤU S2. ðịnh lý: Nếu S2 là phương sai của mẫu ngẫu nhiên có kích thước n ñược rút ra từ một tổng
2
2
n
)
n
S
(
có
thể có phân phối chuẩn có phương sai σ2 . Khi ñó thống kê
2 χ
=
= ∑
1) − 2 σ
i
X X ( − i 2 σ= 1
2
2S : (a) lớn hơn 9,1.
6σ = , sẽ có phương sai mẫu
phân phối Khi bình phương với v = n− 1 bậc tự do. Ví dụ 3 Tìm xác suất ñể một mẫu ngẫu nhiên của 25 quan sát, từ một tổng thể chuẩn có phương sai (b) trong khoảng 3,462 và 10,745. Giả thiết các phương sai mẫu là các giá trị ño liên tục.
35
2
n
S
(
và bậc tự do là
9,1
36, 4
Giải:
>
2 ⇔ = χ
=
2 S >
v
1 24
n= − =
2
0, 05
S<
2 P χ > <
1) − 2 σ là ( 13,848 ⇔ 2 < χ<
24 9,1 × 6 36, 4) 2 < χ =
= 42,96 42,96) 0,95 0, 01 0,94 −
=
2 S > (a) Xác suất ñể 9,1 10, 745 3, 462 (b) < P nên xác suất là (13,848 8.4 TÍNH CÁC THỐNG KÊ MẪU 1, 2 CHIỀU BẰNG MÁY CASIO fx-500MS 1. Thống kê mẫu một chiều + Mẫu cỡ n : cho dưới dạng dãy số: x1, x2, …, xn hoặc bảng tần số (Σmi = n)
+ Xoá bộ nhớ cho lần tính mới: SHIFT
X m … x1 m1 xk mk
+ Vào chế ñộ SD: MODE 2
x2 m2 CLR 3 = =
ix
ix
im M +
và cho bảng tần số + Nhập số liệu: cho dãy số M + ;
n
X
+ Xem kết quả: SHIFT S VAR 1 − = ⇒
x x n , SHIFT S 1 SUM− = ⇒ x x sσ − = , , 1 ∑ ∑ 2,
2. Thống kê mẫu hai chiều + Mẫu cỡ n : cho dưới dạng cặp số: (x1, y1), … (xn, yn) hoặc bảng tần số:
… x1 x2 xk
X Y y1 … yh m11 mlh m21 m2h mk1 mkh Nhập số liệu:
, Nhập theo cặp số xi yi M+ Nhập theo bảng tần số ; mij M+ xi , yj
2. Cách sử dụng bằng máy CASIO fx-500MS + Xoá bộ nhớ cho lần tính mới: SHIFT
CLR 3 = = ,
+ Vào chế ñộ REG: MODE 3 1
ix
iy
ix
jy
+ Nhập số liệu: cho cặp số , bảng tần số M + M + , , ;
ijm ⊳
X
⊳ , + Xem kết quả: SHIFT S VAR 1 − = ⇒
xy y y x n , sσ − = Y n 1 2, , ⊳ SHIFT S 1 SUM− = ⇒ x x sσ − = , n 1 ∑ ∑ 2, x y y ,A B r , ∑ ∑ ∑
Ví dụ 4 Các giá trị ño công suất sinh nhiệt của than do hai mỏ sinh ra (tính theo triệu calo mỗi tấn) có số liệu sau. Tính công suất sinh nhiệt trung bình của 2 mỏ trên và phương sai mẫu. Mỏ 1: 8260 8130 8350 8070 8340 ,
Mỏ 2: 7950 7890 7900 8140 7920 7840
36
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$9. BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH
PHẠM XUÂN ðỒNG
MỞ ðẦU Mục ñích của phần này là sử dụng các phương pháp truyền thống ñể ước lượng tham số tổng thể như trung bình µ , phương sai σ2 và tỷ lệ thực p (gọi chung θ), bằng cách tính các thống kê X , S2 , Pˆ (gọi chung Θˆ ) của mẫu ngẫu nhiên và áp dụng lý thuyết về phân phối lấy mẫu. Cách tìm các giá trị θˆ từ số liệu mẫu (x1, x2, …, xn) sao cho gần với giá trị θ nhất thì gọi là bài toán ước lượng tham số. Ví dụ như ñịnh lý giới hạn trung tâm cung cấp thông tin về mối quan hệ giữa trung bình mẫu X và trung bình tổng thể µ , nên bất cứ kết luận nào về µ ñều có thể dựa vào trung bình mẫu và phân phối lấy mẫu. Có thể giải thích tương tự cho quan hệ giữa σ2 và S2.
ðể biết ước lượng θˆ so với θ có tốt không, ta phải ñưa ra các tiêu chuẩn ñánh giá chất
E
lượng về sai số và ñộ tin cậy gọi là nguyên lý thống kê. Suy luận thống kê có thể chia thành hai lĩnh vực chính: ước lượng và kiểm ñịnh giả thiết. 9.1 CÁC PHƯƠNG PHÁP ƯỚC LƯỢNG TRUYỀN THỐNG I. ƯỚC LƯỢNG ðIỂM. Một ước lượng ñiểm về tham số tổng thể θ là một giá trị ñơn θˆ của một thống kê Θˆ Ví dụ như giá trị x của thống kê X , ñược tính toán từ một mẫu cỡ n, là một ước lượng ñiểm của tham số tổng thể µ. Cũng có thể thu ñược một ước lượng của µ bằng cách sử ~ dụng giá trị x~ của trung vị mẫu X .
=
)ˆ( = θΘ
ˆ
µΘ
.
ˆΘ là hai ước lượng không chệch của cùng tham số tổng thể θ, thì chúng ta
ˆΘ và
1
2
Nếu
II. CÁC TÍNH CHẤT CỦA MỘT ƯỚC LƯỢNG TỐT. 1. Ước lượng không chệch: Một thống kê Θˆ ñược xem là ước lượng không chệch cho tham số θ nếu 2. Ước lượng hiệu quả: Ước lượng không chệch của tham số θ có phương sai nhỏ nhất ñược gọi là ước lượng hiệu quả của θ. sẽ lựa chọn ước lượng mà phân phối lấy mẫu của nó có phương sai nhỏ hơn. ~ Chú ý: ðối với các tổng thể chuẩn thì X , X là các ước lượng không chệch của trung bình tổng thể µ, tuy nhiên phương sai ~ của X nhỏ hơn phương sai của X trong một mẫu xác ñịnh, vì ~ thế X có hiệu quả cao hơn X
.
III. ƯỚC LƯỢNG KHOẢNG
%100)
1( α−
)ˆ,ˆ( L θθ U
1)ˆ
α
−=
n
/2
Từ mẫu thực nghiệm kích thước n, ta muốn ước lượng θ với xác suất xẩy ra chứa ñược giá trị chưa biết θ khá lớn. Tức là cần xác ñịnh một khoảng
X
ˆ( LP sao cho xác suất xảy ra là << θθθ U của thống kê Θˆ và phân phối lấy mẫu của nó. Khi cỡ mẫu tăng thì giảm ñi nên ước lượng có thể gần hơn ñến tham số µ, vì khoảng biến thiên ngắn hơn. Nói chung là các mẫu khác nhau sẽ sinh ra các giá trị Θˆ khác nhau và vì thế có các giá trị khác nhau của Lθˆ và Uθˆ . Các ñiểm mút ñó là các giá trị của các biến ngẫu nhiên tương ứng sao cho
LΘˆ
. Tham số tổng thể θ phụ thuộc vào giá trị 2 σσ =
1)
và UΘˆ
−=
ˆ( ˆ LP << ΘθΘ U
α
37
%100)
1. ðịnh nghĩa: Khoảng
1( α−
)ˆ,ˆ( L θθ U
1)ˆ
gọi là khoảng tin cậy của θ với ñộ tin cậy nếu
α
−=
ˆ( LP << θθθ U
. .
%100)
Các ñiểm cuối Lθˆ và Uθˆ ñược gọi là các giới hạn tin cậy trên và dưới
2. Chú ý: Với một giá trị của
1( α− |ˆ
có nhiều khoảng ước lượng của θ nên thường chọn
)ˆ,ˆ( L θθ U
ˆ| U θθ − L
nhỏ nhất, giúp ta xác ñịnh chính xác hơn tham số cần tìm. sao cho
khoảng
9.2 MẪU ðƠN: ƯỚC LƯỢNG CHO MỘT TRUNG BÌNH µ
x
.
µ
x +<
<
−
2/
2/
z α
z α
σ n
.
1. Tổng thể chuẩn , biết ñộ lệch tiêu chuẩn σ Khoảng tin cậy (1−−−−αααα)100% của µ, khi biết σ là σ n là giá trị z tạo một diện tích
2/αz
trong ñó 2/α bên phía phải của nó.
Chứng minh: Theo ñịnh lý giới hạn trung tâm, phân phối lấy mẫu của X là phân phối chuẩn
n
/σσ =
Z
=
∞→n
µµ =X
X
µ− n
X /σ
Z
z
1)
zP ( −
<
<
α−=
zXP
(
1)
với , nên là phân phối chuẩn chuẩn hóa khi
µ
α
⇔
−
<
<
zX +
−=
2/
2/
α
α
2/
2/
α
α
σ n
σ n
Do ñó:
30≥n
và chưa biết σ hoặc không biết phân phối của tổng thể thì vẫn sử
/2
/2
ZP (
P Z ( / 2 ) 1 / 2 . α α > ⇔ = = − z α z α
Chú ý: (1) Với dụng công thức trên bằng cách sử dụng s thay cho σ. (2) Cách tra bảng tìm giá trị (Vì bảng A.3 cho giá trị
2/αz z < )
%100)
: ðổi α= P Z ( ) < với diện tích bên trái số z là α )
ðịnh lý: Với ñộ tin cậy
1( α−
| µ−x |
z α 2/
σ n
x
|
thì sai số sẽ không vượt quá
−
z | ≤ µ α 2/
σ n
. .
ðịnh lý: Với ñộ tin cậy
1( α−
| µ−x |
%100) 2
n
thì sai số sẽ không vượt quá một lượng cụ thể e
=
z σα 2/ e
ml
n
g
(6,2
,36
)
/
=
=
khi cỡ mẫu là: . . (n ñược làm tròn ñến số nguyên tiếp theo)
Ví dụ 1 Hàm lượng kẽm trung bình thu hồi ñược từ một mẫu có các giá trị ño kẽm tại 36 ñiểm ño khác nhau là 2,6g/mililít. Giả thiết ñộ lệch tiêu chuẩn tổng thể là 0,3. (a) Xác ñịnh khoảng tin cậy 95% cho mật ñộ kẽm trung bình. (b) Một mẫu cần lớn bao nhiêu nếu muốn ñộ tin cậy 95% sai số ước lượng µ nhỏ hơn 0,05? Giải: (a) Gọi µ là trung bình tổng thể của hàm lượng kẽm ñược thu hồi. Ta có ñộ lệch tiêu x chuẩn tổng thể σ = 0,3. Số liệu mẫu: ðể tìm khoảng tin cậy 95% của µ trong trường hợp biết ñộ lệch tiêu chuẩn σ , cỡ mẫu lớn,
x
µ
−
<
x +<
2/
2/
z α
z α
σ n
96,1
50,2
70,2
ta có:
<
σ n =
= z
< µ
2/
,0
025
|
zα 05,0
. Ta có Với ñộ tin cậy (1−α)% = 95% ⇒ α = 0,05 nên
n
]3,138[1
139
=+
=
=
z σα 2/ e
x µ e | =≤ − 2
nên (b) Sai số ước lượng µ nhỏ hơn 0,05 ⇔
38
2. Tổng thể chuẩn, chưa biết σ , cỡ mẫu nhỏ (n < 30).
Khoảng tin cậy (1−−−−αααα)100% của µ, khi chưa biết σ , cỡ mẫu n nhỏ là
x
x
−
<
µ +<
2/
2/
t α
t α
s n
s n
. .
v
1−= n
2/αt
283
là giá trị t với bậc tự do, sinh ra một diện tích bằng 2/α bên phía phải.
,0=s
7=n
, ,
x
trong ñó Ví dụ 2 Hàm lượng axit sulfuric của 7 container là 9,8 ; 10,2 ; 10,4 ; 9,8 ; 10,0 ; 10,2 và 9,6 lít. Tìm khoảng tin cậy 95% cho giá trị trung bình của tất cả các container ñó, giả sử phân phối xấp xỉ chuẩn. Giải: Gọi µ là trung bình tổng thể của hàm lượng axit sulfuric tất cả các container Tính số liệu mẫu: 10=x ðể tìm khoảng tin cậy 95% của µ trong trường hợp chưa biết ñộ lệch tiêu chuẩn σ , cỡ mẫu nhỏ, phân phối xấp xỉ
−
<
x µ +<
2/
2/
t α
t α
s n
s n
chuẩn, ta có:
6=v
,2 = 26,10
447
025 <
= t ,0 < µ
Với ñộ tin cậy (1−α)% = 95%⇒α = 0,05 nên có . Ta với
tα 2/ 74,9 Chú ý: Miền có diện tích α trong A.3 nằm bên trái zα , còn trong bảng A.4 nằm bên phải tα Ví dụ 3 ðể xem mức tiêu hao xăng của một loại ôtô, người ta cho chạy từ A ñến B trong 40 lần và ghi ñược số liệu như sau. Với ñộ tin cậy 94%, hãy ước lượng mức tiêu hao xăng trung bình của loại ôtô ñó theo 2 trường hợp (a) Biết rằng mức tiêu hao xăng tuân theo phân phối chuẩn có ñộ lệch tiêu chuẩn là 0,2. (b) Chưa biết phân phối xác suất của mức tiêu hao xăng.
Mức tiêu hao xăng (lít) Số xe 9,7 5 9,8 7 10,0 13 10,1 9 10,3 6
,0=s
40=n
, ,
Giải: Gọi µ là mức tiêu hao xăng trung bình của loại ôtô ñó. 995,9=x Tính số liệu mẫu: 1887 (a) ðể tìm khoảng tin cậy 95% của µ trong trường hợp phân phối chuẩn, biết ñộ lệch tiêu
x
−
<
x +<
µ
2/
2/
z α
z α
σ n
88,1
9356
0545
,10
,9
chuẩn σ , ta có:
=
= z
<
< µ
2/
03,0
zα
x
. Ta có
<
−
x µ +<
2/
2/
z α
z α
s n
88,1
cỡ mẫu lớn, ta có:
= z
=
03,0
2/
zα
9389
0511
,10
<
< µ
. Ta có
σ n Với ñộ tin cậy (1−α)% = 94% ⇒ α = 0,06 nên (b) ðể tìm khoảng tin cậy 95% của µ trong trường hợp chưa biết ñộ lệch tiêu chuẩn σ nhưng s n Với ñộ tin cậy (1−α)% = 94% ⇒ α = 0,06 nên ,9 9.3 HAI MẪU: ƯỚC LƯỢNG HIỆU HAI TRUNG BÌNH µ1 −−−− µ2 1. Tổng thể chuẩn, biết σσσσ1, σσσσ2.
Khoảng tin cậy (1−−−−αααα)100% của µ1 −−−− µ2 , khi biết σσσσ1, σσσσ2 là
x
x
(
)
(
)
−
−
<
<
−
+
x 1
2/
2
µµ − 1
2
2
x 1
2/
z α
z α
2 2 σσ 2 1 + n n 1
2
2 2 σσ 1 2 + n n 1
2
. .
39
30≥n
và chưa biết σ1, σ2 hoặc không biết phân phối của tổng thể thì vẫn sử
Chú ý: Với dụng công thức trên bằng cách sử dụng s1, s2 thay cho σ1, σ2 .
B µµ , A
B µµ − A
, trong ñó
B µµ , A
n
n
,50
,75
42
là trung bình tổng thể của tổng số dặm ñi ñược trên một gallon của máy A, B
=
=
=
=
A
A
B
B
,
B µµ − A
Ta có ñộ lệch tiêu chuẩn tổng thể σA =6, σB =8. x x Số liệu mẫu: 36 ðể tìm khoảng tin cậy 96% của hiệu hai trung bình tổng thể trong trường hợp
Ví dụ 4 Tiến hành thí nghiệm với hai loại ñộng cơ A và B ñể so sánh số dặm ñã ñi ñược trên mỗi gallon xăng. Trong 50 thí nghiệm tiến hành có sử dụng loại ñộng cơ A và 75 thí nghiệm ñược tiến hành cho ñộng cơ B thì số dặm ñã ñi trung bình ñối với ñộng cơ A là 36 dặm/gallon và ñối với B là 42 dặm/gallon. Xăng sử dụng và các ñiều kiện khác không ñổi. Tìm khoảng tin là trung bình tổng thể của tổng số dặm của máy B, A. cậy 96% của Giả thiết rằng ñộ lệch tiêu chuẩn tổng thể là 6 và 8 cho lần lượt máy A và B. Giải: Gọi biết ñộ lệch tiêu chuẩn σA , σB , ta có:
2 A
2 A
x
x
x
x
(
)
(
)
−
−
<
<
−
+
B
A
A
B
µµ − A
B
2/
2/
z α
z α
2 σσ B + n n
B
A
05,2
43,3
57,8
= z
=
A <
<
2 σσ B + n n B B µµ − A
02,0
2/
zα
. Ta có
Với ñộ tin cậy (1−α)% = 96% ⇒ α = 0,04 ⇒ 2. Tổng thể phân phối chuẩn chưa biết σσσσ1, σσσσ2 nhưng σσσσ1 = σσσσ2 .
Khoảng tin cậy (1−−−−αααα)100% của µ1 −−−− µ2 , khi chưa biết σσσσ1, σσσσ2 nhưng σσσσ1 = σσσσ2 là :
x
s
x
s
(
)
(
)
+
−
−
<
<
−
+
+
p
p
x 1
2/
2
µµ − 2
1
x 1
2/
2
t α
t α
1 n
1 n
1 n 1
2
1 n 1
2
s
(
(
)1
−
n 1
2 2
. .
=
2 s 1 , s
2 2
2 s p
+ n
2 s 1 +
)1 n 1
2
v
n
2
=
+
−
n − 2 2 − là giá trị của phân phối-t với
là giá trị trung bình của 2 phương sai mẫu
n 1
2
2/αt
bậc tự do
Ví dụ 5 Học viện bách khoa Virginia ñã nghiên cứu ñể ước lượng ñộ chênh lệch về lượng của hóa chất orthophospho ñược ño tại hai trạm khác nhau trên sông James. Trong 15 mẫu thu tại trạm 1 có hàm lượng orthophospho trung bình là 3,84 miligam/ lít và ñộ lệch chuẩn 3,07 miligam/lít, trong khi ñó 12 mẫu của trạm 2 có hàm lượng trung bình 1,49 miligam/lít và ñộ lệch chuẩn 0,80 miligam/lít. Tìm khoảng tin cậy 95% cho hiệu của các trung bình chân thực hàm lượng orthophospho tại hai trạm này, giả thiết rằng các quan sát lấy từ các tổng thể chuẩn có phương sai bằng nhau. Giải: Gọi
n
x
1,µµ là trung bình tổng thể của hàm lượng orthophospho ño ñược tại hai trạm 1,2. ,12
07,3
80,0
15
,84,3
2 =
=
=
=
=
n 1
x 1
s 1
2
2
= trong trường hợp chưa
s ,49,1 2 1 µµ − 2
;
x
s
x
s
(
)
(
)
−
−
<
<
−
+
+
+
p
p
x 1
2/
2
µµ − 2
1
x 1
2/
2
t α
t α
1 n
1 n
1 n 1
2
1 n 1
2
,2
056
Số liệu mẫu: ðể tìm khoảng tin cậy 95% của hiệu hai trung bình tổng thể biết ñộ lệch tiêu chuẩn σ1 , σ2 nhưng biết σ1 = σ2 , ta có:
= t
=
2/
,0
025
2
tα 2
s
(
(
)1
−
14
07,3
11
8,0
×
×
n 1
2 2
s
,5
5595
,2
3579
35,2
. Với ñộ tin cậy (1−α)% = 95% ⇒ α = 0,05 nên
=
=
=
− x
=
x 1
2
2 p
=⇒ s p
+ 25
,0
,4
2276
,
<
2 s n )1 + − 1 2 n n 2 + − 1 2 4724 µµ < − 2
1
nên
40
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$10. BÀI TOÁN ƯỚC LƯỢNG TỶ LỆ
PHẠM XUÂN ðỒNG
10.1 MẪU ðƠN: ƯỚC LƯỢNG MỘT TỶ LỆ VỚI CỠ MẪU LỚN
ðịnh lý: Khoảng tin cậy (1−−−−αααα)100% của tỷ lệ p với mẫu lớn là
p
ˆ zp −
<
ˆ zp +<
2/
2/
α
α
ˆˆ qp n
ˆˆ qp n
ˆ p
1ˆ q
. .
−=
Z
p
.
=
=
ˆσ
ˆµ
)ˆ( PEP =
pq n
ˆ − pP pq n /
có phân phối chuẩn với trung bình , phương sai nên với pˆ là tỷ lệ của các thành công trong một mẫu ngẫu nhiên có kích thước n và Chứng minh: Theo lý thuyết giới hạn trung tâm, ñối với n ñủ lớn, Pˆ có ñược phân bố chuẩn P =2
Z
z
1)
zP ( −
<
<
α−=
ˆ( zPP
1)
chuẩn hóa.
α
⇔
−
<
ˆ zPP +<
−=
2/
2/
2/
2/
α
α
α
α
pq n
pq n
Ta có:
ˆ( zPP
1)
α
−
<
ˆ zPP +<
−=
2/
2/
α
α
ˆˆ qp n
ˆˆ qp n
p
%100)
ˆ|
|
Khi n lớn, rất ít sai số xảy ra, nên thay thế ước lượng ñiểm pˆ cho p thì:
ðịnh lý: Với ñộ tin cậy
1( α−
p −
z 2/α
ˆˆ qp n
p
ˆ| p
thì sai số sẽ không vượt quá
−
z | 2/α≤
ˆˆ qp n
p
%100)
ˆ|
|
. .
1( α−
p −
thì sai số sẽ nhỏ hơn một lượng cụ thể e khi cỡ
ðịnh lý: Với ñộ tin cậy mẫu là
ˆˆ qp
n
2 z 2/ α= 2 e
p
%100)
ˆ|
|
. . (n ñược làm tròn ñến số nguyên tiếp theo)
sẽ không vượt quá một lượng cụ thể e khi cỡ mẫu là thì sai số
ðịnh lý: Nếu không có mẫu sơ bộ và pˆ ñược sử dụng là một ước lượng của p, với ñộ tin cậy 1( α−
p −
n
2 z 2/ α= 2 4e
Np
(
)
. .
Chú ý: Dựa vào ước lượng khoảng của tỷ lệ thực p ∈ (p1, p2) của tính chất T nào ñó có mặt trong tổng thể có số lượng N, người ta có thể tính số lượng phần tử có tính chất T là n ∈
1 Np ,
2
41
Ví dụ 1 Trong một mẫu ngẫu nhiên n = 500 gia ñình có ti vi tại thành phố Hamilton, Canada, xác ñịnh ñược rằng x = 340 gia ñình ñăng ký HBO.
(a) Tìm khoảng tin cậy 95% cho tỷ lệ thực các gia ñình trong thành phố này ñăng ký sử dụng HBO. Từ ñó ước lượng số gia ñình ñăng ký HBO trong 2000 gia ñình có ti vi tại thành phố này.
(b) Nếu ñộ tin cậy là 95% thì cần ñiều tra bao nhiêu gia ñình ñể sai số ước lượng p nhỏ hơn 0,02
(c) Nếu không có mẫu sơ bộ trên thì cần lấy mẫu cỡ bao nhiêu ñể ñộ tin cậy 95% của sai số ước lượng p nhỏ hơn 0,02
Giải: (a) Gọi p là tỷ lệ thực gia ñình sử dụng HBO
ˆ p
68,0
32,0
=
=
=
=⇒ ˆ q
x n
340 500
ðể tìm khoảng tin cậy 95% của tỷ lệ thực p trong trường hợp mẫu lớn, ta có:
p
ˆ zp −
<
ˆ zp +<
2/
2/
α
α
ˆˆ qp n
ˆˆ qp n
96,1
64,0
72,0
Số liệu mẫu: x = 340, n = 500 nên tỷ lệ mẫu là:
= z
=
< p
<
2/
,0
025
zα
. Ta có Với ñộ tin cậy (1−α)% = 95% ⇒ α = 0,05 nên
Từ ñó suy ra số gia ñình sử dụng HBO trong số 2000 gia ñình vào khoảng (1280 , 1440)
2
ˆˆ qp
(b) ðể sai số ước lượng p nhỏ hơn e = 0,02 thì cỡ mẫu cần ñiều tra là:
n
2090
=
=
=
2
2 z 2/ α 2 e
32,0.68,0.96,1 02,0
.
2
(c) ðể sai số ước lượng p nhỏ hơn e = 0,02 mà không có mẫu sơ bộ trên thì cỡ mẫu cần ñiều
n
2401
=
=
=
2
2 z 2/ α 2 e 4
96,1 02,0
tra là:
Ví dụ 2 ðể nghiên cứu về lượng sữa của một giống bò sữa mới, người ta tiến hành ñiều tra một cách ngẫu nhiên 100 con bò, cho kết quả như sau:
Lượng sữa X (kg) / ngày Số con bò < 9 10 9 -11 24 11 - 13 42 13 - 15 16 > 15 8
(a) Hãy ước lượng ñiểm lượng sữa trung bình trong một ngày của con bò và tỉ lệ tổng thể (%) của số con bò cho lượng sữa trên 11 lít trong một ngày. (b) Hãy ước lượng khoảng lượng sữa trung bình trong một ngày của con bò và tỉ lệ tổng thể (%) của số con bò cho sữa trên 11 lít trong một ngày với cùng ñộ tin cậy 98 %.
10.2 HAI MẪU: ƯỚC LƯỢNG HIỆU HAI TỶ LỆ VỚI CỠ MẪU LỚN
ðịnh lý: Khoảng tin cậy (1−−−−αααα)100% của hiệu hai tỷ lệ p1 −−−− p2 với cỡ mẫu lớn là
<
−
+
+
ˆ( p 1
)ˆ p 2
2/
z α
/2
ˆˆ qp 22 n
ˆˆ qp 11 n 1
2
ba ),(
. . ( ) − − < − + ˆ p 1 ˆ p 2 p 1 p 2 z α ˆ ˆ p q 1 1 n 1 ˆ ˆ p q 2 2 n 2
p ∈− 2
chứa giá trị 0 thì ñiều ñó có nghĩa là không có tỷ lệ tổng thể này
Chú ý: Nếu p 1 luôn lớn hơn tỷ lệ tổng thể kia.
42
Ví dụ 3 Mười trường kỹ thuật ở Mỹ ñược khảo sát mẫu cho kết quả là: 250 kỹ sư ñiện có 80
người là nữ; 175 kỹ sư hóa học có 40 người là nữ. Tìm khoảng tin cậy 90% cho sai số của tỷ lệ
nữ trong hai ngành kỹ thuật này.
Giải: Gọi p1, p2 là tỷ lệ tổng thể của nữ kỹ sư ñiện và kỹ sư hóa học.
2
n
x
ˆ p
,250
80
,175
40
32,0
,0
2286
=
=
=
=
=
=
=
=
n 1
x 1
2
2
ˆ p 1
2
x n
x 1 n 1
2
Số liệu mẫu: và nên ,
p
−
−
<
−
<
−
+
+
+
ˆ( p 1
)ˆ p 2
2/
p 1
2
ˆ( p 1
)ˆ p 2
2/
z α
z α
ˆˆ qp 22 n
ˆˆ qp 22 n
ˆˆ qp 11 n 1
2
ˆˆ qp 11 n 1
2
,1
6445
Khoảng tin cậy 90% của hiệu hai tỷ lệ tổng thể p1 − p2 trong trường hợp mẫu lớn là:
= z
=
05,0
zα 2/
⇒ 0, 0186 0,1616 Với ñộ tin cậy (1−α)%= 90% ⇒ α = 0,1 nên < − < p 1 p 2
Ví dụ 4 Một thay ñổi nhất ñịnh trong quá trình sản xuất các linh kiện ñang ñược xem xét. Các mẫu thu ñược sử dụng cả quá trình mới và quá trình hiện tại ñể xác ñịnh liệu quá trình mới có hiệu quả hơn hay không. Nếu 75 trong số 1500 linh kiện trong quy trình hiện tại ñược xác ñịnh có lỗi và 80 trong số 2000 linh kiện của quá trình mới ñược xác ñịnh có lỗi, tìm khoảng tin cậy 90% cho sai số chân thực trong phần các sản phẩm bị lỗi giữa quá trình hiện tại và quá trình mới.
p
,0
0017
0217
,0
−
<
−
<
p 1
2
. Vì khoảng này có giá trị 0, cho nên quá trình mới không
ðS: giảm nhiều về tỷ lệ các sản phẩm có lỗi so với phương pháp hiện ñại.
10.3 MẪU ðƠN: ƯỚC LƯỢNG PHƯƠNG SAI
Khoảng tin cậy (1−−−−αααα)100% của phương sai với mẫu n là
2
2
s
s
(
(
)1
2 σ
<
<
2/
2/
n )1 − 2 χ α
n − 2 χ 1 − α
2
. .
các giá trị của phân bố Khi bình phương với n−1 bậc tự do, sinh ra
2 1 αχ− 2/ 2/α và
2
n
S
(
2
X
trong ñó 2/αχ và các vùng có diện tích 2/ về bên phải. 1 α−
ñể ước
Chứng minh: Sử dụng thống kê
=
)1 − 2 σ
2
X
1)
−=
<
<
2/
2/
2 χ α
2
2
S
S
)1
(
(
⇒
P
2 σ
thể chuẩn nên
<
<
2σ . Ta biết thống kê X 2 có phân bố Khi lượng khoảng của bình phương có n−1 bậc tự do khi các mẫu ñược lựa chọn từ 2 P một ( α χ 1 − α 1 −=
2/
2/
n )1 − 2 χ α
n − 2 χ 1 − α
α tổng
Ví dụ 5 Trọng lượng (decagrams) của mười bao hạt giống do một công ty phân phối là:
46,4 46,13 45,83 47,0 46,1 45,9 45,8 46,9 45,2 46,0
Xác ñịnh một khoảng tin cậy 95% cho phương sai của tất cả các bao hạt giống, giả thiết trọng lượng bao tuân theo phân phối chuẩn.
43
Giải: Gọi σ là phương sai của các bao hạt giống.
n
x
s
,10
,126,46
,0
2841
=
=
2 =
2
2
s
s
(
(
)1
ðể tìm khoảng tin cậy 90% của phương sai σ , ta có:
2 σ
<
<
2/
2/
n )1 − 2 χ α
n − 2 χ 1 − α
Số liệu mẫu:
,2
700
,19
023
Với ñộ tin cậy (1−α)% = 95% ⇒ α = 0,05 và v = 9 , khi ñó sử dụng Bảng A.5 ta có:
=
=
=
2/
2 χ ,0
975
2 = χ ,0
025
2 χα 2/
2 χ α 1 −
134,0
947,0
, .
<σ
2 <
Vậy khoảng tin cậy của phương sai là:
TỔNG KẾT KHOẢNG TIN CẬY CỦA TRUNG BÌNH, TỶ LỆ, PHƯƠNG SAI
Trường hợp ước lượng
Khoảng tin cậy (sai số e, cỡ mẫu n, bậc tự do v)
2
n
=
x
|
−
x
−
<
x +<
µ
2/
2/
z α
z α
z σα 2/ e
σ n
x
x
−
<
µ +<
2/
2/
z α
z α
z σ µ α 2/ | ≤ n s n
σ n s n
30≥n
, , 1) trung bình µ của pp chuẩn, biết σ
v
1−= n
x
x
−
<
µ +<
2/
2/
t α
t α
s n
s n
30 x x ( ) ( ) − − < < − + x
1 2 2/ x
1 2 2/ −
µµ
2 1 z
α z
α ( ) 1,σσ 2
2
σσ
2
1
+
n
n
1 2 2
2
σσ
1
2
+
n
n
1 2 2
1 µµ −
2 x x ( ) ( ) + − − < < − + + x
1 2 2/ −
µµ
2 1 x
1 2 2/ z
α z
α 2
s
2
n 2
s
2
n 2
s
1
n
1 2 2
s
1
n
1 2 30 , 1*) trung bình µ của pp bất kỳ,
cỡ mẫu
2) trung bình µ của pp chuẩn,
chưa biết σ , cỡ mẫu
3) hiệu hai trung bình
của pp chuẩn, biết 1 µµ −
2 x s x s ( ) ( ) + − − < < − + + p p x
1 2/ 2 −
µµ
2 1 x
1 2/ 2 t
α t
α 1
n 1
n 1
n
1 2 1
n
1 2 3*) hiệu hai trung bình
của pp bất kỳ, cỡ mẫu
≥nn
1
2 s ( ( )1 − n
1 2
2 v n 2 1,σσ
2 = = + − n
1 2 2
s p 1 σσ =
2
30 +
n 2
s
1
+ n
−
2
2
− )1
n
1 2 ˆ
p p ˆ
p 1ˆ,
q với , ) 4) hiệu hai trung bình
của pp chuẩn, chưa biết
, cỡ mẫu
nhưng
ˆ
zp
− < ˆ
zp
+< = −= 2/ 2/ α α ˆˆ
qp
n x
n với 30≥n ˆˆ
qp p n n ˆ|
p 5) tỷ lệ p với cỡ mẫu . − z
|
2/α≤ ˆˆ
qp
n ˆˆ
qp
n
2
z
2/
α=
2
e 2
z
2/
α=
2
4e p Np ( ) ( , ) ∈ ∈⇒
n pp
,
1 2 Np
1 2 , , p − − + < − ˆ(
p
1 )ˆ
p
2 2/ p
1 2 z
α ˆˆ
qp
22
n ˆˆ
qp
11
n
1 2 p 5*) ước lượng số phần tử thành
công n trong tổng thể có N
phần tử khi biết tỷ lệ p p −
1 2 , cỡ < − + + ˆ(
p
1 )ˆ
p
2 2/ z
α ˆˆ
qp
22
n ˆˆ
qp
11
n
1 2 2 2 s s ( ( )1 2
σ < < . 6) hiệu hai tỷ lệ
mẫu
30≥n 2/ 2/ n
)1
−
2
χ
α n
−
2
χ
1
−
α 7) phương sai σ của pp chuẩn Trong ñời sống kinh tế xã hội chúng ta hay ñưa ra các nhận ñịnh hoặc ước ñoán. Ví dụ,
một nhà nghiên cứu y khoa có thể khẳng ñịnh dựa trên những chứng cứ thực nghiệm rằng uống
cà phê làm tăng khả năng mắc bệnh ung thư ở người; một kỹ sư có thể khẳng ñịnh dựa trên cơ
sở các mẫu số liệu, rằng có sự khác biệt giữa ñộ chính xác của hai loại máy ño. Một sự xác
nhận hay phỏng ñoán liên quan tới một hay nhiều tổng thể gọi là một giả thuyết thống kê. Sự ñúng hay sai của một giả thuyết thống kê không thể biết ñược một cách chắc chắn,
trừ khi ta khảo sát ñược toàn bộ tập hợp. ðiều này tất nhiên là không thực tế trong ña số các
trường hợp. Thay vào ñó, ta lấy một mẫu ngẫu nhiên từ tập hợp ñược quan tâm và sử dụng dữ
liệu có trong mẫu ñể ñưa ra bằng chứng mà theo ñó, ta chấp nhận hoặc không chấp nhận giả
thuyết. Bằng chứng từ mẫu mà mâu thuẫn với giả thuyết sẽ ñưa ñến việc bác bỏ giả thuyết;
ngược lại, bằng chứng phù hợp với giả thuyết sẽ ñưa ñến việc chấp nhận nó gọi là kiểm ñịnh
giả thiết. 1H . 0H dẫn ñến sự chấp nhận một ñối thuyết, ký hiệu là
, gọi là kiểm ñịnh hai phía.
, ñối thiết 0 Với dạng giả thiết :H θ θ≠
0 0H : 1
0θθ= 0 1 0H . Sự bác bỏ
:H θ θ=
0
:H θ θ>
0 1 Còn hoặc , gọi là kiểm ñịnh một phía. , :H θ θ=
0 :H θ θ<
0 0H ñúng 0H sai Chấp nhận 0H Quyết ñịnh ñúng Sai lầm loại II
0H Sai lầm loại I Quyết ñịnh ñúng 0H : 0θθ= H Bác bỏ 1 : θθ≠
0 là xét các giá trị trong lân cận của θ0. Những giá trị θ
hoặc ñối thiết 1 1 , tùy thuộc vào yêu cầu kiểm ñịnh. hoặc Bác bỏ giả thiết ñúng gọi là sai lầm loại I. Chấp nhận giả thiết sai gọi là sai lầm loại II.
Xác suất mắc phải sai lầm loại I, cũng ñược gọi là mức ý nghĩa, ñược ký hiệu là α.
Khi kiểm ñịnh giả thiết
khác ñáng kể θ0 với mức ý nghĩa α có vẻ phù hợp hơn với ñối thiết
:H θ θ>
0 :H θ θ<
0 Thủ tục ñể quyết ñịnh trong kiểm ñịnh giả thiết ñược xây dựng với khái niệm về xác
suất của quyết ñịnh sai lầm. Tức là việc chấp nhận một giả thuyết chỉ ñơn thuần là dữ liệu
không cho ñủ thông tin ñể bác bỏ nó. Nói cách khác, sự bác bỏ có nghĩa là có một xác suất
rất nhỏ ñể nhận ñược thông tin từ mẫu ñã ñược quan sát mà theo ñó, giả thuyết là ñúng.
Với kết quả rủi ro nhỏ của quyết ñịnh sai lầm, dường như sẽ an toàn khi bác bỏ giả thuyết.
Cũng nhấn mạnh rằng việc chấp nhận giả thuyết sẽ không loại bỏ những khả năng khác khi có
mẫu khác. Xác suất sai lầm loại I và loại II có liên quan ñến nhau. Việc giảm xác suất mắc sai lầm H H này sẽ làm tăng xác suất mắc sai lầm kia nên trong thực tiễn không thể ñồng thời làm giảm xác
suất của cả 2 sai lầm ñó trừ khi tăng cỡ mẫu n. Do sai lầm loại I dễ kiểm soát hơn nên chọn
trước số α rất nhỏ (thường bằng 0,05 hoặc 0,1) như là một ngưỡng ñể xác ñịnh sai lầm loại I .
Theo nguyên lý: “Một biến cố có xác suất nhỏ thì coi như không xẩy ra trong một phép thử”
nên kể cả trường hợp giả thiết ñúng mà bị bác bỏ thì khả năng ñó hầu như không xảy ra. 0 : θθ =
0 1 : θθ≠
0 0 và ñối thiết phù hợp hoặc . > < ,
θ θ θ θ
0 0H ) hoặc xác ñịnh giá trị tới hạn. 2. Chọn thống kê tiêu chuẩn hợp lý và tính giá trị của thống kê tiêu chuẩn từ dữ liệu mẫu
3. Chọn mức ý nghĩa α và tìm miền tiêu chuẩn (miền bác bỏ 4. Quyết ñịnh bác bỏ hay chấp nhận giả thiết H0. H H , 0 : µµ=
0 µµ≠
0 x X Z =⇒
z = µ−
0
n
/ σ / σ 2. Chỉ tiêu kiểm ñịnh: z > thz 2/αz (miền tiêu chuẩn là hoặc µ−
0
n
zth =
3. Với mức ý nghĩa α , tìm giá trị tới hạn
z −< thz | | ) z >| z ≤| thz thz 0H bị bác bỏ, nếu 0H ñược chấp nhận. H thì thì 4. Kiểm tra: nếu 0 : µµ=
0 1 1 x X Kết luận bài toán kiểm ñịnh
B. Kiểm ñịnh một phía:
1. , (hoặc ) :H θ θ>
0 :H θ θ<
0 Z = =⇒
z µ−
0
n
/ σ 2. Chỉ tiêu kiểm ñịnh: z > z −< thz µ−
0
n
/
zα= (miền tiêu chuẩn là hoặc ) 3. Với mức ý nghĩa α , tìm giá trị tới hạn z −< thz σ
thz
0H bị bác bỏ, ngược lại thì thz
0H ñược chấp nhận. z 4. Kiểm tra: nếu (hoặc ) thì z>
th Kết luận bài toán kiểm ñịnh 8µ≠ kg, với mức ý nghĩa 0,01. 8µ= kg, ñổi thiết 8,7=x 8 8 + Số liệu mẫu: n = 50, kg. =µH
:0 ≠µH
:1 x X 83,2 + Mức ý nghĩa α = 0,01 và ñộ lệch tổng thể: σ = 0,5 kg.
+ ðây là bài toán kiểm ñịnh giả thiết hai phía về giá trị kỳ vọng của một phân phối biết σ.
1. kg. , kg. = −= Z = =⇒
z µ−
0
n
/ 88,7
−
50
/5,0 σ µ−
0
n / σ 2. Chỉ tiêu kiểm ñịnh: z 575,2 01,0=α = = = zth 2/ ,0 005 z | 575,2 , giá trị tới hạn là 3. Với mức ý nghĩa 83,2|
= > = thz z
α
0H bị bác bỏ 4. Ta thấy nên 71,8 Kết luận: trọng lượng trung bình có thể chịu ñược là khác 8kg, và thực tế là nhỏ hơn 8 kg.
Ví dụ 2 Một mẫu ngẫu nhiên gồm 100 giấy báo tử ở Mỹ cho thấy tuổi thọ trung bình là 71,8
năm. Giả sử ñộ lệch chuẩn là 8,9 năm; có thể cho rằng tuổi thọ trung bình hiện nay là hơn 70
năm không? Cho mức ý nghĩa là 0,05.
Giải:
+ Gọi µ là tuổi thọ trung bình ở Mỹ với ñộ lệch tiêu chuẩn σ = 8,9 năm. x = 70 70 + Số liệu mẫu: n = 100, năm. =µH
:0 >µH
:1 x X năm, năm. + Mức ý nghĩa α = 0,05 và ñộ lệch tổng thể: σ = 8,9 năm.
+ ðây là bài toán kiểm ñịnh giả thiết một phía về giá trị kỳ vọng của một phân phối biết σ.
1. = = Z = =⇒
z µ−
0
n
/ σ / σ 05,0=α 2. Chỉ tiêu kiểm ñịnh: 2, 0225 = = 0,05 −
71,8 70
8,9 / 100
zα=
z , giá trị tới hạn là 1, 645 3. Với mức ý nghĩa = > = µ−
0
n
thz
0H bị bác bỏ z 4. Ta thấy 2, 0225 1, 645 nên z
th
Kết luận: tuổi thọ trung bình hiện nay là hơn 70 năm. 2σ , ta thấy bài toán ước lượng và kiểm ñịnh thống kê ñều dựa H H Z = 0 : µµ=
0 1 : µµ≠
0 µ−
n X
/σ 0µ thuộc khoảng tin cậy ⇔ giả thuyết vào biến ngẫu nhiên . ðiều này ñưa ñến việc kiểm ñịnh , 0H ñược chấp nhận, và )100%α−
0H bị bác bỏ nếu theo mức ý nghĩa α là tương ñương với việc tìm khoảng ước lượng tin cậy (1
cho
µ . Nếu
0µ
không thuộc khoảng tin cậy. Tương tự với sự sai khác giữa hai kỳ vọng, phương sai, tỷ lệ,……
(2) Khi n ≥≥≥≥ 30 và phương sai chưa biết, vẫn có thể sử dụng chỉ tiêu kiểm ñịnh trên bằng cách s≈σ , ta có Z = X
S 0µ−
n
/ thay ðối thiết t = H | t >| th n ,2/ t
α 1
− tht 1 : µµ≠
0 T = X
S t = H Giả thiết Chỉ tiêu kiểm ñịnh Giá trị tới hạn Miền tiêu chuẩn
(bác bỏ H0) th n , 1 tα − 0 : µµ=
0 1 =⇒
t t = t t>
th :H µ µ<
0 th n , 1 tα − 1 v 0µ−
n
/
x
0µ−
n
s
/
1−= n t t< −
th :H µ µ>
0 với bậc tự do Ví dụ 3 Một báo cáo khẳng ñịnh mỗi máy hút bụi tiêu thụ khoảng 46 kWh/ năm. Từ một mẫu
gồm 12 gia ñình ñược nghiên cứu, cho thấy máy hút bụi tiêu thụ trung bình 42 kWh mỗi năm
với ñộ lệch chuẩn 11,9 kWh. Liệu có thể nói, với mức ý nghĩa 0,05, lượng ñiện tiêu thụ trung
bình của máy hút bụi khác với 46 kWh/ năm hay không? Giả sử mật ñộ của số kWh là chuẩn.
Giải: + Gọi µ là lượng ñiện tiêu thụ trung bình của máy hút bụi trong một năm 46 46 =µH
:0 ≠µH
:1 x 42 46 − 16,1 kWh, s = 11,9 kWh.
+ Số liệu mẫu: n = 12,
42=x
+ Mức ý nghĩa α = 0,05; chưa biết ñộ lệch tổng thể.
+ ðây là bài toán kiểm ñịnh giả thiết trung bình của phân phối chuẩn chưa biết σ2 , mẫu nhỏ
1. kWh. , kWh. −= = T =⇒
t = 0µ−
n
/ 12 ,2 201 0µ−
n
/
= /9,11
= = th n ,2/ 11,025 1
− t | 201 X
S
s
, giá trị tới hạn
t
nên
,2 2. Chỉ tiêu kiểm ñịnh: = < 05,0=α
tht t
t
,0
α
0H ñược chấp nhận. 3. Với mức ý nghĩa
4. Kiểm tra:
16,1|
= Kết luận: lượng ñiện trung bình máy hút bụi tiêu thụ trong năm không khác với 46 kWh/ năm.
Ví dụ 4 Cơ thể người cần khoảng 220 miligam natri một ngày. Khảo sát 20 loại suất ăn của
một hãng, ta có số liệu sau: natri (mg) 200 210 220 230 240 250 260 Số suất ăn 2 3 4 4 2 3 2 Với mức ý nghĩa 0,05 , có thể nói lượng natri trung bình trong các suất ăn của hãng này là lớn hơn 220 miligam không? Giả sử phân phối của lượng natri là chuẩn. mg, s = 18,6096 mg. 229 x = mg. , mg. 220 220 H µ=
0 : = = T = ⇒ =
t 0µ−
n
/ −
229 220
18, 6096 / 20 H µ>
1 :
X 2. Chỉ tiêu kiểm ñịnh: 2,1628 = 0,05;19 t 1, 729 = 05,0=α
> µ−
0
n
/
t
=
=
n
;
1
α −
0H bị bác bỏ. H H d d t 3. Với mức ý nghĩa
4. Kiểm tra: 2,1628 nên x
s
S
t
, giá trị tới hạn
th
=
1,729 t
th = ≠ < > − µµ
2 0 : 0 1 µ µ−
2 µ µ−
2 0d 0d 1 1 − µµ
2
X 1
X 0
d , ) , ) − − 1 2 Z = / / + 2
σ
1 2
σ
2 n
1 Kết luận: lượng natri trung bình trong các suất ăn của hãng này là lớn hơn 220 miligam
11.3 HAI MẪU: KIỂM ðỊNH VỀ HIỆU HAI TRUNG BÌNH.
I. Kiểm ñịnh hiệu hai trung bình, biết phương sai.
(hoặc
1.
1 :
( 2. Chỉ tiêu kiểm ñịnh: 2
zth = 2/αz thz 0
n
3. Với mức ý nghĩa α, tìm giá trị tới hạn
4. Kiểm tra và kết luận bài toán kiểm ñịnh 2,1 ( hoặc ) zα= 2 =x 04,0 098 ,0 04,0 (kg). Phương pháp II nuôi 150 con, trọng lượng trung bình là 2 2
1 =σ 150 100 2,1 098 ,0 2
,
2 =σ
1,µµ là trọng lượng trung bình của gà nuôi theo phương pháp 1, 2 với
. Số liệu mẫu 1: , 1,11 =x 2 =n 2 =x 1 =n 2
2 =σ , , , mẫu 2:
48 0 : 0 : = ≠ 1 − µµH
2
1 0 − µµH
1
2
X
X d ( ) − − −
1,1 1, 2 1 2 Z . , Bài toán yêu cầu kiểm ñịnh sự bằng nhau của 2 trung bình trong trường hợp biết phương sai.
1. = = − ⇒ =
z 0
n / / + 2
σ
1 n
1 2
σ
2 2 + 2. Chỉ tiêu kiểm ñịnh: 3, 0812 z 0812 96,1 | > 05,0=α
thz 1,96 0, 04
100
= 0,098
150
= z
0,025 z
tht
α=
/2
0H bị bác bỏ H d H d , giá trị tới hạn là
3. Với mức ý nghĩa
4. Kiểm tra:
thì
,3|
=
=
Kết luận: Trọng lượng gà nuôi theo 2 phương pháp là khác nhau. (hoặc , ) = ≠ < > 1 : 0 : − µµ
2 1 0 µ µ−
2 1 0d − µµ
2
X 1
X ( ) )1 − 0
d
− − 1 2 T = = 2
s p 0d
2
ns
(
2
2
− S 0
n /1 /1 2
+ 2 p n
1 t t µ µ−
2
)1
+−
n
n
+
1
) ,
1
2
ns
(
1
1 với . 2. Chỉ tiêu kiểm ñịnh: 2
= = th n ,2/ t
α −
1 n th 1 ; tα − (hoặc 3. Với mức ý nghĩa α , giá trị tới hạn 12 10 85 81 4 5 4. Kiểm tra và Kết luận bài toán kiểm ñịnh
Ví dụ 6 Một thí nghiệm thực hiện nhằm so sánh mức ñộ mài mòn của hai mẫu kim loại.
Kiểm tra 12 miếng kim loại 1 có trung bình mài mòn là 85 ñơn vị, với ñộ lệch mẫu là 4; trong
khi ñó 10 miếng kim loại 2 có trung bình mài mòn là 81 và ñộ lệch mẫu là 5. Có thể kết luận,
với mức ý nghĩa 0,05, rằng mức ñộ mài mòn của kim loại 1 lớn hơn 2 ñơn vị so với kim loại 2
ñược không? Giả sử các mật ñộ ñều xấp xỉ chuẩn với phương sai bằng nhau.
Giải: Gọi
1,µµ là trung bình của ñộ mài mòn hai kim loại 1 và 2 1 =x 2 =n 2 =x 2 =s 1 =s 2
1 =n , , , , > . 0 1 2 : : , mẫu 2:
Số liệu mẫu 1:
Bài toán yêu cầu kiểm ñịnh sự bằng nhau của 2 trung bình, trong trường hợp chưa biết phương
sai, nhưng bằng nhau
= ,
2
1. H µ µ−
1
2 d x d ( ) ( ) − − − − 1 2 T = =⇒
t 0
n S s 0
n /1 /1 x
1
/1 /1 2
+ + p p 2 n
1 n
1 2 85( ,4 478 04,1 H µ µ−
1
2
X
X 2. Chỉ tiêu kiểm ñịnh: = =t = =ps ,4 25.9
+
2
10
−
05,0=α t 1, 725 16.11
12
+
3. Với mức ý nghĩa Do ñó: nên 2)81
−
−
12/1.478
10/1
+
t
=
= = th 0,05;20 2 ; t
n
α + −
1 n
2 , giá trị tới hạn là = < = 0H ñược chấp nhận. t 1,04 1,725 nên t
th 4. Ta thấy:
Kết luận: mức ñộ mài mòn của kim loại 1 không lớn hơn 2 ñơn vị so với kim loại 2.
Ví dụ 7 Một hãng sản xuất xe hơi muốn xác ñịnh xem, nên dùng loại lốp A hay B cho loại xe
mới của họ. Họ ñã thực hiện thí nghiệm với hai loại lốp này và ghi lại số km (ñơn vị nghìn) ñi
ñược ñến khi phải thay lốp với kết quả như sau. Hãy kiểm ñịnh giả thuyết rằng không có sự
khác biệt giữa hai loại lốp, với mức ý nghĩa 0,04. 37,5
5
2 38,0
8
12 38,5
14
9 39,0
22
15 39,5
8
25 40
11
7 40,5
6
3 41
6
2 1,µµ là số km trung bình của hai loại lốp xe A, B 2 80 ,39 1688 ,0 9478 = 1 =n 1 =s ix x
1 1
= ∑
n x Số liệu mẫu 1: , , , x ,39 1133 ,0 7966 75 = 2 =s 2 =n ∑ =
ix 2 1
n x 0 0 : : , , mẫu 2: ≠ = − µµH
1
2 0 1 − µµH
1
2
X
X d ( ) − − ,39 ,39 1133 − 1 2 Z ,0 3955 Bài toán yêu cầu kiểm ñịnh sự bằng nhau của 2 trung bình, trong trường hợp chưa biết phương
sai, nhưng cỡ mẫu lớn
,
1. . = =⇒ z = 1688
2 2 0
n s / / + ,0 ,0 2 2
s
1 n
1 2
2 + 9478
80 z 7966
75
,2
= = zth 02,0 2/ z
α z 055 ,2 | 2. Chỉ tiêu kiểm ñịnh: = < 055
=
0H ñược chấp nhận.
Kết luận: Không có sự khác biệt về số km ñi giữa hai loại lốp này. nên 3. Với mức ý nghĩa
4. Ta thấy:
,0|
= , giá trị tới hạn là
01,0=α
thz
3955 Chỉ tiêu kiểm ñịnh Giả thiết H0 ðối thiết H1 Giá trị tới
hạn Trường
hợp kiểm
ñịnh Miền tiêu
chuẩn (bác
bỏ H0) thz 0µ µ≠ /2 X z | z>
|
th zα= Z = thz 0µ µ= 0µ µ> µ−
0
n
/ σ z z>
th zα= 1) µ ,
biết σ2 thz 0µ µ< t = | t >| th n ,2/ t
α −
1 tht 0µ µ≠ t = z z< −
th zα= T th n , 1 = tα − 0µ µ= 0µ µ> X
S 0µ−
n
/ t t>
th t = th n , 1 tα − 0µ µ< 2) µ ,
chưa biết
σ2,
n < 30 t t< −
th thz 0µ µ≠ /2 z | z>
|
th zα= = thz 0µ µ= 0µ µ> µ−
0
n
/ thz 0µ µ< z Z z>
th zα= X
S 3) µ ,
chưa biết
σ2, cỡ mẫu
lớn
(n ≥ 30) z z< −
th zα= ≠ thz µ µ−
2 1 0d /2 X X d − − 1 0 2 Z = z | z>
|
th zα= , = > thz µ µ−
2 1 0d µ µ−
2 1 0d 2
2
σσ
1
2
+
n
n
1 2 z z>
th zα= 4)
2µ µ−
1
biết
2
2
1 ,σσ
2 < thz µ µ−
2 1 0d X X d ( ) − − 1 2 0 t = | t >| ≠ th n ,2/ t
α −
1 tht µ µ−
2 1 0d T = S + p t = z z< −
th zα= > 1
n = th n , 1 tα − µ µ−
2 1 0d µ µ−
2 1 0d 1
n
1 )1 − 2
ns
(
1
1 2 = t = 2
s p t t>
th 5)
2µ µ−
,
1
2
2
1 σσ =
2
chưa biết < th n , 1 tα − µ µ−
2 1 0d 2
2
ns
(
2
2
− )1
+−
n
n
+
1 2 t t< −
th p p = ≠ > < pH
0 : 0 pH
1 : 0 X np 0 Z p p 1. , (hoặc , ) p
0 p
0 = −
qnp
00 2. Chỉ tiêu kiểm ñịnh: 3. Với mức ý nghĩa α, miền tiêu chuẩn sẽ là: z z p * hoặc với ñối thiết (bài toán kiểm ñịnh hai phía). p≠
0 zα< −
/2 zα>
/2 p p * z và z với ñối thiết (bài toán kiểm ñịnh một phía). p<
0 p>
0 zα< − với ñối thiết zα> + Gọi p là tỷ lệ người chịu tác ñộng của thuốc mới. + Số liệu mẫu: n = 100, x = 70 . + Cho: α = 0,05. 6,0 6,0 + Bài toán yêu cầu kiểm ñịnh về một tỷ lệ, trong trường hợp cỡ mẫu lớn. =pH
:0 ≠pH
:1 X np x np 0 Z 04,2 1. Giả thiết: , ñối thiết: = = = =⇒
z 70
100 60
−
4,0.6,0. −
qnp
00 −
0
qnp
00 05,0=α z 96,1 2. Chỉ tiêu kiểm ñịnh: = = zth 2/ ,0 025 z
= α z | 96,1 3. Với mức ý nghĩa , giá trị tới hạn là 04,2|
= > = thz 0H 4. Ta thấy: nên bác bỏ Kết luận: Loại thuốc mới có tác dụng khác với loại thường ñược dùng (và có tác dụng nhiều
hơn) X 398 399 400 401 m 11 60 117 62 Những hộp sữa có khối lượng dưới 399 (g) ñược coi là sai qui cách. Với mức ý nghĩa 2%
hãy kiểm ñịnh giả thiết tỷ lệ hộp sữa sai qui cách nhỏ hơn 5% ? + Gọi p là tỷ lệ hộp sữa sai quy cách, + Số liệu mẫu: n = 250, x = 11. + Cho: α = 0,05. 0, 05 0, 05 + Bài toán yêu cầu kiểm ñịnh về một tỷ lệ, trong trường hợp cỡ mẫu lớn, 1 :
H p < 0 :
H p = X np 0 0,4353 Z , ñối thiết: 1. Giả thiết: = ⇒ =
z = = − 11 250 0, 05
×
250 0,05 0,95 −
× × −
qnp
00 x np
−
0
np q
0 0 2, 055 0, 02 z 2. Chỉ tiêu kiểm ñịnh: = = α = 0,02 thz z
α= 0, 4353 2, 055 z , giá tri tới hạn là 3. Với mức ý nghĩa = − < − = − 0H z
th 4. Ta thấy: nên chấp nhận Kết luận: Tỷ lệ hộp sữa sai qui cách là nhỏ hơn 5% , p p = ≠ pH
0 :
1 2 pH
1 :
1 2 Z 1. , = n ) /1[(ˆˆ
qp /1( )] ˆ
ˆ
PP
−
2
1
n
+
1 2 2 ˆ
p 2. Chỉ tiêu kiểm ñịnh: = x
n +
+ x
1
n
1 2 với là tỉ lệ chung của 2 mẫu, ước lượng ñiểm gộp chung cho tỷ lệ p 3. Với mức ý nghĩa α, miền tiêu chuẩn sẽ là: 2≠p
1 z z * hoặc với ñối thiết p (bài toán kiểm ñịnh hai phía). zα< −
/2 zα>
/2 2
2>p
1 * z p và z với ñối thiết p (bài toán kiểm ñịnh một phía). zα< − với ñối thiết zα> 1, pp 2 n x ,200 120 ,500 240 tương ứng là tỷ lệ cử tri trong thị trấn và ở ngoại vi ñồng ý với ñề xuất. + Gọi = = = = n
1 x
1 2 2 + Số liệu mẫu 1: , mẫu 2: + Bài toán yêu cầu kiểm ñịnh về sự bằng nhau của 2 tỷ lệ có cỡ mẫu lớn. Z 1. , :H p
0
1 p=
2 :H p
1
1 p≠
2 = n ) /1[(ˆˆ
qp /1( )] ˆ
ˆ
PP
−
2
1
n
+
1 2 2. Chỉ tiêu kiểm ñịnh: 2 2 ˆ
p ˆ
p 6,0 48,0 51,0 = = = = = = = = = ˆ
p
1 2 x
n x
n 240
500 120
200 240
500 120
200 +
+ +
+ 2 x
1
n
1 2 x
1
n
1 9,2 , , . với = =z 48,06,0
−
/1.[( 200
) 49,0.51,0 /1( 500 )] + 025 z ,0=α 24,2 Nên = = zth 2/ ,0 0125 z
= α z | 24,2 3. Với mức ý nghĩa , giá trị tới hạn 9,2|
= > = 0H , thz nên bác bỏ 4. Ta thấy: Kết luận: Tỷ lệ cử tri trong thị trấn và tỷ lệ cử tri ở ngoại vi ñồng ý với ñề xuất khác là khác
nhau. 1, pp 2 300, 240 400, 288 x = = = = n
+ Số liệu mẫu 1: 1 x
1 n
, mẫu 2: 2 2 + Gọi là tỷ lệ tương ứng của nhóm 1, nhóm 2 sinh con ở thời ñiểm này. + Bài toán yêu cầu kiểm ñịnh về tỷ lệ của nhóm 1 cao hơn nhóm 2, trong trường hợp cỡ mẫu
lớn. > Z 1. , :H p
0
1 p=
2 H p
:
1
1 p
2 = n ) /1[(ˆˆ
qp /1( )] ˆ
ˆ
PP
−
2
1
n
+
1 2 0,8 0, 72 0,7543 ˆ
p 2. Chỉ tiêu kiểm ñịnh: = = = = = = = = = ˆ
p
1 ˆ
p
2 240
300 288
400 +
+ 240 288
+
300 400
+ x
1
n
1 x
2
n
2 x
1
n
1 x
2
n
2 0,8 0, 72
− 2, 4331 z với , , . = = 0,7543.0, 2457.[(1 / 300) (1 / 400)] + 2,325 0, 01 z Nên = = α = 0,01 thz z
α= 2,325 z 3. Với mức ý nghĩa , giá trị tới hạn | 2, 4331
= > = 0H , z
th 4. Ta thấy: | nên bác bỏ Kết luận: Tỷ lệ sinh con của hai nhóm phự nữ là như nhau. Trường Tổng số học sinh Số trượt tốt nghiệp A 1900 380 B 2600 637 Với mức ý nghĩa 0,05, kiểm ñịnh giả thiết là tỷ lệ học sinh thi trượt tốt nghiệp ở 2 trường
trên là bằng nhau. 1, pp 2 1900, 380 0, 2 + Gọi là tỷ lệ tương ứng trưrường A, B. = = n
+ Số liệu mẫu 1: 1 x
1 ⇒ =
1ˆ
p 2600, 637 0, 245 = = n
mẫu 2: 1 x
1 ⇒ =
1ˆ
p , + Bài toán yêu cầu kiểm ñịnh về tỷ lệ trượt của hai trường là bằng nhau, trong trường hợp cỡ
mẫu lớn. ≠ Z 1. , :H p
0
1 p=
2 H p
:
1
1 p
2 = n ) /1[(ˆˆ
qp /1( )] ˆ
ˆ
PP
−
2
1
n
+
1 2 0, 226 0,774 3,5658 ˆ
p 2. Chỉ tiêu kiểm ñịnh: = = ⇒ =
ˆ
q z = +
+ x
1
n
1 x
2
n
2 0, 05 / 2 0, 025 1,96 nên α = ⇒ α = = / 2 ⇒ =
thz zα 1, 96 z 3. Với | 3,5658
= > = 0H . z
th 4. Ta thấy: | nên bác bỏ Kết luận: Tỉ lệ trượt tốt nghiệp ở 2 trường không bằng nhau. thz /2 X np 0 0 Z = = p z | z>
|
th zα= p≠
0 thz −
qnp
00 p p z z>
th p=
0 zα= p>
0 ˆ −
pP
qp
00
n thz p z z< −
th zα= p<
0 thz /2 Z = ˆˆ
qp + z | z>
|
th zα= p
1 p≠
2 thz 1
n ˆ
ˆ
PP
−
1
2
z z>
th zα= p
1 p>
2 p
1 p=
2 2 2 ˆ
p = = thz x
n
ˆ
pn
2
n +
+ 2
+
+ x
1
n
1 2 1
n
1
ˆ
pn
11
n
1 2 z z< −
th zα= p
1 p<
2 Ta bắt ñầu từ số liệu (X, Y) về tuổi, chiều cao (cm) của nhóm trẻ như sau: 4 5 6 7 Câu hỏi ñặt ra là với trẻ 5 tuổi của nhóm này thì chiều cao trung bình là bao nhiêu? Khi trẻ X
Y
100
105
110
115 8
4
3
1 7
6
4
3 3
2
7
5 2
1
5
9 8 tuổi thì có chiều cao trung bình là bao nhiêu? xY là biến ngẫu nhiên Y tương ứng với một giá trị cố ñịnh x. 2 Bài toán dẫn ñến khái niệm x = xYµ , xYσ . Với
2 Ta ký hiệu trung bình, phương sai của nó tương ứng là , ký hiệu ixYµ và phương sai x ) , ix
ixYσ . Khi nối các ñiểm
, sẽ có một ñường xuyên qua các ñiểm của tập dữ liệu ñã cho. ðường này gọi là ixY
(
µ xY
|
i biểu thị biến ngẫu nhiên Yi với trung bình x
µ α β= + Thuật ngữ hồi quy tuyến tính ngụ ý là Y x xYµ có quan hệ tuyến tính với x theo phương
, trong ñó hệ số hồi quy α và β là các tham số ñược ước
xYµ theo ŷ từ ñường hồi Mẫu Hồi quy tuyến tính lượng từ dữ liệu mẫu lần lượt bằng a và b. Tức là, có thể ước lượng (*) Câu chuyện về từ “Hồi quy” (regression) có nguồn gốc như sau: Vào khoảng những năm 30, nhà thống kê nhân chủng
học người Thụy ðiển là Gante có tiến hành nghiên cứu sự phụ thuộc giữa chiều cao của con cái vào chiều cao của bố mẹ. Theo
quan niệm chung, nếu bố mẹ cao thì con cái sẽ cao hơn nữa. Và ñiều ñó ñúng thì ta có thể tạo ra những người cao tùy ý và cũng
với ý ñó có thể lai tạo qua nhiều thế hệ ñể có người có chiều cao tiến tới 0 (!) . Gante ñã phát hiện ra ñiều ngược lại: Nếu cha mẹ
quá cao thì con cái sẽ thấp bớt ñể trở về trạng thái “trung bình của nòi giống”. Hiện tượng ñó Gante ñặt tên là “Hồi quy”. Từ bảng số liệu trên, biểu diễn ñường hồi quy phù hợp
và ñường hồi quy thực theo hình bên. Ta kỳ vọng ñường hồi
quy thực nghiệm sẽ có mức ñộ trùng khớp cao với ñường hồi
quy giả thiết chưa biết khi ñược cung cấp một số lượng lớn dữ liệu . Trong trường hợp ñường hồi quy tuyến tính, trong ñó chỉ có một biến hồi quy ñộc lập x và
một biến ngẫu nhiên phụ thuộc Y, dữ liệu có thể ñược biểu diễn bằng cặp quan sát {(xi , yi), i =
1,2, ...,n} hoặc cho bằng bảng dữ liệu như trên. Nếu ta giả thiết rằng tất cả các số trung bình
ixYµ nằm trên một ñường thẳng, mỗi biến ngẫu nhiên Yi có thể ñược mô tả bằng mô hình hồi
quy tuyến tính ñơn: E E x
βα = + += + Y
i i i i µ |
xY
i trong ñó, sai số ngẫu nhiên Ei, sai số mô hình, cần phải có giá trị trung bình bằng 0. Mỗi cặp
quan sát (xi, yi) trong mẫu thử thỏa mãn phương trình: yi = α +β xi + εi, trong ñó εi là giá trị ñược tính toán bởi Ei khi Yi nhận giá trị yi. Phương trình trên có thể Tương tự, sử dụng ñường hồi quy ước lượng hoặc ñường hồi quy phù hợp ŷ = a + ðiểm khác biệt giữa ei và εi ñược chỉ rõ trên hình bên, mô tả
ñường hồi quy phù hợp với tập hợp dữ liệu này, cụ thể là ñường
ŷ = a + bx, và ñường hồi quy phản ánh mô hình x
+=|
βαµ
xY . x
+=|
βαµ
xY Tất nhiên, hiện giờ α và β vẫn là các tham số chưa biết, tức là
ngoài việc nó là một khái niệm chưa biết gì về ñường
ñơn giản về cách dữ liệu ñược tạo ra trong một quá trình cụ thể. ðường hồi quy phù hợp là ước
lượng của ñường ñược tạo ra bởi mô hình thống kê. Kết quả là, trên thực tế, phép thể hiện của
Ei , cụ thể là εi, không bao giờ ñược quan sát. Tuy nhiên, phần dư ei vẫn ñược quan sát.
2. Phương pháp bình phương tối thiểu ñể ước lượng các hệ số hồi quy. Cho mẫu {(xi, yi) , i = 1,2, ...,n}, các ước lượng bình phương tối thiểu a và b của hệ số n n n n n n n y − y b x x y ( yx
)( ) − − − ∑ yx
i i i i ∑ ∑ ∑ i i i i
∑∑
x
i i i 1
= i i i 1
= 1
= 1
= a xby b = −= = = n n n n 2 x x ( ) − ∑ i n x x − ∑ ∑ 2
i i i 1
= 1
=
1
=
2
i i 1
= 1
= n n n 2 2 . và . SSE y y bx ( ( ) = = − = a
−− ∑ ∑ ∑ 2
e
i i )ˆ
y
i i i i i i 1
= 1
= 1
= n n ) ( ) ( ∂ ∂ 0 0 (SSE = Sum Square of Errors là tổng các bình phương của sai số xung quanh ñường hồi quy)
Tìm a và b sao cho SSE là nhỏ nhất, quy trình cực tiểu hóa này gọi là phương pháp bình = = y bx y bx x ( ) 0 ( ) 0 a
−− = a
−− = − ∑
2 − ∑
2 i i i i i , , ⇔ SSE
a
∂ i i 1
= 1
= n n n n n na b x y a x b x + = + = ∑ ∑ ∑ ∑ ∑ i i i yx
i i 2
i i i i i i 1
= 1
= 1
= 1
= 1
= Sắp xếp nhóm các số hạng: và và giải theo a, b. 70 70 70 70 7525 41595 2201 811275 385 70=n = ∑ i yx i 2 =∑
ix 2 =∑
iy =∑
ix =∑
iy i =i
1 1
= 70 =i
1
7525 ,2 =i
1
385 − × ,2 4850 ,93 8325 , , , , , =b = =a = 7525
2 4850
70 ×
385 =i
1
385
−
2201
− 41595
×
70
× Cho nên và Do ñó, ñường hồi quy tuyến tính là ŷ = 93,8325 + 2,485 x, (b) Thay x = 5 ⇒ ŷ = 106,2575 cm và x = 8 ⇒ ŷ = 113,7125 cm.
Vậy chiều cao trung bình dự ñoán của trẻ 5 tuổi là 106,2575 cm và trẻ 8 tuổi là 113,7125 cm.
Ví dụ 2 Một cuộc nghiên cứu ñược tiến hành trên số lượng ñường chuyển hóa theo một quy
trình xác ñịnh tại các nhiệt ñộ khác nhau. Số liệu ñược mã hóa và ghi lại như sau: ðường chuyển hóa y Nhiệt ñộ x 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 8,1 7,8 8,5 9,8 9,5 8,9 8,6 10,2 9,3 9,2 10,5 11 11 11 11 (a) Tìm ñường hồi quy tuyến tính thực nghiệm
(b) Tính số lượng ñường chuyển hóa trung bình ñược sản xuất ra khi nhiệt ñộ là 1,75.
Giải: 4,100 59,152 85,25 5,16 11=n = ∑ i yx i =∑
ix =∑
iy 2 =∑
ix =i
1 =i
1 i
,14,100 5,16 1
=
− × 11 ,1 8091 ,6 4136 (a) Tính số liệu mẫu: , , , , =b =a = = 4,100
2 8091
11 −
85,25 59,152
×
11
× =i
1
5,16
×
5,16
− Ta có: , Do ñó, ñường hồi quy tuyến tính thực nghiệm ñược cho bởi công thức: ŷ = 6,4136 + 1,8091 x
(b) Thay x = 1,75 ⇒ ŷ = 9,5795. Vậy lượng ñường chuyển hóa trung bình khi nhiệt ñộ 1,75 là
9,5795
3 Tính chất của các ước lượng bình phương tối thiểu n n x Y x ( ) ( − − − ∑ ∑ i Yx
)(
i i Yx
)
i i i 1
= B Các giá trị a và b, dựa trên mẫu ñã cho gồm n quan sát, chỉ là các ước lượng của thông số
thực α và β . Vì thế có thể coi là các giá trị ñược tính toán bởi các biến ngẫu nhiên A và B
ñược xác ñịnh là: = = n 1
=
n 2 2 x x x x ( ) ( ) − − ∑ ∑ i i i i 1
= 1
= n x ∑ 2
i 2
σ i 1
= . = 2
σ 2
σ
A βµ =B 2
σ
B αµ =A n 2 2 x x n x x ( ) ( ) − − = n
∑ ∑ i i i i 1
= 1
= Kết quả: , , , 2 n S bS − ( xy 2 s = = = ∑ y
i
n yy
n )ˆ
y
2 2 SSE
n
2
− −
− − i 1
= n n n . . S x x S y y S x y ( 2) ( 2) ( yx
)( ) = − = − = − − ∑ ∑ ∑ xx i yy i xy i i i i i 1
= 1
= 1
= với , , n n n n n n n S xy 2 2 S x x S y y S y ) ) ( ) = − = − = − b = ∑ ∑ ∑∑
x
).( ∑ xx 2
i i yy 2
i i xy yx
i i i i 1 ∑
(
n 1 ∑
(
n 1
n S i i i i i i i 1
= 1
= 1
= 1
= 1
= 1
= 1
= xx , , , s s b − < b
β +< t
2/
α
S t
2/
α
S xx xx n n x s s x ∑ ∑ 2
i 2
i 2/ 2/ t
α t
α i 1
= 1
= a . . − < a
+< α nS i
nS xx
xx
là giá trị của phân phối-t với n –2 bậc tự do . . 2/αt trong ñó ñó, B S ( / ) − xx T = = Giả ñịnh rằng mỗi Ei, i = 1, 2, ..., n, tuân theo phân phối chuẩn thì Y1, Y2, ..., Yn cũng tuân
theo phân phối chuẩn n (yi ; α +β xi , σ). Vì A và B là các hàm tuyến tính của biến chuẩn ñộc
lập nên suy ra A và B có phân phối xác suất lần lượt là n (a ; α, σA) và n (b ; β, σB).
Thực ra, với giả ñịnh chuẩn, một kết quả rất giống với kết quả ñã cho tại ðịnh lý 8.4
cho phép ta kết luận rằng (n − 2)S2/σ2 là một biến Khi bình phương với n − 2 bậc tự do, không
nhiên B. Do
phụ
kê thống thuộc ngẫu chắn chắc biến vào /()
σβ
S /
σ β
−
S S B
/ xx có phân phối-t với n−2 bậc tự do. Thống kê T có thể ñược sử dụng ñể thiết lập khoảng tin cậy 100% cho hệ số β. + x
βαµ =|
xY 70 70 70 70 . 41595 2201 7525 385 811275 70=n = ∑ 2 =∑
ix =∑
iy i yx i 2 =∑
iy i =i
1 1
= =i
1 n =i
1
n n n 2 2 , , , , , Ví dụ 3 Từ bảng dữ liệu trong Ví dụ 1, tìm 95% khoảng tin cậy ñối với tham số
(a) hệ số góc β
(b) ñiểm chặn α trong ñường hồi quy
Giải: Ta tính từ số liệu mẫu:
70
=∑
ix S x S y y x ) ,83 5052 ) 2337
,
5169 ( ( = = = = − − ∑ ∑ ∑ ∑ xx i yy 2
i i 2
i 1
n =i
1
1
n i i i 1
= 1
= 1
= n n n i
1
=
S xy 8325 Suy ra: , , ,93=a S y b ( ) 207 5, 4850 = − = = ,2= ∑ ∑∑
x
).( xy yx
i i i i 1
n S 1
= xx i
S bS − i
i
1
1
=
=
2337
,
5169 4850 207 5, − × xy 2 s ,37 9558 1608 = = = ,6=⇒ s yy
n 2 ,2
48 − , , s s b − < b
β +< t
2/
α
S t
2/
α
S xx
Với ñội tin cậy (1– α)100% = 95% ⇒ = t ≈ 2/ ,0 025 tα 01,2 1608 1608 ,2 485 ,2 485 1299 ,1 ,3 8401 (a) Khoảng tin cậy 95% ñối với tham số β trong ñường hồi quy µY|x = α + βx là : ⇔ − < < + < < β β ×
,83 ,6
5052 xx
với 48 bậc tự do.
01,2
01,2
,6
×
,83
5052 Thay vào ta có: n n s x s x ∑ ∑ 2
i 2
i 2/ 2/ t
α t
α i 1
= 1
= a − < a
+< α nS i
nS xx xx 01,2 2201 01,2 2201 ,93 8325 ,93 8325 (b) Khoảng tin cậy 95% ñối với tham số α trong ñường hồi quy µY|x = α + βx là : − < < + α 5052 5052 1608
,6
×
70
,83
× Thay vào ta có: ,86 2338 ,101 ⇔ < < α H H : ββ≠
0 0 ββ =
0 B 1
b T Giả thiết = =⇒
t s s / / :
0β−
xxS H H : : Chỉ tiêu kiểm ñịnh: ðối thiết:
0β−
xxS 0 αα=
0 1 αα≠
0
a Giả thiết α − α
0 T = =⇒
t n S x s x ∑ ∑ 2
i nS
/ xx 2 /
i nS xx i i 1
= 1
= − Chỉ tiêu kiểm ñịnh: ðối thiết:
A
n 2 2 x x x x ) ( ) ( 0 ˆ
y s ˆ
y s 14.3 KHOẢNG TIN CẬY CỦA TRUNG BÌNH CÓ ðIỀU KIỆN − < < + + + µ 2/ 0 0 2/ t
α t
α xY
|
0 1
n −
S 1
n −
0
S xx xx . . 2/αt trong ñó là của giá trị của phân phối t với n −2 bậc tự do += µ = + 0x
βα xY ñể ước lượng . ˆY
Chứng minh: Sử dụng hàm ước lượng ñiểm 0 A Bx
0 Ta thấy phân phối mẫu là phân phối chuẩn với trung bình ˆY
0 Bx )ˆ( AE
( ) = = + += = YE
0 x
µβα
0 0 xY
|
0 µ
ˆ
Y
0 2 µ − x x ) ( ˆ
Y
0 0 xY
|
0 T và phương sai = = + = 2
σ + x ( ) − Bx
0 2
σ
xBY
+
0 2
2
σσ
=
ˆ
A
Y
0 2 1
n −
S xx
x x ( ) S + 1
n −
0
S xx nên xây dựng thống kê OxYµ với phân phối-t có n −2 bậc tự do ñể ước lượng kỳ vọng có ñiều kiện ñược sử dụng ñể dự ñoán hoặc ước lượng trung bình có ñiều kiện ñiều kiện xYµ khi x0 = 8. 0xYµ khi x0 = 8 là : 2 2 x x x x ) ( ) ( 0 ˆ
y s ˆ
y s − < < + + + µ 2/ 0 0 2/ t
α t
α xY
|
0 1
n −
S 1
n −
0
S xx xx . . S bS − xy 2 S n s s t ( )1 ,83 5052 ,37 9558 1608 0,2 Từ phương trình hồi quy, với x0 = 8, ta tìm ŷ0 = 93,8325 + 2,485 x0 = 113,7125. 5,5=x = − = = ,6=⇒ s ≈ xx 2 =
X ,0 025 yy
n 2 − ñối với 68 bậc tự do. Ta có 2 2 ,113 7125 1608 ,113 7125 1608 − ,60,2
× × < + ,60,2
× × + + Yµ< 8| 1
70 1
70 )5,58(
−
5052
,83 )5,58(
−
,83
5052
,110 0339 117 ,
3911 Tính: , , , ⇔ < Yµ 8 < . 2 2 x x x x ) ( ) ( 0 0 ˆ
y s y ˆ
y s 1 1 − < < + 0 2/ 0 0 2/ t
α t
α 1
++
n −
S 1
++
n −
S xx xx
là giá trị của phân phối t với n−2 bậc tự do . . 2/αt trong ñó nhiều với nhà khoa học hoặc kỹ sư hơn khoảng tin cậy. Khoảng dự ñoán biểu diễn một khoảng xY |µ là một ước lượng tham số tổng thể về trung bình có ñiều kiện tại x. có xác suất bằng 1− α chứa một giá trị tương lai y0 của biến ngẫu nhiên Y0, còn khoảng tin
cậy của x % 3
y % 5 11 15 18 27 29 30 30 31 31 32 33 33 34 36 36
7
11 21 16 16 28 27 25 35 30 40 32 34 32 34 37 38 x % 36 37 38 39 39 39 40 41 42 42 43 44 45 46 47 50
y % 34 36 38 37 36 45 39 41 40 44 37 44 46 46 49 51 Hãy tìm: (a) Phương trình ñường hồi quy tuyến tính thực nghiệm và giá trị dự ñoán y khi x = 50 x
βαµ
+=|
xY (b) Khoảng tin cậy 95% cho tham số β trong ñường hồi quy x
βαµ
+=|
xY (c) Khoảng tin cậy 95% cho α trong ñường hồi quy xY |µ tại x0 = 20%. (d) Khoảng tin cậy 95% cho trung bình có ñiều kiện 33 33 33 33 (e) Khoảng dự ñoán 95% cho y0 khi x0 = 20%.
Giải: Tính các giá trị mẫu từ bảng số liệu : 1104 1124 41355 41086 = ∑ i yx i =∑
ix =∑
iy 2 =∑
ix i =i
1 =i
1 1
= =i
1 4545 0606 n = 33, , , , , ,33=x ,34=y n n n n n 2 , Suy ra: S x x S y ( ) 4152
,
1818 ) 37521
, 0909 ( = − = = − = ∑ ∑ ∑ ∑∑
x
).( xx 2
i i xy yx
i i i i 1
n 1
n i i i i i 1
= 1
= 1
= 1
= 1
= S xy a xby 8296 , −= ,3= b 9036 = ,0= S xx (a) Tính , nên ñường hồi quy tuyến tính thực nghiệm ŷ = 3,8296 + 0,9036 x Thay x = 50 ⇒ ŷ = 49. s s b − < b
β +< 3752 09, 3713 88, 4152 18, (b) Khoảng tin cậy 95% ñối với tham số β trong ñường hồi
quy µY|x = α + βx là : t
2/
α
S
xx
,
=xyS t
2/
α
S
xx
,
=yyS =xxS , b = 0,903643, − xy 2 s ,10 4299 2295 = ,3=⇒ s = ⇒ t )% %95 ,2 045 yy
n
−
Với
1( Ta tính:
S
bS = ≈ 2
−α ,0 025 ,0 8011 ,1 0061 ñối với 31 bậc tự do. < < β n n s x s x ∑ ∑ 2
i 2
i 2/ 2/ t
α t
α i 1
= 1
= a Thay vào ta có: − < a
+< α i
nS nS xx xx n t ,2 045 ≈ 829633 ,0 2131 ,7 4461 (c) Do ñó 95% khoảng tin cậy ñối với α là ,3=a < <α 41086 ,0 025 2 =∑
ix i 1
= Ta tính: , , . Thay vào ta có: xYµ tại x0 = 20% là: 2 2 x x x x ) ( ) ( 0 ˆ
y s ˆ
y s − + < < + + µ 0 2/ 0 2/ t
α t
α xY
|
0 1
n −
S 1
n −
0
S xx xx x ˆ
y 20 ,21 9025 (d) Khoảng tin cậy 95% cho kỳ vọng có ñiều kiện =⇒= 0 0 4152 18, 4545 2295 Từ phương trình hồi quy, với . ,33=x ,3=s =xxS t ,2 045 ≈ Ngoài ra, , , , ,0 025 ,20 1071 ,23 6979 . < Yµ 20 < Thay vào ta có: . (e) Khoảng dự ñoán 95% cho y0 khi x0 = 20% là 2 2 x x x x ) ( ) ( 0 0 ˆ
y s y ˆ
y s 1 1 − < < + 0 2/ 0 0 2/ t
α t
α 1
++
n −
S 1
++
n −
S xx xx 4152 18, x ˆ
y 4545 2295 20 ,21 9025 ,33=x ,3=s =⇒= =xxS 0 0 t ,2 045 ≈ ,15 0585 287464 Tính số liệu mẫu: n = 33, , , , , < y ,0 025 0 < ñối với 31 bậc tự do. Thay vào ta có: STT n n n n n n 2 2 2 2 S x x x x S y x y y ( ) ) ( ) ( ) ( = − = − = − = − ∑ ∑ ∑ ∑ ∑ ∑ xx i 2
i i yy i 2
i i 1
n i i i i i i 1
= 1
= 1
= 1
= 1
= 1
n
n n n 1
=
n S x y y ( yx
)( ) ( ) = − − = − ∑ ∑∑
x
)( ∑ xy i i yx
i i i i i 1
= 1
= , | i
1
=
xYEy
(
= + 1
n
)
= i
i
1
=
x
βαµ
= xY
| S xy bx a xby +=ˆ
y
a −= b = S xx bx với , . a
+= 0ˆ
y 0 0|xYµ là n n 2 SSE y bx S bS ( ) = = a
−− = − ∑ ∑ 2
e
i i i yy xy i i 1
= 1
= S bS − xy 2 s = = yy
n 2 SSE
n
2
− − s x s x ∑ ∑ 2
i 2
i 2/ 2/ t
α t
α s s b b a v − < − < b
+< β +< α 2−= n t
2/
α
S t
2/
α
S nS nS xx xx xx , với b t H = , chỉ tiêu kiểm ñịnh: 0 : ββ =
0 s / a xx
0β−
xxS
− α
0 t H = , chỉ tiêu kiểm ñịnh: 0 : αα=
0 s x ∑ /2
i nS xx 2 2 x x x x ) ( ( ) 0 0 ˆ
y ˆ
y s
. s
. µ − + < < − + 0 2/ xY
| 0 2/ t
α t
α 0 1
n −
S 1
n −
S xx xx 2 2 x x x x ) ( ( ) 0 0 ˆ
y s y ˆ
y 1. s
1. − < < − 0 2/ 0 0 2/ t
α t
α 1
++
n −
S 1
++
n −
S xx xx 62 168
14 165
17 167
21 166
25 169
9 163
4 X (cm)
số sinh viên
Tính kỳ vọng mẫu, phương sai mẫu.
3 ðiểm thi X của một lớp cho số liệu sau: X 2 7 5 4 3 6 0
số sinh viên 7 8
1
18 21 34 45 28 22 18 15 9
8 10
12 Tính kỳ vọng mẫu, phương sai mẫu. X (triệu ñồng)
Số ñơn vị 20 − 25
40 15 − 20
47 10 − 15
63 0 − 5
17 25 − 30
23 Tính kỳ vọng mẫu, phương sai mẫu và tỉ lệ mẫu của số tiền từ 15 (triệu) trở lên. X
m 12,3
32 13,5
15 16,7
18 18,6
31 20,8
17 15,1
20 4, 0 , 2 y
< <
1 x
< < −
=
y
2 ) f x y
( , ) 0 , tại các ñiểm khác (a) Xác ñịnh hằng số k và tính hàm mật ñộ biên duyên của X và Y.
(b) Tìm hệ số tương quan của X và Y. (a) Tính khoảng tin cậy 99% cho tỷ lệ ñàn ông châu Phi bị rối loạn này.
(b) Chúng ta có thể kết luận ñiều gì với khoảng tin cậy 99% về kích thước có thể của sai số nếu chúng ta ước lượng tỉ lệ ñàn ông châu Phi bị rối loạn tiểu cầu này 0,24?
Câu IV Một mẫu gồm 32 phụ nữ ñang có thai vào giai ñoạn 3 tháng cuối của thai kỳ, có ñộ
tuổi từ 15 ñến 32, ñược chia làm hai nhóm hút thuốc và không hút thuốc. Người ta ño nồng ñộ
axit huyết tương ascorbic (mg/ml) trong máu của họ, khi họ chưa ăn sáng hay các ñồ ăn chứa
axit này, ñược số liệu sau: Hút thuốc
Không hút 0,48 0,71 0,98 0,68 1,18 1,36 0,78 1,64
0,97 0,72 1,00 0,81 0,62 1,32 1,24 0,99 0,90 0,74 0,88 1,24
1,16 0,86 0,85 0,58 0,57 0,64 0,98 1,09 0,92 0,94 0,78 1,18 Giả sử các số liệu tuân theo phân phối chuẩn với phương sai bằng nhau. Với mức ý α= 0, 02 , hãy kiểm ñịnh xem có sự sai khác ñáng kể nào giữa nồng ñộ ascorbic trung 4,3 6,1 5,6 5,9 4,5 5,2 3,8 2,1 7,5 126 132 121 116 118 114 118 141 108 ñơn vị. 4,8 x = nghĩa
bình của hai nhóm hút thuốc và không hút thuốc không?
Câu V Một cuộc nghiên cứu về lượng mưa và lượng ô nhiễm không khí thải ra ñã cho các số
liệu sau:
Lượng mưa hàng
ngày, x (0,01 cm)
Lượng hạt ô nhiễm
thải ra, y (mcg/cum)
(a) Tìm phương trình ñường hồi quy ñể dự ñoán trước lượng hạt ô nhiễm thoát ra từ lượng
mưa hàng ngày.
(b) Tính lượng hạt ô nhiễm thoát ra khi lượng mưa hàng ngày là
ðỀ SỐ 2
Câu I Một công ty ñiện sản xuất một bóng ñèn 100-watt, theo như bảng ñặc ñiểm kĩ thuật
ñược ghi ngoài thùng hàng, có tuổi thọ trung bình là 900 giờ với ñộ lệch chuẩn là 50 giờ. Tối
ña, có bao nhiêu phần trăm bóng sẽ có tuổi thọ dưới 700 giờ? Giả sử rằng phân phối tuổi thọ
của loại bóng ñèn nói trên là phân phối chuẩn. 2
x
12 (1 − x ) , 0 1 x
≤ ≤ f x
( ) . ∉
=
x 0 , [ 0 , 1 ] Tìm 5) . E X −
(3 Công ty
I
II 103
97 94
82 Thời gian (phút)
98
87
110
175
92
123 88 118 |Y xµ tại x0 = 60. 10
70
91 11
50
76 9
55
81 4
65
90 5
55
85 6
70
87 7
65
94 8
70
98 3
55
76 2
50
74 1
65
85 Hãy tính khoảng tin cậy 90% cho hiệu số giữa các khoảng thời gian chiếu trung bình
của hai công ty này. Giả thiết rằng các khoảng chênh lệch thời gian chiếu ñược phân phối
chuẩn có các phương sai bằng nhau.
Câu IV Một công ty dược khẳng ñịnh, loại thuốc cúm mới dành cho trẻ em của họ sẽ có tác
dụng sau 2 ngày dùng thuốc. Qua khảo sát, người ta thấy trong 120 trẻ bị cúm và dùng loại
thuốc này, thì có 29 em khỏi bệnh sau 2 ngày. Trong 280 em bị cúm và không dùng thuốc, thì
có 56 em khỏi sau 2 ngày. Vậy khẳng ñịnh của công ty về tác dụng của thuốc là ñúng không,
với mức ý nghĩa 0,05?
Câu V Số liệu sau ñưa ra ñiểm số môn Hóa của 12 sinh viên mới ngẫu nhiên tại một trường
cao ñẳng xác ñịnh cùng với ñiểm số của các sinh viên này qua bài kiểm tra hệ số thông minh
khi họ ñang học sinh năm cuối của trường phổ thông.
12
Sinh viên
ðiểm kiểm tra, x
55
ðiểm môn Hóa, y
74
(a) Tìm phương trình ñường hồi quy tuyến tính thực nghiệm và giá trị dự ñoán y khi x = 75
(b) Tìm khoảng tin cậy 95% cho trung bình có ñiều kiện
ðỀ SỐ 3 f(x, y)
1
y
3
5 x 2
0,10
0,20
0,10 4
0,15
0,30
0,15 (a) Tìm phân phối biên duyên của X, Y và tính E(2X – 3Y).
(b) Tính covarian của X và Y 2,31
28,3 5,52
36,5 3,21
27,2 4,41
32,2 4,32
27,7 2,75
29,5 4,30
30,3 3,71
28,7 1 2 3 X
Y 0,5
2,5 0,25
3k 0
2k µ σ µ σ σ
,
Y
XY X X Y k
0,15
(a) Tính hệ số k và tìm phân phối biên duyên của X, Y.
(b) Tính , , , Câu III Giả sử thời gian ñể một sinh viên A ñi từ nhà ñến trường (ñơn vị: phút) là biến ngẫu
nhiên chuẩn. Thời gian ñi từ nhà ñến trường trong 7 ngày ngẫu nhiên: 9,8 10,2 10,4 9,8 10,0 10,2 9,6 Tìm khoảng tin cậy 95% cho thời gian trung bình ñi từ nhà ñến trường của sinh viên A ? x
y 77
82 50
66 71
78 72
34 81
47 94
85 96
99 99
99 67
68 Hãy kiểm ñịnh giả thiết ñiểm trung bình của bài báo cáo giữa kỳ và bài thi là như nhau |Y xµ tại x0 = 4. 5
4985 3
5395 2
5695 1
6350 với mức ý nghĩa 0,02.
Câu V Số liệu sau ñây là giá bán z của một nhãn hiệu và kiểu xe ñã qua sử dụng w năm tuổi.
w (năm)
2
5
z (ñô la)
4895
5750
(a) Tìm phương trình ñường hồi quy tuyến tính thực nghiệm và giá trị dự ñoán y khi x = 6
(b) Tính khoảng tin cậy 95% cho trung bình có ñiều kiện
(c) Tìm khoảng dự ñoán 95% cho y0 khi x0 = 4 Mục Khối lượng
Số quả 150
4 160
16 165
25 170
30 180
15 185
10 y x s s , , X (m)
Số lần ño 1100 1150 1250 1350 1450 1550 1650 1750 1850 1950 2000
48 26 32 42 20 10 16 14 4 8 X Y 36
8.3 Kiểm tra hai môn Toán và Lý từ một nhóm 10 học sinh ñược chọn ngẫu nhiên từ một lớp
ta có kết quả ñiểm (X,Y) như sau. Tính
, . y s s , , , X (ñiểm toán)
Y (ñiểm lý) 10
9 7
8 8
9 5
3 4
5 7
7 7
6 6
7 8
6 X Y 9
7
8.4 Nghiên cứu mối liên hệ giữa X là tháng tuổi và Y là khối lượng (kg) của một loại con
x
giống thu ñược bảng số liệu quan sát sau. Tính . Y 4 5 6 7 CLR = 3 X
1
2
3
4 4
1 6
5
3
2 2
7
8
7 5
2 = ; + Vào chế ñộ SD: MODE 2 +M (2) bảng tần số +M ix ix im + Nhập số liệu: (1) dãy số SHIFT VAR S − s xx
, 1 ⇒= = n X σ −1 SHIFT SUM S − 1 ,2 ∑∑
x nx
, ⇒= = CLR 3 = , + Xem kết quả: B. Tính các thống kê hai chiều bằng máy CASIO fx-500MS
+ Xoá bộ nhớ cho lần tính mới: SHIFT 1 , , ; + Vào chế ñộ REG: MODE 3 +M , (2) bảng tần số: +M ix iy ix jy ijm + Nhập số liệu: (1) cặp số: ⊳ ⊳ SHIFT VAR S − s s 1 xx
, yy
, rBA , , ⇒= = = n X n Y σ −1 σ −1 SHIFT SUM S − y xy ∑ 1 ,2 ∑∑
x nx
, ,2 ∑∑
y
, ⇒= ⊳ + Xem kết quả: −−−−2.9
−−−−2.8
−−−−2.7
−−−−2.6
−−−−2.5 −−−−2.4
−−−−2.3
−−−−2.2
−−−−2.1
−−−−2.0 −−−−1.9
−−−−1.8
−−−−1.7
−−−−1.6
−−−−1.5 −−−−1.4
−−−−1.3
−−−−1.2
−−−−1.1
−−−−1.0 −−−−0.9
−−−−0.8
−−−−0.7
−−−−0.6
−−−−0.5 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9278 0.9292 0.9306 0.9319 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9445 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 0.9554 0.9564 0.9573 0.9584 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 0.9641 0.9648 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 0.9981 0.9982 0.9983 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 0.325
0.289
0.277
0.271
0.267 0.727
0.617
0.584
0.569
0.559 1.963
1.386
1.250
1.190
1.1561 1.376
1.061
0.978
0.941
0.920 3.078
1.886
1.638
1.533
1.476 6.314
2.920
2.353
2.132
2.015 12.706
4.303
3.182
2.776
2.571 0.265
0.263
0.262
0.261
0.260 0.553
0.549
0.546
0.543
0.542 1.134
1.119
1.108
1.100
1.093 0.906
0.896
0.889
0.883
0.879 1.440
1.415
1.383
1.383
1.372 1.943
1.895
1.833
1.833
1.812 2.447
2.365
2.262
2.262
2.228 15.895
4.849
3.482
2.999
2.757 21.205
5.643
3.896
3.298
3.003 31.821
6.969
4.541
3.747
3.365 63.657
9.925
5.841
4.604
4.032 127.322
14.089
7.453
5.598
4.773 636.590
31.598
12.924
8.610
6.869 42.434
8.073
5.047
4.088
3.634 2.612
2.517
2.449
2.398
2.359 2.829
2.715
2.634
2.574
2.527 3.372
3.203
3.085
2.998
2.932 3.143
2.998
2.896
2.821
2.764 3.707
3.499
3.355
3.250
3.169 4.317
4.029
3.833
3.690
3.581 5.959
5.408
5.041
4.781
4.587 2.328
2.303
2.282
2.264
2.249 2.491
2.461
2.436
2.415
2.397 2.879
2.836
2.801
2.771
2.746 2.718
2.681
2.650
2.624
2.602 3.106
3.055
3.012
2.977
2.947 3.497
3.428
3.372
3.326
3.286 4.437
4.318
4.221
4.140
4.073 2.235
2.224
2.214
2.205
2.197 2.382
2.368
2.356
2.346
2.336 2.724
2.706
2.689
2.674
2.661 2.583
2.567
2.552
2.539
2.528 2.921
2.898
2.878
2.861
2.845 3.252
3.222
3.197
3.174
3.153 4.015
3.965
3.922
3.883
3.849 2.189
2.183
2.177
2.172
2.167 2.328
2.320
2.313
2.307
2.301 2.649
2.639
2.629
2.620
2.612 2.518
2.508
2.500
2.492
2.485 2.831
2.819
2.807
2.797
2.787 3.135
3.119
3.104
3.091
3.078 3.819
3.792
3.768
3.745
3.725 2.162
2.158
2,154
2.150
2.147 2.296
2.291
2.286
2.282
2.278 2.605
2.598
2.592
2.586
2.581 2.479
2.473
2.467
2.462
2.457 2.779
2.771
2.763
2.756
2.750 3.067
3.057
3.047
3.038
3.030 3.707
3.690
3.674
3.659
3.646 2.125
2.099
2.076 2.250
2.223
2.196 2.542
2.504
2.468 2.423
2.390
2.358 2.704
2.660
2.617 2.971
2.915
2.860 3.551
3.460
3.373 2.054 2.170 2.432 2.326 2.576 .807 3.29144
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$11. KIỂM ðỊNH GIẢ THUYẾT VỀ TRUNG BÌNH
PHẠM XUÂN ðỒNG
11.1 CÁC KHÁI NIỆM CHUNG.
1. Giả thuyết thống kê
2. Kiểm ñịnh một giả thiết thống kê.
3. Giả thiết thống kê và ñối thiết
Một giả thiết thống kê là một sự xác nhận hay phỏng ñoán liên quan ñến một hay nhiều
tổng thể, ký hiệu là
4. Các khả năng có thể xảy ra trong kiểm ñịnh giả thuyết.
5. Miền bác bỏ và miền chấp nhận
45
6. Các bước bài toán kiểm ñịnh giả thiết
1. Mô tả giả thiết
11.2 MẪU ðƠN: KIỂM ðỊNH VỀ MỘT TRUNG BÌNH.
I. Kiểm ñịnh về một trung bình, biết phương sai.
A. Kiểm ñịnh hai phía:
1.
1 :
Ví dụ 1 Một nhà sản xuất dụng cụ thể thao ñưa ra một loại dây câu mới, họ khẳng ñịnh dây có
thể chịu ñược trọng lượng trung bình là 8 kg, với ñộ lệch chuẩn là 0,5 kg. Người ta lấy 50 dây
ngẫu nhiên kiểm tra thấy trọng lượng trung bình có thể chịu ñược là 7,8 kg. Hãy kiểm ñịnh giả
thiết
Giải:
+ Gọi µ là trọng lượng trung bình có thể chịu ñược của dây với ñộ lệch tiêu chuẩn σ = 0,5 kg.
46
Chú ý: (1) Mối quan hệ giữa kiểm ñịnh 2 phía với khoảng tin cậy.
Trong trường hợp µ biết
II. Kiểm ñịnh về một trung bình có pp chuẩn, chưa biết phương sai và cỡ mẫu nhỏ.
47
Giải: + Tính số liệu mẫu n = 20,
+ Gọi µ là lượng natri trung bình trong các suất ăn.
+ Mức ý nghĩa α = 0,05; chưa biết ñộ lệch tổng thể.
+ ðây là bài toán kiểm ñịnh giả thiết trung bình của phân phối chuẩn chưa biết σ2 , mẫu nhỏ
1.
Ví dụ 5 Người ta thí nghiệm hai phương pháp chăn nuôi gà khác nhau ñể xem trọng lượng gà
sau một tháng. Kết quả như sau: phương pháp I nuôi 100 con, trọng lượng trung bình là
1,11 =x
(kg). Với mức ý
nghĩa 0,05 có thể kết luận hai phương pháp cho trọng lượng gà khác nhau không. Giả thiết
trọng lượng của gà theo luật chuẩn với phương sai của phương pháp I và II lần lượt là
2
1 =σ
Giải: Gọi
II. Kiểm ñịnh hiệu hai trung bình, khi phương sai chưa biết nhưng bằng nhau
1.
Số km
Số lốp loại A
Số lốp loại B
Giải: Gọi
49
TỔNG KẾT KIỂM ðỊNH GIẢ THIẾT VỀ TRUNG BÌNH
50
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$12. KIỂM ðỊNH GIẢ THUYẾT VỀ TỶ LỆ VỚI MẪU LỚN
PHẠM XUÂN ðỒNG
12.1 KIỂM ðỊNH VỀ MỘT TỶ LỆ VỚI CỠ MẪU LỚN.
I. Kiểm ñịnh một tỷ lệ với cỡ mẫu lớn.
Ví dụ 1 Một loại thuốc an thần thường ñược dùng chỉ có tác ñộng tới 60% người sử dụng. Kết
quả thử nghiệm loại thuốc mới trên 100 người trưởng thành cho thấy 70 người nhận ñược tác
dụng. Có thể tin ñược hay không rằng loại thuốc mới khác với loại thường dùng với mức ý
nghĩa 0,05.
Giải:
Ví dụ 2 Thống kê khối lượng X (g) của một loại hộp sữa bột ta thu ñược bảng:
51
Giải:
12.1 KIỂM ðỊNH VỀ HIỆU HAI TỶ LỆ VỚI CỠ MẪU LỚN.
II. Kiểm ñịnh về hai tỷ lệ bằng nhau với cỡ mẫu lớn.
Ví dụ 3 Một cuộc bỏ phiếu ñược ñưa ra ñể xác ñịnh vị trí xây dựng một nhà máy hóa chất ở
trong thị trấn hay ở ngoại vi thị trấn. Có 120 trên 200 cử tri trong thị trấn ñồng ý xây dựng nhà
máy trong thị trấn và 240 trên 500 cử tri ở ngoại vi ñồng ý với ñề xuất này. Liệu có thể cho
rằng tỷ lệ cử tri trong thị trấn và ở ngoại vi ñồng ý với ñề xuất như nhau hay không? Sử dụng
mức ý nghĩa 0,025.
Giải:
52
Ví dụ 4 Người ta chọn ngẫu nhiên 2 nhóm phụ nữ ñã có gia ñình nhưng chưa sinh con, ñộ tuổi
từ 25 tới 29. Nhóm 1 gồm những người có gia ñình chưa quá 2 năm, và nhóm 2 gồm những
người ñã có gia ñình 5 năm. Họ sẽ trả lời câu hỏi: họ có kế hoạch sinh con vào thời ñiểm nào?
240 trong số 300 phụ nữ ở nhóm 1 nói họ dự ñịnh sinh con trong thời gian này, và con số ñó
với nhóm 2 là 288 trong 400. Liệu có thể kết luận hay không rằng, tỷ lệ phụ nữ có kế hoạch
sinh con ở nhóm 1 là cao hơn tỷ lệ ở nhóm 2 với mức ý nghĩa 0,01.
Giải:
Ví dụ 5 Thống kê số học sinh thi trượt tốt nghiệp ở 2 trường THPT như sau:
53
Giải:
TỔNG KẾT KIỂM ðỊNH GIẢ THIẾT VỀ TRUNG BÌNH, TỶ LỆ
Chỉ tiêu kiểm ñịnh
Giá trị
tới hạn
Giả thiết
H0
ðối thiết
H1
Trường
hợp kiểm
ñịnh
Miền tiêu
chuẩn
(bác bỏ
H0)
1) một tỷ
lệ, cỡ
mẫu lớn.
2) hai tỷ
lệ bằng
nhau, cỡ
mẫu lớn.
54
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$13. HỒI QUY TUYẾN TÍNH ðƠN
PHẠM XUÂN ðỒNG
13.1 MỞ ðẦU VỀ HỒI QUY TUYẾN TÍNH
i
ñường hồi quy.
trình hồi quy tổng thể:
112
111
110
109
108
107
106
quy thực nghiệm hoặc ñường hồi quy phù hợp: ŷ = a + bx
Ký hiệu ŷ ñược sử dụng ở ñây ñể phân biệt giữa giá trị
ước lượng hoặc dự ñoán do ñường hồi quy mẫu ñưa ra và giá
trị thực nghiệm y ñược quan sát thực tế theo giá trị nào ñó
của x.
105
104
103
0
1
2
3
4
5
6
7
8
13.2 HỒI QUY TUYẾN TÍNH ðƠN VÀ PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI THIỂU
1. ðường hồi quy tuyến tính ñơn.
55
ñược coi là mô hình cho quan sát ñơn yi.
bx, mỗi cặp quan sát thỏa mãn quan hệ: yi = a +bxi + ei, trong ñó ei
= yi - ŷi ñược gọi là phần dư và mô tả sai số trong mức ñộ phù hợp
của mô hình tại ñiểm dữ liệu thứ i.
hồi quy αααα và ββββ là:
Chứng minh: Tổng các bình phương phần dư
phương tối thiểu. ðiều kiện SSE cực tiểu là:
SSE
b
∂
Ví dụ 1 Cho bởi dữ liệu của bảng trên. (a) Tìm ñường hồi quy tuyến tính thực nghiệm.
(b) Dự ñoán chiều cao trung bình của trẻ 5 tuổi và khi trẻ 8 tuổi?
Giải: (a) Tính số liệu mẫu:
70
56
Các ước lượng bình phương nhỏ nhất ñối với αααα và ββββ ñều là những ước lượng không
chệch.
ðịnh lý : Ước lượng không chệch của σσσσ2 là
Chú ý : Thường tính toán của các số trên ở dạng sau:
57
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$14. KHOẢNG TIN CẬY VÀ KIỂM ðỊNH GIẢ THIẾT
CÁC HỆ SỐ ðƯỜNG HỒI QUY – BÀI TOÁN DỰ ðOÁN
PHẠM XUÂN ðỒNG
14.1 KHOẢNG TIN CẬY CHO CÁC HỆ SỐ ðƯỜNG HỒI QUY
Khoảng tin cậy (1– α)100% ñối với tham số β , α trong ñường hồi quy µµµµY|x = αααα + ββββx là:
Chứng minh:
Chú ý: Ký hiệu α ñược sử dụng ở ñây theo cả hai cách hoàn toàn không liên quan: ñó là
mức ý nghĩa và ñiểm chặn của ñường hồi quy.
58
1608
,6
×
70
,83
×
4312
14.2 KIỂM ðỊNH GIẢ THIẾT CHO CÁC HỆ SỐ ðƯỜNG HỒI QUY
Khoảng tin cậy (1– α)100% ñối với trung bình có ñiều kiện µµµµY|xo là :
59
Chú ý: Có một vài lý do tại sao phải xây dựng hồi quy tuyến tính như dự ñoán các giá trị của
biến ngẫu nhiên tại một hay nhiều giá trị của biến ñộc lập. Phương trình ŷ = a+ bx có thể
OxYµ tại ñiểm x = x0,
trong ñó x0 không nhất thiết là một trong những giá trị chọn trước, hoặc có thể ñược sử dụng
ñể dự ñoán một giá trị y0 của biến Y0 khi x = x0. Khi ta kỳ vọng sai số dự ñoán có giá trị cao
hơn trong trường hợp dự ñoán một giá trị thì ñiều này sẽ ảnh hưởng ñến ñộ rộng của khoảng
giá trị ñược dự ñoán, chính là khoảng ước lượng.
Ví dụ 4 Sử dụng dữ liệu trong Ví dụ 1, hãy ước lượng khoảng tin cậy 95% cho kỳ vọng có
Giải: Khoảng tin cậy 95% cho
14.4 KHOẢNG DỰ ðOÁN CHO GIÁ TRỊ BIẾN Y
Khoảng tin cậy (1– α)100% ñối với giá trị y0 của biến ñáp ứng (single repsonse) là :
nhầm lẫn với loại khoảng dùng cho
Chú ý: Khoảng dự ñoán cho giá trị ngẫu nhiên quan sát tương lai thường bị hiểu sai và
xY |µ . Trên thực tế, nói chung khoảng dự ñoán có liên hệ
Ví dụ 5 Sử dụng dữ liệu của bảng: Thước ño phần trăm chất rắn x (%) và nhu cầu oxy sinh
hoá y (%)
60
61
TỔNG KẾT CÔNG THỨC
HỒI QUY, ƯỚC LƯỢNG, DỰ ðOÁN BIẾN 2 CHIỀU (X,Y)
1 Tổng các bình phương sai số giữa mẫu và trung bình mẫu:
2
Hàm hồi quy tuyến tính:
Hàm hồi quy tuyến tính thực nghiệm:
Ước lượng ñiểm của αααα, ββββ là a, b.
Ước lượng ñiểm của
3 Tổng các bình phương sai số giữa mẫu và ñường hồi quy tuyến tính thực nghiệm:
4
Ước lượng không chệch của σσσσ2 là:
5 Khoảng tin cậy của ββββ , αααα với ñộ tin cậy (1−−−−αααα)100% trong ñường y = µµµµY|x = αααα + ββββx
6
Kiểm ñịnh giả thiết ββββ :
7
Kiểm ñịnh giả thiết αααα :
8 Khoảng tin cậy ñối với giá trị trung bình µµµµY|x0
9 Khoảng dự ñoán (1−−−−αααα)100% ñối với y0 tại x0 :
TÓM TẮT BÀI GIẢNG TOÁN V ( XÁC SUẤT THỐNG KÊ )
$15. TỔNG KẾT VÀ CÁC BÀI TẬP TỔNG HỢP
PHẠM XUÂN ðỒNG
15.1 NỘI DUNG ÔN TẬP TOÁN V
I. XÁC SUẤT CỔ ðIỂN
1. ðịnh nghĩa cổ ñiển của xác suất.
2. Các ñịnh lý xác suất của các phép toán trên các biến cố.
3. Công thức ñầy ñủ và Bayes
4. Biến ngẫu nhiên và các phân phối xác suất.
5. Các phân phối xác suất rời rạc và liên tục thường gặp.
II. KỲ VỌNG, PHƯƠNG SAI VÀ COVARIANCE
1. Kỳ vọng toán học: ñịnh nghĩa, cách tính, ý nghĩa (rời rạc, liên tục)
2. Phương sai: ñịnh nghĩa, cách tính, ý nghĩa (rời rạc và liên tục)
3. Các tính chất của kỳ vọng và phương sai.
4. Bảng phân bố hai chiều và hàm mật ñộ hai chiều.
5. Phân phối xác suất biên duyên.
6. Covariance: cách tính , ý nghĩa.
7. Tính ñộc lập của hai biến ngẫu nhiên.
8. Phân phối có ñiều kiện, kỳ vọng có ñiều kiện.
III. BÀI TOÁN ƯỚC LƯỢNG MỘT MẪU VÀ HAI MẪU.
1. Khái niệm mẫu ngẫu nhiên ñơn giản, cỡ mẫu, các ñặc trưng mẫu.
2. Ước lượng ñiểm: ước lượng không chệch, ước lượng hiệu quả.
3. Khoảng tin cậy cho 1 kỳ vọng khi phương sai ñã biết , chưa biết.
4. Khoảng tin cậy cho hiệu 2 kỳ vọng khi phương sai ñã biết, chưa biết nhưng bằng nhau.
5. Khoảng tin cậy cho 1 tỷ lệ, 2 tỷ lệ khi mẫu lớn.
6. Khoảng tin cậy cho phương sai.
7. Mối quan hệ giữa 3 yếu tố trong khoảng tin cậy: ñộ tin cậy, sai số và cỡ mẫu.
IV. KIỂM ðỊNH GIẢ THIẾT MỘT MẪU VÀ HAI MẪU.
1. Khái niệm kiểm ñịnh giả thiết. Mức ý nghĩa α.
2. Kiểm ñịnh hai phía.
3. Tiêu chuẩn mức ý nghĩa α kiểm ñịnh hai phía.
4. Kiểm ñịnh 1 kỳ vọng khi phương sai ñã biết , chưa biết.
5. Kiểm ñịnh hiệu 2 kỳ vọng khi phương sai ñã biết , chưa biết nhưng bằng nhau.
6. Kiểm ñịnh 1 tỷ lệ
7. Kiểm ñịnh 2 tỷ lệ
8. Kiểm ñịnh sự phù hợp của giả thiết có phân phối chuẩn.
V. HỒI QUY TUYẾN TÍNH ðƠN VÀ SỰ TƯƠNG QUAN.
1. Khái niệm hàm hồi quy, hồi quy tuyến tính ñơn.
2. Phương trình ñường hồi quy theo phương pháp bình phương tối thiểu (hồi quy tuyến tính
thực nghiệm)
3. Tính chất của các ước lượng cho hệ số hồi quy.
4. Khoảng tin cậy cho β, α.
5. Kiểm ñịnh về hệ số góc của ñường hồi quy.
6. Dự báo khoảng tin cậy giá trị trung bình của Y (µY|x )
7. Khoảng tin cậy cho dự báo giá trị y0 .
8. Phân tích tương quan.
63
15.2 MỘT SỐ BÀI TẬP VỀ TÍNH SỐ LIỆU MẪU
1 Một mẫu ngẫu nhiên số công nhân của một nhà máy sản xuất ñịa phương cam kết tài trợ cho
quỹ United Fund với số tiền là (ñô la):
100 40 75 15 100 75 50 30 10 55 75 25 50 90 80 15 25 45 100
Tính: (a) trung bình mẫu. (b) phương sai mẫu. (c) trung vị mẫu (median mẫu) (d) mode.
2 Chiều cao X của sinh viên ñược coi là một biến ngẫu nhiên. Lấy một mẫu có số liệu sau
164
12
4 Thống kê số tiền quyên góp ủng hộ quỹ xoá ñói giảm nghèo cho thấy kết quả sau:
5 − 10
49
5 Hãy tính kỳ vọng mẫu, phương sai mẫu từ số liệu quan sát sau:
15.3 MỘT SỐ ðỀ LUYỆN TẬP (Thời gian 90 phút)
ðỀ SỐ 1
Câu I ðể buộc mọi người phải lái xe ñúng tốc ñộ qui ñịnh, cảnh sát giao thông ñặt hệ thống
raña bắn tốc ñộ ở 4 vị trí khác nhau trong thành phố. Tỷ lệ thời gian hoạt ñộng của mỗi hệ
thống raña ở các vị trí L1, L2, L3 và L4 lần lượt là 40%, 30%, 20%, và 30%. Một người lái xe
quá tốc ñộ qui ñịnh phải ñi qua các vị trí này với xác suất tương ứng là 0,2; 0,1; 0,5; và 0,2.
Tìm xác suất ñể anh ta phải nhận biên lai phạt.
Câu II Cho các biến ngẫu nhiên X và Y có hàm mật ñộ ñồng thời là :
k x
(
Câu III Một nhà khoa học nghiên cứu gen quan tâm ñến tỷ lệ ñàn ông châu Phi có rối loạn
tiểu cầu nhất ñịnh. Trong một mẫu ngẫu nhiên100 ñàn ông châu Phi, có 24 người ñược xác
ñịnh bị bệnh này.
64
Câu II Biến ngẫu nhiên X có hàm mật ñộ là:
Câu III Số liệu sau thể hiện khoảng thời gian chiếu phim của hai công ty ñiện ảnh.
Câu I Từ một hộp ñựng 6 quả bóng ñen và 4 quả bóng xanh lần lượt lấy ra 3 quả bóng bằng
cách trả lại hộp quả bóng ñã ñược lấy ra trước khi lấy quả bóng tiếp theo. Tìm xác suất ñể 3
quả bóng lấy ra có cả hai màu.
Câu II Giả sử X, Y là hai biến ngẫu nhiên ñộc lập với phân phối xác suất ñồng thời:
65
Câu III Một nhà sản xuất ñài của Compact sử dụng một loạt các kiểm tra tổng hợp cho tất cả
sản phẩm, ñể hiệu chỉnh các chức năng trước khi bán. Lấy một mẫu ngẫu nhiên 500 sản phẩm
thì thấy có 15 sản phẩm không phải hiệu chỉnh vì ñạt ngay yêu cầu.
(a) Xác ñịnh khoảng tin cậy 90% cho tỷ lệ tổng thể sản phẩm phải hiệu chỉnh qua các
kiểm tra tổng hợp
(b) Nếu lấy 800 sản phẩm cùng loại trên thì có nhiều nhất và ít nhất bao nhiêu sản
phẩm không phải hiệu chỉnh với ñộ tin cậy 90%.
Câu IV Một loại ra-ña mới ñược sử dụng trong hệ thống phòng thủ tên lửa nào ñó. Hệ thống
ñược kiểm tra qua các thí nghiệm với các máy bay mô hình. Qua 300 thí nghiệm, có 250 chiếc
bị tiêu diệt. Với mức ý nghĩa 0,04 liệu có thể khẳng ñịnh xác suất tiêu diệt mục tiêu của hệ
thống khi dùng loại ra-ña mới này là 0,8 hay không?
Câu V Số liệu sau có ñược từ một cuộc nghiên cứu về mối quan hệ giữa trọng lượng và kích
thước ngực của trẻ sơ sinh lúc sinh ra:
Trọng lượng (kg)
2,15
Kích thước ngực (cm)
26,3
(a) Tìm phương trình ñường hồi quy tuyến tính thực nghiệm và giá trị dự ñoán y khi x = 6,0
(b) Tính khoảng dự ñoán 95% cho y0 khi x0 = 4,5
ðỀ SỐ 4
Câu I Một nông trường thực hiện phun thuốc sâu 3 lần. Lần 1 có 80% số sâu bị chết, lần 2 lại
diệt ñược tiếp 60% số sâu còn lại, lần 3 diệt ñược 40% số sâu còn lại sau 2 lần phun. Tìm tỷ lệ
sâu chết sau 3 lần phun thuốc.
Câu II Cho biến ngẫu nhiên hai chiều (X, Y) có phân phối xác suất :
Câu IV ðiểm của một lớp học gồm 9 sinh viên trong bài báo cáo giữa kỳ (x) và bài thi (y) là
66
BÀI TẬP THEO 14 MỤC CHƯƠNG TRÌNH MÔN TOÁN V (XSTK)
Trang
Tên bài tập
27-30
1-4-6-17
37
6
$ 1.
46
63
9-10-11-12
12
45-46
5-6-15
53-56
3-5-10-13-19
$ 2.
61
7- 8
62-63
1-9-10
3-5-7-9-11-12-13-21-22-25-26
$ 3.
75-78
94-96
1-2−−−−3-4-6-13-23
$ 4.
1-2
98-99
107-109
2-5-7-12-15-17-20
$ 5.
117
2-6-11
128-129
8-21
$ 6.
130
2
140-141
1-4-7
149-150
2-15
$ 7.
157
2-5
178-179
5-11-19
232-233
7-12
3-6
247
$ 8.
3-6
261
278-279
4-6-8-10-13-15
$ 9.
1-4-7
290
1-3-7-8-9-14-15-17-19
$ 10. 299-300
1-2-7-11-12-18-24
$ 11. 351-352
360-361
1-2-5-6-10
$ 12.
379-382
1-4-10-12
388-390
1-4-5
$ 13.
396
3-4
403
11-14
$ 14.
412
1-2-6
67
Bài bổ sung tuần 8:
8.1 Cân thử 100 quả trứng ta có kết quả về khối lượng X (gam) mỗi quả như sau. Tính khối
lượng trung bình mẫu của trứng và phương sai mẫu. Tìm tỉ lệ quả trứng có khối lượng nhỏ hơn
165 gam trong mẫu ñó.
8.2 Các lần ño cao ñộ mực nước X tại một hồ nước (ñơn vị mét) cho số liệu như sau. Tính x , s
PHỤ LỤC 1: TÍNH BẰNG MÁY TÍNH CASIO
A. Tính các thống kê một chiều bằng máy CASIO fx-500MS
+ Xoá bộ nhớ cho lần tính mới: SHIFT
68
PHỤ LỤC 2: BẢNG TRA THƯỜNG SỬ DỤNG.
Bảng A.3 Giá trị của phân phối chuẩn.
Diện tích miền tính nằm phía dưới ñường cong chuẩn
và bên trái ñiểm z
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
z
−−−−3.4
−−−−3.3
−−−−3.2
−−−−3.1
−−−−3.0
0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
0.0019 0.0018 0.0017 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
0.0359 0.0352 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
0.0446 0.0436 0.0427 0.0416 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0555
0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0722 0.0708 0.0694 0.0681
0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
−−−−0.4
−−−−0.3
−−−−0.2
−−−−0.1
−−−−0.0
z
69
Bảng A.3 (tiếp)
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0000
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
z
70
Bảng A.4 Giá trị tới hạn của phân phối t
Diện tích miền tính nằm phía dưới ñường cong
và bên phải ñiểm tαααα
v
0.40
0.30
α
0.15
0.20
0.10
0.05
0.025
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0.260
0.259
0.259
0.258
0.258
0.540
0.539
0.537
0.537
0.536
1.088
1.083
1.079
1.076
1.074
0.876
0.873
0.870
0.868
0.866
1.363
1.356
1.350
1.345
1.341
1.796
1.782
1.771
1.761
1.753
2.201
2.179
2.160
2.145
2.131
16
17
18
19
20
0.258
0.257
0.257
0.257
0.257
0.535
0.534
0.534
0.533
0.533
1.071
1.069
1.067
1.066
1.064
0.865
0.863
0.862
0.861
0.860
1.337
1.333
1.330
1.328
1.325
1.746
1.740
1.734
1.729
1.725
2.120
2.110
2.101
2.093
2.086
21
22
23
24
25
0.257
0.256
0.256
0.256
0.256
0.532
0.532
0.532
0.531
0.531
1.063
1.061
1.060
1.059
1.058
0.859
0.858
0.858
0.857
0.856
1.323
1.321
1.319
1.318
1.316
1.721
1.717
1.714
1.711
1.708
2.080
2.074
2.069
2.064
2.060
26
27
28
29
30
0.256
0.256
0.256
0.256
0.256
0.531
0.531
0.530
0.530
0.530
1.058
1.057
1.056
1.055
1.055
0.856
0.855
0.855
0.854
0.854
1.315
1.314
1.313
1.311
1.310
1.706
1.703
1.701
1.699
1.697
2.056
2.052
2.048
2.045
2.042
40
60
120
0.255
0.254
0.254
0.253
0.40
0.529
0.527
0.526
0.524
0.30
1.050
1.045
1.041
1.036
0.15
0.851
0.848
0.845
0.842
0.20
1.303
1.296
1.289
1.282
0.10
1.684
1.671
1.658
1.645
0.05
2.021
2.000
1.980
1.960
0.025
∞∞∞∞
v
71
Bảng A.4 (tiếp)
v
0.02
0.015
0.01
0.005
0.0025
0.0005
α
0.0075
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
0.02
0.015
0.01
0.005
0.0075
0.0025
0.0005
∞∞∞∞
v
72