Chương 3
QUY LUẬT PHÂN PHỐI XÁC SUẤT THƯỜNG GẶP
1
Chương 3
2
3.1. Biến ngẫu nhiên rời rạc
3
• Luật “không - một” A(p) Bernoulli • Luật nhị thức B(n,p) Binomial • Luật Poisson P() Poisson • Luật siêu bội H(N,M, n) Hypergeometric
Phân phối Không – một
• Ký hiệu khác: X~A(p) • Còn gọi là phân phối Bernoulli. • Bảng ppxs:
X P
0 q
1 p
p
pq
• Tham số đặc trưng: E X
V X
4
Phân phối Nhị thức
Ví dụ mở đầu. Bắn ba viên đạn vào bia. Xác suất bắn trúng của mỗi viên đều là 0,8. Gọi X là số viên đạn trúng bia. Khi đó X nhận giá trị 0,1,2,3. Ta có:
P X (
0 )
0.2 0.2 0.2 1
0 0.8 0.2
KKK
P
3
2
P X (
1 )
3 0.8 0.2 0.2 3 0.8 0.2
1 2
P X (
2 )
3 0.8 0.8 0.2 3 0.8 0.2
TTK
P
P KTK P TKT
P TKK P KTT
1
0
P X (
3 )
0.8 0.8 0.8 1
TTT
P
3 0.8 0. 2
P KKT
5
Phân phối Nhị thức (Binomial)
x
n x
C p q
p x
• Kí hiệu: X~B(n,p) • Hàm khối xác suất: k n
• x={0,1,2,3…n} • n,p gọi là các tham số (parameter)
6
Khi nào có phân phối B(n,p)
• Định nghĩa. Một biến ngẫu nhiên rời rạc X gọi là có
phân phối Nhị thức nếu:
• Một thí nghiệm hoặc một phép thử được thực hiện
trong cùng một điều kiện đúng n lần
• Trong mỗi phép thử chỉ có 2 biến cố. Một biến cố gọi là
“thành công” và một biến cố “thất bại”.
• n phép thử độc lập nhau. • Xác suất thành công, ký hiệu p, là như nhau trong mỗi
phép thử. Xác suất thất bại là q=1-p.
• Biến ngẫu nhiên X = số lần thành công trong n phép
thử
7
Ví dụ 1
• Một giảng viên đại học lấy mẫu ngẫu nhiên các sinh viên cho đến khi anh ta tìm thấy bốn sinh viên tình nguyện đi mùa hè xanh. Đặt X là số sinh viên được lấy mẫy. X có phải là biến ngẫu nhiên có phân phối nhị thức không?
8
• Một đồng xu được chế tạo sao cho xác suất xuất hiện mặt ngửa mỗi lần tung là 70%. Tung đồng xu 100 lần, theo các cách y hệt nhau. Gọi X là số lần đồng xu xuất hiện mặt ngửa. X có phải là biến ngẫu nhiên có phân phối Nhị thức?
Ví dụ 2
• Một cuộc khảo sát với cỡ mẫu n = 1000 người Mỹ trưởng thành ngẫu nhiên được tiến hành. Đặt X là số người sở hữu một chiếc xe thể thao đa dụng (SUV) trong mẫu. X có phải là biến ngẫu nhiên nhị thức không?
• Một nhân viên kiểm soát chất lượng điều tra một lô gồm 15 sản phẩm. Anh ta lấy mẫu ngẫu nhiên (không thay thế) 5 sản phẩm từ lô. Đặt X bằng số sản phẩm đạt yêu cầu. X có phải là biến ngẫu nhiên nhị thức không?
9
Effect of n and p on Shape
For small p and small n, the binomial distribution is what we call skewed right
For large p and small n, the binomial distribution is what we call skewed left
10
Effect of n and p on Shape
For small p and large n, the binomial distribution approaches symmetry.
For p = 0.5 and large and small n, the binomial distribution is what we call symmetric.
11
Tham số đặc trưng
np
)
i
• Cho bnn X~B(n,p). Ta có:
E X ii VX npq
)
p
1
ModX
n
p
1
iii n )
1
12
Ví dụ 3
• Xác suất để 1 bệnh nhân được chữa khỏi khi điều trị một bệnh hiếm gặp về máu là 0,4. Nếu 15 người đồng ý chữa trị thì xác suất:
13
• A) Có ít nhất 10 người khỏi • B) Có từ 3 đến 8 người khỏi • C) Có đúng 5 người khỏi Là bao nhiêu?
Ví dụ 4
• Một chuỗi cửa hàng bán lẻ lớn mua một loại thiết bị điện tử về để bán. Nhà sản xuất cho biết tỷ lệ bị hư hỏng của loại thiết bị này là 3%.
a) Bộ phận kiểm tra lấy ngẫu nhiên 20 thiết bị từ lô hàng được giao. Xác suất có ít nhất 1 thiết bị hỏng là bao nhiêu?
14
b) Giả sử cửa hàng nhập 10 lô hàng 1 tháng và với mỗi lô hàng đều được kiểm tra ngẫu nhiên 20 thiết bị. Xác suất có đúng 3 lô hàng có chứa ít nhất 1 thiết bị hỏng trong số 20 thiết bị được kiểm tra?
Ví dụ 5
• Có giả thiết cho rằng 30% các giếng nước ở vùng nông thôn có tạp chất. Để có thể tìm hiểu kỹ hơn người ta đi xét nghiệm một số giếng (vì không đủ tiền xét nghiệm hết).
• A) Giả sử giả thiết trên đúng, tính xác suất có đúng
3 giếng có tạp chất.
15
• B) Xác suất có nhiều hơn 3 giếng có tạp chất? • C) Giả sử trong 10 giếng đã kiểm tra thì có 6 giếng có tạp chất. Có thể kết luận gì về giả thiết trên?
Tính chất
Cho X1, X2 là hai bnn độc lập. Giả sử:
X
~
,
p
;
X
~
,
p
1
B n 1
2
B n 2
Khi đó:
X
X
~
1
2
B n 1
n p , 2
16
Ví dụ 6
• Hai đội A và B tham gia đấu giải với nhau và đội nào đạt 4 trận thắng trước là đội chiến thắng cả giải. Xác suất đội A thắng một trận đấu bất kỳ đều là p và giả sử rằng các trận đấu đều độc lập nhau.
17
• Xác suất A thắng giải là bao nhiêu?
Phân phối siêu bội
• Định nghĩa. Nếu ta chọn ngẫu nhiên n phần tử, không hoàn lại, trong một tập hợp gồm N phần tử với:
A
A
p x
C
• NA phần tử thuộc một loại, giả sử loại A. • Và N- NA phần tử còn lại thuộc loại khác. • Gọi X là số phần tử loại A trong số n phần tử được
18
chọn. Khi này PDF của X dạng n x x C C . N N N n N
Phân phối siêu bội
A
A
i x n ) ii x N )
p x
C
x n x C C . N N N n N
A iii n x N N
)
A
• Các giá trị của bnn X thỏa mãn:
19
• Biến ngẫu nhiên X gọi là có phân phối siêu bội. • Ký hiệu: X~H(N,NA,n)
Mô hình siêu bội
Tính chất A
N N
A
AN
Xét tập hợp có N phần tử.
Lấy ngẫu nhiên n phần tử. Lấy ngẫu nhiên n phần tử,
không hoàn lại.
20
X: số phần tử có t/c A trong n phần tử đã lấy.
Các tham số đặc trưng
Cho bnn X~H(N,NA,n) ta có:
np
;
npq
E X
V X
N n N 1
Trong đó:
p
;
q
1
p
AN N
21
ModX
k ModX k 0
0 1
• Ta có:
n
1
AN
k
1
0
1 2
N
• Với
22
• Công thức trên cho ta khoảng chứa ModX.
Ví dụ 7
23
• Một hồ có 600 con cá, 80 con được đánh dấu bởi các nhà khoa học. Một nhà nghiên cứu chọn ngẫu nhiên 15 con từ hồ. Hãy tìm công thức cho hàm P.M.F của biến ngẫu nhiên X, với X là số cá được đánh dấu có trong mẫu lấy ra.
Ví dụ 8
• Giả sử có 5 người, trong đó có bạn và một người bạn của bạn, xếp hàng một cách ngẫu nhiên. Gọi X là biến ngẫu nhiên thể hiện số người ở giữa bạn và bạn của mình. Hãy xác định PMF của X dưới dạng bảng. Hãy kiểm ta tính hợp lý của hàm PMF này.
X
0
1
2
3
P
0,4
0,3
0,2
0,1
24
Ví dụ 9
25
• Kiện hàng chứa 40 sản phẩm. Bên mua sẽ không mua kiện hàng nếu có từ 3 sản phẩm lỗi trở lên. Để tiện, bên mua quy ước lấy 5 sản phẩm ra kiểm tra, nếu có đúng 1 sản phẩm lỗi thì không mua lô hàng. Xác suất tìm thấy đúng 1 sản phẩm lỗi biết lô hàng có 3 sản phẩm lỗi là bao nhiêu?
Ví dụ 10
26
Trong một cửa hàng bán 100 bóng đèn có 5 bóng hỏng. Một người mua ngẫu nhiên 3 bóng. Gọi X là số bóng hỏng người đó mua phải. a) X pp theo qui luật gì? Viết biểu thức? b) Tính kì vọng, phương sai của bnn X? c) Tính ModX?
Ví dụ 11
Một hộp có 20 sản phẩm trong đó có 6 phế phẩm. Lấy ngẫu nhiên 4 sp từ hộp. Gọi X là số phế phẩm trong 4 sp.
27
a) Luật phân phối xác suất của X. b) Tính E(X), Var(X)? c) Tìm Mod(X)
Quan hệ giữa Nhị thức và siêu bội
n< ~ , ~ ,
X H N N n
X B n p ,A N>20n k
n k A A P X k k
C p q
n C
n k
k
C C
N N
N
n
N 28 Ví dụ 12 29 • Nhà sản xuất thông báo rằng trong số 5000 lốp xe
máy gửi cho một nhà phân phối ở HCM có 1000
lốp có lỗi nhẹ. Nếu một người mua ngẫu nhiên 10
lốp xe từ nhà phân phối này thì xác suất có 3 lốp
mắc lỗi là bao nhiêu? Phân phối Poisson • X: số lần một sự kiện xh trong 1 khoảng thời gian (không gian) 30 • X=0,1,2,…
• X có thể là bnn Poisson
• Ví dụ:
• Số lỗi sai trên 1 trang in
• Số khách hàng vào ATM trong 10 phút
• Số người qua ngã tư trong 2 phút Phân phối Poisson P(λ) x
p x Định nghĩa: bnn X gọi là phân phối theo qui luật Poisson P(λ) nếu có PMF dạng:
e
.
x
! 31 • x=0,1,2,3… và λ>0
• Kí hiệu: X~ P(λ) Điều kiện để xấp xỉ phân phối Poisson • X: số lần sự kiện xh trong 1 khoảng liên tục.
• X tuân theo quá trình xấp xỉ Poisson với tham số λ>0 nếu: a) Số lượng các sự kiện xh trong những khoảng rời nhau là độc lập. b) Xác suất có đúng 1 sự kiện xh trong 1 khoảng ngắn có độ dài h=1/n xấp xỉ với λh = λ(1/n) = λ/n. c) Xác suất có đúng 2 hoặc nhiều hơn hai sự kiện xh trong một khoảng ngắn là 0 (rất nhỏ). 32 Hàm mật độ • Từ công thức n x P X x C
( ) 1 x
n
n x
n
• Lấy giới hạn, ta có: n x
C 1 x
n lim
n
n x
n
x x 1 1 1 1 1 1 lim
n
x
k
!
n 1
n 2
n
n
n
n
e p x
( ) x
x
! 33 Các tham số và tính chất i ) ii V X ) iii ) ModX • Cho X~ P(λ). Ta có:
E X
1
• X1, X2 là hai bnn độc lập và X1~ P(λ1); X2~ P(λ2). X X P 1 2
~
1
2 34 Ta có: Tham số đặc trưng
1 e !
1 k
P X k
P X k
1
e k
1
k
k
!
k
k 1 1
P X k
P X k • Xét tỷ lệ P(X=k+1) và P(X=k) ta có:
1
1 ModX 35 • Vậy Một số ví dụ • Số lần truy cập vào một máy chủ web trong mỗi phút. • Số cuộc điện thoại tại một trạm điện thoại trong mỗi phút. • Số lượng bóng đèn bị cháy trong một khoảng thời gian xác định. • Số lần gõ bị sai của khi đánh máy một trang giấy.
• Số lần động vật bị chết do xe cộ cán phải trên mỗi đơn vị độ dài của một con đường. • Số lượng cây thông trên mỗi đơn vị diện tích rừng hỗn hợp. 36 Ví dụ 13 Trong một nhà máy dệt, biết số ống sợi bị đứt trong 1
giờ có phân phối Poisson với trung bình là 4. Tính xác
suất trong 1 giờ có
a. Đúng 3 ống sợi bị đứt. ( biến cố A)
b. Có ít nhất 1 ống sợi bị đứt.( bc B) 37 Ví dụ 14 Một trạm điện thoại trung bình nhận được 300 cuộc gọi trong một giờ. Tính xác suất: a) Trạm nhận được đúng 2 cuộc gọi trong vòng 1 phút.
b) Trạm nhận được đúng 3 cuộc gọi trong vòng 5 phút. 38 Xấp xỉ B(n,p) bằng P(λ) • Khi n lớn và p nhỏ thì ta có thể xấp xỉ phân phối Nhị thức bằng phân phối Poisson x x x n x
e nC p q
x
! n p E X . • Nghĩa là: 20 n n 100 hay p 0,05 p 0,1
39 • Trong đó:
• Điều kiện để xấp xỉ tốt:
Ví dụ 15 • Năm phần trăm (5%) bóng đèn cây thông Giáng sinh
do một công ty sản xuất bị lỗi. Giám đốc của bộ phận
kiểm soát chất lượng của công ty khá quan ngại và do
đó lấy mẫu ngẫu nhiên 100 bóng đèn ra khỏi dây
chuyền lắp ráp. Gọi X là số bóng đèn trong mẫu bị lỗi.
Xác suất mà mẫu chứa nhiều nhất là ba bóng đèn bị lỗi
là bao nhiêu? 40 Ví dụ 16 41 • Một cửa hàng một ngày nhận bán 10 loại nhật
báo khác nhau. Xác suất bán hết báo trong ngày
của mỗi loại là 0,8. Vậy nếu trong một năm với
khoảng 300 ngày bán hàng thì có khoảng bao
nhiêu ngày bán không hết báo? 3.2. Biến ngẫu nhiên liên tục 42 • Phân phối đều U(a, b) Uniform
• Phân phối lũy thừa Exponential
• Phân phối chuẩn Normal
• Phân phối Student
• Phân phối Khi bình phương Chi-squared,
• Phân phối Fisher Phân phối đều f x ( ) 1
b a
Trong đó: ≤ ≤ F x
( ) x a
b a
43 Phân phối đều 2
i E X
)
Var X a b
2 b a
12 ) a b
, MedX ii ModX x
0 a b
2 44 • Các tham số đặc trưng Ứng dụng của phân phối đều
• Các giá trị gần đúng của phân phối U (0,1) có thể được mô phỏng trên
hầu hết các máy tính sử dụng bộ tạo số ngẫu nhiên. Các số được tạo
sau đó có thể được sử dụng để chỉ định ngẫu nhiên một người điều trị
trong các nghiên cứu thử nghiệm hoặc chọn ngẫu nhiên một cá nhân
để tham gia vào một cuộc khảo sát. • Các số ngẫu nhiên được tạo từ máy tính không thực sự ngẫu nhiên về
mặt kỹ thuật, vì chúng được tạo từ một số giá trị ban đầu (được gọi là
hạt giống- seed). • Nếu cùng một hạt giống được sử dụng lặp đi lặp lại, cùng một chuỗi các
số ngẫu nhiên sẽ được tạo ra. Việc tạo số ngẫu nhiên như vậy đôi khi
được gọi là tạo số giả ngẫu nhiên. Mặc dù một chuỗi các số ngẫu nhiên
được xác định trước bởi một số hạt giống, các số này hoạt động như
thể chúng thực sự được tạo ngẫu nhiên, và rất hữu ích trong các ứng
dụng như trên. Tuy nhiên, chúng có thể không hữu ích trong các ứng
dụng về mật mã hoặc bảo mật internet! 45 Ứng dụng của phân bố đều • Bài 1. Lớp có 40 sinh viên, giảng viên cần chia
thành 2 nhóm mỗi nhóm 20 sinh viên. Làm cách
nào chia nhóm một cách ngẫu nhiên? • Bài 2. Làm cách nào chọn được ngẫu nhiên 100
sinh viên trong toàn bộ sinh viên đang học tại
FTU2 (giả sử gồm 4000 sinh viên) để tham gia
khảo sát về chất lượng giảng dạy. 414/node/137/ 46 • Xem bài viết gốc tại:
• https://newonlinecourses.science.psu.edu/stat Biểu đồ Q-Q (quantile-quantile plot) • Làm thế nào chúng ta có thể đánh giá nếu một tập
hợp dữ liệu cụ thể tuân theo phân phối xác suất
cụ thể? • Cách 1: so sánh các số đặc trưng không đủ
• Cách 2: dùng Q-Q plot (biểu đồ so sánh các phân 47 vị) Ví dụ 17 48 • Tập hợp 19 số dưới đây được phát sinh ngẫu
nhiên từ phân phối U(0,1) bằng phần mềm
Minitabs. Hãy xem xét xem các số này có phù hợp
với mô hình xác suất cho bởi f(x)=1 với 0 Ví dụ 17 E(X) 1/2 = 0.5 0.4648 V(X) 1/12 = 0.0833 0.078 49 Phân phối lũy thừa f x
( )
x
eĐịnh nghĩa. Một biến ngẫu nhiên X gọi là có phân phối
đều U(a,b) nếu hàm mật độ có dạng:
Lý thuyết
Data
Định nghĩa. Một biến ngẫu nhiên X gọi là có phân phối
lũy thừa E( ) nếu hàm mật độ có dạng: