intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Thống kê y học - Bài 5: Phân phối xác suất

Chia sẻ: Nguyễn Bình Minh | Ngày: | Loại File: DOC | Số trang:9

183
lượt xem
15
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Thống kê y học - Bài 5: Phân phối xác suất cung cấp các kiến thức giúp người học có thể: Phân biệt được 3 phân phối xác suất phổ biến - Phân phối nhị thức, phân phối Poisson và phân phối bình thường; tính xác suất của phân phối nhị thức và phân phối poisson khi được cung cấp các tham số,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Thống kê y học - Bài 5: Phân phối xác suất

  1. PHÂN PHỐI XÁC SUẤT Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: ­ Phân biệt được 3 phân phối xác suất phổ biến: phân phối nhị thức, phân phối Poisson   và phân phối bình thường. ­ Tính xác suất của phân phối nhị  thức và phân phối poisson khi được cung cấp các   tham số ­ Xác định được phân phối xác suất của phân phối chuẩn  ở   một giá trị  bất kì, được  phép sử dụng bảng số của phân phối chuẩn. ­ Tính tỉ lệ của dân số có một đặc trưng nhất định về một đại lượng có phân phối bình   thường khi được cung cấp các tham số và bảng số của phân phối chuẩn. 1. Phân phối xác suất Như  đã trình bày,nếu chúng ta chỉ  quan tâm đến giá trị  đại lượng được xác định bởi   kết cục của phép thử,chúng ta mô tả biến cố là biến số ngẫu nhiên. Thí dụ nếu chúng  ta tung 3 đồng tiền mà chỉ  quan tâm đến số  đồng tiên ra mặt ngửa thì chúng ta tạo ra   biến số  ngẫu nhiên X là số  đồng tiền ngửa. Khi đó chúng ta có thể  kí hiệu (X=1) để  chỉ  biến cố  gồm các kết cuộc có số  đồng tiền ngửa là 1 (gồm 3 biến cố  Sấp ­Sấp ­   Ngửa; Sấp ­ Ngửa ­ Sấp; Ngửa ­ Sấp ­ Sấp). Xác suất của biến cố này được được gọi   là phân phối xác suất của X. Áp dụng vào thí dụ  trên chúng ta có phân phối xác suất   của X như sau: xi Số biến cố thuận  f(xi)=P(X=xi) F(xi)=P(X ≤  x) lợi 0 1 1/8 1/8 1 3 3/8 4/8 2 3 3/8 7/8 3 1 1/8 1 Ðịnh nghĩa: Phân phối xác suất của biến số  rời rạc là một bảng mô tả  những giá trị  của biến số rời rạc cùng với xác suất và xác suất tích luỹ tương ứng của nó.  Xác suất của các biến số ngẫu nhiên X được gọi là hàm khối (mass function) của X ­  kí hiệu là f(x). Xác suất tích luỹ của biến số ngẫu nhiên X được gọi là hàm phân phối   (distribution function) của X và được kí hiệu là F(x) Hai đặc tính cơ bản của phân phối xác suất của biến số rời rạc: (1) 0 ≤  P(X=x) ≤  1 (2) Σ P(X=x) = 1 Có hai phân phối xác suất rời rạc được sử dụng rộng rãi nhất là phân phối nhị thức và   phân phối Poision. Chúng ta sẽ  thảo luận về  hai phân phối này và phân phối bình   thường trong các phần sau.
  2. 2. Phân phối nhị thức Bài toán: Giả  sử  chúng ta thực hiện n phép thử  đồng nhất và độc lập với nhau, mỗi   phép thử  có 2 kết cuộc là thành công hay thất bại với xác suất thành công trong mỗi  lần thử là p. Hãy tính xác suất có x lần thành công. Khi thực hiện n lần thử chúng ta sẽ có 2n kết cục. Trong đó số kết cục có x lần thành  công là = px(1­p)n­x  và số kết cục có x lần thành công là nCr Vì vậy, xác suất có x lần thành công sau n lần thử là P( X x) n C x p x (1 p ) ( n x) Do xác suất này phụ thuộc vào x nên nó là hàm số của x và được gọi là hàm khối xác   suất nhị thức (binomial probability mass function)  f ( x) P( X x) n C x p x (1 p) ( n x) Thí dụ: giả sử trong một dân số nhất định, tỉ lệ sinh con trai là 52%. Nếu chúng ta xem   xét kết quả của 5 lần sinh. Để tính xác suất trong 5 lần sinh này có đúng 3 lần sinh là  con trai có thể lập luận như sau: ­ Ðể trong 5 lần sinh có 3 lần sinh con trai, có 5C3 = 5!/[3!x2!] = 10 cách khác nhau (đó  là TGTTG, TTTGG, TGGTT, TTGTG, TTGGT, TGTGT, GTTTG, GGTTT, GTGTT,  GTTGT). Xác suất xảy ra của một cách như  vậy = 0,523(1­0,52)2= 0,2304 x 0,1406 =  0,032. Như vậy xác suất trong 5 lần sinh có 3 lần sinh là con trai là 10 x 0,032 = 0,32. ­ Chúng ta cũng có thể xem 5 lần sinh là thử nghiệm nhị thức gồm 5 lần thử đồng nhất  và mỗi lần thử có hai kết cuộc (sinh con trai và sinh con gái ) và xác suất sinh con trai   là 0,52 không thay đổi trong các lần thử. Áp dụng hàm mật độ  xác suất nhị  thức ta   được f (3) P( X 3) 5 C 3 0,52 3 0,48 ( 5 3) 0,32 Thí dụ: Cho rằng  10% thanh niên trong dân số  là hút thuốc lá.  Để  tính xác suất có   đúng 2 thanh niên hút thuốc lá trong nhóm 10 thanh niên chúng ta có thể sử dụng hàm   mật độ xác suất nhị thức với n = 10, x = 2, and p = 0,1. Trong tr ường h ợp này xác suất  là 0,1937. Thí dụ: Giả sử có 30% trẻ dưới 5 tuổi bị suy dinh duỡng. Trong một mẫu 10 trẻ dưới   5, tính xác suất có đúng 4 bị suy dinh dưỡng. 3. Phân phối Poisson Bài toán: Giả sử trong một đơn vị thời gian trung bình có λ lần xuất hiện kết cục quan  tâm. Hãy tính xác suất trong một đơn vị thời gian có x lần xuất hiện kết cục này. Giả định một đơn vị thời gian được chia thành N phân tử thời gian với N là một số vô   cùng lớn. Khi đó xác suất xảy ra kết cục quan tâm trong một phân tử thời gian là   λ/N.  Khi đó bài toán có thể được đặt dưới dạng: Thực hiện thử nghiệm nhị thức với N lần   thử đồng nhất và xác suất xảy kết cuộc quan tâm trong mỗi lần thử là   λ/N. Áp dụng  công thức hàm mật độ xác suất nhị thức ta được
  3. x ( N x) x ( N x) N ( N 1) ... ( N x 1) f ( x) P( X x) N C x p (1 p ) 1 x! N N N x ( ) x Nx e 1 x! N x N x! x e f (X x) x! để nắm vững các phép biến đổi đại số kể trên cần nhớ lại định nghĩa của số e (cơ số  của logarithm Neper) U 1 e lim 1 U U =2,7183 Bài toán: Giả sử trong một đơn vị thời gian trung bình có λ lần xuất hiện kết cục quan  tâm. Hãy tính xác suất trong t đơn vị thời gian có x lần xuất hiện kết cục này. Giả định một đơn vị thời gian được chia thành N phân tử thời gian với N là một số vô   cùng lớn. Như vậy trong t đơn vị thời gian có Nt phân tử thời gian. Xác suất xảy ra kết  cục quan tâm trong một phân tử  thời gian là    λ/N. Khi đó bài toán có thể  được phát   biểu dưới dạng: Thực hiện thử nghiệm nhị thức với Nt lần thử đồng nhất và xác suất   xảy kết cuộc quan tâm trong mỗi lần thử là  λ/N. Áp dụng công thức hàm mật độ xác  suất nhị thức ta được x ( Nt x ) x ( Nt x ) Nt ( Nt 1) ... ( Nt x 1) f ( x) P( X x) Nt C x p (1 p ) 1 x! N N Nt Nt x ( ) x ( ) N xt x tx ( t)x e t 1 1 x! N x N x! N x! Một cách tổng quát, phân phối Poisson được dùng làm mô hình cho số  lần xuất hiện   các biến số  thuận lợi trong một khoảng thời gian (t đơn vị  thời gian) khi đã biết  λ,  trung bình số  lần xuất hiện biến cố  trong  một đơn vị  thời gian. Hàm khối xác suất   Poisson được trình bày công thức sau ( t)x e t f (X x) x! với λ là tham số của phân phối và là số lần xuất hiện trung bình của biến cố trong một  khoảng thời gian nhất định (hay trong một không gian nhất định) và e=2,7183. Thí dụ: Giả  sử số  lần nhập viện trong ngày cấp cứu  ở  một bệnh viện có phân phối   Poisson với số lần nhập viện trung bình là 3 lần/ngày. Tính xác suất a. Vào ngày 12 tháng 8 năm 2003, có đúng 2 trường hợp cấp cứu. b. Vào ngày 12 tháng 8 năm 2003, có 1 trường hợp cấp cứu nào. c. Trong một tuần có 7 trường hợp cấp cứu.
  4. Tỉ suất Số lần xuất  hiện trung bình của biến cố trong một đơn vị thời gian, λ,  còn được gọi  là tỉ suất (rate) hay mật độ mắc mới (incidence rate). Khác với xác suất,  λ là đại lượng  có đơn vị. Qua hàm khối của phân phối Poisson có thể nhận xét nếu trung bình số lần  xuất hiện của biến cố trong một đơn vị  thời gian là λ thì trung bình số lần xuất hiện  của t đơn vị thời gian là λt. 4. Phân phối xác suất của biến liên tục Giả sử ta muốn tìm phân phối xác suất của biến liên tục (thí dụ như trọng lượng của   trẻ sơ sinh), ta có thể phân loại trọng lượng sơ sinh thành nhiều nhóm nhỏ (thí dụ như  từ  2,0kg đến 
  5. Với  µ  là trung bình của phân phối với   σ  và  σ2  là phương sai là độ  lệch chuẩn và  phương sai của phân phối. Để thể hiện biến số X có phân phối bình thường với trung   bình là µ và phương sai σ2 còn có thể sử dụng kí hiệu X ∼  N(µ,σ2) Phân phối bình thường có 4 đặc tính quan trọng sau: ­ Mật độ cao nhất tập trung ở quanh giá trị µ, càng xa giá trị µ hàm mật độ càng giảm ­ Hàm mật độ tiến tới zero ở các giá trị cách xa µ ­ Hàm mật độ đối xứng qua đường thẳng đứng đi qua µ ­ Ngoài ra từ hàm mật  độ của phân phối bình thường người ta chứng minh được nếu  biến số có phân phối bình thường với trung bình là µ và độ lệch chuẩn σ, xác suất giá  trị  biến số  nằm từ  trung bình – 1,96 độ  lệch chuẩn đến trung bình + 1,96 độ  lệch   chuẩn là 95%. X~N(µ,σ2)  =>  P(µ ­ 1,96σ 
  6. Hình 3. Phân phối của phần trăm so với trọng lượng chuẩn của 1750 trẻ em học sinh nhà trẻ  Hoa Hướng Dương 15, Q11, Thành phố Hồ Chí Minh (trung bình=92, độ lệch chuẩn =10) a. Ước lượng tỉ lệ dân số có một thuộc tính nhất định Thí dụ:Thương số thông minh trong một dân số  có trung bình =100 và độ  lệch chuẩn  15. Chọn ngẫu nhiên một người trong dân số  này, tính xác suất người này có thương  số thông minh nhỏ hơn 120. P(IQ
  7. b. Chẩn đoán cho cá nhân Thí dụ: Theo tổ chức y tế thế giới, đứa trẻ 32 tháng bình thường có trọng lượng trung   bình là 14 kg với độ lệch chuẩn là 1,5 kg. Một đứa trẻ 32 tháng nặng 13 kg có phải là   bất bình thường về dinh dưỡng hay không? Ðể  trả  lời câu hỏi này chúng ta phải xét hiện tượng đứa trẻ  32 tháng nặng 13 kg có  phổ biến hay không. P(TL 
  8. a. Xác suất không có ai sống sót = Xác suất số thành công bằng 0 = P(X=0)= = 10C0 p0(1­p)(10­0) =10C10 . 0,90.0,110  =10!/(0!10!).0,110=1/(1010) Xác suất là 1 phần mười tỉ. b. Ta có P(X=0)+P(X=1)+P(X=2)+P(X=3)+.......+P(X=10) = 1 It nhất hai người bị chết nghĩa là là có từ 0 đến 8 người sống. Do đó, xác suất   có ít nhất hai người bị chết là: P(X=0)+P(X=1)+.......+P(X=8) = 1­ P(X=9)­P(X=10) Với P(X=10) = 10C10 p10(1­p)(10­10) = 0,910 = 0,3486 Và P(X=9) = 10C9 p9(1­p)(10­9) = 0,99 = 0,3874 Nên xác suất có ít nhất 2 người bị chết bằng: 1 ­ 0,3486 ­ 0,3874 = 0,264 c. Xác suât có đúng 3 người bị chết là = Xác suất có 7 người sống: P(X=7) = 10C7 p7(1­p)(10­7) = 120 . 0,97 . 0,13 = 0,0574. Bài tập phân phối Poisson Biết rằng số  chuột trung bình trong mỗi hộ  gia đình  ở  Cần thơ  là 1,4 con. Nếu số  chuột tuân theo phân phối Poisson, tính xác suất ở một gia đình nhất định có: a. Không có con chuột nào? b. Có một con chuột? c. Có từ 3 con chuột trở lên? Bài giải: a. Sử dụng công thức x e f ( x) P(X=x) = x! với λ = 1,4 và x = 0 ta được  P(X=0) = 0,247 x 1,40  / 0! = 0,247 b. P(X=1) =  0,247 x 1,41  / 1! = 0,346 c. Vì P(X=0)+P(X=1)+P(X=2)+P(X≥ 3) =1 Ta có P(X(3) = 1 ­ P(X=0)  ­ P(X=1)  ­ P(X=2) Với  P(X=0) = 0,247 x 1,40  / 0! = 0,247   P(X=1) =  0,247 x 1,41  / 1! = 0,346 P(X=2) =  0,247 x 1,42  / 2! = 0,242 Nên  P(X ≥  3) = 1 ­ 0,247 ­ 0,346 ­ 0,242 = 0,165 Phân phối bình thường 1. Hãy liệt kê 10 biến số ngẫu nhiên mà anh chị nghĩa rằng nó là phân phối xấp xỉ bình  thường. 2. Nếu hàm lượng cholesterol  huyết thanh là phân phối xấp xỉ bình thường với trung   bình là 200mg/100 ml và độ  lệch chuẩn là 20 mg/100ml. Tính xác suất một cá nhân 
  9. được chọn ngẫu nhiên có giá trị  cholesterol (a) từ 180 đến 200 mg/100ml (b) lớn hơn  225 mg/100 ml (c) nhỏ hơn 150 mg/100ml (d) giữa 190 và 210 mg/100 ml. Bài giải 1.  Những biến số có phân phối xấp xỉ bình thường là : chiều cao của đàn   ông  trưởng thành, trọng lượng trẻ sơ sinh, hemoglobin máu, Hct, đường huyết,   chu vi vòng cánh tay, nhịp tim, tuổi dậy thì của phụ nữ, cholesterol huyết thanh,  tỉ trọng nước tiểu. 2.a.   P(180 
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2