intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Thống kê y học - Bài 3: Xác suất có điều kiện - Định luật nhân xác suất

Chia sẻ: Nguyễn Bình Minh | Ngày: | Loại File: DOC | Số trang:7

169
lượt xem
9
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục tiêu của bài giảng là cung cấp các kiến thức giúp người học có thể trình bày định nghĩa của xác suất có điều kiện, trình bày công thức cộng xác suất và công thức nhân xác suất. Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Thống kê y học - Bài 3: Xác suất có điều kiện - Định luật nhân xác suất

  1. XÁC SUẤT CÓ ĐIỀU KIỆN - ĐỊNH LUẬT NHÂN XÁC SUẤT Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: ­ Trình bày định nghĩa của xác suất có điều kiện ­ Trình bày công thức cộng xác suất và công thức nhân xác suất 1. Xác suất có điều kiện Nếu các kết cục có thể  không bao gồm toàn thể  các kết cục (khi một số  kết cục bị  hạn chế)  thì xác suất có thể được gọi là xác suất có điều kiện. Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) Bảng 2. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện X Khoa  Khoa  Tổng số Phổi Thận Nam 11 4 15 Nữ 27 8 35 Tổng số 38 12 50 Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân   bố  của các đặc điểm của bệnh nhân này được trình bày trong bảng. Chọn một người   bất kì, xác suất người là nam  và nằm ở khoa Phổi ­ P(Nam và Khoa Phổi)­ có phải là  xác suất có điều kiện hay không? Hãy tính xác suất này. Chọn một người bất kì, Xác suất người là nam  và nằm ở khoa Phổi ­ P(Nam và Khoa  Phổi) – không phải là xác suất có điều kiện bởi vì các kết cục không có hạn chế   (ai   cũng có thể được chọn).   N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 11;  P (Nam và Khoa Phổi) =  Thí dụ: Chọn một người nam, xác suất người này nằm ở khoa Phổi có phải là  xác suất có điều kiện hay không? Hãy tính xác suất này. Chọn một người nam, xác suất người này nằm  ở  khoa Phổi là xác suất có điều kiện   bởi vì số kết cục bị hạn chế (chỉ có bệnh nhân nam được chọn và như vậy kết cục chỉ  có thể là 1 trong số 15 bệnh nhân nam) Nc: Số kết cuộc có thể là 15; m: số các kết cuộc thuận lợi cho 11;  Xác suất người này nằm ở khoa Phổi  với điều kiện người này là nam giới = P  (Khoa Phổi|Nam) =  Lưu ý: Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) và điều  kiện này phải đúng cho cả kết cục thuận lợi (m) và kết cục có thể  (Nc). Trong thí dụ  trên 11 kết cục thuận lợi vừa đòi hỏi điều kiện là nam giới và đặc tính là nằm ở khoa   phổi và 15 kết cục có thể đòi hỏi điều kiện là nam giới. Thể hiện nhận xét bằng công  thức:
  2. m n( A B ) n( A B ) / N P( A B) P ( B | A) Nc n( A) n( A) / N P( A) (5) n(A∩B ) là số  kết cục thoả điều kiện A và đặc tính B và n(A) số  kết cục thoả  điều   kiện A Thí dụ: Chọn một bệnh nhân ở khoa Thận, tính xác suất bệnh nhân này là nữ. Đây là xác suất có điều kiện. P(nữ|khoa Thận) = =  =  = 0,75 Thí dụ: Theo bản báo cáo “Số ca nghi nhiễm SARS tích luỹ” của Tổ Chức Y tế Thế  Giới   (http://www.who.int/csr/sars/country/2003_05_17/en/),   Số   ca   bệnh   SARS   (Hội  chứng Hô hấp cấp tính trầm trọng) từ ngày 1/10/2002 đến ngày 17/5/2003 là 7761 với   623 trường hợp tử vong. Xác suất tử vong của những người mắc SARS là xác suất có   điều kiện: ( cả 623 ca tử vong và 7761 ca bệnh đều mắc SARS). P(tử vong|SARS)= Xác suất có điều kiện này (Xác suất tử vong ở những người mắc một bệnh cụ  thể nào đó) được gọi là tỉ suất chết/mắc của bệnh đó (case­fatality rate). Thí dụ: Trong một dân số, tỉ lệ những người có dấu hiệu lách to là 20%, những người   vừa sốt rét vừa lách to là 18%, những người bị sốt rét là 23%. Một người ngẫu nhiên  từ dân số đó, người này không có dấu hiệu lách to. Tính khả năng người này bị sốt rét?  Bài giải:  P(sốt rét|lách không to) = P(sốt rét và lách không to) / P(lách không to)  = [P(sốt rét) ­ P(sốt rét và lách to)]/ P(lách không to)  = (0.23­0.18)/0.8  =  0.05/0.8 =0.0625 2. Ðịnh luật nhân xác suất Từ phương trình (5) ta có thể xây dựng công thức: P(A∩B) = P(A) ×   P(B|A) (6) P(A∩B) = P(B∩A) =P(B) ×   P(A|B)  Công thức này được gọi là định lí nhân xác suất. Thí dụ: Nếu xác suất mắc bệnh lao, P(Lao) = 0,001 và xác suất chết/mắc của bệnh  Lao, P(chết|Lao) = 0,1. Xác suất chết vì bệnh lao: P(Lao và Chết) =  P(Lao) ×   P(Chết | Lao) = 0,001 ×  0,1 = 0,0001 Tính độc lập Một   trong   những   khái   niệm   quan   trọng   trong   lí   thuyết   xác   suất   là   tính   độc   lập  (independence). Hai biến cố A và B được gọi là độc lập nếu P(B|A) = P(B), hoặc suy  ra từ (6) nếu  P(A∩B) = P(A) ×   P(B) (7) Ý nghĩa của định nghĩa theo xác suất có điều kiện là xác suất của B không thay đổi dù  có hay không có điều kiện A. Từ  phương trình (7) chúng ta có thể  suy ra là tính độc  lập có tính chất đối xứng (nếu A độc lập với B thì B độc lập với A và ngược lại). Thí dụ: 
  3. Giả sử Xác suất bị  chấn thương giao thông trên dân  số  chung = P(chấn thương giao thông)   =0,01 Xác suất bị chấn thương giao thông ở người hút thuốc lá = P(chấn thương giao thông |  hút thuốc lá) = 0,01 Khi đó chấn thương giao thông và hút thuốc lá là hai biến cố độc lập. Giả sử Xác suất bị  chấn thương giao thông trên dân  số  chung = P(chấn thương giao thông)   =0,01 Xác suất bị chấn thương giao thông ở người nghiện rượu = P(chấn thương giao thông   | nghiện rượu) = 0,03 Khi đó chấn thương giao thông và nghiện rượu là hai biến cố không độc lập Khi biến cố A không độc lập với biến cố B thì: ­ A => B hoặc ­ B => A hoặc ­ Có một yếu tố   ảnh hưởng đến cả  A và B (yếu tố  này được gọi là yếu tố  gây nhiễu). Do đó nếu chúng ta có thể  chứng minh P(B) ≠ P(B|A)  ≠ P(B|Ac) (A và B không độc  lập) và chúng ta loại trừ được các mệnh đề ­ B => A (bằng cách biện luận về thời gian) ­ Yếu tố gây nhiễu ảnh hưởng đến cả A và B  Nghĩa là chúng ta có chứng cớ (evidence) của mệnh đề A=>B. Đây là cách lập luận thường được sử dụng trong nghiên cứu xác định nguyên nhân hay  yếu tố nguy cơ. Tính loại trừ của 2 biến cố Nếu hai biến cố A và B không bao giờ xảy ra đồng thời người ta gọi biến cố A   và B loại trừ lẫn nhau.  Thí dụ bệnh nhân không bao giờ bị nhiễm sán dải và sán dải heo cùng lúc nên  việc nhiễm sán dải bò và sán dải heo là 2 biến cố  loại trừ  lẫn nhau. Trong thửu   nghiệm tung xúc xắc, biến cố  ra mặt chẵn  và biến cố ra mặt 3 là biến cố loại trừ lẫn   nhau. Cần lưu ý hai biến cố  loại trừ  lẫn nhau không phải là 2 biến cố  độc lập mà  thực chất là 2 biến cố  phụ  thuộc lẫn nhau. Biến cố  A xảy ra phụ  thuộc vào việc   không xảy ra biến cố B và ngược lại. 3. Công thức cộng xác suất tổng quát Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân   bố  của các đặc điểm của bệnh nhân này được trình bày trong bảng  ở  đầu chương.  Chọn một người bất kì, hãy tính xác suất người là nam  hay nằm ở khoa Phổi ­ P(Nam   hay Khoa Phổi):
  4. P(Nam hay Khoa Phổi)= P(Nam hay Khoa Phổi)= =  P(Phổi)+P(Nam)­P(Phổi và Nam) Một cách tổng quát, nếu A∪B ≠ Ø thì chúng ta có  P(A∪B) = P(A) + P(B) – P(A∩B) (8) Nếu hai biến cố A và B loại trừ lẫn nhau thì chúng ta có thể tính được xác suất xảy ra   A hay B dựa trên nguyên lí cộng tính: P(A∪B) = P(A) + P(B) Đây là công thức cộng xác suất tổng quát. Sau đây là tổng kết công thức nhân và cộng  xác suất tuỳ theo mối quan hệ giữa 2 biến số A và B Quan   hệ   giữa   biến  Định luật Nhân xác suất Định luật Cộng xác suất cố A và B P(A∩B) P(A∪B) Không   đặc   biệt  =P(A)× P(B|A) = P(A) + P(B) – P(A∩B) (không   độc   lập   và  không loại trừ) Độc lập = P(A)× P(B) = P(A) + P(B) – P(A)× P(B) Loại trừ = 0 = P(A) + P(B) 4. Công thức xác suất toàn phần và định lí Bayes Nếu biến cố B phụ thuộc vào biến cố A – P(B) ≠ P(B|A) – thì xác suất của biến cố B   phụ thuộc vào xác suất của biến cố A. Khi đó xác suất xảy ra B (A c là biến cố đối lập  của biến cố A và được đọc là không A) P ( B) P( A B) P( A C B) P ( A) P ( B | A) P( A C ) P ( B | A C ) (9) Công thức này được gọi là công thức xác suất toàn phần (law of total probability). Áp   dụng công thức này trong trường hợp ung thư phụ thuộc vào hút thuốc lá chúng ta có:   Xác suất ung thư  = Xác suất hút thuốc lá ×  xác suất ung thư  khi hút thuốc lá + Xác  suất không hút thuốc lá ×  xác suất ung thư khi không hút thuốc lá. Tính xác suất A trên điều kiện B  ­ P(A|B) và thay mẫu số  với công thức xác  suất toàn phần ta được P( A B) P ( A) P ( B | A) P( A | B) P( B) P ( A) P ( B | A) P ( A c ) P ( B | A c ) (9) Công thức này được gọi là định lí Bayes. Lí giải công thức này trong trường  hợp hút thuốc lá tăng nguy cơ ung thư phổi như sau. Xác suất một người hút thuốc lá  khi biết người này bị  ung thư phổi bằng với tỉ lệ với xác suất vừa hút thuốc vừa ung   thư phổi trong xác suất bị ung thư phổi.
  5. 5. Biến số ngẫu nhiên Khi chúng ta tiến hành phép thử, chúng ta thường không quan tâm đến chi tiết của biến   cố  mà chỉ  quan tâm giá trị  của một đại lượng nào đó được xác định bởi kết cục của   phép thử. Thí dụ, khi chúng ta gieo 3 con xúc xắc, có thể chúng ta không quan tâm đến   con xúc xắc nào ra mặt mấy mà chỉ  quan tâm đến tổng số  điểm  của 3 con xúc xắc.  Hay khi chúng ta mua vé số, chúng ta chỉ quan tâm đến số tiền mà chúng ta trúng được  (hay số tiền bị mất) sau khi đã có kết quả xổ số. Đại lượng mà giá trị  của nó được xác định bởi   kết cục của phép thử    ngẫu nhiên  được gọi là biến số ngẫu nhiên. Biến số ngẫu nhiên thường được kí hiệu bằng chữ in  hoa (như  X, Y,..). Biến số ngẫu nhiên X của biến cố e được kí hiệu là  X(e). Các thí  dụ khác về biến số ngẫu nhiên gồm: ­ Thí dụ: Một người đặt một con số gồm 2 chữ số. Sau đó người ta tiến hành  quay số để có kết quả là một số 2 chữ số. Như vậy phép thử sẽ có 100 kết   cuộc là con số 00,01,02,03,...,99. Nếu kết cuộc trùng với con số được đặt,  người đặt sẽ  được 70 đồng. Nếu kết cuộc không trùng với con số  được   đặt, người đặt sẽ bị mất 1 đồng. Như vậy có 99 kết cục tương ứng với giá  trị  ­1 và 1 kết cục tương  ứng với giá trị  70. ­1 và 70 là các giá trị  của biến   số ngẫu nhiên X “số tiền thu được”. Ta có thể  tính được P(X=­1)=0,99 và  P(X=70)=0,01 ­ Theo dõi 100 người nghiện chích ma tuý chưa bị  nhiễm HIV, số  người bị  nhiễm HIV sau 1 năm là biến số ngẫu nhiên ­ Điều trị  cho 15 ca bệnh SARS, số  ca tử  vong trong số 15 ca b ệnh này là   biến số ngẫu nhiên ­ Một gia đình  có 1 đứa con, số  con trai trong gia đình này là biến số  ngẫu  nhiên. ­ Đo chiều cao của một người, chiều cao người này là biến số ngẫu nhiên 6. Vọng trị Nếu chúng ta không quan tâm đến chi tiết, chúng ta sẽ gán cho mỗi kết cục một giá trị  của biến số ngẫu nhiên và khi đó chúng ta sẽ gán cho phép thử một giá trị gọi là vọng   trị. Hãy trở lại với ví dụ về phép thử quay số (gồm 2 chữ số) được đưa ra trong phần   biến số ngẫu nhiên. Phép thử này có nhiều kết cục và các kết cục tương ứng với ­1 và  70 là giá trị  của biến số  ngẫu nhiên “số  tiền thu được”. Giả  sử  một người chơi trò  chơi này rất nhiều lần (N lần) thì người số tiền người đó thu được sau N lần chơi: 70 ×  N ×  0,01 – 1 ×  N ×  0,99 = N ×  (0,70 – 0,99) = ­0,29 ×  N Như vậy trung bình mỗi lần chơi người đó bị thu được  (­0,29 ×  N)/N=0,29 đồng Con số này được gọi là vọng trị của trò chơi. Một cách tổng quát vọng trị của phép thử  là trung bình của biến số ngẫu nhiên nếu phép thử được lập lại nhiều lần và vọng trị  của biến số ngẫu nhiên X được kí hiệu là E(X) E(X)=X(e1)P(e1) + X(e2)P(e2) +...
  6. Bài tập Ðịnh luật nhân và cộng xác suất 1. Trong một nhóm gồm 502 người có phân phối nhóm máu và giới tính như sau: Giới tính Nhóm máu Nam Nữ Tổng số O 113 113 226 A 103 103 206 B 25 25 50 AB 10 10 20 Tổng số 251 251 502 1a. Nếu một người được chọn ngẫu nhiên từ  nhóm người này. Tính xác suất người   này có nhóm máu O? xác suất người này có nhóm máu A? Xác suất người này có nhóm   máu B? Xác suất người này có nhóm máu AB? 1b. Giới tính và nhóm máu có độc lập với nhau không? Chứng minh. 2. Xác suất một bệnh nhân được chọn từ một bệnh viện là nam là 0,6. Xác suất một   bệnh nhân nam và ở khoa ngoại là 0,2. Một bệnh nhân được chọn ngẫu nhiên từ bệnh   viện và người ta biết rằng đó là bệnh nhân nam. Tính xác suất bệnh nhân đó ở  khoa  ngoại. 3. Trong dân số của một bệnh viện, xác suất một bệnh nhân được chọn ngẫu nhiên là   có bệnh tim là 0,35. Xác suất bệnh nhân bệnh tim là hút thuốc lá là 0,86. Tính xác suất  một bệnh nhân được chọn ngẫu nhiên là người hút thuốc lá và mắc bệnh tim? 4. Một nhà nghiên cứu muốn ước tính tỉ lệ tiêm chủng ở trẻ em dưới 2 tuổi trong tỉnh   X bằng phương pháp lấy mẫu PPS (probability proportionate to size) gồm 2 bước.   Bước 1:  lên danh sách tất cả các xã trong tỉnh rồi chọn trong danh sách đó 30 xã.   Bước 2: chọn ngẫu nhiên 7 đứa trẻ dưới 2 tuổi trong mỗi xã được chọn để điều tra về  tình hình tiêm chủng của đứa trẻ đó. Giả sử trong tỉnh có xã A có 100 trẻ dưới 2 tuổi và xã B có 40 trẻ dưới 2 tuổi. a. Nếu trong bước 1 đã chọn xã A, tính xác suất một đứa trẻ  dưới 2 tuổi của xã A  được chọn đưa vào nghiên cứu b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không, tính xác   suất một đứa trẻ dưới 2 tuổi của xă A được chọn đưa vào nghiên cứu c. Giả sử xác suất xã B được chọn đưa vào nghiên cứu  là 0,1, tính xác suất một đứa   trẻ dưới 2 tuổi của xã B được chọn đưa vào nghiên cứu Bài giải 1a.  Theo công thức m P( E ) N
  7. Với N là số các biến cố có thể và m số các biến cố thuận lợi. Khi chọn ngẫu nhiên một người ta có thể có 502 kết cuộc khác nhau (Số  biến  cố  có thể  N=502). Trong việc tính xác suất người có nhóm máu O, biến cố  thuận lợi là biến cố  chọn được người có nhóm máu O. Như  vậy có 226 biến  cố thuận lợi trong trường hợp này. Xác suất người này có nhóm máu O là = 226/502=0,45 Tương tự Xác suất người này có nhóm máu A là = 206/502=0,41 Xác suất người này có nhóm máu B là = 50/502=0,10 Xác suất người này có nhóm máu O là = 20/502=0,04 1b.  Biến cố  A độc lập với biến cố B khi (A|B)=P(A) hay chứng minh P(B| A)=P(B). Như vậy Nhóm máu và giới tính là độc lập với nhau bởi vì: P(máu O | Nam)=113/251= 0,45 = P(máu O) P(máu A | Nam)=103/251= 0,41 = P(máu A) P(máu B | Nam)=25/251= 0,10 = P(máu B) P(máu AB | Nam)=10/251= 0,04 = P(máu AB) 2. Áp dụng công thức P(A|B)=P(A(B)/P(B); với A là biến cố  bệnh nhân ở  khoa Ngoại và B là biến cố bệnh nhân là bệnh nhân nam ta có: P(ngoại|nam)=P(ngoại(nam)/P(nam)= 0,2/0,6 = 0,33 3. Áp dụng công thức P(A(B) = P(A).P(B|A) = P(B).P(B|A) ta có P(hút thuốc(bệnh tim)=P(bệnh tim) x P(hút thuốc|bệnh tim) = 0,35 x 0,86 = 0,301 4. Ta kí hiệu đứa trẻ quan tâm là m a. Nếu trong bước 1 đã chọn xã A, xác suất một đứa trẻ  m dưới 2 tuổi của xã   A được chọn đưa vào nghiên cứu = P(chọn m| chọn A) = 7/100 = 0,07 b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không,   xác suất một đứa trẻ m dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu =   P(chọn m và chọn A) =  P(chọn A) ×  P (chọn m| chọn A) = 0,07  ×  P(chọn A) c. Xác suất một đứa trẻ m dưới 2 tuổi của xã B được chọn đưa vào nghiên cứu   = P(chọn m và chọn B) =  P(chọn B) ×  P (chọn m| chọn B) = 0,1 ×    7 / 40 =  0,0175
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2