Bài giảng Thống kê y học - Bài 3: Xác suất có điều kiện - Định luật nhân xác suất
lượt xem 9
download
Mục tiêu của bài giảng là cung cấp các kiến thức giúp người học có thể trình bày định nghĩa của xác suất có điều kiện, trình bày công thức cộng xác suất và công thức nhân xác suất. Mời các bạn cùng tham khảo nội dung chi tiết.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Thống kê y học - Bài 3: Xác suất có điều kiện - Định luật nhân xác suất
- XÁC SUẤT CÓ ĐIỀU KIỆN - ĐỊNH LUẬT NHÂN XÁC SUẤT Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: Trình bày định nghĩa của xác suất có điều kiện Trình bày công thức cộng xác suất và công thức nhân xác suất 1. Xác suất có điều kiện Nếu các kết cục có thể không bao gồm toàn thể các kết cục (khi một số kết cục bị hạn chế) thì xác suất có thể được gọi là xác suất có điều kiện. Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) Bảng 2. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện X Khoa Khoa Tổng số Phổi Thận Nam 11 4 15 Nữ 27 8 35 Tổng số 38 12 50 Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân bố của các đặc điểm của bệnh nhân này được trình bày trong bảng. Chọn một người bất kì, xác suất người là nam và nằm ở khoa Phổi P(Nam và Khoa Phổi) có phải là xác suất có điều kiện hay không? Hãy tính xác suất này. Chọn một người bất kì, Xác suất người là nam và nằm ở khoa Phổi P(Nam và Khoa Phổi) – không phải là xác suất có điều kiện bởi vì các kết cục không có hạn chế (ai cũng có thể được chọn). N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 11; P (Nam và Khoa Phổi) = Thí dụ: Chọn một người nam, xác suất người này nằm ở khoa Phổi có phải là xác suất có điều kiện hay không? Hãy tính xác suất này. Chọn một người nam, xác suất người này nằm ở khoa Phổi là xác suất có điều kiện bởi vì số kết cục bị hạn chế (chỉ có bệnh nhân nam được chọn và như vậy kết cục chỉ có thể là 1 trong số 15 bệnh nhân nam) Nc: Số kết cuộc có thể là 15; m: số các kết cuộc thuận lợi cho 11; Xác suất người này nằm ở khoa Phổi với điều kiện người này là nam giới = P (Khoa Phổi|Nam) = Lưu ý: Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) và điều kiện này phải đúng cho cả kết cục thuận lợi (m) và kết cục có thể (Nc). Trong thí dụ trên 11 kết cục thuận lợi vừa đòi hỏi điều kiện là nam giới và đặc tính là nằm ở khoa phổi và 15 kết cục có thể đòi hỏi điều kiện là nam giới. Thể hiện nhận xét bằng công thức:
- m n( A B ) n( A B ) / N P( A B) P ( B | A) Nc n( A) n( A) / N P( A) (5) n(A∩B ) là số kết cục thoả điều kiện A và đặc tính B và n(A) số kết cục thoả điều kiện A Thí dụ: Chọn một bệnh nhân ở khoa Thận, tính xác suất bệnh nhân này là nữ. Đây là xác suất có điều kiện. P(nữ|khoa Thận) = = = = 0,75 Thí dụ: Theo bản báo cáo “Số ca nghi nhiễm SARS tích luỹ” của Tổ Chức Y tế Thế Giới (http://www.who.int/csr/sars/country/2003_05_17/en/), Số ca bệnh SARS (Hội chứng Hô hấp cấp tính trầm trọng) từ ngày 1/10/2002 đến ngày 17/5/2003 là 7761 với 623 trường hợp tử vong. Xác suất tử vong của những người mắc SARS là xác suất có điều kiện: ( cả 623 ca tử vong và 7761 ca bệnh đều mắc SARS). P(tử vong|SARS)= Xác suất có điều kiện này (Xác suất tử vong ở những người mắc một bệnh cụ thể nào đó) được gọi là tỉ suất chết/mắc của bệnh đó (casefatality rate). Thí dụ: Trong một dân số, tỉ lệ những người có dấu hiệu lách to là 20%, những người vừa sốt rét vừa lách to là 18%, những người bị sốt rét là 23%. Một người ngẫu nhiên từ dân số đó, người này không có dấu hiệu lách to. Tính khả năng người này bị sốt rét? Bài giải: P(sốt rét|lách không to) = P(sốt rét và lách không to) / P(lách không to) = [P(sốt rét) P(sốt rét và lách to)]/ P(lách không to) = (0.230.18)/0.8 = 0.05/0.8 =0.0625 2. Ðịnh luật nhân xác suất Từ phương trình (5) ta có thể xây dựng công thức: P(A∩B) = P(A) × P(B|A) (6) P(A∩B) = P(B∩A) =P(B) × P(A|B) Công thức này được gọi là định lí nhân xác suất. Thí dụ: Nếu xác suất mắc bệnh lao, P(Lao) = 0,001 và xác suất chết/mắc của bệnh Lao, P(chết|Lao) = 0,1. Xác suất chết vì bệnh lao: P(Lao và Chết) = P(Lao) × P(Chết | Lao) = 0,001 × 0,1 = 0,0001 Tính độc lập Một trong những khái niệm quan trọng trong lí thuyết xác suất là tính độc lập (independence). Hai biến cố A và B được gọi là độc lập nếu P(B|A) = P(B), hoặc suy ra từ (6) nếu P(A∩B) = P(A) × P(B) (7) Ý nghĩa của định nghĩa theo xác suất có điều kiện là xác suất của B không thay đổi dù có hay không có điều kiện A. Từ phương trình (7) chúng ta có thể suy ra là tính độc lập có tính chất đối xứng (nếu A độc lập với B thì B độc lập với A và ngược lại). Thí dụ:
- Giả sử Xác suất bị chấn thương giao thông trên dân số chung = P(chấn thương giao thông) =0,01 Xác suất bị chấn thương giao thông ở người hút thuốc lá = P(chấn thương giao thông | hút thuốc lá) = 0,01 Khi đó chấn thương giao thông và hút thuốc lá là hai biến cố độc lập. Giả sử Xác suất bị chấn thương giao thông trên dân số chung = P(chấn thương giao thông) =0,01 Xác suất bị chấn thương giao thông ở người nghiện rượu = P(chấn thương giao thông | nghiện rượu) = 0,03 Khi đó chấn thương giao thông và nghiện rượu là hai biến cố không độc lập Khi biến cố A không độc lập với biến cố B thì: A => B hoặc B => A hoặc Có một yếu tố ảnh hưởng đến cả A và B (yếu tố này được gọi là yếu tố gây nhiễu). Do đó nếu chúng ta có thể chứng minh P(B) ≠ P(B|A) ≠ P(B|Ac) (A và B không độc lập) và chúng ta loại trừ được các mệnh đề B => A (bằng cách biện luận về thời gian) Yếu tố gây nhiễu ảnh hưởng đến cả A và B Nghĩa là chúng ta có chứng cớ (evidence) của mệnh đề A=>B. Đây là cách lập luận thường được sử dụng trong nghiên cứu xác định nguyên nhân hay yếu tố nguy cơ. Tính loại trừ của 2 biến cố Nếu hai biến cố A và B không bao giờ xảy ra đồng thời người ta gọi biến cố A và B loại trừ lẫn nhau. Thí dụ bệnh nhân không bao giờ bị nhiễm sán dải và sán dải heo cùng lúc nên việc nhiễm sán dải bò và sán dải heo là 2 biến cố loại trừ lẫn nhau. Trong thửu nghiệm tung xúc xắc, biến cố ra mặt chẵn và biến cố ra mặt 3 là biến cố loại trừ lẫn nhau. Cần lưu ý hai biến cố loại trừ lẫn nhau không phải là 2 biến cố độc lập mà thực chất là 2 biến cố phụ thuộc lẫn nhau. Biến cố A xảy ra phụ thuộc vào việc không xảy ra biến cố B và ngược lại. 3. Công thức cộng xác suất tổng quát Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân bố của các đặc điểm của bệnh nhân này được trình bày trong bảng ở đầu chương. Chọn một người bất kì, hãy tính xác suất người là nam hay nằm ở khoa Phổi P(Nam hay Khoa Phổi):
- P(Nam hay Khoa Phổi)= P(Nam hay Khoa Phổi)= = P(Phổi)+P(Nam)P(Phổi và Nam) Một cách tổng quát, nếu A∪B ≠ Ø thì chúng ta có P(A∪B) = P(A) + P(B) – P(A∩B) (8) Nếu hai biến cố A và B loại trừ lẫn nhau thì chúng ta có thể tính được xác suất xảy ra A hay B dựa trên nguyên lí cộng tính: P(A∪B) = P(A) + P(B) Đây là công thức cộng xác suất tổng quát. Sau đây là tổng kết công thức nhân và cộng xác suất tuỳ theo mối quan hệ giữa 2 biến số A và B Quan hệ giữa biến Định luật Nhân xác suất Định luật Cộng xác suất cố A và B P(A∩B) P(A∪B) Không đặc biệt =P(A)× P(B|A) = P(A) + P(B) – P(A∩B) (không độc lập và không loại trừ) Độc lập = P(A)× P(B) = P(A) + P(B) – P(A)× P(B) Loại trừ = 0 = P(A) + P(B) 4. Công thức xác suất toàn phần và định lí Bayes Nếu biến cố B phụ thuộc vào biến cố A – P(B) ≠ P(B|A) – thì xác suất của biến cố B phụ thuộc vào xác suất của biến cố A. Khi đó xác suất xảy ra B (A c là biến cố đối lập của biến cố A và được đọc là không A) P ( B) P( A B) P( A C B) P ( A) P ( B | A) P( A C ) P ( B | A C ) (9) Công thức này được gọi là công thức xác suất toàn phần (law of total probability). Áp dụng công thức này trong trường hợp ung thư phụ thuộc vào hút thuốc lá chúng ta có: Xác suất ung thư = Xác suất hút thuốc lá × xác suất ung thư khi hút thuốc lá + Xác suất không hút thuốc lá × xác suất ung thư khi không hút thuốc lá. Tính xác suất A trên điều kiện B P(A|B) và thay mẫu số với công thức xác suất toàn phần ta được P( A B) P ( A) P ( B | A) P( A | B) P( B) P ( A) P ( B | A) P ( A c ) P ( B | A c ) (9) Công thức này được gọi là định lí Bayes. Lí giải công thức này trong trường hợp hút thuốc lá tăng nguy cơ ung thư phổi như sau. Xác suất một người hút thuốc lá khi biết người này bị ung thư phổi bằng với tỉ lệ với xác suất vừa hút thuốc vừa ung thư phổi trong xác suất bị ung thư phổi.
- 5. Biến số ngẫu nhiên Khi chúng ta tiến hành phép thử, chúng ta thường không quan tâm đến chi tiết của biến cố mà chỉ quan tâm giá trị của một đại lượng nào đó được xác định bởi kết cục của phép thử. Thí dụ, khi chúng ta gieo 3 con xúc xắc, có thể chúng ta không quan tâm đến con xúc xắc nào ra mặt mấy mà chỉ quan tâm đến tổng số điểm của 3 con xúc xắc. Hay khi chúng ta mua vé số, chúng ta chỉ quan tâm đến số tiền mà chúng ta trúng được (hay số tiền bị mất) sau khi đã có kết quả xổ số. Đại lượng mà giá trị của nó được xác định bởi kết cục của phép thử ngẫu nhiên được gọi là biến số ngẫu nhiên. Biến số ngẫu nhiên thường được kí hiệu bằng chữ in hoa (như X, Y,..). Biến số ngẫu nhiên X của biến cố e được kí hiệu là X(e). Các thí dụ khác về biến số ngẫu nhiên gồm: Thí dụ: Một người đặt một con số gồm 2 chữ số. Sau đó người ta tiến hành quay số để có kết quả là một số 2 chữ số. Như vậy phép thử sẽ có 100 kết cuộc là con số 00,01,02,03,...,99. Nếu kết cuộc trùng với con số được đặt, người đặt sẽ được 70 đồng. Nếu kết cuộc không trùng với con số được đặt, người đặt sẽ bị mất 1 đồng. Như vậy có 99 kết cục tương ứng với giá trị 1 và 1 kết cục tương ứng với giá trị 70. 1 và 70 là các giá trị của biến số ngẫu nhiên X “số tiền thu được”. Ta có thể tính được P(X=1)=0,99 và P(X=70)=0,01 Theo dõi 100 người nghiện chích ma tuý chưa bị nhiễm HIV, số người bị nhiễm HIV sau 1 năm là biến số ngẫu nhiên Điều trị cho 15 ca bệnh SARS, số ca tử vong trong số 15 ca b ệnh này là biến số ngẫu nhiên Một gia đình có 1 đứa con, số con trai trong gia đình này là biến số ngẫu nhiên. Đo chiều cao của một người, chiều cao người này là biến số ngẫu nhiên 6. Vọng trị Nếu chúng ta không quan tâm đến chi tiết, chúng ta sẽ gán cho mỗi kết cục một giá trị của biến số ngẫu nhiên và khi đó chúng ta sẽ gán cho phép thử một giá trị gọi là vọng trị. Hãy trở lại với ví dụ về phép thử quay số (gồm 2 chữ số) được đưa ra trong phần biến số ngẫu nhiên. Phép thử này có nhiều kết cục và các kết cục tương ứng với 1 và 70 là giá trị của biến số ngẫu nhiên “số tiền thu được”. Giả sử một người chơi trò chơi này rất nhiều lần (N lần) thì người số tiền người đó thu được sau N lần chơi: 70 × N × 0,01 – 1 × N × 0,99 = N × (0,70 – 0,99) = 0,29 × N Như vậy trung bình mỗi lần chơi người đó bị thu được (0,29 × N)/N=0,29 đồng Con số này được gọi là vọng trị của trò chơi. Một cách tổng quát vọng trị của phép thử là trung bình của biến số ngẫu nhiên nếu phép thử được lập lại nhiều lần và vọng trị của biến số ngẫu nhiên X được kí hiệu là E(X) E(X)=X(e1)P(e1) + X(e2)P(e2) +...
- Bài tập Ðịnh luật nhân và cộng xác suất 1. Trong một nhóm gồm 502 người có phân phối nhóm máu và giới tính như sau: Giới tính Nhóm máu Nam Nữ Tổng số O 113 113 226 A 103 103 206 B 25 25 50 AB 10 10 20 Tổng số 251 251 502 1a. Nếu một người được chọn ngẫu nhiên từ nhóm người này. Tính xác suất người này có nhóm máu O? xác suất người này có nhóm máu A? Xác suất người này có nhóm máu B? Xác suất người này có nhóm máu AB? 1b. Giới tính và nhóm máu có độc lập với nhau không? Chứng minh. 2. Xác suất một bệnh nhân được chọn từ một bệnh viện là nam là 0,6. Xác suất một bệnh nhân nam và ở khoa ngoại là 0,2. Một bệnh nhân được chọn ngẫu nhiên từ bệnh viện và người ta biết rằng đó là bệnh nhân nam. Tính xác suất bệnh nhân đó ở khoa ngoại. 3. Trong dân số của một bệnh viện, xác suất một bệnh nhân được chọn ngẫu nhiên là có bệnh tim là 0,35. Xác suất bệnh nhân bệnh tim là hút thuốc lá là 0,86. Tính xác suất một bệnh nhân được chọn ngẫu nhiên là người hút thuốc lá và mắc bệnh tim? 4. Một nhà nghiên cứu muốn ước tính tỉ lệ tiêm chủng ở trẻ em dưới 2 tuổi trong tỉnh X bằng phương pháp lấy mẫu PPS (probability proportionate to size) gồm 2 bước. Bước 1: lên danh sách tất cả các xã trong tỉnh rồi chọn trong danh sách đó 30 xã. Bước 2: chọn ngẫu nhiên 7 đứa trẻ dưới 2 tuổi trong mỗi xã được chọn để điều tra về tình hình tiêm chủng của đứa trẻ đó. Giả sử trong tỉnh có xã A có 100 trẻ dưới 2 tuổi và xã B có 40 trẻ dưới 2 tuổi. a. Nếu trong bước 1 đã chọn xã A, tính xác suất một đứa trẻ dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không, tính xác suất một đứa trẻ dưới 2 tuổi của xă A được chọn đưa vào nghiên cứu c. Giả sử xác suất xã B được chọn đưa vào nghiên cứu là 0,1, tính xác suất một đứa trẻ dưới 2 tuổi của xã B được chọn đưa vào nghiên cứu Bài giải 1a. Theo công thức m P( E ) N
- Với N là số các biến cố có thể và m số các biến cố thuận lợi. Khi chọn ngẫu nhiên một người ta có thể có 502 kết cuộc khác nhau (Số biến cố có thể N=502). Trong việc tính xác suất người có nhóm máu O, biến cố thuận lợi là biến cố chọn được người có nhóm máu O. Như vậy có 226 biến cố thuận lợi trong trường hợp này. Xác suất người này có nhóm máu O là = 226/502=0,45 Tương tự Xác suất người này có nhóm máu A là = 206/502=0,41 Xác suất người này có nhóm máu B là = 50/502=0,10 Xác suất người này có nhóm máu O là = 20/502=0,04 1b. Biến cố A độc lập với biến cố B khi (A|B)=P(A) hay chứng minh P(B| A)=P(B). Như vậy Nhóm máu và giới tính là độc lập với nhau bởi vì: P(máu O | Nam)=113/251= 0,45 = P(máu O) P(máu A | Nam)=103/251= 0,41 = P(máu A) P(máu B | Nam)=25/251= 0,10 = P(máu B) P(máu AB | Nam)=10/251= 0,04 = P(máu AB) 2. Áp dụng công thức P(A|B)=P(A(B)/P(B); với A là biến cố bệnh nhân ở khoa Ngoại và B là biến cố bệnh nhân là bệnh nhân nam ta có: P(ngoại|nam)=P(ngoại(nam)/P(nam)= 0,2/0,6 = 0,33 3. Áp dụng công thức P(A(B) = P(A).P(B|A) = P(B).P(B|A) ta có P(hút thuốc(bệnh tim)=P(bệnh tim) x P(hút thuốc|bệnh tim) = 0,35 x 0,86 = 0,301 4. Ta kí hiệu đứa trẻ quan tâm là m a. Nếu trong bước 1 đã chọn xã A, xác suất một đứa trẻ m dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu = P(chọn m| chọn A) = 7/100 = 0,07 b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không, xác suất một đứa trẻ m dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu = P(chọn m và chọn A) = P(chọn A) × P (chọn m| chọn A) = 0,07 × P(chọn A) c. Xác suất một đứa trẻ m dưới 2 tuổi của xã B được chọn đưa vào nghiên cứu = P(chọn m và chọn B) = P(chọn B) × P (chọn m| chọn B) = 0,1 × 7 / 40 = 0,0175
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Thống kê y học - Bài tập tổng hợp
8 p | 358 | 53
-
Bài giảng Thống kê y học - Bài 15: Kiểm định chi bình phương
8 p | 247 | 31
-
Bài giảng Bài tập thống kê - dịch tễ - BS. Nguyễn Văn Thịnh
19 p | 236 | 26
-
Bài giảng Thống kê y học - Bài 1: Thống kê và vai trò của thống kê trong y học
5 p | 233 | 25
-
Bài giảng Thống kê y học - Bài 4: Ứng dụng xác suất trong ra quyết định chẩn đoán và điều trị
9 p | 317 | 25
-
Bài giảng Thống kê y học - Bài 17: Công thức tóm tắt
5 p | 195 | 22
-
Lâm sàng thống kê: Bài 1. Độ lệch chuẩn hay sai số chuẩn - Nguyễn Văn Tuấn
8 p | 362 | 18
-
Bài giảng Thống kê y học - Bài 13: Ước lượng
8 p | 182 | 16
-
Bài giảng Thống kê y học - Bài 14: So sánh nhiều trung bình - Phân tích phương sai
15 p | 95 | 16
-
Bài giảng Thống kê y học - Bài 5: Phân phối xác suất
9 p | 183 | 15
-
Bài giảng Thống kê y học - Bài 7: Sự biến thiên mẫu của tỉ lệ
9 p | 122 | 12
-
Bài giảng Thống kê y học - Bài 10: Sự biến thiên của trung bình - Kiểm định T-TEST bắt cặp
9 p | 105 | 12
-
Bài giảng Thống kê y học - Bài 2: Một số khái niệm căn bản về xác suất
11 p | 112 | 10
-
Bài giảng Thống kê y học - Bài 8: Nguyên tắc kiểm định - So sánh hai tỉ lệ
6 p | 85 | 10
-
Bài giảng Thống kê y học - Bài 12: Một số những phân phối lấy mẫu quan trọng
7 p | 76 | 10
-
Bài giảng Thống kê y học - Bài 11: So sánh hai trung bình - Kiểm định t không bắt cặp
10 p | 101 | 10
-
Bài giảng Thống kê y học - Bài 9: Nguyên lí kiểm định
6 p | 124 | 9
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn