YOMEDIA
ADSENSE
Chương trình môn học Thống kê y học
259
lượt xem 18
download
lượt xem 18
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Môn học Thống kê y học cung cấp các kiến thức giúp người học có thể ứng dụng được khái niệm xác suất trong việc chẩn đoán và ra quyết định điều trị, giải thích được các khái niệm thống kê cơ bản được sử dụng trong các báo cáo y tế hoặc bài báo nghiên cứu khoa học,... Mời các bạn cùng tham khảo.
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Chương trình môn học Thống kê y học
- CHƯƠNG TRÌNH MÔN HỌC: THỐNG KÊ Y HỌC (Môn bắt buộc) Mục tiêu môn học: Sau khi hoàn thành môn học thống kê y học, sinh viên có khả năng: Ứng dụng được khái niệm xác suất trong việc chẩn đoán và ra quyết định điều trị Giải thích được các khái niệm thống kê cơ bản được sử dụng trong các báo cáo y tế hoặc bài báo nghiên cứu khoa học Chọn lựa được phương pháp thống kê mô tả để trình bày số liệu y tế một cách thuyết phục và rõ ràng Chọn lựa test thống kê phù hợp để kiểm định giả thuyết và tiến hành được các test thống kê đơn giản với máy tính cầm tay. Vì mục tiêu của môn học là học viên có khả năng tiến hành được các test thống kê với máy tính cầm tay, các học viên phải sở hữu một máy tính cầm tay có chức năng thống kê trong giờ học của môn thống kê y học Nội dung Số tiết STT Tên bài học Tổng số Lý Thực Thuyế hành t 1 Ðại cương xác suất (XS) 4 2 2 2 Xác suất có điều kiện Ðịnh luật cộng XS, 4 2 2 nhân XS; Công thức XS toàn phần 3 Ứng dụng XS trong chẩn đoán và điều trị 4 2 2 4 Các phân phối xác suất: phân phối Poisson, 4 2 2 phân phối Bernoulli và phân phối bình thường 5 Khái niệm về biến số 4 2 2 Tóm tắt và trình bày số liệu bằng thống kê và biểu đồ 6 Biến thiên tỉ lệ mẫu ước lượng khoảng tin 4 2 2 cậy của tỉ lệ Nguyên tắc kiểm định So sánh 2 tỉ lệ bằng kiểm định z 6 Biến thiên của trung bình mẫu kiểm định t 4 2 2 bắt cặp kiểm định z và t không bắt cặp 8 Kiểm định chi bình phương 4 2 2 9 Phân tích phương sai một chiều để so sánh 4 2 2 nhiều trung bình 10 Tương quan và hồi quy đơn biến 4 2 2 1
- Phương pháp giảng dạy: Thuyết trình sử dụng Phấn bảng và máy chiếu qua đầu Làm bài tập Thảo luận nhóm Lượng giá: Lượng giá đào tạo sau mỗi đơn vị học trình: bài tập kiểm tra Lượng giá kết thúc khi hết học phần: Thi câu hỏi nhiều lựa chọn Tài liệu học tập: Sách giáo khoa: Ðỗ Văn Dũng. Xác suất và sinh thống kê căn bản. TP Hồ Chí Minh, Khoa Y tế công cộng, Trường Ðại học Y Dược, 2001 Sách tham khảo chính: Kirwood B. Essentials of Medical Statistic. London, Blackwell Scientific Publications, 1988 (Ðỗ Văn Dũng biên dịch) Tài liệu tham khảo: DawsonSaunders B, Trapp RG. Basic clinical biostatistics. London, Prentice Hall International, 1990 Jekel JF, Elmore JG, Katz DL. Epidemiology, Biostatistics and Preventive Medicine. Philadelphia, W.B. Saunders company, 1996. 2
- THỐNG KÊ VÀ VAI TRÒ CỦA THỐNG KÊ TRONG Y HỌC Thống kê là khoa học về việc thu thập, phân tích và lí giải số liệu. Những quan sát trên sinh viên đều xác nhận rằng thống kê “Thống kê là một môn học bị sinh viên ghét nhất” 1. Một nhà thống kê y học nổi tiếng cũng chỉ có thể tự an ủi rằng: "sinh viên y khoa có thể không thích thống kê, nhưng nếu là bác sĩ, họ sẽ thích"2 Tại sao sinh viên y khoa không nhận thức được rằng thống kê là quan trọng như các người thầy của họ? Bởi vì trong các tình huống đơn giản, thống kê có vẻ như không cần thiết bởi vì chúng ta có thể hiểu rõ mà không cần thống kê. Nhưng với nghề nghiệp là bác sĩ hay chuyên viên y tế công cộng, tình huống sẽ phức tạp hơn, thống kê trở thành một công cụ then chốt. Như vậy khi nào thống kê là hữu ích và nó có thể làm gì cho bạn. 1. Những tình huống không cần dùng đến thống kê Hãy nhớ lại các thực nghiệm được tiến hành tại trường phổ thông? Trong vật lí, các học sinh ghi nhận chu kì dao động của con lắc với các chiều dài con lắc khác nhau và so sánh kết quả và như vậy là đủ để có thể kết luận về mối liên quan giữa chiều dài và chu kì con lắc. Thống kê không cần thiết trong trường hợp này. Trong bài thực tập về hoá học, khi thả miếng kim loại Natri vào nước, phản ứng sẽ xẩy ra mãnh liệt. Phản ứng này có thể được thực hiện lập đi lập lại rất nhiều lần và cho kết quả hằng định. Chúng ta có thể rút ra kết luận là kim loại Natri phản ứng mạnh và tức thời với nước mà không cần phải viện dẫn thống kê. Điều này cũng tương tự trong cuộc sống hàng ngày: nếu bạn sử dụng máy chiếu qua đầu và không biết phải bật máy bằng nút nào bạn có thể cắm điện cho máy chiếu và kiểm tra từng nút cho đến khi bật sáng được máy chiếu. Trong các tình huống đơn giản, thống kê dường như không cần thiết. Thống kê có thể làm gì ? Cho phép tóm tắt và trình bày một cách dễ hiểu các thông tin bằng số Kiểm định một giả thuyết – thí dụ sử dụng điều trị hormone thay thế có làm giảm nguy cơ nhồi máu cơ tim ở phụ nữ mãn kinh hay không và cho phép đo lường mức độ chắc chắn của kết luận. So sánh thông tin từ các nhóm khác nhau – thí dụ, so sánh kết cuộc từ nhóm sử dụng dược phẩm có hoạt tính và nhóm sử dụng dược phẩm đối chứng. Tiên đoán được khả năng một biến cố xảy ra đối với mọt bệnh nhân cụ thể thí dụ, tử vong trong vòng 5 năm – và ước lượng được mức độ chính xác của tiên đoán 2. Các tình huống trong đó thống kê là quan trọng Xem xét một thí dụ khác. Một công ty muốn bán bảo hiểm nhân thọ cho các khách hàng của mình và công ty đó phải ước lượng càng chính xác càng tốt xác suất khách hàng đó bị tử vong hay bị tai nạn trong các khoảng thời gian tiếp theo và các khoản phải đền bù tương ứng. Nếu công ty ước lượng quá thấp, tiền đền bù sẽ vượt quá khoản phí bảo hiểm thu được. Nếu công ty ước lượng quá cao, công ty sẽ không thể cạnh tranh với các công ty bảo hiểm khác. Công ty phải thiết lập phí bảo hiểm khác nhau cho các khách hàng, người có nguy cơ thấp phải đóng phí bảo hiểm thấp bởi vì nếu không những người có nguy cơ thấp sẽ không mua bảo hiểm hoặc sẽ mua bảo hiểm ở các công ty khác. 3
- Những làm thế nào một công ty bảo hiểm ước lượng được xác suất bị tử vong hay tai nạn của khách hàng tốt hơn chính bản thân người khách hàng trong khi người này biết rõ về bản thân mình hơn ai hết. Bởi vì từ thống kê quốc gia, các công ty bảo hiểm có thể biết được nhóm người nào, theo giới tính, tuổi, tình trạng sức khoẻ hiện tại, nghề nghiệp, v.v dễ bị các nguy cơ bệnh tật và tai nạn. Nhưng để so sánh nguy cơ bệnh tật và tử vong ở nam và nữ, không đơn giản như thực nghiệm so sánh chu kì của con lắc dài và ngắn, không thể so sánh tử vong 1000 người nam và 1000 người nữ bởi vì không thể nào tìm được một nhóm người đàn ông và đàn bà có cùng phân bố về tuổi, tình trạng sức khoẻ, nghề nghiệp; Bởi vì có thể là chính sự khác biệt của các yếu tố này chứ không phải bản thân giới tính sẽ chịu trách nhiệm cho sự khác biệt về về nguy cơ tử vong và bệnh tật. Điều đáng mừng là thống kê có thể xét đến các sự khác biệt và ước lượng được nguy cơ tử vong và bệnh tật của các đối tượng. Ngoài ra nếu nguy cơ tử vong ở nam cao hơn ở nữ, nó có thể giúp chúng ta quyết định sự khác biệt về nguy cơ này có phải là do tình cờ (chance) hay không. Tình cơ là tác động của các yếu tố không rõ, do chúng ta không có thông tin, ảnh hưởng đến nguy cơ tử vong như yếu tố di truyền, môi trường, thói quen vệ sinh, tính khí. Thống kê do đó có thể ước lượng khả năng sự khác biệt này là do cơ hội và nghĩa là thống kê có thể cho biết mức độ không chắc chắn của ước lượng. Khi nào thống kê có thể có ích? Nhưng biến cố không lường trước được – thí dụ việc mắc bệnh Thông tin có được từ nghiên cứu trên một số lớn đối tượng Những yếu tố có liên quan không dễ dàng được kiểm soát Những yếu tố có liên quan là chưa rõ Nếu một người bác sĩ ước lượng nguy cơ tử vong và bệnh tật dựa trên kinh nghiệm của mình chứ không dựa trên thống kê ít nhất có ba vấn đề. Thứ nhất, người bác sĩ đó chỉ biết được một số giới hạn các bệnh nhân. Thứ hai, người bác sĩ không thể đánh giá các thông tin một cách khách quan: người bác sĩ sẽ chỉ có thể biết được thông tin về hiệu quả điều trị nếu kết quả điều trị tốt và người bệnh trở lại và sẽ mất thông tin nếu bệnh nhân bỏ cuộc, bác sĩ sẽ nhớ các trường hợp bệnh đặc biệt hơn các trường hợp bệnh thông thường. Thứ ba, nếu có một phác đồ điều trị có thể thay đổi nguy cơ tử vong và bệnh tật, với kinh nghiệm người bác sĩ không thể biết điều trị này có phải thực sự là có hiệu quả hay không hay ảnh hưởng này là do tác động của các yếu tố khác như tuổi, giới, dinh dưỡng 3. Tại sao 2 nhóm tình huống này là khác nhau Các biến cố trong nhóm đầu tiền hầu như hoàn toàn có thể tiên liệu trước. Chu kì dao động của con lắc là một hằng số bất kể biên độ dao động. Natri luôn luôn phản ứng rất mãnh liệt với nước. Trong các tình huống đơn giản, để có câu trả lời chỉ cần kinh nghiệm là đủ. Trong nhóm tình huống thứ hai, các biến cố khó tiên liệu hơn và mặc dù người nam có nguy cơ tử vong cao hơn người nữ nhưng có nhiều yếu tố khác cũng quan trọng. Các biến cố trong nhóm thứ nhất dễ dàng đo lường và kiểm soát bởi vì nó chỉ phụ thuộc vào một số các yếu tố trọng lượng và độ dài của con lắc. Nguy cơ tử vong phụ thuộc vào rất nhiều yếu tố, một vài yếu tố không thể đo lường được được và hầu hết các yếu tố này đều không thể kiểm soát. 4
- Các biến cố trong nhóm thứ hai khó tiên liệu hơn. Một người phụ nữ trung niên, không mắc bệnh mạn tính vẫn có thể bị chết trong năm tiếp theo nhưng một người đàn ông lớn tuổi hơn bị cao huyết áp có thể lại vẫn sống. Chúng ta không thể dựa vào kinh nghiệm của một số người.Dù vậy, thống kê với một số lớn người có thể cung cấp thông tin giúp ước lượng nguy cơ tử vong. Tại sao thống kê cho thông tin đúng đắn hơn kinh nghiệm Thông tin từ nhiều bệnh nhân Có thông tin chính xác hơn và khách quan hơn Giảm thiểu sai lệch – thí dụ những bệnh nhân bỏ cuộc hay những yếu tố tình cảm không ảnh hưởng đến kết luận Phương pháp phân tích giúp chúng ta rút ra ý nghĩa của các thông tin phức tạp 4. Tại sao thống kê cần thiết cho y khoa và y tế công cộng? Các chuyên viên y tế công cộng tham gia vào công việc phòng bệnh, chẩn đoán một số bệnh tật cũng như cho lời khuyên cho người dân tiên lượng của các biến cố. Bác sĩ cũng phải tham gia vào việc phòng bệnh, chẩn đoán, điều trị cho bệnh nhân. Những thông tin cần thiết cho những hoạt động này là: Phòng bệnh: Bệnh tật do nguyên nhân gì? Chẩn đoán: Bệnh nhân có những triệu chứng và dấu hiệu gì của bênh Điều trị: Điều trị nào là có hiệu quả cho một bệnh nhất định và có hiệu quả cho bệnh nhân nào Tư vấn: Một bệnh nhân bị một bệnh nào đó (như nhiễm HIV) sẽ có khả năng mắc phải những bệnh lí gì trong 5 năm tới. Những thông tin này phụ thuộc rất nhiều vào nhiều yếu tố và phần lớn những yếu tố này không tiên đoán được, thí dụ bệnh có thể gây ra bởi yếu tố môi trường, bởi tác nhân vi sinh vật (vi khuẩn, virus), các yếu tố bệnh nhân (di truyền, hành vi vệ sinh, các yếu tố xã hội). Tương tự các triệu chứng, dấu hiệu bệnh tật, đáp ứng với điều trị và diễn tiến tự nhiên của bệnh phụ thuộc vào nhiều biến số. Thống kê rõ ràng là rất cần thiết. Tuy nhiên do thống kê là một công cụ hết sức mạnh mẽ nên nó đã bị rất nhiều người lạm dụng trong khi họ chưa được huấn luyện một cách đầy đủ. Một bác sĩ hay một chuyên viên y tế công cộng tương lai cần phải tìm hiểu thấu đáo về thống kê khi sử dụng nó để tránh bị xếp vào cùng loại với những người nói dối và những người nói dối trơ tráo như theo cách nhìn nhận của nhà văn Mark Twain (“lies, damned lies, and statistics”) Tài liệu tham khảo 1. Sinclair S. Making doctors: an institutional apprenticeship. Oxford: Berg, 1997. 2. Bland JM. Medical students may not like statistics, but as doctors they will. BMJ 1998;316:1674. http://bmj.com/cgi/content/full/316/7145/1674 5
- 6
- MỘT SỐ KHÁI NIỆM CĂN BẢN VỀ XÁC SUẤT Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: Trình bày 2 định nghĩa về xác suất và đưa ra các ví dụ Xây dựng được tập giao và hợp của 2 tập hợp xác định Trình bày và phân biệt được hai công thức chuyển vị và tổ hợp Trình bày định nghĩa của xác suất có điều kiện Trình bày công thức cộng xác suất và công thức nhân xác suất 1. Ðịnh nghĩa về xác suất 1.1 Ðịnh nghĩa xác suất theo tần suất tương đối Theo ngôn ngữ thông thường, xác suất chính là tần suất tương đối. Thí dụ mệnh đề khẳng định xác suất sinh con trai là 0,515 có nghĩa là khi thống kê nhiều lần sinh, tần suất tương đối sinh con trai sẽ xấp xỉ bằng 0,515 (tần suất tương đối là tần suất xảy ra biến cố quan tâm chia cho tổng số lần thử). Nói cách khác, nếu một quá trình được lập lại n nhiều lần, và nếu có f lần xảy ra biến cố E, tần suất tương đối của biến cố E sẽ xấp xỉ bằng xác suất của E. f P( E ) n (1) Thí dụ: Buffon thực hiện 4040 lần tung đồng tiền và quan sát được 2048 lần xuất hiện mặt sấp. Tần suất tương đối xảy ra mặt sấp là . Xác suất xảy ra mặt sấp cũng xấp xỉ bằng 0,507. 1.1 Phép thử, kết cục, biến cố, biến cố đối lập Khi chúng ta gieo một đồng tiền lên một mặt phẳng có thể xảy ra một trong hai kết cục: xuất hiện mặt sấp hoặc xuất hiện mặt ngửa với kết quả không thể tiên đoán được. Người ta gọi việc gieo đồng tiền là phép thử (experiment) và sự xuất hiện mặt xấp hay mặt ngửa của đồng tiền là các kết cục (outcome). Tương tự, khi chúng ta tung con xúc xắc, có thể xuất hiện các mặt 1, 2, 3, 4, 5, 6 thì việc tung con xúc xắc được gọi là phép thử ngẫu nghiên và việc xuất hiện mặt 1, xuất hiện mặt 2, 3, 4, 5 và 6 được gọi các kết cục ngẫu nhiên. Nếu chúng ta quan tâm đến biến cố ra mặt xúc xắc chẵn thì biến cố (event) này bao gồm 3 kết cục: ra mặt 2, ra mặt 4 và ra mặt 6. Nói khác đi biến cố là tập hợp mà các phần tử là các kết cục. Bởi vì tập hợp có thể có bao gồm toàn bộ các phần tử, 0 phần tử hay 1 phần tử nên việc ra một mặt xúc xắc nào đó (thí dụ ra mặt 2) vừa có thể xem là kết cuộc vừa có thể xem là biến cố: biến cố đó đôi khi được gọi là biến cố sơ cấp. Nếu chúng ta tung 3 con xúc xắc phân biệt , có kết cục sau có thể xảy ra {1,1,1} (ba con xúc xắc ra mặt 1); {1,1,2}; {1,1,3};....; {6,6,5}; {6,6,6}. Biến cố có tổng số điểm của 3 con xúc xắc =18 bao gồm một kết cục {6,6,6}. Tương tự chúng ta có thể định nghĩa biến cố tổng số điểm của ba con xúc xắc =12. Đối với mỗi biến cố A có một biến cố đối lập (complementary event ) Ac (được đọc là không A) bao gồm các kết cục không có tính chất A. Trở về thí dụ của phép thử tung con súc sắc 6 mặt, biến cố đối lập với biến cố ra mặt chẵn là biến cố ra mặt lẻ. Biến cố đối lập cho biến cố ra mặt >=2 là biến cố ra mặt 1. 7
- 1.2 Kết cục đồng khả năng Khi chúng ta gieo con xúc xắc đồng nhất, cảm nhận thông thường cho phép chúng ta giả định việc xuất hiện kết cục ra mặt 1, ra mặt 2, ra mặt 3, ra mặt 4, ra m ặt 5, ra m ặt 6 có xác xuất như nhau. Khi đó ta gọi các kết cục này là kết cục đồng khả năng. 1.4 Ðịnh nghĩa xác suất cổ điển Nếu phép thử ngẫu nhiên có thể xảy ra theo N kết cục loại trừ lẫn nhau và có xác suất như nhau và gọi m là số các kết cục thuận lợi cho biến cố E, xác suất xảy ra biến cố E, được kí hiệu là P(E), sẽ bằng m chia cho N m P( E ) N (2) N còn được gọi là số các kết cục có thể và m số các kết cục thuận lợi. Thí dụ: Nếu chúng ta tung con xúc xắc (xí ngầu) có 6 mặt: mặt 1, mặt 2, mặt 3, mặt 4, mặt 5, mặt 6 thì có thể xảy ra với 6 kết cục khác nhau. Những kết cục này loại trừ lẫn nhau (nếu ra mặt 1 thì không ra mặt 2 và ngược lại) và đồng xác suất. Giả sử ta quan tâm đến biến cố con xúc xắc ra mặt chẵn. Biến cố này có thể xảy ra theo 3 cách, nói khác đi biến cố này bao gồm 3 kết cục. Khi đó xác suất xảy ra biến cố ra mặt chẵn là 3/6=0.5 Thí dụ: Khoa phổi và khoa Thận của bệnh viện Chợ Rẫy có 50 bệnh nhân trong số này có 35 bệnh nhân nữ. Có 12 bệnh nhân của khoa Thận trong đó có là 8 người là nữ. Có bao nhiêu bệnh nhân nữ ở khoa phổi? Có bao nhiêu trong số những bệnh nhân của 2 khoa này là nữ hay nằm ở khoa Phổi. Trước tiên chúng ta lập một bảng chéo để phân loại các bệnh nhân theo giới tính và theo khoa điều trị (Phổi hay Thận) và điền các thông tin đã cho từ đề bài vào bảng này (các số in đậm của bảng). Từ các thông tin này chúng ta tính các số ở các ô còn lại (các số in thường) của bảng chéo Bảng 1. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện Chợ rẫy Khoa Khoa Tổng số Phổi Thận Nam 11 4 15 Nữ 27 8 35 Tổng số 38 12 50 Từ bảng chéo chúng ta biết được số bệnh nữ của khoa phổi là 27 và số bệnh nhân nữ hay nằm ở khoa phổi là 46 người. Thí dụ: Sử dụng số liệu của bảng trên hãy tính các xác suất: 1. Chọn một người bất kì tính xác suất người nằm ở khoa Phổi P(Khoa Phổi): N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 38; P (Khoa Phổi) = 2. Chọn một người bất kì tính xác suất người đó là nam P(Nam) N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 15; P (Nam) = Khái niệm về nguy cơ và số chênh (odds) Một khái niệm quan trọng trong dịch tễ học là nguy cơ. Nguy cơ được định nghĩa là tỉ lệ mắc bệnh trong khoảng thời gian nghiên cứu ở một nhóm người người lúc đầu 8
- không bị bệnh. Như vậy còn có thể được xem là xác suất của một người bị mắc bệnh trong khoảng thời gian nghiên cứu với điều kiện lúc đầu không bị mắc bệnh. Đó là lí do tại sao xác suất và thống kê có một vai trò then chốt trong các nghiên cứu dịch tễ. Những chúng ta sẽ thấy xác suất là một hàm số có đặc tính thuận lợi về mặt toán học, thí dụ như nguyên lí cộng tính. Tuy nhiên xác suất có miền xác định là đoạn [0;1] nên để mô tả xác suất theo một biểu thức tuyến tính cần sử dụng các phép biến đổi để mở rộng miền xác định. Một trong các phép biến đổi đó là số chênh (odds) Số chênh của một biến cố A được kí hiệu là Odds(A) bằng xác suất của biến cố A chia cho xác suất của biến cố không A. Odds(A)= = Miền xác định của số chênh là đoạn [0;∞) được mở rộng so với miền xác định của xác suất. Số chênh cũng có một đặc tính khác quan trọng là số chênh của biến cố không A bằng nghịch đảo của số chênh biến cố A. Odds(Ac) = = 1: = 1:Odds Mặc dù lí do chính để sử dụng số chênh là đặc tính toán học của nó, số chênh cũng là một khái niệm quen thuộc trong cuộc sống hàng ngày. Thí dụ: Khi ta gieo đồng tiền chúng ta chúng ta có 2 kết cục sấp và ngửa đồng khả năng. Khi đó xác suất được mặt sấp, P(sấp) = = 0,5. Số chênh được mặt sấp, Odds(sấp) = = . Thực ra trong dân gian cách nói xác suất ra mặt sấp là 0,5 không quen thuộc bằng cách nói là việc được mặt ngửa là 1 ăn 1 thua (hay 5 năm 5 thua). Khi biến cố A hiếm (P(A)
- 2. Nhắc lại về lí thuyết tập hợp Một tập hợp là gồm nhiều những đối tượng xác định và khác nhau. Những đối tượng này được gọi là phần tử của tập hợp. Tập hợp thường được kí hiệu bằng chữ in và có thể biểu thị bằng giản đồ Venn. Hình 1. Giản đồ Venn (Venn diagrams) Thí dụ khi ta tung con xúc xắc có thể xảy ra 6 kết cuộc (1, 2, 3, 4, 5, 6). Do biến cố (event) là một tập hợp với các phần tử kết cuộc như vậy chúng ta có xây dựng các biến cố sau: E1={1}; E2={2}; E3={3}; E4={4}; E5={5}; E6={6} (như đã quy ước, các biến cố chỉ có một phần tử là một kết cục được gọi là biến cố sơ cấp) S={1, 2, 3, 4, 5, 6} (biến cố này được gọi là biến cố toàn thể khi tất cả các kết cục đều là các phần tử của biến cố này) A= {2,4,6}: A là biến cố ra mặt chẵn. Kí hiệu x X để chỉ định x là một phần tử của X và kí hiệu x X để chỉ rằng x không thuộc tập hợp X. Áp dụng thí dụ trên và sử dụng kí hiệu chỉ định phần tử, ta có thể viết 1 E1; 1 S; 1 E2 ; 1 A Phần giao của hai tập hợp A và B là một tập hợp (kí hiệu bằng A ∩B )gồm những phần tử chung của hai tập hợp. Phần hợp của hai tập hợp A và B là tập hợp (kí hiêu bằng A ∪B) gồm những phần tử có mặt trong tập hợp A hoặc có mặt trong tập hợp B. Thí dụ: Nếu A là tập hợp của các mặt chẵn của con xúc xắc. A= {2,4,6} Nếu B là tập hợp các mặt lớn hơn hoặc bằng 3 B = {3,4,5,6} A∪B = {2,3,4,5,6} A∩B = {4,6} 10
- 4. Nhắc lại về đại số mệnh đề Một mệnh đề (proposition) là một phát biểu hoặc đúng hoặc sai nhưng không thể cùng đúng và cùng sai. Thí dụ: Trong 3 phát biểu sau, phát biểu nào là mệnh đề a. 42 chia hết cho 7 b. Trái đất là hành tinh duy nhất trong vũ trụ có sự sống c. Mua hai vé xem đá banh trận đấu giữa Manchester United và Leed United Trả lời: Hai phát biểu đầu (a và b) là mệnh đề và phát biểu thứ ba (c) không phải là mệnh đề mà chỉ là một mệnh lệnh. Khi chúng ta kết hợp hai mệnh đề con bằng từ và thì chúng ta có một mệnh đề thì mệnh đề này chỉ đúng nếu hai mệnh đề con đều đúng: Thí dụ: Trong hai mệnh đề sau, mệnh đề nào là mệnh đề đúng. 42 chia hết cho 7 và 100 chia hết cho 10 2 + 2 = 4 và 91 là số nguyên tố Trả lời: Mệnh đề (a) là đúng còn mệnh đề (b) sai vì chỉ có một mệnh đề con của nó là đúng. Mệnh đề con còn lại (91 là số nguyên tố) sai. Khi chúng ta kết hợp hai mệnh đề con bằng từ hay thì chúng ta có một mệnh đề thì mệnh đề này chỉ sai nếu hai mệnh đề con đều sai: Thí dụ: Trong hai mệnh đề sau, mệnh đề nào là mệnh đề đúng. 42 chia hế t cho 7 và 100 chia hết cho 10 2 + 2 = 4 và 91 là số nguyên tố Trả lời: Mệnh đề (a) là đúng vì cả hai mệnh đề con đều đúng. Mệnh đề (b) đúng vì có một mệnh đề con của nó là đúng (2+2 = 4). 5. Nến tảng tiên đề của lí thuyết xác suất Vào đầu thế kỉ 20, lí thuyết xác suất đã được xây dựng nền tảng tiên đề tương tự như các ngành khác của toán học. Nhờ đó sự phát triển của lí thuyết xác suất dựa trên các tiên đề này chỉ phụ thuộc vào tính chặt chẽ logic (logic correctness) dù rằng những định lí của nó có phản ánh thế giới thực hay không. Nhà toán học Nga Kolmogorov là người đã có công xây dựng trình bày các bài toán xác suất theo các khái niệm của lí thuyết đo lường và các tiên đề để xây dựng lí thuyết xác suất do ông đưa ra được trình bày sau đây: Nếu chúng ta kí hiệu S là tập hợp các kết cục của phép thử (còn gọi là biến cố toàn thể), M là một lớp các biến cố và M thoả 3 tính chất sau: (i) S M; (ii) nếu A M, thì Ac M; (iii) nếu A1, A2, . . . M, thì A1 A2 M. Hàm số P được gọi là xác suất gán cho mỗi biến cố A thuộc lớp M một con số không âm và có 2 tính chất sau: 1. P(S) = 1 (Xác suất của biến cố toàn thể bằng đơn vị) 2. Nếu A1, A2, . . . M và Ai Aj = Ø cho tất cả i j, thì P(A1 A2 …) = P(A1) + P(A2) + … (Nếu các biến cố A1, A2,… là loại trừ tương hỗ lẫn nhau thì xác suất của sự xuất hiện A1 hay A2 hay .. bằng tổng của các xác suất đơn lẻ). Tiên đề thứ hai là cơ bản cho các chứng minh trong thống kê và được gọi là nguyên lí cộng tính (principle of additivity) 11
- 6. Giải tích tổ hợp Giải tích tổ hợp (Combinatorics) là lãnh vực toán nghiên cứu về các bài toán chọn lựa, hoán vị và các toán tử trong hệ thống hữu hạn. Trong phạm vi của tài liệu này chúng ta chỉ trình bày các khái niệm về hoán vị (arrangment), chỉnh hợp (permutation) và tổ hợp (combination). 6.1 Nhắc lại về giai thừa (factorial) Giai thừa của n (với n là số nguyên) được đọc là n giai thừa và được kí hiệu là n! n!=n.(n1).(n2)...1 Theo quy ước, 0! =1. Nhờ kí hiệu giai thừa người ta có thể viết một cách vắn tắt tích một chuỗi các chữ số liên tiếp. Thí dụ: Thể hiện biểu thức 1 2 3 4 5 6 7 bằng kí hiệu 7! Thí dụ: Thể hiện biểu thức 3 4 5 6 7 bằng 6.2 Hoán vị Trạm y tế có 3 vị trí để treo 3 bức tranh A, B, C. Số cách sắp xếp 3 bức tranh vào 3 vị trí có thể được tính theo cách lập luận sau: Vị trí số 1 có thể chọn 1 trong 3 bức tranh để treo, như vậy có tất cả 3 cách chọn Vị trí số 2 có thể chọn 1 trong 2 bức tranh còn lại, vậy ở vị trí này có 2 cách chọn Vị trí số 3 chỉ còn duy nhất một tranh để treo, vậy ở vị trí này chỉ có 1 cách chọn Số cách sắp xếp 3 bức tranh vào 3 vị trí = 1 × 2 × 3 = 3! Một cách tổng quát số cách sắp xếp n đối tượng vào n vị trí khác nhau còn được gọi là số cách hoán vị (arrangments) của n đối tượng bằng n!. 6.3. Chỉnh hợp và tổ hợp Chỉnh hợp và tổ hợp đều là cách chọn k đối tượng từ n đối tượng cho trước. Việc chọn các đối tượng được gọi là chỉnh hợp (Permutation) nếu chúng ta để ý đến thứ tự lựa chọn và được gọi là tổ hợp (Combination) nếu chúng ta không quan tâm đến thứ tự lựa chọn. Khái niệm về chỉnh hợp và tổ hợp sẽ được minh hoạ trong thí dụ sau. Giả sử chúng ta có 5 đối tượng phân biệt (distinguishable objects) là các loại thuốc A (antibiotic), B (beta agonist), C (corticosteroid), D (bronchoDilator) và E (expectorant). Giả sử để điều trị cho bệnh nhân bị hen phế quản chúng ta cần phải chọn 2 loại thuốc và hai loại thuốc này không dùng đồng thời (một thuốc dùng trước, một thuốc dùng sau). Khi đó các cách để chọn 2 loại thuốc được liệt kê ở như sau: AB BA AC CA AD DA AE EA BC CB BD DB BE EB CD DC CE EC DE ED Mỗi cách chọn lựa liệt kê ở trên được gọi là một chỉnh hợp. Số các chỉnh hợp này được gọi là số chỉnh hợp 5 đối tượng chọn 2 (permuations of 5 objects taken 2) và được kí hiệu là 5P2. Lập luận để tính số chỉnh hợp 5 đối tượng chọn 2 như sau: Để chọn đối tượng thứ nhất chúng ta có 5 cách chọn Để chọn đối tượng thứ hai sau khi chọn đối tượng đầu tiên chúng ta có 4 cách chọn Do đó 5P2 = 5 × 4 = = 12
- Một cách tổng quát, công thức tính nPr (số chỉnh hợp n đối tượng chọn r) là số cách trong n đối tượng chọn ra r đối tượng có phân biệt thứ tự được chọn (để giao các nhiệm vụ hay nhận lãnh các vị trí khác nhau) là: n! n (n 1) 1 n Pr ( n r )! (n r ) ( n r 1) 1 (3) Chúng ta hãy xét một thí dụ khác. Giả sử để điều trị cho bệnh nhân bị hen phế quản chúng ta cần phải chọn 2 loại thuốc và cho dùng đồng thời. Trong trường hợp này tổ hợp AB đồng nhất như tổ hợp BA, tổ hợp AC cũng đồng nhất như tổ hợp CA và số tổ hợp bằng số chỉnh hợp chia số số hoán vị của 2 đối tượng được chọn. Do đó 5C2 = 5C2 /2! = = Một cách tổng quát, công thức tính nCr (số tổ hợp n đối tượng chọn r) là số cách trong n đối tượng chọn ra r đối tượng có không phân biệt thứ tự được chọn (và sẽ nhận lãnh cùng một nhiệm vụ hay cùng một vị trí ) là: n! n (n 1) 1 n Cr (n r )!r! (n r ) (n r 1) 1 r ( r 1) 1 (4) Lưu ý: Tổ hợp và chỉnh hợp có thể được kí hiệu khác. Thí dụ tổ hợp n lấy r còn được n kí hiệu là C r hay r . Một số tài liệu nêu rõ tổ hợp là tổ hợp không lặp và dùng từ n chập hay cho từ lấy do đó nCr được gọi là tổ hợp không lặp chập r của n đối tương. Tuy nhiên phần lớn tài liệu hiện đại đều quy ước tổ hợp có nghĩa là tổ hợp không lặp để tránh rườm rà. 6.4 Bài toán ngày sinh nhật Bộ môn Y tế công cộng có n=23 giảng viên và nhân viên, hãy tính xác suất P trong bộ môn ít nhất có 2 người trùng ngày sinh. Để đơn giản, chúng ta hãy giả định là một năm chỉ có 365 ngày và mỗi ngày đều có xác suất là ngày sinh của một người ngẫu nhiên là như nhau. Khi đó một nhóm n người sẽ có 365n cách xảy ra ngày sinh của n người đó. Cách chọn trong 365 ngày sinh để gán cho n người khác nhau chính là chỉnh hợp 365 chọn n. do đó Xác suất trong bộ môn ít nhất 2 người trùng ngày sinh = 1 – xác suất n người có ngày sinh hoàn toàn khác nhau. Thay n=23, chúng ta có xác suất trong bộ môn Y tế công cộng có ít nhất 2 người trùng ngày sinh là 0,5 Khi số lượng người gia tăng thì xác suất có ít nhất 2 người cùng ngày sinh nhật cũng gia tăng. Đáp số cụ thể cho các trường hợp được trình bày như sau: Số người 9 23 42 50 XS có ít nhất có 2 người trùng ngày sinh 0,0946 0,5073 0,9140 0,9704 Số chênh 0,1045 1,0296 10,6320 32,7537 Tỉ lệ cá 1:10 1:1 10:1 33:1 13
- Bài tập Bài tập định nghĩa xác suất 1. Một bệnh viện có cơ cấu nhân viên theo tuổi và công tác được trình bày trong bảng 1. Giả sử nếu ta chọn một nhân viên trong bệnh viện., tính xác suất: a nhân viên đó là bác sĩ b nhân viên đó là bác sĩ lớn hơn 35 tuổi c nhân viên đó là điều dưỡng d nhân viên đó là một điều dưỡng tuổi từ 26 đến 35 1a. Theo công thức m P( E ) N Với N là số các biến cố có thể và m số các biến cố thuận lợi. Khi chọn ngẫu nhiên việc chọn lực có thể kết cuộc theo 1766 cách khác nhau (Số biến cố có thể N=1766). Trong việc tính xác suất nhân viên đó là bác sĩ, biến cố thuận lợi là biến cố chọn được một trong 105 bác sĩ. Như vậy số biến cố thuận lợi m = 105. Ta có xác suất chọn được một bác sĩ là 105/1766=0,059 = 5,9% 1b. Tương tự ta có xác suất chọn được một bác sĩ lớn hơn 35 tuổi là 75/1766 = 0,042 = 4,2% 1c. Xác suất chọn được một nhân viên điều dưỡng là 1220 /1766 = 0,691 = 69,1% 1d. Xác suất chon được một nhân viên điều dưỡng tuổi từ 26 đến 35 = (375+442)/1766 = 817/1766 = 0,463 = 46,3% Bài tập về tập hợp và mệnh đề Bảng 1. Nhân viên của bệnh viện phân theo tuổi và công tác Công tác A1 A2 A3 A4 Tổng số ≤ 25 26 31 >35 30 35 B1. Bác sĩ 0 5 25 75 105 B2. Phục vụ phòng thí nghiệm 20 30 35 35 120 B3. Phục vụ dinh dưỡng 3 6 6 10 25 B4. Phục vụ hồ sơ bệnh án 7 15 8 12 42 B5. Phục vụ điều dưỡng 200 375 442 203 1220 B6. Dược sĩ 1 12 8 3 24 B7. Quang tuyến 4 10 19 12 45 B8. Phục vụ điều trị 5 25 15 10 55 B9. Những ngành khác 20 35 50 25 130 Tổng số 260 513 608 385 1766 1. Dựa vào số liệu của bảng 1. Giải thích bằng lời những tập hợp sau đây. Những tập hợp đó có bao nhiêu phần tử: 14
- A4∩B3 ; B5∩A2 ; B3∪A4 ; (A4∪A3)∩B3 2. Trong các mệnh đề sau, mệnh đề nào là đúng 2+2 là 4 hay Darwin là con khỉ Bệnh AIDS do một loại virus gây ra và bệnh AIDS có thể lây lan qua muỗi Aedes aegypti Bài giải 1. Giải thích các tập hợp A4∩B3 là tập hợp những nhân viên cấp dưỡng >35 tuổi. n(A4∩B3) = 10 B5∩A2 là tập hợp những điều dưỡng tuổi từ 26 đến 30. n(B5∩A2) = 375 B3∪A4 là tập hợp những người nhân viên cấp dưỡng hay trên 35 tuổi. n(B3∪A4)=385 +25 10 = 400 (A4∪A3)∩B3 là tập hợp những nhân viên cấp dưỡng tuổi từ 31 trở lên. N{(A4∪A3)∩B3}=16 2. Mệnh đề (a) là mệnh đề hay. Mệnh đề này đúng do một mệnh đề con của nó là đúng (2+2 =4), Mệnh đề (b) là mệnh đề và. Mệnh đề này sai do một mệnh đề con của nó (bệnh AIDS có thể lây lan qua muỗi Aedes aegypti ) là sai. Bài tập về chỉnh hợp, tổ hợp 1. Một nhân viên vật lí trị liệu sắp kế hoạch làm việc trong ngày. Anh ta biết rằng có 7 công việc phải làm trong ngày đó. a. Nếu anh ta có thể tiến hành công việc theo ý muốn, thì anh ta có thể có bao nhiêu cách sắp xếp? b. Nếu anh ta quyết định nghỉ buổi chiều và chỉ làm 3 công việc vào buổi sáng thì anh ta có bao nhiêu cách sắp xếp? 2. Một nhân viên muốn làm xét nghiệm 4 mẫu máu nhưng bà ta chỉ có đủ hóa chất để xét nghiệm cho 3 mẫu mà thôi. Hỏi có bao nhiêu cách chọn 3 mẫu máu trong 4 mẫu để làm xét nghiệm? 3. Giả sử trong phòng thí nghiệm có 3 công việc khác nhau phải làm và có 5 người làm việc đó. Hỏi có bao nhiêu cách để giao 3 công việc này cho 5 người? Bài giải 1a. Do người nhân viên vật lí trị liệu này muốn liên kết 7 công việc khác nhau vào 7 thời điểm khác nhau trong kế hoạch công tác, anh ta có thể có sắp xếp công việc theo 7!=7 × 6 × 5 × 4 × 3 × 2 × 1= 5040 cách. 1b. Nếu anh ta chỉ còn có đủ thời gian để làm 3 công việc, anh ta phải từ 7 công việc chọn ra 3, 3 công việc này sau khi được chọn sẽ được sắp xếp khác nhau. Như vậy, số kế hoạch anh ta có thể sắp xếp là: P = 7!/(73)! = 7 × 6 × 5 × 4 × 3 × 2 × 1 / 4 × 3 × 2 × 1 = 7 × 6 × 5 = 210 7 3 cách. 2. Người nhân viên này muốn chọn từ 4 mẫu máu lấy 3 mẫu, 3 mẫu máu này sau khi chọn là không phân biệt (đều được làm xét nghiệm). Vậy số cách chọn 3 mẫu máu để xét nghiệm là 4C3 = 4!/(43)!3! = 4 × 3 × 2 × 1 / (1 × 3 × 2 × 1) = 4 15
- 3. Từ 5 người chọn ra 3, và 3 người này sẽ có những công việc khác nhau. Số kế hoạch có thể phân công là: 5P3 = 5!/(53)! = 5 × 4 × 3 × 2 × 1 / 3 × 2 × 1 = 60 16
- XÁC SUẤT CÓ ĐIỀU KIỆN - ĐỊNH LUẬT NHÂN XÁC SUẤT Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: Trình bày định nghĩa của xác suất có điều kiện Trình bày công thức cộng xác suất và công thức nhân xác suất 1. Xác suất có điều kiện Nếu các kết cục có thể không bao gồm toàn thể các kết cục (khi một số kết cục bị hạn chế) thì xác suất có thể được gọi là xác suất có điều kiện. Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) Bảng 2. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện X Khoa Khoa Tổng số Phổi Thận Nam 11 4 15 Nữ 27 8 35 Tổng số 38 12 50 Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân bố của các đặc điểm của bệnh nhân này được trình bày trong bảng. Chọn một người bất kì, xác suất người là nam và nằm ở khoa Phổi P(Nam và Khoa Phổi) có phải là xác suất có điều kiện hay không? Hãy tính xác suất này. Chọn một người bất kì, Xác suất người là nam và nằm ở khoa Phổi P(Nam và Khoa Phổi) – không phải là xác suất có điều kiện bởi vì các kết cục không có hạn chế (ai cũng có thể được chọn). N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 11; P (Nam và Khoa Phổi) = Thí dụ: Chọn một người nam, xác suất người này nằm ở khoa Phổi có phải là xác suất có điều kiện hay không? Hãy tính xác suất này. Chọn một người nam, xác suất người này nằm ở khoa Phổi là xác suất có điều kiện bởi vì số kết cục bị hạn chế (chỉ có bệnh nhân nam được chọn và như vậy kết cục chỉ có thể là 1 trong số 15 bệnh nhân nam) Nc: Số kết cuộc có thể là 15; m: số các kết cuộc thuận lợi cho 11; Xác suất người này nằm ở khoa Phổi với điều kiện người này là nam giới = P (Khoa Phổi|Nam) = Lưu ý: Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) và điều kiện này phải đúng cho cả kết cục thuận lợi (m) và kết cục có thể (N c). Trong thí dụ trên 11 kết cục thuận lợi vừa đòi hỏi điều kiện là nam giới và đặc tính là nằm ở khoa phổi và 15 kết cục có thể đòi hỏi điều kiện là nam giới. Thể hiện nhận xét bằng công thức: m n( A B ) n( A B ) / N P ( A B ) P( B | A) Nc n( A) n( A) / N P( A) (5) n(A∩B ) là số kết cục thoả điều kiện A và đặc tính B và n(A) số kết cục thoả điều kiện A Thí dụ: Chọn một bệnh nhân ở khoa Thận, tính xác suất bệnh nhân này là nữ. 17
- Đây là xác suất có điều kiện. P(nữ|khoa Thận) = = = = 0,75 Thí dụ: Theo bản báo cáo “Số ca nghi nhiễm SARS tích luỹ” của Tổ Chức Y tế Thế Giới (http://www.who.int/csr/sars/country/2003_05_17/en/), Số ca bệnh SARS (Hội chứng Hô hấp cấp tính trầm trọng) từ ngày 1/10/2002 đến ngày 17/5/2003 là 7761 với 623 trường hợp tử vong. Xác suất tử vong của những người mắc SARS là xác suất có điều kiện: ( cả 623 ca tử vong và 7761 ca bệnh đều mắc SARS). P(tử vong|SARS)= Xác suất có điều kiện này (Xác suất tử vong ở những người mắc một bệnh cụ thể nào đó) được gọi là tỉ suất chết/mắc của bệnh đó (casefatality rate). Thí dụ: Trong một dân số, tỉ lệ những người có dấu hiệu lách to là 20%, những người vừa sốt rét vừa lách to là 18%, những người bị sốt rét là 23%. Một người ngẫu nhiên từ dân số đó, người này không có dấu hiệu lách to. Tính khả năng người này bị sốt rét? Bài giải: P(sốt rét|lách không to) = P(sốt rét và lách không to) / P(lách không to) = [P(sốt rét) P(sốt rét và lách to)]/ P(lách không to) = (0.230.18)/0.8 = 0.05/0.8 =0.0625 2. Ðịnh luật nhân xác suất Từ phương trình (5) ta có thể xây dựng công thức: P(A∩B) = P(A) × P(B|A) (6) P(A∩B) = P(B∩A) =P(B) × P(A|B) Công thức này được gọi là định lí nhân xác suất. Thí dụ: Nếu xác suất mắc bệnh lao, P(Lao) = 0,001 và xác suất chết/mắc của bệnh Lao, P(chết|Lao) = 0,1. Xác suất chết vì bệnh lao: P(Lao và Chết) = P(Lao) × P(Chết | Lao) = 0,001 × 0,1 = 0,0001 Tính độc lập Một trong những khái niệm quan trọng trong lí thuyết xác suất là tính độc lập (independence). Hai biến cố A và B được gọi là độc lập nếu P(B|A) = P(B), hoặc suy ra từ (6) nếu P(A∩B) = P(A) × P(B) (7) Ý nghĩa của định nghĩa theo xác suất có điều kiện là xác suất của B không thay đổi dù có hay không có điều kiện A. Từ phương trình (7) chúng ta có thể suy ra là tính độc lập có tính chất đối xứng (nếu A độc lập với B thì B độc lập với A và ngược lại). Thí dụ: Giả sử Xác suất bị chấn thương giao thông trên dân số chung = P(chấn thương giao thông) =0,01 Xác suất bị chấn thương giao thông ở người hút thuốc lá = P(chấn thương giao thông | hút thuốc lá) = 0,01 Khi đó chấn thương giao thông và hút thuốc lá là hai biến cố độc lập. Giả sử Xác suất bị chấn thương giao thông trên dân số chung = P(chấn thương giao thông) =0,01 18
- Xác suất bị chấn thương giao thông ở người nghiện rượu = P(chấn thương giao thông | nghiện rượu) = 0,03 Khi đó chấn thương giao thông và nghiện rượu là hai biến cố không độc lập Khi biến cố A không độc lập với biến cố B thì: A => B hoặc B => A hoặc Có một yếu tố ảnh hưởng đến cả A và B (yếu tố này được gọi là yếu tố gây nhiễu). Do đó nếu chúng ta có thể chứng minh P(B) ≠ P(B|A) ≠ P(B|Ac) (A và B không độc lập) và chúng ta loại trừ được các mệnh đề B => A (bằng cách biện luận về thời gian) Yếu tố gây nhiễu ảnh hưởng đến cả A và B Nghĩa là chúng ta có chứng cớ (evidence) của mệnh đề A=>B. Đây là cách lập luận thường được sử dụng trong nghiên cứu xác định nguyên nhân hay yếu tố nguy cơ. Tính loại trừ của 2 biến cố Nếu hai biến cố A và B không bao giờ xảy ra đồng thời người ta gọi biến cố A và B loại trừ lẫn nhau. Thí dụ bệnh nhân không bao giờ bị nhiễm sán dải và sán dải heo cùng lúc nên việc nhiễm sán dải bò và sán dải heo là 2 biến cố loại trừ lẫn nhau. Trong thửu nghiệm tung xúc xắc, biến cố ra mặt chẵn và biến cố ra mặt 3 là biến cố loại trừ lẫn nhau. Cần lưu ý hai biến cố loại trừ lẫn nhau không phải là 2 biến cố độc lập mà thực chất là 2 biến cố phụ thuộc lẫn nhau. Biến cố A xảy ra phụ thuộc vào việc không xảy ra biến cố B và ngược lại. 3. Công thức cộng xác suất tổng quát Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân bố của các đặc điểm của bệnh nhân này được trình bày trong bảng ở đầu chương. Chọn một người bất kì, hãy tính xác suất người là nam hay nằm ở khoa Phổi P(Nam hay Khoa Phổi): P(Nam hay Khoa Phổi)= P(Nam hay Khoa Phổi)= = P(Phổi)+P(Nam)P(Phổi và Nam) Một cách tổng quát, nếu A∪B ≠ Ø thì chúng ta có P(A∪B) = P(A) + P(B) – P(A∩B) (8) Nếu hai biến cố A và B loại trừ lẫn nhau thì chúng ta có thể tính được xác suất xảy ra A hay B dựa trên nguyên lí cộng tính: P(A∪B) = P(A) + P(B) Đây là công thức cộng xác suất tổng quát. Sau đây là tổng kết công thức nhân và cộng xác suất tuỳ theo mối quan hệ giữa 2 biến số A và B Quan hệ giữa biến Định luật Nhân xác suất Định luật Cộng xác suất 19
- cố A và B P(A∩B) P(A∪B) Không đặc biệt =P(A)× P(B|A) = P(A) + P(B) – P(A∩B) (không độc lập và không loại trừ) Độc lập = P(A)× P(B) = P(A) + P(B) – P(A)× P(B) Loại trừ = 0 = P(A) + P(B) 4. Công thức xác suất toàn phần và định lí Bayes Nếu biến cố B phụ thuộc vào biến cố A – P(B) ≠ P(B|A) – thì xác suất của biến cố B phụ thuộc vào xác suất của biến cố A. Khi đó xác suất xảy ra B (A c là biến cố đối lập của biến cố A và được đọc là không A) P ( B) P( A B) P( A C B) P ( A) P ( B | A) P( A C ) P ( B | A C ) (9) Công thức này được gọi là công thức xác suất toàn phần (law of total probability). Áp dụng công thức này trong trường hợp ung thư phụ thuộc vào hút thuốc lá chúng ta có: Xác suất ung thư = Xác suất hút thuốc lá × xác suất ung thư khi hút thuốc lá + Xác suất không hút thuốc lá × xác suất ung thư khi không hút thuốc lá. Tính xác suất A trên điều kiện B P(A|B) và thay mẫu số với công thức xác suất toàn phần ta được P( A B) P( A) P( B | A) P( A | B) P( B) P( A) P( B | A) P( A c ) P( B | A c ) (9) Công thức này được gọi là định lí Bayes. Lí giải công thức này trong trường hợp hút thuốc lá tăng nguy cơ ung thư phổi như sau. Xác suất một người hút thuốc lá khi biết người này bị ung thư phổi bằng với tỉ lệ với xác suất vừa hút thuốc vừa ung thư phổi trong xác suất bị ung thư phổi. 5. Biến số ngẫu nhiên Khi chúng ta tiến hành phép thử, chúng ta thường không quan tâm đến chi tiết của biến cố mà chỉ quan tâm giá trị của một đại lượng nào đó được xác định bởi kết cục của phép thử. Thí dụ, khi chúng ta gieo 3 con xúc xắc, có thể chúng ta không quan tâm đến con xúc xắc nào ra mặt mấy mà chỉ quan tâm đến tổng số điểm của 3 con xúc xắc. Hay khi chúng ta mua vé số, chúng ta chỉ quan tâm đến số tiền mà chúng ta trúng được (hay số tiền bị mất) sau khi đã có kết quả xổ số. Đại lượng mà giá trị của nó được xác định bởi kết cục của phép thử ngẫu nhiên được gọi là biến số ngẫu nhiên. Biến số ngẫu nhiên thường được kí hiệu bằng chữ in hoa (như X, Y,..). Biến số ngẫu nhiên X của biến cố e được kí hiệu là X(e). Các thí dụ khác về biến số ngẫu nhiên gồm: Thí dụ: Một người đặt một con số gồm 2 chữ số. Sau đó người ta tiến hành quay số để có kết quả là một số 2 chữ số. Như vậy phép thử sẽ có 100 kết cuộc là con số 00,01,02,03,...,99. Nếu kết cuộc trùng với con số được đặt, người đặt sẽ được 70 đồng. Nếu kết cuộc không trùng với con số được đặt, người đặt sẽ bị mất 1 đồng. Như vậy có 99 kết cục tương ứng với giá trị 1 và 1 kết cục tương ứng với giá trị 70. 1 và 70 là các giá trị của biến số ngẫu nhiên X “số tiền thu được”. Ta có thể tính được P(X=1)=0,99 và P(X=70)=0,01 20
ADSENSE
CÓ THỂ BẠN MUỐN DOWNLOAD
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn