intTypePromotion=1
ADSENSE

Bài giảng Xác suất và thống kê - ThS. Đoàn Vương Nguyên

Chia sẻ: Kiếp Này Bình Yên | Ngày: | Loại File: PDF | Số trang:22

71
lượt xem
10
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Xác suất và thống kê có cấu trúc gồm 7 chương, với các nội dung cụ thể như: Các khái niệm cơ bản của xác suất, biến (đại lượng) ngẫu nhiên, định lý giới hạn trong xác suất, lý thuyết mẫu, ước lượng đặc trưng của tổng thể (đám đông), kiểm định giả thiết thống kê, lý thuyết tương quan và hàm hồi quy. Mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Xác suất và thống kê - ThS. Đoàn Vương Nguyên

  1. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK XÁC SUẤT VÀ THỐNG KÊ (ðại học và Cao ñẳng) Tài liệu tham khảo: 1. Giáo trình Xác suất – Thống kê và Ứng dụng – Nguyễn Phú Vinh – NXB Thống kê. 2. Ngân hàng câu hỏi Xác suất – Thống kê và Ứng dụng – ðHCN TP.HCM. 3. Lý thuyết Xác suất và Thống kê – ðinh Văn Gắng – NXB Giáo dục. 4. Lý thuyết Xác suất và Thống kê toán – Nguyễn Thanh Sơn, Lê Khánh Luận – NXBTKê. 5. Xác suất – Thống kê – Lý thuyết và các bài tập – ðậu Thế Cấp – NXB Giáo dục. 6. Lý thuyết Xác suất và Thống kê – ðinh Văn Gắng – NXB Giáo dục. 7. Xác suất – Thống kê và Ứng dụng – Lê Sĩ ðồng – NXB Giáo dục. 8. Xác suất và Thống kê – ðặng Hấn – NXB Giáo dục. 9. Giáo trình Xác suất và Thống kê – Phạm Xuân Kiều – NXB Giáo dục. 10. Giáo trình Lý thuyết Xác suất & Thống kê Toán–Nguyễn Cao Văn–NXB Ktế Quốc dân. PHẦN I. LÝ THUYẾT XÁC SUẤT BỔ TÚC ðẠI SỐ TỔ HỢP 1. Tính chất các phép toán ∩ , ∪ 2. Quy tắc nhân a) Tính giao hoán: Giả sử một công việc nào ñó ñược chia thành k giai A ∩ B = B ∩ A, A ∪ B = B ∪ A. ñoạn. Có n1 cách thực hiện giai ñoạn thứ 1, có n2 cách b) Tính kết hợp: thực hiện giai ñoạn thứ 2,..., có nk cách thực hiện giai (A ∩ B) ∩ C = A ∩ (B ∩ C) , ñoạn thứ k. Khi ñó ta có n = n1.n2…nk cách thực hiện toàn bộ công việc. (A ∪ B) ∪ C = A ∪ (B ∪ C) . c) Tính phân phối: 3. Quy tắc cộng A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) , Giả sử một công việc có thể thực hiện ñược k cách A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) . (trường hợp) loại trừ lẫn nhau: cách thứ nhất cho m1 kết d) Tính ñối ngẫu (De–Morgan): quả, cách thứ hai cho m2 kết quả, …, cách thứ k cho mk kết quả. Khi ñó việc thực hiện công việc trên cho A ∩ B = A ∪ B, A ∪ B = A ∩ B. m = m1 + m2 + … + mk kết quả. 5. Các công thức thường dùng 4. Mẫu lặp, mẫu không lặp 5.1. Hoán vị ðịnh nghĩa: Hoán vị của n phần tử là một nhóm có thứ tự gồm ñủ mặt n phần tử ñã cho. Số hoán vị của n phần − Mẫu không lặp: các phần tử của mẫu chỉ có mặt một lần (các phần tử khác nhau từng ñôi một). tử ñược ký hiệu là Pn , Pn = n ! . − Mẫu có lặp: các phần tử của mẫu có thể lặp lại nhiều lần trong mẫu. 5.2. Chỉnh hợp lặp (có thứ tự) − Mẫu không thứ tự: khi thay ñổi vị trí các phần tử khác ðịnh nghĩa: Chỉnh hợp lặp k của n phần tử (k ≤ n) là nhau của mẫu ta không nhận ñược mẫu mới. một nhóm (bộ) có thứ tự gồm phần k tử không nhất thiết − Mẫu có thứ tự: khi thay ñổi vị trí các phần tử khác khác nhau chọn từ n phần tử ñã cho. Số các chỉnh hợp nhau của mẫu ta nhận ñược mẫu mới. lặp k của n phần tử là nk. 5.4. Tổ hợp (mẫu không lặp, không có thứ tự) 5.3. Chỉnh hợp (mẫu không lặp, có thứ tự) ðịnh nghĩa: Tổ hợp chập k của n phần tử (k ≤ n) là ðịnh nghĩa: Chỉnh hợp chập k của n phần tử (k ≤ n) là một nhóm (bộ) không phân biệt thứ tự gồm k phần tử một nhóm (bộ) có thứ tự gồm phần k tử khác nhau chọn khác nhau chọn từ n phần tử ñã cho. từ n phần tử ñã cho. Số chỉnh hợp chập k của n phần tử Số tổ hợp chập k của n phần tử ký hiệu là Ckn và ký hiệu là Akn . n! Ckn = . Quy ước: 0! = 1. Akn = n(n − 1)...(n − k + 1) = n! . k !( n − k )! (n − k)! Tính chất: Ckn = Cnn−k ; −1 + Cn−1 . Ckn = Ckn−1 k ---------------------------------------------- Trang 1
  2. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Chương 1. CÁC KHÁI NIỆM CƠ BẢN CỦA XÁC SUẤT §1. BIẾN CỐ NGẪU NHIÊN 1.1. Phép thử và biến cố 1.2. Các loại biến cố • Phép thử là việc thực hiện 1 thí nghiệm hay quan sát a) Không gian mẫu và biến cố sơ cấp một hiện tượng nào ñó ñể xem có xảy ra hay không. • Trong một phép thử, tập hợp tất cả các kết quả có thể Hiện tượng có xảy ra hay không trong phép thử ñược gọi xảy ra ñược gọi là không gian mẫu ký hiệu là Ω . là biến cố ngẫu nhiên. • Mỗi phần tử ω ∈ Ω không thể phân nhỏ thành hai biến Biến cố ngẫu nhiên thường ñược ký hiệu A, B, C… cố ñược gọi là biến cố sơ cấp. VD 1. + Tung ñồng tiền lên là một phép thử, biến cố là VD 2. Xét phép thử gieo 3 hạt lúa. “mặt sấp xuất hiện” hay “mặt ngửa xuất hiện”. Gọi Ai là biến cố “có i hạt nảy mầm” (i = 0, 1, 2, 3). + Chọn ngẫu nhiên một số sản phẩm từ một lô hàng ñể Khi ñó các Ai là các biến cố sơ cấp và kiểm tra là phép thử, biến cố là “chọn ñược sản phẩm Ω = {A0, A1, A2, A3}. tốt” hay “chọn ñược phế phẩm”. Gọi B là “có ít nhất 1 hạt nảy mầm” thì B không là + Gieo một số hạt lúa là phép thử, biến cố là “hạt lúa nảy biến cố sơ cấp. mầm” hay “hạt lúa không nảy mầm”. b) Biến cố chắc chắn và biến cố không thể • Trong một phép thử mà mọi biến cố sơ cấp ñều ñồng • Trong một phép thử, biến cố nhất ñịnh xảy ra là chắc khả năng thì số phần tử của không gian mẫu ñược gọi chắn, ký hiệu là Ω . là số trường hợp ñồng khả năng của phép thử. • Biến cố không thể là biến cố không thể xảy ra khi thực VD 4. hiện phép thử, ký hiệu ∅ . Gọi ngẫu nhiên một học sinh trong lớp ñể kiểm tra thì VD 3. mỗi học sinh trong lớp ñều có khả năng bị gọi như nhau. Từ một nhóm có 6 nam và 4 nữ chọn ra 5 người. d) Các phép toán Khi ñó, biến cố “chọn ñược 5 người nữ” là không thể, • Tổng của A và B là C, ký hiệu C = A ∪ B hay biến cố “chọn ñược ít nhất 1 nam” là chắc chắn. C = A + B, xảy ra khi ít nhất 1 trong hai biến cố A, B xảy ra. c) Số trường hợp ñồng khả năng VD 5. Bắn hai viên ñạn vào 1 tấm bia. Gọi A1: “viên thứ • Hai hay nhiều biến cố trong một phép thử có khả năng nhất trúng bia”, A2: “viên thứ hai trúng bia” và xảy ra như nhau ñược gọi là ñồng khả năng. C: “bia bị trúng ñạn” thì C = A1 ∪ A2 . • Tích của A và B là C, ký hiệu C = AB = A ∩ B , xảy • Phần bù của A, ký hiệu: ra khi và chỉ khi cả A và B cùng xảy ra. A = Ω \ A = {ω ∈ Ω ω ∉ A} . VD 6. Một người chọn mua áo. Gọi A: “chọn ñược áo màu VD 8. xanh”, B: “chọn ñược áo sơ–mi” và Bắn lần lượt 2 viên ñạn vào 1 tấm bia. C: “chọn ñược áo sơ–mi màu xanh” thì C = AB. Gọi Ai: “có i viên ñạn trúng bia” (i = 0, 1, 2), VD 7. B: “có không quá 1 viên ñạn trúng bia”. Chọn ngẫu nhiên 10 linh kiện trong 1 lô ra kiểm tra. Gọi Khi ñó B = A2 , A0 ≠ A2 và A1 ≠ A2 . Ai: “chọn ñược linh kiện thứ i tốt” và 1.3. Quan hệ giữa các biến cố C: “chọn ñược 10 linh kiện tốt” thì a) Biến cố xung khắc 10 C = A1 ∩ A2 ∩ ... ∩ A10 = • Hai biến cố và B ñược gọi là xung khắc nếu chúng ∩ Ai . không ñồng thời xảy ra trong một phép thử. i =1 • Họ các biến cố A1, A2,…, An ñược gọi là xung khắc VD 10. Trồng 1 cây bạch ñàn. Gọi A: “cây bạch ñàn (hay ñôi một xung khắc) khi một biến cố bất kỳ trong họ sống”, B: “cây bạch ñàn chết” thì A và B là ñối lập. xảy ra thì các biến cố còn lại không xảy ra. Nghĩa là Ai ∩ A j = ∅, ∀i ≠ j . • Họ các biến cố {Ai} (i = 1,…, n) ñược gọi là hệ ñầy ñủ các biến cố nếu thỏa mãn 2 ñiều sau: VD 9. Một hộp có 3 viên phấn màu ñỏ, xanh và trắng. Chọn ngẫu nhiên 1 viên. Gọi A: “chọn ñược viên màu 1) Họ xung khắc, nghĩa là Ai ∩ A j = ∅, ∀ i ≠ j . ñỏ”, B: “chọn ñược viên màu trắng” và C: “chọn ñược 2) Phải có ít nhất 1 biến cố trong họ xảy ra, viên màu xanh” thì A, B, C là xung khắc. nghĩa là A1 ∪ A2 ∪ ... ∪ An = Ω . b) Biến cố ñối lập • Hai biến cố A và B ñược gọi là ñối lập nhau nếu chúng VD 11. Họ {A, B, C} trong VD 9 là ñầy ñủ. thỏa mãn 2 ñiều sau: 1) A và B xung khắc với nhau. { } Chú ý. Họ A, A là ñầy ñủ với biến cố A tùy ý. 2) Phải có ít nhất một trong 2 biến cố xảy ra. Trang 2
  3. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK §2. XÁC SUẤT CỦA BIẾN CỐ 2.1. ðịnh nghĩa xác suất dạng cổ ñiển VD 2. Một hộp có 10 sản phẩm trong ñó có 4 phế phẩm. • Trong một phép thử có tất cả n biến cố sơ cấp ñồng khả Lấy ngẫu nhiên từ hộp ñó ra 3 sản phẩm (lấy 1 lần), tính năng, trong ñó có m khả năng thuận lợi cho biến cố A xác suất ñể: xuất hiện thì xác suất của A là: a) Cả 3 sản phẩm ñều tốt; b) Có ñúng 2 phế phẩm. VD 3. Một lớp có 60 học sinh trong ñó có 28 em giỏi m Soá bieán coá thuaän lôïi cho A toán, 30 em giỏi lý, 32 em giỏi ngoại ngữ, 15 em vừa P(A) = = . giỏi toán vừa giỏi lý, 10 em vừa giỏi lý vừa giỏi ngoại n Soá taát caû caùc bieán coá coù theå ngữ, 12 em vừa giỏi toán vừa giỏi ngoại ngữ, 2 em giỏi VD 1. Một hộp chứa 10 sản phẩm trong ñó có 3 phế cả 3 môn. Chọn ngẫu nhiên một học sinh của lớp. Tính phẩm. Tính xác suất: xác suất: a) Chọn ngẫu nhiên 1 sản phẩm từ hộp ñược phế phẩm. a) Chọn ñược em giỏi ít nhất 1 môn. b) Chọn ngẫu nhiên 1 lần từ hộp ra 2 sản phẩm ñược 2 b) Chọn ñược em chỉ giỏi toán. phế phẩm. c) Chọn ñược em giỏi ñúng 2 môn. Ưu ñiểm và hạn chế của ñịnh nghĩa dạng cổ ñiển VD 7. Hai người bạn hẹn gặp nhau tại 1 ñịa ñiểm theo • Ưu ñiểm: Tính ñược chính xác giá trị của xác suất mà quy ước như sau: không cần thực hiện phép thử. – Mỗi người ñộc lập ñi ñến ñiểm hẹn trong khoảng từ 7 • Hạn chế: Trong thực tế có nhiều phép thử vô hạn các ñến 8 giờ. biến cố và biến cố không ñồng khả năng. – Mỗi người ñến ñiểm hẹn nếu không gặp người kia thì ñợi 30 phút hoặc ñến 8 giờ thì không ñợi nữa. 2.3. ðịnh nghĩa theo hình học Tìm xác suất ñể hai người gặp nhau. Cho miền Ω . Gọi ñộ ño của Ω là ñộ dài, diện tích, thể 2.4. Tính chất của xác suất tích (ứng với Ω là ñường cong, miền phẳng, khối). 1) 0 ≤ P(A) ≤ 1 , với mọi biến cố A; Gọi A là biến cố ñiểm M ∈ S ⊂ Ω . 2) P(∅) = 0 ; 3) P(Ω) = 1 . ñoä ño S Ta có P(A) = . 2.5. Ý nghĩa của xác suất ñoä ño Ω • Xác suất là số ño mức ñộ tin chắc, thường xuyên xảy ra VD 6. Tìm xác suất của ñiểm M rơi vào hình tròn nội của 1 biến cố trong phép thử. tiếp tam giác ñều cạnh 2 cm. Chú ý. Xác suất phụ thuộc vào ñiều kiện của phép thử. §3. CÔNG THỨC TÍNH XÁC SUẤT 3.1. Công thức cộng xác suất c) Biến cố ñối lập a) Biến cố xung khắc • A và B xung khắc thì: P(A ∪ B) = P(A) + P(B) . ( ) P A = 1 − P(A) . • Họ {Ai} (i = 1, 2,…, n) thì: VD 1. Một hộp phấn có 10 viên trong ñó có 3 viên màu P ( A1 ∪ A2 ∪ ... ∪ An ) =P(A1 )+P(A2 )+...+P(An ) . ñỏ. Lấy ngẫu nhiên từ hộp ra 3 viên phấn. Tính xác suất b) Biến cố tùy ý ñể lấy ñược ít nhất 1 viên phấn màu ñỏ. • A và B là hai biến cố tùy ý thì: P(A ∪ B) = P(A) + P(B) − P(AB) . VD 2. Có 33 học sinh tham dự kỳ thi chọn học sinh giỏi • Họ {Ai} (i = 1, 2,…, n) các biến cố tùy ý thì: gồm 2 vòng thi. Biết rằng có 17 học sinh thi ñỗ vòng 1; 14 học sinh thi ñỗ vòng 2 và 11 học sinh trượt cả hai  n  n  P  ∪ Ai  = ∑ P(Ai ) − ∑ P(Ai A j ) vòng thi. Chọn ngẫu nhiên một học sinh trong danh sách  i =1  i =1 i< j . dự thi. Tìm xác suất ñể học sinh ñó chỉ thi ñỗ duy nhất 1 + ∑ P(Ai A jAk )+...+(−1) n−1 P(A1A2 ...An ) trong 2 vòng thi. i < j 0 . Xác suất có ñiều kiện của A với ñiều kiện B VD 3. Một hộp có 10 vé, trong ñó có 3 vé trúng thưởng. Người thứ nhất ñã bốc 1 vé không trúng thưởng. Tính ñã xảy ra ñược ký hiệu và ñịnh nghĩa: xác suất ñể người thứ 2 bốc ñược vé trúng thưởng (mỗi P(AB) người chỉ bốc 1 vé). P( A B ) = . P(B) b) Công thức nhân • Xác suất có ñiều kiện cho phép chúng ta sử dụng thông • A và B là 2 biến cố ñộc lập nếu B có xảy ra hay không tin về sự xảy ra của 1 biến cố ñể dự báo xác suất xảy ra cũng không ảnh hưởng ñến khả năng xảy ra A và ngược biến cố khác. lại, nghĩa là P ( A B ) = P(A) và P ( B A ) = P(B) . • Tính chất: 1) 0 ≤ P ( A B ) ≤ 1 ; Khi ñó ta có P(AB) = P(A).P(B) . 2) P ( B B ) = 1 ; ( ) 3) P A B = 1 − P ( A B ) ; • Với A, B không ñộc lập (phụ thuộc) thì: P(AB) = P(B)P ( A B ) = P(A)P ( B A ) . Trang 3
  4. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK VD 4. Một lô hàng có 100 sản phẩm trong ñó có 10 phế 3.3. Công thức xác suất ñầy ñủ và Bayes. phẩm. Kiểm tra liên tiếp không hoàn lại 5 sản phẩm, nếu a) Công thức xác suất ñầy ñủ có ít nhất 1 phế phẩm thì không nhận lô hàng ñó. Tính • Cho họ các biến cố {Ai} (i = 1, 2,…, n) ñầy ñủ và B là xác suất ñể nhận lô hàng. biến cố bất kỳ trong phép thử, ta có: VD 5. Một lô hàng gồm 12 sản phẩm trong ñó có 8 sản n phẩm tốt và 4 phế phẩm. Rút ngẫu nhiên 1 sản phẩm từ P(B) = ∑ P(Ai )( B Ai ) . lô hàng và không ñể ý tới sản phẩm ñó, sau ñó rút tiếp i =1 sản phẩm thứ 2. Tính xác suất ñể sản phẩm thứ hai là tốt. = P(A1 )P ( B A1 ) + ... + P(An )P ( B An ) VD 6. Một cầu thủ bóng rổ có 4 quả bóng ñang ném từng quả vào rổ. Nếu bóng vào rổ hoặc hết bóng thì cầu VD 7. Một ñám ñông có số ñàn ông bằng nửa số ñàn bà. thủ ngừng ném. Biết xác suất vào rổ của quả bóng thứ 1, Xác suất ñể ñàn ông bị bịnh tim là 0,06 và ñàn bà là 2, 3 và 4 lần lượt là 90%, 80%, 85% và 70%. 0,0036. Chọn ngẫu nhiên 1 người từ ñám ñông, tính xác Tính xác suất cầu thủ ném ñược bóng vào rổ. suất ñể người này bị bịnh tim. b) Công thức Bayes VD 9. Có 3 bao lúa cùng loại. Bao 1 nặng 20kg chứa 1% • Cho họ các biến cố {Ak} (k = 1, 2,…, n) ñầy ñủ và B là hạt lép, bao 2 nặng 30kg chứa 1,2% hạt lép và bao 3 biến cố bất kỳ trong phép thử. Xác suất ñể xuất hiện Ak nặng 50kg chứa 1,5% hạt lép. Trộn cả 3 bao lại rồi bốc sau khi ñã xuất hiện B là: ngẫu nhiên 1 hạt thì ñược hạt lép. P(Ak )P ( B Ak ) Tính xác suất ñể hạt lép này là của bao thứ ba. P ( Ak B ) = . n VD 10. Ba kiện hàng ñều có 20 sản phẩm với số sản ∑ P(Ai )P ( B Ai ) phẩm tốt tương ứng là 12, 15, 18. Lấy ngẫu nhiên 1 kiện i =1 hàng (giả sử 3 kiện hàng có cùng khả năng) rồi từ kiện VD 8. Tỷ số ôtô tải và ôtô con ñi qua ñường có trạm ñó lấy tùy ý ra 1 sản phẩm. bơm dầu là 5/2. Xác suất ñể 1 ôtô tải ñi qua ñường này a) Tính xác suất ñể sản phẩm chọn ra là tốt. vào bơm dầu là 10%; ôtô con là 20%. Có 1 ôtô qua b) Giả sử sản phẩm chọn ra là tốt, tính xác suất ñể sản ñường ñể bơm dầu, tính xác suất ñể ñó là ôtô tải. phẩm ñó thuộc kiện hàng thứ hai. Chương II. BIẾN (ðẠI LƯỢNG) NGẪU NHIÊN §1. BIẾN NGẪU NHIÊN VÀ LUẬT PHÂN PHỐI XÁC SUẤT 1.1. Khái niệm và phân loại biến ngẫu nhiên b) Phân loại biến ngẫu nhiên a) Khái niệm • Biến ngẫu nhiên (bnn) ñược gọi là rời rạc nếu các giá • Một biến số ñược gọi là ngẫu nhiên nếu trong kết quả trị có thể có của nó lập nên 1 tập hợp hữu hạn hoặc của phép thử nó sẽ nhận một và chỉ một trong các giá ñếm ñược. trị có thể có của nó tùy thuộc vào sự tác ñộng của các • Biến ngẫu nhiên ñược gọi là liên tục nếu các giá trị có nhân tố ngẫu nhiên. thể có của nó lấp ñầy 1 khoảng trên trục số. • Các biến ngẫu nhiên ñược ký hiệu: X, Y, Z, …còn các VD 2. + Biến X trong VD 1 là bnn rời rạc (tập hữu hạn). giá trị của chúng là x, y, z,… + Gọi Y là số người ñi qua 1 ngã tư trên ñường phố thì Y VD 1. là bnn rời rạc (tập ñếm ñược). Khi tiến hành gieo n hạt ñậu ta chưa thể biết có bao VD 3. + Bắn 1 viên ñạn vào bia, gọi X là “khoảng cách nhiêu hạt sẽ nảy mầm, số hạt nảy mầm có thể là 0, 1, …, từ ñiểm chạm của viên ñạn ñến tâm của bia” thì X là n. Kết thúc phép thử gieo hạt thì ta biết chắc chắn có bao biến ngẫu nhiên liên tục. nhiêu hạt nảy mầm. Gọi X là số hạt nảy mầm thì là X + Gọi Y là “sai số khi ño 1 ñại lượng vật lý” thì Y là biến ngẫu nhiên và X = {0, 1, 2, …, n}. biến ngẫu nhiên liên tục. 1.2. Luật phân phối xác suất của biến ngẫu nhiên Trong ñó: • Luật phân phối xác suất của biến ngẫu nhiên là một n ∞ cách biểu diễn quan hệ giữa các giá trị của biến ngẫu pi ≥ 0 ; ∑ pi = 1 ; ∑ pi = 1 (vô hạn); nhiên với các xác suất tương ứng mà nó nhận các giá i =1 i =1 trị ñó. P(a < X < b) = ∑ pi . 1.2.1. Phân phối xác suất của biến ngẫu nhiên a
  5. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK VD 5. Xác suất ñể 1 người thi ñạt mỗi khi thi lấy bằng Chú ý lái xe là 0,3. Người ñó thi cho ñến khi ñạt mới thôi. 1) Nhiều khi người ta dùng ký hiệu fX(x) ñể chỉ hàm mật Gọi X là số lần người ñó dự thi. ñộ xác suất của X. Tìm phân phối xác suất của X và tính xác suất ñể người a ñó phải thi không ít hơn 2 lần. b) Trường hợp liên tục 2) Do P(X = a) = ∫ f(x)dx = 0 nên ta không quan a • Cho biến ngẫu nhiên liên tục X. Hàm f(x), x ∈ ℝ tâm ñến xác suất ñể X nhận giá trị cụ thể. Suy ra ñược gọi là hàm mật ñộ xác suất của X nếu thỏa: P(a ≤ X < b) = P(a < X ≤ b) = P(a ≤ X ≤ b) +∞ b 1) f(x) ≥ 0, ∀x ∈ ℝ ; 2) ∫ f(x)dx = 1 ; = P(a < X < b) = ∫ f(x)dx . −∞ a b 3) Về mặt hình học, xác suất biến ngẫu nhiên (bnn) X 3) P(a < X < b) = ∫ f(x)dx (a < b). nhận giá trị trong (a; b) bằng diện tích hình thang cong a giới hạn bởi x = a, x = b, y = f(x) và trục Ox. +∞ 1.2.2. Hàm phân phối xác suất 4) Nếu f(x) thỏa f(x) ≥ 0, ∀x ∈ ℝ và ∫ f(x)dx = 1 • Hàm phân phối xác suất của biến ngẫu nhiên X, ký hiệu F(x) hoặc FX(x), là xác suất ñể X nhận giá trị nhỏ −∞ thì f(x) là hàm mật ñộ xác suất của 1 bnn nào ñó. hơn x (với x là số thực bất kỳ). F(x) = P(X < x), ∀x ∈ ℝ . 4x 3 , x ∈ (0; 1) VD 6. Chứng tỏ f (x) =  là hàm mật ñộ – Hàm phân phối xác suất cho biết tỉ lệ phần trăm giá trị  0, x ∉ (0; 1) của X nằm bên trái của số x. xác suất của biến ngẫu nhiên X. – Với biến ngẫu nhiên rời rạc X = {x1, x2, …, xn}: VD 7. Cho bnn X có hàm mật ñộ xác suất: F(x) = ∑ P(X = x i ) = ∑ pi . 0, x
  6. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK 1.3. Phân phối xác suất của hàm của biến ngẫu nhiên b) Trường hợp nhiều biến • Trong thực tế, ñôi khi ta xét bnn phụ thuộc vào 1 hay VD 13. Cho bảng: nhiều bnn khác ñã biết luật phân phối. Y –1 0 1 X Bài toán. Cho hàm ϕ(x) và bnn rời rạc X có phân phối 1 0,1 0,15 0,05 xác suất cho trước. Tìm phân phối xác suất của ϕ(x) . 2 0,3 0,2 0,2 a) Trường hợp 1 biến Lập bảng phân phối xác suất của: VD 12. Lập bảng phân phối xác suất của a) Y = 2X2 + X − 1 . Y = ϕ(X) = X2 + 2 , biết: b) Z = ϕ(X, Y) = 2X − Y + 5 . X –1 0 1 2 P 0,1 0,3 0,4 0,2 c) Z = ϕ(X, Y) = X2 − Y 2 . 1.4. Phân phối xác suất của bnn 2 chiều (X, Y) rời rạc b) Bảng phân phối xác suất ñồng thời của (X, Y) a) ðịnh nghĩa Y y1 y2 … yj … yn PX • Cặp 2 ñại lượng ngẫu nhiên rời rạc ñược xét ñồng thời X (X, Y) ñược gọi là 1 vector ngẫu nhiên rời rạc. x1 p11 p12 … p1j … p1n p1 Ký hiệu biến cố (X < x).(Y < y) = (X < x; Y < y). x2 p21 p22 … p2j … p2n p2 • Hàm phân phối xác suất ñồng thời của X và Y là: …. .................................................. ... F(x, y) = P(X < x; Y < y), ∀x, y ∈ ℝ . xi pi1 pi2 … pij … pin pi • X và Y ñược gọi là ñộc lập nếu: …. ……………………………….. … xm pm1 pm2 … pmj … pmn pm F(x, y) = FX (x).FY (y), ∀x, y ∈ ℝ . PY q1 q2 … qj … qn 1 Chú ý Pij = P(X = xi, Y = yj) (i = 1,…,m; j = 1,…,n) là xác suất 1) Nếu X, Y ñộc lập thì hàm phân phối ñồng thời của X, m n Y ñược xác ñịnh qua các hàm phân phối của X, của Y. 2) Chương trình chỉ xét hàm phân phối biên của X, Y. ñể X = xi, Y = yj và ∑ ∑ pij = 1 . i =1 j=1 c) Phân phối xác suất biên (lề) Tính chất. X và Y ñộc lập ⇔ pij = p i .q j, ∀i, j . Từ bảng phân phối xác suất ñồng thời của X, Y ta có: • Phân phối xác suất biên của X VD 14. X x1 x2 … xi … xm Cho bảng phân phối xác suất ñồng thời của X và Y: P X p1 p2 … pi … pm Y X 10 20 30 40 n n ∑ pij = ∑ p(X = xi , Y = y j ) = p(X = xi ) = pi . 10 20 0,2 0,1 0,04 0,36 0,01 0,09 0 0 j=1 j=1 • Phân phối xác suất biên của Y 30 0 0,05 0,1 0 Y y1 y2 … yi … yn 40 0 0 0 0,05 P Y q1 q2 … qi … qn m m a) Tìm phân phối biên của X, của Y. ∑ pij = ∑ p(X = x i , Y = y j ) = p(Y = y j ) = q j . b) Xét xem X và Y có ñộc lập không ? c) Tìm phân phối xác suất của Z = X + Y. i =1 i =1 §2. CÁC ðẶC TRƯNG SỐ (THAM SỐ ðẶC TRƯNG) CỦA BIẾN NGẪU NHIÊN • Những thông tin cô ñọng phản ánh từng phần về biến 2.1. Kỳ vọng toán ngẫu nhiên giúp ta so sánh giữa các ñại lượng với nhau 2.1.1. ðịnh nghĩa ñược gọi là các ñặc trưng số. a) Biến ngẫu nhiên rời rạc Có ba loại ñặc trưng số: • Cho X = {x1, x2,…, xn} với xác suất tương ứng là p1, p2,…, pn thì kỳ vọng toán (gọi tắt là kỳ vọng) của X, ký – Các ñặc trưng số cho xu hướng trung tâm của bnn: hiệu EX hay M(X), là: Kỳ vọng toán, Trung vị, Mod,… n EX = x1p1 + x2 p2 + ... + x n pn = ∑ x i pi . – Các ñặc trưng số cho ñộ phân tán của bnn: i =1 Phương sai, ðộ lệch chuẩn, Hệ số biến thiên,… VD 1. Một lô hàng gồm 10 sản phẩm tốt và 2 phế phẩm. Lấy ngẫu nhiên 2 sản phẩm từ lô hàng ñó, gọi X là số – Các ñặc trưng số cho dạng phân phối xác suất. phế phẩm trong 2 sản phẩm lấy ra. Lập bảng phân phối xác suất và tính kỳ vọng của X. Trang 6
  7. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK b) Biến ngẫu nhiên liên tục VD 3. Thời gian chờ mua hàng của khách là biến ngẫu +∞ nhiên liên tục T (ñơn vị: phút) có hàm mật ñộ xác suất  4 3 • Bnn X có hàm mật ñộ là f(x) thì: EX = ∫ x.f(x)dx .  t , t ∈ (0; 3) −∞ f(t) =  81 . Tính thời gian trung bình VD 2. Tìm kỳ vọng của biến ngẫu nhiên X có hàm mật  0, t ∉ (0; 3)   3 2  (x + 2x), x ∈ (0; 1) chờ mua hàng của 1 khách hàng. ñộ xác suất f(x) = 4 . VD 4. Cho biến ngẫu nhiên X có hàm mật ñộ xác suất  0, x ∉ (0; 1)   ax + bx 2 , x ∈ (0; 1) f(x) =  . Chú ý  0, x ∉ (0; 1) 1) Nếu X = {x ∈ A} , X liên tục thì EX ∈ A .   1 2) Nếu X = {x1,…, xn} thì: Cho biết EX = 0,6 hãy tính P  X <  . EX ∈ [min{x1,..., x n }; max{x1,..., x n }] .  2  2.1.2. Ý nghĩa của EX • Kỳ vọng là giá trị trung bình (theo xác suất) của biến VD 6. Một dự án xây dựng ñược viện C thiết kế cho cả 2 ngẫu nhiên X, nó phản ánh giá trị trung tâm của phân bên A và B xét duyệt một cách ñộc lập. Xác suất (khả phối xác suất của X. năng) ñể A và B chấp nhận dự án này khi xét duyệt thiết • Trong thực tế sản xuất hay kinh doanh nếu cần chọn kế là 70% và 80%. Nếu chấp nhận dự án thì bên A phải phương án cho năng suất (hay lợi nhuận) cao, người ta trả cho C là 400 triệu ñồng, còn ngược lại thì phải trả chọn phương án sao cho năng suất kỳ vọng (hay lợi 100 triệu ñồng. Nếu chấp nhận dự án thì bên B phải trả nhuận kỳ vọng) cao. cho C là 1 tỉ ñồng, còn ngược lại thì phải trả 300 triệu VD 5. Theo thống kê, một người Mỹ 25 tuổi sẽ sống ñồng. Biết chi phí cho thiết kế của C là 1 tỉ ñồng và 10% thêm trên 1 năm có xác suất là 0,992 và người ñó chết thuế doanh thu. trong vòng 1 năm tới là 0,008. Một chương trình bảo Hỏi viện C có nên nhận thiết kế hay không? hiểm ñề nghị người ñó bảo hiểm sinh mạng cho 1 năm với số tiền chi trả là 10000 USD, phí bảo hiểm là 100 USD. Hỏi công ty ñó có lãi không? 2.1.3. Tính chất của EX VD 7. Tính EY với Y = ϕ(X) = X2 − 3 , biết X có 1) E(C) = C với C là hằng số. bảng phân phối xác suất: 2) E(CX) = C.EX. X –1 0 1 2 3) E(X ± Y) = EX ± EY, với X và Y là hai biến ngẫu nhiên. P 0,1 0,3 0,35 0,25 4) E(XY) = EX.EY nếu X và Y là hai bnn ñộc lập. VD 8. Cho bnn X có hàm mật ñộ xác suất: 5) Nếu Y = ϕ(X) thì:  2  , x ∈ [1; 2] f(x) =  x2 .  ∑ ϕ(x i )p i , neáu X rôøi raïc   i  0, x ∉ [1; 2] EY =  +∞ . a) Tính EX.  ϕ(x)f(x)dx, neáu X lieân tuïc  ∫ 2  −∞ b) Tính kỳ vọng của Y = X5 − . X 2.2. Phương sai VD 9. Tính phương sai của biến ngẫu nhiên X có bảng 2.2.1. ðịnh nghĩa phân phối xác suất: • Phương sai của biến ngẫu nhiên X, ký hiệu VarX hay X 1 2 3 VX hay D(X), ñược xác ñịnh: P 0,2 0,7 0,1 VD 10. VarX = E ( X − EX ) = E(X2 ) − ( EX ) 2 2 Tính phương sai của biến ngẫu nhiên X trong VD 2.   2  ∑ x i2 .p i −  ∑ x i .pi  , neáu X rôøi raïc  i  i  VD 11. Cho biến ngẫu nhiên X có hàm mật ñộ xác suất: =  +∞   3  +∞ 2  (1 − x 2 ), x ≤ 1    f(x) =  4 .  ∫ x .f(x)dx −  ∫ x.f(x)dx  , neáu X lieân tuïc 2  0, x > 1  −∞  −∞   Tìm phương sai của biến ngẫu nhiên Y = 2X2. Trang 7
  8. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK 2.2.2. Ý nghĩa của VarX • Do X – EX là ñộ lệch giữa giá trị của X so với trung VD 12. Năng suất của hai máy tương ứng là các bnn X, bình của nó nên phương sai là trung bình của bình Y (ñơn vị: sản phẩm/phút) có bảng phân phối xác suất: phương ñộ lệch ñó. Phương sai dùng ñể ño mức ñộ phân tán của X quanh kỳ vọng. Nghĩa là: phương sai nhỏ thì X 1 2 3 4 ñộ phân tán nhỏ nên ñộ tập trung lớn và ngược lại. P 0,3 0,1 0,5 0,1 • Trong kỹ thuật, phương sai ñặc trưng cho ñộ sai số của và thiết bị. Trong kinh doanh, phương sai ñặc trưng cho ñộ Y 2 3 4 5 rủi ro ñầu tư. P 0,1 0,4 0,4 0,1 • Do ñơn vị ño của VarX bằng bình phương ñơn vị ño của X nên ñể so sánh ñược với các ñặc trưng khác người Nếu phải chọn mua 1 trong 2 loại máy này thì ta nên ta ñưa vào khái niệm ñộ lệch tiêu chuẩn chọn máy nào? σ(X) = VarX . 2.2.3. Tính chất của VarX – Nếu X rời rạc thì medX = xi với 1) VarX ≥ 0 ; VarC = 0, với C là hằng số. 1 F(x i ) ≤ ≤ F(x i +1 ) . 2) Var(CX) = C2.VarX; σ(CX) = C .σX . 2 3) Nếu a và b là hằng số thì Var(aX + b) = a2.VarX. – Nếu X liên tục thì medX = m với m 4) Nếu X và Y ñộc lập thì: Var(X ± Y) = VarX + VarY ; F(m) = ∫ f(x)dx = 0, 5 . −∞ σ(X ± Y) = σ2 (X) + σ2 (Y) . 2.3. Trung vị và Mod VD 13. Cho bnn X có bảng phân phối xác suất: 2.3.1. Trung vị • Trung vị của biến ngẫu nhiên X, ký hiệu medX, là số m X 1 2 3 4 5 1 1 P 0,1 0,2 0,15 0,3 0,45 thỏa P(X < m) ≤ và P(X > m) ≤ . Khi ñó ta có medX = 4. 2 2 VD 14. Tìm med của bnn X có bảng phân phối xác suất: VD 16. Cho bnn X có bảng phân phối xác suất: X –1 0 1 2 P 0,25 0,15 0,30 0,30 X 0 1 2 4 5 8  4 P 0,1 0,2 0,3 0,05 0,25 0,1  , x≥1 VD 15. Cho hàm f(x) =   x5 . Khi ñó ta có modX = 2.  VD 17. Tìm medX và modX với biến ngẫu nhiên X có  0, x
  9. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK 3.1.2. Phân phối nhị thức VD 3. Một bà mẹ sinh 2 con (mỗi lần sinh 1 con) với xác a) Công thức Bernoulli suất sinh con trai là 0,51. Gọi X là số con trai trong 2 lần • Dãy phép thử Bernoulli là dãy n phép thử thỏa 3 ñiều sinh. Lập bảng phân phối xác suất của X. kiện: VD 4. Một máy sản xuất lần lượt từng sản phẩm với xác 1) Các phép thử của dãy ñộc lập với nhau. suất 1 phế phẩm là 1%. 2) Trong mỗi phép thử ta chỉ quan tâm ñến 1 biến cố A, a) Cho máy sản xuất ra 10 sản phẩm, tính xác suất có 2 nghĩa là chỉ có A và A xuất hiện. phế phẩm. 3) Xác suất xuất hiện A trong mọi phép thử của dãy luôn b) Máy cần sản xuất ít nhất bao nhiêu sản phẩm ñể xác là hằng số: suất có ít nhất 1 phế phẩm nhỏ hơn 3%.  4x 3 , x ∈ (0; 1) ( ) P(A) = p, P A = 1 − p = q, (0 < p < 1) . VD 5. Cho X có hàm mật ñộ f(x) =   . • Cho dãy n phép thử Bernoulli, xác suất xuất hiện k lần  0, x ∉ (0; 1) Tính xác suất ñể trong 3 phép thử ñộc lập có 2 lần X biến cố A là: pk = Ckn pk q n−k , p = P(A) . nhận giá trị trong khoảng (0, 25; 0,5) . b) ðịnh nghĩa VD 6. Một nhà vườn trồng trồng 5 cây lan quý, với xác • Phân phối nhị thức là phân phối của biến ngẫu nhiên suất nở hoa của mỗi cây trong 1 năm là 0,8. rời rạc X = {0; 1; 2; …; n} với xác suất tương ứng là: a) Lập bảng phân phối xác suất của số cây lan trên nở pk = P(X = k) = Ckn p k q n−k . hoa trong 1 năm. b) Giá 1 cây lan nở hoa là 1,2 triệu ñồng. Giả sử nhà Ký hiệu: X ∈ B(n, p) hay X ~ B(n, p). vườn bán hết những cây lan nở hoa thì mỗi năm nhà Chú ý vườn thu ñược chắc chắn nhất là bao nhiêu tiền? • Khi n = 1 thì X ∈ B(1, p) ≡ B(p), khi ñó X còn ñược c) Nếu muốn trung bình mỗi năm có 10 cây lan nở hoa gọi là có phân phối không – một hay Bernoulli. thì nhà vườn phải trồng mấy cây lan? VD 7. Một lô hàng chứa 20 sản phẩm trong ñó có 4 phế c) Các số ñặc trưng phẩm. Chọn liên tiếp 3 lần (có hoàn lại) từ lô hàng, mỗi EX = np; VarX = npq; lần chọn ra 4 sản phẩm. Tính xác suất ñể trong 3 lần có . ModX = x 0 , np − q ≤ x 0 ≤ np + p ñúng 1 lần chọn có nhiều nhất 3 phế phẩm. 3.1.3. Phân phối Poisson Chẳng hạn, số xe qua 1 trạm hoặc số cuộc ñiện thoại tại a) Bài toán dẫn ñến phân phối Poisson 1 trạm công cộng… có phân phối Poisson. • Gọi X là số lần xuất hiện biến cố A tại những thời ñiểm ngẫu nhiên trong khoảng thời gian (t1; t2) thỏa mãn hai b) ðịnh nghĩa ñiều kiện: • Biến ngẫu nhiên X có phân phối Poisson với tham số 1) Số lần xuất hiện biến cố A trong khoảng (t1; t2) không λ > 0 (trung bình số lần xuất hiện A) nếu X nhận các ảnh hưởng ñến xác suất xuất hiện A trong khoảng thời giá trị 0, 1, 2,…, n,… với xác suất tương ứng là: gian kế tiếp. e−λ .λ k 2) Số lần xuất hiện biến cố A trong 1 khoảng thời gian pk = P(X = k) = . bất kỳ tỉ lệ với ñộ dài của khoảng ñó. k! c) Các số ñặc trưng Khi ñó X có phân phối Poisson, ký hiệu X ∈ P(λ) với EX = VarX = λ; ModX = x 0 , λ − 1 ≤ x 0 ≤ λ . λ = c(t2 − t1 ) > 0 , c: cường ñộ xuất hiện A. VD 8. Trung bình cứ 3 phút có 1 khách ñến quầy mua 3.2. Phân phối xác suất của biến ngẫu nhiên liên tục hàng. Tính xác suất ñể trong 30 giây có 2 khách ñến 3.2.1. Phân phối chuẩn quầy mua hàng. a) ðịnh nghĩa VD 9. Một trạm ñiện thoại trung bình nhận ñược 300 • Bnn X ñược gọi là có phân phối chuẩn với tham số µ cuộc gọi trong 1 giờ. a) Tính xác suất ñể trạm nhận ñược ñúng 2 cuộc gọi và σ2 (σ > 0) , ký hiệu X ∈ N ( µ, σ2 ) , nếu hàm mật trong 1 phút. ñộ phân phối xác suất của X có dạng: b) Tính xác suất ñể trạm nhận ñược ñúng 5 cuộc gọi (x −µ )2 1 − trong 3 phút. f(x) = e 2σ2 , x ∈ ℝ. c) Tính xác suất ñể 2 trong 3 phút liên tiếp, mỗi phút σ 2π trạm nhận ñược nhiều nhất 1 cuộc gọi. VD 10. Trung bình 1 ngày (24 giờ) có 10 chuyến tàu vào Các số ñặc trưng cảng Cam Ranh. Chọn ngẫu nhiên liên tiếp 3 giờ trong 1 ModX = MedX = EX = µ; VarX = σ2 . ngày. Tính xác suất ñể 2 trong 3 giờ ấy có ñúng 1 tàu vào cảng. Trang 9
  10. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK b) Phân phối chuẩn ñơn giản x t2 1 − • Cho X ∈ N ( µ, σ2 ) , ñặt T = X−µ thì T có phân Hàm ϕ(x) = ∫ 2π e ( x ≥ 0 ) ñược gọi là hàm 2 dt σ 0 phối chuẩn ñơn giản T ∈ N ( 0, 1 ) . Laplace (giá trị ñược cho trong bảng B). • Hàm mật ñộ phân phối xác suất của T: Tính chất của hàm Laplace (dùng ñể tra bảng) 1 − t2 1) ϕ(−x) = −ϕ(x) (hàm lẻ); f(t) = e 2 (giá trị ñược cho trong bảng A). 2π 2) với x > 5 thì ϕ(x) ≈ 0, 5 ; • Công thức xác suất: 3) P(T < x) = 0, 5 + ϕ(x) . b − t2 Phân vị mức α 1 P(a < T < b) = ∫ 2π e 2 dt . • Ta gọi tα là phân vị mức α của T nếu: a P ( T > tα ) = α . c) Phương pháp tính xác suất phân phối chuẩn tổng VD 12. Thống kê ñiểm thi X (ñiểm) trong một kỳ tuyển quát sinh ðại học môn toán của học sinh cả nước cho thấy X • Cho X ∈ N ( µ, σ2 ) , ñể tính P(a < X < b) ta ñặt là biến ngẫu nhiên với X ∈ N(4; 2, 25) . Tính tỉ lệ ñiểm thi X ≥ 5,5. a−µ b−µ α= , β= σ σ VD 13. Tuổi thọ của 1 loại bóng ñèn là X (năm) với ⇒ P(a < X < b) = ϕ(β) − ϕ(α) , tra bảng B ta ñược X ∈ N(4, 2; 6, 25) . Khi bán 1 bóng ñèn thì lãi ñược 100 kết quả. ngàn ñồng nhưng nếu bóng ñèn phải bảo hành thì lỗ 300 VD 11. Thời gian X (phút) của 1 khách chờ ñược phục ngàn ñồng. Vậy ñể có tiền lãi trung bình khi bán mỗi vụ tại 1 cửa hàng là bnn với X ∈ N ( 4, 5; 1,21 ) . bóng ñèn loại này là 30 ngàn ñồng thì cần phải quy ñịnh thời gian bảo hành là bao nhiêu? a) Tính xác suất khách phải chờ ñể ñược phục vụ từ 3,5 phút ñến 5 phút; không quá 6 phút. VD 14. Cho X có phân phối chuẩn với EX = 10 và b) Tính thời gian tối thiểu t nếu xác suất khách phải chờ vượt quá t là không quá 5%. P ( 10 < X < 20 ) = 0, 3 . Tính P ( 0 < X ≤ 15 ) . VD 15. Một công ty cần mua 1 loại thiết bị có ñộ dày từ 3.2.3. Phân phối χ2(n) (xem giáo trình) 0,118cm ñến 0,122cm. Có 2 cửa hàng cùng bán loại thiết bị này với ñộ dày là các biến ngẫu nhiên có phân phối 3.2.4. Phân phối Student T(n) (với n bậc tự do) chuẩn N(µ, σ2). Giá bán của cửa hàng X là 3 • Cho T ∈ N(0, 1) và Y ∈ χ2 (n) thì USD/hộp/1000 cái và cửa hàng Y là 2,6 USD/hộp/1000 cái. Chỉ số ñộ dày trung bình µ (cm) và ñộ lệch chuẩn σ T X= ∈ T(n) có hàm mật ñộ xác suất: (cm) ñược cho trong bảng: Y Cửa hàng µ (cm) σ (cm) n I 0,12 0,001  n + 1  II 0,12 0,0015 Γ   − n +1  2   x2  2 Hỏi công ty nên mua loại thiết bị này ở cửa hàng nào? f(x) = 1 +  .  n   n  Chú ý. Nếu X ∈ N ( µ, σ2 ) thì:  nπ.Γ    2  aX + b ∈ N ( aµ + b, a σ2 ) . Giá trị ñược của t(n) ñược cho trong bảng C. Chương III. ðỊNH LÝ GIỚI HẠN TRONG XÁC SUẤT §1. MỘT SỐ LOẠI HỘI TỤ TRONG XÁC SUẤT VÀ CÁC ðỊNH LÝ (Hệ ñại học) 1.1. Hội tụ theo xác suất – Luật số lớn 1 n a) ðịnh nghĩa ⇔ n ∑ ( Xi − EXi )  P →0 . • Dãy biến ngẫu nhiên {Xi} (i = 1, 2,…, n) ñược gọi là i =1 hội tụ theo xác suất ñến biến ngẫu nhiên X nếu: ∀ω ∈ Ω, ∀ε > 0 : lim P ( X n (ω) − X(ω) ≥ ε ) = 0 . b) Bất ñẳng thức Tchébyshev n →∞ • Nếu biến ngẫu nhiên X có EX và VarX hữu hạn thì: Ký hiệu: Xn  P → X (n → ∞) . VarX ∀ε > 0 : P ( X − EX ≥ ε ) ≤ • Họ biến ngẫu nhiên {Xi} (i = 1, 2,…, n) ñược gọi là ε2 tuân theo luật số lớn (dạng Tchébyshev) nếu: hay  1 n n  VarX  1 ∀ε > 0 : lim P  ∑ Xi − ∑ EXi < ε  = 1  P ( X − EX < ε ) ≥ 1 − . n →∞   n i =1 n i =1  ε2 Trang 10
  11. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK VD (tham khảo). Thu nhập trung bình hàng năm của c) ðịnh lý luật số lớn Tchébyshev dân cư 1 vùng là 700USD với ñộ lệch chuẩn 120USD. ðịnh lý Hãy xác ñịnh một khoảng thu nhập hàng năm xung • Nếu họ các biến ngẫu nhiên {Xi} (i = 1, 2,…, n) ñộc quanh giá trị trung bình của ít nhất 95% dân cư vùng ñó. lập từng ñôi có EXi hữu hạn và VarXi bị chặn trên bởi Giải. Gọi X(USD) là thu nhập hàng năm của dân cư hằng C thì: vùng ñó. Ta có:  1 n n   1 VarX ∀ε > 0 : lim P  ∑ Xi − ∑ EXi ≥ ε  = 0 . P ( X − EX < ε ) ≥ 1 − n →∞   n i =1 n i =1  ε2 Hệ quả 1202 • Nếu họ các biến ngẫu nhiên {Xi} (i = 1, 2,…, n) ñộc ⇔ P ( X − 700 < ε ) ≥ 1 − = 0, 95 ε2 lập từng ñôi có EXi = µ và VarXi = σ2 thì: ⇒ ε = 536, 656USD . 1 n Vậy ít nhất 95% dân cư vùng ñó có thu nhập hàng năm ∑ n i =1 P Xi →µ . trong khoảng (163,344USD; 1236,656USD). 1.2. Hội tụ yếu – ðịnh lý giới hạn trung tâm Ý nghĩa a) ðịnh nghĩa • Thể hiện tính ổn ñịnh của trung bình số học các biến • Dãy biến ngẫu nhiên {Xi} (i = 1, 2,…, n) ñược gọi là ngẫu nhiên ñộc lập cùng phân phối và có phương sai hữu hội tụ yếu hay hội tụ theo phân phối ñến b.n.n X nếu: hạn. lim Fn (x) = F(x), ∀x ∈ C(F) . n →∞ • ðể ño 1 ñại lượng vật lý nào ñó ta ño n lần và lấy trung Trong ñó, C(F) là tập các ñiểm liên tục của F(x). bình các kết quả làm giá trị thực của ñại lượng cần ño. d Ký hiệu: Xn   d → X hay Fn   →F . • Áp dụng trong thống kê là dựa vào một mẫu khá nhỏ ñể kết luận tổng thể. Chú ý P d Nếu Xn → X thì Xn   →X . §2. CÁC LOẠI XẤP XỈ PHÂN PHỐI XÁC SUẤT b) ðịnh lý Liapounop (giới hạn trung tâm) 2.1. Liên hệ giữa phân phối Siêu bội và Nhị thức • Cho họ các biến ngẫu nhiên {Xi} (i = 1, 2,…, n) ñộc • Nếu n cố ñịnh, N tăng vô hạn và n n NA lập từng ñôi. ðặt Y = ∑ Xi , µ= ∑ EXi , N → p (0 ≠ p ≠ 1) i =1 i =1 n −k n CkN CN − NA ∑ VarXi . Nếu EXi, VarXi hữu hạn và → Ckn p k q n−k . d σ2 = thì A   n i =1 CN 3 Xấp xỉ phân phối siêu bội bằng Nhị thức n E Xi − EXi lim ∑ = 0 thì Y ∈ N ( µ, σ2 ) . • Nếu N khá lớn và n rất nhỏ so với N (n < 0,05N) thì n →∞ i =1 σ3 N Ý nghĩa X ∼ B(n; p), p = A . N • Dùng ñịnh lý giới hạn trung tâm ñể tính xấp xỉ (gần VD 1. Một vườn lan có 10000 cây sắp nở hoa, trong ñó ñúng) các xác suất. có 1000 cây hoa màu ñỏ. Chọn ngẫu nhiên 20 cây lan • Xác ñịnh các phân phối xấp xỉ ñể giải quyết các vấn ñề trong vườn này. của lý thuyết ước lượng, kiểm ñịnh,… Tính xác suất ñể chọn ñược 5 cây lan có hoa màu ñỏ. 2.2. Liên hệ giữa Nhị thức và Poisson 2.3. ðịnh lý giới hạn Moivre – Laplace • Nếu n → ∞, p → 0, np → λ thì: ðịnh lý 1 (giới hạn ñịa phương) e−λ .λ k Ckn pk q n−k  d → . k! • Gọi pk là xác suất xuất hiện k lần biến cố A trong n Xấp xỉ phân phối Nhị thức bằng Poisson phép thử Bernoulli với P(A) = p (p không quá gần 0 và • Cho X có phân phối nhị thức B(n, p), λ = np . Khi ñó: npq.Pn (k) a) Nếu n lớn và p khá bé (gần bằng 0) thì X ∼ P(λ) . không quá gần 1) thì lim = 1. n →∞ f(x k ) b) Nếu n lớn và p cũng khá lớn (gần bằng 1) thì X ∼ P(λ) . 1 − x2 k − np VD 2. Một lô hàng có 0,1% phế phẩm. Tìm xác suất ñể Trong ñó, f(x) = e 2, xk = hữu hạn. 2π npq khi chọn ra 1000 sản phẩm có: a) Tất cả ñều tốt; b) Không quá 2 phế phẩm. Trang 11
  12. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK ðịnh lý 2 (giới hạn Moivre – Laplace) X − np VD 3. Trong một kho lúa giống có tỉ lệ hạt lúa lai là • Cho X ∈ B(n, p) và Sn = thì: 13%. Tính xác suất sao cho khi chọn 1000 hạt lúa giống npq trong kho thì có không quá 15 hạt lúa lai. F Sn → N(0, 1) . VD 4. Một khách sạn nhận ñặt chỗ của 325 khách hàng Xấp xỉ Nhị thức bằng phân phối chuẩn cho 300 phòng vào ngày 1/1 vì theo kinh nghiệm của • Cho X ∈ B(n, p) , nếu n khá lớn, p không quá gần 0 những năm trước cho thấy có 10% khách ñặt chỗ nhưng và 1 thì X ∼ N(µ; σ2 ) với µ = np, σ2 = npq . không ñến. Biết mỗi khách ñặt 1 phòng, tính xác suất: Khi ñó: a) Có 300 khách ñến vào ngày 1/1 và nhận phòng. 1  k − µ  1) P(X = k) = .f   (tra bảng A, f(–x) = f(x)). σ  σ  b) Tất cả các khách ñến vào ngày 1/1 ñều nhận ñược  k − µ   k − µ  phòng. 2) P(k1 ≤ X ≤ k 2 ) = ϕ  2  − ϕ  1 .  σ   σ  ………………………………………………………………….. PHẦN II. LÝ THUYẾT THỐNG KÊ Chương IV. LÝ THUYẾT MẪU §1. KHÁI NIỆM VỀ PHƯƠNG PHÁP XÁC ðỊNH MẪU Nếu từ hồ ñó bắt lên 1 con cá rồi thả xuống, sau ñó tiếp 1.1. Mẫu và tổng thể (ñám ñông) tục bắt con khác, tiến hành 10 lần như thế ta ñược mẫu • Tập hợp có các phần tử là các ñối tượng mà ta nghiên có hoàn lại kích thước 10. cứu ñược gọi là tổng thể. Số phần tử của tổng thể ñược • Khi mẫu có kích thước lớn thì ta không phân biệt mẫu gọi là kích thước của tổng thể. có hoàn hay không hoàn lại. • Từ tổng thể ta chọn ra n phần tử thì n phần tử ñó ñược 1.2. Phương pháp xác ñịnh mẫu gọi là một mẫu có kích thước (cỡ mẫu) n. Mẫu ñược • Mẫu ñịnh tính là mẫu mà ta chỉ quan tâm ñến các phần chọn ngẫu nhiên một cách khách quan ñược gọi là mẫu tử của nó có tính chất A nào ñó hay không. ngẫu nhiên. VD 2. ðiều tra 100 hộ dân của một thành phố về thu VD 1. Khi nghiên cứu về số cá trong một hồ thì số cá nhập trong 1 năm. Nếu hộ có thu nhập dưới 10 triệu trong hồ là kích thước của tổng thể. Từ hồ ñó bắt lên 10 ñồng/năm là hộ nghèo. Thì trong 100 hộ ñược ñiều tra ta con cá thì ñược 1 mẫu không hoàn lại kích thước là 10. quan tâm ñến hộ nghèo (tính chất A). • Mẫu ñịnh lượng là mẫu mà ta quan tâm ñến một yếu tố về lượng (như chiều dài, cân nặng,…) của các phần tử trong mẫu. VD 4. Chiều cao của cây bạch ñàn là biến ngẫu nhiên có VD 3. Cân 100 trái dưa gang ñược chọn ngẫu nhiên từ 1 phân phối chuẩn. ðo ngẫu nhiên 5 cây X1, X2,…, Xn ta cách ñồng là mẫu ñịnh lượng. ñược X1=3,5m; X2=3,2m; X3=2,5m; X4=4,1m; X5=3m. Khi ñó, {X1, X2,…, Xn} là mẫu tổng quát có phân phối • Mẫu có kích thước n là tập hợp của n biến ngẫu nhiên chuẩn và {3,5m; 3,2m; 2,5m; 4,1m; 3m} là mẫu cụ thể. ñộc lập X1, X2,…, Xn ñược lập từ biến ngẫu nhiên X và có cùng luật phân phối với X là mẫu tổng quát. Tiến • Xác suất nghiên cứu về tổng thể ñể hiểu về mẫu còn hành quan sát (cân, ño,…) từng biến Xi và nhận ñược thống kê thì ngược lại. các giá trị cụ thể Xi = xi, khi ñó ta ñược mẫu cụ thể x1, x2,…, xn. • Xét về lượng 1.3. Sắp xếp số liệu thực nghiệm – Trung bình tổng thể là µ = EX . 1.3.1. Sắp xếp theo các giá trị khác nhau • Giả sử mẫu (X1, X2,…, Xn) có k quan sát khác nhau là – Phương sai tổng thể σ2 = VarX là biểu thị cho mức X1, X2,…, Xk ( k ≤ n ) và Xi có tần số ni (số lần lặp lại) ñộ biến ñộng của dấu hiệu X. • Xét về chất với n1 + n 2 + ... + n k = n . Số liệu ñược sắp xếp theo – ðám ñông ñược chia thành 2 loại phần tử: loại có tính thứ tự tăng dần của Xi. chất A ñó mà ta quan tâm và loại không có tính chất A. – Gọi X = 0 nếu phần tử không có tính chất A và X = 1 VD 5. Kiểm tra ngẫu nhiên 50 sinh viên, kết quả: nếu phần tử có tính chất A, p là tỉ lệ phần tử có tính chất A thì: X (ñiểm) 2 4 5 6 7 8 9 10 Soá phaàn töû coù tính chaát A ni (số SV) 4 6 20 10 5 2 2 1 X ∈ B(p), p = EX = . Soá phaàn töû cuûa toång theå Trang 12
  13. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK 1.3.2. Sắp xếp dưới dạng khoảng • Giả sử mẫu (X1, X2,…, Xn) có nhiều quan sát khác VD 6. ðo chiều cao của n = 100 thanh niên, ta có bảng nhau, khoảng cách giữa các quan sát không ñồng ñều số liệu ở dạng khoảng: hoặc các Xi khác nhau rất ít thì ta sắp xếp chúng dưới dạng khoảng. Lớp (khoảng) Tần số ni ni Xét khoảng ( x min , x max ) chứa toàn bộ quan sát Xi. (ñơn vị: cm) (số thanh niên) Tần suất n Ta chia ( x min , x max ) thành các khoảng bằng nhau (còn 148 – 152 5 0,05 152 – 156 20 0,2 gọi là lớp ) theo nguyên tắc: 156 – 160 35 0,35 Số khoảng tối ưu là 1 + 3,322lgn, ñộ dài khoảng là: 160 – 164 25 0,25 x − x min 164 – 168 15 0,15 h = max . 1 + 3, 322 lg n a i−1 + a i VD 7. Theo dõi mức nguyên liệu hao phí ñể sản xuất ra Sử dụng công thức x i = ta có bảng số liệu ở 2 một ñơn vị sản phẩm ở một nhà máy, ta thu ñược các số dạng bảng (dùng ñể tính toán): liệu sau (ñơn vị: gam). Hãy sắp xếp số liệu dưới dạng n bảng? xi Tần số ni Tần suất i n 20; 22; 21; 20; 22; 22; 20; 19; 20; 22; 21; 150 5 0,05 19; 19; 20; 18; 19; 20; 20; 18; 19; 20; 20; 154 20 0,2 21; 20; 18; 19; 19; 21; 22; 21; 21; 20; 19; 158 35 0,35 20; 22; 21; 21; 22; 20; 20; 20; 19; 20; 21; 162 25 0,25 19; 19; 20; 21; 21. 166 15 0,15 Chú ý • ðối với trường hợp số liệu ñược cho bởi cách liệt kê thì ta sắp xếp lại ở dạng bảng. §2. CÁC ðẶC TRƯNG MẪU (tham khảo) 2.1. Các ñặc trưng mẫu • Giả sử tổng thể có trung bình EX = µ , phương sai Tính chất VarX = σ và tỉ lệ p phần tử có tính chất A. 2 a) Kỳ vọng của tỉ lệ mẫu bằng tỉ lệ tổng thể: 2.1.1. Tỉ lệ mẫu Fn  X + ... + X n  • Cho mẫu ñịnh tính kích thước n, ta gọi M ( Fn ) = M  1  = p . n  0  n  1 Fn = ∑ Xi , Xi =  là tỉ lệ mẫu tổng quát. n i =1 1  b) Phương sai của tỉ lệ mẫu: • Cho mẫu ñịnh tính kích thước n, trong ñó có m phần tử  X + ... + X n  pq có tính chất A. Khi ñó ta gọi: VarFn = Var  1  =  n  n m f = fn = là tỉ lệ mẫu cụ thể. (các Xi có phân phối Bernoulli). n 2.1.2. Trung bình mẫu • Trung bình mẫu: Chú ý n 1 X = Xn = ∑X . n i =1 i X1 + ... + X n • Tỉ lệ mẫu Fn = và trung bình mẫu Trung bình mẫu cụ thể: n n X1 + ... + X n 1 Xn = khác nhau ở chỗ là trong Fn, các x = xn = ∑x . n i =1 i n Xn chỉ có phân phối Bernoulli: Tính chất  0, neáu phaàn töû khoâng coù tính chaát A σ2 Xi =  ( ) ( ) VarX . E X n = µ = EX , Var Xn = = . 1, neáu phaàn töû coù tính chaát A n n  Trang 13
  14. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK 2.1.3. Phương sai mẫu • Trong tính toán ta sử dụng công thức: n n n  2 2 ( ) ( ) 2 2 1 2 2 1 • Phương sai mẫu: ɵ S = ɵ Sn = ∑ X − Xn . s2n =  x n − x n  , x n = ∑ x2i . n i =1 i n − 1   n i =1 n 2.2. Liên hệ giữa ñặc trưng của mẫu và tổng thể ( ) 2 2 1 2 Mẫu cụ thể: ɵs =ɵsn = ∑ x i − x n . n i =1 • Các ñặc trưng mẫu Fn , Xn , Sn2 là các thống kê dùng • Phương sai mẫu hiệu chỉnh: ñể nghiên cứu các ñặc trưng p, µ, σ2 tương ứng của n 1 ( ) 2 tổng thể. Từ luật số lớn ta có: S2 = S2n = ∑ X − Xn n − 1 i =1 i . Fn → p, Xn → µ, S2n → σ2 (theo xác suất). n ( ) 1 2 • Trong thực hành, khi cỡ mẫu n khá lớn (cỡ hàng chục Mẫu cụ thể: s2 = s2n = ∑ x − xn n − 1 i =1 i . trở lên) thì các ñặc trưng mẫu xấp xỉ các ñặc trưng tương 2  2  n − 1 2 ứng của tổng thể: x ≈ µ, f ≈ p, ɵ s ≈ σ2 , s2 ≈ σ2 . Tính chất. E  ɵ S = σ , E ( S2 ) = σ2 .   n §3. PHÂN PHỐI XÁC SUẤT CỦA CÁC ðẶC TRƯNG MẪU (tham khảo) 3.1. Phân phối xác suất của tỉ lệ mẫu F σ2 pq • Do EF = p và EX = µ, VarX = nên: • Do EF = p và VarF = nên với n khá lớn thì: n n  σ2  X−µ  pq  X ∈ N  µ,  hay n ∈ N ( 0, 1 ) .  F ∈ N  p,  .   n  σ  n   • Với mẫu cụ thể kích thước n, tỉ lệ mẫu f thì p ≈ f . • Với mẫu cụ thể kích thước n ñủ lớn, thì σ2 ≈ s2 . Ta  s2  X−µ có: X ∈ N  µ, Ta có:  hay n ∈ N ( 0, 1 ) .  f(1 − f)  (F − p) n  n  s  F ∈ N  p,  hay ∈ N(0, 1) .  n  f(1 − f) • Khi n < 30 và σ2 chưa biết thì: 3.2. Phân phối xác suất của trung bình mẫu X−µ 3.2.1. Trường hợp tổng thể X có phân phối chuẩn n ∈ χ2 (n − 1) có phân phối Student với n – 1 s X ∈ N ( µ, σ2 ) bậc tự do. 3.2.2. Trường hợp X không có phân phối chuẩn b) σ2 chưa biết thì: • Từ ñịnh lý giới hạn trung tâm, ta suy ra: X−µ  S2  X−µ n ≈ N ( 0, 1 ), X ≈ N  µ,  . d n  → N ( 0, 1 )  S  n  σ X−µ n  d → N ( 0, 1 ) .  3.3. Phân phối xác suất của phương sai mẫu s • Giả sử tổng thể X ∈ N ( µ, σ2 ) , khi ñó: • Với n ≥ 30 , ta có các phân phối xấp xỉ chuẩn: n n −1 2 a) σ2 ñã biết thì: n ɵ2 1 ( ) 2  S = S = ∑ Xi − Xn sẽ có phân σ2  σ σ σ2 i =1 2 2 X−µ n ≈ N ( 0, 1 ), X ≈ N  µ,  . σ  n  phối χ2 (n − 1) . §4. THỰC HÀNH TÍNH CÁC ðẶC TRƯNG MẪU CỤ THỂ 4.1. Tính tỉ lệ mẫu f VD. Xét 10 kết quả quan sát: • Trong mẫu có m phần tử có tính chất A mà ta quan tâm 102, 102, 202, 202, 202, 302, 302, 302, 302, 402. m 1 thì tỉ lệ mẫu là f = . Ta có: x = (102.2 + 202.3 + 302.4 + 402.1) . n 10 2 4.2. Tính trung bình mẫu x 4.3. Tính phương sai mẫu ɵ s • Mẫu có n giá trị xi thì trung bình mẫu là: n 1 2 1 ( x1 + x 22 + ... + x2n ) = ∑ x 2i . 2 x + x 2 + ... + x n 1 n • Tính x và x = x= 1 = ∑ xi . n n i =1 n n i =1 ( ). 2 2 2 • Nếu xi lặp lại ni (i = 1,…, k ≤ n ) lần thì trung bình • Phương sai mẫu là: ɵ s =x − x k 1 mẫu là: x = ∑x n . n i =1 i i • Phương sai mẫu có hiệu chỉnh là: s2 = n ɵ2 s . n −1 Trang 14
  15. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK SỬ DỤNG MÁY TÍNH BỎ TÚI ðỂ TÍNH CÁC ðẶC TRƯNG CỦA MẪU 1. SỐ LIỆU ðƠN (không có tần số) VD 1. Cho mẫu có cỡ mẫu là 5: w = (12, 13, 11, 14, 11). a) Máy fx 500MS • Xóa nhớ: MODE -> 3 -> = -> = • Vào chế ñộ thống kê nhập dữ liệu – MODE -> 2 (chọn SD ñối với fx500MS); MODE -> MODE -> 1 (chọn SD ñối với fx570MS) – Nhập các số: 12 M+ 13 M+…. 11 M+ • Xuất kết quả – SHIFT -> 2 -> 1 -> = (xuất kết quả x : trung bình mẫu) ⌢ – SHIFT -> 2 -> 2 -> = (xuất kết quả s = xσn : ñộ lệch chuẩn của mẫu) – SHIFT -> 2 -> 3 -> = (xuất kết quả s = xσn − 1 : ñộ lệch chuẩn của mẫu có hiệu chỉnh) b) Máy fx 500ES • Xóa nhớ: SHIFT -> 9 -> 3 -> = -> = • Vào chế ñộ thống kê nhập dữ liệu – SHIFT -> MODE -> dịch chuyển mũi tên tìm chọn mục Stat -> 3 (chế ñộ không tần số) – MODE -> 3 (stat) -> 1 (1-var) -> (nhập các số) 12 = 13 =…. 11 = • Xuất kết quả – SHIFT -> 1 -> 5 (var) -> 1 -> = (n: cỡ mẫu) – SHIFT -> 1 -> 5 (var) -> 2 -> = ( x : trung bình mẫu) – SHIFT -> 1 -> 5 (var) -> 3 -> = ( xσn : ñộ lệch chuẩn của mẫu) – SHIFT -> 1 -> 5 (var) -> 4 -> = ( xσn − 1 : ñộ lệch chuẩn của mẫu có hiệu chỉnh) 2. SỐ LIỆU CÓ TẦN SỐ VD 2. Cho mẫu như sau xi 12 11 15 ni 3 2 4 a) Máy fx 500MS • Xóa nhớ: MODE -> 3 -> = -> = • Vào chế ñộ thống kê nhập dữ liệu – MODE -> 2 (chọn SD ñối với fx500MS); MODE -> MODE -> 1 (chọn SD ñối với fx570MS) – Nhập các số: 12 -> SHIFT -> , -> 3 -> M+ 11 -> SHIFT -> , -> 2 -> M+ 15 -> SHIFT -> , -> 4 -> M+ • Xuất kết quả, làm như 1a) b) Máy fx 500ES • Xóa nhớ vào chế ñộ thống kê nhập dữ liệu có tần số: – SHIFT -> MODE (SETUP) dịch chuyển mũi tên -> 4 -> 1 – MODE -> 3 (stat) -> 1 (1-var) – Nhập các giá trị và tần số vào 2 cột trên màn hình X FREQ 12 3 11 2 15 4 • Xuất kết quả, làm như 1b) VD 3. ðiều tra năng suất của 100 ha lúa trong vùng, ta có bảng số liệu sau: Năng suất (tấn/ha) 3 - 3,5 3,5 - 4 4 - 4,5 4,5 - 5 5 - 5,5 5,5 - 6 6 - 6,5 6,5 - 7 Diện tích (ha) 7 12 18 27 20 8 5 3 Những thửa ruộng có năng suất ít hơn 4,4 tấn/ha là có năng suất thấp. a) Tính tỉ lệ diện tích lúa có năng suất thấp. b) Tính năng suất lúa trung bình, phương sai và ñộ lệch chuẩn của mẫu có hiệu chỉnh. …………………………………………………………… Trang 15
  16. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK Chương V. ƯỚC LƯỢNG ðẶC TRƯNG CỦA TỔNG THỂ (ðÁM ðÔNG) §1. ƯỚC LƯỢNG ðIỂM VD 1. 1.1. Thống kê X1 + X2 + ... + Xn • Một hàm của mẫu tổng quát T = T(X1, X2,…, Xn) ñược • Tỉ lệ mẫu F = là ước lượng n gọi là 1 thống kê. ñiểm của tỉ lệ tổng thể p. • Các vấn ñề của thống kê toán ñược giải quyết chủ yếu nhờ vào việc xây dựng các hàm thống kê chỉ phụ thuộc X + X2 + ... + Xn • Trung bình mẫu X = 1 là ước vào mẫu tổng quát, không phụ thuộc các tham số. n lượng ñiểm của trung bình tổng thể µ . 1.2. Ước lượng ñiểm 1.3. Ước lượng không chệch (tham khảo) • Ước lượng ñiểm của tham số θ (tỉ lệ, trung bình, • Thống kê ɵ ( ) θ X ,..., X là ước lượng không chệch của phương sai,…) là thống kê ɵ θ =ɵ θ ( X1,..., X n ) chỉ phụ 1 n thuộc vào n quan sát X1, …, Xn, không phụ thuộc vào θ . θ nếu E  ɵ θ ( X1,..., Xn )  = θ .   VD 2. Ta có: • EF = p (tỉ lệ mẫu là ước lượng không chệch của tỉ lệ 498.40+502.20+506.20+510.20 tổng thể). x= = 502, 8(gr) . 100 ( ) • E X = µ (trung bình mẫu là ước lượng không chệch Dự ñoán (ước lượng): Trọng lượng trung bình của các của trung bình tổng thể µ ). sản phẩm trong xí nghiệp là µ ≈ 502, 8(gr) .  2  • E ( S2 ) = E  ɵ S  = σ2 (phương sai mẫu là ước lượng VD 4 (tham khảo). Từ mẫu tổng quát W = (X1, X2) ta   xét hai ước lượng của trung bình tổng thể µ sau: không chệch của phương sai tổng thể σ2 ). 1 1 1 2 VD 3. Cân 100 sản phẩm của 1 xí nghiệp ta có bảng số X= X + X và X ′ = X1 + X2 . 2 1 2 2 3 3 liệu: x (gr) 498 502 506 510 a) Chứng tỏ X và X′ là ước lượng không chệch của µ . ni 40 20 20 20 b) Ước lượng nào hiệu quả hơn? Giải 1  ( )  2 1 b) Var X = Var  X1 + X2  2  1  1 ( )  2 1 2   2 1 a) E X = E  X1 + X2  = E ( X1 ) + E ( X2 ) 2 1 = 1 Var ( X1 ) + Var ( X2 ) = σ2 + σ2 = σ2 . 4 4 4 4 2 1 1 1  = µ + µ = µ. 2 2 ( )  3 2 Var X ′ = Var  X1 + X2  3  1  1 ( )  3 2 3   3 2 E X ′ = E  X1 + X2  = E ( X1 ) + E ( X2 ) 3 = 1 4 Var ( X1 ) + Var ( X2 ) = σ2 + 4σ2 = 5σ2 9 9 9 9 9 1 2 = 3 µ + µ = µ ⇒ (ñpcm). 3 ( ) ⇒ Var X < Var X ′ . ( ) Vậy ước lượng X hiệu quả hơn. §2. ƯỚC LƯỢNG KHOẢNG 2.1. ðịnh nghĩa Chú ý • Khoảng ɵ ( θ; ɵθ 1 2 ) của thống kê ɵ θ ñược gọi là khoảng • Do tổng thể X là biến ngẫu nhiên liên tục nên: tin cậy của tham số θ nếu với xác suất 1 − α cho trước P ɵ ( θ < θ
  17. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK m Trong thực hành với tỉ lệ mẫu f = fn = (n: cỡ mẫu; VD 1. Một trường ðH có 10.000 sinh viên. ðiểm danh n m: số phần tử quan tâm), khoảng tin cậy cho p là: ngẫu nhiên 1000 sinh viên thấy có 76 người bỏ học. Hãy ước lượng số sinh viên bỏ học của trường với ñộ tin cậy f (1 − f ) 95%. ( f − ε; f + ε ) , với ε = tα . n Trong ñó tα là mức phân vị, tìm ñược từ 1−α VD 2. ðể ước lượng số cá trong 1 hồ người ta bắt lên ϕ(tα ) = bằng cách tra bảng B. 2 3000 con, ñánh dấu rồi thả lại xuống hồ. Sau 1 thời gian Chú ý bắt lên 400 con thấy có 60 con có ñánh dấu.  t2  Với ñộ tin cậy 97%, hãy ước lượng số cá có trong hồ. • n =  α f ( 1 − f )  + 1 là kích thước mẫu cần chọn  ε 2  ứng với ε , 1 − α cho trước ([x] là phần nguyên của x). 2.3. Ước lượng trung bình tổng thể µ VD 3. Lấy ngẫu nhiên 200 sản phẩm trong 1 kho hàng • Giả sử tổng thể có trung bình µ chưa biết. Với ñộ tin thấy có 21 phế phẩm. cậy 1 − α cho trước, khoảng tin cậy cho µ là ( µ1 ; µ 2 ) a) Ước lượng tỉ lệ phế phẩm có trong kho hàng với ñộ tin thỏa: P ( µ1 < µ < µ 2 ) = 1 − α . cậy 99%. Trong thực hành ta có 4 trường hợp sau b) Dựa vào mẫu trên, nếu muốn ñộ chính xác của ước a) Trường hợp 1. Kích thước mẫu n ≥ 30 và phương lượng là ε = 0,035 thì ñộ tin cậy của ước lượng là bao sai tổng thể σ2 ñã biết. nhiêu ? • Tính x (trung bình mẫu). c) Dựa vào mẫu trên, nếu muốn ñộ chính xác là 0,01 với 1−α B Từ 1 − α ⇒ = ϕ(tα ) → tα . ñộ tin cậy 97% thì cần kiểm tra thêm bao nhiêu sản 2 phẩm nữa ? σ ( ) • Suy ra µ ∈ x − ε; x + ε với ε = tα n . VD 4. Khảo sát ngẫu nhiên 100 sinh viên thấy ñiểm VD 5. ðo ñường kính của 100 trục máy do 1 nhà máy trung bình môn XSTK là 5,12 ñiểm với ñộ lệch chuẩn sản xuất thì ñược bảng số liệu: 0,26 ñiểm. Hãy ước lượng ñiểm trung bình môn XSTK ðường kính (cm) 9,75 9,80 9,85 9,90 của sinh viên với ñộ tin cậy 97%. Số trục máy 5 37 42 16 b) Trường hợp 2. Kích thước mẫu n ≥ 30 và phương a) Hãy ước lượng ñường kính trung bình của trục máy sai tổng thể σ2 chưa biết. với ñộ tin cậy 97%. ⌢ n ⌢2 b) Dựa vào mẫu trên, với ñộ chính xác 0,006, hãy xác • Tính x, s 2 ⇒ s2 = s ⇒ s (ñộ lệch chuẩn n −1 ñịnh ñộ tin cậy. mẫu hiệu chỉnh). c) Dựa vào mẫu trên, nếu muốn có ñộ chính xác là 0,003 1−α B với ñộ tin cậy 95% thì cần phải ño bao nhiêu trục máy ? • Từ 1 − α ⇒ = ϕ(tα ) → tα (bảng B) 2 c) Trường hợp 3. Với n < 30 , phương sai tổng thể σ2 ñã biết và X có phân phối chuẩn thì ta làm như trường ( ) ⇒ µ ∈ x − ε; x + ε với ε = tα s n . hợp 1. d) Trường hợp 4. Với n < 30 , phương sai tổng thể σ2 mẫu chưa hiệu chỉnh là 0,04m. Tìm khoảng ước lượng chưa biết và X có phân phối chuẩn. chiều dài trung bình của loại sản phẩm này với ñộ tin cậy 95%. ⌢ n ⌢2 VD 7. Năng suất lúa trong 1 vùng là ñại lượng ngẫu • Tính x, s 2 ⇒ s2 = s ⇒ s. n −1 nhiên có phân phối chuẩn. Gặt ngẫu nhiên 115 ha lúa của C Từ 1 − α ⇒ α → tnα−1 (bảng C) vùng này ta có số liệu: Năng suất (tạ/ha) 40 – 42 42 – 44 44 – 46 ( ) • Suy ra µ ∈ x − ε; x + ε với ε = tnα−1. s n . Diện tích (ha) Năng suất (tạ/ha) 7 46 – 48 13 48 – 50 25 50 – 52 Chú ý Diện tích (ha) 35 30 5 • Trong thực hành, nếu ñề bài không cho X có phân phối a) Hãy ước lượng năng suất lúa trung bình ở vùng này chuẩn thì ta bổ sung vào. với ñộ tin cậy 95%. VD 6. Biết chiều dài của 1 sản phẩm là ñại lượng ngẫu b) Những thửa ruộng có năng suất không quá 44 tạ/ha là nhiên có phân phối chuẩn. ðo ngẫu nhiên 10 sản phẩm năng suất thấp. Hãy ước lượng năng suất trung bình của này thì ñược trung bình 10,02m và ñộ lệch chuẩn của những thửa ruộng có năng suất thấp với ñộ tin cậy 99%. Trang 17
  18. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK VD 8. ðể nghiên cứu nhu cầu về loại hàng A ở 1 khu 2.4. Ước lượng phương sai tổng thể σ2 vực người ta tiến hành khảo sát 400 trong toàn bộ 4000 • Giả sử tổng thể X có phân phối chuẩn với phương sai gia ñình, kết quả: Nhu cầu (kg/tháng) 0–1 1–2 2–3 3–4 σ2 chưa biết. Với ñộ tin cậy 1 − α cho trước, khoảng Số gia ñình 10 35 86 132 tin cậy cho σ2 là ( σ12 ; σ22 ) thỏa: Nhu cầu (kg/tháng) 4–5 5–6 6–7 7–8 Số gia ñình 78 31 18 10 P ( σ12 < σ2 < σ22 ) = 1 − α . a) Ước lượng nhu cầu trung bình loại hàng A của khu Trong thực hành ta có hai trường hợp sau vực trên trong 1 năm với ñộ tin cậy 95%. b) Với mẫu khảo sát trên, nếu muốn có ước lượng với ñộ chính xác 4,8 tấn và ñộ tin cậy 95% thì cần khảo sát tối thiểu bao nhiêu gia ñình trong khu vực? a) Trường hợp 1. Trung bình tổng thể µ ñã biết. b) Trường hợp 2. Trung bình tổng thể µ chưa biết. k • Từ mẫu ta tính ɵ2 = ∑ ni ( xi − µ ) , 2 • Từ mẫu ta tính n.s k≤n. k ∑ ni ( xi − x ) , 2 i =1 x ⇒ (n − 1)s2 = k≤n. α i =1 • Từ 1 − α ⇒ , tra bảng D tìm ñược: 2 α • Từ 1 − α ⇒ , tra bảng D tìm ñược:  α α 2 χ2n  1 − , χ2n   .   2   2  α α χ2n −1  1 − , χ2n−1   .  2   2  ɵ2 n.s n.sɵ2 ⇒ σ12 = , σ = 2 . (n − 1)s2 (n − 1)s2 2  α  2   2 α ⇒ σ12 = , σ22 = . χn  1 −  χn    α α   2   2  χ2n−1  1 −  χ2n−1    2  2  VD 9. Trọng lượng gói mì X(gr) là bnn có phân phối chuẩn. Cân kiểm tra 15 gói mì có số liệu: VD 11. Mức hao phí nguyên liệu cho 1 ñơn vị sản phẩm X(gr) 84 84,5 85 85,5 là ñại lượng ngẫu nhiên X (gr) có phân phối chuẩn. Số gói 2 3 8 2 Quan sát 28 sản phẩm này người ta thu ñược bảng số Với ñộ tin cậy 93%, hãy ước lượng phương sai X trong liệu: mỗi trường hợp sau: a) Biết trọng lượng trung bình gói mì là 84,9gr. X (gr) 19,0 19,5 20,0 20,5 b) Chưa biết trọng lượng trung bình gói mì. Số sản phẩm 5 6 14 3 VD 10. Khảo sát 16 sinh viên về ñiểm trung bình của Với ñộ tin cậy 90%, hãy ước lượng phương sai của mức học kỳ 2 thì tính ñược s2 = 2,25 ñiểm. Ước lượng hao phí nguyên liệu trên trong 2 trường hợp: phương sai về ñiểm trung bình học kỳ 2 của sinh viên a) Biết EX = 20gr. với ñộ tin cậy 97%, biết rằng ñiểm trung bình X của sinh b) Chưa biết EX. viên là biến ngẫu nhiên có phân phối chuẩn. Chương VI. KIỂM ðỊNH GIẢ THIẾT THỐNG KÊ §1. KIỂM ðỊNH GIẢ THIẾT VỀ ðẶC TRƯNG TỔNG THỂ (ðÁM ðÔNG) Chú ý 1.1. Khái niệm bài toán kiểm ñịnh • Mức ý nghĩa α giảm thì P(loại I) giảm ⇒ P(loại II) • Dùng các thống kê từ mẫu ñể chấp hay bác bỏ một giả tăng, nghĩa là khả năng chấp nhận H tăng. thiết H nào ñó nói về tổng thể gọi là kiểm ñịnh giả thiết thống kê. 1.2. Kiểm ñịnh giả thiết tỉ lệ tổng thể p • Khi kiểm ñịnh giả thiết H có thể xảy ra 1 trong 2 sai lầm sau: 1) Loại 1: Bác bỏ H trong khi H ñúng; 2) Loại 2: Chấp nhận H trong khi H sai. • Phương pháp kiểm ñịnh là cho phép xác suất xảy ra sai lầm loại 1 không vượt quá mức ý nghĩa α. Với mức ý nghĩa α ñã cho, ta chấp nhận H nếu xác suất xảy ra sai lầm loại 2 là nhỏ nhất. Trang 18
  19. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK F − p0 • Từ mức ý nghĩa α ⇒ 1 − α Với tỉ lệ p0 cho trước thì T = ∈ N(0; 1) và 1−α B p0q 0 ⇒ = ϕ(tα )  → tα . n 2 Wα = { t ∈ T P(t > tα ) ≤ α } là miền bác bỏ giả – Nếu t ≤ tα thì ta chấp nhận giả thiết, nghĩa là p = p0. thiết H. – Nếu t > tα thì ta bác bỏ giả thiết, nghĩa là p ≠ p0 . Các bước giải • ðặt giả thiết H: p = p0 (nghĩa là tỉ lệ tổng thể như tỉ lệ • Trong trường hợp bác bỏ, nếu f > p0 thì kết luận p > p0 cho trước). và f < p0 thì p < p0. m • Từ mẫu cụ thể ta tính tỉ lệ mẫu f = và VD 1. Kiểm tra 800 sinh viên thấy có 128 sinh viên giỏi. n Trường báo cáo tổng kết là có 40% sinh viên giỏi thì có f − p0 thể chấp nhận ñược không với mức ý nghĩa 5%? giá trị kiểm ñịnh t = . p0q 0 n VD 2. ðể kiểm tra 1 loại súng thể thao, người ta cho bắn 1.3. Kiểm ñịnh giả thiết trung bình tổng thể µ 1000 viên ñạn vào bia thấy có 540 viên trúng ñích. Sau • Với trung bình µ0 cho trước, tương tự bài toán ước ñó, bằng cải tiến kỹ thuật người ta nâng tỉ lệ trúng lên lượng khoảng cho trung bình tổng thể, ta có các trường 70%. Hãy cho kết luận về cải tiến với mức ý nghĩa 1%. hợp sau (tóm tắt): • ðặt giả thiết H: µ = µ0 (nghĩa là trung bình tổng thể VD 3. Theo báo cáo, tỉ lệ hàng phế phẩm trong kho là như trung bình cho trước). 12%. Kiểm tra ngẫu nhiên 100 sản phẩm thấy có 13 phế a) Trường hợp 1. Với n ≥ 30, σ2 ñã biết. phẩm. Với mức ý nghĩa 5% thì báo cáo trên có ñáng tin không ? x − µ0 • Tính tα , t = . σ VD 4. Một công ty tuyên bố rằng 40% dân chúng ưa n thích sản phẩm của công ty. Một cuộc ñiều tra 400 người tiêu dùng thấy có 175 người ưa thích sản phẩm của công • Nếu t ≤ tα ta chấp nhận giả thiết; ty. Với mức ý nghĩa 3%, hãy kiểm ñịnh tuyên bố trên ? t > tα ta bác bỏ giả thiết. b) Trường hợp 2. Với n ≥ 30, σ2 chưa biết. Chú ý Làm như trường hợp 1 nhưng thay σ = s . • Trong trường hợp bác bỏ: c) Trường hợp 3. Với n < 30, σ2 ñã biết, X có phân Nếu x > µ 0 ⇒ µ > µ 0 và x < µ 0 ⇒ µ < µ 0 . phối chuẩn (làm như trường hợp 1). d) Trường hợp 4. Với n < 30, σ2 chưa biết, X có VD 5. Trọng lượng trung bình của của một loại sản phân phối chuẩn. phẩm là 6kg. Kiểm tra 121 sản phẩm thấy trọng lượng x − µ0 2 → tnα−1 . trung bình là 5,795 kg và phương sai ɵ C • Tính t = . Từ mức ý nghĩa α  s = 5, 712 . s Hãy kiểm ñịnh về trọng lượng trung bình của sản phẩm n này với mức ý nghĩa 5%. • Nếu t ≤ tαn−1 ta chấp nhận giả thiết; t > tnα−1 ta bác bỏ giả thiết. VD 7. Khối lượng của một bao gạo của 1 nhà máy là VD 6. Cân thử 15 con gà tây ở 1 trại chăn nuôi khi xuất biến ngẫu nhiên có ñộ lệch tiêu chuẩn là 0,3kg. Ban giám ñốc tuyên bố khối lượng mỗi bao gạo của nhà máy chuồng ta tính ñược x = 3, 62kg . Biết trọng lượng gà là 50kg. Cân thử 50 bao thì thấy khối lượng trung bình là tây là biến ngẫu nhiên có σ2 = 0, 01 . 49,97kg. Với mức ý nghĩa 1%, hãy kiểm tra lời tuyên bố trên ? a) Giám ñốc trại nói rằng trọng lượng trung bình của gà VD 8. ðiểm trung bình môn toán của sinh viên năm tây là 3,5kg, với mức ý nghĩa 2% hãy kiểm ñịnh lời nói trước là 5,72. Năm nay theo dõi 100sv ñược số liệu: trên ? ðiểm 3 4 5 6 7 8 9 b) Giả sử người ta dùng thức ăn mới và khi xuất chuồng Số sinh viên 3 5 27 43 12 6 4 trọng lượng trung bình của gà tây là 3,9 kg. Với mức ý Với mức ý nghĩa 5%, phải chăng ñiểm trung bình của nghĩa 3%, hãy cho kết luận về loại thức ăn này ? sinh viên năm nay cao hơn năm trước? Trang 19
  20. ThS. Ñoaøn Vöông Nguyeân Slide baøi giaûng XSTK VD 9. Chiều cao cây giống X(m) trong một vườm ươm (n − 1)s2 là biến ngẫu nhiên có phân phối chuẩn. • Từ mẫu ta tính giá trị kiểm ñịnh χ2 = . ðo ngẫu nhiên 25 cây ta có: σ20 X (m) 0,8 0,9 1,0 1,1 1,2 1,3 α α   α • Từ 1 − α ⇒ D → χ2n−1  , χ2n−1  1 −  . Số cây 1 2 9 7 4 2 2  2   2  Theo quy ñịnh khi nào cây cao trung bình trên 1m thì α   α ñem ra trồng. Với mức ý nghĩa 5%, có thể ñem cây ra • Nếu χ2n−1   < χ2 < χ2n−1  1 −  ta chấp nhận trồng ñược chưa ?  2   2  giả thiết, ngược lại thì bác bỏ giả thiết. 1.4. Kiểm ñịnh giả thiết phương sai tổng thể có phân • Trong trường hợp bác bỏ, nếu s2 > σ20 thì kết luận phối chuẩn σ2 (tham khảo) Với σ20 cho trước, ta thực hiện các bước sau: σ2 > σ20 và s2 < σ20 thì σ2 < σ20 . VD 10. Tiến hành 25 quan sát về chỉ tiêu X của 1 loại • ðặt giả thiết H: σ2 = σ20 (nghĩa là phương sai tổng thể sản phẩm, ta tính ñược s2 = 416,667. Có tài liệu nói rằng như phương sai cho trước). phương sai của chỉ tiêu X là 400. Với mức ý nghĩa 3%, cho nhận xét về tài liệu này? §2. KIỂM ðỊNH SO SÁNH HAI ðẶC TRƯNG 2.1. So sánh hai tỉ lệ px và py của hai tổng thể X, Y • Nếu t ≤ tα thì chấp nhận H ⇒ p x = p y ; • ðặt giả thiết H: px = py.  t > tα  t > tα m • Từ 2 mẫu ta tính fx = x , fy = my , nếu  ⇒ px < p y ; nếu  ⇒ px > p y .  fx < fy  fx > fy nx ny   mx + my VD 1. Từ hai tổng thể X1, X2 tiến hành 2 mẫu có kích p0 = (tỉ lệ thực nghiệm chung của hai mẫu). nx + ny thước n1 = 100, n2 = 120 ta tính ñược f1 = 0,2 và f2 = 0,3. Với mức ý nghĩa 1% hãy so sánh hai tỉ lệ của hai tổng • Tính q 0 = 1 − p0 thể ñó. fx − fy VD 2. Kiểm tra 120 sinh viên trường A thấy có 80 sinh ⇒t= (giá trị kiểm ñịnh). viên giỏi, 150 sinh viên trường B có 90 sinh viên giỏi.  1 1  p0q 0  Hỏi tỉ lệ sinh viên giỏi của 2 trường như nhau không với +   n x n y  mức ý nghĩa là 5%? x−y VD 3. Kiểm tra 120 sản phẩm ở kho I thấy có 6 phế • Từ 2 mẫu cụ thể ta tính kiểm ñịnh t = và phẩm. Kiểm tra 200 sản phẩm ở kho II thấy có 24 phế σ2x σ2 phẩm. Chất lượng hàng ở hai kho có khác nhau không + y nx ny với: 1) Mức ý nghĩa 5% ? 2) Mức ý nghĩa 1% ? so sánh với tα . 2.2. So sánh hai trung bình µx và µy của hai tổng thể Tóm tắt 4 trường hợp (chấp nhận hay bác bỏ giả thiết Trường hợp 2. n x , n y ≥ 30 và σ2x , σ2y chưa biết. như bài kiểm ñịnh trung bình): Ta thay σ2x , σ2y bởi s2x , s2y trong trường hợp 1. • ðặt giả thiết H: µ x = µ y. Trường hợp 3. n x , n y < 30 và σ2x , σ2y ñã biết ñồng Trường hợp 1. n x , n y ≥ 30 và σ2x , σ2y ñã biết. thời X, Y có phân phối chuẩn (như trường hợp 1). Trường hợp 4. n x , n y < 30 và σ2x , σ2y chưa biết; X, Y VD 4. Cân thử 100 trái cây ở nông trường I ta tính ñược có phân phối chuẩn. x = 101, 2gr; s2x = 571, 7 và 361 trái cây ở nông trường II tính ñược y = 66, 39gr; s2y = 29, 72 . • Tính phương sai mẫu chung chưa hiệu chỉnh của 2 mẫu Hãy so sánh trọng lượng trung bình của trái cây ở 2 nông (n x − 1)s2x + (n y − 1)s2y s = 2 . trường với mức ý nghĩa 1%. nx + ny − 2 VD 5. ðo ñường kính 20 trục máy do máy I sản xuất và x−y 22 trục máy do máy II sản xuất ta tính ñược • Tính giá trị kiểm ñịnh t = . 1 1 x = 251, 7mm ; s2x = 52, 853 y = 249, 8mm ; s. + và nx ny s2y = 56, 2 . Có thể xem ñường kính trung bình của các C n + n −2 • Từ α  → tαx y và so sánh với t. trục máy ở 2 máy như nhau với mức ý nghĩa 1% không? Trang 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2