intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Giáo trình Xác xuất thống kê (Giáo trình Cao đẳng Sư phạm): Phần 2

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:97

7
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nối tiếp nội dung phần 1, phần 2 cuốn giáo trình "Xác xuất thống kê" giới thiệu tương quan và hồi quy tuyến tính, nếu ít thời gian thì chỉ trình bày ý nghĩa hệ số tương quan, cách tính, các kết luận. Phần hồi quy tuyến tính chỉ trình bày ý nghĩa của mô hình tuyến tính để tính xấp xỉ biến ngẫu nhiên Y theo biến đã cho X, cách tính các hệ số,

Chủ đề:
Lưu

Nội dung Text: Giáo trình Xác xuất thống kê (Giáo trình Cao đẳng Sư phạm): Phần 2

  1. HỆ SỐ TƯƠNG QUAN, HỌI QUY TUYẾN TÍNH T rong chương 7, chúng ta đã xem xét mối quan hệ giữa hai biến định tính, được trình bày dưới dạng bảng tương liên, trong chương này chúng ta sẽ xem xét mối quan hệ giữa hai biến định lượng được khảo sát đồng thời trên một tổng thể, điều này có nghĩa là khi ta lấy ngẫu nhiên một cá thể của tổng thể ra xem xét thi phải cân đo, phân tích, thử nghiệm, ... đồng thời hai đặc tính sinh học định lượng X và Y. Thí dụ cân và đo chiều cao của một em học sinh lớp 4, cân và đo vòng ngực của một thanh niên chuẩn bị nhập ngũ, cân trọng lượng buồng trứng và đo chiều dài của cá, đo chiều cao của con trai và con gái trong cùng một gia đình, đo chiều cao cây và tính năng suất lúa, đo lượng nước mưa trong quý 4 và tính năng suất ngô vụ đông, ... Sau khi khảo sát một mẫu gồm n cá thể, ta thu được dãy n cặp số (Xị, y¡), một câu hỏi rất tự nhiên là hai biến X và Y có quan hệ với nhau hay không? nếu có thì khi X thay đổi Y sẽ thay đổi theo như thế nào? Câu hỏi đầu: "X và Y có quan hệ với nhau hay không?" được trình bày ở mục hệ số tương quan, câu hỏi "Sau khi X thay đổi Y sẽ thay đổi theo như thế nào?" được trình bày ở mục hổi quy. §1. SẮP XẾP s ố LIỆU Khi có ít số liệu có thể để dãy n cặp số dưới dạng cột hay hàng, nếu nhiều hơn thì có thể sắp dưới dạng có tần số, nếu nhiều nữa thì chia khoảng cả X và Y để sắp thành bảng hai chiều. a) Sắp thành hàng X *1 *2 xn Y yi Y2 yn b) Sắp thành hàng có tần số X *1 *2 Xk Y yi y? y« m mi m2 mk n 101
  2. c) sắp thành cột và sắp thành cột có tần số X Y X Y m Xi yi *1 yi mi *2 y2 m2 *2 V2 yn *k y« mk Tổng n d) Sắp thành bảng, X gồm k lớp, Y gồm / lớp với các điểm giữa Xj và Ỵj Y Y1 V2 y/ *1 mn m12 m1/ *2 m21 m22 m2, *k Mki mk2 mk/ Từ dạng bảng có thể dễ dàng chuyển thành dạng cột hay hàng có tần số và ngược trở lại chuyển từ dạng cột hay hàng có tần số thành bảng. ơ phần sau các công thức tính toán đưa ra chỉ đúng khi số liệu viết dưới dạng hai cột không có tần số, khi có tần số thì phải thêm tần số vào các công thức. §2. HỆ SỐ TƯƠNG QUAN Trong Toán học khi có hai dãy số Xj và y j, người ta có thể khảo sát mối quan hệ giữa X và Y bằng khái niệm hàm số. Trong thống kê Xj và y, là các giá trị thu được trong mẫu quan sát của hai biến ngẫu nhiên X, Y và người ta muốn đưa ra một con số để đánh giá hai biến ngẫu nhiên X và Y có quan hệ với nhau hay không. Có khá nhiều con số được dùng để đánh giá X và Y có quan hệ hay không nhưng không có con số nào thoả mãn được mọi mong muốn cùa chúng ta. Đơn 102
  3. giản, dễ dùng và có nhiều ưu điểm, nhưng chỉ được coi là con số đánh giá mối quan hệ (hay liên hệ) tuyến tính là hệ số tương quan đã để cập sơ qua ờ chương III. Dựa trên lí thuyết xác suất vể hệ số tương quan chúng ta có công thức sau đê tính hệ số tương quan mẫu rXY giữa hai biến ngẫu nhiên X và Y 2 > i-x X y ị-y ) 1 rxv ~ I , (8 .1 ) ^Ẻ(x1-x)2i ( y i-ỹ)\2 — Khai triển công thức này được công thức (8.2) thuận tiện hơn về mặt tính toán n n n ỉ x' ẳ yi Ẻ x. y . - - L — 1 rxy = — (8 .2 ) (Ệ y ,)2 ¡ 3 )(y ?— 1 --------) VxT ỵ Cũng có thể thay — — — bằng nx y ; n , ( I x ,)2 2 thay " — bằng n(x) ; n 2 thay CẸ yQ— bằng n(y)2. -1 n Nếu tính tuần tự các tham số thì có thể tính phương sai mẫu của biến X, phương sai mẫu của biến Y, hiệp phương sai mẫu của X và Y. 5>,-x)2 i>,-ỹ)2 ¿(Xị-xXy.-ỹ) s ỉ = —--------------- ; sĩ = —--------------- ; cov = —------------------------ ( n - 1) y (n - 1) xy ( n - 1) Cov rxyy = — — x (8.3) sxsv 103
  4. Hệ số tương quan mẫu có các tính chất sau: a) Là một số nằm giữa -1 và + 1, nói cách khác |rxy| < 1 b) Nếu Y và X có quan hệ tuyến tính Y = a + bX thì rX I = 1 và ngược y lai nếu I rÏV I = 1 thì Y và X có quan hê tuyến tính Y = a + bX xy c) Nếu X và Y độc lập về xác suất thì rxy = 0 nhưng ngược lại không đúng, nếu rxy = 0 (gọi là không tương quan) thì chưa thể kết luận X và Y độc lập về xác suất. (Như vậy độc lập về xác suất suy ra không tương quan nhưng không tương quan không suy ra độc lập vé xác suất). d) Nếu thực hiện hai phép biến đổi tuyến tính u = aX + b; V = cY + d thì ruv = rxy. Tính chất này được phát biểu dưới dạng: Hệ số tương quan bất biến đối với phép biến đổi tuyến tính. (Trong thống kê thường dùng cách chọn gốc đo mới và đơn vị đo mới. Nếu gọi x0 là gốc mới, h là đơn vị mới, số đo X của biến X bây giờ là u: u = --x ~ x 0> ( hay X = X + hu h 0 như vậy ta đã thực hiện phép biến đổi tuyến tính X = x 0 + hU. Tương tự đối với Y, ta biến đổi Y = y 0 + kV) Bốn tính chất này có thể chứng minh chặt chẽ nhờ các bất đẳng thức toán học đối với hai dãy số (nhưng ở đây chúng ta thừa nhận không chứng minh). Hệ sô tương quan được coi là một số đo mối quan hệ hay liên hộ tuyến tính giữa X và Y vì khi I rxy I gần về phía 1 (thường gọi là tương quan mạnh) thì có thể kết luận X và Y có quan hệ gần với quan hệ tuyến tính, còn nếu rxy I gần về phía 0 (thường gọi là tương quan yếu) thì không kết luận được gì vì có thể X và Y độc lập hoặc có thể có quan hệ, nhưng nếu có thì quan hệ này không thể là quan hệ tuyến tính. Vể dấu thì nếu rxy > 0 ta có tương quan dương, nếu rxv < 0 thì tương quan âm 104
  5. , ^ Ị ) # H ìn h 5. r = 1 Hình 6. r > 0 mạnh Hình 7. r < 0 H ìn h 8. r > 0 yếu Thí dụ 1. Nghiên cứu quan hệ giữa chiều dài X (mm) và trọng lượng y (gam) của một loại trứng gà X y ( X - X) ( y - ỹ) (X -X )2 (y - ỹ)2 (X - x)(y- y) 57 61 1 3 1 9 3 54 59 -2 1 4 1 -2 55 58 -1 0 1 0 0 52 56 -4 -2 16 4 8 55 57 -1 -1 1 1 1 60 59 4 1 16 1 4 56 56 0 -2 0 4 0 56 58 0 0 0 0 0 57 56 1 -2 1 4 -2 58 60 2 2 4 4 4 Tổng 560 580 44 28 16 16 n =10; Xxị = 560; X = 56; Sy, = 580; y = 58; rxy = = 0,4558 V44x28 105
  6. Nếu tính theo (8.2) thì E x ,2 = 3 1 4 0 4 ; l y ? = 3 3 6 68 ; ( x ) 2 = 31 36 ; Z x f - n ( x ) 2= 4 4 1 x ^ = 32496; ĩ ẫ i - n( X )(ỹ) = 1 6 ;Z y f - n ( ỹ )2 = 28. xiy Nếu tính tuần tự theo (8.3) thì: sỉ = — = 4 , 8 8 8 9 ; = — = 3,1111; covxy = ^ = 1,7778; 9 y 9 3 9 r = 1,7778 - = 0 ,4 55 8. y V4,8889x3,1111 77ú dụ 2 Nghiên cứu quan hệ giữa tuổi (tháng) và trọng lượng (kg) của 7 con bê Trọng Tuổi X X2 y2 xy lượng y 0 18 0 324 0 2 32 4 1024 64 3 64 9 4096 192 4 45 16 2025 180 6 91 36 8281 546 8 127 64 16129 1016 12 164 144 26896 1968 35 541 273 58775 3966 n = 7; Sx, = 35; l y , = 541; I x ? = 273; Zy? = 58775; Sx,y, = 3966. Tính theo (8.2) £ x y _ (Z x. )(X y » ) = 3966_ 3 5 :5 4 i =1261 n 7 \ ^ 2 2 y y2 _ _ 2 Z L = 58775 = 16963,429 ^ 1 n 7 106
  7. X = 5 ; ỹ = 77,286; sị = 16,3333; = 2827,2381; covxy = 210,1667 rxy = 0,9780. §3. HỔI QUY TUYẾN TÍNH Vẽ các điểm quan sát Mi(Xj,y,) trên hệ toạ độ vuông góc, các điểm này họp thành một đám mây quan sát, nhìn chung có dạng một elíp (trừ một vài điểm tách ra xa gọi là điểm ngoại lai), nếu I rXY I gần bằng 1 thì elíp rất dẹt, nếu I rXY I vừa phải thì elíp bầu bĩnh, nếu I rX I gần bằng không thì có 2 khả năng: Y hoặc đám mây quan sát tản mạn trên một phạm vi rộng (không quan hệ), hoặc đám mây quan sát không còn dạng elíp mà tập trung thành một hình cong (phi tuyến). Trường hợp I rXY I gần 1 elíp đám mây quan sát khá dẹt. Để giải thích sự thay đổi của Y khi cho X thay đổi, người ta thường đưa ra mô hình hồi quy tuyến tính Y = a + bX. Có thể tìm hiểu mô hình hồi quy tuyến tính theo hai cách sau đây: 3a) Đường trung bình của biến ngẫu nhiên Y theo X trong phán phôi chuân hai chiêu Khảo sát đồng thời hai biến ngẫu nhiên định lượng (như đã làm từ đầu chương này). Cặp biến X, Y thường tuân theo luật chuẩn hai chiều, khi ấy nếu theo dõi biến X trước thì ứng với mỗi giá trị X của biến ngẫu nhiên X có vô s ố giá trị của biến Y, các giá trị này có giá trị trung bình lí thuyết là kì vọng M(Y/x). Khi X thay đổi kì vọng M(Y/x) thay đổi theo và các điểm P(x,M(Y/x)) chạy trên một đường thảng gọi là đường hồi quy tuyến tính Y theo X. Nếu theo dõi biến Y trước thì ứng với mỗi giá trị y của Y có vô số giá trị của biến X có trung bình là kì vọng M(X/y). Điểm Q(y, M(X/y)) chạy trên một đường thẳng gọi là đườns hồi quy tuyến tính X theo Y. Như vậy, vẽ' mặt lí thuyết, khi có phân phối chuẩn hai chiều các đường hồi quy tuyến tính Y theo X và hồi quy tuyến tính X theo Y chính là các đường kì vọng có điều kiện M(Y/x) và M(X!y). 107
  8. Trong trường hợp tổng quát cùa phân phối hai chiểu, các đường kì vọng có điểu kiện có thể là đường thảng hoặc đường cong và được gọi là hồi quy Y theo X (hay X theo Y). Trong thực nghiệm, chúng ta khảo sát hai biến định lượng bằng cách lấy mẫu với dung lượng n khá lớn. Thay cho đường hồi quy tuyến tính lí thuyết có đường hồi quy thực n ghiệm . Gọi (x, y) là toạ độ cùa một điểm chạy trên đường thảng hói q u y, X và ỹ là trung bình cộng của X và Y, sx và Sy là độ lệch chuẩn cùa X và Y, phương trình hồi quy tuyến tính thực nghiệm có dạng: sy - (8.4) y - y = rxy (x_x) sx Nếu viết phương trình đường thẳng dưới dạng y = a + bx thì: y Hệ sô góc b = r Xy — tung độ gốc a = y - bx (8.5) sx Nếu dùng công thức (8.2) để tính hệ số tương quan thì: (8 . ) 6 Hệ số góc b = X (^ i x)(ỵ. y ) . a = ỹ _ b- (8.7) Z (x ,-X )2 Đường hồi quy tuyến tính thực nghiệm X theo Y có phương trình x -x = d (y -y ) với hệ số góc d Nếu viết dưới dạng X = c + dy thì hoành độ gốc c = X - d ỹ Nếu nhân hệ số góc b của hồi quy tuyến tính Y theo X với hệ số góc d của hồi quy tuyến tính X theo Y thì được r 2 : b X d = y . 108
  9. Thí dụ 3 Trong thí dụ 1 ta có X = 56; ỹ = 58; = 4,8889; Sy = 3,1111; rX = 0,4558. y Hồi quy tuyến tính Y theo X y - 58 = 0 , 4 5 5 8 ^ ^ U i ( x - 5 6 ) . >/4,8889 Viết dưới dạng y = a + bx thì nếu tính theo (8.5) hệ sô'góc b = 0 , 4 5 5 8 ^ S Ĩ Ĩ Ĩ = 0,3636, ■v/4,8889 tung độ gốc a = 58 - 0,3636 . 56 = 37,6384. Nếu tính theo ( 8 .6 ) ta có: u 16 _ 5 8 0 -0 ,3 6 3 6 .5 6 0 _ „ , . ^ b = — = 0,3636; a = ---------— ----- ^ = 37,6384. 44 10 Thí dụ 4 Lấy thí dụ 2, ta có X = 5; ỹ = 77,2857; s ị = 16,3333; Sy = 2827,2381; r Xy = 0 , 9 7 8 0 . Hồi quy tuyến tính Y theo X: y = a + bx Hê số góc b = 0.9780 = 12,867. >/16,3333 Tung độ gốc a = 77,2857 - 12,867.5 = 12,95. 1261 _ 541-12.8673x35 Nếu tính theo ( 8 .6 ) thì b = —— = 12,867 ; a = ---------— ---------- = 12,95. y 3b) Đường thẳng gần đúng cùa Y theo X Xét bài toán thường gặp trong các thí nghiệm nông nghiệp và sinh học sau: Một biến X định lượng có các giá trị X (i = 1. n), biến này hoặc do chúng j ta chủ động điểu khiển thí dụ lương nuớc tưới, lượng phân bón. khoảng cách ơiữa các hàng, mật độ cấy. liều lượng thuốc....... hoặc quan sát trong tự nhiên như lượng nước mưa, nhiệt độ, ẩm độ không khí, số ngày n ắn ơ ,... 109
  10. Biến thứ hai là một biến Y mà qua quan sát thấy thay đôi theo X, thí dụ năng suất lúa Y thay đổi theo lượng nước tưới X, chỉ tiêu Y về phản xạ của chuột thay đổi theo lượng thuốc X đã tiêm ... Vấn đề đặt ra là tìm một hàm của X để tính gần đúng các giá trị cùa Y. Hàm này thường chọn trong các lớp hàm: bậc nhất (tuyên tính), bậc hai,' lỏgarít, mũ ... hàm phải đơn giản và dễ lí giải về mật chuyên môn. Nếu dùng Xj làm hoành độ, y, làm tung độ thì có n điểm quan sát Mj(Xj,yj) và bài toán ở đây là dùng một đường thẳng, đường parabôl, đường lôgarít, đường mũ, ... để lí giải sự thay đổi cùa Y theo X, đường này không buộc phải đi qua tất cả các điểm mà chỉ cần đi "sát", đi "gần" các điểm quan sát Mj . Trong phần hàm nhiều biến của toán học cao cấp, sau khi tính đạo hàm riêng có đề cập đến đường thẳng "tốt" nhất theo nguyên tắc (hay phương pháp) bình phương bé nhất. 200 150 ............ ị ..... ... .... ........ 100 . .................. 80 ........í ..... 80 100 120 140 160 180 200 220 240 X H ì n h 9. Hồi quy tuyến tính Y theo X Giả sử chọn đường gần đúng là đường thẳng z = a + bx, ta có mó hình tuyến tính sau: yt = z, + ej = a + bXj + ẽị (8.8) e, là độ chênh lệch giữa giá trị thực Y và giá trị tương ứng z, trẽn đường ị thẳng (thường gọi e, là sai số hay phần dư). Theo nguyên tắc bình phương bé nhất thì đường "tốt” nhất trong các đường thẳng dùng làm đường gần đúng là đường có tông bình phương các phần dư nhó nhất. 110
  11. Dùng cách tính cực trị của hàm hai biến để tìm min , thu được hệ hai phương trình (gọi là hệ phương trình chuẩn) để tìm a và b. ran + b ZXj = ly ị l aSxj + b Z x f = £Xjy, Có nhiều cách giải hệ hai phương trình bậc nhất với hai ẩn số. Nếu dùng định thức để giải thì có ngay kết quả sau: b= a Zy,-bỊ>, (8.9) n trùng với công thức ( 8 .6 ) dùng để tính các hệ số hồi quy a và b trong phần 3a/ Nếu các biến ngẫu nhiên eị trong mô hình tuyến tính (8.7) phân phối chuẩn thoả mãn ba điểu kiện: a) Kì vọng bằng 0 b) Phương sai bằng nhau ( 8 . 10) c) Độc lập với nhau. thì sau khi tính các hệ số theo (8.9), có thể tính được sai số của các hệ số, phân tích và đánh giá các nguồn biến động, phân tích sai số dự báo. Đường thẳng gần đúng tốt nhất vừa tìm được theo (8.9) trong trường hợp này cũng được gọi là đường hồi quy tuyên tính Y theo X. (Để phàn biệt, có khi người ta gọi đường này là đường hồi quy tuyên tính dạng I, còn đường trung bình trong mô hình phân phối chuẩn hai chiều ở 3a/ là đường hồi quy tuyến tính dạng II). Trong mô hình hồi quy tuyến tính dạng I, biến X (không ngẫu nhiên) được gọi là biến độc lập, biến giải thích hay biến điều khiển còn biến Y (ngẫu nhiên) thay đổi theo X được gọi là biến phụ thuộc, biến kết quả hay biến đáp. Trở lại đường hồi quy tuyến tính ở phần 3a/, nếu chọn trước biến ngẫu nhiên X và coi như biến độc lập thì biến thay đổi theo Y trong phân phối chuẩn hai chiều thoả mãn các điều kiện vừa nêu ở (8.10). Như vậy đường hồi quy tuyến tính dạng II, theo nghĩa đường trung bình của biến Y theo biến X, cũn° 111
  12. chính là đường hồi quy tuyến tính theo nghĩa vừa trình bày: đường thăng gân đúng tốt nhất đối với biến Y", tức là đường hồi quy tuyên tính dạng I. Tóm lại khi cần tính hồi quy tuyến tính theo nghĩa "Đường thăng gân đúng tốt nhất đối với biến Y thì dù X là biến không ngẫu nhiên với các sai số e, cùa mô hình thoả mãn điểu kiện (8.10), hay X là biên ngẫu nhiên trong mô hình phân phối chuẩn hai chiều, ta đều có thê tính các hệ số a và b bằng cách dùng các công thức (8.5), ( 8 .6 ), (8.7) hoặc giải hệ hai phương trình chuẩn. Việc tính sai số của a và b, việc phân tích biến động chung thành biến động do hồi quy và biến động do sai số, việc tính và đánh giá dự báo hoàn toàn giống nhau. Thí dụ 5. Lấy lại thí dụ 2 với X là tháng tuổi, Y là trọng lượng bê, ta có: n = 7; Zxj = 35; £y, = 541; I x f = 273; = 58775; Xx,y, = 3966. 7a + 35b = 541 (a) 35a + 273b = 3966 (b) Nhân (a) với 5 được 35 a + 175 b = 2705 (c) Đem (b) trừ (c) 98b = 1261 => b = 12,8673 thay vào (a) 7a + 35.12,8673 = 541 => a = 12,9492. Hồi quy tuyến tính trọng lượng theo tháng y = 12,95 + 12,867x. Thí dụ 6 Sản lượng cá ở một hồ trong 7 năm từ 1994 đến 2000 như sau: Năm Năm X Sản lượng Y(Tấn) X2 Y2 XY 1994 1 20,56 1 422,7136 20,56 1995 2 20,66 4 426,8356 41,32 1996 3 21,74 9 472,6276 65,22 1997 4 23,12 16 534,5344 92,48 1998 5 23,06 25 531,7636 115,3 1999 6 24,40 36 595,36 146,4 2000 7 25,42 49 646,1764 177,94 28 158,96 140 3630,011 659,22 112
  13. Hệ hai phương trình: f 7a + 28 b = 158,96 [ 28a + 140 b = 659,22 Suy ra 28b = 23,38 => b = 0,835 7a = 135,58 => a = 19,3686. Hồi quy tuyến tính sản lượng theo năm y = 19,37 + 0,835 X. Dự báo theo hồi quy tuyến tính Khi có đường hồi quy tuyến tính thì có thể dùng đường đó để dự báo giá trị Ym ứng với giá trị XM ngoài các giá trị x¡ đã có của mẫu quan sát: yM = a + b x M Trong thí dụ 5, hồi quy trọng lượng bê theo tháng tuổi là y = 12,95 + 12,867x Dùng đường hồi quy để dự báo trọng lượng một con bê 10 tháng tuổi: y 10 = 12,95 + 12,867.10 = 141,62 kg Trong thí dụ 6 hồi quy sản lượng cá theo nãm y = 19,37 + 0,835 X Dự báo sản lượng năm 2001 y 8 = 19,37 + 0,835.8 = 26,05 tấn Các dự báo này cho ta một giá trị dự báo yM và có thể tính được sai số dự báo, sai s ố này lớn dần n ếu đ iể m dự báo XM ở xa giá trị X, như vậ y dự báo xa X không tốt vì sai s ố quá lớn. BÀI TẬP CHƯƠNG 8 8 ềl. Tính hộ số tương quan giữa X và Y X 1 2 3 4 5 6 7 8 Y 4 8 12 16 20 24 28 32 8.2. Tính hệ số tương quan giữa X và Y X 1 1 3 3 5 5 7 7 Y 6 12 6 12 6 12 6 12 8-GTXSTK 113
  14. 8.3. Tính hệ số tương quan giưa X và Y và tìm đường hổi quy Y theo X X 5 11 4 5 3 2 Y 31 40 30 34 25 20 8.4. Tính hệ số tương quan giữa X (giá thành) và Y (doanh số) của 8 mặt hàng và tìm đường hồi quy Y theo X X 29,2 30,5 29,7 31,3 30,8 29,9 27,8 27,0 Y 12,2 18,6 29,2 15,7 25,4 35,2 14,7 11,1 8ế5. Tính hệ số tương quan giữa X và Y và tìm đường hồi quy Y theo X \ X 1 2 3 4 Y 5 2 4 1 2 3 2 2 2 1 2 1 2 1 ' 2 2 8 ễ6 Ế Thí nghiệm vê một loại phân bón X (g/m ) và năng suất cỏ (g/m ) X 25 50 75 100 125 150 175 200 225 250 Y 84 80 90 154 148 169 206 244 212 248 Tính hộ số tương quan giữa X và Y và tìm đường hồi quy Y theo X. 8.7. Theo dõi trọng lượng trung bình X và lượng thức ăn Y của 10 nhóm gà (mỗi nhóm 50 con) X 2,3 2,5 2,4 2,2 2.9 2,4 2,5 2,6 2,4 2,6 Y 87,1 93,1 89,8 91,4 99,5 92,1 95,5 99,3 93,4 94,4 Tính hệ số tương quan giữa X và Y và tìm đường hồi quy Y theo X.
  15. ĐÁP SỐ BÀI TẬP CHƯƠNG 1 l . l ẻ Sô vectơ bằng sô chỉnh hợp chập 2 trong 4 điểm A 4 = 4.3 = 12. 1.2. a) A„ = 20 n n e N, n > 3 o ■ - = 20 n o ( n - 2 ) ( n - l ) - 20 = 0 (n -3 )! o n 2 - 3n - 18 = 0 < > n = 6 (n = -3 bị loại). = b) A„ - aỊj = 3 n e N, n > 2 o — —--------- —— = 3 o> n(n - 1) - n - 3 = 0 ( n - 2 )! ( n - 1)! o n 2 - 2n - 3 = 0 < > n = 3 (n = -1 bị .loại) = c) 3 A„ + 42 = AẶn n e N, n > 2 o 3n(n - 1) + 42 = 2n(2n - 1 ) 0 3n2 - 3n + 42 = 4n 2 - 2n o n ' + n - 42 = 0 < > n = 6 ( n = -7 bị loại). = 1.3. Số có 3 chữ số khác nhau lấy từ 5 chữ số 0, 2, 4, 6 , 8 là một chỉnh hợp chập 3 của 5, do đó có tất cả A 5 = 5. 4. 3 = 60 (số). Trong đó có một số bắt đầu bằng số 0 mà ta cần loại bớt. Có thể coi mỗi số bắt đầu bằng số 0 • > , 2 như một chình hợp chập 2 của 4 sô còn lại, như vậy có tất cá A ị = 4. 3 = 12 (số). Còn lại 60 - 12 = 48 số. 1.4. Sô cách chọn bằng sô chỉnh hợp chập 3 của 50: A 50 = 50.49.48 = 117600. 1.5. Số chẵn phải tận cùng (tức là hàng đơn vị) bằng 0, 2 hoặc 4. Nếu tận cùng bằng 0 thì còn lại 4 chữ số đầu lấy trong số 5 chữ số còn lại như vậy có A 5 = 5. 4. 3. 2 = 120 (số). Nếu tận cùng bằng 2 hoặc 4 thì chữ số đầu (hàng chục ngàn) phải khác 0 do đó có 4 cách chọn, còn 3 vị trí ờ giữa (hàng ngàn, hàng trãm, hàng chục) có thể chọn trong 4 số còn lại tức là một chinh hợp chập 3 của 4. Như vậy 115
  16. có tất cả 2. 4. A 4 = 2. 4. 4. 3Ỗ = 192 (số). Tổng cộng có: 120 + 192 = 312 2 số chẵn gồm năm chữ số lấy từ sáu chữ số đã cho 0, 1,2, 3, 4, 5. l ễ6 ẻ Số trận đấu bằng số chỉnh hợp chập 2 của 24: A 24 = 24. 23 = 552 trận. 1.7. Vì ngồi quanh bàn tròn nên có thể sắp các cụ ông ngồi trước sau đó sắp các cụ bà và các em, hoặc ngược lại sắp các em sau đó sắp các cụ bà, như vậy có 2 cách sắp xếp 3 nhóm. Vì có 3 cụ ông nên có 3! cách sắp chỗ cho các cụ ông, có 2! cách sắp chỗ cho 2 cụ bà và 5! cách sắp chỗ cho 5 em, tổng cộng có: 2 . 3! . 2! . 5! = 2. 6 . 2.120 = 2880 cách sắp chỗ. l ễ8 . Nếu 6 người ngồi thành một hàng ta có 6 ! cách sắp xếp. Nếu ta xếp 3 cặp vợ chồng thì có 3! cách sắp xếp 3 cặp, nhưng vợ chồng lại có thể đổi chỗ cho nhau nên tất 'cả có 2 3.3! = 8.6 = 48 cách. l ẵ9. a) Có 14! cách sắp 14 sách lên trên giá b) 4 môn nên có 4! cách sắp xếp sách cùng môn lên giá, trong môn Toán thì có 3 sách nên có 3! cách sắp xếp, 4! cách sắp xếp sách Lí, 2! cách sắp sách Hoá, 5! cách sắp sách Sinh. Tất cả có 4!. 3!. 4!. 2!. 5! = 24. 6 . 24. 2. 120 = 829440 cách. 1.10. 5 chữ số có 5! cách sắp xếp, tức là có 120 số 5 chữ số. Nếu 1 và 2 đứng cạnh nhau thì có 4 cách sắp chỗ, sau đó có thể đổi chỗ 1 và 2, còn lại 3 số thì có 3! cách sắp xếp. Như vậy tổng cộng có 4. 2. 6 = 48 số 5 chữ số trong đó 1 và 2 đứng cạnh nhau. Trong 72 số còn lại 2 số 1 và 2 không đứng cạnh nhau. l ếl l ẽ Số đường thẳng bằng số tổ hợp chập 2 tức là có c ị đường thẳng. 1.12. Đa giác lồi n cạnh có n đỉnh, nối 2 đỉnh ta được đoạn thảng, mỗi đoạn hoặc là cạnh, hoặc là đường chéo, do đó số đường chéo bằng n(n-l) n(n - 3) - n= 2 2 1.13. a) Số tam giác nội tiếp là c ^2 ■ b) Số tứ giác nội tiếp là Cị 2 116
  17. 1.14ễ a) Số cách lấy 5 trong 10 bi là C ịq ; 2 3 b) Số cách lấy 5 bi trong đó có 2 bi trăng là Cị . C 4 ; c) Số cách lấy là cị . cị + cị . cị + cị . c\ + ; d) Số cách lấy là Cg . C4 + c ị . C 4 . 1.15. 10 người 7 nam, 3 nữ a) Có Cjo = — ^ ^ =120 cách chọn uỷ ban. 763 b) Có C 7 . C 3 = ——— = 63 cách chọn uỷ ban trong đó có 1 nữ. c) Có C7 . C 3 + C 7 . C 3 + C 7 . C3 cách chọn uỷ ban trong đó có ít nhất 1 nữ. ĐÁP SỐ BÀI TẬP CHƯƠNG 2 2.1ễ Số cách lấy 6 vé trong 10 vé c^ừ, nếu lấy được vé số 1 thì còn lại 5 vé trong số 9 vé, do đó: p, = Ậ = 0 ,6 , tương tự p „ = - ậ - = ỉ . Ho Mo 2ễ2. Số số máy điện thoại 105, số có năm chữ sô' khác nhau A jo , số nãm chữ số đều lẻ s 3 p, = ^ = 0.3024 ; P b = -^ =¿ 103 lO l ( r3 32 32 'K • » • » 3 ' 2.3. Số để CiQ, xác suất đê không học cả 3 câu là Cg vậy xác suất đê trả lời được ít nhất một cãu là 1- = 1 -0,0491 =0,9509. C20 117
  18. 2.4. Có thể lập luận như sau: Bi cuối cùng có thể là bất cứ bi nào trong 6 bi, _. / 4 2 nếu là bi đen thì phải chon trong số 4 bi đen. Vây xác suất là — = —. 6 3 Nếu giải theo chỉnh hợp thì có 6 ! cách sắp xếp 6 bi vào 6 chỗ (tức là 6 ! hoán vị). Trong số đó có 4 cách chọn bi đen đứng cuối, còn lại 5! hoán vị 5! 4 2 của các bi còn lại: p = 4. — = — = —. 6! 6 3 Nếu giải theo tổ hợp thì có c ị cách chọn 4 trong 6 chỗ để xếp bi đen, nếu xếp một bi đen vào chỗ cuối thì còn lại C 5 cách chọn 3 chỗ để xếp 3 bi đen còn lại. ct 6 3 2.5. Gọi A] là sự kiện bi lấy từ hộp thứ nhất màu trắng, B] là màu xanh, C| là màu đỏ. Tương tự đối với hộp thứ hai ta có A 2, B2, c 2. Coi các sự kiện A ị, A 2 độc lập ta có: Xác suất để được 2 bi trắng , .. , 3 10 30 p(Aj). p(A2) = T7 -TT = - 25 25 625 Tương tự , xác suất để được hai bi xanh 15 9 135 PCB,>. pCB2) = i | . ^ = i | | Xác suất để được hai bi đỏ P(C1). P(C2)= - ^ . Ậ = -42 25 25 625 Theo quy tắc cộng đơn giản, ta có xác suất để hai bi cùng màu: 30 135 42 207 „ ------ 1------ 1----- — - - ------ « 0,331. 625 625 625 625 2.6. Gọi A là sự kiện người gặp ngẫu nhiên trong vùng là người mắc bênh tim, B là sự kiện mắc bệnh huyết áp, A n B là sự kiện mắc cả hai bênh A u B là sự kiện mắc ít nhất một trong hai bệnh, ta có: 118
  19. p(A u B ) = p(A) + p(B) - p(A n B) = 0,09 + 0,12 - 0,07 = 0,14. Sự kiện người đó không mắc hai bệnh tim và huyết áp là sự kiện đối lập của sự kiện A u B , như vậy xác suất để người gặp ngẫu nhiên trong vùng không mắc hai bệnh nói trên bằng 1 - 0,14 = 0,86. 2.7. a) Xác suất để cả 3 đều yếu bằng - ệ - . c 30 ç3 b) Xác suất để ít nhất có một học sinh giỏi bằng 1 ----- . C30 d C99 c) Xác suất đế có đúng một học sinh khá —. '30 2 .8 . 10 sản phẩm chia đôi có tất cả c^o cách, hai phần có số chính phẩm như nhau thì số cách chia sao cho phần 1 có 3 chính phẩm bằng C 5 vậy p = - '10 , 9 2 7 ? X 2.9. a) Số cách lấy lần lượt 2 sản pham A 10, xác suất đế được 2 phế phấm bằng A jo 45 _n b) Số cách lấy một lúc 2 sản phẩm C jo, xác suất đê được 2 phế phẩm bằng r2 45 Ho 2 2 c) Số cách lấy được 2 phế phẩm bằng — = 0,04. 10 10 1 2.10. Xác suất để được hai mặt sấp bằng —. Xác suất của sự kiện đối lập bằng 3 . , —. Goi n là số lần gieo 2 đồng tiền, xác suất đê n lần không ra 2 măt 4 (3V sấp bằng — . Xác suất để ít nhất có một lần ra 2 mặt sấp bằng 119
  20. 1 - > 0,99 —ì < 0 ,0 1 o n l o g — < log( 0 ,0 1 ) w 4 _ log(0 , 01 ) n > ---- -— < > n > 1 /. = log(0,75) 2Ể 11. Gọi AỊ là sự kiện người bắn thuộc nhóm giỏi, A 2 sự kiện người bắn thuộc nhóm khá, A 3 sự kiện người đó thuộc nhóm trung bình, A4 sự kiện người đó thuộc nhóm đạt. Gọi B là sự kiện bắn trượt, ta có: p(A j) = P(B/A,) = 0,2 p(A2) = p(B/A2) = 0,3 lo lo P(A3) = 7 7 ; p(B/A3) = 0,4 p(A4) = p(B/A4) = 0,5. lo lo a) p(B) = — . 0,2 + — . 0,3 + — . 0,4 + — . 0,5 « 0,3167. 18 18 18 18 * b) Các xác suất hậu nghiệm: P(A,/B) = — ■p(A2/B) = 2,1/5,7; p(A3/B) = = — ' 5,7 5, V Nhiều khả năng người bắn trượt là người nhóm khá. 2.12. Gọi A) là sự kiện sản phẩm của máy I, A 2 là sự kiện sản phẩm của máy II. Gọi B là sự kiện sản phẩm tốt, ta có: 2 1 P(A,) = I ; p (A2 ) = ị ; p(B/Aj) = 0,97; p(B/A2) = 0,98. 2 1 7 Q7 a) p(B) = I . 0,97 + - . 0,98 = = 0,9733; 1 94 0 98 *b) p(A l/ B ) = ^ Ì ; p ( A 2/B ) = ^ . Nhiều khả nãng sản phẩm tốt là sản phẩm của máy I. 2.13. Gọi Aj là sự kiện người ta gặp là người nghiện thuốc lá, A 2 là sự kiện người đó không hút thuốc lá, gọi B là sự kiện người đó viêm họng. p(Aị) = 0,3; p(A2) = 0,7; p(B/A,) = 0,6; p(B/A2) = 0,4. 120
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2