intTypePromotion=3

Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Hoàng Ngọc Nhậm

Chia sẻ: Minh Anh | Ngày: | Loại File: PDF | Số trang:149

0
156
lượt xem
70
download

Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Hoàng Ngọc Nhậm

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phần 2 cuốn giáo trình "Lý thuyết xác suất và thống kê toán" nối tiếp phần 1 trình bày các nội dung của 4 chương cuối (từ chương 5 đến chương 8) bao gồm: Hàm của các đại lượng ngẫu nhiên và quy luật số lớn, mẫu ngẫu nhiên, ước lượng đặc trưng của tổng thể, kiểm định giả thiết thống kê. Đây không chỉ là tài liệu hữu ích dành cho sinh viên các khối ngành kinh tế dùng làm tài liệu học tập mà còn giúp ích cho tất cả những ai đang làm các công việc phải xử lý một khối lượng lớn thông tin, số liệu.

Chủ đề:
Lưu

Nội dung Text: Giáo trình Lý thuyết xác suất và thống kê toán: Phần 2 - Hoàng Ngọc Nhậm

  1. íỳiáty trinh Lị thuyết xúc tuất oà tỊỊúutạ kê toán Chương 5 HÀM CÁC ĐẠI LƯỢNG N G Ẫ U NHIÊN VÀ LUẬT S Ố L Ớ N I- Hàm của các đại lượng ngẫu nhiên Trong thực t ế , ta thường gặp trường hợp m ộ t đ ạ i lượng ngẫu n h i ê n là h à m số của một hay nhiều đ ạ i lượng ngẫu n h i ê n k h á c . K h i đó n ế u b i ế t được qui luật p h â n „ p h ố i x á c suất của c á c đ ố i số thì ta có t h ể tìm được qui luật p h â n p h ố i x á c suất của c á c h à m số tương ứng. Ì- Qui luật phân phối xác suất của hàm một đại lượng ngẫu nhiên N ế u v ớ i m ỗ i giá trị có t h ể GÒ của đ ạ i lượng ngẫu n h i ê n X , qua h à m f ( X ) , ta x á c định được một giá trị của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của đ ạ i lượng ngẫu n h i ê n X : Y = f(X) a- Trường, hợp X là đại lượng ngẫu nhiên rời rạc và ứng với các giá trị khác nhau của X ía có các giá trị khác nhau của Y Trường hợp này, ứng với mỗi giá trị có thể nhận của X ta chỉ có m ộ t giá trị có t h ể nhận của Y , tức: (X=x ) = [Y=f(x ) = y ] (Vi) i i i Suy ra: ' P(X= Xi) = P(Y= y o (Vi) 108 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  2. ŨhưỞ4UỊ. 5: Jốàni của eáe. đại lượng, ngẫu nhiên oà. luật IJỐ lởn. Thí dụ ỉ: Đ ạ i lượng ngẫu n h i ê n X có bang p h â n p h ố i x á c suất n h ư sau: X 2 3 4 p 0,3 0,5 0,2 2 T ì m qui luật p h â n p h ố i x á c suất của Y = X Giải: Các giá trị mà Y có thể nhận là: yi = 2 = 4; y = 3 = 9; y = 4 = 16 2 2 2 3 2 P(X= 2) = P(Y= 4) = 0,3; P(X= 3) = P(Y= 9) = 0,5; P(X= 4) = P(Ỷ= 16) = 0,2; Vậy phân phối xác suất của Y như sau: Y 4 9 16 p 0,3 0,5 0,2 b- Nếu tương ứng với hai (hay nhiều hơn 2) giá trị của X ta có một giá trị của Y Chẳng h ạ n ứng v ớ i 2 giá trị có t h ể nhận của X ta chỉ có m ộ t giá trị có t h ể n h ậ n của Y , tức: (Y=y ) = (X=x )u(X=Xj) k t Do các biến cố (X= Xt) và (X= Xj) xung khắc, áp dụng công thức cộng x á c suất ta c ó : P(Y=y ) = P(X= x ) + P(X=Xj) k t Thí dụ 2: Đại lượng ngẫu nhiên X có bảng phân phối xác suất như sau: 109 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  3. éịiáữ trình bị tluiụẾt xòe, mủi tui thống, kè toán X -2 1 2 p 0,1 0,4 0,5 T i m qui luật p h â n p h ố i x á c suất của Y = X Giải: Ta có: khi X = - 2 thì Y = ( - 2 ) = 4; 2 khi x = Ì thì Y = Ì = Ì; 2 K h i X = 2 thì Y = 4 ; N h ư vậy: (Y=4) = [ ( X = - 2 ) U ( X = 2 ) ] Do đ ó : P ( \ = 4) = P ( X = - 2 ) + P ( X = 2) = 0,6 Và: P(Y= 1) = P(X= ì) = 0,4 V ậ y qui luật p h â n phối x á c suất của Y n h ư sau: Y 1 4 p 0,4 0,6 c- Trường hợp X tò đại lượng ngẫu nhiên liên tục G i ả sử đ ạ i lượng ngẫu n h i ê n X liên tục v ớ i h à m mật độ x á c suất f ( x ) đã b i ế t và Y la ham s ố của X : Y = f(X) Có thể chứng minh được rằng: Nếu Y = f(X) là hàm khả vi, đơn đ i ệ u tăng hoặc đơn đ i ệ u g i ả m , có h à m ngược là X = *F(y) thì h à m mật độ x á c suất (p(y) của đ ạ i lượng n g ẫ u n h i ê n Y được x á c định bằng b i ể u thức: 9(y) = f [ ĩ ' ( y ) ] | T ' ( y ) | v 2- Qui luật phân phối xác suất của hàm hai đại lượng ngẫu nhiên IU Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  4. thường. 5: Vỗàm cùa các đại lưựnạ ngẫu nhiên oà luật iế lán N ế u ứng v ớ i m ỗ i cặp giá trị có t h ể nhận của hai đ ạ i lượng ngẫu nhiêri X và z có m ộ t giá trị có t h ể nhận của đ ạ i lượng ngẫu n h i ê n Y thì Y được g ọ i là h à m của 2 đ ạ i lượng ngẫu n h i ê n X và z Y = q>(X, Z) Nếu biết được qui luật phân phối xác suất của X và z, ta có t h ể t ì m đ ư ợ c q u i l u ậ t p h â n p h ố i x á c s u ấ t c ủ a Y = (p(X, Z) Để tìm các giá trị mà Y có thể nhận và tính các xác suất tương ứng của Y n g ư ờ i ta thường t i ế n h à n h l ậ p bảng, Đ ể b i ế t c á c h l ậ p b ả n g n à y la x é t m ộ t thí dụ sau đ â y : Thí dạ: Có 2 máy cùng sản suất một loại sản phẩm, tỷ lệ sản phẩm l o ạ i A của m á y thứ nhất là 0,8; của m á y thứ hai là 0, 7; L ấ y 3 sản p h ẩ m do m á y thứ nhất sản xuất và Ì sản p h ẩ m do m á y thứ hai sản xuất đ ể k i ể m tra. T i m quy luật p h â n p h ố i x á c suất của số sản p h ẩ m l o ạ i A có trong 4 sản p h ẩ m l ấ y ra từ hai m á y đ ể k i ể m tra ? Giải: Gọi X là số sản phẩm loại A có trong 3 sản phẩm lấy ra từ máy thứ nhất đ ể k i ể m tra. D ễ thấy rằng X ~ B(3; 0,8). N ê n ta d ễ d à n g tìm được b ả n g p h â n p h ố i x á c suất của X như sau: X 0 1 2 3 p 0,008 0,096 0,384 0,512 G ọ i z là số sản phẩm l o ạ i A có trong Ì sản p h ẩ m l ấ y ra từ m á y t h ứ hai đ ể k i ể m tra z ~ B ( l ; 0,7). B ả n g p h â n p h ố i x á c suất của z n h ư sau: z 0 1 p 0,3 0,7 G ọ i Y là số sán p h ẩ m l o ạ i A có ư ơ n g 4 sản p h ẩ m l ấ y ra từ hai m á y đ ể k i ể m ư a thì: Y = x + Z Hỉ Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  5. ì íịiáo trình, lý. thuyết xòe, mất oà. thống, kẻ toán tức Y là h à m của hai đ ạ i lượng ngẫu n h i ê n X và z . Để tìm qui luật phân phối xác suất của Y, trước hết ta tìm các giá trị m à Y có t h ể nhận. M u ố n v ậ y ta l ậ p b ả n g n h ư sau: 0 1 2 3 z \ 0 0 1 2 3 1 1 2 3 4 Trong bảng trên d ò n g X ta ghi c á c giá trị m à X có t h ể nhận. (trong thí dụ ta đ a n g xét, X có t h ể nhận c á c giá trị 0, Ì , 2, 3) Cột z ghi cạc giá trị mà z có thể nhận. Trong thí dụ này, z'chỉ có t h ể nhận m ộ t trong hai giá trị: 0 hoặc 1; Các ô còn lại ta ghi các giá trị mà Y có thể nhận. Để xác định các giá trị n à y ta c ă n cứ v à o b i ể u thức của h à m b i ể u đ i ể n m ố i quan hệ giữa Y v ớ i X và z , trong thí dụ ta đ a n g x é t b i ể u thức h à m n à y có dạng: Y = X + z , đồng thời c ă n cứ v à o giá trị của X và z ở cột và d ò n g tương ứng. Chẳng hạn: Y nhận giá trị 0 khi X = 0 đồng thời z = 0; Y = l khi x = 0 đồng thời z = Ì hoặc X = Ì đồng thời z = 0 (tương ứng v ớ i hai ừường hợp n à y t r ê n b ả n g có hai ô ghi s ố 1) Vậy các giá trị mà Y có thể nhận là: 0, Ì, 2, 3, 4. Ta có thể biểu diễn việc phân tích ề Xiên dưới dạng tổng và tích các b i ế n c ố như sau: ( Y = 0) = [ ( X = 0)(Z = 0)] ( Y = 1) = [ ( X = 0)(Z = 1)] u [ ( X = 1)(Z = 0)] ( Y = 2) = [ ( X = 2)(Z = 0)] u [ ( X = 1)(Z = 1)] 112 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  6. (Phương. 5: 7Càm eủa eáe đại /ưựttạ ngẫu nhiên g ã luật tố lởn ( Y = 3) = [ ( X = 2)(Z = 1)] u Ĩ ( X = 3)(Z = 0)] ( Y = 4 ) = [(X = 3)(Z=1)] Á p dụng c ô n g thức cộng x á c suất và công thức nhân xác suất, ta tính c á c x á c suất tương ứng v ớ i c á c giá trị của Y như sau: P(Y = 0) = P(X = 0).P(Z = 0) = 0,08. 0,3 = 0,0024 • P(Y = 1) = P(X = 0).P(Z = 1) + P(X = 1).P(Z = 0) = 0,008. 0,7 + 0,096. 0,3 = 0,0344 P(Y = 2) = P(X = 2).P(Z = 0) + P(X = 1).P(Z = 1) = 0,384. 0,3 + 0,096. 0,7 = 0,1824 P(Y = 3) = P(X = 2).P(Z = 1) + P(X = 3).P(Z = 0) = 0,384. 0,7 + 0,512. 0,3 = 0,4224 P(Y = 4) = P(X = 3).P(Z = 1) = 0,512. 0,7 = 0,3584 V ậ y ta có qui luật p h â n p h ố i x á c suất của Y như sau: Y 0 1 '-. 2 3 4 p 0,0024 0,0344 0,1824 0,4224 0,3584 • Trường hợp X, z là các đại lượng ngẫu nhiên liên tục C ó t h ể chứng (ninh được rằng: h à m m ậ t độ x á c suất (p(y) của Y ( Y = X + Z) được x á c định theo công thức: y ' y cp(y)= Jf (x)f (y-x)dx 1 ỉ Hoặc: Ịf, ( y - z ) f 2 (z)dz f ị và Ỉ2 là c á c h à m m ậ t độ x á c suất của X và z tương ứng [ v ớ i đ i ề u k i ệ n là khi m ộ t trong 2 h à m n à y . x á c định trong khoảng (-00, +oo) bằng m ộ t b i ể u thức] 113 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  7. íịiá& trịnh dị t/uiụết xác xuất MÌ thống, kê toán 3- C á c t h a m s ố đ ặ c t r ư n g c ủ a h à m c á c đ ạ i l ư ợ n g n g ẫ u n h i ê n G i ả sử đ ạ i lượng ngẫu nhiên r ờ i rạc X có p h â n p h ố i x á c suất như sau: X Xi x 2 p P' P2 Pn Ta cần tìm kỳ vọng toán và .phương sai của đ ạ i lượng ngẫu n h i ê n Y [Y = (p(X)]. C á c tham số đặc trưng n à y được x á c định bằng c á c c ô n g thức sau: E(Y) = E[(p(X)]=ịọ(x )p i i Var(Y) = Var[
  8. thường. 5: 7õàtii của các đại lường. Iiạẫii nhiều oà luật tá' lân xét đồng thời một số lớn các đại lượng ngẫu nhiên thì tính "ngẫu n h i ê n " của h i ệ n tượng mất đi và qui luật tất nhiên của nó được t h ể hiện. Đối với thực tiễn thì điều quan trọng là phải xác định các điều k i ệ n trong đó t á c động đồng thời của nhiều n g u y ê n nhàn niiẫn nhiên sẽ dẫn đ ế n k ế t quả gần như k h ô n g phụ thuộc gì v à o c á c y ế u tô ngẫu n h i ê n nữa và khi đó ta có t h ể dự đ o á n được t i ế n ưình của h i ệ n tượng. C á c đ i ề u k i ệ n n à y được chỉ ra trong c á c định lý có t ê n là luật số lớn. Định lý Chebyshev là định lý tổng q u á t nhấí của luật số l ớ n , c ò n định lý Bernoulli là định lý đơn giằn nhất. Để chứng minh' các định lý này ta sử dụng bất đẳng thức Chebyshev. Ì- Bất đẳng thức Chebyshev C ó t h ể chứng minh được rằng: N ế u X là đ ạ i lượng ngẫu n h i ê n có k ỳ vọng toán và phương sai hữu hạn thì v ớ i m ọ i số dương s b é tùy ý, ta đ ề u c ó : Var(X) P(|X-E(X)11- 2 E B ấ t dẳng thức Chebyshev c ò n được b i ể u d i ễ n dưới dạng k h á c như sau: Var(X) P(|X-E(X)ị>8)< s 2 v ề m ặ t thực t i ễ n , b ấ t đẳng thức Chebyshev ít có ý nghĩa vì nó chỉ cho p h é p đ á n h giá cận trên hoặc cận d ư ớ i x á c suất đ ể đ ạ i lượng ngẫu n h i ê n X nhận giá trị sai lệch so v ớ i kỳ vọng toán của nó b é hơn hoặc nhỏ hơn m ộ t số dương s b é tùy ý chơ trước n à o đ ó . Nhưng v ề mặt lý thuyết, bất đẳng thức Chebyshev có ý nghĩa rất l ớ n , nó được sử dụng đ ể chứng minh c á c định lý của luật số lớn. 115 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  9. íịiáú trình lự thuyết xòe. Mất OÀ tkếttạ kẻ toán Thí dụ: Thu nhập trung bình của c á c hộ gia đình ở m ộ t v ù n g là 900 U S D / n ă m và độ lệch chuẩn là 120 USD. H ã y x á c định khoảng thu nhập xung quanh giá trị trung bình của ít nhất 95% h ộ gia đình ô vùng đ ó . Giải: Gọi X là thu nhập của một hô gia đình ở vùng này thì X là đại lượng ngẫu nhiên v ớ i qui luật p h â n p h ố i chưa b i ế t , nhưng E ( X ) = 900 và a x = 120.'Do đó theo bất đẳng thức Chebyshev, ta c ó : p(jx-E(X)|.l-^^ y 6 . ì . = > P ( ị x - 9 0 0 | < e ) > l - ^ y - = 0,95 £ Từ đó ta tìm được s = 536,656 Vậy ít nhất 95% hộ gia đình ở vùng đó có thu nhập hàng năm nằm trong khoảng (900 - 536,656; 90Ọ + 536,656) tức thu nhập của c á c hộ gia đình trong khoảng (363,344;• 1436,656) U S D / n ă m . 2- Định lý Chebyshev Nếu các đại lượng ngẫu nhiên X[, X2 , x độc lập từng đôi, n có kỳ vọng toán hữu hạn và c á c phương sai đ ề u bị chặn t r ê n b ở i hằng số c [Var(Xị) < c ; V i = thì Ve > 0 b é tùy ý cho trước ta luôn c ó : Lim P(|-ẳX -lẳE(X )|
  10. @hưư4iạ 5: Jôàm của oán đại tường, ngẫu nhiều oà luật- úi lứtỊ Ị n \ Ị n E(X) = E \ n t í ) n tí Ì X- 2 1 T- 2 Var( X ) = Var yntỉ ) n i = l Áp dụng bất đẳng thức Chebyshev cho đại lượng ngẫu nhiên X ta có: , , Var(X), X ( i ) V a r X P(|X-E(X)| < £ ) > ! - - ^ 7 ^ = 1 - — Ì ; n .e 2 2 Theo g i ả thiết: V a r ( X ị ) < c (V i = 1,«). Do đó, trong b i ể u thức trên, n ế u ta thay m ỗ i V a r ( X i ) ( i = 1,«) bằng c thì bất đẳng thức sẽ chỉ mạnh thêm. P(|X-E(X)| L i m ( l - -—J) = Ì n-»oo .n-»« n_g Ta chú ý rằng, x á c suất của b i ế n c ố k h ô n g thể lớn hơn 1. Do đ ó : LimP|x-E(X)| 0 b é tùy ý ta- luôn c ó : 117 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  11. ì JQ_ LimP < 6 = 1 n—>00 ni*' • Bản chất của định lý Chebyshev I •!.!•; r i u In vhcv J ã chứng tỏ sự ổ n định của ư u n g bình số học của một số lớn c á c đ ạ i lượng ngẫu nhiên xung quanh trung bình số học c á c kỳ vọng toán của c á c đ ạ i lượng ngẫu n h i ê n ấy. N h ư v ậ y , mặc dù từng đ ạ i lượng ngẫu n h i ê n độc l ậ p có t h ể nhận giá trị sai k h á c nhiều so v ớ i kỳ vọng toán của c h ú n g , nhưng trung bình sù học của một số l ớ n c á c đ ạ i lượng ngẫu n h i ê n l ạ i nhận giá trị gần bằng trung bình số học của c á c kỳ vọng toán của c h ú n g v ớ i xác suất rất lớn'. Đ i ề u đó cho p h é p d ự đ o á n giá trị giá trị trung bình số học của đ ạ i lượng ngẫu n h i ê n . Trong thực tế, định lý Chebyshev được ứng dụng rộng rãi trong nhiều lĩnh vực. Chẳng hạn, trường hợp r i ê n g của nó là cơ sở cho phương p h á p đo lường trong v ậ t lý. N h ư c h ú n g ta đ ề u b i ế t , đ ể xác định m ộ t đ ạ i lượng n à o đ ó , n g ư ờ i ta thường t i ế n h à n h đ o n h i ề u lần và l ấ y ừung bình số học của c á c k ế t quả đ o ấy l à m giá trị thực của đ ạ i lượng cần đ o . Thật vậy: ta có thể coi kết quả của n lần đo là các đại lượng ngẫu nhiên Xị, X2, . . . , X . C á c đ ạ i lương n à y độc l ậ p từng đ ô i , có cùng n kỳ vọng toán (kỳ vọng toán của c á c đ ạ i lượng ngẫu n h i ê n n à y chính là giá trị thực của đ ạ i lượng cần đo) và phương sai của c h ú n g đ ề u bị chặn trên bởi chính độ chính x á c của t h i ế t bị d ù n g đ ể đo. Vì t h ế theo trường hợp r i ê n g của định lý Chebyshev thì trung bình số học của c á c k ế t quả đo sẽ sai lệeh r ấ t ít so v ớ i giá trị thực của đ ạ i lượng cần đo và đ i ề u đó x ả y ra v ớ i x á c suất gần bằng 1. Định lý Chebyshev còn là cơ sở cho một phương pháp được áp dụng rộng rãi trong thống k ê là phương p h á p mẫu mà thực chất là 118 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  12. (?ilười UI 5: JCtưn cua eáe đai Ixíđ4iạ ngẫu nhiên oà Lưu lơ lởn dựa v à o m ộ t m ẫ u khá nhỏ ta có thể k ế t luận v ề toàn bộ tập hợp c á c đ ố i tượng cần n g h i ê n cứu. Chẳng hạn để đánh giá năng suất cây trồng ở một vùng nào đó n g ư ờ i ta k h ô n g cần phải đ i ề u tra toàn bộ d i ệ n tích trồng l o ạ i cây n à y mà chỉ c ầ n dựa v à o k ế t quả thu hoa ch cửa một mẫu mà v ẫ n đưa ra được c á c k ế t luận đủ chính x á c v ề n ă n g suất c â y trồng của vùng đ ó . 3- Định lý Bernoulỉi Nếu F là tần suất xuất hiện biến cố A trong n phép thử độc lập và n p là x á c suất xuất h i ệ n b i ế n c ố trong m ỗ i p h é p thử đó thì v ớ i m ọ i e dương b é tùy ý, ta luôn luôn c ó : Lim p(| F - p I < E) = Ì n Chứng minh: Gọi X là số lần xuất hiện biến cô A trong n phép thử đ ộ c l ậ p . X i (ỉ = ỉ,n) là số l ầ n xuất hiện b i ế n c ố A trong p h é p thử thứ I I >0 thú > M ne X j có p h â n p h ố i xác suất như sau: Xi 0 1 p q p Trong d ỏ . li q= Ì - p , Tri thấy: X i=l iu \ n E(Xi) = o.q + l.p = p => E(X) = E £ x i =£E(X,)=np V i=l ) i=i .2 Var(Xị) = E( X?) - [E(Xi)] = p - p = p(l - p) = p.q 2 2 í ^"n => V a r ( X ) = Var X x . = L V a r ( X . ) =' P l n ( i=i 119 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  13. íịiáữ trình tụ. thuyết xòe, mất oà. tháng, kê tơón X é t đ ạ i lượng ngẫu n h i ê n F = — . Ta thấy F n n chính là t ầ n suất n xuất h i ệ n b i ế n c ố A ư ơ n g n p h é p thử độc l ậ p . ' X Ì Ì EÍF ) = E - n = - E ( X ) = -n.p = p vnj n n V a r ( F ) = Var 1 Var(X) = ^ U H n n n n Á p đụng bất đẳng thức Chebyshcv cho đ a i lưrtng ngẫu n h i ê n F n ta có: P ( | F - p | < e ) > l - - £ ị n n.£^ L ấ y giới hạn cả 2 v ế k h i n - > 00 ta c ó : LimP(| F - p | < s ) > L i m (Ì - ^ 4 ) n = Ì ne M ặ t k h á c , vì x á c suất k h ô n g t h ể lớn hơn Ì, do đ ó : Lim P(| f - p| < e) = Ì n * Ý nghĩa: Định lý Bernoulli chứng minh sự h ộ i tụ theo x á c suất của t ầ n suất xuất h i ệ n .biến c ố trong n p h é p thử độc l ậ p v ề x á c suất x u ấ t hiện b i ế n c ố đó trong m ỗ i p h é p thử khi số p h é p thử t ă n g l ê n vô hạn. N ó chứng tỏ sự ổ n định của t ầ n suất xung quanh giá trị x á c suất của b i ế n c ố đ ó . Định lý Bernoulli là cơ sở lý thuyết cho định nghĩa thống k ê của x á c suất, do đó nó cũng là cơ sở cho m ọ i á p dụng định nghĩa thống k ê của xác suất trong thực t ế . 120 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  14. &uứfrtạ ó: Mẫu ngẫu nhiên Phần 2 T H Ô N G K Ê T O Á N Thống kê toán là bộ môn toán học nghiên cứu qui luật của các hiện tượng ngẫu n h i ê n có tính chất số lớn trên cơ sở thu thập và xử lý c á c s ố l i ệ u thống k ê - c á c k ế t quả quan sát. N h ư v ậ y n ộ i dung chủ y ế u của thống k ê toán là x â y dựng c á c phương p h á p thu thập và x ử lý c á c số l i ệ u thống k ê n h ằ m rút ra c á c k ế t luận khoa học. C á c phương 1 p h á p thống k ê toán là công cụ đ ể g i ả i quyết nhiều vấn đ ề khoa học và thực t i ễ n nảy sinh trong c á c lĩnh vực k h á c nhau của tự n h i ê n và kinh t ế xã h ộ i . C h ư ơ n g 5: M Ẫ U N G Ẫ U NHIÊty I- Tổng thể Ì- Kh4i niệm K h i n g h i ê n cứu c á c v ấ n đ ề kinh te - xã h ộ i , cũng như nhiều v ấ n đ ề thuộc c á c lĩnh vực k h á c , n g ư ờ i ta thường phải khảo sát m ộ i hay một số d ấ u h i ệ u định tính hay định lượng n à o đó. C á c dấu h i ệ u n à y t h ể h i ệ n t r ê n nhiều phần tử k h á c nhau. T ậ p hợp tất cả các phần tử chứa đựng thông tin v ề c á c dấu h i ệ u ta cần nghiên cứu được g ọ i là tập hợp chính hay tổng thể. ~> Chẳng hạn, một doanh nghiệp cần nghiên cứu tập hợp các khách 121 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  15. QiáA trình bị ưuujẤ't xác uiất nả thấtig. kê toán h à n g của mình theo c á c dấu h i ệ u như: mức độ h à i lòng của khách h à n g v ề sản phẩm hay dịch vụ của doanh nghiệp (dấu h i ệ u định tính) hoặc nghiên cứu theo dấu h i ệ u định lượng là nhu cầu của khách hàng v ề số lượng sản phẩm của doanh nghiệp. Trong trường hợp này thì tạp hợp g ồ m tất cả c á c k h á c h h à n g của doanh nghiệp là tổng thể. Đối với tổng thể, ta sử dụng một số khái niệm và ký hiệu sau đây: • N: Số phần tử của tổng thể và được gọi là kích thước của tổng thề. Kích thước của tổng thể phụ thuộc v à o v ấ n đ ề và p h ạ m v i nghiên cứu. • X* : Dấu hiệu ta cần khảo sát, nghiên cứu (trong kinh tế thường gọi là chỉ tiêu).. D ấ u hiệu nghiên cứu có t h ể là định tính hoặc định lượng. Cần nhấn mạnh rằng, khi nói n g h i ê n cứu một tổng t h ể có nghĩa là ta n g h i ê n cứu dấu h i ệ u X* được t h ể h i ệ n trên các p h ầ n tử của tổng thể. • Xi (i = 1,2, k) là các giá trị của dấu hiệu X* đo được trên các phần tử của tổng thể. Xi là những thông tin cần thiết đ ể ta n g h i ê n cứu v ề dấu h i ệ u x \ còn các phần tử của tổng t h ể là những đ ố i tượng mang thông tin. • Ni (i = Ì, 2, .... k): Tần số của Xi - là số phần tử nhận giá trị Xj. * Pi Ú = i, 2 k): Tần suất của X, - là tỷ số giữa tần số của Xi và * , Ni B / £ kích thước tống thế: pi - — - . Ta luôn luôn có 2 ^ p ' - l- 2- Các phương pháp mô tả tổng thể E>ề mô tả một tổng thể ta có thể d ù n g bảng p h â n p h ố i t ầ n số. Dạng .•Sr.ỹ q u á : của bả n ỉ này như sau: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  16. &UÌƯIUỊ ó: MÂU IUỊỖU nhiều Bảng 6.1 Giá trị của X * Xi x 2 x k . T ầ n số (Ni) Ni N 2 N k k H i ể n nhiên: 0 < N i < N và ta luôn có: 2 ^ N ; = N i=l Ta cũng có.thể mô tả tổng thể bằng bảng phân phối tần suất. Dạng tổng q u á t của bảng n à y như sau: Bảng 6.2 Giá trị của X* Xi x 2 x k T ầ n suất (Pi) Pl P2 Pk k Ta l u ô n luôn c ó : 0 < Pi < Ì và ]Tpí =1. i=l * Chùy: Bảng (6.1) và (6.2ì,ró thổ lập dưới dạng cột. Về hình thức, bảng phân phối tần suất của tổng thể tương tự như bảng p h â n p h ố i x á c suất của đ ạ i lượng ngẫu n h i ê n rời rạc. N ó phản á n h cơ cấu của tổng t h ể . 3- Các số đặc trưhg của tổng thể B ả n g 6.1 (hoặc 6.2) m ô tả một c á c h đầy đủ những thông tin v ề dấu h i ệ u X* nhưng cũng khó mà nhớ được những thông tin chi tiết n à y . Vì v ậ y , trong thực t ế n g ư ờ i n g h i ê n cứu thường quan t â m đ ế n những thông tin tổng hợp phản á n h những khía cạnh quan trọng nhất của tổng t h ể theo dấu h i ệ u nghiên cứu. Những thông tin n à y được phẩn á n h qua c á c số đặc trưng sau đây: Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  17. cịiáo trình Lị thuyết xác mất oà. tlÚHtọ. kê tữáiL Ì- Trung bình của tổng thể Trung bình của tổng thể (ký hiệu là ịi), được xác định theo công thức: . k H=2>iPi (6.3) i=l 2- Phương sai của tổng thể Phương sai của tổng thể (ký hiệu là ơ ) được xác định theo công 2 thức: k •i=l I 3- Độ lệch chuẩn của tổng thể Độ lệch chuẩn của tổng thể (ký hiệu là ơ) được xác định theo công thức: ơ=Vỡ (ỂL5). r 4- Tỷ lệ tổng thể Tỷ lệ tổng thể (ký hiệu là p) được định nghĩa như sau: Giả sử tổng thể gồm N phần tử, trong đó có M phần tử có tính chất M Ạ . G ọ i p = — là tỷ l ệ các phần tử có tính chất A của tổng t h ể (hay gọi tắt là tỷ lệ tổng thể), p cũng chính là xác suất lấy được phần tử có tính chất A khi l ấ y ngẫu nhiên một phần tử từ tổng thể. Thí dụ: Ngành cao su có 500.000 công nhân. Để nghiên cứu mức sống của họ, người tá khảo'sát chỉ tiêu X* :" Thu nhập thực tế của công nhân n g à n h cao su" và g i ả sử thu được c á c số l i ệ u cho ở bảng sau: 124 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  18. ót lứtfi tạ ó: Mẫu ngẫu nhiên Bảng 6.6 Thu nhập số công n h â n . T ầ n suất X* ( n g à n / t h á n g ) (Ni) (Pi) 500 50.000 0,10 600 70.000 0,14 700 150.000 0,30 800 120.000 0,24 900 55.000 0,11 1000 30.000 0,06 1100 25.000 0,05 Tống 500.000 1,00 T ừ b ả n g 6.6 ta tính được: • Thu nhập trung bình của công n h â n n g à n h cao su (trung bình tổng t h ể ) là; l i = 500x 0,1 + 600x 0,14 + 700x 0,3 + 800x 0,24 + +900x 0,11 + lOOOx 0,06 + Ì lOOx 0,05 = 750 n g à n đồng. • Phương sai của thu nhập (phương sai của tổng thể): ơ = (500 - 750) .0,1 + (600 -750) .0,14 + (700 - 7 5 0 ) 0,3 + 2 2 2 2 + (800 - 750) .0,24 + (900 - 750) .0,11 + (K)00 - 750) 0,06 2 2 2 + (1100-750) .0,05 =23100 2 • Độ lệch chuẩn của thu nhập (độ lệch chuẩn của tổng thể): ơ = V23100 = 151,987 • T ỷ l ệ công n h â n có thu nhập cao của n g à n h cao su (tỷ l ệ tổng t h ể ) : N ế u ta coi những c ô n g n h â n có mức thu nhập từ 1000 ( n g à n đồng) -trở l ê n là những n g ư ờ i có thu nhập cao thì tỷ l ệ công n h â n có thu nhập cao của n ^ n Ị i cao su Jà: 125 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  19. 4ỳiá& bình bị tluiụết xác tuất oà tliếnạ kê tơÓMi 30000 + 25000 _ n = •— = 0,11 hay 1 1 % F 500000 li- Khái niệm mẫu Đ ể n g h i ê n cứu tổng thể theo m ộ t hay một số dấu h i ệ u n à o đó ta cần n g h i ê n cứu toàn bộ c á c phần tử của tổng t h ể , tức là thống kê toàn bộ táp hợp và p h â n tích từng phần tử của nó theo d ấ u hiệu nghiên cứu. Chẳng hạn đ ể nghiên cứu d â n số của một nước theo các dấu h i ệ u như: giới tính, độ tuổi, nghề nghiệp, trình độ học v ấ n , nơi cư trú, . . . . ta phải t i ế n h à n h tổng đ i ề u tra d â n sô và p h â n tích từng người theo c á c dấu h i ệ u trên sau đó tổng hợp cho toàn bộ d â n số của cả nước. Tuy nhiên trong thực t ế c á c h l à m n à y gặp phải những khó khăn sau đây: • N ế u kích thước của tổng t h ể quá lớn thì v i ệ c n g h i ê n cứu t o à n bộ phải chịu chi phí lớn v ề t i ề n của, thời gian, n h â n lực, phương t i ệ n , . . . d ễ x ả y ra sai sót trong quá trình thu thập thông tin ban đ ầ u , hạn c h ế độ chính x á c của k ế t quả p h â n tích. • Nếu các phần tử của tập hợp lại bị phá hủy trong quá trình điều tra thì phương p h á p n g h i ê n cứu toàn bộ trở thành vô nghĩa . Chẳng hạn: đ ể k i ể m tra chất lượng của c á c hộp sữa do một h ã n g sản xuất thì ta không thể mở tất cả c á c hộp sữa do h ã n g n à y sản xuất đ ể k i ể m tra được. • Có những trường hợp ta k h ô n g t h ể x á c định được )àn bộ các phần tử của tổng t h ể . Trường hợp n à y thường x ả y ra trong v i ệ c đ i ề u tra c á c vấn đ ề thuộc về lĩnh vực xã h ộ i học. Chẳng hạn: đ i ề u tra những người nghiện ma túy, những người n h i ễ m H I V , những trẻ vị thành niên phạm p h á p Trong các trường hợp đó ta cũng không t h ể t i ế n h à n h đ i ề u tra toàn bộ được vì cùn một bộ phận khá l ớ n chưa phát h i ệ n được n ê n không thể x á c định được toàn bộ số phần tử của tổng thể. 126 Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
  20. CHuùttiq. ó: Mẫu ngẫu nhiên. Vì v ậ y , từ t h ế kỷ 17, phương p h á p n g h i ê n cứu mẫu đã ra đ ờ i , n g à y c à n g p h á t t r i ể n và được sử dụng rộng rãi trong nhiều lĩnh vực. T ư tưởng cơ bản của phương p h á p m ẫ u như'sau: T ừ tổng-thể ta l ấ y ra n phần tử và đo lường giá trị của dấu h i ệ u X* trên c h ú n g , n phần tử n à y lập n ê n m ộ t mẫu. s ố phần tử của m ẫ u (n) được g ọ i là kích thước mẫu. thông thường kích thước của m ẫ u nhỏ hơn n h i ề u so v ớ i kích thước của tổng t h ể . Vì v ậ y ta có khả n ă n g thực t ế đ ể thu thập, x ử lý và khai thác thông tin mẫu m ộ t c á c h nhanh c h ó n g , toàn d i ệ n hơn. Sử dụng c á c phương p h á p toán học (đặc b i ệ t là lý thuyết xác suất), n g ư ờ i ta t i ế n h à n h suy rộng k ế t quả n g h i ê n cứu trên m ẫ u cho toàn bộ tổng t h ể , đó là mục đích cuối cùng của phương p h á p mẫu. Để đạt được mục đích trên thì mẫu phải đại diện cho tổng thể. M u ố n vậy, khi l ấ y mẫu phải đ ả m bảo tính ngẫu nhiên, không chọn m ẫ u theo một tiêu chuẩn chủ quan đã định trước. Trong thực t ế có nhiều c á c h l ấ y mẫu: Ì- Lấy mẫu ngẫu nhiên:! Ta đ á n h số c á c phần tử từ Ì đ ế n N (N là số phần tử của tổng thể),- Đ ể có một mẫu kích thước n, ta- có t h ể d ù n g bảng số ngẫu nhiên' hoặc d ù n g cách bốc t h ă m đ ể l ấ y cho iu n phần tử v à o mẫu. B ằ n g cách này, m ỗ i phần tử của tỏng thể đ ề u có khả năng dược chọn v à o m ẫ u như nhau. 2- Chọn mẫu cơ giới: C á c phần tử của tổng t h ể được đưa v à o m ẫ u cách nhau một khoảng x á c định. Chẳng hạn, trên m ộ t d â y chuyền sản xuất, cứ sau một khoảng thời gian t n à o đó l ạ i lấy ra m ộ t sản phẩm đ ể đưa v à o mẫu. 3- Chọn mẫu bằng cách phân lớp: ni Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản