intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng - phương pháp thí nghiệm đồng ruộng - chương 4

Chia sẻ: Norther Light | Ngày: | Loại File: PDF | Số trang:16

228
lượt xem
65
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

CHƯƠNG IV ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Chương này sẽ giới thiệu các dạng ước lượng cụ thể đối với số trung bình của một đặc trưng định lượng và xác suất của một đặc trưng định tính nào đó (tỷ lệ) trong một quần thể (hay công thức); đề cập đến việc kiểm định (so sánh) hai số trung bình của một đặc tính định lượng hay hai xác suất (hai tỷ lệ) của một đặc tính định tính của quần thể. A. ƯỚC LƯỢNG 1. ĐẶT VẤN ĐỀ Như chúng ta đã biết, đối...

Chủ đề:
Lưu

Nội dung Text: Bài giảng - phương pháp thí nghiệm đồng ruộng - chương 4

  1. CHƯƠNG IV ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Chương này sẽ giới thiệu các dạn g ước lượng cụ thể đối với số trung bình của một đặc trưng định lượng và xác su ất của một đặc trưng định tính nào đó (tỷ lệ) trong một quần thể (hay công thức); đề cập đến việc kiểm định (so sánh) hai số trung bình của một đặc tính định lượng hay hai xác suất (hai tỷ lệ) của một đặc tính định tính của quần thể. A. ƯỚC LƯỢNG 1. Đ ẶT VẤN ĐỀ Như chúng ta đ ã biết, đối tượng nghiên cứu trong nông nghiệp khá phức tạp, trong quá trình nghiên c ứu không thể quan sát và đo đ ếm tất cả các cá thể có của quần thể (công t hức) với những lý do sau: - Không có điều kiện về nhân lực và thời gian để theo dõi - P hải bảo vệ đối tượng nghiên c ứu. Do đó phải tiến h ành lấy mẫu ngẫu nhiên n cá thể mang tính đại diện để tiến hành nghiên cứu (quan sát hay đo đếm). Từ kết quả quan s át c ủa mẫu đ ưa ra kết luận (đánh giá) cho to àn quần thể (công thức). Kết luận đ ưa ra được gọi là kết luận thống kê. Nên từ quần thể quan sát đưa ra một kết luận (đánh giá) đối với độ lớn của trung bình (hay xác su ất) thì ta có một ước lượng. Từ kết quả củ a m ẫu suy ra kết quả của cả đám đông thì không tránh khỏi sai số, chỉ có điều là khả năng và mức độ sai số là như thế n ào? Nội dung của ch ương này sẽ nghiên cứu sai số và khả năng hạn chế sai số đó khi tiến h ành ước lượng để đạt tới mong muốn cho phép m à t hôi. 2. CÁC PHƯƠNG PHÁP ƯỚC LƯ ỢNG 2.1. Ước l ượng điểm Ước lượng điểm của một tham số thống kê nào đó là dạng ước l ượng m à từ kết quả quan sát của một mẫu lấy ngẫu nhiên mang tính đ ại diện của tổng thể, đ ưa ra một con số và cho rằng con số đó là giá trị gần đúng tốt nhất cho tham số muốn biết. Thí d ụ: Biến ngẫu nhiên X (đ ịnh l ượng hoặc định tính) có phân phối xác suất phụ thuộc vào một tham số  chưa biết. Từ biến ngẫu nhiên này l ấy một ngẫu nhiên n quan sát. Gọi xi là quan sát th ứ i, còn xi là giá trị cụ thể của Xi. Trong m ẫu quan sát hàm f(X1, X2,...Xn) được dùng để ước lượng  . Vấn đề đặt ra l à chọn hàm nào? Ký hiệu Qn = f (x1, x2,...xn) là hàm ước l ượng của  . Qn l à một biến ngẫu nhiên có giá trị cụ thể q = f (x1, x2,...xn). Vậy q là ước lư ợng điểm của  . 36
  2. (4.1)  q Có thể tính đư ợc độ lệch chuẩn của Qn và ư ớc lượng điểm lúc n ày sẽ là:   q  DQn  (4.2) DQn  là đ ộ lệch chuẩn của Qn . Trong đó Thí dụ: Tổng thể có phân phối chuẩn  , 2   là trung bình (k ỳ vọng) chưa biết cần ước lượng. Lấy n quan sát x1, x2, xi,...xn. . Tính x   xi s như và s x  n n vậy có thể đ ưa ra được ước điểm của kỳ vọng  . s   x ho ặc   x  (4.3) n 2.2. Ước l ượng khoảng Ước lượng khoảng của một tham số thống kê nào đó là từ kết quả quan sát của mẫu đưa ra được giá trị tương ứ ng với một độ tin cậy nhất định. Mọi giá trị nằm trong kho ảng đó đều đư ợc coi là giá trị gần đúng tốt nhất của tham số. Giả sử  là tham số cần ư ớc lượng. Nếu có q1 là giới hạn dư ới và q2 là giới hạn trên,  là xác su ất để mắc sai lầm thì ước lượng khoảng của  được viết nh ư sau: Pq1    q 2   1    P (4.4) Trong đó: [q1 ; q2 ] là kho ảng tin cậy của tham số  P : Gọi là độ tin cậy (th ường lấy với xác suất lớn 0,95; 0,99 và 0,999).   1 - P (thường lấy xác suất nhỏ 0,05; 0,01 và 0,001). 3. ƯỚC LƯỢNG GIÁ TRỊ TRUNG B ÌNH CỦA TỔNG THỂ (KHI CÁC ĐẶC TRƯNG NGHIÊN CỨU CÓ PHÂN PHỐI CHUẨN) Do chỉ quan sát đ ược n cá thể trong mẫu m à lại mong muốn đánh giá đ ược của toàn công th ức (cần biết trung bình của công thức hay còn gọi là kỳ vọng). Cho nên có thể xem xét cụ thể như sau: 3.1. Ước l ượng trị số trung bình c ủa tổng thể khi dung l ượng mẫu n n  30  Giả sử X có phân phối chuẩn N  , 2  , trong thực tế thì hầu nh ư chúng ta không biết ph ương sai  2 m à chỉ tính đ ư ợc phương sai thống kê của mẫu s2. Vì vậy, khi dung lượng mẫu đủ lớn thì có thể coi  2  s 2 . Theo tính chất của phân phối chuẩn chúng ta có: 37
  3. s2 s hay sx  n n Vì vậy, khi phân phối của x là tiệm cận với phân phối chuẩn thì kỳ vọng hay trung bình tổng thể  sẽ đ ược xác định qua ước lượng điểm hoặc ước khoảng như sau: Ước lượng điểm   x  s x và   x Ước lượng khoảng P  x  u s x    x  u s x   1   (4.5) u là giá trị tra ở bảng 2 (phụ lục) Nếu lấy độ tin cậy P là 0,95 thì u  1,96 ; P = 0,99 thì u  2,58 và P = 0,999 thì u  3, 29 . Tương tự sẽ suy ra khoảng tin cậy cụ thể nh ư sau: P x 1,96s x    x  1,96s x   1  0,05  0,95 P x  2,58s x    x  2,58 s x   1  0,01  0,99 P x  3,29, s x    x  3, 29s x   1  0,001  0,999 Thí d ụ: Điều tra năng suất cá thể của một số giống c à chua xuân hè (kg/cây)với mẫu n = 50. Từ đó có năng suất cá thể trung bình x  1,48 kg; đ ộ lệch chuẩn của năng su ất là 0,35 kg/cây. Hãy đưa ra ước lượng cho năng suất cá thể của c à chua điều tra nêu trên. Trước hết ta đưa ra ước lượng điểm có năng suất nh ư sau 0,35  1, 48  0,05 k g/cây.   1,48  50 Ước lượng khoảng ở độ tin cậy P = 0,95 gọi tắt l à kho ảng tin cậy sẽ là  0,35  0,35    1,48  1,96 P1,48  1,96   1  0,05  0,95 50 50   P1,48  0,10    1, 48  0,10   1  0,05  0,95 Điều này có nghĩa với độ tin cậy 95%, năng suất cá thể của c à chua từ 1,38 đến 1,58 kg/cây. Nếu như   0,01 thì khoảng tin cậy được xác định là:  0,35  0,35    1,48  2,58 P1,48  2,58   1  0,01  50  50   P 1,48  0,13    1,48  0,13  1  0,01 38
  4. P1,35    1,61  1  0,01 Năng su ất từ 1,35 đến 1,61 kg/cây với độ tin cậy 99% 3.2. Ước l ượng số trung bình qu ần thể khi dung l ượng mẫu n < 30 Lúc này không thể coi phương sai chưa biết  2 là s2 được do đó phải dùng đến phân phối t (Student). Khoảng tin cậy của trị số trung bình có dạng như sau P x  t (  , df ) s x    x  t ( , df ) s x   1   (4.6) Ở đây giá trị t ( ,df ) với df = n - 1 tra ở bảng phân phối t (bảng 4 phụ lục) Thí d ụ: Theo dõi năng su ất của bắp cải trong thí nghiệm vụ đông xuân tại Đông Anh Hà Nội, dung lượng mẫu điều tra n = 25, năng suất bình quân x  175,5 tạ/ha với độ lệch chuẩn s = 20,5 tạ/ha. H ãy đưa ra kho ảng tin cậy 95% cho năng suất bắp cải vụ đông tại điểm nghiên c ứu ở Đông Anh Hà Nội. Trước hết ta tra bảng t ở mức   0,05 với số bậc tự do df = n - 1 và df = 25 - 1 = 24. Như vậy, giá trị t ( 0, 05, df 24) = 2,06 Kho ảng sẽ được xác định nh ư sau  20,5  20,5 P 175,5  2,06    175,5  2,06   1  0,05  0,95 25 25   P 167,1    183,9  1  0,05 Hay viết gọn lại P (   175,5  8,4 ) tạ/ha với mức ý nghĩa   0,05 4. XÁC Đ ỊNH DUNG LƯỢNG MẪU KHI Ư ỚC LƯỢNG Như đã biết khoảng tin cậy với trung bình của quần thể phụ thuộc vào độ tin cậy và dung lư ợng mẫu. Khi dung lượng mẫu lớn khoảng tin cậy trung bình có d ạng (4.7)  X  Như vậy  là sai số ước lượng và chúng ta muốn    với  càng nhỏ càng tốt để khoảng tin cậy hẹp. t s ( u )  s ho ặc    , df  n n t2 s2 (u ) 2 s 2 hoặc n  ( ,df ) 2 Như vậy n  (khi dung lượng mẫu nhỏ) 2  Khi   0,05 thì u( 0, 05)  1,96 và có thể lấy  2 Còn giá trị t ( 0, 05, df )  1,96 phụ thuộc vào độ tự do có thể tra trong bảng 4 phần phụ lục. 39
  5. 4 s 2 Vậy nct  (4.8) 2 Ở đây  có giá trị chứa đơn vị đo nh ư các quan sát xi ho ặc x . Ta còn có thể tính được độ lớn n cần thiết khi cho trước một sai số ước lượng  % qua công thức sau 4s2 40.000  s 2 (4.9) n ct  10000  ( x ) 2  ( %) 2 ( x ) 2  ( %) 2 Thí d ụ: Q uan sát 10 cành cà phê chè Catimor trồng 2 năm. Đếm số quả trên cành có trung bình x  121 qu ả/cành. Độ lệch chuẩn s = 25 quả/c ành. Để số quả bình quân của vườn cà phê mong muốn   (121  10) quả/cành (   10 quả/cành) thì dung lượng n = 10 như đã lấy thử đủ đảm bảo sai số đưa ra hay chưa với độ tin cậy 95%. n cần thiết cho   10 tính như sau 4  25 2 625  4 Do  là gi á trị số lượng nên cành n ct   25 cành  10 2 10 Vậy để cho sai số của số quả/c ành là 10 quả/c ành thì dung lượng n = 10 như đã lấy thử là chưa đủ lớn m à phải lấy thêm ít nhất 15 cành nữa để tổng số c ành quan sát n  25 . Nếu lại đưa ra  % mong muốn là 5% thì 40.000  (25 2 )  68,3 h ay  68 cành ho ặc 69 cành nct  (121)  5 2 Như vậy, n = 10 còn quá nhỏ so với mong muốn để sai số ư ớc lượng   5% . P hải lấy thêm 59 cành n ữa mới đủ chấp nhận sai số ước lư ợng nêu trên. 5. ƯỚC LƯỢNG XÁC SUẤT CỦA TỔNG THỂ ( ƯỚC LƯ ỢNG TỶ LỆ) Trong thực nghiệm sinh học, rất nhiều trường hợp phải nghiên cứu các xác suất hay tỷ lệ, như t ỷ lệ sống của cây con sau khi đem từ vườn ươm trồng ra lô sản xuất, tỷ lệ bệnh, hoặc tỷ lệ mọc mầm của hạt... Thí dụ: Trong một quần thể có N cá thể (N rất lớn) và gi ả sử có M cá thể có đặc tính A. Như vậy, xác suất của A l à p = M/N (đây là theo lý thuyết). Song ta không thể có điều kiện để tính p trực tiếp. Vì vậy, phải lấy một mẫu ngẫu n hiên từ quần thể ấy. Trong n phần tử của mẫu đếm đ ược m phần tử có đặc tính A. Vậy tần suất của đặc tính A trong mẫu sẽ l à f = m/n. Để ước l ượng xác suất p của các cá thể có đặc tính A cần phải xem xét các điều kiện cụ thể sau: 5.1. Khi sự kiện A có xác s uất không gần 0 v à 1 5.1.1. Khi dung lượng n đủ lớn (n > 100) 40
  6. Lúc này luật phân phối nhị thức, xác suất của A sẽ tiệm cận với luật phân f (1  f ) phối chuẩn, như vậy s p  và biểu thức ước lượng điểm có thể viết như n sau: (4.10) p  f  sp Hoặc p  f (4.11) Kho ảng tin cậy của sự kiện A có xác suất p trong quần thể sẽ có dạng sau: P ( f  u s p  p  f  u s p )  1   (4.12) Hoặc viết gọn như sau: P ( p  f  u s p )  1   (4.13) Cụ thể: p  f  1,96s p là kho ảng tin cậy 95% p  f  2,58 s p là kho ảng tin c ậy 99% p  f  3, 29s p là kho ảng tin cậy 99,9% Thí dụ: Để dự đoán sâu đục quả cà chua vụ xuân hè 2002 tại Gia Lâm, H à Nội, tiến hành lấy ngẫu nhiên một mẫu n = 630 quả, trong đó 82 quả bị sâu đục. H ãy đưa ra các ước lượng cho tỷ lệ sâu đục quả c à chua trong nghiên cứu trên. Do độ lớn n = 630 là lớn nên: * Ước l ượng điểm: Gọi p l à xác su ất bị sâu đục quả của quần thể, f l à t ần suất của mẫu có quả bị sâu 82 f=  0,130 630 p = 0,130 hay 13,0%. 0,130(1  0,130) Hoặc p = 0,130  = 0,130  0,0134 630 hay p = (13,0  1,34 ) %. * Ước l ượng khoảng: Nếu chọn mức ý nghĩa   0,05 thì t ỷ lệ sâu đục quả c à chua nghiên cứu sẽ được xác định nh ư sau: p = f  1,96s p = 0,130  (1,96  0,0134) = 0,0134  0,0262 hay p = (13,0  2,62) % . 41
  7. Với độ tin cậy 95% thì tỷ lệ cà chua bị sâu đục quả vụ xuân hè 2002 tại Gia Lâm, Hà Nội nằm trong khoảng từ 10,38% đến 15,62%. - Nếu chọn   0,01 thì khoảng tin cậy lúc này là: P = 0,130  2,58 S p  0,130  0,0346 hay từ 9,54% đến 16,46%. - Nếu   0,001 thì khoảng sẽ thay đổi từ 8,59% đến 17,4%. 5.1.2. Khi dung lượng n < 100 (không đủ l ớn) Do m ẫu nhỏ nên không thể áp dụng hàm tiệm cận để ước l ượng đ ược m à phải d ùng phân phối nhị thức. Nh ưng việc tính toán sẽ phức tạp nên các nhà toán học thống kê xác suất đ ã l ập bảng tính sẵn cho độ lớn n từ 4 đến 100 (chỉ áp dụng cho kho ảng 95% độ tin cậy). Khoảng n ày sẽ đ ược tìm ở các bảng 6 (a, b, c) phần phụ lục. Bảng 6a áp dụng cho khoảng 95% của tỷ lệ mẫu bé (x = m) Với 4  n  10 Bảng 6b với tỷ lệ của mẫu khi 10  n  100 và 0  m  25 Bảng 6c với tỷ lệ khi 60  n  100 và 26  m  50 Thí dụ: Áp dụng một biện pháp điều trị bằng thuốc hoá cho bệnh chảy gôm bưởi thanh trà ta có kết quả sau:. Tiến hành xử lý ở n = 20 cây ; sau xử lý quan sát thấy có 5 cây khỏi bệnh và 15 cây khác không khỏi bệnh. Vậy khoảng tin cậy 95% của khỏi bệnh là bao nhiêu? * Nếu lấy ước lượng điểm thì ở đ ây xác suất (tỷ lệ) khỏi bệnh chảy gôm cây bưởi sẽ l à: m5 p=f=  0, 250 h ay 25,0%  n 20 * Nếu tìm kho ảng tin cậy 95% cho tỷ lệ khỏi bệnh sẽ d ùng trong b ảng 6 (b) tra tại cột 5 hàng 20 Hàng trên là p1 % = 8,7% Hàng dưới l à p2 % = 49,1% 5 Như vậy khoảng tin cậy 95% của tỷ lệ f = sẽ là từ 8,7% đến 49,1% (khỏi 20 bệnh chảy gôm cây b ưởi). 5.2. Khi sự kiện A có xác suất gần 0 hoặc gần 1 Trong trường hợp n ày xác su ất của A tuân theo luật Poisson (hay c òn gọi là hàm phân phối xác suất của sự kiện hiếm). Dựa theo luật Poisson ngư ời ta đ ã lập một bảng tính sẵn để có ước lượng khoảng cho sự kiện A n ày. Tuy nhiên, chỉ ứng với độ tin cậy 95% (bảng 7 phụ lục). 42
  8. Còn với ước lư ợng điểm thì cũng chỉ lấy gần đúng tốt nhất cho xác suất của tổng thể là xác su ất của A trong mẫu quan sát. Thí dụ: N ghiên cứu ảnh hư ởng của chiếu xạ lên h ạt giống đến hiện tượng dị hình của cây sau xử lý. Mẫu xử lý có độ lớn n = 12500 hạt táo, sau đó đem gieo và theo dõi cây con. Gọi A l à hiện tư ợng dị hình, quan sát thấy có A = 105 cây. H ãy đưa ra các dạng ước lượng cho kết quả xử lý trên về hiện tượng đột biến kiểu hình. Gọi p là xác su ất hay tỷ lệ đột biến kiểu hình của liều lượng xử lý trên, kết quả thống kê m ẫu có tần suất: 105 f  0,0084 h ay 0,84 % 12500 * Vậy ước lượng điểm của hiện tượng đột biến kiểu hình của liều lượng xử lý trên p  f % l à 0,84% * Ước lượng khoảng đ ược xác định sẵn qua bảng 7 phụ lục. Song, bảng chỉ cho hai giá trị np1 và np2 ứ ng với 95% độ tin cậy. P (p1.p2) = 1 – 0,05 với p1. p2 tính từ np1 np và p2 = 2 p1 = n n Trong trường hợp ở đây np1 và np2 phải được tra từ giá trị gần đúng sau: Trong bảng 7 chỉ có x = m nhiều nhất là 100. Từ giá trị m = 105 không có trong bảng. Nên phải giảm (lùi 10 lần); m = 10,5 lấy gần đúng m = 11. Tra ở m = 11 (h àng 10 cột 1) có np1 = 0,025; np2 = 5,572 npi Muốn có p1 và p2 thì pi = . Nhưng vì các giá trị np1 và np2 đều được tính n lùi 10 lần nên lúc này n chỉ còn n = 1250. Từ đó np1 = 5,5 và np2 = 19,7 5,5 p1 =  0,0044 hay 0,44% 1250 19,7  0,01576 hay 1,576% lấy gần đúng 1,58% p2 = 1250 Vậy tỷ lệ đột biến kiểu hình của liều l ượng xử lý n ày sẽ dao động từ 0,44% đến 1,58% với độ tin cậy 95%. B ài tập: 1. Điều tra năng suất ngô của 44 hộ nông dân ta có kết quả sau(tạ/ha) : 14; 38; 35; 42; 42; 36; 40; 36; 34; 36; 35; 36; 34; 42; 39; 39; 44; 37; 44; 36; 41; 43; 42; 42; 42; 43; 39; 43; 39; 44; 40; 43; 43; 35; 38; 39; 39; 42; 43; 37; 44; 40; 39; 43 43
  9. Hãy đưa ra các d ạng ước lượng cho năng suất ngô của vùng điều tra nói trên (ước lượng điểm và ước lượng khoảng) với độ tin cậy 95% và 99%). 2. Đếm số hạt trên bông lúa của một giống ta có số liệu sau(hạt/bông): 120; 119; 116; 110; 121; 118; 106; 133; 123; 115; 112; 126; 109; 128; 123; 107; 132; 125; 106; 124. Hãy đưa ra các d ạng ước lượng cho số hạt trên bông c ủa giống lúa nói trên (ước lượng điểm và ước lượng khoảng) với độ tin cậy 95% và 99%. 3. Ngư ời ta đ ã tiến hành theo dõitỷ lệ bật mầm các mắt ghép ở 200 cây ghép đã cho th ấy kết quả có 148 cây đ ã bật mầm. H ãy đưa ra ước lư ợng điểm và ước lượng khoảng của hiện tượng bật mầm của mắt ghép nêu trên với độ tin cậy l à 95% và 99%. B . KIỂM ĐỊNH G IẢ THUYẾT THỐNG KÊ 1. NHỮNG KHÁI NIỆM CHUNG VÀ Ý NGH ĨA Trong nghiên c ứu t hường phải so sánh các tham số thống kê như số trung bình, phương sai, xác suất của một mẫu với một tiêu chuẩn cho trước nào đó, hoặc 2 mẫu với nhau hay nhiều mẫu với nhau. Thông thường các tham số có sự khác nhau (khác nhau về số học), nhưng ta lại cần xem xét sự sai khác n ày có rõ ràng hay không? ở m ức độ nào? Nếu chúng khác nhau trong phạm vi ngẫu nhiên thì sự khác nhau n ày được coi như không đáng kể (không có ý nghĩa). Nếu chúng khác nhau ngo ài phạm vi ngẫu nhiên thì kết luận sự khác nhau ấy là do tác động của nhân tố thí nghiệm . Để kiểm định người ta d ùng các kết quả thực nghiệm quan sát ở mẫu với việc vận dụng công cụ toán học l à lý thuyết xác suất để kiểm tra những giả thuyết đã cho. Nếu tài liệu thực nghiệm phù hợp với giả thuyết thì giả thuyết được chấp nhận. Ngược lại thì giả thuyết bị bác bỏ. Sự phù hợp m à ta nói ở đây không phải là tuyệt đối mà chỉ l à nói phù hợp theo một tiêu chu ẩn nào đó xác đ ịnh trước đủ thỏa mãn những yêu cầu của thực tiễn. Trong nông học người ta thường so sánh (hay kiểm định) sự sinh trưởng, phát triển, diễn biến sâu bệnh hại cây trồng cũng nh ư các chỉ tiêu năng suất đ ược gieo trồng bằng những biện pháp kỹ thuật khác nhau để xem chúng có ảnh h ưởng thực sự đến các chỉ tiêu nghiên cứu hay không? 2. TRƯ ỜNG HỢP HAI MẪU ĐỘC L ẬP Mẫu độc lập hay thí nghiệm độc lập là những khái niệm tương đối. Theo nghĩa rộng ng ười ta gọi mẫu độc lập hay thí nghiệm độc lập nếu một quá trình thực nghiệm n ào đó được thiết kế một cách độc lập với những thí nghiệm khác. 2.1. Tiêu chu ẩn u của phân p hối ti êu chuẩn Nếu trong trường hợp kiểu phân phối lý thuyết đặc trưng cho 2 kết quả (2mẫu) 44
  10. nghiên cứu chưa biết thì yêu c ầu dung lượng mẫu lấy phải đ ược coi là đủ lớn (n1 > 30 và n2 > 30). Theo luật số lớn thì trong trường hợp mẫu lớn, phân phối xác suất của số trung bình m ẫu X x ấp xỉ luật chuẩn với kỳ vọng MX   và phương sai s2 DX  n  12  Như vậy x1  N  1,   n1    2   x2  N   2 , 2   n2    Giả thiết Ho: 1   2 hay 1   2  0 Đối thiết H1: 1   2 hay 1   2  0 (4.14)  12  2  2  x1  x 2  N  1   2 ,  (4.15)   n1 n2    Được kiểm định bằng tiêu chuẩn u của phân phối tiêu chuẩn với mức ý nghĩa  tính giá trị thực nghiệm như sau: x1  x2 (4.16) utn   12  2 2  n1 n2 Nếu phương sai của 2 tổng thể không đ ược biết trước và dung lượng mẫu đủ lớn thì có thể thay một cách gần đúng ph ương sai tổng thể bằng phương sai mẫu, có nghĩa là  12  s12 và  2  s 2 2 2 Lúc này tiêu chu ẩn phù hợp như sau: x1  x2 (4.17) utn  s12 s 2 2  n1 n2 Nếu nh ư utn  u tra ở bảng 2 phụ lục với mức ý nghĩa  thì gi ả thiết Ho được chấp nhận nghĩa là hai trung bình c ủa hai mẫu bằng nhau. Ngư ợc lại nếu utn  u thì giả thiết bị bác bỏ nghĩa l à hai trung bình của hai mẫu l à khác nhau. Thí d ụ: Đo chiều cao cây cuối c ùng c ủa hai giống lúa mới có kết quả nh ư sau: Giống I: Đo n = 42 khóm có chiều cao trung bình x1  95,2 cm Độ lệch chuẩn về chiều cao l à s1 = 3,2 cm. Giống II: Đo n = 40 khóm có chiều cao trung bình x 2  98,5 cm Độ lệch chuẩn t ương ứ ng s2 = 3,4 cm. 45
  11. Hỏi chiều cao của hai giống có khác nhau hay không với mức ý nghĩa   0 ,0 5 Vì hai dung lượng mẫu n1 và n2 lấy từ hai giống nghiên cứu và không biết trước đ ược hai ph ương sai tổng thể. Nên ta có thể d ùng tiêu chu ẩn u của phân phối chuẩn để kiểm định. Giả thiết Ho: 1   2 hay 1   2  0 Đối thiết H1 ; 1   2 hay 1   2  0 Để kiểm định giả định giả thiết Ho ta áp dụng biểu thức (4.17) x1  x2 95,2  98,5 utn    4,52 s12 s 2 2 3,2 2 3,4 2   42 40 n1 n2 Với   0,05 , u  1,96  4,52  1,96  Ở đây utn  u 0, 05 Nên ta bác bỏ giả thiết Ho và ch ấp nhận đối thiết H1 là giống khác nhau thì chiều cao khác nhau rõ rệt. 2.2.Tiêu chu ẩn t của phân phối Student Tiêu chu ẩn n ày được áp dụng trong trường hợp luật phâ n phối của hai tổng thể m à đ ại diện l à 2 m ẫu có phân phối chuẩn và phương sai của hai tổng thể đ ược coi là bằng nhau. Nếu thỏa mãn hai điều kiện n ày thì có thể kiểm tra. Giả thiết Ho: 1   2 hay 1   2  0 Đối thiết H1 ; 1   2 hay 1   2  0 bằng tiêu chuẩn t của Student như sau: x1  x2 (4.18) t tn  ( n1  1) s12  (n 2  1) s 2  1 1  2  n n  n1  n2  2 1 2 Trong đó: x1 và x 2 là trung bình của 2 m ẫu. s12 và s2 là phương sai c ủa mẫu 1 và m ẫu 2. 2 n1 và n2 là dung lượng quan sát của 2 mẫu. Thường trường hợp này được áp dụng khi n1 và n2 l à không đủ lớn n1 < 30 và n2 < 30 ho ặc n1 > 30 và n2 < 30 hoặc n2 > 30 và n1 < 30 Nếu ttn  t( , n n tra bảng t với n1 + n2 – 2 bậc tự do (phụ lục bảng 4) thì gi ả 2 2 ) 1 thiết Ho được chấp nhận, nghĩa là trung bình c ủa hai mẫu bằng nhau (khác nhau không ý nghĩa). Ngược lại nếu như ttn  t( , n  n 2 ) tra bảng với bậc tự do = n1 + n2 - 2 1 2 46
  12. thì giả thiết Ho bị bác bỏ. Nghĩa là ch ấp nhận đối thuyết H1 trung bình hai mẫu là khác nhau t ại mức ý nghĩa  . Thí d ụ:So sánh năng suất của hai giống c à chua vụ xuân hè Giống số 6: theo dõi 16 điểm trên ruộng năng suất trung bình đ ạt 30,6 tấn/ha. Độ lệch chuẩn về năng suất 4,5 tấn/ha. Giống số 204 A theo dõi ở 19 địa điểm, năng suất bình quân đạt 27,0 tấn /ha. Độ lệch chuẩn năng suất là 4,0 tấn/ha. Biết rằng phân phối về năng suất của c à chua là phân phối chuẩn và phương sai lý thuyết được coi là bằng nhau. Hãy cho biết năng suất trung bình của hai giống trên có khác nhau hay không ở mức ý nghĩa   0,05 và 0,01. Vì hai tổng thể đ ã đáp ứ ng các điều kiện nêu ra nên có thể áp dụng tiêu chuẩn t của phân phối Student để kiểm định giả thiết Giả thiết Ho: 1   2 hay 1   2  0 Đối thiết H1: 1   2 hay 1   2  0 Theo (4.18) x1  x2 t tn  ( n1  1) s12  (n 2  1) s 2  1 1  2  n n  n1  n2  2 1 2 Thay vào đư ợc 30,6  27,0 t tn   2,064 (16  1). 4,5 2  (19  1). 4,0 2  1 1   16  19  2  16 19  t ( 0, 05;33)  2,04 , như vậy  t tn  t 0, 05;33  nên gi ả thiết Ho bị bác bỏ và chấp nhận H1 với câu trả lời “hai giống cà chua nói trên có năng suất trung bình khác nhau”. Với   0,01 thì t ( 0, 01;33)  2,75 Vì 2,064 < 2,75 nên chấp nhận giả thiết Ho có nghĩa l à “hai giống c à chua nói trên có năng su ất trung bình bằng nhau” (khác nhau không có ý nghĩa). Trong một số trường hợp thì áp d ụng tiêu chuẩn t của Student để so sánh 2 mẫu độc lập, điều kiện về luật phân phối chuẩn của tổng thể đ ược thỏa m ãn, nhưng 2 phương sai c ủa tổng thể không được biết trước. Khi đó ph ải kiểm định bằng tiêu chuẩn F của Fisher về sự bằng nhau của hai phương sai (sẽ nêu ở m ục 5). 47
  13. Nếu hai phương sai bằng nhau thì áp dụng kiểm định như biểu thức (4.18). Nếu hai phương sai được coi là khác nhau thì biểu thức áp dụng cho tiêu chuẩn t của Student như sau: x1  x 2 (4.19) t tn  s12 s 2 2 n1 n 2 Nhưng ttn sẽ được so sánh với giá trị t lý thuyết ở mức ý nghĩa  tính như sau: s12   2  s2  t ( , df1  n1 1) n   t ( , df2  n2 1) n  t   1  2 * (4.20) 2 2 s1 s 2  n1 n2 Nếu như ttn  t* thì chấp nhận Ho (hai trung bình là khác nhau không có ý ng hĩa) Nếu như ttn  t* bác bỏ giả thiết Ho thì chấp nhận H1 ( hai trung bình là khác nhau) Thí d ụ:Phân tích hàm lượng đường tổng số (%) của hai giống cà chua vụ xuân hè. - Giống MV1 phân tích ở 6 mẫu có h àm lượng đ ường tổng số đạt 3,09% và phương sai về đường tổng số là 0,75%. - Giống mới phân tích ở n2 = 8 m ẫu có giá trị trung bình c ủa đường tổng số đạt 2,79%. Phương sai có giá trị 0,10%. Hãy cho biết h àm lượng đ ường tổng số của hai giống nêu trên có khác nhau hay không? Cho hai phương sai là không b ằng nhau với mức ý nghĩa   0,05 . Do hai phương sai là không bằng nhau nên áp dụng biểu thức (4.19) x1  x 2 3,09  2,79 thay số vào ta có t tn  t tn   0,798 s12 s 2 0,73 0,16  2 6 8 n1 n 2 * Áp dụng biểu thức (4.20) tính t0, 05 như sau: s2   s2   t ( , df1  n1 1) 1   t ( , df2  n2 1) 2   n1   n2  t   * s12 s 22  n1 n2 Thay số vào 48
  14. 0,75   0,10    2,75     2,36   6 8  * t 0, 05   2,54 0,75 0,10  6 8 Như vậy, t tn  t * (0,798
  15. t tn  t ( ,n1) chấp nhận H1 Thí dụ: Đo đường vanh của 18 cây cao su bằng hai loại thước khác nhau kết quả được ghi lại trong bảng 1.4 .Vậy giữa hai loại thước đo có sự khác nhau rõ rệt hay không ở độ tin cậy 95%. Bảng 1.4. So sánh hai mẫu theo cặp bằng tiêu chuẩn t di 2 TT xi của thư ớc 1 yi của thư ớc 2 di = xi - yi 1 29,7 29,0 0,7 0,49 2 34,9 34,5 0,4 0,16 3 37,0 37,5 - 0,5 0,25 4 28,5 28,0 0,5 0,25 5 26,9 26,5 0,4 0,16 6 27,0 27,1 - 0,1 0,01 7 28,7 28,5 0,2 0,04 8 31,2 31,0 0,2 0,04 9 31,5 31,0 0,5 0,25 10 33,7 33,5 0,2 0,04 11 34,0 33,7 0,3 0,09 12 35,9 36,0 - 0,1 0,01 13 41,2 41,5 - 0,3 0,09 14 29,5 29,0 0,5 0,25 15 30,7 30,5 0,2 0,04 16 33,5 33,7 - 0,2 0,04 17 36,2 36,0 0,2 0,04 18 37,5 37,5 0 0 2 d d  3,1  2,25 Tổng i i ( d i ) 2 (3,1) 2  d i2  2, 25  n 18  0,0749 S   d n (n  1) 18(18  1) 50
  16. Thay số vào biểu thức (4.21) 0,01722 t tn   2,30 0,0749 Tra bảng t của Student với   0,05 bậc tự do df = 17 ta được giá trị t ( 0, 05;17)  2,11 Vì ttn  t( 0, 05;17) nên hai thước đo khác nhau thì kết quả trung bình khác nhau rõ rệt. 51
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2