intTypePromotion=1

Bài giảng Lý thuyết xác suất và thống kê kế toán – Bài 7: Kiểm định giả thuyết thống kê

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:15

0
32
lượt xem
0
download

Bài giảng Lý thuyết xác suất và thống kê kế toán – Bài 7: Kiểm định giả thuyết thống kê

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

"Bài giảng Lý thuyết xác suất và thống kê kế toán – Bài 7: Kiểm định giả thuyết thống kê" với các nội dung lý thuyết cơ bản về kiểm định; thủ tục thực hiện bài toán kiểm định; kiểm định giá trị trung bình của tổng thể phân phối chuẩn; kiểm định phương sai của tổng thể phân phối chuẩn; kiểm định tỷ lệ tổng thể.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Lý thuyết xác suất và thống kê kế toán – Bài 7: Kiểm định giả thuyết thống kê

  1. Bài 7: Kiểm định giả thuyết thống kê BÀI 7 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Hướng dẫn học Cùng với bài toán ước lượng, bài toán kiểm định giả thuyết là kết hợp của tính toán số liệu thống kê và quy luật phân phối xác suất để suy diễn các kết luận hợp lý. Do đó người học cần nắm được ý nghĩa các tham số đặc trưng chủ yếu của biến ngẫu nhiên: kỳ vọng, phương sai, độ lệch chuẩn (học ở bài 3), nắm được các nội dung cơ bản về một số quy luật phân phối xác suất phổ biến trong thực tế: quy luật Không – Một, quy luật Nhị thức, quy luật Chuẩn (học ở bài 3 và bài 4), nhớ được quy luật phân phối xác suất của một số thống kê quan trọng (học ở bài số 5) và nhớ nội dung của nguyên lý xác suất nhỏ (học trong bài số 1). Để học tốt bài này, sinh viên cần tham khảo các phương pháp học sau:  Học đúng lịch trình của môn học theo tuần, làm các bài luyện tập đầy đủ và tham gia thảo luận trên diễn đàn.  Đọc tài liệu: Giáo trình Lý thuyết xác suất và thống kê toán của NXB Đại học KTQD.  Sinh viên làm việc theo nhóm và trao đổi với giảng viên trực tiếp tại lớp học hoặc qua email.  Tham khảo các thông tin từ trang Web môn học. Nội dung  Lý thuyết cơ bản về kiểm định;  Thủ tục thực hiện bài toán kiểm định;  Kiểm định giá trị trung bình của tổng thể phân phối Chuẩn;  Kiểm định phương sai của tổng thể phân phối Chuẩn;  Kiểm định tỷ lệ tổng thể (kỳ vọng của biến ngẫu nhiên phân phối Không – Một). Mục tiêu Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:  Nhận biết về giả thuyết thống kê;  Chuyển đổi giả thuyết thành cặp giả thuyết tương ứng, hiểu khái niệm sai lầm khi kiểm định;  Biết cách sử dụng miền bác bỏ, kết luận đúng về việc bác bỏ hay chưa bác bỏ giả thuyết thống kê;  Trả lời cho câu hỏi đặt ra một cách đúng đắn. 128 TXTOKT02_Bai7_v1.0014109205
  2. Bài 7: Kiểm định giả thuyết thống kê Tình huống dẫn nhập Kiểm định đánh giá kế hoạch và chính sách Sở Nông nghiệp của 1 tỉnh muốn biết liệu năng suất lúa năm nay có đạt mức trung bình là 5 tấn/ha hay không, để đánh giá được tổng sản lượng lúa toàn vùng, từ đó có kế hoạch phù hợp cho việc tiêu thụ nông sản (dự trữ, xuất khẩu, tiêu thụ nội địa…), xác định mức giá hợp lý. Đơn vị nghiên cứu thị trường muốn biết giá cả trên thị trường năm nay có biến động nhiều hơn so với năm ngoái hay không. Một tổ chức quốc tế muốn đánh giá hiệu quả của Chương trình xóa đói giảm nghèo triển khai ở 1 quốc gia, và cần xem xét liệu tỷ lệ hộ nghèo có giảm xuống hay không, so với mức trước khi triển khai chương trình (giả sử là 12%). Tất cả các câu hỏi trên sẽ hoàn toàn được giải đáp nếu như ta đã thu hoạch toàn bộ các điểm trồng lúa ở tỉnh đó, đã đi điều tra về tình trạng đói nghèo của tất cả các hộ gia đình ở quốc gia kia. Nhưng sẽ làm thế nào nếu như chúng ta không làm được việc đó, vì những hạn chế về nguồn lực con người, tài chính, về thời gian, về kỹ thuật? Trong thực tiễn kinh tế xã hội, có những bài toán đặt ra yêu cầu kiểm tra tính đúng sai của một mệnh đề/một tình huống giả định, khi chưa có đầy đủ thông tin chính xác. Vì các mệnh đề này có thể đúng hoặc không đúng nên cần kiểm định, để kết luận về tính thừa nhận hay không thừa nhận được của mệnh đề đó. Khi đó phải thực hiện kiểm tra, kiểm định dựa trên thông tin có từ một mẫu, bằng những phương pháp thống kê cụ thể. Bài toán kiểm định được áp dụng rất nhiều trong các công việc nghiên cứu liên quan đến số liệu, kết quả của nó có mặt rộng rãi trong mọi lĩnh vực, mọi cấp độ, của đời sống kinh tế xã hội. TXTOKT02_Bai7_v1.0014109205 129
  3. Bài 7: Kiểm định giả thuyết thống kê 7.1. Lý thuyết kiểm định giả thuyết 7.1.1. Giả thuyết thống kê Chúng ta nghiên cứu vấn đề của một tổng thể thông qua một dấu hiệu nào đó. Trong quá trình nghiên cứu cần kiểm tra xem dấu hiệu đó có hay không có một hoặc một số tính chất nào đó. Do không có đầy đủ thông tin trên tổng thể nên không thể đánh giá chính xác vấn đề đó được. Thông tin trên mẫu sẽ được sử dụng để kiểm tra đánh giá tính chất đó theo một phương pháp toán học. Những bài toán đó gọi là bài toán kiểm định giả thuyết thống kê. Dấu hiệu nghiên cứu được đặc trưng bởi (các) biến ngẫu nhiên – gọi là biến ngẫu nhiên gốc. Việc kiểm tra một mệnh đề liên quan đến biến ngẫu nhiên gốc là kiểm định một giả thuyết thống kê, bao gồm 3 loại:  Kiểm định về dạng phân phối xác suất (chẳng hạn, liệu một biến ngẫu nhiên nào đó có phân phối Chuẩn hay không?).  Kiểm định về tham số đặc trưng (trung bình, phương sai, tỷ lệ).  Kiểm định về tính độc lập của các biến ngẫu nhiên (chẳng hạn, việc sắp xếp các quầy hàng theo thứ tự khác nhau và sự hài lòng của khách hàng có liên quan với nhau hay không?). Trong giới hạn chương trình, ở bài này ta chỉ xét các giả thuyết thống kê về các tham số đặc trưng của tổng thể (chính là các tham số đặc trưng của biến ngẫu nhiên gốc). Để thuận tiện và chuẩn xác về mặt toán học, các mệnh đề cần được kiểm định sẽ được đặt dưới dạng các cặp giả thuyết. Tùy mục đích nghiên cứu của từng trường hợp, cặp giả thuyết sẽ tương ứng với các mệnh đề. Cặp giả thuyết gồm một giả thuyết gọi là giả thuyết gốc, kí hiệu H0, và một giả thuyết đối, kí hiệu là H1. Khi bác bỏ giả thuyết H0 thì sẽ chấp nhận giả thuyết H1 đi kèm theo nó. Các cặp giả thuyết thống kê về tham số đặc trưng  nào đó của biến ngẫu nhiên gốc có thể quy về ba dạng sau: H 0 :    0 H 0 :    0 H 0 :    0    (7.1)  H1 :    0  H1 :    0  H1 :    0 Ví dụ 7.1. Một nhà máy sản xuất khẳng định trọng lượng trung bình của sản phẩm do họ sản xuất ra là 350g. Khách hàng của nhà máy muốn kiểm tra điều khẳng định đó, khi đó cặp giả thuyết có dạng:  H 0 : m  m0  350   H 1 : m  m0 Với m là trung bình tổng thể, là kì vọng biến ngẫu nhiên X – “Trọng lượng sản phẩm”. Giả thuyết H0 thể hiện điều khẳng định của nhà sản xuất là đúng, giả thuyết H1 thể hiện điều khẳng định đó sai. Ví dụ 7.2. Một quan chức ngành ngân hàng cho rằng độ dao động của giá 1 ounce vàng – đo bởi phương sai – là vượt quá 20 USD2, ta sẽ kiểm định mệnh đề đó thông qua cặp giả thuyết:  H 0 :  2   02  20   H 1 :  2   02 130 TXTOKT02_Bai7_v1.0014109205
  4. Bài 7: Kiểm định giả thuyết thống kê Ở đây 2 là phương sai tổng thể, phương sai của biến ngẫu nhiên X – “Giá 1 ounce vàng”. Giả thuyết H0 thể hiện điều khẳng định của quan chức là sai, độ dao động của giá vàng chỉ ở mức 20 USD2, H1 thể hiện điều khẳng định là đúng, độ dao động của giá vàng đã vượt quá mức 20 USD2. Ví dụ 7.3. Báo cáo của phòng chăm sóc khách hàng nói rằng tỷ lệ khách không hài lòng là chưa đến 10%, cặp giả thuyết có dạng:  H 0 : p  p0  0,1   H 1 : p  p0 Trong đó p là tỷ lệ khách không hài lòng trong tổng thể. Giả thuyết H0 thể hiện báo cáo của phòng chăm sóc khách hàng là sai, tỷ lệ khách không hài lòng đến 10%, giả thuyết H1 thể hiện báo cáo là đúng, tỷ lệ khách không hài lòng chưa đến 2%. Để kiểm tra một giả thuyết là đúng hay không, cần phải kiểm định, chúng ta sử dụng phương pháp thống kê, dựa trên một mẫu thực nghiệm để kết luận, với phương pháp suy luận như sau:  Giả sử H0 đúng;  Khi H0 đúng, với một mẫu, biến cố A sẽ xảy ra với xác suất rất nhỏ;  Theo nguyên lý xác suất nhỏ, có thể nói với một phép thử, A sẽ không xảy ra;  Với mẫu cụ thể nếu A xảy ra thì có thể bác bỏ H0, nếu A không xảy ra thì chưa có cơ sở bác bỏ H0. 7.1.2. Phương pháp kiểm định Xét mẫu ngẫu nhiên (X1, X2,…, Xn) được lập từ tổng thể, tùy thuộc cặp giả thuyết, ta chọn lập một thống kê tương ứng với giả thuyết gốc, kí hiệu là G  f ( X 1 , X 2 ,..., X n ) . Thống kê G được chọn sao cho nếu H0 đúng thì quy luật phân phối xác suất của G hoàn toàn xác định. Cùng với thống kê G, xác định một miền W sao cho với một giá trị là  (0;1) đủ nhỏ (thường lấy  bằng 0,05 hoặc 0,1) thì xác suất để thống kê G thuộc miền W bằng giá trị  đủ nhỏ đó. Tức là: P(G  Wα | H0) = α (7.2) Khi đó, theo nguyên lý xác suất lớn và nhỏ, khi H0 đúng, xác suất để biến cố (G  Wα) xảy ra là nhỏ, nên nếu với một mẫu, tính được giá trị cụ thể của G là Gqs = f(x1, x2,…, xn), và nếu biến cố (G  Wα) xảy ra thì có thể cho rằng H0 là không đúng theo cách kiểm định này.  Thống kê G được gọi là Tiêu chuẩn kiểm định;  Giá trị  được gọi là Mức ý nghĩa của kiểm định;  Miền W được gọi là Miền bác bỏ giả thuyết H0 với mức ý nghĩa . Với một mẫu cụ thể, tính được giá trị quan sát Gqs của tiêu chuẩn kiểm định:  Nếu giá trị quan sát thuộc miền bác bỏ  bác bỏ H0.  Nếu giá trị quan sát không thuộc miền bác bỏ  chưa bác bỏ H0. TXTOKT02_Bai7_v1.0014109205 131
  5. Bài 7: Kiểm định giả thuyết thống kê 7.1.3. Các loại sai lầm Khi sử dụng phương pháp kiểm định thống kê trên, có thể mắc phải các sai lầm. Các sai lầm gồm hai loại:  Sai lầm loại một: bác bỏ một điều đúng. Xác suất mắc sai lầm loại một bằng mức ý nghĩa .  Sai lầm loại hai: thừa nhận một điều sai. Xác suất mắc sai lầm loại hai bằng , 1   gọi là lực kiểm định. 7.1.4. Các bước thực hiện Bài toán kiểm định ở đây được thực hiện với giá trị cho trước của mức ý nghĩa . Các bước tiến hành tổng quát như sau:  Xây dựng giả thuyết gốc H0 cần kiểm định, từ đó viết cặp giả thuyết;  Lập mẫu ngẫu nhiên kích thước n;  Chọn tiêu chuẩn kiểm định G và xác định được quy luật phân phối xác suất của G khi giả thuyết H0 là đúng;  Xác định miền bác bỏ tốt nhất tùy thuộc vào giả thuyết đối H1;  Lập mẫu cụ thể và tìm được giá trị quan sát của tiêu chuẩn kiểm định;  So sánh giá trị quan sát với miền bác bỏ và kết luận. Trên thực tế, ta thường xét một số bài toán kiểm định các tham số cơ bản là trung bình (μ), phương sai (2) của tổng thể phân phối Chuẩn, và tỷ lệ tổng thể (p) trên các mẫu đã được cho thông tin. Do đó các tiêu chuẩn kiểm định, miền bác bỏ đã được xác định trước. Công việc phải thực hiện là:  Xác định chính xác cặp giả thuyết;  Tìm đúng tiêu chuẩn kiểm định và miền bác bỏ;  Tính đúng các thống kê dựa trên mẫu, tính giá trị quan sát;  Tra bảng số để kết luận bác bỏ hoặc chưa bác bỏ H0;  Kết luận đúng về câu hỏi. 7.2. Kiểm định về trung bình tổng thể Cũng tương tự bài toán ước lượng khoảng, ta chỉ xét bài toán kiểm định với tổng thể phân phối Chuẩn. Xét biến ngẫu nhiên gốc trong tổng thể phân phối chuẩn X ~ N(μ ; 2) với các tham số tổng thể là chưa biết, hay  chưa biết, trong đó  chính là trung bình của tổng thể theo dấu hiệu nghiên cứu. Ta kiểm định giả thiết về tham số , với việc so sánh với một số thực 0 cho trước. Các chứng minh đã được trình bày trong giáo trình, tại đây ta áp dụng các công thức để thực hiện kiểm định và đưa ra kết luận phù hợp với từng trường hợp. Xét cặp giả thuyết đầu tiên: H 0 :   0   H1 :   0 132 TXTOKT02_Bai7_v1.0014109205
  6. Bài 7: Kiểm định giả thuyết thống kê Trong đó μ0 là một con số được đưa ra trong giả thuyết cần kiểm định. Khi đó sử dụng thống kê chứa tham số cần kiểm định và có quy luật phân phối xác suất xác định (tiêu chuẩn kiểm định) như sau: ( X  0 ) n T S Nếu H0 đúng, chứng minh được rằng khi đó xác suất để T  t( n/21) là bằng α đủ nhỏ, như vậy theo nguyên lý xác suất nhỏ, có thể nói biến cố đó không xảy ra khi thực hiện một phép thử. Khi thực hiện một phép thử, nghĩa là với số liệu mẫu cụ thể, tính được: ( x  0 ) n Tqs  s Nếu Tqs  t( n/21) thì tức là biến cố “không xảy ra” đã xảy ra, từ đó cho rằng H0 là sai. Trình tự thực hiện bài kiểm định như sau: H :   0  Với cặp giả thuyết:  0  H1 :   0 ( X  0 ) n  Tiêu chuẩn kiểm định: T  S  Với mức ý nghĩa α cho trước, miền bác bỏ H0 là: ( x  0 ) n  Giá trị quan sát là: Tqs  s  Nếu Tqs  Wα hay Tqs  t( n/21) thì bác bỏ H0  Nếu Tqs  Wα hay Tqs  t( n/ 21) thì chưa bác bỏ H0 Với hai loại cặp giả thuyết có dấu lớn hơn và nhỏ hơn, tiêu chuẩn kiểm định và giá trị quan sát không thay đổi so với cặp giả thuyết trên, chỉ có miền bác bỏ là thay đổi.  H 0 :   0 Loại cặp giả thuyết   H1 :   0  Miền bác bỏ H0 : W = {T : T > t( n-1) }  Nếu TqsWα hay Tqs > t( n-1) thì bác bỏ H0  Nếu TqsWα hay Tqs < t( n-1) thì chưa bác bỏ H0 Sự khác biệt so với cặp giả thuyết trên là thay vì trị tuyệt đối |T| thì ở đây không có trị tuyệt đối, và giá trị tới hạn không phải là mức α/2 mà là α: t( n-1) thay cho t( n/-21)  H 0 :   0 Loại cặp giả thuyết   H1 :   0  Miền bác bỏ H0 : W = {T : T < -t( n-1) } TXTOKT02_Bai7_v1.0014109205 133
  7. Bài 7: Kiểm định giả thuyết thống kê  Nếu TqsWα hay Tqs < -t( n-1) thì bác bỏ H0  Nếu TqsWα hay Tqs > -t( n-1) thì chưa bác bỏ H0 Như vậy ở đây sử dụng T không có trị tuyệt đối, và giá trị tới hạn ở mức α và có dấu âm: -t( n-1) , quy cách bác bỏ cũng khác các cặp giả thuyết trên. Có thể tóm tắt ba cặp giả thuyết trong bảng sau: Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi ( X  0 ) n H 0 :   0 T S  W   T : T  t( n/ 21)  Tqs  t( n/21)  H1 :   0 Giá trị quan sát ( x  0 ) n H 0 :   0 Tqs   W   T : T  t( n 1)  Tqs  t( n 1) s  H1 :   0 H 0 :   0  W   T : T   t( n 1)  Tqs  t( n 1)  H1 :   0 Để đơn giản, từ phần này về sau, các cặp giả thuyết, tiêu chuẩn kiểm định và miền bác bỏ sẽ được tóm tắt trong các bảng. Ví dụ 7.4. Xem xét về trọng lượng một loại quả (tính bằng gam), người ta tiến hành cân thử một số quả lấy ngẫu nhiên, đựợc số liệu cho trong bảng dưới đây. Trọng lượng (gam) 25 – 27 27 – 29 29 – 31 31 – 33 33 – 35 35 – 37 Số quả tương ứng 3 5 7 5 3 2 Biết rằng trọng lượng quả là đại lượng có phân phối chuẩn. (a) Tiêu chuẩn đặt ra cho trọng lượng trung bình của quả là 30g. Với mức ý nghĩa 5%, có thể nói loại quả trên đạt tiêu chuẩn hay không? (b) Mùa vụ trước trọng lượng trung bình của loại quả này là 29g. Với mức ý nghĩa 5% có thể nói trọng lượng trung bình đã tăng lên không? Giải: Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N(μ ; 2), trong đó µ là trọng lượng trung bình,2 là phương sai của trọng lượng, cả hai đại lượng này đều chưa biết. Ta có thông tin của một mẫu cụ thể kích thước n = 25. Với bộ số liệu này, tính các thống kê đặc trưng mẫu được kết quả: x  30, 48(g) ; s 2  8, 4267(g 2 ) ; s  2,903(g) (a) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có bằng 30 hay không, hay µ có bằng 30 hay không, với α = 0,05. Cặp giả thuyết là:  H 0 :   30   H 1 :   30 Trong đó giả thuyết H0 nghĩa là loại quả này đạt tiêu chuẩn, H1 là loại quả không đạt tiêu chuẩn. 134 TXTOKT02_Bai7_v1.0014109205
  8. Bài 7: Kiểm định giả thuyết thống kê Lưu ý rằng ta không được sử dụng ngay giá trị trung bình mẫu là 30,48 để kết luận trung bình tổng thể khác 30, vì con số 30,48 chỉ là của một mẫu. Phải thực hiện kiểm định chi tiết. ( X  0 ) n Tiêu chuẩn kiểm định T  ; miền bác bỏ H0: W  T : T  t( n/21)  S ( x   0 ) n (30, 48  30) 25 Với mẫu cụ thể trên, Tqs    0,8267 s 2,903 t( n/21)  t0,025 (24)  2, 064  W  T : T  2, 064 Do đó |Tqs| < 2,064, chưa có cơ sở bác bỏ H0, hay có thể hiểu H0 được coi là đúng, có thể nói loại quả này đạt tiêu chuẩn. Như vậy dù trung bình mẫu không bằng 30 nhưng vẫn có thể coi trung bình tổng thể là bằng 30, vẫn coi quả là đạt tiêu chuẩn. Chính xác hơn là chưa thấy bằng chứng cho thấy quả không đạt tiêu chuẩn. (b) Câu hỏi yêu cầu kiểm định xem trọng lượng trung bình có lớn hơn 29 hay không, với α = 0,05. Cặp giả thuyết là:  H 0 :   29   H 1 :   29 Trong đó giả thuyết H0 nghĩa là trọng lượng trung bình không tăng, H1 là trọng lượng trung bình có tăng lên ( X  0 ) n Tiêu chuẩn kiểm định T  ; miền bác bỏ H0: S  W  T : T  t( n 1)  Với mẫu cụ thể trên, ( x  0 ) n (30, 48  29) 25 Tqs    2,5491 s 2,903 t( n 1)  t0,05 (24)  1, 711  W  T : T  1, 711 Do đó Tqs > 1,711 bác bỏ H0, có thể nói trọng lượng trung bình đã tăng lên so với mùa vụ trước. 7.3. Kiểm định giả thuyết về phương sai tổng thể Giả sử trong tổng thể có biến ngẫu nhiên gốc phân phối chuẩn, X ~ N( , 2), trong đó tham số 2 đặc trưng cho độ phân tán/độ biến động/độ ổn định/độ đồng đều của tổng thể theo dấu hiệu nghiên cứu, là chưa biết. Ta kiểm định giả thuyết về mối quan hệ giữa phương sai tổng thể 2 với một số  02 cho trước. Sử dụng một mẫu kích thước n với phương sai mẫu là S2, độ lệch chuẩn là S. TXTOKT02_Bai7_v1.0014109205 135
  9. Bài 7: Kiểm định giả thuyết thống kê Ta thiết lập thủ tục kiểm định dựa trên quy luật phân phối xác suất của thống kê sau: (n  1) S 2 2  ~  2 (n  1)  2 Từ đó xây dựng được tiêu chuẩn kiểm định, công thức tính giá trị quan sát ứng với một mẫu cụ thể kích thước n (phương sai mẫu s2, độ lệch chuẩn mẫu s) và miền bác bỏ ứng với các cặp giả thuyết như sau: Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi  H 0 :  2   02  W   2  12(n/ 12)  qs 2  12(n /21)   2  2(/n21)  (n  1) S 2  H 1 :  2   02 2  hoặc hoặc  2qs   2(/2n 1)  2 0  H 0 :  2   02 Giá trị quan sát   H 1 :  2   02  W   2  2( n 1)   2qs   2( n 1) (n  1) s 2  qs2   H 0 :  2   02  02   H 1 :  2   02  W   2  12(n 1)   qs 2  12(n 1) Ví dụ 7.5. Với số liệu của ví dụ 7.4 trong phần trên, cân thử 25 quả thấy trọng lượng trung bình mẫu là 30,48 gam, phương sai mẫu 8,4267 gam2, độ lệch chuẩn mẫu 2,903 gam. Biết trọng lượng quả là đại lượng phân phối chuẩn. (a) Với mức ý nghĩa 5%, kiểm định ý kiến cho rằng phương sai trọng lượng quả là bằng 5 gam2. Nếu mức ý nghĩa là 2% thì kết luận có thay đổi không? (b) Mùa vụ trước trọng lượng quả có độ phân tán bằng 4 gam, với mức ý nghĩa 5% thì có thể nói mùa vụ này trọng lượng quả đã đồng đều hơn không? Giải: Đặt X là trọng lượng của loại quả này, theo giả thiết, X ~ N( , 2), trong 2 là phương sai, đo độ đồng đều của trọng lượng, là chưa biết. Thông tin có được chỉ là một mẫu cụ thể kích thước n = 25, ta tính được các thống kê đặc trưng mẫu: x  30, 48( g ) ; s 2  8, 4267( g 2 ) ; s  2,903( g ) (a) Câu hỏi kiểm định giả thuyết 2 bằng 5, với α = 0,05. Cặp giả thuyết là  H 0 :  2  5   H 1 :  2  5 Trong đó giả thuyết H0 nghĩa là ý kiến đúng, H1 là ý kiến sai. (n  1) S 2 Tiêu chuẩn kiểm định  2  ; 02 Miền bác bỏ H0: W   2  12(n /21) hoặc  2  2(/2n 1)  Với mẫu cụ thể trên ta tính được: (n  1) s 2 24  8, 4267  2qs    40, 448 02 5 Ta xác định được các giá trị tới hạn: 12(n / 1)2   0,975 2(24)  12, 4 ;  2(/2n 1)   0,025 2(24)  39,36 136 TXTOKT02_Bai7_v1.0014109205
  10. Bài 7: Kiểm định giả thuyết thống kê Như vậy bác bỏ H0 khi  2qs < 12,4 hoặc  2qs > 39,36. Như vậy  2qs > 39,36: bác bỏ giả thuyết H0, ý kiến cho rằng phương sai trọng lượng bằng 5 gam2 là sai. Nếu mức ý nghĩa α = 0,02 thì: 12(n / 1)2   0,99 2(24)  10,86 ;  2(/2n 1)   0,01 2(24)  42,98 Khi đó 10,86 <  2qs < 42,98: chưa có cơ sở bác bỏ H0, ý kiến cho rằng phương sai trọng lượng bằng 5 gam2 là đúng. (b) Độ đồng đều mùa vụ trước bằng 4 gam, tức là độ lệch chuẩn trọng lượng vụ trước bằng 4, và phương sai mùa vụ trước là 42 = 16 gam2. Độ đồng đều tăng lên tức là phương sai của trọng lượng nhỏ hơn so với ở mùa vụ trước. Câu hỏi kiểm định giả thuyết 2 nhỏ hơn 16, với α = 0,05. Cặp giả thuyết là:  H 0 :  2  16   H 1 :  2  16 Trong đó giả thuyết H0 nghĩa là ý kiến sai, H1 là ý kiến đúng. (n  1) S 2 Tiêu chuẩn kiểm định  2  02  ; Miền bác bỏ H0: W   2 :  2  12(n 1)  (n  1)s 2 24  8, 4267 Với mẫu cụ thể trên ta tính được: qs 2    12, 64 02 16 Tìm được giá trị tới hạn: 12(n 1)  0,95 2(24)  14, 61  W   2 :  2  14, 61 Do đó  2qs < 14,61: bác bỏ H0, có thể nói ý kiến cho rằng trọng lượng quả đồng đều hơn mùa vụ trước là đúng. 7.4. Kiểm định về tỷ lệ tổng thể Tỷ lệ tổng thể, hay còn gọi là tần suất tổng thể được kí hiệu là p. Từ yêu cầu thực tế đặt ra, ta đưa đến việc kiểm định giả thuyết về mối quan hệ giữa tham số p với một số p0 cho trước. Ta lập một mẫu ngẫu nhiên kích thước n, từ đó xác định được tần suất mẫu là f. Thủ tục kiểm định về tần suất tổng thể được thiết lập dựa trên quy luật phân phối xác suất của thống kê sau đây: ( f  p) n U ~ N (0;1) p (1  p ) ( f  p0 ) n Nếu p = p0 (giả thuyết H0 đúng) thì U  ~ N (0;1) p0 (1  p0 ) TXTOKT02_Bai7_v1.0014109205 137
  11. Bài 7: Kiểm định giả thuyết thống kê Dựa trên lý thuyết chung về kiểm định giả thuyết, ta xây dựng được tiêu chuẩn kiểm định và xác định được miền bác bỏ tương ứng cho các cặp giả thuyết trong bảng dưới đây: Tiêu chuẩn Cặp giả thuyết Miền bác bỏ H0 Bác bỏ H0 khi H 0 : p  p 0  W   U : U  u /2  |Uqs| > u/2  H1 : p  p 0 ( f  p0 ) n H 0 : p  p 0 U  W   U : U  u  Uqs > u p0 (1  p0 )  H1 : p  p 0 H 0 : p  p 0  W   U : U   u  Uqs < –u  H1 : p  p 0 Ví dụ 7.6. Tổng điều tra trên một khu vực 5 năm trước cho thấy có 10% dân số ở độ tuổi trưởng thành không biết chữ. Năm nay điều tra ngẫu nhiên 400 người thì có 22 người ở độ tuổi trưởng thành không biết chữ. Với mức ý nghĩa 5%: (a) Nhận xét ý kiến cho rằng tỷ lệ mù chữ không giảm đi so với 5 năm trước. (b) Phải chăng tỷ lệ mù chữ vẫn còn trên 3%? (c) Có thể cho rằng tỷ lệ mù chữ đã giảm đi còn 5% hay không? Giải: Đặt p là tỷ lệ mù chữ của khu vực. Tỷ lệ này 5 năm trước là 10% = 0,1. Với mức ý nghĩa α = 0,05, ta thực hiện kiểm định các giả thuyết theo yêu cầu đề bài. (a) Đề bài yêu cầu kiểm định p có nhỏ hơn 0,1 hay không, cặp giả thuyết là:  H 0 : p  0,1 ( f  p0 ) n  Tiêu chuẩn U   H 1 : p  0,1 p0 (1  p0 ) Miền bác bỏ W   U : U   u  k 22 Tỷ lệ mù chữ trong mẫu f    0, 055 n 400 Từ đó ta tính được giá trị quan sát của tiêu chuẩn kiểm định: (0,055  0,1) 400 U qs   3 0,1(1  0,1) Với mức ý nghĩa cụ thể: u  u0,05  1, 645  W   U : U  1, 645 U qs  W , bác bỏ H0, chấp nhận H1 . Như vậy có thể nói tỷ lệ mù chữ đã giảm đi, ý kiến đưa ra ở trên là sai. (b) Yêu cầu kiểm định p có lớn hơn 0,03 hay không, cặp giả thuyết là:  H 0 : p  0,03 ( f  p0 ) n  Tiêu chuẩn U   H 1 : p  0,03 p0 (1  p0 ) Miền bác bỏ W   U : U  u  (0, 055  0, 03) 400 U qs   2,931 0, 03(1  0, 03) 138 TXTOKT02_Bai7_v1.0014109205
  12. Bài 7: Kiểm định giả thuyết thống kê Miền bác bỏ của giả thuyết H0: U qs  W , bác bỏ H0, chấp nhận H1 . Do đó có thể nói tỷ lệ mù chữ vẫn còn trên 3%. (c) Yêu cầu kiểm định p có bằng 0,05 hay không, cặp giả thuyết là:  H 0 : p  0,05 ( f  p0 ) n  Tiêu chuẩn U   H 1 : p  0,05 p0 (1  p0 ) Miền bác bỏ W   U : U  u /2  (0, 055  0, 05) 400 U qs   0, 4588 0, 05(1  0, 05) Xác định được giá trị tới hạn chuẩn: u /2  u0,025  1,96  W   U : U  1,96 Ta thấy U qs  W , chưa có cơ sở bác bỏ H0, như vậy dựa trên mẫu cụ thể, có thể nói tỷ lệ mù chữ hiện nay là 5%. Ví dụ 7.7. (tổng hợp về bài toán kiểm định tham số). Tuổi thọ sản phẩm do một doanh nghiệp sản xuất ra có phân phối chuẩn. Qua quá trình theo dõi tuổi thọ của một số sản phẩm được sử dụng người ta có số liệu sau: Tuổi thọ (giờ) 320 350 390 400 450 Số sản phẩm 12 25 35 20 8 (a) Tính trung bình mẫu và độ lệch chuẩn của mẫu này. (b) Với mức ý nghĩa 5% có thể nói tuổi thọ trung bình của sản phẩm là dưới 400 giờ? (c) Trước đây độ phân tán của tuổi thọ sản phẩm (đo bằng độ lệch chuẩn) là 25 giờ. Với mức ý nghĩa 5%, có thể nói độ phân tán của tuổi thọ sản phẩm đã tăng lên? (d) Phải chăng tỷ lệ sản phẩm tuổi thọ trên 400 giờ là dưới 10%. Kết luận với mức ý nghĩa 5%. Giải: Gọi X là “Tuổi thọ của sản phẩm”. Theo giả thiết X có phân phối chuẩn, X ~ N(µ ; 2) Trong đó µ là kỳ vọng của X và là tuổi thọ trung bình của sản phẩm; 2 là phương sai, đo độ phân tán của tuổi thọ sản phẩm. Ở đây cả µ và 2 đều chưa biết. (a) Từ số liệu của mẫu cụ thể ta tính được: k k n = 100,  ni xi  37840 , i 1 n x i 1 2 i i  14434800 1 k 37840 x  n i 1 ni xi  100  378, 4 14434800 ms  x 2  ( x ) 2   378, 42  1164, 44 100 n 100  1164, 44 s2  ms   1173,172 n 1 99 s  s 2  1173,172  34, 2515 Như vậy trung bình mẫu là 378,4 (giờ), độ lệch chuẩn mẫu là 34,2515 (giờ). TXTOKT02_Bai7_v1.0014109205 139
  13. Bài 7: Kiểm định giả thuyết thống kê (b) Theo yêu cầu đề bài ta kiểm định xem tuổi thọ trung bình có nhỏ hơn 400 giờ hay không, với α = 0,05. Cặp giả thuyết là:  H 0 :   400   H 1 :   400 Trong đó giả thuyết H1 thể hiện nhận định ở đề bài là đúng. ( X  0 ) n Tiêu chuẩn kiểm định T  ; miền bác bỏ H0: W   T : T   t( n 1)  S ( x   0 ) n (3780, 4  400) 100 Với mẫu cụ thể trên, Tqs    6,306 s 34, 2515 Ta xác định giá trị tới hạn: t( n 1)  t0,05 99  u0,05  1, 645  W  T : T   1, 645 Do đó Tqs < – 1,645: bác bỏ H0. Như vậy có thể nói tuổi thọ trung bình của sản phẩm là dưới 400 giờ. (c) Độ phân tán của tuổi thọ sản phẩm tăng lên tức là phương sai của tuổi thọ sản phẩm lớn hơn so với trước. Câu hỏi kiểm định giả thuyết 2 lớn hơn 252, với α = 0,05. Cặp giả thuyết là: Trong đó giả thuyết H0 nghĩa là ý kiến sai, H1 là ý kiến đúng. (n  1) S 2 Tiêu chuẩn kiểm định  2  02  ; Miền bác bỏ H0: W   2 :  2  2( n 1)  (n  1) s 2 99 1173,172 Với mẫu cụ thể trên ta tính được:  qs 2    185,83 02 625 Tìm được giá trị tới hạn:  2( n 1)   0,05 2(99)  124,34  W   2 :  2  124,34 Do đó  2qs > 124,34: bác bỏ H0, có thể nói ý kiến cho rằng tuổi thọ sản phẩm có độ phân tán tăng hơn trước đây là đúng. (d) Đặt p là tỷ lệ sản phẩm tuổi thọ trên 400 giờ. Đề bài yêu cầu kiểm định p có nhỏ hơn 0,1 hay không, cặp giả thuyết là:  H 0 : p  0,1 ( f  p0 ) n  Tiêu chuẩn U   H 1 : p  0,1 p0 (1  p0 ) Miền bác bỏ W   U : U   u  k 8 Tỷ lệ sản phẩm tuổi thọ trên 400 giờ trong mẫu f    0, 08 n 100 Từ đó ta tính được giá trị quan sát của tiêu chuẩn kiểm định: (0, 08  0,1) 100 U qs   0, 667 0,1(1  0,1) Với mức ý nghĩa cụ thể: u  u0,05  1, 645  W   U : U  1, 645 Do đó Uqs > –1,645 chưa đủ cơ sở bác bỏ H0 . Như vậy chưa thể nói tỷ lệ sản phẩm tuổi thọ trên 400 giờ là dưới 10%. 140 TXTOKT02_Bai7_v1.0014109205
  14. Bài 7: Kiểm định giả thuyết thống kê Tóm lược cuối bài  Nghiên cứu một dấu hiệu và kiểm tra dấu hiệu đó có một hoặc một số tính chất nào đó → bài toán kiểm định giả thuyết.  Phương pháp kiểm định: bao gồm giả thuyết thống kê và tiêu chuẩn kiểm định.  Các cặp giả thuyết cơ bản.  Kiểm định các cặp giả thuyết với 3 tham số cơ bản của biến ngẫu nhiên: μ, σ2 và p. TXTOKT02_Bai7_v1.0014109205 141
  15. Bài 7: Kiểm định giả thuyết thống kê Câu hỏi ôn tập 1. Thế nào là bài toán Kiểm định giả thuyết về tham số? 2. Khi nào thì cần thực hiện công việc Kiểm định? 3. Dấu hiệu nào để xác định công việc đề bài yêu cầu là Kiểm định giả thuyết? 4. Dấu hiệu nào để nhận biết là Bài toán kiểm định µ; 2 hay p. 5. Cách chọn đúng cặp giả thuyết kiểm định trong 3 dạng cặp giả thuyết. 6. Quy trình thực hiện một bài toán kiểm định gồm các bước nào? 142 TXTOKT02_Bai7_v1.0014109205
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2