intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT - BÀI TOÁN ƯỚC LƯỢNG

Chia sẻ: Muay Thai | Ngày: | Loại File: PDF | Số trang:17

1.192
lượt xem
88
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong phần này sẽ đề cập đến việc suy luận các đặc trưng của tổng thể dựa trên các đặc trưng của mẫu. Các đặc trưng của tổng thể có thể là giá trị trung bình, phương sai hoặc tỷ lệ các đơn vị của tổng thể có một tính chất nào đó. Vấn đề đặt ra là ước lượng các đặc trưng của tổng thể (chưa biết) từ các đặc trưng của mẫu dữ liệu thu thập được. 1. Các vấn đề liên quan đến bài toán ước lượng Có hai loại ước lượng là ước lượng điểm và...

Chủ đề:
Lưu

Nội dung Text: ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT - BÀI TOÁN ƯỚC LƯỢNG

  1. Chương 5. ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT 5.1. Bài toán ước lượng Trong phần này sẽ đề cập đến việc suy luận các đặc trưng của tổng thể dựa trên các đặc trưng của mẫu. Các đặc trưng của tổng thể có thể là giá trị trung bình, phương sai hoặc tỷ lệ các đơn vị của tổng thể có một tính chất nào đó. Vấn đề đặt ra là ước lượng các đặc trưng của tổng thể (chưa biết) từ các đặc trưng của mẫu dữ liệu thu thập được. 1. Các vấn đề liên quan đến bài toán ước lượng Có hai loại ước lượng là ước lượng điểm và ước lượng khoảng. Ước lượng điểm là phương pháp dùng một tham số thống kê mẫu đơn lẻ để ước lượng về giá trị thật của tham số tổng thể. ̅ Các tham số đặc trưng Mẫu Tổng thể ̂ Trung bình T ỷ lệ Phương sai Do các tham số đặc trưng của tổng thể được ước lượng thông qua một mẫu được chọn nên khi thay đổi từ mẫu này sang mẫu khác sẽ dẫn đến các tham số đặc trưng của tổng thể cũng thay đổi. Vì vậy, trong trường hợp trung bình của tổng thể nếu dùng một giá trị trung bình mẫu của một mẫu cụ thể để ước lượng điểm về trung bình tổng thể sẽ kém tin cậy hơn so với khi vận dụng quy luật phân phối của trung bình mẫu vào quá trình ước lượng trung bình tổng thể qua phương pháp ước lượng khoảng. Ước lượng khoảng là phương pháp dựa vào dữ liệu của mẫu, với một độ tin cậy cho trước, xác định khoảng giá trị mà đặc trưng của tổng thể có thể rơi vào. quan sát tìm được hai biến ngẫu nhiên và sao cho ( < < ) = 1 − . Một cách tổng quát, gọi là đặc trưng của tổng thể cần ước lượng. Giả sử, dựa vào mẫu Gọi , lần lượt là các giá trị cụ thể của và . Khoảng ( , ) được gọi là khoảng ước lượng với độ tin cậy (1 − ) ∗ 100% của , hay nói một cách ngắn gọn là khoảng tin cậy (1 − ) ∗ 100% của . 2. Ước lượng trung bình tổng thể A. Ước lượng trung bình một tổng thể a. Biết phương sai của tổng thể Giả sử có mẫu quan sát được chọn ngẫu nhiên từ tổng thể phân phối chuẩn có phương sai Gọi là trung bình mẫu, khoảng tin cậy (1 − ) ∗ 100% của trung bình tổng thể đã biết. được xác định bởi
  2. − ∗ < < + ∗ √ √ / / Vớ i có phân phối chuẩn. Ví dụ: Một công ty muốn ước lượng số tài liệu (trang) được chuyển bằng fax trong một ngày. Kết quả thu thập từ 15 ngày cho thấy trung bình một ngày có 267 trang tài liệu được chuyển bằng fax. Theo kinh nghiệm từ các văn phòng tương tự thì độ lệch chuẩn là 32 trang. Giả sử số trang tài liệu chuyển bằng fax trong một ngày có phân phối chuẩn với độ tin cậy 95%, ta ước lượng − ∗ < < + ∗ √ √ / / = 267, = 32, = 15, = = 1.96 ta có 250.8055 < < 283.1945. / . Vớ i Như vậy với độ tin cậy 95%, số lượng tài liệu chuyển trung bình một ngày được ước lượng từ 251 đến 284 trang. Nhận xét: Với một độ tin cậy và kích thước mẫu không đổi, nếu độ lệch chuẩn càng lớn thì khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp. Với một độ tin cậy và độ lệch chuẩn không đổi, nếu kích thước mẫu càng lớn thì khoảng ước lượng càng hẹp, tức là độ chính xác của ước lượng càng cao. Với độ lệch chuẩn và kích thước mẫu không đổi, nếu độ tin cậy càng cao thì khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp. b. Chưa biết phương sai của tổng thể Trong thực tế, ta thường không biết phương sai của tổng thể. (1 − )100% trung bình tổng thể được xác định như sau: Trong trường hợp này ta vẫn giả định tổng thể có phân phối chuẩn, khoảng tin cậy − ∗ < < + ∗ √ √ ,/ ,/ Với có phân phối Student với bậc tự do ( − 1). Ví dụ: Công ty điện thoại ở một thành phố muốn ước lượng thời giant rung bình của các cuộc điện đàm đường dài vào những ngày cuối tuần. Mẫu ngẫu nhiên 20 cuộc gọi đường dài vào những ngày cuối tuần cho thấy thời gian điện đàm trung bình là 14.8 phút, độ lệch chuẩn là 5.6 phút. Như vậy với độ tin cậy 95%, thời gian trung bình của cuộc điện đàm đường dài được xác định như sau: − ∗ < < + ∗ √ √ ,/ ,/
  3. = 14.8; = 5.6; = 20, = = 2.093 ta có ,/ ,. 12.1792 < < 17.4208 Vớ i Nghĩa là với độ tin cậy 95%, thời gian trung bình của một cuộc điện đàm đường dài vào cuối Lưu ý: Trong trường hợp mẫu lớn ( ≥ 30), ta có thể dùng phân phối chuẩn thay cho phân phối tuần được ước lượng khoảng từ 12.1792 đến 17.4208 phút. Student, kể cả trong trường hợp tổng thể có phân phối chuẩn. Ví dụ: Một trường đại học thực hiện nghiên cứu về số giờ tự học của sinh viên trong một tuần. Chọn ngẫu nhiên 200 sinh viên cho thấy số giờ tự học trong tuần tính trung bình là 18.36 giờ, độ lệch chuẩn là 3.92 giờ. Như vậy với độ tin cậy 95%, số giờ tự học trung bình của sinh viên ở trường này được ước lượng là: − ∗ < < + ∗ √ √ / / = 18.36; = 3.92; = 200; = = 1.96 ta có / . 17.8168 < < 18.9032 Vớ i Nghĩa là với độ tin cậy 95%, số giờ tự học trung bình trong tuần của sinh viên được ước lượng từ 17.8168 đến 18.9032 giờ. B. Ước lượng sự khác biệt giữa hai trung bình tổng thể Trong nhiều trường hợp, ta có thể quan tâm đến khác biệt giữa trung bình hai tổng thể, chẳng hạn như khác biệt về doanh số trung bình trong tuần từ hai phương pháp trưng bày hàng hóa, chào hàng hóa khác nhau, hoặc sự khác biệt giữa năng suất cây trồng do sử dụng hai loại phân bón khác nhau… Phương pháp so sánh trung b ình hai tổng thể phụ thuộc vào cách thức lấy mẫu: mẫu phối hợp từng cặp (mẫu phụ thuộc) hoặc mẫu độc lập. a. Mẫu phối hợp từng cặp Ở phương pháp này, các đơn vị mẫu được chọn từng cặp, từ hai tổng thể. Thông thường mẫu phối hợp từng cặp thường bao gồm các trường hợp sau đây: - So sánh trước và sau, chẳng hạn mẫu thứ nhất là doanh số bán trước khi thực hiện khuyến mãi, mẫu thứ hai là doanh số sau khi thực hiện khuyến mãi. Ở đây mẫu phối hợp từng cặp theo nghĩa là doanh số trước và sau khi khuyến mãi được thu thập từ cùng một cửa hàng. - So sánh các đơn vị ở cùng một đặc điểm nào đó, chẳng hạn mẫu thứ nhất là tiền lương của nhân viên nam ở công ty Y, mẫu thứ hai là tiền lương của nhân viên nữ ở công ty Y, hai nhân viên nam và nữ được xem là giống nhau về năng lực và kinh nghiệm. Ở đây, mẫu phối hợp từng cặp theo nghĩa là cả hai nhân viên nam và nữ được xem là có nang lực và kinh nghiệm như nhau.
  4. - So sánh giữa các đơn vị phối hợp từng cặp theo không gian, chẳng hạn mẫu thứ nhất là doanh số của loại nước giải khát nhãn hiệu A ở cửa hàng; ở mẫu thứ hai là doanh số bán hàng của loại nước giải khát nhãn hiệu B ở cửa hàng đó. Ở đây, mẫu phối hợp từng cặp theo nghĩa là cả hai doanh số của hai nhãn hiệu A và B đều được thu thập từ cùng một cửa hàng. - So sánh giữa các đơn vị phối hợp từng cặp theo thời gian, chẳng hạn mẫu thứ nhất là doanh số của nhà hàng X ở một tuần lễ nào đó, mẫu thứ hai là doanh số của nhà hàng Y trong cùng một tuần lễ đó. Ở đây mẫu phối hợp từng cặp theo nghĩa từng cặp doanh số các cặp quan sát ( , ) lấy ngẫu nhiên từ hai tổng thể và . được thu thập trong cùng một tuần lễ. , lần lượt là trung bình của tổng thể , ; Giả sử có ̅ là trung bình của Gọ i khác biệt; Với khoảng tin cậy (1 − )100% của − là độ lệch tiêu chuẩn của khác biệt. được xác định như sau: ̅− < ̅+ ∗ < − ∗ √ √ ,/ ,/ Với có phân phối Student với bậc tự do ( − 1). Ví dụ: Công ty điện lực thực hiện các biện pháp khuyến khích tiết kiệm điện. Lượng điện tiêu thụ ghi nhận ở 12 hộ gia đình trước và sau khi có các biện pháp khuyến khích tiết kiệm ddieemnj như sau: =− −̅ Hộ gia đình Lượng điện tiêu thụ trước và sau khi Độ lệch Bình phương độ lệch khuyến khích tiết kiệm điện (KWh) Trước Sau 1 73 69 4 2 50 54 -4 3 83 82 1 4 78 67 11 5 56 60 -4 6 74 73 1 7 74 75 -1 8 87 78 9 9 69 64 5 10 72 72 0 11 77 70 7 Vậy ta có ̅ = 12 75 63 12 = 3.4167; = = ↔ = 5.4848 . Tổng 41
  5. − Giả sử rằng các khác biệt giữa lượng điện trước và sau khi khuyến khích tiết kiệm điện có phân phối là chuẩn, khoảng itn cậy 95% của ̅− < ̅+ ∗ < − ∗ √ √ ,/ ,/ = 12; ̅ = 3.4167; = = 2.201 ta có = 5.4848; ,/ ,. −0.0682 < − < 6.9016 Vớ i Như vậy, khoảng tin cậy 95% của khác biệt giữa lượng điện tiêu thụ trung bình trước và sau khi khuyến khích tiết kiệm được ước lượng từ -0.0682 KWh đến 6.9016 KWh. Khoảng ước lượng này bao gồm trị số 0, do vậy có thể tin rằng lượng điện tiêu thụ trung bình trước và sau khi thực hiện các biện pháp khuyến khích tiết kiệm là bằng nhau. , b. Mẫu độc lập , Gọ i là các mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể phân phối chuẩn và ; , là trung bình của hai tổng thể và ; , là phương sai của hai tổng thể và ; Khoảng tin cậy (1 − )100% của − là trung bình của hai mẫu. được xác định như sau: ( − )−
  6. 8 9.5 8 9 .5 (46.5 − 51.2) − 1.96 ∗ < (46.5 − 51.2) + 1.96 ∗ + < − + 40 38 40 38 −8.6077 < − < −0.7923 Khoảng tin cậy 95% tính được chỉ là các giá trị âm, không bao gồm giá trị 0. Do vậy có thể nói rằng dây chuyền sản xuất mới có thời gian sản xuất ngắn hơn. Với độ tin cậy 95%, ta ước lượng dây chuyền sản xuất mới rút ngắn thời giant rung bình sản xuất một sản phẩm trong khoảng từ 0.7923 phút đến 8.6077 phút. 3. Ước lượng tỷ lệ tổng thể Trong nghiên cứu, ta quan tâm đến tỷ lệ các đơn vị có một tính chất nào đó trong tổng thể, như tỷ lệ khách hàng sử dụng một loại sản phẩm nào đó, tỷ lệ phế phẩm trong sản xuất… Khi đó ta thực hiện ước lượng cho kiểm định của tổng thể. A. Ước lượng tỷ lệ ̂ là tỷ lệ các quan sát có tính chất Giả sử mẫu ngẫu nhiên có quan sát; Với mẫu lớn ≥ 40, khoảng tin cậy (1 − ) ∗ 100% của tỷ lệ nào đó. các quan sát có tính chất trong tổng thể được xác định bởi: ̂ (1 − ̂ ) ̂ (1 − ̂ ) ̂− < < ̂+ / / Vớ i là phân phối chuẩn. Nhận xét: Khi càng lớn thì khoảng ước lượng càng hẹp, tức độ chính xác của ước lượng càng cao. Ví dụ: Một nghiên cứu được thực hiện nhằm ước lượng thị phần của sản phẩm nội địa (do các công ty trong nước sản xuất) đối với mặt hàng bánh kẹo. Kết quả điều tra ngẫu nhiên 100 khách hàng cho thấy có 34 người dùng sản phẩm nội địa. Như vậy với độ tin cậy 95%, tỷ lệ khách hàng sử dụng sản phẩm bánh kẹo nội địa được ước lượng là: ̂ (1 − ̂ ) ̂ (1 − ̂ ) ̂− < < ̂+ / / Với ̂ = 0.34; = 100; = / . 0.2472 < < 0.4328 =1.96 ta có:
  7. Nghĩa là với độ tin cậy 95%, thị phần bánh kẹo nội địa được ước lượng từ 24.72% đến 43.28%. , B. Ước lượng sự khác biệt giữa tỷ lệ hai tổng thể. , Giả sử ta có hai mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể và ; ̂ , ̂ lần lượt là tỷ lệ các đơn vị có tính chất lần lượt là tỷ lệ các đơn vị có tính chất trong tổng thể; ≥ 40, khoảng tin cậy (1 − ) ∗ 100% của , − trong mẫu. ̂ (1 − ̂ ) ̂ (1 − ̂ ) Với mẫu lớn được xác định như sau: ̂−̂− + < − / ̂ (1 − ̂ ) ̂ (1 − ̂ )
  8. , / ,/ , Vì đây là ước lượng một bên nên thay những giá trị lần lượt bằng các giá trị ,. xuất trung bình hàng ngày. Mẫu ngẫu nhiên 48 ngày cho thấy = 1260 sản phẩm, độ lệch Ví dụ: Với độ tin cậy 95% một công ty muốn ước lượng giới hạn trên cho lượng sản phẩm sản chuẩn = 325 sản phẩm. Khoảng tin cậy bên phải của ước lượng sản phẩm sản xuất trung bình hàng ngày được ước lượng 325 như sau: −∞ < < + ∗ → −∞ < < 1260 + 1.645 ∗ → −∞ < < 1337.17 √48 √ Như vậy, với độ tin cậy 95% ta ước lượng mức sản xuất trung bình hàng ngày không vượt quá 1338 sản phẩm. 4. Xác định cỡ mẫu cho bài toán ước lượng a. Đối với trung bình tổng thể Khoảng tin cậy (1 − ) ∗ 100% của trung bình tổng thể Giả sử ta có mẫu quan sát được chọn ngẫu nhiên tư tổng thể phân phối chuẩn có phương sai . được xác định bởi − ∗ < < + ∗ √ √ / / ∗ Gọ i là sai số ước lượng được xác định bằng nửa chiều rộng của khoảng tin cậy nên = ∗ → = / √ / Ví dụ: Sử dụng các số liệu của ví dụ ước lượng trung bình tổng thể trong trường hợp đã biết 99%, = 10 trang. Kích thước mẫu phải là bao nhiêu để thỏa mãn điều kiện này? phương sai ở trên. Ước lượng số lượng tài liệu chuyển bằng fax trong một ngày với độ tin cậy = = 2.575; = 10; = 32 thì = = 67.89 ∗ / / . Ta có Như vậy cần phải thu thập số liệu ít nhất trong 68 ngày. b. Đối với tỷ lệ tổng thể Tương tự, ta xác định kích thước mẫu tối thiểu như sau: ∗ ̂ ∗ (1 − ̂ ) = / Do ̂ ∗ (1 − ̂ ) ≤ nên ta có thể sử dụng công thức
  9. = / 4 Ví dụ: Sử dụng các số liệu của ví dụ ước lượng tỷ lệ của tổng thể. Ước lượng thị phần của sản phẩm bánh kẹo nội địa với độ tin cậy 99% với sai số ước lượng là 3%. Kích thước mẫu phải là = = 2.575; = 0.03 nên bao nhiêu để thỏa mãn điều kiện này? / . Ta có = = 1841.84 / 4 Như vậy cần phải điều tra 1842 người. 5.2. Bài toán kiểm định Bên cạnh việc ước lượng, các đặc trưng của tổng thể còn có thể được suy diễn từ dữ liệu mẫu thông qua phương pháp kiểm định giả thuyết. Kiểm định giả thuyết là dựa vào mẫu dữ liệu thu thập được để đưa ra các kết luận “bác bỏ” hay “chưa có cơ sở để bác bỏ” về các giả thuyết của tổng thể. Ví dụ: Những chi tiết về sản phẩm (trọng lượng, đường kính…) đã biết trước hoặc được quy định theo tiêu chuẩn kỹ thuật. Lấy mẫu sản phẩm để kết luận xem, những chi tiết hoặc tiêu chuẩn kỹ thuật này được thực hiện trong toàn bộ sản phẩm sản xuất hay không. Hay sau một thời gian thực hiện các biện pháp marketing (quảng cáo, khuyến mãi…) công ty muốn đánh giá xem thị phần, doanh số có gì thay đổi so với trước hay có đạt được mục tiêu đã đặt ra hay không. ... 1. Các vấn đề liên quan đến bài toán kiểm định a. Đặt giả thuyết Giả sử dấu hiệu nghiên cứu trong tổng thể có thể xem như biến ngẫu nhiên . Nếu chưa biết dạng phân phối xác suất của nó, song cơ sở để giả thuyết rằng phân phối theo một quy luật nào đó, người ta đưa ra giả thuyết: “biến ngẫu nhiên phân phối theo quy luật ”. người ta đưa ra giả thuyết = . Cũng có trường hợp dạng phân phối xác suất của đã biết song tham số đặc trưng của nó lại chưa biết, nếu có cơ sở để giả thuyết rằng giá trị của tham số bằng ( là hằng số đã biết), Khi nghiên cứu hai hay nhiều biến ngẫu nhiên độc lập thuộc các tổng thể khác nhau hay thuộc cùng một tổng thể, thường phải xét xem chúng độc lập hay phụ thuộc nhau, các tham số đặc trưng của chúng có bằng nhau hay không… Nếu chưa biết một cách chắc chắn song có cơ sở để nhận định về các vấn đề đó cũng có thể đưa ra các giả thuyết tương ứng. Từ đó có thể đưa ra định nghĩa sau: Định nghĩa: Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên, về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên.
  10. Giả thuyết thống kê đưa ra được ký hiệu là và được gọi là giả thuyết gốc. Khi đưa ra một giả thuyết thống kê, người ta còn nghiên cứu kèm theo nó mệnh đề mâu thuẫn với nó, gọi là giả thuyết đối và ký hiệu là . Để khi giả thuyết bị bác bỏ thì thừa nhận giả thuyết đối . Khi đó và tạo nên cặp giả thuyết thống kê. Chẳng hạn, ta nghiên cứu nhu cầu thị trường về một loại hàng hóa nào đó. Ta có thể đưa ra các cặp giả thuyết thống kê sau: : Nhu cầu trung bình về loại hàng hóa này là = 1000 đơn vị/ tháng; : Nhu cầu của thị trường phân phối theo quy luật chuẩn; Lúc đó các giả thuyết đối tương ứng của nó có thể là: : > 1000; : < 1000; : Nhu cầu của thị trường không phân phối theo quy luật chuẩn. : ≠ 1000. : Nhu cầu của thị trường và thu nhập của khách hàng độc lập với nhau; : Nhu cầu của thị trường và thu nhập của khách hàng phụ thuộc nhau… Trong thực tế, người ta còn phân biệt các giả thuyết chứa đựng một mệnh đề hoặc nhiều mệnh đề. luật chuẩn và ta đưa ra giả thuyết : = 5 thì đó là giả thuyết đơn. Giả thuyết đơn là giả thuyết chỉ chứa đựng một mệnh đề. Chẳng hạn, nếu là tham số của quy hạn giả thuyết : > 5 bao gồm một số vô hạn các giả thuyết đơn dạng : = , trong đó Giả thuyết kép là giả thuyết chứa đựng một số hữu hạn hoặc vô hạn các giả thuyết đơn. Chẳng là mọi số lớn hơn 5. Việc kiểm định giả thuyết kép thường khá phức tạp, do đó ở đây ta chỉ hạn chế ở việc nghiên cứu trường hợp giả thuyết gốc là giả thuyết đơn. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó. Việc kiểm định này gọi là kiểm định thống kê, vì nó dựa vào thông tin thực nghiệm của mẫu để kết luận. Phương pháp chung để kiểm định một giả thuyết thống kê như sau: Trước hết giả sử đúng, từ đó dựa vào thông tin của mẫu rút ra từ tổng thể tìm được một biến cố nào đó, sao cho xác suất xảy ra biến cố bằng bé đến mức có thể, tức là có thể coi không xảy ra trong một phép thử về biến cố này. Lúc đó trên một mẫu cụ thể thực hiện một phép thử đối với biến cố , nếu xảy ra, điều đó chứng tỏ sai và bác bỏ nó; còn nếu không xảy ra thì ta chưa có cơ sở để bác bỏ . Khi một mẫu được chọn ra từ một tổng thể, các thông tin của mẫu có thể nói l ên đặc điểm của tổng thể đó hoặc cũng có thể dùng để đánh giá sự phỏng đoán hoặc một giả thuyết đã được giả định. Ví dụ: - Một nhà sản xuất kẹo cho rằng trung bình mỗi hộp (0,5kg) có khoảng 82 viên kẹo. Ðể kiểm tra điều này, ngẫu nhiên những hộp kẹo được chọn ra để kiểm tra, đếm và tính toán.
  11. - Một nhà sản xuất nước giải khát muốn kiểm tra giả định về tỉ lệ l ượng tạp chất có trong thành phẩm nhiều nhất là 0,5%. Ngẫu nhiên những chai và lon nước giải khát được chọn ra để kiểm tra một cách cẩn thận về tỉ lệ tạp chất n ày. - Một quản trị Marketing muốn kiểm tra giả định doanh thu của công ty tăng trung b ình ít nhất 5% sau đợt quảng cáo. Ông ta kiểm tra giả định bằng cách liệt k ê doanh thu trước và sau chiến dịch quảng cáo để tính toán. - Một đài phát thanh truyền hình muốn biết những chương trình Tivi có thỏa mãn cho cả quí ông và quí bà hay không. Ðể kiểm tra điều này, ông ta lấy ý kiến của nam và nữ một cách ngẫu nhiên trong khu vực phát hình của mình, xử lý thông tin và cho kết luận. Tùy theo mục đích nghiên cứu có nhiều loại kiểm định khác nhau như: Những kiểm định đơn giản về trung bình tổng thể (µ) phương sai tổng thể ( 2), hoặc tỉ lệ tổng thể (p). Kiểm định sự khác sai về trung bình ( ) phương sai ( 2), hoặc tỉ lệ (p) của hai tổng thể hay nhiều tổng thể. Kiểm định của một tổ hợp của những biến độc lập v à những biến phụ thuộc của các nhân tố ảnh hưởng đến các vấn đề nghi ên cứu. Từ đó dặt các giả thuyết H0 và H1 dưới dạng một phía hay hai phía cho thích hợp. Giả thuyết H0: ký hiệu cho các tham số của tổng thể như trung bình , phương sai , t ỷ lệ . Vậy giả thuyết H0 là tham số của tổng thể thì bằng với giá trị 0 cụ thể nào đó trong trường hợp giả thuyết có giá trị đơn, nghĩa làì H0: = 0 (kiểm định hai phía), hoặc giả thuyết là một dãy của giá trị, lúc đó H0: 0 hay H0: 0 (kiểm định một phía). Đối thuyết H1: Giả thuyết H1 là kết quả ngược lại của giả thuyết H0. Nếu giả thuyết H0 đúng thì giả thuyết H1 sai và ngược lại. := Vậy cặp giả thuyết H0 và H1 được thể hiện trong các trường hợp kiểm định như sau: :≠ - Trong trường hợp kiểm định dạng hai phía (Two -tail test): :≥ :≤ - Trong trường hợp kiểm định dạng một phía (One- tail test): :< :> hoặc b. Mức ý nghĩa và các loại sai lầm Sai lầm loại I. Là sai lầm của việc bác bỏ giả thuyết H0 khi giả thuyết này đúng ở mức ý nghĩa nào đó của kiểm định, nghĩa là nếu quyết định xác suất bác bỏ giả thuyết H0 khi giả thuyết này đúng là thì xác suất để chấp nhận nó là (1- ). Sai lầm loại II. Ngược lại sai lầm loại I là sai lầm loại II là loại sai lầm của việc chấp nhận giả thuyết H0 khi giả thuyết này sai. Nếu xác suất của việc quyết định chấp nhận một giả thuyết H 0 sai được ký hiệu là thì xác suất để bác bỏ giả thuyết này là (1- . Những quyết định dựa trên giả thuyết H0 được tóm tắt như sau:
  12. Ví dụ: Lượng tạp chất có trong thành phẩm ta xét Sai lầm lọai I: - Giả thuyết H0: Lượng tạp chất nhiều nhất là 0,5%. - Thực chất lượng tạp chất nhiều nhất là 0,5%, có nghĩa là giả thuyết H0 đúng. Nhưng qua kiểm định ta lại bác bỏ giả thuyết này, vậy ta đã mắc phải sai lầm lọai I: bác bỏ một giả thuyết đúng. Ðiều này cho ta một kết luận rằng tỉ lệ tạp chất có trong nước giải khát ít nhất là 0,5%, quá tỉ lệ tạp chất cho phép, điều này sẽ gây ảnh hưởng không tốt đến người tiêu dùng. Sai lầm lọai II: - Giả thuyết H0: Lượng tạp chất nhiều nhất là 0,5%. - Thực chất lượng tạp chất có trong nước giải khát ít nhất là 0,5%, có nghĩa là giả thuyết H0 sai. Nhưng qua kiểm định ta lại chấp nhận giả thuyết này, vậy ta đã mắc phải sai lầm lọai II: chấp nhận một giả thuyết sai. Ðiều này cho ta kết luận rằng tỉ lệ tạp chất có trong nước giải khát nhiều nhất là 0,5%. − − c. Giá trị Giá trị là mức ý nghĩa nhỏ nhất mà ở đó giả thuyết H0 bị bác bỏ. Đối với giá trị kiểm định đã được tính trong bài toán kiểm định, ta tra bảng phân phối chuẩn tính được giá trị tương ứng. Đó chính là giá trị của kiểm định. Do vậy giả thuyết bị bác bỏ ở bất kỳ mức ý nghĩa nào lớn hơn (hay bằng) p-value. d. Độ giá trị của kiểm định sai) và (1 − ) là xác suất bác bỏ giả thuyết Khi cố định khả năng mắc sai lầm loại I là (mức ý nghĩa), suy ra khả năng mắc sai lầm loại II là (xác suất không bác bỏ một giả thuyết sai, được gọi là độ giá trị của kiểm định. 2. Kiểm định giả thuyết về trung bình tổng thể
  13. Kiểm định trung bình về tổng thể trong các trường hợp mẫu lớn và mẫu nhỏ, với điều kiện đã biết hoặc chưa biết phương sai tổng thể . Gọ i , , ̅, Giả sử ta có mẫu gồm giá trị quan sát được chọn ngẫu nhiên từ một tổng thể nào đó. lần lượt là trung bình và phương sai của tổng thể và mẫu. ≥ , đã biết hoặc chưa biết phương sai Kiểm định giả thuyết về trung bình của tổng thể được thực hiện như sau: := :≠ 2.1. Trường hợp mẫu lớn ứý Kiểm định hai phía vớ i là giá trị cho trước. = |̅ | /√ > Giá trị kiểm định (nếu trong trường hợp chưa biết thì thay bở i ). / Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu . ( : ≠ ) bị bác bỏ ở mức ý nghĩa khi và chỉ khi khoảng tin cậy (1 − )100% := Nhận xét: Ta nhận thấy sự liên hệ giữa ước lượng và kiểm định giả thuyết: Giả thuyết :≥ :≤ của không chứa trị số . :< :> ứý ứý Kiểm định một phía hoặc vớ i là giá trị cho trước. = |̅ | /√ > Giá trị kiểm định (nếu trong trường hợp chưa biết thì thay bở i ). 2.2. Trường hợp mẫu nhỏ < 30. Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu . Với mẫu nhỏ, ta giả định tổng thể phân phối chuẩn. 2.2.1. Đã biết phương sai tổng thể Trường hợp này vẫn áp dụng phương pháp kiểm định như trong trường hợp mẫu lớn. := :≠ 2.2.2. Chưa biết phương sai tổng thể ứý Kiểm định hai phía vớ i là giá trị cho trước. Giá trị kiểm định = |̅ | /√ ở mức ý nghĩa nếu > ( ), . ( ), / / phân phối Student với bậc tự do ( − 1), mức ý nghĩa /2. Quy tắc quyết định: Bác bỏ trong đó có :≥ :≤ :< :> ứý ứý Kiểm định một phía hoặc vớ i là giá trị cho trước. Giá trị kiểm định = |̅ | /√ .
  14. ở mức ý nghĩa nếu > ( ), ( ), phân phối Student với bậc tự do ( − 1), mức ý nghĩa . Quy tắc quyết định: Bác bỏ trong đó có Nhận xét: trong trường hợp chưa biết phương sai của tổng thể thì kiểm định có phân phối Student. 3. Kiểm định giả thuyết về tỷ lệ tổng thể Gọi , ̂ lần lượt là tỷ lệ các đơn vị có một tính chất nào đó mà ta quan tâm trong tổng thể và Giả sử ta có mẫu ngẫu nhiên các quan sát. Với mẫu lớn ≥ 40, phân phối của tỷ lệ mẫu ̂ được xem như chuẩn và kiểm định giả thuyết về trong mẫu. := được thực hiện như sau: :≠ ứý Kiểm định hai phía vớ i là giá trị cho trước. = | | ( )/ nếu > Giá trị kiểm định . / :≥ :≤ Quy tắc quyết định: Bác bỏ ở mức ý nghĩa . :< :> ứý ý Kiểm định một phía hoặc vớ i là giá trị cho trước. = | | ứ ( )/ ở mức ý nghĩa nếu > . Giá trị kiểm định . Quy tắc quyết định: Bác bỏ 4. Kiểm định giả thuyết về sự khác biệt hai trung bình tổng thể các cặp quan sát ( , ) lấy ngẫu nhiên từ hai tổng thể 4.1. Kiểm định dựa trên sự phối hợp từng cặp ( , ), ( , ), … , ( , ). Giả sử ta có và : , ̅, khác biệt ( − ). Gọ i lần lượt là trung bình của và ; là trung bình và độ lệch tiêu chuẩn của , Giả sử rằng phân phối của các khác biệt giữa và trong tổng thể là chuẩn. : − = Kiểm định giả thuyết về sự khác biệt giữa như sau: : − ≠ ứý Kiểm định hai phía vớ i là giá trị cho trước (khi muốn kiểm định = = 0. Giá trị kiểm định = | | giả thuyết thì ta đặt /√ .
  15. >( ), / ( ), / phân phối Student với bậc tự do ( − 1), mức ý nghĩa /2. Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu trong đó có : − ≥ : − ≤ : − < : − > ứý ý Kiểm định một phía hoặc vớ i là giá trị cho ứ Giá trị kiểm định = | | trước. /√ ở mức ý nghĩa nếu > . ( ), ( ), phân phối Student với bậc tự do ( − 1), mức ý nghĩa . Quy tắc quyết định: Bác bỏ trong đó có 4.2. Kiểm định dựa trên mẫu ngẫu nhiên độc lập 4.2.1. Đã biết phương sai của tổng thể Giả sử có hai tổng thể và có phân phối chuẩn. Hai mẫu được chọn ngẫu nhiên độc lập từ hai , mẫu được chọn ngẫu nhiên có cỡ mẫu tổng thể. Tổng thể thứ nhất có trung bình và phương sai , và phương sai , mẫu được chọn ngẫu nhiên có cỡ mẫu trung bình mẫu . Tổng thể thứ hai có trung bình , : − = trung bình mẫu . (Giá trị và có thể khác nhau về kích thước). : − ≠ ứý Kiểm định hai phía vớ i là giá trị cho trước (khi muốn kiểm định = = 0. = | | giả thuyết thì ta đặt Giá trị kiểm định . > / : − ≥ : − ≤ Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu . : − < : − > ứý ứý Kiểm định một phía hoặc vớ i là giá trị cho = | | trước. Giá trị kiểm định . ở mức ý nghĩa nếu > / . Quy tắc quyết định: Bác bỏ ≥ 30 và ≥ 30. 4.2.2. Chưa biết phương sai của tổng thể Trong trường hợp kích thước mẫu lớn Ta vẫn dùng công thức và quy tắc kiểm định như khi đã biết phương sai tổng thể, với phương sai mẫu và thay cho và , kể cả khi tổng thể không có phân phối chuẩn.
  16. Trong trường hợp mẫu nhỏ (hoặc và hoặc cả hai giá trị này đều nhỏ hơn 30), với giả định hai tổng thể và có phân phối chuẩn. Giá trị kiểm định = | | Ta vẫn dùng và thay cho và . . So sánh với giá trị tra bảng phân phối Student với số bậc tự do được xác định bởi công + thức = ốậ ự + −1 −1 Và với mức ý nghĩa /2 trong trường hợp kiểm định hai phía; mức ý nghĩa trong trường hợp kiểm định một phía. = 4.3. Giả định phương sai tổng thể bằng nhau Giả định hai tổng thể có . Kiểm định giả thuyết áp dụng thuận tiện trong trường hợp mẫu nhỏ. ( − 1) +( − 1) Gọ i là giá trị ước lượng cho phương sai chung của cả hai tổng thể = + −2 : − = : − ≠ ứý Kiểm định hai phía vớ i là giá trị cho trước. Giá trị kiểm định = | | . ở mức ý nghĩa nếu > , / : − ≥ : − ≤ Quy tắc quyết định: Bác bỏ . : − < : − > ứý ứý Kiểm định một phía hoặc vớ i là giá trị cho Giá trị kiểm định = | | trước. . nếu > , Quy tắc quyết định: Bác bỏ ở mức ý nghĩa . , 5. Kiểm định giả thuyết về sự bằng nhau giữa hai tỷ lệ tổng thể Giả sử ta có hai mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể và .
  17. Gọi , và ̂ , ̂ lần lượt tỷ lệ cấc đơn vị có tính chất nào đó mà ta quan tâm trong tổng thể Với mẫu lớn , ≥ 40 kiểm định giả thuyết về sự bằng nhau giữa hai tỷ lệ tổng thể = và trong mẫu. : − =0 thực hiện như sau: : − ≠0 ứý Kiểm định hai phía = trong đó ̂ là giá trị ước lượng cho tỷ lệ chung | | ( ) Giá trị kiểm định , trong đó ̂ = ở mức ý nghĩa nếu > / . . : − ≤0 : − ≥0 Quy tắc quyết định: Bác bỏ : − > 0 hoặc : − . Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu .
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2