(Business Statistics)
Chương 6. Kiểm định giả thuyết thống kê
1
CHƯƠNG VI. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
VI.1. Bài toán kiểm định
VI.2. Kiểm định giả thuyết về
trung bình của tổng thể
VI.3. Kiểm định giả thuyết về tỷ lệ
2
VI.1. BÀI TOÁN KIỂM ĐỊNH
Các đặc trưng của mẫu ngoài việc sử dụng để ước lượng các đặc trưng của tổng thể còn được dùng để đánh giá xem một giả thuyết nào đó của tổng thể là đúng hay sai. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết được gọi là kiểm định giả thuyết.
Ví dụ 6.1. Một nhà sản xuất cho rằng khối
lượng trung bình của một gói mì là 75 gam. Để kiểm tra điều này đúng hay sai, chọn ngẫu nhiên một số gói mì để kiểm tra và tính toán.
Ví dụ 6.2. Một xí nghiệp cho rằng tỉ lệ phế phẩm trong kho hàng là 5%. Để kiểm tra điều này đúng hay sai, chọn ngẫu nhiên một số sản phẩm để kiểm tra.
3
1. Khái niệm
2. Giả thuyết H0 và giả thuyết H1 Giả sử tổng thể có đặc trưng θ chưa biết. Với giá trị cụ thể θ0 cho trước nào đó, ta cần kiểm định H0: θ = θ0 giả thuyết
Giả thuyết H1 là kết quả ngược lại của giả thuyết H0. Nếu H1 đúng thì H0 sai và ngược lại. H1 còn được gọi là giả thuyết đối (đối thuyết). Vậy cặp giả thuyết H0 và H1 được thể hiện trong
trường hợp kiểm định sau đây
Ví dụ 6.3. Ở Ví dụ 6.1 ta có thể đặt giả thuyết:
4
H0: θ = θ0; H1: θ ≠ θ0
H0: θ = 75; H1: θ ≠ 75
Vì chỉ dựa trên một mẫu để kết luận các giá trị của tổng thể nên ta có thể phạm sai lầm khi đưa ra kết luận về giả thuyết H0. Các sai lầm đó là: a) Sai lầm loại một: Giả thuyết H0 đúng nhưng ta bác bỏ nó. b) Sai lầm loại hai: Giả thuyết H0 sai nhưng ta chấp nhận nó.
Khi kiểm định, người ta mong muốn khả năng mắc sai lầm loại một không vượt quá một số α cho trước, nghĩa là xác suất bác bỏ H0 khi nó đúng là α thì xác suất chấp nhận nó là 1–α. Ta gọi α là mức ý nghĩa của kiểm định.
Trong một bài toán kiểm định, nếu khả năng phạm sai lầm loại một giảm thì khả năng phạm sai lầm loại hai lại tăng lên. Do đó người ta thường chọn α trong khoảng từ 1% đến 10%.
5
3. Sai lầm loại một, sai lầm loại hai
Giả sử khi kiểm định một giả thuyết H0 nào đó, ta đã
kết luận bác bỏ nó ở mức ý nghĩa 10%.
Khi đó ta cũng có thể bác bỏ ở mức ý nghĩa cao hơn, chẳng hạn, 12%, 15%. Vấn đề đặt ra là liệu có thể bác bỏ ở mức ý nghĩa nhỏ hơn 10%? Nói cách khác, ta cần xác định mức ý nghĩa nhỏ nhất mà ở đó giả thuyết H0 bị bác bỏ.
Mức ý nghĩa nhỏ nhất đó gọi là giá trị p. Giá trị p được xem như một “mức ý nghĩa tiêu chuẩn/chính xác”, gắn liền với từng trường hợp cụ thể. Do vậy, thay vì định trước mức ý nghĩa α, người ta thường xác định giá trị p. (Khi việc tính toán được thực hiện bằng các chương trình xử lí dữ liệu thì kết quả tính được bằng máy tính luôn thể hiện giá trị p).
6
4. Giá trị p (p-value)
VI.1. BÀI TOÁN KIỂM ĐỊNH
Ví dụ 6.4. Một hãng sản xuất lốp xe ô tô tuyên bố sản phẩm của hãng có thể sử dụng 100.000 km, độ lệch tiêu chuẩn bằng 12.000 km. Một công ty vận tải mua 64 lốp xe, sau một thời gian sử dụng thấy độ bền trung bình là 98.500 km.
a) Hãy phát biểu giả thuyết H0, H1?
b) Sai lầm loại I trong bài toán này là gì? Hãy nêu một hậu quả có thể của sai lầm này?
c) Sai lầm loại II trong bài toán này là gì? Hãy nêu một hậu quả có thể của sai lầm này?
7
5. Các bước cần thực hiện trong bài toán kiểm
Một bài toán kiểm định giả thuyết bao gồm 5 bước sau đây:
Bước 1. Thiết lập giả thuyết H0 và H1. Bước 2. Tính giá trị kiểm định. (Mỗi
loại kiểm định có
công thức riêng nhằm đánh giá giả thuyết.)
Bước 3. Chọn mức ý nghĩa α và xác định miền bác bỏ giả thuyết (nếu giá trị kiểm định nằm trong miền này thì H0 bị bác bỏ).
Bước 4. Đưa ra kết luận về mặt thống kê, nghĩa là ở một mức ý nghĩa α nào đó ta sẽ bác bỏ hay chấp nhận giả thuyết H0.
8
Bước 5. Kết luận cuối cùng về nội dung bài toán nhằm trả lời một cách rõ ràng câu hỏi mà bài toán đặt ra (không dùng thuật ngữ thống kê).
định giả thuyết
VI.2. KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH CỦA TỔNG THỂ
Giả sử ta có một mẫu gồm n quan sát được chọn từ tổng thể. Gọi lần lượt là trung trung bình, bình, phương sai của tổng thể; phương sai mẫu hiệu chỉnh. Ta cần kiểm định giả thuyết:
1. Bài toán kiểm định trung bình trên một mẫu
là một giá trị cụ thể với mức ý nghĩa α cho trước.
9
Khi đó việc kiểm định được thực hiện như sau:
1. Bài toán kiểm định trung bình trên một mẫu
Giá trị kiểm định được tính bởi công thức:
Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa
a) Trường hợp đã biết phương sai của tổng thể
10
nếu:
(ngược lại ta “chấp nhận” H0 ở mức ý nghĩa ) Ta nhận thấy có mối quan hệ giữa ước lượng và kiểm định giả thuyết, cụ thể, giả thuyết H0 bị khi và chỉ khi khoảng bác bỏ với mức ý nghĩa ) của μ không ước lượng (với độ tin cậy chứa số μ0.
a) Trường hợp đã biết phương sai của tổng thể
Giải. Tổng thể là toàn bộ số gói mì do máy đó đóng gói. Theo quy định thì khối lượng trung bình của mỗi gói phải là 75 gam, nhưng trên thực tế thì khối lượng trung bình là μ chưa biết. Ta có giả thuyết:
(đúng như quy định). Nếu giả thuyết đúng thì tình hình sản xuất bình thường. Nếu giả thuyết sai thì tình hình sản xuất không bình thường. Ta cần kiểm định giả thuyết đó ở mức ý nghĩa 5%. 11
Ví dụ 6.5. Một máy đóng mì gói tự động quy định khối lượng trung bình là 75 gam, độ lệch tiêu chuẩn là 15 gam. Sau một thời gian sản xuất, kiểm tra 80 gói ta có khối lượng trung bình mỗi gói là 72 gam. Hãy kết luận về tình hình sản xuất với mức ý nghĩa 5%. Tìm giá trị p (p-value).
và phương sai của tổng thể
đã biết, do đó giá trị kiểm định:
Từ mức ý nghĩa
, tra bảng hàm số Laplace, ta có
Vì
nên giả thuyết H0 đúng. Vậy tình hình
𝜶 𝟐
sản xuất vẫn bình thường ở mức ý nghĩa 5%.
Bây giờ ta thấy giả thuyết H0 sẽ bị bác bỏ ở bất kì giá trị nào của α sao cho Zα/2 < 1,79. Tra bảng hàm số Laplace:
12
Suy ra giả thuyết H0 sẽ bị bác bỏ ở bất kì mức ý nghĩa nào lớn hơn 7,346%. Nói cách khác, mức ý nghĩa nhỏ nhất mà giả thuyết H0 bị bác bỏ là 7,346%. Vậy p = 0,07346.
a) Trường hợp đã biết phương sai của tổng thể Theo đề bài ta có
1. Bài toán kiểm định trung bình trên một mẫu
Ví dụ 6.6. Một hãng sản xuất lốp xe ô tô tuyên bố sản phẩm của hãng có thể sử dụng 100.000 km, độ lệch tiêu chuẩn bằng 12.000 km. Một công ty vận tải mua 64 lốp xe, sau một thời gian sử dụng thấy độ bền trung bình là 98.500 km.
Hãy kết luận về tuyên bố của hãng sản xuất lốp
a) Trường hợp đã biết phương sai của tổng thể
13
xe với mức ý nghĩa 5%.
1. Bài toán kiểm định trung bình trên một mẫu
- Với mẫu có kích thước n ≥ 30 thì
và quy tắc quyết định
như trường hợp đã biết phương sai của tổng thể.
- Với mẫu có kích thước n < 30 và tổng thể có phân phối
chuẩn thì giá trị kiểm định:
Quy tắc quyết định:
Bác bỏ H0 ở mức ý nghĩa α
nếu
trong đó có phân phối Student.
Chú ý. Trong tất cả các trường hợp, khi giả thuyết
đã bị bác bỏ (tức là
) thì:
14
Với
ta kết luận μ > μ0; với
thì μ < μ0.
b) Trường hợp chưa biết phương sai của tổng thể
b) Trường hợp chưa biết phương sai của tổng thể
1. Bài toán kiểm định trung bình trên một mẫu
Ví dụ 6.7. Một nhà máy sản xuất đèn chụp hình
cho biết tuổi thọ trung bình của sản phẩm là 100
giờ. Người ta chọn ngẫu nhiên 15 bóng thử
nghiệm thấy tuổi thọ trung bình là 99,7 giờ,
phương sai mẫu hiệu chỉnh là 0,15.
Giả sử tuổi thọ của đèn có phân phối chuẩn. Cho
kết luận về tình hình sản xuất của nhà máy với
15
mức ý nghĩa 1%.
b) Trường hợp chưa biết phương sai của tổng thể
1. Bài toán kiểm định trung bình trên một mẫu
Đặt giả thuyết:
Ta có:
Tra bảng Student dòng 14, cột 0,005:
Suy ra
Vì
nên ta bác bỏ H0.
Vậy tuổi thọ bóng đèn của nhà thấp hơn 100 giờ, do:
16
Ví dụ 6.7. Giải:
2. Kiểm định trung bình của tổng thể trên hai mẫu
Mẫu phối hợp từng cặp (không độc lập, xem tài liệu).
Giả sử ta có hai mẫu được chọn ngẫu nhiên, độc lập từ hai tổng thể có phân phối chuẩn là X và Y. Gọi nx, ny là kích thước của hai mẫu tương ứng và
lần lượt là trung bình của tổng thể, phương sai của tổng thể, trung bình mẫu, phương sai mẫu hiệu chỉnh tương ứng với hai mẫu đó.
Ta cần kiểm định giả thuyết:
với mức ý nghĩa α.
17
LƯU Ý: Phần kiểm định trung bình của tổng thể trên hai mẫu là phần đọc thêm trong học kỳ này.
2. Kiểm định trung bình của tổng thể trên hai mẫu
a) Trường hợp đã biết phương sai của hai tổng thể thì
giá trị kiểm định:
b) Trường hợp chưa biết phương sai của hai tổng thể
mà
thì
thay phương sai của tổng thể bởi
phương sai mẫu hiệu chỉnh trong công thức trên, nghĩa là:
18
2. Kiểm định trung bình của tổng thể trên hai mẫu
Trường hợp a) và b) nguyên tắc bác bỏ như sau:
Trong trường hợp giả thuyết
bị bác bỏ,
Giả thuyết Bác bỏ H0 khi
* Nếu thì ta kết luận ;
19
* Nếu thì ta kết luận .
2. Kiểm định trung bình của tổng thể trên hai mẫu
b) Trường hợp chưa biết phương sai của hai tổng thể
20
Ví dụ 6.8. Một trại chăn nuôi chọn một giống gà để tiến hành nghiên cứu hiệu quả của hai loại thức ăn A và B. Sau một thời gian nuôi thử nghiệm người ta chọn 50 con gà nuôi bằng thức ăn A thì thấy khối lượng trung bình là 2,2 kg, độ lệch mẫu hiệu chỉnh là 1,25 kg. Chọn 40 con gà nuôi bằng thức ăn B thì thấy khối lượng trung bình 1,2 kg, độ lệch mẫu hiệu chỉnh 1,02 kg. Hãy đánh giá hiệu quả của hai loại thức ăn đó với mức ý nghĩa 1%.
2. Kiểm định trung bình của tổng thể trên hai mẫu
b) Trường hợp chưa biết phương sai của hai tổng thể
Ví dụ 6.8. Giải:
lượng trung bình của
Ta đặt giả thuyết:
Nếu giả thuyết H0 đúng thì hiệu quả của hai loại thức ăn như nhau. Nếu giả thuyết H0 sai thì có sự khác biệt. Ta kiểm định giả thuyết ở mức ý nghĩa 1%.
21
Gọi μA, μB lần lượt là khối một con gà nuôi bằng thức ăn A, B.
Ví dụ 6.8. Giải: (tiếp theo)
Ta có:
Giá trị kiểm định:
nên ta bác bỏ giả thuyết H0, nghĩa là
Vì hiệu quả của hai loại thức ăn khác nhau.
nên
22
nghĩa là khối Mặt khác ta thấy lượng trung bình của một con gà nuôi bằng thức ăn A lớn hơn so với nuôi bằng thức ăn B. Vậy thức ăn A có hiệu quả hơn (ở mức ý nghĩa 1%).
2. Kiểm định trung bình của tổng thể trên hai mẫu
Ví dụ 6.9. Nghiên cứu về hai nhãn hiệu pin X và
Y. Chọn ngẫu nhiên mỗi loại 100 pin, kết quả
ghi nhận được như sau. Pin X có thời gian sử
dụng trung bình là 308 phút, độ lệch mẫu hiệu
chỉnh là 54 phút. Đối vối pin Y các chỉ số tương
ứng là 286 và 40 phút.
Có ý kiến cho rằng thời gian sử dụng trung
bình của pin X lớn hơn pin Y. Với mức ý nghĩa
23
= 0,01 bạn có nhận xét gì về ý kiến trên?
2. Kiểm định trung bình của tổng thể trên hai mẫu
c) Trường hợp chưa biết phương sai của tổng thể mà
hoặc
thì giá trị kiểm định:
trong đó
Quy tắc bác bỏ như sau:
24
Giả thuyết Bác bỏ H0 khi
2. Kiểm định trung bình của tổng thể trên hai mẫu
c) Trường hợp chưa biết phương sai của tổng thể mà
hoặc
Ví dụ 6.10. Ban lãnh đạo của một công ty cho rằng
doanh số bán hàng tăng lên sau khi thực hiện các
biện pháp khuyến mãi. Chọn ngẫu nhiên 13 tuần trước
đợt khuyến mãi và 14 tuần sau đợt khuyến mãi. Doanh
số trung bình và độ lệch mẫu hiệu chỉnh trước đợt
khuyến mãi là 1234 và 324 triệu đồng. Còn sau đợt
khuyến mãi, các con số này lần lượt là 1864 và 289
triệu đồng. Hãy kiểm định ý kiến trên với = 0,05.
25
2. Kiểm định trung bình của tổng thể trên hai mẫu
c) Trường hợp chưa biết phương sai của tổng thể mà
hoặc
lần lượt là doanh số trung
Ví dụ 6.10. Giải: Gọi
bình sau và trước khi thực hiện các biện pháp khuyến
mãi. Ta đặt giả thuyết:
Nếu giả thuyết H0 đúng thì đợt khuyến mãi không làm
tăng doanh thu. Nếu giả thuyết H0 sai thì CT khuyến mãi
có tác động. Ta kiểm định giả thuyết ở mức ý nghĩa 5%.
26
Ta có:
Do đó giá trị kiểm định:
Vì
nên ta bác bỏ giả thuyết H0.
Mặt khác,
: vậy doanh số trung bình sau khi áp dụng các biện pháp khuyến mãi đã tăng lên (ở mức ý nghĩa = 0,05).
27
Ví dụ 6.10. Giải (tiếp theo): Đề bài:
2. Kiểm định trung bình của tổng thể trên hai mẫu
c) Trường hợp chưa biết phương sai của tổng thể mà
hoặc
(Bài tập SV tự giải)
Ví dụ 6.11. Cho hai tổng thể có phân phối chuẩn.
Mẫu ngẫu nhiên 15 đơn vị chọn từ tổng thể thứ
nhất có giá trị trung bình là 100, độ lệch mẫu hiệu
chỉnh là 5. Mẫu ngẫu nhiên 10 đơn vị chọn từ tổng
thể thứ hai có các kết quả tương ứng là 110 và 3.
Với = 5%, hãy kiểm định giả thuyết cho rằng
trung bình của hai tổng thể này bằng nhau.
28
CỦNG CỐ
Như vậy, khi thực hiện bài toán kiểm
định trung bình, ta cần xác định:
1. Bài toán kiểm định trên một mẫu hay
hai mẫu?
2. Bài toán kiểm định thuộc trường
29
hợp nào?
V.3. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ
1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Giả sử tổng thể có hai loại phần tử, một trong hai
loại có tính chất A nào đó. Tỉ lệ phần tử có tính
chất A là P chưa biết. Giả sử ta có mẫu với kích
thước n ≥ 30. Gọi
là tỉ lệ phần tử của mẫu có tính
chất A. Kiểm định giả thuyết về P với mức ý nghĩa α
cho trước được thực hiện như sau.
Đặt giả thuyết:
(p0 là 1 giá trị cho trước)
30
1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Tính giá trị kiểm định:
Quy tắc bác bỏ: được tóm tắt trong bảng sau
Lưu ý. Trong trường hợp bác bỏ giả thuyết
Giả thuyết Bác bỏ H0 khi
, nghĩa là đã có thì:
Với ta kết luận
31
Với ta kết luận .
1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Ví dụ 6.12. Theo báo cáo, tỉ lệ hàng phế phẩm
V.3. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ
trong kho là 10%. Kiểm tra ngẫu nhiên 100 sản
phẩm thấy có 8 phế phẩm.
Hỏi báo cáo trên có đáng tin cậy ở mức ý nghĩa
32
5% không?
lệ phế phẩm trong kho
1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
với = 5%.
Ta có kích thước mẫu n = 100, tỉ lệ mẫu
= 0,08.
Tra bảng hàm số Laplace ta thấy:
Tính giá trị kiểm định, ta được:
𝟎
Ví dụ 6.12. Giải: Gọi P là tỉ hàng, P chưa biết. Ta kiểm tra giả thuyết:
𝟎
𝟎
Vì
nên ta chấp nhận H0, tức báo cáo đáng tin.
33
= -0,6667
1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu
Ví dụ 6.13. Trước đây tỉ lệ phế phẩm của một nhà máy là 5%. Năm nay người ta áp dụng một biện pháp kĩ thuật mới để sản xuất. Sau một thời gian, kiểm tra 800 sản phẩm thì thấy có 24 phế phẩm. Với mức ý nghĩa 1%, hãy đánh giá hiệu quả của biện pháp kĩ thuật đó.
34
Ví dụ 6.14. Giả sử sản phẩm của một công ty sản xuất lốp xe ôtô đã chiếm được 42% thị trường. Trước sự cạnh tranh của các đối thủ và điều kiện thay đổi môi trường kinh doanh, ban lãnh đạo công ty nghi ngờ thị trường của công ty đang bị giảm sút. Kiểm tra ngẫu nhiên 550 ô tô trên đường, kết quả cho thấy có 219 xe sử dụng lốp của công ty. Có thể kết luận gì về điều nghi ngờ trên với mức ý nghĩa 10%?
Giả sử ta có 2 mẫu được chọn ngẫu nhiên, độc lập từ là kích thước hai mẫu
hai tổng thể X và Y. Gọi
.
tương ứng là tỉ lệ phần tử có tính chất A của hai tổng thể và mẫu tương ứng. Ta cần kiểm định giả thuyết:
với mức ý nghĩa α cho trước.
Công thức tính giá trị kiểm định:
là tỉ lệ chung cho cả hai mẫu, được tính bởi
trong đó công thức:
35
2. Kiểm định tỉ lệ tổng thể trên hai mẫu
Quy tắc kiểm định như trường hợp một mẫu.
2. Kiểm định tỉ lệ tổng thể trên hai mẫu
Chú ý. Trong trường hợp bác bỏ
Giả thuyết Bác bỏ H0 khi
, nghĩa
Nếu
là đã có thì:
Nếu
ta kết luận
36
ta kết luận .
2. Kiểm định tỉ lệ tổng thể trên hai mẫu
Ví dụ 6.15. Chọn ngẫu nhiên 200 em bé sống ở
thành phố thì thấy có 20 em béo phì. Chọn 220
Hãy kiểm định giả thuyết cho rằng tỉ lệ trẻ em
em sống ở nông thôn thấy có 5 em béo phì.
béo phì ở thành phố và nông thôn là như nhau
37
với mức ý nghĩa 5%.
Ví dụ 6.15. Giải: Gọi Px, Py lần lượt là tỉ lệ trẻ em béo phì ở
thành phố và nông thôn. Ta đặt giả thuyết:
Ta kiểm định giả thuyết ở mức ý nghĩa 5%.
Theo đề bài:
𝒚
𝒚
𝒙
𝒙
𝟎
𝜶 𝟐
𝒙
𝒚
Giá trị kiểm định:
𝟎
𝟎
𝒙
𝒚
Vì
nên ta bác bỏ H0. Mặt khác,
Nghĩa là tỉ lệ béo phì của trẻ em thành phố cao hơn trẻ em 38
nông thôn.
2. Kiểm định tỉ lệ tổng thể trên hai mẫu
CỦNG CỐ KIẾN THỨC CHƯƠNG 6
BÀI TOÁN KIỂM ĐỊNH:
Các bước của bài toán kiểm định.
KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH
1. Trên một mẫu: có 3 trường hợp.
2. Trên hai mẫu: có 3 trường hợp (đọc thêm)
KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ:
1. Trên một mẫu: có 1 trường hợp.
2. Trên hai mẫu: có 1 trường hợp (đọc thêm)
39
CỦA TỔNG THỂ: