(Business Statistics)

Chương 6. Kiểm định giả thuyết thống kê

1

CHƯƠNG VI. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

VI.1. Bài toán kiểm định

VI.2. Kiểm định giả thuyết về

trung bình của tổng thể

VI.3. Kiểm định giả thuyết về tỷ lệ

2

VI.1. BÀI TOÁN KIỂM ĐỊNH

 Các đặc trưng của mẫu ngoài việc sử dụng để ước lượng các đặc trưng của tổng thể còn được dùng để đánh giá xem một giả thuyết nào đó của tổng thể là đúng hay sai. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết được gọi là kiểm định giả thuyết.

 Ví dụ 6.1. Một nhà sản xuất cho rằng khối

lượng trung bình của một gói mì là 75 gam. Để kiểm tra điều này đúng hay sai, chọn ngẫu nhiên một số gói mì để kiểm tra và tính toán.

 Ví dụ 6.2. Một xí nghiệp cho rằng tỉ lệ phế phẩm trong kho hàng là 5%. Để kiểm tra điều này đúng hay sai, chọn ngẫu nhiên một số sản phẩm để kiểm tra.

3

1. Khái niệm

2. Giả thuyết H0 và giả thuyết H1  Giả sử tổng thể có đặc trưng θ chưa biết. Với giá trị cụ thể θ0 cho trước nào đó, ta cần kiểm định H0: θ = θ0 giả thuyết

 Giả thuyết H1 là kết quả ngược lại của giả thuyết H0. Nếu H1 đúng thì H0 sai và ngược lại. H1 còn được gọi là giả thuyết đối (đối thuyết).  Vậy cặp giả thuyết H0 và H1 được thể hiện trong

trường hợp kiểm định sau đây

 Ví dụ 6.3. Ở Ví dụ 6.1 ta có thể đặt giả thuyết:

4

H0: θ = θ0; H1: θ ≠ θ0

H0: θ = 75; H1: θ ≠ 75

 Vì chỉ dựa trên một mẫu để kết luận các giá trị của tổng thể nên ta có thể phạm sai lầm khi đưa ra kết luận về giả thuyết H0. Các sai lầm đó là: a) Sai lầm loại một: Giả thuyết H0 đúng nhưng ta bác bỏ nó. b) Sai lầm loại hai: Giả thuyết H0 sai nhưng ta chấp nhận nó.

 Khi kiểm định, người ta mong muốn khả năng mắc sai lầm loại một không vượt quá một số α cho trước, nghĩa là xác suất bác bỏ H0 khi nó đúng là α thì xác suất chấp nhận nó là 1–α. Ta gọi α là mức ý nghĩa của kiểm định.

 Trong một bài toán kiểm định, nếu khả năng phạm sai lầm loại một giảm thì khả năng phạm sai lầm loại hai lại tăng lên. Do đó người ta thường chọn α trong khoảng từ 1% đến 10%.

5

3. Sai lầm loại một, sai lầm loại hai

 Giả sử khi kiểm định một giả thuyết H0 nào đó, ta đã

kết luận bác bỏ nó ở mức ý nghĩa 10%.

 Khi đó ta cũng có thể bác bỏ ở mức ý nghĩa cao hơn, chẳng hạn, 12%, 15%. Vấn đề đặt ra là liệu có thể bác bỏ ở mức ý nghĩa nhỏ hơn 10%? Nói cách khác, ta cần xác định mức ý nghĩa nhỏ nhất mà ở đó giả thuyết H0 bị bác bỏ.

 Mức ý nghĩa nhỏ nhất đó gọi là giá trị p. Giá trị p được xem như một “mức ý nghĩa tiêu chuẩn/chính xác”, gắn liền với từng trường hợp cụ thể. Do vậy, thay vì định trước mức ý nghĩa α, người ta thường xác định giá trị p. (Khi việc tính toán được thực hiện bằng các chương trình xử lí dữ liệu thì kết quả tính được bằng máy tính luôn thể hiện giá trị p).

6

4. Giá trị p (p-value)

VI.1. BÀI TOÁN KIỂM ĐỊNH

 Ví dụ 6.4. Một hãng sản xuất lốp xe ô tô tuyên bố sản phẩm của hãng có thể sử dụng 100.000 km, độ lệch tiêu chuẩn bằng 12.000 km. Một công ty vận tải mua 64 lốp xe, sau một thời gian sử dụng thấy độ bền trung bình là 98.500 km.

a) Hãy phát biểu giả thuyết H0, H1?

b) Sai lầm loại I trong bài toán này là gì? Hãy nêu một hậu quả có thể của sai lầm này?

c) Sai lầm loại II trong bài toán này là gì? Hãy nêu một hậu quả có thể của sai lầm này?

7

5. Các bước cần thực hiện trong bài toán kiểm

Một bài toán kiểm định giả thuyết bao gồm 5 bước sau đây:

 Bước 1. Thiết lập giả thuyết H0 và H1.  Bước 2. Tính giá trị kiểm định. (Mỗi

loại kiểm định có

công thức riêng nhằm đánh giá giả thuyết.)

 Bước 3. Chọn mức ý nghĩa α và xác định miền bác bỏ giả thuyết (nếu giá trị kiểm định nằm trong miền này thì H0 bị bác bỏ).

 Bước 4. Đưa ra kết luận về mặt thống kê, nghĩa là ở một mức ý nghĩa α nào đó ta sẽ bác bỏ hay chấp nhận giả thuyết H0.

8

 Bước 5. Kết luận cuối cùng về nội dung bài toán nhằm trả lời một cách rõ ràng câu hỏi mà bài toán đặt ra (không dùng thuật ngữ thống kê).

định giả thuyết

VI.2. KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH CỦA TỔNG THỂ

 Giả sử ta có một mẫu gồm n quan sát được chọn từ tổng thể. Gọi lần lượt là trung trung bình, bình, phương sai của tổng thể; phương sai mẫu hiệu chỉnh. Ta cần kiểm định giả thuyết:

1. Bài toán kiểm định trung bình trên một mẫu

là một giá trị cụ thể với mức ý nghĩa α cho trước.

9

Khi đó việc kiểm định được thực hiện như sau:

1. Bài toán kiểm định trung bình trên một mẫu

 Giá trị kiểm định được tính bởi công thức:

 Quy tắc quyết định: Bác bỏ H0 ở mức ý nghĩa

a) Trường hợp đã biết phương sai của tổng thể

10

nếu:

(ngược lại ta “chấp nhận” H0 ở mức ý nghĩa )  Ta nhận thấy có mối quan hệ giữa ước lượng và kiểm định giả thuyết, cụ thể, giả thuyết H0 bị khi và chỉ khi khoảng bác bỏ với mức ý nghĩa ) của μ không ước lượng (với độ tin cậy chứa số μ0.

a) Trường hợp đã biết phương sai của tổng thể

Giải. Tổng thể là toàn bộ số gói mì do máy đó đóng gói. Theo quy định thì khối lượng trung bình của mỗi gói phải là 75 gam, nhưng trên thực tế thì khối lượng trung bình là μ chưa biết. Ta có giả thuyết:

(đúng như quy định). Nếu giả thuyết đúng thì tình hình sản xuất bình thường. Nếu giả thuyết sai thì tình hình sản xuất không bình thường. Ta cần kiểm định giả thuyết đó ở mức ý nghĩa 5%. 11

Ví dụ 6.5. Một máy đóng mì gói tự động quy định khối lượng trung bình là 75 gam, độ lệch tiêu chuẩn là 15 gam. Sau một thời gian sản xuất, kiểm tra 80 gói ta có khối lượng trung bình mỗi gói là 72 gam. Hãy kết luận về tình hình sản xuất với mức ý nghĩa 5%. Tìm giá trị p (p-value).

và phương sai của tổng thể

đã biết, do đó giá trị kiểm định:

 Từ mức ý nghĩa

, tra bảng hàm số Laplace, ta có

 Vì

nên giả thuyết H0 đúng. Vậy tình hình

𝜶 𝟐

sản xuất vẫn bình thường ở mức ý nghĩa 5%.

 Bây giờ ta thấy giả thuyết H0 sẽ bị bác bỏ ở bất kì giá trị nào của α sao cho Zα/2 < 1,79. Tra bảng hàm số Laplace:

12

 Suy ra giả thuyết H0 sẽ bị bác bỏ ở bất kì mức ý nghĩa nào lớn hơn 7,346%. Nói cách khác, mức ý nghĩa nhỏ nhất mà giả thuyết H0 bị bác bỏ là 7,346%. Vậy p = 0,07346.

a) Trường hợp đã biết phương sai của tổng thể  Theo đề bài ta có

1. Bài toán kiểm định trung bình trên một mẫu

 Ví dụ 6.6. Một hãng sản xuất lốp xe ô tô tuyên bố sản phẩm của hãng có thể sử dụng 100.000 km, độ lệch tiêu chuẩn bằng 12.000 km. Một công ty vận tải mua 64 lốp xe, sau một thời gian sử dụng thấy độ bền trung bình là 98.500 km.

 Hãy kết luận về tuyên bố của hãng sản xuất lốp

a) Trường hợp đã biết phương sai của tổng thể

13

xe với mức ý nghĩa 5%.

1. Bài toán kiểm định trung bình trên một mẫu

- Với mẫu có kích thước n ≥ 30 thì

và quy tắc quyết định

như trường hợp đã biết phương sai của tổng thể.

- Với mẫu có kích thước n < 30 và tổng thể có phân phối

chuẩn thì giá trị kiểm định:

 Quy tắc quyết định:

Bác bỏ H0 ở mức ý nghĩa α

nếu

trong đó có phân phối Student.

Chú ý. Trong tất cả các trường hợp, khi giả thuyết

đã bị bác bỏ (tức là

) thì:

14

Với

ta kết luận μ > μ0; với

thì μ < μ0.

b) Trường hợp chưa biết phương sai của tổng thể

b) Trường hợp chưa biết phương sai của tổng thể

1. Bài toán kiểm định trung bình trên một mẫu

Ví dụ 6.7. Một nhà máy sản xuất đèn chụp hình

cho biết tuổi thọ trung bình của sản phẩm là 100

giờ. Người ta chọn ngẫu nhiên 15 bóng thử

nghiệm thấy tuổi thọ trung bình là 99,7 giờ,

phương sai mẫu hiệu chỉnh là 0,15.

Giả sử tuổi thọ của đèn có phân phối chuẩn. Cho

kết luận về tình hình sản xuất của nhà máy với

15

mức ý nghĩa 1%.

b) Trường hợp chưa biết phương sai của tổng thể

1. Bài toán kiểm định trung bình trên một mẫu

Đặt giả thuyết:

Ta có:

Tra bảng Student dòng 14, cột 0,005:

Suy ra

nên ta bác bỏ H0.

Vậy tuổi thọ bóng đèn của nhà thấp hơn 100 giờ, do:

16

Ví dụ 6.7. Giải:

2. Kiểm định trung bình của tổng thể trên hai mẫu

 Mẫu phối hợp từng cặp (không độc lập, xem tài liệu).

 Giả sử ta có hai mẫu được chọn ngẫu nhiên, độc lập từ hai tổng thể có phân phối chuẩn là X và Y. Gọi nx, ny là kích thước của hai mẫu tương ứng và

lần lượt là trung bình của tổng thể, phương sai của tổng thể, trung bình mẫu, phương sai mẫu hiệu chỉnh tương ứng với hai mẫu đó.

 Ta cần kiểm định giả thuyết:

với mức ý nghĩa α.

17

LƯU Ý: Phần kiểm định trung bình của tổng thể trên hai mẫu là phần đọc thêm trong học kỳ này.

2. Kiểm định trung bình của tổng thể trên hai mẫu

 a) Trường hợp đã biết phương sai của hai tổng thể thì

giá trị kiểm định:

 b) Trường hợp chưa biết phương sai của hai tổng thể

thì

thay phương sai của tổng thể bởi

phương sai mẫu hiệu chỉnh trong công thức trên, nghĩa là:

18

2. Kiểm định trung bình của tổng thể trên hai mẫu

 Trường hợp a) và b) nguyên tắc bác bỏ như sau:

 Trong trường hợp giả thuyết

bị bác bỏ,

Giả thuyết Bác bỏ H0 khi

* Nếu thì ta kết luận ;

19

* Nếu thì ta kết luận .

2. Kiểm định trung bình của tổng thể trên hai mẫu

b) Trường hợp chưa biết phương sai của hai tổng thể

20

Ví dụ 6.8. Một trại chăn nuôi chọn một giống gà để tiến hành nghiên cứu hiệu quả của hai loại thức ăn A và B. Sau một thời gian nuôi thử nghiệm người ta chọn 50 con gà nuôi bằng thức ăn A thì thấy khối lượng trung bình là 2,2 kg, độ lệch mẫu hiệu chỉnh là 1,25 kg. Chọn 40 con gà nuôi bằng thức ăn B thì thấy khối lượng trung bình 1,2 kg, độ lệch mẫu hiệu chỉnh 1,02 kg. Hãy đánh giá hiệu quả của hai loại thức ăn đó với mức ý nghĩa 1%.

2. Kiểm định trung bình của tổng thể trên hai mẫu

b) Trường hợp chưa biết phương sai của hai tổng thể

Ví dụ 6.8. Giải:

lượng trung bình của

 Ta đặt giả thuyết:

 Nếu giả thuyết H0 đúng thì hiệu quả của hai loại thức ăn như nhau. Nếu giả thuyết H0 sai thì có sự khác biệt. Ta kiểm định giả thuyết ở mức ý nghĩa 1%.

21

Gọi μA, μB lần lượt là khối một con gà nuôi bằng thức ăn A, B.

Ví dụ 6.8. Giải: (tiếp theo)

Ta có:

Giá trị kiểm định:

nên ta bác bỏ giả thuyết H0, nghĩa là

Vì hiệu quả của hai loại thức ăn khác nhau.

nên

22

nghĩa là khối Mặt khác ta thấy lượng trung bình của một con gà nuôi bằng thức ăn A lớn hơn so với nuôi bằng thức ăn B. Vậy thức ăn A có hiệu quả hơn (ở mức ý nghĩa 1%).

2. Kiểm định trung bình của tổng thể trên hai mẫu

 Ví dụ 6.9. Nghiên cứu về hai nhãn hiệu pin X và

Y. Chọn ngẫu nhiên mỗi loại 100 pin, kết quả

ghi nhận được như sau. Pin X có thời gian sử

dụng trung bình là 308 phút, độ lệch mẫu hiệu

chỉnh là 54 phút. Đối vối pin Y các chỉ số tương

ứng là 286 và 40 phút.

Có ý kiến cho rằng thời gian sử dụng trung

bình của pin X lớn hơn pin Y. Với mức ý nghĩa

23

= 0,01 bạn có nhận xét gì về ý kiến trên?

2. Kiểm định trung bình của tổng thể trên hai mẫu

c) Trường hợp chưa biết phương sai của tổng thể mà

hoặc

thì giá trị kiểm định:

trong đó

 Quy tắc bác bỏ như sau:

24

Giả thuyết Bác bỏ H0 khi

2. Kiểm định trung bình của tổng thể trên hai mẫu

c) Trường hợp chưa biết phương sai của tổng thể mà

hoặc

 Ví dụ 6.10. Ban lãnh đạo của một công ty cho rằng

doanh số bán hàng tăng lên sau khi thực hiện các

biện pháp khuyến mãi. Chọn ngẫu nhiên 13 tuần trước

đợt khuyến mãi và 14 tuần sau đợt khuyến mãi. Doanh

số trung bình và độ lệch mẫu hiệu chỉnh trước đợt

khuyến mãi là 1234 và 324 triệu đồng. Còn sau đợt

khuyến mãi, các con số này lần lượt là 1864 và 289

triệu đồng. Hãy kiểm định ý kiến trên với = 0,05.

25

2. Kiểm định trung bình của tổng thể trên hai mẫu

c) Trường hợp chưa biết phương sai của tổng thể mà

hoặc

lần lượt là doanh số trung

 Ví dụ 6.10. Giải: Gọi

bình sau và trước khi thực hiện các biện pháp khuyến

mãi. Ta đặt giả thuyết:

 Nếu giả thuyết H0 đúng thì đợt khuyến mãi không làm

tăng doanh thu. Nếu giả thuyết H0 sai thì CT khuyến mãi

có tác động. Ta kiểm định giả thuyết ở mức ý nghĩa 5%.

26

 Ta có:

 Do đó giá trị kiểm định:

 Vì

nên ta bác bỏ giả thuyết H0.

 Mặt khác,

: vậy doanh số trung bình sau khi áp dụng các biện pháp khuyến mãi đã tăng lên (ở mức ý nghĩa  = 0,05).

27

Ví dụ 6.10. Giải (tiếp theo):  Đề bài:

2. Kiểm định trung bình của tổng thể trên hai mẫu

c) Trường hợp chưa biết phương sai của tổng thể mà

hoặc

(Bài tập SV tự giải)

 Ví dụ 6.11. Cho hai tổng thể có phân phối chuẩn.

Mẫu ngẫu nhiên 15 đơn vị chọn từ tổng thể thứ

nhất có giá trị trung bình là 100, độ lệch mẫu hiệu

chỉnh là 5. Mẫu ngẫu nhiên 10 đơn vị chọn từ tổng

thể thứ hai có các kết quả tương ứng là 110 và 3.

Với  = 5%, hãy kiểm định giả thuyết cho rằng

trung bình của hai tổng thể này bằng nhau.

28

CỦNG CỐ

Như vậy, khi thực hiện bài toán kiểm

định trung bình, ta cần xác định:

1. Bài toán kiểm định trên một mẫu hay

hai mẫu?

2. Bài toán kiểm định thuộc trường

29

hợp nào?

V.3. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ

1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu

 Giả sử tổng thể có hai loại phần tử, một trong hai

loại có tính chất A nào đó. Tỉ lệ phần tử có tính

chất A là P chưa biết. Giả sử ta có mẫu với kích

thước n ≥ 30. Gọi

là tỉ lệ phần tử của mẫu có tính

chất A. Kiểm định giả thuyết về P với mức ý nghĩa α

cho trước được thực hiện như sau.

 Đặt giả thuyết:

(p0 là 1 giá trị cho trước)

30

1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu

 Tính giá trị kiểm định:

 Quy tắc bác bỏ: được tóm tắt trong bảng sau

 Lưu ý. Trong trường hợp bác bỏ giả thuyết

Giả thuyết Bác bỏ H0 khi

, nghĩa là đã có thì:

Với ta kết luận

31

Với ta kết luận .

1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu

Ví dụ 6.12. Theo báo cáo, tỉ lệ hàng phế phẩm

V.3. KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ

trong kho là 10%. Kiểm tra ngẫu nhiên 100 sản

phẩm thấy có 8 phế phẩm.

Hỏi báo cáo trên có đáng tin cậy ở mức ý nghĩa

32

5% không?

lệ phế phẩm trong kho

1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu

với  = 5%.

Ta có kích thước mẫu n = 100, tỉ lệ mẫu

= 0,08.

Tra bảng hàm số Laplace ta thấy:

Tính giá trị kiểm định, ta được:

𝟎

Ví dụ 6.12. Giải: Gọi P là tỉ hàng, P chưa biết. Ta kiểm tra giả thuyết:

𝟎

𝟎

nên ta chấp nhận H0, tức báo cáo đáng tin.

33

= -0,6667

1. Bài toán kiểm định tỉ lệ tổng thể trên một mẫu

Ví dụ 6.13. Trước đây tỉ lệ phế phẩm của một nhà máy là 5%. Năm nay người ta áp dụng một biện pháp kĩ thuật mới để sản xuất. Sau một thời gian, kiểm tra 800 sản phẩm thì thấy có 24 phế phẩm. Với mức ý nghĩa 1%, hãy đánh giá hiệu quả của biện pháp kĩ thuật đó.

34

Ví dụ 6.14. Giả sử sản phẩm của một công ty sản xuất lốp xe ôtô đã chiếm được 42% thị trường. Trước sự cạnh tranh của các đối thủ và điều kiện thay đổi môi trường kinh doanh, ban lãnh đạo công ty nghi ngờ thị trường của công ty đang bị giảm sút. Kiểm tra ngẫu nhiên 550 ô tô trên đường, kết quả cho thấy có 219 xe sử dụng lốp của công ty. Có thể kết luận gì về điều nghi ngờ trên với mức ý nghĩa 10%?

 Giả sử ta có 2 mẫu được chọn ngẫu nhiên, độc lập từ là kích thước hai mẫu

hai tổng thể X và Y. Gọi

.

tương ứng là tỉ lệ phần tử có tính chất A của hai tổng thể và mẫu tương ứng. Ta cần kiểm định giả thuyết:

với mức ý nghĩa α cho trước.

 Công thức tính giá trị kiểm định:

là tỉ lệ chung cho cả hai mẫu, được tính bởi

trong đó công thức:

35

2. Kiểm định tỉ lệ tổng thể trên hai mẫu

 Quy tắc kiểm định như trường hợp một mẫu.

2. Kiểm định tỉ lệ tổng thể trên hai mẫu

 Chú ý. Trong trường hợp bác bỏ

Giả thuyết Bác bỏ H0 khi

, nghĩa

 Nếu

là đã có thì:

 Nếu

ta kết luận

36

ta kết luận .

2. Kiểm định tỉ lệ tổng thể trên hai mẫu

 Ví dụ 6.15. Chọn ngẫu nhiên 200 em bé sống ở

thành phố thì thấy có 20 em béo phì. Chọn 220

 Hãy kiểm định giả thuyết cho rằng tỉ lệ trẻ em

em sống ở nông thôn thấy có 5 em béo phì.

béo phì ở thành phố và nông thôn là như nhau

37

với mức ý nghĩa 5%.

 Ví dụ 6.15. Giải: Gọi Px, Py lần lượt là tỉ lệ trẻ em béo phì ở

thành phố và nông thôn. Ta đặt giả thuyết:

 Ta kiểm định giả thuyết ở mức ý nghĩa 5%.

 Theo đề bài:

𝒚

𝒚

𝒙

𝒙

𝟎

𝜶 𝟐

𝒙

𝒚

 Giá trị kiểm định:

𝟎

𝟎

𝒙

𝒚

 Vì

nên ta bác bỏ H0. Mặt khác,

 Nghĩa là tỉ lệ béo phì của trẻ em thành phố cao hơn trẻ em 38

nông thôn.

2. Kiểm định tỉ lệ tổng thể trên hai mẫu

CỦNG CỐ KIẾN THỨC CHƯƠNG 6

 BÀI TOÁN KIỂM ĐỊNH:

 Các bước của bài toán kiểm định.

 KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH

1. Trên một mẫu: có 3 trường hợp.

2. Trên hai mẫu: có 3 trường hợp (đọc thêm)

 KIỂM ĐỊNH GIẢ THUYẾT VỀ TỈ LỆ:

1. Trên một mẫu: có 1 trường hợp.

2. Trên hai mẫu: có 1 trường hợp (đọc thêm)

39

CỦA TỔNG THỂ: