Kiểm định phi tham số: Kinh nghiệm và hướng dẫn chi tiết

CHƯƠNG 4:

KIỂM ÐỊNH PHI THAM SỐ

(Nonparametric Tests)

I. KIỂM ĐỊNH WILCOXON

II. KIỂM ĐỊNH MANN-WHITNEY

III. KIỂM ĐỊNH SỰ PHÙ HỢP

1. Kiểm định sự phù hợp trong trường hợp giả định đã biết các

tham số của tổng thể

2. Kiểm định sự phù hợp trong trường hợp các tham số tổng thể

chưa biết

IV. BẢNG TIẾP LIÊN

Trong chương 3, chúng ta kiểm định sự bằng nhau của hai trung bình tổng thể

nhưng phân phối của tổng thể được giả sử có phân phối chuẩn. Trong chương này,

kiểm định được phát triển thêm một bước, cũng với giả thuyết H0 về sự bằng nhau

của hai trung bình tổng thể nhưng phân phối của các tổng thể được giả sử có phân

phối bất kỳ. Ðây chính là thuận lợi của kiểm định phi tham số vì kiểm định loại

này phù hợp với nhiều giả định hơn về phân phối của tổng thể.

Trong nhiều tình huống thực tế, số liệu chỉ có thể biểu hiện dưới hình thức

xếp hạng, vì vậy kiểm định Wilconxon và Mann-Whitney là hai lọai kiểm định

thông dụng nhất ứng với hai trường hợp: một là sử dụng cho mẫu ngẫu nhiên gồm

các quan sát từng cặp và một dùng cho mẫu ngẫu nhiên độc lập. Hơn nữa, khi

phân phối của tổng thể được giả định không phải là phân phối chuẩn (phân

phối bất kỳ) thì kiểm định phi tham số có thể có nhiều ứng dụng hơn. Tuy nhiên,

phương pháp kiểm định phi tham số thì khó mở rộng để giải quyết các vấn đề của

mô hình kinh tế phức tạp.

Kiểm định phi tham số bạn có thể dễ dàng tìm được kết quả khi sử dụng

phần mềm phân tích SPSS, sau khi nhập sữ liệu, chọn menu Analize -

Nonparametric Tests - Chọn loại kiểm định mà bạn mong đợi.

I. KIỂM ĐỊNH WILCOXON (Kiểm định T)

Kiểm định Wilcoxon được áp dụng khi một mẫu ngẫu nhiên gồm các quan

sát từng cặp và phân phối tổng thể của chênh lệch (di) trong các cặp này thì đối

xứng.

1. Trường hợp mẫu nhỏ (n ( 20):

Ví dụ: Một công ty nước giải khát muốn kiểm tra hiệu quả của chiến dịch quảng

cáo cho 5 loại thức uống tốt nhất của công ty bằng cách điều tra số người sử dụng

5 loại thức uống này tăng lên hay giảm xuống sau đợt quảng cáo ở mức ý nghĩa

2,5% và 5%. Công ty chọn ngẫu nhiên 10 thành phố và mỗi thành phố chọn ngẫu

nhiên 500 người để trả lời cuộc điều tra này kết quả như sau:

Thành

phố

1 2 3 4 5 6 7 8 9 10

quảng cáo

(yi)

151

192

215

254

123

153

quảng

cáo (xi)

123

160

180

193

311

121

131

169

Chênh

lệch (di)

9 -12

-22

-2 34

Xếp

hạng

l dil

8 2 3 6,5

4 6,5

1 9 5

{+di }

8 2 0 6,5

4 0 10

0 9 5

{- di }

0 0 3 0 0 6,5

0 1 0 0

2. Trường hợp mẫu lớn (n >20):

Ví dụ: Trở lại ví dụ ở trường hợp 1, thay vì thu thập số liệu ở 10 thành phố, ta thực

hiện ở 85 thành phố lớn nhỏ khác nhau. Trong 85 mức độ chênh lệch được xếp

hạng thì giá trị nhỏ nhất của T (minimum) là 1.195. Hãy kiểm định giả thuyết H0

với đối thuyết H1 rằng chiến dịch quảng cáo có hiệu quả hơn.

Ta có n = 85, T = 1195 và nếu giả thuyết H0 đúng thì phân phối Wilcoxon có

trung bình và phương sai như sau:

II. KIỂM ĐỊNH MANN - WHITNEY (Kiểm định U)

Cũng như kiểm định T, kiểm định U cũng là một loại kiểm định bằng cách

xếp hạng các mẫu độc lập với mục đích kiểm định sự bằng nhau của các tổng thể

có phân phối bất kỳ.

1. Trường hợp mẫu nhỏ (n < 10 và n1 < n2): : là số quan sát mẫu chọn ra từ

tổng thể thứ 1,

Ví dụ: Chúng ta muốn so sánh lương khởi điểm của sinh viên tốt nghiệp ở ngành

kinh tế và điện tử tin học được trả bởi các công ty như sau (100.000 đồng):

Ðiện tử tin học 15 18 27 30 24

Kinh tế 17 22 24 12 28 30 14 18 25 22

Giả thuyết H0: Trung bình lương khởi điểm của 2 ngành thì bằng nhau

H1: Trung bình lương khởi điểm ngành tin học được trả cao hơn

Trước tiên ta xếp hạng các số liệu liên tục cho cả hai ngành từ nhỏ đến lớn:

Ðiện

tử

Tin

học

Xếp

hạng

5,5

9,5

14,

Kinh tế

Xếp

hạng

5,5

7,5

9,5

14,

Chú ý: Trong xếp hạng, hạng của các giá trị trùng nhau của hai ngành cũng được

xếp bằng nhau và bằng trung bình cộng của giá trị hai hạng liên tiếp đó.

2. Trường hợp mẫu lớn (n >10):

Ví dụ: Trở lại vấn đề tiền lương khởi điểm của hai ngành kinh tế và điện tử tin

học. Mỗi ngành chọn ngẫu nhiên 80 sinh viên và sau đó tiền lương được xếp hạng

từ nhỏ đến lớn, và tổng cộng hạng được xếp cho tiền lương của hai ngành thì bằng

nhau và bằng 7.287.

Ta có : n1 = 80 n2 = 80 R1 = 7.287

Giả thuyết H0: Trung bình lương khởi điểm của hai ngành thì bằng nhau.

H1: Trung bình lương khởi điểm ngành kinh tế và điện tử tin học được

trả khác nhau.

III. KIỂM ĐỊNH SỰ PHÙ HỢP (Goodness-of-fit test)

Kiểm định sự phuùhợp là kiểm định xem giả thuyết về phân phối của tổng

thể và số liệu thực tế phù hợp (thích hợp) với nhau đến mức nào. Ở đây ta dùng

phân phối "Chi" bình phương (2) để so sánh trong quá trình kiểm định. Một kiểm

định 2 thường bao gồm những bước sau đây:

1. Thiết lập giả thuyết H0 và H1 về tổng thể.

2. Tính toán các giá trị lý thuyết theo giả thuyết H0

3. Tính toán các khác biệt giữa giá trị lý thuyết và giá trị thực tế. Từ đó, xác

định giá trị kiểm định theo 2 công thức

Oi: Tần số quan sát của nhóm thứ i.

Ei: Tần số lý thuyết của nhóm thứ i (tính theo giả thuyết H0).

4. So sánh giá trị kiểm định tính được với giá trị trong bảng phân phối 2 và

kết luận.

1. Kiểm định sự phù hợp trong trường hợp giả định đã bi

ết các

tham số của tổng thể.

Giả sử có một mẫu ngẫu nhiên với n quan sát, mỗi quan sát có thể được

phân vào một trong k nhóm.

· Gọi O1,O2,...,Ok là số quan sát ở nhóm thứ 1,2,...,k.

· Gói p1, p2,..., pk là xác suất giả thuyết để quan sát rơi vào nhóm thứ 1,2,...,k

(giả thuyết H0). Do vậy, số quan sát ở nhóm thứ i, theo giả thuyết H0, là:

Ei = n.pi (i=1,2,...,k)

Ví dú: Một công ty dự định đưa ra thị trường một sản phẩm mới với bốn màu sắc

khác nhau. Giám đốc công ty muốn tìm hiểu thị hiếu khách hàng về màu sắc sản

phẩm - thích đặc biệt một màu nào hay sở thích đối với cả bốn màu là giống nhau

ở mức ý nghĩa 1%. Một mẫu 80 khách hàng đợc chọn ngẫu nhiên. Mỗi khách hàng

được xem sản phẩm với các màu sắc khác nhau và cho biết ý kiến. Kết quả như

Trắng Nâu Xanh Đen Tổng cộng

12 40 8 20 80

· Giả thuyết H0: Sở thích đối với 4 màu là giống nhau, nghĩa là các suất khách

hàng chọn lựa một trong 4 màu bằng nhau:

p1 = p2 = p3 = p4 = 0,25.

· Giả thuyết H1 : Sở thích đối với 4 màu là giống nhau, nghĩa là xác suất

khách hàng chon lựa đối với 4 màu không bằng nhau..

Theo giả thuyết H0 số lượng khách hàng chọn màu thứ i là Ei = n .pi.

Do đó, ta có:

E1 = E2 = E3 = E4 = (80) (0,25) = 20

Giá trị kiểm định:

Tra baûng phaân phoái 2, ta coù: 2

k-1, = 2

4 -1,1% = 11,34.

Vì giaù trò kieåm ñònh 2 > 2

k-1, , ta keát luaän raèng ôû möùc yù nghóa 1% giaû

thuyeát H0 bò baùc boû, nghóa laø söï choïn löïa ñoái vôùi 4 maøu saéc cuûa saûn

phaåm laø khaùc nhau. Moät vaøi maøu saéc naøo ñoù ñöôïc öa thích hôn.

Cũng cần lưu ý raèng caùc xaùc suaát giaû thuyeát khoâng phaûi baét

buoäc baèng nhau, chuùng coù theå raát khaùc nhau. Chuùng ta caàn xaùc ñònh

roõ caùc xaùc suaát giaû thuyeát naøy khi laäp giaû thuyeát H0 vaø duøng caùc

xaùc suaát giaû thuyeát ñoù ñeå tính toaùn caùc giaù trò Ei.

2. Kiểm định sự phù hợp trong trư

ờng hợp các tham số tổng thể

chưa biết.

Ở phần (1) trang 150, ta đã thực hiện kiểm định giả thuyết về việc quan sát

được phân phối với các xác suất xác định nào đó. Khi đó, xác suất để một quan sát

rơi vào nhóm thứ i được xác định rõ khi lập giả thuyết H0.

Phần này sẽ đề cập đến việc kiểm định giả thuyết các quan sát tuân theo

một luật phân phối nào đó - có thể là phân phối nhị thức, phân phối Poission, hay

KIỂM ÐỊNH PHI THAM SỐ

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi