CHƯƠNG 4:
KIỂM ÐNH PHI THAM SỐ
(Nonparametric Tests)
I. KIỂM ĐỊNH WILCOXON
II. KIỂM ĐỊNH MANN-WHITNEY
III. KIỂM ĐỊNH SỰ PHÙ HỢP
1. Kim định s phù hợp trong trường hợp giả định đã biết c
tham số của tổng thể
2. Kim định sphù hp trong trường hợp các tham số tổng thể
chưa biết
IV. BẢNG TIẾP LIÊN
Trong chương 3, chúng ta kiểm định sự bằng nhau của hai trung bình tổng thể
nhưng phân phối của tổng thể được giả sử có phân phối chuẩn. Trong chương này,
kiểm định được phát triển thêm một bước, cũng với giả thuyết H0 về sự bằng nhau
của hai trung bình tổng thể nhưng phân phối của các tổng thể được giả sử phân
phối bất kỳ. Ðây chính thun lợi của kiểm định phi tham số vì kiểm định loại
này phù hợp với nhiều giả định hơn về phân phối của tổng thể.
Trong nhiu tình huống thực tế, số liệu chỉ thể biểu hiện dưới hình thức
xếp hạng, vì vậy kiểm định Wilconxon và Mann-Whitney hai lọai kiểm định
thông dụng nhất ứng với hai trường hợp: một là sdụng cho mẫu ngẫu nhiên gm
các quan sát từng cặp và một dùng cho mẫu ngẫu nhiên độc lập. Hơn nữa, khi
phân phối của tổng thể được giả định không phải là phân phối chuẩn (phân
phối bất kỳ) thì kiểm định phi tham số thể nhiều ứng dng hơn. Tuy nhiên,
phương pháp kiểm định phi tham số thì khó mrộng để giải quyết các vấn đề của
mô hình kinh tế phức tạp.
Kiểm định phi tham số bạn thể dễ dàng m được kết quả khi sử dụng
phần mềm phân tích SPSS, sau khi nhập sữ liệu, chọn menu Analize -
Nonparametric Tests - Chọn loại kiểm định mà bạn mong đợi.
I. KIỂM ĐỊNH WILCOXON (Kim định T)
Kiểm định Wilcoxon được áp dụng khi một mẫu ngẫu nhiên gồm các quan
sát từng cặp và phân phối tổng thể của chênh lệch (di) trong các cặp này thì đối
xứng.
1. Trường hợp mu nhỏ (n ( 20):
dụ: Một công ty nước giải khát muốn kiểm tra hiệu quả của chiến dịch quảng
cáo cho 5 loại thức uống tốt nhất của công ty bằng cách điều tra sngười sử dụng
5 loại thức uống này ng lên hay giảm xuống sau đợt quảng o mức ý nghĩa
2,5% 5%. Công ty chọn ngẫu nhiên 10 thành phvà mỗi thành phchọn ngẫu
nhiên 500 người để trả lời cuộc điều tra này kết quả như sau:
Thành
ph
1 2 3 4 5 6 7 8 9 10
Trước
quảng cáo
(yi)
95
151
192
71
86
215
254
123
97
153
Sau
quảng
cáo (xi)
123
160
180
93
99
193
311
121
131
169
Chênh
lệch (di)
28
9 -12
22
13
-22
57
-2 34
16
Xếp
hạng
l dil
8 2 3 6,5
4 6,5
10
1 9 5
{+di }
8 2 0 6,5
4 0 10
0 9 5
{- di }
0 0 3 0 0 6,5
0 1 0 0
2. Trường hợp mu lớn (n >20):
Ví dụ: Trở lại ví dụ ở trường hợp 1, thay vì thu thập số liệu ở 10 thành phố, ta thực
hiện 85 thành phlớn nhỏ khác nhau. Trong 85 mức độ chênh lệch được xếp
hạng thì giá trnhỏ nhất của T (minimum) là 1.195. Hãy kiểm định giả thuyết H0
với đối thuyết H1 rằng chiến dịch quảng cáo hiệu quả hơn.
Ta có n = 85, T = 1195 và nếu giả thuyết H0 đúng thì phân phối Wilcoxon có
trung bình và phương sai như sau:
II. KIỂM ĐỊNH MANN - WHITNEY (Kim định U)
Cũng như kiểm định T, kiểm định U cũng là một loại kiểm định bằng cách
xếp hạng các mẫu độc lập với mục đích kiểm định sự bằng nhau của các tổng thể
có phân phối bất kỳ.
1. Trường hợp mẫu nhỏ (n < 10 và n1 < n2): : squan sát mẫu chọn ra từ
tổng thể thứ 1,
dụ: Chúng ta muốn so sánh lương khởi điểm của sinh viên tốt nghiệp ngành
kinh tế và điện tử tin học được trả bởi các công ty như sau (100.000 đồng):
Ðiện tử tin học 15 18 27 30 24
Kinh tế 17 22 24 12 28 30 14 18 25 22
Giả thuyết H0: Trung bình lương khởi điểm của 2 ngành thì bằng nhau
H1: Trung bình lương khởi điểm ngành tin học được trả cao hơn
Trước tiên ta xếp hạng các số liệu liên tục cho cả hai ngành tnhỏ đến lớn:
Ðiện
t
Tin
học
1
5
18
24
2
7
30
Xếp
hạng
3
5,5
9,5
1
2
14,
5
Kinh tế
1
2
1
4
17
18
22
22
24
2
5
28
30
Xếp
hạng
1
2
4
5,5
7,5
7,5
9,5
1
1
13
14,
5
Chú ý: Trong xếp hạng, hạng của các giá trị trùng nhau của hai ngành cũng được
xếp bằng nhau và bằng trung bình cộng của giá trị hai hạng liên tiếp đó.
2. Trường hợp mu lớn (n >10):
dụ: Trở lại vấn đề tiền lương khởi điểm của hai ngành kinh tế điện tử tin
học. Mỗi ngành chọn ngẫu nhiên 80 sinh viên và sau đó tiền lương được xếp hạng
từ nhỏ đến lớn, và tổng cộng hạng được xếp cho tiền lương của hai ngành thì bằng
nhau và bằng 7.287.
Ta có : n1 = 80 n2 = 80 R1 = 7.287
Giả thuyết H0: Trung bình lương khởi điểm của hai ngành thì bằng nhau.
H1: Trung bình lương khởi điểm ngành kinh tế điện tử tin học được
trả khác nhau.
III. KIỂM ĐỊNH SỰ PHÙ HỢP (Goodness-of-fit test)
Kiểm định sphuùhợp là kiểm định xem giả thuyết về phân phối của tổng
thvà sliệu thực tế phù hợp (thích hợp) với nhau đến mức nào. đây ta dùng
phân phối "Chi" bình phương (2) để so sánh trong quá trình kiểm định. Một kiểm
định 2 thường bao gồm những bước sau đây:
1. Thiết lập giả thuyết H0 và H1 về tổng thể.
2. Tính toán các giá trlý thuyết theo giả thuyết H0
3. Tính toán các khác biệt giữa giá trị thuyết và giá trị thực tế. Từ đó, xác
định giá trị kiểm định theo 2 công thức
Oi: Tần số quan sát của nhóm thứ i.
Ei: Tần số lý thuyết của nhóm thứ i (tính theo giả thuyết H0).
4. So sánh giá trkiểm định tính được với giá trị trong bảng phân phối 2
kết luận.
1. Kim định sự phù hp trong trường hp giả định đã bi
ết c
tham số của tổng thể.
Gisử một mẫu ngẫu nhiên với n quan sát, mỗi quan sát thể được
phân vào một trong k nhóm.
· Gọi O1,O2,...,Ok là squan sát ở nhóm thứ 1,2,...,k.
· Gói p1, p2,..., pk là xác suất giả thuyết để quan sát i vào nhóm thứ 1,2,...,k
(giả thuyết H0). Do vậy, số quan sát ở nhóm thứ i, theo giả thuyết H0, là:
Ei = n.pi (i=1,2,...,k)
dú: Một công ty dự định đưa ra thtrường một sản phẩm mới với bốn màu sắc
khác nhau. Giám đốc công ty muốn tìm hiểu thị hiếu khách hàng vmàu sắc sản
phẩm - thích đặc biệt một màu nào hay s thích đối với cả bốn màu giống nhau
ở mức ý nghĩa 1%. Một mẫu 80 khách hàng đợc chọn ngẫu nhiên. Mỗi khách hàng
được xem sản phẩm với các màu sắc khác nhau và cho biết ý kiến. Kết quả như
sau:
Trắng Nâu Xanh Đen Tổng cộng
12 40 8 20 80
· Githuyết H0: S thích đối với 4 màu giống nhau, nghĩa là các suất khách
hàng chọn lựa một trong 4 màu bằng nhau:
p1 = p2 = p3 = p4 = 0,25.
· Githuyết H1 : Sở thích đối với 4 màu giống nhau, nghĩa là xác suất
khách hàng chon lựa đối với 4 màu không bằng nhau..
Theo giả thuyết H0 số lượng khách hàng chọn màu thứ i là Ei = n .pi.
Do đó, ta có:
E1 = E2 = E3 = E4 = (80) (0,25) = 20
Giá trkiểm định:
Tra baûng phaân phoái 2, ta coù: 2
k-1, = 2
4 -1,1% = 11,34.
Vì giaù trò kieåm ñònh 2 > 2
k-1, , ta keát luaän raèng ôû möùc yù nghóa 1% giaû
thuyeát H0 baùc boû, nghóa laø söï choïn löïa ñoái vôùi 4 maøu saéc cuûa saûn
phaåm laø khaùc nhau. Moät vaøi maøu saéc naøo ñoù ñöôïc öa thích hôn.
Cũng cần u ý raèng caùc xaùc suaát giaû thuyeát khoâng phaûi baét
buoäc baèng nhau, chuùng coù theå raát khaùc nhau. Chuùng ta caàn xaùc ñònh
roõ caùc xaùc suaát giaû thuyeát naøy khi laäp giaû thuyeát H0 vaø duøng caùc
xaùc suaát giaû thuyeát ñoù ñeå tính toaùn caùc giaù trò Ei.
2. Kim định sự phù hp trong trư
ờng hp các tham stổng thể
chưa biết.
phần (1) trang 150, ta đã thực hiện kiểm định giả thuyết về việc quan sát
được phân phối với các xác suất xác định nào đó. Khi đó, xác suất để một quan sát
rơi vào nhóm thứ i được xác định rõ khi lập giả thuyết H0.
Phần này sđề cập đến việc kiểm định giả thuyết các quan sát tuân theo
một luật phân phối nào đó - thlà phân phối nhthức, phân phối Poission, hay