Chương 8: KIỂM ĐỊNH PHI THAM SỐ
www.nguyenngoclam.com
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
1.1.Dựa vào đồ thị tần suất: Đối chiếu đồ thị tần suất có giống đồ thị hàm phân phối chuẩn. 1.2. Kiểm định Jarque-Bera: H0: X có phân phối chuẩn H1: X không có phân phối chuẩn
2
x(
n/
i
S
JB
S 6
2 )3K( 24
s
n
4
x(
i
K
s
3 )x 3 x )x 4 x
n/
Bác bỏ H0: JB > 2
2,
152
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
Ví dụ: Kiểm định tỷ lệ lãi trên vốn (%) trước và sau CPH có phân phối chuẩn với mức ý nghĩa 5%:
DN Trước CPH Sau CPH DN Trước CPH Sau CPH
1 3,5 4,5 5,0 4,0 9
2 5,1 5,0 5,4 4,8 10
3 4 4,0 4,2 6,0 4,0 6,5 5,0 6 6,8 11 12
5 5,0 5,0 5,6 5,2 13
6 6,0 6,0 6,2 6,4 14
7 5,8 5,4 6,5 6,0 15
8 6,0 5,0
153
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
1.3. Kolmogorov-Smirnov
154
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
155
II.KIỂM ĐỊNH WILLCOXON (T)
2.1.Giả thuyết: H0: x = y Mẫu phối hợp từng cặp 2.2.Mẫu nhỏ (n≤20): 1. Tính các chênh lệch giữa các cặp: di = xi - yi 2. Xếp hạng di theo thứ tự tăng dần, các giá trị bằng nhau sẽ nhận hạng trung bình của các hạng liên tiếp, bỏ qua trường hợp di = 0. 3. Tìm tổng các hạng di>0 (di<0). Ký hiệu: T+, T- 4. Giá trị kiểm định T=min(T+,T-) 5. Bác bỏ H0: T Tn’,, Tn’, có phân phối Wilcoxon
n’: Số cặp quan sát khác 0
156
II.KIỂM ĐỊNH WILLCOXON (T)
Ví dụ: Để khảo sát xem khách hàng thích sản phẩm nào hơn, chọn ngẫu nhiên 10 khách hàng và yêu cầu họ cho biết sở thích về 2 sản phẩm cùng loại X, Y khác nhau thông qua thang điểm từ 1 đến 5 (điểm càng cao sở thích càng cao). Hãy cho biết khách thích sản phẩm nào nhiều hơn với = 5%.
Khách hàng
1
2
3
5
6
7
8
9
10
4
X
4
5
2
3
1
3
2
1
5
4
Y
3
5
5
5
5
3
5
5
2
2
157
II.KIỂM ĐỊNH WILLCOXON (T)
1 5
3 2 3 5
3 5 -2
4 4 5 2 2 3 5 5 1 0 -3 2 2,5 1
5 1 2 5 -4 0 -3 -4 3 5
1 2 3 4 5 6 7 8 9 10 Tổng
5
2,5 7,5
5 7,5
8,5 27,5
Khách hàng X Y Di T+ T-
158
II.KIỂM ĐỊNH WILLCOXON (T)
2.3. Mẫu lớn n>20: Ta có kiểm định Z
T
T
z
T
2 T
)1'n('n 4
)1'n2)(1'n('n 24
T
159
II.KIỂM ĐỊNH WILLCOXON (T)
160
II.KIỂM ĐỊNH WILLCOXON (T)
161
III.KIỂM ĐỊNH MANN-WHITNEY (U)
3.1.Giả thuyết: H0: 1 = 2 Mẫu độc lập
)1
Un.n 21 1
U 2
n.nU 21
R 1
1
3.2.Mẫu nhỏ (n1,n2≤20): 1. Xếp hạng tất cả các giá trị của hai mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận hạng trung bình các hạng liên tiếp. 2. Tổng hạng mẫu 1 và mẫu 2. Ký hiệu: R1, R2 3. Giá trị kiểm định: U=min(U1,U2) n(n 11 2
4. Bác bỏ H0: U Un1,n2,
162
III.KIỂM ĐỊNH MANN-WHITNEY (U)
X
60
61
62
62
63
63
68
64
64
65
Y
56
56
57
57
58
58
58
59
59
60
60
60
61 61 62
11,5
R(X)
15
18
18
20,5
20,5 25 22,5 22,5
24
Ví dụ: Tại một trang trại nuôi lợn người ta thử áp dụng một loại thuốc tăng trọng bổ sung vào khẩu phần thức ăn của 10 con lợn, sau 3 tháng người ta thu thập số liệu về trọng lượng của heo (X). Trong khi đó 15 con lợn khác không dùng thuốc tăng trọng có trọng lượng, sau 3 tháng người ta thu thập số liệu (Y). Hãy kiểm tra xem trọng lượng có như nhau hay không khi thử nghiệm với =5%.
197,5
R(Y)
1,5
1,5 3,5 3,5
6
6
6
8,5
8,5
11,5
11,5
11,5
15 15 18 127,5
163
III.KIỂM ĐỊNH MANN-WHITNEY (U)
U
n
)1
U
3.3.Mẫu lớn (n1,n2>20): Ta có kiểm định z n(n.n 121
2
z
U
2 U
nn 21 2
12
U
164
III.KIỂM ĐỊNH MANN-WHITNEY (U)
165
III.KIỂM ĐỊNH MANN-WHITNEY (U)
166
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
...
1
k
2
• Giả thuyết:
i(
)j
i
j
:H 0 :H 1
• Giá trị kiểm định: Chọn k mẫu độc lập có n1...,nk quan sát (ni5), n=ni. Tổng hạng của k mẫu R1,...,Rk
W
)1n(3
12 )1n(n
k 1i
2 R i n i • Bác bỏ H0: W> 2
k-1,
167
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
Ví dụ: Một nhà nghiên cứu muốn xem xét phải chăng ở 3 ngành công nghiệp A,B,C tổng giá trị sản phẩm trung bình của các xí nghiệp là như nhau với mức ý nghĩa 5%. Chọn một số xí nghiệp ở các ngành đó như sau:
Ngành A 1,38 1,55 1,90 2,00 1,22 2,11 1,98 1,61 Tổng
Ngành B 2,33 2,50 2,79 3,01 1,99 2,45
Ngành C 1,06 1,37 1,09 1,65 1,44 1,11 15 rank(A) 14 11 6 8 4 12 9 79
rank(B) 16 18 19 20 13 17 103
rank(C) 1 5 2 10 7 3 28
W=13,5416
168
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
169
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
170
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Giả thuyết H0: Tổng thể được chia làm k nhóm, có phân phối xác suất pi (pi=1) để một quan sát rơi vào nhóm i. Chọn ngẫu nhiên n quan sát, ni là số quan sát rơi vào nhóm i.
Nhóm Ho Quan sát
… … …
1 n
1 P1 n1
2 P2 n2
k Pk nk
i
5
2
Giá trị kiểm định:
E , i
np i
2 )En( i E i
k 1i
Bác bỏ Ho: 2 >2
k-1,
171
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Ở một quán cafe, có 4 nhãn hiệu nước giải khát khác nhau. 160 khách hàng được chọn ngẫu nhiên cho thấy sự lựa chọn về các nhãn hiệu như sau. Có thể kết luận sự ưa chuộng của khách hàng về 4 giải khát là như nhau được không ở mức ý nghĩa 2,5%.
Nhãn hiệu A B C D
Số khách hàng 34 46 29 51 160
0,25 0,25 0,25 0,25 1
40 40 40 40
0,90 0,90 3,03 3,03 7,85 GT Ho (pi) Ei=n.pi (ni-Ei)2/Ei
172
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Phân nhóm theo tiêu thức thứ nhất ... ... ... ... ... ...
R1 R2 ... Rr n
Phân nhóm theo tiêu thức thứ hai 1 2 ... r
2 n12 n22 ... nr2 C2
c n1c n2c ... nrc Cc
1 n11 n21 ... nr1 C1
Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp thành 2 tiêu thức:
2
n(
ij
)E ij
j
E ,
2
Giả thuyết H0: Tiêu thức 1 và tiêu thức 2 độc lập
ij
E
CR i n
ij
c r 1i 1j
2
Giá trị kiểm định:
2 ),1c)(1r(
Bác bỏ H0:
173
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Ví dụ: Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát, một mẫu ngẫu nhiên 2.425 người tiêu dùng với các nhãn hiệu nước giải khát được ưa thích như sau. Kiểm định giả thuyết không có mối liên hệ nào giữa giới tính và sự ưa thích nhãn hiệu nước giải khát ở mức ý nghĩa 0,5%.
Giới tính
Nhãn hiệu ưa thích
Coca
Pepsi
7Up
Tổng (Ri) Tổng (Ri)
Nam
599 599
Nữ
1826 1826
Tổng(Cj) Tổng(Cj)
308 (200) 502 (610) 810 810
177 (199) 627 (605) 804 804
114 (200) 697 (611) 811 811
2425 2425
2 = 129,83