Chương 8: KIỂM ĐỊNH PHI THAM SỐ
www.nguyenngoclam.com
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
1.1.Dựa vào đồ thị tần suất: Đối chiếu đồ thị tần suất có giống đồ thị hàm phân phối chuẩn. 1.2. Kiểm định Jarque-Bera: H0: X có phân phối chuẩn H1: X không có phân phối chuẩn
3
2
2
x(
n/
i
S
JB
S 6
)3K( 24
s
n
x(
i
K
s
)x 3 x 4 )x 4 x
n/
Bác bỏ H0: JB > 2
2,
152
I.KIỂM ĐỊNH PHÂN PHỐI CHUẨN
Ví dụ: Kiểm định tỷ lệ lãi trên vốn (%) trước và sau CPH có phân phối chuẩn với mức ý nghĩa 5%:
DN Trước CPH
Sau CPH DN Trước CPH
Sau CPH
1
3,5
4,5
5,0
4,0
9
2
5,1
5,0
5,4
4,8
10
3
4,0
6,0
6,5
6
11
4
4,2
4,0
5,0
6,8
12
5
5,0
5,0
5,6
5,2
13
6
6,0
6,0
6,2
6,4
14
7
5,8
5,4
6,5
6,0
15
8
6,0
5,0
153
II.KIỂM ĐỊNH WILLCOXON (T)
2.1.Giả thuyết: H0: x = y Mẫu phối hợp từng cặp
2.2.Mẫu nhỏ (n≤20): 1. Tính các chênh lệch giữa các cặp: di = xi - yi 2. Xếp hạng di theo thứ tự tăng dần, các giá trị bằng nhau sẽ nhận hạng trung bình của các hạng liên tiếp, bỏ qua trường hợp di = 0. 3. Tìm tổng các hạng di>0 (di<0). Ký hiệu: T+, T- 4. Giá trị kiểm định T=min(T+,T-) 5. Bác bỏ H0: T Tn’,, Tn’, có phân phối Wilcoxon
n’: Số cặp quan sát khác 0
154
II.KIỂM ĐỊNH WILLCOXON (T)
Ví dụ: Để khảo sát xem khách hàng thích sản phẩm nào hơn, chọn ngẫu nhiên 10 khách hàng và yêu cầu họ cho biết sở thích về 2 sản phẩm cùng loại X, Y khác nhau thông qua thang điểm từ 1 đến 5 (điểm càng cao sở thích càng cao). Hãy cho biết khách thích sản phẩm nào nhiều hơn với = 5%.
Khách hàng
1
2
3
5
6
7
8
9
10
4
X
4
5
2
3
1
3
2
1
5
4
Y
3
5
5
5
5
3
5
5
2
2
155
II.KIỂM ĐỊNH WILLCOXON (T)
1 2
3
7
8
10 Tổng
4
6
9
5
4
4 5 2
Khách hàng X
1
1
3 2
5
3
5 3 5 5 -4 0 -3 -4
5 -2
2 3 5 5 1 0 -3 2 2,5 1
2 3 5
Y di T+ T-
8,5 27,5
5
2,5 7,5
5 7,5
156
II.KIỂM ĐỊNH WILLCOXON (T)
2.3. Mẫu lớn n>20: Ta có kiểm định Z
T
T
z
T
2 T
)1'n('n 4
)1'n2)(1'n('n 24
T
157
III.KIỂM ĐỊNH MANN-WHITNEY (U)
3.1.Giả thuyết: H0: 1 = 2 Mẫu độc lập
)1
n.n 21
U 2
U 1
n.nU 21
R 1
1
3.2.Mẫu nhỏ (n1,n2≤20): 1. Xếp hạng tất cả các giá trị của hai mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận hạng trung bình các hạng liên tiếp. 2. Tổng hạng mẫu 1 và mẫu 2. Ký hiệu: R1, R2 3. Giá trị kiểm định: U=min(U1,U2) n(n 11 2
4. Bác bỏ H0: U Un1,n2,
158
III.KIỂM ĐỊNH MANN-WHITNEY (U)
Ví dụ: Tại một trang trại nuôi lợn người ta thử áp dụng một loại thuốc tăng trọng bổ sung vào khẩu phần thức ăn của 10 con lợn, sau 3 tháng người ta thu thập số liệu về trọng lượng của heo (X). Trong khi đó 15 con lợn khác không dùng thuốc tăng trọng có trọng lượng, sau 3 tháng người ta thu thập số liệu (Y). Hãy kiểm tra xem trọng lượng có như nhau hay không khi thử nghiệm với =5%.
X 60 61 62 62 63 63 68 64 64 65
11,5
Y 56 56 57 57 58 58 58 59 59 60 60 60 61 61 62
R(X) 15 18 18 20,5 20,5 25 22,5 22,5 24 197,5
R(Y) 1,5 1,5 3,5 3,5 6 6 6 8,5 8,5 11,5 11,5 11,5 15 15 18 127,5
159
III.KIỂM ĐỊNH MANN-WHITNEY (U)
U
n
)1
U
3.3.Mẫu lớn (n1,n2>20): Ta có kiểm định z n(n.n 121
2
z
U
2 U
nn 21 2
12
U
160
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
...
1
k
2
• Giả thuyết:
i(
)j
i
j
:H 0 :H 1
• Giá trị kiểm định: Chọn k mẫu độc lập có n1...,nk quan sát (ni5), n=ni. Tổng hạng của k mẫu R1,...,Rk
W
)1n(3
12 )1n(n
2 R i n i
k 1i
• Bác bỏ H0: W> 2
k-1,
161
IV.KIỂM ĐỊNH KRUSKAL-WALLIS
Ví dụ: Một nhà nghiên cứu muốn xem xét phải chăng ở 3 ngành công nghiệp A,B,C tổng giá trị sản xuất trung bình của các xí nghiệp là như nhau với mức ý nghĩa 5%. Chọn một số xí nghiệp ở các ngành đó như sau:
Ngành Tổng
A 1,38 1,55 1,90 2,00 1,22 2,11 1,98 1,61
B 2,33 2,50 2,79 3,01 1,99 2,45
C 1,06 1,37 1,09 1,65 1,44 1,11
Hạng A 6 8 11 14 4 15 12 9 79
Hạng B 16 18 19 20 13 17 103
Hạng C 1 5 2 10 7 3 28
W=13,5416
162
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Giả thuyết H0: Tổng thể được chia làm k nhóm, có phân phối xác suất pi (pi=1) để một quan sát rơi vào nhóm i. Chọn ngẫu nhiên n quan sát, ni là số quan sát rơi vào nhóm i.
…
Nhóm Ho Quan sát
… …
1 n
1 P1 n1
2 P2 n2
k Pk nk
i
E ,
5
2
Giá trị kiểm định:
i
np i
2 )En( i E i
k 1i
Bác bỏ Ho: 2 >2
k-1,
163
V.KIỂM ĐỊNH SỰ PHÙ HỢP
Ở một quán cafe, có 4 nhãn hiệu nước giải khát khác nhau. 160 khách hàng được chọn ngẫu nhiên cho thấy sự lựa chọn về các nhãn hiệu như sau. Có thể kết luận sự ưa chuộng của khách hàng về 4 giảI khát là như nhau được không ở mức ý nghĩa 2,5%.
Nhãn hiệu
A
B
C
D
Số khách hàng
34
46
29
51
160
0,25
0,25
0,25
0,25
1
40 0,90
40 0,90
40 3,03
40 3,03
7,85
GT Ho (pi) Ei=n.pi (ni-Ei)2/Ei
164
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp thành 2 tiêu thức:
Phân nhóm theo tiêu thức thứ hai 1 2 ... r
Phân nhóm theo tiêu thức thứ nhất ... ... ... ... ... ...
R1 R2 ... Rr n
2 n12 n22 ... nr2 C2
c n1c n2c ... nrc Cc
1 n11 n21 ... nr1 C1
Giả thuyết H0: Tiêu thức 1 và tiêu thức 2 độc lập
2
n(
ij
)E ij
j
E ,
2
Giá trị kiểm định:
ij
E
CR i n
ij
c r 1i 1j
2
Bác bỏ H0:
2 ),1c)(1r(
165
VI.KIỂM ĐỊNH SỰ ĐỘC LẬP
Ví dụ: Một nghiên cứu được thực hiện nhằm xem xét mối liên hệ giữa giới tính và sự ưa thích các nhãn hiệu nước giải khát, một mẫu ngẫu nhiên 2.425 người tiêu dùng với các nhãn hiệu nước giải khát được ưa thích như sau. Kiểm định giả thuyết không có mối liên hệ nào giữa giới tính và sự ưa thích nhãn hiệu nước giải khát ở mức ý nghĩa 0,5%.
Giới tính Nhãn hiệu ưa thích
Coca Pepsi 7Up Tổng (Ri) Tổng (Ri)
Nam 599 599
Nữ 1826 1826
2 = 129,83
Tổng(Cj) Tổng(Cj) 308 (200) 502 (610) 810 810 177 (199) 627 (605) 804 804 114 (200) 697 (611) 811 811 2425 2425