NGUYÊN LÝ THỐNG KÊ KINH TẾ<br />
ThS. Hứa Thanh Xuân<br />
<br />
Phần dành cho đơn vị<br />
<br />
CHƯƠNG 8: KIỂM ĐỊNH PHI THAM SỐ<br />
• Điều kiện áp dụng:<br />
- Không đòi hỏi phân phối tổng thể là chuẩn.<br />
- Dữ liệu ở dạng tần số hoặc số đếm.<br />
• Các dạng kiểm định phi tham số:<br />
– Kiểm định Wilcoxon (Kiểm định T).<br />
– Kiểm định Mann-Whitney.<br />
– Kiểm định Kruskal – Wallis.<br />
– Kiểm định sự phù hợp.<br />
– Kiểm định sự độc lập.<br />
98<br />
<br />
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)<br />
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)<br />
<br />
• Trường hợp mẫu nhỏ: n 20<br />
Bước 1: Đặt giả thuyết:<br />
<br />
H 0 : 1 2 0<br />
<br />
H1 : 1 2 0<br />
Bước 2: Tính giá trị kiểm định:<br />
- Tính sự chênh lệch giữa các cặp: di = xi – yi<br />
- Xếp hạng các dI trong giá trị tuyệt đối di<br />
- Tìm tổng hạng của di mang dấu dương + và<br />
tổng hạng của di mang dấu âm -.<br />
- Giá trị kiểm định (T): T = min ( + ; -).<br />
Bước 3: Điều kiện bác bỏ H0: T < Tn;<br />
99<br />
<br />
1<br />
<br />
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)<br />
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)<br />
<br />
Ví dụ 8.1: Trong tháng trước và sau Noel, số<br />
lượng người mua sắm quần áo tại 11 cửa hàng<br />
trong thành phố như sau:<br />
7<br />
<br />
8<br />
<br />
9<br />
<br />
10<br />
<br />
11<br />
<br />
Trước Noel 56 105 30 46 85 115 89<br />
<br />
72<br />
<br />
60 150<br />
<br />
97<br />
<br />
70<br />
<br />
55 145<br />
<br />
97<br />
<br />
Cửa hàng<br />
Sau Noel<br />
<br />
1<br />
<br />
2<br />
<br />
50<br />
<br />
95<br />
<br />
3<br />
<br />
4<br />
<br />
5<br />
<br />
6<br />
<br />
30 58 75 105 89<br />
<br />
Với mức ý nghĩa 5%, hãy kiểm định xem số lượt<br />
người mua sằm quần áo trước và sau Noel có thực<br />
sự khác nhau không?<br />
100<br />
<br />
KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T)<br />
(So sánh TB 2 tổng thể-Phương pháp so sánh cặp)<br />
<br />
• Trường hợp mẫu lớn: n > 20<br />
Bước 1: Đặt giả thuyết: có thể đặt ở dạng 1 đuôi hoặc<br />
2 đuôi.<br />
T T<br />
Bước 2: Giá trị kiểm định: Z <br />
T<br />
Với<br />
n( n 1)(2 n 1)<br />
n( n 1)<br />
2T <br />
T <br />
24<br />
4<br />
Bước 3: Bác bỏ H0 khi:<br />
- Kiểm định dạng “1 đuôi”: Z < - Z<br />
- Kiểm định dạng “2 đuôi”: Z < - Z/2.<br />
101<br />
<br />
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)<br />
(So sánh TB 2 tổng thể-Phương pháp độc lập)<br />
1. Trường hợp mẫu nhỏ: n1, n2 10; n1 < n2<br />
Bước 1: Đặt giả thuyết: như các trường hợp trên<br />
Bước 2: Tính giá trị kiểm định:<br />
- Xếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần.<br />
Những giá trị bằng nhau sẽ nhận giá trị trung bình<br />
- Cộng các hạng của tất cả các giá trị ở mẫu thứ nhất, ký<br />
hiệu là R1.<br />
- Giá trị kiểm định: U n n n 1 ( n 1 1) R<br />
1<br />
<br />
2<br />
<br />
2<br />
<br />
1<br />
<br />
Bước 3: Tra bảng phân phối để tìm F (U) = Fn1,n2 (U)<br />
Bước 4: Giả thuyết H0 bị bác bỏ khi: > p = 2 F(U).<br />
Lưu ý:<br />
n (n 1)<br />
<br />
<br />
R<br />
<br />
2<br />
<br />
102<br />
<br />
2<br />
<br />
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)<br />
(So sánh TB 2 tổng thể-Phương pháp độc lập)<br />
Ví dụ 8.2: Chúng ta muốn so sánh lương khởi điểm<br />
của sinh viên tốt nghiệp ở ngành kinh tế với điện tử tin<br />
học được trả bởi các công ty như sau: (100.000đ)<br />
Điện tử tin học<br />
Kinh tế<br />
<br />
15 18 27 30 24<br />
17 22 24 12 28 30 14 18 25 22<br />
<br />
Có thể kết luận tiền lương khởi điểm của 2 nhóm là<br />
khác nhau không?<br />
<br />
103<br />
<br />
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)<br />
(So sánh TB 2 tổng thể-Phương pháp độc lập)<br />
<br />
2. Trường hợp mẫu lớn: n1, n2 > 10<br />
Đặt giả thuyết<br />
<br />
1 đuôi; phải<br />
<br />
1 đuôi trái<br />
<br />
H 0 : 1 2<br />
<br />
H 1 : 1 2<br />
<br />
H 0 : 1 2<br />
<br />
H 1 : 1 2<br />
<br />
GTKĐ<br />
<br />
Z<br />
<br />
Bác bỏ H0<br />
Với<br />
<br />
| Z |> Z<br />
<br />
n n<br />
U 1 2<br />
2<br />
<br />
2 đuôi<br />
H 0 : 1 2<br />
<br />
H 1 : 1 2<br />
<br />
U U<br />
U<br />
<br />
| Z |> Z/2<br />
<br />
n n ( n n 2 1)<br />
2<br />
U<br />
1 2 1<br />
12<br />
<br />
104<br />
<br />
KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U)<br />
(So sánh TB 2 tổng thể-Phương pháp độc lập)<br />
<br />
Ví dụ 8.3: Trở lại vấn đề tiền lương khởi điểm<br />
của hai ngành kinh tế và điện tử tin học. Mỗi<br />
ngành chọn ngẫu nhiên 80 sinh viên và sau đó<br />
tiền lương được xếp hạng từ nhỏ đến lớn, và<br />
tổng cộng hạng được xếp cho tiền lương của<br />
ngành kinh tế bằng 7.287.<br />
<br />
105<br />
<br />
3<br />
<br />
KIỂM ĐỊNH KRUSKAL WALLIS<br />
(So sánh TB nhiều tổng thể)<br />
Bước 1: Đặt giả thuyết<br />
H0: Trung bình của k tổng thể thì giống nhau.<br />
H1: Trung bình của k tổng thể thì khác nhau.<br />
Bước 2: Xếp hạng tất cả các giá trị quan sát của k mẫu<br />
theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận<br />
giá trị trung bình.<br />
Bước 3: Cộng các hạng của tất cả các giá trị ở từng mẫu<br />
lại, ký hiệu là R1, R2, …, Rk (Lưu ý: ∑R = [n*(n+1)] / 2).<br />
Bước 4: Giá trị kiểm định:<br />
2<br />
k Ri<br />
12<br />
<br />
W<br />
3(n 1)<br />
n * (n 1) i 1 n i<br />
Bước 5: Bác bỏ H0 nếu<br />
W 2k 1 ;<br />
106<br />
<br />
KIỂM ĐỊNH KRUSKAL WALLIS<br />
(So sánh TB nhiều tổng thể)<br />
Ví dụ 8.4:<br />
Để so sánh chi phí quảng cáo trên 4 tờ báo khác nhau<br />
(với điều kiện nội dung quảng cáo là như nhau), người<br />
ta lấy mẫu trên các tờ báo và thu được các kết quả<br />
sau (đơn vị: ngàn đồng)<br />
Báo A: 57 65 50 45 70 62 68.<br />
Báo B: 72 81 64 55 75.<br />
Báo C: 35 42 58 46 59 60 61 38.<br />
Báo D: 73 92 68 85 82 94 62.<br />
Yêu cầu: hãy kiểm định có sự khác biệt về chi phí<br />
quảng cáo giữa các tờ báo nói trên hay không ở mức ý<br />
nghĩa 5%.<br />
107<br />
<br />
KIỂM ĐỊNH SỰ PHÙ HỢP<br />
• Bài toán tổng quát:<br />
Giả sử có mẫu ngẫu nhiên n quan sát, được<br />
chia thành k nhóm khác nhau: mỗi quan sát<br />
phải và chỉ thuộc về một nhóm thứ i nào đó ( i<br />
= 1,2, … , k).<br />
Gọi Oi là số lượng quan sát ở nhóm thứ i.<br />
Kiểm định giả thuyết H0 về phân phối của tổng<br />
thể (hay giả thuyết H0 thể hiện các xác suất pi<br />
để một quan sát nào đó thuộc về nhóm thứ i.<br />
108<br />
<br />
4<br />
<br />
KIỂM ĐỊNH SỰ PHÙ HỢP<br />
Bước 1: Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp<br />
giả thuyết H0 đúng, nghĩa là tính các giá trị mong muốn Ei- theo công<br />
thức: Ei = npi (Ei 5).<br />
Nhóm<br />
<br />
1<br />
<br />
2<br />
<br />
…<br />
<br />
k<br />
<br />
<br />
<br />
Giá trị thực tế (Oi)<br />
XS theo giả thuyết H0<br />
( pi)<br />
Giá trị mong muốn<br />
(Ei)<br />
<br />
O1<br />
p1<br />
<br />
O2<br />
p2<br />
<br />
…<br />
…<br />
<br />
Oi<br />
pi<br />
<br />
n<br />
1<br />
<br />
E1 = np1<br />
<br />
E2 = np2<br />
<br />
…<br />
<br />
Ei = npi<br />
<br />
n<br />
<br />
Bước 2: Tính giá trị kiểm định:<br />
<br />
k (O E ) 2<br />
i<br />
i<br />
<br />
2 <br />
<br />
<br />
<br />
Ei<br />
<br />
i 1<br />
<br />
2<br />
<br />
2k 1, <br />
<br />
Bước 3: Bác bỏ giả thuyết H0 khi:<br />
<br />
109<br />
<br />
KIỂM ĐỊNH SỰ PHÙ HỢP<br />
• Ví dụ 8.5 (bài tổng hợp 6):<br />
Nhãn hiệu<br />
<br />
Nokia<br />
<br />
Samsung<br />
<br />
Số lượng khách<br />
chọn (người)<br />
<br />
54<br />
<br />
66<br />
<br />
Sony<br />
Ericsson<br />
29<br />
<br />
Lg<br />
<br />
Tổng<br />
<br />
31<br />
<br />
180<br />
<br />
Với mức ý nghĩa 5%, có thể kết luận sở thích của người<br />
tiêu dùng đối với 4 nhãn hiệu điện thoại di động trên là<br />
khác nhau hay không?<br />
<br />
110<br />
<br />
KIỂM ĐỊNH SỰ ĐỘC LẬP<br />
Bài toán tổng quát:<br />
• Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân<br />
nhóm kết hợp 2 tiêu thức với nhau, hình thành nên bảng<br />
tiếp liên gồm r hàng (row) và c cột (column).<br />
• Gọi Oij là số quan sát ứng với hàng thứ i và cột thứ j .<br />
• Ri là tổng số quan sát ở hàng thứ i .<br />
• Cj là tổng số quan sát ở cột thứ j .<br />
Phân nhóm theo<br />
tiêu thức thứ 2<br />
<br />
1<br />
<br />
Phân nhóm theo tiêu thức thứ 1<br />
2<br />
<br />
…<br />
<br />
…<br />
<br />
c<br />
<br />
<br />
<br />
1<br />
<br />
O11<br />
<br />
O12<br />
<br />
…<br />
<br />
…<br />
<br />
O1c<br />
<br />
R1<br />
R2<br />
<br />
2<br />
<br />
O21<br />
<br />
O22<br />
<br />
…<br />
<br />
…<br />
<br />
O2c<br />
<br />
…<br />
<br />
…<br />
<br />
…<br />
<br />
…<br />
<br />
…<br />
<br />
…<br />
<br />
…<br />
<br />
r<br />
<br />
Or1<br />
<br />
Or2<br />
<br />
…<br />
<br />
…<br />
<br />
Orc<br />
<br />
Rr<br />
<br />
<br />
<br />
C1<br />
<br />
C2<br />
<br />
…<br />
<br />
…<br />
<br />
Cc<br />
<br />
n<br />
<br />
111<br />
<br />
5<br />
<br />