NGUYÊN LÝ THỐNG KÊ KINH TẾ

ThS. Hứa Thanh Xuân

Phần dành cho đơn vị

CHƯƠNG 8: KIỂM ĐỊNH PHI THAM SỐ

• Điều kiện áp dụng:

- Không đòi hỏi phân phối tổng thể là chuẩn. - Dữ liệu ở dạng tần số hoặc số đếm.

• Các dạng kiểm định phi tham số:

– Kiểm định Wilcoxon (Kiểm định T). – Kiểm định Mann-Whitney. – Kiểm định Kruskal – Wallis. – Kiểm định sự phù hợp. – Kiểm định sự độc lập.

98

KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp)

• Trường hợp mẫu nhỏ: n  20

0



H

2

0

1

:

0



  

1

H 1

Bước 1: Đặt giả thuyết: :

2 Bước 2: Tính giá trị kiểm định:

99

- Tính sự chênh lệch giữa các cặp: di = xi – yi - Xếp hạng các dI trong giá trị tuyệt đối di - Tìm tổng hạng của di mang dấu dương  + và tổng hạng của di mang dấu âm  -. - Giá trị kiểm định (T): T = min ( + ; -). Bước 3: Điều kiện bác bỏ H0: T < Tn;

1

KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp)

Ví dụ 8.1: Trong tháng trước và sau Noel, số lượng người mua sắm quần áo tại 11 cửa hàng trong thành phố như sau:

11

1

2

3

4

5

6

7

8

9

10

Cửa hàng

97

56

105

30

46

85

115

89

72

60

150

Trước Noel

97

Sau Noel

50

95

30

58

75

105

89

70

55

145

Với mức ý nghĩa 5%, hãy kiểm định xem số lượt người mua sằm quần áo trước và sau Noel có thực sự khác nhau không?

100

KIỂM ĐỊNH WILCOXON (KIỂM ĐỊNH T) (So sánh TB 2 tổng thể-Phương pháp so sánh cặp)

• Trường hợp mẫu lớn: n > 20

T

T

Z

 

T n(n

) 1

1)

2  T

 T

n)( 21 24

n(n  4

Bước 1: Đặt giả thuyết: có thể đặt ở dạng 1 đuôi hoặc 2 đuôi. Bước 2: Giá trị kiểm định: Với

Bước 3: Bác bỏ H0 khi:

101

- Kiểm định dạng “1 đuôi”: Z < - Z - Kiểm định dạng “2 đuôi”: Z < - Z/2.

KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập)

1. Trường hợp mẫu nhỏ: n1, n2  10; n1 < n2

Bước 1: Đặt giả thuyết: như các trường hợp trên Bước 2: Tính giá trị kiểm định:

- Xếp hạng tất cả các giá trị của 2 mẫu theo thứ tự tăng dần.

Những giá trị bằng nhau sẽ nhận giá trị trung bình

- Cộng các hạng của tất cả các giá trị ở mẫu thứ nhất, ký

hiệu là R1.

) 1

- Giá trị kiểm định:

nnU 

1

2

R 1

n(n 1 1 2

R 

Bước 3: Tra bảng phân phối để tìm F (U) = Fn1,n2 (U) Bước 4: Giả thuyết H0 bị bác bỏ khi:  > p = 2 F(U). Lưu ý: )1n(n  2

102

2

KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập)

Ví dụ 8.2: Chúng ta muốn so sánh lương khởi điểm của sinh viên tốt nghiệp ở ngành kinh tế với điện tử tin học được trả bởi các công ty như sau: (100.000đ)

15 17 18 22 27 24 30 12 24 28 30 14 18 25 22 Điện tử tin học Kinh tế

103

Có thể kết luận tiền lương khởi điểm của 2 nhóm là khác nhau không?

KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập)

2. Trường hợp mẫu lớn: n1, n2 > 10

; 



2



2

2

1 

1 

1

2

:H 0 :H 1

1 

  

1

2

:H  0  :H  1

:H 0 :H 1

1

2

  

U

1 đuôi phải 1 đuôi trái 2 đuôi Đặt giả thuyết

U

Z

 

U

GTKĐ

n

) 1

n(nn 21

2

Bác bỏ H0 | Z |> Z/2 | Z |> Z

U 

2  U

 1 12

21nn 2

104

Với

KIỂM ĐỊNH MANN-WHITNEY (KIỂM ĐỊNH U) (So sánh TB 2 tổng thể-Phương pháp độc lập)

Ví dụ 8.3: Trở lại vấn đề tiền lương khởi điểm của hai ngành kinh tế và điện tử tin học. Mỗi ngành chọn ngẫu nhiên 80 sinh viên và sau đó tiền lương được xếp hạng từ nhỏ đến lớn, và tổng cộng hạng được xếp cho tiền lương của ngành kinh tế bằng 7.287.

105

3

KIỂM ĐỊNH KRUSKAL WALLIS (So sánh TB nhiều tổng thể)

Bước 1: Đặt giả thuyết

H0: Trung bình của k tổng thể thì giống nhau. H1: Trung bình của k tổng thể thì khác nhau. Bước 2: Xếp hạng tất cả các giá trị quan sát của k mẫu theo thứ tự tăng dần. Những giá trị bằng nhau sẽ nhận giá trị trung bình.

R

2 i

W

)1n(3 

12 )1n(*n

n

k  1i 

i

Bước 3: Cộng các hạng của tất cả các giá trị ở từng mẫu lại, ký hiệu là R1, R2, …, Rk (Lưu ý: ∑R = [n*(n+1)] / 2). Bước 4: Giá trị kiểm định:

2 ;1kW 

106

Bước 5: Bác bỏ H0 nếu

KIỂM ĐỊNH KRUSKAL WALLIS (So sánh TB nhiều tổng thể)

Ví dụ 8.4: Để so sánh chi phí quảng cáo trên 4 tờ báo khác nhau (với điều kiện nội dung quảng cáo là như nhau), người ta lấy mẫu trên các tờ báo và thu được các kết quả sau (đơn vị: ngàn đồng)

Báo A: 57 65 50 45 70 62 68. Báo B: 72 81 64 55 75. Báo C: 35 42 58 46 59 60 61 38. Báo D: 73 92 68 85 82 94 62.

107

Yêu cầu: hãy kiểm định có sự khác biệt về chi phí quảng cáo giữa các tờ báo nói trên hay không ở mức ý nghĩa 5%.

KIỂM ĐỊNH SỰ PHÙ HỢP

• Bài toán tổng quát:

Giả sử có mẫu ngẫu nhiên n quan sát, được chia thành k nhóm khác nhau: mỗi quan sát phải và chỉ thuộc về một nhóm thứ i nào đó ( i = 1,2, … , k). Gọi Oi là số lượng quan sát ở nhóm thứ i. Kiểm định giả thuyết H0 về phân phối của tổng thể (hay giả thuyết H0 thể hiện các xác suất pi để một quan sát nào đó thuộc về nhóm thứ i.

108

4

KIỂM ĐỊNH SỰ PHÙ HỢP

Bước 1: Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp giả thuyết H0 đúng, nghĩa là tính các giá trị mong muốn Ei theo công thức: Ei = npi (Ei  5).

Nhóm

1

2

k

… …

n 1

O1 p1

O2 p2

Oi pi

n

Giá trị thực tế (Oi) XS theo giả thuyết H0 ( pi) Giá trị mong muốn

E2 = np2

Ei = npi

E1 = np1

(Ei)

2

Bước 2: Tính giá trị kiểm định:

O(

i

)E i

2 

 E

i

k  1  i

Bước 3: Bác bỏ giả thuyết H0 khi:

2 2  1 k ,

109

KIỂM ĐỊNH SỰ PHÙ HỢP

Nokia

Samsung

Lg

Nhãn hiệu

Tổng

Sony Ericsson

54

66

29

31

180

Số lượng khách chọn (người)

• Ví dụ 8.5 (bài tổng hợp 6):

110

Với mức ý nghĩa 5%, có thể kết luận sở thích của người tiêu dùng đối với 4 nhãn hiệu điện thoại di động trên là khác nhau hay không?

KIỂM ĐỊNH SỰ ĐỘC LẬP

Bài toán tổng quát: • Giả sử có mẫu ngẫu nhiên gồm n quan sát, được phân nhóm kết hợp 2 tiêu thức với nhau, hình thành nên bảng tiếp liên gồm r hàng (row) và c cột (column).

là số quan sát ứng với hàng thứ i và cột thứ j .

• Gọi Oij • Ri là tổng số quan sát ở hàng thứ i . • Cj là tổng số quan sát ở cột thứ j .

Phân nhóm theo tiêu thức thứ 1

Phân nhóm theo tiêu thức thứ 2

1

R1

2

R2

1 O11 O21 …

2 O12 O22 …

c O1c O2c …

r

Rr

n

111

Or1 C1

Or2 C2

Orc Cc

5

KIỂM ĐỊNH SỰ ĐỘC LẬP

- Bước 1: Đặt giả thuyết

R

j

C

E

ij

j

CR j n

H0 : Không có mối liên hệ giữa 2 tiêu thức. H1 : Tồn tại mối liên hệ giữa 2 tiêu thức. - Bước 2: Tính số lượng quan sát theo giả thuyết H0

j n - Bước 3: Tính GTKĐ:

2

O(

ij

)E ij

2 

E

r  1i 

c  1j 

ij

1  ),

1 c)(

2 2  r(

112

- Bước 4: Bác bỏ H0 nếu : Với có phân phối 2 với (r-1) (c-1) bậc tự do.

KIỂM ĐỊNH SỰ ĐỘC LẬP

Ví dụ 8.6: Nhãn hiệu ưa thích Giới tính Coca - Cola Pepsi 7 Up 

Nam 68 47 35 150 55 84 31 170 Nữ 123 131 66 320 

113

Với α = 5%, có thể kết luận có mối liên hệ giữa nhãn hiệu ưa thích và giới tính hay không?

6