TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ

EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH

CHƯƠNG 7

KIỂM ĐỊNH PHI THAM SỐ

Nội dung chính

7.1

Giới thiệu chung về kiểm phi tham số (Bài giảng video)

7.2

Kiểm định dấu và hạng Wilcoxon về trung vị một tổng thể (Bài giảng video)

7.3

Kiểm định tổng hạng Wilcoxon cho trung bình hai mẫu độc lập (Bài giảng video)

7.4

Kiểm định dấu và hạng Wilcoxon cho mẫu cặp (Bài giảng video)

7.5

Kiểm định Kruskal Wallis cho nhiều mẫu độc lập (Bài giảng video)

7.6

Kiểm định Chi-bình phương về tính độc lập

7.7

Kiểm định Chi-bình phương về sự phù hợp

7.8

Thực hành kiểm định phi tham số với SPSS

2

EM3230 Thống kê ứng dụng

7.1 Giới thiệu chung về kiểm định phi tham số

§ KN: Kiểm định phi tham số (non-parametric test) là loại kiểm định mà các đại lượng

đặc trưng của tổng thể hay của mẫu không có trong công thức tính đại lượng kiểm

định

§ Ứng dụng:

§ Dữ liệu định danh, dữ liệu thứ hạng

§ Dữ liệu không/ không chắc chắn có phân phối chuẩn/ bình thường

§ Cỡ mẫu nhỏ

§ Đặc điểm:

So với các kiểm định tham số, kiểm định phi tham số không mạnh bằng nhưng đơn

giản hơn.

3

EM3230 Thống kê ứng dụng

7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể

§ Bước 1: Lập giả thuyết và lựa chọn mức ý nghĩa

H0: Me=Me0 H1: Me≠ Me0

H0: Me≤ Me0 H1: Me> Me0

H0: Me≥Me0 H1: Me

§ Bước 2: Thu thập thông tin mẫu và tính toán chênh lệch di giữa từng giá trị quan sát

với giá trị trung vị giả thuyết

§ Bước 3: Loại bỏ các di =0 và xếp hạng các trị tuyệt đối của di

Nếu các có giá trị |di |bằng nhau thì tính hạng trung bình cho tất cả các quan sát có giá trị |di |bằng nhau này.

§ Bước 4: Tách các hạng vừa xếp thành 2 cột R+ (di dương), R- (di âm)

§ Bước 5: Tính giá trị thống kê và xác định miền bác bỏ

4

EM3230 Thống kê ứng dụng

7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể

§ Bước 5:

Ø TH mẫu nhỏ n£20

§ KĐ 2 bên: W= min[S(cột R+); S(cột R-)]

§ KĐ 1 bên: Bên phải: W= S(cột R+); Bên trái W=S(cột R-)

§ Miền bác bỏ: W£Wa. § Wa tra bảng số 6, n để tra là số lượng di ¹0. Chỉ dùng giá trị cận dưới vì KĐ này luôn

thực hiện ở bên trái.

Ø TH mẫu lớn n>20: Kiểm định Wilcoxon xấp xỉ pp bình thường

§ Giá trị kiểm định Z (n là số lượng di ¹0) § Miền bác bỏ:

Quan điểm theo sách Hoàng Trọng

𝑾 − 𝒏(𝒏 + 𝟏) 𝟒 𝒁 =

§ KĐ 1 bên: Z<-Z a § KĐ 2 bên: Z<-Z a /2

𝒏(𝒏 + 𝟏)(𝟐𝒏 + 𝟏) 𝟐𝟒

5

EM3230 Thống kê ứng dụng

7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể

§ Bước 5:

Quan điểm MBB khác

Giá trị thống kê

Miền bác bỏ

6

EM3230 Thống kê ứng dụng

7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể

Ví dụ:

§ Một ngẫu nhiên 16 thiếu niên được cho xem một bộ phim mới và đánh giá sự hồi hộp tại phần

kết của phim. Một thang đo từ 10 đến 50 được sử dụng với 10 nghĩ là không hồi hộp và 50

nghĩa là rất hấp dẫn. Nếu giá trị trung vị của điểm hấp dẫn là dưới 40, hãng phim sẽ phải làm lại

đoạn kết. Những kinh nghiệm trước đó cho thấy rằng điểm đánh giá kiểu này sẽ không có phân

phối chuẩn. Dùng mức ý nghĩa alpha=0.05 hãy kiểm định về trung vị của điểm hấp dẫn. Điểm

đánh giá cho 16 thiếu niên như sau:

44 24.8 38.2 40 32.5 26.4 31 30.2

36 40.5 34.5 26.6 36.0 40 42 49.8

7

EM3230 Thống kê ứng dụng

7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể

Lời giải

Quan điểm Sách Hoàng Trọng

§ Cặp giả thuyết

§ Đại lượng kiểm định

Bên trái W=S(cột R-)=85.5

H0: Me≥40 H1: Me<40

Tra bảng 6, n=14 (vì có 2 di=0)

Wa= (25; 80)

§ Miền bác bỏ W≤25

§ Chưa có cơ sở bác bỏ H0

0 0 0.5 1.8 2 4 4 4 5.5 7.5 9 9.8 9.8 13.4 13.6 15.2

8

EM3230 Thống kê ứng dụng

7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể

Quan điểm MBB khác

§ Lời giải

§ Cặp giả thuyết

§ Đại lượng kiểm định

Wstat= S(cột R+)= 19.5

H0: Me≥40 H1: Me<40

Tra bảng 6, n=14 (vì có 2 di=0)

Wa= (25; 80)

§ Miền bác bỏ W≤25

§ Có cơ sở bác bỏ H0

9

EM3230 Thống kê ứng dụng

7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập

§ Kiểm tra sự khác biệt của hai trung vị

BT 4 và 8 § Bước 1: Cặp giả thuyết, Me1 là trung vị của mẫu có cỡ mẫu nhỏ hơn

H0: Me1=Me2

H0: Me1≤ Me2

H0: Me1≥Me2

H1: Me1≠ Me2

H1: Me1> Me2

H1: Me1

§ Bước 2: Gộp các quan sát của cả 2 mẫu và xếp hạng từ nhỏ đến lớn. Nhỏ nhất

hạng 1, đồng hạng thì tính trung bình. Rồi tách thành hạng của từng mẫu

§ Bước 3: Tính giá trị kiểm định Wilcoxon T1 là tổng của các hạng trong mẫu có cỡ mẫu nhỏ hơn hoặc của 1 trong 2 mẫu trong trường hợp 2 mẫu có cỡ bằng nhau

§ Bước 4: Miền bác bỏ

10

EM3230 Thống kê ứng dụng

7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập

§ Bước 4: Miền bác bỏ

Ø TH mẫu nhỏ n1 và n2£10: Tra bang 7

§ KĐ 2 bên: T1³ giới hạn trên hoặc T1£ giới hạn dưới

§ KĐ Bên phải: T1³ giới hạn trên; Bên trái T1£ giới hạn dưới

Ø TH mẫu lớn (n1 hoặc n2 lớn hơn 10)

§ T1 xấp xỉ pp bình thường

)1

)1

+

µ- T 1

z

=

=

=

§ Giá trị kiểm định Z

Ts

1

1

T 1 s

nnn . 2 ( 1 12

nn (1 + 2

T 1

§

(n=n1+n2)

§ n1 là cỡ mẫu của mẫu có cỡ nhỏ hơn, tương tự T1

§ MBB tương tự các KĐ Z khác

11

EM3230 Thống kê ứng dụng

7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập

§ Ví dụ

§ Một phương pháp sản xuất piston mới vừa được đề xuất. Để kiểm tra xem phương

pháp mới có thực sự làm tăng sức nén của piston hay không, 12 mẫu pittong được làm

theo phương pháp mới và so sánh với 10 cái piston làm theo phương pháp thông

thường lâu nay. Sức nén được tính bằng pound/inch2 được thể hiện ở bảng dưới đây

Cũ 145 141 146 137 144 135 134 80 138 141

§ Biết sức nén không theo phân phối chuẩn. Xác định xem có phải phương pháp mới tạo

ra piston mạnh hơn hay không. Sử dụng mức ý nghĩa 0.05

Mới 145 150 148 143 138 145 141 142 146 139 136 140

12

EM3230 Thống kê ứng dụng

7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập

§ Cặp giả thuyết

H0: Me1≥ Me2

H1: Me1< Me2

§ Đại lượng kiểm định

Mẫu lớn, T1=91.5, n1=10

µ- T 1

𝝁T= 115

z

=

T 1 s

T 1

𝝈T= 15.166

)1

Z=-1.55

=

1

nn (1 + 2

§ MBB: Z<-1.645

)1

+

=

Ts

1

nnn . 2 ( 1 12

KL: Chưa có đủ

cơ sở bác bỏ H0

13

EM3230 Thống kê ứng dụng

7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp

§ Bước 1: Các cặp giả thuyết

BT 1 và 11

H0: MD=0 H1: MD≠ 0

H0: MD≤ 0 H1: MD> 0

H0: MD≥0 H1: MD<0

§ Bước 2: Xác định sự khác biệt Di.

Khi đó cỡ mẫu thực tế n’= n - số lượng các quan sát có Di=0

§ Bước 3: Xếp hạng từ bé đến lớn giá trị tuyệt đối của các khác biệt nếu có các giá trị bằng

nhau thì hạng của chúng là hạng trung bình

(+)

§ Bước 4: Tính đại lượng kiểm định W= åRi

§ Bước 5: Quy tắc ra quyết định

§ Mẫu bé n’≤20:

§ Mẫu lớn n’>20:

14

EM3230 Thống kê ứng dụng

7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp

§ Bước 5: Quy tắc ra quyết định

Mẫu bé n’≤20: Tra bảng phụ lục 6, bác bỏ H0 nếu:

KĐ 2 bên

KĐ bên phải

KĐ bên trái

W ≥giới hạn trên

W ≤ giới hạn dưới

W ≥giới hạn trên hoặc W ≤ giới hạn dưới

§ Mẫu lớn n’>20: W phân phối xấp xỉ PP bình thường

W

nn

n

+

+

z

=

=

=

ws

µ- w s w

)1'2)(1'(' 24

nn )1'(' + 4

KĐ 2 bên

KĐ bên phải

KĐ bên trái

Z>Za/2 hoặc Z<- Za/2

Z> Za

Z<- Za

15

EM3230 Thống kê ứng dụng

7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp

Ví dụ:

§ Cặp giả thuyết:

Đánh giá Xếp hạng Ri

KH thử (+) (-) Khác biệt Di SP gốc SP mới

A 6 8 +2 3

§ H0: MD≤ 0 § H1: MD> 0 § Đại lượng KĐ:

B 4 9 +5 6

§ W=25

C 5 4 -1 1,5

§

n’=7 mẫu bé

D 8 7 -1 1,5

§ Chọn mức a =0,05

E 3 9 +6 7

§ Giới hạn trên =25

F 6 9 +3 4

§ Giới hạn dưới =3

G 7 7 0

(+)=25 .

H 5 9 +4 5

§ W=åRi Có đủ bằng chứng thống kê để bác bỏ H0 với độ tin cậy 95%.

25 3

16

EM3230 Thống kê ứng dụng

7.5 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập

TH áp dụng: Áp dụng cho trường hợp các nhóm so sánh không chắc chắn có pp bình thường và phương sai bằng nhau (Điều kiện áp dụng ANOVA)

Ho: μ1 = μ2 =….=μk

Các bước thực hiện

§ Gộp dữ liệu của k nhóm tương tự phần 9.3.

§ Xếp hạng liên tục tất cả các quan sát của k nhóm, sau đó phân bổ hang về các nhóm

§ Đặt n=n1+n2+..+nk

§ R1, R2,… Rk là tổng các hạng ở từng mẫu được sắp xếp theo thứ tự của k mẫu

k

§ Chỉ tiêu kiểm định W

W

(3

n

)1

=

-

+

&

å

nn (

)1

2 R i ni

12 +

§ Miền bác bỏ W>𝜒!"#,%

i

1

=

17

EM3230 Thống kê ứng dụng

7.5 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập

§ Áp dụng cho trường hợp các nhóm so sánh không chắc chắn có pp bình thường và

phương sai bằng nhau (Điều kiện áp dụng ANOVA)

§ Xếp hạng liên tục các quan sát của k nhóm gộp lại

§ Đặt n=n1+n2+..+nk

§ R1, R2,… Rk là tổng các hạng ở từng mẫu được sắp xếp theo thứ tự của k mẫu

k

§ Ho: μ1 = μ 2 =….=μ k

W

(3

n

)1

=

-

+

å

§ Chỉ tiêu kiểm định W

nn (

)1

2 R i ni

12 +

i

1

=

&

§ Miền bác bỏ W>𝜒!"#,%

18

EM3230 Thống kê ứng dụng

7.6 Kiểm định Chi-bình phương về tính độc lập

§ KN: Là dạng kiểm định phi tham số xem có mối liên hệ giữa hai biến/ hiện tượng hay không?

Percentages Based on Grand Total

Male Female Col. Totals

TV Radio 175 280 275 115 450 395

NP Row Totals 760 305 560 170 1320 475

25.0

20.0

Male

15.0

Female

10.0

e g a t n e c r e P

5.0

0.0

TV

NP

Radio

Media

19

EM3230 Thống kê ứng dụng

7.6 Kiểm định Chi-bình phương về tính độc lập

§ Các bước kiểm định

Bước 1: Đặt giả thuyết: H0: Không có mối liên hệ giữa 2 biến/ hiện tượng

H1: Có mối liên hệ giữa hai biến/ hiện tượng

Bước 2: Lập bảng tổng hợp các quan sát được chia thành r hàng và c cột.

Phân tổ theo tiêu thức thứ nhất Cộng

…. 1 2 3 c

là số quan sát rơi

1 O11 O12 O13 O1c R1

Oij vào hàng i cột j

2 O21 O22 O23 O2c R2 Phân tổ theo tiêu thức thứ hai

3 O21 O22 O23 O2c R3

Ri là tổng số quan sát ở hàng I

….

r Or1 Or2 Or3 Orc Rr

Cj là tổng số quan sát ở cột j

Cộng n C1 C2 C3 Cc

20

EM3230 Thống kê ứng dụng

7.6 Kiểm định Chi-bình phương về tính độc lập

§ Bước 3: Tính tần số lý thuyết Eij theo giả thuyết H0

xCR i

j

E ji =

n

§ Bước 4: Đại lượng kiểm định:

2

r

c

)

-

( O ji

E ji

2 c

=

åå

i

j

1 =

1 =

E ji

§ Bước 5: Quy tắc ra quyết định

§

Miền bác bỏ:

2

2

(r

1)(c -

α1); -

χ

χ

>

BT 9, 10

21

EM3230 Thống kê ứng dụng

7.6 Kiểm định Chi-bình phương về tính độc lập

Ví dụ:

§

300 công nhân của một công ty đã được lấy ngẫu nhiên và được hỏi xem liệu họ có đồng ý với

việc triển khai chính sách tiền lương mới hay không. Bảng sau chỉ ra các quan điểm và các loại

cán bộ nhân viên khác nhau trong công ty:

Sản xuất Bán hàng Quản lý

Quan điểm Đồng ý Lưỡng lự Phản đối 42 36 12

9 11 10

89 53 38

§ Hãy kiểm định xem liệu có bằng chứng về mối liên hệ giữa quan điểm và các bộ phận khác nhau

trong công ty hay không sử dụng mức ý nghĩa 5%.

Bộ phận

22

EM3230 Thống kê ứng dụng

7.6 Kiểm định Chi-bình phương về tính độc lập

Lời giải

v Cặp giả thuyết cần kiểm định:

§ H0: Không có mối liên hệ giữa các bộ phận và quan điểm của các bộ phận đó § H1: Có mối liên hệ giữa các bộ phận và quan điểm của các bộ phận đó

v Tính Eij:

xCR i

j

Quan điểm Cộng

E ji =

n

Đồng ý Lưỡng lự Phản đối

Sản xuất 89 84 42 42 9 14 140

140

180

Bán hàng 53 60 36 30 11 10 Bộ phận 100

84

=

=E 11

´ 300

Quản lý 38 36 12 18 10 6 60

Cộng 180 90 30 300

23

EM3230 Thống kê ứng dụng

7.6 Kiểm định Chi-bình phương về tính độc lập

Lời giải (tiếp)

v Tính đại lượng kiểm định:

2

r

c

)

-

O ( ji

E ji

,8

9778

2 c

=

= åå

i

j

1 =

1 =

E ji

=9.4877

v Quy tắc ra quyết định. Mức ý nghĩa 0.05 ; c2

(r-1)(c-1)

à Chưa có cơ sở bác bỏ H0

v Kết luận: Với mức ý nghĩa 5% chưa có đủ bằng chứng thống kê để nói rằng giữa các bộ phận

và quan điểm của các bộ phận đó có mối liên hệ với nhau.

24

EM3230 Thống kê ứng dụng

7.7 Kiểm định Chi-bình phương về sự phù hợp

Mục tiêu: Kiểm tra xem dữ liệu thu thập được có phù hợp giả thiết về phân phối của tổng thể. Thường là PP đều và PP chuẩn

BT 5,6,7

2

2

Các bước kiểm định: Bước 1: Đặt giả thuyết H0: Dữ liệu phân phối đúng theo phân phối giả thuyết H1: Dữ liệu không tuân theo phân phối giả thuyết Bước 2: Đại lượng kiểm định § Giả sử 1 mẫu ngẫu nhiên n quan sát được phân tổ thành k nhóm § Gọi Oi là số quan sát rơi vào nhóm i § Gọi Ei là tần số lý thuyết rơi vào nhóm i § Đại lượng kiểm định (điều kiện Ei≥5), nếu Ei<5, cần chia lại tổ Bước 3: : Quy tắc ra quyết định

(k

α1); -

χ

χ

>

Miền bác bỏ

Hoặc

2

-h-(k

α1);

χ

2 χ >

h là số tham số (không có thông tin từ tổng thể) cần ước lượng từ mẫu

25

EM3230 Thống kê ứng dụng

Tham khảo: Kiểm định Mann-Whitney

KN: là phương pháp kiểm định dựa trên việc xếp hạng các giá trị của 2 mẫu độc lập

Các bước thực hiện:

§

Bước 1: Xếp hạng từ bé đến lớn giá trị của các giá trị của từng mẫu nếu có các giá trị bằng nhau thì hạng của chúng là hạng trung bình

§

Bước 2: Tính tổng hạng R1 và R2.

)1

+

)1

+

§

Bước 3: Tính đại lượng

U

=

+

-

-

2

nn 21

R 1

RU = 1

1

nn ( 1 1 2

nn ( 1 1 2

§

Kiểm định 2 bên:

min(

)

U =

1 UU ,

2

§

Kiểm định 1 bên lấy U của tổng thể bé hơn trong H1

§ Đối với mẫu lớn >10, tính giá trị thống kê

)1

U

+

n 2

z

=

=

U =µ

Us

21nn 2

nnn ( + 21 1 12

µ- U s U

§

Bước 4: Quy tắc ra quyết định

26

EM3230 Thống kê ứng dụng

Tham khảo: Kiểm định Mann-Whitney

§ Bước 4: Quy tắc ra quyết định

§ Mẫu bé n1 và n2≤10: Tra bảng phụ lục số 7 , bác bỏ H0 nếu:

H0: Me1=Me2 H1: Me1≠ Me2 H0: Me1≤ Me2 H1: Me1> Me2 H0: Me1≥Me2 H1: Me1

U ≥giới hạn trên U ≤ giới hạn dưới

§ Mẫu lớn >10: bác bỏ H0 nếu:

U ≥giới hạn trên hoặc U ≤ giới hạn dưới

z> Za

z<- Za

z> Za/2 hoặc z<- Za/2

H0: Me1=Me2 H1: Me1≠ Me2 H0: Me1≤ Me2 H1: Me1> Me2 H0: Me1≥Me2 H1: Me1

27

EM3230 Thống kê ứng dụng

Tham khảo: Kiểm định Mann-Whitney

Ví dụ:

§ Một cửa hàng bán đồ ăn ngon trên phố buôn bán lớn thường hàng miễn phí vào các thứ

ngày 7, và cửa hàng muốn kiểm tra xem liệu có tác động đáng kể đến doanh thu hay không. Một mẫu ngẫu nhiên gồm 25 ngày thứ bảy đưa ra các con số về doanh thu như sau:

18 21 23 15 19 26 17 18 22 20 18 21 27 Những ngày có khuyến mại

§ Với mức ý nghĩa 0,05, hãy kiểm định xem liệu khuyến mại vào ngày thứ 7 có tạo ra sự khác

biệt về doanh thu hay không?

Những ngày khác 22 17 15 23 25 20 26 24 16 17 23 21

28

EM3230 Thống kê ứng dụng

Tham khảo: Kiểm định Mann-Whitney

Lời giải

§ Cặp giả thuyết thống kê: H0: Me1= Me2

§

H1: Me1≠ Me2

Những ngày có khuyến mại

Xếp hạng

18 21 23 15 19 26 17 18 22 20 18 21 27 Cộng

4 8,5 11 1 6 12 2 4 10 7 4 8,5 13 R2=91

Những ngày khác

Xếp hạng

22 17 15 23 25 20 26 24 16 17 23 21

)1

+

)1

+

U

156

=

+

-

=

2

nn 21

R 1

0

-

=

RU = 1

1

7 3,5 1 8,5 11 5 12 10 2 3,5 8,5 R1=78

nn ( 1 1 2

)1

+

n 2

38,18

=

=

78

=

=

U

min(

=

0) =

Us

UU , 1

2

nnn ( + 1 21 12

nn 21 2

6 nn ( 1 1 2

29

EM3230 Thống kê ứng dụng

Tham khảo: Kiểm định Mann-Whitney

§ Đại lượng kiểm định:

U

µ U

z

24,4

=

=

-=

0 78 - 38,18

- s U

- Miền bác bỏ : z> Za/2 hoặc z<- Za/2 với Za= Z0,025=1,96

- Kết luận: Với mức ý nghĩa 5%, có cơ sở bác bỏ H0

Hay khuyến mại vào ngày thứ 7 có tạo ra sự khác biệt về doanh thu

30

EM3230 Thống kê ứng dụng

7.8 Thực hành kiểm định phi tham số với SPSS

§

(Sinh viên thực hiện theo hướng dẫn của giảng viên trên lớp)

31

EM3230 Thống kê ứng dụng

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ

CHÚC CÁC BẠN HỌC TỐT