TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH
CHƯƠNG 7
KIỂM ĐỊNH PHI THAM SỐ
Nội dung chính
7.1
Giới thiệu chung về kiểm phi tham số (Bài giảng video)
7.2
Kiểm định dấu và hạng Wilcoxon về trung vị một tổng thể (Bài giảng video)
7.3
Kiểm định tổng hạng Wilcoxon cho trung bình hai mẫu độc lập (Bài giảng video)
7.4
Kiểm định dấu và hạng Wilcoxon cho mẫu cặp (Bài giảng video)
7.5
Kiểm định Kruskal Wallis cho nhiều mẫu độc lập (Bài giảng video)
7.6
Kiểm định Chi-bình phương về tính độc lập
7.7
Kiểm định Chi-bình phương về sự phù hợp
7.8
Thực hành kiểm định phi tham số với SPSS
2
EM3230 Thống kê ứng dụng
7.1 Giới thiệu chung về kiểm định phi tham số
§ KN: Kiểm định phi tham số (non-parametric test) là loại kiểm định mà các đại lượng
đặc trưng của tổng thể hay của mẫu không có trong công thức tính đại lượng kiểm
định
§ Ứng dụng:
§ Dữ liệu định danh, dữ liệu thứ hạng
§ Dữ liệu không/ không chắc chắn có phân phối chuẩn/ bình thường
§ Cỡ mẫu nhỏ
§ Đặc điểm:
So với các kiểm định tham số, kiểm định phi tham số không mạnh bằng nhưng đơn
giản hơn.
3
EM3230 Thống kê ứng dụng
7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
§ Bước 1: Lập giả thuyết và lựa chọn mức ý nghĩa
H0: Me=Me0 H1: Me≠ Me0
H0: Me≤ Me0 H1: Me> Me0
H0: Me≥Me0
H1: Me § Bước 2: Thu thập thông tin mẫu và tính toán chênh lệch di giữa từng giá trị quan sát với giá trị trung vị giả thuyết § Bước 3: Loại bỏ các di =0 và xếp hạng các trị tuyệt đối của di Nếu các có giá trị |di |bằng nhau thì tính hạng trung bình cho tất cả các quan sát có
giá trị |di |bằng nhau này. § Bước 4: Tách các hạng vừa xếp thành 2 cột R+ (di dương), R- (di âm) § Bước 5: Tính giá trị thống kê và xác định miền bác bỏ EM3230 Thống kê ứng dụng § Bước 5: Ø TH mẫu nhỏ n£20 § KĐ 2 bên: W= min[S(cột R+); S(cột R-)] § KĐ 1 bên: Bên phải: W= S(cột R+); Bên trái W=S(cột R-) § Miền bác bỏ: W£Wa.
§ Wa tra bảng số 6, n để tra là số lượng di ¹0. Chỉ dùng giá trị cận dưới vì KĐ này luôn thực hiện ở bên trái. Ø TH mẫu lớn n>20: Kiểm định Wilcoxon xấp xỉ pp bình thường § Giá trị kiểm định Z (n là số lượng di ¹0)
§ Miền bác bỏ: Quan điểm theo sách Hoàng Trọng 𝑾 − 𝒏(𝒏 + 𝟏)
𝟒 𝒁 = § KĐ 1 bên: Z<-Z a
§ KĐ 2 bên: Z<-Z a /2 𝒏(𝒏 + 𝟏)(𝟐𝒏 + 𝟏)
𝟐𝟒 EM3230 Thống kê ứng dụng § Bước 5: Giá trị thống kê Miền bác bỏ EM3230 Thống kê ứng dụng § Một ngẫu nhiên 16 thiếu niên được cho xem một bộ phim mới và đánh giá sự hồi hộp tại phần kết của phim. Một thang đo từ 10 đến 50 được sử dụng với 10 nghĩ là không hồi hộp và 50 nghĩa là rất hấp dẫn. Nếu giá trị trung vị của điểm hấp dẫn là dưới 40, hãng phim sẽ phải làm lại đoạn kết. Những kinh nghiệm trước đó cho thấy rằng điểm đánh giá kiểu này sẽ không có phân phối chuẩn. Dùng mức ý nghĩa alpha=0.05 hãy kiểm định về trung vị của điểm hấp dẫn. Điểm đánh giá cho 16 thiếu niên như sau: 44 24.8 38.2 40 32.5 26.4 31 30.2 36 40.5 34.5 26.6 36.0 40 42 49.8 EM3230 Thống kê ứng dụng § Cặp giả thuyết § Đại lượng kiểm định Bên trái W=S(cột R-)=85.5 H0: Me≥40
H1: Me<40 Wa= (25; 80) § Miền bác bỏ W≤25 § Chưa có cơ sở bác bỏ H0 EM3230 Thống kê ứng dụng § Lời giải § Cặp giả thuyết § Đại lượng kiểm định Wstat= S(cột R+)= 19.5 H0: Me≥40
H1: Me<40 Wa= (25; 80) § Miền bác bỏ W≤25 § Có cơ sở bác bỏ H0 EM3230 Thống kê ứng dụng § Kiểm tra sự khác biệt của hai trung vị H0: Me1=Me2 H0: Me1≤ Me2 H0: Me1≥Me2 H1: Me1≠ Me2 H1: Me1> Me2 H1: Me1 § Bước 2: Gộp các quan sát của cả 2 mẫu và xếp hạng từ nhỏ đến lớn. Nhỏ nhất hạng 1, đồng hạng thì tính trung bình. Rồi tách thành hạng của từng mẫu § Bước 3: Tính giá trị kiểm định Wilcoxon T1 là tổng của các hạng trong mẫu có cỡ
mẫu nhỏ hơn hoặc của 1 trong 2 mẫu trong trường hợp 2 mẫu có cỡ bằng nhau § Bước 4: Miền bác bỏ EM3230 Thống kê ứng dụng § Bước 4: Miền bác bỏ Ø TH mẫu nhỏ n1 và n2£10: Tra bang 7 § KĐ 2 bên: T1³ giới hạn trên hoặc T1£ giới hạn dưới § KĐ Bên phải: T1³ giới hạn trên; Bên trái T1£ giới hạn dưới Ø TH mẫu lớn (n1 hoặc n2 lớn hơn 10) § T1 xấp xỉ pp bình thường )1 )1 + µ-
T
1 z = = = § Giá trị kiểm định Z Ts Tµ 1 1 T
1
s nnn
. 2
(
1
12 nn
(1
+
2 T
1 § (n=n1+n2) § n1 là cỡ mẫu của mẫu có cỡ nhỏ hơn, tương tự T1 § MBB tương tự các KĐ Z khác EM3230 Thống kê ứng dụng § Ví dụ § Một phương pháp sản xuất piston mới vừa được đề xuất. Để kiểm tra xem phương pháp mới có thực sự làm tăng sức nén của piston hay không, 12 mẫu pittong được làm theo phương pháp mới và so sánh với 10 cái piston làm theo phương pháp thông thường lâu nay. Sức nén được tính bằng pound/inch2 được thể hiện ở bảng dưới đây Cũ 145 141 146 137 144 135 134 80 138 141 § Biết sức nén không theo phân phối chuẩn. Xác định xem có phải phương pháp mới tạo ra piston mạnh hơn hay không. Sử dụng mức ý nghĩa 0.05 Mới 145 150 148 143 138 145 141 142 146 139 136 140 EM3230 Thống kê ứng dụng § Cặp giả thuyết § Đại lượng kiểm định µ-
T
1 𝝁T= 115 z = T
1
s T
1 𝝈T= 15.166 )1 = Tµ 1 nn
(1
+
2 § MBB: Z<-1.645 )1 + = Ts 1 nnn
. 2
(
1
12 EM3230 Thống kê ứng dụng § Bước 1: Các cặp giả thuyết H0: MD=0
H1: MD≠ 0 H0: MD≤ 0
H1: MD> 0 H0: MD≥0
H1: MD<0 § Bước 2: Xác định sự khác biệt Di. Khi đó cỡ mẫu thực tế n’= n - số lượng các quan sát có Di=0 § Bước 3: Xếp hạng từ bé đến lớn giá trị tuyệt đối của các khác biệt nếu có các giá trị bằng nhau thì hạng của chúng là hạng trung bình (+) § Bước 4: Tính đại lượng kiểm định W= åRi § Bước 5: Quy tắc ra quyết định § Mẫu bé n’≤20: § Mẫu lớn n’>20: EM3230 Thống kê ứng dụng § Bước 5: Quy tắc ra quyết định Mẫu bé n’≤20: Tra bảng phụ lục 6, bác bỏ H0 nếu: KĐ 2 bên KĐ bên phải KĐ bên trái W ≥giới hạn trên W ≤ giới hạn dưới W ≥giới hạn trên hoặc
W ≤ giới hạn dưới § Mẫu lớn n’>20: W phân phối xấp xỉ PP bình thường W nn n + + z = = = ws wµ µ-
w
s
w )1'2)(1'('
24 nn
)1'('
+
4 KĐ 2 bên KĐ bên phải KĐ bên trái Z>Za/2 hoặc Z<- Za/2 Z> Za Z<- Za EM3230 Thống kê ứng dụng § Cặp giả thuyết: Đánh giá Xếp hạng Ri KH
thử (+) (-) Khác
biệt
Di SP
gốc SP
mới A 6 8 +2 3 § H0: MD≤ 0
§ H1: MD> 0
§ Đại lượng KĐ: B 4 9 +5 6 § W=25 C 5 4 -1 1,5 § n’=7 mẫu bé D 8 7 -1 1,5 § Chọn mức a =0,05 E 3 9 +6 7 § Giới hạn trên =25 F 6 9 +3 4 § Giới hạn dưới =3 G 7 7 0 (+)=25 . H 5 9 +4 5 § W=åRi
Có đủ bằng chứng thống kê để bác bỏ H0 với độ tin cậy 95%. 25 3 EM3230 Thống kê ứng dụng Ho: μ1 = μ2 =….=μk § Gộp dữ liệu của k nhóm tương tự phần 9.3. § Xếp hạng liên tục tất cả các quan sát của k nhóm, sau đó phân bổ hang về các nhóm § Đặt n=n1+n2+..+nk § R1, R2,… Rk là tổng các hạng ở từng mẫu được sắp xếp theo thứ tự của k mẫu k § Chỉ tiêu kiểm định W W (3 n )1 = - + & nn
( )1 2
R
i
ni 12
+ § Miền bác bỏ W>𝜒!"#,% i 1 = EM3230 Thống kê ứng dụng § Áp dụng cho trường hợp các nhóm so sánh không chắc chắn có pp bình thường và phương sai bằng nhau (Điều kiện áp dụng ANOVA) § Xếp hạng liên tục các quan sát của k nhóm gộp lại § Đặt n=n1+n2+..+nk § R1, R2,… Rk là tổng các hạng ở từng mẫu được sắp xếp theo thứ tự của k mẫu k § Ho: μ1 = μ 2 =….=μ k W (3 n )1 = - + § Chỉ tiêu kiểm định W nn
( )1 2
R
i
ni 12
+ i 1 = & § Miền bác bỏ W>𝜒!"#,% EM3230 Thống kê ứng dụng § KN: Là dạng kiểm định phi tham số xem có mối liên hệ giữa hai biến/ hiện tượng hay không? Male
Female
Col. Totals TV Radio
175
280
275
115
450
395 NP Row Totals
760
305
560
170
1320
475 25.0 20.0 Male 15.0 Female 10.0 5.0 0.0 TV NP Radio EM3230 Thống kê ứng dụng § Các bước kiểm định H1: Có mối liên hệ giữa hai biến/ hiện tượng Phân tổ theo tiêu thức thứ nhất Cộng …. 1 2 3 c là số quan sát rơi 1 O11 O12 O13 O1c R1 Oij
vào hàng i cột j 2 O21 O22 O23 O2c R2 Phân tổ
theo
tiêu
thức
thứ hai 3 O21 O22 O23 O2c R3 Ri là tổng số quan
sát ở hàng I …. r Or1 Or2 Or3 Orc Rr Cj là tổng số quan
sát ở cột j Cộng n C1 C2 C3 Cc EM3230 Thống kê ứng dụng § Bước 3: Tính tần số lý thuyết Eij theo giả thuyết H0 xCR
i j E
ji = n § Bước 4: Đại lượng kiểm định: 2 r c ) - (
O
ji E
ji 2
c = i j 1
= 1
= E
ji § Bước 5: Quy tắc ra quyết định § Miền bác bỏ: 2 2 (r 1)(c
- α1);
- χ χ > EM3230 Thống kê ứng dụng § 300 công nhân của một công ty đã được lấy ngẫu nhiên và được hỏi xem liệu họ có đồng ý với việc triển khai chính sách tiền lương mới hay không. Bảng sau chỉ ra các quan điểm và các loại cán bộ nhân viên khác nhau trong công ty: Sản xuất
Bán hàng
Quản lý Quan điểm
Đồng ý Lưỡng lự Phản đối
42
36
12 9
11
10 89
53
38 § Hãy kiểm định xem liệu có bằng chứng về mối liên hệ giữa quan điểm và các bộ phận khác nhau trong công ty hay không sử dụng mức ý nghĩa 5%. Bộ phận EM3230 Thống kê ứng dụng v Cặp giả thuyết cần kiểm định: § H0: Không có mối liên hệ giữa các bộ phận và quan điểm của các bộ phận đó
§ H1: Có mối liên hệ giữa các bộ phận và quan điểm của các bộ phận đó v Tính Eij: xCR
i j Quan điểm Cộng E
ji = n Đồng ý Lưỡng lự Phản đối Sản xuất 89 84 42 42 9 14 140 140 180 Bán hàng 53 60 36 30 11 10 Bộ phận 100 84 = =E
11 ´
300 Quản lý 38 36 12 18 10 6 60 Cộng 180 90 30 300 EM3230 Thống kê ứng dụng v Tính đại lượng kiểm định: 2 r c ) - O
(
ji E
ji ,8 9778 2
c = = åå i j 1
= 1
= E
ji =9.4877 v Quy tắc ra quyết định. Mức ý nghĩa 0.05 ; c2 (r-1)(c-1) à Chưa có cơ sở bác bỏ H0 v Kết luận: Với mức ý nghĩa 5% chưa có đủ bằng chứng thống kê để nói rằng giữa các bộ phận và quan điểm của các bộ phận đó có mối liên hệ với nhau. EM3230 Thống kê ứng dụng Mục tiêu: Kiểm tra xem dữ liệu thu thập được có phù hợp giả thiết về phân phối của tổng thể.
Thường là PP đều và PP chuẩn 2 2 Các bước kiểm định:
Bước 1: Đặt giả thuyết
H0: Dữ liệu phân phối đúng theo phân phối giả thuyết
H1: Dữ liệu không tuân theo phân phối giả thuyết
Bước 2: Đại lượng kiểm định
§ Giả sử 1 mẫu ngẫu nhiên n quan sát được phân tổ thành k nhóm
§ Gọi Oi là số quan sát rơi vào nhóm i
§ Gọi Ei là tần số lý thuyết rơi vào nhóm i
§ Đại lượng kiểm định (điều kiện Ei≥5), nếu Ei<5, cần chia lại tổ
Bước 3: : Quy tắc ra quyết định (k α1);
- χ χ > Miền bác bỏ Hoặc 2 -h-(k α1); χ 2
χ > h là số tham số (không có thông tin từ tổng
thể) cần ước lượng từ mẫu EM3230 Thống kê ứng dụng KN: là phương pháp kiểm định dựa trên việc xếp hạng các giá trị của 2 mẫu độc lập Các bước thực hiện: § Bước 1: Xếp hạng từ bé đến lớn giá trị của các giá trị của từng mẫu nếu có các giá trị bằng nhau thì
hạng của chúng là hạng trung bình § Bước 2: Tính tổng hạng R1 và R2. )1 + )1 + § Bước 3: Tính đại lượng U = + - - 2 nn
21 R
1 RU
=
1 1 nn
(
1
1
2 nn
( 1
1
2 § Kiểm định 2 bên: min( ) U = 1 UU
, 2 § Kiểm định 1 bên lấy U của tổng thể bé hơn trong H1 § Đối với mẫu lớn >10, tính giá trị thống kê )1 U + n
2 z = = U =µ Us 21nn
2 nnn
(
+
21
1
12 µ-
U
s
U § Bước 4: Quy tắc ra quyết định EM3230 Thống kê ứng dụng § Bước 4: Quy tắc ra quyết định § Mẫu bé n1 và n2≤10: Tra bảng phụ lục số 7 , bác bỏ H0 nếu: H0: Me1=Me2
H1: Me1≠ Me2 H0: Me1≤ Me2
H1: Me1> Me2 H0: Me1≥Me2
H1: Me1 U ≥giới hạn trên U ≤ giới hạn dưới § Mẫu lớn >10: bác bỏ H0 nếu: U ≥giới hạn trên hoặc
U ≤ giới hạn dưới z> Za z<- Za z> Za/2 hoặc
z<- Za/2 H0: Me1=Me2
H1: Me1≠ Me2 H0: Me1≤ Me2
H1: Me1> Me2 H0: Me1≥Me2
H1: Me1 EM3230 Thống kê ứng dụng § Một cửa hàng bán đồ ăn ngon trên phố buôn bán lớn thường hàng miễn phí vào các thứ ngày 7, và cửa hàng muốn kiểm tra xem liệu có tác động đáng kể đến doanh thu hay không.
Một mẫu ngẫu nhiên gồm 25 ngày thứ bảy đưa ra các con số về doanh thu như sau: 18 21 23 15 19 26 17 18 22 20 18 21 27 Những ngày có
khuyến mại § Với mức ý nghĩa 0,05, hãy kiểm định xem liệu khuyến mại vào ngày thứ 7 có tạo ra sự khác biệt về doanh thu hay không? Những ngày khác 22 17 15 23 25 20 26 24 16 17 23 21 EM3230 Thống kê ứng dụng § Cặp giả thuyết thống kê: H0: Me1= Me2 § H1: Me1≠ Me2 Những ngày có
khuyến mại Xếp hạng 18 21 23 15 19 26 17 18 22 20 18 21 27 Cộng 4 8,5 11 1 6 12 2 4 10 7 4 8,5 13 R2=91 Những ngày
khác Xếp hạng 22 17 15 23 25 20 26 24 16 17 23 21 )1 + )1 + U 156 = + - = 2 nn
21 R
1 0 - = RU
=
1 1 7 3,5 1 8,5 11 5 12 10 2 3,5 8,5 R1=78 nn
( 1
1
2 )1 + n
2 38,18 = = 78 = = U min( = 0)
= Us Uµ UU
,
1 2 nnn
(
+
1
21
12 nn
21
2 6
nn
(
1
1
2 EM3230 Thống kê ứng dụng § Đại lượng kiểm định: U µ
U z 24,4 = = -= 0
78
-
38,18 -
s
U - Miền bác bỏ : z> Za/2 hoặc z<- Za/2 với Za= Z0,025=1,96 - Kết luận: Với mức ý nghĩa 5%, có cơ sở bác bỏ H0 Hay khuyến mại vào ngày thứ 7 có tạo ra sự khác biệt về doanh thu EM3230 Thống kê ứng dụng § (Sinh viên thực hiện theo hướng dẫn của giảng viên trên lớp) EM3230 Thống kê ứng dụng4
7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
5
7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
Quan điểm MBB khác
6
7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
Ví dụ:
7
7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
Lời giải
Quan điểm Sách
Hoàng Trọng
Tra bảng 6, n=14 (vì có 2 di=0)
0
0
0.5
1.8
2
4
4
4
5.5
7.5
9
9.8
9.8
13.4
13.6
15.2
8
7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
Quan điểm MBB khác
Tra bảng 6, n=14 (vì có 2 di=0)
9
7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
BT 4 và 8
§ Bước 1: Cặp giả thuyết, Me1 là trung vị của mẫu có cỡ mẫu nhỏ hơn
10
7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
11
7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
12
7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
H0: Me1≥ Me2
H1: Me1< Me2
Mẫu lớn, T1=91.5, n1=10
Z=-1.55
KL: Chưa có đủ
cơ sở bác bỏ H0
13
7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp
BT 1 và
11
14
7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp
15
7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp
Ví dụ:
16
7.5 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập
TH áp dụng: Áp dụng cho trường hợp các nhóm so sánh không chắc chắn có pp bình
thường và phương sai bằng nhau (Điều kiện áp dụng ANOVA)
Các bước thực hiện
å
17
7.5 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập
å
18
7.6 Kiểm định Chi-bình phương về tính độc lập
Percentages Based on Grand Total
e
g
a
t
n
e
c
r
e
P
Media
19
7.6 Kiểm định Chi-bình phương về tính độc lập
Bước 1: Đặt giả thuyết: H0: Không có mối liên hệ giữa 2 biến/ hiện tượng
Bước 2: Lập bảng tổng hợp các quan sát được chia thành r hàng và c cột.
20
7.6 Kiểm định Chi-bình phương về tính độc lập
åå
BT 9, 10
21
7.6 Kiểm định Chi-bình phương về tính độc lập
Ví dụ:
22
7.6 Kiểm định Chi-bình phương về tính độc lập
Lời giải
23
7.6 Kiểm định Chi-bình phương về tính độc lập
Lời giải (tiếp)
24
7.7 Kiểm định Chi-bình phương về sự phù hợp
BT 5,6,7
25
Tham khảo: Kiểm định Mann-Whitney
26
Tham khảo: Kiểm định Mann-Whitney
27
Tham khảo: Kiểm định Mann-Whitney
Ví dụ:
28
Tham khảo: Kiểm định Mann-Whitney
Lời giải
29
Tham khảo: Kiểm định Mann-Whitney
30
7.8 Thực hành kiểm định phi tham số với SPSS
31
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
CHÚC CÁC BẠN HỌC TỐT