intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Thống kê cho khoa học xã hội: Bài 4 - ThS. Nguyễn Thị Xuân Mai

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:37

38
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

"Bài giảng Thống kê cho khoa học xã hội - Bài 4: Kiểm định phi tham số" được biên soạn bao gồm các nội dung về kiểm định Mann-Whitney; kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon; kiểm định Khi bình phương.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Thống kê cho khoa học xã hội: Bài 4 - ThS. Nguyễn Thị Xuân Mai

  1. GIỚI THIỆU MÔN HỌC THỐNG KÊ CHO KHOA HỌC XÃ HỘI Giảng viên: ThS. Nguyễn Thị Xuân Mai 1 v1.0016104219
  2. BÀI 4 KIỂM ĐỊNH PHI THAM SỐ Giảng viên: ThS. Nguyễn Thị Xuân Mai 2 v1.0016104219
  3. MỤC TIÊU BÀI HỌC • Trình bày phương pháp kiểm định Mann-Whitney khi so sánh hai mẫu độc lập với các biến thứ bậc. • Trình bày phương pháp kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon khi so sánh hai mẫu phụ thuộc với các biến thứ bậc. • Trình bày phương pháp kiểm định Khi bình phương để thấy sự phù hợp. • Áp dụng phương pháp Khi bình phương để kiểm định mối liên hệ giữa hai tiêu thức được trình bày qua bảng chéo. • Dựa vào phương pháp Khi bình phương để tính toán các tham số đo lường mối liên hệ giữa các biến định danh: Lambda, Hệ số Phi, Cramer’s V. 3 v1.0016104219
  4. CÁC KIẾN THỨC CẦN CÓ Kiến thức chung về kinh tế - xã hội. 4 v1.0016104219
  5. HƯỚNG DẪN HỌC • Đọc tài liệu tham khảo. • Thảo luận với giáo viên và các sinh viên khác về những vấn đề chưa hiểu rõ. • Trả lời các câu hỏi của bài học. • Đọc và tìm hiểu thêm về các phương pháp kiểm định phi tham số. 5 v1.0016104219
  6. CẤU TRÚC NỘI DUNG 4.1 Kiểm định Mann-Whitney 4.2 Kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon 4.3 Kiểm định Khi bình phương 6 v1.0016104219
  7. KIỂM ĐỊNH PHI THAM SỐ • Ưu điểm:  Được sử dụng trong trường hợp dữ liệu không có phân phối chuẩn, hoặc cho các mẫu nhỏ có ít quan sát.  Được sử dụng khi dữ liệu định tính có thang đo định danh hoặc thang đo thứ bậc.  Được sử dụng khi kiểm định các giả thuyết khác bên cạnh các giả thuyết liên quan đến các tham số của tổng thể.  Trong một số trường hợp, tính toán dễ dàng hơn so với kiểm định tham số.  Dễ hiểu. • Nhược điểm:  Có xu hướng sử dụng ít thông tin hơn kiểm định tham số.  Khả năng tìm ra được sự sai biệt kém, không mạnh như các phép kiểm định có tham số (T student, phân tích phương sai…), đồng thời khó mở rộng để giải quyết các mô hình kinh tế phức tạp. 7 v1.0016104219
  8. 4.1. KIỂM ĐỊNH MANN-WHITNEY • Kiểm định Mann-Whitney U là một trong những kiểm định dựa trên xếp hạng. Các quan sát sẽ được xếp hạng từ giá trị nhỏ nhất tới lớn nhất và sau đó thứ hạng sẽ được sử dụng thay cho các giá trị thực trong tính toán. • Kiểm định Mann-Whitney U dùng để kiểm định liệu có tồn tại sự khác biệt giữa hai tổng thể, với điều kiện:  Tổng thể không có phân phối chuẩn;  Dữ liệu ít nhất phải có thang đo thứ bậc;  Hai mẫu được chọn ngẫu nhiên độc lập với nhau. • Giả thuyết cần kiểm định:  H0: Phân phối của hai tổng thể là giống hệt nhau (μ1= μ2). Lưu ý: kiểm định Mann-Whitney U giống kiểm định tổng hạng Wilconxon. 8 v1.0016104219
  9. 4.1. KIỂM ĐỊNH MANN-WHITNEY 9 v1.0016104219
  10. 4.1. KIỂM ĐỊNH MANN-WHITNEY 10 v1.0016104219
  11. 4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo) • Trường hợp tạo mẫu lớn: n1, n2 > 10  Kết hợp hai mẫu ngẫu nhiên và xếp hạng tất cả các quan sát từ nhỏ nhất tới lớn nhất. Những giá trị bằng nhau sẽ nhận hạng trung bình của các hạng liên tiếp.  Tính tổng các thứ hạng riêng cho từng mẫu, giá trị nào lớn hơn, ký hiệu là R1.  Giá trị của thống kê U: n1  n1  1 U  n1n2   R1 2  Tiêu chuẩn kiểm định là thống kê z có phân phối xấp xỉ chuẩn: U  U z U n1n2 n n  n  n  1 Với U  là trung bình của U; U  1 2 1 2 là độ chênh lệch tiêu 2 12 chuẩn của U.  Tra bảng tìm giá trị tới hạn z với mức ý nghĩa  Giả thuyết H0: μ1= μ2 H0: μ1≥ μ2 H0: μ1≤ μ2 H1: μ1≠ μ2 H1: μ1< μ2 H1: μ1> μ2 Bác bỏ H0 z > z/2 z < -z z > z 11 v1.0016104219
  12. 4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo) Ví dụ: Để kiểm tra xem liệu hai phương pháp học ngoại ngữ mới có hiệu quả như nhau không, ta thu thập một cách ngẫu nhiên điểm số của 15 người mỗi nhóm. Với số liệu này, liệu có thể kết luận phương pháp thứ hai hiệu quả hơn không? Phương pháp 1: 65, 57, 74, 43, 39, 88, 62, 69, 70, 72, 59, 60, 80, 83, 50 Phương pháp 2: 85, 87, 92, 98, 90, 88, 75, 72, 60, 93, 88, 89, 96, 73, 62 • Kết hợp hai mẫu lại với nhau và xếp hạng theo thứ tự từ nhỏ đến lớn. PP1 39 43 50 57 59 60 62 65 69 70 72 74 80 83 88 PP2 60 62 72 73 75 85 87 88 89 90 92 93 96 98 88 Xếp hạng 1 2 3 4 5 6.5 8.5 10 11 12 13.5 15 16 17 18 19 20 21 23 25 26 27 28 29 30 • Dễ dàng thấy rằng phương pháp 2 có tổng xếp hạng cao hơn phương pháp 1, vậy R1=6.5+8.5+13.5+15+16+17+20+21+23+23+25+26+27+28+29+30=312.5 12 v1.0016104219
  13. 4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo) n1  n1  1 15  15  1 • Giá trị của thống kê U là: U  n1n2   R1  15 15   312,5  32,5 2 2 n1n2 15 15 • Trung bình của U: U    112,5 2 2 n1n2  n1  n2  1 15 15  15  15  1 • Độ lệch tiêu chuẩn của U: U    24,1 12 12 • Tiêu chuẩn kiểm định z: U  U 32,5  112,5 z   3,32 U 24,1 • Với mức ý nghĩa  = 0,05  H0: 1 = 2 bị bác bỏ vì z = 3,32 > z/2 = 1,96  H0: 1  2 bị bác bỏ vì z = -3,32 < -z = -1,645  H0: 1  2 được chấp nhận vì z = -3,32 < z = 1,645 • Như vậy, có cơ sở cho rằng phương pháp 2 có hiệu quả hơn phương pháp 1. 13 v1.0016104219
  14. 4.2. KIỂM ĐỊNH DẤU VÀ KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON 4.2.1. Kiểm định dấu 4.2.2. Kiểm định tổng hạng có dấu Wilconxon 14 v1.0016104219
  15. 4.2.1. KIỂM ĐỊNH DẤU • Kiểm định dấu dùng để kiểm định về giá trị trung vị của một tổng thể.  Bài toán: Để kiểm định xem liệu giá trị trung vị có bằng một giá trị cho trước nào đó (M), ta lấy một mẫu và so sánh các giá trị đó với giá trị trung vị phỏng đoán trên.  Giả thuyết cần kiểm định: H0: Giá trị của số trung vị = M  Nếu số liệu có giá trị lớn hơn M, nhận dấu dương. Nếu số liệu có giá trị nhỏ hơn M, nhận dấu âm. Nếu số liệu bằng M, nhận kết quả 0, loại khỏi nghiên cứu.  Số dấu âm và số dấu dương sẽ được so sánh với nhau. Nếu số dấu âm và số dấu dương bằng nhau, giả thuyết H0 là đúng.  Trường hợp mẫu nhỏ, n < 20.  Tiêu chuẩn kiểm định là số dấu âm hoặc số dấu dương mà có giá trị nhỏ hơn.  Tra bảng giá trị tới hạn của kiểm định dấu với cỡ mẫu là tổng số dấu âm và số dấu dương và mức ý nghĩa α.  Bác bỏ H0 nếu tiêu chuẩn kiểm định nhỏ hơn giá trị tới hạn tra bảng. 15 v1.0016104219
  16. 4.2.1. KIỂM ĐỊNH DẤU Ví dụ: Có ý kiến cho rằng, giá trị trung vị về năng suất lao động của Doanh nghiệp A là 40 triệu đồng/tháng. Một mẫu ngẫu nhiên gồm 20 lao động được chọn ra để nghiên cứu, cho thấy, có 15 người có năng suất lao động nhỏ hơn 40 triệu đồng/tháng, 3 người có suất lao động lớn hơn 40 triệu đồng/tháng và 2 người có năng suất lao động bằng 40 triệu đồng/tháng. • Giả thuyết: H0: Me= 40 H1: Me ≠ 40 • Số dấu âm là 15, số dấu dương là 3. Tiêu chuẩn kiểm định là min (15,3)=3. • Giá trị tới hạn ở mức 0,05 cho kiểm định hai phía với n = 18 là 4 → Bác bỏ H0. 16 v1.0016104219
  17. 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo)  Trường hợp mẫu lớn, n  20. Khi mẫu lớn tiêu chuẩn kiểm định có phân phối xấp xỉ chuẩn, được tính như sau: n  X  0,5  Trong đó: X = min (số dấu dương, số dấu âm) z 2 n: qui mô mẫu n /2 Ví dụ: Theo một báo cáo, tuổi trung vị của người dân địa phương A là 36,4. Một nhà nghiên cứu đã lựa chọn 50 người dân và thấy có 21 người nhiều hơn 36,4 tuổi. Với mức ý nghĩa 0,05, liệu có thể khẳng định tuổi trung vị thấp nhất là 36,4 không?  Giả thuyết cần kiểm định: H0: Me  36,4 H1: Me < 36,4  Có 21 người nhiều hơn 36,4 tuổi. Vậy có 29 người nhỏ hơn hoặc bằng 36,4 tuổi.  Vậy giá trị X = min(21,29) = 21 n 50  Tiêu chuẩn kiểm định:  X  0,5   21  0,5  z 2 2  0,99 n 50 2 2  Tra bảng tìm giá trị tới hạn với n = 50 và  = 0,05 cho kiểm định phía trái, giá trị tới hạn là -1,65.  Vì z = -0,99 > -1,65, chưa đủ cơ sở bác bỏ H0.  Không có đủ bằng chứng để bác bỏ ý kiến trên (tuổi trung vị thấp nhất là 36,4). 17 v1.0016104219
  18. 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo) • Kiểm định dấu dùng để kiểm định giả thuyết với hai mẫu tương đồng từng cặp. • Bài toán: để kiểm tra trung bình của mẫu khi so sánh hai mẫu phụ thuộc, chẳng hạn như kiểm định trước – sau. • Ví dụ: Một nghiên cứu cho rằng, nếu những người đi bơi có đeo nút bịt tai thì số lần nhiễm trùng tai sẽ giảm xuống. Một mẫu gồm 10 người được lựa chọn để ghi lại số lần nhiễm trùng tai trong 4 tháng. Trong 2 tháng đầu, họ không dùng nút bịt tai, 2 tháng sau có dùng nút bịt tai. Vào đầu của chu kỳ 2 tháng sau, mỗi người sẽ được kiểm tra để chắc chắn là không bị nhiễm trùng tai. 18 v1.0016104219
  19. 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo) Ví dụ (tiếp)  Giả thuyết:  H0: số người bị nhiễm trùng tai không Dấu của giảm xuống; STT Trước Sau chênh lệch  H1: số người bị nhiễm trùng tai 1 3 2 + giảm xuống. 2 0 1 - 3 5 4 +  Xác định dấu của chênh lệch giữa trước và 4 4 0 + sau. 5 2 1 +  Số dấu âm là 2, số dấu dương là 7. 6 4 3 +  Tiêu chuẩn kiểm định là min(2,7) = 2. 7 3 1 +  Tra bảng với n = 2+7 = 9, α = 0,05 cho 8 5 3 + 9 2 2 0 kiểm định một phía, giá trị tới hạn là 1. 10 1 3 -  Do 2 > 1, bác bỏ H0.  Nghiên cứu trên là có cơ sở, sử dụng nút bịt tai sẽ làm giảm bệnh nhiễm trùng tai. 19 v1.0016104219
  20. 4.2.1. KIỂM ĐỊNH DẤU (tiếp theo) • Trường hợp mẫu lớn, n > 20  Tính chênh lệch giữa hai mẫu để xác định số dấu âm, số dấu dương.  Tương tự như với trường hợp kiểm định số trung vị, tiêu chuẩn kiểm định có phân phối chuẩn và được tính theo công thức: n  X  0,5   z 2 n 2  Trong đó: X = min(số dấu dương, số dấu âm); n: qui mô mẫu  So sánh với giá trị tới hạn tra ở bảng để kết luận. 20 v1.0016104219
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2