Bài giảng Nguyên lý thống kê - Chương 5: Phân tích phương sai
lượt xem 4
download
Bài giảng Nguyên lý thống kê - Chương 5: Phân tích phương sai, cung cấp cho người đọc những kiến thức như: phân tích phương sai một nhân tố; các quy luật phân phối. Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Nguyên lý thống kê - Chương 5: Phân tích phương sai
- 3/2020 PHÂN TÍCH PHƯƠNG SAI (ANOVA) Ths.NGUYỄN ĐÌNH KHUÔNG 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ 1 2 ... ... ... ... ... ... ... ... Cho mẫu với cỡ mẫu lần lượt : n1 ;n2 ;...;nk đại diện cho tổng thể • Các tổng thể có phân phối bình thường. • Các phương sai tổng thể bằng nhau • Các mẫu được lấy độc theo một nhân tố . 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ 1 2 ... ... ... ... ... ... ... ... Cho mẫu với cỡ mẫu lần lượt : n1 ;n2 ;...;nk đại diện cho tổng thể Mục tiêu : Kiểm định trung bình của tổng thể này có bằng nhau hay không H 0 : 1 2 ... k : nhân tố không ảnh hưởng đến sự thay đổi dữ liệu. H1 : i j : nhân tố thật sự ảnh hưởng đến sự thay đổi dữ liệu. 1
- 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ Trong đó trung bình nhóm: 1 2 ... ni 1 ... Xi ni x j 1 ij ... ... ... ... ... Trong đó trung bình toàn bộ bộ dữ liệu: ... 1 ... X n xij Quan hệ giữa trung bình 1 1 k ni 1 k mẫu và trung bình nhóm X xij xij ni X i 1 k n n i 1 j 1 n i 1 X ni X i n i 1 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ Biến động dữ liệu trong nội 1 2 ... bộ các nhóm: k ni 2 ... ... SSW xij X i i 1 j 1 ... ... ... ... Biến động dữ liệu giữa các nhóm: ... k 2 ... SSG ni X i X i 1 ... Biến động của tất cả các dữ liệu: SSW SSG SST 2 Mối quan hệ giữa 3 đại lượng tổng sai số SST xij X SST SSG SSW 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) BẢNG ANOVA. Yếu tố biến Tổng chênh lệch Bậc tự Phương sai Phân vị F thiên bình phương do Trong nhóm SSG −1 = = −1 Ngoài nhóm SSW − = − Tổng SST −1 k SSG ni X i X 0 : nhân tố 2 không ảnh hưởng tới dữ liệu. i 1 k SSW SS i TTS SS : nhân tố không ảnh hưởng tới dữ liệu. i1 í ℎ , → → , → ∶ ế ậ 2
- 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) H0 : 1 2 ... k ª Cặp giả thiết: H1 : i j SSG / k 1 ª Trị thống kê: F ~ F k 1 ,nk SSW / n k ª chấp nhận giả thiết: F F 1;n2 k ª Bác bỏ giả thiết: F Fk 1;nk Trung bình của tổng thể này chắc chắn không bằng nhau 7 CÁC QUY LUẬT PHÂN PHỐI. NHẮC LẠI VỀ QUY LUẬT PHÂN PHỐI XÁC SUẤT. ĐỊNH NGHĨA PHÂN PHỐI CHI BÌNH PHƯƠNG Cho n biến ngẫu nhiên , , … , có quy luật phân phối chuẩn đơn giản. X i ~ N 0;1 ; i 1, n Biến ngẫu nhiên dạng: 2 X 12 X 22 ... X n2 gọi là biến ngẫu nhiên theo quy luật phân phối Chi bình phương bậc tự 2;n do. Ký hiệu CÁC QUY LUẬT PHÂN PHỐI. PHÂN PHỐI FISHER X / n1 n1;n2 X / n1 F ~F F n ;n ~F 1 2 Cho hai biến ngẫu nhiên, Y / n2 và Y / n2 X / n1 n1 ;n2 Lập biến ngẫu nhiên F ~F , Biến ngẫu nhiên được gọi là có quy Y / n2 luật phân phối Fisher với 2 bậc tự do 3
- 3/2020 PHÂN PHỐI FISHER EXCEL : = F.INV(prob , df1 , df2) Xác suất trái của quy luật phân phối. Bậc tự do của tử (df1) và mẫu (df2) Phân vị phân phối Fisher 2;19 ª để tra F0 ,05 , hàm excel : = f.inv(0.95 , 2 , 19). F0,05 3,5219 2;19 PHÂN PHỐI FISHER BẢNG TRA (SÁCH GIÁO TRÌNH TRANG 471) Xác suất trái của quy luật phân phối. Bậc tự do của tử (df1) Bậc tự do của mẫu (df2) Phân vị phân phối Fisher F0,05 3,5219 2;19 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Ví dụ: Xem xét việc sinh viên đi làm thêm Nhóm 1 : Nhóm 2 : Nhóm 3 : Đi làm Đi làm Đi làm có ảnh hưởng đến kết quả học tập hay thêm trung thêm trung thêm trung bình ít bình từ 6 – bình trên không. Khảo sát 22 sinh viên trong 3 nhóm hơn 6 12 12 tiếng/tuần tiếng/tuần tiếng/tuần. thời gian đi làm thêm về kết quả học tập 6.3 7.2 6.3 trong một học kỳ cho kết quả như sau: 7.0 6.6 5.8 6.5 6.1 6.0 6.6 5.8 5.5 7.2 6.8 5.2 6.9 7.1 6.5 6.4 5.9 5.3 6.2 4
- 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Nhóm 1 : Đi Nhóm 2 : Đi Nhóm 3 : Đi Nhân tố : là thời lượng trong tuần. làm thêm làm thêm làm thêm trung bình ít trung bình từ trung bình Nếu nhân tố có ảnh hưởng (nghĩa là hơn 6 6 – 12 trên 12 tiếng/tuần tiếng/tuần tiếng/tuần. thời lượng làm thêm có ảnh hưởng 6.3 7.2 6.3 đến điểm trung bình) 7.0 6.6 5.8 Nhân tố không ảnh hưởng: 6.5 6.1 6.0 H0 : 1 2 3 6.6 5.8 5.5 7.2 6.8 5.2 Nhân tố có ảnh hưởng : 6.9 7.1 6.5 H1 : i j 6.4 5.9 5.3 6.2 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Biểu đồ phân tán 7.5 7 6.5 6 5.5 5 0 1 2 3 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Nhóm 1 : Đi làm Nhóm 2 : Đi làm Nhóm 3 : Đi làm thêm trung bình ít thêm trung bình từ 6 thêm trung bình trên hơn 6 tiếng/tuần – 12 tiếng/tuần 12 tiếng/tuần. = . = . = . = . = . = . = . = . = . = . = . = . = . Bước 1: qwR42 (vào chế độ thống kê) w31 (thống kê mô tả) Bước 2: Sau khi nhập dữ liệu, thì C, ra màn hình. Bước 3: Xuất kết quả q142 xuất trung bình ; q143 xuất độ lệch và q144 xuất độ lệch 1 1 Trong đó : x SS SS x 2 .n sx SS SS sx2 . n 1 n n 1 5
- 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) BẢNG ANOVA. Yếu tố Tổng chênh biến lệch bình Bậc tự do Phương sai Phân vị F thiên phương Trong = 3.0036 −1 =2 = = 1.5018 = = 6.6984 nhóm −1 Ngoài = 5.26 − = 19 = = 0.2242 nhóm − Tổng = 7.2636 − 1 = 21 ; ; Trị tới hạn, phân vị phân phối Fisher : = . = 3.5219 ; Vì > nên bác bỏ giả thiết, nghĩa là chắc chắn điểm trung bình của 3 nhóm sinh viên này là không bằng nhau. Vậy việc đi làm thêm có ảnh hưởng đến kết quả học tập của sinh viên. 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) 1. Nhập dữ liệu vào Excel 2. Vào Menu Data, chọn Data Analysis. 3. Chọn trong Analysis tools : “Anova: single Factor” 4. Khai báo cho bảng Options. 5. Đọc kết quả. 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Anova: Single Factor SUMMARY Groups Count Sum Average Variance Nhóm 1 7 46.9 6.7 0.113333 Nhóm 2 7 45.5 6.5 0.326667 Nhóm 3 8 46.8 5.85 0.231429 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 3.003636 2 1.501818 6.69825 0.006287 3.521893 Within Groups 5.26 19 0.224211 Total 7.263636 21 6
- 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Mục đích tiếp theo của phân tích phương sai, khi đã đưa ra kết luận là bác bỏ giả thiết , tức là trung bình của các tổng thể là không bằng nhau. Vậy tổng thể nào sẽ khác tổng thể nào, tổng thể nào lớn và tổng thể nào nhỏ. H0 : 1 2 ... k KIỂM ĐỊNH ANOVA ª : H1 : i j Chắc chắn đúng Với giá trị , tương đương với cặp giá trị cần so sánh. H0 : i j KIỂM ĐỊNH HSD ª : ; i , j 1, n H1 : i j Nếu đối thiết đúng, nghĩa là nhân tố có ảnh hưởng đến tổng thể ; . 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHƯƠNG PHÁP TUKEY, (HSD – HONESTLY SIGNIFICAN DIFFERENCES) H0 : i j ; i ; j 1, k ª Cặp giả thiết: H1 : i j niMIN Minn1 ; n2 ;...; nk MSW ª Trị tới hạn: T q ;nk k ; trong đó k ;nk niMIN q : tra b¶ng ph©n phèi Tukey. ª Trị kiểm định: X i X j Nếu X i X j T , giả thiết tạm thời đúng, nghĩa là i j Nếu X i X j T , đối thiết chắc chắn đúng, nghĩa là i j Nếu X i X j , ta kết luận i j . Và ngược lại. 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHÂN PHỐI TUKEY EXCEL 1. Mở Excel , mở bảng Add-Ins (Alt_T_I) 2. Browse… : chọn địa chỉ cho công cụ thống kê Xrealstas. 3. Hàm Excel : = qinv(prob, k , df) Trong đó prob : là xác suất 2 đuôi của quy luật phân phối, ∶ là số lượng tổng thể, : bậc tự do (= − ) q ; nk qinv 0.05,3,19 3,5927 k 7
- 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHÂN PHỐI TUKEY BẢNG TRA GIÁO TRÌNH TRANG 479. Xác suất hai phía của quy luật phân phối. : số lượng tổng thể − : Bậc tự do Giá trị phân vị. q ; nk q0,05 3,5927 k 3;19 8
- 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Nhóm 1 : Đi làm Nhóm 2 : Đi làm Nhóm 3 : Đi làm thêm trung bình ít thêm trung bình từ 6 thêm trung bình trên hơn 6 tiếng/tuần – 12 tiếng/tuần 12 tiếng/tuần. = . = . = . = . = . = . = . = . = . = . = . = . = . Trong = . − = = = 1.5018 = = . nhóm − Ngoài = . − = = = . nhóm − Tổng = . − = 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHƯƠNG PHÁP TUKEY, (HSD – HONESTLY SIGNIFICAN DIFFERENCES) H0 : 1 2 H0 : 1 3 H0 : 2 3 ª Cặp giả thiết: ; ; H1 : 1 2 H1 : 1 3 H1 : 2 3 MSW 3,19 0.2236 0.2236 ª Trị tới hạn: T q ;nk k q0.05 3.59 0.6422 niMIN 7 7 ª Trị kiểm định: D12 X 1 X 2 0.2 T 1 2 D23 X 1 X 2 0.65 T 2 3 D13 X 1 X 3 0.85 T 1 3 ª So sánh X 1 ; X 2 X 3 , vậy ta có 1 ;2 3 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) KIỂM ĐỊNH GIẢ THIẾT VỀ PHƯƠNG SAI TỔNG THỂ BẰNG NHAU. H0 : 1 2 ... k 2 2 2 ª Cặp giả thiết: H1 : i2 2 2 j sMin ª Trị kiểm định : F s2 Max ª Trị tới hạn: Fk ; df , trong đó : số lượng tổng thể. và FF k ; df : bậc tự do, bằng phần nguyên của ( − 1) ª Kết luận : F Fk ; df : bác bỏ giả thiết nghĩa là phương sai của tổng thể này không bằng nhau. Và trong tình huống này ta phải chuyển từ kiểm định ANOVA sang kiểm định KRUSKAL – WALLIS (10.4, trang 292, GT) 9
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Nguyên lý thống kê kinh tế - Nguyễn Trọng Hải MBA
184 p | 343 | 96
-
Bài giảng Nguyên lý thống kê: Chương 1 - Nguyễn Ngọc Lam
33 p | 330 | 41
-
Bài giảng Nguyên lý thống kê kinh tế
295 p | 174 | 38
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 7 - ĐH Kinh tế Quốc dân
55 p | 156 | 18
-
Bài giảng Nguyên lý thống kê: Chương 9 - Nguyễn Ngọc Lam
22 p | 214 | 17
-
Bài giảng Nguyên lý thống kê - ĐH Kinh tế Quốc dân
131 p | 320 | 16
-
Bài giảng Nguyên lý thống kê: Chương 2 - Nguyễn Ngọc Lam
21 p | 169 | 14
-
Bài giảng Nguyên lý thống kê kinh tế - Chương 2: Tổng hợp thống kê
42 p | 394 | 11
-
Bài giảng Nguyên lý thống kê kinh tế - Học viện Ngân hàng
164 p | 36 | 10
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 1
36 p | 270 | 7
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 1 - Hoàng Đức Thắng
7 p | 68 | 7
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 2 - ThS. Nguyễn Văn Phong
22 p | 107 | 6
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 1 - TS. Hồ Ngọc Ninh
15 p | 87 | 5
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 1 - ThS. Nguyễn Văn Phong
21 p | 136 | 5
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 3 - TS. Hồ Ngọc Ninh
20 p | 80 | 4
-
Bài giảng Nguyên lý thống kê: Chương 1 - Nguyễn Ngọc Lam (2017)
30 p | 37 | 3
-
Bài giảng Nguyên lý thống kê kinh tế: Chương 2 - TS. Hồ Ngọc Ninh
10 p | 86 | 2
-
Bài giảng Nguyên lý thống kê - TS. Hứa Thanh Xuân
39 p | 13 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn