CHƯƠNG 9 ANOVA
Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn
MỤC TIÊU CỦA CHƯƠNG
● Sau khi học xong chương này, người học sẽ
● Hiểu được phạm vi ứng dụng của phân tích
phương sai (ANOVA)
● Biết được cách thực hiện ANOVA một yếu tố (one-
way ANOVA)
● Nắm được quy trình thực hiện ANOVA hai yếu tố
(two-way ANOVA)
● Biết cách đọc bảng ANOVA từ Excel và SPSS
© Nguyễn Tiến Dũng Thống kê ứng dụng
2
CÁC NỘI DUNG CHÍNH
9.1 Phân tích PS một yếu tố (one-way ANOVA) 9.2 Phân tích PS hai yếu tố (two-way ANOVA) 9.3 Ứng dụng Excel
© Nguyễn Tiến Dũng Thống kê ứng dụng
3
9.1 Phân tích PS một yếu tố
● 9.1.1 Trường hợp k tổng thể có PP bình
thường và PS bằng nhau ● B1: Tính tổng chênh lệch bình phương trong từng
nhóm SS1, SS2, ... SSk và SSW
● B2: Tính tổng chênh lệch bình phương giữa các
nhóm SSG
● B3: Tính các phương sai nội bộ nhóm MSW và
MSG ● MSW = SSW/(n-k) ● MSG = SSG/(k-1)
● B4: Tính chỉ tiêu KĐ F = MSG/MSW và KĐGT
● Bác bỏ H0 nếu F > Fk-1;n-k;α
© Nguyễn Tiến Dũng Thống kê ứng dụng
4
PS giữa các nhóm (MSG) và PS nội bộ nhóm (MSW)
PS nội nhóm lớn -> Khó khẳng định TB của các nhóm là khác nhau
PS nội nhóm nhỏ -> Dễ khẳng định TB của các nhóm là khác nhau
© Nguyễn Tiến Dũng Thống kê ứng dụng
5
9.1.2 Ứng dụng Excel
● Sử dụng Data Analysis ● Sử dụng MegaStat
© Nguyễn Tiến Dũng Thống kê ứng dụng
6
© Nguyễn Tiến Dũng Thống kê ứng dụng
7
9.1.3 Kiểm tra các giả định của phân tích PS
● Các quan sát là độc lập với nhau: do cách lấy
mẫu
● Giả định tổng thể có phân phối normal
● Dùng đồ thị: Histogram, biểu đồ hộp và râu ● Dùng kiểm định: KĐ Kolgomorov-Smirnoff
● Giả định phương sai của các nhóm bằng nhau
● KĐ Levene: Phân phối Hartley Fmax
© Nguyễn Tiến Dũng Thống kê ứng dụng
8
9.1.4 Phân tích sâu ANOVA (Post-Hoc Test)
● Mục đích: phát hiện sự khác nhau là giữa các
nhóm cụ thể
● Phương pháp Tukey (HSD – Honestly
Significant Difference)
© Nguyễn Tiến Dũng Thống kê ứng dụng
9
Kiểm định Tukey HSD
● Giả sử phân tích sâu ANOVA cho 3 nhóm ● Các cặp GT cần KĐ:
● Tính chỉ tiêu KĐ Tukey ● Bác bỏ H0 nếu
● Căn cứ vào giá trị của các 𝑥𝑖 để quyết định về µi
xem cái nào lớn hơn
© Nguyễn Tiến Dũng Thống kê ứng dụng
10
9.2 PHÂN TÍCH PHƯƠNG SAI HAI YẾU TỐ
● 9.2.1 Trường hợp có 1 quan sát trong 1 ô ● 9.2.2 Trường hợp có nhiều quan sát trong 1 ô
© Nguyễn Tiến Dũng Thống kê ứng dụng
11
9.2.1 Trường hợp có 1 quan sát trong 1 ô
● Bước 1: Tính các TB trong từng nhóm, từng khối
và TB chung
● Bước 2: Tính tổng các chênh lệch bình phương giữa các nhóm (SSG), giữa các khối (SSB), phần dư (SSE) và tổng các chênh lệch bình phương chung (SST). ● SST = SSG + SSB + SSE
● Bước 3: Tính các PS MSG, MSB và MSE ● Bước 4: Tính chỉ tiêu KĐ F1, F2 để KĐGT về ảnh hưởng của yếu tố thứ nhất (cột) và yếu tố thứ hai (hàng) tới biến kết quả ● Bước 5: Ra QĐ bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
12
9.2.2 Trường hợp có nhiều quan sát trong một ô
● B1: Tính các TB của từng nhóm, từng khối, từng
ô và TB chung của toàn bộ mẫu
● B2: Tính tổng các chênh lệch bình phương SSG, SSB, SSI (giao nhau giữa nhóm và khối), SSE và SST
● B3: Tính các phương sai MSG, MSB, MSI, MSE ● B4: KĐGT về ảnh hưởng của yếu tố 1 (cột), yếu tố 2 (hàng) và tương tác giữa hai yếu tố 1 và 2 tới biến kết quả bằng chỉ tiêu KĐ F1, F2 và F3.
● B5: Áp dụng quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
13
9.2.3 Ứng dụng Excel
© Nguyễn Tiến Dũng Thống kê ứng dụng
14
© Nguyễn Tiến Dũng Thống kê ứng dụng