CHƯƠNG 9 ANOVA

Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn

MỤC TIÊU CỦA CHƯƠNG

● Sau khi học xong chương này, người học sẽ

● Hiểu được phạm vi ứng dụng của phân tích

phương sai (ANOVA)

● Biết được cách thực hiện ANOVA một yếu tố (one-

way ANOVA)

● Nắm được quy trình thực hiện ANOVA hai yếu tố

(two-way ANOVA)

● Biết cách đọc bảng ANOVA từ Excel và SPSS

© Nguyễn Tiến Dũng Thống kê ứng dụng

2

CÁC NỘI DUNG CHÍNH

9.1 Phân tích PS một yếu tố (one-way ANOVA) 9.2 Phân tích PS hai yếu tố (two-way ANOVA) 9.3 Ứng dụng Excel

© Nguyễn Tiến Dũng Thống kê ứng dụng

3

9.1 Phân tích PS một yếu tố

● 9.1.1 Trường hợp k tổng thể có PP bình

thường và PS bằng nhau ● B1: Tính tổng chênh lệch bình phương trong từng

nhóm SS1, SS2, ... SSk và SSW

● B2: Tính tổng chênh lệch bình phương giữa các

nhóm SSG

● B3: Tính các phương sai nội bộ nhóm MSW và

MSG ● MSW = SSW/(n-k) ● MSG = SSG/(k-1)

● B4: Tính chỉ tiêu KĐ F = MSG/MSW và KĐGT

● Bác bỏ H0 nếu F > Fk-1;n-k;α

© Nguyễn Tiến Dũng Thống kê ứng dụng

4

PS giữa các nhóm (MSG) và PS nội bộ nhóm (MSW)

PS nội nhóm lớn -> Khó khẳng định TB của các nhóm là khác nhau

PS nội nhóm nhỏ -> Dễ khẳng định TB của các nhóm là khác nhau

© Nguyễn Tiến Dũng Thống kê ứng dụng

5

9.1.2 Ứng dụng Excel

● Sử dụng Data Analysis ● Sử dụng MegaStat

© Nguyễn Tiến Dũng Thống kê ứng dụng

6

© Nguyễn Tiến Dũng Thống kê ứng dụng

7

9.1.3 Kiểm tra các giả định của phân tích PS

● Các quan sát là độc lập với nhau: do cách lấy

mẫu

● Giả định tổng thể có phân phối normal

● Dùng đồ thị: Histogram, biểu đồ hộp và râu ● Dùng kiểm định: KĐ Kolgomorov-Smirnoff

● Giả định phương sai của các nhóm bằng nhau

● KĐ Levene: Phân phối Hartley Fmax

© Nguyễn Tiến Dũng Thống kê ứng dụng

8

9.1.4 Phân tích sâu ANOVA (Post-Hoc Test)

● Mục đích: phát hiện sự khác nhau là giữa các

nhóm cụ thể

● Phương pháp Tukey (HSD – Honestly

Significant Difference)

© Nguyễn Tiến Dũng Thống kê ứng dụng

9

Kiểm định Tukey HSD

● Giả sử phân tích sâu ANOVA cho 3 nhóm ● Các cặp GT cần KĐ:

● Tính chỉ tiêu KĐ Tukey ● Bác bỏ H0 nếu

● Căn cứ vào giá trị của các 𝑥𝑖 để quyết định về µi

xem cái nào lớn hơn

© Nguyễn Tiến Dũng Thống kê ứng dụng

10

9.2 PHÂN TÍCH PHƯƠNG SAI HAI YẾU TỐ

● 9.2.1 Trường hợp có 1 quan sát trong 1 ô ● 9.2.2 Trường hợp có nhiều quan sát trong 1 ô

© Nguyễn Tiến Dũng Thống kê ứng dụng

11

9.2.1 Trường hợp có 1 quan sát trong 1 ô

● Bước 1: Tính các TB trong từng nhóm, từng khối

và TB chung

● Bước 2: Tính tổng các chênh lệch bình phương giữa các nhóm (SSG), giữa các khối (SSB), phần dư (SSE) và tổng các chênh lệch bình phương chung (SST). ● SST = SSG + SSB + SSE

● Bước 3: Tính các PS MSG, MSB và MSE ● Bước 4: Tính chỉ tiêu KĐ F1, F2 để KĐGT về ảnh hưởng của yếu tố thứ nhất (cột) và yếu tố thứ hai (hàng) tới biến kết quả ● Bước 5: Ra QĐ bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

12

9.2.2 Trường hợp có nhiều quan sát trong một ô

● B1: Tính các TB của từng nhóm, từng khối, từng

ô và TB chung của toàn bộ mẫu

● B2: Tính tổng các chênh lệch bình phương SSG, SSB, SSI (giao nhau giữa nhóm và khối), SSE và SST

● B3: Tính các phương sai MSG, MSB, MSI, MSE ● B4: KĐGT về ảnh hưởng của yếu tố 1 (cột), yếu tố 2 (hàng) và tương tác giữa hai yếu tố 1 và 2 tới biến kết quả bằng chỉ tiêu KĐ F1, F2 và F3.

● B5: Áp dụng quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

13

9.2.3 Ứng dụng Excel

© Nguyễn Tiến Dũng Thống kê ứng dụng

14

© Nguyễn Tiến Dũng Thống kê ứng dụng

15