PHÂN TÍCH PHƯƠNG SAI
lượt xem 76
download
ANOVA là kỹ thuật thống kê được sử dụng khi chúng ta muốn so sánh số trung bình của ≥ 3 nhóm. Kỹ thuật này chia phưong sai của 1 quan sát (observation) thành 2 phần: 1phương sai giữa các nhóm (between groups) và 2phương sai nội nhóm (within group). Do phưong sai là độ phân tán tương đối của các quan sát so với số trung bình nên việc phân tích phương sai giúp so sánh các số trung bình dễ dàng (bên cạnh việc so sánh các phương sai). Phần này chỉ đề cập đến ANOVA một...
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: PHÂN TÍCH PHƯƠNG SAI
- PHÂN TÍCH PHƯƠNG SAI (ANALYSIS OF VARIANCE/ANOVA) I. GIỚI THIỆU ANOVA là k ỹ thuật thống kê được sử dụng khi chúng ta muốn so sánh số trung bình của ≥ 3 nhóm. Kỹ thuật này chia phưong sai của 1 quan sát (observation) thành 2 ph ần: 1phương sai giữa các nhóm (between groups) và 2phương sai nội nhóm (within group). Do phưong sai là độ phân tán tương đối của các quan sát so với số trung bình nên việc phân tích phương sai giúp so sánh các số trung bình dễ dàng (bên cạnh việc so sánh các phương sai). Phần này chỉ đề cập đến ANOVA một chiều (one-way ANOVA) theo đó các nhóm được so sánh dựa trên 1 biến số (yếu tố). II. NGUYÊN LÝ CỦA ANOVA Thí dụ minh họa: Th ời gian nằm viện của các bệnh nhân đã được tiểu phẫu không có biến chứng được so sánh với nhau theo ba bác sĩ điều trị (A, B, C). Ch ọn 1 mẫu ngẫu nhiên bao gồm 8 bệnh án cho từng bác sĩ, số liệu như sau: Bảng 1. Thời gian nằm viện của bệnh nhân theo bác sĩ điều trị
- A2 B2 C2 A B C 4 16 4 16 5 25 5 25 5 25 3 9 5 25 4 16 3 9 4 16 3 9 3 9 6 36 4 16 3 9 6 36 5 25 3 9 4 16 3 9 4 16 5 25 3 9 5 25 ∑A2 = 195 ∑B2 = 125 ∑C2 = 111 ∑A = 39 ∑B = 31 ∑C = 29
- A 4,875 B 3,875 C 3, 625 X 4,125 Biến số (yếu tố) để so sánh chỉ độc nhất là thời gian n ằm viện của bệnh nhân (tính bằng ngày). Số liệu đư ợc phân bố với các ký hiệu như sau: B/n của BS. A: x1A = 4 , x2A = 5 , …………………………….., x8A = 5 B/n của BS. B: x1B = 4 , x2B = 5, …………………………….., x8B = 3 B/n của BS. C: x1C = 5 , x2C = 3, …………………………….., x8C = 5 xij : quan sát thứ i thuộc nhóm j đại trung bình (số trung bình tính được từ 24 b/n) X: số trung bình của các nhóm A, B, và C (tính từ 8 b/n của mỗi nhóm) A, B, C : Chọn x2A làm m ẫu: (x2A – X ) = (5 – 4,125) = 0,875 Hiệu 0,875 có thể đư ợc tách ra làm 2:
- (x2A – X ) = (x2A – A ) + ( A X ) = (5 – 4,875) + (4,875 – 4,125) = (0,125) + (0,750) = 0,875 Biến thiên giữa trung bình của nhóm A và đại Biến trung bình Biến thiên thiên giữa 1 giữa 1 quan sát quan sát thuộc thuộc nhóm A nhóm A và trung và đại bình của trung nhóm A bình ANOVA xem xét biến thiên của tất cả các quan sát với số đại trung bình và phân chúng ra làm 2: biến thiên nội nhóm và biến thiên giữa các nhóm . Nếu số trung bình của các nhóm khác nhau nhiều th ì sự biến thiên giữa chúng và đại trung bình (biến thiên giữa các nhóm) sẽ đáng kể hơn so với các biến thiên giữa các quan sát trong 1 nhóm với trung b ình của nhóm (biến thiên nội nhóm). Nếu số trung b ình của các nhóm không khác nhau nhiều thì biến thiên giữa các nhóm sẽ không lớn h ơn so với biến thiên nội nhóm. Phép kiểm định giả thuyết về 2 ph ương sai, F test, có thể được sử dụng để kiểm định tỉ số phương sai giữa các nhóm và phương sai nội nhóm. Giả thuyết trống của F test cho rằng 2 phương sai này bằng nhau; nếu H0 đúng thì có ngh ĩa là biến thiên giữa các nhóm sẽ không lớn h ơn so với biến thiên nội nhóm. Trong tình huống này, không th ể kết luận là các trung bình khác lẫn nhau (không có 1 cặp trung
- bình nào khác nhau). Ngư ợc lại, nếu từ chối được H0 thì kết luận được là không phải tất cả các trung b ình đều bằng nhau (có ít nhất 1 cặp trung bình khác nhau). III. CÁCH TÍNH TRONG ANOVA + Tính phương sai giữa các số trung bình nhóm so với đại trung bình: Tổng bình phương giữa các nhóm (Sum of Squares Between–SSB) n j ( x j X )2 Ước lượng SSB phương sai giữa ═ j 1 j 1 các nhóm Trung bình bình phương giữa các nhóm (Mean square between groups – MSB) + Tính phương sai giữa các quan sát trong từng nhóm so với số trung bình của nhóm: Tổng bình phương nội Ước lượng nhóm (Sum of Squares Within – SSW) p hương sai nội nhóm 1) s 2 (n SSW j j ═ ( n j 1) Nj
- Trung bình bình phương nội nhóm (Mean square within groups – MSW) MSB + Lập tỉ số ph ương sai (VR = F ratio): V.R = MSW IV. PHÉP KIỂM ANOVA Với thí dụ minh họa trên: Thời gian nằm viện của b/n theo các bác sĩ A, B, C có khác nhau? 1/ Số liệu: bao gồm 1 biến số liên tục (như đã cho) 2/ Giả định: + Thời gian nằm viện (theo 3 BS) phân phối b ình thư ờng. + Phương sai của các dân số (thời gian nằm viện theo A, B, C) bằng nhau + Các m ẫu đư ợc rút ngẫu nhiên và độc lập. 3/ Giả thuyết: HA: Có ít nhất 1 cặp µ khác nhau H0: µA = µB = µC (µA ≠ µB ho ặc µB ≠ µC ho ặc µA ≠ µC) α = 0,05
- 4/ Số TKKĐ: j – 1 df MSB với V.R = N– j d f MSW 5/ PP. cuûa soá TKKÑ: Khi H0 ñuùng, soá TKKÑ seõ coù phaân phoái F vôùi (3 – 1) ñoä töï do töû soá vaø (24 – 3) ñoä töï do maãu soá. 6/ Qui taéc quyeát ñònh: Ñaët = 0,05. Giaù trò tôùi haïn cuûa F (tra baûng) baèng 3,47. Töø choái H0 neáu V.R. 3,47. MSB 7/ Tính số TKKĐ : V.R = MSW 2 SSB n j ( x j X ) MSB Tính j 1 j 1 [8(4,875 4,125) 2 ] [8(3,875 4,125) 2 ] [8(3, 625 4,125)2 ] 4,5 0,5 2, 0 MSB 3, 5 3 1 2 ( n j 1) s 2 SSW j Tính M S W (n 1) Nj j [ ( 8 1 ) 0 , 8 3 4 5 2 ] [ ( 8 1) 0 , 8 3 4 5 2 ] [ ( 8 1 ) 0 , 9 1 6 1 2 ] M SW 24 3
- 4,875 4,875 5,875 MSW 0, 74 21 3, 5 V.R = 4, 73 0, 74 8/ Quyết định thống kê: Từ chối H0 vì V.R = 4,73 >3,47 9/ Kết luận: Có ít nhất 1 cặp µ khác nhau. p = 0,021 Cách trình bày kết quả ANOVA Bảng 2. Kết quả so sánh thời gian nằm viện trung b ình của b/n thuộc các BS điều trị A, B, C Tổng bình Độ tự Trung bình F Giá phương (Sum of do bình phương (V.R) trị Squares) (df) (Mean p square) Giữa các nhóm 7,000 2 3,500 4,704 0,021 (Between
- groups) Nội nhóm 15,625 21 0,744 (Within groups) Tổng 22,625 23 (Total) V. K Ỹ THUẬT HẬU KIỂM (Post hoc procedures) Kết quả của ANOVA không cho biết cặp nào của µ khác nhau. Việc tiến h ành các k ỹ thuật hậu kiểm sẽ giúp kết luận về việc n ày. Phần n ày sẽ giới thiệu 2 phép hậu kiểm: Tukey’s HSD test (Honestly Significant Difference) sử dụng cho trường hợp các m ẫu bằng nhau, và Scheffé test sử dụng cho trường hợp các mẫu không bằng nhau. 1/ Tukey’s HSD test MSW HSD Multiplierq ( a ) Số TKKĐ của HSD: n MSW: Trung bình bình phương giữa các nhóm a: số lượng số trung b ình cần so sánh
- q: df của MSW Tính số TKKĐ: + Với 3 số trung bình cần so sánh và 21 df (của SMW) ở n gưỡng α = 0,05, tra bảng để có multiplier (bội số) là kho ảng 3,55; + MSW = 0,74; +n=8 0, 74 HSD 3,55 1, 08 8 Hiệu giữa 2 số trung bình ít nhất phải bằng 1,08 thì mới được xem là có sự khác biệt có ý ngh ĩa thống kê (ở ngưỡng 0,05). Như vậy: µA = µB A B 4,875 3,875 1, 000 µB = µC B C 3,875 3, 625 0, 250 µA ≠ µC A C 4,875 3, 625 1, 250 Kết luận: Thời gian nằm viện trung bình của b/n thuộc BS. A khác có ý nghĩa thống kê với th ời gian nằm viện trung b ình của b/n thuộc BS. C. 2/ Scheffé test
- ( X 1 X 2 )2 Số TKKĐ: F MSW ( n1 n2 ) / n1n2 (4,875 3,875) 2 Với A và B : F 5, 41 0, 74(8 8) / 64 (3,875 3, 625) 2 Với B và C : F 0,34 0, 74(8 8) / 64 (4,875 3, 625) 2 Với A và C : F 8, 45 0, 74(8 8) / 64 Giá trị tới hạn của F được tính bằng cách lấy số nhóm trừ 1 (3-1) rồi nhân cho giá trị tới hạn của F đ ã tính được trong phép kiểm ANOVA (4,73). F (tới hạn) = 2 x 3,47 = 6,94 Sự khác biệt giữa 2 số trung b ình được xem là có ý ngh ĩa thống kê khi F tính được lớn hơn 6,94. Như vậy chỉ có cặp A và C thỏa điều kiện này. Kết luận tương tự như kết luận trong Tukey’s HSD test. ---------------------------------------------------------------------------------------------------- ---- -----------------------------------------
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Thống kê y học - Bài 14: So sánh nhiều trung bình - Phân tích phương sai
15 p | 96 | 16
-
Bài giảng Thống kê y học - Bài 7: Sự biến thiên mẫu của tỉ lệ
9 p | 124 | 12
-
SO SÁNH KẾT QUẢ ĐIỀU TRỊ CẬN THỊ GIỮA LASIK PHÂN TÍCH GIÁ TRỊ Q VÀ LASIK THƯỜNG QUI
16 p | 102 | 10
-
Chăm sóc bệnh nhân ung thư hở nhiễm trùng
5 p | 117 | 9
-
ĐỘNG KINH (Epilepsy) (Kỳ 3)
5 p | 78 | 7
-
Chẩn đoán diện tích bỏng 1. Tổng diện tích da: Bình thường 14000-16000 cm2 ở
5 p | 148 | 6
-
Chẩn đoán diện tích bỏng
7 p | 107 | 4
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn