intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Nguyên lý thống kê - Chương 5: Phân tích phương sai

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:9

11
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Nguyên lý thống kê - Chương 5: Phân tích phương sai, cung cấp cho người đọc những kiến thức như: phân tích phương sai một nhân tố; các quy luật phân phối. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Nguyên lý thống kê - Chương 5: Phân tích phương sai

  1. 3/2020 PHÂN TÍCH PHƯƠNG SAI (ANOVA) Ths.NGUYỄN ĐÌNH KHUÔNG 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ 1 2 ... ... ... ... ... ... ... ... Cho mẫu với cỡ mẫu lần lượt : n1 ;n2 ;...;nk đại diện cho tổng thể • Các tổng thể có phân phối bình thường. • Các phương sai tổng thể bằng nhau • Các mẫu được lấy độc theo một nhân tố . 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ 1 2 ... ... ... ... ... ... ... ... Cho mẫu với cỡ mẫu lần lượt : n1 ;n2 ;...;nk đại diện cho tổng thể Mục tiêu : Kiểm định trung bình của tổng thể này có bằng nhau hay không H 0 : 1  2  ...  k : nhân tố không ảnh hưởng đến sự thay đổi dữ liệu. H1 :  i   j : nhân tố thật sự ảnh hưởng đến sự thay đổi dữ liệu. 1
  2. 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ Trong đó trung bình nhóm: 1 2 ... ni 1 ... Xi  ni x j 1 ij ... ... ... ... ... Trong đó trung bình toàn bộ bộ dữ liệu: ... 1 ... X n  xij Quan hệ giữa trung bình 1 1 k ni 1 k mẫu và trung bình nhóm X   xij   xij   ni X i 1 k n n i 1 j 1 n i 1 X  ni X i n i 1 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) TỔNG THỂ Biến động dữ liệu trong nội 1 2 ... bộ các nhóm: k ni 2 ... ... SSW   xij  X i i 1 j 1   ... ... ... ... Biến động dữ liệu giữa các nhóm: ... k 2 ... SSG   ni X i  X i 1   ... Biến động của tất cả các dữ liệu: SSW SSG SST 2 Mối quan hệ giữa 3 đại lượng tổng sai số SST   xij  X   SST  SSG  SSW 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) BẢNG ANOVA. Yếu tố biến Tổng chênh lệch Bậc tự Phương sai Phân vị F thiên bình phương do Trong nhóm SSG −1 = = −1 Ngoài nhóm SSW − = − Tổng SST −1 k SSG   ni  X i  X   0 : nhân tố 2 không ảnh hưởng tới dữ liệu. i 1 k SSW   SS i  TTS  SS : nhân tố không ảnh hưởng tới dữ liệu. i1 í ℎ , → → , → ∶ ế ậ 2
  3. 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) H0 : 1  2  ...  k  ª Cặp giả thiết:    H1 : i   j  SSG /  k  1 ª Trị thống kê: F  ~ F k 1 ,nk SSW / n  k  ª chấp nhận giả thiết: F  F 1;n2 k ª Bác bỏ giả thiết: F  Fk 1;nk Trung bình của tổng thể này chắc chắn không bằng nhau 7 CÁC QUY LUẬT PHÂN PHỐI. NHẮC LẠI VỀ QUY LUẬT PHÂN PHỐI XÁC SUẤT. ĐỊNH NGHĨA PHÂN PHỐI CHI BÌNH PHƯƠNG Cho n biến ngẫu nhiên , , … , có quy luật phân phối chuẩn đơn giản. X i ~ N  0;1 ; i  1, n Biến ngẫu nhiên dạng:  2  X 12  X 22  ...  X n2 gọi là biến ngẫu nhiên theo quy luật phân phối Chi bình phương bậc tự 2;n do. Ký hiệu  CÁC QUY LUẬT PHÂN PHỐI. PHÂN PHỐI FISHER X / n1 n1;n2 X / n1 F ~F F n ;n ~F 1 2 Cho hai biến ngẫu nhiên, Y / n2 và Y / n2 X / n1 n1 ;n2 Lập biến ngẫu nhiên F  ~F , Biến ngẫu nhiên được gọi là có quy Y / n2 luật phân phối Fisher với 2 bậc tự do 3
  4. 3/2020 PHÂN PHỐI FISHER EXCEL : = F.INV(prob , df1 , df2) Xác suất trái của quy luật phân phối. Bậc tự do của tử (df1) và mẫu (df2) Phân vị phân phối Fisher 2;19 ª để tra F0 ,05 , hàm excel : = f.inv(0.95 , 2 , 19). F0,05  3,5219 2;19 PHÂN PHỐI FISHER BẢNG TRA (SÁCH GIÁO TRÌNH TRANG 471) Xác suất trái của quy luật phân phối. Bậc tự do của tử (df1) Bậc tự do của mẫu (df2) Phân vị phân phối Fisher F0,05  3,5219 2;19 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Ví dụ: Xem xét việc sinh viên đi làm thêm Nhóm 1 : Nhóm 2 : Nhóm 3 : Đi làm Đi làm Đi làm có ảnh hưởng đến kết quả học tập hay thêm trung thêm trung thêm trung bình ít bình từ 6 – bình trên không. Khảo sát 22 sinh viên trong 3 nhóm hơn 6 12 12 tiếng/tuần tiếng/tuần tiếng/tuần. thời gian đi làm thêm về kết quả học tập 6.3 7.2 6.3 trong một học kỳ cho kết quả như sau: 7.0 6.6 5.8 6.5 6.1 6.0 6.6 5.8 5.5 7.2 6.8 5.2 6.9 7.1 6.5 6.4 5.9 5.3 6.2 4
  5. 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Nhóm 1 : Đi Nhóm 2 : Đi Nhóm 3 : Đi  Nhân tố : là thời lượng trong tuần. làm thêm làm thêm làm thêm trung bình ít trung bình từ trung bình  Nếu nhân tố có ảnh hưởng (nghĩa là hơn 6 6 – 12 trên 12 tiếng/tuần tiếng/tuần tiếng/tuần. thời lượng làm thêm có ảnh hưởng 6.3 7.2 6.3 đến điểm trung bình) 7.0 6.6 5.8  Nhân tố không ảnh hưởng: 6.5 6.1 6.0 H0 : 1  2  3 6.6 5.8 5.5 7.2 6.8 5.2  Nhân tố có ảnh hưởng : 6.9 7.1 6.5 H1 : i   j 6.4 5.9 5.3 6.2 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Biểu đồ phân tán 7.5 7 6.5 6 5.5 5 0 1 2 3 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Nhóm 1 : Đi làm Nhóm 2 : Đi làm Nhóm 3 : Đi làm thêm trung bình ít thêm trung bình từ 6 thêm trung bình trên hơn 6 tiếng/tuần – 12 tiếng/tuần 12 tiếng/tuần. = . = . = . = . = . = . = . = . = . = . = . = . = . Bước 1: qwR42 (vào chế độ thống kê) w31 (thống kê mô tả) Bước 2: Sau khi nhập dữ liệu, thì C, ra màn hình. Bước 3: Xuất kết quả q142 xuất trung bình ; q143 xuất độ lệch và q144 xuất độ lệch 1 1 Trong đó :  x  SS  SS   x 2 .n sx  SS  SS  sx2 .  n  1 n  n  1 5
  6. 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) BẢNG ANOVA. Yếu tố Tổng chênh biến lệch bình Bậc tự do Phương sai Phân vị F thiên phương Trong = 3.0036 −1 =2 = = 1.5018 = = 6.6984 nhóm −1 Ngoài = 5.26 − = 19 = = 0.2242 nhóm − Tổng = 7.2636 − 1 = 21 ; ; Trị tới hạn, phân vị phân phối Fisher : = . = 3.5219 ; Vì > nên bác bỏ giả thiết, nghĩa là chắc chắn điểm trung bình của 3 nhóm sinh viên này là không bằng nhau. Vậy việc đi làm thêm có ảnh hưởng đến kết quả học tập của sinh viên. 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) 1. Nhập dữ liệu vào Excel 2. Vào Menu Data, chọn Data Analysis. 3. Chọn trong Analysis tools : “Anova: single Factor” 4. Khai báo cho bảng Options. 5. Đọc kết quả. 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Anova: Single Factor SUMMARY Groups Count Sum Average Variance Nhóm 1 7 46.9 6.7 0.113333 Nhóm 2 7 45.5 6.5 0.326667 Nhóm 3 8 46.8 5.85 0.231429 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 3.003636 2 1.501818 6.69825 0.006287 3.521893 Within Groups 5.26 19 0.224211 Total 7.263636 21 6
  7. 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Mục đích tiếp theo của phân tích phương sai, khi đã đưa ra kết luận là bác bỏ giả thiết , tức là trung bình của các tổng thể là không bằng nhau. Vậy tổng thể nào sẽ khác tổng thể nào, tổng thể nào lớn và tổng thể nào nhỏ. H0 : 1  2  ...  k  KIỂM ĐỊNH ANOVA ª :   H1 : i   j  Chắc chắn đúng  Với giá trị , tương đương với cặp giá trị cần so sánh. H0 : i   j  KIỂM ĐỊNH HSD ª :  ; i , j  1, n H1 : i   j  Nếu đối thiết đúng, nghĩa  là nhân tố có ảnh hưởng đến tổng thể ; . 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHƯƠNG PHÁP TUKEY, (HSD – HONESTLY SIGNIFICAN DIFFERENCES) H0 : i   j   ; i ; j  1, k ª Cặp giả thiết:  H1 : i   j   niMIN  Minn1 ; n2 ;...; nk   MSW  ª Trị tới hạn: T  q ;nk k ; trong đó  k ;nk niMIN q   : tra b¶ng ph©n phèi Tukey.  ª Trị kiểm định: X i  X j  Nếu X i  X j  T , giả thiết tạm thời đúng, nghĩa là i   j  Nếu X i  X j  T , đối thiết chắc chắn đúng, nghĩa là i   j Nếu X i  X j , ta kết luận i   j . Và ngược lại. 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHÂN PHỐI TUKEY EXCEL 1. Mở Excel , mở bảng Add-Ins (Alt_T_I) 2. Browse… : chọn địa chỉ cho công cụ thống kê Xrealstas. 3. Hàm Excel : = qinv(prob, k , df) Trong đó prob : là xác suất 2 đuôi của quy luật phân phối, ∶ là số lượng tổng thể, : bậc tự do (= − ) q ; nk  qinv 0.05,3,19  3,5927 k 7
  8. 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHÂN PHỐI TUKEY BẢNG TRA GIÁO TRÌNH TRANG 479. Xác suất hai phía của quy luật phân phối. : số lượng tổng thể − : Bậc tự do Giá trị phân vị. q ; nk  q0,05  3,5927 k 3;19 8
  9. 3/2020 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) Nhóm 1 : Đi làm Nhóm 2 : Đi làm Nhóm 3 : Đi làm thêm trung bình ít thêm trung bình từ 6 thêm trung bình trên hơn 6 tiếng/tuần – 12 tiếng/tuần 12 tiếng/tuần. = . = . = . = . = . = . = . = . = . = . = . = . = . Trong = . − = = = 1.5018 = = . nhóm − Ngoài = . − = = = . nhóm − Tổng = . − = 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) PHƯƠNG PHÁP TUKEY, (HSD – HONESTLY SIGNIFICAN DIFFERENCES) H0 : 1  2 H0 : 1  3 H0 : 2  3    ª Cặp giả thiết:   ;  ;  H1 : 1  2 H1 : 1  3 H1 : 2  3       MSW 3,19 0.2236 0.2236 ª Trị tới hạn: T  q ;nk k  q0.05  3.59  0.6422 niMIN 7 7 ª Trị kiểm định: D12  X 1  X 2  0.2  T  1  2 D23  X 1  X 2  0.65  T  2  3 D13  X 1  X 3  0.85  T  1  3 ª So sánh X 1 ; X 2  X 3 , vậy ta có 1 ;2  3 5.1 PHÂN TÍCH PHƯƠNG SAI MỘT NHÂN TỐ (GT/C9/9.1/tr.250) KIỂM ĐỊNH GIẢ THIẾT VỀ PHƯƠNG SAI TỔNG THỂ BẰNG NHAU. H0 : 1  2  ...  k  2 2 2 ª Cặp giả thiết:   H1 : i2  2   2 j sMin ª Trị kiểm định : F  s2 Max ª Trị tới hạn: Fk ; df , trong đó : số lượng tổng thể. và FF  k ; df : bậc tự do, bằng phần nguyên của ( − 1) ª Kết luận : F  Fk ; df : bác bỏ giả thiết nghĩa là phương sai của tổng thể này không bằng nhau. Và trong tình huống này ta phải chuyển từ kiểm định ANOVA sang kiểm định KRUSKAL – WALLIS (10.4, trang 292, GT) 9
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2