intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Thống kê học ứng dụng trong quản lý xây dựng: Phần 10 - TS. Nguyễn Duy Long

Chia sẻ: Star Star | Ngày: | Loại File: PDF | Số trang:13

77
lượt xem
9
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phần 10 cung cấp cho người học những kiến thức về suy luận khi các biến có liên hệ. Nội dung chính trong chương này gồm có: So sánh các số đếm, giới thiệu về phân tích phương sai. Mời các bạn cùng tham khảo để biết thêm các nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Thống kê học ứng dụng trong quản lý xây dựng: Phần 10 - TS. Nguyễn Duy Long

  1. 9/8/2010 Phần 10 Nguyễn Duy Long, Tiến Sỹ Bộ môn Thi Công và QLXD ©2010, Nguyễn Duy Long, Tiến Sỹ 1  So sánh các số đếm  Giới thiệu về phân tích phương sai ©2010, Nguyễn Duy Long, Tiến Sỹ 2 1
  2. 9/8/2010 Comparing Counts ©2010, Nguyễn Duy Long, Tiến Sỹ 3  Khảo sát của 256 giám đốc của 400 công ty lớn nhất. Số sinh Con giáp 23 Tý 20 Sửu 18 Dần 23 Mão 20 Thìn 19 Tỵ 18 Ngọ 21 Mùi 19 Thân 22 Dậu 24 Tuất 29 Hợi Nguồn: Phỏng theo De Veaux, 2006, tr.604 ©2010, Nguyễn Duy Long, Tiến Sỹ 4 2
  3. 9/8/2010  Nếu số sinh phân phối đều theo tuổi, ta kỳ ọ g khoảng vọng g 1/12 / số sinh xuất hiện ệ cho mỗi con giáp (21.3). ◦ Dữ liệu quan sát phù hợp với mô hình “rỗng” đơn giản này ra sao?  Kiểm nghiệm giả thiết để trả lời câu hỏi này được gọi là kiểm nghiệm của “sự phù hợp” ( goodness-of-fit ) (“goodness-of-fit”) ©2010, Nguyễn Duy Long, Tiến Sỹ 5  Điều kiện dữ liệu đếm (counted data condition)  Giả định tính độc lập (independence assumption) ◦ Điều kiện ngẫu nhiên hóa  Giả định kích thước mẫu (sample size condition) ◦ Điều ề kiện k tần ầ suất ấ kỳ vọng củaủ ô ((expected d cell ll frequency condition): Ta nên kỳ vọng ít nhất 5 cá thể cho mỗi ô. ©2010, Nguyễn Duy Long, Tiến Sỹ 6 3
  4. 9/8/2010  Ta xem các sự khác nhau giữa số đếm được quan sát ((observed)) và được q ợ kỳỳ vọng ọ g (expected), ký hiệu là (Obs – Exp) ◦  đối xử như các phần dư (residuals).  Trị số thống kê kiểm nghiệm, gọi là trị số thống kê chi-square, ký hiệu χ2: χ2 = ∑ (Obs - Exp)2 các ô Exp ©2010, Nguyễn Duy Long, Tiến Sỹ 7  Ta chỉ tập các mô hình phân phối mẫu mới y là các mô hình χ bình p này phương g (chi- square models).  Tập các mô hình này chỉ khác nhau ở bậc tự do.  Số bậc tự do cho các mô hình này là n -1, với n không phải là kích thước mẫu mà số lượng của ủ loại. l i ©2010, Nguyễn Duy Long, Tiến Sỹ 8 4
  5. 9/8/2010  K = số bậc tự do Nguồn: http://www2.cedarcrest.edu/academic/bio/hale/biostat/session22links/basics.html ©2010, Nguyễn Duy Long, Tiến Sỹ 9  Kiểm nghiệm chi-square luôn là kiểm nghiệm ộ p một phương. g ◦  nếu trị số thống kê tính được là đủ lớn, ta sẽ bác bỏ giả thiết rỗng.  Sự diễn dịch của kiểm nghiệm chi-square là “nhiều phương”. ◦ Không có hướng trong việc bác bỏ mô hình rỗng, chỉ biết nó không phù hợp. hợp ©2010, Nguyễn Duy Long, Tiến Sỹ 10 5
  6. 9/8/2010  Thực hiện kiểm nghiệm chi-square cho ví dụ giám đốc và con g g giáp p ở trên. ©2010, Nguyễn Duy Long, Tiến Sỹ 11  Khảo sát chọn lựa vào đời của ba nhóm học sinh PTTH theo năm tốt nghiệp. 1980 1990 2000 Tổng Đại học/cao đẳng 320 245 288 853 Đi làm 98 24 17 139 Vào quân đội 18 19 5 42 Du lịch 17 2 5 24 g Tổng 453 290 315 1058  Sự chọn lựa là giống nhau của tất cả ba nhóm học sinh này? Nguồn: Phỏng theo De Veaux, 2006, tr.611 ©2010, Nguyễn Duy Long, Tiến Sỹ 12 6
  7. 9/8/2010  Kiểm nghiệm chi-square của sự đồng nhất ((chi-square q test of homogeneity) g y) dùng g để trả lời câu hỏi trên.  Tính toán của kiểm nghiệm này giống với kiểm nghiệm sự phù hợp. ◦  đếm bậc tự do hơi khác nhau.  Kiểm nghiệm sự đồng nhất đi kèm với giả thiết rỗng ỗ “d “dựng sẵn.” ẵ ” ◦  giả thiết rằng sự phân phối không thay đổi từ nhóm này đến nhóm khác. ©2010, Nguyễn Duy Long, Tiến Sỹ 13  Các giả định và điều kiện giống với kiểm g ệ sự nghiệm ựpphù hợp. ợp ◦ Điều kiện dữ liệu số đếm ◦ Nếu ta không tổng quát hóa, không cần kiểm tra điều kiện ngẫu nhiên hóa. ◦ Điều kiện tần suất kỳ vọng của ô (ít nhất 5). ©2010, Nguyễn Duy Long, Tiến Sỹ 14 7
  8. 9/8/2010  Các giá trị kỳ vọng cho học sinh tốt nghiệp PTTH 1980 1990 2000 Tổng Đại học/cao đẳng 365.2 233.8 254.0 853 Đi làm 59.5 38.1 41.4 139 Vào quân đội 18.0 11.5 12.5 42 Du lịch 10.3 6.6 7.1 24 Tổng 453 290 315 1058  Số bậc tự do: (R-1)(C-1); R là số hàng (row) và C là số cột (column) ©2010, Nguyễn Duy Long, Tiến Sỹ 15  Thực hiện kiểm nghiệm chi-square cho ví dụ ự chọn lựa ọ vào đời của học ọ sinh tốt nghiệp g ệp PTTH ở trên…  Trị thống kê χ2: χ2 = ∑ (Obs - Exp)2 = 72.77 các ô Exp  Giá trị p (p-value)
  9. 9/8/2010  Rủi ro viêm gan C có liên quan với người có hình xăm và nơi xăm không? Viêm gan C Không viêm gian C Tổng Xăm, cửa hiệu 17 35 52 Xăm, nơi khác 8 53 61 Không xăm 22 491 513 Tổng 47 579 626  Nguy cơ mắc viêm gan C có độc lập với việc xăm? ◦  Kiểm nghiệm cho tính độc lập (chi-square test for independence). ©2010, Nguyễn Duy Long, Tiến Sỹ 17  Kiểm nghiệm tính độc lập trả lời câu hỏi: “Các ộ lập? biến có độc ập  Kiểm nghiệm sự đồng nhất: “Các nhóm có đồng nhất?”  Sự tính toán giống nhau. ©2010, Nguyễn Duy Long, Tiến Sỹ 18 9
  10. 9/8/2010  Thực hiện kiểm nghiệm chi-square cho ví dụ viêm ggan C và xăm ở trên…  Trị thống kê χ2: χ2 = ∑ (Obs - Exp)2 = 57.91 các ô Exp  Giá trị p (p-value)
  11. 9/8/2010 Introduction to Analysis of Variance ©2010, Nguyễn Duy Long, Tiến Sỹ 21  Phương pháp rửa tay diệt khuẩn: Vi khuẩn (số vi khuẩn) Các phương pháp  Tất cả các phương pháp rửa tay diệt khuẩn là giống nhau?  giả thiết rỗng? ©2010, Nguyễn Duy Long, Tiến Sỹ 22 11
  12. 9/8/2010  Giả thiết rỗng: “các trị trung bình của tất cả các nhóm là bằng g nhau.” ◦ Giả thiết thay thế sẽ như thế nào?  Khi so sánh nhiều trị trung bình, ta dùng mô hình phân phối mẫu được gọi là mô hình F (F-model).  So sánh sự khác nhau giữa các trị trung bình của ủ các á nhóm hó vớiới sự biến biế đổi bên bê trong t các á nhóm. ◦  ý tưởng chủ đạo của mô hình F. ©2010, Nguyễn Duy Long, Tiến Sỹ 23  Xem hai tập hợp của các biểu đồ hộp sau: Khó nhận ra sự khác nhau giữa các trị Sự biến đổi trong mỗi nhóm trung bình vì các sải lớn nếu so với quá nhỏ làm sự khác biệt giữa sự khác nhau của các trị trung bình. các trị trung bình bộc lộ rõ. ©2010, Nguyễn Duy Long, Tiến Sỹ 24 12
  13. 9/8/2010  Ta đối xử các trị trung bình được ước lượng như thể chúngg là các ggiá trịị q quan sát được ợ và chỉ tính phương sai của chúng.  Phương sai này là thước đo để xem các trị trung bình của các nhóm khác nhau ra sao.  Dữ liệu từ phương pháp rửa tay... ©2010, Nguyễn Duy Long, Tiến Sỹ 25 ©2010, Nguyễn Duy Long, Tiến Sỹ 26 13
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
7=>1