intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 7 - Phan Văn Tân

Chia sẻ: Tầm Y | Ngày: | Loại File: PDF | Số trang:30

47
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Lý thuyết xác suất và thống kê toán học - Chương 7: Kiểm nghiệm giả thiết thống kê" cung cấp cho người học các kiến thức: Khái niệm kiểm nghiệm giả thiết thống kê, một số quy tắc kiểm nghiệm giả thiết,... Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 7 - Phan Văn Tân

  1. LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC Phan Văn Tân Bộ mô Khí tượng
  2. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê Ps (mb) T(oC) • Xét hai chuỗi số liệu: Áp suất khí 1003.5 15.0 quyển (khí áp) và nhiệt độ không khí 1000.7 19.9 • Sự khác nhau giữa các thành phần 1007.6 19.9 trong từng chuỗi: 1006.7 16.5 – Giá trị nhận được giữa các lần đo 998.7 15.4 là khác nhau 999.4 15.9 – Mang tính ngẫu nhiên 1003.2 16.5 • Sự khác nhau giữa các thành phần hai 998.1 17.2 chuỗi: 998.2 19.9 – Khí áp khác với Nhiệt độ 999.7 17.7 – Là bản chất 996.8 17.3 1003.3 15.8
  3. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê • Khi nghiên cứu một hiện tượng nào đó thường nảy sinh vấn đề nghi hoặc: – giữa cái "thật" và cái "giả", – giữa "đúng" và "sai", – giữa cái "bản chất“ và "ngẫu nhiên" • Chẳng hạn, sau khi xem xét chuỗi số liệu lượng mưa ta phát hiện ra rằng "hình như kể từ khi thay đổi vị trí trạm, lượng mưa có dấu hiệu tăng lên so với trước?" – Điều nghi ngờ đó có đúng hay không? – Dấu hiệu lượng mưa tăng lên sau khi thay đổi vị trí trạm là bản chất hay chỉ là ngẫu nhiên? • Để giải quyết mối nghi ngờ đó ta nêu ra giả thiết "lượng mưa tăng lên kể từ khi thay đổi vị trí trạm" và tiến hành kiểm nghiệm nó • Ngược lại với giả thiết này là đối thiết "lượng mưa không tăng lên"
  4. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê • Bài toán tổng quát của kiểm nghiệm giả thiết thống kê: “Cho đại lượng ngẫu nhiên X và một giả thiết Ho về phân bố xác suất của X. Một mệnh đề khác với Ho được gọi là đối thiết H1. Cần kiểm nghiệm xem Ho đúng hay H1 đúng trên cơ sở tập mẫu (X1, X2,..., Xn)” • Thông thường đối thiết H1 là phủ định của giả thiết Ho • Giả thiết Ho có thể là giả thiết đơn giản hoặc giả thiết phức tạp. • Giả thiết đơn giản là giả thiết chỉ chứa một giả định. Ví dụ, Ho: a1=a2 • Giả thiết phức tạp là giả thiết chứa nhiều giả định. Ví dụ, Ho: a1
  5. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê • Nguyên tắc giải: • Về nguyên tắc, để giải bài toán kiểm nghiệm giả thiết thống kê cần phải: – Lập không gian mẫu (X1,…,Xn) – Trên không gian mẫu này xác định một miền D0 là miền chấp nhận H0 và phần bù của D0 là D1 – miền bác bỏ giả thiết H0, tức chấp nhận đối thiết H1 – Mẫu đã lấy được là một điểm xác định trong không gian mẫu – Nếu điểm này thuộc miền D0 ta coi giả thiết H0 là đúng và chấp nhận H0 – Ngược lại thì bác bỏ H0, tức chấp nhận H1
  6. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê Các loại sai lầm: • Khi kiểm nghiệm giả thiết thống kê, chỉ dựa vào một lần thực nghiệm là tập mẫu (X1, X2,..., Xn), do đó những kết luận đưa ra có thể phạm phải sai lầm • Có hai loại sai lầm: – Sai lầm loại I: Là sai lầm bác bỏ giả thiết Ho khi giả thiết này đúng – Sai lầm loại II: Là sai lầm chấp nhận giả thiết Ho khi giả thiết này sai • α = P( Ho/Ho) (Bác bỏ Ho khi Ho đúng) • β = P(Ho/ H o) (Chấp nhận Ho khi Ho sai) • Quan hệ giữa α và β là ngược nhau: α giảm thì β tăng và ngược lại. • Dung lượng mẫu n càng lớn, giá trị của α và β càng nhỏ
  7. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê Các loại sai lầm: • Với dung lượng mẫu n cố định, ta cố gắng lựa chọn một chỉ tiêu thích hợp sao cho có thể loại trừ được cả hai loại sai lầm càng nhiều càng tốt. • Tuy nhiên ta không thể cực tiểu hoá đồng thời cả α và β, vì chúng liên hệ với nhau bởi các hệ thức P( H 0 / H o ) + P( H o / H o ) = 1 P( H 0 / H 0 ) + P( H o / H 0 ) = 1
  8. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê Nguyên lý xác suất nhỏ: • Sự kiện hiếm thì không xuất hiện trong một lần quan sát • Sự kiện đã xuất hiên trong một lần quan sát thì được coi là sự kiện tất yếu
  9. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê Miền thừa nhận và miền loại bỏ : • Trong kiểm nghiệm giả thiết, khi có tập mẫu (X1, X2,…, Xn), tức là ta đã xác định được một điểm trong không gian mẫu, ký hiệu là X* • Điểm này sẽ thuộc miền Do (miền chấp nhận Ho) hay D1 (miền bác bỏ Ho, tức chấp nhận H1) tùy thuộc vào ranh giới d phân chia không gian mẫu D thành hai miền Do, D1 d D1 Do X* D
  10. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê Miền thừa nhận và miền loại bỏ : • Trong thực tế, từ tập mẫu (X1, X2,…, Xn), ta nhận được một thống kê nào đó là một giá trị cụ thể x* • Giá trị này là một điểm trên trục số • Không gian mẫu D bây giờ là toàn bộ hoặc một phần của trục số, trên đó xác định hai miền Do và D1 bởi giá trị giới hạn d • x* thuộc Do hay D1 là tùy thuộc vào giá trị của d Do Do x* d d d D1 D1 = {-∞; -d} ∪ {d;+∞}
  11. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.1 Khái niệm về kiểm nghiệm giả thiết thống kê Miền thừa nhận và miền loại bỏ: • Với xác suất phạm sai lầm loại 1 bằng α ta có: P( D1 / H 0 ) = P( X ∈ D1 / H 0 ) = ∫ f ( s)ds = α D1 P( D0 / H 0 ) = P( X ∈ D0 / H 0 ) = 1 − ∫ f ( s )ds = 1 − α D1 • Trong trường hợp một chiều, nếu f(x/Ho) là mật độ xác suất có điều kiện của X thì 0.8 −d +∞ 0.7 0.6 P( X ∈ D1 / H 0 ) = ∫ f (x / H −∞ 0 )dx + ∫ f (x / H d 0 )dx = α 0.5 +d –d d P( X ∈ D0 / H 0 ) = ∫ f (x / H )dx = 1 − α 0.4 0.3 0 0.2 −d 0.1 D1 = {-∞; -d} ∪ {d;+∞} 0 -6 -4 -2 0 2 4 6 α
  12. CHƯƠNG 7. KIỂM NGHIỆM GIẢ THIẾT THỐNG KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 1. Qui tắc phân bố chuẩn: • Bài toán 1: Cho biến ngẫu nhiên có phân bố chuNn N (μ,σ) với σ đã biết, và (X1,…,Xn) là một mẫu của X. Hãy kiểm nghiệm sự bằng nhau của μ với số μ0 cho trước. • Giải: Đặt giả thiết kiểm nghiệm H0: μ=μ0 1 n Vì μ chưa biết nên thay μ bằng ước lượng μ ≈ X = ∑ X i n i =1 Và đưa giả thiết H0 về dạng tương đương: H 0 : X = μ0 Khi đó, nếu H0 đúng ta có xác suất phạm sai lầm loại 1 là P(| X − μ0 |≥ d ) = α Ý nghĩa: X ≠ μ0 hay μ ≠ μ0
  13. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 1. Qui tắc phân bố chuẩn: • Lập biến mới: u = X − μ0 uα = d σ/ n σ/ n ⇒ P(| X − μ0 |≥ d ) = P(| u |≥ uα ) = α σ N hư đã biết, vì X ∈ N ( μ , ) n nên khi H0 đúng biến u có phân bố chuNn chuNn hóa, u∈N(0,1) Do đó, nếu biết trước α ta có thể tính được uα từ phương trình: uα 1 1 − x2 P(| u |< uα ) = ∫ 2π −uα e 2 dx =1 − α Và đưa ra kết luận: |u| ≥ uα : Bác bỏ H0, tức μ ≠ μ0 |u| < uα : Chấp nhận H0, tức μ = μ0
  14. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 1. Qui tắc phân bố chuẩn: • Nhận xét: • Từ tập mẫu (X1,…,Xn), đại lượng thống kê x* nhận được ở đây chính là ước lượng của μ, tức X • Sau đó, thay cho X là biến thống kê mới u • Miền thừa nhận giả thiết H0 (miền D0) chính là (–uα, uα), và do đó miền loại bỏ H0 (miền D1) là (–∞,–uα) ∪ (+uα,+∞)
  15. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 1. Qui tắc phân bố chuẩn: • Bài toán 2: Cho hai biến ngẫu nhiên có phân bố chuNn X∈N (μx,σx) và Y∈N (μy,σy) với σx và σy đã biết, (X1,…,Xn1) và (Y1,…,Yn2) là các mẫu tương ứng của X và Y. Hãy kiểm nghiệm sự bằng nhau của μx và μy. • Giải: Đặt giả thiết kiểm nghiệm H0: μx=μy Vì μx và μy chưa biết nên thay chúng bằng các n ước lượng 1 1 1 n 2 μ x ≈ X = ∑ X i , μ y ≈ Y = ∑ Yi n1 i =1 n2 i =1 Và đưa giả thiết H0 về dạng tương đương: H0 : X = Y Khi đó, nếu H0 đúng ta có xác suất phạm sai lầm loại 1 là P(| X − Y |≥ d ) = α
  16. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 1. Qui tắc phân bố chuẩn: σ x2 σ y2 • Vì khi H0 đúng thì: ( X − Y ) ∈ N (0, + ) n1 n2 X −Y d Î Lập biến mới u = , uα = σ 2 σ 2 σ x2 σ y2 x + y + n1 n2 n1 n2 Do đó khi H0 đúng biến u có phân bố chuNn chuNn hóa, u∈N(0,1) ⇒ P(| X − Y |≥ d ) = P(| u |≥ uα ) = α Do đó, nếu biết trước α ta có thể tính được uα từ phương trình: u 1 α − 12 x 2 P(| u |< uα ) = ∫ 2π −uα e dx =1 − α Và đưa ra kết luận: |u| ≥ uα : Bác bỏ H0, tức μx ≠ μy |u| < uα : Chấp nhận H0, tức μx = μy
  17. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 2. Qui tắc Student: • Bài toán 1: Cho biến ngẫu nhiên có phân bố chuNn N (μ,σ) với σ chưa biết, và (X1,…,Xn) là một mẫu của X. Hãy kiểm nghiệm sự bằng nhau của μ với số μ0 cho trước. • Giải: Đặt giả thiết kiểm nghiệm H0: μ=μ0 1 n Vì μ chưa biết nên thay μ bằng ước lượng μ ≈ X = ∑ X i n i =1 Và đưa giả thiết H0 về dạng tương đương: H 0 : X = μ0 Khi đó, nếu H0 đúng ta có xác suất phạm sai lầm loại 1 là P(| X − μ0 |≥ d ) = α
  18. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 2. Qui tắc Student: X − μ0 d • Vì chưa biết σ nên lập biến mới: t= * tα = * sx / n sx / n Ở đây: t ∈ St ( n − 1) 1 n s = * x ∑ i n − 1 i =1 ( X − X ) 2 ⇒ P(| X − μ0 |≥ d ) = P (| t |≥ tα ) = α Do đó, nếu biết trước α ta có thể tính được tα từ phương trình: tα f(x,n–1) là hàm mật độ phân bố P (| t |< tα ) = ∫ f ( x, n − 1)dx =1 − α −tα Student với n–1 bậc tự do Và đưa ra kết luận: |t| ≥ tα : Bác bỏ H0, tức μ ≠ μ0 |t| < tα : Chấp nhận H0, tức μ = μ0
  19. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 2. Qui tắc Student: • Bài toán 2: Cho hai biến ngẫu nhiên có phân bố chuNn X∈N (μx,σx) và Y∈N (μy,σy) với σx và σy chưa biết, (X1,…,Xn1) và (Y1,…,Yn2) là các mẫu tương ứng của X và Y. Hãy kiểm nghiệm sự bằng nhau của μx và μy. • Giải: Đặt giả thiết kiểm nghiệm H0: μx=μy Vì μx và μy chưa biết nên thay chúng bằng các n ước lượng 1 1 1 n 2 μ x ≈ X = ∑ X i , μ y ≈ Y = ∑ Yi n1 i =1 n2 i =1 Và đưa giả thiết H0 về dạng tương đương: H0 : X = Y Khi đó, nếu H0 đúng ta có xác suất phạm sai lầm loại 1 là P(| X − Y |≥ d ) = α
  20. CHƯƠN G 7. KIỂM N GHIỆM GIẢ THIẾT THỐN G KÊ 7.2 Một số qui tắc kiểm nghiệm giả thiết 2.Qui tắc Student: X −Y d • Vì chưa biết σx, σy nên lập biến mới: t= , tα = A n1 A *2 *2 1 ( n1 − 1) s + ( n2 − 1) s ⎛ 1 1 ⎞ A= x ⎜⎜ + ⎟⎟y *2 sx = ∑ i n1 − 1 i =1 ( X − X ) 2 n1 + n2 − 2 ⎝ n1 n2 ⎠ 1 n2 Khi đó: t ∈ St ( n1 + n2 − 2) *2 sy = ∑ i n2 − 1 i =1 (Y − Y ) 2 ⇒ P(| X − Y |≥ d ) = P (| t |≥ tα ) = α Do đó, nếu biết trước α ta có thể tính được tα từ phương trình: tα f(x,n1+n2–2) là hàm mật độ phân P (| t |< tα ) = ∫ f ( x, n −tα 1 + n2 − 2)dx =1 − α bố Student với n1+n2–2 bậc tự do Và đưa ra kết luận: |t| ≥ tα : Bác bỏ H0, tức μx ≠ μy |t| < tα : Chấp nhận H0, tức μx = μy
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2