CHƯƠNG 8 KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ CỦA TỔNG THỂ
Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn
MỤC TIÊU CỦA CHƯƠNG
● Sau khi học xong chương này, người học sẽ
● Hiểu được kiểm định là gì và biết cách lập cặp giả thuyết KĐ phù hợp với các bài toán KĐ 2 bên, bên trái và bên phải
● Nắm được quy trình KĐGT tổng quát ● Kể tên được các chỉ tiêu KĐ với bài toán KĐGT trên một tổng thể (trung bình, tỷ lệ, phương sai) ● Biết cách xác định xác suất tới hạn để bác bỏ H0
p-value
● Phát biểu và nêu được chỉ tiêu KĐ với các bài toán KĐGT trên hai tổng thể (trung bình, tỷ lệ, phương sai)
© Nguyễn Tiến Dũng Thống kê ứng dụng
2
CÁC NỘI DUNG CHÍNH
8.1 Các vấn đề chung về kiểm định 8.2 KĐ giả thuyết trên một tổng thể 8.3 KĐ giả thuyết trên hai tổng thể
© Nguyễn Tiến Dũng Thống kê ứng dụng
3
8.1 CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH
● 8.1.1 Đặt giả thuyết về tham số tổng thể
● Cặp giả thuyết H0 (giả thuyết không) và H1(Ha) (giả
thuyết đối)
● TD1: Một nghiên cứu muốn tìm hiểu mối liên hệ
giữa thời gian tự học và KQ học tập (GPA) ● Giả thuyết NC (nghi vấn khoa học): Giữa thời gian tự học
và GPA có mối liên hệ
● H0: Giữa thời gian tự học và GPA KHÔNG có mối liên hệ ● H1: Giữa thời gian tự học và GPA có mối liên hệ ● Để chứng minh nghi vấn của người NC là đúng, thì
người NC sẽ phải: thu thập DL bác bỏ H0.
© Nguyễn Tiến Dũng Thống kê ứng dụng
4
● 8.1.2 Một số nguyên tắc liên quan đến việc
đặt giả thuyết ● H0:
● trạng thái bình thường; trạng thái gốc, không có dữ liệu
chứng minh
● phải có dấu bằng, không có liên hệ;
● H1:
● trạng thái ngược lại H0, không có dấu bằng, có liên hệ,
thể hiện nghi vấn của người nghiên cứu ● đòi hỏi dữ liệu, bằng chứng để chứng minh
● Bác bỏ H0 tức chấp nhận H1 là đúng ● TD: Khối lượng gói ngũ cốc µ = 368g
© Nguyễn Tiến Dũng Thống kê ứng dụng
5
8.1.3 Logic của bài toán kiểm định
● Nếu TB mẫu rất khác so với giá trị cần KĐ thì bằng
trực giác có thể bác bỏ H0 mà không cần KĐ
● Nếu TB mẫu gần với giá trị cần KĐ, cần một quy
tắc nhất quán để bác bỏ H0.
© Nguyễn Tiến Dũng Thống kê ứng dụng
6
8.1.4 Sai lầm Kiểu I và Sai lầm Kiểu II
● Sai lầm Kiểu I ● Sai lầm alpha ● Alpha = P(Bác bỏ
● Sai lầm Kiểu II ● Sai lầm beta ● Beta = P(Chấp nhận
H0/H0 sai)
H0/H0 đúng) ● ● Giảm alpha Giảm
Sai lầm Kiểu I Tăng nguy cơ mắc Sai lầm Kiểu II
● ● Hiệu lực của KĐ ● Chấp nhận H0 -> nguy mắc sai lầm kiểu II
● Bác bỏ được H0, chỉ mắc Sai lầm Kiểu I
Thống kê ứng dụng © Nguyễn Tiến Dũng
7
8.1.5 Mức ý nghĩa của KĐ
● 8.1.5 Mức ý nghĩa của KĐ (Significance level)
● Alpha: sai lầm phạm phải khi bác bỏ H0 ● CL = (1 – α).100% là độ tin cậy của KĐ ● Giá trị thường dùng: CL = 95% hay α = 0,05
© Nguyễn Tiến Dũng Thống kê ứng dụng
8
8.1.6 Xác suất tới hạn (p-value)
● Khi giảm α, khoảng ước lượng rộng ra khả
năng bác bỏ H0 giảm
● Xác suất tới hạn p-value = giá trị nhỏ nhất của α mà tại đó không thể bác bỏ H0 được nữa
● TD: n=100; s=10 ● α1 = 0,1 (90%) z α1/2= 1,645 ● α2 = 0,05 (95%) z α2/2= 1,96
© Nguyễn Tiến Dũng Thống kê ứng dụng
9
8.1.7 KĐ một bên và KĐ hai bên
Kiểm định bên phải
Kiểm định bên trái
Kiểm định hai bên
© Nguyễn Tiến Dũng Thống kê ứng dụng
10
8.2 KIỂM ĐỊNH GIẢ THUYẾT TRÊN MỘT TỔNG THỂ
● 8.2.1 KĐGT về TB tổng thể ● 8.2.2 KĐGT về tỷ lệ tổng thể ● 8.2.3 KĐGT về phương sai tổng thể
© Nguyễn Tiến Dũng Thống kê ứng dụng
11
8.2.1 KĐGT về TB tổng thể
● Quy trình KĐ
1. Lập cặp giả thuyết KĐ H0 và H1 và nhận diện bài toán KĐ
là hai bên, bên trái hay bên phải
2. Chọn mức ý nghĩa a 3. XĐ giá trị tính toán (giá trị thống kê) của chỉ tiêu KĐ: zStat,
tStat … (SGK: ztt, ttt …)
4. Có 2 cách tiếp cận:
●
●
Cách 1 (Cách tiếp cận giá trị tới hạn): XĐ giá trị tra bảng chỉ tiêu KĐ: za, za/2, ta, ta/2 ... Cách 2 (Cách tiếp cận xác suất tới hạn hay p-value): từ chỉ tiêu KĐ tính -> tính ra p-value.
5. Áp dụng quy tắc bác bỏ H0 để ra quyết định về việc bác
bỏ hay chấp chận H0
● ●
Cách 1: So sánh giá trị tính toán với giá trị tra bảng của chỉ tiêu KĐ Cách 2: So sánh p-value và a
6. Kết luận
© Nguyễn Tiến Dũng Thống kê ứng dụng
12
8.2.1.1 Trường hợp biết phương sai tổng thể
● Chỉ tiêu KĐ zStat ● Quy tắc bác bỏ H0 (theo giá trị tới
hạn)
© Nguyễn Tiến Dũng Thống kê ứng dụng
13
8.2.1.2 Trường hợp không biết phương sai tổng thể, cỡ mẫu lớn (n≥30)
● Chỉ tiêu KĐ chính xác cần là tStat ● Do cỡ mẫu lớn, xấp xỉ t bằng z cho đơn
giản -> cChỉ tiêu KĐ zStat
● Thay PS tổng thể bằng PS mẫu ● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
14
8.2.1.3 Trường hợp không biết phương sai tổng thể, cỡ mẫu nhỏ (n< 30)
● Chỉ tiêu KĐ tStat ● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
15
8.2.1.4 Cách tiếp cận p-value trong việc bác bỏ H0
● Tính chỉ tiêu KĐ zStat hoặc tStat (tính) ● Tìm xác suất P tương ứng với bài toán KĐ (hai bên, bên trái, bên phải). Đó chính là p- value ● KĐ hai bên: p-value = 2.P(z ≥ |zStat|) ● KĐ bên trái: p-value = P(z ≤ zStat) ● KĐ bên phải: p-value = P(z ≥ zStat)
● So sánh giá trị p-value với α ● Nếu p-value < α thì bác bỏ H0 ● Nếu p-value ≥ α thì chấp nhận H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
16
8.2.2 KĐGT về tỷ lệ tổng thể
● Điều kiện cỡ mẫu đủ lớn:
● np ≥ 5 ● n(1-p) ≥ 5 ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
17
8.2.3 KĐGT về phương sai tổng thể
● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0
KĐ bên trái
KĐ hai bên
KĐ bên phải
© Nguyễn Tiến Dũng Thống kê ứng dụng
18
Phân phối Chi bình phương
© Nguyễn Tiến Dũng Thống kê ứng dụng
19
KĐ Chi bình phương
KĐ bên trái
KĐ hai bên
KĐ bên phải
© Nguyễn Tiến Dũng Thống kê ứng dụng
20
© Nguyễn Tiến Dũng Thống kê ứng dụng
21
8.3 KĐGT TRÊN HAI TỔNG THỂ
● 8.3.1 KĐGT về chênh lệch của 2 TB tổng thể ● 8.3.2 KĐGT về chênh lệch của 2 tỷ lệ tổng thể ● 8.3.3 KĐGT về tính bằng nhau của 2 phương
sai tổng thể
© Nguyễn Tiến Dũng Thống kê ứng dụng
22
8.3.1 KĐGT về chênh lệch của hai TB tổng thể
● 8.3.1.1 Trường hợp 2 mẫu độc lập, biết PS
● Giả thuyết KĐ ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
23
8.3.1.2 Trường hợp 2 mẫu độc lập, không biết PS, cỡ mẫu lớn
● Thay PS tổng thể bằng PS mẫu
© Nguyễn Tiến Dũng Thống kê ứng dụng
24
8.3.1.3 Trường hợp 2 mẫu độc lập, không biết phương sai, cỡ mẫu nhỏ
● Giả định 2 tổng thể có phân phối normal ● Trường hợp A: PS 2 tổng thể bằng nhau
thay 2 PS mẫu bằng 1 PS chung
© Nguyễn Tiến Dũng Thống kê ứng dụng
25
● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
26
8.3.1.3 Trường hợp 2 mẫu độc lập, không biết PS tổng thể, cỡ mẫu nhỏ (tiếp)
● Trường hợp B: 2 PS tổng thể khác nhau
● Chỉ tiêu KĐ t ● Số bậc tự do df
© Nguyễn Tiến Dũng Thống kê ứng dụng
27
● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
28
8.1.3.4 Trường hợp 2 mẫu cặp
● Tổng thể 1: x1 ● Tổng thể 2: x2 ● Tạo biến chênh lệch d = x1 – x2 hay di = x1i – x2i ● Trở về trường hợp KĐGT trên 1 tổng thể d ● Nếu n ≥ 30 thì chỉ tiêu KĐ là z ● Nếu n < 30 thì chỉ tiêu KĐ là t ● TD Trang 236 về so sánh tốc độ xử lý của 2 phần mềm
hoặc
© Nguyễn Tiến Dũng Thống kê ứng dụng
29
● Quy tắc bác bỏ H0 (n <30)
© Nguyễn Tiến Dũng Thống kê ứng dụng
30
8.3.1.5 Ứng dụng Excel
● Data Analysis ● MegaStat
© Nguyễn Tiến Dũng Thống kê ứng dụng
31
8.3.2 KĐGT về chênh lệch giữa 2 tỷ lệ tổng thể
● 8.3.2.1 Phương pháp dùng phân phối Z
● Kiểm tra GT cỡ mẫu đủ lớn
● n1p1 ≥ 5; n1.(1-p1) ≥ 5 ● n2p2 ≥ 5; n2.(1-p2) ≥ 5
● Giả thuyết KĐ ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0
© Nguyễn Tiến Dũng Thống kê ứng dụng
32
© Nguyễn Tiến Dũng Thống kê ứng dụng
33
8.3.3 KĐGT về tính bằng nhau của 2 PS tổng thể
● Quy tắc thuận tiện: KĐ 2 bên hoặc KĐ bên phải
© Nguyễn Tiến Dũng Thống kê ứng dụng