CHƯƠNG 8 KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ CỦA TỔNG THỂ

Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn

MỤC TIÊU CỦA CHƯƠNG

● Sau khi học xong chương này, người học sẽ

● Hiểu được kiểm định là gì và biết cách lập cặp giả thuyết KĐ phù hợp với các bài toán KĐ 2 bên, bên trái và bên phải

● Nắm được quy trình KĐGT tổng quát ● Kể tên được các chỉ tiêu KĐ với bài toán KĐGT trên một tổng thể (trung bình, tỷ lệ, phương sai) ● Biết cách xác định xác suất tới hạn để bác bỏ H0

p-value

● Phát biểu và nêu được chỉ tiêu KĐ với các bài toán KĐGT trên hai tổng thể (trung bình, tỷ lệ, phương sai)

© Nguyễn Tiến Dũng Thống kê ứng dụng

2

CÁC NỘI DUNG CHÍNH

8.1 Các vấn đề chung về kiểm định 8.2 KĐ giả thuyết trên một tổng thể 8.3 KĐ giả thuyết trên hai tổng thể

© Nguyễn Tiến Dũng Thống kê ứng dụng

3

8.1 CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH

● 8.1.1 Đặt giả thuyết về tham số tổng thể

● Cặp giả thuyết H0 (giả thuyết không) và H1(Ha) (giả

thuyết đối)

● TD1: Một nghiên cứu muốn tìm hiểu mối liên hệ

giữa thời gian tự học và KQ học tập (GPA) ● Giả thuyết NC (nghi vấn khoa học): Giữa thời gian tự học

và GPA có mối liên hệ

● H0: Giữa thời gian tự học và GPA KHÔNG có mối liên hệ ● H1: Giữa thời gian tự học và GPA có mối liên hệ ● Để chứng minh nghi vấn của người NC là đúng, thì

người NC sẽ phải: thu thập DL  bác bỏ H0.

© Nguyễn Tiến Dũng Thống kê ứng dụng

4

● 8.1.2 Một số nguyên tắc liên quan đến việc

đặt giả thuyết ● H0:

● trạng thái bình thường; trạng thái gốc, không có dữ liệu

chứng minh

● phải có dấu bằng, không có liên hệ;

● H1:

● trạng thái ngược lại H0, không có dấu bằng, có liên hệ,

thể hiện nghi vấn của người nghiên cứu ● đòi hỏi dữ liệu, bằng chứng để chứng minh

● Bác bỏ H0 tức chấp nhận H1 là đúng ● TD: Khối lượng gói ngũ cốc µ = 368g

© Nguyễn Tiến Dũng Thống kê ứng dụng

5

8.1.3 Logic của bài toán kiểm định

● Nếu TB mẫu rất khác so với giá trị cần KĐ thì bằng

trực giác có thể bác bỏ H0 mà không cần KĐ

● Nếu TB mẫu gần với giá trị cần KĐ, cần một quy

tắc nhất quán để bác bỏ H0.

© Nguyễn Tiến Dũng Thống kê ứng dụng

6

8.1.4 Sai lầm Kiểu I và Sai lầm Kiểu II

● Sai lầm Kiểu I ● Sai lầm alpha ● Alpha = P(Bác bỏ

● Sai lầm Kiểu II ● Sai lầm beta ● Beta = P(Chấp nhận

H0/H0 sai)

H0/H0 đúng) ● ● Giảm alpha  Giảm

Sai lầm Kiểu I  Tăng nguy cơ mắc Sai lầm Kiểu II

● Hiệu lực của KĐ ● Chấp nhận H0 -> nguy mắc sai lầm kiểu II

● Bác bỏ được H0, chỉ mắc Sai lầm Kiểu I

Thống kê ứng dụng © Nguyễn Tiến Dũng

7

8.1.5 Mức ý nghĩa của KĐ

● 8.1.5 Mức ý nghĩa của KĐ (Significance level)

● Alpha: sai lầm phạm phải khi bác bỏ H0 ● CL = (1 – α).100% là độ tin cậy của KĐ ● Giá trị thường dùng: CL = 95% hay α = 0,05

© Nguyễn Tiến Dũng Thống kê ứng dụng

8

8.1.6 Xác suất tới hạn (p-value)

● Khi giảm α, khoảng ước lượng rộng ra  khả

năng bác bỏ H0 giảm

● Xác suất tới hạn p-value = giá trị nhỏ nhất của α mà tại đó không thể bác bỏ H0 được nữa

● TD: n=100; s=10 ● α1 = 0,1 (90%)  z α1/2= 1,645 ● α2 = 0,05 (95%)  z α2/2= 1,96

© Nguyễn Tiến Dũng Thống kê ứng dụng

9

8.1.7 KĐ một bên và KĐ hai bên

Kiểm định bên phải

Kiểm định bên trái

Kiểm định hai bên

© Nguyễn Tiến Dũng Thống kê ứng dụng

10

8.2 KIỂM ĐỊNH GIẢ THUYẾT TRÊN MỘT TỔNG THỂ

● 8.2.1 KĐGT về TB tổng thể ● 8.2.2 KĐGT về tỷ lệ tổng thể ● 8.2.3 KĐGT về phương sai tổng thể

© Nguyễn Tiến Dũng Thống kê ứng dụng

11

8.2.1 KĐGT về TB tổng thể

● Quy trình KĐ

1. Lập cặp giả thuyết KĐ H0 và H1 và nhận diện bài toán KĐ

là hai bên, bên trái hay bên phải

2. Chọn mức ý nghĩa a 3. XĐ giá trị tính toán (giá trị thống kê) của chỉ tiêu KĐ: zStat,

tStat … (SGK: ztt, ttt …)

4. Có 2 cách tiếp cận:

Cách 1 (Cách tiếp cận giá trị tới hạn): XĐ giá trị tra bảng chỉ tiêu KĐ: za, za/2, ta, ta/2 ... Cách 2 (Cách tiếp cận xác suất tới hạn hay p-value): từ chỉ tiêu KĐ tính -> tính ra p-value.

5. Áp dụng quy tắc bác bỏ H0 để ra quyết định về việc bác

bỏ hay chấp chận H0

● ●

Cách 1: So sánh giá trị tính toán với giá trị tra bảng của chỉ tiêu KĐ Cách 2: So sánh p-value và a

6. Kết luận

© Nguyễn Tiến Dũng Thống kê ứng dụng

12

8.2.1.1 Trường hợp biết phương sai tổng thể

● Chỉ tiêu KĐ zStat ● Quy tắc bác bỏ H0 (theo giá trị tới

hạn)

© Nguyễn Tiến Dũng Thống kê ứng dụng

13

8.2.1.2 Trường hợp không biết phương sai tổng thể, cỡ mẫu lớn (n≥30)

● Chỉ tiêu KĐ chính xác cần là tStat ● Do cỡ mẫu lớn, xấp xỉ t bằng z cho đơn

giản -> cChỉ tiêu KĐ zStat

● Thay PS tổng thể bằng PS mẫu ● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

14

8.2.1.3 Trường hợp không biết phương sai tổng thể, cỡ mẫu nhỏ (n< 30)

● Chỉ tiêu KĐ tStat ● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

15

8.2.1.4 Cách tiếp cận p-value trong việc bác bỏ H0

● Tính chỉ tiêu KĐ zStat hoặc tStat (tính) ● Tìm xác suất P tương ứng với bài toán KĐ (hai bên, bên trái, bên phải). Đó chính là p- value ● KĐ hai bên: p-value = 2.P(z ≥ |zStat|) ● KĐ bên trái: p-value = P(z ≤ zStat) ● KĐ bên phải: p-value = P(z ≥ zStat)

● So sánh giá trị p-value với α ● Nếu p-value < α thì bác bỏ H0 ● Nếu p-value ≥ α thì chấp nhận H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

16

8.2.2 KĐGT về tỷ lệ tổng thể

● Điều kiện cỡ mẫu đủ lớn:

● np ≥ 5 ● n(1-p) ≥ 5 ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

17

8.2.3 KĐGT về phương sai tổng thể

● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0

KĐ bên trái

KĐ hai bên

KĐ bên phải

© Nguyễn Tiến Dũng Thống kê ứng dụng

18

Phân phối Chi bình phương

© Nguyễn Tiến Dũng Thống kê ứng dụng

19

KĐ Chi bình phương

KĐ bên trái

KĐ hai bên

KĐ bên phải

© Nguyễn Tiến Dũng Thống kê ứng dụng

20

© Nguyễn Tiến Dũng Thống kê ứng dụng

21

8.3 KĐGT TRÊN HAI TỔNG THỂ

● 8.3.1 KĐGT về chênh lệch của 2 TB tổng thể ● 8.3.2 KĐGT về chênh lệch của 2 tỷ lệ tổng thể ● 8.3.3 KĐGT về tính bằng nhau của 2 phương

sai tổng thể

© Nguyễn Tiến Dũng Thống kê ứng dụng

22

8.3.1 KĐGT về chênh lệch của hai TB tổng thể

● 8.3.1.1 Trường hợp 2 mẫu độc lập, biết PS

● Giả thuyết KĐ ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

23

8.3.1.2 Trường hợp 2 mẫu độc lập, không biết PS, cỡ mẫu lớn

● Thay PS tổng thể bằng PS mẫu

© Nguyễn Tiến Dũng Thống kê ứng dụng

24

8.3.1.3 Trường hợp 2 mẫu độc lập, không biết phương sai, cỡ mẫu nhỏ

● Giả định 2 tổng thể có phân phối normal ● Trường hợp A: PS 2 tổng thể bằng nhau 

thay 2 PS mẫu bằng 1 PS chung

© Nguyễn Tiến Dũng Thống kê ứng dụng

25

● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

26

8.3.1.3 Trường hợp 2 mẫu độc lập, không biết PS tổng thể, cỡ mẫu nhỏ (tiếp)

● Trường hợp B: 2 PS tổng thể khác nhau

● Chỉ tiêu KĐ t ● Số bậc tự do df

© Nguyễn Tiến Dũng Thống kê ứng dụng

27

● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

28

8.1.3.4 Trường hợp 2 mẫu cặp

● Tổng thể 1: x1 ● Tổng thể 2: x2 ● Tạo biến chênh lệch d = x1 – x2 hay di = x1i – x2i ● Trở về trường hợp KĐGT trên 1 tổng thể d ● Nếu n ≥ 30 thì chỉ tiêu KĐ là z ● Nếu n < 30 thì chỉ tiêu KĐ là t ● TD Trang 236 về so sánh tốc độ xử lý của 2 phần mềm

hoặc

© Nguyễn Tiến Dũng Thống kê ứng dụng

29

● Quy tắc bác bỏ H0 (n <30)

© Nguyễn Tiến Dũng Thống kê ứng dụng

30

8.3.1.5 Ứng dụng Excel

● Data Analysis ● MegaStat

© Nguyễn Tiến Dũng Thống kê ứng dụng

31

8.3.2 KĐGT về chênh lệch giữa 2 tỷ lệ tổng thể

● 8.3.2.1 Phương pháp dùng phân phối Z

● Kiểm tra GT cỡ mẫu đủ lớn

● n1p1 ≥ 5; n1.(1-p1) ≥ 5 ● n2p2 ≥ 5; n2.(1-p2) ≥ 5

● Giả thuyết KĐ ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng

32

© Nguyễn Tiến Dũng Thống kê ứng dụng

33

8.3.3 KĐGT về tính bằng nhau của 2 PS tổng thể

● Quy tắc thuận tiện: KĐ 2 bên hoặc KĐ bên phải

© Nguyễn Tiến Dũng Thống kê ứng dụng

34