TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ

EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH

CHƯƠNG 5:

ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỀ

THAM SỐ TỔNG THỂ

Nội dung chính

5.1 Phân phối của các tham số mẫu (Bài giảng video)

5.2 Lý thuyết về ước lượng và kiểm định

5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)

5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)

5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định

5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh

2

EM3230 Thống kê ứng dụng

Nội dung chính

5.1 Phân phối của các tham số mẫu (Bài giảng video)

5.2 Lý thuyết về ước lượng và kiểm định (Bài giảng video)

5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)

5.4 Ước lượng tỷ lệ cho một tổng thể

5.5 Ước lượng phương sai tổng thể

5.6 Xác định cỡ mẫu cho bài toán ước lượng

5.7 Ước lượng trên hai mẫu (Bài giảng video)

3

EM3230 Thống kê ứng dụng

Mục tiêu của chương

Sau khi học xong chương này người học có thể:

§ Nắm được những vấn đề cơ bản về phân phối của hai đại lượng chính của mẫu là trung bình

mẫu và tỷ lệ mẫu

§ Hiểu ý nghĩa của hệ số hiệu chỉnh tổng thể hữu hạn trong việc điều chỉnh độ lệch chuẩn của

trung bình mẫu và tỷ lệ mẫu

§ Nắm được các khái niệm: Khoảng tin cậy, độ tin cậy, mức ý nghĩa alpha, và mối liên hệ giữa

tham số mẫu và tham số tổng thể

§ Biết cách xác định ước lượng khoảng và kiểm định cho trung bình

§ Hiểu phân phối Student và biết cách tra bảng xác suất phân phối student

§ Biết cách xác định cỡ mẫu khi cần hạn chế sai số do lấy mẫu

§ Biết cách xác định ước lượng khoảng và kiểm định đối với các chênh lệch trung bình và tỷ lệ

của hai tổng thể

4

EM3230 Thống kê ứng dụng

5.1 Phân phối của tham số mẫu

5.1.1 Giới thiệu chung về phân phối của tham số mẫu

5.1.2 Phân phối của trung bình mẫu

5.1.3 Phân phối của tỷ lệ mẫu

5

EM3230 Thống kê ứng dụng

5.1.1 Giới thiệu chung về phân phối của tham số mẫu

§ Lẫy mẫu ngẫu nhiên từ tổng thể. Có nhiều cách lấy mẫu khác nhau

§ Tham số thống kê tính được từ các mẫu cũng sẽ là biến số ngẫu nhiên

Trung bình mẫu/ tỷ lệ mẫu tuân theo quy luật phân phối nào?

Tổng thể có phân phối chuẩn/ nhị thức

6

EM3230 Thống kê ứng dụng

5.1.1 Giới thiệu chung về phân phối của tham số mẫu

§ Phân phối của tham số mẫu là phân phối xác suất của các giá trị có thể có của tham số

mẫu (trung bình, phương sai) khi nó được tính toán từ những mẫu ngẫu nhiên có cùng

kích thước mẫu được lấy ra từ tổng thể nhất định

§ Từ tổng thể X ta lấy ra 1 mẫu ngẫu nhiên kích thước n.

§ Gọi !𝑋 là trung bình mẫu thì !𝑋 cũng là một biến ngẫu nhiên. Giá trị của nó thay đổi theo

cách chọn mẫu.

§ Quy luật phân phối của trung bình mẫu phụ thuộc vào quy luật phân phối của tổng thể

X và kích thước mẫu n.

7

EM3230 Thống kê ứng dụng

5.1 Phân phối của trung bình mẫu

Giá trị trung bình của tất cả trung bình mẫu cùng kích thước lấy ra từ một tổng thể bằng đúng giá

trị trung bình tổng thể, được coi là ước lượng không chệch của trung bình tổng thể.

Độ lệch chuẩn của trung bình mẫu: Do tổng thể bao gồm các giá trị cá biệt nên độ biến thiên rất

rộng, trong khi đó, các giá trị trung bình mẫu đã tính bù trừ nên ít dao động hơn so với giá trị

trung bình của trung bình mẫu, khi cỡ mẫu càng lớn, sự bù trừ càng tăng, do đó, độ lệch chuẩn

của trung bình mẫu càng nhỏ.

à Cần Hệ số hiệu chỉnh tổng thể hữu hạn (Finite Population Correction Factor)

8

EM3230 Thống kê ứng dụng

5.1 Phân phối của trung bình mẫu

Hệ số hiệu chỉnh tổng thể hữu hạn - FPC

# $

𝑵"𝒏

v Khi n/N=<0.05 𝜎 !" =

𝜎 !" =

𝑵"𝟏

∗ 𝑵"𝒏 𝑵"𝟏

# $

v Khi n/N > 0.05 𝑭𝑷𝑪 =

9

EM3230 Thống kê ứng dụng

5.1 Phân phối của trung bình mẫu

X~ N(µ; 𝛔2) : (X~ N(µ; 𝛔2/n)

X~ N(µ; 𝛔2) : Áp dụng định lý giới hạn trung tâm

(CLT- Center Limit Theory)

Định lý giới hạn trung tâm

Khi kích thước mẫu n đủ lớn, phân phối của trung bình mẫu sẽ có dạng xấp xỉ

chuẩn bất kể quy luật phân phối của tổng thể X như thế nào.

10

EM3230 Thống kê ứng dụng

CLT

§ Định lý giới hạn trung tâm

11

EM3230 Thống kê ứng dụng

5.1 Phân phối của trung bình mẫu

Hệ quả của định lý giới hạn trung tâm

Ø Với kích thước mẫu n đủ lớn (≥30) thì trung bình mẫu sẽ phân phối chuẩn bất

kể quy luật phân phối XS của tổng thể như thế nào

Ø Nếu phân phối tổng thể là tương đối đối xứng thì phân phối của trung bình mẫu

sẽ có dạng phân phối xấp xỉ chuẩn với kích thước mẫu ≥5

Ø Nếu phân phối của tổng thể phân phối chuẩn thì trung bình mẫu sẽ phân phối

chuẩn với bất kỳ kích thước mẫu nào

12

EM3230 Thống kê ứng dụng

5.1 Phân phối của trung bình mẫu

Ví dụ:

Gọi X là thời gian ngừng máy trong 1 ca sản xuất.

X tuân theo quy luật phân phối chuẩn với trung bình là 12 phút, độ lệch chuẩn 2 phút.

Điều tra ngẫu nhiên 36 ca làm việc. Tính xác suất để thời gian ngừng máy trung bình

X~ N(µ; 𝛔2) : %X~ N(µ; 𝛔2/n)

P X (

11)

P Z (

)

3) 1

F

(3) 1 0,9986

<

=

<

=

( P Z <-=- =-

11 12 - 2 / 36

của 36 ca nhỏ hơn 11 phút.

13

EM3230 Thống kê ứng dụng

5.2 Phân phối của tỷ lệ mẫu

§ Giả sử tổng thể có kích thước N trong đó có M đơn vị mang dấu hiệu A mà

chúng ta quan tâm. Gọi p là tỷ lệ tổng thể :

p =

M N

§

Lấy ngẫu nhiên một mẫu kích thước n từ tổng thể trên, trong đó có X đơn vị

mang dấu hiệu A. Gọi px là tỷ lệ mẫu

p

=

x

X n

§

px là một biến ngẫu nhiên, nhận các giá trị khác nhau với các mẫu cùng kích

thước n lấy ra từ tổng thể nhất định.

14

EM3230 Thống kê ứng dụng

5.2 Phân phối của tỷ lệ mẫu

§

Phân phối của tỷ lệ mẫu px có thể được gọi là phân phối của tỷ lệ mẫu khi lấy mẫu có hòan trả thì phân phối của tỷ lệ mẫu có dạng nhị thức với 𝞵=np và 𝛔2=np(1-p)

§ Tuy nhiên có thể sử dụng phân phối xấp xỉ chuẩn khi cỡ mẫu n≥30 và np &nq ≥5.

Với X là số lượt thực hiện thành công phép thử, thì ta có thể vận dụng phân phối

p

X

µ

Z

=

=

=

=

X np - (1 p np

)

/ np

/ ) /

(1

p

xp p

- (1

p

)

-

X n np n - n -

- d 𝜎

- n

chuẩn hóa:

§

px~ N(p;p(1-p)/n)

15

EM3230 Thống kê ứng dụng

5.2 Phân phối của tỷ lệ mẫu

Ví dụ: Điều tra một mẫu ngẫu nhiên gồm 50 hộ gia đình về tình hình tham gia bảo hiểm phi

nhân thọ. Câu hỏi điều tra là bạn hay bất kỳ thành viên nào khác trong gia đình bạn có

tham gia đóng bảo hiểm phi nhân thọ hay không.

Tính xác suất để tỷ lệ trả lời có là 40%. Biết tỷ lệ tổng thể là 0,3.

Gọi p là tỷ lệ hộ gia đình có thành viên tham gia bảo hiểm của tổng thể p=0,3

Ta có n =50 là đủ lớn nên tỷ lệ mẫu px~ N(p;p(1-p)/n)

)4,0

ZP (

)

ZP (

1182

,0

3818

>

=

>

=

>

5,0)56,1 =

-

j

,05,0)56,1( =

-

=

pP x (

3,04,0 - 064,0

px~ N(0,3;0,0042) , µ = 0,3 ; 𝛔= 0.0042=0,064

16

EM3230 Thống kê ứng dụng

5.2 Phân phối của tỷ lệ mẫu

Hệ số hiệu chỉnh tổng thể hữu hạn – FPC cho sai số chuẩn của tỷ lệ mẫu

Khi n/N=<0.05

𝝈𝒑𝒙 =

𝒑(𝟏 − 𝒑) 𝒏

.

𝝈𝒑𝒙 =

Khi n/N > 0.05 𝑭𝑷𝑪 =

𝒑(𝟏 − 𝒑) 𝒏

𝑵 − 𝒏 𝑵 − 𝟏

𝑵&𝒏 𝑵&𝟏

17

EM3230 Thống kê ứng dụng

Nội dung chính

5.1 Phân phối của các tham số mẫu (Bài giảng video)

5.2 Lý thuyết về ước lượng và kiểm định

5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)

5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)

5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định

5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh

18

EM3230 Thống kê ứng dụng

5.2 Lý thuyết về ước lượng và kiểm định

5.2.1. Lý thuyết về ước lượng

5.2.2. Lý thuyết về kiểm định

19

EM3230 Thống kê ứng dụng

5.2.1 Lý thuyết về ước lượng

§

Trên thực tế, rất khó để biết toàn bộ thông tin về tổng thể mà phải dựa vào điều tra chọn mẫu,

§

Thống kê suy diễn là việc sử dụng các thông tin trên mẫu để rút ra kết luận về các đặc điểm của

tổng thể.

§ Ước lượng là một công cụ của thống kê suy diễn.

§ Ước lượng thống kê là việc xác định các tham số của tổng thể từ các tham số mẫu.

§ Có 2 loại ước lượng:

§ Ước lượng điểm (Point estimation) và

§ Ước lượng khoảng (Confidence interval)

20

EM3230 Thống kê ứng dụng

5.2.1 Lý thuyết về ước lượng

Mẫu ngẫu nhiên

Tổng thể

Trung bình tổng thể nằm trong khoảng (45;55) với độ tin cậy 95%

Trung bình mẫu

Trung bình µ chưa biết

Ước lượng điểm của trung bình tổng thể bằng 50

50X =

Mẫu

© 1984-1994 T/Maker Co.

21

EM3230 Thống kê ứng dụng

5.2.1 Lý thuyết về ước lượng

§ Ước lượng điểm

Ước lượng tham số của tổng thể Giá trị thống kê mẫu

Trung bình

x

Tỷ lệ

xp

Phương sai

2s

Sự khác biệt

x 1

x- 2

µ p 2s 2µ µ-

1

22

EM3230 Thống kê ứng dụng

5.2.1 Lý thuyết về ước lượng

§ Ước lượng khoảng

v Là quá trình xác định 1 khoảng các giá trị mà tham số của tổng thể sẽ rơi vào trong khoảng đó

với một độ tin cậy nhất định.

v Khoảng tin cậy là khoảng các giá trị mà 1 tham số tổng thể rơi vào trong khoảng đó với 1 độ tin

cậy nhất định.

v Độ tin cậy là xác suất để tham số chưa biết của tổng thể rơi vào khoảng tin cậy

v Các giá trị L (lower limit/ bound) và U (Upper limit/ bound) được gọi là giới hạn dưới (cận dưới)

+ Sai số

- Sai số

và giới hạn trên (cận trên) của ước lượng

Ước lượng điểm

(U) Cận trên của khoảng tin cậy

(L) Cận dưới của khoảng tin cậy

Độ rộng/ Bề rộng của khoảng tin cậy

23

EM3230 Thống kê ứng dụng

5.2.1 Lý thuyết về ước lượng

§ Ước lượng khoảng: Một số thuật ngữ

v Độ tin cậy (Confidence level): được ký hiệu dưới dạng xác suất 1-a hoặc dạng % là 100(1- a)%.

v Giá trị tới hạn (Critical value), nếu Z là một biến phân phối chuẩn hóa thì ta có hai giá trị tới hạn

là Z a /2 và -Z a /2 tuân theo định nghĩa

f(Z)

P(-Za /2

1-a

a

Độ tin cậy

|Za/2|

80%

0,2

1,28

85%

0,15

1,44

90%

0,1

1,645

0.5

0.5

a/2

a/2

95%

0,05

1,96

98%

0,02

2,33

Z

0

-Za/2

Za/2

99%

0,01

2,58

24

EM3230 Thống kê ứng dụng

5.2.2 Lý thuyết về kiểm định

1) Đặt giả thuyết về tham số tổng thể

2) Một số nguyên tắc liên quan đến việc đặt giả thuyết

3) Logic của bài toán kiểm định

4) Xác suất sai lầm loại I và loại II

5) Mức ý nghĩa của kiểm định – Significance level

6) Kiểm định một bên và hai bên

7) Giá trị tới hạn – Critical value

8) Cách tiếp cận p-value

25

EM3230 Thống kê ứng dụng

(1) Đặt giả thuyết về tham số tổng thể

Tôi cho rằng trọng lượng

TB của sản phẩm là nhỏ

§ Giả thuyết là một phát biểu, một nhận

hơn 455 g.

định, một đề xuất, một tuyên bố về tham số của tổng thể

§

Kiểm định giả thuyết là kiểm tra tính hợp lý của một tuyên bố về tổng thể.

§ Đặt giả thuyết là bước đầu tiên trong thủ

tục kiểm định

§

H0: µ≥455 H1: µ< 455

Luôn phải có 1 cặp giả thuyết H0 (giả thuyết không- Null Hypothesis) và H1 (giả thuyết đối – Alternative Hypothesis)

§ Hai quyết định/ kết quả của kiểm định: Bác bỏ H0 hoặc KHÔNG bác bỏ H0

26

EM3230 Thống kê ứng dụng

(2) Nguyên tắc đặt giả thuyết

Giả thuyết H0: Giả thuyết H1

• thường mô tả trạng thái ban đầu • mô tả trạng thái đối ngược của giả thiết H0

của hiện tượng

• không có dấu bằng, có liên hệ, thể hiện

• Luôn phải có dấu bằng, không có

nghi vấn của người nghiên cứu ≠ , >, <

liên hệ =, ≤ , ≥

• không có dữ liệu chứng minh

• đòi hỏi dữ liệu,bằng chứng để chứng minh (Để chứng minh H1 đúng thì nhà nghiên cứu phải thu thập dữ liệu để bác bỏ H0)

27

EM3230 Thống kê ứng dụng

(2) Nguyên tắc đặt giả thuyết

§ Nếu bác bỏ H0 thì có bằng chứng thống kê rằng giả thuyết đối H1 là đúng

§ Nếu không có bằng chứng bác bỏ H0 tức là thất bại trong việc chứng minh H1 là đúng,

§ Tuy nhiên thất bại trong việc chứng minh H1 là đúng không có nghĩa là H0 đúng.

28

EM3230 Thống kê ứng dụng

(3) Logic của bài toán kiểm định

§ Khối lượng quy định là 455g

§ Trung bình mẫu lấy ra kiểm tra đạt 454.99g, hoặc 430g.

Sự khác biệt quá lớn hoặc quá nhỏ: Không cần kiểm định

§ Trung bình mẫu đạt 453.2 g, chưa đủ rõ ràng để ra quyết định à CẦN KIỂM ĐỊNH

bằng cách:

§ Tính toán giá trị kiểm định thống kê căn cứ vào số liệu mẫu

§ Sử dụng phân phối của giá trị kiểm định để quyết định giá trị kiểm định này có cho

phép bác bỏ H0 hay không?

30

EM3230 Thống kê ứng dụng

(4) Xác suất sai lầm loại I và loại II

Sai số do điều tra/ sai số ngẫu nhiên à 2 loại sai lầm.

H0 đúng

H0 sai

Bác bỏ

Sai lầm loại I (a)

Chấp nhận

Sai lầm loại II (b)

§ Giá trị a cho phép xác định diện tích vùng bác bỏ H0 § Nếu giá trị kiểm định tính toán được từ các thông tin của mẫu rơi vào vùng này thì ta sẽ quyết

định bác bỏ H0.

§ Khi a tăng, khả năng bác bỏ H0 giảm nên khả năng phạm sai lầm loại I nhỏ đi nhưng khả năng

mắc sai lầm loại II tăng lên (trong trường hợp cỡ mẫu không đổi)

31

EM3230 Thống kê ứng dụng

(5) Mức ý nghĩa của kiểm định – Significance level

§ Alpha- a: giá trị xác suất phạm sai lầm loại I: cần ấn định trước khi tiến hành kiểm định

§

a phụ thuộc vào mức độ tổn thất người làm kiểm định có thể “chịu đựng” nếu sai lầm loại I xảy

ra

§

a .100% khả năng phạm phải lỗi đã bác bỏ H0 khi thực tế nó đúng.

§

a - mức ý nghĩa của kiểm định

§

Ta tin rằng (1-a) .100% là ta đã quyết định đúng (Độ tin cậy)

33

EM3230 Thống kê ứng dụng

(6) Kiểm định một bên và hai bên

§ Kiểm định 2 bên là loại kiểm định được sử dụng để xác định xem liệu tham số tổng thể khác biệt

(¹) một cách đáng kể so với giá trị giả thuyết hay không. KĐ 2 bên có 2 miền bác bỏ nằm ở 2

bên của của phân phối.

H0:µ = µ0 H1: µ ≠ µ0

34

EM3230 Thống kê ứng dụng

(7) Kiểm định một bên và hai bên

Kiểm định 1 bên

§

KĐ bên trái: KĐ xem liệu tham số của tổng thể có nhỏ hơn một cách đáng kể so với giá trị giả

thuyết không?

§

KĐ bên phải: KĐ xem liệu tham số của tổng thể có lớn hơn một cách đáng kể so với giá trị giả

thuyết không?

H0:µ ³ µ0 H1: µ < µ0

H0:µ £ µ0 H1: µ > µ0

35

EM3230 Thống kê ứng dụng

(8) Giá trị tới hạn – Critical value

§ Giá trị a giúp xác định vùng diện tích bác bỏ H0, và vùng chấp nhận H0.

§ Giá trị tới hạn chính là biên giới giữa hai vùng chấp nhận và bác bỏ H0

Vùng chưa đủ bằng chứng bác bỏ H0

Bác bỏ

Giá trị tới hạn

Vùng chưa đủ bằng chứng bác bỏ H0

Bác bỏ

Bác bỏ

Giá trị tới hạn

Giá trị tới hạn

Vùng chưa đủ bằng chứng bác bỏ H0

Bác bỏ

Giá trị tới hạn

36

EM3230 Thống kê ứng dụng

(9) Cách tiếp cận p-value

§ p-value: Xác suất tới hạn. Xác suất để tìm ra 1 quan sát mà từ đó thấy được H0 là đúng,

§

§

p - value < a (mức rủi ro có thể chấp nhận được): có cơ sở để bác bỏ H0 p - value ³ a (mức rủi ro có thể chấp nhận được): xác suất “quyết định bác bỏ H0 là quyết định SAI LẦM” rất cao, chưa có cơ sở để bác bỏ H0

§ Cách tính xác suất tới hạn

Kiểm định hai bên: p - value = 2. P(z³|zstat|) =2.(1-F(z))

Kiểm định bên phải: p - value = P(z³ zstat)

Kiểm định bên trái: p - value = P(z £ zstat)

37

EM3230 Thống kê ứng dụng

(9) Cách tiếp cận p-value

38

EM3230 Thống kê ứng dụng

Nội dung chính

5.1 Phân phối của các tham số mẫu (Bài giảng video)

5.2 Lý thuyết về ước lượng và kiểm định

5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)

5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)

5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định

5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh

39

EM3230 Thống kê ứng dụng

5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể

5.3.1. Ước lượng trên một tổng thể

5.3.1.1 Ước lượng trung bình một tổng thể

5.3.1.2 Ước lượng tỷ lệ một tổng thể

5.3.1.3 Ước lượng phương sai một tổng thể

5.3.2. Kiểm định trên một tổng thể

5.3.2.1 Kiểm định trung bình một tổng thể

5.3.2.2 Kiểm định tỷ lệ một tổng thể

5.3.2.3 Kiểm định phương sai một tổng thể

40

EM3230 Thống kê ứng dụng

Phân loại các bài toán kiểm định tham số

Biết s

Chưa biết s, mẫu lớn

KĐ trung bình

Chưa biết s, mẫu nhỏ

KĐ trên 1 tổng thể

KĐ tỷ lệ

KĐ phương sai

Biết s

Chưa biết s, mẫu lớn

KĐ trung bình

Chưa biết s, mẫu nhỏ

KĐ trên 2 tổng thể

KĐ tỷ lệ

i

KĐ phương sai

ố s m a h t h n đ m ể K

ANOVA 1 yếu tố

KĐ trên k tổng thể (k³2)

ANOVA 2 yếu tố

41

EM3230 Thống kê ứng dụng

5.3.1. Ước lượng trên một tổng thể 5.3.1.1 Ước lượng trung bình một tổng thể

f(Z)

1-a

a) Trong trường hợp mẫu lớn (n≥30)

P(-Z

α/2

α

/2

a/2

a/2

0. 5

0. 5

Z

0

-Za/2

Za/2

P(-Z <

<

Z )=1-α

α/2

α

/

2

X-μ 𝜎/ δ / n

𝜎/

P(-Z *δ/ n

=1 )

𝜎/

α

/2

α/2

𝜎/

P(-X-Z *δ/ n <-μ<-X+Z *δ / n )=1- 𝜎/

α

α/2

α

P(X-Z

*

)=1-α

α/2

α/2

𝜎 δ n

/2 𝜎 δ n

Sai số (biên)

Sai số (biên)- Margin of error

Ước lượng điểm

42

EM3230 Thống kê ứng dụng

+ Sai số

- Sai số

5.3.1.1 Ước lượng trung bình tổng thể

Ước lượng điểm

(U) Cận trên của khoảng tin cậy

(L) Cận dưới của khoảng tin cậy

Độ rộng/ Bề rộng của khoảng tin cậy

a) Trong trường hợp mẫu lớn (n≥30)

Tổng quát

Độ tin cậy 95%

Độ tin cậy 99%

Biết s

U,L =x±2,575

U,L =x±1,96

U,L =x±Z μ

α/2

μ

μ

σ n

σ n

σ n

Chưa biết s

n-1

n-1

n-1

U,L =x±t μ

α/2

U,L =x±t μ

U,L =x±t μ

0,025

0,005

s n

s n

s n

.

’ $

≈ ̅𝑥 ± 𝑍! "

44

EM3230 Thống kê ứng dụng

5.3.1.1 Ước lượng trung bình tổng thể

b) Trong trường hợp mẫu nhỏ (n<30)

Tổng quát

Độ tin cậy 95%

Độ tin cậy 99%

U,L =x±2,575

U,L =x±1,96

μ

Biết s U,L =x±Z μ

α/2

μ

σ n

σ n

σ n

n-1

n-1

n-1

Chưa biết s U,L =x±t μ

U,L =x±t μ

U,L =x±t μ

α/2

0,025

0,005

s n

s n

s n

45

EM3230 Thống kê ứng dụng

5.3.1.1 Ước lượng trung bình tổng thể

Ví dụ 1 (mẫu lớn):

Trong một nghiên cứu về năng suất canh tác một sản phẩm nông nghiệp với

cỡ mẫu n=36, có trung bình =50 và độ lệch chuẩn là 8 tạ/ha. Ước lượng

khoảng tin cậy trung bình tổng thể với độ tin cậy 95%.

t

50

,2

0301

50

,2

7068

µ

x ±=

=

±

=

±

n

025

,0,1 -

s n

8 36

,47

2932

,52

7068

££ µ

Như vậy chúng ta tin cậy 95% rằng trung bình tổng thể nằm trong khoảng từ

47,2932 tạ/ha đến 52,7068 tạ/ha.

46

EM3230 Thống kê ứng dụng

5.3.1.1 Ước lượng trung bình tổng thể

Ví dụ 2 (mẫu nhỏ)

Kiểm tra trọng lượng 25 sản phẩm của 1 lô hàng. Sau khi tập hợp dữ liệu mẫu này

ta có TB mẫu= 2,5kg và độ lệch chuẩn là s=0,061. Ước lượng trọng lượng trung

0, 061

2,5 0, 02087

2,5 1,711 ±

=

±

U Lµ = ,

25

,2

49582

,2

5287

££ µ

bình của sản phẩm trong lô với độ tin cậy 90%.

Với độ tin cậy 90%, trọng lượng trung bình của sản phẩm trong lô hàng (tổng thể)

nằm trong khoảng từ 2,49582kg đến 2,5287kg.

47

EM3230 Thống kê ứng dụng

5.3.1. Ước lượng trên một tổng thể 5.3.1.2 Ước lượng tỷ lệ tổng thể

Điều kiện: Cỡ mẫu lớn

§ np >=5 và n(1-p) >=5

§ hoặc npx>=5 và n(1-px)>=5 (khi không biết p)

p

)

p

p

)

p

x

x

x

x

p

Z

p

Z

-

p <<

+

x

x

2/

2/

a

a

1( - n

1( - n

p là tỷ lệ tổng thể, px là tỷ lệ mẫu

48

EM3230 Thống kê ứng dụng

5.3.1.2 Ước lượng tỷ lệ tổng thể

Ví dụ:

Chọn một mẫu ngẫu nhiên 100 người và thấy 25% số người này thuận tay trái trong

25,0

96,1

25,0

96,1

-

p <<

+

)25,01(25,0 - 100

)25,01(25,0 - 100

,0

1651

,0

3349

<< p

ăn uống, ước lượng tỷ lệ người thuận tay trái cho tổng thể với độ tin cậy 95%.

Như vậy chúng ta tin cậy 95% rằng tỷ lệ những người thuận tay trái trong ăn uống

là từ 16,51 đến 33,49 %.

49

EM3230 Thống kê ứng dụng

5.3.1.3 Ước lượng phương sai tổng thể

Giả định:

Tổng thể có phân phối chuẩn

2

2

n

s

s

Khoảng tin cậy (1-a)100% của phương sai tổng thể.

(

) 1

) 1

<

2 s

<

1,

/ 2

/ 2

- 2 c n -

a

( n - 2 c n 1,1 - -

a

50

EM3230 Thống kê ứng dụng

5.3.2. Kiểm định trên một tổng thể

5.3.2.1. KĐGT về trung bình tổng thể

5.3.2.2. KĐGT về tỷ lệ tổng thể

=

=

Z stat

tstat

µ0- n

x s

0µ- n

x s

0µ- n

x Z stat s =

2

(

n

s

=

2 c n

Z = stat

stat

(1

) /

n

-

)1 - 2 s 0

p p - 0 p 0

p 0

5.3.2.3. KĐGT về phương sai tổng thể

51

EM3230 Thống kê ứng dụng

5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể

Các bước kiểm định

Bước 1: Lặp cặp giả thuyết và nhận diện bài toán KĐ hai bên, bên trái hay bên phải

Bước 2: Lựa chọn mức ý nghĩa a

Bước 3: Tính đại lượng kiểm định (giá trị thống kê) của chỉ tiêu kiểm định: zstat, tstat, zqs, tqs, hoặc ztt, ttt Bước 4:

§ Cách 1: (giá trị tới hạn): Xác định miền bác bỏ và miền chấp nhận thông qua các giá trị

tới hạn za, za/2, ta, ta/2…

§ Cách 2: (xác suất tới hạn): Từ giá trị thống kê tính toán được của chỉ tiêu kiểm định,

tính p-value

Bước 5: So sánh giá trị thống kê với miền bác bỏ hoặc p-value với a để rút ra kết luận

52

EM3230 Thống kê ứng dụng

5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể

Trường hợp biết phương sai tổng thể

KĐ 2 phía KĐ bên trái KĐ bên phải

Cặp giả thuyết H0:µ=µ0 H1: µ≠µ0 H0:µ³µ0 H1: µ<µ0 H0:µ£µ0 H1: µ>µ0

µ0- n

x Z stat s =

Đại lượng kiểm định

Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc Z<- Za/2

53

EM3230 Thống kê ứng dụng

5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể

Trường hợp KHÔNG biết phương sai tổng thể, mẫu lớn

MẪU LỚN KĐ 2 phía KĐ bên trái KĐ bên phải

=

Z stat

Cặp giả thuyết H0:µ=µ0 H1: µ≠µ0 H0:µ³µ0 H1: µ<µ0 H0:µ£µ0 H1: µ>µ0

x s

0µ- n

Đại lượng kiểm định

Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc Z<- Za/2

54

EM3230 Thống kê ứng dụng

5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể

Trường hợp KHÔNG biết phương sai tổng thể, mẫu nhỏ

MẪU NHỎ KĐ 2 phía KĐ bên trái KĐ bên phải

=

tstat

Cặp giả thuyết H0:µ=µ0 H1: µ≠µ0 H0:µ³µ0 H1: µ<µ0 H0:µ£µ0 H1: µ>µ0

x s

0µ- n

Đại lượng kiểm định

Miền bác bỏ t<- tn-1,a t> tn-1,a t> tn-1,a/2 hoặc t<- tn-1,a/2

55

EM3230 Thống kê ứng dụng

5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể

Ví dụ

Một ông ty công bố trọng lượng trung bình của một sản phẩm mà mình phân phối trên thị trường là 368 g? Công ty cũng ấn định s=15 g. Chọn một mẫu 25 hộp, cho thấy !𝑿 =363.5. Kiểm định xem liệu trọng lượng trung bình của sản phẩm có khác trọng lượng đã công bố với mức ý nghĩa =0,05

Cặp giả thuyết

H0: µ= 368 H1: µ¹ 368

Xác định dạng bài toán:

- Bài toán biết phương sai tổng thể

368 g.

56

EM3230 Thống kê ứng dụng

5.3.2.1. Kiểm định giả thuyết về trung bình tổng thể

Đại lượng kiểm định:

5,1

=Z

-=

5.363 15

368 - 25

Quyết định:

H0: µ = 368 H1: µ ¹ 368 a= 0.05 à Za/2 = 1.96 n = 25 Miền bác bỏ: Z£-1.96 hoặc Z³ 1.96

Không có bằng chứng bác bỏ H0 với a=5%

Bác bỏ

Bác bỏ

0.025

0.025

Z

-1.96

1.96

0

Kết luận: Với mức ý nghĩa 5%, không có bằng chứng chứng tỏ trọng lượng trung bình của sản phẩm khác 368 g

-1.50

57

EM3230 Thống kê ứng dụng

5.3.2.2. KĐGT về tỷ lệ tổng thể

Kiểm tra điều kiện mẫu đủ lớn

§ np ³5 và np(1-p) ³5

KĐ 2 phía KĐ bên trái KĐ bên phải

H0: p = p0 H1: p ≠ p0

H0: p ³ p0 H1: p < p0

H0: p £ p0 H1: p > p0

Z = stat

Cặp giả thuyết

(1

) /

n

-

p p - 0 p 0

p 0

Đại lượng kiểm định

Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc Z<- Za/2

58

EM3230 Thống kê ứng dụng

5.3.2.2. KĐGT về tỷ lệ tổng thể

Ví dụ

Một công ty nghiên cứu marketing tuyên bố tỷ lệ trả lời trong các cuộc điều tra là

4%. Một mẫu khảo sát 500 khách hàng, kết quả là 25 khách hàng trả lời. Hãy kiểm

định về tỷ lệ tổng thể với a= 0.05, xem tuyên bố có hợp lý không?

59

EM3230 Thống kê ứng dụng

5.3.2.2. KĐGT về tỷ lệ tổng thể

§ Cặp giả thuyết cần kiểm định

§ H0: p = 0.04

§ H1: p # 0.04

p

-

§ Mức ý nghĩa: 𝞪 = 0.05,

1.1411

@=

=

Z stat

p

)

)

§

n = 500: Đáp ứng điều kiện mẫu đủ lớn.

Sp ( 1 p - n

0.05 0.04 - ( 0.04 1 0.04 - 500

Sử dụng đại lượng kiểm định Z

§ Giá trị tới hạn ± 1.96. Miền bác bỏ: Z<-1.96 hoặc Z> 1.96.

§

Zstat không thuộc miền bác bỏ à Không có bằng chứng bác bỏ H0 với a= 0.05.

§ Kết luận: Với mức ý nghĩa 5%, không có đủ bằng chứng bác bỏ H0 rằng tỷ lệ phản hồi từ

các cuộc điều tra là 4%.

60

EM3230 Thống kê ứng dụng

5.3.2.3. KĐGT về phương sai tổng thể

KĐ 2 phía KĐ bên trái KĐ bên phải TH Mẫu lớn n≥30,biết s

2

2

2

2

(

n

s

=

2 c n

stat

Cặp giả thuyết H0:s2=s0 2 H1: s2≠s0 H0:s2=s0 2 H1: s2s0

)1 - 2 s 0

ñ

2 n

,1

2/

2 acc - n

Đại lượng kiểm định

ñ

2 n

,1

2 acc - n

2 n

2 < n acc 1(;1 ) - -

2 n

2 --< acc n ,1 2/

Miền bác bỏ

61

EM3230 Thống kê ứng dụng

Phân phối Chi-square

62

EM3230 Thống kê ứng dụng

Phân phối Chi-square

63

EM3230 Thống kê ứng dụng

5.3.2 Kiểm định giả thuyết trên một tổng thể

5.3.2.1 KĐGT về trung bình tổng thể

5.3.2.2 KĐGT về tỷ lệ tổng thể

Biết 𝜎

5.3.2.3 KĐGT về phương sai tổng thể

H0: µ = µ0 H1: µ ≠ µ0

Z = stat

H0: p = p0 H1: p ≠ p0

H0: p £ p0 H1: p > p0

(1

) /

n

-

p p - 0 p 0

p 0

Chưa biết 𝜎, mẫu lớn

Z stat Z stat

H0:µ ³ µ0 H1: µ < µ0

2

(

n

s

0

=

2 c n

tstat tstat

0

H0:µ £ µ0 H1: µ > µ0

stat

H0: s2 = s2 H1: s2 ≠ s2

0

H0: s2 £ s2 0 Chưa biết 𝜎, mẫu nhỏ H1: s2 > s2

0

)1 - 2 s 0

x µ0- x µ0- Z stat s = Z stat s = n n H0: p ³ p0 x 0µ- x 0µ- H1: p < p0 = = n s s n x 0µ- x 0µ- H0: s2 ³ s2 = = 0 H1: s2 < s2 n s s n

64

EM3230 Thống kê ứng dụng

Nội dung chính

5.1 Phân phối của các tham số mẫu (Bài giảng video)

5.2 Lý thuyết về ước lượng và kiểm định

5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)

5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)

5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định

5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh

65

EM3230 Thống kê ứng dụng

5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể

5.4.1. Ước lượng chênh lệch của 2 tổng thể

5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể

5.4.1.2 Ước lượng chênh lệch tỷ lệ của 2 tổng thể

5.4.2. Kiểm định trên hai tổng thể

5.4.2.1. Kiểm định chênh lệch trung bình của 2 tổng thể

5.4.2.2. Kiểm định chênh lệch tỷ lệ của 2 tổng thể

66

EM3230 Thống kê ứng dụng

5.4.1. Ước lượng chênh lệch trên hai tổng thể

Biết phương sai 2 tổng thể

Lấy mẫu độc lập

Mẫu lớn n1 ³30 và n2 ³30

Không biết phương sai 2 tổng thể

Giả định Phương sai 2 tổng thể bằng nhau

Ước lượng chênh lệch Trung bình của 2 tổng thể

Lấy mẫu cặp

Mẫu nhỏ n1 £30 và/ hoặc n2 £30

Giả định Phương sai 2 tổng thể không bằng nhau

Ước lượng chênh lệch TỶ LỆ của 2 tổng thể

67

EM3230 Thống kê ứng dụng

5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể

(1) Trường hợp lấy mẫu độc lập

2 2

2

U,L

=x -x 1

z

+

±

α/2

μ -μ 1

2

2 σ 1 n

σ n

1

2

(a) Biết phương sai của hai tổng thể

68

EM3230 Thống kê ứng dụng

5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể

(1) Trường hợp lấy mẫu độc lập

(b1) Không biết phương sai của hai tổng thể, MẪU LỚN

2

Áp dụng định lý giới hạn trung tâm

U,L

=x -x 1

z

+

±

α/2

μ -μ 1

2

2 S 1 n

2 S 2 n

1

2

69

EM3230 Thống kê ứng dụng

5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể

(1) Trường hợp lấy mẫu độc lập

(b2) Không biết phương sai của hai tổng thể, MẪU NHỎ

2

U,L

=x - 1

x

df t *S

+

±

p

μ 1

2

α/2

1 n

1 n

1

2

2 (n -1)S +(n -1 1

1

2 )S 2

=

S p

2 n +n -2

2

df

n

=

1

1 +n -2 2

(b2.1) Giả định hai tổng thể có phương sai bằng nhau

70

EM3230 Thống kê ứng dụng

5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể

(1) Trường hợp lấy mẫu độc lập

(b2) Không biết phương sai của hai tổng thể, MẪU NHỎ

2 S

2 S

1

2

2

U,

L

=x -x 1

t *

+

± df

μ -μ 1

2

α 2 /

n

n

1

2

2

2 S

2 S

1

2

+

n

n

1

2

df

=

2

2

æ ç ç è 2 S

ö ÷ ÷ ø 2 S

1

2

n

n

+

ö ÷ ÷ ø 1 1 -

ö ÷ ÷ ø 2 1 -

æ ç ç è n 1

æ ç ç è n 2

(b2.2) Giả định hai tổng thể có phương sai KHÔNG bằng nhau

71

EM3230 Thống kê ứng dụng

5.4.1.1 Ước lượng chênh lệch TB của 2 tổng thể

(2) Trường hợp lấy mẫu cặp

Dấu hiệu nhận diện mẫu cặp:

- 2 mẫu có cỡ mẫu giống nhau

- Có đặc điểm tương đồng trừ đặc điểm đang được quan tâm nghiên cứu, tức là các

yếu tố ngoại lai được kiểm soát

$ ∑()*

𝑆𝑑 =

= &𝒅 ± 𝒕𝜶/𝟐

U,Lµd

𝒏&𝟏.𝑺𝒅 𝒏

𝑑( − ̅𝑑 2 𝑛 − 1

Tạo biến chênh lệch d= x1-x2 ; di=x1i-x2i

72

EM3230 Thống kê ứng dụng

5.4.1.2 Ước lượng tỷ lệ của 2 tổng thể

Kiểm tra điều kiện cỡ mẫu lớn

n1.𝒑𝟏³𝟓; 𝒏𝟏. (𝟏 − 𝒑𝟏) ³5

n2.𝒑𝟐³𝟓; 𝒏𝟐. (𝟏 − 𝒑𝟐) ³5

+

p1-p2=(𝒑𝟏 − 𝒑𝟐) ±za/2 .

-)(/&-)) $)

𝒑𝟐(𝟏&𝒑𝟐) 𝒏𝟐

Ước lượng khoảng của chênh lệch giữa 2 tỷ lệ của hai tổng thể

73

EM3230 Thống kê ứng dụng

5.4.2 Kiểm định giả thuyết trên hai tổng thể

Biết phương sai 2 tổng thể

Lấy mẫu độc lập

Mẫu lớn n1 ³30 và n2 ³30

Không biết phương sai 2 tổng thể

Giả định Phương sai 2 tổng thể bằng nhau

Kiểm định chênh lệch Trung bình của 2 tổng thể

Lấy mẫu cặp

Mẫu nhỏ n1 £30 và/ hoặc n2 £30

Giả định Phương sai 2 tổng thể không bằng nhau

Kiểm định chênh lệch TỶ LỆ của 2 tổng thể

74

EM3230 Thống kê ứng dụng

5.4.2.1 KĐGT về chênh lệch hai TB tổng thể

(1) Hai mẫu độc lập, BIẾT PHƯƠNG SAI

KĐ 2 phía KĐ bên trái KĐ bên phải

-

-

0

=

Z stat

Cặp giả thuyết H0:µ1-µ2=d0 H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0 H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0 H1: µ1-µ2 > d0

x x d 1 2 2 2 ss 1 2 + n n 1 2

Đại lượng kiểm định

Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc Z<- Za/2

75

EM3230 Thống kê ứng dụng

5.4.2.1 KĐGT về chênh lệch hai TB tổng thể

(2) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu lớn

KĐ 2 phía KĐ bên trái KĐ bên phải

-

-

x 1

2

0

=

Z stat

Cặp giả thuyết H0:µ1-µ2=d0 H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0 H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0 H1: µ1-µ2 > d0

+

x 2 s 1 n 1

d 2 s 2 n 2

Đại lượng kiểm định

Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc Z<- Za/2

76

EM3230 Thống kê ứng dụng

5.4.2.1 KĐGT về chênh lệch hai TB tổng thể

(3) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu nhỏ

§ Trường hợp 1: Giả định được phương sai 2 tổng thể bằng nhau

KĐ 2 phía KĐ bên trái KĐ bên phải

-

-

x 1

t

=

(

s

stat

2

2 2

s

=

p

Cặp giả thuyết H0:µ1-µ2=d0 H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0 H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0 H1: µ1-µ2 > d0

s

+

n 1 (

( (

)1 )1

2 s )1 + 1 )1 +-

- -

p

- n 1

n 2 n 2

x 2 1 n 1

d 0 1 n 2

Đại lượng kiểm định

Miền bác bỏ t<- tn1+n2-2;a t> tn1+n2-2;a t> tn1+n2-2;a/2 hoặc t<- tn1+n2-2;a/2

77

EM3230 Thống kê ứng dụng

5.4.2.1 KĐGT về chênh lệch hai TB tổng thể

(3) Hai mẫu độc lập, KHÔNG BIẾT PHƯƠNG SAI, mẫu nhỏ

§ Trường hợp 2: Không giả định được phương sai 2 tổng thể bằng nhau

KĐ 2 phía KĐ bên trái KĐ bên phải

2

-

-

+

x 1

2

0

=

2 s 1 n 1

2 s 2 n 2

t stat

df

=

2

2

Cặp giả thuyết H0:µ1-µ2=d0 H1: µ1-µ2 ≠ d0 H0:µ1-µ2 ³d0 H1: µ1-µ2 < d0 H0:µ1-µ2 £ d0 H1: µ1-µ2 > d0

+

+

x 2 s 1 n 1

d 2 s 2 n 2

æ çç è 2 ö s 1 ÷÷ n ø 1 1 -

ö ÷÷ ø 2 ö s 2 ÷÷ n ø 2 1 -

æ çç è n 1

æ çç è n 2

Đại lượng kiểm định

Miền bác bỏ t<- tdf;a t> tdf;a t> tdf;a/2 hoặc t<- tdf;a/2

78

EM3230 Thống kê ứng dụng

5.4.2.1 KĐGT về chênh lệch hai TB tổng thể (4) Mẫu cặp

§ Tạo biến chênh lệch d=x1-x2 với các giá trị của biến d là di=x1i-x2i

§ Đưa về bài toán kiểm định trung bình một tổng thể

§ Nếu mẫu lớn, chỉ tiêu kiểm định là z

§ Nếu mẫu nhỏ, chỉ tiêu kiểm định là t

$ ∑23/

t

=

Z

=

stat

stat

𝑆𝑑 =

d s

d 0- n

𝑑𝑖 − ̅𝑑 2 𝑛 − 1

d s

d 0- n

d

d

§ Miền bác bỏ (xem lại phần 7.2)

Cặp giả thuyết H0: µd=d0 H1: µd ≠ d0 H0: µd ³d0 H1: µd < d0 H0: µd £ d0 H1: µd > d0

79

EM3230 Thống kê ứng dụng

5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể

§ Kiểm tra điều kiện mẫu đủ lớn

KĐ 2 phía KĐ bên trái KĐ bên phải

(

p

p

)

)

-

-

-

s 1

s

2

2

Z

=

stat

=

ps

p

1(

p

)(

)

-

+

s

s

2 )

+ +

X 1 ( n 1

X n 2

Cặp giả thuyết H0: p1=p2 H1: p1≠p2 H0: p1≥p2 H1: p1p2

p ( 1 1 n 1

p 1 n 2

ps ước lượng chung cho tỷ lệ của 2 mẫu kết hợp

Đại lượng kiểm định

Miền bác bỏ Z<- Za Z> Za Z> Za/2 hoặc Z<- Za/2

80

EM3230 Thống kê ứng dụng

5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể

Ví dụ:

Một công ty vừa mới thực hiện một chương trình quảng cáo trên TV để khuếch trương cho một trong

các sản phẩm của họ.

i. Một mẫu ngẫu nhiên 240 người đã được lấy ra trước khi chương trình quảng cáo được thực

hiện, có 60 người đã từng sử dụng sản phẩm của công ty.

ii. Một mẫu ngẫu nhiên khác 360 người, được lấy ra sau khi chương trình quảng cáo được thực

hiện, có 117 người đã sử dụng sản phẩm đó của công ty.

Hãy kiểm định xem liệu có bằng chứng về sự tăng lên đáng kể số người sử dụng sản phẩm của

công ty, với mức ý nghĩa a=0.05

81

EM3230 Thống kê ứng dụng

5.4.2.2 KĐGT về chênh lệch hai TỶ LỆ tổng thể

1. Cặp giả thuyết cần kiểm định

H0: p1≥p2

H1: p1

2. Mức ý nghĩa: a=0,05

,0

295

=

=

=

ps

2 )

+ +

117 60 + 240 360 +

X 1 ( n 1

X n 2

3. Đại lượng kiểm định

(

p

p

)

)

-

-

-

s 1

s

2

2

Z

97,1

=

=

-=

stat

- 295

/1)(

,0

/1

)360

25,0( ,01(295 -

0)325,0 - 240 +

p

1(

p

)(

)

-

+

s

s

p ( 1 1 n 1

p 1 n 2

4. a=0,05, Za= 1,645 àMiền bác bỏ là Z<-1.645; Zstat<- Za có cơ sơ bác bỏ H0 KL: Với mức ý nghĩa 5%, có thể kết luận tỷ lệ người sử dụng sản phẩm của công ty có tăng lên

sau chương trình quảng cáo

82

EM3230 Thống kê ứng dụng

5.4.2 Kiểm định giả thuyết trên hai tổng thể

-

-

-

-

0

x 1

2

0

=

=

Z stat

Z stat

+

x x d 1 2 2 2 ss 1 2 + n n 1 2

x 2 s 1 n 1

d 2 s 2 n 2

Biết phương sai 2 tổng thể

-

-

x 1

t

=

stat

s

+

p

x 2 1 n 1

d 0 1 n 2

Lấy mẫu độc lập

Mẫu lớn n1 ³30 và n2 ³30

Không biết phương sai 2 tổng thể

Giả định Phương sai 2 tổng thể bằng nhau

Kiểm định chênh lệch Trung bình của 2 tổng thể

Lấy mẫu cặp

Z

=

stat

Mẫu nhỏ n1 £30 và/ hoặc n2 £30

d s

d 0- n

d

Giả định Phương sai 2 tổng thể không bằng nhau

t

=

stat

d s

d 0- n

d

(

p

p

)

)

-

-

-

s 1

s

2

2

-

-

Z

=

x 1

2

0

stat

=

Kiểm định chênh lệch TỶ LỆ của 2 tổng thể

t stat

p

1(

p

)(

)

-

+

s

s

+

p ( 1 1 n 1

p 1 n 2

x 2 s 1 n 1

d 2 s 2 n 2

83

EM3230 Thống kê ứng dụng

Nội dung chính

5.1 Phân phối của các tham số mẫu (Bài giảng video)

5.2 Lý thuyết về ước lượng và kiểm định

5.3 Ước lượng và kiểm định giả thuyết trên một tổng thể (Bài giảng video)

5.4 Ước lượng và kiểm định giả thuyết trên hai tổng thể (Bài giảng video)

5.5 Xác định cỡ mẫu cho bài toán ước lượng và kiểm định

5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh

87

EM3230 Thống kê ứng dụng

5.5.1 Xác định cỡ mẫu cho bài toán ước lượng

(1) Xác định cỡ mẫu khi ước lượng trung bình tổng thể

§ Sai số của ước lượng

𝒔

𝝈

𝜺 = 𝒁𝜶/𝟐

𝜺 = 𝒁𝜶/𝟐

𝒏

𝒏

§ Độ rộng của khoảng tin cậy: 2e

§ Công thức ước lượng n để sai số không vượt quá e

𝒏 = (

)2

𝒏 = (

𝒁𝜶/𝟐.𝒔 𝜺

)2

𝒁𝜶/𝟐.𝝈 𝜺

§ Kiểm tra điều kiện n/N

§ Nếu n/N £ 0.05: Không cần điều chỉnh

§ Nếu n/N ³ 0.05: Điều chỉnh n thành n*

n*=

n.N n+(N-1)

88

EM3230 Thống kê ứng dụng

5.5.1 Xác định cỡ mẫu cho bài toán ước lượng

(2) Xác định cỡ mẫu khi ước lượng tỷ lệ tổng thể

§ Công thức ước lượng n để sai số không vượt quá e

§ Khi ước lượng được tỷ lệ của tổng thể p

𝟐 . 𝒑(𝟏 − 𝒑) 𝒁𝜶 𝟐

𝒏 =

𝜺𝟐

§ Khi không biết p, lấy theo trường hợp thận trọng nhất p=0.5

𝟐 𝟎. 𝟐𝟓 ∗ 𝒁𝜶 𝟐

𝒏 =

𝜺𝟐

§ Kiểm tra điều kiện n/N

§ Nếu n/N £ 0.05: Không cần điều chỉnh

n*=

§ Nếu n/N ³ 0.05: Điều chỉnh n thành n*

n.N n+(N-1)

89

EM3230 Thống kê ứng dụng

5.5.2 Xác định cỡ mẫu cho bài toán kiểm định

Nội dung thảo luận theo nhóm trên lớp

90

EM3230 Thống kê ứng dụng

5.6 Ứng dụng kiểm định khi ra quyết định kinh doanh

Nội dung thảo luận theo nhóm trên lớp

91

EM3230 Thống kê ứng dụng

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ

CHÚC CÁC BẠN HỌC TỐT