BÀI 5 BÀI 5 KHÁI NIỆM PHƯƠNG PHÁP MẪU

TS. Nguyễn Mạnh Thế TS N ễ M h Thế

v1.0012107210

1

TÌNH HUỐNG KHỞI ĐỘNG

ố ì

1-2 2-3 3-4 4-5 5-6 6-7

Thu nhập

10 8 5 7 3 2 10 2

7

3

8

5

Số người Số người

Tình huống Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng) ở huyện Đông Anh, ta có bảng số liệu mẫu sau: ở huyện Đông Anh ta có bảng số liệu mẫu sau:

Cần phải tính thu nhập bình quân đầu người và độ chênh lệch thu nhập để xác định mức sống của người dân và mức lệch thu nhập để xác định mức sống của người dân và mức độ đồng đều về thu nhập trong vùng.

Câu hỏi gợi mở

Câu 1: Thu nhập bình quân đầu người là bao nhiêu?

Câu 2: Độ chênh lệch thu nhập là bao nhiêu? Câu 2: Độ chênh lệch thu nhập là bao nhiêu?

v1.0012107210

Câu 3: Độ chênh lệch bình quân hiệu chỉnh? 2

TÌNH HUỐNG KHỞI ĐỘNG

Kết luận

n

X

X G(X , X ,..., X ) n

1

2

i

1   n  i 1

được gọi là trung bình mẫu.

2. Thống kê:

2

2

S

S

X)

i

 (X

n1 1 n  i 1

được gọi là độ lệch chuẩn mẫu được gọi là độ lệch chuẩn mẫu. 3. Thống kê:

n

2

S S '

2 S S '

X) X)

 

 

i

 (X (X

1   n 1  i 1

được gọi là độ lệch chuẩn mẫu hiệu chỉnh.

3

v1.0012107210

1. Thống kê: g

MỤC TIÊU

• Cơ sở lý thuyết mẫu;

• Tổng thể nghiên cứu;

• Mẫu ngẫu nhiên;

• Thống kê; kê

Thố

• Mẫu ngẫu nhiên hai chiều; • Mẫu ngẫu nhiên hai chiều;

• Quy luật phân phối xác suất

ậ p

p

Q y của một số thống kê.

4

v1.0012107210

1. CỞ SỞ LÝ THUYẾT MẪU

Bài toán: Cần nghiên cứu tính chất định tính hoặc định lượng của các phần tử trong một tập hợp nào đó. à đó

ộ ậ h

Ta có hai phương pháp thực hiện nghiên cứu:

Khái niệm phương pháp mẫu:

Nghiên cứu bộ phận

Nghiên cứu toàn bộ

• Ta lấy ra một • Ta lấy ra một

tập con và tập con và nghiên cứu toàn bộ các phần tử trong tập con đó.

lớn về kinh tế, có • Chi phí Chi phí lớn về kinh tế có thể phá hủy toàn bộ tập hợp cần nghiên cứu.

• Không thể nghiên cứu được

• Đưa ra kết luận cho các phần tử trong tập hợp nghiên cứu.

toàn bộ.

Đây là phương pháp nghiên cứu Đây là phương pháp nghiên cứu mẫu (Sampling).

Vậy ta thấy nghiên cứu toàn bộ Vậy ta thấy nghiên cứu toàn bộ tập hợp là không khả thi.

5

v1.0012107210

2. TỔNG THỂ NGHIÊN CỨU

Tổng thể là tập hợp các phần tử cần nghiên cứu tính chất định tính hoặc định lượng, số phần tử trong tổng thể gọi là cỡ của tổng thể, ký hiệu là N. lượng số phần tử trong tổng thể gọi là cỡ của tổng thể ký hiệu là N

a) Biến định lượng

b) Biến định tính

Mã hóa: Lấy giá trị của biến định lượng làm mã của biến.

Mã hoá: Gán tính chất định tính của biến ứng với các số nguyên.

Vậy khi nghiên cứu tổng thể ta luôn có thể giả sử là các các phần tử có dấu hiệu định lượng.

6

v1.0012107210

Định nghĩa:

2. TỔNG THỂ NGHIÊN CỨU (tiếp theo)

là số lần giá trị xi

1

iN

Mô tả tổng thể Mô tả tổng thể

Cho tổng thể với các phần tử { xuất hiện trong tổng thể, ta có: g

N

}. Với n ... N  

x , x ,..., x 2 N N 1 1

2 2

k k

g ệ

f i

(i 1...k), f i

N i N N

xi fi

x1 x2 … xk f1 f2 … fk

Dễ thấy:

Đặt được gọi là tần suất của xi trong tổng thể:

... 1     f 1 f 2 f k

2

2

m

s

(m)

(x m) 

N x i

i

f x i

i

i

f x i

2 i

k k  i 1 

k k  i 1 

1 1 k k  N  i 1

1 1 N N  N  i 1

Trung bình tổng thể: Phương sai tổng thể:

v1.0012107210

7

3. MẪU NGẪU NHIÊN

Các phương pháp lấy mẫu; • Các phương pháp lấy mẫu;

• Định nghĩa mẫu ngẫu nhiên;

• Mô tả mẫu ngẫu nhiên:

 Theo biều đồ tần suất;  Theo tổ chức đồ.

v1.0012107210

8

3.1. CÁC PHƯƠNG PHÁP LẤY MẪU

Mục đích M đí h

• Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải

nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu, từ nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu từ

đó rút ra kết luận cho tổng thể.

• Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu • Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu

nhiên (random sample).

Các phương pháp lấy mẫu Các phương pháp lấy mẫu

• Cách chọn mẫu ngẫu nhiên đơn giản:

 Chọn mẫu ngẫu nhiên có hoàn lại;  Chọn mẫu ngẫu nhiên có hoàn lại;

 Chọn mẫu ngẫu nhiên không hoàn lại.

• Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực

hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần.

v1.0012107210

9

3.2. ĐỊNH NGHĨA MẪU NGẪU NHIÊN

ẫ ẫ ẫ ộ ỡ là h ê h ê ộ ậ ủ b ế

n

1

gọi là giá trị cụ thể của mẫu ngẫu nhiên x , x ,..., x 2

n

1

;

Một mẫu ngẫu nhiên cỡ n của biến ngẫu nhiên X là một tập các biến á b ế ngẫu nhiên X1, X2,… Xn độc lập và có cùng phân phốí với biến ngẫu nhiên X. Trong đó mỗi Xk là một quan sát về biến ngẫu nhiên X. Quan sát Xk nhận giá trị xk Khi đó bộ giá trị X , X ,..., X 2 Ví dụ: Ví dụ:

Khi gieo con xúc xắc 5 lần ta được một mẫu ngẫu nhiên (X1, X2, X3, X4, X5) với các giá trị của mỗi lần gieo là (3, 5, 2, 3, 1). ỗ

v1.0012107210

10

3.3. MÔ TẢ MẪU NGẪU NHIÊN

xi

x1 x2 … xk

ni

n1 n2 … nk

n

Với ni là số lần giá trị xi xuất hiện trong mẫu. Với n là số lần giá trị x xuất hiện trong mẫu Ta có 

... n  k

n 2

n 1

Biểu đồ tần suất: iể đồ ầ ấ

Đặt

gọi là tần suất của xi trong mẫu.

f i

, f i

n i i n

ẫu Ta có bảng biểu diễn tần suất mẫu:

a có bả g b ểu d ễ tầ suất

xi fi fi

x1 x2 … xk f1 f2 … fk fk

f1

f2

n 1

n 2

... n  k

trong đó:

...

1

f 1

f 2

f k

 n n

11

v1.0012107210

3.3. MÔ TẢ MẪU NGẪU NHIÊN (tiếp theo)

khoảng a0- a1 a1- a2 … ak-1- ak

ni

n1 n2 … nk

oả g (ai-1, ai] ni là số giá trị mẫu rơi vào khoảng (ai-1, ai] ẫu ơ ào i à số g á t ị

n

n 1

n 2

... n  k

Mỗi khối chữ nhật có: • Chiều cao:

y

i

n i n.h i

• Độ dài: • Độ dài:

h i

a i

i 1

a 

12

v1.0012107210

Tổ chức đồ: ổ hứ đồ

PROPERTIES Allow user to leave interaction: Show ‘Next Slide’ Button: Completion Button Label:

Anytime Don't show Next Slide

4. THỐNG KÊ

á h í h á iá ị hố h h ẫ ẫ

Cách tính các giá trị thống kê đặc trưng mẫu cho mẫu thu gọn kê đặ Nếu mẫu cho dưới dạng khoảng ta chọn mỗi khoảng điểm đại diện

lúc đó ta có mẫu thu gọn.

i

  i 1 2

a a i x , i 1,2,...,k  

x ix

n in

in .x i

2 2 in .x i

x

A n

x1 x

n1 n

n1x1 n x

2

2

s

(x)

B n

2

'2

2

s

s

n n 1 

n2 . ni . n nk nkxk nkxk n

n2x2 . nixi . n x A

n x 2 n1x1 2 n2x2 . nixi . n x 2 B

Khoảng Khoảng giá trị mẫu a0 – a1 a a a1 – a2 . ai-1 – ai . a ak-1 – ak a 

x2 . xi . xk x

Lập một bảng tính như sau:

v1.0012107210

15

4. THỐNG KÊ (tiếp theo)

Thu nhập

1-2

2-3

3-4

4-5

5-6

6-7

Số người

10

8

5

7

3

2

Ví dụ: Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng), ta có bảng số liệu mẫu sau: ẫ l ệ

2

2 x, s , s , s, s x s s s ' s '

Tính các giá trị đặc trưng mẫu.

v1.0012107210

16

4. THỐNG KÊ (tiếp theo)

ix

in

n .x i

i

2 n .x i

i

Khoảng thu thu nhập

1-2 2-3 2-3 3-4 4-5 5-6 6-7

1,5 2,5 2 5 3,5 4,5 5,5 , 6,5

10 8 8 5 7 3 2

15 20 20 17,5 31,5 16,5 , 13

22,5 50 50 61,25 141,75 90,75 , 84,5

Bài giải: Ta lập bảng tính sau lậ bả í h

n =35 113,5 450,75

x 113.5 / 35 3,243

2 2

2 2

s

450,75 / 35 (3,243) (3 2 3)

/ 3

0

2,363 2 363

s '

2, 43 1,559 

s

2,363 1,573 

2

2 s '

s

2,363 2, 43 

35 35 34

n n 1 

17

v1.0012107210

5. MẪU NGẪU NHIÊN HAI CHIỀU

1

1

2

2

i đì h t

iá t ị

Lấy mẫu điều tra thu nhập và tiêu dùng (triệu đồng/tháng) của 10 hộ gia đình ta thu được giá trị mẫu: th đượ (2; 1.4), (2, 1.5), (3; 1.8), (4; 1.8), (2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4), (2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4), (4; 3.5), (5; 3.7).

18

v1.0012107210

Khái niệm: Khái niệm: Một mẫu ngẫu nhiên cỡ n của véc tơ ngẫu nhiên (X, Y) là một tập các véc tơ ngẫu nhiên (X1, Y1), (X2, Y2)… (Xn, Yn) n n độc lập và có cùng phân phốí với biến ngẫu nhiên (X, Y). Trong đó mỗi véc tơ (Xi, Yi) là một quan sát thứ i về véc tơ ngẫu nhiên (X, Y). ngẫu nhiên (X Y) Ký hiệu (xi, yi) là giá trị của mẫu (Xi, Yi) ( i = 1, 2,.., n) Bộ giá trị {(x1, y1), (x2, y2)… (xn, yn)} gọi là giá trị cụ thể của Bộ giá trị {(x1, y1), (x2, y2)… (xn, yn)} gọi là giá trị cụ thể của (X1, Y1), (X2, Y2)… (Xn, Yn). Ví dụ:

5.1. PHƯƠNG PHÁP MÔ TẢ MẪU

Dạng 1: Lập một bảng hai dòng như sau: Dạng 1: Lập một bảng hai dòng như sau:

xi

x1 x2 … xn

y

y

yi y

y1 y2 … yn y

Dạng 2: Ta thu gọn mẫu và biểu diễn dưới dạng bảng chữ nhật như sau:

y1

y2

… yj …

ai

yh

yi xi x1 x1 x2 … xi … xk bj

n11 n11 n21 … ni1 n … nk1 b1

n12 n12 n22 … ni2 n … nk2 b2

... n1j ... ... n1j ... ... n2j ... ... nij n ... ... nkj ... j bj

n1h n1h n2h ... nih n ... nkh bh

a1 a1 a2 … ai a .... ak n

Ta có:

h

k

k

h

à và

b

a i

n ij

j

n ij

n

  

  

n ij



j 1 

i 1 

i 1 j 1 

19

v1.0012107210

5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU

Véc tơ ngẫu nhiên hai chiều • Véc tơ ngẫu nhiên hai chiều

gọi gọi

(X, Y) (X Y)

là trung bình mẫu của véc tơ ngẫu

nhiên (X, Y), trong đó nhiên (X Y) trong đó

và và

là các là các

X X

Y Y

trung bình mẫu của biến ngẫu nhiên

thành phần X và Y. thà h hầ X à Y

• Giá trị thống kê mẫu của mẫu ngẫu

nhiên hai chiều là

. (x, y)

20

v1.0012107210

Trung bình mẫu:

5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU (tiếp theo)

Hệ số tương quan mẫu ệ ố ẫ

n

trong đó thống kê

R

XY

X Y k k k k

XY (X)(Y)  X YS S S S

1    k 1n 

Giá trị của hệ số tương quan mẫu đối với mẫu cụ thể:

là r

{(x , y ),(x , y ),...,(x , y )} 2

n

n

1

1

2

n

k

h

y xy

( )(y) (x)(y)

xy xy

r

l

n x y n x y i ij

j

  x y x y l

 

1 n

1 n

l 1 

i 1 j 1 

 s s X Y

n

2 2

s

(x) ( )

x

x

X

2 2 l

l

1 1   x n  l 1

n1  1   n  l 1

2

s

(y)

y

y

Y

2 l

 y

l

n1 1 n  l 1

n1 n 1   n  l 1

21

v1.0012107210

Định nghĩa. Hệ số tương quan mẫu của mẫu ngẫu nhiên hai chiều ký hiệu là R được xác định bởi: hai chiều ký hiệu là R được xác định bởi:

6. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ

â

à

X

Định nghĩa Phân phối xác suất của một thống kê được gọi là phân phối mẫu.

23

v1.0012107210

Ví dVí dụ: Phân phối xác suất của được gọi là phân phối mẫu của thống kê trung bình mẫu. phối mẫu của thống kê trung bình mẫu.

6.1. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1

Cho X~A(p) Xét mẫu ngẫu nhiên

rút ra từ X.

(X , X ,..., X ) 2 n

1

X p 

có quy luật phân phối N(0,1)

U

n

p(p 1) p(p 1) 

đủ lớ

f p 

Định lý 1: Thống kê khi n đủ lớn. khi

U

n

p(p 1) 

trong đó

, với k là số lần mẫu nhận giá trị 1.

f

k n

24

v1.0012107210

Chú ý: Thống kê U cũng có thể viết lại dưới dạng

6.2. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1

(X , X ,..., X ) 2 n

1

(Y , Y ,..., Y ) m

1

2

Cho X~A(p1) và Y~A(p2) Xét hai mẫu ngẫu nhiên rút ra từ X và Y.

có quy luật phân phối N(0,1) có quy luật phân phối N(0 1)

U U

2

1

(p X Y (p p ) p ) 1 1 2 2 p (1 p )  2 m

p (1 p )  1 n

Định lý 2: Thống kê Định lý 2: Thống kê

có thể được thay bằng

X

Y

1f

2f

trong đó trong đó

,

f f 1

; f ; f 2

k 1 1 n

k 2 2 m

với k1 là số lần mẫu ngẫu nhiên của X nhận giá trị 1, k2 là số lần mẫu ngẫu nhiên của Y nhận giá trị 1.

25

v1.0012107210

Chú ý:

6.3. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN

.

Cho mẫu ngẫu nhiên (X1, X2, …Xn) được rút ra từ biến ngẫu nhiên   X có quy luật phân phối chuẩn N , 

 2

có phân phối chuẩn

N

X

Định lý 3: Thống kê trung bình mẫu

2 ,   X X

...

  

 

  X

X

n ~ N(0,1)

U  

2

2

2

  

...

  

 

2 2   X

n

      n 2       2 n

X

• Thống kê

có quy luật phân bố student với n-1 bậc tự do.

T

n

  ' S

'2

2

có quy luật phân phối khi bình phương với n-1 bậc

X

2

(n 1)S (n 1)S  

• Thống kê tự do.

26

v1.0012107210

Định lý 4: ý ị

6.4. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN

),

ẫ Y ~ N(

)

Xét mẫu ngẫu nhiên Xét mẫu ngẫu nhiên

rút ra từ X rút ra từ X

và mẫu ngẫu nhiên

rút ra từ Y.

hiê độ lậ X à Y Ch h i biế Cho hai biến ngẫu nhiên độc lập X và Y 2 2 , X ~ N( ,     1 1 2 2 (X , X ,..., X ) (X X X ) 2 n 1 (Y , Y ,..., Y ) m

1

2

X Y (

)

2

U

    1 

2 2

2  1

m m

n n

có quy lụât phân phối chuẩn N(0,1).

X Y (

    1

2

Định lý 5: Thống kê

T

) nm(n m 2)  n m 

nS mS 

2 X

2 Y

có quy luật phân phối student với n + m – 2 bậc tự do.

Các thống kê U và T sẽ được sử dụng trong phần ước lượng và kiểm định tiếp theo. lượ

đị h tiế th

à kiể

27

v1.0012107210

Định lý 6: Thống kê

TÓM TẮT CUỐI BÀI

Nội dung chính

1. Khái niệm mẫu ngẫu nhiên và tổng thể nghiên cứu.

2. Các phương pháp lấy mẫu.

3. Thống kê và các thống kê đặc trưng của mẫu. 3 Thống kê và các thống kê đặc trưng của mẫu

4. Quy luật phân phối xác suất của một số thống kê. 4 Quy luật phân phối xác suất của một số thống kê

28

v1.0012107210

PROPERTIES Allow user to leave interaction: Show ‘Next Slide’ Button: Completion Button Label:

Anytime Don't show Next Slide