Đo lường vị trí trung tâm và biến thiên

Lớp CN YTCC Đồng Tháp

5/29/2014

1

Mục tiêu

• Tính được các giá trị: trung bình, trung vị,

phương sai, độ lệch chuẩn.

• Trình bày được ý nghĩa của những chỉ số: Trung

bình, trung vị, phương sai, độ lệch chuẩn.

5/29/2014

2

Ví dụ 1

• Số liệu Hemoglobin ở 70 phụ nữ

• Làm thế nào để tóm tắt số liệu này?

5/29/2014

3

Tóm tắt số liệu

xi

Đặc trưng chung của bộ số liệu này là gì?

5/29/2014

4

Tóm tắt số liệu

• Thông qua các con số thống kê cơ bản:

– Mức độ tập trung

• Trung bình • Trung vị • Mode (yếu vị) – Mức độ phân tán

5/29/2014

5

• Khoảng • Phương sai – Độ lệch chuẩn • Khoảng phân vị

Đo lường độ tập trung

• Trung bình • Trung vị • Mode (yếu vị)

5/29/2014

6

Trung bình

– Trung bình của 2, 5, và 8 là 5, vì 15/3 = 5

– Trung bình của 1, 3, 2, và 8 là 3.5, vì 14/4 = 3.5

 Tính trung bình Hb của 70 phụ nữ ở ví dụ 1

5/29/2014

7

• Giá trị trung bình :

Trung vị

• Trung vị của 1 bộ số liệu là giá trị đứng giữa các quan sát đó nếu

chúng ta xếp các quan sát theo thứ tự.

• Có sự khác biệt giữa giá trị trung vị của bộ số liệu có số quan sát

chẵn và lẻ.

• Ví dụ:

– Trung vị của 1, 3, 15, 16, và 17 (5 số liệu): là 15.

– Trung vị của 1, 2, 3, 5, 8, và 9 (6 số liệu): là giá trị trung bình của hai

giá trị đứng giữa các quan sát đó

 Tính trung vị của số liệu ví dụ 1, giải thích ý nghĩa?

5/29/2014

8

Mode (yếu vị) • Giá trị mode của một tập hợp các quan sát là giá trị có

tần số xuất hiện nhiều nhất trong tập hợp đó.

• Ví dụ

– Mode của 1, 2, 2, 3, 4, 5

là 2.

– Tập hợp 1, 2, 3, 4, 5

không có mode.

– Tập hợp 1, 2, 3, 3, 4, 5, 5

có 2 mode: 3 và 5

5/29/2014

9

 Tìm mode trong ví dụ 1

Tại sao?

• Tại sao lại có các giá trị thống kê khác nhau

dùng để đo lường độ tập trung?

• Vì: Chúng có các tính chất, điểm mạnh điểm yếu để giúp chúng ta hiểu bản chất của bộ số liệu.

5/29/2014

10

Trung bình

• Điểm mạnh

– Tính toán rất đơn giản

– Giá trị trung bình là duy nhất

• Điểm yếu

– Dễ bị ảnh hưởng bởi các giá trị đầu cùng của bộ số

liệu

– Ví dụ

• Trung bình của 1, 2, và 1.000.000 là 333.334,33, Không thể nói là đại diện cho bộ số liệu được

5/29/2014

• Hoặc giá trị trung bình của 1; 2; 9500; 9600; 9700 11

và 9900 là 6450.5 !

Trung vị

• Điểm mạnh

– Duy nhất đối với mỗi bộ số liệu

– Tiện dụng trong việc mô tả độ lệch của các quan sát

bao gồm cả các quan sát cực lớn hoặc cực nhỏ.

• Điểm yếu

– Do việc xác định giá trị trung vị có sự khác biệt giữa

5/29/2014

12

bộ số liệu chẵn lẻ do đó nó ít được sử dụng trong các thống kê suy luận

Mode (yếu vị)

• Điểm mạnh

– Nếu một bộ số liệu có giá trị mode, thì sẽ rất hữu

• Điểm yếu

dụng cho ta khi mô tả bộ số liệu đó. Ví dụ: hầu hết các trường hợp tự tử đều là trẻ em gái tuổi 14-19.

– Có nhiều bộ số liệu không có mode, hoặc có quá

5/29/2014

13

nhiều mode, và trong trường hợp này sử dụng giá trị mode sẽ không có tác dụng gì nhiều

Đo lường độ phân tán

• Khoảng • Phương sai – Độ lệch chuẩn • Khoảng phân vị

5/29/2014

14

Khoảng

• Giá trị Khoảng là khoảng cách giữa giá trị lớn

nhất và giá trị nhỏ nhất của bộ số liệu.

• Ví dụ

– Khoảng của bộ số liệu 2, 4, 7 là 5.

• Thông thường trong mô tả: ghi rõ số nhỏ nhất –

số lớn nhất – Số ngày nằm viện trung bình là 10 ngày (1-50 ngày)  Nêu khoảng của bộ số liệu ví dụ 1?

5/29/2014

15

– Khoảng của bộ số liệu -10, -3, 4 là 14.

Phân tán

xi

Trung bình

0

So với trung bình, mức độ phân tán của bộ số liệu này được đánh giá như thế nào?

5/29/2014

16

Vấn đề

• Nếu cộng tất cả các chênh lệch, vấn đề gì sẽ

xảy ra? • Giải pháp (xi -

• Khi đó, phương sai được tính là

n

n

2

2

(

x

x

)

x

nx

2

2

i

2 i

x

n x

i

1

i

1

2

S

n

1

n

1

n

1

5/29/2014

17

Ví dụ 2

• Tuổi của 10 đối tượng: 42 28 28 61 31 23 50 34 32 37 Tính phương sai của tuổi

5/29/2014

18

Các bước

)

• Tính trung bình • Bình phương mỗi giá

• Tính trung bình • Tính hiệu số (xi - • Bình phương hiệu số

trên

trị quan sát • Cộng các bình

phương

• Cộng tất cả các bình

phương

• Chia cho (n-1)

• Tính ( ) • Chia cho (n-1)

5/29/2014

19

Độ lệch chuẩn

• Điểm yếu của phương sai: đơn vị đo lường

bình phương

• Độ lệch chuẩn (standard deviation – SD, S): lấy

căn của phương sai

• Tính độ lệch chuẩn của ví dụ 2

5/29/2014

20

Ý nghĩa

• Minh họa mức độ phân tán của số liệu

– Khoảng 68% các giá trị quan sát sẽ nằm trong

khoảng (trung bình ± s)

– Khoảng 95% các giá trị quan sát nằm trong khoảng

(trung bình ± 2s)

 Minh họa mức độ phân tán của ví dụ 2

5/29/2014

21

– Hầu hết nằm trong khoảng (trung bình ± 3s)

Ví dụ 3

• Khoảng bách phân vị trong theo dõi dinh

dưỡng trẻ em

• Phân vị là gì?

5/29/2014

22

Phân vị

• Mô tả tỷ lệ số liệu có giá trị dưới giá trị

phân vị • Phiên giải:

– Phân vị 25% của 1 bộ số liệu là 3? – Phân vị 50% của 1 bộ số liệu là 8? – Phân vị 75% của 1 bộ số liệu là 11? – Phân vị 100%?

5/29/2014

23

Ví dụ 4

Đường kính (tính bằng cm) của khối u Sarcomas được lấy ra từ ngực của 20 phụ nữ

0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0 4.2 4.5

-Nhận xét bộ số liệu Tính phân vị 25%, 50%, 75% Vấn đề?

5/29/2014

24

5.0 5.0 5.0 5.0 6.0 6.5 7.0 8.0 9.5 13.0

Phân vị (tt)

• Phân vị ¼

– Q1= giá trị quan sát thứ (n+1)/4

– Q2= giá trị quan sát thứ (n+1)/2

– Q3= giá trị quan sát thứ 3(n+1)/4

5/29/2014

25

Q1:

 .

5 25

th

measure

Q 1

 20 1 4

Với giá trị: 2.5 + (.25)(3.0-2.5)=2.625

(

. 10 5

th

measure

Q 2

Q2:

) 2 20 1 4

Với giá trị: 4.5 + (.50)(5.0-4.5) = 4.75

Q3:

. 1575

th

measure

Q 3

) 3 20 1 ( 4

Với giá trị: 6.0 + (.75)(6.5-6.0) = 6.375

5/29/2014

26

0.5 5.0 1.2 5.0 2.1 5.0 2.5 5.0 2.5 6.0 3.0 6.5 3.8 7.0 4.0 8.0 4.2 9.5 4.5 13.0

Hai bước tính phân vị

• Tìm vị trí của phân vị • Tính phân vị

5/29/2014

27

(Giá trị lớn nhất)

Q3

(Phân vị 3/4)

Q2

(Phân vị ½)

Q1

(Phân vị 1/4)

(Giá trị nhỏ nhất)

Biểu đồ Box-Whisher

5/29/2014

28

Vẽ biểu đồ B-W cho ví dụ 4

BÀI TẬP THỰC HÀNH

Một nghiên cứu của Roberts và cộng sự về năng lượng cần thiết hàng ngày và sự tiêu hao năng lượng được tiến hành trên 14 đối tượng. Sau đây là các chỉ số về BMI của nhóm đối tượng nghiên cứu

24.4

30.4 21.4 25.1

21.3 23.8

20.8 22.9

20.9 23.2 21.1

23.0 20.6

26.0

5/29/2014

29

Hãy tính

(a) Giá trị trung bình, trung vị, mode, phương sai, độ lệch

(b) Vẽ đồ thị box-and-whisker. (c) Tỷ lệ các ước lượng nằm trong khoảng 1SD so với

chuẩn.

(d) Tỷ lệ các ước lượng nằm trong khoảng 2SD so với

giá trị trung bình

(e) Tỷ lệ các ước lượng nằm trong khoảng 3SD so với

giá trị trung bình

5/29/2014

30

giá trị trung bình

Tóm tắt

• Đo lường mức độ tập trung

• Đo lường mức độ phân tán

Áp dụng cho các biến số định lượng

– Trung bình – Trung vị – Mode

5/29/2014

31

– Khoảng – Phương sai – Độ lệch chuẩn – Khoảng phân vị - Biểu đồ Box-Whisher