
1
Chư ơ ng 4. TÓM TẮ T DỮLIỆU BẰ NG CÁC ĐẠ I LƯ Ợ NG
THỐNG KÊ MÔ TẢ
4.1. Các đạ i lư ợ ng đo lư ờ ng khuynh hư ớ ng tập trung
1. Trung bình cộng
a. Trư ờ ng hợp dữliệu nhận các giá trịrời rạc
Trung bình cộ ng đư ợ c xác đị nh bằng cách cộng giá trịcủ a các quan sát, sau đó đem chia cho
tổng sốquan sát.
Trung bình tổng thể
Một tổng thểcó quan sát, trung bình cộ ng đư ợ c xét theo công thức:
=∑
Trong đó là trung bình tổng thể;
là giá trịquan sát thứ;
là tổng số quan sát (kích thư ớ c của tổng thể).
Ví dụ:Sốliệu tỷlệlãi trên vốn (%) của một công ty ghi nhậ n qua 10 năm như sau:
5.2
6.0
3.8
4.5
7.4
5.0
5.2
6.5
6.2
6.4
Tỷlệlãi vốn trung bình của công ty trong thời kỳ 10 năm đư ợ c xác đị nh như sau:
=5.2 + 6.0 + + 6.4
10 = 5.62(%)
Công thức tính trung bình trên trong trư ờ ng hợp khảo sát cảtổng thể. Trong thực tế , thư ờ ng ta
không thểhoặc không cần nghiên cứu cảtổng thể.
Trung bình mẫu
Một mẫu có quan sát, trung bình mẫ u đư ợ c tính theo công thức
=∑
Trong đó là trung bình mẫu;
là giá trịquan sát thứ;
là tổng sốquan sát (cỡmẫ u hay kích thư ớ c của mẫu).
Ví dụ:Sốngày nghỉtrong mộ t năm củ a một mẫu gồ m 16 ngư ờ i đư ợ c chọn ra từsốnhân viên
trong một công ty lớ n đư ợ c ghi nhậ n như sau:
10
11
12
15
15
18
6
10
14
8
2
7
4
10
6
12
Trung bình mẫ u đư ợ c xác đị nh như sau:

2
=10 + 11 + + 12
16 = 10 (ngày)
Trung bình có trọng số
Trung bình có trọng số là trư ờ ng hợ p đặ c biệt của trung bình cộng, khi mỗi giá trịxuất
hiện nhiều lầ n. Khi đó trung bình có trọng số đư ợ c xác đị nh theo công thức:
=∑∗
∑
Trong đó là trung bình có trọng số;
là giá trịquan sát thứ;
là trọng sốthứ,∑=.
Ví dụ:Sốsản phẩ m đạ t tiêu chuẩn kỹthuật trong 60 ngày ởmộ t xư ở ng ghi nhậ n đư ợ c như sau:
Sản phẩ m đạ t tiêu chuẩn kỹthuật
450
500
600
Sốngày
20
28
12
Sản phẩ m đạ t tiêu chuẩn kỹthuật trung bình đư ợ c xác đị nh theo công thức:
=450 + 500 + 600
20 + 28 + 12 = 503.3 (ngày)
b. Trư ờ ng hợp dữliệu là các khoảng
Trong trư ờ ng hợp này trung bình cộ ng đư ợ c tính một cách xấp xỉtheo công thức
=∑∗
∑
Trong đó là trung bình;
là trịsốgiữ a (điể m giữa) của nhóm thứ , đư ợ c tính bằng cận trên và cận
dư ớ i của khoả ng đó cộ ng lại chia 2;
là tần sốcủa nhóm thứ,∑=.
Ví dụ:Trong mộ t đợ t sản xuấ t, ngư ờ i ta chọn ngẫu nhiên 50 sản phẩm và ghi nhận trọ ng lư ợ ng.
Sản phẩ m đư ợ c phân nhóm theo trọ ng lư ợ ng như sau:
Trọ ng lư ợ ng (gam)
Trịsốgiữa
Sốsản phẩm
484-490
487
5
490-496
493
10
496-502
499
15
502-508
505
13
508-514
511
7
Tổng
50
Trung bình mẫuxác đị nh theo công thức

3
=487 ∗5 + 493 ∗10 + + 511 ∗7
50 = 499.84 (gam)
Nhận xét: Trung bình cộ ng thư ờ ng rất nhạy cảm với các giá trị độ t biến (giá trịquá lớn hoặc quá
nhỏ ), do đó giá trị trung bình sẽkém tiêu biểu khi dãy sốxuất hiện các giá trị độ t biến. Tuy
nhiên, trung bình cộng có thể đư ợ c sửdụ ng để so sánh hai hay nhiều tổng thể , như so sánh mứ c
lư ợ ng ngày của nhân viên giữa các công ty, so sánh tuổi thọmột loại sản phẩm giữa các nhãn
hiệu.
2. Trung vị(Median)
a. Trư ờ ng hợp dữliệu nhận các giá trịrời rạc
Trung vịlà giá trị đứ ng ởvịtrí giữa trong một dãy số đãđư ợ c sắp xếp có thứtự. Trung vịchia
dãy sốra thành hai phần bằ ng nhau: trư ớ c và sau trịsốtrung vịsẽcó 50% quan sát, ký hiệu
.
Xác đị nh trung vị:
Trư ờ ng hợp lẻ : trư ớ c hết giá trịcủa các quan sát sẽ đư ợ c sắp xếp theo thứtựlớn dần,
trung vịsẽlà giá trị ở vịtrí thứ→ = ( ) .
Trư ờ ng hợp chẵ n: trư ờ ng hợp này trung vị rơ i vào giữ a hai giá trịvà , trung
vị quy ư ớ c là trung bình cộng của hai giá trị đó =.
b. Trư ờ ng hợp dữliệu là các khoảng
Với dữliệ u đã phân nhóm, trung vị đư ợ c xác đị nh một cách xấp xỉ qua các bư ớ c sau:
B1. Tính tần sốtích lũy.
B2. Xác đị nh nhóm chứa, đó là nhóm có tầ n sốtích lũy ≥.
B3. Áp dụng công thức=( ) + ∗
Trong đó ( ) là giới hạ n dư ớ i của nhóm chứa ;
là trịsốkhoảng cách nhóm chứa;
là tần sốtích lũy củ anhóm đứ ng trư ớ c nhóm chứa;
là tần sốcủa nhóm chứa.
Ví dụ:Sửdụng kết quảví dụtrên ta có

4
Trọ ng lư ợ ng (gam)
Sốsản phẩm
Tần sốtích lũy
484-490
5
5
490-496
10
15
496-502
15
30
502-508
13
43
508-514
7
50
Tổng
50
Nhóm chứa là nhóm (496-502), vì nhóm đó có tầ n sốtích lũy bằ ng 30 > (50 + 1)/ 2
Áp dụng công thức ta có
= 496 + 6 ∗
50
2− 15
15 = 500 (gam)
Nhận xét: Trung vịlà trịsốduy nhất có thể đư ợ c xác đị nh trong một dãy số , là đặ c trư ng đo
lư ờ ng khuynh hư ớ ng tập trung không bị ả nh hư ở ng bởi các giá trị độ t biến. Trung vịcó thểtính
cho các dữliệu sửdụ ng các thang đo tỷ lệ , thang đo khoả ng và thang đo thứ bậc.
3. Các tứphân vị, thập phân vị
a. Trư ờ ng hợp dữliệu nhận các giá trịrời rạc
Trong một dãy số đã sắp xếp có thứtự, các trịsốcủa tứphân vịsẽchia dãy sốthành bốn phần
bằng nhau.
Với mẫu có quan sát, gọi, , lầ n lư ợ t là tứphân vị đầ u tiên, tứphân vịthứhai và tứ
phân vịthứ ba. Cách xác đị nh các trịsố như sau:
là giá trị ở vịtrí thứ:=( )/ ;
chính là sốtrung vị;
là giá trị ở vịtrí thứ( ):=( )/ .
Ví dụ:Tỷlệlãi của các doanh nghiệp sắp xếp từnhỏ đế n lớn
(%)
8.5
9
9.5
10
10.5
12
12.5
Ví dụ:Chúng ta có tập dữliệu vớ i 8 quan sát như sau
11
12
14
15
16
17
18
21
Xác đị nh giá trịcủa các tứphân vị
là giá trị ở vịtrí thứ= = 2.25 → phải là một giá trịnằm giữa quan sát thứ2 và
quan sát thứ3 theo tọ a độ lệch ¼ gần vềphía quan sát thứ hai nên ta xác đị nh giá trị như sau:

5
= 12 + 0.25 ∗
(14 − 12)= 12.5
là giá trị ở vịtrí thứ= = 4.5 → phải là một giá trịnằm giữa quan sát thứ4 và
quan sát thứ 5 nên ta xác đị nh giá trị như sau:
=15 + 16
2= 15.5
là giá trị ở vịtrí thứ( ) =( ) = 6.75 → phải là một giá trịnằm giữa quan sát thứ6
và quan sát thứ7 theo tọ a độ lệch 3/4 gần vềphía quan sát thứsáu nên ta xác đị nh giá trị như
sau:
= 17 + 0.75 ∗
(18 − 17)= 17.75
b. Trư ờ ng hợp dữliệu là các khoảng
Tứphân vịthứnhất=( ) + ∗
Trong đó ( ) là giới hạ n dư ớ i của nhóm chứa ;
là trịsốkhoảng cách nhóm chứa;
là tần sốtích lũy củ a nhóm đứ ng trư ớ c nhóm chứa;
là tần sốcủa nhóm chứa.
Tứphân vịthứba =( ) + ∗
Trong đó ( ) là giới hạn dư ớ i của nhóm chứa ;
là trịsốkhoảng cách nhóm chứa;
là tần sốtích lũy củ a nhóm đứ ng trư ớ c nhóm chứa;
là tần sốcủa nhóm chứa.
Đồ thịhình hộplà phư ơ ng pháp mô tả và tổng hợp các sốliệu mẫu bằ ng đồ thị , trên đó phả n
ánh đư ợ c cùng một lúc cả các đặ c trư ng về xu hư ớ ng trung tâm cũng như độ phân tán của các giá
trịmẫu.
Để xây dự ng đồ thịhình hộ p ngư ờ i ta thư ờ ng sửdụng các thố ng kê đặ c trư ng mẫ u là trung vị,
các tứphân vị,và các giá trịvà của phân phối mẫu. Nó có dạ ng như hình sau