Chapter 4<br />
<br />
Nguyên lý thống kê KT<br />
<br />
Nguyên lý thống kê KT<br />
<br />
Nội dung chương<br />
• Chỉ tiêu số tuyệt đối<br />
<br />
Chương 4<br />
Thống kê mức độ hiện tượng KT-XH<br />
<br />
• Chỉ tiêu số tương đối<br />
• Các chỉ tiêu thể hiện xu hướng hội tụ<br />
– Trung bình, trung vị, mốt<br />
<br />
• Chỉ tiêu thể hiện độ phân tán<br />
- Tứ phân vị<br />
- Đo lường sự biến động<br />
+ Khoảng cách, khoảng cách phần tư, phương sai và độ lệch chuẩn,<br />
hệ số biến động<br />
<br />
Hồ Ngọc Ninh<br />
<br />
- Hệ số tương quan<br />
<br />
Dept. of Quantitative Analysis<br />
1<br />
<br />
2<br />
<br />
4.1 Số tuyệt đối<br />
• Khái niệm<br />
• Đơn vị tính<br />
• Một số vấn đề chú ý với số tuyệt đối<br />
<br />
Ưu điểm, nhược điểm?<br />
<br />
• Số tuyệt đối trong thống kê và trong toán học<br />
• Số tuyệt đối về mặt thời gian<br />
• Số tuyệt đối về mặt chất lượng<br />
<br />
3<br />
<br />
4<br />
<br />
4.2 Số tương đối<br />
• Khái niệm<br />
• So sánh 2 số tuyệt đối<br />
<br />
Ưu điểm, nhược điểm?<br />
<br />
• Không phụ thuộc vào giá trị của tử số và<br />
mẫu số<br />
• Số tương đối có gốc so sánh<br />
• Nguyên tắc sử dụng số tương đối<br />
5<br />
<br />
6<br />
<br />
Chapter 4<br />
<br />
Nguyên lý thống kê KT<br />
<br />
4.3 Các giá trị thể hiện xu hướng hội tụ<br />
<br />
Các loại số tương đối<br />
• Kế hoạch<br />
<br />
Xu hướng hội tụ<br />
<br />
• Động thái<br />
• Kết cấu<br />
<br />
Trung bình<br />
<br />
Trung vị<br />
<br />
Mốt<br />
<br />
n<br />
<br />
<br />
<br />
• So sánh<br />
X <br />
<br />
• Cường độ<br />
<br />
Xi<br />
<br />
i 1<br />
<br />
n<br />
N<br />
<br />
X<br />
<br />
<br />
i<br />
<br />
i 1<br />
<br />
N<br />
<br />
7<br />
<br />
4.3.1 Trung bình<br />
<br />
8<br />
<br />
Trung bình<br />
(tiếp)<br />
<br />
• Được sử dụng nhiều nhất để thể hiện xu hướng hội<br />
tụ<br />
• Bị ảnh hưởng bởi các giá trị đầu mút (outliers)<br />
<br />
• Các giá trị trung bình<br />
– Trung bình mẫu<br />
Sample Size<br />
<br />
n<br />
<br />
X<br />
X <br />
<br />
–<br />
<br />
i<br />
<br />
i 1<br />
<br />
<br />
n thể<br />
Trung bình tổng<br />
<br />
X1 X 2 X n<br />
n<br />
0 1 2 3 4 5 6 7 8 9 10<br />
<br />
X<br />
<br />
<br />
0 1 2 3 4 5 6 7 8 9 10 12 14<br />
<br />
Population Size<br />
<br />
N<br />
i<br />
<br />
i 1<br />
<br />
N<br />
<br />
Mean = 5<br />
<br />
X X 2 X N<br />
1<br />
N<br />
<br />
Mean = 6<br />
<br />
9<br />
<br />
Các loại số bình quân<br />
<br />
10<br />
<br />
4.3.2 Trung vị (Median)<br />
• Thể hiển giá trị trung tâm<br />
• Không bị ảnh hưởng bởi các giá trị đầu mút<br />
<br />
• Số bình quân số học<br />
- Giản đơn<br />
<br />
0 1 2 3 4 5 6 7 8 9 10<br />
<br />
- Gia quyền<br />
<br />
Median = 5<br />
<br />
• Số bình quân điều hòa<br />
<br />
0 1 2 3 4 5 6 7 8 9 10 12 14<br />
<br />
Median = 5<br />
<br />
• Khi số liệu được sắp xếp theo trật tự, nó là giá trị ở vị trí<br />
chính giữa<br />
<br />
• Số trung bình nhân<br />
<br />
– Nếu n or N lẻ, trung vị là giá trị của số ở chính giữa<br />
– Nếu n or N chẵn, trung vị là trung bình cộng của 2 số ở chính giữa<br />
<br />
11<br />
<br />
12<br />
<br />
Chapter 4<br />
<br />
Nguyên lý thống kê KT<br />
<br />
Cách xác định trung vị<br />
<br />
Ví dụ: có tài liệu phân tổ theo mức lượng của 380 công nhân như sau<br />
<br />
Møc l¬ng (ngµn ®ång)<br />
500 - 600<br />
600 - 700<br />
700 - 800<br />
800 - 900<br />
900 - 1.000<br />
1.000 - 1.100<br />
Tæng céng<br />
<br />
• Tài liệu phân tổ có khoảng cách tổ<br />
<br />
f S<br />
<br />
Me xe he 2<br />
<br />
e1<br />
<br />
fe<br />
<br />
Me: Trung vÞ<br />
xe: Giíi h¹n ®Çu cña tæ chøa trung vÞ<br />
he: Kho¶ng c¸ch tæ chøa trung vÞ<br />
fe: TÇn sè cña tæ chøa trung vÞ<br />
f: Tæng c¸c tÇn sè<br />
Se-1: Tæng c¸c tÇn sè cña c¸c tæ ®øng trªn tæ chøa trung vÞ<br />
<br />
Sè ngêi<br />
35<br />
70<br />
95<br />
100<br />
60<br />
20<br />
380<br />
<br />
Me =789,5<br />
13<br />
<br />
14<br />
<br />
Các xác định Mốt<br />
<br />
4.3.3 Mốt (Mode)<br />
<br />
• Tài liệu phân tổ có khoảng cách tổ không đều<br />
<br />
•<br />
•<br />
•<br />
•<br />
•<br />
<br />
Cũng là một giá trị đo xu hướng hội tụ<br />
Là giá trị xuất hiện nhiều nhất (f max)<br />
Không bị ảnh hưởng bởi các giá trị trung tâm<br />
Sử dụng cả cho tài liệu chất lượng và số lượng<br />
Có thể không, có một, hoặc một vài giá trị mốt<br />
<br />
M o xo ho<br />
<br />
0 1 2 3 4 5 6<br />
<br />
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14<br />
<br />
No Mode<br />
<br />
Mode = 9<br />
<br />
15<br />
<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
<br />
Mo: Mốt<br />
xo: Giới hạn dưới tổ chứa mốt<br />
ho: Khoảng cách tổ chứa mốt<br />
1 = (fo - fo-1) hoặc (do - do-1)<br />
2 = (fo - fo+1) hoặc (do - do+1)<br />
fo Tần số của tổ chứa Mốt<br />
fo-1 Tần số của tổ đứng trước tổ chứa Mốt<br />
fo+1 Tần số của tổ đứng sau tổ chứa Mốt<br />
<br />
(Đo độ phân tán)<br />
<br />
• Chia số liệu thành 4 phần<br />
25%<br />
<br />
Q1 <br />
<br />
• Vị trí của Qi<br />
<br />
Sự biến động/phân tán<br />
<br />
25%<br />
<br />
Q2 <br />
<br />
16<br />
<br />
4.4. Đo lường sự biến động<br />
<br />
4.3.4 Tứ phân vị (Qi)<br />
25%<br />
<br />
1<br />
1 2<br />
<br />
25%<br />
<br />
Q3 <br />
Qi <br />
<br />
P.Sai<br />
<br />
i n 1<br />
4<br />
<br />
Data in Ordered Array: 11 12 13 16 16 17 18 21 22<br />
<br />
1 9 1<br />
12 13 12.5<br />
2.5<br />
Q1 <br />
4<br />
2<br />
• Q1 và Q3 không phải là các giá trị trung tâm<br />
• Q2 = Me, Là giá trị trung tâm<br />
Position of Q1 <br />
<br />
Độ lệch chuẩn<br />
<br />
PS<br />
<br />
ĐLC<br />
<br />
tổng thể<br />
<br />
Tổng thể<br />
<br />
PS mẫu<br />
<br />
Hệ số biến<br />
động<br />
<br />
ĐLC<br />
Mẫu<br />
<br />
Khoảng biến thiên<br />
17<br />
<br />
18<br />
<br />
Chapter 4<br />
<br />
Nguyên lý thống kê KT<br />
<br />
Sự cần thiết của đo độ phân tán<br />
Tần<br />
số<br />
<br />
Tại sao phải sử dụng độ phân tán?<br />
<br />
Nếu chỉ tính Mo,<br />
Me,TB thì 2<br />
phân phối A và<br />
B cho cùng KQ.<br />
<br />
A<br />
<br />
+ Để<br />
<br />
thẩm định độ tin cậy của các số đo xu<br />
hướng hội tụ (Mốt, Trung vị, TB)<br />
<br />
+ Nhận biết được đặc trưng riêng của từng<br />
phân phối để có hướng giải quyết phù hợp<br />
+ Giúp lựa chọn phân phối mẫu, tổng thể tốt<br />
hơn (tránh những phân phối có độ phân<br />
tán rộng)<br />
<br />
B<br />
<br />
<br />
<br />
X<br />
19<br />
<br />
4.4.2 Độ lệch tuyệt đối trung bình<br />
<br />
4.4.1 Khoảng biến thiên (Range)<br />
• Đo lường sự biến động<br />
• Là khoảng cách giữa quan sát lớn nhất và quan sát<br />
nhỏ nhất:<br />
<br />
• Khái niệm<br />
• Ưu, nhược điểm<br />
<br />
xi - x<br />
xi - x fi<br />
d = ------ hay d = ------------n<br />
fi<br />
<br />
Range X Largest X Smallest<br />
• Bỏ qua sự phân bố của các lượng biến bên trong<br />
Range = 12 - 7 = 5<br />
<br />
Range = 12 - 7 = 5<br />
7<br />
<br />
8<br />
<br />
9<br />
<br />
10<br />
<br />
11<br />
<br />
20<br />
<br />
7<br />
<br />
12<br />
<br />
8<br />
<br />
9<br />
<br />
10<br />
<br />
11<br />
<br />
12<br />
21<br />
<br />
4.4.4 Độ lệch chuẩn (Standard Deviation)<br />
<br />
4.4.3 Phương sai (Variance)<br />
<br />
• Là chỉ tiêu quan trọng “nhất” đo lường sự biến động<br />
• Biểu hiện sự biến động xung quanh giá trị TB<br />
• Có đơn vị giống đơn vị gốc<br />
<br />
• Là giá trị quan trọng đo lường sự biến động<br />
• Biểu hiện sự biến động xung quanh giá trị TB<br />
– Phương sai mẫu:<br />
n<br />
<br />
2<br />
<br />
S <br />
<br />
X<br />
<br />
i<br />
<br />
X<br />
<br />
22<br />
<br />
– Độ lệch chuẩn mẫu:<br />
<br />
2<br />
<br />
n<br />
<br />
X<br />
<br />
i 1<br />
<br />
S<br />
<br />
n 1<br />
<br />
– Phương sai tổng thể:<br />
<br />
X<br />
<br />
i<br />
<br />
2<br />
<br />
i 1<br />
<br />
n 1<br />
<br />
– Độ lệch chuẩn tổng thể:<br />
N<br />
2<br />
<br />
<br />
<br />
X<br />
<br />
i<br />
<br />
<br />
<br />
N<br />
<br />
2<br />
<br />
X<br />
<br />
<br />
i 1<br />
<br />
N<br />
<br />
23<br />
<br />
i<br />
<br />
<br />
<br />
2<br />
<br />
i 1<br />
<br />
N<br />
<br />
24<br />
<br />
Chapter 4<br />
<br />
Nguyên lý thống kê KT<br />
<br />
So sánh độ lệch chuẩn<br />
Data A<br />
11 12 13<br />
<br />
4.4.5 Hệ số biến động tiêu thức<br />
Mean = 15.5<br />
s = 3.338<br />
<br />
14 15 16 17 18 19 20 21<br />
<br />
• Đo lường sự thay đổi tương đối<br />
• Luôn có đơn vị là phần trăm (%)<br />
• Biểu hiện sự biến động “so với” số TB<br />
<br />
Data B<br />
11 12 13<br />
<br />
14 15 16 17 18 19 20 21<br />
<br />
Mean = 15.5<br />
s = 0.9258<br />
<br />
14 15 16 17 18 19 20 21<br />
<br />
Mean = 15.5<br />
s = 4.57<br />
<br />
•<br />
<br />
Data C<br />
11 12 13<br />
<br />
• Thường dùng so sánh sự phân bố của hai hay<br />
nhiều data có đơn vị tính khác nhau<br />
<br />
S<br />
CV <br />
X<br />
<br />
<br />
100%<br />
<br />
<br />
25<br />
<br />
26<br />
<br />
So sánh hệ số biến động<br />
<br />
Câu hỏi thảo luận<br />
<br />
• Cổ phiếu A:<br />
<br />
=> Tại sao các nhà phân tích tài chính lại<br />
quan tâm tới độ phân tán thu nhập của<br />
các cơ sở sản xuất?<br />
<br />
– Giá bán bq năm trước = $50<br />
– Độ lệch chuẩn = $5<br />
<br />
• Cổ phiếu B:<br />
– Giá bán bq năm trước = $100<br />
– Độ lệch chuẩn = $5<br />
<br />
=> Tại sao các nhà quản lý chất lượng<br />
sản phẩm lại quan tâm tới độ phân tán<br />
của các đặc trưng của sản phẩm?<br />
<br />
• Hệ số biến động tiêu thức:<br />
– Cổ phiếu A:<br />
– Cổ phiếu B:<br />
<br />
S<br />
$5 <br />
CV 100% <br />
100% 10%<br />
X<br />
$50 <br />
S<br />
CV <br />
X<br />
<br />
<br />
$5 <br />
100% <br />
100% 5%<br />
<br />
$100 <br />
<br />
27<br />
<br />
28<br />
<br />
Dạng phân phối<br />
<br />
Hệ số không đối xứng<br />
<br />
• Mô tả sự phân bố của số liệu<br />
<br />
• Khái niệm:<br />
<br />
• Đặc trưng của phân phối<br />
<br />
• Công thức tính:<br />
<br />
KA <br />
<br />
– Đối xứng or độ nghiêng<br />
<br />
Lệch trái<br />
<br />
Đối xứng<br />
<br />
Mean < Median < Mode Mean = Median =Mode<br />
<br />
X M0<br />
<br />
<br />
+ Nếu KA < 0 phân phối lệch trái<br />
<br />
Lệch phải<br />
Mode < Median < Mean<br />
<br />
+ Nếu KA >0 thì phân phối lệch phải<br />
+ KA càng lớn thì phân phối càng không đối xứng<br />
<br />
29<br />
<br />
30<br />
<br />