59
PHN II
THNG KÊ TOÁN
Thng hc mt trong nhng môn khoa hc lch s phát trin lâu dài t đơn
giản đến phc tp. T thi c đại con người đã biết chú ý đến vic ghi chép, khai v s
người, ruộng đt tài sn..., đồng thi cùng vi s phát trin ca kinh tế, hội cũng đã
nghiên cu v những phương pháp thu thập s liu, tính toán phân tích v mặt lượng ca
các hiện tượng kinh tế hi. Thông qua vic phát hin, phn ánh nhng quy lut v mt
ng ca hiện tượng, các con s thng giúp cho vic kim tra giảm sát, đánh giá các
chương trình kế hoạch và định hướng s phát trin kinh tế xã hi trong tương lai...
Ngày nay vi nhng thành tu ca khoa hc t nhiên đặc bit là s ra đời ca môn lý
thuyết xác suất đã có ảnh hưởng lớn đến s phát trin ca môn thng kê toán và thng kê toán
được coi là mt trong nhng công c quản mô quan trng vai trò cung cp các thông
tin thng trung thực khách quan, chính xác, đầy đủ, kp thi; s dụng các phương pháp
phân tích v mặt lượng ca các hoạt động kinh tế hi phc v trong việc đánh giá dự báo
tình hình, xây dng các chính sách, kế hoch phát trin kinh tế hi ngn hn dài hn,
đồng thời cũng kiểm tra, đánh giá được tình hình thc hin các chính sách, kế hoạch đó.
Chương 3
PHƢƠNG PHÁP MẪU THNG
§ 1. MU THNG KÊ NGU NHIÊN
3.1.1. Điều tra chn mu
Để th phn ánh đƣợc bn cht quy lut phát trin ca hiện ng cn nghiên
cu, các con s thng kê phải đƣợc thu thp trên mt s ln các hiện tƣợng cá bit và coi tng
th các hiện tƣợng biệt đó nhƣ mt th hoàn chnh cn nghiên cu. Mun nghiên cu tng
th phi dựa trên sở nghiên cu các hiện tƣợng bit (ta gọi đơn vị tng th). Nếu
th điu tra toàn b, thu thập đƣợc s liu vi tt c mọi đơn vị tng th (còn gi tp gc)
thì s nhận đƣợc đầy đủ nhng thông tin, s liu chính xác nht v đối tƣợng cn nghiên cu.
Tuy nhiên trong nhiều trƣờng hợp điều đó không thể thc hiện đƣợc, do kích thƣớc ca tp
hp gc quá ln, hoc do các phn t trong tp hp gc biến động nhanh không kim soát
đƣợc s ng, hoặc do đặc tính ca các phn t thay đổi thƣờng xuyên…Cho nên thông
thƣờng chúng ta ch thc hiện điều tra không toàn b tc là chn ra (với phƣơng thức chn có
60
th hoàn li, hoc không hoàn li) một nhóm các đơn vị tng th t tp gốc để thu thp s
liu, t đó nghiên cu x lý và đánh giá kết lun cho toàn b tp gốc; đây gọi là phương pháp
điều tra chn mu thng kê.
Phƣơng pháp điều tra điều tra chn mu có th rút ngắn đƣợc thi gian, tiết kim công
sc, gim chi phí, nhƣng cũng những hn chế nhất định, đó là luôn phát sinh sai số do ch
da vào s liu ca mt s ít đơn vị tng th để đánh giá cho toàn bộ hiện tƣợng cn nghiên
cu. Tuy nhiên nếu chn các phn t ca mu mt cách ngẫu nhiên, độc lp vi nhau, x
bằng các phƣơng pháp xác suất thì vừa thu đƣợc các kết lun một cách nhanh chóng, đỡ
tn kém mà vẫn đảm bảo đƣợc độ chính xác và trung thc cho tp hp gc.
3.1.2. Mu ngu nhiên
T mt tp gc gm toàn b đơn vị tng th chung có kích thƣớc là N chn mt cách
ngẫu nhiên và độc lp ra mt nhóm gm n đơn vị tng th để thu thp s liu và nghiên cu ta
có mt mu ngu nhiên, s phn t ca mẫu đƣợc gi kích thước ca mẫu. Khi đó với cách
chn ngu nhiên hoàn li thì s ng mu có th hình thành
n
kN
mu, còn vi cách
chn ngu nhiên không hoàn li thì
!
!!
N
kn N n
mẫu. Nhƣ vậy mẫu đƣợc chọn ra để
điều tra nghiên cu ch là mt trong s rt ln s ng mu có th hình thành.
Chú ý: Do các du hiu định lƣợng ca hiện tƣợng biệt thƣờng chịu tác động ca
nhiu yếu t tt nhiên và ngu nhiên vi nhng mức độ và chiu hƣớng khác nhau; cho nên nếu
ch thu thp s liu trên mt s ít các hin ng thì khó có th tìm ra đƣợc bn cht chung ca
hiện tƣợng. Nc li khi nghiên cu trên mt s ln các hiện tƣợng cá bit, thì các yếu t ngu
nhiên s bù tr trit tiêu nhau khi đó quy luật chung ca hiện tƣợng s đƣc bc l rõ, vì
thế thƣờng phi chn kích thƣớc mu đ ln.
Gi s du hiệu định lƣợng cn nghiên cu ca các phn t trong tp gc ca tng th
s liệu đƣợc cho bi biến ngu nhiên
X
, ca các phn t trong mu là các biến ngu
nhiên
12
; ;...; n
X X X
khi đó do chọn ngẫu nhiên độc lp t mt tng th nên các biến ngu
nhiên
12
; ;...; n
X X X
độc lp vi nhau cùng phân phi xác sut vi
;X
ta hiu mu
ngu nhiên là
12
, ,..., n
X X X
khi các biến ngu nhiên nhn gtr c th
...; nn
Xx
thì mu ngu nhiên sgiá tr thc nghim là
12
, ,..., .
n
x x x
§ 2. THNG KÊ MU
Để nghiên cu biến ngu nhiên gc
X
trong tng th, nếu ch trên s mt mu
ngu nhiên
12
, ,..., n
X X X
tmi ch đƣc mt vài kết luận bộ ri rc v biến ngu
61
nhiên gc X, vì các biến ngu nhiên
i
X
tuy có cùng quy lut phân phi xác sut vi
X
nhƣng
quy luật này thƣờng chƣa đƣợc xác định hoàn toàn. Song nếu tng hp nhiu các biến ngu
nhiên
12
, ,..., n
X X X
thì theo lut s ln s bc l nhng quy lut mới làm cơ sở để nhận định
v biến ngu nhiên gc
X
trong tng th.
Vic tng hp mu
12
, ,..., n
X X X
đƣợc thc hiện dƣới dng mt hàm ca các biến
ngu nhiên trong mu, hiu:
12
, ,..., n
Z g X X X
đƣợc gi thng mu. Thng
mẫu cũng là một biến ngu nhiên, và khi các biến ngu nhiên trong mu nhn các giá tr thc
nghim c th
1 1 2 2
; ;...; nn
X x X x X x
thì thng mu nhn g tr thc nghim
12
, ,...,
tn n
Z g x x x
.
Nghiên cu mu ngu nhiên chúng ta có th s dng nhiu dng thng mu giá
tr của nó để phân tích biu th đặc trƣng của mẫu, nhƣng trong chƣơng trình này chúng ta chỉ
xét k ba thng kê mẫu đặc trƣng có nhiều ng dng trong phân tích thng kinh tế, đó là:
K vng mu, tn sut mẫu, phƣơng sai và độ lch chun mu và t đó suy diễn mt s thng
kê liên quan đến các thống kê đó để đánh giá các tham số: K vng, xác suất, phƣơng sai
độ lch chun ca tng th chung..
3.2.1. Trung bình mu
3.2.1.1. Định nghĩa. Cho mu ngu nhiên
12
, ,..., n
X X X
đƣợc chn t tp hp gc ca
X
,
khi đó thống kê mu
1
1n
i
i
XX
n
đƣợc gi là trung bình mu.
12
; ;...; n
X X X
là c biến ngẫu nhiên độc lp cùng phân phi vi X , nên trung
bình mu
X
cũng một biến ngu nhiên cùng phân phi xác sut vi X th tính
đƣợc k vọng, phƣơng sai ca
X
theo k vng
EX
phƣơng sai
2
VX
ca
biến ngu nhiên gc X.
3.2.1.2. K vng ca trung bình mu
1 1 1 1
1 1 1 1
n n n n
i i i
i i i i
E X E X E X E X
n n n n

. (3.1)
3.2.1.3. Phƣơng sai của trung bình mu
Do các biến ngu nhiên
, 1,
i
X i n
độc lp với nhau nên ta cũng tính đƣợc phƣơng
sai ca trung bình mu:
22
2
2 2 2
1 1 1
1 1 1




n n n
ii
i i i
n
V X V X V X X
n n n n n n
(3.2)
62
Chú ý: Trong trƣờng hp tp hp gốc có kích thƣớc
N
nh và chn mẫu theo phƣơng
pháp không hoàn li thì mu ngẫu nhiên đƣợc chn ra các giá tr đặc trƣng mẫu s phn
ánh không chính xác trung thc cho tp gc. vậy khi tính phƣơng sai của trung bình
mẫu, (thƣờng là vi những trƣờng hp n N/10) ta phi nhân thêm vi h s
1
Nn
N
, khi đó
phƣơng sai của trung bình mẫu đƣợc tính theo công thc:
2
1
Nn
VX Nn
(3.3)
Công thc này vn hoàn toàn phù hp với trƣờng hp chn mẫu theo phƣơng pháp có
hoàn li, hoc tp gốc có kích thƣớc
N
lớn đã nêu ở phần trên, vì khi đó:
lim 1
1
N
Nn
N

cho nên
22
lim 1
N
Nn
N n n


.
Với trƣờng hp mu ta chn toàn b tp gc thì n = N tc n N = 0 khi đó
0VX
tc là không có sai s.
3.2.2. Tn sut mu
3.2.2.1. Định nghĩa. Cho mu ngu nhiên
12
, ,..., n
X X X
đƣợc chn t tp gc ca biến
ngu nhiên phân phi Bernoulli X ~ B(1;p), khi đó
P A p
, k
vng ca
X
E X p
và phƣơng sai của
X
V X pq
.
Thng kê mu
A
k
fn
(trong đó
A
k
là tn s ca
A
) đƣợc gi tn sut mu,
f
cũng là biến ngu nhiên, và có th tính đƣợc k vọng, phƣơng sai.
3.2.2.2. K vọng, phƣơng sai của tn sut mu.
E f p
pq pq
V f f
nn
. (3.4)
3.2.3. Phƣơng sai mẫu.
1) Phương sai mu. Cho mu ngu nhiên
12
, ,..., n
X X X
đƣợc chn t tp gc ca
X. Thng mu
2
2
1
1n
i
i
S X X
n

22
1
1()
n
i
i
XX
n

đƣợc gi phương sai mẫu; căn
bc hai của phƣơng sai mẫu
2
SS
đƣợc gi là độ lch chun mu.
Phƣơng sai mẫu
2
S
mt biến ngu nhiên th tính đƣợc k vng của phƣơng
sai mu
2
S
theo phƣơng sai
2
VX
ca
X
:
63
2
2 2 2 2
22
1 1 1 1
2 2 2 2 2
22
11
1 1 1 1 1
1 1 1 1 1
( ) ( ) ( ) ( ) ( )
n n n n n
i i i i i j
i i i i i j
nnn
i i i j
i i i j
E S E X X E X E X E X X
n n n n n
nn
E X E X E X X E X E X
n n n n n
 
 








2) Phương sai mu hiu chnh. T kết qu nh tn k vng ca phƣơng sai mu ta thy:
2 2 2
1n
ES n


Do đó ta nhân với h s hiu chnh
1
n
n
nhận đƣợc thng hiu
2
's
thống kê đó đƣợc gi là phương sai mẫu hiu chnh
2
22
1
1
'11
n
i
i
n
s S X X
nn

(3.5)
Khi đó ta có
2 2 2
( ' ) ( )
1
n
E s E S
n

.
Căn bậc hai của phƣơng sai mẫu hiu chnh :
2
''ss
đƣợc gi độ lch chun
mu hiu chnh. Ta có:
'
'. 11
n s S
sS
nnn
Chú ý: Trong thc tế ta thƣờng s dụng phƣơng sai mẫu hiu chỉnh nhƣng khi kích
thƣớc mu
n
khá lớn thì phƣơng sai mẫu và phƣơng sai mẫu hiu chnh có giá tr xp x nhau,
khi đó có thể cũng có thể s dụng phƣơng sai mẫu thay cho phƣơng sai mẫu hiu chnh.
Để tính giá tr thc nghim ca k vng mẫu, độ lch chun mẫu độ lch chun
mu hiu chnh, ta có th s dng máy tính tay Casio, hoc Analyzis Toolpak trong Excel.
§ 3. THNG KÊ MÔ T
Trong thc tế nhng s liu thu thập đƣợc trong quá trình điều tra thng ch mi
phản ánh đƣợc các đặc trƣng cá biệt ca từng đơn vị tng th, có tính cht ri rc, l t cho nên
chƣa thể s dụng ngay đƣợc vào công tác nghiên cu và phân tích thống kê. Để thun tin cho
việc phân ch tính toán, nhƣng không làm thay đổi các giá tr đặc trƣng mẫu, ta phi tiến
hành tp trung chnh lý h thng hóa mt cách khoa hc các s liệu. Đồng thi phi làm cho
các đặc trƣng riêng biệt ca từng đơn v tng th ớc đu chuyển thành các đặc trƣng chung
ca toàn b tng th, làm cho các biu hin riêng ca tiêu thức điều tra bƣớc đầu chuyn thành
các biu hin chung v đặc điểm ca hiện tƣợng nghiên cứu. Đây giai đoạn tng hp thng
kê, việc đầu tiên là mô t sp xếp thu gn các s liệu tính các đặc trƣng cơ bn.