
59
PHẦN II
THỐNG KÊ TOÁN
Thống kê học là một trong những môn khoa học có lịch sử phát triển lâu dài từ đơn
giản đến phức tạp. Từ thời cổ đại con người đã biết chú ý đến việc ghi chép, kê khai về số
người, ruộng đất và tài sản..., đồng thời cùng với sự phát triển của kinh tế, xã hội cũng đã
nghiên cứu về những phương pháp thu thập số liệu, tính toán và phân tích về mặt lượng của
các hiện tượng kinh tế xã hội. Thông qua việc phát hiện, phản ánh những quy luật về mặt
lượng của hiện tượng, các con số thống kê giúp cho việc kiểm tra giảm sát, đánh giá các
chương trình kế hoạch và định hướng sự phát triển kinh tế xã hội trong tương lai...
Ngày nay với những thành tựu của khoa học tự nhiên đặc biệt là sự ra đời của môn lý
thuyết xác suất đã có ảnh hưởng lớn đến sự phát triển của môn thống kê toán và thống kê toán
được coi là một trong những công cụ quản lý vĩ mô quan trọng có vai trò cung cấp các thông
tin thống kê trung thực khách quan, chính xác, đầy đủ, kịp thời; sử dụng các phương pháp
phân tích về mặt lượng của các hoạt động kinh tế xã hội phục vụ trong việc đánh giá dự báo
tình hình, xây dựng các chính sách, kế hoạch phát triển kinh tế xã hội ngắn hạn và dài hạn,
đồng thời cũng kiểm tra, đánh giá được tình hình thực hiện các chính sách, kế hoạch đó.
Chương 3
PHƢƠNG PHÁP MẪU THỐNG KÊ
§ 1. MẪU THỐNG KÊ NGẪU NHIÊN
3.1.1. Điều tra chọn mẫu
Để có thể phản ánh đƣợc bản chất và quy luật phát triển của hiện tƣợng cần nghiên
cứu, các con số thống kê phải đƣợc thu thập trên một số lớn các hiện tƣợng cá biệt và coi tổng
thể các hiện tƣợng cá biệt đó nhƣ một thể hoàn chỉnh cần nghiên cứu. Muốn nghiên cứu tổng
thể phải dựa trên cơ sở nghiên cứu các hiện tƣợng cá biệt (ta gọi là đơn vị tổng thể). Nếu có
thể điều tra toàn bộ, thu thập đƣợc số liệu với tất cả mọi đơn vị tổng thể (còn gọi là tập gốc)
thì sẽ nhận đƣợc đầy đủ những thông tin, số liệu chính xác nhất về đối tƣợng cần nghiên cứu.
Tuy nhiên trong nhiều trƣờng hợp điều đó không thể thực hiện đƣợc, do kích thƣớc của tập
hợp gốc quá lớn, hoặc do các phần tử trong tập hợp gốc biến động nhanh không kiểm soát
đƣợc số lƣợng, hoặc do đặc tính của các phần tử thay đổi thƣờng xuyên…Cho nên thông
thƣờng chúng ta chỉ thực hiện điều tra không toàn bộ tức là chọn ra (với phƣơng thức chọn có

60
thể hoàn lại, hoặc không hoàn lại) một nhóm các đơn vị tổng thể từ tập gốc để thu thập số
liệu, từ đó nghiên cứu xử lý và đánh giá kết luận cho toàn bộ tập gốc; đây gọi là phương pháp
điều tra chọn mẫu thống kê.
Phƣơng pháp điều tra điều tra chọn mẫu có thể rút ngắn đƣợc thời gian, tiết kiệm công
sức, giảm chi phí, nhƣng cũng có những hạn chế nhất định, đó là luôn phát sinh sai số do chỉ
dựa vào số liệu của một số ít đơn vị tổng thể để đánh giá cho toàn bộ hiện tƣợng cần nghiên
cứu. Tuy nhiên nếu chọn các phần tử của mẫu một cách ngẫu nhiên, độc lập với nhau, và xử
lý bằng các phƣơng pháp xác suất thì vừa thu đƣợc các kết luận một cách nhanh chóng, đỡ
tốn kém mà vẫn đảm bảo đƣợc độ chính xác và trung thực cho tập hợp gốc.
3.1.2. Mẫu ngẫu nhiên
Từ một tập gốc gồm toàn bộ đơn vị tổng thể chung có kích thƣớc là N chọn một cách
ngẫu nhiên và độc lập ra một nhóm gồm n đơn vị tổng thể để thu thập số liệu và nghiên cứu ta
có một mẫu ngẫu nhiên, số phần tử của mẫu đƣợc gọi là kích thước của mẫu. Khi đó với cách
chọn ngẫu nhiên có hoàn lại thì số lƣợng mẫu có thể hình thành là
n
kN
mẫu, còn với cách
chọn ngẫu nhiên không hoàn lại thì có
!
!!
N
kn N n
mẫu. Nhƣ vậy mẫu đƣợc chọn ra để
điều tra nghiên cứu chỉ là một trong số rất lớn số lƣợng mẫu có thể hình thành.
Chú ý: Do các dấu hiệu định lƣợng của hiện tƣợng cá biệt thƣờng chịu tác động của
nhiều yếu tố tất nhiên và ngẫu nhiên với những mức độ và chiều hƣớng khác nhau; cho nên nếu
chỉ thu thập số liệu trên một số ít các hiện tƣợng thì khó có thể tìm ra đƣợc bản chất chung của
hiện tƣợng. Ngƣợc lại khi nghiên cứu trên một số lớn các hiện tƣợng cá biệt, thì các yếu tố ngẫu
nhiên sẽ bù trừ và triệt tiêu nhau và khi đó quy luật chung của hiện tƣợng sẽ đƣợc bộc lộ rõ, vì
thế thƣờng phải chọn kích thƣớc mẫu đủ lớn.
Giả sử dấu hiệu định lƣợng cần nghiên cứu của các phần tử trong tập gốc của tổng thể
là số liệu đƣợc cho bởi biến ngẫu nhiên
X
, và của các phần tử trong mẫu là các biến ngẫu
nhiên
12
; ;...; n
X X X
khi đó do chọn ngẫu nhiên và độc lập từ một tổng thể nên các biến ngẫu
nhiên
12
; ;...; n
X X X
độc lập với nhau và có cùng phân phối xác suất với
;X
ta ký hiệu mẫu
ngẫu nhiên là
12
, ,..., n
X X X
và khi các biến ngẫu nhiên nhận giá trị cụ thể
1 1 2 2
;;X x X x
...; nn
Xx
thì mẫu ngẫu nhiên sẽ có giá trị thực nghiệm là
12
, ,..., .
n
x x x
§ 2. THỐNG KÊ MẪU
Để nghiên cứu biến ngẫu nhiên gốc
X
trong tổng thể, nếu chỉ trên cơ sở một mẫu
ngẫu nhiên
12
, ,..., n
X X X
thì mới chỉ có đƣợc một vài kết luận sơ bộ rời rạc về biến ngẫu

61
nhiên gốc X, vì các biến ngẫu nhiên
i
X
tuy có cùng quy luật phân phối xác suất với
X
nhƣng
quy luật này thƣờng chƣa đƣợc xác định hoàn toàn. Song nếu tổng hợp nhiều các biến ngẫu
nhiên
12
, ,..., n
X X X
thì theo luật số lớn sẽ bộc lộ những quy luật mới làm cơ sở để nhận định
về biến ngẫu nhiên gốc
X
trong tổng thể.
Việc tổng hợp mẫu
12
, ,..., n
X X X
đƣợc thực hiện dƣới dạng một hàm của các biến
ngẫu nhiên trong mẫu, ký hiệu:
12
, ,..., n
Z g X X X
đƣợc gọi là thống kê mẫu. Thống kê
mẫu cũng là một biến ngẫu nhiên, và khi các biến ngẫu nhiên trong mẫu nhận các giá trị thực
nghiệm cụ thể
1 1 2 2
; ;...; nn
X x X x X x
thì thống kê mẫu nhận giá trị thực nghiệm là
12
, ,...,
tn n
Z g x x x
.
Nghiên cứu mẫu ngẫu nhiên chúng ta có thể sử dụng nhiều dạng thống kê mẫu và giá
trị của nó để phân tích biểu thị đặc trƣng của mẫu, nhƣng trong chƣơng trình này chúng ta chỉ
xét kỹ ba thống kê mẫu đặc trƣng có nhiều ứng dụng trong phân tích thống kê kinh tế, đó là:
Kỳ vọng mẫu, tần suất mẫu, phƣơng sai và độ lệch chuẩn mẫu và từ đó suy diễn một số thống
kê liên quan đến các thống kê đó để đánh giá các tham số: Kỳ vọng, xác suất, phƣơng sai và
độ lệch chuẩn của tổng thể chung..
3.2.1. Trung bình mẫu
3.2.1.1. Định nghĩa. Cho mẫu ngẫu nhiên
12
, ,..., n
X X X
đƣợc chọn từ tập hợp gốc của
X
,
khi đó thống kê mẫu
1
1n
i
i
XX
n
đƣợc gọi là trung bình mẫu.
Vì
12
; ;...; n
X X X
là các biến ngẫu nhiên độc lập có cùng phân phối với X , nên trung
bình mẫu
X
cũng là một biến ngẫu nhiên có cùng phân phối xác suất với X và có thể tính
đƣợc kỳ vọng, phƣơng sai của
X
theo kỳ vọng
EX
và phƣơng sai
2
VX
của
biến ngẫu nhiên gốc X.
3.2.1.2. Kỳ vọng của trung bình mẫu
1 1 1 1
1 1 1 1
n n n n
i i i
i i i i
E X E X E X E X
n n n n
. (3.1)
3.2.1.3. Phƣơng sai của trung bình mẫu
Do các biến ngẫu nhiên
, 1,
i
X i n
độc lập với nhau nên ta cũng tính đƣợc phƣơng
sai của trung bình mẫu:
22
2
2 2 2
1 1 1
1 1 1
n n n
ii
i i i
n
V X V X V X X
n n n n n n
(3.2)

62
Chú ý: Trong trƣờng hợp tập hợp gốc có kích thƣớc
N
nhỏ và chọn mẫu theo phƣơng
pháp không hoàn lại thì mẫu ngẫu nhiên đƣợc chọn ra có các giá trị đặc trƣng mẫu sẽ phản
ánh không chính xác và trung thực cho tập gốc. Vì vậy khi tính phƣơng sai của trung bình
mẫu, (thƣờng là với những trƣờng hợp n ≥ N/10) ta phải nhân thêm với hệ số
1
Nn
N
, khi đó
phƣơng sai của trung bình mẫu đƣợc tính theo công thức:
2
1
Nn
VX Nn
(3.3)
Công thức này vẫn hoàn toàn phù hợp với trƣờng hợp chọn mẫu theo phƣơng pháp có
hoàn lại, hoặc tập gốc có kích thƣớc
N
lớn đã nêu ở phần trên, vì khi đó:
lim 1
1
N
Nn
N
cho nên
22
lim 1
N
Nn
N n n
.
Với trƣờng hợp mẫu ta chọn là toàn bộ tập gốc thì n = N tức n – N = 0 và khi đó
0VX
tức là không có sai số.
3.2.2. Tần suất mẫu
3.2.2.1. Định nghĩa. Cho mẫu ngẫu nhiên
12
, ,..., n
X X X
đƣợc chọn từ tập gốc của biến
ngẫu nhiên có phân phối Bernoulli X ~ B(1;p), khi đó
P A p
và
1P A q p
, kỳ
vọng của
X
là
E X p
và phƣơng sai của
X
là
V X pq
.
Thống kê mẫu
A
k
fn
(trong đó
A
k
là tần số của
A
) đƣợc gọi là tần suất mẫu,
f
cũng là biến ngẫu nhiên, và có thể tính đƣợc kỳ vọng, phƣơng sai.
3.2.2.2. Kỳ vọng, phƣơng sai của tần suất mẫu.
E f p
và
pq pq
V f f
nn
. (3.4)
3.2.3. Phƣơng sai mẫu.
1) Phương sai mẫu. Cho mẫu ngẫu nhiên
12
, ,..., n
X X X
đƣợc chọn từ tập gốc của
X. Thống kê mẫu
2
2
1
1n
i
i
S X X
n
22
1
1()
n
i
i
XX
n
đƣợc gọi là phương sai mẫu; căn
bậc hai của phƣơng sai mẫu
2
SS
đƣợc gọi là độ lệch chuẩn mẫu.
Phƣơng sai mẫu
2
S
là một biến ngẫu nhiên và có thể tính đƣợc kỳ vọng của phƣơng
sai mẫu
2
S
theo phƣơng sai
2
VX
của
X
:

63
2
2 2 2 2
22
1 1 1 1
2 2 2 2 2
22
11
1 1 1 1 1
1 1 1 1 1
( ) ( ) ( ) ( ) ( )
n n n n n
i i i i i j
i i i i i j
nnn
i i i j
i i i j
E S E X X E X E X E X X
n n n n n
nn
E X E X E X X E X E X
n n n n n
2) Phương sai mẫu hiệu chỉnh. Từ kết quả tính toán kỳ vọng của phƣơng sai mẫu ta thấy:
2 2 2
1n
ES n
Do đó ta nhân với hệ số hiệu chỉnh
1
n
n
và nhận đƣợc thống kê ký hiệu là
2
's
và
thống kê đó đƣợc gọi là phương sai mẫu hiệu chỉnh
2
22
1
1
'11
n
i
i
n
s S X X
nn
(3.5)
Khi đó ta có
2 2 2
( ' ) ( )
1
n
E s E S
n
.
Căn bậc hai của phƣơng sai mẫu hiệu chỉnh :
2
''ss
đƣợc gọi là độ lệch chuẩn
mẫu hiệu chỉnh. Ta có:
'
'. 11
n s S
sS
nnn
Chú ý: Trong thực tế ta thƣờng sử dụng phƣơng sai mẫu hiệu chỉnh nhƣng khi kích
thƣớc mẫu
n
khá lớn thì phƣơng sai mẫu và phƣơng sai mẫu hiệu chỉnh có giá trị xấp xỉ nhau,
khi đó có thể cũng có thể sử dụng phƣơng sai mẫu thay cho phƣơng sai mẫu hiệu chỉnh.
Để tính giá trị thực nghiệm của kỳ vọng mẫu, độ lệch chuẩn mẫu và độ lệch chuẩn
mẫu hiệu chỉnh, ta có thể sử dụng máy tính tay Casio, hoặc Analyzis Toolpak trong Excel.
§ 3. THỐNG KÊ MÔ TẢ
Trong thực tế những số liệu thu thập đƣợc trong quá trình điều tra thống kê chỉ mới
phản ánh đƣợc các đặc trƣng cá biệt của từng đơn vị tổng thể, có tính chất rời rạc, lẻ tẻ cho nên
chƣa thể sử dụng ngay đƣợc vào công tác nghiên cứu và phân tích thống kê. Để thuận tiện cho
việc phân tích và tính toán, nhƣng không làm thay đổi các giá trị đặc trƣng mẫu, ta phải tiến
hành tập trung chỉnh lý và hệ thống hóa một cách khoa học các số liệu. Đồng thời phải làm cho
các đặc trƣng riêng biệt của từng đơn vị tổng thể bƣớc đầu chuyển thành các đặc trƣng chung
của toàn bộ tổng thể, làm cho các biểu hiện riêng của tiêu thức điều tra bƣớc đầu chuyển thành
các biểu hiện chung về đặc điểm của hiện tƣợng nghiên cứu. Đây là giai đoạn tổng hợp thống
kê, việc đầu tiên là mô tả sắp xếp thu gọn các số liệu và tính các đặc trƣng cơ bản.