70
PhÇn 2. Thèng to¸n
Thèng to¸n hä ra ®êi g¾n liÒn víi nhu Çu thù tiÔn ña nhiªn - héi ã lÞh
ph¸t triÓn l©u ®êi nhÊt. Néi dung hÝnh ña thèng to¸n x©y dùng ¸ ph¬ng ph¸p thu
thËp, s¾p xÕp liÖu thèng (sè liÖu thèng ë ®©y ã thÓ nh÷ng ®Æ tÝnh ®Þnh
tÝnh hoÆ nh÷ng ®Æ tÝnh ®Þnh lîng). Th«ng qua viÖ ph¸t hiÖn, ph¶n ¸nh nh÷ng quy luËt
mÆt lîng ña ¸ hiÖn tîng, ¸ on thèng gióp ho viÖ kiÓm tra, ®¸nh gi¸ ¸ hiÖn
tîng nhiªn, ¸ vÊn ®Ò kinh òng nh ¸ vÊn ®Ò héi. ®ã ®a ra nh÷ng quyÕt ®Þnh,
b¸o ho¹h ®Þnh hiÕn lî ph¸t triÓn ña ¸ vËt, hiÖn tîng ®î nghiªn øu. PhÇn
thèng to¸n giíi thiÖu nh÷ng kiÕn thø ¬ b¶n nhÊt mét bµi to¸n quan träng trong
thèng bµi to¸n í lîng tham sè, bµi to¸n kiÓm ®Þnh gi¶ thuyÕt thèng bµi to¸n t¬ng
quan håi quy.
Ch¬ng 3
thuyÕt mÉu
Qu¸ tr×nh nghiªn øu thèng gåm ¸ giai ®o¹n: thu thËp liÖu, tæng hîp ph©n
tÝh, b¸o. Trong thu thËp liÖu thêng ¸p dng hai h×nh thø hñ yÕu: b¸o ¸o thèng
®Þnh ®iÒu tra thèng kª. Ch¬ng nµy nh»m giíi thiÖu mét vÊn ®Ò Çn quan t©m khi b¾t
®Çu lµm mét bµi to¸n thèng kª, ®ã giai ®o¹n thu thËp liÖu.
3.1 Tæng thÓ mÉu
3.1.1 Tæng thÓ kÝh thí ña tæng thÓ
§Þnh nghÜa 3.1.1.
Toµn tËp hîp ¸ phÇn ®ång nhÊt theo mét dÊu hiÖu nghiªn øu ®Þnh
tÝnh hoÆ ®Þnh lîng nµo ®ã ®î gäi
tæng thÓ nghiªn øu
(
population
) (hay tæng thÓ hoÆ
tËp hÝnh). lîng ¸ ¸ thÓ (hay ¸ phÇn tö) ña tæng thÓ ®î gäi
kÝh thí ña tæng
thÓ (size of population)
, thêng ®î hiÖu
N
.
Víi mçi tæng thÓ ta kh«ng nghiªn øu trù tiÕp tæng thÓ ®ã th«ng qua mét hay nhiÒu
dÊu hiÖu ®Æ trng ho tæng thÓ ®ã, ®î gäi
dÊu hiÖu nghiªn øu
. C¸ dÊu hiÖu nµy ã
thÓ ®Þnh tÝnh hoÆ ®Þnh lîng (ta òng ã thÓ gäi biÕn ®Þnh tÝnh hoÆ biÕn ®Þnh lîng).
Ch¼ng h¹n, ®Ó nghiªn øu hiÒu dµi b«ng lóa ña mét gièng lóa nµo ®ã th× dÊu hiÖu nghiªn
øu ë ®©y mang tÝnh ®Þnh lîng hÝnh hiÒu dµi b«ng; khi nghiªn øu mét lo¹i bÖnh míi
xuÊt hiÖn trªn gia Çm t¹i ®ång b»ng B¾ th× ®Æ tÝnh ta quan t©m ®Õn ë ®©y ®Æ tÝnh
mang tÝnh ®Þnh tÝnh, xt mçi ¸ thÓ gia Çm trong tæng thÓ th× ã hoÆ kh«ng ã lo¹i bÖnh
ta quan t©m.
3.1.2 MÉu ph¬ng ph¸p hän mÉu
§Þnh nghÜa 3.1.2.
Mét tËp hîp ¸ ¸ thÓ ®î lÊy ra tæng thÓ ®î gäi
mÉu (sample)
.
lîng ¸ thÓ trong mét mÉu gäi
kÝh thí mÉu (size of sample)
, thêng hiÖu
n
.
Chó ý r»ng kÝh thí ña mÉu thêng nhá h¬n rÊt nhiÒu so víi kÝh thí tæng thÓ.
tæng thÓ ®· ho ta ã thÓ lÊy ra nhiÒu mÉu kh¸ nhau víi ïng mét kÝh thí
n
. TËp hîp tÊt
71
72
¶ ¸ mÉu ã thÓ lÊy ra ®î tæng thÓ ®î gäi
kh«ng gian mÉu (sample spae).
Thay
nghiªn øu tÊt ¶ ¸ ¸ thÓ ã mÆt trong tæng thÓ ta huyÓn sang nghiªn øu mét phËn
ña tæng thÓ mÉu vËy mÉu ph¶i ®¹i diÖn mét ¸h kh¸h quan nhÊt ho tæng thÓ. Ta quan
t©m ®Õn ¸ ph¬ng ph¸p lÊy mÉu sau ®©y:
a) LÊy mÉu ngÉu nhiªn kh«ng hoµn l¹i:
§ã ph¬ng ph¸p lÊy mÉu b»ng ¸h ®¸nh ¸
¸ thÓ trong tæng thÓ
1
®Õn
N
. Rót ngÉu nhiªn lÇn lît
n
¸ thÓ ®a vµo mÉu theo mét trong
hai ¸h sau.
-
MÉu ngÉu nhiªn ®¬n gi¶n:
tæng thÓ kÝh thí
N
ngêi ta dïng ¸h rót th¨m ®¬n
gi¶n ra
n
phÇn ña mÉu theo mét b¶ng ngÉu nhiªn nµo ®ã. u ®iÓm ña ph¬ng ph¸p
nµy ho php thu ®î mét mÉu ã tÝnh ®¹i diÖn ao, ho php suy réng ¸ kÕt qu¶ ña
mÉu ho tæng thÓ víi mét sai x¸ ®Þnh. Nhî ®iÓm ña ph¬ng ph¸p nµy ph¶i ã ®î
toµn danh s¸h ña tæng thÓ nghiªn øu, mÆt kh¸ hi phÝ hän mÉu kh¸ lín.
-
MÉu ngÉu nhiªn thèng:
lo¹i mÉu ngÉu nhiªn ®· ®î ®¬n gi¶n ho¸ trong ¸h hän,
trong ®ã hØ ã phÇn ®Çu tiªn ®î hän mét ¸h ngÉu nhiªn, sau ®ã dùa trªn danh s¸h ®·
®î ®¸nh ña tæng thÓ ®Ó hän ra ¸ phÇn tiÕp theo vµo mÉu theo mét thñ t nµo ®ã.
Nhî ®iÓm ña ph¬ng ph¸p nµy m¾ sai thèng khi danh s¸h ña tæng thÓ kh«ng
®î s¾p xÕp mét ¸h ngÉu nhiªn l¹i theo mét trËt hñ quan nµo ®ã.
b) LÊy mÉu ngÉu nhiªn ã hoµn l¹i
: §¸nh ¸ ¸ thÓ trong tæng thÓ
1
®Õn
N
. Rót ngÉu
nhiªn tæng thÓ ra
1
¸ thÓ, ghi ®Æ tÝnh ña ¸ thÓ nµy råi tr¶ ¸ thÓ ®ã tæng thÓ, ®Æ tÝnh
võa ghi l¹i ®î oi phÇn ®Çu tiªn ña mÉu. ViÖ x¸ ®Þnh ¸ phÇn tiÕp theo ña mÉu
òng ®î lµm t¬ng nh trªn.
ph¬ng ph¸p lÊy mÉu ngÉu nhiªn ã hoµn l¹i ta thÊy x¸ suÊt ®Ó mçi ¸ thÓ ã mÆt trong
mÉu ®Òu
1/N
. Mçi ¸ thÓ ã thÓ ã mÆt nhiÒu lÇn trong mÉu. thÊy, víi kÝh thí
n
,
lîng ¸ mÉu trong trêng hîp lÊy mÉu kh«ng hoµn l¹i
An
N
, lîng ¸ mÉu trong trêng
hîp lÊy ã hoµn l¹i
An
N=Nn
. Khi
N
lín h¬n rÊt nhiÒu so víi
n
th×
An
NNn
, khi ®ã viÖ
lÊy mÉu hoµn l¹i kh«ng hoµn l¹i ho ta ¸ kÕt qu¶ sai lÖh kh«ng ®¸ng kÓ.
) LÊy mÉu theo ¸ líp
: Chia tæng thÓ ra lµm
k
líp. Råi mçi líp lÊy ngÉu nhiªn ra mét
¸ thÓ ®a vµo mÉu. NÕu lîng ¸ ¸ thÓ ë líp thø
i
Ni
th× ¸ thÓ ®î hän vµo
mÉu ña líp nµy
ni
nªn tháa m·n ®iÒu kiÖn
ni
nNi
N
.
d) LÊy mÉu theo hu
: Trong viÖ kiÓm tra hÊt lîng s¶n phÈm «ng nghiÖp ®î s¶n xuÊt
theo d©y huyÒn, viÖ lÊy mÉu ngÉu nhiªn gÆp khã kh¨n tèn km. Ph¬ng ph¸p lÊy mÉu
theo hu ra ã hiÖu qu¶ trong nÒn s¶n xuÊt «ng nghiÖp hiÖn ®¹i. sau mét hu
gåm
T
s¶n phÈm lÊy ra mét s¶n phÈm ®Ó ®a vµo mÉu. §Ó tr¸nh trïng lÆp ña hu s¶n
xuÊt ra ¸ s¶n phÈm tèt, xÊu ña d©y huyÒn víi hu lÊy mÉu, ta ã thÓ thay ®æi hu
T
trong ¸ ®ît lÊy mÉu kh¸ nhau víi m ®Ýh mÉu ph¶i ®¹i diÖn mét ¸h kh¸h quan nhÊt
ho tæng thÓ.
73
C¸ ph¬ng ph¸p lÊy mÉu trªn ¸ ph¬ng ph¸p phæ biÕn trong viÖ thu thËp ¸ liÖu.
ViÖ lÊy mÉu tèt, xÊu theo nghÜa ã kh¸h quan hay kh«ng ¶nh hëng rÊt lín ®Õn viÖ ®a ra
kÕt luËn ã hÝnh x¸ hay kh«ng ¸ ®Æ tÝnh ã mÆt trong tæng thÓ.
Chó ý 3.1.3.
kÕt qu¶ tËp mÉu ã ®î ta ã thÓ suy ra ¸ kÕt qu¶ ho tæng thÓ bëi vËy
bao giê òng ã thÓ m¾ ph¶i sai lÇm nhÊt ®Þnh. §é sai lÖh lín hay b ph thué vµo ph¬ng
ph¸p x©y dùng mÉu kÝh thí mÉu. §é hÝnh x¸ trong thèng thêng ®î gäi
®é
tin Ëy (degree of onfidene)
ña kÕt luËn, hiÖu
γ
. NÕu gäi
α
sai sãt
(hay mø ý
nghÜa) ña kÕt luËn th×
α= 1 γ
.
3.1.3 MÉu ngÉu nhiªn
Sau ®©y, mÉu ®î hiÓu mÉu ã lÆp l¹i ®î lÊy theo ph¬ng ph¸p ngÉu nhiªn ®¬n
gi¶n. Gi¶ ®Æ trng biÕn
X
ë mçi ¸ thÓ ë tæng thÓ mét biÕn ngÉu nhiªn, ßn ®î gäi
biÕn ngÉu nhiªn gè
, ã hµm ph©n phèi x¸ suÊt
F(x)
. Ta tiÕn hµnh mét php lÊy mÉu ngÉu
nhiªn ã kÝh thí
n
. Gäi
Xi
biÕn ngÉu nhiªn hØ gi¸ trÞ
X
ña ¸ thÓ thø
i
trong mÉu, ta
thÊy ¸
Xi
¸ biÕn ngÉu nhiªn ã ïng ph©n phèi x¸ suÊt víi
X
. Víi mçi mÉu  thÓ
Xi
ã gi¸ trÞ x¸ ®Þnh
xi
. Do viÖ lÊy mÉu ®é lËp nªn d·y
X1, X2,...,Xn
¸ biÕn ngÉu
nhiªn ®é lËp.
§Þnh nghÜa 3.1.4.
MÉu ngÉu nhiªn (random sample)
kÝh thí
n
tËp hîp ña
n
biÕn ngÉu
nhiªn ®é lËp
X1, X2,...,Xn
®î thµnh lËp biÕn ngÉu nhiªn
X
ã ïng quy luËt ph©n
phèi x¸ suÊt víi
X
, hiÖu
W= (X1, X2,...,Xn)
.
Gi¶
X1
nhËn gi¸ trÞ
x1
,
X2
nhËn gi¸ trÞ
x2
, ...,
Xn
nhËn gi¸ trÞ
xn
. TËp hîp
n
gi¸ trÞ
x1, x2, . . . , xn
t¹o thµnh mét gi¸ trÞ ña mÉu ngÉu nhiªn, hay ßn gäi mÉu  thÓ, hiÖu
w= (x1, x2,...,xn)
.
d 3.1.5.
Xt tæng thÓ tËp sinh viªn ViÖt Nam, biÕn ngÉu nhiªn gè
X
hiÒu ao ña
mçi sinh viªn. Xt mét mÉu ã kÝh thí
n= 10
, gäi
Xi
hiÒu ao ña sinh viªn thø
i
trong mÉu, khi ®ã
W= (X1, X2,...,X10)
mét mÉu ngÉu nhiªn. Thù hiÖn mét php thö ®èi
víi mÉu ngÉu nhiªn trªn, tø tiÕn hµnh ®o hiÒu ao ña
10
sinh viªn hän vµo mÉu ta thu
®î mÉu  thÓ
x1= 1,50; x2= 1,52; x3= 1,60; x4= 1,65; x5= 1,70; x6= 1,81; x7=
1,63; x8= 1,77; x9= 1,55, x10 = 1,58
(®¬n mt),
(1,50; 1,52; 1,60; 1,65; 1,70; 1,81; 1,63; 1,77; 1,55; 1,58)
mét mÉu  thÓ (hay mét thÓ hiÖn) ña mÉu ngÉu nhiªn
(X1, X2,...,X10)
.
Chó ý 3.1.6.
Víi ¸h x©y dùng mÉu ngÉu nhiªn nh trªn th× ¸ biÕn ngÉu nhiªn
X1, X2,...,Xn
ña mÉu kh«ng nh÷ng ã ïng d¹ng ph©n phèi x¸ suÊt víi biÕn ngÉu nhiªn gè
X
, tø ã
74
ïng hµm ph©n phèi x¸ suÊt
F(x)
¸ tham ®Æ trng ña hóng òng b»ng ¸ tham
®Æ trng ña
X
, tø lµ:
E(X1) = E(X2) = · · · =E(Xn) = E(X)
(3.1)
V(X1) = V(X2) = · · · =V(Xn) = V(X)
(3.2)
3.2 C¸ ph¬ng ph¸p mÉu ngÉu nhiªn
3.2.1 S¾p xÕp liÖu thù nghiÖm
§Ó khai th¸ ¸ th«ng tin høa ®ùng trong d·y liÖu nµy ta Çn s¾p xÕp liÖu
nh»m nhËn ra ¸ ®Æ trng ña d·y liÖu ®ã. Th«ng thêng ta s¾p xÕp liÖu theo thø
t¨ng dÇn. D·y liÖu nµy u ®iÓm h¬n d·y liÖu ban ®Çu, ta ã thÓ dµng nhËn biÕt gi¸ trÞ
nhá nhÊt gi¸ trÞ lín nhÊt ña ¸ liÖu mÉu, biÕt ®î biªn ®é dao ®éng ña ¸ liÖu
mÉu. Víi ¸h s¾p xÕp nµy ta dµng nhËn biÕt ¸ liÖu ã mÆt trong mÉu mét lÇn ¸
liÖu b»ng nhau ®î xÕp liÒn nhau. Mét ph¬ng ph¸p thêng ®î dïng ®Ó s¾p xÕp
liÖu nh sau.
a) Ph¬ng ph¸p liÖt kª.
LiÖt tÊt ¶ ¸ phÇn ña mÉu. Ch¼ng h¹n, víi mét mÉu ì
n
, ta
ã thÓ viÕt
x1= 2,5; x2= 2,6; ...,xn= 3,0
.
Nhî ®iÓm ña ¸h s¾p xÕp nµy kh«ng ®î mÉu ì lín, tÝnh to¸n phø t¹p,
kh«ng khoa hä.
b) Ph¬ng ph¸p dïng b¶ng tÇn b¶ng tÇn suÊt.
Gi¶ tæng thÓ ña biÕn ngÉu nhiªn
gè
X
rót ra mét mÉu ngÉu nhiªn kÝh thí
n
, trong ®ã gi¸ trÞ
x1
xuÊt hiÖn víi tÇn
n1
, gi¸
trÞ
x2
xuÊt hiÖn víi tÇn
n2,...,
gi¸ trÞ
xk
xuÊt hiÖn víi tÇn
nk
, ló ®ã sau khi ¸
xi
®·
®î s¾p xÕp theo tr×nh t¨ng dÇn gi¸ trÞ  thÓ ña mÉu, ta ã thÓ mÉu  thÓ b»ng
b¶ng ph©n phèi tÇn thù nghiÖm sau.
xix1x2
...
xi. . . xk
nin1n2
...
ni. . . nk
víi
n1+n2+...+nk=n
. Dßng trªn ghi ¸ gi¸ trÞ ã thÓ ã ña mÉu theo thø t¨ng dÇn,
dßng díi ghi tÇn t¬ng øng. TÇn mÉu ¸ thÓ ã ®Æ tÝnh
X=xi
trong mÉu. B¶ng
tÇn ho ta nhiÒu th«ng tin h¬n d·y liÖu ®î s¾p xÕp theo thø t¨ng dÇn. Ngoµi nh÷ng
th«ng tin ã ®î nh d·y liÖu s¾p xÕp theo thø t¨ng dÇn, qua b¶ng tÇn ta ã thÓ biÕt
®î liÖu nµo ã mÆt nhiÒu nhÊt, liÖu nµo ã mÆt Ýt nhÊt trong mÉu.
Gäi
fi=ni
n,(i= 1,...,k)
tÇn suÊt ña ¸ thÓ ã ®Æ tÝnh
xi
trong mÉu, ta ã b¶ng ph©n
phèi tÇn suÊt thù nghiÖm nh sau
xix1x2. . . xi. . . xk
fif1f2. . . fi. . . fk