Bài 5: Cơ s lý thuyết mu
103
BÀI 5: CƠ S LÝ THUYT MU
Các kiến thc cn có
Mc tiêu
Gii thiu mt s khái nim cơ
bn ca Thng kê toán hc, c
th là nhng vn đề liên quan
đến cp phm trù tng th
mu, đến các khái nim thng
kê, thng kê ca đặc trưng mu
và phân phi xác sut ca thng
đặc trưng mu, xem xét c th
các khái nim đó trong mt s
trường hp đặc bit nhưng
thường gp trong thc hành.
Thi lượng
8 tiết
Khái nim phương pháp mu
Tng th nghiên cu
Định nghĩa
Mô t tng th
Các s đặc trưng ca tng th
Mu ngu nhiên
Các phương pháp ly mu
Định nghĩa mu ngu nhiên
Mô t mu ngu nhiên
Thng kê (Statistics)
Định nghĩa
Các thng kê đặc trưng mu
Mu ngu nhiên hai chiu
Khái nim
Phương pháp mô t mu
Thng kê đặc trưng mu hai chiu
Quy lut phân phi xác sut ca mt s thng kê
Trường hp biến ngu nhiên gc có phân phi 01
Trường hp hai biến ngu nhiên gc có phân phi 01
Trường hp biến ngu nhiên gc có phân phi chun
Trường hp hai biến ngu nhiên gc có phân phi chun
Bài 5: Cơ s lý thuyết mu
104
TÌNH HUNG KHI ĐỘNG BÀI
Tình hung
Điu tra mc thu nhp cá nhân trong mt tháng (triu đồng) huyn Đông Anh, ta có bng s liu
mu sau:
Thu nhp 1-2 2-3 3-4 4-5 5-6 6-7
s người 10 8 5 7 3 2
Cn phi tính thu nhp bình quân đầu người và độ chênh lch thu nhp để xác định mc sng
ca người dân và mc độ đồng đều v thu nhp trong vùng.
Câu hi
1. Thu nhp bình quân đầu người là bao nhiêu?
2. Độ chênh lch thu nhp là bao nhiêu?
3. Độ chênh lch bình quân hiu chnh?
Bài 5: Cơ s lý thuyết mu
105
5.1. Khái nim phương pháp mu
Bài toán:
Chúng ta cn nghiên cu tính cht định tính hoc
định lượng ca các phn t trong mt tp hp nào đó.
Khi đó ta có hai phương pháp thc hin nghiên cu
Nghiên cu toàn b các phn t ca tp hp và
ghi li các đặc tính cn quan tâm. Khi thc
hin nghiên cu toàn b ta gp phi nhng hn
chế sau:
o Phi tr chi phí ln v kinh tế và thi gian do
s lượng các phn t trong tp toàn b quá ln.
o Có th dn ti phá hu toàn b tp hp cn nghiên cu. Ví d nghiên cu thi
gian hot động ca các thiết b đin t. Khi áp dng phương pháp này s dn
ti phá hu toàn b các thiết b đin t.
o Có nhng tp hp mà ta không th nghiên cu được toàn b. Ví d như trong
lĩnh vc kho c hc.
Vy ta thy trong đa s các trường hp nghiên cu toàn b tp hp là không kh thi.
Nghiên cu b phn, t tp hp nghiên cu ta ly ra mt tp con và nghiên cu
toàn b các phn t trong tp con đó và t đó đưa ra kết lun cho các phn t trong
tp hp nghiên cu.
Phương pháp nghiên cu th hai gi là phương pháp nghiên cu mu.
5.2. Tng th nghiên cu
5.2.1. Định nghĩa
Tng th (population) là tp hp các phn t cn
nghiên cu tính cht định tính hoc định lượng, s
phn t trong tng th gi là c ca tng th, ký
hiu là N.
Ví d:
Thu nhp ca toàn b dân cư ca mt nước.
Cht lượng sn phm ca mt nhà máy.
Nhu cu tiêu dùng đin ca các h gia đình.
Khi nghiên cu tng th thì các phn t có th hai loi tính cht định tính hoc định
lượng cn quan tâm, do đó ta có hai loi biến:
Biến định lượng là các s đo ca phn t;
Ví d: Cân nng, chiu cao, tui, thu nhp,…
Biến định tính là tính cht nào đó ca đối tượng nghiên cu.
Ví d: Gii tính, cht lượng, dân tc, tôn giáo,…
Đối vi các biến ta có các cách mã hoá như sau:
K thut mã hoá
Bài 5: Cơ s lý thuyết mu
106
o Mã hoá biến định lượng: Ta ly giá tr ca biến định lượng làm mã ca biến
o Mã hoá biến định tính: Ta gán tính cht định tính ca biến ng vi các
s nguyên.
Ví d:
Đối tượng là thu nhp ca h gia đình ta có các mc: Nghèo, trung bình, giàu.
Ta mã hoá các biến như sau:
Nghèo Æ -1; Trung bình Æ 0; Giàu Æ 1
Vy khi nghiên cu tng th ta luôn có th gi s là các các phn t ca tng th
du hiu định lượng.
5.2.2. Mô t tng th
Cho tng th vi các phn t {x1, x2,… xN}, ta có th thu gn bng cách gp các giá tr
ging nhau li và biu din như dng.
xi x1 x2.……………xk
Ni N1 N2. …………. Nk
trong đó Ni (i = 1,...,k) là s ln giá tr xi xut hin trong tng th, ta có
N1 + N2 +…+ Nk = N
Đặt i
1
N
fN
= (i = 1,…,k), fi được gi là tn sut ca xi trong tng th và ta có bng tn sut.
xi x1 x2 …………xk
fi f2 f2………….fk
Hin nhiên ta có: f1+ f2 +… + fk = 1
Bng tn sut ging như mt bng phân phi xác sut ca biến ngu nhiên, do đó ta có
th đồng nht tng th nghiên cu vi mt biến ngu nhiên X nào đó vi hàm phân
phi F. Vy, thay vì nghiên cu tng th thì ta quy v nghiên cu biến ngu nhiên X .
5.2.3. Các s đặc trưng ca tng th
Trung bình tng th
Trung bình tng thđại lượng ký hiu là m được
xác định bi:
NN
ii ii
i1 i1
1
mNxfx
N==
==
∑∑
Ta thy m có th xem là k vng ca biến ngu
nhiên X.
Phương sai tng th
Phương sai tng thđại lượng ký hiu là s được xác định bi:
NN
222
iii
i1 i1
1
s(xm)fx(m).
N==
=−=
∑∑
Ta thy s có th xem là phương sai ca biến ngu nhiên X .
Bài 5: Cơ s lý thuyết mu
107
5.3. Mu ngu nhiên
Trong phn trước ta đã biết rng không th nghiên cu cn k tng phn t ca tng
th, do đó ta phi nghiên cu hn chế trên mt nhóm nh được rút ra t tng th gi là
mu và t đó rút ra kết lun cho tng th, do vy ta mong mun mu đại din tt nht
cho tng th. Nói chung, đểđược mt mu đại din tt nht cho tng th người ta
thường phi tiến hành xây dng mu theo mt quy trình chn ngu nhiên các phn t
ca mu. Mt mu như vy được gi là mu ngu nhiên (random sample).
5.3.1. Các phương pháp ly mu
Có rt nhiu phương pháp chn mu ngu nhiên để
tho mãn tính đại din tt nht cho tng th và phù
hp vi mc tiêu nghiên cu. Sau đây ta ch nghiên cu
nhng phương pháp ch yếu.
Cách chn mu ngu nhiên đơn gin
o Chn mu ngu nhiên có hoàn li: T tng
th ta rút ngu nhiên mt phn t và ghi li
các đặc trưng cn quan tâm, sau đó tr li
phn t đó v tng th và làm tương t các
ln tiếp theo cho ti khi ta được mt mu c n.
o Chn mu ngu nhiên không hoàn li: Làm
tương t như trên, ch khác là sau mi ln rút
các phn t ta loi phn t đó ra khi tng th.
Chn mu phân cp
nhng tng th ln có th có nhng yêu cu phi chn mt mu phân cp chng
hn như điu tra phân tích mc sng ca dân cư trong nước thường có nhng yêu
cu kết lun cho các vùng, các min.
o Mu phân cp đơn gin có th được thành lp như sau: Chia tng th ra thành k
tng th b phn và ta thc hin cách ly mu ngu nhiên đơn gin trên mi
tng th thành phn ri tng hp li để có mu ca toàn b tng th.
Ta cũng có th tiến hành ly mu phân cp theo nhng quy trình phc tp hơn. Chng
hn như sau khi chia tng th ra thành k tng th b phn, ta chn ngu nhiên trong s
k tng th b phn đó ra m tng th ri tiếp tc thc hin ly mu ngu nhiên trên
tng tng th được chn để tng hp thành mu ca toàn b tng th.
5.3.2. Định nghĩa mu ngu nhiên
Mt mu ngu nhiên c n ca biến ngu nhiên X
mt b n các biến ngu nhiên X1, X2, ….Xn độc lp
và có cùng phân phi vi biến ngu nhiên X ,
trong đó mi Xk mt quan sát v biến ngu
nhiên X.
Ta ký hiu xk là kết qu quan sát được ln th k,
tc là quan sát Xk nhn giá tr xk (k = 1,2,…, n). Khi đó b giá tr (x1, x2, …,xn) gi là giá
tr c th ca mu ngu nhiên (X1, X2, …,Xn).