36
CHƯƠNG IV
ƯỚC NG VÀ KIỂM ĐNH GI THUYẾT THNG KÊ
Chương này s giới thiệu các dạng ước lượng c thể đi với s trung bình
ca một đặc trưng đnh lượng và xác suất của một đc trưng định tính nào đó (tỷ l)
trong mt quần th (hay ng thức); đ cp đến việc kim định (so sánh) hai s
trung bình ca một đặc tính đnh lượng hay hai c sut (hai t l) của một đc nh
địnhnh ca qun th.
A. ƯỚC LƯỢNG
1. ĐẶT VẤN ĐỀ
Như chúng ta đã biết, đi tượng nghiên cứu trong nông nghiệp khá phức tp,
trong quá tnh nghiên cu không th quan sát và đo đếm tất c các cá th có ca
qun thể (công thức) với những lý do sau:
- Không điu kin v nhân lực và thời gian đ theo dõi
- Phi bảo v đối tượng nghiên cứu.
Do đó phi tiến hành ly mẫu ngu nhiên n cá thmang tính đi diện đ tiến
hành nghn cu (quan sát hay đo đếm). T kết qu quan sát của mu đưa ra kết
luận (đánh giá) cho toàn qun thể (công thức). Kết lun đưa ra được gi là kết lun
thống kê. n t qun th quan sát đưa ra một kết lunánh giá) đi với đ lớn của
trung bình (hay xác suất) thì ta có mt ước lượng.
Tkết qu ca mu suy ra kết qu ca c đám đông thì không tnh khỏi sai
s, ch có điu là kh năng và mức đ sai s là như thế nào? Nội dung ca chương
này s nghiên cu sai s và khnăng hn chế sai s đó khi tiến hành ước lượng đ
đt tới mong muốn cho phép mà thôi.
2. CÁC PƠNG PHÁP ƯỚC LƯỢNG
2.1. Ước lượng đim
Ước lượng điểm ca một tham s thng nào đó là dng ước lượng mà t
kết ququan sát của một mu ly ngu nhiên mang nh đi diện ca tổng thể, đưa
ra mt con s và cho rng con s đó là giá trgần đúng tt nhất cho tham s mun
biết.
Td : Biến ngu nhn X nh lượng hoc đnh tính) có phân phi xác sut ph
thuc vào mt tham s
ca biết. Tbiến ngu nhiên này ly một ngẫu nhiên n
quant.
Gọi xi quan sát thi, còn xi là giá trcth ca Xi. Trong mu quan sát
hàm f(X1, X2,...Xn) được dùng để ước lượng
. Vấn đ đặt ra là chn hàm o?
hiu Qn = f (x1, x2,...xn) là hàm ước lượng ca
. Qn là mt biến ngu
nhn giá trị c th q = f (x1, x2,...xn). Vy q ướcợng điểm ca
.
37
q
(4.1)
Có thể tính được đ lệch chuẩn của Qn và ước lượng điểm lúc này s là:
n
QDq
(4.2)
Trong đó
n
QD độ lệch chun ca Qn.
Thí dụ: Tng th có phân phi chun
2
,
là trung bình (kvng) chưa
biết cn ước lượng. Ly n quan sát x1, x2, xi,...xn. . Tính
n
x
xi
và n
s
sx như
vy th đưa ra được ước điểm ca kỳ vng
.
x
hoặc n
s
x
(4.3)
2.2. Ước lượng khong
Ước lượng khong ca một tham s thng nào đó là tkết qu quan sát
ca mu đưa ra được giá trị tương ứng với một đ tin cậy nht định. Mọi giá trị nm
trong khong đó đều được coi là giá tr gn đúng tốt nhất ca tham s.
Gi s
là tham s cn ước lượng. Nếu có q1 giới hn dưới và q2 giới
hn trên,
là xác suất đ mắc sai lm thì ước lượng khong ca
được viết như
sau:
PqqP
1
21 (4.4)
Trong đó:
[q1 ; q2] là khoảng tin cy ca tham s
P : Gi độ tin cậy (thường lấy với c sut lớn 0,95; 0,99 và 0,999).
1
- P (thưng lấy xác sut nh 0,05; 0,01 0,001).
3. ƯỚC LƯỢNG GIÁ TR TRUNG BÌNH CA TỔNG TH(KHI CÁC ĐẶC
TRƯNG NGHIÊN CỨU PHÂN PHỐI CHUẨN)
Do chquan sát được n cá thể trong mẫu mà lại mong mun đánh giá được
ca toàn công thức (cn biết trung bình ca công thức hay còn gi là k vng). Cho
nên th xem xét c th như sau:
3.1. Ước lượng tr số trung bình ca tổng th khi dung lượng mẫu n
30n
Gi sX có phân phi chun N
2
,
, trong thc tế thì hu như chúng ta
không biết phương sai 2
mà chnh được pơng sai thng kê ca mu s2. Vì
vy, khi dung lượng mu đ lớn thì thể coi 22 s
. Theonh cht của phân phi
chun chúng ta:
38
n
s
sx hay n
s2
Vì vy, khi phân phi ca
x
tim cn với phân phi chun thì k vọng hay
trung bình tng thể
s được c đnh qua ước lượng điểm hoặc ước khong n
sau:
Ước lượng đim x
sx
và
x
Ước lượng khong
1
xx suxsuxP (4.5)
u giá trị tra bảng 2 (phụ lục)
Nếu lấy đ tin cy P là 0,95 thì 96,1
u; P = 0,99 thì 58,2
u và P = 0,999
thì 29,3
u.
Tương tự sẽ suy ra khong tin cy cụ thể như sau:
95,005,0196,196,1 xx sxsxP
99,001,0158,258,2 xx sxsxP
999,0001,0129,3,29,3 xx sxsxP
T dụ: Điều tra năng sut cá th ca một s giống cà chua xuân hè (kg/cây)với
mẫu n = 50. T đó có năng sut thể trung bình
48
,
1
x
kg; đ lch chun của
năng sut là 0,35 kg/cây. Hãy đưa ra ước lượng cho năng sut cá thể của cà chua
điều tra nêu trên.
Trước hết ta đưa ra ước lượng điểm có năng sut như sau
05,048,1
50
35,0
48,1
kg/cây.
Ước lượng khong đ tin cy P = 0,95 gi tt là khong tin cy sẽ là
95,005,01
50
35,0
96,148,1
50
35,0
96,148,1
P
95,005,0110,048,110,048,1
P
Điều này có nghĩa với đ tin cy 95%, năng sut cá thể ca cà chua t 1,38
đến 1,58 kg/cây.
Nếu như
01
,
0
thì khong tin cy được xác định là:
01,01
50
35,0
58,248,1
50
35,0
58,248,1
P
P
01,0113,048,113,048,1
39
01,0161,135,1
P
Năng sut từ 1,35 đến 1,61 kg/cây với đ tin cy 99%
3.2. Ước lượng số trung bình quần th khi dung lượng mẫu n < 30
Lúc này không th coi pơng sai chưa biết 2
là s2 được do đó phi dùng
đến phân phi t (Student). Khong tin cậy của trị s trung bình dạng như sau
P
1
),(),( xdfxdf stxstx (4.6)
đây giá tr ),( df
t
với df = n - 1 tra bng phân phi t (bng 4 phlục)
T dụ: Theo dõi năng sut ca bp ci trong thí nghiệm vụ đông xuân ti Đông
Anh Hà Ni, dung lượng mu điu tra n = 25, năng suất bình quân
5
,
175
x
tạ/ha
với đ lch chun s = 20,5 tạ/ha. Hãy đưa ra khong tin cy 95% cho năng sut bắp
ci vụ đông ti đim nghiên cứuĐông Anh Hà Ni.
Trước hết ta tra bảng t ở mức
05
,
0
với số bc tự do
df = n - 1 và df = 25 - 1 = 24. Như vy, giá trị )24,05,0( df
t= 2,06
Khong sẽ được xác định như sau
P 95,005,01
25
5,20
06,25,175
25
5,20
06,25,175
P
05,019,1831,167
Hay viết gn lại P (
4
,
8
5
,
175
) t/ha với mức ý nghĩa
05
,
0
4. XÁC ĐỊNH DUNG NG MẪU KHI ƯỚC NG
Như đã biết khoảng tin cy với trung bình ca qun thể phthuộc o đ tin
cy dung ợng mẫu. Khi dung lượng mẫu ln khong tin cy trung bình có dng
X
(4.7)
Như vy
là sai s ước lượng và chúng ta mun
với
càng nh càng
tt đ khoảng tin cy hp.
n
su
)(
hoặc n
st df
,
Như vậy 2
22
)(
su
n
hoc 2
22
),(
st
ndf
(khi dung lượng mẫu nhỏ)
Khi
05
,
0
thì 96,1
)05,0( u có thể lấy
2
Còn giá tr 96,1
),05,0(
df
t phthuc vào đ tdo có th tra trong bảng 4 phn
ph lục.
40
Vậy 2
2
4
s
nct (4.8)
đây
có giá trchứa đơn v đo như các quan sát xi hoc
x
. Ta còn có th
nh được đ lớn n cn thiết khi cho trước một sai s ước lượng %
qua công thức
sau
22
2
22
2
%)()(
000.40
10000
%)()(
4
x
s
x
s
nct (4.9)
Thí d: Quant 10nh cà phê chè Catimor trng 2 năm. Đếm s quả trên cành có
trung bình 121
x qu/cành. Độ lch chun s = 25 quả/cành. Để s qu bình quân
ca vườn cà p mong mun
)
10
121
(
qu/cành ( 10
qu/cành) thì dung
lượng n = 10 như đã ly thử đ đảm bo sai s đưa ra hay ca với độ tin cy 95%.
n cn thiết cho 10
tính như sau
Do
giá trị s lượng nên cành 25
10
4625
10
254
2
2
ct
nnh
Vậy đ cho sai s ca s qu/cành 10 qu/cành thì dung lượng n = 10 như
đã ly thử chưa đủ ln mà phải ly thêm ít nhất 15 cành na để tổng s cành quan
sát 25
n.
Nếu li đưa ra %
mong mun là 5% t
3,68
5)121(
)25(000.40
2
2
ct
n hay 68
cành hoặc 69 cành
Như vậy, n = 10 còn quá nhỏ so với mong mun đ sai s ước lượng %5
.
Phi ly thêm 59 cành nữa mới đ chp nhận sai số ướcợng nêu trên.
5. ƯỚC LƯNG XÁC SUẤT CỦA TỔNG TH( ƯỚCỢNG TỶ LỆ)
Trong thc nghiệm sinh học, rất nhiu trường hợp phi nghiên cứu các c
sut hay t l, như tlệ sng ca cây con sau khi đem từ ờn ươm trng ra lô sn
xut, tỷ lệ bệnh, hoc t lệ mọc mm của ht...
Tdụ: Trong mt quần th có N cá th (N rt lớn) và giscó M cá thể có
đc nh A. N vy, xác sut ca A là p = M/N (đây là theo lý thuyết). Song ta
không th có điu kiện đ tính p trực tiếp. Vì vậy, phi ly một mẫu ngu nhiên t
qun th y. Trong n phn tca mẫu đếm được m phn tử có đc tính A. Vy tần
sut ca đcnh A trong mẫu s là f = m/n.
Để ước lượng xác sut p ca các cá th có đặc tính A cn phi xem xét các
điều kiện cth sau:
5.1. Khi skin A có xác sut không gn 0 và 1
5.1.1. Khi dung lượng n đ lớn (n > 100)