
36
CHƯƠNG IV
ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Chương này sẽ giới thiệu các dạng ước lượng cụ thể đối với số trung bình
của một đặc trưng định lượng và xác suất của một đặc trưng định tính nào đó (tỷ lệ)
trong một quần thể (hay công thức); đề cập đến việc kiểm định (so sánh) hai số
trung bình của một đặc tính định lượng hay hai xác suất (hai tỷ lệ) của một đặc tính
định tính của quần thể.
A. ƯỚC LƯỢNG
1. ĐẶT VẤN ĐỀ
Như chúng ta đã biết, đối tượng nghiên cứu trong nông nghiệp khá phức tạp,
trong quá trình nghiên cứu không thể quan sát và đo đếm tất cả các cá thể có của
quần thể (công thức) với những lý do sau:
- Không có điều kiện về nhân lực và thời gian để theo dõi
- Phải bảo vệ đối tượng nghiên cứu.
Do đó phải tiến hành lấy mẫu ngẫu nhiên n cá thể mang tính đại diện để tiến
hành nghiên cứu (quan sát hay đo đếm). Từ kết quả quan sát của mẫu đưa ra kết
luận (đánh giá) cho toàn quần thể (công thức). Kết luận đưa ra được gọi là kết luận
thống kê. Nên từ quần thể quan sát đưa ra một kết luận (đánh giá) đối với độ lớn của
trung bình (hay xác suất) thì ta có một ước lượng.
Từ kết quả của mẫu suy ra kết quả của cả đám đông thì không tránh khỏi sai
số, chỉ có điều là khả năng và mức độ sai số là như thế nào? Nội dung của chương
này sẽ nghiên cứu sai số và khả năng hạn chế sai số đó khi tiến hành ước lượng để
đạt tới mong muốn cho phép mà thôi.
2. CÁC PHƯƠNG PHÁP ƯỚC LƯỢNG
2.1. Ước lượng điểm
Ước lượng điểm của một tham số thống kê nào đó là dạng ước lượng mà từ
kết quả quan sát của một mẫu lấy ngẫu nhiên mang tính đại diện của tổng thể, đưa
ra một con số và cho rằng con số đó là giá trị gần đúng tốt nhất cho tham số muốn
biết.
Thí d ụ: Biến ngẫu nhiên X (định lượng hoặc định tính) có phân phối xác suất phụ
thuộc vào một tham số
chưa biết. Từ biến ngẫu nhiên này lấy một ngẫu nhiên n
quan sát.
Gọi xi là quan sát thứ i, còn xi là giá trị cụ thể của Xi. Trong mẫu quan sát
hàm f(X1, X2,...Xn) được dùng để ước lượng
. Vấn đề đặt ra là chọn hàm nào?
Ký hiệu Qn = f (x1, x2,...xn) là hàm ước lượng của
. Qn là một biến ngẫu
nhiên có giá trị cụ thể q = f (x1, x2,...xn). Vậy q là ước lượng điểm của
.

37
q
(4.1)
Có thể tính được độ lệch chuẩn của Qn và ước lượng điểm lúc này sẽ là:
n
QDq
(4.2)
Trong đó
n
QD là độ lệch chuẩn của Qn.
Thí dụ: Tổng thể có phân phối chuẩn
2
,
là trung bình (kỳ vọng) chưa
biết cần ước lượng. Lấy n quan sát x1, x2, xi,...xn. . Tính
n
x
xi
và n
s
sx như
vậy có thể đưa ra được ước điểm của kỳ vọng
.
x
hoặc n
s
x
(4.3)
2.2. Ước lượng khoảng
Ước lượng khoảng của một tham số thống kê nào đó là từ kết quả quan sát
của mẫu đưa ra được giá trị tương ứng với một độ tin cậy nhất định. Mọi giá trị nằm
trong khoảng đó đều được coi là giá trị gần đúng tốt nhất của tham số.
Giả sử
là tham số cần ước lượng. Nếu có q1 là giới hạn dưới và q2 là giới
hạn trên,
là xác suất để mắc sai lầm thì ước lượng khoảng của
được viết như
sau:
PqqP
1
21 (4.4)
Trong đó:
[q1 ; q2] là khoảng tin cậy của tham số
P : Gọi là độ tin cậy (thường lấy với xác suất lớn 0,95; 0,99 và 0,999).
1
- P (thường lấy xác suất nhỏ 0,05; 0,01 và 0,001).
3. ƯỚC LƯỢNG GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ (KHI CÁC ĐẶC
TRƯNG NGHIÊN CỨU CÓ PHÂN PHỐI CHUẨN)
Do chỉ quan sát được n cá thể trong mẫu mà lại mong muốn đánh giá được
của toàn công thức (cần biết trung bình của công thức hay còn gọi là kỳ vọng). Cho
nên có thể xem xét cụ thể như sau:
3.1. Ước lượng trị số trung bình của tổng thể khi dung lượng mẫu n
30n
Giả sử X có phân phối chuẩn N
2
,
, trong thực tế thì hầu như chúng ta
không biết phương sai 2
mà chỉ tính được phương sai thống kê của mẫu s2. Vì
vậy, khi dung lượng mẫu đủ lớn thì có thể coi 22 s
. Theo tính chất của phân phối
chuẩn chúng ta có:

38
n
s
sx hay n
s2
Vì vậy, khi phân phối của
x
là tiệm cận với phân phối chuẩn thì kỳ vọng hay
trung bình tổng thể
sẽ được xác định qua ước lượng điểm hoặc ước khoảng như
sau:
Ước lượng điểm x
sx
và
x
Ước lượng khoảng
1
xx suxsuxP (4.5)
u là giá trị tra ở bảng 2 (phụ lục)
Nếu lấy độ tin cậy P là 0,95 thì 96,1
u; P = 0,99 thì 58,2
u và P = 0,999
thì 29,3
u.
Tương tự sẽ suy ra khoảng tin cậy cụ thể như sau:
95,005,0196,196,1 xx sxsxP
99,001,0158,258,2 xx sxsxP
999,0001,0129,3,29,3 xx sxsxP
Thí dụ: Điều tra năng suất cá thể của một số giống cà chua xuân hè (kg/cây)với
mẫu n = 50. Từ đó có năng suất cá thể trung bình
48
,
1
x
kg; độ lệch chuẩn của
năng suất là 0,35 kg/cây. Hãy đưa ra ước lượng cho năng suất cá thể của cà chua
điều tra nêu trên.
Trước hết ta đưa ra ước lượng điểm có năng suất như sau
05,048,1
50
35,0
48,1
kg/cây.
Ước lượng khoảng ở độ tin cậy P = 0,95 gọi tắt là khoảng tin cậy sẽ là
95,005,01
50
35,0
96,148,1
50
35,0
96,148,1
P
95,005,0110,048,110,048,1
P
Điều này có nghĩa với độ tin cậy 95%, năng suất cá thể của cà chua từ 1,38
đến 1,58 kg/cây.
Nếu như
01
,
0
thì khoảng tin cậy được xác định là:
01,01
50
35,0
58,248,1
50
35,0
58,248,1
P
P
01,0113,048,113,048,1

39
01,0161,135,1
P
Năng suất từ 1,35 đến 1,61 kg/cây với độ tin cậy 99%
3.2. Ước lượng số trung bình quần thể khi dung lượng mẫu n < 30
Lúc này không thể coi phương sai chưa biết 2
là s2 được do đó phải dùng
đến phân phối t (Student). Khoảng tin cậy của trị số trung bình có dạng như sau
P
1
),(),( xdfxdf stxstx (4.6)
Ở đây giá trị ),( df
t
với df = n - 1 tra ở bảng phân phối t (bảng 4 phụ lục)
Thí dụ: Theo dõi năng suất của bắp cải trong thí nghiệm vụ đông xuân tại Đông
Anh Hà Nội, dung lượng mẫu điều tra n = 25, năng suất bình quân
5
,
175
x
tạ/ha
với độ lệch chuẩn s = 20,5 tạ/ha. Hãy đưa ra khoảng tin cậy 95% cho năng suất bắp
cải vụ đông tại điểm nghiên cứu ở Đông Anh Hà Nội.
Trước hết ta tra bảng t ở mức
05
,
0
với số bậc tự do
df = n - 1 và df = 25 - 1 = 24. Như vậy, giá trị )24,05,0( df
t= 2,06
Khoảng sẽ được xác định như sau
P 95,005,01
25
5,20
06,25,175
25
5,20
06,25,175
P
05,019,1831,167
Hay viết gọn lại P (
4
,
8
5
,
175
) tạ/ha với mức ý nghĩa
05
,
0
4. XÁC ĐỊNH DUNG LƯỢNG MẪU KHI ƯỚC LƯỢNG
Như đã biết khoảng tin cậy với trung bình của quần thể phụ thuộc vào độ tin
cậy và dung lượng mẫu. Khi dung lượng mẫu lớn khoảng tin cậy trung bình có dạng
X
(4.7)
Như vậy
là sai số ước lượng và chúng ta muốn
với
càng nhỏ càng
tốt để khoảng tin cậy hẹp.
n
su
)(
hoặc n
st df
,
Như vậy 2
22
)(
su
n
hoặc 2
22
),(
st
ndf
(khi dung lượng mẫu nhỏ)
Khi
05
,
0
thì 96,1
)05,0( u và có thể lấy
2
Còn giá trị 96,1
),05,0(
df
t phụ thuộc vào độ tự do có thể tra trong bảng 4 phần
phụ lục.

40
Vậy 2
2
4
s
nct (4.8)
Ở đây
có giá trị chứa đơn vị đo như các quan sát xi hoặc
x
. Ta còn có thể
tính được độ lớn n cần thiết khi cho trước một sai số ước lượng %
qua công thức
sau
22
2
22
2
%)()(
000.40
10000
%)()(
4
x
s
x
s
nct (4.9)
Thí dụ: Quan sát 10 cành cà phê chè Catimor trồng 2 năm. Đếm số quả trên cành có
trung bình 121
x quả/cành. Độ lệch chuẩn s = 25 quả/cành. Để số quả bình quân
của vườn cà phê mong muốn
)
10
121
(
quả/cành ( 10
quả/cành) thì dung
lượng n = 10 như đã lấy thử đủ đảm bảo sai số đưa ra hay chưa với độ tin cậy 95%.
n cần thiết cho 10
tính như sau
Do
là giá trị số lượng nên cành 25
10
4625
10
254
2
2
ct
n cành
Vậy để cho sai số của số quả/cành là 10 quả/cành thì dung lượng n = 10 như
đã lấy thử là chưa đủ lớn mà phải lấy thêm ít nhất 15 cành nữa để tổng số cành quan
sát 25
n.
Nếu lại đưa ra %
mong muốn là 5% thì
3,68
5)121(
)25(000.40
2
2
ct
n hay 68
cành hoặc 69 cành
Như vậy, n = 10 còn quá nhỏ so với mong muốn để sai số ước lượng %5
.
Phải lấy thêm 59 cành nữa mới đủ chấp nhận sai số ước lượng nêu trên.
5. ƯỚC LƯỢNG XÁC SUẤT CỦA TỔNG THỂ ( ƯỚC LƯỢNG TỶ LỆ)
Trong thực nghiệm sinh học, rất nhiều trường hợp phải nghiên cứu các xác
suất hay tỷ lệ, như tỷ lệ sống của cây con sau khi đem từ vườn ươm trồng ra lô sản
xuất, tỷ lệ bệnh, hoặc tỷ lệ mọc mầm của hạt...
Thí dụ: Trong một quần thể có N cá thể (N rất lớn) và giả sử có M cá thể có
đặc tính A. Như vậy, xác suất của A là p = M/N (đây là theo lý thuyết). Song ta
không thể có điều kiện để tính p trực tiếp. Vì vậy, phải lấy một mẫu ngẫu nhiên từ
quần thể ấy. Trong n phần tử của mẫu đếm được m phần tử có đặc tính A. Vậy tần
suất của đặc tính A trong mẫu sẽ là f = m/n.
Để ước lượng xác suất p của các cá thể có đặc tính A cần phải xem xét các
điều kiện cụ thể sau:
5.1. Khi sự kiện A có xác suất không gần 0 và 1
5.1.1. Khi dung lượng n đủ lớn (n > 100)

