Chương 4
Ước ợng tham số
Ước lượng tham số một trong những bài toán bản của thống kê toán học. Khi
nghiên cứu một dấu hiệu đặc trưng dưới dạng các đặc tính định lượng (chẳng hạn
như chiều cao, cân nặng, độ dài, . . . ) của tổng thể thông qua biến ngẫu nhiên X,
nếu xác định được quy luật phân phối xác suất của Xthì việc đưa ra các đánh giá
cũng như các dự báo v sự biến động của tổng thể liên quan đến đặc tính y sẽ
chính xác và khách quan. Tuy nhiên không phải lúc nào chúng ta cũng xác định
được quy luật phân phối xác suất của X. Trong một số trường hợp, bằng phương
pháp phân tích thuyết ta thể biết được dạng toán học của hàm phân phối
hoặc hàm mật độ của X. Tuy nhiên, các tham số đặc trưng của như kỳ vọng,
phương sai, hoặc t lệ . . . (gọi chung tham số θ) lại chưa biết nên ta cần phải xác
định θ. Việc tính chính xác θ khó thể thực hiện được ta chỉ thể tính gần
đúng. Việc tính gần đúng tham số đặc trưng θthông qua mẫu cụ thể đã gọi
ước lượng tham số (estimate for parameters).
Chương y sẽ trình y bài toán ước lượng tham số cho kỳ vọng toán và tỷ lệ.
Mục 4.1 sẽ giới thiệu phương pháp ước lượng điểm làm sở quan trọng cho việc
giải quyết bài toán ước lượng bằng khoảng tin cậy được trình bày trong Mục 4.2.
Nội dung của chương được tham khảo ch yếu từ các tài liệu [2], [6]-[8], [10] và [12].
4.1. Phương pháp ưc ợng điểm
Bài toán. Xét biến ngẫu nhiên Xcủa một tổng thể ta đã biết quy luật phân
phối xác suất nhưng chưa biết tham số đặc trưng θcủa X. Hãy ước lượng θvới độ
tin cậy cho trước 1α.
Phương pháp chung. Từ tổng thể cần nghiên cứu rút ra một mẫu ngẫu nhiên
kích thước nvà dựa vào mẫu đó y dựng một thống kê G dùng để ước lượng θ.
Phương pháp ước lượng điểm (point estimation) ch trương dùng một giá trị để
thay thế cho tham số θchưa biết v tổng thể, bản thân θ một số xác định.
Thông thường giá trị được chọn một thống kê Gnào đó của mẫu ngẫu nhiên.
nhiều cách chọn thống kê Gkhác nhau tạo nên những phương pháp ước lượng điểm
khác nhau.
97
98 Chương 4: Ước ng tham số
Giả sử cần ước lượng tham số θcủa biến ngẫu nhiên X. Đối với phương pháp
ước lượng điểm ta thể tiến hành theo các bước như sau:
Bước 1. Từ tổng thể lập mẫu ngẫu nhiên kích thước n:W= (X1,X2, . . . ,Xn).
Bước 2. Lập thống kê G=f(X1,X2, . . . ,Xn)được gọi hàm ước lượng của
θ. Thông thường chọn thống kê mẫu tương ứng với tham số θcần ước lượng,
chẳng hạn, để ước lượng vọng toán E(X)của biến ngẫu nhiên Xthì người
ta thường chọn thống kê trung bình mẫu X, để ước lượng phương sai V(X),
chọn thống kê phương sai điều chỉnh mẫu S2.
Bước 3. Xác định mẫu cụ thể và tính được giá trị g=f(x1,x2, . . . , xn)của
thống kê Gtrên mẫu cụ thể đó. Từ đó suy ra ước lượng của θ giá trị gvừa
tính được.
Chất lượng của ước lượng không thể đánh giá qua một giá trị cụ thể của G
như vậy chỉ cách so sánh trực tiếp gvà θ θlại chưa biết. Do đó chỉ thể đánh
giá chất lượng của ước lượng thông qua bản thân thống G=f(X1,X2, . . . ,Xn).
ràng vô số cách chọn hàm f, tức vô số thống kê G thể dùng làm
ước lượng của θnên cần đưa ra một tiêu chuẩn để đánh giá chất lượng thống kê G,
từ đó lựa chọn được thống kê “xấp xỉ một cách tốt nhất” tham số ước lượng. 3
tiêu chuẩn bản để chọn thống kê như sau.
Định nghĩa 4.1.1. Thống Gcủa mẫu được gọi
(i) ước lượng không chệch của tham số θcủa biến ngẫu nhiên Xnếu E(G) = θ.
Ngược lại, nếu E(G)=θthì Gđược gọi ước lượng chệch của θ.
(ii) ước lượng hiệu quả của tham số θcủa biến ngẫu nhiên Xnếu ước lượng
không chệch và phương sai nhỏ nhất so với mọi ước lượng không chệch khác
được y dựng trên cùng một mẫu.
(iii) ước lượng vững của tham số θcủa biến ngẫu nhiên Xnếu Ghội tụ theo xác
suất đến θkhi n , tức với mọi εdương bé tùy ý ta luôn lim
x→∞P(|G
θ|< ε) = 1.
Chú ý 4.1.2. (i) G ước lượng không chệch của tham số θkhông nghĩa mọi
giá trị của Gđều trùng khít với θ chỉ nghĩa trung bình các giá trị của thống
kê Gbằng θ. Từng giá trị của G thể sai lệch rất lớn so với θ.
(ii) Trung bình mẫu X ước lượng không chệch của kỳ vọng của biến ngẫu
nhiên X, nghĩa E(X) = E(X). Trung bình mẫu Xcũng ước lượng hiệu quả
(vững) của E(X).
(iii) Tần suất mẫu f ước lượng không chệch của xác suất Pcủa biến ngẫu
nhiên X, nghĩa E(f) = P. Tần suất mẫu f ước lượng hiệu quả (vững) của xác
suất P.
(iv) Phương sai điều chỉnh mẫu S2 ước lượng không chệch của phương sai
V(X)của biến ngẫu nhiên X, tức E(S2) = V(X). Phương sai điều chỉnh mẫu
S2cũng ước lượng hiệu quả (vững) của phương sai V(X).
dụ 4.1.3 Giả sử một hàng của một nhà y đã được đóng thùng, mỗi thùng
50 sản phẩm. Kiểm tra ngẫu nhiên số phế phẩm trong 50 thùng hàng ta thu được
kết quả như sau:
4.1 Phương pháp ước lượng điểm 99
Số phế phẩm X0 1 2 3 4 5 6 7 8 9 10
Số thùng (ni) 0 2 3 7 20 6 4 7 2 1 1
(i) y ước lượng cho số phế phẩm trung bình trong mỗi thùng.
(ii) y ước lượng cho t lệ phế phẩm của hàng đó.
(iii) Tìm ước lượng không chệch cho phương sai của số phế phẩm mỗi thùng.
Giải. (i) Gọi X biến ngẫu nhiên chỉ số phế phẩm mỗi thùng. Đây bài toán
ước lượng điểm cho kỳ vọng của tổng thể. Ta sẽ dùng trung bình mẫu để ước lượng
số phế phẩm trung bình trong mỗi thùng.
nixinixinix2
i
0 0 0 0
2 1 2 2
3 2 6 12
7 3 21 63
20 4 80 320
6 5 30 150
4 6 24 144
7 7 49 343
2 8 16 128
1 9 9 81
1 10 10 100
50 247 1343
Nhìn vào bảng trên ta thấy:
x=247
50 = 4,94.
Vậy số phế phẩm trung bình mỗi thùng hàng khoảng 5sản phẩm.
(ii) Đây bài toán ước lượng tỷ lệ của một tổng thể. Ta dùng tần suất mẫu (tỷ
lệ phế phẩm của 50 thùng hàng) để ước lượng t lệ phế phẩm của cả hàng đó.
Tổng số sản phẩm điều tra n= (50)(50) = 2500.
Số phế phẩm phát hiện 247. Do đó, t lệ phế phẩm trong mẫu gồm 50 thùng
hàng
f=247
2500 = 0,0908.
Vậy t lệ phế phẩm của hàng vào khoảng (0,0908)(100%) = 9,88%.
(iii) Ước lượng không chệch cho phương sai của số phế phẩm mỗi thùng chính
phương sai điều chỉnh mẫu S2. Ta có:
s2=1343
50 (4,94)2= 2,4564 s2=50
49(2,4564) = 2,507.
Vậy phương sai của số phế phẩm giữa các thùng vào khoảng 2,507.
100 Chương 4: Ước ng tham số
4.2. Phương pháp ưc ợng bằng khoảng tin cậy
4.2.1. Khái niệm
Các phương pháp ước lượng điểm nói trên một nhược điểm bản khi kích
thước mẫu nhỏ thì ước lượng điểm tìm được thể sai lệch rất nhiều so với giá trị
của tham số cần ước lượng, tức sai số của ước lượng thể rất lớn. Mặt khác
dùng các phương pháp trên không thể đánh giá được khả năng mắc sai lầm khi
ước lượng bằng bao nhiêu. Do đó khi kích thước mẫu nhỏ người ta thường sử dụng
phương pháp ước lượng bằng khoảng tin cậy.
Định nghĩa 4.2.1. Khoảng (θ12)của thống kê Gđược gọi khoảng tin cậy
(interval confidence) của tham số θvới độ tin cậy 1αnếu P(θ1< θ < θ2) = 1α.
Tham số 1α=γđược gọi độ tin cậy của ước lượng, αđược gọi mức ý
nghĩa,θ1 cận trái (giá trị tối thiểu), θ2 cận phải (giá trị tối đa), còn I=|θ1θ2|
độ dài khoảng tin cậy,I/2 bán kính khoảng.
Để giải một bài toán ước lượng tham số bằng khoảng tin cậy, ta tiến hành các
bước chính như sau:
Bước 1. Từ tổng thể lập mẫu ngẫu nhiên W= (X1,X2, . . . ,Xn).
Bước 2. Chọn thống kê G=f(X1,X2, . . . ,Xn)sao cho quy luật phân phối
xác suất của Ghoàn toàn xác định.
Bước 3. Với độ tin cậy 1αcho trước thể tìm được cặp giá trị α1và α2
sao cho α1+α2=αvà tương đương với chúng tìm được cặp phân vị θ1=θα1
và θ2=θα2thỏa mãn điều kiện
P(G < θ1) = α1;P(G > θ2) = α2P(θ1< G < θ2) = 1 (α1+α2) = 1 α.
Như vậy, với độ tin cậy (1 α)ta đã y dựng được khoảng tin cậy (θ1, θ2)
cho G. Bằng các phép biến đổi tương đương, công thức trên luôn đưa được về dạng
P(G1< θ < G2) = 1α, với G1=f(X1,X2, . . . ,Xn1)và G2=f(X1,X2, . . . ,Xn2).
Đó chính khoảng tin cậy cần tìm.
Chú ý 4.2.2. (i) Khi tiến hành một phép thử với mẫu ngẫu nhiên W= (X1,X2,
. . . ,Xn)ta thu được một mẫu cụ thể w= (x1,x2, . . . ,xn), do đó tính được giá trị
của θ1và θ2ứng với mẫu cụ thể. Khi đó kết luận qua mẫu cụ thể w, với độ
tin cậy 1α, tham số θcủa biến ngẫu nhiên gốc Xsẽ nằm trong khoảng (θ12).
(ii) Với độ tin cậy 1αcho trước ta thể tìm được số cặp (θ12)thỏa mãn
điều kiện α1+α2=α. thế vô số khoảng tin cậy tương ứng với độ tin cậy
đã cho.
4.2.2. Ước ợng kỳ vọng toán
Trong mục y ta sẽ xét bài toán ước lượng kỳ vọng toán của biến ngẫu nhiên Xxét
trong hai trường hợp khi X phân phối chuẩn và khi Xkhông phân phối chuẩn.
4.2 Phương pháp ước lượng bằng khoảng tin cậy 101
1. Khi biến ngẫu nhiên X phân phối chuẩn N(a,σ2)
Bài toán. Cho biến ngẫu nhiên Xcó phân phối chuẩn N(a,σ2)với kỳ vọng a
chưa biết phương sai σ2có thể đã biết (chưa biết). Hãy ước lượng tham số kỳ vọng
avới độ tin cậy 1α.
Giải.
Bước 1. Từ tổng thể lập một mẫu ngẫu nhiên W= (X1,X2, . . . ,Xn)kích thước n.
Các bước tiếp theo của việc giải bài toán trên phụ thuộc vào việc chọn thống kê
Gsao cho phù hợp với các điều kiện của bài toán. Ta xét hai trường hợp tùy thuộc
vào phương sai σ2của biến ngẫu nhiên Xđã biết hoặc chưa biết.
a. Đã biết phương sai σ2của biến ngẫu nhiên X
Bước 2. Chọn thống kê
G=U=(Xa)n
σ,
trong đó X trung bình mẫu. Khi đó, theo Định giới hạn trung tâm, ta
thống kê Uxấp xỉ phân phối chuẩn hóa N(0,1). Với độ tin cậy 1αcho trước tìm
được cặp giá trị α1và α2sao cho α1+α2=α. Từ đó tìm được hai phân vị chuẩn
uα1và u1α2thỏa mãn điều kiện
P(U < uα1) = α1;P(U > u1α2) = α2.
Suy ra
P(uα1< U < u1α2) = 1 (α1+α2) = 1 α.
uα1=u1α1nên thay thống kê Uvào biểu thức trên, ta thu được
P(u1α1<(Xa)n
σ< u1α2)= 1 α, hay
P(Xσ
nu1α2< a < X+σ
nu1α1)= 1 α.
Bước 3. Kết luận: với độ tin cậy bằng (1 α), tham số acủa biến ngẫu nhiên
Xsẽ nằm trong khoảng
(Xσ
nu1α2;X+σ
nu1α1).(4.1)
Từ công thức (4.1) , để xác định khoảng tin cậy của a, người ta thường xét các
trường hợp đặc biệt của khoảng tin cậy theo cách chọn α1và α2như sau.
Khoảng tin cậy đối xứng: Nếu α1=α2=α
2thì khoảng tin cậy của alà:
(Xσ
nu1α
2;X+σ
nu1α
2).(4.2)
Trong (4.2), đặt ε=σ
nu1α
2thì biểu thức dạng (Xε;X+ε),εđược gọi
độ chính xác của ước lượng, phản ánh mức độ sai lệch của trung bình mẫu so
với trung bình tổng thể với độ tin cậy (1 α)cho trước.