
83
KHOẢNG TIN CẬY
Trong nghiên cứu nhiều khi tìm được giá trị p vẫn chưa thể có kết luận về ý
nghĩa thống kê một cách chắc chắn vì nếu các giá trị xung quanh trị số trung bình hay
giá trị ước lượng có chứa phần nhiều hay ít giá trị của quần thể thật hay không. Nếu
chưa nhiều và hội tụ gần thì chứng tỏ giá trị thu được tập trung và đại diện hoặc ngược
lại. Khi tìm được 2 cực của khoảng tin cậy là ta tìm được giới hạn tin cậy. Thông
thường trong nghiên cứu người ta hay giới hạn khoảng tin cậy ở mức 95% (p = 0,05)
nên gọi là CI 95% để đánh giá sự may rủi.
Đối với các phân phối chuẩn hoặc có hệ thống thì khoảng tin cậy được tính theo
công thức sau:
(Nếu CI 95% thì tbtd = 1,96 (dựa theo biểu đồ Gauss)
Trong đó:
BA XX − là các giá trị trung bình ngẫu nhiên hoặc mẫu chứng.
Scb là đọ lệnh chung.
tbtd: Trị số phân phối t ở các bậc tự do với ý nghĩa thống kê có mức ấn định.
Đối với các biến rời rạc khoảng tin cậy được tính trên cơ sở giá trị của nguy cơ
tương đối RR hoặc tỷ xuất chênh OR. Cách này có sự phức tạp của sự hiển diện ở
công thức một cách logarit tự nhiên với giá trị tương quan khác nhau. Để đơn giản
người ta dựa trên trắc nghiệm đã tính được χ2 để tính xấp xỉ và tìm phương sai theo
công thức sau:
z: Là trị số tương ứng với mức tin cậy mong muốn (1,645; l,96; 2,3261 2,576)
Khoảng tin cậy có thể cung cấp các thông tin của trị số p, nên khoảng rộng của
khoảng tin cậy dao động lớn, nhỏ có ý nghĩa rõ rệt và liên quan đến lực và cơ mẫu. Cỡ
mẫu càng lớn thì ước lượng càng ổn định và khoảng tin cậy càng hẹp và ngược lại,
chính vì vậy giá trị tin cậy cũng được xác định.

84
SAI SỐ QUAN TRẮC
1. Ba loại sai số
Ta biết rằng, dù với sự quan trắc khá chính xác cùng một loại đại lượng, các kết
quả của các quan trắc riêng biệt vẫn sai khác nhau, và do đó có chứa sai số.
Hiệu x - a giữa kết quả quan trắc x và giá trị chân thực a của đại lượng được quan
trắc gọi là sai số quan trắc. Đây lại một trong những bài toán cơ bản của việc xử lý
bằng toán học các kết quả thực nghiệm chính là ước lượng giá trị chân thực của đại
lượng quan trắc theo các kết quả đã thu được. Để giải bài toán đó, cắn biết các tính
chất cơ bản của sai số quan trắc và biết cách sử dụng chúng.
1.1. Sai số thô
Sai số sinh ra do vi phạm các điều kiện cơ bản của công việc quan trắc hoặc do
sơ xuất của người làm thí nghiệm. Khi phát hiện có sai số thô, cần bỏ ngay kết quả
quan trắc và quan trắc lại. Ta luôn luôn xem tằng chỉ giữ lại để xử lý bằng toán học các
kết quả quan trắc không chứa sai số thô.
1.2. Sai số hệ thống
Các sai số quan trắc do một số lớn nguyên nhân mang nhiều vẻ khác nhau gây
nên. Ví dụ do không điều chính chính xác dụng cụ, do thay đổi của các điều kiện bên
ngoài, ta có thể dễ dàng trừ bỏ các loại sai số hệ thống bằng cách dựa vào các hiệu
chỉnh với sự tương ứng trong kết quả quan trắc. Ta xem rằng ngay từ đầu của việc sử
lý bằng toán học các kết quả quan trắc, tất cả các sai số hệ thống đều đã được phát hiện
và trừ bỏ.
1.3. Sai số ngẫu nhiên
Sai số quan trắc còn lại sau khi đã khử tất cả các sai số hệ thống được gọi là sai
số ngẫu nhiên. Sai Bố ngẫu nhiên gây nên bởi một số rất lớn các nhân tố, mà tác dụng
của chúng bé đến mức ta không thể tách riêng và tính riêng biệt cho từng nhân tố
được. Bằng các phương pháp của lý thuyết xác suất, có thể tính được ảnh hưởng của
chúng đến việc ước lượng giá trị chân thực của các đại lượng được quan trắc.
2. Phân phối của sai số ngẫu nhiên trong các quan trắc
Sai số ngẫu nhiên trong các quan trắc được đặc trưng bởi một luật phân phối xác
định.
Trong mô hình lý thuyết xác xuất, có sai số ngẫu nhiên z = x - a cũng được xem
như là các đại lượng ngẫu nhiên (hay là biến ngẫu nhiên) có thể nhận các giá trị thực
tuỳ ý đồng thời mỗi khoảng (l1, z2) tương ứng với một số hoàn toàn xác định được gọi
là xác suất để đại lượng ngẫu nhiên z rơi vào khoảng đó, và ký hiệu là p (z1 < z < z2)

85
hoặc p (z ∈ z1. z2) xác Suất đó là Sự lý tưởng hoá của tần suất tương đối của sự rơi vào
khoảng (z1, z2) tức là trong thực hành, chính tần suất tương đối đã nêu trên đây gần với
xác suất đó.
Quy tắc cho phép tìm xác suất p (z1 < z < z2) đối với khoảng (z1, z2) tuỳ ý được
gọi là luật phân phối xác suất của đại lượng ngẫu nhiên z. Ta có thể viết dưới dạng tích
phân:
Trong đó p (z) là một hàm không âm nào đó, được chuẩn hoá bởi điều kiện:
Hàm đó xác định hoàn toàn luật phân phối xác suất tương ứng và được gọi là mật
độ xác suất (hay gọi mật độ phân phối)
3. Phương pháp khử sai số thô
3.1. Phương pháp khử sai số thô khi biết
δ
Ta ký hiệu giá trị đột xuất là XA còn tất cả các giá trị còn lại là X1,
và so sánh giá trị tuyệt đối của hiệu XXA− với đại lượng, đối với tỷ số thu được:
Ta tính xác suất để cho tỷ số đang xét nhận một cách ngẫu nhiên giá trị không bé
hơn 1 với điều kiện giá trị XA không chứa sai số thô. Nếu như xác suất tính được bằng
cách đó rất bé, thì giá trị “đột xuất” chứa sai số thô và cần phải bỏ giá trị đó trong việc
sử lý tiếp theo các kết quả quan trắc.
Ví dụ: Giả sử trong số 41 kết quả quan trắc độc lập được tiến hành và sau khi
tính toán ta có kết quả s = 0,133; Phát hiện có giá trị đột xuất x* = 6,866, đồng thời giá
trị trung bình của 40 kết quả còn lại là X = 6,500 có thể xem rằng giá trị “đột suất” đó
chứa sai số và như vậy nó có giá trị nào đó trong việc xử lý các kết quả nghiên cứu về
sau không? Trong tình huống này chúng ta phải làm một phép thử đặc hiệu để đánh giá
và sau đó đưa ra hướng giải quyết theo công thức:

86
Giải:
Ta tính xác suất 1 -2 Φ (t) = 0,0066 < 0,007.
Độ tin cậy của kết luận p > 0,993 => có thể xem rằng giá trị x* chứa sai số thô và
bỏ giá trị đó trong việc sử lý sau này các kết quả quan trắc.
3.2. Phương pháp khử sai số thô khi không biết s
Ta dùng sai số tiêu chuẩn thực nghiệm vì s không tìm thấy trong tài liệu hoặc vì
lý do nào đó mà ta không sử dụng được. Công thức áp dụng và cách làm được tiến
hành như sau:
Ví dụ: Giả sử n kết quả quan trắc độc lập cùng độ chính xác ta có được giá trị
trung bình x = 6,500 còn sai số tiêu chuẩn thực nghiệm S = 0,133 và giả Bộ quan trắc
lần thứ n + 1 cho kết quả X* = 6,866. Ta đang đứng trước tình huống cần xem xét, lựa
chọn vì giá trị trung bình của lần quan trắc ni lớn hơn so với kết quả quan trắc độc lập.
Có thể khử kết quả đó khỏi việc xử lý về sau không là điều mà nhà nghiên cứu cần hết
sức cân nhắc để sao cho mẫu nghiên cứu không nhỏ đi nếu không cần thiết, ngược lại
nếu để thì có làm sai lệch toàn bộ các kết quả nghiên cứu chung đã thu được hay
không.
Giải:
Nếu số các kết quả chấp nhận được là n = 40 thì tỷ số thu được vượt quá giá trị
tới hạn 2,74 với độ tin cậy p = 0,99 và ta có thể khử giá trị x với độ tin cậy của kết
luận lớn hơn 0,99. Còn nếu số các kết quả chấp nhận được là hơn 5, tỷ số thu được bé
hơn giá trị tới hạn là 2,78 ngay cả với độ tin cậy p = 0,95 ta cũng không nên khử giá trị
x* vì mất quá nhiều số liệu (đây là sự vừa lòng với xác suất p = 5)

87
PHẦN PHỤ LỤC
Bảng 1: Bảng t
P
Đtd 0,05 0,02 0,01 0,001
1 12,706 31,821 63,657 636,619
2 4,303 6,965 9,925 31 589
3 3,182 4,541 5,841 12,924
4 2,776 3,747 4,604 8,610
5 2,571 3,365 4,032 6,860
6 2,447 3,143 3,707 5,595
7 2,365 2,998 3,499 5,408
8 2,306 2,896 3,355 5,401
9 2,262 2,821 3,250 4,781
10 2,228 2,764 3,169 4,587
11 2,201 2,718 3,106 4,437
12 2,179 2,681 3.055 4,318
13 2,160 2,650 3,012 4,221
14 2,145 2,524 3,977 4,140
15 2,131 2,602 2,947 4,073
16 2,120 2,583 2,931 4,015
17 2,110 2,567 2,808 3,965
18 2,101 2,552 2,878 3,922
19 2,093 2,539 2,861 3,883
20 2,086 2,528 2,845 3,850
21 2,080 2,518 2,831 3,819
22 2,074 2,508 2,819 3,792
23 2,069 2,500 2,807 3,767
24 2,064 2,492 2,797 3.745
25 2,060 2,485 2,787 3,725
26 2,056 2,479 2,779 3,707
27 2,052 2,473 2,771 3,690
28 2,048 2,467 2,763 3,674
29 2,045 2,462 2,756 3,659
30 2,042 2,457 2,750 3,646
31 1,960 2,326 2,576 3,291

