Chương 2: PHÂN TÍCH PHƯƠNG SAI
NG
L
I. KHÁI QUÁT VỀ PHÂN TÍCH PHƯƠ SAI (ANA YSIS OF VARIANCE)
1. Mục đích và ý nghĩa:
Cần phân biệt hai loại yếu tố ảnh hưởng đến giá trị của một số đo thực nghiệm : yếu tố cơ b n và yếu tố ngẫu nhiên. ả
• Yếu tố cơ bản : Bao gồm một nhóm các điều kiện cơ bản của thí nghiệm. Mỗi điều ược coi là một yếu tố cơ bản. Trong thí nghiệm Hóa học, yếu tố cơ bản thường là kiện đ làm dịch chuyển cân bằ yếu tố ng hóa học hoặc làm thay đổi vận tốc phản ứng. Thí dụ : nhiệt độ, áp suất, nông độ các chất xúc tác, nồng độ tác chất... là các yếu tố cơ bản. Mỗi ệ điều kiện cụ th ể của thí nghi m gọi là mức cố định của yếu tố cơ bản. Chẳng hạn, ảnh o sát ở hưởng của pH 3 mức cố định là pH = 2, pH = 3, pH = 4. được khả
Kh ể gâ ệm, với khoảng mức cố định đã chọn thì yếu tố cơ bản có hệ thống của giá trị trung bình. Nếu xét về mặt sai số thì i lập kế hoạch thí nghi y ra sự thay đổi có tính là yếu th yếu tố cơ bản tố có khả năng gây ra sai số hệ thống của phép đo.
nh phân tích giống hệt nhau, thường xảy ra có sự khác biệt h
người ta ch ấp nhậ Khi có nhiều phòng thí nghiệm cùng tham gia phân tích một mẫu đồng nhất bằng một ệ thống giữa các giá quy trì trị trung bình thu được bởi mỗi phòng thí nghiệm. Tình huống này rất hay gặp trong thực tế kiểm nghiệm. Khi đó n một yếu tố cơ bản đặc biệt gọi là “yếu tố phòng thí nghiệm” với số mức cố định bằng đúng bằng số phòng thí nghiệm tham gia.
•
Yếu tố ngẫu nhiên : Thể hiện khi lặp lại thí nghiệm với các điều kiện cơ bản ợc những giá trị đo khác nhau. Đây là sai số ngẫu nhiên “thuần nh của yếu tố
a thí nghiệm. Để ước lượng sai số ngẫu nhiên này với mỗi mức cố đị cần phải tiến hành một số thí nghiệm song song. không hề thay đổi, thu đư túy” củ c ơ bản
ựng ảnh hưởng đồ ng thời của yếu tố cơ bản và yếu tố ngẫu ỗi giá trị đo chứa đ ⇒ M n hiên.
Mục
ới nhau, giữa các y ếu tố cơ b
đích của phân tích phương sai là tách biệt và so sánh từng loại yếu tố đến giá trị ếu tố cơ bản với các yếu tố phát hiện một loạt ảnh hưởng
ản v , phân tích phươn sa còn cho phép g i đ n đặ o: ảnh hưởng giữa các y gẫu nhiên. Hơn nữa c biệt chỉ thể hiện khi có m ặt đồng thời hai hay nhiều yếu tố cơ bản.
Phâ
n tích phương sai được sử dụng rộng rãi trong Hóa phân tích để phát hiện và đánh giá vai trò của nguồn sai số khác nhau. Trong Hóa học nói chung, phân tích phương sai là m a ột công cụ để tìm ra định thí nghiệm. u hó trong hoạch các điều kiện t ối ư
Tùy theo số yếu tố cơ bản dự định đem khảo cứu, phân tích phương sai một yếu tố, ếu tố, nhiều yếu tố... Thông thường mỗi yếu tố được khảo cứu ít nhất với h ai mức cố
hai y định.
2. Nguyên tắc và thuật toán:
Sự th
• ị đo do mỗi yếu tố gây ra được đặc trưng bằng một do tương ứng. Phép so sánh ảnh hưởng của các yếu tố rút của giá tr ăng giáng c số tự phương sai mẫu với bậ thành phép kiểm định tính đồng nhất của các yếu tố.
46
Kiểm định tính đồ - ng nhất của 2 phương sai : chuẩn Fisher.
Kiểm định tính đồ nhấ của một dãy phương sai : - t ng chuẩn Bartlet hoặc Cochran.
Thuật toán : •
ai : Có hai loại phương sai đặc trưng của phân tích phương s
2 thS
: b iểu thị tác dụng của yếu tố ngẫ u nhiên “thuần túy” đến ương sai tái hiệ n
2
- Ph o. giá trị đ
dsS : biểu thị tác dụng chung của yếu tố ngẫu nhiê
- Phương sai đối sánh n và yếu tố cơ
b ản đến giá trị đo.
2 thS
2 dsS
và đồng nhất (theo Fisher) : yếu tố cơ bản không ảnh hưởng đến kết + Nếu
q uả đo.
2 thS
2 dsS
2 ds
2 thS
2 dsS
+ Nếu và không đồng nh ất, S lấn át , có thể tách thành hai phần
2
riê ng :
thS c a yếu ủ
2
tố ngẫu nhiên thuần túy ♣Thành phần
AS c
2
S
ủa yếu tố cơ bản A ♣Thành phần
i m
A đượ
2 ds
và S và c giải quyết dự a vào số lặp lại n ỗi mức j
2 Mối quan hệ giữa thS ủa yếu tố A , nếu ni đồng c
2
2
đều cho mọi mức (thí nghiệm đối xứng) thì:
2 A
dsS =
thS + n S
(n là số lần thí nghiệm song song)
II. PHÂN TÍCH PH
ƯƠNG SAI MỘT YẾU TỐ (SINGLE FACTOR)
Mục đích : Đánh giá sự ảnh hưởng của một yếu tố nào đó trên các giá trị trung bình
của kết quả đo
Gi k, m ả sử khảo sát ảnh hưởng của yếu tố cơ bản A với k mức cố định, đánh số j = 1, 2,... , ỗi mức tiến hành thí nghiệm song song đánh s ,... ,n = 1, ố i 2
1. Trình tự thực hiện:
Bước 1:
Lập bảng ghi kết quả đo xji và tính thêm các các dữ liệu cần thiết
...
j 1 2 k i
1 x 11 x21 xk1
...
n
k
2 x 12 x22 x k2
N
jin
∑∑=
1j =
... ... ... ...
1i =
n x1n x2n xkn
47
n
x
i
...
kx
1x
2x
x
j
∑ 1i == n
i
k
n
T
=
...
jT
ix
Tk T 1 T2
∑
∑
1j =
1i =
k
n
2
2
2
2
x
x
=
...
2 j
2 i
jx
kx
1x
2x
∑
∑
1i =
=1j
...
2s j
2 ks
2 1s
2 2s
Các ký hiệ u :
*Trung bì
nh
của mẫu
n
ix∑
x
j
== 1i n
i
= jT in
* Trung bình
chung:
x =
T N
* SST: Tổng bình phương chung (Total Sum of Squares)
2
2n
kn
1n
x(
2)x
2)x
x(
2)x
−
i1
2i
ki
2 ji
+ =
∑ − x
SST = ∑ −
∑ − x(
T N
=1i
1i =
=i 1
+….+ ∑
* SSF : Tổng bình phương do yế
u tố
(Sum of Squares for Factor)
2
k
2
...
)x
−
=
+
+
−
x(jn
j
SSF =
∑
2 T k n
T N
2 T 1 n
T n
= 1j
2 2 + 2
k
1
* SSE : Tổng bình phương do sa
i số (Sum of Squares for Erro)
SSE = SST – SSF
* M F : Trung bình bình phương của yếu tố (Mean Square for
S
Factor)
(fđs = k-1 )
SSF 1k −
MSF = = S 2 ds
* M E : Trung bình bình phương c
S
ủa
sai số (Mean Square for
2
Erro)
MSE
=
=
thS (fth= N-k)
SSE kN −
* M T : Trung bình bình phươ
S
ng chung
(Mean Total Sum of quare)
48
S
2 Chung
SST 1N −
=
M ST = = (fchung = N-1)
f,PF
ds f,
th
S SF SSE
2 dsS 2 thS
) * Ftn= (Flt =
S
So sánh Ftnvà F lt
t
2 th
2 ds
S
: và S đồng nhất (theo Fisher) : + Nếu Ftn < Fl
2 chung
để biểu thị sai số ⇒ Yếu tố cơ bản A không ảnh hưởng đến kết quả đo.. Lấy
2S và
2S không đồng nhất (theo Fisher)
ngẫu nhiên của toàn bộ phép đo, với b ậc số tự do fchung = N - 1.
th
ds
+ Nếu Ftn > Flt :
Yếu tố cơ bản A ảnh hưởng đáng kể đến kết quả đo .Trong dãy giá tr ị trung ⇒ bìn h nhất định có một hoặc vài cặp có sai biệt hệ thống (tiến hành bước 2)
2
2
Tổ ng bình Thàn h phần Phương sai Nguồn gốc phương sai của phương sai Số b ậc tự do phương các độ lệch
AS
dsS =
2 thS
2
+ n
dsS =
SSF 1k −
2
2
k - 1 SSF Tác dụng chung của ố cơ bản và ngẫu yếu t nhiên (thí nghiệm đối xứng)
thS =
thS
SSE kN −
S
N - k SSE T ác dụng riêng của yếu tố ngẫu nhiên
S
2 Chung
2 chung
SST 1N −
= “Ngẫu nhiên hóa” mọi tác dụn của yếu tố cơ N- 1 g SST bản và ngẫu nhiên
Bước 2 :Kiểm định tính đồng nhất của phương sai theo chuẩn Bartlet hoặc
Cochran (khi thí nghiệm đối xứng các n =n):
j
2
Cần loại bỏ các phương sai lớn cho đến khi các phương sai còn lại đều đồng nhất
Bước
3 : Kiểm định tính không đồng nhất của
dsS t
S
F = tn
S
2 ds 2 th
F
và heo ch uẩn Fisher : S 2 th
F = lt
f,P
f,
th
ds
với fâs = k - 1 fth = k(n - 1)
lt
tn
và F : So sánh v ới F
tn
lt
ận : y ếu t ố A không có ảnh hưởng đáng kể đến các giá trị đo – Nếu F < F , kết lu (t rên các số đo còn lại sau khi loại bỏ ở bước 2)
49
lt
ưởng đáng ể đến giá trị đo. ó ảnh h k – Nếu Ftn > F , kết luận : yếu tố A c
Trong dãy giá trị trung bình nhất định có một hoặc vài cặp có sai biệt hệ thống., cần tiến hành bước 4 đ t giữa các giá trị trung bình. ể kiểm định s ai biệ
B ớc 4
ư
: Ki ểm định sự sai biệt hệ thống giữa các giá trị trung bình theo chuẩn
Duncan:
jx theo trình tự từ lớn
đến nh ỏ, đánh s ố b ậc r = 1, 2, ..., k; sau đó tiến Ta s ắp xếp l ại
h ành như ở phần chuẩn Duncan.
III
. BÀI TẬP ỨN
G DỤNG
1.
Bài tập 1:
ng Ca (%) trong mẫu đá vôi được xác định bằng 3 phương pháp khác ng bởi các phương pháp phân được có bị ảnh hàm lương C a thu hưở àm lượ H au. Hãy cho biết nh tích khác nhau không?
Bả ng kết quả:
12
10
11
12
12
9
PP1
12
14
15
16
PP2
12
11
13
10
PP3
Bước 1
: Lập bảng và ghi các dữ liệu cần thiết
Gi ả thi ết thống kê
ợng Ca không bị ảnh hưởng bởi phương pháp phân tích H0 : Hàm lư
(Các giá trị trung bình thu được xem như tương đương nhau)
H1 : Hàm lượng Ca bị ảnh hưởng bởi phương pháp phân tích
(Các giá trị trung bình thu đư ợc có sự khác biệt )
PP1
PP2
PP3
12
12
12
10
14
11
11
15
13
12
16
10
9
12
6
4
4
N
=14
nj
5
3
3
fj
50
jx
11
14,25
11.
5
66
57
46
T
2
jS
1,6
2,916667
1,666667
2
2 ji
SST = = 48,9286
∑ − x
T N
2
... ++
T n
T N
2 T 2 n
2 T 1 + n 1
2
2 k − k
SSF = = 27,1786
2
(f
SSE = SST – SSF = 21,75
đs = k-1 = 3-1 = 2)
dsS = 13,5893
SSF 1k −
2
MSF = =
MSE =
=
thS = 1,97
SSE kN −
S
73 (fth= N-k = 14-3 = 11)
0,95;2;1
1 = 3,98
F = tn
S
2 ds 2 th
= 6,8727 > F
ố phươ ng pháp phân tích có ảnh hưởn g đến kết quả đ o ⇒ Yếu t
ướ B c 2
f
Slog
j
2 j
: Kiể m định tính đồn g nhấ t của các p hươn g sai bằng chuẩ
PP1
PP2
PP
3
Slog
jf
2 j
n Barlet ∑
1,0206
1,3947
0,6655
3,0808
f
S
Sg
j log
2 j
2 th
B = 2,3 ) - ∑ 03( th lo f
2 2;95,0χ
= 5 ,99 ( f = k-1 = 2) B = 2,30 3(11. log1,9773 – 3,0 808) = 0, 4053 <
2
2
⇒ Các phương sai đồng nhất
ớc 3: Ki
thS và
dsS t eo chuẩn
S
ểm định tí nh kh ông đồng nhất của h Fishe r : Bư
F = tn
S
2 ds 2 th
= 6,8727 > F0,95;2;11 = 3,98
là không đồng nhất ⇒Yếu tố phương pháp phân tích
2 thS hưởng ến các kết qu
2 và dsS ả thu được
⇒ Các phương sai đ có ảnh
Bướ
c 4: Kiểm định sự sai biệt hệ thống giữa các giá trị trung bình theo chuẩn Duncan :
Lập bảng
51
r
1
2
3
jx
14,25
11,5
11
4
4
6
n j
x
Sth = 1,4062
th
thf;R;95,0Q
thf;R;99,0Q
′′−′ x j j S
n
th
′ ′′ n.n.2 j j ′′+′ n j j
và ( v ới f = 11 và R = r/ - r// + Qtn = Qlt =
jx′
jx ′′
1)
R
K(cid:31)t lu(cid:31)n
thf;R;95,0Q
thf;R;99,0Q
Qtn
14,25
11,5
2
3,91
3,12
4,4
>
11
3
5,06
3,26
4,64
>>
≈
11
,5
11
2
0,78
3,12
4,4
Bảng điểm tổng kết:
PP
1
PP2
PP3
Ph
(cid:31)(cid:31)n ph g
áp
11
14,25
11,5
Hà
m l(cid:31)(cid:31)ng Ca
(%)
1
(cid:31)i(cid:31)m t
(cid:31)ng k(cid:31)t
1
41
Kết l ận: u
Bác bỏ giả thiết H0 , chấp nhận giả th
ịết H1.Nghĩa là hàm lượng Ca thu được từ 3 PP phân tích có sự khác biệt . Trong đó PP1 và PP3 xem như cho kết quả tương đương . nhau
hú ý: Ở đây chưa biết giá trị đ
úng của Ca nên không thể kết luận là PP nào cho
C kết quả đú
ng .
2. Bài tập
2:
7Br (a5) đến hiệu suất
4), C3H
Hãy so sánh ảnh hưởng của các halogenur alkyl CH3I (a1), C3H7I (a2), C4H9I (a3), (%) của phản ứng polimer theo cơ chế gốc tự do, C2H5Br (a dựa vào bảng số liệu đo hiệu suất :
52
1 2 3 4 5 j (a ) 1 (a ) 2 (a ) 3 (a ) 4 (a5) i
1 79,8 87,3 42,5 76,0 70,7
2 86,3 69,6 64,3 83,8 64,8
3 86,5 81,8 79,0 72,8 38,5
4 92,3 78,0 61,0 89,0 77,0
5 76,5 83,7 31,3 76,5 91,5
6 87,1 64,8 72,9 87,5 68,0
7 82,5 67,3 58,7 74,5 38,1
Giải :
8 90,0 7 5,5 52,5 93,2 80,0
Bước 1:: Lập bảng và ghi các dữ liệu cần thiết
Giả thiết thống kê
H0 : Các halogenur alkyl không ảnh hưởng đến hiệu suất
(Các hiệu suất thu được xem như tương đương nhau)
H1 : Các halogenur alkyl có ảnh hưởng đến hiệu suất
(Các hiệu suất thu được có sự khác biệt )
1 2 3 4 5 j (a1) (a2) (a3) (a4) (a5) i
1 79,8 87,3 42,5 76,0 70,7
2 86,3 69,6 64,3 83,8 64,8
3 86,5 81,8 79,0 72,8 38,5
4 92,3 78,0 61,0 89,0 77,0
5 76,5 83,7 31,3 76,5 91,5
6 87,1 64,8 72,9 87,5 68,0
7 82,5 67,3 58,7 74,5 38,1
8 90,0 75,5 52,5 93,2 80,0
jx
85,125 76 57,775 81,6625 66,075
681 608 462,2 653,3 528,6 Tj
53
2
T= ∑Tj = 2933,1
jS
27,4364 66,7086 242,1678 59,1655 361,3421
2
x
N = 40
2 ji
T N
2
+
... ++
−
= 9379,9397 SST =∑ −
2 T k n
T N
2 T 1 n
2 T 2 n
1
2
k
SSF = = 4082,196
2
SSE = SST – SSF = 5297,7437
(fđs = k-1 = 5-1 = 4)
dsS = 1020,549
SSF 1k −
2
MSF = =
MSE =
=
th= N-k = 40-5 = 35)
thS = 151,3641 (f
SSE kN −
2
F = tn
dsS S
2 th
= 6,7539 > F0,95;4;35 = 2,65
2
có ảnh hưởng đến hiệu suất của ph ản ứng (các hiệu suất thu ⇒ Yếu tố halogenur alkyl được có sự khác biệt nhau)
jS để kiểm định sự đ
ồng nhất
của
Chú ý: Nếu thí nghiệm đối xứng (nj = n), sử dụng giá trị các phương sai theo chuẩn Cochran
Bướ
c 2: Kiểm định sự đồng nh
ất của các phương sai theo chuẩn Cochran
2 maxS
= 361,3421
,361 ,756
3421 8204
j
2 S max ∑ 2 S
= = 0,4774 Gtn =
Glt = G0,95;k-1,n = G0,95;4;8 = 0,3910 ; G0,99;4;8 = 0,4627 < Gtn
2 maxS
= 361,3421 ⇒ loại bỏ
Xem xét 4 phương sai còn lại :
2 maxS
= 242,1678
,756
3421
1678 ,242 8204 ,361 −
j
2 S max ∑ 2 S
= = 0,6123 Gtn =
2 maxS
= 242,1678 Glt = G0,95;3;8 = 0,4377 ; G0,99;3,8 = 0,5209 < Gtn⇒ loại bỏ
Xem xét 3 phương sai còn lại :
2 maxS
= 66,7086
54
,756
8204
,66
7086
,66 ,361
7086 3421
−
−
j
2 S max ∑ 2 S
= = 0,2029 Gtn =
Glt = G0,95;2;8 = 0,5157 > Gtn = 0,2029
i là đồng nhất ⇒ 3 phương sai còn lạ
Bảng số liệu bỏ đi 2 cột a3 và a5
T = 2933,1 - 462,2 – 528,6 = 1942,3
N = 40 – 16 = 24
k=3
SST = = 1412,6895
∑ − 2x ji
T 2 N
2
+
... ++
−
2 T k n
T N
2 T 1 n
2 T 2 n
1
2
k
SSF = = 339,5158
SSE = SST – SSF = 1073,1737
2S = 169,7579 (f = k-1 = 3-1 = 2) đs
ds
SSF 1k −
= MSF =
MSE =
=
2S = 51,1035 (f = N-k = 24-3 = 21) th
th
SSE kN −
2
2
Bước 3 : Kiểm định tính không đồng nhất của
thS và
dsS theo chuẩn Fisher :
2
F = tn
dsS S
2 th
*2 ds
11,98 =
F tn =
1185,40 = 98,87
S S *2
th
= 3,3218 > F0,95;2;21 = 3,47
Flt = F0,95;3;28 = 4,57 < 11,98
⇒ Các hiệu suất của a1, a2, và a4 không có sự khác biệt nhau.
Kết luận: Chấp nhận giả thiết thống kê H1, các halogenur alkyl có ảnh hưởng đến hiệu suất của phản ứng polimer hóa. Sau khi loại bỏ a3 và a5 thì các hiệu suất còn lại a1, a2, và a4 không có sự khác biệt nhau.
55
BÀI TẬP
1 . Kết quả phân tích hàm lượ ng (%) của H2SO4 do 3 nhóm sinh viên thực hiện như sau:
Nhóm 1: 79 6 8 94 89
N hóm 2: 71 77 81 88
Nhóm 3: 8 2 68 70 76
Kiểm định xem hà m l ượng trung bình của các nhóm thu được có giống nhau không?
2. Đánh gia hiệu suất của phương pháp chiết thuốc trừ sâu Basudin từ các hệ dung môi thu được kết quả sau (%):
OH: 78,4 72,2 71,6 73, 3 78,4 76,4 78,4 76,1 CH3CO
97,8 95, 8 93,9 98,8 98,8 97,8 CH3CO OH:CCl4 (1:1): 95,9 96,8
95,8 94,8 96,8 96,8 94,3 95,8 C H3COOH:CCl4(1:2): 96,8 95,5
Cho P=0,95
TÀI LIỆU THAM KHẢO
4- Doe rffel – Thống kê trong h óa học phân tích – NXB ĐH&THCN – 1983
h Long – Giáo trình “xử lý thống kê trong thực nghiệm hóa học” – ĐH 5- Cù Thàn ợ Tổng h p TP HCM 1991
g Hùng Th ắng – Thống kê và ứng dụng – NXB GD – 1999 6- Đặn