Chương 2: PHÂN TÍCH PHƯƠNG SAI

NG

L

I. KHÁI QUÁT VỀ PHÂN TÍCH PHƯƠ SAI (ANA YSIS OF VARIANCE)

1. Mục đích và ý nghĩa:

Cần phân biệt hai loại yếu tố ảnh hưởng đến giá trị của một số đo thực nghiệm : yếu tố cơ b n và yếu tố ngẫu nhiên. ả

• Yếu tố cơ bản : Bao gồm một nhóm các điều kiện cơ bản của thí nghiệm. Mỗi điều ược coi là một yếu tố cơ bản. Trong thí nghiệm Hóa học, yếu tố cơ bản thường là kiện đ làm dịch chuyển cân bằ yếu tố ng hóa học hoặc làm thay đổi vận tốc phản ứng. Thí dụ : nhiệt độ, áp suất, nông độ các chất xúc tác, nồng độ tác chất... là các yếu tố cơ bản. Mỗi ệ điều kiện cụ th ể của thí nghi m gọi là mức cố định của yếu tố cơ bản. Chẳng hạn, ảnh o sát ở hưởng của pH 3 mức cố định là pH = 2, pH = 3, pH = 4. được khả

Kh ể gâ ệm, với khoảng mức cố định đã chọn thì yếu tố cơ bản có hệ thống của giá trị trung bình. Nếu xét về mặt sai số thì i lập kế hoạch thí nghi y ra sự thay đổi có tính là yếu th yếu tố cơ bản tố có khả năng gây ra sai số hệ thống của phép đo.

nh phân tích giống hệt nhau, thường xảy ra có sự khác biệt h

người ta ch ấp nhậ Khi có nhiều phòng thí nghiệm cùng tham gia phân tích một mẫu đồng nhất bằng một ệ thống giữa các giá quy trì trị trung bình thu được bởi mỗi phòng thí nghiệm. Tình huống này rất hay gặp trong thực tế kiểm nghiệm. Khi đó n một yếu tố cơ bản đặc biệt gọi là “yếu tố phòng thí nghiệm” với số mức cố định bằng đúng bằng số phòng thí nghiệm tham gia.

Yếu tố ngẫu nhiên : Thể hiện khi lặp lại thí nghiệm với các điều kiện cơ bản ợc những giá trị đo khác nhau. Đây là sai số ngẫu nhiên “thuần nh của yếu tố

a thí nghiệm. Để ước lượng sai số ngẫu nhiên này với mỗi mức cố đị cần phải tiến hành một số thí nghiệm song song. không hề thay đổi, thu đư túy” củ c ơ bản

ựng ảnh hưởng đồ ng thời của yếu tố cơ bản và yếu tố ngẫu ỗi giá trị đo chứa đ ⇒ M n hiên.

Mục

ới nhau, giữa các y ếu tố cơ b

đích của phân tích phương sai là tách biệt và so sánh từng loại yếu tố đến giá trị ếu tố cơ bản với các yếu tố phát hiện một loạt ảnh hưởng

ản v , phân tích phươn sa còn cho phép g i đ n đặ o: ảnh hưởng giữa các y gẫu nhiên. Hơn nữa c biệt chỉ thể hiện khi có m ặt đồng thời hai hay nhiều yếu tố cơ bản.

Phâ

n tích phương sai được sử dụng rộng rãi trong Hóa phân tích để phát hiện và đánh giá vai trò của nguồn sai số khác nhau. Trong Hóa học nói chung, phân tích phương sai là m a ột công cụ để tìm ra định thí nghiệm. u hó trong hoạch các điều kiện t ối ư

Tùy theo số yếu tố cơ bản dự định đem khảo cứu, phân tích phương sai một yếu tố, ếu tố, nhiều yếu tố... Thông thường mỗi yếu tố được khảo cứu ít nhất với h ai mức cố

hai y định.

2. Nguyên tắc và thuật toán:

Sự th

• ị đo do mỗi yếu tố gây ra được đặc trưng bằng một do tương ứng. Phép so sánh ảnh hưởng của các yếu tố rút của giá tr ăng giáng c số tự phương sai mẫu với bậ thành phép kiểm định tính đồng nhất của các yếu tố.

46

Kiểm định tính đồ - ng nhất của 2 phương sai : chuẩn Fisher.

Kiểm định tính đồ nhấ của một dãy phương sai : - t ng chuẩn Bartlet hoặc Cochran.

Thuật toán : •

ai : Có hai loại phương sai đặc trưng của phân tích phương s

2 thS

: b iểu thị tác dụng của yếu tố ngẫ u nhiên “thuần túy” đến ương sai tái hiệ n

2

- Ph o. giá trị đ

dsS : biểu thị tác dụng chung của yếu tố ngẫu nhiê

- Phương sai đối sánh n và yếu tố cơ

b ản đến giá trị đo.

2 thS

2 dsS

và đồng nhất (theo Fisher) : yếu tố cơ bản không ảnh hưởng đến kết + Nếu

q uả đo.

2 thS

2 dsS

2 ds

2 thS

2 dsS

+ Nếu và không đồng nh ất, S lấn át , có thể tách thành hai phần

2

riê ng :

thS c a yếu ủ

2

tố ngẫu nhiên thuần túy ♣Thành phần

AS c

2

S

ủa yếu tố cơ bản A ♣Thành phần

i m

A đượ

2 ds

và S và c giải quyết dự a vào số lặp lại n ỗi mức j

2 Mối quan hệ giữa thS ủa yếu tố A , nếu ni đồng c

2

2

đều cho mọi mức (thí nghiệm đối xứng) thì:

2 A

dsS =

thS + n S

(n là số lần thí nghiệm song song)

II. PHÂN TÍCH PH

ƯƠNG SAI MỘT YẾU TỐ (SINGLE FACTOR)

Mục đích : Đánh giá sự ảnh hưởng của một yếu tố nào đó trên các giá trị trung bình

của kết quả đo

Gi k, m ả sử khảo sát ảnh hưởng của yếu tố cơ bản A với k mức cố định, đánh số j = 1, 2,... , ỗi mức tiến hành thí nghiệm song song đánh s ,... ,n = 1, ố i 2

1. Trình tự thực hiện:

Bước 1:

Lập bảng ghi kết quả đo xji và tính thêm các các dữ liệu cần thiết

...

j 1 2 k i

1 x 11 x21 xk1

...

n

k

2 x 12 x22 x k2

N

jin

∑∑=

1j =

... ... ... ...

1i =

n x1n x2n xkn

47

n

x

i

...

kx

1x

2x

x

j

∑ 1i == n

i

k

n

T

=

...

jT

ix

Tk T 1 T2

1j =

1i =

k

n

2

2

2

2

x

x

=

...

2 j

2 i

jx

kx

1x

2x

1i =

=1j

...

2s j

2 ks

2 1s

2 2s

Các ký hiệ u :

*Trung bì

nh

của mẫu

n

ix∑

x

j

== 1i n

i

= jT in

* Trung bình

chung:

x =

T N

* SST: Tổng bình phương chung (Total Sum of Squares)

2

2n

kn

1n

x(

2)x

2)x

x(

2)x

i1

2i

ki

2 ji

+ =

∑ − x

SST = ∑ −

∑ − x(

T N

=1i

1i =

=i 1

+….+ ∑

* SSF : Tổng bình phương do yế

u tố

(Sum of Squares for Factor)

2

k

2

...

)x

=

+

+

x(jn

j

SSF =

2 T k n

T N

2 T 1 n

T n

= 1j

2 2 + 2

k

1

* SSE : Tổng bình phương do sa

i số (Sum of Squares for Erro)

SSE = SST – SSF

* M F : Trung bình bình phương của yếu tố (Mean Square for

S

Factor)

(fđs = k-1 )

SSF 1k −

MSF = = S 2 ds

* M E : Trung bình bình phương c

S

ủa

sai số (Mean Square for

2

Erro)

MSE

=

=

thS (fth= N-k)

SSE kN −

* M T : Trung bình bình phươ

S

ng chung

(Mean Total Sum of quare)

48

S

2 Chung

SST 1N −

=

M ST = = (fchung = N-1)

f,PF

ds f,

th

S SF SSE

2 dsS 2 thS

) * Ftn= (Flt =

S

So sánh Ftnvà F lt

t

2 th

2 ds

S

: và S đồng nhất (theo Fisher) : + Nếu Ftn < Fl

2 chung

để biểu thị sai số ⇒ Yếu tố cơ bản A không ảnh hưởng đến kết quả đo.. Lấy

2S và

2S không đồng nhất (theo Fisher)

ngẫu nhiên của toàn bộ phép đo, với b ậc số tự do fchung = N - 1.

th

ds

+ Nếu Ftn > Flt :

Yếu tố cơ bản A ảnh hưởng đáng kể đến kết quả đo .Trong dãy giá tr ị trung ⇒ bìn h nhất định có một hoặc vài cặp có sai biệt hệ thống (tiến hành bước 2)

2

2

Tổ ng bình Thàn h phần Phương sai Nguồn gốc phương sai của phương sai Số b ậc tự do phương các độ lệch

AS

dsS =

2 thS

2

+ n

dsS =

SSF 1k −

2

2

k - 1 SSF Tác dụng chung của ố cơ bản và ngẫu yếu t nhiên (thí nghiệm đối xứng)

thS =

thS

SSE kN −

S

N - k SSE T ác dụng riêng của yếu tố ngẫu nhiên

S

2 Chung

2 chung

SST 1N −

= “Ngẫu nhiên hóa” mọi tác dụn của yếu tố cơ N- 1 g SST bản và ngẫu nhiên

Bước 2 :Kiểm định tính đồng nhất của phương sai theo chuẩn Bartlet hoặc

Cochran (khi thí nghiệm đối xứng các n =n):

j

2

Cần loại bỏ các phương sai lớn cho đến khi các phương sai còn lại đều đồng nhất

Bước

3 : Kiểm định tính không đồng nhất của

dsS t

S

F = tn

S

2 ds 2 th

F

và heo ch uẩn Fisher : S 2 th

F = lt

f,P

f,

th

ds

với fâs = k - 1 fth = k(n - 1)

lt

tn

và F : So sánh v ới F

tn

lt

ận : y ếu t ố A không có ảnh hưởng đáng kể đến các giá trị đo – Nếu F < F , kết lu (t rên các số đo còn lại sau khi loại bỏ ở bước 2)

49

lt

ưởng đáng ể đến giá trị đo. ó ảnh h k – Nếu Ftn > F , kết luận : yếu tố A c

Trong dãy giá trị trung bình nhất định có một hoặc vài cặp có sai biệt hệ thống., cần tiến hành bước 4 đ t giữa các giá trị trung bình. ể kiểm định s ai biệ

B ớc 4

ư

: Ki ểm định sự sai biệt hệ thống giữa các giá trị trung bình theo chuẩn

Duncan:

jx theo trình tự từ lớn

đến nh ỏ, đánh s ố b ậc r = 1, 2, ..., k; sau đó tiến Ta s ắp xếp l ại

h ành như ở phần chuẩn Duncan.

III

. BÀI TẬP ỨN

G DỤNG

1.

Bài tập 1:

ng Ca (%) trong mẫu đá vôi được xác định bằng 3 phương pháp khác ng bởi các phương pháp phân được có bị ảnh hàm lương C a thu hưở àm lượ H au. Hãy cho biết nh tích khác nhau không?

Bả ng kết quả:

12

10

11

12

12

9

PP1

12

14

15

16

PP2

12

11

13

10

PP3

Bước 1

: Lập bảng và ghi các dữ liệu cần thiết

Gi ả thi ết thống kê

ợng Ca không bị ảnh hưởng bởi phương pháp phân tích H0 : Hàm lư

(Các giá trị trung bình thu được xem như tương đương nhau)

H1 : Hàm lượng Ca bị ảnh hưởng bởi phương pháp phân tích

(Các giá trị trung bình thu đư ợc có sự khác biệt )

PP1

PP2

PP3

12

12

12

10

14

11

11

15

13

12

16

10

9

12

6

4

4

N

=14

nj

5

3

3

fj

50

jx

11

14,25

11.

5

66

57

46

T

2

jS

1,6

2,916667

1,666667

2

2 ji

SST = = 48,9286

∑ − x

T N

2

... ++

T n

T N

2 T 2 n

2 T 1 + n 1

2

2 k − k

SSF = = 27,1786

2

(f

SSE = SST – SSF = 21,75

đs = k-1 = 3-1 = 2)

dsS = 13,5893

SSF 1k −

2

MSF = =

MSE =

=

thS = 1,97

SSE kN −

S

73 (fth= N-k = 14-3 = 11)

0,95;2;1

1 = 3,98

F = tn

S

2 ds 2 th

= 6,8727 > F

ố phươ ng pháp phân tích có ảnh hưởn g đến kết quả đ o ⇒ Yếu t

ướ B c 2

f

Slog

j

2 j

: Kiể m định tính đồn g nhấ t của các p hươn g sai bằng chuẩ

PP1

PP2

PP

3

Slog

jf

2 j

n Barlet ∑

1,0206

1,3947

0,6655

3,0808

f

S

Sg

j log

2 j

2 th

B = 2,3 ) - ∑ 03( th lo f

2 2;95,0χ

= 5 ,99 ( f = k-1 = 2) B = 2,30 3(11. log1,9773 – 3,0 808) = 0, 4053 <

2

2

⇒ Các phương sai đồng nhất

ớc 3: Ki

thS và

dsS t eo chuẩn

S

ểm định tí nh kh ông đồng nhất của h Fishe r : Bư

F = tn

S

2 ds 2 th

= 6,8727 > F0,95;2;11 = 3,98

là không đồng nhất ⇒Yếu tố phương pháp phân tích

2 thS hưởng ến các kết qu

2 và dsS ả thu được

⇒ Các phương sai đ có ảnh

Bướ

c 4: Kiểm định sự sai biệt hệ thống giữa các giá trị trung bình theo chuẩn Duncan :

Lập bảng

51

r

1

2

3

jx

14,25

11,5

11

4

4

6

n j

x

Sth = 1,4062

th

thf;R;95,0Q

thf;R;99,0Q

′′−′ x j j S

n

th

′ ′′ n.n.2 j j ′′+′ n j j

và ( v ới f = 11 và R = r/ - r// + Qtn = Qlt =

jx′

jx ′′

1)

R

K(cid:31)t lu(cid:31)n

thf;R;95,0Q

thf;R;99,0Q

Qtn

14,25

11,5

2

3,91

3,12

4,4

>

11

3

5,06

3,26

4,64

>>

11

,5

11

2

0,78

3,12

4,4

Bảng điểm tổng kết:

PP

1

PP2

PP3

Ph

(cid:31)(cid:31)n ph g

áp

11

14,25

11,5

m l(cid:31)(cid:31)ng Ca

(%)

1

(cid:31)i(cid:31)m t

(cid:31)ng k(cid:31)t

1

41

Kết l ận: u

Bác bỏ giả thiết H0 , chấp nhận giả th

ịết H1.Nghĩa là hàm lượng Ca thu được từ 3 PP phân tích có sự khác biệt . Trong đó PP1 và PP3 xem như cho kết quả tương đương . nhau

hú ý: Ở đây chưa biết giá trị đ

úng của Ca nên không thể kết luận là PP nào cho

C kết quả đú

ng .

2. Bài tập

2:

7Br (a5) đến hiệu suất

4), C3H

Hãy so sánh ảnh hưởng của các halogenur alkyl CH3I (a1), C3H7I (a2), C4H9I (a3), (%) của phản ứng polimer theo cơ chế gốc tự do, C2H5Br (a dựa vào bảng số liệu đo hiệu suất :

52

1 2 3 4 5 j (a ) 1 (a ) 2 (a ) 3 (a ) 4 (a5) i

1 79,8 87,3 42,5 76,0 70,7

2 86,3 69,6 64,3 83,8 64,8

3 86,5 81,8 79,0 72,8 38,5

4 92,3 78,0 61,0 89,0 77,0

5 76,5 83,7 31,3 76,5 91,5

6 87,1 64,8 72,9 87,5 68,0

7 82,5 67,3 58,7 74,5 38,1

Giải :

8 90,0 7 5,5 52,5 93,2 80,0

Bước 1:: Lập bảng và ghi các dữ liệu cần thiết

Giả thiết thống kê

H0 : Các halogenur alkyl không ảnh hưởng đến hiệu suất

(Các hiệu suất thu được xem như tương đương nhau)

H1 : Các halogenur alkyl có ảnh hưởng đến hiệu suất

(Các hiệu suất thu được có sự khác biệt )

1 2 3 4 5 j (a1) (a2) (a3) (a4) (a5) i

1 79,8 87,3 42,5 76,0 70,7

2 86,3 69,6 64,3 83,8 64,8

3 86,5 81,8 79,0 72,8 38,5

4 92,3 78,0 61,0 89,0 77,0

5 76,5 83,7 31,3 76,5 91,5

6 87,1 64,8 72,9 87,5 68,0

7 82,5 67,3 58,7 74,5 38,1

8 90,0 75,5 52,5 93,2 80,0

jx

85,125 76 57,775 81,6625 66,075

681 608 462,2 653,3 528,6 Tj

53

2

T= ∑Tj = 2933,1

jS

27,4364 66,7086 242,1678 59,1655 361,3421

2

x

N = 40

2 ji

T N

2

+

... ++

= 9379,9397 SST =∑ −

2 T k n

T N

2 T 1 n

2 T 2 n

1

2

k

SSF = = 4082,196

2

SSE = SST – SSF = 5297,7437

(fđs = k-1 = 5-1 = 4)

dsS = 1020,549

SSF 1k −

2

MSF = =

MSE =

=

th= N-k = 40-5 = 35)

thS = 151,3641 (f

SSE kN −

2

F = tn

dsS S

2 th

= 6,7539 > F0,95;4;35 = 2,65

2

có ảnh hưởng đến hiệu suất của ph ản ứng (các hiệu suất thu ⇒ Yếu tố halogenur alkyl được có sự khác biệt nhau)

jS để kiểm định sự đ

ồng nhất

của

Chú ý: Nếu thí nghiệm đối xứng (nj = n), sử dụng giá trị các phương sai theo chuẩn Cochran

Bướ

c 2: Kiểm định sự đồng nh

ất của các phương sai theo chuẩn Cochran

2 maxS

= 361,3421

,361 ,756

3421 8204

j

2 S max ∑ 2 S

= = 0,4774 Gtn =

Glt = G0,95;k-1,n = G0,95;4;8 = 0,3910 ; G0,99;4;8 = 0,4627 < Gtn

2 maxS

= 361,3421 ⇒ loại bỏ

Xem xét 4 phương sai còn lại :

2 maxS

= 242,1678

,756

3421

1678 ,242 8204 ,361 −

j

2 S max ∑ 2 S

= = 0,6123 Gtn =

2 maxS

= 242,1678 Glt = G0,95;3;8 = 0,4377 ; G0,99;3,8 = 0,5209 < Gtn⇒ loại bỏ

Xem xét 3 phương sai còn lại :

2 maxS

= 66,7086

54

,756

8204

,66

7086

,66 ,361

7086 3421

j

2 S max ∑ 2 S

= = 0,2029 Gtn =

Glt = G0,95;2;8 = 0,5157 > Gtn = 0,2029

i là đồng nhất ⇒ 3 phương sai còn lạ

Bảng số liệu bỏ đi 2 cột a3 và a5

T = 2933,1 - 462,2 – 528,6 = 1942,3

N = 40 – 16 = 24

k=3

SST = = 1412,6895

∑ − 2x ji

T 2 N

2

+

... ++

2 T k n

T N

2 T 1 n

2 T 2 n

1

2

k

SSF = = 339,5158

SSE = SST – SSF = 1073,1737

2S = 169,7579 (f = k-1 = 3-1 = 2) đs

ds

SSF 1k −

= MSF =

MSE =

=

2S = 51,1035 (f = N-k = 24-3 = 21) th

th

SSE kN −

2

2

Bước 3 : Kiểm định tính không đồng nhất của

thS và

dsS theo chuẩn Fisher :

2

F = tn

dsS S

2 th

*2 ds

11,98 =

F tn =

1185,40 = 98,87

S S *2

th

= 3,3218 > F0,95;2;21 = 3,47

Flt = F0,95;3;28 = 4,57 < 11,98

⇒ Các hiệu suất của a1, a2, và a4 không có sự khác biệt nhau.

Kết luận: Chấp nhận giả thiết thống kê H1, các halogenur alkyl có ảnh hưởng đến hiệu suất của phản ứng polimer hóa. Sau khi loại bỏ a3 và a5 thì các hiệu suất còn lại a1, a2, và a4 không có sự khác biệt nhau.

55

BÀI TẬP

1 . Kết quả phân tích hàm lượ ng (%) của H2SO4 do 3 nhóm sinh viên thực hiện như sau:

Nhóm 1: 79 6 8 94 89

N hóm 2: 71 77 81 88

Nhóm 3: 8 2 68 70 76

Kiểm định xem hà m l ượng trung bình của các nhóm thu được có giống nhau không?

2. Đánh gia hiệu suất của phương pháp chiết thuốc trừ sâu Basudin từ các hệ dung môi thu được kết quả sau (%):

OH: 78,4 72,2 71,6 73, 3 78,4 76,4 78,4 76,1 CH3CO

97,8 95, 8 93,9 98,8 98,8 97,8 CH3CO OH:CCl4 (1:1): 95,9 96,8

95,8 94,8 96,8 96,8 94,3 95,8 C H3COOH:CCl4(1:2): 96,8 95,5

Cho P=0,95

TÀI LIỆU THAM KHẢO

4- Doe rffel – Thống kê trong h óa học phân tích – NXB ĐH&THCN – 1983

h Long – Giáo trình “xử lý thống kê trong thực nghiệm hóa học” – ĐH 5- Cù Thàn ợ Tổng h p TP HCM 1991

g Hùng Th ắng – Thống kê và ứng dụng – NXB GD – 1999 6- Đặn

56