CHƯƠNG 9 - ĐÁNH GIÁ SỐ LIỆU PHÂN TÍCH
lượt xem 57
download
Khi thiết kế và đánh giá một phương pháp phân tích, thường ta xem xét riêng lẻ 3 sai số thí nghiệm. Đầu tiên, trước khi phân tích, những sai số liên quan đến mỗi phép đo được đo lường để chắc rằng những lỗi này không ảnh hưởng đến quá trình phân tích. Thứ hai, trong quá trình phân tích, mọi thứ được kiểm soát chặt chẻ để chắc rằng số liệu đạt được là tin cậy.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: CHƯƠNG 9 - ĐÁNH GIÁ SỐ LIỆU PHÂN TÍCH
- CHƯƠNG 9 ĐÁNH GIÁ SỐ LIỆU PHÂN TÍCH Khi thiết kế và đánh giá một phương pháp phân tích, thường ta xem xét riêng lẻ 3 sai số thí nghiệm. Đầu tiên, trước khi phân tích, những sai số liên quan đến mỗi phép đo được đo lường để chắc rằng những lỗi này không ảnh hưởng đến quá trình phân tích. Thứ hai, trong quá trình phân tích, mọi thứ được kiểm soát chặt chẻ để chắc rằng số liệu đạt được là tin cậy. Sau cùng khi kết thúc phép đo, chất lượng quá quá trình đo và kết quả được đánh giá và so với với tiêu chuNn phân tích để chắc chắn số liệu. Chương này sẽ giới thiệu về nguồn, đánh giá các sai số trong quá trình phân tích, ảnh hưởng của những sai số trong quá trình đo lên kết quả và phân tích thống kê dữ liệu đạt được. Điều này rất quan trọng nhằm mục đích kiểm tra độ tin cậy trong phép đo, từ đó có những điều chỉnh phù hợp trong các quá trình đo tiếp theo. 9.1 Đo giá trị trung tâm 9.1.1 Giá trị trung bình ( X ) Là số giá trị đạt được từ tổng các giá trị đạt được từ phép đo riêng lẻ chia cho số lần lần đo n Xi X i 1 n Trong đó: n là số lần đo i là giá trị đo thứ i (i = 1, 2, 3, 4…) Ví dụ 9.1: Hàm lượng N-NO3- trong nước được xác định trong 7 lần lặp lại với nồng độ như sau: 3,080/ 3,094/ 3,107/ 3,056/ 3,112/ 3,174/ 3,198 mg/L Như vậy n = 7 X = (3,080 + 3,094 + 3,107 + 3,056 + 3,112 + 3,174 + 3,198)/ 7 = 3,117 mg/L 9.1.2 Giá trị giữa Là giá trị ở giữa khi số liệu của các lần phân tích được sắp xếp từ nhỏ nhất đến lớn nhất. Trong ví dụ 9.1 các giá trị được sắp xếp như sau: 3,056 3,080 3,094 3,107 3,112 3,174 3,198 Như vậy, 3,107 là giá trị giữa. Giá trị giữa (median) và giá trị trung bình (mean) cho biết ước lượng giống nhau về xu hướng trung tâm đối với tất cả các số liệu giống nhau về độ lớn. Đối với những dãy số liệu biến động lớn giữa số lần đo (quan sát) thì giá trị giữa và giá trị trung bình khác xa nhau. 9.2 Đo lường độ biến động của dãy kết quả 9.2.1 Độ biến động (range) Độ rộng của dãy số liệu w là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của dãy số liệu. Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 77
- Độ rộng dãy = w = Xnhỏ nhất – Xlớn nhất Độ rộng dãy cung cấp thông tin về tổng của sự thay đổi trong dãy số liệu nhưng không cung cung câp thông tin về sự phân bố của từng số liệu đơn lẻ. Ví dụ 9.2 Trong Ví dụ 9.1 hàm lượng N-NO3- trong nước được xác định trong 7 lần lặp lại với nồng độ như sau: 3,080/ 3,094/ 3,107/ 3,056/ 3,112/ 3,174/ 3,198 mg/L Như vậy: w = 3,198 mg – 3,056 mg = 0.142 mg 9.2.2 Độ lệch chuẩn tuyệt đối (s) (absolute standard deviation) và tương đối (sr) (relative standard deviation) Độ lệch chuẩn tuyệt đối s độ biến động của một giá trị đo đạt so với giá trị trung bình n ( X i X )2 s i 1 n 1 Trong đó: i là số thứ i trong tổng số n giá trị, X là giá trị trung bình. Thông thường độ lệch chuẩn tương đối sr cũng được sử dụng/ s sr X Độ lệch chuN tương đối thường được hiển thị bởi nhân với 100%. n Ví dụ 9.3: Ở ví dụ 9.1 hàm lượng N-NO3- trong nước được xác định trong 7 lần lặp lại với nồng độ như sau: 3,080/ 3,094/ 3,107/ 3,056/ 3,112/ 3,174/ 3,198 mg/L. Tính độ lệch chuN tuyệt đối và độ n lệch chuN tương đối? n Giá trị trung bình X = 3,117 mg/L (3,080 – 3,117)2 = (-0,037)2 = 0,00137 (3,094 – 3,117)2 = (-0,037)2 = 0,00053 (3,107 – 3,117)2 = (-0,010)2 = 0,00010 (3,056 – 3,117)2 = (-0,061)2 = 0,00372 (3,112 – 3,117)2 = (-0,005)2 = 0,00003 (3,174 – 3,117)2 = (+0,057)2 = 0,00325 (3,198 – 3,117)2 = (+0,081)2 = 0,00656 0,01556 Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 78
- Độ lệch chuN tuyệt đối: n 0,01556 s 0,051 7 1 Độ lệch chuN tương đối: n 0,051 sr 0,016 3,117 sr(%) = 0,016 × 100 = 1,6% 9.2.3 Phương sai (variance) Một giá trị khác để đo độ biến động của số liệu là phương sai. Phương sai bằng bình phương của độ lệch chuN tuyệt đối. n Trong Ví dụ 9.3 thì phương sai sẽ là: Phương sai = s2 = (0,051)2 = 0,0026 9.3 Tính chất của sai số phân tích 9.3.1 Độ đúng Độ đúng trong phân tích là sự đo lường mức độ gần của giá trị đo với nồng độ thực tế của một chất là đúng hoặc giá trị đó được chấp nhận µ. Độ đúng thường được hiển thị bằng sai số tuyệt đối (absolute error) E. E= X -µ hoặc phần trăm sai số tương đối (percent relative error) Er X Er 100 Những sai số ảnh hưởng lên độ đúng trong phân tích được dọi là xác định (determinate) thường được mô tả như là một sai số hệ thống (systematic error). Sai số xác định dương xãy ra khi giá trị trung tâm lớn hơn giá trị (nồng độ) thực tế của mẫu. Sai số xác định âm xãy ra khi hía trị trung tâm nhỏ hơn giá trị thực tế của mẫu. Sai số xác định được chia thành 4 loại: sai số do lấy mẫu (sampling error), sai số do phương pháp (method error), sai số đo lường (measurement error), sai số do cá nhân người phân tích (personal error). 9.3.2 Sai số xác định (determinate error) Sai số thu mẫu (sampling error): Sai số trong thu mẫu là lỗi thường hay gặp nhất và ảnh hưởng lớn nhất đến kết quả đánh giá một chỉ tiêu môi trường. Ví dụ như thu mẫu để đánh giá chất lượng nước ở một lưu vực sông, nhưng điểm thu mẫu lại gần các nguồn gây ô nhiễm như điểm thải ra của nhà máy công nghiệp, cống thoát ở khu dân cư. Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 79
- Sai số do phương pháp (method error): Đây là sai số khi chọn lựa phương pháp phân tích mẫu. Ví dụ đối với một chỉ tiêu thì sai số của mỗi phương pháp sẽ khác nhau như phương pháp so màu, phương pháp chuN độ, phương n pháp hấp thụ huỳnh quang… Hơn nửa trong mỗi phương pháp thì thuốc thử, độ tinh khiết của hoá chất cũng dẫn đến sai số trong phương pháp. Sai số phương pháp có thể được hạn chế bằng cách tiêu chuN hoá phương pháp, sử dụng hoá chất có độ tinh khiết cao. Tuy nhiên, sai n số phương pháp do sự “nhiểm bN (interference) thì không thể kiểm soát được, và để hạn chế n” điều này có thể xác định bằng cách làm mẫu trắng (nước cất) sau đó trừ ra. Lỗi đo lường (measurement error): Đây là lỗi do thiết bị như dụng cụ thuỷ tinh, cân, các thiết bị đo pH, nhiệt độ, EC… Ví dụ một bình định mức 25 mL có thể có sai số tối đa là 0,03 mL (được cung cấp bởi nhà sản xuất). Như vậy thể tích thực và khoảng sai số chấp nhận khi dùng bình này để phân tích sẽ là 24,97 – 25,03 mL. Bảng 9.1 Sai số của dụng cụ thuỷ tinh Sai số đo lường Dụng cụ Thể tích (mL) Loại A (± mL) Loai B (± mL) 1 0,006 0,012 2 0,006 0,012 5 0,01 0,02 10 0,02 0,04 Pipette 20 0,03 0,06 25 0,03 0,06 50 0,05 0,01 5 0,02 0,04 10 0,02 0,04 25 0,03 0,06 50 0,05 0,10 100 0,08 0,16 Bình định mức 250 0,12 0,24 500 0,20 0,40 1000 0,30 0,60 2000 0,50 1,00 10 0,02 0,04 Burette Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 80
- 25 0,03 0,06 50 0,05 0,10 Bảng 9.2 Sai số đo lường của cân Cân Tải trọng (g) Sai số đo lường 160 ± 1 mg Precisa 160 M 120 ± 0,1 mg A & D ER 120 M 160 ± 0,01 mg Metler H54 Bảng 9.3 Sai số đo lường của micropipette Loại micropipette Thể tích (mL hoặc µL) Sai số đo lường (± %) 10 1,0 50 0,6 10 – 100 µL 100 0,6 200 1,5 200 – 1000 µL 1000 0,8 1 0,6 5 0,4 1 – 10 mL 10 0,3 Sai số cá nhân phân tích (personal error): Kết quả phân tích cũng tuỳ thuộc vào người phân tích và sai số trong phân tích tuỳ theo kỷ năng người phân tích trong sự nhật biết màu, xác định điểm dừng chuN độ. Sai số này có thể n được hạn chế là cN thận trong phân tích. n 9.3.2 Nhận biết sai số xác định Sai số xác định có thể khó để xác định vì chúng ta không biết được giá trị thực của mẫu phân tích. Tuy nhiên, một vào sai số xác định có thể được nhận biết thông quan việc phân tích mẫu lặp lại với thể tích mẫu khác nhau để xem mức độ tương quan. Độ lớn của hằng số sai số xác định thì giống nhau đối với tất cả các mẫu vì vậy rất có ý nghĩa khi phân tích mẫu với thể tích phân tích nhỏ. Hằng số sai số xác định (contanst determinate error) có thể được phát hiện thông qua việc chạy mẫu với các thể tích mẫu khác nhau để phát hiện sự sai số hệ thồng trong quá trình phân tích. Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 81
- Hằng số sai số xác định có thể là sai số xác định âm (negative determinate error) và cũng có thể sai số xác định dương (negative determinate error), được thể hiện ở Hình 4.1. H ằng số sai số dươ ng % w/w phân tích % w/w th ực phân tích củ a mẫu Hằng số sai số âm N ồng độ mẫu Hình 9.1: Ảnh hưởng của hằng số sai số lên nồng độ báo cáo của một hợp chất Ngoài các sai số trên, trong phân tích còn có sai số tiềm năng (potential error), đây là một sai số khi pha chất chuN (standard sample). Đây là sai số cũng khá nguy hiểm dẫn là nguyên n nhân dẫn đên sai số xác định dương (positive) hoặc âm (negative). 9.4 Độ chính xác Độ chính xác thường được dùng để chỉ độ biến động của các giá trị phân tích trong cùng một mẫu so với giá trị thực của mẫu đó. Độ chính xác thường liên quan đến độ biến động (range), độ lệch chuN (standard deviation), phương sai (variance). Độ chính xác thường được chia n thanh 2 loại: khả năng lặp lại (repeatability) và khả năng ổn định (reproducibility). Khả năng lặp lại là độ chính xác đạt được khi phân tích lập lại một chất nào đó trong cùng điều kiện phòng thí nghiệm, môi trường hoá chất trong một khoảng thời gian phân tích nào đó (ví dụ như phân tích lặp lại 10 lần/ mẫu để đánh giá số liệu). Khả năng ổn định là độ chính xác đạt được khi phân tích một chất được thực hiện ở các điều kiện khác nhau như phòng thí nghiệm khác nhau, khoảng thời gian khác nhau (ví dụ hôm nay nay phân tích 3 lần lặp lại, ngày mai phân tích cũng cùng mẫu đó ở cùng phòng hay khác phòng thí nghiệm cũng với 3 lần lặp lại…) để đánh giá reproducibility. Sai số bất định: Sai số bất định không ảnh hưởng đến độ đúng (accuracy) vì sai số bất định phân tán ngN u nhiên xung quanh giá trị trung tâm (central value), nhưng chúng ảnh hưởng đến độ chính xác (precision). Nguồn của sai số bất định: Sai số bât định là do sai số do mẫu và sai số do thao tác khi lấy mẫu, do thiết bị đo: Sai số do mẫu: sai số này với sai số xác định trong thu mẫu (sampling error) trong phần 9.3.2. Đây là loại sai số trong lấy mẫu để phân tích chứ không phải là sai số trong quá trình lấy mẫu ngoài hiện trường. Sai số này gặp khi lắc mẫu không đều, Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 82
- mẫu không đồng nhất khi pipet mẫu vào ống nghiệm để phân tích. Sai số này cũng do dụng cụ thu mẫu gây ra. Ví dụ khi thu mẫu, chai lọ không được rữa sạch, dính bụi dơ, ảnh hưởng đến mẫu. Sai số do thao tác xử lý mẫu: đây là loại sai số khi lấy mẫu dùng quá nhiều loại pipet khác nhau dẫn đến sự không đồng nhất giữa các mẫu. Mặt khác một số loại mẫu cần phải xử lý trước khi phân tích, do đó sai số này không thể xác định được. Sai số do thiết bị/ dụng cụ: đây là sai số liên quan đến thiết bị khi phân tích và thang đọc của nó. Hình 9.2 thể hiện rõ nhất sai số bất định do thiết bị/ dụng cụ gây nên vì nhiều giá trị ta không thể đọc chính xác. ? Hình 9.2. Sai số bất định trong phân tích Đánh giá sai số bất định: Sai số bất định là không thể loại trừ, ảnh hưởng của nó có thể được giới hạn ở mức thấp nhất nếu nguồn, và mức độ tương đối của nó được biết. Sai số bất định cũng có thể được ước lượng thông qua việc đo lường sự biến động của như sử dụng độ lệch chuN trong vài trường n, hợp thì sai số bất định cũng được ước lượng. 9.5 Sai số (error) và sự không chắc chắn (uncertainty) 9.5.1 Phân biệt sai số và sự không chắc chắn Trong phân tích cần phải phân biệt rõ ràng 2 khái niệm sự sai số và sự không chắc chắn. Sai số: là sự khác khác nhau giữa các lần đo riêng lẻ với nhau, hoặc kết quả và giá trị thực của nó. Hay nói cách khác sai số là một quá trình đo sự sai lệch (“error is a measure of bias”). Mặc dù ta có thể hạn chế, triệt tiêu sai số xác định nhưng sai số bất định vẫn tồn tại. Sự không chắc chắn (uncertainty): thể hiện thang mà số liệu có thể phân bố, khi đó các quá trình đo đạc hoặc kết quả có thể như mong đợi. Lưu ý rằng định nghĩa độ không chắc chắn (uncertainty) không giống như độ chính xác (precision). Sự không chắc chắn thể hiện tất cả các sai số, kể cả sai số xác định và bất định mặc dù trong phân tích ta luôn có gắng để giảm sai số xác đinh, còn sai số bất định xảy ra ngẫu nhiên. Để minh chứng sự khác nhau giữa sự không chắc chắn và độ chính xác, ta cùng xem ví dụ: Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 83
- Ví dụ 9.4: Ta sử dụng 1 pipet 10 mL để hút hoá chất, sự không chắc chắn của pipet là thang thể tích của pipet này. Cụ thể là bạn mua pipet này từ một công ty không có sự điều chỉnh thể tích (volume calibration) của pipet, dẫn đến thang chia trên pippet không đúng với thể tích thực. Còn độ chính xác (precision) là bạn sử dụng cây pippet này hút hoá chất và đo lượng thể tích của dung dịch hoá chất một số lần để độ chính xác của pippet này và thường thể hiện ở độ lệch chuN (standard deviation). n Quá trình lan truyền của sự không chắc chắn (propagation of uncertainty) Ví dụ 9.5: Chúng ta có một cây pippet 10 ml, sau 10 lần đo kiểm tra, ta được thể tích trung trình của pipette này là X = 9,992 mL với độ lệch chuN s = 0,006 mL. n Sự không chắc sẽ như thế nào nếu ta hút mẫu 2 lần? Kết quả là: (9,992 mL + 9,992 mL) ± (0,006 mL + 0,006 mL) = 19,984 ± 0,012 mL 9.5.2 Sự không chắc chắn đối với các chức năng toán học khác Ta cần biết qua hai khái niệm sự không chắc tương đối SR (relative uncertainty) và sự không chắc tuyệt đối R (absolute uncertainty). Nhiều khía cạnh của toán học được áp dụng trong hoá học phân tích như luỹ thừa, căn, logarithms… Theo từng chức năng mà sự không chắc mà sự không chắc tương đối SR được tính dựa vào Bảng 9.4 dưới đây: Bảng 9.4 Bảng chức năng độ không chắc chắn tương đối Chức năng SR R = kA SR = ksA R=A+B SR S A SB 2 2 R=A–B SR S A SB 2 2 2 2 S S SR A B R=A×B R A B A 2 2 S S SR R= A B B R A B R = ln(A) SA SR A R = log(A) SA S R 0,4343 A Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 84
- R = eA SR SA R R = 10A SR 2,303 S A R R = 10k SR S A k R A Ví dụ 9.6: Một dung dịch HCl có pH đo đạt được là 3,72 ± 0,03 (SA = ± 0,03). Hãy tính nồng độ [H+] và độ không chắc chắn tuyệt đối SA của nó. Giải quyết vấn đề: Nồng độ mol của ion H+ là: [H+]=10–pH =10–3,72 = 1,91 × 10–4 M Từ Bảng 9.4, sự không chắc tương đối trong nồng độ ion [H+] là: SR = 2,303 × SA = 2,303 × 0,03 = 0,069 R và độ không chắc tuyệt đối là: R = (1,91 × 10–4 M) × (0.069) = 1,3 × 10–5 M 0,13 × 10–4 M Chúng ta báo cáo nồng độ ion [H+] và độ không chắc tuyệt đối là: 1,9 (± 0.1) × 10–4 M. 4.5.3 Lợi ích của việc tính toán độ không chắc chắn tương đối (relative uncertainty)? Để dễ hiểu ta xem Ví dụ 9.7 dưới đây: Ví dụ 9.7: Sử dụng cách nào khi chuN bị một dung dịch Na2S2O3 có nồng độ 0,001N từ một dung dịch n mẹ 0,1N để có độ không chắc chắn tương đối là thấp nhất? a) Cách a: Làm 1 bước: lấy pippet 1 mL hút 1 mL dung dịch 0,1 N cho vào bình định mức 1.000 mL. Định mức lại thành 1.000 mL. b) Cách b: Làm 2 bước: hút 20 mL dung dịch mẹ 0,1 N pha thành 1,000 mL. Sau đó, hút 25 mL dung dịch mới pha, tiếp tục pha với nước cất thành 500 mL. Cho biết độ sai số ghi trên các dụng cụ trên là: Pipet 1ml: ± 0,006 mL Pipet 25 mL: ± 0,03 mL Bình định mức 500 mL: ± 0,2 mL Bình định mức 1000 mL: ± 0,3 mL Giải quyết vấn đề: Nồng độ N của dung dịch Na2S2O3 0,001 N có thể được hiển thị theo 2 cách bằng công thức: Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 85
- Na = (0,1 N × 1 mL)/1000 mL Nb = (0,1 N × 20 mL × 25 mL)/(1000 mL × 500 mL) Sử dụng độ sai số của pippet và độ không chắc chắn SR ở Bảng 9.4 ta được: 2 2 SR 0,006 0,3 0,006 R Na 1000 1000 2 2 2 2 SR 0,03 0,03 0,2 0,3 0,002 R Nb 20 25 500 1000 Kết luận: Bởi vì độ không chắc chắn tương đối của cách 2 nhỏ hơn cách 1, nên phương pháp pha loãng 2 bước như cách 2 sẽ có độ chính xác cao hơn. 4.6 Sự phân bố của kết quả phân tích Trong phân tích ta thường phân tích lập lại một vào lần, và chúng ta sẽ báo cáo số liệu như thế nào khi số liệu phân tích của các các lần lạp lại quá phân tán so với giá trị trung tâm (central value) vì khi phân tích không phải số liệu nào ta cũng lấy. Như vậy ta phải tính toán để xem các giá trị có gần với giá trị trung tâm không, và giá trị nào nằm ngoài sự phân bố của dãy dữ liệu đạt được. Tổng thể (population) và mẫu (sample) Tổng thể là toàn bộ những chỉ tiêu, mẫu nước mà chúng ta cần phân tích để đánh giá chất lượng môi trường ở một vùng nào đó. Trong tổng thể này ta một số chỉ tiêu, những điểm thu mẫu đại diện nào đó thì gọi là mẫu vì ta không thể lấy hết tổng thể để phân tích. Ví dụ 9.8: Để so sánh chiều cao và trọng lượng của sinh viên ở 2 khoa Thuỷ sản và Công nghệ, Trường Đại học Cần Thơ. Thì số lượng sinh viên của mỗi khoa được gọi là tổng thể (population). Tuy nhiên, do số lượng sinh viên quá đông nên không thể đo hết. Do đó chọn ngẫu nhiên 100 SV ở mỗi khoa để đo chiều cao và trọng lượng, như vậy 100 sinh viên ở mỗi khoa được gọi là mẫu (samples). Ví dụ 9.9: Để đánh giá chất lượng nước của tuyến sông Hậu, phục vụ cho công tác qui hoạch nuôi cá Tra bè đến năm 2015 của tỉnh Vinh Long. Chất lượng nước sông Hậu thay đổi theo triều cường (nước ròng, nước lớn) hoặc theo mùa lũ. Toàn bộ lưu vực nước ở tất cả các thời điểm trên được gọi là tổng thể. Tuy nhiên, do không có thời gian và kinh phí, ta chỉ quan trắc môi trường vào các thời điểm trên và chỉ thu mẫu ở một số điểm được xem là đại diện và đặc trưng của lưu vực nước, như vậy ta gọi là lấy mẫu (sample). Phân phối chuẩn (normal distribution): Phân phối chuN (normal distribution) được nêu ra bởi một người Anh gốc Pháp tên là n Abraham de Moivre (1733). Sau đó Gauss, một nhà toán học ngưới Đức, đã dùng luật phân Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 86
- phối chuN để nghiên cứu các dữ liệu về thiên văn học (1809) và do vậy cũng được gọi là n phân phối Gauss. Hai thông số quan trọng trong một phân phối là giá trị trung tâm hay gọi là trung bình µ và phương sai σ2 (hoặc độ lệch chuN σ) và thường biểu thị bằng X ~ N (µ, σ2) (N viết tắt từ n normal). X 1 f X 2 2 e 2 2 Độ tự do df (degree of freedom): Ở đây ta cần phân biệt 2 trường hợp rất dễ nhầm lẫn đó là phương sai của tổng thể và phương sai của mẫu. Phương sai của tổng thể (population’s variance): X n 2 i 2 i 1 n Trong đó: n là số mẫu, µ là giá trị trung bình, Xi là giá trị mẫu thứ i Phương sai của mẫu (sample’s variance): X X n 2 i 2 i 1 s n 1 Một thông số hiện thân cho phương sai của mẫu và tổng thể gọi là độ tự do df được sử dụng. df = n – 1 Đối với tổng thể (population) thì độ tự do df luôn luôn bằng số mẫu n (tức là không trừ đi 1). 9.7 Phân tích thống kê số liệu Kiểm tra sự khác biệt: Trong phân tích, làm sao so sánh mức độ tin cậy của 2 phương pháp, kiểm tra đánh giá nồng độ dung dịch, kiểm tra độ tin cậy của một số liệu trong quá trình phân tích. Trong trường hợp này ta phải dùng đến phương pháp thống kê trong phân tích mơi đánh giá được. Đối với kết quả phân tích được ta có các dạng phân bố của 2 dãy số liệu (2 nghiệm thức khác nhau, 2 phương pháp khác nhau…) như sau: Giá trị Giá trị Giá trị Khác biệt ý nghĩa? Khác biệt có ý nghĩa Khác biệt không ý Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 87
- Hình 9.3. Mối qua hệ giữa 2 tổng thể Hình 9.3a cho thấy 2 giá trị trung bình hoàn toàn tách biệt nhau nên ta dễ dàng kết luận trung bình 2 nghiệm thức khác biệt nhau có ý nghĩa thống kê. Tương tự vậy Hình 9.3b cho thấy 2 trung bình gần trung với nhau nên ta dễ dàng kết luận. Tuy nhiên Hình 9.3c sẽ làm cho ta phân vân, và nếu chúng khác biệt thì ở độ tin cậy 95 hay 99%?. Xây dựng một phép kiểm tra trong phân tích: Một kiểm tra khác biệt trong phân tích được thiết kế nhằm để xác định có hay không sự khác biệt giữa 2 hay nhiều giá trị mà nguyên nhân do các sai số không xác định gây nên (undeterminate error). Như vậy để thực hiện ta có 2 giả thuyết: Ho (null hypothesis): là giả thuyết mà những sai số không xác định đủ để làm cho hai nghiệm thức khác biệt không ý nghĩa HA (alternative hypothesis): là giả thuyết đưa ra để chúng minh sự khác biệt giữa 2 giá trị trung bình của tổng thể là quá lớn, và những sai số không khác định trong phân tích là khác nhau. Mức ý nghĩa và độ tin cậy: Mức ý nghĩa (significance level) (α) là một đại lượng thể hiện mức độ tin cậy (confidence level) khi ta chấp nhận một giả thuyết Ho hoặc HA. Confidence level 1 100 Ví dụ 9.8: Sau khi phân tích thông kê ta kết luận hai nghiệm thức khác biệt ở mức ý nghĩa α = 0,05. Có nghĩa là 95% ta tin tưởng vào kết luận này. 4.8 Phương pháp thống kê đối với phân phối chuẩn: 4.8.1 So sánh trung bình ( X ) với một giá trị biết trước (µ) Phương pháp cho sự đánh giá một phương pháp phân tích mới là phương pháp một môt chuN n biết trước nồng độ µ, bằng cách phân tích để xác định nồng độ mẫu chuN này một số lần. n Công thức quá trình kiểm tra: X n texp s Ví dụ 9.9: Trước phi phân tích hàm lượng CO32- trong nước. Một sinh viên phân tích một mẫu chuN có n 2- chứa hàm lượng CO3 có nồng độ 98,76%. Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 88
- Các giá trị đạt được của 5 lần phân tích lặp lại như sau: 98,71% 98,59% 98,62% 98,44% 98,58% Với α = 0,05 (độ tin cậy 95%), hãy cho biết kết quả của sinh viên chấp nhận hay không? Giải quyết vấn đề: Ta có: Trung bình ( X ) = 98,59. Độ lệch chuN (s) = 0,0973. n Độ tự do df = n – 1 = 5 – 1 = 4 Như vậy ta có 2 giả thuyết: Giả thuyết 2: HA: X µ Giả thuyết 1: Ho: X = µ (Khác biệt không ý nghĩa) (Khác biệt có ý nghĩa) Ta áp dụng công thức trên: X n 98,76 98,59 5 texp 3,91 s 0,0973 Ta tìm giá trị t(0,05, 4) trong Bảng 4.8 bên dưới ta có: t(0,05, 4) = 2,78. Như vậy ta có texp > t(0,05, 4), ta loại bỏ giả thuyết Ho và chấp nhận giả thuyết HA. Ta có kết luận: sai số không xác định trong phân tích đã ảnh hưởng đến quá trình phân tích của sinh viên này. Bảng 4.8 Bảng giá trị chuẩn Student t 90% 95% 98% 99% Độ t ự d o 0.10 0.05 0.02 0.01 1 6.31 12.71 31.82 63.66 2 2.92 4.30 6.96 9.92 3 2.35 3.18 4.54 5.84 4 2.13 2.78 3.75 4.60 5 2.02 2.57 3.36 4.03 6 1.94 2.45 3.14 3.71 7 1.89 2.36 3.00 3.50 8 1.86 2.31 2.90 3.36 9 1.83 2.26 2.82 3.25 10 1.81 2.23 2.76 3.17 Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 89
- 12 1.78 2.18 2.68 3.05 14 1.76 2.14 2.62 2.98 16 1.75 2.12 2.58 2.92 18 1.73 2.10 2.55 2.88 20 1.72 2.09 2.53 2.85 30 1.70 2.04 2.46 2.75 50 1.68 2.01 2.40 2.68 1.64 1.96 2.33 2.58 9.8.2 So sánh 2 giá trị trung bình: Trong phần sai số ta đã biết kết quả phân tích bị ảnh hưởng bởi nhiều nguyên nhân: sai số do thu mẫu, do phương pháp, do dụng cụ, hoá chất và kể cả sai số của từng cá nhân phân tích (kiểm nghiệm viên). Đối với dạng so sánh này ta có công thức: n A 1s A nB 1sB XA XB 2 2 s pool texp và n A nB 2 1 1 s pool n n A B Độ tự do df = (nA + nB) – 2 Ví dụ sau đây thể hiện rõ nhất về so sánh 2 giá trị trung bình: Ví dụ 9.10: Hàm lượng NO3- trong nước được xác định bằng 2 phương pháp khác nhau (A và B) trong cùng một mẫu nước thu. Và đạt được kết quả như sau: Phương pháp A Phương pháp B 3,080 3,052 3,094 3,141 3,107 3,083 3,056 3,083 3,112 3,046 3,174 3,198 3,117 3,081 Trung bình X Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 90
- Độ lệch chuN s n 0,00259 0,00138 Số quan sát n 7 5 Với độ tinh cậy 95%, hãy xác định 2 phương pháp phân tích khác nhau có ý nghĩa hay không? Giải quyết vấn đề: Tính trung bình, độ lệch chuN được tính và thể hiện ở bảng trên. n Độ tự do df = (7 + 5) – 2 = 10 Ta có 2 giả thuyết: Giả thuyết 2: HA: X A X B Giả thuyết 1: Ho: X A = X B (Khác biệt không ý nghĩa) (Khác biệt có ý nghĩa) Áp dụng công thức ta có: n A 1s A nB 1sB 7 10,00259 5 10,00138 0,0459 2 2 s pool n A nB 2 752 và: XA XB 3,117 3,081 texp 1,34 1 1 1 1 0,0459 s pool n n 7 5 A B Ta tìm giá trị t(0,05, 10) trong Bảng 9.8 ta có: t(0,05, 10) = 2,23. Như vậy ta có texp < t(0,05, 10), ta chấp nhận giả thuyết Ho. Nghĩa là 2 phương pháp này phân tích cho kết quả không khác biệt nhau. 9.8.3 Số liệu cặp đôi (pair data): Trong một số trường hợp sự biến động số liệu trong cùng một phương pháp hoặc một nghiệm thức biến động hơn sự khác biệt giữa hai giá trị trung bình của 2 dãy số liệu. Lúc này nến ta xử lý thống kê để so sánh sự khác biệt sẽ không đúng. Ví dụ so sánh 2 phương pháp khi thu mẫu ở các thuỷ vực khác nhau. Hàm lượng chất nào đó trong các thuỷ vực biến động quá lớn, từ đó sẽ không đánh giá được phương pháp. Hãy xem ví dụ dưới đây: Ví dụ 9.11: Để đánh giá của một hợp chất hoá học lên hàm lượng chất rắn hoà tan (TDS) trong môi trường nước nước thải từ ao nuôi cá Tra bằng cách sử dụng 2 phương pháp (phương pháp trọng lượng và đo bằng điện cực). Mẫu được thu ở nhiều lần ở thời gian khác nhau và đạt được kết quả sau: PP trọng lượng (ms/cm2) PP điện cực (ms/cm2) Mẫu Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 91
- 1 129,5 132,3 2 89,6 91,0 3 76,6 73,6 4 52,2 58,2 5 110,8 104,2 6 50,4 49,9 7 72,4 82,1 8 141,4 154,1 9 75,0 73,4 10 34,1 38,1 11 63,3 60,1 Hãy xác định xem 2 phương pháp trên có khác biệt nhau về kết quả phân tích hay không? Giải quyết vấn đề: Đây là một ví dụ điển hình của số liệu cặp đôi. Trong trường hợp này ta không thể cộng và tính trung bình ( X ) để so sánh thống kê trung bình như Ví dụ 9.10 được vì theo thời gian TDS sẽ biến động do ảnh hưởng của hoá chất xử lý. Trong trường hợp này ta phải tính độ chên lệch giữa 2 phương pháp, kí hiệu là d. d = XPP trọng lượng – XPP điện cực Ta có thể tính d cho mỗi mẫu: PP điện cực (ms/cm2) Mẫu PP trọng lượng Khác biệt (d) (ms/cm2) 1 129,5 132,3 2,8 2 89,6 91,0 1,4 3 76,6 73,6 -3,0 4 52,2 58,2 6,0 5 110,8 104,2 -6,6 6 50,4 49,9 -0,5 7 72,4 82,1 9,7 8 141,4 154,1 12,7 9 75,0 73,4 -1,6 10 34,1 38,1 4,0 Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 92
- 11 63,3 60,1 -0,2 Trung bình 2,25 Độ lệch chuN s n 5,63 Độ tự do df = n – 1 = 11 – 1 = 10 Ta có 2 giả thuyết: HA: dtb 0 Ho: dtb = 0 Ta có: dn 2,25 11 texp 1,33 sd 5,63 Dò vào Bảng 9.8 ta có t(0,05, 10) = 2,23 > texp = 1,33, do đó chấp nhận giả thuyết Ho. Nghĩa là: hai phương pháp này khác nhau có không ý nghĩa. 9.8.4 Số liệu “out” (outliers) Trong phân tích lặp lại trong cùng một mẫu hoặc giữa các lần lặp lại trong cùng một nghiệm thức ta thu được nhưng nhiều số liệu với giá trị khác nhau. Đôi khi ta thu được 1 số liệu quá cao, hoặc quá thấp so với dãy số liệu đạt được. Đôi khi ta không biết có nên loại bỏ (reject) số liệu này hay không. Vì vậy ta phải tính toán để đi đến kết luận một cách khoa học. Một phương pháp thông thường để chứng minh một giá trị gọi là “out” là Dixon’s Q-Test. Ta có công thức: - Đối với số nhỏ nhất: X 2 X1 Qexp X n X1 - Đối với số cao nhất: X n X n1 Qexp X n X1 Trong đó n là số lần lặp lại của một phép phân tích hay một nghiệm thức nào đó. Nếu Qexp > Qlý thuyết trong Bảng 9.9 thì chấp nhận giả thuyết HA, và số liệu cần được loại bỏ. Bảng 9.9: Bảng giá trị Q-Test N/α 0.1 0.05 0.04 0.02 0.01 0.941 0.970 0.976 0.988 0.994 3 0.765 0.829 0.846 0.889 0.926 4 Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 93
- 0.642 0.710 0.729 0.780 0.821 5 0.560 0.625 0.644 0.698 0.740 6 0.507 0.568 0.586 0.637 0.680 7 0.468 0.526 0.543 0.590 0.634 8 0.437 0.493 0.510 0.555 0.598 9 0.412 0.466 0.483 0.527 0.568 10 Xem ví dụ sau: Ví dụ 9.12: Một sinh viên phân tích hàm lượng NO3- trong nước 9 lần lặp lại, với số liệu như sau: 3,067 3,049 3,039 2,514 3,048 3,079 3,094 3,109 3,102 Bằng Dixon’s Q-Test, hãy tìm xem số liệu 2,514 có nằm ngoài (outlier) và cần phải loại bỏ? Giải quyết vấn đề: Trước tiên, ta cần sắp xếp dãy số liệu trên theo thứ tự từ nhỏ đến lớn: 1 2 3 4 5 6 7 8 9 2,514 3,039 3,048 3,049 3,067 3,079 3,094 3,102 3,109 Áp dụng công thức đối với số nhỏ nhất, ta có: X 2 X 1 3,039 2,514 Qexp 0,882 X 9 X 1 3,109 2,514 Dò tìm giá trị Q(0,05, 9) trong Bảng 9.9 ta được Q(0,05, 9) = 0,493 < 0,882. Do đó ta chấp nhận giả thuyết HA. Nghĩa là số 2,514 đã “out” so với dãy số liệu đạt được, vì vậy có thể loại bỏ số liệu này. 4.9 Giới hạn phát hiện (Detection Limits) Phần cuối của chương này là đánh giá khả năng của một phương pháp trong việc phát hiện một chất ở nồng độ cực thất (hàm lượng vết – trace amount). Giới hạn phát hiện của một phương pháp (method’s detection limit) là một lượng hoặc một nồng độ nhỏ nhất mà phương pháp có thể phát hiện đáng tin cậy. Theo định nghĩa của International Union of Pure and Applied Chemistry (IUPAC) thì giới hạn phát hiện (Limit of Detection - LOD) là nồng độ nhỏ nhất của chất tan có tín hiệu (signal) cao hơn có ý nghĩa so với mẫu trắng có thêm thuốc thử (reagent blank). Về mặt toán học, tín hiệu của một chất tại giới hạn phát hiện SA(DL) là: SA(DL) = Areagent + zσreagent Trong đó: Areagent là tín hiệu của mẫu trắng có thêm thuốc thử σreagent là độ lệch chuN của mẫu trắng có thêm thuốc thử (thường đo 30 lần lặp lại) n Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 94
- z là một nhân tố ở mức ý nghĩa nhất định theo mong muốn Nồng độ tại giới hạn phát hiện có thể được xác định thông qua tính hiệu (độ hấp thụ quang) tại giới hạn phát hiện. S A DL S A DL n A DL C A DL và k k Giá trị z phụ thuộc vào mức ý nghĩa mong muốn cho báo cáo một giá trị giới hạn phát hiện (LOD). Điển hình là giá trị z là 3,0 từ Bảng 9.10 tương ứng với mức ý nghĩa α = 0,00135. Do đó chỉ 0,135% quá trình đo đạt mẫu trắng mang lại tính hiệu nằm ngoài giới hạn đo Hình 9.8. Kh ả n ăng phân bố củ a mẫu trắng SA(DL) Sthuố c th ử Hình 9.4. Khả năng phâ bố của mẫu trắng Bảng 9.10: Giá trị z ở các mức ý nghĩa u 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641 0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4365 0.4325 0.4286 0.4347 0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483 0.4 0.3446 0.3409 0.3372 0.3326 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121 0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776 0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867 0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611 1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379 1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170 1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985 1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823 1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681 1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559 1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455 Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 95
- 1.7 0.0446 0.0436 0.0427 0.0416 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367 1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294 1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0253 2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183 2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143 2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110 2.3 0.0107 0.0104 0.0102 0.00964 0.00914 0.00866 2.4 0.00820 0.00776 0.00734 0.00695 0.00657 2.5 0.00621 0.00587 0.00554 0.00523 0.00494 2.6 0.00466 0.00440 0.00415 0.00391 0.00368 2.7 0.00347 0.00326 0.00307 0.00298 0.00272 2.8 0.00256 0.00240 0.00226 0.00212 0.00199 2.9 0.00187 0.00175 0.00164 0.00154 0.00144 3.0 0.00135 3.1 0.00968 3.2 0.000687 3.3 0.000483 3.4 0.000337 3.5 0.0002233 3.6 0.000159 3.7 0.000108 3.8 0.0000723 3.9 0.0000481 4.0 0.0000317 4.1 0.0000207 4.2 0.0000133 4.3 0.00000854 4.4 0.00000541 4.5 0.00000340 4.6 0.00000211 4.7 0.00000130 4.8 0.000000793 4.9 0.000000479 5.0 0.000000287 Khoa Thuỷ sản - Đai học Cần Thơ | Huỳnh Trường Giang 96
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Thuốc điều trị và Vacxin sử dụng trong thú y: Phần 2 - NXB Nông Nghiệp
33 p | 279 | 80
-
Giáo trình Miễn dịch học thú y - Chương 9
15 p | 177 | 46
-
Giáo trình nuôi trồng hải sản - Chương 9: Sinh Học và Kỹ Thuật Nuôi Cá Ngựa
24 p | 145 | 37
-
66 bệnh gia cầm và biện pháp phòng trị part 9
16 p | 140 | 30
-
Giáo trình dinh dưỡng gia súc: Chương 9: Vitamin
27 p | 128 | 23
-
Sổ tay đào tạo giảng viên ToT về quản lý Câu lạc bộ khuyến nông có sự tham gia: Phần 1
146 p | 82 | 15
-
Kết quả chọn tạo và khảo nghiệm giống hoa cẩm chướng D06.9
6 p | 13 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn