Áp dụng phân tích thống kê đa biến trong phân vùng và đánh giá chất lượng nước dưới đất: Nghiên cứu trường hợp ở huyện Hải Lăng, tỉnh Quảng Trị
lượt xem 3
download
Bài viết giới thiệu các kết quả thu được khi áp dụng phương pháp PCA và AHC trong phân vùng CLN dưới đất; áp dụng phương pháp PCA để xác định Trọng số Wi trong xây dựng chỉ số GWQI để đánh giá CLN dưới đất ở huyện Hải Lăng, tỉnh Quảng Trị giai đoạn 2015 - 2021.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Áp dụng phân tích thống kê đa biến trong phân vùng và đánh giá chất lượng nước dưới đất: Nghiên cứu trường hợp ở huyện Hải Lăng, tỉnh Quảng Trị
- 686 ÁP DỤNG PHÂN TÍCH THỐNG KÊ ĐA BIẾN TRONG PHÂN VÙNG VÀ ĐÁNH GIÁ CHẤT LƢỢNG NƢỚC DƢỚI ĐẤT: NGHIÊN CỨU TRƢỜNG HỢP Ở HUYỆN HẢI LĂNG, TỈNH QUẢNG TRỊ Nguyễn Văn Hợp1*, Nguyễn Đăng Giáng Châu1, Trƣơng Quý Tùng1, Trƣơng Trung Kiên2, Nguyễn Trọng Hữu2, Mai Thị Thanh Tuyền2, Nguyễn Trƣờng Khoa2, Bùi Văn Xuân3 1 Trường Đại học Khoa học - Đại học Huế 2 Sở Tài nguy n và Môi trường, tỉnh Quảng Trị 3 Trung tâm An toàn Môi trường và Hóa học, thành phố Đà Nẵng * Tác giả chịu trách nhiệm: ngvanhopkh@gmail.com Tóm tắt Phư ng pháp phân tích thành phần chính (PCA) và phân tích cụm (AHC) được áp dụng để đánh giá và phân vùng chất lượng nư c (CLN) dư i đất ở huyện Hải Lăng, tỉnh Quảng Trị. Phư ng pháp PCA cũng được áp dụng để xác định Trọng số wi một cách khách quan trong xây dựng Chỉ số chất lượng nư c dư i đất (GWQI) để đánh giá CLN tổng quát. Chỉ số GWQI này được tính toán từ 10 thông số CLN lựa chọn i (i 1 - 10), bao gồm: pH, TDS, độ cứng (HARD), SO4, COD, N-NH4, N-NO3, Fe, Mn và tổng coliform. Các hàm Chỉ số phụ (qi) tuyến tính được thiết lập dưa trên gi i hạn cho phép của các thông số được quy định trong Quy chuẩn kỹ thuật quốc gia về CLN sử dụng cho mục đích sinh hoạt (QCVN 01-1:2018/BYT). Trên c sở so sánh 03 phư ng pháp tính chỉ số GWQI khác nhau (chúng đều là hàm số của Trọng số wi và Chỉ số phụ qi): phư ng pháp tích (GWQIM), phư ng pháp tổng (GWQIA) và phư ng pháp khác (GWQIRef), đã chọn được chỉ số phù hợp là GWQIM. Áp dụng chỉ số GWQIM cho tập dữ liệu CLN giai đoạn 2019-2021 cho thấy: chỉ số GWQIM phản ánh phù hợp CLN dư i đất ở huyện Hải Lăng; có 89% giá trị GWQIM thuộc loại CLN RẤT TỐT hoặc TỐT, 7% thuộc loại TRUNG BÌNH; 1% thuộc loại KÉM và 3% thuộc loại RẤT KÉM. Từ khóa: PCA; AHC; nước dưới ấ; Quảng Trị. 1. Đặt vấn đề Đánh giá chất lượng nư c (CLN) là một trong những nhiệm vụ quan trọng trong quản lý nguồn nư c Để đánh giá CLN, mỗi quốc gia hoặc tổ chức quốc tế thường ban hành các tiêu chuẩn hoặc hư ng dẫn CLN để áp dụng. Tuy vậy, cách đánh giá CLN dựa vào tiêu chuẩn (quy chuẩn) CLN chỉ tính đến các thông số CLN riêng biệt và không chỉ ra được ‗ ức tranh‘ tổng quát về CLN ở vùng hoặc khu vực khảo sát, không cho phép phân loại, phân vùng CLN và khó hiểu đối v i cộng đồng và các nhà hoạch định chính sách. Các hệ môi trường nư c (sông, suối, hồ, nguồn nư c dư i đất…) đều là những hệ đa iến, tức là CLN của nó được giải thích hay quyết định bởi tổ hợp nhiều biến (hay nhiều thông số CLN). Do vậy, để phân vùng CLN ở khu vực khảo sát (dựa vào đặc điểm của nhiều thông số CLN), cần phải áp dụng phư ng pháp phân tích thống kê đa iến như phư ng pháp phân tích thành phần chính (PCA - Principal Component Analysis) và phư ng pháp phân tích cụm (CA - Clustering Analysis, điển hình là AHC - Agglomerate Hierarchical Clustering) (Denis, D. J., 2020). Mặt khác, để đánh giá CLN tổng quát nhằm khắc phục các hạn chế của cách đánh giá dựa vào tiêu chuẩn/quy chuẩn, cần thiết phải phát triển phư ng pháp đánh giá CLN dựa vào một chỉ số định lượng và dễ hiểu, cho phép đánh giá CLN dựa vào tổ hợp nhiều thông số CLN (Abbasi T. and Abbasi S.A, 2012). Một trong những chỉ số đó là Chỉ số chất lượng nư c (WQI - Water Quality Index) hoặc Chỉ số chất lượng nư c dư i đất (GWQI - Ground Water Quality Index). Chỉ số WQI hoặc GWQI là một công cụ toán học cho phép chuyển các thông số CLN thành một con số nguyên để đánh giá CLN tổng quát của một nguồn nư c. Do có nhiều ưu điểm, nên nhiều nghiên cứu đã cho rằng, chỉ số WQI hoặc GWQI là công cụ hữu hiệu trong đánh giá CLN và quản lý nguồn nư c (Abbasi T. and Abbasi S.A, 2012; Sutadian A. D. và nnk., 2016).
- . 687 Một cách tổng quát, chỉ số WQI hoặc GWQI là một hàm số được tính toán từ 02 đại lượng - Trọng số (weightage) wi và Chỉ số thông số hay Chỉ số phụ (sub-index) qi tư ng ứng thể hiện tầm quan trọng tư ng đối và chất lượng của thông số CLN thứ i. Trọng số wi (đối v i các nguồn nư c mặt) thường nhận giá trị trong khoáng 0 - 1 v i tổng trọng số của các thông số 1 Đối v i các nguồn nư c dư i đất, trọng số wi của thông số i có thể dao động trong khoảng rộng, từ < 1 đến 5 Đối v i các nguồn nư c mặt, Chỉ số thông số qi nhận các giá trị trong khoảng 0 - 100 và được xác định bằng cách chuyển kết quả quan trắc thông số i (có đ n vị đo khác nhau) thành thang đo chuẩn hóa 0 - 100: thông số có q càng gần 100, có chất lượng càng tốt và ngược lại. Chỉ số WQI thường có thang điểm 0 - 100, càng gần 100, CLN của nguồn nư c mặt càng tốt và ngược lại Trong khi đó, đối v i nguồn nư c dư i đất, các giá trị qi có thể l n h n 100 (qi càng l n, chất lượng của thông số càng kém và ngược lại), nên chỉ số GWQI thường có thang điểm 0 - 300 hoặc l n h n và càng l n, CLN càng kém và ngược lại (Abbasi T. and Abbasi S.A, 2012; Prasad M. và nnk., 2019, Subba Rao N. và nnk., 2019) Để xác định Trọng số wi nhiều tác giả dựa vào ý kiến chuyên gia, nhưng nhiều nghiên cứu cho rằng, để xác định wi một cách khách quan, nên áp dụng phư ng pháp phân tích thống kê đa iến như phân tích thành phần chính (PCA - Principal Component Analysis) hoặc một dạng tư ng tự là phân tích yếu tố (FA - Factor Analysis) (Adimalla N. and Qian H., 2019; Ekere N. R. và nnk., 2019; Barbosa Filho J. and de Oliveira I. B., 2021). Ở Việt Nam, Bộ Tài nguyên và Môi trường (TNMT) đã an hành chỉ số WQI để áp dụng đánh giá CLN của các nguồn nư c mặt trong cả nư c (từ năm 2011 và điều chỉnh năm 2019) (Bộ TNMT, 2019), nhưng chưa nghiên cứu xây dựng chỉ số GWQI. Nói chung, các nghiên cứu về GWQI ở nư c ta còn rất hạn chế. Bài báo này gi i thiệu các kết quả thu được khi áp dụng phư ng pháp PCA và AHC trong phân vùng CLN dư i đất; áp dụng phư ng pháp PCA để xác định Trọng số wi trong xây dựng chỉ số GWQI để đánh giá CLN dư i đất ở huyện Hải Lăng, tỉnh Quảng Trị giai đoạn 2015 - 2021. 2. Phƣơng pháp nghiên cứu 2.1. Khu vực nghiên cứu và dữ liệu chất lƣợng nƣớc dƣới đất Hải Lăng là huyện ven biển phía Nam của tỉnh Quảng Trị, có tọa độ địa lý từ 16o33‘40‘‘ đến 16 48‘00‘‘ độ vĩ ắc và 107o04‘10‘‘ đến 107o23‘30‘‘ độ kinh Đông; tổng diện tích đất tự nhiên o 42 368 ha (năm 2019); ao gồm 16 đ n vị hành chính (15 xã và 01 thị trấn - thị trấn Diên Sanh) (Hình 1) v i dân số 79 533 người (năm 2019), trong đó dân số đô thị 3 300 người (chiếm 4,15%), dân số nông thôn 76 233 người (chiếm 95,85%). Trong chư ng trình quan trắc môi trường hàng năm do Trung tâm Quan trắc TNMT (thuộc Sở TNMT Quảng Trị) thực hiện, từ năm 2015 đến 2021 người ta quan trắc nư c dư i đất ở 12 - 26 vị trí (giếng khoan hoặc giếng đào) ở huyện Hải Lăng (Hình 1) v i tần suất 1 - 2 đợt/năm (01 đợt mùa khô, tháng 1-8, 01 đợt mùa mưa, tháng 9-12). Đa số người dân ở khu vực nông thôn hiện nay vẫn dùng nư c giếng cho sinh hoạt và ăn uống. Dữ liệu CLN dư i đất ở 12 - 26 vị trí ở huyện Hải Lăng giai đoạn 2015-2021 được cung cấp bởi Trung tâm Quan trắc TNMT gồm 13 thông số: (i) Các thông số hóa - lý: pH, độ đục (Tur) hoặc tổng chất rắn l lửng (TSS), tổng chất rắn hòa tan (TDS), độ cứng (HARD); (ii) Các thông số hóa học: COD, amoni tính theo nit (viết tắt là N-NH4), nitrit (N-NO2), nitrat (N-NO3), clorua (Cl-), sunfat (SO4), tổng sắt tan (Fe), tổng mangan tan (Mn); (iii) Thông số vi sinh: Tổng coliform (TC). Các vị trí quan trắc nư c dư i đất ở huyện Hải Lăng được nêu ở Hình 1. Để phân vùng CLN, sử dụng dữ liệu giai đoạn 2015-2019 (67 mẫu hay N 67) v i 12 thông số kể trên, ngoại trừ thông số HARD.
- 688 Hình 1. Các vị trí quan trắc chất lượng nước dưới đất ở huyện Hải Lăng. Để xác định Trọng số wi và xây dựng chỉ số GWQI, sử dụng dữ liệu giai đoạn 2015-2021 và chọn 10 thông số CLN ở trên: pH, TSS, TDS, HARD, SO4, N-NH4, N-NO3, Fe, Mn và TC (ngoại trừ thông số thông số Cl- và N-NO2, do Cl- tư ng quan chặt v i TDS, còn thông số N- NO2 rất nhỏ trong nhiều mẫu, nhỏ h n gi i hạn phát hiện của phư ng pháp phân tích) Mặt khác, để xây dựng chỉ số GWQI, chia tập dữ liệu giai đoạn 2015-2021 thành hai: T p dữ liệu 1 (giai đoạn 2015-2018, N 62 mẫu) được dùng để xác định Trọng số wi; T p dữ liệu 2 (giai đoạn 2019-2021, N 101 mẫu) được dùng để kiểm tra sự phù hợp của chỉ số GWQI xây dựng được. Các thông số CLN ở trên cũng được quy định trong QCVN 01-1:2018/BYT (viết tắt là QCVN 01-1) về CLN sạch sử dụng cho mục đích sinh hoạt. Các kim loại nặng và độc (Hg, Cd, Pb, As, Ni, Cr, Cu, Zn) cũng như các hóa chất bảo vệ thực vật nhóm clo (nhóm DDT, nhóm HCH) đều có hàm lượng rất nhỏ, hoặc nhỏ h n gi i hạn phát hiện của phư ng pháp phân tích (LOD) hoặc nhỏ h n nhiều so v i gi i hạn cho phép trong QCVN 01-1, nên chúng không được đưa vào để xây dựng chỉ số GWQI. Các dữ liệu quan trắc CLN chi tiết (hay dữ liệu gốc) không được đưa ra ở đây Tập dữ liệu gốc về CLN dư i đất huyện Hải Lăng (giai đoạn 2015 - 2021) được xử lý để tạo ra tập dữ liệu phù hợp cho phân tích theo phư ng pháp PCA như: loại bỏ các giá trị bất thường (nếu có), lấy con số có nghĩa phù hợp, gán các số liệu nhỏ h n LOD ằng LOD, chuyển dạng dữ liệu về dạng biến chuẩn hóa, tức là chuyển kết quả quan trắc các biến xij (có đ n vị khác nhau) thành biến zij (không có đ n vị): zij (xij - trung bình số học)/độ lệch chuẩn; trong đó, i 1 - n v i n là số thông số CLN lựa chọn, j 1 - N v i N là số mẫu. Biến zij có trung bình quần thể bằng 0 và phư ng sai ằng 1 (Miller J. N & Miller J. C., 2010; Denis D. J., 2020).
- . 689 2.2. Phƣơng pháp PCA và AHC 2.2.1. Phân vùng chất lượng nước Phư ng pháp PCA là phư ng pháp chiếu (projection), cho phép giảm dữ liệu từ không gian m chiều (mỗi chiều ứng v i một biến/thông số CLN) thành không gian ít chiều h n: k chiều (k < m); mỗi chiều được gọi là một thành phần chính (PC - Principal Component) - là tổ hợp tuyến tính của các biến gốc (xij) và các PC không tư ng quan v i nhau, mà trực giao nhau. Thông thường, chỉ cần giữ lại một vài PC đầu tiên, chẳng hạn PC1, PC2 vì chúng vẫn giải thích được đa số biến động hay phư ng sai của tập dữ liệu gốc. Những PC được giữ lại là những PC có Giá trị riêng l n h n 1 (giá trị riêng là lượng phư ng sai của các biến gốc được giải thích bởi PC tư ng ứng) và phư ng sai tích lũy của chúng l n h n 60% (Denis D. J., 2020). Từ các kết quả PCA, xác định được tư ng quan của các biến và khi phát hiện có các cấu trúc tồn tại trong tập dữ liệu gốc, chẳng hạn, có sự tách ra các cụm (hay nhóm) các đối tượng (các mẫu hoặc các vị trí quan trắc), cần thực hiện phân tích sâu h n theo phư ng pháp AHC để nhóm các đối tượng thành các cụm (cluster) hay nhóm. Việc gộp các đối tượng thành các cụm là dựa vào độ tư ng tự (similarity) hoặc bất tư ng tự (dissimilarity) giữa chúng Độ tư ng tự hoặc bất tượng tự được thể hiện qua hàm khoảng cách (distance function) giữa các đối tượng hoặc cụm đối tượng. Trong nghiên cứu này, sử dụng khoảng cách Ơclit (Euclidean distance) làm thư c đo độ tư ng tự giữa các đối tượng/cụm đối tượng (Denis D. J., 2020). Từ đó, cho phép phân vùng CLN dư i đất dựa vào đặc điểm của các thông số CLN trong mỗi vùng. 2.2.2. X c ịnh Trọng số wi của c c thông số chất lượng nước hi xây dựng chỉ số GWQI Từ kết quả tính toán theo PCA, sẽ thu được Tải lượng ình phương (squared loading) của mỗi biến (hay thông số CLN) trên mỗi PC giữ lại. Tải lượng ình phư ng của mỗi biến chính là lượng phư ng sai của nó được giải thích bởi mỗi PC (Denis D. J., 2020). Từ T ng tải lượng bình phương của mỗi biến trên các PC giữ lại (communality) và Tổng tải lượng ình phư ng của tất cả các biến trên các PC giữ lại (được gọi là T ng t ch l y), sẽ tính được Trọng số (hay tầm quan trọng tư ng đối) của mỗi biến theo công thức (1) Để thực hiện các tính toán theo phư ng pháp PCA, nghiên cứu này sử dụng phần mềm R - phần mềm được áp dụng phổ biến trên thế gi i: R version 4.0.3/64-bit (10-10-2020) v i module R-Studio, dùng gói (package) Factoextra (version 1.0.7). (1) Khi xây dựng chỉ số GWQI, nhiều tác giả tính toán Trọng số wi theo công thức (2) và (3) (Prasad M., 2019; Adimalla N. & Qian H., 2019; Ekere N. R., 2019; Solangi G. S., 2019): (2) Trong đó, hệ số K 1/(1/Coi); Coi là giới hạn của thông số được quy định trong tiêu chuẩn CLN của quốc gia; wi* là trọng số của mỗi thông số CLN được xác định theo ý kiến chuyên gia, tùy thuộc vào tầm quan trọng của thông số trong đánh giá CLN; các giá trị wi* 1 - 5 và wi* càng lớn, thông số càng quan trọng và ngược lại. Từ các giá trị wi*, tính được Trọng số tương đối wi theo (3): ∑ (3) 2.3. Phƣơng pháp xác định Chỉ số phụ Để xác định Chỉ số thông số qi, cần chuyển đổi kết quả quan trắc được của thông số CLN thứ i thành thang đo chuẩn hóa không có đ n vị. Trong các nghiên cứu phát triển chỉ số GWQI, nhiều tác giả xác định giá trị qi theo công thức (4) (Abbasi T. and Abbasi S.A, 2012; Prasad M. và nnk., 2019, Subba Rao N. và nnk., 2019):
- 690 (4) Trong đó, Ci (mg/L) và Coi (mg/L) tư ng ứng là kết quả quan trắc thông số i trong mẫu và giá trị gi i hạn của thông số được quy định trong tiêu chuẩn CLN của quốc gia. Theo công thức (4), qi càng tăng, chất lượng của thông số càng giảm và ngược lại; khi Ci > Coi, giá trị của qi > 100. Việc sử dụng tiêu chuẩn CLN để hỗ trợ chia nhỏ các giá trị Chỉ số phụ qi sẽ cung cấp thêm thông tin và thuận tiện cho người dùng (House M. A., 1989). Mặt khác, nếu sử dụng thang đo qi trong khoảng 0 - 100 sẽ dễ hiểu h n so v i thang đo qi theo công thức (4). Trong nghiên cứu này, sử dụng các giá trị gi i hạn được quy định trong QCVN01-1 để thiết lập các hàm tuyến tính xác định qi (có giá trị 1 - 100), q càng gần 100, chất lượng thông số càng tốt và ngược lại Phư ng trình tuyến tính có dạng y a x, trong đó, y q được tính toán từ kết quả quan trắc thông số CLN (x); a và b là hai hệ số được suy ra từ hai phư ng trình tuyến tính (5) và (6): 100 = a + b × (gi i hạn cho phép của QCVN 01-1 đối v i thông số CLN) (5) Trong đó, y = q 100 ứng v i chất lượng tốt của thông số; Khi kết quả quan trắc thông số (x) gi i hạn cho phép của QCVN 01-1, giá trị q của nó 100; 1 = a + b × (gi i hạn cho phép của QCVN 01-1 đối v i thông số CLN + 3×S) (6) Trong đó, y q 1 ứng v i chất lượng kém của thông số; Khi kết quả quan trắc của thông số (x) gi i hạn cho phép + 3×S, giá trị q của nó 1 Điều này được hiểu là: Gi i hạn cho phép đối v i mỗi thông số là trung bình của một phân bố chuẩn (hay một quần thể); Chỉ những giá trị x nằm ngoài khoảng tin cậy 99,87% của giá trị trung ình đó m i được xem là phân bố khác (hay quần thể khác), tức là l n h n gi i hạn cho phép; Số 3 là giá trị của biến chuẩn hóa (u) ứng v i xác suất tin cậy P 0,9987; S là độ lệch chuẩn của quần thể (Miller J. N & Miller J. C., 2010). Độ lệch chuẩn S được tính toán từ Độ lệch chuẩn tư ng đổi (RSD, %): (7) Trong đó, Trung bình số học chính là Gi i hạn cho phép của thông số CLN trong QCVN 01- 1; RSD được xác định dựa vào phư ng trình Horwitz (Rivera C. and Rodriguez R., 2010): ; V i C là nồng độ được biểu diễn bằng phân số. (8) 2.4. Phƣơng pháp tính chỉ số GWQI và thang điểm phân loại chất lƣợng nƣớc Để chọn công thức tính phù hợp, tiến hành tính chỉ số GWQI (cho cả Tập dữ liệu 1 và Tập dữ liệu 2) theo phư ng pháp tích - công thức (9) và phư ng pháp tổng - công thức (10): ∏ (9) ∑ (10) Để thuận lợi cho người dùng chỉ số GWQI, nghiên cứu này sử dụng thang điểm phân loại CLN dư i đất dựa vào GWQI tư ng tự như thang điểm phân loại CLN mặt do Bộ TNMT quy định (Bộ TNMT, 2019) Theo đó, GWQI càng l n, CLN dư i đất càng tốt và ngược lại (Bảng 1). Bảng 1. Phân loại chất lượng nước dưới đất theo chỉ số GWQI Loại/ Mức Chỉ số GWQI Đánh giá chất lượng nư c I 91 - 100 RẤT TỐT (RT) II 76 - 90 TỐT (T) III 51 - 75 TRUNG BÌNH (TB) IV 26 - 50 KÉM (K) V 1 - 25 RẤT KÉM (RK, hay không phù hợp cho ăn uống) Mặt khác, để so sánh, ở đây cũng tính toán giá trị GWQI theo phư ng pháp khác - công thức (11) - đã được một số tác giả đề xuất (Elubid B. A., 2019; Prasad M., 2019; Adimalla N. & Qian
- . 691 H., 2019; Ekere N. R., 2019; Solangi G. S., 2019): ∑ (11) ∑ Trong đó, wi được tính theo công thức (2) và (3); Chỉ số phụ qi được tính theo công thức (12): (12) Ở đây, Ci và Co tư ng ứng là nồng độ của thông số CLN trong mẫu và nồng độ lý tưởng của thông số trong nư c tinh khiết 0 (ngoại trừ pH có Co 7,0). Theo công thức (11), GWQI được phân chia thành 5 mức CLN: < 50 (RẤT TỐT); 51 - 100 (TỐT); 101 - 200 (KÉM); 201 - 300 (RẤT KÉM) và > 300 (không phù hợp cho ăn uống). 3. Kết quả và thảo luận 3.1. Phân vùng chất lƣợng nƣớc dƣới đất ở huyện Hải Lăng Theo phư ng pháp PCA, phân tích ma trận tư ng quan của các biến zij (dữ liệu giai đoạn 2015-2019 v i 12 thông số CLN và N 67 mẫu), thu được các giá trị riêng, phần phư ng sai và phư ng sai tích lũy của các thành phần chính (PC) ở Bảng 2. Chỉ cần giữ lại 04 thành phần chính (PC1 - PC4) vì chúng đều có giá trị riêng 1 và giải thích được 72,1% phư ng sai của tập dữ liệu gốc Nói cách khác, để lý giải về 12 biến gốc, chỉ cần dựa vào 04 biến m i (hay 04 PC). Các PC còn lại (PC5 - PC10) đều có giá riêng < 1 và chỉ giải thích 27,9% phư ng sai, được xem là biến động nền hay ―nhiễu nền‖ Bảng 2. Giá trị riêng, phần phương sai và phương sai tích lũy của 04 thành phần chính đầu tiên Đại lượng thống kê PC1 PC2 PC3 PC4 Giá trị riêng 3,135 2,480 1,702 1,337 Phần phư ng sai (%) 26,1 20,7 14,2 11,1 Phư ng sai tích lũy (%) 26,1 46,8 61,0 72,1 Biểu diễn các vector biến trong không gian các thành phần chính PC1-PC2 và PC3-PC4, thu được đồ thị tải lượng (factor loading plot) ở Hình 2. Tải lượng mỗi biến trên mỗi PC là hình chiếu vuông góc của vector biến đó trên trục PC tư ng ứng. Kết quả ở Hình 2(a) cho thấy: (i) PC1 giải thích chủ yếu các biến TDS, Cl và ở mức độ thấp h n là Fe, Tur và pH; Các iến có tư ng quan chặt v i nhau là TDS-Cl-, Fe-Tur, TDS-Mn, COD-NO3; COD và NO3 tư ng quan nghịch v i Mn, TDS, Cl-; (ii) PC2 giải thích chủ yếu các biến NO2 và ở mức độ thấp h n là NO3, COD và Fe; Như vậy, khi TDS và Cl- cao, sẽ làm tăng sự h a tan Fe, Mn vào nư c, dẫn đến làm tăng nồng độ Fe và Mn; Nồng độ Fe cao cũng làm tăng độ đục của nư c. Hình 2(b) cho thấy, PC3 giải thích chủ yếu biến TC và SO4, trong khi PC4 (gần tư ng tự PC2, nhưng ở mức độ thấp h n) giải thích chủ yếu các biến NO3 và COD. Biểu diễn các đối tượng (các mẫu) lên không gian các thành phần chính, thu được đồ thị các đối tượng (score plot) ở Hình 3 và thấy rằng, các đối tượng có tách ra thành các nhóm (hay cụm). Áp dụng phư ng pháp AHC cho tập dữ liệu giai đoạn 2015-2019 (N 67) và tổ hợp các đối tượng theo phư ng pháp Ward (Ward method linkage), thu được đồ thị phân cụm đối tượng (dendrogram) ở Hình 4.
- 692 (a) (b) Hình 2. Đồ thị tải lượng trong không gian 2 thành phần chính (a) PC1-PC2 và (b) PC3-PC4. (để cho gọn, trên hình thay các ký hiệu N-NH4, N-NO2 và N-NO3 bằng NH4, NO2, NO3). Kết quả của phư ng pháp AHC (Hình 4) cho thấy, theo đặc điểm các thông số CLN, vùng khảo sát được chia thành 4 cụm CLN: Cụm 1 (14 mẫu), Cụm 2 (23 mẫu), Cụm 3 (6 mẫu) và Cụm 4 (24 mẫu) Theo địa gi i hành chính, có thể phân các cụm đó thành 03 tiểu vùng như sau: (i) Tiểu vùng I (cụm 1 và 2): gồm 2 xã Hải Dư ng và Hải Vĩnh; Nư c dư i đất ở tiểu vùng này có nồng độ COD, N-NO3, N-NO2 và TC cao h n; nhưng pH, nồng độ muối (TDS, Cl-), Fe, Tur và NH4 thấp h n tiểu vùng II và III. (ii) Tiểu vùng II (cụm 3): gồm 2 xã Hải Thành và Hải Hòa; Một số giếng có Fe, độ đục và NH4 cao h n so v i tiểu vùng I và III, chẳng hạn ở thôn An Th năm 2019, nồng độ Fe (2,04 mg/L), Tur (24 NTU) và N- NH4 (1,25 mg/L) đều không đạt QCVN 01-1. (iii) Tiểu vùng III (cụm 4) gồm xã Hải Ba và Hải Quế: mức nhiễm muối (TDS, Cl-, SO4) và Mn cao h n, nhưng COD, NO3 và TC thấp h n so v i tiểu vùng I và II Đáng lưu ý là mức nhiễm các vi khuẩn trong hầu Hình 3. Đồ thị đối tượng trong không gian PC1-PC2 hết các giếng ở cả 3 tiểu vùng đều (20 đối tượng) và PC3 – PC4 (5 đối tượng). khá cao (TC 3 - 1.100 MPN/100 (ở đây chỉ biểu diễn các đối tượng có tải lượng bình phương mL) và không đạt yêu cầu của 0,5, tức là trên 50% phương sai của các biến được giải QCVN 01-1. thích bởi PC1 và PC2, hoặc PC3 và PC4; các con số 1,2… là số thứ tự đối tượng).
- . 693 Hình 4. Giản đồ phân cụm các đối tượng ở vùng khảo sát (4 cụm). (các số thứ tự 1, 2, 3… là số thứ tự của các mẫu). 3.2. Xây dựng chỉ số GWQI và áp dụng cho huyện Hải Lăng 3.2.1. Trọng số của c c thông số chất lượng nước Áp dụng phư ng pháp PCA cho T p dữ liệu 1 (giai đoạn 2015-2018, N 62 v i 10 biển chuẩn hóa zij), thu được các kết quả ở Bảng 3. Chỉ cần giữ lại 04 thành phần chính (PC1 - PC4) vì chúng đều có giá trị riêng 1 và giải thích được 74,4% phư ng sai của tập dữ liệu gốc. Nói cách khác, để lý giải về 10 biến lựa chọn, chỉ cần dựa vào 04 biến m i (PC1-PC4). Các thành phần chính còn lại (PC5 - PC10) đều có giá riêng < 1 và chỉ giải thích 25,6% phư ng sai, được xem là ―nhiễu nền‖ Bảng 3. Giá trị riêng, phần phương sai và phương sai tích lũy của 04 thành phần chính đầu tiên Thành phần chính PC1 PC2 PC3 PC4 Giá trị riêng 3,6 1,6 1,2 1,0 Phần phư ng sai (%) 36,2 15,7 12,3 10,2 Phư ng sai tích lũy (%) 36,2 51,9 64,1 74,4 Mặt khác, theo phư ng pháp PCA, tính toán được Tải lượng ình phương của mỗi biến và T ng tải lượng ình phương của nó trên các PC giữ lại (communality). Từ đó tính được Tổng tải lượng ình phư ng của 10 biến trên các PC giữ lại (T ng t ch l y) và Trọng số (tầm quan trọng tư ng đối) của mỗi biến theo công thức (1) (Bảng 4). Bảng 4. Tải lượng bình phương, Tổng tải lượng bình phương và Trọng số của các thông số CLN(*) Tổng t i lượng Thông số PC1 PC2 PC3 PC4 Trọng số (w) bình phương pH 0,0003 0,0197 0,4632 0,2184 0,701 0,10 TDS 0,9459 0,0001 0,0003 0,0042 0,950 0,14 HARD 0,8212 0,0101 0,0038 0,0037 0,839 0,12 SO4 0,9356 0,0000 0,0002 0,0054 0,941 0,14 COD 0,4612 0,0012 0,0050 0,0001 0,468 0,07 N-NH4 0,0063 0,0680 0,1985 0,3027 0,575 0,08 N-NO3 0,0130 0,2649 0,0756 0,2271 0,581 0,08 Fe 0,0029 0,3928 0,2924 0,0010 0,689 0,10 Mn 0,0008 0,4704 0,0079 0,1473 0,626 0,09 TC 0,0001 0,1337 0,1649 0,2017 0,500 0,08 (*) Ngoại trừ các giá trị wi, số con số sau dấu phẩy của các số liệu trong bảng ược giữ lại chỉ ể phục vụ tính toán. T ng tích l y của 10 biến trên 4 PC giữ lại bằng t ng các giá riêng của các PC giữ lại ( 7,4).
- 694 3.2.2. Chỉ số phụ của c c thông số chất lượng nước Các hàm tuyến tính (biểu diễn đồ thị và phư ng trình) xác định Chỉ số phụ qi đối v i thông số CLN i được nêu ở Hình 5. Hình 5. Đồ thị biểu diễn sự phụ thuộc giữa chỉ số phụ (qi) và nồng độ/hàm lượng của thông số CLN (các phương trình để tính qi được đưa ra trên đồ thị). 3.2.3. Kiểm tra sự phù hợp của chỉ số GWQI - công thức t nh GWQI Để kiểm tra sự phù hợp của các công thức tính GWQI khi phản ánh CLN ở vùng khảo sát, tiến hành so sánh kết quả tính toán và phân loại CLN theo 03 (ba) công thức khác nhau: chỉ số GWQI được tính theo công thức dạng tích (9), dạng tổng (10) và dạng khác (11) và được ký hiệu tư ng ứng là GWQIM, GWQIA và GWQIRef (tính toán cho một số trường hợp đặc biệt: có một hoặc nhiều thông số CLN không đạt yêu cầu của QCVN 01-1). Bảng 5. So sánh kết quả tính các chỉ số GWQIM, GWQIA và GWQIRef, và phân loại CLN đối với một số trường hợp đặc biệt của Tập dữ liệu 1(a) Ký hiệu TDS SO4 Fe TC (MPN/ GWQIA - GWQIM - GWQIRef - mẫu (mg/L) (mg/L) (mg/L) 100 mL) phân loại phân loại phân loại DS18 82 10 0.02 43 (*) 92 - RT 69 - TB 12 - RT HB17-P 1357 (*) 446 (*) 0.37 (*) 3 79 - T 64 - TB 44 - T (*) (*) HB18-P 2674 546 0.22 3 72 - TB 28 - K 43 - T (*) HQ18 372 38 0.02 23 92 - RT 69 - TB 69 - TB HK16-T 99 9 0.14 23 (*) 92 - RT 69 - TB 82 - K (*) HP17 1013 155 0.02 3 91 - RT 66 - TB 111 - RK (*) HC17-B 223 12 3.50 3 91 - RT 66 - TB 92 - K (*) HĐ15 371 45 0.06 1100 92 - RT 69 - TB 3087- RK (a) (*) Chi tiết về mẫu hông ưa ra ở ây; Ký hiệu thể hiện trường hợp hông ạt y u cầu của QCVN 01-1.
- . 695 Các kết quả ở Bảng 5 cho thấy, các chỉ số GWQIM, GWQIA và GWQIRef phản ánh CLN khác nhau. Trong nhiều trường hợp, mặc dù có một hoặc một vài thông số không đạt yêu cầu của QCVN 01-1, nhưng chỉ số GWQIA và GWQIRef vẫn phản ánh CLN loại TỐT hoặc RẤT TỐT và như vậy là không phù hợp. Nói cách khác, trong những trường hợp đó, chỉ số GWQIA và GWQIRef bị mắc tính ―mập mờ‖ (ambiguity) hoặc ―che khuất‖ (eclipsing) trong phản ánh CLN (Abbasi T. and Abbasi S.A, 2012; Barbosa Filho J. and de Oliveira I. B., 2021). Trong các trường hợp đó, chỉ số GWQIM phản ánh CLN phù hợp v i thực tế h n Như vậy, trong 03 công thức khảo sát, công thức dạng tích (hay chỉ số GWQIM) phù hợp h n trong phản ánh CLN dư i đất ở vùng khảo sát và do đó, nó được lựa chọn để áp dụng vào thực tế. Từ đây, để cho gọn, ký hiệu chỉ số GWQIM là GWQI. 3.2.4. Áp dụng thực tế chỉ số GWQI trong nh gi chất lượng nước dưới ất Áp dụng chỉ số GWQI xây dựng được cho T p dữ liệu 2 (giai đoạn 2019 - 2021, N 101) cho thấy: - CLN dư i đất ở huyện Hải Lăng hầu hết đều đạt loại RẤT TỐT v i các giá trị GWQI 91 - 100 (89/101 trường hợp, chiếm 88%) và TỐT (GWQI 88, chiếm 1%); Chỉ 7% các giá trị GWQI phản ánh CLN thuộc loại TRUNG BÌNH (GWQI 63 - 69); 1% phản ánh CLN thuộc loại KÉM (GWQI 44) và 3% phản ánh CLN thuộc loại RẤT KÉM (GWQI 11 - 18). - Có 7,6% số liệu quan trắc các thông số CLN không đạt yêu cầu của QCVN 01-1 (do vượt quá mức cho phép). Phần trăm này (7,6%) khá phù hợp v i phần trăm các giá trị GWQI (11%) phản ánh CLN thuộc loại TRUNG BÌNH, KÉM và RẤT KÉM. Kết quả này cũng cho phép khẳng định rằng, chỉ số GWQI xây dựng được hoàn toàn phù hợp khi áp dụng vào thực tế. 4. Kết luận Phư ng pháp PCA và AHC là những công cụ phân tích thống kê đa iến cho phép áp dụng thuận lợi trong đánh giá và phân vùng chất lượng nư c dư i đất ở huyện Hải Lăng, tỉnh Quảng Trị. Áp dụng phư ng pháp PCA c n cho phép xác định Trọng số (wi) của các thông số CLN một cách khách quan trong xây dựng chỉ số GWQI v i 10 thông số CLN lựa chọn. Chỉ số GWQI đề xuất - là tích của các Chỉ số phụ qi được lũy thừa các Trọng số wi tư ng ứng - nên được chọn như một công cụ hỗ trợ hiệu quả trong đánh giá CLN dư i đất ở huyện Hải Lăng. Cuối cùng, phư ng pháp phân vùng CLN và xây dựng chỉ số GWQI trong nghiên cứu này có thể áp dụng nhân rộng để đánh giá CLN dư i đất ở địa phư ng hoặc khu vực khác ở nư c ta. Lời cảm ơn Các tác giả chân thành cảm n Sở Tài nguyên và Môi trường Quảng Trị đã cung cấp các dữ liệu quan trắc chất lượng nư c dư i đất cho nghiên cứu này. Tài liệu tham khảo Abbasi T. and Abbasi S. A., 2012. Water Quality Indices. Esevier. Adimalla N. and Qian H., 2019. Groundwater quality evaluation using water quality index (WQI) for drinking purposes and human health risk (HHR) assessment in an agricultural region of Nanganur, south India. Ecotoxicol. Environ. Saf., vol. 176, pp. 153-161, doi: 10.1016/j.ecoenv.2019.03.066. Barbosa Filho J. and de Oliveira I. B., 2021. Development of a groundwater quality index: GWQI, for the aquifers of the state of Bahia, Brazil using multivariable analyses. Sci. Rep., vol. 11, no. 1, doi: 10.1038/s41598-021-95912-9. Bộ Tài nguyên và Môi trường - Tổng cục Môi trường, 2019. Hướng dẫn kỹ thu t tính toán và công bố chỉ số chất lượng nước Việt Nam, pp. 1-10. Bộ Y tế, 2018. QCVN 01-1:2018/BYT - Quy chuẩn kỹ thu t quốc gia về chất lượng nước sạch sử dụng cho mục ch sinh hoạt. Available: www.gree-vn.com.
- 696 Denis D. J., 2020. Univariate, bivariate, and multivariate statistics using R: Quantitative tools for data analysis and data science. doi: 10.1002/9781119549963. Ekere N. R., Agbazue V. E., Ngang B. U., and Ihedioha J. N., 2019. Hydrochemistry and Water Quality Index of groundwater resources in Enugu north district, Enugu, Nigeria. Environ. Monit. Assess., vol. 191, no. 3, doi: 10.1007/s10661-019-7271-0. Elubid B. A. và nnk., 2019. Geospatial distributions of groundwater quality in Gedaref state using geographic information system (GIS) and drinking water quality index (DWQI). Int. J. Environ. Res. Public Health, vol. 16, no. 5, doi: 10.3390/ijerph16050731. House M. A., 1989. A Water Quality Index for River Management. Water Environ. J., vol. 3, no. 4, pp. 336-344, doi: 10.1111/j.1747-6593.1989.tb01538.x. Miller J. N. and Miller J. C., 2010. The quality of analytical measurements. Available: http://www.tandfonline.com/doi/abs/10.1198/tech.2004.s248. Noori R., Berndtsson R., Hosseinzadeh M., Adamowski J. F., and Abyaneh M. R., 2019. A critical review on the application of the National Sanitation Foundation Water Quality Index. Environ. Pollut., vol. 244, pp. 575-587, doi: 10.1016/j.envpol.2018.10.076. Prasad M., Sunitha V., Reddy Y. S., Suvarna B., Reddy B. M., and Reddy M. R., 2019. Data on water quality index development for groundwater quality assessment from Obulavaripalli Mandal, YSR district, A.P India. Data Br., vol. 24, doi: 10.1016/j.dib.2019.103846. Rivera C. and Rodriguez R., 2010. Horwitz equation as quality benchmark in ISO-IEC 17025 Horwitz Ratio (HorRat). IIE Annu. Conf., vol. 5, pp. 1-6. Solangi G. S., Siyal A. A., Babar M. M., and Siyal P., 2019. Application of water quality index, synthetic pollution index, and geospatial tools for the assessment of drinking water quality in the Indus Delta, Pakistan. Environ. Monit. Assess., vol. 191, no. 12, doi: 10.1007/s10661-019-7861-x. Subba Rao N., Sunitha B., Adimalla N., and Chaudhary M., 2020. Quality criteria for groundwater use from a rural part of Wanaparthy District, Telangana State, India, through ionic spatial distribution (ISD), entropy water quality index (EWQI) and principal component analysis (PCA). Environ. Geochem. Health, vol. 42, no. 2, pp. 579-599, doi: 10.1007/s10653-019-00393-5. Sutadian A. D., Muttil N., Yilmaz A. G., and Perera B. J. C., 2016. Development of river water quality indices - a review. Environ. Monit. Assess., vol. 188, no. 1, pp. 1-29, doi: 10.1007/s10661-015-5050-0.
- . 697 Application of multivariate statistic analysis to zoning and assessment of ground water quality: A case study in Hai Lang district, Quang Tri province Nguyen Van Hop1*, Nguyen Dang Giang Chau1, Truong Quy Tung1, Truong Trung Kien2, Nguyen Trong Huu2, Mai Thi Thanh Tuyen2, Nguyễn Trƣờng Khoa2, Bui Van Xuan3 1 Hue University of Sciences, Hue University, Hue city 2 Department of Natural Resources and Environment, Quang Tri province 3 Center for Environmental and Chemical Safety, Da nang city *Corresponding author: ngvanhopkh@gmail.com Abstract Principal Component Analysis (PCA) and Agglomerate Hierarchical Clustering (AHC) were applied to zoning and assessment of ground water quality in Hai Lang district, Quang Tri province. Principal Component Analysis was also applied to objective determination of weightages wi in establishment of Ground Water Quality Index (GWQI) used for general assessment of ground water quality. The index GWQI was calculated from ten selected water quality parameters i (i 1 - 10), consisting of pH, TDS, hardness (HARD); SO4, COD, N-NH4, N-NO3, Fe, Mn and total coliform. The linear sub-index functions (qi) were set up basing on the allowable limits of the parameters specified in the National Technical Regulation on Domestic Water Quality (QCVN 01-1:2018/BYT). Basing on comparison of three different methods to calculate the GWQI indexes (that are all functions of the weightages wi and sub-indexes qi) such as multiplicate method (GWQIM), additive method (GWQIA) and other method (GWQIRef), the GWQIM was selected as a most suitable index. Application of the GWQIM to the ground water quality data set of the period 2019 - 2021 shown that the index GWQIM reflected suitably ground water quality in the district; there are 89% of GWQIM values classified as VERY GOOD or GOOD water quality, 7% as MEDIUM, 1% as POOR and 3% as VERY POOR. Keywords: PCA, AHC, ground water, Quang Tri province.
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Giáo trình Xác suất thống kê - Tống Đình Quỳ
242 p | 861 | 284
-
Nhiệt động học và Vật lý thống kê
163 p | 379 | 103
-
CHƯƠNG V: QUAN TRẮC, PHÂN TÍCH VÀ BÁO CÁO HIỆN TRẠNG MÔI TRƯỜNG
67 p | 265 | 69
-
Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 2
44 p | 192 | 30
-
Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3
31 p | 125 | 22
-
Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 5
40 p | 93 | 21
-
Lợi ích của phân tích khoa học luận trong dạy học xác suất thống kê một phân tích khoa học luận về phân phối chuẩn
13 p | 126 | 12
-
Hoá học hiện đại (Tập 4: Các phương pháp Vật lí, Toán học thống kê ứng dụng trong hoá học hiện đại): Phần 2
101 p | 17 | 6
-
Đề cương chi tiết học phần: Xác suất thống kê (Ngành (chuyên ngành) đào tạo: Sinh viên năm thứ nhất các ngành học thuộc khối A, B)
7 p | 65 | 5
-
Bài giảng Nguyên lý thống kê - Chương 9: Phương pháp Anova
7 p | 94 | 4
-
Một giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt
6 p | 60 | 3
-
Nghiên cứu điều kiện phân tích Beta Lactam bằng phương pháp điện di mao quản
14 p | 51 | 2
-
Nghiên cứu xác định các Hidrocacbon thơm nhóm Btex bằng phương pháp phân tích động lực học kết hợp với vi chiết pha rắn màng kim rỗng và sắc kí khí
23 p | 80 | 2
-
Áp dụng phương pháp chi tiết hóa thống kê và “máy” tạo thời tiết lars Wg để đánh giá các đại lượng mưa cực trị theo các kịch bản khí hậu cho vùng đồng bằng ven biển huyện Gio Linh tỉnh Quảng Trị
9 p | 50 | 2
-
Áp dụng phương pháp FSA để phân tích phóng xạ môi trường cho mẫu hình học Marinelli
10 p | 32 | 2
-
Xác định nguồn phát thải kim loại trong không khí tại hải phòng sử dụng chỉ thị sinh học rêu Barbula indica và phương pháp thống kê đa biến
9 p | 2 | 2
-
Phân tích biến động đường bờ khu vực bờ biển cửa sông Hậu bằng tư liệu viễn thám
7 p | 40 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn