Nghiên cứu ứng dụng thử nghiệm thuật toán phân cụm dữ liệu (AI) để phân vùng các đặc trưng nhiệt độ, độ muối bề mặt khu vực Biển Đông
lượt xem 1
download
"Nghiên cứu ứng dụng thử nghiệm thuật toán phân cụm dữ liệu (AI) để phân vùng các đặc trưng nhiệt độ, độ muối bề mặt khu vực Biển Đông" bước đầu áp dụng thử nghiệm thuật toán phân cụm dữ liệu đối với bộ dữ liệu bề mặt nhiệt muối hai chiều (2D) để phân chia bề mặt nước biển khu vực Biển Đông thành các vùng có các đặc trưng nhiệt muối có độ tương đồng cao. Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Nghiên cứu ứng dụng thử nghiệm thuật toán phân cụm dữ liệu (AI) để phân vùng các đặc trưng nhiệt độ, độ muối bề mặt khu vực Biển Đông
- NGHIÊN CỨU ỨNG DỤNG THỬ NGHIỆM THUẬT TOÁN PHÂN CỤM DỮ LIỆU (AI) ĐỂ PHÂN VÙNG CÁC ĐẶC TRƯNG NHIỆT ĐỘ, ĐỘ MUỐI BỀ MẶT KHU VỰC BIỂN ĐÔNG Nguyễn Hồng Lân, Lê Phú Hưng Trường Đại học Tài nguyên và Môi trường Hà Nội Tóm tắt Trong nước biển tồn tại các khối nước tương đối đồng nhất về các đặc trưng lý hóa như nhiệt độ và độ muối. Việc xác định các khối nước cùng với các đặc trưng nhiệt muối của chúng có vai trò quan trọng trong việc đánh giá các quá trình động lực - nguyên nhân dẫn đến sự hình thành các khối nước đó. Hiện nay, với sự trợ giúp của các thuật toán của khai phá dữ liệu (các thuật toán thuộc trí tuệ nhân tạo - AI trong khai phá dữ liệu) có thể xác định và phân chia khối nước biển thành các khối nước có độ tương đồng cao về nhiệt muối. Trong nghiên cứu này nhóm tác giả bước đầu áp dụng thử nghiệm thuật toán phân cụm dữ liệu đối với bộ dữ liệu bề mặt nhiệt muối hai chiều (2D) để phân chia bề mặt nước biển khu vực Biển Đông thành các vùng có các đặc trưng nhiệt muối có độ tương đồng cao. Từ khóa: Khối nước; Phân cụm dữ liệu; Nhiệt - Muối. Abstract Application of AI data clustering algorithm for zoning water surface based on temperature and salinity characteristics in the East Sea (Bien Dong) Homogenous water masses in the seawater always exist in the form of similarity in physical and chemical characteristics, such as temperature and salinity. It is also necessary to assess the dynamical processes that base on the water mass characteristics, formed by thermal and salty identification. Nowadays, it is possible to identify and divide seawater mass into smaller areas for the similarity in temperature and salinity as a result of the support from the data cluster algorithms method (another form of AI for data mining). In this study, the clustering algorithms using the thermal - salty surface dataset in 2-Dimensional (2D) is applied and tested for splitting the surface of the East Sea into different regions with the different values of temperature and salinity characteristics. Keywords: Water mass; Data clustering; Thermal - Salty. 1. Đặt vấn đề Trong đại dương nói chung và tại các khu vực biển nói riêng liên tục diễn ra những quá trình trao đổi năng lượng và vật chất, di chuyển và xáo trộn, làm biến đổi và hướng tới san bằng những đặc trưng lý, hóa, sinh học ở mọi điểm của đại dương. Tuy nhiên, vẫn tồn tại những khối nước lớn chiếm khoảng không gian kích thước cỡ đại dương hoặc biển và duy trì trong một thời gian dài tính đồng nhất tương đối của các đặc trưng của chúng đã từng được hình thành ở những vùng địa lý nhất định. Những đặc trưng lý hóa cơ bản thường được sử dụng để phân biệt các khối nước với nhau là nhiệt độ (T) và độ muối (S) của chúng. Những yếu tố vật lý, hóa học, sinh học khác như oxy hòa tan, độ trong suốt tương đối, các chỉ số thủy sinh thì được dùng ít hơn. Một trong những phương pháp phân tích các khối nước được sử dụng nhiều nhất hiện nay là phương pháp đường cong T - S dựa trên biểu đồ T - S của các trạm quan trắc hải văn. Biểu đồ T - S là hệ trục vuông góc có tọa độ Hội thảo Khoa học Quốc gia 2023 67
- là nhiệt độ T và độ muối S, trên đó ghi các độ sâu quan trắc ứng với nhiệt độ và độ muối quan trắc được [1]. Phương pháp phân tích dựa trên biểu đồ T - S có hạn chế là cho phép phân chia theo độ sâu các lớp nước có đặc trưng T - S tương tự nhau chỉ cho profile tại một điểm. Sau đó kết nối với các điểm khác ta có thể xác định được ranh giới các khối nước. Hình 1: Khu vực nghiên cứu và lưới dữ liệu T - S Trong nghiên cứu này, nhóm tác giả đề xuất phân chia các khối nước dựa trên phương pháp phân cụm dữ liệu (data clustering) trong lý thuyết khai phá dữ liệu (data mining). Phương pháp này xác định được các cụm dữ liệu của các yếu tố nào đó có độ tương đồng cao. Khi áp dụng các phân cụm này đối với môi trường nước biển có các yếu tố đặc trưng là nhiệt độ (T) và độ muối (S) thì các khối nước biển chính là các cụm dữ liệu có độ tương đồng cao về các yếu tố đặc trưng T - S của khối nước đó. 2. Phương pháp nghiên cứu 2.1. Chuẩn hóa dữ liệu Để khai phá dữ liệu thành công, trước khi thực hiện các phương pháp khai phá, chúng ta cần có cái nhìn tổng quan về dữ liệu. Trên cơ sở đó chúng ta có thể phát hiện ra các đặc tính của dữ liệu, cũng như có thể phát hiện ra đâu là dữ liệu nhiễu hay dữ liệu ngoại lai. Để thực hiện các phương pháp khai phá dữ liệu trước hết cần thiết việc tiền xử lý, chuẩn hóa dữ liệu và lựa chọn phương pháp khai phá nào cho phù hợp với tập dữ liệu ta đang xét. Việc tiền xử lý dữ liệu không thuộc phạm vi nghiên cứu của bài báo này [2]. Các đại lượng đo đạc có thể ảnh hưởng tới phân tích dữ liệu, như sự thay đổi của các đại lượng giữa oC và oF trong đo đạc nhiệt độ, giữa phần trăm (%) và phần nghìn (‰) trong đo đạc độ muối, có thể dẫn tới các kết quả khác nhau. Khi chia nhỏ một thuộc tính thì đồng nghĩa với việc mở rộng miền giá trị của thuộc tính đó, sẽ dẫn đến việc thuộc tính đó có ảnh hưởng lớn 68 Hội thảo Khoa học Quốc gia 2023
- hơn các thuộc tính khác. Để tránh sự phụ thuộc vào cách chọn các đại lượng đo lường, dữ liệu nên được chuẩn hóa trước khi sử dụng. Một trong số cách thường dùng là chuyển miền dữ liệu về nằm trong khoảng [-1; 1] hoặc [0; 1]. Có rất nhiều phương pháp chuẩn hóa dữ liệu là chuẩn hóa min - max, chuẩn hóa z-score,… Trong nghiên cứu này sử dụng phương pháp chuẩn hóa dữ liệu min - max. Chuẩn hóa min - max thực hiện việc chuyển đổi tuyến tính dựa trên dữ liệu gốc. Gọi minA, maxA là giá trị lớn nhất và nhỏ nhất của thuộc tính A. Chuẩn hóa min - max sẽ ánh xạ một giá trị v của A tương ứng với một giá trị v’ trong khoảng [new_minA, new_maxA] thông qua công thức: v − minA =v′ ( new _ maxA − new _ minA ) + new _ minA (1) max A − minA 2.2. Phân cụm dữ liệu Một trong những bài toán quan trọng của khai phá dữ liệu là bài toán phân cụm dữ liệu. Thực tế nhiều tập dữ liệu chưa có nhãn, tức chưa phân loại thuộc vào lớp nào và việc gán nhãn cho các phần tử khá tốn kém. Một trong những giải pháp để xử lý vấn đề này là tự động nhóm các phần tử dữ liệu có độ tương tự nhau vào cùng một cụm. Các phần tử giữa các cụm khác nhau sẽ có độ khác biệt hẳn với nhau, độ đo khác biệt được đo dựa trên giá trị của các thuộc tính mô tả phần tử dữ liệu. Thông thường người ta sử dụng độ đo khoảng cách để đo độ khác biệt. Có ba cách tính độ đo khoảng cách: + Độ đo khoảng cách Manhattan: n d ( p= 1 , p2 ) ∑p i =1 1i − p2i (2) + Độ đo khoảng cách Euclide: n 2 d (= p1 , p2 ) ∑p i =1 1i − p2i (3) + Độ đo khoảng cách Minkowski: n q d (= p1 , p2 ) q ∑p i =1 1i − p2i (4) Trong nghiên cứu này, nhóm tác giả sử dụng công thức tính độ đo khoảng cách Euclide. Độ đo khoảng cách này được sử dụng trong phương pháp phân cụm dữ liệu theo thuật toán k-means. Giải thuật k-means: - Phân các phần tử dữ liệu vào các cụm dựa vào trọng tâm của các cụm. - Đầu vào: Tập dữ liệu D, số lượng các cụm k. - Đầu ra: Tập dữ liệu đã được phân thành k cụm. Thuật toán k - means được mô tả với các bước thực hiện như sau: 1. Chọn ngẫu nhiên k phần tử trong D làm trọng tâm ban đầu cho các cụm. 2. Phân các phần tử dữ liệu trong D vào các cụm dựa vào độ tương đồng của nó với trọng tâm của các cụm. Phần tử dữ liệu sẽ được phân vào cụm có độ tương đồng lớn nhất. Ở bước này, các phần tử dữ liệu di chuyển giữa các cụm để làm cực đại hóa độ tương tự giữa các phần tử dữ Hội thảo Khoa học Quốc gia 2023 69
- liệu bên trong 1 cụm (hay cực tiểu hóa khoảng cách giữa các phần tử dữ liệu). 3. Tính lại trọng tâm của các cụm. 4. Nhảy đến bước 2 cho đến khi quá trình hội tụ (không có sự gắn lại các phần tử dữ liệu giữa các cụm, hay trọng tâm của các cụm là không đổi). - Độ đo tương tự nội tại của 1 cụm: k J = ∑ ∑ simüp mi (5) = 1 ∈ ü i với: Ci, mi lần lượt là cụm thứ i và trọng tâm của nó; sim (p, mi) là độ tương tự giữa p và mi. Trọng tâm mi được tính: p mC = ∑ (6) p∈C C - Giải thuật k-means hoạt động sao cho hàm điều kiện của nó hội tụ, hàm hội tụ thường là hàm tổng bình phương lỗi được định nghĩa: ∑∑ p − m 2 =E C (7) C p∈C (a) (b) (c) Hình 2: Hình ảnh minh họa hoạt động của giải thuật k-means [2] Mô tả minh họa thuật toán: Ban đầu có tập dữ liệu, giả sử số cụm k = 3. + Hình 2a: Lựa chọn 3 phần tử dữ liệu ngẫu nhiên làm trọng tâm (được đánh dấu + bên cạnh), các phần tử dữ liệu được gán vào 3 cụm dựa vào độ tương tự của nó với 3 trọng tâm này. + Hình 2b: Các trọng tâm được tính lại dựa vào các phần tử trong 1 cụm, sau đó các phần tử dữ liệu được gán lại dựa vào trọng tâm mới (dấu +). + Hình 2c: Diễn tả quá trình tương tự và cuối cùng ta thu được 3 cụm đầu ra. Kết quả cuối cùng của k-means phụ thuộc rất nhiều vào cách lựa chọn k phần tử dữ liệu ban đầu làm trọng tâm. Do đó, ta có thể chạy thuật toán k-means một số lần và lấy kết quả của lần chạy có giá trị của hàm J theo công thức (5) là lớn nhất. Trường hợp tập dữ liệu quá lớn, trọng tâm của cụm thay đổi liên tục thì ta có thể thêm các điều kiện dừng sau đây: + Khi số lượng vòng lặp vượt qua một ngưỡng nào đó (nhược điểm của điều kiện này là chất lượng của giải thuật không được tốt vì nó chưa chạy đủ số vòng lặp cần thiết). + Khi giá trị của J nhỏ hơn một ngưỡng nào đó (đảm bảo chất lượng của các cụm đủ tốt hoặc 70 Hội thảo Khoa học Quốc gia 2023
- nó đã chạy đủ số vòng lặp cần thiết). + Khi hiệu của giá trị của J trong hai vòng lặp liên tiếp (Ji, Ji+1) nhỏ hơn một ngưỡng nào đó. Giả sử số vòng lặp của giải thuật là t thì độ phức tạp của thuật toán là O(nkt), với n là số lượng các phần tử dữ liệu, k là số các cụm; t
- STT Kinh độ (oE) Vĩ độ (oN) Nhiệt độ (T oC) Độ muối (S ‰) 6 113,00 21,00 25,83 33,72 7 114,00 21,00 25,95 33,74 8 115,00 21,00 26,08 33,76 9 116,00 21,00 26,21 33,79 10 117,00 21,00 26,36 33,84 … … … … … 129 117,00 9,00 28,62 33,34 Min 104,00 9,00 25,23 32,18 Max 117,00 21,00 28,62 33,89 Để tăng tính hiệu quả của thuật toán các dữ liệu đó được chuẩn hóa để đưa về các giá trị không thứ nguyên và nằm trong khoảng dữ liệu [0, 1]. Dữ liệu được chuẩn hóa theo phương pháp min - max theo công thức (1) đối với cả 4 giá trị: kinh độ, vĩ độ, nhiệt độ, độ muối. Sau khi chuẩn hóa các giá trị đều nằm trong khoảng [0, 1] và không có thứ nguyên (Bảng 2). Bảng 2. Bộ dữ liệu sau khi đã được chuẩn hóa (không thứ nguyên) STT Kinh độ Vĩ độ Nhiệt độ Độ muối 1 0,23077 1,00000 0,00000 0,08772 2 0,30769 0,83333 0,20354 0,36842 3 0,38462 0,75000 0,39528 0,83041 4 0,46154 0,66667 0,48083 0,90643 5 0,61538 1,00000 0,17404 0,92982 6 0,69231 1,00000 0,17699 0,90058 7 0,76923 1,00000 0,21239 0,91228 8 0,84615 1,00000 0,25074 0,92398 9 0,92308 1,00000 0,28909 0,94152 10 1,00000 1,00000 0,33333 0,97076 … … … … … 129 1,00000 0,00000 1,00000 0,68736 3.4. Kết quả phân cụm T - S và thảo luận Trong nghiên cứu của bài báo sử dụng giải thuật k-means phân cụm dữ liệu nhiệt - muối bề mặt biển đối với bộ dữ liệu nhiệt - muối tại các điểm dữ liệu (Hình 1). Giải thuật k-means được thực hiện bằng ngôn ngữ lập trình VBA (Visual Basic for Applications) trong môi trường ArcGIS 10.8 (ESRI). Các kết quả được tính đối với hai trường hợp: a) Số cụm k = 3 Bảng 3. Bộ dữ liệu sau khi phân cụm (với k = 3) Một số giá trị minh họa, các dữ liệu đã chuẩn hóa (không thứ nguyên) Cụm Kinh độ Vĩ độ Nhiệt độ Độ muối 3 0,23 1,00 0,00 0,09 3 0,31 1,00 0,02 0,22 72 Hội thảo Khoa học Quốc gia 2023
- 3 0,38 1,00 0,04 0,35 2 0,54 1,00 0,19 0,96 2 0,62 1,00 0,17 0,93 2 0,69 1,00 0,18 0,90 2 0,77 1,00 0,21 0,91 2 0,85 1,00 0,25 0,92 1 0,92 0,50 0,81 0,82 1 1,00 0,50 0,83 0,81 1 0,46 0,42 0,65 0,81 1 0,54 0,42 0,69 0,81 1 0,62 0,42 0,73 0,81 1 0,69 0,42 0,77 0,80 … … … … … 1 1,00 0,00 1,00 0,68 Thuật toán k-means được thực hiện với k = 3 sau quá trình tính lặp được dừng lại khi không có sự phân chia lại các cụm dữ liệu. Hay nói một cách khác là đến khi quá trình hội tụ (không có sự gắn lại các phần tử dữ liệu giữa các cụm, hay trọng tâm của các cụm là không đổi). Khi đó, ta có các giá trị thống kê tại Bảng 4. Bảng 4. Các đặc trưng của các cụm (với k = 3) Cụm Cụm 1 Cụm 2 Cụm 3 Số điểm giá trị T - S 11 55 63 Kinh độ Vĩ độ Nhiệt độ Độ muối Giá trị trọng tâm cụm (oE) (oN) (T oC) (S ‰) Chuẩn hóa 0,28 0,89 0,13 0,29 Cụm 1 (k1) Trước chuẩn hóa 107.64 19.68 25,67 32,68 Chuẩn hóa 0,70 0,75 0,50 0,93 Cụm 2 (k2) Trước chuẩn hóa 113.10 18.00 26,93 33,77 Chuẩn hóa 0,65 0,20 0,83 0,68 Cụm 3 (k3) Trước chuẩn hóa 112.45 11.40 28,04 33,34 Theo Bảng 4, số điểm thuộc cụm 1, cụm 2 và cụm 3 tương ứng là 11, 55 và 63. Trọng tâm của các cụm là các điểm k1, k2, k3 có các giá trị như Bảng 4. Ví dụ: cụm 1 có trọng tâm là điểm k1 với: Kinh độ 107.64oE; vĩ độ 19.68oN; nhiệt độ 25,67 oC; độ muối 32,68 ‰. Cụm 1 bao gồm các điểm nhiệt - muối (T - S) hầu như nằm trong vịnh Bắc Bộ. Như vậy, vùng nước bề mặt của cụm 1 bao gồm khối nước với độ tương tự cao của các yếu tố nhiệt muối. Cụm 1 có các đặc trưng trung bình nhiệt độ là 25,67 oC, độ muối 32,68 ‰. Cụm 2 chiếm phần lớn khu vực phía Bắc của Biển Đông có ranh giới với cụm 3 ở phía Nam Biển Đông dọc theo vĩ tuyến 15oN. Hội thảo Khoa học Quốc gia 2023 73
- Hình 3: Phân cụm dữ liệu (với k = 3) b) Số cụm k = 5 Bảng 5. Bộ dữ liệu sau khi phân cụm (với k = 3) Một số giá trị minh họa, các dữ liệu đã chuẩn hóa (không thứ nguyên) Cụm Kinh độ Vĩ độ Nhiệt độ Độ muối 4 0,23 1,00 0,00 0,09 4 0,38 1,00 0,04 0,35 3 0,54 1,00 0,19 0,96 3 0,62 1,00 0,17 0,93 3 0,69 1,00 0,18 0,90 5 0,38 0,75 0,40 0,83 3 0,62 0,75 0,50 0,98 2 1,00 0,58 0,78 0,86 5 0,38 0,50 0,59 0,88 1 0,46 0,25 0,71 0,71 1 0,54 0,25 0,74 0,73 2 0,62 0,25 0,78 0,73 2 0,69 0,25 0,81 0,73 2 0,77 0,25 0,84 0,73 1 0,46 0,17 0,74 0,70 … … … … … 1 1,00 0,00 1,00 0,68 Thuật toán k-means được thực hiện với k = 5, kết quả nhận được theo Bảng 6 số điểm thuộc cụm 1 là 11, cụm 2, 3, 4 và 5 tương ứng là 28, 31, 38 và 21. Trọng tâm của các cụm là các điểm k1, k2, k3, k4, k5 có các giá trị như Bảng 6. 74 Hội thảo Khoa học Quốc gia 2023
- Hình 4: Phân cụm dữ liệu (với k = 5) Ví dụ như cụm 1 có trọng tâm là k1 với: Kinh độ 107.64oE, vĩ độ 19.68oN, nhiệt độ 25,67 oC, độ muối 32,68 ‰; Cụm 2 có trọng tâm là k2 với: Kinh độ 111.15oE, vĩ độ 15.84oN, nhiệt độ 27,26 oC, độ muối 33,67 ‰; Cụm 3 có trọng tâm là k3 với: Kinh độ 114.14oE, vĩ độ 19.32oN, nhiệt độ 26,69 oC, độ muối 33,84 ‰,…; Cụm 5 có trọng tâm là k5 với: Kinh độ 108.81oE, vĩ độ 9.96oN, nhiệt độ 27,94 oC, độ muối 33,15 ‰. Bảng 6. Phân cụm với k = 5 Cụm Cụm 1 Cụm 2 Cụm 3 Cụm 4 Cụm 5 Số điểm giá trị T-S 11 28 31 38 21 Kinh độ Vĩ độ Nhiệt độ Độ muối Giá trị trọng tâm cụm (oE) (oN) (T oC) (S ‰) Chuẩn hóa 0,28 0,89 0,13 0,29 Cụm 1 (k1) Trước chuẩn hóa 107.64 19.68 25,67 32,68 Chuẩn hóa 0,55 0,57 0,60 0,87 Cụm 2 (k2) Trước chuẩn hóa 111.15 15.84 27,26 33,67 Chuẩn hóa 0,78 0,86 0,43 0,97 Cụm 3 (k3) Trước chuẩn hóa 114.14 19.32 26,69 33,84 Chuẩn hóa 0,84 0,25 0,86 0,73 Cụm 4 (k4) Trước chuẩn hóa 114.92 12.00 28,15 33,43 Chuẩn hóa 0,37 0,08 0,80 0,57 Cụm 5 (k5) Trước chuẩn hóa 108.81 9.96 27,94 33,15 Như vậy, đối với hai trường hợp thử nghiệm phân cụm khi k = 3 và k = 5 kết quả nhận được cho thấy cụm 1 có số các điểm dữ liệu thuộc cụm không thay đổi là 11, trọng tâm không thay đổi có tọa độ là kinh độ 107.641 oE; vĩ độ 19.68 oN. Đây là khối nước thuộc vịnh Bắc Bộ có các giá trị đặc trưng trung bình nhiệt độ là 25,67 oC, độ muối 32,68 ‰. Hội thảo Khoa học Quốc gia 2023 75
- 4. Kết luận Việc sử dụng bộ dữ liệu 2D nhiệt - muối bề mặt để thử nghiệm với phương pháp phân cụm dữ liệu theo giải thuật k-means bước đầu đã có thể phân cụm dữ liệu nhiệt - muối thành các vùng nước có sự tương đồng cao đối với các yếu tố nhiệt - muối. Từ đó có thể phân tích để đưa ra các đánh giá về nguồn gốc các vùng nước và sự di chuyển của chúng trên bề mặt biển. Đối với các bộ dữ liệu 3D gồm 3 giá trị tọa độ: x - kinh độ, y - vĩ độ, z - độ sâu (thêm giá trị độ sâu tầng nước chứa điểm dữ liệu), hoàn toàn có thể áp dụng phương pháp trên để phân cụm dữ liệu. Từ đó có thể xác định được các khối nước (3D) có độ tương đồng cao về các yếu tố nhiệt - muối. Đối với bộ dữ liệu nhiệt - muối thời gian thực (in-situ) có thể áp dụng thuật toán phân cụm với cùng số cụm k. Từ đó có thể đánh giá được sự thay đổi, di chuyển của các cụm (các khối nước) trong biển và đại dương theo thời gian dưới tác động của các quá trình động lực biển. Đây cũng là một trong những bài toán đặt ra đối với lĩnh vực động lực biển, hải dương học hiện nay. Có thể phân cụm dữ liệu đối với các yếu tố vật lý, hóa học, sinh học khác của nước biển. Thuật toán có thể phát triển khi bổ sung thêm các trọng số khác nhau đối với các yếu tố trong công thức tính khoảng cách trung bình. Các trọng số này được đưa ra dựa trên đánh giá chuyên gia về mức độ ảnh hưởng, tham gia của các yếu tố này đối với các quá trình hải dương học. Nhược điểm của thuật toán k-means: Khi xuất hiện 1 phần tử có giá trị lớn nhưng nó chỉ là 1 phần tử ngoại lệ, do đó ảnh hưởng đến trọng tâm của cụm chứa nó dẫn đến hệ quả là các cụm không được tối ưu và tổng bình phương lỗi sẽ cao. Từ đó, đề xuất sử dụng giải thuật k-medoids để tránh nhược điểm trên trong những nghiên cứu tiếp theo. TÀI LIỆU THAM KHẢO [1]. Phạm Văn Huấn (1991). Cơ sở hải dương học. Giáo trình giảng dạy. Nhà xuất bản Khoa học và Kỹ thuật, 36-37. [2]. Nguyễn Hà Nam, Nguyễn Trí Thành, Hà Quang Thụy (2013). Giáo trình khai phá dữ liệu. Nhà xuất bản Đại học Quốc gia Hà Nội. [3]. Đỗ Phúc (2016). Giáo trình “Khai phá dữ liệu - Data Mining. Nhà xuất bản. Đại học Quốc gia TP. Hồ Chí Minh, 273 trang. [4]. J. Han, M. Kamber and Jian Pei (2011). Data mining: Concepts and Techniques (3rd edition). Morgan Kaufmann. [5]. Bộ dữ liệu NOAA 2018. https://www.ncei.noaa.gov/archive/accession/NCEI-WOA18. BBT nhận bài: 14/7/2023; Chấp nhận đăng: 15/9/2023 76 Hội thảo Khoa học Quốc gia 2023
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Nghiên cứu ứng dụng màng Chitosan nano bạc trong bảo quản nhằm nâng cao chất lượng thanh long sau thu hoạch
10 p | 128 | 9
-
Nghiên cứu xử lý chất thải hữu cơ bằng ruồi Lính Đen (Hermetia illucens) quy mô phòng thí nghiệm
11 p | 13 | 8
-
Ứng dụng giải thuật di truyền vào bài toán vận tải tuyến tính
4 p | 104 | 7
-
Hệ thống xử lý nước mặn và nước lợ ứng dụng màng lọc nano (NF) để cấp nước ăn uống vùng ven biển
8 p | 58 | 5
-
Nghiên cứu ứng dụng mã nguồn mở xây dựng phần mềm quản lý và khai thác dữ liệu tài nguyên môi trường biển
7 p | 36 | 5
-
Ứng dụng vi khuẩn lactic trong sản xuất thử nghiệm nước tẩy rửa sinh học từ nước chua tàu hủ
8 p | 71 | 4
-
Nghiên cứu ứng dụng động cơ ô tô điện cho tàu thủy vỏ composite có tích hợp điện mặt trời (E–Boat)
10 p | 6 | 4
-
Nghiên cứu ứng dụng công nghệ Mobile GIS và GPS trong thu thập dữ liệu không gian về đất đai
6 p | 93 | 4
-
Tóm tắt Luận án Tiến sĩ Vật lý nguyên tử: Nghiên cứu xây dựng hệ thiết bị thu, nhận và xử lý số liệu dựa trên kỹ thuật DSP qua ứng dụng FPCTA phục vụ nghiên cứu hạt nhân thực nghiệm
26 p | 46 | 4
-
Sử dụng than tràm, than tre, than trấu và than hoạt tính gáo dừa làm giảm tác động của Fenobucarb đến Enzyme Cholinesterase được tách chiết từ cá rô đồng (anabas testudineus)
8 p | 55 | 3
-
Nghiên cứu ứng dụng mô hình HEC - HMS tính toán dự báo lũ sông Mã
3 p | 6 | 3
-
Nghiên cứu ứng dụng kỹ thuật khuyếch tán qua màng mỏng xác định tại chỗ hàm lượng kim loại linh động trong môi trường nước
5 p | 59 | 3
-
Nghiên cứu áp dụng thử nghiệm mô hình EFDC mô phỏng dòng chảy lũ hạ lưu sông Cả
11 p | 85 | 2
-
Ứng dụng tư liệu MODIS hỗ trợ công tác quản lý tài nguyên và môi trường
8 p | 51 | 2
-
Nghiên cứu áp dụng thử nghiệm mô hình mạng Bayes trong đánh giá các yếu tố ảnh hưởng đến diễn biến cửa sông Đà Diễn
13 p | 43 | 2
-
nghiên cứu xử lí ion kim loại nặng Cu2+, Ni2+ VÀ Pb2+ trong nước thải công nghiệp. Ứng dụng thu hồi ion Cu2+ trong nước thải phòng thí nghiệm hóa học và tinh chế CuSO4 làm hóa chất
5 p | 51 | 2
-
Nghiên cứu ứng dụng mô hình Noah-MP dự báo điều kiện khí tượng nông nghiệp vùng đồng bằng sông Hồng
13 p | 9 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn