TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

----------o0o----------

PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ LƢỢNG MƢA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO THỜI TIẾT CHO KHU VỰC VIỆT NAM

LUẬN VĂN THẠC SỸ KHOA HỌC

HÀ NỘI, 2012

TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-----------o0o-----------

PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ LƢỢNG MƢA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO THỜI TIẾT CHO KHU VỰC VIỆT NAM

: Khí tƣợng và Khí hậu học : 60 44 87

Chuyên ngành Mã số

LUẬN VĂN THẠC SỸ KHOA HỌC

NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. VŨ THANH HẰNG

HÀ NỘI, 2012

ii

MỤC LỤC MỤC LỤC ....................................................................................................................... 1 CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ ........................................................................ 6 1.1. Bài toán đánh giá dự báo trong khí tƣợng ............................................................ 6 1.1.1. Mục đích và ý nghĩa của bài toán đánh giá .................................................. 6 1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết ............................. 7 1.1.3. Sơ lược về tiêu chuẩn đánh giá ................................................................... 10 1.1.4. Các loại yếu tố dự báo ................................................................................ 11 1.1.5. Các thuộc tính của một dự báo tốt .............................................................. 12 1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến .............................................. 14 1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số ..................... 14 1.2.2. Phương pháp đánh giá đối với biến liên tục ............................................... 17 1.2.3. Phương pháp đánh giá đối với dự báo pha ................................................ 21 1.3. Cơ sở lý thuyết của phƣơng pháp đánh giá fuzzy .............................................. 24 1.4. Tình hình nghiên cứu chung liên quan đến đề tài trên thế giới và tại Việt Nam33 CHƢƠNG 2. KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ HRM, MM5 VÀ NGUỒN SỐ LIỆU SỬ DỤNG ..................................................................... 36 2.1. Giới thiệu về mô hình MM5 .............................................................................. 36 2.1.1. Giới thiệu mô hình ...................................................................................... 36 2.1.2. Cấu trúc mô hình ........................................................................................ 36 2.1.3. Hệ các phương trình thủy nhiệt động lực của MM5 ................................... 37 2.1.4. Điều kiện biên ............................................................................................. 37 2.1.5. Các quá trình tham số hóa .......................................................................... 38 2.2. Giới thiệu về mô hình HRM .............................................................................. 40 2.2.1. Giới thiệu mô hình ...................................................................................... 40 2.2.2. Cấu trúc lưới và phương pháp số ............................................................... 40 2.2.3. Hệ các phương trình cơ bản ....................................................................... 40 2.2.4. Các quá trình tham số hóa vật lý ................................................................ 41 2.3. Số liệu ................................................................................................................. 42 CHƢƠNG 3. KẾT QUẢ ĐÁNH GIÁ NHIỆT ĐỘ VÀ LƢỢNG MƢA CỦA MÔ HÌNH MM5 VÀ HRM CHO KHU VỰC VIỆT NAM ................................................. 45 3.1. Kết quả đánh giá nhiệt độ ................................................................................... 45 3.2. Kết quả đánh giá lƣợng mƣa .............................................................................. 51 3.3. Kết quả thử nghiệm đánh giá mƣa bằng phƣơng pháp fuzzy ............................ 66 3.3.1. Kết quả thử nghiệm với chuỗi số liệu mẫu ................................................. 66 3.3.2. Thử nghiệm đánh giá kết quả dự báo mưa bằng phương pháp fuzzy cho Việt Nam ................................................................................................................ 71 3.3.2.1. Thử nghiệm đánh giá cho dự báo mưa do bão gây ra ............................ 71 3.3.2.2. Thử nghiệm đánh giá cho dự báo mưa do không khí lạnh gây ra .......... 75 KẾT LUẬN ................................................................................................................... 79 TÀI LIỆU THAM KHẢO ............................................................................................. 81 Tiếng Việt: ................................................................................................................. 81 Tiếng Anh: ................................................................................................................. 81

1

DANH MỤC HÌNH VẼ Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết ................................................. 8 Hình 1.2. Sơ (NWP) .......... 16 Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trƣờng hợp dự báo 00 giờ, bên phải là trƣờng hợp dự báo 36 giờ (số liệu lấy từ trạm phao) .................................. 17 Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lƣợng dự báo mƣa .......... 21 Hình 1.5. a. Miền quan trắc; b. Đánh giá truyền thống (phải tƣơng thích cả về không gian và thời gian giữa dự báo và quan trắc); c. Đánh giá bằng phƣơng pháp fuzzy (vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc). .................................... 24 Hình 1.6. Cửa sổ quan trắc và dự báo của phƣơng pháp đánh giá fuzzy ...................... 25 Hình 2.1. Sơ đồ lồng ghép hai miền tính cho MM5 ...................................................... 39 Hình 2.2. Các trạm quan trắc trong miền tính ............................................................... 43 Hình 3.1. Nhiệt độ trung bình trong các tháng mùa hè tại các trạm. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) ....................................................... 46 Hình 3.2. Nhiệt độ trung bình trong các tháng mùa đông tại các trạm. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) .............................................. 47 Hình 3.3. Sai số ME của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) ............................................................................................................ 48 Hình 3.4. Sai số MAE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) ............................................................................................................ 49 Hình 3.5. Sai số RMSE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) .................................................................................................. 50 Hình 3.6. Hệ số tƣơng quan nhiệt độ của các mô hình cho toàn Việt Nam (a) và các khu vực (b, c, d) ............................................................................................................. 51 Hình 3.7. Giá trị trung bình mƣa tích lũy 24 giờ trong các tháng mùa hè. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) .............................................. 52 Hình 3.8. Giá trị trung bình mƣa tích lũy 24 giờ trong các tháng mùa đông. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) .......................................... 53 Hình 3.9. Điểm số ME của mƣa cho toàn Việt Nam và các khu vực trong các tháng mùa đông (a) và mùa hè (b) ........................................................................................... 54 Hình 3.10. Điểm số MAE của mƣa cho toàn Việt Nam và các khu vực trong các tháng mùa đông (a) và mùa hè (b) ........................................................................................... 55 Hình 3.11. Chỉ số RMSE của mƣa cho Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) ................................................................................................................. 56 Hình 3.12. Hệ số tƣơng quan của mƣa của các mô hình cho Việt Nam (a) và các khu vực (b, c, d) .................................................................................................................... 58 Hình 3.13 . Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa đông ........... 59 Hình 3.14. Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa hè ................ 59 Hình 3.15. Chỉ số TS các khu vực theo các ngƣỡng mƣa trong mùa đông ................... 61 Hình 3.16. Chỉ số TS các khu vực theo các ngƣỡng mƣa trong mùa hè ....................... 62 Hình 3.17. Chỉ số POD các khu vực theo các ngƣỡng mƣa trong mùa đông ............... 63 Hình 3.18. Chỉ số POD các khu vực theo các ngƣỡng mƣa trong mùa hè .................... 63 Hình 3.19. Chỉ số TSS các khu vực theo các ngƣỡng mƣa trong mùa đông................. 64 Hình 3.20. Chỉ số TSS các khu vực theo các ngƣỡng mƣa trong mùa hè ..................... 65 Hình 3.21. Vùng mƣa thám sát (trái) và vùng mƣa dự báo 3h (phải) (mm/h) lúc 15h UTC ngày 29/5/1999 ..................................................................................................... 66

2

Hình 3.22. Kết quả đánh giá bằng phƣơng pháp fuzzy cho hạn dự báo 03 giờ ngày 29/5/1999 ....................................................................................................................... 68 Hình 3.23. Vùng mƣa thám sát (trái) và vùng mƣa dự báo mƣa tích lũy 24h (phải) (mm/ngày) ngày 6/7/2007 ............................................................................................. 71 Hình 3.24. Kết quả đánh giá bằng phƣơng pháp fuzzy cho dự báo mƣa 24 giờ ngày 06/7/2007 ....................................................................................................................... 72 Hình 3.25. Vùng mƣa thám sát (trái) và vùng mƣa dự báo 24h (phải) (mm/ngày) ngày 23/12/2007 (không khí lạnh) ......................................................................................... 75 Hình 3.26. Kết quả đánh giá bằng phƣơng pháp fuzzy cho hạn dự báo mƣa tích lũy 24 giờ ngày 23/12/2007 ...................................................................................................... 76

3

MỞ ĐẦU

Nhƣ chúng ta đã biết, khí hậu nói chung và thời tiết nói riêng ảnh hƣởng đến mọi mặt đời sống kinh tế - xã hội của loài ngƣời. Vì vậy việc dự báo các yếu tố khí hậu cũng nhƣ thời tiết đang ngày càng quan trọng và cần thiết, trở thành mối quan tâm lớn của tất cả các quốc gia trên thế giới. Và giờ đây nó càng trở nên cấp bách hơn bao giờ hết khi ảnh hƣởng của

các nƣớc trên thế giới trong đó Việt Nam cũng là một trong

những quốc gia chịu ảnh hƣởng nặng nề của biến đổi khí hậu.

s

ở thử nghiệm

nghiệp vụ

hoặc nghiê

văn Trung ƣơng, RAMS, HRM, WRF

văn và , Trƣờng Khoa nhiên

Môi .

Mỗi mô hình số đều chứa đựng các sai số sinh ra do số liệu ban đầu, do

các quá trình tham số hóa trong khí quyển chƣa đủ chính xác... ,

cần phải tìm ra đƣợc những điểm mạnh của mô hình để khai thác và sử dụng đồng thời chỉ ra những điểm yếu để tìm cách khắc phục, đem lại hiệu quả cao hơn cho công tác dự báo. Bên cạnh đó, kết quả đánh giá còn có thể cho biết về sai số hệ thống của mô hình, là cơ sở cho việc hiệu chỉnh mô hình cho tốt hơn. Chính vì vậy, vấn đề đánh giá định lƣợng sản phẩm của các mô hình số là rất cần thiết và có ý nghĩa khoa học.

Bài toán đánh giá dự báo là đánh giá mức độ chính xác của mô hình hoặc mức độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quan trắc thực tế nhằm chỉ ra những ƣu điểm, nhƣợc điểm của mô hình, giúp cho các chuyên gia nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất lƣợng dự báo của mô hình. Hơn nữa, kết quả đánh giá dự báo có thể đƣa ra những thông tin giúp các nhà quản lý quyết định có nên đầu tƣ cơ sở vật chất, trang thiết bị để phát triển mô hình hay không.

và lƣợng mƣa

và . Chính vì vậy, trong

4

khuôn khổ của luận văn tác giả tập trung vào việc đánh giá chất lƣợng dự báo 24h của nhiệt độ, lƣợng mƣa của hai mô hình dự báo thời tiết số đƣợc sử dụng phổ biến hiện nay ở Việt Nam là mô hình HRM và mô hình MM5. Ngoài phần Mở đầu, Kết luận và Tài liệu tham khảo, luận văn đƣợc bố cục cụ thể nhƣ sau:

Chƣơng 1. Tổng quan về bài toán đánh giá dự báo trong khí tƣợng và các

chỉ số đánh giá.

Chƣơng 2. Khái quát về các mô hình dự báo thời tiết số HRM, MM5 và

nguồn số liệu sử dụng.

Chƣơng 3. Kết quả đánh giá nhiệt độ và lƣợng mƣa của mô hình MM5 và

HRM cho khu vực Việt Nam.

5

CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ

1.1. Bài toán đánh giá dự báo trong khí tƣợng

1.1.1. Mục đích và ý nghĩa của bài toán đánh giá

Đánh giá chất lƣợng dự báo thời tiết nói chung là phƣơng pháp thẩm tra đánh giá và xác định định lƣợng mức độ chính xác của mô hình hoặc mức độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quan trắc thực tế nhằm chỉ ra những ƣu điểm, nhƣợc điểm của mô hình, giúp cho các chuyên gia nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất lƣợng dự báo của mô hình.

Có ba lý do quan trọng nhất để đánh giá dự báo là:

- Kiểm tra chất lƣợng dự báo – dự báo chính xác đến đâu và sẽ đƣợc cải

tiến ra sao.

- Nâng cao chất lƣợng dự báo: Bƣớc đầu tiên để tiến tới dự báo tốt hơn là

việc tìm ra cái gì mà ngƣời làm dự báo đang làm sai.

- So sánh chất lƣợng của các hệ thống dự báo khác nhau – đến mức độ nào thì một hệ thống dự báo đƣợc cho là dự báo tốt hơn so với những hệ thống dự báo khác và bằng cách nào mà hệ thống dự báo đó đem lại kết quả tốt hơn nhƣ vậy.

Các hoạt động đánh giá chỉ hữu ích khi chúng đƣa ra đƣợc các quyết định về sản phẩm dự báo đang đƣợc đánh giá. Quyết định đó sẽ làm phát sinh những thay đổi trong sản phẩm dự báo hoặc cách thức dự báo đƣợc thực hiện sau đó, hoặc quyết định đó xác nhận và khẳng định sản phẩm dự báo thỏa mãn cho các mục đích của ngƣời sử dụng và của xã hội. Các sản phẩm dự báo đƣợc phổ biến rộng rãi trong công chúng thì phải đƣợc viết đủ khách quan để ngƣời sử dụng có thể kiểm tra, còn các số liệu quan trắc khí quyển thực tế phải đƣợc thể hiện một cách chính xác những gì diễn ra trong thực tế. Hơn nữa, một vài phƣơng pháp đánh giá còn đòi hỏi quan trắc tại một điểm cũng có thể đại diện một cách đầy đủ và khách quan các hiện tƣợng thời tiết xảy ra trong một khu vực.

Chính tính cấp thiết trong các hoạt động đánh giá chất lƣợng dự báo thời tiết cho thấy mục đích đánh giá phải đƣợc thiết lập trƣớc khi hệ thống đánh giá

6

đƣợc xác lập. Từ đây các hoạt động đánh giá trong khí tƣợng cũng nhƣ trong các hoạt động dự báo thời tiết có thể đƣợc phân chia thành hai mục đích chính là đánh giá hành chính và đánh giá khoa học.

Mục đích hành chính: Các thông tin đánh giá trong mục đích quản lý hành chính nhằm cung cấp thông tin cho việc mua sắm các trang thiết bị chính nhƣ các máy tính có cấu hình cao hơn, tốc độ xử lý nhanh hơn,… Xác định khi nào, hoặc có nên thay thế một sản phẩm đang đƣợc sử dụng bằng một sản phẩm dự báo mới hay không, và còn nhiều các quyết định khác để phát triển tối ƣu nguồn lực về con ngƣời cũng nhƣ các nguồn trang thiết bị khác phục vụ cho công tác phát hành một bản tin dự báo thời tiết.

Mục đích khoa học: Đánh giá với mục đích khoa học là xác định một cách đầy đủ và chi tiết ƣu điểm cũng nhƣ nhƣợc điểm của một sản phẩm dự báo. Các hoạt động này giúp tìm ra các biện pháp thích hợp để cải thiện chất lƣợng dự báo phục vụ cũng nhƣ cung cấp các thông tin để hoạch định phƣơng hƣớng cho việc nghiên cứu và phát triển tiếp theo.

Ngoài ra một số tác giả khác còn xét đến mục đích kinh tế nhƣng đó là

vấn đề rất phức tạp nên trong giới hạn luận văn này không đƣợc đề cập đến.

1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết

Hình 1.1 là một kiểu mô hình chung nhất để đánh giá dự báo các yếu tố thời tiết, ngoài ra có thể có các mô hình đánh giá khác nữa. Tuy nhiên đây là mô hình cho thấy bức tranh chi tiết nhất về quan hệ giữa đặc trƣng của phép đánh giá các đại lƣợng đo và các giải pháp khác nhau để có thể lựa chọn. Sơ đồ này sử dụng cho việc quyết định các bƣớc cần thiết phải đƣợc làm trƣớc khi lựa chọn các phƣơng pháp đánh giá cụ thể.

Tất cả các phƣơng pháp đánh giá đều bắt đầu từ việc tập hợp các tập số liệu quan trắc và dự báo (hình bình hành ở trên cùng trong Hình 1.1). Bƣớc tiếp theo là xử lý số liệu, bƣớc này phụ thuộc vào việc quyết định của ngƣời sử dụng (hình thoi trong sơ đồ). Quan trọng nhất là việc quyết định của ngƣời sử dụng lựa chọn mục đích đánh giá hành chính hay khoa học nhƣ đã nêu ở trên.

Khi mục đích đánh giá đã đƣợc xác định, tiến hành phân loại các tập số liệu mẫu theo mục đích đã định trƣớc. Phân loại nghĩa là chia nhỏ các phần tử trong tập mẫu ra thành hai hay nhiều nhóm theo một nguyên tắc đã định sẵn, sau đó thực hiện đánh giá cho từng nhóm một cách riêng biệt. Trên Hình 1.1 đã chỉ 7

ra hai kiểu phân loại là “Phân loại ngoại bộ” và “Phân loại nội bộ”.

Các tập số liệu dùng để đánh giá

Mục đích khoa học

Quản lý hành chính

Phân loại ngoại bộ

Phân loại ngoại bộ

Phân loại nội bộ theo quan trắc

Phân loại nội bộ theo dự báo

Phân loại nội bộ theo dự báo

Biến liên tục

Biến liên tục

Biến pha

Biến pha

Biến liên tục

Bảng liên hợp

Đồ thị điểm

Sai số trung bình tuyệt đối

Bảng liên hợp

Đồ thị điểm

Điểm Berier RPS

Sai số bình phƣơng trung bình

Bảng độ tin cậy

Độ giảm phƣơng sai

Điểm kỹ năng Brier

Hệ số phân tán

Phân loại ngoại bộ là kiểu phân loại mà nguyên tắc lựa chọn độc lập đối với các yếu tố đang cần đƣợc đánh giá. Kiểu phân loại ngoại bộ phổ biến nhất là cho phép xác định các biến đổi trong đánh giá theo thời gian trong ngày hoặc theo mùa. Phân loại ngoại bộ có thể tiến hành ở bất cứ thời điểm nào trong quá trình trƣớc khi tính toán các đánh giá thống kê thực tế, và có thể đƣợc làm cho cả mục đích hành chính hay mục đích khoa học.

Biến pha Nguyên lý phát hiện tín hiệu

Độ lệch (BIAS)

Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết

8

Xuất phát từ các câu hỏi đặt ra đối với đánh giá khoa học thấy rằng, cần có một nhu cầu phân loại cao hơn đối với tập mẫu. Chẳng hạn nhƣ, nếu ta quan tâm đến dự báo cực trị thì tập mẫu sẽ phải đƣợc phân nhóm để tách các giá trị cực trị đó ra từ chuỗi các sự kiện chung. Kiểu phân nhóm này đƣợc gọi là “phân loại nội bộ” bởi vì nguyên tắc phân loại đƣợc quyết định bởi mục đích đánh giá và sử dụng chính yếu tố đang đƣợc đánh giá. Có hai cách để thực hiện phân loại nội bộ, trên Hình 1.1 cho thấy sự khác nhau trong kết quả đánh giá thu đƣợc từ hai cách phân loại đó.

Phân loại theo quan trắc nghĩa là phân loại theo giá trị của các yếu tố khí tƣợng quan trắc đƣợc. Sau đó, các tiêu chuẩn đánh giá có thể đƣợc tính toán cho từng nhóm giá trị quan trắc và giá trị thống kê đƣợc tạo thành này gọi là giá trị có điều kiện đối với quan trắc. Một ví dụ cho phân bố có điều kiện của dự báo là một giá trị đặc biệt hay một phạm vi các giá trị quan trắc.

Phân loại theo dự báo nghĩa là phân loại theo giá trị của các yếu tố khí tƣợng đƣợc dự báo. Cũng tƣơng tự nhƣ trên, các giá trị thống kê đƣợc tính toán theo cách phân loại này đƣợc gọi là điều kiện dự báo. Việc lựa chọn kiểu phân loại phụ thuộc vào mục đích đánh giá. Trong nhiều trƣờng hợp cần phải sử dụng kết hợp cả hai cách phân loại trên để đƣa ra một kết quả hoàn chỉnh. Hơn nữa, nhƣ đã thấy ở sơ đồ trên, những đại lƣợng đánh giá khác nhau (hình ô van bên dưới) đặc trƣng cho một kiểu phân nhóm khác và đƣa ra nhiều thông tin khác nhau về sản phẩm.

Một cách khác, trong đánh giá hành chính, ngƣời ta ít quan tâm chi tiết đến việc biểu diễn những biến theo các giá trị khác nhau trong dự báo. Mà thay vào đó, các câu hỏi đặt ra đều mang tính chung chung và chỉ cần một câu trả lời ngắn gọn xúc tích nào đó. Vì vậy, phân loại nội bộ có thể vẫn đƣợc thực hiện nhƣng nó hiếm khi đƣợc dùng đến. Tuy nhiên, ƣu điểm lớn của đánh giá hành chính là biểu diễn chất lƣợng sản phẩm chỉ bằng vài con số hoặc việc so sánh thuận tiện hay hƣớng xác minh dễ dàng. Bản chất chung của đánh giá hành chính có mối liên hệ mật thiết với các quy tắc điểm số tổng kết đƣợc chỉ ra ở Hình 1.1. Đôi khi việc tóm tắt cũng trở nên khó khăn khi phải cố gắng tổng kết tất cả các thông tin về chất lƣợng sản phẩm chỉ trong một điểm số để cung cấp cho nhà quản lý. Nhu cầu tóm tắt thông tin đánh giá chỉ bằng một con số gây ra một áp lực lớn cho việc thiết kế hệ thống đánh giá để đảm bảo đƣợc rằng:

- Điểm số đƣợc lựa chọn theo yêu cầu là đáng tin cậy;

9

- Các sự kiện hợp thành đều đƣợc xem xét công bằng nhƣ nhau trong các

điểm số;

Hạn chế chung của bản tổng kết đánh giá này là tất cả các sự kiện đều đƣợc xem là nhƣ nhau trong quá trình trung bình hóa. Điều này làm cho việc thực hiện thuận tiện hơn (việc tính toán sẽ đơn giản hơn khi sử dụng đại lƣợng trung bình), nhƣng cũng vì thế mà rất khó để có thể tìm đƣợc một hàm trọng số chính xác và phản ánh đủ khách quan cho các sự kiện hợp thành của mục đích sử dụng mà không có bất kỳ trở ngại nào đối với các thuộc tính của điểm số. Làm thế nào để đƣa ra các hàm trọng số của các sự kiện hợp thành trong đánh giá tổng hợp vẫn còn là vấn đề chƣa giải quyết đƣợc.

Trƣớc đây, các điểm số đánh giá đã đƣợc đánh giá quá cao. Vì thế các dự báo viên sớm thất vọng khi phải cố gắng sử dụng chúng để trả lời các câu hỏi về các vấn đề mang tính chất khoa học. Tính chất của việc đánh giá tổng kết đó hạn chế việc sử dụng trong mục đích khoa học bởi thiếu sự phân loại đánh giá bằng những điều kiện cho trƣớc. Ví dụ, điểm số tổng kết không thể nói mƣa dự báo tốt nhƣ thế nào trong các trƣờng hợp ngƣỡng thấp mà chỉ có thể nói mƣa đƣợc dự báo tốt nhƣ thế nào một cách chung chung. Không thể nói, dƣới điều kiện nào mô hình phần tử hữu hạn khu vực RFE (Regional Finite Element model) tốt hơn mô hình phổ, chỉ có thể nói rằng mô hình RFE tốt hơn hoặc xấu hơn một chút so với mô hình phổ.

1.1.3. Sơ lược về tiêu chuẩn đánh giá

Các điểm số dùng trong đánh giá đƣợc minh họa theo từng cặp ở phía dƣới Hình 1.1 cho thấy mối quan hệ giữa chúng. Ví dụ, bảng liên hợp và đồ thị điểm là hoàn toàn tƣơng tự nhau, chúng cung cấp các dạng thông tin nhƣ nhau, bảng liên hợp xuất phát từ yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến dự báo liên tục. Điểm tổng kết luôn đƣợc phân loại theo cách này: Điểm Brier và điểm RP đều đo chính xác các đặc tính của khả năng xảy ra hay biến pha, chúng tƣơng tự sai số bình phƣơng trung bình của dự báo theo biến liên tục. Chú ý rằng dự báo pha không tƣơng tự nhƣ sai số trung bình tuyệt đối. Có hai loại đại lƣợng đo đƣợc phân loại tƣơng ứng theo dự báo và quan trắc là “Bảng độ tin cậy” và “Nguyên lý phát hiện tín hiệu”. Trong khi đó bảng liên hợp và đồ thị điểm lại tổng quát hơn, cho phép phân loại theo một trong hai cách hoặc theo cả hai cách. Nguyên lý phát hiện tín hiệu là một ý tƣởng mới mẻ và hiện nay chƣa đƣợc sử dụng rộng rãi.

10

Các điểm số liệt kê trên Hình 1.1 gồm 3 loại, đó là: điểm số tuyến tính,

điểm số toàn phƣơng (bậc hai) và điểm số kỹ năng.

Điểm số toàn phƣơng đƣa ra trọng lƣợng của sai số theo bình phƣơng của chúng trong khi điểm số tuyến tính cho sai số có giá trị bậc nhất. Vì vậy điểm số toàn phƣơng thƣờng đƣa ra trọng số sai số lớn hơn là điểm số tuyến tính và điểm số này rất phù hợp trong các trƣờng hợp sai số lớn thực sự nghiêm trọng hơn sai số nhỏ.

Điểm số kỹ năng đƣợc xây dựng để đánh giá mối quan hệ giữa dự báo và một giá trị chuẩn nào đó. Giá trị chuẩn đƣợc chọn lựa để mô tả một dự báo không kỹ năng.

Ba tiêu chuẩn đƣợc sử dụng để so sánh là: chuẫn ngẫu nhiên, chuẩn quán tính và chuẩn khí hậu. Tính ngẫu nhiên mô tả sự phỏng đoán thuần túy và không yêu cầu hiểu biết tri thức, chuẩn quán tính là một dự báo xác định và yêu cầu các hiểu biết về điều kiện thời tiết, còn chuẩn khí hậu là một dự báo trạng thái thời tiết diễn ra trong khoảng thời gian dài và cần phải có sự hiểu biết về tiến trình lịch sử của thời tiết. Điểm số kỹ năng đƣợc biểu diễn trong công thức sau:

trong đó SC là điểm có đƣợc từ dự báo, ST là điểm đạt đƣợc từ dự báo chuẩn và PS là điểm từ dự báo hoàn hảo. Điểm số kỹ năng có thể đƣợc hình thành từ việc sử dụng bất kỳ một trong các điểm số. Điểm số kỹ năng phổ biến nhất dựa trên nền tảng của điểm Brier (điểm kỹ năng Brier), điểm RP (điểm kỹ năng RP), các giá trị của bảng ngẫu nhiên (điểm Heidke) và sai số trung bình tuyệt đối. Tiêu chuẩn thƣờng đƣợc sử dụng nhất là chuẩn khí hậu, còn điểm Heidke lại thƣờng xuyên đƣợc kết hợp với chuẩn ngẫu nhiên. Không có điểm kỹ năng cơ bản nào là quan trọng hơn, chúng bình đẳng nhƣ nhau và đều biểu hiện đặc tính của kỹ năng.

1.1.4. Các loại yếu tố dự báo

Sau khi giải quyết xong những vấn đề về phân loại và những yêu cầu của một mô hình đánh giá đã đặt ra cần lựa chọn một phƣơng pháp thích hợp để đáp ứng các yêu cầu đó. Hình chữ nhật trên Hình 1.1 đƣa ra gợi ý cho cách lựa chọn phù hợp tùy thuộc vào bản chất dự báo đƣợc đánh giá. Phụ thuộc vào mục đích đánh giá ngƣời ta chia ra thành hai dạng dự báo là: Dự báo các đại lƣợng liên tục

11

và dự báo pha.

* Yếu tố dự báo liên tục: Là các yếu tố đƣợc dự báo tại một giá trị nhất định hoặc trong một khoảng giá trị nào đó. Trong số các yếu tố thời tiết thì nhiệt độ, áp suất, và gió là hay đƣợc dự báo theo cách này.

* Yếu tố dự báo pha: Là các yếu tố dự báo có thể xảy ra hoặc không xảy ra. Chẳng hạn nhƣ xét sự xuất hiện của giáng thủy (có hoặc không), hoặc xét dạng giáng thủy (băng, tuyết, nƣớc).

Một số yếu tố có thể đƣợc dự báo liên tục hoặc dự báo pha tùy thuộc vào yêu cầu của ngƣời sử dụng trong quá trình làm dự báo. Tuy nhiên khi một dự báo mà cho kết quả biến thiên liên tục thì phải đƣợc đánh giá theo pha bởi vì tất cả những thông tin đó rất cần thiết cho ngƣời sử dụng.

* Dự báo xác suất đƣợc xem nhƣ là dự báo pha nhƣng tổng quát hơn. Trong đó, mỗi pha đƣợc gán bằng một xác suất xảy ra và tổng tất cả xác suất phải bằng 1 (tức là một cái gì đó phải xảy ra). Dự báo pha là một dự báo xác suất thu hẹp, ở đây xác suất chỉ có hai trƣờng hợp xảy ra hoặc là 0% hoặc là 100% và hiển nhiên là một trong hai trƣờng hợp ấy chắc chắn sẽ xảy ra.

1.1.5. Các thuộc tính của một dự báo tốt

Do tính chất phức tạp của bài toán đánh giá, việc lựa chọn, sử dụng những chỉ số nào để phản ánh đƣợc tất cả các khía cạnh là vấn đề khó khăn. Chẳng hạn, khi nói về đánh giá chất lƣợng dự báo (có thể là của một mô hình) Murphy (1993) đã đƣa ra 3 khái niệm để chỉ mức độ “tốt” của một dự báo là:

1) Độ chắc chắn (Consistency) của dự báo là mức độ phù hợp giữa dự báo

và kiến thức hiểu biết của dự báo viên;

2) Chất lƣợng dự báo (Quality) là mức độ phù hợp giữa dự báo với thực tế

xảy ra;

3) Ý nghĩa (hay giá trị - Value) của dự báo là mức độ mà dự báo có thể giúp cho ngƣời ra quyết định thấy rõ hoặc đạt đƣợc lợi ích nào đó về kinh tế hoặc lợi ích khác.

Cũng theo Murphy (1993), đã đƣa ra 9 khái niệm đƣợc gọi là 9 thuộc tính

đóng góp cho độ chắc chắn của dự báo nhƣ sau:

- Độ lệch (Bias): Là mức độ phù hợp giữa trung bình quan trắc và trung

12

bình dự báo.

- Tính liên kết (Association): Là mức độ chặt chẽ về quan hệ tuyến tính giữa dự báo và quan trắc(chẳng hạn, hệ số tƣơng quan là thƣớc đo mối quan hệ tuyến tính này).

- Độ chính xác (Accuracy):

dự báo và thực tế ( )

. K

.

- Kỹ năng dự báo (Skill):

một dự báo tham chiếu nào đó. Dự báo tham chiếu nói chung là dự báo không có kỹ năng, nhƣ dự báo ngẫu nhiên (may rủi), dự báo quán tính, hoặc dự báo khí hậu. Kỹ năng ám chỉ sự tăng lên của độ chính xác do hệ thống dự báo “thông minh”.

- Độ tin cậy (Reliability): Là sự phù hợp trung bình giữa các giá trị dự báo và các giá trị quan trắc. Nếu tất cả các trƣờng hợp dự báo đƣợc xem xét khi đó độ tin cậy trên toàn bộ giống nhƣ thiên hƣớng (bias). Nếu các trƣờng hợp dự báo đƣợc phân chia thành các khoảng khác nhau hoặc theo các phân hạng thì độ tin cậy giống nhƣ độ lệch có điều kiện (conditional bias). Thông thƣờng độ tin cậy đƣợc cải tiến nhờ Bias. Nhƣng sau khi cải tiến làm độ tin cậy của các dự báo tƣơng đƣơng tăng lên thì chính Bias lại sẽ bị khử đi.

- Độ phân giải (Resolution): Là năng lực của dự báo có thể phân loại tập các sự kiện thành các tập con có phân bố tần suất khác nhau. Điều đó có nghĩa là phân bố nhận đƣợc khi “A” đƣợc dự báo khác với phân bố nhận đƣợc khi “B” đƣợc dự báo. Thậm chí nếu các dự báo là sai, hệ thống dự báo có độ phân giải nếu nó có thể phân chia một cách thành công phân bố của các dạng khác nhau. (Nói cách khác, có thể tách biệt đƣợc các trƣờng hợp dự báo thành những tập có cùng phân bố).

- Độ nhọn (hay độ nhạy bén - Sharpness): Là xu hƣớng của dự báo có thể dự báo đƣợc các giá trị cực trị. Độ nhọn là một thuộc tính của dự báo, tƣơng tự nhƣ độ phân giải, một dự báo có thể có thuộc tính này ngay cả khi nó sai (trong trƣờng hợp này nó có thể là kém tin cậy);

- Độ phân biệt (hay độ phân lớp - Discrimination): Là khả năng của dự

13

báo có thể tách biệt các quan trắc thành những trƣờng hợp có tần suất dự báo cao hơn, tức là có khả năng phân lớp. Là khả năng của dự báo có thể tách biệt các quan trắc thành những trƣờng hợp có tần suất dự báo cao hơn, tức là có khả năng phân lớp.

- Độ biến động (hay tính không chắc chắn - Uncertainty): Là sự dao động của các giá trị quan trắc trong tập mẫu đánh giá và không phụ thuộc vào giá trị dự báo. Đối với các biến đƣợc dự báo theo pha thì độ biến động là 1 nếu sự kiện xảy ra và 0 nếu sự kiện không xảy ra. Đại lƣợng này liên quan đến độ “khó khăn” của dự báo. Độ biến động càng lớn có nghĩa là sẽ có những dao động lớn với nhiều tần số khác nhau trong yếu tố dự báo đang đƣợc đánh giá và dĩ nhiên việc dự báo sẽ khó khăn hơn. Độ biến động của từng tập số liệu sẽ rất khác nhau và do đó, việc so sánh giữa các con số đánh giá thống kê của tập số liệu là hết sức mạo hiểm vì chúng thƣờng rất nhạy với độ biến động.

Theo truyền thống thì đánh giá dự báo tập trung nhấn mạnh vào độ chính xác và kỹ năng dự báo. Nhƣng cũng cần lƣu ý rằng các thuộc tính khác của dự báo cũng ảnh hƣởng mạnh đến giá trị dự báo.

1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến

1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số

a. Những nguyên nhân gây sai số trong mô hình dự báo số

Để ứng dụng đƣợc một mô hình khu vực hạn chế vào trong nghiệp vụ dự báo thời tiết đòi hỏi trƣớc hết là phải đánh giá đƣợc sai số dự báo của mô hình so với thực tế. Các nguyên nhân có thể đƣa đến dự báo sai của mô hình số có thể tóm tắt nhƣ sau:

- Các công thức toán học để mô tả các quá trình vật lý xảy ra trong khí

quyển là chƣa hoàn chỉnh;

- Ảnh hƣởng của địa hình đến kết quả dự báo (thƣờng không đƣợc mô

hình số mô tả hoàn chỉnh);

- Các quá trình vật lý và các sơ đồ tham số hóa chƣa thật sự hoàn thiện;

- Một số giả thiết không thực sự phù hợp đƣợc đƣa ra để có thể giải đƣợc

hệ phƣơng trình thủy nhiệt động lực học mô tả khí quyển thực.

- Điều kiện biên và điều kiện ban đầu của các biến khí tƣợng là chƣa hoàn

14

chỉnh và phụ thuộc khá nhiều vào địa hình. Các trạm thám sát thƣa thớt, đặc biệt là vùng nhiệt đới;

- Các kết quả nhận đƣợc chứa đựng những sai số khi giải các công thức

toán học bằng phƣơng pháp gần đúng, ...

b. Nguyên lý chung cho việc đánh giá mô hình dự báo số

Hình 1.2

Hình

1.1 số liệu quan trắc và bộ số liệu này phải tƣơng

, số liệu quan trắc có thể sẽ đƣợc phân

tích về lƣới dự báo hoặc

phẩm

. Trong trƣờng hợp này

, điều quan trọng trong đánh giá mô hình là phải luôn ghi nhớ thủ tục kiểm tra lại số liệu quan trắc khi đánh giá kết quả.

Để đánh giá một sản phẩm mô hình số có hiệu quả, yêu cầu đặt ra là những vấn đề quyết định cần giải quyết phải đƣợc làm cho mục đích đánh giá trƣớc khi một hệ thống đánh giá đƣợc thiết lập. “Đánh giá hành chính” trả lời câu hỏi về xu hƣớng trong kỹ năng và độ chính xác của mô hình và thƣờng đƣợc sử dụng để so sánh độ chính xác của hai mô hình khác nhau. Tƣơng tự nhƣ đánh giá các yếu tố thời tiết cho những mục đích hành chính, có một khuynh hƣớng nhằm giảm thiểu các kết quả chỉ bằng một vài con số thông qua việc sử dụng các điểm số tổng kết.

“Đánh giá khoa học”

diễn của mô hình để đƣa ra

thông tin có thể phản hồi lại cho c

front. Bộ số liệu đánh giá phải đƣợc sắp xếp cẩn thận theo các đặc trƣng đó, và điều này có thể đƣợc thực hiện theo một trong hai hƣớng đó là theo cơ sở của các đặc trƣng quan trắc hay theo cơ sở của các đặc trƣng dự báo.

15

“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá

theo mùa hoặc theo thời gian chạy mô hình

Các tập số liệu dùng để đánh giá

Mục đích khoa học

Quản lý hành chính

Phân loại ngoại bộ

Phân loại nội bộ

Sai số trung bình tuyệt đối

Sai số bình phƣơng trung bình

Thẩm định trung tâm áp suất

Sai số đƣờng đi

Điểm kỹ năng (Độ suy giảm phƣơng sai)

Các trƣờng hợp nghiên cứu

Độ lệch trung tâm

Hệ số phân tán

Lỗi hệ thống

.

Phân loại theo không gian

Độ lệch (BIAS)

Tƣơng quan dị thƣờng

Điểm số S1

Hình 1.2

(NWP)

16

. Khi phân loại theo không gian đƣợc tiến hành theo mục đích khoa học, các khu vực có quy mô dƣới lƣới đƣợc ƣu tiên lựa chọn để phản ánh các chế độ khí hậu khác nhau nhƣ các khu vực có địa hình đồi núi, các vùng núi khuất gió, bờ biển,…

1.2.2. Phương pháp đánh giá đối với biến liên tục

1.2.2.1. Phương pháp toán đồ tụ điểm

Hệ số tƣơng quan = 0.595

Hệ số tƣơng quan = 0.789

Tốc độ gió mô hình PPR (kts)

Tốc độ gió mô hình PPR (kts)

Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trường hợp dự báo 00 giờ, bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao)

Toán đồ tụ điểm là phƣơng pháp đơn giản nhất, chủ yếu phục vụ cho các biến liên tục nhƣ nhiệt độ và gió, thƣờng gồm tất cả các điểm số ứng với mỗi cặp dự báo – quan trắc tƣơng ứng trên cùng một đồ thị với tung độ và hoành độ có tỷ lệ nhƣ nhau. Trƣờng hợp lý tƣởng là các điểm số nằm trên một đƣờng thẳng đi qua gốc tọa độ và tạo với trục hoành một góc 450 (giá trị dự báo bằng giá trị quan trắc). Đƣờng 450 này thƣờng đƣợc vẽ ra để thuận tiện cho việc nội suy các điểm rời rạc.

Hình 1.3 là một ví dụ về toán đồ tụ điểm cho dự báo gió biển. Mỗi điểm “x” đại diện cho ít nhất một lần xuất hiện của cặp dự báo – quan trắc riêng lẻ. Trên mỗi đồ thị còn có một đƣờng thẳng thứ hai mà có thể không đi qua gốc tọa độ, đó chính là đƣờng hồi quy bình phƣơng tối thiểu tƣơng ứng với tập số liệu

17

quan trắc.

Nếu dự báo là hoàn hảo thì đƣờng hồi quy sẽ trùng với đƣờng 450. Sự phù hợp giữa đƣờng hồi quy và đƣờng 450 cho thấy chất lƣợng của dự báo. Chất lƣợng dự báo sẽ giảm đi nếu đƣờng hồi quy có khuynh hƣớng lệch theo chiều nằm ngang hơn. Nếu đƣờng hồi quy nằm ngang hoàn toàn thì khi đó quan trắc hoàn toàn độc lập với dự báo.

Một đại lƣợng đánh giá khác có thể ƣớc lƣợng từ đồ thị điểm là sai số bình phƣơng hoặc độ lệch. Hình 1.3 chỉ ra một đồ thị điểm khác cho dự báo nhiệt độ khách quan (sản phẩm mô hình thống kê). Tập số liệu mẫu là 701 trƣờng hợp (số liệu này đƣợc lấy từ 11 trạm vùng Đại Tây Dƣơng - CASSP). Trong đồ thị này không thấy xuất hiện các dấu “x” nhƣ đồ thị trƣớc, thay vào đó là các con số. Các số trên đồ thị này biểu hiện số trƣờng hợp các cặp giá trị nhiệt độ quan trắc - dự báo tƣơng ứng với đồ thị điểm.

Một đồ thị điểm mô tả phân loại cơ bản từ tất cả các trƣờng hợp đƣợc miêu tả riêng rẽ. Điều này cho phép cân nhắc một cách linh hoạt cho phân tích số liệu. Giả sử -200C và +100C đƣợc chọn nhƣ là ngƣỡng của nhiệt độ cực trị, giá trị này có thể nhận đƣợc từ phân tích trên đồ thị. Tất cả các điểm, ở đây nhiệt độ quan trắc nằm trong giới hạn của cực trị và không có nhiệt độ dự báo đƣợc gọi là miền các sự kiện dự báo sót (missed events) và tất cả các điểm ở đây giá trị dự báo nằm trong phạm vi cực trị và không quan trắc đƣợc gọi là miền báo động sai (false alarms). Miền các sự kiện dự báo sót và miền báo động sai có thể thấy trên đồ thị. Qua đồ thị có thể thấy, tất cả nhiệt độ có giá trị cao nhất đã bị bỏ sót (dự báo dƣới ngƣỡng) trong khi đó nhiệt độ thấp xảy ra ở cả hai miền các sự kiện dự báo sót và miền báo động sai.

Phân loại trên cơ sở quan trắc chỉ cho phép nhận dạng miền các sự kiện dự báo sót (đƣờng ngang vẽ đậm ở các giá trị ngƣỡng). Phân loại trên cơ sở dự báo chỉ cho phép nhận dạng đƣợc miền báo động sai (đƣờng đứng vẽ đậm ở các giá trị ngƣỡng). Từ đây có thể thấy rằng điều quan trọng nhất là phải sử dụng cả hai kiểu phân loại để nhận đƣợc thông tin đầy đủ và hoàn hảo về một sản phẩm đang đƣợc đánh giá. Ví dụ những giá trị thấp nhất đã bị bỏ sót có thể lấy lại đƣợc đơn giản bằng cách tƣởng tƣợng di chuyển tất cả các điểm trên đồ thị đến bên trái giá trị ngƣỡng 100C, nhƣng cái giá phải trả cho việc hiệu chỉnh này là sự tăng lên đột ngột trong miền báo động sai. Điều này sẽ không nhìn thấy nếu

18

phân loại trên cơ sở của một mình quan trắc. Do vậy luôn luôn có thể hiệu đính cho sự kiện cực trị đã bị bỏ sót.

Phân loại trên cơ sở dự báo có lẽ có ích hơn cho hiểu biết về ý nghĩa thực của dự báo. Thông tin chi tiết về ý nghĩa của dự báo cho các nhiệt độ khác nhau có thể nhận đƣợc từ một chuỗi phân bố có điều kiện cho mỗi nhiệt độ dự báo hoặc cho phạm vi của nhiệt độ.

1.2.2.2 Các chỉ số đánh giá

Trong các công thức dƣới đây, Fi và Oi tƣơng ứng là giá trị mô hình và giá trị quan trắc của một biến nào đó (nhiệt độ, lƣợng mƣa), i=1,2,…, N, N là dung lƣợng mẫu.

a. Sai số trung bình (ME - Mean Error)

(1. 1)

Giá trị của ME nằm trong khoảng (-∞, +∞). ME cho biết xu hƣớng lệch trung bình của giá trị dự báo so với giá trị quan trắc, nhƣng không phản ánh độ lớn của sai số. ME dƣơng cho biết giá trị dự báo vƣợt quá giá trị quan trắc và ngƣợc lại. Mô hình đƣợc xem là “hoàn hảo” (không thiên lệch về một phía nào cả) nếu ME=0.

b. Sai số tuyệt đối trung bình (MAE-Mean Absolute Error)

(1. 2)

Giá trị MAE nằm trong khoảng (0,+∞). MAE biểu thị biên độ trung bình của sai số mô hình nhƣng không nói lên xu hƣớng lệch của giá trị dự báo và quan trắc. Khi MAE = 0, giá trị của mô hình hoàn toàn trùng khớp với giá trị quan trắc, mô hình đƣợc xem là “lý tƣởng”. Thông thƣờng MAE đƣợc sử dụng cùng với ME để đánh giá độ tin cậy. Chẳng hạn, nếu MAE của sản phẩm khác biệt hẳn so với ME thì việc hiệu chỉnh là hết sức mạo hiểm. Trong trƣờng hợp ngƣợc lại, khi mà MAE và ME tƣơng đối “sát” với nhau thì có thể dùng ME để hiệu chỉnh sản phẩm dự báo một cách đáng tin cậy.

c. Sai số bình phƣơng trung bình MSE (Mean Square Error)

19

(1. 3)

MSE là trung bình của tổng bình phƣơng của hiệu giữa các giá trị mô hình và quan trắc, phản ánh mức độ dao động của sai số. Mô hình là “lí tƣởng” nếu MSE=0.

d. Sai số bình phƣơng trung bình quân phƣơng (RMSE - Root mean square

Error)

(1. 4)

Sai số bình phƣơng trung bình là một trong những đại lƣợng cơ bản và thƣờng đƣợc sử dụng phổ biến cho việc đánh giá kết quả của mô hình dự báo số trị. Ngƣời ta thƣờng hay sử dụng đại lƣợng sai số bình phƣơng trung bình quân phƣơng (RMSE) biểu thị độ lớn trung bình của sai số. Đặc biệt RMSE rất nhạy với những giá trị sai số lớn. Do đó nếu RMSE càng gần MAE sai số mô hình càng ổn định và có thể thực hiện việc hiệu chỉnh sản phẩm mô hình. Giống nhƣ MAE, RMSE không chỉ ra độ lệch giữa giá trị dự báo và giá trị quan trắc. Giá trị của RMSE nằm trong khoảng (0,+ ∞).

Khi so sánh MAE và RMSE ta thấy: RMSE ≥ MAE. Còn RMSE = MAE khi và chỉ khi tất cả các sai số có độ lớn nhƣ nha0u: RMSE = MAE =0.

e. Hệ số tƣơng quan (Correlation coefficient)

(1. 5)

Hệ số tƣơng quan (r) cho phép đánh giá mối quan hệ tuyến tính giữa tập giá trị dự báo và tập giá trị quan trắc. Giá trị của nó biến thiên trong khoảng -1 đến 1, giá trị hoàn hảo bằng 1. Giá trị tuyệt đối của hệ số tƣơng quan càng lớn thì mối quan hệ tuyến tính giữa hai biến càng chặt chẽ. Hệ số tƣơng quan dƣơng phản ánh mối quan hệ cùng chiều (đồng biến), ngƣợc lại, hệ số tƣơng quan âm biểu thị mối quan hệ ngƣợc chiều (nghịch biến) giữa dự báo và quan trắc.

20

1.2.3. Phương pháp đánh giá đối với dự báo pha

Đánh giá thống kê theo loại (categorical statistics) là loại tiêu chuẩn đánh giá sự phù hợp giữa sự xảy ra hiện tƣợng dự báo và hiện tƣợng quan trắc tại nút lƣới.

Các điểm số đánh giá đƣợc dựa vào bảng ngẫu nhiên sau (Damrath, 2002):

Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa

Hits (H) = dự báo có + quan trắc có

Misses (M) = dự báo không + quan trắc có

False alarms (F) = dự báo có + quan trắc không

Correct negatives (CN) = dự báo không + quan trắc không

Dƣới đây là một vài điểm số thƣờng dùng trong đánh giá dự báo mƣa định lƣợng ở trên thế giới:

a. Chỉ số FBI (BS hay FBI - Bias score): Đánh giá tỷ số giữa vùng dự báo và vùng thám sát.

FBI < 1: vùng dự báo nhỏ hơn vùng thám sát

FBI > 1: vùng dự báo lớn hơn vùng thám sát

FBI = 1: vùng dự báo trùng với vùng thám sát (giá trị lý tƣởng)

(1. 6)

FBI là tỉ lệ giữa số lần có xảy ra hiện tƣợng theo mô hình và theo quan trắc. Giá trị FBI biến đổi trong khoảng từ 0 đến +∞.

21

FBI càng nhỏ hơn 1 mô hình cho kết quả càng sai sót nhiều; FBI càng lớn hơn 1 mô hình cho kết quả càng sai khống nhiều. Đại lƣợng FBI chỉ cho biết mức độ phù hợp giữa mô hình và quan trắc về tần số xuất hiện nhƣng không phản ánh độ chính xác của mô hình.

b. Xác suất phát hiện (Probability of Detection - POD)

(1. 7)

POD đƣợc hiểu là xác suất xuất hiện hiện tƣợng, bằng tỷ số giữa số lần trùng khớp giữa mô hình và quan trắc khi hiện tƣợng có xuất hiện (hits) và tổng số lần xuất hiện hiện tƣợng trong thực tế. POD cho biết khả năng thành công của mô hình, có giá trị trong khoảng từ 0 đến 1, lý tƣởng là POD = 1 (mô hình đƣợc xem là hoàn hảo). POD càng gần 1 thì độ chính xác của mô hình càng cao. POD chỉ nhạy đối với những hiện tƣợng không dự báo đƣợc (misses events) chứ không nhạy đối với phát hiện sai (false alarms).

c. Tỷ phần phát hiện sai (False Alarms Ratio - FAR)

(1. 8)

FAR cho biết tỷ lệ mô phỏng/dự báo khống của mô hình (mô hình cho kết quả có nhƣng thực tế hiện tƣợng không xảy ra). Giá trị của FAR biến đổi từ 0 cho đến 1. FAR=0 khi F=0, tức tỷ lệ khống của mô hình bằng 0. Giá trị của FAR càng gần 0 thì mô hình càng tốt (tối ƣu). Ngƣợc lại, FAR càng tiệm cận tới 1 (tƣơng đƣơng với H tiến gần tới không) thì mô hình càng kém.

d. Điểm số thành công (Critical Success Index – CSI hay Threat Score – TS)

(1. 9)

TS phản ánh mối quan hệ giữa số lần mô hình cho kết quả hiện tƣợng có xuất hiện và số lần quan trắc đƣợc hiện tƣợng có xuất hiện. Nó có thể đƣợc xem nhƣ thƣớc đo độ chính xác của mô hình khi bỏ qua không xem xét những trƣờng hợp hiện tƣợng không xuất hiện. Phạm vi biến thiên của TS từ 0 đến 1. TS=0 nghĩa là mô hình không có kỹ năng, TS=1 – mô hình là hoàn hảo.

22

e. Điểm số thành công hợp lý (Equitable Threat Score – ETS)

ETS có giá trị tốt nhất là 1.

(1. 10)

trong đó Hrandom là số dự báo đúng ngẫu nhiên xác định nhƣ sau

(1. 11)

ETS cho biết mối quan hệ giữa số lần mô hình đúng (kể cả đúng do ngẫu nhiên) so với quan trắc trong những trƣờng hợp hiện tƣợng có xuất hiện trong thực tế. Phạm vi biến thiên của ETS là 1/3 đến 1. ETS=1 – mô hình là hoàn hảo. Chỉ số ETS thƣờng đƣợc dùng trong đánh giá dự báo mƣa của mô hình số vì tính “công bằng” của nó. Chỉ số này rất nhạy cảm với các dự báo đúng, vì nó xử lý “F” và “M” theo cùng một cách, không phân biệt nguồn gốc của sai số dự báo.

f. Điểm số so le (Odds Ratio)

(1. 12)

g. Điểm số Hanssen & Kuipers (HK hay TSS)

(1. 13)

TSS phản ánh mức độ tách biệt giữa những kết quả của mô hình đối với các sự kiện có xảy ra và không xảy ra hiện tƣợng. Giá trị của TSS nằm trong khoảng -1 đến 1. TSS=0 là mô hình không có kỹ năng, TSS=1 thì mô hình là hoàn hảo.

h. Độ chính xác (Percentage Correct – PC hay Fraction Correct - FC)

(1. 14)

FC phản ánh tỷ lệ trùng khớp giữa kết quả của mô hình và quan trắc trong cả hai pha có và không xuất hiện hiện tƣợng. Giá trị của PC biến đổi trong khoảng từ 0 đến 1. Nếu mô hình là hoàn hảo, tức kết quả mô hình trùng khớp hoàn toàn với quan trắc thì PC bằng 1, ngƣợc lại, PC sẽ bằng 0 nếu tất cả mọi trƣờng hợp kết quả của mô hình đều ngƣợc với quan trắc. PC càng lớn độ chính xác mô phỏng, dự báo của mô hình càng cao.

23

1.3. Cơ sở lý thuyết của phƣơng pháp đánh giá fuzzy

Những dự báo có độ phân giải cao của các mô hình số trị có thể khá chính xác và cung cấp cho dự báo viên những thông tin rất hữu ích. Tuy nhiên, khi đánh giá sử dụng các phƣơng pháp truyền thống chúng lại thƣờng có kết quả không tốt bởi vì rất khó khăn trong việc dự báo trùng khớp hoàn toàn với quan trắc ở độ phân giải cao. Đánh giá “fuzzy” tiến tới trùng khớp bằng cách làm giảm yêu cầu về mức độ chính xác giữa dự báo và quan trắc. Mấu chốt của cách tiếp cận fuzzy là việc sử dụng một cửa sổ không gian (spatial window) hoặc vùng lân cận các điểm dự báo và/hoặc quan trắc. Việc xử lý số liệu trong cửa sổ có thể bao gồm trung bình (nâng qui mô) hoặc ngƣỡng phụ thuộc vào phƣơng pháp fuzzy đặc biệt đƣợc sử dụng và mô hình giải quyết ẩn nó liên quan tới việc làm thế nào để có một dự báo tốt. Kích thƣớc của vùng lân cận có thể đƣợc thay đổi để cung cấp các kết quả đánh giá ở nhiều kích thƣớc, do đó cho phép ngƣời sử dụng xác định tại kích thƣớc nào thì dự báo có kỹ năng tốt.

Phƣơng pháp đánh giá fuzzy cho phép vùng dự báo có thể không thật trùng khớp với vùng thám sát. Mức chênh lệch cho phép đƣợc xác định bởi một vùng lân cận địa phƣơng. Sự khác nhau giữa phƣơng pháp đánh giá truyền thống và phƣơng pháp đánh giá fuzzy đƣợc thể hiện trong Hình 1.5.

Không phải dễ dàng chỉ ngay ra đƣợc kích thƣớc vùng lân cận thích hợp. Nó còn phụ thuộc vào khoảng cách giữa các ô lƣới, độ phân giải thời gian, và trạng thái thời tiết, vì vậy một giá trị đơn lẻ có thể không thích hợp cho tất cả các loại dự báo cũng nhƣ các miền tính.

Phƣơng pháp đánh giá fuzzy giải quyết đƣợc điều này bằng cách thay đổi kích thƣớc của miền lân cận, bởi vậy nó đem lại các thông tin cho chất lƣợng dự báo nhƣ là một hàm của quy mô.

a. Quan trắc

c. Dự báo (Đánh giá fuzzy)

b. Dự báo (Đánh giá truyền thống) Hình 1.5. a. Miền quan trắc; b. Đánh giá truyền thống (phải tương thích cả về không gian và thời gian giữa dự báo và quan trắc); c. Đánh giá bằng phương pháp fuzzy (vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc).

24

Một số phƣơng pháp đánh giá fuzzy giả định rằng các ô lƣới lân cận của vùng quan trắc cũng đƣợc mở rộng tƣơng ứng nhƣ vùng dự báo. Đây là một trong những cách thể hiện sự không chắc chắn trong quan trắc. Trƣờng hợp này đƣợc thể hiện trong hình 1.6, đƣợc gọi là vùng quan trắc – vùng dự báo.

a. Quan trắc

b. Dự báo

(Đánh giá fuzzy)

(Đánh giá fuzzy)

Hình 1.6. Cửa sổ quan trắc và dự báo của phương pháp đánh giá fuzzy

Để mô tả kỹ phƣơng pháp đánh giá fuzzy, một số các ký hiệu đƣợc thiết

lập nhƣ sau:

Gọi X là giá trị quan trắc trong một ô lƣới, Y là giá trị dự báo trong ô lƣới

tƣơng ứng. biểu thị giá trị các ô lƣới xung quanh điểm lƣới đang xét, trong đó

s là quy mô lƣới. biểu thị giá trị trung bình toàn miền tính.

Ix cho biết sự kiện quan trắc đƣợc trong hộp lƣới (có xảy ra = 1, không và xảy ra = 0), và Iy cho biết sự kiện dự báo đƣợc trong hộp lƣới tƣơng ứng.

biểu thị các sự kiện quan trắc và dự báo trong vùng lân cận các hộp lƣới

đang xét. Việc quyết định sử dụng phƣơng pháp nào để xác định sự kiện trong

vùng lân cận phụ thuộc vào từng phƣơng pháp đánh giá fuzzy đang đƣợc sử

dụng, nhƣ chúng ta sẽ xét đến dƣới đây. Một số phƣơng pháp đòi hỏi phải

đƣợc tách riêng, ví dụ nhƣ 0 hoặc 1, trong khi đó các phƣơng pháp khác cho phép sử dụng các giá trị trung gian.

Ký hiệu là thành phần của hộp lƣới tại vùng lân cận quan trắc và

là thành phần của hộp lƣới tại vùng lân cận dự báo:

25

trong đó n là số ô lƣới trong vùng dự báo.

Bằng cách so sánh dự báo với các sự kiện quan trắc ta có thể tính đƣợc sai

số quy mô phụ thuộc dựa trên một so sánh các giá trị trong ô lƣới và

trong vùng lân cận.

Phƣơng pháp đánh giá fuzzy khá đơn giản: Chọn một tập hợp các quy mô với các chỉ số: s = 1, 2, …., S và ngƣỡng cƣờng độ sự kiện với các chỉ số k = 1, 2, ..., K, thông qua đó để tính toán các kết quả đánh giá fuzzy.

a. Đối với mỗi quy mô s: Với mỗi điểm thám sát, thu thập các ô lƣới dự báo trong cửa sổ quy mô s xung quanh điểm thám sát đó. Nếu trƣờng hợp là “vùng thám sát – vùng dự báo” thì cũng thu thập những thám sát tƣơng ứng trong cửa sổ tƣơng ứng.

b. Đối với mỗi ngƣỡng cƣờng độ k quy mô tính toán ( , , ,

, )k phụ thuộc vào việc lựa chọn các biến của mô hình (đƣợc đề cập

dƣới đây).

c. Đối với mỗi ngƣỡng cƣờng độ k có một điểm số đại diện cho toàn

miền.

Mỗi phƣơng pháp đánh giá fuzzy cho kết quả là một ma trận (k x s) các điểm số đánh giá đối với các điểm số thay đổi tùy thuộc vào quy mô (s) và cƣờng độ (k).

Bằng cách kiểm tra việc thực hiện dự báo theo cách này có thể quyết định đƣợc sự kết hợp quy mô, cƣờng độ tại dự báo với độ phân giải cao hữu ích. Kết quả đánh giá fuzzy có thể đƣợc tập hợp theo dự báo tháng, dự báo mùa, hoặc các hiện tƣợng thời tiết tƣơng tự để tìm ra quy luật có tính hệ thống.

a. Các phương pháp đánh giá fuzzy đặc trưng

Tất cả các phƣơng pháp đều sử dụng một trong hai loại đã đƣợc đề cập đến ở trên là: “một điểm quan trắc – một vùng dự báo”, và “một vùng quan trắc – một vùng dự báo”. Tùy vào từng nhu cầu cụ thể về thông tin chất lƣợng dự báo mà ngƣời dùng có thể lựa chọn phƣơng pháp phù hợp.

26

a. Nâng quy mô (Upscaling):

Là một trong những phƣơng pháp đánh giá đơn giản và xuất hiện sớm nhất. Các giá trị dự báo và quan trắc đƣợc lấy trung bình theo các quy mô tăng dần và đƣợc đem so sánh bằng cách sử dụng các điểm số truyền thống. Mô hình đƣa ra một dự báo có chất lƣợng thì tƣơng thích với quan trắc khi lấy trung bình trong các quy mô lƣới thô. Yates và Cộng sự (CS) (2006) sử dụng cả các biến liên tục và các biến pha để đánh giá dự báo nâng quy mô, trong khi Zepeda-Arce và CS(2000) và Weygandt cùng CS (2004) đánh giá dự báo mƣa bằng cách sử dụng các điểm số truyền thống. Trong trƣờng hợp này quy tắc để tính toán các hiện tƣợng trong vùng lân cận là:

Tƣơng tự đối với .

b. Độ phủ tối thiểu (Minimum coverage)

Damrath (2004) giả định rằng trong các vùng lân cận sự kiện quan trắc và dự báo không có độ nhọn, tức là các hiện tƣợng có thể xảy ra ở bất cứ đâu trong

vùng lân cận đó, với xác suất tƣơng ứng là và . Ông đã thử nghiệm

với hai mô hình cơ bản. Đầu tiên, thiết lập một độ phủ tiêu chuẩn tối thiểu, dự báo tốt nếu nhƣ các hiện tƣợng đƣợc dự báo vƣợt quá một xác suất phủ tối thiểu của vùng dự báo đã chọn, hiện tƣợng xảy ra trong vùng lân cận đƣợc xác định nhƣ sau:

Trong đó Pe là giá trị nhỏ nhất trong vùng lân cận, giá trị đó phải nằm trong các hộp lƣới của cả dự báo và quan trắc. Yêu cầu đặt ra là hiện tƣợng phải xảy ra ít nhất một lần trong vùng lân cận đó. Một số ứng dụng đòi hỏi các hiện

tƣởng phải xảy ra trong nửa vùng lân cận trƣớc khi thiết lập = 1. Các điểm số

dự báo xác suất thƣờng dùng là xác suất phát hiện POD, tỉ lệ báo động sai FAR, điểm cảnh báo ETS đƣợc tính cho các hiện tƣợng xảy ra trong vùng lân cận.

c. Fuzzy lôgic (Fuzzy logic)

27

Phƣơng pháp lôgic đƣợc Damrath (2004) xác định các hiện tƣợng xảy ra

trong vùng lân cận nhƣ xác suất của chính các thành phần trong hộp lƣới:

nằm trong khoảng từ 0 đến 1. Một dự báo có thể chính xác hoặc không

cũng giống nhƣ trƣờng hợp quan trắc. Khả năng này đƣợc gọi là “có độ tin cậy”.

Phƣơng pháp này có thể chỉ ra dự báo chuẩn và dự báo sai cùng một lúc. Thích hợp cho các mô hình có dự báo chính xác nhiều hơn dự báo sai. Nguyên tắc của phƣơng pháp này đƣợc đƣa ra bởi Zimmerman (2001), các yếu tố trong bảng tổng hợp đƣợc xác định bởi trọng số nhỏ nhất hỗ trợ cho các nguyên tắc đối với dự báo đúng, dự báo khống, tỉ lệ báo động sai, và khả năng loại trừ đúng. Nhƣợc điểm của phƣơng pháp này là các yếu tố trong bảng khó có thể thể lên đến 1 đƣợc.

Quan trắc

1-

Min(

,

) Min(1-

,

)

Dự báo

1-

Min(

,1-

) Min(1-

,1-

)

Vì vậy, Ebert (2002) đã cải tiến phƣơng pháp này bằng cách dùng các xác

suất đồng thời để xác định các yếu tố trong bảng:

Quan trắc

1-

(1-

)

Dự báo

1-

(1-

)

(1-

)(1-

)

Các điểm số trong bảng này đƣợc tính từ các yếu tố trong bảng phía trên

d. Bảng liên hợp các sự kiện (Multi-event contingency table)

Atger (2001) đã đƣa ra một bảng liên hợp các sự kiện để ƣớc lƣợng sự phù hợp giữa dự báo và quan trắc cho nhiều ngƣỡng đã định. Bảng liên hợp truyền thống 2x2 chỉ sử dụng cho một sự kiện đơn lẻ, các giá trị của biến không vƣợt quá một ngƣỡng nhất định. Bảng này không những có thể mở rộng các ngƣỡng cƣờng độ mà còn có thể tăng kích thƣớc, ví dụ nhƣ kích thƣớc về không

28

gian, thời gian. Bất kỳ một thành phần lân cận nào cũng có thể đƣợc xác

định theo nguyên tắc.

Với Pe=1/n, tức là bắt buộc phải có ít nhật một sự kiện xảy ra trong hộp lƣới dự báo, tƣơng ứng với sự kiện quan trắc đƣợc ở tâm của cửa sổ quan trắc. “Một dự báo tốt là dự báo có ít nhất một sự kiện gần với sự kiện quan trắc đƣợc”. Điều này cho thấy sai số dự báo là chấp nhận đƣợc.

e. Cường độ - quy mô (Intensity-scale)

Phƣơng pháp này đƣợc đề xuất bởi Casati (2004), quy mô phụ thuộc vào

tại mỗi quy mô hiệu sai số, Iy - Ix, sử dụng mảng hai chiều. Hiệu sai số

có thể coi nhƣ là tổng sai số trung bình tại quy mô lớn nhất và thay đổi tùy vào tính chất đặc trƣng của quy mô đó. Các giá trị bình phƣơng trung bình đƣợc tính theo miền và phụ thuộc vào điểm kỹ năng (ss) có tính đến dự báo ngẫu nhiên không có kỹ năng. Trƣờng hợp này một dự báo tốt là dự báo đúng nhiều hơn là quan trắc sắp xếp ngẫu nhiên. Phƣơng pháp này không giống với các phƣơng pháp khác, phƣơng pháp này sử dụng cửa sổ rời rạc hơn là các cửa sổ động, chính vì vậy phƣơng pháp này đƣợc thực hiện khá nhanh.

f. Điểm kỹ năng phần tử (Fractions skill score - FBS).

Phƣơng pháp này đƣợc phát triển bởi Roberts (2005), so sánh trực tiếp các phần tử trong sự kiện trong các cửa sổ bao quanh vùng quan trắc và dự báo. Nguyên tắc cơ bản của mô hình là một dự báo tốt khi tần suất các sự kiện dự báo gần trùng với tần suất các sự kiện quan trắc. Thay vì suy luận từ các tần suất xuất hiện sự kiện các vùng lân cận, chúng đƣợc sử dụng trực tiếp để so sánh các điểm số Brier, nhƣ sau:

Trong đó N là số các ô lƣới trong cửa sổ. FBS là một trong những trƣờng hợp (bằng một nửa) của điểm số Brier nhƣng giá trị quan trắc lúc này chỉ nhận giá trị từ 0 đến 1. Kết quả có thể đƣợc biểu diễn nhƣ là một điểm số kỹ năng các phần tử

29

Số hạng thứ hai trong mẫu số là khả năng dự báo kém nhất để không có sự chồng chéo giữa dự báo và quan trắc. FSS nhận giá trị trong khoảng từ 0 đến

thì FSS tiến dần tới

1, giá trị tối ƣu bằng 1. Nếu độ lệch dự báo là 2b/(b2-1) khi quy mô tăng lên.

g. Phương pháp tiếp cận thực tế (Pragmatic approach)

Phƣơng pháp này sử dụng các dự báo trƣớc trong một vùng lân cận các điểm quan trắc. Thay vì đánh giá xác suất dự báo trong các ô lân cận dựa trên các quan trắc, trong miền lân cận đƣợc chọn để đánh giá dựa trên các giá trị quan trắc ở trung tâm hộp lƣới. Phƣơng pháp này sử dụng điểm Brier (BS) và điểm kỹ năng Brier (BSS) để đánh giá các dự báo thành công. Quyết định tới mô hình: Một dự báo tốt là dự báo có khả năng cao phát hiện sự kiện có xảy ra hay không. Để xác định mức độ phát triển của dự báo thực tiễn nó đƣợc đem so sánh với đầu ra của mô hình, BSS đƣợc đối chiếu với đầu ra của mô hình mà có xác suất bằng 0 hoặc 1 tại điểm quan trắc. Để áp dụng, thay vì tính toán BSS với lƣu ý đến khí hậu tiêu biểu trong toàn miền quan trắc.

h. Phương pháp thực nghiệm hoàn hảo (Practically perfect hindcast)

Brooks (1998) đã phát triển một phƣơng pháp đánh giá fuzzy để giải quyết vấn đề đánh giá các sự kiện hiếm. Rất khó khăn nếu không nói là không thể để đạt đƣợc một dự báo hoàn hảo cho các sự kiện hiếm hoi, do đó, điểm số nhƣ số điểm cảnh báo (TS) thƣờng có giá trị rất thấp. Mục đích đƣa ra các điểm số đánh giá trong trƣờng hợp này là so sánh nó với số điểm đạt đƣợc bằng một "thực nghiệm hoàn hảo", đó là dự báo không gian đã đƣợc xác định bởi một kiến thức dự báo hoàn hảo của dự báo viên về các quan trắc trƣớc đó .

Nếu quan trắc trên một mạng lƣới có độ phân giải cao (ví dụ, dữ liệu

radar) thì xác suất có thể đƣợc ƣớc lƣợng từ quan trắc trong các vị trí lân

cận. Đối với mỗi quy mô nhất định, các ngƣỡng xác suất đƣợc xác định nhƣ sau:

30

toàn miền khi Ngƣỡng xác suất đƣợc đƣa ra là giá trị điểm cảnh báo TS lớn nhất trên đƣợc đánh giá dựa trên việc xác định Ix tƣơng ứng đƣợc định

nghĩa là vùng mƣa sát thực. Sử dụng ngƣỡng dự báo xác suất đƣợc tính và

đánh giá với Ix tƣơng ứng.

i. Căn bậc hai có điều kiện của RPS (Conditional square root of RPS)

Germann và Zawadzki (2004) áp dụng phƣơng pháp một điểm quan trắc – một vùng dự báo để đánh giá lƣợng mƣa. Tần suất xuất hiện của các giá trị dự báo giáng thủy tăng theo hàm lôga thời gian, đƣợc dùng để phân cấp các điểm số xác suất (RPS). Căn bậc hai của nó có thể đƣợc hiểu nhƣ là độ lệch chuẩn của xác suất. Thông thƣờng mƣa quan trắc đƣợc dùng để đánh giá kết quả để so sánh với các sự kiện khác của dự báo. Điểm số này là căn bậc hai của RPS (ký hiệu là CSRR)

Trong trƣờng hợp này, dự báo rất hữu ích nếu nó có một xác suất cao phù

hợp với giá trị quan sát.

j. Vùng liên đới RMSE (Area related RMSE)

Rezacova et al. (2006) đề xuất, cách tiếp cận của phƣơng pháp này là so sánh các giá trị dự báo lƣới phân giải cao và quan trắc trong vùng lân cận để đƣa

ra sai số quy mô phụ thuộc vào quan trắc . Dự báo tốt là dự báo có độ phân

bố cƣờng độ gần đúng với thám sát. Phƣơng pháp này tính toán diện tích liên quan đến sai số bình phƣơng trung bình RMSE. Các giá trị quan trắc và dự báo đƣợc sắp xếp từ nhỏ đến lớn sau đó RMSE đƣợc tính từ chuỗi số liệu đƣợc sắp xếp đó. Quy mô phụ thuộc vào giá trị RMSE có thể đƣợc vẽ trên bản đồ hoặc chúng có thể đƣợc tổng hợp trên các miền.

k. Tóm tắt các phương pháp đánh giá fuzzy phổ biến

Tùy vào từng nhu cầu cụ thể về thông tin chất lƣợng dự báo mà ngƣời

dùng có thể lựa chọn phƣơng pháp phù hợp.

NO-NF: Vùng lân cận quan trắc – vùng lân cận dự báo

31

SF-NF: Một điểm quan trắc – vùng dự báo lân cận

Bảng 1.1. Bảng tóm tắt các phƣơng pháp đánh giá fuzzy phổ biến

Nguyên tắc xác định

Phƣơng pháp Fuzzy

Loại dự báo

Xác định mô hình dự báo

Đại lƣợng so sánh

Chỉ số truyền thống

Nâng quy mô (uspcaling)

,

NO-NF

BIAS, TS, ETS

,

NO-NF

Độ phủ tối thiểu (Minimum coverage)

POD, FAR, ETS

,

Fuzzy lôgic (Fuzzy logic)

NO-NF

POD, FAR, ETS

Ix ,

SO-NF

Bảng liên hợp các sự kiện (Multi-event contingency table)

ROC, V

NO-NF

---

SS

Ix , Iy

Cƣờng độ - quy mô (Intensity-scale)

,

NO-NF

---

Điểm kỹ năng phần tử (Fractions skill score - FBS).

FSS (liên quan đến 1 chủ đề)

Ix ,

SO-NF

---

BS, BSS

Phƣơng pháp tiếp cận thực tế (Pragmatic approach)

Phƣơng pháp thực nghiệm hoàn hảo (Practically perfect hindcast)

SO-NF

TSx, TSy

Ix , Iy ,

Ix ,

SO-NF

---

Tƣơng tự với quan trắc khi tính trung bình các quy mô lƣới thô Dự báo các hiện tƣợng vƣợt quá một phần tử nhỏ nhất của vùng đang xét Thích hợp cho các dự báo chuẩn hơn là các dự báo sai Dự báo đƣợc ít nhất một hiện tƣợng tƣơng thích với một hiện tƣợng quan trắc đƣợc Có kết cấu chính xác hơn so với các quan trắc đƣợc xắp xếp ngẫu nhiên Có sự đồng nhất về tần suất xuất hiện các hiện tƣợng dự báo và quan trắc đƣợc Xác suất phát hiện cao các hiện tƣợng xảy ra hay không xảy ra Một cách gần đúng là những kiến thức hoàn hảo của ngƣời làm dự báo đƣợc quy làm thám sát trƣớc đó Xác suất phát hiện cao tƣơng ứng với các giá trị thám sát

Căn bậc hai có điều kiện (Conditional square root of RPS)

CSRR (liên quan đến

32

Nguyên tắc xác định

Phƣơng pháp Fuzzy

Loại dự báo

Xác định mô hình dự báo

Đại lƣợng so sánh

Chỉ số truyền thống một chủ đề)

RMSE

NO-NF

---

Chuỗi X, Chuỗi Y

Phân bố cƣờng độ gần đúng với thám sát

Vùng liên đới RMSE (Area related RMSE)

b. Ưu điểm của phương pháp đánh giá fuzzy

Thích hợp cho cả biến không liên tục;

Kết quả có thể dễ dàng nhận thấy bằng trực giác;

Có thể sử dụng để so sánh các dự báo với các độ phân giải khác nhau, biết đƣợc những quy mô nào có kỹ năng để đƣa ra quy mô dự báo hữu ích và đáng tin cậy.

1.4. Tình hình nghiên cứu chung liên quan đến đề tài trên thế giới và tại Việt Nam

Một số tác giả trên thế giới đã đƣa ra sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số, nhƣ Henry R.Stanski, Laurence J. Wilson và William R. Burrows (1990); Murphy, A.H và R.L. Winkler (2004) …

Tuy nhiên tại mỗi quốc gia trên thế giới, các Cơ quan KTTV Quốc gia đều tự xây dựng cho riêng mình một hệ thống đánh giá mô hình NWP. Theo kết quả điều tra trên quy mô toàn cầu vào năm 1997 của WMO (tổ chức Khí tƣợng thế giới), 57% các Cơ quan KTTV quốc gia có hệ thống đánh giá dự báo đƣợc chính thức dùng trong nghiệp vụ trong đó bao gồm cả đánh giá mô hình NWP. Tuy nhiên, có sự khác biệt rất lớn về phƣơng thức và bản chất của cách đánh giá giữa quốc gia này với quốc gia khác vì các phƣơng pháp đánh giá đƣợc sử dụng hoàn toàn phụ thuộc vào đặc trƣng riêng của từng loại sản phẩm dự báo, yếu tố dự báo, cách xây dựng phƣơng pháp dự báo, và đôi khi còn do yếu tố chủ quan của ngƣời xây dựng phƣơng pháp đánh giá dự báo. Trong nhiều năm qua, WMO đã có những cố gắng để đƣa ra những chuẩn mực thống nhất về đánh giá chất lƣợng dự báo (bao gồm cả dự báo NWP) cho các cơ quan KTTV Quốc gia nhƣng vẫn chƣa đạt đƣợc kết quả mong muốn. Bởi vì mỗi quốc gia đều có những quy định, quy tắc riêng trong đánh giá chất lƣợng dự báo KTTV cho riêng quốc gia mình, phụ thuộc vào mục đích, yêu cầu, thực trạng công tác quan trắc đo đạc, công tác dự báo và trình độ khoa học công nghệ dự báo của quốc gia

33

đó.

Tại một số nơi nhƣ Cơ quan khí tƣợng Australia (BOM), dự báo mƣa từ mô hình NWP đƣợc đánh giá so với lƣợng mƣa quan trắc 24 giờ trên toàn lãnh thổ; độ phân giải của trƣờng phân tích là 0.25°, và trƣờng phân tích đƣợc quy về độ phân giải của mô hình. Các chỉ số đánh giá cơ bản là BIAS, RMSE và một số chỉ số khác áp dụng cho dự báo nhị phân (có/không). Tại Cơ quan Khí tƣợng Canada (CMC), ngƣời ta sử dụng các chỉ số BIAS và RMSE đối với các yếu tố nhƣ gió, nhiệt độ, điểm sƣơng, khí áp mặt đất và độ cao địa thế vị; các chỉ số BIAS và TS cho các ngƣỡng khác nhau đƣợc sử dụng để đánh giá mƣa. Tại Tổng cục khí tƣợng Trung Quốc (CMA), 400 trạm quan trắc đã đƣợc lựa chọn kỹ để dùng vào việc đánh giá mƣa từ mô hình NWP. Các sản phẩm dự báo số và dự báo khách quan đƣợc nội suy về vị trí các trạm này. Các chỉ số đƣợc sử dụng là BIAS và TS cho 1 số ngƣỡng (0,1; 10; 25; 50 và 100 mm/24 giờ). Tại Cơ quan khí tƣợng Pháp (Meteo France), ngƣời ta đánh giá các yếu tố mƣa, lƣợng mây, nhiệt độ và độ ẩm tại 2m, tốc độ gió, hƣớng gió, và cƣờng độ gió giật. Điểm lƣới gần điểm quan trắc nhất đƣợc sử dụng để đánh giá với các chỉ số BIAS, RMSE và các chỉ số đánh giá cho dự báo nhị phân. Tại Cơ quan khí tƣợng Nhật Bản (JMA) chỉ đánh giá mƣa và nhiệt độ. Số liệu quan trắc đƣợc biến đổi thành một lƣới số liệu đồng nhất độ phân giải 80 km, và số liệu dự báo đƣợc so sánh với số liệu quan trắc này sử dụng các chỉ số BIAS, TS và ETS. Tại Cơ quan khí tƣợng Anh (UKMet), MSE đƣợc sử dụng để đánh giá nhiệt độ và gió, trong khi đó ETS lại đƣợc dùng để đánh giá mƣa, lƣợng mây và tầm nhìn xa với các ngƣỡng khác nhau. Tại Cơ quan khí tƣợng Mỹ (NWS), chỉ có các yếu tố nhƣ nhiệt độ, gió, độ ẩm, lƣợng mƣa, trƣờng khí áp, độ cao địa thế vị đƣợc đánh giá. Các chỉ số đƣợc sử dụng là BIAS, ETS, POD, FAR và Odds ratio.

Tại Việt Nam, kể từ sau khi đƣa vào áp dụng các mô hình dự báo số trị, cũng đã có một số nghiên cứu về đánh giá chất lƣợng dự báo mô hình số. Tuy nhiên, các nghiên cứu này mới chỉ dừng lại ở việc đánh giá kỹ năng dự báo một số yếu tố khí tƣợng bề mặt nhƣ lƣợng mƣa, khí áp và nhiệt độ đối với một số mô hình đã chạy nghiệp vụ ở Việt Nam. Các nghiên cứu đánh giá này mới chỉ áp dụng cho một số biến dự báo và một số khu vực nhỏ mà chƣa thực hiện đƣợc một đánh giá tổng thể theo cả không gian, thời gian cũng nhƣ các hình thế thời tiết. Đánh giá dự báo mƣa, có tác giả Nguyễn Thị Thanh Bình (2002), Trần Quang Năng (2009), Nguyễn Văn Bảy (2004). Đánh giá kết quả dự báo nhiệt độ,

34

có tác giả Vũ Anh Tuấn (2003). Đánh giá kết quả trƣờng áp, tác giả Nguyễn Văn Bảy (2004). Hoàng Đức Cƣờng (2004), Nghiên cứu thử nghiệm áp dụng mô hình khí tượng động lực quy mô vừa MM5 trong dự báo hạn ngắn ở Việt Nam, Viện Khoa học Khí tƣợng Thủy văn và Môi trƣờng – Đề tài cấp Nhà nƣớc. Hoàng Đức Cƣờng (2007), Nghiên cứu thử nghiệm dự bao mưa lớn ở Việt Nam bằng mô hình MM5, Viện Khoa học Khí tƣợng Thủy văn và Môi trƣờng – Đề tài cấp Nhà nƣớc; Đỗ Lệ Thủy (2009), Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê trên sản phẩm mô hình HRM, Trung tâm Khí tƣợng Thủy văn Quốc gia – Đề tài cấp Nhà nƣớc. Ngoài ra trong Báo cáo tổng kết đề tài NCKH cấp Bộ tác giả Dƣơng Liên Châu – Nguyễn Viết Thi (2007) có xây dựng hệ thống chỉ tiêu đánh giá chất lƣợng dự báo Khí tƣợng Thủy văn.

Hiện nay Cục Khí tƣợng Thủy văn và Biến đổi khí hậu đang thực hiện đề tài cấp Bộ “Nghiên cứu xây dựng và phát triển hệ thống đánh giá khách quan các sản phẩm của mô hình dự báo số cho khu vực Việt Nam” nhằm xây dựng đƣợc hệ thống đánh giá khách quan các sản phẩm dự báo số trị, qua đó tổ chức đánh giá và so sánh chất lƣợng dự báo của các mô hình dự báo thời tiết số trị hiện có tại Việt Nam, do thạc sỹ Nguyễn Thị Bình Minh chủ nhiệm đề tài, hoàn thành trong tháng 12 năm 2011.

35

CHƢƠNG 2. KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ HRM, MM5 VÀ NGUỒN SỐ LIỆU SỬ DỤNG

2.1. Giới thiệu về mô hình MM5

2.1.1. Giới thiệu mô hình

Mô hình khí tƣợng động lực quy mô vừa thế hệ thứ 5 (MM5) của Trung tâm Quốc gia Nghiên cứu Khí quyển Mỹ (NCAR) và Trƣờng Đại học Tổng hợp Pennsylvania Mỹ (PSU) là thế hệ mới nhất trong một loạt các mô hình dự báo đƣợc Anthes phát triển từ những năm 1970. Qua quá trình thử nghiệm, mô hình đã đƣợc điều chỉnh và cải tiến nhiều lần nhằm mô phỏng tốt hơn các quá trình vật lý quy mô vừa và có thể áp dụng đối với nhiều đối tƣợng sử dụng khác nhau. Phiên bản 3.5 (MM5V3.5) của mô hình ra đời năm 2001 đã đƣợc điều chỉnh, cải tiến thêm so với các phiên bản trƣớc trong các mảng: Kỹ thuật lồng ghép nhiều mực; Động lực học bất thuỷ tĩnh; Đồng hoá số liệu 4 chiều; Bổ sung lựa chọn các sơ đồ tham số hoá vật lý; Kỹ thuật tính toán.

Mô hình MM5 sử dụng hệ thống lƣới lồng (nesting grid) nhằm mô phỏng tốt hơn các quá trình vật lý có quy mô nhỏ hơn bƣớc lƣới của miền tính ban đầu. Về lý thuyết, MM5 cho phép lồng ghép tối đa 9 khu vực. Tỷ lệ của độ phân giải (ĐPG) theo phƣơng ngang của miền tính trong so với miền tính ngoài luôn là 3:1.

Số liệu ban đầu và điều kiện biên phụ thuộc vào thời gian cho mô hình MM5 đƣợc lấy từ các trƣờng phân tích và dự báo từ mô hình toàn cầu GFS. GFS là mô hình phổ toàn cầu của Trung tâm dự báo môi trƣờng Mỹ (NCEP-National Centers for Environmental Predictions).

2.1.2. Cấu trúc mô hình

Các mô đung chính của MM5 gồm:

- Môđun TERRAIN

TERRAIN là mô đun đầu tiên của hệ thống mô hình dự báo MM5, dùng để nội suy phƣơng ngang các dữ liệu về độ cao địa hình và thảm thực vật (land use), loại hình bề mặt đất, ranh giới đất – nƣớc,... cho các miền tính. Trƣờng số liệu đƣa vào ở đây bao gồm:

+ Độ cao địa hình;

36

+ Thảm thực vật hay loại hình sử dụng;

+ Nhiệt độ đất các lớp sát mặt;

+ Độ nhám bề mặt đất.

- Môđun REGRID

Các chƣơng trình trong môđun REGRID dùng để đọc và phân tích số liệu khí tƣợng ở các mực khí áp theo phƣơng ngang đồng thời nội suy các giá trị phân tích đƣợc từ lƣới thô ban đầu (lƣới của các mô hình toàn cầu, khu vực mà số liệu đƣợc lấy làm đầu vào cho MM5) vào lƣới tính của mô hình dựa vào các phép chiếu bản đồ đã đƣợc định nghĩa trong khi thực hiện tính toán ở môđun TERRAIN.

- Môđun INTERPF

Chức năng chính của môđun INTERPF là:

+ Nội suy số liệu khí tƣợng theo chiều thẳng đứng vào lƣới mô hình;

+ Bổ sung các trƣờng bề mặt nhƣ khí áp, nhiệt độ không khí;

+ Xử lý mô hình bất thuỷ tĩnh nguyên thuỷ.

- Môđun MM5

MM5 là môđun đƣa ra kết quả dự báo số của mô hình, tất cả các lựa chọn

của mô hình đƣợc MM5 mô phỏng và dự báo.

Phổ ứng dụng của MM5 bao gồm nghiên cứu lý thuyết và ứng dụng. MM5 cho phép mô phỏng và dự báo thời tiết nói chung, các quá trình quy mô từ lớn đến vừa nhƣ gió mùa, bão, áp thấp,… Ngoài ra, MM5 cũng cho phép mô phỏng và dự báo các quá trình quy mô nhỏ hơn (từ 2 đến 200km).

2.1.3. Hệ các phương trình thủy nhiệt động lực của MM5

- Phƣơng trình xu thế khí áp;

- Phƣơng trình xu thế nhiệt độ;

- Các phƣơng trình chuyển động ngang và thẳng đứng;

2.1.4. Điều kiện biên

- Điều kiện biên xung quanh

Để chạy mô hình dự báo thời tiết khu vực yêu cầu phải có điều kiện biên

37

xung quanh. Trong MM5, ở bốn biên xung quanh ta phải xác định các biến nhiệt độ (T), độ ẩm tƣơng đối (RH), áp suất hoặc độ cao địa thế vị (H), các thành phần gió ngang (U, V) và có thể cả các trƣờng vật lý vi mô nhƣ là mây nếu cần thiết. Các giá trị biên có thể lấy từ phân tích trong tƣơng lai, từ mô phỏng của lƣới thô hơn trƣớc đó (tƣơng tác một chiều) hoặc từ các mô hình dự báo khác (trong dự báo thời gian thực). Đối với dự báo thời gian thực, giá trị biên thƣờng lấy mô hình dự báo toàn cầu. Trong các trƣờng hợp nghiên cứu điều kiện biên có thể lấy từ số liệu phân tích đƣợc tăng cƣờng từ các thám sát bề mặt và cao không.

- Điều kiện biên bức xạ:

Điều kiện biên trên bức xạ đƣợc thiết lập trên cơ sở lí thuyết sau:

+ Áp dụng vào khí quyển thì các quá trình khí quyển có thể mô tả bằng

các phƣơng trình tuyến tính hoá;

+ Tính ổn định tĩnh và dòng trung bình đƣợc coi là hằng số;

+ Hiệu ứng Coriolis đƣợc bỏ qua;

+ Áp dụng đƣợc đối với gần đúng thuỷ tĩnh.

Việc thiết lập RUBC trong các mô hình phổ là tƣơng đối đơn giản, nhƣng

phức tạp hơn đối với những mô hình nút lƣới.

2.1.5. Các quá trình tham số hóa

Tham số hóa các quá trình khí quyển quy mô dƣới lƣới trong MM5 gồm

có:

- Tham số hóa đối lưu: Đƣợc chia làm 03 nhóm chính là thích ứng đối lƣu, đối lƣu xuyên thủng và sơ đồ dựa trên mô hình mây tích. Hiện nay có nhiều sơ đồ tham số hóa đối lƣu nhƣ sơ đồ của Manabe và các cộng sự, Betts và Miller, Arakawa và Shubert, Grell, Frank, và Cohen.

- Tham số hóa các quá trình vi mô trong mây: Vai trò chính của các sơ đồ vi vật lý mây trong mô hình số trị là: Xử lý các quá trình mây và mƣa quy mô l- ƣới; Có thể tính toán đến pha băng và tạo hạt đá; Tính toán xu thế nhiệt, các biến ẩm, và mƣa không phải do đối lƣu; và cung cấp các thông tin và tính chất của mây cho các sơ đồ bức xạ.

Tham số hóa các quá trình vi mô trong mây gồm có Sơ đồ Simple Ice, Sơ

đồ Mixed-phase và sơ đồ Warm Rain... và một số sơ đồ khác ít phổ biến hơn.

38

- Tham số hóa bức xạ: Gồm có sơ đồ tham số hóa bức xạ sóng dài và

tham số hóa bức xạ sóng ngắn, theo Rodgers (1967).

- Tham số hóa lớp biên hành tinh: Bao gồm phƣơng trình năng lƣợng bề mặt, Thông lƣợng bức xạ thuần Rn, thông lƣợng hiển nhiệt Hs và thông lƣợng ẩm Es, sơ đồ tham số hóa khí động lực học (Bulk-aerodynamic), mô hình phân giải cao của Blackadar, sơ đồ khuếch tán thẳng đứng, Sơ đồ khuếch tán ẩm thẳng đứng.

- Tham số hóa các quá trình đất – bề mặt: Gồm các sơ đồ:

+ None: Không dự báo nhiệt độ lớp đất bề mặt;

+ Force - Restone (Blackada) scheme: Dùng cho lớp mỏng đơn thuần

ngay trên bề mặt và nhiệt độ của lớp đó;

+ Five - Layer Soil Model: Dự báo nhiệt độ của 5 lớp: 1, 2, 4, 8, 16m;

+ OSU/Eta-Suface Model: Mô hình lớp đất bề mặt có thể dự báo nhiệt độ

và độ ẩm của 4 lớp: 10, 30, 60, 100 cm.

Hình 2.1 là miền tính sử dụng trong luận văn này là miền tính lồng ghép từ hai miền. Miền tính thứ nhất (miền lớn) giới hạn trong khoảng 5-30ON, 90- 130OE với 65x95 điểm tính và độ phân giải ngang 45km. Về phƣơng đứng 23 mực sigma phân bố không đều từ mặt đất đến mực xấp xỉ 100mb. Miền tính thứ hai cho Việt Nam (miền nhỏ) đƣợc lồng vào miền tính thứ nhất có độ phân giải ngang 15km với 127x63 điểm tính. Miền tính này bao trùm lãnh thổ Việt Nam.

Hình 2.1. Sơ đồ lồng ghép hai miền tính cho MM5

39

2.2. Giới thiệu về mô hình HRM

2.2.1. Giới thiệu mô hình

Mô hình dự báo thời tiết khu vực phân giải cao HRM (High resolution Regional Model) là mô hình thuỷ tĩnh, sử dụng hệ phƣơng trình nguyên thuỷ, bao gồm đầy đủ các quá trình vật lý nhƣ: Bức xạ, mô hình đất, các quá trình rối trong lớp biên, tạo mƣa qui mô lƣới, đối lƣu nông và đối lƣu sâu. Mô hình HRM đƣợc phát triển tại Tổng cục Thời tiết Cộng hòa liên bang Đức (DWD) và đang đƣợc chạy nghiệp vụ tại nhiều cơ quan khí tƣợng quốc gia nhƣ tại Philipin, Brazil, Tây Ban Nha, Đức,… Mô hình HRM đƣợc chuyển giao và chạy nghiệm vụ tại Trung tâm Dự báo Khí tƣợng Thủy văn Trung ƣơng (TTDBTƢ) từ năm 2002 thông qua dự án hợp tác nghiên cứu giữa 3 đơn vị là DWD, Khoa Khí tƣợng Thủy văn và Hải dƣơng học, Trƣờng Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội và TTDBTƢ. Số liệu ban đầu và điều kiện biên phụ thuộc vào thời gian cho mô hình HRM đƣợc lấy từ các trƣờng phân tích và dự báo từ mô hình toàn cầu (Global Model for Europe - GME) của DWD. Hiện tại, mô hình HRM đang đƣợc chạy nghiệp vụ tại TTDBTƢ với phiên bản HRM-14km (độ phân giải ngang là 14km, 40 mực thẳng đứng và bƣớc thời gian là 90 giây) cho 2 phiên dự báo hàng ngày vào 00UTC (7 giờ Việt Nam) và 12UTC (19 giờ Việt Nam). HRM là mô hình dự báo thời tiết đầu tiên đƣợc triển khai tại Việt Nam và đã đƣợc cải tiến nhiều lần trong những năm gần đây.

2.2.2. Cấu trúc lưới và phương pháp số

- Lƣới điều hoà hoặc lƣới quay kinh-vĩ;

- Độ phân giải từ 0.250 đến 0.050(tƣơng ứng với 28 đến 6 km);

- Sơ đồ sai phân trung tâm bậc hai theo không gian, theo lƣới C-Arakava;

- Hệ toạ độ lai với số mực từ 20 đến 40;

- Sơ đồ tích phân theo thời gian Leap-frog, bán tƣờng minh, có độ chính xác bậc bốn đƣợc áp dụng để tích phân hệ phƣơng trình dự báo. Bƣớc tích phân theo thời gian Dt (s) theo công thức CFL (Courant-Friedrichs-Levy) và phụ thuộc vào bƣớc tích phân theo không gian;

- Cách xử lý biên theo Davies (1976).

2.2.3. Hệ các phương trình cơ bản

40

Hệ phƣơng trình nguyên thuỷ của mô hình bao gồm 6 phƣơng trình dự

báo tƣơng ứng với 6 biến: pS, u, v, T, qV, qC.

- Phƣơng trình xu thế khí áp mặt đất;

- Hai phƣơng trình thành phần gió ngang;

- Phƣơng trình bảo toàn nhiệt;

- Phƣơng trình bảo toàn hơi nƣớc;

- Phƣơng trình bảo toàn nƣớc lỏng trong mây;

Ngoài ra còn có 9 phƣơng trình cảnh báo, đó là: Phƣơng trình tốc độ thẳng đứng trong toạ độ lai, phƣơng trình trạng thái, phƣơng trình chuyển đổi giữa động năng và thế năng, phƣơng trình tính tốc độ thẳng đứng trong toạ độ khí áp, quan hệ tính xoáy thế tuyệt đối, quan hệ tính động năng trên một đơn vị khối lƣợng, quan hệ tính địa thế vị từ tích phân phƣơng trình thuỷ tĩnh, quan hệ xác định nhiệt độ ảo và phƣơng trình tính độ ẩm riêng bão hoà.

2.2.4. Các quá trình tham số hóa vật lý

* Sơ đồ tham số hóa đối lưu Tiedtke

Từ năm 1989, Tiedtke đã xây dựng một sơ đồ TSHĐL mây tích dựa trên cơ sở gần đúng các dòng khối. Ông đã chia động lực của mây tích thành hai phần, một phần dòng thăng và một phần dòng giáng. Dòng khối trong mây khi đó là tổng của dòng khối trong dòng thăng và dòng khối trong dòng giáng.

Tiedtke (1989) phân biệt các loại mây đối lƣu nhƣ sau:

- Đối lƣu sâu: hội tụ không khí ở lớp biên trong điều kiện bất ổn định có

khả năng tạo thành dòng thăng lớn để có thể xuyên qua tầng đối lƣu.

- Đối lƣu nông: bên dƣới có phân kỳ nhẹ và chỉ đạt đến độ cao trong tầng

đối lƣu.

- Đối lƣu mực giữa: xuất hiện ở vùng front trong lớp giữa của khí quyển,

chân mây nằm trên lớp biên khí quyển.

* Sơ đồ Heise

Sơ đồ này đƣợc phát triển dựa trên cơ sở lý thuyết của sơ đồ TSHĐL Tiedtke (1989). Điểm khác biệt duy nhất giữa hai sơ đồ là cách tính thông lƣợng khối lƣợng dòng thăng tại chân mây cho đối lƣu sâu. Trong sơ đồ Tiedtke, giả

41

thiết khép kín này đƣợc xác định dựa vào hội tụ ẩm qui mô lớn ở mực thấp.

* Sơ đồ Betts-Miller-Janjic

Sơ đồ TSHĐL BMJ đƣợc xây dựng trên nguyên tắc điều chỉnh cấu trúc nhiệt ẩm đối lƣu mô hình về cấu trúc nhiệt ẩm thám sát thực trong khí quyển nhiệt đới.

Cấu trúc nhiệt động thám sát trong khí quyển nhiệt đới:

Một trong những mục đích chìa khóa quan trọng của nghiên cứu thám sát GATE là nghiên cứu đối lƣu sâu có tổ chức rất phức tạp ở nhiệt đới để thử nghiệm và phát triển các sơ đồ TSHĐL khu vực này trong mô hình số (Betts, 1974). Mục đích đầu tiên của các sơ đồ TSHĐL là phải đảm bảo cho cấu trúc thẳng đứng của nhiệt và ẩm bị điều khiển mạnh bởi đối lƣu phải gần thực, nghĩa là gần nhất với thám sát. Ý tƣởng cơ bản về tựa cân bằng giữa trƣờng mây và ép buộc qui mô lớn đối với đối lƣu nông là của Betts (1973) và đối với đối lƣu sâu là do Arakawa và Shubert (1974) đƣa ra. Điều đó có nghĩa cấu trúc nhiệt ẩm đặc trƣng trong các vùng đối lƣu đƣợc minh chứng bởi thám sát. Đây là cơ sở của quá trình điều chỉnh đối lƣu. Manable & CS (1965) đề xuất phƣơng pháp điều chỉnh đối lƣu sâu về đoạn nhiệt ẩm trong khi khí quyển nhiệt đới không tiến đến cân bằng đoạn nhiệt ẩm khi tồn tại đối lƣu sâu. Tất cả đó cho thấy, trên qui mô lƣới trong mô hình có mặt đối lƣu luôn phải duy trì một cấu trúc thẳng đứng của nhiệt ẩm thực nhƣ thám sát.

Vấn đề tiếp theo là bằng thám sát làm thế nào minh chứng đƣợc rằng các chế độ đối lƣu khác nhau có các cấu trúc nhiệt động tựa cân bằng khác nhau để duy trì đƣợc sự tựa cân bằng giữa mây qui mô dƣới lƣới và các quá trình qui mô lƣới. Betts (1982) nêu ra một quan điểm lý thuyết từ thám sát (GATE, BOMEX, ATEX) dựa vào sự thiết lập điểm bão hoà. Từ đó tác giả đã xác định đƣợc một tập hợp các tham số thích hợp cho đối lƣu sâu và đối lƣu nông trong mô hình toàn cầu.

2.3. Số liệu

Kết quả dự báo mƣa và nhiệt độ 24h của mô hình MM5 và HRM đƣợc đánh giá cho toàn Việt Nam và cho từng khu vực Bắc Bộ, Trung Bộ và Nam Bộ trong các tháng mùa đông (12, 01, 02), các tháng mùa hè (06, 07, 08), và trung bình toàn chuỗi (gồm cả mùa đông và mùa hè) trong ba năm 2007, 2008, 2009. Các phân tích đánh giá đƣợc phân chia nhƣ vậy vì đặc điểm địa hình cũng nhƣ 42

đặc điểm thời tiết, khí hậu ở Việt Nam có sự khác biệt rõ rệt giữa các vùng và trong các mùa khác nhau. Tập số liệu đánh giá đƣợc chia theo không gian và thời gian nhƣ sau:

+ Toàn Việt Nam: 7.1250N - 27.1250N; 97.1250E - 117.1250E (HRM1: 128 trạm; HRM2 và MM5: 24 trạm)

+ Khu vực Bắc Bộ: 19.50N - 27.1250N; 97.1250E - 117.1250E (HRM1: 65 trạm; HRM2 và MM5: 12 trạm)

+ Khu vực Trung Bộ: 120N - 19.50N; 97.1250E - 117.1250E (HRM1: 34 trạm; HRM2 và MM5: 8 trạm)

+ Khu vực Nam Bộ: 70N - 120N; 97.1250E - 117.1250E (HRM1: 29 trạm; HRM2 và MM5: 4 trạm)

128 trạm quan trắc

24 trạm quan trắc

Hình 2.2. Các trạm quan trắc trong miền tính

Số liệu thám sát trƣớc khi đánh giá đƣợc kiểm tra theo chỉ dẫn chung của WMO, gồm kiểm tra các giá trị ngƣỡng và kiểm tra tính phù hợp bên trong tập số liệu (theo không gian và thời gian). Tuy nhiên trong luận văn này, số liệu đƣợc dùng là bộ số liệu phát báo nghiệp vụ hàng ngày và đƣợc chỉnh biên, lƣu trữ tại Trung tâm tƣ liệu Khí tƣợng Thủy văn nên đƣợc xem là có độ tin cậy cao.

Hai đại lƣợng đƣợc lựa chọn để phân tích, đánh giá là sản phẩm dự báo mƣa tích lũy 24h và nhiệt độ trung bình 24h của mô hình HRM đƣợc chạy nghiệp vụ hàng ngày tại Trung tâm Khí tƣợng Thủy văn Trung ƣơng với độ phân giải 14km và của mô hình MM5 đƣợc chạy tại Viện Khoa học Khí tƣợng

43

Thủy văn và Môi trƣờng với độ phân giải 15km. Kết quả dự báo trên lƣới của mô hình đƣợc nội suy về vị trí của các trạm quan trắc.

44

CHƢƠNG 3. KẾT QUẢ ĐÁNH GIÁ NHIỆT ĐỘ VÀ LƢỢNG MƢA CỦA MÔ HÌNH MM5 VÀ HRM CHO KHU VỰC VIỆT NAM

Lãnh thổ Việt Nam, kéo dài trên 150 vĩ tuyến, nằm trong cùng một đới khí hậu nhiệt đới gió mùa, đặc trƣng cơ bản là một nền bức xạ - nhiệt độ cao phù hợp với những chỉ tiêu cơ bản của khí hậu vùng nội chí tuyến, và một sự phân hóa theo mùa rõ rệt phụ thuộc vào sự thay đổi theo mùa của hoàn lƣu. Tuy nhiên, tính phức tạp của một cơ chế gió mùa không thuần nhất ở khu vực Đông Nam Á, đƣợc khơi sâu thêm trong điều kiện địa hình chia cắt của nƣớc ta đã đem lại những khác biệt rất rõ rệt về khí hậu giữa các vùng miền.

Trong chƣơng này tác giả sẽ trình bày kết quả đánh giá dự báo 24 giờ của nhiệt độ trung bình ngày và lƣợng mƣa của mô hình HRM và MM5 tại 24 trạm trên toàn Việt Nam. Riêng mô hình HRM có hai kết quả đánh giá là HRM1 với 128 trạm và HRM2 với 24 trạm cho toàn Việt Nam. Việc đánh giá kết quả HRM với 2 chuỗi số liệu có độ dài khác nhau giúp ta xem xét đƣợc mức độ ảnh hƣởng của số trạm đối với các chỉ số đánh giá.

Dƣới đây là những kết quả đánh giá cho các tháng mùa đông (tháng 12, 1, 2), và các tháng mùa hè (6, 7, 8) của ba năm 2007, 2008, 2009 trên toàn Việt Nam và theo từng khu vực Bắc Bộ, Trung Bộ và Nam Bộ vì các hình thế thời tiết nói chung và yếu tố mƣa và nhiệt nói riêng trong các mùa và giữa các khu vực có sự khác biệt rõ rệt.

3.1. Kết quả đánh giá nhiệt độ

Trƣớc khi phân tích các chỉ số, giá trị nhiệt độ trung bình ngày của chuỗi số liệu tính toán (mùa hè, mùa đông) đƣợc biểu diễn trên các hình từ 3.1 đến 3.2 để có cái nhìn chung nhất về sự phân bố nhiệt độ trên toàn lãnh thổ Việt Nam.

Hình 3.1 biểu diễn nhiệt độ trung bình trong các tháng mùa hè của các phiên bản mô hình HRM1, HRM2, MM5 và các giá trị quan trắc tƣơng ứng. Hình vẽ cho thấy mô hình HRM (gồm cả HRM1 và HRM2) nhìn chung có giá trị nhiệt độ trung bình thấp hơn so với quan trắc. Kết quả của mô hình MM5 ở khu vực Bắc Bộ và Nam Bộ thƣờng lớn hơn so với quan trắc nhƣng ở khu vực Trung Bộ lại thể hiện ngƣợc lại.

45

(a)

(b)

(c)

(d)

(e)

Hình 3.1. Nhiệt độ trung bình trong các tháng mùa hè tại các trạm. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm)

Hình 3.2 là giá trị nhiệt độ trung bình trong các tháng mùa đông của mô hình HRM1, HRM2, MM5 và các trạm quan trắc tƣơng ứng. Hình vẽ cho thấy mô hình HRM vẫn cho giá trị nhiệt độ trung bình ngày thấp hơn so với quan trắc. Đối với mô hình MM5, kết quả dự báo ở khu vực Bắc Bộ nhỏ hơn so với quan trắc tuy nhiên ở khu vực Trung Bộ và Nam Bộ lại có giá trị nhiệt độ trung bình của mô hình lớn hơn so với quan trắc.

46

(a)

(b)

(c)

(d)

(e)

Hình 3.2. Nhiệt độ trung bình trong các tháng mùa đông tại các trạm. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm)

Hình 3.3 là kết quả tính sai số ME của nhiệt độ (0C) cho toàn Việt Nam và các khu vực Bắc Bộ, Trung Bộ, Nam Bộ trong các tháng mùa đông và mùa hè. Từ hình vẽ nhận thấy mô hình HRM luôn có ME âm trong các tháng mùa đông, các tháng mùa hè, cũng nhƣ trung bình toàn chuỗi, giá trị ME bằng khoảng -20C. Điều này có nghĩa là mô hình HRM thƣờng cho kết quả dự báo nhiệt độ thấp hơn so với thực tế. Khi đánh giá riêng cho từng khu vực ta thấy ở khu vực Bắc Bộ và Nam Bộ sai số trong các tháng mùa đông thƣờng lớn hơn sai số trong các tháng mùa hè, riêng khu vực Trung Bộ lại có xu thế ngƣợc lại. Những sai số lớn trong thời kỳ mùa đông ở khu vực Bắc Bộ liên quan nhiều đến hoạt động của gió

47

mùa mùa đông gây nên những đợt xâm nhập lạnh trên lãnh thổ nƣớc ta, ảnh hƣởng mạnh mẽ đến sự biến đổi nhiệt độ nói chung và nhiệt độ tối thấp nói riêng ở khu vực Bắc Bộ. Đối với khu vực Trung Bộ, hoạt động của gió mùa tây nam trong các tháng mùa hè gây nên hiện tƣợng thời tiết khô nóng, hệ quả là mô hình có thể không dự báo tốt đƣợc những giá trị nhiệt độ cao nhất ở đây. Ở khu vực Nam Bộ thƣờng có sai số lớn là do đây là vùng vĩ độ thấp, gần xích đạo nên mô hình thủy tĩnh nhƣ HRM chƣa mô tả đƣợc tốt những quá trình xảy ra trong khí quyển. Giá trị ME của mô hình HRM ở khu vực Bắc Bộ và Trung Bộ cũng có sự khác biệt nhiều giữa hai chuỗi số liệu (HRM1 và HRM2). Nhìn chung, với trƣờng hợp độ dài chuỗi số liệu ngắn (HRM2) thƣờng cho sai số nhỏ hơn. Điều này cho thấy số lƣợng của các trạm tham gia vào quá trình đánh giá cũng ảnh hƣởng đáng kể đến kết quả đánh giá mô hình.

(a)

(b)

Hình 3.3. Sai số ME của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b)

Kết quả tính ME của mô hình MM5 cho thấy trong các tháng mùa đông ME âm trên toàn Việt Nam và khu vực Bắc Bộ, ngƣợc lại ME dƣơng ở khu vực Trung Bộ và Nam Bộ. Trong các tháng mùa hè, mô hình MM5 thƣờng cho dự báo nhiệt độ cao hơn so với thực tế (ME > 0). Tuy nhiên, xét về giá trị tuyệt đối thì sai số này không lớn (thƣờng dƣới 1oC) và ít có sự khác biệt hơn giữa các khu vực. Tính trung bình cho toàn chuỗi số liệu thì MM5 cho dự báo nhiệt độ cao hơn thực tế trên cả ba khu vực cũng nhƣ toàn Việt Nam, trong đó sai số lớn nhất ở khu vực Nam Bộ. Điều này cho thấy, mặc dù MM5 là một mô hình phi thủy tĩnh nhƣng cũng gặp phải những khó khăn trong việc mô tả các quá trình khí quyển ở vùng vĩ độ thấp.

Nhƣ vậy, xét chung cho toàn chuỗi số liệu ta thấy mô hình HRM dự báo

48

nhiệt độ thiên thấp khoảng 20C, còn mô hình MM5 dự báo nhiệt độ thiên cao khoảng dƣới 0,50C. Cả hai mô hình đều có sai số lớn ở khu vực Nam Bộ.

(a)

(b)

Hình 3.4. Sai số MAE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b)

Tƣơng tự, Hình 3.4 và Hình 3.5 biểu diễn giá trị MAE và RMSE của nhiệt độ cho cả hai mô hình. Giá trị MAE cho biết giá trị tuyệt đối độ lệch của dự báo khỏi quan trắc và đƣợc dùng để đánh giá sai số trung bình cho các yếu tố khí tƣợng mà không chú ý đến thiên hƣớng sai số dƣơng hoặc âm. Từ hình vẽ nhận thấy giá trị MAE của mô hình HRM (gồm cả HRM1 và HRM2) cao hơn rõ rệt so với giá trị MAE của mô hình MM5. Điều này cho thấy về cơ bản mô hình bất thủy tĩnh MM5 mô tả đƣợc trạng thái khí quyển chính xác hơn so với mô hình thủy tĩnh HRM. Giá trị MAE trong các tháng mùa đông của mô hình HRM thƣờng lớn hơn trong các tháng mùa hè, ngoại trừ khu vực Trung Bộ. Nhìn chung, sai số của HRM1 thƣờng lớn hơn sai số của HRM2 trong đó khu vực Bắc Bộ có sai số lớn nhất (MAE_HRM1 = 2,885oC và MAE_HRM2 = 2,398oC). Điều này là do trong các tháng mùa đông, hoàn lƣu gió mùa bất ổn định mạnh và gây nên sự phân hóa rõ rệt về nhiệt độ, đặc biệt ở khu vực Bắc Bộ nơi chịu ảnh hƣởng mạnh và ít biến tính nhất của khối không khí lạnh. Ngƣợc lại, trong các tháng mùa hè hoàn lƣu gió mùa gây ra sự biến động lớn chủ yếu trong chế độ mƣa còn về cơ bản nền nhiệt tƣơng đối ổn định giữa các khu vực do đó giá trị sai số trong các tháng mùa hè ít có sự khác biệt giữa các khu vực.

Kết quả tính MAE của mô hình MM5 có sự khác biệt ít hơn giữa các khu vực và giữa các tháng, khu vực Bắc Bộ cũng là nơi có sai số lớn nhất (MAE_MM5 = 1,818oC). Tƣơng tự nhƣ MAE, RMSE không chỉ ra xu hƣớng của sai số, tuy nhiên với sai số càng lớn thì trọng số càng lớn và do đó RMSE rất

49

nhạy đối với các sai số lớn của mô hình. Từ hình vẽ cho thấy RMSE của nhiệt độ của mô hình HRM trong thời kỳ mùa đông ở khu vực Bắc Bộ lớn hơn đáng kể so với RMSE của các khu vực còn lại và RMSE trong thời kỳ mùa hè. Điều này cho thấy trong các tháng mùa đông nhiều trạm có kết quả dự báo sai khác nhiều so với thực tế dẫn đến giá trị RMSE bị khuếch đại lên đáng kể ở khu vực Bắc Bộ.

Mô hình MM5 cho kết quả RMSE tƣơng đối nhỏ và ít có sự khác biệt trong cả mùa đông và mùa hè cũng nhƣ giữa các khu vực. Nhƣ vậy, sai số trong kết quả dự báo nhiệt độ của mô hình MM5 nhìn chung ổn định hơn so với mô hình HRM.

(b)

(a)

Hình 3.5. Sai số RMSE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b)

Đối với chuỗi số liệu đánh giá dài hơn HRM1 cho giá trị tuyệt đối của ME chênh lệch rất ít với MAE nên việc hiệu chỉnh đối với HRM1 là có thể thực hiện đƣợc. Tuy nhiên, với chuỗi số liệu đánh giá ngắn hơn HRM2 có giá trị tuyệt đối MAE và ME chênh lệch nhau không nhiều, nhƣng RMSE lớn hơn rất nhiều (toàn Việt Nam và khu vực Bắc Bộ), điều này chứng tỏ ẩn chứa nhiều sai số lớn khiến cho việc hiệu chỉnh là không đủ tin cậy. Tƣơng tự nhƣ vậy đối với mô hình MM5, MAE lớn hơn giá trị tuyệt đối của ME khá nhiều nên việc hiểu chỉnh sai số là mạo hiểm vì các sai số âm và sai số dƣơng đã khử lẫn nhau trong quá trình tính toán sai số.

50

Bắc Bộ

Việt Nam

0.923

1

0.883

1

0.906

0.866

0.793

0.804

0.856

0.758

0.774

0.731

0.8

0.8

HRM1

0.6

0.6

0.472

HRM2

0.4

0.297

0.4

HRM1 HRM2 MM5

MM5

0.2

0.2

0

0

Mùa Đông

Mùa Hè

Mùa Đông

Mùa Hè

(b)

(a)

Nam Bộ

Trung Bộ

0.961

1

0.893

0.929

0.905

1

0.877

0.849

0.869

0.833

0.838

0.797

0.785

0.734

0.8

0.8

0.6

0.6

0.4

0.4

HRM1 HRM2 MM5

HRM 1 HRM 2

0.2

0.2

0

0

Mùa Đông

Mùa Hè

Mùa Đông

Mùa Hè

(c)

(d)

Hình 3.6. Hệ số tương quan nhiệt độ của các mô hình cho toàn Việt Nam (a) và các khu vực (b, c, d)

Hệ số tƣơng quan cho biết mức độ phù hợp giữa nhiệt độ dự báo và nhiệt độ quan trắc, đƣợc biểu diễn trên Hình 3.6. Từ hình vẽ nhận thấy hệ số tƣơng quan nhiệt độ luôn dƣơng trong các trƣờng hợp và tƣơng đối cao, thể hiện mối quan hệ đồng biến giữa dự báo và quan trắc. Xét một cách chung nhất cho cả hai mô hình thì hệ số tƣơng quan khu vực Nam Bộ có giá trị lớn nhất, và nhỏ nhất ở khu vực Bắc Bộ. Hệ số tƣơng quan của mô hình HRM các tháng mùa hè lớn hơn các tháng mùa đông (Chênh lệch ít nhất là khu vực Nam Bộ: R_hè = 0.869, R_đông = 0.838). Mô hình MM5 thể hiện ngƣợc lại, hệ số tƣơng quan mùa đông lớn hơn mùa hè (Chênh lệch lớn nhất là khu vực Trung Bộ, R_hè = 0.734, R_đông = 0.893). Điều này cũng phù hợp với kết quả tính toán chỉ số RMSE vì hệ số tƣơng quan rất nhạy với những giá trị sai số lớn, tản mạn. RMSE của hô hình HRM trong những tháng mùa đông lớn hơn trong các tháng mùa hè, và RMSE của mô hình MM5 các tháng mùa đông nhỏ hơn các tháng mùa hè.

3.2. Kết quả đánh giá lƣợng mƣa

Tƣơng tự nhƣ nhiệt độ, trƣớc khi phân tích chi tiết các sai số của trƣờng mƣa, giá trị lƣợng mƣa trung bình ngày của các chuỗi số liệu đánh giá (mùa đông và mùa hè) đƣợc biểu diễn để có cái nhìn chung nhất về sự phân bố của lƣợng mƣa theo thời gian và theo không gian.

51

(a)

(b)

(c)

(d)

(e)

Hình 3.7. Giá trị trung bình mưa tích lũy 24 giờ trong các tháng mùa hè. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm)

Hình 3.7 là giá trị lƣợng mƣa tích lũy 24h trong các tháng mùa hè của mô hình HRM, MM5 và các trạm quan trắc tƣơng ứng. Hình vẽ cho thấy mô hình HRM (gồm cả HRM1 và HRM2) đều cho giá trị lƣợng mƣa ngày lớn hơn so với quan trắc trong khi đó kết quả dự báo của mô hình MM5 thƣờng cho giá trị lƣợng mƣa ngày nhỏ hơn so với quan trắc.

Hình 3.8 biểu diễn lƣợng mƣa tích lũy 24h trong các tháng mùa đông của mô hình HRM, MM5 và các trạm quan trắc tƣơng ứng. Hình vẽ cho thấy tƣơng tự nhƣ trong các tháng mùa hè mô hình HRM (gồm cả HRM1 và HRM2) đều cho giá trị lƣợng mƣa ngày lớn hơn so với quan trắc trong khi đó mô hình MM5 thể hiện kết quả ngƣợc lại.

52

(a)

(b)

(c)

(d)

(e)

Hình 3.8. Giá trị trung bình mưa tích lũy 24 giờ trong các tháng mùa đông. a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm)

Để đánh giá khả năng dự báo của hai mô hình đối với biến mƣa – một trong những yếu tố khí tƣợng khó dự báo nhất, bên cạnh các điểm số đánh giá thống kê truyền thống giống nhƣ nhiệt độ, một số điểm số khác thƣờng đƣợc dùng trong đánh giá biến bất liên tục cũng đƣợc sử dụng đó là FBI, TS, POD và TSS.

Hình 3.9 biểu diễn kết quả điểm số ME (mm/ngày) của lƣợng mƣa cho toàn Việt Nam, khu vực Bắc Bộ, Trung Bộ và Nam Bộ trong các tháng mùa đông (a), mùa hè (b), và trung bình toàn chuỗi (c).

Từ hình vẽ cho thấy mô hình HRM cho kết quả ME rất nhỏ trong mùa đông (giá trị đều dƣới 1mm/ngày) và lớn hơn đáng kể trong mùa hè (lên tới gần

53

7mm/ngày nhƣ khu vực Bắc Bộ). Điều này cho thấy kết quả dự báo mƣa trong các tháng mùa hè (đồng thời là mùa mƣa ở phần lớn các vùng khí hậu) kém chính xác hơn trong mùa đông. Nguyên nhân có thể là do trong thời kỳ mùa hè gió mùa tây nam hoạt động mạnh mang theo nhiều ẩm và cho mƣa ở lục địa nhƣng điểm hạn chế của mô hình HRM là miền tích phân của mô hình không đủ rộng về phía nam để nắm bắt đƣợc hoàn lƣu đi từ vùng vĩ độ thấp đặc biệt là dòng vƣợt xích đạo từ nam bán cầu.

(a)

(b)

Hình 3.9. Điểm số ME của mưa cho toàn Việt Nam và các khu vực trong các tháng mùa đông (a) và mùa hè (b)

Trong các tháng mùa đông ME ở khu vực Trung Bộ lớn nhất nhƣng trong các tháng mùa hè khu vực có ME lớn là khu vực Bắc Bộ. Mô hình HRM luôn cho ME dƣơng trong các tháng mùa hè, có nghĩa là mô hình HRM thƣờng dự báo khống mƣa trong các tháng mùa hè. Vào mùa đông, giá trị độ lệch ME của mô hình HRM nhỏ hơn rất nhiều so với mùa hè và thể hiện dấu không đồng nhất giữa các khu vực: ME > 0 ở khu vực Bắc Bộ và Nam Bộ (dự báo thiên cao) trong khi đó ME < 0 ở khu vực Trung Bộ (dự báo thiên thấp). Kết quả đánh giá chung cho toàn chuỗi số liệu cho thấy sai số lớn nhất thƣờng ở khu vực Bắc Bộ và nhỏ nhất ở khu vực Trung Bộ. Điều này cũng tƣơng tự với kết quả sai số nhiệt độ đã phân tích ở phần trên. Giá trị ME của mô hình HRM ở khu vực Bắc Bộ khác biệt không đáng kể giữa hai chuỗi số liệu HRM1 và HRM2, nhƣng ở khu vực Trung Bộ và Nam Bộ lại có sự khác biệt rõ. Trƣờng hợp chuỗi số liệu ngắn (HRM2) thƣờng cho sai số nhỏ hơn. Điều này cho thấy số liệu các trạm tham gia vào quá trình đánh giá có ảnh hƣởng đáng kể đến kết quả đánh giá của mô hình tùy thuộc vào mỗi khu vực.

Kết quả tính ME của mô hình MM5 cho thấy ME < 0 ở hầu hết các khu vực trong các tháng mùa đông và các tháng mùa hè (ngoại trừ khu vực Nam Bộ

54

vào mùa hè), điều này nghĩa là mô hình MM5 thƣờng dự báo thiên thấp lƣợng mƣa. Giá trị ME trong mùa đông nhỏ hơn rất nhiều so với mùa hè tƣơng tự nhƣ mô hình HRM. Giá trị ME của khu vực Bắc Bộ lớn nhất, sau đó đến Trung Bộ và Nam Bộ. Điều này cho thấy đối với dự báo lƣợng mƣa, mô hình phi thủy tĩnh MM5 mô tả tốt hơn các quá trình khí quyển ở vùng vĩ độ thấp.

Nhƣ vậy, xét chung cho toàn chuỗi số liệu ta thấy mô hình HRM cho dự báo lƣợng mƣa thiên cao, còn mô hình MM5 dự báo lƣợng mƣa thiên thấp. Cả hai mô hình đều cho sai số lớn nhất ở khu vực Bắc Bộ.

Tƣơng tự, Hình 3.10 và Hình 3.11 biểu diễn giá trị MAE và RMSE của lƣợng mƣa. Hình vẽ cho thấy giá trị MAE của mô hình HRM trong mùa hè lớn hơn rất nhiều so với trong mùa đông. Giá trị MAE trong mùa đông lớn nhất ở khu vực Trung Bộ (~ 3 mm), và nhỏ nhất ở khu vực Bắc Bộ (~ 1 mm). Tuy nhiên, trong mùa hè MAE của khu vực Bắc Bộ lại lớn nhất (~16 mm) và nhỏ nhất ở khu vực Trung Bộ (~7 mm). Giá trị MAE có sự nghịch đảo giữa hai mùa nhƣ vậy có thể do sự khác biệt về hoàn lƣu khí quyển giữa hai mùa mà mô hình chƣa nắm bắt đƣợc tốt. Nhìn chung, sai số của HRM1 thƣờng lớn hơn sai số của HRM2, trong đó độ lệch lớn nhất vào mùa hè ở khu vực Trung Bộ (MAE_HRM1 = 7.967 mm và MAE_HRM2 = 6.434 mm).

Kết quả tính MAE của mô hình MM5 cho thấy MAE trong mùa hè lớn hơn rất nhiều so với mùa đông. Mùa đông MAE lớn nhất ở khu vực Trung Bộ (3.473 mm), và nhỏ nhất ở khu vực Bắc Bộ (1.151 mm). Mùa hè thì Nam Bộ lại là khu vực có MAE lớn nhất (14.23 mm) và nhỏ nhất ở Trung Bộ (5.868 mm).

(a)

(b)

Hình 3.10. Điểm số MAE của mưa cho toàn Việt Nam và các khu vực trong các tháng mùa đông (a) và mùa hè (b)

55

Phần tiếp theo phân tích sai số quân phƣơng RMSE của mƣa cho khu vực Việt Nam, Bắc Bộ, Trung Bộ, và Nam bộ trong mùa đông và mùa hè (Hình 3.11). Tƣơng tự nhƣ ME và MAE, RMSE trong mùa hè lớn hơn đáng kể so với mùa đông. Điều này cho thấy trong các tháng mùa hè, cũng chính là mùa mƣa ở hầu hết các vùng, lƣợng mƣa lớn và các hình thế gây mƣa cũng phức tạp hơn nên mô hình gặp phải khó khăn trong trong việc mô phỏng chính xác hoàn lƣu khí quyển, lƣợng ẩm khí quyển dẫn đến kết quả dự báo bị sai khác nhiều hơn so với thực tế. Bên cạnh đó còn có vai trò của địa hình ở một số trạm ảnh hƣởng tới kết quả dự báo mƣa dẫn đến giá trị RMSE bị khuyếch đại lên đáng kể, đặc biệt là ở khu vực Bắc Bộ vào mùa hè (~30 mm/ngày). Xu hƣớng lệch của RMSE giữa các khu vực tƣơng tự với xu hƣớng của ME và MAE nhƣ đã phân tích ở trên.

Tính trung bình toàn chuỗi số liệu, RMSE ở khu vực Bắc Bộ có giá trị lớn nhất. Khi tính chung cho toàn Việt Nam thì cả hai mô hình có giá trị RMSE gần nhƣ bằng nhau. Đối với khu vực Trung Bộ và Nam Bộ thì mô hình MM5 có giá trị RMSE lớn hơn mô hình HRM.

Từ các kết quả trên ta thấy, HRM1 và HRM2 có MAE lớn hơn nhiều so với ME, điều này khiến cho việc hiệu chỉnh mô hình HRM là tƣơng đối khả quan. Còn mô hình MM5 thì giá trị MAE và RMSE không lớn hơn hơn ME nhiều lắm nên việc hiệu chỉnh là không đảm bảo, có hàm chứa các giá trị sai số lớn.

(a)

(b)

Hình 3.11. Chỉ số RMSE của mưa cho Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b)

56

Hình 3.12 là kết quả tính toán hệ số tƣơng quan mƣa. Kết hợp với Hình 3.6 ta thấy so với nhiệt độ thì hệ số tƣơng quan của mƣa thấp hơn hẳn, nhất là vào mùa hè, khi mà các hình thế gây mƣa khó đƣợc mô hình mô tả đầy đủ. Hầu hết hệ số tƣơng quan đều dƣơng ở các khu vực (thể hiện mối quan hệ đồng biến), riêng mô hình MM5 có hệ số tƣơng quan âm (thể hiện quan hệ nghịch biến) trong các tháng mùa hè ở khu vực Nam Bộ (Hình 3.12d). Hình 3.12a biểu diễn hệ số tƣơng quan tính cho toàn Việt Nam cho thấy nhìn chung mô hình HRM có hệ số tƣơng quan của mƣa lớn hơn mô hình MM5, và hệ số tƣơng quan của mƣa trong các tháng mùa đông tốt hơn trong các tháng mùa hè. Điều này có thể do mƣa mùa hè gắn liền với nhiều hình thế gây mƣa lớn phức tạp nhƣ bão, dải hội tụ nhiệt đới… mà mô hình chƣa mô phỏng chính xác.

Các Hình 3.12b, 3.12c, 3.12d biễu diễn hệ số tƣơng quan của mƣa ở các khu vực Bắc Bộ, Trung Bộ, Nam Bộ. Với chuỗi số liệu đánh giá dài hơn HRM1 có hệ số tƣơng quan mƣa ở khu vực Bắc Bộ là nhỏ nhất trong các tháng mùa đông, tiếp đến là ở khu vực Trung Bộ và lớn nhất là ở khu vực Nam Bộ. Ngƣợc lại trong các tháng mùa hè, khu vực Nam Bộ lại có hệ số tƣơng quan nhỏ nhất, tiếp đến là khu vực Bắc Bộ và lớn nhất là ở khu vực Trung Bộ. Trƣờng hợp đánh giá trên chuỗi số liệu ngắn cho thấy HRM2 khác biệt khá nhiều so với HRM1. Trong các tháng mùa đông hệ số tƣơng quan lớn nhất ở khu vực Bắc Bộ, sau đó là khu vực Trung Bộ và nhỏ nhất là khu vực Nam Bộ. Trong các tháng mùa hè hệ số tƣơng quan có giá trị lớn nhất ở khu vực Trung Bộ, tiếp đến là khu vực Bắc Bộ và Nam Bộ.

Đối với mô hình MM5, trong các tháng mùa đông hệ số tƣơng quan lớn nhất ở khu vực Bắc Bộ, sau đó là khu vực Trung Bộ và Nam Bộ. Trong các tháng mùa hè hệ số tƣơng quan ở khu vực Trung Bộ lớn nhất, tiếp đến là ở khu vực Bắc Bộ, riêng khu vực Nam Bộ có hệ số tƣơng quan âm (thể hiện mối quan hệ nghịch biến) và có giá trị tuyệt đối nhỏ nhất.

57

Việt Nam

Bắc Bộ

0.566

0.6

0.6

0.535

0.499

0.5

0.5

0.371

HRM1 HRM2 MM5

0.4

0.4

HRM1 HRM2 MM5

0.309

0.281

0.254

0.3

0.3

0.254

0.241

0.2

0.2

0.127

0.1

0.1

0.055

0.029

0

0

Mùa Đông

Mùa Hè

Mùa Đông

Mùa Hè

(a)

(b)

Nam Bộ

Trung Bộ

0.6

0.6

0.493

0.469

0.5

0.5

0.432

0.383

0.4

0.329

0.4

HRM 1 HRM 2

HRM 1 HRM 2

0.287

0.3

0.275

0.3

0.172

0.2

0.119

0.113

0.2

0.1

0.083

0.1

0

0

Mùa Đông

Mùa Hè

-0.1

-0.082

Mùa Đông

Mùa Hè

(d)

(c)

Hình 3.12. Hệ số tương quan của mưa của các mô hình cho Việt Nam (a) và các khu vực (b, c, d)

Tiếp theo Hình 3.13 và Hình 3.14 biểu diễn kết quả tính toán chỉ số FBI trung bình trong các tháng mùa đông và trong các tháng mùa hè của toàn Việt Nam và các khu vực Bắc Bộ, Trung Bộ, Nam Bộ của mô hình HRM và MM5. Trục hoành biểu diễn ngƣỡng mƣa với các giá trị 1, 2, 5, 10, 15, 20, 30, 40, 50 mm/ngày và trục tung là giá trị điểm số FBI. Giá trị tƣơng ứng nhận đƣợc của các mô hình dự báo là các đƣờng cong với chú giải nhƣ trên hình vẽ.

58

Hình 3.13 . Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa đông

Hình 3.14. Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa hè

59

Nhìn trên Hình 3.13 ta thấy, trong các tháng mùa đông khi tính cho toàn Việt Nam giá trị FBI lớn hơn 1 khi ngƣỡng mƣa dƣới 10mm/ngày đối với mô hình HRM và dƣới 2mm/ngày đối với mô hình MM5, điều này có nghĩa là ở ngƣỡng này mô hình có diện mƣa dự báo lớn hơn so với diện mƣa thám sát. Nhƣ vậy, đối với cả hai mô hình thƣờng cho kết quả dự báo khống ở các ngƣỡng mƣa nhỏ. Trong các tháng mùa hè (Hình 3.14), mô hình MM5 có giá trị FBI nhỏ hơn 1 ở tất cả các ngƣỡng, tức là dự báo diện mƣa mùa hè của mô hình này nhỏ hơn thực tế. Trong khi đó mô hình HRM có FBI >1 ở ngƣỡng dƣới 30mm/ngày (mô hình dự báo diện mƣa lớn hơn thám sát) và <1 ở ngƣỡng trên 30mm/ngày (mô hình dự báo diện mƣa nhỏ hơn thám sát).

Ở khu vực Bắc Bộ, mô hình MM5 có giá trị FBI < 1 trong cả các tháng mùa đông và các tháng mùa hè, nghĩa là mô hình luôn cho diện mƣa nhỏ hơn so với thực tế ở tất cả các ngƣỡng mƣa. Trong các tháng mùa đông, mô hình HRM với chuỗi số liệu đánh giá dài hơn (HRM1) có FBI luôn lớn hơn 1 ngoại trừ ngƣỡng mƣa 15mm/ngày là FBI = 1, tức là diện mƣa dự báo thƣờng lớn hơn diện mƣa thám sát. HRM2 có FBI dao động xung quanh giá trị 1 theo các ngƣỡng mƣa, tuy nhiên biên độ dao động này khá nhỏ, chứng tỏ các trạm tham gia vào chuỗi số liệu đánh giá có kết quả dự báo diện mƣa tƣơng đối phù hợp với thám sát. Trong các tháng mùa hè, HRM1 và HRM2 đều có FBI > 1 ở ngƣỡng mƣa dƣới 20mm, và nhỏ hơn 1 ở những ngƣỡng mƣa lớn hơn. Điều này có nghĩa là mô hình HRM thƣờng dự báo khống ở các ngƣỡng mƣa nhỏ nhƣng lại dự báo sót ở các ngƣỡng mƣa lớn.

Đối với khu vực Trung Bộ, trong các tháng mùa đông FBI cũng lớn hơn 1 ở những ngƣỡng mƣa nhỏ (< 10mm/ngày đối với HRM, và < 2mm/ngày đối với MM5), và nhỏ hơn 1 ở những ngƣỡng mƣa lớn hơn. Trong các tháng mùa hè, FBI của mô hình MM5 > 1 ở ngƣỡng mƣa dƣới 5mm/ngày, còn FBI của mô hình HRM > 1 ở ngƣỡng dƣới 30mm/ngày, và chỉ số này có giá trị nhỏ hơn 1 ở những ngƣỡng lớn hơn.

Ở khu vực Nam Bộ, trong các tháng mùa đông cả hai trƣờng hợp HRM1, HRM2 đều có xu hƣớng giống nhƣ những khu vực khác, ở ngƣỡng mƣa thấp (< 10mm/ngày đối với HRM1 và < 5mm/ngày đối với HRM2) mô hình có chỉ số FBI lớn hơn 1 (dự báo diện mƣa lớn hơn thám sát) và ở những ngƣỡng mƣa cao hơn có FBI nhỏ hơn 1 (dự báo diện mƣa nhỏ hơn thám sát). Mô hình MM5 có giá trị FBI biến đổi phức tạp hơn. Ở ngƣỡng dƣới 2mm/ngày và ngƣỡng trên

60

20mm/ngày có chỉ số FBI lớn hơn 1, ngƣỡng mƣa từ 2mm/ngày đến 20mm/ngày có FBI < 1. Trong các tháng mùa đông xu hƣớng biến đổi của chỉ số FBI cũng tƣơng tự nhƣ trong các tháng mùa hè, mô hình HRM có FBI > 1 ở ngƣỡng mƣa dƣới 17mm/ngày, và FBI < 1 ở các ngƣỡng cao hơn. Mô hình MM5 có FBI > 1 ở ngƣỡng mƣa dƣới 4mm/ngày và trên 30mm/ngày, các ngƣỡng còn lại có FBI <1.

Hình 3.15. Chỉ số TS các khu vực theo các ngưỡng mưa trong mùa đông

61

Hình 3.16. Chỉ số TS các khu vực theo các ngưỡng mưa trong mùa hè

Hình 3.15 và Hình 3.16 biểu diễn điểm số thành công TS ở các ngƣỡng mƣa của hai mô hình, điểm số này cho biết mức độ trùng khớp giữa vùng mƣa thám sát và vùng mƣa dự báo. Giá trị TS biến đổi trong khoảng từ 0 đến 1 với giá trị lý tƣởng là TS bằng 1. Trên hình vẽ nhận thấy, ở tất cả các khu vực và đối với cả hai mô hình, TS có giá trị giảm dần khi ngƣỡng mƣa tăng lên. Điều này có nghĩa là với những ngƣỡng mƣa lớn thì mức độ trùng khớp giữa mô hình và thám sát càng giảm đi. Trong các tháng mùa đông, giá trị TS giảm theo ngƣỡng mƣa chậm hơn so với trong các tháng mùa hè.

Trong tất cả các trƣờng hợp, đƣờng màu đỏ (HRM2), và đƣờng màu xanh lục (HRM1) đều nằm trên đƣờng màu xanh lá cây (MM5), điều này cho thấy mô hình HRM cho điểm số thành công tốt hơn mô hình MM5.

62

Hình 3.17. Chỉ số POD các khu vực theo các ngưỡng mưa trong mùa đông

Hình 3.18. Chỉ số POD các khu vực theo các ngưỡng mưa trong mùa hè

63

Hình 3.17 và Hình 3.18 là biểu diễn kết quả tính chỉ số xác suất phát hiện hiện tƣợng (POD), POD có giá trị từ 0 đến 1, giá trị tối ƣu là bằng 1. Kết quả tính toán ta cho thấy trong tất cả các trƣờng hợp điểm số POD trong các tháng mùa hè lớn hơn trong các tháng mùa đông - nghĩa là xác suất phát hiện đúng hiện tƣợng mƣa trong các tháng mùa hè tốt hơn trong các tháng mùa đông. Tuy nhiên giá trị POD giảm mạnh khi ngƣỡng mƣa tăng lên. Nhƣ vậy, ở những ngƣỡng mƣa lớn, xác suất phát hiện đúng hiện tƣợng gần nhƣ bằng không.

Trong cả hai mùa và ở tất cả các khu vực đƣờng màu xanh lục (HRM1) và đƣờng màu đỏ (HRM2) đều ở phía trên đƣờng màu xanh lá cây (MM5), điều này cho thấy mô hình HRM có xác suất phát hiện mƣa tốt hơn so với mô hình MM5.

Hình 3.19. Chỉ số TSS các khu vực theo các ngưỡng mưa trong mùa đông

64

Hình 3.20. Chỉ số TSS các khu vực theo các ngưỡng mưa trong mùa hè

Hình 3.19 và Hình 3.20 biểu diễn điểm kỹ năng TSS của hai mô hình ở các ngƣỡng mƣa. Giá trị TSS nằm trong khoảng -1 đến 1, giá trị tối ƣu là bằng 1. Hình vẽ cho thấy điểm số TSS trong các tháng mùa đông dốc hơn so với trong các tháng mùa hè, điều này chứng tỏ vào mùa đông TSS giảm theo độ tăng ngƣỡng mƣa lớn hơn so với mùa hè. Kỹ năng dự báo mƣa của các mô hình tốt hơn vào mùa đông và ở các ngƣỡng mƣa nhỏ, sau đó giảm nhanh khi ngƣỡng mƣa tăng lên. Trong các tháng mùa hè, các đƣờng biểu diễn TSS có xu hƣớng nằm ngang hơn, có nghĩa là kỹ năng dự báo của các mô hình tƣơng đối ổn định khi ngƣỡng mƣa tăng lên. Đƣờng màu xanh lục (HRM1) và đƣờng màu đỏ (HRM2) đều nằm trên so với đƣờng màu xanh lá cây (MM5), điều này cho thấy mô hình HRM có kỹ năng tốt hơn so với mô hình MM5.

65

3.3. Kết quả thử nghiệm đánh giá mƣa bằng phƣơng pháp fuzzy

3.3.1. Kết quả thử nghiệm với chuỗi số liệu mẫu

Để làm sáng tỏ phƣơng pháp đánh giá fuzzy, trƣớc khi áp dụng đánh giá cho khu vực Việt Nam, tác giả đã thử nghiệm với chuỗi số liệu mẫu đánh giá dự báo mƣa gây ra bởi một cơn bão tại xứ Wales nƣớc Anh. Số liệu thám sát lấy từ số liệu rađa, số liệu dự báo với độ phân giải tinh 5km, hạn dự báo 3 giờ của mô hình dự báo quy mô vừa (Golding 2000). Miền tính gồm 256x256 ô lƣới tại trung tâm của vùng mƣa.

100 km

Hình 3.21 cho thấy sự sai khác giữa vùng mƣa thám sát và dự báo lúc 15h UTC ngày 29 tháng 5 năm 1999. Hình vẽ cho thấy vùng mƣa dự báo có cƣờng độ nhỏ hơn và mở rộng hơn so với vùng mƣa thám sát. Vị trí tâm mƣa dự báo lệch về phía tây so với vùng mƣa thám sát.

Hình 3.21. Vùng mưa thám sát (trái) và vùng mưa dự báo 3h (phải) (mm/h) lúc 15h UTC ngày 29/5/1999

Hình 3.22 biểu diễn kết quả của các phƣơng pháp đánh giá fuzzy đã nêu tại bảng 1.1. Trục hoành là ngƣỡng cƣờng độ mƣa, trục tung là quy mô không gian. Kích thƣớc cửa sổ đƣợc chọn là 65 ô lƣới (tƣơng ứng với 325km). Các điểm số là hàm của quy mô không gian và cƣờng độ mƣa (từ 0.1 – 50mm/h). Ngoài ra các kết quả có thể đƣợc vẽ dƣới dạng các đƣờng cong, ở mỗi ngƣỡng mƣa đƣờng cong này là hàm của quy mô không gian, và ngƣợc lại. Trƣờng hợp kết quả tính CSRR và vùng liên đới RMSE chỉ là hàm của không gian (kích thƣớc cửa sổ) vì nó độc lập với ngƣỡng mƣa.

66

Phƣơng pháp nâng quy mô (upscaling) cho giá trị ETS lớn nhất ở ngƣỡng cƣờng độ mƣa nhỏ và quy mô không gian lớn (Hình 3.22.a), còn ở những vị trí ngƣỡng cƣờng độ mƣa lớn, khoảng cách không gian lớn những điểm số này cho giá trị nhỏ hoặc không xác định (mô hình không có kỹ năng). Điều này có thể là do vùng mƣa trải rộng ra ở những khoảng cách xa nhƣng chỉ cho cƣờng độ mƣa thấp. Ở những ngƣỡng cƣờng độ mƣa lớn, quy mô không gian lớn, mức độ phù hợp giữa thám sát và dự báo giảm đi, hoặc không xác định (mô hình không có kỹ năng).

Ở hai hình tiếp theo Hình 3.22b và Hình 3.22c là hai dạng biến thể của phƣơng pháp tiêu chuẩn phủ tối thiểu (minimum coverage criterion). Trƣờng hợp đầu tiên (Hình 3.22b), ấn định có ít nhất một sự kiện xảy ra trong hộp lƣới, trên hình cho thấy mô hình không tính đƣợc lƣợng mƣa ở ngƣỡng cƣờng độ mƣa 50mm/giờ, nên ở ngƣỡng cƣờng độ này ETS có giá trị bằng 0 ở tất cả các quy mô không gian khác nhau, ETS có giá trị cao nhất ở quy mô không gian lớn ở bất cứ khoảng cƣờng độ mƣa nào dƣới 50mm/giờ, điều này là do khi bán kính mở rộng ra, việc tìm thấy ít nhất một sự kiện xảy ra đáp ứng tiêu chí của phƣơng pháp trong khu vực ấy sẽ dễ dàng hơn. ETS cho giá trị cao nhất (0.61) ở ngƣỡng cƣờng độ mƣa 20mm/giờ và quy mô không gian là 325km. Ở những quy mô không gian nhỏ hơn, tỉ lệ báo động sai ETS cho giá trị nhỏ hơn.

Trƣờng hợp tiếp theo (Hình 3.22c), đòi hỏi phải sự kiện xảy ra trong hộp lƣới phải trên 50% (≥50 coverage). Gần giống với trƣờng hợp nâng quy mô (upscaling), giá trị ETS lớn nhất ở các ngƣỡng quy mô cƣờng độ mƣa thấp, nhƣng ở quy mô không gian nhỏ hơn (24÷45km) (Hình 3.22c). Ở ngƣỡng cƣờng độ mƣa lớn, quy mô không gian rộng hơn, ETS có giá trị bằng 0 (các ô màu xanh dƣơng), mô hình dự báo không có kỹ năng (các ô trắng).

Cả phƣơng pháp fuzzy lôgic (Hình 3.22d) và dạng khác của nó phƣơng pháp xác suất đồng thời (Hình 3.22e - joint probability) đều xác định các hiện tƣợng xảy ra trong vùng lân cận nhƣ xác suất của chính chúng trong hộp lƣới, nhƣng khác nhau ở cách tính dự báo đúng trong bảng liên hợp. Phƣơng pháp fuzzy logic cải thiện hiệu suất khi tăng quy mô không gian ở hầu hết các ngƣỡng mƣa khi độ tin cậy của các dự báo không chính xác giảm nhanh so với các dự báo chính xác (Hình 3.22.d).

67

Hình 3.22. Kết quả đánh giá bằng phương pháp fuzzy cho hạn dự báo 03 giờ ngày 29/5/1999

Khi bảng liên hợp các yếu tố dựa trên xác suất đồng thời, khác với fuzzy lôgic, trƣờng hợp này giá trị ETS xấu đi khi quy mô không gian tăng (Hình 3.22e). Điều này là do xác suất đồng thời của dự báo có và không có hiện tƣợng

xảy ra so với thám sát giảm đi khi các trƣờng trở nên không đồng nhất và

nhận các giá trị trung bình. Mức độ phù hợp giữa dự báo và thám sát ở mỗi ngƣỡng cƣờng độ mƣa với quy mô không gian trên 5km sẽ cho một giá trị ETS cao nhất (ví dụ, ngƣỡng mƣa 20km/giờ, ETS lớn nhất ở khoảng cách 45km).

Điểm số Hanssen và Kuipers đƣợc biểu diễn trƣờng hợp bảng liên hợp các sự kiện (Multi-event contingency table). Tiêu chuẩn cho một dự báo tốt trong trƣờng hợp này là dự báo đúng đƣợc ít nhất một sự kiện gần với thám sát. Trƣờng hợp này tƣơng tự nhƣ trƣờng hợp tiêu chuẩn phủ thứ nhất (Hình 3.22b -

68

Anywhere in window), trừ trƣờng hợp các sự kiện quan trắc ở vị trí trung tâm của vùng lân cận. Các giá trị lớn nhất của chỉ số HK nằm ở quy mô trung bình và ngƣỡng mƣa cao (Hình 3.22f). Hình 3.21 cho thấy mƣa dự báo thấp hơn trong khoảng vài km so với tâm mƣa thám sát, nhƣng khi mở rộng không gian ra ngoài thì dễ dàng tìm thấy có ít nhất một khoảng nào đó có cƣờng độ mƣa dự báo gần đúng với thám sát.

Phƣơng pháp quy mô - cƣờng độ cho thấy vùng có điểm số lớn nhất không phụ thuộc vào ngƣỡng mƣa (Hình 3.22.g). Cấu trúc giống nhƣ một điểm kỹ năng đối với việc sắp xếp ngẫu nhiên trong cửa sổ thám sát, các điểm số có giá trị cực trị xảy ra tại các ngƣỡng mƣa lớn. Kết quả thu đƣợc từ phƣơng pháp này biến thiên nhiều nhất so với các phƣơng pháp khác bởi vì các không gian cửa sổ đƣợc lấy từng trƣờng hợp riêng lẻ chứ không lấy liên tiếp các cửa sổ với các kích thƣớc khác nhau.

Điểm kỹ năng phần tử (FSS) (Hình 3.22h) đo mức độ phù hợp giữa xác suất xuất hiện sự kiện dự báo và các hiện tƣợng quan trắc trong vùng lân cận, cấu trúc giống nhƣ điểm kỹ năng đặc trƣng cho các dự báo không chồng chéo lên nhau. Giá trị điểm số FSS tăng lên cùng với độ tăng của ngƣỡng không gian khi dự báo gần đúng với thám sát, và đối với trƣờng hợp này, FSS đạt giá trị lớn nhất tại ngƣỡng cƣờng độ mƣa trung bình, nơi dự báo có độ lệch nhỏ nhất so với thám sát.

Các phƣơng pháp tiếp cận thực tế so sánh xác suất của các sự kiện bên trong cửa sổ dự báo với các hiện tƣợng xảy ra ở trung tâm cửa sổ quan trắc, sử dụng số điểm kỹ năng Brier đánh giá sai số bình phƣơng trung bình với chuẩn khí hậu. Các kỹ năng lớn nhất về các ngƣỡng mƣa trung bình đến lớn và quy mô không gian vừa phải (Hình 3.22i).

Hình 3.22j cho thấy tỷ lệ chính xác của phƣơng pháp thực nghiệm hoàn hảo (Practically perfect hindcast), ETSy/ETSx. Trƣờng hợp này ETS cho giá trị lớn ở quy mô không gian lớn và ngƣỡng cƣờng độ mƣa thấp (0,1-0,2mm/giờ). Thấy rõ lƣợng mƣa trung bình phía tây xứ Wales đƣợc dự báo không tốt đối với ngƣỡng mƣa trung bình.

Hai phƣơng pháp tiếp theo xác định các điểm số một cách trực tiếp độc lập với cƣờng độ mƣa, không phải xác định sự xuất hiện hay xác suất của các sự kiện. Căn bậc hai có điều kiện của RPS (CSRR) cơ bản kiểm tra xác suất dự báo

69

cƣờng độ mƣa phù hợp nhƣ thế nào so với giá trị thám sát. Khi quy mô tăng quy mô RPS giảm (Hình 3.22k), khi tiếp tục tăng quy mô lớn hơn nữa dự báo không còn đƣợc sắc nét nữa và điểm số bắt đầu trở nên kém hơn (RPS tăng lên).

Vùng liên đới RMSE tính giá trị sai số bình phƣơng trung bình của cƣờng độ đƣợc sắp xếp trong không gian cửa sổ. Các đồ thị Hình 3.22l cho thấy trung bình của các giá trị RMSE khu vực liên đới đến tất cả các cửa sổ trong miền tính. Phù hợp với FSS trong Hình 3.22h, điểm số đƣợc cải thiện khi tăng kích thƣớc cửa sổ đồng nghĩa với việc sự phân bố cƣờng độ trong vùng lân cận dự báo và thám sát trở nên phù hợp hơn.

Điểm mấu chốt của phƣơng pháp đánh giá fuzzy là đƣa ra đƣợc thông tin dự báo ở quy mô và cƣờng độ nào là có kỹ năng, đƣa ra đƣợc quyết định đúng đắn về tính hữu ích của mô hình cho ngƣời sử dụng,

Việc có một mức độ phù hợp tốt giữa dự báo và thám sát ở quy mô thô là

hết sức quan trọng, điều này chỉ xảy trong trƣờng hợp mƣa nhỏ (Hình 3.22a).

Nếu không kết hợp các giá trị trung bình khu vực, đòi hỏi dự báo có chứa một giá trị phù hợp trong vùng lân cận của các giá trị quan sát, thì nhiều khả năng là mức độ sai số sẽ tăng lên. Trong thực tế, khi các kỹ năng nhƣ là một minh chứng cho độ giảm các báo động sai (false alarms) và dự báo xót (miss) để dự báo đƣợc tốt hơn đối với ngƣỡng cƣờng độ mƣa lớn nhất (Hình 3.22b, hình 3.22e). Nếu mức độ bao phủ trên 50% là cần thiết cho một sự kiện thì chỉ phù hợp đối với lƣợng mƣa nhỏ hơn (Hình 3.22c).

Khi sự kiện đƣợc phép cả một phần "có" và một phần "không", fuzzy lôgic cho thấy dự báo chính xác hơn ở quy mô lớn nhất (Hình 3.22d). Ngƣợc lại, phƣơng pháp xác suất chung cho thấy quy mô lớn hơn ít chính xác và trong thực tế, dự báo chính xác nhất ở quy mô lớn nhất và cƣờng độ mƣa nhẹ nhất (Hình 3.22e).

Nếu đặc trƣng chính xác cho phần mƣa là quan trọng nhất, thì kỹ năng lớn nhất xảy ra ngẫu nhiên ở quy mô không gian lớn và ngƣỡng cƣờng độ mƣa cao (nơi không dự báo và không quan trắc đƣợc nhƣng sai số ngẫu nhiên lại nhỏ) (Hình 3.22g). Chúng ta có thể làm giảm các quy mô không gian và cƣờng độ khi chúng không đặc trƣng tại những vùng quy mô không gian và cƣờng độ không có mƣa (xem Hình 3.22a) trong khi các mô hình dự báo mƣa tốt nhất ở quy mô lớn và lƣợng mƣa nhỏ trong khi dự báo kém chính xác nhất xảy ra tại quy mô

70

không gian nhỏ và cƣờng độ mƣa cao. Nếu dự báo hữu ích đòi hỏi rằng các tần số dự báo tƣơng tự nhƣ tần số quan sát, dự báo là tốt nhất ở quy mô lớn và cƣờng độ mƣa trung bình (Hình 3.22h). Khi dự báo cho các địa điểm cụ thể chứ không phải là khu vực lân cận, các kỹ năng tốt nhất trong việc phát hiện các sự kiện và không phải là sự kiện xảy ra ở quy mô không gian trung bình và cƣờng độ trung bình (Hình 3.22i). Dự báo gần nhất sẽ đƣợc cấp bởi một dự báo có kỹ năng tốt ở các quy mô trung bình và ngƣỡng mƣa nhỏ (Hình 3.22j). Cuối cùng, khi phân bố cƣờng độ thám sát là quan trọng, cả hai phƣơng pháp sai phƣơng có điều kiện CSRR và phƣơng pháp vùng liên đới RMSE đều cho kỹ năng tốt ở ngƣỡng mƣa trung bình với quy mô lớn (Hình. 3.22k và Hình 3.22l).

3.3.2. Thử nghiệm đánh giá kết quả dự báo mưa bằng phương pháp fuzzy cho Việt Nam

Thử nghiệm đánh giá chất lƣợng dự báo mƣa bằng phƣơng pháp fuzzy cho khu vực Bắc Bộ Việt Nam. Tác giả thử nghiệm phƣơng pháp fuzzy cho 2 hình thế mƣa khác nhau: mƣa do bão và mƣa do không khí lạnh. Thời gian thử nghiệm cho đánh giá dự báo mƣa do bão gây ra là ngày 06/7/2007 (ngày đang có bão đổ bộ vào miền bắc Việt Nam) và mƣa do không khí lạnh gây ra là ngày 23/12/2007. Các số liệu này đƣợc trích từ tập số liệu đã thu thập đƣợc nhƣ đã nói ở những phần trên (Số liệu dự báo của mô hình HRM).

Miền đánh giá: Khu vực Bắc Bộ: 19.50N - 27.1250N; 97.1250E - 117.1250E (HRM1: 65 trạm đƣợc nội suy về lƣới mô hình)

3.3.2.1. Thử nghiệm đánh giá cho dự báo mưa do bão gây ra

a

b

Hình 3.23. Vùng mưa thám sát (trái) và vùng mưa dự báo mưa tích lũy 24h (phải) (mm/ngày) ngày 6/7/2007

71

Hình 3.23 biểu diễn sự sai khác giữa vùng mƣa thám sát (Hình 3.23a) và dự báo (Hình 3.23b) ngày 6/7/2007. Hình vẽ cho thấy, cƣờng độ mƣa dự báo nhỏ hơn so với thám sát, vùng mƣa của mô hình HRM lệch lên phía Bắc so với thám sát.

Hình 3.24 biểu diễn kết quả đánh giá fuzzy của một số phƣơng pháp tiêu biểu cho dự báo mƣa khu vực bắc bộ Việt Nam với hình thế mƣa do bão gây ra, trục hoành là ngƣỡng cƣờng độ mƣa, trục tung là quy mô không gian. Kích thƣớc cửa sổ đƣợc chọn là 65 ô lƣới (tƣơng ứng với 910km). Các điểm số là hàm của kích thƣớc cửa sổ và phụ thuộc vào ngƣỡng cƣờng độ mƣa (từ 0.1 – 150mm/ngày).

Hình3.24. Kết quả đánh giá bằng phương pháp fuzzy cho dự báo mưa 24 giờ ngày 06/7/2007

72

Phƣơng pháp nâng quy mô (upscaling) cho giá trị ETS lớn nhất ở ngƣỡng cƣờng độ mƣa nhỏ (dƣới 5mm/ngày) và quy mô không gian lớn (ETS =0.46 tại quy mô 462km) (Hình 3.23a). Ở những ngƣỡng cƣờng độ mƣa cao hơn (trên 5mm/ngày), ETS cho giá trị nhỏ (hoặc không xác định đƣợc (không có kỹ năng) – những ô màu trắng). Điều này là do ở phạm vi rộng hơn mức độ phù hợp giữa dự báo và thám sát giảm đi ở các mức độ mƣa khác nhau.

Ở hình tiếp theo hình 3.24.b và hình 3.24c là kết quả tính chỉ số ETS bằng phƣơng pháp độ bao phủ tối thiểu (minimum coverage). Trong trƣờng hợp này, phƣơng pháp không có kỹ năng với những cƣờng độ mƣa trên 50mm/ngày, nên từ ngƣỡng cƣờng độ này ETS có giá trị bằng 0 (những ô màu xanh dƣơng) hoặc không xác định đƣợc (những ô màu trắng) ở tất cả các quy mô không gian từ nhỏ đến lớn. Trong Hình 3.24 (anywhere in window), ta thấy ETS có giá trị cao nhất ở quy mô không gian lớn (0.58) ở ngƣỡng cƣờng độ mƣa 30mm/ngày. Ở những quy mô không gian nhỏ hơn, ETS cho giá trị nhỏ hơn. Điều này là do ở một quy mô rộng lớn thì điều kiện dự báo xảy ra ít nhất một sự kiện so với thám sát dễ đƣợc đáp ứng hơn so với phạm vi quy mô nhỏ. Một trƣờng hợp khác của phƣơng pháp độ phủ tối thiểu, độ phủ trên 50% (≥50 coverage) gần giống với trƣờng hợp nâng quy mô (upscaling) trong Hình 3.24a, giá trị ETS lớn nhất ở các ngƣỡng cƣờng độ mƣa nhỏ (dƣới 5mm/ngày), nhƣng ở quy mô không gian nhỏ (hình 3.24c). Ở ngƣỡng cƣờng độ mƣa lớn, quy mô không gian lớn hơn, ETS có giá trị bằng 0 hoặc không xác định đƣợc. Điều này cho thấy ở quy mô không gian rộng lớn hơn điều kiện mức độ phù hợp giữa dự báo và thám sát phải trên 50% là khó thực hiện đƣợc hơn ở các quy mô không gian nhỏ ở tất cả các ngƣỡng cƣờng độ mƣa (đặc biệt là những ngƣỡng mƣa lớn).

Hai trƣờng hợp tiếp theo Hình 3.24d và Hình 3.24e là phƣơng pháp fuzzy lôgic và xác suất đồng thời (một dạng của phƣơng pháp fuzzy lôgic). Hai phƣơng pháp này đều cho ETS bằng 0 hoặc không xác định đƣợc giá trị ở các ngƣỡng mƣa trên 30mm/ngày. Trong khi đó, ở ngƣỡng mƣa dƣới 30mm/ ngày, fuzzy lôgic (Hình 3.24d) cho giá trị ETS hơn ở quy mô lớn và ngƣỡng cƣờng độ mƣa nhỏ (ETS cho giá trị cao hơn ở cả một vùng dƣới 5mm/ngày với quy mô trên 126km), còn xác suất đồng thời (Hình 3.24e) thì cho giá trị ETS lớn ở ngƣỡng cƣờng độ mƣa rất nhỏ (dƣới 5mm/ngày) với quy mô không gian nhỏ (ETS lớn nhất 0.18 ở quy mô nhỏ hơn 42km).

Hình tiếp theo (Hình 3.24f) biểu diễn phƣơng pháp liên hợp các sự kiện

73

(Multi-event contingency table), tiêu chuẩn cho một dự báo tốt trong trƣờng hợp này là dự báo đúng đƣợc ít nhất một sự kiện gần đúng với thám sát. Trong phƣơng pháp này ETS lớn hơn ở quy mô nhỏ với cƣờng độ mƣa thấp (ETS lớn nhất bằng 0.18 ở ngƣỡng dƣới 5mm/ngày với quy mô 14km). Ở các ngƣỡng mƣa trên 50mm/ngày và dƣới 100 mm/ngày ETS có giá trị bằng 0, ở ngƣỡng trên 100 mm/ ngày giá trị ETS là không xác định.

Điểm kỹ năng phần tử (FSS) (Hình 3.24g) xác định mức độ phù hợp giữa các dự báo và các hiện tƣợng quan trắc đƣợc trong vùng lân cận, cấu trúc giống nhƣ điểm kỹ năng đối với các dự báo không chồng chéo lên nhau. Giá trị điểm số FSS tăng lên cùng với độ tăng của ngƣỡng không gian khi dự báo gần đúng với thám sát, và đối với trƣờng hợp này, FSS đạt giá trị lớn nhất tại ngƣỡng cƣờng độ mƣa thấp, nơi dự báo có độ lệch nhỏ nhất.

Khi dự báo cho các điểm trong chính ô lƣới chứ không phải là khu vực lân cận, các kỹ năng lớn nhất trong việc phát hiện các sự kiện và không phải là sự kiện xảy ra ở quy mô trung bình và cƣờng độ trung bình (Hình 3.24.h). Trƣờng hợp này điểm số BSS có giá trị tuyệt đối lớn nhất ở quy mô nhỏ và ngƣỡng cƣờng độ mƣa thấp. Ngƣợc lại ở các quy mô lớn và ngƣỡng cƣờng độ mƣa cao, điểm số BSS cho giá trị rất thấp.

Hình 3.24i cho thấy tỷ lệ chính xác của phƣơng pháp thực nghiệm hoàn hảo (Practically perfect hindcast). Trƣờng hợp này ETS cho giá trị lớn ở quy mô không gian lớn và ngƣỡng cƣờng độ mƣa nhỏ (dƣới 5mm/ngày).

Tiếp theo là phƣơng pháp sai số bình phƣơng có điều kiện (CSRR) RPS (Hình 3.24j) cơ bản kiểm tra xác suất dự báo cƣờng độ mƣa phù hợp nhƣ thế nào so với giá trị thám sát. Phƣơng pháp này độc lập với ngƣỡng cƣờng độ mƣa, đƣợc biểu diễn dƣới dạng đƣờng cong. Đƣờng CSRR có xu hƣớng giảm dần theo mức tăng quy mô, tức là ở quy mô lớn hơn mô hình dự báo tốt hơn (vì CSRR gần giống nhƣ độ lệch chuẩn của xác suất). Ở quy mô lớn hơn nữa đƣờng CSRR lại có xu hƣớng tăng lên, ở quy mô quá lớn này, dự báo xác suất dự báo không còn sắc nét và điểm số bắt đầu trở nên kém hơn.

Vùng liên đới RMSE tính giá trị sai số bình phƣơng trung bình, các đƣờng biểu diễn trong Hình 3.24k cho thấy đƣờng liên đới RMSE giảm dần theo mức tăng quy mô. Điều này cũng phù hợp với xu hƣớng điểm FSS trong Hình 3.24g, điểm số đƣợc cải thiện khi tăng quy mô đồng nghĩa với việc sự phân bố mƣa dự

74

báo và thám sát trở nên phù hợp hơn.

3.3.2.2. Thử nghiệm đánh giá cho dự báo mưa do không khí lạnh gây ra

Hình 3.25 biểu diễn sự sai khác giữa vùng mƣa thám sát và dự báo ngày 23/12/2007, mƣa thám sát (Hình 3.25a), vùng mƣa dự báo (Hình 3.25b). Hình vẽ cho thấy vị trí mƣa dự báo lệch hẳn về phía nam so với thám sát (và vùng mƣa dự báo cũng nhỏ hơn rất nhiều so với vùng mƣa thám sát), cƣờng độ mƣa dự báo nhỏ hơn rất nhiều so với thám sát.

Hình 3.25. Vùng mưa thám sát (trái) và vùng mưa dự báo 24h (phải) (mm/ngày) ngày 23/12/2007 (không khí lạnh)

Hình 3.26 biểu diễn kết quả phƣơng pháp đánh giá fuzzy của một số phƣơng pháp cho dự báo mƣa khu vực bắc bộ Việt Nam với hình thế mƣa do không khí lạnh gây ra, trục hoành là ngƣỡng cƣờng độ mƣa, trục tung là quy mô không gian. Kích thƣớc cửa sổ đƣợc chọn là 65 ô lƣới (tƣơng ứng với 910km). Các điểm số là hàm của kích thƣớc cửa sổ và phụ thuộc vào ngƣỡng cƣờng độ mƣa (từ 0.1 – 150mm/ngày).

Phƣơng pháp nâng quy mô (upscaling) cho giá trị ETS lớn nhất ở ngƣỡng cƣờng độ mƣa nhỏ (dƣới 5mm/ngày) và quy mô không gian lớn (ETS =0.49 tại quy mô 462km) (hình 3.26.a), những ngƣỡng cƣờng độ mƣa cao hơn (trên 5mm/ngày), ETS cho giá trị nhỏ (hoặc không xác định đƣợc (không có kỹ năng) – những ô màu trắng). Điều này là do ở phạm vi rộng hơn mức độ phù hợp giữa dự báo và thám sát giảm đi.

Ở hình tiếp theo hình 3.26b và hình 3.26c là kết quả tính chỉ số ETS bằng phƣơng pháp độ phủ tổi thiểu (minimum coverage). Trong trƣờng hợp này, phƣơng pháp không có kỹ năng với những cƣờng độ mƣa trên 20mm/ngày, trên ngƣỡng cƣờng độ này ETS có giá trị bằng 0 (các ô màu xanh dƣơng) hoặc xác định đƣợc (những ô màu trắng). Trong hình 3.26b (anywhere in window), ta

75

thấy ETS có giá trị cao nhất ở quy mô không gian trung bình (0.42) ở ngƣỡng cƣờng độ mƣa nhỏ dƣới 5 mm/ngày. Điều này là do ở một quy mô rộng lớn thì điều kiện dự báo xảy ra ít nhất một sự kiện so với thám sát dễ đƣợc đáp ứng hơn so với phạm vi quy mô nhỏ. Một trƣờng hợp khác của phƣơng pháp độ phủ tối thiểu, độ phủ trên 50% (≥50 coverage), giá trị ETS lớn nhất ở các ngƣỡng cƣờng độ mƣa nhỏ (dƣới 5mm/ngày) với quy mô không gian trung bình (hình 3.26c). Ở ngƣỡng cƣờng độ mƣa lớn, quy mô không gian lớn hơn, ETS có giá trị bằng 0 hoặc không xác định đƣợc. Điều này cho thấy ở quy mô không gian rộng lớn hơn mức độ phù hợp giữa dự báo và thám sát phải trên 50% là ít khả quan hơn ở các quy mô không gian nhỏ ở tất cả các ngƣỡng cƣờng độ mƣa (đặc biệt là những ngƣỡng mƣa lớn).

Hình 3.26. Kết quả đánh giá bằng phương pháp fuzzy cho hạn dự báo mưa tích lũy 24 giờ ngày 23/12/2007

76

Hai trƣờng hợp tiếp theo Hình 3.26d và hình 3.26e là phƣơng pháp fuzzy lôgic và xác suất đồng thời (một dạng của phƣơng pháp fuzzy lôgic). Hai phƣơng pháp này đều cho ETS bằng 0 (những ô màu xanh dƣơng) hoặc không xác định đƣợc (những ô màu trắng) giá trị ETS ở các ngƣỡng mƣa trên 20mm/ngày. Trong khi đó, ở ngƣỡng mƣa dƣới 20mm/ ngày, fuzzy lôgic (Hình 2.26d) cho giá trị ETS hơn hơn ở quy mô lớn và quy mô trung bình với ngƣỡng cƣờng độ mƣa nhỏ, còn xác suất đồng thời (hình 3.26e) thì cho giá trị ETS lớn ở ngƣỡng cƣờng độ mƣa rất nhỏ (dƣới 5mm/ngày) với quy mô không gian nhỏ (ETS lớn nhất 0.27 ở quy mô nhỏ hơn 126km).

Hình tiếp theo (Hình 3.26f) biểu diễn phƣơng pháp liên hợp các sự kiện (Multi-event contingency table), ETS lớn hơn ở quy mô nhỏ với cƣờng độ mƣa thấp (ETS lớn nhất bằng 0.28 ở ngƣỡng dƣới 5mm/ngày với quy mô 14km). Ở các ngƣỡng mƣa trên 20mm/ngày giá trị ETS là không xác định đƣợc.

Điểm kỹ năng phần tử (FSS) (hình 3.26g), giá trị điểm số FSS cao ở quy mô không gian lớn ở tất cả các ngƣỡng mƣa nhƣng cao nhất là ở ngƣỡng mƣa thấp (dƣới 5mm/ngày). Điều này là do vị trí vùng mƣa dự báo lệch về phía nam quá nhiều so với vị trí vùng mƣa thám sát, mặt khác dự báo lại chỉ cho kết quả mƣa ở ngƣỡng thấp.

Khi dự báo cho các điểm trong chính ô lƣới chứ không phải là khu vực lân cận, các kỹ năng lớn nhất trong việc phát hiện các sự kiện và không phải là sự kiện xảy ra ở quy mô trung bình và cƣờng độ mƣa thấp (hình 3.24.h). Trƣờng hợp này điểm số BSS có giá trị tuyệt đối lớn nhất ở quy mô nhỏ và ngƣỡng cƣờng độ mƣa thấp.

Hình 3.26.i cho thấy tỷ lệ chính xác của phƣơng pháp thực nghiệm hoàn hảo (Practically perfect hindcast). Trƣờng hợp này ETS cho giá trị lớn ở quy mô không gian lớn và ngƣỡng cƣờng độ mƣa nhỏ dƣới 5mm/ngày (ETS lớn nhất bằng 0.54). Ở ngƣỡng mƣa vừa (16-20mm/ngày) ETS có giá trị bằng 0, và ở ngƣỡng trên 20mm/ngày ETS không xác định.

Tiếp theo là phƣơng pháp sai số bình phƣơng có điều kiện (CSRR) RPS (hình 3.26j), phƣơng pháp này độc lập với ngƣỡng cƣờng độ mƣa, đƣợc biểu diễn dƣới dạng đƣờng cong. Đƣờng CSRR có xu hƣớng giảm dần theo mức tăng quy mô, tức là ở quy mô lớn hơn mô hình dự báo tốt hơn (vì CSRR gần giống nhƣ độ lệch chuẩn của xác suất). Ở quy mô lớn hơn nữa đƣờng CSRR lại có xu

77

hƣớng tăng lên, ở quy mô quá lớn này, dự báo xác suất không còn sắc nét và điểm số bắt đầu trở nên kém hơn.

Vùng liên đới RMSE tính giá trị sai số bình phƣơng trung bình, các đƣờng biểu diễn trong hình 3.26k cho thấy đƣờng liên đới RMSE giảm mạnh theo mức tăng quy mô. Điều này cũng phù hợp với xu hƣớng điểm FSS trong hình 3.26g, điểm số đƣợc cải thiện khi tăng quy mô đồng nghĩa với việc sự phân bố mƣa dự báo và thám sát trở nên phù hợp hơn.

78

KẾT LUẬN

Vì không có một điểm số đánh giá nào chứa đầy đủ thông tin cũng nhƣ ý nghĩa ƣu việt do đó cần phải kết hợp tính toán nhiều điểm số nhằm đánh giá đƣợc một cách toàn diện và khách quan trong phân tích kết quả.

Sau khi chọn phân tích kết hợp các điểm số đánh giá trên có chú trọng đến tính hệ thống và tính ngẫu nhiên của sai số, tác giả đã rút ra một số kết luận sau:

* Đối với nhiệt độ:

Mô hình HRM cho nhiệt độ dự báo thấp hơn so với quan trắc khoảng 20C (dự báo thiên thấp). Trong khi đó mô hình MM5 cho nhiệt độ dự báo cao hơn quan trắc khoảng dƣới 0.50C (dự báo thiên cao). Sai số nhiệt độ trong mùa đông thƣờng lớn hơn so với mùa hè. Kết quả đánh giá chung cho toàn chuỗi số liệu của HRM cho thấy sai số lớn nhất thƣờng ở khu vực Bắc Bộ và nhỏ nhất là ở khu vực Trung Bộ, MM5 cho sai số lớn ở khu vực Nam Bộ.

Tuy rằng mô hình MM5 cho giá trị độ lệch trung bình nhiệt độ nhỏ hơn so với mô hình HRM nhƣng độ ổn định không cao (Có lúc dự báo cho giá trị nhiệt độ thấp hơn so với thám sát thiên thấp, có lúc lại cho dự báo thiên cao). Và hệ số tƣơng quan cũng thấp hơn so với mô hình HRM. Mô hình HRM luôn cho giá trị nhiệt độ dự báo thấp hơn so với giá trị thám sát (ME luôn âm), kết hợp với giá trị MAE chênh lệch không nhiều so với ME. Điều này khiến cho việc hiệu chỉnh mô hình HRM sẽ dễ dàng hơn so với mô hình MM5.

Kết quả đánh giá nhiệt độ của đề tài này cho khu vực Bắc Bộ Việt Nam hoàn toàn phù hợp với kết quả đề tài luận văn thạc sỹ: “Đánh giá sản phẩm mô hình dự báo số HRM trƣờng nhiệt độ mùa đông ở Bắc Bộ Việt Nam” của tác giả Vũ Anh Tuấn (2004).

* Đối với mƣa:

HRM cho dự báo mƣa mùa hè kém chính xác hơn trong mùa đông (ME mùa đông dƣới 1mm/ngày, trong khi mùa hè tới gần 7mm/ngày tại khu vực Bắc Bộ). Sai số lớn nhất thƣờng ở khu vực Bắc Bộ và nhỏ nhất ở khu vực Trung Bộ. Trƣờng hợp chuỗi số liệu ngắn (HRM2) thƣờng cho sai số nhỏ hơn.

Mô hình MM5 cho dự báo lƣợng mƣa thiên thấp. MM5 cho dự báo lƣợng mƣa thấp hơn so với thực tế ở khu vực Bắc Bộ và Trung Bộ, cũng nhƣ khu vực Việt Nam. Chỉ riêng khu vực Nam Bộ cho lƣợng mƣa cao hơn, trong đó sai số

79

lớn nhất ở khu vực Bắc Bộ. Điều này cho thấy đối với dự báo lƣợng mƣa, mô hình phi thủy tĩnh MM5 mô tả tốt hơn các quá trình khí quyển ở vùng vĩ độ thấp.

Nhƣ vậy, xét chung cho toàn chuỗi số liệu ta thấy mô hình HRM cho dự báo lƣợng mƣa thiên cao, còn mô hình MM5 dự báo mƣa thiên thấp. Cả hai mô hình đều cho các giá trị độ lệch trung bình giữa dự báo và quan trắc lúc âm lúc dƣơng (lúc dự báo thấp hơn thám sát, lúc lại dự báo cao hơn thám sát). Hệ số tƣơng quan của HRM ổn định hơn trong các mùa so với MM5.

Kết hợp giữa các chỉ số có thể thấy mô hình HRM có tính ổn định và mức

độ tin cậy cao hơn so với mô hình MM5.

Ở cả hai mô hình, dự báo mƣa ở các ngƣỡng mƣa thấp cho kết quả chính

xác (độ tin cậy cao hơn) so với các ngƣỡng mƣa lớn.

* Đánh giá dự báo mƣa bằng phƣơng pháp fuzzy:

Ƣu điểm lớn nhất của phƣơng pháp đánh giá kết quả dự báo mƣa mô hình HRM là có thể dễ dàng nhận thấy bằng trực giác ở những quy mô không gian nào và ở ngƣỡng mƣa nào mô hình cho dự báo tốt hơn.

Các kết quả đƣợc tính trên đây chỉ chiếm một phần nhỏ của các điểm số mà phƣơng pháp fuzzy có thể tính đƣợc. Tuy nhiên, rất khó để đồng thời làm rõ ý nghĩa của tất cả các điểm số đó bằng một điểm số duy nhất, mà ngƣời dùng phải kết hợp tất cả các điểm số đó mới đƣa ra đƣợc một kết luận đúng đắn nhất. Đánh giá fuzzy là một phƣơng pháp hoàn toàn mới tại Việt Nam, số liệu mô hình HRM có độ phân giải (14km) không đƣợc tinh nhƣ số liệu rađa của số liệu mẫu (5km), số liệu chỉ chạy cho hai ngày không đủ dài để đánh giá thống kê. Chính vì vậy mà việc áp dụng phƣơng pháp này trong khuôn khổ luận văn, tác giả chủ yếu chú trọng đến việc thử nghiệm phƣơng pháp.

Tuy vậy, bƣớc đầu cũng đã thu đƣợc một số kết quả có ý nghĩa về mặt lý thuyết. Về cơ bản mô hình HRM dự báo tốt đƣợc lƣợng mƣa ở cƣờng độ mƣa không quá cao và HRM dự báo tốt hơn ở những quy mô không gian không quá lớn.

Hƣớng nghiên cứu tiếp theo, tác giả có tham vọng sử dụng phƣơng pháp này để đánh giá cho tất cả các mô hình dự báo thời tiết đang chạy nghiệp vụ tại Việt Nam với độ chính xác đủ tin cậy./.

80

TÀI LIỆU THAM KHẢO

Tiếng Việt:

1. Nguyễn Văn Bảy (2003), Đánh giá dự báo mưa vừa, mưa lớn và trường dự báo khí áp mực biển cho và trên khu vực Trung Bộ, Luận văn thạc sĩ Khoa học, Đại học Khoa học Tự Nhiên, Đại học Quốc gia Hà Nội;

2. Dƣơng Liên Châu, Nguyễn Viết Thi (2007), Xây dựng hệ thống chỉ tiêu đánh giá chất lượng dự báo khí tượng thủy văn, Đề tài cấp Nhà nƣớc, Trung tâm Dự báo Khí tƣợng thủy văn Trung Ƣơng;

3. Hoàng Đức Cƣờng (2004), Nghiên cứu thử nghiệm áp dụng mô hình khí tượng động lực quy mô vừa MM5 trong dự báo hạn ngắn ở Việt Nam, Viện Khoa học Khí tƣợng Thủy văn và Môi trƣờng, tháng 12/2004 – Đề tài cấp Nhà nƣớc;

4. Hoàng Đức Cƣờng (2007), Nghiên cứu thử nghiệm dự bao mưa lớn ở Việt Nam bằng mô hình MM5, Viện Khoa học Khí tƣợng Thủy văn và Môi trƣờng, tháng 12/2007– Đề tài cấp Nhà nƣớc;

5. Nguyễn Đình Dũng (2007), Nghiên cứu Đánh giá chất lượng sản phẩm dự báo khí hậu và xây dựng quy trình đánh giá trong dự báo nghiệp vụ, Viện Khoa học Khí tƣợng Thủy văn và Môi trƣờng, 2007.

6. Trần Quang Năng (2009), Đánh giá sai số hệ thống dự báo mưa của mô hình HRM cho khu vực đông Bắc Bộ, Luận văn thạc sĩ Khoa học, Đại học Khoa học Tự Nhiên, Đại học Quốc gia Hà Nội, Hà Nội;

7. Đỗ Lệ Thủy (2009), Nghiên cứu xây dựng hệ thống dự báo các yếu tố khí tượng bằng phương pháp thống kê trên sản phẩm mô hình HRM, Trung tâm Khí tƣợng Thủy văn Quốc gia – Đề tài cấp Nhà nƣớc;

8. Vũ Anh Tuấn (2004), Đánh giá sản phẩm mô hình dự báo số (HRM) trường nhiệt độ mùa Đông ở Bắc bộ Việt Nam, Luận văn thạc sĩ Khoa học, Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội;

Tiếng Anh:

1. Atger, F. (2001), “Verification of intense precipitation forecasts from single models and ensemble prediction systems”, Nonlin. Proc. Geophys., 8, 401-417. 2. Brooks, H.E., M. Kay and J.A. Hart (1998), “Objective limits on forecasting skill of rare events”, 19th Conf. Severe Local Storms, AMS, 552-555. 3. Damrath, U., (2004) “Verification against precipitation observations of a high density network – what did we learn” Intl. Verification Methods Workshop, 15- 17 September 2004, Montreal, Canada. [Available online at

81

http://www.bom.gov.au/bmrc/wefor/staff/eee/verif/Workshop2004/presentations /5.3_Damrath.pdf; 24 November 2006. 4. Elizabeth E. Ebert (2006), “Fuzzy Verification of High Resolution Gridded Forecasts”, Review and Proposed Framework, Bureau of Meteorology Research Centre, Australia; 5. Germann, U. and I. Zawadzki, (2004) “Scale dependence of the predictability of precipitation from continental radar images”, Part II: Probability forecasts. J. Appl. Meteorol., 43, 74-89. 6. Henry R. Stanski, Laurence J. Wilson and William R. Burrows (1990), “Survey of common verification methods in meteorology”, Atmospheric Environment Service Forecast Research Division 4905 Dufferin Street, Downsview, Ontation, Canada M3H 5T4; 7. Murphy, A.H. and R.L. Winkler, 1987, “A general framework for forecast verification”. Mon. Wea. Rev. 115, 1330-1338. 8. Rezacova, D., Z. Sokol and P. Pesice, (2005), “A radar-based verification of precipitation forecast for local convective storms”, Atmos. Res., in press. 9. Roberts, N.M., (2005), “An investigation of the ability of a storm-scale configuration of the Met Office NWP model to predict flood-producing rainfall”, Forecasting Research Tech. Rept. 455, Met Office, 80 pp. 10. Theis, S.E., A. Hense and U. Damrath, (2005), “Probabilistic precipitation forecasts from a deterministic model: a pragmatic approach”, Meteorol. Appl., 12, 257-268. 11. Weygandt, S.S., A.F. Loughe, S.G. Benjamin and J.L. Mahoney, (2004), “Scale sensitivities in model precipitation skill scores during IHOP”, 22nd Conf. Severe Local Storms, Amer. Met. Soc., 4-8 October 2004, Hyannis, MA. 12. Yates, E., S. Anquetin, V. Ducrocq, J.-D. Creutin, D. Ricard and K. Chancibault, (2006), “Point and areal validation of forecast precipitation fields”, Meteorol. Appl., 13, 1-20. 13. Zepeda-Arce, J., E. Foufoula-Georgiou, and K.K. Droegemeier, (2000), “Space-time rainfall organization and its role in validating quantitative precipitation forecasts”, J. Geophys. Res., 105 (D8), 10,129-10,146. 14. Zimmermann, H.-J., (2001), “Fuzzy Set Theory and Its Applications”, Kluwer Dordrecht, 507 pp.

82