
Tuyển tập Hội nghị Khoa học thường niên năm 2024. ISBN: 978-604-82-8175-5
529
LỰA CHỌN HÀM PHÂN BỐ XÁC SUẤT PHÙ HỢP
CHO DÒNG CHẢY NĂM VÀ DÒNG CHẢY LŨ Ở VIỆT NAM
Ngô Lê An
Trường Đại học Thuỷ lợi, email: nlan@tlu.edu.vn
1. GIỚI THIỆU CHUNG
Trong tính toán thuỷ văn thiết kế, các hàm
phân bố xác suất thường được sử dụng để
ước tính các giá trị lưu lượng thiết kế ứng với
một thời kỳ lặp lại nào đó. Theo tiêu chuẩn
13615:2022 về Tính toán các đặc trưng thuỷ
văn có đưa ra một số các dạng hàm phân bố
xác suất thường dùng trong thuỷ văn, và việc
lựa chọn phân bố phù hợp sẽ dựa trên việc vẽ
đường tần suất lý luận hoặc dựa trên chỉ tiêu
kiểm định thống kê.
Hiện nay, các nghiên cứu về lưạ chọn
hàm phân bố xác suất tính toán thuỷ văn thiết
kế đã được thực hiện tại Việt Nam [1], [2]...
Tuy nhiên, các nghiên cứu này chủ yếu tập
trung vào đối tượng mưa cực trị, các nghiên
cứu về phân tích tần suất dòng chảy năm và
dòng chảy lũ tại Việt Nam còn chưa nhiều.
Nhằm giúp cho các nhà tư vấn thiết kế
thuỷ văn có thể lựa chọn nhanh các hàm phân
bố tần suất phù hợp trong tính toán dòng
chảy năm và dòng chảy lũ, nghiên cứu này sẽ
đánh giá một số hàm phân bố tần suất thông
dụng ở Việt Nam dựa trên một số chỉ tiêu
kiểm định và ứng dụng cho một số trạm thuỷ
văn có số liệu tin cậy.
2. PHƯƠNG PHÁP NGHIÊN CỨU
Để đánh giá hàm phân bố xác suất phù
hợp, nghiên cứu sẽ sử dụng ba chỉ tiêu kiểm
định là AIC, BIC và RMSE.
Công thức của 3 chỉ tiêu như sau [3]:
2
2k 2k
AIC 2k 2ln(L) nk1
BIC ln(n)k 2ln(L)
n2
ii
i1 ˆ
(y y )
RMSE n
trong đó: k là số tham số của hàm, n là kích
thước mẫu,
Llà giá trị lớn nhất của hàm hợp
lý đối với phân bố, i
ˆ
ylà giá trị ước tính thứ i
và yi là giá trị đo đạc thứ i. Cả ba chỉ tiêu
này có trị số càng bé thì hàm phân bố càng
phù hợp.
Dữ liệu sử dụng trong nghiên cứu là các
dữ liệu đo dòng chảy trung bình năm (Qn) và
giá trị dòng chảy tức thời lớn nhất năm
(Qmax) tại 12 trạm thuỷ văn phân bố đều ở
Việt Nam. Để đảm bảo chuỗi dữ liệu được
đồng nhất, các số liệu đo dòng chảy chỉ được
thu thập trong giai đoạn không bị ảnh hưởng
bởi các công trình điều tiết trên hệ thống.
Bảy phân bố xác suất được dùng trong
nghiên cứu này là : Gamma, GEV (Generalized
Extreme Value), Gumbel (EVI), Log-Normal,
Log-Pearson Type III, Normal, Pearson Type III.
Với mỗi chuỗi số liệu dòng chảy, từng
hàm phân bố lý thuyết sẽ được khớp với
chuỗi số liệu thực đo sử dụng phương pháp
ước lượng hợp lý tối đa (Maximum
Likelihood Estimation - MLE).
Kết quả tính toán cho mỗi trạm thuỷ văn
theo từng chỉ tiêu sẽ được sử dụng để xếp
hạng. Hàm phân bố nào cho giá trị chỉ tiêu
thấp nhất sẽ được xếp hạng 1, các hàm cho
giá trị chỉ tiêu cao hơn sẽ xếp các hạng sau,
hàm cho giá trị chỉ tiêu cao nhất sẽ xếp hạng
7. Hàm phân bố phù hợp nhất là sẽ hàm có
tổng các thứ hạng thấp nhất đánh giá trên cả
số liệu của 12 trạm thuỷ văn.