Tuyn tp Hi ngh Khoa hc thường niên năm 2024. ISBN: 978-604-82-8175-5
529
LỰA CHỌN HÀM PHÂN BỐ XÁC SUẤT PHÙ HỢP
CHO DÒNG CHẢY NĂM VÀ DÒNG CHẢY LŨ Ở VIỆT NAM
Ngô Lê An
Trường Đại hc Thu li, email: nlan@tlu.edu.vn
1. GIỚI THIỆU CHUNG
Trong tính toán thuỷ văn thiết kế, các hàm
phân bố xác suất thường được sử dụng để
ước tính các giá trị lưu lượng thiết kế ứng với
một thời kỳ lặp lại nào đó. Theo tiêu chuẩn
13615:2022 về Tính toán các đặc trưng thuỷ
văn đưa ra một số các dạng hàm phân bố
xác suất thường dùng trong thuỷ văn, và việc
lựa chọn phân bố phù hợp sẽ dựa trên việc vẽ
đường tần suất luận hoặc dựa trên chỉ tiêu
kiểm định thống kê.
Hiện nay, các nghiên cứu về lưạ chọn
hàm phân bố xác suất tính toán thuỷ văn thiết
kế đã được thực hiện tại Việt Nam [1], [2]...
Tuy nhiên, các nghiên cứu này chủ yếu tập
trung vào đối tượng mưa cực trị, các nghiên
cứu về phân tích tần suất dòng chảy năm
dòng chảy lũ tại Việt Nam còn chưa nhiều.
Nhằm giúp cho các nhà vấn thiết kế
thuỷ văn có thể lựa chọn nhanh các hàm phân
bố tần suất phù hợp trong tính toán dòng
chảy năm và dòng chảy lũ, nghiên cứu y sẽ
đánh giá một số hàm phân bố tần suất thông
dụng Việt Nam dựa trên một số chỉ tiêu
kiểm định và ứng dụng cho một số trạm thuỷ
văn có số liệu tin cậy.
2. PHƯƠNG PHÁP NGHIÊN CỨU
Để đánh giá hàm phân bố xác suất phù
hợp, nghiên cứu sẽ sử dụng ba chỉ tiêu kiểm
định là AIC, BIC và RMSE.
Công thức của 3 chỉ tiêu như sau [3]:
2
2k 2k
AIC 2k 2ln(L) nk1
BIC ln(n)k 2ln(L)



n2
ii
i1 ˆ
(y y )
RMSE n
trong đó: k số tham số của hàm, n kích
thước mẫu,
L g tr lớn nhất củam hợp
lý đối với phân bố, i
ˆ
y g trị ưc tính thứ i
yi giá trị đo đạc thứ i. Cả ba chỉ tiêu
này trị số càng thì hàm phân bố càng
phù hợp.
Dữ liệu sử dụng trong nghiên cứu các
dữ liệu đo dòng chảy trung bình năm (Qn)
giá trị dòng chảy tức thời lớn nhất năm
(Qmax) tại 12 trạm thuỷ văn phân bố đều
Việt Nam. Để đảm bảo chuỗi dữ liệu được
đồng nhất, các số liệu đo dòng chảy chỉ được
thu thập trong giai đoạn không bị ảnh hưởng
bởi các công trình điều tiết trên hệ thống.
Bảy phân bố xác suất được dùng trong
nghiên cứu này là : Gamma, GEV (Generalized
Extreme Value), Gumbel (EVI), Log-Normal,
Log-Pearson Type III, Normal, Pearson Type III.
Với mỗi chuỗi số liệu dòng chảy, từng
hàm phân bố thuyết sẽ được khớp với
chuỗi số liệu thực đo sử dụng phương pháp
ước lượng hợp tối đa (Maximum
Likelihood Estimation - MLE).
Kết quả tính toán cho mỗi trạm thuỷ văn
theo từng chỉ tiêu sẽ được sử dụng để xếp
hạng. Hàm phân bố nào cho giá trị chỉ tiêu
thấp nhất sẽ được xếp hạng 1, các hàm cho
giá trị chỉ tiêu cao hơn sẽ xếp các hạng sau,
hàm cho giá trị chỉ tiêu cao nhất sẽ xếp hạng
7. Hàm phân bố phù hợp nhất sẽ hàm
tổng các thứ hạng thấp nhất đánh giá trên cả
số liệu của 12 trạm thuỷ văn.
Tuyn tp Hi ngh Khoa hc thường niên năm 2024. ISBN: 978-604-82-8175-5
530
3. KẾT QUẢ NGHIÊN CỨU
Dữ liệu dòng chảy năm dòng chảy
lớn nhất từng năm được thu thập tại 12 trạm
Lạng Sơn (1958-2013), An Hoà (1982-2000),
Bình Liêu (1962-2000), Dừa (1959-2000),
Thành Mỹ (1977-2010), Nông Sơn (1977-
2010), An Chỉ (1981-2017), Sơn Giang
(1979-2014), Tà Pao (1976-2007), Bản Yên
(1976-2013), Krong Buk (1977-2010), Lâm
Sơn (1970-2020). Các chuỗi dữ liệu nhìn
chung đảm bảo yêu cầu do được lấy trong
giai đoạn không bị tác động bởi các công
trình điều tiết nước.
Kết quả tính toán cho từng chỉ tiêu tại từng
trạm cũng như thứ hạng như sau:
* Dòng chảy năm Qn:
+ Theo chỉ tiêu AIC:
Xếp hạng
Lạng Sơn
An Hoà
Bình Liêu
Dừa
Thành Mỹ
Nông Sơn
An Chỉ
Sơn Giang
Tà Pao
Bản Yên
Krong Buk
Lâm Sơn
1 1 4 4 1 3 3 3 4 6 3 1 1
2 3 3 3 6 4 4 1 3 5 4 6 3
3 2 1 1 5 1 1 4 1 2 7 3 4
4 7 7 7 4 7 2 2 2 1 1 2 5
5 5 5 5 2 5 5 7 5 7 5 5 7
6 6 2 2 7 2 7 5 7 4 2 7 2
7 4 6 6 3 6 6 6 6 3 6 4 6
+ Theo chỉ tiêu BIC:
Xếp hạng
Lạng Sơn
An Hoà
Bình Liêu
Dừa
Thành Mỹ
Nông Sơn
An Chỉ
Sơn Giang
Tà Pao
Bản Yên
Krong Buk
Lâm Sơn
1 1 4 4 1 3 3 3 4 6 3 1 1
2 3 3 3 6 4 4 1 3 5 4 6 3
3 6 1 1 4 1 1 4 1 1 1 3 4
4 4 7 7 3 7 2 2 2 2 7 4 5
5 2 5 5 5 5 5 7 5 7 5 2 7
6 7 2 2 2 2 7 5 7 4 2 5 2
7 5 6 6 7 6 6 6 6 3 6 7 6
+ Theo chỉ tiêu RMSE:
Xếp hạng
Lạng Sơn
An Hoà
Bình Liêu
Dừa
Thành Mỹ
Nông Sơn
An Chỉ
Sơn Giang
Tà Pao
Bản Yên
Krong Buk
Lâm Sơn
1 3 5 3 5 7 5 4 3 7 7 1 3
2 1 7 7 7 5 3 3 4 2 5 7 7
3 2 2 4 2 2 2 2 5 6 2 4 1
4 7 4 5 6 4 4 1 2 5 3 5 4
5 5 1 2 1 1 7 5 7 1 4 2 5
6 4 3 1 4 3 1 7 1 4 1 3 2
7 6 6 6 3 6 6 6 6 3 6 6 6
* Dòng chảy lũ Qmax:
+ Theo chỉ tiêu AIC:
Xếp hạng
Lạng Sơn
An Hoà
Bình Liêu
Dừa
Thành Mỹ
Nông Sơn
An Chỉ
Sơn Giang
Tà Pao
Bản Yên
Krong Buk
Lâm Sơn
1 1 1 1 4 7 4 6 1 7 2 4 7
2 3 7 3 1 1 1 3 4 3 5 7 4
3 7 5 4 3 4 3 1 3 4 4 5 1
4 5 3 7 7 3 7 2 7 5 7 2 5
5 4 4 5 5 5 6 7 5 2 3 3 2
6 2 2 2 2 6 5 5 2 1 1 1 3
7 6 6 6 6 2 2 4 6 6 6 6 6
+ Theo chỉ tiêu BIC:
Xếp hạng
Lạng Sơn
An Hoà
Bình Liêu
Dừa
Thành Mỹ
Nông Sơn
An Chỉ
Sơn Giang
Tà Pao
Bản Yên
Krong Buk
Lâm Sơn
1 1 1 1 4 7 4 6 1 3 4 4 4
2 3 7 3 1 1 1 3 4 4 2 7 7
3 4 3 4 3 4 3 1 3 7 5 3 1
4 7 5 7 7 3 7 2 7 1 7 5 5
5 5 4 5 5 5 6 7 5 5 3 2 2
6 2 2 2 2 6 5 5 2 2 1 1 3
7 6 6 6 6 2 2 4 6 6 6 6 6
Tuyn tp Hi ngh Khoa hc thường niên năm 2024. ISBN: 978-604-82-8175-5
531
+ Theo chỉ tiêu RMSE:
Xếp hạng
Lạng Sơn
An Hoà
Bình Liêu
Dừa
Thành Mỹ
Nông Sơn
An Chỉ
Sơn Giang
Tà Pao
Bản Yên
Krong Buk
Lâm Sơn
1 2 7 4 4 5 4 7 4 7 2 2 7
2 7 1 7 2 1 5 2 7 5 5 5 4
3 1 2 2 7 2 1 5 2 2 7 7 5
4 5 5 5 5 3 3 6 5 4 4 4 1
5 3 4 3 1 4 2 3 1 3 1 1 2
6 4 3 1 3 6 7 1 3 1 3 3 3
7 6 6 6 6 7 6 4 6 6 6 6 6
Kí hiệu của từng hàm phân bố là:
Hàm phân bố Kí hiệu
Gamma 1
Generalized Extreme Value 2
Gumbel (EVI) 3
Log-Normal 4
Log-Pearson Type III 5
Normal 6
Pearson Type III 7
Tng hp các th hng theo tng ch tiêu
như sau:
* Dòng chảy năm:
Hàm phân bố AIC BIC RMSE
Gamma 29 27 54
Generalized Extreme Value 57 62 43
Gumbel (EVI) 31 28 44
Log-Normal 39 32 48
Log-Pearson Type III 55 60 37
Normal 67 64 77
Pearson Type III 58 63 33
* Dòng chảy lũ:
Hàm phân bố AIC BIC RMSE
Gamma 34 32 52
Generalized Extreme Value 63 66 32
Gumbel (EVI) 41 37 64
Log-Normal 36 30 41
Log-Pearson Type III 52 57 35
Normal 75 75 80
Pearson Type III 35 39 32
Dựa trên kết quả tính toán tổng hợp, có thể
thấy các hàm phân bố xác suất tổng thứ
hạng thấp nhất ứng với từng chỉ tiêu sẽ là các
hàm số phù hợp nhất. thể thấy, các hàm
Gamma, Gumbel nhìn chung tổng thứ
hạng thấp nhất cho việc phân tích chuỗi dữ
liệu dòng chảy năm. Trong khi, các hàm
Gamma, Log-Normal, Pearson type III
phù hợp với dòng chảy lũ.
4. KẾT LUẬN
Nghiên cứu này đã đánh giá 07 hàm phân
bố xác suất thông dụng Việt Nam cho
chuỗi dòng chảy năm dòng chảy lớn nhất
của 12 trạm đo thuỷ văn.
Kết quả nghiên cứu cho thấy, đối với dòng
chảy năm, hàm Gamma Gumbel phù hợp
nht theo ch tiêu AIC, BIC trong khi hàm
Log-Pearson type III phù hợp nhất theo chỉ
tiêu RMSE. Đối với dòng chảy lũ, hàm
Gamma Pearson type III phù hợp nhất
theo chỉ tiêu AIC, hàm Gamma Log-
Normal theo ch tiêu BIC, hàm GEV và
Pearson type III theo chỉ tiêu RMSE.
Dựa trên kết quả nghiên cứu tại 12 trạm
thuỷ văn này, tác giả cho rằng, có thể sử dụng
hàm Gamma Gumbel cho phân tích dòng
chảy năm hàm Gamma, Pearson type III
cho phân tích dòng chảy lũ.
Để nâng cao độ tin cậy, nghiên cứu này
cần phải thực hiện trên nhiều trạm đo thuỷ
văn khác.
5. TÀI LIỆU THAM KHẢO
[1] Nguyễn Trường Huy, Nguyễn Hoàng Lâm,
Võ Ngọc Dương, Phạm Thành ng, Nguyễn
Chí Công, ‘Chọn hàm phân phối xác suất đại
diện cho phân phối mưa 1 ngày max Việt
Nam’, Tạp chí Khoa học kỹ thuật Thủy lợi
Môi trường, vol. 56, pp. 72-79, Mar. 2017.
[2] Nguyn Th Thu Hà, Ngô Lê An, Hoàng
Thanh Tùng, “Lựa chọn hàm phân phối c
suất trong phân tích tần suất lượng mưa lớn
nhất thời đoạn”, Hội nghị Thường niên Đại
học Thủy lợi, Nov. 2019, pp. 730-732.
[3] P. Stoica and Y. Selen, Model-order selection:
a review of information criterion rules”, IEEE
Signal Process Mag, vol. 21, no. 4, pp. 36-47,
Jul. 2004, doi: 10.1109/MSP.2004.1311138.