VIỆN HÀM LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN TOÁN HỌC
NGUYỄN THANH NGA
MỘT SỐ PHƯƠNG PHÁP
ƯỚC LƯỢNG TUỔI THỌ TRUNG BÌNH
Chuyên ngành: thuyết Xác suất và Thống kê Toán học
số: 9 46 01 06
TÓM TT LUẬN ÁN TIẾN TOÁN HỌC
Nội - 2024
Luận án được hoàn thành tại:
Viện Toán học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Người hướng dẫn khoa học:
PGS.TS. HỒ ĐĂNG PHÚC
Phản biện 1: ..........................................
Phản biện 2: ..........................................
Phản biện 3: ..........................................
Luận án sẽ được bảo v trước hội đồng chấm Luận án cấp Viện họp tại Viện Toán
học - Viện Hàn lâm Khoa học và Công nghệ Việt Nam vào hồi ..........giờ.......
ngày........tháng.........năm ......
thể tìm luận án tại:
- Thư viện Quốc gia nội
- Thư viện Viện Toán học
Mở đầu
Tuổi thọ trung bình, cách gọi thông thường thường của vọng sống (life ex-
pectancy), thường được hiểu thời gian sống trung bình của con người. Tuổi thọ
trung bình đã được William Farr sử dụng để đánh giá sức khỏe của người dân và
dùng để so sánh v sức khỏe giữa các quốc gia (xem Eyler [1979]). Ngày nay, tuổi
thọ trung bình cũng được các nhà nghiên cứu lựa chọn một chỉ số để đánh giá
sự mất cần bằng trong địa và nhân khẩu hội v t lệ tử vong (xem Griffiths
and Fitzpatrick [2001]).
nhiều phương pháp khác nhau được y dựng nhằm ước lượng tuổi thọ
trung bình, trong đó phương pháp y dựng bảng sống nhằm ghi lại t lệ sống
sót mỗi độ tuổi thường được các nhà nhân khẩu học sử dụng. Một số phương
pháp đã được các nhà thống kê đánh giá cao v nền tảng thuyết cũng như tính
ứng dụng, trong đó nổi bật phương pháp Chiang (xem Chiang [1972], Chiang
[1984]) và phương pháp Silcocks (xem Silcocks et al. [2001]). Phương pháp Chiang
sử dụng bảng sống hiện tại dạng rút gọn để tổng hợp dữ liệu v số người chết và
dân số theo các khoảng tuổi dưới 1, 1–4, 5–9 ... 80–84, 85 tuổi trở lên. Dữ liệu tổng
hợp v số ca tử vong và dân số các nhóm tuổi giúp tính toán tỉ suất tử vong đặc
trưng theo khoảng tuổi và từ đó được sử dụng để ước tính xác suất tử vong mỗi
khoảng tuổi. Những xác suất y sau đó được áp dụng trên một quần thể giả định
gồm tập hợp các trẻ em lúc mới sinh, để tạo ra công thức ước tính tuổi thọ trung
bình. Tuy nhiên nhiều nghiên cứu đã chỉ ra một số vấn đề tồn tại trong phương
y. Cụ thể, một số nghiên cứu như Pollard [1989], Hsieh [1991], Wilmoth et al.
[2007] đã chỉ ra kết quả ước lượng vọng sống theo phương pháp Chiang bị sai
lệch do ảnh hưởng bởi ước lượng tỉ suất chết trên mỗi khoảng tuổi Mivà xác suất
chết trên mỗi khoảng tuổi qi(xem Golbeck [1986], Meulen [2012], Pollard [1989]).
Bên cạnh đó, phương pháp Chiang không y dựng được công thức để tính toán
tỉ phần sống sót trung bình trên mỗi khoảng tuổi (kí hiệu ai), và với việc coi
ai= 0.5sẽ dẫn đến hàm sống sót trên mỗi khoảng tuổi sẽ dạng tuyến tính
(là một đường thẳng), điều y được coi không phù hợp đối với những khoảng
tuổi độ dài 5 năm (xem Schoen [1978]). Một hạn chế khác trong phương pháp
1
Chiang đã được nhiều nghiên cứu đề cập đến đó khi quần thể dân số kích
thước giảm dần thì sai số chuẩn của các ước lượng tuổi thọ trung bình sẽ tăng lên
(xem Eayres and Williams [2004], Toson and Baker [2003]). Ngoài ra, trong trường
hợp khoảng tuổi không sự kiện chết xảy ra cũng sẽ y khó khăn cho việc tính
toán phương sai của ước lượng tuổi thọ trung bình theo phương pháp Chiang.
Luận án y đề cập đến việc y dựng phương pháp mới cho ước lượng tuổi
thọ trung bình và thể khắc phục được một số vấn đề của phương pháp Chiang.
Luận án gồm 3 chương chính.
Chương 1 nhắc lại một số kiến thức bản liên quan đến thuyết xác suất,
thuyết phân tích sống sót và một số phương pháp ước lượng tuổi thọ trung bình,
phương pháp Bootstrap, giới thiệu b số liệu FilaBavi.
Trong Chương 2, chúng tôi đề xuất hai phương pháp mới cho ước lượng tuổi
thọ trung bình. Trong đó, phương pháp thứ nhất (được đặt tên phương pháp
Kaplan-Meier) y dựng dựa trên ước lượng Kaplan-Meier cho hàm sống sót và
áp dụng cho dữ liệu bán thuần tập (trích xuất thông tin đầy đủ từ dữ liệu được
ghi đầy đủ ngày sinh và ngày mất của tất cả các quan sát trong một khoảng thời
gian nhất định) nhằm đem lại một kết quả khá chính xác cho ước lượng tuổi thọ
trung bình. Phương pháp thứ hai (được đặt tên phương pháp tham số hóa địa
phương) y dựng dựa trên hình tham số hóa địa phương quá trình sống sót
theo phân phối Weibull và áp dụng cho dữ liệu thu gon (chỉ chứa một cặp số người
chết và số người trong mỗi khoảng tuổi - kiểu dữ liệu thường sử dụng trong ước
lượng tuổi thọ trung bình). Với phương pháp y chúng tôi đã xây dựng được
công thức ước tính tuổi thọ trung bình, phương sai của ước lượng, chứng minh
ước lượng phân phối tiệm cận chuẩn để từ đó đưa ra công thức cho khoảng tin
cậy của tuổi thọ trung bình.
Trong Chương 3, chúng tôi trình y các kết quả áp dụng các phương pháp
(phương pháp Kaplan-Meier, phương pháp tham số hóa địa phương, phương pháp
Chiang, phương pháp Silcocks) trên b dữ liệu thực tế FilaBavi. Các kết quả tính
toán cho thấy, phương pháp tham số hóa địa phương đem lại các ước lượng tuổi
thọ trung bình chính xác và hiệu quả hơn so với phương pháp Chiang, phương
pháp Silcocks.
2
Chương 1
Một số kiến thức chuẩn bị
Trong chương này, chúng tôi nhắc lại một số khái niệm và kết quả liên quan
đến thuyết phân tích sống sót và tuổi thọ trung bình.
1.1 Một số kiến thức v thuyết xác suất
Trong phần y, chúng tôi trình y các khái niệm v hội tụ của y biến ngẫu
nhiền và một số kết quả liên quan đến Định giới hạn trung tâm và Định
Slutsky (xem Jacod and Protter [2004]).
1.2 hình phân tích sống sót
Trong phần y chúng tôi giới thiệu lược v hình phân tích sống sót (hàm
sống sót, hàm tỉ suất rủi ro, hàm rủi ro tích lũy), một số phân phối thông dụng
trong thuyết phân tích sống sót (như phân phối mũ, phân phối Weibull,..) và
dữ liệu mất theo dõi.
1.3 Ước lượng Kaplan - Meier
Trong phần y, chúng tôi trình y về ước lượng Kaplan-Meier cho hàm sống
sót và các tính chất, và một số ước lượng khác cho hàm rủi ro tích lũy.
1.4 Kiểm định so sánh hàm sống sót giữa các nhóm
Trong phần y, chúng tôi trình bày v các kiểm định so sánh hàm sống sót
giữa hai hoặc nhiều nhóm.
3