VIỆN HÀM LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN TOÁN HỌC
NGUYỄN THANH NGA
MỘT SỐ PHƯƠNG PHÁP
ƯỚC LƯỢNG TUỔI THỌ TRUNG BÌNH
LUẬN ÁN TIẾN TOÁN HỌC
Nội - 2024
VIỆN HÀM LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
VIỆN TOÁN HỌC
NGUYỄN THANH NGA
MỘT SỐ PHƯƠNG PHÁP
ƯỚC LƯỢNG TUỔI THỌ TRUNG BÌNH
Chuyên ngành: thuyết Xác suất và Thống kê Toán học
số: 9 46 01 06
LUẬN ÁN TIẾN TOÁN HỌC
Người hướng dẫn: PGS.TS HỒ ĐĂNG PHÚC
Nội - 2024
Tóm tắt
Luận án y được dành để nghiên cứu v một số phương pháp ước lượng tuổi
thọ trung bình. Luận án gồm 3 chương chính.
Trong Chương 1, chúng tôi nhắc lại các kiến thức chuẩn bị gồm: một số kiến
thức trong thuyết xác suất, thuyết phân tích sống sót (mô hình phân tích
sống sót, ước lượng Kaplan-Meier). Bên cạnh đó, chúng tôi cũng trình y v hai
phương pháp ước lượng tuổi thọ trung bình (phương pháp Chiang, phương pháp
Silcocks) hiện đang được sử dụng rộng rãi và một số vấn đề tồn tại của hai phương
pháp y. Ngoài ra, chúng tôi cũng giới thiệu v phương pháp Bootstrap - một
phương pháp thống kê hiện đại đơn giản và tính ứng dụng cao. Cuối cùng,
chúng tôi giới thiệu v b số liệu thực tế FilaBavi.
Trong Chương 2, chúng tôi đề xuất hai phương pháp mới cho ước lượng tuổi thọ
trung bình. Phương pháp thứ nhất (được đặt tên phương pháp Kaplan-Meier)
được y dựng dựa trên ước lượng Kaplan-Meier cho hàm sống sót và áp dụng cho
dữ liệu bán thuần tập (trích xuất thông tin từ dữ liệu được ghi đầy đủ ngày sinh
và ngày mất của tất cả các quan sát trong một khoảng thời gian nhất định) nhằm
đem lại một kết quả khá chính xác cho ước lượng tuổi thọ trung bình. Phương
pháp thứ hai (được đặt tên phương pháp tham số hóa địa phương) được y
dựng dựa trên hình tham số hóa địa phương quá trình sống sót theo phân phối
Weibull và áp dụng cho dữ liệu thu gon (chỉ chứa một cặp số người chết và số người
trong mỗi khoảng tuổi - kiểu dữ liệu thường được sử dụng trong ước lượng tuổi
thọ trung bình). Với phương pháp y chúng tôi đã xây dựng được công thức ước
lượng tuổi thọ trung bình, công thức tính phương sai của ước lượng, chứng minh
ước lượng phân phối tiệm cận chuẩn để từ đó đưa ra công thức cho khoảng tin
cậy cho tuổi thọ trung bình.
Trong Chương 3, chúng tôi trình y các kết quả áp dụng các phương pháp
(phương pháp Kaplan-Meier, phương pháp tham số hóa địa phương, phương pháp
Chiang, phương pháp Silcocks) trên b dữ liệu thực tế FilaBavi. Các kết quả tính
toán cho thấy, phương pháp tham số hóa địa phương ước lượng tuổi thọ trung
bình chính xác và hiệu quả hơn so với phương pháp Chiang, phương pháp Silcocks.
ii
Abstract
This thesis is devoted to studying some methods for estimating life expectancy.
The thesis consists of 3 chapters.
In Chapter 1, we review the preparatory knowledge including some knowledge in
probability theory, and survival analysis theory (survival analysis model, Kaplan-
Meier estimation). In addition, we present two methods of estimating average life
expectancy (Chiang method, Silcocks method) that are currently widely used, as
well as some existing problems with these two methods. Besides, we introduce
the Bootstrap method, which is a simple and highly applicable modern statistical
method. Finally, we introduce the FilaBavi data set.
In Chapter 2, we propose two new methods for estimating life expectancy. The
first method (named the Kaplan-Meier method) is built based on the Kaplan-
Meier estimate for the survival function. It is applied to the semi-cohort dataset,
extracting complete information from data fully recorded birth date and death
date of all death individuals, providing the most accurate estimation of life ex-
pectancy. Therefore, that method can be adopted as a "standard" in the accuracy
investigation of other life expectancy estimations. The second method, called the
local parametric method, is tailored according to the theoretical background of the
survival process with local parametric Weibull distributions and can be applied to
abridged datasets containing only a pair of number of deaths and persons in each
age group. With this method, we have built a formula to estimate the average
life expectancy and variance of the estimate, proving that the estimate has an
approximately normal distribution to then provide a formula for the confidence
interval of the life expectancy.
In Chapter 3, we present the results of applying the methods (Kaplan-Meier
method, local parametric method, Chiang method, Silcocks method) on the real
FilaBavi data set. The calculation results show that the local parameter method
provides a more accurate and higher effective life expectancy estimation than the
Chiang and Silcocks methods.
iii
Lời cam đoan
Tôi xin cam đoan luận án y công trình nghiên cứu của tôi, dưới sự hướng dẫn
của PGS.TS Hồ Đăng Phúc. Những kết quả được trích từ các bài báo được viết
chung đã nhận được sự cho phép sử dụng của các đồng tác giả khi đưa vào luận
án. Các kết quả nêu trong luận án trung thực và chưa từng được một ai khác
công bố.
Tác giả
Nguyễn Thanh Nga
iv