
Kết luận thống kê về nhu cầu chăm sóc sức
khỏe ở Hải Dương
Nguyễn Huyền Trang
Trường Đại học Khoa học Tự nhiên; Khoa Toán - Cơ - Tin học
Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 60 46 15
Người hướng dẫn: PGS.TS. Hồ Đăng Phúc
Năm bảo vệ: 2012
Abstract. Trình bày các vấn đề cơ bản về phương pháp phân tích hồi quy logistic và mô
hình hồi quy logistic bội. Giới thiệu phương pháp phân tích thống kê được dùng trong
nghiên cứu này là mô hình nhiều mức cho dữ liệu nhị phân, đặc biệt là mô hình hồi quy
logistic nhiều mức. Đưa ra các kết quả phân tích ảnh hưởng của các yếu tố kinh tế - xã
hội đến nhu cầu khám chữa bệnh tại nhà của hai nhóm đối tượng người trong độ tuổi lao
động và trẻ em dưới 16 tuổi và một số ý kiến về xây dựng và phát triển mô hình y tế gia
đình nhằm nâng cao chất lượng y tế cộng đồng.
Keywords. Lý thuyết xác suất; Thống kê Toán học; Chăm sóc sức khỏe; Hải Dương
Content.
LỜI NÓI ĐẦU
Thống kê toán học là công cụ nghiên cứu được sử dụng rộng rãi trong hầu
hết các ngành khoa học thực nghiệm nhất là trong y học, sinh học, xã hội học, kinh
tế và môi trường…Thống kê toán học giúp cho các ngành khoa học khám phá ra từ
các số liệu thực nghiệm các quy luật nội tại của các hiện tượng trong tự nhiên và
trong xã hội.
Các nghiên cứu về y tế cộng đồng cũng đòi hỏi sử dụng các công cụ của
thống kê toán học để giải đáp các câu hỏi liên quan đến hệ thống chăm sóc sức
khỏe toàn dân, đưa ra các bằng chứng giúp xây dựng các chủ trương, chính sách
liên quan đến mạng lưới cung cấp các dịch vụ chăm sóc sức khỏe, nâng cao hiệu
quả phục vụ của hệ thống y tế.
Nghiên cứu này có mục đích đánh giá các yếu tố ảnh hưởng đến nhu cầu
khám chữa bệnh tại nhà đối với hai nhóm đối tượng người trong độ tuổi lao động

và trẻ em dưới 16 tuổi, thông qua việc áp dụng mô hình hồi quy logistic nhiều mức
– phương pháp thống kê hiện đại đang được sử dụng rộng rãi trong nghiên cứu ở
nhiều nước trên thế giới và bước đầu được sử dụng tại Việt Nam.
Luận văn “ Kết luận thống kê về tình hình chăm sóc sức khỏe ở Hải Dương”
bao gồm 3 chương và danh mục tài liệu tham khảo.
Chương 1 trình bày các vấn đề cơ bản về phương pháp phân tích hồi quy
logistic và mô hình hồi quy logistic bội.
Chương 2 giới thiệu phương pháp phân tích thống kê được dùng trong
nghiên cứu này là mô hình nhiều mức cho dữ liệu nhị phân, đặc biệt là mô hình hồi
quy logistic nhiều mức.
Dựa trên cơ sở lý thuyết của hai chương đầu, Chương 3 đưa ra các kết quả
phân tích ảnh hưởng của các yếu tố kinh tế - xã hội đến nhu cầu khám chữa bệnh
tại nhà của hai nhóm đối tượng người trong độ tuổi lao động và trẻ em dưới 16
tuổi. Phần cuối của chương 3 đưa ra một số ý kiến về xây dựng và phát triển mô
hình y tế gia đình nhằm nâng cao chất lượng y tế cộng đồng.
Chương 1. Phương pháp phân tích hồi quy logistic
Trong nghiên cứu y khoa và khoa học thực nghiệm nói chung thường có nhu
cầu phân tích mối quan hệ giữa một (hay nhiều ) yếu tố nguy cơ và khả năng xảy
ra một sự cố(biến cố) nào đó. Trong các nghiên cứu này đối tượng phân tích
thường được thể hiện qua các biến số nhị phân, tức là có/ không, mắc bệnh/ không
mắc bệnh, chết/ sống, ….Yếu tố nguy cơ có thể là các biến số liên tục, các biến nhị
phân hay các biến mang đặc tính thứ bậc.
Vấn đề đặt ra cho các nghiên cứu dạng này là làm cách nào để ước tính mức
độ liên quan giữa yếu tố nguy cơ và khả năng xảy ra sự cố. Các phương pháp phân
tích như mô hình hồi quy tuyến tính không thể áp dụng được bởi vì biến phụ thuộc
không phải là biến liên tục mà là biến nhị phân. Phương pháp phổ biến nhất sử
dụng để phân tích các dữ liệu với các biến phản ứng lưỡng phân là hồi quy
Logistic.

1. Số chênh và tỷ số chênh
Số chênh của một số sự kiện xảy ra được định nghĩa là tỉ số của số lần xảy ra
sự kiện và số lần không xảy ra sự kiện.
Tỷ số chênh là tỷ số của hai số chênh. Tỷ số này gần 1 thì hai nhóm không
có sự khác biệt. Ngược lại tỷ số chênh này càng xa 1 thì càng thể hiện sự khác biệt
giữa hai nhóm.
2. Hồi quy Logistic
Phân tích hồi quy nghiên cứu mối quan hệ phụ thuộc của một biến (gọi là
biến phụ thuộc hoặc biến được giải thích) với một hay nhiều biến khác (được gọi
là biến độc lập hay biến giải thích). Chúng ta sử dụng các ký hiệu sau:
•
Y
là biến phụ thuộc (hay biến được giải thích);
•
i
X
là biến độc lập (hay biến giải thích thứ i).
Một trong nhiều vấn đề mà phân tích hồi quy giải quyết là ước lượng giá trị
trung bình của biến phụ thuộc ứng với giá trị đã cho của biến độc lập
i
E Y X
.
Nói chung,
i
E Y X
là một hàm của
i
X
sao cho:
i
E Y X
=
i
fX
i
fX
được gọi là hàm hồi quy tổng quát.
Hồi quy logistic là hồi quy phi tuyến trong đó biến độc lập là định tính
hoặc định lượng, biến phụ thuộc là nhị phân.
Vấn đề được đặt ra là: “Trong trường hợp biến phụ thuộc
Y
là nhị phân thì
hàm hồi quy
x
phải có dạng như thế nào?”.
Định nghĩa . Hàm hồi quy logistic đơn của hai biến X và Y có dạng
01
01
1
X
X
e
E Y X e
(2.1)
Trong đó,
•
0
là hệ số tự do (hay hệ số chặn),

•
1
là hệ số dốc,
• X là biến độc lập, Y là biến phụ thuộc.
Định nghĩa . Phép biến đổi sau được gọi là phép biến đổi logit:
ln 1
x
gx x
(2.12)
Nhận xét:
+
01
g x x
là hàm tuyến tính của
x
với
,x
+
01x
với mọi giá trị của
x
+ Giả sử giá trị quan sát y của biến phụ thuộc
Y
có dạng
yx
, trong đó
gọi là sai số (hiệu giá trị quan sát và kì vọng có điều kiện của biến phụ thuộc).
Khi đó
nhận hai giá trị sau:
Nếu
1y
thì
1x
với xác suất
x
,
Nếu y = 0 thì
x
với xác suất
1x
.
Từ đó,
có phân phối nhị thức với
0E
và
ar ar . 1V V Y x x
3. Mô hình hồi quy Logistic
Xét biến phụ thuộc là biến nhị phân
Y
và
k
biến độc lập
12
, ,..., k
X X X
.
Muốn dự đoán tần suất xuất hiện giá trị 1 của biến
Y
theo các biến độc lập, có thể
lập phương trình hồi quy:
Tần suất = a1X1 + a2X2 +…+ akXk + b.
Hạn chế của mô hình trên: tần suất ở vế trái chỉ nhận các giá trị lớn hơn 0
nhỏ hơn 1 trong khi vế phải có thể nhận giá trị âm dương bất kì.
1 1 2 2
log ...
1kk
pa X a X a X b
p
3.1. Ước lượng các tham số của mô hình hồi quy logistic
Việc ước lượng các tham số của mô hình bằng phương pháp hợp lý cực đại
được thực hiện theo quy trình như sau:

a. Theo (1.1) ta có
1P Y x x
, do đó có
01P Y x x
. Như
vậy
Y
nhận giá trị 1 với xác suất bằng
i
x
và nhận giá trị 0 với xác suất bằng
1i
x
,
1,...,in
.
Với mỗi cặp
,
ii
xy
,
1,...,in
, đặt
b. Với mẫu n quan sát độc lập ,i =1,…,n ta thành lập hàm hợp lý có
dạng (2.13)
Lấy logarit hàm hợp lý (2.13) ta nhận được hàm số có dạng
(2.14)
c. Lấy đạo hàm của hàm L(β ) theo và ta có hệ phương trình hợp lý:
(2.15)
d. Giải hệ (2.15) ta có nghiệm của hệ phương trình hợp lý là ước lượng hợp
lý cực đại của các tham số . Ta ký hiệu là ước lượng hợp lý cực đại
của β.
3.2. Kiểm định sự phù hợp của mô hình hồi quy logistic
3.2.1. Kiểm định tỷ số hàm hợp lý
Định nghĩa. Độ lệch của mô hình hồi quy logistic, ký hiệu là D, có dạng
(2.16)
Định nghĩa. Hiệu độ lệch của hai mô hình không có biến độc lập và có biến độc
lập được gọi là tiêu chuẩn tỷ lệ hợp lý, ký hiệu là G:
G =D (mô hình không có biến độc lập) – D (mô hình có biến độc lập).
Ta kiểm tra sự phù hợp của mô hình hồi quy logistic đơn bằng các kiểm định
giả thuyết H: .
Định lý. Khi giả thuyết β1 = 0 đúng thì tiêu chuẩn thống kê G có phân phối
tiệm cận phân phối χ 2 với bậc tự do bằng 1.

