Kết lun thống kê về nhu cầu chăm sóc sức
khe Hải Dương
Nguyn Huyn Trang
Trường Đại hc Khoa hc T nhiên; Khoa Toán - - Tin hc
Chuyên ngành: Lý thuyết xác suất và thống kê toán học
Mã số: 60 46 15
Người hướng dn: PGS.TS. H Đăng Phúc
Năm bảo v: 2012
Abstract. Trình bày các vấn đề bản v phương pháp phân tích hồi quy logistic
hình hi quy logistic bi. Gii thiệu phương pháp phân ch thống được dùng trong
nghiên cứu này hình nhiu mc cho d liu nh phân, đặc biệt hình hồi quy
logistic nhiu mức. Đưa ra các kết qu phân tích ảnh hưởng của các yếu t kinh tế - xã
hội đến nhu cầu khám chữa bnh tại nhà của hai nhóm đối tượng người trong độ tui lao
động tr em dưới 16 tuổi mt s ý kiến v y dựng phát triển hình y tế gia
đình nhằm nâng cao chất lượng y tế cộng đồng.
Keywords. Lý thuyết xác suất; Thống kê Toán học; Chăm sóc sức khe; Hải Dương
Content.
LỜI NÓI ĐẦU
Thống kê toán học công cụ nghiên cứu được s dng rộng rãi trong hầu
hết các ngành khoa học thc nghim nhất là trong y hc, sinh học, xã hội hc, kinh
tế và môi trường…Thống kê toán học giúp cho các ngành khoa học khám phá ra từ
các số liu thc nghiệm các quy lut ni ti của các hiện tượng trong t nhiên
trong xã hội.
Các nghiên cu v y tế cộng đồng cũng đòi hỏi s dụng các công cụ ca
thống kê toán học để giải đáp các câu hỏi liên quan đến h thống chăm sóc sức
khỏe toàn dân, đưa ra các bằng chứng giúp xây dựng các chủ trương, chính sách
liên quan đến mạng lưới cung cấp các dịch v chăm sóc sức khỏe, nâng cao hiệu
qu phc v ca h thng y tế.
Nghiên cứu này mục đích đánh giá các yếu t ảnh ởng đến nhu cu
khám chữa bnh tại nhà đối với hai nhóm đối tượng người trong độ tuổi lao động
và trẻ em dưới 16 tuổi, tng qua việc áp dụng mô hình hồi quy logistic nhiu mc
phương pháp thống hiện đại đang được s dng rộng rãi trong nghiên cu
nhiều nước trên thế giới và bước đầu được s dng ti Vit Nam.
Luận văn “ Kết lun thống kê về tình hình chăm sóc sc khe Hải Dương”
bao gồm 3 chương và danh mục tài liệu tham kho.
Chương 1 trình bày các vấn đề bn v phương pháp phân tích hồi quy
logistic và mô hình hồi quy logistic bi.
Chương 2 giới thiệu phương pháp phân tích thống được dùng trong
nghiên cứu này là mô hình nhiều mc cho d liu nh phân, đặc biệt là mô hình hồi
quy logistic nhiu mc.
Dựa trên s thuyết ca hai chương đầu, Chương 3 đưa ra các kết qu
phân tích ảnh hưởng của các yếu t kinh tế - hội đến nhu cầu khám cha bnh
tại nhà của hai nhóm đối tượng người trong độ tuổi lao động trẻ em dưới 16
tui. Phn cui của chương 3 đưa ra một s ý kiến v xây dựng phát triển
hình y tế gia đình nhằm nâng cao chất lượng y tế cộng đồng.
Chương 1. Phương pháp phân tích hồi quy logistic
Trong nghiên cứu y khoa và khoa học thc nghiệm nói chung thường có nhu
cầu phân tích mối quan h gia mt (hay nhiu ) yếu t nguy khả năng xy
ra mt s c(biến c) nào đó. Trong các nghiên cứu này đối tượng phân tích
thường được th hiện qua các biến s nh phân, tức có/ không, mắc bệnh/ không
mc bnh, chết/ sống, ….Yếu t nguy cơ có thể các biến s liên tục, các biến nh
phân hay các biến mang đặc tính thứ bc.
Vấn đ đặt ra cho các nghiên cu dạng này là làm cách nào đ ước tính mức
độ liên quan gia yếu t nguy cơ và khả năng xy ra s cố. Các phương pháp phân
tích như mô hình hồi quy tuyến tính không th áp dụng được bởi vì biến ph thuc
không phải biến liên tục biến nh phân. Phương pháp phổ biến nht s
dụng để phân tích các d liu với các biến phn ứng lưỡng phân là hồi quy
Logistic.
1. S chênh và tỷ s chênh
S chênh của mt s s kin xảy ra được định nghĩa là tỉ s ca s ln xy ra
s kiện và số lần không xảy ra s kin.
T s chênh là tỷ s ca hai s chênh. Tỷ s này gần 1 thì hai nhóm không
có sự khác biệt. Ngược li t s chênh này càng xa 1 thì càng thể hin s khác biệt
giữa hai nhóm.
2. Hi quy Logistic
Phân tích hồi quy nghiên cứu mi quan h ph thuc ca mt biến (gọi là
biến ph thuc hoc biến được giải thích) vi mt hay nhiu biến khác (được gi
biến độc lp hay biến giải thích). Chúng ta sử dng các ký hiệu sau:
Y
là biến ph thuc (hay biến được giải thích);
i
X
là biến độc lp (hay biến giải thích thứ i).
Mt trong nhiu vấn đề mà phân tích hồi quy gii quyết là ước lượng giá tr
trung bình của biến ph thuc ng với giá trị đã cho của biến độc lp
i
E Y X
.
Nói chung,
i
E Y X
là một hàm của
i
X
sao cho:
i
E Y X
=
i
fX
i
fX
đưc gọi là hàm hồi quy tổng quát.
Hồi quy logistic là hồi quy phi tuyến trong đó biến độc lập là định tính
hoặc định lượng, biến ph thuộc là nhị phân.
Vấn đề được đặt ra là: “Trong trường hp biến ph thuc
Y
là nhị phân t
hàm hồi quy
x
phải có dạng như thế nào?”.
Định nghĩa . Hàm hồi quy logistic đơn của hai biến X và Y có dạng
(2.1)
Trong đó,
0
là hệ s t do (hay h s chn),
1
là hệ s dc,
X là biến độc lp, Y là biến ph thuc.
Định nghĩa . Phép biến đổi sau được gọi là phép biến đổi logit:
ln 1
x
gx x



(2.12)
Nhận xét:
+
01
g x x


là hàm tuyến tính của
x
vi
,x
+
01x

vi mọi giá trị ca
x
+ Gi s giá trị quan sát y của biến ph thuc
Y
có dạng
yx


, trong đó
gọi là sai số (hiu giá trị quan sát và kì vọng có điều kin ca biến ph thuc).
Khi đó
nhận hai giá trị sau:
Nếu
1y
thì
1x


với xác suất
x
,
Nếu y = 0 thì
x


với xác suất
1x
.
T đó,
có phân phối nh thc vi
0E
ar ar . 1V V Y x x


3. Mô hình hồi quy Logistic
Xét biến ph thuộc là biến nh phân
Y
k
biến độc lp
12
, ,..., k
X X X
.
Mun d đoán tần sut xut hiện giá trị 1 ca biến
Y
theo các biến độc lp, có thể
lập phương trình hồi quy:
Tn sut = a1X1 + a2X2 +…+ akXk + b.
Hn chế của mô hình trên: tần sut vế trái chỉ nhận các giá trị lớn hơn 0
nh hơn 1 trong khi vế phải có thể nhận giá trị âm dương bất kì.
1 1 2 2
log ...
1kk
pa X a X a X b
p



3.1. Ước lượng các tham số của mô hình hi quy logistic
Việc ước lượng các tham s của mô hình bằng phương pháp hợp lý cực đại
đưc thc hin theo quy trình như sau:
a. Theo (1.1) ta có
1P Y x x

, do đó có
01P Y x x
. Như
vy
Y
nhận giá tr 1 với xác suất bng
i
x
và nhận giá trị 0 với xác suất bng
1i
x
,
1,...,in
.
Vi mi cp
,
ii
xy
,
1,...,in
, đt
b. Vi mẫu n quan sát độc lp ,i =1,…,n ta thành lập hàm hợp lý có
dng (2.13)
Lấy logarit hàm hợp lý (2.13) ta nhận được hàm số có dạng
(2.14)
c. Lấy đạo hàm của hàm L(β ) theo ta có hệ phương trình hợp lý:
(2.15)
d. Gii h (2.15) ta có nghiệm ca h phương trình hợp lý là ước lượng hp
lý cực đại của các tham số . Ta ký hiệu là ước lượng hợp lý cực đại
của β.
3.2. Kiểm định s phù hợp của mô hình hồi quy logistic
3.2.1. Kiểm định t s hàm hợp lý
Định nghĩa. Độ lch của mô hình hồi quy logistic, ký hiệu là D, có dạng
(2.16)
Định nghĩa. Hiệu độ lch của hai mô hình không có biến độc lập và có biến độc
lập được gọi là tiêu chuẩn t l hợp lý, ký hiệu là G:
G =D (mô hình không có biến độc lp) D (mô hình có biến độc lp).
Ta kim tra s phù hợp của mô hình hồi quy logistic đơn bằng các kiểm định
gi thuyết H: .
Định lý. Khi gi thuyết β1 = 0 đúng thì tiêu chuẩn thng kê G có phân phối
tim cận phân phối χ 2 vi bc t do bng 1.