Chương trình ging dy Kinh tế Fulbright Lp MPP3 – hc k Thu 2010
Khai thác d liu kho sát mc sng h gia đình Vit Nam (VHLSS)
để làm đề tài nghiên cu – s dng phn mm Stata
1. Gii thiu v B d liu kho sát mc sng h gia đình Vit Nam (VHLSS 2008)
2. Khi động Stata 11
3. Mt vài lnh qun lý d liu đơn gin
4. To bng tn s
5. Tính các thng kê mô t
6. Sơ lược v tương quan & hi quy
7. Ni hai file d liu bng lnh Merge
8. Tr giúp
Ph lc 1. M rng v hi quy bi
Ph lc 2. Mt s lnh qun lý d liu nâng cao
Ph lc 3. Mô hình Logit
Ph lc 4. Cu trúc lnh cơ bn trong Stata, vn đề trng s trong VHLSS
Ph lc 5. Kiu d liu; mt s lnh, hàm, toán t thường dùng
Nguyn Khánh Duy, email: khanhduy@ueh.edu.vn Ghi chú bài ging 1
Chương trình ging dy Kinh tế Fulbright Lp MPP3 – hc k Thu 2010
1. Gii thiu v D liu kho sát mc sng h gia đình
Để cung cp thông tin v mc sng dân cư phc v vic xây dng, đánh giá chính sách … Đến nay,
Tng cc thng kê đã tiến hành 6 cuc điu tra mc sng ln vi 2 tên gi khác nhau: kho sát mc
sng dân cư (1993-1994, 1997-1998); kho sát mc sng h gia đình (năm 2002, năm 2004, năm
2006, năm 2008). Có l, khong gn 2 năm na anh ch mi có được d liu VHLSS ca năm 2010!
Gn đây nht là cuc kho sát/điu tra mc sng (thường được viết tt là KSMS) h gia đình năm
2008. D liu điu tra t cuc điu tra này được lưu tr trong b d liu kho sát mc sng h gia
đình năm 2008 (thường gi là VHLSS 2008). Chúng ta có th khai thác b d liu này để làm đề tài
nghiên cu/ bài viết chính sách. (Bn có th liên h vi V Xã hi & Môi trường – Tng cc thng kê
v vn đề bn quyn trong vic s dng b d liu này, hi các thông tin cn thiết …)
Để tìm hiu chi tiết v cuc điu tra này, v cách chn mu, t chc điu tra, phiếu điu tra, các khái
nim …, chúng ta cn đọc thêm tài liu “S tay kho sát mc sng h gia đình 2008” do Tng cc
Thng kê biên son. Dường như, người phân tích VHLSS nào cũng cn có quyn s tay này bên cnh.
Chúng ta tìm hiu sơ lược mt s thông tin chung v KSMS 2008
1.1 Mc đích ca kho sát mc sng 2008
Thu thp các thông tin làm căn c đánh giá mc sng, đánh giá tình trng nghèo đói và phân
hoá giàu nghèo để phc v công tác hoch định các chính sách, kế hoch và các chương trình mc tiêu
quc gia ca Đảng và Nhà nước nhm không ngng nâng cao mc sng dân cư trong c nước, các
vùng và các địa phương.
Cung cp s liu để tính quyn s ch s giá tiêu dùng.
Ngoài ra, thu thp thông tin phc v nghiên cu, phân tích mt s chuyên đề v qun lý điu
hành và qun lý ri ro và phc v tính toán tài khon quc gia.
1.2 Ni dung ca kho sát mc sng 2008
KSMS 2008 gm nhng ni dung ch yếu phn ánh mc sng ca các h gia đình trên c nước
và nhng điu kin kinh tế xã hi cơ bn (đặc đim ca xã/phường…) có tác động đến mc sng ca
người dân nơi h sinh sng. Các ni dung c th bao gm:
a. Đối vi h gia đình
- Mt s đặc đim v nhân khu hc ca các thành viên trong h, gm: Tui, gii tính, dân tc,
tình trng hôn nhân.
- Thu nhp ca h gia đình, gm: Mc thu nhp; thu nhp phân theo ngun thu (tin công, tin
lương; hot động sn xut t làm nông nghip, lâm nghip, thu sn; hot động ngành ngh sn xut
kinh doanh dch v t làm ca h gia đình; thu khác); thu nhp phân theo khu vc kinh tế và ngành
kinh tế.
- Chi tiêu h gia đình: mc chi tiêu, chi tiêu phân theo mc đích chi và khon chi (chi cho ăn,
mc, , đi li, giáo dc, y tế, văn hoá, v.v… và chi khác theo danh mc các nhóm/khon chi tiêu để
tính quyn s ch s giá tiêu dùng).
- Trình độ hc vn, trình độ chuyên môn k thut ca tng thành viên h gia đình.
Nguyn Khánh Duy, email: khanhduy@ueh.edu.vn Ghi chú bài ging 2
Chương trình ging dy Kinh tế Fulbright Lp MPP3 – hc k Thu 2010
- Tình trng m đau, bnh tt và s dng các dch v y tế.
- Tình trng vic làm, thi gian làm vic.
- Tài sn, nhà và các tin nghi như đồ dùng, đin, nước, điu kin v sinh.
- Tham gia chương trình xoá đói gim nghèo, tình hình tín dng.
- Qun lý điu hành và qun lý ri ro
b. Đối vi xã
- Mt s tình hình chung v nhân khu, dân tc.
- Kết cu h tng kinh tế - xã hi ch yếu, gm: hin trng đin, đường, trường hc, trm y tế,
ch, bưu đin, ngun nước.
- Tình trng kinh tế, gm: Tình hình sn xut nông nghip (đất đai, xu hướng và nguyên nhân
tăng gim sn lung các cây trng chính, các điu kin h tr phát trin sn xut như tưới tiêu, khuyến
nông); cơ hi vic làm phi nông nghip.
- Mt s thông tin cơ bn v trt t an toàn xã hi và bo v môi trường.
1.3 Mu kho sát
a. Đối tượng, phm vi, thi đim kho sát
Đối tượng kho sát gm các h gia đình, các thành viên h gia đình và các xã có các h gia đình được
kho sát. Đơn v kho sát gm h gia đình và xã được chn kho sát.
Phm vi kho sát bao gm tt c các địa bàn, các xã đưc chn thuc 64 tnh, thành ph trc thuc trung
ương (sau đây gi tt là tnh/thành ph).
Thi đim kho sát gm hai k vào tháng 5 và tháng 9 năm 2009. Thi gian thu thp thông tin ti địa
bàn mi k kéo dài 2 tháng.
b. Mu kho sát
Mu 1: Mu để kho sát mc sng 2008 và để tính quyn s ch s giá tiêu dùng (CSGTD).
Mu này chn t dàn mu ch thiết kế cho các cuc KSMS giai đon 2000-2010 gm 3.063
xã/phường, mi xã/phường chn 3 địa bàn t các địa bàn ca Tng điu tra Dân s và Nhà năm
1999.
C ca Mu 1 gm 45.945 h được chn t 3.063 địa bàn ca dàn mu ch, chia làm 2 loi:
- Mu thu nhp và quyn s CSGTD gm 36.756 h để thu thp các ni dung thông tin đã nêu
trên và quyn s CSGTD, tr chi tiêu ca h gia đình để đánh giá mc sng cp quc gia, vùng và
tnh/thành ph, đồng thi để tính quyn s CSGTD. Mu này phng vn Phiếu s 1A-PVH/KSMS08;
- Mu thu nhp chi tiêu gm 9.189 h để thu thp đầy đủ các ni dung thông tin đánh giá, phân
tích mc sng mt cách sâu hơn cp quc gia và vùng (không có thông tin để tính quyn s
CSGTD). Mu này phng vn Phiếu s 1B-PVH/KSMS08.
Mu 2: Mu ch để tính quyn s CSGTD, gm 2 phn, Phn 1 gm 9.189 h gia đình được
chn thêm t 3.063 địa bàn ca Mu 1, mi địa bàn chn 3 h gia đình; và Phn 2 gm 15.000 h
Nguyn Khánh Duy, email: khanhduy@ueh.edu.vn Ghi chú bài ging 3
Chương trình ging dy Kinh tế Fulbright Lp MPP3 – hc k Thu 2010
được chn t 1000 địa bàn ca Tng điu tra Dân s và Nhà năm 1999 ngoài mu ch. Mu này
phng vn Phiếu s 1C-PVH/QS08.
c. Các bước chn mu
Đối vi Mu 1:
Bước 1: Chn địa bàn.
Các địa bàn ca Mu 1 s được chn theo cách luân phiên, c th: chn li 50% s địa bàn ca
KSMS 2006 (trong đó có mt na s địa bàn đã được kho sát c trong KSMS 2004 và 2006 và na s
địa bàn còn li ch được kho sát trong KSMS 2006) và 50% s địa bàn còn li được chn mi hoàn
toàn t dàn mu ch, phn chưa được chn vào mu ca KSMS 2004 và 2006.
V Thng kê Xã hi và Môi trường chu trách nhim chn và gi danh sách địa bàn đã chn
cho các Cc Thng kê để rà soát và cp nht, trong đó có gi kèm c sơ đồ và bng kê ca Tng điu
tra Dân s và Nhà năm 1999 ca các địa bàn mi. Các Cc Thng kê tnh/thành ph có th xem xét,
đề ngh điu chnh mt s địa bàn cho phù hp hơn vi các đặc đim địa lý, kinh tế, xã hi thc tế ca
địa phương, nhưng s địa bàn đề ngh điu chnh không vượt quá 5% tng s địa bàn ca tnh/thành
ph và phi được s đồng ý ca TCTK (V XHMT) trước khi tiến hành kho sát.
Bước 2: Chn h.
Cc Thng kê chn h kho sát, c th:
- Đối vi nhng địa bàn chn li t KSMS 2006, chn tt c 15 h, trong đó 12 h đã kho sát
thu nhp (h thu nhp) năm 2006 để kho sát thu nhp cho KSMS 2008 và 3 h đã kho sát thu nhp
chi tiêu (h thu nhp chi tiêu) năm 2006 để kho sát thu nhp chi tiêu cho KSMS 2008. Trong trường
hp có nhng h đã được kho sát năm 2004 hoc 2006 nhưng nay đã đi khi địa bàn thì phi chn h
d b thay thế đểđủ s lượng 12 h thu nhp và 3 h thu nhp chi tiêu mi địa bàn kho sát.
- Đối vi nhng địa bàn mi, chn 20 h t danh sách h đã cp nht ca địa bàn. T 20 h
được chn, chn 15 h (12 h chính thc, 3 h d phòng) để kho sát thu nhp; 5 h còn li (3 chính
thc và 2 d phòng) để kho sát thu nhp chi tiêu.
Vic chn h kho sát được thc hin theo phương pháp nêu trong S tay hướng dn nghip v
KSMS 2008.
Đối vi Mu 2:
- Đối vi Phn 1 ca Mu 2: Chn 5 h (3 h chính thc và 2 h d b) t danh sách h đã cp
nht ca mi địa bàn trong 3.063 địa bàn ca Mu 1 (tr các h đã được chn vào Mu 1) để thu thp
thông tin tính quyn s CSGTD..
- Đối vi Phn 2 ca Mu 2: chn 20 h t danh sách h đã cp nht ca mi địa bàn trong
1.000 địa bàn ca Phn 2 Mu 2. T 20 h được chn, chn 15 h chính thc và 5 h d phòng để thu
thp thông tin tính quyn s CSGTD.
Cc Thng kê tnh/thành ph s chia s địa bàn đưc phân b ca tng khu vc thành th/nông
thôn và vùng địa lý cho 2 k kho sát vào tháng 5 và tháng 9 như sau: 2/3 địa bàn ca Mu 1, k c 3
h ca Phn 1 Mu 2 để kho sát vào k tháng 5; s địa bàn còn li kho sát vào k tháng 9. Các xã có
địa bàn được chn phng vn h s đồng thi tiến hành phng vn Phiếu phng vn xã.
Nguyn Khánh Duy, email: khanhduy@ueh.edu.vn Ghi chú bài ging 4
Chương trình ging dy Kinh tế Fulbright Lp MPP3 – hc k Thu 2010
Danh sách địa bàn và h được chn s được lưu gi ti 2 địa ch: Cc Thng kê tnh/thành ph
và V Thng kê Xã hi và Môi trường để phc v vic t chc thc hin và theo dõi, kim tra, giám
sát.
Mu thu nhp và mu thu nhp chi tiêu được phân b cho 2 thi đim kho sát như sau:
Thi gian
thu thp
s liu
Mu 1
Thu nhp và
quyn s
CSGTD
Mu 1
Thu
nhp chi
tiêu
Mu 2
Phn 1
Mu 2
Phn 2
Cng
TNG S
Chia ra:
36.756
9.189
9.189
15.000
70.134
Tháng
5-6/2008
24.504
6.126
6.126
36.756
Tháng
9-10/2008
12.252
3.063
3.063
15.000
33.378
1.4 Phương pháp thu thp d liu
Cuc kho sát này s dng hai loi phiếu phng vn: loi phiếu phng vn h gia đình và loi
phiếu phng vn xã. Loi phiếu phng vn h gia đình gm: Phiếu phng vn thu nhp chi tiêu (áp
dng cho mu thu nhp chi tiêu) bao gm tt c các thông tin ca ni dung kho sát; Phiếu phng vn
thu nhp và quyn s CSGTD (áp dng cho mu thu nhp và quyn s CSGTD) gm các thông tin ca
ni dung kho sát tr các thông tin v chi tiêu ca h và thêm thông tin để tính quyn s CSGTD; và
Phiếu quyn s CSGTD (áp dng cho mu ch thu thp thông tin để tính quyn s CSGTD). Phiếu
phng vn được thiết kế tương đối chi tiết giúp điu tra viên ghi chép thun li, đồng thi tránh b sót
các khon mc và tăng tính thng nht gia các điu tra viên, t đó nâng cao cht lượng s liu kho
sát.
Cuc kho sát áp dng phương pháp phng vn trc tiếp. Điu tra viên đến h, gp ch h
nhng thành viên trong h có liên quan để phng vn và ghi thông tin vào phiếu phng vn h gia
đình. Đội trưởng đội kho sát phng vn lãnh đạo xã và các cán b địa phương có liên quan và ghi
thông tin vào phiếu phng vn xã. Để bo đảm cht lượng thông tin thu thp, cuc kho sát không
chp nhn phương pháp kho sát gián tiếp hoc sao chép các thông tin t các ngun có sn khác vào
phiếu phng vn.
Nguyn Khánh Duy, email: khanhduy@ueh.edu.vn Ghi chú bài ging 5