Sö dông ch¬ng tr×nh Stata ®Ó khai th¸c sè liÖu
§iÒu tra Møc sèng hé gia ®×nh (VLSS) *
néi dung
CH ¬NG I: GIÍI THIÖU CHUNG VÒ CH ¬NG TR×NH STATA ............................... 1
1. TÆ CHØC L U TR÷ D÷ LIÖU TRONG STATA (DATASET IN STATA) ................................................... 2
2. KHËI ®ÉNG THO¸T KHÁI STATA (OPEN AND EXIT) .................................................................. 3
3. GIAO DIÖN STATA 7 (STATA INTERFACE) .................................................................................. 3
4. BIªN BN LΜM VIÖC (LOG FILE) ................................................................................................ 6
5. NHËP L U D÷ LIÖU (USE, INPUT AND AND SAVE) ................................................................... 7
CH ¬NG II: KHAI TH¸C D÷ LIÖU ............................................................................. 10
1. CÊU TRÓC LÖNH TRONG STATA (STATA COMMAND SYNTAX) ..................................................... 10
2.TO¸N HΜM (OPERATORS AND FUNCTIONS) ................................................................. 13
3. M« TD÷ LIÖU (DATA REPORTING) ....................................................................................... 14
4. BIªN TËP SÖA CH÷A D÷ LIÖU (DATA MANIPULATION) ........................................................... 26
5. QUYÒN TRONG VHLSS (WEIGHT) ................................................................................... 40
CH ¬NG III: KIÓM ®ÞNH GI¶ THIÕT V PH©N TÝCH HÅI QUYΜ .................. 44
1. ¦ÍC L ÎNG KIÓM ®ÞNH GITHIÕT (ESTIMATION AND HYPOTHESIS TESTING) .............................. 44
2. PH©N TÝCH T ¬NG QUAN HÅI QUY (CORRELATION AND REGRESSION) .................................... 51
CH ¬NG IV: VÏ ®Å THÞ ............................................................................................... 57
1. VÏ ®Å THÞ (GRAPH) ............................................................................................................. 57
2. MÉT LO¹I ®Å THÞ TH ÊNG DÏNG ......................................................................................... 66
3. L U TR÷ HIÓN THÞ ®Å THÞ (SAVING AND GRAPH USING) ...................................................... 73
CH ¬NG V: LËP TR×NH TRONG STATA ................................................................ 75
1. GIÍI THIÖU CHUNG VÒ CH ¬NG TR×NH DO-FILE ......................................................................... 75
2. LOCAL GLOBAL MACROS ................................................................................................... 79
3. TÝCH V« H ÍNG MA TRËN (SCALAR AND MATRIX) .................................................................. 82
4. LÖNH ®IÒU KIÖN VSSNG LÆP ........................................................................................ 85
5. GIÍI THIÖU VÒ FILE ADO ....................................................................................................... 87
T I LIÖU THAM KH¶OΜ ............................................................................................ 88
PHÔ LÔC ....................................................................................................................... 88
Ch¬ng I: Giíi thiÖu chung vÒ ch¬ng tr×nh Stata
1
1. Tæ chøc lu tr÷ d÷ liÖu trong Stata (Dataset in Stata)
Stata phÇn mÒm thèng dông ®Ó qu¶n lý, ph©n tÝch liÖu ®å thÞ.
Stata cho phÐp lu tr÷ th«ng tin c¸c ®Æc ®iÓm cña c¸c ®èi tîng nghiªn cøu. liÖu
lu tr÷ trong Stata cã thÓ ®îc hiÓn thÞ díi d¹ng b¶ng nh vÝ dô sau:
hhcode headname hhsize incomepc
101 Nguyen Van A 6 2100
102 Le Thi B 5 3210
103 Tran Van C 10 1200
Quan s¸t (b¶n ghi)
Mçi mét hµng ngang cña b¶ng liÖu ®îc gäi mét quan s¸t (observation), hay mét
b¶n ghi (record) lu tr÷ liÖu vÒ mét ®èi tîng nghiªn cøu. ë trªn3 quan s¸t lu
tr÷ liÖu (hhcode); Tªn chñ (headname); Quy hé (hhsize); Thu
nhËp b×nh qu©n (incomepc) cña 3 hé gia ®×nh.
BiÕn (trêng; thuéc tÝnh)
Th«ng tin vÒ ®èi tîng nghiªn cøu ®îc thu thËp vµ lu tr÷ theo c¸c ®Æc ®iÓm cña chóng.
C¸c ®Æc ®iÓm nµy ®îc gäi biÕn (variable), hay trêng (field). BiÕn ®îc xem c¸c
cét cña b¶ng liÖu. ë trªn 4 biÕn, víi tªn hhcoed, hedname, hhsize,
incomepc. Tªn biÕn dµi 1 ®Õn 32 tù, ®îc b¾t ®Çu ch÷ hoÆc dÊu g¹ch díi (_).
Tªn biÕn chØ bao gåm ch÷, dÊu g¹ch díi. C¸c tù ®Æc biÖt kh¸c kh«ng thÓ
dïng ®Ó ®Æt tªn cho biÕn.
BiÕn x¸c ®Þnh (identifying variables)
Th«ng thêng trong c¸c biÕn sÏ cã c¸c biÕn dïng ®Ó nhËn d¹ng quan s¸t, ®îc gäi lµ biÕn
x¸c ®Þnh. Nhê c¸c biÕn x¸c ®Þnh nµy c¸c quan s¸t thÓ ph©n biÖt ®îc víi
nhau. Mçi mét quan s¸tmét gi¸ trÞ cña c¸c biÕn nµy. ë vÝ trªn, biÕn x¸c ®Þnh
hhcode, ®èi víi mçi mét quan s¸t biÕn hhcode nhËn mét gi¸ trÞ.
C¸c ®Æc ®iÓm cña biÕn
C¸c biÕn thÓ ®îc g¸n nh·n (chó thÝch). biÕn hhcode thÓ ®îc g¸n nh·n
“M· hé”.
BiÕn thÓ ®îc ®Þnh d¹ng (format) biÕn biÕn tù víi c¸c lo¹i lu tr÷ kh¸c
nhau. BiÕn thÓ lu tr÷ díi lo¹i byte; int; long; float; double. Cßn biÕn th×
thÓ lu tr÷ díi d¹ng str1 ®Õn str80 cho c¸c ®é dµi kh¸c nhau.
KiÓu lu tr÷
d¹ng sè
Dung lîng
(Byte)
Gi¸ trÞ nhá nhÊt Gi¸ trÞ lín nhÊt KiÓu
byte 1 -127 126 Sè nguyªn
int 2 -32,767 32,766 Sè nguyªn
long 4 -2,147,483,647 2,147,483,646 Sè nguyªn
float 4 -10^36 10^36 Sè thùc
double 8 -10^308 10^308 Sè thùc
C¸c biÕn thÓ bao gåmc biÕn rêi r¹c liªn tôc. C¸c biÕn nh lµ quy gia
®×nh, giíi tÝnh chñ hé, vïng ®Þa lý, tr×nh ®é gi¸o dôc lµ c¸c biÕn rêi r¹c (discrete) (hay
cßn gäi biÕn ph©n lo¹i (categorical)). C¸c biÕn nµy thÓ ®îc lu tr÷ díi d¹ng byte,
2
int, long. C¸c biÕn liªn tôc (continuous) nh thu nhËp, chi tiªu cña th× lu tr÷ díi
d¹ng float hoÆc double.
BiÕn (string) dïng ®Ó lu tr÷ c¸c lo¹i ký tù. biÕn headname lµ biÕn kiÓu
tù dïng ®Ó lu tr÷ tªn cña chñ hé.
KiÓu lu tr÷
d¹ng ch÷
Byte §é dµi lín nhÊt
str1 1 1
str2 2 2
...
str80 80 80
2. Khëi ®éng vµ tho¸t khái Stata (Open and exit)
Stata ®îc khëi ®éng t¬ng tù nh c¸c ch¬ng tr×nh tin häc øng dông kh¸c, b»ng c¸ch kÝch
vµo biÓu tîng cña tÖp wstata.exe trong Windows explorer, hoÆc chän b»ng c¸ch chän
Start -> Program -> Stata. Ch¬ng tr×nh ®îc tho¸t ra b»ng lÖnh exit cöa lÖnh
Stata Command, hoÆc tuú chän exit trong thùc ®¬n (menu) File.
3. Giao diÖn Stata 7 (Stata interface)1
Sau khi Stata ®îc khëi ®éng, giao diÖn cña Stata ®îc hiÖn lªn, bao gåm thanh thùc
®¬n (menu bar) ë trªn cïng, díi ®ã lµ thanh c«ng cô (tool bar) vµ c¸c cöa sæ (windows).
1 Phiªn b¶n Stata 8 cã giao diÖn t¬ng tù nh phiªn b¶n Stata 7. Kh¸c biÖt lín nhÊt lµ Stata 8 cã
thªm tuú chän Statistics trong thanh thùc ®¬n. Tuú chän nµy cho phÐp thùc hiÖn c¸c mét sè
lÖnh thèng kª b»ng c¸c tuú chän qua giao diÖn cöa sæ mµ kh«ng ph¶i gâ c¸c lÖnh trong cöa
sæ Command.
3
C¸c cöa sæ cña Stata
C¸c cöa cña Stata ®îc ra b»ng viÖc lùa chän c¸c tuú chän ë thanh thùc ®¬n
Windows (menu bar). C¸c cöa sæ nµy bao gåm:
Results HiÓn thÞ c¸c lÖnh vµ kÕt qu¶
Graph HiÓn thÞ ®å thÞ
Viewer HiÓn t cöa trî gióp (help) hiÓn thÞ néi dung c¸c file v¨n
b¶n (text)
Command Dïng ®Ó gâ c¸c c©u lÖnh
Review HiÓn thÞ c¸c lÖnh ®· thùc hiÖn
Variables HiÓn thÞ danh s¸ch c¸c biÕn cña tÖp sè liÖu
Data editor HiÓn thÞ vµ söa ch÷a sè liÖu díi d¹ng b¶ng
Do-file editor HiÓn thÞ cöa sæ ®Ó so¹n th¶o ch¬ng tr×nh
Thanh thùc ®¬n (Menu bar)
B»ng ch kÝch vµo thanh thùc ®¬n c¸c tuú chän trong ®ã, Stata thùc hiÖn c¸c
lÖnh kh¸c nhau. Thanh thùc ®¬n bao gåm c¸c nhãm lÖnh sau ®©y:
4
File
Open Më file sè liÖu
View Xem c¸c file cña Stata trong cöa sæ Viewer
Save Lu file sè liÖu
Save as Lu file sè liÖu díi tªn míi
File name Chän tªn file ®Ó ®a vµo cöa sæ lÖnh
Log §ãng, më, xem l¹i log file
Save graph Lu gi÷ file ®å thÞ
Print graph In ®å thÞ
Print results In kÕt qu¶
Exit Tho¸t khái Stata
Edit
Copy text Sao chÐp v¨n b¶n (text)
Copy tables Sao chÐp b¶ng biÓu
Paste D¸n
Table copy options Lùa chän sao chÐp b¶ng sè liÖu
Graph copy options Lùa chän sao chÐp ®å thÞ (kh«ng cã trong Stata 7)
Prefs C¸c tuú chän vÒ mµu s¾c, ph«ng ch÷, vµ kÝch cì
Windows
Results Më cöa sæ kÕt qu¶
Graph Më cöa sæ ®å thÞ
Log Më cöa sæ log file
Viewer Më cöa sæ trî gióp (help) vµ xem néi dung file
Command Më cöa sæ c©u lÖnh
Review Më cöa sæ c¸c lÖnh ®· thùc hiÖn
Variables Më cöa sæ danh s¸ch c¸c biÕn cña tÖp sè liÖu
Help/Search Më cöa sæ trî gióp (help)
Data editor Më cöa ®Ó xem sè liÖu lu tr÷ díi d¹ng b¶ng
Do-file editor Më cöa sæ viÕt ch¬ng tr×nh
Help C¸c trî gióp liªn quan ®Õn viÖc sö dông Stata
Thanh c«ng cô (tool bar)
5