
Sö dông ch¬ng tr×nh Stata ®Ó khai th¸c sè liÖu
§iÒu tra Møc sèng hé gia ®×nh (VLSS) *
néi dung
CH ¬NG I: GIÍI THIÖU CHUNG VÒ CH ¬NG TR×NH STATA ............................... 1
1. TÆ CHØC L U TR÷ D÷ LIÖU TRONG STATA (DATASET IN STATA) ................................................... 2
2. KHËI ®ÉNG VΜ THO¸T KHÁI STATA (OPEN AND EXIT) .................................................................. 3
3. GIAO DIÖN STATA 7 (STATA INTERFACE) .................................................................................. 3
4. BIªN B¶N LΜM VIÖC (LOG FILE) ................................................................................................ 6
5. NHËP VΜ L U D÷ LIÖU (USE, INPUT AND AND SAVE) ................................................................... 7
CH ¬NG II: KHAI TH¸C D÷ LIÖU ............................................................................. 10
1. CÊU TRÓC LÖNH TRONG STATA (STATA COMMAND SYNTAX) ..................................................... 10
2.TO¸N TÖ VΜ HΜM SÈ (OPERATORS AND FUNCTIONS) ................................................................. 13
3. M« T¶ D÷ LIÖU (DATA REPORTING) ....................................................................................... 14
4. BIªN TËP VΜ SÖA CH÷A D÷ LIÖU (DATA MANIPULATION) ........................................................... 26
5. QUYÒN SÈ TRONG VHLSS (WEIGHT) ................................................................................... 40
CH ¬NG III: KIÓM ®ÞNH GI¶ THIÕT V PH©N TÝCH HÅI QUYΜ .................. 44
1. ¦ÍC L ÎNG VΜ KIÓM ®ÞNH GI¶ THIÕT (ESTIMATION AND HYPOTHESIS TESTING) .............................. 44
2. PH©N TÝCH T ¬NG QUAN VΜ HÅI QUY (CORRELATION AND REGRESSION) .................................... 51
CH ¬NG IV: VÏ ®Å THÞ ............................................................................................... 57
1. VÏ ®Å THÞ (GRAPH) ............................................................................................................. 57
2. MÉT SÈ LO¹I ®Å THÞ TH ÊNG DÏNG ......................................................................................... 66
3. L U TR÷ VΜ HIÓN THÞ ®Å THÞ (SAVING AND GRAPH USING) ...................................................... 73
CH ¬NG V: LËP TR×NH TRONG STATA ................................................................ 75
1. GIÍI THIÖU CHUNG VÒ CH ¬NG TR×NH DO-FILE ......................................................................... 75
2. LOCAL VΜ GLOBAL MACROS ................................................................................................... 79
3. TÝCH V« H ÍNG VΜ MA TRËN (SCALAR AND MATRIX) .................................................................. 82
4. LÖNH ®IÒU KIÖN VΜ VSSNG LÆP ........................................................................................ 85
5. GIÍI THIÖU VÒ FILE ADO ....................................................................................................... 87
T I LIÖU THAM KH¶OΜ ............................................................................................ 88
PHÔ LÔC ....................................................................................................................... 88
Ch¬ng I: Giíi thiÖu chung vÒ ch¬ng tr×nh Stata
1

1. Tæ chøc lu tr÷ d÷ liÖu trong Stata (Dataset in Stata)
Stata lµ phÇn mÒm thèng kª sö dông ®Ó qu¶n lý, ph©n tÝch sè liÖu vµ vÏ ®å thÞ.
Stata cho phÐp lu tr÷ th«ng tin vÒ c¸c ®Æc ®iÓm cña c¸c ®èi tîng nghiªn cøu. Sè liÖu
lu tr÷ trong Stata cã thÓ ®îc hiÓn thÞ díi d¹ng b¶ng nh vÝ dô sau:
hhcode headname hhsize incomepc
101 Nguyen Van A 6 2100
102 Le Thi B 5 3210
103 Tran Van C 10 1200
Quan s¸t (b¶n ghi)
Mçi mét hµng ngang cña b¶ng sè liÖu ®îc gäi lµ mét quan s¸t (observation), hay mét
b¶n ghi (record) lu tr÷ sè liÖu vÒ mét ®èi tîng nghiªn cøu. ë vÝ dô trªn cã 3 quan s¸t lu
tr÷ sè liÖu vÒ M· hé (hhcode); Tªn chñ hé (headname); Quy m« hé (hhsize); Thu
nhËp b×nh qu©n (incomepc) cña 3 hé gia ®×nh.
BiÕn (trêng; thuéc tÝnh)
Th«ng tin vÒ ®èi tîng nghiªn cøu ®îc thu thËp vµ lu tr÷ theo c¸c ®Æc ®iÓm cña chóng.
C¸c ®Æc ®iÓm nµy ®îc gäi lµ biÕn (variable), hay trêng (field). BiÕn ®îc xem lµ c¸c
cét cña b¶ng sè liÖu. ë vÝ dô trªn cã 4 biÕn, víi tªn lµ hhcoed, hedname, hhsize, vµ
incomepc. Tªn biÕn dµi tõ 1 ®Õn 32 ký tù, ®îc b¾t ®Çu ch÷ hoÆc dÊu g¹ch díi (_).
Tªn biÕn chØ bao gåm ch÷, sç vµ dÊu g¹ch díi. C¸c ký tù ®Æc biÖt kh¸c kh«ng thÓ
dïng ®Ó ®Æt tªn cho biÕn.
BiÕn x¸c ®Þnh (identifying variables)
Th«ng thêng trong c¸c biÕn sÏ cã c¸c biÕn dïng ®Ó nhËn d¹ng quan s¸t, ®îc gäi lµ biÕn
x¸c ®Þnh. Nhê cã c¸c biÕn x¸c ®Þnh nµy mµ c¸c quan s¸t cã thÓ ph©n biÖt ®îc víi
nhau. Mçi mét quan s¸t cã mét gi¸ trÞ cña c¸c biÕn nµy. ë vÝ dô trªn, biÕn x¸c ®Þnh lµ
hhcode, ®èi víi mçi mét quan s¸t biÕn hhcode nhËn mét gi¸ trÞ.
C¸c ®Æc ®iÓm cña biÕn
C¸c biÕn cã thÓ ®îc g¸n nh·n (chó thÝch). VÝ dô biÕn hhcode cã thÓ ®îc g¸n nh·n lµ
“M· hé”.
BiÕn cã thÓ ®îc ®Þnh d¹ng (format) lµ biÕn sè vµ biÕn ký tù víi c¸c lo¹i lu tr÷ kh¸c
nhau. BiÕn sè cã thÓ lu tr÷ díi lo¹i byte; int; long; float; double. Cßn biÕn ký tù th× cã
thÓ lu tr÷ díi d¹ng str1 ®Õn str80 cho c¸c ®é dµi kh¸c nhau.
KiÓu lu tr÷
d¹ng sè
Dung lîng
(Byte)
Gi¸ trÞ nhá nhÊt Gi¸ trÞ lín nhÊt KiÓu
byte 1 -127 126 Sè nguyªn
int 2 -32,767 32,766 Sè nguyªn
long 4 -2,147,483,647 2,147,483,646 Sè nguyªn
float 4 -10^36 10^36 Sè thùc
double 8 -10^308 10^308 Sè thùc
C¸c biÕn sè cã thÓ bao gåm c¸c biÕn rêi r¹c vµ liªn tôc. C¸c biÕn nh lµ quy m« hé gia
®×nh, giíi tÝnh chñ hé, vïng ®Þa lý, tr×nh ®é gi¸o dôc lµ c¸c biÕn rêi r¹c (discrete) (hay
cßn gäi lµ biÕn ph©n lo¹i (categorical)). C¸c biÕn nµy cã thÓ ®îc lu tr÷ díi d¹ng byte,
2

int, vµ long. C¸c biÕn liªn tôc (continuous) nh thu nhËp, chi tiªu cña hé th× lu tr÷ díi
d¹ng float hoÆc double.
BiÕn ký tù (string) dïng ®Ó lu tr÷ c¸c lo¹i ký tù. VÝ dô biÕn headname lµ biÕn kiÓu ký
tù dïng ®Ó lu tr÷ tªn cña chñ hé.
KiÓu lu tr÷
d¹ng ch÷
Byte §é dµi lín nhÊt
str1 1 1
str2 2 2
...
str80 80 80
2. Khëi ®éng vµ tho¸t khái Stata (Open and exit)
Stata ®îc khëi ®éng t¬ng tù nh c¸c ch¬ng tr×nh tin häc øng dông kh¸c, b»ng c¸ch kÝch
vµo biÓu tîng cña tÖp wstata.exe trong Windows explorer, hoÆc chän b»ng c¸ch chän
Start -> Program -> Stata. Ch¬ng tr×nh ®îc tho¸t ra b»ng lÖnh exit tõ cöa sæ lÖnh
Stata Command, hoÆc tuú chän exit trong thùc ®¬n (menu) File.
3. Giao diÖn Stata 7 (Stata interface)1
Sau khi Stata ®îc khëi ®éng, giao diÖn cña Stata sÏ ®îc hiÖn lªn, bao gåm thanh thùc
®¬n (menu bar) ë trªn cïng, díi ®ã lµ thanh c«ng cô (tool bar) vµ c¸c cöa sæ (windows).
1 Phiªn b¶n Stata 8 cã giao diÖn t¬ng tù nh phiªn b¶n Stata 7. Kh¸c biÖt lín nhÊt lµ Stata 8 cã
thªm tuú chän Statistics trong thanh thùc ®¬n. Tuú chän nµy cho phÐp thùc hiÖn c¸c mét sè
lÖnh thèng kª b»ng c¸c tuú chän qua giao diÖn cöa sæ mµ kh«ng ph¶i gâ c¸c lÖnh trong cöa
sæ Command.
3

C¸c cöa sæ cña Stata
C¸c cöa sæ cña Stata ®îc më ra b»ng viÖc lùa chän c¸c tuú chän ë thanh thùc ®¬n
Windows (menu bar). C¸c cöa sæ nµy bao gåm:
Results HiÓn thÞ c¸c lÖnh vµ kÕt qu¶
Graph HiÓn thÞ ®å thÞ
Viewer HiÓn thÞ cöa sæ trî gióp (help) vµ hiÓn thÞ néi dung c¸c file v¨n
b¶n (text)
Command Dïng ®Ó gâ c¸c c©u lÖnh
Review HiÓn thÞ c¸c lÖnh ®· thùc hiÖn
Variables HiÓn thÞ danh s¸ch c¸c biÕn cña tÖp sè liÖu
Data editor HiÓn thÞ vµ söa ch÷a sè liÖu díi d¹ng b¶ng
Do-file editor HiÓn thÞ cöa sæ ®Ó so¹n th¶o ch¬ng tr×nh
Thanh thùc ®¬n (Menu bar)
B»ng c¸ch kÝch vµo thanh thùc ®¬n vµ c¸c tuú chän trong ®ã, Stata sÏ thùc hiÖn c¸c
lÖnh kh¸c nhau. Thanh thùc ®¬n bao gåm c¸c nhãm lÖnh sau ®©y:
4

File
Open Më file sè liÖu
View Xem c¸c file cña Stata trong cöa sæ Viewer
Save Lu file sè liÖu
Save as Lu file sè liÖu díi tªn míi
File name Chän tªn file ®Ó ®a vµo cöa sæ lÖnh
Log §ãng, më, xem l¹i log file
Save graph Lu gi÷ file ®å thÞ
Print graph In ®å thÞ
Print results In kÕt qu¶
Exit Tho¸t khái Stata
Edit
Copy text Sao chÐp v¨n b¶n (text)
Copy tables Sao chÐp b¶ng biÓu
Paste D¸n
Table copy options Lùa chän sao chÐp b¶ng sè liÖu
Graph copy options Lùa chän sao chÐp ®å thÞ (kh«ng cã trong Stata 7)
Prefs C¸c tuú chän vÒ mµu s¾c, ph«ng ch÷, vµ kÝch cì
Windows
Results Më cöa sæ kÕt qu¶
Graph Më cöa sæ ®å thÞ
Log Më cöa sæ log file
Viewer Më cöa sæ trî gióp (help) vµ xem néi dung file
Command Më cöa sæ c©u lÖnh
Review Më cöa sæ c¸c lÖnh ®· thùc hiÖn
Variables Më cöa sæ danh s¸ch c¸c biÕn cña tÖp sè liÖu
Help/Search Më cöa sæ trî gióp (help)
Data editor Më cöa ®Ó xem sè liÖu lu tr÷ díi d¹ng b¶ng
Do-file editor Më cöa sæ viÕt ch¬ng tr×nh
Help C¸c trî gióp liªn quan ®Õn viÖc sö dông Stata
Thanh c«ng cô (tool bar)
5

