intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Sử dụng chương trình Stata để khai thác số liệu điều tra mức sống hộ gia đình (VLSS)

Chia sẻ: Thach Kim Khanh | Ngày: | Loại File: DOC | Số trang:89

152
lượt xem
34
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Giới thiệu chung về chương trình Stata, khai thác dữ liệu, Kiểm định giả thiết và phân tích hồi quy, vẽ đồ thị,... là những nội dung chính trong 5 chương của tài liệu "Sử dụng chương trình Stata để khai thác số liệu điều tra mức sống hộ gia đình (VLSS)". Mời các bạn cùng tham khảo để có thêm tài liệu phục vụ nhu cầu học tập và nghiên cứu.

Chủ đề:
Lưu

Nội dung Text: Sử dụng chương trình Stata để khai thác số liệu điều tra mức sống hộ gia đình (VLSS)

  1. Sö dông ch¬ng tr×nh Stata ®Ó khai th¸c sè liÖu §iÒu tra Møc sèng hé gia ®×nh (VLSS) * néi dung  CH ¬NG I: GIÍI THIÖU CHUNG VÒ CH    ¬NG TR×NH STATA                                      ...............................      1 1. TÆ CHØC LU TR÷ D÷ LIÖU TRONG STATA (DATASET IN STATA)................................................... 2 2. KHËI ®ÉNG VΜ THO¸T KHÁI STATA (OPEN AND EXIT).................................................................. 3 3. GIAO DIÖN STATA 7 (STATA INTERFACE).................................................................................. 3 4. BIªN B¶N LΜM VIÖC (LOG FILE)................................................................................................ 6 5. NHËP VΜ LU D÷ LIÖU (USE, INPUT AND AND SAVE) ................................................................... 7  CH ¬NG II: KHAI TH¸C D÷ LIÖU                                                                                    .............................................................................       10 1. CÊU TRÓC LÖNH TRONG STATA (STATA COMMAND SYNTAX)..................................................... 10 2.TO¸N TÖ VΜ HΜM SÈ (OPERATORS AND FUNCTIONS)................................................................. 13 3. M« T¶ D÷ LIÖU (DATA REPORTING)....................................................................................... 14 4. BIªN TËP VΜ SÖA CH÷A D÷ LIÖU (DATA MANIPULATION)........................................................... 26 5. QUYÒN SÈ TRONG VHLSS (WEIGHT)................................................................................... 40  CH ¬NG III: KIÓM ®ÞNH GI¶ THIÕT V   Μ  PH©N TÝCH HÅI QUY                      ..................       44 1. ¦ÍC LÎNG VΜ KIÓM ®ÞNH GI¶ THIÕT (ESTIMATION AND HYPOTHESIS TESTING).............................. 44 2. PH©N TÝCH T¬NG QUAN VΜ HÅI QUY (CORRELATION AND REGRESSION).................................... 51  CH ¬NG IV: VÏ ®Å THÞ                                                                                                      ...............................................................................................       57 1. VÏ ®Å THÞ (GRAPH)............................................................................................................. 57 2. MÉT SÈ LO¹I ®Å THÞ THÊNG DÏNG......................................................................................... 66 3. LU TR÷ VΜ HIÓN THÞ ®Å THÞ (SAVING AND GRAPH USING)...................................................... 73  CH ¬NG V: LËP TR×NH TRONG STATA                                                                       ................................................................       75 1. GIÍI THIÖU CHUNG VÒ CH¬NG TR×NH DO-FILE......................................................................... 75 2. LOCAL VΜ GLOBAL MACROS................................................................................................... 79 3. TÝCH V« HÍNG VΜ MA TRËN (SCALAR AND MATRIX).................................................................. 82 4. LÖNH ®IÒU KIÖN VΜ VSSNG LÆP........................................................................................ 85 5. GIÍI THIÖU VÒ FILE ADO....................................................................................................... 87  TΜ I LIÖU THAM KH¶O                                                                                                ............................................................................................       88  PHÔ LÔC                                                                                                                           .......................................................................................................................       88 Ch¬ng I: Giíi thiÖu chung vÒ ch¬ng tr×nh Stata 1
  2. 1. Tæ chøc lu tr÷ d÷ liÖu trong Stata (Dataset in Stata) Stata lµ phÇn mÒm thèng kª sö dông ®Ó qu¶n lý, ph©n tÝch sè liÖu vµ vÏ ®å thÞ. Stata cho phÐp lu tr÷ th«ng tin vÒ c¸c ®Æc ®iÓm cña c¸c ®èi tîng nghiªn cøu. Sè liÖu lu tr÷ trong Stata cã thÓ ®îc hiÓn thÞ díi d¹ng b¶ng nh vÝ dô sau: hhcode headname hhsize incomepc 101 Nguyen Van A 6 2100 102 Le Thi B 5 3210 103 Tran Van C 10 1200 Quan s¸t (b¶n ghi) Mçi mét hµng ngang cña b¶ng sè liÖu ®îc gäi lµ mét quan s¸t (observation), hay mét b¶n ghi (record) lu tr÷ sè liÖu vÒ mét ®èi tîng nghiªn cøu. ë vÝ dô trªn cã 3 quan s¸t lu tr÷ sè liÖu vÒ M· hé (hhcode); Tªn chñ hé (headname); Quy m« hé (hhsize); Thu nhËp b×nh qu©n (incomepc) cña 3 hé gia ®×nh. BiÕn (trêng; thuéc tÝnh) Th«ng tin vÒ ®èi tîng nghiªn cøu ®îc thu thËp vµ lu tr÷ theo c¸c ®Æc ®iÓm cña chóng. C¸c ®Æc ®iÓm nµy ®îc gäi lµ biÕn (variable), hay trêng (field). BiÕn ®îc xem lµ c¸c cét cña b¶ng sè liÖu. ë vÝ dô trªn cã 4 biÕn, víi tªn lµ hhcoed, hedname, hhsize, vµ incomepc. Tªn biÕn dµi tõ 1 ®Õn 32 ký tù, ®îc b¾t ®Çu ch÷ hoÆc dÊu g¹ch díi (_). Tªn biÕn chØ bao gåm ch÷, sç vµ dÊu g¹ch díi. C¸c ký tù ®Æc biÖt kh¸c kh«ng thÓ dïng ®Ó ®Æt tªn cho biÕn. BiÕn x¸c ®Þnh (identifying variables) Th«ng thêng trong c¸c biÕn sÏ cã c¸c biÕn dïng ®Ó nhËn d¹ng quan s¸t, ®îc gäi lµ biÕn x¸c ®Þnh. Nhê cã c¸c biÕn x¸c ®Þnh nµy mµ c¸c quan s¸t cã thÓ ph©n biÖt ® îc víi nhau. Mçi mét quan s¸t cã mét gi¸ trÞ cña c¸c biÕn nµy. ë vÝ dô trªn, biÕn x¸c ®Þnh lµ hhcode, ®èi víi mçi mét quan s¸t biÕn hhcode nhËn mét gi¸ trÞ. C¸c ®Æc ®iÓm cña biÕn C¸c biÕn cã thÓ ®îc g¸n nh·n (chó thÝch). VÝ dô biÕn hhcode cã thÓ ®îc g¸n nh·n lµ “M· hé”. BiÕn cã thÓ ®îc ®Þnh d¹ng (format) lµ biÕn sè vµ biÕn ký tù víi c¸c lo¹i lu tr÷ kh¸c nhau. BiÕn sè cã thÓ lu tr÷ díi lo¹i byte; int; long; float; double. Cßn biÕn ký tù th× cã thÓ lu tr÷ díi d¹ng str1 ®Õn str80 cho c¸c ®é dµi kh¸c nhau. KiÓu lu tr÷ Dung lîng Gi¸ trÞ nhá nhÊt Gi¸ trÞ lín nhÊt KiÓu d¹ng sè (Byte) byte 1 -127 126 Sè nguyªn int 2 -32,767 32,766 Sè nguyªn long 4 -2,147,483,647 2,147,483,646 Sè nguyªn float 4 -10^36 10^36 Sè thùc double 8 -10^308 10^308 Sè thùc C¸c biÕn sè cã thÓ bao gåm c¸c biÕn rêi r¹c vµ liªn tôc. C¸c biÕn nh lµ quy m« hé gia ®×nh, giíi tÝnh chñ hé, vïng ®Þa lý, tr×nh ®é gi¸o dôc lµ c¸c biÕn rêi r¹c (discrete) (hay cßn gäi lµ biÕn ph©n lo¹i (categorical)). C¸c biÕn nµy cã thÓ ®îc lu tr÷ díi d¹ng byte, 2
  3. int, vµ long. C¸c biÕn liªn tôc (continuous) nh thu nhËp, chi tiªu cña hé th× lu tr÷ díi d¹ng float hoÆc double. BiÕn ký tù (string) dïng ®Ó lu tr÷ c¸c lo¹i ký tù. VÝ dô biÕn headname lµ biÕn kiÓu ký tù dïng ®Ó lu tr÷ tªn cña chñ hé. KiÓu lu tr÷ Byte §é dµi lín nhÊt d¹ng ch÷ str1 1 1 str2 2 2 ... str80 80 80 2. Khëi ®éng vµ tho¸t khái Stata (Open and exit) Stata ®îc khëi ®éng t¬ng tù nh c¸c ch¬ng tr×nh tin häc øng dông kh¸c, b»ng c¸ch kÝch vµo biÓu tîng cña tÖp wstata.exe trong Windows explorer, hoÆc chän b»ng c¸ch chän Start -> Program -> Stata. Ch¬ng tr×nh ®îc tho¸t ra b»ng lÖnh exit tõ cöa sæ lÖnh Stata Command, hoÆc tuú chän exit trong thùc ®¬n (menu) File. 3. Giao diÖn Stata 7 (Stata interface)1 Sau khi Stata ®îc khëi ®éng, giao diÖn cña Stata sÏ ®îc hiÖn lªn, bao gåm thanh thùc ®¬n (menu bar) ë trªn cïng, díi ®ã lµ thanh c«ng cô (tool bar) vµ c¸c cöa sæ (windows). 1  Phiªn b¶n Stata 8 cã giao diÖn t¬ng tù nh phiªn b¶n Stata 7. Kh¸c biÖt lín nhÊt lµ Stata 8 cã thªm tuú chän Statistics trong thanh thùc ®¬n. Tuú chän nµy cho phÐp thùc hiÖn c¸c mét sè lÖnh thèng kª b»ng c¸c tuú chän qua giao diÖn cöa sæ mµ kh«ng ph¶i gâ c¸c lÖnh trong cöa sæ Command. 3
  4. C¸c cöa sæ cña Stata C¸c cöa sæ cña Stata ®îc më ra b»ng viÖc lùa chän c¸c tuú chän ë thanh thùc ®¬n Windows (menu bar). C¸c cöa sæ nµy bao gåm: Results HiÓn thÞ c¸c lÖnh vµ kÕt qu¶ Graph HiÓn thÞ ®å thÞ Viewer HiÓn thÞ cöa sæ trî gióp (help) vµ hiÓn thÞ néi dung c¸c file v¨n b¶n (text) Command Dïng ®Ó gâ c¸c c©u lÖnh Review HiÓn thÞ c¸c lÖnh ®· thùc hiÖn Variables HiÓn thÞ danh s¸ch c¸c biÕn cña tÖp sè liÖu Data editor HiÓn thÞ vµ söa ch÷a sè liÖu díi d¹ng b¶ng Do-file editor HiÓn thÞ cöa sæ ®Ó so¹n th¶o ch¬ng tr×nh Thanh thùc ®¬n (Menu bar) B»ng c¸ch kÝch vµo thanh thùc ®¬n vµ c¸c tuú chän trong ®ã, Stata sÏ thùc hiÖn c¸c lÖnh kh¸c nhau. Thanh thùc ®¬n bao gåm c¸c nhãm lÖnh sau ®©y: 4
  5. File Open Më file sè liÖu View Xem c¸c file cña Stata trong cöa sæ Viewer Save Lu file sè liÖu Save as Lu file sè liÖu díi tªn míi File name Chän tªn file ®Ó ®a vµo cöa sæ lÖnh Log §ãng, më, xem l¹i log file Save graph Lu gi÷ file ®å thÞ Print graph In ®å thÞ Print results In kÕt qu¶ Exit Tho¸t khái Stata Edit Copy text Sao chÐp v¨n b¶n (text) Copy tables Sao chÐp b¶ng biÓu Paste D¸n Table copy options Lùa chän sao chÐp b¶ng sè liÖu Graph copy options Lùa chän sao chÐp ®å thÞ (kh«ng cã trong Stata 7) Prefs C¸c tuú chän vÒ mµu s¾c, ph«ng ch÷, vµ kÝch cì Windows Results Më cöa sæ kÕt qu¶ Graph Më cöa sæ ®å thÞ Log Më cöa sæ log file Viewer Më cöa sæ trî gióp (help) vµ xem néi dung file Command Më cöa sæ c©u lÖnh Review Më cöa sæ c¸c lÖnh ®· thùc hiÖn Variables Më cöa sæ danh s¸ch c¸c biÕn cña tÖp sè liÖu Help/Search Më cöa sæ trî gióp (help) Data editor Më cöa ®Ó xem sè liÖu lu tr÷ díi d¹ng b¶ng Do-file editor Më cöa sæ viÕt ch¬ng tr×nh Help C¸c trî gióp liªn quan ®Õn viÖc sö dông Stata Thanh c«ng cô (tool bar) 5
  6. C¸c tuú chän trªn thanh c«ng cô ®îc thiÕt kÕ ®Ó thùc hiÖn c¸c lÖnh th«ng dông cña Stata. NÕu chóng ta di chuyÓn con trá ®Õn c¸c nót nµy th× sÏ hiÖn lªn c¸c c©u huíng dÉn, bao gåm: Open (use) Më file sè liÖu Stata Save Lu tr÷ file sè liÖu ra ®Üa Print results In néi dung cña cöa sæ kÕt qu¶ Begin log Më, ®ãng vµ xem néi dung cña file log Start viewer Më cöa sæ trî trî (help) Bring Dialog Window to font §a cöa sæ hép tho¹i ra phÝa tríc Bring Result Window to font §a cöa sæ kÕt qu¶ ra phÝa tríc Bring Graph Window to font §a cöa sæ vÏ ®å thÞ ra phÝa tríc Do-file editor Më cöa sæ so¹n th¶o ch¬ng tr×nh Data editor Më cöa sæ söa ch÷a sè liÖu Data browser Më cöa sæ xem sè liÖu Clear –more- condition T¾t lÖnh more Break Dõng viÖc thùc hiÖn lÖnh hoÆc ch¬ng tr×nh 4. Biªn b¶n lµm viÖc (log file) Th«ng thêng khi lµm viÖc víi Stata, ngêi sö dông muèn ghi l¹i biªn b¶n lµm viÖc bao gåm c¸c lÖnh, c¸c th«ng b¸o vµ c¸c kÕt qu¶ ph©n tÝch thu ®îc. Stata cho phÐp ghi l¹i c¸c biªn b¶n lµm viÖc b»ng lÖnh log using. Có ph¸p: log using (®êng dÉn\tªn tÖp) [, append replace [ text | smcl ] ] C¸c tuú chän: append Ghi biªn b¶n lµm viÖc tiÕp vµo 1 file ®· cã s½n replace Ghi l¹i biªn b¶n lµm viÖc ®Ì lªn 1 file ®· cã s½n text T¹o biªn b¶n lµm viÖc díi d¹ng v¨n b¶n (text) (phÇn më réng lµ log) smcl T¹o biªn b¶n lµm viÖc díi d¹ng smcl (phÇn më réng lµ smcl), ®©y còng lµ tuú chän ngÇm ®Þnh VÝ dô: log using baitap1 T¹o tÖp baitap1 ghi l¹i biªn b¶n lµm viÖc t¹i th môc hiÖn thêi, phÇn më réng mÆc ®Þnh lµ smcl 6
  7. . log using baitap1 ------------------------------------------------------------------------------- log: C:\baitap1.smcl log type: smcl opened on: 17 Feb 2004, 15:32:03 log using baitap1, replace T¹o tÖp baitap1 ghi ®Ì lªn tÖp baitap1 ®· cã s½n log using “d:\baitap2”, text T¹o tÖp baitap2 t¹i æ ®Üa D, díi d¹ng v¨n b¶n (text) (phÇn më réng lµ log) log using “d:\baitap2”, append Ghi tiÕp tôc biªn b¶n lµm viÖc ë tÖp baitap2 t¹i æ ®Üa D C¸c tÖp víi phÇn më réng smcl cã thÓ chuyÓn thµnh c¸c tÖp text b»ng lÖnh translate. VÝ dô: translate baitap1.smcl exercise1.log log off LÖnh nµy t¹m thêi dõng viÖc ghi l¹i biªn b¶n lµm viÖc vµo tÖp log/smcl ®ang më log on LÖnh nµy tiÕp tôc ghi biªn b¶n lµm viÖc vµo tÖp log ®ang më. Lªnh nµy ®îc dïng sau lÖn log using hoÆc log off. log close LÖnh nµy ®ãng vµ lu tr÷ tÖp log ®ang më. Chó ý: ­ Stata cho phÐp chØ ghi l¹i nh÷ng g× mµ ngêi sö dông ®· gâ trong cöa sæ command, viÖc nµy gióp cho viÖc sau nµy viÕt c¸c ch¬ng tr×nh dùa trªn nh÷ng biªn b¶n ®· lµm viÖc. Có ph¸p: cmdlog using (®êng dÉn\tªn tÖp) [, append replace] cmdlog {off | on | close} ­ §Ó xem c¸c file log/smcl vµo thanh thùc ®¬n: file/log/view (hoÆc ë cöa sæ lÖnh command gâ: view (tªn tÖp)); hoÆc cã thÓ më b»ng c¸c ch¬ng tr×nh so¹n thao v¨n b¶n kh¸c nh MS-Word; Notepad 5. NhËp vµ lu d÷ liÖu (Use, input and and save) Më tÖp sè liÖu ®ang cã: Có ph¸p: use (®êng dÉn\tªn tÖp) LÖnh nµy më tÖp Stata, víi phÇn réng lµ .dta, ®îc chØ ra ë tªn tÖp. 7
  8. VÝ dô: use ho1.dta më tÖp ho1.dta ë th môc hiÖn thêi use "D:\VHLSS 2004\ho1.dta", më tÖp ho1.ta ë th môc VHLSS 2004 trªn æ D clear TÖp sè liÖu Stata cã thÓ ®îc më b»ng lùa chän Open trªn thùc ®¬n File; hoÆc nót Open (use) trªn thanh c«ng cô tool bar. NÕu file sè liÖu cã dung lîng lín th× chóng ta ph¶i thiÕt lËp bé nhí cÇn dïng cho Stata b»ng lÖnh: set memory #[k|m] VÝ dô: set mem 32m set mem 32000k NhËp sè liÖu Cã mét sè c¸ch ®Ó nhËp sè liÖu tõ bµn phÝm vµo bé nhí cña Stata. ­ Sö dông cöa sæ Stata editor ®Ó nhËp sè liÖu. HoÆc tõ cöa sæ command, gâ lÖnh edit. Sau ®ã nhËp sè liÖu theo kiÓu biÓu b¶ng trong cöa sæ nµy. ­ Sö dông lÖnh: input [danh s¸ch biÕn + ®Þnh d¹ng nÕu cÇn] Sau ®ã sö dông bµn phÝm ®Ó nhËp sè liÖu lÇn lît cho c¸c biÕn cña tõng quan s¸t. Gi¸ trÞ ®îc nhËp c¸ch nhau 1 ký tù trèng. KÕt thóc nhËp sè liÖu b»ng lÖnh end. VÝ dô: . input hhcode str15 name income hhcode name income 1. 101 "Nguyen Van A" 1200 2. 102 "Nguyen Van B" 1350 3. 103 "Tran Thi C" 2310 4. end Stata cho phÐp nhËp sè liÖu tõ c¸c file c¬ së d÷ liÖu kh¸c. Tríc hÕt c¸c file sè liÖu nµy cÇn ®îc lu tr÷ díi d¹ng text (cã thÓ b»ng ch¬ng tr×nh Excel), c¸c quan s¸t ®îc c¸c nhau 1 dßng vµ c¸c gi¸ trÞ c¸ch nhau 1 dÉu phÈy (commas) hoÆc dÊu c¸ch (tab). Sau ®ã dïng lÖnh insheet ®Ó nhËp sè liÖu nµy vµo Stata. Có ph¸p: insheet [danh s¸ch biÕn] using (tªn tÖp text) [, [no]names comma tab clear] LÖnh nµy sÏ ®äc vµo bé nhí cña Stata c¸c quan s¸t cña tÖp text, vµ chØ ra tªn c¸c biÕn sÏ ®îc t¹o ra. C¸c tuú chän: 8
  9. [no]names Cho phÐp nhËp tªn biÕn ®îc chØ ra ë dßng thø nhÊt cña file text comma Th«ng b¸o lµ c¸c gi¸ trÞ cña file text ®îc ph©n c¸ch b»ng dÊu phÈy tab Th«ng b¸o lµ c¸c gi¸ trÞ cña file text ®îc ph©n c¸ch b»ng dÊu tab clear Sè liÖu ®îc ®äc vµo sÏ thay thÕ sè liÖu ®ang ®îc thêng tró trong bé nhí cña Stata VÝ dô: . insheet using c:\income.txt (3 vars, 4 obs) . insheet maho hoten thunhap using c:\income.txt (note: variable names in file ignored) (3 vars, 4 obs) Lu tr÷ sè liÖu Có ph¸p: save (®êng dÉn\tªn tÖp) [,replace] LÖnh nµy lu tr÷ sè liÖu ®ang ë trong bé nhí cña Stata thµnh tÖp chØ ®Þnh díi tªn tÖp. NÕu tuú chän replace ®îc chØ ra th× tÖp sè liÖu nµy sÏ ghi ®Ì lªn tÖp hiÖn thêi (tÊt nhiªn tªn tÖp sè liÖu lµ gièng nhau). ViÖc lu tr÷ sè liÖu cã thÓ thùc hiÖn b»ng c¸c tïy chän Save vµ Save as ë trong thanh thùc ®¬n (menu bar); hoÆc nót Save trªn thanh c«ng cô (tool bar). Chó ý: Xem thªm lÖnh infile vµ outfile 9
  10. Ch¬ng II: Khai th¸c d÷ liÖu 1. CÊu tróc lÖnh trong Stata (Stata command syntax) CÊu tróc c¬ b¶n cña mét lÖnh trong Stata nh sau: [by danh s¸ch biÕn:] Có ph¸p lÖnh [danh s¸ch biÕn] [biÓu thøc] [®iÒu kiÖn] [ph¹m vi] [quyÒn sè] [, tuú chän] Trong phÇn Híng dÉn s dông (Help) cña Stata, có ph¸p lÖnh tr×nh bµy b»ng tiÕng Anh nh sau: [by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options] Trong ®ã dÊu ngoÆc vu«ng ký hiÖu c¸c tuú chän. Chó ý: ­ C¸c c©u lÖnh Stata ®îc viÕt b»ng ch÷ thêng. ­ §èi víi tªn biÕn, Stata ph©n biÖt ch÷ viÕt thêng víi ch÷ viÕt hoa. VÝ dô, trong cïng mét tÖp sè liÖu, biÕn “Ho_ten” vµ biÕn “ho_ten” lµ 2 biÕn kh¸c nhau. ­ C¸c tuú chän ®îc ký hiÖu trong dÊu ngoÆc vu«ng [ ]. C¸c tuú chän nµy cã thÓ cã hoÆc kh«ng trong c©u lÖnh. C¸c tham sè b¾t buéc (tªn biÕn) ®îc ®Æt trong dÊu ngoÆc < >. C¸c c©u lÖnh sÏ kh«ng thùc hiÖn ®îc nÕu c¸c tham sè b¾t buéc nµy kh«ng ®îc khai b¸o. ­ Mét sè lÖnh Stata cho phÐp viÕt t¾t. VÝ dô lÖnh summarize cã thÓ viÕt t¾t lµ sum. Trong cuèn tµi liÖu nµy phÇn g¹ch ch©n díi có ph¸p cña c©u lÖnh lµ có ph¸p “viÕt t¾t” cña c©u lÖnh ®ã. ­ C¸c vÝ dô trong cuèn tµi liÖu nµy sö dông sè liÖu §iÒu tra Møc sèng d©n c n¨m 1998 do Tæng côc Thèng kª tiÕn hµnh. Trong ®ã TÖp chi tiªu tæng hîp Hhexp98n.dta thêng xuyªn ®îc sö dông. by danh s¸ch biÕn (by varlist): Stata sÏ thùc hiÖn c©u lÖnh víi theo tõng gi¸ trÞ ®îc chØ ra bëi danh s¸ch biÕn. BiÕn ®îc chØ ra bëi danh s¸ch biÕn ®îc yªu cÇu s½p xÕp tríc khi thùc hiÖn lÖnh. VÝ dô: . sort sex . by sex: sum rlpcex1 -> sex = 1 10
  11. Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- rlpcex1 | 4375 2980.906 2430.648 357.318 45801.71 -> sex = 2 Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- rlpcex1 | 1624 3748.368 3231.241 376.9805 30624.77 . sort sex urban98 . by sex urban98: sum rlpcex1 -> sex = 1, urban98 = Rural Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- rlpcex1 | 3344 2308.134 1345.671 357.318 24386.43 -> sex = 1, urban98 = Urban Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- rlpcex1 | 1031 5163.01 3602.245 682.9575 45801.71 -> sex = 2, urban98 = Rural Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- rlpcex1 | 925 2553.448 1776.178 376.9805 25527.95 -> sex = 2, urban98 = Urban Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- rlpcex1 | 699 5329.628 3962.946 1057.797 30624.77 Danh s¸ch biÕn (varlist) ChØ ra danh s¸ch c¸c biÕn chÞu t¸c ®éng cña c©u lÖnh. NÕu nh kh«ng cã biÕn nµo ®îc chØ ra th× lÖnh Stata sÏ cã t¸c dông lªn tÊt c¶ c¸c biÕn (all variables) VÝ dô: . sum hhsize sex reg7 Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- hhsize | 5999 4.752292 1.954292 1 19 sex | 5999 1.270712 .4443645 1 2 reg7 | 5999 4.01917 2.145305 1 7 11
  12. . sum Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- househol | 5999 19617.86 11201.92 101 38820 year | 5999 97.94666 .2247337 97 98 month | 5999 6.340723 3.011082 1 12 --Break-- r(1); LÖnh sum nµy hiÓn thÞ thèng kª c¬ b¶n cña tÊt c¶ c¸c biÕn trong tÖp sè liÖu. §iÒu kiÖn (if exp) Stata chØ thùc hiÖn c©u lÖnh ®èi víi c¸c quan s¸t mµ gi¸ trÞ cña nã cho kÕt qu¶ cña biÓu thøc lµ ®óng. VÝ dô: . sum poor if reg7==1 Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- poor | 859 .4982538 .5002882 0 1 LÖnh nµy chØ cã t¸c dông ®èi víi c¸c quan s¸t mµ biÕn reg7 cã gi¸ trÞ b»ng 1. Ph¹m vi (in range) ChØ ra ph¹m vi c¸c quan s¸t chÞu t¸c ®éng cña c©u lÖnh. Range (ph¹m vi) cã thÓ cã c¸c d¹ng sau: sum poor in 10 TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t 10 (chÝnh b»ng gi¸ trÞ cña biÕn poor t¹i quan s¸t thø 10) sum poor in TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t tõ 10 ®Õn 10/100 100 sum poor in f/100 TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t tõ ®Çu tiªn ®Õn 100 sum poor in 100/l TÝnh gi¸ trÞ trung b×nh cña biÕn poor cho quan s¸t tõ thø 100 ®Õn quan s¸t cuèi cïng QuyÒn sè (weight) Cho phÐp tÝnh to¸n sñ dông quyÒn sè. Tuú chän vÒ quyÒn sè sÏ ®îc tr×nh bµy kü ë môc 5 cña ch¬ng nµy. C¸c tuú chän (Options) NhiÒu c©u lÖnh Stata cho phÐp c¸c tuú chän riªng. C¸c tuú chän nµy ®îc chØ ra sau dÊu phÈy. 12
  13. VÝ dô: LÖnh sum cã tuú chän lµ detail, cho phÐp tÝnh to¸n thªm mét sè thèng kª kh¸c ngoµi gi¸ trÞ trung b×nh vµ ®é lÖnh chuÈn. . sum rlpcex1, detail comp.M&Reg price adj.pc tot exp ------------------------------------------------------------- Percentiles Smallest 1% 682.9575 357.318 5% 1012.433 366.2792 10% 1238.088 376.9805 Obs 5999 25% 1671.054 381.3502 Sum of Wgt. 5999 50% 2397.042 Mean 3188.667 Largest Std. Dev. 2692.567 75% 3711.917 26944.64 90% 5940.803 30624.77 Variance 7249918 95% 8045.32 31066.5 Skewness 3.791027 99% 14163.04 45801.71 Kurtosis 29.21398 Chó ý: ­ Stata cho phÐp viÕt t¾t c¸c lÖnh vµ tïy chän. Trong tµi liÖu nµy, phÇn g¹ch ch©n díi c¸c lÖnh cã nghÜa lµ lÖnh ®ã cã thÓ viÕt t¾t b»ng ký tù trong phÇn g¹ch ch©n nµy. VÝ dô nh lÖnh use cã nghÜa lµ cã thÓ ®îc viÕt t¾t bëi u. ­ Có ph¸p cña c¸c c©u lÖnh trong tµi liÖu nµy ®îc viÕt b»ng tiÕng Anh, cho phÐp ngêi ®äc cã thÓ ®èi chiÕu víi phÇn híng dÉn sö dông trong Stata. 2.To¸n tö vµ hµm sè (Operators and functions) C¸c to¸n tö (operators) C¸c to¸n tö trong Stata ®îc ký hiÖu nh sau: Ký hiÖu ý nghÜa Sè häc + Céng - Trõ * Nh©n / Chia ^ Luü thõa Quan hÖ > Lín h¬n < Nhá h¬n >= Lín h¬n hoÆc b»ng
  14. L«gÝc ~ Kh«ng | HoÆc & Vµ Chó ý: Trong biÓu thøc dÊu == ®îc dïng cho viÖc kiÓm ®Þnh biÓu thøc, vÝ dô nh ®îc dïng sau lÖnh if. Cßn dÊu = ®îc dïng cho lÖnh t¹o biÕn. VÝ dô: gen RRD=0 replace RRD=1 if reg8==1 C¸c hµm sè (function) Hµm sè thêng ®îc dïng trong biÓu thøc (exp) cña c©u lÖnh Stata. NÕu coi Y lµ mét hµm sè cña f(X1, X2,…, Xn) th× lÖnh vÒ hµm sè trong Stata sÏ tÝnh gi¸ trÞ cña Y nÕu cho c¸c gi¸ trÞ cña Xi. Stata cã 8 lo¹i hµm sè: Mathematical functions C¸c hµm to¸n häc Statistical functions Hµm thèng kª Random numbers Hµm cho sè ngÉu nhiªn String functions Hµm liªn quan ®Õn dÉy ký tù Special functions Hµm ®Æc biÖt Date functions Hµm ngµy th¸ng Time-series functions Hµm chuçi thêi gian Matrix functions Hµm ma trËn VÝ dô: gen absx=abs(x) gen log_exp=log(rlpcex1) C¸c ký hiÖu cô thÓ vÒ c¸c hµm sè nµy cã thÓ xem ë môc help functions. 3. M« t¶ d÷ liÖu (Data reporting) 3.1. Xo¸ bé nhí cña Stata Có ph¸p: clear LÖnh nµy xo¸ c¸c d÷ liÖu trong bé nhí cña Stata, b¾t ®Çu cho mét file lµm viÖc míi. 3.2. Híng dÉn sö dông lÖnh Stata Có ph¸p: 14
  15. help LÖnh nµy hiÓn thÞ híng dÉn sö dông c¸c lÖnh Stata, lÖnh Stata cÇn ph¶i ®îc gâ ®Çy ®ñ vµ chÝnh x¸c. VÝ dô: . help sum help for sum not found try help contents or search sum . help summarize ----------------------------------------------------------------------------------------- help for summarize (manual: [R] summarize) ----------------------------------------------------------------------------------------- Summary statistics …. Chó ý: Chóng ta cã thÓ t×m híng dÉn sö dông theo tõ kho¸ b»ng lÖnh search. LÖnh search cã thÓ ®îc thùc hiÖn b»ng tuú chän Search ë thùc ®¬n help. 3.3. M« t¶ d÷ liÖu Có ph¸p: describe [danh s¸ch biÕn] LÖnh nµy hiÓn thÞ th«ng tin chung nh tªn biÕn, ®Þnh d¹ng, nh·n biÕn cña c¸c biÕn ®- îc liÖt kª bëi danh s¸ch biÕn cña file sè liÖu ®ang më. NÕu nh kh«ng cã biÕn nµo ®îc chØ ra th× lÖnh describe sÏ hiÖn thÞ th«ng tin cña tÊt c¶ c¸c biÕn. VÝ dô: . des househol year month vlssmphs storage display value variable name type format label variable label ------------------------------------------------------------------- ------------ househol long %12.0g household code year float %9.0g Year of interview month float %9.0g Month of interview vlssmphs byte %8.0g 1 if vlss, 2 if mphs source 3.4. HiÓn thÞ gi¸ trÞ cña c¸c biÕn 15
  16. Có ph¸p: list [danh s¸ch biÕn] [®iÒu kiÖn] [ph¹m vi] [, nolabel] LÖnh nµy hiÓn thÞ gi¸ trÞ cña c¸c biÕn ®îc chØ ra bëi danh s¸ch biÕn. Tuú chän nolable cho phÐp hiÓn thÞ gi¸ trÞ sè chø kh«ng ph¶i lµ gi¸ trÞ g¸n nh·n. VÝ dô: . list househol farm in 1/5 househol farm 1. 36307 farm 2. 28002 farm 3. 36017 farm 4. 32418 non farm 5. 15215 non farm . list househol farm in 1/5, nolabel househol farm 1. 36307 1 2. 28002 1 3. 36017 1 4. 32418 0 5. 15215 0 3.5. HiÓn thÞ dÉy ký tù vµ biÓu thøc Có ph¸p: display ["DÉy (chuçi) ký tù"] [biÓu thøc] LÖnh nµy hiÓn thÞ dÉy ký tù hoÆc gi¸ trÞ cña biÓu thøc. VÝ dô: . dis "So lieu VLSS 1998" So lieu VLSS 1998 . dis 120*100/30 400 3.6. Söa ch÷a, xem sè liÖu Có ph¸p: edit [danh s¸ch biÕn] [®iÒu kiÖn] [ph¹m vi] [, nolabel] browse [danh s¸ch biÕn] [®iÒu kiÖn] [ph¹m vi] [, nolabel] 16
  17. LÖnh edit nµy më cöa sæ Data editor ®Ó ngêi sö dông söa ch÷a, nhËp sè liÖu. Tuú chän nolable cho phÐp hiÓn thÞ gi¸ trÞ sè chø kh«ng ph¶i lµ gi¸ trÞ g¸n nh·n. LÖnh nµy cã thÓ ®îc chän tõ tuú chän Data editor trong thanh thùc ®¬n Windows. LÖnh browse gièng lÖnh edit nhng kh«ng cho phÐp söa ch÷a sè liÖu. 3.7. §Õm quan s¸t Có ph¸p: count [®iÒu kiÖn] [ph¹m vi] LÖnh nµy ®Õm sè quan s¸t ®îc chØ ra bëi ®iÒu kiÖn (exp) vµ ph¹m vi (range). NÕu ®iÒu kiÖn (exp) vµ ph¹m vi (range) kh«ng ®îc chØ ra th× sÏ hiÖn thÞ sè quan s¸t cña tÖp sè liÖu. VÝ dô: . count 5999 . count if reg7==1 859 . count if reg7==1 & urban98==1 187 . count if reg7==1 & urban98==0 672 3.8. Thèng kª c¬ b¶n Có ph¸p: summarize [danh s¸ch biÕn] [quyÒn sè] [®iÒu kiÖn] [ph¹m vi] [, detail] LÖnh nµy tÝnh to¸n vµ hiÓn thÞ nh÷ng thèng kª c¬ b¶n cña c¸c biÕn ®îc chØ ra bëi danh s¸ch biÕn. Tuú chän detail cho phÐp hiÓn thÞ thªm mét sè thèng kª nh ®é nhän, ®é lÖnh vµ c¸c gi¸ trÞ cña thËp vÞ ph©n. VÝ dô: . sum rlpcex1 Variable | Obs Mean Std. Dev. Min Max -------------+----------------------------------------------------- rlpcex1 | 5999 3188.667 2692.567 357.318 45801.71 . sum rlpcex1, detail comp.M&Reg price adj.pc tot exp ------------------------------------------------------------- Percentiles Smallest 1% 682.9575 357.318 17
  18. 5% 1012.433 366.2792 10% 1238.088 376.9805 Obs 5999 25% 1671.054 381.3502 Sum of Wgt. 5999 50% 2397.042 Mean 3188.667 Largest Std. Dev. 2692.567 75% 3711.917 26944.64 90% 5940.803 30624.77 Variance 7249918 95% 8045.32 31066.5 Skewness 3.791027 99% 14163.04 45801.71 Kurtosis 29.21398 3.9. HiÓn thÞ th«ng tin chung vÒ biÕn Có ph¸p: inspect [danh s¸ch biÕn] [®iÒu kiÖn] [ph¹m vi] LÖnh nµy m« t¶ vÒ sè liÖu cña c¸c biÕn kiÓu sè. Nã ®a ra th«ng tin vÒ sè ©m, d¬ng, sè nguyªn, gi¸ trÞ thiÕu (missing) cña gi¸ trÞ cña biÕn. VÝ dô: . gen x=invnorm(uniform()) . inspect x x: Number of Observations ---- Non- Total Integers Integers | # Negative 2964 - 2964 | # Zero - - - | # Positive 3035 - 3035 | # ----- ----- ----- | # # # Total 5999 - 5999 | . # # # . Missing - +---------------------- ----- -3.918931 3.641588 5999 (More than 99 unique values) Chó ý: cã thÓ xem thªm lÖnh codebook 3.10. T¹o b¶ng tÇn suÊt T¹o b¶ng tÇn suÊt 1 chiÒu Có ph¸p: tabulate [quyÒn sè] [®iÒu kiÖn] [ph¹m vi] [, missing nolabel] tab1 [quyÒn sè] [®iÒu kiÖn] [ph¹m vi] [, missing nolabel] 18
  19. LÖnh nµy t¹o b¶ng tÇn suÊt 1 chiÒu cña biÕn ®îc chØ ra. LÖnh tabulate chØ cho phÐp cã 1 biÕn ®îc chØ ra, nÕu cã h¬n 1 biÕn ®îc chØ ra th× Stata sÏ hiÓu lµ t¹o b¶ng tÇn suÊt 2 chiÒu. C¸c tuú chän: missing Cho phÐp c¸c quan s¸t kh«ng cã gi¸ trÞ (missing) ®îc xÕp vµo 1 lo¹i. nolabel Cho phÐp hiÓn thÞ gi¸ trÞ sè cña biÕn, chø kh«ng ph¶i nh·n biÕn VÝ dô: . tab sex Gender of | HH.head | (1:M;2:F) | Freq. Percent Cum. ------------+----------------------------------- 1 | 4375 72.93 72.93 2 | 1624 27.07 100.00 ------------+----------------------------------- Total | 5999 100.00 . tab1 urban98 reg7 -> tabulation of urban98 1:urban 98; | 0:rural 98 | Freq. Percent Cum. ------------+----------------------------------- Rural | 4269 71.16 71.16 Urban | 1730 28.84 100.00 ------------+----------------------------------- Total | 5999 100.00 -> tabulation of reg7 Code by 7 | regions | Freq. Percent Cum. ------------+----------------------------------- region1 | 859 14.32 14.32 region2 | 1175 19.59 33.91 region3 | 708 11.80 45.71 region4 | 754 12.57 58.28 region5 | 368 6.13 64.41 region6 | 1023 17.05 81.46 region7 | 1112 18.54 100.00 ------------+----------------------------------- Total | 5999 100.00 19
  20. T¹o b¶ng tÇn suÊt 2 chiÒu Có ph¸p: tabulate [quyÒn sè] [®iÒu kiÖn] [ph¹m vi] [, chi2 missing nofreq cell column row] tab2 [quyÒn sè] [®iÒu kiÖn] [ph¹m vi] [, chi2 missing nofreq cell column row] LÖnh tablulate nµy tÝnh vµ hiÓn thÞ b¶ng tÇn suÊt 2 chiÒu cña 2 biÕn ®îc chØ ra. LÖnh tab2 t¹o b¶ng tÇn suÊt 2 chiÒu cña tõng cÆp biÕn ®îc chØ ra trong danh s¸ch biÕn. VÝ dô: . tab urban98 farm 1:urban | Type of HH (1:farm; 98; | 0:nonfarm) 0:rural 98 | non farm farm | Total -----------+----------------------+---------- Rural | 1021 3248 | 4269 Urban | 1540 190 | 1730 -----------+----------------------+---------- Total | 2561 3438 | 5999 C¸c tuú chän: chi2 Thùc hiÖn kiÓm ®Þnh gi¶ thiÕt lµ hai biÕn ®éc lËp missing Cho phÐp c¸c quan s¸t kh«ng cã gi¸ trÞ ®îc xÕp vµo 1 lo¹i nofreq Kh«ng hiÓn thÞ tÇn suÊt cell HiÓn thÞ tÇn suÊt t¬ng ®èi (tû lÖ %) cña c¸c « column HiÓn thÞ tÇn suÊt t¬ng ®èi (tû lÖ %) cña c¸c « theo cét row HiÓn thÞ tÇn suÊt t¬ng ®èi (tû lÖ %) cña c¸c « theo hµng VÝ dô: . tab reg7 urban98, cell nof | 1:urban 98; 0:rural Code by 7 | 98 regions | Rural Urban | Total -----------+----------------------+---------- region1 | 11.20 3.12 | 14.32 region2 | 13.05 6.53 | 19.59 region3 | 10.00 1.80 | 11.80 region4 | 8.37 4.20 | 12.57 region5 | 6.13 0.00 | 6.13 region6 | 8.57 8.48 | 17.05 region7 | 13.84 4.70 | 18.54 -----------+----------------------+---------- Total | 71.16 28.84 | 100.00 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2