Khởi động Stata
ở ộ ươ ằ ấ
ở ộ 1. Kh i đ ng Stata Kh i đ ng ch
ng trình STATA b ng cách nh p vào nút Start :: All Programs ::
ặ ấ ể ượ ng (icon) Stata 8 trên màn hình Medistat :: Stata 8 ho c nh p vào bi u t Desktop.
giao di n c a ch
ng trình Stata
ả ệ ủ
ệ ủ ẽ ệ
ươ ớ
ử ổ
ề ớ ữ
2. Mô t Giao di n c a Stata s hi n ra v i 3 thanh và 4 c a s : 3 thanh bao g m:ồ 1. Thanh tiêu đ v i dòng ch "Intercooled Stata 6.0"
ở ậ ệ ỉ ớ ố ệ ườ ọ ố ở 2. Thanh menu v i các menu File (đóng m t p tin); Edit (hi u ch nh); Prefs (Tùy ồ ọ ch n); Data (S li u) Graphics (Đ h a) Statistics (Th ng kê) User (Ng i dùng) ợ ử ổ Window (m ra các c a s ) và Help (Tr giúp)
ụ 3. Thanh công c (toolbar)
ụ ồ ụ
Thanh công c g m 12 nút công c (1 Open file; 2 Save; 3 Print Results; 4 Begin (Close) log; 5 Start Viewer (Bring Viewer to Front) ; 6 Bring results window to Front 7Bring graph windows to Front; 8 Dofile Editor; 9Data Editor; 10Data Browser; 11Clear more Condition và 12 Break)
ụ ư ủ ừ Ý nghĩa c a t ng công c nh sau:
ở ậ
ư ậ
ế 1 Open file (m t p tin) 2 Save (L u t p tin) ả 3 Print Results (In k t qu )
ế ế ả ả ắ ầ 4 Begin (Close) log: (B t đ u (K t thúc) ghi biên b n k t qu )
ắ ầ ử ụ ư ử ổ ế ử ổ ả
ư ử ổ ồ ọ c) ướ 5 Start Viewer (Bring Viewer to Front) : B t đ u s d ng c a s Viewer ướ 6 Bring results window to Front : (Đ a c a s k t qu ra tr 7Bring graph windows to Front (Đ a c a s đ h a ra tr c)
ạ ậ ươ 8 Dofile Editor: (Biên so n t p tin ch ng trình do file)
ậ ố ệ ớ ố ệ ữ
ữ ể ế ụ ư ệ ự ệ ươ ng
ươ ư ậ ử 9Data Editor: Biên t p s li u (s a ch a, thêm b t s li u) ử ệ ố ệ 10Data Browser: Duy t s li u (xem nh ng không s a ch a) 11Clear more Condition (Xóa l nh more đ ti p t c th c hi n ch trình) 12 Break: (Ng ng t p tin ch ng trình)
ố ử ổ ệ ề ồ ồ t kê theo ng ồ c chi u kim đ ng h bao g m
ượ ử ổ ệ B n c a s li ử ổ 1. C a s Command (c a s l nh)
ử ổ ế ử ổ ả 2. C a s Result (c a s K t qu )
ử ổ ư ử ổ ữ 3. C a s Review (c a s L u tr )
ử ố ế ố ử ổ 4. C a s Variables (c a s Bi n s )
ệ ệ
ươ
ng trình Stata
ể ự ể ươ ử ụ ử ổ ệ ộ ể ỏ ệ ng trình Stata: Dùng bàn phím đ gõ l nh ơ ọ chu t đ ch n các trình đ n ệ
ể ự 3. Cách cách đ th c hi n l nh trong ch ệ ệ Có hai cách đ th c hi n l nh trong ch vào c a s l nh (Stata Command) hay s d ng con tr ồ ọ (menu) giao di n đ h a (Graphic Interface) ể
ệ Dùng bàn phím đ gõ l nh
ệ ự
ứ
ớ ử ụ ươ ể ợ ủ ộ ng pháp này có th không thích h p cho ng ử ệ ấ ả t c các l nh ụ c a l nh. Tuy ủ ệ i m i s d ng do nó ườ ủ ườ ệ ả i dùng ph i thu c các câu l nh và cú pháp c a nó
ử ổ ệ ể Dùng bàn phím đ gõ l nh vào c a s l nh (Stata Command). Đây là cách s ệ t ệ ườ ụ i chuyên nghi p vì nó cho phép th c hi n d ng Stata c a ng ầ ủ ớ đ y đ các ch c năng ph ủ c a Stata m t cách nhanh chóng v i nhiên ph ỏ đòi h i ng ộ ớ ỏ ộ ệ ồ ọ Con tr chu t v i giao di n đ h a (Graphic Interface)
ộ ự ố ệ ệ ệ ươ ươ ằ ố ệ ễ ử ụ ng pháp d s d ng nên s đ ẽ ử c u tiên trình bày ộ ệ ể Có th dùng chu t th c hi n các l nh nh m thao tác s li u (menu Data), v ồ ị đ th (menu Graphics) và phân tích s li u (menu Statistics). Ph ng pháp s ẽ ượ ư ụ d ng chu t và menu là ph trong tài li u này.
ư ạ ế
ả i k t qu phân tích
ế ử ổ ượ ể ế t d c cho phép xem l ế ử ổ ả ỉ ư ạ ả ữ ạ ữ i toàn b k t qu phân tích chúng ta c n ph i m c a s ườ ố ư ấ ộ ế ụ ằ ằ ở ị
4. L u l ả ủ K t qu c a phân tích đ ượ ọ thanh tr ẫ ầ nh m l n cho ng ế n u chúng ta mu n l u tr l log b ng cách nh p vào nút công c Stata Log n m v trí th t
ộ ể ệ c th hi n trên c a s Stata Result và c a s này có m t ữ ạ i nh ng k t qu phân tích cũ. Tuy nhiên đ tránh gây ả ầ ấ ử ổ i nh ng k t qu g n nh t. Do đó i phân tích, c a s này ch l u l ở ử ổ ầ ứ ư ừ trên thanh t ả trái
ể ậ ở ủ ậ . Khi đó c a s Open Stata Log m ra, chúng ta có th nh p tên c a t p ử ổ ộ ữ ả công c ụ ư tin l u tr (log file) vào h p văn b n File name.
ọ ậ ộ s chúng ta ch n t p tin này là "baitap.smcl" hãy gõ "baitap" vào h p File Name
ượ ả ả phân ử ố ế qu ể ư l u ẽ ệ ẽ s tích đ c ạ t i ả ử Gi ấ ồ r i nh p OK. ế ằ t r ng biên Khi đó trên c a s k t qu (Stata results) s hi n ra thông báo đ cho bi ậ ế ả b n k t t p tin "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl"
. log using "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl" ----------------------------------------------------------------------------- - log: D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl
log type: smcl opened on: 10 Oct 2004, 12:01:34
ể ự ệ ạ ướ Sau đó b n có th th c hi n các b c phân tích.
ạ ế ả ụ ấ ả (k t qu phân tích) hãy nh p vào nút công c log ộ ầ ữ ể ệ ử ổ Khi mu n ố xem l i biên b n m t l n n a đ hi n ra c a s Stata Log Options.
ọ ệ ể ấ ọ
ấ ế ệ ả ả ấ ứ vi c ghi biên b n (k t qu phân tích) hãy nh p vào nút công c ụ Sau đó ch n vào nút ch n View snapshot of log file và nh p vào nút l nh OK đ xem biên b n. ả Khi mu n ố ch m d t
ử ổ ể ệ log đ hi n ra c a s Stata Log Options.
ọ ọ ấ
ố ệ ở ậ ệ ườ ử ụ ướ ỏ ấ ế ế ể ố i s d ng Stata có kinh nghi m sau khi m t p tin s li u luôn luôn ả c khi ti n hành các phân tích th ng kê đ không b m t các k t qu Sau đó ch n vào nút ch n Close log file và nh p vào nút OK. ờ L i khuyên: Ng ở ậ m t p tin log tr ủ c a quá trình phân tích.
ẫ ạ ươ ả ố ệ ng này s h ng d n b n ph ng pháp mô t ư ụ ậ ặ
Mô tả số liệu với Stata 8.0 for Windows ề ầ ớ s li u v i ph n m m Stata 8.0 ạ cài đ t các t p tin
ướ ả ố ệ ự ệ ầ ng tr c khi mô t ườ ố ệ ướ s li u chúng ta c n th c hi n b ệ ẩ ẩ ở ậ ồ ị ữ ụ ứ ố ệ ố ệ ệ ạ ủ ế ệ ầ ủ ứ ế ố ạ ẫ ầ ị ế ả ủ ơ ố ệ ố ệ ể ệ ệ ế ọ ẽ ướ ươ Ch ộ ố ệ ivf.dta có trong th m c C:\DATA sau khi b n ử ụ s d ng b s li u ẫ ố ệ s li u m u. ệ ị c chu n b và vi c Thông th ố ệ thao tác s li u (data processing). Công tác chu n b bao g m vi c m t p tin s li u, ế ả ố ệ ả ở ậ m t p tin log (Open log file), kh o sát s li u có bao nhiêu b n ghi và có nh ng bi n ứ ề ươ ư ố s nào cũng nh nghiên c u đ c ng nghiên c u (ch y u là m c tiêu nghiên c u) ệ ể đ giúp vi c phân lo i bi n s . Vi c thao tác s li u là vi c rà soát s li u có b sai sót ế ố ớ hay nh m l n gì hay không, t o bi n s m i theo yêu c u c a phân tích và ti n hành ể vi c dán nhãn s li u đ giúp cho vi c hi u rõ h n s li u và đ c k t qu c a phân ố tích th ng kê.
ướ ướ ở ộ c tiên chúng ta hãy kh i đ ng Stata theo cách đã h ch
ệ ế ậ ị
ố ệ
ở ậ ở ậ
ử ổ ở ộ ằ ẫ ở ươ Kh i đ ng ở ộ ng d n Tr ng ế ậ ẩ ự Stata. Sau đó th c hi n các bài t p 1 đ n 3 cho công tác chu n b và các bài t p 4 đ n 6 cho công tác thao tác s li u. 1 M t p tin ivf_v.dta và m t p tin log Kh i đ ng c a s Use New Data b ng cách 1 trong 2 cách:
ụ ở ụ ầ ị v trí đ u tiên trên thanh công c ).
ấ ọ Nh n nút công c m file ( Ch n menu File :: Open
ẽ ệ ử ổ ợ ả ộ ọ ư ụ ấ ộ ố ệ ườ ậ ng t p tin s li u n m ể th m c C:\Data). Tìm t p tin s ấ ấ ậ ặ ệ ồ
ư ụ ậ ậ ể ở ậ ấ ộ ộ ế ự ệ ầ ớ ể ấ Sau khi c a s Use New Data s hi n ra. Nh p vào mũi tên bên ph i h p Look in đ ọ ổ đĩa thích h p và dùng con chu t nh p vào các th m c đ ch n th m c có ch n ằ ở ư ụ ứ ố ệ ố ch a s li u (thông th ể ở ậ ệ li u ivf_v.dta, nh p đúp vào tên t p tin này đ m t p tin (ho c nh p vào t p tin này ấ ể ậ đ tên t p tin r i vào h p File Name r i sau đó nh p vào nút l nh Open đ m t p tin). ẽ ượ ể ư c th c hi n, c n nh nh p vào nút Đ l u tr ơ ả i toàn b k t qu phân tích s đ ữ ạ l
ể ắ ầ ằ ị ụ ả ứ ư ừ t ẽ ệ ạ đ b t đ u log ể ụ ở trên thanh công c ộ ư ụ ư ủ ậ ậ ọ công c Stata Log n m v trí th t trái ế k t qu (begin log). Máy tính s hi n ra h p tho i Begin Logging Stata Output đ chúng ta ch n tên t p tin (File name) và th m c l u (Save In) c a t p tin log.
ư ụ ớ ố ư ậ ư ụ ậ Thí d chúng ta mu n l u t p tin log v i tên là ivf_v.smcl vào th m c c:\data; chúng ta nh p vào các thông tin nh trên.
ế ố ủ ậ ứ ứ ụ ể
ế ố ứ ể ệ ấ ẫ ấ ế ố ủ ố ệ ạ ả 2. Kh o sát các bi n s c a t p tin và nghiên c u m c tiêu nghiên c u đ phân lo i bi n sế ố ể ướ t kê các bi n s chúng ta có th nh n phím ch c năng F3 hay H ng d n: Đ xem li ử ụ s d ng menu (nh p vào menu Data :: Describe data :: Describe variable in memory) ể đ xem các bi n s c a s li u
. describe
Contains data from C:\DATA\ivf_v.dta
obs: 641
vars: 7 15 Aug 2006 15:27
size: 20,512 (99.8% of memory free)
-------------------------------------------------------------------------------
storage display value
variable name type format label variable label
-------------------------------------------------------------------------------
maso float %9.0g ma so
tuoime float %9.0g tuoi me (nam)
tangha float %9.0g tang huyet ap thai ki - 1=tang
ha, 0=khong tang ha
tuoithai float %9.0g tuoi thai (tuan)
gioi float %9.0g gioi tinh tre - 1=trai, 0=gai
tlsosinh float %9.0g trong luong so sinh (gram)
nghenghiep float %9.0g nghe nghiep me - 1=tu do,
2=cong nhan, 3=vien chuc
-------------------------------------------------------------------------------
Sorted by: maso
ế ố ệ ể ở Chúng ta có th xem danh sách các bi n s li t kê sau:
ủ ố ệ ế ậ ứ ng nghiên c u chúng ta bi đ c ừ t đây là t p tin c a s li u 641 đ a tr ệ ố s t c sinh t ẹ ụ ổ ưở ứ ả ẻ ứ ụ ớ bà m th thai trong ng nghi m (invitro fertilisation) v i m c tiêu ọ ng lên tr ng ọ ả ử ừ ề ươ Gi ượ đ nghiên c u là xem tu i thai và tăng huy t áp trong thai kì có nh h ượ l ế ả ố ệ ượ i s li u đ ng thai hay không. Cách lí gi c minh h a
ủ ế STT Tên bi nế Ý nghĩa c a bi n
ộ ụ ượ ộ ị ị ế ố ạ Phân lo i bi n s : ậ (Đ c l p hay Ph thu c) – (Đ nh tính hay đ nh l ng)
1 Maso Mã số
ổ ủ ổ 2 Tuoime ẹ Tu i c a m (năm tu i)
ế 3 Tangha Tăng huy t áp thai kì 1= có 0= không
ầ ổ 4 Tuoithai Tu i thai (tính theo tu n)
ớ ủ 5 Gioi Gi ẻ i tính c a tr 1=trai 0=gái
ượ 6 Tlsosinh ng sinh tính theo ọ Tr ng l grams
ủ ề ệ ẹ 7 ự Nghenghiep Ngh nghi p c a m 1=t do 2=công nhân 3=viên ch cứ
ố ệ ể
ướ ế ẫ ể ằ 3. Làm th nào đ xem s li u ố ệ H ng d n: Có th xem s li u b ng 2 cách:
ệ ị ừ ủ ụ (v trí 11 tính t bên trái c a thanh công c )
Dùng nút l nh Data Browser Dùng menu Data :: Data browser (readonly editor)
ử ụ ướ ươ cho phép nhìn s li u trong l i (nh các ô c a ch ủ ủ ổ ế ố ử ụ ư ể ư ố ệ S d ng Data Browser ng trình ấ ố ệ . Mu n nhìn s li u ra c a s k t xu t ố ệ Excel) nh ng nó không cho phép in s li u (output) đ sau đó in ra hãy s d ng menu Data:: Describe Data :: List data.
ố t
ự ẫ ả ấ ả t c các bi n s trong b s li u này: ố ả ố ị ượ ị ự ả
ộ ệ ấ ủ ố ầ ị ế ể ế ố ộ ố ệ ệ 4. Hãy th c hi n th ng kê mô t ế ế ướ ướ ng và c tiên chúng ta ph i xác đ nh bi n s nào là bi n s đ nh l H ng d n: tr ế ố ố ố ệ ế ố ị ế ố cho các bi n s : đ i bi n s nào là bi n s đ nh tính. Sau đó th c hi n th ng kê mô t ể ể ệ ệ ự ẩ ượ ế ớ ng, th c hi n l nh summarize đ đ có trung bình và đ l ch chu n, v i bi n đ nh l ế ả ệ ệ ự ị ố ớ đ i v i bi n đ nh tính th c hi n l nh tab1 đ có b ng phân ph i t n su t c a các bi n s . ố
ộ ố ệ ượ ế ế ị Trong b s li u này có các bi n tuoime, tuoithai, tlsosinh là bi n đ nh l ả ế ố ử ụ ể
ng. bi n s này chúng ta s d ng menu Statistics :: Summaries, tables, & tests :: Statistics. Đ mô t Summary
ộ ạ ệ ự ướ c sau:
ỏ ặ
ể ế ầ ấ vào c a s Variables, và nh p vào các bi n c n mô t ướ ướ ố ả ử ổ ể ế ệ ấ ộ ả ả tuoime, tuoithai, tlsosinh) đ tên các bi n này xu t hi n trên h p văn b n
ướ ệ ấ ệ Sau khi h p tho i Summarize hi n ra, th c hi n các b ộ B c 1: Đ t con tr vào h p văn b n Variables ỏ B c 2: Di chuy n con tr th ng kê ( Variables B c 3: Nh p vào nút l nh OK
ả ượ ư K t qu đ ế c trình bày nh u sau: . summarize tuoime tuoithai tlsosinh
Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- tuoime | 641 33.97192 3.87046 23 43 tuoithai | 641 38.68725 2.329931 24.69 42.35 tlsosinh | 641 3129.137 652.7827 630 4650
ế ế ớ Các bi n s đ nh tính bao g m tang_ha (tăng huy t áp), gioi (gi ố ị ề ế ố ị ồ ẹ ể ắ ệ ủ ử ụ ẻ ủ i tính c a tr ), nghenghiep (ngh nghi p c a m ). Đ tóm t t các bi n s đ nh tính này (tang_ha, gioi, nghenghiep) chúng ta s d ng menu Statistics :: Summaries, tables & test :: Tables :: Multiple oneway tables.
ồ ướ ệ c th c hi n g m:
ự ư ộ ỏ
ả ổ ử ấ ỏ vào c a s Variables và nh p vào các bi n ế tang_ha, gioi, ế ả ộ
ư ể ư ấ ướ ể ệ Các b ướ B c 1: đ a con tr vào h p văn b n categorical variable(s) ướ B c 2: đ a con tr nghenghiep đ đ a các tên bi n này vào h p văn b n Categorical variables(s) ấ B c 3: nh p nút l nh OK đ hoàn t t
. tab1 tang_ha gioi nghenghiep
-> tabulation of tang_ha
tang huyet | ap thai ki | - 1=tang | ha, 0=khong | tang ha | Freq. Percent Cum. ------------+----------------------------------- 0 | 552 86.12 86.12 1 | 89 13.88 100.00 ------------+----------------------------------- Total | 641 100.00
-> tabulation of gioi
gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum.
------------+----------------------------------- 0 | 315 49.14 49.14 1 | 326 50.86 100.00 ------------+----------------------------------- Total | 641 100.00
-> tabulation of nghenghiep
nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------- 1 | 104 16.22 16.22 2 | 238 37.13 53.35 3 | 299 46.65 100.00 ------------+----------------------------------- Total | 641 100.00
ầ ị ả ế ệ ế ư ư ọ ạ ả ố ế ệ ố ự ả ị ả ọ ạ ế ữ ả ệ ườ ế ố ị ệ ấ ộ ự ố ệ
ẫ
ị ố ố ệ ệ ố i làm th ng kê chuyên nghi p và ng ự ướ ệ ườ ố ứ ỏ ư ậ ợ i ích do nó đem l ự ệ
ả ệ ướ ự ạ c: t o nhãn (define label value) ị ị ủ ắ ố ệ t s li u nh trên là đ t yêu c u. Tuy nhiên vi c mã hoá các giá tr c a 5. Các tóm t ấ ủ ầ ế ố bi n s khi n cho vi c đ c b ng b ng t n su t c a bi n s danh đ nh (nh gioi và ữ ườ nghenghiep) b khó khăn (nh t là cho nh ng ng i không tr c ti p làm th ng kê hay ố ờ i làm th ng kê i k t qu sau m t kho ng th i gian dài). Do đó nh ng ng ph i đ c l ệ chuyên nghi p luôn luôn th c hi n ghi chú (dán nhãn) cho các bi n s đ nh tính. Hãy ệ th c hi n vi c dán nhãn s li u. H ng d n: ệ ệ ư t Vi c dán nhãn cho các giá tr mã hóa là vi c làm t n công nh ng nó giúp phân bi ườ ặ i làm th ng kê không chuyên nghi p. M c ng ầ ạ ượ t qua công s c b ra vì v y chúng ta c n i v dù t n công nh ng l ệ ph i th c hi n vi c dán nhãn này. ệ ị ế ố ượ Vi c dán nhãn giá tr bi n s đ c th c hi n qua 2 b và dán nhãn cho giá tr (Assign value label to variable).
ạ
ử ổ ể ạ ử ụ ẽ ượ T o nhãn sex, tang_ha, nhãn nghenghiep Đ t o nhãn s d ng menu Data :: Labels & Notes :: Define value label. C a s Define value label s đ ệ c hi n ra.
ắ ữ ả ử ố ạ ướ ụ ể ư c c th nh s chúng ta mu n t o nhãn sex theo quy t c 1 =nam và 2=n , các b
ộ ấ ậ ệ ệ
ộ ả ướ ướ
ậ ệ ẽ ệ
ả ệ ộ ướ ướ B c 3: nh p vào nút l nh OK khi đó h p nh p li u Add value s hi n ra B c 4: Nh p
ướ ả
ủ ộ ướ ệ ệ ậ ậ ộ
ướ ộ
ẽ ệ ệ ậ
ả ộ
ướ ướ ướ ả
Gi sau: ể ệ B c 1: nh p vào nút l nh Define đ hi n ra h p nh p li u Define new lable B c 2: gõ sex vào h p văn b n Label name ấ ộ ậ 1 vào h p văn b n value ộ ậ nam vào h p văn b n Text B c 5: nh p ệ ấ B c 6: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p li u ấ ế Add Value bi n m t ả ấ B c 7: Nh p vào nhãn sex trong h p văn b n Defien label names ể ộ ấ ệ B c 8: Nh p vào nút l nh Add đ h p nh p li u Add value s hi n ra ậ B c 9: Nh p 0 vào h p văn b n value ậ nữ vào h p văn b n Text ộ B c 10: nh p ệ ấ ướ ủ ệ ậ ộ ế ệ ậ ộ B c 11: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ấ li u Add Value bi n m t
ấ ể ệ ể ạ ể ế ụ ạ ủ ộ ệ
ủ ộ Sau đó có th nh p vào nút l nh Close (c a h p tho i Define value labels) đ thoát ra ạ ấ hay nh p vào nút l nh Define (c a h p tho i Define value labels) đ ti p t c t o nhãn tang_ha.
ướ ụ ể ể ạ c c th đ t o nhãn tang_ha g m:
ệ ệ ấ ậ ộ
ộ
ồ Các b ể ệ ướ B c 1: nh p vào nút l nh Define đ hi n ra h p nh p li u Define new lable ả ướ B c 2: gõ tang_ha vào h p văn b n Label name ấ ẽ ệ ướ ệ ệ ậ ộ B c 3: nh p vào nút l nh OK khi đó h p nh p li u Add value s hi n ra
ầ ư ế ặ ợ ể ế ặ ớ ớ ư ườ ớ ng h p trên ta đ t tên ụ ế ể i) ho c tên nhãn có th trùng v i tên bi n (thí d ta ế ể ặ C n l u ý: tên nhãn có th khác v i tên bi n (thí du nh tr nhãn là sex trong khi tên bi n là gi có th đ t tên nhãn là tang_ha cho bi n tăng ha).
ộ ả ướ B c 4: Nh p
ướ ả ộ
ủ ộ ướ ệ ậ ậ ộ
ướ ả ộ ậ 1 vào h p văn b n value ậ huyet ap tang vào h p văn b n Text B c 5: nh p ệ ệ ấ B c 6: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p li u ế ấ Add Value bi n m t ấ B c 7: Nh p vào nhãn tang_ha trong h p văn b n Define label names
ẽ ệ ể ộ ướ ệ ệ ấ ậ B c 8: Nh p vào nút l nh Add đ h p nh p li u Add value s hi n ra
ướ ộ B c 9: Nh p
ướ ả ộ
ậ 0 vào h p văn b n value ả ậ huyet ap bt vào h p văn b n Text B c 10: nh p ậ ấ ướ ệ ủ ệ ộ ệ ế ậ ộ B c 11: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ấ li u Add Value bi n m t
ể ế ụ ạ ủ ệ ấ ạ ộ Đ ti p t c t o nhãn nghenghiep ta nh p vào nút l nh Define (c a h p tho i Define value labels).
ấ ệ ệ ậ ộ
ướ ướ ộ
ể ệ B c 1: nh p vào nút l nh Define đ hi n ra h p nh p li u Define new lable ả nghenghiep vào h p văn b n Label name B c 2: gõ ấ ẽ ệ ướ ệ ệ ậ ộ B c 3: nh p vào nút l nh OK khi đó h p nh p li u Add value s hi n ra
ộ ướ ả B c 4: Nh p
ướ ả
ủ ộ ệ ướ ệ ậ ậ ộ ậ 1 vào h p văn b n value ộ ậ tu do vào h p văn b n Text B c 5: nh p ấ ế ệ B c 6: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p li u ấ Add Value bi n m t
ộ ướ ả
ẽ ệ ậ
ướ ướ ộ B c 8: Nh p vào nút l nh Add đ h p nh p li u Add value s hi n ra B c 9: Nh p
ướ ả ộ
ấ nghenghiep trong h p văn b n Define label names B c 7: Nh p vào nhãn ấ ệ ể ộ ệ ậ 2 vào h p văn b n value ả ậ cong nhan vào h p văn b n Text B c 10: nh p ậ ấ ướ ủ ệ ệ ộ ế ệ ậ ộ B c 11: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ấ li u Add Value bi n m t
ẫ Ở ộ ế ụ ấ ọ nghenghiep, nh p vào ẽ ệ
ả ướ B c 12: ệ ậ nút l nh Add đ h p nh p li u Add value s hi n ra ộ ướ B c 13: Nh p
ướ ộ
ướ ệ ệ ộ ế ệ ế h p Define label names v n ti p t c ch n nhãn ể ộ ệ ậ 3 vào h p văn b n value ả ậ vien chuc vào h p văn b n Text B c 14: nh p ủ ậ ậ ấ ộ B c 15: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ả ư ấ li u Add Value bi n m t. Ta có k t qu nh sau:
ướ ể ấ ệ ạ ệ B c 16: Đ hoàn t ấ t vi c t o nhãn ta nh n vào nút l nh Close
ị ế
ế ố ằ ượ ạ ị c nhãn, chúng ta hãy dán nhãn giá tr cho bi n s b ng cách dùng
Dán nhãn giá tr (Assign value label) cho các bi n gioi, tang_ha, và nghenghiep Sau khi dã t o đ menu Data :: Labels & Notes :: Assign value label to variable
ế ệ ể ỗ ố ướ ạ ệ ộ ự Khi h p tho i labels value – Attach value label hi n ra đ dán nhãn cho m i bi n s ầ c n th c hi n 4 b c sau:
ả
ặ ư ỏ ỏ ấ ể ế ấ ế gioi đ tên bi n này xu t ộ ướ ướ ệ ả
ướ ả ỏ ộ ể sex trong h p văn b n Attach value label đ dán nhãn
ư ế ấ ể ự ướ ệ ệ ệ ộ B c 1: Đ t con tr vào h p văn b n Variable ử ổ B c 2: Đ a con tr vào c a s Variable và nh p vào bi n hi n trên h p văn b n Variable. B c 3: Đ a con tr vào nhãn sex vào tên bi n sex B c 4: Nh p vào nút l nh Submit đ th c hi n vi c dán nhãn.
ự ệ ươ ự ể ế ế ng t đ dán nhãn tang_ha cho bi n tang_ha, hãy ti n hành ể ế ụ ướ Đ ti p t c th c hi n t c sau: các b
ả
ặ ư ỏ ỏ ấ ể ế ấ ế gioi đ tên bi n này xu t ộ ướ ướ ệ ả
ướ ả ộ ỏ ể sex trong h p văn b n Attach value label đ dán nhãn
ư ế ấ ể ự ướ ệ ệ ệ ộ B c 5: Đ t con tr vào h p văn b n Variable ử ổ B c 6: Đ a con tr vào c a s Variable và nh p vào bi n hi n trên h p văn b n Variable. B c 7: Đ a con tr vào nhãn sex vào tên bi n sex B c 8: Nh p vào nút l nh Submit đ th c hi n vi c dán nhãn.
ệ ươ ự ể ế ng t ế đ dán nhãn nghenghiep cho bi n nghenghiep, hãy ti n ể ế ụ Đ ti p t c th c hi n t ướ hành các b ự c sau:
ộ ỏ ặ
ấ ư ế ể ế gioi đ tên bi n này ộ ả ệ
ỏ ướ ướ ấ ướ ể ả ộ sex trong h p văn b n Attach value label đ dán nhãn
ể ự ầ ư ướ ệ ệ ệ ệ ướ ệ ể ấ ử ư ổ ệ ấ ế ụ ệ ử ổ ả B c 9: Đ t con tr vào h p văn b n Variable ử ổ ỏ B c 10: Đ a con tr vào c a s Variable và nh p vào bi n xu t hi n trên h p văn b n Variable. ư B c 11: Đ a con tr vào nhãn ế sex vào tên bi n sex ữ ấ B c 12: Nh p vào nút l nh OK đ th c hi n vi c dán nhãn. C n l u ý, trong nh ng ầ c chúng ta nh p vào nút l nh submit đ hoàn thành vi c dán nhãn l n dán nhãn tr ế nh ng không đóng c a s label values. Sau khi dán nhãn nghenghiep cho bi n ầ nghenghiep, chúng ta không c n dán nhãn ti p t c nên chúng ta nh p vào nút l nh OK ể đ đóng c a s label values sau khi hoàn thành vi c dán nhãn.
ấ ố ầ ế ố ị
ế ướ
ượ c dán nhãn bao g m ồ tang_ha sex matagegp gestcat. Để ử ụ tang_ha sex matagegp gestcat) chúng ta s d ng ả ậ 6. L p b ng phân ph i t n su t cho các bi n s đ nh tính sau khi đã dán nhãn cho các bi n này. ẫ H ng d n: ố ị ế Các bi n s đ nh tính đã đ ố ị ế ắ t các bi n s đ nh tính này ( tóm t menu Statistics :: Summaries, tables & test :: Tables :: Multiple oneway tables.
ạ ướ ế ệ ộ ộ ặ c (1) đ t con tr ế ố ế ể ọ ệ ả ẽ ư ệ ấ ấ ỏ Khi h p tho i tab1 – Oneway tables hi n ra, chúng ta ti n hành 3 b ử ổ ấ vào h p Categorical value (2) Nh p vào c a s variable đ ch n các bi n s ti n hành ế phân tích và (3) Nh p vào nút l nh OK. K t qu s xu t hi n nh sau:
. tab1 gioi tang_ha nghenghiep
-> tabulation of gioi
gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum. ------------+----------------------------------- gai | 315 49.14 49.14 trai | 326 50.86 100.00 ------------+----------------------------------- Total | 641 100.00
-> tabulation of tang_ha
tang huyet ap | thai ki - | 1=tang ha, |
0=khong tang | ha | Freq. Percent Cum. --------------+----------------------------------- huyet ap bt | 552 86.12 86.12 huyet ap tang | 89 13.88 100.00 --------------+----------------------------------- Total | 641 100.00
-> tabulation of nghenghiep
nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------- tu do | 104 16.22 16.22 cong nhan | 238 37.13 53.35 vien chuc | 299 46.65 100.00 ------------+----------------------------------- Total | 641 100.00
ủ ế ọ ượ ơ ng s sinh (tlsosinh)
ả ử ụ ẽ ổ ứ ồ ch c đ (histogram) c a bi n tr ng l 7. V t ướ ẫ H ng d n: ể ẽ ổ ứ ồ Đ v t ch c đ , ta ph i s d ng menu Graphics :: Histogram
ự ệ ạ ộ ướ ệ Khi h p tho i histogram hi n ra, chúng ta th c hi n các b c sau:
ả
ấ ế ế ặ ư ể ư ỏ ỏ ướ ướ ộ ử ổ ộ
ị ằ ể ướ ị ổ ứ ồ ẽ ắ ầ ừ ch c đ s b t đ u t giá tr 600 (Lower limit ế
ướ ị ằ ả ộ ộ ấ ậ ỉ ệ ủ c a các kho ng giá tr b ng cách nh p ỗ ả ế ổ ứ ồ ẽ t t ch c đ s ghi nh n t l
B c 1: đ t con tr vào h p văn b n Variable B c 2: đ a con tr vào c a s Variables và nh p vào bi n tlsosinh đ đ a bi n này ả vào h p văn b n Variable. ướ B c 3 – B c 4: nh m đ xác đ nh t of first bin) và m i kho ng ti p theo (bin) có đ r ng là 300 (Width of bins) B c 5: Cho bi ọ vào nút ch n Fraction. ế ể ệ ấ ọ ậ ộ ủ ấ ệ ữ ố ọ ố ố ấ ư
ầ (Fraction) = T n su t (Frequency) / C m u (N)
ỉ ệ ậ ộ ỡ ẫ ủ ộ ộ ỉ ệ ả ế ố N u mu n th hi n m t đ c a phân ph i, nh p vào nút ch n Density, n u ể ệ ầ mu n th hi n t n su t thì nh p vào nút ch n Frequency. M i liên h gi a các ố hàm phân ph i này nh sau: T l M t đ (Density) = T l ấ (Fraction) / Đ r ng c a kho ng chia (Width of bins)
ả ế ẽ ượ ế K t qu ti p theo s đ c trình bày trong hình sau.
5 2
.
2
.
5 1
.
n o
i t c a r F
1
.
5 0
.
0
1000
2000
3000
4000
5000
trong luong so sinh (gram)
ồ ị ố ố ệ ủ ạ ụ ể ệ ả ổ ả ử ụ ả ố ư ụ ả ư ệ ầ ấ 8. Đ th này cho chúng ta th y hình d ng c a phân ph i s li u, tuy nhiên chúng ta ụ ệ cũng có th thay đ i th c hi n vi c chia kho ng cho tr c hoành, ghi chú cho tr c ự hoành, chia kho ng cho tr c tung và ghi chú cho tr c tung. Gi s chúng ta mu n th c hi n các yêu c u chia kho ng và ghi chú nh sau:
(cid:0) ả ế ụ ố ư ậ ầ ả ả ế t ph i có 14 kho ng. ả ị ế ỗ 600 đ n 4200 và m i nhãn giá tr cách nhau 600 ộ ị ừ 600 đ n 4800 (biên đ là 4200). Chúng ta Tr c hoành ph i có kho ng giá tr t ỗ ả ộ ớ mu n chia làm m i kho ng có đ l n là 300 nh v y c n thi ị ừ ố Chúng ta cũng mu n ghi giá tr t gram.
(cid:0) ụ ượ Tr c hoành đ c ghi chú là "trong luong so sinh (gram) cua 641 tre"
(cid:0) ụ ế ả ị ị
Tr c tung có kho ng giá tr là 0 đ n 0.3, ghi nhãn cho các giá tr và các nhãn này cách nhau 0.1
(cid:0) ụ ượ ỉ ệ ả Tr c tung đ ứ c ghi chú là "t l " (ch không ph i là fraction).
ả ệ ụ ướ ể ự ụ ư c đ th c hi n chia kho ng và ghi chú cho tr c hoàng (tr c X) nh sau:
ấ ể Ở ộ ụ ậ ả h p văn b n Title, nh p vào ghi chú là
ướ ụ ể ắ ủ ả ộ ộ ố ố ố ầ ả
Các b ướ B c 1: Nh p vào Tab Xaxis ậ ướ B c 2: Đ nh p ghi chú cho tr c hoành, "trong luong so sinh (gram) cua 641 tre" ậ ở ộ ả B c 3: Đ chia kho ng cho tr c hoành, h p văn b n Rule, nh p vào 600(600)4800. ắ Nguyên t c c a quy t c này là: S đ u thang đo (Đ r ng kho ng chia) S cu i thang đo.
ướ ể ự ụ ư ụ ệ ả Các b c đ th c hi n chia kho ng và ghi chú cho tr c hoàng (tr c Y) nh sau:
ụ ấ ể ướ ướ Ở ộ ả ậ h p văn b n Title, nh p vào ghi chú là "Ti
ướ ụ ậ h p văn b n Rule, nh p vào 0(0.1)0.3. ả ể ắ ủ ả ộ ộ ố ố ố ầ
ở ố ử ổ ể ướ ệ ấ ấ B c 4: Nh p vào Tab Yaxis ậ B c 5: Đ nh p ghi chú cho tr c tung, le" ở ộ ả B c 6: Đ chia kho ng cho tr c hoành, ắ Nguyên t c c a quy t c này là: S đ u thang đo (Đ r ng kho ng chia) S cu i thang đo. B c 7: Nh p vào nút l nh OK cu i c a s đ hoàn t t
3
.
2
.
l
ä e æ T
1
.
0
600
1200
1800
2400
3000
3600
4200
4800
Troïng lö ôïng sô sinh (gram) c uûa 641 treû
ể ẽ ồ ị ể ấ ế ố tlsosinh có tuân theo ườ ng
ướ ử ụ 9. Chúng ta cũng có th v đ th xu t (pp plot) đ xem bi n s ố phân ph i bình th ẫ H ng d n: S d ng menu Graph – Distributional graph normal quantile plot
ệ ế ướ c sau:
ả
ỏ ỏ ướ ướ ử ổ ặ ư ể ư ế ế ấ ả ộ
ướ ướ ấ Khi c a s qnorm hi n ra, chúng ta ti n hành các b ộ B c 1: đ t con tr vào h p văn b n Variable ử ổ B c 2: đ a con tr vào c a s Variables và nh p vào bi n tlsosinh đ đ a bi n này vào h p văn b n Variable. ể ộ ấ B c 3: Đánh d u vào h p ki m: Show grid at percentiles: ệ B c 4: Nh p vào nút l nh OK
ả ư ế K t qu nh sau:
ố ẽ ậ ố ệ ế ng thì đ ậ ng chéo c a hình ch nh t (đ ố ằ ở ố ệ ườ ườ ố ủ ườ ữ ng cong phân ph i n m ớ ng nét đ m) s trùng v i ở xác ươ ng ng chéo.
ườ ng cong phân ph i (đ ả ẳ ng th ng m nh). N u phân ph i l ch âm thì ế ườ bên trái đ ng chéo. N u phân ph i l ch d ả ườ ố ẽ ằ ở bên ph i đ ố ớ ố ườ ệ ậ ố ố ự ườ ộ ố ế N u phân ph i bình th ườ đ ườ ấ su t 0,5 đ ườ ấ ở xác su t 0,5 đ thì ng cong phân ph i s n m ườ ự ộ ơ ộ ố ủ ế ng cong phân ph i l n h n m t (1) có nghĩa là phân ph i th c N u đ d c c a đ ỏ ơ ườ ơ ng cong phân ph i nh h n nghi m tăng ch m h n phân ph i bình th ơ ệ ườ ng. m t (1) có nghĩa là đ ế ng, n u đ ng cong th c nghi m tăng nhanh h n phân ph i bình th
5 1
.
1
.
n o
i t c a r F
5 0
.
0
1000
2000
3000
4000
5000
tro ng luong so sinh (gram)
ị ệ ở ố ủ ơ ơ ố ọ kho ng tr ng l ẩ Ở ả ượ ấ ng th p, phân ượ ọ ng cao kho ng tr ng l ả ng s sinh tăng ch m h n phân ph i chu n. ơ ượ ơ ươ ẩ ố ơ ư ậ ọ Nh v y, phân ph i c a tr ng s sinh b l ch trái và ố ọ ph i tr ng l ọ tr ng l ơ ậ ng s sinh tăng h i nhanh h n phân ph i chu n.

