Khởi động Stata

ở ộ ươ ằ ấ

ở ộ 1. Kh i đ ng Stata Kh i đ ng ch

ng trình STATA b ng cách nh p vào nút Start   ::   All Programs   ::

ặ ấ ể ượ ng (icon) Stata 8 trên màn hình Medistat   ::   Stata 8   ho c nh p vào bi u t Desktop.

giao di n c a ch

ng trình Stata

ả ệ ủ

ệ ủ ẽ ệ

ươ ớ

ử ổ

ề ớ ữ

2. Mô t Giao di n c a Stata s  hi n ra v i 3 thanh và 4 c a s :  3 thanh bao g m:ồ 1. Thanh tiêu đ   v i dòng ch  "Intercooled Stata 6.0"

ở ậ ệ ỉ ớ ố ệ ườ ọ ố ở 2. Thanh menu v i các menu File (đóng m  t p tin); Edit (hi u ch nh); Prefs (Tùy ồ ọ ch n); Data (S  li u) Graphics (Đ  h a)   Statistics  (Th ng kê) User (Ng i dùng) ợ ử ổ Window (m  ra các c a s ) và Help (Tr  giúp)

ụ 3. Thanh công c  (toolbar)

ụ ồ ụ

Thanh công c  g m 12 nút công c  (1­ Open file; 2­ Save; 3­ Print Results; 4­ Begin   (Close) log; 5­ Start Viewer (Bring Viewer to Front) ; 6­  Bring results window to  Front 7­Bring graph windows to Front; 8­ Do­file Editor; 9­Data Editor; 10­Data  Browser; 11­Clear  ­ more ­ Condition và 12­ Break)

ụ ư ủ ừ Ý nghĩa c a t ng công c  nh  sau:

ở ậ

ư ậ

ế 1­ Open file (m  t p tin)             2­ Save (L u t p tin) ả                       3­ Print Results (In k t qu )

ế ế ả ả ắ ầ                     4­ Begin (Close) log: (B t đ u (K t thúc) ghi biên b n k t qu )

ắ ầ ử ụ ư ử ổ ế ử ổ ả

ư ử ổ ồ ọ c) ướ 5­ Start Viewer (Bring Viewer to Front) : B t đ u s  d ng c a s  Viewer ướ              6­  Bring results window to Front : (Đ a c a s  k t qu  ra tr                        7­Bring graph windows to Front (Đ a c a s  đ  h a ra tr c)

ạ ậ ươ 8­ Do­file Editor: (Biên so n t p tin ch ng trình ­ do file)

ậ ố ệ ớ ố ệ ữ

ữ ể ế ụ ư ệ ự ệ ươ   ng

ươ ư ậ ử     9­Data Editor: Biên t p s  li u (s a ch a, thêm b t s  li u) ử ệ ố ệ             10­Data Browser: Duy t s  li u (xem nh ng không s a ch a)                      11­Clear  ­ more ­ Condition (Xóa l nh more đ  ti p t c th c hi n ch trình)                                12­ Break: (Ng ng t p tin ch ng trình)

ố ử ổ ệ ề ồ ồ t kê theo ng ồ c chi u kim đ ng h  bao g m

ượ ử ổ ệ B n c a s  li ử ổ 1. C a s  Command (c a s  l nh)

ử ổ ế ử ổ ả 2. C a s  Result (c a s  K t qu )

ử ổ ư ử ổ ữ 3. C a s  Review (c a s  L u tr )

ử ố ế ố ử ổ 4. C a s  Variables (c a s  Bi n s )

ệ ệ

ươ

ng trình Stata

ể ự ể ươ ử ụ ử ổ ệ ộ ể ỏ ệ   ng trình Stata: Dùng bàn phím đ  gõ l nh ơ   ọ  chu t đ  ch n các trình đ n ệ

ể ự 3. Cách cách đ  th c hi n l nh trong ch ệ ệ Có hai cách  đ  th c hi n l nh trong ch vào c a s  l nh (Stata Command) hay s  d ng con tr ồ ọ (menu) giao di n đ  h a (Graphic Interface) ể

ệ Dùng bàn phím đ  gõ l nh

ệ ự

ớ ử ụ ươ ể ợ ủ ộ ng pháp này có th  không thích h p cho ng ử  ệ   ấ ả t c  các l nh ụ c a l nh. Tuy ủ ệ     i m i s  d ng do nó ườ ủ ườ ệ ả i dùng ph i thu c các câu l nh và cú pháp c a nó

ử ổ ệ ể Dùng bàn phím đ  gõ l nh vào c a s  l nh (Stata Command). Đây là cách s ệ t ệ ườ ụ i chuyên nghi p vì nó cho phép th c hi n  d ng Stata c a ng ầ ủ ớ đ y đ  các ch c năng ph ủ c a Stata m t cách nhanh chóng v i  nhiên ph ỏ đòi h i ng ộ ớ ỏ ộ ệ ồ ọ Con tr  chu t v i giao di n đ  h a (Graphic Interface)

ộ ự ố ệ ệ ệ ươ ươ ằ ố ệ ễ ử ụ ng pháp d  s  d ng nên s  đ ẽ  ử    c  u tiên trình bày ộ ệ ể Có th  dùng chu t th c hi n các l nh nh m thao tác s  li u (menu Data), v ồ ị đ  th  (menu Graphics) và phân tích s  li u (menu Statistics). Ph ng pháp s ẽ ượ ư ụ d ng chu t và menu là ph trong tài li u này.

ư ạ ế

ả i k t qu  phân tích

ế ử ổ ượ ể ế t d c cho phép xem l ế ử ổ ả ỉ ư ạ ả ữ ạ ữ i toàn b  k t qu  phân tích chúng ta c n ph i m  c a s ườ ố ư ấ ộ ế ụ ằ ằ ở ị

4.  L u l ả ủ K t qu  c a phân tích đ ượ ọ thanh tr ẫ ầ nh m l n cho ng ế n u chúng ta mu n l u tr  l log b ng cách nh p vào nút công c  Stata Log n m v  trí th  t

ộ   ể ệ c th  hi n trên c a s  Stata Result và c a s  này có m t ữ ạ   i nh ng k t qu  phân tích cũ. Tuy nhiên đ  tránh gây ả ầ ấ ử ổ i nh ng k t qu  g n nh t. Do đó   i phân tích, c a s  này ch  l u l ở ử ổ  ầ ứ ư ừ    trên thanh  t ả  trái

ể ậ ở ủ ậ   . Khi đó c a s  Open Stata Log m  ra, chúng ta có th  nh p tên c a t p ử ổ ộ ữ ả công c  ụ ư tin l u tr  (log file) vào h p văn b n File name.

ọ ậ ộ s  chúng ta ch n t p tin này là "baitap.smcl" hãy gõ "baitap" vào h p File Name

ượ ả ả   phân ử ố ế   qu ể ư l u ẽ ệ ẽ s tích đ c ạ t i ả ử Gi ấ ồ r i nh p OK. ế ằ t r ng  biên Khi đó trên c a s  k t qu  (Stata results) s  hi n ra thông báo đ  cho bi ậ ế ả b n   k t t p   tin   "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl"

. log using "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl" ----------------------------------------------------------------------------- - log: D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl

log type: smcl opened on: 10 Oct 2004, 12:01:34

ể ự ệ ạ ướ Sau đó b n có th  th c hi n các b c phân tích.

ạ ế ả ụ ấ ả  (k t qu  phân tích) hãy nh p vào nút công c   log ộ ầ ữ ể ệ ử ổ Khi mu n ố xem l i biên b n m t l n n a đ  hi n ra c a s  Stata Log Options.

ọ ệ ể ấ ọ

ấ ế ệ ả ả ấ ứ  vi c ghi biên b n (k t qu  phân tích) hãy nh p vào nút công c ụ Sau đó ch n vào nút ch n View snapshot of log file và nh p vào nút l nh OK đ  xem biên b n. ả Khi mu n ố ch m d t

ử ổ ể ệ log đ  hi n ra c a s  Stata Log Options.

ọ ọ ấ

ố ệ ở ậ ệ ườ ử ụ ướ ỏ ấ ế ế ể ố i s  d ng Stata có kinh nghi m sau khi m  t p tin s  li u luôn luôn ả  c khi ti n hành các phân tích th ng kê đ  không b  m t các k t qu Sau đó ch n vào nút ch n Close log file và nh p vào nút OK. ờ L i khuyên: Ng ở ậ m  t p tin log tr ủ c a quá trình phân tích.

ẫ ạ ươ ả ố ệ ng này s  h ng d n b n ph ng pháp mô t ư ụ ậ ặ

Mô tả số liệu với Stata 8.0 for Windows ề ầ ớ  s  li u v i ph n m m Stata 8.0 ạ cài đ t các t p tin

ướ ả ố ệ ự ệ ầ ng tr c khi mô t ườ ố ệ ướ  s  li u chúng ta c n th c hi n b ệ ẩ ẩ ở ậ ồ ị ữ ụ ứ ố ệ ố ệ ệ ạ ủ ế ệ ầ ủ ứ ế ố ạ ẫ ầ ị ế ả ủ ơ ố ệ ố ệ ể ệ ệ ế ọ ẽ ướ ươ Ch ộ ố ệ ivf.dta có trong th  m c C:\DATA sau khi b n  ử ụ s  d ng b  s  li u  ẫ ố ệ s  li u m u. ệ   ị c chu n b  và vi c Thông th ố ệ   thao tác s  li u (data processing). Công tác chu n b  bao g m vi c m  t p tin s  li u, ế   ả ố ệ ả ở ậ m  t p tin log (Open log file), kh o sát s  li u có bao nhiêu b n ghi và có nh ng bi n ứ   ề ươ ư ố s  nào cũng nh  nghiên c u đ  c ng nghiên c u (ch  y u là m c tiêu nghiên c u) ệ ể   đ  giúp vi c phân lo i bi n s . Vi c thao tác s  li u là vi c rà soát s  li u có b  sai sót ế ố ớ   hay nh m l n gì hay không, t o bi n s  m i theo yêu c u c a phân tích và ti n hành ể vi c dán nhãn s  li u đ  giúp cho vi c hi u rõ h n s  li u và đ c k t qu  c a phân   ố tích th ng kê.

ướ ướ ở ộ c tiên chúng ta hãy kh i đ ng Stata theo cách đã h ch

ệ ế ậ ị

ố ệ

ở ậ ở ậ

ử ổ ở ộ ằ ẫ ở ươ Kh i đ ng ở ộ   ng d n  Tr ng  ế   ậ ẩ ự Stata. Sau đó th c hi n các bài t p 1 đ n 3 cho công tác chu n b  và các bài t p 4 đ n 6 cho công tác thao tác s  li u.  1­ M  t p tin ivf_v.dta và m  t p tin log Kh i đ ng c a s  Use New Data  b ng cách 1 trong 2 cách:

ụ ở ụ ầ ị v  trí đ u tiên trên thanh công c ).

ấ ọ ­ Nh n nút công c  m  file ( ­ Ch n menu File :: Open

ẽ ệ ử ổ ợ ả ộ ọ ư ụ ấ ộ ố ệ ườ ậ ng t p tin s  li u n m ể  th  m c C:\Data). Tìm t p tin s ấ ấ ậ ặ ệ ồ

ư ụ ậ ậ ể ở ậ ấ ộ ộ ế ự ệ ầ ớ ể  ấ Sau khi c a s  Use New Data s  hi n ra. Nh p vào mũi tên bên ph i h p Look in đ ọ ổ  đĩa thích h p và dùng con chu t nh p vào các th  m c đ  ch n th  m c có   ch n  ằ ở ư ụ ứ ố ệ ố  ch a s  li u (thông th ể ở ậ ệ   li u ivf_v.dta, nh p đúp vào tên t p tin này đ  m  t p tin (ho c nh p vào t p tin này ấ ể ậ   đ  tên t p tin r i vào h p File Name r i sau đó nh p vào nút l nh Open đ  m  t p tin). ẽ ượ ể ư   c th c hi n, c n nh  nh p vào nút Đ  l u tr ơ ả i toàn b  k t qu  phân tích s  đ ữ ạ  l

ể ắ ầ ằ ị ụ ả ứ ư ừ  t ẽ ệ ạ đ  b t đ u log   ể ụ ở  trên thanh công c   ộ ư ụ ư ủ ậ ậ ọ công c  Stata Log n m v  trí th  t  trái  ế k t qu  (begin log).   Máy tính s  hi n ra h p tho i Begin Logging Stata Output đ chúng ta ch n  tên t p tin (File name) và th  m c l u (Save In) c a t p tin log.

ư ụ ớ ố ư ậ ư ụ ậ Thí d  chúng ta mu n l u t p tin log v i tên là ivf_v.smcl vào th  m c c:\data; chúng ta nh p vào các thông tin nh  trên.

ế ố ủ ậ ứ ứ ụ ể

ế ố ứ ể ệ ấ ẫ ấ ế ố ủ ố ệ ạ   ả 2. Kh o sát các bi n s  c a t p tin và nghiên c u m c tiêu nghiên c u đ  phân lo i bi n sế ố ể ướ t kê các bi n s  chúng ta có th  nh n phím ch c năng F3 hay H ng d n: Đ  xem li ử ụ s  d ng menu (nh p vào menu Data :: Describe data  ::  Describe variable  in memory) ể đ  xem các bi n s  c a s  li u

. describe

Contains data from C:\DATA\ivf_v.dta

obs: 641

vars: 7 15 Aug 2006 15:27

size: 20,512 (99.8% of memory free)

-------------------------------------------------------------------------------

storage display value

variable name type format label variable label

-------------------------------------------------------------------------------

maso float %9.0g ma so

tuoime float %9.0g tuoi me (nam)

tangha float %9.0g tang huyet ap thai ki - 1=tang

ha, 0=khong tang ha

tuoithai float %9.0g tuoi thai (tuan)

gioi float %9.0g gioi tinh tre - 1=trai, 0=gai

tlsosinh float %9.0g trong luong so sinh (gram)

nghenghiep float %9.0g nghe nghiep me - 1=tu do,

2=cong nhan, 3=vien chuc

-------------------------------------------------------------------------------

Sorted by: maso

ế ố ệ ể ở Chúng ta có th  xem danh sách các bi n s  li t kê sau:

ủ ố ệ ế ậ ứ ng nghiên c u chúng ta bi đ  c ừ t đây là t p tin c a s  li u 641 đ a tr ệ ố s  t c sinh t ẹ ụ ổ ưở ứ ả ẻ  ứ ụ ớ  bà m  th  thai trong  ng nghi m (in­vitro fertilisation)  v i m c tiêu   ọ   ng lên tr ng ọ ả ử ừ ề ươ Gi ượ đ nghiên c u là xem tu i thai và tăng huy t áp trong thai kì có  nh h ượ l ế ả ố ệ ượ i s  li u đ ng thai hay không. Cách lí gi c minh h a

ủ ế STT Tên bi nế Ý nghĩa c a bi n

ộ ụ ượ ộ ị ị ế ố ạ Phân lo i bi n s : ậ (Đ c   l p   hay   Ph   thu c)   –   (Đ nh tính hay đ nh l ng)

1 Maso Mã số

ổ ủ ổ 2 Tuoime ẹ Tu i c a m  (năm tu i)

ế 3 Tangha Tăng huy t áp thai kì 1= có 0= không

ầ ổ 4 Tuoithai Tu i thai (tính theo tu n)

ớ ủ 5 Gioi Gi ẻ i tính c a tr  1=trai 0=gái

ượ 6 Tlsosinh ng   sinh   tính   theo ọ Tr ng   l grams

ủ ề ệ ẹ 7 ự Nghenghiep Ngh   nghi p   c a   m   1=t do 2=công nhân 3=viên ch cứ

ố ệ ể

ướ ế ẫ ể ằ 3. Làm th  nào đ  xem s  li u  ố ệ H ng d n: Có th  xem s  li u b ng 2 cách:

ệ ị ừ ủ ụ (v  trí 11 tính t bên trái c a thanh công c )

­ Dùng nút l nh Data Browser  ­ Dùng menu  Data  ::  Data browser (read­only editor)

ử ụ ướ ươ cho phép nhìn s  li u trong l i (nh  các ô c a ch ủ ủ ổ ế ố ử ụ ư ể ư ố ệ   S  d ng Data Browser  ng trình ấ   ố ệ . Mu n nhìn s  li u ra c a s  k t xu t ố ệ Excel) nh ng nó không cho phép in s  li u (output) đ  sau đó in ra hãy s  d ng menu Data:: Describe Data :: List data.

ố t

ự ẫ ả ấ ả t c  các bi n s  trong b  s  li u này: ố ả ố ị ượ ị ự ả

ộ ệ ấ ủ ố ầ ị ế ể ế ố ộ ố ệ ệ 4.  Hãy th c hi n th ng kê mô t ế ế ướ ướ ng và c tiên chúng ta ph i xác đ nh bi n s  nào là bi n s  đ nh l   H ng d n: tr ế ố ố   ố ệ ế ố ị ế ố  cho các bi n s : đ i bi n s  nào là bi n s  đ nh tính. Sau đó th c hi n th ng kê mô t ể ể ệ ệ ự ẩ   ượ ế ớ ng, th c hi n l nh  summarize đ  đ  có trung bình và đ  l ch chu n, v i bi n đ nh l ế   ả ệ ệ ự ị ố ớ đ i v i bi n đ nh tính th c hi n l nh tab1 đ  có b ng phân ph i t n su t c a các bi n s . ố

ộ ố ệ ượ ế ế ị Trong b  s  li u này có các bi n tuoime, tuoithai, tlsosinh là bi n đ nh l ả ế ố ử ụ ể

ng.  bi n s  này chúng ta s  d ng menu Statistics  ::  Summaries, tables, & tests  :: Statistics. Đ  mô t Summary

ộ ạ ệ ự ướ c sau:

ỏ ặ

ể ế ầ ấ vào c a s  Variables, và nh p vào các bi n c n mô t ướ ướ ố ả ử ổ ể ế ệ ấ ộ ả  ả   tuoime, tuoithai, tlsosinh)  đ  tên các bi n này xu t  hi n trên h p văn b n

ướ ệ ấ ệ Sau khi h p tho i Summarize hi n ra, th c hi n các b ộ B c 1: Đ t con tr  vào h p văn b n Variables ỏ B c 2: Di chuy n con tr th ng kê ( Variables B c 3: Nh p vào nút l nh OK

ả ượ ư K t qu  đ ế c trình bày nh u sau: . summarize tuoime tuoithai tlsosinh

Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- tuoime | 641 33.97192 3.87046 23 43 tuoithai | 641 38.68725 2.329931 24.69 42.35 tlsosinh | 641 3129.137 652.7827 630 4650

ế ế ớ Các bi n s  đ nh tính bao g m tang_ha (tăng huy t áp), gioi (gi ố ị ề ế ố ị ồ ẹ ể ắ ệ ủ ử ụ ẻ   ủ i tính c a tr ),   nghenghiep (ngh  nghi p c a m ). Đ  tóm t t các bi n s  đ nh tính này (tang_ha, gioi,   nghenghiep) chúng ta s  d ng menu  Statistics  ::  Summaries, tables & test  ::  Tables  :: Multiple one­way tables.

ồ ướ ệ c th c hi n g m:

ự ư ộ ỏ

ả ổ ử ấ ỏ vào   c a   s   Variables   và   nh p   vào   các   bi n ế tang_ha,   gioi, ế ả ộ

ư ể ư ấ ướ ể ệ Các b ướ ­ B c 1: đ a con tr  vào h p văn b n categorical variable(s) ướ ­   B c   2:   đ a   con   tr nghenghiep đ  đ a các tên bi n này  vào h p văn b n Categorical variables(s) ấ ­ B c 3: nh p nút l nh OK đ  hoàn t t

. tab1 tang_ha gioi nghenghiep

-> tabulation of tang_ha

tang huyet | ap thai ki | - 1=tang | ha, 0=khong | tang ha | Freq. Percent Cum. ------------+----------------------------------- 0 | 552 86.12 86.12 1 | 89 13.88 100.00 ------------+----------------------------------- Total | 641 100.00

-> tabulation of gioi

gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum.

------------+----------------------------------- 0 | 315 49.14 49.14 1 | 326 50.86 100.00 ------------+----------------------------------- Total | 641 100.00

-> tabulation of nghenghiep

nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------- 1 | 104 16.22 16.22 2 | 238 37.13 53.35 3 | 299 46.65 100.00 ------------+----------------------------------- Total | 641 100.00

ầ ị ả ế ệ ế ư ư ọ ạ ả ố ế ệ ố ự ả ị ả ọ ạ ế ữ ả ệ ườ ế ố ị ệ ấ ộ ự ố ệ

ị ố ố ệ ệ ố i làm th ng kê chuyên nghi p và ng ự ướ ệ ườ ố ứ ỏ ư ậ ợ i ích do nó đem l ự ệ

ả ệ ướ ự ạ c: t o nhãn (define label value) ị ị ủ   ắ ố ệ t s  li u nh  trên là đ t yêu c u. Tuy nhiên vi c mã  hoá các giá tr  c a 5. Các tóm t ấ ủ ầ ế ố   bi n s  khi n cho vi c đ c b ng b ng t n su t c a bi n s  danh đ nh (nh  gioi và ữ ườ   nghenghiep) b  khó khăn (nh t là cho nh ng ng i không tr c ti p làm th ng kê hay ố ờ   i làm th ng kê i k t qu  sau m t kho ng th i gian dài). Do đó nh ng ng ph i đ c l ệ chuyên nghi p luôn luôn  th c hi n ghi chú (dán nhãn) cho các bi n s  đ nh tính.  Hãy   ệ th c hi n vi c dán nhãn s  li u. H ng d n: ệ ệ   ư t Vi c dán nhãn cho các giá tr  mã hóa là vi c làm t n công nh ng nó giúp phân bi ườ ặ   i làm th ng kê không chuyên nghi p. M c ng ầ   ạ ượ t qua công s c b  ra vì v y chúng ta c n i v dù t n công nh ng l ệ ph i th c hi n vi c dán nhãn này. ệ ị ế ố ượ Vi c dán nhãn giá tr  bi n s  đ c th c hi n qua 2 b và dán nhãn cho giá tr  (Assign value label to variable).

ử ổ ể ạ ử ụ ẽ ượ ­ T o nhãn sex, tang_ha, nhãn nghenghiep Đ  t o nhãn s  d ng menu Data ::  Labels & Notes :: Define value label. C a s  Define value label s  đ ệ c hi n ra.

ắ ữ ả ử ố ạ ướ ụ ể ư  c c  th  nh s  chúng ta mu n t o nhãn sex theo quy t c 1 =nam và 2=n , các b

ộ ấ ậ ệ ệ

ộ ả ướ ướ

ậ ệ ẽ ệ

ả ệ ộ ướ ướ ­ B c 3: nh p vào nút l nh OK khi đó h p nh p li u Add value s  hi n ra ­ B c 4: Nh p

ướ ả

ủ ộ ướ ệ ệ ậ ậ ộ

ướ ộ

ẽ ệ ệ ậ

ả ộ

ướ ướ ướ ả

Gi sau: ể ệ ­B c 1: nh p vào nút l nh Define đ  hi n ra h p nh p li u Define new lable ­ B c 2: gõ  sex vào h p văn b n Label name ấ ộ ậ 1 vào h p văn b n value  ộ ậ nam vào h p văn b n Text ­ B c 5: nh p  ệ   ấ ­ B c 6: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p li u ấ ế Add Value bi n m t ả ấ ­ B c 7: Nh p vào nhãn  sex trong h p văn b n Defien label names ể ộ ấ ệ ­ B c 8: Nh p vào nút l nh Add đ  h p nh p li u Add value s  hi n ra ậ ­ B c 9: Nh p 0 vào h p văn b n value  ậ nữ vào h p văn b n Text ộ ­ B c 10: nh p  ệ ấ ướ ủ ệ ậ ộ ế ệ ậ   ộ ­ B c 11: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ấ li u Add Value bi n m t

ấ ể ệ ể ạ ể ế ụ ạ ủ ộ ệ

ủ ộ Sau đó có th  nh p vào nút l nh Close (c a h p tho i Define value labels) đ  thoát ra ạ ấ hay nh p vào nút l nh Define (c a h p tho i Define value labels) đ  ti p t c t o nhãn tang_ha.

ướ ụ ể ể ạ c c  th  đ  t o nhãn tang_ha g m:

ệ ệ ấ ậ ộ

ồ Các b ể ệ ướ ­B c 1: nh p vào nút l nh Define đ  hi n ra h p nh p li u Define new lable ả ướ ­ B c 2: gõ  tang_ha vào h p văn b n Label name ấ ẽ ệ ướ ệ ệ ậ ộ ­ B c 3: nh p vào nút l nh OK khi đó h p nh p li u Add value s  hi n ra

ầ ư ế ặ ợ ể ế ặ ớ ớ ư ườ ớ ng h p trên ta đ t tên   ụ   ế ể i) ho c tên nhãn có th  trùng v i tên bi n (thí d  ta ế ể ặ C n l u ý: tên nhãn có th  khác v i tên bi n (thí du nh  tr nhãn là sex trong khi tên bi n là gi có th  đ t tên nhãn là tang_ha cho bi n tăng ha).

ộ ả ướ ­ B c 4: Nh p

ướ ả ộ

ủ ộ ướ ệ ậ ậ ộ

ướ ả ộ ậ 1 vào h p văn b n value  ậ huyet ap tang vào h p văn b n Text ­ B c 5: nh p  ệ   ệ ấ ­ B c 6: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p li u ế ấ Add Value bi n m t ấ ­ B c 7: Nh p vào nhãn tang_ha  trong h p văn b n Define label names

ẽ ệ ể ộ ướ ệ ệ ấ ậ ­ B c 8: Nh p vào nút l nh Add đ  h p nh p li u Add value s  hi n ra

ướ ộ ­ B c 9: Nh p

ướ ả ộ

ậ 0 vào h p văn b n value  ả ậ huyet ap bt vào h p văn b n Text ­ B c 10: nh p  ậ ấ ướ ệ ủ ệ ộ ệ ế ậ   ộ ­ B c 11: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ấ li u Add Value bi n m t

ể ế ụ ạ ủ ệ ấ ạ ộ Đ  ti p t c t o nhãn nghenghiep ta nh p vào nút l nh Define (c a h p tho i Define value labels).

ấ ệ ệ ậ ộ

ướ ướ ộ

ể ệ ­B c 1: nh p vào nút l nh Define đ  hi n ra h p nh p li u Define new lable ả nghenghiep vào h p văn b n Label name ­ B c 2: gõ  ấ ẽ ệ ướ ệ ệ ậ ộ ­ B c 3: nh p vào nút l nh OK khi đó h p nh p li u Add value s  hi n ra

ộ ướ ả ­ B c 4: Nh p

ướ ả

ủ ộ ệ ướ ệ ậ ậ ộ ậ 1 vào h p văn b n value  ộ ậ tu do vào h p văn b n Text ­ B c 5: nh p  ấ ế ệ   ­ B c 6: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p li u ấ Add Value bi n m t

ộ ướ ả

ẽ ệ ậ

ướ ướ ộ ­ B c 8: Nh p vào nút l nh Add đ  h p nh p li u Add value s  hi n ra ­ B c 9: Nh p

ướ ả ộ

ấ nghenghiep trong h p văn b n Define label names ­ B c 7: Nh p vào nhãn  ấ ệ ể ộ ệ ậ 2 vào h p văn b n value  ả ậ cong nhan vào h p văn b n Text ­ B c 10: nh p  ậ ấ ướ ủ ệ ệ ộ ế ệ ậ   ộ ­ B c 11: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ấ li u Add Value bi n m t

ẫ Ở ộ ế ụ ấ ọ nghenghiep, nh p vào ẽ ệ

ả ướ ­ B c 12:  ệ ậ nút l nh Add đ  h p nh p li u Add value s  hi n ra ộ ướ ­ B c 13: Nh p

ướ ộ

ướ ệ ệ ộ ế ệ ế h p Define label names v n ti p t c ch n nhãn  ể ộ ệ ậ 3 vào h p văn b n value  ả ậ vien chuc vào h p văn b n Text ­ B c 14: nh p  ủ ậ   ậ ấ ộ ­ B c 15: Nh p vào nút l nh OK c a h p nh p li u Add Value. Khi đó h p nh p ả ư ấ li u Add Value bi n m t. Ta có k t qu  nh  sau:

ướ ể ấ ệ ạ ệ ­ B c 16: Đ  hoàn t ấ t vi c t o nhãn ta nh n vào nút l nh Close

ị ế

ế ố ằ ượ ạ ị c nhãn, chúng ta hãy dán nhãn giá tr  cho bi n s  b ng cách dùng

Dán nhãn giá tr  (Assign value label) cho các bi n gioi, tang_ha, và nghenghiep Sau khi dã t o đ menu   Data ::  Labels & Notes :: Assign value label to variable

ế ệ ể ỗ ố ướ ạ ệ ộ ự Khi h p tho i labels value – Attach value label hi n ra đ  dán nhãn cho m i bi n s ầ c n th c hi n 4 b c sau:

ặ ư ỏ ỏ ấ ể ế ấ   ế gioi đ  tên bi n này xu t ộ ướ ướ ệ ả

ướ ả ỏ ộ ể sex trong h p văn b n Attach value label đ  dán nhãn

ư ế ấ ể ự ướ ệ ệ ệ ộ ­ B c 1: Đ t con tr  vào h p văn b n Variable ử ổ ­ B c 2: Đ a con tr  vào c a s  Variable và nh p vào bi n  hi n trên h p văn b n Variable. ­ B c 3: Đ a con tr  vào nhãn  sex vào tên bi n sex ­ B c 4: Nh p vào nút l nh Submit đ  th c hi n vi c dán nhãn.

ự ệ ươ ự ể ế ế ng t đ  dán nhãn tang_ha cho bi n tang_ha, hãy ti n hành ể ế ụ ướ Đ  ti p t c th c hi n t c sau: các b

ặ ư ỏ ỏ ấ ể ế ấ   ế gioi đ  tên bi n này xu t ộ ướ ướ ệ ả

ướ ả ộ ỏ ể sex trong h p văn b n Attach value label đ  dán nhãn

ư ế ấ ể ự ướ ệ ệ ệ ộ ­ B c 5: Đ t con tr  vào h p văn b n Variable ử ổ ­ B c 6: Đ a con tr  vào c a s  Variable và nh p vào bi n  hi n trên h p văn b n Variable. ­ B c 7: Đ a con tr  vào nhãn  sex vào tên bi n sex ­ B c 8: Nh p vào nút l nh Submit đ  th c hi n vi c dán nhãn.

ệ ươ ự ể ế ng t ế    đ  dán nhãn nghenghiep cho bi n nghenghiep, hãy ti n ể ế ụ Đ  ti p t c th c hi n t ướ hành các b ự c sau:

ộ ỏ ặ

ấ ư ế ể ế gioi  đ  tên bi n này ộ ả ệ

ỏ ướ ướ ấ ướ ể ả ộ sex trong h p văn b n Attach value label đ  dán nhãn

ể ự ầ ư ướ ệ ệ ệ ệ ướ ệ ể ấ ử ư ổ ệ ấ ế ụ ệ ử ổ ả ­ B c 9: Đ t con tr  vào h p văn b n Variable ử ổ ỏ ­ B c 10: Đ a con tr  vào c a s  Variable và nh p vào bi n   xu t hi n trên h p văn b n Variable. ư ­ B c 11: Đ a con tr  vào nhãn  ế sex vào tên bi n sex ữ   ấ ­ B c 12: Nh p vào nút l nh OK đ  th c hi n vi c dán nhãn. C n l u ý, trong nh ng ầ c chúng ta nh p vào nút l nh submit đ  hoàn thành vi c dán nhãn l n dán nhãn tr   ế   nh ng   không   đóng   c a   s   label   values.   Sau   khi   dán   nhãn   nghenghiep   cho   bi n ầ nghenghiep, chúng ta không c n dán nhãn ti p t c nên chúng ta nh p vào nút l nh OK   ể đ  đóng c a s  label values sau khi hoàn thành vi c dán nhãn.

ấ ố ầ ế ố ị

ế ướ

ượ c dán nhãn bao g m ồ tang_ha  sex matagegp gestcat. Để  ử ụ   tang_ha  sex matagegp gestcat) chúng ta s  d ng ả ậ 6. L p b ng phân ph i t n su t cho các bi n s  đ nh tính sau khi đã dán nhãn cho các bi n này. ẫ H ng d n:  ố ị ế Các bi n s  đ nh tính đã đ ố ị ế ắ t các bi n s  đ nh tính này ( tóm t menu  Statistics  ::  Summaries, tables & test  ::  Tables  ::  Multiple one­way tables.

ạ ướ ế ệ ộ ộ ặ c (1) đ t con tr ế ố ế ể ọ ệ ả ẽ ư ệ ấ ấ ỏ  Khi h p tho i tab1 – One­way tables hi n ra, chúng ta ti n hành 3 b ử ổ ấ   vào h p Categorical value (2) Nh p vào c a s  variable đ  ch n các bi n s  ti n hành ế phân tích và (3) Nh p vào nút l nh OK. K t qu  s  xu t hi n nh  sau:

. tab1 gioi tang_ha nghenghiep

-> tabulation of gioi

gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum. ------------+----------------------------------- gai | 315 49.14 49.14 trai | 326 50.86 100.00 ------------+----------------------------------- Total | 641 100.00

-> tabulation of tang_ha

tang huyet ap | thai ki - | 1=tang ha, |

0=khong tang | ha | Freq. Percent Cum. --------------+----------------------------------- huyet ap bt | 552 86.12 86.12 huyet ap tang | 89 13.88 100.00 --------------+----------------------------------- Total | 641 100.00

-> tabulation of nghenghiep

nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------- tu do | 104 16.22 16.22 cong nhan | 238 37.13 53.35 vien chuc | 299 46.65 100.00 ------------+----------------------------------- Total | 641 100.00

ủ ế ọ ượ ơ ng s  sinh (tlsosinh)

ả ử ụ ẽ ổ ứ ồ  ch c đ  (histogram) c a bi n tr ng l 7. V  t ướ ẫ H ng d n: ể ẽ ổ ứ ồ Đ  v  t ch c đ , ta ph i s  d ng menu Graphics :: Histogram

ự ệ ạ ộ ướ ệ Khi h p tho i histogram hi n ra, chúng ta th c hi n các b c sau:

ấ ế ế ặ ư ể ư ỏ ỏ ướ ướ ộ ử ổ ộ

ị ằ ể ướ ị ổ ứ ồ ẽ ắ ầ ừ  ch c đ  s  b t đ u t giá tr  600 (Lower limit ế

ướ ị ằ ả ộ ộ ấ   ậ ỉ ệ ủ  c a các kho ng giá tr  b ng cách nh p ỗ ả ế ổ ứ ồ ẽ t t ch c đ  s  ghi nh n t  l

B c 1: đ t con tr  vào h p văn b n Variable B c 2: đ a con tr  vào c a s  Variables và nh p vào bi n tlsosinh đ  đ a bi n này ả vào h p văn b n Variable. ướ B c 3 – B c 4: nh m đ  xác đ nh t of first bin) và m i kho ng ti p theo (bin) có đ  r ng là 300 (Width of bins) B c 5: Cho bi ọ vào nút ch n Fraction. ế ể ệ ấ ọ ậ ộ ủ ấ ệ ữ ố ọ ố ố ấ ư

ầ (Fraction) = T n su t (Frequency) / C  m u (N)

ỉ ệ ậ ộ ỡ ẫ ủ ộ ộ ỉ ệ ả ế   ố N u mu n th  hi n m t đ  c a phân ph i, nh p vào nút ch n Density, n u ể ệ ầ   mu n th  hi n t n su t thì nh p vào nút ch n Frequency. M i liên h  gi a các ố hàm phân ph i này nh  sau: T  l M t đ  (Density) = T  l ấ  (Fraction) / Đ  r ng c a kho ng chia (Width of bins)

ả ế ẽ ượ ế K t qu  ti p theo s  đ c trình bày trong hình sau.

5 2

.

2

.

5 1

.

n o

i t c a r F

1

.

5 0

.

0

1000

2000

3000

4000

5000

trong luong so sinh (gram)

ồ ị ố ố ệ ủ ạ ụ ể ệ ả ổ ả ử ụ ả ố ư ụ ả ư ệ ầ ấ 8. Đ  th  này cho chúng ta th y hình d ng c a phân ph i s  li u, tuy nhiên chúng ta   ụ   ệ cũng có th  thay đ i th c hi n vi c chia kho ng cho tr c hoành, ghi chú cho tr c ự   hoành, chia kho ng cho tr c tung và ghi chú cho tr c tung. Gi  s  chúng ta mu n th c hi n các yêu c u chia kho ng và ghi chú nh  sau:

(cid:0) ả ế ụ ố ư ậ ầ ả ả ế t ph i có 14 kho ng. ả ị ế ỗ 600 đ n 4200 và m i nhãn giá tr  cách nhau 600 ộ ị ừ  600 đ n 4800 (biên đ  là 4200). Chúng ta  Tr c hoành ph i có kho ng giá tr  t ỗ ả ộ ớ mu n chia làm m i kho ng có đ  l n là 300 nh  v y c n thi ị ừ ố Chúng ta cũng mu n ghi giá tr  t gram.

(cid:0) ụ ượ Tr c hoành đ c ghi chú là "trong luong so sinh (gram) cua 641 tre"

(cid:0) ụ ế ả ị ị

Tr c tung có kho ng giá tr  là 0 đ n 0.3, ghi nhãn cho các giá tr  và các nhãn này  cách nhau 0.1

(cid:0) ụ ượ ỉ ệ ả Tr c tung đ ứ c ghi chú là "t  l " (ch  không ph i là fraction).

ả ệ ụ ướ ể ự ụ ư c đ  th c hi n chia kho ng và ghi chú cho tr c hoàng (tr c X) nh  sau:

ấ ể Ở ộ ụ ậ ả h p văn b n Title, nh p vào ghi chú là

ướ ụ ể ắ ủ ả ộ ộ ố ố ố ầ ả

Các b ướ B c 1: Nh p vào Tab X­axis ậ ướ B c 2: Đ  nh p ghi chú cho tr c hoành,  "trong luong so sinh (gram) cua 641 tre" ậ ở ộ ả   B c 3:  Đ  chia kho ng cho tr c hoành,   h p văn b n Rule, nh p vào 600(600)4800. ắ   Nguyên t c c a quy t c này là:  S  đ u thang đo (Đ  r ng kho ng chia)  S  cu i thang đo.

ướ ể ự ụ ư ụ ệ ả Các b c đ  th c hi n chia kho ng và ghi chú cho tr c hoàng (tr c Y) nh  sau:

ụ ấ ể ướ ướ Ở ộ ả ậ h p văn b n Title, nh p vào ghi chú là "Ti

ướ ụ ậ h p văn b n Rule, nh p vào 0(0.1)0.3.  ả ể ắ ủ ả ộ ộ ố ố ố ầ

ở ố ử ổ ể ướ ệ ấ ấ B c 4: Nh p vào Tab Y­axis ậ B c 5: Đ  nh p ghi chú cho tr c tung,  le" ở ộ ả B c 6:  Đ  chia kho ng cho tr c hoành,  ắ Nguyên t c c a quy t c này là:  S  đ u thang đo (Đ  r ng kho ng chia)  S  cu i thang đo. B c 7: Nh p vào nút l nh OK cu i c a s  đ  hoàn t t

3

.

2

.

l

ä e æ T

1

.

0

600

1200

1800

2400

3000

3600

4200

4800

Troïng lö ôïng sô sinh (gram) c uûa 641 treû

ể ẽ ồ ị ể ấ ế ố tlsosinh có tuân theo ườ ng

ướ ử ụ 9. Chúng ta cũng có th  v  đ  th  xu t (p­p plot) đ  xem bi n s   ố phân ph i bình th ẫ H ng d n: S  d ng menu Graph – Distributional graph ­ normal quantile plot

ệ ế ướ c sau:

ỏ ỏ ướ ướ ử ổ ặ ư ể ư ế ế ấ ả ộ

ướ ướ ấ Khi c a s  qnorm hi n ra, chúng ta ti n hành các b ộ B c 1: đ t con tr  vào h p văn b n Variable ử ổ B c 2: đ a con tr  vào c a s  Variables và nh p vào bi n tlsosinh đ  đ a bi n này vào h p văn b n Variable. ể ộ ấ B c 3: Đánh d u vào h p ki m: Show grid at percentiles:  ệ B c 4: Nh p vào nút l nh OK

ả ư ế K t qu  nh  sau:

ố ẽ ậ ố ệ ế ng thì đ ậ ng chéo c a hình ch  nh t (đ ố ằ ở ố ệ ườ ườ ố ủ ườ ữ ng cong phân ph i n m ớ   ng nét đ m) s  trùng v i ở  xác   ươ   ng ng chéo.

ườ ng cong phân ph i (đ ả ẳ ng th ng m nh). N u phân ph i l ch âm thì  ế ườ  bên trái đ ng chéo. N u phân ph i l ch d ả ườ ố ẽ ằ ở  bên ph i đ ố ớ ố ườ ệ ậ ố ố ự ườ ộ ố ế N u phân ph i bình th ườ đ ườ ấ su t 0,5 đ ườ ấ ở  xác su t  0,5 đ thì  ng cong phân ph i s  n m  ườ ự   ộ ơ ộ ố ủ ế ng cong phân ph i l n h n m t (1) có nghĩa là phân ph i th c N u đ  d c c a đ ỏ ơ   ườ ơ ng cong phân ph i nh  h n nghi m tăng ch m h n phân ph i bình th ơ ệ ườ ng. m t (1) có nghĩa là đ ế ng, n u đ ng cong th c nghi m tăng nhanh h n phân ph i bình th

5 1

.

1

.

n o

i t c a r F

5 0

.

0

1000

2000

3000

4000

5000

tro ng luong so sinh (gram)

ị ệ ở ố ủ ơ ơ ố ọ  kho ng tr ng l ẩ Ở ả ượ ấ ng th p, phân ượ ọ ng cao kho ng tr ng l ả ng s  sinh tăng ch m h n phân ph i chu n.  ơ ượ ơ ươ ẩ ố ơ ư ậ ọ Nh  v y, phân ph i c a tr ng s  sinh b  l ch trái và  ố ọ ph i tr ng l ọ tr ng l ơ ậ ng s  sinh tăng h i nhanh h n phân ph i chu n.