BÀI GI NG SPSS

SUY LU N C B N TRONG TH NG KÊ

Ậ Ơ Ả

(Basic Inferential Statistics)

THS. LÊ VĂN HÙNG

ĐT: 0906238311 – Email: hungolympia2001@gmail.com

4/23/14 1

N i dung

1

CHI-SQUARE

2

T

NG QUAN

(CORELATIONS)

ƯƠ

3

H I QUY

(REGRESSION)

1. CÁC KHÁI NI M Đ C TR NG C B N

Ơ Ả

Ư

ế

ộ ậ (independent variable)

ế

ả ổ ủ

ế ế ế

ộ ặ

1. Bi n đ c l p c l a ch n đ nghiên c u. Bi n đ c l p là m t đ c tính đ ể ượ ự ặ ộ ộ ậ thuy t là m t bi n không ph thu c vào c gi Bi n đ c l p đ ụ ế ộ ượ ộ ậ bi n khác, s bi n đ i c a nó có nh h ng chi ph i ho c gây ự ế ố ưở ả ra nh ng bi n đ i kéo theo ổ ế

m t bi n khác. ế

ở ộ

ế

ộ (dependent variable)

ế

ự ế ộ

ế

ế

ế ộ ậ

ế ố ộ

ọ ế

2. Bi n ph thu c Bi n ph thu c là m t bi n mà s bi n đ i c a nó ch u s chi ị ộ c g i là bi n ph ph i (đáp ng) c a 1 bi n khác. M t bi n đ ụ thu c khi giá tr c a nó tuỳ thu c vào giá tr c a bi n đ c l p. ộ Nó chính là hi u qu gi ủ

ổ ủ ượ ị ủ ộ ậ

đ nh c a bi n đ c l p. ế

ủ ị ủ ệ

ả ả ị

3 4/23/14

1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)

Ơ Ả

Ư

ế

3. M t ố (y u v _mode)

ế

ng là trung đi m c a kho ng đ ng

Y u v c a m t t p h p các đo l ộ ậ

ị ủ

ế

ườ

i đa hay trong tr

lo i ch a đ ng t n s t ự

ố ố

ườ

ng h p các bi n đ nh tính, ế

ng có t n s l n nh t.

nó là tên c a lo i đo l ủ

ườ

ố ớ

4.Trung v ị (median)

Trung v c a m t t p h p đo l

ng là tr s r i vào chính gi a khi các

ộ ậ

ị ủ

ườ

ị ố ơ

c x p đ t theo th t

s đo l ố

ườ

ng y đ ấ

ượ

ứ ự ộ ớ

đ l n c a chúng ủ

ế

Công th c tính trung v

ị = s h ng th 1/2* (N+1)

ố ạ

N u có s ch n quan sát thì l y giá tr trung bình c a th h ng đ ng

ứ ạ

ế

tr

ng và sau.

ườ

4 4/23/14

1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)

Ơ Ả

Ư

ế

5. Giá tr trung bình

(mean)

Trung bình maãu (kyù hieäu laø , hoaëc EX hoaëc), ñöôïc xaùc ñònh theo coâng thöùc:

i

m

=

p x . i

i

m x k . i =� n = 1 i

m � = i 1

N u cho d ng ghép l p thì dùng trung

ế

ị ạ

5 ng 6 - SPSS Ch

đi m c a đo n làm giá tr đ i di n ể 4/23/14

ươ

1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)

Ơ Ả

Ư

ế

(covariance)

ng sai

ng sai

là đ đo s bi n thiên cùng nhau c a hai - đo m c đ bi n ng sai

ự ế ệ ớ ph t v i

ủ ộ ế

ươ

6.Hi p ph ươ ệ q Hi p ph ươ ệ bi n ng u nhiên ẫ ế thiên c a m t bi n) ủ

(phân bi ế

q N u 2 bi n có xu h ế

ướ

ơ

ế

ổ ị

ế

ơ

ế

ế ộ ướ ữ ằ

ươ

ng thay đ i cùng nhau (nghĩa là, khi m t bi n có giá tr cao h n giá tr kỳ vòng thì bi n kia có xu ng sai h ng cũng cao h n giá tr kỳ v ng), thì hi p ph ươ ệ ị ng. M t khác, n u m t bi n gi a hai bi n này có giá tr d ị ươ ế ộ ế ng n m d n m trên giá tr kì v ng còn bi n kia có xu h i ế ướ ằ ướ ọ ị ng sai c a hai bi n này có giá giá tr kì v ng, thì hi p ph ế ệ ị tr âmị

6 4/23/14

1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)

Ơ Ả

Ư

ế

ng sai

ươ ng sai dùng đ đo l

(variance) ườ

ươ

ữ ệ ề

ữ ệ

ng m c đ phân tán c a d li u. ng sai l n thì d li u phân tán, không đ ng đ u. ng sai mà nh thì d li u t p trung, ít phân

i n u ph

ữ ệ ậ

ớ ươ

ượ ạ ế

7. Ph Ph ươ N u ph ế c l Ng tán.

ộ ệ

ẩ (Standard deviation)

ng sai. Có ý nghĩa t

ng

ươ

ươ

8. Đ l ch chu n Đ l ch chu n là căn b c 2 c a ph ộ ệ nh ph t ư ự

ẩ ng sai. ươ

7 4/23/14

2. KI M NGHI M CHI-SQUARE Ệ

Analyze/Descriptive statistics/ Crosstabs sau đó ch n statistics... ọ

8 4/23/14

2. KI M NGHI M CHI-SQUARE Ệ

q Laø moät coâng cuï thoâng keâ söû duïng ñeå

kieåm nghieäm giaû thuyeát cho raèng caùc

bieán trong haøng vaø coät thì ñoäc laäp vôùi

nhau (H0).

q Phöông phaùp kieåm nghieäm naøy chæ cho ta

bieát ñöôïc lieäu moät bieán naøy coù quan heä

hay khoâng vôùi moät bieán khaùc

q Phöông phaùp kieåm nghieäp naøy khoâng chæ

ra cöôøng ñoä cuûa moái quan heä giöõa hai

bieán maïnh hay yeáu (neáu coù quan heä),

cuõng nhö khoâng chæ ra höôùng thuaän hay

nghòch cuûa moái quan heä naøy (neáu coù quan

heä).

9 4/23/14

2. KI M NGHI M CHI-SQUARE Ệ

2

r

c

E

)

( O ij

ij

2

=

X

-

E

= 1

i

= 1

j

ij

(cid:229) (cid:229)

10 4/23/14

2. KI M NGHI M CHI-SQUARE Ệ

Đeå vieäc kieåm nghieäm naøy laø ñaùng tin caäy thì

caùc soá lieäu trong baûng cheùo giöõa hai bieán ñang

khaûo saùt phaûi thoûa maõn moät soá ñieàu kieän

nhaát ñònh sau:

q Khoâng toàn taïi ôû baát kyø oâ giao nhau giöõa hai

bieán coù giaù trò mong ñôïi nhoû hôn 1.

q Khoâng vöôït quaù 20% löôïng oâ giao nhau giöõa

hai bieán ñang khaûo saùt trong baûng cheùo coù

giaù trò nhoû hôn 5 (ñoái vôùi baûng 2x2-baûng maø

phaàn traêm giôùi haïn naøy laø 0%)

11 4/23/14 moãi bieán trong baûng cheùo chæ coù hai giaù trò,

2. KI M NGHI M CHI-SQUARE – VÍ D

Từ menu chọn Analyze/Descritipve Statistics/ Crosstabs

12 4/23/14

2. KI M NGHI M CHI-SQUARE – VÍ D

Nh n vào Statistics, nh n Chi-square r i nh n continue

l ượ

ợ l ượ Các đ i ng ạ ki m đ nh dành ị ể cho tr ng h p ườ 2 bi n đ nh danh ị ế

Các đ i ng ạ ki m đ nh dùng ị ể ng h p cho tr ườ 2 bi n d ng th ứ ạ ế b cậ

13 4/23/14

2. KI M NGHI M CHI-SQUARE – VÍ D

Nh n vào cell nh m xác đ nh các đ i l

ạ ượ

ng th ng kê ố

14 4/23/14

2. KI M NGHI M CHI-SQUARE – VÍ D

15 4/23/14

2. KI M NGHI M CHI-SQUARE – VÍ D

q Dòng cu i cùng thông báo S ô có t n s <5

q Ñoái vôùi daïng baûng cheùo coù hai coät vaø hai doøng (2X2 tables) –

ầ ố ố ố

moãi bieán trong baûng chæ coù hai giaù trò, ta duøng caùc chæ soá

Yate’s corrected chi-square hay coøn goïi laø Continuity Correction ñaùnh

q Likelihood Ratio t

giaù moái töông quan giöõa hai bieán trong baûng

q Linear-by-Linear Association: Đo l

ng t nh pearson Chi-square ươ ự ư

ườ ng m i quan h tuy n tính gi a hai bi n, ch ỉ ữ ế ế ệ ố

tăng ỉ ố ệ ộ ượ ắ ế c s p x p theo th t ứ ự 16

s này ch có ý nghĩa khi s li u trong hàng và c t đã đ ố 4/23/14 d n.ầ

3. CORRELATION (S T

NG QUAN)

Ự ƯƠ

q Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù tự hoaëc khoaûng caùchï. Vieäc ño löôøng moái töông quan giöõa hai bieán thöù töï naøy chuû yeáu döï vaøo hai heä soá Spearman’s correlation coefficient rho vaø Pearson correlation coefficient

q Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa hai bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø thaáp nhaát ñeán cao nhaát)

q Khi caùc bieán trong baûng laø caùc bieán ñònh löôïng ta söû duïng heä soá Pearson correlation coefficient ñeå ño löôøng moái quan heä tuyeán tính giöõa caùc bieán naøy

17

q Caùc giaù trò cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu coäng hoaëc tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch), giaù trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông quan giöõa hai bieán, giaù trò naøy caøng lôùn moái töông quan 4/23/14 caøng maïnh.

3. CORRELATION (S T

NG QUAN)

Ự ƯƠ

q Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù tö hoaëc khoaûng caùchï. Vieäc ño löôøng moái töông quan giöõa hai bieán thöù töï naøy chuû yeáu döï vaøo hai heä soá Spearman’s correlation coefficient rho vaø Pearson correlation coefficient

q Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa hai bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø thaáp nhaát ñeán cao nhaát)

q Khi caùc bieán trong baûng laø caùc bieán ñònh löôïng ta söû duïng heä soá Pearson correlation coefficient ñeå ño löôøng moái quan heä tuyeán tính giöõa caùc bieán naøy

18

q Caùc giaù trò cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu coäng hoaëc tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch), giaù trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông quan giöõa hai bieán, giaù trò naøy caøng lôùn moái töông quan 4/23/14 caøng maïnh.

3. CORRELATION (S T

NG QUAN)

Ự ƯƠ

q Giöõa hai bieán ñònh danh: Ñeå ño löôøng moái quan heä giöõa hai bieán bieåu danh. Söû duïng caùc heä soá Phi (coefficient) vaø Cramer’s V, Contingency coefficient ñeå ño löôøng neáu döïa vaøo keát quaû kieåm nghieäm Chi-bình phöông. ÔÛ ñaây caùc heä soá naøy seõ baèng 0 neáu vaø chæ neáu heä soá Pearson chi bình phöông baèng 0. Do ñoù ngöôøi ta söû duïng caùc thoâng soá naøy ñeå kieåm nghieäm giaû thuyeát cho raèng caùc heä soá naøy ñeàu baèng 0 - ñieàu naøy töông ñöông vôùi giaû thuyeát ñoäc laäp giöõa hai bieán, hay hai bieán khoâng coù moâí quan heä vôùi nhau. Ta seõ töø choái giaû thuyeát naøy

Ø Phi: Chæ duøng cho daïng baûng 2x2 tables, heä soá phi coefficient naøy bieán thieân töø -1 ñeán +1. Do ñoù heä soá naøy ngoaøi khaû naêng chæ ra moái quan heä vaø cöôøng ñoä cuûa moái quan heä noù coøn chæ ra höôùng cuûa moái quan heä ño

Ø Cramer's V vaø Contingency coefficient (heä soá liên h p):ợ

19

Ñöôïc söû duïng cho baûng maø soá coät vaø haøng laø baát kyø, giaù trò kieåm nghieäm bieán thieân töø 0 ñeán 1, vôùi giaù trò 0 chæ ra khoâng coù moái quan heä 4/23/14 giöõa caùc bieán

3. CORRELATION (S T

NG QUAN)

Ự ƯƠ

q Lambda (symmetric and asymmetric lambdas and Goodman and Kruskal’s tau), vaø Uncertainty coefficient. Laø caùc ño löôøng khoâng döïa vaøo giaù trò Chi-square ñeå tính toaùn, vaø khoâng quan taâm ñeán tính ñoái xöùng cuûa phaân phoái chuaån.

q Caùc giaù trò cuûa heä soá naøy cuõng bieán thieân töø 0 ñeá 1 vaø ñöôïc duøng ñeå ño löôøng khaû naêng döï baùo cuûa moät bieán (bieán ñoäc laäp) ñoái vôùi moät bieán khaùc (bieán phuï thuoäc). ü Vôùi giaù trò 0: ch ra không có m i liên h gi a các bi n ỉ

ệ ữ

ế nhaän ñöôïc ố coù yù nghóa raèng nhöõng kieán thöùc veà bieán ñoäc laäp khoâng giuùp ích gì cho vieäc döï baùo nhöõng khaû naêng xaûy ra cuûa bieán phuï thuoäc,

ü Giaù trò 1 cho bieát khi ta bieát ñöôïc nhöõng thoâng tin veà bieán ñoäc laäp thì noù seõ giuùp ta xaùc ñònh ñöôïc moät caùch hoaøn haûo caùc khaû naêng xaûy ra cho bieán phuï thuoäc

20 4/23/14

4. S D NG SPSS TRONG T

NG QUAN

Ử Ụ

ƯƠ

q Xét 2 bi n c19.3 (m c đ quan tâm đ n ch đ gia đình) và dotuoi (nhóm

ứ ộ

ủ ề

ế

ế

tu i). ổ

q Vào Analyze/Descritipve Statistics/ Crosstabs q Đ a c19.3 vào Row và dotuoi vào column

ư

21 4/23/14

4. S D NG SPSS TRONG T

NG QUAN

Ử Ụ

ƯƠ

22 4/23/14

4. S D NG SPSS TRONG T

NG QUAN

Ử Ụ

ƯƠ

23 4/23/14

5. T

NG QUAN VÀ H I QUY

ƯƠ

24 4/23/14

5.1. H S T

NG QUAN

Ệ Ố ƯƠ

Vào Analyze/Correlate/Bivariate…

Two– tailed: Ki m đ nh 2 ị ể phía

H s ệ ố ng t ươ quan h ngạ

25 4/23/14

5.1. H S T

NG QUAN

Ệ Ố ƯƠ

t giá tr trung bình và đ l ch ế ộ ệ ị

q Mean and standard deviations: Cho bi ế

q Cross – product deviation and covariances: Cho bi

chu n c a t ng bi n. ủ ừ ẩ

t t ng các tích mômen ế ổ

q Exclude cases pairwise: Các tr

chéo và hi p ph ệ ươ ng sai c a t ng c p ủ ừ ặ

ng h p d li u thi u c a bi n đang dùng ườ ữ ệ ủ ế ế ợ

q Exclude cases listwise: Các tr

đ ượ c lo i b . ạ ỏ

ườ ng h p d li u c a b t kỳ bi n nào thi u s ẽ ấ ữ ệ ủ ế ế ợ

b lo i b ị ạ ỏ

26 4/23/14

5.1.1. H S T

NG QUAN

Ệ Ố ƯƠ

27 4/23/14

5.2. H I QUY TUY N TÍNH

ng, tác đ ng c a m t s bi n đ c ưở ộ ộ

ủ Đ a ra mô hình h i qui. Nghiên c u m i liên h , s nh h l p lên bi n ph thu c c n quan tâm.  ậ ệ ự ả ầ ộ ố ế ồ ố ụ ứ ế ư ộ

ng (Y) ph thu c vào B ng c p (X1) Thâm niên (kinh ề ươ ụ ấ ằ ộ

Ví dụ: Ti n l nghi m) (X2) Ch c v (X3) ụ ệ

=

b

+

b

+

b

Y

*

X

*

X

*

X

0

1

1

3

2

3

3

ứ + b

Các bê ta g i là h s h i quy ệ ố ồ ọ

28 4/23/14

5.2. H I QUY TUY N TÍNH

q Phân lo i h i quy

ü H i qui đ n

ơ

ü H i qui b i ộ

ü H i qui tuy n tính

ế

ü H i qui phi tuy n

ế

: ạ ồ

q Tuy n tính ế

nghĩa là khi bi n đ c l p tăng 1 đ n v , thì giá tr ị

ộ ậ

ế

ơ

ph thu c tăng thêm 1 giá tr không đ i là

Tham Số

29 4/23/14

5.2. H I QUY TUY N TÍNH

30 4/23/14

5.2. H I QUY TUY N TÍNH

ộ ậ ế ố

i thích đ ượ ả

Sig.(F)  Ki m tra ý nghĩa mô hình ● Sig.(F) >= 0.05 Mô hình ko có ý nghĩa th ng kê (các bi n đ c l p không gi c …) ● Sig.(F) < 0.05 Mô hình có ý nghĩa ● Sig.(t) < 0.05 Có ph thu c bi n … đó ụ ế ộ

31 4/23/14

5.2. H I QUY TUY N TÍNH

 Bêta  Gi i thích ý nghĩa tác đ ng c a ả ẩ ủ ộ

q

ư ế

 B  So sánh tác đ ng h n – kém c a bi n ủ ế ộ ơ

q

ệ ố ồ ế ộ ậ ệ ố ồ ộ ậ

c bao nhiêu ph n trăm trong t ng i thích đ ượ ầ ổ

q

ế ế

ộ ậ ữ ư ế ắ

q H s h i qui ch a chu n hóa bi n đ c l p lên bi n ph thu c ộ ụ H s h i qui đã chu n hóa ẩ đ c l p lên bi n ph thu c ộ ế ụ R-Square  Bi n đ c l p gi ả ế ộ ậ bi n thiên c a bi n ph thu c ộ ụ ủ R-Square hi u ch nh  Cân nh c nên đ a thêm 1 bi n đ c l p n a vào ỉ ệ mô hình hay không?

q H s xác đ nh = R^2

q H s hi u ch nh

= R Square  R = H s t ng quan (0.7  T t) ệ ố ị ệ ố ươ ố

Adjusted R Square ệ ố ệ ỉ

kn

2

2

-=

R

1(1

R

*)

- -

kn

1

- -

32 4/23/14

5.2. H I QUY TUY N TÍNH

5.2.2. H I QUY TUY N TÍNH B I Ộ

(

)

=

+

U

i

=

XXYE / 3 b b +

+

i b

+

2 , i X

X

U

Y i Y i

2

2

i

1

3

3

i

i

33 4/23/14

C¸c gi¶ thiÕt c ña m« h×nh

v Gi¶ thiÕt 1: Hµm håi qui cã d¹ng tuyÕn tÝnh ®èi víi c¸c

tham sè.

v Gi¶ thiÕt 2: C¸c biÕn gi¶i thÝch lµ phi ngÉu nhiªn. v Gi¶ thiÕt 3: Kú väng cña c¸c yÕu tè ngÉu nhiªn b»ng

kh«ng. E(Ui) = 0 víi mäi i

v Gi¶ thiÕt 4: Ph­¬ng sai sai sè ngÉu nhiªn thuÇn nhÊt.

Var(Ui) = 2 víi mäi i

v Gi¶ thiÕt 5: Kh«ng cã tù t­ư¬ng quan gi- aữ c¸c sai sè

ngÉu nhiªn. Cov(Ui,Uj) = 0 víi mäi i ≠ j

5.2. H I QUY TUY N TÍNH

5.2.2. H I QUY TUY N TÍNH B I Ộ

Ma tr n h s t ng quan: Vào correlate/Bivariate ệ ố ươ ậ

35 4/23/14