BÀI GI NG SPSS
Ả
SUY LU N C B N TRONG TH NG KÊ
Ậ Ơ Ả
Ố
(Basic Inferential Statistics)
THS. LÊ VĂN HÙNG
ĐT: 0906238311 – Email: hungolympia2001@gmail.com
4/23/14 1
N i dung
ộ
1
CHI-SQUARE
2
T
NG QUAN
(CORELATIONS)
ƯƠ
3
H I QUY
(REGRESSION)
Ồ
1. CÁC KHÁI NI M Đ C TR NG C B N
Ơ Ả
Ư
Ặ
Ệ
ế
ộ ậ (independent variable)
ứ
ọ
ế
ả ổ ủ
ế ế ế
ộ ặ
1. Bi n đ c l p c l a ch n đ nghiên c u. Bi n đ c l p là m t đ c tính đ ể ượ ự ặ ộ ộ ậ thuy t là m t bi n không ph thu c vào c gi Bi n đ c l p đ ụ ế ộ ượ ộ ậ bi n khác, s bi n đ i c a nó có nh h ng chi ph i ho c gây ự ế ố ưở ả ra nh ng bi n đ i kéo theo ổ ế
m t bi n khác. ế
ở ộ
ữ
ế
ụ
ộ (dependent variable)
ộ
ụ
ự
ế
ự ế ộ
ứ
ế
ế
ế ộ ậ
ế ố ộ
ọ ế
2. Bi n ph thu c Bi n ph thu c là m t bi n mà s bi n đ i c a nó ch u s chi ị ộ c g i là bi n ph ph i (đáp ng) c a 1 bi n khác. M t bi n đ ụ thu c khi giá tr c a nó tuỳ thu c vào giá tr c a bi n đ c l p. ộ Nó chính là hi u qu gi ủ
ổ ủ ượ ị ủ ộ ậ
đ nh c a bi n đ c l p. ế
ủ ị ủ ệ
ả ả ị
3 4/23/14
1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)
Ơ Ả
Ư
Ặ
Ệ
ế
3. M t ố (y u v _mode)
ế
ị
ng là trung đi m c a kho ng đ ng
Y u v c a m t t p h p các đo l ộ ậ
ị ủ
ế
ợ
ườ
ủ
ể
ả
ẳ
i đa hay trong tr
lo i ch a đ ng t n s t ự
ố ố
ứ
ầ
ạ
ườ
ng h p các bi n đ nh tính, ế
ợ
ị
ng có t n s l n nh t.
nó là tên c a lo i đo l ủ
ạ
ườ
ố ớ
ầ
ấ
4.Trung v ị (median)
Trung v c a m t t p h p đo l
ng là tr s r i vào chính gi a khi các
ộ ậ
ị ủ
ợ
ườ
ị ố ơ
ữ
c x p đ t theo th t
s đo l ố
ườ
ng y đ ấ
ượ
ứ ự ộ ớ
đ l n c a chúng ủ
ế
ặ
Công th c tính trung v
ứ
ị = s h ng th 1/2* (N+1)
ố ạ
ứ
N u có s ch n quan sát thì l y giá tr trung bình c a th h ng đ ng
ứ ạ
ủ
ứ
ế
ấ
ẵ
ố
ị
tr
ng và sau.
ườ
4 4/23/14
1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)
Ơ Ả
Ư
Ặ
Ệ
ế
5. Giá tr trung bình
(mean)
ị
Trung bình maãu (kyù hieäu laø , hoaëc EX hoaëc), ñöôïc xaùc ñònh theo coâng thöùc:
i
m
=
p x . i
i
m x k . i =� n = 1 i
m � = i 1
N u cho d ng ghép l p thì dùng trung
ớ
ế
ạ
ị ạ
ủ
ệ
ạ
5 ng 6 - SPSS Ch
đi m c a đo n làm giá tr đ i di n ể 4/23/14
ươ
1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)
Ơ Ả
Ư
Ặ
Ệ
ế
(covariance)
ng sai
ng sai
ộ
là đ đo s bi n thiên cùng nhau c a hai - đo m c đ bi n ng sai
ự ế ệ ớ ph t v i
ủ ộ ế
ươ
ứ
6.Hi p ph ươ ệ q Hi p ph ươ ệ bi n ng u nhiên ẫ ế thiên c a m t bi n) ủ
ộ
(phân bi ế
q N u 2 bi n có xu h ế
ướ
ị
ơ
ế
ổ ị
ế
ọ
ơ
ế
ặ
ế ộ ướ ữ ằ
ươ
ủ
ọ
ng thay đ i cùng nhau (nghĩa là, khi m t bi n có giá tr cao h n giá tr kỳ vòng thì bi n kia có xu ng sai h ng cũng cao h n giá tr kỳ v ng), thì hi p ph ươ ệ ị ng. M t khác, n u m t bi n gi a hai bi n này có giá tr d ị ươ ế ộ ế ng n m d n m trên giá tr kì v ng còn bi n kia có xu h i ế ướ ằ ướ ọ ị ng sai c a hai bi n này có giá giá tr kì v ng, thì hi p ph ế ệ ị tr âmị
6 4/23/14
1. CÁC KHÁI NI M Đ C TR NG C B N (ti p)
Ơ Ả
Ư
Ặ
Ệ
ế
ng sai
ươ ng sai dùng đ đo l
(variance) ườ
ể
ủ
ứ
ộ
ươ
ữ ệ ề
ữ ệ
ồ
ng m c đ phân tán c a d li u. ng sai l n thì d li u phân tán, không đ ng đ u. ng sai mà nh thì d li u t p trung, ít phân
i n u ph
ữ ệ ậ
ớ ươ
ỏ
ượ ạ ế
7. Ph Ph ươ N u ph ế c l Ng tán.
ộ ệ
ẩ (Standard deviation)
ng sai. Có ý nghĩa t
ng
ủ
ậ
ươ
ươ
8. Đ l ch chu n Đ l ch chu n là căn b c 2 c a ph ộ ệ nh ph t ư ự
ẩ ng sai. ươ
7 4/23/14
2. KI M NGHI M CHI-SQUARE Ệ
Ể
Analyze/Descriptive statistics/ Crosstabs sau đó ch n statistics... ọ
8 4/23/14
2. KI M NGHI M CHI-SQUARE Ệ
Ể
q Laø moät coâng cuï thoâng keâ söû duïng ñeå
kieåm nghieäm giaû thuyeát cho raèng caùc
bieán trong haøng vaø coät thì ñoäc laäp vôùi
nhau (H0).
q Phöông phaùp kieåm nghieäm naøy chæ cho ta
bieát ñöôïc lieäu moät bieán naøy coù quan heä
hay khoâng vôùi moät bieán khaùc
q Phöông phaùp kieåm nghieäp naøy khoâng chæ
ra cöôøng ñoä cuûa moái quan heä giöõa hai
bieán maïnh hay yeáu (neáu coù quan heä),
cuõng nhö khoâng chæ ra höôùng thuaän hay
nghòch cuûa moái quan heä naøy (neáu coù quan
heä).
9 4/23/14
2. KI M NGHI M CHI-SQUARE Ệ
Ể
2
r
c
E
)
( O ij
ij
2
=
X
-
E
= 1
i
= 1
j
ij
(cid:229) (cid:229)
10 4/23/14
2. KI M NGHI M CHI-SQUARE Ệ
Ể
Đeå vieäc kieåm nghieäm naøy laø ñaùng tin caäy thì
caùc soá lieäu trong baûng cheùo giöõa hai bieán ñang
khaûo saùt phaûi thoûa maõn moät soá ñieàu kieän
nhaát ñònh sau:
q Khoâng toàn taïi ôû baát kyø oâ giao nhau giöõa hai
bieán coù giaù trò mong ñôïi nhoû hôn 1.
q Khoâng vöôït quaù 20% löôïng oâ giao nhau giöõa
hai bieán ñang khaûo saùt trong baûng cheùo coù
giaù trò nhoû hôn 5 (ñoái vôùi baûng 2x2-baûng maø
phaàn traêm giôùi haïn naøy laø 0%)
11 4/23/14 moãi bieán trong baûng cheùo chæ coù hai giaù trò,
2. KI M NGHI M CHI-SQUARE – VÍ D
Ể
Ệ
Ụ
Từ menu chọn Analyze/Descritipve Statistics/ Crosstabs
12 4/23/14
2. KI M NGHI M CHI-SQUARE – VÍ D
Ể
Ệ
Ụ
Nh n vào Statistics, nh n Chi-square r i nh n continue
ấ
ấ
ấ
ồ
l ượ
ợ l ượ Các đ i ng ạ ki m đ nh dành ị ể cho tr ng h p ườ 2 bi n đ nh danh ị ế
ợ
Các đ i ng ạ ki m đ nh dùng ị ể ng h p cho tr ườ 2 bi n d ng th ứ ạ ế b cậ
13 4/23/14
2. KI M NGHI M CHI-SQUARE – VÍ D
Ể
Ệ
Ụ
Nh n vào cell nh m xác đ nh các đ i l
ạ ượ
ấ
ằ
ị
ng th ng kê ố
14 4/23/14
2. KI M NGHI M CHI-SQUARE – VÍ D
Ể
Ệ
Ụ
15 4/23/14
2. KI M NGHI M CHI-SQUARE – VÍ D
Ể
Ệ
Ụ
q Dòng cu i cùng thông báo S ô có t n s <5
q Ñoái vôùi daïng baûng cheùo coù hai coät vaø hai doøng (2X2 tables) –
ầ ố ố ố
moãi bieán trong baûng chæ coù hai giaù trò, ta duøng caùc chæ soá
Yate’s corrected chi-square hay coøn goïi laø Continuity Correction ñaùnh
q Likelihood Ratio t
giaù moái töông quan giöõa hai bieán trong baûng
q Linear-by-Linear Association: Đo l
ng t nh pearson Chi-square ươ ự ư
ườ ng m i quan h tuy n tính gi a hai bi n, ch ỉ ữ ế ế ệ ố
tăng ỉ ố ệ ộ ượ ắ ế c s p x p theo th t ứ ự 16
s này ch có ý nghĩa khi s li u trong hàng và c t đã đ ố 4/23/14 d n.ầ
3. CORRELATION (S T
NG QUAN)
Ự ƯƠ
q Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù tự hoaëc khoaûng caùchï. Vieäc ño löôøng moái töông quan giöõa hai bieán thöù töï naøy chuû yeáu döï vaøo hai heä soá Spearman’s correlation coefficient rho vaø Pearson correlation coefficient
q Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa hai bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø thaáp nhaát ñeán cao nhaát)
q Khi caùc bieán trong baûng laø caùc bieán ñònh löôïng ta söû duïng heä soá Pearson correlation coefficient ñeå ño löôøng moái quan heä tuyeán tính giöõa caùc bieán naøy
17
q Caùc giaù trò cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu coäng hoaëc tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch), giaù trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông quan giöõa hai bieán, giaù trò naøy caøng lôùn moái töông quan 4/23/14 caøng maïnh.
3. CORRELATION (S T
NG QUAN)
Ự ƯƠ
q Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù tö hoaëc khoaûng caùchï. Vieäc ño löôøng moái töông quan giöõa hai bieán thöù töï naøy chuû yeáu döï vaøo hai heä soá Spearman’s correlation coefficient rho vaø Pearson correlation coefficient
q Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa hai bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø thaáp nhaát ñeán cao nhaát)
q Khi caùc bieán trong baûng laø caùc bieán ñònh löôïng ta söû duïng heä soá Pearson correlation coefficient ñeå ño löôøng moái quan heä tuyeán tính giöõa caùc bieán naøy
18
q Caùc giaù trò cuûa heä soá töông quan bieán thieân töø –1 ñeán 1, daáu coäng hoaëc tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch), giaù trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä töông quan giöõa hai bieán, giaù trò naøy caøng lôùn moái töông quan 4/23/14 caøng maïnh.
3. CORRELATION (S T
NG QUAN)
Ự ƯƠ
q Giöõa hai bieán ñònh danh: Ñeå ño löôøng moái quan heä giöõa hai bieán bieåu danh. Söû duïng caùc heä soá Phi (coefficient) vaø Cramer’s V, Contingency coefficient ñeå ño löôøng neáu döïa vaøo keát quaû kieåm nghieäm Chi-bình phöông. ÔÛ ñaây caùc heä soá naøy seõ baèng 0 neáu vaø chæ neáu heä soá Pearson chi bình phöông baèng 0. Do ñoù ngöôøi ta söû duïng caùc thoâng soá naøy ñeå kieåm nghieäm giaû thuyeát cho raèng caùc heä soá naøy ñeàu baèng 0 - ñieàu naøy töông ñöông vôùi giaû thuyeát ñoäc laäp giöõa hai bieán, hay hai bieán khoâng coù moâí quan heä vôùi nhau. Ta seõ töø choái giaû thuyeát naøy
Ø Phi: Chæ duøng cho daïng baûng 2x2 tables, heä soá phi coefficient naøy bieán thieân töø -1 ñeán +1. Do ñoù heä soá naøy ngoaøi khaû naêng chæ ra moái quan heä vaø cöôøng ñoä cuûa moái quan heä noù coøn chæ ra höôùng cuûa moái quan heä ño
Ø Cramer's V vaø Contingency coefficient (heä soá liên h p):ợ
19
Ñöôïc söû duïng cho baûng maø soá coät vaø haøng laø baát kyø, giaù trò kieåm nghieäm bieán thieân töø 0 ñeán 1, vôùi giaù trò 0 chæ ra khoâng coù moái quan heä 4/23/14 giöõa caùc bieán
3. CORRELATION (S T
NG QUAN)
Ự ƯƠ
q Lambda (symmetric and asymmetric lambdas and Goodman and Kruskal’s tau), vaø Uncertainty coefficient. Laø caùc ño löôøng khoâng döïa vaøo giaù trò Chi-square ñeå tính toaùn, vaø khoâng quan taâm ñeán tính ñoái xöùng cuûa phaân phoái chuaån.
q Caùc giaù trò cuûa heä soá naøy cuõng bieán thieân töø 0 ñeá 1 vaø ñöôïc duøng ñeå ño löôøng khaû naêng döï baùo cuûa moät bieán (bieán ñoäc laäp) ñoái vôùi moät bieán khaùc (bieán phuï thuoäc). ü Vôùi giaù trò 0: ch ra không có m i liên h gi a các bi n ỉ
ệ ữ
ế nhaän ñöôïc ố coù yù nghóa raèng nhöõng kieán thöùc veà bieán ñoäc laäp khoâng giuùp ích gì cho vieäc döï baùo nhöõng khaû naêng xaûy ra cuûa bieán phuï thuoäc,
ü Giaù trò 1 cho bieát khi ta bieát ñöôïc nhöõng thoâng tin veà bieán ñoäc laäp thì noù seõ giuùp ta xaùc ñònh ñöôïc moät caùch hoaøn haûo caùc khaû naêng xaûy ra cho bieán phuï thuoäc
20 4/23/14
4. S D NG SPSS TRONG T
NG QUAN
Ử Ụ
ƯƠ
q Xét 2 bi n c19.3 (m c đ quan tâm đ n ch đ gia đình) và dotuoi (nhóm
ứ ộ
ủ ề
ế
ế
tu i). ổ
q Vào Analyze/Descritipve Statistics/ Crosstabs q Đ a c19.3 vào Row và dotuoi vào column
ư
21 4/23/14
4. S D NG SPSS TRONG T
NG QUAN
Ử Ụ
ƯƠ
22 4/23/14
4. S D NG SPSS TRONG T
NG QUAN
Ử Ụ
ƯƠ
23 4/23/14
5. T
NG QUAN VÀ H I QUY
ƯƠ
Ồ
24 4/23/14
5.1. H S T
NG QUAN
Ệ Ố ƯƠ
Vào Analyze/Correlate/Bivariate…
Two– tailed: Ki m đ nh 2 ị ể phía
H s ệ ố ng t ươ quan h ngạ
25 4/23/14
5.1. H S T
NG QUAN
Ệ Ố ƯƠ
t giá tr trung bình và đ l ch ế ộ ệ ị
q Mean and standard deviations: Cho bi ế
q Cross – product deviation and covariances: Cho bi
chu n c a t ng bi n. ủ ừ ẩ
t t ng các tích mômen ế ổ
q Exclude cases pairwise: Các tr
chéo và hi p ph ệ ươ ng sai c a t ng c p ủ ừ ặ
ng h p d li u thi u c a bi n đang dùng ườ ữ ệ ủ ế ế ợ
q Exclude cases listwise: Các tr
đ ượ c lo i b . ạ ỏ
ườ ng h p d li u c a b t kỳ bi n nào thi u s ẽ ấ ữ ệ ủ ế ế ợ
b lo i b ị ạ ỏ
26 4/23/14
5.1.1. H S T
NG QUAN
Ệ Ố ƯƠ
27 4/23/14
5.2. H I QUY TUY N TÍNH
Ồ
Ế
ng, tác đ ng c a m t s bi n đ c ưở ộ ộ
ủ Đ a ra mô hình h i qui. Nghiên c u m i liên h , s nh h l p lên bi n ph thu c c n quan tâm. ậ ệ ự ả ầ ộ ố ế ồ ố ụ ứ ế ư ộ
ng (Y) ph thu c vào B ng c p (X1) Thâm niên (kinh ề ươ ụ ấ ằ ộ
Ví dụ: Ti n l nghi m) (X2) Ch c v (X3) ụ ệ
=
b
+
b
+
b
Y
*
X
*
X
*
X
0
1
1
3
2
3
3
ứ + b
Các bê ta g i là h s h i quy ệ ố ồ ọ
28 4/23/14
5.2. H I QUY TUY N TÍNH
Ồ
Ế
q Phân lo i h i quy
ü H i qui đ n
ơ
ồ
ü H i qui b i ộ
ồ
ü H i qui tuy n tính
ế
ồ
ü H i qui phi tuy n
ế
ồ
: ạ ồ
q Tuy n tính ế
nghĩa là khi bi n đ c l p tăng 1 đ n v , thì giá tr ị
ộ ậ
ế
ơ
ị
ph thu c tăng thêm 1 giá tr không đ i là
ụ
ổ
ộ
ị
Tham Số
29 4/23/14
5.2. H I QUY TUY N TÍNH
Ồ
Ế
30 4/23/14
5.2. H I QUY TUY N TÍNH
Ồ
Ế
ể
ộ ậ ế ố
i thích đ ượ ả
Sig.(F) Ki m tra ý nghĩa mô hình ● Sig.(F) >= 0.05 Mô hình ko có ý nghĩa th ng kê (các bi n đ c l p không gi c …) ● Sig.(F) < 0.05 Mô hình có ý nghĩa ● Sig.(t) < 0.05 Có ph thu c bi n … đó ụ ế ộ
31 4/23/14
5.2. H I QUY TUY N TÍNH
Ồ
Ế
Bêta Gi i thích ý nghĩa tác đ ng c a ả ẩ ủ ộ
q
ư ế
B So sánh tác đ ng h n – kém c a bi n ủ ế ộ ơ
q
ệ ố ồ ế ộ ậ ệ ố ồ ộ ậ
c bao nhiêu ph n trăm trong t ng i thích đ ượ ầ ổ
q
ế ế
ộ ậ ữ ư ế ắ
q H s h i qui ch a chu n hóa bi n đ c l p lên bi n ph thu c ộ ụ H s h i qui đã chu n hóa ẩ đ c l p lên bi n ph thu c ộ ế ụ R-Square Bi n đ c l p gi ả ế ộ ậ bi n thiên c a bi n ph thu c ộ ụ ủ R-Square hi u ch nh Cân nh c nên đ a thêm 1 bi n đ c l p n a vào ỉ ệ mô hình hay không?
q H s xác đ nh = R^2
q H s hi u ch nh
= R Square R = H s t ng quan (0.7 T t) ệ ố ị ệ ố ươ ố
Adjusted R Square ệ ố ệ ỉ
kn
2
2
-=
R
1(1
R
*)
- -
kn
1
- -
32 4/23/14
5.2. H I QUY TUY N TÍNH
Ồ
Ế
5.2.2. H I QUY TUY N TÍNH B I Ộ
Ồ
Ế
(
)
=
+
U
i
=
XXYE / 3 b b +
+
i b
+
2 , i X
X
U
Y i Y i
2
2
i
1
3
3
i
i
33 4/23/14
C¸c gi¶ thiÕt c ña m« h×nh
v Gi¶ thiÕt 1: Hµm håi qui cã d¹ng tuyÕn tÝnh ®èi víi c¸c
tham sè.
v Gi¶ thiÕt 2: C¸c biÕn gi¶i thÝch lµ phi ngÉu nhiªn. v Gi¶ thiÕt 3: Kú väng cña c¸c yÕu tè ngÉu nhiªn b»ng
kh«ng. E(Ui) = 0 víi mäi i
v Gi¶ thiÕt 4: Ph¬ng sai sai sè ngÉu nhiªn thuÇn nhÊt.
Var(Ui) = 2 víi mäi i
v Gi¶ thiÕt 5: Kh«ng cã tù tư¬ng quan gi- aữ c¸c sai sè
ngÉu nhiªn. Cov(Ui,Uj) = 0 víi mäi i ≠ j
5.2. H I QUY TUY N TÍNH
Ồ
Ế
5.2.2. H I QUY TUY N TÍNH B I Ộ
Ồ
Ế
Ma tr n h s t ng quan: Vào correlate/Bivariate ệ ố ươ ậ
35 4/23/14