intTypePromotion=1
ADSENSE

Bài tập nhóm phân tích định lượng: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ trung bình của phụ nữ giữa các quốc gia trên thế giới

Chia sẻ: Hfhgfvhgf Hfhgfvhgf | Ngày: | Loại File: PDF | Số trang:25

202
lượt xem
39
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài tập nhóm phân tích định lượng: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ trung bình của phụ nữ giữa các quốc gia trên thế giới nhằm trình bày về phân tích ma trận tương quan và quan hệ giữa các biến, xây dựng mô hình hổi quy tổng quát dùng phương pháp enter.

Chủ đề:
Lưu

Nội dung Text: Bài tập nhóm phân tích định lượng: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ trung bình của phụ nữ giữa các quốc gia trên thế giới

  1. B GIÁO D C VÀ ÀO T O TR NG I H C M TP. H CHÍ MINH BÀI T P NHÓM MÔN H C PHÂN TÍCH NH L NG Xây d ng mô hình h i quy gi i thích s khác bi t v tu i th trung bình c a ph n gi a các qu c gia trên th gi i Gi ng viên h ng d n : Ths. HOÀNG TR NG L p : MBA8 Nhóm 2 : Bùi Qu c Nam Hu nh Gia Xuyên Nguy n Ng c Qu nh Nh Lê Th Bích Ng c V Th Bích Vân TP. H CHÍ MINH 03/2009
  2. M TS THU T NG VI T T T DÙNG TRONG BÀI ANOVA (Analysis of Variance): Phân tích ph ng sai DF (Degrees of Freedom): B c t do Sig (Observed Significance level): M c ý ngh a quan sát (chính là p-value) Std. Deviation (Standard deviation): l ch chu n Std. Error (Standard Error): Sai s chu n SPSS (Statistical Package for Social Science): Ph n m m th ng kê cho khoa h c xã h i VIF (Variance Inflation Factor): H s phóng i ph ng sai
  3. M CL C M T S THU T NG VI T T T DÙNG TRONG BÀI Trang M CL C N I DUNG FILE XU T C A SPSS (MBA8_KT_NHOM_2.SOP) I. GI I TH U 1 I.1 T ng quát 1 I.2 Mô t d li u 1 II. QUAN SÁT TR C QUAN V T NG QUAN TUY N TÍNH 2 GI A CÁC BI N III. XÂY D NG MÔ HÌNH 6 III.1 Phân tích ma tr n t ng quan và quan h gi a các bi n 6 III.2 Xây d ng mô hình h i quy t ng quát dùng ph ng pháp 10 Enter III.2.1. Hi n t ng a c ng tuy n 10 III.2.2. T m quan tr ng gi a các bi n 12 III.2.3. Ki m nh phù h p c a mô hình 13 III.2.4. Ki m tra l i m t s vi ph m gi nh c n thi t 13 III.2.4.1. Ki m nh m i quan h tuy n tính gi a bi n c 13 l p và bi n ph thu c III.2.4.2. Ki m nh v tính c l p c a sai s (không có 14 t ng quan gi a các ph n d ) III.3. Mô hình h i quy 15 IV. K T LU N 15 IV.1 Ý ngh a c a mô hình h i quy 15 IV.2 Xây d ng th 16
  4. N I DUNG FILE XU T C A SPSS ( MBA8_KT_NHOM_2.SPO) PH N N I DUNG 1 th bi u th quan h gi a bi n urban và bi n lifeexpf 2 th bi u th quan h gi a bi n pop_incr và bi n lifeexpf 3 th bi u th quan h gi a bi n gdp_cap và bi n lifeexpf 4 th bi u th quan h gi a bi n calories và bi n lifeexpf 5 H s t ng quan gi a bi n lifexpf v i các bi n nh l ng khác 6 Mô hình h i quy g m 7 bi n: literacy, babymort, birth_rt, fertilty, lgurban, lggdpcap, sqcalory 7 Mô hình h i quy g m 5 bi n: literacy, fertilty, lgurban, lggdpcap, sqcalory 8 Mô hình h i quy g m 4 bi n: literacy, fertilty, lgurban, lggdpcap 9 Bi u phân tán gi a ph n d chu n hoá và giá tr d oán chu n hoá 10 Bi u t n s c a ph n d chu n hoá 11 K t qu th ng kê t n s tu i th trung bình c a ph n trên th gi i
  5. GVHD : ThS. Hoàng Tr ng I.GI I THI U I.1./ T ng quát Bài làm c a nhóm là t xây d ng mô hình h i quy gi i thích s khác bi t v tu i th ph n gi a các qu c gia trên th gi i v i d li u làm vi c là file World 95 Tieng Viet .SAV do th y Hoàng Tr ng cung c p. Nhóm ã dùng ph n m m SPSS ver.11 x lý s li u v i file output có tên là MBA8_KT_nhom_2.SPO , ng th i khi x lý s li u nhóm c ng gi thuy t là s li u c a file World 95 Tieng Viet .SAV ã c làm s ch và có tin c y ch p nh n c v i yêu c u t ra. I.2./ Mô t v d li u D li u thu th p d li u tu i th trung bình c a ph n 109 qu c gia khác nhau, m i m t m u tin g m 23 bi n v i 4 bi n nh danh là country (qu c gia), religion (tôn giáo chính), region (khu v c) và climate (khí h u chính). Qua th ng kê t n s ta th y s li u tu i th trung bình c a ph n c thu th p y (missing = 0) và có giá tr bi n thiên trong kho ng r t r ng t 43 (tu i) n 82 (tu i), tu i th trung bình là 70,16 (tu i) và l ch chu n là 10,572. B ng I.1 K t qu th ng kê t n s Statistics Tu i th TB ph n N Valid 109 Missing 0 Mean 70.16 Median 74.00 Mode 75(a) Std. Deviation 10.572 Skewness -1.109 Std. Error of Skewness .231 Kurtosis .213 Std. Error of Kurtosis .459 Minimum 43 Maximum 82 Sum 7647 a. Multiple modes exist. The smallest value is shown Nhóm th c hi n : Nhóm 2 Trang 1
  6. GVHD : ThS. Hoàng Tr ng II.QUAN SÁT TR C QUAN V T NG QUAN TUY N TÍNH GI A CÁC BI N u tiên, ta dùng th Scatter và công c curve estimate (trong SPSS) nh n nh tr c quan m i t ng quan tuy n tính gi a bi n ph thu c tu i th ph n (lifeexpf) v i các bi n nh l ng c l p khác1 (18 bi n), (b qua 3 bi n nh tính là bi n s 1 country (qu c gia), bi n s 5 religion (tôn giáo) và bi n s 12 region (khu v c). Ta có k t q a nh sau (b ng II.1): B ng II.1 Các bi n nh l ng c kh o sát b ng th (l n 1) STT Tên bi n ph thu c Label bi n ph thu c T ng quan qua th c a scatter v i bi n ph bi n thu c 2 Populatn S l ng dân Không có 3 Density M t dân s (ng i/km2) Không có 4 Urban T l dân s ng vùng ô th Phi Tuy n 2 (%) 7 Lifeexpm Tu i th nam gi i Tuy n tính 8 Literacy T l dân bi t ch (%) Tuy n tính 9 pop_incr T c t ng dân s (%/n m) Không rõ 3 10 Babymort T su t t tr s sinh (%) Tuy n tính 11 gdp_cap GDP tính trên u ng i Phi tuy n 4 13 Calories Calori n p h ng ngày TB 1 Phi Tuy n 5 ng i 14 Aids Aids cases Không có 15 birth_rt T su t sinh Tuy n tính 16 death_rt T su t t Tuy n tính 17 aids_rt Number of aids Không có cases/100.000 people 18 B_to_d Birth to death ratio Không có 19 Fertilty S con TB c a 1 ph n Tuy n tính 20 Cropgrow Không có 21 Lit_mal T l nam gi i bi t ch (%) Tuy n tính 22 Lit_fema T l n gi i bi t ch (%) Tuy n tính Nh v y qua quan sát trên th Scatter (và Curve estimation) ta ch c n xem l i 12 bi n nh l ng c l p có m i t ng quan v i tu i th trung bình c a ph n (lifeexpf) (b ng II.2) 1 K t qu th scatter gi a các bi n nh l ng v i bi n lifeexpf bi u th m i t ng quan tuy n tính rõ r t không c l u l i trong file xu t MBA8_KT_nhom_2.spo, nh m m c ích cho t p tin nh g n 2 Xem ph n 1 file xu t MBA8_KT_nhom_2.spo 3 Xem ph n 2 file xu t MBA8_KT_nhom_2.spo 4 Xem ph n 3 file xu t MBA8_KT_nhom_2.spo 5 Xem ph n 4 file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm 2 Trang 2
  7. GVHD : ThS. Hoàng Tr ng B ng II.2 K t qu các bi n nh l ng gi l i sau khi kh o sát b ng th (l n 1) STT Tên bi n Label bi n ph thu c T ng quan qua th c a ph thu c scatter v i bi n ph thu c bi n 4 Urban T l dân s ng vùng ô th (%) Phi tuy n 7 Lifeexpm Tu i th nam gi i Tuy n tính 8 Literacy T l dân bi t ch (%) Tuy n tính 9 pop_incr T c t ng dân s (%/n m) Không rõ 10 Babymort T su t t tr s sinh(%) Tuy n tính 11 gdp_cap GDP tính trên u ng i Phi tuy n 13 Calories Calori n p h ng ngày TB 1 ng i Phi tuy n 15 birth_rt T su t sinh (%) Tuy n tính 16 death_rt T su t t (%) Tuy n tính 19 Fertilty S con TB c a 1 ph n Tuy n tính 21 lit_mal T l nam gi i bi t ch (%) Tuy n tính 22 lit_fema T l n gi i bi t ch (%) Tuy n tính Do trên th scatter, các bi n s 4 (urban), s 9 (pop_incr), s 11 (gdp_cap), và 13 (calories) bi u th m i t ng quan v i tu i th ph n (lifeexpf) có d ng phi tuy n ho c không rõ nên ta có th xác minh l i b ng công c Curve estimation trong SPSS6 i v i bi n Urban ta có k t qu nh sau: Independent: URBAN Dependent Mth Rsq d.f. F Sigf LIFEEXPF LIN .553 106 131.00 .000 LIFEEXPF LOG .563 106 136.70 .000 LIFEEXPF INV .378 106 64.43 .000 LIFEEXPF QUA .586 105 74.43 .000 LIFEEXPF CUB .587 104 49.36 .000 LIFEEXPF COM .533 106 121.12 .000 LIFEEXPF POW .559 106 134.17 .000 LIFEEXPF S .388 106 67.10 .000 LIFEEXPF GRO .533 106 121.12 .000 LIFEEXPF EXP .533 106 121.12 .000 LIFEEXPF LGS .533 106 121.12 .000 Ta th y giá tr R2 c a ba mô hình b c 2, b c 3 và mô hình log là cao nh t, i u này th hi n kh n ng gi i thích ba d ng mô hình này là m nh nh t cho m i quan h gi a urban và lifeexpf. Tuy r ng R2 c a hai mô hình b c 2, b c 3 cao h n R2 c a mô hình log, nh ng n gi n hoá mô hình h n n a có th tránh hi n t ng c ng tuy n có th có gi a các bi n urban b c 1 và b c 2, 3, ta quy t nh ch n mô hình log - tuy n tính cho quan h g a urban và lifeexpf b ng cách t o ra bi n lgurban = log10 (urban). Bi n lgurban có s th t là 24 6 Tham kh o th ph n 1,2,3,4 c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm 2 Trang 3
  8. GVHD : ThS. Hoàng Tr ng i v i bi n pop_incr ta có: Independent: POP_INCR Dependent Mth Rsq d.f. F Sigf LIFEEXPF LIN .336 107 54.07 .000 LIFEEXPF LOG LIFEEXPF INV .034 107 3.76 .055 LIFEEXPF QUA .406 106 36.24 .000 LIFEEXPF CUB .488 105 33.39 .000 LIFEEXPF COM .302 107 46.36 .000 LIFEEXPF POW LIFEEXPF S .031 107 3.44 .066 LIFEEXPF GRO .302 107 46.36 .000 LIFEEXPF EXP .302 107 46.36 .000 LIFEEXPF LGS .302 107 46.36 .000 Notes: 12 Independent variable has non-positive values. Giá tr R2 c a các mô hình u nh , th m chí hai mô hình logarith và power không th tính c, do v y ta d t khoát b bi n pop_incr ra kh i mô hình quan h v i bi n lifeexpf. i v i bi n gdp_cap ta có: Independent: GDP_CAP Dependent Mth Rsq d.f. F Sigf LIFEEXPF LIN .412 107 75.11 .000 LIFEEXPF LOG .691 107 238.93 .000 LIFEEXPF INV .600 107 160.41 .000 LIFEEXPF QUA .544 106 63.35 .000 LIFEEXPF CUB .604 105 53.32 .000 LIFEEXPF COM .364 107 61.26 .000 LIFEEXPF POW .652 107 200.32 .000 LIFEEXPF S .597 107 158.60 .000 LIFEEXPF GRO .364 107 61.26 .000 LIFEEXPF EXP .364 107 61.26 .000 LIFEEXPF LGS .364 107 61.26 .000 Giá tr R2 c a mô hình Logarithm là l n nh t, do ó ta ch n mô hình log - tuy n tính bi u th m i quan h gi a gdp_cap v i lifeexpf b ng cách t o ra bi n lggdpcap = log10 (gdp_cap). Bi n lggdpcap có s th t là 25 i v i bi n calories ta có: Independent: CALORIES Nhóm th c hi n : Nhóm 2 Trang 4
  9. GVHD : ThS. Hoàng Tr ng Dependent Mth Rsq d.f. F Sigf LIFEEXPF LIN .601 73 110.05 .000 LIFEEXPF LOG .631 73 125.07 .000 LIFEEXPF INV .648 73 134.41 .000 LIFEEXPF QUA .667 72 72.00 .000 LIFEEXPF CUB .668 72 72.35 .000 LIFEEXPF COM .569 73 96.56 .000 LIFEEXPF POW .602 73 110.49 .000 LIFEEXPF S .622 73 120.18 .000 LIFEEXPF GRO .569 73 96.56 .000 LIFEEXPF EXP .569 73 96.56 .000 LIFEEXPF LGS .569 73 96.56 .000 K t qu R2 c a mô hình b c 2 là cao (dù R2 c a mô hình b c 3 cao h n nh ng không áng k mà l i ph c t p h n nhi u) nên ta quy t nh dùng mô hình b c 2 mô t m i quan h gi a calories và lifeexpf b ng cách t o thêm bi n calories2 = (calories)2. ng th i n ây ta c ng quy t nh b h n bi n calories ra kh i mô hình vì v b n ch t ch c n bi n sqcalory = (calories)2 thay th cho bi n calories là , n u v n gi bi n calories s r t d gây hi n t ng a c ng tuy n. Bi n sqcalory s có s th t là 26. Nh v y, qua quan sát tr c quan b ng th scatter và dùng công c curve estimation , tr c h t ta t m th i cho các bi n c l p trong b ng (II.3) vào mô hình xây d ng h i quy cho tu i th trung bình c a ph n . B ng II.3 K t qu gi l i các bi n nh l ng sau khi dùng Curve Estimation STT Tên bi n Label bi n ph thu c T ng quan qua th c a ph thu c scatter v i bi n ph thu c bi n 7 Lifeexpm Tu i th nam gi i Tuy n tính 8 Literacy T l dân bi t ch (%) Tuy n tính 10 babymort T su t t tr s sinh (%) Tuy n tính 15 Birth_rt T su t sinh (%) Tuy n tính 16 Death_rt T su t t (%) Tuy n tính 19 fertilty S con TB c a 1 ph n Tuy n tính 21 lit_mal T l nam gi i bi t ch (%) Tuy n tính 22 lit_fema T l n gi i bi t ch (%) Tuy n tính 24 lgurban Log (urban) Lin-Log 25 lggdpcap Log (gdp_cap) Lin-Log 26 sqcalory Sqrt (calories) Lin-Qua7 7 Lin-Qua hay còn g i là Quadratic Dependence Nhóm th c hi n : Nhóm 2 Trang 5
  10. GVHD : ThS. Hoàng Tr ng III. XÂY D NG MÔ HÌNH III.1./ Phân tích ma tr n h s t ng quan và quan h gi a các bi n8 Qua tính toán ma tr n h s t ng quan (xem b ng III.2), ta nh n th y h s t ng quan gi a bi n ph thu c lifeexpf v i 9 bi n c l p ã nêu u cao (th p nh t là -0,696 i v i bi n death_rt). Tuy nhiên m i t ng quan gi a các bi n này c ng r t cao (thí d gi a h s t ng quan gi a babymort v i lifeexpm là -0,936, v i literacy là -0,9. Và h s t ng quan gi a fertilty v i birth_rt là 0,975) và ý ngh a ôi khi t ng ng, do v y ta có th xét l i vi c a các bi n này vào ph ng trình h i quy nh sau: - Bi n lifeexpm (Tu i th nam gi i) tuy có m i t ng quan v i lifeexpf r t cao (0,982), nh ng b n ch t gi a hai bi n này là t ng ng, y u t tu i th nam gi i cao không ph i là y u t làm tu i th n gi i cao. Có ngh a là bi n lifeexpm không ph i là bi n nguyên nhân tác ng t i bi n ph thu c lifeexpf, mà c hai bi n này u b nh h ng b i m t s bi n nguyên nhân khác. Do ó ta có th b bi n này không a vào mô hình h i quy. - Bi n babymort (T su t t tr s sinh(%)) tuy có h s t ng quan v i lifeexpf r t cao (-0,962) nh ng ng th i l i c ng có quan h ch t ch v i bi n literacy (h s t ng quan = - 0,9) nên ta c ng có th b bi n này ra kh i mô hình ngoài ra xét v b n ch t thì bi n babymort c ng không ph i là y u t nh h ng t i lifeexpf. - Bi n birth_rt (T su t sinh (%)) c ng c a ra kh i mô hình h i quy tuy r ng h s t ng quan v i lifeexpf c ng cao ( -0,862), nh ng b n thân bi n này l i c ng quan h ch t v i bi n fertilty (h s t ngquan = 0,975). H n n a xét v m t ý ngh a thì c ng không ph i là y u t nh h ng t i bi n lifeexpf. - Bi n death_rt (T su t t (%)) không c a vào mô hình vì h s t ng quan v i lifeexpf là th p nh t (-0,696) trong b ng k t qu correlation. H n n a xét v m t ý ngh a thì bi n death_rt c ng không ph i là y u t nh h ng t i bi n lifeexpf. - Bi n lit_male (T l nam gi i bi t ch (%)) và lit_fema (T l n gi i bi t ch (%)) tuy có quan h v i lifeexpf (h s t ng quan l n l t là 0,777 và 0,819) nh ng l i c ng có quan h ch t v i bi n literacy (h s t ng quan l n l t là 0,948 và 0,973), do v y có th nói ba bi n literacy,,lit_male và lit_fema là cùng b n ch t (cùng th hi n dân trí vì t l dân bi t ch s ng bi n v i t l nam gi i bi t ch và t l n gi i bi t ch ). Do v y ta có th b hai bi n lit_male và lit_fema không a vào mô hình, mà ch gi l i m t bi n literacy th hi n do m c dân trí mà thôi. Tóm l i, n ây ch còn b y bi n a vào mô hình h i quy nh b ng (III.1) 8 Xem ph n 5 c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm 2 Trang 6
  11. GVHD : ThS. Hoàng Tr ng B ng III.1: Các bi n (7 bi n) gi l i sau khi phân tích ý ngh a STT Tên bi n ph Label bi n ph thu c D ng a vào mô hình thu c 8 Literacy T l dân bi t ch (%) Tuy n tính 10 Babymort T su t t tr s sinh (%) Tuy n tính 15 birth_rt T su t sinh (%) Tuy n tính 19 Fetilty S con TB c a 1 ph n Tuy n tính 24 Lggdpcap GDP tính trên u ng i lggdpcap = log(gdp_cap) 25 Lgurban T l dân s ng vùng ô th (%) lgurban = log(urban) 26 Sqcalory Calory n p TB cho 1 ng i/1 ngày Tuy n tính Nhóm th c hi n : Nhóm 2 Trang 7
  12. GVHD : ThS. Hoàng Tr ng B ng III.2 B ng h s t ng quan gi a các bi n Correlations logarith co binh Tæ leä nam logarith co so 10 cua phuong Tuoåi thoï TB Tuoåi thoï TB Tæ leä daân bieát Tæ suaát töû treû Tæ suaát sinh Tæ suaát töû Soá con TB giôù bieá i t Tæ leä nöõ giôùi so 10 cua bien bien phuï nöõ nam giôùi chöõ (%) sô sinh o/oo o/oo o/oo cuûa 1 phuï nöõ chöõ (%) bieát chöõ (%) bien urban gdp_cap calories Tuoåi thoï Pearson 1 .982(**) .865(**) -.962(**) -.862(**) -.696(**) -.838(**) .777(**) .819(**) .750(**) .831(**) .750(**) TB phuï nöõ Correlation Sig. (2-tailed) . .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 N 109 109 107 109 109 108 107 85 85 108 109 75 Tuoåi thoï Pearson TB nam Correlation .982(**) 1 .809(**) -.936(**) -.805(**) -.739(**) -.783(**) .717(**) .745(**) .735(**) .805(**) .739(**) giôùi Sig. (2-tailed) .000 . .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 N 109 109 107 109 109 108 107 85 85 108 109 75 Tæ leä daân Pearson bieát chöõ Correlation .865(**) .809(**) 1 -.900(**) -.869(**) -.486(**) -.866(**) .948(**) .973(**) .662(**) .732(**) .661(**) (%) Sig. (2-tailed) .000 .000 . .000 .000 .000 .000 .000 .000 .000 .000 .000 N 107 107 107 107 107 106 105 85 85 107 107 74 Tæ suaát töû Pearson treû sô sinh Correlation -.962(**) -.936(**) -.900(**) 1 .865(**) .630(**) .833(**) -.809(**) -.843(**) -.716(**) -.824(**) -.754(**) o/oo Sig. (2-tailed) .000 .000 .000 . .000 .000 .000 .000 .000 .000 .000 .000 N 109 109 107 109 109 108 107 85 85 108 109 75 Tæ suaát Pearson -.862(**) -.805(**) -.869(**) .865(**) 1 .367(**) .975(**) -.794(**) -.835(**) -.635(**) -.769(**) -.754(**) sinh o/oo Correlation Sig. (2-tailed) .000 .000 .000 .000 . .000 .000 .000 .000 .000 .000 .000 N 109 109 107 109 109 108 107 85 85 108 109 75 Tæ suaát töû Pearson -.696(**) -.739(**) -.486(**) .630(**) .367(**) 1 .396(**) -.486(**) -.510(**) -.560(**) -.402(**) -.307(**) o/oo Correlation Sig. (2-tailed) .000 .000 .000 .000 .000 . .000 .000 .000 .000 .000 .007 N 108 108 106 108 108 108 107 85 85 107 108 75 Soá con TB Pearson cuûa 1 phuï Correlation -.838(**) -.783(**) -.866(**) .833(**) .975(**) .396(**) 1 -.796(**) -.839(**) -.642(**) -.693(**) -.683(**) nöõ Nhóm th c hi n : Nhóm 2 Trang 8
  13. GVHD : ThS. Hoàng Tr ng Sig. (2-tailed) .000 .000 .000 .000 .000 .000 . .000 .000 .000 .000 .000 N 107 107 105 107 107 107 107 85 85 106 107 75 Tæ leä nam Pearson giôù bieá i t Correlation .777(**) .717(**) .948(**) -.809(**) -.794(**) -.486(**) -.796(**) 1 .964(**) .590(**) .611(**) .553(**) chöõ (%) Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 . .000 .000 .000 .000 N 85 85 85 85 85 85 85 85 85 85 85 59 Tæ leä nöõ Pearson giôù bieá i t Correlation .819(**) .745(**) .973(**) -.843(**) -.835(**) -.510(**) -.839(**) .964(**) 1 .620(**) .632(**) .527(**) chöõ (%) Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 . .000 .000 .000 N 85 85 85 85 85 85 85 85 85 85 85 59 logarith co Pearson so 10 cua Correlation .750(**) .735(**) .662(**) -.716(**) -.635(**) -.560(**) -.642(**) .590(**) .620(**) 1 .713(**) .638(**) bien urban Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 . .000 .000 N 108 108 107 108 108 107 106 85 85 108 108 74 logarith co Pearson so 10 cua Correlation .831(**) .805(**) .732(**) -.824(**) -.769(**) -.402(**) -.693(**) .611(**) .632(**) .713(**) 1 .838(**) bien gdp_cap Sig. (2-tailed) .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 . .000 N 109 109 107 109 109 108 107 85 85 108 109 75 binh Pearson phuong Correlation .750(**) .739(**) .661(**) -.754(**) -.754(**) -.307(**) -.683(**) .553(**) .527(**) .638(**) .838(**) 1 bien calories Sig. (2-tailed) .000 .000 .000 .000 .000 .007 .000 .000 .000 .000 .000 . N 75 75 74 75 75 75 75 59 59 74 75 75 ** Correlation is significant at the 0.01 level (2-tailed). Nhóm th c hi n : Nhóm 2 Trang 9
  14. GVHD : ThS. Hoàng Tr ng III.2./ Xây d ng mô hình h i quy t ng quát dùng ph ng pháp Enter Qua k t qu phân tích trên, ta s xây d ng mô hình tuy n tính gi a lifeexpf v i b y bi n literacy, babymort, birth_rt, fertilty, lgurban (logarith c s 10 c a urban), lggdpcap (logarith c s 10 c a gdp_cap), và sqcalory (sqcalory = calories2). Ta s dùng ph ng pháp Enter trong SPSS, a toàn b b y bi n này vào cùng m t lúc, sau ó ta s l n l t dò tìm các vi ph m gi nh c n thi t d n d n tinh ch nh thêm mô hình h i quy c a ta: B ng III.3 K t qu ki m nh mô hình h i quy g m b y bi n cl p Coefficients(a) Mod Unstandardized Standardized Collinearity el Coefficients Coefficients T Sig. Correlations Statistics Std. Zero- B Error Beta order Partial Part Tolerance VIF 1 (Constant) 83.140 6.978 11.914 .000 Tæ daâ bieá leä n t -.094 .041 -.191 -2.274 .026 .869 -.270 -.066 .122 8.213 chöõ (%) Tæ suaát töû treû sô -.260 .027 -.880 -9.590 .000 -.963 -.763 -.280 .102 9.848 sinh o/oo Tæ suaát sinh o/oo -.119 .164 -.129 -.721 .474 -.864 -.088 -.021 .027 37.286 Soá con TB cuûa 1 -.334 .922 -.057 -.362 .718 -.842 -.045 -.011 .035 28.674 phuï nöõ logarith co so 10 4.901 2.013 .122 2.434 .018 .766 .287 .071 .343 2.915 cua bien urban logarith co so 10 cua bien .684 1.317 .040 .519 .605 .827 .064 .015 .146 6.859 gdp_cap binh phuong -1.105E- .000 -.030 -.531 .597 .750 -.065 -.016 .260 3.843 bien calories 07 a Dependent Variable: Tuoåi thoï TB phuï nöõ III.2.1/ Hi n t ng a c ng tuy n9 (xem b ng III.3): - Bi n t su t t tr s sinh (babymort) có h s VIF (Variance Inflation factor) ~10 (9,848) c ng nh h s tolerance quá nh (0,102) nên có hi n t ng a c ng tuy n. Qua b ng correlation ta th y bi n babymort (T su t t tr s sinh(%)) tuy có h s t ng quan v i lifeexpf r t cao (-0,962) nh ng ng th i l i c ng có quan h ch t ch v i bi n literacy (h s t ng quan = - 0,9) nên n u gi l i bi n literacy thì s ph i b bi n này babymort ra kh i mô hình. - Bi n t su t sinh (birth_rt) có h s VIF > 10 (37,286) c ng nh h s tolerance quá nh (0,027) nên có hi n t ng a c ng tuy n. Qua b ng Correlation, ta th y bi n birth_rt tuy r ng h s t ng quan v i lifeexpf c ng cao ( -0,862), nh ng b n thân bi n này l i c ng quan h r t ch t v i bi n fertilty (h s t ngquan = 0,975). Do v y khi gi bi n literacy trong mô hình thì ta s ph i b bi n birth_rt ra kh i mô hình. - Bi n s con trung bình c a m t ph n (fertilty) có h s VIF > 10 (28,674) c ng nh h s tolerance quá nh (0,035) nên có hi n t ng a c ng tuy n. Tuy nhiên qua b ng Correlation, ta th y b n thân bi n này l i c ng quan h r t ch t v i bi n birth_rt (t 9 Multicollinearity Nhóm th c hi n : Nhóm 2 Trang 10
  15. GVHD : ThS. Hoàng Tr ng su t sinh) (h s t ngquan = - 0,975). Mà ta ã quy t nh b bi n birth_rt ra kh i mô hình nên ta có th gi l i bi n fertilty trong mô hình (ta s ch y l i k t qu khi b bi n birth_rt xem vi c gi l i bi n fertilty là có phù h p không?) n ây sau khi b hai bi n babymort và birt_rt ki m tra l i ta th y tr c m t không còn hi n t ng a công tuy n (h s VIF cao nh t là 5,134) nh ng h s h i quy ng tr c bi n sqcalory l i không còn ý ngh a (Beta chu n hoá quá nh = 0,08 và sig l i quá l n = 0,347), do ó ta c ng l i b luôn bi n sqcalory ra kh i mô hình (n u chú ý, ta có th th y gi a bi n sqcalory và bi n lggdpcap có m i quan h c ng tuy n ti m n vì cùng ch m c sung túc v v t ch t c a cu c s ng). B ng III.3: K t qu ki m nh m c phù h p c a các h s h i quy v i 5 bi n cl p Coefficients(a) Standardize Mod Unstandardized d Collinearity el Coefficients Coefficients t Sig. Correlations Statistics Std. Zero- Toleran B Error Beta order Partial Part ce VIF 1 (Constant) 34.348 6.324 5.432 .000 Tæ daâ leä n bieá chöõ t .169 .048 .342 3.559 .001 .869 .396 .159 .216 4.623 (%) Soá con TB cuûa 1 phuï -1.371 .544 -.233 -2.522 .014 -.842 -.292 -.113 .234 4.271 nöõ logarith co so 10 cua 8.314 2.795 .206 2.975 .004 .766 .339 .133 .415 2.408 bien urban logarith co so 10 cua 3.183 1.740 .185 1.829 .072 .827 .217 .082 .195 5.134 bien gdp_cap binh phuong 2.899E- bien .000 .080 .948 .347 .750 .114 .042 .281 3.560 07 calories a Dependent Variable: Tuoåi thoï TB phuï nöõ V y cu i cùng ta ch còn b n bi n c l p literacy, fetilty, lggdpcap, lgurban trong mô hình h i quy (b ng III.4) B ng III.4: Các bi n (4 bi n ) gi l i mô hình h i quy sau khi ki m tra hi n t ng a c ng tuy n STT Tên bi n ph Label bi n ph thu c D ng a vào mô hình thu c 8 Literacy T l dân bi t ch (%) Tuy n tính 19 Fetilty S con TB c a 1 ph n Tuy n tính 24 Lggdpcap GDP tính trên u ng i lggdpcap = log(gdp_cap) 25 Lgurban T l dân s ng vùng ô th (%) lgurban = log(urban) Nhóm th c hi n : Nhóm 2 Trang 11
  16. GVHD : ThS. Hoàng Tr ng Ch y l i mô hình h i quy v i b n bi n quan sát trên ta có k t q a b ng (III.5) B ng III.5: K t q a ki m nh m c phù h p c a các h s h i quy v i 4 bi n cl p Coefficients(a) Standardize Mod Unstandardized d Collinearity el Coefficients Coefficients t Sig. Correlations Statistics Std. Zero- Toleran B Error Beta order Partial Part ce VIF 1 (Constant) 33.767 5.031 6.712 .000 Tæ daâ bieá leä n t .143 .036 .308 3.996 .000 .865 .371 .144 .218 4.585 chöõ (%) Soá con TB cuûa 1 -1.459 .419 -.258 -3.479 .001 -.847 -.329 -.125 .236 4.236 phuï nöõ logarith co so 10 8.772 2.337 .213 3.753 .000 .779 .351 .135 .403 2.481 cua bien urban logarith co so 10 cua bien 4.486 1.079 .263 4.159 .000 .833 .384 .150 .324 3.084 gdp_cap a Dependent Variable: Tuoåi thoï TB phuï nöõ n ây ta ã th y hoàn toàn không còn hi n t ng a c ng tuy n (VIF cao nh t là 4,585 và các h s beta u có ý ngh a, sig l n nh t là 0,001). Ta có th xem nh b n bi n c l p a vào mô hình là h p lý (b ng III.5). III.2.2./ T m quan tr ng c a các bi n10 (b ng III.5) - H s Beta: H s beta c a các bi n trong ph ng trình h i quy có ý ngh a th ng kê (sig l n nh t là 0,001) và x p x nhau: Literacy: 0,308 Fertilty: -0,258 Logurban: 0,213 Loggdpcap: 0,263 - H s t ng quan t ng ph n (Part Correlation coefficient): th hi n t ng quan c a các bi n d c l p v i ph thu c lifeexpf khi ã lo i b nh h ng tuy n tính gi a các bi n c l p v i nhau Literacy: 0,144 Fertilty: -0,125 Logurban: 0,135 Loggdpcap: 0,150 - H s t ng quan riêng (Partial Correlation coefficient) : th hi n t ng quan c a các bi n d c l p v i ph thu c lifeexpf khi ã lo i b nh h ng tuy n tính gi a các bi n c l p v i nhau và gi a các bi n c l p khác v i bi n ph thu c Literacy: 0,371 Fertilty: -0,329 Logurban: 0,351 Loggdpcap: 0,384 10 Có th tham kh o k h n ph n 8 c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm 2 Trang 12
  17. GVHD : ThS. Hoàng Tr ng Qua phân tích ta th y nh h ng c a các bi n c l p v i bi n ph thu c chênh l ch nhau nhi u. Có th th y r ng bi n Lggdpcap có m c nh h ng l n nh t, literacy có m c nh h ng nhì, th ba là lgurban và cu i cùng là fertilty. III.2.3/ Ki m nh phù h p c a mô hình 11 - Ki m nh phù h p: Ki m nh Fisher cho gi thuy t t t c các h s h i quy b ng 0, tr h ng s (Ho: 1 = 2 = 3 = 4 = 0) v i sig =0,000 cho phép ta an toàn bác b gi thuy t Ho, nh v y mô hình h i quy tuy n tính c a ta là phù h p v i d li u ã dùng (b ng III.7). - ánh giá phù h p c a mô hình: v i h s R2 i u ch nh = 0,865 nên có th coi là m c phù h p c a mô hình là khá cao. B ng III.7: K t qu th ng kê F tính t giá tr R2 ANOVA(b) Sum of Model Squares Df Mean Square F Sig. 1 Regressio 10351.984 4 2587.996 167.652 .000(a) n Residual 1543.673 100 15.437 Total 11895.657 104 a Predictors: (Constant), logarith co so 10 cua bien gdp_cap, Soá con TB cuûa 1 phuï nöõ, logarith co so 10 cua bien urban, Tæ daâ bieá chöõ(%) leä n t b Dependent Variable: Tuoåi thoï TB phuï nöõ III.2.4./ Ki m tra l i m t s vi ph m gi nh c n thi t: ph n 2.1, ta ã xét mô hình h i quy c a ta không còn d u hi n x y ra hi n t ng a c ng tuy n. Du i ây ta s ti p t c các gi thuy t v m i quan h tuy n tính gi a bi n c l p và bi n ph thu c (cho dù tr c ây, ta ã dùng th Scatter và curve estimation th y m i quan h tuy n tính gi a bi n c l p và bi n ph thu c nh ng i u ó ch mang tính tr c quan mà thôi). V tính c l p c a các sai s (không có t ng quan gi a các ph n d ) và tính phân ph i chu n c a ph n d . III.2.4.1./ Ki m nh m i quan h tuy n tính gi a bi n c l p và bi n ph thu c Nh ã nói, tuy r ng tr c ây ta ã dùng th Scatter và công c curve estimation th y m i quan h tuy n tính gi a bi n c l p và bi n ph thu c nh ng d u sao i u này c ng ch mang tính tr c quan và th hi n m i t ng quan c a t ng bi n c l p v i bi n ph thu c mà thôi, ta c n ki m nh l i gi thuy t là gi a các bi n c l p và bi n ph thu c có quan h tuy n tính trên c s xem th phân tán (hình III.1) gi a ph n d c chu n hoá (standardized residual c ph n m m SPSS l u bi n zre_1) và giá tr d oán chu n hoá (standardized predicted value c ph n m m SPSS l u bi n zpr_1). Qua th này, ta th y ph n d phân tán ng u nhiên chung quanh ng i qua g c O, nên ta có th k t lu n gi nh các bi n c l p v i bi n ph thu c có quan h tuy n tính (ph i nh là có hai bi n c l p lgurban và lggdpcap là logarithm c s 10 c a hai bi n quan sát lúc u là urban và gdp_cap). 11 Có th tham kh o rõ h n ph n 8 c a file xu t MBA8_KT_nhom_2.spo Nhóm th c hi n : Nhóm 2 Trang 13
  18. GVHD : ThS. Hoàng Tr ng Hình III.1: th phân tán gi a ph n d c chu n hoá và giá tr d oán chu n hoá 3 2 1 0 -1 Standardized Residual -2 -3 -4 -5 -3 -2 -1 0 1 2 Standardized Predicted Value III.2.4.2/ Ki m nh v tính c l p c a sai s (không có t ng quan gi a các ph n d )12 Ta dùng b ng th ng kê Durbin-Watson ki m nh. Qua b ng tóm t t mô hình (b ng III.8) ta th y h s Durbin-Watson = 2,067 n m gi a giá tr c a du = 1,4 và c a (4-du) = 2,6 nên có th ch p nh n gi thuy t không có hi n t ng t t ng quan chu i b c nh t gi a các ph n d , có ngh a là kh ng nh gi thuy t v tính c l p c a sai s . B ng III.8 B ng k t q a ki m nh mô hình Model Summary(b) Change Statistics Adjusted R Std. Error of R Square Sig. F Durbin- Model R R Square Square the Estimate Change F Change df1 df2 Change Watson 1 .933(a) .870 .865 3.929 .870 167.652 4 100 .000 2.067 a Predictors: (Constant), logarith co so 10 cua bien gdp_cap, Soá con TB cuûa 1 phuï nöõ, logarith co so 10 cua bien urban, Tæ daâ bieá chöõ(%) leä n t b Dependent Variable: Tuoåi thoï TB phuï nöõ III.2.4.3./ Ki m nh v tính phân ph i chu n c a ph n d : Ta có th dùng bi u t n s Histogram (hình III.2) kh o sát phân ph i c a ph n d (th hi n bi n zre_1 do SPSS l u l i). Qua th này ta th y phân ph i ph n d c a mô hình x p x chu n vì có trung bình Mean = 0 và d l ch chu n Std Dev = 0,98 (g n = 1). Nên ta có th k t lu n gi thuy t ph n d có phân ph i chu n không b vi ph m. 12 Autocorrelated errors : còn g i là t t ng quan.Có th ki m nh b ng ph ng pháp Durbin-Watson hay Breusch-Godfrey (BG) Nhóm th c hi n : Nhóm 2 Trang 14
  19. GVHD : ThS. Hoàng Tr ng Hình III.2 Histogram kh o sát phân ph i c a ph n d 20 10 Std. Dev = .98 Mean = 0.00 0 N = 105.00 -4 -3 -3 -2 -2 -1 -1 -.5 0. .5 1. 1. 2. 00 0 00 50 00 .0 .5 .0 .5 .0 .5 .0 0 0 0 0 0 0 0 0 Standardized Residual III.3./ Mô hình h i quy (b ng III.5): - Cu i cùng ta ã xây d ng c mô hình h i quy cho vi c d báo tu i th c a ph n (lifeexpf) v i 4 bi n c l p là literacy (t l dân bi t ch có n v %), fertilty (s con trung bình c a 1 ph n ), lggdpcap (log10 c a gdp_cap v i gdp_cap là GDP bình quân trên m t u ng i có n v USD), lgurban (log10 c a urban v i urban là t l dân s ng ô th có n v %). Mô hình trên không còn hi n t ng a c ng tuy n (VIF cao nh t là 4,585
  20. GVHD : ThS. Hoàng Tr ng %). Quá trình xây d ng mô hình này ta ch chú ý vào các bi n c l p là bi n nh l ng mà b qua các bi n nh danh nh bi n region (khu v c), bi n climate (khí h u). Do v y mô hình c ng n gi n vì không có các bi n gi th hi n cho các bi n nh danh này13. V i k t q a mô hình h i quy, ta có th a ra m t vài nh n xét sau: Lifeexpf = 33,767 - 1,459*fertilty + 4,486*log10(gdp_cap) + 8,772 *log10(urban) + 0,143*literacy - S con trung bình c a m t ph n t l ngh ch v i tu i th trung bình c a ph n , c t ng lên m t con thì tu i th trung bình c a ng i ph n s gi m i 1,459 n m. - GDP bình quân trên m t u ng i t l thu n v i tu i th trung bình c a ph n , n u GDP bình quân trên m t u ng i t ng g p 10 l n, thì tu i th trung bình c a ph n s t ng t ng ng là 4,486 n m. - T l dân s ng ô th t l thu n v i tu i th trung bình c a ph n , n u t l dân s ng ô th t ng g p 10 l n, thì tu i th trung bình c a ph n s t ng t ng ng là 8,772 n m. - T l dân bi t ch t l thu n v i tu i th trung bình c a ph n , n u t l dân bi t ch t ng 10%, thì tu i th trung bình c a ph n s t ng t ng ng là 1,43 n m. Qua nh n xét này, ta th y các v n ô th hoá, nâng cao dân trí, GDP và k ho ch hoá gia ình u có m t nh h ng nh t nh n tu i th trung bình c a ph n . Mô hình h i quy này c ng ch ra c các v n chi n l c cho vi c phát tri n b n v ng c a các qu c gia, hay v n bình ng hoá i s ng c a ph n trong xã h i. IV.2./ Xây d ng th 14 nhìn th y tr c quan h n s nh h ng c a t ng y u t n tu i th trung bình c a ph n , ta có th bi u di n th bi n thiên c a tu i th trung bình c a ph n (lifeexpf) v i t ng y u t , khi các y u t khác c gi không i. - Hình V.1: Tu i th trung bình c a ph n theo s con trung bình khi các y u t khác c gi nguyên (GDP trung bình /1 ng i =100 USD, t l dân s ng ô th = 50 %, t l dân bi t ch =50 %) - Hình V.2: Tu i th trung bình c a ph n theo GDP trung bình /1 ng i khi các y u t khác c gi nguyên (s con trung bình =5, t l dân s ng ô th = 50 %, t l dân bi t ch =50 %) - Hình V.3: Tu i th trung bình c a ph n theo t l dân s ng ô th khi các y u t khác c gi nguyên (s con trung bình =5, GDP trung bình /1 ng i =100 USD, t l dân bi t ch =50 %) - Hình V.4: Tu i th trung bình c a ph n theo t l dân bi t ch khi các y u t khác c gi nguyên (s con trung bình =5, GDP trung bình /1 ng i =100 USD, t l dân s ng ô th = 50 %) 13 Khi a các bi n nh tính vào mô hình ,ta ph i dùng các bi n g a (Dummy variable) ,n u bi n nh tính có (m) ph m trù thì ph i a vào mô hình (m-1) bi n g a 14 Qua th ta s có thê công c làm công tác d báo (forecast) h ac xây d ng chi n l c phát tri n v mô Nhóm th c hi n : Nhóm 2 Trang 16
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2