intTypePromotion=1

Tiểu luận: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới

Chia sẻ: Hfhgfvhgf Hfhgfvhgf | Ngày: | Loại File: PDF | Số trang:26

0
288
lượt xem
47
download

Tiểu luận: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tiểu luận: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới nhằm xây dựng phương trình của mô hình hồi đơn tuyến tính từ dữ liệu mẫu. Đánh giá độ phù hợp của mô hình, kiểm định các giả thiết. Kiểm định giả thiết về độ phù hợp của mô hình (phân tích phương sai).

Chủ đề:
Lưu

Nội dung Text: Tiểu luận: Xây dựng mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới

  1. BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH ----- ----- Môn: PHÂN TÍCH ĐNNH LƯỢNG Tiểu luận: Danh sách nhóm 7: Phạm Anh Tuấn Nguyễn Trọng An Hoàng Ngọc Lâm Đoàn Ngọc Châu Nguyễn Thành Sơn Tôn Thất Kỳ Nam 2009
  2. DANH SÁCH CÁC THÀNH VIÊN NHÓM 7 STT MSHV HỌ VÀ TÊN 1 MBA.0832 Phạm Anh Tuấn 2 MBA.0801 Nguyễn Trọng An 3 MBA.0814 Hoàng Ngọc Lâm 4 MBA.0805 Đoàn Ngọc Châu 5 MBA.0826 Nguyễn Thành Sơn 6 MBA.0816 Tôn Thất Kỳ Nam
  3. ĐẠI HỌC MỞ BÁN CÔNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TP HỒ CHÍ MINH Độc lập – Tự do – Hạnh phúc ------------- ------------------- ĐỀ KIỂM TRA MÔN: PHÂN TÍCH ĐNN H LƯỢN G LỚP: MBA8 Ghi chú: Sinh viên làm bài theo nhóm Yêu cầu: Sử dụng dữ liệu trong file World 95 Tieng Viet.sav đính kèm, bạn hãy tự xây dựng cho mình một mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. Bạn được tự do lựa chọn các biến giải thích để đưa vào mô hình cũng như tự quyết định dạng thức của các liên hệ giữa biến giải thích và biến kết quả. Hãy mô tả chi tiết quá trình xây dựng mô hình của bạn và tăng tính thuyết phục của mô hình này bằng các công cụ chNn đoán và đánh giá mô hình. Giải thích ý nghĩa các kết quả của mô hình rút ra. Sản phẩm nộp: 1. Bài làm dạng file Word (có ghi tên các thành viên của nhóm ở trang đầu) 2. File output SPSS Cả 2 file được đặt tên như sau MBA8_KT_nhomX (X là số thứ tự nhóm) Hình thức: File Word định dạng khổ giấy A4 (canh lề 2cm mỗi phía), font chữ Time N ew Roman, cỡ 12 points Cách đoạn (Spacing before) 6 points, giãn dòng (line spacing) 1.2 Chúc thành công!
  4. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 Mục Lục LỜI N ÓI ĐẦU. I. MÔ HÌN H HỒI QUI ĐƠN TUYẾN TÍN H: 1. Xây dựng phương trình của mô hình hồi đơn tuyến tính từ dữ liệu mẫu. 2. Đánh giá độ phù hợp của mô hình. 3. Kiểm định các giả thiết. a. Kiểm định giả thiết về độ phù hợp của mô hình (phân tích phương sai) b. Kiểm định giả thiết về ý nghĩa của hệ số hồi qui. 4. Vận dụng để xây dựng một mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới. II. MÔ HÌN H HỒI QUI TUYẾN TÍN H BỘI: 1. Xem xét ma trận hệ số tương quan. 2. Xây dựng mô hình. 3. Đánh giá độ phù hợp của mô hình hồi qui tuyến tính bội. 4. Kiểm định độ phù hợp của mô hình. 5. Ý nghĩa các hệ số hồi qui riêng phần trong mô hình. 6. Lựa chọn biến cho mô hình. KẾT LUẬN . ----- ----- Trang 1
  5. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 LỜI NÓI ĐẦU Phân tích định lượng là một môn khoa học về đo lường các mối quan hệ kinh tế xã hội diễn ra trong thực tế. N gày nay, nó là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính, nhằm định lượng các mối quan hệ kinh tế xã hội, dự báo khả năng phát triển hay diễn biến của các hiện tượng kinh tế xã hội và phân tích chính sách. Một khía cạnh quan trọng trong nghiên cứu kinh tế xã hội là nghiên cứu để tìm hiểu, đưa ra các quyết định thay đổi cho tương lai. Phán đoán tốt, trực giác và quan tâm đến thực trạng của nền kinh tế, môi trường kinh doanh và môi trường xã hội có thể cho người nghiên cứu một ý tưởng sơ bộ hay “cảm giác” về những gì có thể xảy ra trong tương lai. Tuy nhiên, chuyển từ cảm giác thành con số để có thể sử dụng một cách hiệu quả thì khá khó khăn. Phân tích dữ liệu thống kê giúp các nhà nghiên cứu và quản lý dự đoán thực tế phức tạp của kinh tế và xã hội trong tương lai ít rủi ro hơn. N hững người ra quyết định và người quản lý thành công nhất chính là những người có thể hiểu thông tin và sử dụng thông tin hiệu quả. Một trong những nội dung chính của môn phân tích định lượng là phân tích hồi qui – nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc) vào một hay nhiều biến khác (các biến độc lập), với ý tưởng là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập. Đây là nội dung chính của tiểu luận mà nhóm chúng em sẽ trình bày. N hân đây, chúng em muốn tỏ lòng biết ơn sâu sắc đến thầy Hoàng Trọng, người đã hết lòng tận tụy truyền đạt những kiến thức quý báu và chia sẻ những kinh nghiệm thực tế của bản thân cho khóa học MBA8 và chúng em cũng xin kính chúc Thầy được dồi dào sức khỏe và luôn luôn thành công trong con đường sự nghiệp. Tp.HCM, ngày 20 tháng 02 năm 2009 Các thành viên nhóm 7 Trang 2
  6. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 I. MÔ HÌNH HỒI QUI ĐƠN TUYẾN TÍNH: Một đồ thị phân tán là công cụ hữu ích có thể cho chúng ta thấy nhiều loại liên hệ giữa hai biến ta đang khảo sát. Một số dạng liên hệ thường gặp giữa hai biến định lượng: Không có tương quan Tương quan nghịch Tương quan thuận N gười ta dùng một số thống kê có tên là hệ số tương quan Pearson (ký hiệu là r) để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng. Trong đó: -1 ≤ r ≤ 1 r có thể âm hoặc dương, trị tuyệt đối của r tiến gần đến 1 khi hai biến có mối tương quan tuyến tính chặt chẽ. Trị tuyệt đối của r = 1 : Khi tất cả các điểm phân tán xếp thành một đường thẳng. Giá trị r = 0 : Khi hai biến không có mối liên hệ tuyến tính Phân tích hồi qui trước hết là đo mức độ tuyến tính giữa hai biến, nhằm ước lượng hay dự báo một biến trên cơ sở giá trị đã cho của một biến khác. Về mặt kỹ thuật, trong phân tích hồi qui, các biến không có tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên, biến giải thích là phi ngẫu nhiên, giá trị của chúng đã được xác định. 1. Xây dưng phương trình của mô hình hồi đơn tuyến tính từ dữ liệu mẫu: Xét mối liên hệ tuyến tính giữa một biến phụ thuộc và một biến độc lập. Mô hình được xây dựng từ dữ liệu mẫu có dạng đường thẳng như sau: Ŷi = B0 + B1*X Trong đó: Xi : là trị quan sát thứ i của biến độc lập Ŷi : là giá trị dự đoán (hay giá trị lý thuyết) thứ i của biến phụ thuộc, dấu mũ đại diện cho giá trị dự đoán. Trang 3
  7. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 B0 và B1 : là hệ số hồi qui. Phương pháp dùng để xác định B0 (tung độ của vị trí tại đó đường thẳng cắt trục tung) và B1 (độ dốc) là phương pháp bình phương nhỏ nhất thông thường (OLS – Ordinary Least Square), nghĩa là ta phải tìm ra Ŷi sao cho nó càng gần với giá trị thực (Yi) càng tốt. Đường thẳng được tìm ra dựa trên nguyên tắc nó cực tiểu hóa tổng các độ lệch bình phương giữa tung độ của các điểm dữ liệu quan sát và đường thẳng. Khi chỉ có một biến độc lập thì mô hình hồi qui tuyến tính tổng thể có thể được mô tả như sau: Yi = β0 + β1 * X + ei β1, β0 : là các hệ số độ dốc và hằng số của tổng thể ei : sai số thực, là chênh lệch giữa giá trị thực Yi quan sát được và giá trị dự báo (do ảnh hưởng của các yếu tố khác chưa nghiên cứu tới), tức là: ei = (Y - Ŷi) = Yi – (β0 + β1 * X) 2. Đánh giá độ phù hợp của mô hình: Một công việc quan trọng của bất kỳ thủ tục thống kê xây dựng mô hình từ dữ liệu mẫu nào cũng đều là chứng minh sư phù hợp của mô hình. Để biết mô hình hồi qui tuyến tính đã xây dựng phù hợp đến mức độ nào, ta dùng một thước đo là hệ số xác định R2 (Coefficient of Determination). SSR R2 = 0 ≤ R2 ≤ 1 SST Trong đó: SST (Total Sum of Squares) : là tổng bình phương của tất cả các sai lệch giữa các giá trị quan sát Yi với giá trị trung bình của chúng. SSR (Sum of Squares explained by Regression) : là tổng bình phương của tất cả các sai lệch giữa giá trị của biến Y tính theo hàm hồi qui mẫu với giá trị trung bình. Phần này đo độ chính xác của hàm hồi qui. Mặt khác: SST = SSR + SSE N ếu R2 = 1 : thì đường hồi qui phù hợp “hoàn hảo”, tất cả sai lệch của Y (so với giá trị trung bình) đều giải thích được bởi mô hình hồi qui. N ếu R2 = 0 : chứng tỏ các biến X và Y không có quan hệ. N ếu hàm hồi qui mẫu phù hợp tốt với các số liệu quan sát thì SSR sẽ càng lớn hơn SSE. N ếu tất cả các giá trị quan sát của Yi đều nằm trên đường hồi qui (Ŷ) thì SSR sẽ bằng SST và do đó SSE=0. N gược lại, nếu hàm hồi qui mẫu kém phù hợp với các giá trị quan sát thì SSE sẽ càng lớn hơn SSR. (xem hình) Trang 4
  8. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 3. Kiểm định các giả thiết: Ta tiến hành qua hai bước sau: a. Kiểm định giả thiết về độ phù hợp của mô hình (phân tích phương sai): Xây dựng xong mô hình hồi qui tuyến tính, ta phải xem xét độ phù hợp của mô hình đối với tập dữ liệu qua giá trị R2. Để kiểm định độ phù hợp của mô hình hồi qui tổng thể, ta đặt giả thiết R2=0. N ếu sau khi kiểm định ta có đủ bằng chứng bác bỏ giả thiết H0 : R2 pop=0 thì kết luận mô hình hồi qui tuyến tính xây dựng được phù hợp với tổng thể. Đại lượng F được sử dụng cho kiểm định này. N ếu xác suất F nhỏ thì giả thiết R2pop=0 bị bác bỏ. Tính F theo công thức sau: N ^ ∑ ( Y - Y) i =1 2 p F= N ^ ∑ (Y i =1 i − Yi ) 2 N − p −1 Trong SPSS, số liệu tính F được lấy từ bảng phân tích phương sai ANOVA(b): MeanSquare Re gression F= Mean Square Re sidual b. Kiểm định giả thiết về ý nghĩa của hệ số hồi qui: Mặc dù mô hình hồi qui tuyến tính mẫu ta xây dựng được có giá trị độ dốc B1 ≠ 0, nhưng ta chưa thể chắc chắn độ dốc của mô hình tổng thể khác 0. Vì vậy, ta phải làm kiểm định để có kết luân về β1. Giả thiết dùng để kiểm định giả thiết này là H0: β1=0, ta kỳ vọng giả thiết này sẽ bị bác bỏ vì nếu β1=0, nghĩa là Y độc lập với X. Do đó, mối quan hệ tương quan tuyến tính ta nhận thấy ở mẫu xảy ra là do ngẫu nhiên, mô hình hồi qui tuyến tính ta đã xây dựng được dựa trên một mối quan hệ “giả” giữa hai biến. Trị thống kê dùng để kiểm định giả thiết là: B1 t= S B1 Trong SPSS, ta xem số liệu ở hai cột cuối cùng (là t và Sig. - hệ số độ dốc) trong bảng Coefficients(a): Trang 5
  9. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 4. Vận dụng để xây dựng một mô hình hồi quy giải thích sự khác biệt về tuổi thọ phụ nữ giữa các quốc gia trên thế giới: Trong mô hình này, với: Tuổi thọ TB của phụ nữ là biến phụ thuộc Lần lượt xét từng chỉ tiêu còn lại với vai trò là biến độc lập. Trong SPSS, ta thực hiện các thao tác sau: Graphs / Scatter … : để vẽ đồ thị phân tán cho từng cặp biến (giữa biến phụ thuộc với một biến độc lập). Analyze / Correlate / Bivariate … : để tính được r của mẫu và thực hiện kiểm định giả thiết về hệ số tương quan tuyến tính của tổng thể. Analyze / Regression / Linear … : Xây dựng mô hình hồi qui đơn tuyến tính a. Vẽ đồ thị phân tán cho từng cặp biến: + Tuổi thọ trung bình của phụ nữ theo Số lượng dân: 90 Correlations 80 Tuoåi thoï TB Soá löôïng phuï nöõ daân 70 Pearson Correlation 1 -.071 Tuæi thä TB cña phô n÷ Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .461 60 N 109 109 Pearson Correlation -.071 1 50 Soá löôïng daân Sig. (2-tailed) .461 . N 109 109 40 -200000 200000 600000 1000000 1400000 0 400000 800000 1200000 Sè l−îng d©n Trang 6
  10. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 + Tuổi thọ trung bình phụ nữ với Mật độ dân số (người/Km2): 90 Correlations 80 Maät ñoä daân Tuoåi thoï TB soá phuï nöõ (ngöôøi/km2) 70 Pearson Correlation 1 .128 Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .186 60 N 109 109 Tuæi thä TB phô n÷ Pearson Correlation .128 1 Maät ñoä daân soá (ngöôøi/km2) Sig. (2-tailed) .186 . 50 N 109 109 40 -1000 0 1000 2000 3000 4000 5000 6000 MËt ®é d©n sè (ng−êi/Km2) + Tuổi thọ trung bình phụ nữ với Tỉ lệ dân sống ở vùng đô thị (%): 90 Correlations Tæ leä daân 80 Tuoåi thoï TB soáng ôû vuøng phuï nöõ ñoâ thò (%) Pearson Correlation 1 .743(**) 70 Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 N 109 108 60 Tuæi thä TB phô n÷ Pearson Correlation .743(**) 1 Tæ leä daân soáng ôû vuøng Sig. (2-tailed) .000 . ñoâ thò (%) 50 N 108 108 ** Correlation is significant at the 0.01 level (2-tailed). 40 0 20 40 60 80 100 120 TØ lÖ d©n sèng ë vïng ®« thÞ (%) + Tuổi thọ trung bình phụ nữ với Tỉ lệ dân biết chữ (%): 90 Correlations 80 Tuoåi thoï TB Tæ leä daân bieát phuï nöõ chöõ (%) Pearson 1 .865(**) 70 Correlation Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 N 109 107 60 Tuæi thä TB phô n÷ Pearson .865(**) 1 Correlation Tæ leä daân bieát chöõ (%) Sig. (2-tailed) .000 . 50 N 107 107 40 ** Correlation is significant at the 0.01 level (2-tailed). 0 20 40 60 80 100 120 TØ lÖ d©n biÕt ch÷ (%) Trang 7
  11. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 + Tuổi thọ trung bình phụ nữ với Tốc độ tăng dân số (%/năm): 90 Correlations 80 Toác ñoä taêng Tuoåi thoï daân soá TB phuï nöõ (%/naêm) 70 Pearson Correlation 1 -.579(**) Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 60 N 109 109 Tuæi thä TB phô n÷ Pearson Correlation -.579(**) 1 Toác ñoä taêng daân soá Sig. (2-tailed) .000 . 50 (%/naêm) N 109 109 ** Correlation is significant at the 0.01 level (2-tailed). 40 -1 0 1 2 3 4 5 6 Tèc ®é t¨ng d©n sè (%/n¨m) + Tuổi thọ trung bình phụ nữ với Tỉ suất tử trẻ sơ sinh o/oo: 90 Correlations 80 Tuoåi thoï Tæ suaát töû treû TB phuï nöõ sô sinh o/oo Pearson 70 1 -.962(**) Correlation Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 N 109 109 60 Tuæi thä TB phô n÷ Pearson -.962(**) 1 Correlation Tæ suaát töû treû sô sinh o/oo Sig. (2-tailed) .000 . 50 N 109 109 ** Correlation is significant at the 0.01 level (2-tailed). 40 -100 0 100 200 TØ suÊt tö trÎ s¬ sinh o/oo + Tuổi thọ trung bình phụ nữ với GDP tính trên đầu người (USD): 90 Correlations 80 GDP tính Tuoåi thoï treân ñaàu TB phuï nöõ ngöôøi (USD) 70 Pearson 1 .642(**) Correlation Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 60 Tuæi thä TB phô n÷ N 109 109 Pearson .642(**) 1 50 Correlation GDP tính treân ñaàu ngöôøi (USD) Sig. (2-tailed) .000 . 40 N 109 109 -10000 0 10000 20000 30000 ** Correlation is significant at the 0.01 level (2-tailed). GDP tÝnh trªn ®Çu ng−êi (USD) Trang 8
  12. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 + Tuổi thọ trung bình phụ nữ với Calori nạp hàng ngày trung bình một người: 90 Correlations 80 Calori naïp Tuoåi thoï haøng ngaøy TB phuï nöõ TB 1 ngöôøi 70 Pearson Correlation 1 .775(**) Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 60 N 109 75 Tuæi thä TB phô n÷ Pearson Correlation .775(**) 1 Calori naïp haøng ngaøy TB 50 Sig. (2-tailed) .000 . 1 ngöôøi N 75 75 40 ** Correlation is significant at the 0.01 level (2-tailed). 1000 2000 3000 4000 Calori n¹p hμng ngμy TB mét ng−êi + Tuổi thọ trung bình phụ nữ với Tỉ suất sinh o/oo: 90 Correlations 80 Tuoåi thoï TB Tæ suaát sinh phuï nöõ o/oo Pearson 1 -.862(**) 70 Correlation Tuoåi thoï TB phuï nöõ Sig. (2- . .000 tailed) 60 N 109 109 Tuæi thä TB phô n÷ Pearson -.862(**) 1 Correlation 50 Tæ suaát sinh o/oo Sig. (2- .000 . tailed) N 109 109 40 ** Correlation is significant at the 0.01 level (2-tailed). 0 10 20 30 40 50 60 TØ suÊt sinh o/oo + Tuổi thọ trung bình phụ nữ với Số con trung bình của một phụ nữ: 90 Correlations 80 Tuoåi thoï Soá con TB TB phuï nöõ cuûa 1 phuï nöõ 70 Pearson 1 -.838(**) Correlation Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 60 N 109 107 Tuæi thä TB phô n÷ Pearson -.838(**) 1 Correlation Soá con TB cuûa 1 50 phuï nöõ Sig. (2-tailed) .000 . N 107 107 40 ** Correlation is significant at the 0.01 level (2-tailed). 1 2 3 4 5 6 7 8 9 Sè con TB cña mét phô n÷ Trang 9
  13. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 + Tuổi thọ trung bình phụ nữ với Tỉ lệ nữ giới biết chữ (%): 90 Correlations 80 Tuoåi thoï Tæ leä nöõ giôùi TB phuï nöõ bieát chöõ (%) Pearson 1 .819(**) 70 Correlation Tuoåi thoï TB phuï nöõ Sig. (2-tailed) . .000 N 109 85 60 Pearson Tuæi thä TB phô n÷ .819(**) 1 Correlation Tæ leä nöõ giôùi bieát chöõ (%) Sig. (2-tailed) .000 . 50 N 85 85 ** Correlation is significant at the 0.01 level (2-tailed). 40 0 20 40 60 80 100 120 TØ lÖ n÷ giíi biÕt ch÷ (%) b. Hệ số tượng quan r: Quan sát trên các bảng Correlations, tại vị trí (**), ta chọn giá trị nào mà có giá trị tuyệt đối của nó càng tiến gần đến 1, điều đó có nghĩa là hai biến có mối tương quan tuyến tính chặt chẽ. Ta có thể chọn một trong các biến sau làm biến giải thích: Tương quan thuận: Tỉ lệ dân sống ở vùng đô thị, ứng với r = 0.743 Tỉ lệ dân biết chữ (%), ứng với r = 0.865 Calori nạp hàng ngày TB một người, ứng với r = 0.775 Tỉ lệ nữ giới biết chữ (%), ứng với r = 0.819 Tương quan nghịch: Tỉ suất tử trẻ sơ sinh o/oo, ứng với r = -0.962 Tỉ suất sinh, ứng với r = -0.862 Số con TB của một phụ nữ, ứng với r = -0.838 Trong các trường hợp nêu trên, em xin chọn biến “Số con TB của một phụ nữ” làm biến giải thích. Trang 10
  14. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 c. Xây dưng phương trình của mô hình hồi đơn tuyến tính từ dữ liệu mẫu: Sử dụng SPSS để tính toán ra đường thẳng này, bằng cách vào menu Analyze / Regression / Linear … Với biến: Phụ thuộc (Dependent) là “Tuổi thọ TB phụ nữ” Và biến độc lập (Independents) là “Số con TB của một phụ nữ” Kết quả thu được như sau: Regression Variables Entered/Removed(b) Model Variables Entered Variables Removed Method 1 Soá con TB cuûa 1 phuï nöõ(a) . Enter a All requested variables entered. b Dependent Variable: Tuoåi thoï TB phuï nöõ Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 .838(a) .702 .699 5.827 a Predictors: (Constant), Soá con TB cuûa 1 phuï nöõ ANOVA(b) Sum of Mean Model df F Sig. Squares Square 1 Regression 8379.723 1 8379.723 246.790 .000(a) Residual 3565.267 105 33.955 Total 11944.991 106 a Predictors: (Constant), Soá con TB cuûa 1 phuï nöõ b Dependent Variable: Tuoåi thoï TB phuï nöõ Coefficients(a) Unstandardized Standardized Model t Sig. Coefficients Coefficients B Std. Error Beta 1 (Constant) 86.661 1.200 72.194 .000 Soá con TB cuûa 1 phuï nöõ -4.674 .297 -.838 -15.710 .000 a Dependent Variable: Tuoåi thoï TB phuï nöõ Trang 11
  15. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 Từ bảng Coefficients(a) cho ta biết được thông tin về hệ số hồi qui mà phương pháp OLS ước lượng được, độ dốc và hằng số được thể hiện trong cột B. Ta viết được phương trình hồi qui tuyến tính đơn biến có dạng sau: Ŷi = 86.661 – 4.674*X Hay : Tuổi thọ TB phụ nữ = 86.661 – 4.674 * Số con TB của một phụ nữ Ý nghĩa của hàm hồi qui này: Với B1= -4.674 < 0 cho biết: xét tuổi thọ trung bình phụ nữ giữa các quốc gia trên thế giới nằm trong khoảng (43; 82), khi số con tăng lên 1 thì tuổi thọ trung bình phụ nữ giảm khoảng 4.674 tuổi. d. Đánh giá độ phù hợp của mô hình: Từ bảng Model Summary, ta có R Square = 0.702 (tiến gần đến 1). Vậy mô hình này là phù hợp. e. Kiểm định các giả thiết: Kiểm định giả thiết về độ phù hợp của mô hình (phân tích phương sai): Ta đặt giả thiết R2=0. N ếu sau khi kiểm định ta có đủ bằng chứng bác bỏ giả thiết H0 : R2 pop=0 thì kết luận mô hình hồi qui tuyến tính xây dựng được phù hợp với tổng thể. ANOVA(b) Model Sum of Squares df Mean Square F Sig. 1 Regression 8379.723 1 8379.723 246.790 .000(a) Residual 3565.267 105 33.955 Total 11944.991 106 a Predictors: (Constant), Soá con TB cuûa 1 phuï nöõ b Dependent Variable: Tuoåi thoï TB phuï nöõ Từ bảng AN OVA(b) tương ứng với mức ý nghĩa quan sát được là 0.0001 (cột Sig.). Ta an toàn bác bỏ giả thiết H0 và kết luận mô hình hồi qui tuyến tính xây dựng được phù hợp với tổng thể. Trang 12
  16. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 Kiểm định giả thiết về ý nghĩa của hệ số hồi qui: Giả thiết dùng để kiểm định giả thiết này là H0: β1=0, ta kỳ vọng giả thiết này sẽ bị bác bỏ vì nếu β1=0, nghĩa là Y độc lập với X. Coefficients(a) Standardized Model Unstandardized Coefficients t Sig. Coefficients B Std. Error Beta 1 (Constant) 86.661 1.200 72.194 .000 Soá con TB cuûa -4.674 .297 -.838 -15.710 .000 1 phuï nöõ a Dependent Variable: Tuoåi thoï TB phuï nöõ Từ bảng Coefficients(a), ta thấy mức ý nghĩa quan sát được đối với hệ số độ dốc của Tuổi thọ trung bình phụ nữ = 0.0001. Chứng tỏ rằng giả thiết H0: β1=0 bị bác bỏ. Vậy độ dốc của mô hình tổng thể khác 0 (hay β1 ≠ 0). II. MÔ HÌNH HỒI QUI TUYẾN TÍNH BỘI: Trên thực tế, mô hình hồi qui đơn biến (có 2 biến) là không thỏa đáng, những lý thuyết kinh tế ít khi đơn giản như vậy. Do đó, ta phải xem xét mô hình hồi qui có nhiều hơn hai biến. Đó là mô hình hồi qui bội. Các bước thực hiện cũng giống như mô hình hồi qui đơn tuyến tính. Mô hình hồi quy bội mở rộng mô hình hồi qui hai biến bằng cách thêm vào một số biến độc lập để giải thích tốt hơn cho biến phụ thuộc. Mô hình có dạng sau: Yi = βo + β1X1i + β2X2i + β3X3i + … + βpXpi + ei Trong đó: Xpi : Biểu hiện giá trị của biến độc lập thứ p tại quan sát thứ i. βk : Là hệ số hồi qui riêng phần (Partial RegressionCoefficients) ei : Là một biến độc lập ngẫu nhiên có phân phối chuNn với trung bình là 0 và phương sai không đổi σ2. Một giả định quan trọng đối với mô hình hồi qui tuyến tính là không có biến giải thích nào có thể được biểu thị dưới dạng tổ hợp tuyến tính với những biến giải thích còn lại. N ếu tồn tại một quan hệ tuyến tính như vậy, khi đó xảy ra hiện tượng đa cộng tuyến. Trang 13
  17. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 1. Xem xét ma trận hệ số tương quan: Đầu tiên, khi tiến hành phân tích hồi qui tuyến tính bội là xem xét các mối tương quan tuyến tính giữa tất cả các biến, xem xét tổng quát mối quan hệ giữa từng biến độc lập với biến phụ thuộc và chính giữa các biến độc lập với nhau. Ta xây dựng ma trận tương quan giữa tất cả các biến cho mục đích này. Trong tiểu luận này, ta xem xét Tuổi thọ trung bình phụ nữ giữa các quốc gia trên thế giới phụ thuộc như thế nào vào: Tỉ lệ dân sống ở vùng đô thị (%). Calori nạp hàng ngày trung bình một người. Số con trung bình của một phụ nữ. Tỷ lệ nữ giới biết chữ. Sử dụng SPSS, ta có ma trận sau: Correlations Calori naïp Soá con TB Tæ leä nöõ giôùi Tuoåi thoï Tæ leä daân soáng ôû haøng ngaøy cuûa 1 phuï bieát chöõ TB phuï nöõ vuøng ñoâ thò (%) TB 1 ngöôøi nöõ (%) Tuoåi thoï TB phuï nöõ Pearson Correlation 1 .743(**) .775(**) -.838(**) .819(**) Sig. (2-tailed) . .000 .000 .000 .000 N 109 108 75 107 85 Tæ leä daân soáng ôû Pearson Correlation .743(**) 1 .692(**) -.619(**) .612(**) vuøng ñoâ thò (%) Sig. (2-tailed) .000 . .000 .000 .000 N 108 108 74 106 85 Calori naïp haøng Pearson Correlation .775(**) .692(**) 1 -.696(**) .548(**) ngaøy TB 1 ngöôøi Sig. (2-tailed) .000 .000 . .000 .000 N 75 74 75 75 59 Soá con TB cuûa 1 Pearson Correlation -.838(**) -.619(**) -.696(**) 1 -.839(**) phuï nöõ Sig. (2-tailed) .000 .000 .000 . .000 N 107 106 75 107 85 Tæ leä nöõ giôùi bieát Pearson Correlation .819(**) .612(**) .548(**) -.839(**) 1 chöõ (%) Sig. (2-tailed) .000 .000 .000 .000 . N 85 85 59 85 85 ** Correlation is significant at the 0.01 level (2-tailed). Trang 14
  18. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 Trong mô hình hồi qui bội với nhiều biến độc lập, biến nào có trị tuyệt đối của hệ số tương quan càng lớn thì liên hệ tuyến tính càng mạnh. Bảng Correlations cho thấy tương quan giảm dần giữa các biến độc lập với Tuổi thọ trung bình phụ nữ như sau: Số con trung bình của một phụ nữ. (r = 0.838) Tỉ lệ nữ giới biết chữ (%). (r = 0.819) Calori nạp hàng ngày trung bình một người. (r = 0.775) Tỉ lệ dân sống ở vùng đô thị (%). (r = 0.743) Các số 1 trên đường chéo là hệ số tương quan tính được giữa một biến với chính nó. Ta chỉ cần quan tâm đến tam giác phía trên hay tam giác phía dưới đường chéo, vì chúng đối xứng nhau qua đường chéo. Từ bảng Correlations ta thấy: Hệ số tương quan giữa Tuổi thọ trung bình phụ nữ và các biến độc lập còn lại đều cao (thấp nhất là 0.743). Sơ bộ ta có thể kết luận các biến độc lập này có thể đưa vào mô hình để giải thích cho Tuổi thọ trung bình phụ nữ. 2. Xây dựng mô hình: Sử dụng SPSS ta có các bảng số liệu sau: Regression Variables Entered/Removed(b) (Bảng 01) Model Variables Entered Variables Removed Method 1 Tæ leä nöõ giôùi bieát chöõ (%), Calori naïp haøng ngaøy TB 1 ngöôøi, Tæ leä daân soáng ôû vuøng ñoâ . Enter thò (%), Soá con TB cuûa 1 phuï nöõ(a) a All requested variables entered. b Dependent Variable: Tuoåi thoï TB phuï nöõ Model Summary (Bảng 02) Model R R Square Adjusted R Square Std. Error of the Estimate 1 .901(a) .812 .798 4.977 a Predictors: (Constant), Tæ leä nöõ giôùi bieát chöõ (%), Calori naïp haøng ngaøy TB 1 ngöôøi, Tæ leä daân soáng ôû vuøng ñoâ thò (%), Soá con TB cuûa 1 phuï nöõ Trang 15
  19. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 ANOVA(b) (Bảng 03) Model Sum of Squares df Mean Square F Sig. 1 Regression 5780.805 4 1445.201 58.348 .000(a) Residual 1337.500 54 24.769 Total 7118.305 58 a Predictors: (Constant), Tæ leä nöõ giôùi bieát chöõ (%), Calori naïp haøng ngaøy TB 1 ngöôøi, Tæ leä daân soáng ôû vuøng ñoâ thò (%), Soá con TB cuûa 1 phuï nöõ b Dependent Variable: Tuoåi thoï TB phuï nöõ Coefficients(a) (Bảng 04) Standardized Model Unstandardized Coefficients t Sig. Coefficients B Std. Error Beta 1 (Constant) 47.467 7.016 6.765 .000 Tæ leä daân soáng ôû vuøng ñoâ .110 .039 .251 2.811 .007 thò (%) Calori naïp haøng ngaøy TB 1 .005 .002 .216 2.525 .015 ngöôøi Soá con TB cuûa 1 phuï nöõ -1.648 .646 -.275 -2.550 .014 Tæ leä nöõ giôùi bieát chöõ (%) .128 .046 .312 2.764 .008 a Dependent Variable: Tuoåi thoï TB phuï nöõ 3. Đánh giá độ phù hợp của mô hình hồi qui tuyến tính bội: Mô hình càng có nhiều biến độc lập vào thì R2 càng tăng. Tuy nhiên, không phải mô hình càng có nhiều biến thì càng phù hợp hơn với dữ liệu. N hư vậy, R2 có khuynh hướng là một ước lượng lạc quan của thước đo sự phù hợp của mô hình đối với dữ liệu trong trường hợp có hơn 1 biến giải thích trong mô hình. Mô hình thường không phù hợp với dữ liệu thực tế như giá trị R2 thể hiện. Trong tình huống này, R2 điều chỉnh (Adjusted R Square thể hiện ở cột thứ 4 trong bảng 02) từ R2 được sử dụng để phản ảnh sát hơn mức độ phù hợp của mô hình hồi qui tuyến tính đa biến. R2 điều chỉnh không nhất thiết tăng lên khi nhiều biến được thêm vào phương trình, nó là thước đo sự phù hợp được sử dụng cho tình huống hồi qui tuyến tính đa biến vì nó không phụ thuộc vào độ lệch phóng đại của R2. R2 điều chỉnh được tính như sau: p (1 − R 2 ) R =R − 2 2 N − p −1 Trong đó: P : là biến độc lập trong phương trình. Trang 16
  20. Tiểu luận: Phân Tích Định Lượng N hóm 7 - MBA8 Model Summary (Bảng 02) Model R R Square Adjusted R Square Std. Error of the Estimate 1 .901(a) .812 .798 4.977 a Predictors: (Constant), Tæ leä nöõ giôùi bieát chöõ (%), Calori naïp haøng ngaøy TB 1 ngöôøi, Tæ leä daân soáng ôû vuøng ñoâ thò (%), Soá con TB cuûa 1 phuï nöõ Trong bảng 02, so sánh 2 giá trị R Square và Adjusted R Square, ta thấy Adjusted R Square nhỏ hơn, dùng nó đánh giá độ phù hợp của mô hình sẽ an toàn hơn vì nó không thổi phồng mức độ phù hợp của mô hình. 4. Kiểm định độ phù hợp của mô hình: Kiểm định F sử dụng trong bảng phân tích phương sai là một phép kiểm định giả thiết về độ phù hợp của mô hình hồi qui tuyến tính tổng thể. Ý tưởng của kiểm định này là xem biến phụ thuộc Y có liên hệ tuyến tính với toàn bộ các biến độc lập hay không. Giả thiết Ho : β1 = β2 = β3 = β4 =0 N ếu giả thiết Ho bị bác bỏ thì ta kết luận là kết hợp của các biến hiện có trong mô hình có thể giải thích được thay đổi của Y, điều này cũng có nghĩa là mô hình ta xây dựng phù hợp với tập dữ liệu. ANOVA(b) (Bảng 03) Model Sum of Squares df Mean Square F Sig. 1 Regression 5780.805 4 1445.201 58.348 .000(a) Residual 1337.500 54 24.769 Total 7118.305 58 a Predictors: (Constant), Tæ leä nöõ giôùi bieát chöõ (%), Calori naïp haøng ngaøy TB 1 ngöôøi, Tæ leä daân soáng ôû vuøng ñoâ thò (%), Soá con TB cuûa 1 phuï nöõ b Dependent Variable: Tuoåi thoï TB phuï nöõ Trị thống kê F được tính từ giá trị R Square của mô hình đầy đủ, giá trị Sig. rất nhỏ cho thấy ta an toàn bác bỏ giả thiết Ho cho rằng tất cả các hệ số hồi qui bằng 0 (ngoại trừ hằng số) mô hình hồi qui tuyến tính bội của ta phù hợp với tập dữ liệu và có thể sử dụng được. Trang 17
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2