Bài giảng Phương pháp nghiên cứu: Chương 5 - Nguyễn Hùng Phong

Chia sẻ: Dsgvfdcx Dsgvfdcx | Ngày: | Loại File: PDF | Số trang:59

0
40
lượt xem
11
download

Bài giảng Phương pháp nghiên cứu: Chương 5 - Nguyễn Hùng Phong

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục tiêu chương 5 Hàm tương quan đa biến thuộc bài giảng phương pháp nghiên cứu nhằm giúp giúp sinh viên hiểu việc xây dựng mô hình với việc phân tích đa biến, thực hiện việc xây dựng hàm tương quan đa biến, phân tích và lý giải kết quả của hàm tương quan đa biến, thực hiện các phép kiểm định thống kê với hàm tương quan đa biến.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Phương pháp nghiên cứu: Chương 5 - Nguyễn Hùng Phong

  1. Hàm tương quan đa biến Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-1
  2. Mục tiêu học tập  Thông hiểu việc xây dựng mô hình với việc phân tích đa biến  Thực hiện việc xây dựng hàm tương quan đa biến.  Phân tích và lý giải kết quả của hàm tương quan đa biến  Thực hiện các phép kiểm định thống kê với hàm tương quan đa biến Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-2
  3. Mô hình của hàm tương quan đa biến Hàm tương quan của đám đông Y-intercept Population slopes Random Error y  β0  β1x1  β2 x 2    βk x k  ε Hàm tương quan ước lượng Estimated Estimated (or predicted) Estimated slope coefficients intercept value of y ˆ y  b0  b1x1  b2 x 2    bk x k Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-3
  4. Mô hình của hàm tương quan đa biến (trường hợp hai biến) Mô hình hai biến y ˆ y  b0  b1x1  b2 x 2 x2 x1 Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-4
  5. Mô hình của hàm tương quan đa biến (trường hợp hai biến) Hai biến y Quan sát thực tế yi ˆ y  b0  b1x1  b2 x 2 < yi < e = (y – y) x2i x2 x1i Hàm tương quan sẽ có độ chính xác của ướclượng x1 cao khi tối thiểu hóa tổng Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. bình phương sai lệch: Chap 14-5 e2
  6. Multiple Regression Assumptions Sai lệch (errors) hay phần dư (residuals): < e = (y – y)  Giả thuyết  Các sai lệch có phân phối chuẩn  Bình quân của các sai lệch co giá trị bằng 0  Phương sai của các sai lệch là cố định  Các sai lệch hoàn toàn độc lập Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-6
  7. Ma trận hệ số tương quan  Ma trận hệ số tương quan giữa biến phụ thuôc và các biến độc lập được tính trên Excel:  Tools / Data Analysis… / Correlation  Kiểm tra độ tin cậy thống kê của các hệ số tương quan với phép kiểm định t Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-7
  8. Ví dụ  Một nhà sản xuất bánh nướng muốn đánh giá sự tác động của giá cả và quảng cáo đến sản lượng hàng bán ra  Biến phụ thuộc: Sản lượng (Chiếc mỗi tuần)  Biến độc lập: giá cả ($) và chi phí quảng cáo (đơn vị $100/tuần)  Thông tin được thu thập liên tục trong 15 tuần Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-8
  9. Hàm tương quan đa biến Pie Price Advertising Week Sales ($) ($100s) Multiple regression model: 1 350 5.50 3.3 2 460 7.50 3.3 3 350 8.00 3.0 Sales = b0 + b1 (Price) 4 430 8.00 4.5 5 350 6.80 3.0 + b2 (Advertising) 6 380 7.50 4.0 7 430 4.50 3.0 8 470 6.40 3.7 Correlation matrix: 9 450 7.00 3.5 Pie Sales Price Advertising 10 490 5.00 4.0 Pie Sales 1 11 340 7.20 3.5 Price -0.44327 1 12 300 7.90 3.2 Advertising 0.55632 0.03044 1 13 440 5.90 4.0 14 450 5.00 3.5 15 300 7.00 2.7 Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-9
  10. Giải thích ý nghĩa các hệ số tương quan (bi)  bi  Giá trị trung bình của y sẽ thay đổi bi đơn vị khi gia tăng một đơn vị Xi, giả định rằng các biến khác đều cố định  Hằng số tương quan (b0)  Giá trị trung bình của y khi mọi biến Xi đều bằng 0. Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-10
  11. Kết quả của hàm tương quan đa biến Regression Statistics Multiple R 0.72213 R Square 0.52148 Adjusted R Square 0.44172 Standard Error 47.46341 Sales  306.526 - 24.975(Pri ce)  74.131(Adv ertising) Observations 15 ANOVA df SS MS F Significance F Regression 2 29460.027 14730.013 6.53861 0.01201 Residual 12 27033.306 2252.776 Total 14 56493.333 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404 Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392 Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888 Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-11
  12. Hệ số xác định của hàm tương quan đa biến  Tỷ lệ % biến thiên của y có thể giải thích bởi sự biến thiên đồng thời của tất cả các Xi ESS Sum of squares regression 2 R   TSS Total sum of squares Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-12
  13. Hệ số xác định của hàm tương quan đa biến (continued) Regression Statistics Multiple R 0.72213 SSR 29460.0 2 R    .52148 R Square 0.52148 SST 56493.3 Adjusted R Square 0.44172 Standard Error 47.46341 52.1% of the variation in pie sales Observations 15 is explained by the variation in price and advertising ANOVA df SS MS F Significance F Regression 2 29460.027 14730.013 6.53861 0.01201 Residual 12 27033.306 2252.776 Total 14 56493.333 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404 Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392 Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888 Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-13
  14. Hệ số xác định đã điều chỉnh (Adjusted R2)  R2 hầu như không bao giờ giảm khi chúng ta thêm biến độc lập mới vào mô hình  Gây khó khăn trong việc so sánh các mô hình trước và sau khi thêm biến mới  Tác đông thực khi thêm biến mới  Chúng ta sẽ giãm bậc tự do khi có biến mới thêm vào.  Việc thêm biến mới có đũ năng lực giải thích để bù đấp cho sự mất mát khi giãm bậc tự do hay không? Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-14
  15. Hệ số xác định đã điều chỉnh (Adjusted R2) (continued)  Thể hiện % tổng biến thiên của y có thể giải thích đượcbởi tất cả các biến Xi đã được điều chỉnh cho số biến sử dụng 2  n 1  2 R  1  (1  R ) A   n  k  1 (n = Cở mẩu, k = số lượng các biến độc lập) Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-15
  16. Hệ số xác định đã điều chỉnh (Adjusted R2) Tác dụng của việc sử dụng R2 đã điều chỉnh  Trừng phạt việc đưa quá nhiều biến không cần thiết vào mô hình  Hữu dụng trong việc so sánh mô hình Thường giá trị của nó nhỏ hơn R2 Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-16
  17. Hệ số xác định đã điều chỉnh (Adjusted R2) (continued) Regression Statistics Multiple R 0.72213 R 2  .44172 A R Square 0.52148 Adjusted R Square 0.44172 44.2% of the variation in pie sales is Standard Error 47.46341 explained by the variation in price and Observations 15 advertising, taking into account the sample size and number of independent variables ANOVA df SS MS F Significance F Regression 2 29460.027 14730.013 6.53861 0.01201 Residual 12 27033.306 2252.776 Total 14 56493.333 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404 Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392 Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888 Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-17
  18. Kiểm tra độ tin cậy của mô hình tương quan  Dùng kiểm định F  Thể hiện tất cả các biến đôc lập có mối quan hệ tương quan tuyến tính với biến phụ thuộc y hay không?  Giả thuyết :  H0: β1 = β2 = … = βk = 0 (không có quan hệ tuyến tính)  HA: Tối thiểu có βi ≠ 0 (Tối thiểu có một biến có quan hệ tuyến tính với y) Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-18
  19. Cách xác định kiểm định F (continued)  Giá trị F tính toán: ESS k MESS F  RSS MRSS n  k 1 where F has (numerator) D1 = k and (denominator) D2 = (n – k - 1) degrees of freedom Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-19
  20. Kết quả kiểm định F trên Excel (continued) Regression Statistics Multiple R 0.72213 R Square 0.52148 MSR 14730.0 F   6.5386 Adjusted R Square 0.44172 MSE 2252.8 Standard Error 47.46341 With 2 and 12 degrees P-value for Observations 15 of freedom the F-Test ANOVA df SS MS F Significance F Regression 2 29460.027 14730.013 6.53861 0.01201 Residual 12 27033.306 2252.776 Total 14 56493.333 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404 Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392 Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888 Business Statistics: A Decision-Mak ing Approach, 6e © 2005 Prentice-Hall, Inc. Chap 14-20

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản