Bài giảng Phân tích dữ liệu và dự báo: Chương 3 - Trường ĐH Quy Nhơn
lượt xem 7
download
Bài giảng Phân tích dữ liệu và dự báo: Chương 3 Phương pháp phân tích hồi quy, cung cấp cho người đọc những kiến thức như: Mô hình hồi quy đơn; Mô hình hồi quy bội; Suy diễn thống kê và dự báo; Ước lượng khoảng tin cậy; Kiểm định giả thuyết thống kê; Dự báo từ mô hình hồi quy. Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Phân tích dữ liệu và dự báo: Chương 3 - Trường ĐH Quy Nhơn
- CHƯƠNG 3 PHƯƠNG PHÁP PHÂN TÍCH HỒI QUY
- Hiểu rõ các vấn đề cơ bản về phân tích hồi quy Áp dụng dụng được mô hình hồi quy để dự báo nhằm hỗ trợ cho việc ra quyết định Sử dụng được phần mềm Eviews để ước lượng, kiểm định và dự báo từ các mô hình hồi quy 2
- PHƯƠNG PHÁP PHÂN TÍCH HỒI QUY 1. Mô hình hồi quy đơn 2. Mô hình hồi quy bội 3. Suy diễn thống kê và dự báo • Ước lượng khoảng tin cậy • Kiểm định giả thuyết thống kê • Dự báo từ mô hình hồi quy 3
- MÔ HÌNH HỒI QUY TUYẾN TÍNH Mô hình hồi quy tuyến tính 𝑘𝑘 biến 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑡𝑡 + 𝑢𝑢𝑡𝑡 Với giả thiết 𝐸𝐸(𝑢𝑢𝑡𝑡 |𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑡𝑡 ) = 0. Khi đó 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑘𝑘 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑘𝑘 được gọi là hàm hồi quy tổng thể 𝑌𝑌𝑡𝑡 : biến phụ thuộc (biến được giải thích) 𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑡𝑡 : biến độc lập (biến giải thích) 𝛽𝛽1 , 𝛽𝛽2 , … , 𝛽𝛽𝑘𝑘 : các hệ số hồi quy; 𝑢𝑢𝑡𝑡 : sai số ngẫu nhiên (hay nhiễu) 4
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 , … , 𝑋𝑋𝑘𝑘𝑘𝑘 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑘𝑘 + 𝛽𝛽1 : hệ số chặn: giá trị trung bình của biến phụ thuộc khi tất cả các biến độc lập bằng 0 + 𝛽𝛽𝑗𝑗 (𝑗𝑗 = 2, … , 𝑘𝑘): hệ số hồi quy riêng của biến 𝑋𝑋𝑗𝑗 , khi 𝑋𝑋𝑗𝑗 tăng (giảm) 1 đơn vị thì trung bình biến phụ thuộc thay đổi 𝛽𝛽𝑗𝑗 đơn vị trong điều kiện các yếu tố khác không đổi - Trong thực tế, các hệ số hồi quy thường không biết nên ta ước lượng chúng bằng phương pháp bình phương nhỏ nhất thông thường (OLS – Ordinary Least Squares) thông qua một mẫu 5
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Phương pháp OLS để ước lượng các hệ số hồi quy từ mẫu kích thước n đối với mô hình hồi quy tuyến tính hai biến 𝑛𝑛∑𝑌𝑌𝑡𝑡 𝑋𝑋𝑡𝑡 − ∑𝑋𝑋𝑡𝑡 ∑𝑌𝑌𝑡𝑡 ∑𝑥𝑥𝑡𝑡 𝑦𝑦𝑡𝑡 𝛽𝛽̂2 = 2 = n∑𝑋𝑋𝑡𝑡 − ∑𝑋𝑋𝑡𝑡 2 ∑𝑥𝑥𝑡𝑡2 ∑𝑋𝑋t2 ∑𝑌𝑌𝑡𝑡 − ∑𝑋𝑋𝑡𝑡 ∑(𝑋𝑋𝑡𝑡 𝑌𝑌𝑡𝑡 ) 𝛽𝛽̂1 = = � − 𝛽𝛽̂2 𝑋𝑋� 𝑌𝑌 n∑𝑋𝑋𝑡𝑡2 − ∑𝑋𝑋𝑡𝑡 2 1 𝑛𝑛 1 𝑛𝑛 Với � � � 𝑦𝑦𝑡𝑡 = 𝑌𝑌𝑡𝑡 − 𝑌𝑌� 𝑋𝑋 = ∑𝑡𝑡=1 𝑋𝑋𝑡𝑡 ; 𝑌𝑌 = ∑𝑡𝑡=1 𝑌𝑌𝑡𝑡 ; 𝑥𝑥𝑡𝑡 = 𝑋𝑋𝑡𝑡 − 𝑋𝑋; 𝑛𝑛 𝑛𝑛 6
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Các giả thiết của mô hình: 1. Mô hình có dạng tuyến tính và được xác định đúng 2. E(ut ) = 0 3. ut ∼ N(μ, σ2 ) 4. Xt và ut không tương quan: cov Xt , ut = 0 5. Không có đa cộng tuyến hoàn hảo giữa các biến độc lập 6. Phương sai không đổi: 𝑣𝑣𝑣𝑣𝑣𝑣 𝑢𝑢𝑡𝑡 = 𝜎𝜎 2 7. Không có tương quan chuỗi: cov 𝑢𝑢𝑠𝑠 , 𝑢𝑢𝑡𝑡 = 0, ∀𝑡𝑡 ≠ 𝑠𝑠 7
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Đặc điểm của các ước lượng OLS khi thỏa mãn các giả thiết: 1. Các ước lượng OLS đạt tiêu chuẩn BLUE (Best linear unbiased estimator) 2. Mức độ chính xác của các ước lượng OLS có thể đánh giá qua phương sai của các hệ số hồi quy 𝑣𝑣𝑣𝑣𝑣𝑣(𝛽𝛽̂𝑗𝑗 ) Với MH 2 biến: 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 ∑𝑋𝑋𝑡𝑡2 2 𝜎𝜎 2 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽̂1 = 2 𝜎𝜎 , 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽̂2 = 𝑛𝑛∑𝑋𝑋𝑡𝑡 ∑𝑋𝑋𝑡𝑡2 ∑ 𝑌𝑌𝑡𝑡 −𝑌𝑌�𝑡𝑡 2 Ước lượng của 𝜎𝜎 2 là 𝜎𝜎� 2 = 𝑛𝑛−2 8
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Với MH 3 biến: 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋2𝑡𝑡 , 𝑋𝑋3𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + 𝛽𝛽3 𝑋𝑋3𝑡𝑡 1 𝑋𝑋�22∑𝑥𝑥3𝑡𝑡 2 +𝑋𝑋 2 −2𝑋𝑋 �32 ∑𝑥𝑥2𝑡𝑡 �2 𝑋𝑋�3 ∑𝑥𝑥2𝑡𝑡 𝑥𝑥3𝑡𝑡 ̂ 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽1 = + 2 2 𝜎𝜎 2 , 𝑛𝑛 ∑𝑥𝑥2𝑡𝑡 ∑𝑥𝑥3𝑡𝑡 − ∑𝑥𝑥2𝑡𝑡 𝑥𝑥3𝑡𝑡 2 2 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽̂2 = 2 𝜎𝜎 2 , ∑𝑥𝑥2𝑡𝑡 (1−𝑟𝑟23 ) 𝜎𝜎 2 𝑣𝑣𝑣𝑣𝑣𝑣 𝛽𝛽̂3 = 2 (1−𝑟𝑟 2 ) ∑𝑥𝑥3𝑡𝑡 23 với ước lượng không chệch của 𝜎𝜎 2 là 2 ∑ 𝑌𝑌 𝑡𝑡 − �𝑡𝑡 𝑌𝑌 𝜎𝜎� 2 = 𝑛𝑛 − 3 9
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Nhận xét: - Trường hợp hồi quy nhiều biến, phương sai của các hệ số hồi quy phụ thuộc vào phương sai hạng nhiễu, mẫu và mối tương quan giữa các biến giải thích (hệ số tương quan của biến 𝑋𝑋𝑖𝑖 và 𝑋𝑋𝑗𝑗 là 𝑟𝑟𝑖𝑖𝑖𝑖 và −1 ≤ 𝑟𝑟𝑖𝑖𝑖𝑖 ≤ 1) - Trong phân tích hồi quy thường sử dụng sai số chuẩn của các hệ số, ký hiệu 𝑠𝑠𝑠𝑠 𝛽𝛽̂𝑗𝑗 𝑠𝑠𝑠𝑠 𝛽𝛽̂𝑗𝑗 = 𝑣𝑣𝑣𝑣𝑣𝑣(𝛽𝛽̂𝑗𝑗 ) 10
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Đánh giá mức độ phù hợp của mô hình: - Hệ số xác định 𝑅𝑅 2 (0 ≤ 𝑅𝑅2 ≤ 1): • 𝑅𝑅2 = 1: MH giải thích 100% sự biến thiên của Y • 𝑅𝑅 2 = 0: MH không giải thích được gì cho sự biến thiên của Y • 𝑅𝑅2 càng gần 1 thì MH có độ phù hợp càng cao (với dữ liệu mẫu) • 𝑅𝑅 2 càng gần 0 thì MH có độ phù hợp càng thấp (với dữ liệu mẫu) 11
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) 1 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋𝑡𝑡 + 𝛽𝛽3 𝑋𝑋𝑡𝑡2 + 𝑢𝑢𝑡𝑡 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋𝑡𝑡 + 𝑢𝑢𝑡𝑡 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 ( ) + 𝑢𝑢𝑡𝑡 𝑋𝑋𝑡𝑡 50 50 50 0 0 0 -50 -50 -50 -100 -100 -100 Y Y Y -150 -150 -150 -200 -200 𝑅𝑅2 =1 R2 = 0.922 𝑅𝑅2 =0.067 -200 -250 -250 -250 -300 -300 -300 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 X X X 12
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Lưu ý: - 𝑅𝑅2 là hàm tăng theo số biến giải thích - Khi so sánh mức độ phù hợp giữa các mô hình (cùng dạng biến phụ thuộc) khác nhau về số biến độc lập ta sử dụng hệ số xác định hiệu chỉnh ∑𝑢𝑢� 𝑡𝑡2 𝑛𝑛 − 𝑘𝑘 𝑛𝑛 − 1 𝑅𝑅� = 1 − 2 2 2 = 1 − (1 − 𝑅𝑅 ) 𝑛𝑛 − 𝑘𝑘 ∑𝑦𝑦𝑡𝑡 𝑛𝑛 − 1 𝑘𝑘 là số hệ số ước lượng trong mô hình 13
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Lưu ý: - Vấn đề hồi quy giả mạo dẫn đến 𝑅𝑅 2 rất cao - Tương quan mạnh giữa các biến giải thích dẫn đến 𝑅𝑅2 rất cao - Tương quan không nhất thiết hàm ý quan hệ nhân quả - Hệ số 𝑅𝑅2 không có nghĩa chọn lựa sai biến giải thích 𝑋𝑋𝑡𝑡 - Các giá trị 𝑅𝑅2 từ các phương trình với biến phụ thuộc khác nhau không thể so sánh được 14
- MÔ HÌNH HỒI QUY TUYẾN TÍNH (tt) Các tiêu chí lựa chọn mô hình: 𝑅𝑅𝑅𝑅𝑅𝑅 𝑅𝑅𝑅𝑅𝑅𝑅 2𝑘𝑘 1. 𝐴𝐴𝐴𝐴𝐴𝐴 = 𝑢𝑢� 2𝑘𝑘/𝑛𝑛 ; ln AIC = ln + 𝑛𝑛 𝑛𝑛 𝑛𝑛 𝑅𝑅𝑅𝑅𝑅𝑅 𝑅𝑅𝑅𝑅𝑅𝑅 𝑘𝑘 2. 𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑢𝑢� 𝑘𝑘/𝑛𝑛 ; ln SBC = ln + 𝑛𝑛 𝑛𝑛 𝑛𝑛 𝑅𝑅𝑅𝑅𝑅𝑅 𝑛𝑛+𝑘𝑘 3. 𝐹𝐹𝐹𝐹𝐹𝐹 = 𝑛𝑛 𝑛𝑛−𝑘𝑘 𝑅𝑅𝑅𝑅𝑅𝑅 4. 𝐻𝐻𝐻𝐻𝐻𝐻 = (ln(𝑛𝑛))2𝑘𝑘/𝑛𝑛 𝑛𝑛 Ta chọn MH với các tiêu chí trên sao cho chúng có giá trị nhỏ nhất; AIC và SBC thường được ưu tiên với chuỗi thời gian 15
- HỆ SỐ HỒI QUY CHUẨN HÓA - Để xác định biến giải thích nào có ảnh hưởng nhiều hơn đến biến phụ thuộc, ta cần phải dự vào các hệ số hồi quy chuẩn hóa - Hệ số hồi quy chuẩn hóa cho biết tầm quan trọng tương đối của các biến giải thích trong một mô hình hồi quy - Để ước lượng hệ số hồi quy chuẩn hóa, ta cần chuyển hóa mỗi biến (cả biến phụ thuộc) sang dạng biến chuẩn hóa, sau đó dùng phương pháp OLS để ước lượng - Ta chuyển hóa mô hình hồi quy tuyến tính 𝑘𝑘 biến 𝑌𝑌𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑡𝑡 + ⋯ + 𝛽𝛽𝑘𝑘 𝑋𝑋𝑘𝑘𝑡𝑡 + 𝑢𝑢𝑡𝑡 16
- HỆ SỐ HỒI QUY CHUẨN HÓA (tt) Mô hình trên được chuyển hóa như sau: 𝑌𝑌𝑡𝑡 − 𝑌𝑌� 𝑋𝑋2𝑡𝑡 − �2 𝑋𝑋 𝑋𝑋𝑘𝑘𝑡𝑡 − �𝑘𝑘 𝑋𝑋 = 𝛽𝛽2∗ + ⋯ + 𝛽𝛽𝑘𝑘∗ + 𝑢𝑢𝑡𝑡 𝑠𝑠𝑌𝑌 𝑠𝑠𝑋𝑋2 𝑠𝑠𝑋𝑋𝑘𝑘 Quan hệ giữa hệ số hồi quy chuẩn hóa với các hệ số hồi quy riêng 𝑠𝑠𝑋𝑋𝑗𝑗 𝛽𝛽𝑗𝑗∗ = 𝛽𝛽𝑗𝑗 (∗) 𝑠𝑠𝑌𝑌 Giả sử một hệ số hồi quy chuẩn hóa 𝛽𝛽̂𝑗𝑗∗ = 0.7 sẽ cho biết một sự thay đổi bằng 1 độ lệch chuẩn của biến 𝑋𝑋𝑗𝑗 sẽ dẫn đến sự thay đổi 0.7 độ lệch chuẩn trong biến phụ thuộc 17
- HỆ SỐ HỒI QUY CHUẨN HÓA (tt) Trong Eviews, ta thực hiện các bước như sau: • Bước 1: Ước lượng mô hình hồi quy theo OLS (giả sử đó là mô hình tốt nhất) • Bước 2: Tính các độ lệch chuẩn của tất cả các biến scalar sy=scalar(Y) scalar sx=scalar(X) • Bước 3: Tính hệ số hồi quy chuẩn hóa theo công thức (*) ở trên 18
- ỨNG DỤNG DỰ BÁO Dự báo trung bình: Xét hàm hồi quy hai biến: 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋𝑡𝑡 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋𝑡𝑡 - Dự báo điểm của 𝐸𝐸 𝑌𝑌𝑡𝑡 𝑋𝑋𝑡𝑡 tại điểm 𝑋𝑋 0 là 𝑌𝑌�0 = 𝛽𝛽̂1 + 𝛽𝛽̂2 𝑋𝑋 0 - Khoảng tin cậy cho giá trị dự báo trung bình tại 𝑋𝑋 0 � 𝑛𝑛−2 � � 𝑛𝑛−2 𝑌𝑌0 − 𝑡𝑡α . 𝑠𝑠𝑠𝑠 𝑌𝑌0 ≤ 𝐸𝐸(𝑌𝑌|𝑋𝑋0 ) ≤ 𝑌𝑌0 + 𝑡𝑡 . 𝑠𝑠𝑠𝑠(𝑌𝑌�0 ) α/2 2 1 𝑋𝑋0 −𝑋𝑋� 2 Trong đó: 𝑠𝑠𝑠𝑠 𝑌𝑌�0 = 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌�0 = 𝜎𝜎� 2 + 𝑛𝑛 ∑ 𝑋𝑋−𝑋𝑋� 2 19
- ỨNG DỤNG DỰ BÁO (tt) Dự báo riêng biệt: - Khoảng tin cậy cho giá trị dự báo riêng biệt tại 𝑋𝑋0 � 𝑛𝑛−2 � � 𝑛𝑛−2 𝑌𝑌0 − 𝑡𝑡α/2 . 𝑠𝑠𝑠𝑠 𝑌𝑌0 − 𝑌𝑌0 ≤ 𝑌𝑌0 ≤ 𝑌𝑌0 + 𝑡𝑡α . 𝑠𝑠𝑠𝑠(𝑌𝑌0 − 𝑌𝑌�0 ) 2 1 𝑋𝑋0 −𝑋𝑋� 2 Trong đó: 𝑠𝑠𝑠𝑠 𝑌𝑌0 − 𝑌𝑌�0 = 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌0 − 𝑌𝑌�0 = 𝜎𝜎� 2 1 + + 𝑛𝑛 ∑ 𝑋𝑋−𝑋𝑋� 2 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌0 − 𝑌𝑌�0 = 𝜎𝜎� 2 + 𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌�0 * Các KTC cho dự báo trung bình và riêng biệt đều được tính toán dễ dàng từ Eviews trong cả trường hợp nhiều biến 20
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Phân tích hoạt động kinh doanh - Chương 4
22 p | 200 | 29
-
Bài giảng Nghiên cứu Marketing: Chương 7 - Nguyễn Thị Minh Hải
68 p | 119 | 25
-
Bài giảng Phân tích dữ liệu trong nghiên cứu Kinh tế và Kinh doanh - TS Phạm Cảnh Huy
84 p | 140 | 20
-
Bài giảng Nghiên cứu marketing: Chương 6 - ThS. Trần Trí Dũng
62 p | 157 | 15
-
Bài giảng Phân tích hoạt động kinh doanh: Chương 0 - ThS. Lê Văn Hòa (2016)
7 p | 157 | 14
-
Bài giảng Phân tích và xử lý dữ liệu trong kinh doanh: Chương 1 - Học viện Ngân hàng
39 p | 155 | 10
-
Bài giảng Phân tích và xử lý dữ liệu trong kinh doanh: Chương 3 - Học viện Ngân hàng
66 p | 111 | 9
-
Bài giảng Phân tích dữ liệu và dự báo: Chương 1 - Trường ĐH Quy Nhơn
28 p | 11 | 7
-
Bài giảng Phân tích dữ liệu và dự báo: Chương 5 - Trường ĐH Quy Nhơn
18 p | 13 | 7
-
Bài giảng Nghiên cứu Marketing - Chương 9: Xử lý, phân tích dữ liệu và phương pháp phân tích thống kê mô tả trong xử lý dữ liệu
8 p | 155 | 7
-
Bài giảng Phân tích dữ liệu và dự báo: Chương 4 - Trường ĐH Quy Nhơn
46 p | 17 | 7
-
Bài giảng Phân tích dữ liệu và dự báo: Chương 2 - Trường ĐH Quy Nhơn
47 p | 18 | 7
-
Bài giảng Phân tích và xử lý dữ liệu với R: Bài thực hành 1 - Học viện Ngân hàng
12 p | 124 | 6
-
Bài giảng Phân tích và xử lý dữ liệu với R: Bài thực hành 4 - Học viện Ngân hàng
25 p | 113 | 5
-
Bài giảng Phân tích và xử lý dữ liệu với R: Bài thực hành 3 - Học viện Ngân hàng
12 p | 85 | 5
-
Bài giảng Phân tích kinh tế doanh nghiệp - Chương 2: Phân tích tình hình cung ứng, sử dụng và dự trữ nguyên vật liệu, hàng hóa
21 p | 28 | 4
-
Bài giảng Nghiên cứu marketing - Chương 7: Xử lý và phân tích dữ liệu
59 p | 6 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn