YOMEDIA
ADSENSE
Bài giảng Bài 7: Hồi quy hai biến
103
lượt xem 8
download
lượt xem 8
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Bài giảng Bài 7: Hồi quy hai biến nêu lên mô hình hồi quy, các giả thiết cổ điển của mô hình hồi qui tuyến tính, phương sai và sai số chuẩn của các ước lượng, hệ số xác định và hệ số tương quan, phân phối xác suất của các ước lượng, khoảng tin cậy của các hệ số hồi qui, kiểm định giả thiết về các hệ số hồi qui.
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Bài 7: Hồi quy hai biến
- BÀI 7: HỒI QUY HAI BIẾN Khái niệm Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc) vào một hay nhiều biến khác (biến độc lập), nhằm mục đích ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập. Phân tích tương quan là đo mức độ quan hệ tuyến tính giữa hai biến; không có sự phân biệt giữa các biến; các biến có tính chất đối xứng.
- 1. Mô hình hồi quy Mô hình hồi quy tổng thể (PRF) Yi = 1 + 2Xi + Ui 1 : là hệ số chặn – tung độ gốc 2 : hệ số góc hệ số đo độ dốc đường hồi quy • Ui:sai số ngẫu nhiên của tổng thể ứng với quan sát thứ i Với một mẫu n quan sát (Yi, Xi). Cần ước lượng (PRF).
- Mô hình hồi quy mẫu (SRF) Mô hình hồi quy mẫu: Yˆi ˆ ˆ X 1 2 i Trong đó ˆ : ước lượng cho 1. 1 ˆ 2 : Ước lượng cho 2. Yˆi : Ước lượng cho E(Y/Xi) = Yi Mô hình hồi quy mẫu ngẫu nhiên Yi ˆ ˆ X ei 1 2 i
- Theo phương pháp OLS, để ˆ i càng gần với Yi βˆ 1 , βˆ 2 cần thỏa mãn : Y n n thì 2 ei ˆ ˆ ( Yi β 1 β 2 Xi ) 2 min i 1 i 1 Suy ra βˆ 1 , βˆ 2 cần thỏa mãn : n ei2 n i 1 2( Yi βˆ 1 βˆ 2 Xi )( 1) 0 βˆ 1 i 1 n ei2 n i 1 2( Yi βˆ 1 βˆ 2 Xi )( Xi ) 0 βˆ 2 i 1
- giải hệ, ta có : n Xi Yi nX Y βˆ 2 i 1 n βˆ 1 Y βˆ 2 X 2 2 Xi n( X) i 1 Ví dụ 1: Giả sử cần nghiên cứu chi tiêu tiêu dùng của hộ gia đình phụ thuộc thế nào vào thu nhập của họ, người ta tiến hành điều tra, thu được một mẫu gồm 10 hộ gia đình với số liệu như sau :
- Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260 Trong đó : Y – chi tiêu hộ gia đình (USD/tuần) X – thu nhập hộ gia đình (USD/tuần) Giả sử Y và X có quan hệ tuyến tính. Hãy ước lượng mô hình hồi qui của Y theo X.
- Y 160 Yi = 1+ 2Xi + ui 140 Yi= 1+ 2Xi+ui 120 E(Y/Xi)= 1+ 2Xi ui Tiêu dùng, 100 Y Yi 80 2 Y = E(Y/Xi) 60 1 40 50 100 150 200 250 X Thu nhập khả dụng, X
- 2. Các giả thiết cổ điển của mô hình hồi qui tuyến tính • Giả thiết 1 : Biến độc lập Xi là phi ngẫu nhiên, các giá trị của chúng phải được xác định trước. • Giả thiết 2 : Kỳ vọng có điều kiện của sai số ngẫu nhiên bằng 0 : E (Ui / Xi) = 0 i
- • Giả thiết 3 : (Phương sai thuần nhất ) Các sai số ngẫu nhiên có phương sai bằng nhau : Var (Ui / Xi) = 2 i • Giả thiết 4 : Không có hiện tượng tương quan giữa các sai số ngẫu nhiên : Cov (Ui , Uj ) = 0 i j • Giả thiết 5 : Không có hiện tượng tương quan giữa biến độc lập Xi và sai số ngẫu nhiên Ui : Cov (Xi , Ui ) = 0
- • Định lý Gauss – Markov : Với các giả thiết từ 1 đến 5 của mô hình hồi qui tuyến tính cổ điển, các ước lượng OLS là các ước lượng tuyến tính, không chệch và có phương sai bé nhất trong lớp các ước lượng tuyến tính, không chệch.
- 3. Phương sai và sai số chuẩn của các ước lượng Phương sai Sai số chuẩn X2 s = 2 s 2 � s βˆ = s 2 βˆ1 n ( X 2 − n(X) 2 ) e 1 βˆ1 1 s = 2 se2 � s βˆ = s 2βˆ βˆ2 ( X 2 − n(X)2 ) 2 2 Trong đó : ^ s 2 = �e 2 i = �(Y − Y ) i i 2 = RSS e n−2 n−2 n−2
- 4. Hệ số xác định và hệ số tương quan a. Hệ số xác định Mô hình hồi qui tuyến tính được xây dựng nhằm để giải thích sự biến thiên của biến phụ thuộc Y vào biến độc lập X nhưng liệu mô hình này đã thể hiện một cách tốt nhất mối liên hệ giữa X và Y chưa? Bao nhiêu phần trăm biến thiên của Y có thể giải thích bởi sự phụ thuộc tuyến tính của Y vào X? Hệ số xác định R2 sẽ giúp trả lời điều này
- Hệ số xác định 2 dn ESS RSS R 1 TSS TSS Trong đó : TSS = ESS + RSS n TSS = (Yi − Y) 2 i =1 n ESS = ˆ (Yi − Y) 2 i =1 n RSS = ˆ )2 (Yi − Yi i =1
- y ( xi , yi ) yi ySRFa bx yi yˆi yi y yˆi y y x
- Miền xác định của R2 : 0 R2 1 R2 1 : hàm hồi qui càng phù hợp. R2 0 : hàm hồi qui càng ít phù hợp Ví dụ : …
- b. Hệ số tương quan (Pearson): Là số đo mức độ chặt chẽ của quan hệ tuyến tính giữa X và Y. (X i − X)(Yi − Y) r= �(X i − X) 2 �(Y − Y) i 2 XY − nXY = ( �X − nX ) ( �Y − nY ) 2 2 2 2 2 Chứng minh được : r R Và dấu của r trùng với dấu của hệ số βˆ 2 của X trong hàm hồi qui ( ).
- r > 0,8 : tương quan mạnh r = 0,4 0,8 : tương quan trung bình r
- Tính chất của hệ số tương quan : 1. Miền giá trị của r : 1 r 1 | r| 1 : quan hệ tuyến tính giữa X và Y càng chặt chẽ. 2. r có tính đối xứng : rXY = rYX 3. Nếu X, Y độc lập thì r = 0. Điều ngược lại không đúng.
- Hệ số tương quan hạng Spearman • Được tính dựa trên hạng của dữ liệu chứ không dựa vào giá trị thực của quan sát • Trước tiên, ta xếp hạng RX , RY các giá trị quan sát xi , yi theo thứ tự tăng dần từ 1 trở đi, (nếu có các giá trị quan sát bằng nhau, thì được xếp đồng hạng và hạng sẽ là hạng trung bình). • Hệ số tương quan hạng Spearman rs chính là hệ số tương quan r giữa các hạng của xi và yi, tức là vẫn dùng công thức tính r để tính rs, trong đó, thay xi, yi bằng các hạng của chúng.
- lưu ý : nếu không xảy ra trường hợp các giá trị xi hay yi bằng nhau, tức là không xảy ra trường hợp đồng hạng, rs có thể được tính bằng công thức đơn giản hơn: n 6 d i2 rs = 1 − i =1 n (n − 1) 2 n laøsoálöôïng caù c caë p (xi, yi) di Rxi Ryi : cheâ nh leä ch giöõ a töø ng caë p thöùhaïng cuû a xi vaøyi
ADSENSE
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn