intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Bài 7: Hồi quy hai biến

Chia sẻ: Lavie Lavie | Ngày: | Loại File: PPT | Số trang:37

105
lượt xem
8
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Bài 7: Hồi quy hai biến nêu lên mô hình hồi quy, các giả thiết cổ điển của mô hình hồi qui tuyến tính, phương sai và sai số chuẩn của các ước lượng, hệ số xác định và hệ số tương quan, phân phối xác suất của các ước lượng, khoảng tin cậy của các hệ số hồi qui, kiểm định giả thiết về các hệ số hồi qui.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Bài 7: Hồi quy hai biến

  1. BÀI 7: HỒI QUY HAI BIẾN  Khái niệm Phân tích hồi quy  là nghiên cứu sự phụ thuộc  của  một  biến  (biến  phụ  thuộc)  vào  một  hay  nhiều biến khác (biến độc lập), nhằm mục đích  ước  lượng  (hay  dự  đoán)  giá  trị  trung  bình  của  biến phụ thuộc trên cơ sở các giá trị biết trước  của các biến độc lập. Phân tích tương quan là đo mức độ quan hệ  tuyến tính giữa hai biến; không có sự phân biệt  giữa các biến; các biến có tính chất đối xứng.
  2. 1. Mô hình hồi quy Mô hình hồi quy tổng thể (PRF)   Yi =  1 +  2Xi + Ui 1 : là hệ số chặn – tung độ gốc 2 : hệ số góc ­ hệ số đo độ dốc đường hồi quy • Ui:sai số ngẫu nhiên của tổng thể ứng với quan  sát thứ i Với một mẫu n quan sát (Yi, Xi). Cần ước lượng  (PRF).
  3. Mô hình hồi quy mẫu (SRF) Mô hình hồi quy mẫu: Yˆi ˆ ˆ X 1 2 i Trong đó  ˆ : ước lượng cho  1. 1 ˆ 2 : Ước lượng cho  2. Yˆi : Ước lượng cho E(Y/Xi) = Yi Mô hình hồi quy mẫu ngẫu nhiên Yi ˆ ˆ X ei 1 2 i
  4. Theo phương pháp OLS, để ˆ i càng gần với Yi  βˆ 1 , βˆ 2 cần thỏa mãn : Y n n thì 2 ei ˆ ˆ ( Yi β 1 β 2 Xi ) 2 min i 1 i 1 Suy ra βˆ 1 , βˆ 2 cần thỏa mãn : n ei2 n i 1 2( Yi βˆ 1 βˆ 2 Xi )( 1) 0 βˆ 1 i 1 n ei2 n i 1 2( Yi βˆ 1 βˆ 2 Xi )( Xi ) 0 βˆ 2 i 1
  5. giải hệ, ta có : n Xi Yi nX Y βˆ 2 i 1 n βˆ 1 Y βˆ 2 X 2 2 Xi n( X) i 1 Ví dụ 1: Giả sử cần nghiên cứu chi  tiêu tiêu dùng của hộ gia đình phụ  thuộc thế nào vào thu nhập của họ,  người ta tiến hành điều tra, thu được  một mẫu gồm 10 hộ gia đình với số  liệu như sau :
  6. Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260 Trong đó : Y – chi tiêu hộ gia đình  (USD/tuần) X – thu nhập hộ gia đình  (USD/tuần) Giả sử Y và X có quan hệ tuyến tính. Hãy  ước lượng mô hình hồi qui của Y theo X.
  7. Y 160 Yi =  1+ 2Xi + ui 140 Yi= 1+ 2Xi+ui 120 E(Y/Xi)= 1+ 2Xi ui Tiêu  dùng, 100 Y Yi  80 2 Y = E(Y/Xi) 60 1 40 50 100 150 200 250 X Thu nhập khả dụng, X
  8. 2. Các giả thiết cổ điển của mô hình  hồi qui tuyến tính • Giả thiết 1 : Biến độc lập Xi là phi  ngẫu nhiên, các giá trị của chúng phải  được xác định trước. • Giả thiết 2 : Kỳ vọng có điều kiện  của sai số ngẫu nhiên bằng 0 : E (Ui / Xi) = 0  i
  9. • Giả thiết 3 : (Phương sai thuần nhất )  Các sai số ngẫu nhiên có phương sai  bằng nhau :    Var (Ui / Xi) =  2    i • Giả thiết 4 : Không có hiện tượng  tương quan giữa các sai số ngẫu nhiên :  Cov (Ui , Uj ) = 0      i   j • Giả thiết 5 : Không có hiện tượng  tương quan giữa biến độc lập Xi và sai  số ngẫu nhiên Ui :   Cov (Xi , Ui ) = 0 
  10. • Định lý Gauss – Markov : Với các  giả thiết từ 1 đến 5 của mô hình hồi  qui tuyến tính cổ điển, các ước lượng  OLS là các ước lượng tuyến tính,  không chệch và có phương sai bé  nhất trong lớp các ước lượng tuyến  tính, không chệch.
  11. 3. Phương sai và sai số chuẩn của  các ước lượng Phương sai Sai số chuẩn X2 s = 2 s 2 � s βˆ = s 2 βˆ1 n ( X 2 − n(X) 2 ) e 1 βˆ1 1 s = 2 se2 � s βˆ = s 2βˆ βˆ2 ( X 2 − n(X)2 ) 2 2 Trong đó :  ^ s 2 = �e 2 i = �(Y − Y ) i i 2 = RSS e n−2 n−2 n−2
  12. 4. Hệ số xác định và hệ số tương  quan a. Hệ số xác định  Mô hình hồi qui tuyến tính được xây dựng  nhằm để giải thích sự biến thiên của biến phụ  thuộc Y vào biến độc lập X nhưng liệu mô hình  này đã thể hiện một cách tốt nhất mối liên hệ  giữa X và Y chưa?   Bao nhiêu phần trăm biến thiên của Y có thể  giải thích bởi sự phụ thuộc tuyến tính của Y  vào X?   Hệ số xác định R2 sẽ giúp trả lời điều này 
  13. Hệ số xác định 2 dn ESS RSS R 1 TSS TSS Trong đó :  TSS = ESS + RSS n TSS = (Yi − Y) 2 i =1 n ESS = ˆ (Yi − Y) 2 i =1 n RSS = ˆ )2 (Yi − Yi i =1
  14.   y  ( xi , yi )   yi     ySRFa bx   yi yˆi     yi y                 yˆi y    y                x 
  15. Miền xác định của R2 : 0   R2   1 R2  1 : hàm hồi qui càng phù hợp. R2  0 : hàm hồi qui càng ít phù hợp Ví dụ : …
  16. b. Hệ số tương quan (Pearson): Là số đo  mức độ chặt chẽ của quan hệ tuyến tính  giữa X và Y. (X i − X)(Yi − Y) r= �(X i − X) 2 �(Y − Y) i 2 XY − nXY = ( �X − nX ) ( �Y − nY ) 2 2 2 2 2 Chứng minh được : r R Và dấu của r trùng với dấu của hệ số  βˆ 2 của X trong hàm hồi qui (    ).
  17.        r  > 0,8 : tương quan mạnh      r  = 0,4  ­ 0,8 : tương quan trung bình      r   
  18. Tính chất của hệ số tương quan : 1. Miền giá trị của r    :   ­1   r   1     | r|  1 : quan hệ tuyến tính giữa X  và Y càng chặt chẽ. 2. r có tính đối xứng  :  rXY = rYX 3. Nếu X, Y độc lập thì r = 0. Điều  ngược lại không đúng.
  19. Hệ số tương quan hạng Spearman • Được tính dựa trên hạng của dữ liệu chứ không  dựa vào giá trị thực của quan sát • Trước tiên, ta xếp hạng RX , RY các giá trị quan  sát xi , yi theo thứ tự tăng dần từ 1 trở đi, (nếu có  các giá trị quan sát bằng nhau, thì được xếp  đồng hạng và hạng sẽ là hạng trung bình). • Hệ số tương quan hạng Spearman rs chính là hệ  số tương quan r giữa các hạng của xi và yi, tức  là vẫn dùng công thức tính r để tính rs, trong đó,  thay xi, yi bằng các hạng của chúng.
  20. lưu ý : nếu không xảy ra trường hợp các giá trị xi  hay yi bằng nhau, tức là không xảy ra trường  hợp đồng hạng, rs có thể được tính bằng công  thức đơn giản hơn: n 6 d i2 rs = 1 − i =1 n (n − 1) 2 n laøsoálöôïng caù c caë p (xi, yi) di Rxi Ryi : cheâ nh leä ch giöõ a töø ng caë p thöùhaïng cuû a xi vaøyi
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2