Chương 5: Một vài mô hình phi tuyến<br />
Khi biến phụ thuộc là biến giả, chúng ta muốn<br />
tìm xác suất mà một sự kiện nào đó xảy ra nên<br />
gọi là mô hình xác suất<br />
Ví dụ:<br />
Y=<br />
Y=<br />
<br />
1 nếu một sinh viên tốt nghiệp ra trường<br />
0 nếu không tốt nghiệp<br />
1 nếu một gia đình có vay được vốn từ ngân hàng<br />
0 nếu không vay được<br />
<br />
Mô hình xác suất tuyến tính - LPM<br />
Chúng ta viết mô hình xác suất tuyến tính<br />
dưới dạng hồi qui thông thường như sau:<br />
Pi = Pr(Yi = 1|Xi) = E(Yi|Xi) = 1 +2Xi<br />
với E(Ui) = 0.<br />
Kỳ vọng có điều kiện E(Yi|Xi) được giải thích<br />
như là xác suất có điều kiện để sự kiện khi<br />
biến Xi đã xảy ra.<br />
<br />
Mô hình xác suất tuyến tính<br />
Gọi:<br />
Pi là xác suất Yi = 1 (sự kiện xảy ra),<br />
(1 – Pi) là xác suất Yi = 0 (sự kiện không xảy ra)<br />
Vậy Yi theo phân phối Bernoulli, có kỳ vọng:<br />
E(Yi) = 1.Pi + 0.(1 – Pi) = Pi<br />
E(Yi|Xi) = Pi<br />
Vì E(Yi|Xi) là một xác suất nên:<br />
0 E(Yi|Xi) 1<br />
<br />
Mô hình xác suất tuyến tính<br />
Ui = Yi - 1 - 2Xi<br />
Khi Yi = 1, Ui = 1 - 1 - 2Xi, với xác suất Pi,<br />
Khi Yi = 0, Ui = -1 -2Xi, với xác suất 1- Pi,<br />
Có hiện tượng phương sai sai số thay đổi, do<br />
ui theo phân phối Bernoulli nên:<br />
Var(Ui) = Pi(1 – Pi)<br />
E(Yi|Xi)= 1 + 2Xi có thể vượt khoảng (0,1)<br />
nếu Xi có giá trị lớn.<br />
<br />
Mô hình Probit và Logit<br />
Trong mô hình LPM Pi là phân phối tuyến tính<br />
nên có nhiều nhược điểm, để khắc phục<br />
người ta đưa ra 2 trường hợp:<br />
Probit<br />
Logit<br />
<br />
Khi đó, chắc chắn 0 E(Yi|Xi) 1.<br />
<br />