1
2
Công trình ñược hoàn thành tại ĐẠI HỌC ĐÀ NẴNG
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG HUỲNH NGỌC TUẤN
MỞ RỘNG MÔ HÌNH HỒI QUY
TUYẾN TÍNH HAI BIẾN
Người hướng dẫn khoa học: TS. CAO VĂN NUÔI Phản biện 1: TS. NGUYỄN DUY THÁI SƠN Phản biện 2: GS.TS. LÊ VĂN THUYẾT
Chuyên ngành : PHƯƠNG PHÁP TOÁN SƠ CẤP
Mã số: 60.46.40
Luận văn ñược bảo vệ tại Hội ñồng chấm luận văn tốt nghiệp Thạc sĩ khoa học họp tại Đại học Đà Nẵng vào ngày 02 tháng 02 năm 2012.
TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC
* Có thể tìm hiểu luận văn tại:
Đà Nẵng - Năm 2012
- Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng - Thư viện trường Đại học Sư phạm, Đại học Đà Nẵng
3
4
cách có hệ thống với các ví dụ minh họa ñầy ñủ cho phần lý thuyết
MỞ ĐẦU
ñã trình bày.
5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI 1. LÝ DO CHỌN ĐỀ TÀI 5.1. Ý nghĩa khoa học: Hệ thống kiến thức về “mở rộng mô hình hồi Việc xác ñịnh một cách ñịnh lượng trong kinh tế ñược khảo sát khá quy tuyến tính hai biến” và ứng dụng vào giải một số bài toán kinh tế kỹ trong bộ môn kinh tế lượng. Bộ môn này, ra ñời vào những năm lượng dựa trên số liệu thực tế. 1930 của thế kỷ XX, cho ñến nay môn khoa học này ñã ñem lại cho 5.2. Ý nghĩa thực tiễn: Đề tài hoàn thành trở thành tài liệu tham các nhà kinh tế một công cụ sắc bén, nhất là trong ước lượng, kiểm khảo cho giáo viên, sinh viên ở các trường ñại học và cao ñẳng, các ñịnh các quan hệ kinh tế, dự báo các thay ñổi kinh tế vĩ mô quan bạn yêu toán và các ứng dụng của toán trong kinh tế, ñặc biệt là kinh trọng như lãi suất, tỉ lệ lạm phát, GDP…các mô hình kinh tế như: tế lượng. Hồi quy tuyến tính, mô hình log tuyến tính, mô hình nửa log 6. CẤU TRÚC LUẬN VĂN (semilog),.... Luận văn gồm 3 chương: Hiện nay giáo trình và tài liệu trình bày một cách có hệ thống kiến CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN thức về mở rộng mô hình hồi quy tuyến tính tổng quát trong kinh tế Định nghĩa mô hình hồi quy tuyến tính cơ bản và các tích chất liên lượng bằng ngôn ngữ toán học vẫn còn hạn chế. Vì vậy, tôi chọn ñề quan. tài “MỞ RỘNG MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY TUYẾN TÍNH BIẾN” ñể làm luận văn tốt nghiệp của mình. HAI BIẾN 2. MỤC ĐÍCH NGHIÊN CỨU Trình bày sự mở rộng về hồi quy tuyến tính hai biến. Tác giả rất hi vọng ñây sẽ là tài liệu tham khảo bổ ích về mở rộng CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC MÔ HÌNH MỞ mô hình hồi quy tuyến tính hai biến và áp dụng của nó trong thực tế. RỘNG TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN 3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU Trình bày một số áp dụng của mô hình hồi quy tuyến tính hai biến 3.1. Đối tượng: Áp dụng mô hình hồi quy trong kinh tế lượng. mở rộng. 3.2. Phạm vi nghiên cứu: Mô hình hồi quy tuyến tính hai biến và
mở rộng mô hình hồi quy tuyến tính hai biến.
4. PHƯƠNG PHÁP NGHIÊN CỨU
Tham khảo, phân tích, tổng hợp, hệ thống các tài liệu chuyên khảo
và các bài báo trên internet khác nhau có liên quan ñến hồi quy tuyến
tính và ứng dụng trong một số vấn ñề kinh tế. Từ ñó trình bày một
5
6
Từ bảng trên ta tính ñược:
CHƯƠNG 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
X fi
80
100
120
140
160
180
200
220
240
260
Bảng 1.2. Các thông số về xác suất và trung bình 1.1. KHÁI NIỆM HÀM HỒI QUY ĐÁM ĐÔNG
( ) p Y X fl |
i
Giả thiết rằng một cụm dân cư có 60 hộ dân. Giả sử rằng chúng ta
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
chỉ quan tâm ñến việc nghiên cứu mối quan hệ giữa ñại lượng Y tiêu
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
dùng hàng tuần và ñại lượng X khả năng thu nhập khả dụng của mỗi
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
gia ñình. Xác suất có Giả sử chúng ta chia 60 gia ñình này thành 10 nhóm có thu nhập xấp
i
-
1/6
-
1/7
1/6
1/6
1/7
1/6
1/7
-
-
-
-
1/7
-
-
1/7
-
1/7
-
xỉ nhau và ñánh giá thu chi của các gia ñình này trong từng nhóm thu kiện ñiều ) ( p Y X | nhập. Số liệu ñược cho bởi bảng sau:
Bảng 1.1. Số liệu thu nhập của 60 gia ñình
80
100
120
140
160
180
200
220
240
260
65
77
89
101
113
125
137
149
161
173
Trung bình
X fi Y fl
có ñiều kiện
Chi tiêu
55
102
102
110
120
135
137
150
65
79
của Y
tiêu
70
84
60
93
107
115
136
137
145
152
dùng
74
90
65
95
110
120
140
140
155
175
gia ñình
80
94
70
103
116
135
145
157
175
180
hàng
88
--
-
113
125
140
160
189
185
-
tuần Y,
-
-
-
-
115
-
-
162
-
191
$
Tổng
325
462
445
707
678
750
685
1043 966
1211
cộng
Bảng 1.2 ñược thể hiện qua các hình sau:
Bảng 1.1, các giá trị trung bình của Y tăng khi X tăng. Nếu chúng
ta tập trung vào các ñiểm có kích thước lớn ñể thể hiện các giá trị
trung bình của Y thì các trung bình có ñiều kiện này nằm trên một Hình 1.1. Phân phối có ñiều kiện của chi tiêu ñối với ñường thẳng với một ñộ dốc dương. Đường thẳng này ñược gọi là mức ñộ thu nhập khác nhau của Bảng 1.1 ñường hồi quy tổng thể.
7
8
(
)
|
1.2.2. Sự tuyến tính theo các tham số
i
E Y X là một hàm tuyến tính theo các tham số b của nó. Theo các hiểu này thì nó có thể tuyến tính hoặc không tuyến tính theo biến X.
Đó là kỳ vọng có ñiều kiện của Y,
1.3. SAI SỐ NGẪU NHIÊN
iX , mức chi tiêu của một hộ gia ñình có thể nằm xung quanh giá trị trung bình của các hộ gia ñình có thu nhập iX . Điều này ta có thể diễn tả ñộ lệch của iY xung quanh giá trị kỳ vọng của nó: =
)
Từ hình 1.1, nhận thấy rằng với một mức thu nhập
|
( E T X
i
+ u i
Hình 1.2. Đường hồi quy tổng thể của Bảng 1.2 (1.3)
Y i iu là biến số ngẫu nhiên không thể quan sát.
iu là số hạng nhiễu ngẫu nhiên hay số hạng sai số ngẫu nhiên. Công thức (1.3) có thể cho chúng ta biết
=
=
)
|
1,
n
iX . Kí hiệu: ( ) i f X ,
i
i
trong ñó, ñộ lệch Từ hình 1.1 và 1.2, ta nhận thấy rằng mỗi trung bình có ñiều kiện Về thuật ngữ chuyên môn, ta gọi
( f X là hàm của biến giải thích
i
(
)
|
E T X chi tiêu trung bình của tất cả các gia ñình có cùng thu
i
iu yếu tố ngẫu nhiên hay không hệ thống.
=
b
b +
)
( E Y X
|
X
i
1
2
i gọi là hệ số hồi quy.
,b b 1
2
iX . Về mặt hình học, ñường cong tuyến tính trong trường hợp này là
rằng chi tiêu của một gia ñình khi biết mức thu nhập của họ: E(Y|Xi) là một hàm của ( E Y X ) trong ñó, (1) (1.1) iX , phương trình (1.1) ñược gọi là hàm hồi quy tổng thể hai biến (Population Regression nhập (yếu tố này tất yếu). Function - PRF) hay ngắn gọn hơn là hồi quy tổng thể (Population (2) Regression - PR). Theo Keynes, hàm tiêu dùng Y theo thu nhập X 1.4. HÀM HỒI QUY MẪU như sau: Chúng ta cần phải tính PRF trên cơ sở thông tin mẫu. Giả thiết (1.2) rằng ta không có thông tin gì về Bảng 1.1 và ta chỉ có thông tin ngẫu trong ñó, nhiên tương ứng các giá trị Y với X (ñược cho ở bảng sau). Phương trình (1.2) ñược gọi là hàm hồi quy tổng thể tuyến tính. Bảng 1.3. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (1) 1.2. Ý NGHĨA CỦA THUẬT NGỮ “TUYẾN TÍNH” Y X Y X 1.2.1. Sự tuyến tính theo các biến số 70 80 115 180 Đó là kỳ vọng có ñiều kiện của Y là một hàm tuyến tính của 65 100 120 200
90 120 140 220 ñường thẳng.
95 140 155 140
110 160 150 260
9
10
+ b
=
b
X
Từ Bảng 1.3 ta có thể dự ñoán ñược chi tiêu trung bình hàng tuần Y
2
1
Y i
i
trong tổng thể tương ứng X ñược chọn không? Hay ta có thể tính (1.4) Tóm lại, mục tiêu chính của ta trong phân tích hồi quy là tính PRF + u i
+ b
X
ˆ b 1
i
ˆ Y i
+ ˆ u i
ñược PRF từ bảng dữ liệu mẫu hay không? Việc tính này cũng ñặt ra Trên cơ sở của SRF = nghi vấn không tính chính xác ñược PRF bởi vì có sự dao ñộng trong (1.9)
việc lấy mẫu. Giả sử ta lấy ngẫu nhiên một mẫu ngẫu nhiên khác từ
bảng 1.1.
Bảng 1.4. Mẫu ngẫu nhiên từ tổng thể bảng 1.1 (2)
Y X Y X
55 80 120 180
ˆ 2 1.5. MÔ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN 1.5.1. Ước lượng các hệ số của mô hình hồi quy bằng phương pháp bình phương tối thiểu thông thường OLS (Ordinary Least Square) 1.5.1.1. Các giả ñịnh của mô hình hồi quy tuyến tính cổ ñiển 1.5.1.2. Phương pháp bình phương tối thiểu thông thường
=
b
88 100 145 200
X
ˆ b 1
ˆ 2
u i
Y i
i
n
n
- - 90 120 125 220 Từ hàm hồi quy (1.9):
b
(
)2
X
ˆ b 1
ˆ 2
Y i
i
∑ ∑ = 2 u i
= 1
= 1
i
i
80 140 145 240 - - (1.10) vậy 118 160 175 260
Từ bảng 1.3 và 1.4, chúng ta ñược ñồ thị phân tán như sau:
-=
XˆY
2
1
n
y x i i
∑
i
=
Điều kiện ñể (1.10) ñạt cực trị là: ˆ b b (1.15)
ˆ b 2
= 1 n
2 x i
∑
=
=
(1.17)
= i 1 y
x
XX
YY
i
i
i
i
- - với và .
1.5.1.3. Tính chất của hàm hồi quy mẫu theo OLS Tính chất của ước lượng tham số:
ˆb
ˆb
1
2
ˆb
là duy nhất ứng với một mẫu xác ñịnh gồm n quan sát và (1)
ˆb
1
1
2
2
(Xi,Yi). ˆb và và là các ước lượng ñiểm của b 1 và b 2. Giá trị của Hình 1.3. Đường hồi quy mẫu của 2 mẫu bảng 1.3 và 1.4 (2) ˆb thay ñổi theo mẫu dùng ñể ước lượng.
=
X
ˆ b 1
ˆ 2
ˆ Y i
i
Biểu thức tương ứng với (1.2) có thể ñược viết lại: + b (1.8)
11
12
1
1,2n(
)2/
1
1
)2/
1
ˆ ˆ
ˆ 1 ˆ
+ t +
t t
)ˆ(se )ˆ(se
1,2n( t
)ˆ(se )ˆ(se
2
2
)2/
1,2n(
1,2n(
2
2
2
b b £ b £ b - b Tính chất của hàm hồi quy mẫu: (1.24) a - - a - - b b £ b £ b - b (1.25) a - - a - -
)2/ 1.5.2.2. Kiểm ñịnh giả thiết về hệ số hồi quy *
Y
:H 0
b=b 2
2
^ E Y
*
:H 1
2
2
(
) 0 iE u = .
n
sát ñối với biến phụ thuộc . (1) Hàm hồi quy mẫu ñi qua giá trị trung bình của dữ liệu. (2) Giá trị trung bình của ước lượng bằng giá trị trung bình của quan = Giả thiết: b „ b (3) Giá trị trung bình của phần dư bằng 0:
0
2
2
iu và
iY không tương quan với nhau:
=∑ u Y i i
t
-= 1
,2n(
)2/
1,2n(
)2/
i
ˆ )ˆ(se
tP
2
= 1 n
b - b (4) Các phần dư . a £ £ mệnh ñề xác suất: a - - a - b
0
iu và
iX không tương quan với nhau:
i
=∑ u X i
= 1
i
ˆb
(5) Các phần dư . ñiều kiện quyết ñịnh:
2
2
* 2
2
* 2
>
t
-< t
0H .
,2n(
)2/
1,2n(
)2/
b - b b - b và (1)Nếu hoặc thì bác bỏ a a - -
1.5.1.4. Phân phối của
ˆ )ˆ(se
ˆ )ˆ(se
2
2
b b
ˆb 1 ˆb 1 ( ) ˆE b=b 1
1
2
2
* 2
n
t
t
0H
,2n(
)2/
1,2n(
)2/
2
X
ˆ )ˆ(se
2 i
∑
2
ˆb 2 ( ) ˆE b=b 2 ( ˆ
Kỳ vọng b - b £ £ (1) Nếu thì ta không thể bác bỏ a - - a - s b
)
=
var
2
2
n
b Phương
( ˆ
)
=
var
1
= 1i n
2R
x
2 i
∑
n
x
2 i
∑
= 1i
2R
= 1i
2
n
n
s b 1.5.3. Độ thích hợp của hàm hồi quy - sai 1.5.3.1 Hệ số xác ñịnh
i
yx i
∑
X
2 i
∑
=
= 1i
2
ˆ
2
=
=
n
R
=
2 r Y,X
n
ˆ
= 1i n
1
x
2 i
∑
y
2 i
2 i
n ∑∑ x
n
x
= 1i
2 i
∑
= 1i
= 1i
= 1i
n
s s b Sai số (1.35) s s b chuẩn
2R
X
2 i
∑
2
1.5.3.2 Ý nghĩa của hệ số xác ñịnh
2
,N~ˆ
N~ˆ
,
1
1
2
2
= 1i n
n
n
x
x
2 i
2 i
∑
∑
= 1i
= 1i
(1) Đo tỷ lệ hay số phần trăm của toàn bộ sai lệch của Y với giá trị s Phân s b b b b trung bình của chúng ñược giải thích bằng mô hình. phối (2) Hệ số
2
2
1
0
0
R£
2R ñược sử dụng ñể ño mức ñộ phù hợp của hàm hồi quy. 2R R = thể hiện X và Y ñộc lập thống kê.
R = 2 1
1.5.3.3 Tính chất của hệ số xác ñịnh £ . Với (1)
thể hiện X và Y phụ thuộc tuyến tính hoàn hảo. 1.5.2. Khoản tin cậy và kiểm ñịnh giả thiết các hệ số hồi quy 1.5.2.1. Khoản tin cậy của các hệ số hồi quy Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa a như sau:
13
14
n
1
X Y i i
∑
0
Nếu thì mô hình hồi quy càng thích hợp.
i
=
ˆ b 2
= 1 n
X
2 i
∑
i
= 1
Nếu thì mô hình hồi quy ít thích hợp. (2.6) (2)
R fi 2 R fi 2 2R không xét ñến quan hệ nhân quả. 1.5.4. Dự báo bằng mô hình hồi quy hai biến
2
tYˆ
)Yˆ(se
s
o
1,2n(
)2/
o
=
(
)
v ar
ˆ b 2
n
0X càng lệch ra khỏi giá trị trung bình thì sai số dự báo
X
2 i
∑
– Khoảng tin cậy cho dự báo: a - - (2.7) Nhận xét:
= 1
i
càng lớn.
1.6. ĐỊNH LÝ GAUSS – MARKOV So sánh các công thức với các công thức khi có tung ñộ gốc trong mô
n
n
x y i i
2 ˆ u i
∑
2
s
i
=
=
s ˆ
(
)
v ar
hình:
ˆ b 2
ˆ b 2
2
= 1 n
n
∑ == 1 i n
2
2 x i
2 x i
∑
∑
; ; -
= 1
i
= 1
i
Nội dung của ñịnh lý này ñược phát biểu: “Cho trước các giả thuyết của mô hình hồi quy tuyến tính cổ ñiển, các hàm ước lượng bình phương tối thiểu, trong nhóm các hàm ước lượng tuyến tính không chệch, có phương sai nhỏ nhất, chúng là các hàm ước lượng không chệch tuyến tính tốt nhất”.
Sự khác biệt giữa các công thức rất rõ ràng:
(1) Trong mô hình không có tung ñộ gốc, ta sử dụng tổng bình
CHƯƠNG 2. CÁC MỞ RỘNG CỦA HỒI QUY TUYẾN TÍNH HAI BIẾN
phương và tích chéo thô nhưng trong mô hình có tung ñộ gốc, ta sử
)1n -
2.1. HỒI QUY QUA GỐC
b=
X u
Y i
2
trong hai trường hợp lần lượt là ( và dụng tổng bình phương và tích chéo hiệu chỉnh. 2ˆs (2.1) Xét hàm hồi quy tổng thể (PRF) hai biến có dạng sau: + i
Trong mô hình này, tung ñộ gốc không có hay bằng 0 và ñược gọi là (2) Số bậc tự do ñể tính )2n - ( Mặc dù trong mô hình không có tung ñộ gốc hay tung ñộ gốc bằng
mô hình hồi quy qua gốc. không có thể thích hợp trong một số trường hợp, tuy nhiên khi sử
n
Làm sao chúng ta ước lượng các mô hình như (2.1) và mô hình này dụng mô hình này ta cần chú ý:
ˆ u i
∑ , luôn bằng 0 trong mô hình có tung ñộ gốc (mô hình quy
= 1
i
X
ñưa ra các vấn ñề ñặc biệt như thế nào? Để trả lời câu hỏi này, ta viết (a)
+ ˆ u i
Y i
i
(2.5) mô hình hồi quy mẫu (SRF) của (2.1) là: ˆ b= 2
ˆ u i
= 1
i
ñộ gốc. Nói một cách ngắn gọn, ước) nhưng không cần phải bằng 0 trong trường hợp không có tung n ∑ không nhất thiết bằng 0 với
mô hình hồi quy qua gốc.
15
16
2r , hệ số xác ñịnh luôn không âm với mô hình quy ước
(b) lượng bằng hồi quy OLS. Do tính chất tuyến tính này, các mô hình
Do các ñặc ñiểm của mô hình, ta cần rất cẩn thận khi sử dụng mô như thế ñược gọi là mô hình log-log, log kép, hay tuyến tính log.
hình hồi quy qua gốc tọa ñộ bằng 0. Trừ khi chúng ta có một tiên Trong mô hình hai biến, cách ñơn giản nhất ñể quyết ñịnh xem mô
nghiệm rất mạnh, ta cần phải sử dụng mô hình quy ước có tung ñộ hình tuyến tính lôgarit có thích hợp với số liệu hay không là vẽ lên ñồ
gốc.
Điều này có lợi thế kép: thị phân tán biểu diễn lnYi theo lnXi và xem xem nếu các ñiểm phân tán nằm gần ñúng theo một ñường thẳng.
(1) Thứ nhất: Nếu số hạng tung ñộ gốc ñưa vào mô hình nhưng nó trở 2.4. MÔ HÌNH NỬA LOG
2.4.1. Mô hình log – lin
Ta có bảng số liệu sau:
nên không có ý nghĩa về mặt thống kê, ta có một mô hình hồi quy qua gốc tọa ñộ(3). (2) Thứ hai: nếu thật sự có tung ñộ gốc nhưng ta khẳng ñịnh rằng ñó
là hồi quy qua gốc tọa ñộ thì ta sẽ phạm sai số ñặc trưng, và như vậy Bảng 2.2.(6) Tổng sản phẩm nội ñịa tính theo giá năm 1987 của Hoa Kỳ, 1972 – 1991
ta sẽ vi phạm giả thuyết của mô hình hồi quy tuyến tính cổ ñiển. Năm GDP Năm GDP Năm GDP
2.2. TỶ LỆ VÀ ĐƠN VỊ ĐO 1972 3107.1 1979 3796.8 1986 4404.5
Việc chuyển ñổi tỉ lệ không tác ñộng tới những tính chất của ước 1973 3268.6 1980 3776.3 1987 4539.9
lượng OLS. 1974 3248.1 1981 3843.1 1988 4718.6 2.3. MÔ HÌNH LOG TUYẾN TÍNH 1975 3221.7 1982 3760.3 1989 4838
iu
2
b=
X eb
Y i
1
i
1976 3380.8 1983 3906.6 1990 4877.5 Xem xét mô hình sau với tên gọi là mô hình hồi quy mũ: (2.34) 1977 3533.3 1984 4148.5 1991 4821
b +
=
ln
ln
ln
X
+ u i
Y i
2
1
i
1978 3703.5 1985 4279.8 -- --
e =
2,718
(2.35) )
a b = +
ln
ln
X
Y i
2
i
a
Phương trình có thể ñược biểu diễn dưới dạng sau: b với ln là logarit tự nhiên nghĩa là logarit với cơ số e ( Nếu ta viết (2.34) dưới dạng: Giả sử ta muốn tìm tốc ñộ tăng trưởng GDP thực trong giai ñoạn này. Đặt Yt = GDP thực (RGDP) vào thời ñiểm t và Y0 = giá trị ban ñầu (năm 1972) của GDP thực. Bây giờ nhớ lại công thức tính lãi
b= ln
+ u i , mô hình này tuyến tính theo các thông số a và
1
2
=
)t
r
tY
Y 0 (1
(2.36) b với , suất gộp nổi tiếng về tiền tệ, tài chính và ngân hàng. + (2.38)
(6) Nguồn: Báo cáo của Tổng thống, tháng 1 năm 1993, bảng B-1 và B-2 trang 348 - 349
tuyến tính theo lôgarit của các biến Y và X. Mô hình có thể ñược ước (3) Henri Theil chỉ ra rằng nếu tung ñộ gốc thật sự không có, hệ số ñộ dốc có thể ñược ước lượng với ñộ chính xác lớn hơn rất nhiều so với trường hợp có tung ñộ gốc. Xem Introduction to Economertrics của Henri Theil, Prentice – Hall, Englewood Cliffs, N.J., 1978, trang 76.
17
18
=
+
+
ln
ln
t
ln(1
r
)
với r là tốc ñộ tăng trưởng gộp (theo thời gian) của Y. Lấy lôgarit tự
tY
(2.39) nhiên (ln) của (2.38), ta có: Y 0
1976 1977 1978 1979 1980 1782.8 1990.5 2249.7 2508.2 2723.0 1163.7 1984 1286.7 1985 1389.0 1986 1500.2 1987 1633.1 -- 3772.2 4014.9 4240.3 4526.7 -- 2363.6 2562.6 2807.7 2901.0 -- bây giờ ñặt:
lnY 0 ln(1
)r
b = 1 b = 2
Lưu ý: Các số liệu GNP là số liệu hàng quý trên cơ sở tốc ñộ hàng + (2.40) (2.41) năm ñã hiệu chỉnh theo mùa.
b +
=
b
ln tY
1
2
tiền mặt + tiền gửi không kỳ hạn + séc du lịch + các loại tiền ta có thể viết (2.39) dưới dạng: t (2.42) M2 = gửi ñược rút séc khác + hợp ñồng mua lại chứng khoán (RP) 1 ngày
b +
b
Y ln t
1
+ t u t
2
ñêm và Eurodollar + số dư MMMF (quỹ hỗ tương trên thị trường tiền cộng thêm yếu tố nhiễu vào (2.42), ta có:(7) = (2.43) tệ) + MMDAs (các tài khoản tiền gửi trên thị trường tiền tệ) + tiết
b
2
=
b
b +
X
Y i
1
2 ln
i
+ u i
kiệm và tiền gửi nhỏ. số là tuyến tính. Sự khác nhau duy nhất là biến hồi quy phụ Mô hình này giống mọi mô hình tuyến tính khác ở chỗ các thông b và 1 Giả sử ta có số liệu như trong bảng 2.3, với Y là GNP và X là lượng thuộc vào lôgarit của Y và biến hồi quy ñộc lập là “thời gian”, lấy giá cung tiền. Tiếp theo, giả sử ta quan tâm ñến việc tìm xem GNP tăng trị 1,2,3,... lên bao nhiêu (về giá trị tuyệt ñối) nếu lượng cung tiền tăng lên 1%. Các mô hình như (2.43) ñược gọi là mô hình bán lôgarit (semilog) Không giống mô hình tăng trưởng vừa thảo luận trong ñó ta quan do chỉ có một biến (trong trường hợp này là biến hồi quy phụ thuộc) tâm ñến việc tìm xem gia tăng phần trăm của Y khi X tăng lên 1 ñơn xuất hiện dưới dạng lôgarit. Đối với các mục ñích mô tả, một mô vị, bây giờ ta quan tâm ñến việc tìm sự thay ñổi tuyệt ñối của Y khi X hình trong ñó biến hồi quy phụ thuộc ñược lôgarit hóa sẽ ñược gọi là thay ñổi ñi 1%. Một mô hình phục vụ mục tiêu này có thể ñược viết mô hình log-lin. như sau: 2.4.2. Mô hình Lin – log (2.45)
=
b
b +
+
Với các mục ñích mô tả, mô hình như vậy là mô hình lin – log. Ta có bảng số liệu sau: Bảng 2.3.(9) GNP và lượng cung tiền Hoa Kỳ năm 1973 – 1987 2.5. MÔ HÌNH NGHỊCH ĐẢO Năm Năm M2 M2 Các mô hình có dạng sau ñược gọi là mô hình nghịch ñảo.
Y i
1
2
u i
1 X
i
(2.48)
1973 1974 1975 GNP ( tỷ USD) 3052.6 3166.0 3405.7 1981 861.0 908.5 1982 1023.2 1983 1795.5 1954.0 2185.2
GNP ( tỷ USD) 1359.3 1472.8 1598.4 (7) Ta ñưa thêm sai số vào vì công thức lãi suất gộp sẽ không thảo mãn chính xác. (9) Nguồn báo cáo kinh tế của Tổng thống, 1989, số liệu GNP lấy từ bảng B-1 trang 308 và M2 từ bảng B-67 trang 385
19
20
b
Mặc dù mô hình này là phi tuyến theo biến X bởi vì biến X có dạng
b và 1
2
và do vậy mô
CHƯƠNG 3. MỘT SỐ ÁP DỤNG CỦA CÁC MÔ HÌNH MỞ RỘNG TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH 3.1. MỘT ÁP DỤNG CỦA MÔ HÌNH HỒI QUY TUYẾN TÍNH
b
)X
2 (1 /
2
nghịch ñảo, mô hình có dạng tuyến tính theo hình là mô hình hồi quy tuyến tính.(11) Mô hình này có các ñặc ñiểm: khi X tiến dần tới vô cùng, số hạng b dần tới không (lưu ý: CỔ ĐIỂN: ĐƯỜNG ĐẶC TÍNH CỦA LÝ THUYẾT CƠ CẤU
ĐẦU TƯ CHỨNG KHOÁN
không ñổi) và Y tiến tới giá trị giới b . Do vậy, các mô hình như (2.48) tạo nên một giá hạn hay tiệm cận 1 trị tiệm cận hay giới hạn mà biến phụ thuộc sẽ nhận khi giá trị của Ta có bảng số liệu về suất sinh lợi hàng năm (%) của Afuture Fund:
biến X dần tới vô cùng.
=
b
b +
b
b
Y
X
*
1
2
2
2
Bảng tóm tắt các ñặc trưng nổi bật các mô hình vừa trình bày ở trên: Bảng 3.1. Suất sinh lợi trung bình của Afuture Fund và của chỉ số Fisher (cơ cấu chứng khoán thị trường), 1971 – 1980(14) Năm Bảng 2.4. Tóm tắt các hệ số co giãn cho các mô hình Mô hình Phương trình Độ dốc
Tuyến tính Độ co giãn X Y
=
b
b +
b
b
LnY
X
1
2 ln
2
2
Tuyến tính
Y X
log hay
=
b
b +
lnY
X
1
2
log-log
=
b
b +
b
b
Y
X
*
1
2 ln
2
2
Log-lin
1 Y
) *Xb 2 (
=
b
b +
b
Y
*
1
2
2
2
1 X
1 XY
2 ( )Yb 1 X b
1 2 X
=
a
b +
X
Y i
i
i
+ u i
Lin-log 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 Suất sinh lợi của Afuture Fund (%) Y 37.5 19.2 -35.2 -42.0 63.7 19.3 3.6 20.0 40.3 37.5 Suất sinh lợi dựa trên chỉ số Fisher (%) X 19.5 8.5 -29.3 -26.5 62.9 45.5 9.5 14.0 35.3 31.0 Nghịch - - Đường ñặc tính của phân tích ñầu tư có thể biểu diễn như sau:
ñảo
b=
(3.1) i a dương và có ý Trong một số kết quả thực nghiệm ñã cho thấy i nghĩa thống kê và một số khác lại cho thấy nó không khác 0 và
(3.2)
i
i
+ u i
*
)
X
X
(2.48) có các thông số và các biến
iY và
* i
i
iX tuyến
( = (11) Nếu ta gọi 1 / tính.
Y i (14) Nguồn: Haim Levy & Marshall Sarnat, Portfolio and Investment Selection: Theory and Practive, Prentice – Hall, Engwood Cliffs, N.J., 1984, trang 730 & 738. Số liệu này ñược thu thập bởi các tác giả từ Weisenberg Investment Sevice, Investment Companies, lần xuất bản 1981.
trường hợp sau có thể viết lại mô hình dưới dạng: X
21
22
=
ˆ Y
1.0899
X
i
i
Nếu quyết ñịnh sử dụng mô hình (2.1), ta có kết quả hồi quy sau(15):
(
)
= 2r thô 0.7825 t = 5.6884
(3.3)
2.20 2.11 1.94 1.97 2.06 2.02 1975 1976 1977 1978 1979 1980 0.75 1.08 1.81 1.39 1.20 1.17
Chạy mô hình hồi quy (3.1) và sử dụng bảng số liệu 2.1, ta có kết quả
=
+
1
2
=
=
+
=
0.1216
0.0148;
var
1.2797 (
)
1.0691 (
X )
ˆ iY t
0.1664
4.4860
r
0.7155
ˆ b 1
t ˆ 1
sau: - Sau ñó ta dùng mô hình tuyến tính hai biến ñể làm thích hợp với dữ liệu ñã cho trong bảng 3.2, ta thu ñược các kết quả như sau(17): ˆ Y t (3.4)
2
=
=
=
s
ˆ
(3.5) Từ những kết quả này ta không thể bác bỏ giả thuyết cho rằng giá trị
) )
) = )
0.01140;
0.01656
0.0129;
X ( b se ( b se
var
ˆ b 2
ˆ 2
2
= 2.6911 0.4795 ( ( =
0.6628
r
ñúng của tung ñộ gốc bằng 0, do vậy ta xác nhận việc sử dụng (3.2),
tức là hồi quy qua gốc tọa ñộ. Thực hiện tính toán, ta thu ñược các kết quả sau: 3.2. MỘT ÁP DỤNG CỦA MÔ HÌNH LOG TUYẾN TÍNH: SỰ 0,7774 – 0,2530 lnXt TIÊU THỤ CAFÉ (CÀ PHÊ) Ở HOA KỲ NĂM 1970 – 1980 (3.6) Xét dữ liệu ñã cho trong bảng 3.2
Bảng 3.2. Tiêu thụ Coffee ở Hoa Kỳ (Y) trong tương quan với giá bán lẻ thực tế trung bình (X), 1970 – 1980(16). lnY = r2 = 0,7448 F1,9 = 26,27 Với Yt = tiêu dùng cà phê, ly/người/ngày, và Xt = giá thực của cà phê, USD/pao. Năm Từ các kết quả này, ta thấy hệ số co giãn giá cả là -0,25, có nghĩa là
với 1% gia tăng mức giá thực của 1 pao cà phê, mức cầu cà phê (tính
bằng số ly cà phê tiêu dùng một ngày) bình quân giảm ñi 0,25%. Do
giá trị hệ số co giãn giá cả là 0,25 nhỏ hơn 1 về giá trị tuyệt ñối, ta có
thể nói rằng cầu cà phê không có tính co giãn về giá cả. 1970 1971 1972 1973 1974 Y (Số ly 01 người uống mỗi ngày) 2.57 2.50 2.35 2.30 2.25 X (Giá bán lẽ trung bình mỗi ly) 0.77 0.74 0.72 0.73 0.76 Bây giờ, một cách ñể ta có thể so sánh hai mô hình là tính một ñại
lượng gần ñúng của hệ số co giãn giá cả cho mô hình (3.5). Điều ñó
(15) Kết quả in ra của SAS trong phụ lục 3A, mục 3A.1 (16) Lưu ý: giá danh nghĩa ñược lấy từ chỉ số tiêu dùng (CPI) cho thực phẩm và ñồ uống, 1967 = 100 Nguồn: Dữ liệu Y lấy từ tóm lược của công trình nghiên cứu Quốc gia về uống Café, Nhóm dữ liệu Elkins Park, Peen., 1981 và dữ liệu về X danh nghĩa (nghĩa là X tính theo giá hiện tại) lấy từ Niealsen Food Index A.C.Nielsen, New York, 1981.
(17) Kết quả in ra của SAS trong phụ lục 3A, mục 3A.2
có thể ñược thực hiện như sau:
23
24
ˆ Y t
t
= 2
+ 16329.0 2584.8 ) (
X )
Hệ số co giãn E của biến Y (ví dụ lượng cầu) ñối với một biến khác X
0.9832
t
r
*
*
= - ( = - (
23.494 )
27.549 (
)
0.0000
Giá tri
= 0.0000
p
ñược ñịnh nghĩa là:
( (
/ Y Y X X /
) 100 ) 100
% Thay ñổi của Y E = * là giá trị rất nhỏ. % Thay ñổi của X Giải thích theo cách vừa trình bày, hệ số ñộ dốc khoảng 2585 có D (cid:215) nghĩa là trong khoảng thời gian của mẫu, lượng cung tiền tăng lên = (3.7) D (cid:215) 1%, bình quân, kéo theo sự gia tăng GNP khoảng 25,85 tỷ USD.
Y X X Y
Trước khi tiếp tục, lưu ý rằng nếu muốn tính hệ số co giãn cho các D (cid:215) = D mô hình log-lin hay lin-log, ta có thể thực hiện từ ñịnh nghĩa hệ số co
giãn ở trên, cụ thể, (dY/dX)(X/Y). Trên thực tế, khi biết dạng hàm số = (hệ số ñộ dốc)(X/Y) của mô hình, ta có thể tính các hệ số co giãn bằng cách áp dụng ñịnh ñủ nhỏ, ta có thể thay thế nghĩa ở trên. D D Với D /Y biểu thị thay ñổi (nhỏ). Nếu D X bởi dạng ñạo hàm, dY/dX. Bây giờ ñối với mô hình tuyến 3.4. MỘT ÁP DỤNG CỦA MÔ HÌNH NGHỊCH ĐẢO: ĐƯỜNG
2
CONG PHILLIPS CỦA ANH QUỐC, 1950-1966 tính (3.6), ước lượng của hệ số ñộ dốc ñược tính bởi hệ số ước lượng b , trong hàm cầu cà phê là -0,4795. Như (3.7) biểu thị, ñể tính ñộ Ta có bảng số liệu sau: co giãn, ta phải nhân hệ số ñộ dốc này với tỷ lệ (X/Y), tức là giá cả Bảng 3.3. Tỷ lệ tăng lương hàng năm và tỷ lệ thất nghiệp, chia cho số lượng. Nhưng ta chọn giá trị nào của X và Y? Như Bảng
3.2 biểu thị, có 11 cặp giá trị giá cả (X) và số lượng (Y). Nếu ta sử
dụng tất cả các giá trị này, ta sẽ có 11 ước lượng của ñộ co giãn giá Năm Thất nghiệp, % X
cả. Anh Quốc, 1950-1966 Tăng lương hàng năm, % Y 1,8 1950 1,4 Tuy nhiên trên thực tế, hệ số co giãn ñược tính bằng giá trị trung bình
hay bình quân của Y và X. Tức là, ta có một ước lượng về hệ số co
giãn trung bình.
3.3. MỘT ÁP DỤNG CỦA MÔ HÌNH NỬA LOG
Quay lại với số liệu trong Bảng 2.3, ta có các kết quả hồi quy như
sau:
1951 1952 1953 1954 1955 1956 1957 1958 1959 8,5 8,4 4,5 4,3 6,9 8,0 5,0 3,6 2,6 1,1 1,5 1,5 1,2 1,0 1,1 1,3 1,8 1,9
25
26
KẾT LUẬN VÀ KIẾN NGHỊ
Sau gần một năm nghiên cứu ñề tài “Mở rộng mô hình hồi quy
tuyến tính hai biến”, tác giả nhân thấy ñây là ñề tài rất hay, rất bổ ích.
Hiện chưa có giáo trình, tài liệu chính thức nào bằng tiếng việt ñể
mọi người tham khảo. Điểm hạn chế của ñề tài này là tác giả mới tiếp 1960 1961 1962 1963 1964 1965 1966 2,6 4,2 3,6 3,7 4,8 4,3 4,6 1,5 1,4 1,8 2,1 1,5 1,3 1,4 cận với các mô hình thông qua hai biến việc này dẫn ñến các mô hình
= -
+
(
)
1, 4282
8,2743 1 /
X
r = 2
0,3849
nhiều hơn hai biến chưa ñược nghiên cứu hết. Nếu có ñiều kiện tác Việc xây dựng một mô hình nghịch ñảo (2.48) thích hợp với chuỗi số liệu cho ta các kết quả sau:(19)
Y t
t
(3.8)
giả sẽ tiếp tục nghiên cứu và bổ sung ñể luận văn ñược hoàn chỉnh hơn.
Hình 3.1. Đường cong Philips của Anh Quốc, 1950 – 1966
Đường hồi quy ước lượng ñược biểu diễn trong Hình 3.1. Từ hình
này ta thấy rõ rằng giới hạn bên dưới của tốc ñộ thay ñổi mức lương
là -1,43, tức là khi X tăng lên vô hạn, tỷ lệ phần trăm giảm sút của
(19) Kết quả in ra của SAS trong phụ lục 3A, mục 3A.3
mức lương sẽ không lớn hơn 1,43%/năm.