KINH TẾ LƯỢNG ỨNG DỤNG

1

Nội dung môn học

 Phần I: KTL cơ bản

 Mô hình hồi quy: ước lượng, kiểm định và dự báo

 Các khuyết tật của mô hình

 Định dạng mô hình

 Mô hình hồi quy với biến giả, biến tương tác

 Phần II: Phân tích chuỗi thời gian

 Các mô hình chuỗi thời gian ứng dụng

 Chuỗi thời gian dừng và không dừng

2

 Phần III: Thực hành máy tính với phần mềm Eviews/Stata

HƯỚNG TIẾP CẬN THEO KINH TẾ LƯỢNG

Lý thuyết hoặc giả thiết

Mô hình toán kinh tế

Mô hình kinh tế lượng

Thu thập số liệu

Ước lượng thông số

Kiểm định giả thiết

Xây dựng lại mô hình

Diễn dịch kết quả

Quyết định chính sách

Dự báo

3

Dữ liệu cho nghiên cứu kinh tế lượng

Dữ liệu chéo: bao gồm quan sát cho

nhiều đơn vị kinh tế ở một thời điểm cho trước

Dữ liệu chuỗi thời gian: bao gồm các

quan sát trên một đơn vị kinh tế cho trước tại nhiều thời điểm.

Dữ liệu bảng: là sự kết hợp giữa dữ liệu

chéo và dữ liệu chuỗi thời gian.

4

Time Series Data

Examples of Problems that Could be Tackled Using a

How the value of a country’s stock index has varied with that country’s macroeconomic fundamentals.

How a company’s stock returns has varied when it

Time Series Regression

announced the value of its dividend payment.

in its interest rate

The effect on a country’s currency of an increase

5

Cross Sectional Data

Examples of Problems that Could be Tackled Using a

The relationship between company size and the

Cross-Sectional Regression

return to investing in its shares

The relationship between a country’s GDP level

Acquirer abnormal returns in M & A within banks

and the probability that the government will default on its sovereign debt.

6

Panel Data

Examples of Problems that Could be Tackled Using a

The daily prices of a number of blue chip stocks

Cross-Sectional Regression

over two years

Data

Micro-finance and Poverty: Evidence Using Panel

Corruption and Trade Protection

7

Tips for data source

One of the most frustrating things in doing an

econometrics paper is finding the data. Do not spend a lot of time on a topic before determining whether there is data available that will allow you to answer your question. It is a good idea to write down your ideal data set that would allow you to address your topic. If you find that the available data is not even close to what you had originally desired, you might want to change your topic.

8

CROSS-COUNTRY COMPARISONS

 http://unstats.un.org/unsd/methods/inter-

natlinks/sd_natstat.htm - a United Nations site, provides links to the statistical agencies of countries. Warning – if you are gathering international data from a variety of sources, make sure that the definitions of variables are comparable. Try and find sources that have compiled cross-country statistics on your topic. They have likely already adjusted for definitional differences.

 Check out the websites of the major international

9

organizations – the OECD has a lot of data (www.oecd.org, click on statistics).

MACRO TOPICS  Macro (aggregate) data may be a little easier to find than

10

micro data. Since the data is aggregated (i.e. unemployment rates versus whether a person was unemployed last year) there is little concern of confidentiality which hampers a lot of the gathering of micro-level data. The downside of using aggregate data is that the number of observations that you have are typically much lower and you may have less variation. Also, note that some data used in time series are collected annually, some quarterly, some daily. Make sure you are able to get consistent time periods.

FIRM LEVEL DATA  This type of data is notoriously more difficult to find, for confidentiality reasons. However, industry analyses make for interesting econometric papers. For example, one recent project looked at the effect of pharmaceutical advertisement regulation on sales. Or one could look at the impact of trade regulations or employment regulations on a certain industry. To do a project like this, I would suggest first looking at the annual reports of companies that you are interested in. Also, remember that the fewer companies that you have the more years of data you will need.

11

FINANCIAL DATA  Financial data is useful, not just for finance related topics but as a way of measuring the performance of certain industries. Careful with this type of data – a lot of it costs money. Be sure that the data is downloadable and not just available.

 Some useful websites that you can collect financial data

12

(www.cophieu68.vn; http://cafef.vn/; www.thomsonone.com)

13

 Also, remember that knowing the location of your data – website, reference book, etc – is not the same as having your data available to use. It may take a LONG time to get the data in a format that SOFTWARES can read. Do not leave this till the last minute.

14

 For most data, I enter the data into Excel first. Then …

Some Points to Consider when reading papers in the academic literature

1. Does the paper involve the development of a theoretical model or is it merely a technique looking for an application, or an exercise in data mining?

2. Is the data of “good quality”? Is it from a reliable source? Is the size of the sample sufficiently large for asymptotic theory to be invoked?

3. Have the techniques been validly applied? Have diagnostic tests for violations of been conducted for any assumptions made in the estimation of the model?

4. Have the results been interpreted sensibly? Is the strength of the results exaggerated? Do the results actually address the questions posed by the authors?

5. Are the conclusions drawn appropriate given the results, or has

the Importance of the results of the paper been overstated?

15

Phần I- Mô hình kinh tế lượng cơ bản

 Mô hình hồi quy:

Kiểm định

Ước lượng

Dự báo

 Định dạng mô hình

16

 Các khuyết tật của mô hình

Giới thiệu

 Nhà kinh tế: cung tiền tăng thì lạm phát tăng (các yếu tố

khác không đổi)

 Nhà thống kê: cung tiền và lạm phát có quan hệ tuyến tính chặt với nhau (xu hướng thay đổi rất giống nhau)

 Nhà kinh tế lượng: khi cung tiền tăng 1% thì lạm phát

tăng 0.2% (khi các yếu tố khác không đổi)

 Tác động của việc tăng chi tiêu chính phủ lên tăng

 Tác động của việc tăng cung tiền lên lạm phát?

trưởng kinh tế?

17

 Tác động của việc tăng giá lên doanh thu?, v.v

Mô hình hồi quy tuyến tính

 Mục đích của phân tích hồi quy:

 Dùng số liệu quan sát để ước lượng ảnh hưởng của các biến số (biến độc lập) lên giá trị trung bình của một biến số nào đó (biến phụ thuộc)

 Từ các tham số ước lượng được:

Đánh giá tác động ảnh hưởng

Đưa ra các khuyến nghị về chính sách

18

Thực hiện các dự báo

Mô hình hồi quy tuyến tính – giới thiệu

 Ví dụ: Q = Q (Y, P)

 => hàm hồi quy tuyến tính thể hiện quan hệ này:

 Nếu biết chẳng hạn β1 =10, β2 =0.6, β3 = -0.3 =>

 Q = β1+ β2 Y+ β3 P + u, nếu giả thiết E(u) =0 =>  E(Q| Y, P) = β1+ β2 Y+ β3 P

 Khi giá tăng 1 đơn vị => ?

 Khi thu nhập tăng 1 đơn vị =>?

 Khi Y =100, P =10 thì =>?

19

 Chúng ta muốn biết các βj

Mô hình hồi quy tuyến tính – giới thiệu

 Mô hình hồi quy tổng thể dạng tuyến tính

 Các thành phần của mô hình:

 Biến phụ thuộc

 Các biến độc lập

 Hệ số góc, hệ số hồi quy riêng

20

 Hệ số chặn

Mô hình hồi quy tuyến tính – giới thiệu

 Ý nghĩa của các hệ số hồi quy

 Hệ số chặn

 Hệ số góc

lượng

 Tuy nhiên các hệ số này thường không biết => cần ước

 Hàm hồi quy mẫu: giả sử có mẫu ngẫu nhiên n quan sát

Ước lượng cho các βj chưa biết

ước lượng cho E(Y| Xj)

21

Mô hình hồi quy tuyến tính – giới thiệu

 Q: làm thế nào để nhận được các ước lượng tốt

 => sai lệch giữa giá trị thực tế và giá trị ước lượng là

2 bé nhất

2 + e2

2 +...en

 Viết lại hàm hồi quy mẫu:

22

 Tìm đường hồi quy mẫu mà có: e1  => OLS

Mô hình hồi quy tuyến tính – ước lượng OLS

 Mô hình hai biến => UL OLS là:

 Mô hình 3 biến =>

23

Định lý Gauss-Markov

 Định lý: Nếu các giả thiết 1-6 được thỏa mãn thì: các ước

lượng nhận được từ phương pháp OLS là:  Tuyến tính, không chệch*  Có phương sai nhỏ nhất trong lớp các UL KC

 Các giả thiết:

1. E(ui|X2i,...,Xki)=0: không có sai số hệ thống 2. var(ui|X2i,...,Xki) = δ2 với mọi i 3. cov(ui,uj)=0 với mọi i khác j 4. ui ~ N(0, δ2) với mọi i 5. Không có đa cộng tuyến hoàn hảo giữa các biến Xj 6. Biến Xj là phi ngẫu nhiên, nếu là ngẫu nhiên thì phải độc

24

lập với Ui

Đánh giá sơ bộ về hàm hồi quy ước lượng

 Vậy nếu các giả thiết trên thỏa mãn thì p/p OLS cho ta các

UL điểm tốt nhất cho các tham số của tổng thể

 Ngoài ra với giả thiết 6 về tính chuẩn của u, ta biết được

phân phối của các ước lượng

 Dấu của các hệ số ước lượng: có phù hợp với lý thuyết kinh

tế không?

25

 Hệ số xác định (hệ số xác định bội): R2 , cho biết các biến giải thích trong mô hình giải thích được bao nhiêu phần trăm sự biến đổi của biến phụ thuộc

Ví dụ minh họa

 Kết quả thu được từ hàm hồi quy mức tăng giá theo mức

tăng trong cung tiền là như sau:

 p,m và gdp: mức tăng (%) trong giá, cung tiền và GDP

thực

 CH: con số 0.8 cho biết điều gì?

 Khi tăng cung tiền 1%, liệu mức tăng (%) trong mức

tăng giá sẽ là khoảng bao nhiêu?

=> Bài toán tìm khoảng tin cậy  Liệu có thực sự là khi tăng cung tiền thì gía cũng tăng

không?

26

=> Bài toán kiểm định giả thuyết thống kê

Bài toán xây dựng KTC cho các tham số

 Nếu giả thiết 6 cũng được thỏa mãn, khi đó các KTC là

KTC đối xứng

KTC bên phải

KTC cho βj

KTC bên trái

KTC cho δ2

Ví dụ 1

27

Ví dụ

28

Ví dụ  => Hàm hồi quy có phù hợp với lý thuyết kinh tế không?  Xét dấu của hệ số ước lượng: β^2 = -113.42<0,  β^3 >0; phù hợp với ltkt nói rằng....

 Khi giá thay tăng 1 đơn vị thì trung bình Q thay đổi trong

nhiêu đơn vị?  Tìm KTC bên phải cho β3: => 83.87+ t0.05;1715.28 =  Các biến ADD và P giải thích được bao nhiêu % sự thay

29

đổi trong Q?

khoảng nào?  Tìm KTC đối xứng cho β2  (- 113.42- t0.025,1732.03; -113.42+t0.025;1732.03)  Khi ADD tăng 1 đơn vị thì trung bình Q tăng tối đa bao

Bài toán kiểm định giả thuyết về tham số

Ví dụ về các giả thuyết muốn kiểm định:

 Xu hướng tiêu dùng cận biên <= 1?

 Cung tiền không ảnh hưởng đến lạm phát?

β2 = 0 β2 <= 1  Chi tiêu của chính phủ và đầu tư tư nhân có ảnh hưởng

như nhau đến tăng trưởng kinh tế β2 = β3

 Chi tiêu cho quảng cáo có tác động đến lợi nhuận không β2 >= β3

bé hơn chi tiêu cho R&D

 Giá phân bón và giá điện đều cùng không ảnh hưởng đến

sản lượng lúa

β2 = β3 =0  Tất cả biến độc lập trong mô hình cùng không ảnh hưởng

β2 = ..= βk =0

30

đến Y

Thực hiện kiểm định giả thuyết

 Các bước thực hiện:

 Đưa ra cặp giả thuyết (H0, H1), thống kê và miền bác

bỏ Wα

 Từ số liệu mẫu tính ra giá trị của thống kê (quan sát)  Nếu giá trị này thuộc Wα thì bác bỏ H0 và chấp nhận H1

 Kiểm định T

 Kiểm định về sự phù hợp của hàm hồi quy

 Kiểm định F:

31

 Kiểm định thu hẹp hàm hồi quy

Kiểm định T

 Ví dụ: Y= β1+ β2TV+ β3IN +β4P+ u ; n=100 Y: lợi nhuận của công ty; TV: Quảng cáo trên tivi; IN: Quảng cáo trên mạng, P: giá bán của sản phẩm

Y^ = 156+ 1.7 TV+1.4IN – 0.1P; R2 = 0.95

 Kết quả chạy hồi quy:

se 2 (1.5) (0.5) (0.02)

Quảng cáo trên tivi giúp tăng lợi nhuận?

 Muốn kiểm định:

Wα = (t0.05;∞) = (1.66; ∞)

32

Không bác bỏ H0

Bảng tóm tắt về cặp gt và miền bác bỏ

Loại giả thiết

Bác bỏ H0 khi

H0

H1

Hai phía

*

*

i

i = i i # i | t |> t /2(n - k)

Bên trái

*

i = () i

* i < i

t < - t  (n - k)

Bên phải

*

i = ( i

*) i > i

33

t > t (n - k)

Ghi chú

 Khi kiểm định: H0: βj = 0; H1: βj # 0 thì có 2 cách thực

hiện:

 Khi không nói rõ α (mức ý nghĩa của kiểm định), hoặc (1- α) ( độ tin cậy dùng khi tìm KTC) thì mặc định α = 0.05

34

 Kiểm định thông thường: dùng tỷ số t  Đọc giá trị P: nếu P< α thì bác bỏ H0

Kiểm định F về sự phù hợp của hàm hồi quy

 Về sự phù hợp của hàm hồi quy:

n = 100; R2 = 0.68

Y= β1+ β2TV+ β3IN +β4P+ u

Fqs = 68 > 3.1 Bác bỏ H0

 H0: β2= β3= β4= 0; H1: có ít nhất 1 hệ số là khác 0  Fqs = (R2/3) / [(1 – R2) /(n -4)]  Nếu Fqs> fα (3, n-4) => bác bỏ H0

 Công thức chung: Nếu Fqs = (R2/(k-1)) / [(1 – R2) /(n -k)] >fα (k-1, n-k) => bác bỏ

35

H0; trong đó k là số biến có mặt trong mô hình

Kiểm định hồi quy có điều kiện ràng buộc- kiểm định F

 Ví dụ: Muốn kiểm định: cả hai hình thức quảng cáo đều

không có tác động đến lợi nhuận

H0: β2 = 0; β3 = 0 ; H1: có ít nhất 1 trong 2 hệ số này

th

khác 0

 Fqs thuộc miền bác bỏ => bác bỏ H0

36

Wα = (fα(m, n-k), ∞) = (f0.05(2,96), ∞ ) = (3.09, ∞) Thực hiện hồi quy thu hẹp: Y= α1+ α2P+ v, thu được R2

Kiểm định định F (tiếp)

 Ví dụ:

 Hàm hồi quy có phù hợp không?

Kiểm định F: đọc thống kê F: Fqs = 24.18 > f0.05(2, 17) => bác bỏ H0 Đọc giá trị P của thống kê F: Giá trị P của thống kê F = 0.00< 0.05 => bác bỏ H0

37

  cả P và ADD đều cùng không ảnh hưởng đến Q?  H0 : β2 = β3 = 0; H1: có ít nhất 1 hệ số khác 0

Bài toán dự báo

 Trở lại bài toán về mức tăng giá (lạm phát)

 Giả định sang năm 2008: GDP tăng 9%, cung tiền tăng

20%

 Mức tăng giá trung bình sẽ dao động trong khoảng

 Khi đó mức tăng giá (trung bình) sẽ là bao nhiêu?

nào?

 Mức tăng giá cá biệt sẽ dao động trong khoảng nào?

 Mức tăng giá (cá biệt) là bao nhiêu?

38

 Bài toán về dự báo giá trị trung bình và giá trị cá biệt

Thực hiện dự báo

 Dự báo bằng ước lượng điểm

 Dự báo bằng KTC

 giá trị trung bình

39

 Giá trị cá biệt

Tóm tắt

 Ý nghĩa kinh tế của hệ số góc:

Khi X2 tăng 1% thì trung bình của Y tăng β2 % đơn vị  Ý nghĩa thống kê của hệ số góc: có khác 0 hay không? ~ biến X tương ứng có ảnh hưởng lên biến độc lập không

40

Khi X2 tăng 1 đơn vị => Y tăng β2 đơn vị, khi các biến khác không đổi

Về các khuyết tật có thể có của mô hình

- Đa cộng tuyến cao

- Phương sai của sai số thay đổi

- Tự tương quan

- Dạng hàm sai

41

- Tính chuẩn của ssnn

Đa cộng tuyến

 Khái niệm về đa cộng tuyến: mối tương quan tuyến tính

 ĐCT hoàn hảo

giữa các biến giải thích trong mô hình

 ví dụ: giá dầu và CPI; giá thịt lợn và giá thịt bò; lao

 ĐCT không hoàn hảo - chỉ quan tâm khi ĐCT cao

động và vốn của doanh nghiệp

Y= β1+ β2X2+ β3X3 + u ==> r23 cao?

 Chẳng hạn trong:

Y= β1+ β2X2+...+ βkXk + u ==> tương quan tuyến tính giữa X2;...;Xk cao

42

 Làm sao để phát hiện: hồi quy phụ;

Đa cộng tuyến

 ước lượng OLS khi có hiện tượng đa cộng tuyến cao

 Vẫn là ULTTKC tốt nhất trong lớp các UL TTKC

 Tuy nhiên nó không tốt, như sau:

Xét mô hình hồi quy 3 biến, khi đó:

Phương sai của các UL lớn => Độ chính xác thấp

KTC thường rộng

Dấu hệ số ước lượng có thể sai .v.v

43

Tỷ số t thường nhỏ => ?

Phương sai sai số thay đổi

i

 Khái niệm: var(ui) = δ2  Nguyên nhân:

 Mối quan hệ giữa các biến số

 v.v.

 Con người học được từ hành vi trong quá khứ,

 UL OLS khi PSSS thay đổi:

 Vẫn là UL tuyến tính, không chệch, nhưng không hiệu

quả

 UL của các phương sai sẽ chệch

44

 Kiểm định T, F mất hiệu lực

Phương sai sai số thay đổi

45

 Xét ví dụ mô hình hồi qui 2 biến trong đó biến phụ thuộc Y là tiết kiệm của hộ gia đình và biến giải thích X là thu nhập khả dụng của hộ gia đình

Y

Y

(a)

(b)

0

X

0

X

X1 X2

Xn

X1 X2

Xn

Hình: (a) Phương sai của sai số không đổi và (b) Phương sai của sai số thay đổi

46

 Hình a cho thấy tiết kiệm trung bình có khuynh hướng

tăng theo thu nhập. Tuy nhiên mức độ dao động giữa tiết kiệm của từng hộ gia đình so với mức tiết kiệm trung bình không thay đổi tại mọi mức thu nhập.

 Đây là trường hợp của phương sai sai số (nhiễu) không

2) = 2

đổi, hay phương sai bằng nhau.

47

E(ui

2

E(ui

2) = i

48

 Trong hình b, mức độ dao động giữa tiết kiệm của từng hộ gia đình so với mức tiết kiệm trung bình thay đổi theo thu nhập. Đây là trường hợp phương sai của sai số thay đổi.

Nguyên nhân của phương sai thay đổi

 Do tích lũy kinh nghiệm mà sai số theo thời gian ngày

càng giảm

 Công cụ về thu thập xử lý số liệu cải thiện dẫn đến sai

 Do bản chất của hiện tượng kinh tế

49

số đo lường và tính toán giảm

 Trong mẫu có các outlier (giá trị rất nhỏ hoặc rất lớn so

với các giá trị quan sát khác)

 Mô hình hồi quy không đúng (dạng hàm sai, thiếu biến

quan trọng)

 Hiện tượng phương sai thay đổi thường gặp khi thu thập

50

số liệu chéo (theo không gian)

Hậu quả của phương sai thay đổi

1. Ước lượng OLS vẫn tuyến tính, không chệch nhưng không phải là ước lượng hiệu quả (vì phương sai không nhỏ nhất)

2. Ước lượng phương sai của ước lượng OLS, nhìn

51

chung, sẽ bị chệch.

Kiểm định White về PSSS thay đổi

=> R2(1)

 H0 : PSSS trong mô hình là không đổi  ước lượng mô hình gốc thu được các phần dư et  chạy hàm hồi quy (trường hợp có tích chéo):

 Nếu:

k: số biến trong m.h 1

PSSS thay đổi

52

 Tương tự với trường hợp không có tích chéo

Khắc phục PSSS thay đổi

 Định dạng của phương sai thay đôỉ

 Dùng đồ thị để dự đoán dạng của phương sai

 Thực hiện các kiểm định để kiểm định dự đoán

 Cách khắc phục: phương pháp bình phương bé nhất

tổng quát (GLS):

 Biến đổi biến số để mô hình mới có PPSS không đổi

ngược lại hệ số cho mô hình gốc

 ước lượng bằng OLS mô hình mới này, từ đó suy

2 = a = không đổi

53

 Ví dụ: Y= β1+ β2TV+ β3IN +β4P+ u  nếu PSSS có dạng: var(ui) = aTV2, khi đó Y/TV= β1/TV+ β2+ β3IN/TV +β4P/TV+ u/TV Khi đó var(ui/TVi) = var(ui)/ TVi

Tự tương quan

 Khái niệm: cov(ui; uj) >< 0 với i>

 ut = ρut-1 + vt ==> tự tương quan bậc nhất; AR(1)  ut = ρ1ut-1 +..+ ρput-p+ vt => AR(p)  v(t) là sai số ngẫu nhiên, thỏa mãn các giả thiết của OLS.

 Hậu quả khi có tự tương quan:

 Vẫn là UL không chệch

 Phương sai ước lượng của thường bị chệch

 Các kiểm định T, F không đáng tin cậy

 Ước lượng cũng là ước lượng chệch =>

54

a. Đồ thị

et

et

 

 

t

t

(b)

(a)

et

et 

 

t

t

(c)

 

(d)

et

 

 

t

(e) Không có tự tương quan

Nguyên nhân

Nguyên nhân khách quan:

 Quán tính: các chuỗi thời gian mang tính chu kỳ, VD: các

chuỗi số liệu thời gian về GDP, chỉ số giá, sản lượng, tỷ lệ thất nghiệp…

 Hiện tượng mạng nhện: phản ứng của cung của nông sản

đối với giá thường có một khoảng trễ về thời gian:

QSt = 1 + 2Pt-1 + ut

 Độ trễ: tiêu dùng ở thời kỳ hiện tại phụ thuộc vào thu nhập và chi tiêu tiêu dùng ở thời kỳ trước đó: Ct = 1 + 2It + 3Ct- 1 + ut

Nguyên nhân

Nguyên nhân chủ quan

 Hiệu chỉnh số liệu: do việc “làm trơn” số liệu  loại bỏ

những quan sát “gai góc”.

 Sai lệch do lập mô hình: bỏ sót biến, dạng hàm sai.

 Phép nội suy và ngoại suy số liệu

Phát hiện tự tương quan

 Kiểm định Durbin Watson, dùng trong trường hợp:

Không có giá trị trễ của biến phụ thuộc là biến giải

AR (1)

thích

Không mất quan sát

Không đủ chứng cứ để kết luận

Không có TTQ

TTQ dương

TTQ âm

0

2

dL

dU

4-dU

4-dL

4

58

Phát hiện tự tương quan

 Khi có giá trị trễ của biến phụ thuộc là biến giải thích:

Durbin h

 kiểm định B-G

et = a1 + a2 Xt + ρ1et-1+..+ ρp et-p +vt => R2(1) et = a1 + a2 Xt + vvt => R2(2)

Nếu:

hoặc

Mô hình gốc có TTQ bậc p

ví dụ Eviews

59

Tự tương quan- khắc phục

 Biện pháp khắc phục:

giả sử TTQ có dạng AR(1): ut = ρut-1 +vt  ước lượng hệ số tự tương quan rồi sau đó dùng GLS

 đặt Y* = Y – ρ’Y(-1); X* = X – ρ’X(-1)

dựa trên hệ số ước lượng này, như sau:

 Thực hiện OLS hàm hồi quy theo biến mới:

60

Y* = β1+ β2X* + v

Định dạng mô hình

 Thừa biến: => ước lượng OLS là không chệch, vững nhưng

không hiệu quả

 Kiểm định thừa biến

 Kiểm định thừa 1 biến: kiểm định T  Kiểm định thừa >= 2 biến: Kiểm định F

 Hồi quy mô hình gốc: Y = α1+ α2X+u , thu được ước

 Thiếu biến: => ước lượng OLS chệch và không vững  Dạng hàm sai & thiếu biến: Kiểm định RESET

lượng của Yt và R2(1)

 Thực hiện hồi quy:

61

Thu được R2(2)

Định dạng mô hình (Tiếp)

 Nếu Fqs = [(R2(2) – R2(1)/(m-1)]/[ (1-R2(2))/(n-k(2)) ]>

fα (m, n-k(2))

 Bác bỏ H0, trong đó H0: hàm định dạng đúng

 Kiểm định nhân tử Lagrange (LM)

 Hồi quy hàm hồi quy gốc, thu được ước lượng của Yt

và R2(1)

 Thực hiện hồi quy:

định dạng sai

62

 Thu được R2(3). Nếu => mô hình

Tóm tắt

 Mục đích của phân tích hồi quy  Phương pháp sử dụng để UL mô hình hồi quy tuyến tính

cổ điển: OLS

 Các kết quả ước lượng dùng để:

 Suy diễn về các hệ số trong tổng thể  Từ đó có các ứng dụng thực tế về chính sách  Để các UL thu được có các tính chất tốt, mô hình cần

 Đã xét về 4 giả thiết cơ bản  Mô hình với biến giải thích là biến giả: xem giáo trình  Tính chuẩn của ssnn

63

thỏa mãn một số giả thiết cơ bản

Những nội dung chính cần nhớ

 Hiểu ý nghĩa kinh tế/ ý nghĩa thống kê của các hệ số

ước lượng trong mô hình

 Hiểu một số thống kê quan trọng của mô hình

hậu quả

 Nắm được 4 loại khuyết tật có thể có của mô hình và

 Nắm được các phương pháp phát hiện chính/ công thức

 Hiểu được cách khắc phục của từng loại khuyết tật

64

của các thống kê dùng để kiểm định

HỒI QUY VỚI BIẾN GIẢ

1

5.1. Sử dụng biến giả trong mô hình hồi quy

Ví dụ 5.1: Xét sự phụ thuộc của thu nhập (Y) (triệu

đồng/tháng) vào thời gian công tác (X) (năm) và nơi

làm việc của người lao động (DNNN và DNTN).

Z = 1: làm trong DNNN và Z = 0: làm trong DNTN

Trong đó Y và X là biến số lượng, còn Z là chỉ tiêu

chất lượng cho biết có hay không một thuộc tính nào

đó. Z được gọi là biến giả trong mô hình

2

(5.3)

E(Y/X,Z) = 1 + 2Xi + 3Zi (5.1) (5.2) E(Y/X,Z=0) = 1 + 2Xi E(Y/X,Z=1) = 1 + 2Xi + 3 (5.2): mức thu nhập bình quân tháng của người lao động tại DNTN khi có thời gian công tác là X năm.

: 2 người có cùng thời gian công tác thì

trung bình mức thu nhập của người làm tại DNNN cao

hơn người làm tại DNTN 0,4 triệu đồng/tháng.

3

E(Y/X,Z) = 1 + 2Xi + 3Zi

Y

X

4

Hình 5.1

E(Y/X,Z) = 1 + 2Xi + 3Zi + 4XiZi

Y

X

5

Hình 5.2

Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) Z1i = 0 phạm trù Z2i = 0 cơ sở Để lượng hoá chỉ tiêu chất lượng trên, ta phải dùng 2 biến giả Z1 và Z2.

6

7

E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i E(Y/X,Z1=0,Z2=0) = 1 + 2Xi E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3 E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4 : 2 người có cùng thời gian công tác thì trung bình mức thu nhập của người làm tại DNNN cao hơn người làm tại DNLD 0,4 triệu đồng/tháng. : 2 người có cùng thời gian công tác thì trung bình mức thu nhập của người làm tại DNTN thấp hơn người làm tại DNLD 0,2 triệu đồng/tháng. Lưu ý: Một chỉ tiêu chất lượng có m phạm trù khác nhau thì ta phải dùng m-1 biến giả để lượng hoá cho chỉ tiêu chất lượng đó.

Ví dụ 5.3. tiếp ví dụ 5.2, thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác)

D1i =

D2i =

1: nếu trình độ từ đại học trở lên 0: nếu không 1: nếu trình độ cao đẳng 0: nếu không có trình độ cao đẳng

8

Tổng quát: số biến giả đưa vào mô hình phụ thuộc vào số biến định tính và số phạm trù có ở mỗi biến định tính. Số biến giả đưa vào mô hình có thể được xác định theo công thức sau: Trong đó: n – số biến giả đưa vào mô hình; k – số biến định tính; ni – số phạm trù của biến định tính thứ i.

9

10

5.2. Sử dụng biến giả trong phân tích mùa Z = 1, nếu quan sát trong mùa, và Z=0 nếu quan sát không nằm trong mùa. Từ tháng 1-6: trong mùa, Tháng 7-12: ngoài mùa. Y: chi tiêu cho quần áo, X: thu nhập khả dụng - Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn - Nếu yếu tố mùa có ảnh hưởng đến hệ số góc thì Mô hình sau có tính tổng quát hơn. Thông qua việc kiểm định giả thiết chúng ta sẽ biết được hệ số góc nào có ý nghĩa.

5.3. Kiểm định sự ổn định cấu trúc của các mô hình hồi quy bằng biến giả Ví dụ 5.4. Cho số liệu tiết kiệm và thu nhập cá nhân ở nước Anh từ 1946-63 (triệu pounds)

11

Hàm tiết kiệm Thời kỳ tái thiết: 1946-54 Thời kỳ hậu tái thiết có các trường hợp sau xảy ra:

12

Chúng ta kiểm tra xem hàm tiết kiệm có bị thay đổi cấu trúc giữa 2 thời kỳ hay không. Chúng ta xét hàm tiết kiệm tổng quát của cả 2 thời kỳ:

Với n = n1 + n2 Trong đó Z = 1: quan sát thuộc thời kỳ tái thiết Z = 0 : quan sát thuộc thời kỳ hậu tái thiết * Kiểm định giả thiết H0: 3=0 Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình * Kiểm định giả thiết H0: 4=0 Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình

13

Từ số liệu ở bảng ta có kết quả hồi quy theo mô hình như sau: t = (-5,27) (9,238) (3,155) (-3,109) pt = (0,000) (0,000) (0,007) (0,008) Kết quả trên cho thấy cả tung độ gốc và hệ số góc chênh lệch đều có ý nghĩa thống kê. Điều đó chứng tỏ rằng các hồi quy trong hai thời kỳ là khác nhau.

14

Từ kết quả trên, chúng ta có thể tính hồi quy cho 2 thời kỳ như sau: Thời kỳ tái thiết: Z = 1 Thời kỳ hậu tái thiết: Z = 0

15

Tiết kiệm

Thu nhập

-0.27

16

-1.75

5.4. Hàm tuyến tính từng khúcYX Ví dụ 5.5: Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*. Hàm hồi quy sẽ có dạng: Y: Chi phí; X: sản lượng; X*: giá trị ngưỡng sản lượng

17

Y

X

18

Trong đó tổng SL làm thay đổi độ dốc (X*) là 5500 tấn

Ta có kết quả hồi quy như sau:

t = (-0,824) (6,607) (1,145) R2 = 0,9737 X* = 5500

19

Lưu ý: Nếu biến phụ thuộc là biến giả: Nếu ta có một biến phụ thuộc là biến giả tức là biến chỉ nhận hai giá trị 0 và 1. Chúng ta không thể sử dụng phương pháp bình phương bé nhất (OLS) để ước lượng hàm hồi quy mà phải dùng các phương pháp khác để ước lượng như: -Mô hình xác suất tuyến tính (LPM) -Mô hình Logit (Logit model) -Mô hình Probit (Probit model) -Mô hình Tobit (Tobit model)

20

DẠNG HÀM

DẠNG HÀM

MỤC TIÊU

1. Mở rộng các dạng hàm 2. Hiểu ý nghĩa các hệ số hồi quy

2

NỘI DUNG

Khái niệm biên tế, hệ số co giãn 1

Giới thiệu các mô hình 2

4.1 BIÊN TẾ

Giả sử có hàm Y=f(X) Giá trị biên tế MXY =∆Y/∆X ∆Y= MXY * ∆X Ý nghĩa của biên tế: Cho biết lượng thay đổi tuyệt đối của biến phụ thuộc Y khi biến độc lập X thay đổi 1 đơn vị

Khi ∆X->0, MXY ≈ f’(X)

4

4.1 HỆ SỐ CO GIÃN

Hệ số co giãn của Y theo X là

Lượng thay đổi tương đối của Y

5

4.1 HỆ SỐ CO GIÃN

Ý nghĩa của hệ số co giãn: cho biết sự thay đổi tương đối (%) của Y khi X thay đổi 1% Khi ∆X->0

Hệ số co giãn không phụ thuộc đơn vị đo

6

4.2 Mô hình hồi quy qua gốc tọa độ

Mô hình hồi quy tổng thể Mô hình hồi quy mẫu ngẫu nhiên:

7

4.3 Mô hình tuyến tính logarit (log-log)

 Mô hình hồi quy mũ Hay

8

4.3 Mô hình tuyến tính logarit (log-log)

Ví dụ: Khi giá tăng 1% thì lượng cầu của loại hàng hoá này sẽ giảm 0,25%.

9

4.4 . Mô hình bán logarit

4.4.1. Mô hình log-lin

Công thức tính lãi gộp

Với r: tốc độ tăng trưởng gộp theo thời gian

của Y

t: thời gian (tháng, quý, năm)

10

4.4.1. Mô hình log-lin

Lấy logarit hai vế

lnYt = lnY0 + t*ln(1+r)

Hay lnYt = 1 + 2.t

với lnY0= 1 và ln(1+r) = 2

Mô hình bán logarit có yếu tố ngẫu nhiên

lnYt = 1 + 2.t + Ut

11

4.4.1. Mô hình log-lin

Thay đổi tương đối của biến phụ thuộc (Y)

2 =

Thay đổi tuyệt đối của biến độc lập (t)

Nhân thay đổi tương đối của Y lên 100. Nếu 2>0: tốc độ tăng trưởng (%) của Y đối với thay đổi tuyệt đối của t Nếu 2 < 0: tốc độ giảm sút

12

4.4.1. Mô hình log-lin

Ứng dụng: Nghiên cứu khảo sát tốc độ tăng trưởng (giảm sút) của các biến kinh tế vĩ mô như GDP, dân số, lao động, năng suất. Mô hình tuyến tính Yt = β1 + β2.t +Ut thích hợp với ước lượng thay đổi tuyệt đối của Y theo thời gian Mô hình log-lin thích hợp với ước lượng thay đổi tương đối của Y theo thời gian

13

4.4.1. Mô hình log-lin

Ví dụ: Cho kết quả hồi quy tổng SP nội địa (RGDP) tính theo giá năm 1987 của Mỹ trong khoảng thời gian 1972-1991

Nếu Y = ln(RGDP)

GDP thực tăng với tốc độ 2,47%/năm từ 1972- 1991.

Nếu Y = RGDP

GDP thực tăng với tốc độ tuyệt đối 97,68 tỷ USD/năm từ 1972-1991.

14

4.4.2. Mô hình lin-log

hay

Nếu X thay đổi 0,01 (hay 1%) thay đổi tuyệt đối của Y là 0,012.

15

4.4.2. Mô hình lin-log

Ví dụ Y: GNP (tỷ USD) X: lượng cung tiền (tỷ USD) Với số liệu trong khoảng thời gian 1970-83 Ý nghĩa 2=2584,785: trong khoảng thời gian 1970-83, lượng cung tiền tăng lên 1%, kéo theo sự gia tăng bình quân của GNP 25,84 tỷ USD.

16

4.5 Mô hình nghịch đảo

Đặc điểm: Khi X tiến tới ∞, số hạn β2(1/X) tiến dần tới 0 và Y tiến tới giá trị tới hạn β1. Ứng dụng: đường chi phí đơn vị, đường tiêu dùng theo thu nhập Engel hoặc đường cong Philip.

17

Đường chi phí đơn vị

Y (AFC)

1 >0 2 >0

1

Chi phí sản xuất cố định trung bình (AFC) giảm liên tục khi sản lượng tăng và cuối cùng tiệm cận với trục sản lượng ở β1

0

X (sản lượng)

18

Đường cong Phillips

1 <0 2 >0

0

X (Tỷ lệ thất nghiệp)

1

Khi tỷ lệ thất nghiệp tăng vô hạn, tỷ lệ giảm sút của tiền lương sẽ không vượt quá β1

19

Y (Tỷ lệ thay đổi tiền lương)

Đường cong Engel

1

1 > 0 2 < 0

0

-2 / 1

Y (Chi tiêu của một loại hàng)

20

X (Tổng thu nhập/ Tổng chi tiêu)

Đường cong Engel

Chi tiêu hàng hóa tăng khi tổng thu nhập (hoặc tổng chi tiêu) tăng nhưng đối với một số loại hàng hóa thì thu nhập của người tiêu dùng phải đạt ở mức tối thiểu -2 / 1 (hay còn gọi là ngưỡng thu nhập) thì người tiêu dùng mới sử dụng loại hàng này.

Mặt khác, nhu cầu của loại hàng này là hữu hạn, nghĩa là dù thu nhập có tăng vô hạn thì người tiêu dùng cũng không tiêu thụ thêm mặt hàng này nữa. Mức tiêu dùng bão hòa của loại hàng này là β1

21

4.6 Mô hình đa thức

Tổng chi phí

Với: Y X Số lượng sản phẩm Ứng dụng: từ hàm này, suy ra được chi phí trung bình (AC) và chi phí biên (MC)

22

4.7 Mô hình có độ trễ phân phối

Với: Yt Tiêu dùng năm t Xt Thu nhập năm t Xt-1 Thu nhập năm t-1 Xt-k Thu nhập năm t-k k

Chiều dài độ trễ

23

So sánh R2 giữa các mô hình

Cùng cỡ mẫu n Cùng số biến độc lập. Nếu các hàm hồi quy không cùng số biến độc lập thì dùng hệ số xác định hiệu chỉnh Biến phụ thuộc xuất hiện trong hàm hồi quy có cùng dạng. Biến độc lập có thể ở các dạng khác nhau. VD: Các hàm hồi quy có thể so sánh R2 với nhau

Y=β1 + β.X +U Y= β1 + β.lnX +U

Y=β1 + β.X +U lnY= β1 + β.X +U

24

Các hàm hồi quy không thể so sánh R2 với nhau

Copyright 1996 Lawrence C. Marsh

Time Series Analysis

Copyright 1996 Lawrence C. Marsh

Previous Chapters used Economic Models

1. economic model for dependent variable of interest. 2. statistical model consistent with the data. 3. estimation procedure for parameters using the data. 4. forecast variable of interest using estimated model.

Times Series Analysis does not use this approach.

Time Series Analysis does not generally incorporate all of the economic relationships found in economic models.

Times Series Analysis uses more statistics and less economics.

Copyright 1996 Lawrence C. Marsh

Time Series Analysis is useful for short term forecasting only.

Long term forecasting requires incorporating more involved behavioral economic relationships into the analysis.

Univariate Time Series Analysis can be used to relate the current values of a single economic variable to:

1. its past values

2. the values of current and past random errors

Other variables are not used in univariate time series analysis.

Copyright 1996 Lawrence C. Marsh

Three types of Univariate Time Series Analysis processes will be discussed in this chapter:

1. autoregressive (AR)

2. moving average (MA)

3. autoregressive moving average (ARMA)

Copyright 1996 Lawrence C. Marsh

Multivariate Time Series Analysis can be used to relate the current value of each of several economic variables to:

1. its past values.

2. the past values of the other forecasted variables.

3. the values of current and past random errors.

Vector autoregressive models discussed later in this chapter are multivariate time series models.

Copyright 1996 Lawrence C. Marsh

First-Order Autoregressive Processes, AR(1):

yt = d + q1yt-1+ et, t = 1, 2,...,T. (16.1.1)

d is the intercept.

2 .

q1 is parameter generally between -1 and +1. et is an uncorrelated random error with mean zero and variance se

Copyright 1996 Lawrence C. Marsh

Autoregressive Process of order p, AR(p) :

yt = d + q1yt-1 + q2yt-2 +...+ qpyt-p + et (16.1.2)

d is the intercept.

qi’s are parameters generally between -1 and +1.

2 .

et is an uncorrelated random error with mean zero and variance se

Copyright 1996 Lawrence C. Marsh

Copyright 1996 Lawrence C. Marsh

Properties of least squares estimator:

AR models always have one or more lagged dependent variables on the right hand side.

Consequently, least squares is no longer a best linear unbiased estimator (BLUE), but it does have some good asymptotic properties including consistency.

AR(2) model of U.S. unemployment rates

yt = 0.5051 + 1.5537 yt-1 - 0.6515 yt-2 (0.1267) (0.0707) (0.0708)

positive

negative

Copyright 1996 Lawrence C. Marsh

Note: Q1-1948 through Q1-1978 from J.D.Cryer (1986) see unempl.dat

Choosing the lag length, p, for AR(p):

The Partial Autocorrelation Function (PAF)

The PAF is the sequence of correlations between (yt and yt-1), (yt and yt-2), (yt and yt-3), and so on, given that the effects of earlier lags on yt are held constant.

Copyright 1996 Lawrence C. Marsh

1

Partial Autocorrelation Function Data simulated from this model: ^ qkk

yt = 0.5 yt-1 + 0.3 yt-2 + et qkk is the last (kth) coefficient in a kth order AR process.

k

2 / T 0 - 2 / T

This sample PAF suggests a second order process AR(2) which is correct.

-1

Copyright 1996 Lawrence C. Marsh

Using AR Model for Forecasting:

unemployment rate: yT-1 = 6.63 and yT = 6.20

^

^

^ ^ yT+1 = d + q1 yT + q2 yT-1 = 0.5051 + (1.5537)(6.2) - (0.6515)(6.63) = 5.8186

^

^

^ ^ yT+2 = d + q1 yT+1 + q2 yT = 0.5051 + (1.5537)(5.8186) - (0.6515)(6.2) = 5.5062

^

^

^ ^ yT+1 = d + q1 yT + q2 yT-1 = 0.5051 + (1.5537)(5.5062) - (0.6515)(5.8186) = 5.2693

Copyright 1996 Lawrence C. Marsh

Moving Average Process of order q, MA(q):

yt = m + et + a1et-1 + a2et-2 +...+ aqet-q + et (16.2.1)

m is the intercept.

2 .

ai‘s are unknown parameters. et is an uncorrelated random error with mean zero and variance se

Copyright 1996 Lawrence C. Marsh

An MA(1) process:

yt = m + et + a1et-1 (16.2.2)

Minimize sum of least squares deviations:

Copyright 1996 Lawrence C. Marsh

T

T

2

2

S(m,a1) = S et = S(yt - m - a1et-1) (16.2.3)

t=1

t=1

Stationary vs. Nonstationary

Copyright 1996 Lawrence C. Marsh

stationary: A stationary time series is one whose mean, variance, and autocorrelation function do not change over time.

nonstationary: A nonstationary time series is one whose mean, variance or autocorrelation function change over time.

Copyright 1996 Lawrence C. Marsh

Copyright 1996 Lawrence C. Marsh

Copyright 1996 Lawrence C. Marsh

Copyright 1996 Lawrence C. Marsh

Copyright 1996 Lawrence C. Marsh

NONSTATIONARY PROCESSES

Random walk

The chart shows a typical random walk. If it were a stationary process, there would be a tendency for the series to return to 0 periodically. Here there is no such tendency.

10

Copyright 1996 Lawrence C. Marsh

STATIONARY PROCESSES

Here is a series generated by this process with b2 = 0.7 and random numbers for the innovations.

16

First Differencing is often used to transform a nonstationary series into a stationary series:

yt = z t - z t-1

where z t is the original nonstationary series and yt is the new stationary series.

Copyright 1996 Lawrence C. Marsh

Choosing the lag length, q, for MA(q):

The Autocorrelation Function (AF)

The AF is the sequence of correlations between (yt and yt-1), (yt and yt-2), (yt and yt-3), and so on, without holding the effects of earlier lags on yt constant.

The PAF controlled for the effects of previous lags but the AF does not control for such effects.

Copyright 1996 Lawrence C. Marsh

Autocorrelation Function

yt = et - 0.9 et-1

Data simulated from this model:

1

rkk

This sample AF suggests a first order process MA(1) which is correct.

k

2 / T 0 - 2 / T

rkk is the last (kth) coefficient in a kth order MA process.

-1

Copyright 1996 Lawrence C. Marsh

Autoregressive Moving Average ARMA(p,q)

An ARMA(1,2) has one autoregressive lag and two moving average lags:

yt = d + q1yt-1 + et + a1et-1 + a2 et-2

Copyright 1996 Lawrence C. Marsh

Integrated Processes

A time series with an upward or downward trend over time is nonstationary.

Many nonstationary time series can be made stationary by differencing them one or more times.

Such time series are called integrated processes.

Copyright 1996 Lawrence C. Marsh

The number of times a series must be differenced to make it stationary is the order of the integrated process, d.

An autocorrelation function, AF, with large, significant autocorrelations for many lags may require more than one differencing to become stationary.

Check the new AF after each differencing to determine if further differencing is needed.

Copyright 1996 Lawrence C. Marsh

Copyright 1996 Lawrence C. Marsh

Unit Root

zt = q1zt -1 + m + et + a1et -1 (16.3.2)

-1 < q1 < 1 stationary ARMA(1,1)

q1 = 1 nonstationary process

q1 = 1 is called a unit root

Unit Root Tests

zt - zt -1 = (q1- 1)zt -1 + m + et + a1et -1

Copyright 1996 Lawrence C. Marsh

*

Dzt = q1zt -1 + m + et + a1et -1 (16.3.3)

*

where Dzt = zt - zt -1 and q1 = q1- 1

*

Testing q1 = 0 is equivalent to testing q1 = 1

Unit Root Tests

Copyright 1996 Lawrence C. Marsh

*

*

H0: q1 = 0 vs. H1: q1 < 0 (16.3.4)

Computer programs typically use one of the following tests for unit roots:

Dickey-Fuller Test

Phillips-Perron Test

Copyright 1996 Lawrence C. Marsh

Autoregressive Integrated Moving Average ARIMA(p,d,q)

An ARIMA(p,d,q) model represents an AR(p) - MA(q) process that has been differenced (integrated, I(d)) d times.

yt = d + q1yt-1 +...+ qpyt-p + et + a1et-1 +... + aq et-q

The Box-Jenkins approach:

1. Identification

determining the values of p, d, and q.

2. Estimation

linear or nonlinear least squares.

3. Diagnostic Checking

model fits well with no autocorrelation?

4. Forecasting

short-term forecasts of future yt values.

Copyright 1996 Lawrence C. Marsh

Vector Autoregressive (VAR) Models

Use VAR for two or more interrelated time series:

yt = q0 + q1yt-1 +...+ qpyt-p + f1xt-1 +... + fp xt-p + et

xt = d0 + d1yt-1 +...+ dpyt-p + a1xt-1 +... + ap xt-p + ut

Copyright 1996 Lawrence C. Marsh

Vector Autoregressive (VAR) Models

1. extension of AR model. 2. all variables endogenous. 3. no structural (behavioral) economic model. 4. all variables jointly determined (over time). 5. no simultaneous equations (same time).

Copyright 1996 Lawrence C. Marsh

The random error terms in a VAR model may be correlated if they are affected by relevant factors that are not in the model such as government actions or national/international events, etc.

Since VAR equations all have exactly the same set of explanatory variables, the usual seemingly unrelation regression estimation produces exactly the same estimates as least squares on each equation separately.

Copyright 1996 Lawrence C. Marsh

Least Squares is Consistent

Consequently, regardless of whether the VAR random error terms are correlated or not, least squares estimation of each equation separately will provide consistent regression coefficient estimates.

Copyright 1996 Lawrence C. Marsh

VAR Model Specification

To determine length of the lag, p, use:

1. Akaike’s AIC criterion

2. Schwarz’s SIC criterion

Copyright 1996 Lawrence C. Marsh

Spurious Regressions

yt = b1 + b2 xt + et

where et = q1 et-1 + nt

-1 < q1 < 1 I(0) (i.e. d=0) q1 = 1 I(1) (i.e. d=1)

If q1 =1 least squares estimates of b2 may appear highly significant even when true b2 = 0 .

Copyright 1996 Lawrence C. Marsh

Copyright 1996 Lawrence C. Marsh

Cointegration

yt = b1 + b2 xt + et

If xt and yt are nonstationary I(1) we might expect that et is also I(1).

However, if xt and yt are nonstationary I(1) but et is stationary I(0), then xt and yt are said to be cointegrated.

Cointegrated VAR(1) Model

VAR(1) model:

yt = q0 + q1yt-1 + f1xt-1 + et

xt = d0 + d1yt-1 + a1xt-1 + ut

If xt and yt are both I(1) and are cointegrated, use an Error Correction Model, instead of VAR(1).

Copyright 1996 Lawrence C. Marsh

Error Correction Model

Dyt = yt - yt-1 and Dxt = xt - xt-1

Dyt = q0 + (q1-1)yt-1 + f1xt-1 + et

Dxt = d0 + d1yt-1 + (a1-1)xt-1 + ut

(continued)

Copyright 1996 Lawrence C. Marsh

Error Correction Model

Copyright 1996 Lawrence C. Marsh

*

Dyt = q0 + g1(yt-1 - b1 - b2 xt-1) + et

*

Dxt = d0 + g2(yt-1 - b1 - b2 xt-1) + ut

* q0 = q0 + g1b1

g1 =

f1 d1 a1 - 1

b2 =

1 - a1 d1

g2 = d1

* d0 = d0 + g2b1

Estimating an Error Correction Model

Step 1:

yt-1 = b1 + b2 xt-1 + et-1

Estimate by least squares: to get the residuals:

^

^

^ et-1 = yt-1 - b1 - b2 xt-1

Copyright 1996 Lawrence C. Marsh

Estimating an Error Correction Model

Step 2:

Estimate by least squares:

Copyright 1996 Lawrence C. Marsh

*

^

Dyt = q0 + g1 et-1 + et

*

^

Dxt = d0 + g2 et-1 + ut