Hai biến ngẫu nhiên ngang nhau: Không phân biệt biến độc lập

CHƯ Ơ NG 8. TƯ Ơ NG QUAN VÀ HỒ I QUY

Trong các chư ơ ng trư ớ c, ta đề cập chủyế u các phư ơ ng pháp nghiên cứ u một biế n đơ n lẻ , hoặc các

biến ngẫ u nhiên độ c lập.

Trong chư ơ ng này, ta sẽ nói đế n mối liên hệgiữa hai biến ngẫu nhiên vớ i hai phư ơ ng pháp: tư ơ ng

quan và hồi quy.

1. TƯ Ơ NG QUAN

Mục tiêu củ a phân tích tư ơ ng quan là đo lư ờ ng cư ờ ng độ của mối quan hệgiữa hai biến và .

Trong phân tích này, và đư ợ c xem là hai biến ngẫ u nhiên “ngang nhau”-không phân biệt biến

độ c lập và biến phụthuộc.

Tư ơ ng quan tuyế n tính giữa hai biến và là khái niệm thểhiệnmứ c độ mối liên hệtuyến tính

giữa và .

1.1.Hệsố tư ơ ng quan

Giảsửvà là hai biến ngẫu nhiên, với trung bình và phư ơ ng sai lầ n lư ợ t là , , , .

Hệsố tư ơ ng quan thểhiệ n cư ờ ng độ và chiề u hư ớ ng tuyến tính giữa và ;

đư ợ c gọi là hệsố tư ơ ng quan củ a tổng thể. Ta có − 1 ≤ ≤ 1.

< 0 thì giữa và có mối liên hệnghịch, nghĩa là khi một biến giả m đi thì biến kia sẽ

tăng lên và ngư ợ c lại.

> 0 thì giữa và có mối liên hệthuận, nghĩa là khi biế n này tăng thì biến kia cũng tăng

và ngư ợ c lại.

= 0 thì giữa và không có mối liên hệtuyên tính.

Trịtuyệ t đố i của càng lớn thì mối liên hệtuyến tính giữa và càng chặt chẽ.

Trong thực tế, ta không biết và phả i ư ớ c lư ợ ng nó từdữliệu mẫu thu thậ p đư ợ c.

Gọi(,),(,),…,(,)là mẫu gồm n cặp giá trịquan sát thu thập ngẫu nhiên từvà .

Hệsố tư ơ ng quan tổ ng thể đư ợ c ư ớ c lư ợ ng từhệsố tư ơ ng quan mẫ u (còn đư ợ c gọi là hệsố

tư ơ ng quan Pearson):

=∑( − )( − )

( − 1)

Ví dụ:Số lư ợ ng vềthời gian quảng cáo trên truyền hình và lư ợ ng sản phẩm tiêu thụ ở một công ty

sản xuấ t đồ chơ i trẻ em:

Thời gian quảng cáo trong tuần

(phút)

Lư ợ ng tiêu thụtrong tuần

(1000 sản phẩm)

Gọi và lầ n lư ợ t là thời gian quảng cáo trên truyền hình (phút) và lư ợ ng sản phẩm tiêu thụtrong

tuần (1000 sản phẩm).

Áp dụng công thức trên ta có = 0.63882

1.2.Kiể m đị nh giảthuyết vềmối liên hệ tư ơ ng quan

Bên cạnh việc thểhiện mứ c độ chặt chẽcủa mối liên hệ, vấ n đề chủyế u là dùng r để xét xem có

hay không mối liên hệ tư ơ ng quan giữ a hai biến,, tức là kiể m đị nh giảthuyết cho rằng hệsố

tư ơ ng quan củ a tổng thểbằng không.

Giảsửcó mẫu n cặp quan sát chọn ngẫu nhiên từ,có phân phối chuẩn.

Gọi r là hệsố tư ơ ng quan mẫ u.

Kiể m đị nh giảthuyế t tư ơ ng quan về tổng thể như sau:

: = 0 ( ô ó ê ệ ữ à )

: ≠ 0 ( ó ê ệ ữ à )

Giá trịkiể m đị nh

=| |

1 −

− 2

Quy tắc quyế t đị nh ởmức ý nghĩa bác bỏnếu>( ), /

Với( ), / là tra bảng phân phối Student với bậc tựdo ( − 2) với mức ý nghĩa / 2.

Kiể m đị nh hai phía trên đây sử dụng khi không biế t trư ớ c chiề u hư ớ ng của mối liên hệ.

Nếu có thể xác đị nh đư ợ c chiề u hư ớ ng của mối liên hệ, ta thực hiện kiể m đị nh một phía,bên trái

hoặc bên phải: : > 0 hoặc: < 0.

Ta làm hoàn toàn tư ơ ng tự như kiể m đị nh hai phía, chỉ lư u ý trong tra bảng phân phối Student giá

trị( ),thay vì ( ), / .

2. HỒ I QUY ĐƠ N GIẢ N

2.1. Lý thuyết Keynes vềtiêu dùng

2.1.1. Lý thuyết củ a Keynes đãđặ t ra mối quan hệgiữa tiêu dùng và thu nhập

= ( ).

Ví dụ:Kết quả điề u tra vềthu nhập (triệ u đồ ng/tháng) và tiêu dùng (triệ u đồ ng/tháng) cho bởi

bảng giá trịsau:

Thu nhập

Tiêu dùng

2.038

4.038

6.038

Minh họa các sốliệu trên hình vẽ, quan hệgiữa tiêu dùng và thu nhập= ( ), là mối quan hệ

tuyến tính.

Dependent Variable: TIEUDUNG

Method: Least Squares

Date: 12/11/09 Time: 15:34

Sample: 1 3

Included observations: 3

Variable

Coefficient

Std. Error

t-Statistic

Prob.

THUNHAP

0.400000

1.60E-16

2.50E+15

0.0000

0.038000

1.73E-15

2.20E+13

0.0000

R-squared

1.000000

Mean dependent var

4.038000

Adjusted R-squared

1.000000

S.D. dependent var

2.000000

S.E. of regression

1.13E-15

Sum squared resid

1.28E-30

F-statistic

6.23E+30

Durbin-Watson stat

1.114255

Prob(F-statistic)

0.000000

Khi đó ta có quan hệ ở dạng

= 0.038 + 0.4

Ý nghĩa củ a phư ơ ng trình này như sau:

Nếu= 0 thì = 0.038, điề u này có ý nghĩa rằ ng ngư ờ i không có thu nhập vẫn tiêu dùng

ởmức tối thiểu là 0.038 triệ u đồ ng/tháng.

Hệsố 0.4 (hay khuynh hư ớ ng tiêu dùng theo thu nhập) cho biết, nế u tăng thu nhậ p lên

1 triệu/tháng thì tiêu dùng tăng lên 0.4 triệ u đồ ng/tháng. Tức là mứ c tăng tiêu dùng không

nhanh bằng mứ c tăng thu nhậ p.

Vềtrung bình, khi thu nhậ p tăng thì tỷlệgiữa thu nhập và tiêu dùng ()ngày càng giảm

2.038

5>4.038

10 >6.038

Như vậ y có một tỷlệlớ n hơ n thu nhậ p đư ợ c đư a vào tiế t kiệ m khi ngư ờ i ta giàu lên.

Một cách tổng quát, hàm mô tảtốt nhấ t khuynh hư ớ ng tiêu dùng theo thu nhập của Keynes có dạng

tuyến tính

= + ( > 0, ∈(0,1)

Ví dụ:Sốliệu vềtiêu dùng trung bình và thu nhập khảdụng theo giá cố đị nh của nền kinh tếMỹ

trong 10 năm từ 1970-1979

Đơ n vị : tỷdollars

Năm

Thu nhập khảdụng

Tiêu dùng trung bình

1970

751.6

672.1

1971

779.2

696.8

1972

810.3

737.1

1973

864.7

767.9

1974

857.5

762.8

1975

874.9

779.4

1976

906.8

823.1

1977

942.9

864.3

1978

988.8

903.2

1979

1015.7

927.6

Dependent Variable: TIEUDUNGTRUNGBINH

Method: Least Squares

Date: 12/11/09 Time: 15:40

Sample: 1 10

Included observations: 10

Variable

Coefficient

Std. Error

t-Statistic

Prob.

THUNHAPKHADUNG

0.979267

0.031607

30.98253

0.0000

-67.58065

27.91071

-2.421316

0.0418

R-squared

0.991735

Mean dependent var

793.4300

Adjusted R-squared

0.990702

S.D. dependent var

84.96543

S.E. of regression

8.193028

Akaike info criterion

7.221301

Sum squared resid

537.0056

Schwarz criterion

7.281818

Log likelihood

-34.10650

F-statistic

959.9172

Durbin-Watson stat

1.566424

Prob(F-statistic)

0.000000

Mặc dù dữliệu xem ra thểhiện khá tốt quy luật tuyến tính.

Như ng rõ ràng mối quan hệ có tính xác đị nh đó là không đủ để mô tảthực tiễn, vì còn rất nhiều

yếu tốkhác ả nh hư ở ng đế n tiêu dùng (như giớ i tính, tuổ i tác, tâm lý…)

Nói chung, chúng ta không có tham vọ ng đư a hế t tất cảmọi yếu tố ả nh hư ở ng tới tiêu dùng vào mô

hình mà chỉnhững yếu tốquan trọng, thiết yếu nhất.

Vì vậ y, để có thểbiểu diễn quy luật tiêu dùng trên thếgiới thực, ta cầ n đư a thêm vào mô hình tuyến

tính trên một thành phần khác nữa mang tính ngẫu nhiên, thểhiện sự tác độ ng tổng hợp của các

nhân tốnhỏ, không ổ n đị nh tới tiêu dùng.

Tức là những yếu tốlàm cho quan sát thật vềtiêu dùng và thu nhập bịlệch khỏi xu thế ổ n đị nh,

tuyến tính nêu trên.

Tức là ta muốn biểu diễn mối quan hệgiữa các cặp dữliệ u quan sát đư ợ c vềthu nhập và tiêu dùng

{,}như sau:

= + + , = 1, 2,…,

Trong đó (,)= ( , ) lầ n lư ợ t là tiêu dùng và thu thập thực tếcủa mẫu quan sát thứ.Xét vế

phải củ a phư ơ ng trình này ta có:

- Thành phần thứnhất+là quy luậ t xác đị nh, mà ta cầ n ư ớ c lư ợ ng.

- Thành phần thứhai là nhiễu (tức là bao gồm sự tác độ ng tổng hợp của mọi yếu tố

khác của hoàn cảnh, có tính ngẫu nhiên, làm quan sát bịlệch khỏ i khuynh hư ớ ng hay ổn

đị nh).

Cảhai phần này, tính xu thế-xác đị nh và yếu tốngẫ u nhiên đư ợ c gộp lạ i trong phư ơ ng trình trên

để mô tảlý thuyết tiêu dùng của Keynes.

2.1.2. Ư ớ c lư ợ ng quy luật tiêu dùng

Ta muốnư ớ c lư ợ ng xu thếtiêu dùng bằng quy luật tuyến tính:

= +

trong đó là ư ớ c lư ợ ng về tiêu dùng, khi cho trư ớ c quan sát thu nhập ;

và là các tham số ư ớ c lư ợ ng của các tham sốtổng thể , chư a biế t,.

Mứ c độ tốtcủa việ c ư ớ c lư ợ ng đư ợ c đo lư ờ ng qua số dư

= −

Tổng bình phư ơ ng các sai số , ký hiệu là ESS

=(−)= − −

Một cách tổng quát, chúng ta muốn rằng tổng bình phư ơ ng sai số phầ n dư là nhỏ nhất theo phư ơ ng

pháp bình phư ơ ng cự c tiểu:

, = − − → min( , )

Sửdụng cực trị có điề u kiệnta có

HAI BIẾN NGẪU NHIÊN NGANG NHAU - KHÔNG PHÂN BIỆT BIẾN ĐỘC LẬP

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi