Phương pháp hồi quy và tương quan - Phân tích dãy số thời gian và dự báo

Chia sẻ: le_cuongtv

Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn gọi là biến được giải thích) vào một biến hay nhiều biến khác (biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập.

Bạn đang xem 10 trang mẫu tài liệu này, vui lòng download file gốc để xem toàn bộ.

Nội dung Text: Phương pháp hồi quy và tương quan - Phân tích dãy số thời gian và dự báo

CHƯƠNG 1

CƠ SỞ LÝ LUẬN


1.1. Phương pháp hồi quy và tương quan

1.1.1. Hồi qui tuyến tính một chiều ( tuyến tính đơn)

Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn
gọi là biến được giải thích) vào một biến hay nhiều biến khác (biến độc lập hay còn
gọi là biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đoán) giá trị trung
bình của biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập.

1.1.1.1. Phương trình hồi qui tuyến tính một chiều

Đặt (x1, y1), (x2, y2),…, (xn, yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:

y = α + β x1 + ε1

Theo phương pháp bình phương bé nhất thì ước lượng các hệ số α và β là các giá
trị a và b sao cho tổng bình phương sai số của phương trình sau đây là bé nhất:
n n

∑ ei2 = ∑ ( y − a − bx ) 2
SS = i i
i =1 i =1



Các hệ số a và b được tính như sau:
n n

∑ xi yi − nx y ∑ ( x − x)( y − y)
i 1
i =1 i =1
b= =
n n

∑ x − nx ∑ ( x − x)
−2
2 2
i i
i =1 i =1



Suy ra : a = y - b x

Và phương trình hồi qui tuyến tính mẫu của y trên x là: y = a + b x

1.1.1.2. Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều

Giả sử đường hồi qui tuyến tính có dạng: yi = α + β x1 + ε1

Và đặt σ ε là phương sai của sai số và được ước lượng từ công thức sau:
2



-1-
n

∑e 2
SEE
2
s= i
=
i =1
e
n−2
n−2

Đặt b là ước lượng mẫu của β thì phương sai của b là

σ e2
σ e2
σ=
2
=
∑ ( xi − x)2 ∑x
2
b
− nx
2
i



→ Ước lượng không chênh lệch của σ ε2 được xác định bởi:

σ e2
Se2
σ =S =
2 2
=
∑ ( xi − x)2 ∑x
2
b b
− nx
2
i



Giả sử, sai số hồi qui ( ε1 ) có phân phối chuẩn thì ngẫu nhiên (t) dùng để kiểm định
giả thuyết về β và ước lượng khoảng tin cậy của β được tính như sau:

b−β
t=
Sb

Và khoảng tin cậy 100 (1 - α )% cho β là:

Sb < β < b + t
b −t Sb
α α
n−2, n − 2,
2 2


α
Trong đó, tn − 2,α là một số sao cho P( tn − 2 > tn − 2,α ) =
2
2 2



1.1.1.3. Kiểm định tham số hồi qui tổng thể ( β )

Ở mức ý nghĩa α , giả thuyết H0 có thể được kiểm định dưới các trường hợp:

 H 0 : β = β0  H 0 : β = β0  H 0 : β = β0
Đặt giả thuyết:   
(1) (2) (3)
 H1 : β > β 0  H1 : β < β 0  H1 : β # β 0

b − β0
Giá trị kiểm định: t =
Sb

t > t α
 n − 2,
2
Quyết định bác bỏ giả thuyết H0 khi: t < tn − 2,α t < tn − 2,α 
t < −tn − 2,α
 2



Giả thuyết H0: β = 0

-2-
1.1.1.4. Phân tích phương sai hồi qui

* Hệ số xác định: R2 là hệ số nhằm xác định mức độ quan hệ giữa X và Y có quan
hệ hay không hoặc bao nhiêu phần trăm sự biến thiên của Y có thể giải thích bởi sự
phụ thuộc tuyến tính của Y vào X.

Giá trị thực tế yi = a + bx1 +e1

Giá trị dự đoán theo phương trình hồi qui: y = a + bx1

⇒ y1 = µ1 + e1
y

Vậy e1 là sự khác biệt giữa giá trị thực tế với giá trị dự đoán của phương trình hồi qui
tuyến tính. Như vậy e1 thể hiện phần biến thiên của Y không thể giải thích bởi mối
quan hệ tuyến tính giữ Y và X.

Ta có:

∑e
∑ ( y − y) ∑ ( µ − y)
2
2 2
= +
y i
i i



Hay SST = SSR+ SSE

SSR càng lớn thì mô hình hồi qui tuyến tính càng có độ tin cậy cao trong việc giải
thích sự biến động của Y

SSR SSE
Hệ số xác định R2 = là phần trăm biến động của Y được giải thích
=1-
SST SST
bởi mối quan hệ tuyến tính của Y vào X.

* Phân tích phương sai

Trong ước lượng các tham số của mô hình hồi qui tuyến tính đơn theo phương pháp
bình quân nhỏ nhất, có thể chứng minh được rằng:
∑ ( yi – ytb)2 = ∑ ( yi - )2 + ∑ ( – ytb)2
i i

Trong đó:
∑ ( yi – ytb)2 = SST là tổng biến động của y
– ytb)2 = SSR là tổng bình phương hồi qui, là đại lượng biến
∑( i

động của y được giải thích bởi đường hồi qui.




-3-
)2 = SSE là phần biến động còn lại hay còn gọi là dư số, là
∑ ( yi - i

đại lượng biến động tổng gộp của nguồn biến động do các nhân tố khác gây ra mà
không hiện diện trong mô hình hồi qui và phần biến động ngẩu nhiên.
SSR càng lón thì mô hình hồi qui càng có đ ộ tin cậy cao trong vi ệc gi ải thích

biến động của y.
Hệ số xác định: r2 = SSR/ SST = 1 – ( SSE/ SST) là phần trăm biến động của y

được giải thích bởi mối quan hệ tuyến tính của y đối với x.
Số thống kê F = SSR/ [ SSE/ ( n-2)] = MSR/MSE có phân phối F và thường được

dùng để kiểm định mức ý nghĩa của mô hình hồi qui. F càng lớn mô hình càng có ý
nghĩa.
Các nguồn biến động của hồi qui tuyến tính đơn được tóm tắt trong bảng phân
tích phương sai hồi qui như sau:
Độ tự do Tổng bình phương Trung bình bình phương
Nguồn biến (d.f) (SS) (MS)
động
Do hồi qui – ytb)2
1 SSR=∑ ( i

Dư số )2
(n-2) SSE=∑ ( yi - SSE/(n-2)
i




Tổng cộng SST= ∑ ( yi – ytb)2
(n-1) SST/(n-1)
1.1.1.5. Dự báo trong phương pháp hồi qui tuyến tính đơn giản

Ước lượng khoảng giá trị thực của yn +1 với độ tin cậy (1 - α )

1 ( xn +1 − x) 2
1+ +
$ ±t
y Se n n2
α
∑ xi − nx
2
n − 2,
2
i =1



Ước lượng khoảng giá trị trung bình của yn +1 với độ tin cậy (1 - α )

1 ( xn +1 − x ) 2
+
$ ±t
y Se n n2
α
∑ xi − nx
2
n − 2,
2
i =1




1.1.2. Hồi qui tuyến tính nhiều chiều

-4-
1.1.2.1. Mô hình hồi qui

Giả sử Y phụ thuộc vào k biến độc lập X1…Xk. Nếu giá trị của k biến độc lập
X1...Xk mô hình hồi qui tuyến tính nhiều chiều có dạng :

Y = α + β1 X1 + β 2 X2 + … + β k Xk + U

Giải thích biến:

- Y (biến phụ thuộc): chỉ tiêu phân tích: Năng suất lúa dình quân cả năm.

- α ( biến độc lập): hệ số chặn phản ánh mức độ ảnh hưởng của các nhân tố khác
đến chỉ tiêu phân tích.

- β : hệ số ước lượng, các hệ số hồi quy này phản ánh mức độ ảnh hưởng của từng
nhân tố đến biến giải thích.

Nếu β >0 thì ảnh hưởng thuận và ngược lại là ảnh hưởng nghịch. β càng lớn thì sự
ảnh hưởng đến chỉ tiêu phân tích càng mạnh.

- Xi các yếu tố ảnh hưỏng đến năng suất.Với i chạy từ 1 đến k.

- U là sai số

1.1.2.2. Phương trình hồi qui

Gọi các hệ số a, b1…bk ước lượng cho α , β1 … β k được xác định bởi phương pháp
bình phương bé nhất. Phương trình hồi qui có dạng:

Y = a + b1x1 + b2x2 +…+bkxk.

Các tham số a, b1,b2,…,bn có thể được ước lượng dễ dàng nhờ các phần mềm có sẵn
các biến độc lập X1, X2,…, Xk.

1.1.2.3. Phân tích phương sai hồi qui

 Hệ số xác định:

Hệ số xác định R2 là nói lên tính chặt chẽ giữa biến phụ thuộc Y và các biến độc lập
Xi, tức là nó thể hiện phần trăm biến thiên của Y có thể được giải thích bởi sự biến
thiên của tất cả các biến Xi.

SSR SSE
0 ≤ R2 ≤ 1
R2 = =1-
SST SST
-5-
Trong đó:
n

∑e 2
: là phần biến động còn lại hay còn gọi là số dư
SSE = i
i =1


n

∑ (° − y ) 2 : là tổng bình phương hồi qui, là đại lượng biến động của y
y
SSR = i
i =1 i


được giải thích bằng đường hồi qui
n

∑ ( y − y) 2
: là tổng biến động của y.
SST = i
i =1



SSR càng lớn thì mô hình hồi quy càng có độ tin cậy cao trong việc giải thích bi ến
động y

 Hệ số tương quan bội R

R nối lên tính chặt chẽ của mối quan hệ giữa biến phụ thuộc (y) và các biến độc lập
(xi).

(-1 ≤ R ≤ 1)
R= R2

 Phân tích ANOVA hồi quy:

Kiểm định sự phù hợp của mô hình (ANOVA):

Giá trị được dùng để kiểm định là giá trị F. Việc kiểm định này nhằm đảm
bảo cho việc phù hợp của mô hình hồi quy tuyến tính mẫu với các hệ số tìm được
vẫn có giá trị khi suy diễn ra mô hình thực cho tổng thể.

Để kiểm định sự phù hợp của mô hình hồi quy tổng thể, ta sử dụng Sig.F đ ể
làm căn cứ cho việc chấp nhận hay bác bỏ giả thiết

Sig.F < α : mô hình có ý nghĩa.

Sig.F > α : mô hình không có ý nghĩa.

1.1.2.4. Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy nhiều
chiều

Mô hình hồi qui nhiều chiều cho tổng thể có dạng:

y = α + β1 x1 + β 2 x2 +… + β k xk + U

-6-
Đặt a, b1, b2, … ,bk là những tham số được ước lượng cho tổng thể ; Sa , Sb , Sb , …, 1 2



Sbk là những độ lệch chuẩn đã ước lượng, và U coi phân phối chuẩn thì biến ngẫu

nhiên t được tính như sau:

b1 − β1
a −α
; tb1 = S
tα = có độ tự do ( n –k -1)
Sa b1



Vì vậy, khoảng tin cậy 100(1- α )% cho các hệ số hồi qui β1 được tính như sau:

b1 - tn − k −1,α Sb < β < b1 + tn − k −1,α Sb
i i
2 2



 
t
là một số sao cho (P  tn −k −1 > tn − k −1,α ÷ .
α
n − k −1,
 
2
2



1.2.Dãy số thời gian

1.2.1. Khái niệm

Các hiện tượng kinh tế - xã hội luôn luôn biến động qua thời gian. Để nghiên cứu sự
biến động này người ta dung phương pháp dãy số thời gian . Dãy số thời gian là dãy
các giá trị của chỉ tiêu kinh tế - xã hội biến động theo thời gian.

1.2.2. Phân loại

Căn cứ vào đặc điểm về mặt thời gian, người ta thường chia dãy số thời gian thành 2
loại:

Dãy số thời kỳ: là dãy số biểu hiện sự thay đổi của hiện tượng qua từng thời
-
kỳ nhất định.

Dãy số thời điểm: là dãy số biểu hiện mặt lượng của hiện tượng vào một
-
thời điểm nhất định

Một cách chi tiết hơn, dãy số thời điểm còn có thể được chia thành dãy số thời điểm
có khoảng cách thời gian bằng nhau và dãy số thời điểm có khoảng cách thời gian
không bằng nhau.



1.2.3. Ý nghĩa của việc nghiên cứư dãy số thời gian

-7-
Phương pháp phân tích một dãy số thời gian dựa trên một giả định căn bản là: sự
biến động trong tương lai của hiện tượng nói chung sẽ giống với sự biến động c ủa
hiện tượng trong quá khứ và hiện tại xét về mặt đặc điểm và cường độ biến động.
Nói một cách khác các yếu tố đã ảnh hưởng đến biến động của hiện tượng trong quá
khứ và hiện tại được giả định trong tương lai sẽ tiếp tục tác động đến hiện tượng
theo xu hướng và cường độ giống hoặc gần giống như trước.

Do vậy, mục tiêu chính của phân tích dãy số thời gian là chỉ ra và tách biệt các yếu tố
đã ảnh hưởng đến dãy số thời gian. Điều đó có ý nghĩa trong việc dự đoán cũng như
nghiên cứu quy luật biến động của hiện tượng. Tất nhiên, giả định nói trên có nhược
điểm, nó thường bị phê bình là quá ngây thơ và máy móc vì đã không xem xét đến sự
thay đổi về kỹ thuật, thói quen, nhu cầu hoặc sự tích lũy kinh nghiệm trong kinh
doanh... Vì vậy phương pháp phân tích dãy số thời gian cung cấp những thông tin
hữu ích các nhà quản lý trong việc dự đoán và xem xét chu kỳ biến động c ủa hi ện
tượng. Đây là công cụ đắc lực cho họ trong việc ra quyết định.

1.2.4. Các yếu tố ảnh hưởng đến dãy số thời gian

Biến động của một dãy số thời gian: X1, X2,…, Xn thường được xem như là kết
quả hợp thành của các yếu tố sau đây:

- Tính xu hướng: Quan sát số liệu thực tế của hiện tượng trong một thời
gian dài (thường là nhiều năm), ta thấy biến động của hiện tượng theo một chiều
hướng ( tăng hoặc ) giảm rõ rệt. Nguyên nhân của 2 loại biến động này là sự thay
đổi trong công nghệ sản xuất, gia tăng dân số, biến động về tài sản…

- Tính chu kỳ: biến động của hiện tượng được lặp lại với một chu kỳ nhất
định, thường kéo dài 2-10 năm, trải qua 4 giai đoạn: phục hồi, phát triển, thịnh
vượng, suy thoái và đình trệ. Biến động theo chu kỳ là do biến động tổng hợp của
nhiều yếu tố khác nhau. Chẳng hạn như trong kỳ kinh doanh thì chu kỳ đời sống sản
phẩm ảnh hưởng rất lớn đến doanh thu của công ty qua 4 giai đoạn của nó.

- Tính thời vụ: biến động của một số hiện tượng kinh tế - xã hội mang tính
thời vụ nghĩa là hàng năm, vào thời điểm nhất định (tháng hoặc quý) biến động của
hiện tượng được lặp đi lặp lại. Nguyên nhân của biến động hiện tượng là do các
điều kiện thời tiết khí hậu tập quán xã hội, tín ngưỡng của dân cư…
-8-
- Tính ngẫu nhiên hay bất thường: là những biến động không có quy luật và
hầu như không thể dự đoán được. Loại biến động này thường xảy ra trong một thời
gian ngắn và không lặp lại. Nguyên nhân là do ảnh hưởng của các biến cố chính tr ị,
thiên tai, chiến tranh…

Giá trị X trong dãy số thời gian X1, X2,…, Xn, có thể được diễn tả bằng công thức
sau:

Xi = Ti . Ci . Si . Ii

Xi : Giá trị thứ i của dãy số thời gian

Ti : Giá trị của yếu tố xu hướng

Ci : Giá trị của yếu tố chu kỳ

Si : Giá trị của yếu tố thời vụ

Ii : Giá trị của yếu tố ngẫu nhiên (bất thường)

1.2.5. Các chỉ tiêu cơ bản dùng để phân tích biến động dãy số thời gian

1.2.5.1. Mức độ trung bình theo thời gian

Là số trung bình của các mức độ trong dãy số. Chỉ tiêu này biểu hiện mức độ
chung nhất của hiện tượng trong thời kỳ nghiên cứu.

Ký hiệu: x1, x2, …, xn: Dãy số thời gian

x : Mức độ trung bình

 Mức độ trung bình của dãy số thời kỳ
n

∑x
x1 + x2 + ... + xn 1
x= = i =1
n
n

 Mức độ trung bình của dãy số thời điểm

Khoảng cách thời gian giữa các thời điểm bằng nhau

1 1
x1 + x2 + ... + xn −1 +
x=2 2
n −1

Nếu khoảng cách giữa các điểm thời gian không bằng nhau
-9-
∑ x .t i
x=
∑t i



xi: mức độ thứ i

ti: độ dài thời gian có mức độ thứ i

x : Giá trị trung bình thứ i

1.2.5.2.Lượng tăng (giảm) tuyệt đối

Là chỉ tiêu biểu hiện sự thay đổi về giá trị tuyệt đối của hiện tượng giữa hai thời
kỳ hoặc thời điểm nghiên cứu.

Tuỳ theo mục đích nghiên cứu, ta có:

Lượng tăng giảm tuyệt đối từng kỳ (liên hoàn): Biểu hiện lượng tăng giảm
-

tuyệt đối giữa 2 thời kỳ kế tiếp nhau.

∆ i = xi - xi −1 ( I =2, …,n)

Lượng tăng (giảm) tuyệt đối định gốc: Biểu hiện lượng tăng giảm tuyệt đối
-

giữa kỳ nghiên cứu và kỳ được chọn làm gốc.

∆ 'n = xi – x1

x1: kỳ được chọn làm gốc

Giữa lượng tăng (giảm) tuyệt đối từng kỳ và định gốc có mối liên hệ sau.
Tổng đại số các lượng tăng (giảm) tuyệt đối từng kỳ bằng lượng tăng (giảm) tuy ệt
đối định gốc, nghĩa là:
n

∑∆ = ∆n
'
i
i =1



- Lượng tăng (giảm) tuyệt đối trung bình: chỉ tiêu này biểu hi ện một
cách chung nhất lượng tăng (giảm) tuyệt đối, tính trung bình cho cả thời kỳ
nghiên cứu.
n

∑∆ i
∆= i =2

n −1

-10-
Chỉ tiêu này có ý nghĩa khi các lượng tăng (giảm) tuyệt đối từng kỳ xấp xỉ nhau.

1.2.5.3. Tốc độ phát triển (lần, %)

Là chỉ tiêu biểu hiện sự biến động của hiện tượng xét về mặt t ỷ l ệ. Tuỳ
theo mục đích nghiên cứu, ta có các loại tốc độ phát triển sau:

- Tốc độ phát triển từng kỳ (liên hoàn) : Biểu hiện sự biến động về mặt tỷ
lệ của hiện tựơng giữa hai kỳ liền nhau.

xi
xi −1
ti = ( i= 2,3,…,n)

- Tốc độ phát triển định gốc: Biểu hiện sự biến động về mặt tỷ lệ của hiện
tượng giữa kỳ nghiên cứu với kỳ được chọn làm gốc.

xi
ti' = (I = 2,3,…,n)
x1

* Mối quan hệ giữa tốc độ phát triển từng kỳ và định gốc

- Tích các tốc độ phát triển từng kỳ bằng tốc độ phát triển định gốc.
n

∏t = tn
'
Công thức: i
i −2



- Thương của hai tốc độ phát triển định gốc liền nhau bằng tốc độ phát từng kỳ.

t i'
= ti
Công thức:
t i'−1

1.2.5.4. Tốc độ tăng (giảm)

Thực chất tốc độ tăng (giảm) bằng tốc độ tăng trừ đi 1 ( hoặc trừ 100 nếu tính bằng
%). Nó phản ánh mức độ của hiện tượng nghiên cứu giữa hai thời kỳ tăng lên hay
giảm đi bao nhiêu lần (hoặc %), nói lên nhịp điệu của sự tăng theo thời gian.

- Tốc độ tăng (giảm) từng kỳ (hay liên hoàn)

xi − xi −1
ai = (i=2,3,…,n)
xi −1

xi − xi −1 = ∆ i
Vì:

-11-
- Tốc độ tăng (giảm) định gốc

∆i
Suy ra: a i = hay ai = t i − 1
xi −1

xi − x1
ai' = (i=2,3,…,n)
x1

xi − x1 = ∆'i
Vì:

∆'i
ai' = hay ai' = t i' − 1
Suy ra:
xi

- Tốc độ tăng (giảm) trunng bình

a = t −1

1.2.5.5. Giá trị tuyệt đối của 1% tăng (giảm)

Là chỉ tiêu này biểu hiện mối quan hệ giữa chỉ tiêu lượng tăng (giảm) tuyệt
đối trong công thức với chỉ tiêu tốc độ tăng (giảm), nghĩa là tính xem 1 % tăng (giảm)
của chúng tương ứng với một lượng giá trị tuyệt đối tăng giảm là bao nhiêu.

∆i
gi =
ai

∆i
Từ công thức trên ta có: ai = x.100
xi −1

∆i x
gi = = i −1
∆ i x.100 100
Suy ra:
xi −1

Chỉ tiêu này không tính cho tốc độ tăng (giảm) định gốc vì kết quả luôn luôn bằng

x1
100



1.2.6. Dự đoán biến động của dãy số thời gian




-12-
Dự báo là xác định mức độ có thể xảy ra trong tương lai của hiện tượng. Biết được
tương lai của hiện tượng sẽ giúp các nhà quản trị chủ động cũng như có những
quyết định đúng trong kinh doanh.

Có nhiều phương thức dự đoán khác nhau . Tuy vậy nội dung cơ bản của dự đoán
thống kê là dựa trên các giá trị đã biết (x1, x2, …, xn). Dự đoán dựa vào dãy số thời gian
để phân tích các yếu tố ảnh hưởng đến sự biến động của hiện tượng.

1.2.6.1. Dự đoán bằng hàm xu hướng

Tùy theo tính chất của hiện tượng nghiên cứu hoặc kết hợp với kinh nghiêm
ta có thể xây dựng hoặc chọn một hàm số phù hợp biểu hiện sự biến động của hiện
tượng qua thời gian.

 Hàm xu hướng dạng đa thức (bậc n ≤ 4)

Giả sử đường dữ liệu được biểu diễn dưới dạng:

yi = α 0 + α1ti + α 2ti2 + α 3ti3 + α 4ti4 + ε i

Mô hình hàm xu hướng: yt = b0 + b1t + b2t + b3t + b4t
2 3 4




Tính tổng bình phương các sai số:
2
n n n

∑e ∑(y − y ∑  y − (b + b1ti + b t + b t + b t ) 
2 2
)= 2 3 4
SS = =  
i i ti i 0 2i 3i 4i
i =1 i =1 i =1



Xác định các biến bk với (k = 0,1,2,3,4) sao cho hàm SS đạt cực tiểu:

Lấy đạo hàm của hàm SS theo các biến b k với (k = 0,1,2,3,4), ta được

∂SS n
= −2∑ ( yi − b0 − b1ti − b2ti2 − b3ti3 − b4ti4 )tik ; (k = 0,1,2,3,4)
∂bk i =1



yt = b0 + b1t + b2t 2 + b3t 3 + b4t 4
Hàm xu hướng dạng bậc 4:

Trong đó:

a0 − c1b2 − c2b4
b0 = ;
n

a1 − c2b3
b1 = ;
c1

-13-
(na2 − a0c1 ) − (nc3 − c1c2 )b4
b2 = ;
nc2 − c12

a3c1 − a1c2
b3 = 2;
c1c3 − c2

(na4 − a0c2 )(nc2 − c12 ) − (nc3 − c1c2 )(na2 − a0 c1 )
b4 =
(nc4 − c2 )(nc2 − c12 ) − (nc3 − c1c2 ) 2
2




 n
ck = ∑ ti2 k

 i =1
Với  (k = 0,1,2,3,4)
n
a =
∑ yitik
 k
 i =1



yt = b0 + b1t + b2t 2 + b3t 3
Hàm xu hướng dạng bậc 3:

a0 − c1b2
b0 =
Trong đó: ;
n

a1 − c2b3
b1 = ;
c1

na2 − a0c1
b2 = ;
nc2 − c12

a3c1 − a1c2
b3 =
c1c3 − c2
2




yt = b0 + b1t + b2t 2
Hàm xu hướng dạng bậc 2:

a0 − c1b2
b0 =
Trong đó: ;
n

a1
b1 = ;
c1

na2 − a0c1
b2 =
nc2 − c12

yt = b0 + b1t
Hàm xu hướng dạng bậc 1:
n

∑y i
Trong đó: ;
a
b0 = 0 = i =1

n n
-14-
n

∑yt ii
a
b1 = 1 = i =1
n
c1
∑t 2
i
i =1



 Hàm xu hướng dạng hàm mũ

Giả sử đường dữ liệu được biểu diễn dưới dạng:

yi = α 0 eα1ti + ε i

Mô hình hàm xu hướng: yt = b0 e
bt 1




Lấy log hai vế hàm mữ ta được: lnyt = lnb0 +b1t

yt = b0 eb1t
Áp dụng hàm xu hướng dạng đường thẳng ta được:

n

∑ ln y
n

∑ ln yi
i
Trong đó: lnb0 = hay i =1
i =1
b0 = e n
n
n

∑ t ln y i i
b1 = i =1
n

∑t 2
i
i =1



 Hàm xu hướng dạng hàm Logarithmic

Giả xử đường dữ liệu được biểu diễn dưới dạng:

yi = α 0 + α1 ln ti + ε i

Mô hình hàm xu hướng: yt = b0 + b1 ln t

Áp dụng hàm xu hướng dạng đường thẳng ta được:

yt = b0 + b1 ln t

n

∑ ln t i
Trong đó:
b0 = y − b1 i =1

n




-15-
n n n
n∑ yi ln ti − ∑ yi ∑ ln ti
b1 = i =1 i =1 i =1
2
 
n n
n∑ ( ln ti ) −  ∑ ln ti ÷
2

 i =1 
i =1



 Hàm xu hướng dạng hàm luỹ thừa

Giả xử đường dữ liệu được biểu diênc dưới dạng:

yi = α 0tiα1 + ε1

1
Mô hình hàm xu hướng: yt = b0t b

Áp dụng hàm xu hướng dạng đường thẳng ta được:
1
yt = b0t b

 
n n

∑ ln yi ∑ ln ti ÷
n n 
∑ ln y ∑ ln t  ÷
i =1 i =1
−b1
 ÷
i i
Trong đó: lnb0 = hay n n
 ÷
− b1
i =1 i =1
 ÷
b0 = e  
n n



n n n
n∑ ln yi ln ti − ∑ ln yi ∑ ln ti
b1 = i =1 i =1 i =1
2
 
n n
n∑ ( ln ti ) −  ∑ ln ti ÷
2

 i =1 
i =1



1.2.6.2. Mô hình dự đoán lượng tăng (giảm) tuyệt đối trung bình

Phương pháp này thường được sử dụng khi hiện tượng biến động với một l ượng
tuyệt đối hay tương đối đều nghĩa là các lượng tăng (giảm) tuyệt đối từng kì xấp xỉ
nhau.

Công thức dự đơán:

ˆ
y n + L = y n + ∆ .L

ˆ
y n + L : Giá trị dự đoán ở thời điểm n + L

y n : Giá trị thực tế tại thời điểm n




-16-
n

∑∆
∆ : Lượng tăng (giảm) tuyệt đối trung bình;
i
∆= i =2

n −1

L: Tầm xa dự đoán

1.2.6.3. Dự đoán dựa vào tốc độ phát triển trung bình.

Phương pháp này thường được sử dụng khi hiện tượng bất động với một nhịp độ
tương đối ổn định, nghĩa là tốc độ phát triển từng kỳ xấp xỉ nhau.

Công thức dự đoán:

y n + L = y n. .( t )
L
ˆ

ˆ
y n + L : Giá trị dự đoán ở thời điểm n + L

y n: : Giá trị thực tế tại thời điểm n

xn
t : Tốc độ phát triển trung bình; t = n −1
x1

L: Tầm xa dự đoán




-17-
CHƯƠNG 2

PHÂN TÍCH TÌNH HÌNH BIẾN ĐỘNG NĂNG SUẤT
LÚA VIỆT NAM GIAI ĐOẠN 1991 – 2005


2.1. Một số yếu tố ảnh hưởng đến sự biến động năng suất việt Nam giai đoạn
1991 – 2005.

Bảng 2.1. Sự biến động năng suất lúa bình quân cả năm giai đoạn 1991-2005

Sản lượng Phân Sản lượng lúa Năng suất lúa bình
Năm
(nghìn tấn) quân (tạ/ha)
Bón (kg/ha)

1991 65.3 19621.9 3.113204
1992 70.5 21590.4 3.33427
1993 78.2 22836.5 3.481492
1994 89.9 23528.2 3.565635
1995 97.3 24963.7 3.689798
1996 102.2 26396.7 3.768911
1997 110.6 27523.9 3.876769
1998 118.9 29145.5 3.958534
1999 125.5 31393.8 4.101834
2000 127.8 32529.5 4.243181
2001 135.1 32108.4 4.285291
2002 140.8 34447.2 4.590328
2003 146.2 34568.8 4.638738
2004 153.3 36148.9 4.855264

-18-
2005 162.7 35832.9 4.88906
Tổng 1724.3 432636.3 60.392309

(Bảng số liệu được thu thập từ trang wed tổng cục thống kê www.gso.gov.vn)

Theo kết quả từ SPSS, ta có:
Des criptive Statistics

Mean Std. Deviatio n N
Na ng suat 4.026 2 .55 244 15
Luongphanbo n 114.95 3 30 .47 91 15
Sa nluong 28 842.420 5 490.2 858 15



Correlations

Luongph
Nangsuat anbon Sanluong
Pearson Correlation Nangsuat 1.000 .987 .986
Luongphanbon .987 1.000 .990
Sanluong .986 .990 1.000
Sig. (1-tailed) Nangsuat . .000 .000
Luongphanbon .000 . .000
Sanluong .000 .000 .
N Nangsuat 15 15 15
Luongphanbon 15 15 15
Sanluong 15 15 15


Hệ số tương quan giữa Y (năng suất) và chính nó là 1. Như vậy Năng suất lúa với
chính nó có mối quan hệ rất chặt chẽ.

Hệ số tương quan giữa X1 (lượng phân bón) và Y là 0.987. Giá trị này cho thấy rằng
giữa năng suất và sản lượng phân bón có mối quan hệ chặt chẽ với nhau.

Hệ số tương quan giữa X2 (sản lượng lúa) và Y là 0.986. Giá trị này cũng cho ta
thấy rằng sản lượng lúa cả năm có mối quan hệ chặt chẽ với năng suất lúa trung
bình cả năm.




-19-
b
V ariables Ente re d /Re moved

Va ria bles Variab les
Mod e l Ente red Re mo ved Me thod
1 Sa nluong,
Luongp ha . Ente r
a
nb o n
a. All re q ueste d va riab le s e nte red .
b. D ep ende nt Variab le : Na ng sua t



b
Model Summary

Adjusted Std. Error of
Model R R Square R Square the Estimate
.989 a
1 .979 .975 .08711
a. Predictors: (Constant), Sanluong, Luongphanbon
b. D ependent Variable: Nangsuat

Ta thấy hệ số tương quan r = 0.989: tương quan giữa hai biến là trên mức trung bình
(r = 98.9%), nghĩa là năng suất lúa bình quân sẽ tăng khi tăng l ượng phân bón và s ản
lượng lúa thu hoạch được.

Hệ số xác định R2: Chỉ riêng tăng lượng phân bón và sản lượng lúa thu hoạch sẽ làm
thay đổi 97.9% năng suất lúa (R2 = 0.979).


b
ANOVA

Sum of
Model Squares df Mean Square F Sig.
.000 a
1 Regression 4.182 2 2.091 275.556
Residual .091 12 .008
Total 4.273 14
a. Predictors: (Constant), Sanluong, Luongphanbon
b. D ependent Variable: Nangsuat

Kiểm định ở mức ý nghĩa 5% thì mô hình hồi qui rất có ý nghĩa vì Sig.F= 0.00001 rất
nhỏ so với 5%, tức là sản lượng lúa thu hoạch và lượng phân bón ảnh h ưởng đ ến
năng suất lúa trung bình.




-20-
a
C oefficients

Unstandardized Standardized 95% Confidence
Coefficients Coefficients Interval for B
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound
1 (Constant) 1.615 .263 6.144 .000 1.042 2.188
Luongphan
.010 .005 .571 1.943 .076 -.001 .022
bon
Sanluong 4.236 .000 .421 1.433 .177 .000 .000
a. Dependent Variable: Nangsuat


Phương trình hồi qui: y = 4.236X1 +0.1X2 +1.615

Y: Năng suất lúa bình quân cả năm (tấn/ha)

X1: Sản lượng phân bón (kg/ha)

X2: Sản lượng lúa cả năm (nghìn tấn)

Ý nghĩa của phương trình:

- Khi cố định X1 ( sản lượng phân bón) sản lượng lúa thu hoạch tăng 0.1 nghìn tấn.
Ta thấy sản lượng ảnh hưởng đến năng suất lúa bình quân cả năm

- Khi cố định X2 (sản lượng lúa) lượng phân bón tăng 4.236 kg/ha. Ta thấy lượng
phân bón ảnh hưởng tới năng suất lúa bình quân cả năm.

- Ngoài 2 nhân tố trên các nhân tố khác làm tăng năng suất lúa bình quân cả năm là
1.615 tấn/ha.

- Sai số chuẩn của lượng phân bón là 0.005

- Sai số chuẩn của sản lượng lúa là 0.0001

2.2. Phân tích dãy số thời gian và dự báo

2.2.1. Phân tích dãy số thời gian và bự báo năng suất lúa bình quân cả năm

Để xác định hàm số mô tả một cách gần đúng nhất biến động của hiện tượng được
thể hiện bằng đồ thị về hàm số xu hướng. Quan sát đồ thị ở dưới đồ thị có dạng
hàm xu hướng bậc 2, ta thấy năng suất lúa có hiện tượng tăng dần.
Hàm xu hướng bậc 2 có dạng:
yt = b2t2 + b1t + b0


-21-
yt: Giá trị dự đoán của hiện tượng ở thời điểm t

b0 , b1 , b2 : tham số

t : thời gian

Năng suất lúa (tấn/ha)
Năm
1991 3.113204
1992 3.33427
1993 3.481492
1994 3.565635
1995 3.689798
1996 3.768911
1997 3.876769
1998 3.958534
1999 4.101834
2000 4.243181
2001 4.285291
2002 4.590328
2003 4.638738
2004 4.855264
2005 4.88906


t2 t3 t4 yt2
Năm y t yt
1991 3.1132 -7 -21.79 49 -343 2401 152.55
1992 3.3343 -6 -20.01 36 -216 1296 120.03
1993 3.4815 -5 -17.41 25 -125 625 87.037
1994 3.5656 -4 -14.26 16 -64 256 57.05
1995 3.6898 -3 -11.07 9 -27 81 33.208
1996 3.7689 -2 -7.538 4 -8 16 15.076
1997 3.8768 -1 -3.877 1 -1 1 3.8768
1998 3.9585 0 0 0 0 0 0
1999 4.1018 1 4.1018 1 1 1 4.1018
2000 4.2432 2 8.4864 4 8 16 16.973
2001 4.2853 3 12.856 9 27 81 38.568
2002 4.5903 4 18.361 16 64 256 73.445
2003 4.6387 5 23.194 25 125 625 115.97
2004 4.8553 6 29.132 36 216 1296 174.79
2005 4.8891 7 34.223 49 343 2401 239.56
Tổng 60.392 0 34.402 280 0 9352 1132.2
Từ số liệu bảng trên ta có n = 15 và các tham số b0, b1, b2 được tính như sau:

-22-
b0 = 4.0039
b1 = 0.1229
b2 = 0.0012

Vậy hàm mô tả biến động năng suất lúa bình quân cả năm là:

y= 4.0039 + 0.1229t + 0.0012t2

NĂNG SUẤT LÚA
2
y = 0.0012t + 0.1229t + 4.0039
6

5
y(nă ng s uất tấn/ha )




4
Năng suất lúa (tấn/ha)
3
Poly. (Năng suất lúa
2
(tấn/ha))
1

0
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7
t



Hàm số này có thể dự đoán được năng suất của những năm sắp tới. Ta có thể dự
đoán được năng suất bình quân vào những năm 2011, 2012, 2013, 2014, 2015 như sau:

Xu hướng phát Dựa vào tốc độ Dựa vào lượng tăng
Năm
triển phát triển trung giảm tuyệt đối
trung bình
bình yn + L = yn . ( t )
y= b0 + b1t + b2t2 L


yn + L = yn + ∆.L

2011 5.8044 5.9407 5.6501
2012 5.9597 6.1367 5.7770
2013 6.1174 6.3392 5.9038
2014 6.2775 6.5484 6.0307
2015 6.7645 6.7645 6.1575
2.2.2. Phân tích dãy số thời gian và dự báo cho lượng phân bón


-23-
Để xác định hàm số mô tả một cách gần đúng nhất bi ến động của hi ện t ượng đ ược th ể
hiện bằng đồ thị về hàm số xu hướng. Quan sát đồ thị ở dưới ta thấy đồ thị có dạng hàm
xu hướng bậc 4 .
Hàm xu hướng bậc 3 có dạng:
yt = b3t3 + b2t2 + b1t + b0

Với yt: giá trị dự đoán của lượng phân bón

b0, b1, b2, b3, b4: hàm số

t: thời gian

Lượng phân bón (kg/ha)
Năm
1991 65.3
1992 70.5
1993 78.2
1994 89.9
1995 97.3
1996 102.2
1997 110.6
1998 118.9
1999 125.5
2000 127.8
2001 135.1
2002 140.8
2003 146.2
2004 153.3
2005 162.7




-24-
Năm t2 yt2 t3 t4 t5 t6 t7 t8 yt3 yt4
t y yt
1991 -7 65.3 -457.1 49 3199.7 -343 2401 -16807 117649 -823543 5764801 -22398 156785
1992 -6 67.5 -405 36 2430 -216 1296 -7776 46656 -279936 1679616 -14580 87480
1993 -5 78.2 -391 25 1955 -125 625 -3125 15625 -78125 390625 -9775 48875
1994 -4 93.4 -373.6 16 1494.4 -64 256 -1024 4096 -16384 65536 -5978 23910.4
1995 -3 131.2 -393.6 9 1180.8 -27 81 -243 729 -2187 6561 -3542 10627.2
1996 -2 128.5 -257 4 514 -8 16 -32 64 -128 256 -1028 2056
1997 -1 122.6 -122.6 1 122.6 -1 1 -1 1 -1 1 -122.6 122.6
1998 0 145.2 0 0 0 0 0 0 0 0 0 0 0
1999 1 131.7 131.7 1 131.7 1 1 1 1 1 1 131.7 131.7
2000 2 133.6 267.2 4 534.4 8 16 32 64 128 256 1068.8 2137.6
2001 3 135.1 405.3 9 1215.9 27 81 243 729 2187 6561 3647.7 10943.1
2002 4 140.8 563.2 16 2252.8 64 256 1024 4096 16384 65536 9011.2 36044.8
2003 5 146.2 731 25 3655 125 625 3125 15625 78125 390625 18275 91375
2004 6 153.3 919.8 36 5518.8 216 1296 7776 46656 279936 1679616 33113 198677
2005 7 162.7 1138.9 49 7972.3 343 2401 16807 117649 823543 5764801 55806 390643
Tổng 0 1835.3 1757.2 280 32177 0 9352 0 369640 0 15814792 63630 1059808
Từ số liệu trên ta có n = 15 và các tham số b0, b1, b2, b3, b4 được tính như sau:

b0 = 118.11
b1 = 6.3404
b2 = −0.3374
b3 = 0.0135
b4 = 0.005


Vậy ta được phương trình: yt = 118.11 + 6.3404t – 0.3374t2 + 0.0135t3+ 0.005t4




-25-
SẢN LƯỢNG PHÂN BÓN
y = 0.005t + 0.0135t3 - 0.3374t2 + 6.3404t + 118.11
4

180
160
y (lượ ng phâ n bón kg/ha )

140
120 Lượ ng phân bón (kg/ha)
100
80 Poly. (Lượ ng phân bón
(kg/ha))
60
40
20
0
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7
t



Hàm số trên ta có thể dự đoán được lượng phân bón sử dụng trong những năm sắp tới.
Ta có thể dự đoán được năm 2011, 2012, 2013, 2014, 2015 như sau:

Xu hướng phát triển Dựa vào tốc độ phát Dựa vào lượng tăng
Năm
triển trung bình giảm tuyệt đối
y = b0 + b1t + b11t
2

() trung bình
L
yn + L = y n . t
yn + L = yn + ∆.L

2011 315.9791 241.4468 204.4429
2012 369.8692 257.8632 211.4000
2013 435.9885 275.4023 218.3571
2014 516.1580 294.1291 225.3143
2015 612.3187 314.1249 232.2714
2.2.3. Phân tích dãy số thời gian và dự báo cho sản lượng

Để xác định hàm số mô tả một cách gần đúng nhất biến động của hiện tượng đ ược th ể hi ện
bằng đồ thị về hàm số xu hướng. Quan sát đồ thị ở dưới ta thấy đồ thị có dạng đường thẳng
và ta cũng sử dụng hàm số dạng đường thẳng để mô tả.

Ta có công thức hàm số đường thẳng có dạng : yt = b0 +b1t

Với yt : giá trị dự đoán của sản lượng

-26-
b0, b1: hàm số

t: thời gian

Năng suất lúa (tấn/ha)
Năm
1991 3.113204
1992 3.33427
1993 3.481492
1994 3.565635
1995 3.689798
1996 3.768911
1997 3.876769
1998 3.958534
1999 4.101834
2000 4.243181
2001 4.285291
2002 4.590328
2003 4.638738
2004 4.855264
2005 4.88906




t2
Năm y t yt
1991 19621.9 -7 -137353.3 49
1992 21590.4 -6 -129542.4 36
1993 22836.5 -5 -114182.5 25
1994 23528.2 -4 -94112.8 16
1995 24963.7 -3 -74891.1 9
1996 26396.7 -2 -52793.4 4
1997 27523.9 -1 -27523.9 1
1998 29145.5 0 0 0
1999 31393.8 1 31393.8 1
2000 32529.5 2 65059 4
2001 32108.4 3 96325.2 9
2002 34447.2 4 137788.8 16
2003 34568.8 5 172844 25
2004 36148.9 6 216893.4 36
2005 35832.9 7 250830.3 49
-27-
Tổng 432636.3 0 340735.1 280


Từ số liệu trên ta có n =15 và các tham số b0 và b1 được tính như sau:

432636.3
b0 = = 28842
15

340735.1
b1 = = 1216.9
280

Vậy ta được phương trình: y = 1216.9t +28842

Ý nghĩa:

b0 =28842.42 (nghìn tấn): sản lượng ở năm 1998

b1 = 1216.911 (nghìn tấn): sản lượng tăng lên hàng năm

Chart Title

40000
35000
30000
y = 1216.9t + 28842 Series1
25000
Linear (Series1)
20000
15000
10000
5000
0
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7



Hàm số trên có thể dự đoán được sản lượng ở những năm sắp tới. Ta có thể dự đoán
được

năm 2011, 2012, 2013, 2014, 2015 như sau:



Xu hướng phát triển Dựa vào tốc độ phát Dựa vào lượng tăng
Năm

-28-
triển trung bình giảm tuyệt đối
yi=b0 +b1t
trung bình
()
L
yn + L = y n . t
yn + L = yn + ∆.L

2011 44661.7 46503.94 42780.47
2012 45878.6 48567.91 43938.4
2013 47095.5 50724.34 45096.33
2014 48312.4 52975.36 46254.26
2015 49529.3 55329.58 47412.19




-29-
Đề thi vào lớp 10 môn Toán |  Đáp án đề thi tốt nghiệp |  Đề thi Đại học |  Đề thi thử đại học môn Hóa |  Mẫu đơn xin việc |  Bài tiểu luận mẫu |  Ôn thi cao học 2014 |  Nghiên cứu khoa học |  Lập kế hoạch kinh doanh |  Bảng cân đối kế toán |  Đề thi chứng chỉ Tin học |  Tư tưởng Hồ Chí Minh |  Đề thi chứng chỉ Tiếng anh
Theo dõi chúng tôi
Đồng bộ tài khoản