(Business Statistics)
Chương 7. Phân tích hồi quy và dự báo trong kinh doanh
1
CHƯƠNG VII. PHÂN TÍCH HỒI QUY VÀ DỰ BÁO TRONG KINH DOANH
VII.1. Tương quan giữa hai biến
VII.2. Mô hình hồi quy tuyến tính đơn
VII.3. Mô hình hồi quy bội (đọc thêm)
VII.4. Phân tích dự báo theo chuỗi thời
gian (đọc thêm)
2
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN
1. Khái niệm
2. Hệ số tương quan
(Correlation Coefficient)
3. Bảng tương quan mẫu
4. Hệ số tương quan mẫu
3
Xem mục 1 phần III.3 trang 69, GT BÀI GIẢNG THỐNG KÊ KINH DOANH
HỆ SỐ TƯƠNG QUAN PEARSON (Pearson’s Correlation Coefficient, ký hiệu r)
4
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 1. Khái niệm Hệ số tương quan Pearson (Correlation coefficient, r) là chỉ số thống kê đo lường mức độ tương quan tuyến tính giữa hai biến (định lượng). Về nguyên tắc, tương quan Pearson sẽ tìm ra một đường thẳng phù hợp nhất với mối quan hệ tuyến tính (hàm số nối kết) của 2 biến. Có 3 dạng quan hệ tuyến tính sau:
Không có quan hệ tuyến tính
Tuyến tính thuận (QH đồng biến)
Tuyến tính nghịch (QH nghịch biến)
5
II.4. TƯƠNG QUAN GIỮA HAI BIẾN 1. Khái niệm (tt)
Tuần
Ví dụ 7.1: Để xem xét mối quan hệ giữa Số lần quảng cáo (X) được chiếu trên TV và Doanh số bán hàng (Y, ngàn sản phẩm) của một mặt hàng, người ta thu thập dữ liệu thực tế trong 10 tuần và cho kết quả ở bảng bên phải.
Hãy thể hiện mối quan hệ giữa hai biến này.
Số lần QC 2 5 1 3 4 1 5 3 4 2
Doanh số (ngàn sp) 50 57 41 54 54 38 63 48 59 46
1 2 3 4 5 6 7 8 9 10
6
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 1. Khái niệm (tt): Ví dụ 7.1: (tt) Biểu diễn dữ liệu trên đồ thị phân tán (Scatter, Excel), ta thấy rằng Số lần quảng cáo trên TV và Doanh số bán hàng của mặt hàng này có mối quan hệ tuyến tính thuận. Điều đó có nghĩa là việc xuất hiện càng nhiều lần quảng cáo thì doanh số bán hàng càng cao.
65
60
55
50
45
40
) p s n à g n ( ố s h n a o D
35
0
1
2
4
5
6
3 Số lần quảng cáo
7
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 2. Tương quan giữa các đại lượng ngẫu nhiên
Giả sử hai đại lượng ngẫu nhiên X và Y là hai dấu hiệu trên cùng một tổng thể. Để đo mức độ tương quan giữa X và Y người ta xét số:
được gọi là hệ số tương quan giữa X và Y.
Với mọi đại lượng ngẫu nhiên, ta có -1 RXY 1. Trường hợp RXY = 0 : X và Y không tương quan
tuyến tính với nhau (hiếm xảy ra).
Trường hợp RXY = 1 : X và Y có tương quan
tuyến tính (chặt chẽ).
8
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 3. Bảng tương quan mẫu
Cho một mẫu kích thước n. Quan sát đồng thời X và Y ta được bảng sau đây, được gọi là bảng tương quan mẫu.
Y
...
y1
y2
yh
ni
... ...
...
... ...
n1 n2 ... nk Σ = n
X x1 x2 ... xk mj
n11 n21 ... nk1 m1
n12 n22 ... nk2 m2
n1h n2h ... nkh mk
9
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 3. Bảng tương quan mẫu (tt)
Bảng tương quan mẫu ở trên cũng còn được
trình bày tương đương như sau
x
y
nij
x1 x2 ... xk
y1 y2 ... yh
n11 n12 ... nkh
10
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 3. Bảng tương quan mẫu (tt)
Trong bảng này
𝒊𝒋
là các giá trị của X; là các giá trị của Y
𝒋
(cid:3038)
(cid:3035)
là số lần đồng thời là số lần X nhận giá trị xi là số lần Y nhận giá trị yj
(cid:3035)
Ta có
(cid:3036)
(cid:3037)
(cid:3036)(cid:3037)
(cid:3036)(cid:3037)
(cid:3036)
(cid:3036)(cid:3037)
(cid:3037)
(cid:3036)(cid:2880)(cid:2869)
(cid:3037)(cid:2880)(cid:2869)
(cid:3036),(cid:3037)
(cid:3036)(cid:2880)(cid:2869)
(cid:3037)(cid:2880)(cid:2869)
(cid:3038)
(cid:3038)
(cid:2870)
Các đặc trưng của mẫu:
(cid:3036)
(cid:3036)
(cid:3036)
(cid:2870) (cid:3036)
(cid:3036)(cid:2880)(cid:2869) (cid:3035)
(cid:3036)(cid:2880)(cid:2869) (cid:3035)
(cid:2870)
(cid:2870)
(cid:2870)
(cid:3037)
(cid:3036)
(cid:3037)
(cid:2870) (cid:3041)
(cid:3025)
(cid:2870) (cid:3037)
(cid:3037)(cid:2880)(cid:2869)
(cid:2870)
(cid:2870)
(cid:3036) (cid:3037) (cid:3036)(cid:3037)
(cid:2870) (cid:3041)
(cid:3026)
(cid:3038) (cid:3036)(cid:2880)(cid:2869)
(cid:3035) (cid:3037)(cid:2880)(cid:2869)
11
(cid:3037)(cid:2880)(cid:2869) (cid:2869) (cid:3041)
X nhận giá trị xi, Y nhận giá trị yj. (cid:3038)
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN
4. Hệ số tương quan mẫu
Ta gọi
là hệ số tương quan mẫu giữa X và Y.
Như vậy, hệ số tương quan mẫu là một ước
lượng của hệ số tương quan RXY.
Ta cũng có -1 rXY 1
12
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 4. Hệ số tương quan mẫu (tt)
Ví dụ 7.2: Cho lượng nước mưa ở hai địa phương quan sát được tại 10 thời điểm khác nhau, ta có số liệu sau đây:
8
Xi 87 47 74 86 38 15 41 Yi
79 75 86 56 84 72 47 17 43 19 88 78
Hãy dùng máy tính cầm tay tính:
Excel: (Xem lại các hàm ở slide 81 hoặc Thống kê mô tả ở slide 80)
1. Trung bình cộng của X = AVERAGE (vùng dữ liệu của X) = 55;
2. Trung bình cộng của Y = AVERAGE (vùng dữ liệu của Y) = 59;
3. Độ lệch chuẩn được hiệu chỉnh của X = STDEVA (data Xi) = 29,212;
4. Độ lệch chuẩn được hiệu chỉnh của Y = STDEVA (data Y) = 26,870;
5. Hệ số tương quan rxy = PEARSON (vùng dữ liệu của X và Y) = 0,967.
13
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 4. Hệ số tương quan mẫu (tt): Ví dụ 2.38 (tt): Casio
1. Shift Mode 4:Stat 1 (Mở/On hoặc Tắt/Off tần số Frequency?)
2. Mode 3:Stat 2:A+BX (dạng quan hệ tuyến tính giữa 2 biến)
3. Nhập dữ liệu (ấn dấu bằng ‘=‘ để hoàn tất) lần lượt vào 2 cột X, Y.
4. Bấm AC
5. Gọi kết quả:
- Shift 1:Stat 4:Var
14
- Shift 1:Stat 5:Reg
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 4. Hệ số tương quan mẫu (tt):
Ví dụ 2.39:
Cho bảng số liệu sau đây. Hãy tính các đặc trưng và hệ số tương quan mẫu của bộ số liệu đó. [Làm như slide trên]
Y
10 15 20 25 30 35
X
4 7 1
10 2 15
3 26 35 3
4 10 8 18 6
15
Giải. Ta lập một bảng mới để tính toán các tổng cần thiết cho việc tính các đặc trưng mẫu như sau:
5 2 5 6 1
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 4. Hệ số tương quan mẫu (tt):
Ví dụ 2.39: (tt)
Y
10 15 20 25 30 35 ni X
4 7 1 11
10 2 15 25
3 26 35 3 64
10 2 8 5 18 6 6 1 42 14
53 48 27 7 156 4 17 4 5 mj
16
Ta tính được các đặc trưng của mẫu:
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 4. Hệ số tương quan mẫu (tt):
Ví dụ 2.39: (tt)
Các đặc trưng của mẫu: (tiếp theo)
Vậy hệ số tương quan mẫu là:
Ví dụ 7.3. Đo chiều cao X và khối lượng Y của 7 học
sinh, ta được kết quả cho ở bảng sau.
1,5 1,65 1,55 1,68 1,7 68 60 45
63
65
X (m) 1,45 1,6 55 Y (kg) 50
17
Hãy tính:
VII.1. TƯƠNG QUAN GIỮA HAI BIẾN 4. Hệ số tương quan mẫu (tt):
Y
2
3
4
5
6
7
3
5 2 8
10 12 4
15 16
X 20 22 24 26 28
5 7 8
5
Tìm hệ số tương quan
18
Ví dụ 7.4: Để nghiên cứu sự phát triển của một loại cây, người ta tiến hành đo chiều cao Y (m) và đường kính X (cm) của một số cây. Kết quả được ghi ở bảng sau đây.
VII.2. Mô hình hồi quy tuyến tính đơn Trong kinh doanh, các quyết định quản trị thường dựa trên việc xem xét mối quan hệ giữa hai hoặc nhiều yếu tố kinh tế (biến thống kê).
Ví dụ: Sau khi xem xét mối quan hệ giữa chi tiêu quảng cáo và doanh thu bán hàng, trưởng bộ phận Marketing cố gắng dự đoán doanh thu cho một mức chi tiêu quảng cáo nhất định.
Đôi khi, một người quản lý sẽ dựa vào trực giác để đánh giá
19
Tuy nhiên, nếu dữ liệu của các biến có thể thu được thì một là phân tích hồi quy phương pháp trong thống kê gọi (regression analysis) có thể được sử dụng để phát triển một phương trình cho thấy các mối liên hệ giữa các biến có liên quan.
hai biến có liên quan như thế nào một cách định tính.
VII.2. Mô hình hồi quy tuyến tính đơn
Ví dụ về chuỗi nhà hàng thức ăn nhanh Armand’s Pizza
1. Mô hình
Mô hình hồi quy tuyến tính đơn tổng thể có dạng:
Parlours.
(1)
Trong đó:
biến phụ thuộc (dependent variable);
biến độc lập (independent variable);
các tham số tổng thể của mô hình;
: sai số ngẫu nhiên của mô hình (các yếu tố khác
20
ngoài tác động đến ).
2. Tương quan giữa hai biến (nhắc lại)
Hệ số tương quan Pearson (Correlation coefficient, r) là chỉ số thống kê đo lường mức độ tương quan tuyến tính giữa hai biến (định lượng). Về nguyên tắc, tương quan Pearson sẽ tìm ra một đường thẳng phù hợp nhất với mối quan hệ tuyến tính (hàm số nối kết) của 2 biến. Có 3 dạng quan hệ tuyến tính sau:
Không có quan hệ tuyến tính
Tuyến tính thuận (QH đồng biến)
Tuyến tính nghịch (QH nghịch biến)
21
VII.2. Mô hình hồi quy tuyến tính đơn
Các trường hợp của hệ số góc
:
22
VII.2. Mô hình hồi quy tuyến tính đơn
23
VII.2. Mô hình hồi quy tuyến tính đơn
Phương trình hồi quy ước lượng tuyến tính mẫu có dạng:
Ý nghĩa của b0 và b1:
thì giá trị trung bình của
tăng 1 (đơn vị) thì giá trị trung bình của
(đơn vị); - Nếu - Trong điều kiện các yếu tố khác không thay đổi, nếu tăng (hoặc giảm)
(đơn vị).
24
Trong đó:
3. Nghiên cứu tình huống (Case study) Trong tình huống Armand’s Pizza Parlours, tổng thể là gì? ), ta có: Thu thập dữ liệu ngẫu nhiên của 10 nhà hàng (
25
Biểu đồ phân tán (Scatter) của tập dữ liệu mẫu
26
Đồ thị của Phương trình Hồi quy ước lượng
27
Phương trình hồi quy ước lượng tuyến tính mẫu:
Biểu đồ phân tán (Scatter) của tập dữ liệu mẫu
215
195
) a
l
175
155
135
115
95
75
ô đ n à g n ( ý u q o e h t ố s h n a o D
55
35
0
5
10
20
25
30
15 Số lượng sinh viên (ngàn SV)
28
Phương trình hồi quy ước lượng tuyến tính mẫu:
Cách bấm máy tính Casio chạy hồi quy
1. Shift Mode 4:Stat 1 (Mở/On hoặc Tắt/Off tần số Frequency?)
2. Mode 3:Stat 2:A+BX (dạng quan hệ tuyến tính giữa 2 biến)
3. Nhập dữ liệu (ấn dấu bằng ‘=‘ để hoàn tất) lần lượt vào 2 cột X, Y.
4. Bấm AC
5. Gọi kết quả:
- Shift 1:Stat 4:Var
29
1: A = b0 2: B = b1 3: r = rXY - Shift 1:Stat 5:Reg
Ý NGHĨA KINH TẾ:
Phương trình hồi quy ước lượng tuyến tính mẫu:
: doanh thu trung bình của nhà hàng khi không
Hệ số góc của phương trình hồi quy ước
phục vụ sinh viên ( ) là 60 nghìn USD mỗi quý;
lượng (
> 0) là dương, ngụ ý rằng khi số lượng
sinh viên tăng lên thì doanh thu trung bình mỗi quý sẽ
tăng lên. Điều đó có nghĩa là, trong điều kiện các yếu tố
khác không thay đổi, nếu mỗi ngôi trường tuyển sinh
tăng thêm được 1000 SV thì doanh thu trung bình
của cửa hàng sẽ tăng lên 5000 đô la (lưu ý đổi đơn
vị). Hay nói cách khác, mỗi sinh viên học tại trường sẽ
30
mang lại 5 đô la doanh thu cho của hàng.
SUMMARY OUTPUT
Regression Statistics
Hệ số tương quan
Multiple R
Hệ số xác định, đo độ phù hợp của MHHQ
R Square Adjusted R Square Standard Error Observations
0.950122955 = rXY 0.90273363 = R2 0.890575334 13.82931669 10
ANOVA
Pvalue(F) để kiểm định mô hình
Giá trị F để kiểm định mô hình F
MS
df
SS
Significance F 0.00002549
14200 74.24836601 191.25
Regression Residual Total
1 8 9
14200 1530 15730
Standard Error
t Stat
P-value
Lower 95%
Upper 95%
Intercept
9.22603481 6.503335532 0.000187444
38.72472558 81.27527442
X
0.580265238 8.616749156
2.54887E-05
3.661905962 6.338094038
Coefficients 60 5
Tung độ gốc của đường hồi quy mẫu
Hệ số góc của đường hồi quy mẫu
Giá trị Cận dưới và Cận trên của Khoảng tin cậy 95% của các hệ số hồi quy.
31
Kết quả Phân tích Hồi quy cho tình huống Armand’s Pizza Parlours
4. Hệ số xác định R2 của mô hình Trong ví dụ trên, ta sử dụng đường thẳng liên tục để mô
Câu hỏi đặt ra: Liệu mô hình đường thẳng có thực sự mô tả tốt cho dữ liệu thực tế không? Làm thế nào để đánh giá được khả năng dự báo tốt doanh thu khi chọn mô hình dạng đường thẳng đó?
Để trả lời cho câu hỏi này ta sử dụng hệ số xác định
phỏng cho dữ liệu điểm rời rạc.
32
(coefficient of determination) của mô hình. Đối với mô hình hồi quy tuyến tính đơn (1), hệ số xác định của mô hình (1) được cho bởi công thức:
R2 = R Square trong bảng kết quả hồi quy (Regression)
Nhận xét:
. Hệ số xác định được sử dụng để đánh giá % mức độ phù hợp của mô hình đang mô tả mối quan hệ giữa biến phụ thuộc
với biến độc lập .
Mô hình hoàn toàn không phù hợp;
Mô hình phù hợp hoàn hảo;
33
Mô hình càng phù hợp với dữ liệu thực tế.
4. Hệ số xác định R2 của mô hình (tt)
Ví dụ 7.5. Hãy tính hệ số xác định của mô hình trong tình huống Armand’s Pizza Parlours và giải thích ý nghĩa của nó.
Với dữ liệu trên ta tính được:
Như vậy, nếu sử dụng mô hình này để dự báo doanh thu thì mức độ chính xác lên đến 90,27%.
Ngoài ra, điều này cũng có nghĩa: sự thay đổi số lượng SV giải thích 90,27% sự thay đổi của doanh thu, còn lại 9,73% là do yếu tố khác tác động.
34
5. Bài toán kiểm định
A. Kiểm định sự phù hợp của mô hình (F test)
Thêm một câu hỏi khác được đặt ra: Một mô
hình có hệ số xác định
bao nhiêu % thì
chấp nhận được?
Để trả lời cho câu hỏi này, ta thực hiện bài toán
kiểm định sự phù hợp của mô hình với mức
ý nghĩa
cho trước.
35
A. Kiểm định sự phù hợp của mô hình (F test)
Bước 1: Lập giả thuyết
BÀI TOÁN KIỂM ĐỊNH F CÓ 4 BƯỚC:
(tức R2 = 0)
Bước 2: Tính giá trị
(tức R2 0) H0: Mô hình (1) không phù hợp; H1: Mô hình (1) phù hợp
Bước 3: Tra bảng phân phối Fisher tìm
(với k là số lượng tham số beta)
Bước 4: Quy tắc ra quyết định
ứng với dòng cột .
- Nếu
36
- Nếu Bác bỏ H0 Chấp nhận H0
A. Kiểm định sự phù hợp của mô hình (F test)
Ví dụ 7.6. Với dữ liệu đang có trong tình huống Armand’s Pizza Parlours, mô hình (1) có thực sự tốt để dự báo doanh thu theo quý của nhà hàng thức ăn nhanh không với mức ý nghĩa 5%. Giải: Lập giả thuyết
Giá trị kiểm định
Tra bảng Fisher dòng 8, cột 1,
Vì
37
H0: Mô hình (1) không phù hợp; H1: Mô hình (1) phù hợp
nên bác bỏ giả thuyết H0. Như vậy, mô hình (1) là phù hợp để dự báo doanh thu hàng quý của nhà hàng với mức ý nghĩa 5%.
B. Kiểm định sự tác động của (từng) biến độc
lập X đến Y (t test)
Đối với biến phụ thuộc Y có thể có nhiều hơn 1 biến độc lập X tác động đến nó. Do đó, chúng ta cần phải kiểm tra xem mỗi biến X có thực sự tác động đến Y trong mô hình hay không.
Đó là bài toán kiểm định t test. Để tính giá trị kiểm định t ta cần 2 công thức sau để đo lường mức độ tập trung của dữ liệu quanh đường hồi quy:
với (1)
Trong đó,
38
: giá trị quan sát thứ i; : giá trị của đại lượng Y tương ứng với : độ lệch chuẩn của sai số ngẫu nhiên.
Độ lệch chuẩn của hệ số hồi quy
39
B. Kiểm định sự tác động của (từng) biến độc lập X đến Y (t test)
Bài toán kiểm định t có 4 bước như sau: Bước 1: Lập giả thuyết
;
.
Bước 3: Tra bảng phân phối Student tìm
H0: X không tác động đến Y H1: X tác động đến Y Bước 2: Tính giá trị kiểm định
𝜶 𝟐
với k
Bước 4: Quy tắc ra quyết định
Nếu
là số lượng tham số beta có trong mô hình.
𝜶 𝟐
Nếu
thì bác bỏ H0;
40
𝜶 𝟐
thì chấp nhận H0.
Ví dụ 7.7. Với Với dữ liệu đã cho trong tình huống Armand’s Pizza Parlours, với mức ý nghĩa 1%, số lượng sinh viên (X) của trường ở gần nhà hàng có thực sự tác động đến doanh thu (Y) của nhà hàng không?
Giải: Ta có pt hồi quy mẫu:
2
6
8
8
12
16
20
20
22
26
𝒊
58
105
88
118
117
137
157
169
149
202
𝒊
70
90
100
100
120
140
160
160
170
190
(cid:3036)
Từ đây ta được bảng giá trị sau:
41
Suy ra
Ví dụ 7.7. Giải (tiếp theo):
Lập giả thuyết
H0: Số lượng SV không tác động đến doanh thu;
Tính giá trị kiểm định
Tra bảng student
𝜶 𝟐
Vì
H1: Số lượng SV có tác động đến doanh thu.
𝜶 𝟐
nên ta bác bỏ H0.
42
Vậy số lượng SV có ảnh hưởng đến doanh thu ở mức ý nghĩa 1%.
6. Khoảng ước lượng của beta 1 (1)
Bên cạnh việc giải thích ý nghĩa các hệ số hồi quy như đã biết, nhà quản trị muốn biết sự thay đổi của biến phụ thuộc Y tối đa và tối thiểu là bao nhiêu khi X tăng 1 đơn vị. Đây chính là bài toán ước lượng khoảng giá trị của beta với công thức như sau:
Ý nghĩa: Trong điều kiện các yếu tố khác không thay đổi, nếu X tăng 1 (đơn vị) thì giá trị trung bình của Y tăng (hoặc giảm) trong khoảng (đơn vị).
43
4. Khoảng ước lượng của beta 1 (1)
Ví dụ 7.8. Nếu lượng sinh viên của trường ở gần nhà
hàng tăng thêm 1000 SV thì doanh thu của cửa hàng
đạt được tối đa là bao nhiêu với mức ý nghĩa 1%.
Giải:
Ta có:
.
Như vậy, nếu quy mô của trường thay đổi từ 10.000 SV
lên 11.000 SV thì doanh thu tăng tối đa là:
(nghìn đô la)
44
7. Xây dựng khoảng dự báo giá trị kì vọng của Y tại X0 với mức ý nghĩa cho trước Sau khi kiểm định xác nhận việc lựa chọn mô hình hồi quy tuyến tính để mô tả mối quan hệ của các biến trong tập dữ liệu là phù hợp. Nhà quản trị sẽ sử dụng mô hình này để ước tính giá trị tối đa và tối thiểu của biến phụ thuộc Y khi cho trước giá trị của X.
Công thức:
.
45
Với và
7. Xây dựng khoảng dự báo giá trị kì vọng
của Y tại X0 với mức ý nghĩa cho trước
Ví dụ 7.8. Quản lý của chuỗi nhà hàng Armand’s
Pizza Parlours muốn dự đoán kì vọng doanh thu
(hay doanh thu trung bình) tối đa và tối thiểu của
một cửa hàng khi biết được số lượng sinh viên
của ngôi trường gần đó là 10.000 SV với mức ý
nghĩa 5%.
46
Ví dụ 7.8. Giải:
Từ phương trình hồi quy ta có:
Và
𝟐
𝟐
𝟎
𝟐
𝟐 𝑿
Theo công thức, ta được
.
.
47
Vậy khoảng ước lượng doanh thu của cửa hàng khi quy mô của trường 10.000 SV:
8. p-value và bài toán kiểm định t và F
Ngoài việc áp dụng 4 bước của bài toán kiểm định như
đã đề cập, để thực hiện bài toán kiểm định nhanh hơn
mà không cần phải tra các bảng phụ lục thống kê, chúng
ta có thể sử dụng giá trị p–value. Giá trị này được
p–value là mức ý nghĩa nhỏ nhất để bác bỏ giả
các phần mềm thống kê tính toán sẵn.
Nếu
thuyết H0. Tức là:
Nếu
thì ta bác bỏ H0;
48
thì ta chấp nhận H0;
6. Computer Solution
CASE STUDY: Một công ty bất động sản muốn xem xét mối quan hệ giữa giá bán của một ngôi nhà và diện tích của nó để dự doán mức giá bán hợp lý cho mỗi ngôi nhà. Một mẫu ngẫu nhiên gồm 10 ngôi nhà được chọn. Biến phụ thuộc (Y): giá nhà (đơn vị 1000 đôla). Biến độc lập (X): diện tích (square feet). Hãy ước lượng mô hình hồi quy đơn cho dữ liệu mẫu này và kiểm định sự phù hợp của mô hình tìm được?
245
312
279
308
199
219
405
324
319
255
House Price in $1000s
Square feet
(Y)
49
(X) 1400 1600 1700 1875 1100 1550 2350 2450 1425 1700
CỦNG CỐ KIẾN THỨC CHƯƠNG 7
1. Hệ số tương quan
2. Phương trình hồi quy tuyến tính mẫu
3. Hệ số xác định mô hình:
4. Kiểm định F – test và t – test
5. Ước lượng hệ số
6. Ước lượng giá trị
tại
7. Computer Solution
50