Bài tập và hướng dẫn phân tích số liệu bằng SPSS

Chia sẻ: Bui Thanh Trung | Ngày: | Loại File: DOC | Số trang:52

Thêm vào BST

Báo xấu

1.779
lượt xem 318
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tính suất sinh lợi của thị trường (Rm) và hãy vẽ trên cùng đồ thị hai biến VNI và Rm? Lưu ý, Rm có thể được tính như sau Rm = (VNIt – VNIt-1)/VNIt-1 hoặc Rm = ln(VNIt/VNIt-1). Trong Eviews, hàm ln được sử dụng là log.thu thập số liệu theo tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây: - lưu số liệu vừa thu thập về dưới dạng tập tin Excel với tên : data1.xls...

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Bài tập và hướng dẫn phân tích số liệu bằng SPSS

Bài tập và hướng dẫn phân tích số liệu bằng SPSS 1
BAI TAP CA NHAN I.ASSIGNMENT 1: Bài 1: Anh/Chị hãy vào trang web: http://www.fpts.com.vn/user/stock/thong-ke/ thu thập số liệu theo tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây: - lưu số liệu vừa thu thập về dưới dạng tập tin Excel với tên : data1.xls Chuyển hai chuỗi dữ liệu đó qua tập tin Eviews với tên biến là VNI và SSI? a. click chuột phải vào data1.xls chọn Open with/Eviews - trong hộp thoại Spreadsheet Read: - bước 1: chọn Custom range sau đó điều chỉnh tới cột cần đặt t ên /Next - bước 2: lần lượt nhập tên cho 2 cột là VNI và SSI /Finish - 2
b. Vẽ hai biến VNI và SSI trên cùng một đồ thị? - từ cửa sổ tập tin, chọn Quick/Graph - trong Series list, nhập tên biến vào (biến nào ở trục hoành gõ trước): vni ssi /OK - nếu chọn Type: là Line & Symbol và Axis/Scale : #2 SSI là Right /OK thì ta có đồ thị sau 300 250 200 1,200 150 1,000 100 800 50 0 600 400 200 2 4 6 8 10 12 14 16 18 20 22 24 VNI SSI c. Tính suất sinh lợi của thị trường (Rm) và hãy vẽ trên cùng đồ thị hai biến VNI và Rm? Lưu ý, Rm có thể được tính như sau Rm = (VNIt – VNIt-1)/VNIt-1 hoặc Rm = ln(VNIt/VNIt-1). Trong Eviews, hàm ln được sử dụng là log. - trên màn hình lệnh của Eviews nhập : genr rm=log(vni/vni(-1)) - sau đó, tương tự câu b, chọn Quick/Graph, rồi nhập tên biến : vni rm /OK - chọn Type: Line & Symbol và Axis/Scale cho Rm là Right /OK, ta có đồ thị sau 3
.4 .3 .2 .1 .0 1,200 -.1 1,000 -.2 800 600 400 200 2 4 6 8 10 12 14 16 18 20 22 24 VNI RM d. Vẽ đồ thị tần suất kèm thống kê mô tả biến SSI? Giải thích ý nghĩa của các thống kê trong bảng kết quả? - chọn Quick/Series Statistics/Histogram and Stats - trong Series name, nhập tên biến : ssi /OK , có đồ thị sau 10 Series : SSI Sam ple 1 24 O bs ervations 24 8 Mean 103.6250 Median 61.75000 6 Maximum 265.0000 Minimum 21.40000 Std. Dev. 80.80398 4 Skewness 0.645914 Kurtosis 2.037646 2 Jarque-Bera 2.594943 Probability 0.273222 0 0 25 50 75 100 125 150 175 200 225 250 275 4
Ý nghĩa của các thống kê trong bảng kết quả : Series : biến Sample : mẫu quan sát Observations : số quan sát Mean : giá trị trung bình Median: trung vị Maximum: giá trị lớn nhất Minimum: giá trị nhỏ nhất Std.Dev. : độ lệch chuẩn Skewness : độ nghiêng Kurtosis : độ nhọn Jarque-Bera: thống kê JB, càng nhỏ thì biến càng “dễ” có phân phối chuẩn Probability: xác suất tương ứng của JB, càng nhỏ thì khả năng bác bỏ giả thiết Ho càng cao (giả thiết Ho mặc định là : biến có pp chuẩn), ở đây có kết quả 0.273222 (rất nhỏ) tức l à biến không có phân phối chuẩn e. Vẽ trên cùng đồ thị VNI và VNI trễ một giai đoạn? - chọn Quick/Graph - nhập tên biến : vni vni(-1) /OK , có đồ thị sau 1,100 1,000 900 800 700 600 500 400 300 200 2 4 6 8 10 12 14 16 18 20 22 24 VNI V NI(-1) 5
f. Vẽ giản đồ tự tương quan của VNI với độ trễ được chọn là 5. Anh/Chị hãy giải thích và nêu ý nghĩa các hệ số AC và PAC? - chọn Quick/Series Statistics/Correlogram - trong Series name, nhập tên biến : vni(-5) /OK - trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau Ý nghĩa các hệ số AC và PAC : AC (Autocorrelation Coefficient): hệ số tự tương quan  xác định chuỗi thời gian dừng hay không : - là “dừng” khi AC đầu tiên 0 nhưng các AC tiếp theo =0 một cách có ý nghĩa thống kê - là “không dừng” khi một số AC 0 một cách có ý nghĩa thống kê PAC (Partial Autocorrelation Coefficient): hệ số tự tương quan riêng xác định mô hình ARIMA thích hợp g. Vẽ giản đồ tự tương quan sai phân bậc nhất của VNI với độ trễ được chọn là 5. Anh/Chị có nhận xét gì giữa kết quả câu (g) và câu (f)? - chọn Quick/Series Statistics/Correlogram - trong Series name, nhập tên biến : d(vni,5) /OK - trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau 6
Nhận xét kết quả câu g và f : - ở câu g là chuỗi thời gian không dừng vì: các hệ số AC đầu rất cao và về sau giảm dần =0 theo độ trễ - ở câu f là chuỗi thời gian dừng vì: các hệ số AC đầu 0 nhưng tiếp theo sẽ =0 Bài 2: Sử dụng tập tin hhexpe06.dta (tập tin Stata), chuyển sang tập tin Eviews và thực hiện các yêu cầu sau đây: - click chuột phải vào hhexpe06.dta chọn Open with/Eviews - xuất hiện hộp thoại Table read specification: chọn các biến cần thiết theo y êu cầu của đề bài để chuyển sang Eviews (mặc định là chọn hết) /OK 7
a. Vẽ đồ thị tần suất các biến chi tiêu lúa gạo, chi tiêu phi lương thực, chi tiêu giáo dục, chi tiêu sức khỏe, chi tiêu nước uống, chi tiêu điện sinh hoạt và qui mô hộ gia đình Việt Nam năm 2006? - mở cùng lúc các biến riceexp, nonfdx_1, educex_1, hlthex_1, waterexp, elecexp, hhsize bằng cách : giữ phím Ctrl khi chọn biến rồi click chuột phải chọn Open/as Group để mở biến từ cửa sổ vừa mở, chọn View/Graph… - trong Graph Options : chọn Type là Distribution /OK, ta có đồ thị tần suất như sau - 8
R I C EEXP N O N F D X_1 ED U C EX_ 1 5,000 6,000 7,000 6,000 5,000 4,000 5,000 4,000 Frequenc y Frequenc y Frequenc y 3,000 4,000 3,000 3,000 2,000 2,000 2,000 1,000 1,000 1,000 0 0 0 0 4,000 8,000 12,000 16,000 0 40,000 80,000 120,000 160,000 0 10,000 20,000 30,000 40,000 H L TH EX_ 1 W ATER EXP EL EC EXP 10,000 10,000 8,000 8,000 8,000 6,000 Frequenc y Frequenc y Frequenc y 6,000 6,000 4,000 4,000 4,000 2,000 2,000 2,000 0 0 0 0 40,000 80,000 120,000 0 5,000 10,000 15,000 20,000 0 10,000 20,000 30,000 40,000 H H SI Z E 3,000 2,500 2,000 Frequ enc y 1,500 1,000 500 0 0 2 4 6 8 10 12 14 16 18 b. Lập bảng giá trị trung bình của các biến trên theo 5 nhóm thu nhập khác nhau? Anh/Chị rút ra được nhận xét gì? - double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau - chọn View/Descriptive Statistics & Tests/Stats by Classification… - xuất hiện hộp thoại Statistics By Classification : - trong Statistics : click chọn Mean - trong Series/Group for classify : nhập biến thu nhập (ko tìm thấy???) /OK, ta có kết quả như sau Nhận xét: c. Lập bảng giá trị trung bình của các biến trên theo 8 vùng địa lý khác nhau ở Việt Nam? Anh/Chị rút ra được nhận xét gì? - double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau - chọn View/Descriptive Statistics & Tests/Stats by Classification… - xuất hiện hộp thoại Statistics By Classification : - trong Statistics : click chọn Mean - trong Series/Group for classify : nhập Reg8 (biến vùng địa lý) /OK, ta có các kết quả như sau 9
Nhận xét ở Việt Nam năm 2006: - Chi tiêu lúa gạo trung bình: cao nhất ở vùng 7 (1970.702), thấp nhất ở vùng 1 (663.8771) - Chi tiêu phi lương thực trung bình: cao nhất ở vùng 7 (9690.978), thấp nhất ở vùng 3 (3196.382) - Chi tiêu giáo dục trung bình: cao nhất ở vùng 7 (2003.274), thấp nhất ở vùng 3 (675.6620) - Chi tiêu sức khỏe trung bình: cao nhất ở vùng 7 (1986.412), thấp nhất ở vùng 3 (658.8135) - Chi tiêu nước uống trung bình: cao nhất ở vùng 7 (236.9655), thấp nhất ở vùng 3 (40.83916) - Chi tiêu điện sinh hoạt trung bình: cao nhất ở vùng 7 (1182.311), thấp nhất ở vùng 3 (250.9021) - Qui mô hộ gia đình trung bình: cao nhất ở vùng 3 (6 người/hộ), thấp nhất ở vùng 1 (4 người/hộ) Vùng 7: có chi tiêu TB cao nhất => vùng đồng bằng Nam Bộ (mức sống cao) Vùng 3: mức chi tiêu TB thấp + qui mô hộ gia đình TB cao nhất => vùng duyên hải miền Trung (nghèo, đông con) Vùng 1: chi tiêu TB lúa gạo và qui mô hộ gia đình TB thấp nhất => vùng núi caoTây Nguyên (thiếu lương thực, dân tộc thiểu số) 10
d. Lập bảng so sánh giá trị trung bình các biến trên theo hai khu vực thành thị và nông thôn? Anh/Chị rút ra được nhận xét gì? - double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau - chọn View/Descriptive Statistics & Tests/Stats by Classification… - xuất hiện hộp thoại Statistics By Classification : - trong Statistics : click chọn Mean - trong Series/Group for classify : nhập Urban06 (biến khu vực) /OK, ta có kết quả như sau Nhận xét : - trung bình về chi tiêu lúa gạo, chi tiêu phi lương thực, chi tiêu giáo dục, chi tiêu sức khỏe, chi tiêu nước uống, chi tiêu điện sinh hoạt : ở thành thị (URBAN) đều cao hơn nông thôn - trung bình về qui mô hộ gia đình Việt Nam năm 2006: ở nông thôn (4.301) cao hơn thành thị (4.104)  thành thị có mức sống cao hơn nông thôn  nông thôn chưa thực hiện kế hoạch hóa gia đình bằng thành thị e. Anh/Chị hãy kiểm định xem có sự khác biệt về chi tiêu giáo dục trung bình giữa thành thị và nông thôn hay không? - mở biến educex_1 - chọn View/Descriptive Statistics & Tests/Equality Tests by Classification… - xuất hiện hộp thoại Tests By Classification: - trong Series/Group for classify: nhập URBAN06 - trong Test equality of: chọn Mean ( kiểm định trung bình ) /OK, có kết quả sau 11
 Giá trị ANOVA F-test có Probability thấp bằng 0.0000 (mà p-value càng thấp thì khả năng bác bỏ H0 càng cao) do đó ta bác bỏ H0 (H0: trung bình chi tiêu giáo dục ở thành thị và nông thôn là bằng nhau)  có sự khác biệt về chi tiêu giáo dục trung bình giữa thành thị và nông thôn Bài 3: Anh/Chị hãy chọn và phân tích một vấn đề về năng lực cạnh tranh cấp tỉnh ở Việt Nam m à mình quan tâm. Để hỗ trợ bài tập này, Anh/Chị nên sử dụng tập tin PCI.xls của các năm 2006, 2007, và 2008 (và các báo cáo tổng hợp liên quan). 12
Bài 4: Cho X ~ N(8,25)  μ=8 , σ=5 Yêu cầu: Vẽ phát họa đồ thị cho từng trường hợp. a. Tính P(X > 8.6) 8. 6  8 với Z ~ N( 0,1 ) Có Z = = 0.12 5  P( X > 8.6 ) = P( Z > 0.12 ) = 1 - P( Z < 0.12 ) = 1 - 0.5478 = 0.4522 Tính P( Z < 0.12 ) bằng Excel, sử dụng hàm : = NORMDIST ( 0.12 , 0 , 1 , true ) = 0.547758426 b. Tính P(8 < X < 8.6) Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :  P( 8 < X < 8.6 ) = 50% - P( X > 8.6 ) = 0.5 - 0.4522 = 0.0478 c. Tính P(X < 7.4) Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :  P( X < 7.4 ) = P( X > 8.6 ) = 0.4522 d. Tính P(7.4 < X < 8.6) Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :  P( 7.4 < X < 8.6 ) = 2 * P( 8 < X < 8.6 ) = 2 * 0.0478 = 0.0956 Bài 5: 13
Từ một mẫu 25 quan sát, người ta tính được giá trị trung bình là 172.5 và độ lệch chuẩn là 15.4. Giả sử có giả thiết sau đây:  N = 25 , μ = 172.5 , σ = 15.4 H0:  = 168 H1:   168 Yêu cầu: Vẽ phát họa đồ thị cho từng trường hợp. a. Xác định loại thống kê kiểm định phù hợp?  Loại KIỂM ĐỊNH TRUNG BÌNH ( với X có phân phối chuẩn ) : - là thống kê t : với giả thiết H0, có phân phối t với số bậc tự do là N-1 ( nếu không biết σ của X ) - là thống kê z : với giả thiết H0, có phân phối chuẩn hóa ( nếu biết σ của X ) Ở đây do ta đã biết σ = 15.4 , nên thuộc loại thống kê z có phân phối chuẩn hóa b. Kiểm định giả thiết trên với mức ý nghĩa lần lượt như sau:  = 1%, 5%, 10%, và 15%? Anh/Chị cho biết khi  thay đổi thì quyết định chấp nhận hay bác bỏ giả thiết H0 sẽ thay đổi như thế nào? - Mở biến - Chọn View/ Descriptive Statistics & Tests/ Simple Hypothesis Tests - Xuất hiện hộp thoại Series Distribution Tests : - Trong Test value: nhập vào “MEAN” là 168 - Trong Mean test assumption: nhập vào “ENTER s.d. if known” là 24 ( do = N-1 = 25 -1) /OK  Khi  càng tăng thì càng “dễ” chấp nhận giả thiết Ho II. ASSIGNMENT 2: Bài 2: Từ dữ liệu của Assignment 1 1. Ước lượng mô hình CAPM có dạng: log(SSI/SSI(-1)) c log(VNI/VNI(-1)) : Chọn 2 biến ssi và vni  Quick/Estimation Equation  nhập log(SSI/SSI(-1)) c log(VNI/VNI(-1)) Dependent Variable: LOG(SSI/SSI(-1)) Method: Least Squares Date: 04/11/09 Time: 12:29 Sample (adjusted): 2 22 Included observations: 21 after adjustments Variable Coefficient Std. Error t-Statistic Prob. C -0.010652 0.006188 -1.721389 0.1014 LOG(VNI/VNI(-1)) 0.878655 0.404512 2.172137 0.0427 14
R-squared 0.198927 Mean dependent var -0.012801 Adjusted R-squared 0.156765 S.D. dependent var 0.030483 S.E. of regression 0.027992 Akaike info criterion -4.223392 Sum squared resid 0.014888 Schwarz criterion -4.123913 Log likelihood 46.34561 Hannan-Quinn criter. -4.201802 F-statistic 4.718180 Durbin-Watson stat 1.670739 Prob(F-statistic) 0.042709 2. Vẽ trên cùng đồ thị các biến suất sinh lợi thực tế, suất sinh lợi ước lượng và phần dư của mô hình trên : Tiếp tục trong cửa sổ Estimation Equation trên, chọn View/Actual, Fitted, Residual/ Actual, Fitted, Residual Graph. .06 .04 .02 .00 -.02 .06 -.04 .04 -.06 .02 .00 -.02 -.04 -.06 2 4 6 8 10 12 14 16 18 20 22 Res idual A c t ual F i t t ed 3. Xây dựng khoảng tin cậy 95% cho B2: Trên dòng lệnh, nhập: scalar b2_cd=c(2)-@qtdist(0.975,20)*@stderrs(2)  giá trị chặn dưới. scalar b2_ct=c(2)-@qtdist(0.975,20)*@stderrs(2  giá trị chặn trên. So sánh b2 với 2 giá trị trên, nếu b2_cd
Bài 3: III. ASSIGNMENT3: Bài 1: a) Nhấp đúp vào biến y -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “X2” ở Series/ group for classify -> ta có bảng sau: Descriptive Statistics for Y Categorized by values of X2 Date: 05/20/09 Time: 22:31 Sample: 1 30 Included observations: 30 X2 Mean Std. Dev. Obs. [0, 20) 42.57143 9.501880 7 [20, 40) 56.28571 10.45170 7 [40, 60) 56.33333 5.316641 6 [60, 80) 59.00000 5.049752 5 [80, 100) 66.80000 8.642916 5 All 55.30000 11.16692 30 Nhận xét: doanh số bán hàng tăng theo điểm về kỹ năng bán hàng. b) Mô hình dự báo: chưa học! c) Hồi quy: Ở màn hình lệnh: ls y c x2 x3 x4 x5 x6, ta có bảng sau: Dependent Variable: Y Method: Least Squares Date: 05/20/09 Time: 22:39 Sample: 1 30 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. C -90.62915 17.84109 -5.079799 0.0000 X2 0.202915 0.028221 7.190144 0.0000 X3 6.154295 0.921462 6.678840 0.0000 X4 0.112319 0.503071 0.223266 0.8252 X5 -0.013198 0.785811 -0.016796 0.9867 X6 -0.586477 1.762090 -0.332830 0.7422 R-squared 0.895539 Mean dependent var 55.30000 Adjusted R-squared 0.873776 S.D. dependent var 11.16692 S.E. of regression 3.967380 Akaike info criterion 5.770945 Sum squared resid 377.7625 Schwarz criterion 6.051185 Log likelihood -80.56418 Hannan-Quinn criter. 5.860596 F-statistic 41.15014 Durbin-Watson stat 1.895046 Prob(F-statistic) 0.000000 Các hệ số b4,b5,b6 không có ý nghĩa thống kê. Hệ số b2, b3 có ý nghĩa thống kê và có dấu đúng với kỳ vọng. 16
Vì: - b2 >0 : điểm về kỹ năng bán hàng càng cao thì doanh số bán hàng cũng tăng theo. - b3 >0 : nhân viên càng hăng hái trong công việc thì doanh số bán hàng càng tăng. d) Ước lượng mô hình dự báo: chưa học! Bài 2: a) Chọn các biến y,b2,b3,b4,b5,b6,b7,b8 -> nhấp chuột phải, Open/as group -> vào view/ Descriptive stats/common sample X2 X3 X4 X5 X6 X7 X8 Y Mean 22.36898 172.5951 31.74383 1723.560 255.0064 39.85211 47.95525 2266.132 Median 9.025000 26.62300 17.88800 342.2877 33.20000 20.55600 24.61515 472.0812 Maximum 207.7000 4186.930 348.1426 45999.01 4485.195 423.2698 785.0718 60334.51 Minimum 0.442000 1.066000 0.429000 2.398000 1.011100 0.267000 0.750000 6.803000 Std. Dev. 30.58231 438.6564 39.58890 4488.490 573.7774 55.84726 86.40719 5799.043 Skewness 2.638699 5.133975 3.290828 5.794956 3.859590 3.502381 5.336685 5.944537 Kurtosis 11.73742 36.88443 20.81731 45.86810 21.32879 19.38885 38.88011 48.11877 Jarque-Bera 1146.128 13789.44 3968.524 21692.00 4350.833 3494.271 15414.33 23947.59 Probability 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 Sum 5905.412 45565.10 8380.372 455020.0 67321.69 10520.96 12660.19 598258.9 Sum Sq. Dev. 245978.0 50606322 412194.9 5.30E+09 86584999 820275.1 1963611. 8.84E+09 Observations 264 264 264 264 264 264 264 264 b) Chọn các biến y,b2,b3,b4,b5,b6,b7,b8 -> View/ Group statistics/ Correlations X2 X3 X4 X5 X6 X7 X8 Y X2 1.000000 0.573045 0.260664 0.581816 0.606916 0.208016 0.210286 0.602849 X3 0.573045 1.000000 0.122734 0.905251 0.627895 0.023502 0.262369 0.932005 X4 0.260664 0.122734 1.000000 0.083741 0.123914 0.456082 0.079123 0.105862 X5 0.581816 0.905251 0.083741 1.000000 0.624455 0.020705 0.196601 0.987976 X6 0.606916 0.627895 0.123914 0.624455 1.000000 0.043653 0.253913 0.618947 X7 0.208016 0.023502 0.456082 0.020705 0.043653 1.000000 0.013897 0.052856 X8 0.210286 0.262369 0.079123 0.196601 0.253913 0.013897 1.000000 0.215714 Y 0.602849 0.932005 0.105862 0.987976 0.618947 0.052856 0.215714 1.000000 Nhận xét: các hệ số tương quan giữa các biến thấp -> không có đa cộng tuyến (chưa chắc lắm!) c) Các biến giải thích có hệ số tương quan với y lớn hơn 0.7 là X3, X5  Vẽ đồ thị phân tán giữa X3 với Y: - Quick/Graph/ nhập x3 y/ (Type) chọn Scatter/ (Fit lines) chọn Regression line (- > tạo đường hồi quy) 17
70,000 60,000 50,000 40,000 Y 30,000 20,000 10,000 0 0 1,000 2,000 3,000 4,000 5,000 X3 Nhận xét : đây là mô hình phù hợp vì các giá trị phân tán quanh đường hồi quy.  Vẽ đồ thị phân tán giữa X5 với Y: (t ương tự với X3) 70,000 60,000 50,000 40,000 Y 30,000 20,000 10,000 0 0 10,000 20,000 30,000 40,000 50,000 X5 Nhận xét : đây là mô hình phù hợp vì các giá trị phân tán quanh đường hồ i quy. 18
d) Nhấp đúp vào biến y -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “X3 X2” ở Series/ group for classify -> ta có bảng sau: Descriptive Statistics for Y Categorized by values of X3 and X2 Date: 05/21/09 Time: 00:22 Sample: 1 266 Included observations: 265 Mean Std. Dev. X2 Obs. [0, 50) [50, 100) [100, 150) [150, 200) [200, 250) All [0, 1000) 1032.968 2383.734 6163.426 11049.50 NA 1246.357 1575.080 2188.790 5477.006 NA NA 1917.238 227 21 3 1 0 252 [1000, 2000) 14698.14 16465.63 29127.00 9254.117 34736.00 17979.29 6131.026 9293.366 NA NA NA 9514.644 4 4 1 1 1 11 X3 [2000, 3000) NA 28085.00 NA NA NA 28085.00 NA NA NA NA NA NA 0 1 0 0 0 1 [4000, 5000) NA NA 60334.51 NA NA 60334.51 NA NA NA NA NA NA 0 0 1 0 0 1 All 1269.594 5538.690 21590.36 10151.81 34736.00 2265.183 2473.740 7873.685 24144.75 1269.527 NA 5788.070 231 26 5 2 1 265 Nhận xét: - Cùng khoảng giá trị của X3 (chi tiêu vốn hữu hình) thì giá trị trung bình của Y tăng theo X2 (tổng số lao động) - Cùng khoảng giá trị của X2 (tổng số lao động) thì giá trị trung bình của Y tăng theo X3 (chi tiêu vốn lao động). d) Chiến lược chọn mô hình: từ tổng quát (general) đến giản đơn (simple): B1: hồi quy Y theo tất cả các biến: Dependent Variable: Y Method: Least Squares Date: 05/21/09 Time: 00:32 Sample: 1 266 Included observations: 264 Variable Coefficient Std. Error t-Statistic Prob. C -155.3579 64.48403 -2.409246 0.0167 X2 6.102751 1.971835 3.094961 0.0022 X3 2.771448 0.241587 11.47185 0.0000 X4 -0.620636 1.258533 -0.493142 0.6223 X5 1.032169 0.023537 43.85339 0.0000 19
X6 -0.334775 0.106573 -3.141288 0.0019 X7 2.907275 0.882797 3.293253 0.0011 X8 0.351253 0.527540 0.665832 0.5061 R-squared 0.985744 Mean dependent var 2266.132 Adjusted R-squared 0.985355 S.D. dependent var 5799.043 S.E. of regression 701.7919 Akaike info criterion 15.97499 Sum squared resid 1.26E+08 Schwarz criterion 16.08335 Log likelihood -2100.698 Hannan-Quinn criter. 16.01853 F-statistic 2528.820 Durbin-Watson stat 1.955415 Prob(F-statistic) 0.000000 -> các hệ số b4,b8 không có ý nghĩa thống kê. B2: Kiểm định Wald test (kiểm định giả thiết đồng thời: có phải cả 2 biến này X4,X8 đồng thời không ảnh hưởng lên doanh số hay không) -> từ kết quả hồi quy-> view/Coefficient Tests/ Wald-Coefficient Restrictions/ gõ C(4)=C(8)=0 (Ho), ta có bảng: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 0.334088 (2, 256) 0.7163 Chi-square 0.668175 2 0.7160 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(4) -0.620636 1.258533 C(8) 0.351253 0.527540 Restrictions are linear in coefficients. -> p-value của F-statistic lớn (0.7163)-> chấp nhận Ho (cả x4,x8 đồng thời không ảnh hưởng đến Y) B3: hồi quy Y theo x2,x3,x5,x6,x7 Dependent Variable: Y Method: Least Squares Date: 05/21/09 Time: 00:45 Sample: 1 266 Included observations: 265 Variable Coefficient Std. Error t-Statistic Prob. C -149.1473 59.07772 -2.524596 0.0122 X2 6.068047 1.947646 3.115580 0.0020 X3 2.783337 0.237022 11.74293 0.0000 X5 1.030859 0.023233 44.37082 0.0000 X6 -0.320920 0.105859 -3.031572 0.0027 X7 2.718822 0.800158 3.397854 0.0008 20