intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Đề tài: Phân tích sản lượng và doanh thu ngành bưu chính viễn thông (giai đoạn 1995-2011).

Chia sẻ: Trần Quang Hợp | Ngày: | Loại File: DOCX | Số trang:36

157
lượt xem
32
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phân tích hồi quy là tìm quan hệ phụ thuộc của một biến, được gọi là biết phụ thuộc vào một hoặc nhiều biến khác, được gọi là biến độc lập nhằm mục đích ước lượng hoặc tiên đoán giá trị kỳ vọng của biến phụ thuộc khi biết trước giá trị của biến độc lập.Tính đ n gi n c a hàm tuy n tính,b t kỳ lúc nào tác đ ng c a X ơ ả ủ ế ấ ộ ủ phụ thuộc vào các giá trị của X hoặc Y, thì dạng hàm tuyến tính không thể là dạng hàm phù hợp....

Chủ đề:
Lưu

Nội dung Text: Đề tài: Phân tích sản lượng và doanh thu ngành bưu chính viễn thông (giai đoạn 1995-2011).

  1. LỜI NÓI ĐẦU
  2. MỤC LỤC Họ và tên Công việc STT Ghi chú LƯƠNG ĐÌNH LƯU 1 PHẠM DUY KHÁNH 2 TRẦN QUANG HỢP 3
  3. I- PHÂN TÍCH BÀI TOÁN – BẢNG SỐ LIỆU II- Phân tích bài toán 1. Tên đề tài: Phân tích sản lượng và doanh thu ngành bưu chính viễn thông (giai đoạn 1995-2011). 2. Tập dữ liệu mà nhóm 13 nghiên cứu gồm 8 yếu tố với 17 bộ dữ liệu Chúng ta nhận thấy biến phụ thuộc là biến Doanh thu (t ỉ đ ồng). Ở d ữ li ệu này có 6 biến độc lập là: Bưu phẩm đi có cước, B ưu ki ện đi có c ước, Th ư và điện chuyển tiền, Báo chí phát hành, Điện báo có cước, Điện thoại đường dài. Các biến độc lập này dùng để dự đoán được biến phụ thuộc (Doanh thu). 3. Phương pháp phân tích bài toán Với tập dữ liệu này ta sẽ dùng các phương pháp là h ồi quy tuy ến tính, phân tích đặc trưng và phân tích chuỗi thời gian. Bảng số liệu III-
  4. Thư và điện Bưu phẩm đi Điện báo có Bưu kiện đi có cước chuyển Báo chí phát hành có cước (triệu cước (triệu Năm tiền (triệu tờ) (nghìn cái) tiếng) cái) (nghìn bức) 1995 116.5 162.0 1365.0 223.5 49. 1996 121.4 230.0 1744.0 238.9 45. 1997 124.9 307.0 2408.0 214.8 42.0 1998 135.0 433.0 3358.0 225.6 35.0 1999 146.7 962.0 3751.0 239.6 28. 2000 155.0 709.0 4412.0 299.1 0.0 2001 148.1 1080.0 4883.0 286.8 0.0 2002 162.3 789.9 5625.0 285.4 0.0 2003 181.6 1080.3 6518.0 307.9 0.0 2004 191.8 1378.0 7174.0 411.6 0.0 2005 238.3 1344.0 7723.0 432.3 0.0 2006 166.7 1297.0 8139.0 404.2 0.0 2007 234.7 1559.0 8786.0 396.5 0.0 2008 251.3 1753.0 8664.0 430.7 0.0 2009 332.9 2402.1 8183.0 577.2 0.0 2010 342.1 2526.0 9010.0 553.3 0.0 2011 393.4 2778.6 9460.0 608.6 0.0
  5. PHÂN TÍCH ĐẶC TRƯNG IV- V- Phân tích đặc trưng Chúng ta tiến hành phân tích từng thành phần số liệu riêng của từng sản lượng của từng yếu tốvà rút ra các bảng kết quả sau: Chú thích  Count: Số lượng mẫu. o Average: Số trung bình. o Median: Trung vị. o Mode: Số trội. o Variance: Phương sai. o Standard deviation: Độ lệch chuẩn. o Coeff. of variation: Hệ số biến thiên. o Standard Error: Sai số chuẩn. o Minimum: Trị số quan sát bé nhất. o Maximum: Trị số quan sát lớn nhất. o Range: Độ biến thiên. o Skewness: Độ lệch của phân bố. o Kurtosis: Độ nhọn của phân bố. o Sum: Tổng các trị số quan sát. o Làm ví dụ với yếu tố “Bưu phẩm đi có cước”. Để phân tích đặc trưng ta chọn: Analyze > Variable Data > One – Variable Analysis… Đây là bảng phân tích đặc trưng nhận được
  6.  Cách tính các giá trị trong bảng:  Median Med=  Variance S2 =  Standard deviation Sf = = 84.3966  Coeff. of variation Cv = = 41.6749%  Standard error S  Range = Maximum – Minimum  Skewness == 1.89988  Kurtosis = = 0.227539s Kết luận:  Nhận xét sơ bộ: Nhìn vào bảng kết quả ta quan tâm đến các thông số sau: Skewness có giá trị >0 nên tập số liệu có xu hướng lớn hơn giá trị trung bình và đồ thị phân bố có xu hướng “lệch trái” so với giá trị trung bình. Kurtosis có giá trị >0 nên tập số liệu có xu h ướng phân b ố xung quanh giá trị trung bình (Đồ thị phân bố của tập số liệu này “nhọn h ơn phân phối chuẩn”)
  7. PHÂN TÍCH HỒI QUY CHƯƠNG I- I- Khái niệm 1. Khái niệm Phân tích hồi quy là tìm quan hệ phụ thuộc của một bi ến, đ ược g ọi là bi ết phụ thuộc vào một hoặc nhiều biến khác, được gọi là biến độc l ập nh ằm mục đích ước lượng hoặc tiên đoán giá trị kỳ vọng của biến phụ thuộc khi biết trước giá trị của biến độc lập. 2. Mục đích hồi quy: + Ước lượng trung bình biến phụ thuộc trong những điều kiện xác định của biến giải thích. + Ước lượng các tham số. + Kiểm định về mối quan hệ. + Dự báo giá trị biến phụ thuộc khi biến giả thích thay đổi 3. Một số dạng hàm cơ bản trong phân tích hồi qui Dạng hàm tuyến tính: 3.1. Phương trình: Yi= β1 + β2Xi + ui - Ưu điểm: - + Có tính đơn giản. + Mỗ lần X tăng thêm một đơn vị thì Y tăng thêm β2 đơn vị Nhược điểm: -
  8. Tính đơn giản của hàm tuyến tính,bất kỳ lúc nào tác động của X ph ụ + thuộc vào các giá trị của X hoặc Y, thì dạng hàm tuy ến tính không th ể là dạng hàm phù hợp. Dạng hàm Bậc hai: 3.2. Phương trình: Yi= β1 + β2Xi + β3Xi2 + ui - Khi X tăng thêm một đơn vị thì Y tăng thêm β 2 + 2β3Xi đơn vị. Nếu β3>0, thì - khi tăng lên Nếu β3< 0, thì khi X tăng lên tác động bổ sung của X đến Y giảm xuống. - Nếu có đường biểu diễn chi phí thì chi phí biên sẽ là MC= β2+ 2β3Q - Dạng hàm logarit 3.3. Phương trình: lnYi= β1 + β2lnXi+ ui -
  9. Nếu X thay đổi 1% thì Y sẽ thay đổi B 2%; đây là tính chất đặc biệt của - quan hệ logarit. II- Các thông số đánh giá 1. Hệ số tương quan R (Coefficient of correlation) Yếu tố nào có R càng lớn thì ảnh hưởng càng nhiều - Theo như kết quả kiểm duyệt: -  không tương quan R < 0.3  có dấu hiệu 0.3 < R < 0.7  hơi tương quan 0.5 < R < 0.7 0.7 < R < 0.9 tương quan  rất tương quan R > 0.9 2. Bình phương của hệ số tương quan (R square) Yếu tố nào có R2 càng lớn thì mối quan hệ giữa yếu tố đó và biến y - càng chặt chẽ: Trong đó: SSE (Sum of Square Error): SST (Sum of Square Total): Adjusted R –Square: 3. Sai số chuẩn (standard error – với hồi quy đơn là N-2)
  10. Residual 6.0706E8 15 4.04707E7 Total (Corr.) 1.14124E10 16 Correlation Coefficient = 0.97304 R-squared = 94.6807 percent R-squared (adjusted for d.f.) = 94.3261 percent Standard Error of Est. = 6361.65 Mean absolute error = 3972.39 Durbin-Watson statistic = 2.40009 (P=0.7247) Lag 1 residual autocorrelation = -0.231529 y = -31864 + 307.918*x1 Trong đó: - Correlation Coefficient: Hệ số tương quan - R-squared: hệ số xác định (bình phương R) - Standard Error of Est: độ lệch chuẩn - Mean absolute erro: trung bình lỗi
  11. Đánh giá yếu tố “Bưu phẩm đi có cước” với biến ph ụ thuộc là “Doanh thu” để xem số lượng bưu phẩm đi có cước ảnh hưởng thế nào đến doanh thu: Nhìn vào kết quả phân tích ở trên ta thấy hệ số tương quan của nó là • R=0.97304 điều đó cho thấy “Bưu phẩm đi có cước” rất tương quan với “Doanh thu”. Tiếp theo đến hệ số xác định R2 = 94,6807% điều đó khẳng định được • rằng yếu tố “Bưu phẩm đi có cước” có khả năng giải thích khoảng 94,6807% sự thay đổi của biến phụ thuộc chính là “Doanh thu” Ta so sánh đến giá trị P-value của biến độc lập này. • Trước hết xin nói rõ ý nghĩa của giá trị P-value trong phân tích th ống kê - số liệu: khi nhà nghiên cứu đã nghiên cứu ra một gi ả thuy ết thì ông cũng p ải định nghĩa giả thuyết đảo cho nó (null hypothesis) tức là một gi ả thuy ết ngược lại với những gì mình nghiên cứu và tin nó là th ật. Ví d ụ nh ư theo truyền thống trong y học nếu giá trị xác suất nhỏ hơn 5% nhà nghiên cứu có
  12. thể bác bỏ đi giả thuyết đảo còn nếu giá trị xác su ất mà l ớn 5% thì không có lý do gì để bác bỏ nó hay chưa có bằng chứng đầy đủ dể bác bỏ nó nh ưng cũng không có nghĩa là giả thuyết đảo là đúng là sự thật. Với yếu tố này Pvalue = 0.0000 điều này có nghĩa là yếu tố mà ta đang xét gần như bác bỏ giả thuyết đảo của nó, và cũng gần như chấp nhận giả thuyết đang tin tưởng đó là yếu tố “Bưu ph ẩm đi có c ước” có ảnh h ưởng nhiều đến Doanh thu Đánh giá với độ lệch chuẩn: hầu hết ta mong đợi các giá trị quan sát • của y nằm trong khoảng phạm vi 2s của các giá trị y tính toán theo ph ương pháp bình phương cực tiểu của chúng Ta sẽ kiểm định giả thuyết với giá trị độ dốc B • Bác bỏ Ha nếu B = 0 và ngược lại bác bỏ Ho nếu B ≠ 0 (B > 0 ho ặc B - < 0) Giả định độ tin cậy P = 95% - Ta cóttính= 16.3399 So sánhtbảng= Ta nhậnthấyttính>tbảng  Ta chấp nhận Ha và bác bỏ Ho. Điều này cho th ấy mô hình mà ta đang xét với một biến độc lập (Bưu phẩm đi có cước) là khá phù h ợp và bi ến này có khả năng giải thích cho biến phụ thuộc là Doanh thu. 2. Yếu tố “Bưu kiện đi có cước (nghìn cái)” Coefficients Least Squares Standard T Parameter Estimate Error Statistic P-Value Intercept -9231.65 3273.69 -2.81996 0.0129 Slope 32.4815 2.26514 14.3398 0.0000 Analysis of Variance
  13. Source Sum of Df Mean F-Ratio P-Value Squares Square Model 1.06365E10 1 1.06365E10 205.63 0.0000 Residual 7.75902E8 15 5.17268E7 Total (Corr.) 1.14124E10 16 Correlation Coefficient = 0.965408 R-squared = 93.2013 percent R-squared (adjusted for d.f.) = 92.748 percent Standard Error of Est. = 7192.14 Mean absolute error = 5576.68 Durbin-Watson statistic = 1.16837 (P=0.0163) Lag 1 residual autocorrelation = 0.369967
  14. Đánh giá yếu tố “Bưu kiện đi có cước” với biến ph ụ thuộc là “Doanh thu” để xem số lượng bưu phẩm đi có cước ảnh hưởng thế nào đến doanh thu: Nhìn vào kết quả phân tích ở trên ta thấy hệ số tương quan của nó là • R=0.965408 điều đó cho thấy “Bưu kiện đi có cước” rất tương quan với “Doanh thu”. Tiếp theo đến hệ số xác định R2 = 93,2013% điều đó khẳng định được • rằng yếu tố “Bưu kiện đi có cước” có khả năng giải thích khoảng 93,2013% sự thay đổi của biến phụ thuộc chính là “Doanh thu” Ta so sánh đến giá trị P-value của biến độc lập này. • Với yếu tố này Pvalue = 0.0000 điều này có nghĩa là yếu tố mà ta đang xét gần như bác bỏ giả thuyết đảo của nó, và cũng gần như chấp nhận giả thuyết đang tin tưởng đó là yếu tố “Bưu kiện đi có cước” có ảnh hưởng nhiều đến Doanh thu Giả định độ tin cậy P = 95% - Ta cóttính= 14,3398 So sánhtbảng = Ta nhậnthấyttính>tbảng
  15.  Ta chấp nhận Ha và bác bỏ Ho. Điều này cho th ấy mô hình mà ta đang xét với một biến độc lập (Bưu kiện đi có cước) là khá phù hợp và biến này có khả năng giải thích cho biến phụ thuộc là Doanh thu. 3. Yếu tố “Thư và điện chuyển tiền (nghìn bức)” Coefficients Least Squares Standard T Parameter Estimate Error Statistic P-Value Intercept -18892.3 8846.12 -2.13566 0.0496 Slope 8.29571 1.3586 6.10609 0.0000 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 8.13829E9 1 8.13829E9 37.28 0.0000 Residual 3.27415E9 15 2.18277E8 Total (Corr.) 1.14124E10 16 Correlation Coefficient = 0.844457 R-squared = 71.3107 percent R-squared (adjusted for d.f.) = 69.3981 percent Standard Error of Est. = 14774.2 Mean absolute error = 11928.4 Durbin-Watson statistic = 0.278645 (P=0.0000) Lag 1 residual autocorrelation = 0.755119
  16. Đánh giá yếu tố “Thư và điện chuyển tiền” với biến ph ụ thu ộc là “Doanh thu” để xem số thư và điện chuyển tiền ảnh hưởng thế nào đến doanh thu: Nhìn vào kết quả phân tích ở trên ta thấy hệ số tương quan của nó là • R=0.844457 điều đó cho thấy “Thư và điện chuyển tiền” tương quan với “Doanh thu”.
  17. Tiếp theo đến hệ số xác định R2 = 71,3107% điều đó khẳng định được • rằng yếu tố “Thư và điện chuyển tiền” có khả năng giải thích khoảng 71,3107% sự thay đổi của biến phụ thuộc chính là “Doanh thu” Ta so sánh đến giá trị P-value của biến độc lập này. • Với yếu tố này Pvalue = 0.0000 điều này có nghĩa là yếu tố mà ta đang xét gần như bác bỏ giả thuyết đảo của nó, và cũng gần như chấp nhận giả thuyết đang tin tưởng đó là yếu tố “Thư và điện chuy ển ti ền” có ảnh h ưởng nhiều đến Doanh thu Giả định độ tin cậy P = 95% - Ta cóttính= 6,10609 So sánhtbảng = Ta nhậnthấyttính>tbảng Ta chấp nhận Ha và bác bỏ Ho. Điều này cho th ấy mô hình mà ta đang xét với một biến độc lập (Thư và điện chuyển tiền) là khá phù hợp và biến này có khả năng giải thích cho biến phụ thuộc là Doanh thu. 4. Yếu tố “Báo chí phát hành (triệu tờ)” Coefficients Least Squares Standard T Parameter Estimate Error Statistic P-Value Intercept -41489.8 5407.16 -7.67312 0.0000 Slope 199.431 14.1525 14.0915 0.0000 Analysis of Variance Source Sum of Squares Df Mean Square F-Ratio P-Value Model 1.06109E10 1 1.06109E10 198.57 0.0000 Residual 8.01543E8 15 5.34362E7 Total (Corr.) 1.14124E10 16
  18. Correlation Coefficient = 0.964244 R-squared = 92.9766 percent R-squared (adjusted for d.f.) = 92.5084 percent Standard Error of Est. = 7310.01 Mean absolute error = 5100.44 Durbin-Watson statistic = 1.23012 (P=0.0238) Lag 1 residual autocorrelation = 0.377733
  19. Đánh giá yếu tố “Báo chí phát hành” với biến phụ thuộc là “Doanh thu” để xem số lượng Báo chí phát hành ảnh hưởng thế nào đến doanh thu:
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2