intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Phân tích và xử lý dữ liệu trong kinh doanh: Chương 4 - Học viện Ngân hàng

Chia sẻ: Nhẫn Nhẫn | Ngày: | Loại File: PPTX | Số trang:50

95
lượt xem
12
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Chương 4 - Phân tích hồi quy và tương quan. Những nội dung chính trong chương này: Mối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quan, xác định mô hình hồi quy tuyến tính đơn, đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình, ước lượng giá trị trong tương lai dựa vào mô hình hồi quy, mô hình hồi quy bội.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Phân tích và xử lý dữ liệu trong kinh doanh: Chương 4 - Học viện Ngân hàng

  1. CHƯƠNG 4 PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN
  2. NHỮNG CHỦ ĐỀ CHÍNH 1. Mối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quan 2. Xác định mô hình hồi quy tuyến tính đơn 3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình 4. Ước lượng giá trị trong tương lai dựa vào mô hình hồi quy 5. Mô hình hồi quy bội
  3. 1. Mối quan hệ giữa các hiện KT – XH Phân tích hồi quy được sử dụng đầu tiên và phương pháp hồi quy tương • để dự đoán quan Một mô hình thống kê được sử dụng để dự đoán giá trị của biến phụ thuộc (biến kết quả) dựa trên những giá trị của ít nhất một biến độc lập (biến nguyên nhân) • Phân tích tương quan được sử dụng làm thước đo độ lớn trong mối liên hệ giữa các biến định lượng.
  4. Biểu đồ phân tán (Scatter) • ( X i , Yi ) Đồ thị gồm tất cả các cặp Y X
  5. Các loại mô hình hồi quy Mối liên hệ phi tuyến Mối liên hệ tuyến tính thuận Mối liên hệ tuyến tính Không có mối liên hệ nghịch
  6. 2. Xác định mô hình hồi quy tuyến tính đơn • Mối liên hệ giữa các biến là một phương trình đường thẳng • Đường thẳng là phù hợp nhất với dữ liệu Yi = β 0 + β1 X i + ε i Y: biến phụ thuộc; X: biến độc lập; β0: Hệ số chặn β1 : Hệ số góc (độ dốc của đường hồi quy)
  7. Giả định • Mối quan hệ giữa X và Y là tuyến tính • X và Y là biến định lượng • X không có sai số ngẫu nhiên; • Các giá trị của Y độc lập với nhau ( ví dụ Y1 không liên quan tới Y2) 2 • Sai số ngẫu nhiêni ~ N (0, )
  8. Mô hình hồi quy của tổng thể chung Y YYi i = β 00 + β11XXii + ε i i Giá trị quan sát i : Sai số ngẫu nhiên Yi b0 b1 X i i X Giá trị quan sát EPI 809/Spring 2008 8
  9. Tổng thể và mô hình hồi quy mẫu Tổng thể      EPI 809/Spring 2008 9
  10. Tổng thể và mô hình hồi quy mẫu Tổng thể Unknown Relationship  Yi 0 1 Xi i     EPI 809/Spring 2008 10
  11. Tổng thể và mô hình hồi quy mẫu Tổng thể Mẫu ngẫu nhiên Unknown Relationship  Yi 0 1 Xi i       EPI 809/Spring 2008 11
  12. Tổng thể và hàm hồi quy mẫu Tổng thể Mẫu ngẫu nhiên Unknown Yi b0 b1 X i i Relationship  Yi Xi  0 1 i      EPI 809/Spring 2008 12
  13. Ước lượng mô hình hồi quy • Mô hình được ước lượng bằng cách – Thu thập mẫu từ tổng thể – Tính toán các giá trị thống kê của tổng thể mẫu. y – Xác định w đường thẳng đi qua tập thẳng đường dữ liệu nào w w là tốt nhất? w w w w ww w w w w w w x 13
  14. Phương pháp bình phương tối thiểu Đường hồi quy tìm được là đường thẳng (Ordinary Least Square ) sao cho tổng bình phương sai số từ điểm quan sát tới đường thẳng đó là nhỏ nhất
  15. Phương pháp bình phương tối thiểu Sum of squared differences (2=- 1)2 (4 + - 2)2(1.5 + - 3)2(3.2 + - 4)2 = 6.89 Sum of squared differences (2=-2.5)2 (4 + - 2.5)2(1.5 + - 2.5)2(3.2 + - 2.5)2 = 3.99 Let us compare two lines 4 (2,4) w The second line is horizontal 3 w (4,3.2) 2.5 2 (1,2)w w(3,1.5) 1 The smaller the sum of squared differences the better the fit of the 1 2 3 4 line to the data. 15
  16. Phương pháp bình phương tối thiểu Cần  b0 , b1 sao cho tìm n n �ε i =1 i 2 = �(Yi − b0 − b1 X i ) i =1 2 min Suy ra β1 , β 2 thỏa mãn n ε i2 n i =1 = 2(Yi − b0 − b1 X i )( −1) = 0 β1 i =1 n ε i2 n i =1 = 2(Yi − b0 − b1 X i )( − X i ) = 0 β2 i =1
  17. Ước lượng hệ số hồi quy Ta thu được công thức sau: SS xy b1 = SS xx b0 = Y − b1 X SS xy = (X i ( − X ) ( Yi − Y ) = n XY − X .Y ) ( xi − x ) 2 SS xx = = n( X i2 − X 2 ) Hàm hồi quy có dạng ˆ Yi = b0 + b1 X i 17
  18. Ví dụ 1 • Giả sử cần nghiên cứu chi tiêu tiêu dùng của hộ gia đình phụ thuộc thế nào vào thu nhập của họ, người ta tiến hành điều tra, thu được một mẫu gồm 10 hộ gia đình với số liệu như sau : Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260 – Y: Chi tiêu của hộ gia đình (USD/Tuần)
  19. Thuyết minh kết quả Y = 24.46 + 0.509 X Hệ số chặn: 24.46  dù không có thu nhập thì mỗi gia đình cũng phải tiêu ít nhất 24.46 usd/tuần Độ dốc: 0.509  mỗi khi thu nhập tăng lên 10 usd thì trung bình mỗi gia đình sẽ tiêu thêm khoảng 5 usd một tuần
  20. Ước tính bằng R • Chúng ta muốn ước tính mối liên quan giữa việc thích mua sắm và xu hướng mua hàng ngẫu nhiên của người tiêu dùng • Mô hình hồi quy tuyến tính IB = b0 + b1ShopEnjoy + ε i • R: lm(IB~ShopEnjoy)
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2