intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Thước đo đánh giá mô hình hồi quy tuyến tính

Chia sẻ: Menh Menh | Ngày: | Loại File: PDF | Số trang:14

51
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng trình bày đánh giá mô hình hồi quy tuyến tính; mô hình hồi quy tuyến tính; phương pháp Least square; Residuals – độ dao động từ; phân tích phương sai; hai thước đo đánh giá mô hình hồi quan tuyến tính; hệ số xác định; diễn giải hệ số xác định...

Chủ đề:
Lưu

Nội dung Text: Bài giảng Thước đo đánh giá mô hình hồi quy tuyến tính

  1. Tuan V. Nguyen Senior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen
  2. Đánh giá mô hình hồi qui tuyến tính • Khái niệm 'residual' và phương sai • RMSE – residual mean squared error • Hệ số xác định (coefficient of determination)
  3. Mô hình hồi qui tuyến tính • Mô hình Y = a + bX + e • Chúng ta không biết α và β • Nhưng có thể dùng dữ liệu thí nghiệm / thực tế để ước tính 2 tham số đó • Ước số (estimate) của α và β là a và b
  4. Phương pháp "Least square" yˆ i = a + bxi d i = yi - yˆ i yi Y X Tìm công thức (estimator) để tính a và b sao cho tổng d2 là nhỏ nhất à Least square method = Bình phương nhỏ nhất
  5. Residuals – độ dao động dư • Mô hình cho dữ liệu y = a + bx + e Giá trị trung bình: E(y) = yhat = a + bx Phần dư : e = y – E(y) • Phát biểu "thường dân" Dữ liện quan sát = Mô hình tiên lượng + Phần dư (nhiễu) Phần dư = giá trị quan sát – giá trị tiên lượng
  6. Phân tích phương sai • Mô hình pcfat = a + b*age+ e • Giá trị quan sát = model (mô hình) + random (ngẫu nhiên) SStotal = SSreg + SSerror SStotal = total sum of squares SSreg = sum of squares due to the regression model SSerror = sum of squares due to random component
  7. SSerror SStotal pcfat SSreg trung bình -- mean age SStotal = SSreg + SSerror R-square = SSreg / SStotal
  8. Hai thước đo đánh giá mô hình HQTT • RMSE – residual mean squared error – có thể xem là 'phương sai' của biến Y sau khi đã hiệu chỉnh cho X • Hệ số xác định (coefficient of determination), R2 – Phản ảnh bao nhiêu phần trăm dao động của biến Y có thể giải thích bởi biến X (còn gọi là "explained variation")
  9. Hệ số xác định (R2) m1 = lm(pcfat ~ age, data=ob) anova(m1) RMSE = 46.8 Analysis of Variance Table Response: pcfat Df Sum Sq Mean Sq F value Pr(>F) age 1 5917 5916.8 126.52 < 2.2e-16 *** Residuals 1215 56821 46.8 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 R2 = 5917 / (5917 + 56821) = 0.094
  10. Diễn giải hệ số xác định Residual standard error: 6.839 on 1215 degrees of freedom Multiple R-squared: 0.09431, Adjusted R-squared: 0.09357 F-statistic: 126.5 on 1 and 1215 DF, p-value: < 2.2e-16 Coefficient of determination R2 = 0.094 Diễn giải: Những khác biệt về độ tuổi giải thích khoảng 9.5% tổng phương sai của tỉ trọng mỡ.
  11. Diễn giải RMSE • RMSE = 46.8 là phương sai của biến Y sau khi đã hiệu chỉnh cho biến X • Phương sai của pcfat khi chưa có X là > var(ob$pcfat) [1] 51.5935
  12. Khác biệt gvề pcfat giữa nam và nữ: diễn giải Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 34.6724 0.1826 189.9
  13. Khác biệt gvề pcfat giữa nam và nữ: diễn giải Residual standard error: 5.362 on 1215 degrees of freedom Multiple R-squared: 0.4432, Adjusted R-squared: 0.4428 F-statistic: 967.3 on 1 and 1215 DF, p-value: < 2.2e-16 Diễn giải: Khác biệt giữa nam và nữ giải thích 44% những khác biệt về phương sai của tỉ trọng mỡ.
  14. Tóm tắt Hai thước đo đánh giá mô hình hồi qui tuyến tính • RMSE (phương sai của Y sau khi đã điều chỉnh cho X) • Hệ số xác định R2
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2