
Tuan V. Nguyen
Senior Principal Research Fellow, Garvan Institute of Medical Research
Professor, UNSW School of Public Health and Community Medicine
Professor of Predictive Medicine, University of Technology Sydney
Adj. Professor of Epidemiology and Biostatistics,
School of Medicine Sydney, University of Notre Dame Australia
Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen

Đánh giá mô hình hồi qui tuyến tính
• Khái niệm 'residual' và phương sai
•RMSE – residual mean squared error
• Hệ số xác định (coefficient of determination)

Mô hình hồi qui tuyến tính
•Mô hình
Y =
a
+
b
X+
e
• Chúng ta không biết α và β
• Nhưng có thể dùng dữ liệu thí nghiệm / thực tế để ước tính 2
tham số đó
•Ước số (estimate) của α và β là avà b

Phương pháp "Least square"
Y
X
ii bxay +=
ˆ
iii yyd ˆ
-=
y
i
Tìm công thức (estimator) để tính a và b sao cho tổng d2là nhỏ nhất àLeast
square method = Bình phương nhỏ nhất

Residuals – độ dao động dư
• Mô hình cho dữ liệu
y = a + bx + e
Giá trị trung bình: E(y) = yhat = a + bx
Phần dư : e = y – E(y)
•Phát biểu "thường dân"
Dữ liện quan sát = Mô hình tiên lượng + Phần dư (nhiễu)
Phần dư = giá trị quan sát –giá trị tiên lượng