
Tuan V. Nguyen
Senior Principal Research Fellow, Garvan Institute of Medical Research
Professor, UNSW School of Public Health and Community Medicine
Professor of Predictive Medicine, University of Technology Sydney
Adj. Professor of Epidemiology and Biostatistics,
School of Medicine Sydney, University of Notre Dame Australia
Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen

Nội dung
•Mô hình hồi qui tuyến tính đa biến
•Ứng dụng 1: đánh giá mối liên quan (association / assessment)
•Ứng dụng 2: hiệu chỉnh cho yếu tố nhiễu (adjustment)
•Ứng dụng 3: mô hình tiên lượng (prediction)

Mô hình hồi qui tuyến tính đa biến
• Mô hình hồi qui tuyến tính đơn giản:
Y = β0+ β1X1
• Mô hình hồi qui tuyến tính đa biến:
Y = β0+ β1X1+ β2X2+ β3X3 + ... + βpXp
• Các biến X có thể là biến liên tục hay phân nhóm

Mô hình hồi qui tuyến tính đa biến
•Mô hình căn bản
ebbbb
+++++= pp XXXY ...
22110
•Y là biến phụ thuộc (dependent variable), biến liên tục
• X1, X2, X3, …, Xp: biến tiên lượng
β1, β2, β3, ..., βp: regression coefficients (hệ số hồi qui )
ε~ phân bố chuẩn (normal), độc lập, trung bình 0, phương sai σ2
ε~ (0, σ2)

Hàm lm trong R
• Trong R, có hàm lm (linear models)
–giải phương trình để ước tính tham số
–tính toán các chỉ số thống kê liên quan đến mô hình
–đánh giá sự thích hợp của mô hình
• Công thức chung
lm(y ~ x1 + x2 + x3 + ...)