Tuan V. Nguyen
Garvan Institute of Medical Research
Professor, UNSW School of Public Health and Community Medicine
Professor of Predictive Medicine, University of Technology Sydney
Adj. Professor of Epidemiology and Biostatistics,
School of Medicine Sydney, University of Notre Dame Australia
Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen
Dữ liệu thực tế
Nghiên cứu tiểu đường (n = 3165 nam và nữ)
> db = read.csv("~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6-
2019/Datasets/Diabetes data.csv")
> head(db)
id age gender height weight waist hip sysbp diabp active hypertension
1 1 76 Female 163 53 90 93 160 90 0 1
2 1 40 Female 149 51 74 94 100 60 0 0
3 1 51 Female 151 55 91 100 120 80 0 0
4 1 43 Female 158 62 78 96 120 80 1 0
5 2 72 Female 148 47 91 95 130 60 1 0
6 2 44 Male 155 48 69 86 120 80 0 0
bmi whr diabetes
1 19.95 0.97 IFG
2 22.97 0.79 Normal
3 24.12 0.91 Normal
4 24.84 0.81 Normal
5 21.46 0.96 IFG
6 19.98 0.80 Normal
> sim(db)
Phân tích mô tả và so sánh
Mô tả biến liên tục (continuous variables)
Mô tả biến phân nhóm (categorical variables)
So sánh hai nhóm: biến liên tục
So sánh hai nhóm: biến phân nhóm
Mô tả biến liên tục
Biểu đồ phân bố, biểu đồ hộp
Phân bố chuẩn: trung bình, độ lệch chuẩn
Phân bố lệch so với phân bố chuẩn: trung vị, bách phân vị
25%, 75%
Mô tả biến phân nhóm
Biểu đồ bar
Tỉ lệ, độ lệch chuẩn, khoảng tin cậy 95%
Phân bố lệch so với phân bố chuẩn: trung vị, bách phân vị
25%, 75%