
Tuan V. Nguyen
Garvan Institute of Medical Research
Professor, UNSW School of Public Health and Community Medicine
Professor of Predictive Medicine, University of Technology Sydney
Adj. Professor of Epidemiology and Biostatistics,
School of Medicine Sydney, University of Notre Dame Australia
Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen

Dữ liệu thực tế
Nghiên cứu tiểu đường (n = 3165 nam và nữ)
> db = read.csv("~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6-
2019/Datasets/Diabetes data.csv")
> head(db)
id age gender height weight waist hip sysbp diabp active hypertension
1 1 76 Female 163 53 90 93 160 90 0 1
2 1 40 Female 149 51 74 94 100 60 0 0
3 1 51 Female 151 55 91 100 120 80 0 0
4 1 43 Female 158 62 78 96 120 80 1 0
5 2 72 Female 148 47 91 95 130 60 1 0
6 2 44 Male 155 48 69 86 120 80 0 0
bmi whr diabetes
1 19.95 0.97 IFG
2 22.97 0.79 Normal
3 24.12 0.91 Normal
4 24.84 0.81 Normal
5 21.46 0.96 IFG
6 19.98 0.80 Normal
> sim(db)

Phân tích mô tả và so sánh
•Mô tả biến liên tục (continuous variables)
•Mô tả biến phân nhóm (categorical variables)
•So sánh hai nhóm: biến liên tục
•So sánh hai nhóm: biến phân nhóm

Mô tả biến liên tục
• Biểu đồ phân bố, biểu đồ hộp
• Phân bố chuẩn: trung bình, độ lệch chuẩn
• Phân bố lệch so với phân bố chuẩn: trung vị, bách phân vị
25%, 75%

Mô tả biến phân nhóm
•Biểu đồ bar
• Tỉ lệ, độ lệch chuẩn, khoảng tin cậy 95%
• Phân bố lệch so với phân bố chuẩn: trung vị, bách phân vị
25%, 75%