intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Giới thiệu ngôn ngữ R Markdown

Chia sẻ: Menh Menh | Ngày: | Loại File: PDF | Số trang:20

44
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Giới thiệu ngôn ngữ R Markdown và mục tiêu tái lập; một session với R Markdown; một document của R Markdown; phân tích mô hình hồi quy tuyến tính...

Chủ đề:
Lưu

Nội dung Text: Bài giảng Giới thiệu ngôn ngữ R Markdown

  1. Tuan V. Nguyen Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen
  2. RMardown, RStudio, R • R là nền tảng • R Studio được xây dựng trên R – có 'menu' và giao diện biểu đồ • R Mardown là một phần của RStudio – giúp 'document' mã R – tái lập (reproducibility)
  3. R Studio • Download R Studio https://www.rstudio.com/products/RStudio/#Desktop • R Markdown có trong R Studio
  4. R mardown Data objects Mã R Output
  5. Vận hành của R Studio Có thể lưu mã R và output bằng cách dùng File/Save
  6. R Markdown và mục tiêu tái lập Đảm bảo tính reproducibility: dữ liệu + mã R + văn bản
  7. R Markdown • R + Markdown = RMarkdown • Có thể xem là một "markup language" • Lưu trữ mã R • Export output sang Word, pdf, html
  8. Một session với R Markdown
  9. Một document của R Markdown • Header • R codes • Output
  10. Một document của R Markdown # Phân tích tương quan giữa BMI và pcfat ## Dữ liệu obesity data, Việt Nam • Header ### PI: Tuan Nguyen • R codes # Đọc dữ liệu vào R ``` {r} • Output ob = read.csv("~/Dropbox/_Lectures and Talks/UTS Data Analytics 2019/obesity data.csv") head(ob) summary(lm(pcfat ~ bmi, data=ob)) Giữa ``` và ``` là R codes # Vẽ mối tương quan giữa BMI và pcfat library(ggplot2) p = ggplot(data=ob, aes(x=bmi, y=pcfat, ol=gender)) p + geom_point() + geom_smooth(method="lm") ```
  11. Header Header R codes R codes in-line R codes
  12. Output
  13. R Markdown codes and output --- title: "Analysis of obesity" author: "Tuan Nguyen" date: "4/22/2019" output: html_document --- # Analysis of obesity dataset ## Data are from a study in Vietnam ### PI: Tuan Nguyen
  14. R Markdown codes and output # Đọc dữ liệu vào R ```{r} ob = read.csv("~/Dropbox/_Lectures and Talks/UTS Data Analytics 2019/obesity data.csv") head(ob) ```
  15. # Phân tích mô hình hồi qui tuyến tính ```{r} summary(lm(pcfat ~ bmi, data=ob)) ``` ### Summary The mean of percent body fat is `r mean(ob$pcfat)`.
  16. # Vẽ mối tương quan giữa BMI và pcfat ``` {r} library(ggplot2) p = ggplot(data=ob, aes(x=bmi, y=pcfat, col=gender)) p + geom_point() + geom_smooth(method="lm") ```
  17. Sau khi viết xong, có thể "Knit" để cho ra html output trên rpubs.com
  18. rpubs.com/nguyet
  19. RStudio và RMarkdown • Hai 'additions' rất quan trọng cho phân tích dữ liệu với R • RStudio cung cấp giao diện 'thân thiện' hơn R • RMarkdown là một 'ngôn ngữ bị chú' cho một công trình phân tích dữ liệu – một phương tiện rất có ích cho lưu trữ mã R – đảm bảo tính tái lập trong phân tích dữ liệu – có thể xuất sang Word, html và pdf
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
17=>2