intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Tin học ứng dụng: Nhập, lọc và mã hóa số liệu - Trường ĐH Y dược Huế

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:21

13
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Tin học ứng dụng: Nhập, lọc và mã hóa số liệu được biên soạn với mục tiêu nhằm giúp sinh viên xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số liệu thường gặp trong nghiên cứu y tế; Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản; Nhập và kiểm tra một bộ số liệu hoàn chỉnh. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Tin học ứng dụng: Nhập, lọc và mã hóa số liệu - Trường ĐH Y dược Huế

  1. TIN HỌC ỨNG DỤNG NHẬP, LỌC VÀ MÃ HÓA SỐ LIỆU TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN 1
  2. Mục tiêu 1/ Xác định được ý nghĩa của việc kiểm tra số liệu, lọc số liệu và mã hóa lại các số liệu thường gặp trong nghiên cứu y tế. 2/ Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản 3/ Nhập và kiểm tra một bộ số liệu hoàn chỉnh. 2
  3. Một số lỗi thông thường 1) Lỗi bỏ trống dữ liệu. 2) Lỗi logic. 3) Lỗi nhập sai giá trị đã mã hóa, outlier ( ví dụ : code 1: nam , 2: nữ nhưng số liệu lại có 3,4,5…). 3
  4. Phương pháp kiểm tra số liệu • Dùng các lệnh sắp xếp dữ liệu ( sort case: ascending/ descending)  hiển thị các giá trị missing hay outline. • Chạy các bảng tần suất hoặc trung bình  xác định giá trị missing/ lớn nhất , nhỏ nhất. • Chạy bảng chéo  các lỗi logic đơn giản. 4
  5. Biến cần sắp xếp Tăng dần Giảm dần 5
  6. Giá trị bổ trống thường xuất hiện trên cùng bộ số liệu ( ascending) Giá trị bỏ trống thường xuát hiện cuối cùng bộ số liệu (Descending) 6
  7. Lệnh lọc số liệu cơ bản 1. Select case (Lựa chọn các trường hợp theo điều kiện ) 2. Split file (chia tách dữ liệu)  2 lệnh này sẽ chỉ hiển thị kết quả khi chạy phân tích số liệu trên của số hiên thị kết quả ( out put) 7
  8. Mã hóa số liệu ( Recode) Thông thường sẽ có 2 dạng • Mã hóa  mớithực hiện ngay trên biến ban đầu ( lưu ý số liệu gốc sẽ thay đổi theo) Recode into same variable • Mã hóa  tạo thành biến Recode into different variable) 8
  9. Recode into same variables  TransVí dụ: Chia tuổi của bệnh nhân thành 3 nhóm : (60 – 70); (71- 80); và >80. form / Recode into same variables Đưa biến cần mã hõa vào 9
  10. Giá trị cũ Giá trị mỡi cần mã hóa Khoảng Thấp hơn từ … Cao hơn từ Giá trị khác ngoài khoãng đa mã hóa Lưu ý: Sau khi code cần nhấn add để việc mã hóa thực hiện Và continue để hoàn tất 10
  11. Ví dụ chia nhóm tuổi 11
  12. Lệnh sẽ được thực hiện ngay trên biến tuổi ban đầu  Lưu ý khi sử dụng lệnh này 12
  13. Recode into different variables • Về nguyên tắc thực hiện giống với recode into same variables. • Tuy nhiên lệnh này sẽ tạo ra một biến mới và nằm cuối cùng của bộ số liệu (không thay đổi số liệu gốc ban đầu) • Chú ý thay đổi tên biến mới khi thực hiện 13
  14. Transform/ recode into different variables Gõ tên biến mới Thực hiện tương tự như mã hóa same 14 into variables
  15. Kết quả tạo một biến mới nằm sau cùng của bộ số liệu 15
  16. Kiểm tra kết quả sau mã hóa số liệu • Để xem kết quả sau khi mã hóa dữ liệu có thể sử dụng lệnh Analyze/ Descriptive statistics / Frequencies  xem tần số, tỷ lệ ( cửa số output) • Ví dụ trường hợp biến tuổi 16
  17. BÀI TẬP 1 1. Dùng lệnh Sort cases phát hiện số liệu sai của biến số cân nặng. 2. Dùng lệnh Find phát hiện số liệu sai của biến số tuổi mẹ (tuổi mẹ có giá trị 8 hoặc 9 tuổi là sai). 3. Frequency để tìm số liệu sai của biến số Gan to 17
  18. 4. Frequency tìm số liệu sai của biến số lách to 5. Crosstabs: Tìm mối liên quan giữa tuổi và cân nặng , phát hiện số liệu bất hợp lý 6. Select cases: Phân tich số liệu cho nữ giới: Tìm tỷ lệ % lách to theo độ cho nữ giới 18
  19. BÀI TẬP 2 Chia tuổi thành 8 nhóm tuổi: • nhóm 1: 15-19 nhóm 2 : 20-24 • nhóm 3: 25-29 nhóm 4: 30-34 • nhóm 5: 35-39 nhóm 6 : 40-44 • nhóm 7: 45-49 nhóm 8 : > 49 tuổi 1.Hãy cho biết số lượng và tỷ lệ mỗi nhóm? 2.Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)? 19
  20. BÀI TẬP 3 Chia 5 nhóm thể lực theo cân nặng (cannang) • nhóm 1: < 40 kg nhóm 2 : 40-50 kg • nhóm 3: 51-60 nhóm 4: 61-70 • nhóm 5: > 70 1. Hãy cho biết số lượng và tỷ lệ mỗi nhóm? 2. Tỷ lệ cao nhất thuộc nhóm nào? 3. Tỷ lệ người nặng trên 60kg là bao nhiêu? 4. Hãy cho biết số lượng và tỷ lệ mỗi nhóm theo giới tính (nam/nữ)? 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2