
NHẬP, LỌC VÀ MÃ HÓA
SỐ LIỆU
TIN HỌC ỨNG DỤNGTIN HỌC ỨNG DỤNG
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
1

Mục tiêu
1/ Xác định được ý nghĩa của việc kiểm tra số liệu, lọc
số liệu và mã hóa lại các số liệu thường gặp trong
nghiên cứu y tế.
2/ Thực hiện được các lệnh lọc, mã hóa số liệu cơ bản
3/ Nhập và kiểm tra một bộ số liệu hoàn chỉnh.
2

1) Lỗi bỏ trống dữ liệu.
2) Lỗi logic.
3) Lỗi nhập sai giá trị đã mã hóa, outlier ( ví dụ :
code 1: nam , 2: nữ nhưng số liệu lại có 3,4,5…).
Một số lỗi thông thường
3

Phương pháp kiểm tra số liệu
• Dùng các lệnh sắp xếp dữ liệu ( sort case:
ascending/ descending) hiển thị các giá trị
missing hay outline.
• Chạy các bảng tần suất hoặc trung bình xác
định giá trị missing/ lớn nhất , nhỏ nhất.
• Chạy bảng chéo các lỗi logic đơn giản.
4

Biến cần sắp
xếp
Tăng dần
Giảm dần
5