09/01/2018
1
FBA
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG II:
LÀM SẠCH DỮ LIỆU
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆUCHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 LÝ DO
2.2 CÁC BIỆN PHÁP NGĂN NGỪA
2.3 CÁC PHƯƠNG PHÁP LÀM SẠCH DỮ LIỆU
2.3.1 DÙNG BẢNG TẦN SỐ
2.3.2 DÙNG BẢNG PHỐI HỢP HAI BIẾN HAY BA BIẾN
(BASIC OR GERERAL)
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆUCHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 LÝ DO
Chất lượng của phỏng vấn và đọc soát
Nhập liệu sai, sót, thừa
09/01/2018
2
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆUCHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 CÁC BIỆN PHÁP NGĂN NGỪA
Thiết kế bảng câu hỏi rõ ràng.
Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.
Điều tra thử trước khi tiến hành chính thức.
Bảng câu hỏi sau khi phỏng vấn phải được đọc
kiểm soát lỗi trước khi tiến hành nhập liệu.
Việc mã hóa phải tiến hành tập trung và nhất quán
với chuyên gia nhập liệu.
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆUCHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.1 Dùng bảng tần số
Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần
số để tìm dữ liệu sai sót để sửa.
Thực hiện: từ cửa sổ Data view Analyze
Descriptive Statistics chọn Frequencies Hộp
thoại.
Thí dụ: Minh họa bằng data lamsachdulieu.sav
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆUCHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.1 Dùng bảng tần số
09/01/2018
3
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆUCHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.
Thực hiện: từ cửa sổ Data view AnalyzeDescriptive
Statistics chọn Frequencies Hộp thoại.
- Bước 1: Vào Data Select Cases..., khi màn hình hiện ra hộp thoại
thì ta chọn If Condition is satisfied để nút If hiện ra ấn vào
- Bước 2: Chọn biến Tuoi biến NgheNghiep bên trái để đưa vào
khung bên phải với điều kiện logic bao=8 & NgheNghiep="2“tiếp đó
ấn Continue và ấn tiếp OK.
- Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là
filter_$, biến này nhận giá trị 0 tại tất cả các tình huống không thỏa
mãn 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị
1 trong biến filter_$ chính những trường hợp sai ta cần tìm để
sửa.
-Thí dụ: Minh họa bằng data lamsachdulieu.sav
IS
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆUCHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.
Chuyển 1 biến dạng phân loại (Category) thành dạng
biến lưỡng phân (Dichotomy)
Chuyển 1 biến dạng phân loại (Category) thành dạng
biến lưỡng phân (Dichotomy) Được ng khi gặp u
hỏi nhiều trả lới (MA) để tập hợp một thông tin
chứa trong các câu trả lời, muốn vậy cần tạo một biến
với 2 biểu hiện: 1 thông tin 0 không thông tin,
đếm 1 sẽ được thông tin cần quan tâm; cách tiến
hành:
Vào Transform \ count. Thí dụ minh họa “baosggp”.