09/01/2018

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

CHƯƠNG II: LÀM SẠCH DỮ LIỆU

FBA

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

2.1 LÝ DO

2.2 CÁC BIỆN PHÁP NGĂN NGỪA

2.3 CÁC PHƯƠNG PHÁP LÀM SẠCH DỮ LIỆU

2.3.1 DÙNG BẢNG TẦN SỐ

2.3.2 DÙNG BẢNG PHỐI HỢP HAI BIẾN HAY BA BIẾN (BASIC OR GERERAL)

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

CHƯƠNG 2: LÀM SẠCH DỮ LIỆU CHƯƠNG 2: LÀM SẠCH DỮ LIỆU

CHƯƠNG 2: LÀM SẠCH DỮ LIỆU CHƯƠNG 2: LÀM SẠCH DỮ LIỆU

2.1 LÝ DO  Chất lượng của phỏng vấn và đọc soát  Nhập liệu sai, sót, thừa

1

09/01/2018

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

CHƯƠNG 2: LÀM SẠCH DỮ LIỆU CHƯƠNG 2: LÀM SẠCH DỮ LIỆU

2.1 CÁC BIỆN PHÁP NGĂN NGỪA  Thiết kế bảng câu hỏi rõ ràng.  Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

Điều tra thử trước khi tiến hành chính thức.  Bảng câu hỏi sau khi phỏng vấn phải được đọc kiểm soát lỗi trước khi tiến hành nhập liệu.  Việc mã hóa phải tiến hành tập trung và nhất quán với chuyên gia nhập liệu.

CHƯƠNG 2: LÀM SẠCH DỮ LIỆU CHƯƠNG 2: LÀM SẠCH DỮ LIỆU

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

2.3 Các phương pháp làm sạch dữ liệu 2.3.1 Dùng bảng tần số Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần số để tìm dữ liệu sai sót để sửa. Thực hiện: từ cửa sổ Data view Analyze Descriptive Statistics  chọn Frequencies  Hộp thoại. Thí dụ: Minh họa bằng data lamsachdulieu.sav

CHƯƠNG 2: LÀM SẠCH DỮ LIỆU CHƯƠNG 2: LÀM SẠCH DỮ LIỆU

2.3 Các phương pháp làm sạch dữ liệu 2.3.1 Dùng bảng tần số

2

09/01/2018

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

IS

CHƯƠNG 2: LÀM SẠCH DỮ LIỆU CHƯƠNG 2: LÀM SẠCH DỮ LIỆU

thì ta chọn If Condition is satisfied để nút If hiện ra và ấn vào

- Bước 2: Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào khung bên phải với điều kiện logic bao=8 & NgheNghiep="2“tiếp đó ấn Continue và ấn tiếp OK.

- Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là filter_$, biến này nhận giá trị 0 tại tất cả các tình huống không thỏa mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị là 1 trong biến filter_$ chính là những trường hợp sai mà ta cần tìm để sửa.

- Thí dụ: Minh họa bằng data lamsachdulieu.sav

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM KHOA QUẢN TRỊ - KINH DOANH KHOA QUẢN TRỊ - KINH DOANH

2.3 Các phương pháp làm sạch dữ liệu 2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến. Thực hiện: từ cửa sổ Data view Analyze Descriptive Statistics  chọn Frequencies  Hộp thoại. - Bước 1: Vào Data  Select Cases..., khi màn hình hiện ra hộp thoại

CHƯƠNG 2: LÀM SẠCH DỮ LIỆU CHƯƠNG 2: LÀM SẠCH DỮ LIỆU

2.3 Các phương pháp làm sạch dữ liệu 2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến. Chuyển 1 biến dạng phân loại (Category) thành dạng biến lưỡng phân (Dichotomy) Chuyển 1 biến dạng phân loại (Category) thành dạng biến lưỡng phân (Dichotomy) Được dùng khi gặp câu hỏi có nhiều trả lới (MA) để tập hợp một thông tin chứa trong các câu trả lời, muốn vậy cần tạo một biến với 2 biểu hiện: 1 có thông tin và 0 không có thông tin, đếm 1 sẽ có được thông tin cần quan tâm; cách tiến hành: Vào Transform \ count. Thí dụ minh họa “baosggp”.

3