09/01/2018<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG II:<br />
LÀM SẠCH DỮ LIỆU<br />
<br />
FBA<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br />
2.1 LÝ DO<br />
<br />
2.2 CÁC BIỆN PHÁP NGĂN NGỪA<br />
<br />
2.3 CÁC PHƯƠNG PHÁP LÀM SẠCH DỮ LIỆU<br />
<br />
2.3.1 DÙNG BẢNG TẦN SỐ<br />
2.3.2 DÙNG BẢNG PHỐI HỢP HAI BIẾN HAY BA BIẾN<br />
(BASIC OR GERERAL)<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br />
2.1 LÝ DO<br />
Chất lượng của phỏng vấn và đọc soát<br />
Nhập liệu sai, sót, thừa<br />
<br />
1<br />
<br />
09/01/2018<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br />
2.1 CÁC BIỆN PHÁP NGĂN NGỪA<br />
Thiết kế bảng câu hỏi rõ ràng.<br />
Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.<br />
Điều tra thử trước khi tiến hành chính thức.<br />
Bảng câu hỏi sau khi phỏng vấn phải được đọc<br />
kiểm soát lỗi trước khi tiến hành nhập liệu.<br />
Việc mã hóa phải tiến hành tập trung và nhất quán<br />
với chuyên gia nhập liệu.<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br />
2.3 Các phương pháp làm sạch dữ liệu<br />
2.3.1 Dùng bảng tần số<br />
Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần<br />
số để tìm dữ liệu sai sót để sửa.<br />
Thực hiện: từ cửa sổ Data view Analyze<br />
Descriptive Statistics chọn Frequencies Hộp<br />
thoại.<br />
Thí dụ: Minh họa bằng data lamsachdulieu.sav<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br />
2.3 Các phương pháp làm sạch dữ liệu<br />
2.3.1 Dùng bảng tần số<br />
<br />
2<br />
<br />
09/01/2018<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br />
2.3 Các phương pháp làm sạch dữ liệu<br />
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.<br />
Thực hiện: từ cửa sổ Data view Analyze Descriptive<br />
Statistics chọn Frequencies Hộp thoại.<br />
IS<br />
<br />
- Bước 1: Vào Data Select Cases..., khi màn hình hiện ra hộp thoại<br />
thì ta chọn If Condition is satisfied để nút If hiện ra và ấn vào<br />
- Bước 2: Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào<br />
khung bên phải với điều kiện logic bao=8 & NgheNghiep="2“tiếp đó<br />
ấn Continue và ấn tiếp OK.<br />
- Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là<br />
filter_$, biến này nhận giá trị 0 tại tất cả các tình huống không thỏa<br />
mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị<br />
là 1 trong biến filter_$ chính là những trường hợp sai mà ta cần tìm để<br />
sửa.<br />
- Thí dụ: Minh họa bằng data lamsachdulieu.sav<br />
<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br />
KHOA QUẢN TRỊ - KINH DOANH<br />
<br />
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br />
2.3 Các phương pháp làm sạch dữ liệu<br />
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.<br />
Chuyển 1 biến dạng phân loại (Category) thành dạng<br />
biến lưỡng phân (Dichotomy)<br />
Chuyển 1 biến dạng phân loại (Category) thành dạng<br />
biến lưỡng phân (Dichotomy) Được dùng khi gặp câu<br />
hỏi có nhiều trả lới (MA) để tập hợp một thông tin<br />
chứa trong các câu trả lời, muốn vậy cần tạo một biến<br />
với 2 biểu hiện: 1 có thông tin và 0 không có thông tin,<br />
đếm 1 sẽ có được thông tin cần quan tâm; cách tiến<br />
hành:<br />
Vào Transform \ count. Thí dụ minh họa “baosggp”.<br />
<br />
3<br />
<br />