intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Tin học quản lý SPSS: Chương 2 - ThS. Cao Hoàng Huy

Chia sẻ: Võ đình Thiên | Ngày: | Loại File: PDF | Số trang:3

81
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Chương 2 giúp người học hiểu về "Làm sạch dữ liệu". Nội dung trình bày cụ thể gồm có: Lý do, các biện pháp ngăn ngừa, các phương pháp làm sạch dữ liệu, dùng bảng tần số, dùng bảng phối hợp hai biến hay ba biến (basic or gereral).

Chủ đề:
Lưu

Nội dung Text: Bài giảng Tin học quản lý SPSS: Chương 2 - ThS. Cao Hoàng Huy

09/01/2018<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG II:<br /> LÀM SẠCH DỮ LIỆU<br /> <br /> FBA<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br /> 2.1 LÝ DO<br /> <br /> 2.2 CÁC BIỆN PHÁP NGĂN NGỪA<br /> <br /> 2.3 CÁC PHƯƠNG PHÁP LÀM SẠCH DỮ LIỆU<br /> <br /> 2.3.1 DÙNG BẢNG TẦN SỐ<br /> 2.3.2 DÙNG BẢNG PHỐI HỢP HAI BIẾN HAY BA BIẾN<br /> (BASIC OR GERERAL)<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br /> 2.1 LÝ DO<br />  Chất lượng của phỏng vấn và đọc soát<br />  Nhập liệu sai, sót, thừa<br /> <br /> 1<br /> <br /> 09/01/2018<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br /> 2.1 CÁC BIỆN PHÁP NGĂN NGỪA<br />  Thiết kế bảng câu hỏi rõ ràng.<br />  Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.<br /> Điều tra thử trước khi tiến hành chính thức.<br />  Bảng câu hỏi sau khi phỏng vấn phải được đọc<br /> kiểm soát lỗi trước khi tiến hành nhập liệu.<br />  Việc mã hóa phải tiến hành tập trung và nhất quán<br /> với chuyên gia nhập liệu.<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br /> 2.3 Các phương pháp làm sạch dữ liệu<br /> 2.3.1 Dùng bảng tần số<br /> Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần<br /> số để tìm dữ liệu sai sót để sửa.<br /> Thực hiện: từ cửa sổ Data view Analyze<br /> Descriptive Statistics  chọn Frequencies  Hộp<br /> thoại.<br /> Thí dụ: Minh họa bằng data lamsachdulieu.sav<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br /> 2.3 Các phương pháp làm sạch dữ liệu<br /> 2.3.1 Dùng bảng tần số<br /> <br /> 2<br /> <br /> 09/01/2018<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br /> 2.3 Các phương pháp làm sạch dữ liệu<br /> 2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.<br /> Thực hiện: từ cửa sổ Data view Analyze Descriptive<br /> Statistics  chọn Frequencies  Hộp thoại.<br /> IS<br /> <br /> - Bước 1: Vào Data  Select Cases..., khi màn hình hiện ra hộp thoại<br /> thì ta chọn If Condition is satisfied để nút If hiện ra và ấn vào<br /> - Bước 2: Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào<br /> khung bên phải với điều kiện logic bao=8 & NgheNghiep="2“tiếp đó<br /> ấn Continue và ấn tiếp OK.<br /> - Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là<br /> filter_$, biến này nhận giá trị 0 tại tất cả các tình huống không thỏa<br /> mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị<br /> là 1 trong biến filter_$ chính là những trường hợp sai mà ta cần tìm để<br /> sửa.<br /> - Thí dụ: Minh họa bằng data lamsachdulieu.sav<br /> <br /> TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM<br /> KHOA QUẢN TRỊ - KINH DOANH<br /> <br /> CHƯƠNG 2: LÀM SẠCH DỮ LIỆU<br /> 2.3 Các phương pháp làm sạch dữ liệu<br /> 2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.<br /> Chuyển 1 biến dạng phân loại (Category) thành dạng<br /> biến lưỡng phân (Dichotomy)<br /> Chuyển 1 biến dạng phân loại (Category) thành dạng<br /> biến lưỡng phân (Dichotomy) Được dùng khi gặp câu<br /> hỏi có nhiều trả lới (MA) để tập hợp một thông tin<br /> chứa trong các câu trả lời, muốn vậy cần tạo một biến<br /> với 2 biểu hiện: 1 có thông tin và 0 không có thông tin,<br /> đếm 1 sẽ có được thông tin cần quan tâm; cách tiến<br /> hành:<br /> Vào Transform \ count. Thí dụ minh họa “baosggp”.<br /> <br /> 3<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2