12/30/2013
TIN HỌC ỨNG DỤNG Chương 2: Phân tích dữ liệu với SPSS
Phan Minh Trung Trung tâm Tin học – Đại học An Giang Email: pmtrung@agu.edu.vn Website: http://staff.agu.edu.vn/pmtrung
1
Tin học ứng dụng quản lý
Nội dung
1
• Giới thiệu SPSS & Cài đặt
2
• Mã hoá dữ liệu, Khai báo biến, Nhập liệu, Xử lý,„
3
• Kiểm đðnh thang đo
4
• Mô hình phân tích nhân tố khám phá (EFA).
5
• Phân tích hồi qui.
• Thống kê mô tả (tạo bảng tần số, bảng thống kê một số đại lượng, vẽ đồ thð)
6
2
Tin học ứng dụng quản lý
1
12/30/2013
Giới thiệu SPSS Viết tắt Statistical Package for the Social Sciences
Sử dụng rộng rãi trong công tác thống kê kinh tế -
xã hội
SPSS cung cấp một hệ thống quản lý dữ liệu và phân tích thống kê trong một môi trường đồ họa
Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình bày đẹp, linh hoạt
3
Tin học ứng dụng quản lý
Cài đặt SPSS
Cài đặt SPSS V20
4
Tin học ứng dụng quản lý
2
12/30/2013
Mã hóa dữ liệu & Nhập liệu
VD: ta có bảng dữ liệu như sau
Các biến
Giới tính Tuổi Nghề nghiệp
i
1 Nữ 19 Sinh viên
ờ
l
ả r t i
2 Nữ 32 Nhân viên
ờ ư g N
3 Nam 53 Về hưu
…. … … …..
n Nam 42 Khác
5
Tin học ứng dụng quản lý
Mã hóa dữ liệu & Nhập liệu
Ta qui ước như sau
Giới tính Tuổi Nghề nghiệp
1. Nam 2. Nữ 1. Từ 1 – 25 2. Từ 26 – 50 3. Trên 50 1. Sinh viên 2. Nhân viên văn phòng 3. Về hưu 4. Khác
6
Tin học ứng dụng quản lý
3
12/30/2013
Mã hóa dữ liệu & Nhập liệu
Giới tính Tuổi Nghề nghiệp
1 2 1 1
2 2 2 2
3 1 3 3
…. … … …..
n 1 2 4
7
Tin học ứng dụng quản lý
Ví dụ: Mã hóa bảng câu hỏi!
Hãy mã hóa và nhập liệu cho bảng phỏng về đề tài nghiên cứu cứu “Các yếu tố ảnh hưởng đến sự hài lòng của khách hàng: trường hơp nghiên cứu ở Ngân hàng Nông nghiệp PTNT, chi nhánh TPHCM”. Trong đó bao gồm các biến độc lập, phụ thuộc, nhân khẩu học.
Xem phụ lục 2.1
8
Tin học ứng dụng quản lý
4
12/30/2013
Mã hóa dữ liệu
TAN
REL
RES
ASS
EMP
SAT
INFO
SAT_1 SAT_2 SAT_3
TAN_1 TAN_2 TAN_3 TAN_4
INFO_1 INFO_2 INFO_3 INFO_4
RES_1 RES_2 RES_5 RES_4 RES_5
ASS_1 ASS_2 ASS_3 ASS_4 ASS_5 ASS_6 ASS_7
REL_1 REL_2 REL_3 REL_4 REL_5 REL_6 REL_7 REL_8
EMP_1 EMP_2 EMP_3 EMP_4 EMP_5 EMP_6 EMP_7 EMP_8 EMP_9
2. Từ 20 – 30 tuổi 4. Trên 50 tuổi
Mã hóa theo từng nhóm thành phần Thông tin cá nhân theo 1 nhóm và qui ước các con số khi nhập liệu: VD INFO_2 (Độ tuổi): 1. ≤ 20 3. Từ 31 – 50 tuổi
9
Tin học ứng dụng quản lý
Nhập liệu
Để nhập dữ liệu nhanh ta thực hiện như sau:
Nhập dữ liệu bằng Excel theo cột.
Chuyển dòng thành cột.
Kiểm tra dữ liệu.
Chuyển dữ liệu qua SPSS:
Khai báo biến đã mã hóa.
Copy dữ liệu từ Excel qua SPSS.
10
Tin học ứng dụng quản lý
5
12/30/2013
Nhập liệu Excel
11
Tin học ứng dụng quản lý
Chuyển dòng thành cột
12
Tin học ứng dụng quản lý
6
12/30/2013
Kiểm tra dữ liệu bằng Filter trong Excel
13
Tin học ứng dụng quản lý
Khai báo biến bên SPSS
14
Tin học ứng dụng quản lý
7
12/30/2013
Giải thích giao diện khai báo biến.
Name
Tên biến, liên tục không có khoảng trắng
Kiểu dữ liệu (Số, chuỗi,…)
Type
Độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự tối đa
Width
Llượng số thập phân
Decimals
Nhãn biến (chú thích cho tên biến)
Label
Định nghĩa giá trị cho các biến.
Values
Khai báo giá trị khuyết
Missing
Độ rộng cột tên biến
Columns
Canh lề dữ liệu nhập trong cột.
Align
Measure
Loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc), Nominal (thang đo danh nghĩa), Scale (gồm cả Interval và Ratio).
Vai trò của biến
Role
15
Tin học ứng dụng quản lý
Xử lý biến„
Đðnh nghïa giá trð cho các biến.
16
Tin học ứng dụng quản lý
8
12/30/2013
Mô hình Phân tích nhân tố khám phá (EFA)
Qui trình phân tích nhân tố khám phá
(Exploratory Factor Analysis): Bước 1: Kiểm đðnh chất lượng thang đo.
Bước 2: Phân tích nhân tố khám phá (EFA).
Kiểm đðnh tính thích hợp của EFA (chî số 0,5 < KMO
<1); Kaiser – Meyer - Olkin.
Kiểm đðnh tương quan giữa các biến: kiểm đðnh
Bartlett với Sig. < 0,05.
Kiểm đðnh mức độ giải thích (% cumulative variance –
phương sai trích) lớn hơn 50%
17
Tin học ứng dụng quản lý
Mô hình Phân tích nhân tố khám phá (EFA)
Qui trình (tt):
Bước 3: Phân tích hồi qui bội (Multi Regression
Linear).
Tương quan từng phần, mức ý nghïa của HSHQ Sig.<0,05
đều chînh: sử dụng
Mức độ phù hợp của mô hình R2 và R2 phân tích phương sai ANOVA Sig.<0,05
Hiện tượng đa cộng tuyến VIF < 10.
18
Tin học ứng dụng quản lý
9
12/30/2013
Kiểm đðnh thang đo
AnalyzeScale Reliability Analysis
Xuất hiện hình dưới vả đưa thang đo cần kiểm đðnh như
hình:
19
Tin học ứng dụng quản lý
Kiểm đðnh thang đo (tt)
Hệ số Cronbach Alpha >= 0,6 và tương quan
biến tổng ≥ 0,3
Nếu nhỏ hơn 0,6 ta loại bỏ biến ở bảng dưới
và thực hiện lại kiểm đðnh như ban đầu.
20
Tin học ứng dụng quản lý
10
12/30/2013
Phân tích nhân tố khám phá
AnalyzeDimension ReductionFactor
21
Tin học ứng dụng quản lý
Phân tích nhân tố khám phá (tt)
22
Tin học ứng dụng quản lý
11
12/30/2013
Phân tích nhân tố khám phá (tt)
23
Tin học ứng dụng quản lý
Phân tích nhân tố khám phá (tt)
24
Tin học ứng dụng quản lý
12
12/30/2013
Phân tích nhân tố khám phá (tt)
Cỡ mẫu
Giá trð chọn (Factor loading)
> 350
0,3
100 ≤ Cỡ mẫu ≤ 350
0,55
< 100
0,75
25
Tin học ứng dụng quản lý
Phân tích nhân tố khám phá (tt)
Dựa vào bảng Rotated Component Matrix để
trích nhân tố.
Kiểm đðnh tính thích hợp 0,5 < KMO < 1
Kiểm đðnh tương quan của các biến quan sát
trong thang đo (Bartlett với Sig. < 0,05).
Kiểm đðnh mức độ giải thích các biến đặc trưng đối với nhân tố (% Cumulative ≥ 50% - Phương sai trích).
26
Tin học ứng dụng quản lý
13
12/30/2013
Phân tích nhân tố khám phá (tt)
KMO = 0,891 thỏa mãn điều kiện: 0,5 < KMO < 1, phân tích nhân tố khám phá là thích hợp cho dữ liệu thực tế.
Kiểm đðnh Bartlett có Sig. = 0,000 < 0,05, các biến đặc trưng có tương quan tuyến tính với nhân tố đại diện.
27
Tin học ứng dụng quản lý
Phân tích nhân tố khám phá (tt)
Phương sai trích 63,6%. Điều này có nghïa 63,6% thay đổi của các nhân tố được giải thích bởi các biến quan sát.
28
Tin học ứng dụng quản lý
14
12/30/2013
Phân tích nhân tố khám phá (tt)
Trích được 4 nhân tố: mô hình 5
nhấn tố còn lại 4 nhân tố:
1. Cảm thông (EMP)
2. Phương tiện hữu hình (TAN)
3. Đáp ứng (RES)
4. Tin cậy (REL)
Bước tiếp theo là Phân tích hồi
qui bội.
29
Tin học ứng dụng quản lý
Phân tích hồi qui bội
Mô hình tổng thể: SAT = f(EMP, TAN, RES, REL)
Để thực hiện hồi qui:
Lấy trung bình hoặc tổng các thành phần.
Chạy mô hình hồi qui.
Phương trình hồi qui:
SAT = B0 + B1EMP + B2TAN + B3RES + B4REL
30
Tin học ứng dụng quản lý
15
12/30/2013
Kiểm đðnh hồi qui
AnalyzeRegressionLinear„
31
Tin học ứng dụng quản lý
Phân tích kiểm đðnh hồi qui
Chọn Save.
32
Tin học ứng dụng quản lý
16
12/30/2013
Phân tích kiểm đðnh hồi qui (tt)
Kiểm đðnh HSHQ: tất cả các biến đều có Sig. nhỏ hơn 0,05. Như vậy các biến tương quan có ý nghïa với SAT với độ tin cậy 95%.
33
Tin học ứng dụng quản lý
Phân tích kiểm đðnh hồi qui (tt)
Kiểm đðnh mức độ phù hợp của mô hình: R2 điều chînh là 0,594. Như vậy 59,4% thay đổi sự hài lòng củ KH được giải bởi các biến độc lập của mô hình.
34
Tin học ứng dụng quản lý
17
12/30/2013
Phân tích kiểm đðnh hồi qui (tt)
Mức độ phù hợp: Phân tích phương sai, với Sig. < 0,05 có thể kết luận rằng mô hình đưa ra phù hợp với dữ liệu thực tế.
35
Tin học ứng dụng quản lý
Phân tích kiểm đðnh hồi qui (tt)
Đa cộng tuyến: hệ số phương sai phóng đại VIF < 2, hiện tượng đa cộng tuyến không bð vi phạm.
36
Tin học ứng dụng quản lý
18
12/30/2013
Thảo luận kết quả hồi qui
Kết luận giả thuyết đưa ra: quan hệ dương
giữa các thành phần đến sự hài lòng.
Hệ số hồi qui chưa chuẩn hóa:
EMP: 0,135 (EMP tăng 1 thì hài lòng tăng 0,135)
TAN: 0,375 (TAN tăng 1 thì hài lòng tăng 0,375)
RES: 0,419 (RES tăng 1 thì hài lòng tăng 0,419)
REL: 0,199 (REL tăng 1 thì hài lòng tăng 0,199)
37
Tin học ứng dụng quản lý
Thống kê mô tả
Thống kê mô tả các biến:
AnalyzeDescriptive StatisticsFrequencies„
Hoặc
AnalyzeDescriptive StatisticsDescriptives„
Đổ bảng chéo:
AnalyzeDescriptive Statistics Crosstabs
38
Tin học ứng dụng quản lý
19
12/30/2013
Vẽ biểu đồ
Vẽ biểu đồ trong phần thống kê.
Vẽ biểu đồ với GraphsChart Builder„
39
Tin học ứng dụng quản lý
Kiểm đðnh tham số
Kiểm đðnh T-Test đối với tham số trung bình
của 2 nhóm độc lập:
H0: không có sự khác biệt về sự hài lòng của
khách hàng theo giới tính (nam – nữ).
Ha: Có sự khác nhau
AnalyzeCompare meansIndependent-Samples T Test
40
Tin học ứng dụng quản lý
20
12/30/2013
Kiểm đðnh tham số (tt)
41
Tin học ứng dụng quản lý
Kiểm đðnh tham số (tt)
Kết quả: nếu thống kê Levence Sig. > 0,05 thì khẳng đðnh giả đðnh phương sai đồng nhất, khi đó các giá trð thống kê (T-Test) tham chiếu theo dòng Equal Variances Assumed và ngược lại.
Trong trường hợp này, kiểm đðnh Levence với F=0,84 và Sig.=0,36> α =0,05 nên khẳng đðnh phương sai đồng nhất.
Sig. (2-tailed) = 0,928 > 0,05 nên khẳng đðnh không
có sự khác nhau về sự hài lòng theo giới tính.
42
Tin học ứng dụng quản lý
21
12/30/2013
Kiểm đðnh tham số (tt)
Kiểm đðnh ANOVA: kiểm đðnh sự khác nhau
trung bình có hơn 2 nhóm trở lên.
Giả thuyết H0: Không có sự khác biệt về hài lòng
theo Nghề nghiệp
Ha: Có sự khác nhau
AnalyzeCompare meansOne-Way Anova„
43
Tin học ứng dụng quản lý
Kiểm đðnh tham số (tt)
44
Tin học ứng dụng quản lý
22
12/30/2013
Kiểm đðnh tham số (tt)
Bảng Test of Homogenetiny of Variances Sig.=0,554 không có sự khác nhau phương sai đồng nhất.
Bảng ANOVA có Sig.=0,487 > 0,05. Có thể kết luận không có sự khác biệt hay chấp nhập giả thuyết H0.
45
Tin học ứng dụng quản lý
Thanks for Listening Cám ơn đã lắng nghe
46
Tin học ứng dụng quản lý
23