12/30/2013

TIN HỌC ỨNG DỤNG Chương 2: Phân tích dữ liệu với SPSS

Phan Minh Trung Trung tâm Tin học – Đại học An Giang Email: pmtrung@agu.edu.vn Website: http://staff.agu.edu.vn/pmtrung

1

Tin học ứng dụng quản lý

Nội dung

1

• Giới thiệu SPSS & Cài đặt

2

• Mã hoá dữ liệu, Khai báo biến, Nhập liệu, Xử lý,„

3

• Kiểm đðnh thang đo

4

• Mô hình phân tích nhân tố khám phá (EFA).

5

• Phân tích hồi qui.

• Thống kê mô tả (tạo bảng tần số, bảng thống kê một số đại lượng, vẽ đồ thð)

6

2

Tin học ứng dụng quản lý

1

12/30/2013

Giới thiệu SPSS  Viết tắt Statistical Package for the Social Sciences

 Sử dụng rộng rãi trong công tác thống kê kinh tế -

xã hội

 SPSS cung cấp một hệ thống quản lý dữ liệu và phân tích thống kê trong một môi trường đồ họa

 Dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng biểu, báo cáo được trình bày đẹp, linh hoạt

3

Tin học ứng dụng quản lý

Cài đặt SPSS

Cài đặt SPSS V20

4

Tin học ứng dụng quản lý

2

12/30/2013

Mã hóa dữ liệu & Nhập liệu

VD: ta có bảng dữ liệu như sau

Các biến

Giới tính Tuổi Nghề nghiệp

i

1 Nữ 19 Sinh viên

l

ả r t i

2 Nữ 32 Nhân viên

ờ ư g N

3 Nam 53 Về hưu

…. … … …..

n Nam 42 Khác

5

Tin học ứng dụng quản lý

Mã hóa dữ liệu & Nhập liệu

Ta qui ước như sau

Giới tính Tuổi Nghề nghiệp

1. Nam 2. Nữ 1. Từ 1 – 25 2. Từ 26 – 50 3. Trên 50 1. Sinh viên 2. Nhân viên văn phòng 3. Về hưu 4. Khác

6

Tin học ứng dụng quản lý

3

12/30/2013

Mã hóa dữ liệu & Nhập liệu

Giới tính Tuổi Nghề nghiệp

1 2 1 1

2 2 2 2

3 1 3 3

…. … … …..

n 1 2 4

7

Tin học ứng dụng quản lý

Ví dụ: Mã hóa bảng câu hỏi!

 Hãy mã hóa và nhập liệu cho bảng phỏng về đề tài nghiên cứu cứu “Các yếu tố ảnh hưởng đến sự hài lòng của khách hàng: trường hơp nghiên cứu ở Ngân hàng Nông nghiệp PTNT, chi nhánh TPHCM”. Trong đó bao gồm các biến độc lập, phụ thuộc, nhân khẩu học.

 Xem phụ lục 2.1

8

Tin học ứng dụng quản lý

4

12/30/2013

Mã hóa dữ liệu

TAN

REL

RES

ASS

EMP

SAT

INFO

SAT_1 SAT_2 SAT_3

TAN_1 TAN_2 TAN_3 TAN_4

INFO_1 INFO_2 INFO_3 INFO_4

RES_1 RES_2 RES_5 RES_4 RES_5

ASS_1 ASS_2 ASS_3 ASS_4 ASS_5 ASS_6 ASS_7

REL_1 REL_2 REL_3 REL_4 REL_5 REL_6 REL_7 REL_8

EMP_1 EMP_2 EMP_3 EMP_4 EMP_5 EMP_6 EMP_7 EMP_8 EMP_9

2. Từ 20 – 30 tuổi 4. Trên 50 tuổi

Mã hóa theo từng nhóm thành phần Thông tin cá nhân theo 1 nhóm và qui ước các con số khi nhập liệu: VD INFO_2 (Độ tuổi): 1. ≤ 20 3. Từ 31 – 50 tuổi

9

Tin học ứng dụng quản lý

Nhập liệu

 Để nhập dữ liệu nhanh ta thực hiện như sau:

 Nhập dữ liệu bằng Excel theo cột.

 Chuyển dòng thành cột.

 Kiểm tra dữ liệu.

 Chuyển dữ liệu qua SPSS:

 Khai báo biến đã mã hóa.

 Copy dữ liệu từ Excel qua SPSS.

10

Tin học ứng dụng quản lý

5

12/30/2013

Nhập liệu Excel

11

Tin học ứng dụng quản lý

Chuyển dòng thành cột

12

Tin học ứng dụng quản lý

6

12/30/2013

Kiểm tra dữ liệu bằng Filter trong Excel

13

Tin học ứng dụng quản lý

Khai báo biến bên SPSS

14

Tin học ứng dụng quản lý

7

12/30/2013

Giải thích giao diện khai báo biến.

Name

Tên biến, liên tục không có khoảng trắng

Kiểu dữ liệu (Số, chuỗi,…)

Type

Độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự tối đa

Width

Llượng số thập phân

Decimals

Nhãn biến (chú thích cho tên biến)

Label

Định nghĩa giá trị cho các biến.

Values

Khai báo giá trị khuyết

Missing

Độ rộng cột tên biến

Columns

Canh lề dữ liệu nhập trong cột.

Align

Measure

Loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc), Nominal (thang đo danh nghĩa), Scale (gồm cả Interval và Ratio).

Vai trò của biến

Role

15

Tin học ứng dụng quản lý

Xử lý biến„

 Đðnh nghïa giá trð cho các biến.

16

Tin học ứng dụng quản lý

8

12/30/2013

Mô hình Phân tích nhân tố khám phá (EFA)

 Qui trình phân tích nhân tố khám phá

(Exploratory Factor Analysis):  Bước 1: Kiểm đðnh chất lượng thang đo.

 Bước 2: Phân tích nhân tố khám phá (EFA).

 Kiểm đðnh tính thích hợp của EFA (chî số 0,5 < KMO

<1); Kaiser – Meyer - Olkin.

 Kiểm đðnh tương quan giữa các biến: kiểm đðnh

Bartlett với Sig. < 0,05.

 Kiểm đðnh mức độ giải thích (% cumulative variance –

phương sai trích) lớn hơn 50%

17

Tin học ứng dụng quản lý

Mô hình Phân tích nhân tố khám phá (EFA)

 Qui trình (tt):

 Bước 3: Phân tích hồi qui bội (Multi Regression

Linear).

 Tương quan từng phần, mức ý nghïa của HSHQ Sig.<0,05

đều chînh: sử dụng

 Mức độ phù hợp của mô hình R2 và R2 phân tích phương sai ANOVA Sig.<0,05

 Hiện tượng đa cộng tuyến VIF < 10.

18

Tin học ứng dụng quản lý

9

12/30/2013

Kiểm đðnh thang đo

 AnalyzeScale  Reliability Analysis

 Xuất hiện hình dưới vả đưa thang đo cần kiểm đðnh như

hình:

19

Tin học ứng dụng quản lý

Kiểm đðnh thang đo (tt)

 Hệ số Cronbach Alpha >= 0,6 và tương quan

biến tổng ≥ 0,3

 Nếu nhỏ hơn 0,6 ta loại bỏ biến ở bảng dưới

và thực hiện lại kiểm đðnh như ban đầu.

20

Tin học ứng dụng quản lý

10

12/30/2013

Phân tích nhân tố khám phá

 AnalyzeDimension ReductionFactor

21

Tin học ứng dụng quản lý

Phân tích nhân tố khám phá (tt)

22

Tin học ứng dụng quản lý

11

12/30/2013

Phân tích nhân tố khám phá (tt)

23

Tin học ứng dụng quản lý

Phân tích nhân tố khám phá (tt)

24

Tin học ứng dụng quản lý

12

12/30/2013

Phân tích nhân tố khám phá (tt)

Cỡ mẫu

Giá trð chọn (Factor loading)

> 350

0,3

100 ≤ Cỡ mẫu ≤ 350

0,55

< 100

0,75

25

Tin học ứng dụng quản lý

Phân tích nhân tố khám phá (tt)

 Dựa vào bảng Rotated Component Matrix để

trích nhân tố.

 Kiểm đðnh tính thích hợp 0,5 < KMO < 1

 Kiểm đðnh tương quan của các biến quan sát

trong thang đo (Bartlett với Sig. < 0,05).

 Kiểm đðnh mức độ giải thích các biến đặc trưng đối với nhân tố (% Cumulative ≥ 50% - Phương sai trích).

26

Tin học ứng dụng quản lý

13

12/30/2013

Phân tích nhân tố khám phá (tt)

 KMO = 0,891 thỏa mãn điều kiện: 0,5 < KMO < 1, phân tích nhân tố khám phá là thích hợp cho dữ liệu thực tế.

 Kiểm đðnh Bartlett có Sig. = 0,000 < 0,05, các biến đặc trưng có tương quan tuyến tính với nhân tố đại diện.

27

Tin học ứng dụng quản lý

Phân tích nhân tố khám phá (tt)

 Phương sai trích 63,6%. Điều này có nghïa 63,6% thay đổi của các nhân tố được giải thích bởi các biến quan sát.

28

Tin học ứng dụng quản lý

14

12/30/2013

Phân tích nhân tố khám phá (tt)

 Trích được 4 nhân tố: mô hình 5

nhấn tố còn lại 4 nhân tố:

1. Cảm thông (EMP)

2. Phương tiện hữu hình (TAN)

3. Đáp ứng (RES)

4. Tin cậy (REL)

 Bước tiếp theo là Phân tích hồi

qui bội.

29

Tin học ứng dụng quản lý

Phân tích hồi qui bội

 Mô hình tổng thể: SAT = f(EMP, TAN, RES, REL)

 Để thực hiện hồi qui:

 Lấy trung bình hoặc tổng các thành phần.

 Chạy mô hình hồi qui.

 Phương trình hồi qui:

SAT = B0 + B1EMP + B2TAN + B3RES + B4REL

30

Tin học ứng dụng quản lý

15

12/30/2013

Kiểm đðnh hồi qui

 AnalyzeRegressionLinear„

31

Tin học ứng dụng quản lý

Phân tích kiểm đðnh hồi qui

 Chọn Save.

32

Tin học ứng dụng quản lý

16

12/30/2013

Phân tích kiểm đðnh hồi qui (tt)

 Kiểm đðnh HSHQ: tất cả các biến đều có Sig. nhỏ hơn 0,05. Như vậy các biến tương quan có ý nghïa với SAT với độ tin cậy 95%.

33

Tin học ứng dụng quản lý

Phân tích kiểm đðnh hồi qui (tt)

 Kiểm đðnh mức độ phù hợp của mô hình: R2 điều chînh là 0,594. Như vậy 59,4% thay đổi sự hài lòng củ KH được giải bởi các biến độc lập của mô hình.

34

Tin học ứng dụng quản lý

17

12/30/2013

Phân tích kiểm đðnh hồi qui (tt)

 Mức độ phù hợp: Phân tích phương sai, với Sig. < 0,05 có thể kết luận rằng mô hình đưa ra phù hợp với dữ liệu thực tế.

35

Tin học ứng dụng quản lý

Phân tích kiểm đðnh hồi qui (tt)

 Đa cộng tuyến: hệ số phương sai phóng đại VIF < 2, hiện tượng đa cộng tuyến không bð vi phạm.

36

Tin học ứng dụng quản lý

18

12/30/2013

Thảo luận kết quả hồi qui

 Kết luận giả thuyết đưa ra: quan hệ dương

giữa các thành phần đến sự hài lòng.

 Hệ số hồi qui chưa chuẩn hóa:

 EMP: 0,135 (EMP tăng 1 thì hài lòng tăng 0,135)

 TAN: 0,375 (TAN tăng 1 thì hài lòng tăng 0,375)

 RES: 0,419 (RES tăng 1 thì hài lòng tăng 0,419)

 REL: 0,199 (REL tăng 1 thì hài lòng tăng 0,199)

37

Tin học ứng dụng quản lý

Thống kê mô tả

 Thống kê mô tả các biến:

AnalyzeDescriptive StatisticsFrequencies„

Hoặc

AnalyzeDescriptive StatisticsDescriptives„

 Đổ bảng chéo:

AnalyzeDescriptive Statistics Crosstabs

38

Tin học ứng dụng quản lý

19

12/30/2013

Vẽ biểu đồ

 Vẽ biểu đồ trong phần thống kê.

 Vẽ biểu đồ với GraphsChart Builder„

39

Tin học ứng dụng quản lý

Kiểm đðnh tham số

 Kiểm đðnh T-Test đối với tham số trung bình

của 2 nhóm độc lập:

 H0: không có sự khác biệt về sự hài lòng của

khách hàng theo giới tính (nam – nữ).

 Ha: Có sự khác nhau

AnalyzeCompare meansIndependent-Samples T Test

40

Tin học ứng dụng quản lý

20

12/30/2013

Kiểm đðnh tham số (tt)

41

Tin học ứng dụng quản lý

Kiểm đðnh tham số (tt)

 Kết quả: nếu thống kê Levence Sig. > 0,05 thì khẳng đðnh giả đðnh phương sai đồng nhất, khi đó các giá trð thống kê (T-Test) tham chiếu theo dòng Equal Variances Assumed và ngược lại.

 Trong trường hợp này, kiểm đðnh Levence với F=0,84 và Sig.=0,36> α =0,05 nên khẳng đðnh phương sai đồng nhất.

 Sig. (2-tailed) = 0,928 > 0,05 nên khẳng đðnh không

có sự khác nhau về sự hài lòng theo giới tính.

42

Tin học ứng dụng quản lý

21

12/30/2013

Kiểm đðnh tham số (tt)

 Kiểm đðnh ANOVA: kiểm đðnh sự khác nhau

trung bình có hơn 2 nhóm trở lên.

 Giả thuyết H0: Không có sự khác biệt về hài lòng

theo Nghề nghiệp

 Ha: Có sự khác nhau

AnalyzeCompare meansOne-Way Anova„

43

Tin học ứng dụng quản lý

Kiểm đðnh tham số (tt)

44

Tin học ứng dụng quản lý

22

12/30/2013

Kiểm đðnh tham số (tt)

 Bảng Test of Homogenetiny of Variances Sig.=0,554 không có sự khác nhau phương sai đồng nhất.

 Bảng ANOVA có Sig.=0,487 > 0,05. Có thể kết luận không có sự khác biệt hay chấp nhập giả thuyết H0.

45

Tin học ứng dụng quản lý

Thanks for Listening Cám ơn đã lắng nghe

46

Tin học ứng dụng quản lý

23