PHÂN TÍCH DỮ LIỆU

KIỂM ĐỊNH GIẢ THUYẾT, HỒI QUY

# Phân tích tương quan - 2 biến định lượng

- Mối liên quan giữa hai biến định lượng có thể

được biểu thị dưới dạng biểu đồ chấm và hệ số tương quan

- Nếu cả hai biến đều có phân bố chuẩn, thì hệ số

tương quan Pearson’s là có giá trị

- Nếu không, cần phải sử dụng hệ số tương quan

Spearman’s

- Từ thực đơn dọc chọn:

Analyse/Correlate/Bivariate

# Hệ số tương quan

Kiểm định trung bình tổng thể

# Kiểm định giả thuyết về trung bình

của một tổng thể:

Nếu muốn so sánh giá trị trung bình của

một tổng thể với một giá trị cụ thể nào đó, sử dụng One-sample T-test

- Vào menu, chọn Analyze/Compare

Means/ One-sample T-test

- Chọn biến đưa vào khung Test Variable - Khai báo Test Value

# Ví dụ: Kiểm định One-sample T-test

One-sample T-test

- Điều kiện áp dụng: Mẫu phải được chọn ngẫu nhiên hoặc tương

đương

Mẫu phải có phân phối xấp xỉ chuẩn hoặc

chuẩn

Kiểm định trung bình tổng thể

# Kiểm định giả thuyết về sự bằng nhau

giữa hai trung bình tổng thể:

Nếu muốn so sánh hai giá trị trung bình của hai tổng thể dựa trên hai mẫu độc lập, sử dụng Independent-Samples T-test - Vào menu, chọn Analyze/Compare

Means/ Independent-Samples T-test

Independent-Samples T-test

- Chọn biến định lượng đưa vào khung Test

Variable

- Chọn biến định tính (chia số quan sát thành 2

nhóm mẫu độc lập) đưa vào Grouping Variable

- Nhấn nút Define Groups để chỉ định hai

nhóm cần so sánh với nhau

- Nhấn nút Continue

Independent-Samples T-test

- Dựa vào kết quả kiểm định sự bằng nhau của

hai phương sai (Levene’s Test)

+ Nếu giá trị Sig. <0,05: sử dụng kết quả kiểm

định t ở cột Equal variances not assumed

+ Nếu giá trị Sig. >0,05: sử dụng kết quả kiểm

định t ở cột Equal variances assumed

Independent-samples T-test

- Điều kiện áp dụng: 2 mẫu phải được chọn ngẫu nhiên, có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn; không có các giá trị bất thường (outliers)

- Ví dụ

Kiểm định trung bình tổng thể

# Kiểm định giả thuyết về sự bằng nhau

giữa hai trung bình tổng thể:

Nếu muốn so sánh hai giá trị trung bình của

hai tổng thể dựa trên hai mẫu phụ thuộc hay mẫu phối hợp từng cặp, sử dụng Paired- samples T-test

- Vào menu, chọn Analyze/Compare Means/ Paired-Samples T-test

Paired-samples T-test

- Điều kiện áp dụng: Kích cỡ 2 mẫu so sánh bằng nhau hoặc tương

đương

Chênh lệch giữa các giá trị trung bình của 2 mẫu phải có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn

Kiểm định trung bình tổng thể

# Kiểm định giả thuyết về sự bằng nhau

giữa các trung bình tổng thể:

Nếu muốn so sánh giá trị trung bình của nhiều nhóm tổng thể độc lập, sử dụng phân tích phương sai ANOVA

- Phân tích phương sai 1 yếu tố (One-way

ANOVA): trường hợp sử dụng 1 biến yếu tố để phân loại các quan sát thành các nhóm khác nhau

Phân tích phương sai một yếu tố - One-way ANOVA

- Điều kiện áp dụng: + Các nhóm so sánh phải độc lập và được

chọn một cách ngẫu nhiên

+ Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để xem như xấp xỉ phân phối chuẩn

+ Phương sai của các nhóm so sánh phải đồng

nhất (bằng nhau)

One-way ANOVA (tt)

- Cách tiến hành: Từ menu, chọn Analyze/ Compare Means/

One-way ANOVA

Chọn biến định lượng đưa vào khung

Dependent List

Chọn biến phân loại xác định các nhóm cần so

sánh đưa vào khung Factor

Chọn Options; đánh dấu vào Descriptive và

Homogeneity-of-variance

- Ví dụ

- Phân tích sâu ANOVA

Kiểm định tỷ lệ tổng thể

- Sử dụng Chi-bình phương hoặc/và Binomial Test - Điều kiện: + Mẫu được chọn ngẫu nhiên + Biến nhị phân (chỉ có 2 tình huống). Nếu có nhiều hơn, nên dùng lệnh Recode để chuyển thành biến có 2 lựa chọn

Ví dụ: Sử dụng Binomial Test

• Ho: Tỷ lệ đánh giá hài lòng trở lên đối

với chuyến tham quan Đại Nội của toàn bộ khách nội địa là 80% • H1: Tỷ lệ này nhỏ hơn 80% - Chọn Analyze/ Nonparametric

tests/Binomial

- Ví dụ

Hồi quy tuyến tính

- Dùng để suy rộng cho mối quan hệ giữa

các biến trong tổng thể

- Dùng để dự báo được mức độ của biến phụ thuộc (Y) (với độ chính xác trong một phạm vi giới hạn) khi biết trước giá trị của biến độc lập (X)

Hồi quy đơn tuyến tính

• Mô hình xây dựng từ dữ liệu mẫu có

dạng: Y = Bo + B1 * X

Trong đó:

X: biến độc lập Y: biến phụ thuộc Bo & B1: Hệ số hồi quy

- Ví dụ: Doanh số = Bo + B1* Chi phí chào

hàng

Hồi quy đơn tuyến tính

• Cách xây dựng trong SPSS: - Vào menu, chọn Analyze/ Regression/Linear - Chọn biến phụ thuộc, đưa vào ô Dependent - Chọn biến độc lập, đưa vào ô Independents - Bấm OK

Ví dụ

Đánh giá độ phù hợp của mô hình

• Để biết mô hình hồi quy tuyến tính đã

xây dựng trên dữ liệu mẫu phù hợp đến mức độ nào với dữ liệu: sử dụng hệ số xác định R2

• Hệ số này càng gần 1: mô hình càng thích hợp; càng gần 0: mô hình càng kém phù hợp với tập dữ liệu mẫu

Đánh giá độ phù hợp của mô hình

• Hệ số xác định R2 còn đo lường mối

tương quan giữa X và Y

• Ví dụ: R2 = 0,818: mô hình hồi quy

tuyến tính đã xây dựng phù hợp với tập dữ liệu đến mức 81,8%. Hay 81,8% khác biệt của các giá trị Y quan sát được có thể được giải thích bởi sự khác biệt giữa các giá trị X

Kiểm định giả thuyết

• Để kiểm định độ phù hợp của mô hình hồi quy tổng thể, sử dụng đại lượng F từ bảng phân tích phương sai ANOVA

• Giả thuyết Ho:

Hệ số R2 của tổng thể = 0

Đọc kết quả: nếu p < mức ý nghĩa: bác bỏ

Ho và kết luận mô hình hồi quy tuyến tính xây dựng phù hợp với tổng thể

Kiểm định giả thuyết

• Để kiểm định ý nghĩa của hệ số hồi

quy:

• Ho: độ dốc của mô hình tổng thể B1 =0 • Cách đọc kết quả: sử dụng giá trị p-

value (Sig.) của kiểm định t

• Nếu p-value < mức ý nghĩa: bác bỏ Ho, kết luận giữa hai biến trong tổng thể có liên hệ tuyến tính

Ví dụ

Các giả định cần tuân thủ

• Các giá trị quan sát của X & Y có liên hệ

tuyến tính

• Phương sai của sai số không đổi • Phần dư phân phối chuẩn • Tính độc lập của sai số (không có tương

quan giữa các phần dư)