Hướng dẫn thực hành SPSS cơ bản

Chia sẻ: pimento670

Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được. Khi biến phụ thuộc ở dạng nhị phân ( hai biểu hiện 0 và 1) thì không thể phân tích với dạng hồi quy thông thường mà phải sử dụng hồi quy Binary Logistic.

Nội dung Text: Hướng dẫn thực hành SPSS cơ bản

Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung
SPSS 16.0


HỒI QUY BINARY LOGiSTIC

Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác
suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được. Khi biến
phụ thuộc ở dạng nhị phân ( hai biểu hiện 0 và 1) thì không thể phân tích với dạng hồi quy
thông thường mà phải sử dụng hồi quy Binary Logistic.

I. Cách thức tiến hành phân tích hồi quy Binary Logistic với SPSS

1. Vào menu Analyze  Regression  Binary Logistic, xuất hiện hộp thoại sau:




2. Đưa biến phụ thuộc Y dạng nhị phân vào ô dependent, và biến độc lập sang khung
Covariate.

3. Chọn phương pháp đưa biến vào (Method) tương tự như hồi quy tuyến tính thông
thường. Tuy nhiên điều kiện căn cứ trên số thống kê likelihood-ratio (tỷ lệ thích
hợp) hay số thống kê Wald.

Enter: đưa vào bắt buộc, các biến trong khối biến độc lập được đưa vào trong
-
một bước.

Forward: Conditional là phương pháp đưa dần vào theo điều kiện. Nó kiểm tra
-
việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên
những ước lượng thông số có điều kiện.

Forward: LR là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên
-
xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra
tối đa (maximum-likelihood estimates).

Forward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên
-
xác suất của số thống kê Wald.


1
Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung

Backward: Conditional là phương pháp loại trừ dần theo điều kiện. Nó kiểm tra
-
việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên
những ước lượng thông số có điều kiện.

Backward: LR là phương pháp loại trừ dần vào kiểm tra việc loại biến căn cứ
-
trên xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy
ra tối đa.

Backward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên
-
xác suất của số thống kê Wald.

Stepwise: hồi quy từng bước, số thống kê được sử dụng cho các biến được đưa
-
vào và loại ra căn cứ trên số thống kê Likelihood-ratio, hay số thống kê Wald.

4. Để hiện đồ thị phân loại giá trị thật và giá trị dự báo của biến phụ thuộc, chọn
Option, chọn Classification plots trong phần Statistics and plots. Click Continue trở
về hộp thoại đầu tiên.




5. Muốn tính được giá trị dự đoán, là xác suất mà một đối tượng sẽ … (biến phụ
thuộc Y), ta chọn Predict value trong hộp thoại Save. Chọn Continue  Ok để thực
hiện lệnh.




2
Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung

II. Cách thức đọc kết quả phân tích hồi quy Binary Logistic

Ví dụ: sử dụng phương pháp đưa biến vào mặc định là Enter. Phân tích mức độ ảnh
hưởng của sự hài lòng về 4 dịch vụ đến mức độ hài lòng chung về điểm đến khi đi du lịch
của du khách.

Y: mức độ hài lòng chung về điểm đến (0: không hài lòng, 1: hài lòng)

X1  X4: mức độ hài lòng về 4 dịch vụ (tương tự như phần hồi quy tuyến tính)

Thực hiện các bước trên để tiến hành phân tích. Kết quả xuất hiện với rất nhiều
bảng. Ta sẽ chú ý phân tích các bảng sau:


Bảng 1. Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 1 Step 178.459 4 .000

Block 178.459 4 .000

Model 178.459 4 .000

Ở bảng 1, ta đọc kết quả kiểm định H0: β1 = β2 = … = βk = 0. Kiểm định này xem
xét khả năng giải thích biến phụ thuộc của tổ hợp biến độc lập.
Kết quả ở bảng 1 cho thấy độ phù hợp tổng quát có mức ý nghĩa quan sát sig. =
0,000 nên ta bác bỏ H0. Nghĩa là tổ hợp liên hệ tuyến tính của toàn bộ các hệ số trong mô
hình có ý nghĩa trong việc giải thích cho biến phụ thuộc.

Bảng 2. Model Summary

Cox & Snell R Nagelkerke R
Step -2 Log likelihood Square Square

26.793a
1 .595 .769

a. Estimation terminated at iteration number 6 because
parameter estimates changed by less than .001.

Bảng 2 thể hiện kết quả độ phù hợp của mô hình. Khác với hồi quy tuyến tính
thông thường hệ số R2 càng lớn thì mô hình càng phù hợp, hồi quy Binary Logistic sử dụng
chỉ tiêu -2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình. -2LL càng nhỏ càng
thể hiện độ phù hợp cao. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số) khi đó mô
hình có độ phù hợp hoàn hảo.
Kết quả bảng 2 cho thấy giá trị của -2LL = 26,472 không cao lắm, như vậy nó thể
hiện một độ phù hợp khá tốt của mô hình tổng thể.




3
Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung

Bảng 3. Classification Tablea

Predicted

Satisfied dummy Percentage
Observed Dissatisfied Satisfied Correct

Step 1 Satisfied dummy Dissatisfied 51 49 51.0

Satisfied 22 389 94.6

Overall Percentage 86.1

a. The cut value is .500

Mức độ chính xác cũng được thể hiện ở bảng 3, bảng này cho thấy trong 73 trường h ợp
không hài lòng về điểm đến (xem theo cột) mô hình đã d ự đoán đúng 49 tr ường h ợp (xem theo
hàng), vậy tỷ lệ đúng là 51%. Còn với 438 trường hợp hài lòng v ề đi ểm đ ến, mô hình d ự đoán
sai 22 trường hợp, tỷ lệ đúng là 94,6%. Từ đó ta tính đ ược t ỷ l ệ d ự đoán đúng c ủa toàn b ộ mô
hình là 86,1%.

Bảng 4. Variables in the Equation

B S.E. Wald df Sig. Exp(B)

Step 1a Satisfied with Accom 1.567 .255 37.812 1 .000 4.794

Satisfied with Food .435 .249 3.051 1 .031 1.546

Satisfied with Shopping .672 .222 9.164 1 .002 1.959

Satisfied with Transp .918 .228 16.273 1 .000 2.505

Constant -11.737 1.347 75.891 1 .000 .000

a. Variable(s) entered on step 1: Q3.2.a, Q3.2.f, Q3.2.s, Q3.2.t.



Bảng 4 thể hiện kết quả của kiểm định Wald (kiểm định giả thuyết hồi quy khác
không). Nếu hệ số hồi quy B0 và B1 đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ
bằng 1, tức xác suất để sự kiện xảy ra hay không xảy ra như nhau, lúc đó mô hình hồi quy
không có tác dụng dự đoán.
Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuy ết H 0: βk=0.
Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm
định ý nghĩa thống kê của hệ số hồi quy tổng thể.
Kết quả bảng 4 cho thấy mức độ hài lòng về 4 dịch vụ có giá trị p (sig.) nhỏ hơn
mức ý nghĩa α = 0,05  bác bỏ H0. Như vậy các hệ số hồi quy tìm được có ý nghĩa và mô
hình được sử dụng tốt.




Từ các hệ số hồi quy này ta viết được phương trình:
4
Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung




Diễn giải ý nghĩa của các hệ số hồi quy Binary Logistic như sau:
Mức độ hài lòng về 4 dịch vụ đều làm tăng mức độ hài lòng chung về điểm
đến , trong đó hài lòng về DV lưu trú tác động mạnh nhất. Cụ thể tác động biên
của mức độ hài lòng về DV lưu trú lên mức độ hài lòng chung với xác suất ban
đầu = 0,5 thì tác động này bằng 0,5(1-0,5)1,57 = 0,3925.


VẬN DỤNG MÔ HÌNH HỒI QUY BINARY LOGISTIC CHO MỤC ĐÍCH DỰ BÁO

Mô hình hồi quy Binary Logistic có thể được áp dụng để dự báo khả năng trả nợ
khi đối tượng đi vay hay dự báo nhu cầu sử dụng một sản phẩm cụ thể nào đó. Ta s ử
dụng công thức sau:




5
Đề thi vào lớp 10 môn Toán |  Đáp án đề thi tốt nghiệp |  Đề thi Đại học |  Đề thi thử đại học môn Hóa |  Mẫu đơn xin việc |  Bài tiểu luận mẫu |  Ôn thi cao học 2014 |  Nghiên cứu khoa học |  Lập kế hoạch kinh doanh |  Bảng cân đối kế toán |  Đề thi chứng chỉ Tin học |  Tư tưởng Hồ Chí Minh |  Đề thi chứng chỉ Tiếng anh
Theo dõi chúng tôi
Đồng bộ tài khoản