Hướng dẫn thực hành SPSS cơ bản

Chia sẻ: pimento670

Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được. Khi biến phụ thuộc ở dạng nhị phân ( hai biểu hiện 0 và 1) thì không thể phân tích với dạng hồi quy thông thường mà phải sử dụng hồi quy Binary Logistic.

Nội dung Text: Hướng dẫn thực hành SPSS cơ bản

 

  1. Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung SPSS 16.0 HỒI QUY BINARY LOGiSTIC Hồi quy Binary Logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được. Khi biến phụ thuộc ở dạng nhị phân ( hai biểu hiện 0 và 1) thì không thể phân tích với dạng hồi quy thông thường mà phải sử dụng hồi quy Binary Logistic. I. Cách thức tiến hành phân tích hồi quy Binary Logistic với SPSS 1. Vào menu Analyze  Regression  Binary Logistic, xuất hiện hộp thoại sau: 2. Đưa biến phụ thuộc Y dạng nhị phân vào ô dependent, và biến độc lập sang khung Covariate. 3. Chọn phương pháp đưa biến vào (Method) tương tự như hồi quy tuyến tính thông thường. Tuy nhiên điều kiện căn cứ trên số thống kê likelihood-ratio (tỷ lệ thích hợp) hay số thống kê Wald. Enter: đưa vào bắt buộc, các biến trong khối biến độc lập được đưa vào trong - một bước. Forward: Conditional là phương pháp đưa dần vào theo điều kiện. Nó kiểm tra - việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện. Forward: LR là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên - xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa (maximum-likelihood estimates). Forward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên - xác suất của số thống kê Wald. 1
  2. Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung Backward: Conditional là phương pháp loại trừ dần theo điều kiện. Nó kiểm tra - việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện. Backward: LR là phương pháp loại trừ dần vào kiểm tra việc loại biến căn cứ - trên xác suất của số thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa. Backward: Wald là phương pháp đưa dần vào kiểm tra việc loại biến căn cứ trên - xác suất của số thống kê Wald. Stepwise: hồi quy từng bước, số thống kê được sử dụng cho các biến được đưa - vào và loại ra căn cứ trên số thống kê Likelihood-ratio, hay số thống kê Wald. 4. Để hiện đồ thị phân loại giá trị thật và giá trị dự báo của biến phụ thuộc, chọn Option, chọn Classification plots trong phần Statistics and plots. Click Continue trở về hộp thoại đầu tiên. 5. Muốn tính được giá trị dự đoán, là xác suất mà một đối tượng sẽ … (biến phụ thuộc Y), ta chọn Predict value trong hộp thoại Save. Chọn Continue  Ok để thực hiện lệnh. 2
  3. Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung II. Cách thức đọc kết quả phân tích hồi quy Binary Logistic Ví dụ: sử dụng phương pháp đưa biến vào mặc định là Enter. Phân tích mức độ ảnh hưởng của sự hài lòng về 4 dịch vụ đến mức độ hài lòng chung về điểm đến khi đi du lịch của du khách. Y: mức độ hài lòng chung về điểm đến (0: không hài lòng, 1: hài lòng) X1  X4: mức độ hài lòng về 4 dịch vụ (tương tự như phần hồi quy tuyến tính) Thực hiện các bước trên để tiến hành phân tích. Kết quả xuất hiện với rất nhiều bảng. Ta sẽ chú ý phân tích các bảng sau: Bảng 1. Omnibus Tests of Model Coefficients Chi-square df Sig. Step 1 Step 178.459 4 .000 Block 178.459 4 .000 Model 178.459 4 .000 Ở bảng 1, ta đọc kết quả kiểm định H0: β1 = β2 = … = βk = 0. Kiểm định này xem xét khả năng giải thích biến phụ thuộc của tổ hợp biến độc lập. Kết quả ở bảng 1 cho thấy độ phù hợp tổng quát có mức ý nghĩa quan sát sig. = 0,000 nên ta bác bỏ H0. Nghĩa là tổ hợp liên hệ tuyến tính của toàn bộ các hệ số trong mô hình có ý nghĩa trong việc giải thích cho biến phụ thuộc. Bảng 2. Model Summary Cox & Snell R Nagelkerke R Step -2 Log likelihood Square Square 26.793a 1 .595 .769 a. Estimation terminated at iteration number 6 because parameter estimates changed by less than .001. Bảng 2 thể hiện kết quả độ phù hợp của mô hình. Khác với hồi quy tuyến tính thông thường hệ số R2 càng lớn thì mô hình càng phù hợp, hồi quy Binary Logistic sử dụng chỉ tiêu -2LL (-2 log likelihood) để đánh giá độ phù hợp của mô hình. -2LL càng nhỏ càng thể hiện độ phù hợp cao. Giá trị nhỏ nhất của -2LL là 0 (tức là không có sai số) khi đó mô hình có độ phù hợp hoàn hảo. Kết quả bảng 2 cho thấy giá trị của -2LL = 26,472 không cao lắm, như vậy nó thể hiện một độ phù hợp khá tốt của mô hình tổng thể. 3
  4. Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung Bảng 3. Classification Tablea Predicted Satisfied dummy Percentage Observed Dissatisfied Satisfied Correct Step 1 Satisfied dummy Dissatisfied 51 49 51.0 Satisfied 22 389 94.6 Overall Percentage 86.1 a. The cut value is .500 Mức độ chính xác cũng được thể hiện ở bảng 3, bảng này cho thấy trong 73 trường h ợp không hài lòng về điểm đến (xem theo cột) mô hình đã d ự đoán đúng 49 tr ường h ợp (xem theo hàng), vậy tỷ lệ đúng là 51%. Còn với 438 trường hợp hài lòng v ề đi ểm đ ến, mô hình d ự đoán sai 22 trường hợp, tỷ lệ đúng là 94,6%. Từ đó ta tính đ ược t ỷ l ệ d ự đoán đúng c ủa toàn b ộ mô hình là 86,1%. Bảng 4. Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 1a Satisfied with Accom 1.567 .255 37.812 1 .000 4.794 Satisfied with Food .435 .249 3.051 1 .031 1.546 Satisfied with Shopping .672 .222 9.164 1 .002 1.959 Satisfied with Transp .918 .228 16.273 1 .000 2.505 Constant -11.737 1.347 75.891 1 .000 .000 a. Variable(s) entered on step 1: Q3.2.a, Q3.2.f, Q3.2.s, Q3.2.t. Bảng 4 thể hiện kết quả của kiểm định Wald (kiểm định giả thuyết hồi quy khác không). Nếu hệ số hồi quy B0 và B1 đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ bằng 1, tức xác suất để sự kiện xảy ra hay không xảy ra như nhau, lúc đó mô hình hồi quy không có tác dụng dự đoán. Đối với hồi quy tuyến tính sử dụng kiểm định t để kiểm định giả thuy ết H 0: βk=0. Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể. Kết quả bảng 4 cho thấy mức độ hài lòng về 4 dịch vụ có giá trị p (sig.) nhỏ hơn mức ý nghĩa α = 0,05  bác bỏ H0. Như vậy các hệ số hồi quy tìm được có ý nghĩa và mô hình được sử dụng tốt. Từ các hệ số hồi quy này ta viết được phương trình: 4
  5. Hướng dẫn thực hành SPSS cơ bản GV: Phạm Lê Hồng Nhung Diễn giải ý nghĩa của các hệ số hồi quy Binary Logistic như sau: Mức độ hài lòng về 4 dịch vụ đều làm tăng mức độ hài lòng chung về điểm đến , trong đó hài lòng về DV lưu trú tác động mạnh nhất. Cụ thể tác động biên của mức độ hài lòng về DV lưu trú lên mức độ hài lòng chung với xác suất ban đầu = 0,5 thì tác động này bằng 0,5(1-0,5)1,57 = 0,3925. VẬN DỤNG MÔ HÌNH HỒI QUY BINARY LOGISTIC CHO MỤC ĐÍCH DỰ BÁO Mô hình hồi quy Binary Logistic có thể được áp dụng để dự báo khả năng trả nợ khi đối tượng đi vay hay dự báo nhu cầu sử dụng một sản phẩm cụ thể nào đó. Ta s ử dụng công thức sau: 5
Theo dõi chúng tôi
Đồng bộ tài khoản