intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Giáo trình Phân tích thống kê cơ bản trong quản lý xây dựng bằng SPSS: Phần 1

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:87

8
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Giáo trình "Phân tích thống kê cơ bản trong quản lý xây dựng bằng SPSS" Phần 1 cung cấp cho người học những kiến thức như: Giới thiệu thống kê và SPSS; Thu thập và xử lý số liệu; Phân tích thống kê mô tả; Kiểm định mối liên hệ giữa hai biến định tính. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Giáo trình Phân tích thống kê cơ bản trong quản lý xây dựng bằng SPSS: Phần 1

  1. PGS.TS. HÀ DUY KHÁNH (chủ biên) ThS. NGUYỄN THANH TÚ, TS. NGUYỄN VĂN MINH GIÁO TRÌNH PHÂN TÍCH THỐNG KÊ CƠ BẢN TRONG QUẢN LÝ XÂY DỰNG BẰNG SPSS
  2. Chịu trách nhiệm biên soạn và liên hệ: PGS.TS. Hà Duy Khánh Bộ môn Thi công và Quản lý Xây dựng Khoa Xây dựng Trường Đại học Sư phạm Kỹ thuật TP. Hồ Chí Minh Email: khanhhd@hcmute.edu.vn 2
  3. LỜI NÓI ĐẦU Trong những năm vừa qua, ngành Quản lý xây dựng (QLXD) đã và đang phát triển rất mạnh mẽ ở Việt Nam. Nhiều trường đại học kỹ thuật ở Việt Nam đã mở các chuyên ngành đào tạo về QLXD cả bậc Đại học và Cao học. Trong thực tế, tư duy thống kê là nền tảng cho các quyết định về thực hiện và quản lý dự án xây dựng trước, trong và sau khi triển khai dự án. Trong đào tạo ngành QLXD, phân tích thống kê là công cụ quan trọng giúp người học tìm ra các kết quả và kết luận cho vấn đề đặt ra. Hiện nay, nhu cầu đào tạo ngành QLXD đang có sức hút rất mạnh mẽ. Có thể liệt kê một số trường ở khu vực phía Nam có đào tạo ngành QLXD (hoặc Kinh tế xây dựng) gồm Trường Đại học Bách Khoa – ĐHQG TP.HCM, Trường Đại học Sư phạm Kỹ thuật TP.HCM, Trường Đại học Kiến trúc TP.HCM, Trường Đại học Giao thông Vận tải TP.HCM, Trường Đại học Mở TP.HCM và Trường Đại học Công nghệ TP.HCM (HUTECH). Tuy nhiên, số lượng giáo trình liên quan đến phân tích thống kê còn rất hiếm. Với mong muốn đem đến một tài liệu phục vụ công tác nghiên cứu, dạy và học, nhóm tác giả đã dành tâm huyết và thời gian để viết cuốn sách này. Điều khác biệt trong cuốn sách này đó là các bài toán thực hành liên quan rất chặt chẽ đến một vài vấn đề thực tế của quản lý dự án xây dựng. Hy vọng những nội dung trong cuốn sách sẽ đem lại nguồn tri thức mới cho những ai đang cần, đặc biệt là sinh viên và học viên cao học ngành QLXD. Nhóm tác giả viết sách gồm PGS.TS. Hà Duy Khánh, ThS. Nguyễn Thanh Tú và TS. Nguyễn Văn Minh. Vai trò của các tác giả trong cuốn sách như sau: PGS.TS. Hà Duy Khánh, chủ biên viết tất cả các chương; ThS. Nguyễn Thanh Tú và TS. Nguyễn Văn Minh tham gia chỉnh sửa, góp ý và hoàn thiện cuốn sách. Đây là phiên bản đầu tiên của cuốn sách nên nội dung có thể tồn tại những hạn chế và thiếu sót, nhóm tác giả rất mong nhận được sự đóng góp chân thành của người đọc. Mọi thắc mắc, vui lòng liên hệ PGS.TS. Hà Duy Khánh, Khoa Xây dựng, Trường Đại học Sư phạm Kỹ thuật TP. Hồ Chí Minh. Trân trọng cám ơn ./. Nhóm tác giả 3
  4. 4
  5. LỜI GIỚI THIỆU Cuốn sách này cung cấp các phân tích thống kê cơ bản trong ngành QLXD bằng sử dụng phần mềm SPSS (Statistical Package for the Social Sciences). Có hai loại thống kê được trình bày trong cuốn sách gồm thống kê mô tả và thống kê suy luận. Riêng thống kê suy luận chỉ tập trung vào kiểm định mối liên hệ giữa các biến. Cấu trúc của sách gồm 8 chương: - Chương 1: Giới thiệu thống kê và SPSS - Chương 2: Thu thập và xử lý số liệu - Chương 3: Phân tích thống kê mô tả - Chương 4: Kiểm định mối liên hệ giữa hai biến định tính - Chương 5: Kiểm định mối liên hệ giữa biến định tính với biến định lượng - Chương 6: Kiểm định phi tham số - Chương 7: Phân tích tương quan - Chương 8: Phân tích hồi quy tuyến tính Nội dung của từng chương được viết theo logic: giới thiệu tóm tắt lý thuyết, sau đó trình bày thực hành với các bước phân tích (kèm hình ảnh từ SPSS) cho một ví dụ cụ thể, và cuối cùng là diễn giải kết quả. Tổng cộng có 11 ví dụ trong nội dung giáo trình và 6 bài tập làm thêm kèm đáp án (số liệu được cung cấp trong đĩa CD đính kèm). Các số liệu làm ví dụ trong cuốn sách được nhóm tác giả sưu tầm và giả định. Ngoài ra, nội dung cuốn sách có tham khảo một vài nguồn dữ liệu trên Internet và giáo trình khác. 5
  6. 6
  7. MỤC LỤC LỜI NÓI ĐẦU .......................................................................................... 3 LỜI GIỚI THIỆU ......................................................................................5 DANH MỤC CÁC BẢNG BIỂU, HÌNH ẢNH ........................................ 9 CHƯƠNG 1: GIỚI THIỆU THỐNG KÊ VÀ SPSS ...................................................... 11 1.1. Tổng quan về thống kê .................................................................. 11 1.2. Giới thiệu SPSS ............................................................................. 17 1.3. Khai báo biến và nhập liệu trong SPSS......................................... 19 1.4. Thay đổi mặc định ban đầu trong SPSS ........................................ 23 1.5. Tóm tắt chương ............................................................................. 34 CHƯƠNG 2: THU THẬP VÀ XỬ LÝ SỐ LIỆU ......................................................... 35 2.1. Dữ liệu là gì? ................................................................................. 35 2.2. Phân loại dữ liệu ............................................................................ 36 2.3. Các loại thang đo ........................................................................... 37 2.3.1. Thang đo danh nghĩa ............................................................. 37 2.3.2. Thang đo thứ bậc ................................................................... 38 2.3.3. Thang đo khoảng cách ........................................................... 38 2.3.4. Thang đo tỷ lệ ........................................................................ 40 2.4. Xác định kích thước mẫu .............................................................. 40 2.5. Nguyên tắc mã hóa và nhập liệu ................................................... 42 2.6. Những điều bất thường của số liệu và giải pháp phòng ngừa ....... 43 2.6.1. Những điều bất thường của số liệu ........................................ 43 2.6.2. Giải pháp phòng ngừa sai sót................................................. 45 2.6.3. Các phương pháp làm sạch số liệu ........................................ 46 2.7. Tóm tắt chương ............................................................................. 49 CHƯƠNG 3: PHÂN TÍCH THỐNG KÊ MÔ TẢ ......................................................... 50 3.1. Bảng tần suất ................................................................................. 50 3.2. Đại lượng mô tả ............................................................................. 52 3.3. Lập bảng tần suất kết hợp với các đại lượng thống kê mô tả ........ 56 3.4. Đồ thị ............................................................................................. 60 3.5. Công cụ Explore ............................................................................ 64 3.6. Tóm tắt chương ............................................................................. 67 BÀI TẬP THỰC HÀNH ......................................................................... 67 7
  8. CHƯƠNG 4: KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH ................ 68 4.1. Kiểm định mối liên hệ giữa hai biến: định danh-định danh, hoặc định danh-thứ bậc ....................................................................... 70 4.1.1. Lý thuyết về kiểm định Chi-square ....................................... 70 4.1.2. Sử dụng SPSS để thực hiện kiểm định Chi-square................ 72 4.1.3. Một số trị số thống kê khác để kiểm định mối liên hệ giữa hai biến định danh.................................................................... 77 4.2. Kiểm định mối liên hệ giữa hai biến thứ bậc ................................ 81 4.2.1. Kiểm định Gamma của Goodman và Kruskal ....................... 83 4.2.2. Kiểm định d của Somer ......................................................... 83 4.2.3. Kiểm định Tau của Kendall ................................................... 84 4.3. Tóm tắt chương ............................................................................. 86 BÀI TẬP THỰC HÀNH ......................................................................... 87 CHƯƠNG 5: KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA BIẾN ĐỊNH TÍNH VÀ BIẾN ĐỊNH LƯỢNG ........................................................................................ 88 5.1. Kiểm định trị trung bình của tổng thể ........................................... 88 5.1.1. Trường hợp một tổng thể ....................................................... 89 5.1.2. Trường hợp có hai tổng thể trở lên ........................................ 92 5.2. Phân tích phương sai của tổng thể................................................. 99 5.2.1. Phân tích phương sai một yếu tố ......................................... 100 5.2.2. Phân tích phương sai hai yếu tố ........................................... 108 5.3. Tóm tắt chương ........................................................................... 113 BÀI TẬP THỰC HÀNH ....................................................................... 114 CHƯƠNG 6: KIỂM ĐỊNH PHI THAM SỐ ................................................................ 115 6.1. Kiểm định dấu ............................................................................. 117 6.2. Kiểm định dấu và hạng Wilcoxon ............................................... 120 6.3. Kiểm định Mann-Whitney .......................................................... 123 6.4. Kiểm định Kruskal-Wallis .......................................................... 126 6.5. Kiểm định Chi-square ................................................................. 128 6.6. Kiểm định Kolmogorov-Smirnov ............................................... 131 6.7. Kiểm định tỷ lệ ............................................................................ 133 6.8. Tóm tắt chương ........................................................................... 136 BÀI TẬP THỰC HÀNH ....................................................................... 137 8
  9. CHƯƠNG 7: PHÂN TÍCH TƯƠNG QUAN .............................................................. 138 7.1. Giới thiệu chung .......................................................................... 138 7.2. Phân tích tương quan đơn biến .................................................... 139 7.2.1. Giới thiệu về tương quan Pearson ....................................... 139 7.2.2. Một số đặc điểm của hệ số tương quan ............................... 140 7.2.3. Kiểm định giả thuyết về tương quan ................................... 141 7.2.4. Thực hiện phân tích trên SPSS ............................................ 142 7.3. Phân tích tương quan xếp hạng ................................................... 145 7.4. Tóm tắt chương ........................................................................... 147 BÀI TẬP THỰC HÀNH ....................................................................... 148 CHƯƠNG 8: PHÂN TÍCH HỒI QUY TUYẾN TÍNH ............................................... 149 8.1. Giới thiệu chung .......................................................................... 149 8.2. Hồi quy tuyến tính đơn biến ........................................................ 150 8.2.1. Các giả định của phân tích hồi quy...................................... 154 8.2.2. Sai số khi ước lượng hồi quy cho tổng thể .......................... 155 8.2.3. Đánh giá độ phù hợp của mô hình hồi quy .......................... 156 8.2.4. Kiểm tra tính hợp lệ của các giả định cần thiết ................... 163 8.3. Hồi quy tuyến tính đa biến .......................................................... 168 8.4. Tóm tắt chương ........................................................................... 174 BÀI TẬP THỰC HÀNH ....................................................................... 175 TÀI LIỆU THAM KHẢO ..................................................................... 176 PHỤ LỤC 1 ........................................................................................... 177 PHỤ LỤC 2 ........................................................................................... 178 SỐ LIỆU VÀ ĐÁP ÁN BÀI TẬP THỰC HÀNH ................................ 178 Đáp án Chương 3: Thống kê mô tả đối tượng nghiên cứu ................ 179 Đáp án Chương 4: Kiểm định mối liên hệ giữa hai biến định tính .............................................................................................. 181 Đáp án Chương 5: Kiểm định mối liên hệ giữa biến định tính và biến định lượng ............................................................................. 184 Đáp án Chương 6: Kiểm định phi tham số ........................................ 187 Đáp án Chương 7: Phân tích tương quan ........................................... 190 Đáp án Chương 8: Phân tích hồi quy tuyến tính ................................ 193 9
  10. DANH MỤC CÁC BẢNG BIỂU, HÌNH ẢNH (Ngoài chương trình Excel và SPSS) • Danh mục bảng biểu: Bảng 1.1. Giá đất Thành phố Thủ Đức ........................................... 11 Bảng 2.1. Một số sản phẩm công nghiệp chủ yếu năm 2018 ......... 12 Bảng 6.1. Phạm vi thay thế của các kiểm định ............................ 116 Bảng 7.1. Tóm tắt các đặc điểm của phân tích tương quan .......... 138 Bảng 8.1. Một số đặc điểm của hồi quy tuyến tính ...................... 149 • Danh mục hình ảnh: Hình 1.1. Tuổi thọ theo giới tính của Ireland và EU ...................... 13 Hình 2.1. Hai chiều hướng phân tích thống kê ............................... 35 Hình 2.2. Phân loại dữ liệu ............................................................. 37 Hình 4.1. Quy tắt bác bỏ giả thuyết rỗng ........................................ 77 Hình 5.1. Hai phân phối có hình dạng khác nhau ........................... 93 Hình 7.1. Chiều hướng bác bỏ giả thuyết rỗng .............................. 142 Hình 8.1. Đồ thị thể hiện phương pháp bình phương cực tiểu ...... 151 Hình 8.2. Giả định phương sai cân bằng ....................................... 154 Hình 8.3. Minh họa giải thích về R2 .............................................. 157 10
  11. CHƯƠNG 1: GIỚI THIỆU THỐNG KÊ VÀ SPSS Chương này giúp người học hiểu được vai trò và ý nghĩa của phân tích thống kê trong kỹ thuật và trong xã hội. Nội dung bao gồm giới thiệu tổng quan về thống kê và các giao diện của SPSS nhằm giúp người đọc có cái nhìn tổng quan tốt hơn trước khi bắt đầu. Kết quả phân tích thống kê thực sự đúng và có ý nghĩa khi người nghiên cứu hiểu đúng bản chất của vấn đề nghiên cứu, mục đích của các công cụ phân tích và ý nghĩa của từng kết quả. 1.1. Tổng quan về thống kê Để hiểu về thống kê, hãy đọc các ví dụ bên dưới và trả lời các câu hỏi: Ví dụ 1: Số liệu giá đất của Thành phố Thủ Đức từ năm 2015 đến năm 2019 được trình bày như Bảng 1.1 bên dưới. Bảng 1.1. Giá đất Thành phố Thủ Đức [1] ĐVT: 1,000 đồng/m2 Đoạn đường STT Tên đường Giá Từ Đến Đường số 5, Bà Ranh tỉnh Bình 1 Quốc lộ 1K 3,700 Giang Dương Ranh Quân 2 Bình Chiểu Tỉnh lộ 43 3,700 đoàn 4 3 Đường số 14 Linh Trung Quốc lộ 1 3,700 4 Cây Keo Tô Ngọc Vân Cuối đường 4,800 5 Chương Dương Võ Văn Ngân Kha Vạn Cân 6,600 Dương Văn 6 Đặng Thị Rành Tô Ngọc Vân 6,600 Cam 7 Đặng Văn Bi Võ Văn Ngân Nguyễn Văn Bá 7,000 Ranh tỉnh Bình 8 Đào Trinh Nhất Kha Vạn Cân 4,400 Dương Ngã Ba Hồ Văn 9 Đoàn Công Hớn Võ Văn Ngân Tư 8,400 10 Đường số 19 Kha Vạn Cân Cuối đường 4,800 1. Phương pháp thu thập là gì? Công cụ nào để phân tích? Số liệu được trình bày dưới dạng nào? 11
  12. 2. Giá đất của đường Đặng Văn Bi là bao nhiêu và có đặc điểm vị trí gì? 3. Giá đất trung bình của 10 tuyến đường? 4. Nhận xét và diễn giải sự khác nhau giữa giá đất trung bình và giá đất của 01 tuyến đường bất kỳ? Gợi ý trả lời: 1. Phương pháp: khảo sát thống kê. Công cụ phân tích: giá trị trung bình. Số liệu trình bày: dưới dạng bảng. 2. Giá đất đường Đặng Văn Bi: 7 triệu đồng/m2. Đường Đặng Văn Bi tiếp giáp hai đầu là đường Võ Văn Ngân và đường Nguyễn Văn Bá. Đặc điểm đường này là một trong số các đường chính của trung tâm TP. Thủ Đức với nhiều cửa hàng, đơn vị sản xuất kinh doanh nên có giá đất cao hơn một số tuyến đường khác. 3. Giá đất trung bình của 10 tuyến đường là: 5.08 triệu đồng/m2. 4. Giả sử chọn Đường số 19, Phường Hiệp Bình Chánh có giá đất trung bình là 4.8 triệu đồng/m2. Đây cũng là một tuyến đường nhánh trên Đại lộ Phạm Văn Đồng, chủ yếu phục vụ cho mục đích ở, ít sản xuất kinh doanh nên giá đất thấp hơn các tuyến đường khác. Tuy nhiên, tuyến đường này gần Sân bay Tân Sơn Nhất (cách khoảng 8km) và dễ di chuyển qua các Quận khác. Chênh lệch so với giá đất trung bình: 280,000 đồng/m2 (5.5%). Ví dụ 2: Chỉ số tiêu thụ một số sản phẩm công nghiệp của yếu của Việt Nam năm 2018 được thể hiện trong Bảng 2.1. Bảng 2.1. Một số sản phẩm công nghiệp chủ yếu năm 2018 [2] (+/-) % so Tên sản phẩm ĐVT 2018 với 2017 Đá xây dựng các loại 1,000 m3 205.5 11.5% Sữa hoặc kem đặc có hoặc không có 1,000 tấn 101.7 2.4% đường Bia chai, lon triệu lít 1,660.2 4.9% Thuốc lá điếu triệu bao 2,119.7 10.8% Quần áo các loại trừ quần áo thể thao triệu cái 1,662.3 6.8% Sổ sách, vở, giấy và các sản phẩm 1,000 tấn 12.4 22.6% bằng giấy Bột giặt và các chế phẩm dùng để tẩy 1,000 tấn 554.2 16.0% rửa Xi măng 1,000 tấn 9,532.1 6.4% 12
  13. (+/-) % so Tên sản phẩm ĐVT 2018 với 2017 Sắt, thép các loại 1,000 tấn 455.5 28.2% Ti vi 1,000 tấn 12,913.6 32.0% Điện thương phẩm triệu Kwh 24,414.9 7.9% Nước uống triệu m3 675.5 7.7% Phân khoáng hoặc phân hóa học 1,000 tấn 243.2 -24.3% 1. Cho biết mức tiêu thụ và đơn vị tính của đá, xi măng và sắt thép xây dựng? 2. Nhận xét về mức tiêu thụ này? Dự báo xu thế tương lai? 3. Phương pháp tính mức tiêu thụ này? Gợi ý trả lời: 1. Mức tiêu thụ và đơn vị tính của đá, xi măng và sắt thép lần lượt là 205,500 tấn, 9,532,100 tấn và 455,500 tấn. 2. Nhận xét về mức tiêu thụ: đá tăng 11.5%, xi măng tăng 6.4% và sắt thép các loại tăng 28.2%. Như vậy, trong các mức tăng thì sắt thép các loại có mức độ tiêu thụ tăng nhiều nhất. Dự báo mức tiệu thụ trong tương lai: chưa thể dự báo được do nguồn số liệu chỉ có 2 năm. 3. Phương pháp tính mức tiêu thụ: tính chênh lệch giữa 2 năm liền kề 2017 và 2018, được tính dưới dạng phần trăm (%). Ví dụ 3: Hãy xem Hình 1.1 và trả lời các câu hỏi bên dưới: Tuổi thọ (Life expectancy) 86.0 84.0 82.0 80.0 78.0 76.0 74.0 2006 2008 2010 2012 2014 2016 EU 28 - Nam EU 28 - Nữ Ireland - Nam Ireland - Nữ Hình 1.1. Tuổi thọ theo giới tính của Ireland và EU [3] 1. Tuổi thọ (life expectancy) giữa EU và Ireland? 13
  14. 2. Giữa nam và nữ của Ireland? 3. Năm 2017 liệu tuổi thọ có tăng lên không? Gợi ý trả lời: 1. Tuổi thọ giữa EU và Ireland có sự tương đồng cao về nam giới, nhưng giữa nữ giới thì có sự khác biệt rõ rệt. 2. Riêng Ireland, tuổi thọ của nữ giới cao hơn so với nam giới. Sự khác biệt này có xu hướng giảm dần từ năm 2007 chênh lệch khoảng 5 năm đến năm 2016 giảm xuống khoảng 3.5 năm. 3. Năm 2017, dự báo sẽ tăng vì theo số liệu quá khứ từ năm 2007 đến năm 2016 có xu hướng tăng rõ rệt. Độ tăng đối với nam giới EU là (78.1-76)/10 = 0.21 năm và nữ giới EU là (83.5-82.2)/10 = 0.13 năm. Độ tăng đối với nam giới Ireland là (80-77.2)/10 = 0.28 năm và nữ giới Ireland giống với nữ giới EU. Nhìn nhận chung, độ tăng về tuổi thọ của nam giới lớn hơn so với nữ giới cho cả EU và Ireland. Tuy nhiên, độ tăng này sẽ đạt đến một ngưỡng nhất định do tuổi thọ con người không thể nào không có giới hạn. Nhờ phân tích thống kê, các ví dụ trên đã cung cấp cho chúng ta các thông tin của vấn đề nghiên cứu như giá trị trung bình, độ lệch, giá trị lớn nhất, giá trị nhỏ nhất, phần trăm, và xu hướng liên hệ (thuận chiều hay nghịch chiều). Cụ thể, nếu không có phân tích thống kê, chúng ta không biết được giá trị trung bình của các tuyến đường ở Thành phố Thủ Đức ở Ví dụ 1, hoặc không có tính phần trăm thì chúng ta đâu biết được mức tiêu thụ của năm 2018 tăng hay giảm so với năm 2017 ở Ví dụ 2, hoặc không có thể hiện đồ thị thì chúng ta không thể nhìn ra được xu hướng tăng của tuổi thọ, thậm chí là không thấy được mức độ khác nhau giữa tuổi thọ của EU và Ireland. Như vậy, thông qua các ví dụ trên, thống kê là gì? Thống kê là một phương pháp phân tích sử dụng các công thức toán học bên trong để xử lý và biểu diễn dữ liệu theo một thể thức khoa học nhất định. Ngoài ra, nó cũng là một môn khoa học cơ bản trong khối kiến thức khoa học tự nhiên và xã hội giúp tìm hiểu về dữ liệu, sau đó tính toán, giải thích và trình bày cho một vấn đề nghiên cứu cụ thể ở cả mức độ học thuật và thực tiễn. Cho đến nay, phân tích thống kê đã và đang được sử dụng trong nhiều lĩnh vực kỹ thuật và xã hội khác nhau. Nhờ có thống kê, chúng ta có thể tìm ra các lỗ hổng và các vấn đề phức tạp trong quá trình thực hiện và vận hành công việc. Trên cơ sở đó, chúng ta đưa ra các nghiên cứu để cải thiện tình hình, đặc biệt là trong giai đoạn cần đưa ra các quyết định tiềm ẩn các 14
  15. yếu tố rủi ro. Để phân tích thống kê đạt yêu cầu, chúng ta cần phải: hiểu rõ lý do vì sao phải thực hiện thống kê trước khi thực hiện, xây dựng mô hình thống kê gồm những biến (hay yếu tố) nào, xác định các điều kiện của phân tích thống kê đã lựa chọn, định nghĩa và phân loại số liệu, diễn đạt các kết quả phân tích, và cuối cùng kiểm tra độ phù hợp giữa kết quả phân tích với thực tiễn. Có nhiều trường hợp cho thấy có sự khác biệt đáng kể, thậm chí rất lớn, giữa kết quả thống kê và kết quả thực tế. Chúng ra cần cẩn trọng với những sự khác biệt này. Chúng ta chỉ có thể đưa ra kết luận có ý nghĩa về mặt thống kê nhưng không đưa ra được kết luận có ý nghĩa thực tiễn. Từ đó, chúng ra có những kết luận đúng đắn cho vấn đề nghiên cứu. Thống kê gồm hai loại là thống kê mô tả (descriptive statistics) và thống kê suy luận (inferential statistics). Thống kê mô tả là loại thống kê giúp chúng ra có những kết luận bên ngoài cho vấn đề nghiên cứu. Những kết luận này, chúng ra có thể cảm nhận trực quan và đo lường được. Trong khi đó, thống kê suy luận là loại thống kê giúp chúng ta có những kết luận bên trong cho vấn đề nghiên cứu. Những kết luận này, chúng ra không thể cảm nhận trực quan được nhưng có thể đo lường được dựa vào những công cụ thống kê phù hợp. Có 4 mức thống kê cơ bản thường được sử dụng tùy theo mức độ yêu cầu của người phân tích: (1) thu thập và xử lý số liệu, (2) phân tích và trình bày các kết quả mô tả, (3) kiểm định các mối liên hệ (hay hiện tượng) giữa các sự kiện (hay yếu tố), và (4) ứng dụng dự báo. - Mức 1 "Thu thập và xử lý số liệu": Mức này thường hay được sử dụng trong hầu hết các phân tích thống kê. Để có thể tiến hành phân tích thống kê, chúng ta cần phải có dữ liệu của vấn đề nghiên cứu. Dữ liệu này cần phải có tính đại diện cho tất cả đối tượng khảo sát (hay còn gọi là quần thể). Để đảm bảo tính đại diện, việc thu thập dữ liệu phải đảm bảo ba nguyên tắc sau: cỡ mẫu đủ lớn, lấy mẫu ngẫu nhiên, và có tính khách quan. Tuy nhiên, khi vấn đề nghiên cứu phức tạp hoặc ít phổ biến, rất khó để đảm bảo lấy mẫu có tính đại diện, đặc biệt khó đảm bảo được số lượng mẫu. Một số trường hợp, thậm chí không thu thập được số liệu, hoặc thu thập được nhưng lại không đảm bảo được điều kiện phân tích, hoặc phân tích được nhưng lại không đáp ứng được mục tiêu đề ra. Có hai phương pháp lấy mẫu là lấy mẫu xác suất (probability sampling) và lấy mẫu phi xác suất hay còn gọi là lấy mẫu thuận tiện (non-probability sampling). Lấy mẫu xác suất là lấy mẫu đảm bảo tính ngẫu nhiên và khách quan cho tất cả đối tượng khảo sát của quần thể. Ngược lại, lấy mẫu phi xác suất không đảm bảo điều này. Trong điều kiện 15
  16. ở Việt Nam cũng như nhiều nước trên thế giới, lấy mẫu phi xác suất vẫn còn được chấp nhận vì những lý do nhất định, đặc biệt là do sự quen biết lẫn nhau và để nhanh có số liệu. Những kết luận có được từ phân tích số liệu trên nhóm mẫu này có thể suy luận ra cho quần thể ở mức tin cậy thống kê cao. Tuy nhiên, do đặc điểm lấy mẫu thuận tiện nên đôi khi kết luận chỉ phản ánh nhận định chủ quan. Điều này gây ra hiện tượng sai lệch (bias) giữa kết luận từ thống kê so với thực tiễn. - Mức 2 "Phân tích và trình bày các kết quả mô tả": Từ các số liệu có được sau khi thu thập, chúng ta có thể thấy được kết quả bằng nhìn nhận trực quan hoặc bằng các công cụ thống kê mô tả đơn giản. Thống kê mô tả thường được sử dụng cho dù vấn đề nghiên cứu ít hay rất phức tạp bởi tính trực quan của kết quả. Để thực hiện thống kê mô tả, chúng ta chỉ cần làm các phép toán khá đơn giản như cộng, đếm, tính tần suất, phần trăm... Nhắc lại, với các kết quả thống kê mô tả, chúng ta chỉ có thể đưa ra các kết luận bên ngoài của vấn đề nghiên cứu. - Mức 3 "Kiểm định mối liên hệ giữa các sự kiện (hay yếu tố)": Kiểm định này ở mức độ chuyên sâu trong phân tích thống kê. Các sự kiện trong thực tế thường xảy ra do chúng có tính chất liên quan với nhau. Cụ thể, sự xảy ra của sự kiện này phụ thuộc vào sự xảy ra hoặc tác động của sự kiện kia. Đó được gọi là mối liên hệ giữa hai sự kiện. Nếu sự xảy ra của sự kiện này có sự tương đồng với sự xảy ra của sự kiện kia, người ta gọi mối liên hệ này là có tính tương quan (correlative relationship). Nếu sự xảy ra của sự kiện này bị phụ thuộc vào sự tác động của sự kiện kia, người ta gọi mối liên hệ này có tính nhân quả (causal relationship). Để đo lường mối liên hệ giữa các sự kiện, người ta sử dụng hai đại lượng là mức độ (coefficient) và chiều hướng (direction). Xác định đúng mối liên hệ cố hữu giữa các sự kiện, sẽ cho chúng ta những kết luận thú vị và đúng đắn. - Mức 4 "Ứng dụng dự báo": Ở mức 3, dựa trên số liệu quá khứ, nếu đã xác định đúng mối liên hệ giữa các sự kiện đảm bảo ở mức ý nghĩa thống kê có kiểm chứng thực tiễn thì mối liên hệ này được gọi là quy luật. Mối liên hệ giữa chúng càng chặt chẽ (tức ở mức độ cao và cùng chiều hướng) thì khả năng ứng dụng để dự báo sự xảy ra về sau của sự kiện càng cao. Một điều bắt buộc nữa để đảm bảo dự báo phù hợp là giữa hai sự kiện phải có tính nhân quả. Trong nhiều lĩnh vực kỹ thuật và xã hội, việc đưa ra một dự đoán chính 16
  17. xác luôn là một nhu cầu cần thiết. Dựa vào kết quả dự đoán chúng ta dễ dàng hơn để đưa ra những quyết sách ở tương lai. Ngày nay, các thông tin thống kê trong lĩnh vực khoa học kỹ thuật và khoa học xã hội gần như sẵn có bởi có sự quản lý của các cơ quan nhà nước và doanh nghiệp bằng các công nghệ thu thập, xử lý và phân tích tiên tiến. Tuy nhiên, để đánh giá đúng bản chất của sự vật hay hiện tượng trong quá trình thực hiện, công tác thống kê luôn không ngừng cập nhật và đổi mới. Đặc biệt trong thời kỳ phát triển nhanh của khoa học và công nghệ, các vấn đề nghiên cứu có sử dụng thống kê càng trở nên phức tạp. Do đó, các nhà nghiên cứu và quản lý cần phải có khả năng hiểu được thông tin từ thống kê và sử dụng nó một cách hiệu quả. Từ đây có thể thấy, tư duy thống kê kết hợp với kinh nghiệm thực hành sẽ giúp chúng ta nắm bắt nhanh hơn các hiện tượng, từ đó dễ dàng hơn khi đưa ra các quyết định phù hợp về sau. 1.2. Giới thiệu SPSS SPSS (Statistical Package for the Social Sciences) là phần mềm phân tích thống kê phổ biến của công ty IBM (2009). Giá bản quyền của SPSS là 99$/tháng và từ 1,290$ đến 5,730$/năm (tùy phiên bản sử dụng). Bên cạnh SPSS còn có các phần mềm phổ biến như Minitab, RStudio, JMP, OriginPro... SPSS là một chương trình máy tính phục vụ công tác phân tích thống kê. SPSS được tạo ra với mục đích phân tích dữ liệu khoa học ứng dụng trong lĩnh vực khoa học xã hội. Nhưng dần về sau, SPSS không dừng lại ở đó mà đã được ứng dụng rộng rãi trong các các nghiên cứu điều tra xã hội học, kinh tế lượng, nghiên cứu thị trường và kỹ thuật quản lý. Hiện nay, trên thị trường có khoảng 70 phần mềm phân tích thống kê khác nhau chẳng hạn như Minitab, EVIEW, STATA, Base SAS, OriginPro, AMOS... Đối với ngành QLXD nói riêng và đối với các ngành kinh tế kỹ thuật nói chung, SPSS đã là phần mềm phân tích thống kê được ưa chuộng nhiều vì các thao tác đơn giản và giao diện dễ nhìn. Các công cụ phân tích thống kê trong SPSS bao gồm các phân tích từ cơ bản đến nâng cao. Tùy vào mục đích nghiên cứu mà chọn công cụ phân tích cho phù hợp. Ở Việt Nam, các nhà quản lý và nghiên cứu trong ngành xây dựng thường dùng SPSS như là phần mềm hữu ích để điều tra và phân tích các vấn đề liên quan đến dự án từ lúc hình thành, triển khai và vận hành. Đặc biệt, đối với đào tạo sau đại học về QLXD, nó là công cụ dường như không thể thiếu trong các luận văn và luận án. Vấn đề khó khăn nhất khi sử dụng SPSS đó là nó đòi hỏi người sử dụng phải am hiểu tường tận các lý thuyết về kiểm định và thống kê trước khi sử dụng. 17
  18. SPSS có nhiều chức năng chính trong việc xử lý và phân tích dữ liệu bao gồm: • Nhập và làm sạch dữ liệu. • Xử lý các biến đổi và quản lý các dữ liệu đó. • Tổng hợp dữ liệu và trình bày chủ yếu dưới các dạng bảng và đồ thị. • Phân tích dữ liệu, tính toán các tham số thống kê và diễn giải kết quả. Khi mở chương trình SPSS lên, xuất hiện cửa sổ sau: • Open an existing data source: mở nguồn dữ liệu sẵn có. • Open another type of file: mở một loại file khác. • Run the tutorial: chạy hướng dẫn sử dụng. • Type in data: loại dữ liệu. • Run an existing query: chạy thảo luận hiện hữu. • Creata new query using Database Wizard: tạo một thảo luận mới sử dụng thuật toán cơ sở dữ liệu. Các hình thức mở file dữ liệu ở trên thuận tiện và nhanh hơn cho người sử dụng. Tuy nhiên nó thường gây nhầm lẫn. Do đó, lời khuyên là người 18
  19. sử dụng nên chọn Cancel nếu việc nhập dữ liệu là lần đầu. Khi đó, giao diện mặc định khi mở SPSS ra như sau: Mỗi cột là một biến Thanh công cụ Dòng nhập Giao giữa cột và dữ liệu dòng là vùng nhập và hiển thị số liệu • Data view: cửa sổ xem dữ liệu nhập (màn hình mở mặc định của chương trình). • Variable view: cửa sổ xem thông tin của tất cả các biến. 1.3. Khai báo biến và nhập liệu trong SPSS - Chọn cửa sổ Variable View: Các thuộc tính của biến Mỗi dòng tương ứng 01 biến - Name: tên biến, nên đặt không quá 8 ký tự, không có ký hiệu đặc biệt, và viết liền không có khoảng trống. - Type: kiểu biến, mặc định sau khi đặt tên xong chương trình sẽ chọn kiểu định lượng bằng số (numberic). Nếu muốn thay đổi, click vào ô và chọn các kiểu biến phù hợp. Comma = dấu phẩy, dot = dấu chấm, scientific notation = ký hiệu khoa học, date = ngày, dollar = đô-la, custom currency = đơn vị tiền tệ tự chọn, string = chuỗi, và restricted number (integer with leading zero) = số theo quy định (phần nguyên làm tròn). 19
  20. - Width: độ rộng của biến, là số ký tự tối đa có thể nhập. Mặc định là 8 ký tự. - Decimal Places: số lẻ sau dấu chấm chia cách phần nguyên và thập phân. Mặc định là 2. Lưu ý, theo thông lệ quốc tế, dấu cách giữa các phần nghìn là dấu phẩy, dấu cách giữa phần nguyên và thập phân là dấu chấm. - Label: nhãn hiệu cho biến, nhãn cần phải đặt ngắn gọn nhằm giải thích rõ hơn cho tên gọi biến. - Values: Mặc định sau khi đặt xong tên là None, nhấp chuột vào ô và chọn nút bên phải sẽ xuất hiện hộp thoại khai báo: 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
10=>1