CHƯƠNG 8 PHÂN TÍCH DỮ LIỆU

ThS. Nguyễn Tiến Dũng Bộ môn Quản trị Kinh doanh, Viện Kinh tế và Quản lý Website: https://sites.google.com/site/nguyentiendungbkhn Email: dung.nguyentien3@hust.edu.vn

Các nội dung chính

8.1 Chuẩn bị dữ liệu 8.2 Phân tích thống kê 8.3 Diễn giải kết quả phân tích thống kê 8.4 Bàn luận về kết quả NC

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

2

8.1 Chuẩn bị dữ liệu

● Mã hoá bản câu hỏi ● Sàng lọc dữ liệu ● Đánh số bản câu hỏi ● Nhập dữ liệu vào máy tính ● Làm sạch file dữ liệu

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

3

Mã hoá bản câu hỏi

● (Coding): gán các con số cho các phương án trả lời ● Bạn là sinh viên ngành:  Kỹ thuật  Kinh tế  Khác ● Bạn là sinh viên ngành: 1. Kỹ thuật 2. Kinh tế 3. Khác

● Mã hoá được thực hiện trước và sau khi phỏng vấn.

● Câu hỏi đóng: thực hiện trước PV ● Câu hỏi mở: phân loại trả lời rồi mã hóa

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

4

Sàng lọc dữ liệu

● Loại bỏ các BCH không đạt yêu cầu về chất lượng ● Đọc soát và sàng lọc hàng ngày ● Trong khâu sàng lọc dữ liệu, cần phải:

● Kiểm tra DL khuyết (missing data): các câu hỏi không có trả lời ● Kiểm tra tính logic của các trả lời

● Loại bỏ các BCH

● Có nhiều DL khuyết ● Trả lời giống nhau ● Trả lời không logic, tùy ý

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

5

Đánh số bản câu hỏi

● Chỉ đánh số những bản câu hỏi có chất lượng đạt yêu cầu,

tức là được giữ lại sau quá trình sàng lọc dữ liệu. ● Cách đơn giản nhất là đánh số liên tục từ 1 đến hết. ● Phân tổ theo địa bàn hoặc tiêu chí khác để dễ quản lý

● 001-100: Hà Nội ● 101-200: TPHCM

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

6

Nhập và lưu dữ liệu vào máy tính

● Khởi tạo file dữ liệu mới trong phần mềm SPSS / Excel ● Định nghĩa các biến số: tên biến, kiểu biến, bậc đo lường, các phương án

trả lời, dữ liệu khuyết ….

● Nhập các trả lời trong các bản câu hỏi đã sàng lọc vào máy tính. Để đảm bảo tránh sai sót, tốt nhất là nên có 2 người: 1 người nhập, 1 người khác rà soát lại file dữ liệu của người đã nhập.

● Sau khi nhập khoảng 5 bản câu hỏi, nhớ cất (Save) file dữ liệu đề phòng

bị mất dữ liệu.

● Cất file dữ liệu thành nhiều phiên bản khác nhau. Thí dụ, file dữ liệu lưu lần đầu thì cất với tên là data_ver1.sav, sau khi nhập được 5 bản câu hỏi nữa thì lưu thành data_ver2.sav (.sav là phần mở rộng của tên file dữ liệu trong SPSS) và tương tự.

● Sao lưu file dữ liệu ra một phương tiện lưu trữ khác ngoài ổ cứng

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

7

Tạo file dữ liệu trong Excel (đối với khảo sát bằng bản câu hỏi) ● Cột 1: Số thứ tự ● Các cột là các biến số ● Các hàng là các BCH đã thu về ● Câu hỏi chỉ chọn 1 trả lời: 1 câu hỏi là 1 biến

số

● Câu hỏi có thể chọn nhiều trả lời: phải tạo nhiều biến số ⇨ số lượng biến số = số phương án trả lời có thể chọn, mỗi biến sẽ nhận 1 trong 2 giá trị là 0 hoặc 1. ● Giá trị của biến số được xác định theo quy tắc mã

hoá và đặc điểm câu hỏi đã thiết kế

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

8

Tạo file dữ liệu trong SPSS

● Tab Variable View

● Hàng: biến  tạo các biến số ● Cột: đặc điểm của biến

● Tab “Data View”

● Hàng: quan sát, BCH ● Cột: biến

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

9

Làm sạch file dữ liệu

● Mục đích

● Tìm ra và loại bỏ các sai sót trong quá trình nhập dữ liệu vào máy tính

● Phương pháp:

● Thống kê tần số: phát hiện các giá trị bất thường ● Tạo bảng liên hợp 2 biến số: Cross-tab, Pivot  phát hiện các giá trị

bất thường

● Thực hiện với phần mềm

● SPSS: Frequencies, Cross-tabs ● Excel: CountIf, Data Analysis (Histogram), Pivot Table

● Phòng bệnh hơn chữa bệnh

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

10

8.2 Phân tích thống kê

● Thống kê mô tả:

● Dữ liệu mẫu => rút ra kết luận về mẫu ● Bao gồm:

● TK tần số và tỷ lệ phần trăm ● TK giá trị TB và độ lệch chuẩn, min, max: các đại lượng đặc trưng cho độ tập trung và phân tán của dữ liệu mẫu

● Thống kê suy diễn

● Dữ liệu mẫu => muốn rút ra kết luận về tổng thể

(giả định: mẫu đại diện cho tổng thể) ● Bao gồm: kiểm định các giả thuyết NC

● CLDV (+)  SHL ● SHL (+) -> STrT

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

11

Thực hiện phân tích thống kê trong Excel

● Dùng các lệnh có sẵn trong Excel: TK mô tả

● Tần số: COUNTIF(), SUMIF() ● Giá trị TB: AVERAGE() ● Độ lệch chuẩn: STDEV()

● Lập bảng kết hợp nhiều biến (cross-tabs) thể hiện mối liên hệ giữa 2 biến số (2 biến định tính hoặc 1 biến định tính và 1 biến định lượng) ● Excel: Pivot Table

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

12

Thực hiện phân tích thống kê trong Excel (tiếp)

● Phát hiện và khẳng định mối liên hệ giữa các

biến số: X và Y ● X và Y có DL kiểu định lượng: PT tương quan

hoặc PT hồi quy ● Tương quan: CORREL(x, y) ● Hồi quy: y = b0 + b1.x ⇨ Vẽ đồ thị Scatter và “Add

Trendline”

● Dùng công cụ hỗ trợ (macro) cài thêm vào

Excel (Add-ins) để tăng cường khả năng phân tích dữ liệu: ● Data Analysis ● MegaStat

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

13

Thống kê suy diễn

● Mục đích:

● Suy ra đặc điểm của tổng thể từ thông tin có được trên

mẫu ● TB mẫu ⇨ TB tổng thể ● Tỷ lệ mẫu ⇨ Tỷ lệ tổng thể ● TD: Kiểm định mối liên hệ giữa CLDV và sự hài lòng của KH

trên mẫu ⇨ CLDV và sự hài lòng của KH trên tổng thể

● PT trên toàn bộ mẫu và so sánh các nhóm trong cùng

một mẫu

● Đòi hỏi phải đặt giả thuyết và kiểm định giả

thuyết

● Xem thêm ở môn học “Thống kê ứng dụng”

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

14

Trình tự phân tích thống kê

● Phân tích đặc điểm của mẫu: tổng số, cơ cấu của mẫu theo giới tính, độ tuổi, học vấn, nghề, thu nhập …

● Phân tích thống kê mô tả với các biến số tương

ứng với các nhóm câu hỏi trong bản câu hỏi ● Hành vi: làm gì, mua gì, ở đâu, khi nào, ● Nhận thức và thái độ: biết, hiểu như thế nào, mức độ

ưa thích, hài lòng,

● Ý định tương lai: sẽ như thế nào ● Kiểm định các giả thuyết NC ● Đã đặt ra trong mô hình NC

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

15

8.3 Diễn giải kết quả phân tích thống kê

● Máy tính và phần mềm thống kê không thể trợ

giúp việc diễn giải

● Ngôn ngữ đơn giản, đời thường ● Không nhắc lại số liệu trong bảng / hình ● Nêu hình mẫu, xu thế nổi bật của bảng / hình

● Cái gì lớn nhất, nhỏ nhất ● Cái gì tăng/giảm nhiều nhất ● Cái gì chiếm tỷ trọng lớn nhất/bé nhất …

● Nêu ý nghĩa ● Tốt hay xấu? ● Cao hay thấp?

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

16

Thí dụ: Diễn giải kết quả PTTK đối với biến định danh

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

17

Thí dụ: Diễn giải kết quả PTTK đối với biến thứ bậc

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

18

Thí dụ: Diễn giải kết quả PTTK đối với biến định lượng

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

19

8.4 Bàn luận về kết quả NC

● (Discussion on research results) ● Cần nói về ý nghĩa của kết quả NC ● So với lý thuyết ● So với các NC tương tự, gần đây ● Những điểm tương đồng và khác nhau

● Tần số, tỷ lệ phần trăm, giá trị TB tính ra như vậy là cao, TB hay thấp? ● Giá trị của Độ lệch chuẩn như vậy là lớn, bình thường hay nhỏ? ● Tương tự hay khác với lý thuyết, với các NC đã có? ● Nếu có sự khác nhau thì đâu có thể là nguyên nhân? ● Đòi hỏi phải rà soát lại phần Cơ sở lý thuyết và Tổng quan tình

hình NC ● Xem lại và đối chiếu với kết quả của các NC gần đây

© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

20