CHƯƠNG 8 PHÂN TÍCH DỮ LIỆU
ThS. Nguyễn Tiến Dũng Bộ môn Quản trị Kinh doanh, Viện Kinh tế và Quản lý Website: https://sites.google.com/site/nguyentiendungbkhn Email: dung.nguyentien3@hust.edu.vn
Các nội dung chính
8.1 Chuẩn bị dữ liệu 8.2 Phân tích thống kê 8.3 Diễn giải kết quả phân tích thống kê 8.4 Bàn luận về kết quả NC
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
2
8.1 Chuẩn bị dữ liệu
● Mã hoá bản câu hỏi ● Sàng lọc dữ liệu ● Đánh số bản câu hỏi ● Nhập dữ liệu vào máy tính ● Làm sạch file dữ liệu
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
3
Mã hoá bản câu hỏi
● (Coding): gán các con số cho các phương án trả lời ● Bạn là sinh viên ngành: Kỹ thuật Kinh tế Khác ● Bạn là sinh viên ngành: 1. Kỹ thuật 2. Kinh tế 3. Khác
● Mã hoá được thực hiện trước và sau khi phỏng vấn.
● Câu hỏi đóng: thực hiện trước PV ● Câu hỏi mở: phân loại trả lời rồi mã hóa
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
4
Sàng lọc dữ liệu
● Loại bỏ các BCH không đạt yêu cầu về chất lượng ● Đọc soát và sàng lọc hàng ngày ● Trong khâu sàng lọc dữ liệu, cần phải:
● Kiểm tra DL khuyết (missing data): các câu hỏi không có trả lời ● Kiểm tra tính logic của các trả lời
● Loại bỏ các BCH
● Có nhiều DL khuyết ● Trả lời giống nhau ● Trả lời không logic, tùy ý
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
5
Đánh số bản câu hỏi
● Chỉ đánh số những bản câu hỏi có chất lượng đạt yêu cầu,
tức là được giữ lại sau quá trình sàng lọc dữ liệu. ● Cách đơn giản nhất là đánh số liên tục từ 1 đến hết. ● Phân tổ theo địa bàn hoặc tiêu chí khác để dễ quản lý
● 001-100: Hà Nội ● 101-200: TPHCM
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
6
Nhập và lưu dữ liệu vào máy tính
● Khởi tạo file dữ liệu mới trong phần mềm SPSS / Excel ● Định nghĩa các biến số: tên biến, kiểu biến, bậc đo lường, các phương án
trả lời, dữ liệu khuyết ….
● Nhập các trả lời trong các bản câu hỏi đã sàng lọc vào máy tính. Để đảm bảo tránh sai sót, tốt nhất là nên có 2 người: 1 người nhập, 1 người khác rà soát lại file dữ liệu của người đã nhập.
● Sau khi nhập khoảng 5 bản câu hỏi, nhớ cất (Save) file dữ liệu đề phòng
bị mất dữ liệu.
● Cất file dữ liệu thành nhiều phiên bản khác nhau. Thí dụ, file dữ liệu lưu lần đầu thì cất với tên là data_ver1.sav, sau khi nhập được 5 bản câu hỏi nữa thì lưu thành data_ver2.sav (.sav là phần mở rộng của tên file dữ liệu trong SPSS) và tương tự.
● Sao lưu file dữ liệu ra một phương tiện lưu trữ khác ngoài ổ cứng
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
7
Tạo file dữ liệu trong Excel (đối với khảo sát bằng bản câu hỏi) ● Cột 1: Số thứ tự ● Các cột là các biến số ● Các hàng là các BCH đã thu về ● Câu hỏi chỉ chọn 1 trả lời: 1 câu hỏi là 1 biến
số
● Câu hỏi có thể chọn nhiều trả lời: phải tạo nhiều biến số ⇨ số lượng biến số = số phương án trả lời có thể chọn, mỗi biến sẽ nhận 1 trong 2 giá trị là 0 hoặc 1. ● Giá trị của biến số được xác định theo quy tắc mã
hoá và đặc điểm câu hỏi đã thiết kế
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
8
Tạo file dữ liệu trong SPSS
● Tab Variable View
● Hàng: biến tạo các biến số ● Cột: đặc điểm của biến
● Tab “Data View”
● Hàng: quan sát, BCH ● Cột: biến
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
9
Làm sạch file dữ liệu
● Mục đích
● Tìm ra và loại bỏ các sai sót trong quá trình nhập dữ liệu vào máy tính
● Phương pháp:
● Thống kê tần số: phát hiện các giá trị bất thường ● Tạo bảng liên hợp 2 biến số: Cross-tab, Pivot phát hiện các giá trị
bất thường
● Thực hiện với phần mềm
● SPSS: Frequencies, Cross-tabs ● Excel: CountIf, Data Analysis (Histogram), Pivot Table
● Phòng bệnh hơn chữa bệnh
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
10
8.2 Phân tích thống kê
● Thống kê mô tả:
● Dữ liệu mẫu => rút ra kết luận về mẫu ● Bao gồm:
● TK tần số và tỷ lệ phần trăm ● TK giá trị TB và độ lệch chuẩn, min, max: các đại lượng đặc trưng cho độ tập trung và phân tán của dữ liệu mẫu
● Thống kê suy diễn
● Dữ liệu mẫu => muốn rút ra kết luận về tổng thể
(giả định: mẫu đại diện cho tổng thể) ● Bao gồm: kiểm định các giả thuyết NC
● CLDV (+) SHL ● SHL (+) -> STrT
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
11
Thực hiện phân tích thống kê trong Excel
● Dùng các lệnh có sẵn trong Excel: TK mô tả
● Tần số: COUNTIF(), SUMIF() ● Giá trị TB: AVERAGE() ● Độ lệch chuẩn: STDEV()
● Lập bảng kết hợp nhiều biến (cross-tabs) thể hiện mối liên hệ giữa 2 biến số (2 biến định tính hoặc 1 biến định tính và 1 biến định lượng) ● Excel: Pivot Table
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
12
Thực hiện phân tích thống kê trong Excel (tiếp)
● Phát hiện và khẳng định mối liên hệ giữa các
biến số: X và Y ● X và Y có DL kiểu định lượng: PT tương quan
hoặc PT hồi quy ● Tương quan: CORREL(x, y) ● Hồi quy: y = b0 + b1.x ⇨ Vẽ đồ thị Scatter và “Add
Trendline”
● Dùng công cụ hỗ trợ (macro) cài thêm vào
Excel (Add-ins) để tăng cường khả năng phân tích dữ liệu: ● Data Analysis ● MegaStat
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
13
Thống kê suy diễn
● Mục đích:
● Suy ra đặc điểm của tổng thể từ thông tin có được trên
mẫu ● TB mẫu ⇨ TB tổng thể ● Tỷ lệ mẫu ⇨ Tỷ lệ tổng thể ● TD: Kiểm định mối liên hệ giữa CLDV và sự hài lòng của KH
trên mẫu ⇨ CLDV và sự hài lòng của KH trên tổng thể
● PT trên toàn bộ mẫu và so sánh các nhóm trong cùng
một mẫu
● Đòi hỏi phải đặt giả thuyết và kiểm định giả
thuyết
● Xem thêm ở môn học “Thống kê ứng dụng”
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
14
Trình tự phân tích thống kê
● Phân tích đặc điểm của mẫu: tổng số, cơ cấu của mẫu theo giới tính, độ tuổi, học vấn, nghề, thu nhập …
● Phân tích thống kê mô tả với các biến số tương
ứng với các nhóm câu hỏi trong bản câu hỏi ● Hành vi: làm gì, mua gì, ở đâu, khi nào, ● Nhận thức và thái độ: biết, hiểu như thế nào, mức độ
ưa thích, hài lòng,
● Ý định tương lai: sẽ như thế nào ● Kiểm định các giả thuyết NC ● Đã đặt ra trong mô hình NC
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
15
8.3 Diễn giải kết quả phân tích thống kê
● Máy tính và phần mềm thống kê không thể trợ
giúp việc diễn giải
● Ngôn ngữ đơn giản, đời thường ● Không nhắc lại số liệu trong bảng / hình ● Nêu hình mẫu, xu thế nổi bật của bảng / hình
● Cái gì lớn nhất, nhỏ nhất ● Cái gì tăng/giảm nhiều nhất ● Cái gì chiếm tỷ trọng lớn nhất/bé nhất …
● Nêu ý nghĩa ● Tốt hay xấu? ● Cao hay thấp?
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
16
Thí dụ: Diễn giải kết quả PTTK đối với biến định danh
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
17
Thí dụ: Diễn giải kết quả PTTK đối với biến thứ bậc
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
18
Thí dụ: Diễn giải kết quả PTTK đối với biến định lượng
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh
19
8.4 Bàn luận về kết quả NC
● (Discussion on research results) ● Cần nói về ý nghĩa của kết quả NC ● So với lý thuyết ● So với các NC tương tự, gần đây ● Những điểm tương đồng và khác nhau
● Tần số, tỷ lệ phần trăm, giá trị TB tính ra như vậy là cao, TB hay thấp? ● Giá trị của Độ lệch chuẩn như vậy là lớn, bình thường hay nhỏ? ● Tương tự hay khác với lý thuyết, với các NC đã có? ● Nếu có sự khác nhau thì đâu có thể là nguyên nhân? ● Đòi hỏi phải rà soát lại phần Cơ sở lý thuyết và Tổng quan tình
hình NC ● Xem lại và đối chiếu với kết quả của các NC gần đây
© Nguyễn Tiến Dũng Phương pháp nghiên cứu trong kinh doanh

