intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Phân tích dữ liệu trong nghiên cứu Kinh tế và Kinh doanh - TS Phạm Cảnh Huy

Chia sẻ: Sdfv Sdfv | Ngày: | Loại File: PDF | Số trang:84

141
lượt xem
20
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Môn học này cung cấp các kỹ thuật phân tích dữ liệu cần thiết cho thực hiện nghiên cứu khoa học và làm luận án/ luận văn tốt nghiệp. Học viên tiếp cận kiến thức của môn học không chỉ từ góc độ kiến thức nền tảng của các công thức toán học cần thiết, từ các tình huống gần gũi trong thực tế.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Phân tích dữ liệu trong nghiên cứu Kinh tế và Kinh doanh - TS Phạm Cảnh Huy

  1. 10/25/2012 Bài giảng Phân tích dữ liệu trong nghiên cứu Kinh tế và Kinh doanh TS. Phạm Cảnh Huy Khoa Kinh tế và quản lý – ĐHBKHN 1 Nội dung  Giới thiệu mục tiêu học phần:  Môn học này cung cấp các kỹ thuật phân tích dữ liệu cần thiết cho thực hiện nghiên cứu khoa học và làm luận án/ luận văn tốt nghiệp.  Học viên tiếp cận kiến thức của môn học không chỉ từ góc độ kiến thức nền tảng của các công thức toán học cần thiết, từ các tình huống gần gũi trong thực tế, mà còn dưới dạng ‘ứng dụng’, ‘thực hành’ trên phần mềm Eviews, SPSS…  Những kiến thức cơ bản được trang bị từ môn học: 1) Kỹ thuật phân tích thống kê mô tả với các loại dữ liệu khác nhau; 2) Các phương pháp kiểm định; 3) Kỹ thuật phân tích nhân tố khám phá, kiểm định độ tin cậy của thang đo; 4) Phân tích tương quan, hồi quy; 5) Sử dụng phần mềm Eviews và/hoặc SPSS. 2 1
  2. 10/25/2012 Nội dung Tài liệu tham khảo:  Gerhard Bohm, Günter Zech, Introduction to Statistics and Data Analysis, 2010.  Gerald Keller, Brian Warrack, Statistics for management and economics. 6th Edition  SPSS Programming and Data Management, 3rd Edition, SPSS Inc.  Damodar N.Gujarati, Basic Econometrics, McGraw-Hill 2004  TS. Phạm Cảnh Huy, Bài giảng kinh tế lượng, Nhà xuất bản Đại học Bách khoa Hà Nội 2008.  Hoàng Trọng- Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu nghiên cứu với SPSS , Nhà xuất bản Hồng Đức. 3 Nội dung 1 Giới thiệu phân tích dữ liệu 2 Phân loại dữ liệu và một số xử lý trên biến 3 Mô tả dữ liệu 4 Phân tích diễn giải dữ liệu 5 Phân tích tương quan và hồi quy 6 Phân tích nhân tố và đánh độ tin cậy của thang đo 4 2
  3. 10/25/2012 Chương 1 GIỚI THIỆU PHÂN TÍCH DỮ LIỆU 5 1.1. Nghiên cứu và phân tích dữ liệu  Trong kinh doanh hiện đại thì kinh nghiệm còn được gọi là "dữ liệu". "Dữ liệu là Kinh nghiệm"  Nếu bạn không thu thập dữ liệu bạn đang lãng phí kinh nghiệm của bạn.  Nhưng dữ liệu là "kinh nghiệm" chỉ là/ hay chỉ được mã hoá bằng những con số.  Để dữ liệu giải mã hoặc để hiểu được nó chúng ta cần phải phân tích (Phân tích dữ liệu). 6 3
  4. 10/25/2012 1.1. Nghiên cứu và phân tích dữ liệu  Phân tích dữ liệu thường được chia thành: 1. Mô tả dữ liệu PHÂN TÍCH 2. So sánh dữ liệu DỮ LIỆU 3. Liên hệ dữ liệu 7 1.2. Bản chất của phân tích dữ liệu  Bản thân dữ liệu thô không phải là tri thức.  Trình tự đi từ dữ liệu đến tri thức: Mức độ chính xác của mô hình thống kê Hiểu biết, tri thức Sự kiện Thông tin Dữ liệu Mức độ cải thiện các quyết định 8 4
  5. 10/25/2012 1.3. Thống kê và phân tích dữ liệu Khái niệm  Thống kê là tập hợp các phương pháp dùng để thu thập, phân tích, trình bày và diễn giải dữ liệu.  Phân tích dữ liệu cung cấp kinh nghiệm thực hành để đẩy mạnh việc ứng dụng tư duy thống kê và kỹ thuật thống kê nhằm hiểu rõ các hiện tượng nghiên cứu làm cơ sở cho việc ra các quyết định phù hợp.  Máy tính đóng một vai trò rất quan trọng trong phân tích dữ liệu nghiên cứu. 9 1.3. Thống kê và phân tích dữ liệu Phương pháp phân tích theo các biến số  Phương pháp biến số đơn: trong đó chỉ có một biến số duy nhất được phân tích.  Phương pháp biến số kép: được sử dụng để tìm hiểu sự liên hệ giữa hai biến số.  Phương pháp đa biến: được sử dụng để tìm hiểu sự liên hệ giữa các biến số với nhau. 10 5
  6. 10/25/2012 1.4. Quá trình phân tích dữ liệu Tổng quát Thu thập và Khám phá dữ liệu Phân tích Chuẩn bị dữ liệu Thu thập dữ liệu Thống kê mô tả So sánh các nhóm Mã hóa dữ liệu Thiết lập cấu trúc dữ liệu Nhập dữ liệu Bảng biểu, đồ thị Mối quan hệ giữa các biến Kiểm tra, hiệu chỉnh 11 1.4. Quá trình phân tích dữ liệu Thu thập và Chuẩn bị dữ liệu  Từ điều tra Thu thập dữ liệu  Từ dữ liệu sẵn có Mã hóa dữ liệu  Chuyển dữ liệu gốc sang dữ liệu được mã hóa  Tên biến (name): Là tên đại diện cho biến  Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến. Thiết lập cấu trúc  Nhãn của biến (label): Tên biến được thể hiện tóm tắt bằng ký hiệu dữ liệu  Giá trị khuyết (Missing)  Dạng thang đo (measures): Hiển thị dạng thang đo của biến Nhập dữ liệu  Trực tiếp (Data view)  Từ Excel  Kiểm tra lỗi (Min, max,…) Kiểm tra, hiệu chỉnh  Tìm lỗi (Sort case, Edit find) 12 6
  7. 10/25/2012 1.4. Quá trình phân tích dữ liệu Khám phá dữ liệu  Dữ liệu Categorical (phân loại): Tần suất  Dữ liệu Numerical (dạng số):  mean Thống kê mô tả  standard deviation  minimum  maximum…  Histogram Bảng biểu,  Table đồ thị  Bar charts  Scatterplots  Line graphs 13 1.4. Quá trình phân tích dữ liệu Phân tích dữ liệu  Non-parametric statistics So sánh  T-tests  One-way analysis of variance ANOVA các nhóm  Two-way between groups ANOVA  Multivariate analysis of variance MANOVA Mối quan hệ  Crosstabulation/Chi Square  Correlation giữa các biến  Regression/Multiple regression  Factor analysis 14 7
  8. 10/25/2012 1.5. Các phần mềm ứng dụng  EXCEL  SPSS  EVIEWS  ………… 15 Chương 2 PHÂN LOẠI, ĐÁNH GIÁ ĐO LƯỜNG DỮ LIỆU VÀ MỘT SỐ XỬ LÝ TRÊN BIẾN 16 8
  9. 10/25/2012 2.1. Phân loại dữ liệu  Dữ liệu nghiên cứu có thể chia thành 2 loại chính là dữ liệu định tính và dữ liệu định lượng, các dữ liệu này thu thập bằng 4 thang đo cơ bản như sau: Dữ liệu Dữ liệu định Dữ liệu định tính lượng Thang đo Thang đo Thang đo Thang đo tỷ danh nghĩa thứ bậc khoảng cách lệ 17 2.1. Phân loại dữ liệu Thang đo danh nghĩa (biểu danh)/ nominal scale  Thang đo biểu danh là thang đo đơn giản nhất để phân biệt sự vật hay hiện tượng này với cái khác nó, nhiều khi người ta dùng các con số để mã hoá hay chỉ (biểu danh) một sự vật, ngoài ra không có ý nghĩ gì khác. Ví dụ 1: - Khách hàng:  Nam  Nữ; - Đối tượng: Người bán sỉ  Người bán lẻ; - Thái độ:  Thích  Không thích Giữa các biểu danh: Nam/ Nữ; Thích/ Không thích... hoàn toàn không có quan hệ thứ bậc nào cả. 18 9
  10. 10/25/2012 2.1. Phân loại dữ liệu Thang đo danh nghĩa (biểu danh)/ nominal scale  Ví dụ 2: Hỏi “Xin vui lòng cho biết tình trạng hôn nhân của bạn hiện nay?” Độc thân 1 Đang có gia đình 2 Goá bụa 3 Đã ly hôn 4 Những con số này mang tính định danh vì rõ ràng ta không thể cộng chúng lại hoặc tính ra giá trị trung bình của tình trạng hôn nhân”. 19 2.1. Phân loại dữ liệu Thang đo danh nghĩa (biểu danh)/ nominal scale  Những phép toán thống kê có thể sử dụng cho dạng thang biểu danh là:  Đếm;  Tính tần suất của một biểu hiện nào đó;  Xác định giá trị mode;  Thực hiện một số phép kiểm định. 20 10
  11. 10/25/2012 2.1. Phân loại dữ liệu Thang đo thứ bậc/ ordinal scale  Là thang đo được sử dụng để xếp hạng các đồ vật hay hiện tượng theo một thứ tự nhất định với sự so sánh định tính nào đó về thứ bậc hay sự hơn kém, nó không cho ta biết được khoảng cách giữa chúng.  Thang đo xếp hạng theo thứ tự là thang đo biểu danh, nhưng không phải thang đo biểu danh nào cũng đều là thang đo xếp hạng theo thứ bậc.  Đối với thang đo xếp hạng theo thứ tự, khuynh hướng trung tâm có thể xem xét bằng trung vị; giá trị Mode. 21 2.1. Phân loại dữ liệu Thang đo thứ bậc/ ordinal scale  Ví dụ 1: Thu nhập của anh/chị/ông/bà hàng tháng: 1.< 3 triệu đồng 2.Từ 3-5 triệu đồng 3. >5 trđ  Ví dụ 2: Xếp hạng TOPTEN hàng tiêu dùng Việt Nam tuỳ theo số lượng thư khách hàng bình chọn nhiều hay ít từ hạng nhất đến hạng 10 (không nói rõ hạng nào được bao nhiêu thư). Hoặc theo mức độ ưa chuộng của khách hàng ở 3 mức: 1. Không thích; 2. Hơi thích; 3. Rất thích. Ta biết là “hơi thích” là hơn “không thích” nhưng không đo lường được khoảng cách giữa hai cấp độ đó là bao nhiêu. 22 11
  12. 10/25/2012 2.1. Phân loại dữ liệu Thang đo khoảng/ interval scale THANG ĐO KHOẢNG CÁCH Là loại thang cung cấp định lượng về quan hệ thứ tự giữa các sự vật và hiện tượng; là một dạng đặc biệt của thang đo xếp hạng theo thứ bậc; nó nói lên được khoảng cách giữa hai cấp bậc thứ tự (đã được lượng hoá). Trong việc đo lường thái độ hay ý kiến thì thang đo khoảng cách cung cấp nhiều thông tin hơn so với thang đo xếp hạng theo thứ tự 23 2.1. Phân loại dữ liệu Thang đo khoảng/ interval scale  Ví dụ 1: Đánh giá chất lượng đào tạo của một trường Rất không đồng ý Rất đồng ý Chương trình đào tạo của trường phù hợp tốt với 1 2 3 4 5 yêu cầu thực tiễn Nội dung các môn học được cập nhật, đổi mới,đáp ứng tốt yêu cầu đào tạo GV có kiến thức sâu về môn học đảm trách 24 12
  13. 10/25/2012 2.1. Phân loại dữ liệu Thang đo khoảng/ interval scale  Ví dụ 2: Phát biểu ý thích về màu sắc sản phẩm nào đó bằng cách đánh dấu vào bậc thang khoảng cách từ: 1 2 3 4 5 6 7 Không thích ---------------------------------------------------------- rất thích Khi đó, người ta xác định thái độ của mình chính xác ở vào điểm số nào. 25 2.1. Phân loại dữ liệu Thang đo khoảng/ interval scale  Các phép toán thống kê có thể sử dụng thêm cho loại thang đo này (so với 2 loại thang đo trên) là:  Tính khoảng biến thiên;  Số trung bình;  Độ lệch chuẩn. Cần chú ý là thang đo khoảng cách tự nó không có điểm 0 tuyệt đối, do đó bạn chỉ có thể thực hiện được phép tính công hay trừ (+/-), nếu dùng phép chia (/) thì kết quả sẽ không có ý nghĩa. 26 13
  14. 10/25/2012 2.1. Phân loại dữ liệu Thang đo tỷ lệ/ ratio scale  Đây là những loại thang đo lường cho phép đánh giá và so sánh các sự vật hiện tượng một cách tuyệt đối, cung cấp thông tin định lượng một cách đầy đủ nhất và được áp dụng rộng rãi nhất. Nhiều thang đo tỉ lệ cho thấy những ý nghiã sâu sắc hơn là ba loại thang đo trước.  Đây là thang đo dùng cho tiêu thức số lượng. Ví dụ: Mức độ chi tiêu cho tiền học của con cái chiếm 30% thu nhập của tôi.  Nói chung thang đo khoảng và thang đo tỷ lệ có thể đo lường xu hướng trung tâm bằng bảng tần số, biểu đồ tần số, trung bình số học. Còn xu hướng phân tán được đo bằng phương sai, độ lệch chuẩn. Do vậy SPSS gộp chung 2 thang đo này thành một và gọi là Scale Measures. 27 2.2. Đánh giá đo lường Sai lệch trong đo lường  Sai lệch trong đo lường (measurement error- єm) được chia thành 2 nhóm: Sai lệch hệ thống (systematic error – єs); Sai lệch ngẫu nhiên (Random error- єr). Và chúng ta có: єm = єs + єr  Sai lệch hệ thống là các sai lệch tạo nên một “chệch” cố định (constant bias) trong đo lường. Chúng xảy ra khi ta đùng thang đo lường không cân bằng, hay kỹ thuật phỏng vấn kém,…  Sai lệch ngẫu nhiên là do những sai sót xảy ra trong quá trình thực hiện, do người thực hiện gây nên như: ghi nhầm; chọn sai ô lựa chọn;… Các sai lệch ngẫu nhiên có thể do mệt mỏi, nóng giận, buồn chán, sự hiện diện của người khác,… gây ra. 28 14
  15. 10/25/2012 2.2. Đánh giá đo lường Giá trị và độ tin cậy của đo lường  Một đo lường được gọi là có giá trị (Validity) nếu nó đo lường được đúng cái cần đo lường. Nói cách khác do lường được coi là “lý tưởng” khi Sai lệch trong đo lường bằng 0 (єm = 0 Khi єs = 0; єr = 0). Thật vậy, nếu X là số đo được của một thuộc tính nào đó và X0 là số đo thật của nó thì: X = X0 + єm = X0 + єs + єr  Như vậy, nếu chúng ta có thể đo lường được đúng cái cần đo lường thì sự khác biệt về số đo sẽ phản ánh sự khác nhau về thái độ, ý kiến của đối tượng nghiên cứu.  Khi một sự đo lường vắng mặt các sai lệch ngẫu nhiên (єr=0)thì đo lường đó có độ tin cậy (reliability). Độ tin cậy là điều kiện cần để cho một đo lường có giá trị. 29 2.3. Xử lý dữ liệu Xử lý dữ liệu  Nhiệm vụ tổng quát của việc xử lý dữ liệu là “chuyển hóa” những ghi chép quan sát hoặc các câu trả lời dưới dạng “thô” thành các con số thống kê theo một trật tự nhất định để chuẩn bị cho việc phân tích và diễn giải các kết quả nghiên cứu thu được. Xử lý Xử lý với trợ giúp thủ công của máy tính 30 15
  16. 10/25/2012 2.3. Xử lý dữ liệu Các giai đoạn xử lý dữ liệu Chuẩn bị dữ liệu Nhập dữ liệu và lưu trữ Giai đọan này gổm 3 bước: Giai đọan này cũng gồm 3 bước:  Kiểm tra và hiệu chỉnh  Nhập dữ liệu vào máy dữ liệu; tính;  Định biến dữ liệu;  Làm sạch dữ liệu;  Mã hóa dữ liệu.  Lưu trữ dữ liệu. 31 2.3. Xử lý dữ liệu Các giai đoạn xử lý dữ liệu/ Kiểm tra và hiệu chỉnh  Đây là bước kiểm tra chất lượng thông tin, ví dụ thông tin trong bảng câu hỏi nhằm đảm bảo không có bảng câu hỏi nào bị thiếu hoặc chứa đựng những thông tin sai sót theo yêu cầu thiết kế ban đầu. Người kiểm tra phải bảo đảm tính toàn vẹn và tính chính xác của từng bảng câu hỏi. Thông thường ở bước này các nhà nghiên cứu sẽ tiến hành kiểm tra các đặc tính cơ bản của bảng câu hỏi.  Quá trình kiểm tra, rà soát lại nhằm mục đích kiểm tra, phát hiện, sửa chữa và thông báo kịp thời cho người thu thập dữ liệu để tránh những sai sót tương tự. Để xử lý các sai sót phát hiện được qua kiểm tra, ta có thể chọn cách xử lý tuỳ thuộc vào mức độ sai sót. 32 16
  17. 10/25/2012 2.3. Xử lý dữ liệu Các giai đoạn xử lý dữ liệu/ Định biến dữ liệu  Biến nghiên cứu là tập hợp các khái niệm có ý nghĩa mô tả (định tính, định lượng ) cho mục tiêu nghiên cứu, được thể hiện bằng các ký hiệu (mã hoá) theo một qui ước nào đó. Biến nghiên cứu được thể hiện và là một bộ phận không thể thiếu trong mô hình nghiên cứu.  Biến nghiên cứu có thể được phân loại theo kiểu dữ liệu (dạng thang đo). Biến định tính là biến chứa các giá trị quan sát ở dạng thang đo danh nghĩa và thang đo thứ bậc. Biến định lượng là biến chứa các giá trị quan sát ở dạng thang đo khoảng và thang đo tỷ lệ. Ví dụ trong bảng câu hỏi, mỗi một câu hỏi thường phải nhằm một mục đích quan sát nào đó. Do vậy, thường mỗi một câu hỏi tương ứng với một biến quan sát 33 2.3. Xử lý dữ liệu Các giai đoạn xử lý dữ liệu/ Định biến dữ liệu  Ví dụ biến nghiên cứu: Giả sử rằng “Các yếu tố tác động đến quyết định lựa chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo” của khách hàng trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao bì hấp dẫn. Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc tính cấu thành kết luận chất lượng sản phẩm tốt của mì ăn liền ”Hảo Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2) Màu sắc của mì và nước dùng tươi ngon; (a1.3) Có thành phần dinh dưỡng cao; … Và các yếu tố còn lại cũng có các thuộc tính xác định chúng. Ở thí dụ trên các biến số: a1; a2; a3; a4 là các biến số trực tiếp (cấp 1) tác động đến quyết định lựa chọn mì ăn liến “ Hảo Hảo”. Còn các biến số a1.1; a1.2; … là các biến số cấp 2 34 17
  18. 10/25/2012 2.3. Xử lý dữ liệu Các giai đoạn xử lý dữ liệu/ Mã hóa dữ liệu  Mã hoá giúp giảm số biểu hiện của một biến định tính chỉ còn 2 hay 3 biểu hiện cơ bản hoặc khi biến định lượng có quá nhiều giá trị chúng ta muốn nhóm lại giúp cho việc trình bày gọn hơn. Mã hoá dữ liệu làm cơ sở cho việc thống kê phân tích dữ liệu.  Mã hoá dữ liệu (Coding) là quá trình chuyển đổi thành dạng mã số để nhập và xử lý dữ liệu.  Trong nghiên cứu Marketing, mục đích của việc mã hoá là tạo nhãn (labels) cho các câu trả lời, thường là bằng các con số, hay ký hiệu. Một trả lời khi mã hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời (số đo). Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối với sữa chua Vinamilk? Code: 1 2 3 4 5 Rất ghét Ghét Tạm được Thích Rất thích 35 2.3. Xử lý dữ liệu Các giai đoạn xử lý dữ liệu/ Mã hóa dữ liệu TT Câu hỏi nghiên cứu Biến quan sát Mã trả lời Trả lời 1 Vui lòng cho biết giới tính của a1:Giới tính 1 Nam bạn? 2 Nữ 2 Xin vui lòng cho biết bạn thuộc a2: Nhóm tuổi 1 Dưới 18 tuổi nhóm tuổi nào dưới đây? 2 Từ 19- 25 3 Từ 26-35 4 Từ 36-45 5 Trên 45 tuổi 3 Xin vui lòng cho biết sở thích a3: Sở thích của 1 Rất ghét của bạn đối với sữa chua khách hàng đối 2 Ghét Vinamilk? với sữa chua Vinamilk. 3 Tạm được 4 Thích 5 Rất thích … 36 18
  19. 10/25/2012 2.3. Xử lý dữ liệu Các giai đoạn xử lý dữ liệu/ Làm sạch và lưu trữ Nhập dữ liệu vào máy tính CÁC BƯỚC CÔNG ViỆC (Inputing data into computer) Làm sạch dữ liệu (Data cleaning) Lưu trữ dữ liệu (Data saving) 37 2.3. Xử lý dữ liệu Giới thiệu về màn hình quản lý dữ liệu trên SPSS Cột (Column): Đại diện Là nơi lưu trữ dữ cho biến quan sát. liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng 38 19
  20. 10/25/2012 2.3. Xử lý dữ liệu Giới thiệu về màn hình quản lý dữ liệu trên SPSS Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và Hàng (Row): Đại diện các ô giao nhau cho một trường hợp giữa cột và hàng quan sát (người trả lời), 39 2.3. Xử lý dữ liệu Giới thiệu về màn hình quản lý dữ liệu trên SPSS Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm cột, hàng và các ô giao nhau giữa cột và hàng Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trả lời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát). Ô là sự kết hợp của đối tượng và biến. Các ô chỉ chứa các trị số biến. 40 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2