Bài giảng NGUYÊN LÝ THỐNG KÊ
Nguyễn Ngọc Lam
Điện thoại cá nhân: 3738 999 – 0918 625526 (Hạn chế điện thoại ngoài giờ hành chính và không nhắn tin)
Email: nnlam@ctu.edu.vn www.nguyenngoclam.com
1
VỊ TRÍ HỌC PHẦN
Nghiên cứu Marketing
Kinh tế lượng
Kinh tế Sản xuất
Nguyên lý thống kê
Xác suất thống kê toán
Kinh tế Nông nghiệp
2
NỘI DUNG HỌC PHẦN
Tổng hợp và trình bày dữ liệu
1
Giới thiệu học phần
Các số đo
2
Phân phối tổng thể
3
Thống kê mô tả
Ước lượng khoảng tin cậy
4
Kiểm định giả thuyết
5
Thống kê suy luận
Tương quan và hồi qui
6
Dãy số thời gian
7
Phương pháp chọn mẫu
8
Phần mềm: Excel, SPSS, Stata, Eviews
3
ĐÁNH GIÁ HỌC PHẦN
Đánh giá: • Điểm giữa kỳ: hệ số 0,3 • Điểm thi: hệ số 0,7
4
Kiểm tra, thi: (được sử dụng tài liệu) • Kiểm tra: từ đầu đến hết chương ước lượng • Thi: Tất cả • Lịch thi và kiểm tra sẽ được công bố trên lớp và web. • Các khiếu nại chỉ giải quyết trong buổi trả bài. • Khi đi kiểm tra, thi phải đem theo giấy tờ có ảnh.
TÀI LIỆU THAM KHẢO
5
TÀI LIỆU THAM KHẢO
6
TÀI LIỆU THAM KHẢO
7
I.NGUỒN GỐC MÔN HỌC
- Năm 1660, nhà kinh tế học người Đức H.Conhring (1606 - 1681) đã giảng dạy thử môn “Phương pháp nghiên cứu hiện tượng xã hội dựa vào số liệu điều tra cụ thể”.
- Năm 1682, nhà kinh tế học của người Anh William Petty phát hành cuốn sách “Số học chính trị”.
8
- Năm 1759, giáo sư người Đức, Achenwall (1719-1772) lần đầu tiên dùng danh từ “Statistics”.
II.THỐNG KÊ LÀ GÌ?
2.1. Định nghĩa thống kê: Thống kê là một hệ thống các phương pháp bao gồm thu thập, tổng hợp, trình bày số liệu, tính toán các đặc trưng của đối tượng nghiên cứu nhằm phục vụ cho quá trình phân tích, dự đoán và ra quyết định.
2.2. Chức năng của thống kê:
9
- Thống kê mô tả: là các phương pháp có liên quan đến việc thu thập số liệu, tóm tắt, trình bày, tính toán các đặc trưng khác nhau để phản ánh một cách tổng quát đối tượng nghiên cứu.
II.THỐNG KÊ LÀ GÌ?
- Thống kê suy luận: là bao gồm các phương pháp ước lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát mẫu.
2.3. Phương pháp thống kê:
10
- Thu thập và xử lý số liệu - N.cứu hiện tượng trong hoàn cảnh không chắc chắn - Điều tra chọn mẫu - Nghiên cứu mối liên hệ giữa các hiện tượng - Dự báo
III.MỘT SỐ KHÁI NIỆM THƯỜNG DÙNG
3.1. Tổng thể thống kê: (Populations) Là tập hợp các đơn vị trên cơ sở một đặc điểm chung nào đó. 3.2. Mẫu: (Samples) là một bộ phận của tổng thể được chọn ra để quan sát và dùng suy diễn cho tổng thể 3.3. Quan sát: (Observations) Là mỗi đơn vị của mẫu. 3.4. Tiêu thức thống kê: Là khái niệm chỉ các đặc điểm của đơn vị tổng thể.
- Định tính: các biểu hiện là loại hoặc tính chất. - Định lượng: các biểu hiện bằng con số có giá trị.
11
• Rời rạc: là các giá trị của nó có thể đếm được. • Liên tục: là các giá trị của nó lắp đầy một khoảng
III.MỘT SỐ KHÁI NIỆM THƯỜNG DÙNG
3.5. Tham số tổng thể: Là giá trị quan sát được của tổng thể và dùng để mô tả đặc trưng của hiện tượng nghiên cứu.
µ: Trung bình tổng thể p: Tỷ lệ tổng thể 2: Phương sai tổng thể
3.6. Tham số mẫu: Là số đo tính toán được của một mẫu và dùng để suy rộng cho tham số tổng thể.
: Trung bình mẫu : Tỷ lệ mẫu
x pˆ s2 : Phương sai mẫu
12
IV.CÁC LOẠI THANG ĐO
4.1. Thang đo danh nghĩa: (Nominal scale) Dữ liệu là tên, nhãn cho một loại nào đó và không có giả thuyết nào về sự liên hệ giá trị. Ví dụ: Công ty ông/bà đang hoạt động trong lĩnh vực nào?
Sản xuất □ 1
Xây dựng □ 2
Dịch vụ □ 3
Thương mại □ 4
13
Khác…………… □ 5
IV.CÁC LOẠI THANG ĐO
4.2. Thang đo thứ bậc: (Ordinal scale) Thang đo để sắp xếp thứ hạng của dữ liệu nhưng không thực hiện được phép tính đại số.
Ví dụ: Khi mua xe gắn máy, theo ông/bà yếu tố nào là quan trọng nhất và xếp hạng các yếu tố sau theo thứ tự giảm dần.
Giá cả ……
Chất lượng ……
Thời trang ……
14
Tiết kiệm nhiên liệu ……
IV.CÁC LOẠI THANG ĐO
4.3. Thang đo khoảng: (Interval scale) là thang đo thứ tự, đo được khoảng cách của các giá trị và không thực hiện được phép chia. Ví dụ: Đánh giá về chủ đề và thời gian của khóa huấn luyện:
TT
Nội dung cần đánh giá
Điểm
1 2 3 4 5 6 7 8 9 10
1 Sự cần thiết của chủ đề đối với nhu cầu thực sự cần
đào tạo?
2 Mức độ hợp lý trong việc phân bổ thời gian từng
chủ đề (1-4: ngắn; 5-8: hợp lý; 9-10: dài)
3
Tính hữu ích của các kỹ năng/thông tin mới thu nhận được sau khóa huấn luyện như thế nào?
4 Mức độ thỏa mãn của khóa huấn luyện so với nhu cầu
đào tạo?
Đánh giá chung
Nhận xét, góp ý (nếu có):
15
IV.CÁC LOẠI THANG ĐO
4.4. Thang đo tỷ lệ: (Ratio scale) là thang đo khoảng và thực hiện được phép chia.
16
Ví dụ: Xin cho biết mức doanh thu của quý doanh nghiệp trung bình mỗi tháng là bao nhiêu: ……………….
V.THU THẬP THÔNG TIN
5.1. Xác định nội dung thông tin: - Thích đáng - Kịp thời - Chính xác - Khách quan
5.2. Nguồn số liệu:
17
5.2.1. Dữ liệu thứ cấp: là các thông tin đã có sẵn đã qua xử lý. - Số liệu nội bộ: đơn vị, từ các cuộc điều tra trước đây. - Số liệu từ các ấn phẩm của nhà nước http://www.gso.gov.vn - Báo, tạp chí chuyên ngành - Thông tin của các tổ chức, hiệp hội nghề nghiệp - Thông tin từ các công ty hoạt động nghiên cứu thị trường.
V.THU THẬP THÔNG TIN
5.2.2. Dữ liệu sơ cấp: Là các thông tin thu thập từ cuộc điều tra.
1) Điều tra toàn bộ: Là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc tổng thể nghiên cứu. - Ưu điểm: nắm được thông tin toàn bộ
- Nhược điểm:
- Mất nhiều thời gian, tốn kém, đôi khi còn thiếu chính xác.
18
- Trong một số trường hợp không thực hiện được
V.THU THẬP THÔNG TIN
2) Điều tra chọn mẫu: Nghiên cứu một số phần tử đại diện để suy ra toàn bộ tổng thể bằng các phương pháp thống kê.
- Tiết kiệm chi phí
- Cung cấp thông tin kịp thời cho quá trình nghiên cứu
- Đáng tin cậy
19
* Tùy vào từng trường hợp cụ thể mà chúng ta có phương pháp điều tra phù hợp.
V.THU THẬP THÔNG TIN
3. Các phương pháp thu thập thông tin: 1) Quan sát 2) Phương pháp gởi thư
3) Phỏng vấn bằng điện thoại
4) Phỏng vấn trực tiếp:
- Phỏng vấn cá nhân
20
- Phỏng vấn nhóm
V.THU THẬP THÔNG TIN
Đặc điểm của các phương pháp thu thập thông tin
Tính chất
Quan sát
Gởi thư
Phỏng vấn điện thoại
Phỏng vấn trực tiếp
Linh hoạt
Kém
Kém
Tốt
Tốt
Ít
Đầy đủ
Hạn chế
Đầy đủ
Khối lượng thông tin
Chậm
Chậm
Nhanh
Nhanh
Tốc độ thu thập thông tin
Hạn chế
Thấp
Cao
Cao
Tỷ lệ câu hỏi được trả lời
Chi phí
Tốn kém Tiết kiệm Tốn kém Tốn kém
21
V.THU THẬP THÔNG TIN
5.4. Kỹ thuật lấy mẫu: 5.4.1. Chọn mẫu xác suất: (Probability sampling) 1) Chọn mẫu ngẫu nhiên đơn giản: (Simple random sampling) - Rút thăm, thẻ - Sử dụng Excel chọn ngẫu nhiên
22
Ưu điểm: - Đơn giản - Nền tảng là xác suất Nhược điểm: - Phải có danh sách tổng thể - Thời gian và kinh phí cao - Đặc trưng nhóm có thể bị bỏ sót
V.THU THẬP THÔNG TIN
23
V.THU THẬP THÔNG TIN
24
2) Chọn mẫu hệ thống: (Systematic sampling) - Lập danh sách tổng thể: N phần tử - Xác định cỡ mẫu: n phần tử - Chọn phần tử đầu tiên ngẫu nhiên - Chọn tiếp các phần tử còn lại theo bước nhảy: k = N/n Ưu điểm: - Có thể không cần biết lập danh sách tổng thể - Mẫu đại diện hơn Nhược điểm: - Không phù hợp đặc trưng có tính chu kỳ
V.THU THẬP THÔNG TIN
1. Jane
35. Fred
18. Steve
1. Chia đám đông cho qui
2. Bill
36. Mike
19. Sam
3. Harriet
20. Marvin
37. Doug
4. Leni
38. Ed M.
21. Ed. T.
mô mẫu mong muốn: VD: 50/10 = 5
5. Micah
39. Tom
22. Jerry
6. Sara
40. Mike G.
23. Chitra
2. Chọn điểm xuất phát: VD,
7. Terri
24. Clenna
41. Nathan
8. Joan
42. Peggy
25. Misty
43 = Heather
9. Jim
43. Heather
26. Cindy
10. Terrill
44. Debbie
27. Sy
11. Susie
28. Phyllis
45. Cheryl
12. Nona
46. Wes
29. Jerry
13. Doug
47. Genna
30. Harry
14. John S.
31. Dana
48. Ellie
15. Bruce A.
32. Bruce M.
49. Alex
16. Larry
33. Daphne
50. John D.
3. Sau đó chọn thành viên thứ 5 từ điểm xuất phát và lần lượt như vậy cho đến khi hoàn tất danh sách đám đông
17. Bob
34. Phil
25
V.THU THẬP THÔNG TIN
3) Chọn mẫu cả khối/cụm: (Cluster sampling) - Tổng thể chia ra nhiều khối, mỗi khối coi như một quan sát. - Chọn ngẫu nhiên m khối. - Khảo sát tất cả các phần tử trong m khối.
Ví dụ: Nghiên cứu cấp quận, quận có 14 phường. - Chọn ngẫu nhiêu 2 phường. - Khảo sát tất cả các hộ của 2 phường.
26
Ưu điểm: Không cần lập danh sách tổng thể. Chú ý: Các khối có tính chất không quá khác nhau.
V.THU THẬP THÔNG TIN
4) Chọn mẫu nhiều giai đoạn: (Multi-Stage sampling) Chọn mẫu hai giai đoạn: - Tổng thể chia ra nhiều khối, mỗi khối coi như một quan sát. - Chọn ngẫu nhiên m khối (mẫu bậc 1) - Trong mỗi khối khảo sát một số phần tử (mẫu bậc 2)
27
Ví dụ: Nghiên cứu cấp thành phố - Chọn ngẫu nhiên một số quận trong thành phố (mẫu bậc 1) - Mỗi quận chọn ngẫu nhiên một số phường (mẫu bậc 2) - Trong mỗi phường chọn một số hộ (mẫu bậc 3)
V.THU THẬP THÔNG TIN
5) Chọn mẫu phân tầng: (Stratified sampling) - Các phần tử quá khác nhau về tính chất liên quan đến nội dung nghiên cứu. - Tổng thể được chia thành k lớp. - Trong mỗi lớp chọn ngẫu nhiên một số phần tử.
Cách xác định số phần tử cần chọn trong mỗi lớp: - Tổng thể có N phần tử được phân thành k lớp - Mỗi lớp có Ni phần tử.Tỷ trọng từng từng lớp: Ni/N - Chọn mẫu n phần tử, tỷ lệ chọn mẫu p = n/N. - Số phần tử chọn mỗi lớp: + ni = n(Ni/N)
28
+ ni = p.Ni
V.THU THẬP THÔNG TIN
Ví dụ: Khảo sát về sự hài lòng của sinh viên, học viên. Chọn 1.000 sinh viên, học viên để khảo sát.
Hệ/cấp đào tạo
Tỷ trọng (%)
Số lượng cần chọn
Số lượng
Cử nhân hệ chính qui
10.000
50
500
Cử nhân hệ liên thông
2.000
10
100
Cử nhân bằng đại học thứ 2
2.000
10
100
Cử nhân hệ vừa làm vừa học
5.000
25
250
Cao học
1.000
5
50
Tổng
20.000
100
1.000
29
V.THU THẬP THÔNG TIN
Ví dụ: Trường hợp có nhiều nhân tố.
Tỷ lệ chọn mẫu p = 1.000/10.000 = 0,1.
Địa diểm
Giới tính Nông thôn
Thành thị Miền núi
Tổng số
Nam
1.200 [120]
1.200 [120]
600 [60]
3.000 [300]
Nữ
2.800 [280]
2.800 [280]
1.400 [140]
7.000 [700]
Tổng số
4.000 [400]
4.000 [400]
2.000 [200]
10.000 [1.000]
30
V.THU THẬP THÔNG TIN
5.4.1. Chọn mẫu phi xác suất: (Non-Probability sampling)
1) Chọn mẫu thuận tiện: (Convenient sampling)
- Dựa trên tính “dễ tiếp xúc” và cơ hội thuận tiện để chọn mẫu
- Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm 2) Chọn mẫu tích lũy nhanh:
- Chọn ngẫu nhiên một số quan sát ban đầu.
31
- Các mẫu bổ sung tiếp theo được chọn ra từ việc cung cấp qua hình thức giới thiệu của những mẫu ban đầu.
V.THU THẬP THÔNG TIN
3) Chọn mẫu phán đoán: (Judgement sampling)
- Người điều tra quyết định sự thích hợp đối tượng điều tra.
- Mức độ đại diện của mẫu điều tra phụ thuộc vào trình độ và kinh nghiệp của người điều tra và người thu thập số liệu.
4) Chọn mẫu định mức: (Quota sampling)
- Chia tổng thể ra k lớp (như chọn mẫu phân tầng)
32
- Mỗi lớp chọn ra một số phần tử theo phương pháp phi ngẫu nhiên.
www.nguyenngoclam.com
33