Bài giảng NGUYÊN LÝ THỐNG KÊ

Nguyễn Ngọc Lam

Điện thoại cá nhân: 3738 999 – 0918 625526 (Hạn chế điện thoại ngoài giờ hành chính và không nhắn tin)

Email: nnlam@ctu.edu.vn www.nguyenngoclam.com

1

VỊ TRÍ HỌC PHẦN

Nghiên cứu Marketing

Kinh tế lượng

Kinh tế Sản xuất

Nguyên lý thống kê

Xác suất thống kê toán

Kinh tế Nông nghiệp

2

NỘI DUNG HỌC PHẦN

Tổng hợp và trình bày dữ liệu

1

Giới thiệu học phần

Các số đo

2

Phân phối tổng thể

3

Thống kê mô tả

Ước lượng khoảng tin cậy

4

Kiểm định giả thuyết

5

Thống kê suy luận

Tương quan và hồi qui

6

Dãy số thời gian

7

Phương pháp chọn mẫu

8

Phần mềm: Excel, SPSS, Stata, Eviews

3

ĐÁNH GIÁ HỌC PHẦN

Đánh giá: • Điểm giữa kỳ: hệ số 0,3 • Điểm thi: hệ số 0,7

4

Kiểm tra, thi: (được sử dụng tài liệu) • Kiểm tra: từ đầu đến hết chương ước lượng • Thi: Tất cả • Lịch thi và kiểm tra sẽ được công bố trên lớp và web. • Các khiếu nại chỉ giải quyết trong buổi trả bài. • Khi đi kiểm tra, thi phải đem theo giấy tờ có ảnh.

TÀI LIỆU THAM KHẢO

5

TÀI LIỆU THAM KHẢO

6

TÀI LIỆU THAM KHẢO

7

I.NGUỒN GỐC MÔN HỌC

- Năm 1660, nhà kinh tế học người Đức H.Conhring (1606 - 1681) đã giảng dạy thử môn “Phương pháp nghiên cứu hiện tượng xã hội dựa vào số liệu điều tra cụ thể”.

- Năm 1682, nhà kinh tế học của người Anh William Petty phát hành cuốn sách “Số học chính trị”.

8

- Năm 1759, giáo sư người Đức, Achenwall (1719-1772) lần đầu tiên dùng danh từ “Statistics”.

II.THỐNG KÊ LÀ GÌ?

2.1. Định nghĩa thống kê: Thống kê là một hệ thống các phương pháp bao gồm thu thập, tổng hợp, trình bày số liệu, tính toán các đặc trưng của đối tượng nghiên cứu nhằm phục vụ cho quá trình phân tích, dự đoán và ra quyết định.

2.2. Chức năng của thống kê:

9

- Thống kê mô tả: là các phương pháp có liên quan đến việc thu thập số liệu, tóm tắt, trình bày, tính toán các đặc trưng khác nhau để phản ánh một cách tổng quát đối tượng nghiên cứu.

II.THỐNG KÊ LÀ GÌ?

- Thống kê suy luận: là bao gồm các phương pháp ước lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyết định trên cơ sở thông tin thu thập từ kết quả quan sát mẫu.

2.3. Phương pháp thống kê:

10

- Thu thập và xử lý số liệu - N.cứu hiện tượng trong hoàn cảnh không chắc chắn - Điều tra chọn mẫu - Nghiên cứu mối liên hệ giữa các hiện tượng - Dự báo

III.MỘT SỐ KHÁI NIỆM THƯỜNG DÙNG

3.1. Tổng thể thống kê: (Populations) Là tập hợp các đơn vị trên cơ sở một đặc điểm chung nào đó. 3.2. Mẫu: (Samples) là một bộ phận của tổng thể được chọn ra để quan sát và dùng suy diễn cho tổng thể 3.3. Quan sát: (Observations) Là mỗi đơn vị của mẫu. 3.4. Tiêu thức thống kê: Là khái niệm chỉ các đặc điểm của đơn vị tổng thể.

- Định tính: các biểu hiện là loại hoặc tính chất. - Định lượng: các biểu hiện bằng con số có giá trị.

11

• Rời rạc: là các giá trị của nó có thể đếm được. • Liên tục: là các giá trị của nó lắp đầy một khoảng

III.MỘT SỐ KHÁI NIỆM THƯỜNG DÙNG

3.5. Tham số tổng thể: Là giá trị quan sát được của tổng thể và dùng để mô tả đặc trưng của hiện tượng nghiên cứu.

µ: Trung bình tổng thể p: Tỷ lệ tổng thể 2: Phương sai tổng thể

3.6. Tham số mẫu: Là số đo tính toán được của một mẫu và dùng để suy rộng cho tham số tổng thể.

: Trung bình mẫu : Tỷ lệ mẫu

x pˆ s2 : Phương sai mẫu

12

IV.CÁC LOẠI THANG ĐO

4.1. Thang đo danh nghĩa: (Nominal scale) Dữ liệu là tên, nhãn cho một loại nào đó và không có giả thuyết nào về sự liên hệ giá trị. Ví dụ: Công ty ông/bà đang hoạt động trong lĩnh vực nào?

Sản xuất □ 1

Xây dựng □ 2

Dịch vụ □ 3

Thương mại □ 4

13

Khác…………… □ 5

IV.CÁC LOẠI THANG ĐO

4.2. Thang đo thứ bậc: (Ordinal scale) Thang đo để sắp xếp thứ hạng của dữ liệu nhưng không thực hiện được phép tính đại số.

Ví dụ: Khi mua xe gắn máy, theo ông/bà yếu tố nào là quan trọng nhất và xếp hạng các yếu tố sau theo thứ tự giảm dần.

Giá cả ……

Chất lượng ……

Thời trang ……

14

Tiết kiệm nhiên liệu ……

IV.CÁC LOẠI THANG ĐO

4.3. Thang đo khoảng: (Interval scale) là thang đo thứ tự, đo được khoảng cách của các giá trị và không thực hiện được phép chia. Ví dụ: Đánh giá về chủ đề và thời gian của khóa huấn luyện:

TT

Nội dung cần đánh giá

Điểm

1 2 3 4 5 6 7 8 9 10

1 Sự cần thiết của chủ đề đối với nhu cầu thực sự cần

đào tạo?

2 Mức độ hợp lý trong việc phân bổ thời gian từng

chủ đề (1-4: ngắn; 5-8: hợp lý; 9-10: dài)

3

Tính hữu ích của các kỹ năng/thông tin mới thu nhận được sau khóa huấn luyện như thế nào?

4 Mức độ thỏa mãn của khóa huấn luyện so với nhu cầu

đào tạo?

Đánh giá chung

Nhận xét, góp ý (nếu có):

15

IV.CÁC LOẠI THANG ĐO

4.4. Thang đo tỷ lệ: (Ratio scale) là thang đo khoảng và thực hiện được phép chia.

16

Ví dụ: Xin cho biết mức doanh thu của quý doanh nghiệp trung bình mỗi tháng là bao nhiêu: ……………….

V.THU THẬP THÔNG TIN

5.1. Xác định nội dung thông tin: - Thích đáng - Kịp thời - Chính xác - Khách quan

5.2. Nguồn số liệu:

17

5.2.1. Dữ liệu thứ cấp: là các thông tin đã có sẵn đã qua xử lý. - Số liệu nội bộ: đơn vị, từ các cuộc điều tra trước đây. - Số liệu từ các ấn phẩm của nhà nước http://www.gso.gov.vn - Báo, tạp chí chuyên ngành - Thông tin của các tổ chức, hiệp hội nghề nghiệp - Thông tin từ các công ty hoạt động nghiên cứu thị trường.

V.THU THẬP THÔNG TIN

5.2.2. Dữ liệu sơ cấp: Là các thông tin thu thập từ cuộc điều tra.

1) Điều tra toàn bộ: Là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc tổng thể nghiên cứu. - Ưu điểm: nắm được thông tin toàn bộ

- Nhược điểm:

- Mất nhiều thời gian, tốn kém, đôi khi còn thiếu chính xác.

18

- Trong một số trường hợp không thực hiện được

V.THU THẬP THÔNG TIN

2) Điều tra chọn mẫu: Nghiên cứu một số phần tử đại diện để suy ra toàn bộ tổng thể bằng các phương pháp thống kê.

- Tiết kiệm chi phí

- Cung cấp thông tin kịp thời cho quá trình nghiên cứu

- Đáng tin cậy

19

* Tùy vào từng trường hợp cụ thể mà chúng ta có phương pháp điều tra phù hợp.

V.THU THẬP THÔNG TIN

3. Các phương pháp thu thập thông tin: 1) Quan sát 2) Phương pháp gởi thư

3) Phỏng vấn bằng điện thoại

4) Phỏng vấn trực tiếp:

- Phỏng vấn cá nhân

20

- Phỏng vấn nhóm

V.THU THẬP THÔNG TIN

Đặc điểm của các phương pháp thu thập thông tin

Tính chất

Quan sát

Gởi thư

Phỏng vấn điện thoại

Phỏng vấn trực tiếp

Linh hoạt

Kém

Kém

Tốt

Tốt

Ít

Đầy đủ

Hạn chế

Đầy đủ

Khối lượng thông tin

Chậm

Chậm

Nhanh

Nhanh

Tốc độ thu thập thông tin

Hạn chế

Thấp

Cao

Cao

Tỷ lệ câu hỏi được trả lời

Chi phí

Tốn kém Tiết kiệm Tốn kém Tốn kém

21

V.THU THẬP THÔNG TIN

5.4. Kỹ thuật lấy mẫu: 5.4.1. Chọn mẫu xác suất: (Probability sampling) 1) Chọn mẫu ngẫu nhiên đơn giản: (Simple random sampling) - Rút thăm, thẻ - Sử dụng Excel chọn ngẫu nhiên

22

Ưu điểm: - Đơn giản - Nền tảng là xác suất Nhược điểm: - Phải có danh sách tổng thể - Thời gian và kinh phí cao - Đặc trưng nhóm có thể bị bỏ sót

V.THU THẬP THÔNG TIN

23

V.THU THẬP THÔNG TIN

24

2) Chọn mẫu hệ thống: (Systematic sampling) - Lập danh sách tổng thể: N phần tử - Xác định cỡ mẫu: n phần tử - Chọn phần tử đầu tiên ngẫu nhiên - Chọn tiếp các phần tử còn lại theo bước nhảy: k = N/n Ưu điểm: - Có thể không cần biết lập danh sách tổng thể - Mẫu đại diện hơn Nhược điểm: - Không phù hợp đặc trưng có tính chu kỳ

V.THU THẬP THÔNG TIN

1. Jane

35. Fred

18. Steve

1. Chia đám đông cho qui

2. Bill

36. Mike

19. Sam

3. Harriet

20. Marvin

37. Doug

4. Leni

38. Ed M.

21. Ed. T.

mô mẫu mong muốn: VD: 50/10 = 5

5. Micah

39. Tom

22. Jerry

6. Sara

40. Mike G.

23. Chitra

2. Chọn điểm xuất phát: VD,

7. Terri

24. Clenna

41. Nathan

8. Joan

42. Peggy

25. Misty

43 = Heather

9. Jim

43. Heather

26. Cindy

10. Terrill

44. Debbie

27. Sy

11. Susie

28. Phyllis

45. Cheryl

12. Nona

46. Wes

29. Jerry

13. Doug

47. Genna

30. Harry

14. John S.

31. Dana

48. Ellie

15. Bruce A.

32. Bruce M.

49. Alex

16. Larry

33. Daphne

50. John D.

3. Sau đó chọn thành viên thứ 5 từ điểm xuất phát và lần lượt như vậy cho đến khi hoàn tất danh sách đám đông

17. Bob

34. Phil

25

V.THU THẬP THÔNG TIN

3) Chọn mẫu cả khối/cụm: (Cluster sampling) - Tổng thể chia ra nhiều khối, mỗi khối coi như một quan sát. - Chọn ngẫu nhiên m khối. - Khảo sát tất cả các phần tử trong m khối.

Ví dụ: Nghiên cứu cấp quận, quận có 14 phường. - Chọn ngẫu nhiêu 2 phường. - Khảo sát tất cả các hộ của 2 phường.

26

Ưu điểm: Không cần lập danh sách tổng thể. Chú ý: Các khối có tính chất không quá khác nhau.

V.THU THẬP THÔNG TIN

4) Chọn mẫu nhiều giai đoạn: (Multi-Stage sampling) Chọn mẫu hai giai đoạn: - Tổng thể chia ra nhiều khối, mỗi khối coi như một quan sát. - Chọn ngẫu nhiên m khối (mẫu bậc 1) - Trong mỗi khối khảo sát một số phần tử (mẫu bậc 2)

27

Ví dụ: Nghiên cứu cấp thành phố - Chọn ngẫu nhiên một số quận trong thành phố (mẫu bậc 1) - Mỗi quận chọn ngẫu nhiên một số phường (mẫu bậc 2) - Trong mỗi phường chọn một số hộ (mẫu bậc 3)

V.THU THẬP THÔNG TIN

5) Chọn mẫu phân tầng: (Stratified sampling) - Các phần tử quá khác nhau về tính chất liên quan đến nội dung nghiên cứu. - Tổng thể được chia thành k lớp. - Trong mỗi lớp chọn ngẫu nhiên một số phần tử.

Cách xác định số phần tử cần chọn trong mỗi lớp: - Tổng thể có N phần tử được phân thành k lớp - Mỗi lớp có Ni phần tử.Tỷ trọng từng từng lớp: Ni/N - Chọn mẫu n phần tử, tỷ lệ chọn mẫu p = n/N. - Số phần tử chọn mỗi lớp: + ni = n(Ni/N)

28

+ ni = p.Ni

V.THU THẬP THÔNG TIN

Ví dụ: Khảo sát về sự hài lòng của sinh viên, học viên. Chọn 1.000 sinh viên, học viên để khảo sát.

Hệ/cấp đào tạo

Tỷ trọng (%)

Số lượng cần chọn

Số lượng

Cử nhân hệ chính qui

10.000

50

500

Cử nhân hệ liên thông

2.000

10

100

Cử nhân bằng đại học thứ 2

2.000

10

100

Cử nhân hệ vừa làm vừa học

5.000

25

250

Cao học

1.000

5

50

Tổng

20.000

100

1.000

29

V.THU THẬP THÔNG TIN

Ví dụ: Trường hợp có nhiều nhân tố.

Tỷ lệ chọn mẫu p = 1.000/10.000 = 0,1.

Địa diểm

Giới tính Nông thôn

Thành thị Miền núi

Tổng số

Nam

1.200 [120]

1.200 [120]

600 [60]

3.000 [300]

Nữ

2.800 [280]

2.800 [280]

1.400 [140]

7.000 [700]

Tổng số

4.000 [400]

4.000 [400]

2.000 [200]

10.000 [1.000]

30

V.THU THẬP THÔNG TIN

5.4.1. Chọn mẫu phi xác suất: (Non-Probability sampling)

1) Chọn mẫu thuận tiện: (Convenient sampling)

- Dựa trên tính “dễ tiếp xúc” và cơ hội thuận tiện để chọn mẫu

- Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm 2) Chọn mẫu tích lũy nhanh:

- Chọn ngẫu nhiên một số quan sát ban đầu.

31

- Các mẫu bổ sung tiếp theo được chọn ra từ việc cung cấp qua hình thức giới thiệu của những mẫu ban đầu.

V.THU THẬP THÔNG TIN

3) Chọn mẫu phán đoán: (Judgement sampling)

- Người điều tra quyết định sự thích hợp đối tượng điều tra.

- Mức độ đại diện của mẫu điều tra phụ thuộc vào trình độ và kinh nghiệp của người điều tra và người thu thập số liệu.

4) Chọn mẫu định mức: (Quota sampling)

- Chia tổng thể ra k lớp (như chọn mẫu phân tầng)

32

- Mỗi lớp chọn ra một số phần tử theo phương pháp phi ngẫu nhiên.

www.nguyenngoclam.com

33