21/01/2015
KHÁI QUÁT QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ:
Xác định mục đích, nội dung, đối tượng vấn đề nghiên cứu
xây dựng hệ thống các khái niệm, chỉ tiêu thống kê.
Đieàu tra thoáng keâ
THU THAÄP DÖÕ LIEÄU THOÁNG KEÂ
Xử lý số liệu : - Tập hợp, sắp xếp số liệu. - Chọn các phần mềm xử lý số liệu. - Phân tích thống kê sơ bộ.
Phân tích và giải thích kết quả. Dự đóan xu hướng phát triển của hiện tượng
Viết báo cáo và truyền đạt kết quả nghiên cứu
1
2
XAÙC ÑÒNH DÖÕ LIEÄU CAÀN THU THAÄP
Vấn đề đầu tiên của công việc thu thập dữ liệu:
- Xác định rõ những dữ liệu nào cần thu thập
-
thứ tự ưu tiên của các dữ liệu này.
3
4
1
21/01/2015
- Phản ánh tính chất, sự hơn kém của các đối - Phản ánh mức độ hay mức độ hơn kém tượng nghiên cứu. - Thu thập bằng thang đo bằng thang đo khoảng cách hay thang đo tỉ lệ. - Thu thập bằng thang đo định danh hay thứ bậc - Ví dụ: Số lượng sinh viên của lớp K713QT. - Ví dụ: Sv ở nhà cha mẹ, ở trọ, ktx hay ở nhà bà con người quen,
Secondary Data Compilation
Primary Data Collection
1.SV của trường X có đi làm thêm. 2.Số lượng SV đi làm thêm chiếm 35% 3.Thời gian làm thêm trung bình 12 giờ (3 buổi) mỗi
tuần
4.Tính chất công việc ít liên quan đến ngành nghề đang
Print or Electronic
được đào tạo
5.Mục đích chủ yếu của việc đi làm thêm là lý do kinh
Observation
Survey
tế
6.Việc làm thêm có ảnh hưởng đến kết quả học tập 7.Điểm trung bình học tập của SV đi làm thêm giảm
Experimentation
bình quân là 0,3 điểm
7
2
21/01/2015
Dữ liệu thu thập từ những nguồn có sẵn, đó chính là những dữ liệu đã qua tổng hợp xử lý từ các cơ quan.
Nguồn dữ liệu thứ cấp : - Nội bộ: các số liệu báo cáo về tình hình kinh tế như sx, tiêu thụ, tài chính, nhân sự..của các phòng ban.
- Cơ quan thống kê nhà nước: dữ liệu tổng quát về dân số, lao động, việc làm, giáo dục, mức sống dân cư, tài nguyên…
Ưu điểm -Thu thập nhanh, ít tốn kém chi phí Nhược điểm - Dữ liệu đôi khi ít chi tiết và không đáp ứng đúng nhu cầu nghiên cứu.
- Cơ quan chính phủ - Báo, tạp chí - Các tổ chức hiệp hội, viện nghiên cứu
9
10
Dữ liệu thu thập trực tiếp, ban đầu từ đối
phương pháp thu thập dữ liệu sơ cấp
tượng nghiên cứu.
Ưu điểm - Dữ liệu chi tiết và đáp ứng đúng nhu cầu nghiên cứu Nhược điểm - Tốn kém chi phí và thời gian
12
11
Nghiên cứu thực nghiệm Nghiên cứu quan sát - Khảo sát qua điện thoại -Thư hỏi và các dạng khảo sát viết khác - Quan sát trực tiếp và phỏng vấn cá nhân - PP thu thập khác
3
21/01/2015
ĐTTK
Thu thập thông tin liên tục theo thời gian, theo sát với quá trình biến động của hiện tượng nghiên cứu.
VD : - Điều tra biến động nhân khẩu địa phương
(sinh, tử, đi, đến)
Căn cứ vào t/c liên tục của việc thu thập thông tin
Căn cứ vào phạm vi tổng thể tiến hành điều tra
- Tình hình nhân công tại DN…
Điều tra thường xuyên
Điều tra không thường xuyên
Điều tra toàn bộ
Điều tra không toàn bộ
Đ/t trọng điểm
Đ/t chuyên đề
Đ/t chọn mẫu
13
14
Tiến hành thu thập thông tin không liên tục
Tiến hành điều tra tất cả các đơn vị của tổng thể
nên còn gọi là tổng điều tra.
Phản ánh trạng thái của hiện tượng ở một thời
điểm hay thời kỳ nhất định theo nhu cầu.
VD : Tổng điều tra dân số Tổng điều tra nông nghiệp
Thường dùng cho các hiện tượng cần theo dõi
thường xuyên.
Ưu điểm:cung cấp thông tin đầy đủ về hiện tượng.
Chi phí điều tra lớn, hoặc các hiện tượng không
cần theo dõi thường xuyên.
Nhược điểm: chi phí cao về thời gian, nhân lực,
chi phí.
16
15
4
21/01/2015
Thu thập thông tin của một số đơn vị được chọn từ
tổng thể chung.
Điều tra trọng điểm
Điều tra chuyên đề
Mục đích : Có thông tin làm căn cứ nhận định hoặc suy rộng cho tổng thể chung.
Điều tra chọn mẫu
17
18
Chỉ tiến hành thu thập thông tin ở bộ phận chủ yếu (bộ phận chiếm tỷ trọng lớn) của tổng thể chung.
Là điều tra trên một số ít các đơn vị của tổng thể nhưng lại đi sâu nghiên cứu nhiều khía cạnh của đơn vị đó.
Kết quả điều tra không dùng để suy rộng cho toàn tổng thể nhưng giúp cho việc nắm được những đặc điểm cơ bản của hiện tượng.
Thường dùng nghiên cứu những điển hình (tốt, xấu) để tìm hiểu nguyên nhân, rút kinh nghiệm
Thích hợp với những tổng thể có các bộ phận
tương đối tập trung, chiếm tỷ trọng lớn trong tổng thể.
Kết quả điều tra không dùng để suy rộng hoặc làm căn cứ đánh giá tình hình cơ bản của hiện tượng.
19
20
5
21/01/2015
Là tiến hành điều tra thu thập thông tin trên một số đơn vị của tổng thể chung theo phương pháp khoa học sao cho các đơn vị này phải đại diện cho cả tổng thể chung đó.
Sample(Mẫu)
Probability(Xác suất)
Non-Probability Samples (Phi xác suất)
Simple Random (ngẫu nhiên đơn giản)
Kết quả điều tra dùng để suy rộng cho cả tổng thể chung. Ưu điểm : tiết kiệm thời gian ,chi phí và dữ liệu đáng tin
Stratified (phân tầng)
cậy
Judgement (Phán đoán)
Convenient (thuận tiện)
Systematic (hệ thống)
Cluster (cụm)
Quota (định mức)
21
Các đơn vị mẫu được chọn ở tại một địa điểm
Chọn mẫu thuận tiện
Chọn mẫu phán đoán
Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận
và vào một thời gian nhất định
Chọn mẫu định mức
Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm, không dùng cho nghiên cứu mô tả hay nhân quả vì tính đại diện không cao
23
24
tiện” để chọn mẫu
6
21/01/2015
Vd: chọn mẫu những người đi mua sắm ở Metro CT và tiếp cận họ khi họ bước vào sthị hoặc khi họ mua sắm món hàng mà ta muốn khảo sát.
Các đơn vị mẫu được chọn dựa vào sự phán đoán của người nghiên cứu mà họ nghĩ rằng những mẫu này có thể đại diện cho tổng thể
Ưu điểm: dễ dàng tập hợp các đơn vị mẫu
Cách chọn mẫu này được dùng phổ biến
Nhược điểm: không đạt được độ xác thực
khi nghiên cứu định tính
25
26
Là chọn mẫu theo tỷ lệ gần đúng của các nhóm đại diện trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi nhóm
Ví dụ: Chọn mẫu một số ít liên doanh lớn có thể chiếm phần lớn tổng sản lượng ngành công nghiệp cả nước.
Tổng thể quá lớn, sự khác biệt (biến động) giữa các
cao
Ưu điểm: chọn đúng phần tử rất quan
phần tử không lớn
Tổng thể đã được phân tổ nhóm trước (đồng nhất) PVV chỉ cần chọn cho đủ số lượng không cần ngẫu nhiên
Nhược điểm: có khả năng phát sinh những
Ưu điểm: đảm bảo được số mẫu cần thiết cho từng
trọng của tổng thể
Nhược điểm: có thể cho kết quả sai lệch
27
28
sai lệch lớn nhóm trong tổng thể phục vụ khách hàng
7
21/01/2015
Dựa vào lý thuyết xác suất để lấy mẫu ngẫu
Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải khát để so sánh kết quả thống kê về thái độ khách hàng. Hoặc tổng thể NC bao gồm 1.000 c.ty, trong đó 600 c.ty vừa và nhỏ, 300 trung bình và 100 qui mô lớn. Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60 c.ty vừa và nhỏ, 30 trung bình và 10 c.ty lớn
Một số cách chọn mẫu xác suất Chọn mẫu ngẫu nhiên đơn giản Chọn mẫu có hệ thống Chọn mẫu ngẫu nhiên phân tầng Chọn mẫu cả cụm
Vd: ý thức tham gia giao thông của SV ĐHCT (có thể chọn bất kỳ sinh viên nam nữ nào vì trong trường hợp này thì giới tính không có sự khác biệt lớn)
29
30
nhiên
Là cách chọn mẫu mà mỗi phần tử trong tổng thể có cùng cơ hội được chọn với xác suất như nhau. Để chọn được mẫu, người NC phải có danh sách tổng thể NC
Chọn ngẫu nhiên mẫu đầu tiên. Sau đó dùng bước nhảy (lặp đi lặp lại) Áp dụng tốt nếu danh sách tổng thể được xếp ngẫu nhiên (giảm sai lệch do tuần hoàn bước nhảy)
Vd: PV các hộ gia đình vùng nông thôn
Vd: Chọn ngẫu nhiên 100 mẫu sinh viên trong tổng số 4.000 sinh viên Khoa Kinh Tế & QTKD.
31
32
8
21/01/2015
Xác suất
Phi xác suât
Là phân chia các đối tượng nghiên cứu thành các nhóm, tầng theo các đặc tính, sau đó lấy mẫu theo tầng, nhóm.
Ưu điểm
Tiết kiệm thời gian và chi phí.
Tính đại diện cao. Khái quát hóa cho tổng thể.
Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức nào đó gọi là tiêu thức phân tầng (thu nhập, giới tính, tuổi tác, TĐHV, nhân khẩu,…).
Nhược điểm
Tính đại diện thấp.
Tốn kém thời gian và chi phí.
Chọn ngẫu nhiên hay hệ thống trong từng nhóm
Phạm vi sử dụng
phân tầng theo tỷ lệ với nhóm.
Nghiên cứu thăm dò, thử nghiệm.
Nghiên cứu mô tả, nhân quả và khám phá.
Ưu điểm: Phổ biến nhất vì tính chính xác và đại
diện cao.
34
33
Decide on sample size: n
Every individual or item from the frame has
Divide frame of N individuals into groups of k
an equal chance of being selected
individuals: k=n/n
Selection may be with replacement or
Randomly select one individual from the 1st group
without replacement
Select every k-th individual thereafter
Samples obtained from table of random numbers or computer random number generators
N = 64
n = 8
First Group
k = 8
Basic Business Statistics, 8e © 2002 Prentice-Hall, Inc.
Chap 1-35
9
21/01/2015
Population divided into several “clusters,” each
representative of the population
Population divided into two or more groups according to some common characteristic
Simple random sample selected from each
Simple random sample selected from each group
The samples are combined into one
The two or more samples are combined into one
Basic Business Statistics, 8e © 2002 Prentice-Hall, Inc.
Chap 1-38
Simple random sample and systematic sample
Kế hoạch điều tra là gì ?
Simple to use May not be a good representation of the population’s
underlying characteristics
Stratified sample
Ensures representation of individuals across the entire
population Cluster sample
More cost effective Less efficient (need larger sample to acquire the same
- Là một tài liệu dưới dạng văn bản: + đề cập những vấn đề hoặc cần được hiểu + thống nhất, trình tự và phương pháp tiến hành cuộc điều tra. + những vấn đề thuộc về chuẩn bị và tổ chức toàn bộ cuộc điều tra.
level of precision)
Population divided into 4 clusters.
10
21/01/2015
- Mô tả mục đích điều tra
1 MỤC TIÊU Giúp đáp viên hiểu đúng nội dung câu hỏi.
- Xác định đối tượng điều tra và đơn vị điều tra
Động viên, tranh thủ sự cộng tác.
- Nội dung điều tra (mục lục các tiêu thức cần thu
thập dữ liệu trên các đơn vị điều tra)
Hướng dẫn cách trả lời.
- Xác định thời điểm thời kì điều tra.
Tối thiểu các sai sót có thể xảy ra khi đáp
viên trả lời.
- Biểu điều tra và bảng giải thích cách ghi biểu
41
42
2 NỘI DUNG BẢN CÂU HỎI
2 NỘI DUNG BẢN CÂU HỎI
Giới thiệu bản thân phỏng vấn viên.
Phần giới thiệu
Giới thiệu lý do, mục đích nghiên cứu.
Phần sàng lọc Chọn đúng đối tượng để thu dữ liệu. Thường dùng BCH phân đôi.
Khoảng thời gian cần thiết để hoàn thành.
Phần nội dung chính Đa số câu hỏi liên quan đến nội dung NC.
43
44
Phần quản lý: xác nhận, lời cam đoan, mẫu số.
11
21/01/2015
Nghiên cứu số
Vùng, địa phương
Bảng câu hỏi
Phỏng vấn viên
Phỏng vấn lúc
Thời gian phỏng vấn
Giám sát viên
Kết luận của GSV
Kiểm tra viên
Kết quả kiểm tra
Phần giới thiệu
Tên người trả lời
Địa chỉ
Điện thoại
46
45
Xin chào, tôi là thuộc nhóm nghiên cứu . Chúng tôi đang thực hiện đề tài. Anh (chị) vui lòng dành chút thời gian khoảng để giúp chúng tôi trả lời một số câu hỏi dưới đây. Chúng tôi rất hoan nghênh sự cộng tác và giúp đỡ của anh (chị). Các ý kiến trả lời của anh (chị) sẽ được đảm bảo giữ bí mật tuyệt đối.
Dự án nghiên cứu
Bảng câu hỏi
Nhóm người trả lời
2 XÁC ĐỊNH HÌNH THỨC PHỎNG VẤN 1 Xác định thông tin cần thiết • Thư tín: tiện lợi, chi phí thấp nhưng tỷ lệ trả
Danh mục các thông tin cần có
Các câu hỏi cần được chi tiết
Các dữ liệu cần thu thập
lời thấp, khó xác định độ tin cậy của thông tin được thu thập.
Vd: năng suất lúa
Sản lượng từng vụ Diện tích từng vụ
• Điện thoại: tốn kém, chỉ áp dụng khi thu thập ít thông tin và thời gian phỏng vấn ngắn; thông tin tương đối tin cậy
Sản lượng đã thu hoạch Diện tích gieo trồng
47
48
• Trực tiếp: thông tin tin cậy, tỷ lệ trả lời cao nhưng tốn kém
12
21/01/2015
Câu hỏi MỞ:
Câu hỏi ĐÓNG:
• Phần trả lời không định trước, đáp viên tự trả lời theo suy nghĩ
Câu trả lời được soạn sẵn, đáp viên chỉ chọn những trả lời sẵn có.
• Khai thác ý kiến mới.
Ví dụ:
• Tạo quan hệ mật thiết khi trả lời.
•Ông (bà) trồng lúa theo mô hình 3g3t
1. Có (tiếp tục)
2. Không (tạm dừng)
• Khó tập hợp, mã hóa, phân tích.
• Không phù hợp với phỏng vấn bằng thư tín.
•Ông (bà) gặp những khó khăn nào trong canh tác lúa? Vốn Lao động Công nghệ Thời tiết
• Khó khăn khi đáp viên trả lời dài dòng, lạc đề.
49
50
3 LỰA CHỌN CẤU TRÚC CÂU HỎI 3 LỰA CHỌN CẤU TRÚC CÂU HỎI
5 ĐIỀU CHỈNH BCH • Tiến hành điều tra thử (pretest, pilot survey) 4 TỪ NGỮ SỬ DỤNG TRONG BCH • Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ:
• Bổ sung, chỉnh sửa nếu có Who, What, Where, When, Why, How. • Sử dụng từ ngữ đơn giản, thông dụng. • Tránh dùng từ ngữ trừu tượng. (Vd: đi sthị có thường không?) • Những cuộc phỏng vấn mô phỏng. • Tránh dùng câu hỏi có 2 vế song song (vừa - vừa). • Cẩn thận câu hỏi liên quan đến tự ái cá nhân. (hỏi • Câu trả lời không đầy đủ, lạc đề, sai nội dung, không về trình độ,..). đọc được. • Ý nghĩa từ ngữ được sử dụng? Có nghĩa nào khác không? • Hiệu chỉnh sai sót thông qua các BCH khác. • Từ đồng âm khác nghĩa. • Từ địa phương (vd: lợn-heo, trà-chè,…) • Dùng viết khác màu để chỉnh sửa.
51
52
• Thống nhất nguyên tắc chỉnh lý chung.
13
21/01/2015
6 NHẬP SỐ LIỆU • Mã hóa các câu hỏi và trả lời trước khi nhập. 7 XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU • Mã hóa các câu hỏi và trả lời trước khi nhập.
• Soạn thảo các tập tin mô tả việc mã hóa để phục vụ • Soạn thảo các tập tin mô tả việc mã hóa để phục vụ cho việc đọc số liệu trong tập tin dữ liệu. cho việc đọc số liệu trong tập tin dữ liệu.
• Nhập số liệu vào máy tính, các phần mềm xử lý bảng • Nhập số liệu vào máy tính, các phần mềm xử lý bảng tính: Excel, SPSS, Stata, Limdep, … tính: Excel, SPSS, Stata, Limdep, …
• Kiểm tra độ chính xác của việc nhập: so sánh ngẫu • Kiểm tra độ chính xác của việc nhập: so sánh ngẫu
53
54
Những câu hỏi cần trả lời
Các bước cần thực hiện
Các công việc chính trong mỗi bước
Các số liệu đã được thu thập cho mỗi mục tiêu NC là gì?
-Xem xét lại việc thu thập tại thực địa,
Chuẩn bị số liệu cho phân tích
nhiên một số mẫu; tổ chức nhiều người nhập liệu song song, … nhiên một số mẫu; tổ chức nhiều người nhập liệu song song, …
Số liệu có hoàn chỉnh và chính xác không?
-Lập bảng kiểm kê các số liệu cho mỗi mục tiêu,
-Xếp thứ tự các số liệu và kiểm tra chất lượng,
-Kiểm tra output của máy tính
Các số liệu trông như thế nào?
Các số liệu có thể được tóm tắt như thế nào cho phân tích đơn giản?
Tóm tắt số liệu và mô tả các biến/xác định biến mới
Bảng tần suất, biểu đồ, biểu đồ phát triển, tỷ trọng, tần suất chéo, hệ số tương quan, các thống kê mô tả, …
56
55
i. Phân tích thống kê mô tả Độ tập trung: mean, mode, median. Độ phân tán:phương sai, độ lệch chuẩn, dãy biến động, hệ số biến động. ii. Phân tích tần số: đếm tần số xuất hiện, đồ thị phân phối tần số. iii. Phân tích phương sai: một chiều, nhiều chiều iv. Phân tích hồi quy tương quan, …
14
21/01/2015
-Bảng tần suất chéo,
-Chuẩn bị dàn ý của báo cáo,
-Đo lường sự tương quan,
-Trình bày và diễn dịch số liệu,
Phân tích sự tương quan
Sự tương quan giữa các biến số được xác định như thế nào?
-Xử lý các biến nhiễu.
-Bản nháp và bản nháp lần 2.
Báo cáo nên được viết như thế nào?
Viết báo cáo và xây dựng các kiến nghị
-Thảo luận và tóm tắt kết luận
-Xây dựng kiến nghị
Chuẩn bị cho phân tích thống kê
- Các đo lường sự phân tán, phân phối chuẩn và sự biến động mẫu
Xác định loại của phân tích thống kê
- Lựa chọn các kiểm định về mức ý nghĩa
Có đo lường sự chênh lệch hay tương quan giữa các biến không?
T-test, chi-square test
Những kết quả và kiến nghị nên được công bố và sử dụng như thế nào?
Thảo luận những tóm tắt và kế hoạch thực hiện đối với những người liên quan
paired t-test
Phân tích các quan sát theo cặp và lẻ
Trình bày tóm tắt và bản nháp cho việc thực hiện các kiến nghị
Làm thế nào sự khác biệt giữa các nhóm có thể được xác định?
Mc-Nemar’s chi-square test
Biểu đồ phân tán,
Đường hồi quy, và
Làm thế nào sự tương quan giữa các biến có thể được xác định?
Thực hiện các đo lường về sự tương quan
Hệ số tương quan
57
58
+ Làm tốt công tác chuẩn bị điều tra
Sai số do đăng kí: sai số này phát sinh do việc ghi chép tài liệu không chính xác , do khai báo sai,..
+ Theo dõi, kiểm tra quá trình điều tra.
+ Làm tốt công tác tuyên truyền vận động
Sai số do tính chất đại biểu: sai số này chỉ xảy ra trong điều tra không toàn bộ, đặc biệt là điều tra chọn mẫu.
59
60
15
21/01/2015
Coverage error
Excluded from frame.
Non response error
Follow up on non
responses.
Sampling error
Chance differences from sample to sample.
Measurement error