intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Thống kê kinh tế - Chương 2: Thu thập dữ liệu thống kê

Chia sẻ: Lê Thị Na | Ngày: | Loại File: PDF | Số trang:16

287
lượt xem
20
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nội dung chương 2 của Bài giảng Thống kê kinh tế trình bày cách xác định dữ liệu cần thu thập, dữ liệu định tính và dữ liệu định lượng, các loại điều tra thống kê, thiết kế bảng câu hỏi, sai số trong điều tra thống kê.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Thống kê kinh tế - Chương 2: Thu thập dữ liệu thống kê

  1. 21/01/2015 KHÁI QUÁT QUÁ TRÌNH NGHIÊN CỨU THỐNG KÊ: Xác định mục đích, nội dung, đối tượng vấn đề nghiên cứu xây dựng hệ thống các khái niệm, chỉ tiêu thống kê. Đieàu tra thoáng keâ Xử lý số liệu : THU THAÄP DÖÕ LIEÄU THOÁNG KEÂ - Tập hợp, sắp xếp số liệu. - Chọn các phần mềm xử lý số liệu. - Phân tích thống kê sơ bộ. Phân tích và giải thích kết quả. Dự đóan xu hướng phát triển của hiện tượng Viết báo cáo và truyền đạt kết quả nghiên cứu 1 2 XAÙC ÑÒNH DÖÕ LIEÄU CAÀN THU THAÄP Vấn đề đầu tiên của công việc thu thập dữ liệu: Data - Xác định rõ những dữ liệu nào cần thu thập Categorical Numerical (Qualitative) (Quantitative) - thứ tự ưu tiên của các dữ liệu này. Discrete Continuous 3 4 1
  2. 21/01/2015 - Phản ánh tính chất, sự hơn kém của các đối - Phản ánh mức độ hay mức độ hơn kém tượng nghiên cứu. - Thu thập bằng thang đo bằng thang đo - Thu thập bằng thang đo định danh hay thứ khoảng cách hay thang đo tỉ lệ. bậc - Ví dụ: Số lượng sinh viên của lớp K713QT. - Ví dụ: Sv ở nhà cha mẹ, ở trọ, ktx hay ở nhà bà con người quen, 1.SV của trường X có đi làm thêm. 2.Số lượng SV đi làm thêm chiếm 35% Primary Secondary 3.Thời gian làm thêm trung bình 12 giờ (3 buổi) mỗi Data Collection Data Compilation tuần 4.Tính chất công việc ít liên quan đến ngành nghề đang Print or Electronic được đào tạo 5.Mục đích chủ yếu của việc đi làm thêm là lý do kinh Observation Survey tế 6.Việc làm thêm có ảnh hưởng đến kết quả học tập 7.Điểm trung bình học tập của SV đi làm thêm giảm Experimentation bình quân là 0,3 điểm 7 2
  3. 21/01/2015 Nguồn dữ liệu thứ cấp : Dữ liệu thu thập từ những nguồn có sẵn, đó chính là những dữ liệu đã qua tổng - Nội bộ: các số liệu báo cáo về tình hình hợp xử lý từ các cơ quan. kinh tế như sx, tiêu thụ, tài chính, nhân sự..của các phòng ban. - Cơ quan thống kê nhà nước: dữ liệu tổng  Ưu điểm quát về dân số, lao động, việc làm, giáo -Thu thập nhanh, ít tốn kém chi phí dục, mức sống dân cư, tài nguyên… Nhược điểm - Cơ quan chính phủ - Dữ liệu đôi khi ít chi tiết và không đáp - Báo, tạp chí ứng đúng nhu cầu nghiên cứu. - Các tổ chức hiệp hội, viện nghiên cứu 9 10 Dữ liệu thu thập trực tiếp, ban đầu từ đối phương pháp tượng nghiên cứu. thu thập dữ liệu sơ cấp Nghiên cứu quan sát Ưu điểm - Khảo sát qua điện thoại - Dữ liệu chi tiết và đáp ứng đúng nhu cầu -Thư hỏi và các dạng khảo sát viết khác Nghiên cứu thực nghiệm - Quan sát trực tiếp và phỏng vấn cá nhân nghiên cứu - PP thu thập khác Nhược điểm - Tốn kém chi phí và thời gian 11 12 3
  4. 21/01/2015  Thu thập thông tin liên tục theo thời gian, theo sát ĐTTK với quá trình biến động của hiện tượng nghiên cứu.  VD : - Điều tra biến động nhân khẩu địa phương Căn cứ vào t/c liên tục Căn cứ vào phạm vi của việc thu thập thông tin tổng thể tiến hành điều tra (sinh, tử, đi, đến) - Tình hình nhân công tại DN… Điều tra Điều tra không Điều tra Điều tra không thường xuyên thường xuyên toàn bộ toàn bộ Đ/t Đ/t Đ/t trọng chuyên chọn điểm đề mẫu 13 14  Tiến hành thu thập thông tin không liên tục  Tiến hành điều tra tất cả các đơn vị của tổng thể nên còn gọi là tổng điều tra.  Phản ánh trạng thái của hiện tượng ở một thời điểm hay thời kỳ nhất định theo nhu cầu.  VD : Tổng điều tra dân số  Thường dùng cho các hiện tượng cần theo dõi Tổng điều tra nông nghiệp thường xuyên.  Ưu điểm:cung cấp thông tin đầy đủ về hiện tượng.  Chi phí điều tra lớn, hoặc các hiện tượng không cần theo dõi thường xuyên.  Nhược điểm: chi phí cao về thời gian, nhân lực, chi phí. 15 16 4
  5. 21/01/2015  Thuthập thông tin của một số đơn vị được chọn từ tổng thể chung.  Điều tra trọng điểm Mục đích : Có thông tin làm căn cứ nhận định hoặc suy rộng cho  Điều tra chuyên đề tổng thể chung.  Điều tra chọn mẫu 17 18  Chỉ tiến hành thu thập thông tin ở bộ phận chủ yếu  Làđiều tra trên một số ít các đơn vị của tổng thể (bộ phận chiếm tỷ trọng lớn) của tổng thể chung. nhưng lại đi sâu nghiên cứu nhiều khía cạnh của đơn vị đó.  Kết quả điều tra không dùng để suy rộng cho toàn tổng thể nhưng giúp cho việc nắm được  Thường dùng nghiên cứu những điển hình (tốt, những đặc điểm cơ bản của hiện tượng. xấu) để tìm hiểu nguyên nhân, rút kinh nghiệm  Thích hợp với những tổng thể có các bộ phận tương đối tập trung, chiếm tỷ trọng lớn trong tổng  Kếtquả điều tra không dùng để suy rộng hoặc thể. làm căn cứ đánh giá tình hình cơ bản của hiện tượng. 19 20 5
  6. 21/01/2015  Là tiến hành điều tra thu thập thông tin trên một số đơn Sample(Mẫu) vị của tổng thể chung theo phương pháp khoa học sao cho các đơn vị này phải đại diện cho cả tổng thể chung đó. Non-Probability Probability(Xác suất) Samples (Phi xác  Kết quả điều tra dùng để suy rộng cho cả tổng thể chung. suất) Simple Random  Ưu điểm : tiết kiệm thời gian ,chi phí và dữ liệu đáng tin (ngẫu nhiên đơn giản) Stratified cậy Judgement Convenient (thuận (phân tầng) (Phán đoán) tiện) Systematic (hệ thống) Cluster (cụm) Quota (định mức) 21  Các đơn vị mẫu được chọn ở tại một địa điểm  Chọn mẫu thuận tiện và vào một thời gian nhất định  Chọn mẫu phán đoán  Dựa trên tính “dễ tiếp xúc” và “cơ hội thuận tiện” để chọn mẫu  Chọn mẫu định mức  Chỉ dùng cho nghiên cứu thăm dò, trắc nghiệm, không dùng cho nghiên cứu mô tả hay nhân quả vì tính đại diện không cao 23 24 6
  7. 21/01/2015  Vd: chọn mẫu những người đi mua sắm ở Metro CT và tiếp cận họ khi họ bước vào Các đơn vị mẫu được chọn dựa vào sự sthị hoặc khi họ mua sắm món hàng mà ta muốn khảo sát. phán đoán của người nghiên cứu mà họ nghĩ rằng những mẫu này có thể đại diện cho tổng thể  Ưu điểm: dễ dàng tập hợp các đơn vị mẫu  Nhược điểm: không đạt được độ xác thực Cách chọn mẫu này được dùng phổ biến cao khi nghiên cứu định tính 25 26  Ví dụ: Chọn mẫu một số ít liên doanh lớn  Là chọn mẫu theo tỷ lệ gần đúng của các nhóm đại diện có thể chiếm phần lớn tổng sản lượng trong tổng thể hoặc theo số mẫu được chỉ định cho mỗi nhóm ngành công nghiệp cả nước.  Tổng thể quá lớn, sự khác biệt (biến động) giữa các phần tử không lớn  Ưuđiểm: chọn đúng phần tử rất quan trọng của tổng thể  Tổng thể đã được phân tổ nhóm trước (đồng nhất) PVV chỉ cần chọn cho đủ số lượng không cần ngẫu nhiên  Nhược điểm: có khả năng phát sinh những  Ưuđiểm: đảm bảo được số mẫu cần thiết cho từng sai lệch lớn nhóm trong tổng thể phục vụ khách hàng  Nhược điểm: có thể cho kết quả sai lệch 27 28 7
  8. 21/01/2015  Ví dụ: Chọn 100 phần tử cho mỗi nhãn hiệu nước giải  Dựavào lý thuyết xác suất để lấy mẫu ngẫu khát để so sánh kết quả thống kê về thái độ khách nhiên hàng. Hoặc tổng thể NC bao gồm 1.000 c.ty, trong đó 600 c.ty vừa và nhỏ, 300 trung bình và 100 qui mô lớn. Số mẫu chỉ định là 10% trên tổng thể, ta sẽ chọn 60  Một số cách chọn mẫu xác suất c.ty vừa và nhỏ, 30 trung bình và 10 c.ty lớn  Chọn mẫu ngẫu nhiên đơn giản  Chọn mẫu có hệ thống  Vd: ý thức tham gia giao thông của SV ĐHCT (có thể  Chọn mẫu ngẫu nhiên phân tầng chọn bất kỳ sinh viên nam nữ nào vì trong trường hợp  Chọn mẫu cả cụm này thì giới tính không có sự khác biệt lớn) 29 30 Là cách chọn mẫu mà mỗi phần tử trong  Chọn ngẫu nhiên mẫu đầu tiên. tổng thể có cùng cơ hội được chọn với  Sau đó dùng bước nhảy (lặp đi lặp lại) xác suất như nhau. Để chọn được mẫu,  Áp dụng tốt nếu danh sách tổng thể được xếp ngẫu nhiên (giảm sai lệch do tuần hoàn bước người NC phải có danh sách tổng thể NC nhảy)  Vd: PV các hộ gia đình vùng nông thôn Vd: Chọn ngẫu nhiên 100 mẫu sinh viên trong tổng số 4.000 sinh viên Khoa Kinh Tế & QTKD. 31 32 8
  9. 21/01/2015  Là phân chia các đối tượng nghiên cứu thành các Xác suất Phi xác suât nhóm, tầng theo các đặc tính, sau đó lấy mẫu theo tầng, nhóm. Ưu điểm Tính đại diện cao. Tiết kiệm thời gian Khái quát hóa cho và chi phí.  Chia tổng thể ra từng nhóm nhỏ theo 1 tiêu thức tổng thể. nào đó gọi là tiêu thức phân tầng (thu nhập, giới tính, tuổi tác, TĐHV, nhân khẩu,…). Nhược điểm Tốn kém thời gian và Tính đại diện thấp. chi phí.  Chọn ngẫu nhiên hay hệ thống trong từng nhóm phân tầng theo tỷ lệ với nhóm. Phạm vi sử dụng Nghiên cứu mô tả, Nghiên cứu thăm nhân quả và khám dò, thử nghiệm. phá.  Ưu điểm: Phổ biến nhất vì tính chính xác và đại diện cao. 34 33  Every individual or item from the frame has  Decide on sample size: n an equal chance of being selected  Divide frame of N individuals into groups of k  Selection may be with replacement or individuals: k=n/n without replacement  Randomly select one individual from the 1st group  Samples obtained from table of random  Select every k-th individual thereafter numbers or computer random number generators N = 64 n=8 First Group Basic Business Statistics, 8e © 2002 Prentice-Hall, Inc. k=8 Chap 1-35 9
  10. 21/01/2015  Population divided into two or more groups  Population divided into several “clusters,” each according to some common characteristic representative of the population  Simple random sample selected from each group  Simple random sample selected from each  The two or more samples are combined into one  The samples are combined into one Population divided into 4 Basic Business Statistics, 8e © 2002 clusters. Prentice-Hall, Inc. Chap 1-38  Simple random sample and systematic sample  Kế hoạch điều tra là gì ?  Simple to use  May not be a good representation of the population’s underlying characteristics - Là một tài liệu dưới dạng văn bản:  Stratified sample + đề cập những vấn đề hoặc cần được hiểu  Ensures representation of individuals across the entire population + thống nhất, trình tự và phương pháp tiến hành cuộc  Cluster sample điều tra.  More cost effective + những vấn đề thuộc về chuẩn bị và tổ chức toàn bộ  Less efficient (need larger sample to acquire the same cuộc điều tra. level of precision) 10
  11. 21/01/2015 - Mô tả mục đích điều tra 1 MỤC TIÊU  Giúp đáp viên hiểu đúng nội dung câu hỏi. - Xác định đối tượng điều tra và đơn vị điều tra  Động viên, tranh thủ sự cộng tác. - Nội dung điều tra (mục lục các tiêu thức cần thu thập dữ liệu trên các đơn vị điều tra)  Hướng dẫn cách trả lời. - Xác định thời điểm thời kì điều tra.  Tối thiểu các sai sót có thể xảy ra khi đáp viên trả lời. - Biểu điều tra và bảng giải thích cách ghi biểu 41 42 2 NỘI DUNG BẢN CÂU HỎI 2 NỘI DUNG BẢN CÂU HỎI Phần giới thiệu Phần sàng lọc  Chọn đúng đối tượng để thu dữ liệu.  Giới thiệu bản thân phỏng vấn viên.  Thường dùng BCH phân đôi.  Giới thiệu lý do, mục đích nghiên cứu. Phần nội dung chính  Đa số câu hỏi liên quan đến nội dung NC.  Khoảng thời gian cần thiết để hoàn thành. Phần quản lý: xác nhận, lời cam đoan, mẫu số. 43 44 11
  12. 21/01/2015 Phần giới thiệu Nghiên cứu số Vùng, địa phương Xin chào, tôi là thuộc nhóm nghiên cứu . Chúng tôi đang thực hiện đề tài. Anh (chị) vui lòng Bảng câu hỏi Phỏng vấn viên dành chút thời gian khoảng để giúp chúng tôi trả Phỏng vấn lúc Thời gian phỏng vấn lời một số câu hỏi dưới đây. Chúng tôi rất hoan nghênh sự cộng tác và giúp đỡ của anh (chị). Các ý kiến trả lời của anh (chị) sẽ Giám sát viên Kết luận của GSV được đảm bảo giữ bí mật tuyệt đối. Kiểm tra viên Kết quả kiểm tra Tên người trả lời Địa chỉ Điện thoại 46 45 1 Xác định thông tin cần thiết 2 XÁC ĐỊNH HÌNH THỨC PHỎNG VẤN • Thư tín: tiện lợi, chi phí thấp nhưng tỷ lệ trả Dự án nghiên cứu Bảng câu hỏi Nhóm người trả lời lời thấp, khó xác định độ tin cậy của thông tin được thu thập. Danh mục các Các câu hỏi cần Các dữ liệu cần thu • Điện thoại: tốn kém, chỉ áp dụng khi thu thập thông tin cần có được chi tiết thập ít thông tin và thời gian phỏng vấn ngắn; thông tin tương đối tin cậy Vd: năng suất lúa Sản lượng từng vụ Sản lượng đã thu Diện tích từng vụ hoạch • Trực tiếp: thông tin tin cậy, tỷ lệ trả lời cao Diện tích gieo trồng nhưng tốn kém 47 48 12
  13. 21/01/2015 3 LỰA CHỌN CẤU TRÚC CÂU HỎI 3 LỰA CHỌN CẤU TRÚC CÂU HỎI Câu hỏi MỞ: Câu hỏi ĐÓNG: • Phần trả lời không định trước, đáp viên tự trả lời theo suy nghĩ Câu trả lời được soạn sẵn, đáp viên chỉ chọn những trả lời sẵn có. • Khai thác ý kiến mới. Ví dụ: • Tạo quan hệ mật thiết khi trả lời. •Ông (bà) trồng lúa theo mô hình 3g3t 1. Có (tiếp tục) 2. Không (tạm dừng) • Khó tập hợp, mã hóa, phân tích. •Ông (bà) gặp những khó khăn nào trong canh tác lúa? Vốn  Lao động  • Không phù hợp với phỏng vấn bằng thư tín. Công nghệ  Thời tiết  • Khó khăn khi đáp viên trả lời dài dòng, lạc đề. 49 50 4 TỪ NGỮ SỬ DỤNG TRONG BCH 5 ĐIỀU CHỈNH BCH • Câu hỏi phải diễn đạt vấn đề rõ ràng, dùng các từ: • Tiến hành điều tra thử (pretest, pilot survey) Who, What, Where, When, Why, How. • Sử dụng từ ngữ đơn giản, thông dụng. • Bổ sung, chỉnh sửa nếu có • Tránh dùng từ ngữ trừu tượng. (Vd: đi sthị có thường không?) • Những cuộc phỏng vấn mô phỏng. • Tránh dùng câu hỏi có 2 vế song song (vừa - vừa). • Cẩn thận câu hỏi liên quan đến tự ái cá nhân. (hỏi về trình độ,..). • Câu trả lời không đầy đủ, lạc đề, sai nội dung, không • Ý nghĩa từ ngữ được sử dụng? Có nghĩa nào khác đọc được. không? • Từ đồng âm khác nghĩa. • Hiệu chỉnh sai sót thông qua các BCH khác. • Từ địa phương (vd: lợn-heo, trà-chè,…) • Dùng viết khác màu để chỉnh sửa. 51 • Thống nhất nguyên tắc chỉnh lý chung. 52 13
  14. 21/01/2015 6 NHẬP SỐ LIỆU 7 XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU • Mã hóa các câu hỏi và trả lời trước khi nhập. • Mã hóa các câu hỏi và trả lời trước khi nhập. • Soạn thảo các tập tin mô tả việc mã hóa để phục vụ • Soạn thảo các tập tin mô tả việc mã hóa để phục vụ cho việc đọc số liệu trong tập tin dữ liệu. cho việc đọc số liệu trong tập tin dữ liệu. • Nhập số liệu vào máy tính, các phần mềm xử lý bảng • Nhập số liệu vào máy tính, các phần mềm xử lý bảng tính: Excel, SPSS, Stata, Limdep, … tính: Excel, SPSS, Stata, Limdep, … • Kiểm tra độ chính xác của việc nhập: so sánh ngẫu • Kiểm tra độ chính xác của việc nhập: so sánh ngẫu nhiên một số mẫu; tổ chức nhiều người nhập liệu song nhiên một số mẫu; tổ chức nhiều người nhập liệu song song, … song, … 53 54 Những câu hỏi Các bước cần Các công việc chính trong i. Phân tích thống kê mô tả cần trả lời thực hiện mỗi bước  Độ tập trung: mean, mode, median. Các số liệu đã được thu thập cho mỗi mục tiêu NC là gì? Chuẩn bị số liệu cho -Xem xét lại việc thu thập tại thực địa,  Độ phân tán:phương sai, độ lệch chuẩn, phân tích Số liệu có hoàn chỉnh và chính -Lập bảng kiểm kê các số liệu cho mỗi xác không? dãy biến động, hệ số biến động. mục tiêu, -Xếp thứ tự các số liệu và kiểm tra ii. Phân tích tần số: đếm tần số xuất hiện, chất lượng, đồ thị phân phối tần số. Các số liệu trông như thế nào? -Kiểm tra output của máy tính iii. Phân tích phương sai: một chiều, nhiều Các số liệu có thể được tóm tắt như thế nào cho phân tích đơn Tóm tắt số liệu và mô Bảng tần suất, biểu đồ, biểu đồ tả các biến/xác định phát triển, tỷ trọng, tần suất chéo, chiều giản? biến mới hệ số tương quan, các thống kê iv. Phân tích hồi quy tương quan, … mô tả, … 56 55 14
  15. 21/01/2015 -Bảng tần suất chéo, -Chuẩn bị dàn ý của báo cáo, Sự tương quan giữa các Phân tích sự tương biến số được xác định như -Đo lường sự tương quan, -Trình bày và diễn dịch số liệu, quan Báo cáo nên được viết nhưViết báo cáo và xây dựng thế nào? -Xử lý các biến nhiễu. thế nào? các kiến nghị -Bản nháp và bản nháp lần 2. -Thảo luận và tóm tắt kết luận Chuẩn bị cho phân tích - Các đo lường sự phân tán, phân thống kê phối chuẩn và sự biến động mẫu -Xây dựng kiến nghị Có đo lường sự chênh lệch Xác định loại của phân hay tương quan giữa các - Lựa chọn các kiểm định về mức tích thống kê biến không? ý nghĩa Những kết quả và kiến Trình bày tóm tắt và Thảo luận những tóm tắt và kế nghị nên được công bố và bản nháp cho việc Làm thế nào sự khác biệt Phân tích các quan sát T-test, chi-square test hoạch thực hiện đối với những sử dụng như thế nào? thực hiện các kiến giữa các nhóm có thể được theo cặp và lẻ paired t-test người liên quan nghị xác định? Mc-Nemar’s chi-square test Làm thế nào sự tương quan Biểu đồ phân tán, Thực hiện các đo giữa các biến có thể được lường về sự tương Đường hồi quy, và xác định? quan Hệ số tương quan 57 58  Sai số do đăng kí: + Làm tốt công tác chuẩn bị điều tra sai số này phát sinh do việc ghi chép tài liệu không chính xác , do khai báo sai,.. + Theo dõi, kiểm tra quá trình điều tra.  Sai số do tính chất đại biểu: + Làm tốt công tác tuyên truyền vận động sai số này chỉ xảy ra trong điều tra không toàn bộ, đặc biệt là điều tra chọn mẫu. 59 60 15
  16. 21/01/2015  Coverage error Excluded from frame.  Non response error Follow up on non responses.  Sampling error Chance differences from sample to sample.  Measurement error Bad Question! 16
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2