intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Nguyên lý thống kê: Phần 2 - ĐH Phạm Văn Đồng

Chia sẻ: Trần Thị Ta | Ngày: | Loại File: PDF | Số trang:27

50
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

(NB) Tiếp nối phần 1, phần 2 Bài giảng Nguyên lý thống kê trình bày dãy số biến động theo thời gian, điều tra chọn mẫu. Mời các bạn cùng tham khảo để nắm chi tiết nội dung của bài giảng.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Nguyên lý thống kê: Phần 2 - ĐH Phạm Văn Đồng

  1. CHƢƠNG 5: DÃY SỐ BIẾN ĐỘNG THEO THỜI GIAN Phân tích dãy số biến động theo thời gian giúp quan sát hiện tượng biến đổi theo thời gian rồi tìm ra quy luật và dùng quy luật đó để phân tích và dự đoán thống kê. Chương này trình bày một số vấn đề chung về dãy số thời gian, giới thiệu các chỉ tiêu phân tích dãy số thời gian và các phương pháp biểu diễn xu hướng biến động của hiện tượng qua thời gian 5.1 Khái niệm, phân loại và ý nghĩa của dãy số biến động theo thời gian 5.1.1. Khái niệm dãy số biến động theo thời gian Dãy số biến động theo thời gian là dãy các trị số của một chỉ tiêu thống kê đƣợc sắp xếp theo thứ tự thời gian. Một dãy số thời gian gồm có 2 phần: - Thời gian: là những thời điểm hay thời kỳ nhƣ ngày, tuần, tháng, quý, năm....Độ dài giữa hai thời gian gần nhau đƣợc gọi là khoảng cách thời gian. - Mức độ của dãy số: là các trị số của chỉ tiêu về hiện tƣợng nghiên cứu, mức độ này có thể là số tuyệt đối, số tƣơng đối, số bình quân. 5.1.2. Các loại dãy số biến động theo thời gian Căn cứ vào đặc điểm tồn tại về quy mô của hiện tƣợng qua thời gian, có thể phân dãy số thời gian thành hai loại: - Dãy số thời kỳ: là dãy số mà các trị số của chỉ tiêu phản ánh mức độ của hiện tƣợng trong từng khoảng thời gian nhất định. Ví dụ 1: Doanh thu của công ty X giai đoạn 2013 - 2017 Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Đặc điểm của dãy số thời kỳ là có thể cộng các mức độ lại với nhau để có một mức độ mới với khoảng thời gian dài hơn. - Dãy số thời điểm: là dãy số mà các trị số của chỉ tiêu phản ánh mức độ của hiện tƣợng tại những thời điểm nhất định. Ví dụ 2: Có tài liệu về giá trị hàng tồn kho của công ty X vào quý I/năm N nhƣ sau: Ngày đầu tháng 1/1 1/2 1/3 1/4 Giá trị hàng tồn kho (triệu đồng) 800 850 900 750 45
  2. Đặc điểm của dãy số thời điểm là không thể cộng các mức độ lại với nhau vì mức độ của hiện tƣợng ở thời điểm sau thƣờng bao gồm toàn bộ hoặc một bộ phận mức độ của hiện tƣợng ở thời điểm trƣớc đó, cho nên việc cộng các trị số của chỉ tiêu không phản ánh quy mô của hiện tƣợng. 5.1.3 Ý nghĩa của dãy số biến động theo thời gian - Cho thấy sự biến động của hiện tƣợng qua thời gian. - Cho phép tính toán đƣợc các chỉ tiêu phân tích dãy số. - Giúp nghiên cứu quy luật phát triển của hiện tƣợng, dựa vào đó dự đoán đƣợc mức độ của hiện tƣợng ở tƣơng lai. 5.2. Các chỉ tiêu phân tích dãy số biến động theo thời gian 5.2.1. Mức độ bình quân theo thời gian Mức độ bình quân theo thời gian là chỉ tiêu phản ánh mức độ đại biểu của các mức độ tuyệt đối trong một dãy số biến động theo thời gian. * Đối với dãy số thời kỳ. ∑ Công thức tính: ̅ Trong đó: - ̅ : mức độ bình quân theo thời gian của dãy số thời kỳ - yi : các mức độ của dãy số thời kỳ (i = 1, 2,...., n) - n là số thời kỳ Ví dụ: Từ số liệu ví dụ 1 ta tính doanh thu bình quân hàng năm của công ty X giai đoạn 2013 – 2017 nhƣ sau: ̅ (ngàn tấn/năm) * Đối với dãy số thời điểm: Có 2 trƣờng hợp sau: - Dãy thời điểm có khoảng cách thời gian đều nhau Công thức tính: ̅ Ví dụ: Từ ví dụ 2 ta tính giá trị hàng tồn kho bình quân quý I/năm N của công ty X: ̅ triệu đồng - Dãy số thời điểm có khoảng cách thời gian không đều nhau 46
  3. ∑ Công thức tính: ̅ ∑ Trong đó: - ti : là độ dài thời gian có mức độ yi ( i = 1, 2,..., n) - yi : các mức độ của dãy số thời điểm (i = 1, 2,...., n) Ví dụ 3: Có tài liệu về số công nhân trong danh sách của một doanh nghiệp Y trong quý I/2018 nhƣ sau: - Ngày 1/1 doanh nghiệp có 200 công nhân - Ngày 5/2 doanh nghiệp nhận thêm 5 công nhân - Ngày 5/3 doanh nghiệp nhận thêm 3 công nhân - Ngày 20/3 doanh nghiệp cho thôi việc 2 công nhân và từ đó đến cuối tháng 3 không có gì thay đổi. Tính số công nhân bình quân quý I/2018 của doanh nghiệp trên. Từ tài liệu trên ta lập bảng sau: Thời gian Số ngày (ti) Số công nhân (yi) Từ 1/1 đến 4/2 35 200 Từ ngày 5/2 đến 4/3 28 205 Từ 5/3 đến 19/3 15 208 Từ 20/3 đến 31/3 12 206 Số công nhân bình quân trong quý I/2018 ∑ ̅ ∑ (ngƣời) - Dãy số thời điểm chỉ có 2 thời điểm đầu và cuối, thì ̅ Ví dụ 4: Số công nhân đầu tháng 01/2018 của doanh nghiệp A là 100 ngƣời, số công nhân cuối tháng 01/2018 của doanh nghiệp A là 140 ngƣời. Vậy số công nhân bình quân trong tháng 01/2018 là ̅ (ngƣời) 47
  4. 5.2.2. Lƣợng tăng (giảm) tuyệt đối Lƣợng tăng (giảm) tuyết đối là chỉ tiêu phản ánh sự chênh lệch về số tuyệt đối giữa 2 mức độ của dãy số ở hai thời gian khác nhau. Nếu mức độ của hiện tƣợng tăng lên thì trị số của chỉ tiêu mang dấu dƣơng (+), ngƣợc lại thì mang dấu âm (-). Tùy vào mức độ làm gốc so sánh mà ta có các lƣợng tăng (giảm) tuyệt đối nhƣ sau: a) Lượng tăng (giảm) tuyệt đối liên hoàn (Ký hiệu là ). Lƣợng tăng (giảm) tuyết đối liên hoàn là chênh lệch giữa mức độ kỳ nghiên cứu và mức độ của kỳ đứng liền trƣớc đó. Công thức tính: (i = 2, 3,..., n) ; (j = 1, 2,.., n-1) Trong đó: - : lƣợng tăng (giảm) tuyệt đối liên hoàn - yi : mức độ kỳ nghiên cứu - yi-1: mức độ của kỳ đứng liền trƣớc kỳ nghiên cứu yi. Ví dụ: Từ số liệu ví dụ 1, ta tính lƣợng tăng (giảm) tuyệt đối liên hoàn nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Lƣợng tăng (giảm) tuyệt đối liên hoàn +20 +26 +24 +30 b) Lượng tăng (giảm) tuyệt đối định gốc (Ký hiệu là Δj ) Lƣợng tăng (giảm) tuyệt đối định gốc là chênh lệch giữa mức độ kỳ nghiên cứu và mức độ của một kỳ đƣợc chọn làm gốc cố định, thƣờng là mức độ đầu tiên của dãy số. Công thức tính: Δj = yi - y1 (i = 2, 3,.., n); (j = 1, 2,.., n-1) Với y1 là mức độ kỳ gốc đƣợc cố định cho mọi lần so sánh. Ví dụ: Từ số liệu ví dụ 1, ta tính lƣợng tăng giảm tuyệt đối định gốc nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Lƣợng tăng (giảm) tuyệt đối định gốc - +20 +46 +70 +100 * Mối quan hệ giữa lượng tăng (giảm) tuyệt đối liên hoàn và định gốc: 48
  5. Tổng lƣợng tăng (giảm) tuyệt đối liên hoàn bằng lƣợng tăng (giảm) tuyệt đối định gốc tức là: ∑ (j = 1, 2,.., n-1). Ví dụ: Theo số liệu trên thì ∑ tức là (20 + 26 + 24 + 30) = 100 c) Lượng tăng (giảm) tuyệt đối bình quân liên hoàn (Ký hiệu ̅ ) ∑ Công thức tính: ̅ Chỉ tiêu này chỉ nên tính khi các mức độ của dãy số có cùng xu hƣớng cùng tăng hoặc cùng giảm. Ví dụ: Theo số liệu ví dụ 1 thì ∑ ̅ 5.2.3. Tốc độ phát triển Tốc độ phát triển là số tƣơng đối động thái phản ánh quan hệ so sánh giữa hai mức độ trong dãy số biến động theo thời gian. Chỉ tiêu này phản ánh tốc độ và xu hƣớng biến động của hiện tƣợng theo thời gian. a) Tốc độ phát triển liên hoàn (Ký hiệu tj) Tốc độ phát triển liên hoàn là tỷ số giữa mức độ kỳ nghiên cứu và mức độ của kỳ đứng liền trƣớc đó. Công thức tính: ̅̅̅̅̅̅̅̅̅̅ Trong đó: - tj : tốc độ phát triển liên hoàn - yi : mức độ của hiện tƣợng ở kỳ nghiên cứu (i = 2, 3,..., n) - yi-1 : mức độ của hiện tƣợng ở kỳ đứng liền trƣớc kỳ nghiên cứu. Ví dụ: Từ số liệu ví dụ 1, ta tính tốc độ phát triển liên hoàn nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ phát triển liên hoàn (lần) 1,04 1,05 1,044 1,053 b) Tốc độ phát triển định gốc (Ký hiệu Tj ) Tốc độ phát triển định gốc là tỉ số giữa mức độ kỳ nghiên cứu và mức độ của một kỳ đƣợc chọn làm gốc cố định, thƣờng là mức độ đầu tiên của dãy số. 49
  6. Công thức tính: ̅̅̅̅̅̅̅̅̅̅̅; (i = 2, 3,..., n) Ví dụ: Từ số liệu ví dụ 1, ta tính tốc độ phát triển định gốc nhƣ sau: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ phát triển định gốc (lần) - 1,04 1,092 1,14 1,2 * Mối quan hệ giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gốc: - Tích số của các tốc độ phát triển liên hoàn bằng tốc độ phát triển định gốc trong một khoản thời gian tƣơng ứng. Tức là: ∏ (∏ là dấu tích số) Ví dụ: Theo số liệu ví dụ trên: 1,04 x 1,05 x 1,044 x 1,053 = 1,2 - Thƣơng của hai tốc độ phát triển định gốc liền nhau bằng tốc độ phát triển liên hoàn giữa hai thời gian đó. Theo ví dụ trên thì tức là ; tức là … c) Tốc độ phát triển bình quân ( Ký hiệu ̅ ) Tốc độ phát triển bình quân là mức độ đại biểu của các tốc độ phát triển liên hoàn của hiện tƣợng trong suốt thời gian nghiên cứu và đƣợc tính theo công thức số bình quân nhân. ̅ √ √∏ Ví dụ: Theo ví dụ 1 thì tốc độ phát triển bình quân ̅ √ lần Chỉ tiêu này chỉ nên tính với những hiện tƣợng phát triển theo một xu hƣớng nhất định. 5.2.4. Tốc độ tăng (giảm) a) Tốc độ tăng (giảm) liên hoàn (Ký hiệu là aj) 50
  7. Tốc độ tăng (giảm) liên hoàn là tỉ số so sánh giữa lƣợng tăng (giảm) liên hoàn với mức độ kỳ gốc liên hoàn. Công thức tính: ̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅̅ hay (nếu tj là tốc độ phát triển liên hoàn, tính bằng số lần); (nếu tj tính bằng phần trăm). Ví dụ: Theo số liệu ví dụ 1 thì tốc độ tăng liên hoàn là: Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ tăng (giảm) - 0,04 0,05 0,044 0,053 liên hoàn (lần) Hay 4% Hay 5% Hay 4,4% Hay 5,3% b) Tốc độ tăng (giảm) định gốc (Ký hiệu là Aj ) Tốc độ tăng (giảm) định gốc là tỉ số giữa lƣợng tăng (giảm) định gốc với mức độ kỳ gốc cố định (y1). ̅̅̅̅̅̅̅̅̅̅̅ Hay Aj = Tj - 1 (nếu Tj là tốc độ phát triển định gốc, tính bằng số lần) Aj = Tj - 100% (nếu Tj tính bằng phần trăm). Ví dụ: theo số liệu ví dụ 1 thì tốc độ tăng (giảm) định gốc Năm 2013 2014 2015 2016 2017 Doanh thu (tỷ đồng) 500 520 546 570 600 Tốc độ tăng (giảm) - 0,04 0,092 0,14 0,2 định gốc (lần) Hay 4% Hay 9,2% Hay 14% Hay 20% c) Tốc độ tăng (giảm) bình quân (Ký hiệu ̅ ) Tốc độ tăng (giảm) bình quân là chỉ tiêu phản ánh tốc độ tăng (giảm) đại biểu của hiện tƣợng trong suốt thời gian nghiên cứu. ̅ ̅ (nếu ̅ tính bằng số lần). Trong đó ̅ là tốc độ phát triển bình quân Hoặc ̅ ̅ (nếu ̅ tính bằng phần trăm). 51
  8. Ví dụ: Theo ví dụ 1 thì tốc độ tăng bình quân: a = t - 1 = 1,047 – 1 = 0,047 lần hay 4,7%. 5.2.5. Giá trị tuyệt đối của 1% tăng (giảm) a) Giá trị tuyệt đối của 1% tăng (giảm) liên hoàn (ký hiệu là gj ) Chỉ tiêu này phản ánh cứ 1% tăng (giảm) của tốc độ tăng (giảm) liên hoàn thì tƣơng ứng với một trị số tuyệt đối là bao nhiêu. ̅̅̅̅̅̅̅̅̅̅̅ ̅̅̅̅̅̅ ( ) Ví dụ: Theo số liệu ví dụ trên thì giá trị tuyệt đối của 1% tăng liên hoàn là: ; ; … b)Giá trị tuyệt đối của 1% tăng (giảm) định gốc (ký hiệu là Gj ) Giá trị tuyệt đối của 1% tăng (giảm) định gốc luôn luôn là một số không đổi và bằng ( ) Ví dụ: Theo ví dụ 1 thì giá trị tuyệt đối của 1% tăng định gốc luôn là: 5.3. Các phƣơng pháp biểu hiện xu hƣớng phát triển cơ bản của hiện tƣợng. Biến động của hiện tƣợng theo thời gian chịu sự tác động của nhiều nhân tố, ngoài các nhân tố chủ yếu quyết định xu hƣớng biến động của hiện tƣợng còn có những nhân tố ngẫu nhiên gây ra những sai lệch khỏi xu hƣớng đó. Vì vậy, cần sử dụng những phƣơng pháp thích hợp loại bỏ phần nào tác động của những nhân tố ngẫu nhiên để nêu lên xu hƣớng và tính quy luật về sự biến động của hiện tƣợng. 5.3.1. Phƣơng pháp mở rộng khoảng cách thời gian Phƣơng pháp này đƣợc sử dụng khi dãy số thời kỳ có khoảng cách thời gian tƣơng đối ngắn và có nhiều mức độ mà qua đó chƣa phản ánh đƣợc xu hƣớng biến 52
  9. động của hiện tƣợng. Vì thế ta cần tính toán lại các mức độ trong dãy số bằng cách mở rộng khoảng cách thời gian nhƣ: biến đổi các mức độ hàng ngày thành mức độ hàng tuần, mức độ hàng tuần thành mức độ hàng tháng, mức độ hàng tháng thành quý.... Ví dụ: Có tài liệu về sản lƣợng hàng tháng ở một doanh nghiệp nhƣ sau: Tháng Sản lƣợng (1.000 tấn) Tháng Sản lƣợng (1.000 tấn) 1 37,4 7 40,8 2 36,8 8 44,8 3 40,6 9 49,4 4 38,0 10 48,9 5 42,2 11 49,2 6 48,5 12 47,2 Dãy số trên cho thấy sản lƣợng khi tăng, khi giảm một cách thất thƣờng, khó đánh giá rõ xu hƣớng biến động. Để đánh giá đƣợc tình hình sản xuất của doanh nghiệp trong năm, ta có thể mở rộng khoảng cách thời gian từ tháng sang quý nhƣ sau: Quý Sản lƣợng (1.000.tấn) I 114,8 II 128,7 III 135,0 IV 145,3 Sau khi khoảng cách thời gian đƣợc mở rộng ta thấy rõ xu hƣớng biến động cơ bản là tình hình sản xuất của doanh nghiệp tăng dần từ quý I đến quý IV 5.3.2. Phƣơng pháp số bình quân trƣợt Số bình quân trƣợt là số bình quân cộng của một nhóm nhất định các mức độ của dãy số, đƣợc tính bằng cách loại dần các mức độ đầu đồng thời thêm vào các mức độ tiếp theo, sao cho tổng số lƣợng các mức độ tham gia tính số bình quân trƣợt không thay đổi. Giả sử các mức độ của một dãy số thời gian: y1, y2, y3, ........, yn-1, yn Nếu tính bình quân trƣợt cho nhóm ba mức độ, ta sẽ có: 53
  10. ̅̅̅ ̅̅̅ …… Thông thƣờng ta tính số bình quân trƣợt theo từng nhóm lẻ các mức độ (3, 5, 7,... các mức độ) để thuận tiện cho việc sắp xếp số bình quân trƣợt trùng với trung tâm của khoảng cách san bằng. Nếu sự biến động của hiện tƣợng tƣơng đối đều đặn và số lƣợng các mức độ dãy số không nhiều thì có thể tính số bình quân trƣợt từ 3 mức độ. Nếu sự biến động của hiện tƣợng lớn và dãy số có nhiều mức độ thì có thể tính số bình quân trƣợt từ 5 hoặc 7 mức độ. Số bình quân trƣợt càng đƣợc tính từ nhiều mức độ thì càng có tác dụng san bằng ảnh hƣởng của các nhân tố ngẫu nhiên. Từ số liệu ở ví dụ trên, ta tính số bình quân trƣợt cho nhóm 3 mức độ nhƣ sau: Tháng Sản lƣợng Số bình quân Tháng Sản lƣợng Số bình quân (1.000.tấn) trƣợt (1.000.tấn) trƣợt 1 37,4 - 7 40,8 44,7 2 36,8 38,3 8 44,8 45,0 3 40,6 38,5 9 49,4 47,7 4 38,0 40,3 10 48,9 48,2 5 42,2 42,9 11 49,2 48,4 6 48,5 43,8 12 47,2 - 5.3.3. Phƣơng pháp hồi quy Trong một số trƣờng hợp trên cơ sở dãy số thời gian, ngƣời ta tìm một hàm số (gọi là phƣơng trình hồi quy) phản ánh sự biến động của hiện tƣợng qua thời gian có dạng tổng quát nhƣ sau: ̅ Trong đó: ̅ là mức độ lý thuyết (tiêu thức kết quả) - t là thứ tự thời gian (tiêu thức nguyên nhân) Để lựa chọn đúng đắn dạng của phƣơng trình hồi quy đòi hỏi phải dựa vào sự phân tích biến động của hiện tƣợng qua thời gian. Phƣơng trình hồi quy có thể là tuyến tính hoặc phi tuyến tính với các dạng khác nhau. 54
  11. 5.3.4. Phƣơng pháp biểu hiện quy luật biến động thời vụ Một số hiện tƣợng kinh tế xã hội thƣờng biến động có tính chất thời vụ. Biểu hiện của sự biến động này là hầu nhƣ hàng năm cứ đến một thời kỳ nhất định thì hiện tƣợng sẽ tăng lên hoặc giảm đi một cách rõ rệt. Nguyên nhân của sự biến động này chủ yếu là do ảnh hƣởng của các điều kiện tự nhiên hoặc do phong tục, tập quán sinh hoạt của con ngƣời. Để nghiên cứu biến động thời vụ thống kê thƣờng tính chỉ số thời vụ: ̅ ̅ Trong đó:- : chỉ số thời vụ của thời gian i - :bình quân các mức độ của các thời gian cùng tên i qua các năm - ̅: bình quân chung của tất cả các mức độ trong dãy số Số lƣợng hàng tiêu thụ (tấn) Tháng Itv (%) 2005 2006 2007 Cộng các tháng SBQ các tháng (1) (2) (3) (4) (5) (6)=(5)/3 7=(6)/ y 1 1.495 1.500 1.490 4.485 1.495 62,9 2 1.461 1.490 1.480 4.431 1.477 62,2 3 1.533 1.599 1.604 4.736 1.578 66,4 4 1.922 2.210 2.005 6.137 2.046 86,1 5 2.746 2.804 2.745 8.295 2.765 116,4 6 3.289 3.282 3.250 9.821 3.274 137,8 7 3.523 3.620 3.700 10.843 3.614 152,1 8 3.330 3.300 3.215 9.845 3.282 138,2 9 2.597 2.604 2.590 7.791 2.597 109,3 10 2.249 2.205 2.304 6.758 2.253 84,8 11 2.144 2.200 2.190 6.534 2.178 91,7 12 1.983 1.889 1.950 5.822 1.941 81,7 Tổng 28.272 28.703 28.523 85.498 55
  12. CÂU HỎI ÔN TẬP 1. Dãy số thời gian là gì? Có bao nhiêu loại dãy số thời gian? 2. Trình bày các các chỉ tiêu phân tích dãy số thời gian? Ý nghĩa của từng chỉ tiêu và mối liên hệ giữa chúng? 56
  13. CHƢƠNG 6: ĐIỀU TRA CHỌN MẪU Như đã trình bày ở chương 2, để thu thập tài liệu ban đầu, thống kê sử dụng hai hình thức: báo cáo thống kê định kỳ và điều tra chuyên môn. Báo cáo thống kê định kỳ được quy định thành chế độ báo cáo do cơ quan có thẩm quyền quyết định và áp dụng cho nhiều năm. Điều tra chuyên môn áp dụng để thu thập thông tin đối với những hiện tượng và quá trình kinh tế xã hội không thể hoặc không nhất thiết phải thực hiện báo cáo thống kê định kỳ. Điều tra chuyên môn có thể tiến hành trên toàn bộ các đơn vị tổng thể (điều tra toàn bộ) hoặc chỉ tiến hành trên một số đơn vị tổng thể (điều tra không toàn bộ, trong đó điều tra chọn mẫu được áp dụng phổ biến nhất). 6.1 Khái niệm và ý nghĩa của điều tra chọn mẫu a) Khái niệm Điều tra chọn mẫu là một loại điều tra không toàn bộ, ngƣời ta chỉ chọn ra một số đơn vị từ tổng thể chung để điều tra, rồi sau đó bằng phƣơng pháp khoa học, tính toán suy rộng cho toàn bộ tổng thể. Ví dụ: Điều tra tỷ lệ phế phẩm của một hãng sản xuất mì tôm. Ngƣời ta thƣờng chọn ra một số gói mì nhất định, xác định tỷ lệ phế phẩm của số gói đƣợc chọn (giả sử tỷ lệ phế phẩm của mẫu đã chọn là 2%). Sử dụng kết quả này tính toán và suy rộng thành tỷ lệ phế phẩm của toàn bộ khối lƣợng mì mà hàng đã sản xuất. Tại sao chỉ điều tra một số đơn vị tổng thể mà suy ra kết quả của cả tổng thể chung? Cơ sở khoa học của điều tra chọn mẫu là sử dụng quy luật số lớn và lý thuyết xác suất thống kê để tính toán trong thực tế. Quy luật số lớn đã chỉ ra rằng, nếu chỉ nghiên cứu một số đủ lớn các đơn vị, phần tử cá biệt thì những biểu hiện ngẫu nhiên của các đơn vị này sẽ bù trừ và triệt tiêu lẫn nhau, tính quy luật sẽ đƣợc thể hiện rõ Nhƣ vậy, trong điều tra chọn mẫu ngƣời ta đặc biệt lƣu ý tới hai vấn đề cơ bản: + Quy tắc lựa chọn các đơn vị sao cho có thể đại diện cho toàn bộ tổng thể. + Dùng công thức suy rộng thành các đặc điểm của tổng thể. * Khái niệm tổng thể chung và tổng thể mẫu - Tổng thể chung là tổng thể bao gồm toàn bộ các đơn vị thuộc đối tƣợng nghiên cứu. Số đơn vị tổng thể chung đƣợc ký hiệu bằng N. 57
  14. - Tổng thể mẫu là tổng thể bao gồm một số đơn vị đƣợc chọn ra từ tổng thể chung để điều tra thực tế. Số đơn vị của tổng thể mẫu đƣợc ký hiệu bằng n. * Bình quân mẫu: Là lƣợng biến bình quân của các đơn vị mẫu. Kí hiệu: Bình quân mẫu x , bình quân chung X * Phương pháp chọn mẫu Hiện nay, có hai phƣơng pháp chọn mẫu cơ bản đƣợc sử dụng phổ biến trong các cuộc điều tra là chọn mẫu ngẫu nhiên và chọn mẫu phi ngẫu nhiên. - Chọn ngẫu nhiên: Chọn mẫu ngẫu nhiên là chọn mẫu phải hoàn toàn khách quan. Tất cả các đơn vị tổng thể đều có cơ hội chọn mẫu nhƣ nhau, không phụ thuộc vào ý muốn chủ quan của ngƣời lựa chọn mẫu. Ví dụ: Rút thăm, dùng bảng số ngẫu nhiên… - Chọn mẫu phi ngẫu nhiên: là phƣơng pháp chọn đơn vị điều tra phụ thuộc vào ý muốn chủ quan của ngƣời chọn Ví dụ: Chọn đơn vị trung bình, chọn chuyên gia… Chọn mẫu phi ngẫu nhiên đƣợc sử dụng trong trƣờng hợp việc chọn mẫu ngẫu nhiên gặp khó khăn nhƣ những cuộc điều tra mới hoàn toàn chƣa có một thông tin tiên nghiệm nào về đối tƣợng điều tra, hoặc có những hiện tƣợng kinh tế phức tạp, sự phân tán không ổn định, biến động thất thƣờng hoặc nhiều tầng lớp,... Phƣơng pháp này không hoàn toàn dựa trên cơ sở toán học nhƣ điều tra chọn mẫu ngẫu nhiên mà đòi hỏi phải kết hợp chặt chẽ giữa phân tích lý luận và thực tiễn xã hội. Do đó, phần nhiều mang tính chất cảm tính, chủ quan của ngƣời chọn thông qua kinh nghiệm và sự hiểu biết về tổng thể nghiên cứu. Chính vì vậy, trong phạm vi và nội dung bài giảng chỉ đề cập đến các vấn đề thuộc điều tra chọn mẫu ngẫu nhiên b) Ý nghĩa: + Điều tra chọn mẫu có thể đƣợc sử dụng linh hoạt trong nhiều trƣờng hợp với mục đích khác nhau. +Tiến độ công việc nhanh hơn, có thể đáp ứng đƣợc tính khẩn cấp của thông tin cần thu thập. + Tiết kiệm đƣợc chi phí, thời gian. 58
  15. 6.2 Trình tự tiến hành điều tra chọn mẫu Khi tiến hành điều tra chọn mẫu, ngƣời ta thƣờng tiến hành theo các bƣớc nhƣ sau: Sơ đồ 6.1. Các bước trong điều tra chọn mẫu 2. Xác định tổng thể nghiên cứu 1. Xác định mục đích nghiên cứu 3. Xác định phƣơng pháp chọn mẫu, kích thƣớc mẫu 6. Kết luận về 4. Lựa chọn phƣơng tổng thể pháp thu thập thông tin 5. Suy rộng các đặc trƣng của mẫu thành các đặc trung của tổng thể Bƣớc 1: Xác định mục đích điều tra Do nhu cầu thực tế ta cần thông tin về một hiện tƣợng nào đó mà không có sẵn và không thể thu thập bằng điều tra toàn bộ đƣợc thì ta chọn điều tra chọn mẫu. Xác định mục đích điều tra là nhằm thu thập thông tin gì, phục vụ cho mục đích nghiên cứu nào. Việc xác định rõ mục đích điều tra có ý nghĩa quan trong trong việc lựa chọn số lƣợng và phƣơng pháp lấy mẫu. Bƣớc 2: Xác định tổng thể có liên quan Mẫu đƣợc chọn ra phải mang tính chất đại diện cho tổng thể, do đó cần xác định tổng thể nào có chứa mẫu. Xác định tổng thể có liên quan nghĩa là xác định phạm vi, tính chất của tổng thể phù hợp với mục đích nghiên cứu. Bƣớc 3: Xác định kích thƣớc mẫu và phƣơng pháp chọn mẫu Số lƣợng mẫu cần chọn là bao nhiêu? Phƣơng pháp chọn mẫu nhƣ thế nào là bƣớc rất quan trọng có liên quan đến kết quả suy rộng cho tổng thể. Nội dung cụ thể của bƣớc này đƣợc trình bày chi tiết ở mục sau. Bƣớc 4: Phƣơng pháp thu thập và tính toán thông tin 59
  16. Sau khi đã chọn đƣợc mẫu đại diện, công việc tiếp theo là thu thập các thông tin của từng đơn vị mẫu. Phƣơng pháp thu thập thông tin của các đơn vị mẫu thƣờng áp dụng nhƣ các phƣơng pháp thu thập thông tin đã đƣợc trình bày ở chƣơng II (số trung bình mẫu, tỷ lệ mẫu). Cách xử lý, trình bày và tính toán các đặc trƣng của mẫu giống nhƣ các phƣơng pháp đã trình bày ở các chƣơng III và IV. Bƣớc 5: Suy rộng các đặc trƣng của tổng thể Từ các đặc trƣng của mẫu nhƣ số trung bình mẫu, tỷ lệ mẫu, sử dụng các phƣơng pháp thống kê để suy rộng thành các đặc trƣng của tổng thể. Bƣớc 6: Rút ra kết luận về tổng thể Nội dung của bƣớc này là xem xét các kết luận rút ra từ kết quả suy rộng trên cơ sở các đặc trƣng của mẫu có đáp ứng yêu cầu đặt ra trong mục tiêu nghiên cứu hay không? Nhận xét này cũng cần đối chiếu với nội dung bƣớc 1 xem có phù hợp không? 6.3 Điều tra chọn mẫu ngẫu nhiên 6.3.1 Các phƣơng pháp tổ chức điều tra chọn mẫu ngẫu nhiên a) Phương pháp chọn mẫu ngẫu nhiên đơn giản - Khái niệm: Chọn mẫu ngẫu nhiên đơn giản là phƣơng pháp tổ chức chọn mẫu từ tổng thể chung một cách hết sức ngẫu nhiên không qua một sự sắp xếp nào và có thể chọn một lần (không lặp), chọn nhiều lần (chọn có lặp). Ví dụ: Bốc thăm, quay số hoặc chọn theo bảng số ngẫu nhiên hay chọn bất kỳ. Chọn 1 lần là sau khi rút ra 1 thăm ngƣời ta không bỏ lại vào tổng thể để chọn lần sau. Nhƣ vậy, mỗi đơn vị tổng thể chỉ có thể đƣợc chọn ra 1 lần và tổng thể mẫu gồm các đơn vị hoàn toàn khác nhau, sẽ đại biểu cho tổng thể cao hơn. Chọn nhiều lần là cách chọn sau khi rút ra 1 thăm ngƣời ta ghi lại đơn vị đƣợc chọn rồi trả lại cái thăm vào tổng thể cũ. Nhƣ vậy, lần sau chọn vẫn có khả năng chọn đúng vào cái thăm đó chọn lần trƣớc. Trong trƣờng hợp này tổng thể mẫu có thể có một số đơn vị đƣợc chọn lại nhiều lần và mức độ đại biểu cho tổng thể chung sẽ không cao. - Đánh giá phương pháp + Ƣu điểm: Đơn giản, dễ làm. 60
  17. + Nhƣợc điểm: gặp khó khăn khi tổng thể chung có quy mô lớn hoặc kết cấu phức tạp. Nếu gặp tổng thể không đồng đều thì tính chất đại biểu của mẫu không cao do các đơn vị đƣợc lựa chọn có thể phân bố không đều, tập trung vào một chỗ. - Điều kiện vận dụng: Chỉ thích hợp với những tổng thể tƣơng đối đồng đều và không quá lớn. b) Phương pháp chọn mẫu máy móc (chọn hế thống) - Khái niệm: Là phƣơng pháp tổ chức chọn mẫu trong đó mỗi đơn vị đƣợc chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã đƣợc sắp xếp sẵn của tổng thể chung. Các đơn vị đƣợc chọn lần lƣợt, đơn vị sau cách đơn vị trƣớc một khoảng xác định d = N/n. Ví dụ: Từ tổng thể chung có 1.000 công nhân, ngƣời ta chọn ra 100 công nhân để tiến hành điều tra, khi đó d = 1.000/100 = 10. Và cứ 10 ngƣời theo danh sách thì sẽ chọn ra 1 ngƣời để điều tra. Ngƣời đầu tiên đƣợc chọn ra trong số 10 ngƣời đầu tiên của danh sách bằng cách ngẫu nhiên đơn thuần. Giả sử trong 10 ngƣời này rút thăm đƣợc ngƣời thứ 5 thì những ngƣời đƣợc chọn tiếp theo là 15, 25... - Đánh giá phương pháp + Ƣu điểm: Thủ tục đơn giản, rút ngắn đƣợc thời gian cũng nhƣ chi phí; các đơn vị rải đều ra trong toàn bộ tổng thể nên tính chất đại biểu của mẫu cao. + Nhƣợc điểm: Có khả năng xảy ra sai số hệ thống (sai số luôn lệch về một phía đối với số thực tế) do mẫu lấy ra phụ thuộc vào đơn vị đầu tiên đƣợc chọn từ nhóm đầu tiên. Do đó, khi tổng thể chung không đồng đều, đây chƣa phải là cách cho chúng ta mẫu tốt nhất. Mặt khác, khi tổng thể chung lớn thì việc sắp xếp các đơn vị theo một thứ tự nào đó để chọn mẫu cũng gặp nhiều khó khăn. - Điều kiện vận dụng: Trƣớc khi tiến hành chọn phải sắp xếp các đơn vị trong tổng thể vào danh sách theo một thứ tự nào đó của tiêu thức nghiên cứu hoặc tiêu thức bất kỳ. c) Phương pháp chọn mẫu phân tổ: - Khái niệm: Chọn mẫu phân tổ là tiến hành chọn các đơn vị mẫu khi tổng thể chung đã đƣợc phân chia thành các tổ. Việc chọn đơn vị từ các tổ đƣợc tiến hành theo phƣơng pháp chọn mẫu ngẫu nhiên đơn thuần hay hệ thống. - Đánh giá phương pháp 61
  18. + Ƣu điểm: Chọn đƣợc tổng thể mẫu có kết cấu gần giống với kết cấu của tổng thể chung (trong trƣờng hợp chọn theo tỷ lệ) nên tính đại biểu cao, sai số chọn mẫu nhỏ. + Nhƣợc điểm: Phức tạp và khó thực hiện hơn, đòi hỏi phải có nhiều thông tin về tổng thể chung. - Điều kiện vận dụng: Thƣờng sử dụng khi tổng thể phức tạp, phân bố không đồng đều. d) Phương pháp chọn mẫu cả khối (mẫu chùm) - Khái niệm: Chọn mẫu cả khối là phƣơng pháp tổ chức chọn mẫu trong đó số đơn vị mẫu đƣợc rút ra để điều tra không phải là từng đơn vị riêng lẻ mà là từng khối (chùm) đơn vị. - Đánh giá phương pháp + Ƣu điểm: Tổ chức gọn nhẹ, giảm đƣợc chi phí. + Nhƣợc điểm: Do số đơn vị đƣợc chọn chỉ tập trung vào một số khối nên có thể dẫn đến sai số lớn nếu giữa các khối có sự khác biệt nhau nhiều. - Điều kiện vận dụng: Chỉ nên áp dụng trong trƣờng hợp giữa các đơn vị trong một khối có sự khác nhau đáng kể song giữa các khối lại giống nhau về bản chất đ) Phương pháp chọn mẫu nhiều cấp. - Khái niệm: Trong trƣờng hợp các đơn vị của tổng thể phân tán quá rộng và thiếu thông tin về chúng, ngƣời ta thƣờng chọn mẫu theo nhiều cấp: cấp 1, cấp 2, cấp3.... Ví dụ: Để điều tra mức sống dân cƣ trong cả nƣớc có thể chọn mẫu theo ba cấp nhƣ sau: + Đơn vị mẫu cấp 1: Chọn các tỉnh, thành phố. + Đơn vị mẫu cấp 2: Trong các đơn vị mẫu cấp 1 đã chọn (các tỉnh, thành phố) chọn ra một số quận, huyện. + Đơn vị mẫu cấp 3: Trong các đơn vị mẫu cấp 2 đã chọn (các quận, huyện) chọn một số hộ để điều tra. Điều kiện vận dụng: Sử dụng trong trƣờng hợp các đơn vị của tổng thể phân tán quá rộng và thiếu thông tin về tổng thể. 62
  19. Tóm lại: Trong các phƣơng pháp tổ chức chọn mẫu ngẫu nhiên đƣợc trình bày ở trên thì phƣơng pháp tổ chức chọn mẫu phân tổ , đặc biệt là phƣơng pháp chọn hệ thống, thƣờng cho sai số chọn mẫu nhỏ nhất, đồng thời là phƣơng pháp tổ chức chọn mẫu phức tạp nhất. 6.3.2 Những vấn đề trong điều tra chọn mẫu ngẫu nhiên a) Sai số bình quân chọn mẫu và phạm vi sai số chọn mẫu: * Khái niệm về sai số chọn mẫu Sai số trong điều tra chọn mẫu ngẫu nhiên là sự chênh lệch giữa trị số mà điều tra mẫu thu thập đƣợc so với trị số thật của nó trong tổng thể chung. Do cuộc điều tra chọn mẫu chỉ tiến hành ở một số đơn vị tổng thể mà kết quả lại suy rộng ra cho cả tổng thể nên tất yếu nảy sinh sai số (gọi là sai số chọn mẫu). Đây là vấn đề không thể tránh khỏi trong bất kỳ cuộc điều tra nào Sai số chọn mẫu không phải là một trị số cố định. Với cùng một hiện tƣợng nhƣng nếu tiến hành điều tra nhiều lần với các cách chọn mẫu khác nhau, kết cấu của tổng thể mẫu khác nhau thì sẽ có các sai số chọn mẫu khác nhau. Ví dụ: 1 tổng thể gồm 10 đơn vị ABCDMNPQRV. Chọn mẫu 3 đơn vị để điều tra. C1: ABC ta tính đƣợc sai số chọn mẫu thứ nhất (s1); C2: ABD ta tính đƣợc sai số chọn mẫu thứ nhất (s2); C1: MNP ta tính đƣợc sai số chọn mẫu thứ nhất (s3); ….. Do đó, để tính sai số nhằm đánh giá mức độ chính xác của ƣớc lƣợng thì phải tính sai số bình quân chọn mẫu. * Sai số bình quân chọn mẫu: Bình quân tất cả các sai số chọn mẫu do việc lựa chọn mẫu có kết cấu thay đổi Thống kê toán đã xác định đƣợc công thức tính sai số bình quân chọn mẫu nhƣ sau: 63
  20. Dùng suy rộng cho số Phƣơng pháp chọn Dùng suy rộng cho tỷ lệ bình quân Chọn nhiều lần √ √ Chọn một lần √ √ Ký kiệu : là sai số bình quân chọn mẫu; n là số đơn vị mẫu; N là số đơn vị tổng thể là phƣơng sai p là tỷ lệ của tổng thể Một số lưu ý: - Sự khác biệt giữa hai phƣơng pháp chọn hoàn lại và chọn không hoàn lại chính làm(1 – n/N). Do đó, ta luôn có sai số bình quân chọn mẫu theo cách chọn hoàn lại lớn hơn sai số bình quân chọn mẫu theo cách chọn không hoàn lại. - Khi n nhỏ hơn rất nhiều so với N thì khi đó n/N nhỏ và (1– n/N) gần với 1. Do vậy, có thể chọn theo cách không hoàn lại nhƣng sử dụng công thức của chọn hoàn lại để tính sai số bình quân chọn mẫu cho đơn giản. - Theo lý thuyết và p phải tính từ tổng thể nhƣng thực tế chƣa xác định đƣợc. Để giải quyết khó khăn nμy có thể sử dụng các phƣơng pháp sau đây: + Lấy phƣơng sai lớn nhất trong những lần điều tra trƣớc (nếu có) hoặc chọn p nào gần với 0,5 nhất. + Lấy phƣơng sai của các cuộc điều tra khác có tính chất tƣơng tự. + Điều tra thí điểm để xác định phƣơng sai. + Ƣớc lƣợng phƣơng sai nhờ khoảng biến thiên. Thống kê toán đã chứng minh trong trƣờng hợp hiện tƣợng phân phối chuẩn thì: Nhƣ trên đã biết, sai số bình quân chọn mẫu này không phải là một trị số xác định, nếu ta tiến hành nhiều lần điều tra khác nhau sẽ nhận đƣợc các sai số khác 64
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2