intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Nguyên lý thống kê - Chương 1: Nguyên lý thống kê, Các khái niệm cơ bản

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:19

33
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Nguyên lý thống kê - Chương 1: Nguyên lý thống kê, Các khái niệm cơ bản, cung cấp cho người đọc những kiến thức như: một số khái niệm dùng trong thống kê; tổng hợp và trình bày dữ liệu thống kê. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Nguyên lý thống kê - Chương 1: Nguyên lý thống kê, Các khái niệm cơ bản

  1. 3/2020 NGUYÊN LÝ THỐNG KÊ Giáo trình và tài liệu tham khảo.  Sách giáo trình và bài tập : Thống kê ứng dụng trong kinh tế và kinh doanh, Hoàng Trọng – Chu Nguyễn Mộng Ngọc, NXB Đại Học Kinh Tế. Đánh giá học phần. CỘT ĐIỂM % HÌNH THỨC CÁCH TÍNH Bài tập cá nhân đánh giá thông qua 11 bài/10 điểm – Quá trình 10% nội dung trong các buổi học. Điểm 10% tổng số điểm danh Kiểm tra cá nhân,đánh giá thông qua 1 bài/10 điểm – Giữa kỳ 30% bài tập lớn, đánh giá nội dung tổng 30% tổng số điểm kết từng chương. Thi cuối Thi tự luận, có sử dụng tài liệu. Tất cả 1 bài/10 điểm – 60% 60% tổng số điểm học phần nội dung của học phần. Điều kiện dự thi: Sinh viên phải tham dự 80% trở lên thời gian quy định cho học phần đó và có điểm quá trình (chuyên cần, điểm giữa kỳ) đạt từ 4 điểm (theo thang điểm 10) trở lên. 1
  2. 3/2020 Đánh giá học phần. STT Tên chương Buổi QT G.HP C.HP Nguyên lý thống kê, Các khái 1 niệm cơ bản 2. Thống kê mô tả 2 X 3. Ước lượng khoảng 2 X 4. Kiểm định giả thiết thống kê 2 X 5. Phân tích phương sai 2 X 6. Mô hình hồi quy đơn 2 X 7 Lựa chọn mô hình hồi quy 1 X 1784 1870 1969 2013 Cơ khí hóa với Động cơ điện máy chạy bằng và dây chuyền Kỷ nguyên máy hơi nước và Các hệ thống lắp ráp, sản tính và tự động thủy lực liên kết thế giới xuất hàng loạt hóa thực và ảo KHOA HỌC DỮ LIỆU (DATA SCIENCE) The sexiest job of 21th century [Business Havard Review] 2
  3. 3/2020  Tóm tắt dữ liệu, thống kê mô tả.  Toán sơ cấp.  Xác suất căn bản, các quy luật phân phối cơ bản, định lý giới  Thống kê. hạn trung tâm.  Đại số tuyến tính.  Thuật toán tạo số ngẫu nhiên.  Giải tích.  Kiểm định giả thiết thống kê  Toán rời rạc. và phương pháp ước lượng.  Phân tích phương sai.  Toán tối ưu.  Mô hình hồi quy tuyến tính. NGUYÊN LÝ THỐNG KÊ 3
  4. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.5/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ QUY TRÌNH THỐNG KÊ Xác định Xây dựng Thu Xử lý số mục đích hệ thống nhập liệu nghiên cứu chỉ tiêu dữ liệu  Phân tích đối tượng nghiên cứu Xây dựng bảng câubày dữ liệu dạng  Tổng thể, mẫu  Trình hỏi Chọn chương  Phân tích nội dung nghiênchọn  Xác định quybảngmẫu  Các tiêu thức thống kê Lựa cứu phương mô và biểu đồ trình và xử lý số án thống kê  Lượng biến  Phân tổ dữ liệu các thamliệu trên máy  Tính số đặc  Thang đo loại bài toán thống kê: của dữtrình xử lý số liệu  Phân  trưng Các chương liệu Phân tích tổng Báo cáo kết quả Ước lượng, kiểm định, thông dụng : Exel, R, SPSS, STATA hợp,xây thích giải thống kê dựng mô hình hồi quy…. quả. kết CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.5/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ Thống kê mô tả: dùng để tóm tắt dữ liệu, dưới dạng bảng, đồ thị, tính toán các đặc trưng số. Ước lượng Kiểm định P/tích phương sai Thống kê suy diễn: rút ra một kết luận về đặc tính Hồi quy nào đó của tổng thể dựa trên quan sát một mẫu cụ thể. Chuỗi thời gian CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.1 + 1.4/tr.3 ; 9 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.1.Tổng thể và Mẫu Tổng thể thống kê: là tập hợp các đơn vị cá biệt (hay phần tử) thuộc hiện tượng nghiên cứu, cần quan sát, thu thập và phân tích mặt lượng của chúng theo một hay một số đặc điểm nào đó. Mẫu: là một nhóm các đơn vị tổng thể được chọn một cách ngẫu nhiên từ tổng thể theo các tiêu chí, hay thuộc tính cho trước. 4
  5. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.4/tr.9 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.2. Tiêu thức Tiêu thức: là đặc tính của đơn vị tổng thể. Phân loại tiêu thức như sau: I. Tiêu thức bất biến – tiêu thức biến động. • Tiêu thức bất biến: là đặc tính giống nhau ở mọi đơn vị tổng thể. • Tiêu thức biến động: là đặc tính không giống nhau ở các đơn vị tổng thể. II. Tiêu thức số lượng – tiêu thức thuộc tính. • Tiêu thức số lượng: là đặc tính của đơn vị tổng thể thể hiện qua con số • Tiêu thức thuộc tính: là đặc tính của đơn vị tổng thể thể hiện qua tính chất của đơn vị tổng thể. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.4/tr.10 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.3 Lượng biến Lượng biến: là biểu hiện cụ thể của tiêu thức số lượng. Có 2 loại lượng biến: lượng biến rời rạc và lượng biến liên tục. • Lượng biến rời rạc: là lượng biến nhận giá trị hữu hạn hoặc vô hạn đếm được. • Lượng biến liên tục: là lượng biến nhận giá trị phủ lấp một khoảng của trục số. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.4/tr.10 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.4 Tham số Tham số: là các giá trị phản ánh trực tiếp tính chất, đặc điểm của dữ liệu. Có 2 loại tham số: tham số mẫu và tham số tổng thể. • Tham số tổng thể: là tham số lý thuyết, dùng để phản ánh đặc trưng cho tổng thể • Tham số mẫu: là tham số tính toán dựa trên dữ liệu thu thập được và tính toán dựa trên tham số tổng thể. 5
  6. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo Thang đo: là quy định về giá trị cho dữ liệu thu thập. Phân loại thang đo dựa trên tiêu thức và lượng biến. Có 4 cấp thang đo, theo mức độ thông tin tăng dần, gồm : thang đo định danh, thang đo thứ bậc, thang đo khoảng, thang đo tỷ lệ. • Thang đo định danh (Nominal Scale): dùng cho tiêu thức thuộc tính, mang tính chất phân loại theo thuộc tính của dữ liệu, không mang tính so sánh giữa các thuộc tính với nhau. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo • Thang đo định danh (Nominal Scale): dùng cho tiêu thức thuộc tính, mang tính chất phân loại theo thuộc tính của dữ liệu, không mang tính so sánh giữa các thuộc tính với nhau. Ví dụ: Một cuộc khảo sát về dân Độc thân 1 số, bạn được hỏi như sau: “Vui Đang có gia đình  2 lòng cho biết tình trạng hôn nhân Ở góa 3 của bạn hiện nay?” Ly thân hoặc ly dị  4 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo • Thang đo định danh (Nominal Scale): dùng cho tiêu thức thuộc tính, mang tính chất phân loại theo thuộc tính của dữ liệu, không mang tính so sánh giữa các thuộc tính với nhau Ví dụ: Một cuộc khảo sát, bạn Trung học cơ sở 1 được hỏi một câu về trình độ học Trung học phổ thông  2 vấn: “vui lòng cho biết trình độ Đại học 3 học vấn cao nhất của bạn hiện Sau đại học 4 nay?” 6
  7. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo • Thang đo thứ bậc (Ordinal Scale): dùng cho tiêu thức thuộc tính. Dùng để phân dữ liệu theo thứ bậc hơn kém, nhưng không nhất thiết chênh lệch bằng nhau. Ví dụ: Một cuộc khảo sát về chất Rất hài lòng 1 lượng trường ĐH Văn Lang: “Bạn Hài lòng 2 hài lòng như thế nào về cơ sở vật Bình thường 3 chất của trường đại học Văn Không hài lòng 4 Lang?”. Rất không hài lòng 5 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo • Thang đo thứ bậc (Ordinal Scale): dùng cho tiêu thức thuộc tính. Dùng để phân dữ liệu theo thứ bậc hơn kém, nhưng không nhất thiết chênh lệch bằng nhau. Ví dụ: Một cuộc khảo sát về nhu Dưới 5 triệu 1 cầu người tiêu dùng về 1 sản Từ 5 đến 7 triệu 2 phẩm điện tử, bạn được hỏi :“ Vui Từ 7 đến 9 triệu 3 lòng cho biết thu nhập hàng Từ 9 đến 11 triệu 4 tháng của anh/chị?” Trên 11 triệu 5 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo Thang đo khoảng: là thang đo thứ bậc có khoảng cách đều nhau. Dùng cho tiêu thức thuộc tính(sau khi quy giá trị thành lượng biến) và tiêu thức số lượng. Cho phép đo lường chính xác sự khác nhau giữa các đơn vị và không có điểm gốc 0. Ví dụ: Một bảng khảo sát như sau: “theo anh, chị tầm quan trọng của các yếu tố sau đây như thế nào với cuộc sống của một người (Mức đánh giá từ 1 (không quan trọng) cho đến 7 (rất quan trọng))” 7
  8. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo Thang đo khoảng: là thang đo thứ bậc có khoảng cách đều nhau. Dùng cho tiêu thức thuộc tính(sau khi quy giá trị thành lượng biến) và tiêu thức số lượng. Cho phép đo lường chính xác sự khác nhau giữa các đơn vị và không có điểm gốc 0. 1. Có nhiều tiền 1 2 3 4 5 6 7 2. Đạt trình độ học vấn cao 1 2 3 4 5 6 7 1. Có địa vị trong xã hội 1 2 3 4 5 6 7 4. Có quan hệ rộng rãi 1 2 3 4 5 6 7 5. Có sức khỏe tốt 1 2 3 4 5 6 7 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C1/1.6/tr.11 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.5 Thang đo • Thang đo tỷ lệ: là thang đo thứ bậc có khoảng cách đều nhau và có điễm gốc 0. Nhờ điểm gốc và một tiêu chuẩn đo cụ thể, ta có thể sử dụng được mọi công cụ toán - thống kê để phân tích dữ liệu, so sánh được tỷ lệ giữa các trị số đo. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN 1.1 MỘT SỐ KHÁI NIỆM DÙNG TRONG THỐNG KÊ 1.1.6. Thiết kế thang đo và bảng câu hỏi. (phần đọc thêm). 8
  9. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.2/tr.17 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.1. Xác định dữ liệu và phương pháp thu thập dữ liệu. Dữ liệu thứ cấp : Là nguồn dữ liệu đã được thu thập một cách chính xác, thông qua các tổ chức, cơ quan (có liên quan tới vấn đề nghiên cứu). Dữ liệu thứ cấp thường là những dữ liệu đã qua tổng hợp, xử lý. Việc thu thập dữ liệu thứ cấp có ưu điểm là thu thập nhanh, ít tốn kém chi phí. Nhưng đôi khi không đáp ứng đủ mục đích nghiên cứu. Ví dụ: Các nguồn dữ liệu thứ cấp đáng tin cậy (lấy từ www.rces.info) http://rces.info/sinh-vien- kinh-te-nckh/gioi-thieu- mot-so-nguon-lay-du-lieu- thu-cap-dang-tin-cay/ CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.2/tr.17 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.1. Xác định dữ liệu và phương pháp thu thập dữ liệu. Dữ liệu sơ cấp : Là nguồn dữ liệu mà người làm nghiên cứu thu thập theo một quy trình bài bản tùy theo mục đích nghiên cứu. Dữ liệu sơ cấp là dữ liệu chưa qua tổng hợp và xử lý số liệu. Việc thu thập dữ liệu sơ cấp thường tốn nhiều thời gian và tiền bạc, nhưng đáp ứng đúng mục tiêu nghiên cứu đặt ra. Nghiên cứu thực nghiệm. Dữ liệu sơ Khảo sát qua điện thoại cấp được thu Khảo sát qua dạng viết Nghiên cứu thập thông qua quan sát. Quan sát trực tiếp, phỏng vấn cá nhân Những phương pháp khác 9
  10. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.2. Các kỹ thuật lấy mẫu. Kỹ thuật lấy mẫu theo xác suất. (Probability Sampling) Lấy mẫu ngẫu nhiên đơn giản. (Simple random sampling) Lấy mẫu ngẫu nhiên hệ thống. (Systematic sampling) Lấy mẫu theo khối/cụm (Cluster sampling) Lấy mẫu theo giai đoạn. (Multi Stage sampling) Lấy mẫu phân tầng (Stratified sampling) Kỹ thuật lấy mẫu phi xác suất. (non-probability sampling) Lấy mẫu thuận tiện (Convenient sampling) Lấy mẫu định mức (Quota sampling) Lấy mẫu phán đoán (Judgement sampling) CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.2. Các kỹ thuật lấy mẫu. Lấy mẫu ngẫu nhiên có hệ thống (Systematic sampling) Bước 1: Lập danh sách tổng thể gồm N phần tử đánh thứ tự ngẫu nhiên Bước 2 : Tính toán cỡ mẫu n sẽ khảo sát. N Tính khoảng cách giữa các phần tử mẫu : h  n Bước 3 : Chọn giá trị khởi đầu ngẫu nhiên a  1; h Bước 4 : Lập danh sách lấy mẫu theo danh sách tổng thể ban đầu theo thứ tự { ; + ℎ; + 2ℎ; … ; + ℎ} (cho tới khi đạt cỡ mẫu ) CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.2. Các kỹ thuật lấy mẫu. Lấy mẫu ngẫu nhiên có hệ thống (Systematic sampling) 10
  11. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.2. Các kỹ thuật lấy mẫu. Lấy mẫu ngẫu nhiên có hệ thống (Systematic sampling) Lưu ý : Nếu khoảng cách giữa các lần lấy mẫu là ℎ là số thập phân. Trong một số trường hợp ta không thể chọn đủ được cỡ mẫu . Nguyên tắc chọn vòng xoay : nếu + > → + − ∶ thứ tự chọn mẫu kế tiếp. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.2. Các kỹ thuật lấy mẫu. Lấy mẫu theo khối/cụm (Cluster sampling) CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.2. Các kỹ thuật lấy mẫu. Lấy mẫu theo khối/cụm (Cluster sampling) Một tổng thể trên một khu vực rộng, chia thành các nhóm (cụm) nghiên cứu có sẵn chung một đặc điểm thống kê. Việc chọn mẫu từ tổng thể theo quy trình chọn cụm và chọn mẫu theo cụm. Bước 1: Lập danh sách cụm và danh sách trong từng cụm. Bước 2: Tổng hợp danh sách theo thứ tự cộng dồn theo từng cụm. Bước 3: Tính toán cỡ cụm ( ) và cỡ mẫu cần lấy ( ). N Tính khoảng cách giữa các cụm : h  k 11
  12. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.2. Các kỹ thuật lấy mẫu. Lấy mẫu theo khối/cụm (Cluster sampling) Bước 4: Chọn ngẫu nhiên giá trị bắt đầu với ( ∈ [1; ℎ]) . Chọn cụm có phần tử đánh dấu cộng dồn tương ứng , và các cụm kế lần lượt chứa { ; + ℎ ; + 2ℎ ; … } (cho tới khi đủ số cụm) Bước 5: Gọi ′ là số lượng tổng thể của các cụm được chọn. Ni Bước 6: Số lượng mẫu trong mỗi cụm : ni  n N' Lập danh sách lấy mẫu trong từng cụm. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. Ví dụ: Khảo sát về sức khỏe tổng quát của học sinh tiểu học khu vực quận Gò Vấp. Trên khu vực có 9000 em, phân bố 10 trường. Cần chọn một mẫu gồm 4 trường và 300 em. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 Cụm Số lượng 1 400 2 700 3 800 4 1200 5 1800 6 300 7 800 8 900 9 1100 10 1000 Tổng =9000 12
  13. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 Cụm Số lượng Cộng dồn 1 400 400 2 700 1100 3 800 1900 4 1200 3100 5 1800 4900 6 300 5200 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng =9000 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 Cụm Số lượng Cộng dồn Tham số 1 400 400 Khoảng cách 2 700 1100 = / 3 800 1900 =9000/4 4 1200 3100 =2250 5 1800 4900 Chọn 6 300 5200 = 7 800 6000 8 900 6900 9 1100 8000 10 1000 9000 Tổng =9000 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 Cụm Số lượng Cộng dồn Tham số Chọn cụm 1 400 400 Khoảng cách 2 700 1100 = / 650 3 800 1900 =9000/4 4 1200 3100 =2250 2900 5 1800 4900 Chọn 6 300 5200 = 5150 7 800 6000 8 900 6900 9 1100 8000 7400 10 1000 9000 Tổng =9000 =3300 13
  14. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 Cụm Số lượng Cộng dồn Tham số Chọn cụm Chọn mẫu 1 400 400 Khoảng cách 2 700 1100 = / 650 63,63≈ 3 800 1900 =9000/4 4 1200 3100 =2250 2900 109 5 1800 4900 Chọn 6 300 5200 = 5150 27 7 800 6000 8 900 6900 9 1100 8000 7400 100 10 1000 9000 Tổng =9000 =3300 300 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.1. Xác định quy mô mẫu. 1. Mức độ chính xác do chọn mẫu mang lại Mức độ chính xác do việc chọn mẫu mang lại tỷ lệ thuận với bình phương của quy mô mẫu. Khi tăng quy mô mẫu lên k lần thì mức độ chính xác sẽ tăng lần. 2. Sai số do chọn mẫu. Sai số do chọn mẫu là chênh lệch giữa giá trị tham số thu được trên mẫu và giá trị tham số đó trên tổng thể chung. 1. Khoảng tin cậy. Khoảng tin cậy là khoảng giá trị mà dựa vào giá trị tham số trên mẫu, ta ước lượng giá trị tham số của tổng thể sẽ rơi vào đó CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.1. Xác định quy mô mẫu. 4. Độ tin cậy. Là khả năng đúng khi ta ước lượng giá trị tham số của tổng thể nằm trong khoảng tin cậy. 5. Một số trường hợp về việc xác định cỡ mẫu cho ước lượng tham số. 14
  15. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.1. Xác định quy mô mẫu. 5. Một số trường hợp về việc xác định cỡ mẫu cho ước lượng tham số. TRƯỜNG HỢP 1 : Xác định cỡ mẫu theo tính tóan cho tham số tuyệt đối n  z /2 S 2 2 Nếu tổng thể vô hạn   5% thì cỡ mẫu   n N    2 n  Nz /2 S 2 2 Nếu tổng thể hữu hạn   5% thì cỡ mẫu   n N    N  1 2  z /2S 2 2 Trong đó : 1   là độ tin cậy,   là độ chính xác, S  phương sai 2 mẫu khảo sát từ mẫu lớn hơn 30. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.1. Xác định quy mô mẫu. 5. Một số trường hợp về việc xác định cỡ mẫu cho ước lượng tham số. TRƯỜNG HỢP 2 : Xác định cỡ mẫu theo tính tóan cho tham số tương đối n  z 2 p1  p Nếu tổng thể vô hạn   5% thì n   /2   N    2 n  Nz /2 p1  p 2 Nếu tổng thể hữu hạn   5% thì n    N    N 12  z /2 p1  p 2 Trong đó : 1   là độ tin cậy,   là độ chính xác, p là tỷ lệ phần tử loại A khảo sát từ một mẫu có cỡ mẫu lớn hơn 30. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.1. Xác định quy mô mẫu. Ví dụ: Quận Gò Vấp tiến hành khảo sát về sức khỏe mắt của sinh viên tiểu học. Biết trên một mẫu đã khảo sát thì tỷ lệ em bị bệnh về mắt là 10%. Với số liệu như trong bảng, cần khảo sát bao nhiêu em để độ chính xác trong việc ước lượng tỷ lệ em bị bệnh về mắt là 3%, với độ tin cậy 95%. Lập kế hoạch lấy mẫu như tính toán cho từng cụm trong khu vực. Chọn 1 cụm và lập danh sách lấy mẫu cho cụm đó. 15
  16. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C2/2.4/tr.23 Cụm Số lượng 1 400 2 700 3 800 4 1200 5 1800 6 300 7 800 8 900 9 1100 10 1000 Tổng =9000 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.4. Phân tổ. Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ có tính chất khác nhau. 1. Phân tổ theo thuộc tính • Ít thuộc tính: Phân tổ theo thuộc tính • Nhiều thuộc tính: Ghép các thuộc tính cùng kiểu thành thuộc tính chung và phân tổ theo thuộc tính chung 2. Phân tổ theo lượng biến • Ít giá trị: Phân tổ theo các giá trị CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.4. Phân tổ. 2. Phân tổ theo lượng biến • Nhiều giá trị: Phân tổ theo các khoảng giá trị, trị số của chặn trên và chặn dưới khoảng gọi là khoảng cách tổ.  Khoảng cách giữa các tổ có thể không đều.  Khoảng cách giữa các tổ đều nhau, thì số tổ tính theo công thức = ( ) Trong đó : Cỡ mẫu ∶ sổ tổ 16
  17. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.4. Phân tổ. 2. Phân tổ theo lượng biến  Khoảng cách giữa các tổ đều nhau, khoảng cách tổ tính theo: − Nếu lượng biến liên tục : ℎ = − )−( −1 Nếu lượng biến rời rạc : ℎ= ℎ ∶ Trị số khoảng cách tổ ∶ Trị số quan sát lớn nhất. ∶ sổ tổ ∶ Trị số quan sát bé nhất. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.4. Phân tổ. 2. Phân tổ theo lượng biến Ví dụ : Năng suất (tạ/ha) của loại cây trồng quan sát tại 40 nơi như sau: 153 154 156 157 158 159 159 160 160 160 161 161 161 162 162 162 163 163 163 164 164 164 165 165 166 166 167 167 168 168 170 171 172 173 174 175 176 177 178 179 Phân tổ cho bộ dữ liệu trên. CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.4. Phân tổ. 1. Phân tổ mở Mức năng suất Số hộ • Là phân tổ mà tổ đầu tiên không có lúa (tạ/ha) giới hạn dưới, tô cuối cùng không có
  18. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.4. Phân tổ. 4. Phân tổ liên hệ. Giữa các tiêu thức mà Mức đầu tư Số cơ Mức bình Tăng trọng bình thống kê nghiên cứu thức ăn sở quân tổ quân (kg/con/ngày) (kg/con/ngày) (g/con/ngày) thường có mối quan hệ
  19. 3/2020 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. 1.2.7 lập bảng cho dữ liệu kết hợp hai biến Biến thứ nhất Thông tin mẫu Tổ (1) .. Tổ (m) điều tra Tần số Tần suất … Tần số Tần suất n11 n1m Tổ (1) n11 f11  … n1m f 1m  Biến N1 Nm thứ … … … … … … hai n nnm Tổ (n) nn1 fn1  n1 … nnm f nm  N1 Nm Tổng cột N1 100% … Nm 100% ni 1 f2 4 3 CHƯƠNG 1 : THỐNG KÊ VÀ CÁC KHÁI NIỆM CƠ BẢN GT/C3/3.1/tr.38 1.2 TỔNG HỢP VÀ TRÌNH BÀY DỮ LIỆU THỐNG KÊ. Thu nhập (triệu đồng/tháng) Dưới 5 Từ 5 đến 7 Từ 7 đến 9 Trên 9 ni 1 fi 1 ni 2 fi 2 ni 3 fi 3 ni 4 fi 4 Đại học Nam Thạc sỹ Tiến sỹ Đại học Nữ Thạc sỹ Tiến sỹ Tổng 100% 100% 100% 100% 19
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2