intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Nguyên lý thống kê - Chương 2: Tóm tắt dữ liệu bằng đại lượng số

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:22

22
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Nguyên lý thống kê - Chương 2: Tóm tắt dữ liệu bằng đại lượng số, cung cấp cho người đọc những kiến thức như: các đại lượng đo mức tập trung dữ liệu; các đại lượng đo mức độ phân tán; các hệ số đo vị trí tương đối dữ liệu. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Nguyên lý thống kê - Chương 2: Tóm tắt dữ liệu bằng đại lượng số

  1. 3/2020 THỐNG KÊ ỨNG DỤNG Nội dung chương 2 2.1 CÁC ĐẠI LƯỢNG ĐO MỨC TẬP TRUNG DỮ LIỆU 2.2 CÁC ĐẠI LƯỢNG ĐO MỨC ĐỘ PHÂN TÁN 2.3 CÁC HỆ SỐ ĐO VỊ TRÍ TƯƠNG ĐỐI DỮ LIỆU CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.66 QUY TRÌNH THỐNG KÊ Thống kê mô tả: dùng để tóm tắt dữ liệu, dưới dạng bảng, đồ thị, tính toán các đặc trưng số. Ước lượng Kiểm định Kết luận P/tích phương sai Thống kê suy diễn: rút ra một kết luận về đặc tính Hồi quy nào đó của tổng thể dựa trên quan sát một mẫu cụ thể. Chuỗi thời gian 1
  2. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.66 Từ tổng thể , chọn ngẫu nhiên một mẫu với cỡ mẫu ký hiệu: ( ; ;…; ) Mẫu ( ; ;…; ) : lượng biến có thể rời rạc hoặc liên tục. Bảng tần số, rời rạc. Bảng tần số, liên tục. … [ ; ] … [ ; ] … … CÁC ĐẠI LƯỢNG ĐO MỨC TẬP TRUNG DỮ LIỆU CÁC ĐẠI LƯỢNG ĐO MỨC ĐỘ PHÂN TÁN CÁC HỆ SỐ ĐO VỊ TRÍ TƯƠNG ĐỐI DỮ LIỆU CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.66 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.1 Số trung bình cộng (MEAN). i. Số trung bình cộng. ∑ = : Giá trị lượng biến quan sát thứ i. : Số quan sát CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.66 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.1 Số trung bình cộng (MEAN). ii.Số trung bình cộng có trọng số. … [ ; ] … [ ; ] … … + ∑ = 2 ∑ = ∑ : Giá trị lượng biến nhỏ nhất trong tổ thứ i : Giá trị lượng biến cao nhất trong tổ thứ i : tần số quan sát của lượng biến trong tổ thứ i 2
  3. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.66 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.1 Số trung bình cộng (MEAN). Doanh thu Số Cửa (triệu đồng) hàng Ví dụ: Có tài liệu về doanh thu của 79 cửa 200 – 400 8 hàng trong tháng 10 năm 2009 như bảng dưới. Xác định trung bình (Mean) của dữ 400 – 500 12 liệu. 500 – 600 25 600 – 800 25 800 – 1000 9 Tổng 79 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.66 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.1 Số trung bình cộng (MEAN). = : Tổng tất cả các lượng biến cùng giá trị lượng biến thứ i ∑ = Ví dụ : Tính trung bình lương của một người theo bảng số liệu sau Tiền lương 1 người (nhóm)(ngàn đồng) 500 650 800 950 1.000 Tiền lương cả nhóm 2.500 5.200 16.000 9.500 7.000 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.73 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.2 Số trung bình nhân. (Geometric mean) Trung bình nhân dùng để tính giá trị trung bình trong trường hợp các trị số có quan hệ tích. = ... : Giá trị lượng biến quan sát thứ i. Giá trị trung bình nhân của việc đo sự phát triển một đại lượng kinh tế, thường được gọi là tốc độ tăng trưởng gộp hay tỉ suất theo thời gian. 3
  4. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.73 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.2 Số trung bình nhân. (Geometric mean) Ví dụ Thống kê tổng mức bán lẻ hàng hóa và dịch vụ tiêu dùng (tỷ đồng) năm 2000-2009 (Theo tổng cục thống kê) Năm TMBL Năm TMBL Tìm mức tăng trưởng trung bình 2000 220410,60 2006 596207,10 theo công thức số học và theo 2001 245315,00 công thức trung bình nhân. 2007 746159,40 2002 280884,00 2008 1009860,00 2003 333809,30 2009 1197480,19 2004 398524,50 2005 480293,50 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.73 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.2 Số trung bình nhân. (Geometric mean) năm 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Tỷ lệ 11,30 14,50 18,84 19,39 20,52 24,13 25,15 35,34 18,58 (%) % % % % % % % % % 40 Trung bình tỷ lệ tăng trưởng 35 30 qua các năm 25 20 15 Số học Nhân 10 5 20,861% 20,690% 0 1 2 3 4 5 6 7 8 9 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.73 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.2 Số trung bình nhân. (Geometric mean) Ví dụ. Một người đem $100 đi đầu tư vào mã cổ phiếu và nhận được mức lợi nhuận liên tiếp qua các năm như sau: Năm Mức lợi nhuận Năm Mức lợi nhuận Năm 1 3% Năm 6 50% Năm 2 5% Năm 7 150% Năm 3 8% Năm 8 -30% Năm 4 1% Năm 9 -10% Năm 5 10% Năm 10 10% Hỏi mức lợi nhuận bình quân trong 5 năm đầu và 5 năm sau là bao nhiêu. 4
  5. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.71 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.3 trung vị (Median). Số trung vị là lượng biến của đơn vị tổng thể đứng ở vị trí giữa trong dãy số lượng biến đã được sắp xếp theo thứ tự tăng dần. Số trung vị phân chia dãy số lượng biến làm hai phần (phần trên và phần dưới số trung vị) mỗi phần có số đơn vị tổng thể bằng nhau. Trường hợp: Lượng biến rời rạc, tổng số quan sát là số lẻ = ⁄ Trường hợp: Lượng biến rời rạc, tổng số quan sát là số chẵn ⁄ + ⁄ = 2 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.3/tr.86 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.3 trung vị (Median). Trường hợp tổ quan sát có khoảng cách ℎ = + − 2 • Giới hạn dưới tổ chứa trung vị : ( ) • Khoảng cách của tổ chứa trung vị : ℎ • Tổng số quan sát : • Tổng tần số của tất cả các tổ trước tổ chứa trung vị : • Tần số của tổ chứa trung vị : CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.3/tr.86 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.3 trung vị (Median). Doanh thu Số Cửa Số Cửa Tần số (triệu đồng) hàng hàng cộng dồn Ví dụ: Có tài liệu về doanh thu của 79 cửa hàng trong 200 – 400 8 8 8 tháng 10 năm 2009 như 400 – 500 12 12 20 bảng dưới. Xác định trung 500 – 600 25 45 vị (Med) của dữ liệu. 600 – 800 25 70 800 – 1000 9 9 79 Tổng 79 79 5
  6. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.72 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.4 yếu vị (Mode). Mode là biểu hiện của một lượng biến được gặp nhiều nhất trong tổng thể. • Trong trường hợp lượng biến rời rạc thì mode là giá trị của lượng biến tương ứng với tần số lớn nhất. • Trong trường hợp lượng biến liên tục và phân tổ [ ; ] [ ; ] … [ ; ] [ ; ] … Bước 1: tìm tổ chứa Mode Bước 2: Xác định Mode trong tổ chứa Mode CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.3/tr.86 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.4 yếu vị (Mode). Bước 1: tìm tổ chứa Mode Trường hợp số liệu phân tổ có khoảng cách bằng nhau. • Tổ chứa Mod là tổ có tần số lớn nhất. Trường hợp số liệu phân tổ có khoảng cách không bằng nhau. • Tổ chứa Mod là tổ có mật độ lớn nhất. Mật độ phân phối của một tổ : = ℎ CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.3/tr.86 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.4 yếu vị (Mode). Bước 2: Xác định Mode trong tổ chứa Mode − = ( ) +ℎ − + − • Giới hạn dưới tổ chứa mod: ( ) • Khoảng cách của tổ chứa mod: ℎ • Mật độ của tổ chứa mod : • Mật độ của tổ trước tổ chứa mod : • Mật độ của tổ sau tổ chứa mod : 6
  7. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.3/tr.86 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.4 yếu vị (Mode). Doanh thu Số Cửa Mật độ (triệu đồng) hàng Ví dụ: Có tài liệu về doanh 200 – 400 8 8/200 thu của 79 cửa hàng trong tháng 10 năm 2009 như 400 – 500 12 12/100 bảng dưới. Xác định yếu vị 500 – 600 25 25/100 (Mod) của dữ liệu. 600 – 800 25 25/200 800 – 1000 9 9/200 Tổng 79 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.77 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN Mối quan hệ giữa trung bình, trung vị và yếu vị • Số bình quân thường bị nhầm lẫn không bao gồm trung vị và mode. • Trung vị phản ánh mức độ tập trung đo lường mạnh hơn vì không bị ảnh hưởng bởi biến động của số liệu, • Vị trí của số bình quân, trung vị và mode quyết định hình dạng của phân phối. CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.77 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN Mối quan hệ giữa trung bình, trung vị và yếu vị Ví dụ. Giả sử rằng bạn chạy 100 m trong sáu lần, mỗi lần chạy bạn dùng đồng hồ đo lại thời gian chạy (tính bằng giây) và kết quả 6 lần chạy của bạn như sau: x  25.1; 21.2; 17.9; 23.0; 24.6; 19.5 • Thời gian chạy trung bình (mean) là 21.9 giây • Giá trị giữa (trung vị - median) là 22.1 giây • Thời gian chạy nhiều nhất (maximum) là 25.1 giây và ít nhất (minimum) là 17.9 giây. 7
  8. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.1/tr.77 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN Mối quan hệ giữa trung bình, trung vị và yếu vị Giả sử sau khi chạy hết 6 lần, bạn chạy tiếp lần thứ 7. Lần này đột nhiên chân bạn bị đau và bạn đi bộ thay vì chạy và kết quả thời gian của lần này là 79.9 giây. Bạn cố gắng thử thêm lần nữa và kết quả vẫn 79.9 giây x  25.1; 21.2; 17.9; 23.0; 24.6; 19.5; 79.9; 79.9 Các giá trị Mean, Median và Mode so sánh giữa 2 Sample như sau Bộ 6 dữ liệu Bộ 8 dữ liệu Mean 21.9 giây 36.4 giây Median 22.1 giây 23.8 giây Mode 79.9 giây CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU XSTK (đọc thêm) 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.5. Quy luật phân phối của trung bình mẫu. Định lý Lindeberg Lévy Nghiên cứu một tổng thể đặc trưng bởi biến ngẫu nhiên , • Tổng thể giả sử có dạng phân phối chuẩn ~ , • Mẫu lý thuyết , ,..., , có ~ , với mọi = 1; ~ , • Với kích thước mẫu đủ lớn ( ≥ 30) thì trung bình mẫu sẽ có phân phối chuẩn bất kể quy luật phân phối của tổng thể. CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU XSTK (đọc thêm) 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.5. Quy luật phân phối của trung bình mẫu. 8
  9. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU XSTK (đọc thêm) 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.5. Quy luật phân phối của trung bình mẫu. Chứng minh định lý Lindeberg Lévy Ta có ~ , Với ~ , 1 1 1 = = = = 1 1 1 = = = = Vậy ~ , CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU XSTK (đọc thêm) 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.5. Quy luật phân phối của trung bình mẫu. Ví dụ: Trọng lượng trung bình của một loại sản phẩm do một nhà máy sản xuất ra là 78,5g và độ lệch chuẩn là 11,2g. Chọn ngẫu nhiên 30 sản phẩm. Gọi là trọng lượng trung bình của 30 sản phẩm. Tính xác suất để >82g. CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU XSTK (đọc thêm) 2.1. CÁC K.H. ĐO LƯỜNG MỨC TẬP TRUNG VÀ BÌNH QUÂN 1.5. Quy luật phân phối của trung bình mẫu. Doanh thu Số Cửa Ví dụ: Có tài liệu về doanh thu của 79 cửa (triệu đồng) hàng hàng trong tháng 10 năm 2009 như bảng 200 – 400 8 dưới. Biết doanh thu của các cửa hàng có 400 – 500 12 phân phối chuẩn với độ lệch chuẩn 8o 500 – 600 25 triệu đồng. Ước lượng cho kỳ vọng (trung 600 – 800 25 bình tổng thể) doanh thu của một cửa hàng với xác suất 95% phân phối đối xứng 800 – 1000 9 giữa quy luật phân phối. Tổng 79 9
  10. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.79 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.1 Khoảng biến thiên. (Range) Ví dụ : thu nhập số liệu thu nhập của 8 hộ gia đình (1000 đồng) Hộ 1 2 3 4 5 6 7 8 Thu nhập 8.000 8.200 8.300 8.500 8.500 8.700 8.800 9.000 Hộ 1 2 3 4 5 6 7 8 Thu nhập 6.000 7.000 8.500 8.700 9.000 9.300 9.500 10.000 Hộ 1 2 3 4 5 6 7 8 Thu nhập 6.000 8.250 8.450 8.550 8.750 9.000 9.000 10.000 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.79 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.1 Khoảng biến thiên. (Range) Khoảng biến thiên là độ dài khoảng giá trị mà lượng biến tối đa và tối thiều có thể nhận được. = − : Khoảng biến thiên : lượng biến tối đa : lượng biến tối thiểu CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.2 Độ lệch tuyệt đối bình quân (Mean absolute deviation) Độ lệch tuyệt đối bình quân là mức chênh lệch bình quân giữa các lượng biến và số bình quân cộng của các lượng biến đó | − | | − | ̅= ̅= ∑ ̅ : Độ lệch tuyệt đối bình quân : Giá trị trung bình cộng • Ưu điểm khảo sát sự chênh lệch của toàn bộ bảng số liệu so với giá trị trung bình • Nhược điểm phụ thuộc vào việc xét dấu giá trị tuyệt đối, 10
  11. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.2 Độ lệch tuyệt đối bình quân (Mean absolute deviation) Ví dụ : Cho bảng số liệu về tiền lương của nhân viên một công ty như sau STT Mức lương (triệu Số nhân đồng/người) viên 1 10 15 2 15 20 3 20 50 4 25 10 5 35 5 Tính độ lệch tuyệt đối bình quân lương của một nhân viên công ty này. CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.2 Độ lệch tuyệt đối bình quân Doanh thu Số Cửa Độ lệch Ví dụ: Có tài liệu về (triệu đồng) hàng tuyệt đối doanh thu của 79 cửa 200 – 400 8 296.8354 hàng trong tháng 10 400 – 500 12 146.8354 năm 2009 như bảng 500 – 600 25 46.83544 dưới. Xác định độ lệch 600 – 800 25 103.1646 tuyệt đối binh quân của 800 – 1000 9 303.1646 bảng số liệu. Tổng 79 134,3695 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.81 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.3 Phương sai (Variane) Phương sai là bình quân cộng của bình phương các độ lệch giữa lượng biến với số bình quân của hiện tượng đó 1. Phương sai tổng thể Phương sai khảo sát trên toàn bộ số liệu của tổng thể gọi là phương sai tổng thể. Ký hiệu là . Công thức theo xác suất = = − 1 Công thức theo tần số = = − 11
  12. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.81 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.3 Phương sai (Variane) 2. Phương sai mẫu Xét một mẫu , ,..., lấy từ tổng thể ~ ( ; ). Phương sai mẫu có hiệu chỉnh dùng để thay thế cho phương sai tổng thể được ký hiệu là 1 = − −1 1  n 2 2 Hệ quả. S 2   X i  n X  và E  S 2    2 n  1  i 1   CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.81 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.3 Phương sai (Variane) 1 1 ( )= − = −2 + −1 −1 1 = −2 + −1 1 = + − + −1 1 1 −1 = + − + = = −1 −1 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.81 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.3 Phương sai (Variane) Doanh thu Số Cửa Ví dụ: Có tài liệu về doanh thu của 79 cửa (triệu đồng) hàng hàng trong tháng 10 năm 2009 như bảng 200 – 400 8 dưới. Xác định Phương sai mẫu (có hiệu 400 – 500 12 chỉnh) của bảng số liệu. 500 – 600 25 600 – 800 25 800 – 1000 9 Tổng 79 12
  13. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.81 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN Bấm máy độ lệch chuẩn và phương sai B1 : qwR41 Doanh thu Số Cửa (triệu đồng) hàng 1: ON (có tần số) 2:OFF ( không tần số) 200 – 400 8 B2 : W31 400 – 500 12 500 – 600 25 C 600 – 800 25 B3: q14 800 – 1000 9 2 : độ lệch chuẩn. Tổng 79 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.2/tr.81 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.3 Phương sai (Variane) Độ lệch chuẩn là giá trị đo độ phân tán giá trị của biến lượng so với giá trị trung bình có cùng đơn vị với biến lượng. 1 1. Độ lệch chuẩn tổng thể = = − (Standart Deviation) 2. Độ lệch chuẩn mẫu 1 = − (Standart Deviation) −1 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.95 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.4 Hệ số biến thiên (Coefficient of variation) Hệ số biến thiên là tỷ số so sánh giữa độ lệch tiêu chuẩn (hoặc độ lệch tuyệt đối bình quân) với số bình quân cộng của các lượng biến. 1. Hệ số biến thiên tính theo độ lệch chuẩn mẫu = 100% 2. Hệ số biến thiên tính theo độ lệch tổng thể = 100% : Hệ số biến thiên : Độ lệch chuẩn tổng thể. : Độ lệch chuẩn mẫu. 13
  14. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.95 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.4 Hệ số biến thiên (Coefficient of variation) Ví dụ : khảo sát về chiều cao của học sinh lớp 9 ở Việt Nam người ta chọn ngẫu nhiên 100 học sinh và có bảng số liệu sau Chiều cao 1.56 1.60 1.64 1.68 1.72 1.76 1.80 Số học sinh 2 15 30 35 10 5 3 Tính hệ số biến thiên về chiều cao học sinh lớp 9 theo bảng số liệu trên CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.95 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.4 Hệ số biến thiên (Coefficient of variation) Doanh thu Số Cửa Ví dụ: Có tài liệu về doanh thu của 79 cửa (triệu đồng) hàng hàng trong tháng 10 năm 2009 như bảng 200 – 400 8 dưới. Xác định hệ số biến thiên của bảng 400 – 500 12 số liệu theo độ lệch chuẩn và độ lệch tuyệt 500 – 600 25 đối binh quân. 600 – 800 25 800 – 1000 9 Tổng 79 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN Định nghĩa phân phối Chi bình phương Cho n biến ngẫu nhiên , ,…, có quy luật phân phối chuẩn đơn giản. X i ~ N  0;1 ; i  1, n Biến ngẫu nhiên dạng:  2  X 12  X 22  ...  X n2 gọi là biến ngẫu nhiên theo quy luật phân phối Chi bình phương bậc tự do. Ký hiệu   n  2 14
  15. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.5 Quy luật phân phối của phương sai mẫu. Nghiên cứu một tổng thể đặc trưng bởi biến ngẫu nhiên , • Tổng thể giả sử có dạng phân phối chuẩn ~ , • Mẫu lý thuyết , ,..., , có ~ , với mọi = 1;  E S2    2   n  1 S 2 ~  n21 2 • là phương sai mẫu dùng để ước lượng trực tiếp cho phương sai tổng thể. CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.5 Quy luật phân phối của phương sai mẫu.  n  1 S 2 2  E S2    2  ~  n1 2 P  X   n ,    2 2  n, CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.5 Quy luật phân phối của phương sai mẫu. Ví dụ : Cho ~ ( ; ) là đại lượng tổng thể chỉ chiều cao của nam thanh niên Việt Nam. Khảo sát ngẫu nhiên chiều cao của 101 thanh niên Việt Nam. Cho bảng số liệu: 150 – 155 155 – 160 160 – 165 165 – 170 170 – 175 175 – 180 180 – 185 5 16 35 21 13 8 3 a. Tìm trung bình mẫu ( ) và độ lệch chuẩn mẫu có hiệu chỉnh ( ). b. Tính xác suất µ ∈ ( − 2; + 2) c. Tìm ; để σ ( ; ) với xác suất 95% phân bố đều 2 bên quy luật phân phối. 15
  16. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN Định nghĩa phân phối Student Cho biến ngẫu nhiên theo quy luật phân phối chuẩn đơn giản và theo quy luật phân phối Chi bình phương bậc tự do . Biến ngẫu nhiên dạng: X T n Y Tuân thủ theo phân phối Student bậc tự do, kí hiệu T ~ t  n  CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.6 Quy luật phân phối đồng thời của trung bình mẫu và phương sai mẫu. Nghiên cứu một tổng thể đặc trưng bởi biến ngẫu nhiên , • Tổng thể giả sử có dạng phân phối chuẩn ~ , • Mẫu lý thuyết , ,..., , có ~ , với mọi = 1;  2   n  1 S 2 ~  2  X ~ N  ;    n  2 • Trường hợp chưa biết thì n  X    ~ t  n  1 : phân phối Student có bậc tự do là (n-1). S 16
  17. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.6 Quy luật phân phối đồng thời của trung bình mẫu và phương sai mẫu.  2   X ~ N  ;   X  ~ N  0;1   n  1 S 2 2 ~  n 1  n  2 2 n X  X  X  1 X  1  n   .  . S S  S  S2 n n  n 2 X  1 N  0;1  .  ~ t  n  1  2 1   n  1 S  2  n 1 n   n 1   2  n 1 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.6 Quy luật phân phối đồng thời của trung bình mẫu và phương sai mẫu. • Phân phối Student bậc tự do ( ) hội tụ đến (0; 1) khi tiến tới vô cùng. • Trong thực hành khi ≥ 30 thì coi như ~ ( ) sẽ xấp xỉ gần bằng (0; 1) • Gọi ; là hàm phân phối của phân phối chuẩn và phân phối Student bậc tự do . • Gọi = − ( ) là sai số giữa hai phân phối tại . CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. Biễu đồ sai số 2 quy luật phân phối 0.14 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 0.12 0.1 ĐỘ LỆCH HAI PHÂN PH 0.08 r=1 r = 10 0.06 r = 30 r=5 0.04 0.02 0 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 1.10 1.20 1.30 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 2.20 2.30 2.40 2.50 2.60 2.70 2.80 2.90 3.00 3.10 3.20 3.30 3.40 Axis Title 17
  18. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU Đọc thêm. 2.2. CÁC KHUYNH HƯỚNG ĐO LƯỜNG MỨC ĐỘ PHÂN TÁN 2.6 Quy luật phân phối đồng thời của trung Doanh thu Số Cửa bình mẫu và phương sai mẫu. (triệu đồng) hàng Ví dụ: Có tài liệu về doanh thu của 79 cửa 200 – 400 8 hàng trong tháng 10 năm 2009 như bảng 400 – 500 12 dưới. Biết doanh thu của các cửa hàng có 500 – 600 25 phân phối chuẩn. Ước lượng cho kỳ vọng (trung bình tổng thể) doanh thu của một 600 – 800 25 cửa hàng với xác suất 95% phân phối đối 800 – 1000 9 xứng giữa quy luật phân phối. Tổng 79 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.98 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.1 Trị z Một giá trị đo lường số lượng (số tương đối) độ lệch chuẩn giữa một giá trị quan sát và trung bình của tập dữ liệu, được định nghĩa bằng công thức : − = • Định lý Chebyshev Một tổng thể với hình dạng phân phối bất kỳ, giá trị rơi vào khoảng µ ± ; ≠ ± 1 có xác suất thỏa. 1 − < < + = 1− CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.96 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.1 Trị z Ví dụ. Định lý Chebyshev tổng quát • Với = 2 , ít nhất 75% giá trị rơi trong khoảng : − ; + • Với = 3 , ít nhất 88,89% giá trị rơi trong khoảng : ( − ; + ) Trường hợp đặc biệt: Ví dụ. Phân phối chuẩn Nếu một tổng thể có phân phối chuẩn : • Với = 1 , ít nhất 68% giá trị rơi trong khoảng : − ; + • Với = 2 , ít nhất 95% giá trị rơi trong khoảng : − ; + • Với = 3 , ít nhất 99% giá trị rơi trong khoảng : ( − ; + ) 18
  19. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.96 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.1 Trị z CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.96 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.1 Trị z • Ít nhất là 75%, và rất có thể là 95%, các giá trị quan sát trong một tập dữ liệu nằm trong phạm vi hai độ lệch chuẩn so với trung bình, nên các giá trị z trong khoảng từ −2 đến +2 là rất có khả năng xảy ra, và như thế các giá trị nằm trong khoảng này hoàn toàn là bình thường. • Ít nhất là 8/9, hay rất có thể là tất cả, các giá trị quan sát nằm trong phạm vi 3 độ lệch chuẩn so với trung bình. • Vì thế, các giá trị z trong khoảng từ 2 đến 3, tính theo giá trị tuyệt đối, ít có khả năng xảy ra hơn, và các giá trị z cao hơn 3 phải được xem xét cẩn thận có thật sự tồn tại không. CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.98 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.1 Trị z Ví dụ. Xét mẫu 10 giá trị quan sát 3, 2, 0, 15, 2, 3, 4, 0, 1, 3 có phân phối chuẩn. Giá trị = 15 có phải là giá trị đột biến không (với vùng 90% dữ liệu). 1 1 = = 3,3 = − = 18,6778 ⇒ = 4,32 10 10 − 1 − 15 − 3,3 Giá trị cho = 15 : = = = 2,71 4,32 Bởi vì giá trị này cao hơn 2, nên chúng ta xác định = 15 là một giá trị đột biến có thể có. Chúng ta phải xem xét thủ tục lấy mẫu của mình để xem liệu = 15 là một giá trị quan sát bị sai hay không. 19
  20. 3/2020 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.6/tr.98 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.1 Trị z Ví dụ. Theo Consumer Reports (Báo cáo Người Tiêu dùng - 2017), giá trung bình của loa Sony SLV-700HF stereo VCR là 410USD, với độ lệch chuẩn là 14USD. Nếu bạn mua loại VCR này tại một cửa hàng với giá 430USD, hãy tính giá trị z đối với giá mua của anh/chị. Giá này có được xem là cao bất thường không (trong phạm vi 90% dữ liệu của quy luật phân phối chuẩn). CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.5/tr.91 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.2 Phân vị Cho , , . . . , là bộ giá trị quan sát đã được sắp theo thứ tự tăng dần Phân vị thứ là giá trị của sao cho có nhiều nhất là % các giá trị đo lường là thấp hơn giá trị của và ít nhất là 100 − % là cao hơn giá trị của . p Công thức xác định vị trí của giá trị phân vị thứ p : i  n  1 100 Nếu là số lẻ dạng = + / thì phân vị thứ được tính bằng: a   Trong đó : ầ ủ . x[ i ]  x  x[ i ] : / ầ ẻ ứ ấ ủ . b i 1 CHƯƠNG 2 : CÁC ĐẶC TRƯNG ĐO LƯỜNG CỦA DỮ LIỆU GT/C.4/4.5/tr.91 2.3. CÁC KHUYNH HƯỚNG ĐO LƯỜNG VỊ TRÍ TƯƠNG ĐỐI 3.2 Phân vị Cho , , . . . , là bộ giá trị quan sát đã được sắp theo thứ tự tăng dần Phân vị thứ là giá trị của sao cho có nhiều nhất là % các giá trị đo lường là thấp hơn giá trị của và ít nhất là 100 − % là cao hơn giá trị của . Công thức xác định vị trí của giá trị phân vị thứ p : i  p n 100 Lập cột tần số cộng dồn, tổ có tần số cộng dồn vừa đủ hơn là tổ chứa phân vị hk  p   n  S k 1  Trong đó : ; ; : thông tin tổ thứ xkMin     : : tần số cộng dồn trước tổ thứ . nk  100   20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2