
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 5 - Nguyễn Phương
lượt xem 1
download

Bài giảng "Lý thuyết xác suất và thống kê toán học - Chương 5: Lý thuyết mẫu" cung cấp cho người đọc các nội dung: Các khái niệm cơ bản, mẫu ngẫu nhiên, hai định lí quan trọng trong thống kê, thống kê mô tả, phân phối mẫu, tính các đặc trưng của mẫu cụ thể. Mời các bạn cùng tham khảo nội dung chi tiết.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 5 - Nguyễn Phương
- Chương 5: LÝ THUYẾT MẪU NGUYỄN PHƯƠNG Bộ môn Toán kinh tế Trường Đại học Ngân hàng TPHCM Blog: https://nguyenphuongblog.wordpress.com Email: nguyenphuong0122@gmail.com Ngày 3 tháng 6 năm 2024 1
- Statistics is a way to get information from data.
- 1 Các khái niệm cơ bản Tổng thể - Mẫu Thống kê mô tả - Thống kê suy diễn 2 Mẫu ngẫu nhiên 3 Hai định lí quan trọng trong thống kê Luật số lớn (Law of large numbers) Định lí giới hạn trung tâm (Central limit theorem) 4 Thống kê mô tả Tóm tắt và trình bày dữ liệu bằng bảng và đồ thị Các đại lượng đo lường khuynh hướng tập trung Các đại lượng đo lường độ phân tán 5 Phân phối mẫu 6 Tính các đặc trưng của mẫu cụ thể 3
- Các khái niệm cơ bản Tổng thể - Mẫu Tổng thể là tập hợp tất cả các phần tử có đặc trưng cần nghiên cứu. Mẫu là một tập con của tổng thể, gồm các phần tử được chọn từ tổng thể. Hình 1.1: Tổng thể - Mẫu
- Các khái niệm cơ bản Tổng thể - Mẫu Ví dụ: - Nếu muốn điều tra thu nhập trung bình của các gia đình ở TP HCM thì tổng thể là các hộ gia đình ở TP HCM, dấu hiệu nghiên cứu là thu nhập của từng mỗi gia đình. - Nếu muốn nghiên cứu chiều cao trung bình của sinh viên ĐH Ngân Hàng thì tổng thể là toàn bộ sinh viên ĐH Ngân Hàng, dấu hiệu nghiên cứu là chiều cao của từng sinh viên. Trong thực tế, việc điều tra, nghiên cứu gặp phải những khó khăn sau: - Do kích cỡ của tổng thể lớn nên việc nghiên cứu toàn bộ sẽ đòi hỏi nhiều thời gian, chi phí,. . . - Có nhiều trường hợp khi điều tra sẽ phá hủy đi các phần tử được điều tra, do đó không thể tiến hành điều tra toàn bộ được. - Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tổng thể, do đó không thể tiến hành toàn bộ được. −→ Vì vậy, người ta sẽ chọn một tập con của tổng thể để nghiên cứu, một tập con như vậy gọi là Mẫu. Số phần tử của mẫu gọi là cỡ mẫu. 5
- Các khái niệm cơ bản Thống kê mô tả - Thống kê suy diễn Thống kê mô tả là các phương pháp được sử dụng để tóm tắt hoặc mô tả một tập hợp dữ liệu. Thống kê suy diễn là các phương pháp được sử dụng để đưa ra kết luận cho tổng thể (tham số, tính chất, mô hình, . . . của tổng thể) từ dữ liệu mẫu. Hình 1.2: Mối quan hệ giữa xác suất và thống kê suy diễn 6
- Mẫu ngẫu nhiên Giả sử cần nghiên cứu đặc trưng X của tổng thể. Với mẫu kích thước n, gọi Xi là giá trị của đặc trưng X của phần tử thứ i của mẫu (1, . . . , n). Mẫu ngẫu nhiên kích thước n là một tập hợp gồm n biến ngẫu nhiên độc lập X1 , X2 , . . . , Xn được lập từ biến ngẫu nhiên X và có cùng phân phối với X. Kí hiệu W = (X1 , X2 , . . . , Xn ). Khi thực hiện lấy mẫu thực tế, ta được X1 = x1 , X2 = x2 , . . . , Xn = xn . Khi đó, (x1 , x2 , . . . , xn ) được gọi là mẫu cụ thể kích thước n. Ví dụ 2.1 Gọi X là số chấm xuất hiện khi tung 1 con xúc xắc cân đối, đồng chất. Bảng phân phối xác suất của X. X 1 2 3 4 5 6 P 1/6 1/ 6 1/6 1/6 1/6 1/6 Nếu tung con xúc xắc 4 lần và gọi Xi là số chấm xuất hiện ở lần tung thứ i, (i = 1, 4), thì ta có 4 biến ngẫu nhiên độc lập có cùng phân phối với X, khi đó ta có mẫu ngẫu nhiên W = (X1 , X2 , X3 , X4 ) Khi tung thực tế, tung thực tế lần thứ nhất được 5 chấm, lần thứ 2 được 3 chấm, lần thứ 3 được 6 chấm, lần thứ 4 được 2 chấm thì (5, 3, 6, 2) là một mẫu cụ thể.
- Mẫu ngẫu nhiên Một hàm của mẫu ngẫu nhiên T = T (X1 , X2 , . . . , Xn ) được gọi là một thống kê. Đặc trưng mẫu Mẫu tổng quát Mẫu cụ thể Trung bình X = X1 +X2n +···+Xn x = x1 +x2n +···+xn XA nA Tỉ lệ Fn = n fn = n n 2 n Phương sai S2 = 1 n Xi − X s2 = 1 n (xi − x)2 i=1 i=1 n 2 n Phương sai hiệu chỉnh S2 = 1 n−1 Xi − X s2 = 1 n−1 (xi − x)2 i=1 √ i=1 √ Độ lệch chuẩn S= S2 s= s2 Các số đặc trưng của các đặc trưng mẫu: σ2 Trung bình mẫu: E X = µ; Var X = n . p(1−p) Tỉ lệ mẫu: E (F) = p; Var (F) = n . n σ n−1 2 Phương sai mẫu: E S2 = Phương sai mẫu hiệu chỉnh: E (S2 ) = σ2 8
- Hai định lí quan trọng trong thống kê Luật số lớn (Law of large numbers) Định lý 3.1 (Luật yếu số lớn) Cho X1 , X2 , . . . là các biến ngẫu nhiên độc lập, có cùng phân phối xác suất với E(Xi ) = µ với mọi i. Với mọi ε > 0, ta có X1 + · · · + Xn P −µ
- Hai định lí quan trọng trong thống kê Định lí giới hạn trung tâm (Central limit theorem) Định lý 3.2 (Định lí giới hạn trung tâm) Cho X1 , X2 , . . . là các biến ngẫu nhiên độc lập, có cùng phân phối xác suất với n (Xi −µ) X −µ √ E(Xi ) = µ, var(Xi ) = σ2 với mọi i. Đặt Zn = i=1 √n σ = n σ n với n i=1 Xi Xn = n . Khi đó, x 1 −t2 lim P (Zn < x) = √ e 2 dt n→∞ 2π −∞ F Zn −→ Z ∼ N(0, 1) đọc là Zn hội tụ (theo phân phối) về biến ngẫu nhiên Z có phân phối chuẩn tắc. 10
- Thống kê mô tả Tóm tắt và trình bày dữ liệu bằng bảng và đồ thị - Bảng tần số. - Phân tổ sữ liệu. - Đồ thị phân phối tần số. - Đa giác tần số. - Biểu đồ thân và lá.
- Thống kê mô tả Các đại lượng đo lường khuynh hướng tập trung x1 + x2 + · · · + xn Trung bình: x = n Trong một tập dữ liệu được sắp xếp theo thứ tự tăng dần, median (còn được gọi là trung vị) là giá trị đứng giữa của tập dữ liệu. −→ không kể trung vị, sẽ có 50% số quan sát của tập dữ liệu có giá trị bé hơn trung vị và 50% số quan sát của tập dữ liệu có giá trị lớn hơn giá trị trung vị. −→ Trung vị là giá trị của quan sát tại vị trí xác định bởi công thức [50%.(n + 1)]. Mode (còn được gọi là yếu vị) là giá trị xuất hiện nhiều lần nhất trong một tập dữ liệu; là giá trị có tần số xuất hiện lớn nhất. 12
- Thống kê mô tả Các đại lượng đo lường khuynh hướng tập trung Tứ phân vị Các tứ phân vị chia một tập dữ liệu đã được sắp xếp theo thứ tự tăng dần thành 4 phần có số quan sát bằng nhau (trong khi trung vị chỉ chia làm 2 phần bằng nhau). ➤ Tứ phân vị thứ nhất, Q1 , là giá trị của quan sát tại vị trí xác định bởi công thức [25%.(n + 1)]. ➤ Tứ phân vị thứ hai, Q2 , chính là trung vị. ➤ Tứ phân vị thứ ba, Q3 , là giá trị của quan sát tại vị trí xác định bởi công thức [75%.(n + 1)]. 13
- Thống kê mô tả Các đại lượng đo lường độ phân tán Khoảng biến thiên (R) là chênh lệch giữa giá trị quan sát lớn nhất (xmax ) và giá trị quan sát nhỏ nhất (xmin ). R = xmax − xmin Độ trải giữa (còn được gọi là khoảng tứ phân vị) là chênh lệch giữa tứ phân vị thứ ba và tứ phân vị thứ nhất. R Q = Q3 − Q1 1 n Phương sai mẫu: s2 = (xi − x)2 n − 1 i=1 √ Độ lệch chuẩn mẫu: s = s2
- Thống kê mô tả Các đại lượng đo lường độ phân tán Ví dụ 4.1 Số lần phạm lỗi trong mỗi trận đấu trong một mùa giải được thực hiện bởi một đội bóng đá đang nỗ lực để dành chức vô địch quốc gia là: 2,8,2,5,0,6,6,3,6,4,2 Xem số liệu trên như là tổng thể của tất cả 11 trận đấu đã diễn ra. a) Tìm số trung bình, số trung vị và mode (yếu vị) của số lần phạm lỗi. b) Tính khoảng biến thiên và khoảng trải giữa. c) Tính độ lệch chuẩn. 15
- Phân phối mẫu a) Trường hợp đặc trưng X có phân phối chuẩn X ∼ N (µ, σ2 ) X−µ √ X ∼ N µ, σ ; σ 2 n n ∼ N (0, 1). X−µ √ σ n ∼ N (0, 1) khi n < 30, σ2 chưa biết. n 1 σ2 (Xi − µ)2 ∼ χ2 (n) i=1 n 2 (n−1)S2 σ2 = 1 σ2 Xi − X ∼ χ2 (n − 1) i=1 b) Trường hợp X không có phân phối chuẩn: Với cỡ mẫu n đủ lớn (n ≥ 30), ta có các phân phối xấp xĩ chuẩn: X−µ √ Khi σ2 biết: σ n ≃ N (0, 1). X−µ √ Khi σ2 chưa biết: S n ≃ N (0, 1). p(1 − p) Với np ≥ 5; n(1 − p) ≥ 5: Fn ≃ N p, n 16
- Tính các đặc trưng của mẫu cụ thể Bài toán: Cho bảng phân phối thực nghiệm: xi x1 x2 ... xk ni n1 n2 ... nk Tính trung bình, phương sai, độ lệch tiêu chuẩn của mẫu. Các công thức cần nhớ: k n= ni i=1 nx x = ni i 1 s2 = n−1 ni x2 − n(x)2 i √ s = s2 Ví dụ 6.1 Ở một địa điểm thu mua vải, kiểm tra một số vải thấy kết quả sau: Số khuyết tật/đơn vị 0 1 2 3 4 5 6 Số đơn vị kiểm tra/m 8 20 12 40 30 25 15 Hãy xác định kích thước mẫu, giá trị trung bình và phương sai của mẫu 17
- Tính các đặc trưng của mẫu cụ thể Dùng Casio 570 Plus Shift −→ Mode −→↓−→ 4 −→ 1 −→ Mode −→ 3 −→ 1 −→ Nhập các giá trị của X −→ Nhập tần số FREQ −→ AC 1 Shift −→ 1 −→ 4 −→ 1 −→ =: Ta được n = 150; 2 Shift −→ 1 −→ 4 −→ 2 −→ =: Ta được x ≈ 3.32667; 3 Shift −→ 1 −→ 4 −→ 4 −→ =: Ta được s = sx ≈ 4.99589. Dùng Casio 580 Shift −→ Menu −→↓−→ 3 −→ 1 −→ Menu −→ 6 −→ 1 −→ Nhập các giá trị của X −→ Nhập tần số FREQ −→ AC −→ OPTN −→ 2 −→ Kết quả như trên.
- Tính các đặc trưng của mẫu cụ thể Ví dụ 6.2 Điều tra về trọng lượng của một loại sản phẩm (đv: gam), được kết quả cho trong bảng: xi 0−5 5 − 10 10 − 15 15 − 20 20 − 25 25 − 30 30 − 35 ni 3 7 10 20 30 15 10 a) Tính các giá trị đặc trưng mẫu: x, s2 , s. b) Những sản phẩm có trọng lượng không vượt quá 15 gam là loại B. Hãy tìm tỉ lệ mẫu các sản phẩm loại B. c) Những sản phẩm có trọng lượng không vượt hơn 20 gam là sản phẩm xuất khẩu được. Hãy tìm tỉ lệ mẫu các sản phẩm xuất khẩu được. 19

CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Lý thuyết xác suất và thống kê toán: Dãy phép thử Bernoulli - Nguyễn Thị Hồng Nhung
16 p |
382 |
43
-
Bài giảng Lý thuyết xác suất: Chương 1
32 p |
166 |
10
-
Bài giảng Lý thuyết xác suất và thống kê toán - Chương 1: Khái niệm cơ bản của lý thuyết xác suất
69 p |
59 |
5
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 1 - Nguyễn Phương
25 p |
8 |
2
-
Bài giảng Lý thuyết xác suất và thống kê - TS. Nguyễn Như Lân
8 p |
44 |
2
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 2 - Nguyễn Phương
18 p |
7 |
2
-
Bài giảng Lý thuyết xác suất và thống kê toán - Bài 2: Biến cố và xác suất
35 p |
12 |
2
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 4 - Nguyễn Phương
33 p |
9 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học - Chương 1: Dữ liệu và thống kê
151 p |
28 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 3 - TS. Hồ Vũ
68 p |
2 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 6 - Nguyễn Phương
23 p |
3 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 1 - TS. Hồ Vũ
22 p |
5 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 4 - TS. Hồ Vũ
42 p |
2 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 3 - Nguyễn Phương
11 p |
16 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 7 - Nguyễn Phương
23 p |
3 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 2 - TS. Hồ Vũ
34 p |
2 |
1
-
Bài giảng Lý thuyết xác suất và thống kê toán học: Chương 5 - TS. Hồ Vũ
96 p |
5 |
1


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
