Bài giảng Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Thống kê suy luận
lượt xem 4
download
Bài giảng "Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Thống kê suy luận" trình bày các nội dung chính sau đây: mô hình thống kê (statistical model); ước lượng điểm (point estimation) và phân phối mẫu (sampling distribution); tính chất cần thiết của ước lượng điểm; định lý giới hạn trung tâm (the central limit theorem);... Mời các bạn cùng tham khảo nội dung chi tiết!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Thống kê suy luận
- Thống Kê Suy Luận (Inferential Statistics)
- Khái Quát • Mô hình thống kê (statistical model). • Ước lượng điểm (point estimation) và phân phối mẫu (sampling distribution). • Tính chất cần thiết của ước lượng điểm. • Định lý giới hạn trung tâm (the central limit theorem)
- Mô Hình Thống Kê • Mô hình thống kê (statistical model) được xem là gồm nhóm các biến ngẫu nhiên (quan sát được hay giả định) và các giả định xác suất thống kê về các biến ngẫu nhiên đó (như phân phối xác suất đồng thời). • Mô hình thống kê mang tính lý tưởng, trừu tượng và có thể hiểu là sự xấp xỉ của thế giới hiện thực. • Thống kê suy luận (statistical inference) là quá trình tạo ra những đánh giá xác suất (probabilistic statement) về một phần hay toàn bộ mô hình thống kê. • Về mặt ký hiệu, chúng ta cần đi tìm hoặc xác định tốt nhất các hệ số (parameter), kí hiệu chung 𝜽, của một mô hình thống kê bao gồm ℳ 𝒮, 𝒫 . Với 𝒮 là không gian mẫu và 𝒫 là các giả định xác suất.
- Mô Hình Hóa Quá Trình Chọn Mẫu (1) • Đánh giá chiều cao trung bình của quần thể nam Việt Nam từ mẫu quan sát. • Mỗi 𝑋 𝑖 (𝑖 = 1, 2, … , 𝑛) là một biến ngẫu nhiên có trung bình 𝜇 𝑖 và phương sai 𝜎 2 . 𝑖 • Mỗi giá trị trong từng mẫu quan sát được gọi là hiện thực hóa, quan sát hay giá trị quan sát (realization, observation or observed value) của biến ngẫu nhiên trong thực tế. • Với cùng một tổng thể thống kê, chúng ta có thể có giá trị quan sát mẫu khác nhau. Các giá trị quan sát này phải cũng có tính “ngẫu nhiên”. Mẫu ngẫu nhiên 𝐗𝟏 𝐗𝟐 … 𝐗𝐧 Mẫu quan sát 1 170 165 … 161 Giá trị hiện thực hóa của mẫu lần 1 (trường Bách Khoa)
- Giá Trị Quan Sát Mẫu Khác Nhau Cho Cùng Một Mẫu Kích Cỡ 𝒏 = 𝟓 Mẫu ngẫu nhiên 𝐗𝟏 𝐗𝟐 𝐗𝟑 𝐗𝟒 𝐗𝟓 Mẫu quan sát 1 170 165 177 161 168 Giá trị hiện thực hóa của mẫu lần 1 (trường Bách Khoa lần 1) Mẫu quan sát 2 163 181 168 173 166 Giá trị hiện thực hóa của mẫu lần 2 (trường Bách Khoa lần 2) Mẫu quan sát 3 159 177 173 169 173 Giá trị hiện thực hóa của mẫu lần 3 (điền bảng online) Mẫu quan sát 4 164 178 175 170 178 Giá trị hiện thực hóa của mẫu lần 4 (bệnh viện) Mẫu quan sát 5 174 165 172 168 163 Giá trị hiện thực hóa của mẫu lần 5 (trung tâm thương mại)
- Giả Định I.I.D. Về Mẫu (1) • Thu thập mẫu ngẫu nhiên (a random sample) gồm 𝑛 quan sát (observation): 𝑋1 , 𝑋2 , 𝑋3 … 𝑋 𝑛 • Mẫu này được giả định là có phân phối độc lập và đồng nhất – identical independent distributed (I.I.D.). Nghĩa là: 𝑓1 𝑥1 = 𝑓2 𝑥2 = ⋯ = 𝑓 𝑛 (𝑥 𝑛 ) 𝑓𝑖 𝑥 𝑖 và 𝑓𝑗 (𝑥 𝑗 ) độc lập với nhau từng đôi một (𝑖 ≠ 𝑗) • Với một mẫu I.I.D., chúng ta có thể đi tìm giá trị 𝜇 và 𝜎 2 (giống nhau) cho 𝑓𝑖 (𝑥 𝑖 ) – đánh giá (mang tính xác suất) về một phần của 𝑓𝑖 (𝑥 𝑖 ) .
- Giả Định I.I.D. Về Mẫu (2) • Ví dụ 1: thảy đồng xu 10 lần. • Độc lập: mỗi kết quả xấp hay ngửa đều không phụ thuộc vào những lần thảy trước. • Đồng nhất: sử dụng một đồng xu như nhau. Cho dù đồng xu có không đều hai mặt, xác suất xấp ngửa vẫn không đổi. • Ví dụ 2: rút một lá bài từ bộ bài 52 lá. • Độc lập: Nếu ta bỏ lại là bài vừa rút và không bỏ lại lá bài vừa rút? • Đồng nhất? • Ví dụ: thu thập mẫu đo chiều cao, biết rằng 40% mẫu từ thành thị và 60% mẫu từ nông thôn. • Độc lập? • Đồng nhất?
- Mô Hình Hóa Quá Trình Chọn Mẫu (2) • A statistic (một thống kê) là một hàm số bất kì của các biến ngẫu nhiên hình thành nên mẫu: 𝑔 𝑋1 , 𝑋2 , … , 𝑋 𝑛 𝑛 𝑋1 +𝑋 𝑛 𝑋1 +𝑋2 +𝑋3 𝑋1 +𝑋2 +⋯+𝑋 𝑛 σ 𝑖=1 𝑋 𝑖 − ത 2 𝑋 • Ví dụ: ത2 = 𝑋 , ഥ𝑋3 = , ത𝑛 = 𝑋 , 𝜒𝑛 = σ 𝑋2 , 𝑖 𝑆2 = 2 3 𝑛 𝑛−1 • Sampling distribution (phân phối mẫu) là hàm phân phối xác suất của một thống kê (a statistic). • Ví dụ: Nếu 𝑋1 , 𝑋2 , … , 𝑋 𝑛 ~𝑁(𝜇, 𝜎 2 ) – phân phối giống nhau và độc lập (I.I.D.) – thì: 𝑋1 +𝑋2 +⋯+𝑋 𝑛 𝜎2 • ത𝑛 = 𝑋 có phân phối mẫu ത 𝑛 ~𝑁(𝜇, 𝑋 ) 𝑛 𝑛 𝑋1 +𝑋2 +𝑋3 𝜎2 • ത3 = 𝑋 có phân phối mẫu ത3 ~𝑁(𝜇, 𝑋 ) 3 3
- Các Dạng Thống Kê Suy Luận • Ước lượng điểm: tính giá trị dự đoán “tối ưu” cho các hệ số cần quan sát. • Ví dụ: tìm giá trị gần đúng nhất cho 𝜇 và 𝜎 2 của phân phối chiều cao nam Việt Nam. • Ước lượng khoảng: tìm ra khoảng dao động của hệ số cần quan sát. • Ví dụ: với độ chính xác 95%, chiều cao trung bình tổng thể nam Việt Nam 𝜇 dao động trong khoảng 167 – 169 cm. • Kiểm định giả thuyết thống kê: đánh giá dữ liệu đang có có chứng minh giả thuyết (hypothesis) thống kê hay không. • Ví dụ: mẫu hiện tại có chứng minh là chiều nam Việt Nam không thấp hơn 1m67 hay không (𝜇 ≥ 167)?
- Liên Hệ Với Cách Hiểu “Tần Số” Của Xác Suất • Trường phái “frequentist” về xác suất cho rằng tồn lại một mô hình thống kê ℳ 𝒮, 𝒫 với các hệ số không quan sát (unknown) được 𝜃. • Ví dụ: 𝜇 và 𝜎 2 cho phân phối chiều cao nam thanh niên. • Nhiệm vụ của người làm nghiên cứu là đi ước lượng giá trị 𝜃 này, càng chính xác càng tốt. • Chúng ta sẽ áp dụng phương pháp thống kê suy luận của trường phái “frequentist” trong phần còn lại.
- Ước Lượng Điểm (Point Estimation)
- Ước Lượng Điểm (1) • Ước lượng điểm (point estimation) là phương pháp tính toán một giá trị duy nhất cho hệ số của một mô hình thống kê dựa vào mẫu quan sát. • Các hệ số phổ biển của mô hình thống kê (hay đặc điểm của một quần thể): • Giá trị kì vọng: 𝐸(𝑋) hay 𝜇 • Phương sai: Var 𝑋 hay 𝜎 2 • Ví dụ: ước lượng chiều cao trung bình đàn ông Việt Nam từ một mẫu 100 quan sát.
- Ước Lượng Điểm (2) Quan sát 1 2 3 4 5 6 Chiều cao (cm) 170 180 165 161 172 167 Biến ngẫu nhiên 𝑋1 𝑋2 𝑋3 𝑋4 𝑋5 𝑋6 • Giả định mẫu i.i.d., giá trị ước lượng điểm nào là phù hợp cho giá trị kì vọng 𝜇? o Quan sát đầu tiên. o Trung bình của quan sát 1 tới 3. o Trung bình quan sát 4 tới 6. o Trung bình của mẫu.
- Các Tính Chất Của Cần Thiết Của Một Ước Lượng Điểm (1) • Gọi đặc điểm cần được ước lượng là 𝜃 và giá trị ước lượng (an estimator) bất kì là መ Giá trị (cũng được gọi là một statistic) 𝜃. này phải được tính từ mẫu với dạng tổng quát như sau: መ = 𝑔 𝑋1 , 𝑋2 , … , 𝑋 𝑛 𝜃 • Các tính chất tối ưu cần thiết được thỏa mãn bao gồm: • Không chệch (unbiasedness): 𝐸 = 𝜃 𝜃 • Hiệu quả toàn diện (full efficiency)
- Các Tính Chất Của Cần Thiết Của Một Ước Lượng Điểm (2) • Độ chính xác về phân tán của ước lượng điểm: 2 Var መ = 𝐸 መ − 𝐸 መ 𝜃 𝜃 𝜃 • Giá trị Var መ càng nhỏ quan sát càng chính xác. 𝜃 • Nếu một ước lượng መ 𝑏 thỏa mãn 2 yếu tố: không chệch (unbiased) và 𝜃 có Var መ nhỏ nhất trong tất cả các ước lượng khác có thể được gọi 𝜃 ước lượng hiệu quả toàn diện (an fully efficient estimator). • Lưu ý: còn một số tính chất khác nhưng chúng ta chỉ tập trung vào hai yếu tố trên.
- Ước Lượng Hiệu Quả Toàn Diện Cho Giá Trị Kì Vọng • Sampling distribution (phân phối mẫu) của các ước lượng (estimators) cho giá trị kì vọng 𝜇 của quần thể. • Giả sử: 𝑋1 , 𝑋2 , … , 𝑋 𝑛 ~𝑁 𝜇, 𝜎 2 là các biến ngẫu nhiên I.I.D. 𝑋1 +𝑋2 +𝑋3 𝜎2 • ത3 = 𝑋 có phân phối mẫu ത3 ~ 𝑁(𝜇, 𝑋 ) 3 3 𝑋1 +𝑋2 +⋯+𝑋 𝑛 𝜎2 • ത𝑛 = 𝑋 có phân phối mẫu ത 𝑛 ~ 𝑁(𝜇, 𝑋 ) 𝑛 𝑛 • Ước lượng nào là ước lượng hiệu quả toàn diện (a fully efficient estimator)?
- Lưu Ý: • Khi cỡ mẫu tiến tới vô cùng – 𝑛 → ∞ – mà ước lượng điểm tiến tới giá trị cần thu thập, ta gọi đó ước lượng nhất quán (a consistent estimator). plim መ = 𝜃 𝜃 𝑛→∞ • Các phương pháp ước lượng phổ biến các bạn sẽ gặp: • Maximum likelihood (MLE) (Hợp lý cực đại/ Khả năng tối đa). • Least square (Bình phương tối thiểu). • Method of moments (Ước lượng mô men).
- Ước Lượng Không Chệch • Ước lượng không chệch của phương sai 𝑆 2 1 𝑛 𝜎2 ො1 = 𝑆 2 = 𝑋𝑖 − ത 𝑋 2 𝑛−1 𝑖=1 • Ước lượng không chệch của hiệp phương sai: 1 𝑛 𝑐𝑜𝑣(𝑋, 𝑌) = ෞ 𝑋𝑖 − ത 𝑋 𝑌𝑖 − ത 𝑌 𝑛−1 𝑖=1
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Các phương pháp phân tích định lượng – Cao Hào Thi
8 p | 254 | 34
-
Bài giảng Các phương pháp nghiên cứu cho phân tích chính sách: Bài 8 - Nguyễn Xuân Thành
8 p | 161 | 19
-
Bài giảng Các phương pháp phân tích định lượng: Hồi quy đa biến
14 p | 152 | 17
-
Bài giảng Các phương pháp nghiên cứu cho phân tích chính sách: Bài 9 - Nguyễn Xuân Thành
9 p | 177 | 13
-
Bài giảng Các phương pháp phân tích định lượng: Giới thiệu môn học
8 p | 166 | 12
-
Bài giảng Các phương pháp nghiên cứu - ĐH kinh tế Huế
16 p | 142 | 9
-
Bài giảng Các phương pháp phân tích định lượng: Xác suất
19 p | 105 | 7
-
Bài giảng Các phương pháp phân tích định lượng: Phân phối xác suất rời rạc
13 p | 101 | 7
-
Bài giảng 3: Phương pháp hỗn hợp trong nghiên cứu chính sách
6 p | 224 | 7
-
Bài giảng Các phương pháp phân tích định lượng: Biến độc lập định tính (Biến giả)
16 p | 111 | 7
-
Bài giảng Các phương pháp phân tích định lượng: Hồi qui đa biến - Kiểm định giả thuyết và lựa chọn mô hình
16 p | 103 | 6
-
Bài giảng Các phương pháp định lượng - Chương 16: Các mô hình hồi quy dữ liệu bảng
20 p | 53 | 5
-
Bài giảng Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Ước lượng khoảng
12 p | 6 | 3
-
Bài giảng Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Lý thuyết về thống kê
28 p | 12 | 3
-
Bài giảng Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Lý thuyết xác suất 3
22 p | 11 | 3
-
Bài giảng Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Lý thuyết xác suất 2
43 p | 7 | 3
-
Bài giảng Các phương pháp định lượng 1 (Học phần: Xác xuất thống kê) - Lý thuyết xác suất 1
30 p | 13 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn