Bài giảng Xác suất thống kê: Chương 7 - TS. Phan Thị Hường
lượt xem 1
download
Bài giảng Xác suất thống kê: Chương 7 Hồi quy tuyến tính đơn, cung cấp cho người học những kiến thức như giới thiệu; mô hình hồi quy tuyến tính đơn; phân tích tương quan. Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Xác suất thống kê: Chương 7 - TS. Phan Thị Hường
- X ÁC SUẤT - THỐNG KÊ CHƯƠNG 8: HỒI QUY TUYẾN TÍNH ĐƠN TS. Phan Thị Hường Trường Đại học Bách Khoa TP HCM Khoa Khoa học ứng dụng, bộ môn Toán ứng dụng Email: huongphan@hcmut.edu.vn TP. HCM — 2020. TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 1 / 40
- NỘI DUNG 1 GIỚI THIỆU TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 40
- NỘI DUNG 1 GIỚI THIỆU 2 MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 40
- NỘI DUNG 1 GIỚI THIỆU 2 MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN 3 PHÂN TÍCH TƯƠNG QUAN TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 2 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY Bài toán: trong các hoạt động về khoa học - kỹ thuật, y học, kinh tế - xã hội, . . . ta có nhu cầu xác định mối liên giữa hai hay nhiều biến ngẫu nhiên với nhau. Ví dụ: Mối liên hệ giữa chiều cao và cỡ giày của một người, từ đó một cửa hàng bán giầy dép có thể xác định chính xác cỡ giầy của một khách hàng khi biết chiều cao, TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 3 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY Bài toán: trong các hoạt động về khoa học - kỹ thuật, y học, kinh tế - xã hội, . . . ta có nhu cầu xác định mối liên giữa hai hay nhiều biến ngẫu nhiên với nhau. Ví dụ: Mối liên hệ giữa chiều cao và cỡ giày của một người, từ đó một cửa hàng bán giầy dép có thể xác định chính xác cỡ giầy của một khách hàng khi biết chiều cao, Độ giãn nở của một loại vật liệu theo nhiệt độ môi trường, TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 3 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY Bài toán: trong các hoạt động về khoa học - kỹ thuật, y học, kinh tế - xã hội, . . . ta có nhu cầu xác định mối liên giữa hai hay nhiều biến ngẫu nhiên với nhau. Ví dụ: Mối liên hệ giữa chiều cao và cỡ giày của một người, từ đó một cửa hàng bán giầy dép có thể xác định chính xác cỡ giầy của một khách hàng khi biết chiều cao, Độ giãn nở của một loại vật liệu theo nhiệt độ môi trường, Hàm lượng thuốc gây mê và thời gian ngủ của bệnh nhân, TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 3 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY Bài toán: trong các hoạt động về khoa học - kỹ thuật, y học, kinh tế - xã hội, . . . ta có nhu cầu xác định mối liên giữa hai hay nhiều biến ngẫu nhiên với nhau. Ví dụ: Mối liên hệ giữa chiều cao và cỡ giày của một người, từ đó một cửa hàng bán giầy dép có thể xác định chính xác cỡ giầy của một khách hàng khi biết chiều cao, Độ giãn nở của một loại vật liệu theo nhiệt độ môi trường, Hàm lượng thuốc gây mê và thời gian ngủ của bệnh nhân, Doanh thu khi bán 1 loại sản phẩm và số tiền chi cho quảng cáo và khuyến mãi, TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 3 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY Bài toán: trong các hoạt động về khoa học - kỹ thuật, y học, kinh tế - xã hội, . . . ta có nhu cầu xác định mối liên giữa hai hay nhiều biến ngẫu nhiên với nhau. Ví dụ: Mối liên hệ giữa chiều cao và cỡ giày của một người, từ đó một cửa hàng bán giầy dép có thể xác định chính xác cỡ giầy của một khách hàng khi biết chiều cao, Độ giãn nở của một loại vật liệu theo nhiệt độ môi trường, Hàm lượng thuốc gây mê và thời gian ngủ của bệnh nhân, Doanh thu khi bán 1 loại sản phẩm và số tiền chi cho quảng cáo và khuyến mãi, ... TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 3 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY Bài toán: trong các hoạt động về khoa học - kỹ thuật, y học, kinh tế - xã hội, . . . ta có nhu cầu xác định mối liên giữa hai hay nhiều biến ngẫu nhiên với nhau. Ví dụ: Mối liên hệ giữa chiều cao và cỡ giày của một người, từ đó một cửa hàng bán giầy dép có thể xác định chính xác cỡ giầy của một khách hàng khi biết chiều cao, Độ giãn nở của một loại vật liệu theo nhiệt độ môi trường, Hàm lượng thuốc gây mê và thời gian ngủ của bệnh nhân, Doanh thu khi bán 1 loại sản phẩm và số tiền chi cho quảng cáo và khuyến mãi, ... Để giải quyết các vấn đề trên, ta sử dụng kỹ thuật phân tích hồi quy (Regression Analysis). TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 3 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY • Phân tích hồi quy được sử dụng để xác định mối liên hệ giữa: một biến phụ thuộc Y (biến đáp ứng), và một hay nhiều biến độc lập X 1 , X 2 , . . . , X p . Các biến này còn được gọi là biến giải thích. Biến phụ thuộc Y phải là biến liên tục, Các biến độc lập X 1 , X 2 , . . . , X p có thể là biến liên tục, hoặc phân loại. TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 4 / 40
- Giới thiệu PHÂN TÍCH HỒI QUY Mối liên hệ giữa X 1 , . . . , X p và Y được biểu diễn bởi một hàm tuyến tính. Sự thay đổi trong Y được giả sử do những thay đổi trong X 1 , . . . , X p gây ra. • Trên cơ sở xác định mối liên hệ giữa biến phụ thuộc Y và các biến giải thích X 1 , X 2 , . . . , X p , ta có thể: dự đoán, dự báo giá trị của Y , giải thích tác động của sự thay đổi trong các biến giải thích lên biến phụ thuộc. TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 5 / 40
- Mô hình hồi quy tuyến tính đơn MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN ĐỊNH NGHĨA 2.1 Một mô hình thống kê tuyến tính đơn (Simple linear regression model) liên quan đến một biến ngẫu nhiên Y và một biến giải thích x là phương trình có dạng Y = β0 + β1 x + , (1) trong đó • β0 , β1 là các tham số chưa biết, gọi là các hệ số hồi quy, • x là biến độc lập, giải thích cho y , • là thành phần sai số, được giả sử có phân phối chuẩn với E( ) = 0 và Var ( ) = σ2 . TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 6 / 40
- Mô hình hồi quy tuyến tính đơn MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN Trong mô hình (1), sự thay đổi của Y được giả sử ảnh hưởng bởi 2 yếu tố: Mối liên hệ tuyến tính của X và Y : E[Y |x] = β0 + β1 x, Trong đó, β0 được gọi là hệ số chặn (intercept) và β1 gọi là hệ số góc (slope). Tác động của các yếu tố khác (không phải X ): thành phần sai số . TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 7 / 40
- Mô hình hồi quy tuyến tính đơn MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN Với (x 1 , y 1 ), . . . , (x n , y n ) là n cặp giá trị quan trắc của một mẫu ngẫu nhiên cỡ n , từ (1) ta có Y i = β0 + β1 x i + i , i = 1, 2, . . . , n (2) Một mô hình hồi quy tuyến tính đơn cần các giả định: Các thành phần saia số εi là độc lập với nhau. εi ∼ N (0, σ2 ) or Y ∼ N (β0 + β1 x, σ2 ). TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 8 / 40
- Mô hình hồi quy tuyến tính đơn ĐỒ THỊ PHÂN TÁN CHO DỮ LIÊU CẶP Dữ liệu cars cung cấp 50 giá trị quan trắc của 2 biến speed(mph) và dist (ft). Biến speed(mph) ghi chú tốc độ xe và biến dist (ft) mô tả khoảng cách cần thiết trước khi xe dừng. speed dist 1 4.00 2.00 2 4.00 10.00 3 7.00 4.00 4 7.00 22.00 5 8.00 16.00 ... ... ... 48 24.00 93.00 49 24.00 120.00 50 25.00 85.00 TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 9 / 40
- Mô hình hồi quy tuyến tính đơn ĐỒ THỊ PHÂN TÁN CHO DỮ LIÊU CẶP HÌNH: The scatter diagram of the cars dataset. TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 10 / 40
- Mô hình hồi quy tuyến tính đơn ĐỒ THỊ PHÂN TÁN CHO DỮ LIÊU CẶP HÌNH: The scatter diagram of the cars dataset. • Sử dụng đồ thị phân tán (scatter plot) để biểu diễn các cặp giá trị quan trắc (x i , y i ) trên hệ trục tọa độ Ox y . TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 10 / 40
- Mô hình hồi quy tuyến tính đơn ĐỒ THỊ PHÂN TÁN CHO DỮ LIÊU CẶP HÌNH: The scatter diagram of the cars dataset. • Sử dụng đồ thị phân tán (scatter plot) để biểu diễn các cặp giá trị quan trắc (x i , y i ) trên hệ trục tọa độ Ox y . ⇒ Đồ thị phân tán thể cho chúng ta một đánh giá trực quan về sự phù hợp của mô hình hồi quy tuyến tính đơn. TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 10 / 40
- Mô hình hồi quy tuyến tính đơn ƯỚC LƯỢNG CÁC HỆ SỐ HỒI QUY TS. Phan Thị Hường (BK TPHCM) Xác Suất - Thống Kê TP. HCM — 2020. 11 / 40
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng: Xác suất thống kê - Biến cố và Xác suất của biến cố
42 p | 964 | 228
-
Bài giảng Xác suất thống kê - Nguyễn Ngọc Phụng (ĐH Ngân hàng TP.HCM)
17 p | 264 | 35
-
Bài giảng Xác suất thống kê - Chương 1: Biến cố và xác suất - GV. Lê Văn Minh
8 p | 260 | 30
-
Bài giảng Xác suất thống kê: Chương 1 - Nguyễn Ngọc Phụng (ĐH Ngân hàng TP.HCM)
10 p | 315 | 22
-
Bài giảng Xác suất thống kê - Nguyễn Thị Thu Thủy
50 p | 173 | 22
-
Bài giảng Xác suất thống kê: Chương 2 - GV. Trần Ngọc Hội
13 p | 130 | 15
-
Bài giảng Xác suất thống kê ứng dụng trong kinh tế xã hội: Chương 5.1 - Ngô Thị Thanh Nga
108 p | 120 | 9
-
Bài giảng Xác suất thống kê: Xác suất của một biến cố - Nguyễn Ngọc Phụng
10 p | 106 | 6
-
Bài giảng Xác suất thống kê và quy hoạch thực nghiệm: Chương 1.3 - Nguyễn Thị Thanh Hiền
35 p | 17 | 4
-
Bài giảng Xác suất thống kê: Chương 7 - Nguyễn Kiều Dung
20 p | 8 | 2
-
Bài giảng Xác suất thống kê: Chương 6 - Nguyễn Kiều Dung
29 p | 12 | 2
-
Bài giảng Xác suất thống kê: Chương 5 - Nguyễn Kiều Dung
62 p | 7 | 2
-
Bài giảng Xác suất thống kê: Chương 4 - Nguyễn Kiều Dung
71 p | 6 | 2
-
Bài giảng Xác suất thống kê: Chương 3 - Nguyễn Kiều Dung
26 p | 7 | 2
-
Bài giảng Xác suất thống kê: Chương 2 - Nguyễn Kiều Dung
43 p | 5 | 2
-
Bài giảng Xác suất thống kê: Chương 1 - Nguyễn Kiều Dung
106 p | 5 | 2
-
Bài giảng Xác suất thống kê: Chương 1.3 - Xác suất của một sự kiện
24 p | 7 | 2
-
Bài giảng Xác suất thống kê: Chương 8 - Nguyễn Kiều Dung
27 p | 12 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn