intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Tóm tắt Luận văn Thạc sĩ Khoa học: Hồi quy bội tuyến tính hồi quy phi tuyến và ứng dụng

Chia sẻ: Na Na | Ngày: | Loại File: PDF | Số trang:58

75
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mục đích của luận văn này là đưa ra các dạng cơ bản của hồi quy tuyến tính bội, hồi quy phi tuyến, các kết quả phân tích để ứng dụng vào các mô hình hữu ích trong thực tế. Sau đây là bản tóm tắt luận văn. Mời các bạn tham khảo nội dung tài liệu để nắm bắt nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Tóm tắt Luận văn Thạc sĩ Khoa học: Hồi quy bội tuyến tính hồi quy phi tuyến và ứng dụng

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN ----------------------- PHẠM THỊ HƯƠNG HỒI QUY BỘI TUYẾN TÍNH HỒI QUY PHI TUYẾN VÀ ỨNG DỤNG Chuyên ngành: Lý thuyết Xác suất và Thống kê toán học Mã số: 60406106 TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - Năm 2015
  2. 1 Công trình được hoàn thành tại: Trường Đại học Khoa hoc Tự nhiên - Đại học Quốc gia Hà Nội Người hướng dẫn khoa học: GS.TSKH Đặng Hùng Thắng Hội đồng chấm luận văn: • Chủ tịch: PGS.TS Phan Viết Thư - Đại học Khoa học Tự Nhiên - ĐHQGHN • Phản biện 1: TS. Nguyễn Mạnh Thế - Đại học Kinh Tế Quốc Dân • Phản biện 2: TS. Trịnh Quốc Anh - Đại học Khoa học Tự Nhiên - ĐHQGHN • Thư ký: TS. Trần Mạnh Cường - Đại học Khoa học Tự Nhiên - ĐHQGHN • Ủy viên: TS. Nguyễn Hồng Hải - Học Viện Kỹ Thuật Quân Sự Luận văn đã được bảo vệ trước Hội đồng chấm luận văn thạc sĩ họp tại: Khoa Toán-Cơ-Tin học Trường Đại học Khoa học Tự nhiên (ĐHQGHN) vào 9h giờ 00 ngày 1 tháng 2 năm 2016 Có thể tìm đọc luận văn tại: - Trung tâm thư viện Đại học Quốc gia Hà Nội
  3. Mục lục 1 HỒI QUY BỘI TUYẾN TÍNH 3 1.1 Nhắc lại hồi quy đơn tuyến tính . . . . . . . . . . . . . . . . . . . 3 1.2 Các mô hình hồi quy bội . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.1 Sự cần thiết phải đưa ra nhiều biến dự báo . . . . . . . . 5 1.2.2 Mô hình bậc nhất với hai biến dự báo . . . . . . . . . . . . 5 1.2.3 Mô hình bậc nhất với nhiều hơn hai biến dự báo . . . . . . 6 1.2.4 Mô hình hồi quy tuyến tính tổng quát . . . . . . . . . . . . 6 1.3 Dạng ma trận của mô hình hồi quy tuyến tính tổng quát . . . . . 10 1.4 Ước lượng các hệ số hồi quy . . . . . . . . . . . . . . . . . . . . . . 10 1.5 Ước lượng mẫu và phần dư . . . . . . . . . . . . . . . . . . . . . . . 11 1.6 Các kết quả phân tích phương sai . . . . . . . . . . . . . . . . . . . 12 1.7 Các kết luận về các tham số hồi quy . . . . . . . . . . . . . . . . . 14 1.8 Ước lượng trung bình đáp ứng và dự báo quan sát mới . . . . . . 15 1.9 Chẩn đoán và biện pháp khắc phục . . . . . . . . . . . . . . . . . . 17 2 HỒI QUY PHI TUYẾN VÀ MÔ HÌNH MẠNG NƠ RON 21 2.1 Mô hình hồi quy tuyến tính và phi tuyến . . . . . . . . . . . . . . 21 2.2 Ước lượng các tham số hồi quy . . . . . . . . . . . . . . . . . . . . 23 2.3 Ước lượng bình phương cực tiểu trong hồi quy phi tuyến . . . . . 24 2.3.1 Nghiệm của phương trình chuẩn . . . . . . . . . . . . . . . 24 2.3.2 Tìm kiếm số trực tiếp - Phương pháp Gauss-Newton . . . 25 2.3.3 Các thủ tục tìm kiếm trực tiếp khác . . . . . . . . . . . . . 26 2.4 Xây dựng và chẩn đoán mô hình . . . . . . . . . . . . . . . . . . . 27 2.5 Các kết luận về tham số hồi quy phi tuyến . . . . . . . . . . . . . 27 2.5.1 Ước lượng phương sai sai số . . . . . . . . . . . . . . . . . . 27 2.5.2 Định lí mẫu lớn . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.5.3 Khi nào định lý mẫu lớn dùng được? . . . . . . . . . . . . . 27 1
  4. Luận văn tốt nghiệp Phạm Thị Hương 2.5.4 Biện pháp khắc phục hậu quả. . . . . . . . . . . . . . . . . 28 2.5.5 Khoảng ước lượng của γk . . . . . . . . . . . . . . . . . . . 28 2.5.6 Khoảng tin cậy đồng thời cho một số γk . . . . . . . . . . . 28 2.5.7 Kiểm tra tính liên quan của một tham số γk . . . . . . . . 29 2.5.8 Kiểm định đồng thời một số γk . . . . . . . . . . . . . . . . 29 2.6 Giới thiệu về mô hình mạng Nơ ron . . . . . . . . . . . . . . . . . 29 2.6.1 Mô hình mạng Nơ ron . . . . . . . . . . . . . . . . . . . . . 29 2.6.2 Mạng đại diện . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.6.3 Mạng Nơ ron như sự tổng quát của hồi quy tuyến tính. . . 31 2.6.4 Ước lượng tham số: Bình phương cực tiểu penalized . . . . 32 2.6.5 Một số bình luận cuối về mô hình mạng Nơ ron . . . . . . 33 3 Ứng dụng 34 3.1 Ứng dụng 1: Dự báo doanh số bán hàng . . . . . . . . . . . . . . . 34 3.1.1 Đặt bài toán . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.1.2 Các tính toán cơ bản . . . . . . . . . . . . . . . . . . . . . . 35 3.1.3 Ước lượng hàm hồi quy . . . . . . . . . . . . . . . . . . . . 36 3.1.4 Các ước lượng mẫu và phần dư . . . . . . . . . . . . . . . . 37 3.1.5 Phân tích sự phù hợp của mô hình . . . . . . . . . . . . . . 37 3.1.6 Phân tích phương sai . . . . . . . . . . . . . . . . . . . . . . 39 3.1.7 Ước lượng các tham số hồi quy . . . . . . . . . . . . . . . . 40 3.1.8 Ước lượng trung bình đáp ứng . . . . . . . . . . . . . . . . 41 3.1.9 Giới hạn dự báo cho các quan sát mới . . . . . . . . . . . . 42 3.2 Ứng dụng 2: Dự báo mức độ phục hồi sau khi xuất viện . . . . . . 43 3.3 Ứng dụng 3: Đường cong học tập . . . . . . . . . . . . . . . . . . . 49 3.4 Ứng dụng 4: Bệnh thiếu máu cơ tim . . . . . . . . . . . . . . . . . 52 Tài liệu tham khảo 55 2
  5. MỞ ĐẦU Phân tích hồi quy là phương pháp có ứng dụng rộng rãi nhất trong các phương pháp thống kê. Hiện nay, các mô hình hồi quy được sử dụng nhiều trong quản trị kinh doanh, kinh tế, kỹ thuật và xã hội, y tế, khoa học và sinh học. . . ..Các mô hình hồi quy rất đa dạng bao gồm: hồi quy tuyến tính, hồi quy phi tuyến. Các loại mô hình gồm nhiều dạng nhỏ khá phức tạp. Mục đích của luận văn này là đưa ra các dạng cơ bản của hồi quy tuyến tính bội, hồi quy phi tuyến, các kết quả phân tích để ứng dụng vào các mô hình hữu ích trong thực tế. Bản luận văn được chia làm 3 chương: Chương 1: Hồi quy bội tuyến tính Trình bày các mô hình hồi quy bội tuyến tính, các ước lượng hồi quy bội và các phân tích về các ước lượng hồi quy đó. Chương 2: Hồi quy phi tuyến và mô hình mạng Nơ ron Chương này trình bày một số mô hình hồi quy phi tuyến thường gặp, các ước lượng của mô hình và việc phân tích, xây dựng chẩn đoán mô hình. Chương 3: Ứng Dụng Đề cập đến các ứng dụng của mô hình hồi quy bội tuyến tính và hồi quy phi tuyến ngoài thực tế. Trong mỗi ứng dụng có nhấn mạnh đến việc xây dựng mô hình, ước lượng tham số và đánh giá mô hình. Mặc dù có nhiều cố gắng, xong do nhiều yếu tố khách quan và chủ quan, nên trong quá trình chọn lọc tư liệu và trình bày nội dung khó tránh khỏi những thiếu sót. Vì vậy tôi rất mong nhận được những ý kiến chỉ bảo của thầy cô, sự góp ý chân thành của các bạn học viên để luận văn được hoàn thiện hơn. 3
  6. Chương 1 HỒI QUY BỘI TUYẾN TÍNH 1.1 Nhắc lại hồi quy đơn tuyến tính 1.1.1 Mô hình dạng chuẩn Mô hình được xây dựng như sau: Y i = β0 + β1 X i + εi (1.1) 1.1.2 Các đặc trưng quan trọng của mô hình 1. Yi là biến ngẫu nhiên. 2. Hàm hồi quy cho mô hình (1.1) là: E{Y } = β0 + β1 X (1.2) 3. Giá trị đáp ứng Yi trong thử nghiệm thứ i sai khác với giá trị hàm hồi quy một lượng là sai số εi . 4. Đáp ứng Yi cũng có phương sai không đổi: σ 2 {Yi } = σ 2 (1.3) 5. Đáp ứng Yi và Yj cũng không tương quan. 6. Tóm lại, mô hình (1.1) chỉ ra rằng đáp ứng Yi có phân phối xác suất mà trung bình của nó là E{Yi } = β0 + β1 Xi và phương sai của nó là σ 2 và là như 4
  7. Luận văn tốt nghiệp Phạm Thị Hương nhau với mọi giá trị của X. Hơn nữa, hai giá trị đáp ứng Yi và Yj là không tương quan. 1.1.3 Dạng biến đổi của mô hình hồi quy Đặt X0 là hằng số có giá trị bằng 1. Khi đó mô hình (1.1) có thể được viết như sau: Yi = β0 X0 + β1 Xi + εi X0 ≡ 1 (1.4) Do vậy dạng mô hình biến đổi là: Yi = β0∗ + β1 (Xi − X) ¯ + εi (1.5) 1.1.4 Ước lượng hàm hồi quy Phương pháp bình phương cực tiểu Hàm tiêu chuẩn Q: n X Q= (Yi − β0 − β1 Xi )2 (1.6) i=1 Các ước lượng của β0 và β1 tương ứng là b0 và b1 làm cực tiểu hóa hàm tiêu chuẩn Q đối với các mẫu quan sát (X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn ) đưa ra. Tính chất của các ước lượng bình phương cực tiểu: Định lí 1.1.1. (Gauss-Markov): Với các điều kiện của mô hình hồi quy (1.1), các ước lượng bình phương cực tiểu b0 và b1 trong (1.10) là không chệch và có phương sai nhỏ nhất trong tất cả các ước lượng tuyến tính không chệch khác. 1.1.5 Ước lượng phương sai sai số σ 2 Tổng bình phương phần dư: n X n X SSE = (Yi − Y¯ )2 = e2i (1.7) i=1 i=1 5
  8. Luận văn tốt nghiệp Phạm Thị Hương Pn Pn 2 SSE − Y¯ )2 i=1 (Yi 2 i=1 ei s = M SE = = = (1.8) n−2 n−2 n−2 MSE là ước lượng không chệch của σ 2 : E{M SE} = σ 2 (1.9) √ Và ước lượng của độ lệch chuẩn đơn giản là s = M SE . 1.2 Các mô hình hồi quy bội 1.2.1 Sự cần thiết phải đưa ra nhiều biến dự báo Các mô hình hồi quy bao gồm một biến đáp ứng hay biến phản hồi và một số lượng các biến dự báo. Một biến dự báo đơn lẻ trong mô hình không cung cấp sự mô tả đầy đủ vì một số lượng các biến dự báo chìa khóa tác động đến biến đáp ứng theo các cách đặc biệt và quan trọng. Vì vậy cần đưa ra mô hình nhiều hơn một biến dự báo. 1.2.2 Mô hình bậc nhất với hai biến dự báo Khi có hai biến dự báo X1 và X2 mô hình hồi quy: Yi = β0 + β1 Xi1 + β2 Xi2 + εi (1.10) được gọi là mô hình bậc nhất với hai biến dự báo. Hàm hồi quy cho mô hình (1.23) là: E{Y } = β0 + β1 X1 + β2 X2 (1.11) Hàm hồi quy (1.24) là một mặt phẳng. Hình (1.1) đưa ra một phần mặt phẳng đáp ứng: E{Y } = 10 + 2X1 + 5X2 (1.12) 6
  9. Luận văn tốt nghiệp Phạm Thị Hương Hình 1.1: Hàm đáp ứng là một mặt phẳng 1.2.3 Mô hình bậc nhất với nhiều hơn hai biến dự báo Mô hình hồi quy: Yi = β0 + β1 Xi1 + β2 Xi2 + ... + βp−1 Xip−1 + εi (1.13) được gọi là mô hình bậc nhất với p − 1 biến dự báo. Hàm đáp ứng cho mô hình (1.27) là: E{Y } = β0 + β1 X1 + β2 X2 + ... + βp−1 Xp−1 (1.14) 1.2.4 Mô hình hồi quy tuyến tính tổng quát Tổng quát, định nghĩa mô hình tuyến tính tổng quát với điều kiện các sai số chuẩn như sau: Yi = β0 + β1 Xi1 + β2 Xi2 + ... + βp−1 Xip−1 + εi (1.15) Hàm đáp ứng cho mô hình hồi quy (1.29) là : E{Y } = β0 + β1 X1 + β2 X2 + ... + βp−1 Xp−1 (1.16) Mô hình tuyến tính tổng quát bao gồm một loạt các tình huống rất đa dạng : 7
  10. Luận văn tốt nghiệp Phạm Thị Hương p-1 biến dự báo Khi X1 , . . . , Xp−1 biểu diễn p − 1 biến dự báo khác nhau, mô hình tuyến tính tổng quát (1.29) là mô hình bậc nhất không có các ảnh hưởng tương tác giữa các biến dự báo. Các biến dự báo định tính Mô hình hồi quy tuyến tính tổng quát (1.29) bao gồm không chỉ các biến dự báo định lượng mà còn bao gồm các biến dự báo định tính. Chúng ta sử dụng các biến chỉ số nhận giá trị 0 và 1 để định nghĩa các lớp giá trị của biến định tính. Hồi quy đa thức Đây là mô hình hồi quy đa thức với một biến dự báo: Yi = β0 + β1 Xi + β2 Xi2 + εi (1.17) Nếu chúng ta cho Xi1 = Xi và Xi2 = Xi2 thì có thể viết (1.34) như sau: Yi = β0 + β1 Xi1 + β2 Xi2 + εi Đây là dạng của mô hình hồi quy tuyến tính tổng quát (1.29). Biến biến đổi Các mô hình với biến biến đổi liên quan đến hàm đáp ứng là các đường cong phức tạp vẫn là trường hợp đặc biệt của mô hình hồi quy tuyến tính tổng quát. Xét mô hình sau với biến biến đổi Y: logYi = β0 + β1 Xi1 + β2 Xi2 + β3 Xi3 + εi (1.18) Nếu đặt Yi0 = logYi ta có: Yi0 = β0 + β1 Xi1 + β2 Xi2 + β3 Xi3 + εi đây là dạng của mô hình hồi quy tuyến tính tổng quát (1.29) mà biến đáp ứng là hàm logarit của Y. 8
  11. Luận văn tốt nghiệp Phạm Thị Hương Nhiều mô hình khác có thể biến đổi được thành mô hình hồi quy tuyến tính tổng quát. Ví dụ mô hình: 1 Yi = (1.19) β0 + β1 Xi1 + β2 Xi2 + εi có thể đưa về mô hình hồi quy tuyến tính tổng quát bằng cách đặt Yi0 = 1/Yi ta có: Yi0 = β0 + β1 Xi1 + β2 Xi2 + εi Ảnh hưởng tương tác. Ví dụ một mô hình hồi quy không cộng tính với hai biến dự báo X1 , X2 là: Yi = β0 + β1 Xi1 + β2 Xi2 + β3 Xi1 Xi2 + εi (1.20) Đặt Xi3 = Xi1 Xi2 và viết lại (1.37) như sau: Yi = β0 + β1 Xi1 + β2 Xi2 + β3 Xi3 + εi đây chính là dạng của mô hình hồi quy tuyến tính tổng quát (1.29). Sự kết hợp của các trường hợp. Một mô hình hồi quy có thể có sự kết hợp của một số trường hợp ở trên và ta vẫn có thể đưa được về mô hình hồi quy tuyến tính tổng quát. Xét mô hình hồi quy với hai biến dự báo sau có chứa các điều kiện tuyến tính và bình phương cho mỗi biến và một điều kiện tương tác: 2 2 Yi = β0 + β1 Xi1 + β2 Xi1 + β3 Xi2 + β4 Xi2 + β5 Xi1 Xi2 + εi (1.21) Định nghĩa: 2 2 Zi1 = Xi1 Zi2 = Xi1 Zi3 = Xi2 Zi4 = Xi2 Zi5 = Xi1 Xi2 Khi đó mô hình hồi quy (1.38) như sau: Yi = β0 + β1 Zi1 + β2 Zi2 + β3 Zi3 + β4 Zi4 + β5 Zi5 + εi đây là dạng của mô hình hồi quy tuyến tính tổng quát (1.29). 9
  12. Luận văn tốt nghiệp Phạm Thị Hương Hình 1.2: Ví dụ cộng tính của hàm đáp ứng Ý nghĩa tuyến tính trong mô hình hồi quy tuyến tính tổng quát. Điều kiện mô hình tuyến tính đề cập đến một thực tế là mô hình (1.29) là tuyến tính với các tham số, không phải đề cập đến hình dáng của mặt đáp ứng. Nói một mô hình hồi quy là tuyến tính với các tham số khi nó có thể được viết dưới dạng: Yi = ci0 β0 + ci1 β1 + ci2 β2 + ... + cip−1 βp−1 + εi (1.22) trong đó các giá trị ci0 , ci1 ,... là các hệ số liên quan đến biến dự báo. 10
  13. Luận văn tốt nghiệp Phạm Thị Hương 1.3 Dạng ma trận của mô hình hồi quy tuyến tính tổng quát Định nghĩa cho các ma trận sau: Y1 1 X11 X12 . . . X1,p−1      Y2  1 X21 X22 . . . X2,p−1  Y =  ..  (1.40a) X = . .. .. ..  (1.40b)  |{z} . |{z}  .. . . ... . n×1 n×p Yn 1 Xn1 Xn2 . . . Xn,p−1 β0 ε1      β1   ε2  β =  ..  (1.40c) ε =  ..  (1.40d) (1.23) |{z} . |{z} n×1 . p×1 βp εn Dạng ma trận của mô hình hồi quy tuyến tính tổng quát (1.29) là: Y = |{z} |{z} X β + |{z} ε (1.24) |{z} n×1 n×p p×1 n×1 Do đó, véc tơ ngẫu nhiên Y có kỳ vọng: E{Y } = Xβ (1.25) | {z } n×1 và ma trận hiệp phương sai của Y là giống với ε σ 2 {Y } = σ 2 I (1.26) | {z } n×n 1.4 Ước lượng các hệ số hồi quy Tiêu chuẩn bình phương cực tiểu: n X n X Q= ε2i = (Yi − β0 − · · · − βp−1 Xi,p−1 )2 (1.27) i=1 i=1 Biểu diễn véc tơ ước lượng các hệ số hồi quy b0 , b1 , . . . , bp−1 là b: b0    b1  b = .. (1.28) . |{z}  p×1 bp−1 11
  14. Luận văn tốt nghiệp Phạm Thị Hương Các phương trình chuẩn: (X 0 X) |{z} X 0 |{z} b = |{z} Y (1.29) | {z } p×p p×1 p×n n×1 và các ước lượng bình phương cực tiểu là: 0 −1 0 b = (X X) |{z} |{z} XY (1.30) | {z } p×1 p×p p×1 Hàm hợp lý cho hồi quy bội như sau: " n # 1 −1 X L(β, σ 2 ) = exp (Yi − β0 − β1 Xi1 − · · · − βp−1 Xi,p−1 )2 (1.31) (2πσ 2 )n/2 2σ 2 i=1 1.5 Ước lượng mẫu và phần dư Gọi Yˆ là véc tơ ước lượng mẫu Yˆi và e là véc tơ phần dư ei = Yi − Yˆi , ta có: Yˆ1   e1    ˆ   e2  (1.49a) ˆ =  Y.2  Y (1.49b) e =  ..  (1.32) |{z}  ..  |{z} . n×1 n×1 Yˆn en Khi đó, các ước lượng mẫu được xác định bởi: ˆ Y = Xb (1.33) |{z} n×1 và phần dư e = Y − Yˆ = Y − Xb |{z} (1.34) n×1 Véc tơ ước lượng mẫu có thể được biểu diễn dưới dạng ma trận mũ H như sau: ˆ Y = HY (1.35) |{z} n×1 trong đó H = X(X 0 X)−1 X 0 |{z} (1.52a) n×n 12
  15. Luận văn tốt nghiệp Phạm Thị Hương Tương tự vậy, véc tơ phần dư có thể được biểu diễn như sau: e = (I − H)Y |{z} (1.36) n×1 Ma trận hiệp phương sai của phần dư là: σ 2 {e} = σ 2 (I − H) (1.37) | {z } n×n được ước lượng bởi: s2 {e} = M SE(I − H) (1.38) | {z } n×n 1.6 Các kết quả phân tích phương sai 1.6.1 Tổng bình phương và trung bình bình phương Tổng bình phương cho phân tích phương sai dạng ma trận là: 1 h 1 i SST O = Y 0 Y − Y 0 JY = Y 0 I − J Y (1.39) n n SSE = e0 e = (Y − Xb)0 (Y − Xb) = Y 0 Y − b0 X 0 Y = Y 0 (I − H)Y (1.40) 1 h 1 i SSR = b0 X 0 Y − Y 0 JY = Y 0 H − J Y (1.41) n n Bảng 1.1 chỉ ra các kết quả phân tích phương sai, cũng như trung bình bình phương M SR và M SE : SSR M SR = (1.42) p−1 SSE M SE = (1.43) n−p Kỳ vọng của M SR là σ 2 cộng thêm một lượng không âm. Ví dụ, khi p − 1 = 2, ta có: X X E(M SR) = σ 2 + [β12 ¯ 1 )2 + β 2 (Xi1 − X ¯ 2 )2 + (Xi2 − X 2 X 2β1 β2 ¯ 1 )(Xi2 − X (Xi1 − X ¯ 2 )]/2 (1.44) Nguồn biến đổi SS df MS SSR = b X Y − n1 Y 0 JY 0 0 SSR  Hồi quy p−1 M SR = p−1 Sai số SSE = Y 0 Y − b0 X 0 Y n−p M SE = SSE n−p SST O = Y 0 Y − n1 Y 0 JY  Tổng số n−1 Bảng 1.1: Bảng Anova cho mô hình hồi quy tuyến tính tổng quát (1.41) 13
  16. Luận văn tốt nghiệp Phạm Thị Hương 1.6.2. Kiểm định F cho quan hệ hồi quy Để kiểm định liệu có hay không quan hệ hồi quy giữa biến đáp ứng và các biến X : X1 , . . . , Xp−1 , tức là lựa chọn giữa các giả thiết: H0 : β1 = β2 = . . . = βp−1 = 0 Ha : không phải tất cả βk (k=1,. . . ,p-1) bằng 0 (1.61a) ta dùng một thống kê kiểm định: M SR F∗ = (1.61b) M SE Quy tắc để kiểm tra sai lầm loại I tại mức α là: Nếu F ∗ ≤ F (1 − α; p − 1; n − p) chấp nhận H0 Nếu F ∗ > F (1 − α; p − 1; n − p) chấp nhận Ha (1.61c) 1.6.3. Hệ số xác định bội Hệ số xác định bội, ký hiệu R2 , được định nghĩa như sau: SSR SSE R2 = =1− (1.45) SST O SST O Theo trên ta có: 0 ≤ R2 ≤ 1 (1.46) Hệ số xác định bội hiệu chỉnh, ký hiệu Ra2 : SSE   n−p n−1 SSE Ra2 =1− SST O =1− (1.47) n−1 n−p SST O 1.6.4. Hệ số tương quan bội Hệ số tương quan bội R là căn bậc hai của R2 : √ R= R2 (1.48) 14
  17. Luận văn tốt nghiệp Phạm Thị Hương 1.7 Các kết luận về các tham số hồi quy Các ước lượng bình phương cực tiểu và hợp lý cực đại b là không chệch: E(b) = β (1.49) Ma trận hiệp phương sai σ 2 (b):  2  σ (b0 ) σ(b0 , b1 ) . . . σ(b0 , bp−1 )  σ(b1 , b0 ) σ 2 (b1 ) . . . σ(b1 , bp−1 )  σ 2 (b) =  .. .. ..  (1.50) | {z }  . . .  p×p σ(bp−1 , b0 ) σ(bp−1 , b1 ) . . . σ 2 (bp−1 ) được xác định bởi: σ 2 (b) = σ 2 (X 0 X)−1 (1.51) | {z } p×p Ma trận hiệp phương sai ước lượng s2 (b):  2  s (b0 ) s(b0 , b1 ) . . . s(b0 , bp−1 )  s(b1 , b0 ) s2 (b1 ) . . . s(b1 , bp−1 )  s2 (b) =  .. .. ..  (1.52) |{z}  . . .  p×p s(bp−1 , b0 ) s(bp−1 , b1 ) . . . s2 (bp−1 ) được xác định bởi: s2 (b) = M SE(X 0 X)−1 (1.53) |{z} p×p 1.7.1 Ước lượng khoảng tin cậy cho βk Đối với mô hình hồi quy sai số chuẩn (1.41), ta có: bk − β k ∼ t(n − p) k = 0, 1, . . . , p − 1 (1.54) s(bk ) nên khoảng tin cậy cho βk với độ tin cậy 1 − α là: bk ± t(1 − α/2; n − p)s{bk } (1.55) 1.7.2 Kiểm định cho βk 15
  18. Luận văn tốt nghiệp Phạm Thị Hương Để kiểm định: H0 : βk = 0 Ha : βk 6= 0 (1.72a) ta dùng thống kê t: bk t∗ = (1.72b) s{bk } và kết luận theo quy tắc: nếu |t∗ | ≤ t(1 − α/2; n − p) chấp nhận H0 Ngược lại chấp nhận Ha (1.72c) Kết luận chung Nếu g tham số cùng được ước lượng (g ≤ p), khoảng tin cậy với cùng độ tin cậy 1 − α là: bk ± Bs{bk } (1.56) trong đó: B = t(1 − α/2; n − p) (1.73a) 1.8 Ước lượng trung bình đáp ứng và dự báo quan sát mới 1.8.1 Ước lượng khoảng tin cậy của E{Yh } Định nghĩa véc tơ Xh như sau: 1   Xh1 X = .. (1.57)   h . |{z}  p×1 Xh,p−1 Khi đó, trung bình đáp ứng được ước lượng là: E{Yh } = Xh0 b (1.58) 16
  19. Luận văn tốt nghiệp Phạm Thị Hương Ước lượng trung bình đáp ứng theo Xh kí hiệu là Yˆh : Yˆh = Xh0 b (1.59) đây là ước lượng không chệch: E{Yˆh } = Xh0 b = E{Yh } (1.60) và phương sai: σ 2 {Yˆh } = Xh0 (X 0 X)−1 Xh (1.61) Các ước lượng phương sai s2 {Yˆh } được tính như sau: s2 {Yˆh } = M SE(Xh0 (X 0 X)−1 Xh )) = Xh0 s2 {b}Xh (1.62) Giới hạn tin cậy 1 − α cho E{Yh } là: Yˆh ± t(1 − α/2; n − p)s{Yˆh } (1.63) 1.8.2 Miền tin cậy cho mặt hồi quy Các điểm giới hạn của miền tin cậy tại Xh có được từ: Yˆh ± W s{Yˆh } (1.64) 1.8.3 Khoảng tin cậy đồng thời cho một số trung bình đáp ứng 1. Sử dụng miền giới hạn tin cậy Working-Hotelling (1.81) cho các véc tơ Xh khác nhau: Yˆh ± W s{Yˆh } (1.65) 2. Khi thực hiện g ước lượng khoảng, khoảng tin cậy Boferroni là: Yˆh ± Bs{Yˆh } (1.66) trong đó: B = t(1 − α/2g; n − p) (1.83a) 1.8.4 Dự báo quan sát mới Yh(new) 17
  20. Luận văn tốt nghiệp Phạm Thị Hương Giới hạn dự báo 1 − α cho quan sát mới Yh(new) ứng với Xh là: Yˆh ± t(1 − α/2; n − p)s{pred} (1.67) 1.8.5 Dự báo trung bình của m quan sát mới tại Xh Khi m quan sát mới được lựa chọn với cùng mức Xh và trung bình của chúng Y¯h(new) được dự báo, khoảng dự báo 1 − α là: Yˆh ± t(1 − α/2; n − p)s{predmean} (1.68) trong đó: M SE M SE s2 {predmean} = + s2 (Yˆh ) = + Xh0 s2 (b)Xh m  m 1  = M SE + Xh0 (X 0 X)−1 Xh (1.85a) m 1.8.6 Các dự đoán của g quan sát mới Khoảng dự báo đồng thời cho g quan sát mới tại g mức khác nhau của Xh với độ tin cậy 1 − α được đưa ra bởi: Yˆh ± Ss(pred) (1.69) Có thể dùng khoảng dự báo đồng thời Bonferroni để đưa ra khoảng tin cậy đồng thời 1 − α cho g dự báo mới: Yˆh ± Bs{pred} (1.70) 1.8.7 Thận trọng về phép ngoại suy ẩn Khi ước lượng trung bình đáp ứng hoặc dự đoán quan sát mới trong hồi quy bội, cần đặc biệt cẩn thận khi ước lượng hoặc dự báo không nằm ngoài phạm vi của mô hình. 1.9 Chẩn đoán và biện pháp khắc phục 1.9.1 Ma trận đồ phân tán Phân tích được dễ dàng hơn nếu các biểu đồ phân tán được lắp ráp trong một ma trận đồ phân tán, ví dụ hình 1.4: 18
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2