intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Tin học trong quản lý chất lượng: Phần 3 - Vũ Hồng Sơn

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:36

11
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Tin học trong quản lý chất lượng: Phần 3" bao gồm các nội dung chính về mô hình hồi quy bao gồm: Phân tích hồi quy, đường hồi quy, biến phụ thuộc và biến độc lập, hồi quy đa biến. Mời quý thầy cô và các em cùng tham khảo bài giảng!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Tin học trong quản lý chất lượng: Phần 3 - Vũ Hồng Sơn

  1. Tin UD trong QLCL Hồi quy tuyến tính Mô hình hồi quy NỘI DUNG 1. Phân tích hồi quy 2. Biến phụ thuộc và biến độc lập 3. Đường hồi quy 4. Hồi quy đa biến PhD.VHSon_Hust 1
  2. Tin UD trong QLCL Hồi quy tuyến tính 1. Phân tích hồi quy  Phân tích mối liên hệ của biến phụ thuộc với một hay nhiều biến độc lập thông qua việc ước lượng giá trị trung bình của tổng thể.  Kết quả phân tích hồi quy có thể được dùng để ước lượng hay dự đoán giá trị trung bình của một biến dựa trên số liệu đã biết của biến khác. 2. Biến phụ thuộc và độc lập 1 2 Biến phụ thuộc Biến độc lập Biến được g/thích Biến giải thích Biến được dự báo Biến dự báo Biến được hồi quy Biến hồi quy Biến phản ứng Biến tác nhân Biến nội sinh Biến ngoại sinh PhD.VHSon_Hust 2
  3. Tin UD trong QLCL Hồi quy tuyến tính 3. Đường hồi quy Là đường tập hợp những giá trị trung bình của biến phụ thuộc dựa vào giá trị đã biết của biến giải thích 3. Đường hồi quy PhD.VHSon_Hust 3
  4. Tin UD trong QLCL Hồi quy tuyến tính 3. Đường hồi quy Nếu mối quan hệ giữa các biến này là tuyến tính => Mô hình hồi quy tuyến tính Thuật ngữ “tuyến tính” ở đây được hiểu:  Tuyến tính đối với tham số • E(Y/Xi) =  1 +  2Xi • E(Y/Xi) =  1 +  2Xi2 • E(Y/Xi) =  1 +  2Xi +  3Xi  Tuyến tính đối với biến số • E(Y/Xi) =  1 + (1/ 2)Xi • E(Y/Xi) =  1 +  22 Xi 4. Mô hình hồi quy tổng thể  Mối liên hệ giữa biến phụ thuộc và biến giải thích dựa trên số liệu đã biết của toàn bộ tổng thể.  Mô hình hồi qui đơn (Simple regression) là mô hình phương trình gồm một biến phụ thuộc (Y) và một biến giải thích (X). Mô hình có dạng: PRF E(Y/Xi)= 1 + 2 Xi PRM Yi = 1 + 2 Xi + ui PRF (population regression function)-hàm hồi quy tổng thể PRM (population regression model)-mô hình hồi quy tổng thể PhD.VHSon_Hust 4
  5. Tin UD trong QLCL Hồi quy tuyến tính 4. Mô hình hồi quy tổng thể Trong đó: Y: Biến phụ thuộc,Yi: Giá trị cụ thể của biến phụ thuộc X: Biến độc lập, Xi : Giá trị cụ thể của biến độc lập β1 : Tung độ của hàm hồi quy tổng thể, hệ số chặn (intercept coefficient), là giá trị trung bình của biến phụ thuộc Y khi biến độc lập nhận giá trị bằng 0 β2 : Hệ số dốc của hàm hồi quy (slope coefficient), phản ánh độ dốc của hàm hồi quy tổng thể , là lượng thay đổi trung bình của Y khi X thay đổi 1 đơn vị Ui : Sai số ngẫu nhiên ứng với quan sát thứ i. (random errors) 4. Mô hình hồi quy tổng thể Sai số ngẫu nhiên Xét giá trị cụ thể Yi  (Y/Xi), thông thường Yi ≠ E(Y/Xi) Đặt ui = Yi – E(Y/Xi) : là sai số ngẫu nhiên (nhiễu, yếu tố ngẫu nhiên: random errors) Tính chất của SSNN:  Nhận những giá trị dương và âm.  Kỳ vọng bằng 0: E(ui) = 0 ∀ i PhD.VHSon_Hust 5
  6. Tin UD trong QLCL Hồi quy tuyến tính 4. Mô hình hồi quy tổng thể Bản chất của SSNN: Những yếu tố không biết. Những yếu tố không có số liệu. Những yếu tố không ảnh hưởng nhiều đến biến phụ thuộc. Sai số của số liệu thống kê. Sai lệch do chọn dạng hàm số. Những yếu tố mà tác động của nó không mang tính hệ thống. 4. Mô hình hồi quy tổng thể Ví dụ :Xét sự phụ thuộc chi tiêu Y của một gia đình vào thu nhập X ở một địa phương có tổng cộng 60 hộ gia đình. X 80 100 120 140 160 180 200 220 240 260 Y1 55 65 79 80 102 105 120 135 137 150 Y2 60 70 84 93 107 110 136 137 145 152 Y3 65 74 90 95 110 110 140 140 155 175 Y4 70 80 94 103 116 115 144 152 165 178 Y5 75 85 98 108 118 120 145 157 175 180 Y6 88 113 125 130 160 189 185 Y7 115 162 191  Yi 325 462 445 707 678 690 685 1043 966 1211 E(Y/Xi) 65 77 89 101 113 115 137 149 161 173 PhD.VHSon_Hust 6
  7. Tin UD trong QLCL Hồi quy tuyến tính 4. Mô hình hồi quy tổng thể 4. Mô hình hồi quy tổng thể Tương ứng với mỗi X (mức thu nhập tuần), sẽ có một nhóm Y (các mức chi tiêu) phân tán xung quanh giá trị trung bình của Y. Nếu xem xét mức chi tiêu cụ thể của từng hộ gia đình thì thấy có sự sai lệch so với mức chi tiêu trung bình của cả nhóm các hộ gia đình có cùng thu nhập. Ui là độ sai lệch giữa giá trị quan sát thực tế Yi với E(Y/Xi) và được gọi là nhiễu hoặc sai số ngẫu nhiên PhD.VHSon_Hust 7
  8. Tin UD trong QLCL Hồi quy tuyến tính 5. Mô hình hồi quy mẫu Hàm hồi quy được xây dựng trên một mẫu được gọi là hàm hồi quy mẫu Mẫu: một số phần tử của tổng thể. W = {(Xi, Yi), i = 1-n} được gọi là một mẫu kích thước n, có n quan sát (observation). SRF Y = +2Xi ˆ ˆ ˆ i 1 SRM Yi = 1 +  2 X i + ei ˆ ˆ 1 Tung độ gốc của hàm hồi quy mẫu, là ước lượng ˆ điểm của β1  ˆ 2 Độ dốc của hàm hồi quy mẫu, là ước lượng điểm của β2 5. Mô hình hồi quy mẫu Đặt ei = Yi – ˆ Yi và gọi là phần dư (residual), là ước lượng điểm của Ui Bản chất của phần dư ei giống sai số ngẫu nhiên ui Mục tiêu của phân tích hồi quy mẫu Tìm giá trị ước lượng gần với giá trị thực tế hay giá trị tổng thể mặc dù không biết trước được giá trị thật của tổng thể Đường hồi quy mẫu càng gần với đường hồi quy tổng thể thì kết quả hồi quy có giá trị càng cao. PhD.VHSon_Hust 8
  9. Tin UD trong QLCL Hồi quy tuyến tính 5. Mô hình hồi quy mẫu Ví dụ: hai ngẫu nhiên từ tổng thể trong Bảng 2.1 Mẫu 1 Mẫu 2 5. Mô hình hồi quy mẫu Hình 2.4: Đường hồi quy tương ứng với hai mẫu 1 và 2 PhD.VHSon_Hust 9
  10. Tin UD trong QLCL Hồi quy tuyến tính 6. Ước lượng các tham số hồi quy (OLS-Ordinary Least Square) - Mô hình hồi qui đơn ( Simple regression ) là mô hình phương trình gồm một biến phụ thuộc (Y) và một biến giải thích (X). - Mô hình có dạng: PRF E(Y/Xi)= 1 + 2 Xi PRM Yi = 1 + 2 Xi + ui - Với mẫu W = {(Xi, Yi), i = 1-n}, tìm 1 ,  2 sao cho ˆ ˆ SRF Y =1 +2Xi ˆ ˆ ˆ i SRM Yi = 1 +  2 X i + ei ˆ ˆ phản ánh xu thế biến động về mặt trung bình của mẫu. 6. Ước lượng các tham số hồi quy Sai số ei =Y −Y =Y −1 −2Xi i ˆ i i ˆ ˆ Tìm 1 ,  2 sao cho tổng bình phương sai số là ˆ ˆ nhỏ nhất ∑e =∑(Y − − X ) →min n n 2 Tức là 2 ˆ ˆ i i 1 2 i i=1 i=1 PhD.VHSon_Hust 10
  11. Tin UD trong QLCL Hồi quy tuyến tính 6. Ước lượng các tham số hồi quy 6. Ước lượng các tham số hồi quy Điều kiện để phương trình trên đạt cực trị là: n ∂ (∑ ei2 ) n   i =1  = −2∑ (Yi − 1 −  2 X i ) = 0 ∂1 i =1 n ∂ (∑ ei2 ) n   i =1  = −2∑ X i (Yi − 1 −  2 X i ) = 0 ∂ 2 i =1 ∑ Y = nˆ + ˆ ∑ X i 1 2 i ∑ X Y = ˆ ∑ X + ˆ ∑ X i i 1 i 2 i 2 PhD.VHSon_Hust 11
  12. Tin UD trong QLCL Hồi quy tuyến tính 6. Ước lượng các tham số hồi quy Giải bài toán cực trị hàm hai biến, ta được n n ∑ ( X i − X )(Yi − Y ) ∑Y X i i − n. X .Y 2 = ˆ i =1 n = i =1 n ∑(X i =1 i − X) 2 ∑X i =1 2 i − n.( X ) 2 1 = Y −  2 X ˆ ˆ Với X= ∑X i là giá trị trung bình của X n Y = ∑ Yi là giá trị trung bình của Y n 6. Ước lượng các tham số hồi quy Ví dụ: Quan sát về thu nhập (X – triệu đồng/năm) và chi tiêu (Y – triệu đồng/năm) của 10 người, ta được các số liệu sau : Xi 31 50 47 45 39 50 35 40 45 50 Yi 29 42 38 30 29 41 23 36 42 48 Xây dựng hàm hồi quy mẫu Yi = 1 +  2 X i ˆ ˆ ˆ Yi = −5,4517 + 0,9549 X i ˆ PhD.VHSon_Hust 12
  13. Tin UD trong QLCL Hồi quy tuyến tính 7. Các giả thuyết của mô hình Giả thuyết 1: Mô hình hồi quy có dạng tuyến tính đối với tham số. Giả thuyết 2: Biến giải thích là phi ngẫu nhiên Giả thuyết 3: Trung bình của các sai số ngẫu nhiên bằng 0 E(ui) = 0  i Giả thuyết 4: Phương sai sai số ngẫu nhiên bằng nhau Var(ui) = 2  i Giả thuyết 5: Các sai số ngẫu nhiên không tuơng quan Cov(ui, uj) = 0  i ≠ j 7. Các giả thuyết của mô hình Giả thuyết 6: SSNN và biến giải thích không tương quan: Cov(ui, Xi) = 0  i Giả thuyết 7: Các giá trị của biến giải thích phải khác nhau càng nhiều càng tốt : Var(X) > 0 Giả thuyết 8: Kích thước mẫu phải lớn hơn số tham số cần ước lượng của mô hình. n > k Giả thuyết 9: Mô hình được chỉ định đúng. Giả thuyết 10: Không có đa cộng tuyến giữa các biến giải thích của mô hình hồi quy bội. PhD.VHSon_Hust 13
  14. Tin UD trong QLCL Hồi quy tuyến tính 7. Các giả thuyết của mô hình Định lý Gaus-Markov: Nếu tổng thể thỏa mãn các giả thuyết trên thì ước lượng OLS (Ordinary Least Square) sẽ là ước lượng tuyến tính, không chệch, tốt nhất (trong số các ước lượng không chệch) của các tham số (Best Linear Unbiassed Estimator - BLUE). 8. Các tham số đặc trưng Kỳ vọng E ( 1 ) = 1 ˆ E ( 2 ) =  2 ˆ Phương sai Var ( 1 ) =  ˆ = ˆ 2 ∑X i 2 2 ≈ ∑X i 2 2 ˆ 1 n ( ∑ X − nX i 2 2 ) n ( ∑ X − nXi 2 2 ) 2 2 ˆ Var (  2 ) =  ˆ = ˆ 2 ≈ 2 ∑X i 2 − nX 2 ∑X i 2 − nX 2 ˆ 2 = ∑e 2 i = ∑ (Y − Yˆ ) i i 2 = RSS n−2 n−2 n−2 PhD.VHSon_Hust 14
  15. Tin UD trong QLCL Hồi quy tuyến tính 8. Các tham số đặc trưng Sai số chuẩn (Standard error) se ) =( ) =  ( ˆ1 ˆ 1 2 ˆ 1 se2) =(2) =  (ˆ ˆ 2 ˆ 2 9. Hệ số phù hợp và hệ số tương quan Tổng bình phương toàn phần Total Sum of Squares-TSS Tổng bình phương tất cả các sai lệch giữa giá trị thực tế của Y với giá trị trung bình của nó. TSS = ∑(Yi −Y ) = ∑Yi 2 − n(Y )2 2 PhD.VHSon_Hust 15
  16. Tin UD trong QLCL Hồi quy tuyến tính 9. Hệ số phù hợp và hệ số tương quan Tổng bình phương hồi quy Explained Sum of Squares-ESS Tổng bình phương tất cả các sai lệch giữa giá trị của Y được tính theo mô hình với giá trị trung bình của nó. ESS = ∑ (Yi − Y ) =  22 (∑ X i2 − nX 2 ) 2 ˆ ˆ 9. Hệ số phù hợp và hệ số tương quan Tổng bình phương phần dư Residual Sum of Squares-RSS Tổng bình phương tất cả các sai lệch giữa giá trị thực tế với giá trị lý thuyết theo mô hình của Y. RSS = ∑ (Yi −Yi ) 2 = ∑ ei2 ˆ PhD.VHSon_Hust 16
  17. Tin UD trong QLCL Hồi quy tuyến tính 9. Hệ số phù hợp và hệ số tương quan = + TSS ESS RSS Hệ số phù hợp (coefficient of determination) ESS R= 2 TSS •0≤ R2 ≤1 •R2 = 1: mô hình hoàn toàn phù hợp với mẫu nghiên cứu •R2 = 0: mô hình không phù hợp với mẫu nghiên cứu 9. Hệ số phù hợp và hệ số tương quan Chứng minh TSS = ESS + RSS 2 2 2  ∧ ∧   ∧  ∧   ∧  ∧  TSS= ∑ y − y+ y− y  = ∑ y − y  + ∑ y− y  + 2∑ y − y  y− y            ∧  ∧  = RSS+ ESS+ 2∑ y − y  y− y     ∑ y − y y− y = ∑ y − y −  (x − x)  (x − x)=  ∑(y − y)(x − x)−  (x − x)   ∧  ∧   ∧  ∧ ∧  ∧ 2      2  2 2  2  ∧ ( ) ( 2 ) ∧ ∧ = 2 2 ∑ x − x − 2 ∑ x − x  = 0 2   PhD.VHSon_Hust 17
  18. Tin UD trong QLCL Hồi quy tuyến tính 9. Hệ số phù hợp và hệ số tương quan Y SRF Yi Yi −Yi = ei ˆ Yi −Y Yi −Y ˆ Y Xi X 9. Hệ số phù hợp và hệ số tương quan Hệ số tương quan: là hệ số đo lường mức độ chặt chẽ của quan hệ tuyến tính giữa X và Y r= ∑ ( X − X )(Y − Y ) i i ∑ ( X − X ) ∑ (Y − Y ) i 2 i 2 • Đặt xi = X i − X thì r= ∑x y i i yi = Yi − Y ∑x ∑y 2 2 • Nếu r = ± R 2 dấu của r trùng với dấu của  2 ˆ PhD.VHSon_Hust 18
  19. Tin UD trong QLCL Hồi quy tuyến tính 9. Hệ số phù hợp và hệ số tương quan Tính chất hệ số tương quan: • -1 ≤ r ≤ 1 • r = 1, r = -1: Tương quan mạnh giữa X và Y • r = 0: Không có tương quan • r có tính chất đối xứng 9. Hệ số phù hợp và hệ số tương quan Ví dụ: Quan sát về thu nhập (X – triệu đồng/năm) và chi tiêu (Y – triệu đồng/năm) của 10 người, ta được các số liệu sau : Xi 31 50 47 45 39 50 35 40 45 50 Yi 29 42 38 30 29 41 23 36 42 48 Tính hệ số xác định R2 của mô hình Tính hệ số tương quan r PhD.VHSon_Hust 19
  20. Tin UD trong QLCL Hồi quy tuyến tính 10. Phân phối xác suất của các ước lượng Gỉa thiết Ui ~ N(0,σ2) Khi đó các ước lượng 1 ,  2 ,  có tính chất sau: ˆ ˆ ˆ 1. Là các ước lượng không chệch 2. Có phương sai nhỏ nhất 3. Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ giá trị thực 4. Ước lượng 1 ≈ N ( 1 ,  2 ) ˆ ˆ 1 5. Ước lượng  2 ≈ N (  2 ,  ˆ2 ) ˆ 2 (n − 2) 2 ˆ 6. Ước lượng 2 = ≈  (2n− 2)  2 7. Yi ~ N(β1 + β2Xi, σ 2) 11. Khoảng tin cậy của hệ số hồi quy Khoảng tin cậy của β1 β2 σ2 với độ tin cậy 1-α là (ˆ 1 − t / 2 ,n − 2 × se ( ˆ 1 ); ˆ 1 + t  / 2 ,n − 2 × se ( ˆ 1 ) ) (ˆ 2 − t / 2,n − 2 × se(  2 );  2 + t / 2,n − 2 × se(  2 ) ˆ ˆ ˆ )    ( n − 2 ). ˆ ( n − 2 ). ˆ  2 2  ;    2  12−    2 2  Với t / 2 có được khi tra bảng t-Student với bậc tự do (n-2) Với  2 có được khi tra bảng χ2 (chi-square) với bậc tự do (n-2) 2 PhD.VHSon_Hust 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
6=>0