intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

HỒI QUI LOGISTIC (Logistic Regression)

Chia sẻ: Nguyen Uyen | Ngày: | Loại File: PDF | Số trang:5

295
lượt xem
63
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Hồi qui logistic là một kỹ thuật phân tích hồi qui trong đó biến số phụ thuộc (Y) là một biến số nhị phân (dichotomous – binary variable), theo đó Y thường được mã hoá là 1 và 0 (Y = 1, thành công; Y = 0, thất bại). Biến số độc lập trong hồi qui logistic có thể là biến số rời hoặc liên tục, biến số đơn hoặc đa biến số. Phần này chỉ trình bày những nguyên lý và hiểu biết cơ bản của hồi qui logistic. ...

Chủ đề:
Lưu

Nội dung Text: HỒI QUI LOGISTIC (Logistic Regression)

  1. HỒI QUI LOGISTIC (Logistic Regression) I. GIỚI THIỆU Hồi qui logistic là một kỹ thuật p hân tích hồi qui trong đó biến số phụ thuộc (Y) là m ột biến số nhị phân (dichotomous – binary variable), theo đó Y thường được mã hoá là 1 và 0 (Y = 1, thành công; Y = 0, th ất bại). Biến số độc lập trong hồi qui logistic có thể là biến số rời hoặc liên tục, biến số đơn ho ặc đa b iến số. Ph ần này ch ỉ trình bày những nguyên lý và hiểu biết cơ b ản của hồi qui logistic. II. MÔ HÌNH HỒI QUI LOGISTIC Phương trình hồi qui tu yến tính:  y / x là số trung b ình của tiểu dân số Y ở 1 X biết  y / x  0  1 X trước 28
  2.  0 là hằng số chỉ nơi đường hồi qui cắt trục Y, và ước lượng giá trị trung bình của Y khi X = 0 1 là số ước lượng độ dốc, cho biết sự thay đổi trung bình của Y đi kèm với 1 sự thay đổi ở x. biến thiên từ  đến   0  1 Khi Y là biến số nhị phân, ph ương trình trên không sử dụng được vì giá trị mong đợi (số trung b ình) của Y là xác su ất để Y = 1 với giới hạn biến thiên là từ 0 đến 1. Nếu đặt p = P(Y=1) thì tỉ số (p/1–p) có thể biến thiên trong khoảng 0 đến  . Ngoài ra, logarithm tự nhiên (ln) của p/(1-p) có thể biến thiên trong khoảng  đến  . Như vậy: p Ln   =  0  1 X (1) 1  p  (1) được gọi là mô hình hồi qui logistic vì sự chuyển dạng của  y / x (hoặc p) thành ln [p/(1–p)] được gọi là sự chuyển dạng logit (logit transformation). 29
  3. (1) cũng được trình bày như sau: exp( 0  1 X ) exp: nghịch đảo của ln p= 1  exp( 0  1 X ) III. HỒI QUI LOGISTIC VỚI BIẾN SỐ ĐỘC LẬP NHỊ PHÂN Sử dụng bảng 2x2 với số TKKĐ là Tỉ số chênh (Odds Ratio). IV. HỒI QUI LOGISTIC VỚI BIẾN SỐ ĐỘC LẬP LIÊN TỤC Thí dụ minh hoạ: Xác đ ịnh mối tương quan giữa tuổi và nồng độ Cholesterol toàn phần (TC) thực hiện trên cộng đồng người Mỹ gốc Mỹ La tinh (Hispanic Americans), và dựa trên đó để tiên đoán kh ả năng của 1 người Hispanic American có nồng TC ≥ 240 nếu biết trước tuổi của người đó. Hispanic Americans với nồng độ TC ≥ 240 mg% phân bố theo Tuổi Nhóm tuổi (năm) Số được khám (n i) Số có TC ≥ 240 (ni1) 30
  4. 25 – 34 522 41 35 – 44 330 51 45 – 54 344 81 55 – 64 219 81 65 – 74 114 50 Biến số độc lập là biến số liên tục (Tuổi). Do không có số liệu về tuổi của từng cá nhân nên việc phân tích Biến số phụ thuộc là biến số nhị phân (TC ≥ 240 và TC < 240). Kết quả:  0  4, 04 1  0, 06 PT. Hồi qui: yi  4, 04  0, 06 x trong đó ni1: số người trong nhóm tuổi thứ I có TC ≥ yi  ln(ni1 / ni 2 ) 240 ni1 + n i2 = ni Kiểm định giả thuyết H0: 1  0 cho kết quả p < 0,0001 (Chisquare test vói 1 df) Kết luận: Phương trình hồi qui thích hợp để sử dụng. 31
  5. Sử dụng hồi qui logistic để tiên đoán: tìm xác suất để 1 Hispanic American ở độ tuổi 29,5 có TC ≥ 240. exp[4, 04  (0, 06)(29,5)] p  0, 087 1  exp[4, 04  (0, 06)(29,5)] V. HỒI QUI LOGISTIC VỚI ĐA BIẾN SỐ ĐỘC LẬP RỜI Mô hình hồi qui logistic (với 3 biến số độc lập rời – discrete independent variables) 1 PX  1  exp[ ( 0  1 X 1   2 X 2  3 X 3 )] ---------------------------------------------------------------------------------------------------- ---- ----------------------------------------------------------------------------------------- 32
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2