Bài giảng Đánh giá mô hình hồi quy Logistic
lượt xem 5
download
Bài giảng trình bày ba tiêu chí cho một mô hình tiên lượng: phân định, chính xác và tái phân nhóm; hai thước đo độ tin cậy của một mô hình; ý nghĩa thật của AUC; đánh giá độ chính xác calibration; ...
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Đánh giá mô hình hồi quy Logistic
- Tuan V. Nguyen Senior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj. Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V. Nguyen
- Ba tiêu chí cho một mô hình tiên lượng • Discrimination – phân định • Calibration – chính xác • Reclassification – tái phân nhóm
- Discrimination – phân định
- Hai thước đo độ tin cậy của một mô hình • Sensitivity – độ nhạy • Specificity – độ đặc hiệu
- Độ nhạy • Trong số những người mắc bệnh, bao nhiêu % có tiên lượng dương tính? • Gold standard – mắc bệnh trong thực tế • Test result – mô hình tiên lượng
- Độ đặc hiệu • Trong số những người không mắc bệnh, bao nhiêu % có tiên lượng âm tính • Gold standard – mắc bệnh trong thực tế • Test result – mô hình tiên lượng
- Ví dụ Tiên lượng Bệnh (n=177) Không bệnh (n=81) +ve (trên 20%) 120 20 -ve (dưới 20%) 57 61 Tổng số 177 81
- Ví dụ Tiên lượng Bệnh (n=177) Không bệnh (n=81) +ve (trên 20%) 120 20 -ve (dưới 20%) 57 61 Tổng số 177 81 Sensitivity = 120 / 177 = 0.68 Specificity = 61 / 81 = 0.75
- Tỉ lệ dương tính giả (false +ve) Tiên lượng Bệnh (n=177) Không bệnh (n=81) +ve (trên 20%) 120 20 -ve (dưới 20%) 57 61 Tổng số 177 81 Sensitivity (dương tính thật) = 120 / 177 = 0.68 Specificity = 61 / 81 = 0.75 Dương tính giả = 1 – 0.75 = 0.25
- ROC curve • Receiver operating characteristic (ROC) curve • Đo lường khả năng phân định (power of discrimination) của một xét nghiệm hay mô hình tiên lượng • Thường dùng cho các kết quả biến liên tục • Y-axis (trục tung): true positive (sensitivity) • X-axis (trục hoành): false positive (1-specificity)
- Một ví dụ về một xét nghiệm hoàn hảo G Tripepi et al.: Diagnostic methods 24 h microalbuminuria cutoff tion ind True negatives True positives minate a large renal d (true-n positive individ classifie to the r 0 10 20 30 40 50 60 the fals 24h microalbuminuria (mg/24 h) the fals the cut Patients with renal dysfunction false-ne Healthy subjects false-po Figure 1 | Scattergram of 24 h microalbuminuria in patients cutoff c with renal dysfunction (gray circles) and in healthy subjects (green circles). Because of the way we defined renal dysfunction,
- disease, indicating that a 24 h microalbuminuria 430 mg/day Clinica Nhưng trong thực tế perfectly discriminates between sick and healthy people. For thi diagno we con Urine albumin:creatinine ratio cutoff dysfun False negatives True positives microa assesse throug helps t An True negatives False positives sensitiv specific series o 0 10 20 30 40 50 60 given d Urine albumin:creatinine ratio both u (mg/g of creatinine) analysi of the Patients with renal dysfunction conside Healthy subjects range Figure 2 | Scattergram of urine albumin:creatinine ratio plottin (UACR) in patients with renal dysfunction and in healthy ing to
- Ví dụ về tiên lượng ung thư tiền liệt tuyến PSA level (ng/mL) Sensitivity Specificity ≥1 1.00 0.21 ≥2 1.00 0.48 ≥3 1.00 0.60 ≥4 0.99 0.73 ≥5 0.96 0.76 ≥6 0.94 0.79 ≥7 0.90 0.83 ≥8 0.90 0.88 ≥9 0.68 0.90 ≥ 10 0.54 0.93 ≥ 11 0.47 0.94 ≥ 12 0.30 0.95 ≥ 13 0.23 0.96 ≥ 14 0.17 0.97 ≥ 15 0.11 0.97 Morgan TO, et al. Age-specific reference ranges for serum prostate specific antigen in black men. N Engl J Med 1996;335:304-310
- ROC curve !
- Diện tích dưới đường biểu diễn (area under the curve - AUC) !
- Diễn giải AUC AUC Meaning >0.90 Excellent test 0.80 to 0.90 Good 0.70 to 0.80 Fair 0.60 to 0.70 Poor 0.50 to 0.60 Fail
- Ý nghĩa thật của AUC • Định nghĩa: Probability that a randomly selected pair of healthy individual and patient, the test result will be higher in the patient than in the healthy individual (xác suất mà một cặp bệnh nhân và người bình thường được chọn, và bệnh nhân có giá trị tiên lượng cao hơn người bình thường) • Khó hiểu!
- Một ví dụ đơn giản • Chúng ta có 7 người được theo dõi 5 năm • 4 người mắc bệnh ung thư tiền liệt tuyến, và giá trị PSA là: 8, 2, 6, 3 • 3 người không mắc bệnh, giá trị PSA: 3, 2, 6
- Tổ hợp • 4 giá trị PSA của 4 bệnh nhân • 3 giá trị PSA của 3 người không bệnh • Tổng số cặp có thể: 4 x 3 = 12 • AUC = số cặp mà PSA bệnh nhân cao hơn PSA của người không mắc bệnh chia cho 12.
- Nếu chúng bắt cặp bệnh nhân 1 với 3 người trong nhóm không bệnh: Bệnh Không bệnh Chú ý 8 3 Concordant (8 > 3) 2 2 Concordant (8 > 2) 6 6 Concordant (8 > 6) 3
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Bộ môn Công nghệ phần mềm - Bài 3: Kiến trúc phần mềm
27 p | 137 | 20
-
Bài giảng môn học Kỹ nghệ phần mềm: Bài mở đầu - PGS.TS. Nguyễn Văn Vỵ
8 p | 103 | 15
-
Bài giảng Hệ thống thông tin quản trị - Chương 8: Quản lý hệ thống thông tin
12 p | 88 | 13
-
Bài giảng Bộ môn Công nghệ phần mềm - Bài 5: Thiết kế giao diện người dùng
35 p | 93 | 13
-
Bài giảng Nhập môn Học máy và Khai phá dữ liệu: Chương 3 - Nguyễn Nhật Quang
19 p | 28 | 9
-
Bài giảng Nhập môn Học máy và Khai phá dữ liệu - Chương 6: Phân loại và đánh giá hiệu năng
30 p | 28 | 7
-
Bài giảng Mô hình bề mặt - Surface các phương pháp xây dựng
5 p | 112 | 6
-
Bài giảng Khai phá web - Bài 4: Tìm kiếm thông tin
62 p | 24 | 6
-
Bài giảng Ứng dụng mô hình hồi quy Logistic
24 p | 78 | 5
-
Bài giảng Ứng dụng mô hình hồi quy tuyến tính: Đánh giá mối liên quan
35 p | 64 | 5
-
Bài giảng Nhập môn khai phá dữ liệu: Chương 6 - PGS. TS. Hà Quang Thụy
55 p | 26 | 4
-
Bài giảng Bài 5: Công cụ mô hình hóa dữ liệu - Nguyễn Hoài Anh
33 p | 91 | 4
-
Bài giảng Thước đo đánh giá mô hình hồi quy tuyến tính
14 p | 51 | 3
-
Bài giảng Mạng máy tính: Mở đầu - TS. Trần Quang Diệu
7 p | 66 | 3
-
Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 2 - Viện Công nghệ Thông tin và Truyền thông
20 p | 47 | 3
-
Bài giảng Tìm kiếm và trình diễn thông tin: Giới thiệu môn học
7 p | 7 | 1
-
Bài giảng Tìm kiếm và trình diễn thông tin - Bài 7: Đánh giá kết quả tìm kiếm
42 p | 4 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn