Giới thiệu tài liệu
Ung thư tuyến tiền liệt (UTTTL) là một trong những bệnh lý ác tính phổ biến nhất ở nam giới, đòi hỏi chiến lược phân tầng nguy cơ chính xác để tối ưu hóa chẩn đoán và giảm thiểu các thủ thuật sinh thiết không cần thiết. Việc chẩn đoán sớm và chính xác đóng vai trò then chốt trong việc cải thiện kết quả điều trị và giảm gánh nặng cho bệnh nhân. Các phương pháp truyền thống thường có độ chính xác hạn chế. Với sự tiến bộ của học máy, tiềm năng phát triển các mô hình dự báo tiên tiến đã mở ra. Nghiên cứu này nhằm mục đích xây dựng và đánh giá các mô hình học máy để dự báo nguy cơ UTTTL, dựa trên dữ liệu sinh thiết hợp nhất đàn hồi, nhằm nâng cao hiệu quả chẩn đoán và hỗ trợ quyết định lâm sàng.
Đối tượng sử dụng
Các bác sĩ chuyên khoa tiết niệu, ung thư, chẩn đoán hình ảnh, cũng như các nhà khoa học dữ liệu và nhà nghiên cứu quan tâm đến ứng dụng học máy trong y học để cải thiện chẩn đoán ung thư tuyến tiền liệt.
Nội dung tóm tắt
Nghiên cứu này tập trung vào việc phát triển và đánh giá các mô hình học máy nhằm nâng cao khả năng dự báo nguy cơ ung thư tuyến tiền liệt (UTTTL) và tối ưu hóa quy trình sinh thiết. Với bệnh UTTTL là bệnh lý phổ biến và việc chẩn đoán sớm còn nhiều thách thức, mục tiêu là giảm thiểu sinh thiết không cần thiết và cải thiện phân tầng nguy cơ. Phương pháp nghiên cứu là hồi cứu, sử dụng dữ liệu từ 1550 bệnh nhân nghi ngờ UTTTL tại IUCT-Oncopole từ năm 2018 đến 2023. Tập dữ liệu được phân chia thành 80% để huấn luyện và 20% để kiểm tra. Các mô hình học máy được triển khai bao gồm hồi quy logistic, Random Forest (RF), XGBoost và Support Vector Machine (SVM), tích hợp các biến lâm sàng và dữ liệu cộng hưởng từ (điểm PI-RADS 2.1). Kết quả cho thấy tất cả các mô hình đều đạt hiệu suất phân loại tốt, với chỉ số AUC dao động từ 0,80 đến 0,84 trên tập kiểm tra. Mô hình hồi quy logistic đạt AUC cao nhất (0,84) nhưng có số lượng âm tính giả (FN) lớn (68 trường hợp), trong đó nhiều trường hợp có UTTTL có ý nghĩa lâm sàng. Ngược lại, RF và XGBoost có số FN thấp nhất (28 trường hợp), với tỷ lệ ung thư Gleason ≥ 7 thấp hơn, cho thấy khả năng giảm bỏ sót bệnh nhân nguy cơ cao. SVM đạt độ chính xác và hệ số Kappa cao nhất. Hồi quy logistic với chính quy hóa LASSO được đánh giá là mô hình đơn giản, dễ giải thích và dễ triển khai trong môi trường lâm sàng. Nghiên cứu nhấn mạnh tiềm năng của các mô hình dự báo nguy cơ trong việc hỗ trợ quyết định sinh thiết, tuy nhiên, việc lựa chọn mô hình phù hợp cần cân bằng giữa độ chính xác, khả năng diễn giải và tính dễ triển khai. Các hàm ý bao gồm khả năng ứng dụng các mô hình này để hỗ trợ sàng lọc và đưa ra quyết định sinh thiết cá thể hóa, giúp tối ưu hóa quá trình chẩn đoán UTTTL.