Giới thiệu tài liệu
Bài viết này trình bày nghiên cứu về kỹ thuật rút gọn đặc trưng trong phân tích dữ liệu y tế, một vấn đề quan trọng trong bối cảnh dữ liệu y tế ngày càng lớn và phức tạp. Mục tiêu là ứng dụng các kỹ thuật rút gọn đặc trưng để lựa chọn mô hình tối ưu trong hỗ trợ quyết định chẩn đoán bệnh, sử dụng thuật toán Bayes và phần mềm R.
Đối tượng sử dụng
Sinh viên, nhà nghiên cứu trong lĩnh vực y tế và khoa học dữ liệu quan tâm đến phân tích dữ liệu y tế và ứng dụng học máy trong chẩn đoán bệnh.
Nội dung tóm tắt
Nghiên cứu này tập trung vào việc sử dụng thuật toán Bayes để rút gọn các đặc trưng trong phân tích dữ liệu y tế, cụ thể là dữ liệu về bệnh tiểu đường. Mục tiêu chính là xây dựng một mô hình tiên lượng bệnh tiểu đường hiệu quả hơn bằng cách loại bỏ các đặc trưng dư thừa và nhiễu. Phương pháp nghiên cứu bao gồm việc áp dụng thuật toán Bayes trên phần mềm R để lựa chọn các đặc trưng tối ưu từ bộ dữ liệu bệnh tiểu đường. Kết quả cho thấy việc sử dụng thuật toán Bayes giúp giảm độ phức tạp của mô hình mà vẫn duy trì được độ chính xác cao trong tiên lượng chẩn đoán. Mô hình rút gọn đạt độ nhạy 80.60% và độ đặc hiệu 93.26%. Nghiên cứu cũng đánh giá mô hình bằng ma trận hỗn hợp và đường cong ROC, cho thấy khả năng phân loại tốt của mô hình.