Giới thiệu tài liệu
Tài liệu này trình bày về phương pháp cộng hòa trong học máy, đó là việc kết hợp nhiều mô hình hoặc luận định để tạo ra một kết quả dự đoán chính xác hơn. Tác giả giới thiệu các phương pháp như: Bagging (Bootstrap Aggregating), Boosting và Stacking.
Đối tượng sử dụng
nhà nghiên cứu, sinh viên về học máy
Nội dung tóm tắt
Tài liệu trình bày quan tâm chủ yếu về các phương pháp cộng hòa trong học máy, mục đích đó là để tạo ra một kết quả dự đoán chính xác hơn. Các phương pháp này bao gồm: Bagging (Bootstrap Aggregating), Boosting và Stacking. Bagging là việc kết hợp nhiều instance của một mô hình giống nhau, chỉ có trên các bộ dữ liệu khác nhau. Boosting là quá trình huấn luyện các mô hình trên residuals của mô hình trước đó. Stacking sử dụng một mô hình meta-model để kết hợp các đoán của nhiều base model. Tài liệu còn giới thiệu về các phương pháp voting, như hard voting, soft voting và voting trọng số. Ngoài ra, tài liệu cũng cung cấp ví dụ về áp dụng các phương pháp này đến dataset Diabetes Predictions bằng scikit-learn và các thư viện khác.