ĐI HỌC QUỐC GIA TP. HCHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGH THÔNG TIN
1
HÌNH BÀI TOÁN Y HC
TS. Nguyễn Vinh Tiệp
Thực hiện bởi Trường Đại học Công nghThông tin, ĐHQG-HCM
NỘI DUNG
Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2
I. Bài toán máy học
II. hình máy học
A. Nền tảng
B. Bagging and Boosting
C. hình cây (tree-based)
III. Máy học tự động (Auto Machine learning)
9 May, 2024
Trường ĐH CNTT Lập trình Python cho Máy học (CS116)
Bagging
Thuộc vào nhóm hình học kết hợp (ensemble-based learning)
Các hình Weak learners chừng học song song độc lập,kết hợp các hình để xác định dự
đoán trung bình của hình
Vd:Random Forest
https://www.geeksforgeeks.org/bagging-vs-boosting-in-machine-learning/
Trường ĐH CNTT Lập trình Python cho Máy học (CS116)
c bước thực hiện của hình Bagging
Bước 1
Nhiều tập hợp con được
tạo từ tập dữ liệu gốc với
các bộ dữ liệu bằng
nhau, chọn các quan sát
có thể thay thế
Bước 2
Một mô hình cơ sở được
tạo trên mỗi tập hợp con
này
Bước 3
Mỗi mô hình được học
song song với mỗi tập
huấn luyện và độc lập với
nhau
Bước 4
Các dự đoán cuối cùng
được xác định bằng cách
kết hợp các dự đoán từ
tất cả các mô hình
Trường ĐH CNTT Lập trình Python cho Máy học (CS116)
Random Forest
Sử dụng Bagging (Bootstrap Aggregating) để huấn luyện từng hình Decision Tree trên một tập hợp
con dữ liệu ngẫu nhiên khác nhau
Giảm sự tương quan giữa các cây làm cho ensemble trở nên mạnh mẽ hơn
https://en.wikipedia.org/wiki/Random_forest