Trang chủ » Công Nghệ Thông Tin » Kỹ thuật phần mềm

39 trang

132 lượt xem

3

0

Bài giảng Lập trình Python cho máy học: Bài 10 - TS. Nguyễn Vinh Tiệp

Bài giảng "Lập trình Python cho máy học: Bài 10 - Xây dựng mô hình máy học" tập trung vào quy trình xây dựng mô hình máy học từ đầu đến cuối, bao gồm các bước huấn luyện, đánh giá và tối ưu hóa mô hình. Nội dung bao gồm cách chọn mô hình phù hợp, huấn luyện mô hình với dữ liệu, đánh giá hiệu suất mô hình qua các chỉ số như accuracy, precision, recall, F1-score, và sử dụng các kỹ thuật như cross-validation để đảm bảo mô hình không bị quá khớp. Mời các bạn cùng tham khảo!

Chủ đề:

Lập trình ứng dụng

Bài giảng Lập trình ứng dụng

/

39

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

1

XÂY DỰNG MÔ HÌNH MÁY

HỌC

Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM

NỘI DUNG

Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2

I. Model Selection và Evaluation

A. Holdout Validation

B. Cross Validation

C. Hyper-parameters Optimization

D. Evaluation Metric

II. Handle Imbalanced Data Method

A. Resampling

B. Cost sensitive learning

C. Tools

III. Error Analysis Model

14 May, 2024

Trường ĐH CNTT – Lập trình Python cho Máy học (CS116)

Holdout Validation

❏Một phương pháp đơn giản để đánh giá các mô hình trên dữ liệu chưa biết

❏Chia dư liệu hiện tại thành các tập con riêng biệt để tạo thành tập huấn luyện và tập xác thực

(và có thể tập kiểm tra)

Trường ĐH CNTT – Lập trình Python cho Máy học (CS116)

Vấn đề với Holdout Validation

4

PP yêu cầu dành một phần dữ liệu để thử nghiệm

(không được sử dụng cho mô hình huấn luyện)

Sử dụng dữ

liệu

Vấn đề với Holdout

Validation

Thiên vị do

lấy mẫu

ngẫu nhiên

Có thể có vấn đề khi xử lý các tập dữ liệu nhỏ vì

nó giới hạn lượng dữ liệu mà mô hình có thể học

Phân chia ngẫu nhiên có thể dẫn đến “thiên vị”

nếu nó không đại diện cho toàn bộ tập dữ liệu

Điều này có thể dẫn đến việc mô hình hoạt động tốt trên tập xác

thực (validation) nhưng lại hoạt động kém trên dữ liệu thực tế

chưa được nhìn thấy.

Trường ĐH CNTT – Lập trình Python cho Máy học (CS116)

Vấn đề với Holdout Validation

5

Mô hình được tinh chỉnh nhiều lần để tối ưu

hóa hiệu suất trên validation set →dẫn đến

overfitting

Overfitting trên

Validation Set

Vấn đề với Holdout

Validation

Variance

Điều này có thể dẫn đến hiệu suất tăng cao và

khả năng khái quát hóa kém đối với dữ liệu mới,

chưa được nhìn thấy

Có thể dẫn đến sự khác biệt lớn trong hiệu suất

mô hình

Phân chia ngẫu nhiên dữ liệu nhiều lần →mỗi lần chúng tôi có

thể nhận được các kết quả khác nhau do tính chất ngẫu nhiên

của việc phân chia.

Tài liệu liên quan

Bài giảng Scratch 3.0 cơ bản từ Lại Đại Vương

Bài giảng Scratch cơ bản (Phiên bản 3.0) - Lại Đại Vương

Bài giảng Lập trình trực quan C# chuẩn nhất

Bài giảng Lập trình trực quan C#

Bài giảng Lập trình Python cho máy học: Bài 11 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 11 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 9 của TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 9 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 8 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 8 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 7 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 7 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 6 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 6 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 5 của TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 5 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 4 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 4 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 3 - TS. Nguyễn Vinh Tiệp

Bài giảng Lập trình Python cho máy học: Bài 3 - TS. Nguyễn Vinh Tiệp

Tài liêu mới

Đề thi kết thúc học phần Lập trình web 1 [năm] [khóa]

Đề thi kết thúc học phần Lập trình web 1

Tài liệu thực hành Lập trình Window - ĐH Kỹ thuật Công nghiệp Thái Nguyên

Tài liệu thực hành Lập trình trong môi trường Window - Trường ĐH Kỹ thuật Công nghiệp Thái Nguyên

Tài liệu thực hành Lập trình Java chuẩn nhất - ĐH Kỹ thuật Công nghiệp Thái Nguyên

Tài liệu thực hành Lập trình Java - Trường ĐH Kỹ thuật Công nghiệp Thái Nguyên

Bài giảng Hệ thống nhúng Nguyễn Văn Huy

Bài giảng Hệ thống nhúng - Nguyễn Văn Huy

Tập bài giảng Lập trình trên điện thoại di động của Đoàn Ngọc Phương

Tập bài giảng Lập trình trên điện thoại di động - Đoàn Ngọc Phương

Bài giảng Lập trình di động Chương 14: ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 14 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 13 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 13 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 12: ThS. Nguyễn Hữu Trung (mới nhất)

Bài giảng Lập trình di động: Chương 12 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 11: ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 11 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 10: ThS. Nguyễn Hữu Trung (Mới nhất)

Bài giảng Lập trình di động: Chương 10 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 9: ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 9 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 8: ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 8 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 7: ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 7 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 6: ThS. Nguyễn Hữu Trung (Mới nhất)

Bài giảng Lập trình di động: Chương 6 - ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động Chương 5: ThS. Nguyễn Hữu Trung

Bài giảng Lập trình di động: Chương 5 - ThS. Nguyễn Hữu Trung

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu trực tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 670/GP-BTTTT cấp ngày 30/11/2015