Trang chủ » Khoa Học Tự Nhiên » Toán học - Thống kê

61 trang

489 lượt xem

2

0

Bài giảng Học máy thống kê: Gán nhãn dữ liệu

Bài giảng Học máy thống kê: Gán nhãn dữ liệu là một chuyên đề thiết yếu, làm rõ vai trò quan trọng của dữ liệu được gán nhãn trong học máy. Chuyên đề này giải thích lý do cần gán nhãn, quy trình tổng quát để thực hiện, vai trò của người gán nhãn và cách đánh giá chất lượng quy trình gán nhãn. Hiểu rõ quy trình này là chìa khóa cho chất lượng dữ liệu và hiệu suất mô hình. Mời các bạn cùng tham khảo bài giảng để biết thêm chi tiết!

Chủ đề:

hoatrongguong03

Thống kê trong học máy

Bài giảng Thống kê trong học máy

/

61

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH

[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 1

Chương 5:

GÁN NHÃN DỮ LIỆU

Khoa Khoa học và Kỹ thuật thông tin

Bộ môn Khoa học dữ liệu

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH

[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 2

Nội dung chính

1. Tại sao cần gán nhãn dữ liệu.

2. Quy trình tổng quát để gán nhãn dữ liệu.

3. Người gán nhãn.

4. Đánh giá quy trình gán nhãn.

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH

[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 3

TẠI SAO PHẢI GÁN NHÃN DỮ LIỆU

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH

[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 4

Tại sao cần gán nhãn dữ liệu

─Trong lĩnh vực máy học hiện tại, đa phần các bài toán đều xoay

quanh lĩnh vực học có giám sát.

+Dữ liệu huấn luyện phải là dữ liệu có giám sát (có nhãn).

─Trong thực tế, dữ liệu chưa giám sát tồn tại nhiều hơn dữ liệu có

giám sát.

─ Mục tiêu: tạo ra các bộ dữ liệu có giám sát, phục vụ cho công việc

huấn luyện mô hình máy học.

➔Gán nhãn (annotation) giúp tạo ra các bộ dữ liệu huấn luyện cho

các bài toán máy học.

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH

[T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 5

Các bài toán cần gán nhãn dữ liệu

─Bài toán nhận diện vật thể (object detection):

+Input: một ảnh.

+Output: vector xác định vị trí và kích thước một vật thể.

─Bài toán phân tích cảm xúc về sản phẩm:

+Input: câu bình luận về sản phẩm.

+Output: loại cảm xúc về sản phẩm (tích cực, tiêu cực, trung tính).

─Bài toán nhận diện ảnh X-quang phổi bị nhiễm COVID-19:

+Input: Ảnh X-quang phổi.

+Output: Tình trạng phổi: Bình thường, bị nhiễm bệnh.

Tài liệu liên quan

Mô hình máy học kết hợp (Ensemble Learning): Bài giảng Học máy thống kê

Bài giảng Học máy thống kê: Mô hình máy học kết hợp (Ensemble Learning)

Cây quyết định (Decision tree): Bài giảng Học máy thống kê chi tiết

Bài giảng Học máy thống kê: Cây quyết định (Decision tree)

Bài giảng Support Vector Machine (SVM): Học máy thống kê, máy véc tơ hỗ trợ

Bài giảng Học máy thống kê: Support Vector Machine (Máy véc tơ hỗ trợ)

Hồi quy Logistic (Logistic Regression): Bài giảng Học máy thống kê

Bài giảng Học máy thống kê: Hồi quy logistic (Logistic Regression)

Gradient Descent: Bài giảng Học máy thống kê Gradient giảm

Bài giảng Học máy thống kê: Gradient giảm (Gradient Descent)

Hồi quy tuyến tính (Linear Regression): Bài giảng Học máy thống kê Supervised learning

Bài giảng Học máy thống kê: Hồi quy tuyến tính (Linear Regression- Supervised learning)

Phân lớp trong Học máy thống kê: Bài giảng và cách đánh giá bộ phân lớp

Bài giảng Học máy thống kê: Phân lớp và cách đánh giá bộ phân lớp

Bài giảng Học máy thống kê: Dự án máy học

Bài giảng Học máy thống kê: Một dự án máy học

Bài giảng Học máy thống kê: Tổng quan về máy học [Mới nhất]

Bài giảng Học máy thống kê: Tổng quan về máy học

Bài giảng Dữ liệu bảng (Panel Data) Đinh Công Khải

Bài giảng Dữ liệu bảng (Panel Data) - Đinh Công Khải

Tài liêu mới

Giáo Trình Toán Rời Rạc: Tổ Hợp & Lý Thuyết Đồ Thị (Chi Tiết, Dễ Hiểu)

Giáo trình Toán rời rạc (Trình độ: Cao đẳng) - Cao đẳng Công thương Việt Nam

Bài tập Giải tích 1 Lê Văn Ngọc: Tuyển tập bài giải hay và chi tiết

Bài tập Giải tích 1 - Lê Văn Ngọc

Bài giảng Giải tích 1: TS. Lưu Thị Hiệp (Chi tiết, đầy đủ)

Bài giảng Giải tích 1 - TS. Lưu Thị Hiệp

Bài giảng Toán rời rạc chương 4: GV Nguyễn Thùy Dung (tổng hợp)

Bài giảng Toán rời rạc: Chương 4 - GV: Nguyễn Thùy Dung

Bài giảng Toán rời rạc chương 3: GV Nguyễn Thùy Dung (tóm tắt, chi tiết)

Bài giảng Toán rời rạc: Chương 3 - GV: Nguyễn Thùy Dung

Bài giảng Toán rời rạc Chương 2: GV Nguyễn Thùy Dung

Bài giảng Toán rời rạc: Chương 2 - GV: Nguyễn Thùy Dung

Bài giảng Toán rời rạc Chương 1: GV Nguyễn Thùy Dung (Tổng hợp)

Bài giảng Toán rời rạc: Chương 1 - GV: Nguyễn Thùy Dung

Bài giảng Giải tích 1 Chương 5: Tài liệu thầy Lê Thái Thanh

Bài giảng Giải tích 1: Chương 5 - Lê Thái Thanh

Bài giảng Giải tích 1 Chương 4: Tài liệu của Lê Thái Thanh

Bài giảng Giải tích 1: Chương 4 - Lê Thái Thanh

Bài giảng Giải tích 1 Chương 3: Tài liệu của Lê Thái Thanh

Bài giảng Giải tích 1: Chương 3 - Lê Thái Thanh

Bài giảng Giải tích 1 Chương 2: Tài liệu thầy Lê Thái Thanh

Bài giảng Giải tích 1: Chương 2 - Lê Thái Thanh

Bài giảng Giải tích 1 Chương 1: Lê Thái Thanh (Chi tiết)

Bài giảng Giải tích 1: Chương 1 - Lê Thái Thanh

Giáo trình Giải tích II: Hàm số nhiều biến số - Phần 2

Giáo trình Giải tích II - Hàm số nhiều biến số: Phần 2

Giáo trình Giải tích II: Hàm số nhiều biến số (Phần 1)

Giáo trình Giải tích II - Hàm số nhiều biến số: Phần 1

Bài giảng Đại số tuyến tính: Chương 3 - PGS. TS Trần Tuấn Nam

Bài giảng Đại số tuyến tính: Chương 3 - PGS. TS Trần Tuấn Nam

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà

Doanh nghiệp quản lý: Công ty TNHH Tài Liệu Trực Tuyến Vi Na - GCN ĐKDN: 0307893603

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 38/GP-BVHTTDL cấp ngày 09/3/2026