Giới thiệu tài liệu
Tài liệu: "Kỹ thuật phân loại dữ liệu" của Trịnh Tấn Đạt, Khoa CNTT - Đại Học Sài Gòn giới thiệu về việc sử dụng kỹ thuật phân loại dữ liệu trong nhiều lĩnh vực, bao gồm marketing, chẩn đoán bệnh, phân tích đa phương tiện,... Theo sách, kỹ thuật phân loại dữ liệu bao gồm hai giai đoạn: giai đoạn huấn luyện và giai đoạn thử nghiệm. Kỹ thuật phân loại dữ liệu được chia thành sáu nhóm chính: phương pháp chọn lọc đặc trưng, phương pháp xác suất, cây quyết định, phương pháp quy tắc, học máy dựa trên instance, và máy học hỗ trợ vector (SVM).
Đối tượng sử dụng
Sách này sẽ hữu ích cho những người học máy và nghiên cứu khoa học.
Nội dung tóm tắt
Tài liệu: "Kỹ thuật phân loại dữ liệu" của Trịnh Tấn Đạt chủ yếu giới thiệu về việc sử dụng kỹ thuật phân loại dữ liệu trong nhiều lĩnh vực, bao gồm marketing, chẩn đoán bệnh, phân tích đa phương tiện,... Theo sách, kỹ thuật phân loại dữ liệu được chia thành hai giai đoạn: giai đoạn huấn luyện và giai đoạn thử nghiệm. Kỹ thuật phân loại dữ liệu bao gồm sáu nhóm chính: phương pháp chọn lọc đặc trưng (bao gồm filter models và wrapper models), phương pháp xác suất (sử dụng thống kê để tìm ra lớp tốt nhất cho một ví dụ mới), cây quyết định (tạo ra một phân hoạch hiếarchic của dữ liệu, liên quan đến các lớp khác nhau tại cấp lá), phương pháp quy tắc (tìm ra các quy tắc từ dữ liệu huấn luyện và sử dụng chúng để phân loại dữ liệu mới), học máy dựa trên instance (không cần giai đoạn huấn luyện, chỉ cần trực tiếp liên hệ với các ví dụ huấn luyện để tạo ra một mô hình phân loại) và máy học hỗ trợ vector (SVM) (tìm ra một giải pháp tối ưu bằng cách tối đa hóa khoảng cách giữa hai lớp). Phần cuối cùng của sách tập trung vào các biến thể khác nhau trong kỹ thuật phân loại dữ liệu, bao gồm học máy trên các lớp hiếm, học máy ensembles và học máy chuyển tiếp.