Giới thiệu tài liệu
Bài giảng này giới thiệu về học sâu, một phương pháp học máy sử dụng mạng nơ-ron nhân tạo để tự động trích xuất đặc trưng từ dữ liệu. Bài giảng cũng trình bày lý do tại sao học sâu trở nên quan trọng và sự bùng nổ của nó trong thời gian gần đây, cùng với các khái niệm cơ bản về học máy có giám sát, hiện tượng overfit và underfit, và các phương pháp phân lớp tuyến tính và hồi quy tuyến tính. Cuối cùng, bài giảng giới thiệu các công cụ và môi trường phổ biến cho học sâu như Google Colab, Jupyter Notebook, Tensorflow/Keras/PyTorch.
Đối tượng sử dụng
Bài giảng này dành cho sinh viên và những người mới bắt đầu tìm hiểu về học sâu, cung cấp kiến thức nền tảng về các khái niệm và phương pháp cơ bản trong lĩnh vực này.
Nội dung tóm tắt
Bài giảng cung cấp một cái nhìn tổng quan về học sâu và các khái niệm liên quan, bao gồm:
1. **Giới thiệu về học sâu:** Định nghĩa học sâu là phương pháp học máy sử dụng mạng nơ-ron để tự động trích xuất đặc trưng. Ưu điểm của học sâu so với phương pháp học máy truyền thống là khả năng tự động trích xuất đặc trưng, giảm sự phụ thuộc vào kinh nghiệm và kiến thức chuyên môn.
2. **Lý do học sâu trở nên quan trọng:** Học sâu giải quyết vấn đề trích xuất đặc trưng thủ công trong các phương pháp học máy truyền thống. Việc trích xuất đặc trưng thủ công đòi hỏi nhiều kinh nghiệm và phụ thuộc vào từng bài toán cụ thể, trong khi học sâu có thể tự động học các đặc trưng phù hợp từ dữ liệu.
3. **Các khái niệm cơ bản về học máy có giám sát:** Bài giảng giới thiệu về tập huấn luyện (training set) và tập kiểm tra (testing set), là hai thành phần quan trọng trong học máy có giám sát. Tập huấn luyện được sử dụng để huấn luyện mô hình, trong khi tập kiểm tra được sử dụng để đánh giá hiệu năng của mô hình.
4. **Hiện tượng Overfitting và Underfitting:** Overfitting xảy ra khi mô hình học quá chi tiết dữ liệu huấn luyện, dẫn đến khả năng khái quát hóa kém trên dữ liệu mới. Underfitting xảy ra khi mô hình quá đơn giản để biểu diễn các tính chất của dữ liệu. Bài giảng cũng giải thích về bias và variance liên quan đến hai hiện tượng này.
5. **Các phương pháp phân lớp và hồi quy tuyến tính:** Bài giảng trình bày về phân lớp tuyến tính và hồi quy tuyến tính, hai phương pháp cơ bản trong học máy. Các khái niệm như hàm mục tiêu, gradient descent và stochastic gradient descent (SGD) cũng được giới thiệu để tối ưu hóa mô hình.