
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 3 - TS. Nguyễn Vinh Tiệp
lượt xem 0
download

Bài giảng Các kỹ thuật học sâu và ứng dụng - Bài 3: Mạng Convolutional Neural Network tập trung vào một trong những kiến trúc mạng nơ-ron mạnh mẽ nhất, đặc biệt hiệu quả trong xử lý ảnh. Chuyên đề này giới thiệu về CNN, cách thức hoạt động và hướng dẫn cài đặt CNN sử dụng thư viện Tensorflow. Đây là kiến thức cốt lõi để bạn xây dựng các ứng dụng thị giác máy tính. Mời các bạn cùng tham khảo bài giảng để biết thêm chi tiết!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 3 - TS. Nguyễn Vinh Tiệp
- ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN CS431 – CÁC KỸ THUẬT HỌC SÂU VÀ ỨNG DỤNG Bài 03 Mạng Convolutional Neural Network TS. Nguyễn Vinh Tiệp Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 26/09/2023 1
- NỘI DUNG 1. Giới thiệu 2. Convolutional neural networks (CNN) 3. Cài đặt CNN với Tensorflow 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2
- Giới thiệu - Các loại ảnh phổ biến 0 120 3 0 6 100 0 43 2 128 Ảnh xám 2 1 255 0 1 height 34 0 4 5 7 1 1 56 0 1 0 120 3 0 6 0 120 3 0 6 100 0 43 2 128 Ảnh RGB 2 100 1 00 255 120 43 0 32 1 0128 6 2 100 1 0255 43 0 21 128 34 0 4 5 7 34 20 14 255 5 07 1 1 1 56 0 1 1 34 1 056 40 51 7 1 1 56 0 1 depth 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 3
- Giới thiệu - Bài toán phân loại ảnh Xe cộ Neural networks Nhà cửa Con người 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 4
- Giới thiệu - Mạng neuron fully connected 200 Mỗi node ẩn kết nối với tất cả pixel Số lượng tham số của 40K tầng này : 200*200*40K = 1.6B Quá nhiều tham số!!! 200 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 5
- Giới thiệu - Mạng neuron locally connected Mỗi hidden node chỉ kết nối 200 với một vùng pixel cố định có kích thước 10x10 Số lượng tham số của tầng : 40K*10*10 = 4M 200 40K Số lượng tham số giảm đáng kể so với fully-connected! 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 6
- Giới thiệu - Mạng neuron locally connected Hạn chế: Chỉ phù hợp với ảnh có bố cục rõ ràng, chẳng hạn như ảnh khuôn mặt người Làm thế nào để áp dụng cho những ảnh thông thường? → Mỗi hidden node cần kết nối nhiều vùng pixel trên một bức ảnh → Chia sẻ tham số 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 7
- Mạng neuron weight-sharing locally connected Tham số được chia sẻ cho các vùng ảnh khác nhau Phép convolution 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 8
- Phép Convolution • Phép biến đổi Convolution: • Là một phép biến đổi tuyến tính • Rút trích đặc trưng hình ảnh (feature) 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 9
- Nội dung • Giới thiệu • Convolutional neural networks (CNN) • Cài đặt CNN với Tensorflow 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 10
- CNN - Kiến trúc phổ dụng 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 11
- CNN - Kiến trúc phổ dụng • Tầng convolution Lặp k lần • Tầng activation (ReLU) Lặp n lần • Tầng pooling (optional) VD: k = 2, n = 3 • Tầng fully connected 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 12
- CNN - Kiến trúc phổ dụng • Tầng convolution Lặp k lần • Tầng activation (ReLU) Lặp n lần • Tầng pooling (optional) VD: k = 2, n = 3 • Tầng fully connected 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 13
- Tầng Convolution - 2D convolution x: Ảnh x*w: Feature map w: Filter 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 14
- Tầng convolution - 2D Convolution cho ảnh RGB x: Ảnh x*w: Feature w: Filter 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 15
- Tầng convolution - Kết quả 28 24 5 5 24 28 3 3 x: Ảnh w: Filter x*w: Feature 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 16
- Tầng convolution - Kết quả 5 24 5 28 3 24 28 3 Chồng các feature ta được khối 3D là output của tầng convolution, còn gọi là 4 filter feature map. Input: W × H × D K filter F × F × D Output: W′ × H′ × K 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 17
- Tầng convolution - Ví dụ Receptive field 3x3 Filter 3x3 Feature map 1 Ảnh 5x5 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 18
- Tầng Convolution - 2D convolution • Trượt filter theo hai chiều rộng và cao của tấm hình Ảnh 5x5 Filter 3x3 Feature map 3x3 2 0 3 0 1 0 1 0 1 8 2 * = 1 9 7 1 0 4 2 1 0 1 0 3 1 1 0 1 0 1 0 2 7 5 1 0 4 5 0 0 1 2 0 1 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 19
- Tầng Convolution - Stride • Stride (S) là độ dài bước trượt của filter Feature map 3x3 Ảnh 5x5 Filter 3x3 1 8 2 2 0 3 0 1 0 1 0 = 1 9 7 S=1 1 0 4 2 1 * 0 1 0 2 7 5 3 1 1 0 1 0 1 0 Feature map 2x2 1 0 4 5 0 1 2 = S=2 0 1 2 0 1 2 5 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 20

CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Nhập môn tin học: Phần 2 - Pascal căn bản
70 p |
259 |
20
-
Bài giảng Nhập môn tin học - Chương 5: Giới thiệu mạng lưới máy tính
62 p |
144 |
12
-
Bài giảng Ứng dụng tin học trong thiết kế - Chương 4: Drawing
16 p |
64 |
8
-
Bài giảng Các hệ quản trị cơ sở dữ liệu: Các kỹ thuật phục hồi cơ sở dữ liệu - ThS. Hoàng Mạnh Hà
74 p |
93 |
6
-
Bài giảng Tin quản lý Visual Foxpro - Bài 2: Các kỹ thuật cơ bản làm việc với bảng dữ liệu
29 p |
151 |
5
-
Bài giảng Cấu trúc dữ liệu và giải thuật: Các kỹ thuật thiết kế thuật toán - Phan Mạnh Hiển (2020)
25 p |
52 |
5
-
Bài giảng Nhập môn lập trình - Bài 16: Các kỹ thuật thao tác trên bit
29 p |
60 |
5
-
Bài giảng Trí tuệ nhân tạo: Chương 8 - Nguyễn Văn Hòa
41 p |
76 |
4
-
Đề cương bài giảng môn Kỹ thuật lập trình
82 p |
39 |
4
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 4 - TS. Nguyễn Vinh Tiệp
39 p |
0 |
0
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 7 - TS. Nguyễn Vinh Tiệp
36 p |
5 |
0
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 1 - TS. Nguyễn Vinh Tiệp
59 p |
2 |
0
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 5 - TS. Nguyễn Vinh Tiệp
33 p |
2 |
0
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 8 - TS. Nguyễn Vinh Tiệp
11 p |
3 |
0
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 2 - TS. Nguyễn Vinh Tiệp
34 p |
2 |
0
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 6 - TS. Nguyễn Vinh Tiệp
37 p |
0 |
0
-
Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 9 - TS. Nguyễn Vinh Tiệp
12 p |
1 |
0


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
