intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 3 - TS. Nguyễn Vinh Tiệp

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:37

6
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Các kỹ thuật học sâu và ứng dụng - Bài 3: Mạng Convolutional Neural Network tập trung vào một trong những kiến trúc mạng nơ-ron mạnh mẽ nhất, đặc biệt hiệu quả trong xử lý ảnh. Chuyên đề này giới thiệu về CNN, cách thức hoạt động và hướng dẫn cài đặt CNN sử dụng thư viện Tensorflow. Đây là kiến thức cốt lõi để bạn xây dựng các ứng dụng thị giác máy tính. Mời các bạn cùng tham khảo bài giảng để biết thêm chi tiết!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Các kỹ thuật học sâu và ứng dụng: Bài 3 - TS. Nguyễn Vinh Tiệp

  1. ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN CS431 – CÁC KỸ THUẬT HỌC SÂU VÀ ỨNG DỤNG Bài 03 Mạng Convolutional Neural Network TS. Nguyễn Vinh Tiệp Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 26/09/2023 1
  2. NỘI DUNG 1. Giới thiệu 2. Convolutional neural networks (CNN) 3. Cài đặt CNN với Tensorflow 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 2
  3. Giới thiệu - Các loại ảnh phổ biến 0 120 3 0 6 100 0 43 2 128 Ảnh xám 2 1 255 0 1 height 34 0 4 5 7 1 1 56 0 1 0 120 3 0 6 0 120 3 0 6 100 0 43 2 128 Ảnh RGB 2 100 1 00 255 120 43 0 32 1 0128 6 2 100 1 0255 43 0 21 128 34 0 4 5 7 34 20 14 255 5 07 1 1 1 56 0 1 1 34 1 056 40 51 7 1 1 56 0 1 depth 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 3
  4. Giới thiệu - Bài toán phân loại ảnh Xe cộ Neural networks Nhà cửa Con người 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 4
  5. Giới thiệu - Mạng neuron fully connected 200 Mỗi node ẩn kết nối với tất cả pixel Số lượng tham số của 40K tầng này : 200*200*40K = 1.6B Quá nhiều tham số!!! 200 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 5
  6. Giới thiệu - Mạng neuron locally connected Mỗi hidden node chỉ kết nối 200 với một vùng pixel cố định có kích thước 10x10 Số lượng tham số của tầng : 40K*10*10 = 4M 200 40K Số lượng tham số giảm đáng kể so với fully-connected! 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 6
  7. Giới thiệu - Mạng neuron locally connected Hạn chế: Chỉ phù hợp với ảnh có bố cục rõ ràng, chẳng hạn như ảnh khuôn mặt người Làm thế nào để áp dụng cho những ảnh thông thường? → Mỗi hidden node cần kết nối nhiều vùng pixel trên một bức ảnh → Chia sẻ tham số 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 7
  8. Mạng neuron weight-sharing locally connected Tham số được chia sẻ cho các vùng ảnh khác nhau Phép convolution 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 8
  9. Phép Convolution • Phép biến đổi Convolution: • Là một phép biến đổi tuyến tính • Rút trích đặc trưng hình ảnh (feature) 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 9
  10. Nội dung • Giới thiệu • Convolutional neural networks (CNN) • Cài đặt CNN với Tensorflow 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 10
  11. CNN - Kiến trúc phổ dụng 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 11
  12. CNN - Kiến trúc phổ dụng • Tầng convolution Lặp k lần • Tầng activation (ReLU) Lặp n lần • Tầng pooling (optional) VD: k = 2, n = 3 • Tầng fully connected 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 12
  13. CNN - Kiến trúc phổ dụng • Tầng convolution Lặp k lần • Tầng activation (ReLU) Lặp n lần • Tầng pooling (optional) VD: k = 2, n = 3 • Tầng fully connected 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 13
  14. Tầng Convolution - 2D convolution x: Ảnh x*w: Feature map w: Filter 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 14
  15. Tầng convolution - 2D Convolution cho ảnh RGB x: Ảnh x*w: Feature w: Filter 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 15
  16. Tầng convolution - Kết quả 28 24 5 5 24 28 3 3 x: Ảnh w: Filter x*w: Feature 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 16
  17. Tầng convolution - Kết quả 5 24 5 28 3 24 28 3 Chồng các feature ta được khối 3D là output của tầng convolution, còn gọi là 4 filter feature map. Input: W × H × D K filter F × F × D Output: W′ × H′ × K 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 17
  18. Tầng convolution - Ví dụ Receptive field 3x3 Filter 3x3 Feature map 1 Ảnh 5x5 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 18
  19. Tầng Convolution - 2D convolution • Trượt filter theo hai chiều rộng và cao của tấm hình Ảnh 5x5 Filter 3x3 Feature map 3x3 2 0 3 0 1 0 1 0 1 8 2 * = 1 9 7 1 0 4 2 1 0 1 0 3 1 1 0 1 0 1 0 2 7 5 1 0 4 5 0 0 1 2 0 1 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 19
  20. Tầng Convolution - Stride • Stride (S) là độ dài bước trượt của filter Feature map 3x3 Ảnh 5x5 Filter 3x3 1 8 2 2 0 3 0 1 0 1 0 = 1 9 7 S=1 1 0 4 2 1 * 0 1 0 2 7 5 3 1 1 0 1 0 1 0 Feature map 2x2 1 0 4 5 0 1 2 = S=2 0 1 2 0 1 2 5 26/09/2023 Thực hiện bởi Trường Đại học Công nghệ Thông tin, ĐHQG-HCM 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
7=>1