intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Hệ thống thông tin: Ứng dụng phương pháp học sâu để nhận diện khuôn mặt qua camera giám sát

Chia sẻ: Matroinho | Ngày: | Loại File: PDF | Số trang:86

31
lượt xem
9
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn "Ứng dụng phương pháp học sâu để nhận diện khuôn mặt qua camera giám sát" trình bày khảo sát một số thuật toán nhận dạng khuôn mặt và đề xuất một mô hình hiệu quả để giải quyết bài toán nhận dạng khuôn mặt và có thể áp dụng để nhận dạng trực tiếp từ camera.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Hệ thống thông tin: Ứng dụng phương pháp học sâu để nhận diện khuôn mặt qua camera giám sát

  1. UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN THANH TÙNG ỨNG DỤNG PHƯƠNG PHÁP HỌC SÂU ĐỂ NHẬN DIỆN KHUÔN MẶT QUA CAMERA GIÁM SÁT LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8 48 01 04 BÌNH DƯƠNG – 2019
  2. UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN THANH TÙNG ỨNG DỤNG PHƯƠNG PHÁP HỌC SÂU ĐỂ NHẬN DIỆN KHUÔN MẶT QUA CAMERA GIÁM SÁT LUẬN VĂN THẠC SỸ CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8 48 01 04 NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. BÙI THANH HÙNG BÌNH DƯƠNG – 2019 ii
  3. LỜI CAM ĐOAN Tên tôi là: Nguyễn Thanh Tùng Sinh ngày: 15/01/1983 Học viên lớp cao học CH17HT - Trường Đại học Thủ Dầu Một. Xin cam đoan: Đề tài “Ứng dụng phương pháp học sâu để nhận diện khuôn mặt qua camera giám sát.” do Thầy TS. Bùi Thanh Hùng hướng dẫn là công trình nghiên cứu của riêng tôi. Tất cả tài liệu tham khảo đều có nguồn gốc, trích dẫn rõ ràng. Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu của thầy giáo hướng dẫn. Nếu sai tôi hoàn toàn chịu trách nhiệm trước hội đồng khoa học. Bình Dương, tháng 10 năm 2019 Tác giả luận văn Nguyễn Thanh Tùng iii
  4. LỜI CẢM ƠN Sau một thời gian nghiên cứu và làm việc nghiêm túc, được sự động viên, giúp đỡ và hướng dẫn tận tình của Thầy hướng dẫn TS. Bùi Thanh Hùng, luận văn Cao học “Ứng dụng phương pháp học sâu để nhận diện khuôn mặt qua camera giám sát” đã hoàn thành. Tôi xin bày tỏ lòng biết ơn sâu sắc đến: Thầy hướng dẫn TS. Bùi Thanh Hùng đã tận tình chỉ dẫn, giúp đỡ tôi hoàn thành luận văn này. Đồng thời tôi gửi lời cảm ơn đến các thầy, cô đã giảng dạy truyền đạt kiến thức quý báo cho tôi trong suốt thời gian học tập và nghiên cứu. Tôi chân thành cảm ơn bạn bè, đồng nghiệp và gia đình đã động viên, khích lệ, tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập, thực hiện và hoàn thành luận văn này. iv
  5. TÓM TẮT LUẬN VĂN Đã có rất nhiều công trình công bố, đưa ra các hướng tiếp cận khác nhau cho việc giải quyết bài toán nhận dạng khuôn mặt như nhận dạng dựa trên đặc trưng của các phần tử trên khuôn mặt bao gồm biển đổi sóng Wavelet (Gabor Wavelet), phương pháp đồ thị đàn hồi (Elastic Bunch Graph Matching - EBGM), mạng Nơron (Neural Network - NN), học máy vector hỗ trợ (Support Vector Machine –SVM)… nhận dạng dựa trên xét tổng thể toàn khuôn mặt bao gồm phương pháp phân tích thành phần chính (Principal Component Analysis– PCA) phương pháp phân tích sự khác biệt tuyến tính (Linear Discriminant Analysis – LDA). Trong đó, nhận dạng khuôn mặt dùng mạng Nơron mang lại hiệu quả nhận dạng cao bởi nó hoạt động ổn định và có tính thích nghi cao khi dữ liệu đầu vào thay đổi nhiều. Luận văn trình bày khảo sát một số thuật toán nhận dạng khuôn mặt và đề xuất một mô hình hiệu quả để giải quyết bài toán nhận dạng khuôn mặt và có thể áp dụng để nhận dạng trực tiếp từ camera. Trong đó, luận văn tập trung chính vào hai công đoạn: phát hiện và nhận dạng khuôn mặt. Trong việc phát hiện và canh chỉnh khuôn mặt được đề xuất sử dụng phương pháp mô tả đặc trưng (Histogram of Oriented Gradients – HOG) và việc phân lớp, nhận dạng khuôn mặt sử dụng mô hình CNN cụ thể là thuật toán FaceNet. Hiệu quả của mô hình nhận dạng được kiểm nghiệm trên tập cơ sở dữ liệu chuẩn ORL (Olivetti Research Laboratory) của AT&T, và bộ dữ liệu của cá nhân thu thập hình ảnh của 15 người. Các kết quả thực nghiệm cho thấy mô hình đề xuất đạt độ chính xác cao và ổn định trên các tập dữ liệu. v
  6. MỤC LỤC LỜI CAM ĐOAN ...................................................................................................... iii LỜI CẢM ƠN ............................................................................................................ iv TÓM TẮT LUẬN VĂN ............................................................................................. v MỤC LỤC .................................................................................................................. vi DANH MỤC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT ............................................ ix DANH MỤC CÁC BẢNG.......................................................................................... x DANH MỤC HÌNH VẼ, ĐỒ THỊ ............................................................................. xi CHƯƠNG 1: TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU .................................. 1 1.1. Lý do chọn đề tài .............................................................................................. 1 1.2. Mục tiêu nghiên cứu ......................................................................................... 2 1.3. Đối tượng, phạm vi nghiên cứu ........................................................................ 2 1.4. Phương pháp nghiên cứu .................................................................................. 2 1.5. Ý nghĩa khoa học và ý nghĩa thực tiễn ............................................................. 3 1.6. Bố cục luận văn ................................................................................................ 3 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN .......... 5 2.1. Mạng Nơron tích chập ...................................................................................... 5 2.1.1. Mạng Nơron ............................................................................................... 5 2.1.2. Mạng nơron tích chập ............................................................................... 15 2.2. Trích chọn đặc trưng ....................................................................................... 21 2.2.1. Tổng quan trích chọn đặc trưng ............................................................... 21 vi
  7. 2.2.2. Phương pháp mô tả đặc trưng (Histogram of Oriented Gradients – HOG) ............................................................................................................................ 22 2.2.3. Phương pháp phân tích thành phần chính (Principal Component Analysis - PCA) ................................................................................................................. 23 2.2.4. Phương pháp mẫu nhị phân địa phương (Local Binary Pattern - LBP ) .. 26 2.3. Nhận dạng khuôn mặt ..................................................................................... 32 2.3.1. Tổng quan ................................................................................................. 32 2.3.2. Các hướng tiếp cận ................................................................................... 35 2.3.3. Hướng đề xuất nghiên cứu ....................................................................... 36 Tiểu kết chương......................................................................................................... 37 CHƯƠNG 3: MÔ HÌNH ĐỀ XUẤT ........................................................................ 38 3.1. Tổng quan mô hình đề xuất ............................................................................ 38 3.2. Các đặc trưng của mô hình đề xuất ................................................................ 40 3.2.1. Phát hiện khuôn mặt ................................................................................. 40 3.2.2. Nhận dạng khuôn mặt............................................................................... 47 3.2.3. Mô hình kết hợp HOG-CNN .................................................................... 56 3.2.4. Phương pháp đánh giá mô hình ................................................................ 57 CHƯƠNG 4: THỰC NGHIỆM VÀ KẾT LUẬN .................................................... 58 4.1 Dữ liệu ............................................................................................................. 58 4.2 Huấn luyện mô hình......................................................................................... 62 4.3 Đánh giá ........................................................................................................... 64 4.4 Xây dựng ứng dụng ......................................................................................... 65 vii
  8. 4.5 Kết luận và hướng phát triển ........................................................................... 69 CÔNG TRÌNH CÔNG BỐ ....................................................................................... 70 TÀI LIỆU THAM KHẢO ......................................................................................... 71 viii
  9. DANH MỤC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT KÝ HIỆU TÊN TIẾNG ANH ANN Artificial Neural Network CNN Convolution Neural Network DNN Deep Neural Networks FC Fully Connected FCM Fuzzy Cognitive Map HAC Hierarchical Agglomerative Clustering HOG Histogram of Oriented Gradients LBP Local Binary Pattern LDA Linear Discriminant Analysis LFW Labeled Faces in the Wild LMNN Large margin nearest neighbor classification MDP Markov Decision Process PCA Principal Component Analysis RELU Rectified Linear Unit RGB Red Green Blue SGD Stochastic Gradient Descent SIFT Scale Invariant Feature Transform SOM Self – Organizing Map SURF Speeded up robust features SVM Support Vector Machines ix
  10. DANH MỤC CÁC BẢNG Bảng 4.1 Đánh giá độ chính xác trên dữ liệu cá nhân ............................................. 63 Bảng 4.2 Đánh giá độ chính xác trên dữ liệu ORL .................................................. 64 x
  11. DANH MỤC HÌNH VẼ, ĐỒ THỊ Hình 2.1: Mạng nơron sinh học .................................................................................. 5 Hình 2.2: Cấu trúc của mạng nơron nhân tạo ............................................................. 6 Hình 2.3: Quá trình xử lý của một nơron trong ANN ................................................. 6 Hình 2.4: Đồ thị các hàm kích hoạt ............................................................................ 8 Hình 2.5: AlphaGo của Google ................................................................................. 11 Hình 2.6: Mô phỏng cách tính lan truyền ngược ...................................................... 13 Hình 2.7: Mô hình các lớp cơ bản CNN ................................................................... 16 Hình 2.8: Ví dụ một mô hình CNN ........................................................................... 17 Hình 2.9: Minh họa tích chập trên ma trận ảnh ........................................................ 18 Hình 2.10: Phương thức Avarage Pooling và Max Pooling ..................................... 20 Hình 2.11: Ví dụ về cấu trúc CNN ............................................................................ 21 Hình 2.12: R-HOG và C-HOG.................................................................................. 23 Hình 2.13: Ảnh sau khi biến đổi theo PCA............................................................... 25 Hình 2.14: Ví dụ về phương pháp LBP .................................................................... 27 Hình 2.15: Ví dụ về ảnh khuôn mặt và các đặc trưng LBP ...................................... 27 Hình 2.16: Tập hợp các điểm xung quanh Ptt. .......................................................... 28 Hình 2.17: Các biến thể của LBP, LBP đồng dạng................................................... 29 Hình 2.18: Bảng thống kê các mẫu của LBP đồng dạng .......................................... 30 Hình 2.19: Ví dụ về quá trình tính toán đặc trưng .................................................... 31 Hình 2.20: Mô hình bài toán nhận dạng mặt người .................................................. 33 xi
  12. Hình 2.21: Cấu trúc tổng quát của hệ thống nhận dạng khuôn mặt .......................... 33 Hình 3.1: Mô hình đề xuất ........................................................................................ 39 Hình 3.2: Số ảnh nhậndạng được .............................................................................. 40 Hình 3.3: Biểu đồ tuyến tính HOG ........................................................................... 40 Hình 3.4: Biểu đồ tuyến tính LBP ............................................................................. 41 Hình 3.5: So sánh phát hiện khuôn mặt HOG và LBP ............................................. 42 Hình 3.6: Chia khối trích đặc trưng HOG ................................................................. 43 Hình 3.7: Ví dụ về trích chọn đặc trưng bởi HOG.................................................... 46 Hình 3.8: Ảnh input và kết quả phát hiện và canh chỉnh ảnh mặt với HOG ............ 47 Hình 3.9: Hình minh họa output khoảng cách khi sử dụng FaceNet giữa các cặp khuôn mặt. ................................................................................................................. 48 Hình 3.10: Tóm tắt quy trình nhận dạng khuôn mặt sử dụng FaceNet ..................... 49 Hình 3.11: Cấu trúc mô hình FaceNet ...................................................................... 50 Hình 3.12: Ví dụ về bộ ba sai số ............................................................................... 51 Hình 3.13: Bộ ba sai số tối thiểu hóa khoảng cách giữa ảnh vào (Anchor) và ảnh cùng loại với ảnh vào (Positive) và tối đa hóa khoảng cách giữa ảnh vào và ảnh khác loại với ảnh vào (Negative) ....................................................................................... 52 Hình 3.14: Ảnh vào sau khi huấn luyện, thu được vector 128 chiều ........................ 54 Hình 3.15: Cấu trúc mạng do Zeiler và Fergus đề xuất ............................................ 55 Hình 3.16: Module Inception dạng nguyên thủy và dạng giảm chiều. ..................... 55 Hình 3.17: FaceNet sử dụng mô hình Inception tương tự với. ................................. 56 Hình 3.18: Sơ đồ mô hình nhận dạng kết hợp HOG-FaceNet .................................. 57 xii
  13. Hình 4.1: Ví dụ các mẫu data đã cắt khuôn mặt ....................................................... 58 Hình 4.2: Phương pháp Xoay ngẫu nhiên tăng dữ liệu ảnh ...................................... 59 Hình 4.3: Phương pháp độ sáng ngẫu nhiên tăng dữ liệu ảnh .................................. 60 Hình 4.4: Phương pháp phóng to thu nhỏ ngẫu nhiên tăng dữ liệu ảnh ................... 60 Hình 4.5: Phương pháp dịch chuyển dọc tăng dữ liệu ảnh ....................................... 61 Hình 4.6: Phương dịch chuyển ngang tăng dữ liệu ảnh ............................................ 61 Hình 4.7: Tiền xử lý ảnh khuôn mặt ......................................................................... 62 Hình 4.8: Kết quả huấn luyện mô hình ..................................................................... 63 Hình 4.9: Các thông số huấn luyện mô hình. ............................................................ 64 Hình 4.10: Giao diện chính của chương trình ........................................................... 65 Hình 4.11: Cửa sổ thêm người mới ........................................................................... 66 Hình 4.12: Cửa sổ chụp ảnh người mới .................................................................... 66 Hình 4.13: Thực hiện huấn luyện lại mô hình. ......................................................... 67 Hình 4.14: Cửa sổ nhận dạng khuôn mặt .................................................................. 67 Hình 4.15: Mô tả dữ liệu và kết quả.......................................................................... 68 xiii
  14. CHƯƠNG 1 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU 1.1. Lý do chọn đề tài Với sự phát triển nhanh chóng của các loại máy móc hiện đại như máy ảnh số, máy quay phim kỹ thuật số, máy vi tính,… thì lượng thông tin con người thu được dưới dạng hình ảnh là khá lớn. Xử lý ảnh là một trong những lĩnh vực ngày càng được phổ biến trong đời sống xã hội. Không chỉ dừng lại ở việc xử lý những vết nhòe, tái chế và phục hồi các ảnh cũ, ngày nay các kỹ thuật, phương pháp xử lý ảnh đã mang lại những tiến bộ vượt bậc như nhận dạng vân tay, nhận dạng khuôn mặt, nhận dạng đối tượng khi nó kết hợp với lĩnh vực trí tuệ nhân tạo. Bên cạnh đó, vấn đề an ninh bảo mật đang được yêu cầu khắc khe tại mọi quốc gia trên thế giới. Các hệ thống xác định, nhận dạng con người được ra đời với độ tin cậy cao. Một trong những bài toán nhận dạng con người được quan tâm nhất hiện nay đó là nhận dạng qua khuôn mặt. Các phương pháp nhận dạng phổ biến hiện nay là nhận dạng dựa trên đặc trưng của các phần tử trên khuôn mặt và nhận dạng dựa trên xét tổng thể toàn khuôn mặt như phương pháp Phân tích thành phần chính (Principal Component Analysis – PCA) phương pháp Phân tích sự khác biệt tuyến tính (Linear Discriminant Analysis – LDA), phương pháp mẫu nhị phân địa phương (Local Binary Pattern - LBP), phương pháp mô tả đặc trưng (Histogram of Oriented Gradients – HOG) và hiện nay việc áp dụng các phương pháp học sâu của mạng nơron (Neural Network) cho ra kết quả nhận dạng rất tốt. Các nghiên cứu gần đây cho thấy việc kết hợp giữa phương pháp phân tích đặc trưng và mạng học sâu nơron mang lại hiệu quả nhận dạng cao bởi nó hoạt động ổn định và có tính thích nghi cao khi dữ liệu đầu vào thay đổi nhiều. Vì vậy tôi chọn đề tài: “Ứng dụng phương pháp học sâu để nhận diện 1
  15. khuôn mặt qua camera giám sát” để nghiên cứu cho luận văn tốt nghiệp cao học của mình. 1.2. Mục tiêu nghiên cứu Luận văn “Ứng dụng phương pháp học sâu để nhận diện khuôn mặt qua camera giám sát”. Hướng tới một chương trình có chức năng phát hiện ra khuôn mặt người và nhận dạng ra đó là ai thông qua các phương pháp phát hiện và nhận dạng. Thông qua nghiên cứu các phương pháp học sâu cho bài toán nhận dạng khuôn mặt và ngôn ngữ lập trình Python luận văn muốn xây dựng một chương trình có thể nhận dạng được khuôn mặt người thông qua camera theo thời gian thực. 1.3. Đối tượng, phạm vi nghiên cứu Với mục tiêu đã đề ra ở trên, luận văn thực hiện những vấn đề sau: - Đối tượng nghiên cứu là các phương pháp phát hiện khuôn mặt người và nhận dạng khuôn mặt qua đó lựa chọn một phương pháp phù hợp. Tìm hiểu và đề xuất một phương pháp cụ thể. - Nghiên cứu và sử dụng phương pháp học sâu trên nền tảng Python. - Phạm vi thực hiện: trên camera và video giám sát theo thời gian thực. 1.4. Phương pháp nghiên cứu - Phương pháp nghiên cứu lý thuyết: Tổng hợp, nghiên cứu các tài liệu về nhận dạng khuôn mặt; nghiên cứu các phương pháp, thuật toán nhận dạng khuôn mặt; nghiên cứu các phương pháp học sâu. Tìm hiểu các kiến thức liên quan như lý thuyết xử lý ảnh, học máy, kỹ thuật lập trình. - Phương pháp nghiên cứu thực nghiệm: Sau khi nghiên cứu lý thuyết, phát biểu bài toán, đề xuất mô hình; xây dựng và phát triển ứng dụng dựa trên mô hình đề xuất; cài đặt thử nghiệm chương trình, đánh giá các kết quả đạt được; công bố kết quả nghiên cứu trong các Hội thảo. 2
  16. 1.5. Ý nghĩa khoa học và ý nghĩa thực tiễn Ý nghĩa khoa học: Luận văn góp phần giới thiệu các bước tiến hành để xây dựng hệ thống nhận dạng nói chung và nhận dạng khuôn mặt nói riêng. Nghiên cứu về phương pháp trích chọn đặc trưng nhận dạng khuôn mặt HOG và mạng Nơron trong việc nhận dạng khuôn mặt. Cài đặt thử nghiệm và đánh giá bằng thực nghiệm các kỹ thuật trong trích chọn đặc trưng HOG và phân loại đối tượng dựa trên mạng nơron. Nghiên cứu này tạo tiền đề cho những nghiên cứu tiếp theo trong tương lai. Ý nghĩa thực tiễn: Luận văn nghiên cứu một số kỹ thuật, các thuật toán hỗ trợ cho việc phát hiện và nhận dạng khuôn mặt người. Luân văn đã xây dựng thành công hệ thống nhận dạng khuôn mặt dựa trên trích chọn đặc trưng HOG và mạng nơron. Bên cạnh đó, luận văn này góp phần xây dựng chương trình nhận dạng khuôn mặt người để áp dụng cho nhiều ứng dụng thực tiễn, nhằm đáp ứng cho các yêu cầu như nhận dạng, bảo mật ngày càng cao. Ngoài ra, luận văn đã xây dựng cơ sở dữ liệu trong thực tế trên khuôn mặt người cán bộ công chức tạo tiền đề cho việc xây dựng cơ sở dữ liệu nhận dạng cán bộ công chức một cách tự động. 1.6. Bố cục luận văn Nội dung của luận văn được chia thành các phần như sau: Chương 1: Tổng quan về lĩnh vực nghiên cứu. Chương này trình bày khái quát về bài toán nhận dạng khuôn mặt, những ứng dụng cũng như yêu cầu đề tài. 3
  17. Chương 2: Cơ sở lý thuyết và các nghiên cứu liên quan: Chương này trình bày các thuật toán nhận dạng khuôn mặt và các nghiên cứu liên quan. Chương 3: Mô hình đề xuất: Chương này trình bày phương pháp nhận dạng khuôn mặt kết hợp giữa phương pháp phân tích đặc trưng HOG và mạng nơron tích chập (CNN). Chương 4: Thực nghiệm: Chương 4 trình bày quá trình và kết quả đạt được khi thực nghiệm, phân tích và đánh giá các kết quả đạt được. Chương 5: Kết luận và hướng phát triển. 4
  18. CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN 2.1. Mạng Nơron tích chập 2.1.1. Mạng Nơron Mạng Nơron nhân tạo (Artificial Neural Network – ANN) là mô hình xử lý thông tin được mô phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật hay còn gọi là mạng Nơron sinh học (hình 2.1) [1]. Cấu tạo từ số lượng lớn các nơron được kết nối với nhau để xử lý thông tin. ANN giống như bộ não con người, được học bởi kinh nghiệm thông qua huấn luyện, có khả năng lưu giữ những kinh nghiệm tri thức và sử dụng những tri thức đó trong việc dự đoán các dữ liệu chưa biết. ANN được giới thiệu năm 1943 bởi nhà thần kinh học Warren McCulloch và nhà logic học Walter Pits. [1] Hình 2.1: Mạng nơron sinh học [1] Các ứng dụng của Mạng neuron được sử dụng trong rất nhiều lĩnh vực như điện, điện tử, kinh tế, quân sự,… để giải quyết các bài toán có độ phức tạp và đòi hỏi có độ chính xác cao như điều khiển tự động, khai phá dữ liệu, nhận dạng,… Một ANN gồm ba tầng lớp đầu vào (input layer), các lớp ẩn (hidden layers) và cuối cùng là lớp đầu ra (output layer) được mô tả trong hình 2.2 [1], trong đó, lớp ẩn gồm nhiều nơron nhận dữ liệu đầu vào từ các lớp trước đó để xử lý và chuyển 5
  19. đổi các dữ liệu này cho các lớp tiếp theo. Một ANN có thể có nhiều lớp ẩn hoặc không có lớp ẩn. Hình 2.2: Cấu trúc của mạng nơron nhân tạo [1] Mỗi node trong mạng gọi là một nơron. Mỗi nơron nhận các dữ liệu đầu vào xử lý chúng và trả ra một kết quả duy nhất. Kết quả đầu ra của nơron này có thể làm dữ liệu đầu vào của các nơron khác. Hình 2.3 [1] mô tả quá trình xử lý của một nơron trong ANN. Trong đó input là dữ liệu đầu vào, output là kết quả đầu ra. Trọng số liên kết hay trọng số (connection weights hay gọi tắt là weights) là thành phần rất quan trọng, thể hiện mức độ quan trọng đối với quá trình xử lý dữ liệu từ lớp này sang lớp khác. Quá trình học của ANN thực ra là quá trình điều chỉnh trọng số của các dữ liệu đầu vào. Hình 2.3: Quá trình xử lý của một nơron trong ANN [1] 6
  20. Hàm tổng Σ tính tổng của tích trọng số và dữ liệu vào. Hàm tính tổng một nơron của k dữ liệu đầu vào của lớp thứ i 𝑎𝑖 = ∑ 𝑥𝑘 𝜔𝑖,𝑘 (2.1) Hàm kích hoạt hay hàm chuyển đổi 𝑓 tính toán đầu ra của một nơron để chuyển đến lớp tiếp theo trong mạng nơron. Hàm kích hoạt phi tuyến được sử dụng vì mạng chỉ sử dụng các hàm kích hoạt tuyến tính có thể lược giản thông qua các biến đổi đại số thành mô hình perceptron một lớp (là mô hình ANN đơn giản nhất, không có lớp ẩn). Một số hàm kích hoạt phi tuyến thường dùng là ReLU (Rectified Linear Unit), sigmoid, logistic, Gaussian, tanh, softmax. Hình 2.4 [1] 0 ,𝑥 < 0 𝑓 (𝑥 ) = { (2.2) 𝑥 ,𝑥 ≥ 0 Hàm Sigmoid: 1 𝑓 (𝑥 ) = (2.3) 1+𝑒 −𝑥 Hàm Tanh: 1 𝑓 (𝑥 ) = −1 (2.4) 1+𝑒 −2𝑥 7
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
8=>2