Mô hình Deep Learning trong nhận diện cảm xúc và cảnh báo stress
lượt xem 5
download
Bài viết Mô hình Deep Learning trong nhận diện cảm xúc và cảnh báo stress áp dụng mạng nơ ron CNN để xây dựng hệ thống nhận diện cảm xúc khuôn mặt. Hệ thống được thiết kế dựa trên kiến trúc Lenet 5 có cải tiến ở một số điểm để tăng hiệu suất cũng như thời gian huấn luyện. Đồng thời, hệ thống nhận diện cảm xúc và cảnh báo stress được xây dựng trên thiết bị di động.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Mô hình Deep Learning trong nhận diện cảm xúc và cảnh báo stress
- Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 MÔ HÌNH DEEP LEARNING TRONG NHẬN DIỆN CẢM XÚC VÀ CẢNH BÁO STRESS Trần Thị Ngân1, Nguyễn Văn Dũng1 1 Trường Đại học Thủy lợi, email: ngantt@tlu.edu.vn 1. GIỚI THIỆU giúp cho chúng ta xây dựng được những hệ Khuôn mặt là một trọng tâm chính trong thống thông minh với độ chính xác cao. CNN mối quan hệ giao tiếp trong xã hội. Biểu áp dụng trong nhận dạng cảm xúc khuôn mặt cảm khuôn mặt đóng vai trò quan trọng cũng là một trong những giải pháp tốt trong trong việc truyền tải bản sắc riêng và cảm thị giác máy tính, giao tiếp người – máy xúc của con người. Biểu hiện trên khuôn trong xu thế hiện nay [3]. mặt, là cách biểu đạt và trực tiếp nhất để Trong bài báo này, chúng tôi áp dụng giao tiếp cảm xúc ở người. Tuy nhiên, mặc mạng nơ ron CNN để xây dựng hệ thống dù nét mặt có thể dễ dàng nhận ra bởi con nhận diện cảm xúc khuôn mặt. Hệ thống người, nhưng nhận dạng khuôn mặt đáng được thiết kế dựa trên kiến trúc Lenet 5 có tin cậy bằng máy vẫn là một thách thức lớn. cải tiến ở một số điểm để tăng hiệu suất cũng Hơn nữa, nó là một vấn đề thú vị và đầy thử như thời gian huấn luyện. Đồng thời, hệ thách do phạm vi rộng của các ứng dụng thống nhận diện cảm xúc và cảnh báo stress như tương tác giữa con người và máy tính, được xây dựng trên thiết bị di động. nhận dạng hình mẫu, phân loại hình ảnh và 2. MÔ HÌNH MẠNG CNN TRONG NHẬN nhiều lĩnh vực khác. Ngoài ra, ảnh khuôn DIỆN CẢM XÚC KHUÔN MẶT mặt trong thực tế còn chứa đựng rất nhiều vấn đề như: độ sáng, độ nhòe/ mờ, độ Hệ thống nhận diện cảm xúc dựa trên nhiễu, độ phân giải, góc ảnh, tầm nhìn… khuôn mặt bằng mô hình CNN được thực Hệ thống nhận diện cảm xúc qua khuôn hiện thông qua các bước chính được minh mặt bằng phương pháp truyền thống sẽ xử lý họa trong Hình 1 dưới đây. bài toán với các giai đoạn: tiền xử lý hình bức ảnh khuôn mặt, trích chọn đặc trưng của bức ảnh và tiến hành phân loại [1, 2]. Từ các nghiên cứu đã có, hệ thống nhận dạng cảm xúc qua khuôn mặt thực hiện bằng các giai đoạn sau: tiền xử lý dữ liệu, phân lớp dữ liệu sử dụng học sâu. Vào những năm gần đây, học sâu mang lại độ chính xác, ổn định hơn phương pháp truyền thống vì nó không phải Hình 1. Cấu trúc tổng quát của mô hình thông qua bước trích xuất các đặc trưng một cách tường minh mà thay vào đấy thực hiện Trong đó, dữ liệu được đưa vào hệ thống đi kèm với phương pháp phân loại. là ảnh chụp khuôn mặt người với các biểu Mạng nơ-ron tích chập (Convolutional cảm khác nhau. Neural Network – CNN) là một trong những Mạng CNN được sử dụng trong mô hình là mô hình máy học (machine learning) tiên tiến mạng LeNet 5 với cấu trúc như Hình 2. 114
- Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 khuôn mặt có kích thước 48×48 pixels. Bộ dữ liệu gồm 7 loại cảm xúc: Giận dữ (Angry), Ghê tởm (Disgust), Sợ hãi (Fear), Hạnh phúc (Happy), Buồn bã (Sad), Bất ngờ (Surprise) và Trung lập (Neutral). Với ứng dụng trên thiết bị di động, ảnh đầu vào có thể được chọn từ thư viện hoặc ảnh chụp trực tiếp từ thiết bị. Hình 2. Kiến trúc mạng LeNet Để xây dựng mô hình, một vài cải tiến được tác giả đề xuất sử dụng bao gồm: Hàm kích hoạt là hàm ReLU, các bộ lọc có kích thước nhỏ (3x3), xếp nhiều tầng CNN + max pooling, sử dụng dropout layer giúp giảm số lượng liên kết neural và kiểm soát overfitting. Hình 4. Giao diện chọn ảnh đầu vào Ngoài ra, để triển khai hệ thống trên thiết bị di động, mô hình cần được chuyển đổi sang Sau khi ảnh đầu vào được chọn, hệ thống dạng TensorFlow Lite (.tflite). phát hiện khuôn mặt và nhận diện cảm xúc. Kết Ứng dụng có chức năng chính là dựa trên quả được hiển thị như trong Hình 5 dưới đây. ảnh mà người dùng chụp hoặc lấy từ bộ nhớ máy sau đó tiến hành nhận diện khuôn mặt, xử lý ảnh sao cho ảnh đúng đầu vào của model, sau khi xử lý ảnh xong model sẽ chạy và nhận dạng được cảm xúc của khuôn mặt trên bức ảnh đấy từ đó đưa ra thông báo cho người dùng. Ảnh được đưa vào hệ thống qua 2 chức năng chính đó là: cho phép người dùng tự chụp ảnh hoặc người dùng có thể lấy ảnh từ thư viện ảnh trong máy. (a ) Quá trình xây dựng hệ thống trên thiết bị di động được thực hiện dựa theo sơ đồ dưới đây: Hình 3. Sơ đồ hoạt động của ứng dụng Trong đó, ảnh đầu vào có thể được chọn từ (b) các ảnh có sẵn hoặc chụp ảnh trực tiếp từ máy ảnh của thiết bị di động. Hình 5. Hoạt động của ứng dụng: (a) Ảnh đầu vào; (b) Kết quả nhận diện cảm xúc 3. KẾT QUẢ THỰC NGHIỆM Bên cạnh việc nhận diện cảm xúc khuôn mặt, Dữ liệu được sử dụng để huấn luyện mô hệ thống còn cảnh báo stress đối với biểu cảm hình là bộ dữ liệu FER-2013 [4]. FER-2013 là nhận được. Trong hình 6 cảm xúc được dự báo một bộ dữ liệu phổ biến với 35,887 ảnh là Buồn (sad) nên hệ thống hiển thị cảnh bảo 115
- Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8 (Stress alert). Với những cảm xúc tích cực, cảnh Về dung lượng: Mô hình được chuyển đổi báo này không xuất hiện (Hình 5). sang dạng TensorFlow nên tốn ít dung lượng trên thiết bị. 4. KẾT LUẬN Trong nghiên cứu này, mạng CNN được sử dụng để huấn luyện mô hình nhận diện cảm xúc và cảnh báo stress từ ảnh khuôn mặt. Hệ thống được xây dựng trên nền tảng Android. Với ảnh đầu vào có thể được lựa chọn từ thư viện hoặc được chụp trực tiếp từ máy ảnh của thiết bị, hệ thống đưa ra kết quả nhận diện cảm xúc trên khuôn mặt. Với những cảm xúc tiêu cực (buồn, giận dữ, …), hệ thống có thêm cảnh báo stress và đưa ra các gợi ý đối với người dùng. (a) 5. TÀI LIỆU THAM KHẢO [1] Mehendale, N. (2020). Facial emotion recognition using convolutional neural networks (FERC). SN Applied Sciences, 2(3), 1-8. [2] Huỳnh Cao Tuấn, Đỗ Sĩ Trường, Nguyễn Thanh Bình, Lâm Thành Hiển (2020), Phát hiện khuôn mặt người trong ảnh bằng kỹ (b) thuật phân lớp nhị phân, Journal of Science and Technology on Information and Communications 1, no. 4A, 42-46. Hình 6. Hiển thị cảm xúc kèm cảnh báo stress: [3] Nguyễn Thị Duyên, Trương Xuân Nam, (a) Ảnh đầu vào; (b) Kết quả thực hiện. Nguyễn Thanh Tùng (2019), Một mô hình Đánh giá mô hình: học sâu cho phát hiện cảm xúc khuôn mặt, Kỷ yếu Hội nghị KHCN Quốc gia lần thứ Về độ chính xác: Mô hình đề xuất được đánh XII về Nghiên cứu cơ bản và ứng dụng giá dựa trên độ đo Accuracy (Acc). Kết quả Công nghệ thông tin (FAIR); Huế, ngày 07- nhận được trên bộ dữ liệu đã chọn như sau: 08/6/2019. DOI: 10.15625/vap.2019.00036 Acctrain = 91.05% [4] Link dữ liệu: https://www.kaggle.com/ AccValidation = 67.8% datasets/deadskull7/fer2013. Về thời gian: Mô hình nhận diện cảm xúc khuôn mặt với thời gian gần như tức thời (realtime). 116
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Một mô hình deep learning nhẹ cho bài toán nhận dạng tuổi và giới tính sử dụng mạng CNN
6 p | 270 | 17
-
Mô hình huấn luyện trí tuệ nhân tạo tự động phát hiện và phân loại các truy vấn URL độc hại
14 p | 13 | 7
-
Đề xuất mô hình YOLO V5 ứng dụng trong nhận diện biển số xe
13 p | 15 | 7
-
Nhận dạng hình ảnh tự nhiên sử dụng mô hình mạng Neuron tích chập
5 p | 116 | 4
-
Nhận dạng hình ảnh thực phẩm bằng phương pháp deep learning
9 p | 23 | 2
-
Mô hình huấn luyện mạng nơ ron dựa trên ảnh mô phỏng
7 p | 51 | 1
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn