
v
TÓM TẮT LUẬN VĂN
Trong thời đại 4.0 hiện nay, cùng với sự bùng nổ của trí tuệ nhân tạo,
đã có rất nhiều công trình nghiên cứu máy học được công bố, trong số đó
lĩnh vực thị giác máy tính nói chung cũng như nhận dạng hình ảnh nói riêng
là một trong các lĩnh vực được rất đông người quan tâm hiện thời. Trong đó,
bài toán nhận dạng cảm xúc khuôn mặt dựa trên cách trích xuất đặc trưng sử
dùng mạng nơ-ron mang lại hiệu quả cao bởi tính ổn định và thích nghi rất
tốt khi dữ liệu đầu vào có thay đổi.
Cảm xúc khuôn mặt là một trong những phương thức quan trọng nhất
để thể hiện cảm xúc của con người trong giao tiếp xã hội. Tự động nhận
dạng biểu hiện khuôn mặt đã trở thành một chủ đề “yêu thích” trong lĩnh
vực nghiên cứu thị giác máy tính. Trong luận văn này, chúng tôi xin đề xuất
một phương pháp sử dụng mô hình học sâu mạng nơ-ron tích chập (CNN)
để nhận dạng cảm xúc khuôn mặt người thông qua hình ảnh. Bằng cách khai
thác các tính năng ưu việt của CNN, xây dựng một mô hình CNN của riêng
chúng tôi, mô hình đề xuất của chúng tôi đạt được kết quả tốt hơn so với các
mô hình khác. Các thí nghiệm được thực hiện trên cơ sở dữ liệu FER-2013
và điểm ma trận chính xác và nhầm lẫn được sử dụng để đánh giá mô hình
của chúng tôi.
Một phần kết quả nghiên cứu của chúng tôi, bài báo: “Facial
Expression Recognition with CNN-LSTM” đã được công bố tại Hội nghị
RICE 2020 lần thứ 5 - International Conference on Research in Intelligent
and Computing in Engineering tháng 6/2020 và giành được giải thưởng Bài
báo xuất sắc nhất (Best Paper Awards) của Hội nghị.