HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
VÕ TH HNG NHUNG
PHÂN TÍCH BIU CM MẶT NGƯỜI DÙNG MNG
NƠ RON TÍCH CHẬP
Chuyên ngành: H Thng Thông Tin
Mã s: 8.48.01.04
TÓM TT LUN VĂN THẠC SĨ
(Theo định hướng ng dng)
TP. H CHÍ MINH - NĂM 2022
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: PGS.TS. Lê Hoàng Thái
Phản biện 1: …………………………………………………
Phản biện 2: …………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc tại
Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện ca Hc vin Công ngh Bưu chính Viễn thông.
1
I. M ĐẦU
1. Lý do chọn đề tài
Phân loi biu cảm là lĩnh vực đã được nghiên cu trong nhiu
năm qua với nhiu ng dng trong nhiều lĩnh vực khác nhau gn lin
vi các h thống tương tác người máy. Trong máy hc, phân loi biu
cm là một bài toán khó, tuy nhiên, đối với con người, vn đề này có th
gii quyết ngay lp tc. Các thách thc chính là: hình nh biu cm ca
cùng một người cùng mt biu cm vn th khác nhau nhng
điều kiện ánh sáng, môi trường góc quay. Nhng biến đổi này càng
lớn khi các đối tượng nghiên cu càng đa dạng.
- Nhn biết cm xúc t nét mt có mt s li thế như:
o Tiếp cận theo hướng t nhiên nhất để xác định trng thái cm
xúc ca khuôn mt
o Nhiu b d liu có sn cho biu hin cm xúc trên khuôn mt.
o Nhiu công c h tr xác định cm xúc khuôn mt có sn.
- Nhn biết cm xúc t nét mặt cũng có một s nhược điểm như:
o Không th cung cp thông tin ng cảnh, do đó đôi khi kết qu
b sai lch.
o Kết qu phát hin cm xúc ph thuc vào chất ng hình nh
hoc video
o Chuyển động liên quan đến cm xúc khuôn mt th được
đối tượng c tình làm gi như các diễn viên …
thế, nhn biết biu cm vn mt thách thc vi th giác
máy tính. Trong luận n này, đưa ra một hướng tiếp cận đơn giản cho
2
nhn biết biu cm khuôn mt: kết hp gia Convolutional Neural
Network (CNN) các bước tin x đặc trưng. CNN sẽ đạt đ chính
xác rt cao nếu hc vi b d liu ln. Tn dụng ưu điểm này, d kiến
đề xuất phương pháp áp dụng vài k thut tin x để ch rút trích các
thành phần đặc trưng cho biểu cm trên khuôn mt kết hp vi
CNNs để thc hin phân loi cm xúc hiu qu. D kiến s thc nghim
đánh giá trên 2 tập d liu công khai ln (CK+, JAFFE). Các thc
nghim s được thc hiện để đánh giá các ảnh hưởng ca tin x
các mt s ảnh hưởng ca các yếu t khác. Hy vng xây dựng được h
thng phân bit cảm xúc có đ chính xác cao và đáp ứng các yêu cu v
thi gian thc.
2. Tng quan v vấn đề nghiên cu
2.1 Phân chia cm xúc khuôn mt
- Bảng dưới đây cho biết biu cm trên khuôn mt th hin by
cm xúc chính của con người [1]:
Bảng 1. 1: Mô tả các cảm xúc cơ bản của con người
Cm xúc
Biu cm khuôn mt
Vui v
Khóe môi hé m,Má nâng cao
Bun bã
Đôi mí mắt trên sp xung,
mt mt tp trung, mép kéo nh xung
Tc gin
Mt Nhìn chm chằm, Mũi nỡ ra,
Môi ép cht
3
S hãi
Lông mày nhưng lên, Ming m ra
Ghê tm
Đôi môi được nâng cao lên, Mũi nhăn
Ngc nhiên
Lông mày cong cao hơn
Tròng trng ca mắt rõ hơn, miệng
Bình thường
Không biu hin gì
2.2 Tình hình nghiên cu
3. Mục đích nghiên cứu
Nghiên cứu đề tài này nhằm mục đích m hiểu bài toán nhận
biết cảm xúc từ nét mặt, từ đó xây dựng các hệ thống ứng dụng trong
thực tiễn như: đánh giá cảm xúc nhân viên trong thời gian làm việc tại
công ty, từ đó xác định hiệu quả công việc…
4. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: tập trung tìm hiểu một số phương pháp
CNN phổ biến hiện nay, xác định một trong bảy trạng thái cảm xúc
bản của con người dựa vào hình ảnh đơn nhập vào.
Phạm vi nghiên cứu: thực hiện trên tập dữ liệu chuẩn CK+ [10]
JAFFE, trên hai giới tính nam lẫn giới tính nữ, độ tuổi từ 18 - 45
tuổi, với nhiều chủng tộc người khác nhau. Đồng thời, cũng thử nghiệm
trên một số ảnh chụp webcam đminh hoạ tính khả thi của hệ thống về
mặt ứng dụng.