XÂY DỰNG HỆ THỐNG ĐIỂM DANH BẰNG KHUÔN MẶT
Nguyễn Nhĩ Khang - 1824801040068,
Nguyễn Thị Thanh Trúc - 1824801040071,
Nguyễn Luân Lưu - 1824801040120,
Nguyễn Đức Duy 1824801040126.
Lớp D18HT02 – Khoa Kthuật – Công ngh
GVHD: Tiến sĩ. Bùi Thanh Hùng
TÓM TẮT:
Đề tài được xây dựng dựa trên nhu cầu thực tế về việc ứng dụng khoa học công nghệ xây
dựng hệ thống điểm danh bằng khuôn mặt đáp ứng yêu cầu của người sử dụng trong quá
điểm danh, rà soát một cách dễ dàng hơn. Quy trình cũ nhiều công đoạn thừa và tốn
thi gian nhân lực, dẫn đến dẫn đến tình trạng ùn ứ, chờ đợi trong quá trình điểm
danh, không tiện lợi cho cả người sử dụng người quản . Trong nghiên cu này,
nhóm đề xut s dụng phương pháp hc sâu Mạng ron tích chập CNN, một phương
được s dng trong nhiu nghiên cu v th giác máy tính. Trên s đánh giá trên bộ
d liu chun ORL (ca Lab nghiên cu AT&T) với các phương pháp khác nhau PCA-
NN, LDA-DNN thì phương pháp do nhóm đ xut CNN kết hp vi Haar Cascade trong
xác định khuôn mt cho kết qu tt nht. Da trên kết qu đó, nhóm đã xây dng ng
dụng điểm danh bng khuôn mt áp dụng thí điểm ti môn thuyết đồ th lp
D18HT02, Đại hc Th Du Mt. Kết qu kho sát t ging viên thc hiện thí đim cho
thy ng dụng đề xuất đạt hiu qu tt trong việc điểm danh sinh viên.
QUÁ TRÌNH NGHIÊN CỨU VÀ KẾT QUẢ
1. Tng quan
1.1. Gii thiu v đề tài
Trí tunhân tạo (AI) đang xu hướng phát triển nhiều tiềm năng trong lĩnh
vc công nghệ thông tin, nm giữ vai trò chđạo trong dòng chảy công nghệ hiện đại với
nhiều ứng dụng trong mọi lĩnh vực của đời sống xã hội như trợ ảo, nhà thông minh, xe
tlái, các hệ thống nhận diện,… Nhận diện khuôn mặt là một một lĩnh vực nghiên cứu
của ngành thgiác máy tính, và cũng được xem là một lĩnh vực nghiên cứu của ngành
sinh trắc học tương tự như nhận dạng vân tay, hay nhận dạng mống mắt.
Chúng tôi nhận thấy việc điểm danh sinh viên vào các buổi học thường tốn nhiều
thời gian vì người điểm danh cần gọi tên, điểm mặt từng bạn trong lớp học. Đối với
những lớp học từ 50 sinh viên trlên thì công việc này càng khó khăn hơn vì th
xảy ra trường hợp gian lận trong điểm danh (điểm danh hộ). Trong đề tài này, chúng tôi
chọn nghiên cứu về nhận diện khuôn mặt bằng thuật toán hc sâu mạng ron tích chập-
CNN. Chúng tôi cũng đã phân tích phương pháp đề xut với các phương pháp khác. Trên
sở đó, chúng tôi xây dng ng dng điểm danh sinh viên áp dụng thí điểm ti môn
thuyết đồ th lp D18HT02, Đại hc Th Du Mt. ng dụng điểm danh sinh viên bng
nhn dng khuôn mt giúp cho việc điểm danh trở nên nhanh chóng và ddàng hơn, khắc
phục những khuyết điểm, hạn chế của việc điểm danh truyền thống.
1.2. Mc tiêu và nhim v nghiên cu
Thông qua máy hc nghiên cu các thut toán nhn dng khuôn mt bng mng
-ron tích chp (Convolutional Neural Network) và các phương pháp học sâu mang li
kết qu độ chính xác cao, t đó áp dụng vào bài toán thc tế: Xây dng h thống điểm
danh bng khuôn mt.
1.3. Đối tượng và phm vi nghiên cu
Tập trung chính vào đối tượng nghiên cu mặt người, k thut nhn din khuôn
mt bng máy hc.
Do các hn chế v thi gian cùng thiết bị, đề tài s tp trung nghiên cu trin khai
ng dng trên mt tp d liu sn (nh khuôn mt ca 20 thành viên lp D18HT02
Trường Đại hc Th Du Mt).
1.4. Phương pháp nghiên cứu
Để thc hiện đề tài khoa hc này, chúng tôi s dng kết hợp hai phương pháp
nghiên cu sau:
Phương pháp nghiên cứu lý thuyết:
- Th giác máy tính
- X lý hình nh
- X lý video
- Các phương pháp hc máy
- Ngôn ng và k thut lp trình
Phương pháp nghiên cứu thc nghim:
- Lp trình xây dng ng dng.
2. Các nghn cu có liên quan
Nhn dng khuôn mặt người quá trình xác định danh tính t động cho từng đi
tượng người trong nh/video. Nhiều hướng tiếp cận đã được đề xuất để gii quyết bài
toán này [1], [2], [3], [4]. Nhìn chung, quy trình gii quyết bài toán gồm các công đon
như: (i) Thu nhận hình nh; (ii) tin x lý, tăng cường chất lượng hình nh; (iii) Phát hin,
căn chỉnh, crop nh khuôn mt; (iv) Nhn dng (trích chn đặc trưng và phân lớp) khuôn
mt.
Các đặc trưng tiếp cận trước đây chủ yếu da trên đặc trưng (feature-based)
luôn c gắng đưa ra các đnh nghĩa tường minh để biu din khuôn mt da trên các t l
khong cách, dng tích góc [3]. Tuy nhiên, trong thc tế các biu diễn được định
nghĩa tường minh thường không chính xác. Để khc phục điều đó, các hướng tiếp cn sau
này được đề xut da trên ý tưởng s dng các hình hc máy thng kh năng
học để la chọn các đặc trưng khuôn mặt t mt tp mẫu cho trước, điển hình như
phương pháp PCA (Principal Component Analysis), trong đó mi khuôn mặt được biu
diễn dưới dng t hp các eigenvector, eigenfaces và fisherfaces [5], [6]
Hin ti, hiu qu ca các hình nhn dng khuôn mặt đã được ci thiện đáng
k da trên vic kết hp s dng các mô hình học sâu để t động phát hin các đặc trưng
trên khuôn mt và các k thut phân lp. Trong [7], [8], [9] các tác gi đã đề xut mt
hình nhn dng phc tp, nhiều công đoạn da trên vic kết hp mạng ron tích chập
(CNN) với PCA để gim chiu d liu.
Y.Taigman cng s [8] đ xut hình DeepFace da trên ý tưởng kết hp
nhiều công đoạn (multi-stage): trước tiên s dng mt hình khuôn mt 3 chiều để
chun hóa các ảnh đầu vào v thế nhìn thẳng, sau đó xây dng mt kiến trúc mng
nơron học sâu DNN (Deep Neural Network) vi 120 triu tham s, kh năng học t
mt tp d liu khng l vi trên 4,4 triu khuôn mặt đã được gán nhãn.
Nhóm tác gi Nguyn Thanh Tùng, Bùi Thanh Hùng đã trình bày nghiên cu ng
dụng phương pháp học sâu nhn dng khuôn mt ti Ngày hi Khoa hc cán b ging
viên tr và hc viên cao hc ln III- m 2019, Đại hc Th Du Mt [10].
Tác gi Nguyn Thanh Tùng nghiên cu v ng dụng phương pháp học sâu để
nhn din khuôn mt qua camera giám t, Luận văn Thạc sĩ - Đại hc Th Du Mt
2019 [11].
Tác gi Bùi Thanh Hùng đề xuất phương pháp học sâu kết hp HOG-CNN cho
nhn dng khuôn mt trong báo cáo ti Hi ngh RICE 2020, Face Recognition Using
Hybrid HOG-CNN Approach. The Fifth International Conference on Research in
Intelligent and Computing in Engineering [12].
Dựa trên sở các nghiên cứu trước, trong nghiên cu này nhóm Đề xut s dng
hình Hc sâu CNN cho nhn dng khuôn mt. hình tng quát của nhóm được
trình bày phn tiếp theo.
3. hình đề xut
3.1. Mô hình tng quát
Mô hình tng quát được trình bày trong Hình 3.1
Hình 3.1 Sơ đồ mô hình đề xuất
Trong mô hình này gm: Mô hình huấn luyện và xây dng ng dng Web.
hình hun luyn, t tp d liu thô t thu thp, nhóm s dụng các phương
pháp tin x d liệu và tăng cường ảnh, sau đó đưa qua hình học sâu để trích xut
đặc trưng và nhận dng ri lưu mô hình tối ưu để phc v xây dng ng dng Web.
3.2. Đặc trưng của mô hình đề xut
3.2.1 Lấy mu huấn luyện
Chúng tôi thu thập mẫu huấn luyện từ những hình ảnh được các bn sinh viên cung
cấp. Khuôn mặt trong các lớp được mã hóa dưi dạng các vector đặc trưng phân biệt giữa
khuôn mặt này với khuôn mặt khác trong các lớp. Sau đó, các vector đặc trưng sẽ được
lưu trữ trong cơ sở dữ liệu khuôn mặt.
3.2.2 Phát hin khuôn mt
Để phát hin khuôn mt, nhóm s dng Phương pháp Haar Cascade. Phương pháp
này mt thut toán phát hiện đối tượng bng học máy được s dng để xác định c
đối tượng trong mt hình nh hoc video da trên khái niệm c tính năng. Phương pháp
này được đề xut bi Paul Viola Michael Jones trong bài báo "Rapid Object Detection
using a Boosted Cascade of Simple Features" năm 2001 [13].
Sau bước phát hin khuôn mt, nh s được đưa qua mạng ron tích chập CNN
để trích xuất đặc trưng và nhận din khuôn mt.
3.2.3 Mạng nơ-ron tích chp
Convolutional Neural Network (CNNs –Mạng -ron tích chp) được đề xut bi
Fukushima năm 1980 được ci tiến bi LeCun, Bottou, Bengio and Haffner năm 1998
[14] mt trong nhng hình Deep Learning tiên tiến giúp cho chúng ta xây dng
được nhng h thng thông minh với đ chính xác cao như hin nay.
Mô hình học sâu CNN sẽ thực hiện train và test, mô hình ảnh đầu vào schuyển nó
qua một loạt các lớp tích chập với các bộ lọc ( filters) - (Kernals), sau đó đến Pooling, rồi
tiếp theo là các lớp được kết nối hoàn chỉnh (FC-fully connected layers) và sau đó áp dụng
chức năng softmax để phân loại một đối tượng có giá trị xác suất từ 0 đến 1.