HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
Nguyễn Thị Thủy
NGHIÊN CỨU MÔ HÌNH HỌC SÂU ỨNG DỤNG VÀO BÀI TOÁN ĐIỂM
DANH TẠI DOANH NGHIỆP
Chuyên ngành: Hệ thống thông tin
Mã số: B21CHIS013
TÓM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ
HÀ NỘI - NĂM 2023
Đề án tốt nghiệp được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: Tiến sĩ Phan Thị Hà
Phản biện 1: ………………………………………………………………
Phản biện 2: ……………………………………………………………..
Đề án tốt nghiệp sẽ được bảo vệ trước Hội đồng chấm đề án tốt nghiệp thạc tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiu đề án tốt nghip ti:
1
TÓM TẮT ĐỀ ÁN
Bài toán nhận dạng một trong những bài toán thu hút sự quan tâm của
cộng đồng nghiên cứu bởi tính ứng dụng rất cao vào các bài toán thực tiễn.
Dạng bài toán này trải dài qua nhiều lĩnh vực khác nhau từ xử ảnh, x
âm thanh đến xử ngôn ngữ tự nhiên một trong những bài toán bản
trong sự phát triển của học máy/học sâu. Nhận diện gương mặt thể được
xếp vào nhóm bài toán nhận dạng bởi mục đích của để xác định danh
tính của 1 người trong cơ sở dữ liệu. Nhận diện khuôn mặt được ứng dụng để
giám sát an ninh, đảm bảo an toàn hội tại mọi nơi, đặc biệt một số đơn
vị/địa điểm cần mức độ an toàn hơn mức bình thường như: quan công an,
doanh trại quân đội, văn phòng công ty, chung cư cao cấp, …
Nhận diện danh tính qua khuôn mặt không chỉ đặc biệt quan trọng trong
ngành an ninh mà còn có thể áp dụng cho nhiều lĩnh vực khác nhau như: điểm
danh học sinh/sinh viên trong ngành giáo dục, giám sát trẻ nhỏ trong lớp
học…Nhận diện khuôn mặt hai yếu tố chính đó phát hiện khuôn mặt
trong ảnh nhận diện danh tính khuôn mặt. Phát hiện khuôn mặt đã mặt
trên nhiều thiết bị di động thông minh, còn muốn biết xem danh tính người đó
là ai từ thư viện ảnh thì ta dùng nhận diện khuôn mặt.
Để thể nhận dạng đúng khuôn mặt, điều quan trọng đầu tiên phải
phát hiện ra khuôn mặt. Tính đến hiện nay, các nhà nghiên cứu vẫn chưa thực
sự đạt được sự ưng ý trong việc giải quyết các khó khăn của bài toán cho
ra kết quả đúng hoàn toàn. Tuy nhiên, thì những thành quả đạt được tính đến
thời điểm này cũng đủ để ứng dụng rộng rãi đem lại lợi ích cho đời sống
và xã hội.
Tuy còn nhiều khó khăn, nhưng cũng không thể phủ nhận đây một bài
toán sức hấp dẫn lớn, nhìn vào những ứng dụng tuyệt vời trong cuộc sống
2
cộng thêm niềm đam về công nghệ hiện đại, với khát khao chinh phục
khám phá những tri thức mới mẻ. Nội dung gồm 4 chương, như sau:
Chương 1: Tổng quan về bài toán
Chương 1 sẽ giới thiệu tổng quan về bài toán nhận dạng, đây là một bài
toán điển hình trong lĩnh vực thị giác máy tính. Được đánh giá một bài
toán cổ điển, bản tuy nhiên để giải quyết triệt để hiệu quả thì còn
vấn đề khó và chưa đạt được những thành công hoàn chỉnh.
Nói riêng về nhận dạng thì nhận dạng khuôn mặt một trường hợp cụ
thể của bài toán nhận dạng, luôn tồn tại những khó khăn riêng. Trên thực
tế, rất nhiều khuôn mặt giống nhau đến mắt người còn khó phân biệt
được phải dựa vào những đặc điểm rất nhỏ trên khuôn mặt mới thể
nhận dạng đúng.
Hướng giải quyết của bài toán: Để nhận diện gương mặt 2 giai đoạn
chính đó là phát hiện gương mặt (Face Detection) và nhận diện gương mặt
(Face Verifiaction). Các giai đoạn hiện nay đều thể ứng dụng nhiều
thuật toán và mô hình khác nhau. Dựa vào 3 yếu tố chính: tốc độ, xử lý, độ
chính xác và độ lớn của hình để lựa chọn ra mô hình phù hợp. Sau khi
đã nghiên cứu và lựa chọn được mô hình phù hợp cũng như được đánh giá
hiệu quả nhất, ta sẽ ứng dụng phát triển một hệ thống nhận diện
gương mặt dựa theo mô hình đã lựa chọn
Trong chương 1, sẽ nghiên cứu về 2 phương pháp học máy học sâu.
Phân nhánh Học máy sẽ bao gồm: Học giám sát (Supervised learning),
học không giám sát (Unsupervised learning), học bán giám sát (Semi-
supervised learning), học củng cố (Reinforcement learning) học sâu
(Deep learning). Nghiên cứu kỹ hơn về phương pháp Học sâu, học sâu
việc mô phỏng lại cách thức hoạt động của bộ não con người với các phần
tử cơ bản là các nơ ron. Nếu như học máy cần bước trích xuất đặc trưng từ
3
dữ liệu đầu vào thì học sâu sẽ tự động thực hiện nhiệm vụ này dựa trên dữ
liệu nhận được. Do đó, điểm khác biệt lớn của học sâu so với học
máy đó lượng dữ liệu cần thiết để huấn luyện học sâu lớn hơn rất
nhiều. Một số thuật toán nổi tiếng của học sâu thể kể đến là: Mạng
ron tích chập (Convolutional neural network CNN) mạng ron tái
tạo (Recurrent neural networks RNN). Đồng thời nêu lên một số ứng
dụng điển hình trong việc ứng dụng Deep learning như: Ứng dụng xe tự
động, phỏng nhận diện hình ảnh, trợ ảo tính năng dịch tự
động. Trên sở tổng quan, dựa trên sở thuyết của chương 1,
chương 2 sẽ đi thực nghiệm bài toán nhận diện khuôn mặt sử dụng phương
pháp học sâu.
Chương 2: Thực nghiệm bài toán nhận diện khuôn mặt
Trong chương này, đồ án đi vào thực nghiệm dựa trên những sở
thuyết đã trình bài chương trước. Mục tiêu của chương cài đặt được
thực nghiệm hệ thống, trên sở đó sẽ phát triển ứng dụng nhận diện
khuôn mặt.
Các bước nhận diện khuôn mặt, bao gồm:
1. Thực hiện thu thập dữ liệu
Bước đầu tiên của bài toán là tiến hành thu thập dữ liệu. Dữ liệu của bài
toán bao gồm một tập ảnh, trong đó mỗi ảnh sẽ chứa khuôn mặt định
danh tương ứng của khuôn mặt đó. Đối với bài toán nhận diện khuôn mặt,
yêu cầu cơ bản của tập dữ liệu ảnh sẽ là: chất lượng ảnh sắc nét, khuôn mặt
to, rõ ràng, chứa khuôn mặt của một người duy nhất khuôn mặt
không được lệch quá nhiều so với phương nhìn chính diện, mỗi ảnh phải có
định danh tương ứng đi kèm, mỗi định danh phải ít nhất từ 50 ảnh trở
lên, …