intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Đề án tốt nghiệp Thạc sĩ Kỹ thuật: Dự đoán tuổi và giới tính bằng phương pháp học sâu

Chia sẻ: Cảnh Phương Thanh | Ngày: | Loại File: PDF | Số trang:77

14
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Đề án "Dự đoán tuổi và giới tính bằng phương pháp học sâu" nhằm mục đích áp dụng phương pháp học sâu của mạng nơ ron tích chập CNN để dự đoán tuổi và giới tính; xây dựng mô hình dự đoán tuổi và giới tính sử dụng phương pháp học sâu; đánh giá hiệu quả của phương pháp CNN trong việc dự đoán tuổi và giới tính trong lĩnh vực tuyển dụng. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Đề án tốt nghiệp Thạc sĩ Kỹ thuật: Dự đoán tuổi và giới tính bằng phương pháp học sâu

  1. i HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG ----------------------------------- TRẦN TẤN LỘC DỰ ĐOÁN TUỔI VÀ GIỚI TÍNH BẰNG PHƯƠNG PHÁP HỌC SÂU ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023
  2. ii HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG -------------------------------------- TRẦN TẤN LỘC DỰ ĐOÁN TUỔI VÀ GIỚI TÍNH BẰNG PHƯƠNG PHÁP HỌC SÂU Chuyên ngành: Hệ thống thông tin Mã số: 8.48.01.04 ĐỀ ÁN TỐT NGHIỆP THẠC SỸ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. LÊ HOÀNG THÁI THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023
  3. i LỜI CAM ĐOAN Tôi xin cam đoan đề án thạc sĩ công nghệ thông tin “Dự đoán tuổi và giới tính bằng phương pháp học sâu” là do tôi nghiên cứu, tổng hợp và thực hiện. Tất cả các nội dung, các số liệu, kết quả nêu trong đề án tốt nghiệp này là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Tôi hoàn toàn chịu trách nhiệm cho mọi hành vi sao chép trái phép hoặc vi phạm quy chế đào tạo. Tp. Hồ Chí Minh, ngày 16 tháng 08 năm 2023 Học viên thực hiện đề án Trần Tấn Lộc
  4. ii LỜI CẢM ƠN Tôi xin gửi lời cảm ơn chân thành và sâu sắc đến PGS.TS Lê Hoàng Thái, người thầy đã tận tâm và nhiệt tình trong việc hướng dẫn và động viên tôi suốt quá trình thực hiện đề án. Nhờ sự hỗ trợ của người thầy, tôi đã được định hướng và hoàn thành các mục tiêu mà tôi đã đề ra. Tôi xin gửi lời tri ân chân thành đến các Thầy, Cô đã đồng hành và tận tình giảng dạy cho tôi suốt thời gian học tập trong chương trình Thạc sĩ Hệ thống thông tin tại khoa Đào tạo Sau đại học, Học viện Công nghệ Bưu chính Viễn thông cơ sở tại thành phố Hồ Chí Minh. Tôi muốn bày tỏ lòng biết ơn đến ban Giám Đốc Trung tâm Công nghệ Thông tin – Viễn thông Tây Ninh đã tạo điều kiện thuận lợi cho học tập của tôi. Tôi biết ơn đến tất cả bạn bè đã động viên, hỗ trợ và đóng góp những ý kiến quý báu cho đề án này. Đóng góp của các bạn đã giúp tôi hoàn thiện nghiên cứu này. Đề án đã hoàn thành và đạt được một số kết quả nhất định, tuy vậy tôi thừa nhận rằng còn tồn tại những hạn chế và thiếu sót. Vì vậy, tôi chân thành mong nhận được sự thông cảm và sự đóng góp quý báu từ quý thầy cô và các bạn để tôi có thể cải thiện và nâng cao chất lượng của nghiên cứu này. Một lần nữa tôi xin chân thành cảm ơn! Tp. Hồ Chí Minh, ngày 16 tháng 08 năm 2023 Học viên thực hiện đề án Trần Tấn Lộc
  5. iii MỤC LỤC LỜI CAM ĐOAN ........................................................................................................... i LỜI CẢM ƠN ................................................................................................................ ii MỤC LỤC ..................................................................................................................... iii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT ............................................... vi DANH SÁCH BẢNG .................................................................................................. vii DANH SÁCH HÌNH VẼ ............................................................................................ viii MỞ ĐẦU ........................................................................................................................ 1 CHƯƠNG 1 - TỔNG QUAN ..................................................................................... 3 1.1 Lý do chọn đề án ................................................................................................. 3 1.2 Tổng quan vấn đề nghiên cứu ............................................................................ 4 1.3 Mục tiêu nghiên cứu............................................................................................ 6 1.4 Đối tượng và phạm vi nghiên cứu ...................................................................... 7 1.5 Phương pháp nghiên cứu.................................................................................... 9 1.6 Ý nghĩa khoa học và thực tiễn của đề án ........................................................ 10 CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT ....................................................................... 11 2.1. Giới thiệu về học sâu và thị giác máy tính ..................................................... 11 2.1.1. Học sâu......................................................................................................... 11 2.1.1.1. Các thành phần của mô hình học sâu .................................................... 12 2.1.1.2. So với máy học, mô hình học sâu mang lại những lợi ích sau ............. 13 2.1.2. Thị giác máy tính .......................................................................................... 15
  6. iv 2.2. Kiến trúc mạng nơ ron tích chập .................................................................... 15 2.2.1. Tổng quan về kiến trúc mạng tích chập ....................................................... 15 2.2.2. Các đặc trưng chung của mạng CNN .......................................................... 17 2.2.3. Các mạng CNN tiêu biểu ............................................................................. 19 CHƯƠNG 3 - PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG ................................... 27 3.1. Hướng tiếp cận ................................................................................................. 27 3.2. Dữ liệu huấn luyện ........................................................................................... 27 3.2.1. Giới thiệu về tập dữ liệu............................................................................... 27 3.2.2. Các bước xây dựng từ tập dữ liệu Adience Dataset .................................... 29 3.3. Tiền xử lý dữ liệu .............................................................................................. 31 3.3.1. Loại bỏ đặc trưng không cần thiết ............................................................... 31 3.3.2. Chỉnh kích thước ảnh sang kích thước phù hợp .......................................... 32 3.4. Mô hình được sử dụng ..................................................................................... 32 3.4.1. Tổng quan mô hình....................................................................................... 32 3.4.2. Định nghĩa .................................................................................................... 35 3.4.3.Chuẩn bị dữ liệu tập huấn ............................................................................. 38 3.4.4. Kiến trúc ....................................................................................................... 40 3.4.5. Huấn luyện mô hình ..................................................................................... 43 3.4.5.1 Khởi tạo mô hình.................................................................................... 43 3.4.5.2 Các phương thức tiền xử lý ảnh ............................................................. 45 3.4.5.3 Các bước tiến hành huấn luyện mô hình ................................................ 48
  7. v CHƯƠNG 4 - CÀI ĐẶT THỬ NGHIỆM VÀ ĐÁNH GIÁ................................... 52 4.1. Cài đặt môi trường ........................................................................................... 52 4.2. Phương pháp đánh giá ..................................................................................... 52 4.3. Phân tích đánh giá hệ thống đề xuất .............................................................. 53 4.3.1. Xây dựng mô đun đánh giá .......................................................................... 53 4.3.2. Kiểm tra đánh giá hệ thống trên bộ dữ liệu công khai ................................ 57 4.3.2.1. Bộ dữ liệu công khai Adience ............................................................... 57 4.3.2.2. Kết quả đánh giá trên bộ dữ liệu công khai Adience ............................ 57 4.3.3. Kiểm tra đánh giá hệ thống trên bộ dữ liệu đã xây dựng ............................ 59 4.3.3.1. Bộ dữ liệu đã xây dựng ......................................................................... 59 4.3.3.2. Kết quả đánh giá trên bộ dữ liệu đã xây dựng ...................................... 59 4.4. Cài đặt triển khai thử nghiệm. ........................................................................ 60 KẾT LUẬN .................................................................................................................. 64 DANH MỤC TÀI LIỆU THAM KHẢO ................................................................... 66
  8. vi DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT VIẾT TẮT TIẾNG ANH TIẾNG VIỆT CNN Convolutional Neural Network Mạng Nơ ron tích chập CV Curriculum Vitae Hồ sơ cá nhân AI Artificial Intelligence Trí tuệ nhân tạo DL Deep Learning Học sâu ML Mechine Learning Học máy Conv Convolutional layer Lớp tích chập Hàm kích hoạt trong mạng nơ ReLU Rectified Linear Unit ron nhân tạo
  9. vii DANH SÁCH BẢNG Bảng 3.1: Danh mục nhãn .............................................................................................. 30 Bảng 3.3: Thông tin các nhãn tương ứng với các bức ảnh ............................................ 31
  10. viii DANH SÁCH HÌNH VẼ Hình 2.1: Mô hình học sâu ............................................................................................. 12 Hình 2.2: Hình ảnh tỷ lệ xám chỉ có một kênh .............................................................. 17 Hình 2.3: Mạng Alexnet, một kiến trúc điển hình của CNN ......................................... 17 Hình 2.4: Kiến trúc LeNet .............................................................................................. 19 Hình 2.5: Kiến trúc AlexNet .......................................................................................... 19 Hình 2.6: Hàm ReLU ..................................................................................................... 21 Hình 2.7: Phương pháp dropout ..................................................................................... 21 Hình 2.8: Kiến trúc VGG-16 .......................................................................................... 22 Hình 2.9: Kiến trúc GoogleNet ...................................................................................... 23 Hình 2.10: Kiến trúc GoogleNet - Inception version 3 .................................................. 25 Hình 3.1: Hình ảnh trong tập dữ liệu Adience ............................................................... 28 Hình 3.2: Thư mục chứa các ảnh được giải nén ............................................................ 29 Hình 3.3: Mạng Alexnet ................................................................................................. 33 Hình 3.4: Ví dụ thí nghiệm sử dụng ReLU .................................................................... 35 Hình 3.5: Tổ chức thư mục ............................................................................................ 36 Hình 3.6: Mô hình gồm 5 block ..................................................................................... 40 Hình 3.7: Kết quả huấn luyện độ tuổi dạng biểu đồ ...................................................... 49 Hình 3.8: Kết quả huấn luyện độ tuổi ............................................................................ 50 Hình 3.9: Kết quả huấn luyện giới tính dạng biểu đồ .................................................... 51 Hình 3.10: Kết quả huấn luyện giới tính ........................................................................ 51
  11. ix Hình 4.1: Giao diện tải ảnh lên hệ thống đánh giá ......................................................... 54 Hình 4.2: Giao diện khi đã tải hình ................................................................................ 54 Hình 4.3: Kết quả dự đoán giới tính nam độ tuổi 12 ..................................................... 55 Hình 4.4: Kết quả dự đoán giới tính nam độ tuổi 45 ..................................................... 55 Hình 4.5: Kết quả dự đoán giới tính nữ độ tuổi 40 ........................................................ 56 Hình 4.6: Kết quả dự đoán giới tính nữ độ tuổi 18 ........................................................ 56 Hình 4.7: Kết quả dự đoán giới tính nam độ tuổi 28 ..................................................... 57 Hình 4.8: Kết quả kiểm chứng mô hình với dự đoán giới tính với dữ liệu công khai ... 58 Hình 4.9: Kết quả kiểm chứng mô hình với dự đoán tuổi với dữ liệu công khai .......... 58 Hình 4.10: Kết quả kiểm chứng mô hình dự đoán giới tính với dữ liệu đã xây dựng ... 59 Hình 4.11: Kết quả kiểm chứng mô hình với dự đoán tuổi với dữ liệu đã xây dựng .... 60 Hình 4.12: Giao diện hệ thống ....................................................................................... 60 Hình 4.13: Giao diện nhập thông tin ứng viên ............................................................... 61 Hình 4.14: Giao diện chọn ảnh ứng viên ....................................................................... 61 Hình 4.15: Giao diện khi đã nhập xong thông tin .......................................................... 62 Hình 4.16: Giao diện kết quả nghi vấn dưới độ tuổi lao động ....................................... 62 Hình 4.17: Giao diện kết quả trong độ tuổi lao động ..................................................... 63 Hình 4.18: Giao diện kết quả nghi vấn quá độ tuổi lao động ........................................ 63
  12. 1 MỞ ĐẦU Sự phát triển kinh tế - xã hội phụ thuộc vào nhiều yếu tố khác nhau, nhưng tập trung chủ yếu vào nguồn nhân lực. Dù có máy móc, thiết bị, nhưng chúng trở nên vô dụng nếu thiếu sự can thiệp của con người. Nguồn nhân lực đóng vai trò trung tâm và quan trọng nhất trong phát triển kinh tế-xã hội của đất nước, đặc biệt trong giai đoạn đẩy mạnh công nghiệp hóa, hiện đại hóa và hội nhập kinh tế quốc tế. Tuyển dụng tốt sẽ tạo đội ngũ nhân lực phù hợp với công việc và vị trí, từ đó nâng cao hiệu quả công việc và chất lượng nguồn nhân lực của doanh nghiệp. Đồng thời giúp tiết kiệm được chi phí đào tạo nhân lực, tránh tình trạng ứng viên khai gian dối độ tuổi lao động gây ra vi phạm luật lao động hiện hành dẫn tới phải liên tục tuyển dụng nhân sự mới, doanh nghiệp lại phải tốn chi phí và thời gian cho công tác tuyển dụng lại nhân sự. Tuyển dụng, là một trong những lĩnh vực quan trọng của xã hội đang dần được cải tiến và nâng cao hiệu quả bằng các công nghệ mới. Ngày nay có nhiều hệ thống hỗ trợ trong công tác tuyển dụng nhân sự phổ biến ở nước ta như: Base E-hiring, Talent Solution, Zoho Recruit, Greenhouse, Workable…Nhưng đa phần các hệ thống này chỉ tập trung vào quản lý ứng viên, đăng tin tuyển dụng, lập báo cáo. Bằng cách áp dụng các kỹ thuật của trí tuệ nhân tạo kết hợp với mạng CNN đề án đã áp dụng các giải pháp này để hướng đến xây dựng hệ thống hỗ trợ công tác tuyển dụng thông qua dự đoán độ tuổi và giới tính từ đó đưa ra nhận định ứng viên có phù hợp theo độ tuổi lao động hiện hành [3] giúp nhà tuyển dụng tránh được sự khai man của các ứng viên. Kết quả của quá trình này đó là đề án đã xây dựng được một ứng dụng hỗ trợ công tác tuyển dụng. Kết quả trả về bao gồm kết quả chính xác và các kết quả liên quan. Ứng dụng đã được cài đặt, thử nghiệm tại phòng nhân sự VNPT Tây Ninh giúp cho quá trình tuyển dụng trở nên hiệu quả hơn.
  13. 2 Kết quả của đề án được trình bày trong các phần như mở bài, mục lục, kết luận và kiến nghị, danh mục hình vẽ, danh mục bảng biểu, tài liệu tham khảo, phụ lục, và phần chính của đề án bao gồm 4 chương như sau:  Chương 1 Đề án giới thiệu các thông tin về nghiên cứu liên quan, phân tích và đánh giá thực trạng, trình bày mục tiêu và giới hạn của đề án, cung cấp ý nghĩa lý luận và thực tiễn, trình bày phương pháp nghiên cứu, hướng tiếp cận giải quyết vấn đề, và mô tả nội dung thực hiện của đề án.  Chương 2 Trình bày cơ sở lý thuyết liên quan đến vấn đề học sâu và thị giác máy tính, bao gồm các lý thuyết về mô hình mạng nơ ron tích chập (CNN) cùng với các phương pháp xây dựng mô hình dữ liệu.  Chương 3 Trình bày tổng quan về bài toán dự đoán độ tuổi và giới tính bằng phương pháp học sâu. Giới thiệu về hệ thống và một số phương pháp tiếp cận.  Chương 4 Cài đặt thử nghiệm và đánh giá. Thực hiện mô hình mạng nơ ron tích chập CNN, xây dựng ứng dụng hỗ trợ tuyển dụng. Tiến hành thực nghiệm, so sánh và đánh giá kết quả.
  14. 3 CHƯƠNG 1 - TỔNG QUAN 1.1 Lý do chọn đề án Lĩnh vực quản lý nhân sự được coi là một trong những lĩnh vực quan trọng nhất đối với mọi doanh nghiệp. Một trong những nhiệm vụ quan trọng nhất của nhà quản lý nhân sự là tuyển dụng và chọn lọc những ứng viên sao cho phù hợp với các công việc cụ thể. Để đảm bảo tính hiệu quả của quá trình tuyển dụng, nhà quản lý nhân sự cần phải đưa ra những quyết định đúng đắn và nhanh chóng dựa trên những thông tin chính xác và đầy đủ về ứng viên. Với sự vận động, phát triển mạnh mẽ của lĩnh vực tuyển dụng ở Việt Nam, việc sử dụng phương pháp học sâu để dự đoán độ tuổi và giới tính của ứng viên đang trở thành xu hướng mới nhằm giúp cho quá trình tuyển dụng trở nên hiệu quả và chính xác hơn bao giờ hết. Bằng cách áp dụng các kỹ thuật của trí tuệ nhân tạo giúp dự đoán độ tuổi và giới tính với độ chính xác cao trong việc xác định các ứng viên phù hợp nhất với yêu cầu, tính chất của công việc, tránh tình trạng khai man khi dự tuyển. Hình ảnh khuôn mặt mang rất nhiều thông tin quan trọng như: tuổi tác, giới tính, trạng thái cảm xúc, dân tộc…Trong đó, việc xác định tuổi tác và giới tính là hết sức quan trọng, như trong giao tiếp, cần sử dụng những từ ngữ phù hợp với giới tính của người nghe ví dụ trong tiếng Việt có: anh/chị, cô/chú…[2] Ngoài ra nó còn được áp dụng vào nhiều lĩnh vực khác nhau như vào lĩnh vực tuyển dụng ta vừa đề cập ở trên. Do đó, việc xác định tuổi và giới tính dựa trên khuôn mặt là một bài toán hết sức quan trọng, có ý nghĩa thực tế to lớn. Có nhiều nghiên cứu, giải pháp đã đề xuất cho bài toán dự đoán tuổi và giới tính trong những năm trước đây. Hầu hết dựa vào phương pháp truyền thống, trích xuất đặc trưng bằng tay sau đó đưa vào bài toán phân lớp. Các nghiên cứu gần đây đã cho thấy
  15. 4 kết quả khá tốt, tuy nhiên, trong vấn đề nhận diện thời gian thực, các mô hình này vẫn chưa đạt hiệu quả cao do thiết kế quá phức tạp [2]. Hiện nay với sự phát triển của mạng học sâu, thì bài toán dự đoán tuổi và giới tính cho những kết quả vượt bậc trong các bài toán điển hình [2] và thực hiện end-to- end ít cần sự trích xuất đặc trưng bằng tay. Một mô hình mới đã được đề xuất bởi Alex và nhóm nghiên cứu của họ [4]. Mô hình này sử dụng mạng CNN và đã đạt thành công đáng kinh ngạc khi giành chiến thắng trong cuộc thi ImageNet năm 2012. Cuộc thi này được coi là sự kiện quy mô lớn nhất trên thế giới trong lĩnh vực nhận diện đối tượng trong ảnh. Từ thực tiễn trên, tôi thực hiện một nghiên cứu, ứng dụng phương pháp học sâu trong dự đoán độ tuổi và giới tính. Nghiên cứu của tôi đã tập trung vào việc xây dựng một mô hình dự đoán tuổi và giới tính từ những hình ảnh trên chiếc CV của các ứng cử viên từ đó hệ thống phân tích và dự đoán một cách nhanh chóng và chính xác để đáp ứng các nhu cầu hiện hữu thông qua phương pháp “dự đoán tuổi và giới tính bằng phương pháp học sâu” đó là lý do tôi chọn thực hiện đề án này. 1.2 Tổng quan vấn đề nghiên cứu Tổng quan Với nhu cầu tuyển dụng ngày càng tăng, đặc biệt là trong các doanh nghiệp lớn, việc xác định độ tuổi và giới tính của ứng viên là điều rất quan trọng, tránh được các rủi ro cần thiết như khai man độ tuổi lao động, hỗ trợ nhà tuyển dụng lọc các ứng viên nhanh chóng. Tuy nhiên, quá trình này thường đòi hỏi sự nhận định và khả năng đánh giá của nhà tuyển dụng, và có thể dẫn đến sai sót. Vì vậy, việc áp dụng phương pháp học sâu vào việc dự đoán tuổi và giới tính của ứng viên và đưa ra đánh giá có thể giúp cho quá trình tuyển dụng trở nên chính xác và hiệu quả hơn.
  16. 5 Mục tiêu của nghiên cứu này là xây dựng một mô hình học sâu để dự đoán tuổi và giới tính của ứng viên trong quá trình tuyển dụng. Bằng cách sử dụng các thuật toán học sâu như mạng nơ ron tích chập (CNN) nghiên cứu này mong muốn đem lại kết quả chính xác và đáng tin cậy. Hiện nay có nhiều giải pháp liên quan đến nghiên cứu của đề án, nhiều nghiên cứu trên thế giới và Việt Nam đã quan tâm đến vấn đề nhận dạng độ tuổi và giới tính con người đã được nghiên cứu từ rất lâu, hầu như chúng chỉ nghiên cứu tách rời nhau. Việc xây dựng hệ thống dự đoán tuổi và giới tính trong bối cảnh Việt Nam có ý nghĩa quan trọng từ cả mặt lý thuyết và thực tiễn. Các công trình nghiên cứu liên quan - Năm 2012, Alex Krizhevsky, Ilya Sutskever và Geoffrey Hinton với công trình nghiên cứu “Phân loại ImageNet bằng mạng nơ ron tích chập sâu” [4] được coi là một công trình đầy tầm quan trọng trong lĩnh vực Deep learning. Các tác giả đề xuất một kiến trúc mạng nơ ron sâu được gọi là AlexNet, đạt được thành công đột phá đáng kể trong cuộc thi “ImageNet Large Scale Visual Recognition Challenge” năm 2012. Kiến trúc AlexNet đạt được tỷ lệ lỗi là 15,3%, vượt qua phương pháp tốt nhất thứ hai một khoảng cách hơn 10%. Các đóng góp của bài báo bao gồm việc phát triển kiến trúc AlexNet, sử dụng một số kỹ thuật đổi mới như hàm kích hoạt ReLU, chuẩn hóa đáp ứng cục bộ, chế độ giảm thiểu và tăng lượng dữ liệu để cải thiện hiệu suất mạng, mở đường cho việc áp dụng rộng rãi deep learning trong các ứng dụng thị giác máy tính. - Năm 2016, Linnan Zhu cùng các cộng sự đã công bố công trình nghiên cứu “Học một mạng tích chập sâu nhẹ cho nhận dạng đồng thời tuổi và giới tính” [5] đề xuất một mô hình đa nhiệm vụ giải quyết cả hai bài toán cùng một lúc. Bài báo đề cập đến vấn đề nhận dạng đồng thời tuổi và giới tính của một
  17. 6 người từ một hình ảnh đã cho. Các tác giả đề xuất một kiến trúc mạng tích chập sâu nhẹ được thiết kế để đạt độ chính xác cao trong khi giảm thiểu độ phức tạp tính toán. Các tác giả đánh giá mạng được đề xuất trên hai bộ dữ liệu công khai: bộ dữ liệu Adience và bộ dữ liệu FG-NET. Kết quả cho thấy rằng mạng được đề xuất vượt qua các phương pháp tiên tiến hiện có về độ chính xác và hiệu suất tính toán. 1.3 Mục tiêu nghiên cứu Mục tiêu tổng quát Nghiên cứu này nhằm mục đích áp dụng phương pháp học sâu của mạng nơ ron tích chập CNN để dự đoán tuổi và giới tính. Từ các kết quả tìm hiểu về cơ sở lý thuyết, thực hiện phát triển thành ứng dụng hỗ trợ công tác tuyển dụng với các chức năng hỗ trợ cho các đối tượng là nhà tuyển dụng. Hệ thống cần phải đáp ứng được các yêu cầu về hỗ trợ như: Xác định được giới tính ứng viên, xác định độ tuổi lao động của ứng viên và đưa ra kết luận dự đoán cho từng ứng viên. Đóng góp vào việc cải thiện quá trình tuyển dụng, trở nên nhanh chóng và chính xác hơn. Mục tiêu cụ thể Đề án này tập trung nghiên cứu các lý thuyết cơ bản liên quan đến xử lý ảnh, nhận dạng và dự đoán. Nghiên cứu các lý thuyết liên quan bài toán xác độ tuổi và giới tính các khuôn mặt trong ảnh để giải quyết các lớp vấn đề liên quan, bao gồm: - Tổng quan về phương pháp học sâu và ứng dụng của nó trong việc dự đoán tuổi và giới tính.
  18. 7  Tìm hiểu và phân tích các khái niệm và thành phần cơ bản của phương pháp học sâu.  Tham khảo các nghiên cứu liên quan đến phương pháp học sâu trong việc dự đoán tuổi và giới tính.  Xác định cách thức áp dụng mạng nơ ron tích chập vào việc dự đoán tuổi và giới tính trong lĩnh vực tuyển dụng. - Xây dựng mô hình dự đoán tuổi và giới tính sử dụng phương pháp học sâu.  Thu thập dữ liệu từ bộ dữ liệu công khai Adience Dataset.  Tiền xử lý dữ liệu: lựa chọn, chuyển đổi, chuẩn hóa tập huấn luyện.  Thiết kế và triển khai mô hình mạng nơ ron tích chập để dự đoán tuổi và giới tính.  Đánh giá hiệu suất của mô hình bằng các chỉ số như độ chính xác, xác suất. - Đánh giá hiệu quả của phương pháp CNN trong việc dự đoán tuổi và giới tính trong lĩnh vực tuyển dụng.  Đánh giá khả năng áp dụng thực tế của phương pháp CNN trong quá trình tuyển dụng và quy mô mở rộng.  Đề xuất những cải tiến và phát triển tiếp theo cho phương pháp CNN trong việc dự đoán tuổi và giới tính trong lĩnh vực tuyển dụng. 1.4 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu - Các phương pháp và các kỹ thuật của học sâu, thị giác máy tính. - Các phương pháp xử lý hình ảnh.
  19. 8 - Các phương pháp nhận dạng tuổi và giới tính. - Phân tích thiết kế và xây dựng chức năng của ứng dụng của hệ thống hỗ trợ tuyển dụng. Phạm vi nghiên cứu - Mô hình kiến trúc mạng nơ ron tích chập (CNN). - Phương pháp nhận dạng giới tính:  Giới tính nam.  Giới tính nữ. - Để nhận dạng giới tính thông qua bức ảnh, có thể sử dụng các đặc trưng sau đây để đạt được hiệu suất tốt hơn như sau:  Kích thước khuôn mặt: Ví dụ khuông mặt giới tính nam sẽ thường to hơn so với giới tính nữ.  Đặc trưng khuôn mặt: Một số đặc trưng có thể trích xuất từ khuôn mặt như đặc điểm của mắt, mũi, miệng, vùng trán.... Điều này có thể cung cấp thông tin quan trọng để phân biệt giữa các đặc điểm giới tính. Ví dụ miệng của giới tính nam thường sẽ to hơn so với nữ.  Các đặc điểm hình học: Các đặc điểm hình học như hình dáng khuôn mặt (hình vuông hoặc tròn), tỷ lệ giữa các phần của khuôn mặt có thể có ý nghĩa trong việc nhận dạng giới tính.  Kiểu tóc: Kiểu tóc thường khác biệt giữa nam và nữ. Thông qua đặc trưng như độ dài, kiểu tóc.  Chi tiết vùng mắt: vùng mắt có thể cung cấp nhiều thông tin về giới tính.
  20. 9 - Phương pháp xác định đối tượng trong các nhóm độ tuổi được chia cố định:  Từ 0 tuổi đến 14 tuổi.  Từ 15 tuổi đến 45 tuổi.  Lớn hơn 65 tuổi. - Có thể sử dụng các đặc trưng sau đây để đạt được hiệu suất tốt hơn đối với nhận dạng độ tuổi như sau:  Nếp nhăn và đặc điểm khuôn mặt: Những nếp nhăn, vết chân chim và các đặc điểm khuôn mặt khác có thể chứa thông tin về độ tuổi của người.  Sắc tố da và tóc: Sự thay đổi của màu da và tóc thường đi kèm với tuổi tác  Nám và tàn nhang: Những dấu hiệu của tuổi tác như nám, tàn nhang.  Kiểu tóc và màu tóc: Kiểu tóc và màu tóc cũng có thể thay đổi theo độ tuổi. Chẳng hạn, sự xuất hiện của sợi tóc bạc thường đi kèm với tuổi tác cao hơn.  Biểu cảm khuôn mặt: Những biểu cảm khuôn mặt cũng có thể thay đổi theo độ tuổi.  Kích thước mắt, miệng: Kích thước của các phần trên khuôn mặt cũng có thể thay đổi theo độ tuổi. 1.5 Phương pháp nghiên cứu Đề án kết hợp việc sử dụng phương pháp nghiên cứu lý thuyết và xây dựng ứng dụng thực nghiệm. - Nghiên cứu lý thuyết:  Tìm hiểu về học sâu, tìm hiểu về thị giác máy tính, trí tuệ nhân tạo.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2