Một giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt

Chia sẻ: Hoang Son | Ngày: | Loại File: PDF | Số trang:6

0
10
lượt xem
1
download

Một giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong bài báo này, chúng tôi đề xuất việc sử dụng phương pháp phát hiện khuôn mặt từ ảnh để đếm số sinh viên dự lớp. Chúng tôi đã thực nghiệm việc áp dụng phương pháp phát hiện khuôn mặt của Viola-Jones trong môi trường lớp học từ đó phân tích, đánh giá khả năng áp dụng trên thực tế. Kết quả thực nghiệm, phân tích cho thấy giải pháp chúng tôi đề xuất là khả thi, đúng hướng.

Chủ đề:
Lưu

Nội dung Text: Một giải pháp mới cho bài toán thống kê số lượng sinh viên dự lớp sử dụng phương pháp phát hiện khuôn mặt

Nguyễn Thị Thanh Tâm và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> 99(11): 103 - 108<br /> <br /> MỘT GIẢI PHÁP MỚI CHO BÀI TOÁN THỐNG KÊ SỐ LƯỢNG SINH VIÊN<br /> DỰ LỚP SỬ DỤNG PHƯƠNG PHÁP PHÁT HIỆN KHUÔN MẶT<br /> Nguyễn Thị Thanh Tâm*, Nguyễn Văn Tới,<br /> Nguyễn Thị Tính, Lê Thu Trang<br /> Trường Đại học Công nghệ thông tin và Truyền thông – ĐH Thái Nguyên<br /> <br /> TÓM TẮT<br /> Thống kê số lượng sinh viên dự lớp là một nhu cầu thực tế đặt ra tại các trường đại học. Hiện nay,<br /> phương pháp thu thập số liệu một cách độc lập về số lượng sinh viên dự lớp vẫn được thực hiện<br /> thủ công bằng cách đếm trực tiếp tại lớp học. Đây là công việc tốn thời gian và gây phiền toái, ảnh<br /> hưởng đến giờ học nên việc thu thập dữ liệu một cách độc lập vẫn chưa được thực hiện thường<br /> xuyên. Trong bài báo này, chúng tôi đề xuất việc sử dụng phương pháp phát hiện khuôn mặt từ<br /> ảnh để đếm số sinh viên dự lớp. Chúng tôi đã thực nghiệm việc áp dụng phương pháp phát hiện<br /> khuôn mặt của Viola-Jones trong môi trường lớp học từ đó phân tích, đánh giá khả năng áp dụng trên<br /> thực tế. Kết quả thực nghiệm, phân tích cho thấy giải pháp chúng tôi đề xuất là khả thi, đúng hướng.<br /> Từ khóa: bài toán thống kê, phương pháp phát hiện khuôn mặt, Viola-Jones<br /> <br /> GIỚI THIỆU*<br /> Hầu hết các trường đại học đều có nhu cầu<br /> thống kê, phân tích số lượng sinh viên dự lớp.<br /> Số liệu này giúp các bộ phận quản lý nắm<br /> được tình hình tham gia học tập của sinh viên<br /> từng lớp, mức độ hấp dẫn của bài giảng và<br /> nhiều khía cạnh khác.<br /> Hiện nay việc thu thập dữ liệu về số lượng<br /> sinh viên dự lớp một cách độc lập, với mật độ<br /> đủ lớn hầu như vẫn chưa được thực hiện bởi<br /> vì những khó khăn, phiền phức. Với cách làm<br /> hiện tại, việc thu thập dữ liệu thường được<br /> thực hiện bởi các nhân viên bằng cách đi đến<br /> đếm trực tiếp tại các lớp vào giờ học. Cách<br /> làm này tốn công sức, nhân lực đồng thời gây<br /> gián đoạn, ảnh hưởng đến giờ học. Việc đếm<br /> trực tiếp trong hoàn cảnh phải nhanh chóng<br /> để đỡ ảnh hưởng đến lớp học cũng dẫn đến<br /> sai sót. Vì vậy, chúng tôi đề xuất một giải<br /> pháp mới cho việc thu thập dữ liệu đó là sử<br /> dụng máy ảnh hoặc camera kỹ thuật số để thu<br /> ảnh lớp học rồi sử dụng hệ thống tự động phát<br /> hiện khuôn mặt để hỗ trợ việc thu thập số liệu<br /> một cách nhanh chóng và chính xác.<br /> Trong những năm gần đây, phát hiện và nhận<br /> dạng khuôn mặt là chủ đề nghiên cứu thu hút<br /> sự quan tâm của nhiều nhà khoa học cả trên<br /> khía cạnh nghiên cứu phương pháp cơ bản<br /> cũng như các nghiên cứu ứng dụng. Đã có<br /> *<br /> <br /> Tel: 0973 002640, Email: ntttam@ictu.edu.vn<br /> <br /> nhiều phương pháp phát hiện, nhận dạng<br /> khuôn mặt được nghiên cứu và đề xuất [1].<br /> Trong đó, phương pháp Viola-Jones [2] được<br /> đánh giá là phương pháp tốt và được sử dụng<br /> rộng rãi hiện nay [3]. Theo thống kê và xếp<br /> hạng của Microsoft Academic Search [4], bài<br /> báo đầu tiên trình bày phương pháp ViolaJones [5] được trích dẫn 3279 lượt (số liệu<br /> ngày 10/11/2012) và số lượng trích dẫn vẫn<br /> đang liên tục tăng. Bài báo này xếp thứ mười<br /> về số lượng trích dẫn trong lĩnh vực thị giác<br /> máy tính, đứng thứ nhất trong bài toán phát<br /> hiện khuôn mặt và phát hiện đối tượng. Các<br /> bài báo khác về phương pháp này [6][2] đều<br /> có hàng nghìn lượt trích dẫn. Điều đó chứng<br /> tỏ phương pháp Viola-Jones ngày càng được<br /> đánh giá cao và sử dụng rộng rãi. Ở bài báo<br /> này, chúng tôi nghiên cứu áp dụng phương<br /> pháp Viola-Jones trong việc đếm số lượng<br /> sinh viên dự lớp.<br /> Những đóng góp của chúng tôi trình bày<br /> trong bài báo này bao gồm:<br /> - Đề xuất giải pháp mới cho bài toán thống kê<br /> số lượng sinh viên dự lớp sử dụng phương<br /> pháp phát hiện khuôn mặt;<br /> - Đánh giá hiệu quả của phương pháp ViolaJones trong môi trường lớp học thông qua<br /> thực nghiệm từ đó đưa ra kết luận về tính khả<br /> thi và hiệu quả của giải pháp đã đề xuất.<br /> Phần còn lại của bài báo được trình bày theo<br /> cấu trúc như sau: Phần 2 trình bày giải pháp<br /> 103<br /> <br /> Nguyễn Thị Thanh Tâm và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> giải quyết bài toán thống kê số lượng sinh<br /> viên dự lớp sử dụng phương pháp phát hiện<br /> khuôn mặt. Phần 3 giới thiệu sơ lược phương<br /> pháp Viola-Jones mà chúng tôi sử dụng. Phần<br /> 4 trình bày kết quả thực nghiệm và những<br /> phân tích kết luận của chúng tôi khi áp dụng<br /> phương pháp Viola-Jones trong môi trường<br /> lớp học. Kết luận và hướng nghiên cứu tiếp<br /> theo được trình bày trong phần 5.<br /> ĐỀ XUẤT GIẢI PHÁP GIẢI QUYẾT BÀI<br /> TOÁN THỐNG KÊ SỐ LƯỢNG SINH<br /> VIÊN DỰ LỚP<br /> Hình 1 là sơ đồ mô tả giải pháp mà chúng tôi<br /> đề xuất. Dưới đây là mô tả chi tiết từng bước<br /> trong sơ đồ:<br /> Thu thập ảnh dữ liệu lớp học: Thay vì trực<br /> tiếp đếm số lượng sinh viên trên lớp như cách<br /> làm truyền thống, chúng tôi đề xuất hai<br /> cách làm tùy theo điều kiện cơ sở vật chất<br /> nơi áp dụng.<br /> Cách 1: Nhân viên thu thập dữ liệu sử dụng<br /> máy ảnh kỹ thuật số để chụp ảnh lớp học. Với<br /> công nghệ hiện nay, có những loại máy ảnh<br /> có góc chụp rộng cho phép thu được ảnh chứa<br /> toàn bộ sinh viên từ cửa lớp. Dữ liệu ảnh thu<br /> được là đầu vào cho bước tự động phát hiện<br /> khuôn mặt và hiệu chỉnh kết quả. Ưu điểm<br /> của cách làm này so với cách làm truyền<br /> thống là không làm mất nhiều thời gian, hạn<br /> chế đến mức thấp nhất làm gián đoạn việc<br /> dạy và học.<br /> Cách 2: Sử dụng hệ thống camera gắn tại các<br /> phòng học. Việc sử dụng camera để thu thập<br /> ảnh dữ liệu sẽ mang lại hiệu quả cao hơn. Dữ<br /> liệu ảnh được thu nhận tức thời tại thời điểm<br /> mong muốn trong khi các tiết học đang diễn<br /> ra thông qua hệ thống mạng. Cách làm này<br /> không làm ảnh hưởng đến giờ học. Trong<br /> trường hợp này, cần trang bị hệ thống camera<br /> nhưng bù lại không cần nhân viên đi chụp ảnh.<br /> Xử lý phát hiện khuôn mặt: Sau khi đã có dữ<br /> liệu ảnh lớp học, hệ thống sẽ nhận ảnh đầu<br /> vào và tự động phát hiện khuôn mặt. Bước<br /> này được thực hiện bởi một chức năng trong<br /> chương trình phần mềm sẽ được xây dựng.<br /> Kết quả ảnh đầu ra được hiển thị với các vùng<br /> được đánh dấu được cho là khuôn mặt (có thể<br /> đúng hoạc sai). Như đã phân tích trong phần<br /> 1, chúng tôi đề xuất sử dụng phương pháp<br /> Viola-Jones cho chức năng này.<br /> 104<br /> <br /> 99(11): 103 - 108<br /> <br /> Hình 1. Mô hình hoạt động của hệ thống thống kê<br /> số lượng sinh viên dự lớp sử dụng phương pháp<br /> phát hiện khuôn mặt<br /> <br /> Hiệu chỉnh kết quả phát hiện khuôn mặt: Ảnh<br /> đầu vào thu nhận trong môi trường thực tế có<br /> nhiều yếu tố phức tạp như tư thế ngồi của<br /> sinh viên khác nhau (hướng của khuôn mặt,<br /> người trước ngồi lấp mặt ngườisau...). Chức<br /> năng tự động phát hiện khuôn mặt có thể thực<br /> hiện không chính xác, nhầm hoặc bỏ sót. Hiện<br /> nay, chưa có phương pháp phát hiện khuôn<br /> mặt được đúng 100%. Chức năng hiệu chỉnh<br /> kết quả tự động phát hiện khuôn mặt được<br /> thực hiện bởi người quản lý chương trình một<br /> cách dễ dàng, nhanh chóng với các thao tác<br /> click chọn trên ảnh.<br /> Lưu trữ số lượng sinh viên dự lớp: Sau khi<br /> người quản lý hiệu chỉnh lại kết quả của việc<br /> phát hiện khuôn mặt để thu được kết quả<br /> chính xác, số liệu này được tổ chức lưu trữ<br /> trong cơ sở dữ liệu được thiết kế hợp lý và có<br /> thể phối hợp với các hệ thống khác liên quan.<br /> Những vị trí khuôn mặt trên ảnh cũng được<br /> lưu trữ. Tất cả các thông tin có thể được hiển<br /> thị, hiệu chỉnh, khai thác trong tương lai.<br /> Xử lý, phân tích, thống kê số lượng sinh viên<br /> dự lớp: Tùy theo nhu cầu, các chức năng<br /> thống kê, phân tích, báo cáo sẽ được trang bị<br /> trong chương trình. Đây là việc làm mang<br /> tính chuyên môn phục vụ cho tùy từng mục<br /> <br /> Nguyễn Thị Thanh Tâm và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> đích của việc thống kê số lượng học sinh, sinh<br /> viên. Ngoài ra, các kết quả, số liệu có thể được<br /> sử dụng ở nhiều công việc khác tiếp theo.<br /> PHƯƠNG PHÁP VIOLA -JONES<br /> Năm 2001, Paul Viola và cộng sự công bố<br /> một phương pháp phát hiện đối tượng theo<br /> hướng tiếp cận học máy sử dụng Boosted<br /> Cascade của các đặc trưng Haar-like [5].<br /> Phương pháp ban đầu nhằm mục đích giải<br /> quyết bài toán phát hiện khuôn mặt. Phương<br /> pháp này kết hợp nhiều bộ phân lớp trong một<br /> cấu trúc Cascade, Hình 2. Mỗi nút của cấu<br /> trúc Cascade là một bộ phân lớp. Ở đây, bộ<br /> phân lớp thực hiện phân một đối tượng vào<br /> một trong hai lớp: là khuôn mặt hoặc không là<br /> khuôn mặt.<br /> <br /> 99(11): 103 - 108<br /> <br /> là hơn 180.000. Tuy nhiên, giá trị các đặc<br /> trưng Haar-like được tính toán rất nhanh và<br /> thời gian tính là bằng nhau cho mỗi giá trị<br /> bằng cách sử dụng Integral Image.<br /> <br /> Hình 3. Các kiểu đặc trưng Haar-like, [5]. (A)<br /> Kiểu đặc trưng Two-rectangle (cấu tạo bởi hai<br /> vùng hình chữ nhật); (B) và (C) là hai kiểu đặc<br /> trưng Three-rectangle; (D) Kiểu đặc trưng Fourrectangle.<br /> <br /> Hình 2.Cấu trúc Cascade,[5].<br /> <br /> Quá trình phát hiện khuôn mặt trên một ảnh<br /> đầu vào sẽ diễn ra như sau: tất cả các vùng<br /> hình chữ nhật (Sub-Window) ở tất cả các vị<br /> trí và với tất cả các kích thước được xem xét.<br /> Với một Sub-Window, nó được đưa vào nút<br /> đầu tiên của Cascade, nếu nút này xác định<br /> Sub-Window là khuôn mặt thì nó được đưa<br /> qua nút tiếp theo, nếu không thì kết luận SubWindow này không phải là khuôn mặt. Một<br /> Sub-Window được kết luận là khuôn mặt nếu<br /> được lần lượt chấp nhận ở tất cả các nút. Các<br /> bộ phân lớp ứng với các nút của Cascade sử<br /> dụng đặc trưng Haar-like, Hình 3.<br /> Giá trị đặc trưng Haar-like là chênh lệch giữa<br /> tổng giá trị điểm ảnh thuộc vùng trắng và<br /> tổng giá trị điểm ảnh thuộc vùng xám. Một<br /> đặc trưng Haar-like của một ảnh được xác<br /> định bởi kiểu đặc trưng, kích thước và vị trí<br /> trên ảnh. Tổng số đặc trưng của ảnh là rất lớn,<br /> lớn hơn nhiều so với số lượng điểm ảnh. Ví<br /> dụ, với ảnh kích thước 24x24 thì số đặc trưng<br /> <br /> Hình 4.Ví dụ đặc trưng Haar-like của ảnh khuôn<br /> mặt. Đây là những đặc trưng đầu tiên được chọn<br /> trong quá trình huấn luyện, [5].<br /> <br /> Hình 4 là ví dụ đặc trưng Haar-like trên vùng<br /> ảnh khuôn mặt (Sub-Window). Đã có nhiều<br /> nghiên cứu mở rộng, cải tiến tập đặc trưng<br /> Haar-like. Lienhart và cộng sự đưa ra tập đặc<br /> trưng Haar-like mở rộng [7] với 14 loại đặc<br /> trưng bằng cách thêm vào các đặc trưng xoay<br /> 45o, Hình 4. Chúng tôi sử dụng tập đặc trưng<br /> mở rộng này.<br /> Mỗi bộ phân lớp ứng với mỗi nút trong cấu<br /> trúc Cascade được tạo ra bởi quá trình huấn<br /> luyện sử dụng thuật toán AdaBoost [8]. Thuật<br /> toán AdaBoost thực hiện T lần lặp để chọn ra<br /> T bộ phân loại yếu rồi kết hợp lại thành một<br /> bộ phân loại mạnh. Thuật toán AdaBoost<br /> được sử dụng vừa để chọn bộ phân loại yếu<br /> 105<br /> <br /> Nguyễn Thị Thanh Tâm và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> tốt nhất tại mỗi lần lặp (cũng chính là chọn<br /> đặc trưng Haar-like) đồng thời huấn luyện bộ<br /> phân loại mạnh. Quá trình huấn luyện cũng<br /> đồng thời huấn luyện cấu trúc Cascade.<br /> (a) Các đặc trưng cạnh:<br /> <br /> (b) Các đặc trưng đường:<br /> <br /> (c) Các đặc trưng bao quanh tâm:<br /> <br /> Hình 4. Tập đặc trưng Haar-like mở rộng, [7].<br /> <br /> KHẢO SÁT THỰC NGHIỆM ĐÁNH GIÁ<br /> HIỆU QUẢ CỦA HỆ THỐNG ĐỀ XUẤT<br /> Để đánh giá tính khả thi và hiệu quả dự kiến<br /> của giải pháp đã trình bày ở phần 3, chúng tôi<br /> tiến hành thử nghiệm phương pháp ViolaJones trong môi trường lớp học. Hiệu quả của<br /> phương pháp phát hiện khuôn mặt càng cao<br /> thì hiệu quả của giải pháp đã đề xuất càng<br /> cao. Việc thử nghiệm được tiến hành trong<br /> môi trường lớp học tại Trường Đại học Công<br /> nghệ thông tin và Truyền thông – Đại học<br /> Thái Nguyên.<br /> Mô tả thử nghiệm<br /> Để có được tập ảnh phục vụ việc thử nghiệm<br /> phát hiện khuôn mặt, chúng tôi tiến hành<br /> bằng cách đến từng lớp học chụp ảnh học<br /> sinh, sinh viên trong giờ học. Trường Đại học<br /> Công nghệ thông tin và truyền thông hiện nay<br /> có tất cả 4 giảng đường với 31 phòng học<br /> phục vụ cho việc học tập trên lớp đó là: C2,<br /> C3, C4, và KT (Ký túc). Trong điều kiện cho<br /> phép của nhóm nghiên cứu chúng tôi sử dụng<br /> máy ảnh Canon PowerShot A580, độ phân<br /> giải 8.0 Megapixels, kích thước ảnh thu nhận<br /> 3264x2448 pixels. Việc thử nghiệm với loại<br /> máy ảnh có cấu hình và chất lượng thấp như<br /> thế này nếu cho kết quả khả thi thì khi áp<br /> 106<br /> <br /> 99(11): 103 - 108<br /> <br /> dụng với máy ảnh và camera tốt hơn sẽ còn<br /> cho kết quả tốt hơn.<br /> Chúng tôi thu thập ảnh lớp học ở tất cả các<br /> điều kiện môi trường khác nhau xuất hiện<br /> trong trường. Tại mỗi phòng học, chúng tôi<br /> chụp nhiều lần tại các thời điểm khác nhau<br /> với điều kiện ánh sáng khác nhau, trạng thái<br /> sinh viên trong lớp khác nhau. Dữ liệu được<br /> thu tại tất cả các giảng đường. Ở mỗi giảng<br /> đường, chúng tôi thu dữ liệu ở các phòng học<br /> ở mỗi tầng có điều kiện môi trường khác nhau<br /> (số lượng bóng đèn chiếu sáng, vị trí bố trí<br /> các bóng đèn chiếu sáng, khung cảnh bên<br /> ngoài phòng học ảnh hưởng đến ánh sáng<br /> trong phòng...). Việc lấy dữ liệu ở tất cả các<br /> giảng đường, phòng học với tất cả các môi<br /> trường khác nhau nhằm đảm bảo độ tin cậy<br /> của kết quả thực nghiệm và các phân tích, kết<br /> luận. Tổng số ảnh thu được là 219 với 4600<br /> lượt sinh viên xuất hiện.<br /> Với bộ ảnh thu thập được tại các lớp học,<br /> chúng tôi xây dựng chương trình thử nghiệm<br /> dựa trên bộ thư viện mã nguồn mở OpenCV<br /> 2.0 để phát hiện khuôn mặt. Các bộ phát hiện<br /> đã được huấn luyện kèm theo thư viện<br /> OpenCV 2.0 được sử dụng. Chúng tôi xây<br /> dựng công cụ hỗ trợ đánh dấu thủ công những<br /> vị trí có khuôn mặt sinh viên trong ảnh để tạo<br /> dữ liệu ground truth phục vụ việc thử nghiệm.<br /> Tất cả dữ liệu và các công cụ do chúng tôi<br /> chuẩn bị có thể được tham khảo cho mục đích<br /> học tập, nghiên cứu. (Hãy gửi email yêu cầu<br /> cho tác giả số 1 khi cần: ntttam@ictu.edu.vn).<br /> Phương pháp đánh giá<br /> Để đánh giá hiệu quả của phương pháp ViolaJones trong môi trường lớp học cho việc phát<br /> hiện sinh viên thông qua phát hiện khuôn mặt,<br /> chúng tôi sử dụng độ đo Precision-Recall [9]<br /> được sử dụng rộng rãi trong lĩnh vực tra cứu<br /> thông tin (Information Retrival). Gọi NP là số<br /> lượt sinh viên thực tế xuất hiện trong cơ sở dữ<br /> liệu thử nghiệm, NT là số lượng khuôn mặt<br /> phát hiện đúng, NF là số lượng khuôn mặt<br /> phát hiện sai. Khi đó:<br /> <br /> Nguyễn Thị Thanh Tâm và Đtg<br /> <br /> Tạp chí KHOA HỌC & CÔNG NGHỆ<br /> <br /> Recall được gọi là độ thu hồi, là tỷ lệ giữa số<br /> lượng phát hiện đúng trên số lượng đối tượng<br /> thực tế có trong cơ sở dữ liệu thử nghiệm.<br /> Precision gọi là độ chính xác, là tỷ lệ giữa số<br /> lượng phát hiện đúng trên tổng số đối tượng<br /> do chương trình phát hiện ra. F là một độ đo<br /> phối hợp giữa Precision và Recall.<br /> Cùng với phương pháp đánh giá trên đây,<br /> chúng tôi đề xuất một phương pháp đánh giá<br /> mức độ hiệu quả của việc áp dụng bước tự<br /> động phát hiện khuôn mặt như sau:<br /> Ta gọi việc người sử dụng xác định bằng tay<br /> một đối tượng có phải là khuôn mặt (sinh<br /> viên) hay không là một “thao tác”. Như vậy,<br /> với hệ thống không áp dụng phương pháp<br /> phát hiện khuôn mặt tự động mà người dùng<br /> thực hiện xác định hoàn toàn bằng tay thì số<br /> thao tác là NP. Còn trong trường hợp sử dụng<br /> phương pháp phát hiện khuôn mặt rồi hiệu<br /> chỉnh thì số thao tác của người dùng ở bước<br /> hiệu chỉnh là NF + (NP-NT), tức là số thao<br /> tác để loại bỏ những phát hiện sai (NF) cộng<br /> với số thao tác để xác định thêm những đối<br /> tượng còn thiếu (NP-NT). Gọi H là hiệu quả<br /> của việc áp dụng bước phát hiện khuôn mặt,<br /> được tính là tỷ lệ giữa số thao tác giảm đi khi<br /> áp dụng bước phát hiện khuôn mặt so với số<br /> thao tác bình thường phải thực hiện khi không<br /> áp dụng.<br /> <br /> Kết quả thử nghiệm và nhận xét<br /> Bảng 1 trình bày kết quả đánh giá dưới dạng<br /> Precision-Recall của bước tự động phát hiện<br /> sinh viên thông qua phát hiện khuôn mặt.<br /> Bảng 2 trình bày kết quả đánh giá hiệu quả<br /> của bước này theo cách chúng tôi đề xuất<br /> trong phần 4.2.<br /> Trong thí nghiệm này, phương tiện và điều<br /> kiện thu nhận ảnh thử nghiệm chưa tốt (máy<br /> ảnh cấu hình thấp, chụp ở vị trí thấp dẫn đến<br /> nhiều sinh viên phía dưới bị che khuất mặt).<br /> <br /> 99(11): 103 - 108<br /> <br /> Hơn nữa, với mục tiêu đánh giá khách quan,<br /> ảnh được thu nhận trong môi trường thực tế<br /> nên nhiều khuôn mặt bị nghiêng, che khuất.<br /> Tuy nhiên bộ phát hiện khuôn mặt đã phát<br /> hiện khá tốt các khuôn mặt rõ, không bị che<br /> khuất. Trong các bảng số liệu trình bày ở trên,<br /> NP là số lượt sinh viên xuất hiện, kể cả những<br /> trường hợp bị che khuất. Chúng tôi sử dụng<br /> trên số liệu này với mục đích đánh giá hiệu<br /> quả của bộ phát hiện khuôn mặt tác động lên<br /> hệ thống thống kê số lượng sinh viên chứ<br /> không đánh giá hiệu quả phát hiện khuôn mặt<br /> trên tập khuôn mặt đầu vào. Kết quả cho thấy<br /> khi sử dụng bộ phát hiện khuôn mặt, công sức<br /> cần bỏ ra thực hiện bước xác định sinh viên<br /> trong ảnh giảm 38%. Nếu hệ thống thu nhận<br /> ảnh là camera gắn cố định ở vị trí cao, thuận<br /> lợi trong lớp thì số khuôn mặt bị che khuất sẽ<br /> ít, tỷ lệ tự động phát hiện sẽ cao hơn và mang<br /> lại hiệu quả tốt hơn.<br /> Bảng 1. Đánh giá dạng Precision-Recall bước<br /> phát hiện tự động<br /> Chỉ số<br /> Giá trị<br /> NP<br /> 4600<br /> NT<br /> 2466<br /> NF<br /> 737<br /> Recall<br /> 0.54<br /> Precision<br /> 0.77<br /> F-measure<br /> 0.63<br /> Bảng 2. Đánh giá hiệu quả bước phát hiện<br /> tự động.<br /> Chỉ số<br /> Giá trị<br /> Số thao tác khi không áp dụng bước<br /> 4600<br /> tự động phát hiện khuôn mặt<br /> Số thao tác giảm khi sau khi áp dụng<br /> 1729<br /> bước tự động phát hiện khuôn mặt<br /> H<br /> 38%<br /> <br /> Hơn nữa, ngay cả trong trường hợp không sử<br /> dụng phương pháp phát hiện khuôn mặt tự<br /> động mà thực hiện thủ công bằng cách người<br /> dùng chỉ ra trên ảnh dựa vào phần mềm với<br /> giao diện thân thiện thì đã tốt hơn cách truyền<br /> thống. Việc thu thập ảnh trên lớp nhanh hơn,<br /> giảm việc gây ảnh hưởng đến lớp. Phần mềm<br /> với giao diện thân thiện giúp thao tác dễ dàng,<br /> nhanh, chính xác. Hệ thống cũng mở ra nhiều<br /> khả năng phối hợp, khai thác thông tin trong<br /> toàn trường.<br /> 107<br /> <br />

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản