YOMEDIA
ADSENSE
Đánh giá hiệu năng máy vector hỗ trợ sử dụng hàm nhân radial basic trong hệ thống nhận dạng khuôn mặt sử dụng khối trích xuất PCA-LDA
30
lượt xem 2
download
lượt xem 2
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Bài viết trình bày phương pháp hiệu quả để nhận dạng khuôn mặt được trình bày để giải quyết tốt sự biến đổi về biểu cảm khuôn mặt, tư thế mặt, và điều kiện chiếu sáng. Phương pháp này được dựa trên sự kết hợp giữa Phân tích thành phần chính (PCA), Phân tích sự khác biệt tuyến tính (LDA) và máy vector hỗ trợ (SVM) sử dụng hàm Radial Basic (RBF). Mời các bạn cùng tham khảo!
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Đánh giá hiệu năng máy vector hỗ trợ sử dụng hàm nhân radial basic trong hệ thống nhận dạng khuôn mặt sử dụng khối trích xuất PCA-LDA
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Đánh Giá Hiệu Năng Máy Vector Hỗ Trợ Sử Dụng Hàm Nhân Radial Basic trong Hệ Thống Nhận Dạng Khuôn Mặt Sử Dụng Khối Trích Xuất PCA-LDA Phạm Văn Tuấn∗ , Hà Xuân Cường∗ , Hồ Đức Trung∗ ∗ Trung tâm Xuất Sắc Đại học Bách Khoa Đà Nẵng Đà Nẵng, Việt Nam Email: pvtuan@dut.udn.vn, haxuancuong187@gmail.com, trunghoduc_1992@yahoo.com.vn Tóm tắt—Trong bài báo này, một phương pháp hiệu quả Mặt khác, PCA và LDA là các phương pháp trích xuất để nhận dạng khuôn mặt được trình bày để giải quyết tốt thuộc tính cơ bản. Hai hướng tiếp cận này có thể giúp giảm sự biến đổi về biểu cảm khuôn mặt, tư thế mặt, và điều kiện bớt đáng kể khối lượng tính toán cho hệ thống nhận dạng, chiếu sáng. Phương pháp này được dựa trên sự kết hợp giữa từ đó rút ngắn thời gian hoạt động. Chỉ riêng PCA hoặc Phân tích thành phần chính (PCA), Phân tích sự khác biệt tuyến tính (LDA) và máy vector hỗ trợ (SVM) sử dụng hàm LDA cũng tạo ra hiệu năng tốt khi kết hợp với SVM [5], Radial Basic (RBF). Các thử nghiệm đã được tiến hành trên [6], [7]. tập cơ sở dữ liệu hình ảnh: Grimace, Sheffield, và Yale B mở rộng (Extended Yale B). Hiệu năng của phương pháp được đề xuất cũng được so sánh với ba phương pháp khác, đó là: PCA và RBF SVM, PCA và Linear SVM, PCA-LDA và Linear SVM. Kết quả đã chỉ ra rằng, phương pháp sử dụng PCA-LDA và RBF SVM cho kết quả nhận dạng cao Hình 1. Sơ đồ khối của hệ thống nhận dạng và đáng tin cậy đối với sự thay đổi về biểu cảm khuôn mặt, tư thế mặt, và điều kiện chiếu sáng. Từ khóa—Phân tích thành phần chính, Phân tích sự khác Trong bài báo này, một nghiên cứu đối sánh được thực biệt tuyến tính, Máy vector hỗ trợ, Hàm Radial Basic, Máy hiện để đánh giá hiệu năng của hệ thống nhận dạng sử vector hỗ trợ tuyến tính. dụng các phương pháp trích xuất thuộc tính cơ bản (PCA, LDA) cùng với SVM. Sau khi tiến hành việc so sánh, hệ I. ĐẶT VẤN ĐỀ thống tốt nhất được đề xuất. Hệ thống này phải có hiệu Nhận dạng khuôn mặt là một trong lĩnh vực nghiên cứu năng cao và đáng tin cậy khi phải đối mặt với sự thay đổi tiên phong có nhiều ứng dụng trong thực tiễn, thí dụ: hệ về biểu cảm khuôn mặt, tư thế mặt, và điều kiện chiếu thống tương tác giữa người và máy, cỗ máy tìm kiếm, hệ sáng. Sơ đồ khối tổng quát của quy trình nhận dạng được thống theo dõi, hệ thống đăng nhập,... Một hệ thống nhận mô tả ở hình 1. PCA và sự kết hợp PCA-LDA được sử dạng khuôn mặt tốt phải đạt được các yêu cầu sau: độ dụng làm phương pháp trích xuất thuộc tính. Trong khối chính xác cao, đáp ứng thời gian thực, ít bị ảnh hưởng bởi phân loại, có hai tùy chọn đó là Linear SVM và RBF các điều kiện bên ngoài (biểu cảm khuôn mặt, tư thế mặt, SVM. điều kiện chiếu sáng,...). Cấu trúc của bài báo như sau: Phần II trình bày các Trong những năm gần đây, SVM nổi lên như một bước tiền xử lí ảnh, tiếp đó, Phần III mô tả các thuật toán phương pháp đầy hứa hẹn cho việc phân loại khuôn trích xuất thuộc tính (PCA, và PCA-LDA). Phần IV trình mặt [1], [2]. Trong số các thuật toán trích xuất thuộc tính, bày kiến thức về SVM cũng như cách xây dựng một SVM wavelet Gabor đã được thừa nhận là một phương pháp rất nhiều lớp. Kết quả thí nghiệm và phân tích được trình bày mạnh khi phải đối mặt với sự thay đổi độ sáng, tư thế mặt ở Phần V. Cuối cùng, kết luận và hướng phát triển được và biểu cảm khuôn mặt, theo nguồn từ [3]. Nghiên cứu thảo luận ở Phần VI. ở [4] chỉ ra rằng sự kết hợp giữa Linear SVM và bộ lọc II. TIỀN XỬ LÍ Gabor đáp ứng tốt khi cần giải quyết nhiều mặt của việc nhận dạng khuôn mặt. Tuy vậy, wavelet Gabor yêu cầu Các bước tiền xử lí ảnh được áp dụng trong nghiên cứu một lượng tính toán cực lớn. Do đó, các hệ thống nhận này được trình bày như sau: dạng khuôn mặt sử dụng wavelet Gabor thường rất chậm. • Cắt từ ảnh chụp gốc để lấy ảnh khuôn mặt 330 ISBN: 978-604-67-0635-9 330
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) • Thay đổi kích thước ảnh thành 64x64 trong đó xji là mẫu thứ i trong lớp thứ j, µj là trung bình • Đổi ảnh màu sang ảnh xám của lớp j, c là số các lớp, và Nj là số các mẫu trong lớp • Đổi ảnh xám sang vector ảnh j. • Thường hóa các vector ảnh sao cho chúng có trung Định nghĩa 2. Ma trận phân tán liên-lớp, kí hiệu là Sb , bình 0 và độ lệch chuẩn 1 được định nghĩa bởi: • Giãn cường độ sáng c III. TRÍCH XUẤT THUỘC TÍNH Sb = (µj − µ)(µj − µ)T j=1 Phần này mô tả cách thức hoạt động của các phương pháp trích xuất thuộc tính (PCA và LDA). trong đó µ biểu diễn trung bình của tất cả các lớp. Mục tiêu của LDA là tìm các hướng mà tối đa giá trị A. Không gian PCA phân tán liên-lớp đồng thời tối thiểu giá trị phân tán cùng- ||W Sb W T || Cho trước một ma trận dữ liệu X trong không gian lớp. Tức là, tìm W mà tối thiểu được ||W Sw W T || . Cần lưu N -chiều trong đó mỗi vector cột xi , i = 1, 2, . . . , M biểu ý rằng: diễn một ảnh (nói cách khác, cơ sở dữ liệu ảnh có M ảnh, • Cần ít nhất N + c mẫu để đảm bảo rằng ma trận Sw mỗi ảnh có N điểm ảnh), Phân Tích Thành Phần Chính không là ma trận đơn. Tuy nhiên vì N rất lớn (với cỡ (PCA) có thể được sử dụng để tìm một không gian con ảnh 64×64 trong hệ thống của chúng tôi, N = 4096) mà các vector cơ bản của nó tương ứng với các hướng nên điều này trở nên không khả thi đối với các ứng phương sai tối đa trong không gian ban đầu. Để giai đoạn dụng thời gian thực. nhận dạng theo sau giai đoạn trích xuất thuộc tính mạnh • Một hệ thống LDA thuần thường thể hiện không tốt hơn, chúng tôi đã thực hiện một số thay đổi sau: lắm khi thử các mẫu thử không có trong cơ sở huấn • Thứ nhất, vector ảnh xi được chuẩn hoá sao cho luyện. ||xi || = 1 để đảm bảo hệ thống không bị ảnh hưởng Một vài kĩ thuật đã được đề xuất để giải quyết vấn đề bởi cường độ ánh sáng chiếu vào. này. Trong [10], PCA được dùng làm không gian trung • Thứ hai, các ảnh đã được chuẩn hoá sẽ bị trừ đi trung gian. Không gian N -chiều ban đầu trước tiên được chiếu bình của tất cả các vector được chuẩn hoá để đảm xuống không gian I-chiều của PCA. Kĩ thuật này do đó bảo rằng các eigenvectors ứng với các eigenvalues được gọi là Phân Tích Khác Biệt của Thành Phần Cơ Bản lớn nhất biểu diễn các hướng trong eigenspace cùng trong nhận diện khuôn mặt. Ý tưởng kết hợp PCA và LDA với phương sai của tất cả vector là tối đa về phương là để tận dụng tính chất lưu giữ đặc trưng dữ liệu của PCA diện tương quan, xi := xi − ¯x, trong đó ¯x là vector và tính chất phân biệt dữ liệu của LDA. ảnh trung bình. Khi triển khai thuật toán PCA, chúng tôi rút ra một vài IV. NHẬN DẠNG SỬ DỤNG SVM nhận xét sau: Trong đề tài này, SVM dựa trên hàm nhân Linear và • Tập trung vào việc biểu diễn thông tin hơn là phân hàm nhân RBF được xây dựng và được tiến hành thực loại, do đó nó tối ưu hơn cho việc biểu diễn. nghiệm dựa trên bộ công cụ LIBSVM [11]. Trước tiên, • Nhạy với các thay đổi về tư thế của đầu, vị trí, và khái lược lý thuyết cơ bản về SVM trong bài toán phân biểu cảm của mặt. loại nhị phân được trình bày [12]. Sau đó, kỹ thuật này • Kết quả nhận dạng khuôn mặt được tối ưu khi ba được mở rộng để giải quyết bài toán phân loại nhiều lớp eigenvector đầu tiên không được sử dụng (dường và áp dụng vào nhận diện khuôn mặt. như chúng được dùng để biểu diễn sự thay đổi độ A. SVM trong bài toán phân loại nhị phân sáng) [9], nhưng nếu xoá chúng đi, kết quả nhìn chung là giảm. SVM là một giải thuật máy học dựa trên lý thuyết học thống kê do Vapnik và Chervonenkis xây dựng. Bài toán B. Không gian PCA-LDA cơ bản của SVM là bài toán phân loại nhị phân. Cho tập mẫu xi , yi , i = 1, 2, . . . , N trong đó xi ∈ RD và yi ∈ LDA tìm các vector trong không gian mà phân chia rõ {1, −1}N , mục tiêu của thuật toán SVM là tìm một siêu nhất các lớp (chứ không phải là mô tả dữ liệu tốt nhất phẳng phân cách sao cho khoảng cách lề giữa hai lớp đạt giống như của PCA). cực đại. Tức là chúng ta cần tìm siêu phẳng H : w·x+b = Định nghĩa 1. Với một dữ liệu X cho trước, ma trận phân 0 và hai siêu phẳng hỗ trợ H1 , H2 song song với H và có tán cùng-lớp, kí hiệu là Sw , được định nghĩa như sau: cùng khoảng cách đến H. Với điều kiện không có phần tử nào của tập mẫu nằm giữa H1 và H2 , khi đó: Nj c Sw = (xji − µj )(xji − µj )T w · xi + b ≥ +1 với yi = +1 j=1 i=1 w · xi + b ≤ −1 với yi = −1 331 331
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) C. Tối ưu hóa tham số của SVM Trong phạm vi của bài báo này, tham số cần cho hàm nhân Linear là C. Đối với hàm nhân RBF, hai tham số cần được tối ưu là C và γ. Quy trình cross-validation được sử dụng để tìm các thông số tối ưu bởi vì nó có thể ngăn cản vấn đề overfitting. Trong quy trình k-fold cross-validation, tập huấn luyện sẽ được chia thành k tập con có cùng kích thước. Lần lượt, từng tập con sẽ được thử với máy phân loại đã được huấn luyện dựa trên k − 1 tập con còn lại. Do đó, mỗi mẫu trong tập huấn luyện đều sẽ được kiểm tra một lần nên độ chính xác của cross-validation chính là phần trăm của dữ liệu được Hình 2. Minh hoạ thuật toán SVM phân loại đúng. Trong thực tế, k được chọn là 5, còn C và γ được chọn bằng thuật toán đơn giản tìm lưới Khoảng cách lề giữa hai lớp là ||w||2 . Ta cần tìm siêu (grid search), cụ thể là log2 C ∈ {−5, −4, . . . , 15} và log2 γ ∈ {−15, −14, . . . , 3} [16], [17], [18]. phẳng H với lề lớn nhất, tức là giải bài toán tối ưu tìm minw,b ||w|| với điều kiện yi (w · xi + b) ≥ 1. Tuy nhiên V. ĐÁNH GIÁ cách làm như trên (được gọi là tìm lề cứng) chỉ thực hiện Trong bài báo này, hệ thống nhận diện khuôn mặt được được khi tập mẫu hoàn toàn phân tách tuyến tính được. đánh giá dựa trên ba tập cơ sở dữ liệu, với hai mô hình Đối với những tập dữ liệu nhiễu, sẽ trường hợp có một huấn luyện và ba kịch bản kiểm tra. Cuối cùng hiệu suất vài mẫu không phân lớp được nếu vẫn sử dụng lề cứng. nhân dạng và độ tin cậy của hệ thống được so sánh theo Trong trường hợp này, lề mềm nên được tìm thay lề cứng. các trường hợp sau: Sử dụng toán tử Lagrange cùng với một vài phép biến đổi, • Sự kết hợp giữa PCA và Linear SVM vector pháp tuyến w được biểu diễn như sau: • Sự kết hợp giữa PCA và RBF SVM • Sự kết hợp giữa PCA-LDA và Linear SVM N w= yi αi xi • Sự kết hợp giữa PCA-LDA và RBF SVM i=1 Thuật toán SVM có thể được mở rộng cho trường hợp A. Cơ sở dữ liệu tập mẫu không thể phân tách tuyến tính bằng cách ánh • Grimace [19]: từ 18 người, mỗi người gồm 20 ảnh xạ tập mẫu lên một không gian có số chiều lớn hơn bằng với góc chụp cố định là nhìn thẳng. Các bức ảnh mô cách sử dụng một hàm nhân K. Một số hàm nhân hay tả mức độ tăng dần về cảm xúc và biểu cảm khuôn được sử dụng đó là: mặt. Các sự thay đổi khác là không đáng kể. Linear • Sheffield [20]: có tổng cộng 573 ảnh được chụp từ 20 K(xi , xj ) = xTi xj người (đa dạng về chủng tộc/giới tính/vẻ bề ngoài). Polynomial Tập ảnh của mỗi người có sự thay đổi chủ yếu về K(xi , xj ) = (γxTi xj + r)d , γ > 0 góc lệch giữa khuôn mặt và máy chụp theo phương Radial Basic Function (RBF) ngang. K(xi , xj ) = exp(−γ||xi − xj ||2 ), γ > 0 • Extended YaleB (YaleB+) [21]: bài báo này chỉ sử Sigmoid dụng 1538/5760 ảnh của 10 đối tượng với sự khác K(xi , xj ) = tanh(γxTi xj + r) biệt đáng kể về điều kiện chiếu sáng, tư thế mặt thay đổi rất ít. B. SVM trong bài toán phân loại nhiều lớp Có vài phương pháp giúp mở rộng SVM cho bài toán B. Mô hình huấn luyện và kịch bản kiểm tra phân loại nhiều lớp. Hai trong số đó là One-Against-One Hệ thống được huấn luyện dưới hai mô hình được gọi là (OAO) và One-Against-All (OAA). Đối với OAA, để giải Clean model (CM) và Noisy model (NM). CM bao gồm quyết một bài toán phân loại q-lớp với SVM, q SVM sẽ các ảnh khuôn mặt nhìn thẳng và khuôn mặt không có được huấn luyện. Mỗi SVM sẽ phân chia một lớp với tất biểu cảm. NM bao gồm các ảnh khuôn mặt có sự thay đổi cả các lớp còn lại [12], [13]. Đối với OAO, q(q−1) 2 SVM về góc nhìn so với máy chụp và các khuôn mặt có sự biểu sẽ được huấn luyện khi ta cần phân loại q lớp. Mỗi SVM cảm. Với mỗi mô hình huấn luyện, hệ thống được kiểm tra sẽ lần lượt phân chia một cặp hai lớp. dưới ba kịch bản: Well-Matched (WM), Medium-Matched Trong công trình nghiên cứu này, OAO SVM được chọn (MM) and Highly-Mismatched (HM). Dữ liệu kiểm tra để phân loại khuôn mặt người vì phương pháp OAO dường WM là một tập các ảnh tương tự với các ảnh huấn luyện. như tốn nhiều thời gian hơn phương pháp OAA nhưng lại Dữ liệu kiểm tra MM bao gồm các ảnh có sự khác biệt cho độ chính xác cao hơn [14], [15]. một phần về biểu cảm và tư thế khuôn mặt so với các ảnh 332 332
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Bảng I Bảng II MA TRẬN PHÂN LOẠI CHO HAI LOẠI ĐỐI TƯỢNG KẾT QUẢ RECALL (%) Trạng thái Cơ Kịch Hệ thống sở bản Cho phép Từ chối PCA kết PCA PCA-LDA PCA-LDA dữ kiểm liệu tra hợp RBF kết hợp kết hợp kết hợp Không thẩm quyền (N) False (F) True (T) Loại đối tượng SVM Linear RBF Linear Có thẩm quyền (P) True (T) False (F) SVM SVM SVM CM NM CM NM CM NM CM NM Gri- WM 96 40 100 100 100 100 100 100 huấn luyện. Với trường hợp HM, tập ảnh kiểm tra bao gồm mace MM 97 82 97 100 97 100 97 100 các ảnh về biểu cảm và tư thế có sự khác biệt rất lớn so với tập ảnh huấn luyện. Shef- MM 86 100 83 100 79 100 95 100 field HM 64 100 64 100 31 90 74 100 C. Tiêu chí đánh giá WM 100 18 100 18 100 93 100 100 YaleB- MM 99 27 99 27 92 89 92 97 Để đánh giá sự hiệu quả của hệ thống, ba đại lượng ext được sử dụng đó là : Recall, Equal Error Rate (EER) và HM 31 25 27 25 6 84 5 96 Accuracy (ACC). 1) Recall: đại lượng này được sử dụng khi một phần của cơ sở dữ liệu được dùng cho việc huấn luyện, phần a) Sự phụ thuộc vào thuật toán trích xuất thuộc tính: còn lại được dùng cho việc kiểm tra. Tập ảnh kiểm tra sẽ Đối với tập cơ sở dữ liệu đơn giản nhất là Grimace, PCA không có sự hiện diện của các bức ảnh chứa khuôn mặt và PCA-LDA cho hiệu quả cao và gần như tương đương. của những người lạ. Recall = Số lần nhận diện đúng Tổng số lần nhận diện Đối với tập dữ liệu có sự thay đổi đáng kể về góc khuôn 2) EER: : Với sự xuất hiện của người lạ, hệ thống sẽ mặt (Sheffield), PCA vẫn cho kết quả cao nhưng PCA- sử dụng một chỉ số gọi là ngưỡng (threshold) để quyết LDA cho kết quả tốt hơn. Đối với tập cơ sở dữ liệu phức định người đó có được chấp nhận hay không. Bảng I là tạp nhất (Extended Yale B), khi có sự thay đổi khắc nghiệt ma trận phân loại cho hai loại đối tượng với P đại diện về điều kiện chiếu sáng, PCA-LDA cho thấy sự vượt trội cho người không có thẩm quyền và N đại diện cho người hoàn toàn so với PCA. Kết quả kiểm tra của PCA-LDA có thẩm quyền. Dựa vào bảng I, số lần người không có với NM là rất cao trong khi kết quả của PCA là rất thấp. thẩm quyền được hệ thống cho qua là FN. Tương tự, ta b) Sự phụ thuộc vào hàm nhân: Dựa vào các kết rút ra định nghĩa của TN, TP, và FP. Tỉ lệ chấp nhận sai quả thể hiện trên bảng II, rõ ràng rằng Linear SVM cho (FAR - False Acceptance Rate) là tỉ lệ một người không độ chính xác cao hơn so với RBF SVM trong hầu hết các có thẩm quyền bị chấp nhận sai bởi hệ thống. Tỉ lệ từ trường hợp. Đặc biệt, sự kết hợp giữa PCA-LDA và Linear chối sai (FRR - False Rejection Rate) là tỉ lệ một người SVM tạo ra hệ thống tốt nhất bởi vì nó cho kết cả cao có thẩm quyền bị từ chối bởi hệ thống. FAR và FRR được nhất gần như trong tất cả các trường hợp. tính theo công thức: PCA, linear, grimace, Noisy Model, WM, 1, 0, 0.98095, 0.016667 1 FP FN FAR F RR = , F AR = 0.9 FRR TP + FP TN + FN 0.8 Với các ngưỡng khác nhau, FAR và FRR sẽ cho các giá 0.7 trị tương ứng. EER được định nghĩa là giao điểm của hai đường FAR và FRR. 0.6 3) ACC: ACC là tỉ lệ mà hệ thống nhận diện đúng các Error 0.5 đối tượng. Nó được tính theo công thức: 0.4 0.3 TP + TN ACC = 0.2 TP + FP + TN + FN 0.1 D. Kết quả và phân tích 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Threshold 1) Với mục đích nhận dạng: Đầu tiên, mức độ hiệu quả của bốn hệ thống được xem xét khi nhu cầu của người Hình 3. EER của PCA-Linear SVM được kiểm tra với Grimace-NM-WM dùng là để xác định đúng danh tính của những đối tượng (số cuối cùng, EER = 0.016) có trong cơ sở dữ liệu (không có sự tấn công của người lạ). Bảng II trình bày tỉ lệ nhận dạng đúng khi hệ thống c) Sự phụ thuộc vào mô hình huấn luyện: Trong bài được thử trên ba tập cơ sở dữ liệu với độ khó tăng dần. báo này, sự hiệu quả của bốn hệ thống được nghiên cứu 333 333
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) PCA−LDA, linear, grimace, Noisy Model, WM, 1, 0.11667, 1, 0 Bảng III 1 FAR KẾT QUẢ EER FRR 0.9 0.8 Cơ Kịch Hệ thống sở bản 0.7 dữ kiểm PCA kết PCA PCA-LDA PCA-LDA liệu tra hợp RBF kết hợp kết hợp kết hợp 0.6 SVM Linear RBF Linear SVM SVM SVM Error 0.5 0.4 CM NM CM NM CM NM CM NM 0.3 Gri- WM 0.13 0.51 0.02 0.02 0.00 0.00 0.05 0.00 0.2 mace MM 0.10 0.26 0.05 0.03 0.04 0.00 0.17 0.01 0.1 Shef- MM 0.27 0.16 0.25 0.11 0.28 0.00 0.25 0.22 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 field HM 0.36 0.16 0.40 0.16 0.50 0.08 0.55 0.25 Threshold WM 0.02 0.57 0.00 0.55 0.00 0.09 0.02 0.05 Hình 4. EER của PCA-LDA-Linear SVM được kiểm tra với Grimace- YaleB- MM 0.12 0.66 0.13 0.66 0.33 0.12 0.23 0.16 NM-WM (số cuối cùng, EER = 0) ext HM 0.58 0.60 0.59 0.60 0.55 0.18 0.33 0.18 dựa trên hai mô hình huấn luyện là CM và NM. Các kết quả thu được cho thấy rằng tỉ lệ nhận dạng của NM tốt Bảng IV KẾT QUẢ ACC (%) hơn so với tỉ lệ nhận dạng của CM. Điều này là hợp lý bởi vì với NM, hệ thống được học với các ảnh huấn luyện Cơ Kịch Hệ thống có sự thay đổi đa dạng. Tuy nhiên, cần lưu ý rằng PCA sở bản dường như hoạt động rất tốt với CM. Khi được kiểm tra dữ kiểm PCA kết PCA PCA-LDA PCA-LDA liệu tra hợp RBF kết hợp kết hợp kết hợp với tập cơ sở dữ liệu khó nhất là Extended Yale B, PCA SVM Linear RBF Linear luôn mang lại hiệu suất nhận dạng cao hơn đối với trường SVM SVM SVM hợp sử dụng CM. Trong một vài trường hợp, cụ thể là khi CM NM CM NM CM NM CM NM các ảnh kiểm tra thuộc tập WM và MM được sử dụng để kiểm tra CM của tập cơ sở dữ liệu Extended Yale B, Gri- WM 88 37 98 98 100 100 96 100 mace MM 91 82 95 95 97 100 83 99 PCA thậm chí vượt trội so với PCA-LDA. Sau khi xem xét các phân tích trên, một đề xuất được nêu ra đó là PCA Shef- MM 74 85 74 88 83 100 77 80 thích hợp cho các tập cơ sở dữ liệu đơn giản: không có field HM 63 84 59 86 53 95 42 76 sự thay đổi khắc nghiệt về điều kiện chiếu sáng và có số lượng ít các ảnh của mỗi đối tượng. Công trình nghiên WM 98 42 100 46 100 94 98 95 YaleB- MM 88 34 87 32 73 88 78 84 cứu trong [22] có thể phần nào chứng minh được đề xuất ext này. HM 42 41 42 40 37 82 71 82 2) Với mục đích bảo mật: Mức độ hiệu quả mà hệ thống có thể mang lại được xem xét khi có sự hiện diện của những đối tượng lạ không có trong cơ sở dữ liệu. EER và ACC được dùng để đánh giá độ tin cậy của các hầu hết các trường hợp, PCA-LDA cho kết quả EER và hệ thống. độ chính xác tốt hơn so với PCA. Hình 3 và hình 4 minh a) Sự phụ thuộc vào thuật toán trích xuất thuộc tính: họa cho các kết quả này. Các hệ thống sử dụng PCA hoạt động khá tốt với tập b) Sự phụ thuộc vào hàm nhân: Linear SVM cho Grimace và Sheffield. Chúng cho kết quả EER thấp và thấy hiệu quả tốt hơn so với RBF SVM khi chúng được hiệu suất nhận dạng cao khi được thử với NM. Với cơ sở kết hợp với PCA. Tuy nhiên, RBF SVM lại cho kết quả dữ liệu lớn có sự thay đổi khắc nghiệt về điều kiện chiếu EER và độ chính xác tốt hơn so với Linear SVM khi chúng sáng (Extended YaleB), PCA tỏ ra không đáng tin cậy. kết hợp với PCA-LDA. Hệ thống sử dụng PCA-LDA và Các hệ thống sử dụng PCA chỉ cho kết quả EER thấp và RBF SVM cũng là hệ thống đáng tin cậy nhất trong tất cả hiệu suất nhận dạng cao khi tập ảnh kiểm tra WM và MM bốn hệ thống. Với yêu cầu về tính bảo mật, PCA-LDA và được thử với CM. Kết quả trong bảng III và bảng IV một RBF SVM vượt trội hơn so với hệ thống sử dụng PCA- lần nữa củng cố đề xuất rằng PCA chỉ nên được sử dụng LDA và Linear SVM. cho các tập dữ liệu không có những sự thay đổi lớn và c) Sự phụ thuộc vào mô hình huấn luyện: Tương tự, những tập dữ liệu có số lượng ảnh nhỏ. Ngược lại, các các kết quả trong bảng III và bảng IV một lần nữa cho hệ thống sử dụng PCA-LDA thì ổn định và đáng tin cậy. thấy NM nổi trội hơn so với CM khi độ tin cậy của các Chúng hoạt động tốt với cả ba tập cơ sở dữ liệu. Trong hệ thống được xét đến. 334 334
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) VI. KẾT LUẬN [4] G. Majumder, M. K. Bhowmik, Gabor-Fast ICA Feature Extraction for Thermal Face Recognition Using Linear Kernel Support Vector Một vài hệ thống nhận dạng khuôn mặt đã được xây Machine, IEEE 2015 International Conference on Computational dựng bằng việc kết hợp các phương pháp trích xuất thuộc Intelligence and Networks (CINE), Bhubaneshwar, pp. 21 – 25, tính và các hàm nhân trong khối nhận dạng. Các hệ thống Jan. 2015. [5] Chengliang Wang, Libin Lan, Yuwei Zhang, and Minjie Gu, Face này được kiểm tra với nhiều cơ sở dữ liệu ảnh dưới nhiều Recognition Based on Principal Component Analysis and Sup- mức độ khác nhau của yêu cầu an ninh. Khi hiệu suất nhận port Vector Machine, IEEE 2011 3rd International Workshop on dạng được ưu tiên, sự kết hợp PCA-LDA và Linear SVM Intelligent Systems and Applications (ISA), Wuhan, pp. 1 – 4, May 2011. là hệ thống tốt nhất, theo sau là PCA-LDA và RBF SVM. [6] S. L. Happy, A. Routray, Robust facial expression classification Tuy nhiên, khi sự tin cậy của hệ thống được ưu tiên, hệ using shape and appearance features, IEEE 2015 Eighth Interna- thống sử dụng PCA-LDA và RBF SVM vượt trội hệ thống tional Conference on Advances in Pattern Recognition (ICAPR), Kolkata, pp. 1 – 5, Jan. 2015. sử dụng PCA-LDA và Linear SVM. Trong ứng dụng thời [7] Abdulrahman, Muzammil, Eleyan, and Alaa, Facial expression recog- gian thực, mục đích và môi trường sử dụng của hệ thống nition using Support Vector Machines, IEEE Signal Processing and Communications Applications Conference (SIU), 2015 23th, nhận dạng khuôn mặt cần được xem xét kĩ lưỡng. Tuy Malatya, Turkey, pp. 276 – 279, May 2015. nhiên, trong thí nghiệm này, hệ thống sử dụng PCA-LDA [8] M. Turk and A. Pentland, Eigenface for Recognition, Journal of và RBF SVM được đề xuất, với những điều kiện về cơ sở Cognitive Neuroscience, vol. 3, no. 1, pp. 71-86, 1991. [9] A. Pentland, T. Starner, N. Etcoff, N. Masoiu, O. Oliyide, and M. Turk, dữ liệu và yêu cầu cho trước. Về mặt tính chất của hình Experiments with Eigenfaces, Proc. Looking at People Workshop ảnh, hệ thống đã nêu có thể xử lí được những thay đổi về Int’l Joint Conf. Artificial Intelligence, Aug. 1993. điều kiện chiếu sáng, tư thế mặt, và biểu cảm khuôn mặt. [10] P. N. Belhumeror, J.P. Hespanha, and D.J. Kriegman, Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection, Thời gian kiểm tra là rất ngắn trên máy tính cá nhân, do IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 19, đó hệ thống có thể đáp ứng được yêu cầu của một ứng no. 7, pp. 711-720, 1997. dụng thời gian thực. [11] LIBSVM – A Library for Support Vector Machines, [online]. Avail- able: http://www.csie.ntu.edu.tw/~cjlin/libsvm/ Mục tiêu cuối cùng của bài báo này là xây dựng được [12] C. Cortes and V. Vapnik, “Support vector networks,” Machine một hệ thống nhận dạng khuôn mặt hiệu quả và đáng tin Learning, 1995 cậy với thành phần cốt lõi là SVM. Một vài khó khăn cần [13] B. Scholkopf, C. Burges, and V. Vapnik. Extracting support data for a given task in U. Fayyad and R. Uthurusamy, editors, Proceedings phải vượt qua là: a) nghiên cứu thêm về các phương pháp of the First International Conference on Knowledge Discovery and trích xuất thuộc tính khác: PCA-LDA hoạt động có hiệu Data Mining, Menlo Park, CA, 1995. AAAI Press. quả, nhưng nó là phương pháp cơ bản. b) nghiên cứu bản [14] Ben Aisen, A Comparison of Multiclass SVM Methods, December 15, 2006. chất của SVM: trong bài báo này, SVM được dùng như [15] R. Kyle Eichelberger, Victor S. Sheng, Does One-Against-All or One- một công cụ với các tham số. Trong tương lai, cần xem Against-One Improve the Performance of Multiclass Classifica- xét việc sử dụng các hàm nhân mới. tions?, Proceedings of the Twenty-Seventh AAAI Conference on Artificial Intelligence. TÀI LIỆU THAM KHẢO [16] Carl Staelin, Parameter selection for support vector machines, HP Laboratories Israel, November 2003. [1] Juneja, Komal, An improvement on face recognition rate using local [17] Chih-Wei Hsu, Chih-Chung Chang, and Chih-Jen Lin, A practical tetra patterns with support vector machine under varying illumina- guide to support vector classification, April 2010. tion conditions, IEEE Computing, 2015 International Conference [18] Zhigang Yan, Yuanxuan Yang and Yunjing Ding, An experimental on Communication & Automation (ICCCA), India, pp. 1079 – study of the hyper-parameters distribution region and its optimiza- 1084, May 2015. tion method for support vector machine with Gaussian Kernel, [2] Jia Jun Zhang, Yu Ting Shi, Face recognition systems based on International Journal of Signal Processing, Image Processing and independent component analysis and support vector machine, Pattern Recognition, Vol.6, No.5 (2013), pp.437-446, 2013. IEEE 2014 International Conference on Audio, Language and [19] Essex Grimace Database, [Online]. Available: http://cswww.essex.ac. Image Processing (ICALIP), Shanghai, pp. 296 – 300, July 2014. uk/mv/allfaces/grimace.html [3] F.Ahmad Bhat, M. Arif Wani, Gabor wavelet based face recognition [20] Sheffield Face Database, [Online]. Available:http://www.sheffield.ac. under varying lighting, pose and expression conditions, IEEE uk/eee/research/iel/research/face 2015 2nd International Conference on Computing for Sustainable [21] Extended Yale B Database, [Online]. Available: http://www.vision. Global Development (INDIACom), New Delhi, pp. 1314 – 1318, ucsd.edu/~leekc/ExtYaleDatabase/ExtYaleB.html March 2015. [22] Aleix M. MartoAnez and Avinash C. Kak, PCA versus LDA, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 2, pp. 228-233, February 2001. 335 335
ADSENSE
CÓ THỂ BẠN MUỐN DOWNLOAD
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn