Giải thưng Sinh viên nghiên cu khoa hc Euréka ln 20 năm 2018 K yếu khoa hc
152
HỆ THỐNG HỖ TRỢ PHÂN TÍCH DỮ LIỆU
NGƯỜI XEM QUẢNG CÁO
Võ Minh Công*, Lê Ngọc Phú
Trường Đại học Sư phạm Kỹ thuật TP. Hồ Chí Minh
*Tác giả liên lạc: vominhcong05@gmail.com
TÓM TT
Th trường qung cáo s dng LCD ngày càng n r Vit Nam bi tính hiu
qu v mt qung sn phm, ch thích th hiếu người dùng thông qua hình
nh âm thanh sng động. Tuy nhiên, không phi chiến dịch nào được trin
khai cũng mang về doanh thu như mong đợi bi s khó khăn trong quá trình đo
ờng độ hiu qu ca quảng cáo đối vi từng đối tượng khách hàng c th.
Trong nghiên cứu này, chúng tôi đề xut mt h thng s dng các thut tóa n x
nh kết hp vi các thut tóa n hc sâu giúp trích xuất thông tin người xem
quảng cáo như s ợng người xem, thi gian xem, giới tính, độ tui nhm h tr
vic phân tích mức độ c động ca quảng cáo đến từng đối tượng khách hàng
mt cách nhanh hiu qu. Mô hình nhn dng gii tính và đ tui hiện đã hoạt
động được vi tc d ~30FPS, cho ra kết qu khá tt với độ chính xác đạt
được là 92% vi gii tính và sai s v tui là 3.2. Vi kết qu này, mô hình đã
kh năng triển khai rng rãi trên các h thng quảng cáo LCD, trong tương lai,
độ chính xác ca hình th được ci thiện hơn nhờ vic thu thp thêm d
liu hình nh s thêm công c h tr phân tích các d liu thu thập được
bng thut tóa n máy hc.
T khóa: Qung cáo, phân tích, x nh, học sâu, độ tui và gii tính.
SMART ADVERTISING SYSTEMS
Vo Minh Cong*, Le Ngoc Phu
Ho Chi Minh City University of Technology and Education
*Corresponding Author: vominhcong05@gmail.com
ABSTRACT
The LCD advertising market is booming in Vietnam because of the efficiency in
promoting the product, stimulating attraction through visuals and sound.
However, not every campaign is deployed as well as expected as the difficulty in
measuring the effectiveness of advertising for each specific customer. In this
study, we propose a system that utilizes image processing algorithms in
conjunction with deep learning algorithms to extract viewer information such as
the number of views, viewing time, gender and age, to help analyze the impact of
advertising to each customer quickly and effectively. Gender and age
identification is now working at ~ 30FPS, and yields good results with 92%
accuracy with gender and age error of 3.2. With this result, the model has the
potential to be widely deployed on LCD advertising systems. In the future, the
accuracy of the model can be further improved by acquiring more image data
and will have additional tools for analyzing data collected by machine learning
algorithms.
Keywords: advertisings, analysis, image processing, deep learning, age and
gender.
Giải thưng Sinh viên nghiên cu khoa hc Euréka ln 20 năm 2018 K yếu khoa hc
153
TNG QUAN
Trong th trường cnh tranh cao ngày
nay, quảng cáo đóng vai trò quan trọng
ảnh hưởng trc tiếp đến s thành
công ca các doanh nghip. Cùng vi
s phát trin ca nn công nghip sn
xut, các công ty ngày càng quan tâm
đến vic qung bá hình nh, sn phm
dch v của mình đến vi khách
hàng. Riêng th trường Vit Nam các
bng qung cáo ngoài tri chiếm t l
cao nht (95,2% - theo nghiên cu ca
Kantar Media). s xut hin ca các
bng qung cáo bng bảng điện t,
LCD khiến cho vic các qung cáo tiếp
cân khách hàng càng d dàng hơn.
Nhưng hiện nay chưa một phương
pháp nào để đánh giá độ hiu qua ca
qung cáo ngay lp tc các nhãn
hàng thưng phi da vào doanh s
bán hàng, vic này cn phi tn nhiu
thi gian. Ngày nay vi s phát trin
mnh m ca khoa hc máy tính, càng
ngày càng nhiều đột phá trong các
thut tóa n máy học đặc bit hc sâu,
mt thut tóa n đang đưc ng dng
rng rãi trong các sn phm ng dng
trí tu nhân to. Mc tiêu của đề tài
nghiên cu mt h thng ng dng
thut tóa n học sâu đ h tr trích xut
thông tin v độ tui, gii tính, thi gian
xem, s ợng người xem qung cáo
trên các bảng LCD và lưu lại thông tin
trên máy ch, t đó nhng nhà phân
tích có th kim chứng độ hiu qu ca
qung cáo nhanh chóng.
CÁC THUT TÓA N PHƯƠNG
PHÁP NGHIÊN CU
Chun b d liu
B d liu hun luyn ly t tp
MegAsian (Zhang, Liu, Li, & Loy,
2017). S dụng phương pháp ca
Viola-Jone (Viola & Jones, 2004) đó
dùng các đặc trưng Haar để nhn din
vùng có cha khuôn mặt người. và ct
khuôn mt ra khi b d liu gc. D
liệu được đa dạng hóa bng các phép
xoay hình để to thêm d liu cho quá
trình hun luyn.
Xây dng hình ca thut tóa n
hc sâu
Để trích xuất đặc trưng của khuôn mt
người chúng tôi đã thiết kế mt mng
CNN. Cu trúc mng CNN lần đầu
được to ra tên AlexNet
(Krizhevsky, Ilya, & Hinton, 2012)
Mng CNN mt nh cha
nhiu lp ma trn nhân chp khác nhau
đảm nhiệm c tính năng khác nhau
trong mạng như khử nhiu, làm m,
trích xut cạnh, nhiều đặc trưng
khác. Đối vi các thut tóa n x nh
thông thường quá trình trích xuất đc
trưng thì giá trị các mt n phải được
nghiên cứu cài đặt mt cách th
công. Nhưng đối vi thut tóa n hc
sâu tcác giá tr ca các mt n (trng
số) được máy điều chnh thông qua quá
trình hun luyn sao cho giá tr cac
lp cuối là đúng với nhãn ca d liu.
Gia các lp nhân chp chúng tôi s
dụng thêm thuật thường a (Ioffe
& Szegedy, 2015) nhm gim thiu
thi gian hun luyn và chng hình
to ra một đầu ra quá chính xác vi tp
d liu hun luyn (hay còn gi
overfitting). Lp cui ca mng CNN
cho ra 2 ngõ ra là tui gii tính. Vi
ngõ ra d đóa n tui hàm kích hot
được s dng hàm tuyến tính cho bài
tóa n hi quy độ tui. Vi ngõ ra gii
tính, hàm kích hot hàm sigmoid cho
ngõ ra 0/1 tương ng vi hai gii tính
n/nam. Vi mục tiêu ban đầu mt
hoạt động theo thi gian thc, ly ý
ng da vào mng MobileNet
(Howard, et al., 2017) nhm gim thiu
thi gian x lnhưng vẫn cho ra kết
qu khá tt.
Đánh giá sai số
Để xác định được thi gian mà khuôn
Giải thưng Sinh viên nghiên cu khoa hc Euréka ln 20 năm 2018 K yếu khoa hc
154
mt xem qung cáo, h thng tích hp
thêm mt thut tóa n nhm theo dõi
khuôn mt t khi khuôn mt xut hin
trên camera đến khi ri khi camera.
Khi mt khuôn mặt được phát hin, h
thng s gán s định danh cho
khuôn mặt đó, một đường bao s đưc
to ra xung quanh khuôn mt. H thng
s to ra thêm một đường bao lớn hơn
d đóa n khu vc vùng mặt đó xuất
hin trong khung nh tiếp theo, nếu
trong vùng nh tiếp theo khuôn mặt đó
vn còn trong vùng d đóa n, thut tóa
n s cp nht v trí mi ca khuôn mt.
Giao tiếp gia máy ch c bin
quảng cáo được hình thành qua giao
thc HTTP và mt giao diện người
dùng đưc tạo ra để các bng qung
cáo có th truyn thông tin hình nh v
máy ch.
KẾT QUẢ VÀ THẢO LUẬN
Sau gần 50 vòng lặp để huấn luyện mô
hình học sâu ta có kết quả như sau:
Bảng 1. Kết quả sai số của mô hình trên hai tập dữ liệu sau 50 vòng lặp
Sai s
Trên tp hun luyn
~4.08
Trên tập đánh giá
~3.22
Bảng 2. Kết quả độ chính xác của mô hình trên hai tập dữ liệu sau 50 vòng lặp
Độ chính xác
Trên tp hun luyn
~91%
Trên tập đánh giá
~91%
Kết quả mô hình mạng CNN có thiết kế như hình bên dưới.
Hình 1. Sơ đồ mô hình của mạng CNN
Giải thưng Sinh viên nghiên cu khoa hc Euréka ln 20 năm 2018 K yếu khoa hc
155
hình mạng CNN này lõi xử lý
mấu chốt của toàn bộ hệ thống. Cùng
với các thuật tóa n xử l ảnh, mô hình
mạng CNN được triển khai trên máy
chủ. Những bảng quảng cáo được tích
hợp camera nhiệm vụ thu thập dữ
liệu người xem gửi về máy chủ
máy chủ sẽ trích xuất thông tin lưu
vào nhật k để phân tích.
KẾT LUẬN
hình dự báo tuổi giới tính tuy
chưa đạt độ chính xác tuyệt đối và
những trường hợp sai lệch những
trường hợp thể bỏ qua được. Theo
một cách khách quan, ngay cả mắt
người cũng không thể dự đóa n chính
xác được độ tuổi của người chỉ bằng
hình ảnh. Vì vậy những kết quả kể trên
thể chấp nhận được. Với các kết quả
này thì hình thể được sdụng
trong hệ thống, hỗ trợ trích xuất đặc
trưng của người dùng để hỗ trợ phân
tích độ hiệu quả của quảng cáo. Trong
tương lai, hệ thống sẽ được cải thiện về
mật độ chính xác, nâng cấp thời gian
xử l, tạo nhiều kết nối giữa hệ thống
máy chủ máy trạm hơn nữa. Ngoài
ra, màn hình quản l phân tích các
thông tin hữu ích và cần thiết sẽ được
thiết kế để cung cấp cho các bên quản
l có cái nhìn trực quan và chi tiết hơn.
khả năng ứng dụng của hình
này thể tùy biến để áp dụng vào
nhiều vấn đề hơn nữa ngoài việc hỗ trợ
phân tích hiệu quả quảng cáo.
TÀI LIỆU THAM KHẢO
HOWARD, A. G., ZHU, M., CHEN, B., KALENICHENKO, D., WANG, W.,
WEYAND, T., ADAM, H. (2017). MobileNets: Efficient Convolutional
Neural Networks for Mobile Vision Applications. CoRR.
IOFFE, S., & SZEGEDY, C. (2015). Batch normalization: Accelerating deep
network training by reducing internal covariate shift. International
Conference on Machine Learning (trang 448-456). JMLR.org.
KRIZHEVSKY, A., ILYA, S., & HINTON, G. E. (2012). ImageNet
classification with deep convolutional neural networks. Neural
Information Processing Systems (NIPS) (trang 1097-1105). Curran
Associates Inc.
VIOLA, P., & JONES, M. J. (2004). Robust Real-Time Face Detection.
International Journal of Computer Vision, 57, 137-154.
ZHANG, Y., LIU, L., LI, C., & LOY, C. C. (2017). Quantifying Facial Age by
Posterior of Age Comparisons. CoRR.