Hệ thống hỗ trợ phân tích dữ liệu người xem quảng cáo
lượt xem 4
download
Bài viết đề xuất một hệ thống sử dụng các thuật toán xử lí ảnh kết hợp với các thuật toán học sâu giúp trích xuất thông tin người xem quảng cáo như số lượng người xem, thời gian xem, giới tính, độ tuổi nhằm hỗ trợ việc phân tích mức độ tác động của quảng cáo đến từng đối tượng khách hàng một cách nhanh và hiệu quả.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Hệ thống hỗ trợ phân tích dữ liệu người xem quảng cáo
- Giải thưởng Sinh viên nghiên cứu khoa học Euréka lần 20 năm 2018 Kỷ yếu khoa học HỆ THỐNG HỖ TRỢ PHÂN TÍCH DỮ LIỆU NGƯỜI XEM QUẢNG CÁO Võ Minh Công*, Lê Ngọc Phú Trường Đại học Sư phạm Kỹ thuật TP. Hồ Chí Minh *Tác giả liên lạc: vominhcong05@gmail.com TÓM TẮT Thị trường quảng cáo sử dụng LCD ngày càng nở rộ ở Việt Nam bởi tính hiệu quả về mặt quảng bá sản phẩm, kích thích thị hiếu người dùng thông qua hình ảnh và âm thanh sống động. Tuy nhiên, không phải chiến dịch nào được triển khai cũng mang về doanh thu như mong đợi bởi sự khó khăn trong quá trình đo lường độ hiệu quả của quảng cáo đối với từng đối tượng khách hàng cụ thể. Trong nghiên cứu này, chúng tôi đề xuất một hệ thống sử dụng các thuật tóa n xử lí ảnh kết hợp với các thuật tóa n học sâu giúp trích xuất thông tin người xem quảng cáo như số lượng người xem, thời gian xem, giới tính, độ tuổi nhằm hỗ trợ việc phân tích mức độ tác động của quảng cáo đến từng đối tượng khách hàng một cách nhanh và hiệu quả. Mô hình nhận dạng giới tính và độ tuổi hiện đã hoạt động được với tốc dộ ~30FPS, và cho ra kết quả khá tốt với độ chính xác đạt được là 92% với giới tính và sai số về tuổi là 3.2. Với kết quả này, mô hình đã có khả năng triển khai rộng rãi trên các hệ thống quảng cáo LCD, trong tương lai, độ chính xác của mô hình có thể được cải thiện hơn nhờ việc thu thập thêm dữ liệu hình ảnh và sẽ có thêm công cụ hỗ trợ phân tích các dữ liệu thu thập được bằng thuật tóa n máy học. Từ khóa: Quảng cáo, phân tích, xử lí ảnh, học sâu, độ tuổi và giới tính. SMART ADVERTISING SYSTEMS Vo Minh Cong*, Le Ngoc Phu Ho Chi Minh City University of Technology and Education *Corresponding Author: vominhcong05@gmail.com ABSTRACT The LCD advertising market is booming in Vietnam because of the efficiency in promoting the product, stimulating attraction through visuals and sound. However, not every campaign is deployed as well as expected as the difficulty in measuring the effectiveness of advertising for each specific customer. In this study, we propose a system that utilizes image processing algorithms in conjunction with deep learning algorithms to extract viewer information such as the number of views, viewing time, gender and age, to help analyze the impact of advertising to each customer quickly and effectively. Gender and age identification is now working at ~ 30FPS, and yields good results with 92% accuracy with gender and age error of 3.2. With this result, the model has the potential to be widely deployed on LCD advertising systems. In the future, the accuracy of the model can be further improved by acquiring more image data and will have additional tools for analyzing data collected by machine learning algorithms. Keywords: advertisings, analysis, image processing, deep learning, age and gender. 152
- Giải thưởng Sinh viên nghiên cứu khoa học Euréka lần 20 năm 2018 Kỷ yếu khoa học TỒNG QUAN khuôn mặt ra khỏi bộ dữ liệu gốc. Dữ Trong thị trường cạnh tranh cao ngày liệu được đa dạng hóa bằng các phép nay, quảng cáo đóng vai trò quan trọng xoay hình để tạo thêm dữ liệu cho quá và ảnh hưởng trực tiếp đến sự thành trình huấn luyện. công của các doanh nghiệp. Cùng với Xây dựng mô hình của thuật tóa n sự phát triển của nền công nghiệp sản học sâu xuất, các công ty ngày càng quan tâm Để trích xuất đặc trưng của khuôn mặt đến việc quảng bá hình ảnh, sản phẩm người chúng tôi đã thiết kế một mạng và dịch vụ của mình đến với khách CNN. Cấu trúc mạng CNN lần đầu hàng. Riêng thị trường Việt Nam các được tạo ra có tên là AlexNet bảng quảng cáo ngoài trời chiếm tỷ lệ (Krizhevsky, Ilya, & Hinton, 2012) cao nhất (95,2% - theo nghiên cứu của Mạng CNN là một mô hình có chứa Kantar Media). Và sự xuất hiện của các nhiều lớp ma trận nhân chập khác nhau bảng quảng cáo bằng bảng điện tử, đảm nhiệm các tính năng khác nhau LCD khiến cho việc các quảng cáo tiếp trong mạng như khử nhiễu, làm mờ, cân khách hàng càng dễ dàng hơn. trích xuất cạnh, … và nhiều đặc trưng Nhưng hiện nay chưa có một phương khác. Đối với các thuật tóa n xử lí ảnh pháp nào để đánh giá độ hiểu qua của thông thường quá trình trích xuất đặc quảng cáo ngay lập tức mà các nhãn trưng thì giá trị các mặt nạ phải được hàng thường phải dựa vào doanh số nghiên cứu và cài đặt một cách thủ bán hàng, việc này cần phải tốn nhiều công. Nhưng đối với thuật tóa n học thời gian. Ngày nay với sự phát triển sâu thì các giá trị của các mặt nạ (trọng mạnh mẽ của khoa học máy tính, càng số) được máy điều chỉnh thông qua quá ngày càng có nhiều đột phá trong các trình huấn luyện sao cho giá trị của các thuật tóa n máy học đặc biệt là học sâu, lớp cuối là đúng với nhãn của dữ liệu. một thuật tóa n đang được ứng dụng Giữa các lớp nhân chập chúng tôi sử rộng rãi trong các sản phẩm ứng dụng dụng thêm kĩ thuật thường hóa (Ioffe trí tuệ nhân tạo. Mục tiêu của đề tài là & Szegedy, 2015) nhằm giảm thiểu nghiên cứu một hệ thống ứng dụng thời gian huấn luyện và chống mô hình thuật tóa n học sâu để hỗ trợ trích xuất tạo ra một đầu ra quá chính xác với tập thông tin về độ tuổi, giới tính, thời gian dữ liệu huấn luyện (hay còn gọi là xem, và số lượng người xem quảng cáo overfitting). Lớp cuối của mạng CNN trên các bảng LCD và lưu lại thông tin cho ra 2 ngõ ra là tuổi và giới tính. Với trên máy chủ, từ đó những nhà phân ngõ ra dự đóa n tuổi hàm kích hoạt tích có thể kiểm chứng độ hiệu quả của được sử dụng là hàm tuyến tính cho bài quảng cáo nhanh chóng. tóa n hồi quy độ tuổi. Với ngõ ra giới tính, hàm kích hoạt là hàm sigmoid cho CÁC THUẬT TÓA N VÀ PHƯƠNG ngõ ra 0/1 tương ứng với hai giới tính PHÁP NGHIÊN CỨU nữ/nam. Với mục tiêu ban đầu là một Chuẩn bị dữ liệu hoạt động theo thời gian thực, lấy ý Bộ dữ liệu huấn luyện lấy từ tập tưởng dựa vào mạng MobileNet MegAsian (Zhang, Liu, Li, & Loy, (Howard, et al., 2017) nhằm giảm thiểu 2017). Sử dụng phương pháp của thời gian xử lý nhưng vẫn cho ra kết Viola-Jone (Viola & Jones, 2004) đó là quả khá tốt. dùng các đặc trưng Haar để nhận diện Đánh giá sai số vùng có chứa khuôn mặt người. và cắt Để xác định được thời gian mà khuôn 153
- Giải thưởng Sinh viên nghiên cứu khoa học Euréka lần 20 năm 2018 Kỷ yếu khoa học mặt xem quảng cáo, hệ thống tích hợp vẫn còn trong vùng dự đóa n, thuật tóa thêm một thuật tóa n nhằm theo dõi n sẽ cập nhật vị trí mới của khuôn mặt. khuôn mặt từ khi khuôn mặt xuất hiện Giao tiếp giữa máy chủ và các biển trên camera đến khi rời khỏi camera. quảng cáo được hình thành qua giao Khi một khuôn mặt được phát hiện, hệ thức HTTP và một giao diện người thống sẽ gán mã số định danh cho dùng được tạo ra để các bảng quảng khuôn mặt đó, một đường bao sẽ được cáo có thể truyền thông tin hình ảnh về tạo ra xung quanh khuôn mặt. Hệ thống máy chủ. sẽ tạo ra thêm một đường bao lớn hơn dự đóa n khu vực vùng mặt đó xuất KẾT QUẢ VÀ THẢO LUẬN hiện trong khung ảnh tiếp theo, nếu Sau gần 50 vòng lặp để huấn luyện mô trong vùng ảnh tiếp theo khuôn mặt đó hình học sâu ta có kết quả như sau: Bảng 1. Kết quả sai số của mô hình trên hai tập dữ liệu sau 50 vòng lặp Sai số Trên tập huấn luyện ~4.08 Trên tập đánh giá ~3.22 Bảng 2. Kết quả độ chính xác của mô hình trên hai tập dữ liệu sau 50 vòng lặp Độ chính xác Trên tập huấn luyện ~91% Trên tập đánh giá ~91% Kết quả mô hình mạng CNN có thiết kế như hình bên dưới. Hình 1. Sơ đồ mô hình của mạng CNN 154
- Giải thưởng Sinh viên nghiên cứu khoa học Euréka lần 20 năm 2018 Kỷ yếu khoa học Mô hình mạng CNN này là lõi xử lý hình ảnh. Vì vậy những kết quả kể trên mấu chốt của toàn bộ hệ thống. Cùng có thể chấp nhận được. Với các kết quả với các thuật tóa n xử lý ảnh, mô hình này thì mô hình có thể được sử dụng mạng CNN được triển khai trên máy trong hệ thống, hỗ trợ trích xuất đặc chủ. Những bảng quảng cáo được tích trưng của người dùng để hỗ trợ phân hợp camera có nhiệm vụ thu thập dữ tích độ hiệu quả của quảng cáo. Trong liệu người xem và gửi về máy chủ và tương lai, hệ thống sẽ được cải thiện về máy chủ sẽ trích xuất thông tin và lưu mật độ chính xác, nâng cấp thời gian vào nhật ký để phân tích. xử lý, tạo nhiều kết nối giữa hệ thống máy chủ và máy trạm hơn nữa. Ngoài KẾT LUẬN ra, màn hình quản lý và phân tích các Mô hình dự báo tuổi và giới tính tuy thông tin hữu ích và cần thiết sẽ được chưa đạt độ chính xác tuyệt đối và thiết kế để cung cấp cho các bên quản những trường hợp sai lệch là những lý có cái nhìn trực quan và chi tiết hơn. trường hợp có thể bỏ qua được. Theo Và khả năng ứng dụng của mô hình một cách khách quan, ngay cả mắt này có thể tùy biến để áp dụng vào người cũng không thể dự đóa n chính nhiều vấn đề hơn nữa ngoài việc hỗ trợ xác được độ tuổi của người chỉ bằng phân tích hiệu quả quảng cáo. TÀI LIỆU THAM KHẢO HOWARD, A. G., ZHU, M., CHEN, B., KALENICHENKO, D., WANG, W., WEYAND, T., ADAM, H. (2017). MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. CoRR. IOFFE, S., & SZEGEDY, C. (2015). Batch normalization: Accelerating deep network training by reducing internal covariate shift. International Conference on Machine Learning (trang 448-456). JMLR.org. KRIZHEVSKY, A., ILYA, S., & HINTON, G. E. (2012). ImageNet classification with deep convolutional neural networks. Neural Information Processing Systems (NIPS) (trang 1097-1105). Curran Associates Inc. VIOLA, P., & JONES, M. J. (2004). Robust Real-Time Face Detection. International Journal of Computer Vision, 57, 137-154. ZHANG, Y., LIU, L., LI, C., & LOY, C. C. (2017). Quantifying Facial Age by Posterior of Age Comparisons. CoRR. 155
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Giáo trình Hệ thống quản trị nguồn lực doanh nghiệp ERP
108 p | 1177 | 288
-
Phân tích SWOT - AnBinhBank
31 p | 413 | 194
-
Báo cáo: Phân tích ứng dụng ERP trong công ty cổ phần Huetronics
18 p | 364 | 137
-
Bài giảng Hệ thống thông tin quản lý - Lê Thị Ngọc Diệp
179 p | 147 | 15
-
Giới thiệu công cụ phân tích số liệu kinh doanh thông minh
3 p | 115 | 10
-
Mô hình hệ thống khai thác dữ liệu phi cấu trúc hỗ trợ khách hàng ra quyết định mua hàng trực tuyến
6 p | 33 | 10
-
Bài giảng Quản lý chiến lược: Chương 6 - Lại Văn Tài
55 p | 72 | 8
-
Hạ tầng cho phát triển hệ thống logistics ở Việt Nam và vùng kinh tế trọng điểm miền Trung
18 p | 15 | 8
-
Bài giảng Hệ thống thông tin quản lý: Chương 6 - ThS. Huỳnh Đỗ Bảo Châu
12 p | 118 | 8
-
Kho dữ liệu trong phân tích và quản trị dữ liệu thông minh tại các cơ quan - doanh nghiệp (Enterprise data warehouse in smart data analytics and management)
14 p | 17 | 6
-
Thiết kế và xây dựng máy tìm kiếm ngữ nghĩa để hỗ trợ cho hệ thống hỏi đáp thông minh TBT Long An
15 p | 23 | 6
-
Bài giảng Hệ thống thông tin quản lý - Chương 4: Các hệ thống thông tin quản lý trong doanh nghiệp (Năm 2022)
11 p | 24 | 5
-
Phân tích môi trường marketing
9 p | 106 | 5
-
Giải pháp thuế và hải quan hỗ trợ doanh nghiệp xuất khẩu
5 p | 6 | 3
-
Mô tả công việc nhân viên phân tích quy trình
1 p | 71 | 3
-
Mô tả công việc nhân viên phân tích quy trình kinh doanh
1 p | 86 | 3
-
Bài giảng Hệ thống thông tin quản lý: Chương 6 - TS. Lê Diên Tuấn
8 p | 4 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn