intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Ứng dụng mô hình SVM cho bài toán dự đoán người dùng mua hàng sau khi click quảng cáo

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:4

6
lượt xem
1
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết này được tổ chức thành năm phần bao gồm cả phần giới thiệu. Trong phần 2, chúng tôi trình bày về dữ liệu của quảng cáo hiển thị và giảm chiềuvector đặc trưng bằng kĩ thuật băm. Sau đó, kết quả thực nghiệm về mô hình SVM sẽ được trình bày trong phần 3. Cuối cùng, kết luận về bài báo được chúng tôi trình bày trong phần 4. Phần cuối cùng là tài liệu tham khảo liên quan.

Chủ đề:
Lưu

Nội dung Text: Ứng dụng mô hình SVM cho bài toán dự đoán người dùng mua hàng sau khi click quảng cáo

  1. Tuyển tập Hội nghị Khoa học thường niên năm 2015. ISBN : 978-604-82-1710-5 ỨNG DỤNG MÔ HÌNH SVM CHO BÀI TOÁN DỰ ĐOÁN NGƯỜI DÙNG MUA HÀNG SAU KHI CLICK QUẢNG CÁO Đinh Phú Hùng Đại học Thuỷ lợi, email: hungdp@tlu.edu.vn 1. GIỚI THIỆU Việc dự đoán chỉ số CR đóng vai trò rất quan trọng trong các mô hình quảng cáo hiện nay. Quảng cáo hiển thị (Display Advertising) là Ví dụ như, trong đấu giá thời gian thực, một hình thức của quảng cáo trực tuyến mà người ta cần tính được giá trị kì vọng của các nhà quảng cáo (người mua quảng cáo) trả CPM. Theo Olivier[1], giá trị eCPM được tiền cho những nhà xuất bản (người bán quảng xác định theo công thức (1). cáo) cho phép đặt các quảng cáo hình ảnh trên eCPM= CPA*Pr(conversion, click) các trang web của nhà xuất bản. Cách thức = CPA*Pr(click)*Pr(conversion|click). (1) truyền thống của việc bán các quảng cáo hiển Trong bài báo này chúng tôi đề xuất sử thị chính là việc có hợp đồng dài hạn được dụng phương pháp SVM (Support Vector thoả thuận trước giữa người mua quảng cáo và Machine) để dự đoán số người mua hàng sau nhà xuất bản. Trong vòng chục năm qua, có rất khi click sản phẩm. Độ chính xác mà mô nhiều các cách thức mà nhà quảng cáo và nhà hình đạt được cũng chính là chỉ số CR. xuất bản giao dịch với nhau. Bài báo này được tổ chức thành năm phần Tuỳ thuộc vào nhu cầu của nhà quảng cáo, bao gồm cả phần giới thiệu. Trong phần 2, thị trường quảng cáo sẽ cung cấp cho họ một chúng tôi trình bày về dữ liệu của quảng cáo loạt các lựa chọn quảng cáo như: CPM (Cost hiển thị và giảm chiềuvector đặc trưng bằng Per Thousand Impressions), CPC (Cost Per kĩ thuật băm. Sau đó, kết quả thực nghiệm về Click), CPA (Cost Per Action) hay người ta mô hình SVM sẽ được trình bày trong phần còn goi với một cái tên khác là (Cost Per 3. Cuối cùng, kết luận về bài báo được chúng Conversion). Ý nghĩa cụ thể các hình thức tôi trình bày trong phần 4. Phần cuối cùng là quảng cáo này có thể được mô tả ngắn gọn tài liệu tham khảo liên quan. như sau: CPM là hình thức quảng cáo mà các nhàquảng cáo phải trả tiền cho mỗi 1000 lần 2. DỮ LIỆU VÀ ĐẶC TRƯNG quảng cáo hiển thị. CPC là hình thức trả tiền Trong phần này, chúng tôi trình bày một cho mỗi lần click quảng cáo, còn CPA là trả số thông tin cơ bản liên quan đến dữ liệu của tiền khi người dùng có hành động trên web quảng cáo hiển thị, thông tin về bộ dữ liệu của họ sau khi click quảng cáo. Các hành quảng cáo dùng trong phần thực nghiệm và động bao gồm mua sản phẩm, điền form đăng một kỹ thuật băm để giảm chiều vector đặc ký, gọi điện, gửi email. trưng dữ liệu. Một chỉ số quan trọngCR (Conversion Rate) là tỉ lệ giữa số lượng người mua hàng 2.1. Các đặc trưng trong quảng cáo hiển thị và số lượng người click. Chỉ số CR cao nói Nhìn chung có 4 tập đặc trưng chính cho nhà quảng cáo biết hoạt động quảng cáo thường được dùng liên quan đến quảng cáo của họ mang lại giá trị. Ngược lại, chỉ số CR hiển thị: nhà quảng cáo, nhà xuất bản, người thấp nói cho họ biết hoạt động quảng cáo dùng và thời gian. Chi tiết các đặc trưng đang lãng phí tiền của và không đạt hiệu quả. trong từng nhóm được mô tả trong bảng 1. 100
  2. Tuyển tập Hội nghị Khoa học thường niên năm 2015. ISBN : 978-604-82-1710-5 Bảng 1. Các đặc trưng trong nhóm bit (từ đặc trưng 11 đến 19). Thông thường, nếu sử dụng phương pháp từ điển để biểu diễn cho các đặc trưng này, ta cần một vector có số chiều 232 (hơn 4 tỷ chiều). Ý tưởng sử dụng một hàm băm để giảm chiều dữ liệu. Thay vì sử dụng c chiều để biểu diễn dữ liệu cho vector đặc trưng, chúng ta sẽ sử dụng d chiều với d
  3. Tuyển tập Hội nghị Khoa học thường niên năm 2015. ISBN : 978-604-82-1710-5 3. THỰC NGHIỆM người mua hàng sau khi click với từng ngày 3.1. Dữ liệu thực nghiệm sau đó và với tổng thể cả 7 ngày. Bảng 2. Bảng kết quả thực nghiệm Chúng tôi trích rút ra 1 chiến dịch quảng cáo có mã “15eea2bb” làm thực nghiệm. Chúng tôi sử dụng 21 ngày cho huấn luyện (bắt đầu từ ngày thứ 32 đến ngày thứ 53) và 7 ngày cho kiểm tra (bắt đầu từ ngày 53 đến ngày thứ 60). Chúng tôi gán nhãn dương cho những dữ liệu mà có độ lệch thời gian ∆𝑡 = 𝑡2 − 𝑡1 (𝑡1 là thời điểm click quảng cáo, 𝑡2 là thời điểm mua hàng) nằm trong cửa sổ thời gian mà chúng tôi xét. Gán nhãn âm cho dữ Kết quả thực nghiêm khi áp dụng mô hình liệu mà có ∆𝑡 không nằm trong cửa sổ đang SVM cho độ chính xác >90%, điều này cho xét hoặc 𝑡2 =null. Sử dụng kỹ thuật băm mô thấy rằng mô mình SVM cho dự đoán tốt tả trong mục 2.3 để ánh xạ các đặc trưng tới người mua hàng sau khi click. không gian đặc trưng thưa kích thước 222 4. KẾT LUẬN (khoảng 4 triệu chiều). Hàm băm được chúng tôi sử dụng là MurMurHash322. Đồ thị biểu Trong bài báo này, chúng tôi đã đề xuất áp diễn số lượng click và số lượng người mua dụng phương pháp SVM cho việc giải quyết hàng trong khoảng thời gian xét là 21 ngày bài toán dự đoán người dùng mua hàng sau được mô tả trong hình 1. Đường màu xanh khi click quảng cáo. Kết quả SVM thực hiện nước biển cho biết số người click theo thời phân lớp đối với người dung sau khi click gian, đường màu xanh lá cây cho biết số quảng cáo là tốt, độ chính xác đạt >90%. lượng người mua hàng theo thời gian. 5. TÀI LIỆU THAM KHẢO [1] O. Chapelle (2014), "Modeling Delayed Feedback in Display Advertising," in In Proceedings of the 20th ACM SIGKDD international conference on Knowledge Hình 1. Đồ thị số lần click, conversion discovery and data mining (KDD '14), New York, NY, USA. 3.2. Công cụ thực nghiệm [2] Weinberger, K., Dasgupta, A., Langford, J., Chúng tôi sử dụng công cụ Libsvm3 để Smola, A., and Attenberg (2009), "Feature hashing for large scale multitask learning," in chạy giải thuật SVM cho phần thực nghiệm. In Proceedings of the 26th Annual International 3.3. Kết quả thực nghiệm Conference on Machine Learning (ICML '09), Trong phần này, chúng tôi trình bày kết quả New York, NY, USA, 2009. thực nghiệm trên mô hình SVM. Sử dụng công [3] Olivier C, Eren M, and Romer R (2015), cụ Libsvm với các tham số mặc định để xây "Simple and Scalable Response Prediction dựng mô hình. Trong đó, tham số C = 1, hàm for Display Advertising," ACM nhân sử dụng là RBF (Radial basic function) Transactions on Intelligent Systems and với tham số 𝛾 = 2.38479 ∗ 10−7. Chúng tôi Technology (TIST) - Special Sections on sử dụng 21 ngày huấn luyện (từ ngày 32-53) Diversity and Discovery in Recommender với 29882 lượt click. Thực nghiệm dự đoán số Systems, vol. 5, no. 4, p. 34. 2 https://gist.github.com/automatonic/3725443 3 Xem chi tiết về Libsvm tại http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 102
  4. Tuyển tập Hội nghị Khoa học thường niên năm 2015. ISBN : 978-604-82-1710-5
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
77=>2