Giải pháp ứng dụng công nghệ big data hỗ trợ doanh nghiệp bán lẻ tại Việt Nam
lượt xem 6
download
Bài viết Giải pháp ứng dụng công nghệ big data hỗ trợ doanh nghiệp bán lẻ tại Việt Nam nghiên cứu dữ liệu lớn, phân tích dữ liệu lớn và giới thiệu về ứng dụng công nghệ dữ liệu lớn trong một số doanh nghiệp bán lẻ trên thế giới. Đồng thời, bài viết chỉ ra thực trạng ứng dụng dữ liệu lớn tại một số doanh nghiệp bán lẻ Việt Nam.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Giải pháp ứng dụng công nghệ big data hỗ trợ doanh nghiệp bán lẻ tại Việt Nam
- 156 KỶ YẾU HỘI THẢO QUỐC TẾ “THƯƠNG MẠI VÀ PHÂN PHỐI“ LẦN THỨ 4 NĂM 2023 GIẢI PHÁP ỨNG DỤNG CÔNG NGHỆ BIG DATA HỖ TRỢ DOANH NGHIỆP BÁN LẺ TẠI VIỆT NAM Nguyễn Hưng Long, Bùi Lan Phương, Đỗ Thị Thanh Tâm, Vũ Kim Oanh Trường Đại học Thương mại Email: ntthlong@tmu.edu.vn Tóm tắt: Bài viết đã tập trung nghiên cứu những khái niệm cơ bản về dữ liệu lớn, phân tích dữ liệu lớn - một công nghệ số hiện đại. Bài viết cũng nghiên cứu dữ liệu lớn, phân tích dữ liệu lớn và giới thiệu về ứng dụng công nghệ dữ liệu lớn trong một số doanh nghiệp bán lẻ trên thế giới. Đồng thời, bài viết chỉ ra thực trạng ứng dụng dữ liệu lớn tại một số doanh nghiệp bán lẻ Việt Nam. Qua đó, bài viết đề xuất một giải pháp ứng dụng dữ liệu lớn hỗ trợ doanh nghiệp bán lẻ tại Việt Nam bởi thuật toán SWFP-miner khai phá tập mục phổ biến với trọng số trên dòng dữ liệu sử dụng mô hình cửa sổ trượt nhằm tăng doanh số bán hàng và tạo ra lợi thế cạnh tranh với các thủ khác trong bối cảnh nền kinh tế mới. Từ khóa: Big data, dữ liệu lớn, khai phá dữ liệu, khai phá tập phổ biến, dòng dữ liệu, doanh nghiệp bán lẻ. BIG DATA TECHNOLOGY APPLICATION SOLUTION SUPPORTING FOR RETAIL BUSINESSES IN VIETNAM Abstract: The paper concentrated on studying the basic theories of Big data, big-data analysis - mordern digital technology and introduced big data application that applyied in some retail companies in the world. Simultaneously, the paper showed situation of big data applied on some retail businesses in Vietnam. Therefore, the paper proposed a big-data application solution supporting retail companies in Vietnam by SWFP-miner algothrithm mining weighted frequent itemsets over data stream data stream using the sliding window model to increase profit and make advanced competition with other competitors in the new economic context. Keywords: Big data, data mining, mining weighted frequent itemsets, data stream, retail businesses LỜI MỞ ĐẦU Ngày nay, trong kỷ nguyên số hóa toàn cầu, đặc biệt với sự ảnh hưởng của đại dịch toàn cầu Covid-19 với diễn biến phức tạp và khó lường (từ cuối tháng 12
- THE 4TH INTERNATIONAL CONFERENCE PROCEEDINGS COMMERCE AND DISTRIBUTION 157 năm 2019 đến nay), khách hàng (người tiêu dùng) đã và đang có xu hướng gia tăng chuyển dịch từ mua hàng truyền thống sang trực tuyến (online). Theo báo cáo của Ninja Van Group (Công ty Bưu chính Thương mại điện tử (e-logistics)) đang hoạt động tại các nước Đông Nam Á công bố Báo cáo nghiên cứu về hình thức kinh doanh thương mại điện tử xuyên biên giới đã dự báo: năm 2022, số lượng người Việt Nam mua sắm hàng trực tuyến lên đến hơn 51 triệu, tăng 13.5% so với năm 2021, tổng chi tiêu cho việc mua sắm trực tuyến đạt 12.42 tỷ USD. Cùng thời điểm này Google Temasek Bain & Company dự báo quy mô của nền kinh tế số Việt Nam sẽ vượt ngưỡng 52 tỷ USD và đứng vị trí thứ 3 trong khu vực Đông Nam Á vào năm 2025. Theo đó, Việt Nam là quốc gia đứng đầu Đông Nam Á với số lượng mua hàng trực tuyến trung bình khoảng 104 đơn hàng/năm, có 73% đáp viên cho biết họ thường xuyên mua sắm hàng trên các nền tảng thương mại điện tử và 59% cho biết họ đã từng nhiều lần đặt hàng hoặc mua sắm trên các website quốc tế. Việt Nam hiện đang chiếm 15% tổng thị trường mua sắm trực tuyến tại Đông Nam Á, chỉ đứng sau Thái Lan với tỷ lệ 16% và ngang bằng với Philippines. Theo Sách trắng Thương mại điện tử Việt Nam (Bộ Công Thương) công bố, đã dự báo quy mô thị trường thương mại điện tử bán lẻ (B2C) của Việt Nam năm 2022 ước đạt 16.4 tỷ USD, tăng trưởng 20% so với năm 2021. Điều này chứng tỏ, thương mại điện tử tại Việt Nam đã phát triển mạnh mẽ. Mặt khác, trong những năm gần đây, Việt Nam cũng đã rất quan tâm đến công cuộc chuyển đổi số, với trụ cột chính là Chính phủ số, kinh tế số và xã hội số quốc gia. Trong đó, Chính phủ đề ra, năm 2022 là năm đẩy mạnh chuyển đổi số theo hướng lấy người dân làm trung tâm, toàn dân và toàn diện. Giai đoạn từ năm 2022- 2025 sẽ là giai đoạn tăng tốc chuyển đổi số với những hành động triển khai cụ thể theo từng ngành, từng lĩnh vực, từng địa phương. Đối với các doanh nghiệp, Chính phủ cũng đã có nhiều chính sách khuyến khích các doanh nghiệp thực hiện chuyển đổi số nhằm đáp ứng nhu cầu thị trường trong bối cảnh mới. Nhận thấy, quyết tâm của Chính phủ là điều kiện thuận lợi giúp các doanh nghiệp trong mọi lĩnh vực nói chung và lĩnh vực bán lẻ nói riêng có thời cơ và thuận lợi để thể thực hiện chuyển đổi số. Tuy nhiên, quá trình chuyển đổi số là những bước đi đầu tiên của các doanh nghiệp bán lẻ tại Việt Nam nên họ gặp không ít khó khăn. Trong quá trình chuyển đổi số doanh nghiệp bán lẻ cần phải trang bị nhiều công nghệ số như: Internet vạn vật (Internet of Things - IoT), trí tuệ nhân tạo (Artificial Intelligence - AI), dữ liệu lớn (big data), thực tế ảo (Virtual Reality - VR), thực tế ảo tăng cường (Augmented Reality - AR), điện toán đám mây (Cloud computing),... Ở đó, dữ liệu lớn cho phép doanh nghiệp bán lẻ hiểu rõ hơn về thói quen mua sắm của khách hàng và cách thu hút khách hàng mới; ghi nhận hành vi của khách hàng thông qua trải nghiệm khách hàng; tăng doanh số bán hàng và tạo ra lợi thế cạnh tranh với các thủ khác. Bài viết đã tập trung nghiên cứu những khái niệm cơ bản về dữ liệu lớn, phân tích dữ liệu lớn - một công nghệ số hiện đại. Bài viết cũng nghiên cứu dữ liệu lớn, phân tích dữ liệu lớn và giới thiệu về ứng dụng công nghệ dữ liệu lớn trong một số doanh nghiệp bán lẻ trên thế giới. Đồng thời, bài viết chỉ ra thực trạng ứng dụng dữ liệu lớn tại một số doanh nghiệp bán lẻ Việt Nam. Qua đó, bài viết đề xuất một giải pháp ứng dụng dữ liệu lớn hỗ trợ doanh nghiệp bán lẻ tại Việt Nam bởi thuật toán SWFP-miner khai phá tập mục phổ biến với trọng
- 158 KỶ YẾU HỘI THẢO QUỐC TẾ “THƯƠNG MẠI VÀ PHÂN PHỐI“ LẦN THỨ 4 NĂM 2023 số trên dòng dữ liệu sử dụng mô hình cửa sổ trượt nhằm tăng doanh số bán hàng và tạo ra lợi thế cạnh tranh với các thủ khác trong bối cảnh nền kinh tế mới. 1. GIỚI THIỆU Dữ liệu lớn (big data) là tài sản thông tin, mà những thông tin này có khối lượng dữ liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có công nghệ mới để xử lý một cách hiệu quả nhằm đưa ra các quyết định hiệu quả, khám phá được các yếu tố tiềm ẩn trong dữ liệu và tối ưu hóa được quá trình xử lý dữ liệu”. Dữ liệu lớn là một thuật ngữ cho việc xử lý một tập hợp dữ liệu rất lớn và phức tạp mà các ứng dụng mà sử dụng công cụ xử lý dữ liệu truyền thống rất khó. Hay dữ liệu lớn mô tả các tập dữ liệu lớn, đa dạng, gia tăng liên tục theo thòi gian, được tạo ra với khối lượng lớn và tốc độ cao. Trong ngành bán lẻ, dữ liệu lớn được ứng dụng phổ biến để ghi nhận hành vi khách hàng từ đó cải thiện trải nghiệm khách hàng. Tập dữ liệu lớn được thu thập trên nhiều nền tảng khác nhau (webpage, Facebook, Tiktok Shop/Live, Instagram Live, WhatsApp, Wechat, Amazon Live,...), các kho ứng dụng (apps store) dành cho máy tính và các thiết bị di động thông minh, thẻ khách hàng thân thiết, điểm bán hàng POS, và các thiết bị giám sát cảm biến (RFID) trong Internet kết nối vạn vật (Internet of Things - IoT). Dữ liệu lớn có 5 đặc trưng, được định nghĩa bởi 5V, đó là Volume (khối lượng), Velocity (vận tốc), Variety (đa dạng), Veracity (tính xác thực) và Value (giá trị). Các đặc trưng của dữ liệu lớn được thể hiện trong hình 1. Hình 1. Năm đặc trưng của big data (Nguồn: https://investbook.vn) Phân tích dữ liệu lớn (big data analytics) là một quy trình hoàn chỉnh kiểm tra các tập dữ liệu lớn thông qua các công cụ và quy trình khác nhau để khám phá ra các mẫu còn tiềm ẩn, mối tương quan ẩn, xu hướng có ý nghĩa và các thông tin chi tiết khác để đưa ra quyết định dựa trên dữ liệu nhằm mục tiêu tốt hơn. Phân tích dữ liệu lớn trong các doanh nghiệp bán lẻ tạo điều kiện cho việc cung cấp nhu cầu theo thời gian thực; dự báo, dự đoán công suất hiện tại và tối ưu hóa các cấp độ của chuỗi cung ứng (supply chain). Ngoài ra, nó tạo điều kiện thuận lợi cho việc xác định tập khách hàng quan trọng nhất, xác định chiến lược mở rộng, khả năng của nguyên vật liệu,... Phân
- THE 4TH INTERNATIONAL CONFERENCE PROCEEDINGS COMMERCE AND DISTRIBUTION 159 tích dữ liệu lớn cung cấp một cách hiệu quả hơn và nhanh hơn để thu thập, quản lý, phân phối và kiểm soát thông tin có cấu trúc và không có cấu trúc trên các kênh thương mại điện tử. Mặt khác, phân tích dữ liệu lớn trong các doanh nghiệp bán lẻ nhằm phân tích dữ liệu để cải thiện thông tin tiềm ẩn về khách hàng, cung cấp thông tin cho các chiến dịch tiếp thị hiệu quả, hỗ trợ điều chỉnh quy mô hoạt động dữ liệu tăng hiệu quả hoạt động và cung cấp thông tin cho quá trình phát triển sản phẩm. Một quy trình phân tích dữ liệu lớn được thực hiện theo 8 giai đoạn: (1) Đánh giá nghiệp vụ doanh nghiệp; (2) Xác định nguồn dữ liệu; (3) Lọc dữ liệu; (4) Trích xuất dữ liệu; (5) Tổng hợp dữ liệu; (6) Phân tích dữ liệu; (7) Trực quan hóa dữ liệu và (8) Kết quả phân tích cuối cùng (được cung cấp cho các bên liên quan) của doanh nghiệp. Các loại phân tích dữ liệu lớn bao gồm: Phân tích mô tả, phân tích chẩn đoán, phân tích dự đoán và phân tích đề xuất. Tại các doanh nghiệp bán lẻ trên thế giới, ngoài việc ứng dụng công nghệ dữ liệu lớn còn được sử dụng kết hợp đồng thời với các công nghệ số khác nhằm tăng hiệu suất và hiệu quả trong toàn bộ các hoạt động của doanh nghiệp. Các công nghệ số kết hợp với dữ liệu lớn như: Công nghệ IoT (Internet of Things); điện toán đám mây (cloud computing); trí tuệ nhân tạo (Artificial Intelligence - AI); thực tế tăng cường (AR) và thực tế ảo (VR); chuỗi khối (Blockchain); robot (Robotics). Công nghệ IoT cung cấp kết nối Internet giữa các thiết bị để tạo ra một môi trường thông minh, làm cho máy móc đủ thông minh và đưa ra những phân tích, xử lý các luồng dữ liệu theo real-time mà không có bất kỳ sự chậm trễ nào để đưa ra các quyết định kiểm soát một cách hiệu quả. Còn Big Data có độ trễ giữa thời điểm dữ liệu được thu thập và khi dữ liệu được xử lý, mục đích chính để con người phân tích tập hợp dữ liệu khổng lồ đó để dẫn đến các quyết định tốt hơn và các động thái kinh doanh chiến lược. Việc áp dụng bổ sung giữa dữ liệu lớn và IoT có thể hữu ích cho doanh nghiệp bán lẻ trong: nghiên cứu thị trường, tiết lộ xu hướng khách hàng, tìm mối tương quan ẩn và phát hiện các thông tin mới... Công nghệ điện toán đám mây, cung cấp một môi trường đáng tin cậy, có thể truy cập và có thể mở rộng để các hệ thống dữ liệu lớn hoạt động. Các đám mây phát triển và cung cấp các giải pháp cho môi trường dữ liệu lớn phù hợp trong khi lưu trữ truyền thống không thể đáp ứng các yêu cầu xử lý dữ liệu lớn, bên cạnh nhu cầu trao đổi dữ liệu giữa các vị trí lưu trữ phân tán khác nhau. Điện toán đám mây cung cấp các giải pháp và giải quyết các vấn đề với dữ liệu lớn. Điện toán đám mây được xây dựng cho khối lượng công việc có mục đích chung và tập hợp tài nguyên được sử dụng để cung cấp tính linh hoạt theo yêu cầu. Do đó, môi trường điện toán đám mây dường như rất phù hợp với dữ liệu lớn. Các lợi ích khi phân tích dữ liệu lớn trong đám mây: Cải thiện phân tích, cơ sở hạ tầng đơn giản hóa, Giảm chi phí, bảo mật và quyền riêng tư. Công nghệ trí tuệ nhân tạo, dữ liệu lớn và trí tuệ nhân tạo có mối quan hệ cộng hưởng. AI yêu cầu quy mô dữ liệu khổng lồ để tìm hiểu và cải thiện quy trình ra quyết định và phân tích dữ liệu lớn tận dụng AI để phân tích dữ liệu tốt hơn. Bằng cách kết hợp dữ liệu lớn và công nghệ AI, các doanh nghiệp bán lẻ có thể cải thiện hiệu suất và hiệu quả kinh doanh bằng cách: Dự đoán và tận dụng các xu hướng thị trường và ngành mới nổi; phân tích hành vi người tiêu dùng và tự động hóa phân khúc khách hàng; cá nhân hóa và tối ưu hóa hiệu suất của các chiến dịch tiếp thị kỹ thuật số; Sử dụng các hệ thống hỗ trợ quyết định thông minh được thúc đẩy bởi dữ liệu lớn, AI và phân tích dự đoán.
- 160 KỶ YẾU HỘI THẢO QUỐC TẾ “THƯƠNG MẠI VÀ PHÂN PHỐI“ LẦN THỨ 4 NĂM 2023 Công nghệ thực tế tăng cường và thực tế ảo, sự kết hợp giữa AR và VR có thể mở ra một thế giới khả năng để sử dụng dữ liệu lớn tốt hơn. VR và AR trên thực tế có thể cải thiện cách cảm nhận dữ liệu và thực sự có thể là giải pháp để tận dụng lượng lớn dữ liệu chưa sử dụng. Bằng cách trình bày dữ liệu ở dạng 3D, người dùng sẽ có thể giải mã những điểm chính từ dữ liệu tốt hơn và nhanh hơn với sự hiểu biết dễ dàng hơn. Việc trực quan hóa dữ liệu lớn bằng VR và AR có thể cắt giảm đáng kể thời gian dành cho phân tích dữ liệu khách hàng. Công nghệ AR và VR cũng là cách để không lãng phí khối lượng dữ liệu lớn về khách hàng được tạo và thu thập cũng như hiểu rõ hơn về chúng. Công nghệ chuỗi khối (Blockchain), việc kết hợp chuỗi khối và dữ liệu lớn sẽ mở ra rất nhiều cơ hội trong bán lẻ tại các doanh nghiệp. Chuỗi khối thực sự có thể khắc phục nhiều thách thức về dữ liệu lớn và cuối cùng sẽ làm cho dữ liệu trở nên có giá trị hơn vì nó mang lại chất lượng và bảo mật tốt hơn. Chuỗi khối mang lại các lợi ích trong quá trình chuyển đổi dữ liệu lớn: Kiểm soát việc chia sẻ dữ liệu; tìm kiếm thông tin giao dịch đưa ra quyết định sáng suốt hơn về hành động của mình và nhận ra các xu hướng mới trong việc sử dụng tiền điện tử; bảo mật dữ liệu nâng cao; ngăn chặn gian lận; nâng cao chất lượng dữ liệu và truy cập dễ dàng; cung cấp thông tin chi tiết theo thời gian thực. Công nghệ Robotics, có thể coi công nghệ này là sức mạnh tổng hợp của các công nghệ đa chiều cho không gian bán lẻ, tăng cường các quy trình bán lẻ. Đặc biệt, sự hợp nhất của các công nghệ: dữ liệu lớn và phân tích; tính di động và điện toán toàn diện; điện toán đám mây; truyền thông xã hội và trí tuệ nhân tạo và Robotics làm tăng sức mạnh cho không gian bán lẻ. Sử dụng thẻ RFID gắn vào kệ hàng, sản phẩm và cách bố trí cửa hàng có thể giúp nắm bắt dữ liệu về sở thích, chuyển động, quyết định mua hàng và thậm chí cả xu hướng mua hàng của khách hàng. Mặt khác, với sử dụng kệ thông minh - là sản phẩm phụ của việc kết hợp IoT trong lĩnh vực quản lý hàng tồn kho của ngành bán lẻ. Kệ thông minh tạo điều kiện giám sát tự động hàng tồn kho và gửi cảnh báo tới các cơ quan chức năng liên quan nếu một mặt hàng nào đó sắp hết hàng hoặc sắp hết hạn sử dụng. Tương tự như vậy, thẻ RFID được gắn vào sản phẩm kết hợp với phân tích theo quy định và dự đoán có thể giúp khách hàng đưa ra quyết định mua hàng chính xác nhất. 2. THỰC TRẠNG ỨNG DỤNG CÔNG NGHỆ DỮ LIỆU LỚN TẠI CÁC DOANH BÁN LẺ VIỆT NAM Trong những năm gần đây, các doanh nghiệp bán lẻ đã và đang nhận thấy lợi ích và cơ hội mang lại của công nghệ số và đặc biệt là của dữ liệu lớn như: giúp cho việc phân tích thị trường cạnh tranh và sự quan tâm của khách hàng. Dữ liệu lớn giúp xác định hành trình trải nghiệm, xu hướng mua sắm và sự hài lòng của khách hàng. Thông qua dữ liệu lớn thu thập được và các công nghệ số hiện đại có thể cải thiện hiệu suất và hiệu quả bán hàng cho các doanh nghiệp bán lẻ của mình. Dưới đây là một số thực trạng ứng dụng công nghệ dữ liệu lớn và một số công nghệ số khác tại Việt Nam trong những năm gần đây: Hãng sơn Dulux đã ứng dụng công nghệ AR kết hợp dữ liệu lớn để khách hàng có thể thử các màu sơn trên bức tường nhà mình trước khi họ quyết định có nên mua sản phẩm sơn nào đó hay không. Hay như của hàng trực tuyến Sephora (chính thức có tại Việt Nam vào tháng 3/2022) đã ứng dụng công nghệ AR để các khách hàng có thể trải nghiệm các sản phẩm mỹ phẩm mà không cần sử dụng trực tiếp lên da mặt.
- THE 4TH INTERNATIONAL CONFERENCE PROCEEDINGS COMMERCE AND DISTRIBUTION 161 Chuỗi cửa hàng Walgreen Việt Nam đã sử dụng điện toán đám mây và các công cụ phân tích dữ liệu lớn bán lẻ để cải thiện hiệu quả dịch vụ hỗ trợ tại cửa hàng để cải thiện dịch vụ hỗ trợ khách hàng. Các công cụ phân tích dữ liệu lớn được đưa vào sử dụng tại 8.100 cửa hàng để xác định địa điểm và thời điểm các cuộc gọi từ khách hàng diễn ra thường xuyên nhất, giải quyết tất cả các vấn đề này và giải phóng nhân sự. Với phân tích dữ liệu lớn trong bán lẻ, có sự sự hợp tác của Pantene và Walgreen và Kênh thời tiết. Kênh thời tiết đã thu thập dữ liệu về mức độ ẩm trong không khí và thời gian sẽ cao nhất. Điều này đã giúp Pantene và Walgreen quảng cáo sản phẩm của họ liên quan đến các vấn đề về tóc mà người phụ nữ có thể gặp phải do độ ẩm trong không khí tăng lên. Qua đó, phụ nữ tìm kiếm ngày càng tăng lên về sản phẩm tại các cửa hàng địa phương của họ để ngăn mình khỏi bất kỳ vấn đề về tóc tăng lên rõ rệt. Chuỗi siêu thị bán lẻ Walmart cũng đã triển khai trí tuệ nhân tạo và học máy để dự đoán các nhu cầu của khách hàng và tối ưu hóa hoạt động của họ. Từ năm 2015, Walmart đã thử nghiệm phần mềm nhận dạng khuôn mặt để cải thiện trải nghiệm khách hàng. Phần mềm nhận dạng khuôn mặt kết hợp máy có khả năng nhận biết mức độ thất vọng của khách hàng khi thanh toán và kích hoạt cảnh báo để đại diện dịch vụ khách hàng xử lý vấn đề. Công ty cổ phần Mondelez Kinh Đô đã triển khai ứng dụng dữ liệu lớn và trí tuệ nhân tạo trong công tác quản lý bán hàng. Theo cách ứng dụng này việc khai thác dữ liệu, việc xử lý đơn hàng rất dễ dàng và nhanh chóng thông qua việc gợi ý đơn hàng một cách chính xác và hiệu quả cho cửa hàng bán lẻ, đặc biệt dữ liệu được cá nhân hoá theo từng điểm bán. Mondelez Kinh Đô cũng đã mở rộng triển khai giải pháp dữ liệu lớn và ứng dụng tri tuệ nhân tạo trong hoạt động kinh doanh với các đối tác bán lẻ của mình. Giai đoạn thử nghiệm ứng dụng dữ liệu lớn và trí tuệ nhân tạo đã triển khai tại hơn 22.000 cửa hàng và cho thấy kết quả doanh thu tại những nơi có triển khai ứng dụng bán hàng với trí tuện nhân tạo đạt mức tăng trưởng cao hơn 30% trong 3 tháng gần nhất. Với kết quả đó, Mondelez Kinh Đô đặt mục tiêu mở rộng triển khai dự án này tại tất cả các cửa hàng vào đầu năm 2022. Giải pháp Vision AI cho phép: Thống kê lưu lượng người, phương tiện, vật thể; nhận diện khuôn mặt; phân tích đặc điểm và hành vi; nhận diện vật thể. Vision AI Đã được triển khai tại Trung tâm thương mại Vincom Mega Mall Times City đã và đang thúc đẩy trải nghiệm khách hàng tại điểm bán, tối ưu quản trị vận hành và ghi nhận những kết quả vượt trội như đo đếm và phân tách thông tin trung bình của 126,000 khách hàng/ngày đến mua sắm và tham quan. Công ty cổ phần công nghệ Sendo đã phân tích dữ liệu lớn trên 5 triệu sản phẩm được bán bởi trên 80.000 cửa hàng đòi hỏi sự chuyên nghiệp trong quá trình xử lý, nhằm bảo đảm loại trừ chính xác hàng giả, hàng nhái; và kiểm tra độ tin cậy về giá bán cuối cùng của các của hàng trong thời gian Lễ hội bán hàng. Chợ Tốt (thuộc Tập đoàn Carousell) là đơn vị ứng dụng dữ liệu kinh doanh khá thành công. Việc ứng dụng dữ liệu lớn về dòng xe, giá xe để đưa ra gợi ý giá cả các mẫu xe, giúp người bán dễ dàng quyết định hơn trong quá trình đăng bán, cũng dựa vào dữ liệu hành vi tìm kiếm của người dùng để đưa ra những gợi ý mẫu xe phù hợp nhất với nhu cầu khách hàng. Trên thực tế trên thực tế dữ liệu lớn đang được ứng dụng vào mọi lĩnh vực của nền kinh tế - xã hội, tạo những chuyển biến tích cực, giúp gia tăng hiệu quả và tăng năng suất của tổ chức và doanh nghiệp.
- 162 KỶ YẾU HỘI THẢO QUỐC TẾ “THƯƠNG MẠI VÀ PHÂN PHỐI“ LẦN THỨ 4 NĂM 2023 Trong bán lẻ, dữ liệu lớn mang lại nhiều cơ hội bằng cách phân tích thị trường cạnh tranh và sự quan tâm của khách hàng đến doanh nghiệp. Việc phân tích này dựa trên các tập dữ liệu lớn về khách hàng mà doanh nghiệp thu thập được. Nó hỗ trợ xác định hành trình trải nghiệm, xu hướng mua sắm và sự hài lòng của khách hàng. Do vậy, phân tích dữ liệu lớn đưa ra nhiều thông tin còn tiềm ẩn, mối tương quan ẩn, xu hướng có ý nghĩa và các thông tin chi tiết khác giúp cho cải thiện hiệu suất và hiệu quả bán hàng của các doanh nghiệp. Những ứng dụng hiệu quả của big data trong bán lẻ giúp cho doanh nghiệp bán lẻ thực hiện tốt cá nhân hóa trải nghiệm khách hàng, phân tích hành trình khách hàng, dự đoán nhu cầu khách hàng và tối ưu hiệu quả hoạt động kinh doanh của mình. Dữ liệu lớn giúp nhà quản lý xây dựng chiến lược kinh doanh mới để phù hợp với xu hướng sự thay đổi (hành vi, nhu cầu,...) của khách hàng. Nhà bán lẻ có thể biết nhóm các khách hàng nào thường xuyên mua sắm các mặt hàng nào, nhóm các mặt hàng mà khách hàng thường xuyên mua cùng nhau, nhóm các mặt hàng nào mà bán được ít nhất, doanh thu bán được cho các khách hàng thường xuyên mua sắm này với một ngướng tối thiểu là bao nhiêu,.... Qua đó, nhà bán lẻ cần xác định bố trí các sản phẩm trên kệ hàng một cách phù hợp nhất để đánh trúng tâm lý của khách hàng cũng như cần đề ra chiến lược kinh doanh mới, tối ưu nhất nhằm giảm chi phí, tăng doanh thu cho doanh nghiệp. Phân tích dữ liệu lớn trong bán lẻ cho phép các doanh nghiệp tạo các đề xuất cho khách hàng dựa trên lịch sử mua hàng, sở thích, thói quen mua sắm, nhân khẩu học,... Kết quả của phân tích dữ liệu lớn là cơ sở để phân tích thị trường, dự báo xu hướng và đưa ra quyết định chiến lược của doanh nghiệp bán lẻ. Để phân tích dữ liệu lớn hiệu quả tốt nhất cho doanh nghiệp thì cần có công cụ (phần mềm) phân tích dữ liệu, nhưng để có phần mềm tốt cần có thuật toán tốt. Trong phần tiếp theo chúng tôi đề xuất một giải pháp phân tích dữ liệu lớn trong các doanh nghiệp bán lẻ bằng phương pháp định tính. Ở đó, sử dụng thuật toán khai phá dòng dữ liệu lớn hỗ trợ cho các doanh nghiệp bán lẻ tại Việt Nam. 3. GIẢI PHÁP ỨNG DỤNG THUẬT TOÁN KHAI TẬP PHỔ BIẾN VỚI TRỌNG SỐ TRÊN PHÁ DÒNG DỮ LIỆU TRONG BÁN LẺ 3.1. Đánh giá nghiệp vụ kinh doanh Giả sử một doanh nghiệp bán lẻ (siêu thị, đại siêu thị, trung tâm mua sắm,,...) bán hàng hóa hay dịch vụ cho khách hàng để họ sử dụng vào mục đích cá nhân khác nhau. Hàng hóa hay dịch vụ của doanh nghiệp bán lẻ có cơ cấu chủng loại hàng hoá phong phú, đa dạng, bảo đảm chất lượng. Doanh nghiệp bán lẻ kinh doanh với số lượng lớn các mặt hàng (có thể hàng nghìn, đến hàng trăm nghìn mặt hàng khác nhau) và theo đơn vị thời gian (ngày, tuần, tháng, quý,...) doanh nghiệp có mối quan hệ giao dịch (số lượng khách hàng) rất lớn và các khách hàng có thể mua hàng chục nghìn đến hàng trăm nghìn đơn hàng trong một đơn vị thời gian. Mặt khác, các khách hàng đến với doanh nghiệp tùy theo các yếu tố tác động như: mức độ chi tiêu, nhân khẩu học, độ tuổi, giới tính,... mà hành vi mua của khách hàng là khác nhau. Nhưng qua quan sát, thống kê, kinh nghiệm nhận thấy: Trong mỗi giỏ hàng (giao dịch) đều có mối liên hệ mật thiết với nhau như: có một mặt hàng/nhóm mặt hàng mà khách hàng thường xuyên mua cùng nhau (lớn hơn một ngưỡng
- THE 4TH INTERNATIONAL CONFERENCE PROCEEDINGS COMMERCE AND DISTRIBUTION 163 nào đó) trong cùng một giỏ hàng; có nhóm mặt hàng thường xuyên xuất hiện cùng nhau (lớn hơn một ngưỡng nào đó) trong các giỏ hàng mà khách hàng thường xuyên mua. Theo chiều thời gian thì một mặt hàng/nhóm mặt hàng được khách hàng mua tại thời điểm hiện tại có mức độ quan trọng hơn một mặt hàng/nhóm mặt hàng được khách hàng mua tại những thời điểm trước đó. Mức độ quan trọng này được gọi là trọng số. Các trọng số này được đánh theo ngày với nguyên tắc như sau: Tại thời điểm T1, xét một lô bao gồm n ngày, mỗi ngày có nhiều giao dịch (giỏ hàng) mà khách hàng đã mua. Mỗi giao dịch bao gồm mã định danh giao dịch và các mặt hàng mà khách hàng mua, thì sẽ có n trọng số được đánh theo theo thứ tự tăng dần từ ngày thứ nhất đến ngày thứ n. Sang thời điểm T2, không xét các giao dịch của ngày thứ nhất (của thời điểm T1) nhưng sẽ bổ sung thêm các giao dịch của ngày thứ (n+1). Các trọng số lại được gán lại cho n ngày mới của thời điểm T2 như trên. Đối với các thời điểm T3, T4,... được giải thích tương tự. Dựa trên dữ liệu các giỏ hàng mà khách hàng mua, các trọng số được gán cho các ngày tại các thời điểm, một ngưỡng tối thiểu nào đó được cho trước. Yêu cầu của bài toán: Tại mỗi thời điểm T1, T2, T3,...doanh nghiệp bán được các mặt hàng (đã được thu thập dữ liệu), với mức độ quan trọng của việc xuất hiện các mặt hàng đó theo ngày, với một ngưỡng tối thiểu cho trước thì: mặt hàng/nhóm mặt hàng nào thường xuyên xuất hiện cùng nhau? Để cho tiện theo dõi ta có thể xét trường hợp cụ thể như sau: Xét tại thời điểm T1, có một cửa sổ với kích cỡ là 4 lô (giả sử tương ứng cho 4 ngày), ký hiệu các lô tính từ 3 ngày trước đó đến ngày hiện tại là W14, W13, W12, W11. Mỗi lô có nhiều giao tác (giỏ hàng). Với mỗi giao tác có định danh các giỏ hàng và tên các mặt hàng tron các giỏ đó. Trọng số của các lô W14, W13, W12, W11 được gán tương ứng 0.1, 0.2, 0.3 và 0.4. Việc gán trọng số theo thứ tự tăng dần này đảm bảo những giao tác của lô mới nhất bao giờ cũng có trọng số lớn hơn của các lô trước đó (xem Hình 2). Xét thời điểm T2, loại bỏ lô W14 (lô cũ nhất tại thời điểm T1), cập nhật lô W21 (lô xuất hiện mới nhất được bổ sung vào tại thời điểm T2). Ba lô W13, W12, W11 (tại thời điểm T1) sau khi chuyển sang thời điểm T2 được được gán lại là các lô W24, W23, W22 (tại thời điểm T2) tương ứng 0.1, 0.2, 0.3 và 0.4 (xem Hình 2). Lưu ý: (1) Việc loại bỏ một lô cũ nhất (tại thời điểm trước đó) và bổ sung một lô mới (tại thời điểm hiện tại) để luôn luôn đảm bảo kích cỡ của sổ là 4. (2) Trọng số của các lô tại các thời điểm luôn được gán cho từ lô cũ tới lô mới luôn luôn là 0.1, 0.2, 0.3 và 0.4 tương ứng. Việc gán trọng số theo thứ tự tăng dần này đảm bảo những giao tác của lô mới nhất trong cửa sổ bao giờ cũng có trọng số lớn hơn của các lô trước đó. Trong kịch bản này chúng tôi lấy ví dụ xét cho 2 thời điểm T1 và T2. Đối với xét tại các thời điểm tiếp theo T3, T4, T5,... của dòng dữ liệu cũng được giải thích tương tự như trên. Các ký hiệu a, b, c, d và e là tên các mặt hàng Thẻ nhớ, Pin sạc dự phòng, Ốp lưng, Tai nghe và Miếng dán màn hình tương ứng.
- 164 KỶ YẾU HỘI THẢO QUỐC TẾ “THƯƠNG MẠI VÀ PHÂN PHỐI“ LẦN THỨ 4 NĂM 2023 Hình 2. Thông tin về lô, định danh giỏ hàng, giỏ hàng, trọng số các lô tại thời điểm T1, T2 3.2. Xác định nguồn dữ liệu, lọc, trích xuất, tổng hợp dữ liệu Để tập trung vào các bước chính trong phân tích dữ liệu lớn, trong nội dung này chúng tôi sử dụng tập dữ liệu chính là các bảng bảng dữ liệu trong hình 2 (mục 3.1) coi như đã trải qua các bước xác định nguồn dữ liệu, lọc, trích xuất, tổng hợp dữ liệu. 3.3. Phân tích dữ liệu Để tiến hành phân tích dữ liệu chúng tôi sử dụng thuật toán khai phá tập mục (mặt hàng) phổ biến với trọng số trên dòng dữ liệu được mô tả như dưới đây. Nội dung chi tiết của của thuật toán có thể xem trong (Long, 2014). Giới thiệu thuật toán SWFP-miner SWFP-miner là thuật toán khai phá tập mục (mặt hàng) phổ biến với trọng số trên dòng dữ liệu được phát triển từ đề xuất bởi (Tsai P. S, 2009). Thuật toán SWFP-miner được đề xuất bởi (Long, 2014), SWFP-miner gồm 2 pha: (1) Xây dựng cấu trúc cây cho cửa sổ hiện thời, gọi là SWFI-tree và (2) khai phá các cây điều kiện của SWFI-tree để tìm ra các TMTX theo phương pháp FP-growth. Pha 1, Xây dựng cây SWFI-tree: Bao gồm một cấu trúc cây và một Bảng đầu mục. Tuy nhiên, để xây dựng SWFI-tree chỉ cần quét toàn bộ CSDL một lần. Bảng đầu mục lưu trữ các mục theo thứ tự từ điển, thông tin về trọng số, tần số của mỗi mục trong mỗi lô và con trỏ trỏ đến nút cùng tên đầu tiên trong SWFI-tree. SWFI-tree gồm một nút gốc gọi là nút ”null” (kí hiệu là {}) và một tập các cây tiền tố là các cây con của nút gốc. Các giao tác của mỗi lô trong CSDL sẽ lần lượt được chèn lên cây theo thứ tự từ điển của các mục. Ngoại trừ nút gốc, mỗi nút của SWFI-tree ghi lại tên của mục mà nó đại diện, thông tin về tần số xuất hiện của nút trong mỗi lô trên đường đi từ gốc đến nó và các con trỏ trỏ đến nút cha, nút con, nút cùng tên tiếp theo trên cây. Khi một nút mới được tạo ra trên cây bởi việc chèn một giao tác từ lô thứ k của cửa sổ hiện tại gồm N lô, thì tại đó một danh sách gồm N giá trị tần số trong N lô sẽ được khởi tạo với giá trị bằng 1 tại vị trí thứ k, giá trị bằng 0 tại tất cả các vị trí còn lại.
- THE 4TH INTERNATIONAL CONFERENCE PROCEEDINGS COMMERCE AND DISTRIBUTION 165 Pha 2, Khai phá các cây điều kiện của SWFI-tree để tìm ra các TMTX theo phương pháp FP-growth (Han và cs, 2004). Nội dung thuật toán SWFP-miner đã được đề xuất như sau: Cụ thể thuật toán xây dựng cây SWFI-tree và thuật toán SWFP-miner khai phá, cập nhật cây SWFI-tree có thể xem chi tiết trong (Long, 2014). Ứng dụng thuật toán SWFP-miner Giả sử dữ liệu đầu vào phục vụ cho quá trình khai phá dữ liệu tại các thời điểm T1, T2 được cho trong Bảng 2 và với độ hỗ trợ tối thiểu cho trước là minsupp=20%. Tại thời điểm T1, qua các bước của thuật toán SWFP-miner (Long, 2015), tiến hành khai phá cây SWFI-tree, với độ hỗ trợ tối thiểu minsup=20%, tính được độ hỗ trợ với trọng số tối thiểu , ta thu được tập các tập mục (mặt hàng) phổ biến L như sau: Sau khi giải mã cho tên các mặt hàng ta thu được tập các tập mặt hàng phổ biến với trọng số trên dòng dữ liệu như trong Bảng 2. Bảng 2. Tập mặt hàng phổ biến cùng độ hỗ trợ với trọng số tại thời điểm T1 TT Tập các tập phổ biến với trọng số Độ hỗ trợ với trọng số 1 Thẻ nhớ 1.2 2 Pin sạc dự phòng 1.8 3 Ốp lưng 2.2 4 Tai nghe 1.4 5 Miếng dán màn hình 1.0 6 Ốp lưng, Miếng dán màn hình 0.9 7 Pin sạc dự phòng, Tai nghe 1.0 8 Ốp lưng, Tai nghe 1.1 9 Pin sạc dự phòng, Ốp lưng, Tai nghe 0.7 10 Thẻ nhớ, Ốp lưng 0.6 11 Pin sạc dự phòng, Ốp lưng 1.1 12 Thẻ nhớ, Pin sạc dự phòng 0.6
- 166 KỶ YẾU HỘI THẢO QUỐC TẾ “THƯƠNG MẠI VÀ PHÂN PHỐI“ LẦN THỨ 4 NĂM 2023 3.3. Kết quả phân tích cuối cùng Tại thời điểm T1: Qua thuật toán SWFP-miner khai phá dữ liệu theo dòng với với độ hỗ trợ tối thiểu minsup=20%, ta thu được tập mặt hàng phổ biến cùng độ hỗ trợ với trọng số tại thời điểm T1 (trong Bảng 2) và tiến hành thực hiện để có kết quả phân tích như dưới đây: Trước hết từ Bảng 2 ta sắp xếp với độ hỗ trợ với trọng số của các mặt hàng/nhóm theo thứ tự giảm dần ta thu được Bảng 3. Bảng 3. Tập các tập phổ biến với trọng số cùng độ hỗ trợ với trọng số theo thứ tự giảm dần tại thời điểm T1 TT Tập các tập phổ biến với trọng số Độ hỗ trợ với trọng số 1 Ốp lưng 2.2 2 Pin sạc dự phòng 1.8 3 Tai nghe 1.4 4 Thẻ nhớ 1.2 5 Ốp lưng, Tai nghe 1.1 6 Pin sạc dự phòng, Ốp lưng 1.1 7 Miếng dán màn hình 1.0 8 Pin sạc dự phòng, Tai nghe 1.0 9 Ốp lưng, Miếng dán màn hình 0.9 10 Pin sạc dự phòng, Ốp lưng, Tai nghe 0.7 11 Thẻ nhớ, Ốp lưng 0.6 12 Thẻ nhớ, Pin sạc dự phòng 0.6 + Có 12 tập mặt hàng/nhóm hàng phổ biến xuất hiện trong các giỏ hàng thoả mãn ngưỡng độ hỗ trợ tối thiểu minsupp=20%. + Tất cả các mặt hàng đơn đều là mặt hàng phổ biến, thoả mãn ngưỡng minsupp và các mặt hàng đơn này là: “Thẻ nhớ”, “Pin sạc dự phòng”, “Ốp lưng”, “Tai nghe” và “Miếng dán màn hình”. + Có 3 mặt hàng đơn “Ốp lưng: 2.2”, “Pin sạc dự phòng: 1.8” và “Tai nghe: 1.4” có độ hỗ trợ với trọng số lớn nhất lần lượt là 2.2, 1.8 và 1.4 thoả mãn ngưỡng minsupp. + Nhóm khách hàng thường xuyên mua mặt hàng “Ốp lưng” là T2, T3, T4, T5, T6, T8, T8, T10, T11, T11. + Có 2 nhóm mặt hàng cùng với độ hỗ trợ với trọng số thấp nhất là: “Thẻ nhớ, Ốp lưng: 0.6” và “Thẻ nhớ, Pin sạc dự phòng: 0.6” thoả mãn ngưỡng minsupp. + Nhóm khách hàng thường xuyên mua nhóm mặt hàng “Thẻ nhớ, Ốp lưng” là 8 và T12. + Nhóm khách hàng thường xuyên mua nhóm mặt hàng “Thẻ nhớ, Pin sạc dự phòng” là T7 và T13. + Có 7 nhóm mặt hàng có xuất hiện cùng nhau trong các giỏ hàng, thoả mãn ngưỡng minsupp và đồng thời mức độ quan trọng của nhóm các mặt hàng đó lần lượt là: “Ốp lưng, Tai nghe: 1.1”, “Pin sạc dự phòng, Ốp lưng: 1.1”,..., “Thẻ nhớ, Pin sạc dự phòng: 0.6”.
- THE 4TH INTERNATIONAL CONFERENCE PROCEEDINGS COMMERCE AND DISTRIBUTION 167 + Có 3 nhóm 2 mặt hàng mà khách hàng thường xuyên mua là “Thẻ nhớ, Pin sạc dự phòng”, “Pin sạc dự phòng, Ốp lưng” và “Thẻ nhớ, Ốp lưng” nhưng không khách hàng nào mua đồng thời cả 3 mặt hàng này xuất hiện cùng nhau. + Có 1 nhóm 3 mặt hàng (nhiều mặt hàng nhất) xuất hiện cùng nhau trong các giỏ hàng là: “Pin sạc dự phòng, Ốp lưng, Tai nghe: 0.7” thoả mãn ngưỡng minsupp. + Nhóm khách hàng thường xuyên mua nhóm mặt hàng có nhiều mặt hàng xuất hiện cùng nhau “Pin sạc dự phòng, Ốp lưng, Tai nghe” xuất hiện trong các giỏ hàng là T3, T4, T6 và T9. + Không có nhóm khách hàng nào mua nhiều hơn 3 mặt hàng xuất hiện cùng nhau trong các giỏ hàng thoả mãn ngưỡng minsupp. Tại thời điểm T2: Tại thời điểm T2, để khi xoá lô cũ (W14), cập nhật lô mới (W21), đánh số lại các lô tại thời điểm này. Tiến hành sử dụng thuật toán cập nhật cây SWFI-tree và thuật toán khai phá cây SWFP-miner với ngưỡng độ hỗ trợ tối thiểu minsup=20%, (sau khi cập nhật cây SWFI- tree) trong (Long, 2014). Quá trình khai phá để thu được tập mặt hàng phổ biến cùng độ hỗ trợ với trọng số tại thời điểm T2 tương tự như trong thời điểm T1. Tại các thời điểm tiếp theo T3, T4, T5,...: Lập luận tương tự với thời điểm T2 cho quá trình cập nhật và khai phá cây SWFI-tree. Một điểm đặc biệt lưu ý, với dự kiến các lô, các ngưỡng minsupp khác nhau, tại các thời điểm khác nhau thì sẽ kết quả khai phá cũng khác nhau. 3.5. Đánh giá kết quả khai khá dòng dữ liệu hỗ trợ ra quyết định - Qua kết quả phân tích dữ liệu trên ta có thể biết được một mặt hàng hay nhóm các mặt hàng phổ biến xuất hiện cùng nhau với ngưỡng minsupp cho trước tại một thời điểm. Qua dữ liệu khai phá, các nhà phân tích dữ liệu, các chuyên gia, nhà quản lý thì DN có thể xây dựng kịch bản cho chiến lược hoạt động marketing, E-marketing trong tương lai, ở đó phải trả lời các câu hỏi: + Chọn ngưỡng minsupp nào có thể là (tương đối) tốt nhất trong bán lẻ của doanh nghiệp? + Nên mua/đầu tư các mặt hàng/nhóm mặt hàng nào trong lĩnh vực bán lẻ? + Nhóm các mặt hàng nào có mức độ quan trong lớn nhất/tháp nhất? + Các mặt hàng nào không nên mua/đầu tư? hay phải có chính sách khuyến mại, giảm giá để có thể tránh tồn kho đối với các nhóm mặt hàng này? + Nên bố trí, sắp xếp thiết kế các kệ hàng sao cho có nhóm các mặt hàng (như phân tích ở trên) gần nhau tại cửa hàng bán lẻ/siêu thị/ đại siêu thị,...? + Có chiến lược khuyến mại, mời chào khách hàng thông qua các kênh tiếp thị cũng cần quan tâm đến nhóm các mặt hàng thường xuyên xuất hiện cùng nhau trong các giỏ hàng mà khách hàng đã mua trước đó nhằm khách hàng có sự lựa chọn tốt nhất cho mình với các nhóm mặt hàng đó. + Nên có chương trình khuyến mại, thẻ giảm giá,... đối với nhóm các mặt hàng thường xuyên xuất hiện cùng nhau qua các kênh truyền thông, các trang mạng xã hội để chuyển tới nhóm khách hàng tiềm năng mà doanh nghiệp nhận định qua quá trình phân tích dữ liệu?
- 168 KỶ YẾU HỘI THẢO QUỐC TẾ “THƯƠNG MẠI VÀ PHÂN PHỐI“ LẦN THỨ 4 NĂM 2023 + Nên thiết kế các mẫu quảng cáo, tờ rơi,... như thế nào đó để có thể gửi cho nhóm khách hàng tiềm năng qua kênh truyền thông, các trang mạng xã hội. + Sau mỗi chu kỳ đánh giá dựa trên số lô (số ngày) trong cửa sổ (số giao dịch bán theo ngày), ngưỡng độ hỗ trợ minsupp thì các nhà phân tích, các chuyên gia, nhà quản lý doanh nghiệp bán lẻ cần phải điều chỉnh lại các chỉ số này nhằm đưa ra các quyết định tối ưu, mang lại hiệu quả tốt nhất. 4. Kết luận Bài viết đã tập trung nghiên cứu những khái niệm cơ bản về dữ liệu lớn, phân tích dữ liệu lớn - một công nghệ số hiện đại. Bài viết cũng nghiên cứu dữ liệu lớn, phân tích dữ liệu lớn và giới thiệu về ứng dụng công nghệ dữ liệu lớn trong một số doanh nghiệp bán lẻ trên thế giới. Đồng thời, bài viết chỉ ra thực trạng ứng dụng dữ liệu lớn tại một số doanh nghiệp bán lẻ Việt Nam. Qua đó, bài viết đề xuất một giải pháp ứng dụng dữ liệu lớn hỗ trợ doanh nghiệp bán lẻ tại Việt Nam bởi thuật toán SWFP-miner khai phá tập mục phổ biến với trọng số trên dòng dữ liệu sử dụng mô hình cửa sổ trượt nhằm tăng doanh số bán hàng và tạo ra lợi thế cạnh tranh với các thủ khác trong bối cảnh nền kinh tế mới. Bài viết nghiên cứu một trường hợp (case study) cho quá trình khai phá dữ liệu trên dòng, phân tích, xây dựng kịch bản với một cơ sở dữ liệu bán lẻ (với ít lô, ít giao dịch) nhưng vẫn vẫn đảm bảo tính khoa học và thực tiễn. Kết quả của thuật toán SWFP-miner khai phá tập mục phổ biến với trọng số trên dòng dữ liệu sử dụng mô hình cửa sổ trượt sẽ giúp nhà phân tích, các chuyên gia, nhà quản lý doanh nghiệp bán lẻ có thể xây dựng các kịch bản cho hoạt động kinh doanh bán lẻ tại doanh nghiệp của mình. Hướng nghiên cứu tiếp theo chúng tôi sẽ nghiên cứu ứng dụng các thuật toán khai phá dữ liệu có yếu tố thời gian, trên các cơ sở dữ liệu giao tác, dòng dữ liệu, các mục dữ liệu có gắn trọng số, các mục dữ liệu có thể xuất hiện nhiều hơn một lần trong các giao tác,... Hơn nữa, chúng tôi cũng sẽ tiến hành nghiên cứu xây dựng các phần mềm để thực nghiệm trên các cơ sở dữ liệu bán lẻ mang tính thực tiễn cao hơn. TÀI LIỆU THAM KHẢO TIẾNG ANH Han, J., Pei, J., Yin, Y., Mao, R. (2004), Mining frequent patterns without candidate generation: a frequent-pattern tree approach, Data Mining and Knowledge Discovery 8, pp. 53-87, (2004). Kantardzic M. (2003), Data Mining: Concepts, Models, Method, and Algorithms, John Wiley & Sons, New York, NY. Margaret H. Dunham, Yongqiao Xiao, Le Gruenwald, Zahid Hossain (1997), A Survey of Association Rules, IEEE Press. Philip Kotler, Gary Armstrong (2021), Principles of Marketing, Person Global Edition. Tsai P. S. M., (2009), Mining frequent itemsets in data streams using the weighted sliding window model, Expert Systems with Applications, pp. 11617-11625, (2009).
- THE 4TH INTERNATIONAL CONFERENCE PROCEEDINGS COMMERCE AND DISTRIBUTION 169 TIẾNG VIỆT Viktor Mayer-Schonberger and Kenneth Cukier (2019). Dữ liệu lớn. Nhà xuất bản Trẻ. Bernard Marr (2019). Chiến lược dữ liệu. Nhà xuất bản Tổng hợp Thành phố Hồ Chí Minh. Đỗ Phúc (2017), Giáo trình Khai phá dữ liệu, Nhà xuất bản Đại học Quốc gia Thành phố Hồ Chí Minh. Nguyễn Hưng Long (2014), Thuật toán hiệu quả khai phá tập mục thường xuyên với trọng số trên dòng dữ liệu sử dụng mô hình cửa sổ trượt, Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông - Đắk Lắk, 30-31/10/2014. Nguyễn Hưng Long (2018), Ứng dụng một số thuật toán trong bài toán khai thác dữ liệu cho hoạt động kinh doanh thương mại, Đề tài NCKH và CN cấp cơ sở, Trường Đại học Thương mại. Linsay Herbert (Nguyễn Bích Phương dịch), (2020), Digital Transformation - Chuyển đổi số 5 giai đoạn triển khai công nghệ số cho doanh nghiệp, Alphabooks, Nhà xuất bản Thông tin và Truyền Thông. Mark Raskino & Graham Waller (Phạm Anh Tuấn, Huỳnh Hữu Tài dịch), (2020), Chuyển đổi số đến cốt lõi nâng tầm năng lực lãnh đạo cho ngành nghề, doanh nghiệp và chính bản thân bạn, Nhà xuất bản Thông tin và Truyền Thông. Vũ Xuân Thức, Kim Minh (2020), Chuyển đổi số lấy khách hàng làm trung tâm, Công ty TNHH Hearme. CÁC TRANG WEB https://aramex.vn/ https://aws.amazon.com/ https://ictvietnam.vn/ https://investbook.vn https://insights.magestore.com/ https://fsivietnam.com.vn/ https://vinbigdata.com/ https://firstnews.com.vn/ https://vneconomy.vn/ https://mobiwork.vn/ https://www.statista.com/ https://www.techsignin.com/ https://anywhere.epam.com/business/big-data-analytics-in-retail https://www.netguru.com/blog/iot-and-big-data-in-retail https://www.c-sharpcorner.com/article/big-data-and-cloud-computing-a-perfect-combination/ https://rpradeepmenon.medium.com/new-retail-how-big-data-and-ai-are-fuelling-retail- transformation-76c81105c82d- https://www.datasciencecentral.com/big-data-visualization-how-ar-and-vr-is-transforming- data/
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Công nghệ thông tin: thực trạng và giải pháp
1 p | 619 | 235
-
Ứng dụng thành tựu cách mạng công nghiệp 4.0 trong phát triển nông nghiệp công nghệ cao trên địa bàn tỉnh Hưng Yên
7 p | 37 | 12
-
Tìm nguồn cung ứng các giải pháp bền vững tại triển lãm công nghệ dệt may và may mặc hợp nhất, lớn nhất thế giới
8 p | 81 | 11
-
Chuỗi cung ứng lạnh Việt Nam trong bối cảnh cuộc cách mạng công nghiệp 4.0 - những tác động và giải pháp
11 p | 63 | 8
-
Chuyển đổi số doanh nghiệp bán lẻ tại Việt Nam: Thực trạng và giải pháp
16 p | 20 | 8
-
Nâng cao năng lực của các trung tâm ứng dụng và chuyển giao công nghệ
4 p | 14 | 7
-
Giải pháp cho các doanh nghiệp cung ứng dịch vụ taxi truyền thống trong cuộc cạnh tranh với taxi công nghệ
13 p | 84 | 7
-
Đo lường hiệu suất chuỗi cung ứng - nghiên cứu mô hình SCOR tại công ty cổ phần nước giải khát Sanest Khánh Hòa
18 p | 11 | 7
-
Ứng dụng công nghệ chuỗi khối trong quản lý chuỗi cung ứng sản phẩm lúa gạo
8 p | 19 | 6
-
Tăng cường ứng dụng công nghệ thông tin trong các doanh nghiệp Logistics Việt Nam
19 p | 13 | 6
-
Tiếp thị theo phương pháp địa lý
6 p | 102 | 6
-
Các yếu tố ảnh hưởng đến sự phụ thuộc vào ChatGPT của gen Z trong học tập ở thành phố Hồ Chí Minh và giải pháp
20 p | 16 | 5
-
Một số giải pháp công nghệ tối ưu hóa hoạt động bán lẻ ở Việt Nam trong thời gian tới
8 p | 43 | 5
-
Ứng dụng công nghệ thông tin trong phân tích hoạt động kinh doanh
6 p | 34 | 4
-
Ứng dụng công nghệ thông tin trong thương mại và phân phối với shipper tại Việt Nam
11 p | 51 | 4
-
Bài giảng Hệ thống thông tin quản lý: Chương 4 - TS. Phạm Thị Thanh Hồng
23 p | 31 | 3
-
Nghiên cứu ứng dụng đặt món ăn trực tuyến bằng công nghệ NFC trong hoạt động kinh doanh nhà hàng tại các khách sạn thuộc địa bàn thành phố Hồ Chí Minh
8 p | 10 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn