intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Cá nhân hóa chiến lược khuyến mãi cho mạng di động tại Việt Nam thông qua mô hình RFM mở rộng kết hợp với giá trị vòng đời khách hàng (CLV)

Chia sẻ: Tô Nhiễm | Ngày: | Loại File: PDF | Số trang:10

6
lượt xem
1
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nghiên cứu "Cá nhân hóa chiến lược khuyến mãi cho mạng di động tại Việt Nam thông qua mô hình RFM mở rộng kết hợp với giá trị vòng đời khách hàng (CLV)" tập trung vào mở rộng mô hình RFM truyền thống bằng cách tích hợp thêm ba biến mới là A (Trung bình chi trả), C (Danh mục chi phối) và V (Dung lượng trung bình) giúp nâng cao khả năng phân loại và có cái nhìn rõ hơn về hành vi mua sắm của khách hàng trong lĩnh vực mạng di động. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Cá nhân hóa chiến lược khuyến mãi cho mạng di động tại Việt Nam thông qua mô hình RFM mở rộng kết hợp với giá trị vòng đời khách hàng (CLV)

  1. CÁ NHÂN HÓA CHIẾN LƯỢC KHUYẾN MÃI CHO MẠNG DI ĐỘNG TẠI VIỆT NAM THÔNG QUA MÔ HÌNH RFM MỞ RỘNG KẾT HỢP VỚI GIÁ TRỊ VÒNG ĐỜI KHÁCH HÀNG (CLV) Nguyễn Thanh Minh Tú, Lê Thị Cẩm Hằng, Phạm Nguyễn Thanh Mai, Hoàng Trung, Nguyễn Quang Hưng* Trường Đại học Kinh tế - Luật, ĐHQG-TPHCM, Thành phố Hồ Chí Minh, Việt Nam * Tác giả liên hệ: hungnq@uel.edu.vn TÓM TẮT Trước nhu cầu sử dụng ngày càng cao về dữ liệu di động trong cuộc sống hàng ngày và sự đa dạng trong hành vi tiêu dùng của khách hàng, cùng với sự thay đổi nhanh chóng của thị trường, nghiên cứu này tập trung vào mở rộng mô hình RFM truyền thống bằng cách tích hợp thêm ba biến mới là A (Trung bình chi trả), C (Danh mục chi phối) và V (Dung lượng trung bình) giúp nâng cao khả năng phân loại và có cái nhìn rõ hơn về hành vi mua sắm của khách hàng trong lĩnh vực mạng di động. Đồng thời, việc kết hợp với CLV còn hỗ trợ doanh nghiệp đánh giá giá trị của từng khách hàng và từ đó, đề xuất gói cước dữ liệu di động phù hợp với từng đặc điểm về nhu cầu sử dụng dữ liệu di động, khả năng chi trả và hành vi tiêu dùng của khách hàng. Bằng cách này, các nhà mạng có thể xây dựng mối quan hệ chặt chẽ và bền vững với khách hàng trong môi trường cạnh tranh của ngành mạng di động tại Việt Nam hiện nay. Từ khoá: Cá nhân hoá khách hàng, CLV, lưu lượng dữ liệu, mạng di động, RFM mở rộng. 1. Tổng quan Với sự phát triển không ngừng của Internet hiện nay, lưu lượng truy cập Internet và dữ liệu toàn cầu đang tăng nhanh chóng và dự kiến sẽ bùng nổ với sự tiến bộ của công nghệ. Theo Báo cáo của Ericsson (2020), lưu lượng dữ liệu mạng di động đã tăng đến 50% chỉ trong 1 năm (2019-2020), tương ứng 180 và 230 exabyte (10^18 byte: 1 tỷ tỷ) mỗi tháng vào năm 2019 và 2020 (Cổng thông tin Khoa học và Công nghệ, n.d.). Bên cạnh đó, dự kiến năm 2029 lưu lượng dữ liệu mạng di động ở các nước Đông Nam Á và Châu Đại Dương sẽ tiếp tục tăng lên tới 66GB mỗi tháng, gấp 2 lần so với năm 2023 (Nguyên, 2022). Sự gia tăng này phản ánh nhu cầu ngày càng cao của người dùng về dữ liệu di động, đặc biệt là tại Việt Nam. Do đó, các nhà mạng tại Việt Nam đã ra mắt nhiều gói cước dữ liệu di động nhằm đáp ứng đa dạng nhu cầu của khách hàng. Tuy nhiên, sự đa dạng đó vẫn chưa thực sự tối ưu hóa được nhu cầu cá nhân của mỗi khách hàng. Ví dụ, nhu cầu sử dụng dữ liệu của khách hàng thường xuyên lướt web và chơi game trực tuyến sẽ có sự khác biệt so với khách hàng chủ yếu dùng dữ liệu để xem video và nhắn tin. Mặc dù có rất nhiều gói cước được đưa ra, vẫn chưa có giải pháp giúp cá nhân hoá từng nhu cầu của khách hàng, những người tiêu dùng này sẽ phải chấp nhận những yếu tố không cần thiết, hoặc trả phí cao hơn so với những gì họ sử dụng do sự không phù hợp. Do đó, việc đề xuất các gói cước cá nhân hoá là một bước tiến quan trọng để đáp ứng chính xác nhu cầu đặc biệt của từng khách hàng. Điều này không chỉ giúp tối ưu hoá chi phí sử dụng mà còn tăng cường trải nghiệm cá nhân, độ hài lòng và lòng trung thành từ phía người dùng. Một phương pháp được sử dụng rộng rãi bởi các nhà quản lý trong việc định hình các chiến lược tiếp thị khách hàng dựa trên hành vi và thói quen của họ là mô hình RFM (Recency - Thời gian giao dịch gần nhất, Frequency - Tần suất, Monetary - Tổng số tiền giao dịch) (Bunnak at al., 2015). Tận dụng những dữ liệu sẵn có từ các giao dịch mà khách hàng đã thực hiện, kết quả phân cụm khách hàng có được sau khi sử dụng mô hình có thể giúp doanh nghiệp hiểu rõ hành vi và giao dịch của khách hàng từ đó áp dụng các chiến lược phù hợp từng khách hàng (McCarty & Hastak, 2007; Chen at al., 2012). Từ đó, các công ty có thể cung cấp dịch vụ thuê bao phù hợp nhất với nhu cầu khách hàng (Bacila at al., 2012). Bacila và cộng sự đã tiến hành một cuộc khảo sát nhằm theo dõi mô hình hành vi của khách hàng thuê bao trả trước trong lĩnh vực viễn thông, sử dụng phân tích RFM để phân loại khách hàng dựa trên ngày nạp tiền cuối cùng, tần suất nạp tiền trong ba tháng, và giá trị của các giao dịch nạp tiền trong thời gian này. Bên cạnh đó, nghiên cứu của Lê Ngọc Toàn (2023) đã mô tả cách sử dụng các thuật toán phân cụm để phân nhóm khách hàng dựa trên các chỉ số của mô hình RFM đối với nhóm khách hàng tổ chức. Đối với nhóm khách hàng cá nhân, nghiên cứu của Đinh Tiến Minh & Lê Vũ Lan 273
  2. Oanh (2021) đã phân khúc khách hàng mua sắm dựa trên kỳ vọng của họ về các đặc điểm của trung tâm thương mại. Trong khi đó, nghiên cứu của Hồ Trung Thành & Nguyễn Đăng Sơn (2021) sử dụng RFM để phân khúc khách hàng của cửa hàng bán lẻ trực tuyến, cho thấy sự áp dụng linh hoạt của mô hình trong các bối cảnh kinh doanh đa dạng. Từ mô hình RFM cơ bản, đã có rất nhiều nghiên cứu phát triển mô hình này với đa dạng các biến dựa trên các đặc điểm trong hành vi người dùng cũng như các chỉ số có thể thay đổi theo lĩnh vực. Trong nghiên cứu của Babaiyan & Sarfarazi (2019), tệp khách hàng của Công ty Viễn thông South Khorasan đã được phân loại thành 5 nhóm thông qua việc mở rộng mô hình từ RFM sang LRFM. Biến L (Length) - Độ dài trong mô hình trên đại diện cho chiều dài mối quan hệ của khách hàng với tổ chức nhằm cải thiện sự trung thành của khách hàng. Cheng & Chen (2009) đã đề xuất mô hình RFM trên mỗi sản phẩm (RFM/P). Trong mô hình này, tổng giá trị khách hàng được tính bằng cách cộng các giá trị khách hàng ước tính của từng sản phẩm. Jha at al. (2020) đã đề xuất một mô hình, viết tắt là RFMOC với hai biến mới là Offer Factor - một biến liên quan đến các chỉ số về khuyến mãi và Category - biến được phân loại dựa trên danh mục của doanh nghiệp để phân khúc khách hàng. Gần đây, nghiên cứu của Hồ Trung Thành & cộng sự (2023) đề xuất mô hình RFMD kết hợp giữa hành vi và nhân khẩu học (Demographic) của khách hàng trong ngành bán lẻ trực tuyến. Nhận thấy tiềm năng kết hợp hiệu quả nhằm phân khúc khách hàng giữa mô hình RFM kết hợp cùng CLV - giá trị hiện tại của dòng tiền trong tương lai gắn liền với một khách hàng (Pfeifer at al., 2005), mô hình kết hợp này đã được đề xuất và sử dụng lần đầu trong một nghiên cứu vào năm 2007 và đã đạt được một số kết quả tích cực (Sohrabi & Khanlari, 2007). Sau đó hàng loạt các nghiên cứu liên quan đã được công bố về sự kết hợp này và nó cũng đã được chứng minh sẽ giúp các doanh nghiệp hiểu hơn về khách hàng của mình và nâng cao lòng trung thành của khách hàng (Safari at al., 2016; Paul & Ramanan, 2019). Cuối cùng, hiệu quả phân cụm thông qua RFM đã được chứng minh khi kết hợp mô hình này với ba thuật toán phân cụm khác nhau (K-Means, Fuzzy C-Means và RM K-Means) và đều thu được điểm Silhouette - một chỉ số đánh chất lượng của việc phân cụm dữ liệu hết sức khả quan (Christy at al., 2021). Có thể thấy mô hình RFM sẽ mang lại lợi ích lớn cho cả doanh nghiệp và người tiêu dùng khi được vận dụng một cách hiệu quả. Về phía doanh nghiệp, nhờ hiểu rõ hành vi và phân đoạn chính xác, các nhà tiếp thị có thể thiết kế chiến dịch tiếp thị phù hợp, tối ưu hóa doanh thu và giảm thiểu chi phí. Đối với khách hàng, họ không chỉ được tiếp cận với những sản phẩm phù hợp với nhu cầu và khả năng chi trả mà còn được nâng cao trải nghiệm khi sử dụng sản phẩm, dịch vụ của doanh nghiệp. Nhìn chung, việc ứng dụng mô hình RFM mang lại lợi ích cân bằng cho cả hai bên, tạo nên mối quan hệ bền vững giữa doanh nghiệp và khách hàng. Thông qua khảo sát các nghiên cứu liên quan trong và ngoài nước, nhóm tác giả ghi nhận những điểm tích cực từ các công trình hiện có, đồng thời xác định một số lỗ hổng nghiên cứu đáng chú ý mà nghiên cứu này có thể đóng góp giải quyết. Trước hết, dù mô hình RFM đã được ứng dụng rộng rãi nhưng hầu hết các nghiên cứu trước đây chỉ tập trung vào các lĩnh vực như thương mại điện tử, ngân hàng, bán lẻ, bảo hiểm hoặc các lĩnh vực khác mà lại chưa có nhiều nghiên cứu về lĩnh vực viễn thông di động - một lĩnh vực được đánh giá là khá cạnh tranh và cần sự tối ưu trải nghiệm của khách hàng một cách tối đa (Saha at al., 2023). Mặc dù đã có một số nghiên cứu liên quan đến áp dụng RFM trong lĩnh vực di động, nhưng số lượng nghiên cứu vẫn còn hạn chế và chưa được cập nhật trong thời gian gần đây. Bên cạnh đó, các nghiên cứu hiện tại vẫn chưa đề cập đến việc phân tích dữ liệu di động và các đặc điểm riêng biệt của khách hàng trong lĩnh vực viễn thông di động. Các yếu tố đặc thù của ngành như lưu lượng sử dụng, tốc độ truy cập dữ liệu, giới hạn lưu lượng hay tính đa dịch vụ của các gói cước chưa được khai thác và tích hợp vào mô hình phân tích. Hơn nữa, hầu hết các nghiên cức chỉ tập trung vào việc ứng dụng RFM để phân khúc khách hàng thành các nhóm chung và đưa ra chiến lược tiếp thị tương ứng, nhưng chưa thực sự cá nhân hóa và đưa ra giải pháp riêng cho từng khách hàng cụ thể. Do đó, việc nghiên cứu, đề xuất một mô hình RFM mở rộng có độ phù hợp cao với đặc thù ngành viễn thông di động là một lĩnh vực nghiên cứu mới, chưa được khai thác đầy đủ và hứa hẹn nhiều tiềm năng ứng dụng thực tiễn. Chính vì vậy, nhóm tác giả đề xuất áp dụng sự kết hợp giữa mô hình RFM mở rộng và CLV để phân tích trong lĩnh vực mạng di động tại thị trường Việt Nam. Trong phạm vi của bài nghiên cứu này, các đặc điểm riêng của hành vi và giao dịch khách hàng trong lĩnh vực mạng di động sẽ được khai thác tối đa nhằm cá nhân hóa các gói cước di động đối với từng khách hàng trong các phân khúc khác nhau. Các tác giả đã đề xuất 3 biến mới là A (Average Payment) - Trung bình chi trả, C (Dominant Category) - Danh mục chi phối và V (Volmean) - Dung lượng trung bình trong việc chuyển đổi mô hình RFM truyền thống sang mô hình mở rộng với tên gọi RFMACV nhằm tối ưu khả năng dự đoán của mô hình trong lĩnh vực viễn thông. Bên cạnh đó, CLV sẽ đo lường giá trị vòng đời khách hàng, giúp doanh nghiệp xác định được mức độ hài lòng và lòng trung thành 274
  3. của khách hàng trong suốt thời gian họ gắn bó với doanh nghiệp. Từ đó, doanh nghiệp sẽ đưa ra đề xuất về các gói cước hoặc ưu đãi phù hợp với từng đặc điểm riêng lẻ của khách hàng. Tóm lại, bài nghiên cứu này được thực hiện với mục đích đề xuất gói cước dữ liệu di động phù hợp nhằm đáp ứng đa dạng hóa nhu cầu sử dụng lương lưu di động của khách hàng, dựa trên sự kết hợp hai phương pháp quan trọng là RFM mở rộng và CLV. 2. Phương pháp 2.1. Mô tả bộ dữ liệu Bộ dữ liệu của tác giả Ramakrushna Mohapatra ghi lại lịch sử giao dịch của khách hàng trong ngành viễn thông tại Ấn Độ từ tháng tháng 6 đến tháng 9 năm 2014. Bộ dữ liệu có 226 cột và 99999 bản ghi, lưu trữ thông tin cá nhân khách hàng, các gói dịch vụ đã đăng ký, dung lượng sử dụng, chi phí thanh toán, lịch sử nạp tiền, thời lượng gọi,... Nhưng đối với phạm vi nghiên cứu của bài báo này nhóm nghiên cứu chỉ tập trung vào phân tích các cột sau cho từng thành phần của mô hình mà nhóm nghiên cứu đề xuất đó là: Đối với thông tin người dùng cột được sử dụng sẽ là: Mobile_number - Đây là số điện thoại của khách hàng có tác dụng như một cách nhận diện các khách hàng trong bộ dữ liệu trên. Đối với biến R (Recency) - Thời gian giao dịch gần nhất sẽ được tính toán thông qua các cột có dữ liệu thể hiện ngày cuối cùng mà khách hàng gia hạn gói của tháng 6, 7, 8, 9 lần lượt là: date_of_last_rech_data_6, date_of_last_rech_data_7, date_of_last_rech_data_8, date_of_last_rech_data_9. Đối với biến F (Frequency) - Tần suất sẽ được tính toán thông qua các cột có dữ liệu thể hiện tổng số lần mà khách hàng tiến hành gia hạn các gói vào tháng 6, 7, 8, 9 lần lượt là: total_rech_data_6, total_rech_data_7, total_rech_data_8, total_rech_data_9. Đối với biến M (Monetary) - Tổng số tiền giao dịch sẽ được tính toán thông qua các cột có dữ liệu thể hiện số tiền mà khách hàng bỏ ra vào tháng 6, 7, 8, 9 lần lượt là: av_rech_amt_data_6, av_rech_amt_data_7, av_rech_amt_data_8, av_rech_amt_data_9. Đối với biến C (Dominant Category) – Danh mục chi phối sẽ được tính toán thông qua các cột có dữ liệu thể hiện các gói mà khách hàng sử dụng các tháng 6, 7, 8, 9 bao gồm: night_pck_user_6, night_pck_user_7, night_pck_user_8, night_pck_user_9, monthly_3g_6, monthly_3g_7, monthly_3g_8, monthly_3g_9, sachet_3g_6, sachet_3g_7, sachet_3g_8, sachet_3g_9, monthly_4g_6, monthly_4g_7, monthly_4g_8, monthly_4g_9, sachet_4g_6, sachet_4g_7, sachet_4g_8, sachet_4g_9, fb_user_6, fb_user_7, fb_user_8, fb_user_9. Và cuối cùng là biến V (Volmean) - Dung lượng trung bình sẽ được tính toán thông qua các cột có dữ liệu thể hiện dung lượng sử dụng đối với các gói 4G của tháng 6, 7 ,8, 9. Bao gồm các cột sau: vol_3g_mb_6, vol_3g_mb_7, vol_3g_mb_8, vol_3g_mb_9, vol_4g_mb_6, vol_4g_mb_7, vol_4g_mb_8, vol_4g_mb_9. Tổng số cột cần thiết được sử dụng cho mô hình là 46 cột dữ liệu và sẽ được tiến hành tiền xử lý dữ liệu trước khi tiến hành tính toán cho toàn bộ mô hình để cho ra kết quả cuối cùng. Và sau đó mô hình sẽ được đánh giá kiểm tra mức độ phù hợp để đưa ra kết quả cuối cùng. 275
  4. 2.2. Mô hình nghiên cứu đề xuất Mô hình đề xuất sẽ đi qua ba giai đoạn như được mô tả trong hình phía dưới. Ảnh 1: Các bước thực hiện mô hình đề xuất (Nguồn: Nhóm Tác Giả). 2.2.1. Chuẩn bị dữ liệu Giai đoạn đầu tiên tập trung vào việc thu thập và xử lý dữ liệu. Sau khi đã có bộ dữ, liệu các cột không liên quan tới mô hình sẽ bị loại bỏ và giữ lại 46 cột cần thiết để tiến hành tính toán cho mô hình. Tiếp đến các giá trị NULL, các giá trị không phù hợp, các khách hàng không có lịch sử giao dịch nạp tiền sử dụng gói cước và missing value trong 46 cột kể trên sẽ được loại bỏ. Ngoài ra, để tránh trường hợp dữ liệu ngày, tháng, năm trong quá trình tính toán có thể xảy ra sai sót, các cột ngày, tháng, năm sẽ được định dạng đưa các về cùng một dạng đó là '%m/%d/%y'. Sau đó, bộ dữ liệu sẽ được kiểm tra lại một lần nữa để chắc chắn không còn các giá trị không phù hợp sau khi đã hoàn tất kiểm tra nhóm nghiên cứu sẽ tiến hành thực hiện các bước tiếp theo. Ở giai đoạn này, ngoài việc làm sạch bộ dữ liệu để tính toán mô hình bộ dữ liệu, liên quan tới gói cước còn xây dựng thông qua việc cào dữ liệu gói cước trên trang của nhà mạng tại Viettel hiện nay. Bộ dữ liệu đó sẽ bao gồm các cột cơ bản sau: Cột thể hiện tên gói cước (Package_name), Giá của gói cước (Price), Dung lượng trong mỗi ngày (Volume_pday), Tổng dung lượng của gói (Volume_total), Ưu đãi (Endow), Ngày hết hạn (Expiry), Danh mục (Category), và cuối cùng là Free_social - có tác dụng kiểm tra xem gói có được sử dụng mạng xã hội miễn phí không. Bộ dữ liệu này sẽ phục vụ cho việc tự động hóa gói cước cho từng phân khúc khách hàng ở bước 3. 2.2.2. Xây dựng mô hình RFM mở rộng kết hợp tính toán giá trị vòng đời khách hàng Sau khi đã hoàn thành giai đoạn 1, tiếp theo mô hình đề xuất sẽ được tiến hành xây dựng. Ở giai đoạn này, nhóm nghiên cứu sẽ tiến hành chia nhỏ ra thành ba giai đoạn nhỏ hơn. Đầu tiên, các biến của mô hình đề xuất sẽ được tiến hành tính toán ở đây là R (Recency) - Thời gian giao dịch gần nhất, F (Frequency) - Tần suất, M (Monetary) - Tổng số tiền giao dịch, A (Average Payment) - Trung bình chi trả, C (Dominant Category) – Danh mục chi phối và cuối cùng là V (Volmean) - Dung lượng trung bình. Biến R sẽ được tính bằng cách lấy giá trị cuối cùng từ 4 cột ngày cuối cùng mà người dùng đăng ký dữ liệu sau đó sẽ tiến hành chọn ra ngày mốc bằng cách lấy giá trị lớn nhất của 4 cột trên ở trong trường hợp này là ngày 30 tháng 9 năm 2014. Sau đó nhóm nghiên cứu tiến hành lấy ngày lớn nhất trừ cho ngày mua gần nhất để tính ra biến R. Biến F sẽ được tính bằng cách lấy giá trị của các cột đã được đề cập ở trên sau đó tổng lại. Tương tự biến F biến M sẽ tổng lấy giá trị của các cột trên rồi để ra kết quả. Tiếp đến là biến A biến A sẽ được tính bằng cách lấy giá trị của biến M chia cho giá trị của biến F. Đối với biến C đầu tiên, các cột Night_4g, Month_4g, Sachet_4g sẽ được tạo ra để xác định gói dịch vụ mà khách hàng sử dụng. Sau đó, cột Category_data sẽ được tạo bằng cách xem cột nào trong ba cột Night_4g, Month_4g, Sachet_4g có giá trị lớn nhất. Nếu Night_4g lớn nhất, thì C = 1; nếu Sachet_4g lớn nhất, thì C = 2; nếu Month_4g lớn nhất, thì C = 3. Và cuối cùng, cột tên Social_data sẽ được tạo thêm từ 4 cột: 276
  5. fb_user_6, fb_user_7, fb_user_8, fb_user_9 có giá trị là 0 hoặc 1 nếu khách hàng có sử dụng thì sẽ có giá trị 1, không sử dụng là thì giá trị sẽ là 0. Biến V sẽ được tính bằng cách lấy trung bình dữ liệu mà người dùng đã mua ở các tháng 6, 7, 8, 9 trên các gói 3G và 4G. Sau khi tính toán các biến và chia dữ liệu thành các khoảng bằng nhau, dữ liệu sẽ được tiến hành công đoạn này thông qua việc trực quan hóa và tính tứ phân vị để xác định giá trị ngoại lai. Nếu phát hiện giá trị ngoại lai, nhóm loại bỏ chúng để cải thiện tính chính xác của mô hình. Tiếp theo, nhóm tính toán giá trị vòng đời khách hàng (CLV) dựa trên ba biến R, F, M. Đầu tiên, nhóm tính tần suất mua trung bình, tỷ lệ mua lại và tỷ lệ rời bỏ của khách hàng. Sau đó, nhóm tính lợi nhuận ròng trên doanh số bán lẻ và giả định tỷ suất lợi nhuận ròng là 36,5% (dựa trên tỷ lệ lợi nhuận trung bình cho ngành viễn thông di động vào năm 2014). Và sau đó nhóm sẽ tiến hành lượng hóa các biến của mô hình và chỉ số CLV để phục vụ cho các bước sau của mô hình. Khi đã chuẩn bị xong các giá trị, nhóm tính giá trị vòng đời của khách hàng và kết hợp nó vào bộ dữ liệu của mô hình để tiếp tục xử lý cho các bước tiếp theo. 2.2.3. Tự động hóa việc phân phối gói cước di động Giai đoạn cuối cùng trong quá trình xây dựng mô hình, các gói cước sẽ được phân bổ đã được xây dựng ở giai đoạn đầu tiên . Để thực hiện điều này, cột mới có tên là 'Package_Data_Name' sẽ được bổ sung thêm vào dataframe 'merged_data_telecom_customers_no_outliers'. Cột này chứa tên của gói dịch vụ phù hợp cho cho mỗi khách hàng, dựa trên kết quả các biến của mô hình. Tiếp theo, một dataframe tạm thời sẽ được tạo ra từ cột 'Package_Data_Name' trong dataframe 'merged_data_telecom_customers_no_outliers'. DataFrame tạm thời này chứa thông tin về tên gói dịch vụ phù hợp cho từng khách hàng. Sau đó, dataframe tạm thời sẽ được nối với bộ dữ liệu đã được xử lý từ mô hình đề xuất. Điều này giúp kết hợp thông tin về các điểm RFMACV và CLV đã được tính toán từ mô hình đề xuất với thông tin về gói dịch vụ phù hợp cho từng khách hàng. Sau đây là quy trình tính toán cụ thể của mô hình. Để tìm gói cước phù hợp, bảng dữ liệu gói cước sẽ được sử dụng đã được xây dựng. Quá trình phân tích và tìm kiếm sẽ dựa trên 3 thông tin về gói cước và 5 thông tin điểm. Mô hình sẽ xem xét các thông tin như loại khách hàng, sử dụng mạng xã hội, chi phí trung bình, dung lượng sử dụng, điểm CLV để so khớp với các gói cước có sẵn như 'night', 'day', 'month'. Nếu các thông tin trùng nhau, mô hình sẽ đề xuất các gói cước cao cấp hơn dựa trên điểm đánh giá CLV của khách hàng. Đối với gói liên quan đến mạng xã hội, mô hình sẽ đề xuất tất cả các gói trên các nền tảng như Facebook, Youtube, Tiktok. Qua quá trình so sánh, mô hình tìm ra gói cước phù hợp nhất dựa trên thông tin khách hàng. Cuối cùng, bộ dữ liệu đã có sẽ được cứu ghép vào hai cột mang giá trị là gói cước. Kết quả của giai đoạn cuối cùng là một bảng dữ liệu hoàn chỉnh, bao gồm các điểm RFMACV, giá trị khách hàng trọn đời, và gói dịch vụ hiệu quả cho từng khách hàng, dựa trên phân bổ tự động của mô hình. 3. Kết quả và thảo luận 3.1. Kết quả xử lý dữ liệu Với bộ dữ liệu gồm 226 cột với 99999 hàng chứa toàn bộ lịch sử giao dịch của khách hàng bao gồm cả thông tin về cước gọi thoại và gói cước di động, nhằm có được bộ dữ liệu phục vụ cho quá trình nghiên cứu về gói cước di động, bộ dữ liệu trên đã được xử lý với các thao tác giản lược cột, thay đổi định dạng dữ liệu, loại bỏ các giá trị không phù hợp và một số các thay đổi cần thiết. Bộ dữ liệu sau khi xử lý với 46 cột và 18565 hàng sẽ bao gồm toàn bộ các thông tin về thời gian giao dịch, số tiền giao dịch, số lần giao dịch của khách hàng đối với các gói cước của nhà mạng trong khoảng thời gian từ tháng 6 đến tháng 9. Và toàn bộ dữ liệu tại bộ dữ liệu này đều được đảm bảo phù hợp với mục đích của đề tài nhằm tối ưu hóa quy trình thực nghiệm của nghiên cứu. Bảng 3. Kết quả xử lý dữ liệu. Trước khi xử lý Sau khi xử lý 277
  6. Số cột 226 46 Số hàng 99999 18565 3.2. Kết quả tính chỉ số các biến của mô hình Tại bước đầu tiên của giai đoạn 2 - Xây dựng mô hình RFM mở rộng kết hợp CLV, từ bộ dữ liệu đã xử lý, các cột dữ liệu giao dịch khách hàng sẽ được tính toán nhằm đưa ra giá trị của 6 biến R (Recency) - Thời gian giao dịch gần nhất, F (Frequency) - Tần suất, M (Monetary) - Tổng số tiền giao dịch, A (Average Payment) - Trung bình chi trả, C (Dominant Category) - Danh mục chi phối, V (Volmean) - Dung lượng trung bình. Sau các quy trình tính toán, nhóm nghiên cứu đã thu được kết quả như sau. Bảng 4. Kết quả tính chỉ số các biến của mô hình. Số điện thoại khách hàng R F M A C V 7000000126 4 4.0 637.0 159.250000 3 30.620583 7000000229 34 3.0 483.0 161.000000 3 28.525889 .... .... .... .... .... .... .... 7000001992 9 1.0 175.0 175.000000 3 3.367000 7000002102 9 2.0 191.0 95.500000 3 20.084839 Bảng trên đây chính là giá trị thực tế các biến của một số khách hàng. Sau khi đã có được giá trị thực tế 6 chỉ số của khách hàng, để trực quan hóa các giá trị nhằm xem xét độ phân bổ khác nhau của từng chỉ số, các mô hình trực quan hóa khác nhau đã được sử dụng và dưới đây chính là kết quả trực quan hóa thông qua mô hình chính mà nhóm nghiên cứu sử dụng - mô hình Box Plot. Ảnh 2. Mô hình Box Plot chỉ số các biến của mô hình. Nhận thấy được sự phân bổ các giá trị đang có nhiều giá trị ngoại lai có thể gây khó khăn cho các bước sau của mô hình và khó đem lại kết quả phân tích tối ưu, nhóm nghiên cứu đã thực hiện loại bỏ toàn bộ các giá trị ngoại lai này ở 6 chỉ số và thu được mô hình Box Plot 6 chỉ số sau khi loại bỏ như sau. 278
  7. Ảnh 3. Mô hình Box Plot chỉ số các biến của mô hình sau khi loại bỏ giá trị ngoại lai. 3.3. Kết quả tính toán CLV - Customer Lifetime Value Sau khi đã có được giá trị các biến R (Recency) - Thời gian giao dịch gần nhất, F (Frequency) - Tần suất, M (Monetary) - Tổng số tiền giao dịch, giá trị của CLV (Customer Lifetime Value) - Giá trị vòng đời khách hàng sẽ được tính toán cho từng khách hàng và thu được kết quả như sau. Bảng 5. Kết quả tính chỉ số CLV của mô hình. Số điện thoại khách hàng R F M A C V CLV 7000000126 4 4.0 637.0 159.250000 3 30.620583 6.321762e+07 7000000229 34 3.0 483.0 161.000000 3 28.525889 3.792599e+07 .... .... .... .... .... .... .... .... 7000001992 9 1.0 175.0 175.000000 3 3.367000 4.978732e+06 7000002102 9 2.0 191.0 95.500000 3 20.084839 1.693446e+04 Nhằm quan sát sự phân bổ của 6 biến và chỉ số CLV (Customer Lifetime Value) - Giá trị vòng đời khách hàng, một bảng dữ liệu tính toán các giá trị thống kê với các giá trị quen thuộc như: count, mean, std, min, tứ phân vị, max đã được tính toán và cho ra kết quả như sau. Bảng 6. Kết quả các chỉ số thống kê của 6 biến và CLV. R F M A C V CLV 18565.00 18565.00000 18565.00000 18565.00000 18565.00000 18565.00000 1.856500e+ count 0000 0 0 0 0 0 04 43.08424 5.077511 503.641603 119.246328 2.481067 55.082042 1.404400e+ mean 5 08 34.63424 4.981832 503.913079 96.678447 0.510639 102.584824 1.555894e+ std 4 09 0.000000 1.000000 1.000000 0.375000 1.000000 0.000000 0.000000e+ min 00 6.000000 2.000000 108.000000 25.000000 2.000000 8.275493 3.699390e+ 20% 05 33.00000 3.000000 266.000000 80.285714 2.000000 21.561628 5.093182e+ 40% 0 06 279
  8. 42.00000 5.000000 517.000000 151.000000 3.000000 34.056933 3.220698e+ 60% 0 07 72.00000 7.000000 802.000000 179.600000 3.000000 65.634848 9.907198e+ 80% 0 07 103.0000 93.000000 10534.00000 1555.000000 3.000000 3002.760000 1.443176e+ max 00 0 11 3.4. Kết quả so sánh mô hình RFM và mô hình RFMACV Hiểu được việc chứng minh sự hiệu quả của mô hình đề xuất với 3 biến mới là A A (Average Payment) - Trung bình chi trả, C (Dominant Category) - Danh mục chi phối, V (Volmean) - Dung lượng trung bình là rất quan trọng đối với kết quả nghiên cứu, nhóm nghiên cứu đã tính toán các chỉ số Silhouette và Cluster ratio trên cả hai mô hình RFM - mô hình truyền thống và RFMAVC - mô hình đề xuất hiện tại của nghiên cứu và thu được kết quả như Bảng 5. Bảng 7. Kết quả so sánh mô hình RFM và mô hình RFMCAV. Mô hình RFM Mô hình RFMACV Sihouette 0.8104122172308253 0.8104210241881482 Cluster ratio 0.0006776775929108358 0.0006775447934983927 Sau khi thực hiện Silhouette test và phân cụm cùng thuật toán K-means trên kết quả mô hình RFMACV đã tính được, kết quả thu được đã thể hiện rằng mô hình đề xuất RFMACV có chỉ số Silhouette gần 1 hơn so với mô hình RFM truyền thống, tức là mô hình RFMACV sẽ đem lại kết quả phân cụm tốt hơn ở bộ dữ liệu này. Kết quả cluster ratio thông qua thuật toán K-means của mô hình RFMACV cũng đưa lại chỉ số tối ưu hơn khi nó gần 0 hơn so với mô hình truyền thống. Kết quả thu được từ hai chỉ số trên đã cho ta thấy được rằng tuy mô hình RFMACV không đem lại chỉ số quá chênh lệch đối với mô hình RFM nhưng nó vẫn đưa lại kết quả cao hơn và được đánh giá là chỉ số khá tốt. Điều đó đã chứng minh rằng, sự đề xuất 3 biến mới là phù hợp và có thể áp dụng đối với mô hình. Sự so sánh trên chỉ nhằm mục đích chứng minh sự khả thi của 3 biến đề xuất và không khẳng định rằng mô hình RFMACV sẽ ưu việt hơn mô hình truyền thống ở mọi lĩnh vực vì 3 biến đề xuất trên đã được nghiên cứu dựa trên mục đích phục vụ lĩnh vực gói cước di động. 3.5. Kết quả tự động hóa gói cước di động Tận dụng các chỉ số đã được tính toán của mô hình, nhằm cá nhân hóa các gói cước di động cho từng khách hàng dựa trên lịch sử giao dịch của họ, nhóm nghiên cứu tiếp tục thực hiện giai đoạn tiếp theo - Tự động hóa gói cước di động với các bước sau. Đầu tiên, bộ dữ liệu gồm thông tin các gói cước từ doanh nghiệp gồm các thông tin cụ thể như: tên gói, giá tiền gói cước, tổng dữ liệu, mô tả gói cước,... sẽ được thu thập nhằm chuẩn bị sẵn sàng các dữ liệu cho việc tự động hóa gói cước tiếp theo. Sau đó, dựa trên sự phân bổ các chỉ số sau khi lượng hóa của từng khách hàng và các thông tin liên quan của gói cước, các gói cước sẽ lần lượt được phân bổ cho khách hàng. Phân tích rõ hơn về sự phân bổ giữa thông tin gói cước và các chỉ số, với chỉ số C (Dominant Category) - Danh mục chi phối của khách hàng cho thấy danh mục gói cước mà họ quan tâm nhất, chỉ số này sẽ được sử dụng nhằm phân bổ danh mục của gói cước liên quan mà khách hàng quan tâm. Chỉ số A (Average Payment) - Trung bình chi trả sẽ được kết nối với giá tiền của gói cước để đưa ra được gói cước ở danh mục yêu thích có mức giá phù hợp nhất. Tiếp đến chỉ số V (Volmean) - Dung lượng trung bình sẽ là cơ sở để các gói cước với dung lượng khác nhau tại danh mục mà khách hàng yêu thích được kết nối với khách hàng. Và cuối cùng chỉ số CLV (Customer Lifetime Value) - Giá trị vòng đời khách hàng sẽ là cơ sở cho quy trình đề xuất đến khách hàng các gói cước có thời hạn kéo dài hơn so với danh mục yêu thích của khách hàng. Sau quy trình phân bổ ấy, các gói cước phù hợp sẽ được tự động hóa phân bổ đến với khách hàng và thu được kết quả dưới đây. Bảng 8. Kết quả tự động hóa gói cước di động. Số điện thoại khách hàng R F M A C V CLV Package Name 7000000126 5 3 4 4 3 3 4 MXH120 280
  9. 7000000229 3 2 3 4 3 3 4 MXH120 .... .... .... .... .... .... .... .... 7000001992 5 5 3 2 2 5 2 YT1, T1 7000002102 2 1 1 2 1 5 1 YT1, T1 Nhìn vào kết quả, nhóm nghiên cứu cho rằng kết quả tự động hóa gói cước đang có sự phù hợp tương đối bởi các gói cước đã được phân bổ phù hợp với nhu cầu về dung lượng, khả năng chi trả và thói quen của khách hàng. 4. Kết luận Giải pháp này mang lại một số ưu điểm như tiết kiệm thời gian và nguồn lực so với việc phân loại thủ công các gói cước di động phù hợp với từng khách hàng, đề xuất cho người tiêu dùng gói cước lưu lượng di động đáp ứng đúng nhu cầu và mong muốn của họ. Hơn nữa, phương pháp này giúp doanh nghiệp nâng cao khả năng giữ chân và kích thích khách hàng, tăng cường sự tương tác và tăng doanh số bán hàng. Việc phân loại khách hàng dựa trên các đặc điểm, hành vi giao dịch của khách hàng cho phép doanh nghiệp về lĩnh vực mạng di động đề xuất gói lưu lượng di động phù hợp với từng khách hàng, tạo động lực mua sắm và tối ưu hóa tương tác khách hàng với doanh nghiệp. Sự kết hợp giữa mô hình RFMACV cùng CLV để cá nhân hoá gói cước di động cho từng khách hàng sẽ là một giải pháp triển vọng và mang lại lợi ích cho cả doanh nghiệp và khách hàng trong lĩnh vực mạng di động. TÀI LIỆU THAM KHẢO 1. Babaiyan, V., & Sarfarazi, S. A. (2019). Analyzing customers of South Khorasan telecommunication company with expansion of RFM to LRFM model. Journal of AI and Data Mining, 7(2), 331-340. 2. Bacila, M. F., Radulescu, A., & Marar, I. L. (2012). RFM based segmentation: An analysis of a telecom company's customers. In The Proceedings of the International Conference" Marketing-from Information to Decision" (p. 52). Babes Bolyai University. 3. Bunnak, P., Thammaboosadee, S., & Kiattisin, S. (2015). Applying Data Mining Techniques and Extened RFM Model in Customer Loyalty Measurement (Doctoral dissertation, Mahidol University). 4. Chen, D., Sain, S. L., & Guo, K. (2012). Data mining for the online retail industry: A case study of RFM model- based customer segmentation using data mining. Journal of Database Marketing & Customer Strategy Management, 19, 197-208. 5. Cheng, C. H., & Chen, Y. S. (2009). Classifying the segmentation of customer value via RFM model and RS theory. Expert systems with applications, 36(3), 4176-4184. 6. Christy, A. J., Umamakeswari, A., Priyatharsini, L., & Neyaa, A. (2021). RFM ranking–An effective approach to customer segmentation. Journal of King Saud University-Computer and Information Sciences, 33(10), 1251-1257. 7. Cổng thông tin Khoa học và Công nghệ. (n.d.). Sự phát triển của dữ liệu và truyền dữ liệu toàn cầu hiện nay - Cổng thông tin Khoa học và Công nghệ. Gov.Vn. Retrieved February 4, 2024, from https://www.vista.gov.vn/vi/news/khoa-hoc-ky-thuat-va-cong-nghe/su-phat-trien-cua-du-lieu-va-truyen-du-lieu-toan- cau-hien-nay-5755.html. 8. Đinh, T. M., & Lê, V. L. O. (2021). Phân khúc khách hàng mua sắm dựa trên thuộc tính của các trung tâm thương mại tại Thành phố Hồ Chí Minh. Tạp chí công thương, (1), 64-71. ISSN 0866-7756. 9. Hoàng, A. D. (2020). Phân tích hành vi sử dụng dịch vụ viễn thông của khách hàng dựa trên thuật toán phân cụm đưa ra chính sách khuyến mại về sản phẩm và theo phân khúc khách hàng (Doctoral dissertation). 10. Ho, T. T., & Nguyễn, S. Đ. (2021). An interdisciplinary research between analyzing customer segmentation in marketing and machine learning method. VNUHCM Journal of Economics, Business and Law, 6(1), 2005-2015. https://doi.org/https://doi.org/10.32508/stdjelm.v6i1.850 11. Ho, T., Nguyen, S., Nguyen, H., Nguyen, N., Man, D. S., & Le, T. G. (2023). An Extended RFM Model for Customer Behaviour and Demographic Analysis in Retail Industry. Business Systems Research: International journal of the Society for Advancing Innovation and Research in Economy, 14(1), 26-53. https://doi.org/10.2478/bsrj-2023-0002 281
  10. 12. Jha, N., Parekh, D., Mouhoub, M., & Makkar, V. (2020). Customer Segmentation and Churn Prediction in Online Retail. In Advances in Artificial Intelligence: 33rd Canadian Conference on Artificial Intelligence, Canadian AI 2020, Ottawa, ON, Canada, May 13–15, 2020, Proceedings 33 (pp. 328-334). Springer International Publishing. https://doi.org/10.1007/978-3-030-47358-7_33 13. Kumar, V., & Rajan, B. (2020). Customer lifetime value: What, how, and why. In The Routledge companion to strategic marketing (pp. 422-448). Routledge. 14. McCarty, J. A., & Hastak, M. (2007). Segmentation approaches in data-mining: A comparison of RFM, CHAID, and logistic regression. Journal of business research, 60(6), 656-662. 15. Nguyên, P. (2022, June 24). Báo cáo Di động Ericsson: 5G vượt một tỷ thuê bao trong năm 2022. BÁO SÀI GÒN GIẢI PHÓNG. https://www.sggp.org.vn/bao-cao-di-dong-ericsson-5g-vuot-mot-ty-thue-bao-trong-nam-2022- post641496.html 16. Paul, L., & Ramanan, T. R. (2019). An RFM and CLV analysis for customer retention and customer relationship management of a logistics firm. International Journal of Applied Management Science, 11(4), 333-351. 17. Pfeifer, P. E., Haskins, M. E., & Conroy, R. M. (2005). Customer lifetime value, customer profitability, and the treatment of acquisition spending. Journal of managerial issues, 11-25. http://www.jstor.org/sBảng/40604472 18. Safari, F., Safari, N., & Montazer, G. A. (2016). Customer lifetime value determination based on RFM model. Marketing Intelligence & Planning, 34(4), 446-461. 19. Saha, L., Tripathy, H. K., Gaber, T., El-Gohary, H., & El-kenawy, E. S. M. (2023). Deep churn prediction method for telecommunication industry. Sustainability, 15(5), 4543. 20. Sohrabi, B., & Khanlari, A. (2007). Customer lifetime value (CLV) measurement based on RFM model. 21. Toàn, L. (2023). Phân khúc và dự báo lòng trung thành cho khách hàng tổ chức. https://digital.lib.ueh.edu.vn/handle/UEH/69200 282
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2