664
PHÂN TÍCH ĐỊNH LƯỢNG CÁC VẤN ĐỀ KINH T VÀ XÃ HỘI TRONG MÔI TRƯỜNG S LN TH 3
PHÂN TÍCH HÀNH VI MUA SẮM THIẾT BỊ ĐIỆN TỬ TRÊN SÀN THƯƠNG
MẠI ĐIỆN TỬ: GIAI ĐOẠN 2018 2023
Nguyn Hữu Xuân Trường, Trn Th Mai Vy
Hc vin Chính sách và Phát trin
Nguyn Sao Mai
Đại học Lao động Xã hi
Email: truongnhx@apd.edu.vn
Tóm tt: Trong thời đại s hóa ngày nay, thương mại điện t đã trở thành mt phn
không th thiếu trong cuc sng hàng ngày, biến đổi cách thc mua sm kinh doanh trên
toàn cu. S phát trin mnh m của thương mại điện t đã tạo ra một lượng ln d liu phong
phú đa dạng. D liu này, thu thp t hàng triu giao dịch hàng ngày trên các sàn thương
mại điện t, chứa đựng những thông tin quý giá, giúp phân tích hành vi tiêu dùng, xu hướng th
trường h tr trong vic ra quyết định kinh doanh. Trong bài báo này, chúng tôi tp trung
vào vic phân tích d liu t một sàn thương mại điện t, nhn mnh vào vic khám phá các
yếu t ảnh hưởng đến hành vi tiêu dùng và hiu sut bán hàng trong lĩnh vc sn phẩm điện t.
Bài báo s dụng phương pháp phân tích dữ liu tiên tiến và cung cp thông tin hu ích cho các
nhà qun lý doanh nghip. Nghiên cu này m rng hiu biết v thương mại đin t và h
tr trong vic ra quyết định da trên d liu.
T khóa: pn tich d liệu, thương mại điện t, xu ng bán ng, hiu sut bán ng.
1. Gii thiu
Trong thp k qua, s bùng n của thương mại điện t đã thay đổi cách thc mua sm
kinh doanh trên toàn cu. S tin li, kh năng tiếp cn rng rãi và s đa dạng ca sn phẩm đã
làm cho thương mại điện t tr thành mt phn không th thiếu trong cuc sng hàng ngày ca
chúng ta. Đặc bit, trong bi cảnh đại dch COVID-19, thương mại điện t đã chứng minh được
vai trò quan trng của mình như một kênh bán hàng chính, cho phép người tiêu dùng tiếp tc
mua sm mà không cn ra khỏi nhà. Do đó, vic phân tích d liu t các nn tảng thương mại
điện t không ch cung cp cái nhìn sâu sc v hành vi và xu hướng tiêu dùng mà còn góp phn
vào vic hình thành chiến lược kinh doanh và quyết định sn xut (Li, 2023).
Trong lĩnh vực thương mại điện t, vic phân tích hành vi mua sm trc tuyến ngày càng
tr nên quan trọng, đặc bit trong bi cnh th trường đầy biến động cnh tranh. Các nghiên
cu trên thế gii ti Việt Nam đã tập trung vào ng dng k thut d liu ln, trí tu nhân
to (AI) học máy (Machine Learning) để hiểu hơn về các yếu t ảnh hưởng đến quyết
định mua hàng của người tiêu dùng. Turban et al. (2018) nhn mnh tm quan trng ca vic
s dng phân tích d liu trong vic hiểu hành vi người tiêu dùng và ci thin tri nghim mua
sm. Nghiên cu của Provost và Fawcett (2013) cũng cho thấy vic áp dng phân tích d liu
cung cp cái nhìn sâu sc và giúp d đoán nhu cầu của người tiêu dùng mt cách chính xác. Ti
Vit Nam, các nghiên cứu như của Nguyễn Thu Hà (2020) đã khám phá các yếu t ảnh hưởng
đến hành vi mua sm trc tuyến trong bi cnh Covid 19, cho thy s chuyn dch rõ rt t mua
sm ngoi tuyến sang trc tuyến. Các công trình nghiên cu này cung cp cái nhìn toàn din v
cách thc doanh nghip có th tn dng công nghphân tích d liệu đ tối ưu hóa chiến lược
665
PHÂN TÍCH ĐỊNH LƯỢNG CÁC VẤN ĐỀ KINH T VÀ XÃ HỘI TRONG MÔI TRƯỜNG S LN TH 3
kinh doanh và đáp ứng nhu cu của người tiêu dùng trong thời đại s.
Bài nghiên cu này nhm mục tiêu phân tích xu hướng nhu cu th trường thông qua
vic khám phá d liu thu thp t mt trong nhng nn tảng thương mại điện t hàng đầu
Lazada. Tp d liệu được s dng trong nghiên cu này bao gm thông tin chi tiết v các sn
phẩm điện t - mt trong nhng phân khúc hàng hóa ph biến nht trên các nn tảng thương
mại điện t. Thông qua vic phân tích d liu này, chúng tôi mong mun cung cp mt cái nhìn
toàn din v các yếu t ảnh hưởng đến nhu cu tiêu dùng hiu sut bán hàng, t giá c,
chương trình khuyến mãi, lượt đánh giá của sn phẩm đến địa điểm vn chuyn.
Bng cách s dụng phương pháp phân tích dữ liu tiên tiến, nghiên cu này không ch
đóng góp vào lĩnh vực hc thut bng cách m rng hiu biết v thương mại điện t còn
cung cp thông tin quan trng cho các nhà qun lý và doanh nghip (Li, 2023). Điều này giúp
h đưa ra quyết định chiến lược tốt hơn dựa trên d liu, t đó nâng cao kh ng cạnh tranh
và hiu qu kinh doanh (Chaffey, 2019).
Bài báo này được cấu trúc như sau: đầu tiên phn gii thiu này phương pháp nghiên
cu, bao gm cách thu thp và x lý d liu. Tiếp theo, chúng tôi s trình bày kết qu phân tích
d liu, bao gm các t thống phân tích xu hướng. Phn tho lun s tp trung vào
vic din gii các kết qu đưa ra các ý nghĩa thực tin ca chúng. Cui cùng, bài báo kết thúc
bng nhng kết luận chính đề xut cho các nghiên cứu tương lai. Phm vi nghiên cu ca
bài báo này d liu ca các sn phầm điện t trên sàn thương mại điện t Lazada trong khong
thi gian t năm 2018 đến 2023.
Thông qua vic phân tích d liu thc tế t nn tảng thương mại điện t, nghiên cu này
không ch giúp làm sáng t các yếu t ảnh hưởng đến quyết định mua hàng của người tiêu dùng
còn cung cp cái nhìn sâu sc v cách các yếu t này tương tác vi nhau trong môi
trường kinh doanh điện t đầy đổi mi và cnh tranh.
2. Phương pháp nghiên cu
Trong nghiên cu này, chúng tôi áp dng mt loạt các phương pháp phân tích dữ liệu để
khám phá và din gii thông tin t tp d liệu thương mại điện t (Eric, 2015). Quá trình này
bao gm vic thu thp, x lý, phân tích và din gii d liệu để đạt được mc tiêu nghiên cứu đã
đề ra (Nguyn Hà Nam, 2013):
2.1. Thu thp d liu
D liu được thu thp là d liu bán hàng các sn phẩm điện t trên nn tảng thương
mại điện t Lazada.
Tp d liu bao gm các thông tin chi tiết v sn phẩm như tên sản phm, giá bán,
ợt bán, địa ch vn chuyn, t l giảm giá, lượt đánh giá 5 sao, phân loi sn phm thi
gian m bán.
2.2. X lý và làm sch d liu
Đây là bước đặc bit quan trọng đ giúp cho vic phân tích d liệu đạt hiu qu tt. D
liệu được làm sạch để loi b các li và bt nhất quán. Các bước c th bao gm:
Kim tra và x lý giá tr thiếu: Đầu tiên, chúng tôi kim tra d liệu để xác định xem
có giá tr nào b thiếu hay không và xem xét cách x lý chúng.
666
PHÂN TÍCH ĐỊNH LƯỢNG CÁC VẤN ĐỀ KINH T VÀ XÃ HỘI TRONG MÔI TRƯỜNG S LN TH 3
X lý d liu không nht quán hoc sai lch: Bao gm chuyển đổi các trường d liu
sang định dng thích hp và x lý các giá tr không hợp lý, đặc biệt là đồng nhất các đối tượng
ging nhau, chng hạn như tên sản phm.
Chun hoá d liu: Định dng li d liệu để đảm bo tính nht quán, ví d như định
dng ngày tháng hoc chun hóa các giá tr s.
Loi b d liu trùng lp: Kim tra và loi b các bn ghi trùng lặp để ci thin cht
ợng và độ chính xác ca d liu.
2.3. Phân tích d liu
Phân tích mô t thng kê: áp dng các thng kê t để cung cp cái nhìn tng quan
v d liu, bao gồm xu hướng trung bình, phân b và phm vi ca các biến.
Phân tích xu hướng: khám phá xu hướng theo thi gian và mi quan h gia các yếu
t như giá cả, t l giảm giá, lượt đánh giá và thời gian m bán.
Mô hình d đoán doanh số: xây dng mô hình hi quy tuyến tính để d đoán doanh
sn hàng theo mt s thông tin khác. Để thc hin, cn chia tp d liu thành tp hun luyn
và kiểm tra, sau đó huấn luyện mô hình và đánh giá bằng các ch s MSE, R2.
Phân nhóm sn phm: s dụng phương pháp phổ biến như K-Means để phân sn
phm ra thành mt s nhóm, sao cho mi sn phm trong cùng một nhóm độ tương đồng
giống nhau cao hơn so với các sn phm ca nhóm khác.
2.4. Din gii kết qu
S dng kết qu t các phân tích trên đ din gii hiểu rõ hơn về các yếu t nh
hưởng đến nhu cu và hành vi tiêu dùng.
Phân tích s tp trung vào việc xác định các yếu t chính dẫn đến s thành công ca
sn phm và làm thế nào c yếu t này tương tác với nhau trong môi trường thương mại điện
t.
Bng cách áp dụng phương pháp nghiên cu này, chúng tôi mong mun cung cp mt cái
nhìn toàn din và sâu sc v th trường thương mại điện tử, đặc biệt là trong lĩnh vực sn phm
điện tử. Qua đó, nghiên cứu không ch giúp phn ánh hin trng th trường mà còn góp phần đề
xut các chiến lược và quyết định kinh doanh da trên d liu.
3. D liu
Chúng tôi tiến hành cào d liu v các sn phẩm điện t trên sàn thương mại điện t
Lazada bng công c Data Scaper. Đây mt tin ích ca Chrome giúp cho trích xut hàng
nghìn bn ghi t mt trang web xut d liệu dưới dng tp .csv hoc .xlsx định dng
cu trúc. Không nhng vậy, nó cũng có thể được s dụng để thu thp thông tin t phn ln các
trang web, bao gm c nhng trang ni tiếng như Amazon và eBay, hay những trang nh hơn.
Tp d liu bán hàng các sn phm thiết b điện t trong khong thi gian t năm 2018
đến 2023 được chúng tôi thu thp t trang Lazada (mt khoảng hơn 2 giờ) bao gm 9280 dòng
và 9 ct (thuc tính) c th như sau:
Link Sn Phm: Đường link trc tiếp đến trang sn phm.
Tên Sn Phm: Tên ca sn phm.
Giá Bán: Giá bán ca sn phm.
667
PHÂN TÍCH ĐỊNH LƯỢNG CÁC VẤN ĐỀ KINH T VÀ XÃ HỘI TRONG MÔI TRƯỜNG S LN TH 3
t Bán: S ng sn phẩm đã bán.
Địa Ch Vn Chuyn: Địa ch t đâu sản phẩm được vn chuyn.
T L Gim Giá: Phần trăm giảm giá ca sn phm.
ợt Đánh Giá 5 Sao: S ợt đánh giá 5 sao mà sản phm nhận được.
Phân Loi: Loi hình ca sn phm (ví dụ: Điện Thoi).
Thi Gian M Bán: Ngày mà sn phm bắt đầu được bán.
c tiếp theo trong quá trình phân tích làm sch chun b d liu bng công c
Python, bao gm các công việc như xoá các dòng dữ liu b thiếu, đặc bit là ti cột “Lượt
bán”, chuyển đổi các ct d liệu sang định dng phù hp (ví d: chuyển đổi ngày tháng, chun
hóa tên ct, xoá các giá tr trùng lặp), đồng nht tên sn phm…
4. Phân Tích D Liu
Phn này ca bài báo tp trung vào vic phân tích chi tiết d liu thu thập được t nn
tảng thương mại điện tử, qua đó cung cấp cái nhìn sâu sc v xu hướng nhu cu trong th
trường sn phẩm điện t. Các s liệu được tính toán, tng hp bng công c Python.
4.1. Phân tích thng kê mô t
t thống kê bản được thc hiện để c định các đặc điểm chính ca d liu, bao
gm giá tr trung bình, trung vị, độ lch chun, và phm vi ca các biến như giá bán, tỷ l gim
giá, lượt đánh giá 5 sao. Phân tích này giúp chúng tôi hiểu rõ hơn về s phân b và xu hướng
chung ca d liệu, bước đầu tiên trong vic khám phá mi quan h gia các yếu t khác nhau.
Bng 1. Thng kê mô t các thuc tính d liu
Giá Bán (VND)
Lượt Bán
Tỷ Lệ
Giảm Giá
Lượt Đánh Giá
5 Sao
Trung bình
6,194,926
47.34
23.7%
22.07
Độ lệch chuẩn
9,459,697
236.998
19.8%
53.297
Giá trị nhỏ nhất
1,000
0
0%
0
Q1 (25%)
1,043,866
0
0%
0
Trung vị (50%)
2,350,000
17
24%
7
Q3 (75%)
7,190,000
44
44%
35
Giá trị lớn nhất
118,990,000
9897
71%
2463
(Ngun: Tính toán ca nhóm nghiên cu)
Trong phn này, chúng tôi thc hin phân tích thng t để đưa ra cái nhìn tổng
quan v tp d liệu. Điều này bao gm vic xem t phân b ca các biến chính như "Giá Bán",
"T L Giảm Giá", "Lượt Bán" và "Lượt Đánh Giá 5 Sao".
Giá bán:
Giá bán ca sn phm phm vi rng ln, t 1,000 đến 118,990,000, vi giá trung
bình là khoảng 6,193,412. Điu này cho thy th trường có s đa dạng v mc giá, t các sn
phm giá r đến nhng sn phm cao cp.
668
PHÂN TÍCH ĐỊNH LƯỢNG CÁC VẤN ĐỀ KINH T VÀ XÃ HỘI TRONG MÔI TRƯỜNG S LN TH 3
S phân b ca giá bán cho thy mt s ít sn phm giá rt cao, th các sn
phm công ngh cao cp hoc mi ra mt.
Hình 1. Biểu đồ phân b d liu ca các thuc tính
(Ngun: Tính toán ca nhóm nghiên cu)
T l gim giá:
T l gim giá trung bình 23.8%, vi giá tr ti thiu 0% và tối đa 71%. Điều
này phn ánh chiến lược gim giá đa dạng ca các nhà bán hàng trên nn tng thương mại điện
t.
S phân b ca t l gim giá cho thy nhiu sn phm được gim giá mức độ va
phải, điều này có th là mt chiến lược thu hút khách hàng.
t bán:
S phân b s ng bán hàng rt biến động với độ lch chun ln (236.998) so vi
trung bình (47.34).
Có mt t l ln sn phẩm không bán được hoc bán rt ít (Q1 mc 0 và trung v ch
17). Tuy nhiên có mt s sn phm n chy vi s ng bán hàng ln nht lên ti 9897, cho
thy có nhng sn phm cc k ph biến.
t đánh giá 5 sao:
ợt đánh giá 5 sao dao động t 0 đến 2463, vi giá tr trung bình là khoảng 22. Điều
này cho thấy đa số sn phẩm có lượng đánh giá 5 sao ở mức độ trung bình hoc thp.
Mt s ít sn phẩm lượng đánh giá 5 sao rất cao, điều này th phn ánh mức độ
ph biến và chất lượng cao ca sn phẩm đó.
Nhng phân tích này cung cấp cái nhìn bộ v nh hình th trường sn phẩm điện t