
86
Tạp chí Kinh tế - Luật và Ngân hàng
Năm thứ 27(13)- Tháng 12. 2025- Số 285
© Học viện Ngân hàng
ISSN 3030 - 4199
Ứng dụng Machine Learning trong đánh giá sức
khỏe kinh tế tư nhân tại các địa phương Việt Nam
Ngày nhận: 18/07/2025 Ngày nhận bản sửa: 19/10/2025 Ngày duyệt đăng: 19/11/2025
Tóm tắt: Kinh tế tư nhân là động lực quan trọng của tăng trưởng, tạo việc làm
và đổi mới sáng tạo, song Việt Nam còn thiếu một thước đo hệ thống về “sức
khỏe” khu vực này ở cấp địa phương. Do vậy, bài viết tiến hành xây dựng chỉ
số tổng hợp sức khỏe kinh tế tư nhân cho 63 tỉnh/thành, phục vụ phân nhóm
địa phương và định hướng chính sách. Phương pháp nghiên cứu ứng dụng
học máy: PCA để giảm chiều và rút trích các chiều cạnh cốt lõi (quy mô, mật
độ, hiệu quả vận hành), sau đó K-means để phân cụm địa phương. Dữ liệu sử
dụng từ Tổng cục Thống kê (2022), bao quát chỉ tiêu số lượng và chất lượng.
Kết quả xác định ba cụm rõ nét: (i) Thành phố Hà Nội và Thành phố Hồ Chí
Minh có quy mô lớn và phát triển tương đối toàn diện; (ii) nhóm tỉnh công
nghiệp (Bắc Ninh, Bắc Giang, Hải Phòng, Bà Rịa- Vũng Tàu) có mật độ doanh
Applying Machine Learning in assessing the health of the private economy in Vietnamese
localities
Abstract: The private economy is a crucial driving force for growth, job creation, and innovation; however,
Vietnam still lacks a systematic measure of the "health" of this sector at the local level. Therefore,
this article builds a comprehensive index of private economic health for 63 provinces/cities, serving
local clustering and policy orientation. The research method applies machine learning: PCA to reduce
dimensionality and extract core dimensions (scale, density, operational efficiency), then K-means to cluster
localities. The data used are from the General Statistics Office (2022), covering both quantity and quality
indicators. The results identify three clear clusters: (i) Hanoi and Ho Chi Minh City have large scale and
relatively comprehensive development; (ii) the group of industrial provinces (Bac Ninh, Bac Giang, Hai
Phong, Ba Ria- Vung Tau) has a high density of enterprises, efficient use of capital but overall efficiency
is not equal to cluster (i); (iii) mountainous/remote provinces have modest scale and efficiency. The new
contribution of this study is to propose a multidimensional, transparent, and reproducible index based
on PCA- K-means, thereby providing an empirical basis for designing policy recommendations tailored to
local clusters.
Keywords: Private Economy, Principal Component Analysis, Cluster Analysis, Localities, Viet Nam
Link Doi: http://doi.org/10.59276/JELB.2025.12.3032
Nguyen Bich Ngoc
Email: ngocnb@hvnh.edu.vn
Organization: Banking Academy of Viet Nam
Nguyễn Bích Ngọc
Học viện Ngân hàng, Việt Nam
CÔNG NGHỆ VÀ KINH TẾ SỐ

NGUYỄN BÍCH NGỌC
87
Năm thứ 27 (13)- Tháng 12. 2025- Số 285- Tạp chí Kinh tế - Luật & Ngân hàng
nghiệp cao, sử dụng vốn hiệu quả nhưng hiệu quả tổng thể chưa ngang cụm
(i); (iii) các tỉnh miền núi/xa trung tâm có quy mô và hiệu quả còn khiêm tốn.
Đóng góp mới của nghiên cứu là đề xuất một chỉ số đa chiều, minh bạch và
tái lập dựa trên PCA- K-means, qua đó cung cấp cơ sở thực chứng để thiết kế
khuyến nghị chính sách theo cụm địa phương.
Từ khóa: Kinh tế tư nhân, Phân tích thành phần chính, Phân tích cụm, Địa phương,
Việt Nam
1. Giới thiệu
Kinh tế tư nhân ngày càng được xác định
là động lực quan trọng đối với tăng trưởng
kinh tế, đặc biệt tại các nền kinh tế chuyển
đổi, nơi khu vực công từng giữ vai trò chi
phối. Từ góc độ lý thuyết, vai trò của khu
vực tư nhân đã được khẳng định qua các
mô hình kinh tế tiêu biểu như mô hình hai
khu vực của Lewis (1954), mô hình tăng
trưởng Solow-Swan (Solow, 1956; Swan,
1956), và mô hình tăng trưởng nội sinh của
Barror (1990), trong đó nhấn mạnh vai trò
của tích lũy tư bản, đổi mới sáng tạo và hiệu
quả sử dụng nguồn lực trong việc thúc đẩy
tăng trưởng dài hạn. Về mặt thực chứng,
các nghiên cứu thực nghiệm đa quốc gia
như De Gregorio (1992), Levine và Renelt
(1992), Ahamed (2021), Boudreaux và
cộng sự (2019), Turan và Yanıkkaya
(2021) và tại Việt Nam như Bùi Hữu Toàn
(2025); Trần Việt Dũng và cộng sự (2025)
đều cho thấy phát triển khu vực tư nhân có
mối quan hệ chặt chẽ với năng suất, hiệu
quả đầu tư và tăng trưởng bền vững, đặc
biệt tại các nền kinh tế đang phát triển.
Với những bằng chứng rõ nét từ cả lý
thuyết và thực nghiệm về vai trò của kinh
tế tư nhân đến tăng trưởng kinh tế, kinh tế
tư nhân đã nhận được nhiều sự quan tâm
từ các nhà lãnh đạo cấp cao tại các quốc
gia trên thế giới và Việt Nam. Trong đó,
tại Việt Nam từ năm 2020 đến nay, Đảng
và Nhà nước đã ban hành nhiều chính sách
quan trọng nhằm thúc đẩy vai trò của khu
vực kinh tế tư nhân như một động lực trung
tâm của tăng trưởng kinh tế. Tiêu biểu là
Nghị quyết số 68-NQ/TW ngày 4/5/2025
của Bộ Chính trị, trong đó khẳng định kinh
tế tư nhân là “động lực quan trọng nhất”
và đặt mục tiêu khu vực này đến năm 2030
đóng góp 55- 58% GDP, giải quyết 85%
việc làm xã hội. Trước đó, Nghị quyết
139/NQ-CP của Chính phủ và Nghị quyết
198/2025/QH15 của Quốc hội cũng đưa
ra hàng loạt chính sách hỗ trợ về thể chế,
thuế, đất đai, tín dụng và cải cách hành
chính nhằm khơi thông nguồn lực cho kinh
tế tư nhân. Cùng với đó, các phát biểu của
lãnh đạo cấp cao như Thủ tướng Chính phủ
Phạm Minh Chính và Tổng Bí thư- Chủ
tịch nước Tô Lâm đều nhấn mạnh vai trò
tiên phong của khu vực tư nhân trong đổi
mới sáng tạo, chuyển đổi số và tạo việc làm.
Xuất phát từ thực tiễn đó, nhu cầu đo lường,
đánh giá sức khỏe kinh tế tư nhân ở cấp độ
quốc gia nói chung, và tại địa phương nói
riêng để đưa ra các chính sách hỗ trợ phù
hợp nhằm phát huy hơn nữa sức mạnh của
khu vực này là điều vô cùng cần thiết. Một
số phương pháp đo lường sức mạnh kinh
tế tư nhân cấp địa phương đã được phát
triển dựa trên các nhóm dữ liệu và công cụ
khác nhau. Theo đó, các phương pháp có
thể được chia thành ba nhóm chính: (1) dựa
trên đầu tư và tích lũy vốn, (ii) dựa trên
kết quả sản xuất- việc làm, và (iii) dựa trên
môi trường thể chế và hành vi thị trường.

Ứng dụng Machine Learning trong đánh giá sức khỏe
kinh tế tư nhân tại các địa phương Việt Nam
88
CÔNG NGHỆ VÀ KINH TẾ SỐ
Tạp chí Kinh tế - Luật & Ngân hàng- Năm thứ 27 (13)- Tháng 12. 2025- Số 285
Tuy nhiên, các phương pháp hiện hành mới
chỉ dừng lại ở việc phản ánh quy mô hoặc
mức độ hiện diện của khu vực tư nhân (như
số lượng doanh nghiệp đăng ký, tỷ lệ lao
động làm việc trong khu vực tư, hay cảm
nhận doanh nghiệp về môi trường kinh
doanh), trong khi chưa tiếp cận đầy đủ các
yếu tố phản ánh chất lượng hay hiệu quả
hoạt động của khu vực này. Chính vì vậy,
nghiên cứu này hướng đến (i) ứng dụng
machine learning trong đo lường sức khỏe
kinh tế tư nhân địa phương ở cả khía cạnh
lượng và chất; (ii) xếp hạng và phân loại
sức khỏe kinh tế tư nhân tại các địa phương
và (iii) đưa ra hệ khuyến nghị phù hợp cho
từng nhóm địa phương. Về lý luận, nghiên
cứu góp phần chuẩn hóa và vận dụng khái
niệm “sức khỏe kinh tế tư nhân” theo tiếp
cận đa chiều bao hàm cả số lượng và chất
lượng. Ngoài ra, nghiên cứu cũng đề xuất
khung đo lường hợp nhất PCA và K-means
để trích xuất cấu phần cốt lõi và phân loại
hình thái phát triển, tạo chỉ số tổng hợp
minh bạch, tái lập, bổ khuyết cho PCI. Về
thực tiễn, nghiên cứu cung cấp bộ chỉ số
sức khỏe kinh tế tư nhân cho 63 tỉnh để lập
bản đồ phân cụm, và khuyến nghị chính
sách phù hợp đặc điểm địa phương; qua đó,
hỗ trợ thúc đẩy kinh tế tư nhân.
Bài nghiên cứu ngoài phần lời mở đầu được
chia thành 4 phần chính bao gồm (2) tổng
quan nghiên cứu, (3) dữ liệu và phương
pháp nghiên cứu, (4) kết quả nghiên cứu
và (5) kết luận và khuyến nghị chính sách.
2. Tổng quan nghiên cứu
2.1. Kinh tế tư nhân
Khái niệm kinh tế tư nhân được tiếp cận
theo nhiều góc nhìn trong tài liệu quốc tế
cũng như trong thực tiễn quản lý tại Việt
Nam. Theo OECD (2004), khu vực kinh tế
tư nhân bao gồm tất cả các tổ chức kinh tế
vận hành theo nguyên tắc sở hữu tư nhân,
hoạt động vì lợi nhuận trong môi trường
thị trường cạnh tranh. Định nghĩa này nhấn
mạnh yếu tố quyền sở hữu và sự độc lập
với khu vực công, đồng thời phản ánh vai
trò của khu vực tư nhân như một động lực
thúc đẩy sản xuất, sáng tạo và tăng trưởng.
Cách tiếp cận tương tự được UNDP (2018)
đưa ra, theo đó khu vực tư nhân bao gồm
các công ty đa quốc gia, doanh nghiệp vừa
và nhỏ, các hợp tác xã và tổ chức trung
gian. Việc đưa cả hợp tác xã và tổ chức xã
hội vào phạm vi khái niệm thể hiện một
cách nhìn rộng hơn về khu vực tư nhân,
chú trọng đến bản chất hoạt động thị trường
hơn là hình thức pháp lý cụ thể.
Tại Việt Nam, Tổng cục Thống kê- GSO
(2021) định nghĩa khu vực kinh tế tư nhân
bao gồm các doanh nghiệp ngoài nhà nước,
hộ kinh doanh và hợp tác xã- những đơn vị
có đăng ký và hoạt động hợp pháp, đóng
góp giá trị gia tăng vào nền kinh tế. Định
nghĩa này phản ánh cách phân loại hành
chính- thống kê tại Việt Nam, nhưng cũng
phần nào cho thấy sự công nhận rõ ràng đối
với vai trò thực tiễn của khu vực tư nhân
trong nền kinh tế.
Từ các góc nhìn nêu trên, có thể thấy hai
hướng tiếp cận nổi bật: hướng thứ nhất nhấn
mạnh bản chất sở hữu và cơ chế thị trường
(như OECD và UNDP), trong khi hướng
thứ hai (như GSO) chú trọng đến khía cạnh
pháp lý và thống kê nhằm xác định quy mô
và đóng góp cụ thể của khu vực này. Trong
khuôn khổ nghiên cứu này, khu vực kinh
tế tư nhân được hiểu dựa theo hướng thứ
hai là bao gồm các doanh nghiệp, cơ sở sản
xuất- kinh doanh hợp pháp, không thuộc sở
hữu nhà nước, đang hoạt động thực tế và có
đóng góp vào sản lượng, thu nhập, và việc
làm tại các địa phương.
2.2. Các phương pháp đo lường sức khỏe
kinh tế tư nhân

NGUYỄN BÍCH NGỌC
89
Năm thứ 27 (13)- Tháng 12. 2025- Số 285- Tạp chí Kinh tế - Luật & Ngân hàng
“Sức khỏe kinh tế tư nhân” được đo lường
theo nhiều cách tiếp cận khác nhau trong
các nghiên cứu trước đây, bao gồm mức
độ đóng góp của khu vực tư nhân vào
tăng trưởng kinh tế (Levine & Renelt,
1992; Solow, 1956), năng lực tạo việc làm
và hiệu quả hoạt động (Klapper & Love,
2010), hoặc môi trường thể chế và điều
kiện phát triển (PCI- VCCI & USAID).
Tuy nhiên, các chỉ tiêu truyền thống này
chủ yếu tập trung vào số lượng hoặc đầu
vào- đầu ra kinh tế, trong khi chưa phản
ánh đầy đủ chất lượng nội tại của khu vực
doanh nghiệp, như hiệu quả sử dụng vốn,
mức sinh lời, hay mức độ đổi mới sáng tạo.
Do đó, “sức khỏe kinh tế tư nhân” trong
nghiên cứu này được tiếp cận theo hướng
toàn diện hơn, bao gồm cả quy mô, năng
suất, hiệu quả hoạt động và điều kiện lao
động, nhằm phản ánh tổng thể năng lực phát
triển của khu vực này tại cấp địa phương.
Tại nghiên cứu này, với cách tiếp cận nhìn
nhận sức khỏe kinh tế tư nhân từ cả góc độ
số lượng và chất lượng, phương pháp học
máy, cụ thể là phương pháp phân tích thành
phần chính (PCA) và phân cụm K-means
(k-means clustering) được sử dụng. Điều
này là do các phương pháp như Phân tích
thành phần chính (Principal Component
Analysis- PCA) và phân cụm K-means đã
được nhiều công trình khoa học quốc tế
chứng minh về tính hiệu quả trong việc xây
dựng các chỉ số tổng hợp và phân nhóm đối
tượng theo đặc điểm tương đồng. Trong
đó, PCA cho phép rút gọn tập dữ liệu nhiều
chiều về một số thành phần chính có khả
năng giải thích phần lớn phương sai của dữ
liệu, từ đó hỗ trợ xây dựng chỉ số phản ánh
các đặc tính cốt lõi của hiện tượng kinh tế.
Bên cạnh đó, phân cụm K-means đã được
nhiều công trình khoa học quốc tế chứng
minh góp phần xác định các mô hình phát
triển tài chính, chất lượng dịch vụ công và
phân loại vùng kinh tế (Jolliffe & Cadima,
2016; Pham và cộng sự, 2022). Korir
(2024), Mulyaningsih và Heikal (2022) là
hai trong rất nhiều nghiên cứu chứng minh
sự kết hợp giữa PCA và K-means mang lại
hiệu quả trong phân tầng đối tượng theo
đặc trưng đa chiều. Cụ thể, Korir (2024)
cho thấy PCA giúp loại bỏ các thông tin
trùng lặp, đồng thời cô đọng thông tin cốt
lõi của bộ chỉ báo kinh tế- xã hội cấp quận/
hạt tại Kenya. Thông tin này sau đó được
tác giả sử dụng để tiến hành phân nhóm
5 cụm địa phương bằng phương pháp
K-means để phục vụ cho quá trình lập kế
hoạch phát triển kinh tế bao trùm, bền vững
ở địa phương. Ở cấp độ doanh nghiệp,
Mulyaningsih và Heikal (2022) sử dụng tỷ
số tài chính làm đầu vào, áp dụng PCA để
trích xuất thành phần chính và K-means để
phân cụm hiệu năng các công ty tài chính
tiêu dùng trên sàn Indonesia trước và trong
COVID-19. Qua đó, nhóm tác giả nhận
diện nhóm doanh nghiệp chịu ảnh hưởng
mạnh/ít bị ảnh hưởng, và gợi ý hệ quả
cho phân bổ danh mục/ra quyết định đầu
tư- một minh chứng điển hình cho đánh
giá “sức khỏe” doanh nghiệp bằng cụm
hiệu quả tài chính. Với những bằng chứng
thực nghiệm trên, việc tích hợp PCA và
K-means trong nghiên cứu này về sức khỏe
kinh tế tư nhân ở cấp địa phương không
chỉ phù hợp về mặt phương pháp luận mà
còn cho phép gia tăng giá trị ứng dụng của
kết quả nghiên cứu trong hoạch định chính
sách thực tiễn.
3. Dữ liệu và phương pháp nghiên cứu
Dữ liệu sử dụng trong nghiên cứu này được
khai thác từ bộ dữ liệu kinh tế trên cổng
thông tin của Tổng cục Thống kê Việt
Nam (https://www.nso.gov.vn/), trong đó
tập trung vào dữ liệu doanh nghiệp của 63
địa phương (63 quan sát) tại Việt Nam. Tại
mỗi địa phương, tác giả tiến hành thu thập

Ứng dụng Machine Learning trong đánh giá sức khỏe
kinh tế tư nhân tại các địa phương Việt Nam
90
CÔNG NGHỆ VÀ KINH TẾ SỐ
Tạp chí Kinh tế - Luật & Ngân hàng- Năm thứ 27 (13)- Tháng 12. 2025- Số 285
dữ liệu từ 17 chỉ số về kinh tế doanh nghiệp
(bao gồm 9 chỉ số phản ánh số lượng và 8
chỉ số phản ánh chất lượng) tại thời điểm
năm 2022- năm dữ liệu được cập nhật gần
nhất tính tới thời điểm nghiên cứu này
được thực hiện.
Dữ liệu sau khi thu thập sẽ lần lượt được
xử lý và phân tích trong phần mềm R qua
các bước sau:
Thứ nhất, dữ liệu sẽ được dữ liệu sẽ được
chuẩn hóa theo phương pháp chuẩn hóa
của Barron và Schmidt (1988) theo công
thức sau:
I{it}^{n} = (Iit - Min(Ii))/(Max(Ii) - Min(Ii))
Trong đó, I{it}^{n} là giá trị đã chuẩn hóa
của biến i năm t; Max(Ii) là giá trị tối đa
của biến i trong mỗi năm; Min(Ii) là giá trị
tối thiểu của biến i trong mỗi năm. Giá trị
sau chuẩn hóa sẽ dao động trong khoảng từ
0 đến 1.
Thứ hai, nghiên cứu áp dụng phương pháp
PCA để tiến hành giảm chiều dữ liệu. Cụ
thể, sự đa dạng của chỉ tiêu sử dụng trong
đo lường sức khỏe kinh tế tư nhân (9 chỉ
Bảng 1. Các chỉ số sử dụng trong đánh giá sức khỏe kinh tế tư nhân
Nhóm
chỉ tiêu
Chỉ số Ý nghĩa
Số
lượng
DN_DK_TLM
Số doanh nghiệp đăng ký thành lập mới
DN_DHD
Số doanh nghiệp đang hoạt động
DN_DHD_BQ
Số doanh nghiệp đang hoạt động tại thời điểm 31/12 hàng năm bình quân
trên 1.000 dân phân theo địa phương
DN_DHD_CKQ
Số doanh nghiệp đang hoạt động có kết quả sản xuất kinh doanh tại thời điểm
31/12 hàng năm phân theo địa phương chia theo Tỉnh/thành phố và Năm
TSLD_ TDNHD_
CKQ
Tổng số lao động trong các doanh nghiệp đang hoạt động có kết quả sản
xuất kinh doanh tại thời điểm 31/12 hàng năm phân theo địa phương
SHTX_DHD
Số hợp tác xã đang hoạt động có kết quả sản xuất kinh doanh tại thời điểm
31/12 hàng năm phân theo địa phương chia theo Tỉnh/thành phố và Năm
SCSK_TCT_PNN
Số cơ sở kinh tế cá thể phi nông nghiệp phân theo địa phương chia theo
Tỉnh/thành phố và Năm
LD_TCCSKT_
CTPNN
Lao động trong các cơ sở kinh tế cá thể phi nông nghiệp phân theo địa
phương chia theo Tỉnh/thành phố và Năm
SLD_THTX_DHD
Số lao động trong hợp tác xã đang hoạt động có kết quả sản xuất kinh do-
anh tại thời điểm 31/12 hàng năm phân theo địa phương
Chất
lượng
VSXKD
Vốn SXKD bình quân hàng năm của các DN đang hoạt động có kết quả
SXKD phân theo địa phương
GTTSCD_DTTCDH
Giá trị tài sản cố định và đầu tư tài chính dài hạn của các DN đang hoạt động
có kết quả SXKD tại thời điểm 31/12 hàng năm phân theo địa phương
DTT_SXKD_DND-
HD
Doanh thu thuần sản xuất kinh doanh của các doanh nghiệp đang hoạt
động có kết quả sản xuất kinh doanh phân theo địa phương
TTNLD
Tổng thu nhập của người lao động trong doanh nghiệp đang hoạt động có
kết quả sản xuất kinh doanh phân theo địa phương
TNBQ_NLĐ_1T
Thu nhập bình quân một tháng của người lao động trong doanh nghiệp
đang hoạt động có kết quả sản xuất kinh doanh phân theo địa phương
LNTT_DNDHD
Lợi nhuận trước thuế của doanh nghiệp đang hoạt động có kết quả sản xuất
kinh doanh phân theo địa phương
TSLN_DNDHD
Tỷ suất lợi nhuận của doanh nghiệp đang hoạt động có kết quả sản xuất
kinh doanh phân theo địa phương chia theo Tỉnh/thành phố và Năm
TBTSCDDBQ_1LD
Trang bị tài sản cố định bình quân 1 lao động của doanh nghiệp đang hoạt
động có kết quả sản xuất kinh doanh phân theo địa phương
Nguồn: Tổng hợp của tác giả

