TP CHÍ KHOA HC KINH T - S 12(05) 2025
29
NHN DIN GIAN LN BÁO CÁO TÀI CHÍNH:
TỔNG QUAN XU HƯỚNG NGHIÊN CU VÀ HƯỚNG ĐI MI
DETECTING FINANCIAL STATEMENT FRAUD: A COMPREHENSIVE REVIEW OF
RESEARCH TRENDS AND FUTURE DIRECTIONS
Ngày nhn bài: 04/03/2025
Ngày nhn bn sa: 25/05/2025
Ngày chp nhận đăng: 14/07/2025
Tiêu Th Thanh Hoa, Hoàng Thanh Hin
TÓM TT
Bài báo tng hp các nghiên cứu trong ngoài nước v nhn din GLBCTC ca doanh nghip,
nhm cung cp cái nhìn tng quát v kết qu đạt được. Thông qua so sánh gia các hình d
báo s dng ch s tài chính, thông tin phi tài chính và k thut hc máy, nghiên cu nhn din hiu
qu t tri ca hc máy so với các phương pháp thống truyn thống. Đồng thi, bài báo ch
ra các khong trng nghiên cu ti Việt Nam, như hạn chế tích hp thông tin phi tài chính, ng dng
ch yếu phương pháp truyền thng và phm vi nghiên cu gii hạn đi vi doanh nghip niêm yết
trên mt sàn giao dch. Nhng phát hin này góp phn cng c nn tng lý thuyết và đưa ra hàm ý
chính sách cho các bên liên quan.
T khóa: Ch s tài chính; Gian ln báo cáo tài chính; Thông tin phi tài chính; Hc máy.
ABSTRACT
This paper surveys both domestic and international research on detecting financial statement fraud
in firms, presenting a concise overview of the main findings. By comparing models that use financial
ratios, non-financial information, and machine learning techniques, the study demonstrates that
machine learning methods outperform traditional statistical approaches. It also identifies research
gaps in Vietnam, such as the limited integration of non-financial data, the predominant reliance on
traditional methods, and the narrow focus on companies listed on a single exchange. These findings
contribute to the theoretical foundation for developing more effective fraud detection models and
offer policy implications for relevant stakeholders.
Keywords: Fraudulent financial statements; Financial indicators; Non-financial information; Machine
learning.
1. Giới thiệu
Gian ln báo cáo tài chính (GLBCTC)
mt trong nhng ri ro nghiêm trng nhất đối
vi s minh bch và n định ca th trường tài
chính. Hu qu ca các v gian ln tài chính
không ch gii hn trong phm vi doanh nghip
còn gây ra những tác động lan ta, làm lung
lay nim tin của nhà đầu tư và ảnh hưởng tiêu
cực đến toàn b nn kinh tế. Nhng v bi
tài chính lớn như Enron, Worldcom, Global
Crossing, Adelphia, Lehman Brothers đã để li
bài hc sâu sc v hu qu nghiêm trng ca
vic thao túng báo cáo tài chính, dẫn đến phá
sn doanh nghip thit hi hàng t USD. Ti
Vit Nam, các v gian lận tài chính như Công
ty Bánh ko Biên Hòa (2002), Công ty Đồ hp
3
Tiêu Th Thanh Hoa, Trường Đại hc Công nghip TP. H Chí Minh
Hoàng Thanh Hin, Đại hc FPT, Cơ sở Đà Nẵng
Email: hienht57@fe.edu.vn
TRƯỜNG ĐẠI HC KINH T - ĐẠI HC ĐÀ NNG
30
H Long (2002), Công ty Bông Bch Tuyết
(2004-2008), Công ty Dược Viễn Đông
(2009), Công ty G Trường Thành (2016)
gần đây là Tập đoàn Tân Hoàng Minh (2024),
Tập đoàn Vạn Thnh Phát (2024), tiếp tục đặt
ra nhng thách thức đối vi h thng kim soát
tài chính và quy trình giám sát doanh nghip.
Theo Hip hội Các nhà điều tra gian ln
(ACFE, 2016-2024), mc dù GLBCTC không
phi loi gian ln ph biến nht so vi chiếm
đoạt tài sản hay tham nhũng, nhưng li gây
thit hi ln nht. Nghiên cu ca Kaminski
cng s (2004) ch ra rng hu hết các v gian
ln ch đưc phát hin sau nhiều năm, khi hậu
qu đã trở n nghiêm trng. Báo cáo ca
ACFE (2022) cũng nhấn mnh rng gian ln
tài chính trung bình mất 2 năm để phát hin,
thi gian phát hin ng lâu thì tn tht càng
lớn. Đáng lo ngại hơn, khi gian ln b phát
hin, các bng chứng thường đã bị xóa b hoc
bóp méo, khiến vic x tr nên khó khăn
hơn. Điều này đặt ra mt câu hi cp thiết: Liu
th phát hin GLBCTC sớm hơn để cung
cp cnh báo kp thi cho c bên liên quan
hay không?
Trong bi cảnh đó, nghiên cứu v mô hình
nhn diện GLBCTC đã và đang trở thành mt
xu hướng quan trng trong gii hc thut. Các
phương pháp truyền thng da trên ch s tài
chính như Altman Z-score, Beneish M-score
đã được s dng rộng rãi để phát hin gian ln.
Tuy nhiên, vi s phát trin ca công ngh, các
phương pháp mi ng dng hc máy (machine
learning), trí tu nhân to (AI), d liu phi
tài chính đã chứng minh được hiu qu t
tri. Dù vy, ti Vit Nam, hu hết các nghiên
cu vn ch yếu áp dng các hình truyn
thống, chưa khai thác đầy đủ tiềm năng của các
phương pháp tiên tiến.
Bài nghiên cu này nhm h thng hóa các
phương pháp nhận diện GLBCTC, đồng thi
xác định nhng khong trng nghiên cu còn
tn tại, đặc bit trong bi cnh Việt Nam. Để
đạt được mc tiêu này, nghiên cu tp trung tr
li câu hi: Những phương pháp hình
nào đã được s dụng để nhn din gian ln báo
cáo tài chính, khong trng nào còn tn ti
trong nghiên cu hiện nay, đặc bit trong bi
cnh Vit Nam?
Bng cách tng hp các nghiên cu trong
ngoài nước, nghiên cu này không ch làm
xu hướng phát triển trong lĩnh vực phát hin
gian lận tài chính còn đưa ra đề xut v
những hướng đi mới, góp phn ci thin hiu
qu d báo h tr các nhà qun lý, kim toán
viên trong vic phát hin sm các hành vi gian
ln. Để đạt được mc tiêu nghiên cu, bài báo
không ch dng vic tp trung vào phân tích
các phương pháp khai thác d liệu được s
dng cho phát hiện GLBCTC như nghiên cứu
tng quan ca Gupta và Mehta (2024). Mà còn
xem xét đến các biến/thuc tính bao gm ch
s tài chính thông tin phi tài chính được đưa
vào mô nh d đoán trong c nghiên cứu như
thế nào. Đây là điểm tương đồng vi nghiên
cu tng quan ca Shahana và cng s (2023).
Ngoài ra, theo khuyến ngh ca Shahana
cng s (2023), các nghiên cứu trong tương lai
nên m rng tổng quan đối vi c nhng
nghiên cu ti các quốc gia đang phát triển.
Điu này nhm cung cp bng chng v tình
hình nghiên cứu cũng như tính hiệu qu ca
các phương pháp tự động (hc máy, trí tu
nhn to) các quc gia này so vi nghiên cu
của các nước phát triển. Như vậy, vic thc
hin tng quan các nghiên cu bao gm c Vit
Nam - mt nước đang phát triển th góp
phn làm phong phú tài liu v ch đề nghiên
cu nhn diện GLBCTC. Đây là một s đóng
góp cơ bản ca nghiên cu này.
2. Tổng quan nghiên cứu gian lận trong báo
cáo tài chính của các doanh nghiệp
Nghiên cu tng hp các tài liu trong
ngoài nước v nhn din GLBCTC da trên
tiêu chí chn lc cht ch. Vic tìm kiếm được
thc hiện theo tiêu đề, tóm tt và t khóa đưc
TP CHÍ KHOA HC KINH T - S 12(05) 2025
31
s dng: nhn din gian ln báo cáo tài
chính, detecting fraudulent financial
statements”. Các tài liệu được la chn t các
tp chí khoa hc uy tín thuc danh mc
Scopus, ISI Hội đồng giáo i vi các
bài báo trong nước), xut bn t 1995-2024 để
đảm bo tính cp nhật, đồng thi gi li các
nghiên cu nn tảng như Altman Z-score. Kết
qu tìm kiếm vi s ng 145 bài báo nghiên
cứu liên quan đến nhn din GLBCTC. Nhng
nghiên cu không d liu thc nghim hoc
không rõ ngun gc b loi b. Đồng thi, ch
các tài liu kết qu nghiên cứu đề cập đến
hiu sut d đoán gian lận mới được tng quan
và phân tích vi s ng 38 bài (Bng 1). Bi
vì, mt trong nhng mục đích quan trng ca
ch đề nghiên cu nhn din GLBCTC cung
cp công c d đoán khả năng tồn ti
GLBCTC và được đánh giá bằng hiu sut d
đoán. Các tài liệu sau đó được phân loi theo
phương pháp dự đoán gian lận: hình truyn
thng, hc máy, tích hp thông tin phi tài
chính. Các nghiên cứu ban đầu v d đoán
GLBCTC ch yếu xây dng mô hình bng các
ch s tài chính. Kết qu nghiên cứu đã cho ra
đời các hình kinh điển vẫn được s dng
cho đến ngày nay chng hạn như Altman Z-
score và Beneish M-score.
2.1. Mô hình Altman Z-score
Theo Altman (1968) các nghiên cứu đã ngụ
ý rng các ch s tài chính tiềm năng nhất
định trong vic d báo s phá sản. Do đó, ông
s dụng năm tỷ s tài chính bao gm: vốn lưu
động/tng tài sn; li nhun gi li/tng tài
sn; li nhuận trước lãi vay thuế/tng tài
sn; giá tr th trưng ca vn ch s hu/giá
tr s sách ca tng n; doanh thu/tng tài sn
để phát trin mô hình nghiên cu. Tác gi vn
dụng phương pháp phân tích phân biệt nhiu
lần (Multiple discriminant analysis) để so sánh
các doanh nghip không phá sản đã psản.
Kết qu cho thy hình d đoán chính xác
vic phá sn tối đa hai năm trước khi thc tế
xy ra. Mô hình Z -score ban đu áp dng cho
các doanh nghip sn xut niêm yết trên th
trưng chng khoán. Sau đó, Altman cộng
s (1998) đã điều chnh loi b ch s tài chính
“doanh thu/tổng tài sản” và thay đi các trng
s so vi hình gốc năm 1968 nhằm áp dng
phù hợp đối vi th trưng mi ni. Mức điểm
Z-score càng cao thì sc khe tài chính ca
doanh nghip càng tt.
Nghiên cu sau này (Lenard cng s,
2009; Văn Nghị Hoàng Cm Trang,
2013) xác nhn rng Z-score có th ch báo
cho gian ln báo cáo tài chính, do mi quan h
giữa khó khăn tài chính thao túng lợi nhun
(DeAngelo cng s, 1994; Rosner, 2003;
Charitou cng s, 2007; Chen cng s,
2010; Li cng s, 2014). Các nghiên cu
khác (Beasley cng s, 1999; Kinney
McDaniel, 1989; Mishra Drtina, 2004) cũng
cho thy các doanh nghip tình trng tài
chính kém kh năng GLBCTC cao n so
vi doanh nghiệp bình thường, cng c vai trò
ca Z-score trong vic phát hin du hiu bt
thường tài chính.
2.2. Mô hình Beneish M-score
Beneish (1999) phát trin M-score, mt
hình thng nhằm xác đnh doanh nghip
thao túng thu nhp bng cách s dng 8 ch s
tài chính, bao gm: t l khon phi thu/doanh
thu, li nhun gp biên, chất lượng tài sản, tăng
trưng doanh thu, khu hao tài sn, chi phí bán
hàng và qun lý, biến dn tích kế toán/tng tài
sản, đòn bẩy tài chính. hình này phân
loi doanh nghip có hoc không có GLBCTC
da trên một ngưỡng điểm nhất định.
Nhiu nghiên cứu đã kiểm định độ chính
xác ca M-score ti c quc gia khác nhau
(Arshad cng s, 2015; Herawati, 2015;
Nguyen Nguyen, 2016; Lotfi và Chadegani,
2018; Hołda, 2020; Phạm Th Mng Tuyn,
2019; Halilbegovic cng s, 2020; Hoàng
Anh cng s, 2022). Kết qu cho thy
hình độ chính xác trung bình khong
TRƯỜNG ĐẠI HC KINH T - ĐẠI HC ĐÀ NNG
32
75%, thm chí mt s nghiên cu ch đạt 40%
(Bng 1). Mt s hc gi (Bhavani
Amponsah, 2017; Marais cng sự, 2023) đã
khuyến ngh thn trng khi s dng hình
này do nhng hn chế v độ chính xác.
Để ci thin hiu sut d báo, nhiu nghiên
cu m rng M-score bng cách b sung biến
tài chính (Kaminski cng s, 2004;
Kanapickienė Grundienė, 2015;
Zainudin
Hashim, 2016) hoc tích hp thông tin phi
tài chính (Dechow và cng s, 2011). Dechow
cng s (2011) đã phát triển F-score, mt
biến s kết hp d liu tài chính thông tin
t th trường chứng khoán. Mô hình này đạt đ
chính xác khong 65,9% khi F-score > 1, cho
thy xác sut cao doanh nghip gian ln.
hình Dechow F-score đã được kiểm định
m rng trong các nghiên cu v nhn din
GLBCTC ti Vit Nam (Nguyn Tiến Hùng
Võ Hồng Đức, 2017; Bùi Phương Chi và cộng
s, 2021; Trn Th Giang Tân cng s,
2015; Dang và cng s, 2017; Nguyn Tiến
Hùng cng s, 2018; Phm Th Mng
Tuyn, 2019).
Bên cạnh phương pháp hồi quy logistic
truyn thng, nhiu nghiên cu đã áp dụng hc
máy để nâng cao độ chính xác d báo (Green
Choi, 1997; Feroz cng s, 2000;
Gaganis, 2009; Lin và cng s, 2015; Hajek
Henriques, 2017; Jan, 2018; Hajek, 2019;
Đặng Ngc Hùng cng s, 2022; Nguyen
và cng s, 2022). Mt s nghiên cu còn kết
hp thông tin phi tài chính trong hình hc
máy để tối ưu hóa khả năng phát hiện gian ln
(Ata và Seyrek, 2009; Omar và cng s, 2017;
Lin cng s, 2003; Kotsiantis cng s,
2006; Kirkos cng s, 2007; Liou, 2008;
Ravisankar cng s, 2011; Lokanan cng
s, 2019). Tng hp t các nghiên cứu trước
đây cho thấy phương pháp học máy hiu
sut d báo cao hơn so với phương pháp thng
kê truyn thống, đặc bit khi tích hp c ch s
tài chính và thông tin phi tài chính (Bng 1).
Bng 1. Thng kê kết qu nghiên cu nhn din gian ln trong báo cáo tài chính
MÔ HÌNH SỬ DỤNG CHỈ SỐ TÀI CHÍNH
Phương pháp truyền thống
STT
Tác giả
Quốc gia
Thuật toán/Phương pháp
Tỷ lệ mẫu
(gian lận:
không
gian lận)
1
Persons (1995)
Mỹ
Hồi quy Logistic
(Logistic regression)
280:203
(Nhiều: 1)
2
Kaminski và
cộng sự (2004)
Mỹ
Phân tích phân biệt
(Discriminant analysis)
79:79
(1:1)
3
Kanapickienė và
Grundienė
(2015)
Lithuania
Hồi quy Logistic
(Logistic regression)
40:125
(1:nhiều)
4
Arshad cộng
sự (2015)
Malaysia
Hồi quy Logistic
(Logistic regression)
24:24
(1:1)
5
Tarjo và
Herawati (2015)
Indonesia
Hồi quy Logistic
(Logistic regression)
35:35
(1:1)
6
Nguyen và
Nguyen (2016)
Việt Nam
Beneish M-Score
223:0
7
Lotfi và
Chadegani
(2018)
Iran
Hồi quy Logistic
(Logistic regression)
137:0
8
Hołda (2020)
Ba Lan
Beneish M - score
30:30
(1:1)
TP CHÍ KHOA HC KINH T - S 12(05) 2025
33
9
Halilbegovic và
cộng sự (2020)
Liên bang
Bosnia và
Herzegovi
na
Beneish M-Score
68
79,41%
10
Hoàng Hà Anh
và cộng sự
(2022)
Việt Nam
Beneish M-Score
Hồi quy Logistic
(Logistic regression)
38:65
(1: nhiều)
44,70%
Phương pháp học máy
11
Green và Choi
(1997)
Mỹ
Mạng nơ ron
(Neural networks)
86:95
(1: nhiều)
68,64%
12
Lin và cộng sự
(2003)
Mỹ
Mạng nơ ron mờ
(Neuron - Fuzzy)
20:80
(1: nhiều)
35%
Hồi quy Logistic
(Logistic regression)
97%
13
Kotsiantis và
cộng sự (2006)
Hy Lạp
Cây quyết định
(Decision tree)
41:123
(1: nhiều)
85,20%
Mạng nơ ron nhân tạo
(Artificial neural networks)
36,60%
Mạng niềm tin Bayesian
(Bayesian Belief network)
51,20%
Hồi quy Logistic
(Logistic regression)
36,60%
k - láng giềng gần nhất
(k-Nearest Neighbour)
56,10%
Máy vector hỗ trợ
(Support vector machine) )
48,80%
14
Kirkos và cộng
sự (2007)
Hy Lạp
Cây quyết định
(Decision tree)
38:38
(1: 1)
75%
Mạng niềm tin Bayesian
(Bayesian Belief network)
91,70%
Mạng nơ ron nhân tạo
(Neural networks)
82,50%
15
Liou (2008)
Đài Loan
Hồi quy Logistic
(Logistic regression)
3018:3019
(1: 1)
99,05%
Mạng nơ ron
(Neural networks)
95,82%
Cây quyết định
(Decision tree)
95,59%
16
Ata và Seyrek
(2009)
Thổ Nhĩ
Kỳ
Cây quyết định
(Decision tree)
50:50
(1: 1)
67,92%
17
Ravisankar và
cộng sự (2011)
Trung
Quốc
Mạng thần kinh truyền thẳng
đa lớp (Multiplayer Feed
Forward Neural Network)
101:101
(1: 1)
78,36%
Máy vector hỗ trợ
(Support vector machine)
70,41%
Lập trình di truyền
(Genetic programming)
94,14%
Phương pháp xử lý dữ liệu
nhóm
(Group Method of Data
Handling)
93%
Mạng nơ ron xác suất
(Probabilistic Neural Network)
98,09%