BỘ GIÁO DỤC VÀ ĐÀO TẠO
NGÂN HÀNG NHÀ NƯỚC VIỆT NAM
TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP.HỒ CHÍ MINH
NGUYỄN LỆ ĐOAN TRANG
LỰA CHỌN MÔ HÌNH DỰ BÁO XÁC SUẤT VỠ NỢ
CỦA DOANH NGHIỆP VỪA VÀ NHỎ TẠI CÁC
NGÂN HÀNG THƯƠNG MẠI VIỆT NAM
DỰA TRÊN CÁC CHỈ SỐ TÀI CHÍNH
LUẬN VĂN THẠC SĨ KINH TẾ
TP. HỒ CHÍ MINH - NĂM 2019
BỘ GIÁO DỤC VÀ ĐÀO TẠO
NGÂN HÀNG NHÀ NƯỚC VIỆT NAM
TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP.HỒ CHÍ MINH
NGUYỄN LỆ ĐOAN TRANG
LỰA CHỌN MÔ HÌNH DỰ BÁO XÁC SUẤT VỠ NỢ
CỦA DOANH NGHIỆP VỪA VÀ NHỎ TẠI CÁC
NGÂN HÀNG THƯƠNG MẠI VIỆT NAM
DỰA TRÊN CÁC CHỈ SỐ TÀI CHÍNH
LUẬN VĂN THẠC SĨ KINH TẾ
Chuyên ngành: Tài chính - Ngân hàng
Mã số: 8 34 02 01
Người hướng dẫn khoa học: TS. NGÔ VI TRỌNG
TP. HỒ CHÍ MINH - NĂM 2019
LỜI CAM ĐOAN
Luận văn này chưa từng được trình nộp để lấy học vị thạc sĩ tại bất cứ một trường
đại học nào. Luận văn này là công trình nghiên cứu riêng của tác giả, kết quả nghiên
cứu là trung thực, trong đó không có các nội dung đã được công bố trước đây hoặc các
nội dung do người khác thực hiện ngoại trừ các trích dẫn được dẫn nguồn đầy đủ trong
luận văn.
TP Hồ Chí Minh ngày …. Tháng …. năm 2019
Tác giả luận văn
i
Nguyễn Lệ Đoan Trang
LỜI CẢM ƠN
Để hoàn thành luận văn thạc sĩ kinh tế này, tôi xin gửi lời cảm ơn sâu sắc đến
giảng viên hướng dẫn khoa học: Tiến sĩ Ngô Vi Trọng, đã tận tình hướng dẫn tôi trong
suốt quá trình hoàn thiện luận văn. Đồng thời tôi cũng xin gửi lời cảm ơn trân trọng đến
các thầy cô giáo Trường Đại học Ngân hàng TP Hồ Chí Minh đã tận tình truyền đạt kiến
thức trong 2 năm học tập, vốn kiến thức được trang bị trong quá trình học là kiến thức nền
tảng cho quá trình nghiên cứu đề tài. Cuối cùng kính chúc các thầy cô sức khỏe và thành
công trong sự nghiệp cao quý.
ii
Xin chân thành cảm ơn!
TÓM TẮT
Hệ thống xếp hạng tín dụng nội bộ luôn đóng vai trò quan trọng tại các NHTM
trong việc đánh giá mức độ rủi ro tín dụng của khách hàng đồng thời hỗ trợ ngân hàng
trong việc ra quyết định tín dụng cũng như trong các hoạt động quản trị rủi ro tại ngân
hàng. Đồng thời, Chính Phủ đã và đang xây dựng hành lang pháp lý đối với lĩnh vực
XHTN nhằm nâng cao tính công khai minh bạch thông tin hỗ trợ cho các ngân hàng kiểm
soát được rủi ro tín dụng ngay từ đầu cũng như hỗ trợ thị trường chứng khoán, thị trường
trái phiếu thúc đẩy huy động vốn thông qua thị trường chứng khoán, bảo vệ quyền và lợi
ích của nhà đầu tư. Việc nghiên cứu và lựa chọn các mô hình xếp hạng phù hợp sẽ đóng
góp rất nhiều đến sự phát triển của hoạt động xếp hạng tín nhiệm ở Việt Nam. Tuy nhiên,
các mô hình dự báo xác suất vỡ nợ hiện nay đều có những hạn chế nhất định và đang có
nhiều tranh luận, không thống nhất về mức độ tin cậy của các mô hình này dẫn đến sự
khó khăn trong việc lựa chọn mô hình phù hợp để dự báo xác suất vỡ nợ của doanh
nghiệp. Bên cạnh đó, việc xác định các chỉ số tài chính nào thực sự tác động đến kết quả
xếp hạng luôn là mục tiêu, vấn đề cần nghiên cứu trong các công trình nghiên cứu về dự
báo xác suất vỡ nợ. Cho đến nay, hiện vẫn chưa có nhiều nghiên cứu được công bố tại
Việt Nam về việc lựa chọn mô hình dự báo xác suất vỡ nợ của các doanh nghiệp dựa
trên các chỉ số tài chính.
Trên cơ sở của tầm quan trọng và mức độ cần thiết, mục tiêu của nghiên cứu này
nhằm: (i) xác định các tiêu chí của một mô hình dự báo phù hợp; (ii) cách lựa chọn mô
hình có khả năng dự báo xác suất vỡ nợ của doanh nghiệp vừa và nhỏ tại các NHTM Việt
Nam dựa trên các chỉ số tài chính. Kết quả đạt được từ nghiên cứu này hướng đến việc
cung cấp thêm những bằng chứng khoa học định lượng nhằm trả lời câu hỏi mô hình dự
báo nào mang lại kết quả tốt nhất trong việc dự báo xác suất vỡ nợ của các doanh nghiệp
iii
vừa và nhỏ tại các NHTM Việt Nam.
Đóng góp quan trọng nhất của nghiên cứu này là đề ra ý tưởng cơ bản trong việc
sử dụng các chỉ tiêu tài chính để dự báo xác suất vỡ nợ của các doanh nghiệp vừa và nhỏ,
qua đó góp phần nâng cao hiệu quả trong công tác kiểm soát rủi ro tín dụng của các
iv
NHTM ở Việt Nam trong thời gian tới.
MỤC LỤC
DANH MỤC CÁC BẢNG ..................................................................................... viii
DANH MỤC HÌNH .................................................................................................. ix
DANH MỤC TỪ VIẾT TẮT .................................................................................... x
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN ............................................................. 1
1.1 Tính cấp thiết của đề tài .............................................................................. 1
1.2 Vấn đề nghiên cứu ....................................................................................... 3
1.3 Mục tiêu nghiên cứu .................................................................................... 3
1.4 Câu hỏi nghiên cứu ...................................................................................... 4
1.5 Đối tượng và phạm vi nghiên cứu .............................................................. 4
1.6 Phương pháp nghiên cứu ............................................................................ 4
1.7 Đóng góp của đề tài ...................................................................................... 5
1.8 Cấu trúc của luận văn .................................................................................. 5
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU TRƯỚC ĐÂY ... 8
2.1 Xếp hạng tín nhiệm .......................................................................................... 8
2.2 Xác suất vỡ nợ (PD) ......................................................................................... 9
2.3 Khảo lược các mô hình dự báo xác suất vỡ nợ của doanh nghiệp ............ 10
2.4 Tổng quan các nghiên cứu trước .................................................................. 16
2.4.1 Các nghiên cứu trên thế giới ...................................................................... 16
v
2.3.2 Các nghiên cứu tại Việt Nam ..................................................................... 18
CHƯƠNG 3: MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU ........................ 21
3.1 Phương pháp xây dựng các mô hình ............................................................ 21
3.2 Thu thập và xử lý dữ liệu............................................................................... 22
3.3 Lựa chọn các biến đầu vào trong mô hình dự báo xác suất vỡ nợ ............ 24
3.4 Các mô hình dự báo xác suất vỡ nợ được nghiên cứu ................................ 27
3.4.1 Mô hình tham số ........................................................................................ 27
3.4.2 Mô hình phi tham số .................................................................................. 29
3.5 Phương pháp lựa chọn mô hình dự báo xác suất vỡ nợ ............................. 31
3.5.1 Ma trận Confussion .................................................................................... 31
3.5.2 Điểm số F1 (F1-score) ............................................................................... 34
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU .............................................................. 35
4.1 Kết quả thống kê mô tả .................................................................................. 35
4.2. Kết quả hồi quy ............................................................................................. 37
4.2.1 Kết quả hồi quy của các mô hình tham số ................................................. 37
4.2.2 Kết quả hồi quy của mô hình phi tham số ................................................. 42
CHƯƠNG 5: KẾT LUẬN ....................................................................................... 45
5.1 Ứng dụng mô hình để dự báo khả năng trả nợ của các khách hàng doanh
nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt Nam ........................ 46
5.1.1 Công cụ hỗ trợ trong việc xác định nhóm đối tượng khách hàng tiềm năng
............................................................................................................................ 46
5.1.2 Kết quả mô hình là cơ sở định hướng chính sách tín dụng ....................... 46
5.1.3 Vận dụng kết quả mô hình nhằm nâng cao hiệu quả quản lý rủi ro tín dụng
vi
ở các ngân hàng thương mại ............................................................................... 48
5.2 Hạn chế của đề tài và hướng nghiên cứu tiếp theo ..................................... 48
5.2.1 Hạn chế của đề tài ...................................................................................... 48
5.2.2 Hướng nghiên cứu trong tương lai ............................................................ 49
TÀI LIỆU THAM KHẢO ....................................................................................... 50
vii
PHỤ LỤC
DANH MỤC CÁC BẢNG
Số thứ tự Tên bảng Trang
Bảng 2.1 Khảo lược các mô hình xếp hạng tín nhiệm dự báo xác suất vỡ nợ 11
Bảng 3.1 Tổng hợp số lượng doanh nghiệp – ngành nghề kinh doanh 24
Bảng 3.2 Phân tách các công ty phá sản và không phá sản 25
Bảng 3.3 Các biến độc lập trong mô hình dự báo xác suất vỡ nợ 29
Bảng 3.4 Cấu trúc dữ liệu các biến trong mô hình Logit 30
Bảng 3.5 Ma trận Confussion 34
Bảng 4.1 Thống kê mô tả các biến độc lập 38
Bảng 4.2 Ma trận tương quan 39
Bảng 4.3 Kết quả hồi quy của các mô hình tham số 40
Bảng 4.4 Ma trận Confussion của mô hình logit 43
Bảng 4.5 Ma trận Confusion của mô hình probit 43
Bảng 4.6 Ma trận Confusion của mô hình Complementary log-log 44
Bảng 4.7 Ma trận Confusion của mô hình cây quyết định(Decision Tree) 46
viii
Bảng 4.8 Ma trận Confusion của mô hình Random forest 47
DANH MỤC HÌNH
Số thứ tự Nội dung Trang
Hình 3.1 Mô phỏng mô hình cây quyết định 32
Hình 3.2 Mô phỏng mô hình random forest 33
Hình 4.1 Kết quả hồi quy của mô hình cây quyết định (Decision Tree) 45
ix
46 Hình 4.2 Kết quả của mô hình Random Forest
DANH MỤC TỪ VIẾT TẮT
BCTC Báo cáo tài chính
BLĐ Ban lãnh đạo
HCM Hồ Chí Minh
KHDN Khách hàng doanh nghiệp
NHNN Ngân hàng nhà nước
NHTM Ngân hàng thương mại
TCTD Tổ chức tín dụng
TP Thành phố
XHTN Xếp hạng tín nhiêm
VCSH Vốn chủ sở hữu
VN Việt Nam
x
VVN Vừa và nhỏ
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN
1.1 Tính cấp thiết của đề tài
Hệ thống xếp hạng tín dụng nội bộ luôn đóng vai trò quan trọng tại các NHTM trong việc
đánh giá mức độ rủi ro tín dụng của khách hàng đồng thời hỗ trợ ngân hàng trong việc ra
quyết định tín dụng cũng như trong các hoạt động quản trị rủi ro tại ngân hàng. Tại Việt
Nam, các NHTM đang ngày càng nhận thấy tầm quan trọng của hệ thống này trong hoạt
động tín dụng và quản trị rủi ro của ngân hàng, đặc biệt trong giai đoạn các NHTM Việt
Nam đang cố gắng để đáp ứng các tiêu chuẩn của Basel II.
Trong bối cảnh đó, tính cấp thiết của đề tài nghiên cứu này được thể hiện ở các khía cạnh
cụ thể như sau:
Thứ nhất, các mô hình XHTN hiện nay đều có những hạn chế nhất định và đang có
nhiều tranh luận, không thống nhất về mức độ tin cậy của các mô hình XHTN dẫn đến sự
khó khăn trong việc lựa chọn mô hình XHTN phù hợp để dự báo xác suất vỡ nợ của
doanh nghiệp (Huseyin &Bora, 2009). Theo nghiên cứu của Aysegul Iscanoglu, 2005
cũng như Hayden& Daniel, 2010 đã nêu ra nhiều mô hình nghiên cứu trong lĩnh vực
XHTN như mô hình phân tích phân biệt (discriminant analysis), mô hình Logit (logistic
regression), mô hình hình cây (decision tree), mô hình mạng thần kinh nhân tạo (artificial
neural networks – ANN), mô hình Probit regression... với các ưu và nhược điểm của
từng mô hình. Thực tế, đã có nhiều phân tích chuyên sâu về các mô hình nêu trên. Platt
(1991) đã sử dụng mô hình Logit trong kiểm định, lựa chọn các biến tài chính và cho
rằng việc sử dụng các biến tài chính trung bình của ngành tốt hơn sử dụng những biến tài
chính của một doanh nghiệp đơn lẻ trong dự báo phá sản của doanh nghiệp. Lawrence
(1992) sử dụng mô hình Logit dự báo xác suất vỡ nợ của những khoản vay có thế chấp.
Altman (1968) đã sử dụng mô hình phân tích phân biệt tìm một hàm tuyến tính của các
biến tài chính và thị trường để có thể phân biệt một cách tốt nhất giữa 2 loại doanh
nghiệp vỡ nợ và không vỡ nợ…
Thứ hai, việc xác định các chỉ số tài chính nào thực sự tác động đến kết quả xếp hạng
1
luôn là mục tiêu, vấn đề cần nghiên cứu trong các công trình nghiên cứu về dự báo xác
suất vỡ nợ. Trong giai đoạn 1926 – 1936, các nhà nghiên cứu chỉ sử dụng chỉ số tài
chính cơ bản để xếp hạng kèm một số chỉ số khác như Ramser &Foster (1931) với chỉ
số vốn chủ sở hữu/tổng doanh thu thuần hay Fitzpatrick (1932) sử dụng chỉ số vốn chủ
sở hữu/tài sản cố định. Giai đoạn tiếp theo, Altman (1968) sử dụng 5 chỉ số tài chính
trong mô hình phân tích phân biệt để dự báo khả năng vỡ nợ của các doanh nghiệp gồm
vốn chủ sở hữu/giá trị sổ sách của các khoản nợ, doanh thu thuần/tổng tài sản, thu nhập
hoạt động kinh doanh/tổng tài sản, lợi nhuận sau thuế/tổng tài sản và vốn lưu động/tổng
tài sản. Cũng sử dụng mô hình phân tích phân biệt nhưng Deakin (1972) lại chọn 14
biến tài chính sau: tiền mặt/nợ ngắn hạn, dòng tiền thực/tổng nợ, tiền mặt/doanh thu
thuần, tiền mặt/tài sản cố định, hệ số khả năng thanh toán hiện hành, tài sản ngắn
hạn/doanh thu thuần, tài sản ngắn hạn/tổng tài sản, thu nhập/tổng tài sản, tài sản có tính
thanh khoản cao/nợ ngắn hạn, tài sản có tính thanh khoản cao/doanh thu thuần, tài sản
có tính thanh khoản cao/tổng tài sản, tổng nợ phải trả/tổng tài sản, vốn lưu động/doanh
thu thuần, vốn lưu động/tổng tài sản. Theo thời gian, các nhà khoa học đã tìm thêm
nhiều chỉ số tài chính có khả năng tác động đến kết quả XHTN như Blum (1974) sử
dụng các biến tài chính gồm tỷ suất lợi nhuận của thị trường, hệ số khả năng thanh toán
nhanh, tài sản có tính thanh khoản cao/hàng tồn kho,dòng tiền/tổng nợ phải trả, giá trị sổ
sách của tài sản/tổng nợ phải trả, xu hướng giảm của lợi nhuận, xu hướng giảm của tài
sản có tính thanh khoản cao/hàng tồn kho hay Back, Laitinen, Sere & Wesel (1996) sử
dụng 31 chỉ số khác nhau.
Thứ ba, hiện tại phương pháp xếp hạng tại các ngân hàng ở Việt Nam còn mang tính
chủ quan, định tính, dựa trên đánh giá – kinh nghiệm của các cán bộ tín dụng trực tiếp
quản lý khách hàng (phương pháp chuyên gia), do đó chỉ hỗ trợ cho việc ra quyết định
cấp tín dụng, không phải là cơ sở để ra quyết định, vì chưa có cơ sở khoa học có độ tin
cậy cao để dự báo khả năng phá sản của các doanh nghiệp. Cho đến nay, hiện vẫn chưa
có nhiều nghiên cứu được công bố tại Việt Nam về việc lựa chọn mô hình dự báo xác
suất vỡ nợ của các doanh nghiệp dựa trên các chỉ số tài chính.
Thứ tư, Chính Phủ đã và đang xây dựng hành lang pháp lý đối với lĩnh vực XHTN nhằm
2
nâng cao tính công khai minh bạch thông tin hỗ trợ cho các ngân hàng kiểm soát được rủi
ro tín dụng ngay từ đầu cũng như hỗ trợ thị trường chứng khoán, thị trường trái phiếu thúc
đẩy huy động vốn thông qua thị trường chứng khoán, bảo vệ quyền và lợi ích của nhà đầu
tư. Việc nghiên cứu và lựa chọn các mô hình xếp hạng phù hợp sẽ đóng góp rất nhiều đến
sự phát triển của hoạt động xếp hạng tín nhiệm ở Việt Nam. Cụ thể,Chính Phủ đã ban
hành Nghị định số 88/2014/NĐ-CP ngày 26/09/2014 quy định về dịch vụ XHTN, điều
kiện hoạt động của doanh nghiệp XHTN được thành lập và hoạt động tại Việt Nam; đồng
thời theo Quyết định phê duyệt quy hoạch phát triển dịch vụ xếp hạng tín nhiệm đến 2020
và tầm nhìn đến 2030 của Thủ tướng Chính phủ số 507/QĐ-TTg ngày 17/04/2015, việc
phát hành trái phiếu doanh nghiệp sẽ phải được xếp hạng tín nhiệm kể từ năm 2020.
Rõ ràng, việc lựa chọn được mô hình dự đoán xác suất vỡ nợ doanh nghiệp dựa trên các
chỉ số tài chính phù hợp được đề cập là một trong những biện pháp quản lý kiểm soát rủi
ro tín dụng của các NHTM Việt Nam nhằm phân loại sàng lọc khách hàng ngay từ đầu và
kiểm soát rủi ro vỡ nợ của ngân hàng theo khuyến cáo của Ủy ban Basel (Basel II, 2004).
Chính vì vậy, bài luận văn tập trung nghiên cứu vấn đề “Lựa chọn mô hình dự báo xác
suất vỡ nợ của doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại Việt Nam
dựa trên các chỉ số tài chính” nhằm cung cấp cho các NHTM một cách có hệ thống cơ
sở lý luận và minh chứng thực nghiệm liên quan đến việc lựa chọn mô hình dự báo khả
năng phá sản doanh nghiệp phù hợp để góp phần nâng cao hiệu quả trong công tác kiểm
soát rủi ro tín dụng của ngân hàng trong thời gian tới.
1.2 Vấn đề nghiên cứu
Lựa chọn mô hình phù hợp dự báo xác suất vỡ nợ của các doanh nghiệp vừa và nhỏ tại
các NHTM Việt Nam dựa trên các chỉ số tài chính trong giai đoạn từ năm 2016 – 2018.
1.3 Mục tiêu nghiên cứu
Trên cơ sở xác định các tiêu chí của một mô hình dự báo phù hợp và cách lựa chọn mô
hình, từ đó bài nghiên cứu sẽ tiến hành lựa chọn mô hình có khả năng dự báo xác suất vỡ
nợ của doanh nghiệp vừa và nhỏ tại các NHTM Việt Nam dựa trên các chỉ số tài chính
trong giai đoạn từ năm 2016 – 2018. Thông qua đó giúp các ngân hàng thương mại sàng
3
lọc khách hàng và kiểm soát rủi ro tín dụng tốt hơn.
1.4 Câu hỏi nghiên cứu
Nhằm đạt được mục tiêu nêu trên, bài nghiên cứu đã đặt ra các câu hỏi nghiên cứu sau:
(i) Các chỉ số tài chính nào ảnh hưởng lớn đến việc lựa chọn mô hình dự báo xác
suất vỡ nợ của các doanh nghiệp vừa và nhỏ?
(ii) Mô hình nào mang lại kết quả tốt nhất trong việc dự báo xác suất vỡ nợ của các
doanh nghiệp vừa và nhỏ?
1.5 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của luận văn là xác suất vỡ nợ của khách hàng doanh nghiệp vừa
và nhỏ tại các NHTM Việt Nam.Doanh nghiệp vừa và nhỏ là doanh nghiệp đáp ứng một
trong hai tiêu chí sau: (i) tổng nguồn vốn không quá 100 tỷ đồng; (ii) tổng doanh thu của
năm trước liền kề không quá 500 tỷ đồng.
Phạm vi nghiên cứu: bài nghiên cứu thu thập các chỉ số tài chính từ các báo cáo tài
chính của các doanh nghiệp vừa và nhỏ tại các NHTM Việt Nam trong giai đoạn từ
2016 – 2018.
1.6 Phương pháp nghiên cứu
Luận văn sử dụng phương pháp kết hợp phương pháp nghiên cứu định tính và nghiên cứu
định lượng. Trong đó:
Phương pháp nghiên cứu định tính: Thảo luận về quan điểm, nhận thức đánh giá của các
NHTM về vấn đề XHTN khách hàng doanh nghiệp vừa và nhỏ tại các NHTM ở Việt
Nam. Tìm hiểu và nghiên cứu các yếu tố ảnh hưởng đến kết quả XHTN khách hàng
doanh nghiệp vừa và nhỏ ở các NHTM tại Việt Nam. Từ đó xây dựng các thang đo lường
để thực hiện nghiên cứu định lượng.
Phương pháp nghiên cứu định lượng: xác định lại các yếu tố tài chính ảnh hưởng và đo
lường mức độ tác động của từng yếu tố đến kết quả XHTN khách hàng doanh nghiệp vừa
và nhỏ tại các NHTM ở Việt Nam. Sử dụng phương pháp hồi quy để xây dựng mô hình
4
XHTN bao gồm các phương pháp logit, probit. Bên cạnh đó, luận văn cũng sử dụng mô
hình xếp hạng theo phương pháp cây quyết định (Decision tree) và phương pháp Random
Forest để đánh giá hạng tín nhiệm của các doanh nghiệp vừa và nhỏ.
Ngoài ra, luận văn sử dụng kết hợp các phương pháp bao gồm: Phương pháp thống kê mô
tả nhằm tổ chức dữ liệu theo các đặc tính cần mô tả; Phương pháp so sánh đối chiếu giữa
mô hình và thực tiễn để để đưa ra kết luận; Phương pháp phân tích tổng hợp để tổng hợp
và phân tích dữ liệu liên quan trong quá trình nghiên cứu.
1.7 Đóng góp của đề tài
Kết quả nghiên cứu của luận văn có ý nghĩa khoa học và thực tiễn được thể hiện trên các
khía cạnh chủ yếu sau:
Phân tích một cách có hệ thống và đầy đủ những lý luận cơ bản, hệ thống các lý thuyết
nền liên quan đến các mô hình dự báo xác suất vỡ nợ và tiêu chí lựa chọn mô hình phù
hợp. Trên cơ sở đó, bài nghiên cứu cung cấp một cách khá đầy đủ và toàn diện những
công trình nghiên cứu đã được công bố để thấy rõ những khoảng trống trong các nghiên
cứu trước đây liên quan đến việc lựa chọn mô hình phù hợp nhất để dự báo khả năng phá
sản của các doanh nghiệp vừa và nhỏ tại các NHTM Việt Nam dựa trên các chỉ số tài
chính. Đây chính là cơ sở quan trọng giúp các nhà nghiên cứu có thể tiếp tục triển khai
các nghiên cứu có liên quan khác.
Trên cơ sở các vấn đề và kết quả nghiên cứu được tìm thấy, bài nghiên cứu đề xuất lựa
chọn mô hình XHTN phù hợp, có khả năng dự báo xác suất vỡ nợ cho các doanh nghiệp
vừa và nhỏ tại các NHTM Việt Nam dựa trên các chỉ số tài chính góp phần nâng cao
hiệu quả trong công tác kiểm soát rủi ro tín dụng của các NHTM ở Việt Nam trong thời
gian tới.
1.8 Cấu trúc của luận văn
Cấu trúc luận văn gồm 5 chương từ giới thiệu tổng quan, đưa ra cở sở lý thuyết và các
nghiên cứu trước đây, mô hình xếp hạng tín nhiệm, sau đó tiến hành phân tích kết quả và
5
cuối cùng là một số trao đổi kèm kiến nghị, chi tiết cụ thể như sau:
Chương 1 (Giới thiệu tổng quan) trình bày về tính cấp thiết của đề tài, vấn đề nghiện
cứu, mục tiêu nghiên cứu, câu hỏi nghiên cứu, đối tượng và phạm vi nghiên cứu, phương
pháp nghiên cứu, đóng góp của đề tài và cấu trúc của luận văn nhằm cung cấp cho người
đọc một bức tranh tổng thể về toàn bộ bài nghiên cứu.
Chương 2 (Cơ sở lý thuyết và các nghiên cứu trước đây) trình bày những lý luận cơ
bản và các lý thuyết nền liên quan đến xếp hạng tín dụng, xác suất vỡ nợ của các doanh
nghiệp và phương pháp đo lường, dự báo các nội dung này cũng như kết quả đánh giá các
nghiên cứu trước đây đã được công bố để làm rõ tính cấp thiết của đề tài, đồng thời cung
cấp cơ sở cho việc tiến hành đề xuất mô hình nghiên cứu và phân tích kết quả nghiên cứu
được trình bày ở các chương tiếp theo.
Chương 3 (Mô hình và phương pháp nghiên cứu) trình bày chi tiết nội dung của mô
hình nghiên cứu – mô hình dự báo xác suất vỡ nợ được đề xuất, mô tả chi tiết các dữ liệu
đã thu thập và các phương pháp nghiên cứu được sử dụng để cho thấy mức độ tin cậy của
kết quả nghiên cứu được trình bày ở chương tiếp theo. Mô hình dự báo xác suất vỡ nợ
được đề xuất sử dụng bao gồm mô hình tham số (với các mô hình logit, probit,
complementary log-log) và mô hình phi tham số (gồm mô hình cây quyết định decision
tree, mô hình random forest).
Chương 4 (Kết quả nghiên cứu) phân tích kết quả hồi quy từ các mô hình tham số và
phi tham số, đồng thời dựa trên các chỉ tiêu được tính toán từ ma trận confusion
(Accuracy, Sensitivity, Specificity, Precision, F1 - Score) để so sánh và đánh giá khả năng
dự báo xác suất vỡ nợ của từng mô hình.
Chương 5 (Kết luận và kiến nghị) tổng kết các kết quả đạt được của bài luận văn, từ
đó đề xuất các giải pháp giúp các ngân hàng thương mại nâng cao khả năng dự báo xác
suất vỡ nợ của các doanh nghiệp vừa và nhỏ, theo đó kịp thời có các chính sách định
hướng cũng như điều chỉnh hoạt động cấp tín dụng của các NHTM để đạt hiệu quả cao
hơn và giảm thiểu rủi ro tín dụng, đảm bảo an toàn vốn. Ngoài ra, bài luận văn cũng gợi
6
ý một số hàm ý chính sách quản trị cho chính các doanh nghiệp để giảm thiểu rủi ro phá
sản. Thêm vào đó, bài luận văn cũng đưa ra những hạn chế và các vấn đề còn tồn tại, từ
7
đó đề xuất các hướng nghiên cứu tiếp theo.
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU
TRƯỚC ĐÂY
2.1 Xếp hạng tín nhiệm
Thuật ngữ “xếp hạng tín nhiệm” (XHTN) lần đầu tiên được đưa ra bởi John Moody
năm 1900 trong ấn phẩm “Moody’s Manual of Industrial and Miscellaneous Securities”
khi cho rằng XHTN là ý kiến về khả năng và sự sẵn sàng của một đơn vị trong việc
thanh toán đúng hạn cho một khoản nợ nhất định trong suốt thời hạn tồn tại của khoản
nợ. Hệ thống xếp hạng trình bày trong báo cáo này được ký hiệu gồm 3 chữ cái ABC
được xếp hạng lần lượt là AAA (mức ổn định cao nhất) đến C (mức rủi ro cao nhất).
Kể từ đó đến nay, việc sử dụng XHTN trở nên rất phổ biến và đa dạng về mục đích
cũng như đối tượng xếp hạng, theo đó cách nhìn nhận cũng như quan điểm về XHTN
đã có nhiều thay đổi.
Theo Michael K.Ong (2003), XHTN là một tiến trình đánh giá và phân loại mức độ tín
nhiệm tương ứng với các cấp độ rủi ro khác nhau, mỗi kết quả xếp hạng là một sự phản
ánh rõ ràng và ngắn gọn về khả năng thanh toán nợ của công ty được xếp hạng, đồng thời
XHTN còn là quá trình sử dụng các thông tin đã biết và thông tin hiện thời để dự báo kết
quả tương lai.
Với quan điểm của Standard & Poor’s thì XHTN là đánh giá khả năng tín dụng của bên
phải thực hiện nghĩa vụ tài chính trong tương lai dựa trên những yếu tố hiện tại và quan
điểm của người đánh giá. Nói cách khác, XHTN là trình bày các ý kiến về rủi ro tín dụng.
Cụ thể là thể hiện ý kiến về khả năng và và sự sẵn sàng của tổ chức phát hành (Rating
issuers) - chẳng hạn như một tổng công ty hoặc chính phủ tiểu bang hoặc thành phố - để
đáp ứng các nghĩa vụ tài chính đầy đủ và đúng hạn. XHTN cũng có thể đề cập tới chất
lượng tín dụng của một khoản nợ riêng lẻ (Rating issues) - chẳng hạn như trái phiếu công
ty hoặc trái phiếu chính phủ - hoặc đánh giá nguy cơ liên quan có thể dẫn đến bị tổn thất.
Fitch Ratings khẳng định theo quan điểm của họ, XHTN là đánh giá mức độ khả năng
thực hiện các nghĩa vụ nợ như lãi suất, cổ tức ưu đãi, các khoản bảo hiểm hay các khoản
8
phải trả khác của một đối tượng được xếp hạng. Phương pháp XHTN của Fitch là sự kết
hợp của cả yếu tố tài chính và phi tài chính. Vì vậy, chỉ số đánh giá còn cho thấy khả năng
sinh lợi tương lai của tổ chức được đánh giá.
Một cách khái quát có thể hiểu XHTN là một tiến trình đánh giá và phân loại mức độ tín
nhiệm tương ứng với các cấp độ rủi ro khác nhau, phản ánh về chất lượng, khả năng
thanh toán nợ của đối tượng được xếp hạng và dự báo kết quả trong tương lai, được thể
hiện thông qua hệ thống các ký hiệu xếp hạng. Theo đó, XHTN cung cấp thông tin cho
các nhà đầu tư biết về tình trạng tài chính và mức độ rủi ro của các định chế tài chính để
có quyết định đầu tư phù hợp. Các yếu tố để đánh giá thường bao gồm yếu tố tài chính
và phi tài chính. Yếu tố tài chính bao gồm các tỷ số tài chính quan trọng thông qua các
báo cáo tài chính. Yếu tố phi tài chính là các yếu tố khó có thể định lượng như: chính
trị, ngành nghề kinh doanh, môi trường kinh tế vĩ mô…
2.2 Xác suất vỡ nợ (PD)
Xác suất vỡ nợ là một thành phần quan trọng được áp dụng trong nhiều phân tích rủi
ro tín dụng và hoạt động quản lý rủi ro. Theo Basel II, nó là một tham số chính được
sử dụng trong tính toán mức vốn kinh tế có khả năng hấp thụ các rủi ro tại các tổ chức
tín dụng.
Theo định nghĩa được đưa ra bởi Office of the Comptroller of the Currency: “Xác suất vỡ
nợ là rủi ro mà người đi vay sẽ không thể hoặc không sẵn sàng trả nợ đầy đủ hoặc đúng
hạn. Rủi ro vỡ nợ bắt nguồn từ việc phân tích năng lực của bên có nghĩa vụ để trả nợ theo
các điều khoản hợp đồng”. PD thường liên quan đến các đặc điểm tài chính như dòng tiền
không đủ bù đắp chi phí, doanh thu hoặc tỷ suất lợi nhuận hoạt động sụt giảm, đòn bẩy
cao, thanh khoản giảm hoặc không đảm bảo năng lực để thực hiện các kế hoạch kinh
doanh thành công. Ngoài những yếu tố có thể định lượng này, sự sẵn sàng trả nợ của
người đi vay cũng cần phải được đánh giá để xác định xác suất vỡ nợ.
Hoặc như Tysk (2010) đã giải thích, xác suất vỡ nợ là sự đánh giá định lượng về khả
năng một bên có nghĩa vụ sẽ phá sản trong một khoảng thời gian nhất định, thường là
một năm. Thông thường, xác suất vỡ nợ phác thảo công ty không hoàn thành trách
9
nhiệm với khoản vay của họ hay nói cách khác là trách nhiệm thanh toán đối với các
ngân hàng. Vì các nguyên nhân chính khiến các công ty mất khả năng trả nợ là thua lỗ
kinh doanh hoặc thiếu tiền, nên nó cũng có thể được coi là khả năng phá sản của các
công ty. Để ước tính xác suất vỡ nợ, ngân hàng có thể cho điểm các công ty dựa trên khả
năng trả nợ của họ, từ đó đưa ra quyết định tốt hơn trong việc cho vay.
PD là một trong những tỷ lệ hiệu quả nhất để phân loại người vay. Tất cả các ngân hàng,
cho dù sử dụng phương pháp tiêu chuẩn hay các phương pháp tiên tiến khác đều phải
cung cấp cho giám sát viên với một ước tính nội bộ của PD liên quan đế người đi vay
trong phạm vi số điểm được chấm. Kết quả xếp hạng dựa trên số liệu PD được xem là
tương đối chính xác vì nó được tính toán trên các tỷ lệ tài chính thực tế của doanh
nghiệp và có thể phản ánh tình trạng của doanh nghiệp một cách thiết thực. PD có thể
giúp giảm rủi ro tín dụng một cách hiệu quả nếu được xem xét đầy đủ.
2.3 Khảo lược các mô hình dự báo xác suất vỡ nợ của doanh nghiệp
Trên thế giới đã có khá nhiều các nghiên cứu liên quan đến mô hình dự báo xác suất vỡ
nợ của doanh nghiệp. Mỗi một mô hình sẽ có biến đầu vào, ưu và nhược điểm khác nhau,
10
được thể hiện cụ thể trong bảng sau:
Bảng 2.1: Khảo lược các mô hình dự báo xác suất vỡ nợ
TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm
- Phổ biến và - Kết quả hồi quy - Mô hình hồi quy tuyến tính là 1 Mô hình hồi
dễ áp dụng. có thể nằm bên một mô hình thống kê nhằm quy
- Dễ tính toán ngoài khoảng mục đích điều tra nghiên cứu (Regression
và kết quả có [0,1]. và mô hình hóa mối quan hệ Analysis
thể được giải - Khả năng ngoại tuyến tính giữa các biến. Năm Models)
thích. suy có thể thấp. 1970, Orgler đã sử dụng mô
- Có thể đưa ra - Rất nhạy cảm hình này để xác định mối
được một kết với những quan hệ tuyến tính giữa các
quả tốt với trường hợp đặc đặc điểm của khách hàng với
hệ thống dữ biệt. tình trạng vỡ nợ của khách
liệu ít. hàng đó.
- Phổ biến và - Các biến được - Fisher (1936) đã đưa ra mô 2 Mô hình phân
dễ thực hiện. giả định theo hình phân tích phân biệt để tích phân biệt
- Điểm số có phân phối phân tách người đi vay (tốt (Discriminant
thể được tính chuẩn, tuy nhiên hay xấu) dựa trên đặc điểm Analysis)
trực tiếp từ điều này không của họ thông qua ước lượng
mô hình hợp lý và rất hàm phân biệt tuyến tính,
tuyến tính khó để kiểm tra trong đó các biến số là biến
ước tính. sự ổn định của định lượng (các số liệu được
- Giảm tỷ lệ mô hình cũng lấy từ BCTC hàng năm của
lỗi của như tính hợp lý doanh nghiệp).
mô hình. của các hệ số - Chức năng phân biệt phải thỏa
hồi quy. mãn các nguyên tắc sau: Tối
- Tương tự như đa hoá sự khác biệt giữa các
hồi qui tuyến nhóm khách hàng phá sản –
11
tính, giá trị tuyệt không phá sản và khoảng cách
TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm
đối của mô hình giữa các khách hàng trong
không thể diễn cùng một nhóm là thấp nhất.
giải được. - Mặc dù mô hình này có vẻ
tương tự như mô hình hồi quy
tuyến tính, nhưng vẫn có sự
khác biệt. Cụ thể: Trong mô
hình hồi quy tuyến tính, đặc
điểm của người đi vay được
xác định và trạng thái của
người đi vay là ngẫu nhiên.
Trong khi đó, trong mô hình
phân tích phân biệt thì trạng
thái của người đi vay được xác
định và đặc điểm của họ thì
ngẫu nhiên.
- Dễ dàng đưa - Có thể vi phạm - Được sử dụng trong nghiên 3 Mô hình hồi
ra kết quả và giả định chuẩn cứu của Olso (1980), Gilbert quy Logit and
kết quả thì của các biến (1990), Hayden (2010). Probit (Logit
dễ giải thích. trong mô hình. - Mô hình logit và Probit and Probit
- Kết quả đưa - Mô hình không nghiên cứu sự phụ thuộc của models)
ra là xác thể ứng dụng một biến nhị phân (biến phụ
suất vì vậy đối với các thuộc Y) vào các biến độc
hỗ trợ cho trường hợp DN lập khác (Xi), qua đó có thể
việc đưa ra khiếm khuyết ước lượng xác suất vỡ nợ
quyết định. dữ liệu hoặc DN của một doanh nghiệp có
- Có thể kiểm có cấu trúc tài nguy cơ phá sản là bao nhiêu
12
định được chính đặc biệt. trực tiếp từ mẫu.
TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm
mức độ tin - Vấn đề đánh giá
cậy của kết quá cao hoặc
quả xếp hạng quá thấp có thể
và các biến. xuất hiện trong
mô hình.
- Không có các - Dễ xảy ra lỗi khi - Mô hình cây quyết định là một 4 Mô hình cây
giả định về có quá nhiều lớp. mô hình phi tham số được quyết định
phân phối - Chi phí tính toán Brieman giới thiệu lần đầu vào (Decision Tree)
chuẩn của các để xây dựng mô năm 1980, được sử dụng nhiều
biến trong hình cao. cho vấn đề phân loại và dự báo
mô hình. - Sự ổn định vỡ nợ của các doanh nghiệp.
- Xác suất phá của mô hình - Cây quyết định là quá trình
sản có thể tính không thể được phân tích dữ liệu, phân lớp. Cụ
toán được. đánh giá bằng thể cây quyết định chia một
- Trực quan, dễ các bài kiểm tra tập dữ liệu thành các tập dữ
nhìn, dễ dàng thống kê. liệu con sao cho các tập dữ
giải thích các liệu này đồng nhất hơn với
kết quả. biến phân lớp.
- Mối quan hệ - Cây quyết định có cấu trúc
phi tuyến biểu diễn dưới dạng hình cây
giữa các biến gồm nút quyết định và nút lá,
độc lập và đỉnh trên cùng của cây gọi là
biến phụ gốc. Mỗi nút quyết định tương
thuộc được ứng với một thử nghiệm trên
mô hình hóa một thuộc tính duy nhất của
dễ dàng. dữ liệu đầu vào và mỗi nút
13
quyết định xử lý một kết quả
TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm
của thử nghiệm. Mỗi nút lá là
kết quả của quyết định cho
một trường hợp.
- Quá trình phân nhánh hay quá
trình ra quyết định ở từng
bước đều được dựa trên
những điều kiện, hệ số đo
lường, tính toán nhất định.
- Cho kết quả - Không thể giải - Random forests được đưa ra 5 Mô hình
dự báo tốt thích được cơ chế bởi Ho vào năm 1995, là mô Random forests
hơn so với hoạt động của hìnhdự báo xác suất vỡ nợ, (RF)
mô hình cây mô hình, phân loại bằng cách xây dựng
quyết định. Random Forest là nhiều cây quyết định và trả kết
- Mô hình vẫn một trong những quả như là giá trị Mode của
có thể làm mô hình hộp đen nhóm hoặc là giá trị Mean của
việc được với (Black box). cây quyết định.
dữ liệu thiếu - Phải mất nhiều - Random Forest là một tập hợp
giá trị. thời gian hơn để của hàng trăm cây quyết định,
- Khi rừng có phân tích dữ liệu trong đó mỗi cây quyết
nhiều cây so với các tập dữ địnhđược tạo nên ngẫu nhiên
hơn, có thể liệu trước đó. từ việc tái chọn mẫu (chọn
tránh được random 1 phần của tập dữ liệu
hiện tượng để xây dựng) và random các
overfitting biến từ toàn bộ các biến trong
tập dữ liệu tập dữ liệu. Với một cơ chế
(hiện tượng như vậy, mô hình Random
14
mô hình tìm Forest thường hoạt động rất
TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm
chính xác, nhưng chúng ta được quá
không thể nào hiểu được cơ khớp với tập
chế hoạt động bên trong mô dữ liệu).
hình vì cấu trúc quá phức tạp.
- Dễ dàng cho - Mô hình này là - Lý thuyết về mạng nơtron xuất 6 Mô hình mạng
các mô hình một hộp đen, kết hiện từ năm 1943 và cho đến thần kinh nhân
phức tạp. quả không được năm 1990 bắt đầu từ nghiên tạo (Artificial
- Không có diễn giải. cứu của Shade, nó trở thành Neural network
những giả - Yêu cầu dữ liệu một công cụ quan trọng được - ANN)
định hạn chế. chất lượng cao. sử dụng trong nghiên cứu dự
- Cho phép sử - Mẫu được đưa báo vỡ nợ.
dụng dữ liệu vào mô hình phải - Mục tiêu của mô hình là tìm
định tính. đủ lớn. mối quan hệ giữa biến độc lập
- Có thể kiểm - Các biến phải và biến phụ thuộc. Tuy nhiên,
soát dữ liệu lựa chọn theo thứ mô hình này không ước tính
thô, không có tự ưu tiên. các thông số, nó sử dụng ý
ý nghĩa. - Yêu cầu những tưởng hoạt động của nơ-ron,
- Có thể khắc định nghĩa chi là quá trình xử lý thông tin
phục được tiết từ người thiết của não, vì vậy được xem là
vấn đề tự kế mô hình. mô hình phi tham số.
tương quan. - Mất nhiều thời - Mô hình bao gồm nhiều nút,
- Kết quả đưa gian xử lý. mỗi nút gửi kết quả đến các
ra rõ ràng. - Rủi ro trong việc nút mạng khác nếu nó nhận
lỗi mô hình. được dữ liệu vào từ một nút
- Mô hình rất mạng cụ thể được kết nối. Một
phức tạp, khó áp bộ dữ liệu được sử dụng để
15
dụng và phổ biến đào tạo các mô hình nhận ra
TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm
những người không trả được tại Việt Nam.
nợ. Điều chỉnh được thực hiện
trên các kết nối giữa đầu vào,
đầu ra và các nút trung gian để
tạo ra mô hình cuối cùng.
2.4 Tổng quan các nghiên cứu trước
Cho đến nay đã có rất nhiều nghiên cứu liên quan đến dự báo xác suất vỡ nợ của
doanh nghiệp và rủi ro phá sản của doanh nghiệp, tuy nhiên kết quả nghiên cứu được
tìm thấy vẫn còn chưa thống nhất do nhiều nguyên nhân khác nhau, bao gồm sự khác
nhau về đối tượng và phạm vi nghiên cứu cũng như mô hình và phương pháp nghiên
cứu đã được sử dụng.
2.4.1 Các nghiên cứu trên thế giới
Trên thế giới đã có khá nhiều các nghiên cứu liên quan đến dự báo xác suất vỡ nợ của
doanh nghiệp và rủi ro phá sản của doanh nghiệp. Cụ thể như nghiên cứu của Edward I.
A. (1968) về chỉ số tài chính, phân tích mô hình đa thức nhằm dự báo khả năng phá sản
của doanh nghiệp. Nghiên cứu có mẫu khảo sát gồm 66 doanh nghiệp được chia thành 2
nhóm gồm 33 doanh nghiệp phá sản theo Chương X của Luật phá sản Hoa Kỳ giai đoạn
1946 – 1965 và 33 doanh nghiệp không phá sản trong cùng thời kỳ, các đơn vị này vẫn
tiếp tục hoạt động trong năm 1966. Tác giả đã sử dụng 22 biến độc lập chỉ số tài chính để
phân tích chia thành 5 nhóm gồm: chỉ số về khả năng thanh khoản, chỉ số về khả năng
sinh lời, chỉ số đòn bẩy tài chính, chỉ số và khả năng thanh toán nợ và chỉ số hoạt động.
Kết quả nghiên cứu từ mô hình phân tích đa thức này của Edward I. A. đạt mức chính xác
khá cao, cụ thể dự báo đúng 94% mẫu khảo sát ban đầu. Tuy nhiên, giới hạn của bài
nghiên cứu này là chỉ khảo sát các doanh nghiệp sản xuất lớn (dựa vào quy mô tài sản).
Tiếp theo phải kể đến nghiên cứu về dự báo thất bại doanh nghiệp của Evridiki
16
Neophytou, Andreas Charitou & Chris Charalambous (2000) với kỹ thuật phân tích logit
đã phát triển mô hình phân loại các doanh nghiệp công nghiệp thất bại cho nước Anh. Bộ
dữ liệu bao gồm 51 cặp doanh nghiệp thất bại và không thất bại ở Anh giai đoạn 1988 –
1997. Mô hình dự báo được phát triển cho đến ba năm trước khi sự kiện thất bại của
doanh nghiệp diễn ra trên cơ sở ba biến tài chính là khả năng sinh lời, dòng tiền hoạt động
kinh doanh và biến đòn bẩy tài chính. Kết quả của mô hình có thể giải thích chính xác
83% khả năng thất bại của doanh nghiệp trước một năm. Tuy nhiên, mô hình có giả định
về phân phối xác suất, giả thiết không có hiện tượng đa cộng tuyến do đó làm giảm mức
độ áp dụng của mô hình.
Ravi & Pramodh (2008) đã sử dụng mô hình mạng thần kinh nhân tạo nơtron để dự báo
vỡ nợ cho các ngân hàng Thổ Nhĩ Kỳ và Tây Ban Nha, trong đó có sử dụng 9 nhân tố
tài chính cho các ngân hàng Thổ Nhĩ Kỳ và 12 nhân tố tài chính cho các ngân hàng Tây
Ban Nha. Mức độ chính xác của mô hình xây dựng là 96,6% cho tập số liệu của các
ngân hàng Tây Ban Nha và 100% cho tập số liệu của các ngân hàng Thổ Nhĩ Kỳ. Tuy
nhiên, do mô hình này khá phức tạp, cấu trúc của nó khó theo dõi, nằm ngoài sự kiểm
soát của người xây dựng mô hình nên tính ứng dụng không cao.
Bên cạnh đó, trong nghiên cứu về chỉ số tài chính và phân tích biệt số đa nhân tố dự báo
sự thất bại của các doanh nghiệp Malaysia của nhóm nghiên cứu Ben Chin-FookYap,
David Gun-Fie Yong & Wai-Ching Poon(2010) đã phát triển mô hình phân tích biệt số
đa nhân tố (MDA – Multiple Discriminant Analysis) để cải thiện khả năng dự báo sự
thất bại cho các doanh nghiệp Malaysia sau khoảng thời gian cơ cấu lại với điều kiện tài
chính, hoạt động, kinh doanh khác nhau. Nhóm tác giả sử dụng 16 biến chỉ số tài chính
để phân tích trên mẫu khảo sát gồm 64 doanh nghiệp. Kết quả nghiên cứu tìm thấy 7
biến chỉ số tài chính có ý nghĩa thống kê trong việc dự báo với tỷ lệ chính xác khá cao
từ 88% đến 94% cho mỗi doanh nghiệp trước khi doanh nghiệp thất bại, bao gồm tổng
tài sản trên tổng nợ phải trả, dòng tiền trên tổng nợ dài hạn, tổng nợ dài hạn trên tổng tài
sản, vốn lưu động trên tổng tài sản, thu nhập giữ lại trên tổng tài sản, thu nhập trước
thuế và lãi vay trên doanh thu và thu nhập ròng trên doanh thu. Tuy nhiên, phương pháp
17
này cũng có nhược điểm liên quan đến các giả định cơ bản trong mô hình (giả thiết về
phân phối chuẩn và phương sai bằng nhau) có thể bị vi phạm làm giảm độ tin cậy của
mô hình cũng như làm giảm khả năng áp dụng.
2.3.2 Các nghiên cứu tại Việt Nam
Tại Việt Nam, cũng có nhiều nghiên cứu liên quan đến chủ đề này, đa số được công bố
trên các phương tiện thông tin đại chúng đã tiến hành nghiên cứu các nhân tố ảnh hưởng
đến rủi ro phá sản của doanh nghiệp, ước tính xác suất phá sản trong thẩm định giá trị
doanh nghiệp (Hay Sinh 2003, Lê Đạt Chí & Lê Tuấn Anh 2012; Lê Nguyễn Sơn Vũ
2013; Võ Hồng Đức & Nguyễn Đình Thiên 2013; nhóm tác giả thuộc ngành ngành khoa
học kinh tế trường Đại học kinh tế Thành phố Hồ Chí Minh 2013; Nguyễn Minh Hà &
Nguyễn Bá Hướng 2016). Các công trình đã được công bố chủ yếu sử dụng phương pháp
phân tích thống kê mô tả trên cơ sở dữ liệu bảng cũng như chưa đặt trọng tâm vào việc
nghiên cứu các mô hình dự báo xác suất vỡ nợ của doanh nghiệp. Chính vì vậy, hiện tại
vẫn còn thiếu các bằng chứng thực nghiệm từ kết quả phân tích mô hình hồi quy nhằm
cung cấp thêm minh chứng vững chắc cho việc đề xuất mô hình dự báo xác suất phá sản
doanh nghiệp mang lại kết quả chính xác nhất.
Cụ thể hơn, nghiên cứu về ước tính xác suất phá sản trong thẩm định giá trị doanh nghiệp
của Hay Sinh (2003). Theo tác giả, xác suất phá sản là một tham số tài chính có ảnh
hưởng trực tiếp đến giá trị doanh nghiệp. Giá được thẩm định thông qua hai phương pháp
gồm phương pháp thuộc cách tiếp cận dòng tiền – xác suất phá sản chưa được ước tính là
một tham số độc lập mà thường được thể hiện trong tỷ suất chiết khấu và phương pháp
giá trị hiện tại có điều chỉnh (APV) – ước tính xác suất phá sản như một tham số độc lập.
Kết quả nghiên cứu của tác giả hướng đến mục đích thiết lập các phương pháp ước tính
xác suất phá sản của một doanh nghiệp nhằm giúp phương pháp giá trị hiện tại có điều
chỉnh (APV) ngày càng được áp dụng rộng rãi, góp phần làm đa dạng hóa các phương
pháp trong hoạt động thẩm định giá trị doanh nghiệp tại Việt Nam.
Hay, Lê Nguyễn Sơn Vũ (2013) nghiên cứu về quyết định đầu tư và rủi ro phá sản của
các công ty niêm yết trên thị trường chứng khoán Việt Nam đã đưa ra các bằng chứng
18
thực nghiệm về sự tác động của các yếu tố chỉ số tài chính đến quyết định đầu tư và rủi
ro phá sản của các công ty niêm yết trên thị trường chứng khoán Việt Nam giai đoạn
2003 – 2012. Bộ dữ liệu gồm 737 công ty thuộc các lĩnh vực khác nhau. Kết quả nghiên
cứu cho thấy ba yếu tố gồm thu nhập ròng âm hai năm gần nhất, khả năng thanh khoản
ngắn hạn và nợ phải trả trên tổng tài sản có mối tương quan thuận chiều với chỉ số dự
báo phá sản Oscore và đồng thời có mối quan nghịch giữa hai nhân tố tỷ suất sinh lợi
trên tổng tài sản và tốc độ tăng trưởng thu nhập ròng với chỉ số dự báo phá sản Oscore;
và tất cả đều có ý nghĩa thống kê. Trong khi đó, bốn nhân số còn lại gồm quy mô doanh
nghiệp, tổng nợ phải trả trên tổng tài sản, vốn lưu động trên tổng tài sản và quỹ được lập
từ hoạt động trên tổng nợ phải trả cũng có tác động đến chỉ số dự báo phá sản Oscore
nhưng không có ý nghĩa thống kê.
Gần đây, Nguyễn Thị Tuyết Lan (2019) đã thực hiện nghiên cứu các nhân tố ảnh hưởng
đến rủi ro phá sản của các doanh nghiệp niêm yết ngành xây dựng tại Việt Nam. Mô hình
được sử dụng để nghiên cứu là mô hình logit với 5 biến độc lập gồm tổng nợ phải trả trên
tổng tài sản, vốn lưu động trên tổng tài sản, khả năng thanh toán ngắn hạn, tỷ suất sinh lợi
trên tổng tài sản và tốc độ tăng trưởng thu nhập ròng. Tổng thể mẫu khảo sát gồm 109
doanh nghiệp niêm yết thuộc ngành xây dựng tại Việt Nam trên 2 sàn là HNX và HOSE
giai đoạn 2005 – 2017. Kết quả nghiên cứu cho thấy các nhân tố gồm: tổng nợ phải trả
trên tổng tài sản có mối tương quan cùng chiều với rủi ro phá sản của doanh nghiệp niêm
yết thuộc ngành xây dựng tại Việt Nam và ngược lại tỷ lệ sinh lợi trên tổng tài sản có ảnh
hưởng ngược chiều.
Qua khảo lược các nghiên cứu ở trong và ngoài nước cho thấy rằng các tổ chức tài chính
có thể ứng dụng nhiều mô hình xếp hạng tín nhiệm khác nhau để dự báo xác suất vỡ nợ
của các doanh nghiệp. Các mô hình dự báo này có thể là mô hình đa thức, mô hình logit,
mô hình probit, mô hình mạng thần kinh nhân tạo… Bên cạnh đó, các mô hình xếp hạng
này sử dụng các yếu tố đầu vào hay các chỉ số tài chính khác nhau để dự báo khả năng
phá sản của doanh nghiệp. Các chỉ số tài chính thường được sử dụng như khả năng thanh
toán ngắn hạn, tỷ suất sinh lợi trên tổng tài sản, tổng nợ phải trả trên tổng tài sản… Tuy
nhiên, với những bộ dữ liệu được xây dựng trong các khoảng thời gian khác nhau, các kết
19
luận về việc lựa chọn mô hình xếp hạng tín nhiệm phù hợp và các chỉ số tài chính ảnh
hưởng đến xác xuất vỡ nợ của doanh nghiệp trong các bài nghiên cứu có sự khác nhau
cũng như việc vận dụng trong nghiên cứu dự báo khả năng vỡ nợ khách hàng doanh
nghiệp vừa và nhỏ tại Việt Nam theo tác giả là một điểm mới. Thông qua việc phân tích,
so sánh, tổng hợp các công trình nghiên cứu trên và các vấn đề có liên quan, tác giả đã chỉ
ra một số khoảng trống trong nghiên cứu, đề xuất mô hình và phương pháp nghiên cứu dự
kiến cho đề tài. Chi tiết về mô hình và phương pháp nghiên cứu sẽ được trình bày chi tiết
trong Chương 3 – Mô hình và phương pháp nghiên cứu để làm cơ sở cho việc đánh giá
mức độ tin cậy của kết quả nghiên cứu được trao đổi thảo luận trong Chương 4 – Kết quả
nghiên cứu.
Kết luận chương 2: Chương này tác giả đã trình bày những lý luận cơ bản và các lý
thuyết nền liên quan đến xếp hạng tín dụng, xác suất vỡ nợ của các doanh nghiệp và
phương pháp đo lường, dự báo các nội dung này cũng như kết quả đánh giá các nghiên
cứu trước đây đã được công bố để làm rõ tính cấp thiết của đề tài, đồng thời cung cấp cơ
sở cho việc tiến hành đề xuất mô hình nghiên cứu và phân tích kết quả nghiên cứu được
20
trình bày ở các chương tiếp theo.
CHƯƠNG 3: MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU
Trên cơ sở những bài học kinh nghiệm được đúc kết từ các công trình nghiên cứu đã
công bố trước đã trình bày ở trong Chương 2, chương này sẽ trình bày các thông tin cụ
thể liên quan đến các mô hình nghiên cứu được sử dụng cũng như xử lý cùng với các
phương pháp nghiên cứu phù hợp với các đặc điểm cụ thể của từng mô hình và dữ liệu
nghiên cứu đã được thu thập để tiến hành kiểm định các giả thuyết nghiên cứu đã được
đặt ra ban đầu ở Chương 1. Các thông tin chi tiết, cụ thể về các mô hình và phương pháp
nghiên cứu được sử dụng sẽ cho thấy mức độ tin cậy của các kết quả nghiên cứu được
thể hiện ở phần tiếp theo (Chương 4 – Kết quả nghiên cứu).
3.1 Phương pháp xây dựng các mô hình
Trong bài nghiên cứu này, tác giả sử dụng các mô hình tham số và phi tham số để dự
báo khả năng vỡ nợ của các doanh nghiệp vừa và nhỏ tại Việt Nam trong giai đoạn 2016
– 2018. Các bước xây dựng mô hình được thực hiện như sau:
Bước 1: Thu thập và xử lý dữ liệu. Dữ liệu sử dụng được lấy từ báo cáo tài chính hàng
năm có kiểm toán của khoảng 350 doanh nghiệp vừa và nhỏ thuộc 9 ngành khác nhau
tại Việt Nam từ năm 2016 đến năm 2018.
Bước 2: Lựa chọn các biến đầu vào của mô hình. Để dự báo khả năng nợ vỡ nợ của các
doanh nghiệp, tác giả đã lựa chọn 14 biến đầu vào là các chỉ số tài chính được tính toán
từ báo cáo tài chính của các doanh nghiệp. Các biến độc lập này thuộc 4 nhóm chỉ số tài
chính: nhóm chỉ số về khả năng thanh khoản, nhóm chỉ số về mức độ sử dụng nợ, nhóm
chỉ số về khả năng sinh lời, và nhóm chỉ số về hiệu quả hoạt động của doanh nghiệp.
Bước 3: Thực hiện chạy hồi quy trên các mô hình xếp hạng tín nhiệm được lựa chọn,
bao gồm mô hình tham số và phi tham số. Các mô hình tham số bao gồm mô hình logit,
mô hình probit, mô hình complementary log – log; các mô hình phi tham số bao gồm mô
hình cây quyết định, mô hình random foerest.
Bước 4: Sử dụng ma trận Confusionvà điểm số F1 (F1 – Score) để đánh giá kết quả hồi
quy của từng mô hình. Trên cơ sở đó, lựa chọn mô hình xếp hạng tín nhiệm phù hợp và
21
có khả năng dự báo tốt xác suất vỡ nợ của khách hàng.
Các bước nghiên cứu trên sẽ được trình bày chi tiết trong các phần nội dung tiếp theo
của Chương 3.
3.2 Thu thập và xử lý dữ liệu
Dữ liệu được lấy từ báo cáo tài chính hàng năm của khoảng 350 công ty từ năm 2016
đến năm 2018. Các báo cáo tài chính này đã được kiểm toán để đảm bảo chất lượng
của nguồn thông tin. Trong 350 doanh nghiệp, có 27 doanh nghiệp thuộc lĩnh vực kinh
doanh thương mại hàng tiêu dùng; 31 doanh nghiệp thuộc ngành kinh doanh xăng dầu;
34 doanh nghiệp thuộc ngành kinh doanh ô tô; 35 doanh nghiệp thuộc ngành thi công
xây lắp; 38 doanh nghiệp thuộc ngành kinh doanh dược phẩm và thiết bị y tế; 39 doanh
nghiệp thuộc ngành dệt may; 41 doanh nghiệp thuộc ngành thủy sản (cá tra, tôm,
nghêu…); 47 doanh nghiệp thuộc ngành sắt thép và 58 doanh nghiệp thuộc ngành kinh
doanh nông sản (lúa gạo, cà phê, điều, tiêu…).
Bảng 3.1: Tổng hợp số lượng doanh nghiệp – ngành nghề kinh doanh
STT Ngành Số lượng công ty
Thương mại hàng tiêu dùng 1 27
Kinh doanh xăng dầu 2 31
Kinh doanh ô tô 3 34
Thi công xây lắp 4 35
Kinh doanh dược phẩm – thiết bị y tế 5 38
Dệt may 6 39
Thủy sản (cá tra, tôm,nghêu…) 7 41
Sắt thép 8 47
9 Kinh doanh nông sản (lúa gạo, cà phê, điều, tiêu…) 58
Tổng cộng 350
22
Nguồn: Thống kê từ tác giả
Crouhy, Galai & Mark (2001) đã vạch ra điểm yếu của nhiều mô hình đo lường rủi ro là
chúng dựa trên thông tin tài chính lịch sử được tạo ra trong các điều kiện có thể không
áp dụng được trong tương lai hoặc dữ liệu được sử dụng trong mô hình được cập nhật
không thường xuyên. Đó là lý do để tiến hành nghiên cứu trong ba năm gần đây nhất,
khi tình hình kinh tế và hoạt động của doanh nghiệp không thay đổi nhiều.
Bên cạnh đó, các công ty này được chia thành hai nhóm: Nhóm phá sản được đánh dấu
là 1 và và nhóm không phá sản được đánh dấu là 0. Các nhóm này được phân chia dựa
trên Vốn chủ sở hữu được lấy từ bảng cân đối kế toán, lợi nhuận sau thuế được lấy từ
Bảng báo cáo kết quả hoạt động kinh doanh và dòng tiền hoạt động kinh doanh được lấy
từ bảng lưu chuyển tiền tệ. Các công ty bị xếp vào nhóm phá sản (đánh dấu là 1) nếu rơi
vào các trường hợp sau đây:
(i) Vốn chủ sở hữu âm
(ii) Hai năm liên tiếp lợi nhuận sau thuế âm và dòng tiền từ hoạt động kinh doanh âm
(iii) Các công ty tuyên bố phá sản
(iv) Thuộc nhóm nợ xấu (nhóm 3, 4 và 5)
Giả thiết này dựa trên lý thuyết của Crouhy, Galai & Mark rằng phân tích rủi ro tín dụng
dựa trên nhiều thuộc tính của người vay bao gồm tài chính, quản lý, thu nhập và dòng
tiền, chất lượng tài sản và thanh khoản của công ty.
Bảng 3.2: Phân tách các công ty phá sản và không phá sản
Các doanh Các doanh nghiệp Năm Tổng nghiệp phá sản không phá sản
2016 38 312 350
2017 60 290 350
2018 48 302 350
Nguồn: Thống kê từ tác giả
Trong tập dữ liệu, các giá trị bị thiếu, không chính xác hoặc không có ý nghĩa sẽ được
23
xem xét điều chỉnh theo nguyên tắc như sau:
- Thay thế các giá trị bị thiếu bằng các giá trị trung bình của nhóm mà người đi vay
thuộc về. Ví dụ: nếu giá trị thiếu là từ một công ty phá sản, nó sẽ được thay thế
bằng giá trị trung bình của nhóm các công ty phá sản.
- Thay thế các giá trị không xác định (infinitive values) bằng các giá trị tối đa hoặc
tối thiểu tùy thuộc vào giá trị nào sẽ phù hợp hơn.
- Các giá trị biến động bất thường sẽ được thay thế bằng quantile 5% hoặc 95% của
các chỉ số tài chính
3.3 Lựa chọn các biến đầu vào trong mô hình dự báo xác suất vỡ nợ
Một số bài nghiên cứu khoa học ủng hộ quan điểm sử dụng các chỉ số tài chính như
nguồn thông tin đánh giá rủi ro tín dụng (Demerjian, 2007). Hay Smith & Warner (1979)
lưu ý rằng việc khách hàng vi phạm các điều kiện cam kếtsẽ cung cấp tín hiệu về khả
năng trả nợ của họ cho ngân hàng. Dichev & Skinner (2002) cũng nhận thấy rằng các điều
kiện cam kết về chỉ số tài chính sẽ định hướng các nội dung được đề cập trong các hợp
đồng tín dụng.
Lundholm & Sloan (2004) đã chứng minh rằng các điều kiện cam kết về tỷ lệ tài chính rất
hữu ích vì “… nếu công ty bắt đầu có dấu hiệu khó khăn, ngân hàng có thể thu hồi nợ hay
xử lý tài sản trước khi công ty mất khả năng thanh toán”. Hay Beaver (1966) trình bày
bằng chứng thực nghiệm rằng một số chỉ số tài chính đã cho các tín hiệu thống kê nổi bật
trước các thất bại trong kinh doanh thực tế của các công ty. Beaver đã cố gắng để dự đoán
xác suất vỡ nợ của công ty bằng cách sử dụng các chỉ số tài chính của họ. Tuy nhiên,
nghiên cứu này chủ yếu tập trung vào tỷ lệ đòn bẩy và thanh khoản, có thể chưa cung cấp
đầy đủ thông tin tài chính để đưa ra dự báo chính xác.
Chỉ số tài chính cũng đã được xem xét bởi một số lượng lớn các tổ chức xếp hạng tín
nhiệm khi đánh giá chất lượng tín dụng. Chẳng hạn như Standard & Poor's (2006) đã dựa
trên sự cải thiện về tỷ lệ nợ trên dòng tiền (tổng nợ/ thu nhập) và hệ số khả năng thanh
toán để giải thích cho việc nâng hạng tín dụng cho Staples, Inc. Hay như Moody (2006)
đã lưu ý trong việc xếp hạng cho Limited Brands, Inc rằng việc suy giảm hay ổn định
phạm vi bảo hiểm và nợ trên dòng tiền (tổng nợ/ thu nhập) sẽ ảnh hưởng đến thay đổi xếp
24
hạng trong tương lai.
Demerjian (2007) đã nêu 5 điều kiện cam kết về chỉ số tài chính thường được sử dụng
trong các hợp đồng tín dụng làm cơ sở để dự đoán rủi ro tín dụng của người vay. Cụ thể:
i. Mức bảo hiểm tối thiểu (thu nhập/ chi phí liên quan đến nợ định kỳ)
ii. Nợ tối đa đối với dòng tiền (tổng nợ/ thu nhập)
iii. Giá trị thuần tối thiểu (tài sản - nợ phải trả = vốn cổ phần của cổ đông)
iv. Đòn bẩy tối đa (tổng nợ/ tổng tài sản)
v. Khả năng thanh toán tối thiểu (tài sản ngắn hạn/ nợ ngắn hạn)
Moody’s và Standard and Poor's cung cấp một số chỉ số tài chính quan trọng trong quy
trình xếp hạng của họ bao gồm: Chỉ số Nợ /Tài sản; Chỉ số thanh toán lãi vay từ lợi nhuận
trước thuế và lãi vay; Triển vọng kinh doanh (tăng trưởng của dòng tiền hoặc lợi nhuận
trên tài sản); Cổ tức và các khoản thanh toán khác; Rủi ro kinh doanh (biến động của
dòng tiền hoặc giá trị tài sản); Thanh khoản tài sản.
Báo cáo của Moody (2001) đã đề xuất một mô hình xếp hạng tín dụng định lượng để đánh
giá các công ty thuộc thị trường cấp cao ở Nhật Bản được gọi là RiskCalc. Mô hình này
sử dụng bảy chỉ tiêu, bao gồm các loại sau: khả năng sinh lời, đòn bẩy tài chính, khả năng
thanh khoản, khả năng trả nợ gốc, khả năng trả lãi vay, quy mô và các chỉ số hoạt động
của doanh nghiệp (Phụ lục – Bảng 01).
Engelmann & Rauhmeier (2010) đã mở rộng nghiên cứu của Hayden với 14 tỷ lệ tài
chính đã được lựa chọn và chia thành 9 nhóm rủi ro bao gồm đòn bẩy tài chính, khả
năng thanh khoản, chỉ số hoạt động, khả năng kiểm soát chi phí, hiệu quả sử dụng tài
sản, khả năng sinh lời, quy mô doanh nghiệp, tốc độ tăng trưởng và tốc độ gia tăng nợ
vay (Phụ lục – Bảng 02).
Tóm lại, các biến độc lập được lựa chọn trong mô hình dự báo xác suất vỡ nợ thường
thuộc 4 nhóm chỉ số tài chính sau:
Nhóm chỉ số về khả năng thanh khoản:
Nhóm chỉ số này phản ánh khả năng chuyển đổi tài sản thành tiền để thanh toán các
khoản nợ ngắn hạn của doanh nghiệp, hay thể hiện khả năng thanh toán trong ngắn hạn
25
của doanh nghiệp. Nhóm chỉ số này thường bao gồm hệ số khả năng thanh toán hiện
hành và hệ số khả năng thanh toán nhanh. Các hệ số này càng thấp thì rủi ro phá sản
của doanh nghiệp càng cao.
Nhóm chỉ số về đòn bẩy tài chính:
Nhóm chỉ số này đo lường mức độ sử dụng nợ của doanh nghiệp thông qua các chỉ số
như hệ số nợ trên tổng tài sản, hệ số nợ trên vốn chủ sở hữu, khả năng thanh toán lãi
vay, khả năng thanh toán nợ dài hạn. Các hệ số nợ càng cao và khả năng thanh toán nợ
càng thấp thì rủi ro vỡ nợ của doanh nghiệp càng cao.
Nhóm chỉ số về khả năng sinh lời
Nhóm chỉ số này đo lường khả năng sinh lợi của doanh nghiệp thông qua các chỉ số như
lợi nhuận gộp biên, thu nhập trước thuế trên doanh thu thuần, thu thập trước thuế trên
tổng tài sản, thu thập trước thuế trên vốn chủ sở hữu. Người ta tin rằng khả năng sinh lời
của công ty là một yếu tố dự báo tốt về việc liệu sau đó công ty có khả năng thanh toán
nghĩa vụ nợ của mình hay không, một công ty luôn thua lỗ cuối cùng sẽ làm cạn kiệt bất
kỳ nguồn vốn chủ sở hữu nào và không có khả năng trả nợ.
Nhóm chỉ số về hiệu quả hoạt động
Chỉ số về hiệu quả hoạt động cho thấy doanh nghiệp đã sử dụng tài sản hiệu quả như thế
nào. Chỉ số này càng thấp thì rủi ro tín dụng của doanh nghiệp càng cao khi doanh
nghiệp sử dụng tài sản chưa hiệu quả; đặc biệt là hàng tồn kho, các khoản phải thu và
các tài sản của doanh nghiệp.
Trên cơ sở các nghiên cứu trên, tác giả đã lựa chọn 14 chỉ số tài chính là các biến độc
lập cho các mô hình xếp hạng tín nhiệm trong bài nghiên cứu. Bảng sau đây mô tả cách
14 biến độc lập được tính toán, cũng như kỳ vọng về dấu của các biến này trong mô hình
26
dự báo xác suất vỡ nợ.
Bảng 3.3: Các biến độc lập trong mô hình dự báo xác suất vỡ nợ
Các chỉ số tài chính Nhóm chỉ số tài chính Các biến độc lập Kỳ vọng về dấu
Lợi nhuận gộp/Doanh thu thuần Khả năng sinh lời - X1
Thu nhập trước thuế/Doanh thu thuần Khả năng sinh lời - X2
Thu nhập trước thuế/Tổng tài sản Khả năng sinh lời - X3
Thu nhập trước thuế/Vốn chủ sở hữu Khả năng sinh lời - X4
Tổng nợ phải trả/Tổng tài sản Đòn bẩy tài chính + X5
Tổng nợ phải trả/Vốn chủ sở hữu Đòn bẩy tài chính + X6
Tài sản ngắn hạn/Nợ ngắn hạn Khả năng thanh khoản - X7
Khả năng thanh khoản - X8 (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn
Lợi nhuận trước thuế và lãi vay/Lãi vay Thanh toán lãi vay - X9
Thanh toán nợ dài hạn - X10 Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn
Khả năng thanh khoản - X11 Tiền và các khoản tương đương tiền/Vốn chủ sở hữu
Giá vốn hàng bán/Hàng tồn kho bình quân Hiệu quả hoạt động + X12
Các khoản phải thu/Doanh thu bình quân Hiệu quả hoạt động + X13
Tổng doanh thu/Tổng tài sản Hiệu quả hoạt động - X14
3.4 Các mô hình dự báo xác suất vỡ nợ được nghiên cứu
3.4.1 Mô hình tham số
(i) Mô hình logit
Mô hình Logit là mô hình hồi quy, trong đó biến phụ thuộc (Y) được xem là biến giả
hay biến nhị phân, chỉ nhận hai giá trịlà 0 và 1; các biến độc lập có thể là biến rời rạc
hoặc biến liên tục. Trong mô hình XHTN, biến phụ thuộc Y nhận giá trị 1 khi khách
27
hàng không trả được nợ và Y nhận giá trị 0 khi khách hàng trả được nợ.
Bảng 3.4: Cấu trúc dữ liệu các biến trong mô hình Logit
Biến Ký hiệu Loại
Phụ thuộc Y Nhị phân
Độc lập Liên tục hoặc rời rạc 𝑋𝑖
Mối quan hệ giữa biến phụ thuộc (Y) và các biến độc lập được thể hiện thông qua
phương trình sau:
)=𝑍𝑖=𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑘𝑋𝑘 𝐿𝑖 = ln ( 𝑃𝑖 1−𝑃𝑖
Trong đó:
- P là xác suất trả nợ của khách hàng
- 𝛽1 , 𝛽2 , 𝛽3, … , 𝛽𝑛 là các hệ số
- 𝑋1 , 𝑋2 ,…, 𝑋𝑘 là các nhân tố ảnh hưởng
Để xác định xác suất vỡ nợ của khách hàng, chúng ta cần phải tìm giá trị 𝑌̂. 𝑌̂ được xem
là giá trị ước lượng của Y, thu được khi hồi quy Y theo các biến độc lập 𝑋𝑖.
Công thức tính xác suất phá sản của doanh nghiệp được ước lượng theo mô hình logit như
sau:
𝑒𝑌̂ 1+𝑒𝑌̂=
exp(𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑛𝑋𝑛) 1+ exp(𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑛𝑋𝑛)
P(𝑌𝑖 = 1)=
(ii) Mô hình Probit
Năm 1934, Chester Ittner Bliss đã có ý tưởng nghiên cứu về phân tích probit. Tuy nhiên,
đến năm 1952, sách “phân tích probit” mới được xuất bản bởi David Finney – một giáo sư
về thống kê tại Đại học Edinburgh.
Cấu trúc dữ liệu trong mô hình Probit cũng tương tự như mô hình Logit, mô hình cũng
ước lượng được xác suất trả nợ của một khách hàng. Mô hình Probit có giả thiết sai số
1
𝑡2 2 𝑑𝑡
ngẫu nhiên có sai số chuẩn hóa: 𝜀 ~ N(0,1)
𝛽1+𝛽2𝑋2𝑖+⋯+𝛽𝑘𝑋𝑘𝑖 −∞
√2𝜋
28
𝑒 𝑃𝑖 = P(𝑌𝑖 = 1) = F (𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + ⋯ + 𝛽𝑘𝑋𝑘𝑖) = ∫
Trong đó F là hàm phân phối xác suất tích lũy. Khi đó hàm hợp lý có dạng:
𝑖=1
(1 𝐿 = ∏ 𝐹𝑛 (𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + ⋯ + 𝛽𝑘𝑋𝑘𝑖)𝑌𝑖 −(𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + ⋯ +
𝛽𝑘𝑋𝑘𝑖)1−𝑌𝑖)
Các biến và tham số trong mô hình Probit tương tự như mô hình Logit
(iii) Mô hình Complementary Log-Log
Mô hình Complementary Log-Log cũng được xem là mô hình hồi quy nhị phân mang
những đặc tính giống mô hình logit và probit. Tuy nhiên, mô hình Complementary Log-
Log thường được sử dụng khi xác suất xuất hiện của một biến cố thì rất thấp hoặc rất lớn.
Không giống như mô hình logit hay probit, hàm Complementary Log-Log không đối
xứng vì giả thiết sai số ngẫu nhiên của mô hình có dạng phân phối log-Weibull.
Hàm log-likelihood cho mô hình Complementary Log-Log là:
𝑙𝑛𝐿 = ∑ 𝑊𝑗 𝑙𝑛𝐹(𝑥𝑗𝑏) + ∑ 𝑊𝑗 ln (1 − 𝐹(𝑥𝑗𝑏))
Trong đó: F(z) = 1-exp(-exp(z)) và 𝑤𝑗 là trọng số
3.4.2 Mô hình phi tham số
(i) Mô hình cây quyết định
Cây quyết định (DT) là một kiểu mô hình phân lớp các quan sát dựa vào dãy các luật.
Mô hình này bao gồm một nút gốc (Root node), các nút bên trong (Internal node) và nút
lá (Leaf node).Mỗi một nút trong DT tương ứng với một biến; đường nối giữa nó với nút
con của nó thể hiện một giá trị cụ thể cho biến đó (đây chính là điều kiện hay luật để
phân nhánh cho mỗi node).
Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu; các giá trị cho trước của các
29
biến được biểu diễn bởi đường đi từ nút gốc tới nút lá đó.
Hình 3.1: Mô phỏng mô hình cây quyết định
Nguồn: Abdou (2011)
Cây quyết định được xây dựng bằng cách phân tách thuộc tính các giá trị tại mỗi nút dựa
trên một thuộc tính đầu vào. Quá trình phân lớp sử dụng các thuộc tính phân tách được
thực hiện liên tục cho tới khi gặp các nút lá (giá trị mục tiêu). Tập hợp các luật đường đi
từ nút gốc tới nút lá sẽ xác định cho chúng ta các luật quyết định mà hàm mục tiêu trả về
giá trị là mức độ rủi ro tương ứng với khách hàng.
Việc phân tách tại các nút sẽ được xác định theo chỉ số Gini với thuật toán CART
(Classicification and Regression Tree).
𝑚 𝑖=1
Gini(D) = 1 – ∑ (𝑝𝑖)2
Trong đó:
- m là tổng số lớp
- 𝑝𝑖 là xác suất để 1 bộ bất kỳ trong D thuộc về lớp 𝐶𝑖
Mô hình cây quyết định là một phương pháp phân lớp rất hiệu quảvà dễ hiểu. Tuy nhiên,
hiệu quả phân lớp củacây quyết định phụ thuộc rất lớn vào dữ liệu huấn luyện (training
data). Do vậy, việc sử dụng một bộ dữ liệu lớn về lịch sử vay nợ của khách hàng là rất
cần thiết để xây dựng mô hình cây quyết định đáng tin cậy.
(ii) Mô hình Random forest
Mô hình Random forest – rừng ngẫu nhiên: đây là phương pháp xây dựng một tập hợp
30
rất nhiều cây quyết định để đưa ra quyết định về biến mục tiêu cần được dự báo. Trong
đó mỗi cây quyết định được tạo ra một cách ngẫu nhiên từ việc: tái chọn mẫu
(boostrap, random sampling) và chỉ dùng một phần nhỏ tập biến ngẫu nhiên (random
features) từ toàn bộ các biến trong dữ liệu. Ở trạng thái sau cùng, mô hình random
forest thường hoạt động rất chính xác nhưng điểm bất lợi của thuật toán là ta không thể
hiểu được cơ chế hoạt động bên trong của mô hình vì cấu trúc quá phức tạp. Mô hình
Random forest do đó được xem là một trong những mô hình hộp đen (black box).
Hình 3.2: Mô phỏng mô hình random forest
3.5 Phương pháp lựa chọn mô hình dự báo xác suất vỡ nợ
Để đánh giá mức độ phù hợp của các mô hình dự báo xác suất vỡ nợ, một vài kỹ thuật
được sử dụng như ma trận Confussion (Confussion Matrix), tỷ lệ độ chính xác
(Accuracy ratio), tỷ lệ nhạy cảm (Sensitivity ratio), tỷ lệ Specificity (Specificity ratio),
điểm F1 (F1 score).
3.5.1 Ma trận Confussion
Ma trận Confussion là một phương pháp được xây dựng để đánh giá kết quả của những
bài toán phân loại bằng việc xem xét tỷ lệ về độ chính xác và độ bao quát của các dự
đoán cho từng lớp cụ thể. Một ma trận Confussion gồm có 4 chỉ số sau đối với mỗi lớp
phân loại: True positive (TP) là chỉ số số lượng dự đoán chính xác; True Negative (TN)
chỉ số số lượng dự báo chính xác một cách gián tiếp; False positive (FP) chỉ số số lượng
31
các dự báo sai lệch; False Negative (FN) chỉ số số lượng các sai lệch một cách gián tiếp.
Trong trường hợp đánh giá kết quả dự báo khả năng vỡ nợ của các doanh nghiệp, ma
trận Confussion được mô hình như bảng dưới đây:
Bảng 3.5: Ma trận Confussion
Predicted class
Non-default Default Classes (Không phá sản) (Phá sản)
Non-default Actual True Negative (TN) False Positive (FP) class (Không phá sản)
Default False Negative (FN) True Positive (TP) (Phá sản)
Trong đó các chỉ số đối với mỗi lớp phân loại được hiểu như sau:
True Positive (TP): Số lượng dự báo chính xác. Là khi mô hình dự báo đúng một công ty
bị phá sản.
True Negative (TN): Số lượng dự báo chính xác một cách gián tiếp. Là khi mô hình dự
đoán đúng một doanh nghiệp không bị phá sản, tức là việc không chọn trường hợp doanh
nghiệp bị phá sản là chính xác.
False Positive (FP): Số lượng các dự đoán sai lệch. Là khi mô hình dự báo một công ty
bị phá sản nhưng công ty đó hoàn toàn khỏe mạnh. Đây có thể được xem là lỗi loại 1 của
mô hình.
False Negative (FN): Số lượng các dự đoán sai lệch một cách gián tiếp. Là khi mô hình
dự đoán một công ty không bị phá sản nhưng công ty đó lại rơi vào tình trạng phá sản, tức
là việc không chọn trường hợp công ty đó bị phá sản là sai.Đây được xem là lỗi loại 2 của
mô hình.
Theo các nghiên cứu củaHaydenand Daniel thấy rằng, mục tiêu của mô hình dự báo xác
suất vỡ nợ là phân tích, đánh giá và xếp hạng các khách hàng vay, để từ đó phân loại được
32
khách hàng tốt và khách hàng xấu. Tuy nhiên khi rủi ro xảy ra, các thống kê cho thấy rằng
False Negative tức là lỗi loại 2, sẽ mang đến những tổn thất lớn cho ngân hàng hơn là
False Positive tức là lỗi loại 1, do khả năng không thu hồi vốn được từ nhóm khách hàng
do lỗi loại 2 gây ra.
Từ bốn chỉ số trên, các nhà nghiên cứu xây dựng các nhóm chỉ số để đánh giá mức độ tin
cậy của một mô hình dự báo xác suất vỡ nợ của doanh nghiệp.
Tỷ lệ đo lường sự chính xác của mô hình (Accuracy ratio): Mức độ chính xác là khả
năng mô hình phân biệt được những công ty phá sản và không phá sản một cách chính
xác. Để tính toán mức độ chính xác của một mô hình dự báo, các nhà nghiên cứu đã đưa
ra công thức như sau:
Accuracy = (TN + TP)/(TN + FN + TP + FP)
Tỷ lệ đo lường mức độ nhạy cảm của mô hình (sensititvity ratio): Mức độ nhạy cảm là
khả năng mô hình xác định được các trường hợp các công ty phá sản một cách chính xác,
nó được đo lường bởi tỷ lệ các công ty được dự báo phá sản chính xác trên tổng các công
ty bị phá sản thật sự. Mức độ nhạy cảm của mô hình được xác định bởi công thức như
sau:
Sensitivity = TP/(TP+FN)
Tỷ lệ specificity (specificity ratio): Đây là tỷ lệ được xây dựng nhằm đo lường khả năng
mô hình xác định được các trường hợp các công ty không bị phá sản một cách chính xác.
Tỷ lệ này được xác định bởi tỷ lệ các công ty được dự báo không phá sản chính xác trên
tổng các công ty không bị phá sản thật sự. Công thức xác định tỷ lệ này như sau:
Specificity = TN/(TN+FP)
Tỷ lệ precision (precision ratio): Đây là tỷ lệ đo lường số lượng công ty được dự báo phá
sản chính xác trên tổng các công ty được dự báo phá sản. Tỷ lệ này được xác định thông
qua công thức sau:
33
Precision = TP/(TP + FP)
3.5.2 Điểm số F1 (F1-score)
Điểm số F1-score được đưa ra nhằm khắc phục nhược điểm của việc đánh giá mức độ tin
cậy của mô hình dựa trên các nhóm chỉ số được xây dựng dựa trên ma trận Confussion.
Trong các bài toán phân loại các công ty thuộc lớp phá sản hoặc không phá sản, bộ dữ
liệu được sử dụng để xây dựng và kiểm định mô hình thường có sự phân bố không đồng
đều, trong trường hợp này dữ liệu về các công ty không phá sản sẽ chiếm một tỷ lệ lớn
hơn rất nhiều so với dữ liệu của các công ty phá sản, từ đó dẫn đến các tỷ lệ sensitivity và
tỷ lệ precision thường bị lệch và cho kết quả dự báo không thật sự chính xác. Vì vậy,
điểm số F1 được đưa ra, nó là chỉ số được xây dựng dựa trên việc đánh giá đồng thời giữa
2 nhóm tỷ lệ sensitivity và precision, từ đó dẫn đến kết quả đánh giá tính hiệu quả của các
mô hình xếp hạng sẽ cho kết quả đáng tin cậy hơn.
Điểm số F1 hay còn gọi là F-measure được xác định bởi công thức như sau:
F1 Score = 2 * (Precision*Sensitivity) / (Precision + Sensitivity)
Điểm số F1 càng tiệm cận với giá trị là 1 thì mức độ chính xác và hiệu quả của mô hình
xếp hạng tín nhiệm càng cao và đáng tin cậy.
Kết luận chương 3: Chương này tác giả đã trình bày chi tiết nội dung của mô hình
nghiên cứu – mô hình dự báo xác suất vỡ nợ được đề xuất, mô tả chi tiết các dữ liệu đã
thu thập và các phương pháp nghiên cứu được sử dụng để cho thấy mức độ tin cậy của kết
quả nghiên cứu được trình bày ở chương tiếp theo. Mô hình dự báo xác suất vỡ nợ được
đề xuất sử dụng bao gồm mô hình tham số (với các mô hình logit, probit, complementary
log-log) và mô hình phi tham số (gồm mô hình cây quyết định decision tree, mô hình
34
random forest).
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU 4.1 Kết quả thống kê mô tả
Bảng 4.1: Thống kê mô tả các biến độc lập
Chỉ số tài chính Mean Median Min Max Biến độc lập
Lợi nhuận gộp/Doanh thu thuần (%) -0.017 0.102 -5.818 0.897 X1
-1.334 0.016 -12.558 9.208 X2 Thu nhập trước thuế/Doanh thu thuần (%)
-0.003 0.005 -0.483 0.311 X3 Thu nhập trước thuế/Tổng tài sản (%)
-0.240 0.043 -20.215 16.667 X4 Thu nhập trước thuế/Vốn chủ sở hữu (%)
Tổng nợ phải trả/Tổng tài sản (%) 0.706 0.728 0.010 3.769 X5
Tổng nợ phải trả/Vốn chủ sở hữu (%) 9.546 2.266 -163.476 224.405 X6
Tài sản ngắn hạn/Nợ ngắn hạn (lần) 1.574 1.148 0.072 19.663 X7
1.033 0.722 3.612 19.663 X8 (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn (lần)
-46.372 1.396 -1546 1681.384 X9 Lợi nhuận trước thuế và lãi vay/Lãi vay (lần)
9.782 0.111 -6.065 1821.081 X10 Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn(lần)
tương đương 1.006 0.101 -10.749 173.189 X11 Tiền, các khoản tiền/Vốn chủ sở hữu (lần)
89.43 1.766 1.391 348 X12 Giá vốn hàng bán/Hàng tồn kho bình quân (vòng)
0.694 0.923 0.003 5.189 X13 Các khoản phải thu/Doanh thu bình quân (lần)
35
0.4930 0.3991 0.002 3.771 X14 Tổng doanh thu/Tổng tài sản (vòng)
Bảng 4.1 mô tả giá trị của 14 biến độc lập thông qua giá trị trung bình, trung vị, giá trị
nhỏ nhất và lớn nhất giúp chúng ta hiểu khái quát về bộ dữ liệu được sử dụng để xây
dựng các mô hình dự báo xác suất vỡ nợ.
Ma trận tương quan giữa các biến trong mô hình
Bảng 4.2: Ma trận tương quan
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10 X11 X12 X13 X14
Loan
Status
1.00
X1
0.40
1.00
X2
0.48
0.69
1.00
X3
0.28
0.35
0.60
1.00
X4
-0.27
-0.15
-0.39
-0.32
1.00
X5
-0.16
-0.04
-0.23
-0.62
0.59
1.00
X6
0.29
0.37
0.44
0.27
-0.64
-0.28
1.00
X7
0.17
0.28
0.48
0.28
-0.70
-0.36
0.72
1.00
X8
0.30
0.37
0.46
0.29
-0.23
-0.18
0.37
0.32
1.00
X9
0.25
0.25
0.49
0.27
-0.34
-0.19
0.34
0.43
0.57
1.00
X10
-0.12
0.10
0.14
-0.10
0.32
0.40
-0.07
-0.09
0.13
0.11
1.00
X11
-0.01
0.09
0.38
0.18
-0.37
-0.18
0.18
0.50
0.18
0.29
0.02
1.00
X12
-0.13
-0.62
-0.40
-0.19
0.08
0.00
-0.10
0.00
-0.36
-0.21
-0.19
-0.06
1.00
X13
-0.06
0.42
0.53
0.29
0.01
-0.05
0.06
0.14
0.35
0.29
0.31
0.25
-0.50
1.00
X14
Bảng 4.2 cho thấy mối quan hệ giữa các biến trong mô hình dự báo xác suất vỡ nợ, trong
ma trận tương quan trên có cặp biến độc lập có mức độ tương quan cao. Ví dụ: (i) biến X7
và X8: mức độ tương quan là 0,72; (ii) biến X2 và X3: mức độ tương quan là 0,69; (iii)
biến X5 và X8: mức độ tương quan là - 0,70. Tuy nhiên, các mức độ tương quan này đều
nhỏ hơn 0,8, do đó hiện tượng đa cộng tuyến giữa các biến trong mô hình có thể không
36
tác động quá lớn đến kết quả hồi quy của mô hình.
4.2. Kết quả hồi quy
4.2.1 Kết quả hồi quy của các mô hình tham số
Bảng 4.3: Kết quả hồi quy của các mô hình tham số
Complementary Logit Model Probit Model Log - Log Model
Coefficients: Estimate Estimate Estimate Std. Error Std. Error Std. Error
(Intercept) -4.853 5.659 -2.818 3.054 -2.348 4.112
X1 -1.446 5.659 -1.366 3.206 -1.505 4.047
X2 -1.717 2.909 -1.101 1.483 -1.038 2.013
X3 -71.83 * 37.327 -4.10 ** 1.974 -50.03 ** 24.00
X4 -1.057 2.260 -6.389 1.273 -0.136 1.621
X5 12.35 * 6.370 6.79 ** 3.270 7.98 ** 3.938
X6 0.103 0.084 6.298 4.921 0.079 0.066
X7 -4.250 2.913 -2.302 1.481 -3.136 2.251
X8 3.600 4.543 2.062 2.399 0.798 3.143
X9 -0.281 0.399 -1.424 2.116 -0.283 0.320
X10 -27.47 * 14.783 -1.50 ** 7.554 -14.91 * 8.087
X11 -2.841 2.781 -1.669 1.552 -2.510 2.030
X12 0.731** 0.354 3.95 ** 1.783 0.681 0.269
X13 -0.002 0.003 -9.152 1.454 -0.000 0.001
X14 -8.827 ** 4.288 -4.76 ** 2.133 -7.453 3.052
Signif. codes: ‘***’ 0.01 ‘**’ 0.05 ‘*’ 0.1
Kết quả hồi quy cho thấy rằng, trong cả 3 mô hình dự báo xác suất vỡ nợ, các biến độc
lập Lợi nhuận gộp/Doanh thu thuần (X1), Thu nhập trước thuế/Doanh thu thuần (X2),
Thu nhập trước thuế/Tổng tài sản (X3), Thu nhập trước thuế/Vốn chủ sở hữu (X4), Tài
sản ngắn hạn/Nợ ngắn hạn (X7), Lợi nhuận trước thuế và lãi vay/Lãi vay (X9), Thu nhập
37
trước thuế, lãi vay và khấu hao/Nợ dài hạn (X10), Tiền và các khoản tương đương
tiền/Vốn chủ sở hữu (X11), Các khoản phải thu/Doanh thu bình quân (X13), Tổng
doanh thu/Tổng tài sản (X14) có sự biến động ngược chiều với biến phụ thuộc. Sự biến
động này phù hợp với các kỳ vọng về dấu của các biến độc lập được trình bày trong
bảng 3.3. Tuy nhiên trong các biến độc lập trên, biến X13 có mức độ ảnh hưởng không
thực sự rõ ràng với các hệ số đo được trong mô hình logit và mô hình complementary
log-log lần lượt là – 0,002 và – 0,000. Ngược lại, các biến X3, X10 và X14 có mức độ
ảnh hưởng khá lớn đến kết quả dự báo khả năng vỡ nợ của doanh nghiệp với các hệ số
đo được rất lớn lần lượt là – 71,83; – 27,47 và – 8,827.
Điều này cho thấy rằng, nếu một doanh nghiệp có lợi nhuận gộp và thu nhập trước thuế
đạt giá trị càng lớn trên doanh thu thuần và vốn chủ sở hữu tức là khả năng tạo ra lợi
nhuận của doanh nghiệp càng lớn thì khả năng phá sản của doanh nghiệp đó càng thấp.
Thêm nữa, chỉ số thanh toán hiện hành càng cao tức là tỷ lệ tài sản ngắn hạn trên nợ
ngắn hạn càng lớn, đồng thời doanh nghiệp đó nắm giữ lượng tiền mặt trong công ty
càng nhiều thì khả năng phá sản của doanh nghiệp đó càng thấp. Khả năng trả lãi vay
được đo lường bởi tỷ lệ lợi nhuận trước thuế và lãi vay trên lãi vay chiếm tỷ lệ càng
lớn thì xác suất phá sản của doanh nghiệp đó cũng sẽ giảm. Ngoài ra, vòng quay tổng
tài sản càng lớn, tức là doanh nghiệp đó sử dụng các tài sản trong doanh nghiệp càng
hiệu quả thì khả năng vỡ nợ của doanh nghiệp càng có xu hướng giảm.
Các biến độc lập Tổng nợ phải trả/Tổng tài sản (X5), Tổng nợ phải trả/Vốn chủ sở hữu
(X6), (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn (X8) và Giá vốn hàng bán/Hàng
tồn kho bình quân (X12) biến động cùng chiều với biến phụ thuộc. Sự biến động cùng
chiều này phù hợp với các kỳ vọng về dấu của các biến độc lập được dự báo trong các
nghiên cứu trước đây. Trong đó, biến X5 có mức độ tác động lớn đến kết quả của mô hình
dự báo xác suất vỡ nợ với các hệ số đo được trong mô hình logit, mô hình probit và mô
hình complementary log-log lần lượt là 12,35; 6,79 và 7,98. Ngược lại, biến X6 có mức
độ ảnh hưởng yếu hơn với hệ số đo được khá thấp lần lượt là 0,079 và 0,103.
Thông qua kết quả hồi quy có thể thấy một doanh nghiệp nếu sử dụng nợ vay càng nhiều
38
thì khả năng tự chủ tài chính càng thấp, áp lực tài chính càng lớn dẫn đến khả năng phá
sản càng cao. Bên cạnh đó, việc quản lý hàng tồn kho cũng đóng vai trò hết sức quan
trọng đến hiệu quả sinh lời của doanh nghiệp. Đặc biệt, các doanh nghiệp sản xuất phải
luôn tồn trữ một lượng hàng hóa nhất định để đảm bảo việc sản xuất được diễn ra liên tục
và giảm thiểu thiệt hại do biến động giá nguyên vật liệu.
Trong mô hình logit, có 5 trong số 14 biến độc lập có ý nghĩa thống kê, bao gồm các
biến X3, X5, X10, X12 và X14; trong đó biến X12 và X14 có ý nghĩa thống kê tại mức
5%, các biến còn lại có ý nghĩa thống kê tại mức 10%. Do đó, xác suất vỡ nợ được ước
lượng theo mô hình logit có thể được thể hiện như sau:
𝑒𝑌̂ 1+𝑒𝑌̂=
exp(−4,853−71,83𝑋3+12,35𝑋5− 27,47𝑋10+0,731𝑋12−8,847𝑋14) 1+ exp(−4,853−71,83𝑋3+12,35𝑋5− 27,47𝑋10+0,731𝑋12−8,847𝑋14)
P(𝑌𝑖 = 1)=
Trong mô hình probit, 5 biến X3, X5, X10, X12 và X14 cũng là 5 trong số14 biến độc
lập có ý nghĩa thống kê và toàn bộ đều có ý nghĩa thống kê tại mức 5%.Xác suất vỡ nợ
1
𝑡2 2 𝑑𝑡
được ước lượng theo mô hình probit có thể được thể hiện như sau:
− 2,818−4,10𝑋3+6,79𝑋5−1,50𝑋10+3,95𝑋12−4,76𝑋14 −∞
√2𝜋
𝑒 P(𝑌𝑖 = 1) = ∫
Tuy nhiên, trong mô hình complementary log-log, chỉ có 3 trong số 14 biến độc lập có
ý nghĩa thống kê, bao gồm các biến X3, X5 và X10; trong đó biến X10 có ý nghĩa
thống kê tại mức 10%, hai biến còn lại có ý nghĩa thống kê tại mức 5%. Xác suất vỡ nợ
được ước lượng theo mô hình complementary log-log có thể được thể hiện như sau:
F(−2,348 − 50,03𝑋3+ 7,98𝑋5 − 14,91𝑋10) = 1−exp(−exp(−2,348 − 50,03𝑋3+
39
7,98𝑋5 − 14,91𝑋10))
Ma trận Confussion của mô hình tham số
Bảng 4.4: Ma trận Confussion của mô hình logit
Logit Model Predicted class
Non-default Default
Non-default 208 56 Actual class
Default 18 68
Accuracy = 0.7886
Sensitivity = 0.8095
Specificity = 0.7879
Precision = 0.5484
F1 – Score = 0.6538
Bảng 4.5: Ma trận Confusion của mô hình probit
Probit Model Predicted class
Classes Non-default Default
Non-default 218 46
Default 18 68 Actual class
Accuracy = 0.8171
Sensitivity = 0.8095
Specificity = 0.8258
Precision = 0.5965
40
F1 – Score = 0.6869
Bảng 4.6: Ma trận Confusion của mô hình Complementary log-log
cloglog Model Predicted class
Classes Non-default Default
Non-default 84 180
Default 74 12 Actual class
0.7257 Accuracy =
0.8605 Sensitivity =
0.6818 Specificity =
0.4684 Precision =
0.6066 F1 – Score =
Thông qua bảng ma trận confusion của ba mô hình dự báo xác suất vỡ nợ tham số nêu
trên, ta có thể đưa ra một vài nhận xét như sau:
Accuracycủa mô hình probit là cao nhất, tương ứng với tỷ lệ chính xác là 0,8171.
Điều này cho thấy rằng khả năng mô hình probit phân biệt được những công ty phá
sản và không phá sản chính xác lên đến 81,71%.
Sensitivity của mô hình complementary log-log đạt 0,8605 – cao nhất trong ba mô
hình, cho thấy mô hình này có khả năng phát hiện trường hợp các công ty phá sản
chính xác lên đến 86,05%.
Specificitycủa mô hình probit là cao nhất, tương ứng với tỷ lệ chính xác là 0,8258,
cho thấy mô hình này có khả năng phát hiện trường hợp các công ty không bị phá
sản chính xác lên đến 82,58%.
Mặc dù các mô hình có sự khác nhau về Accuracy, Sensitivity, Specificity hay
Precision, nhưng nhìn chung mô hình probit mang lại kết quả tốt nhất khi có F1
41
Score đạt giá trị cao nhất, tương ứng với mức độ dự báo chính xác là 68,69%.
4.2.2 Kết quả hồi quy của mô hình phi tham số
Hình 4.1: Kết quả hồi quy của mô hình cây quyết định (Decision Tree)
Thông qua kết quả hồi quy của mô hình cây quyết định ta có thể thấy rằng mô hình này
sử dụng ba biến X9, X4 và X8 để dự báo xác suất vỡ nợ của doanh nghiệp. Khả năng dự
báo xác suất vỡ nợ qua ba biến độc lập trên được thực hiện thông qua các bước như sau:
- Bước 1: Sử dụng biến độc lập X9 để phân tách thành hai nhóm: phá sản và không
phá sản. Nếu X9≥ 0,55 thì kết luận doanh nghiệp đó rơi vào trường hợp 78% các
công ty có khả năng không bị phá sản. Ngược lại, thì xem xét đến bước tiếp theo.
- Bước 2: Nếu X9 < 0,55 và X4 < - 0,18 thì doanh nghiệp rơi vào nhóm 12% công ty
42
có khả năng bị phá sản. Ngược lại X4 ≥ - 0,18 ta xem xét đến bước tiếp theo.
- Bước 3: Nếu X9 < 0,55 và X4 ≥ - 0,18 và X8 < 0,34 thì doanh nghiệp rơi vào nhóm
3% các công ty có khả năng phá sản. Ngược lại X8 ≥ 0,34 thì doanh nghiệp rơi vào
nhóm 7% các công ty có khả năng không bị phá sản.
Bảng 4.7: Ma trận Confusion của mô hình cây quyết định (Decision Tree)
Decision Tree Predicted class
Classes Non-default Default
Non-default 251 13
Default 41 45 Actual class
Accuracy = 0.8457
Sensitivity = 0.5232
Specificity = 0.9508
Precision = 0.7759
F1 – Score = 0.6250
43
Hình 4.2: Kết quả của mô hình Random Forest
Bảng 4.8: Ma trận Confusion của mô hình Random forest
Random Forest Predicted class
Classes Non-default Default
Non-default 254 10
Default 28 58 Actual class
Accuracy = 0.8914
Sensitivity = 0.6744
Specificity = 0.9621
Precision = 0.8529
F1 – Score = 0.7532
Thông qua bảng ma trận confusion của hai mô hình dự báo xác suất vỡ nợ phi tham số
gồm mô hình cây quyết định và mô hình random forest, ta có thể nhận thấy rằng mô
hình random forest mang lại kết quả tốt hơn khi tất cả chỉ số Accuracy, Sensitivity,
Specificity, Precision và F1 – Score đều cao hơn so với mô hình cây quyết định. Điều
đó cho thấy sự vượt trội của mô hình random forest so với mô hình cây quyết định.
Kết luận chương 4: Chương này tác giả đã thực hiện phân tích kết quả hồi quy từ các mô
hình tham số và phi tham số, đồng thời dựa trên các chỉ tiêu được tính toán từ ma trận
confusion (Accuracy, Sensitivity, Specificity, Precision, F1 - Score) để so sánh và đánh
giá khả năng dự báo xác suất vỡ nợ của từng mô hình. Qua đó tìm ra mô hình phù hợp để
44
dự báo xác suất vỡ nợ của các doanh nghiệp.
CHƯƠNG 5: KẾT LUẬN
Toàn bộ kết quả nghiên cứu của đề tài đã được đề cập trong chương 4 của luận văn, theo
đó tác giả đã tìm được câu trả lời cho ba câu hỏi nghiên cứu được đề cập trong chương 1.
- Để giải quyết câu hỏi thứ nhất, tác giả đã sử dụng 14 biến độc lập tương ứng với 14
chỉ số tài chính quan trọng của doanh nghiệp để xác định khả năng vỡ nợ của các
khách hàng. Kết quả tìm thấy trong mô hình tham số, 5 biến đóng vai trò quan
trọng trong việc dự báo xác suất vỡ nợ của khách hàng, đó là các biến Thu nhập
trước thuế/Tổng tài sản (X3), Tổng nợ phải trả/Tổng tài sản (X5), Thu nhập trước
thuế, lãi vay và khấu hao/Nợ dài hạn (X10), Giá vốn hàng bán/Hàng tồn kho bình
quân (X12) và Tổng doanh thu/Tổng tài sản (X14). Trong khi đó, mô hình phi tham
số lại cho thấy 3 biến gồm Lợi nhuận trước thuế và lãi vay/Lãi vay (X9), Thu nhập
trước thuế/Vốn chủ sở hữu (X4) và (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn
hạn (X8) đóng vai trò quan trọng trong việc phân loại nhóm khách hàng phá sản và
không phá sản.
- Với câu hỏi thứ hai, tác giả đã sử dụng các tiêu chí cụ thể bao gồm: ma trận
confusion và điểm F1 – Score, qua đó lựa chọn mô hình phù hợp để dự báo xác suất
vỡ nợ đối với các doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt
Nam. Kết quả hồi quy trong chương 4 cho thấy mô hình phi tham số random forest
cho kết quả tốt nhất với mức dự báo chính xác lên đến 89,14%. Tuy nhiên, mô hình
này được xem là một trong những mô hình “black box”, vì vậy rất khó xác định
biến độc lập hay chỉ số tài chính nào tác động chính yếu đến khả năng vỡ nợ của
khách hàng. Do đó, các ngân hàng có thể xem xét để sử dụng các mô hình tham số,
đặc biệt là mô hình probit để dự báo xác suất vỡ nợ của khách hàng với mức độ
chính xác khoảng 81,71%, không chênh lệch quá lớn so với mô hình random forest,
nhưng lại giúp ngân hàng biết được các biến độc lập hay chỉ số tài chính nào tác
45
động đến khả năng phá sản của doanh nghiệp.
Trong chương 5 này, tác giả đưa ra một số kiến nghị cho các ngân hàng thương mại tại
Việt Nam, đồng thời nêu lên những mặt hạn chế trong quá trình thực hiện đề tài cũng như
gợi ý những hướng nghiên cứu mở rộng tiếp theo. Cụ thể bao gồm:
5.1 Ứng dụng mô hình để dự báo khả năng trả nợ của các khách hàng doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt Nam
5.1.1 Công cụ hỗ trợ trong việc xác định nhóm đối tượng khách hàng tiềm năng
Luận văn đã tìm ra được mô hình dự báo khả năng trả nợ (xác suất vỡ nợ) của các khách
hàng doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt Nam. Mô hình có thể
hỗ trợ ổn định chất lượng tín dụng, giảm thiểu nợ xấu phát sinh. Các khách hàng được
xếp hạng tín nhiệm đạt chuẩn (xếp hạng từ A trở lên) kết hợp với kết quả đo lường khả
năng trả nợ tốt theo mô hình sẽ có xác suất phát sinh nợ xấu không cao, theo đó rủi ro tín
dụng đối với nhóm khách hàng này nhỏ.
Có thể thấy mô hình là công cụ hỗ trợ cho các ngân hàng thương mại trong hoạt động cấp
tín dụng, đảm bảo chất lượng tín dụng, tạo điều kiện cho quá trình mở rộng và tăng
trưởng hiệu quả, an toàn, bền vững. Từ đó có thể giúp các ngân hàng chọn lọc và duy trì
cơ cấu khách hàng tốt, đẩy mạnh chiến lược marketing hướng tới nhóm các khách hàng ít
rủi ro và phát triển mạng lưới khách hàng có uy tín, đảm bảo khả năng trả nợ.
5.1.2 Kết quả mô hình là cơ sở định hướng chính sách tín dụng
Kết quả của mô hình là cơ sở để các ngân hàng thương mại định hướng thu hẹp tín dụng
đối với nhóm khách hàng yếu kém (xác suất vỡ nợ cao) và tăng trưởng tín dụng hiệu quả
đối với nhóm khách hàng hoạt động tốt (xác suất phá sản thấp). Đồng thời xây dựng chính
sách tín dụng phù hợp từng loại khách hàng về các điều kiện cấp tín dụng, chính sách lãi
suất, phí, yêu cầu về biện pháp bảo đảm,… nhằm đảm bảo an toàn trong hoạt động.
- Nhóm có xác suất vỡ nợ thấp: thực hiện cấp tín dụng với nhiều điều kiện ưu đãi
như áp dụng lãi suất ưu đãi, cấp tín dụng không có bảo đảm bằng tài sản hoặc có
bảo đảm một phần bằng tài sản, không quy định các điều kiện cam kết về các chỉ
46
số tài chính,…
- Nhóm có xác suất vỡ nợ trung bình: cấp tín dụng phù hợp với quy định chung của
ngân hàng, xem xét giảm lãi suất khi khách hàng thế chấp tài sản bảo đảm dưới tỷ
lệ theo quy định của nhóm khách hàng và sản phẩm tín dụng.
- Nhóm có xác suất vỡ nợ cao: không cấp tín dụng mới, thu hẹp dần số dư tín dụng
đã cấp trước đó, trong thời gian cấp tín dụng áp dụng lãi suất cao và ràng buộc
những điều kiện chặt chẽ về chỉ số tài chính hay những yêu cầu khắt khe khác
nhằm giảm thiểu rủi ro khách hàng không trả được nợ.
- Ngoài ra, cần tập trung cấp tín dụng đối với các khách hàng thuộc các ngành kinh
doanh có hiệu quả hoạt động cao, rủi ro vỡ nợ thấp; ngược lại cần có chính sách,
định hướng thu hẹp, tăng cường kiểm soát đối với các khách hàng thuộc nhóm
ngành có hiệu quả sinh lời thấp, rủi ro phá sản cao.
Bên cạnh đó, kết quả hồi quy các mô hình tham số trong Chương 4 cho thấy có 5 biến chỉ
số tài chính có ý nghĩa thống kê và ảnh hưởng lớn đến khả năng vỡ nợ của các doanh
nghiệp vừa và nhỏ, bao gồm Thu nhập trước thuế / Tổng tài sản, Tổng nợ phải trả / Tổng
tài sản, Thu nhập trước thuế, lãi vay và khấu hao / Nợ dài hạn, Giá vốn hàng bán / Hàng
tồn kho bình quân và Tổng doanh thu / Tổng tài sản. Kết quả nghiên cứu thực nghiệm chỉ
ra chỉ số Thu nhập trước thuế / Tổng tài sản, Thu nhập trước thuế, lãi vay và khấu hao/Nợ
dài hạn và Tổng doanh thu/Tổng tài sảncó biến động ngược chiều với khả năng phá sản
của doanh nghiệp, tức khả năng tạo ra doanh thu cũng như lợi nhuận của doanh nghiệp
càng lớn thì khả năng phá sản của doanh nghiệp càng thấp.Ngược lại, các chỉ số Tổng nợ
phải trả/Tổng tài sản và Giá vốn hàng bán/Hàng tồn kho bình quân biến động cùng chiều
với khả năng vỡ nợ của doanh nghiệp; điều này cho thấy rằng một doanh nghiệp nếu sử
dụng nợ vay càng nhiều thì áp lực tài chính càng lớn dẫn đến khả năng phá sản càng cao;
đồng thời nếu doanh nghiệp không có biện pháp quản lý và tích trữ hàng tồn kho phù hợp
thì cũng dễ dẫn đến khả năng vỡ nợ. Thông qua kết quả nghiên cứu trên, các ngân hàng
thương mại có thể sử dụng để đánh giá, lựa chọn khách hàng trong thực tế nhằm giảm
thiểu rủi ro khách hàng không trả được nợ vay.Cụ thể: ưu tiên cấp tín dụng đối với những
doanh nghiệpcó khả năng tạo ra doanh thu, lợi nhuận cao và cẩn trọng phân tích đánh giá
47
trước khi cấp tín dụng đối với các doanh nghiệp sử dụng nợ vay nhiều, khả năng tự chủ
tài chính thấp cũng như xem xét việc quản lý tồn trữ hàng tồn kho đối với các doanh
nghiệp sản xuất có đảm bảo cho hoạt động sản xuất được diễn ra liên tục và giảm thiểu
thiệt hại do biến động giá nguyên vật liệu thường xuyên thay đổi hay không.
Mặt khác thông tin đo lường khả năng trả nợ và kết quả của mô hình còn phản ánh nhiều
vấn đề liên quan đến tình hình hoạt động kinh doanh của doanh nghiệp cũng như lĩnh
vực – ngành sản xuất kinh doanh. Nhờ vậy, mô hình trở thành nguồn cung cấp thông tin
cho các hoạt động phân tích, đánh giá, dự báo và điều hành chính sách tín dụng trong
tương lai.
5.1.3 Vận dụng kết quả mô hình nhằm nâng cao hiệu quả quản lý rủi ro tín dụng ở các
ngân hàng thương mại
Việc dự báo được khả năng trả nợ của khách hàng không những là công cụ hỗ trợ các
ngân hàng trong việc xác định các đối tượng khách hàng tiềm năng mà còn giúp các ngân
hàng nâng cao chất lượng trong việc giám sát và tái xếp hạng khách hàng sau khi cấp tín
dụng. Trên cơ sở kết quả của mô hình, các ngân hàng thương mại có thể kịp thời phát
hiện và có biện pháp ứng xử tín dụng nhanh chóng đối với các khách hàng có vấn đề về
khả năng trả nợ (xác suất vỡ nợ cao), qua đó góp phần hạn chế rủi ro tổn thất mất vốn cho
ngân hàng.
Hiện nay, theo Quyết định số 493/2005/QĐ-NHNN ngày 22/04/2005 về phân loại nợ,
trích lập và sử dụng dự phòng để xử lý rủi ro tín dụng trong hoạt động ngân hàng của các
tổ chức tín dụng; các ngân hàng thương mại tại Việt Nam đa phần vẫn áp dụng việc trích
lập dự phòng theo kết quả phân loại nợ khách hàng, từ đó trích lập dự phòng theo tỷ lệ
phù hợp. Vì vậy, nếu các ngân hàng thương mại có thể dự báo tốt khả năng trả nợ (xác
suất vỡ nợ) của các khách hàng thì việc trích lập dự phòng trở nên dễ dàng hơn nhiều,
theo đó việc xây dựng Quỹ dự phòng rủi ro tín dụng cũng hiệu quả hơn.
5.2 Hạn chế của đề tài và hướng nghiên cứu tiếp theo
5.2.1 Hạn chế của đề tài
48
Ngoài kết quả đạt được luận văn cũng có một số giới hạn và khó khăn nhất định.
Hạn chế nổi bật nhất của nghiên cứu này là tập hợp dữ liệu nhỏ. Do hạn chế về thời gian,
chỉ có 350 doanh nghiệp được thu thập và giới hạn trong 9 lĩnh vực kinh doanh.Số biến
đầu vào là 14, phù hợp với số lượng quan sát. Tuy nhiên, mẫu này được coi là nhỏ, dẫn
đến thiếu các kết quả quan trọng.
Bên cạnh đó, chất lượng nguồn thông tin đầu vào chưa cao. Tuy để đảm bảo chất lượng
của nguồn thông tin, các báo cáo tài chính được thu thập đã được kiểm toán nhưng chất
lượng kiểm toán các báo cáo tài chính tại Việt Nam chưa thực sự minh bạch, rõ ràng và
mang lại hiệu quả cao như ở các nước phát triển. Tại Việt Nam, một doanh nghiệp có
thể lập ba hoặc bốn báo cáo tài chính để phục vụ cho nhiều mục đích khác nhau như gửi
cơ quan thuế, gửi ngân hàng, kiểm toán, kiểm soát nội bộ… Do đó việc kiểm soát, đánh
giá chất lượng thông tin đầu vào của mô hình là rất quan trọng để thu được kết quả
chính xác nhất.
Ngoài ra, mô hình xếp hạng tín nhiệm được đề cập trong luận văn chỉ được xây dựng dựa
trên các chỉ số tài chính, không xét đến các yếu tố phi tài chính như các mô hình xếp hạng
tín dụng nội bộ đang được áp dụng tại các ngân hàng thương mại ở Việt Nam hiện nay.
Trong thực tế, nhiều trường hợp báo cáo tài chính khách hàng cung cấp không phản ánh
đúng, đầy đủ kết quả hoạt động kinh doanh cũng như tình hình tài chính của đơn vị nên
các ngân hàng phải dựa vào các thông tin phi tài chính để sàng lọc, phân loại khách hàng.
5.2.2 Hướng nghiên cứu trong tương lai
Tôi đề xuất nghiên cứu sâu hơn trong các lĩnh vực/khu vực như sau:
Mở rộng tập hợp dữ liệu và khoảng thời gian: Để có được kết quả đáng tin cậy hơn, số
lượng doanh nghiệp được thu thập được mở rộng lên 1.000 doanh nghiệp hoặc thậm chí
cao hơn. Bên cạnh đó, thay vì thu thập báo cáo tài chính hàng năm, có thể thu thập báo
cáo tài chính doanh nghiệp hàng quý để đạt được mức độ chính xác cao hơn.
Ngoài ra, trường hợp số liệu thu thập đủ lớn và có thể phân tách theo từng nhóm khách
hàng thuộc các ngành kinh doanh khác nhau cũng sẽ mang lại kết quả chính xác và phù
hợp với đặc thù hoạt động kinh doanh của từng doanh nghiệp, tăng khả năng ứng dụng
49
của mô hình vào thực tế.
TÀI LIỆU THAM KHẢO
Danh mục tài liệu tham khảo tiếng Việt
Hay Sinh, 2003, “Ước tính xác suất phá sản trong thẩm định giá trị doanh nghiệp”, Tạp
chí Phát triển & Hội nhập – Số 8 (18).
Lê Đạt Chí và Lê Tuấn Anh (2012), “Kết hợp phương pháp Cvar và mô hình
Merto/KMV để đo lường rủi ro vỡ nợ: Bằng chứng thực nghiệm ở Việt Nam”, Tạp chí
Phát triển & Hội nhập – Số 5 (15).
Lê Nguyễn Sơn Vũ, 2013, Quyết định đầu tư và rủi ro phá sản của các công ty niêm yết
trên thị trường chứng khoán Việt Nam, Luận văn thạc sĩ kinh tế, Trường Đại học Kinh tế
Thành phố Hồ Chí Minh.
Nguyễn Thị Tuyết Lan, 2019, “Các nhân tố ảnh hưởng đến rủi ro phá sản của các doanh
nghiệp niêm yết ngành xây dựng tại Việt Nam”, Tạp chí Khoa học & Đào tạo Ngân
hàng – Số 205.
Võ Hồng Đức và Nguyễn Đình Thiên (2013a), “XHTN doanh nghiệp niêm yết tại Việt
Nam sử dụng lý thuyết mờ”,Tạp chí Phát triển kinh tế - Số 269.
Danh mục tài liệu tham khảo tiếng Anh
Altman, Edward I, 1968. Financial Ratios, Discriminant Analysis and the Prediction of
Corporate Bankruptcy. Journal of Finance, 189-209.
Beaver, 1996. Financial Ratios As Predictors of Failure. Journal of Accounting
Research,71-111.
Brieman, 1980. Classification and regression trees. Chapman and Hall.
Dombolena, I. and S. Khoury, 1980. Ratio Stability and Corporate Failure. Journal of
Finance, 1017-1026.
Evridiki Neophytou, Andreas Charitou and Chris Charalambous, 2000. Predicting
Corporate Failure: Empirical Evidence for the UK. Journal of Accounting Literature.
Fisher, R. 1936.The Use of Multiple Measurements in Taxonomic Problems.Annals of
50
Eugenics 7,179-188.
Fitzpatrick, F., 1932.A Comparison of Ratios of Successful Industrial Enterprises with
Those of Failed Firm. Certified Public Accountant, 6, 727-731.
HaydenEvelyn and Daniel Porath, 2010.Statistical Methods to Develop Rating Models.
The Basel II Risk Parameters, 1-12.
HaydenEvelyn, 2010. Estimation of a Rating Model for Corporate Exposures. The Basel
II Risk Parameters, 13-24.
Ho Tin Kam, 1995. Random Decision Forests, Proceedings of the 3rd International
Conference on Document Analysis and Recognition, Montreal, 278-282.
Leo Breiman, Jerome Friedman and Charles J. Stone, 1984. Classification and
Regression Trees. R.A. Olshen.
M. Fernandez Delgado, E. Cernadas, S. Barro and D. Amorim, 2014.Do we Need
Hundreds of Classifiers to Solve Real Worls Classification problems?. Journal of
Machine Learning Research.
Myers and Forgy, 1963. The development of numerical credit evaluation system. Journal
of the American Statistical Association, 799-806.
Odom and Sharda,1993. A Neural Network for Bankruptcy Prediction. International
Joint Conference on Neural Networks, 163-168.
Ong, M. 2005, Internal Credit Risk Models Capital Allocation and Performance
Measurement, Risk Books .
Oslo. Hosmer, D. W., Jovanovic, B., and Lemeshow, S., 1989.Best subsets logistic
regression, Biometrics, 1265-1270.
Patcha, A. and Park, J.M, 2009. An overview of outlier detection techniques: Existing
solutions and latest technological trends. Computer Networks 3448-3470
Platt, H.D., 1991. Predicting corporate financial distress: Reflections on choice-based
sample bias. Journal of Economics and Finance 2002.
Rajan R, Zingales L. What do we know about capital structure? some evidence from
51
international data. Journal of Finance 1995; 1421-1460.
Serrasqueiroand Macas Nunes. Non-linear relationships between growth opportunities
and debt: Evidence from quoted Portuguese companies. J Business Research 2009,870-
878.
Stehman and Stephen, 1997. Selecting and interpreting measures of thematic
classification accuracy. Remote Sensing of Environment, 77-89.
Sudhakar, M., and Reddy C.V.K. Two Step Credit Risk Assessment Model For
Retail Bank Loan Applications Using Decision Tree Data Mining Technique.
International Journal of Advanced Research in Computer Engineering & Technology
2016, 705-718.
Svetnik 2003. Random Forest:A Classification and Regression Tool for Compound
Classification and QSAR Modeling. Journal of Chemical Information Computer
52
Science, 1947–1958.
PHỤ LỤC
Bảng 01: Các biến đầu vào của RiskCalcTM - mô hình công ty tư nhân Nhật Bản
Chỉ số tài chính Cách tính
Khả năng sinh lời Lợi nhuận thuần từ hoạt động kinh doanh
trên tổng tài sản
Đòn bẩy tài chính Tổng nợ trên tổng tài sản
Khả năng thanh khoản Tiền mặt trên tài sản ngắn hạn
Khả năng trả nợ gốc Thu nhập giữ lại trên nợ ngắn hạn
Khả năng trả lãi vay Lợi nhuận gộp trên tổng chi phí lãi vay
Quy mô Tổng doanh thu
Chỉ số hoạt động Tổng hàng tồn kho trên tổng doanh thu
53
Nguồn: Báo cáo của Moody: RiskCalc for Japanese private companies, 2001
Bảng 02: Biến đầu vào được lựa chọn bởi Engelmann and Rauhmeier
Chỉ số tài chính Yếu tố rủi ro
Tổng nợ phải trả / Tổng tài sản
Vốn chủ sở hữu / Tổng tài sản Đòn bẩy tài chính
Nợ ngân hàng / Tổng tài sản
Nợ ngắn hạn/ Tổng tài sản Khả năng
thanh khoản Tài sản ngắn hạn / Nợ ngắn hạn
Các khoản phải thu / Doanh thu thuần Chỉ số hoạt động Các khoản phải trả / Doanh thu thuần
Khả năng kiểm soát (Doanh thu thuần - Chi phí nguyên liệu) / Chi phí nhân công chi phí
Hiệu quả sử dụng Doanh thu thuần / Tổng tài sản tài sản
Lợi nhuận trước thuế và lãi vay / Tổng tài sản Khả năng sinh lời Lợi nhuận thuần từ hoạt động kinh doanh / Tổng tài sản
Tổng tài sản Quy mô
Doanh thu thuần / Doanh thu thuần năm liền kề Tốc độ tăng trưởng
Tốc độ gia tăng Tổng nợ phải trả / Tổng nợ phải trả năm liền kề nợ vay
54
Nguồn: Báo cáo của Risk Parameter, 2010