BỘ GIÁO DỤC VÀ ĐÀO TẠO

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP.HỒ CHÍ MINH

NGUYỄN LỆ ĐOAN TRANG

LỰA CHỌN MÔ HÌNH DỰ BÁO XÁC SUẤT VỠ NỢ

CỦA DOANH NGHIỆP VỪA VÀ NHỎ TẠI CÁC

NGÂN HÀNG THƯƠNG MẠI VIỆT NAM

DỰA TRÊN CÁC CHỈ SỐ TÀI CHÍNH

LUẬN VĂN THẠC SĨ KINH TẾ

TP. HỒ CHÍ MINH - NĂM 2019

BỘ GIÁO DỤC VÀ ĐÀO TẠO

NGÂN HÀNG NHÀ NƯỚC VIỆT NAM

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP.HỒ CHÍ MINH

NGUYỄN LỆ ĐOAN TRANG

LỰA CHỌN MÔ HÌNH DỰ BÁO XÁC SUẤT VỠ NỢ

CỦA DOANH NGHIỆP VỪA VÀ NHỎ TẠI CÁC

NGÂN HÀNG THƯƠNG MẠI VIỆT NAM

DỰA TRÊN CÁC CHỈ SỐ TÀI CHÍNH

LUẬN VĂN THẠC SĨ KINH TẾ

Chuyên ngành: Tài chính - Ngân hàng

Mã số: 8 34 02 01

Người hướng dẫn khoa học: TS. NGÔ VI TRỌNG

TP. HỒ CHÍ MINH - NĂM 2019

LỜI CAM ĐOAN

Luận văn này chưa từng được trình nộp để lấy học vị thạc sĩ tại bất cứ một trường

đại học nào. Luận văn này là công trình nghiên cứu riêng của tác giả, kết quả nghiên

cứu là trung thực, trong đó không có các nội dung đã được công bố trước đây hoặc các

nội dung do người khác thực hiện ngoại trừ các trích dẫn được dẫn nguồn đầy đủ trong

luận văn.

TP Hồ Chí Minh ngày …. Tháng …. năm 2019

Tác giả luận văn

i

Nguyễn Lệ Đoan Trang

LỜI CẢM ƠN

Để hoàn thành luận văn thạc sĩ kinh tế này, tôi xin gửi lời cảm ơn sâu sắc đến

giảng viên hướng dẫn khoa học: Tiến sĩ Ngô Vi Trọng, đã tận tình hướng dẫn tôi trong

suốt quá trình hoàn thiện luận văn. Đồng thời tôi cũng xin gửi lời cảm ơn trân trọng đến

các thầy cô giáo Trường Đại học Ngân hàng TP Hồ Chí Minh đã tận tình truyền đạt kiến

thức trong 2 năm học tập, vốn kiến thức được trang bị trong quá trình học là kiến thức nền

tảng cho quá trình nghiên cứu đề tài. Cuối cùng kính chúc các thầy cô sức khỏe và thành

công trong sự nghiệp cao quý.

ii

Xin chân thành cảm ơn!

TÓM TẮT

Hệ thống xếp hạng tín dụng nội bộ luôn đóng vai trò quan trọng tại các NHTM

trong việc đánh giá mức độ rủi ro tín dụng của khách hàng đồng thời hỗ trợ ngân hàng

trong việc ra quyết định tín dụng cũng như trong các hoạt động quản trị rủi ro tại ngân

hàng. Đồng thời, Chính Phủ đã và đang xây dựng hành lang pháp lý đối với lĩnh vực

XHTN nhằm nâng cao tính công khai minh bạch thông tin hỗ trợ cho các ngân hàng kiểm

soát được rủi ro tín dụng ngay từ đầu cũng như hỗ trợ thị trường chứng khoán, thị trường

trái phiếu thúc đẩy huy động vốn thông qua thị trường chứng khoán, bảo vệ quyền và lợi

ích của nhà đầu tư. Việc nghiên cứu và lựa chọn các mô hình xếp hạng phù hợp sẽ đóng

góp rất nhiều đến sự phát triển của hoạt động xếp hạng tín nhiệm ở Việt Nam. Tuy nhiên,

các mô hình dự báo xác suất vỡ nợ hiện nay đều có những hạn chế nhất định và đang có

nhiều tranh luận, không thống nhất về mức độ tin cậy của các mô hình này dẫn đến sự

khó khăn trong việc lựa chọn mô hình phù hợp để dự báo xác suất vỡ nợ của doanh

nghiệp. Bên cạnh đó, việc xác định các chỉ số tài chính nào thực sự tác động đến kết quả

xếp hạng luôn là mục tiêu, vấn đề cần nghiên cứu trong các công trình nghiên cứu về dự

báo xác suất vỡ nợ. Cho đến nay, hiện vẫn chưa có nhiều nghiên cứu được công bố tại

Việt Nam về việc lựa chọn mô hình dự báo xác suất vỡ nợ của các doanh nghiệp dựa

trên các chỉ số tài chính.

Trên cơ sở của tầm quan trọng và mức độ cần thiết, mục tiêu của nghiên cứu này

nhằm: (i) xác định các tiêu chí của một mô hình dự báo phù hợp; (ii) cách lựa chọn mô

hình có khả năng dự báo xác suất vỡ nợ của doanh nghiệp vừa và nhỏ tại các NHTM Việt

Nam dựa trên các chỉ số tài chính. Kết quả đạt được từ nghiên cứu này hướng đến việc

cung cấp thêm những bằng chứng khoa học định lượng nhằm trả lời câu hỏi mô hình dự

báo nào mang lại kết quả tốt nhất trong việc dự báo xác suất vỡ nợ của các doanh nghiệp

iii

vừa và nhỏ tại các NHTM Việt Nam.

Đóng góp quan trọng nhất của nghiên cứu này là đề ra ý tưởng cơ bản trong việc

sử dụng các chỉ tiêu tài chính để dự báo xác suất vỡ nợ của các doanh nghiệp vừa và nhỏ,

qua đó góp phần nâng cao hiệu quả trong công tác kiểm soát rủi ro tín dụng của các

iv

NHTM ở Việt Nam trong thời gian tới.

MỤC LỤC

DANH MỤC CÁC BẢNG ..................................................................................... viii

DANH MỤC HÌNH .................................................................................................. ix

DANH MỤC TỪ VIẾT TẮT .................................................................................... x

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN ............................................................. 1

1.1 Tính cấp thiết của đề tài .............................................................................. 1

1.2 Vấn đề nghiên cứu ....................................................................................... 3

1.3 Mục tiêu nghiên cứu .................................................................................... 3

1.4 Câu hỏi nghiên cứu ...................................................................................... 4

1.5 Đối tượng và phạm vi nghiên cứu .............................................................. 4

1.6 Phương pháp nghiên cứu ............................................................................ 4

1.7 Đóng góp của đề tài ...................................................................................... 5

1.8 Cấu trúc của luận văn .................................................................................. 5

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU TRƯỚC ĐÂY ... 8

2.1 Xếp hạng tín nhiệm .......................................................................................... 8

2.2 Xác suất vỡ nợ (PD) ......................................................................................... 9

2.3 Khảo lược các mô hình dự báo xác suất vỡ nợ của doanh nghiệp ............ 10

2.4 Tổng quan các nghiên cứu trước .................................................................. 16

2.4.1 Các nghiên cứu trên thế giới ...................................................................... 16

v

2.3.2 Các nghiên cứu tại Việt Nam ..................................................................... 18

CHƯƠNG 3: MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU ........................ 21

3.1 Phương pháp xây dựng các mô hình ............................................................ 21

3.2 Thu thập và xử lý dữ liệu............................................................................... 22

3.3 Lựa chọn các biến đầu vào trong mô hình dự báo xác suất vỡ nợ ............ 24

3.4 Các mô hình dự báo xác suất vỡ nợ được nghiên cứu ................................ 27

3.4.1 Mô hình tham số ........................................................................................ 27

3.4.2 Mô hình phi tham số .................................................................................. 29

3.5 Phương pháp lựa chọn mô hình dự báo xác suất vỡ nợ ............................. 31

3.5.1 Ma trận Confussion .................................................................................... 31

3.5.2 Điểm số F1 (F1-score) ............................................................................... 34

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU .............................................................. 35

4.1 Kết quả thống kê mô tả .................................................................................. 35

4.2. Kết quả hồi quy ............................................................................................. 37

4.2.1 Kết quả hồi quy của các mô hình tham số ................................................. 37

4.2.2 Kết quả hồi quy của mô hình phi tham số ................................................. 42

CHƯƠNG 5: KẾT LUẬN ....................................................................................... 45

5.1 Ứng dụng mô hình để dự báo khả năng trả nợ của các khách hàng doanh

nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt Nam ........................ 46

5.1.1 Công cụ hỗ trợ trong việc xác định nhóm đối tượng khách hàng tiềm năng

............................................................................................................................ 46

5.1.2 Kết quả mô hình là cơ sở định hướng chính sách tín dụng ....................... 46

5.1.3 Vận dụng kết quả mô hình nhằm nâng cao hiệu quả quản lý rủi ro tín dụng

vi

ở các ngân hàng thương mại ............................................................................... 48

5.2 Hạn chế của đề tài và hướng nghiên cứu tiếp theo ..................................... 48

5.2.1 Hạn chế của đề tài ...................................................................................... 48

5.2.2 Hướng nghiên cứu trong tương lai ............................................................ 49

TÀI LIỆU THAM KHẢO ....................................................................................... 50

vii

PHỤ LỤC

DANH MỤC CÁC BẢNG

Số thứ tự Tên bảng Trang

Bảng 2.1 Khảo lược các mô hình xếp hạng tín nhiệm dự báo xác suất vỡ nợ 11

Bảng 3.1 Tổng hợp số lượng doanh nghiệp – ngành nghề kinh doanh 24

Bảng 3.2 Phân tách các công ty phá sản và không phá sản 25

Bảng 3.3 Các biến độc lập trong mô hình dự báo xác suất vỡ nợ 29

Bảng 3.4 Cấu trúc dữ liệu các biến trong mô hình Logit 30

Bảng 3.5 Ma trận Confussion 34

Bảng 4.1 Thống kê mô tả các biến độc lập 38

Bảng 4.2 Ma trận tương quan 39

Bảng 4.3 Kết quả hồi quy của các mô hình tham số 40

Bảng 4.4 Ma trận Confussion của mô hình logit 43

Bảng 4.5 Ma trận Confusion của mô hình probit 43

Bảng 4.6 Ma trận Confusion của mô hình Complementary log-log 44

Bảng 4.7 Ma trận Confusion của mô hình cây quyết định(Decision Tree) 46

viii

Bảng 4.8 Ma trận Confusion của mô hình Random forest 47

DANH MỤC HÌNH

Số thứ tự Nội dung Trang

Hình 3.1 Mô phỏng mô hình cây quyết định 32

Hình 3.2 Mô phỏng mô hình random forest 33

Hình 4.1 Kết quả hồi quy của mô hình cây quyết định (Decision Tree) 45

ix

46 Hình 4.2 Kết quả của mô hình Random Forest

DANH MỤC TỪ VIẾT TẮT

BCTC Báo cáo tài chính

BLĐ Ban lãnh đạo

HCM Hồ Chí Minh

KHDN Khách hàng doanh nghiệp

NHNN Ngân hàng nhà nước

NHTM Ngân hàng thương mại

TCTD Tổ chức tín dụng

TP Thành phố

XHTN Xếp hạng tín nhiêm

VCSH Vốn chủ sở hữu

VN Việt Nam

x

VVN Vừa và nhỏ

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

1.1 Tính cấp thiết của đề tài

Hệ thống xếp hạng tín dụng nội bộ luôn đóng vai trò quan trọng tại các NHTM trong việc

đánh giá mức độ rủi ro tín dụng của khách hàng đồng thời hỗ trợ ngân hàng trong việc ra

quyết định tín dụng cũng như trong các hoạt động quản trị rủi ro tại ngân hàng. Tại Việt

Nam, các NHTM đang ngày càng nhận thấy tầm quan trọng của hệ thống này trong hoạt

động tín dụng và quản trị rủi ro của ngân hàng, đặc biệt trong giai đoạn các NHTM Việt

Nam đang cố gắng để đáp ứng các tiêu chuẩn của Basel II.

Trong bối cảnh đó, tính cấp thiết của đề tài nghiên cứu này được thể hiện ở các khía cạnh

cụ thể như sau:

Thứ nhất, các mô hình XHTN hiện nay đều có những hạn chế nhất định và đang có

nhiều tranh luận, không thống nhất về mức độ tin cậy của các mô hình XHTN dẫn đến sự

khó khăn trong việc lựa chọn mô hình XHTN phù hợp để dự báo xác suất vỡ nợ của

doanh nghiệp (Huseyin &Bora, 2009). Theo nghiên cứu của Aysegul Iscanoglu, 2005

cũng như Hayden& Daniel, 2010 đã nêu ra nhiều mô hình nghiên cứu trong lĩnh vực

XHTN như mô hình phân tích phân biệt (discriminant analysis), mô hình Logit (logistic

regression), mô hình hình cây (decision tree), mô hình mạng thần kinh nhân tạo (artificial

neural networks – ANN), mô hình Probit regression... với các ưu và nhược điểm của

từng mô hình. Thực tế, đã có nhiều phân tích chuyên sâu về các mô hình nêu trên. Platt

(1991) đã sử dụng mô hình Logit trong kiểm định, lựa chọn các biến tài chính và cho

rằng việc sử dụng các biến tài chính trung bình của ngành tốt hơn sử dụng những biến tài

chính của một doanh nghiệp đơn lẻ trong dự báo phá sản của doanh nghiệp. Lawrence

(1992) sử dụng mô hình Logit dự báo xác suất vỡ nợ của những khoản vay có thế chấp.

Altman (1968) đã sử dụng mô hình phân tích phân biệt tìm một hàm tuyến tính của các

biến tài chính và thị trường để có thể phân biệt một cách tốt nhất giữa 2 loại doanh

nghiệp vỡ nợ và không vỡ nợ…

Thứ hai, việc xác định các chỉ số tài chính nào thực sự tác động đến kết quả xếp hạng

1

luôn là mục tiêu, vấn đề cần nghiên cứu trong các công trình nghiên cứu về dự báo xác

suất vỡ nợ. Trong giai đoạn 1926 – 1936, các nhà nghiên cứu chỉ sử dụng chỉ số tài

chính cơ bản để xếp hạng kèm một số chỉ số khác như Ramser &Foster (1931) với chỉ

số vốn chủ sở hữu/tổng doanh thu thuần hay Fitzpatrick (1932) sử dụng chỉ số vốn chủ

sở hữu/tài sản cố định. Giai đoạn tiếp theo, Altman (1968) sử dụng 5 chỉ số tài chính

trong mô hình phân tích phân biệt để dự báo khả năng vỡ nợ của các doanh nghiệp gồm

vốn chủ sở hữu/giá trị sổ sách của các khoản nợ, doanh thu thuần/tổng tài sản, thu nhập

hoạt động kinh doanh/tổng tài sản, lợi nhuận sau thuế/tổng tài sản và vốn lưu động/tổng

tài sản. Cũng sử dụng mô hình phân tích phân biệt nhưng Deakin (1972) lại chọn 14

biến tài chính sau: tiền mặt/nợ ngắn hạn, dòng tiền thực/tổng nợ, tiền mặt/doanh thu

thuần, tiền mặt/tài sản cố định, hệ số khả năng thanh toán hiện hành, tài sản ngắn

hạn/doanh thu thuần, tài sản ngắn hạn/tổng tài sản, thu nhập/tổng tài sản, tài sản có tính

thanh khoản cao/nợ ngắn hạn, tài sản có tính thanh khoản cao/doanh thu thuần, tài sản

có tính thanh khoản cao/tổng tài sản, tổng nợ phải trả/tổng tài sản, vốn lưu động/doanh

thu thuần, vốn lưu động/tổng tài sản. Theo thời gian, các nhà khoa học đã tìm thêm

nhiều chỉ số tài chính có khả năng tác động đến kết quả XHTN như Blum (1974) sử

dụng các biến tài chính gồm tỷ suất lợi nhuận của thị trường, hệ số khả năng thanh toán

nhanh, tài sản có tính thanh khoản cao/hàng tồn kho,dòng tiền/tổng nợ phải trả, giá trị sổ

sách của tài sản/tổng nợ phải trả, xu hướng giảm của lợi nhuận, xu hướng giảm của tài

sản có tính thanh khoản cao/hàng tồn kho hay Back, Laitinen, Sere & Wesel (1996) sử

dụng 31 chỉ số khác nhau.

Thứ ba, hiện tại phương pháp xếp hạng tại các ngân hàng ở Việt Nam còn mang tính

chủ quan, định tính, dựa trên đánh giá – kinh nghiệm của các cán bộ tín dụng trực tiếp

quản lý khách hàng (phương pháp chuyên gia), do đó chỉ hỗ trợ cho việc ra quyết định

cấp tín dụng, không phải là cơ sở để ra quyết định, vì chưa có cơ sở khoa học có độ tin

cậy cao để dự báo khả năng phá sản của các doanh nghiệp. Cho đến nay, hiện vẫn chưa

có nhiều nghiên cứu được công bố tại Việt Nam về việc lựa chọn mô hình dự báo xác

suất vỡ nợ của các doanh nghiệp dựa trên các chỉ số tài chính.

Thứ tư, Chính Phủ đã và đang xây dựng hành lang pháp lý đối với lĩnh vực XHTN nhằm

2

nâng cao tính công khai minh bạch thông tin hỗ trợ cho các ngân hàng kiểm soát được rủi

ro tín dụng ngay từ đầu cũng như hỗ trợ thị trường chứng khoán, thị trường trái phiếu thúc

đẩy huy động vốn thông qua thị trường chứng khoán, bảo vệ quyền và lợi ích của nhà đầu

tư. Việc nghiên cứu và lựa chọn các mô hình xếp hạng phù hợp sẽ đóng góp rất nhiều đến

sự phát triển của hoạt động xếp hạng tín nhiệm ở Việt Nam. Cụ thể,Chính Phủ đã ban

hành Nghị định số 88/2014/NĐ-CP ngày 26/09/2014 quy định về dịch vụ XHTN, điều

kiện hoạt động của doanh nghiệp XHTN được thành lập và hoạt động tại Việt Nam; đồng

thời theo Quyết định phê duyệt quy hoạch phát triển dịch vụ xếp hạng tín nhiệm đến 2020

và tầm nhìn đến 2030 của Thủ tướng Chính phủ số 507/QĐ-TTg ngày 17/04/2015, việc

phát hành trái phiếu doanh nghiệp sẽ phải được xếp hạng tín nhiệm kể từ năm 2020.

Rõ ràng, việc lựa chọn được mô hình dự đoán xác suất vỡ nợ doanh nghiệp dựa trên các

chỉ số tài chính phù hợp được đề cập là một trong những biện pháp quản lý kiểm soát rủi

ro tín dụng của các NHTM Việt Nam nhằm phân loại sàng lọc khách hàng ngay từ đầu và

kiểm soát rủi ro vỡ nợ của ngân hàng theo khuyến cáo của Ủy ban Basel (Basel II, 2004).

Chính vì vậy, bài luận văn tập trung nghiên cứu vấn đề “Lựa chọn mô hình dự báo xác

suất vỡ nợ của doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại Việt Nam

dựa trên các chỉ số tài chính” nhằm cung cấp cho các NHTM một cách có hệ thống cơ

sở lý luận và minh chứng thực nghiệm liên quan đến việc lựa chọn mô hình dự báo khả

năng phá sản doanh nghiệp phù hợp để góp phần nâng cao hiệu quả trong công tác kiểm

soát rủi ro tín dụng của ngân hàng trong thời gian tới.

1.2 Vấn đề nghiên cứu

Lựa chọn mô hình phù hợp dự báo xác suất vỡ nợ của các doanh nghiệp vừa và nhỏ tại

các NHTM Việt Nam dựa trên các chỉ số tài chính trong giai đoạn từ năm 2016 – 2018.

1.3 Mục tiêu nghiên cứu

Trên cơ sở xác định các tiêu chí của một mô hình dự báo phù hợp và cách lựa chọn mô

hình, từ đó bài nghiên cứu sẽ tiến hành lựa chọn mô hình có khả năng dự báo xác suất vỡ

nợ của doanh nghiệp vừa và nhỏ tại các NHTM Việt Nam dựa trên các chỉ số tài chính

trong giai đoạn từ năm 2016 – 2018. Thông qua đó giúp các ngân hàng thương mại sàng

3

lọc khách hàng và kiểm soát rủi ro tín dụng tốt hơn.

1.4 Câu hỏi nghiên cứu

Nhằm đạt được mục tiêu nêu trên, bài nghiên cứu đã đặt ra các câu hỏi nghiên cứu sau:

(i) Các chỉ số tài chính nào ảnh hưởng lớn đến việc lựa chọn mô hình dự báo xác

suất vỡ nợ của các doanh nghiệp vừa và nhỏ?

(ii) Mô hình nào mang lại kết quả tốt nhất trong việc dự báo xác suất vỡ nợ của các

doanh nghiệp vừa và nhỏ?

1.5 Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu của luận văn là xác suất vỡ nợ của khách hàng doanh nghiệp vừa

và nhỏ tại các NHTM Việt Nam.Doanh nghiệp vừa và nhỏ là doanh nghiệp đáp ứng một

trong hai tiêu chí sau: (i) tổng nguồn vốn không quá 100 tỷ đồng; (ii) tổng doanh thu của

năm trước liền kề không quá 500 tỷ đồng.

Phạm vi nghiên cứu: bài nghiên cứu thu thập các chỉ số tài chính từ các báo cáo tài

chính của các doanh nghiệp vừa và nhỏ tại các NHTM Việt Nam trong giai đoạn từ

2016 – 2018.

1.6 Phương pháp nghiên cứu

Luận văn sử dụng phương pháp kết hợp phương pháp nghiên cứu định tính và nghiên cứu

định lượng. Trong đó:

Phương pháp nghiên cứu định tính: Thảo luận về quan điểm, nhận thức đánh giá của các

NHTM về vấn đề XHTN khách hàng doanh nghiệp vừa và nhỏ tại các NHTM ở Việt

Nam. Tìm hiểu và nghiên cứu các yếu tố ảnh hưởng đến kết quả XHTN khách hàng

doanh nghiệp vừa và nhỏ ở các NHTM tại Việt Nam. Từ đó xây dựng các thang đo lường

để thực hiện nghiên cứu định lượng.

Phương pháp nghiên cứu định lượng: xác định lại các yếu tố tài chính ảnh hưởng và đo

lường mức độ tác động của từng yếu tố đến kết quả XHTN khách hàng doanh nghiệp vừa

và nhỏ tại các NHTM ở Việt Nam. Sử dụng phương pháp hồi quy để xây dựng mô hình

4

XHTN bao gồm các phương pháp logit, probit. Bên cạnh đó, luận văn cũng sử dụng mô

hình xếp hạng theo phương pháp cây quyết định (Decision tree) và phương pháp Random

Forest để đánh giá hạng tín nhiệm của các doanh nghiệp vừa và nhỏ.

Ngoài ra, luận văn sử dụng kết hợp các phương pháp bao gồm: Phương pháp thống kê mô

tả nhằm tổ chức dữ liệu theo các đặc tính cần mô tả; Phương pháp so sánh đối chiếu giữa

mô hình và thực tiễn để để đưa ra kết luận; Phương pháp phân tích tổng hợp để tổng hợp

và phân tích dữ liệu liên quan trong quá trình nghiên cứu.

1.7 Đóng góp của đề tài

Kết quả nghiên cứu của luận văn có ý nghĩa khoa học và thực tiễn được thể hiện trên các

khía cạnh chủ yếu sau:

Phân tích một cách có hệ thống và đầy đủ những lý luận cơ bản, hệ thống các lý thuyết

nền liên quan đến các mô hình dự báo xác suất vỡ nợ và tiêu chí lựa chọn mô hình phù

hợp. Trên cơ sở đó, bài nghiên cứu cung cấp một cách khá đầy đủ và toàn diện những

công trình nghiên cứu đã được công bố để thấy rõ những khoảng trống trong các nghiên

cứu trước đây liên quan đến việc lựa chọn mô hình phù hợp nhất để dự báo khả năng phá

sản của các doanh nghiệp vừa và nhỏ tại các NHTM Việt Nam dựa trên các chỉ số tài

chính. Đây chính là cơ sở quan trọng giúp các nhà nghiên cứu có thể tiếp tục triển khai

các nghiên cứu có liên quan khác.

Trên cơ sở các vấn đề và kết quả nghiên cứu được tìm thấy, bài nghiên cứu đề xuất lựa

chọn mô hình XHTN phù hợp, có khả năng dự báo xác suất vỡ nợ cho các doanh nghiệp

vừa và nhỏ tại các NHTM Việt Nam dựa trên các chỉ số tài chính góp phần nâng cao

hiệu quả trong công tác kiểm soát rủi ro tín dụng của các NHTM ở Việt Nam trong thời

gian tới.

1.8 Cấu trúc của luận văn

Cấu trúc luận văn gồm 5 chương từ giới thiệu tổng quan, đưa ra cở sở lý thuyết và các

nghiên cứu trước đây, mô hình xếp hạng tín nhiệm, sau đó tiến hành phân tích kết quả và

5

cuối cùng là một số trao đổi kèm kiến nghị, chi tiết cụ thể như sau:

Chương 1 (Giới thiệu tổng quan) trình bày về tính cấp thiết của đề tài, vấn đề nghiện

cứu, mục tiêu nghiên cứu, câu hỏi nghiên cứu, đối tượng và phạm vi nghiên cứu, phương

pháp nghiên cứu, đóng góp của đề tài và cấu trúc của luận văn nhằm cung cấp cho người

đọc một bức tranh tổng thể về toàn bộ bài nghiên cứu.

Chương 2 (Cơ sở lý thuyết và các nghiên cứu trước đây) trình bày những lý luận cơ

bản và các lý thuyết nền liên quan đến xếp hạng tín dụng, xác suất vỡ nợ của các doanh

nghiệp và phương pháp đo lường, dự báo các nội dung này cũng như kết quả đánh giá các

nghiên cứu trước đây đã được công bố để làm rõ tính cấp thiết của đề tài, đồng thời cung

cấp cơ sở cho việc tiến hành đề xuất mô hình nghiên cứu và phân tích kết quả nghiên cứu

được trình bày ở các chương tiếp theo.

Chương 3 (Mô hình và phương pháp nghiên cứu) trình bày chi tiết nội dung của mô

hình nghiên cứu – mô hình dự báo xác suất vỡ nợ được đề xuất, mô tả chi tiết các dữ liệu

đã thu thập và các phương pháp nghiên cứu được sử dụng để cho thấy mức độ tin cậy của

kết quả nghiên cứu được trình bày ở chương tiếp theo. Mô hình dự báo xác suất vỡ nợ

được đề xuất sử dụng bao gồm mô hình tham số (với các mô hình logit, probit,

complementary log-log) và mô hình phi tham số (gồm mô hình cây quyết định decision

tree, mô hình random forest).

Chương 4 (Kết quả nghiên cứu) phân tích kết quả hồi quy từ các mô hình tham số và

phi tham số, đồng thời dựa trên các chỉ tiêu được tính toán từ ma trận confusion

(Accuracy, Sensitivity, Specificity, Precision, F1 - Score) để so sánh và đánh giá khả năng

dự báo xác suất vỡ nợ của từng mô hình.

Chương 5 (Kết luận và kiến nghị) tổng kết các kết quả đạt được của bài luận văn, từ

đó đề xuất các giải pháp giúp các ngân hàng thương mại nâng cao khả năng dự báo xác

suất vỡ nợ của các doanh nghiệp vừa và nhỏ, theo đó kịp thời có các chính sách định

hướng cũng như điều chỉnh hoạt động cấp tín dụng của các NHTM để đạt hiệu quả cao

hơn và giảm thiểu rủi ro tín dụng, đảm bảo an toàn vốn. Ngoài ra, bài luận văn cũng gợi

6

ý một số hàm ý chính sách quản trị cho chính các doanh nghiệp để giảm thiểu rủi ro phá

sản. Thêm vào đó, bài luận văn cũng đưa ra những hạn chế và các vấn đề còn tồn tại, từ

7

đó đề xuất các hướng nghiên cứu tiếp theo.

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU

TRƯỚC ĐÂY

2.1 Xếp hạng tín nhiệm

Thuật ngữ “xếp hạng tín nhiệm” (XHTN) lần đầu tiên được đưa ra bởi John Moody

năm 1900 trong ấn phẩm “Moody’s Manual of Industrial and Miscellaneous Securities”

khi cho rằng XHTN là ý kiến về khả năng và sự sẵn sàng của một đơn vị trong việc

thanh toán đúng hạn cho một khoản nợ nhất định trong suốt thời hạn tồn tại của khoản

nợ. Hệ thống xếp hạng trình bày trong báo cáo này được ký hiệu gồm 3 chữ cái ABC

được xếp hạng lần lượt là AAA (mức ổn định cao nhất) đến C (mức rủi ro cao nhất).

Kể từ đó đến nay, việc sử dụng XHTN trở nên rất phổ biến và đa dạng về mục đích

cũng như đối tượng xếp hạng, theo đó cách nhìn nhận cũng như quan điểm về XHTN

đã có nhiều thay đổi.

Theo Michael K.Ong (2003), XHTN là một tiến trình đánh giá và phân loại mức độ tín

nhiệm tương ứng với các cấp độ rủi ro khác nhau, mỗi kết quả xếp hạng là một sự phản

ánh rõ ràng và ngắn gọn về khả năng thanh toán nợ của công ty được xếp hạng, đồng thời

XHTN còn là quá trình sử dụng các thông tin đã biết và thông tin hiện thời để dự báo kết

quả tương lai.

Với quan điểm của Standard & Poor’s thì XHTN là đánh giá khả năng tín dụng của bên

phải thực hiện nghĩa vụ tài chính trong tương lai dựa trên những yếu tố hiện tại và quan

điểm của người đánh giá. Nói cách khác, XHTN là trình bày các ý kiến về rủi ro tín dụng.

Cụ thể là thể hiện ý kiến về khả năng và và sự sẵn sàng của tổ chức phát hành (Rating

issuers) - chẳng hạn như một tổng công ty hoặc chính phủ tiểu bang hoặc thành phố - để

đáp ứng các nghĩa vụ tài chính đầy đủ và đúng hạn. XHTN cũng có thể đề cập tới chất

lượng tín dụng của một khoản nợ riêng lẻ (Rating issues) - chẳng hạn như trái phiếu công

ty hoặc trái phiếu chính phủ - hoặc đánh giá nguy cơ liên quan có thể dẫn đến bị tổn thất.

Fitch Ratings khẳng định theo quan điểm của họ, XHTN là đánh giá mức độ khả năng

thực hiện các nghĩa vụ nợ như lãi suất, cổ tức ưu đãi, các khoản bảo hiểm hay các khoản

8

phải trả khác của một đối tượng được xếp hạng. Phương pháp XHTN của Fitch là sự kết

hợp của cả yếu tố tài chính và phi tài chính. Vì vậy, chỉ số đánh giá còn cho thấy khả năng

sinh lợi tương lai của tổ chức được đánh giá.

Một cách khái quát có thể hiểu XHTN là một tiến trình đánh giá và phân loại mức độ tín

nhiệm tương ứng với các cấp độ rủi ro khác nhau, phản ánh về chất lượng, khả năng

thanh toán nợ của đối tượng được xếp hạng và dự báo kết quả trong tương lai, được thể

hiện thông qua hệ thống các ký hiệu xếp hạng. Theo đó, XHTN cung cấp thông tin cho

các nhà đầu tư biết về tình trạng tài chính và mức độ rủi ro của các định chế tài chính để

có quyết định đầu tư phù hợp. Các yếu tố để đánh giá thường bao gồm yếu tố tài chính

và phi tài chính. Yếu tố tài chính bao gồm các tỷ số tài chính quan trọng thông qua các

báo cáo tài chính. Yếu tố phi tài chính là các yếu tố khó có thể định lượng như: chính

trị, ngành nghề kinh doanh, môi trường kinh tế vĩ mô…

2.2 Xác suất vỡ nợ (PD)

Xác suất vỡ nợ là một thành phần quan trọng được áp dụng trong nhiều phân tích rủi

ro tín dụng và hoạt động quản lý rủi ro. Theo Basel II, nó là một tham số chính được

sử dụng trong tính toán mức vốn kinh tế có khả năng hấp thụ các rủi ro tại các tổ chức

tín dụng.

Theo định nghĩa được đưa ra bởi Office of the Comptroller of the Currency: “Xác suất vỡ

nợ là rủi ro mà người đi vay sẽ không thể hoặc không sẵn sàng trả nợ đầy đủ hoặc đúng

hạn. Rủi ro vỡ nợ bắt nguồn từ việc phân tích năng lực của bên có nghĩa vụ để trả nợ theo

các điều khoản hợp đồng”. PD thường liên quan đến các đặc điểm tài chính như dòng tiền

không đủ bù đắp chi phí, doanh thu hoặc tỷ suất lợi nhuận hoạt động sụt giảm, đòn bẩy

cao, thanh khoản giảm hoặc không đảm bảo năng lực để thực hiện các kế hoạch kinh

doanh thành công. Ngoài những yếu tố có thể định lượng này, sự sẵn sàng trả nợ của

người đi vay cũng cần phải được đánh giá để xác định xác suất vỡ nợ.

Hoặc như Tysk (2010) đã giải thích, xác suất vỡ nợ là sự đánh giá định lượng về khả

năng một bên có nghĩa vụ sẽ phá sản trong một khoảng thời gian nhất định, thường là

một năm. Thông thường, xác suất vỡ nợ phác thảo công ty không hoàn thành trách

9

nhiệm với khoản vay của họ hay nói cách khác là trách nhiệm thanh toán đối với các

ngân hàng. Vì các nguyên nhân chính khiến các công ty mất khả năng trả nợ là thua lỗ

kinh doanh hoặc thiếu tiền, nên nó cũng có thể được coi là khả năng phá sản của các

công ty. Để ước tính xác suất vỡ nợ, ngân hàng có thể cho điểm các công ty dựa trên khả

năng trả nợ của họ, từ đó đưa ra quyết định tốt hơn trong việc cho vay.

PD là một trong những tỷ lệ hiệu quả nhất để phân loại người vay. Tất cả các ngân hàng,

cho dù sử dụng phương pháp tiêu chuẩn hay các phương pháp tiên tiến khác đều phải

cung cấp cho giám sát viên với một ước tính nội bộ của PD liên quan đế người đi vay

trong phạm vi số điểm được chấm. Kết quả xếp hạng dựa trên số liệu PD được xem là

tương đối chính xác vì nó được tính toán trên các tỷ lệ tài chính thực tế của doanh

nghiệp và có thể phản ánh tình trạng của doanh nghiệp một cách thiết thực. PD có thể

giúp giảm rủi ro tín dụng một cách hiệu quả nếu được xem xét đầy đủ.

2.3 Khảo lược các mô hình dự báo xác suất vỡ nợ của doanh nghiệp

Trên thế giới đã có khá nhiều các nghiên cứu liên quan đến mô hình dự báo xác suất vỡ

nợ của doanh nghiệp. Mỗi một mô hình sẽ có biến đầu vào, ưu và nhược điểm khác nhau,

10

được thể hiện cụ thể trong bảng sau:

Bảng 2.1: Khảo lược các mô hình dự báo xác suất vỡ nợ

TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

- Phổ biến và - Kết quả hồi quy - Mô hình hồi quy tuyến tính là 1 Mô hình hồi

dễ áp dụng. có thể nằm bên một mô hình thống kê nhằm quy

- Dễ tính toán ngoài khoảng mục đích điều tra nghiên cứu (Regression

và kết quả có [0,1]. và mô hình hóa mối quan hệ Analysis

thể được giải - Khả năng ngoại tuyến tính giữa các biến. Năm Models)

thích. suy có thể thấp. 1970, Orgler đã sử dụng mô

- Có thể đưa ra - Rất nhạy cảm hình này để xác định mối

được một kết với những quan hệ tuyến tính giữa các

quả tốt với trường hợp đặc đặc điểm của khách hàng với

hệ thống dữ biệt. tình trạng vỡ nợ của khách

liệu ít. hàng đó.

- Phổ biến và - Các biến được - Fisher (1936) đã đưa ra mô 2 Mô hình phân

dễ thực hiện. giả định theo hình phân tích phân biệt để tích phân biệt

- Điểm số có phân phối phân tách người đi vay (tốt (Discriminant

thể được tính chuẩn, tuy nhiên hay xấu) dựa trên đặc điểm Analysis)

trực tiếp từ điều này không của họ thông qua ước lượng

mô hình hợp lý và rất hàm phân biệt tuyến tính,

tuyến tính khó để kiểm tra trong đó các biến số là biến

ước tính. sự ổn định của định lượng (các số liệu được

- Giảm tỷ lệ mô hình cũng lấy từ BCTC hàng năm của

lỗi của như tính hợp lý doanh nghiệp).

mô hình. của các hệ số - Chức năng phân biệt phải thỏa

hồi quy. mãn các nguyên tắc sau: Tối

- Tương tự như đa hoá sự khác biệt giữa các

hồi qui tuyến nhóm khách hàng phá sản –

11

tính, giá trị tuyệt không phá sản và khoảng cách

TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

đối của mô hình giữa các khách hàng trong

không thể diễn cùng một nhóm là thấp nhất.

giải được. - Mặc dù mô hình này có vẻ

tương tự như mô hình hồi quy

tuyến tính, nhưng vẫn có sự

khác biệt. Cụ thể: Trong mô

hình hồi quy tuyến tính, đặc

điểm của người đi vay được

xác định và trạng thái của

người đi vay là ngẫu nhiên.

Trong khi đó, trong mô hình

phân tích phân biệt thì trạng

thái của người đi vay được xác

định và đặc điểm của họ thì

ngẫu nhiên.

- Dễ dàng đưa - Có thể vi phạm - Được sử dụng trong nghiên 3 Mô hình hồi

ra kết quả và giả định chuẩn cứu của Olso (1980), Gilbert quy Logit and

kết quả thì của các biến (1990), Hayden (2010). Probit (Logit

dễ giải thích. trong mô hình. - Mô hình logit và Probit and Probit

- Kết quả đưa - Mô hình không nghiên cứu sự phụ thuộc của models)

ra là xác thể ứng dụng một biến nhị phân (biến phụ

suất vì vậy đối với các thuộc Y) vào các biến độc

hỗ trợ cho trường hợp DN lập khác (Xi), qua đó có thể

việc đưa ra khiếm khuyết ước lượng xác suất vỡ nợ

quyết định. dữ liệu hoặc DN của một doanh nghiệp có

- Có thể kiểm có cấu trúc tài nguy cơ phá sản là bao nhiêu

12

định được chính đặc biệt. trực tiếp từ mẫu.

TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

mức độ tin - Vấn đề đánh giá

cậy của kết quá cao hoặc

quả xếp hạng quá thấp có thể

và các biến. xuất hiện trong

mô hình.

- Không có các - Dễ xảy ra lỗi khi - Mô hình cây quyết định là một 4 Mô hình cây

giả định về có quá nhiều lớp. mô hình phi tham số được quyết định

phân phối - Chi phí tính toán Brieman giới thiệu lần đầu vào (Decision Tree)

chuẩn của các để xây dựng mô năm 1980, được sử dụng nhiều

biến trong hình cao. cho vấn đề phân loại và dự báo

mô hình. - Sự ổn định vỡ nợ của các doanh nghiệp.

- Xác suất phá của mô hình - Cây quyết định là quá trình

sản có thể tính không thể được phân tích dữ liệu, phân lớp. Cụ

toán được. đánh giá bằng thể cây quyết định chia một

- Trực quan, dễ các bài kiểm tra tập dữ liệu thành các tập dữ

nhìn, dễ dàng thống kê. liệu con sao cho các tập dữ

giải thích các liệu này đồng nhất hơn với

kết quả. biến phân lớp.

- Mối quan hệ - Cây quyết định có cấu trúc

phi tuyến biểu diễn dưới dạng hình cây

giữa các biến gồm nút quyết định và nút lá,

độc lập và đỉnh trên cùng của cây gọi là

biến phụ gốc. Mỗi nút quyết định tương

thuộc được ứng với một thử nghiệm trên

mô hình hóa một thuộc tính duy nhất của

dễ dàng. dữ liệu đầu vào và mỗi nút

13

quyết định xử lý một kết quả

TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

của thử nghiệm. Mỗi nút lá là

kết quả của quyết định cho

một trường hợp.

- Quá trình phân nhánh hay quá

trình ra quyết định ở từng

bước đều được dựa trên

những điều kiện, hệ số đo

lường, tính toán nhất định.

- Cho kết quả - Không thể giải - Random forests được đưa ra 5 Mô hình

dự báo tốt thích được cơ chế bởi Ho vào năm 1995, là mô Random forests

hơn so với hoạt động của hìnhdự báo xác suất vỡ nợ, (RF)

mô hình cây mô hình, phân loại bằng cách xây dựng

quyết định. Random Forest là nhiều cây quyết định và trả kết

- Mô hình vẫn một trong những quả như là giá trị Mode của

có thể làm mô hình hộp đen nhóm hoặc là giá trị Mean của

việc được với (Black box). cây quyết định.

dữ liệu thiếu - Phải mất nhiều - Random Forest là một tập hợp

giá trị. thời gian hơn để của hàng trăm cây quyết định,

- Khi rừng có phân tích dữ liệu trong đó mỗi cây quyết

nhiều cây so với các tập dữ địnhđược tạo nên ngẫu nhiên

hơn, có thể liệu trước đó. từ việc tái chọn mẫu (chọn

tránh được random 1 phần của tập dữ liệu

hiện tượng để xây dựng) và random các

overfitting biến từ toàn bộ các biến trong

tập dữ liệu tập dữ liệu. Với một cơ chế

(hiện tượng như vậy, mô hình Random

14

mô hình tìm Forest thường hoạt động rất

TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

chính xác, nhưng chúng ta được quá

không thể nào hiểu được cơ khớp với tập

chế hoạt động bên trong mô dữ liệu).

hình vì cấu trúc quá phức tạp.

- Dễ dàng cho - Mô hình này là - Lý thuyết về mạng nơtron xuất 6 Mô hình mạng

các mô hình một hộp đen, kết hiện từ năm 1943 và cho đến thần kinh nhân

phức tạp. quả không được năm 1990 bắt đầu từ nghiên tạo (Artificial

- Không có diễn giải. cứu của Shade, nó trở thành Neural network

những giả - Yêu cầu dữ liệu một công cụ quan trọng được - ANN)

định hạn chế. chất lượng cao. sử dụng trong nghiên cứu dự

- Cho phép sử - Mẫu được đưa báo vỡ nợ.

dụng dữ liệu vào mô hình phải - Mục tiêu của mô hình là tìm

định tính. đủ lớn. mối quan hệ giữa biến độc lập

- Có thể kiểm - Các biến phải và biến phụ thuộc. Tuy nhiên,

soát dữ liệu lựa chọn theo thứ mô hình này không ước tính

thô, không có tự ưu tiên. các thông số, nó sử dụng ý

ý nghĩa. - Yêu cầu những tưởng hoạt động của nơ-ron,

- Có thể khắc định nghĩa chi là quá trình xử lý thông tin

phục được tiết từ người thiết của não, vì vậy được xem là

vấn đề tự kế mô hình. mô hình phi tham số.

tương quan. - Mất nhiều thời - Mô hình bao gồm nhiều nút,

- Kết quả đưa gian xử lý. mỗi nút gửi kết quả đến các

ra rõ ràng. - Rủi ro trong việc nút mạng khác nếu nó nhận

lỗi mô hình. được dữ liệu vào từ một nút

- Mô hình rất mạng cụ thể được kết nối. Một

phức tạp, khó áp bộ dữ liệu được sử dụng để

15

dụng và phổ biến đào tạo các mô hình nhận ra

TT Tên mô hình Tổng quan về mô hình Ưu điểm Nhược điểm

những người không trả được tại Việt Nam.

nợ. Điều chỉnh được thực hiện

trên các kết nối giữa đầu vào,

đầu ra và các nút trung gian để

tạo ra mô hình cuối cùng.

2.4 Tổng quan các nghiên cứu trước

Cho đến nay đã có rất nhiều nghiên cứu liên quan đến dự báo xác suất vỡ nợ của

doanh nghiệp và rủi ro phá sản của doanh nghiệp, tuy nhiên kết quả nghiên cứu được

tìm thấy vẫn còn chưa thống nhất do nhiều nguyên nhân khác nhau, bao gồm sự khác

nhau về đối tượng và phạm vi nghiên cứu cũng như mô hình và phương pháp nghiên

cứu đã được sử dụng.

2.4.1 Các nghiên cứu trên thế giới

Trên thế giới đã có khá nhiều các nghiên cứu liên quan đến dự báo xác suất vỡ nợ của

doanh nghiệp và rủi ro phá sản của doanh nghiệp. Cụ thể như nghiên cứu của Edward I.

A. (1968) về chỉ số tài chính, phân tích mô hình đa thức nhằm dự báo khả năng phá sản

của doanh nghiệp. Nghiên cứu có mẫu khảo sát gồm 66 doanh nghiệp được chia thành 2

nhóm gồm 33 doanh nghiệp phá sản theo Chương X của Luật phá sản Hoa Kỳ giai đoạn

1946 – 1965 và 33 doanh nghiệp không phá sản trong cùng thời kỳ, các đơn vị này vẫn

tiếp tục hoạt động trong năm 1966. Tác giả đã sử dụng 22 biến độc lập chỉ số tài chính để

phân tích chia thành 5 nhóm gồm: chỉ số về khả năng thanh khoản, chỉ số về khả năng

sinh lời, chỉ số đòn bẩy tài chính, chỉ số và khả năng thanh toán nợ và chỉ số hoạt động.

Kết quả nghiên cứu từ mô hình phân tích đa thức này của Edward I. A. đạt mức chính xác

khá cao, cụ thể dự báo đúng 94% mẫu khảo sát ban đầu. Tuy nhiên, giới hạn của bài

nghiên cứu này là chỉ khảo sát các doanh nghiệp sản xuất lớn (dựa vào quy mô tài sản).

Tiếp theo phải kể đến nghiên cứu về dự báo thất bại doanh nghiệp của Evridiki

16

Neophytou, Andreas Charitou & Chris Charalambous (2000) với kỹ thuật phân tích logit

đã phát triển mô hình phân loại các doanh nghiệp công nghiệp thất bại cho nước Anh. Bộ

dữ liệu bao gồm 51 cặp doanh nghiệp thất bại và không thất bại ở Anh giai đoạn 1988 –

1997. Mô hình dự báo được phát triển cho đến ba năm trước khi sự kiện thất bại của

doanh nghiệp diễn ra trên cơ sở ba biến tài chính là khả năng sinh lời, dòng tiền hoạt động

kinh doanh và biến đòn bẩy tài chính. Kết quả của mô hình có thể giải thích chính xác

83% khả năng thất bại của doanh nghiệp trước một năm. Tuy nhiên, mô hình có giả định

về phân phối xác suất, giả thiết không có hiện tượng đa cộng tuyến do đó làm giảm mức

độ áp dụng của mô hình.

Ravi & Pramodh (2008) đã sử dụng mô hình mạng thần kinh nhân tạo nơtron để dự báo

vỡ nợ cho các ngân hàng Thổ Nhĩ Kỳ và Tây Ban Nha, trong đó có sử dụng 9 nhân tố

tài chính cho các ngân hàng Thổ Nhĩ Kỳ và 12 nhân tố tài chính cho các ngân hàng Tây

Ban Nha. Mức độ chính xác của mô hình xây dựng là 96,6% cho tập số liệu của các

ngân hàng Tây Ban Nha và 100% cho tập số liệu của các ngân hàng Thổ Nhĩ Kỳ. Tuy

nhiên, do mô hình này khá phức tạp, cấu trúc của nó khó theo dõi, nằm ngoài sự kiểm

soát của người xây dựng mô hình nên tính ứng dụng không cao.

Bên cạnh đó, trong nghiên cứu về chỉ số tài chính và phân tích biệt số đa nhân tố dự báo

sự thất bại của các doanh nghiệp Malaysia của nhóm nghiên cứu Ben Chin-FookYap,

David Gun-Fie Yong & Wai-Ching Poon(2010) đã phát triển mô hình phân tích biệt số

đa nhân tố (MDA – Multiple Discriminant Analysis) để cải thiện khả năng dự báo sự

thất bại cho các doanh nghiệp Malaysia sau khoảng thời gian cơ cấu lại với điều kiện tài

chính, hoạt động, kinh doanh khác nhau. Nhóm tác giả sử dụng 16 biến chỉ số tài chính

để phân tích trên mẫu khảo sát gồm 64 doanh nghiệp. Kết quả nghiên cứu tìm thấy 7

biến chỉ số tài chính có ý nghĩa thống kê trong việc dự báo với tỷ lệ chính xác khá cao

từ 88% đến 94% cho mỗi doanh nghiệp trước khi doanh nghiệp thất bại, bao gồm tổng

tài sản trên tổng nợ phải trả, dòng tiền trên tổng nợ dài hạn, tổng nợ dài hạn trên tổng tài

sản, vốn lưu động trên tổng tài sản, thu nhập giữ lại trên tổng tài sản, thu nhập trước

thuế và lãi vay trên doanh thu và thu nhập ròng trên doanh thu. Tuy nhiên, phương pháp

17

này cũng có nhược điểm liên quan đến các giả định cơ bản trong mô hình (giả thiết về

phân phối chuẩn và phương sai bằng nhau) có thể bị vi phạm làm giảm độ tin cậy của

mô hình cũng như làm giảm khả năng áp dụng.

2.3.2 Các nghiên cứu tại Việt Nam

Tại Việt Nam, cũng có nhiều nghiên cứu liên quan đến chủ đề này, đa số được công bố

trên các phương tiện thông tin đại chúng đã tiến hành nghiên cứu các nhân tố ảnh hưởng

đến rủi ro phá sản của doanh nghiệp, ước tính xác suất phá sản trong thẩm định giá trị

doanh nghiệp (Hay Sinh 2003, Lê Đạt Chí & Lê Tuấn Anh 2012; Lê Nguyễn Sơn Vũ

2013; Võ Hồng Đức & Nguyễn Đình Thiên 2013; nhóm tác giả thuộc ngành ngành khoa

học kinh tế trường Đại học kinh tế Thành phố Hồ Chí Minh 2013; Nguyễn Minh Hà &

Nguyễn Bá Hướng 2016). Các công trình đã được công bố chủ yếu sử dụng phương pháp

phân tích thống kê mô tả trên cơ sở dữ liệu bảng cũng như chưa đặt trọng tâm vào việc

nghiên cứu các mô hình dự báo xác suất vỡ nợ của doanh nghiệp. Chính vì vậy, hiện tại

vẫn còn thiếu các bằng chứng thực nghiệm từ kết quả phân tích mô hình hồi quy nhằm

cung cấp thêm minh chứng vững chắc cho việc đề xuất mô hình dự báo xác suất phá sản

doanh nghiệp mang lại kết quả chính xác nhất.

Cụ thể hơn, nghiên cứu về ước tính xác suất phá sản trong thẩm định giá trị doanh nghiệp

của Hay Sinh (2003). Theo tác giả, xác suất phá sản là một tham số tài chính có ảnh

hưởng trực tiếp đến giá trị doanh nghiệp. Giá được thẩm định thông qua hai phương pháp

gồm phương pháp thuộc cách tiếp cận dòng tiền – xác suất phá sản chưa được ước tính là

một tham số độc lập mà thường được thể hiện trong tỷ suất chiết khấu và phương pháp

giá trị hiện tại có điều chỉnh (APV) – ước tính xác suất phá sản như một tham số độc lập.

Kết quả nghiên cứu của tác giả hướng đến mục đích thiết lập các phương pháp ước tính

xác suất phá sản của một doanh nghiệp nhằm giúp phương pháp giá trị hiện tại có điều

chỉnh (APV) ngày càng được áp dụng rộng rãi, góp phần làm đa dạng hóa các phương

pháp trong hoạt động thẩm định giá trị doanh nghiệp tại Việt Nam.

Hay, Lê Nguyễn Sơn Vũ (2013) nghiên cứu về quyết định đầu tư và rủi ro phá sản của

các công ty niêm yết trên thị trường chứng khoán Việt Nam đã đưa ra các bằng chứng

18

thực nghiệm về sự tác động của các yếu tố chỉ số tài chính đến quyết định đầu tư và rủi

ro phá sản của các công ty niêm yết trên thị trường chứng khoán Việt Nam giai đoạn

2003 – 2012. Bộ dữ liệu gồm 737 công ty thuộc các lĩnh vực khác nhau. Kết quả nghiên

cứu cho thấy ba yếu tố gồm thu nhập ròng âm hai năm gần nhất, khả năng thanh khoản

ngắn hạn và nợ phải trả trên tổng tài sản có mối tương quan thuận chiều với chỉ số dự

báo phá sản Oscore và đồng thời có mối quan nghịch giữa hai nhân tố tỷ suất sinh lợi

trên tổng tài sản và tốc độ tăng trưởng thu nhập ròng với chỉ số dự báo phá sản Oscore;

và tất cả đều có ý nghĩa thống kê. Trong khi đó, bốn nhân số còn lại gồm quy mô doanh

nghiệp, tổng nợ phải trả trên tổng tài sản, vốn lưu động trên tổng tài sản và quỹ được lập

từ hoạt động trên tổng nợ phải trả cũng có tác động đến chỉ số dự báo phá sản Oscore

nhưng không có ý nghĩa thống kê.

Gần đây, Nguyễn Thị Tuyết Lan (2019) đã thực hiện nghiên cứu các nhân tố ảnh hưởng

đến rủi ro phá sản của các doanh nghiệp niêm yết ngành xây dựng tại Việt Nam. Mô hình

được sử dụng để nghiên cứu là mô hình logit với 5 biến độc lập gồm tổng nợ phải trả trên

tổng tài sản, vốn lưu động trên tổng tài sản, khả năng thanh toán ngắn hạn, tỷ suất sinh lợi

trên tổng tài sản và tốc độ tăng trưởng thu nhập ròng. Tổng thể mẫu khảo sát gồm 109

doanh nghiệp niêm yết thuộc ngành xây dựng tại Việt Nam trên 2 sàn là HNX và HOSE

giai đoạn 2005 – 2017. Kết quả nghiên cứu cho thấy các nhân tố gồm: tổng nợ phải trả

trên tổng tài sản có mối tương quan cùng chiều với rủi ro phá sản của doanh nghiệp niêm

yết thuộc ngành xây dựng tại Việt Nam và ngược lại tỷ lệ sinh lợi trên tổng tài sản có ảnh

hưởng ngược chiều.

Qua khảo lược các nghiên cứu ở trong và ngoài nước cho thấy rằng các tổ chức tài chính

có thể ứng dụng nhiều mô hình xếp hạng tín nhiệm khác nhau để dự báo xác suất vỡ nợ

của các doanh nghiệp. Các mô hình dự báo này có thể là mô hình đa thức, mô hình logit,

mô hình probit, mô hình mạng thần kinh nhân tạo… Bên cạnh đó, các mô hình xếp hạng

này sử dụng các yếu tố đầu vào hay các chỉ số tài chính khác nhau để dự báo khả năng

phá sản của doanh nghiệp. Các chỉ số tài chính thường được sử dụng như khả năng thanh

toán ngắn hạn, tỷ suất sinh lợi trên tổng tài sản, tổng nợ phải trả trên tổng tài sản… Tuy

nhiên, với những bộ dữ liệu được xây dựng trong các khoảng thời gian khác nhau, các kết

19

luận về việc lựa chọn mô hình xếp hạng tín nhiệm phù hợp và các chỉ số tài chính ảnh

hưởng đến xác xuất vỡ nợ của doanh nghiệp trong các bài nghiên cứu có sự khác nhau

cũng như việc vận dụng trong nghiên cứu dự báo khả năng vỡ nợ khách hàng doanh

nghiệp vừa và nhỏ tại Việt Nam theo tác giả là một điểm mới. Thông qua việc phân tích,

so sánh, tổng hợp các công trình nghiên cứu trên và các vấn đề có liên quan, tác giả đã chỉ

ra một số khoảng trống trong nghiên cứu, đề xuất mô hình và phương pháp nghiên cứu dự

kiến cho đề tài. Chi tiết về mô hình và phương pháp nghiên cứu sẽ được trình bày chi tiết

trong Chương 3 – Mô hình và phương pháp nghiên cứu để làm cơ sở cho việc đánh giá

mức độ tin cậy của kết quả nghiên cứu được trao đổi thảo luận trong Chương 4 – Kết quả

nghiên cứu.

Kết luận chương 2: Chương này tác giả đã trình bày những lý luận cơ bản và các lý

thuyết nền liên quan đến xếp hạng tín dụng, xác suất vỡ nợ của các doanh nghiệp và

phương pháp đo lường, dự báo các nội dung này cũng như kết quả đánh giá các nghiên

cứu trước đây đã được công bố để làm rõ tính cấp thiết của đề tài, đồng thời cung cấp cơ

sở cho việc tiến hành đề xuất mô hình nghiên cứu và phân tích kết quả nghiên cứu được

20

trình bày ở các chương tiếp theo.

CHƯƠNG 3: MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU

Trên cơ sở những bài học kinh nghiệm được đúc kết từ các công trình nghiên cứu đã

công bố trước đã trình bày ở trong Chương 2, chương này sẽ trình bày các thông tin cụ

thể liên quan đến các mô hình nghiên cứu được sử dụng cũng như xử lý cùng với các

phương pháp nghiên cứu phù hợp với các đặc điểm cụ thể của từng mô hình và dữ liệu

nghiên cứu đã được thu thập để tiến hành kiểm định các giả thuyết nghiên cứu đã được

đặt ra ban đầu ở Chương 1. Các thông tin chi tiết, cụ thể về các mô hình và phương pháp

nghiên cứu được sử dụng sẽ cho thấy mức độ tin cậy của các kết quả nghiên cứu được

thể hiện ở phần tiếp theo (Chương 4 – Kết quả nghiên cứu).

3.1 Phương pháp xây dựng các mô hình

Trong bài nghiên cứu này, tác giả sử dụng các mô hình tham số và phi tham số để dự

báo khả năng vỡ nợ của các doanh nghiệp vừa và nhỏ tại Việt Nam trong giai đoạn 2016

– 2018. Các bước xây dựng mô hình được thực hiện như sau:

Bước 1: Thu thập và xử lý dữ liệu. Dữ liệu sử dụng được lấy từ báo cáo tài chính hàng

năm có kiểm toán của khoảng 350 doanh nghiệp vừa và nhỏ thuộc 9 ngành khác nhau

tại Việt Nam từ năm 2016 đến năm 2018.

Bước 2: Lựa chọn các biến đầu vào của mô hình. Để dự báo khả năng nợ vỡ nợ của các

doanh nghiệp, tác giả đã lựa chọn 14 biến đầu vào là các chỉ số tài chính được tính toán

từ báo cáo tài chính của các doanh nghiệp. Các biến độc lập này thuộc 4 nhóm chỉ số tài

chính: nhóm chỉ số về khả năng thanh khoản, nhóm chỉ số về mức độ sử dụng nợ, nhóm

chỉ số về khả năng sinh lời, và nhóm chỉ số về hiệu quả hoạt động của doanh nghiệp.

Bước 3: Thực hiện chạy hồi quy trên các mô hình xếp hạng tín nhiệm được lựa chọn,

bao gồm mô hình tham số và phi tham số. Các mô hình tham số bao gồm mô hình logit,

mô hình probit, mô hình complementary log – log; các mô hình phi tham số bao gồm mô

hình cây quyết định, mô hình random foerest.

Bước 4: Sử dụng ma trận Confusionvà điểm số F1 (F1 – Score) để đánh giá kết quả hồi

quy của từng mô hình. Trên cơ sở đó, lựa chọn mô hình xếp hạng tín nhiệm phù hợp và

21

có khả năng dự báo tốt xác suất vỡ nợ của khách hàng.

Các bước nghiên cứu trên sẽ được trình bày chi tiết trong các phần nội dung tiếp theo

của Chương 3.

3.2 Thu thập và xử lý dữ liệu

Dữ liệu được lấy từ báo cáo tài chính hàng năm của khoảng 350 công ty từ năm 2016

đến năm 2018. Các báo cáo tài chính này đã được kiểm toán để đảm bảo chất lượng

của nguồn thông tin. Trong 350 doanh nghiệp, có 27 doanh nghiệp thuộc lĩnh vực kinh

doanh thương mại hàng tiêu dùng; 31 doanh nghiệp thuộc ngành kinh doanh xăng dầu;

34 doanh nghiệp thuộc ngành kinh doanh ô tô; 35 doanh nghiệp thuộc ngành thi công

xây lắp; 38 doanh nghiệp thuộc ngành kinh doanh dược phẩm và thiết bị y tế; 39 doanh

nghiệp thuộc ngành dệt may; 41 doanh nghiệp thuộc ngành thủy sản (cá tra, tôm,

nghêu…); 47 doanh nghiệp thuộc ngành sắt thép và 58 doanh nghiệp thuộc ngành kinh

doanh nông sản (lúa gạo, cà phê, điều, tiêu…).

Bảng 3.1: Tổng hợp số lượng doanh nghiệp – ngành nghề kinh doanh

STT Ngành Số lượng công ty

Thương mại hàng tiêu dùng 1 27

Kinh doanh xăng dầu 2 31

Kinh doanh ô tô 3 34

Thi công xây lắp 4 35

Kinh doanh dược phẩm – thiết bị y tế 5 38

Dệt may 6 39

Thủy sản (cá tra, tôm,nghêu…) 7 41

Sắt thép 8 47

9 Kinh doanh nông sản (lúa gạo, cà phê, điều, tiêu…) 58

Tổng cộng 350

22

Nguồn: Thống kê từ tác giả

Crouhy, Galai & Mark (2001) đã vạch ra điểm yếu của nhiều mô hình đo lường rủi ro là

chúng dựa trên thông tin tài chính lịch sử được tạo ra trong các điều kiện có thể không

áp dụng được trong tương lai hoặc dữ liệu được sử dụng trong mô hình được cập nhật

không thường xuyên. Đó là lý do để tiến hành nghiên cứu trong ba năm gần đây nhất,

khi tình hình kinh tế và hoạt động của doanh nghiệp không thay đổi nhiều.

Bên cạnh đó, các công ty này được chia thành hai nhóm: Nhóm phá sản được đánh dấu

là 1 và và nhóm không phá sản được đánh dấu là 0. Các nhóm này được phân chia dựa

trên Vốn chủ sở hữu được lấy từ bảng cân đối kế toán, lợi nhuận sau thuế được lấy từ

Bảng báo cáo kết quả hoạt động kinh doanh và dòng tiền hoạt động kinh doanh được lấy

từ bảng lưu chuyển tiền tệ. Các công ty bị xếp vào nhóm phá sản (đánh dấu là 1) nếu rơi

vào các trường hợp sau đây:

(i) Vốn chủ sở hữu âm

(ii) Hai năm liên tiếp lợi nhuận sau thuế âm và dòng tiền từ hoạt động kinh doanh âm

(iii) Các công ty tuyên bố phá sản

(iv) Thuộc nhóm nợ xấu (nhóm 3, 4 và 5)

Giả thiết này dựa trên lý thuyết của Crouhy, Galai & Mark rằng phân tích rủi ro tín dụng

dựa trên nhiều thuộc tính của người vay bao gồm tài chính, quản lý, thu nhập và dòng

tiền, chất lượng tài sản và thanh khoản của công ty.

Bảng 3.2: Phân tách các công ty phá sản và không phá sản

Các doanh Các doanh nghiệp Năm Tổng nghiệp phá sản không phá sản

2016 38 312 350

2017 60 290 350

2018 48 302 350

Nguồn: Thống kê từ tác giả

Trong tập dữ liệu, các giá trị bị thiếu, không chính xác hoặc không có ý nghĩa sẽ được

23

xem xét điều chỉnh theo nguyên tắc như sau:

- Thay thế các giá trị bị thiếu bằng các giá trị trung bình của nhóm mà người đi vay

thuộc về. Ví dụ: nếu giá trị thiếu là từ một công ty phá sản, nó sẽ được thay thế

bằng giá trị trung bình của nhóm các công ty phá sản.

- Thay thế các giá trị không xác định (infinitive values) bằng các giá trị tối đa hoặc

tối thiểu tùy thuộc vào giá trị nào sẽ phù hợp hơn.

- Các giá trị biến động bất thường sẽ được thay thế bằng quantile 5% hoặc 95% của

các chỉ số tài chính

3.3 Lựa chọn các biến đầu vào trong mô hình dự báo xác suất vỡ nợ

Một số bài nghiên cứu khoa học ủng hộ quan điểm sử dụng các chỉ số tài chính như

nguồn thông tin đánh giá rủi ro tín dụng (Demerjian, 2007). Hay Smith & Warner (1979)

lưu ý rằng việc khách hàng vi phạm các điều kiện cam kếtsẽ cung cấp tín hiệu về khả

năng trả nợ của họ cho ngân hàng. Dichev & Skinner (2002) cũng nhận thấy rằng các điều

kiện cam kết về chỉ số tài chính sẽ định hướng các nội dung được đề cập trong các hợp

đồng tín dụng.

Lundholm & Sloan (2004) đã chứng minh rằng các điều kiện cam kết về tỷ lệ tài chính rất

hữu ích vì “… nếu công ty bắt đầu có dấu hiệu khó khăn, ngân hàng có thể thu hồi nợ hay

xử lý tài sản trước khi công ty mất khả năng thanh toán”. Hay Beaver (1966) trình bày

bằng chứng thực nghiệm rằng một số chỉ số tài chính đã cho các tín hiệu thống kê nổi bật

trước các thất bại trong kinh doanh thực tế của các công ty. Beaver đã cố gắng để dự đoán

xác suất vỡ nợ của công ty bằng cách sử dụng các chỉ số tài chính của họ. Tuy nhiên,

nghiên cứu này chủ yếu tập trung vào tỷ lệ đòn bẩy và thanh khoản, có thể chưa cung cấp

đầy đủ thông tin tài chính để đưa ra dự báo chính xác.

Chỉ số tài chính cũng đã được xem xét bởi một số lượng lớn các tổ chức xếp hạng tín

nhiệm khi đánh giá chất lượng tín dụng. Chẳng hạn như Standard & Poor's (2006) đã dựa

trên sự cải thiện về tỷ lệ nợ trên dòng tiền (tổng nợ/ thu nhập) và hệ số khả năng thanh

toán để giải thích cho việc nâng hạng tín dụng cho Staples, Inc. Hay như Moody (2006)

đã lưu ý trong việc xếp hạng cho Limited Brands, Inc rằng việc suy giảm hay ổn định

phạm vi bảo hiểm và nợ trên dòng tiền (tổng nợ/ thu nhập) sẽ ảnh hưởng đến thay đổi xếp

24

hạng trong tương lai.

Demerjian (2007) đã nêu 5 điều kiện cam kết về chỉ số tài chính thường được sử dụng

trong các hợp đồng tín dụng làm cơ sở để dự đoán rủi ro tín dụng của người vay. Cụ thể:

i. Mức bảo hiểm tối thiểu (thu nhập/ chi phí liên quan đến nợ định kỳ)

ii. Nợ tối đa đối với dòng tiền (tổng nợ/ thu nhập)

iii. Giá trị thuần tối thiểu (tài sản - nợ phải trả = vốn cổ phần của cổ đông)

iv. Đòn bẩy tối đa (tổng nợ/ tổng tài sản)

v. Khả năng thanh toán tối thiểu (tài sản ngắn hạn/ nợ ngắn hạn)

Moody’s và Standard and Poor's cung cấp một số chỉ số tài chính quan trọng trong quy

trình xếp hạng của họ bao gồm: Chỉ số Nợ /Tài sản; Chỉ số thanh toán lãi vay từ lợi nhuận

trước thuế và lãi vay; Triển vọng kinh doanh (tăng trưởng của dòng tiền hoặc lợi nhuận

trên tài sản); Cổ tức và các khoản thanh toán khác; Rủi ro kinh doanh (biến động của

dòng tiền hoặc giá trị tài sản); Thanh khoản tài sản.

Báo cáo của Moody (2001) đã đề xuất một mô hình xếp hạng tín dụng định lượng để đánh

giá các công ty thuộc thị trường cấp cao ở Nhật Bản được gọi là RiskCalc. Mô hình này

sử dụng bảy chỉ tiêu, bao gồm các loại sau: khả năng sinh lời, đòn bẩy tài chính, khả năng

thanh khoản, khả năng trả nợ gốc, khả năng trả lãi vay, quy mô và các chỉ số hoạt động

của doanh nghiệp (Phụ lục – Bảng 01).

Engelmann & Rauhmeier (2010) đã mở rộng nghiên cứu của Hayden với 14 tỷ lệ tài

chính đã được lựa chọn và chia thành 9 nhóm rủi ro bao gồm đòn bẩy tài chính, khả

năng thanh khoản, chỉ số hoạt động, khả năng kiểm soát chi phí, hiệu quả sử dụng tài

sản, khả năng sinh lời, quy mô doanh nghiệp, tốc độ tăng trưởng và tốc độ gia tăng nợ

vay (Phụ lục – Bảng 02).

Tóm lại, các biến độc lập được lựa chọn trong mô hình dự báo xác suất vỡ nợ thường

thuộc 4 nhóm chỉ số tài chính sau:

Nhóm chỉ số về khả năng thanh khoản:

Nhóm chỉ số này phản ánh khả năng chuyển đổi tài sản thành tiền để thanh toán các

khoản nợ ngắn hạn của doanh nghiệp, hay thể hiện khả năng thanh toán trong ngắn hạn

25

của doanh nghiệp. Nhóm chỉ số này thường bao gồm hệ số khả năng thanh toán hiện

hành và hệ số khả năng thanh toán nhanh. Các hệ số này càng thấp thì rủi ro phá sản

của doanh nghiệp càng cao.

Nhóm chỉ số về đòn bẩy tài chính:

Nhóm chỉ số này đo lường mức độ sử dụng nợ của doanh nghiệp thông qua các chỉ số

như hệ số nợ trên tổng tài sản, hệ số nợ trên vốn chủ sở hữu, khả năng thanh toán lãi

vay, khả năng thanh toán nợ dài hạn. Các hệ số nợ càng cao và khả năng thanh toán nợ

càng thấp thì rủi ro vỡ nợ của doanh nghiệp càng cao.

Nhóm chỉ số về khả năng sinh lời

Nhóm chỉ số này đo lường khả năng sinh lợi của doanh nghiệp thông qua các chỉ số như

lợi nhuận gộp biên, thu nhập trước thuế trên doanh thu thuần, thu thập trước thuế trên

tổng tài sản, thu thập trước thuế trên vốn chủ sở hữu. Người ta tin rằng khả năng sinh lời

của công ty là một yếu tố dự báo tốt về việc liệu sau đó công ty có khả năng thanh toán

nghĩa vụ nợ của mình hay không, một công ty luôn thua lỗ cuối cùng sẽ làm cạn kiệt bất

kỳ nguồn vốn chủ sở hữu nào và không có khả năng trả nợ.

Nhóm chỉ số về hiệu quả hoạt động

Chỉ số về hiệu quả hoạt động cho thấy doanh nghiệp đã sử dụng tài sản hiệu quả như thế

nào. Chỉ số này càng thấp thì rủi ro tín dụng của doanh nghiệp càng cao khi doanh

nghiệp sử dụng tài sản chưa hiệu quả; đặc biệt là hàng tồn kho, các khoản phải thu và

các tài sản của doanh nghiệp.

Trên cơ sở các nghiên cứu trên, tác giả đã lựa chọn 14 chỉ số tài chính là các biến độc

lập cho các mô hình xếp hạng tín nhiệm trong bài nghiên cứu. Bảng sau đây mô tả cách

14 biến độc lập được tính toán, cũng như kỳ vọng về dấu của các biến này trong mô hình

26

dự báo xác suất vỡ nợ.

Bảng 3.3: Các biến độc lập trong mô hình dự báo xác suất vỡ nợ

Các chỉ số tài chính Nhóm chỉ số tài chính Các biến độc lập Kỳ vọng về dấu

Lợi nhuận gộp/Doanh thu thuần Khả năng sinh lời - X1

Thu nhập trước thuế/Doanh thu thuần Khả năng sinh lời - X2

Thu nhập trước thuế/Tổng tài sản Khả năng sinh lời - X3

Thu nhập trước thuế/Vốn chủ sở hữu Khả năng sinh lời - X4

Tổng nợ phải trả/Tổng tài sản Đòn bẩy tài chính + X5

Tổng nợ phải trả/Vốn chủ sở hữu Đòn bẩy tài chính + X6

Tài sản ngắn hạn/Nợ ngắn hạn Khả năng thanh khoản - X7

Khả năng thanh khoản - X8 (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn

Lợi nhuận trước thuế và lãi vay/Lãi vay Thanh toán lãi vay - X9

Thanh toán nợ dài hạn - X10 Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn

Khả năng thanh khoản - X11 Tiền và các khoản tương đương tiền/Vốn chủ sở hữu

Giá vốn hàng bán/Hàng tồn kho bình quân Hiệu quả hoạt động + X12

Các khoản phải thu/Doanh thu bình quân Hiệu quả hoạt động + X13

Tổng doanh thu/Tổng tài sản Hiệu quả hoạt động - X14

3.4 Các mô hình dự báo xác suất vỡ nợ được nghiên cứu

3.4.1 Mô hình tham số

(i) Mô hình logit

Mô hình Logit là mô hình hồi quy, trong đó biến phụ thuộc (Y) được xem là biến giả

hay biến nhị phân, chỉ nhận hai giá trịlà 0 và 1; các biến độc lập có thể là biến rời rạc

hoặc biến liên tục. Trong mô hình XHTN, biến phụ thuộc Y nhận giá trị 1 khi khách

27

hàng không trả được nợ và Y nhận giá trị 0 khi khách hàng trả được nợ.

Bảng 3.4: Cấu trúc dữ liệu các biến trong mô hình Logit

Biến Ký hiệu Loại

Phụ thuộc Y Nhị phân

Độc lập Liên tục hoặc rời rạc 𝑋𝑖

Mối quan hệ giữa biến phụ thuộc (Y) và các biến độc lập được thể hiện thông qua

phương trình sau:

)=𝑍𝑖=𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯ + 𝛽𝑘𝑋𝑘 𝐿𝑖 = ln ( 𝑃𝑖 1−𝑃𝑖

Trong đó:

- P là xác suất trả nợ của khách hàng

- 𝛽1 , 𝛽2 , 𝛽3, … , 𝛽𝑛 là các hệ số

- 𝑋1 , 𝑋2 ,…, 𝑋𝑘 là các nhân tố ảnh hưởng

Để xác định xác suất vỡ nợ của khách hàng, chúng ta cần phải tìm giá trị 𝑌̂. 𝑌̂ được xem

là giá trị ước lượng của Y, thu được khi hồi quy Y theo các biến độc lập 𝑋𝑖.

Công thức tính xác suất phá sản của doanh nghiệp được ước lượng theo mô hình logit như

sau:

𝑒𝑌̂ 1+𝑒𝑌̂=

exp(𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑛𝑋𝑛) 1+ exp(𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑛𝑋𝑛)

P(𝑌𝑖 = 1)=

(ii) Mô hình Probit

Năm 1934, Chester Ittner Bliss đã có ý tưởng nghiên cứu về phân tích probit. Tuy nhiên,

đến năm 1952, sách “phân tích probit” mới được xuất bản bởi David Finney – một giáo sư

về thống kê tại Đại học Edinburgh.

Cấu trúc dữ liệu trong mô hình Probit cũng tương tự như mô hình Logit, mô hình cũng

ước lượng được xác suất trả nợ của một khách hàng. Mô hình Probit có giả thiết sai số

1

𝑡2 2 𝑑𝑡

ngẫu nhiên có sai số chuẩn hóa: 𝜀 ~ N(0,1)

𝛽1+𝛽2𝑋2𝑖+⋯+𝛽𝑘𝑋𝑘𝑖 −∞

√2𝜋

28

𝑒 𝑃𝑖 = P(𝑌𝑖 = 1) = F (𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + ⋯ + 𝛽𝑘𝑋𝑘𝑖) = ∫

Trong đó F là hàm phân phối xác suất tích lũy. Khi đó hàm hợp lý có dạng:

𝑖=1

(1 𝐿 = ∏ 𝐹𝑛 (𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + ⋯ + 𝛽𝑘𝑋𝑘𝑖)𝑌𝑖 −(𝛽1 + 𝛽2𝑋2𝑖 + 𝛽3𝑋3𝑖 + ⋯ +

𝛽𝑘𝑋𝑘𝑖)1−𝑌𝑖)

Các biến và tham số trong mô hình Probit tương tự như mô hình Logit

(iii) Mô hình Complementary Log-Log

Mô hình Complementary Log-Log cũng được xem là mô hình hồi quy nhị phân mang

những đặc tính giống mô hình logit và probit. Tuy nhiên, mô hình Complementary Log-

Log thường được sử dụng khi xác suất xuất hiện của một biến cố thì rất thấp hoặc rất lớn.

Không giống như mô hình logit hay probit, hàm Complementary Log-Log không đối

xứng vì giả thiết sai số ngẫu nhiên của mô hình có dạng phân phối log-Weibull.

Hàm log-likelihood cho mô hình Complementary Log-Log là:

𝑙𝑛𝐿 = ∑ 𝑊𝑗 𝑙𝑛𝐹(𝑥𝑗𝑏) + ∑ 𝑊𝑗 ln (1 − 𝐹(𝑥𝑗𝑏))

Trong đó: F(z) = 1-exp(-exp(z)) và 𝑤𝑗 là trọng số

3.4.2 Mô hình phi tham số

(i) Mô hình cây quyết định

Cây quyết định (DT) là một kiểu mô hình phân lớp các quan sát dựa vào dãy các luật.

Mô hình này bao gồm một nút gốc (Root node), các nút bên trong (Internal node) và nút

lá (Leaf node).Mỗi một nút trong DT tương ứng với một biến; đường nối giữa nó với nút

con của nó thể hiện một giá trị cụ thể cho biến đó (đây chính là điều kiện hay luật để

phân nhánh cho mỗi node).

Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu; các giá trị cho trước của các

29

biến được biểu diễn bởi đường đi từ nút gốc tới nút lá đó.

Hình 3.1: Mô phỏng mô hình cây quyết định

Nguồn: Abdou (2011)

Cây quyết định được xây dựng bằng cách phân tách thuộc tính các giá trị tại mỗi nút dựa

trên một thuộc tính đầu vào. Quá trình phân lớp sử dụng các thuộc tính phân tách được

thực hiện liên tục cho tới khi gặp các nút lá (giá trị mục tiêu). Tập hợp các luật đường đi

từ nút gốc tới nút lá sẽ xác định cho chúng ta các luật quyết định mà hàm mục tiêu trả về

giá trị là mức độ rủi ro tương ứng với khách hàng.

Việc phân tách tại các nút sẽ được xác định theo chỉ số Gini với thuật toán CART

(Classicification and Regression Tree).

𝑚 𝑖=1

Gini(D) = 1 – ∑ (𝑝𝑖)2

Trong đó:

- m là tổng số lớp

- 𝑝𝑖 là xác suất để 1 bộ bất kỳ trong D thuộc về lớp 𝐶𝑖

Mô hình cây quyết định là một phương pháp phân lớp rất hiệu quảvà dễ hiểu. Tuy nhiên,

hiệu quả phân lớp củacây quyết định phụ thuộc rất lớn vào dữ liệu huấn luyện (training

data). Do vậy, việc sử dụng một bộ dữ liệu lớn về lịch sử vay nợ của khách hàng là rất

cần thiết để xây dựng mô hình cây quyết định đáng tin cậy.

(ii) Mô hình Random forest

Mô hình Random forest – rừng ngẫu nhiên: đây là phương pháp xây dựng một tập hợp

30

rất nhiều cây quyết định để đưa ra quyết định về biến mục tiêu cần được dự báo. Trong

đó mỗi cây quyết định được tạo ra một cách ngẫu nhiên từ việc: tái chọn mẫu

(boostrap, random sampling) và chỉ dùng một phần nhỏ tập biến ngẫu nhiên (random

features) từ toàn bộ các biến trong dữ liệu. Ở trạng thái sau cùng, mô hình random

forest thường hoạt động rất chính xác nhưng điểm bất lợi của thuật toán là ta không thể

hiểu được cơ chế hoạt động bên trong của mô hình vì cấu trúc quá phức tạp. Mô hình

Random forest do đó được xem là một trong những mô hình hộp đen (black box).

Hình 3.2: Mô phỏng mô hình random forest

3.5 Phương pháp lựa chọn mô hình dự báo xác suất vỡ nợ

Để đánh giá mức độ phù hợp của các mô hình dự báo xác suất vỡ nợ, một vài kỹ thuật

được sử dụng như ma trận Confussion (Confussion Matrix), tỷ lệ độ chính xác

(Accuracy ratio), tỷ lệ nhạy cảm (Sensitivity ratio), tỷ lệ Specificity (Specificity ratio),

điểm F1 (F1 score).

3.5.1 Ma trận Confussion

Ma trận Confussion là một phương pháp được xây dựng để đánh giá kết quả của những

bài toán phân loại bằng việc xem xét tỷ lệ về độ chính xác và độ bao quát của các dự

đoán cho từng lớp cụ thể. Một ma trận Confussion gồm có 4 chỉ số sau đối với mỗi lớp

phân loại: True positive (TP) là chỉ số số lượng dự đoán chính xác; True Negative (TN)

chỉ số số lượng dự báo chính xác một cách gián tiếp; False positive (FP) chỉ số số lượng

31

các dự báo sai lệch; False Negative (FN) chỉ số số lượng các sai lệch một cách gián tiếp.

Trong trường hợp đánh giá kết quả dự báo khả năng vỡ nợ của các doanh nghiệp, ma

trận Confussion được mô hình như bảng dưới đây:

Bảng 3.5: Ma trận Confussion

Predicted class

Non-default Default Classes (Không phá sản) (Phá sản)

Non-default Actual True Negative (TN) False Positive (FP) class (Không phá sản)

Default False Negative (FN) True Positive (TP) (Phá sản)

Trong đó các chỉ số đối với mỗi lớp phân loại được hiểu như sau:

True Positive (TP): Số lượng dự báo chính xác. Là khi mô hình dự báo đúng một công ty

bị phá sản.

True Negative (TN): Số lượng dự báo chính xác một cách gián tiếp. Là khi mô hình dự

đoán đúng một doanh nghiệp không bị phá sản, tức là việc không chọn trường hợp doanh

nghiệp bị phá sản là chính xác.

False Positive (FP): Số lượng các dự đoán sai lệch. Là khi mô hình dự báo một công ty

bị phá sản nhưng công ty đó hoàn toàn khỏe mạnh. Đây có thể được xem là lỗi loại 1 của

mô hình.

False Negative (FN): Số lượng các dự đoán sai lệch một cách gián tiếp. Là khi mô hình

dự đoán một công ty không bị phá sản nhưng công ty đó lại rơi vào tình trạng phá sản, tức

là việc không chọn trường hợp công ty đó bị phá sản là sai.Đây được xem là lỗi loại 2 của

mô hình.

Theo các nghiên cứu củaHaydenand Daniel thấy rằng, mục tiêu của mô hình dự báo xác

suất vỡ nợ là phân tích, đánh giá và xếp hạng các khách hàng vay, để từ đó phân loại được

32

khách hàng tốt và khách hàng xấu. Tuy nhiên khi rủi ro xảy ra, các thống kê cho thấy rằng

False Negative tức là lỗi loại 2, sẽ mang đến những tổn thất lớn cho ngân hàng hơn là

False Positive tức là lỗi loại 1, do khả năng không thu hồi vốn được từ nhóm khách hàng

do lỗi loại 2 gây ra.

Từ bốn chỉ số trên, các nhà nghiên cứu xây dựng các nhóm chỉ số để đánh giá mức độ tin

cậy của một mô hình dự báo xác suất vỡ nợ của doanh nghiệp.

Tỷ lệ đo lường sự chính xác của mô hình (Accuracy ratio): Mức độ chính xác là khả

năng mô hình phân biệt được những công ty phá sản và không phá sản một cách chính

xác. Để tính toán mức độ chính xác của một mô hình dự báo, các nhà nghiên cứu đã đưa

ra công thức như sau:

Accuracy = (TN + TP)/(TN + FN + TP + FP)

Tỷ lệ đo lường mức độ nhạy cảm của mô hình (sensititvity ratio): Mức độ nhạy cảm là

khả năng mô hình xác định được các trường hợp các công ty phá sản một cách chính xác,

nó được đo lường bởi tỷ lệ các công ty được dự báo phá sản chính xác trên tổng các công

ty bị phá sản thật sự. Mức độ nhạy cảm của mô hình được xác định bởi công thức như

sau:

Sensitivity = TP/(TP+FN)

Tỷ lệ specificity (specificity ratio): Đây là tỷ lệ được xây dựng nhằm đo lường khả năng

mô hình xác định được các trường hợp các công ty không bị phá sản một cách chính xác.

Tỷ lệ này được xác định bởi tỷ lệ các công ty được dự báo không phá sản chính xác trên

tổng các công ty không bị phá sản thật sự. Công thức xác định tỷ lệ này như sau:

Specificity = TN/(TN+FP)

Tỷ lệ precision (precision ratio): Đây là tỷ lệ đo lường số lượng công ty được dự báo phá

sản chính xác trên tổng các công ty được dự báo phá sản. Tỷ lệ này được xác định thông

qua công thức sau:

33

Precision = TP/(TP + FP)

3.5.2 Điểm số F1 (F1-score)

Điểm số F1-score được đưa ra nhằm khắc phục nhược điểm của việc đánh giá mức độ tin

cậy của mô hình dựa trên các nhóm chỉ số được xây dựng dựa trên ma trận Confussion.

Trong các bài toán phân loại các công ty thuộc lớp phá sản hoặc không phá sản, bộ dữ

liệu được sử dụng để xây dựng và kiểm định mô hình thường có sự phân bố không đồng

đều, trong trường hợp này dữ liệu về các công ty không phá sản sẽ chiếm một tỷ lệ lớn

hơn rất nhiều so với dữ liệu của các công ty phá sản, từ đó dẫn đến các tỷ lệ sensitivity và

tỷ lệ precision thường bị lệch và cho kết quả dự báo không thật sự chính xác. Vì vậy,

điểm số F1 được đưa ra, nó là chỉ số được xây dựng dựa trên việc đánh giá đồng thời giữa

2 nhóm tỷ lệ sensitivity và precision, từ đó dẫn đến kết quả đánh giá tính hiệu quả của các

mô hình xếp hạng sẽ cho kết quả đáng tin cậy hơn.

Điểm số F1 hay còn gọi là F-measure được xác định bởi công thức như sau:

F1 Score = 2 * (Precision*Sensitivity) / (Precision + Sensitivity)

Điểm số F1 càng tiệm cận với giá trị là 1 thì mức độ chính xác và hiệu quả của mô hình

xếp hạng tín nhiệm càng cao và đáng tin cậy.

Kết luận chương 3: Chương này tác giả đã trình bày chi tiết nội dung của mô hình

nghiên cứu – mô hình dự báo xác suất vỡ nợ được đề xuất, mô tả chi tiết các dữ liệu đã

thu thập và các phương pháp nghiên cứu được sử dụng để cho thấy mức độ tin cậy của kết

quả nghiên cứu được trình bày ở chương tiếp theo. Mô hình dự báo xác suất vỡ nợ được

đề xuất sử dụng bao gồm mô hình tham số (với các mô hình logit, probit, complementary

log-log) và mô hình phi tham số (gồm mô hình cây quyết định decision tree, mô hình

34

random forest).

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU 4.1 Kết quả thống kê mô tả

Bảng 4.1: Thống kê mô tả các biến độc lập

Chỉ số tài chính Mean Median Min Max Biến độc lập

Lợi nhuận gộp/Doanh thu thuần (%) -0.017 0.102 -5.818 0.897 X1

-1.334 0.016 -12.558 9.208 X2 Thu nhập trước thuế/Doanh thu thuần (%)

-0.003 0.005 -0.483 0.311 X3 Thu nhập trước thuế/Tổng tài sản (%)

-0.240 0.043 -20.215 16.667 X4 Thu nhập trước thuế/Vốn chủ sở hữu (%)

Tổng nợ phải trả/Tổng tài sản (%) 0.706 0.728 0.010 3.769 X5

Tổng nợ phải trả/Vốn chủ sở hữu (%) 9.546 2.266 -163.476 224.405 X6

Tài sản ngắn hạn/Nợ ngắn hạn (lần) 1.574 1.148 0.072 19.663 X7

1.033 0.722 3.612 19.663 X8 (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn (lần)

-46.372 1.396 -1546 1681.384 X9 Lợi nhuận trước thuế và lãi vay/Lãi vay (lần)

9.782 0.111 -6.065 1821.081 X10 Thu nhập trước thuế, lãi vay và khấu hao/Nợ dài hạn(lần)

tương đương 1.006 0.101 -10.749 173.189 X11 Tiền, các khoản tiền/Vốn chủ sở hữu (lần)

89.43 1.766 1.391 348 X12 Giá vốn hàng bán/Hàng tồn kho bình quân (vòng)

0.694 0.923 0.003 5.189 X13 Các khoản phải thu/Doanh thu bình quân (lần)

35

0.4930 0.3991 0.002 3.771 X14 Tổng doanh thu/Tổng tài sản (vòng)

Bảng 4.1 mô tả giá trị của 14 biến độc lập thông qua giá trị trung bình, trung vị, giá trị

nhỏ nhất và lớn nhất giúp chúng ta hiểu khái quát về bộ dữ liệu được sử dụng để xây

dựng các mô hình dự báo xác suất vỡ nợ.

Ma trận tương quan giữa các biến trong mô hình

Bảng 4.2: Ma trận tương quan

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10 X11 X12 X13 X14

Loan

Status

1.00

X1

0.40

1.00

X2

0.48

0.69

1.00

X3

0.28

0.35

0.60

1.00

X4

-0.27

-0.15

-0.39

-0.32

1.00

X5

-0.16

-0.04

-0.23

-0.62

0.59

1.00

X6

0.29

0.37

0.44

0.27

-0.64

-0.28

1.00

X7

0.17

0.28

0.48

0.28

-0.70

-0.36

0.72

1.00

X8

0.30

0.37

0.46

0.29

-0.23

-0.18

0.37

0.32

1.00

X9

0.25

0.25

0.49

0.27

-0.34

-0.19

0.34

0.43

0.57

1.00

X10

-0.12

0.10

0.14

-0.10

0.32

0.40

-0.07

-0.09

0.13

0.11

1.00

X11

-0.01

0.09

0.38

0.18

-0.37

-0.18

0.18

0.50

0.18

0.29

0.02

1.00

X12

-0.13

-0.62

-0.40

-0.19

0.08

0.00

-0.10

0.00

-0.36

-0.21

-0.19

-0.06

1.00

X13

-0.06

0.42

0.53

0.29

0.01

-0.05

0.06

0.14

0.35

0.29

0.31

0.25

-0.50

1.00

X14

Bảng 4.2 cho thấy mối quan hệ giữa các biến trong mô hình dự báo xác suất vỡ nợ, trong

ma trận tương quan trên có cặp biến độc lập có mức độ tương quan cao. Ví dụ: (i) biến X7

và X8: mức độ tương quan là 0,72; (ii) biến X2 và X3: mức độ tương quan là 0,69; (iii)

biến X5 và X8: mức độ tương quan là - 0,70. Tuy nhiên, các mức độ tương quan này đều

nhỏ hơn 0,8, do đó hiện tượng đa cộng tuyến giữa các biến trong mô hình có thể không

36

tác động quá lớn đến kết quả hồi quy của mô hình.

4.2. Kết quả hồi quy

4.2.1 Kết quả hồi quy của các mô hình tham số

Bảng 4.3: Kết quả hồi quy của các mô hình tham số

Complementary Logit Model Probit Model Log - Log Model

Coefficients: Estimate Estimate Estimate Std. Error Std. Error Std. Error

(Intercept) -4.853 5.659 -2.818 3.054 -2.348 4.112

X1 -1.446 5.659 -1.366 3.206 -1.505 4.047

X2 -1.717 2.909 -1.101 1.483 -1.038 2.013

X3 -71.83 * 37.327 -4.10 ** 1.974 -50.03 ** 24.00

X4 -1.057 2.260 -6.389 1.273 -0.136 1.621

X5 12.35 * 6.370 6.79 ** 3.270 7.98 ** 3.938

X6 0.103 0.084 6.298 4.921 0.079 0.066

X7 -4.250 2.913 -2.302 1.481 -3.136 2.251

X8 3.600 4.543 2.062 2.399 0.798 3.143

X9 -0.281 0.399 -1.424 2.116 -0.283 0.320

X10 -27.47 * 14.783 -1.50 ** 7.554 -14.91 * 8.087

X11 -2.841 2.781 -1.669 1.552 -2.510 2.030

X12 0.731** 0.354 3.95 ** 1.783 0.681 0.269

X13 -0.002 0.003 -9.152 1.454 -0.000 0.001

X14 -8.827 ** 4.288 -4.76 ** 2.133 -7.453 3.052

Signif. codes: ‘***’ 0.01 ‘**’ 0.05 ‘*’ 0.1

Kết quả hồi quy cho thấy rằng, trong cả 3 mô hình dự báo xác suất vỡ nợ, các biến độc

lập Lợi nhuận gộp/Doanh thu thuần (X1), Thu nhập trước thuế/Doanh thu thuần (X2),

Thu nhập trước thuế/Tổng tài sản (X3), Thu nhập trước thuế/Vốn chủ sở hữu (X4), Tài

sản ngắn hạn/Nợ ngắn hạn (X7), Lợi nhuận trước thuế và lãi vay/Lãi vay (X9), Thu nhập

37

trước thuế, lãi vay và khấu hao/Nợ dài hạn (X10), Tiền và các khoản tương đương

tiền/Vốn chủ sở hữu (X11), Các khoản phải thu/Doanh thu bình quân (X13), Tổng

doanh thu/Tổng tài sản (X14) có sự biến động ngược chiều với biến phụ thuộc. Sự biến

động này phù hợp với các kỳ vọng về dấu của các biến độc lập được trình bày trong

bảng 3.3. Tuy nhiên trong các biến độc lập trên, biến X13 có mức độ ảnh hưởng không

thực sự rõ ràng với các hệ số đo được trong mô hình logit và mô hình complementary

log-log lần lượt là – 0,002 và – 0,000. Ngược lại, các biến X3, X10 và X14 có mức độ

ảnh hưởng khá lớn đến kết quả dự báo khả năng vỡ nợ của doanh nghiệp với các hệ số

đo được rất lớn lần lượt là – 71,83; – 27,47 và – 8,827.

Điều này cho thấy rằng, nếu một doanh nghiệp có lợi nhuận gộp và thu nhập trước thuế

đạt giá trị càng lớn trên doanh thu thuần và vốn chủ sở hữu tức là khả năng tạo ra lợi

nhuận của doanh nghiệp càng lớn thì khả năng phá sản của doanh nghiệp đó càng thấp.

Thêm nữa, chỉ số thanh toán hiện hành càng cao tức là tỷ lệ tài sản ngắn hạn trên nợ

ngắn hạn càng lớn, đồng thời doanh nghiệp đó nắm giữ lượng tiền mặt trong công ty

càng nhiều thì khả năng phá sản của doanh nghiệp đó càng thấp. Khả năng trả lãi vay

được đo lường bởi tỷ lệ lợi nhuận trước thuế và lãi vay trên lãi vay chiếm tỷ lệ càng

lớn thì xác suất phá sản của doanh nghiệp đó cũng sẽ giảm. Ngoài ra, vòng quay tổng

tài sản càng lớn, tức là doanh nghiệp đó sử dụng các tài sản trong doanh nghiệp càng

hiệu quả thì khả năng vỡ nợ của doanh nghiệp càng có xu hướng giảm.

Các biến độc lập Tổng nợ phải trả/Tổng tài sản (X5), Tổng nợ phải trả/Vốn chủ sở hữu

(X6), (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn hạn (X8) và Giá vốn hàng bán/Hàng

tồn kho bình quân (X12) biến động cùng chiều với biến phụ thuộc. Sự biến động cùng

chiều này phù hợp với các kỳ vọng về dấu của các biến độc lập được dự báo trong các

nghiên cứu trước đây. Trong đó, biến X5 có mức độ tác động lớn đến kết quả của mô hình

dự báo xác suất vỡ nợ với các hệ số đo được trong mô hình logit, mô hình probit và mô

hình complementary log-log lần lượt là 12,35; 6,79 và 7,98. Ngược lại, biến X6 có mức

độ ảnh hưởng yếu hơn với hệ số đo được khá thấp lần lượt là 0,079 và 0,103.

Thông qua kết quả hồi quy có thể thấy một doanh nghiệp nếu sử dụng nợ vay càng nhiều

38

thì khả năng tự chủ tài chính càng thấp, áp lực tài chính càng lớn dẫn đến khả năng phá

sản càng cao. Bên cạnh đó, việc quản lý hàng tồn kho cũng đóng vai trò hết sức quan

trọng đến hiệu quả sinh lời của doanh nghiệp. Đặc biệt, các doanh nghiệp sản xuất phải

luôn tồn trữ một lượng hàng hóa nhất định để đảm bảo việc sản xuất được diễn ra liên tục

và giảm thiểu thiệt hại do biến động giá nguyên vật liệu.

Trong mô hình logit, có 5 trong số 14 biến độc lập có ý nghĩa thống kê, bao gồm các

biến X3, X5, X10, X12 và X14; trong đó biến X12 và X14 có ý nghĩa thống kê tại mức

5%, các biến còn lại có ý nghĩa thống kê tại mức 10%. Do đó, xác suất vỡ nợ được ước

lượng theo mô hình logit có thể được thể hiện như sau:

𝑒𝑌̂ 1+𝑒𝑌̂=

exp(−4,853−71,83𝑋3+12,35𝑋5− 27,47𝑋10+0,731𝑋12−8,847𝑋14) 1+ exp(−4,853−71,83𝑋3+12,35𝑋5− 27,47𝑋10+0,731𝑋12−8,847𝑋14)

P(𝑌𝑖 = 1)=

Trong mô hình probit, 5 biến X3, X5, X10, X12 và X14 cũng là 5 trong số14 biến độc

lập có ý nghĩa thống kê và toàn bộ đều có ý nghĩa thống kê tại mức 5%.Xác suất vỡ nợ

1

𝑡2 2 𝑑𝑡

được ước lượng theo mô hình probit có thể được thể hiện như sau:

− 2,818−4,10𝑋3+6,79𝑋5−1,50𝑋10+3,95𝑋12−4,76𝑋14 −∞

√2𝜋

𝑒 P(𝑌𝑖 = 1) = ∫

Tuy nhiên, trong mô hình complementary log-log, chỉ có 3 trong số 14 biến độc lập có

ý nghĩa thống kê, bao gồm các biến X3, X5 và X10; trong đó biến X10 có ý nghĩa

thống kê tại mức 10%, hai biến còn lại có ý nghĩa thống kê tại mức 5%. Xác suất vỡ nợ

được ước lượng theo mô hình complementary log-log có thể được thể hiện như sau:

F(−2,348 − 50,03𝑋3+ 7,98𝑋5 − 14,91𝑋10) = 1−exp(−exp(−2,348 − 50,03𝑋3+

39

7,98𝑋5 − 14,91𝑋10))

Ma trận Confussion của mô hình tham số

Bảng 4.4: Ma trận Confussion của mô hình logit

Logit Model Predicted class

Non-default Default

Non-default 208 56 Actual class

Default 18 68

Accuracy = 0.7886

Sensitivity = 0.8095

Specificity = 0.7879

Precision = 0.5484

F1 – Score = 0.6538

Bảng 4.5: Ma trận Confusion của mô hình probit

Probit Model Predicted class

Classes Non-default Default

Non-default 218 46

Default 18 68 Actual class

Accuracy = 0.8171

Sensitivity = 0.8095

Specificity = 0.8258

Precision = 0.5965

40

F1 – Score = 0.6869

Bảng 4.6: Ma trận Confusion của mô hình Complementary log-log

cloglog Model Predicted class

Classes Non-default Default

Non-default 84 180

Default 74 12 Actual class

0.7257 Accuracy =

0.8605 Sensitivity =

0.6818 Specificity =

0.4684 Precision =

0.6066 F1 – Score =

Thông qua bảng ma trận confusion của ba mô hình dự báo xác suất vỡ nợ tham số nêu

trên, ta có thể đưa ra một vài nhận xét như sau:

 Accuracycủa mô hình probit là cao nhất, tương ứng với tỷ lệ chính xác là 0,8171.

Điều này cho thấy rằng khả năng mô hình probit phân biệt được những công ty phá

sản và không phá sản chính xác lên đến 81,71%.

 Sensitivity của mô hình complementary log-log đạt 0,8605 – cao nhất trong ba mô

hình, cho thấy mô hình này có khả năng phát hiện trường hợp các công ty phá sản

chính xác lên đến 86,05%.

 Specificitycủa mô hình probit là cao nhất, tương ứng với tỷ lệ chính xác là 0,8258,

cho thấy mô hình này có khả năng phát hiện trường hợp các công ty không bị phá

sản chính xác lên đến 82,58%.

 Mặc dù các mô hình có sự khác nhau về Accuracy, Sensitivity, Specificity hay

Precision, nhưng nhìn chung mô hình probit mang lại kết quả tốt nhất khi có F1

41

Score đạt giá trị cao nhất, tương ứng với mức độ dự báo chính xác là 68,69%.

4.2.2 Kết quả hồi quy của mô hình phi tham số

Hình 4.1: Kết quả hồi quy của mô hình cây quyết định (Decision Tree)

Thông qua kết quả hồi quy của mô hình cây quyết định ta có thể thấy rằng mô hình này

sử dụng ba biến X9, X4 và X8 để dự báo xác suất vỡ nợ của doanh nghiệp. Khả năng dự

báo xác suất vỡ nợ qua ba biến độc lập trên được thực hiện thông qua các bước như sau:

- Bước 1: Sử dụng biến độc lập X9 để phân tách thành hai nhóm: phá sản và không

phá sản. Nếu X9≥ 0,55 thì kết luận doanh nghiệp đó rơi vào trường hợp 78% các

công ty có khả năng không bị phá sản. Ngược lại, thì xem xét đến bước tiếp theo.

- Bước 2: Nếu X9 < 0,55 và X4 < - 0,18 thì doanh nghiệp rơi vào nhóm 12% công ty

42

có khả năng bị phá sản. Ngược lại X4 ≥ - 0,18 ta xem xét đến bước tiếp theo.

- Bước 3: Nếu X9 < 0,55 và X4 ≥ - 0,18 và X8 < 0,34 thì doanh nghiệp rơi vào nhóm

3% các công ty có khả năng phá sản. Ngược lại X8 ≥ 0,34 thì doanh nghiệp rơi vào

nhóm 7% các công ty có khả năng không bị phá sản.

Bảng 4.7: Ma trận Confusion của mô hình cây quyết định (Decision Tree)

Decision Tree Predicted class

Classes Non-default Default

Non-default 251 13

Default 41 45 Actual class

Accuracy = 0.8457

Sensitivity = 0.5232

Specificity = 0.9508

Precision = 0.7759

F1 – Score = 0.6250

43

Hình 4.2: Kết quả của mô hình Random Forest

Bảng 4.8: Ma trận Confusion của mô hình Random forest

Random Forest Predicted class

Classes Non-default Default

Non-default 254 10

Default 28 58 Actual class

Accuracy = 0.8914

Sensitivity = 0.6744

Specificity = 0.9621

Precision = 0.8529

F1 – Score = 0.7532

Thông qua bảng ma trận confusion của hai mô hình dự báo xác suất vỡ nợ phi tham số

gồm mô hình cây quyết định và mô hình random forest, ta có thể nhận thấy rằng mô

hình random forest mang lại kết quả tốt hơn khi tất cả chỉ số Accuracy, Sensitivity,

Specificity, Precision và F1 – Score đều cao hơn so với mô hình cây quyết định. Điều

đó cho thấy sự vượt trội của mô hình random forest so với mô hình cây quyết định.

Kết luận chương 4: Chương này tác giả đã thực hiện phân tích kết quả hồi quy từ các mô

hình tham số và phi tham số, đồng thời dựa trên các chỉ tiêu được tính toán từ ma trận

confusion (Accuracy, Sensitivity, Specificity, Precision, F1 - Score) để so sánh và đánh

giá khả năng dự báo xác suất vỡ nợ của từng mô hình. Qua đó tìm ra mô hình phù hợp để

44

dự báo xác suất vỡ nợ của các doanh nghiệp.

CHƯƠNG 5: KẾT LUẬN

Toàn bộ kết quả nghiên cứu của đề tài đã được đề cập trong chương 4 của luận văn, theo

đó tác giả đã tìm được câu trả lời cho ba câu hỏi nghiên cứu được đề cập trong chương 1.

- Để giải quyết câu hỏi thứ nhất, tác giả đã sử dụng 14 biến độc lập tương ứng với 14

chỉ số tài chính quan trọng của doanh nghiệp để xác định khả năng vỡ nợ của các

khách hàng. Kết quả tìm thấy trong mô hình tham số, 5 biến đóng vai trò quan

trọng trong việc dự báo xác suất vỡ nợ của khách hàng, đó là các biến Thu nhập

trước thuế/Tổng tài sản (X3), Tổng nợ phải trả/Tổng tài sản (X5), Thu nhập trước

thuế, lãi vay và khấu hao/Nợ dài hạn (X10), Giá vốn hàng bán/Hàng tồn kho bình

quân (X12) và Tổng doanh thu/Tổng tài sản (X14). Trong khi đó, mô hình phi tham

số lại cho thấy 3 biến gồm Lợi nhuận trước thuế và lãi vay/Lãi vay (X9), Thu nhập

trước thuế/Vốn chủ sở hữu (X4) và (Tài sản ngắn hạn – Hàng tồn kho)/Nợ ngắn

hạn (X8) đóng vai trò quan trọng trong việc phân loại nhóm khách hàng phá sản và

không phá sản.

- Với câu hỏi thứ hai, tác giả đã sử dụng các tiêu chí cụ thể bao gồm: ma trận

confusion và điểm F1 – Score, qua đó lựa chọn mô hình phù hợp để dự báo xác suất

vỡ nợ đối với các doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt

Nam. Kết quả hồi quy trong chương 4 cho thấy mô hình phi tham số random forest

cho kết quả tốt nhất với mức dự báo chính xác lên đến 89,14%. Tuy nhiên, mô hình

này được xem là một trong những mô hình “black box”, vì vậy rất khó xác định

biến độc lập hay chỉ số tài chính nào tác động chính yếu đến khả năng vỡ nợ của

khách hàng. Do đó, các ngân hàng có thể xem xét để sử dụng các mô hình tham số,

đặc biệt là mô hình probit để dự báo xác suất vỡ nợ của khách hàng với mức độ

chính xác khoảng 81,71%, không chênh lệch quá lớn so với mô hình random forest,

nhưng lại giúp ngân hàng biết được các biến độc lập hay chỉ số tài chính nào tác

45

động đến khả năng phá sản của doanh nghiệp.

Trong chương 5 này, tác giả đưa ra một số kiến nghị cho các ngân hàng thương mại tại

Việt Nam, đồng thời nêu lên những mặt hạn chế trong quá trình thực hiện đề tài cũng như

gợi ý những hướng nghiên cứu mở rộng tiếp theo. Cụ thể bao gồm:

5.1 Ứng dụng mô hình để dự báo khả năng trả nợ của các khách hàng doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt Nam

5.1.1 Công cụ hỗ trợ trong việc xác định nhóm đối tượng khách hàng tiềm năng

Luận văn đã tìm ra được mô hình dự báo khả năng trả nợ (xác suất vỡ nợ) của các khách

hàng doanh nghiệp vừa và nhỏ tại các ngân hàng thương mại ở Việt Nam. Mô hình có thể

hỗ trợ ổn định chất lượng tín dụng, giảm thiểu nợ xấu phát sinh. Các khách hàng được

xếp hạng tín nhiệm đạt chuẩn (xếp hạng từ A trở lên) kết hợp với kết quả đo lường khả

năng trả nợ tốt theo mô hình sẽ có xác suất phát sinh nợ xấu không cao, theo đó rủi ro tín

dụng đối với nhóm khách hàng này nhỏ.

Có thể thấy mô hình là công cụ hỗ trợ cho các ngân hàng thương mại trong hoạt động cấp

tín dụng, đảm bảo chất lượng tín dụng, tạo điều kiện cho quá trình mở rộng và tăng

trưởng hiệu quả, an toàn, bền vững. Từ đó có thể giúp các ngân hàng chọn lọc và duy trì

cơ cấu khách hàng tốt, đẩy mạnh chiến lược marketing hướng tới nhóm các khách hàng ít

rủi ro và phát triển mạng lưới khách hàng có uy tín, đảm bảo khả năng trả nợ.

5.1.2 Kết quả mô hình là cơ sở định hướng chính sách tín dụng

Kết quả của mô hình là cơ sở để các ngân hàng thương mại định hướng thu hẹp tín dụng

đối với nhóm khách hàng yếu kém (xác suất vỡ nợ cao) và tăng trưởng tín dụng hiệu quả

đối với nhóm khách hàng hoạt động tốt (xác suất phá sản thấp). Đồng thời xây dựng chính

sách tín dụng phù hợp từng loại khách hàng về các điều kiện cấp tín dụng, chính sách lãi

suất, phí, yêu cầu về biện pháp bảo đảm,… nhằm đảm bảo an toàn trong hoạt động.

- Nhóm có xác suất vỡ nợ thấp: thực hiện cấp tín dụng với nhiều điều kiện ưu đãi

như áp dụng lãi suất ưu đãi, cấp tín dụng không có bảo đảm bằng tài sản hoặc có

bảo đảm một phần bằng tài sản, không quy định các điều kiện cam kết về các chỉ

46

số tài chính,…

- Nhóm có xác suất vỡ nợ trung bình: cấp tín dụng phù hợp với quy định chung của

ngân hàng, xem xét giảm lãi suất khi khách hàng thế chấp tài sản bảo đảm dưới tỷ

lệ theo quy định của nhóm khách hàng và sản phẩm tín dụng.

- Nhóm có xác suất vỡ nợ cao: không cấp tín dụng mới, thu hẹp dần số dư tín dụng

đã cấp trước đó, trong thời gian cấp tín dụng áp dụng lãi suất cao và ràng buộc

những điều kiện chặt chẽ về chỉ số tài chính hay những yêu cầu khắt khe khác

nhằm giảm thiểu rủi ro khách hàng không trả được nợ.

- Ngoài ra, cần tập trung cấp tín dụng đối với các khách hàng thuộc các ngành kinh

doanh có hiệu quả hoạt động cao, rủi ro vỡ nợ thấp; ngược lại cần có chính sách,

định hướng thu hẹp, tăng cường kiểm soát đối với các khách hàng thuộc nhóm

ngành có hiệu quả sinh lời thấp, rủi ro phá sản cao.

Bên cạnh đó, kết quả hồi quy các mô hình tham số trong Chương 4 cho thấy có 5 biến chỉ

số tài chính có ý nghĩa thống kê và ảnh hưởng lớn đến khả năng vỡ nợ của các doanh

nghiệp vừa và nhỏ, bao gồm Thu nhập trước thuế / Tổng tài sản, Tổng nợ phải trả / Tổng

tài sản, Thu nhập trước thuế, lãi vay và khấu hao / Nợ dài hạn, Giá vốn hàng bán / Hàng

tồn kho bình quân và Tổng doanh thu / Tổng tài sản. Kết quả nghiên cứu thực nghiệm chỉ

ra chỉ số Thu nhập trước thuế / Tổng tài sản, Thu nhập trước thuế, lãi vay và khấu hao/Nợ

dài hạn và Tổng doanh thu/Tổng tài sảncó biến động ngược chiều với khả năng phá sản

của doanh nghiệp, tức khả năng tạo ra doanh thu cũng như lợi nhuận của doanh nghiệp

càng lớn thì khả năng phá sản của doanh nghiệp càng thấp.Ngược lại, các chỉ số Tổng nợ

phải trả/Tổng tài sản và Giá vốn hàng bán/Hàng tồn kho bình quân biến động cùng chiều

với khả năng vỡ nợ của doanh nghiệp; điều này cho thấy rằng một doanh nghiệp nếu sử

dụng nợ vay càng nhiều thì áp lực tài chính càng lớn dẫn đến khả năng phá sản càng cao;

đồng thời nếu doanh nghiệp không có biện pháp quản lý và tích trữ hàng tồn kho phù hợp

thì cũng dễ dẫn đến khả năng vỡ nợ. Thông qua kết quả nghiên cứu trên, các ngân hàng

thương mại có thể sử dụng để đánh giá, lựa chọn khách hàng trong thực tế nhằm giảm

thiểu rủi ro khách hàng không trả được nợ vay.Cụ thể: ưu tiên cấp tín dụng đối với những

doanh nghiệpcó khả năng tạo ra doanh thu, lợi nhuận cao và cẩn trọng phân tích đánh giá

47

trước khi cấp tín dụng đối với các doanh nghiệp sử dụng nợ vay nhiều, khả năng tự chủ

tài chính thấp cũng như xem xét việc quản lý tồn trữ hàng tồn kho đối với các doanh

nghiệp sản xuất có đảm bảo cho hoạt động sản xuất được diễn ra liên tục và giảm thiểu

thiệt hại do biến động giá nguyên vật liệu thường xuyên thay đổi hay không.

Mặt khác thông tin đo lường khả năng trả nợ và kết quả của mô hình còn phản ánh nhiều

vấn đề liên quan đến tình hình hoạt động kinh doanh của doanh nghiệp cũng như lĩnh

vực – ngành sản xuất kinh doanh. Nhờ vậy, mô hình trở thành nguồn cung cấp thông tin

cho các hoạt động phân tích, đánh giá, dự báo và điều hành chính sách tín dụng trong

tương lai.

5.1.3 Vận dụng kết quả mô hình nhằm nâng cao hiệu quả quản lý rủi ro tín dụng ở các

ngân hàng thương mại

Việc dự báo được khả năng trả nợ của khách hàng không những là công cụ hỗ trợ các

ngân hàng trong việc xác định các đối tượng khách hàng tiềm năng mà còn giúp các ngân

hàng nâng cao chất lượng trong việc giám sát và tái xếp hạng khách hàng sau khi cấp tín

dụng. Trên cơ sở kết quả của mô hình, các ngân hàng thương mại có thể kịp thời phát

hiện và có biện pháp ứng xử tín dụng nhanh chóng đối với các khách hàng có vấn đề về

khả năng trả nợ (xác suất vỡ nợ cao), qua đó góp phần hạn chế rủi ro tổn thất mất vốn cho

ngân hàng.

Hiện nay, theo Quyết định số 493/2005/QĐ-NHNN ngày 22/04/2005 về phân loại nợ,

trích lập và sử dụng dự phòng để xử lý rủi ro tín dụng trong hoạt động ngân hàng của các

tổ chức tín dụng; các ngân hàng thương mại tại Việt Nam đa phần vẫn áp dụng việc trích

lập dự phòng theo kết quả phân loại nợ khách hàng, từ đó trích lập dự phòng theo tỷ lệ

phù hợp. Vì vậy, nếu các ngân hàng thương mại có thể dự báo tốt khả năng trả nợ (xác

suất vỡ nợ) của các khách hàng thì việc trích lập dự phòng trở nên dễ dàng hơn nhiều,

theo đó việc xây dựng Quỹ dự phòng rủi ro tín dụng cũng hiệu quả hơn.

5.2 Hạn chế của đề tài và hướng nghiên cứu tiếp theo

5.2.1 Hạn chế của đề tài

48

Ngoài kết quả đạt được luận văn cũng có một số giới hạn và khó khăn nhất định.

Hạn chế nổi bật nhất của nghiên cứu này là tập hợp dữ liệu nhỏ. Do hạn chế về thời gian,

chỉ có 350 doanh nghiệp được thu thập và giới hạn trong 9 lĩnh vực kinh doanh.Số biến

đầu vào là 14, phù hợp với số lượng quan sát. Tuy nhiên, mẫu này được coi là nhỏ, dẫn

đến thiếu các kết quả quan trọng.

Bên cạnh đó, chất lượng nguồn thông tin đầu vào chưa cao. Tuy để đảm bảo chất lượng

của nguồn thông tin, các báo cáo tài chính được thu thập đã được kiểm toán nhưng chất

lượng kiểm toán các báo cáo tài chính tại Việt Nam chưa thực sự minh bạch, rõ ràng và

mang lại hiệu quả cao như ở các nước phát triển. Tại Việt Nam, một doanh nghiệp có

thể lập ba hoặc bốn báo cáo tài chính để phục vụ cho nhiều mục đích khác nhau như gửi

cơ quan thuế, gửi ngân hàng, kiểm toán, kiểm soát nội bộ… Do đó việc kiểm soát, đánh

giá chất lượng thông tin đầu vào của mô hình là rất quan trọng để thu được kết quả

chính xác nhất.

Ngoài ra, mô hình xếp hạng tín nhiệm được đề cập trong luận văn chỉ được xây dựng dựa

trên các chỉ số tài chính, không xét đến các yếu tố phi tài chính như các mô hình xếp hạng

tín dụng nội bộ đang được áp dụng tại các ngân hàng thương mại ở Việt Nam hiện nay.

Trong thực tế, nhiều trường hợp báo cáo tài chính khách hàng cung cấp không phản ánh

đúng, đầy đủ kết quả hoạt động kinh doanh cũng như tình hình tài chính của đơn vị nên

các ngân hàng phải dựa vào các thông tin phi tài chính để sàng lọc, phân loại khách hàng.

5.2.2 Hướng nghiên cứu trong tương lai

Tôi đề xuất nghiên cứu sâu hơn trong các lĩnh vực/khu vực như sau:

Mở rộng tập hợp dữ liệu và khoảng thời gian: Để có được kết quả đáng tin cậy hơn, số

lượng doanh nghiệp được thu thập được mở rộng lên 1.000 doanh nghiệp hoặc thậm chí

cao hơn. Bên cạnh đó, thay vì thu thập báo cáo tài chính hàng năm, có thể thu thập báo

cáo tài chính doanh nghiệp hàng quý để đạt được mức độ chính xác cao hơn.

Ngoài ra, trường hợp số liệu thu thập đủ lớn và có thể phân tách theo từng nhóm khách

hàng thuộc các ngành kinh doanh khác nhau cũng sẽ mang lại kết quả chính xác và phù

hợp với đặc thù hoạt động kinh doanh của từng doanh nghiệp, tăng khả năng ứng dụng

49

của mô hình vào thực tế.

TÀI LIỆU THAM KHẢO

Danh mục tài liệu tham khảo tiếng Việt

Hay Sinh, 2003, “Ước tính xác suất phá sản trong thẩm định giá trị doanh nghiệp”, Tạp

chí Phát triển & Hội nhập – Số 8 (18).

Lê Đạt Chí và Lê Tuấn Anh (2012), “Kết hợp phương pháp Cvar và mô hình

Merto/KMV để đo lường rủi ro vỡ nợ: Bằng chứng thực nghiệm ở Việt Nam”, Tạp chí

Phát triển & Hội nhập – Số 5 (15).

Lê Nguyễn Sơn Vũ, 2013, Quyết định đầu tư và rủi ro phá sản của các công ty niêm yết

trên thị trường chứng khoán Việt Nam, Luận văn thạc sĩ kinh tế, Trường Đại học Kinh tế

Thành phố Hồ Chí Minh.

Nguyễn Thị Tuyết Lan, 2019, “Các nhân tố ảnh hưởng đến rủi ro phá sản của các doanh

nghiệp niêm yết ngành xây dựng tại Việt Nam”, Tạp chí Khoa học & Đào tạo Ngân

hàng – Số 205.

Võ Hồng Đức và Nguyễn Đình Thiên (2013a), “XHTN doanh nghiệp niêm yết tại Việt

Nam sử dụng lý thuyết mờ”,Tạp chí Phát triển kinh tế - Số 269.

Danh mục tài liệu tham khảo tiếng Anh

Altman, Edward I, 1968. Financial Ratios, Discriminant Analysis and the Prediction of

Corporate Bankruptcy. Journal of Finance, 189-209.

Beaver, 1996. Financial Ratios As Predictors of Failure. Journal of Accounting

Research,71-111.

Brieman, 1980. Classification and regression trees. Chapman and Hall.

Dombolena, I. and S. Khoury, 1980. Ratio Stability and Corporate Failure. Journal of

Finance, 1017-1026.

Evridiki Neophytou, Andreas Charitou and Chris Charalambous, 2000. Predicting

Corporate Failure: Empirical Evidence for the UK. Journal of Accounting Literature.

Fisher, R. 1936.The Use of Multiple Measurements in Taxonomic Problems.Annals of

50

Eugenics 7,179-188.

Fitzpatrick, F., 1932.A Comparison of Ratios of Successful Industrial Enterprises with

Those of Failed Firm. Certified Public Accountant, 6, 727-731.

HaydenEvelyn and Daniel Porath, 2010.Statistical Methods to Develop Rating Models.

The Basel II Risk Parameters, 1-12.

HaydenEvelyn, 2010. Estimation of a Rating Model for Corporate Exposures. The Basel

II Risk Parameters, 13-24.

Ho Tin Kam, 1995. Random Decision Forests, Proceedings of the 3rd International

Conference on Document Analysis and Recognition, Montreal, 278-282.

Leo Breiman, Jerome Friedman and Charles J. Stone, 1984. Classification and

Regression Trees. R.A. Olshen.

M. Fernandez Delgado, E. Cernadas, S. Barro and D. Amorim, 2014.Do we Need

Hundreds of Classifiers to Solve Real Worls Classification problems?. Journal of

Machine Learning Research.

Myers and Forgy, 1963. The development of numerical credit evaluation system. Journal

of the American Statistical Association, 799-806.

Odom and Sharda,1993. A Neural Network for Bankruptcy Prediction. International

Joint Conference on Neural Networks, 163-168.

Ong, M. 2005, Internal Credit Risk Models Capital Allocation and Performance

Measurement, Risk Books .

Oslo. Hosmer, D. W., Jovanovic, B., and Lemeshow, S., 1989.Best subsets logistic

regression, Biometrics, 1265-1270.

Patcha, A. and Park, J.M, 2009. An overview of outlier detection techniques: Existing

solutions and latest technological trends. Computer Networks 3448-3470

Platt, H.D., 1991. Predicting corporate financial distress: Reflections on choice-based

sample bias. Journal of Economics and Finance 2002.

Rajan R, Zingales L. What do we know about capital structure? some evidence from

51

international data. Journal of Finance 1995; 1421-1460.

Serrasqueiroand Macas Nunes. Non-linear relationships between growth opportunities

and debt: Evidence from quoted Portuguese companies. J Business Research 2009,870-

878.

Stehman and Stephen, 1997. Selecting and interpreting measures of thematic

classification accuracy. Remote Sensing of Environment, 77-89.

Sudhakar, M., and Reddy C.V.K. Two Step Credit Risk Assessment Model For

Retail Bank Loan Applications Using Decision Tree Data Mining Technique.

International Journal of Advanced Research in Computer Engineering & Technology

2016, 705-718.

Svetnik 2003. Random Forest:A Classification and Regression Tool for Compound

Classification and QSAR Modeling. Journal of Chemical Information Computer

52

Science, 1947–1958.

PHỤ LỤC

Bảng 01: Các biến đầu vào của RiskCalcTM - mô hình công ty tư nhân Nhật Bản

Chỉ số tài chính Cách tính

Khả năng sinh lời Lợi nhuận thuần từ hoạt động kinh doanh

trên tổng tài sản

Đòn bẩy tài chính Tổng nợ trên tổng tài sản

Khả năng thanh khoản Tiền mặt trên tài sản ngắn hạn

Khả năng trả nợ gốc Thu nhập giữ lại trên nợ ngắn hạn

Khả năng trả lãi vay Lợi nhuận gộp trên tổng chi phí lãi vay

Quy mô Tổng doanh thu

Chỉ số hoạt động Tổng hàng tồn kho trên tổng doanh thu

53

Nguồn: Báo cáo của Moody: RiskCalc for Japanese private companies, 2001

Bảng 02: Biến đầu vào được lựa chọn bởi Engelmann and Rauhmeier

Chỉ số tài chính Yếu tố rủi ro

Tổng nợ phải trả / Tổng tài sản

Vốn chủ sở hữu / Tổng tài sản Đòn bẩy tài chính

Nợ ngân hàng / Tổng tài sản

Nợ ngắn hạn/ Tổng tài sản Khả năng

thanh khoản Tài sản ngắn hạn / Nợ ngắn hạn

Các khoản phải thu / Doanh thu thuần Chỉ số hoạt động Các khoản phải trả / Doanh thu thuần

Khả năng kiểm soát (Doanh thu thuần - Chi phí nguyên liệu) / Chi phí nhân công chi phí

Hiệu quả sử dụng Doanh thu thuần / Tổng tài sản tài sản

Lợi nhuận trước thuế và lãi vay / Tổng tài sản Khả năng sinh lời Lợi nhuận thuần từ hoạt động kinh doanh / Tổng tài sản

Tổng tài sản Quy mô

Doanh thu thuần / Doanh thu thuần năm liền kề Tốc độ tăng trưởng

Tốc độ gia tăng Tổng nợ phải trả / Tổng nợ phải trả năm liền kề nợ vay

54

Nguồn: Báo cáo của Risk Parameter, 2010