BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM

TRẦN NGỌC PHÚC

PHÂN TÍCH CHỈ SỐ TÀI CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BÁO CÁO TÀI CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TRÊN THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM LUẬN VĂN THẠC SĨ KINH TẾ TP.HCM NĂM 2013

BỘ GIÁO DỤC VÀ ÐÀO TẠO TRUỜNG ÐẠI HỌC KINH TẾ TP.HCM TRẦN NGỌC PHÚC PHÂN TÍCH CHỈ SỐ TÀI CHÍNH ÐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BÁO CÁO TÀI CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TRÊN THỊ TRUỜNG CHỨNG KHOÁN VIỆT NAM Chuyên ngành: Kế toán Mã số: 62.34.30.01 LUẬN VĂN THẠC SĨ KINH TẾ NGUỜI HUỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN VIỆT TP.HCM NĂM 2013

MỤC LỤC

Trang phụ bìa

LỜI CAM ĐOAN

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG BIỂU

MỤC LỤC

PHẦN MỞ ĐẦU ....................................................................................................1

1. Tính cấp thiết của đề tài:......................................................................................1

2. Mục tiêu nghiên cứu:...........................................................................................3

3. Đối tượng và phạm vi nghiên cứu:.......................................................................4

4. Phương pháp nghiên cứu: ....................................................................................4

5. Khả năng ứng dụng (tính thực tế) của đề tài:........................................................5

6. Kết cấu đề tài:......................................................................................................5

CHƯƠNG I: GIAN LẬN BÁO CÁO TÀI CHÍNH VÀ KHAI PHÁ DỮ LIỆU TRÊN TỶ SỐ TÀI CHÍNH ........................................................................6

1.1. Gian lận và tỷ số tài chính:.............................................................................6

1.1.1 Các phương pháp gian lận phổ biến: ...............................................................6

1.1.2 Tỷ số tài chính và ý nghĩa: ............................................................................12

1.1.3 Công cụ mới nhằm hoàn thiện quy trình kiểm toán đối với gian lận, sai sót:.15

1.1.4 Xác định tỷ số tài chính phát hiện gian lận sai sót trong BCTC:....................16

1.2. Phân loại lĩnh vực doanh nghiệp niêm yết: .................................................19

1.3. Các công trình nghiên cứu về sử dụng tỷ số tài chính để phát hiện gian lận sai sót trong BCTC:.......................................................................................22

1.4. Kỹ thuật khai phá dữ liệu: ...........................................................................26

1.4.1. Khai phá dữ liệu (Data mining) là gì? ..........................................................26

1.4.2. Quá trình khai phá dữ liệu:...........................................................................27

1.4.3 Công cụ khai phá dữ liệu: .............................................................................29

1.4.4. Phương pháp khai phá dữ liệu:.....................................................................29

1.4.5. Tóm tắt về khai phá dữ liệu - vai trò và ý nghĩa: ..........................................34

Kết luận chương 1: ................................................................................................ 36

CHƯƠNG II. THỰC TRẠNG GIAN LẬN VÀ PHÂN TÍCH CHỈ SỐ TÀI CHÍNH ĐỂ ĐỂ PHÁT HIỆN GIAN LẬN TRÊN CÁC BÁO CÁO TÀI CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TẠI VIỆT NAM : ........... 37

2.1. Thực trạng gian lận và sai sót trên BCTC tại các công ty niêm yết:.......... 37

2.1.1 Các phương pháp gian lận trên BCTC tại các công ty niêm yết ở Việt Nam thường gặp: ........................................................................................................... 37

2.1.2 Thực trạng sử dụng chỉ số tài chính/thực hiện thủ tục phân tích trong các công ty kiểm toán:................................................................................................. 42

2.2. Sử dụng kỹ thuật khai phá dữ liệu để phát hiện gian lận trong trình bày báo cáo tài chính: ................................................................................................ 43

2.2.1 Môi trường thực nghiệm:.............................................................................. 43

2.2.1.1 Lựa chọn công cụ hỗ trợ cho khai phá dữ liệu:.......................................... 44

2.2.1.2 Tiền xử lý dữ liệu:...................................................................................... 45

2.2.1.3 Mô hình hóa công việc: ............................................................................. 48

2.2.2 Tính hữu ích khi sử dụng tỷ số tài chính phân tích BCTC gian lận: .............. 49

2.2.2.1 Sử dụng mô hình Bayesian Network: ......................................................... 49

2.2.2.2 Sử dụng mô hình cây quyết định ............................................................... 51

2.2.2.3 Sử dụng mô hình Multilayer Perceptron .................................................... 60

2.2.3 Áp dụng các luật phân lớp tìm được để phân lớp báo cáo tài chính mới:....... 64

Kết luận chương 2:................................................................................................ 67

CHƯƠNG III: GIẢI PHÁP NÂNG CAO TÍNH HỮU ÍCH KHI VẬN DỤNG TỶ SỐ TÀI CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BCTC.................................................................................................... 69

3.1. Giải pháp nâng cao tính hữu ích khi vận dụng tỷ số tài chính để phát hiện gian lận, sai sót trong BCTC:: .................................................................... 69

3.1.1 Tăng cường, bổ sung công cụ cho các thủ tục kiểm toán tiêu chuẩn truyền thống:

............................................................................................................... 69

3.1.2 Sử dụng hiệu quả nguồn cơ sở dữ liệu ngày càng nhiều để cạnh tranh:.......... 70

3.1.3 Ứng dụng khoa học công nghệ, nâng cao trình độ kiểm toán viên: ................ 72

3.1.4 Khai phá dữ liệu hỗ trợ thêm cho dịch vụ, ngành nghề mới:.......................... 74

3.1.5 Nghiên cứu về khả năng dự báo gian lận:...................................................... 76

3.1.6 Quản trị công ty:............................................................................................ 77

3.1.7 Quản lý chất lượng dịch vụ kiểm toán: ..........................................................78

3.2. Hiệu đính, bổ sung và hướng dẫn chi tiết các chuẩn mực kiểm toán:....... 79

3.2.1 Nâng cao trách nhiệm của kiểm toán viên: .............................................................. 79

3.2.2 Ban hành hướng dẫn chi tiết về thủ tục phân tích: ................................................... 81

3.2.3 Khai thác dữ liệu – sự cần thiết một khung pháp lý:................................................ 84

3.3. Hạn chế và đề xuất nghiên cứu sâu hơn: .....................................................85

3.3.1 Hoàn thiện mẫu dữ liệu: ................................................................................85

3.3.2 Phân tích các biến số (tỷ số tài chính và phi tài chính):..................................87

3.3.3 Sự “vận dụng ngược”: ...................................................................................89

3.3.4 Nâng cao kiến thức phần mềm và lý thuyết về kiểm toán gian lận:................91

KẾT LUẬN..........................................................................................................94

TÀI LIỆU THAM KHẢO

Tài liệu tiếng Việt

Tài liệu tiếng Anh

Phụ lục

Bảng P.1dữ liệu sử dụng mô hình khai phá dữ liệu với Weka trong đề tài ............i

Bảng P.2 Kết quả của mô hình học máy cây quyết định J4.8 ngành công nghiệp ..................................................................................................................ii

Bảng P.3: Kết quả của mô hình học máy cây quyết định J4.8 ngành CNTT........iiv

Bảng P.4: Kết quả của mô hình học máy cây quyết định J4.8 ngành DVTD........iv

Bảng P.5: Kết quả của mô hình học máy cây quyết định J4.8 ngành HTD............v

Bảng P.6: Kết quả của mô hình học máy cây quyết định J4.8 ngành năng lượng..................................................................................................................vii

Bảng P.7: Kết quả của mô hình học máy cây quyết định J4.8 ngành NVL.........viii

Bảng P.8: Kết quả của mô hình học máy cây quyết định J4.8 ngành Y tế ............ix

Kết quả của luật kết hợp......................................................................................xi

Bảng câu hỏi khảo sát......................................................................................xviii

Bảng tổng hợp kết quả khảo sát........................................................................xxii

1

PHẦN MỞ ĐẦU

1. Tính cấp thiết của đề tài:

Báo cáo tài chính (BCTC) là một công cụ nhằm duy trì tính minh bạch trong các

hoạt động kinh doanh, là một bộ phận bắt buộc phải công khai đối với công ty niêm

yết và công ty đại chúng.

Tầm quan trọng của báo cáo tài chính đối với người quản lý, nhà đầu tư, nhà cung

cấp, ngân hàng hay bất kỳ bên tham gia thị trường vốn nào là quá rõ. Tuy nhiên, một

vấn đề tồn tại từ lâu trên thế giới cũng như Việt Nam, đó là các Báo cáo tài chính

công bố có những gian lận, sai sót, đây là một vấn đề nghiêm trọng của xã hội và

ảnh hưởng lớn tới nền kinh tế. Nhiều trường hợp gian lận báo cáo tài chính đã làm

suy yếu niềm tin vào các thị trường vốn của Việt Nam cũng như thế giới. Đặc biệt là

hàng loạt các công ty hàng đầu trên thế giới bị phá sản hoặc bị đẩy đến bờ vực phá

sản do các bê bối kế toán, gian lận trong công bố thông tin trên Báo cáo tài chính

trong thời gian gần đây như: AIG, BusinessWeek, Lucent, Xerox, Rite Aid, Waste

Management, Micro Strategy, Raytheon, Sunbeam, Enron, Worldcom, Global

Crossing, Adelphia, Qwest, Satyam (Ấn Độ).

Gian lận luôn là một nguy cơ lớn đối với các doanh nghiệp trên toàn thế giới.

Không có cách nào để dự đoán những người sẽ gian lận. Hơn nữa, vì gian lận là

hành vi cố ý che dấu bởi các thủ thuật thông minh và tinh vi nên nó thường rất khó

phát hiện trong một thời gian. Gian lận làm tiêu tốn rất nhiều chi phí của xã hội.

Theo thống kê của Hiệp hội kiểm tra chứng nhận gian lận (ACFE) trong năm 2009-

2010, các tổ chức mất trung bình 5% doanh thu vì gian lận. Và trong đó gian lận báo

cáo tài chính là loại gian lận chiếm chi phí cao nhất (86,3% trên tổng chi phí của

gian lận trong năm 2010 theo ACFE). Cuộc khảo sát gian lận toàn cầu lần thứ 11 của

Ernst&Young tiến hành cũng trong thời gian này đã phát hiện rằng, về tổng thể, các

gian lận trọng yếu trong 2 năm đã tăng lên 3% (16% trả lời có gian lận năm 2009, số

liệu này của năm 2008 là 13%).

2

Tại Việt Nam, Công ty Bông Bạch Tuyết (BBT), Công ty Cổ phần Dược Viễn

Đông (DVD) có thể không phải là những trường hợp duy nhất thiếu minh bạch dẫn

đến thiệt hại cho nhà đầu tư.

Trong mùa công bố BCTC năm 2011, tính đến đầu tháng 04/2012 thì đã có đến

khoản 8% doanh nghiệp niêm yết trên Sở giao dịch chứng khoán TP.HCM có sai

lệch với báo cáo kiểm toán. Cùng với tình hình kinh tế khó khăn, khủng hoảng, tình

trạng sai lệch này diễn ra ngày càng đáng quan ngại. Việc phát sinh gian lận trên

Báo cáo tài chính ở những công ty có tầm vóc lớn đã làm phát sinh sự quan tâm

ngày càng nhiều về tính trung thực, hợp lý của Báo cáo tài chính, thậm chí gây nghi

ngờ về chất lượng báo cáo kiểm toán. Nó cũng là thách thức lớn đối với người quản

lý công ty cũng như đối với kiểm toán viên. Do đó, gian lận luôn là chủ đề được

nhiều nhà nghiên cứu và nhiều nghề nghiệp khác nhau quan tâm.

Tính trung thực trong báo cáo tài chính có ý nghĩa đặc biệt quan trọng nên các

nước trên thế giới đều có những động thái tích cực như là ban hành các đạo luật

nhằm thắt chặt công việc của kiểm toán, các luật bảo vệ nhà đầu tư để ngăn chặn

gian lận và sai sót trên báo cáo tài chính (Đạo luật Sarbanes-Oxley).

Kiểm toán được đòi hỏi yêu cầu và nhiệm vụ cao hơn khi mà càng ngày càng có

nhiều bằng chứng cho thấy sổ sách kế toán bị “xào nấu” được áp dụng rộng rãi.

Từ lâu đã có nhiều nghiên cứu trên thế giới về việc sử dụng chỉ số tài chính để

phát hiện gian lận trên báo cáo tài chính. Thực sự việc này có hữu ích hay không khi

áp dụng vào Việt Nam? Gần đây các nghiên cứu tập trung vào việc kiểm tra sự hữu

dụng của việc thống kê và các thuật toán khác nhau trên máy tính, ví dụ như thống

kê hồi quy và mạng nơ-ron chống giả mạo (artificial neural networks) để tăng cường

phát hiện gian lận BCTC. Các phương pháp này dựa trên nền tảng là chỉ số tài chính.

Chỉ số tài chính vốn dĩ được sử dụng để phân tích vào nhiều khía cạnh khác nhau,

và khá quan trọng (chiếm 33% trong tổng tính điểm xếp hạng tín nhiệm) khi thực

hiện xếp hạng tín dụng doanh nghiệp của Ngân hàng nhà nước, ảnh hưởng rất lớn tới

chất lượng tín dụng của hệ thống ngân hàng, quyết định đầu tư của các nhà đầu tư và

3

nhà phân tích chứng khoán, quyết định của doanh nghiệp có nên phá sản sớm để

không gây tác động tiêu cực đến nền kinh tế - đặc biệt là trong điều kiện nền kinh tế

bất ổn (lạm phát và chi phí vay) như hiện nay.

Báo cáo tài chính gian lận có thể khó để phát hiện nhưng không phải là không thể,

vì vậy việc hoàn thiện các tiêu chuẩn để phát hiện gian lận, sai sót trong báo cáo tài

chính là một yêu cầu cấp thiết, đặc biệt là ở các doanh nghiệp niêm yết. Các công ty

kiểm toán của Việt Nam đa phần là các công ty nhỏ, năng lực nhân sự và việc sử

dụng phần mềm có hạn chế. Các nghiên cứu này nếu hữu hiệu để áp dụng trong thị

trường niêm yết ở Việt Nam sẽ giúp ích rất nhiều cho kiểm toán.

Tuy nhiên bản thân người viết nhận thấy việc phân tích trên có nên phụ thuộc quá

nhiều vào các chỉ số này và có còn chính xác không khi mà thời gian gần đây, gian

lận trong báo cáo tài chính ngày càng bị phát hiện nhiều; và ảnh hưởng như thế nào

nếu sử dụng chính những chỉ số này để phát hiện gian lận, sai sót trong các báo cáo

tài chính.

Người viết mong muốn áp dụng các phương pháp đã được thực nghiệm trong các

nghiên cứu trên thế giới vào thị trường Việt Nam – mà tập trung vào các doanh

nghiệp niêm yết – để xem tính hữu ích khi áp dụng, từ đó phát hiện những kinh

nghiệm và bài học cho việc phân tích chỉ số tài chính để phát hiện gian lận, sai sót

trong BCTC nhằm nâng cao hiệu quả của chất lượng Báo cáo kiểm toán.

2. Mục tiêu nghiên cứu:

Trên phương diện nghiên cứu, khai phá dữ liệu và ứng dụng của nó vào lĩnh vực

kinh tế và kiểm toán vẫn còn là một nội dung chưa được quan tâm nhiều. Trong

nghiên cứu này, tác giả tập trung nghiên cứu đánh giá việc ứng dụng khai phá dữ

liệu sử dụng chỉ số tài chính để phát hiện gian lận trong Báo cáo tài chính. Cụ thể

hơn, luận văn sẽ giải quyết các mục tiêu nghiên cứu sau:

1. Khả năng ứng dụng khai phá dữ liệu trong phát hiện gian lận trong Báo

cáo tài chính.

4

2. Lựa chọn mô hình, phương pháp khai phá dữ liệu phù hợp trong phát

hiện gian lận Báo cáo tài chính.

3. Tìm ra nhóm biến (là các tỷ số tài chính)có khả năng khai phá dữ liệu để

phát hiện gian lận sai sót trong báo cáo tài chính trên thị trường chứng

khoán ở Việt Nam.

Giới thiệu, áp dụng và đánh giá việc sử dụng các phương pháp khai thác dữ liệu,

mục đích là từ đó sẽ đóng góp cho các nghiên cứu liên quan đến việc phát hiện quản

lý gian lận bằng cách áp dụng thống kê và mạng trí tuệ nhân tạo dựa trên khai thác

dữ liệu báo cáo tài chính công bố công khai.

3. Đối tượng và phạm vi nghiên cứu:

Đối tượng nghiên cứu: Các chỉ số tài chính được kiểm toán viên và các nhà

nghiên cứu sử dụng để phát hiện gian lận trong BCTC và các phương pháp khai thác

dữ liệu (Data Mining).

Phạm vi nghiên cứu: mẫu bao gồm các chỉ số tài chính thu được từ 202 BCTC

(nghĩa là Bảng cân đối và báo cáo kết quả hoạt động kinh doanh) của các công ty

niêm yết trên thị trường Việt Nam từ năm 2009 đến năm 2011. Các công ty này

được phân thành 8 lĩnh vực công nghiệp chủ yếu trong nền kinh tế.

4. Phương pháp nghiên cứu:

+ Câu hỏi nghiên cứu:

Quan điểm và bằng chứng thực nghiệm trong việc ứng dụng khai phá dữ liệu

trong phát hiện gian lận trong Báo cáo tài chính?

Khả năng ứng dụng khai phá dữ liệu trong phát hiện gian lận, sai sót trong BCTC

trneen thị trường chứng khoán Việt Nam?

Tỷ số tài chính nào hữu ích khi dùng để phát hiện gian lận trong BCTC trên thị

trường chứng khoán Việt Nam?

Phân tích, khai phá dữ liệu như thế nào thì hữu hiệu nhất để phát hiện BCTC có

gian lận?

+ Các phương pháp thực hiện:

5

Để giải quyết các nội dung nghiên cứu nêu trên, tác giả đã sử dụng phương pháp

định tính như khảo sát thực tiễn và phỏng vấn trực tiếp các kiểm toán viên hành

nghề, kế toán nhằm đánh giá thực trạng và thu thập thông tin phục vụ nghiên cứu.

Đồng thời tác giả sử dụng phương pháp định lượng dựa trên sử dụng Data mining

với các kỹ thuật khai thác dữ liệu được thử nghiệm ứng dụng để phát hiện gian lận

quản lý: cây quyết định, Neural Networks và Bayesian Belief Networks để có được

những kết quả tài chính các mô hình. Việc triển khai quá trình ứng dụng Data

mining trong phát hiện gian lận trong BCTC trên thị trường chứng khoán Việt Nam

được dựa trên quy trình đề xuất 6 bước của nhà nghiên cứu R Gupta. Ngoài ra quá

trình thử nghiệm Data mining được thực hiện dựa trên phần mềm hỗ trợ xử lý dữ

liệu Weka 3.7.

5. Khả năng ứng dụng (tính thực tế) của đề tài:

Có thể ứng dụng hướng đến việc áp dụng Data mining trong kiểm toán: quá trình

mô hình hóa dữ liệu để phát hiện gian lận trong báo cáo tài chính bằng thống kê

(statistical), máy học (machine learning), mạng nơ ron (neural network) để suy diễn

về các độ tương quan khi có gian lận trong báo cáo tài chính xảy ra.

Kết quả này là nền tảng để giúp phát triển các công cụ để giúp việc kiểm toán

hiệu quả hơn. Ngoài ra, kết luận của luận văn cũng giúp các nhà nghiên cứu, chính

phủ xây dựng chuẩn mực kiểm toán phù hợp

6. Kết cấu đề tài:

Chương 1: Gian lận Báo cáo tài chính và khai phá dữ liệu trên tỷ số tài chính:

Chương 2: Thực trạng gian lận và sử dụng chỉ số tài chính dùng kỹ thuật khai phá

dữ liệu để phát hiện gian lận trên các báo cáo tài chính của các doanh nghiệp niêm

yết tại Việt Nam:

Chương 3: Giải pháp nâng cao tính hữu ích khi vận dụng chỉ số tài chính để phát

hiện gian lận, sai sót trong BCTC

Ngoài ra luận văn còn đính kèm thêm một số phụ lục.

6

CHƯƠNG I: GIAN LẬN BÁO CÁO TÀI CHÍNH VÀ KHAI PHÁ DỮ LIỆU

TRÊN TỶ SỐ TÀI CHÍNH

1.1. Gian lận và tỷ số tài chính:

Việc yêu cầu tính toán tỷ số tài chính là bắt buộc khi lập Báo cáo tài chính ở Việt

Nam. Một vài nghiên cứu trước đây nói rằng tỷ số này là “vô dụng” trong việc xác

định gian lận báo cáo tài chính [Kathleen et al. (2004)], trong khi một số người thì

nói ngược lại [Spathis (2002), Persons (1995)]. Những xung đột trong nghiên cứu

này cho thấy cuộc tranh luận vẫn còn. Bài viết này nhằm xem xét liệu các tỷ lệ tài

chính hiện nay có thể phát hiện gian lận khi áp dụng vào Việt Nam. Nếu nghiên cứu

xác nhận điều này đúng thì việc sử dụng các tỷ số khuyến cáo trong nghiên cứu này

sẽ có ích cho Kiểm toán viên, Chính phủ và các bên quan tâm khác.

1.1.1 Các phương pháp gian lận phổ biến:

SAS 99 phân loại các sai sót liên quan đến gian lận thành hai loại: một là các

gian lận liên quan đến báo cáo tài chính, hai là các gian lận liên quan đến việc biển

thủ tài sản.

Trong chuẩn mực kiểm toán VN số 240 “ Gian lận và sai sót”, gian lận và sai sót

được định nghĩa trong đoạn 4 như sau : Gian lận là những hành vi cố ý làm sai lệch

thông tin kinh tế, tài chính do một hay nhiều người trong Hội đồng quản trị, BGĐ,

các nhân viên hoặc bên thứ ba thực hiện làm ảnh hưởng đến BCTC. Gian lận có thể

được biểu hiện dưới các hình thức tổng quát sau :

- Xuyên tạc, làm giả chứng từ, tài liệu liên quan đến BCTC

- Sửa đổi chứng từ, tài liệu kế toán làm sai lệch BCTC

- Biển thủ tài sản

- Che dấu hoặc cố ý bỏ sót các thông tin, tài liệu hoặc nghiệp vụ kinh tế làm

sai lệch BCTC

- Ghi chép các nghiệp vụ kinh tế không đúng sự thật

- Cố ý áp dụng sai các chuẩn mực, nguyên tắc, phương pháp và chế độ kế

toán, chính sách tài chính

- Cố ý tính toán sai về số học.

7

Sai sót là những lỗi không cố ý làm ảnh hưởng đến BCTC như:

- Lỗi về tính toán số học hoặc ghi chép sai

- Bỏ sót hoặc hiểu sai, ghi chép sai các khoản mục, các nghiệp vụ kinh tế

- Áp dụng sai các chuẩn mực, nguyên tắc, phương pháp và chế độ kế toán,

chính sách tài chính nhưng không cố ý.

Trong chuẩn mực kế toán VN số 29 về “Thay đổi các chính sách kế toán, ước

tính kế toán và các sai sót”, khái niệm về sai sót được trình bày trong đoạn 22 của

chuẩn mực “sai sót có thể phát sinh từ việc ghi nhận, xác định giá trị, trình bày và

thuyết minh các khoản mục trên BCTC. BCTC được coi là không phù hợp với

chuẩn mực kế toán và chế độ kế toán nếu có các sai sót trọng yếu hoặc các sai sót

không trọng yếu nhưng cố ý trình bày tình hình tài chính, kết quả hoạt động kinh

doanh hay các luồng tiền theo một hướng khác”. Như vậy, sai sót là hành vi vi

phạm không phải do cố ý nhưng có thể gây thiệt hại cho người sử dụng BCTC nếu

đó là sai sót trọng yếu.

Theo chuẩn mực kiểm toán Việt Nam mới (được áp dụng từ ngày 01/01/2013),

việc xem xét rủi ro gian lận trước hết thuộc về trách nhiệm của ban quản trị và ban

giám đốc đơn vị được kiểm toán. Đối với trách nhiệm của kiểm toán viên, kiểm

toán viên phải đạt được sự đảm bảo hợp lý về việc có những sai sót trọng yếu do

gian lận hoặc nhầm lẫn hay không, xét trên phương diện tổng thể.

Với những mục đích khác nhau, không ít các công ty dùng các thủ thuật gian lận

trên báo cáo tài chính. Ví dụ như là để phát hành thêm cổ phiếu mới, để đủ điều

kiện niêm yết cổ phiếu tại Sở Giao dịch/ Trung tâm giao dịch, để thu hút các nhà

đầu tư, để làm cho giá cổ phiếu tăng, nhiều công ty đã “che dấu” những thua lỗ

trong kinh doanh. Để trốn thuế và các khoản phải nộp cho Ngân sách Nhà nước,

một số công ty đã che giấu lợi nhuận.

Vào năm 1996, ACFE đã tiến hành môt cuộc khảo sát trên phạm vi toàn Hoa Kỳ

với mục đích tìm ra nguyên nhân, ảnh hưởng, cách thức thực hiện gian lận. Tổ chức

này đã khảo sát trên 10.000 trường hợp các doanh nghiệp cho là có gian lận. Mặc dù

cuộc khảo sát chưa được hoàn chỉnh nhưng đây là cuộc khảo sát có quy mô lớn nhất

8

từ trước đến nay trong lĩnh vực về gian lận. Căn cứ vào kết quả phân tích, năm 1996

ACFE đã cho ra đời Báo cáo về gian lận và sự lạm dụng trên toàn quốc - “Report to

Nation on Occupational Fraud and Abuse”. Đến cuối năm 2001 đầu năm 2002,

ACFE tiếp tục triển khai một cuộc khảo sát mới với quy mô nhỏ hơn, chỉ tiến hành

trên 663 trường hợp nhưng lại tập trung nghiên cứu các vấn đề như gian lận được

thực hiện như thế nào, và các phương pháp ngăn ngừa gian lận. Sau đó cứ mỗi hai

năm, ACFE tiếp tục khảo sát nghiên cứu và thống kê. Từ báo cáo của ACFE cho

thấy có 3 loại hành vi gian lận là gian lận BCTC (khoảng 10% trở xuống), tham ô

(khoảng 30%) và biển thủ tài sản (xấp xỉ 90%), và mặc dù luôn chiếm tỷ lệ thấp qua

các năm nhưng tổn thất của loại gian lận BCTC gây ra lại lớn nhất. Năm 2010, quy

mô khảo sát của ACFE được mở rộng ra các quốc gia trên toàn thế giới. Thật thú vị,

ở Hoa Kỳ, thiệt hại trung bình cho tất cả ba loại gian lận đáng chú ý đều nhỏ hơn

trong năm 2010 so với năm 2008.

Năm 2004

Năm 2006

Năm 2008

Năm 2010

Năm 2012

(dữ liệu bao gồm các trường hợp gian lận ở Hoa Kỳ)

Bảng1.1: Tổng hợp kết quả cuộc nghiên cứu của ACFE từ 2004-2012:

Loại gian lận

Thiệt hại (USD)

Thiệt hại (USD)

Thiệt hại (USD)

Thiệt hại (USD)

Thiệt hại (USD)

% gian lận

% gian lận

% gian lận

% gian lận

% gian lận

Năm 2010 (trên thế giới) Thiệt hại (18 tỷ USD)

92.7%

93.000 91,5%

150.000 88,7%

150.000 86,3%

135.000

86%

120.000

20,7%

Biển thủ

Tham ô

30,1% 250.000 30,8%

538.000 26,9%

375.000 32,8%

250.000 33,4%

250.000

11,3%

7,9% 1.000.000 10,6% 2.000.000 10,3% 2.000.000

4,8% 4.100.000

7,6% 1.000.000

68%

Gian lận trên BCTC

(Tổng tỷ lệ phần trăm trong bảng xếp hạng này vượt quá 100% vì một số trường

hợp có liên quan đến nhiều hơn một loại gian lận).

Kết quả nghiên cứu về gian lận theo công trình nghiên cứu của ACFE

Có ba loại gian lận như sau:

- Biển thủ tài sản: Xảy ra khi nhân viên biển thủ tài sản của tổ chức (ví dụ điển

hình là biển thủ tiền, đánh cắp hàng tồn kho, gian lận về tiền lương).

9

- Tham ô: Xảy ra khi người quản lý lợi dụng trách nhiệm và quyền hạn của họ

tham ô tài sản của công ty hay hành động trái ngược với các nghĩa vụ họ đã cam kết

với tổ chức để làm lợi cho bản thân hay một bên thứ ba.

- Gian lận trên Báo cáo tài chính: Là trường hợp các thông tin trên Báo cáo tài

chính bị bóp méo, phản ảnh không trung thực tình hình tài chính một cách cố ý

nhằm lừa gạt người sử dụng thông tin.

Kết quả nghiên cứu của ACFE cho thấy, trong các trường hợp khảo sát, gian lận

liên quan đến tài sản tuy chiếm khoảng 90% trường hợp nhưng mức thiệt hại cho

nền kinh tế là thấp nhất. Trong khi đó, các gian lận trên Báo cáo tài chính, tuy

chiếm tỷ lệ thấp nhất nhưng hậu quả gây ra cho nền kinh tế là lớn nhất.

Biểu đồ 1.1: Tổn thất do các gian lận gây ra

Ước tính của 1.843 chuyên gia chống gian lận rằng trung bình mỗi tổ chức mất

5% doanh thu của nó vào gian lận. Tuy nhiên con số này chỉ là ước tính mà không

dựa trên bất kỳ dữ liệu cụ thể hoặc quan sát thực tế, do không có cách nào để tính

toán chính xác thiệt hại của gian lận trên toàn cầu, tuy nhiên ước tính của các

chuyên gia chống gian lận được xem là tốt nhất và tiên phong mà chúng ta có thể tin

cậy.

10

Mức độ gian lận ở loại các tổ chức

14.3%

9.6%

Tổ chức phi lợi nhuận

18.1%

Chính phủ

16.3%

2008 2010

28.4%

32.1%

Công ty niêm yết

39.1%

42.1%

Doanh nghiệp tư nhân

0.0% 10.0% 20.0% 30.0% 40.0% 50.0%

(Nguồn: ACFE. (2010). Report to the Nation on occupational Fraud & abuse)

Biểu đồ 1.2: Tổn thất do gian lận gây ra phân theo khu vực doanh nghiệp

Dù công trình nghiên cứu về gian lận của ACFE đã đưa ra những số liệu thống kê

về những thiệt hại của việc gian lận trên Báo cáo tài chính bị phát hiện, tuy nhiên,

họ vẫn cho rằng khó mà xác định được thiệt hại thực sự bởi lẽ không phải tất cả

những gian lận đều bị phát hiện và không phải tất cả các gian lận được phát hiện

đều được báo cáo và không phải tất cả gian lận đã báo cáo đều bị khởi tố theo đúng

pháp luật. Bên cạnh đó, những công trình nghiên cứu trên chỉ thống kê thiệt hại về

kinh tế trực tiếp do gian lận trên Báo cáo tài chính, trong khi còn rất nhiều thiệt hại

vô hình không thể biểu hiện bằng con số cụ thể ví dụ như chi phí kiện tụng, phí bảo

hiểm, sự sụt giảm niềm tin và tác động xấu đến thị trường chứng khoán.

Điều đó càng cho thấy mục tiêu phải phát hiện được gian lận trên báo cáo tài

chính nhanh chóng, đáng tin cậy và với chi phí thấp là rất quan trọng.

Một trong những đóng góp rất lớn của ACFE là việc thống kê các phương pháp

thực hiện gian lận phổ biến trên Báo cáo tài chính. Dưới đây là thống kê các loại

gian lận phổ biến trên BCTC.

11

Gian lận

Tham ô

Biển thủ tài sản

Biểu đồ 1.3: Các cách thức gian lận trên BCTC theo ACFE:

Gian lận trên BCTC

Tài chính

Phi tài chính

Khai thiếu doanh thu, tài sản

Khai khống doanh thu, tài sản

Phân công phân nhiệm

Sai thời khóa

Tài liệu nội bộ

Tài liệu ngoài

Doanh thu không có thật

Che giấu chi phí, công nợ

Công bố không đầy đủ

Đánh giá sai tài sản

Từ góc độ kế toán, doanh thu, lợi nhuận, hoặc các tài sản thường phóng đại,

trong khi tổn thất, chi phí, hoặc nợ phải trả thường bị bớt đi. Phóng đại doanh thu,

lợi nhuận, hoặc các tài sản nhằm mô tả tài chính công ty mạnh hơn. Giảm bớt tổn

thất, chi phí, và trách nhiệm pháp lý để mô tả sự gia tăng giá trị tài sản và vốn chủ

sở hữu. Giảm bớt doanh thu hoặc phóng đại chi phí chỉ khi các công ty, những

người quản lý muốn giảm nghĩa vụ thuế của họ. Và từ các trường hợp gian lận được

biết thì doanh thu không được công nhận, bao gồm cả doanh thu hư cấu và sự khác

biệt thời gian, chiếm khoảng một nửa trong số tất cả các gian lận báo cáo tài chính.

Mặc dù không có trường hợp gian lận nào là hoàn toàn giống như nhau, nhưng

tựu chung lại sẽ có các loại gian lận nêu trên, từ đó có thể xác định được một phần

các tỷ số tài chính nào cần quan tâm khi phân tích.

12

1.1.2 Tỷ số tài chính và ý nghĩa:

Phân tích tỷ số tài chính là một khái niệm, một kỹ thuật lâu đời như là khái niệm

kế toán.

Phân tích tỷ số tài chính là quá trình tính toán, xác định và trình bày mối quan hệ

của các khoản mục liên quan và các nhóm khoản mục của các báo cáo tài chính.

Phân tích tỷ số tài chính sẽ cung cấp một bản báo cáo tóm tắt và ngắn gọn về tình

hình tài chính của một đơn vị. Tỷ số tài chính có thể cung cấp cho người kế toán các

đầu mối và các triệu chứng của tình trạng tài chính cơ bản. Một tỷ số của một công

ty cho một năm tài chính sẽ có ý nghĩa khi được so sánh với (1) chỉ số năm trước để

kiểm tra xu hướng, (2) với tiêu chuẩn ngành, và (3) là với các công ty cạnh tranh.

Đó là một công cụ cho phép các chủ ngân hàng hoặc người cho vay xem xét các

yếu tố sau của người đi vay (doanh nghiệp) trước khi cho vay nhằm đảm bảo an toàn và an ninh cho các khoản vay của họ1:

- Xác định tính thanh khoản

- Lợi nhuận

- Khả năng thanh toán

- Ổn định tài chính

- Chất lượng quản lý

Chúng là công cụ quan trọng để phân tích tài chính nhằm thẩm định giá trị thực

sự của doanh nghiệp, hiệu quả hoạt động của doanh nghiệp đó trong một khoảng

thời gian và khả năng mà nó phá sản, giải thích của báo cáo tài chính dựa vào mối

liên hệ liên giữa các tỷ số tài chính khác nhau. Đặc biệt trong cơ chế thị trường hiện

nay, PTTC phát triển nhanh chóng do nhiều nguyên nhân: nhu cầu quản lý doanh

nghiệp và tập đoàn tăng lên, sự phát triển của tập đoàn tài chính, các hoạt động về

tái cơ cấu vốn, sự thành lập các tập đoàn quốc gia và đa quốc gia…

Trong các kỹ thuật phân tích tài chính ở Việt Nam hiện nay, kỹ thuật phân tích tỉ

số tài chính được sử dụng nhiều nhất. Tuy không là nguồn thông tin mang tính

1 RK Mohanty-Ratio analysic

quyết định, nhưng vẫn là kỹ thuật phân tích căn bản và quan trọng nhất, kỹ thuật

13

này dựa vào các tỷ số tài chính để đo lường, đánh giá tình hình và hoạt động tài

chính của công ty. Có 2 cách phân loại tỉ số tài chính:

Dựa vào cách thức sử dụng số liệu:

- Tỷ số tài chính xác định từ bảng cân đối kế toán: Tỷ suất đầu tư tổng quát,

Tỷ suất tự tài trợ, Hệ số hao mòn, Hệ số cơ cấu nợ, Tốc độ tăng trưởng vốn, Tỷ

lệ nợ, Tỷ lệ vốn chủ sở hữu, Tỷ suất nguồn vốn thường xuyên, Tỷ lệ thanh toán

nợ ngắn hạn

- Tỷ số tài chính xác định từ báo cáo kết quả hoạt động kinh doanh: Tỷ số chi

trả cổ tức

- Tỷ số tài chính xác định từ cả hai báo cáo vừa nêu.

- Tỷ số tài chính xác định từ báo cáo lưu chuyển tiền tệ: Tỷ số hoạt động , Tỷ

số đầu tư, Tỷ trọng lưu chuyển tiền từ hoạt động kinh doanh chính

Dựa vào mục tiêu phân tích: khả năng thanh khoản, cơ cấu tài chính (quản lý nợ),

tỉ số hoạt động (quản lý tài sản), hiệu quả sinh lời, Tỷ số tăng trưởng, tỉ số giá thị

trường, Mô hình Dupoint và hệ số rủi ro Z’score.

Từ 1988, Viện kế toán công chứng công Hoa Kỳ (AICPA) đã ban hành Chuẩn

mực kiểm toán SAS số 56 quy định về sử dụng thủ tục phân tích dữ liệu trong quy

trình kiểm toán để phát hiện ra các mối quan hệ bất thường, ví dụ, các giao dịch bất

thường cụ thể hoặc sự kiện, thay đổi kế toán, kinh doanh thay đổi, biến động ngẫu

nhiên, hoặc sai sót trọng yếu. [Đoạn 2].

Năm 2009, Chuẩn mực kiểm toán quốc tế IAS 520 “Thủ tục phân tích” (vừa

được chỉnh sửa) đưa ra hướng dẫn cụ thể sử dụng thủ tục phân tích trong cả ba giai

đoạn của cuộc kiểm toán: lập kế hoạch, kiểm tra, đánh giá tổng thể. AICPA cũng đã

cung cấp ấn phẩm hướng dẫn thực tế và các ví dụ minh họa cho việc áp dụng các

thủ tục phân tích.

Chuẩn mực kiểm toán Việt Nam ban hành dựa theo hệ thống chuẩn mực quốc tế,

cũng đã ban hành chuẩn mực VAS số 520 (ban hành ngày 29/12/2000 dựa theo IAS

520 cũ), trình bày rõ “quy trình phân tích trong kiểm toán BCTC là việc phân tích

các số liệu, thông tin, các tỷ suất quan trọng, qua đó tìm ra những xu hướng, biến

14

động và tìm ra những mối quan hệ có mâu thuẫn với các thông tin khác hoặc có sự

chênh lệch lớn so với giá trị đã dự kiến”. Trình tự phân tích của KTV trong giai

đoạn làm quen với hoạt động của doanh nghiệp thường bao gồm các động tác sau:

- So sánh số liệu hiện hành với số liệu của kỳ trước;

- So sánh số liệu thực hiện với số liệu kế hoạch hoặc dự đoán;

- So sánh số liệu thực hiện với số định mức (hoặc tiêu chuẩn tối ưu);

- So sánh số liệu thực tế với số bình quân chung hoặc bình quân của ngành.

Như vậy, thủ tục phân tích chỉ sử dụng để đánh giá sự hợp lý chứ không sử dụng

để đánh giá sự chính xác của các chỉ tiêu. Mục đích của việc áp dụng trình tự phân

tích như trên là xác định những hiện tượng bất thường trong hoạt động và trong báo

cáo của doanh nghiệp. Như vậy, nếu như việc xem xét đánh giá tổng quát trước tình

hình tài chính của doanh nghiệp được tổ chức đúng đắn thì sẽ làm giảm độ sai sót

của KTV trong quá trình kiểm toán.

Thủ tục phân tích không những không dừng lại ở việc giúp kiểm toán viên tìm

hiểu tình hình của khách hàng mà còn dùng để phát hiện ra những số liệu có khả

năng bị sai lệch. Thủ tục này giúp tìm kiếm và phát hiện các gian lận sai sót trọng

yếu trong BCTC thông qua việc phân tích các thông tin tài chính và thông tin phi tài

chính.

Ngoài ra, phân tích tài chính cũng đã trở thành một trong các dịch vụ chủ yếu của

KTV và các công ty kiểm toán, dịch vụ này chiếm tỷ trọng ngày càng tăng trong

tổng doanh thu của các công ty kiểm toán và PTTC chính là một trong các công cụ

hỗ trợ đắc lực nhất cho lĩnh vực kiểm toán.

Năm nay (2012), từ kết quả của dự án Clarity, phiên bản hướng dẫn của AICPA

đầy đủ hơn, có kết hợp các chuẩn mực kiểm toán quốc tế mới vào tất cả các nội

dung hướng dẫn, do đó, kiểm toán viên cần phải hiểu rõ về các chuẩn mực kiểm

toán. Nghiên cứu trường hợp minh họa việc sử dụng các thủ tục phân tích trong việc

lập kế hoạch và kiểm tra nội dung, sử dụng phân tích xu hướng, phân tích tỷ lệ,

kiểm tra tính hợp lý, và phân tích hồi quy. Các phụ lục bao gồm một loạt các ví dụ

15

về các tỷ số tài chính và so sánh các chìa khóa quan trọng của các tiêu chuẩn đánh

giá rủi ro. Tuy nhiên phải sau 15/12/2012 thì chuẩn mực mới này mới có hiệu lực.

1.1.3 Công cụ mới để phát hiện gian lận nhằm hoàn thiện quy trình kiểm

toán BCTC:

Khả năng của kiểm toán viên trong việc phát hiện một gian lận phụ thuộc vào các

yếu tố như sự khéo léo của thủ phạm, tần số và mức độ của các thao tác, mức độ

thông đồng, số lượng cá nhân và thâm niên tham gia trong việc gian lận.

Nhân tố chính để phân biệt giữa gian lận và sai sót là sự cố tình hay vô ý. Vì vậy

khả năng xét đoán là yếu tố then chốt trong việc phát hiện các gian lận tiềm ẩn và

các Chuẩn Mực Kiểm toán chung được thừa nhận GAAS (Generally Accepted

Auditing Standards) đưa ra những hướng dẫn cụ thể trong việc phát hiện gian lận.

Trong những năm gần đây, khối lượng và sự phức tạp của các giao dịch kế toán

trong các tổ chức lớn đã tăng lên đáng kể. Để kiểm toán các tổ chức như vậy, kiểm

toán viên phải thường xuyên đối phó với các dữ liệu đồ sộ với cấu trúc dữ liệu khá

phức tạp. Do đó, kiểm toán viên không thể chỉ dựa vào báo cáo hoặc các công cụ

truyền thống trong quá trình kiểm toán. Thay vào đó, các công cụ bổ sung, chẳng

hạn như kỹ thuật khai thác dữ liệu có thể tự động lấy thông tin từ một số lượng lớn

các dữ liệu để phân tích lại được chứng minh là rất hữu ích trên các nghiên cứu trên

thế giới về khả năng phát hiện gian lận hay ít nhất là phát hiện các sai sót trọng yếu

– là một minh chứng hỗ trợ cho khả năng xét đoán của kiểm toán viên.

Thống kê và phương pháp khai thác dữ liệu đã được áp dụng thành công để phát

hiện những hoạt động như rửa tiền, thương mại điện tử, thẻ tín dụng lừa đảo, gian

lận viễn thông, gian lận bảo hiểm, và xâm nhập máy tính, v.v… Các thuật toán khai

thác dữ liệu cũng đã được nghiên cứu phát triển cho phép để trích xuất những kiến

thức có liên quan từ một số lượng lớn các dữ liệu như báo cáo gian lận tài chính để

phát hiện gian lận báo cáo tài chính. (K. Fanning and K.Cogger, 1998)

Mặc dù áp dụng các kỹ thuật khai thác dữ liệu trong quá trình kiểm toán là một

lĩnh vực tương đối mới, khai thác dữ liệu đã được chứng minh là hiệu quả về chi phí

trong các ứng dụng liên quan đến kiểm toán như phát hiện gian lận, kế toán điều tra.

16

1.1.4 Những tỷ số tài chính được sử dụng để xác định phát hiện gian lận sai

sót trong BCTC:

Việc chuẩn bị một cơ sở dữ liệu để thực hiện khai phá đóng một vai trò tiên

phong quan trọng. Tuy nhiên vấn đề then chốt là phải xác định được các trường

phân tích – chính là các chỉ số tài chính, nhằm đưa ra kết luận cụ thể và hiệu quả

nhất, làm sáng tỏ khả năng ứng dụng thực tế to lớn đồng thời với những thách thức

đối với kỹ thuật phát hiện tri thức và khai phá dữ liệu trong bài toán phát hiện gian

lận trên BCTC.

Hội đồng liên hiệp tín dụng Thế Giới (WOCCU) cuối những năm 1980 dựa trên

kinh nghiệm tăng cường và hiện đại hóa lĩnh vực tín dụng đã đề ra PEARLS.

PEARLS là một tập hợp các chỉ tiêu tài chính thường được sử dụng trong phân tích

hoặc các chỉ số tiêu chuẩn hóa thuật ngữ giữa các tổ chức. Tổng cộng, có 44 chỉ tiêu

định lượng tài chính tạo điều kiện thuận lợi cho một phân tích toàn thể các điều kiện

tài chính của bất kỳ tổ chức tài chính nào. Mỗi chỉ số có một tiêu chuẩn bảo đảm an

toàn hoặc mục tiêu liên quan. Ngoại trừ một số chỉ số sử dụng chuyên biệt cho các

tổ chức tài chính, tác giả đã sử dụng một số chỉ số để phân tích.

Theo các nghiên cứu trước đây cho thấy một số tài khoản trên báo cáo tài chính

có nhiều khả năng là đối tượng bị thao túng bởi người quản lý. Những tài khoản

này bao gồm doanh thu, tài khoản phải thu, các tài khoản dự phòng và hàng tồn kho

(Schilit 1993; Green 1991; Loebbecke et al. 1989; Wright and Ashton 1989; Hylas

and Ashton 1982). Bản chất chủ quan của sự đánh giá liên quan đến các tài khoản

này làm khó khăn hơn trong việc kiểm toán.

Các gian lận của hoạt động ghi chép doanh số bán hàng trước khi nó được thu

được có thể hiển thị như là một tài khoản phải thu bổ sung. (Green 1991; Daroca

and Holder 1985) đã thử nghiệm bằng cách so sánh tài khoản và tỷ lệ các khoản

phải thu với doanh thu và (Stice 1991) so sánh các khoản phải thu với tổng tài sản.

Họ thấy có một mối tương quan tự nhiên giữa các khoản phải thu chiếm tỷ lệ cao

tổng tài sản và các khoản phải thu trên doanh thu bán hàng.

17

Persons (1995), Spellmire et al. (1993), Schilit (1993), Crain (1992), Stice

(1991), và Simunic (1980) cũng cho rằng người quản lý có thể thao tác trên hàng

tồn kho. Công ty có thể có sự không phù hợp trong phân bổ giữa chi phí tương ứng

với doanh thu hàng bán (COGS). Điều này làm tăng tổng lợi nhuận, thu nhập ròng

và củng cố bảng cân đối kế toán. Một loại thao túng khác liên quan đến quá trình

báo cáo hàng tồn kho là ghi hàng tồn kho thấp hơn chi phí hoặc giá cả thị

trường. Công ty có thể chọn không ghi số tiền đúng của hàng tồn kho lỗi thời. Vì

vậy, các nhà nghiên cứu này đã kiểm tra liệu các công ty với Báo cáo tài chính có

gian lận có nhiều khả năng để cho tỷ lệ hàng tồn kho trên tổng tài sản cao lên, ảnh

hưởng đến giá vốn và lợi nhuận. Họ cũng điều tra liệu các công ty phát hành FFS có

thể có tỷ lệ lợi nhuận cao hơn tổng tỷ lệ phần trăm so với nhóm có kiểm soát. Một

khoản mục nữa là cơ cấu nợ cao cũng có thể làm tăng khả năng của FFS, nhất là kể

từ khi thay đổi người quản lý các khoản nợ. Người quản lý có thể thao tác các báo

cáo tài chính theo nhu cầu của họ để đáp ứng giao ước nợ. Điều này cho thấy rằng

mức độ nợ cao có thể làm tăng xác suất của FFS.

Phân tích xu hướng đã thành công trong việc tìm kiếm các bất thường vật chất và

các lỗi (Blocker 1993; Green 1991; McKee 1989; Knechel 1986; Blocher and

Willingham 1985). Kiểm toán viên và các nhà phân tích thường sử dụng một

ngưỡng là một sự thay đổi 10% cho một sự thay đổi vật chất trong tài khoản hoặc tỷ

lệ (Green 1991; Loebbecke and Steinbart 1987; Kinney 1987). K. Fanning and

K.Cogger (1998) ghi nhận biến có khả năng bất thường nếu các tài khoản phải thu

hoặc tổng lợi nhuận của công ty có tỷ lệ phần trăm chênh lệch vượt quá 110% của

giá trị năm trước. Những kết quả này củng cố tầm quan trọng của việc sử dụng tỷ lệ

và phân tích xu hướng như các thủ tục phân tích.

Từ các khoản mục trên có thể thấy các tỷ lệ tài khoản phải thu / doanh thu, tài

khoản phải thu / tổng tài sản, hàng tồn kho / doanh số bán hàng, hàng tồn kho / tổng

tài sản, tài sản ròng nhà máy và thiết bị / tổng tài sản, nợ / vốn chủ sở hữu, nợ phải

thu/ nợ phải trả, doanh thu / tổng tài sản, lợi nhuận/ tổng tài sản có thể là các tỷ lệ

thống kê có ý nghĩa đáng kể. Ngoài ra còn các tỷ số tiềm năng để phát hiện các báo

18

cáo tài chính gian lận như: Tỷ số Dòng tiền từ hoạt động / Tổng nợ, Tỷ số Dòng tiền từ hoạt động / Tổng nợ dài hạn, Chỉ số xếp hạng tín dụng,2…

Từ các công trình nghiên cứu trên đây, tác giả sử dụng các tài liệu tham khảo này

để làm cơ sở cho nghiên cứu và phân tích về các phương pháp phát hiện gian lận

trên báo cáo tài chính hay về mối quan hệ của quản trị, kiểm toán viên và gian lận

dựa vào hệ thống tỷ số bao gồm các nhóm tỷ số sau:

Nhóm tỷ số: Viết tắt:

KHẢ NĂNG THANH KHOẢN

1. Tỷ số thanh toán ngắn hạn (Tài sản ngắn hạn/ Nợ phải trả ngắn hạn) CACL

2. Tỷ số thanh toán nhanh (Tài sản khả dụng ngắn hạn/ Nợ phải trả ngắn QACL

hạn) HIỆU SUẤT SỬ DỤNG TÀI SẢN

3. Tỷ số đầu tư TSCĐ (TSCĐ/ Tổng tài sản) NFATA

4. Tỷ số đầu tư tài chính dài hạn (TS tài chính dài hạn/ Tổng tài sản) B1

5. Tỷ số Doanh thu/ Tổng tài sản SALTA

6. Tỷ số Giá vốn / Tổng tài sản B2

CƠ CẤU VỐN VÀ KHẢ NĂNG LUÂN CHUYỂN VỐN

7. Tỷ số Tiền mặt/ Tài sản CASHTA

8. Tỷ số Nợ phải trả/ Vốn chủ sở hữu DEBTEQ

9. Tỷ số TSCĐ/ Vốn chủ sở hữu FAEQ

10. Tỷ số cơ cấu nợ (Nợ phải thu/ Nợ phải trả) RECLIB

11. Tỷ số Nợ phải trả/ Tài sản TDTA

12. Tỷ số Nợ dài hạn/ Tài sản LTDTA

13. Tỷ số Vốn lưu động/ Tài sản 14. Tỷ số Tồn kho/ Doanh thu 15. Tỷ số Tồn kho/ Tổng tài sản 16. Z'score (1,2xA1+1,4xA2+3,3xA3+0,6xA4+1,0xA5) A1 (=Vốn lưu động (Tài sản ngắn hạn - Nợ ngắn hạn)/ Tổng tài sản) WCTA INVSAL INVTA Z score

2 Michael J. Cerullo and M. Virginia Cerullo -2006-Using Neural Network Software as a Forensic Accounting Tool- Information Systems Control Journal, www.isaca.org

A2 (=Lợi nhuận chưa phân phối (lợi nhuận sau thuế)/ Tổng tài sản) A3 (=EBIT (Lợi nhuận trước lãi vay và thuế)/ Tổng tài sản) A4 (=(Giá thị trường của cổ phiếu*Slượng CP lưu hành)/ Tổng nợ)

19

Nhóm tỷ số: Viết tắt:

A5 (=Doanh thu/ Tổng tài sản)

TỶ LỆ LỢI NHUẬN

COSAL 17. Tỷ số lợi nhuận gộp (=Lợi nhuận gộp/ Doanh thu thuần)

NPSAL NIFA 18. Tỷ số lợi nhuận ròng (=Lợi nhuận ròng/ Doanh thu thuần) 19. Tỷ số Lợi nhuận/ Tài sản cố định

GPTA 20. Tỷ số Lợi nhuận gộp/ Tài sản

NPTA 21. Tỷ số Lợi nhuận/ Tài sản

22. Tỷ số sinh lời trên vốn dài hạn (=Tổng EBIT/ Tổng tài sản – Tổng Nợ ROCE

ngắn hạn)

23. Số vòng quay khoản phải thu (=Khoản phải thu/ Doanh thu) RECSAL

CHỈ TIÊU TĂNG TRƯỞNG

24. Tỷ số tăng trưởng bền vững (=Lợi nhuận giữ lại (lợi nhuận sau thuế - REINV

cổ tức + LNCPP đầu kỳ)/ Vốn chủ sở hữu)

25. Tỷ số tăng trưởng khoản phải thu (=Khoản phải thu/ Khoản phải thu 2 RETREND năm liên tiếp)

B3

26. Tỷ số Tăng trưởng doanh thu (=Doanh thu trung bình kỳ này - Doanh thu trung bình kỳ trước đã điều chỉnh/ Doanh thu trung bình kỳ trước đã điều chỉnh)

GMTREND 27. Tỷ số tăng trưởng lợi nhuận (=LNST trung bình kỳ này - LNST trung bình kỳ trước đã điều chỉnh/ LNST trung bình kỳ trước đã điều chỉnh)

(Bảng 1.2: Tỷ số tài chính sử dụng để khai phá dữ liệu dùng phần mềm Weka)

Một số tỷ số tài chính trên được chỉ ra là hữu ích khi dùng để phát hiện gian lận

trên BCTC ở các thị trường đã có nghiên cứu. Trong nghiên cứu này, tác giả sẽ sử

dụng lại toàn bộ các tỷ số tài chính trên để xét tính hữu ích trên thị trường niêm yết

tại Việt Nam.

1.2 Phân loại lĩnh vực doanh nghiệp niêm yết:

Theo các nghiên cứu từ thực tiễn trước đây, các ảnh hưởng của nền kinh tế đến

mỗi ngành nghề, lĩnh vực gây những tác động khác nhau. Mỗi lĩnh vực ngành nghề

khác nhau cũng có những đặc điểm riêng, dẫn đến gian lận xảy ra ở mỗi lĩnh vực

ngành nghề cũng khác nhau.

ACFE đánh giá rủi ro và xác định khả năng gian lận xảy ra dựa trên văn hóa

doanh nghiệp và đặc điểm ngành công nghiệp, hai điều này ảnh hưởng đáng kể đến

20

khả năng gian lận xảy ra. Các phương pháp đề xuất không thể đảm bảo phát hiện tất

cả 100% gian lận. Tuy nhiên, nó cung cấp một lợi thế hơn các mô hình nguy cơ

truyền thống vì nó tập trung vào những nguyên nhân cơ bản cho gian lận, nên hỗ trợ

kiểm toán viên trong cả phòng ngừa và phát hiện gian lận bằng cách xác định các

dấu hiệu cảnh báo sớm.

Đối với các ngành nghề khác nhau, các hình thức gian lận báo cáo tài chính

thường gặp cũng khác nhau. Ví dụ như trong ngành ngân hàng thủ thuật hay được

sử dụng là phân loại sai các khoản vay theo mức độ rủi ro nhằm giảm chi phí dự

phòng và tăng thu nhập từ tiền lãi. Thủ thuật thứ hai là không lập hoặc lập dự phòng

không đủ cho các khoản đầu tư chứng khoán, đặc biệt là chứng khoán trên thị

trường tự do và những khoản đầu tư dài hạn vào các công ty. Một thủ thuật nữa là

bán những khoản đầu tư cho các bên liên quan với giá cao hơn giá thị trường nhằm

đạt chỉ tiêu lợi nhuận.

Đối với các công ty sản xuất, gian lận báo cáo tài chính phổ biến là đẩy chi phí

sản xuất vào sản phẩm dở dang nhằm tăng giá trị hàng tồn kho, giảm giá vốn hàng

bán và tăng lợi nhuận; lập dự phòng không đầy đủ đối với hàng hỏng và hàng chậm

luân chuyển; kéo dài thời gian khấu hao của tài sản cố định. Chia tách công ty để

tăng giá trị tài sản thông qua việc đánh giá lại tài sản theo giá trị thị trường cũng là

một cách gian lận.

Đối với doanh nghiệp bán lẻ, hình thức gian lận thường gặp là không lập đủ dự

phòng cho hàng chậm luân chuyển và lỗi thời; không ghi nhận các khoản chiết khấu được hưởng từ nhà cung cấp; không ghi nhận đủ doanh số bán hàng bằng tiền mặt.3

Hệ thống ngành kinh tế của Việt Nam (Ban hành kèm theo Quyết định số

10/2007/QĐ-TTg ngày 23 tháng 01 năm 2007 của Thủ tướng Chính phủ) phân loại

thành 21 ngành nghề (bao gồm tất cả các ngành kinh tế, hành chính, hoạt động

Đảng, trợ giúp xã hội,…). Theo Hệ thống ngành này: các doanh nghiệp đang niêm

yết trên sàn xếp vào 47 mã ngành cấp 2 và 69 mã ngành cấp 3. Hệ thống mã ngành

3 Lê Minh Thủy - Công ty Tư vấn Tài chính Capstone - Nỗi niềm mùa báo cáo tài chính – nhipcaudautu.com

cấp 1 cũng dựa trên tiêu chuẩn ngành toàn cầu. Và nhằm mục đích đơn giản, tác giả

21

sử dụng cách phân loại của Industry Classification Benchmark – Tiêu chuẩn phân

loại ngành toàn cầu (ICB) được phát triển bởi Dow Jones và FTSE. Nó được sử

dụng để phân loại thị trường vào các lĩnh vực trong kinh tế vĩ mô. ICB sử dụng một

hệ thống 10 ngành công nghiệp (industry), phân chia thành 20 chuyên ngành, được

chia thành 41 lĩnh vực, sau đó chứa 114 tiểu ngành. Hệ thống này tương tự như

Global Industry Classification Standard (GICS) được phát triển bởi Morgan Stanley

Capital International (MSCI) và Standard & Poor's vào năm 1999.

Bảng 1.3: 10 nhóm ngành theo phân loại của hai tổ chức trên bao gồm:

Tiểu ngành (ICB) Industry (GICS) Sector

Năng lượng - Energy Dầu & Gas – Oil & Gas bao gồm các công ty thăm dò, khai thác hoặc dịch vụ chế biến, vận tải ... các sản phẩm dầu khí, than đá, nhiên liệu chất đốt.

Vật liệu cơ bản - Basic Materials Nguyên vật liệu – Meterials

đây là một nhóm ngành rộng bao gồm các công ty hoá chất, vật liệu xây dựng, kính, giấy, lâm sản; các công ty khai mỏ và luyện kim; các cty sản xuất các sản phẩm bao bì đóng gói (gồm cả bao bì giấy, kim loại, thuỷ tinh).

Công nghiệp - Industrials Công nghiệp – Industrials gồm các cty chế tạo các loại máy móc, công cụ cơ khí, thiết bị điện, nhà thầu xây dựng và các dịch vụ giao thông vận tải, thương mại và dịch vụ công nghiệp, giao thông vận tải.

Dịch vụ tiêu dùng - Consumer Services Tiêu dùng cao cấp - Consumer Discretionary

Hàng tiêu dùng - Consumer Goods Hàng tiêu dùng - Consumer Staples

Y tế - Dược – Health Care Y tế - Dược – Health Care bao gồm các công ty mà sản phẩm và dịch vụ không phải là nhu cầu thiết yếu: xe ô tô, quần áo cao cấp, nhà hàng, khách sạn, và các mặt hàng xa xỉ, dịch vụ tiêu dùng, phương tiện truyền thông, bán lẻ. bao gồm các công ty sản xuất và phân phối lương thực, thực phẩm, nước giải khát và bánh kẹo, thuốc lá và đồ uống có cồn, đồ gỗ và các sản phẩm gia dụng, hệ thống bán lẻ. bao gồm các cty cung cấp các dịch vụ, thiết bị chăm sóc sức khoẻ và các công ty nghiên cứu, phát triển sản xuất dược phẩm và các sản phẩm công nghệ sinh học.

Công nghệ - Technology Công nghệ thông tin - Information bao gồm các công ty nghiên cứu và sản xuất phần mềm cùng các dịch vụ liên quan: dịch vụ

22

Tiểu ngành (ICB) Industry

(GICS) Sector Technology

Tài chính - BĐS Financials Tài chính - BĐS – Financials máy tính, Internet, phần mềm, thiết bị điện tử văn phòng, thiết bị viễn thông và các công ty sản xuất các thiết bị công nghệ phần cứng, chất bán dẫn và thiết bị bán dẫn. gồm các ngân hàng thương mại, cty bảo hiểm, công ty đầu tư tài chính, bất động sản, công ty chứng khoán và chứng chỉ quỹ.

Viễn thông - Telecommunicatio ns Viễn thông - Telecommunicatio ns Services

Điện nước – Utilities Điện nước – Utilities gồm các công ty cung cấp các dịch vụ viễn thông như: dịch vụ viễn thông cố định, không dây, băng thông rộng... gồm các công ty sản xuất và phân phối điện năng, các cty quản lý hệ thống nước, gas sinh hoạt.

Tùy vào môi trường kinh tế trong năm mà mỗi ngành sẽ có mối đe dọa về gian

lận khác nhau. Theo khảo sát của Deloitte, khảo sát 2100 chuyên gia, 56%số người

được hỏi cho rằng báo cáo tài chính năm 2010 và năm 2011 sẽ có gian lận nhiều

hơn ba năm trước cộng lại vì suy thoái kinh tế. Và 50% chuyên gia được hỏi cho

rằng ngành tài chính sẽ có sự gia tăng và có gian lận nhiều nhất, tiếp theo đó là công

nghệ, viễn thông (14%), hàng tiêu dùng (12%), y dược (10%) và công nghiệp (6%)

– mặc dù trước đây ngành công nghiệp sản xuất luôn bị xem là ngành xảy ra nhiều

gian lận nhất.

1.3. Các công trình nghiên cứu về sử dụng tỷ số tài chính để phát hiện gian

lận sai sót trong BCTC:

Nghiên cứu về sử dụng tỷ số tài chính phát hiện gian lận sai sót đã được làm từ

lâu trên thế giới. Từ những năm 1980, Kinney (1979), Coglitore et al.(1988) đã triển

khai trên các tình huống thực tế thực hiện thủ tục phân tích (analytical procedures)

đơn giản, định lượng bao gồm cả phân tích tỷ lệ để đánh giá biến động báo cáo tài

chính thường được tìm thấy là do nguyên nhân nào.

Trong một nghiên cứu về giấy tờ làm việc của KTV do R.E.Hylas và R.H.Ashton

trong cuốn “Audit Detection of Finacial Statement Errors” thực hiện vào năm 1982

23

đã chỉ ra bằng 281 sai phạm được yêu cầu điều chỉnh trong BCTC của 152 công ty

thì có tới 27.1% sai sót được phát hiện khi sử dụng thủ tục phân tích.

Mô hình để phát hiện gian lận quản lý lần đầu tiên được trình bày trong

Loebbecke và Willingham (1988) và tiếp tục phát triển trong Loebbecke et al.

(1989), mô hình này cố gắng để cung cấp một quy trình phân tích để phát hiện các

nguy cơ gian lận quản lý. Loebbecke et al.(1987) lại mô phỏng dữ liệu khi tác giả

cấy sai lệch vào báo cáo tài chính của các doanh nghiệp thực tế rồi áp dụng lại quy

trình phân tích để đánh giá khả năng phát hiện sai lệch của quy trình phân tích.

Có một vài nghiên cứu chuyên về phát hiện gian lận (Blocher, 1992; Caderon

and Green, 1994; Persons, 1995; Beneish, 1999; Kaminski et al., 2004). Các tác giả

dùng phương pháp đối chiếu giữa báo cáo tài chính có sai lệch với các báo cáo tài

chính không có sai lệch. Trong phương pháp này, tác giả dùng các mô hình để xác

định sai lệch dựa trên đối chiếu báo cáo tài chính có sai lệch đã được phát hiện

trong thực tế với các báo cáo tài chính không có sai lệch của các doanh nghiệp cùng

ngành nghề và quy mô. Từ đó, xác định các tỷ số có thể sử dụng để nhận dạng sai lệch trên báo cáo tài chính. O.Persons4 xác định 103 công ty gian lận và sau đó kết

hợp với một mẫu công ty không có gian lận trên cùng ngành và khoảng thời gian.

Tổng cộng có mười biến, trong đó có tám tỷ lệ tài chính được kiểm tra và sử dụng

để phát triển hai mô hình logictis tiên đoán: mô hình cho năm có gian lận và cho

năm trước - một mô hình tám biến để phát hiện gian lận một cách hiệu quả với độ

tin cậy cao.

J.Alton Sizemore5 cung cấp các kỹ thuật đơn giản nhưng mạnh mẽ để phân tích

phát hiện gian lận: phân tích xu hướng, phân tích tỷ số, … Các mô hình logictis

từng bước chỉ ra rằng đòn bẩy tài chính, doanh thu, vốn, tài sản và quy mô doanh

nghiệp là những yếu tố quan trọng ảnh hưởng đến khả năng của báo cáo tài chính

4 Dr.Obeua S.Persons (1995), "Using financial statement data to identify factors associated with fraudulent financing reporting," Journal of Applied Business Research, vol. 11, pp. 38 -46, 1995. 5 ROBERT TIE (2010) Trend and Ratio Analysis,

gian lận.

24

Busta và Randy (1998), sử dụng quy luật Benford và mạng nơron như là một thủ

tục phân tích để đo độ lệch của tập hợp dữ liệu. Độ lệch này cho thấy giả mạo tiềm

năng và có thể được sử dụng để cảnh báo thử nghiệm kiểm toán thêm. Kết quả cho

thấy rằng nếu dữ liệu tài chính đã được làm sai lệch 10%, quy luật Benford phân

tích đánh giá sẽ phát hiện giả mạo 68% lần. Nếu dữ liệu không được làm sai lệch, các kiểm tra sẽ xác nhận nó 67% lần6. Nghiên cứu này đã sử dụng dữ liệu mô phỏng

và không phải là dữ liệu thực tế.

Hoban, James P. (1993) sau khi xem xét nghiên cứu liên quan đến các chỉ số tài

chính, nghiên cứu này có xem xét ý kiến của các ngân hàng về tầm quan trọng của

43 chỉ tiêu tài chính. Ông đã xác định được 19 tỷ lệ được coi là quan trọng trong

việc phân tích các công ty bán lẻ và 14 tỷ lệ cho là quan trọng trong việc phân tích

các công ty sản xuất. Nghiên cứu thống kê đã tìm thấy việc phân loại ngành công

nghiệp rất quan trọng trong phân tích tỷ lệ tài chính. Nghiên cứu này cho thấy các

ngân hàng sử dụng một bộ các tỷ lệ khác nhau khi thẩm định các công ty bán lẻ

khác với khi thẩm định các công ty sản xuất. Đặc biệt, tỷ lệ thanh khoản và các

nhóm hoạt động có ý nghĩa quan trọng đối với các nhà bán lẻ hơn cho các nhà sản

xuất. Trong khi, nhóm tỷ lệ lợi nhuận và tỷ lệ đòn bẩy thì quan trọng ở cả hai nhóm.

Kurt Fanning and K.Cogger (1998) sử dụng các mạng thần kinh nhân tạo kết hợp

với thống kê để phát triển một mô hình để phát hiện gian lận quản lý dựa trên bảng

câu hỏi của KPMG Peat Marwick để khảo sát. Kết quả của họ cũng phân loại được

báo cáo tài chính có gian lận quản lý và không có gian lận quản lý với tỷ lệ rất cao.

Khá nhiều chuyên gia đã dành các nỗ lực nghiên cứu FFS từ một danh mục đầu

tư của các thuật toán khai thác dữ liệu đã được áp dụng cho FFD. Ví dụ, bằng cách sử dụng một phân tích hồi quy logit, Beasley7 phát hiện doanh nghiệp không có

gian lận thì có các thành viên bên ngoài chiếm tỷ lệ phần trăm cổ phần cao hơn

6 Busta, B. and Weinberg, R. (1998). Using Benford’s law and neural networks as a review produce.

Managerial Auditing Journal, 13 June. 7 M. S. Beasley, "An empirical analysis of the relation between the board of director composition and financial statement fraud," The Accounting Review, Vol. 71, No. 4. pp. 443-465, 1996.

đáng kể trong hội đồng quản trị so với các doanh nghiệp có gian lận. Cindy

25

Durtschi (2004) khẳng định công cụ phân tích kỹ thuật số theo quy luật của Benford8 khi được sử dụng một cách chính xác sẽ là một công cụ hữu ích để xác

định các nghi ngờ tài khoản gian lận để phân tích thêm, hiện tại được đưa vào gói

phần mềm phổ biến CareWare 2002 để xác định các lỗi có thể, gian lận tiềm năng

hay các bất thường khác.

Thomas E. McKee (2007) nghiên cứu mô hình dự báo gian lận báo cáo tài chính

với 91 BCTC công ty kết quả của 3 mô hình như sau: mô hình Agglomerative sẽ

xác nhận chéo chính xác 61% dữ liệu, dự báo chính xác 79% trên toàn bộ mẫu với 9

qui tắc và 15 biến; mô hình cây quyết định sẽ xác nhận chéo chính xác 61% dữ liệu,

dự báo chính xác 81% trên toàn bộ mẫu với 3 qui tắc và 4 biến; mô hình hồi quy

Logistic sẽ xác nhận chéo chính xác 64,5% dữ liệu, dự báo chính xác 68,1% trên

toàn bộ mẫu với 4 biến. Có thể thấy mô hình cây quyết định dự báo chính xác hơn

cả.

Efstathios Kirkos (2005) sử dụng dữ liệu BCTC từ 76 công ty sản xuất ở Hy Lạp

đã được kiểm toán phân loại ra làm 2: 38 công ty có có dấu hiệu gian lận được xuất

hiện với 38 công ty không có dấu hiệu gian lận BCTC trong việc ban hành. Tác giả

biên soạn 27 tỷ số tài chính, mà sử dụng từ các tỷ số tài chính được đề xuất dùng để

phân tích dựa trên các nghiên cứu có liên quan trước đây về chủ đề của FFS, được

thực hiện bởi Spathis (2002); Spathis et al. (2002), Fanning và Cogger (1998),

Person (1995). Tác giả chạy ANOVA để lọc sự khác biệt giữa hai biến. Sau đó khai

phá dữ liệu với các mô hình khai phá dữ liệu (data mining model) cụ thể. Tác giả

dùng 3 phương pháp cây quyết định, mạng thần kinh, mạng Bayesian để xây dựng 3

mô hình. Tuy nhiên, hiệu suất của ba mô hình là khác nhau đáng kể. Mô hình mạng

Bayesian đạt được hiệu suất tốt nhất để quản lý phân loại một cách chính xác 90,3%

mẫu xác nhận trong một thủ tục xác nhận qua 10 lần. Mức độ chính xác của mô

hình mạng thần kinh và mô hình cây quyết định tương ứng là 80% và 73,6%.

Johan Perols (2011) nghiên cứu đánh giá việc thực hiện các thuật toán phân loại

khác nhau trong việc phát hiện gian lận. Các thuật toán phân loại được lấy từ Weka, 8 Luật Benford- Làm thế nào phát hiện số liệu giả tạo?, http://www.statistics.vn

26

một mã nguồn mở công cụ khai thác dữ liệu. Sử dụng một công cụ mã nguồn mở

tạo điều kiện cho việc nhân rộng và mở rộng của nghiên cứu này. Weka thực hiện

một tập hợp tương đối đầy đủ các thuật toán phân loại, trong đó có nhiều trong

những phổ biến nhất. Ông đã lựa chọn 6 thuật toán từ Weka: (1) J48, (2) SMO, (3)

MultilayerPerceptron (4) Logistics, (5) stacking, và (6) bagging. Tuy nhiên khác với

các nhà nghiên cứu trước, ông nhận thấy hồi quy logistic thì tốt hơn mạng thần kinh

nhân tạo (ANN). Tuy nhiên nó không mâu thuẫn với các kết quả nghiên cứu trước,

do việc chọn lựa chọn mẫu và các yếu tố khảo sát. Kết quả phụ thuộc vào lựa chọn

các thuộc tính đặc biệt đã đưa ra ý nghĩa của nghiên cứu này là khi các nhà nghiên

cứu phát triển các yếu tố dự báo gian lận mới cần phải kiểm tra các tiện ích của

những dự đoán gian lận bằng cách sử dụng nhiều hơn một thuật toán phân loại.

Với vai trò và ý nghĩa như vậy, thủ tục phân tích các số liệu, thông tin, các tỷ số

quan trọng và việc ứng dụng các công nghệ thông tin mới cần được coi trọng và

thực hiện đầy đủ hơn nữa... Nhưng thực tế áp dụng thủ tục phân tích ở các công ty

kiểm toán ở Việt Nam lại chưa quan tâm đúng mức và chưa thực sự phát huy hết

được tác dụng của thủ tục này trong một cuộc kiểm toán BCTC.

1.4. Kỹ thuật khai phá dữ liệu:

1.4.1. Khai phá dữ liệu (Data mining) là gì?

Kỹ thuật phân tích chỉ số tài chính để phát hiện gian lận được trình bày ở phần

trên đây trong các công trình nghiên cứu gần đây sử dụng thuật khai phá dữ liệu.

Khai phá dữ liệu là một thuật ngữ tương đối mới, nó ra đời vào khoảng những

năm cuối của của thập kỷ 1980. Các nhà thống kê xem "khai phá dữ liệu như là một

quá trình phân tích được thiết kế thăm dò một lượng dữ liệu cực lớn nhằm phát hiện

ra các mẫu thích hợp và/hoặc các mối quan hệ mang tính hệ thống giữa các biến và

sau đó sẽ hợp thức hoá các kết quả tìm được bằng cách áp dụng các mẫu đã phát

hiện được cho tập con mới của dữ liệu".

Nói ngắn gọn: “Khai phá dữ liệu là một quá trình trích xuất tri thức từ một chuỗi

lặp (iterative) và tương tác (interactive) với lượng lớn dữ liệu thô - một quá trình

27

không dễ dàng - để trích xuất thông tin ẩn, hữu ích, chưa được biết trước, đáp ứng

được sự quan tâm của người sử dụng”.

Kỹ thuật khám phá tri thức và khai phá dữ liệu đã và đang được nghiên cứu, ứng

dụng trong nhiều lĩnh vực khác nhau ở các nước trên thế giới, tại Việt Nam kỹ thuật

này còn tương đối mới tuy nhiên cũng đang được nghiên cứu và dần đưa vào ứng

dụng.

1.4.2. Quá trình khai phá dữ liệu:

Kỹ thuật KPDL chỉ là một bước thiết yếu trong quá trình Khám phá tri thức trong

CSDL và quá trình này bao gồm các bước sau:

Lựa chọn đặc điểm (Data selection): dữ liệu không liên quan được phân tích để

quyết định giữ lại hay loại bỏ khỏi tập dữ liệu. Giai đoạn này thực hiện việc lựa

chọn các trường của mỗi mẫu dữ liệu để thực hiện khai phá tri thức thu được kết

quả cao. Tất cả các chỉ tiêu tài chính của Bảng 1.2 phải được thu thập từ công bố

báo cáo tài chính cụ thể là bảng cân đối kế toán, báo cáo kết quả kinh doanh và báo

cáo lưu chuyển tiền tệ.

• Thu thập dữ liệu (Data collection) và Làm sạch dữ liệu (Data cleaning): giai

đoạn này là tạo ra nguồn dữ liệu, loại bỏ nhiễu hoặc các dữ liệu không thích hợp.

Dữ liệu được làm sạch từ các nguồn khác và và tích hợp với nhau. Dữ liệu trong

nghiên cứu với mục tiêu phòng ngừa và phát hiện các hành vi gian lận báo cáo tài

chính, có thể bao gồm chỉ số tài chính liên quan đến lợi nhuận, tính thanh khoản, an

toàn và hiệu quả cùng với hành vi đặc điểm như tuổi tác của công ty, kích thước của

công ty trên cơ sở doanh thu và tài sản.

• Tiền xử lý dữ liệu: Là việc phân tích, chuyển đổi các biến đầu vào, đầu ra để

tối thiểu hóa nhiễu, nhấn mạnh đến các quan hệ nổi bật, phát hiện xu hướng. Các dữ

liệu thô dần được chuẩn hóa thành các giá trị có giới hạn trên và giới hạn dưới của

hàm chuyển đổi được xác định. Dữ liệu được lựa chọn được biến đổi vào các mẫu

thích hợp cho quá trình khai phá (luật kết hợp).

• Khai phá dữ liệu (Data mining): giai đoạn quyết định của quá trình khai phá

tri thức từ dữ liệu. Các kỹ thuật được sử dụng trong giai đoạn này nhằm lấy ra các

28

mẫu hữu ích tiềm ẩn. Quan trọng ở giai đoạn này là lựa chọn kỹ thuật khai thác dữ

liệu thích hợp.

Lựa chọn đặc điểm

Phát hiện gian lận

Khai phá dữ liệu dự báo

Thu thập dữ liệu

Tiền xử lý dữ liệu

Mô tả khai phá dữ liệu (Kết hợp các quy tắc)

Khai phá dữ liệu

Quy tắc động cơ

Hiệu suất đánh giá

Quy tắc giám sát

Hình 1.1: Khuôn khổ phát hiện và phòng chống gian lận Báo cáo tài chính9

Báo cáo gian lận

Cơ cấu vốn

Chống gian lận

Cơ hội

Động lực

Sự hợp lý

Điều kiện

Lựa chọn

• Hiệu suất đánh giá (Performance Evaluation): các mẫu biểu diễn tri thức hấp

dẫn được nhận biết dựa trên các độ đo được đưa ra. Bước này là vô cùng quan trọng

để lựa chọn tốt nhất kỹ thuật phù hợp từ một tập hợp các phương pháp khai thác dữ

9 R Gupta, NS Gill (2012), A Data Mining Framework for Prevention and Detection of Financial Statement Fraud

liệu và tinh chỉnh các yếu tố của tham số đầu vào trong quá trình lặp đi lặp lại của

29

học máy. Do đó, kết quả của bước này sẽ làm việc như là một thông tin phản hồi

cho các khuôn khổ hoàn chỉnh.

• Biểu diễn tri thức (Knowledge representation): là giai đoạn cuối của quá trình

khai phá tri thức từ dữ liệu, nhằm biểu diễn trực quan tri thức cho người dùng. Bước

quan trọng này sử dụng các kỹ thuật trực quan để giúp người sử dụng hiểu và biểu

diễn các kết quả khai phá dữ liệu.

Năm thành tố cơ bản để đặc tả một tác vụ khai phá dữ liệu:

o Dữ liệu cụ thể sẽ được khai phá (task-relevant data)

o Loại tri thức sẽ đạt được (kind of knowledge

o Tri thức nền (background knowledge

o Các độ đo (interestingness measures

o Các kỹ thuật biểu diễn tri thức/trực quan hóa mẫu (pattern visualization and

knowledge presentation

Một giải thuật khai phá dữ liệu bao gồm bốn thành phần cơ bản: cấu trúc mẫu

hay mô hình, hàm tỉ số, phương pháp tìm kiếm và tối ưu hóa, chiến lược quản lý dữ

liệu.

1.4.3 Công cụ khai phá dữ liệu:

Một số hệ thống khai phá dữ liệu:

- Intelligent Miner (IBM)

- Microsoft data mining tools (Microsoft SQL Server 2000/2005/2008)

- Oracle Data Mining (Oracle 9i/10g/11g)

- Enterprise Miner (SAS Institute)

- Weka (the University of Waikato, New Zealand,

www.cs.waikato.ac.nz/ml/weka)

1.4.4. Phương pháp khai phá dữ liệu:

Mặc dù ngày nay gói phần mềm khai phá dữ liệu được yêu cầu tự động hóa

nhiều hơn, nhưng nó vẫn yêu cầu một số hướng dẫn từ người sử dụng. Vì vậy, trong

việc sử dụng các công cụ khai thác dữ liệu, người dùng cần phải có một kiến thức

cơ bản của các phương pháp này. Các loại phương pháp khai phá dữ liệu có thể

30

được phân loại khác nhau. Tuy nhiên, nói chung, nó được chia thành hai nhóm

chính:

- Kỹ thuật khai phá dữ liệu mô tả: có nhiệm vụ mô tả về các tính chất hoặc các

đặc tính chung của tập dữ liệu lớn một cách tổng kết và súc tích. Các kỹ thuật này

bao gồm: Phân cụm (Clustering), tóm tắt (Summerization), trực quan hóa

(Visualization), phân tích sự phát triển và độ lệch (Evolution and Deviation

analyst), phân tích luật kết hợp (Association rules), … Khai thác dữ liệu mô tả là rất

dễ dàng để áp dụng trên dữ liệu không được giám sát. Tính chất này được đề nghị

sử dụng cho công tác phòng chống các hành vi gian lận báo cáo tài chính vì các

phương pháp không được giám sát phát hiện lỗi / sai lầm, thay đổi trong hành vi và

giá trị thay vì phân loại các tổ chức là gian lận hoặc không gian lận.

- Kỹ thuật khai phá dữ liệu dự đoán: Có nhiệm vụ đưa ra các dự đoán dựa vào

các suy diễn trên dữ liệu hiện thời. Các kỹ thuật này gồm có: Phân lớp

(Classifacation), hồi quy (regession), … Mục tiêu của khai thác dữ liệu dự đoán là

để dự đoán giá trị của một thuộc tính trên cơ sở giá trị của các thuộc tính khác. Khả

năng khai thác dữ liệu tiên đoán này sẽ được sử dụng để phát hiện các hành vi gian

lận báo cáo tài chính. Một trong những phương pháp quan trọng của khai thác dữ

liệu dự đoán là phân loại. Phân loại là một quá trình hai bước. Trong bước đầu tiên,

mỗi tổ chức trong mẫu đào tạo được dán nhãn là gian lận, gian lận không trên cơ sở

của một thuộc tính nhãn lớp. Bước này có kết quả học có giám sát trong một mô

hình mà sau bước thứ hai của phân loại, trong đó đã học được cố gắng mô hình để

phân loại các tổ chức từ mẫu xác nhận là gian lận hay không gian lận. Do đó, phát

hiện và xác định các hành vi gian lận báo cáo tài chính có thể được coi như là một

vấn đề cổ điển phân loại.

Để xác định các thuật toán chính được sử dụng cho phát hiện gian lận trong kế

toán tài chính, tác giả trình bày về các kỹ thuật dữ liệu khai thác được xác định

trong các tài liệu áp dụng cho nghiên cứu để phát hiện các hành vi gian lận tài

chính. Kỹ thuật được sử dụng thường xuyên nhất này là các mô hình cây quyết định

(decision trees), mạng thần kinh nhân tạo (Artificial Neural Network- ANN), mạng

31

Belief Bayesian (the Bayesian belief network), tất cả đều rơi vào kỹ thuật dự đoán

và thuật toán luật kết hợp Apriori thuộc vào kỹ thuật mô tả. Bốn kỹ thuật này sẽ

được thảo luận chi tiết hơn trong phần dưới đây.

+ Cây Quyết định (Decision Trees) là công cụ hỗ trợ quyết định mang cấu trúc

hình cây, nơi mà mỗi lá đại diện cho một thử nghiệm trên một thuộc tính và từng

nhánh đại diện cho hậu quả có thể. Những cây này có thể được trồng thông qua dựa

trên thuật toán học máy như CART và ID3, C4.5, J48.

Một cấu trúc cây được tạo ra trong đó mỗi nút của cây quy định cụ thể thử

nghiệm của một thuộc tính, từng ngành tương ứng đến một kết quả thử nghiệm, và

mỗi lá tạo thành một dự đoán phân loại. Mục đích chính của cây quyết định là dùng

để dự đoán lớp (xác định lớp) của các đối tượng chưa biết (unseen data), phân chia

dựa trên các thuộc tính tốt nhất để tách các mẫu. Mẫu tiếp được chia thành các tập

con, cho đến khi không có thêm hoặc chia tách có thể tạo ra sự khác biệt có ý nghĩa

thống kê hoặc các phân nhóm là quá nhỏ để trải qua tương tự có ý nghĩa phân chia.

Thông tin cao nhất là gần nhất với gốc cây.

(Nguồn: http://vi.wikipedia.org/wiki/ Cây_quyết_định )

Các điểm mạnh của phương pháp cây quyết định là: cây quyết định có thể tạo ra

các quy tắc dễ hiểu, thực hiện phân loại mà không cần tính toán nhiều, có thể xử lý

32

biến liên tục và phân loại, và cây quyết định cũng cung cấp một dấu hiệu rõ ràng để

dự đoán và phân loại.

+ Mạng Neuron – mạng thần kinh nhân tạo là mô hình xử lý thông tin được mô

phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật, bao gồm số lượng

lớn các Neuron được gắn kết để xử lý thông tin. ANN giống như bộ não con người,

được học bởi kinh nghiệm (thông qua huấn luyện), có khả năng lưu giữ những kinh

nghiệm hiểu biết (tri thức) và sử dụng những tri thức đó trong việc dự đoán các dữ

liệu chưa biết (unseen data). Mạng lưới thần kinh hiện đại là các công cụ mô hình

thống kê dữ liệu phi tuyến tính. Chúng thường được sử dụng để mô hình hóa các

mối quan hệ phức tạp giữa các yếu tố đầu vào và đầu ra hoặc tìm kiếm mẫu trong

dữ liệu.

Một mạng truyền thẳng đa tầng (Multilayer Perceptron) là một loại trong các lớp

phổ biến và quan trọng nhất trong các ứng dụng của mạng thần kinh, mạng lan

truyền tiến được huấn luyện theo kiểu học có giám sát, thiết lập các dữ liệu đầu vào

vào một tập hợp các đầu ra thích hợp.

(Nguồn: http://bis.net.vn)

33

Mạng lưới thần kinh được áp dụng rộng rãi trong phân loại và phân nhóm, và lợi

thế của nó như sau: Đầu tiên, là nó thích nghi, thứ hai, nó có thể tạo ra các mô hình

mạnh mẽ, và thứ ba, quá trình phân loại có thể được sửa đổi nếu trọng số huấn

luyện (training weights) mới được thiết lập. Mạng lưới thần kinh được áp dụng chủ

yếu trong lĩnh vực thẻ tín dụng, bảo hiểm ô tô và phát hiện gian lận của công ty.

Về cơ bản, mạng lưới thần kinh là một mô hình toán học từ một cơ sở dữ liệu lịch

sử của các ví dụ về các giá trị đầu vào và đầu ra. Sau khi biết mối quan hệ giữa các

biến số, mạng lưới đã được đào tạo và mô hình toán học được xây dựng trong dữ

liệu mẫu, dựa vào mối tương quan giữa các dữ liệu. Mô hình kết quả, khi được sử

dụng với các dữ liệu đầu vào mới, sẽ cung cấp dự đoán các kết quả đầu ra trong

tương lai. Ví dụ, bằng cách thu thập dữ liệu lịch sử của các khoản vay thương mại

được thực hiện cho các tổ chức, ngân hàng có thể xác định những tổ chức không có

khả năng hoàn trả các khoản vay. Một mô hình có thể được xây dựng dựa trên các

mối quan hệ, giữa các chỉ tiêu tài chính và kết quả của khoản vay của một công ty

được lựa chọn. Sau khi mô hình được tổng hợp, nó có thể được sử dụng để dự đoán

nếu người nộp đơn vay thương mại mới có thể để mặc định trả nợ. Mạng lưới thần

kinh là công cụ phân tích dữ liệu lớn có thể được sử dụng hiệu quả để dự đoán sự

xuất hiện của báo cáo tài chính gian lận nhưng thường bị bỏ qua bởi các kiểm toán

viên nội bộ và bên ngoài.

Các nhà nghiên cứu đã khám phá hiệu quả của mạng thần kinh nhân tạo, cây

quyết định và mạng niềm tin Bayesian trong phát hiện gian lận báo cáo tài chính

(FFS) và để xác định các yếu tố liên quan đến FFS (K. Fanning and K.Cogger,

1998) và (Kirkos, 2005).

+ Bayesian Belief Network - Mạng niềm tin Bayesian - là một mô hình đồ họa

mã hóa các mối quan hệ xác suất giữa các biến quan tâm. Khi được sử dụng kết hợp

với các kỹ thuật thống kê, mô hình đồ họa có nhiều thuận lợi cho phân tích dữ liệu.

Một, bởi vì mô hình mã hóa phụ thuộc trong số tất cả các biến, nó dễ dàng xử lý các

tình huống mà một số mục dữ liệu bị thiếu. Hai, một mạng Bayesian có thể được sử

dụng để tìm hiểu các mối quan hệ nhân quả, và do đó có thể được sử dụng để đạt

34

được sự hiểu biết về một vấn đề tên miền và để dự đoán những hậu quả của sự can

thiệp. Ba, bởi vì mô hình này có một ngữ nghĩa nguyên nhân và xác suất, nó là đại

diện cho việc kết hợp kiến thức (mà thường đi kèm theo hình thức quan hệ nhân

quả) và dữ liệu. Bốn, phương pháp thống kê Bayes kết hợp với mạng Bayes cung

cấp một cách tiếp cận hiệu quả và nguyên tắc để tránh lắp dữ liệu. Các nghiên cứu

mô tả mô hình mạng niềm tin Bayesian phân loại chính xác 90,3% của mẫu xác

nhận để phát hiện gian lận. Mạng niềm tin Bayesian tốt hơn mạng thần kinh và

phương pháp cây quyết định và đạt được độ chính xác phân loại xuất sắc.

Tóm lại, dù nhiều kỹ thuật phân lớp được đề xuất (phân lớp cây quyết định,

phân lớp Baysian, mạng noron, phân tích thống kê,…), trong các kỹ thuật đó, cây

quyết định được coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho data

mining (Ho Tu Bao: Chapter 3: Data mining with Decision Tree –

www.akademik.del.ac.id/ebooks).

1.4.5. Tóm tắt về khai phá dữ liệu - vai trò và ý nghĩa:

Khai phá dữ liệu là áp dụng công nghệ hiện đại trong lĩnh vực quản lý thông tin,

nó hiện diện khắp nơi (ubiquitous) và có tính ẩn (invisible) trong nhiều khía cạnh

(Hình 1.2: Khung khái niệm để phân loại các ứng dụng khai thác dữ liệu để phát hiện BCTC gian lận)

của đời sống hằng ngày.

35

Khai phá dữ liệu có ý nghĩa trong làm việc, mua sắm, tìm kiếm thông tin, nghỉ

ngơi, … Được áp dụng trong nhiều ứng dụng thuộc nhiều lĩnh vực khác nhau. Các

lĩnh vực hiện tại có ứng dụng Khai thác dữ liệu bao gồm: Thiên văn học, công nghệ

sinh học, Bào chế thuốc, Thương mại điện tử, Phát hiện gian lận, Quảng cáo,

Marketing, Quản lý quan hệ khách hàng (CMR), Chăm sóc sức khỏe, Viễn thông,

Thể thao, giải trí, Đầu tư, Máy tìm kiếm (web),… Hỗ trợ các nhà khoa học, giáo

dục học, kinh tế học, doanh nghiệp, khách hàng, …

Nghiên cứu về khả năng áp dụng các kỹ thuật khai thác dữ liệu để phát hiện các

hành vi gian lận kế toán tài chính là một lĩnh vực đầy hứa hẹn. Phương pháp thống

kê phát hiện các loại hành vi gian lận khác nhau như thẻ tín dụng gian lận, rửa tiền

gian lận, gian lận viễn thông, vv, được xem xét trong (Bolton, R. J., & Hand, D.J.,

2002). Ứng dụng khai thác dữ liệu trong thị trường chứng khoán, dự báo phá sản và

phát hiện gian lận liên quan đã được điều tra trong (Zhang, D., & Zhou, L., 2004).

Một cuộc khảo sát khai thác dữ liệu dựa trên nghiên cứu phát hiện gian lận được

trình bày trong PHUA (2004), bao gồm cả tín dụng giao dịch gian lận, lừa đảo thuê

bao viễn thông, gian lận bảo hiểm ô tô, phát hiện khủng bố, phát hiện tội phạm tài

chính, xâm nhập và phát hiện thư rác. Những người khác nghiên cứu đã xem xét

gian lận bảo hiểm (Derrig, 2002) và báo cáo tài chính gian lận (Leonard Rang’ala

Lari, 2009).

Điểm pha trộn giữa khai thác dữ liệu và phát hiện gian lận kế toán là khai thác dữ

liệu như là một công cụ phân tích tiên tiến có thể giúp kiểm toán viên trong việc đưa

ra quyết định và phát hiện gian lận. Các kỹ thuật khai thác dữ liệu có khả năng giải quyết được mâu thuẫn giữa tính hiệu lực và hiệu quả phát hiện gian lận10.

Tuy nhiên để thực hiện khai phá dữ liệu để phát hiện tri thức sẽ gặp các thách

thức như là cần các cơ sở dữ liệu lớn, số chiều lớn, dữ liệu có thể bị thiếu hoặc

nhiễu làm ảnh hưởng đến kết quả phân tích, quan hệ giữa các trường phân tích quá

10 Wang, S. (2010). A Comprehensive Survey of Data Mining-Based Accounting-Fraud Detection Research. International Conference on Intelligent Computation Technology and Automation, vol. 1, pp.50- 53, 2010.

phức tạp, việc thay đổi dữ liệu và tri thức có thể làm cho các mẫu đã phát hiện

36

không còn phù hợp. Ngoài ra việc khó truyền đạt, tương tác, giao tiếp với người sử

dụng và kết hợp với các tri thức đã có hay tích hợp với các hệ thống khác...

Kết luận chương 1:

Chương này giới thiệu các kiến thức chung về nghiên cứu. Nghiên cứu tài liệu để

trình bày các khái niệm, các phạm trù liên quan đến đề tài (như gian lận, phương

pháp gian lận thường gặp, tỷ số tài chính, khai phá dữ liệu); tổng kết các lý thuyết,

phương pháp phát hiện gian lận trên báo cáo tài chính được thực hiện bởi các nhà

kinh tế trong quá khứ. Từ những lý thuyết này, tác giả đề cập, lựa chọn, tìm ra các

tỷ số tài chính mà sẽ được vận dụng khai phá dữ liệu vào trong nghiên cứu của

mình ở chương 2.

37

CHƯƠNG II. THỰC TRẠNG GIAN LẬN VÀ PHÂN TÍCH CHỈ SỐ TÀI

CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN TRÊN CÁC BÁO CÁO TÀI CHÍNH

CỦA CÁC DOANH NGHIỆP NIÊM YẾT TẠI VIỆT NAM :

2.1. Thực trạng gian lận và sai sót trên BCTC tại các công ty niêm yết:

Việc minh bạch trong công bố thông tin báo cáo tài chính luôn là một sự quan

tâm lớn của nhà đầu tư và xã hội. Tính đến cuối năm 2011, đã có 708 doanh nghiệp

niêm yết cổ phiếu trên cả hai Sở giao dịch chứng khoán và chứng chỉ quỹ, với tổng

số lượng chứng khoán niêm yết đạt 26,82 tỷ đơn vị. Tổng giá trị vốn hóa thị trường

tính tại thời điểm ngày 31/12/2011 đạt 535,673 nghìn tỷ đồng, suy giảm 32% so với

tượng - Vietstock). Tuy nhiên theo thống kê của hai Sở Giao dịch Chứng khoán Hà

thời gian trước đó. (Nguồn: Thị trường chứng khoán Việt Nam: 1 giáp và 12 con số ấn

Nội (HNX) và Sở TP HCM (HSX), tính tới tháng 9/2012, tổng cộng 15 mã cổ phiếu

đã bị hủy niêm yết trên sàn. Năm 2011, 2012 thực sự là những năm khó khăn đối

với các doanh nghiệp khi lạm phát kéo theo lãi suất ngân hàng tăng cao, cắt giảm

đầu tư công cũng như cắt giảm chi tiêu trong toàn bộ nền kinh tế khiến cho chi phí

của doanh nghiệp tăng mạnh trong khi doanh thu sụt giảm, có đến 2/3 công ty niêm

yết có lợi nhuận bị sụt giảm trong năm 2011. Điều này là một nguyên nhân chính

cho tình hình sai lệch BCTC công bố ngày càng phổ biến, thậm chí có trường hợp

sai lệch lên tới 60% giá trị so với BCTC sau kiểm toán.

Theo thông lệ quốc tế hầu hết thông tin tài chính được DNNY công bố ra công

chúng đều phải có ý kiến của công ty kiểm toán. Tuy nhiên hiện chưa có quy định

bắt buộc khi DN công bố bản cáo bạch niêm yết, hoặc phục vụ cho kế hoạch phát

hành tăng vốn... phải có ý kiến của công ty kiểm toán theo thông lệ quốc tế này. Do

đó chuyện doanh nghiệp “làm đẹp” bản cáo bạch, thông tin tài chính trước khi công

bố ra công chúng là một thực tế nhức nhối trên TTCK hiện nay.

2.1.1 Các phương pháp gian lận trên BCTC tại các công ty niêm yết ở Việt

Nam thường gặp:

Mùa công bố Báo cáo kiểm toán năm nào, nhà đầu tư cũng liên tiếp nhận được

những thông tin công bố về những chênh lệch “khủng” với những gì họ đã nắm bắt

38

trước đó. Các gian lận, sai sót này đều gây ảnh hưởng đến các tỷ số tài chính khi

phân tích BCTC. Dưới đây minh họa những gian lận trong Báo cáo tài chính của

các Công ty cổ phần niêm yết được liệt kê theo các loại gian lận phổ biến trên Báo

cáo tài chính của ACFE.

 Doanh thu (và các tài sản liên quan) không có thật hoặc bị khai khống,

khai thiếu:

Các chỉ số tài chính như Z’score, Tỷ số Tồn kho/ Doanh thu, Tỷ số lợi nhuận, tỷ

số tăng trưởng doanh thu,… đều sẽ bị ảnh hưởng.

CTCP Nhiệt Điện Bà Rịa (BTP) ghi nhận doanh thu căn cứ vào khối lượng điện

năng bán theo đơn giá bán trong hợp đồng. Tuy nhiên, doanh thu của BTP đã ghi

nhận và tới thời điểm phát hành báo cáo bán niên 2012 chưa xuất hóa đơn cũng như

chưa được bên mua xác nhận với số tiền chưa thuế là 129,3 tỷ đồng đối với hợp

đồng mua bán điện số 07/2012/HĐ-NMĐ-Bà Rịa ngày 18/07/2012 cho công ty mua

bán điện.

Hai năm trước khi niêm yết, Dược Viễn Đông chỉ đạt lợi nhuận lần lượt 18,5 tỷ

đồng và 25,5 tỷ đồng, nhưng vào năm 2009, khi vừa niêm yết, lợi nhuận bất ngờ

nhảy vọt lên 109 tỷ đồng. Đáng chú ý, lợi nhuận của Dược Viễn Đông xuất phát từ

hoạt động sản xuất - kinh doanh chính, chứ không phải từ các thu nhập bất thường

như thanh lý tài sản, chuyển nhượng vốn. “Hiện tượng” Dược Viễn Đông sau này

được giải mã bằng hình thức ghi nhận “doanh thu ảo”. Để phát hiện cần so sánh tỷ

số giữa năm nay và năm sau sẽ có sự thay đổi không ổn định.

 Sai thời khóa:

Trường hợp này là do doanh thu hoặc chi phí được cố ý ghi nhận không đúng kỳ.

Sau kiểm toán, báo cáo tài chính hợp nhất năm 2011 của Công ty Cổ phần Tập đoàn

Đầu tư Thăng Long (TIG) đã điều chỉnh giảm doanh thu và giảm tương ứng chi phí

công trình thi công xây dựng hoàn thiện công trình chính và các hạng mục phụ trợ

tòa nhà Viettel Quảng Ngãi do tại thời điểm 31/12/2011 các thủ tục về nghiệm thu

công trình chưa đầy đủ. Giá trị này sẽ được xác định vào năm 2012. Cụ thể: Doanh

thu ghi giảm 1,62 tỷ đồng tương ứng chi phí giảm 1,94 tỷ đồng.

39

Trong mùa kiểm toán năm 2010, Đơn vị kiểm toán có ý kiến ngoại trừ việc Công

ty Cổ phần Địa ốc Đà Lạt (DLR) ghi nhận 31,15 tỷ đồng doanh thu với giá vốn

27,98 tỷ đồng từ Dự án xây dựng Cụm dân cư - Khu chung cư Yersin thành phố Đà

Lạt. Theo ký kết, công ty sẽ bàn giao từng phần hạng mục của dự án sau khi hoàn

thành và đủ điều kiện để bố trí tái định cư. UBND sẽ thanh toán cho công ty khi

quyết toán dự án và đã được cơ quan độc lập kiểm toán. Tuy nhiên, tại Báo cáo tài

chính năm 2010, công ty đã ước tính và ghi nhận doanh thu, giá vốn như trên theo

số liệu hoàn thành giữa công ty và đội thi công của công ty trong khi UBND tỉnh

Lâm Đồng chưa có văn bản chỉ định UBND thành phố Đà Lạt nghiệm thu.

Qua đây cho thấy DRL đã ghi nhận doanh thu và giá vốn Dự án xây dựng Cụm

dân cư - Khu chung cư Yersin thành phố Đà Lạt sai niên độ, doanh thu và giá vốn

này phải được ghi nhận ở niên độ năm 2011, nhưng đã được doanh nghiệp ghi nhận

vào năm 2010.

 Che giấu chi phí, công nợ:

CTCP Dược Phẩm Cửu Long (DCI) 6 tháng đầu năm 2011 giảm lợi nhuận,

nguyên nhân chênh lệch 43,89 tỷ đồng là do 2,65 tỷ đồng trả lãi vay nhà máy Caps -

kháng sinh chưa phân bổ; 19,85 tỷ đồng phân bổ chi phí bán hàng trong năm; 16,92

tỷ đồng hàng bán trả lại chưa ghi nhận; 3,35 tỷ đồng dự phòng hàng tồn kho, nợ

phải thu và 1,12 tỷ đồng chi phí khác.

Có một thực tế là sau khi kiểm toán, quý nào, năm nào cũng có một số công ty

giấu lỗ bị kiểm toán phát hiện, rất hiếm có công ty giấu lãi. Trong số hiếm hoi

những công ty giấu lãi, đáng chú ý là Công ty cổ phần Hóa dầu Petrolimex (mã

chứng khoán PLC), một công ty con của Tổng Công ty Xăng dầu Việt Nam

(Petrolimex). Căn cứ theo giá thực tế, thì khoản lãi thật của PLC trong 6 tháng đầu

năm 2011 phải tăng thêm 88,7 tỷ đồng (tính tròn), đó chính là khoản lãi thật được

“giấu” trong chi phí theo giá hạch toán. Các khoản lợi nhuận thật được “giấu” trong

chi phí hạch toán đó sẽ đi về đâu nếu như không được kiểm toán? Và khi giá hạch

toán giảm thì liệu chất lượng xăng dầu có thực sự đảm bảo. Trên cơ sở xác định đối

chiếu với giá cả tương ứng từ chính nguồn cung cũng như các hãng khác trên thế

40

giới, khi ấy mọi thứ mới có thể sáng rõ. Nhưng, chắc chắn là làm được điều này

không dễ chút nào!

 Công bố thông tin không đầy đủ và gây hiểu lầm:

Ngoài các trường hợp chậm công bố BCTC theo đúng quy định, còn có các

trường hợp như: Viwase đã không công bố các vấn đề về vốn chủ sở hữu, đất đai…

và hiệu quả đầu tư vào các công ty khác. Tuy nhiên, theo Ban lãnh đạo Công ty, do

tài sản, vốn chủ sở hữu của các công ty con đều đã đầu tư từ trước khi cổ phần hóa

và không có gì thay đổi nên không cần thiết công bố, cổ đông nào không mua đấu

giá cổ phần lần đầu, muốn biết những thông tin này, đề nghị liên hệ Công ty để biết.

Bốn năm trước, CTCP Nhiệt điện Phả Lại (PPC) không công bố thông tin về

việc xác định lại tỷ giá khoản nợ trong BCTC quý III-2008 và bị HOSE cảnh cáo.

Theo HOSE, tại thời điểm lập BCTC quý III-2008, PPC biết chi phí tài chính về

việc xác định lại tỷ giá là 584,2 tỷ đồng và có thể dự báo cho nhà đầu tư nhưng

không công bố thông tin, dẫn đến gây hiểu nhầm.

Ngày 22/10/2007, Viglacera Từ Sơn (mã VTS-HNX) công bố thông tin cho biết

VTS đạt lợi nhuận trước thuế quý III/2007 là 1,8 tỷ đồng. Trên thực tế, con số này

chỉ là hơn 600 triệu đồng. Sự nhầm lẫn xuất phát từ báo cáo tài chính không theo

chuẩn và gây khó hiểu. Với quy mô 11 tỷ đồng của VTS, lợi nhuận 1,8 tỷ đồng

trong một quý là rất cao. Ngay sau khi HNX công bố, giá cổ phiếu này đã tăng một

mạch gần gấp hai lần trong vòng khoảng hai tuần. Khối lượng giao dịch cũng cao,

đạt trên 50.000 đơn vị/phiên.

 Định giá sai tài sản:

Thông qua việc không ghi giảm giá hàng tồn kho đã hư hỏng, không lập dự

phòng các khoản phải thu khó đòi, giảm giá đầu tư ngắn hạn và dài hạn, định giá sai

các tài sản qua hợp nhất kinh doanh.

Công ty CP đầu tư hạ tầng và đô thị dầu khí (Petroland - PTL) giải trình báo cáo

tài chính kiểm toán hợp nhất năm 2010 điều chỉnh giảm tổng tài sản không hợp nhất

BCTC vì theo nghị quyết số 21/NQ-ĐHĐCĐ-PVIN ngày 11/3/2011 của ĐHĐCĐ

bất thường của CTCP Đầu tư Dầu khí Nha Trang (PVIN) về việc chuyển nhượng

41

toàn bộ số cổ phần đang sở hữu của Cty PVIN tại CTCP Đầu tư Hải Đăng cho

CTCP Đầu tư và Xây lắp Dầu khí Sài Gòn, nên quyền kiểm soát của Cty Petroland

tại CTCP Đầu tư Hải Đăng tại ngày 31/12/2011 chỉ là tạm thời lên BCTC của

CTCP Đầu tư Hải Đăng không được hợp nhất với BCTC hợp nhất năm 2010 của

Cty Petroland.

 Che dấu công nợ và chi phí, vốn hóa chi phí không đúng cách và không

phù hợp:

Công ty Cổ phần Xi măng Tiên Sơn Hà Tây (TSM): Tại kỳ phát sinh tháng

12/2011, công ty chưa tính trước phí bốc xúc, chi phí này được thanh toán chi trả

sang tháng 1/2012. Vì vậy, kiểm toán đã điều chỉnh trích trước chi phí bốc xúc là

147 triệu đồng. Trong kỳ phát sinh của tháng 10, 11, 12, công ty chưa phân bổ chi

phí của tấm palet để phục vụ việc phơi sấy gạch. Vì vậy, kiểm toán đã điều chỉnh

tăng chi phí là 13 triệu đồng, dẫn đến ảnh hưởng giảm tới lợi nhuận trước thuế và

sau thuế của đơn vị là 114 triệu đồng.

Công ty Cổ phần Vận tải Xăng dầu Đường thủy Petrolimex (PJT) thông báo báo

cáo tài chính năm 2010 đã kiểm toán với lợi nhuận sau thuế của công ty mẹ PJT đạt

10,58 tỷ đồng, giảm 22,74% so với con số 13,7 tỷ đồng đã công bố trước đó.

Nguyên nhân điều chỉnh giảm lợi nhuận là do phải trích lập thêm 4,15 tỷ đồng dự

phòng đầu tư bị lỗ ở công ty con năm 2010.

Báo cáo tài chính năm 2010 của Công ty cổ phần Basa có mã chứng khoán BAS,

công ty đã vốn hóa chi phí đi vay số tiền 1,04 tỷ đồng vào giá trị công trình xây

dựng cơ bản, trong khi công trình này đã ngừng xây dựng trong năm 2010. Nếu áp

dụng đúng như VSA 16, thì chi phí đi vay này phải tạm ngừng vốn hóa và tính vào

chi phí kinh doanh trong kỳ. Nếu thực hiện đúng như VSA 16, công ty sẽ gia tăng

thêm khoản lỗ với số tiền tương ứng 1,04 tỷ đồng.

Các chỉ số tài chính trong nhóm tỷ số hiệu suất sử dụng tài sản liên quan đến chi

phí, tài sản cố định, tài sản dài hạn, đầu tư dài hạn, hoặc tỷ số cơ cấu vốn liên quan

đến công nợ sẽ bị ảnh hưởng.

42

2.1.2 Thực trạng sử dụng chỉ số tài chính/thực hiện thủ tục phân tích trong

các công ty kiểm toán:

VACPA đầu năm 2012 đã có báo cáo về kết quả kiểm tra tình hình hoạt động

năm 2011 của 30 công ty kiểm toán đang hoạt động tại Việt Nam. Theo báo cáo này

cho thấy còn nhiều tồn tại, hạn chế, từ chấp hành chuẩn mực đạo đức nghề nghiệp,

ký kết hợp đồng dịch vụ và quản lý khách hàng, quy trình kiểm toán và hồ sơ làm

việc…. Ngoài một số công ty (E&Y, A&C, AASCN, PDAC, VAC,..) đã thực hiện

quy trình kiểm toán khá tốt và đầy đủ như: lập kế hoạch, thực hiện thủ tục tìm hiểu

khách hàng, đánh giá hệ thống kiểm soát nội bộ, rủi ro kiểm toán; xác định rủi ro có

gian lận, sai sót và xác định mức trọng yếu cho các chỉ tiêu chủ yếu trên BCTC,…

thì đa số hồ sơ được kiểm tra chưa áp dụng quy trình phân tích trong quá trình lập

kế hoạch, thực hiện kiểm toán và trong giai đoạn soát xét tổng thể. Hầu hết chỉ tập

trung vào kiểm tra chi tiết chứng từ tràn lan, hiệu quả không cao (HANCO, KTV,

Thủy Chung, ASACO, AVINA, HanoiAC,…). Đa số các hồ sơ được kiểm tra chưa

thể hiện các thủ tục đánh giá rủi ro về gian lận và sai sót cũng như xây dựng thủ tục

kiểm toán nhằm phát hiện gian lận và sai sót hoặc có nêu trong hồ sơ kiểm toán về

đánh giá gian lận, sai sót nhưng không nêu cơ sở của việc đánh giá (HANCO,

VietUc, VNAAFC,..).

Để khảo sát thực trạng sử dụng chỉ số tài chính trong thực hiện thủ tục phân tích

ở các công ty kiểm toán tại Việt Nam, tác giả đã tiến hành nghiên cứu và phân tích

số liệu dựa trên kết quả khảo sát, nhưng chỉ tập trung vào các nhân tố: về sử dụng

chỉ số tài chính trong thủ tục phân tích, áp dụng chỉ số này cho từng ngành như thế

nào và việc sử dụng chỉ số tài chính có sử dụng hỗ trợ nào của công nghệ thông tin

hay không.

- Về sử dụng chỉ số tài chính trong thủ tục phân tích:

Với kết quả khảo sát của câu 3 “Theo chính sách công ty của Anh (Chị), công ty

có thực hiện thủ tục phân tích trong việc kiểm toán không?” ta thấy đa phần các

công ty đều có bắt buộc thực hiện thủ tục phân tích trong việc kiểm toán.

- Về việc áp dụng chỉ số này cho từng ngành như thế nào:

43

Với kết quả khảo sát của câu 12 “Anh (Chị) có thường sử dụng chỉ số thống kê

ngành để đối chiếu với chỉ số tài chính của đơn vị anh chị đang kiểm toán không?”

thì đa phần các công ty kiểm toán không có so sánh với chỉ số của ngành, và cho

rằng chỉ số tài chính chưa phản ánh đúng tình hình tài chính của đơn vị đang được

kiểm toán.

- Về việc hỗ trợ của công nghệ thông tin trong phân tích kiểm toán:

Mặc dù có thực hiện phân tích chỉ số tài chính, nhưng các kiểm toán viên được

khảo sát cho rằng mức độ hữu ích của việc sử dụng chỉ số tài chính có thể phát hiện

ra gian lận sai sót trên BCTC thông qua phân tích chỉ ở mức trung bình. Lý do có

thể hiểu là theo kết quả của câu 4 “Theo Anh (Chị), lý do nào thủ tục phân tích ít

được thực hiện trong thực tế”, được cho biết là do kiểm toán viên yếu kỹ năng phân

tích và ở các công ty kiểm toán không phải Big 4 thì không có sử dụng phần mềm

khi kiểm toán.

Biểu đồ kết quả chi tiết xem ở Phụ lục Bảng tổng hợp kết quả khảo sát.

2.2. Sử dụng kỹ thuật khai phá dữ liệu để phát hiện gian lận trong trình bày

báo cáo tài chính:

2.2.1 Môi trường thực nghiệm:

Những gì chúng ta quan tâm là hiệu quả hoạt động trong tương lai trong khả

năng phân loại trên dữ liệu mới, dựa trên hiệu suất học máy trước đây trên dữ liệu

cũ. Vì vậy, câu hỏi là, tỷ lệ lỗi trên dữ liệu cũ có thể sẽ là một chỉ số tốt về tỷ lệ lỗi

trên dữ liệu mới? Câu trả lời là không có thành công vang dội nếu không có các dữ

liệu cũ đã được sử dụng trong quá trình học tập để đào tạo các phân loại.

Do đó trong phần này, bước đầu tiên phải thu thập các báo cáo tài chính có gian

lận, tập dữ liệu này gọi là tập dữ liệu học. Mỗi báo cáo tài chính được đặc trưng qua

các tỉ số tài chính. Sau đó chọn một mô hình học phân lớp (đã được nói tới ở phần

1.4) và sử dụng công cụ hỗ trợ học để phân tích các báo cáo tài chính gian lận và rút

ra các luật phân lớp.

44

Sau khi đã có các luật phân lớp ta qua bước vận hành. Báo cáo tài chính cần thẩm

tra được đặc trưng bằng các tiêu chí là tỷ số tài chính, .... Các luật phân lớp sẽ được

áp dụng để phân loại báo cáo tài chính mới là có gian lận hay không?

2.2.1.1 Lựa chọn công cụ hỗ trợ cho khai phá dữ liệu:

Nghiên cứu này dựa trên các nghiên cứu trước đây về lĩnh vực khai phá dữ liệu

đồng thời cập nhật thêm các công cụ hỗ trợ mới, sau khi tìm hiểu các tính năng của

từng công cụ như Discipulus, Weka, Orange, Yale, Carrot 2, ELKI, GATE, R,

Microsoft Analysics Service, SAS, Google Chart API, hay cũng có thể đạt được

nhiều kết quả tốt với Microsoft Excel. Đề tài đã chọn công cụ dựa trên các tiêu chí:

khả năng tính toán, tính tiện dụng dễ hiểu cho người không chuyên công nghệ thông

tin - chỉ đòi hỏi một sự hiểu biết thô sơ của các khái niệm thống kê, hỗ trợ tốt trực

quan hóa (visualization) và hơn thế nữa là tiết kiệm chi phí tối đa (ưu tiên phần

mềm mã nguồn mở). Phần mềm Weka đã đáp ứng các yêu cầu trên đồng thời cũng

có công cụ tiền xử lý dữ liệu tốt và hỗ trợ cho những tập dữ liệu lớn nên tác giả đã

chọn Weka như là một công cụ để thực hiện bài luận này.

Weka đã được phát triển ở trường Đại học Waikato và là tên viết tắt của Waikato

Environment for Knowledge Analysis, hệ thống này được viết bằng ngôn ngữ Java,

chạy trên bất kỳ flatform nào, đã được thử nghiệm với Linux và Windows, và hệ

điều hành Macintosh. Nó cung cấp một giao diện thống nhất với nhiều thuật toán

khác nhau, cùng với các phương pháp cho việc xử lý trước, xử lý sau và dành cho

việc đánh giá kết quả của các sơ đồ học trên bất kỳ tập dữ liệu cho trước nào.

Hình 2.1 :Giao diện phần mềm Weka

Trong phần Application có 4 mục lựa chọn:

45

(cid:0) Explorer: Sử dụng menu lựa chọn. Explorer sử dụng cho những bộ dữ liệu

vừa và nhỏ.

(cid:0) Experimenter: Cho phép người dùng thực hiện những bài tập cơ bản khi ứng

dụng phân lớp và kỹ thuật hồi quy, với những công việc có giá trị, phương pháp và

tham số tốt nhất cho vấn đề đã cho. Cho phép bạn tự động hóa xử lý, làm cho nó

phân lớp và lọc dễ dàng với những cách thiết lập tham số khác nhau trên toàn bảng

dữ liệu.

(cid:0) KnowledgeFlow: Cho phép người dùng kéo thả những chiếc hộp tượng trưng

cho các giải thuật và dữ liệu để kết nối chúng lại với nhau và đưa ra cấu trúc.

(cid:0) Simple CLI: Sử dụng câu lệnh thực thi.

Weka hỗ trợ một số dữ liệu nhiệm vụ khai thác tiêu chuẩn, cụ thể hơn, tiền xử lý

dữ liệu, phân nhóm, phân loại, hồi quy, trực quan, và lựa chọn tính năng. Weka

triển khai một tập hợp tương đối đầy đủ các thuật toán phân loại, bao gồm nhiều

phân loại phổ biến nhất. Dựa trên những nghiên cứu liên quan (ví dụ, nghiên cứu và

dữ liệu nghiên cứu gian lận báo cáo tài chính trước đây khai thác dữ liệu trong các

lĩnh vực), 3 thuật toán đã được lựa chọn từ Weka: (1) J48, (2) Bayesian Network,

(3) MultilayerPerceptron.

2.2.1.2 Tiền xử lý dữ liệu:

Bước đầu tiên là thu thập, phân tích. Kích thước của nghiên cứu là các công ty

niêm yết trên thị trường chứng khoán Việt Nam (HOSE và HNX). Số lượng các

quan sát là 213 mẫu BCTC của các công ty cho giai đoạn tài chính năm 2009 đến

năm 2011 được thu thập thành 2 tập hợp dữ liệu tách biệt nhau: 2020 mẫu BCTC

làm tập hợp dữ liệu huấn luyện và 11 mẫu BCTC để làm tập kiểm tra, xác nhận tính

hữu ích của mô hình. Các tiêu chí cho các quan sát là:

- Các công ty niêm yết trên sàn hơn hoặc bằng 2 năm.

- Báo cáo tài chính của các công ty này được kiểm toán hàng năm bởi các công ty

kiểm toán hoạt động tại Việt Nam. Tuy nhiên các báo cáo được phân tích là các báo

cáo tài chính được công bố trước kiểm toán. Báo cáo được kiểm toán sẽ là cơ sở cho

việc phân loại dưới đây.

46

- Trong tập hợp dữ liệu huấn luyện, phân ra làm 2 loại: 104 công ty có có dấu

hiệu gian lận được xuất hiện và 98 công ty không có dấu hiệu gian lận BCTC trong

việc ban hành. Trong đó 27 công ty trong ngành nguyên vật liệu, 7 công ty ngành

công nghệ thông tin, 94 công ty ngành công nghiệp, 17 công ty ngành dịch vụ tiêu

dùng, 44 công ty ngành hành tiêu dùng, 9 công ty ngành năng lượng, 12 công ty

trong ngành y tế.

Việc phân loại một báo cáo tài chính là có sai sót, gian lận này được dựa trên các

thông số sau đây: trong báo cáo của kiểm toán viên nghi ngờ nghiêm trọng của tính

chính xác của các tài khoản, báo cáo tài chính sau kiểm toán được yêu cầu phải điều

chỉnh, cơ quan thuế có sự không khoan nhượng các khoản thuế nghiêm trọng trong

đó làm thay đổi đáng kể bảng cân đối hàng năm của công ty và báo cáo thu nhập,

việc áp dụng pháp luật Việt Nam liên quan đến giá trị thực tiêu cực (như: dự phòng

giảm giá,…), các công ty trên sàn giao dịch chứng khoán HOSE và HNX bị theo

dõi gắt gao và “đàm phán bị đình chỉ” cho lý do liên quan đến giả mạo dữ liệu tài

chính của công ty, và sự tồn tại của thủ tục tố tụng tòa án chờ đối với FFS hoặc sự

phạm pháp về thuế nghiêm trọng. Các dấu hiệu này trong dữ liệu về lịch sử gian lận

của tổ chức có thể được thu thập từ chính báo cáo giải trình điều chỉnh các sai sót

trọng yếu của công ty đó theo yêu cầu của kiểm toán viên sau khi kiểm toán hoặc

các cáo buộc gian lận nếu có từ nguồn bên ngoài khác chẳng hạn như thị trường

chứng khoán, tạp chí ngành công nghiệp thương mại, báo, tạp chí kinh doanh và

internet.

Những công ty có những đặc điểm không FFS dựa trên sự vắng mặt của bất kỳ

dấu hiệu hoặc bằng chứng liên quan đến việc phân loại FFS trong báo cáo của kiểm

toán viên, trong cơ sở dữ liệu tài chính và thuế và Sở Giao dịch chứng khoán HOSE

và HNX. Mẫu quan sát không có FFS này được quan sát và điều tra cẩn thận, tuy

nhiên điều này không đảm bảo rằng các báo cáo tài chính của các doanh nghiệp này

không bị giả mạo hoặc có các hành vi không FFS được tiết lộ trong tương lai. Nó

chỉ bảo đảm rằng không có FFS đã được tìm dựa trên các thông số trên.

47

Một vấn đề nữa là đối với nghiên cứu này, tác giả muốn yêu cầu một mẫu của

các công ty với FFS được biết đến, tuy nhiên lấy một mẫu trình bày như thế một

thách thức. Hiếm khi nào công ty kiểm toán cung cấp cho các nhà nghiên cứu dữ

liệu FFS. Các công ty kiểm toán lo sợ nguy cơ kiện tụng và thiệt hại có thể được kết

hợp với FFS. Do đó tác giả chỉ lấy các BCTC nghi ngờ có gian lận, dù có những

công văn điều chỉnh hay chưa thì số liệu được dùng để phân tích là số liệu được

chính công ty công bố ban đầu vào kết thúc năm báo cáo tài chính chưa được điều

chỉnh và được đánh giá là có sai sót trọng yếu cần phải được điều chỉnh, và trong

nghiên cứu này được phân loại là có gian lận. Các Báo cáo tài chính có gian lận hay

doanh nghiệp có gian lận trong nghiên cứu này có thể chưa hoặc không bao giờ bị

kết án về hành vi liên quan đến gian lận. Sự phân loại này chỉ phù hợp với những sự

tự thừa nhận lỗi, sự trải nghiệm thời kỳ tài chính khó khăn hay qua các nghiên cứu

trước đây.

Vấn đề thứ hai là các công ty được phân tích không có công ty hoạt động trong

lĩnh vực dịch vụ tài chính như Ngân hàng, Bảo hiểm, quỹ đầu tư,…vì BCTC của

các công ty này khá khác với BCTC doanh nghiệp bình thường và các quy định

hoạt động của họ được kiểm soát chặt bởi các cơ quan cấp cao. Các công ty ngành

viễn thông và điện nước đa phần chưa được cổ phần hóa nên cũng không có trong

dữ liệu của nghiên cứu này. Do đó trong mẫu chọn chỉ bao gồm 7 ngành còn lại

trong phân ngành đã được nói tới ở phần (1.2.3): Năng lượng, Nguyên vật liệu,

Công nghiệp, Dịch vụ tiêu dùng, Hàng tiêu dùng, Y tế, Công nghệ.

Bước tiếp theo là tiền xử lí dữ liệu. Xử lý các giá trị thiếu của các thuộc tính

bằng cahcs thay các giá trị thiếu bằng giá trị trung bình của thuộc tính đó. Loại bỏ

các giá trị chứa các giá trị vô nghĩa và không có khả năng kết nối dữ liệu. Một thách

thức trong khi tiền xử lý dữ liệu là BCTC của các công ty hoạt động đa ngành nghề,

thậm chí trong những ngành rất khác nhau nên tỷ số tài chính của họ ít có ý nghĩa

khi so sánh với tỷ số ngành, do đó để hạn chế các BCTC được dùng để phân tích là

các BCTC riêng của công ty chứ không phải là BCTC hợp nhất. Vì là nghiên cứu

48

nhỏ, nghiên cứu này chỉ mới sử dụng BCTC riêng của công ty chứ chưa dùng

BCTC hợp nhất để phân tích nhằm hạn chế việc phân loại ngành.

Trong giai đoạn tiền xử lý dữ liệu, đề tài lựa chọn các thuộc tính có liên quan

đến công việc dự đoán dựa trên các chỉ số tài chính thường được sử dụng đã trình

bày trong chương I, kết hợp giá trị của các thuộc tính thành các nhóm có ý nghĩa và

dẫn xuất ra thuộc tính mới.

2.2.1.3 Mô hình hóa công việc:

Bước kế tiếp trong vấn đề dự đoán của đề tài là xây dựng và đánh giá các mô

hình. Giải thuật Decision Tree và Bayesian Network được cung cấp trong công cụ

Weka đã được sử dụng cho việc mô hình hóa.

Giải thuật J48-Decision Tree trong Weka được cung cấp ở lớp Java có tên

“weka.classifiers.trees.J48 -C 0.25 -M 2”. Giải thuật này sinh ra cây cắt (pruned)

hoặc không cắt (un-pruned) C4.5 Decision Tree, và có 3 tham số quan trọng (xem

bảng IV):

• confidenceFactor: Nhân tố sử dụng cho việc cắt tỉa (Nếu giá trị này càng nhỏ

thì cây sinh ra sẽ được cắt càng nhiều)

• minNumObj: Số thể hiện (instances) tối thiểu trên một nút lá trong cây.

• Unpruned: Nếu là True thì cây sinh ra sẽ được cắt tỉa và ngược lại.

(Hình 2.2: Tham số của thuật toán cây quyết định J.48)

49

Giải thuật Bayesian Network trong Weka được cung cấp ở lớp Java

“weka.classifiers.bayes.BayesNet -D -Q weka.classifiers.bayes.net.search.local.K2 -

- -P 1 -S BAYES -E weka.classifiers.bayes.net.estimate.SimpleEstimator -- -A 0.5”,

và có hai tham số chính (xem bảng VI):

• Estimator: Sử dụng cho việc tìm bảng phân phối xác suất, nó ước lượng xác

suất trực tiếp từ dữ liệu vào.

• SearchAlgorithm: Sử dụng để tìm cấu trúc cho mạng Bayes

(Hình 2.3: Tham số của thuật toán Bayesian Network)

2.2.2 Tính hữu ích khi sử dụng tỷ số tài chính phân tích BCTC gian lận:

Chúng ta thường cần phải so sánh hai phương pháp học khác nhau về cùng một

vấn đề để xem phương pháp nào tốt hơn để sử dụng. Điều này đơn giản là chọn mô

hình nào mà ước tính thành công là lớn hơn. Tuy nhiên, cũng phải lưu ý rằng các

mô hình có thể có sự khác biệt chỉ đơn giản là do lỗi dự toán, và trong một số

trường hợp, điều quan trọng là để xác định xem một trong những chương trình là

thực sự tốt hơn so với người khác về một vấn đề cụ thể. Đây là một thách thức tiêu

chuẩn cho các nhà nghiên cứu học máy.

Các tham số khi chạy mô hình trong nghiên cứu này là dùng tham số mặc định

trước sử dụng thuật toán phổ biến.

2.2.2.1 Sử dụng mô hình Bayesian Network:

Đây là dữ liệu thu được sau khi thực hiện thành công, gồm thông tin về tập dữ

liệu, mô hình phân lớp, kết quả trên tập dữ liệu kiểm thử và số liệu thống kê.

--

-S

-P

-Q -E

-D BAYES

50

0.649 0.338 0.699 0.649 0.63 0.349 0.748 0.729

=== Confusion Matrix ===

Bảng 2.1: Kết quả của mô hình học máy Bayesian Network (2 trang) weka.classifiers.bayes.BayesNet Scheme: weka.classifiers.bayes.net.search.local.K2 1 weka.classifiers.bayes.net.estimate.SimpleEstimator -- -A 0.5 Relation: 1.nonfraud&fraud-non dscr Instances: 202 Attributes: 29 === Classifier model (full training set) === Bayes Network Classifier not using ADTree #attributes=29 #classindex=28 Network structure (nodes followed by parents) Time taken to build model: 0.02 seconds === Evaluation on training set === Time taken to test model on training data: 0.02 seconds === Summary === Correctly Classified Instances 131 64.8515 % Incorrectly Classified Instances 71 35.1485 % Kappa statistic 0.3064 Mean absolute error 0.3618 Root mean squared error 0.4787 Relative absolute error 72.4133 % Root relative squared error 95.7915 % Coverage of cases (0.95 level) 97.5248 % Mean rel. region size (0.95 level) 90.8416 % Total Number of Instances 202 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 0.888 0.577 0.592 0.888 0.71 0.349 0.748 0.718 NonFraud 0.423 0.112 0.8 0.423 0.553 0.349 0.748 0.739 Fraud Weighted Avg.

51

Bảng 2.1: Kết quả của mô hình học máy Bayesian Network (2 trang) a b <-- classified as 87 11 | a = NonFraud 60 44 | b = Fraud Theo kết quả trên đây thì mẫu dữ liệu gồm có 202 công ty, phân loại ban đầu có

104 BCTC có điều chỉnh sau khi công bố (có sai sót trọng yếu), nhưng mô hình chỉ

phát hiện được 87 trường hợp; phân loại ban đầu có 98 BCTC không có điều chỉnh

sau khi công bố, nhưng mô hình chỉ phát hiện được 44 trường hợp; tổng số phát

hiện đúng là 131 trường hợp (64,9%), phát hiện sai 71 trường hợp (35,1%).

Mô hình phân lớp này không đạt hiệu quả lắm.

2.2.2.2 Sử dụng mô hình cây quyết định:

2.2.2.2.1 Phân loại báo cáo tài chính của các công ty niêm yết trong tất cả mẫu

(7 ngành):

Bảng 2.2: Kết quả của mô hình học máy cây quyết định J4.8 (sử dụng Use training

=== Run information === Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2 Relation: 1.nonfraud&fraud-non dscr Instances: 202 Attributes: 29 CACL QACL NFATA B1 SALTA B2 CASHTA DEBTEQ FAEQ RECLIB TDTA LTDTA WCTA INVSAL

set) (4 trang)

52

Bảng 2.2: Kết quả của mô hình học máy cây quyết định J4.8 (sử dụng Use training

INVTA Z score COSAL NPSAL NIFA GPTA NPTA ROCE RECSAL REINV RETREND B3 GMTREND Nganh Loai Test mode: evaluate on training data === Classifier model (full training set) === J48 pruned tree ------------------ NPTA <= 0.0088 | RECSAL <= 0.1151 | | CASHTA <= 0.0137: NonFraud (3.0) | | CASHTA > 0.0137: Fraud (3.0/1.0) | RECSAL > 0.1151: Fraud (30.0/1.0) NPTA > 0.0088 | Nganh = HTD | | CACL <= 1.0586: Fraud (4.0) | | CACL > 1.0586 | | | CASHTA <= 0.2217 | | | | COSAL <= 0.174: NonFraud (15.0) | | | | COSAL > 0.174 | | | | | GMTREND <= 0.5564 | | | | | | REINV <= 0.092: NonFraud (2.0) | | | | | | REINV > 0.092: Fraud (5.0) | | | | | GMTREND > 0.5564: NonFraud (5.0) | | | CASHTA > 0.2217: Fraud (3.0)

set) (4 trang)

53

Bảng 2.2: Kết quả của mô hình học máy cây quyết định J4.8 (sử dụng Use training

41

| Nganh = Cng: NonFraud (64.0/31.0) | Nganh = DVTD | | COSAL <= 0.0738: Fraud (4.0) | | COSAL > 0.0738 | | | B2 <= 0.6313 | | | | LTDTA <= 0.0195: Fraud (4.0/1.0) | | | | LTDTA > 0.0195: NonFraud (2.0) | | | B2 > 0.6313: NonFraud (8.0) | Nganh = Nlg | | LTDTA <= 0.0651: NonFraud (3.0) | | LTDTA > 0.0651: Fraud (5.0/1.0) | Nganh = Yte | | INVSAL <= 0.1727: Fraud (2.0) | | INVSAL > 0.1727: NonFraud (8.0) | Nganh = NVL | | RECLIB <= 0.3893: Fraud (12.0/1.0) | | RECLIB > 0.3893 | | | B1 <= 0.057 | | | | INVTA <= 0.3286: Fraud (6.0/1.0) | | | | INVTA > 0.3286: NonFraud (3.0) | | | B1 > 0.057: NonFraud (4.0) | Nganh = CNTT: NonFraud (6.0/1.0) | Nganh = CNg: NonFraud (1.0) Number of Leaves : 24 Size of the tree : Time taken to build model: 0.03 seconds === Evaluation on training set === Time taken to test model on training data: 0.03 seconds === Summary === Correctly Classified Instances 164 81.1881 % Incorrectly Classified Instances 38 18.8119 %

set) (4 trang)

54

Bảng 2.2: Kết quả của mô hình học máy cây quyết định J4.8 (sử dụng Use training

Kappa statistic 0.6263 Mean absolute error 0.2154 Root mean squared error 0.3281 Relative absolute error 43.109 % Root relative squared error 65.6577 % Coverage of cases (0.95 level) 99.505 % Mean rel. region size (0.95 level) 74.7525 % Total Number of Instances 202 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 0.939 0.308 0.742 0.939 0.829 0.648 0.919 0.892 NonFraud 0.692 0.061 0.923 0.692 0.791 0.648 0.919 0.898 Fraud Weighted Avg.

0.812 0.181 0.835 0.812 0.809 0.648 0.919 0.895

Số BCTC không có gian lận – mẫu và mô hình cùng kết quả phân loại

=== Confusion Matrix === a b <-- classified as 92 6 | a = NonFraud 32 72 | b = Fraud

Số BCTC có gian lận – mẫu và mô hình cùng kết quả phân loại

set) (4 trang)

Theo kết quả trên đây thì mẫu dữ liệu gồm có 202 công ty, phân loại ban đầu có

104 BCTC có điều chỉnh sau khi công bố (có sai sót, gian lận), nhưng mô hình chỉ

phát hiện được 72 trường hợp; phân loại ban đầu có 98 BCTC không có điều chỉnh

sau khi công bố, mô hình phát hiện được 92 trường hợp; tổng số phát hiện đúng là

164 trường hợp (81,2%), phát hiện sai 38 trường hợp (18,8%).

Mô hình phân lớp bằng cây quyết định chính xác hơn mô hình Bayesian

Network. Ưu điểm vượt trội của mô hình cây quyết định là quy luật phân lớp trực

quan dễ hiểu và có độ tin cậy cao hơn.

55

Quy luật 1: tỷ số NPTA <= 0.0088 thì kiểm tra tỷ số RECSAL , nếu RECSAL >

0.1151 thì BCTC có gian lận.

Quy luật 2: tỷ số NPTA <= 0.0088 thì kiểm tra tỷ số RECSAL , nếu RECSAL

<= 0.1151 thì xét tiếp chỉ số CASHTA, nếu tỷ số CASHTA > 0.0137, thì BCTC có

gian lận, nếu CASHTA <= 0.0137 thì không có gian lận.

Quy luật 3: tỷ số NPTA > 0.0088, thì xét theo ngành,… theo như quy luật được

mô tả trực quan như trong cây quyết định trong hình sau:

(Hình 2.4: Mô hình cây quyết định của toàn bộ tập dữ liệu)

Nghiên cứu khẳng định rằng trong số 29 chỉ số, sức mạnh của các chỉ số tài chính

trong việc phát hiện gian lận báo cáo tài chính cư trú mạnh mẽ trong 14 chỉ số tài

chính mà được vẽ trong biểu đồ hình cây của mô hình cây quyết định gồm các tỷ số:

Tỷ số Lợi nhuận/ Tài sản (NPTA), Số vòng quay khoản phải thu (RECSAL),Tỷ số

Tiền mặt/ Tài sản (CASHTA), Tỷ số thanh toán ngắn hạn (CACL), Tỷ số Nợ dài

hạn/ Tài sản (LTDTA), Tỷ số lợi nhuận gộp (COSAL), Tỷ số Tồn kho/ Doanh thu

(INVSAL), Tỷ số cơ cấu nợ (RECLIB), Tỷ số tăng trưởng lợi nhuận (GMTREND),

56

Tỷ số Tồn kho/ Tổng tài sản (INVTA), Tỷ số tăng trưởng bền vững (REINV), Tỷ số

đầu tư tài chính dài hạn (B1), Tỷ số Giá vốn / Tổng tài sản (B2).

2.2.2.2.2 Phân loại báo cáo tài chính của các công ty niêm yết trong ngành công

nghiệp:

(Hình 2.5: Mô hình cây quyết định của tập dữ liệu ngành công nghiệp)

2.2.2.2.3 Phân loại báo cáo tài chính của các công ty niêm yết trong ngành Công

nghệ thông tin:

(Hình 2.6: Mô hình cây quyết định của tập dữ liệu ngành công nghệ thông tin)

57

2.2.2.2.4 Phân loại báo cáo tài chính của các công ty niêm yết trong ngành Dịch vụ

tiêu dùng:

(Hình 2.7: Mô hình cây quyết định của tập dữ liệu ngành Dịch vụ tiêu dùng)

2.2.2.2.5 Phân loại báo cáo tài chính của các công ty niêm yết trong ngành hàng

tiêu dùng:

(Hình 2.8: Mô hình cây quyết định của tập dữ liệu ngành Hàng tiêu dùng)

58

2.2.2.2.6 Phân loại báo cáo tài chính của các công ty niêm yết trong ngành Năng

lượng:

(Hình 2.9: Mô hình cây quyết định của tập dữ liệu ngành Năng lượng)

2.2.2.2.7 Phân loại báo cáo tài chính của các công ty niêm yết trong ngành nguyên

vật liệu:

(Hình 2.10: Mô hình cây quyết định của tập dữ liệu ngành Nguyên vật liệu)

59

2.2.2.2.8 Phân loại báo cáo tài chính của các công ty niêm yết trong ngành Y tế:

Chi tiết độ chính

TP Rate FP Rate Precision Recall

MCC

F- Measure

ROC Area

PRC Area

xác phân lớp

0.812

0.181

0.835

0.812

0.809

0.648

0.919

0.895

Toàn thị trường (ngoại trừ ngành tài chính)

Ngành công

0.659

0.242

0.791

0.659

0.645

0.459

0.724

0.683

nghiệp

Ngành công nghệ

1

0

1

1

1

1

1

1

thông tin

Ngành Dịch vụ

0.944

0.035

0.951

0.944

0.945

0.892

0.981

0.967

tiêu dùng

Ngành hàng tiêu

1

0

1

1

1

1

1

1

dùng

Ngành Năng

1

0

1

1

1

1

1

1

lượng

Ngành nguyên vật

0.963

0.019

0.967

0.963

0.963

0.922

0.991

0.984

liệu

0.917

0.25

0.925

0.917

0.911

0.775

0.833

0.862

Ngành Y tế

(Hình 2.11: Mô hình cây quyết định của tập dữ liệu ngành Y tế)

(Bảng 2.3 Chi tiết độ chính xác phân lớp theo từng ngành của mô hình cây quyết định)

Sự khác biệt của mô hình cây quyết định chủ yếu là trong mô hình phân ngành

công nghiệp và các ngành còn lại. Xác suất phân loại đúng của mô hình trong từng

phân ngành thì khác nhau, độ tin cậy F-Measure của ngành công nghiệp thấp nhất

chỉ có 0.645. Điều này làm cho độ tin cậy của toàn mẫu đem phân tích cũng bị giảm

xuống còn 0.809. Tuy nhiên độ tin cậy này cũng là đã khá cao rồi. Mô hình phát

60

triển chính xác trong việc phân loại một cách chính xác với tỷ lệ lớn hơn 80% tổng

số mẫu.

Lý do đầu tiên phải kể đến là ngành công nghiệp trong khảo sát thực hiện ở phần

2.1.2 được các kiểm toán viên đánh giá là ngành có khả năng gian lận cao nhất, từ

đó dẫn đến việc có thể trong mẫu có nhiều BCTC có gian lận nhưng chưa được phát

hiện để đưa ra sự học tập phân loại đúng cho mô hình cây quyết định. Đây cũng

chính là hạn chế của mô hình mà tác giả sẽ phân tích ở chương 3.

2.2.2.3 Sử dụng mô hình Multilayer Perceptron:

Bảng 2.10: Kết quả của mô hình Multilayer Perceptron (sử dụng Use training set) (4 trang) === Run information === Scheme: weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H a Relation: 1.nonfraud&fraud-non dscr Instances: 202 Attributes: 29 CACL QACL NFATA B1 SALTA B2 CASHTA DEBTEQ FAEQ RECLIB TDTA LTDTA WCTA INVSAL INVTA Z score COSAL NPSAL NIFA GPTA NPTA

61

Bảng 2.10: Kết quả của mô hình Multilayer Perceptron (sử dụng Use training set) (4 trang) ROCE RECSAL REINV RETREND B3 GMTREND Nganh Loai Test mode: evaluate on training data === Classifier model (full training set) === Sigmoid Node 0 Inputs Weights Threshold 0.9401686932752148 Node 2 -4.198540833393342 Node 3 -1.5266606634372295 Node 4 -0.22589983979365816 Node 5 -3.52665098578603 Node 6 -1.8841993667886345 Node 7 -4.6218510856136925 Node 8 -3.2893233527754555 Node 9 2.7131905770493288 Node 10 -8.365185930945984 Node 11 -7.208281417325674 Node 12 0.13835999247858682 Node 13 -3.382271876611872 Node 14 2.0652591412327563 Node 15 -0.9657552934447652 Node 16 5.617409238514388 Node 17 7.204898979198742 Node 18 -0.7801860622655832 Node 19 10.3323486470791 Sigmoid Node 1 Inputs Weights Threshold -0.9372856529533808 Node 2 4.193773319955618 Node 3 1.5408798085334843 Node 4 0.19964932103731498 Node 5 3.526937416294387 Node 6 1.8919642313697758

62

Bảng 2.10: Kết quả của mô hình Multilayer Perceptron (sử dụng Use training set) (4 trang) Node 7 4.6152650139054305 Node 8 3.29398966743962 Node 9 -2.737232194991993 Node 10 8.368545042998784 Node 11 7.206742568141326 Node 12 -0.16709619530070402 Node 13 3.3801932772083854 Node 14 -2.0386239212743043 Node 15 0.9746052317790681 Node 16 -5.616112706463865 Node 17 -7.207123057602857 Node 18 0.7573855261107713 Node 19 -10.328383000517253 … … Class NonFraud Input Node 0 Class Fraud Input Node 1 Time taken to build model: 2.43 seconds === Evaluation on training set === Time taken to test model on training data: 0.07 seconds === Summary === Correctly Classified Instances 178 88.1188 % Incorrectly Classified Instances 24 11.8812 % Kappa statistic 0.7634 Mean absolute error 0.171 Root mean squared error 0.298 Relative absolute error 34.2231 % Root relative squared error 59.636 % Coverage of cases (0.95 level) 99.0099 % Mean rel. region size (0.95 level) 73.7624 % Total Number of Instances 202 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class

63

Bảng 2.10: Kết quả của mô hình Multilayer Perceptron (sử dụng Use training set) (4 trang) 0.969 0.202 0.819 0.969 0.888 0.776 0.961 0.952 NonFraud 0.798 0.031 0.965 0.798 0.874 0.776 0.961 0.964 Fraud Weighted Avg. 0.881 0.114 0.894 0.881 0.881 0.776 0.961 0.958 === Confusion Matrix === a b <-- classified as 95 3 | a = NonFraud 21 83 | b = Fraud

Mô hình phân loại chính xác được tới 88,11%, có độ chính xác cao nhất trong 3

mô hình.

Theo kết quả trên đây thì mẫu dữ liệu gồm có 202 công ty, phân loại ban đầu có

104 BCTC có điều chỉnh sau khi công bố (có sai sót, gian lận), mô hình phát hiện

được 95 trường hợp; phân loại ban đầu có 98 BCTC không có điều chỉnh sau khi

công bố, mô hình phát hiện được 83 trường hợp; tổng số phát hiện đúng là 178

trường hợp (88,12%), phát hiện sai 24 trường hợp (11.88%).

64

2.2.3 Áp dụng các luật phân lớp tìm được để phân lớp báo cáo tài chính mới:

Không có kỹ thuật phân lớp nào là “tốt nhất” (xem

http://en.wikipedia.org/wiki/No_free_lunch_theorem). Tùy theo mục đích của người

sử dụng mà thường sẽ có một thuật toán phù hợp, hiệu quả hơn. Nếu cần thời gian

huấn luyện nhanh thì thuật toán mạng noron (mô hình Bayesian Network) là một

lựa chọn tốt. Multilayer percetron cũng là mạng noron nhưng có thể chậm trong

huấn luyện và đặc biệt có hiệu quả cao trong việc phân loại nhận diện kiểu dữ liệu

text. Nếu có thời gian nhưng cần độ chính xác cao thì cây ngẫu nhiên (sử dụng một

số cây quyết định để cải thiện tỷ lệ phân loại) là phù hợp với nhu cầu. Nếu chỉ cần

tường minh, dễ hiểu thì mô hình cây quyết định là một lựa chọn tốt. (Charter 13:

OpenCV - http://picprojects.googlecode.com )

Mặc dù trong phần 2.2.2, mô hình Multilayer percetron cho kết quả phân loại tốt

hơn mô hình cây quyết định trong việc học máy phân loại, tuy nhiên do việc phân

loại của mô hình cây quyết định cũng đạt hiệu quá khá cao và để dễ hiểu, cho ra kết

quả nhanh chóng, tác giả sử dụng mô hình cây quyết định để kiểm tra lại mô hình.

Áp dụng các quy luật được tìm ra ở trên dựa vào các báo cáo mẫu đã chọn trong

tập huấn luyện trong mô hình ở trên. Theo đó, tác giả lựa chọn 11 BCTC không và

có gian lận đã được phát hiện để kiểm tra xem liệu mô hình có dự đoán được chính

xác gian lận không.

Mô hình phân lớp cây quyết định J48 được chọn làm mô hình huấn luyện để

 Tác giả đã huấn luyện dữ liệu BCTC thành mô hình lưu là J48.arff

 Sau đó tác giả cho chạy các dữ liệu BCTC mới được lưu với tên là “test.arff”

phân loại, phân tích gian lận sai sót có trong cho các dữ liệu BCTC chính mới:

để kiểm tra dự báo mà thuộc tính phân loại có gian lận hay không có gian lận

 Trong options chọn “Output prediction” là kiểu file “.csv”

 Cho chạy lại dữ liệu “Re-evaluate model on current test set” để dự báo dữ liệu

chưa được biết (được phân loại bất kỳ)

đầu ra (lúc này số liệu thống kê chỉ là vô ích do thiếu giá trị lớp trong tập kiểm

tra, vì vậy chỉ cần bỏ qua chúng).

65

Bảng 2.11: Kết quả dự báo dữ liệu đầu ra dựa trên mô hình cây quyết định (2 trang)

predicted,

=== Re-evaluation on test set === User supplied test set Relation: test Instances: 11 Attributes: 29 === Predictions on user test set === inst#, actual, 1, 2, 3, 4, 5, 6, 7, 8, 9, error, prediction 1 1:NonFraud, 2:Fraud, +, 0.516 1:NonFraud, 1:NonFraud, , 1 1:NonFraud, 2:Fraud, +, 0.516 1:NonFraud, 1:NonFraud, , 1 1:NonFraud, 1:NonFraud, , 0.516 1:NonFraud, 1:NonFraud, , 0.967 +, 1:NonFraud, 2:Fraud, 1 +, 1:NonFraud, 2:Fraud, 1 +, 1:NonFraud, 2:Fraud,

66

Bảng 2.11: Kết quả dự báo dữ liệu đầu ra dựa trên mô hình cây quyết định (2 trang)

10, 11, 1:NonFraud, 2:Fraud, 2:Fraud, 2:Fraud, +, ,

1 0.75 Có 11 BCTC được đem ra để làm dự báo. Cột “predicted” là cột dự báo và ý

nghĩa của nó được hiểu: giá trị = “1” là BCTC không có gian lận, giá trị = “2” thì

BCTC có gian lận. “Prediction” có giá trị từ 0 đến 1, giá trị càng lớn thì độ tin cậy

của “predicted” càng cao, tức là “prediction” bằng 1 thì nếu được dự đoán “Gian

lận” thì chắc chắn 100% BCTC này là có gian lận.

Cột thực tế có thể được bỏ qua, chỉ đơn giản nói rằng dữ liệu này thuộc lớp nào

không rõ, hoặc có thể được đánh dấu bởi dấu “?”. Khi đó “Prediction” có giá trị từ 0

đến 1, giá trị càng lớn thì độ tin cậy của dữ liệu càng cao, dữ liệu đó có thể là trung

thực, ngược lại giá trị càng nhỏ thì độ tin cậy của dữ liệu không cao, BCTC này là

có gian lận.

Giá trị ở dòng 1 được hiểu: BCTC của các tỷ số tương ứng này được dự đoán là

có gian lận và có xác suất của dự đoán này là 1(100%)

Các giá trị tương ứng với dòng 1,3,7,8,9,10,11 là các BCTC có gian lận, cụ thể:

STT Tên công ty Năm BCTC Kết quả kiểm tra của mô hình cây quyết định

Mã công ty BLF 2011 Công ty cổ phần Thủy sản Bạc Liêu Có dấu hiệu gian lận

1 2 CDC 2011 Công ty cổ phần Chương Dương

FBT 3 Có dấu hiệu gian lận 2011

INC 4 2011

5 KSD 2011

6 SD3 Công ty cổ phần Xuất nhập khẩu lâm thủy sản Bến Tre Công ty Cổ phần Tư vấn Đầu tư IDICO Tổng công ty cổ phần Xuất khẩu Đông Nam Á Hamico 2011 Công ty Cổ phần Sông Đà 3

7 THV 2011 Có dấu hiệu gian lận Công ty cổ phần Tập đoàn Thái Hòa Việt Nam

8 VCF 9 DVD 2009 Công ty Cổ phần Dược Viễn Đông 10 DVD 2008 Công ty Cổ phần Dược Viễn Đông 2008 Công ty Cổ phần Bông Bạch Tuyết 11 BBT 2011 Công ty Cổ phần VinaCafé Biên Hòa Có dấu hiệu gian lận Có dấu hiệu gian lận Có dấu hiệu gian lận Có dấu hiệu gian lận

67

Áp dụng cho phân tích BCTC của Công ty Cổ phần Dược phẩm Viễn Đông

(DVD): Phân loại ngành của DVD thuộc lĩnh vực y tế. BCTC của công ty năm

2008, 2009 có NPTA lần lượt là 0,15 và 0,1 (lớn hơn 0,0088) nên xét tiếp tới chỉ số

INVSAL năm 2008, năm 2009 là 0,125 và 0,094 (bé hơn 0,1727), từ đó suy ra báo

cáo hai năm này của DVD đều có dấu hiệu gian lận.

Áp dụng cho phân tích BCTC của Công ty CP Bông Bạch Tuyết (BBT) năm

2008: Phân loại ngành của công ty thuộc lĩnh vực y tế, hàng tiêu dùng. BCTC của

công ty năm 2008 có NPTA là 0,18 (lớn hơn 0,0088) nên xét tiếp tới chỉ số

INVSAL năm 2008 là 0,048 (bé hơn 0,1727), CACL của BBT là 0,405 (bé hơn

1,0586), từ đó suy ra báo cáo năm này của BBT cũng có dấu hiệu gian lận.

Việc phân loại này đã chính xác trong các tình huống kiểm tra trên đây và trong

thực tế.

Như vậy thông qua các kết quả trên đây có thể kết luận rằng chỉ số tài chính rất

hữu ích trong việc phát hiện gian lận sai sót trong báo cáo tài chính. Tất nhiên khi

phân tích sử dụng dữ liệu tổng hợp là BCTC như trên đây thì kết quả phân tích chỉ

cung cấp những thông tin chung ban đầu về khả năng có thể xảy ra sai sót trọng

yếu, gian lận. Do đó, việc xem xét những thông tin khác đã thu thập được khi xác

định rủi ro có sai sót trọng yếu cùng với kết quả của thủ tục phân tích với dữ liệu

chi tiết hơn có thể giúp kiểm toán viên hiểu và đánh giá kết quả của thủ tục phân

tích.

Kết luận chương 2:

Chương 2 nêu ra các tình huống thực tế các phương pháp gian lận thường gặp trong

thực tế ở các doanh nghiệp niêm yết trên thị trường chứng khoán ở Việt Nam để tìm

hiểu về các tỷ số tài chính có khả năng bị ảnh hưởng, và khảo sát thực trạng sử dụng

chỉ số tài chính trong thủ tục phân tích của các công ty kiểm toán ở Việt Nam. Tiếp

theo đó là định lượng nghiên cứu để kiểm tra sự phù hợp của mô hình phát hiện

gian lận của thế giới đến Việt Nam, tác giả ứng dụng phần mềm Weka để khai phá

dữ liệu các Báo cáo tài chính của các công ty niêm yết trên thị trường trong năm

68

2010-2011, từ đó học phân loại báo cáo tài chính nghi ngờ có gian lận theo tập mẫu

đã huấn luyện. Từ đó nhận thấy mô hình khai phá dữ liệu đã hữu ích khi vận dụng

để phát hiện gian lận BCTC ở Việt Nam.

69

CHƯƠNG III: GIẢI PHÁP NÂNG CAO TÍNH HỮU ÍCH KHI VẬN DỤNG

TỶ SỐ TÀI CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BCTC:

3.1. Giải pháp nâng cao tính hữu ích khi vận dụng tỷ số tài chính để phát

hiện gian lận, sai sót trong BCTC:

3.1.1 Tăng cường, bổ sung công cụ cho các thủ tục kiểm toán tiêu chuẩn

truyền thống:

Kiểm toán phát hiện gian lận sử dụng thủ tục kiểm toán truyền thống là một

nhiệm vụ khó khăn hoặc đôi khi là không thể. Đầu tiên, kiểm toán viên thường thiếu

kiến thức yêu cầu về các đặc điểm của kế toán gian lận. Thứ hai, các thao tác gian

lận số liệu kế toán thường là không thường xuyên, và không có gian lận nào là

giống nhau, hầu hết các kiểm toán viên thiếu kinh nghiệm và chuyên môn cần thiết

để phát hiện và ngăn chặn các hành vi gian lận. Cuối cùng, mọi người quan tâm

khác của bộ phận tài chính như Giám đốc tài chính (CFO), quản lý tài chính và kế

toán cố tình tìm cách lừa dối kiểm toán nội bộ hoặc kiểm toán viên bên ngoài.

Những hạn chế của một cuộc kiểm toán như các doanh nghiệp không có bộ máy

kiểm soát nội bộ hoặc có nhưng không hoạt động hiệu quả, số lượng và trình độ

kiểm toán viên chưa tương xứng với nhu cầu, …

Khi biết những hạn chế của một cuộc kiểm toán, các chuyên gia đã kết luận rằng

các thủ tục kiểm toán tiêu chuẩn truyền thống không đủ để phát hiện gian lận.

Những hạn chế của kiểm toán tài chính cho thấy sự cần thiết của thủ tục phân tích

thêm dữ liệu tự động và các công cụ để phát hiện làm sai lệch báo cáo tài chính có

hiệu lực.

Qua các vấn đề được trình bày trong chương 1 và mô hình ứng dụng trong

chương 2, chúng ta nhận thấy với một lượng mẫu dữ liệu thực tế nhỏ và với mục

đích bài toán cụ thể nhưng ta có thể tiếp cận theo nhiều hướng khác nhau của cùng

một phương pháp khai phá dữ liệu và đạt được kết quả, điều đó càng làm sáng tỏ

khả năng ứng dụng thực tế to lớn đồng thời với những thách thức đối với kỹ thuật

phát hiện tri thức và khai phá dữ liệu trong việc kiểm toán BCTC.

70

Kỹ thuật khai thác dữ liệu khi kết hợp với kỹ thuật kiểm toán truyền thống như

quan sát và xác nhận thì kết quả kiểm toán sẽ mạnh mẽ nhất, hiệu quả nhất. Các kỹ

thuật khai thác dữ liệu có khả năng để giải quyết mâu thuẫn giữa hiệu lực và hiệu

quả của phát hiện gian lận. Kỹ thuật phân tích dữ liệu, khi kết hợp với các kỹ thuật

hướng dẫn sử dụng, tạo ra các mô hình kiểm toán hiệu quả nhất và hiệu quả để phục

hồi chi phí, phát hiện sai sót, và phát hiện ra các triệu chứng của sự gian lận trong

các lĩnh vực tài chính và hoạt động.

3.1.2 Sử dụng hiệu quả nguồn cơ sở dữ liệu ngày càng nhiều để cạnh tranh:

Kể từ 1/6/2012, Thông tư số 52/2012/TT-BTC hướng dẫn về việc công bố thông

tin trên TTCK chính thức có hiệu lực. Điểm đáng chú ý trong Thông tư này là việc

đưa công ty đại chúng quy mô lớn vào diện bắt buộc công bố thông tin giống DN

niêm yết. Ủy ban Chứng khoán Nhà nước (UBCK) cho biết, số lượng công ty đủ

điều kiện là công ty đại chúng đã đăng ký với UBCK được cập nhật đến ngày

25/5/2012 là 986 công ty. Trong số này, có 194 công ty có quy mô vốn điều lệ từ

120 tỷ đồng trở lên. Theo đánh giá của Sở Giao dịch chứng khoán TP. HCM

(HOSE), số doanh nghiệp nộp đúng hạn báo cáo tài chính (BCTC) đã tăng lên đáng

kể sau 2 quý thực hiện quy định mới theo thông tư này - báo Đầu tư chứng khoán đã

trao đổi với bà Phan Thị Tường Tâm, Tổng giám đốc HOSE về vấn đề này.

Những cải thiện liên tục của Sở giao dịch chứng khoán trong hạ tầng công nghệ

thông tin là một bước tiến, là nền tảng cho sự minh bạch hóa thông tin của các

DNNY, cùng với các quy định về công khai, minh bạch BCTC ngày càng được

hoàn thiện và được kiểm tra gắt gao thì việc sử dụng kho cơ sở dữ liệu này như thế

nào để mang lại hiệu quả nhất là điều cần phải được đặt ra. Các công trình nghiên

cứu trên thế giới cũng cho thấy việc phân tích dự báo BCTC gian lận thật sự hiệu

quả khi sử dụng thông tin công bố công khai, nhất là nếu có thêm dữ liệu của kiểm

toán viên. Có cả hai loại dữ liệu sẽ cung cấp một mô hình dự báo hiệu quả hơn.

Theo các quy định mới và các tiêu chuẩn báo cáo nghiêm ngặt hơn, kiểm toán

viên nội bộ và kiểm toán độc lập phải đảm bảo nhiều hơn trong khi vẫn gặp khó

khăn về kinh tế và thời gian. Mối quan tâm của kiểm toán viên là báo cáo tài chính

71

của một công ty được ghi công bằng trong tất cả các khía cạnh trọng yếu. Nhà quản

lý và các bên liên quan được tăng cường vai trò của kiểm toán viên trong việc ngăn

chặn và phát hiện gian lận. Bởi vì kiểm toán viên không thể đánh giá tất cả các giao

dịch của một công ty, họ cần cân nhắc phân tích chi phí-lợi ích và quyết định đánh

giá rủi ro.

Ngày nay để cạnh tranh kiểm toán viên phải tự trang bị cho mình với các công cụ

mà sẽ cho phép họ đáp ứng các tiêu chuẩn mới. Thảo luận ở trên cũng là cho xem

hiệu suất hiện tại của kiểm toán viên trong phát hiện gian lận cũng như làm nổi bật

của vai trò của họ trong ngăn chặn và phát hiện gian lận.

Để có nguồn thông tin phục vụ cho phân tích, cần sử dụng thêm số liệu của

ngành thống kê. Hiện nay các doanh nghiệp vẫn phải báo cáo tình hình kinh doanh

theo từng kỳ cho Tổng cục thống kê, nhưng nguồn thông tin này xem ra chưa được

sử dụng triệt để. Trong thời gian tới ngành thống kê nên xem xét thay đổi, bổ sung

việc phân loại ngành nghề cho phù hợp với hoàn cảnh hiện tại; các báo cáo cần

được thông tin, liên kết với các ban ngành để tổng hợp thông tin theo nhiều chiều

linh hoạt nhằm phục vụ tốt hơn cho quá trình ra các quyết định kinh tế trên tầm vĩ

mô nói chung và hỗ trợ công tác kiểm toán, thanh tra nói riêng.

Bên cạnh đó, bản thân các công ty kiểm toán có thể tổ chức lưu trữ thông tin của

khách hàng một cách khoa học tạo ra nguồn số liệu tham khảo bổ ích.

Một trong những kỹ năng của một kiểm toán viên được đào tạo và có trình độ, là

khả năng xác định các thông tin có liên quan và chọn lọc thông qua tất cả các dữ

liệu được trình bày trong quá trình kiểm toán và từ chối những gì không cần thiết

hoặc không liên quan. Kỹ thuật khai thác dữ liệu đang cung cấp trợ giúp lớn trong

việc phát hiện gian lận kế toán tài chính, kể từ khi đối phó với khối lượng dữ liệu

lớn và phức tạp của dữ liệu tài chính là những thách thức lớn đối với kiểm toán. Các

kết quả của chương trình này xem xét rằng các kỹ thuật khai thác dữ liệu như mô

hình logistic, mạng nơron, mạng niềm tin Bayesian, và cây quyết định đã được áp

dụng rộng rãi nhất để cung cấp các giải pháp chính cho các vấn đề cố hữu trong

việc phát hiện và phân loại dữ liệu gian lận. Công cụ khai thác dữ liệu được sử dụng

72

hiệu quả để tìm kiếm bằng chứng gian lận thông qua các tập tin dữ liệu kế toán kết

hợp với các kiến thức về phương pháp gian lận (Phần 1.2.1), kiến thức về những

cảnh báo gian lận, dấu hiệu bất thường và phần mềm công cụ khai phá dữ liệu hoặc

phần mềm kiểm toán gian lận.

3.1.3 Ứng dụng khoa học công nghệ, nâng cao trình độ kiểm toán viên:

Khai phá dữ liệu đang ngày càng trở nên phổ biến trong các ứng dụng kinh

doanh trong thế giới thực và trong một số trường hợp, chẳng hạn như phát hiện gian

lận, trong đánh giá rủi ro và kiểm soát nội bộ, cũng như để hình dung cơ sở dữ liệu

phức tạp để phân đoạn thị trường. Sự bùng nổ trong các ứng dụng bao gồm một loạt

các lợi ích kinh doanh từ quản lý tài chính, dự báo, sản xuất. Sự kết hợp của phương

pháp thống kê, mạng thần kinh cho phép trực tiếp nghiên cứu định lượng được thực

hiện mà không cần một chuyên gia. Tuy nhiên, tiềm năng to lớn của khai phá dữ

liệu trong kinh doanh và kế toán vẫn chưa được thực hiện. Trong kinh nghiệm của các tác giả Cerullo11, tất cả các phương pháp phân tích dữ liệu được sử dụng để dự

đoán hoặc phát hiện gian lận, bao gồm cả phần mềm kiểm toán nói chung, phần

mềm thống kê, phân tích tỷ lệ, bảng tính, gói phần mềm quan hệ cơ sở dữ liệu, phần

mềm phân tích báo cáo tài chính và luật Benford, mô hình mạng thần kinh (NN) là

các phương pháp ít nhất thường được sử dụng. Ví dụ, trong một nghiên cứu của tác

giả Cerullo, khoảng 7% của kiểm toán viên nội bộ đáp ứng một cuộc khảo sát được

sử dụng NN so với hơn 45% người sử dụng phần mềm kiểm toán chung. Ngoài ra,

thậm chí còn gây sốc hơn, một bài báo năm 2004 cho thấy 400 kiểm toán viên trả

lời cuộc khảo sát phần mềm hàng năm của IIA, không sử dụng phần mềm NN. Khai

phá dữ liệu là một công cụ thường bị bỏ qua nhưng rất mạnh mẽ và dễ sử dụng

trong việc phát hiện gian lận quản lý.

Các công cụ hỗ trợ đang ngày càng trở nên thích nghi và hiệu quả, do đó, sử

dụng của chúng dự kiến sẽ trở nên phổ biến hơn và phổ biến rộng rãi trong thời gian

tới. Sử dụng các công cụ phần mềm mạnh mẽ, có thể giúp bạn trau dồi thêm các xu

hướng và các trường hợp ngoại lệ trong báo cáo tài chính hoặc các quá trình khác. 11 Cerullo, Michael J.; M. Virginia Cerullo; Tracy Hardin, “Computer Techniques Used to Audit the Purchasing Function,” Internal Auditing, March/April 1999, p. 24.

73

Bạn sẽ được chuẩn bị để định lượng chuyên nghiệp quá trình rủi ro, phục hồi tiền

mặt, tiết kiệm chi phí, và cải tiến một cách có giá trị cho các quy trình khác nhau.

Công nghệ khai phá dữ liệu trang bị cho kiểm toán viên với chuyên môn mà trước

đây chỉ có thể đạt được với nhiều năm đào tạo và kinh nghiệm. Kiểm toán viên

thường thấy rằng gian lận báo cáo tài chính là rất khó phát hiện bởi vì nó có thể che

giấu hoặc làm sai lệch tài liệu kế toán và các tài liệu hỗ trợ. Do đó, đây là một chiến

lược có thể cho kiểm toán viên chủ động đánh giá khả năng gian lận xảy ra các hành

vi gian lận như vậy. Khả năng đánh giá chính xác nguy cơ gian lận là rất quan trọng

để đánh giá ban đầu của nguy cơ sai sót trọng yếu trong giai đoạn lập kế hoạch ban

đầu của cuộc kiểm toán. Việc đánh giá rủi ro sẽ ảnh hưởng đến thiết kế của các kỹ

thuật kiểm tra kiểm toán tiếp theo.

Mặc dù sự tích hợp giữa kỹ thuật khai thác dữ liệu và quy trình kiểm toán là một

lĩnh vực tương đối mới, khai thác dữ liệu được coi là hữu ích và giúp làm giảm áp

lực chi phí trong nhiều ứng dụng kinh doanh liên quan đến kiểm tra. Vì vậy, luận

văn này nhằm mục đích để khám phá những khả năng của sự tích hợp giữa khai

thác dữ liệu và quy trình kiểm toán thực tế tham gia.

Do các dữ liệu và hạn chế khác, nghiên cứu này không thể được thực hiện rộng

rãi. Tuy nhiên, từ kết quả của nghiên cứu này cho thấy rằng kỹ thuật khai thác dữ

liệu có thể có thể đóng góp một cái gì đó để nghề này ngay cả khi các dữ liệu không

phải là đầy đủ và tất cả những phân tích dựa trên các giả định. Nhưng điều này cũng

không chứng minh rằng khai thác dữ liệu là phù hợp cho tất cả các công việc kiểm

toán. Nó đòi hỏi một nỗ lực đáng kể để tìm hiểu làm thế nào để sử dụng các kỹ

thuật khai thác dữ liệu và để hiểu được ý nghĩa của các kết quả. Tuy nhiên, nếu các

công ty kiểm toán có số lượng lớn các dữ liệu được kiểm toán và kiểm toán viên đã

quen thuộc với bản chất của giao dịch và các mẫu lỗi dự kiến, sau đó khai thác dữ

liệu này cung cấp một phương tiện hiệu quả bề mặt các vấn đề thú vị. Vẫn còn một

chặng đường dài từ sở hữu "trí tuệ nhân tạo" hoàn toàn tự động kiểm tra kiểm toán

cho các kiểm toán viên. Và việc đánh giá các yếu tố nguy cơ gian lận bao gồm các

74

biến gian lận cũng phải được liên tục kiểm tra để phản ánh rõ ràng các chỉ số "báo

động đỏ".

Kiểm toán viên không có đủ thời gian để thực hiện các thuật toán trong kiểm

toán điển hình. Ngoài kỹ thuật, họ cần được đào tạo về lập trình máy tính, ngôn ngữ

truy vấn, và thống kê. Người ta thường nói rằng việc chuẩn bị dữ liệu là khó khăn

hơn so với các phân tích của nó. Nghiên cứu các công cụ tốt nhất, kỹ thuật, và các

phương pháp cần thiết để kiểm toán viên có thể sử dụng cho việc chuẩn bị dữ liệu

để phân tích từ nguồn cơ sở dữ liệu kinh doanh.

3.1.4 Khai phá dữ liệu hỗ trợ thêm cho dịch vụ, ngành nghề mới:

Khai phá dữ liệu hỗ trợ hơn bao giờ hết việc giám sát liên tục nâng cao và các

chương trình kiểm toán liên tục, mở rộng khả năng kiểm toán điều tra và phục hồi,

và dữ liệu phân tích tinh vi hơn và các công cụ kinh doanh thông minh.

SAS No.99 cũng mở rộng để xem xét trách nhiệm của kiểm toán viên có liên

quan đến gian lận. Các vai trò bao gồm chứng kiến thực tế, nhân chứng chuyên

môn, chuyên gia định giá, hỗ trợ kiện tụng doanh nghiệp nhỏ và vừa, tư vấn, và vai

trò liên quan đến gian lận khác. Do đó, kiểm toán viên có thể cung cấp một dịch vụ

có giá trị cho các nạn nhân của gian lận và khách hàng của họ nói chung bằng cách

thực hiện trách nhiệm của mình và bằng cách cung cấp các dịch vụ gian lận liên

quan đến công chúng.

Cải thiện trong các mô hình phát hiện gian lận có thể hữu ích cho kiểm toán viên

trong quá trình lựa chọn của khách hàng, lập kế hoạch kiểm toán, và các thủ tục

phân tích.

Đôi khi các bằng chứng tốt nhất là kỹ thuật số điều tra hoặc ẩn trong công nghệ

như là công cụ khai phá dữ liệu và các chuyên gia cần tạo thẩm quyền để tuyên bố gian lận có hoặc không xảy ra.12

Trên thế giới, nghề kế toán điều tra khá phát triển, ACFE đề cập đến kế toán điều

tra như là kiểm tra gian lận, làm thế nào để cung cấp lời khai chuyên gia tại toà án.

12 Tommie W. Singleton & Aaron J. Singleton. (2010). Fraud Auditing and Forensic Accounting.

Với sự tăng đột ngột trong gian lận kế toán tài chính tại thời điểm kinh tế hiện nay,

75

kinh nghiệm, kế toán tài chính phát hiện gian lận (FAFD) đã trở thành một chủ đề

mới nổi quan trọng đối với nghiên cứu, học tập và các ngành công nghiệp. Sự thất

bại của hệ thống kiểm toán nội bộ doanh nghiệp trong việc xác định gian lận kế toán

đã dẫn đến việc sử dụng các thủ tục chuyên dụng để phát hiện gian lận kế toán tài chính, tập hợp này được gọi là kế toán điều tra.13 Kế toán điều tra đóng một vai trò

quan trọng trong việc phát hiện những gian lận mà khó để tìm ra trong kiểm toán

nội bộ bằng cách sử dụng kế toán, kiểm toán, và các kỹ năng điều tra.

Mặc dù tương đối mới trong nghề kế toán, trên thế giới, vai trò của một chuyên

gia kế toán điều tra (Forensic accounting) đã tồn tại một thời gian trong các ngành

nghề khác từ rất lâu đời. Ở Ai Cập cổ đại, kế toán điều tra được gọi là "mắt và tai"

của nhà vua. Kế toán điều tra là hoạt động xác định, giải quyết, phân loại, báo cáo,

và xác minh dữ liệu quá khứ hoặc các hoạt động kế toán tài chính khác, bằng chứng

cho sự phù hợp với mục đích của việc thiết lập trách nhiệm giải trình và / hoặc xác

nhận hoạt động của công ty. Đây là nghề kế toán để điều tra, ngăn chặn gian lận và

phân tích kiểm sát chống gian và là bằng chứng chuyên môn cho các vấn đề pháp

lý, hỗ trợ cho tòa án. Kế toán điều tra là một nghiên cứu khác cho các trường hợp

ngoại lệ, kỳ quặc, bất thường, các mô hình, và các giao dịch đáng ngờ. Không có

quy trình chuẩn, danh sách kiểm tra và kiểm soát trong kế toán điều tra để khám phá

những gian lận, vì mỗi loại gian lận là duy nhất cho tình hình cụ thể. Kế toán điều

tra đóng một vai trò quan trọng trong việc phát hiện các gian lận nếu không tìm thấy

bằng cách sử dụng kiểm toán nội bộ, kế toán, kiểm toán, và các kỹ năng điều tra.

Nó khác với kiểm toán thường xuyên. Kiểm toán tập trung vào một mẫu giao

dịch, kiểm tra xem liệu rằng thông tin công bố trên báo cáo tài chính có bất kỳ sai

sót, lỗi hoặc xác định các thổi phồng. Mục tiêu cơ bản của kiểm toán không phải là

để phát hiện các giao dịch gian lận. Kiểm toán gian lận tìm kiếm bằng chứng gian

lận, mục đích là để chứng minh hoặc bác bỏ sự tồn tại của một gian lận. Trong lịch

sử, kế toán điều tra chỉ xét tới sau khi bằng chứng hoặc nghi ngờ gian lận đã nổi lên

thông qua một lời cáo buộc, khiếu nại, hoặc phát hiện. Trong những năm gần đây, 13 Anuj Sharma - 2012 - A Review of Financial Accounting Fraud Detection based on Data Mining Techniques

76

với sự mở rộng của các điều khoản trong nghề chống gian lận kế toán điều tra, kiểm toán gian lận trở thành là một tập hợp con của kế toán điều tra14.

Kinh nghiệm về các loại cam kết cho phép các kế toán điều tra để cung cấp đề

xuất như hệ thống kiểm soát nội bộ mà chủ sở hữu có thể thực hiện để làm giảm khả

năng gian lận.

Để phát hiện ra gian lận báo cáo tài chính, kế toán điều tra thường phân tích các

báo cáo tài chính bằng cách sử dụng phân tích tỷ lệ và khai thác dữ liệu kỹ thuật,

một thủ tục được sử dụng để xác định khả năng rằng dữ liệu đã được thay đổi. Thực

hiện các thủ tục khác bao gồm kiểm tra các tài liệu, hồ sơ và tiến hành các cuộc

phỏng vấn với những người có kiến thức về bất kỳ gian lận xảy ra. Nó cũng bao

gồm thu thập thông tin phi tài chính, chẳng hạn như các cuộc phỏng vấn của tất cả

các bên liên quan đến gian lận, khi áp dụng. Phục vụ như là một nhân chứng chuyên

môn và hỗ trợ pháp lý là một phần của kế toán điều tra.

Trên thế giới, đã có nhiều nghiên cứu sử dụng chỉ số tài chính và khai phá dữ liệu

để phục vụ cho việc phát hiện gian lận báo cáo tài chính phục vụ cho kiểm toán gian

lận và kế toán điều tra.

Tuy nhiên, mục tiêu của luận văn này chỉ gói gọn trong việc khai phá dữ liệu

bằng các chỉ số tài chính dựa trên BCTC được công bố rộng rãi để phát hiện gian

lận trên BCTC, mà không đi sâu vào dữ liệu kiểm toán báo cáo chi tiết hay kế toán

điều tra.

3.1.5 Nghiên cứu về khả năng dự báo gian lận:

Sau khi tuyên bố công ty là vi phạm gian lận tài chính thì thường công ty đó cần

thiết được tiếp tục theo dõi thêm thời gian. Chu kỳ gian lận này thường dẫn người quản lý thực hiện các hành động tương tự vào năm sau.15 Và cần phải học hỏi từ

gian lận của trường hợp gần đây để chủ động chỉnh sửa lại mô hình và không thể

giả định rằng việc phân tích được sử dụng trong quá khứ sẽ đủ trong tương lai.

Khai thác dữ liệu như là một công cụ phân tích có thể giúp kiểm toán viên trong

công tác phòng chống và phát hiện các hành vi gian lận báo cáo tài chính. Chỉ số tài 14 Tommie W. Singleton & Aaron J. Singleton. (2010). Fraud Auditing and Forensic Accounting 15 Financial statement fraud, Part 1 By EVERETT E. COLBY, BSBA, CFE, FCGA

77

chính liên quan đến lợi nhuận, tính thanh khoản, an toàn và hiệu quả cùng với hành

vi đặc điểm như tuổi tác của công ty, kích thước của công ty trên cơ sở doanh thu và

tài sản để phòng ngừa và phát hiện các hành vi gian lận báo cáo tài chính.

Tuy nhiên cần lưu ý, khai thác dữ liệu nên được thực hiện ở giai đoạn đầu của

cuộc kiểm toán hoặc cuộc điều tra để xác định:

• Những dữ liệu có liên quan có thể có sẵn?

• Những kỹ năng có sẵn trong mô hình?

• Làm thế nào để phân tích dữ liệu sẽ phù hợp với việc điều tra rộng lớn hơn?

Mô hình phát hiện gian lận này cũng có thể nghiên cứu thêm để ứng dụng phát

triển mô hình dự báo phá sản hay làm thế nào để dự báo gian lận trước khi nó xảy

ra.

Gian lận báo cáo tài chính xảy ra cho số lý do, có thể được giải thích bởi ba biến:

điều kiện, cơ cấu vốn và sự lựa chọn. Sự gian lận báo cáo tài chính có thể được

ngăn ngừa bằng cách đảm bảo rằng ba biến này không có mặt trong tổ chức.

Nếu gian lận xảy ra theo chu kỳ, sau đó kế toán có thể dự đoán gian lận thông

qua phân tích tài chính, kinh tế, và hoàn cảnh chính trị hoặc môi trường trong đó

một gian lận đặc biệt có khả năng xảy ra. Thách thức đối với các nhà nghiên cứu và

kiểm toán viên sẽ là phát triển các chương trình và nghiên cứu để giúp quyết định

làm thế nào có thể dự đoán các hành vi gian lận cụ thể trước khi nó xảy ra.

3.1.6 Quản trị công ty:

Trước hết chúng ta xem xét việc quản trị công ty cổ phần ở nhiều quốc gia, ở

Việt Nam, dựa trên ba nguyên tắc sau:

Thứ nhất, sử dụng các thành viên Hội đồng Quản trị (HĐQT) độc lập

(independent directors) để kiềm chế quyền lực của ban giám đốc, đồng thời bảo vệ

quyền lợi của các cổ đông.

Thứ hai, sử dụng và tín nhiệm giới kế toán để trình báo cáo tài chính có tính xác

thực nhằm giúp cổ đông có thông tin đầy đủ khi đầu tư vào công ty.

Thứ ba, sử dụng và tín nhiệm các nhà phân tích tài chính để xem xét, phân tích

các triển vọng kinh doanh và mức độ lành mạnh về tài chính của các công ty đang

78

và sẽ phát hành chứng khoán ra công chúng nhằm cung cấp đầy đủ thông tin cho

công chúng muốn đầu tư.

Yêu cầu của một bộ máy quản lý tốt là:

+ Môi trường kiểm soát đủ để đánh giá thái độ, nhận thức và hành động của các

giám đốc và quản lý về kiểm soát nội bộ và tầm quan trọng trong công ty.

+ Đánh giá rủi ro của ban quản lý rằng gian lận có thể gây ra một số dư tài khoản

đáng kể chứa một sai sót trọng yếu, quản lý hệ thống kế toán và kiểm toán nội bộ đã

đặt nó và rủi ro như vậy.

+ Hiểu biết của ban quản lý về hệ thống kế toán và kiểm soát nội bộ trong việc

ngăn ngừa và phát hiện gian lận.

Đối với doanh nghiệp: cần tăng cường và hoàn thiện công tác quản trị công ty để

đảm bảo một bộ máy quản lý làm việc có hiệu quả, có trách nhiệm, có đạo đức và

có khả năng giải quyết các vấn đề trên bình diện quốc gia và quốc tế. Nâng cao chất

lượng của các báo cáo tài chính. Quản trị doanh nghiệp có thể giảm thiểu gian lận

báo cáo tài chính thông qua quá trình giám sát của tổ chức. Các hệ thống kiểm soát

nội bộ của một tổ chức phải được đánh giá và tiết lộ bất cứ điểm yếu nào. Hệ thống

kế toán quản trị cũng cần phải được hội đồng quản trị đề cao và xây dựng tốt, mặc

dù không phải là bắt buộc theo yêu cầu của nhà nước, nhưng hệ thống này gắn liền

và có ảnh hưởng lớn đến báo cáo tài chính, ảnh hưởng đến hiệu quả của kiểm toán

viên và cũng là một cách để phòng chống gian lận hữu hiệu.

3.1.7 Quản lý chất lượng dịch vụ kiểm toán:

Để chống lại sự thông đồng của công ty kiểm toán và doanh nghiệp niêm yết,

làm đẹp bản BCTC để qua mặt nhà đầu tư, làm mất lòng tin của mặt nhà đầu tư với

thị trường chứng khoán. Kiểm soát chất lượng có tầm quan trọng đặc biệt và là một

bộ phận không thể tách rời trong quá trình kiểm toán. Để đạt được ý kiến có chất

lượng, chúng ta phải đặt ra tiêu chuẩn cho toàn bộ quá trình kiểm toán và thường

xuyên xem xét để đảm bảo rằng chất lượng đề ra đó được duy trì và ngày càng được

nâng cao hơn. Đó chính là quản lý chất lượng hay kiểm soát chất lượng.

79

Tại Hoa Kỳ, giám sát chất lượng kiểm toán là việc quan trọng liên quan đến sự

phát triển của chuẩn mực kiểm toán do AICPA ban hành. Đạo luật Sarbanes Oxley

quy định việc thành lập Ủy ban Giám sát hoạt động kiểm toán các công ty đại chúng

(Public Company Accounting Oversight Board – PCAOB) để thực hiện việc giám

sát chất lượng này.

Vào ngày 15/05/2007, Bộ Tài chính đã ban hành Quyết định 32/2007/QĐ-BTC

về Quy chế kiểm soát chất lượng dịch vụ kế toán, kiểm toán. VACPA đã đảm

nhiệm việc kiểm soát chất lượng dịch vụ kiểm toán thường niên từ năm 2009 đến

nay. Quy chế này dù có những ưu điểm đáng kể, tuy nhiên vẫn còn những bất cập

làm cho việc kiểm soát chất lượng không phát huy tác dụng đầy đủ. Vì kiểm soát

chất lượng hoạt động kiểm toán là một vấn đề phức tạp, cần có sự tham gia của

nhiều tổ chức. Việc kiểm soát chất lượng luôn là mối quan tâm hàng đầu không chỉ

của các công ty kiểm toán mà của cả Nhà nước, Ủy ban Chứng khoán.

Sẽ là không đúng khi cho rằng “kiểm tra” là cốt lõi của công tác quản lý chất

lượng. Trên thực tế, sẽ là hiệu quả hơn nếu công ty kiểm toán và kiểm toán viên tự

đề ra các cam kết tiêu chuẩn chất lượng để thực hiện và tự quản lý chất lượng.

3.2. Hiệu đính, bổ sung và hướng dẫn chi tiết các chuẩn mực kiểm toán:

3.2.1 Nâng cao trách nhiệm của kiểm toán viên:

Việc phát hiện gian lận trong BCTC dù khó nhưng cùng với các hướng dẫn, công

cụ cần thiết thì đó không phải là vấn đề không thể. Tất nhiên, khi các doanh nghiệp

đã có ý đồ “chế biến” số liệu tài chính và hợp thức hóa các chứng từ kế toán, thì

những gian lận tại doanh nghiệp thường khó phát hiện, nó trở thành rủi ro cho kiểm

toán viên cũng như các công ty kiểm toán. Tuy nhiên vấn đề cần nói đến ở đây là

kiểm toán viên có làm đúng trách nhiệm của mình không? Nhiều kiểm toán viên vì

những lý do khác nhau, từng vô tình hoặc cố tình cho qua những điểm nghi vấn

trong báo cáo tài chính (BCTC) của doanh nghiệp. Chính điều này đã khiến tình

trạng bê bét về tài chính tại nhiều doanh nghiệp được giấu kỹ, cho đến khi có nhân

tố mới xuất hiện. Do đó mấu chốt là cần phải nâng cao trách nhiệm kiểm toán viên

đối với gian lận và sai sót trong cuộc kiểm toán Báo cáo tài chính.

80

Trong chuẩn mực VAS 200 và VAS 240 cần phân định rõ trách nhiệm của kiểm

toán viên và Ban giám đốc công ty trong từng trường hợp cụ thể.

Ðể có thể xác định trách nhiệm pháp lý của KTV và công ty kiểm toán đối với

các bên thứ ba như các nhà đầu tư, chủ nợ, trong thời gian tới sẽ cần có những quy

định cụ thể hơn trong các văn bản luật và các văn bản hướng dẫn của các cơ quan

quản lý. Về việc hành nghề của kiểm toán viên bắt buộc phải hành nghề trong một

doanh nghiệp kiểm toán. Việt Nam nên hướng đến quy định cho phép kiểm toán

viên hành nghề cá nhân cho phù hợp với thông lệ các nước trên thế giới. Cần Luật

hóa thêm nhiều điều của Chuẩn mực đạo đức nghề nghiệp để các doanh nghiệp

kiểm toán và kiểm toán viên bắt buộc phải tuân thủ.

Do sự nhẹ tay trong việc phạt các sai phạm nên việc gian lận báo cáo tài chính

ngày càng nhiều hơn, và người sử dụng BCTC (nhà đầu tư, ngân hàng,…) không có

đầy đủ chứng cứ để kiện nếu có bị thiệt hại vì sử dụng BCTC gian lận mà chưa bị

phát hiện do không có sự can thiệp, kiểm tra bởi các cơ quan chức năng hay kiểm

toán vào cuối năm.

Một số vụ việc liên quan đến kiểm toán tại Việt Nam:

∙ Vụ Công ty cho thuê tài chính II (Agribank) lỗ 3.000 tỉ đồng vào ngày

16/4/2011. Nguyên tổng giám đốc Công ty Cho thuê tài chính II (ALCII) cùng một

số cá nhân liên quan bị khởi tố. Tại kết luận kiểm toán Agribank, Kiểm toán Nhà

nước chỉ ra nhiều sai phạm liên quan đến ALCII. Năm 2009, ALCII kinh doanh

thua lỗ 3.000 tỉ đồng và có khả năng lỗ tiềmẩn đối với khoản tiền đầu tư tài sản cho

thuê trị giá gần 4.600 tỉ đồng.

∙ VụCTCP Dược phẩm Viễn Đông tuyên bố phá sản liên quan đến công ty kiểm

toán Ernst & Young (E&Y) hồi đầu tháng 10 vừa qua. Vụ việc đang quy lỗi cho

công ty kiểm toán Ernst & Young

∙ Vụ việc công ty KTĐL kiểm toán Công ty bông Bạch Tuyết năm 2008. Năm

trước nói lãi, ngay năm sau đã nói lỗ nặng, đứng trên bờ vực phá sản. Điều này đã

làm xôn xao về chất lượng kiểm toán.

81

∙ Vụ thua lỗ của Tập đoàn Vinasin, mặc dù được kiểm toán độc lập liên tục từ

năm 2007-2009 nhưng Vinashin thua lỗ, nợ nần đến khi không thể thanh toán người

ta mới biết.

Tuy nhiên cũng như đã nói ở trên, về chế tài xử phạt, hiện chỉ có Nghị định

105/2004/NĐ-CP về kiểm toán độc lập có quy định chế tài đối với công ty kiểm

toán nếu thông đồng, móc nối với đơn vị được kiểm toán để làm sai lệch BCTC

kiểm toán. Tuy nhiên, như thế nào là thông đồng, làm thế nào để chứng minh sự

thông đồng này và xử phạt như thế nào thì lại chưa được quy định chi tiết. Vì thế,

xử phạt công ty kiểm toán vi phạm sẽ rất khó. Do đó cần ban hành các văn bản, luật

để quy định hình thức xử phạt rõ ràng và nghiêm minh đối với vi phạm trong lĩnh

vực kiểm toán.

Ở Việt Nam hiện nay đã có 156 công ty kiểm toán độc lập (T10/2012), với đủ

mọi hình thức gồm công ty TNHH, công ty hợp danh, công ty có vốn đầu tư nước

ngoài, và công ty hãng thành viên quốc tế. Những số liệu từ các hội thảo về kiểm

toán gần đây cho thấy một thực trạng: số lượng công ty kiểm toán khá nhiều nhưng

chất lượng hoạt động đang có nhiều điểm đáng lo ngại. Những công ty mới hoạt

động chỉ có 3-4 kiểm toán viên, nên thường chú trọng vào công tác phát triển khách

hàng, khai thác hợp đồng mà chưa quan tâm đúng mức đến chất lượng hồ sơ và báo

cáo kiểm toán. Bộ tài chính và hội nghề nghiệp nên làm cầu nối cho các công ty

kiểm toán nhỏ sáp nhập với các công ty kiểm toán lớn để tạo ra những lợi ích cho cả

hai và cho cả hệ thống kiểm toán của Việt Nam.

3.2.2 Ban hành hướng dẫn chi tiết về thủ tục phân tích:

Chuẩn mực kiểm toán quốc tế mới được ban hành từ dự án "Clarity Project" do

ủy ban chuẩn mực kiểm toán quốc tế (IAASB) đảm nhiệm bắt đầu từ 2004, được

hoàn thành từ năm 2009. Dự án này viết lại 20 chuẩn mực, 15 chuẩn mực được sửa

đổi và đưa ra 2 chuẩn mực mới (IAS 265 và IAS 450). Mục tiêu của dự án là nhằm

cải thiện thực hành kiểm toán trong nhiều khía cạnh để phục vụ lợi ích công chúng,

làm cho các chuẩn mực dễ hiểu, rõ ràng, và có thể áp dụng nhất quán. AICPA đã

phát triển Báo cáo rủi ro kiểm toán, hiểu biết về các Chuẩn mực kiểm toán trong

82

Clarity Project, nhằm thông báo cho kiểm toán viên các thay đổi và các tiêu chuẩn

sẽ có phần thực hành và phương pháp kiểm toán, bao gồm cả những thay đổi mà có

thể ảnh hưởng đến báo cáo kiểm toán, kèm theo để làm rõ tiêu chuẩn.

Theo nghiên cứu của nhóm cố vấn cho IAASB, các yêu cầu của chuẩn mực tăng

lên khoảng 60%, và gần 30% các tuyên bố trước kia để mở thì nay trở thành các yêu

cầu bắt buộc. Còn theo một nghiên cứu của Ủy ban Thực hành Kiểm toán của UK

và Ireland đối với các công ty kiểm toán, việc áp dụng hệ thống chuẩn mực mới sẽ

làm gia tăng thời gian và chi phí cho một cuộc kiểm toán. Cụ thể là chi phí kiểm

toán tăng trung bình 9,6% đối với khách hàng nhỏ và vừa, 1,9% đối với các khách

hàng lớn, chi phí kiểm toán năm đầu tiên tăng 13,9% đối với khách hàng nhỏ và

vừa, 5% với khách hàng lớn. Ảnh hưởng cụ thể lên các công ty kiểm toán khác nhau

cũng sẽ khác nhau, phụ thuộc vào qui trình kiểm toán mà các công ty đã thực hiện

trước đó như thế nào. Đối với những công ty kiểm toán nhỏ, chưa thực hiện đầy đủ

các chuẩn mực kiểm toán, kiểm soát chất lượng, thì sự thay đổi sẽ rất đáng kể vì

công ty kiểm toán sẽ phải cập nhật phương pháp kiểm toán phù hợp với chuẩn mực

mới.

Chuẩn mực kiểm toán của Việt Nam được biên soạn trên chuẩn mực kiểm toán

quốc tế từ trước năm 2005, do đó phải cập nhật và áp dụng với thực tế thay đổi của

thị trường Việt Nam để ban hành các chuẩn mực mới và hoàn thiện chuẩn mực

kiểm toán hiện hành. Bộ trưởng Bộ Tài chính cũng đã uỷ quyền cho Hội kiểm toán

viên hành nghề Việt Nam (VACPA) thực hiện nghiên cứu, soạn thảo, cập nhật Hệ

thống chuẩn mực kiểm toán Việt Nam phù hợp với chuẩn mực kiểm toán Quốc tế

hiện hành. Ban nghiên cứu của VACPA đã thực hiện thảo luận và biên soạn chuẩn

mực kiểm toán mới từ năm 2009 đến nay, đang trình Hội đồng thẩm định của Bộ tài

chính và dự kiến ban hành 20 chuẩn mực kiểm toán mới đợt 1, và 17 chuẩn mực

kiểm toán mới đợt 2, dự kiến ban hành vào cuối năm 2012 và có hiệu lực từ

01/01/2013. Trong 17 chuẩn mực kiểm toán mới đang đợi phê duyệt đợt 2 có

VAS520 “Thủ tục phân tích”, VAS 315 “Xác định và đánh giá rủi ro có sai sót

trọng yếu thông qua hiểu biết về đơn vị được kiểm toán và môi trường của đơn vị”

83

(hoàn thành 25-7-2011), VAS 330 “Biện pháp xử lý của kiểm toán viên đối với rủi

ro đã đánh giá” (hoàn thành 27-7-2011).

Chuẩn mực kiểm toán quốc tế ISA 520 nêu rõ việc kiểm toán viên sử dụng thủ

tục phân tích là để đáp ứng với rủi ro đánh giá và là thủ tục để hỗ trợ việc đưa đến

kết luận tổng thể của KTV trong một cuộc kiểm toán BCTC. Việc sử dụng các thủ

tục phân tích như là các thủ tục đánh giá rủi ro được quy định trong IAS 315.

Mục tiêu của kiểm toán viên trong IAS 520 là:

(a) Khi sử dụng các thủ tục phân tích như các thủ tục nội dung để đáp ứng với rủi

ro đánh giá, để thiết kế và thực hiện các thủ tục phân tích để họ có hiệu quả trong

việc ứng phó với rủi ro đánh giá sai sót trọng yếu trong báo cáo tài chính ở mức độ

khẳng định, và

(b) thiết kế và thực hiện các thủ tục phân tích hỗ trợ đến kết luận tổng thể trong

một cuộc kiểm toán báo cáo tài chính.

Chuẩn mực VAS 520 cũng đã chỉnh sửa, hoàn thiện theo IAS 520, quy định và

hướng dẫn trách nhiệm của kiểm toán viên trong việc thực hiện các thủ tục phân

tích vào giai đoạn gần kết thúc cuộc kiểm toán để giúp kiểm toán viên hình thành

kết luận tổng thể về báo cáo tài chính. Đoạn 06 (b) Chuẩn mực kiểm toán Việt Nam

số 315 quy định kiểm toán viên phải sử dụng thủ tục phân tích để đánh giá rủi ro.

Đoạn 06 và 18 Chuẩn mực kiểm toán Việt Nam số 330 quy định và hướng dẫn nội

dung, lịch trình và phạm vi các thủ tục kiểm toán để xử lý các rủi ro đã đánh giá;

các thủ tục kiểm toán này có thể bao gồm các thủ tục phân tích cơ bản.

Chuẩn mực kiểm toán Việt Nam số 315 quy định kiểm toán viên phải tìm hiểu về

hệ thống thông tin liên quan đến việc lập và trình bày báo cáo tài chính. Khi xét

đoán về mức độ của rủi ro, kiểm toán viên phải xem xét những nội dung tối thiểu là

rủi ro đó có phải là rủi ro do gian lận hay không.

Thủ tục phân tích là một trong các thủ tục quan trọng giúp phát hiện các xu

hướng biến động bất thường có thể chỉ ra sai sót, gian lận cần tập trung nghiên cứu.

Mặc dù phần lớn kiểm toán viên đều ý thức được tầm quan trọng của thủ tục này

nhưng chỉ những kiểm toán viên cao cấp như trưởng nhóm kiểm toán mới thực hiện

84

thủ tục phân tích. Nguyên nhân chính là do thiếu các hướng dẫn chi tiết nên kiểm

toán viên khó áp dụng vào thực tế. Do đó Bộ tài chính và Hội nghề nghiệp trong

thời gian tới cần có các hướng dẫn chi tiết để thủ tục phân tích thực sự trở thành

một thủ tục quen thuộc trong quá trình tác nghiệp của các kiểm toán viên hay các

trợ lý kiểm toán.

Chuẩn mực kiểm toán chỉ là những nguyên tắc cơ bản về nghiệp vụ, do vậy để

giúp kiểm toán viên hiểu và áp dụng dễ dàng trong thực tế cần có các hướng dẫn chi

tiết. Các quốc gia trên thế giới, bên cạnh chuẩn mực kiểm toán, luôn có các hướng

dẫn chi tiết. Tại Việt Nam, các hướng dẫn chi tiết lại càng cần thiết do có sự khác

biệt đáng kể về trình độ và quy mô giữa các công ty kiểm toán. Nó là điều kiện giúp

các công ty kiểm toán bổ sung trong chương trình kiểm toán để áp dụng chúng vào

thực tế.

Mặc dù đề tài hiện nay chỉ mới phân tích dựa trên tỷ số tài chính nhưng khi

chuẩn mực kế toán ngày càng được hoàn thiện, chất lượng kế toán ngày càng nâng

cao và theo chuẩn mực quốc tế thì việc sử dụng mô hình data mining là một hướng

mới trong tương lai.

3.2.3 Khai thác dữ liệu – sự cần thiết một khung pháp lý:

Tại Hoa Kỳ, khai phá dữ liệu nhận được sự quan tâm của nhiều lĩnh vực liên

quan đến pháp lý: chính phủ, các nhà điều tra thực thi pháp luật và các công tố viên,

các nhà điều tra tổ chức gian lận tài chính, và các nhà điều tra gian lận của công ty,

kiểm toán viên nội bộ cho các cơ quan công cộng và khu vực tư nhân để họ có thể

tìm hiểu làm thế nào, thông qua làm việc theo nhóm, để áp dụng các công nghệ mới

nhất để chống lại gian lận tài chính. Khai phá dữ liệu là một công cụ hiện đại, hữu

hiệu đã được thể hiện để hỗ trợ trong việc phát hiện, điều tra, và truy tố các hành vi gian lận tài chính và biết được các xu hướng gian lận mới nổi. 16

Sử dụng phân tích dữ liệu sẽ xác định được "các điểm nóng" dựa trên các chỉ số

gian lận cao. Bằng cách sử dụng khai thác dữ liệu và các công cụ pháp luật thực thi

16 www.financialcrimesconference.com.

khác để có hiệu quả tập trung hoạt động pháp luật, giúp cho BCTC tăng độ tin cậy,

85

tăng lòng tin của nhà đầu tư và các đối tượng liên quan khác. Tuy nhiên việc xác

định để giảm bớt những thiệt hại cho người tiêu dùng và giữ người phạm tội có

trách nhiệm hơn thì cần khung pháp lý để công nhận bằng chứng kỹ thuật số sử

dụng tại tòa, khai thác dữ liệu là bằng chứng cho việc gian lận.

Như đã có nói ở trên, việc khai thác dữ liệu được sử dụng nhiều trong lĩnh vực kế

toán điều tra. Ở Việt Nam, lĩnh vực kế toán điều tra có thể hỗ trợ trong Cơ quan

cảnh sát điều tra án kinh tế tập trung vào những gì được gọi là tội phạm cổ cồn

trắng. Ngoài việc làm của chính phủ, kế toán điều tra có thể được sử dụng trong các

tổ chức tài chính trung gian chẳng hạn như các ngân hàng và các tổ chức bảo hiểm.

Kế toán điều tra thường làm chứng trong các phiên tòa dân sự và hình sự. Trong vai

trò này, họ đang phục vụ như nhân chứng chuyên môn. Đây là quyết định của tòa

án. Người giám định trình bày bằng chứng. Kế toán điều tra có một số tổ chức hỗ

trợ công việc của họ.

Thiệt hại do tội phạm kinh tế gây ra là rất lớn. Chỉ tính riêng vụ Huỳnh Thị

Huyền Như lừa đảo trong lĩnh vực Ngân hàng đã gây thiệt hại đến 4.600 tỷ đồng,

ngoài ra còn nhiều vụ án lừa đảo khác gây thiệt hại hàng trăm tỷ đồng, … Đây là

những con số rất đau xót trong điều kiện kinh tế nước ta còn nhiều khó khăn, doanh

nghiệp khó tiếp cận vốn, đặc biệt số doanh nghiệp phải giải thể, dừng hoạt động

ngày càng gia tăng.

Kế toán điều tra hiện đang thiếu các phương pháp tiêu chuẩn hóa và thực hành

tiêu chuẩn hóa được tìm thấy trong nhiều ngành nghề khác. Những người làm công

tác chống gian lận cần các hướng dẫn, quy định ban hành về khai phá dữ liệu nhằm

tạo cơ sở pháp lý khi thực hiện.

3.3. Hạn chế và đề xuất nghiên cứu sâu hơn:

Khi thực hiện nghiên cứu này, tác giả nhận thấy một số hạn chế và cũng là trăn

trở để áp dụng vào thực tiễn. Những hạn chế đó là:

3.3.1 Hoàn thiện mẫu dữ liệu:

86

Ngay từ đầu khi thu thập dữ liệu cho mẫu nghiên cứu, tác giả đã có lưu ý về việc

phân loại dữ liệu gian lận và không có dấu hiệu gian lận. Việc chuẩn bị cơ sở dữ

liệu để khai phá dữ liệu là một việc có tầm quan trọng, ảnh hưởng lớn đến kết quả

phân tích. Tuy nhiên, việc thực hiện thu thập thông tin về doanh nghiệp để trên cơ

sở dữ liệu đó phân tích đang gặp nhiều khó khăn. Khó khăn đầu tiên và lớn nhất, là

hiện nay quy chế về công bố thông tin minh bạch hóa hoạt động của doanh nghiệp

chưa được luật hóa, khó khăn trong việc tiếp cận báo cáo tài chính đáng tin cậy, rất

nhiều doanh nghiệp áp dụng hai thậm chí ba bản báo cáo tài chính, một để gửi cho

cơ quan quản lý nhà nước, một để gửi cơ quan thuế, một cho nội bộ lãnh đạo doanh

nghiệp.

Trên thị trường niêm yết ở Việt Nam hiện nay, các BCTC thường bị gian lận

“đọc Báo cáo tài chính, giới chuyên môn có thể phát hiện rất nhiều chỗ sai nhỏ, và tổng hợp lại trong một Báo cáo tài chính, thì có thể lại là lớn”17 hoặc các công ty

kiểm toán thường sẽ bị che giấu hoặc BCTC không đầy đủ. Gian lận tài chính, thậm

chí nếu xảy ra, có thể không được phát hiện bởi các nhà điều tra. Do đó, việc phân

loại trong mẫu nghiên cứu có thể chưa hoàn toàn chính xác.

Việc thiếu thông tin về số liệu ngành và số liệu kế hoạch của khách hàng đã làm hạn chế việc thực hiện hữu hiệu thủ tục phân tích trong kiểm toán BCTC.18 Khai

thác dữ liệu kỹ thuật đòi hỏi số lượng lớn các dữ liệu và lựa chọn các biến thích

hợp, quan tâm tới việc làm sạch dữ liệu, ngăn ngừa việc thông tin cần thiết để phát

hiện gian lận bị tiêu diệt bởi những kẻ lừa đảo. Việc so sánh các chỉ tiêu tài chính

giữa các công ty, các ngành, và các mô hình vẫn đòi hỏi nhiều nghiên cứu thêm.

Chúng ta đã biết gian lận là gì và có các cách thức gian lận thường gặp. Người

viết đã xây dựng và sử dụng các mô hình máy tính để phát hiện gian lận. Vì vậy,

nghiên cứu trong tương lai có thể liên quan đến việc tạo ra một cơ sở dữ liệu tổng

hợp của tất cả các hành vi gian lận đã xảy ra. Các công ty kiểm toán có số lượng lớn

17 Ông Bùi Văn Mai, Tổng thư ký Hội kiểm toán viên hành nghề Việt Nam (VACPA) 18 Lý Trần Kim Ngân (2011), Hoàn thiện thủ tục kiểm toán nhằm phát hiện gian lận trên báo cáo tài chính của các công ty niêm yết tại Việt Nam

các dữ liệu được kiểm toán và kiểm toán viên đã quen thuộc với bản chất của giao

87

dịch và các mẫu lỗi dự kiến, sau đó khai thác dữ liệu này cung cấp một phương thức

bề mặt hiệu quả các vấn đề thú vị. Tuy nhiên bên cạnh đó, sự phán xét của kiểm

toán viên vẫn còn là một điều kiện tiên quyết, mức độ tự động hóa không hoàn toàn

là để xác nhận.

Kiểm toán viên phải lưu ý tính thích hợp của thủ tục phân tích, tính đáng tin cậy

của nguồn số liệu, về tính chính xác trong những xét đoán của kiểm toán viên. Để

nghiên cứu sâu hơn, các công ty kiểm toán và nhà nước nên nối kết tạo ra và chia sẻ

một cơ sở dữ liệu mở cho toàn bộ các công ty trên thị trường để có thông tin phân

tích ngày càng đáng tin cậy.

3.3.2 Phân tích các biến số (tỷ số tài chính và phi tài chính):

Trong nghiên cứu này, tác giả chỉ mới sử dụng các chỉ số tài chính trong báo cáo

kết quả kinh doanh và bảng cân đối kế toán mà chưa có chỉ số nào lấy từ báo cáo

lưu chuyển tiền tệ, vì lý do thời gian hạn hẹp, cũng như các báo cáo lưu chuyển tiền

tệ không thống nhất ở mẫu biểu (BCLCTT gián tiếp, BCLCTT trực tiếp). Do đó đây

là vấn đề cần phải tìm hiểu thêm ở nghiên cứu sau.

Việc phân tích các chỉ số tài chính cũng có những hạn chế mà các nhà phân tích

nên lưu tâm:

* Chỉ số tài chính tại các công ty lớn hoạt động trong các lĩnh vực khác nhau của

các ngành khác nhau thì rất khó tìm thấy một loạt các chỉ số ngành có ý nghĩa.

* Yếu tố môi trường hay lạm phát sẽ ảnh hưởng tới phân tích các chỉ số tài chính,

do đó cần phải xem xét kỹ càng để bỏ qua các yếu tố này khi phân tích dữ liệu qua

thời gian hay qua phân tích so sánh với các đối thủ cạnh tranh.

* Yếu tố mùa vụ cũng có thể là sai lệch các chỉ số tài chính. Hiểu yếu tố mùa vụ

ảnh hưởng như thế nào đến doanh nghiệp có thể giảm thiểu khả năng hiểu sai các

chỉ số tài chính. Ví dụ, hàng tồn kho của doanh nghiệp bán lẻ có thể cao trong mùa

hè để chuẩn bị cung cấp cho khách hàng vào năm học mới. Do đó, khoản phải trả

của doanh nghiệp tăng lên và ROA của nó thấp xuống.

* Các phương pháp kế toán khác nhau cũng có thể bóp méo sự so sánh giữa các

công ty với nhau, thậm chí là ngay trong 1 công ty. Các cách tính chỉ số khác nhau

88

cũng gây ra sai lệch khi khai phá dữ liệu. Tất cả cần phải được đồng nhất. Nếu một

tổ chức công khai đầy đủ các nguyên tắc kế toán thay thế đang được sử dụng và sử

dụng một cách nhất quán thì khi một BCTC bị nghi ngờ gian lận, sau khi phân tích

nó không phải gian lận, điều quan trọng là phải nhớ rằng nguyên tắc kế toán chấp

nhận chung (GAAP) chỉ được chấp nhận chung.

* Thật khó để nhận định được một chỉ số là tốt hay xấu. Một công ty có thể có

những chỉ số tốt và cả những chỉ số xấu, do vậy thật khó mà nói được đó là một

công ty mạnh hay yếu, mà cần phải có sự kết hợp các yếu tố đó lại bằng luật kết hợp

trong mô hình khai phá dữ liệu.

Nói chung, phân tích chỉ số một cách máy móc thì rất nguy hiểm. Nói cách khác,

sử dụng chỉ số phân tích tài chính một cách thông minh sẽ cung cấp cho bạn rất

nhiều thông tin bổ ích. Do đó khi sử dụng chỉ số tài chính để khai phá dữ liệu cần

khắc phục các hạn chế này bằng cách phân tích theo ngành, theo từng chu kỳ kinh

doanh cụ thể.

Ngoài các chỉ số tài chính thì các chỉ số phi tài chính cũng có ý nghĩa khi phân

tích BCTC cũng như áp dụng vào khai phá dữ liệu để phát hiện gian lận. Các chỉ số

như tình trạng cạnh tranh, tình hình sử dụng lao động, ban lãnh đạo và kế toán

trưởng thay đổi nhân sự, kinh nghiệm quản lý, chấm điểm hệ thống kiểm soát nội

bộ công ty, xem xét công ty thực hiện kiểm toán là công ty như thế nào, chỉ số xếp

hạng tín dụng…

Một vài mô hình đã phát triển để giải thích chất lượng báo cáo kiểm toán.

Keasey, Watson, and Wynarzcyk (1988) họ chỉ ra rằng các công ty nhận được chất

lượng báo cáo kiểm toán tăng lên nếu a) công ty kiểm toán là một công ty lớn, b)

công ty có rất ít người quản lý, c) có ít cổ đông bên ngoài, d) là một bảo đảm vay, e)

nếu trong một thời gian dài là giữa kết thúc năm kiểm toán và ngày ký báo cáo kiểm

toán. Và có thể sử dụng thêm các dữ liệu phi tài chính khác, là bất kỳ dữ liệu được

tạo ra bên ngoài hệ thống kế toán bình thường có thể được sử dụng để xác định tính

hợp lý của dữ liệu được tạo ra từ kế toán, để làm thành một tiêu chí khai phá dữ liệu

tối ưu hơn.

89

Thủ tục phân tích là phương pháp kiểm toán có hiệu quả cao vì thời gian ít, chi

phí thấp mà tác dụng lại cao. Kỹ thuật phân tích cung cấp các dữ liệu có độ tin cậy

cao cho hoạt động kiểm toán và thường là kỹ thuật được áp dụng đầu tiên cho mọi

cuộc kiểm toán nên thường được các KTV cấp cao tiến hành. Những sai sót trọng

yếu, những yếu tố bất thường được phát hiện trong quá trình phân tích, so sánh, xác

định tỷ lệ tương quan giữa các tỷ số tài chính sẽ được phân tích thông qua kỹ thuật

mới sử dụng công nghệ thông tin – kỹ thuật khai phá dữ liệu – mà đã được ứng

dụng trong nghiên cứu này.

3.3.3 Sự “vận dụng ngược”:

Các kiểm toán viên được khảo sát khi được hỏi “Anh (Chị) có lo sợ nếu chỉ sử

dụng chỉ số tài chính để phát hiện gian lận trên BCTC mà không có thử nghiệm chi

tiết, sẽ dễ gây ra gian lận nhiều hơn dựa trên chỉ số đã được đưa ra” đều trả lời là có.

Trong nhiều lĩnh vực của cuộc sống, chúng ta có lợi ích từ các loại kỹ thuật công

nghệ, nhưng cái nào cũng có mặt trái của nó. Nhiều thủ phạm sử dụng các thiết bị

kỹ thuật số như là một công cụ để giúp họ gian lận. Việc xây dựng mô hình dự báo

BCTC gian lận, sai sót dựa trên chỉ số tài chính như trong nghiên cứu này gây ra sự

lo ngại cho các kiểm toán viên và các đối tượng quan tâm là liệu rằng nếu chỉ sử

dụng chỉ số tài chính để phát hiện gian lận trên BCTC mà không có thử nghiệm chi

tiết, sẽ dễ gây ra gian lận nhiều hơn dựa trên chỉ số đã được đưa ra. Smith (2005, p

119) lập luận rằng "ngày nay, hầu hết các gian lận tài chính kết hợp với việc sử

dụng các máy tính và thiết bị kỹ thuật số ..." thiết bị kỹ thuật số như máy tính cũng

trở thành mục tiêu và công cụ của các gian lận. Vì vậy, công nghệ cơ bản là một kẻ

thù về gian lận từ quan điểm của kiểm toán viên. Hầu hết kiểm toán viên không

thường có nền tảng kiến thức về các thuật toán nghiêm ngặt trong khai phá dữ liệu.

Các nghiên cứu của các chuyên gia công nghệ thông tin trong lĩnh vực khai phá dữ liệu có thể mang lại những công nghệ bổ sung cho lĩnh vực kế toán, kiểm toán.19

Để giải quyết vấn đề này, mô hình trong chương 2 còn có thể sử dụng luật kết

19 Albrecht, C. C. (2010). Fraud and Forensic Accounting In a Digital Environment.

hợp “Associate” để xem xét sự kết hợp tối ưu của các chỉ số để chỉ ra gian lận chính

90

xác hơn, phần mềm Weka 3.7 đã có hỗ trợ chức năng này. Tuy nhiên vì tác giả

không là chuyên gia trong lĩnh vực công nghệ thông tin, nên chưa tìm được sự kết

hợp tối ưu như mong muốn, mà chỉ mới đưa ra kết quả được chạy dựa trên câu lệnh

có sẵn của phần mềm (Phụ lục Kết quả của luật kết hợp). Việc tìm kiếm các luật kết

hợp trong cơ sở dữ liệu được thực hiện theo thuật toán nguyên thuỷ Apriori. Tuy

nhiên một thực tế là số tập mục phổ biến có thể là rất nhiều, khắc phục hạn chế này

chúng ta có thể dùng thuật toán CHARM được Mohammed .J Zaki và Ching-jui

Hsiao đưa ra trong năm 2002. Thuật toán CHARM không tiến hành tìm những tập

mục phổ biến mà tiến hành tìm những tập mục phổ biến đóng. Điều này dẫn đến số

tập mục phổ biến tìm được là giảm đi rất nhiều và tại các bước của thuật toán việc

cắt nhánh trong quá trình thực hiện là rất hiệu quả. Nhưng công cụ Weka không hỗ

trợ thuật toán này.

Một lợi thế quan trọng của phương pháp khai thác dữ liệu là có thể phát triển mô

hình học máy mới để phát hiện các cuộc tấn công mới trước khi các gian lận này

được nhìn thấy bởi các chuyên gia con người. Mô hình phân loại với luật kết hợp và

các mẫu thường xuyên được phát triển để phát hiện có xâm nhập bất thường (W.

Lee and S. Stolfo., 1998). Cách tiếp cận này có thể tự động tạo ra các mô hình phát

hiện súc tích và chính xác từ số lượng lớn các dữ liệu kiểm toán. Tuy nhiên, nó đòi

hỏi một số lượng lớn các dữ liệu kiểm toán để tính toán. Hơn nữa, quá trình học tập

này là một phần không thể tách rời và liên tục của một hệ thống phát hiện xâm nhập

bởi vì bộ nguyên tắc được sử dụng bởi các module phát hiện có thể thay đối trong

một thời gian dài. Dữ liệu kiểm toán được phân tích bằng thuật toán luật kết hợp để

xác định tính năng không thay đối của dữ liệu tấn công.

Như vậy có thể khắc phục được nhược điểm nếu kiểm toán viên biết cách chính

xác để bảo quản, tiếp thu và phân tích dữ liệu được lưu trữ trong một máy tính nghi

ngờ trở thành mục tiêu của sự gian lận hoặc được sử dụng như một công cụ gian

lận, dữ liệu sẽ trở thành chất lượng cao bằng chứng tại tòa án. Pearson và Singleton

(2008) cho rằng sự cần thiết để có được, quản lý và phân tích các bằng chứng kỹ

thuật số là rất quan trọng cho sự thành công chuyên nghiệp kế toán trong tương lai.

91

Như vậy, lợi ích của công nghệ như máy tính và các thiết bị kỹ thuật số khác có giá

trị hơn mặt tiêu cực của nó.

3.3.4 Nâng cao kiến thức phần mềm và lý thuyết về kiểm toán gian lận:

Mặc dù phần mềm được lựa chọn trong nghiên cứu này cũng tùy biến và thân

thiện với người sử dụng, có thể một số tính năng hữu ích đã được bỏ qua do kiến

thức hạn chế về phần mềm. Tuy nhiên, nghiên cứu này chỉ là một thử nghiệm thí

điểm của chủ đề này, tự nghiên cứu bao gồm cả đọc hướng dẫn sử dụng của nhà

cung cấp phần mềm, điều đáng chú ý là khi một công ty kiểm toán đã quyết định

nghiên cứu, sử dụng hoặc thực hiện một gói phần mềm, đó là một ý tưởng tốt để

đào tạo các nhân viên học hỏi các phần mềm như vậy. Điều này bao gồm đào tạo

người sử dụng thực sự, cung cấp hỗ trợ thời gian thực và chia sẻ kiến thức giữa các

thành viên trong nhóm phát hiện.

Ngoài ra mô hình bắt nguồn từ quá khứ có thể không tiếp tục để được như vậy

trong tương lai. Một số loại gian lận khó bị phát hiện bởi các công cụ khai thác dữ

liệu. Thay vào đó, quan sát và cái nhìn sâu sắc của kiểm toán viên điều tra vào vấn

đề giúp đỡ rất nhiều. Do đó, các công cụ khai thác dữ liệu nên được sử dụng chỉ với

sự giúp đỡ của các chuyên gia trong lĩnh vực như chuyên gia về khai phá dữ liệu và

kiểm toán viên gian lận.

Ví dụ, người kiểm toán gian lận có thể tìm kiếm bằng chứng từ một nhà cung cấp

khai thác dữ liệu cho dấu hiệu cảnh báo gian lận được biết đến của tổng thể, tích lũy

những dấu hiệu cảnh báo gian lận bởi nhà cung cấp, và phát triển danh sách này để

tiếp tục xem xét. Đây là một mức độ khai thác dữ liệu. (Tommie W. Singleton &

Aaron J. Singleton. (2010).

Những nghiên cứu trong tương lai có thể cung cấp các phương pháp để xác định

các giải pháp cho các câu hỏi cụ thể, chẳng hạn như các đặc điểm cá nhân và tổ

chức, kết hợp với một tập hợp các kinh doanh cụ thể hoặc điều kiện kinh tế khác, có

thể là một báo hiệu đỏ cho tội gian lận. Mở rộng nghiên cứu để tăng cường uy tín

nghề nghiệp của kiểm toán viên và đồng thời có phát triển một lý thuyết về báo cáo

92

tài chính gian lận, xác định các điều kiện và hoàn cảnh dẫn đến gian lận và lập

phương pháp để ngăn chặn gian lận trước khi nó xảy ra.

Trong khi nhiều nghiên cứu đã được thực hiện trên kỹ thuật điều tra trong khoa

học máy tính và các lĩnh vực toán học, nghiên cứu bổ sung là cần thiết để áp dụng

các kỹ thuật vào lĩnh vực kiểm toán điều tra. Một cuộc kiểm toán điều tra có thể đắt

hơn đáng kể và tốn thời gian hơn so với công việc kiểm toán thường xuyên. Trong

khi một cuộc kiểm toán tài chính là một hoạt động lấy mẫu mà không nhìn vào mọi

giao dịch thì một cuộc kiểm toán điều tra tập trung vào một khía cạnh cụ thể của

những sổ sách và có thể kiểm tra từng mục. Hầu hết các kiểm toán viên không có cơ

sở cần thiết để hiểu làm thế nào để áp dụng các thuật toán điều tra nghiêm ngặt, nếu

kỹ thuật này không có sẵn trong các phần mềm, mà thông thường họ không sẵn kiến

thức trong lĩnh vực này. Các học giả có kiến thức này có thể mang những công nghệ

bổ sung lĩnh vực kế toán. Như có thể thấy trong phần phương pháp luận ở trên, chỉ

có công việc sơ bộ đã được thực hiện trong việc tạo ra mạnh mẽ, phương pháp

nghiên cứu cho kiểm toán viên điều tra. Các phương pháp được đề xuất cần phải

được xác nhận và thử nghiệm, sau đó phương pháp mới được đề xuất.

Bài viết này sẽ giải thích sự tiến hóa của công nghệ được sử dụng trong một

cuộc điều tra sau đó đánh giá sản phẩm của các công cụ thường được sử dụng trong

kỹ thuật số điều tra do kế toán điều tra và đánh giá về việc sử dụng những công cụ.

Kết luận chương 3:

Chương này sẽ kết thúc toàn bộ nội dung của nghiên cứu. Xem xét, đề xuất

phương pháp để hoàn thiện quy trình phân tích cho kiểm toán viên để nhanh chóng

phát hiện gian lận, sai sót. Mong muốn đưa ra một công cụ dễ dàng cho việc phát

hiện gian lận sai sót cho các bên liên quan (nhà đầu tư, ngân hàng,..) khi mà báo cáo

tài chính chưa được kiểm toán. Chương ba cũng đưa ra những hạn chế của nghiên

cứu và nâng cao lên một số vấn đề cho các nghiên cứu thêm.

Từ các hạn chế khi thực hiện đề tài này, tác giả đã nêu ra các hướng nghiên cứu

tiếp theo để khắc phục các hạn chế trên để nâng cao tính hữu ích của đề tài như tạo

93

cơ sở dữ liệu mở, công khai để tạo nguồn dữ liệu để phân tích, sử dụng thêm các chỉ

số tài chính trên báo cáo lưu chuyển tiền tệ và chỉ số phi tài chính làm biến số cho

việc khai phá dữ liệu. Đề tài mở ra nhiều hướng vận dụng thực tế nhằm bổ sung

công cụ cho thủ tục kiểm toán truyền thống, mở thêm nhiều dịch vụ ngoài kiểm

toán khi dữ liệu được khai thác hiệu quả, tiết kiệm thời gian và được biết thêm về

nghề kế toán điều tra rất phát triển ở các nước phát triển cũng sử dụng công cụ này

là phổ biến để phục vụ cho công tác của họ.

94

KẾT LUẬN

Phát hiện gian lận dựa vào máy tính hỗ trợ là một lĩnh vực mới thú vị cho các

nhà nghiên cứu kế toán. Các chủ đề như kỹ thuật khai thác dữ liệu, tỷ lệ phân tích

để phát hiện các hành vi gian lận báo cáo tài chính, các vấn đề xung quanh các

nguồn thông tin bên ngoài, và kế toán điều tra mang lại cơ hội cho việc nghiên cứu

mạnh mẽ và cho sự hợp tác giữa giảng viên kế toán và hệ thống thông tin, khoa học

pháp lý, máy tính, toán học, và các nhà nghiên cứu khác. Hiện nay, các nghiên cứu

được lan truyền trên một loạt các tạp chí, từ kiểm toán cho các hệ thống thông tin

đến các nhà điều tra. Mục tiêu của bài này là để giới thiệu những gì được biết về sử

dụng chỉ số tài chính với sự hỗ trợ của phần mềm Weka để triển khai việc ứng dụng

các mô hình để khai phá dữ liệu ở chương 2 của luận văn.

Thành công của một số nghiên cứu trên thế giới và của mô hình trong bài khi

phát hiện được BCTC có gian lận, đã cho thấy việc sử dụng khai phá dữ liệu cho kết

quả tốt. Và chúng xứng đáng được nghiên cứu thêm, vì để có được một mô hình

chất lượng cao thì sẽ phải đầu tư nhiều thời gian và công sức. Mở ra một hướng

nghiên cứu mới để củng cố thêm cho những phương pháp kiểm toán truyền thống

đang thực hiện và tạo tiền đề để phát triển nghề kế toán điều tra.

i

Bảng P.1 dữ liệu sử dụng mô hình khai phá dữ liệu với Weka trong đề tài:

PHỤ LỤC

ii

Bảng P.2: Kết quả của mô hình học máy cây quyết định J4.8 ngành công

5

J48 pruned tree ------------------ NPTA <= 0.0108 | QACL <= 0.1225: NonFraud (2.0) | QACL > 0.1225: Fraud (25.0/1.0) NPTA > 0.0108: NonFraud (64.0/30.0) Number of Leaves : 3 Size of the tree : Time taken to build model: 0.17 seconds === Evaluation on training set === Time taken to test model on training data: 0.01 seconds === Summary === Correctly Classified Instances 60 65.9341 % Incorrectly Classified Instances 31 34.0659 % Kappa statistic 0.3716 Mean absolute error 0.3714 Root mean squared error 0.4309 Relative absolute error 76.9008 % Root relative squared error 87.7264 % Coverage of cases (0.95 level) 98.9011 % Mean rel. region size (0.95 level) 85.1648 % Total Number of Instances 91 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 0.973 0.556 0.545 0.973 0.699 0.459 0.724 0.566 NonFraud 0.444 0.027 0.96 0.444 0.608 0.459 0.724 0.764 Fraud Weighted Avg.

0.659 0.242 0.791 0.659 0.645 0.459 0.724 0.683

nghiệp (sử dụng Use training set) (2 trang)

iii

Bảng P.2: Kết quả của mô hình học máy cây quyết định J4.8 ngành công

=== Confusion Matrix === a b <-- classified as 36 1 | a = NonFraud 30 24 | b = Fraud

nghiệp (sử dụng Use training set) (2 trang)

Bảng P.3: Kết quả của mô hình học máy cây quyết định J4.8 ngành Công nghệ

3

J48 pruned tree ------------------ B1 <= 0.059: NonFraud (5.0) B1 > 0.059: Fraud (2.0) Number of Leaves : 2 Size of the tree : Time taken to build model: 0 seconds === Evaluation on training set === Time taken to test model on training data: 0 seconds === Summary === Correctly Classified Instances 7 100 % Incorrectly Classified Instances 0 0 % Kappa statistic 1 Mean absolute error 0 Root mean squared error 0 Relative absolute error 0 % Root relative squared error 0 % Coverage of cases (0.95 level) 100 % Mean rel. region size (0.95 level) 50 % Total Number of Instances 7

thông tin (sử dụng Use training set) (2 trang)

iv

Bảng P.3: Kết quả của mô hình học máy cây quyết định J4.8 ngành Công nghệ

=== Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 1 0 1 1 1 1 1 1 NonFraud 1 0 1 1 1 1 1 1 Fraud Weighted Avg.

1 0 1 1 1 1 1 1

=== Confusion Matrix === a b <-- classified as 5 0 | a = NonFraud 0 2 | b = Fraud Bảng P.4: Kết quả của mô hình học máy cây quyết định J4.8 ngành Dịch vụ tiêu dùng

thông tin (sử dụng Use training set) (2 trang)

7

J48 pruned tree ------------------ COSAL <= 0.0571: Fraud (4.0) COSAL > 0.0571 | B2 <= 0.626 | | LTDTA <= 0.0086: Fraud (4.0/1.0) | | LTDTA > 0.0086: NonFraud (2.0) | B2 > 0.626: NonFraud (8.0) Number of Leaves : 4 Size of the tree : Time taken to build model: 0 seconds === Evaluation on training set === Time taken to test model on training data: 0 seconds === Summary === Correctly Classified Instances 17 94.4444 % Incorrectly Classified Instances 1 5.5556 %

(sử dụng Use training set) (2 trang)

v

Bảng P.4: Kết quả của mô hình học máy cây quyết định J4.8 ngành Dịch vụ tiêu dùng

Kappa statistic 0.8861 Mean absolute error 0.0833 Root mean squared error 0.2041 Relative absolute error 17.4419 % Root relative squared error 41.8609 % Coverage of cases (0.95 level) 100 % Mean rel. region size (0.95 level) 61.1111 % Total Number of Instances 18 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 0.909 0 1 0.909 0.952 0.892 0.981 0.981 NonFraud 1 0.091 0.875 1 0.933 0.892 0.981 0.946 Fraud Weighted Avg.

0.944 0.035 0.951 0.944 0.945 0.892 0.981 0.967

=== Confusion Matrix === a b <-- classified as 10 1 | a = NonFraud 0 7 | b = Fraud Bảng P.5: Kết quả của mô hình học máy cây quyết định J4.8 ngành Hàng tiêu

(sử dụng Use training set) (2 trang)

J48 pruned tree ------------------ CACL <= 1.0569: Fraud (8.0) CACL > 1.0569 | CASHTA <= 0.2217 | | COSAL <= 0.174: NonFraud (15.0) | | COSAL > 0.174 | | | GMTREND <= 0.5552 | | | | REINV <= 0.0776: NonFraud (2.0) | | | | REINV > 0.0776: Fraud (5.0) | | | GMTREND > 0.5552: NonFraud (5.0) | CASHTA > 0.2217: Fraud (3.0)

dùng (sử dụng Use training set) (2 trang)

vi

Bảng P.5: Kết quả của mô hình học máy cây quyết định J4.8 ngành Hàng tiêu

11

Number of Leaves : 6 Size of the tree : Time taken to build model: 0.02 seconds === Evaluation on training set === Time taken to test model on training data: 0 seconds === Summary === Correctly Classified Instances 38 100 % Incorrectly Classified Instances 0 0 % Kappa statistic 1 Mean absolute error 0 Root mean squared error 0 Relative absolute error 0 % Root relative squared error 0 % Coverage of cases (0.95 level) 100 % Mean rel. region size (0.95 level) 50 % Total Number of Instances 38 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 1 0 1 1 1 1 1 1 NonFraud 1 0 1 1 1 1 1 1 Fraud Weighted Avg. 1 0 1 1 1 1 1 1 === Confusion Matrix === a b <-- classified as 22 0 | a = NonFraud 0 16 | b = Fraud

dùng (sử dụng Use training set) (2 trang)

vii

Bảng P.6: Kết quả của mô hình học máy cây quyết định J4.8 ngành năng

J48 pruned tree ------------------ B1 <= 0.0172 | CACL <= 1.6926: NonFraud (3.0) | CACL > 1.6926 | | CACL <= 1.9116: Fraud (2.0) | | CACL > 1.9116: NonFraud (2.0) B1 > 0.0172: Fraud (2.0) Number of Leaves : 4 7 Size of the tree : Time taken to build model: 0 seconds === Evaluation on training set === Time taken to test model on training data: 0 seconds === Summary === Correctly Classified Instances 9 100 % Incorrectly Classified Instances 0 0 % Kappa statistic 1 Mean absolute error 0 Root mean squared error 0 Relative absolute error 0 % Root relative squared error 0 % Coverage of cases (0.95 level) 100 % Mean rel. region size (0.95 level) 50 % Total Number of Instances 9 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 1 0 1 1 1 1 1 1 NonFraud 1 0 1 1 1 1 1 1 Fraud Weighted Avg. 1 0 1 1 1 1 1 1 === Confusion Matrix ===

lượng (sử dụng Use training set) (2 trang)

viii

Bảng P.6: Kết quả của mô hình học máy cây quyết định J4.8 ngành năng

a b <-- classified as 5 0 | a = NonFraud 0 4 | b = Fraud Bảng P.7: Kết quả của mô hình học máy cây quyết định J4.8 ngành Nguyên

lượng (sử dụng Use training set) (2 trang)

J48 pruned tree ------------------ GMTREND <= 0.6134 | NPSAL <= 0.0224 | | QACL <= 0.5495: Fraud (4.0) | | QACL > 0.5495: NonFraud (4.0/1.0) | NPSAL > 0.0224: Fraud (11.0) GMTREND > 0.6134 | COSAL <= 0.4374: NonFraud (6.0) | COSAL > 0.4374: Fraud (2.0) Number of Leaves : 5 Size of the tree : 9 Time taken to build model: 0 seconds === Evaluation on training set === Time taken to test model on training data: 0 seconds === Summary === Correctly Classified Instances 26 96.2963 % Incorrectly Classified Instances 1 3.7037 % Kappa statistic 0.9189 Mean absolute error 0.0556 Root mean squared error 0.1667 Relative absolute error 12.3932 % Root relative squared error 35.3448 % Coverage of cases (0.95 level) 100 % Mean rel. region size (0.95 level) 57.4074 % Total Number of Instances 27

vật liệu (sử dụng Use training set) (2 trang)

ix

Bảng P.7: Kết quả của mô hình học máy cây quyết định J4.8 ngành Nguyên

=== Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 1 0.056 0.9 1 0.947 0.922 0.991 0.967 NonFraud 0.944 0 1 0.944 0.971 0.922 0.991 0.992 Fraud Weighted Avg.

0.963 0.019 0.967 0.963 0.963 0.922 0.991 0.984

3

=== Confusion Matrix === a b <-- classified as 9 0 | a = NonFraud 1 17 | b = Fraud Bảng P.8: Kết quả của mô hình học máy cây quyết định J4.8 ngành Y tế (sử dụng Use training set) (2 trang) J48 pruned tree ------------------ CACL <= 1.2082: Fraud (2.0) CACL > 1.2082: NonFraud (10.0/1.0) Number of Leaves : 2 Size of the tree : Time taken to build model: 0 seconds === Evaluation on training set === Time taken to test model on training data: 0 seconds === Summary === Correctly Classified Instances 11 91.6667 % Incorrectly Classified Instances 1 8.3333 % Kappa statistic 0.75 Mean absolute error 0.15

vật liệu (sử dụng Use training set) (2 trang)

x

0.917 0.25 0.925 0.917 0.911 0.775 0.833 0.862

=== Confusion Matrix === a b <-- classified as 9 0 | a = NonFraud 1 2 | b = Fraud

Bảng P.8: Kết quả của mô hình học máy cây quyết định J4.8 ngành Y tế (sử dụng Use training set) (2 trang) Root mean squared error 0.2739 Relative absolute error 38.1818 % Root relative squared error 63.0315 % Coverage of cases (0.95 level) 100 % Mean rel. region size (0.95 level) 91.6667 % Total Number of Instances 12 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class 1 0.333 0.9 1 0.947 0.775 0.833 0.9 NonFraud 0.667 0 1 0.667 0.8 0.775 0.833 0.75 Fraud Weighted Avg.

Sự khác biệt của mô hình cây quyết định chủ yếu là trong mô hình phân

ngành công nghiệp và các ngành còn lại. Lý do đầu tiên phải kể đến là ngành

công nghiệp trong khảo sát thực hiện ở phần 2.1.2 được các kiểm toán viên

đánh giá là ngành có khả năng gian lận cao nhất, từ đó dẫn đến việc có thể

trong mẫu có nhiều BCTC có gian lận nhưng chưa được phát hiện để đưa ra sự

học tập phân loại đúng cho mô hình cây quyết định.

Mô hình phát triển chính xác trong việc phân loại một cách chính xác với tỷ

lệ lớn hơn 80% tổng số mẫu.

dscr-

'1.nonfraud&fraud-non

dscr-

{'\'(-inf-1.71469]\'','\'(1.71469-3.26998]\'','\'(3.26998-

{'\'(-inf-1.38559]\'','\'(1.38559-2.69738]\'','\'(2.69738-

{'\'(-inf-0.09688]\'','\'(0.09688-0.19166]\'','\'(0.19166-

{'\'(-inf-0.06346]\'','\'(0.06346-0.12692]\'','\'(0.12692-

B1

{'\'(-inf-1.05401]\'','\'(1.05401-2.10642]\'','\'(2.10642-

SALTA

Kết quả của luật kết hợp === Run information === Scheme: weka.associations.FilteredAssociator -F "weka.filters.MultiFilter -F \"weka.filters.unsupervised.attribute.ReplaceMissingValues \"" -c -1 -W weka.associations.Apriori -- -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0 - c -1 Relation: 1.nonfraud&fraud-non weka.filters.unsupervised.attribute.Discretize-B10-M-1.0-Rfirst-last Instances: 202 Attributes: 29 ……… === Associator model (full training set) === FilteredAssociator using weka.associations.Apriori -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -c -1 on data filtered through weka.filters.MultiFilter -F "weka.filters.unsupervised.attribute.ReplaceMissingValues " Filtered Header @relation weka.filters.unsupervised.attribute.Discretize-B10-M-1.0-Rfirst-last- weka.filters.unsupervised.attribute.ReplaceMissingValues-weka.filters.MultiFilter- Fweka.filters.unsupervised.attribute.ReplaceMissingValues' @attribute CACL 4.82527]\'','\'(4.82527-6.38056]\'','\'(6.38056-7.93585]\'','\'(7.93585- 9.49114]\'','\'(9.49114-11.04643]\'','\'(11.04643-12.60172]\'','\'(12.60172- 14.15701]\'','\'(14.15701-inf)\''} @attribute QACL 4.00917]\'','\'(4.00917-5.32096]\'','\'(5.32096-6.63275]\'','\'(6.63275- 7.94454]\'','\'(7.94454-9.25633]\'','\'(9.25633-10.56812]\'','\'(10.56812- 11.87991]\'','\'(11.87991-inf)\''} @attribute NFATA 0.28644]\'','\'(0.28644-0.38122]\'','\'(0.38122-0.476]\'','\'(0.476- 0.57078]\'','\'(0.57078-0.66556]\'','\'(0.66556-0.76034]\'','\'(0.76034- 0.85512]\'','\'(0.85512-inf)\''} @attribute 0.19038]\'','\'(0.19038-0.25384]\'','\'(0.25384-0.3173]\'','\'(0.3173- 0.38076]\'','\'(0.38076-0.44422]\'','\'(0.44422-0.50768]\'','\'(0.50768- 0.57114]\'','\'(0.57114-inf)\''} @attribute 3.15883]\'','\'(3.15883-4.21124]\'','\'(4.21124-5.26365]\'','\'(5.26365-

xi

B2

{'\'(-inf-1.02476]\'','\'(1.02476-2.04782]\'','\'(2.04782-

CASHTA

{'\'(-inf-0.04615]\'','\'(0.04615-0.092]\'','\'(0.092-

{'\'(-inf-3.04114]\'','\'(3.04114-7.06828]\'','\'(7.06828-

{'\'(-inf-0.13964]\'','\'(0.13964-0.25008]\'','\'(0.25008-

TDTA

{'\'(-inf-0.07198]\'','\'(0.07198-0.14396]\'','\'(0.14396-

{'\'(-inf-0.22139]\'','\'(0.22139-0.44278]\'','\'(0.44278-

INVSAL

{'\'(-inf-0.06641]\'','\'(0.06641-0.13282]\'','\'(0.13282-

INVTA

xii

Kết quả của luật kết hợp 6.31606]\'','\'(6.31606-7.36847]\'','\'(7.36847-8.42088]\'','\'(8.42088- 9.47329]\'','\'(9.47329-inf)\''} @attribute 3.07088]\'','\'(3.07088-4.09394]\'','\'(4.09394-5.117]\'','\'(5.117- 6.14006]\'','\'(6.14006-7.16312]\'','\'(7.16312-8.18618]\'','\'(8.18618- 9.20924]\'','\'(9.20924-inf)\''} @attribute 0.13785]\'','\'(0.13785-0.1837]\'','\'(0.1837-0.22955]\'','\'(0.22955- 0.2754]\'','\'(0.2754-0.32125]\'','\'(0.32125-0.3671]\'','\'(0.3671- 0.41295]\'','\'(0.41295-inf)\''} @attribute DEBTEQ {'\'(-inf--3.45271]\'','\'(-3.45271-1.57788]\'','\'(1.57788- 6.60847]\'','\'(6.60847-11.63906]\'','\'(11.63906-16.66965]\'','\'(16.66965- 21.70024]\'','\'(21.70024-26.73083]\'','\'(26.73083-31.76142]\'','\'(31.76142- 36.79201]\'','\'(36.79201-inf)\''} @attribute FAEQ 11.09542]\'','\'(11.09542-15.12256]\'','\'(15.12256-19.1497]\'','\'(19.1497- 23.17684]\'','\'(23.17684-27.20398]\'','\'(27.20398-31.23112]\'','\'(31.23112- 35.25826]\'','\'(35.25826-inf)\''} @attribute 'RECLIB ' {'\'(-inf-0.76974]\'','\'(0.76974-1.52798]\'','\'(1.52798- 2.28622]\'','\'(2.28622-3.04446]\'','\'(3.04446-3.8027]\'','\'(3.8027- 4.56094]\'','\'(4.56094-5.31918]\'','\'(5.31918-6.07742]\'','\'(6.07742- 6.83566]\'','\'(6.83566-inf)\''} @attribute 0.36052]\'','\'(0.36052-0.47096]\'','\'(0.47096-0.5814]\'','\'(0.5814- 0.69184]\'','\'(0.69184-0.80228]\'','\'(0.80228-0.91272]\'','\'(0.91272- 1.02316]\'','\'(1.02316-inf)\''} @attribute LTDTA 0.21594]\'','\'(0.21594-0.28792]\'','\'(0.28792-0.3599]\'','\'(0.3599- 0.43188]\'','\'(0.43188-0.50386]\'','\'(0.50386-0.57584]\'','\'(0.57584- 0.64782]\'','\'(0.64782-inf)\''} @attribute WCTA {'\'(-inf--0.30038]\'','\'(-0.30038--0.18616]\'','\'(-0.18616- -0.07194]\'','\'(-0.07194-0.04228]\'','\'(0.04228-0.1565]\'','\'(0.1565- 0.27072]\'','\'(0.27072-0.38494]\'','\'(0.38494-0.49916]\'','\'(0.49916- 0.61338]\'','\'(0.61338-inf)\''} @attribute 0.66417]\'','\'(0.66417-0.88556]\'','\'(0.88556-1.10695]\'','\'(1.10695- 1.32834]\'','\'(1.32834-1.54973]\'','\'(1.54973-1.77112]\'','\'(1.77112- 1.99251]\'','\'(1.99251-inf)\''} @attribute 0.19923]\'','\'(0.19923-0.26564]\'','\'(0.26564-0.33205]\'','\'(0.33205- 0.39846]\'','\'(0.39846-0.46487]\'','\'(0.46487-0.53128]\'','\'(0.53128- 0.59769]\'','\'(0.59769-inf)\''}

'Z score'

{'\'(-inf-4.7714]\'','\'(4.7714-10.6652]\'','\'(10.6652-

COSAL

{'\'(-inf--0.20494]\'','\'(-0.20494--0.10808]\'','\'(-

NPSAL

{'\'(-inf-0.5622]\'','\'(0.5622-2.554]\'','\'(2.554-

NIFA

{'\'(-inf--40.70243]\'','\'(-40.70243--33.74956]\'','\'(-

{'\'(-inf--0.05043]\'','\'(-0.05043-0.02934]\'','\'(0.02934-

{'\'(-inf--0.03731]\'','\'(-0.03731-0.15868]\'','\'(0.15868-

{'\'(-inf-2.19802]\'','\'(2.19802-4.39064]\'','\'(4.39064-

{'\'(-inf-0.2611]\'','\'(0.2611-0.3432]\'','\'(0.3432-

RETREND

{'\'(-inf--4.76612]\'','\'(-4.76612--4.12544]\'','\'(-4.12544--

xiii

Kết quả của luật kết hợp @attribute 16.559]\'','\'(16.559-22.4528]\'','\'(22.4528-28.3466]\'','\'(28.3466- 34.2404]\'','\'(34.2404-40.1342]\'','\'(40.1342-46.028]\'','\'(46.028- 51.9218]\'','\'(51.9218-inf)\''} @attribute 0.10808--0.01122]\'','\'(-0.01122-0.08564]\'','\'(0.08564- 0.1825]\'','\'(0.1825-0.27936]\'','\'(0.27936-0.37622]\'','\'(0.37622- 0.47308]\'','\'(0.47308-0.56994]\'','\'(0.56994-inf)\''} @attribute 4.5458]\'','\'(4.5458-6.5376]\'','\'(6.5376-8.5294]\'','\'(8.5294- 10.5212]\'','\'(10.5212-12.513]\'','\'(12.513-14.5048]\'','\'(14.5048- 16.4966]\'','\'(16.4966-inf)\''} @attribute 33.74956--26.79669]\'','\'(-26.79669--19.84382]\'','\'(-19.84382-- 12.89095]\'','\'(-12.89095--5.93808]\'','\'(-5.93808-1.01479]\'','\'(1.01479- 7.96766]\'','\'(7.96766-14.92053]\'','\'(14.92053-inf)\''} @attribute GPTA 0.10911]\'','\'(0.10911-0.18888]\'','\'(0.18888-0.26865]\'','\'(0.26865- 0.34842]\'','\'(0.34842-0.42819]\'','\'(0.42819-0.50796]\'','\'(0.50796- 0.58773]\'','\'(0.58773-inf)\''} @attribute NPTA {'\'(-inf--0.28977]\'','\'(-0.28977--0.21394]\'','\'(-0.21394-- 0.13811]\'','\'(-0.13811--0.06228]\'','\'(-0.06228-0.01355]\'','\'(0.01355- 0.08938]\'','\'(0.08938-0.16521]\'','\'(0.16521-0.24104]\'','\'(0.24104- 0.31687]\'','\'(0.31687-inf)\''} @attribute ROCE 0.35467]\'','\'(0.35467-0.55066]\'','\'(0.55066-0.74665]\'','\'(0.74665- 0.94264]\'','\'(0.94264-1.13863]\'','\'(1.13863-1.33462]\'','\'(1.33462- 1.53061]\'','\'(1.53061-inf)\''} @attribute RECSAL 6.58326]\'','\'(6.58326-8.77588]\'','\'(8.77588-10.9685]\'','\'(10.9685- 13.16112]\'','\'(13.16112-15.35374]\'','\'(15.35374-17.54636]\'','\'(17.54636- 19.73898]\'','\'(19.73898-inf)\''} @attribute REINV {'\'(-inf--0.91282]\'','\'(-0.91282--0.50744]\'','\'(-0.50744- -0.10206]\'','\'(-0.10206-0.30332]\'','\'(0.30332-0.7087]\'','\'(0.7087- 1.11408]\'','\'(1.11408-1.51946]\'','\'(1.51946-1.92484]\'','\'(1.92484- 2.33022]\'','\'(2.33022-inf)\''} @attribute 0.4253]\'','\'(0.4253-0.5074]\'','\'(0.5074-0.5895]\'','\'(0.5895- 0.6716]\'','\'(0.6716-0.7537]\'','\'(0.7537-0.8358]\'','\'(0.8358- 0.9179]\'','\'(0.9179-inf)\''} @attribute B3 3.48476]\'','\'(-3.48476--2.84408]\'','\'(-2.84408--2.2034]\'','\'(-2.2034--

xiv

Kết quả của luật kết hợp 1.56272]\'','\'(-1.56272--0.92204]\'','\'(-0.92204--0.28136]\'','\'(-0.28136- 0.35932]\'','\'(0.35932-inf)\''} @attribute GMTREND {'\'(-inf--1.97055]\'','\'(-1.97055--1.4357]\'','\'(- 1.4357--0.90085]\'','\'(-0.90085--0.366]\'','\'(-0.366-0.16885]\'','\'(0.16885- 0.7037]\'','\'(0.7037-1.23855]\'','\'(1.23855-1.7734]\'','\'(1.7734- 2.30825]\'','\'(2.30825-inf)\''} @attribute Nganh {HTD,Cng,DVTD,Nlg,Yte,NVL,CNTT,CNg} @attribute Loai {NonFraud,Fraud} @data Associator Model Apriori ======= Minimum support: 0.9 (182 instances) Minimum metric : 0.9 Number of cycles performed: 2 Generated sets of large itemsets: Size of set of large itemsets L(1): 4 Size of set of large itemsets L(2): 5 Size of set of large itemsets L(3): 2 Best rules found: 1. NPSAL='(-inf-0.5622]' 199 ==> RECSAL='(-inf-2.19802]' 198 lift:(1) lev:(0) [0] conv:(0.99) 2. FAEQ='(-inf-3.04114]' NPSAL='(-inf-0.5622]' 186 ==> RECSAL='(-inf- 2.19802]' 185 lift:(1) lev:(0) [0] conv:(0.92) 3. GMTREND='(0.16885-0.7037]' 184 ==> NPSAL='(-inf-0.5622]' 183 lift:(1.01) lev:(0.01) [1] conv:(1.37) 4. GMTREND='(0.16885-0.7037]' 184 ==> RECSAL='(-inf-2.19802]' 183 lift:(1) lev:(0) [0] conv:(0.91) 5. RECSAL='(-inf-2.19802]' GMTREND='(0.16885-0.7037]' 183 ==> NPSAL='(- inf-0.5622]' 182 lift:(1.01) lev:(0.01) [1] conv:(1.36) 6. NPSAL='(-inf-0.5622]' GMTREND='(0.16885-0.7037]' 183 ==> RECSAL='(- inf-2.19802]' 182 lift:(1) lev:(0) [0] conv:(0.91) 7. RECSAL='(-inf-2.19802]' 200 ==> NPSAL='(-inf-0.5622]' 198

xv

Kết quả của luật kết hợp lift:(1) lev:(0) [0] conv:(0.99) 8. FAEQ='(-inf-3.04114]' 189 ==> RECSAL='(-inf-2.19802]' 187 lift:(1) lev:(0) [0] conv:(0.62) 9. FAEQ='(-inf-3.04114]' RECSAL='(-inf-2.19802]' 187 ==> NPSAL='(-inf- 0.5622]' 185 lift:(1) lev:(0) [0] conv:(0.93) 10. GMTREND='(0.16885-0.7037]' 184 ==> NPSAL='(-inf-0.5622]' RECSAL='(- inf-2.19802]' 182 lift:(1.01) lev:(0.01) [1] conv:(1.21)

Ý nghĩa:

10 luật tốt nhất được sinh ra bởi thuật toán Apriori trên dữ liệu như trên

(sắp xếp giảm dần theo confidence). Tuy nhiên đầu tiên phải rời rạc hóa dữ

liệu các giá trị thô của các chỉ số tài chính, các giá trị của mỗi chỉ số tài chính

được phân thành 10 nhóm với các đoạn giá trị ở phần @attribute trong bảng

trên.

Luật kết hợp số 1 cho biết rằng nếu NPSAL bé hơn hoặc bằng 0.5622 thì

RECSAL có giá trị bé hơn hoặc bằng 2.19802 với độ tin cậy là 0.99.

xvi

Bảng câu hỏi:

KHẢO SÁT

VỀ SỬ DỤNG CHỈ SỐ TÀI CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN,

SAI SÓT TRÊN BÁO CÁO TÀI CHÍNH CỦA CÔNG TY NIÊM YẾT

Kính gửi: Anh/Chị

Tôi là học viên cao học ngành Kế toán Kiểm toán của trường Đại học kinh

tế TP Hồ Chí Minh. Tôi hiện đang trong quá trình thực hiện Luận văn tốt

nghiệp với đề tài “Phân tích chỉ số tài chính để phát hiện gian lận, sai sót trong

Báo cáo tài chính của các doanh nghiệp niêm yết trên thị trường Việt Nam”.

Chính vì vậy, tôi mong muốn quý Anh/Chị, với tư cách là các kiểm toán viên

hoặc kế toán trưởng, đưa ra các quan điểm của mình thông qua bảng câu hỏi

đính kèm dưới đây.

Tôi kính mong quý Anh/Chị dành vài phút để giúp tôi hoàn tất bảng câu

hỏi. Kết quả thu được từ cuộc điều tra này không những giúp tôi hoàn thành

tốt luận văn mà còn nhằm giúp mở ra hướng mới cho việc kiểm toán được hữu

hiệu và hữu ích hơn. Tất cả dữ liệu thu thập được sẽ không được sử dụng vào

bất kỳ mục đích nào khác ngoài việc tổng hợp thông tin thực tế cho luận văn

của tôi và được trình bày dưới hình thức báo cáo tổng hợp, đảm bảo mọi thông

tin cá nhân không bị tiết lộ.

Tôi rất biết ơn sự giúp đỡ của quý Anh/Chị và chúc quý Anh/Chị luôn

thành công trong lĩnh vực chuyên môn của mình. Nếu quý anh chị có nhu cầu,

chúng tôi sẵn sàng cung cấp báo cáo tổng hợp của cuộc điều tra để quý

Anh/Chị tham khảo. Mọi chi tiết xin liên hệ: Trần Ngọc Phúc. Email:

ngocphuc117@gmail.com

Xin Anh/(Chị) vui lòng trả lời các câu hỏi dưới đây (anh chị chọn ý nào

vui lòng gạch dưới hoặc bôi màu ý mà anh chị chọn)

Thông tin về người được phỏng vấn:

Tên đơn vị công tác:……………………………………………………..

Vai trò: (Kiểm toán viên/ Kế toán trưởng)………………………………

xvii

Câu hỏi:

1. Theo các anh chị, trong các ngành sau đây ngành nào thường hay xảy

ra gian lận?

(cid:0) Công nghiệp (gồm các cty chế tạo các loại máy móc cơ khí, thiết bị

điện, nhà thầu xây dựng và các dịch vụ giao thông vận tải )

(cid:0) Công nghệ thông tin (gồm nghiên cứu và sản xuất phần mềm, dịch vụ

liên quan và thiết bị công nghệ phần cứng, chất bán dẫn và thiết bị bán dẫn)

(cid:0) Dịch vụ tiêu dùng (gồm bán lẻ và phân phối thực phẩm, dược phẩm,

du lịch và giải trí, dịch vụ taxi và vận tải hành khách và truyền thông)

(cid:0) Hàng tiêu dùng (gồm sản xuất và phân phối lương thực, thực phẩm,

nước giải khát và bánh kẹo, thuốc lá và đồ uống có cồn, đồ gỗ và các sản

phẩm gia dụng)

(cid:0) Năng lượng (gồm thăm dò, khai thác hoặc dịch vụ chế biến, vận tải ...

các sản phẩm dầu khí, than đá, nhiên liệu chất đốt)

(cid:0) Nguyên vật liệu (gồm hoá chất, vật liệu xây dựng, kính, giấy, lâm sản;

khai mỏ và luyện kim; bao bì)

(cid:0) Y tế (gồm dịch vụ, thiết bị chăm sóc sức khoẻ và dược phẩm và công

nghệ sinh học)

2. Theo Anh (Chị), chuẩn mực kiểm toán Việt Nam đã hướng dẫn đầy đủ

việc vận dụng thủ tục phân tích trong kiểm toán chưa?

(cid:0) Có

(cid:0) Không

3. Theo chính sách công ty của Anh (Chị), công ty có thực hiện thủ tục

phân tích trong việc kiểm toán không?

(cid:0) Có

(cid:0) Không

4. Theo Anh (Chị), lý do nào thủ tục phân tích ít được thực hiện trong

thực tế vì:

(cid:0) Thời gian không đủ

xviii

(cid:0) Dữ liệu so sánh, phục vụ cho việc phân tích không đầy đủ

(cid:0) Kiểm toán viên thiếu kỹ năng phân tích

5. Lý do khác: (anh/chị có thể cho biết vắn tắt) ………………………

Theo chính sách công ty của Anh (Chị), công ty thực hiện thủ tục phân tích ở

giai đoạn nào của chu trình kiểm toán?

(cid:0) Lập kế hoạch và Thực hiện kiểm toán

(cid:0) Cả 3 giai đoạn của chu trình kiểm toán

6. Công ty áp dụng những phương pháp nào để thực hiện phân tích chỉ

số tài chính trong thủ tục phân tích?

(cid:0) Phân tích xu hướng

(cid:0) Phân tích tỷ suất

(cid:0) Phân tích tính hợp lý

7. Theo chính sách công ty của Anh (Chị), có thực hiện phân tích chỉ số

tài chính trong thủ tục phân tích trong việc thực hiện kiểm toán hay không?

(cid:0) Có

(cid:0) Không

Nếu câu trả lời là không, xin vui lòng giải thích lý do:

(cid:0) Không cần thiết, không hiệu quả

(cid:0) Khó khăn, mất thời gian

(cid:0) Lý do

khác:…………………………………………………………………….

Nếu câu trả lời là có, xin vui lòng cho biết Công ty có chính sách bằng văn

bản quy định về các mức độ thực hiện dưới đây không (Từ câu … đến câu…):

8. Công ty có xây dựng quy trình hướng dẫn thực hiện phân tích chỉ số

tài chính trong thủ tục phân tích không?

(cid:0) Có

(cid:0) Không

9. Việc áp dụng thủ tục phân tích ở công ty của Anh (Chị) mục đích chủ

yếu là:

xix

(cid:0) Giảm bớt khối lượng công việc

(cid:0) Hạn chế trách nhiệm pháp lý của kiểm toán viên

(cid:0) Nâng cao tính hữu hiệu và hiệu quả của cuộc kiểm toán

10. Theo chính sách công ty của Anh (Chị), phân tích chỉ số tài chính

trong thủ tục phân tích được thực hiện trên các loại BCTC nào:

(cid:0) Bảng cân đối kế toán

(cid:0) Bảng cân đối kế toán và Báo cáo Kết quả hoạt động kinh doanh

(cid:0) Bảng cân đối kế toán, BC Kết quả hoạt động kinh doanh và BC Lưu

chuyển tiền tệ.

11. Khi lập kế hoạch kiểm toán, công ty có quy định bắt buộc KTV phải

ước tính ban đầu về mức chỉ số tài chính nghi ngờ có gian lận không?

(cid:0) Có

(cid:0) Không

(cid:0) Chỉ đánh giá với một số khách hàng có quy mô lớn

12. Anh (Chị) có thường sử dụng chỉ số thống kê ngành để đối chiếu với

chỉ số của đơn vị anh chị đang kiểm toán không?

(cid:0) Có

(cid:0) Không

13. Công ty có hướng dẫn riêng về tiêu chí đánh giá mức chỉ số tài chính

nghi ngờ có gian lận không?

(cid:0) Có

(cid:0) Không

14. Mức chỉ số tài chính nghi ngờ có gian lận đang áp dụng tại công ty

Anh (Chị) có sửa đổi cho từng ngành nghề kinh doanh khác nhau không?

(cid:0) Có

(cid:0) Không

15. Anh/ Chị thấy các chỉ số tài chính hiện nay đã thể hiện được đúng tình

hình tài chính của đơn vị mình phân tích chưa?

(cid:0) Có

xx

(cid:0) Không

16. Anh/Chị có từng biết đến thuật khai phá dữ liệu (Data Mining) để

phát hiện gian lận trên báo cáo tài chính chưa, nếu có thì anh/chị cho nhận xét

về kỹ thuật này?

(cid:0) Chưa từng tìm hiểu

(cid:0) Đã được biết, nhưng nghĩ kỹ thuật này không hữu hiệu ở Việt Nam

(cid:0) Đã được biết, và đang quan tâm.

17. Công ty có sử dụng phần mềm kiểm toán hỗ trợ cho kiểm toán viên

trong quá trình kiểm toán không?

(cid:0) Có

(cid:0) Không

18. Nếu câu trả lời là có anh chị vui lòng cho biết công ty hiện giờ sử

dụng phần mềm gì?

……………………………………………………………………………

19. Nếu câu trả lời ở trên là không theo Anh/(Chị) công ty có nên trang bị

phần mềm kiểm toán để hỗ trợ cho kiểm toán viên không?

(cid:0) Có

(cid:0) Không

20. Nếu câu trả lời ở trên là không Anh/(Chị) vui lòng cho biết rõ lý do:

(cid:0) Không cần thiết

(cid:0) Tốn kém

(cid:0) Ý kiến khác:…………………………………………………………

21. Theo kinh nghiệm chuyên môn của mình, các Anh (Chị) cho biết sự

tin tưởng vào mức độ hữu ích của việc sử dụng chỉ số tài chính có thể phát

hiện ra gian lận sai sót trên BCTC thông qua phân tích?

(cid:0) Cao

(cid:0) Trung bình

(cid:0) Thấp

xxi

22. Anh (Chị) có lo sợ nếu chỉ sử dụng chỉ số tài chính để phát hiện gian

lận trên BCTC mà không có thử nghiệm chi tiết, sẽ dễ gây ra gian lận nhiều

hơn dựa trên chỉ số đã được đưa ra?

(cid:0) Có

(cid:0) Không

Ngoài các câu hỏi trên, nếu có thể được, xin Anh/(Chị) vui lòng cho ý kiến

một số vấn đề sau:

23. Anh (Chị) có hay sử dụng chuẩn mực kiểm toán Quốc tế chưa được

chấp nhận rộng rãi để kiếm toán các công ty Việt Nam không?

(cid:0) Có

(cid:0) Không

24. Để nâng cao việc vận dụng phân tích chỉ số tài chính trong thủ tục

phân tích trong kiểm toán, theo Anh/(Chị) điều kiện tiên quyết là phải:

(cid:0) Có hướng dẫn cụ thể trong thông tư hướng dẫn của Bộ tài chính

(cid:0) Có hướng dẫn cụ thể trong quy trình kiểm toán của công ty kiểm toán

(cid:0) Cách khác…………………………………………………………

25. Để nâng cao việc vận dụng thủ tục phân tích trong kiểm toán, theo

Anh/(Chị) Bộ tài chính cần phải làm công việc gì?

……………………………………………………………………………

26. Để nâng cao việc vận dụng thủ tục phân tích trong kiểm toán, theo

Anh/(Chị), KTV phải làm công việc gì?

……………………………………………………………………………

27. Nếu có thể, anh/chị có kiến nghị gì để chỉ số tài chính hữu ích hơn

trong việc phát hiện gian lận, sai sót trên BCTC?

……………………………………………………………………………

Xin chân thành cảm ơn sự ủng hộ và cộng tác của Anh/(Chị) giúp chúng

tôi hoàn tất phiếu khảo sát này.

Thành phố Hồ Chí Minh, ngày tháng năm

Công ty kiểm toán

Họ và tên

xxii

BẢNG TỔNG HỢP KẾT QUẢ KHẢO SÁT

Về sử dụng chỉ số tài chính để phát hiện gian lận, sai sót trên BCTC

của công ty niêm yết

Thời gian khảo sát: Tháng 10-11/2012

Đối tượng khảo sát: Kiểm toán viên độc lập, Kiểm toán viên nội bộ, Kế

toán trưởng

Số phiếu gửi khảo sát: gửi online

(https://docs.google.com/spreadsheet/viewform?formkey=dHJ6cHVMQlBp

RWlrN0sxWW5Ya2ZFOWc6MQ#gid=0)

Số phiếu thu lại hợp lệ: 10 phiếu

Dưới đây là kết quả phiếu khảo sát của các công ty kiểm toán tại Việt Nam.

Trong đó:

1. Theo các anh chị, trong các ngành sau đây ngành nào thường hay xảy ra gian lận?

Số kết quả chọn % 50% Công nghiệp 20% Công nghệ thông tin 10% Dịch vụ tiêu dùng 10% Hàng tiêu dùng 20% Năng lượng 10% Nguyên vật liệu 0% Y tế 5 2 1 1 2 1 0

2. Theo Anh (Chị), chuẩn mực kiểm toán Việt Nam đã hướng dẫn đầy đủ việc vận dụng thủ tục phân tích trong kiểm toán chưa?

%

Số kết quả chọn 8 2 80% 20% Có Không

3. Theo chính sách công ty kiểm toán của Anh (Chị), công ty kiểm toán có bắt buộc thực hiện thủ tục phân tích trong việc kiểm toán không?

xxiii

Số kết quả chọn

7 3 % 70% 30% Có Không

4. Theo Anh (Chị), lý do nào thủ tục phân tích ít được thực hiện trong thực tế vì:

Số kết quả chọn % 11% 1

89% 8

6 0

Thời gian không đủ Dữ liệu so sánh, phục vụ cho việc phân tích không đầy đủ 67% Kiểm toán viên thiếu kỹ năng phân tích Other 0% Người phỏng vấn có thể chọn nhiều hơn một đáp án nên phần tram có thể lớn hơn 100%.

5. Theo chính sách công ty kiểm toán của Anh (Chị), công ty thực hiện thủ tục phân tích ở giai đoạn nào của chu trình kiểm toán?

Số kết quả chọn %

Lập kế hoạch và Thực hiện kiểm toán Cả 3 giai đoạn của chu trình kiểm toán 2 8 20% 80%

6. Công ty kiểm toán áp dụng những phương pháp nào để thực hiện phân tích chỉ số tài chính trong thủ tục phân tích?

7 9 5

Số kết quả chọn % 70% Phân tích xu hướng 90% Phân tích tỷ suất Phân tích tính hợp lý 50% Người phỏng vấn có thể chọn nhiều hơn một đáp án nên phần tram có thể lớn hơn 100%. 7. Theo chính sách công ty kiểm toán của Anh (Chị), có thực hiện phân tích chỉ số tài chính trong thủ tục phân tích trong việc thực hiện kiểm toán hay không?

9 1 0

Số kết quả chọn % 90% Có 10% Không Other 0% Người phỏng vấn có thể chọn nhiều hơn một đáp án nên phần tram có thể lớn

xxiv

hơn 100%. Nếu câu trả lời là có, xin vui lòng cho biết Công ty có chính sách bằng văn bản quy định về các mức độ thực hiện dưới đây không (Từ câu 8 đến câu 15): 8. Công ty có xây dựng quy trình hướng dẫn thực hiện phân tích chỉ số tài chính trong thủ tục phân tích không? Số kết quả chọn % 70% Có 30% Không 7 3

78% 22% 89% 7 2 8

9. Việc áp dụng thủ tục phân tích ở công ty của Anh (Chị) mục đích chủ yếu là: Số kết quả chọn % Giảm bớt khối lượng công việc Hạn chế trách nhiệm pháp lý của kiểm toán viên Nâng cao tính hữu hiệu và hiệu quả của cuộc kiểm toán Người phỏng vấn có thể chọn nhiều hơn một đáp án nên phần tram có thể lớn hơn 100%.

10. Theo chính sách công ty kiểm toán của Anh (Chị), phân tích chỉ số tài chính trong thủ tục phân tích được thực hiện trên các loại BCTC nào:

Số kết quả chọn Bảng cân đối kế toán Báo cáo Kết quả hoạt động kinh doanh Báo cáo Lưu chuyển tiền tệ. 9 9 2 % 100% 100% 22%

11. Khi lập kế hoạch kiểm toán, công ty kiểm toán có quy định bắt buộc KTV phải ước tính ban đầu về mức chỉ số tài chính nghi ngờ có gian lận không?

Số kết quả chọn % 40% Có 30% Không 20% Chỉ đánh giá với một số khách hàng có quy mô lớn 4 3 2

12. Anh (Chị) có thường sử dụng chỉ số thống kê ngành để đối chiếu với chỉ số tài chính của đơn vị anh chị đang kiểm toán không? Số kết quả chọn % 30% Có 70% Không 3 7

13. Công ty kiểm toán có hướng dẫn riêng về tiêu chí đánh giá mức chỉ số tài chính nghi ngờ có gian lận không?

xxv

Số kết quả chọn % 60% Có 30% Không 6 3

14. Mức chỉ số tài chính nghi ngờ có gian lận đang áp dụng tại công ty kiểm toán của Anh (Chị) có sửa đổi cho từng ngành nghề kinh doanh khác nhau không?

Số kết quả chọn % 70% Có 20% Không 7 2

15. Anh/ Chị thấy các chỉ số tài chính hiện nay đã thể hiện được đúng tình hình tài chính của đơn vị mình phân tích chưa?

Số kết quả chọn % 30% Có 60% Không 3 6

Ngoài các câu hỏi trên, nhằm kiểm nghiệm kỹ thuật mới về việc sử dụng chỉ số tài chính trong thủ tục phân tích, xin Anh/(Chị) vui lòng cho ý kiến một số vấn đề sau:

16. Anh/Chị có từng biết đến thuật khai phá dữ liệu (Data Mining) để phát hiện gian lận trên báo cáo tài chính chưa, nếu có thì anh/chị cho nhận xét về kỹ thuật này?

%

Chưa từng tìm hiểu Đã được biết, nhưng nghĩ kỹ thuật này không hữu hiệu ở Việt Nam Đã được biết, và đang quan tâm. Số kết quả chọn 5 3 2 50% 30% 20%

17. Công ty có sử dụng phần mềm kiểm toán hỗ trợ cho kiểm toán viên trong quá trình kiểm toán không?

xxvi

Số kết quả chọn % 0% Có 100% Không 0 10

18. Nếu câu trả lời là có anh chị vui lòng cho biết công ty hiện giờ sử dụng phần mềm gì? 19. Nếu câu trả lời ở trên là không theo Anh/(Chị) công ty có nên trang bị phần mềm kiểm toán để hỗ trợ cho kiểm toán viên không?

Số kết quả chọn % Có Không 80% 20% 8 2

20. Nếu câu trả lời cho câu 18 ở trên là không Anh/(Chị) vui lòng cho biết rõ lý do:

Số kết quả chọn %

20% 80% 20% 1 4 1

Không cần thiết Tốn kém Other Người phỏng vấn có thể chọn nhiều hơn một đáp án nên phần tram có thể lớn hơn 100%.

21. Theo kinh nghiệm chuyên môn của mình, các Anh (Chị) cho biết sự tin tưởng vào mức độ hữu ích của việc sử dụng chỉ số tài chính có thể phát hiện ra gian lận sai sót trên BCTC thông qua phân tích?

Số kết quả chọn % Cao Trung bình Thấp 20% 50% 30% 2 5 3

22. Anh (Chị) có lo sợ nếu chỉ sử dụng chỉ số tài chính để phát hiện gian lận trên BCTC mà không có thử nghiệm chi tiết, sẽ dễ gây ra gian lận nhiều hơn dựa trên chỉ số đã được đưa ra?

xxvii

Số kết quả chọn % Có Không 100% 0% 10 0

23. Anh (Chị) có hay sử dụng chuẩn mực kiểm toán Quốc tế chưa được chấp nhận rộng rãi để kiếm toán các công ty Việt Nam không?

Số kết quả chọn % 60% Có 40% Không 6 4

24. Để nâng cao việc vận dụng phân tích chỉ số tài chính trong thủ tục phân tích trong kiểm toán, theo Anh/(Chị) điều kiện tiên quyết là phải:

%

Có hướng dẫn cụ thể trong thông tư hướng dẫn của Bộ tài chính Có hướng dẫn cụ thể trong quy trình kiểm toán của công ty kiểm toán Có nguồn cơ sở dữ liệu lớn và công khai để thực hiện khai phá dữ liệu Other Số kết quả chọn 0 2 8 0 0% 20% 80% 0%

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM

TRẦN NGỌC PHÚC

PHÂN TÍCH CHỈ SỐ TÀI CHÍNH ĐỂ PHÁT HIỆN GIAN LẬN, SAI SÓT TRONG BÁO CÁO TÀI CHÍNH CỦA CÁC DOANH NGHIỆP NIÊM YẾT TRÊN THỊ TRƯỜNG VIỆT NAM Chuyên ngành: Kế toán Mã số: 62.34.30.01 LUẬN VĂN THẠC SĨ KINH TẾ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN VIỆT TP.HCM NĂM 2012

LỜI CẢM ƠN

Trong suốt quá trình học tập và hoàn thành luận văn này, tôi đã nhận được sự

hướng dẫn, giúp đỡ quý báu của các thầy cô, các anh chị và các bạn. Tôi xin chân

thành gửi lời cảm ơn chân thành tới:

Phó giáo sư- Tiến sĩ Nguyễn Việt đã giúp đỡ, định hướng, góp ý, sửa chữa

và tạo mọi điều kiện thuận lợi cho tôi trong suốt quá trình hoàn thành luận văn.

Phó giáo sư- Tiến sĩ Đỗ Phúc – Trường Đại học Quốc Gia TP.HCM - Đại

học Công nghệ thông tin – đã giúp đỡ, hỗ trợ tôi rất về kỹ thuật công nghệ thông tin

ứng dụng trong đề tài để tôi có thể hoàn thành được luận văn này.

Xin chân thành cảm ơn các thầy cô trong hội đồng chấm luận văn đã cho tôi

những đóng góp quý báu để hoàn chỉnh luận văn này.

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Những thông tin và

nội dung trong đề tài đều dựa trên nghiên cứu thực tế và hoàn toàn đúng với nguồn

trích dẫn. Kết quả nêu trong luận văn là trung thực và chưa từng được công bố trong

bất cứ công trình nghiên cứu nào.

TRẦN NGỌC PHÚC

DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

- ACFE: (Association of Certified Fraud Examiners) Hiệp hội các nhà điều tra

gian lận Hoa Kỳ

- AICPA: Uỷ ban kiểm toán Hoa kỳ

- BCTC: Báo cáo tài chính

- CSDL: Cơ sở dữ liệu

- DNNY: Doanh nghiệp niêm yết

- ISA: Chuẩn mực báo cáo tài chính quốc tế

- IIA: (The Institute of Internal Auditors) Hiệp hội kiểm toán nội bộ chuyên

nghiệp quốc tế

- KTV: kiểm toán viên

- PTTC: phân tích tài chính

- FFD: (Financial fraud detection) Phát hiện gian lận Báo cáo tài chính

- FSF: (Financial statement frauds) những gian lận Báo cáo tài chính

- FFS: (Fraud financial statement) Báo cáo tài chính có gian lận

- GAAS: (Generally Accepted Auditing Standards): Chuẩn mực kiểm toán được

chấp nhận chung.

- SAS: (Statement on Auditing Standards) Chuẩn mực kiểm toán của Hoa kỳ

- VAS: Chuẩn mực kế toán Việt Nam

DANH MỤC CÁC BẢNG BIỂU

1. Bảng 1.1: Tổng hợp kết quả cuộc nghiên cứu của ACFE từ 2004-2012 ............... 9

2. Bảng 1.2: Tỷ số tài chính sử dụng để khai phá dữ liệu dùng phần mềm Weka ... 19

3. Bảng 1.3: Phân loại 10 nhóm ngành theo ICB và GICS ..................................... 22

4. Bảng 2.1: Kết quả của mô hình học máy Bayesian Network (2 trang)................ 51

5. Bảng 2.2: Kết quả của mô hình học máy cây quyết định J4.8............................. 52

13. Bảng 2.3 Chi tiết độ chính xác phân lớp theo từng ngành của mô hình cây quyết

định ...................................................................................................................... 60

14. Bảng 2.10: Kết quả của mô hình Multilayer Perceptron ................................... 61

15. Bảng 2.11: Kết quả dự báo dữ liệu đầu ra dựa trên mô hình cây quyết định ..... 66

DANH MỤC HÌNH VẼ

1. Biểu đồ 1.1: Tổn thất do các gian lận gây ra ...................................................... 10

2. Biểu đồ 1.2: Tổn thất do gian lận gây ra phân theo khu vực doanh nghiệp......... 11

3. Biểu đồ 1.3: Các cách thức gian lận trên BCTC theo ACFE .............................. 12

4. Hình 1.1: Khuôn khổ phát hiện và phòng chống gian lận Báo cáo tài chính....... 28

5. Hình 1.2: Khung khái niệm để phân loại các ứng dụng khai thác dữ liệu để phát

hiện BCTC gian lận............................................................................................... 35

6. Hình 2.1 :Giao diện phần mềm Weka ............................................................... 45

7. Hình 2.2: Tham số của thuật toán cây quyết định J.48 ....................................... 49

8. Hình 2.3: Tham số của thuật toán Bayesian Network ........................................ 50

9. Hình 2.4: Mô hình cây quyết định của toàn bộ tập dữ liệu ................................. 56

10. Hình 2.5: Mô hình cây quyết định của tập dữ liệu ngành công nghiệp ............. 57

11. Hình 2.6: Mô hình cây quyết định của tập dữ liệu ngành công nghệ thông tin . 57

12. Hình 2.7: Mô hình cây quyết định của tập dữ liệu ngành Dịch vụ tiêu dùng .... 58

13. Hình 2.8: Mô hình cây quyết định của tập dữ liệu ngành Hàng tiêu dùng ........ 58

14. Hình 2.9: Mô hình cây quyết định của tập dữ liệu ngành Năng lượng.............. 59

15. Hình 2.10: Mô hình cây quyết định của tập dữ liệu ngành Nguyên vật liệu...... 59

16. Hình 2.11: Mô hình cây quyết định của tập dữ liệu ngành Y tế........................ 60

TÀI LIỆU THAM KHẢO

Tài liệu tiếng Việt

1. Các chuẩn mực kiểm toán quốc tế IAS 520, IAS 315

2. Các chuẩn mực và dự thảo chuẩn mực kiểm toán Việt Nam VAS 520, VAS

315, VAS 330

3. comay. (2007, 8, 19). Chỉ số tài chính - vẻ đẹp tiềm ẩn sau những báo cáo khô

khan. http://www.saga.vn.

4. Lê Đạt Chí. (2011). Ứng dụng mô hình mạng thần kinh nhân tạo trong dự

báo: Luận án tiến sĩ. Đại học kinh tế TP.HCM.

5. Lê Duy Ngọc. (2009). Hoàn thiện thủ tục kiểm soát trong kiểm toán báo cáo

tài chính nhằm phát hiện gian lận và sai sót tại các công ty đại chúng Việt

Nam : Luận văn thạc sĩ. Đại học Kinh tế TP.HCM.

6. Lý Trần Kim Ngân. (2011). Hoàn thiện thủ tục kiểm toán nhằm phát hiện

gian lận trên báo cáo tài chính của các công ty niêm yết tại Việt Nam. Đại học

Kinh tế TP.HCM.

7. Nguyễn Thị Ngọc Hằng. (2008). Hoàn thiện thủ tục kiểm soát trong kiểm

toán báo cáo tài chính nhằm phát hiện gian lận và sai sót trong kiểm toán báo

cáo tài chính : Luận văn thạc sĩ. Đại học Kinh tế TP.HCM.

8. Nguyễn Văn Chức. (2010). Vấn đề tiền xử lý dữ liệu trong Data Mining.

http://bis.net.vn/forums.

9. Tạ Bích Trang. Phân lớp trong WEKA.

http://www.uit.edu.vn/forum/index.php?act=Attach&type=post&id=18714

10. Trường Đại học Khoa Học Tự Nhiên. (2011). Khai thác dữ liệu và ứng dụng.

Bài giảng.

11. Thư viện đại học Duy Tân. Data Mining - Khái niệm, vai trò và ứng dụng.

http://elib.dtu.edu.vn/Chuyende/.

12. TS. Trần Thị Giang Tân. (2009). Gian lận trên báo cáo tài chính và các công

trình nghiên cứu về gian lận.

13. Báo cáo tài chính của các công ty lấy từ chính website các công ty hoặc từ

http://www.cophieu68.com; http://cafef.vn/

14. http://vi.wikipedia.org/wiki

Tài liệu tiếng Anh

15. ACFE. (2008). Report to the Nation on occupational Fraud & abuse.

16. ACFE. (2010). Report to the Nation on occupational Fraud & abuse.

17. Albrecht, C. C. (2010). Fraud and Forensic Accounting In a Digital

Environment.

18. Anuj Sharma. (2012). A Review of Financial Accounting Fraud Detection

based on Data Mining Techniques. International Journal of Computer

Applications (0975 – 8887) Volume 39– No.1

19. Bunea-Bontas, Cristina Aurora. (2009). Hedge accounting.

20. CAQAnti. (2010). Deterring and Detecting Financial Reporting Fraud.

21. Cogger, K. F. (1998). Neural network detection of management fraud using

published financial data.

22. G.Apparao. (2009). Financial Statement Fraud Detection by Data Mining.

23. Kaminski, Kathleen a; T Sterling Wetzel; Guan, Liming (2004; 19, 1). Can

financial ratios detect fraudulent financial reporting?. Managerial Auditing

Journal; ProQuest Central, pg. 15

24. K. Fanning and K.Cogger. (1998). Neural network detection of management

fraud using published financial data. IntJ Intelligent Syst Account, Finance

Manage 4(2), pg 113-26

25. Kirkos, E. (2005). Data Mining techniques for the detection of fraudulent

financial statements.

26. Leonard Rang’ala Lari. (2009). The power of financial ratios in detecting

fraudulent financial reporting the case of savings and credit co - operative

societies in Kenya.

27. Perols, J. (2008). Financial Statement Fraud DetectionAn Analysis of

Statistical and Machine Learning Algorithms. Auditing: A Journal of

Practice & Theory, Vol. 30, No. 2(May 2011), pp. 19–50.

28. Persons, Obeua S. (1995) Using financial statement data to identify factors

associated with fraudulent financial reporting, Journal of Applied Business

Research, Vol. 11, No. 3, pp. 38-46

29. Phua, C. (2004). A Comprehensive Survey of Data Mining-based Fraud

Detection Research.

30. R Gupta, NS Gill (2012), A Data Mining Framework for Prevention and

Detection of Financial Statement Fraud, International Journal of Computer

Applications (0975 – 8887), Volume 50 – No.8, July 2012

31. Sharma, A. (2012). A Review of Financial Accounting Fraud Detection

based on Data Mining Techniques.

32. Spathis, C. (2003). Using client performance measures to identify pre-

engagement factors associated with qualified audit reports in Greece.

33. Supatcharee. (2012). Data Mining As A Financial Auditing Tool.

34. Thompson. Using Data Mining

to Detect Fraud & Error.

http://www.tampabayiia.org/PDF/Using_Data_Mining_to_Detect_Fraud_an

d_Error.pdf

35. Tommie W. Singleton & Aaron J. Singleton. (2010). Fraud Auditing and

Forensic Accounting.

36. Zhang, D., & Zhou, L. (2004). Discovering golden nuggets: data mining in

financial application, IEEE Transactions on Systems, Man and Cybernetics

34 (4) (2004) Nov.