intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Cách mạng công nghiệp 4.0, thông tin kế toán, định giá

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:10

8
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nghiên cứu này xem xét việc sử dụng dữ liệu lớn và/hoặc machine learning (ML) để cung cấp thông tin chi tiết liên quan đến việc định giá vốn chủ sở hữu. Khối lượng nghiên cứu trong lĩnh vực này khá lớn, nghiên cứu này tập trung vào các nghiên cứu cung cấp thông tin liên quan đến việc sử dụng KL vào hoạt động kế toán. Cuối cùng, nghiên cứu sẽ cung cấp các khuyến nghị cho nghiên cứu và thực hành trong tương lai.

Chủ đề:
Lưu

Nội dung Text: Cách mạng công nghiệp 4.0, thông tin kế toán, định giá

  1. CÁCH MẠNG CÔNG NGHIỆP 4.0, THÔNG TIN KẾ TOÁN, ĐỊNH GIÁ INDUSTRIAL REVOLUTION 4.0, ACCOUNTING INFORMATION, VALUATION Phạm Tú Anh1* Trần Thị Quỳnh Hương2 Hồ Thị Vân Anh3 1,2,3 Khoa Kế toán – Kiểm toán Trường Đại học Công Nghiệp Thành phố Hồ Chí Minh Tóm tắt. Nghiên cứu này xem xét việc sử dụng dữ liệu lớn và/hoặc machine learning (ML) để cung cấp thông tin chi tiết liên quan đến việc định giá vốn chủ sở hữu. Khối lượng nghiên cứu trong lĩnh vực này khá lớn, nghiên cứu này tập trung vào các nghiên cứu cung cấp thông tin liên quan đến việc sử dụng KL vào hoạt động kế toán. Cuối cùng, nghiên cứu sẽ cung cấp các khuyến nghị cho nghiên cứu và thực hành trong tương lai. Từ khóa. Big data, machine learning, định giá. Abstract. This study examines the use of big data and/or machine learning (ML) to provide insights related to equity valuation. The volume of research in this field is quite large, this study focuses on research that provides information related to the use of ML in accounting activities. Finally, the study will provide recommendations for future research and practice. Keywords. Big data, machine learning, valuation JEL Classification: M40, M00, M41 DOI: https://doi.org/10.59006/vnfa-jaa.05202325 1 GIỚI THIỆU Thuật ngữ dữ liệu lớn vẫn chưa có một định nghĩa rõ ràng cho đến hiện nay. Favaretto và cs (2020), thuật ngữ này được sử dụng để mô tả các khái niệm khác nhau (thu thập, tổng hợp, phân tích và trình bày). Ủy ban Châu Âu (2018), dữ liệu lớn là "… một lượng lớn các loại dữ liệu khác nhau được tạo ra từ nhiều nguồn khác nhau như con người, máy móc hoặc cảm biến. Dữ liệu này có thể là thông tin khí hậu, hình ảnh vệ tinh, hình ảnh và video kỹ thuật số, tín hiệu GPS, dữ liệu cá nhân như tên, ảnh, địa chỉ email, chi tiết ngân hàng, bài đăng trên các trang web mạng xã hội, thông tin y tế hoặc một địa chỉ IP máy tính". Mặc dù không có định nghĩa thống nhất về dữ liệu lớn, nhưng việc sử dụng dữ liệu và các phương pháp phân tích phù hợp với một số khía cạnh của thuật ngữ này (khối lượng lớn, dữ liệu phi cấu trúc, ML) đã phổ biến trong nhiều nghiên cứu cũng như thực hành tài chính và kế toán trong hai thập kỷ gần đây. Nghiên cứu này xem xét việc sử dụng dữ liệu lớn và/hoặc ML nhằm cung cấp sự hiểu biết sâu hơn trong việc sử dụng thông tin kế toán để định giá vốn chủ sở hữu. Cụ thể, tập trung vào các nghiên cứu liên quan về chất lượng và dự báo thu nhập cũng như việc sử dụng thông tin kế toán trong việc đánh giá rủi ro và dự báo tỷ suất lợi nhuận cổ phiếu. Chất lượng thu nhập được đưa vào đánh giá vì nó có liên quan đến việc định giá (Nissim, 2022a). Ngoài ra, chất lượng thu nhập được xác định một phần bởi các hoạt động quản lý thu nhập, có ảnh hưởng đến việc định giá vốn chủ sở hữu. Ví dụ, khi phát hiện có sai sót tài chính tại một công ty, giá cổ phiếu của công ty đó thường giảm (Karpoff và cs, 2008). Sau khi xem xét các nghiên cứu hiện có, nghiên cứu này đưa ra các khuyến nghị cho nghiên cứu và thực hành trong tương lai. Trong những năm gần đây, khả năng thực hiện các phân tích chi tiết trong lĩnh vực kế toán của các công ty đã tăng lên do những cải tiến về tính khả dụng của dữ liệu và kỹ thuật mô hình hóa. Sự phát triển của ML cho phép trích xuất thông tin chi tiết từ các tập dữ liệu tài chính lớn và/hoặc dữ liệu phi cấu trúc, có thể được sử dụng để dự đoán các sai sót tài chính, thu nhập và tỷ suất lợi nhuận cổ phiếu cũng như cho phép ước tính các tham số có liên quan và các biến tiềm ẩn hiệu quả hơn (mô hình các khoản dồn tích không tự định của Breuer & Schutt, 2021). Hơn nữa, hầu hết các nghiên cứu liên quan đến kế toán/dữ liệu lớn cho đến nay đều tập trung vào việc sử dụng dữ liệu lớn (chủ yếu ở dạng văn bản) và/hoặc ML để trích xuất thông tin về các chỉ tiêu kế toán nhưng lại ít chú ý đến việc đo lường chúng cũng như kiểm tra mối quan hệ giữa các chỉ tiêu kế toán này.
  2. 2 Một số nghiên cứu gần đây sử dụng dữ liệu XBRL để đo lường các biến kế toán trong việc dự báo về thu nhập hoặc tỷ suất lợi nhuận cổ phiếu (Du và cs, 2022) và một số nghiên cứu kết hợp phân tích tài chính có cấu trúc để đo lường và ngữ cảnh hóa các biến kế toán trong việc triển khai các thuật toán ML (Binz và cs, 2022). Đồng thời, nhấn mạnh tầm quan trọng của việc thực hiện nghiên cứu dữ liệu lớn/ML đối với việc đo lường và định giá tài sản vô hình. Nghiên cứu này được bố cục như sau. Phần 2, dự báo các sai sót tài chính. Phần 3, dự báo về doanh thu và thu nhập. Phần 4, dự báo về rủi ro công ty. Phần 5, sử dụng thông tin kế toán dự báo tỷ suất lợi nhuận. Cuối cùng, kết luận. 2 DỰ BÁO SAI SÓT TÀI CHÍNH * Mô hình dựa trên thông tin định lượng Việc sử dụng dữ liệu lớn/ML giúp dự đoán gian lận hoặc các sai sót tài chính trong báo cáo tài chính đã được nhiều nghiên cứu chứng minh. Nghiên cứu sử dụng phương pháp hồi quy logistic để dự đoán các sai sót tài chính bằng các biến định lượng (Dechow và cs, 2011), những nghiên cứu sử dụng phương pháp ML giúp cải thiện độ chính xác của các ước tính kế toán hoặc chất lượng kiểm toán (Cecchini và cs, 2010; Amiram và cs, 2015; Kim và cs, 2016). Việc phát triển các mô hình để phát hiện gian lận trong báo cáo tài chính sẽ gặp các thách thức liên quan đến (i) các quan sát gian lận khá ít, (ii) các biến giải thích được xác định trong các tài liệu trước đây tương đối đa dạng, (iii) định nghĩa về gian lận rộng. Perols và cs (2017) giới thiệu và đánh giá ba phương pháp tiền xử lý phân tích dữ liệu để giải quyết những thách thức này cụ thể (1) giải quyết sự mất cân bằng giữa số lượng quan sát gian lận thấp so với số lượng quan sát không gian lận, (2) giải quyết sự mất cân bằng giữa số lượng quan sát gian lận thấp so với số lượng biến giải thích được xác định trong tài liệu dự báo gian lận, (3) sử dụng kiến thức tiên nghiệm để phân chia các biến thành các tập hợp con dựa trên mối quan hệ của chúng với các loại gian lận cụ thể. Kết quả, phương pháp thứ nhất và phương pháp thứ ba cải thiện hiệu quả dự báo gian lận khoảng 10% so với các kỹ thuật tốt nhất hiện tại. Dutta và cs (2017) phát triển các mô hình dự báo cho việc tái cơ cấu tài chính có chủ ý (gian lận) và không chủ ý (sai sót) bằng cách sử dụng tập dữ liệu giai đoạn 2001 - 2014. Sử dụng một số kỹ thuật ML (Decision Tree, Artificial Neural Network - ANN, Naïve Bayes, Support Vector Machines - SVM, Bayesian Belief Network) và thấy rằng ANN vượt trội hơn các thuật toán khai thác dữ liệu khác về độ chính xác và khu vực dưới đường cong ROC (receiver operating characteristic). Hajek & Henriques (2017) sử dụng ML để phát triển hệ thống phát hiện gian lận tài chính, các phương pháp tổng hợp tốt hơn các phương pháp khác - các công ty gian lận được phân loại chính xác là gian lận (tỷ lệ dương). Ngược lại, BBN (Bayesian belief networks) hiệu quả trên các công ty không gian lận (tỷ lệ âm). Bao và cs (2020) áp dụng ML vào dữ liệu kế toán thô để phát triển mô hình dự báo gian lận, mô hình này tốt hơn mô hình hồi quy logistic của Dechow và cs (2011). Bertomeu và cs (2020) sử dụng các biến số kế toán, quản trị, kiểm toán, thị trường và kinh doanh để dự báo các sai sót kế toán. Kết quả, các biến số kế toán không phát hiện tốt các sai sót, nhưng chúng quan trọng khi tương tác với các biến số kiểm toán và thị trường. Hunt và cs (2021) sử dụng ML để ước tính khả năng một công ty chuyển đổi kiểm toán viên dựa trên kế toán và các biến số khác (tổng tài sản, các khoản dồn tích tự định, ROA, biến giả M&A, ý kiến kiểm toán, nhiệm kỳ kiểm toán viên, v.v.). Kết quả, công ty có nhiều khả năng chuyển đổi kiểm toán viên thì chất lượng kiểm toán thấp. Các công ty này có khả năng xảy ra sai sót cao hơn và các khoản dồn tích bất thường lớn hơn, nhất quán với việc các kiểm toán viên hy sinh chất lượng kiểm toán để giữ chân những khách hàng có thể chuyển đổi. Liang và cs (2021) áp dụng unsupervised learning để ghi dữ liệu vào sổ nhật ký chung của 04 công ty khác nhau. Các kỹ thuật này có hiệu quả trong việc nhận ra các mẫu trong dữ liệu và phát hiện ra các điểm bất thường bao gồm cả những điểm bất thường do các nhà kiểm toán tạo ra. * Mô hình dựa trên dữ liệu văn bản, giọng nói, hình ảnh hoặc dữ liệu phi cấu trúc Loughran & McDonald (2011) xây dựng danh sách các từ tiêu cực (mất mát, yêu cầu bồi thường, suy yếu, chống lại, bất lợi, tái cấu trúc, kiện tụng, v.v…) để đo trạng thái của tờ khai 10K (báo cáo toàn diện hàng năm - Form 10K). Kết quả, tỷ lệ các từ tiêu cực trong 10K có thể giúp dự báo gian lận, yếu kém trọng yếu và thu nhập bất ngờ. Larcker & Zakolyukina (2012) ước tính các mô hình phân loại dựa trên ngôn ngữ từ các cuộc thảo luận về thu nhập hàng quý. Kết quả, hiệu suất ngoài mẫu của các mô hình dựa trên tường thuật của CEO/CFO
  3. 3 tốt hơn so với phỏng đoán ngẫu nhiên và tương đương với các mô hình dựa trên các biến tài chính và kế toán. Hobson và cs (2012) xem xét các dấu hiệu phi ngôn ngữ (giọng nói) liên quan đến sự bất hòa về nhận thức để phát hiện sai lệch báo cáo tài chính (phần mềm phân tích cảm xúc giọng nói tự động), nhận thấy các dấu hiệu bất hòa ở giọng nói trong bài phát biểu của CEO có quan hệ tích cực đến khả năng xảy ra các trường hợp sửa đổi bất thường. Brown và cs (2020) sử dụng thuật toán Bayes trong việc dự báo các báo cáo sai có chủ ý, thấy rằng thuật toán giúp cải thiện đáng kể việc phát hiện báo cáo tài chính sai. Ryans (2020) sử dụng Naïve Bayesian để xác định các thư nhận xét của Ủy ban Giao dịch và Chứng khoán Mỹ (SEC). Kết quả, kỹ thuật này hoạt động tốt trong việc dự báo các lần sửa lại và loại bỏ. * Ước tính kế toán Ding và cs (2020) sử dụng ML để ước tính và thực hiện dự phòng tổn thất (dữ liệu của các công ty bảo hiểm), ML giúp cải thiện các ước tính của ban quản trị được trình bày trong báo cáo tài chính. Commerford và cs (2022) xem xét việc giảm lời khuyên dựa trên máy móc so với lời khuyên của con người (hai lời khuyên này giống nhau) trong các xét đoán của kiểm toán viên. Kết quả, các kiểm toán viên nhận được bằng chứng mâu thuẫn từ hệ thống AI (thay vì chuyên gia con người) của công ty đề xuất các điều chỉnh nhỏ hơn đối với các ước tính phức tạp của ban giám đốc, đặc biệt khi ban giám đốc phát triển các ước tính của họ bằng cách sử dụng đầu vào tương đối khách quan (so với chủ quan). 3 DỰ BÁO DOANH THU VÀ THU NHẬP 3.1. Công bố định lượng (không bao gồm XBRL) Anand và cs (2019) sử dụng random forest để tạo ra các dự báo ngoài mẫu về những thay đổi tăng/giảm của ROE, ROA, RNOA, CFO, FCF. Kỹ thuật này đạt được độ chính xác đối với các thước đo lợi nhuận (57% - 64%) và đối với kỹ thuật random walk (50%). Các thước đo CFO tốt hơn các thước đo khả năng sinh lời dựa trên thu nhập. Hunt và cs (2019) sử dụng bộ các chỉ số tài chính để dự báo dấu hiệu thay đổi thu nhập của năm tới, random forest giúp cải thiện độ chính xác của dự báo ngoài mẫu so với hồi quy logit từng bước và mạng đàn hồi, và hữu ích để tạo ra lợi nhuận bất thường. van Binsbergen và cs (2020) sử dụng hồi quy random forest để dự báo thu nhập, sự khác biệt giữa kỳ vọng của nhà phân tích và dự báo dựa trên ML có quan hệ ngược chiều với lợi nhuận cổ phiếu trong tương lai. Cao & You (2020) cho rằng các mô hình ML tạo ra các dự báo chính xác và đầy đủ thông tin về thu nhập của công ty hơn so với các mô hình dự báo thu nhập hiện đại nhất (AR, HVZ và SO, EP, RI) trong các tài liệu hiện có. Easton và cs (2021) sử dụng mô hình k-nearest neighbors (k-NN) giản đơn để dự báo thu nhập hàng năm của công ty, cách tiếp cận này hoạt động tốt hơn các mô hình khác (random walk, hồi quy). Hendriock (2021), sử dụng PDF (probability density function) để cung cấp bằng chứng về sự cải thiện đối với độ chính xác và độ chệch của dự báo thu nhập. Sự cải thiện là rất lớn khi các PDF có điều kiện thu được thông qua hồi quy lượng tử, và sự cải thiện còn lớn hơn nữa khi thay thế ANN cho các hồi quy lượng tử. Binz và cs (2022) sử dụng ML để ước tính khung cấu trúc (NP) của Doron Nissim, & Stephen H. Penman (2001). Phương pháp dự báo này chính xác hơn so với các dự báo từ các mô hình chuẩn (benchmark models), và chiến lược đầu tư dựa trên giá trị nội tại được tạo ra từ các dự báo lợi nhuận được điều chỉnh theo rủi ro. 3.2. XBRL (eXtensible Business Reporting Language) Baranes & Palas (2019) sử dụng SVM và dữ liệu tài chính được trích xuất từ XBRL do SEC ủy quyền để dự báo sự thay đổi có xu hướng của EPS. Mô hình này đã phân loại các công ty chính xác khoảng 63.4%, ít hơn so với phương pháp truyền thống SMLR (Stepwise Multivariate Logistic Regression) là 68.1%. Tuy nhiên, hiệu suất của SMLR là tương tự trong các ngành được kiểm tra, trong khi SVM dẫn đến hiệu suất tốt hơn đối với một số ngành. Huang và cs (2019), hồ sơ XBRL (10-K) của các công ty phức tạp hơn khi các công ty hoạt động kém. Hơn nữa, hồ sơ XBRL phức tạp có liên quan đến thu nhập liên tục dương (âm) ít hơn (nhiều hơn). Chen và cs (2022) sử dụng random forests, stochastic gradient boosting và dữ liệu tài chính chi tiết nhiều chiều (XBRL) để dự báo hướng thay đổi thu nhập trong năm tới. Các mô hình này tốt hơn mô hình hồi quy logistic và các tập hợp nhỏ các biến kế toán và dự báo của các nhà phân tích chuyên nghiệp. 3.3. Công bố bằng văn bản
  4. 4 * Báo cáo tài chính Li (2008), cho thấy mối quan hệ tích cực giữa khả năng đọc báo cáo thường niên với mức độ và tính ổn định thu nhập của công ty, trong đó khả năng đọc được đo bằng cách sử dụng độ dài của tài liệu và chỉ số Fog index. Li (2010) kiểm tra nội dung thông tin FLS (forward-looking statements) trong MD&A của hồ sơ 10K và 10Q kết hợp thuật toán Naïve Bayes. Nhóm FLS trung tính có quan hệ tích cực với thu nhập. Các thước đo dựa trên các từ điển thường được sử dụng (Diction, General Inquirer, the Linguistic Inquiry and Word Count) không dự báo tốt hiệu quả trong tương lai. Amel-Zadeh & Faasse (2016) nhận thấy những thay đổi trong văn bản của MD&A và chú thích cuối trang và sự khác biệt giữa ngôn ngữ của hai phần dự báo tỷ suất lợi nhuận và hiệu suất hoạt động. Các nhà đầu tư thường phản ứng thấp với thông tin trong hai phần tường thuật, đặc biệt là đối với thông tin trong phần chú thích. Peterson và cs (2015) sử dụng mô hình không gian vectơ để đo lường tính nhất quán của kế toán được trình bày trong hồ sơ 10K. Tính nhất quán của kế toán theo thời gian có quan hệ tích cực đến tính ổn định của thu nhập, khả năng dự báo, chất lượng dồn tích và các khoản dồn tích tự định tuyệt đối. Lo và cs (2017) sử dụng chỉ số Fog Index để đo lường khả năng đọc và tập trung vào phần MD&A của báo cáo thường niên, các công ty quản lý thu nhập có MD&As phức tạp hơn và chỉ số Fog Index có thể cung cấp thông tin về quản lý thu nhập. Bochkay & Levine (2019) kết hợp các công bố tường thuật trong phần MD&A của báo cáo 10K với các biến tài chính để tạo ra dự báo về ROE trong năm tới, các mô hình có công bố MD&A chính xác hơn các mô hình chỉ sử dụng các biến tài chính định lượng. * Thông cáo báo chí Davis và cs (2012), ngôn ngữ lạc quan trong các thông cáo báo chí về thu nhập có quan hệ tích cực với ROA trong tương lai. Henry & Leone (2016) đánh giá các biện pháp thay thế cho ngôn ngữ của các thông cáo báo chí về thu nhập. Các phương pháp âm tần số từ dựa trên danh sách từ cụ thể theo miền giúp dự báo tốt hơn phản ứng của thị trường đối với các thông báo thu nhập, có sức mạnh thống kê lớn hơn trong các nghiên cứu sự kiện trong thời gian ngắn. * Cuộc gọi đàm phán Li và cs (2021) áp dụng ML vào bảng điểm cuộc gọi thu nhập. Văn hóa doanh nghiệp có quan hệ với kết quả kinh doanh (hiệu quả hoạt động, chấp nhận rủi ro, quản lý thu nhập, thiết kế lương thưởng cho người điều hành, giá trị doanh nghiệp và thực hiện giao dịch) và mối liên hệ giữa văn hóa - hiệu quả rõ ràng hơn trong những thời điểm xấu. * Trang web công ty Lynch & Taylor (2021) phát triển thước đo nội dung trang web công ty (phương pháp nghiên cứu sự kiện). Những thay đổi độc lập trong các trang web công ty cung cấp cho cho các nhà đầu tư những thông tin có giá trị, giảm sự bất cân xứng thông tin và trước những sửa đổi trong dự báo thu nhập của nhà phân tích và tăng mức độ phủ sóng trên các phương tiện truyền thông. 3.4. Báo cáo của nhà phân tích Báo cáo của nhà phân tích thường chứa bốn loại kết quả: (1) Dự báo (EPS, doanh thu, EBITDA, EBIT), (2) Khuyến nghị cổ phiếu, (3) Giá mục tiêu, (4) Dữ liệu và phân tích định lượng và định tính (hỗ trợ cho ba kết quả đầu ra khác). Các nghiên cứu về tài chính và kế toán xem xét các tính chất khác nhau của ba kết quả đầu tiên. Tuy nhiên, gần đây các nghiên cứu điều tra kết quả thứ tư mà các nhà phân tích bên mua coi là quan trọng hơn ba kết quả còn lại thì tương đối ít, điều này đã thay đổi khi dữ liệu lớn/ML ra đời, cụ thể. Huang và cs (2014) sử dụng Naive Bayes để trích xuất ý kiến văn bản từ các báo cáo của nhà phân tích. Các báo cáo này ngoài việc cung cấp các thông tin dự báo thu nhập, khuyến nghị cổ phiếu và giá mục tiêu còn giải thích các tín hiệu này cho nhà đầu tư. Cuối cùng, văn bản báo cáo của nhà phân tích được chứng minh là có giá trị dự báo về tăng trưởng thu nhập trong tương lai (5 năm tới). Bellstam và cs (2021) phát triển thước đo đổi mới (công ty có và không có bằng sáng chế và R&D) cho các công ty S&P 500. Phép đo dựa trên văn bản dự báo hiệu quả hoạt động của công ty và cơ hội tăng trưởng (tối đa trong bốn năm) cao và những hàm ý giá trị này cũng có tác động mạnh đối với các công ty đổi mới sáng tạo. 3.5. Phương tiện truyền thông
  5. 5 Một số nghiên cứu cung cấp bằng chứng về tính hữu ích của nội dung truyền thông trong việc dự báo thu nhập và tỷ suất lợi nhuận. Tetlock và cs (2008) nhận thấy (i) các từ tiêu cực từ các bản tin dự báo thu nhập của công ty thấp, (ii) giá cổ phiếu của các công ty trong thời gian ngắn phản ứng thấp với thông tin được nhúng trong các từ tiêu cực, (iii) khả năng dự báo thu nhập và lợi nhuận từ các từ tiêu cực là lớn nhất đối với các tin tập trung vào các nguyên tắc cơ bản. Những phát hiện này kết hợp với nhau cho thấy nội dung truyền thông ngôn ngữ liên quan các khía cạnh khó định lượng trong các nguyên tắc cơ bản của công ty được các nhà đầu tư nhanh chóng đưa vào giá cổ phiếu. 3.6. Web, vệ tinh, GPS, ping trên điện thoại di động và dữ liệu tương tự Froot và cs (2017) sử dụng dữ liệu từ MKT Mediastats và LLC để ước tính thời gian thực về doanh số bán hàng của các công ty bán lẻ lớn Mỹ. Các biện pháp này giải thích sự tăng trưởng doanh số hàng quý, doanh thu bất ngờ và thu nhập bất ngờ, tạo ra lợi nhuận thông báo vượt mức trung bình (3.4%). Katona và cs (2018) nhận thấy dữ liệu vệ tinh cho phép các nhà đầu tư thuần thục trong việc hình thành các chiến lược sinh lời, đặc biệt bằng cách nhắm mục tiêu vào các báo cáo quý của các nhà bán lẻ có tin xấu. Kang và cs (2021), số lượng ô tô trong bãi đậu xe của các cửa hàng (đo bằng dữ liệu vệ tinh) là một thước đo hữu ích về hiệu suất ở cấp cửa hàng, và một số nhà đầu tư tổ chức đã kinh doanh và thu lợi nhuận từ thông tin này. Jin và cs (2021), sử dụng dữ liệu GPS từ thiết bị di động của khách hàng để phát triển thước đo về lòng trung thành của khách hàng, nhận thấy doanh thu và thu nhập ổn định hơn khi khách hàng trung thành hơn. Noh và cs (2021) cũng sử dụng dữ liệu GPS, cho thấy lưu lượng người đến các địa điểm thương mại của các công ty bán hàng giảm sau khi báo cáo kết quả tài chính cho thấy rủi ro khả năng thanh toán tăng (đo bằng Altman Z-score). Li và Venkatachalam (2022) sử dụng tập dữ liệu gồm các “ping” trên điện thoại di động (tín hiệu định vị địa lý từ các thiết bị di động) để theo dõi sự gián đoạn sản xuất (ngừng hoạt động) đối với các nhà máy lọc dầu Mỹ. Kết quả (i) các công ty lọc dầu không tự nguyện tiết lộ sự cố ngừng hoạt động, (ii) phương tiện truyền thống chỉ bao gồm một phần nhỏ các trường hợp ngừng hoạt động dựa trên ping, (iii) thị trường chứng khoán nhận thấy việc ngừng hoạt động dựa trên ping có giá trị phù hợp nhưng kết hợp thông tin với độ trễ. Do phương tiện truyền thông đưa tin không đầy đủ và thiếu thông tin công bố rõ ràng, các nhà đầu tư tìm hiểu tác động tài chính của việc ngừng hoạt động thông qua các công bố thu nhập sau đó. 3.7. Dữ liệu cấp độ giao dịch Dichev & Qian (2021) tìm hiểu dữ liệu chi tiết mua hàng hàng tuần của người tiêu dùng từ dữ liệu máy quét RMS (Retail Measurement Services), xây dựng thước đo mua hàng của người tiêu dùng cấp công ty và nhận thấy thước đo này dự báo hiệu quả doanh thu của nhà sản xuất cũng như các lỗi dự báo doanh thu và lợi nhuận hàng tồn kho của nhà phân tích. Blankespoor và cs (2022) sử dụng doanh số bán hàng qua thẻ tín dụng và thẻ ghi nợ ở cấp độ giao dịch của các công ty bán lẻ để xây dựng thước đo doanh thu bất thường hàng tuần cho mỗi công ty. Kết quả, thước đo này có tương quan với lợi nhuận bất thường, kết quả doanh thu bất ngờ và tin tức dự báo doanh thu của hội đồng quản trị. 3.8. Nguồn cung ứng cộng đồng * Nhà đầu tư Chen và cs (2014) xem xét ý kiến của nhà đầu tư trên mạng xã hội để dự báo tỷ suất lợi nhuận tương lai và thu nhập bất ngờ. Quan điểm được thể hiện trong các bài báo và bài bình luận đều dự báo tỷ suất lợi nhuận cổ phiếu và thu nhập bất ngờ trong tương lai. Jame và cs (2016) nhận thấy dự báo thu nhập do Estimize cung cấp là hữu ích trong việc dự báo thu nhập. Kết quả sẽ mạnh hơn khi số lượng cộng tác viên của Estimize lớn hơn, phù hợp với lợi ích của nguồn cung ứng cộng đồng ngày càng tăng theo quy mô của đám đông. Bartov và cs (2018) kiểm tra ý kiến của các cá nhân đã tweet trước khi thu nhập của công ty được công bố đối với việc dự báo thu nhập và tỷ suất lợi nhuận cổ phiếu. Ý kiến tổng hợp từ các tweet riêng lẻ dự báo tốt thu nhập và tỷ suất lợi nhuận hàng quý. Drake và cs (2020) kiểm tra hành động thu thập thông tin kế toán của nhà đầu tư trong việc dự báo hiệu quả hoạt động của công ty trong tương lai (thu nhập bất ngờ và các biện pháp khác), bằng việc sử dụng cơ sở dữ liệu của EDGAR tải xuống. Việc thu thập thông tin báo cáo kế toán của người dùng EDGAR (quỹ đầu cơ, ngân hàng đầu tư) có thể dự báo tốt hiệu quả hoạt động của công ty trong tương lai. * Người tiêu dùng Huang (2018) sử dụng bộ dữ liệu đánh giá sản phẩm trên Amazon.com và kết luận rằng ý kiến của người tiêu dùng giúp dự báo doanh thu, thu nhập và tỷ suất lợi nhuận.
  6. 6 * Người lao động Green và cs (2019), những thay đổi trong xếp hạng nhà tuyển dụng có liên quan đến tăng trưởng doanh số và lợi nhuận, đồng thời giúp dự báo những bất ngờ về công bố thu nhập và tỷ suất lợi nhuận. Huang và cs (2020) nhận thấy dự báo của nhân viên về triển vọng kinh doanh sáu tháng của công ty (Glassdoor.com) có thể hữu ích trong việc dự báo hiệu suất hoạt động trong tương lai. 4 DỰ BÁO RỦI RO Rogers và cs (2011), kiểm tra mối quan hệ giữa ngôn ngữ công bố (đo bằng text dictionaries) và vụ kiện tụng của cổ đông để xác định việc sử dụng ngôn ngữ lạc quan của các nhà quản lý có làm tăng rủi ro kiện tụng. Các nguyên đơn nhắm vào các tuyên bố lạc quan trong các vụ kiện của họ và các thông báo thu nhập của các công ty bị kiện là lạc quan bất thường so với các công ty khác đang gặp hoàn cảnh kinh tế tương tự. Florackis và cs (2020), sử dụng phân tích văn bản và so sánh các công bố về rủi ro an ninh mạng của các công ty đã bị tấn công với các công ty không bị tấn công để xây dựng thước đo về rủi ro an ninh mạng. Rủi ro an ninh mạng có quan hệ tích cực với tỷ suất lợi nhuận, và các công ty có mức độ phơi nhiễm cao sẽ hoạt động kém trong những giai đoạn có rủi ro an ninh mạng cao. Thước đo này cho kết quả cao hơn trong các ngành công nghệ thông tin, tương quan với các đặc điểm liên quan đến các công ty bị tấn công mạng và dự báo các cuộc tấn công mạng trong tương lai. Donovan và cs (2021) sử dụng ML để tạo ra thước đo rủi ro tín dụng dựa trên thông tin định tính được công bố trong các cuộc gọi hội nghị và trong phần MD&A của 10K. Trong các thử nghiệm ngoài mẫu, họ nhận thấy biện pháp này cải thiện khả năng dự báo các sự kiện tín dụng (phá sản, chênh lệch lãi suất và hạ bậc xếp hạng tín dụng) so với các biện pháp rủi ro tín dụng được phát triển bởi nghiên cứu trước (z- score). 5 SỬ DỤNG THÔNG TIN KẾ TOÁN ĐỂ DỰ BÁO TỶ SUẤT LỢI NHUẬN * Các yếu tố định lượng Kryzanowski và cs (1993) sử dụng ANN để tìm hiểu mối quan hệ giữa tỷ suất lợi nhuận cổ phiếu trong năm tới và dữ liệu tài chính bốn năm gần đây nhất cho công ty và ngành, thuật toán ANN phân loại chính xác 72% lợi nhuận dương/âm. Yan & Zheng (2017) kiểm tra các tín hiệu cơ bản từ các báo cáo tài chính và sử dụng phương pháp bootstrap để đánh giá tác động của việc khai thác dữ liệu, nhiều tín hiệu cơ bản là những yếu tố dự báo quan trọng về tỷ suất lợi nhuận. Khả năng dự báo này rõ ràng hơn khi các cổ phiếu có giới hạn chênh lệch giá cao hơn. Amel-Zadeh và cs (2020) so sánh các mô hình ML trong việc dự báo lợi nhuận bất thường xung quanh các thông báo thu nhập. Random Forests đưa ra dự báo lợi nhuận bất thường chính xác nhất. Các mô hình dựa trên mạng nơ-ron hoạt động tốt hơn trong việc dự báo các phản ứng cực đoan của thị trường, trong khi các phương pháp tuyến tính tương đối tốt trong việc dự báo phản ứng thị trường vừa phải. Các danh mục đầu tư dài hạn dựa trên các dự báo của mô hình tạo ra lợi nhuận bất thường khá lớn (giảm dần theo thời gian). Geertsema & Lu (2021) sử dụng ML để xác định các công ty có thể so sánh và tiến hành định giá tương đối. Cách tiếp cận ML xác định các động lực định giá phù hợp với lý thuyết - tỷ suất sinh lời, các biện pháp tăng trưởng và tỷ lệ hiệu quả là các động lực giá trị quan trọng nhất. Chen và cs (2021) sử dụng DNN (deep neural networks) để ước tính mô hình định giá tài sản cho tỷ suất lợi nhuận cổ phiếu riêng lẻ, mô hình định giá tài sản hoạt động tốt hơn tất cả các phương pháp tiếp cận tiêu chuẩn ngoài mẫu về tỷ lệ Sharpe, sự thay đổi được giải thích và lỗi định giá. Du và cs (2022), so sánh thông tin của các hồ sơ (XBRL) được ủy quyền bởi SEC, có thể đọc được bằng máy hoặc dữ liệu được lưu trữ với Compustat. Các khoản tích lũy được tính từ dữ liệu lưu trữ giúp dự báo lợi nhuận còn các khoản tích lũy được tính từ dữ liệu Compustat thì không. Các tài liệu tham khảo về bốn điểm bất thường dựa trên kế toán khác cũng bị ảnh hưởng tương tự do sự khác biệt giữa các nguồn dữ liệu. * Các biện pháp dựa trên văn bản Feldman và cs (2009) sử dụng sơ đồ phân loại các từ tích cực và tiêu cực để đo lường sự thay đổi ngôn ngữ trong phần MD&A của mẫu 10-Q và 10-K so với các hồ sơ định kỳ của SEC, sự thay đổi ngôn ngữ của nhà quản trị sẽ ảnh hưởng đến lợi nhuận của danh mục đầu tư trong khoảng thời gian 2 ngày sau ngày nộp hồ sơ lên SEC cho đến 1 ngày sau khi công bố thu nhập sơ bộ của quý tiếp theo.
  7. 7 Cohen và cs (2020), những thay đổi đối với ngôn ngữ và cách xây dựng báo cáo tài chính có ý nghĩa đối với lợi nhuận và hoạt động trong tương lai của các công ty. Hơn nữa, các thay đổi đối với 10K giúp dự báo thu nhập trong tương lai, khả năng sinh lời, thông báo tin tức trong tương lai và những vụ phá sản cấp công ty trong tương lai. Meursault và cs (2021) phát triển thước đo lợi nhuận bất ngờ bằng tin nhắn cuộc gọi (SUE.txt) và liên kết văn bản với phản ứng của thị trường xung quanh cuộc gọi. SUE.TXT tạo ra sự thay đổi về lợi nhuận trên giấy tờ (PEAD.txt) lớn hơn cách tính PEAD theo cách cổ điển. Cao và cs (2021), AI tốt hơn các nhà phân tích con người về dự báo giá cổ phiếu và tạo ra lợi nhuận vượt mức. Bonini và cs (2021), xử lý một lượng lớn báo cáo của nhà phân tích bên bán kết hợp với ML. Không giống như mô hình tuyến tính đơn giản, mô hình ML phi tuyến tạo ra các alpha dương và có ý nghĩa. Chiến lược danh mục đầu tư dài-ngắn có mối tương quan cao với R&D, đòn bẩy và nắm giữ tiền mặt. 6 KẾT LUẬN Mặc dù các nghiên cứu trên cung cấp nhiều bằng chứng về việc sử dụng dữ liệu lớn/ML để cung cấp hoặc trích xuất thông tin chi tiết từ các biến kế toán, nhưng có một số lĩnh vực quan trọng vẫn còn tương đối ít được chú ý. Nghiên cứu này trình bày về hai chủ đề (1) sử dụng dữ liệu lớn/ML để đo lường nguyên giá và phân bổ giá trị tài sản vô hình, (2) sự kết hợp cấu trúc kinh tế, tài chính và kế toán trong việc triển khai các thuật toán ML. S.P Kothari và cs (2002), giá trị tài sản vô hình rất khó đo lường vì dòng tiền liên quan đến các khoản đầu tư vào tài sản vô hình ít chắc chắn hơn so vào tài sản cố định. Arnott và cs (2021), sự yếu kém trong việc đo lường giá trị tài sản vô hình thập kỷ qua là do các biện pháp kế toán (thu nhập và giá trị sổ sách) không nắm bắt được mức độ quan trọng của tài sản vô hình. Tuy nhiên, những hạn chế trên đã dần khả thi hơn theo thời gian nhờ việc sử dụng dữ liệu lớn/ML, nhưng các nghiên cứu sử dụng dữ liệu lớn/ML cung cấp bằng chứng về nguyên giá hoặc giá trị phân bổ của tài sản vô hình tương đối ít. Các nghiên cứu về sự phát triển ML/dữ liệu lớn hàm ý sự phong phú của dữ liệu sẵn có và sự tiến bộ cua ML tạo điều kiện thuận lợi trong việc trích suất, phân tích thông tin kế toán chi tiết và hỗ trợ người dùng trong việc ra quyết định. Mặc dù dữ liệu lớn, dữ liệu thay thế và các công cụ phân tích hiện đại ngày càng quan trọng, nhưng chúng chỉ nên bổ sung không nên thay thế cho dữ liệu và phân tích truyền thống. Do đó, kết hợp cả hai hoặc nhiều cách tổng quát hơn (từ con người so với máy móc đến con người cộng với máy móc) sẽ mang lại kết quả vượt trội (Cao và cs, 2021). Các nghiên cứu chứng minh lợi ích của việc kết hợp cấu trúc tài chính và kế toán, kiến thức chuyên gia vào phân tích gồm Binz và cs (2022), sử dụng phân tích khả năng sinh lời có cấu trúc và nhận thấy phương pháp này dự báo chính xác hơn; Du và cs (2022), việc đo lường kỹ các biến kế toán (XBRL) giúp cải thiện khả năng dự báo tỷ suất lợi nhuận cổ phiếu; Nissim (2022a, 2022b,2022c) đi sâu vào phát triển, đo lường và bối cảnh hóa các yếu tố kế toán dựa trên các thuật toán ML; Chen và cs (2021), sử dụng ML (mạng lưới thần kinh sâu) để ước tính mô hình định giá tài sản cho các cổ phiếu riêng lẻ. Cuối cùng, nếu thời gian huấn luyện máy móc không gồm các sự kiện kinh tế nổi bật thì các ước tính có khả năng không chính xác cao. Do đó, để khắc phục nên kết hợp các cân nhắc kinh tế, tài chính và kế toán vào ước tính bằng cách (i) lựa chọn cẩn thận, định nghĩa và đo lường các biến; (ii) áp đặt cấu trúc đối với các thông số kỹ thuật; (iii) điều chỉnh các biến và thông số kỹ thuật phù hợp với ngữ cảnh; (iv) mô hình hóa các tác động nhân quả hoặc bán nhân quả khi việc xác định như vậy là khả thi. TÀI LIỆU THAM KHẢO Amel-Zadeh, A., & Faasse, J. (2016). The Information Content of 10-K Narratives: Comparing MD&A and Footnotes Disclosures. Available at: SSRN 2807546. Amel-Zadeh, A., Calliess, J.P., Kaiser, D., & Roberts, S. (2020). Machine Learning-Based Financial Statement Analysis. Available at: SSRN 3520684. Amiram, D., Bozanic, Z., & Rouen, E. (2015). Financial statement errors: evidence from the distributional properties of financial statement numbers. Review of Accounting Studies, 20(4), 1540–1593. https://doi.org/ 10.1007/s11142-015-9333-z Anand, V., Brunner, R., Ikegwu, K., & Sougiannis, T. (2019). Predicting Profitability Using Machine Learning. Available at: SSRN 3466478. Arnott, R. D., Harvey, C. R., Kalesnik, V., & Linnainmaa, J. T. (2021). Reports of Value’s Death May Be Greatly Exaggerated. Financial Analysts Journal, 77(1), 44–67. https://doi.org/10.1080/0015198X.2020.1842704 Bao, Y., Ke, B., Li, B., Yu, Y. J., & Zhang, J. (2020). Detecting Accounting Fraud in Publicly Traded U.S. Firms Using a Machine Learning Approach. Journal of Accounting Research, 58(1), 199–235. https://doi.org/ 10.1111/1475-679X.12292
  8. 8 Baranes, A., & Palas, R. (2019). Earning movement prediction using machine learning-support vector ma- chines (SVM). Academy of Information and Management Sciences Journal, 22(2), 36–53. Bartov, E., Faurel, L., & Mohanram, P. S. (2018). Can Twitter Help Predict Firm-Level Earnings and Stock Returns? The Accounting Review, 93(3), 25–57. https://doi.org/10.2308/accr-51865 Bellstam, G., Bhagat, S., & Cookson, J. A. (2021). A Text-Based Analysis of Corporate Innovation. Man- agement Science, 67(7), 4004–4031. https://doi.org/10.1287/mnsc.2020.3682 Bertomeu, J., Cheynel, E., Floyd, E., & Pan, W. (2020). Using machine learning to detect misstate- ments. Review of Accounting Studies, 26(2), 468–519. https://doi.org/10.1007/s11142-020-09563-8 Binz, O., Schipper, K., & Standridge, K. (2022). What can analysts learn from artificial intelligence about fundamental analysis? https://ssrn.com/ abstract¼3745078 Blankespoor, E., Hendricks, B.E., Piotroski, J.D., & Synn, C. (2022). Real-time Revenue and Firm Disclo- sure. Available at: SSRN. Bochkay, K., & Levine, C. B. (2019). Using MD&A to Improve Earnings Forecasts. Journal of Account- ing, Auditing & Finance, 34(3), 458–482. https://doi.org/10.1177/0148558X17722919 Bonini, S., Gultekin, M., Shohfi, T., & Simaan, M. (2021). Analysts, Fundamentals, and Portfolio Selec- tion: A Machine Learning Approach. Available at: SSRN 3399746. Breuer, M., & Schütt, H. (2021). Accounting for uncertainty: An application of Bayesian methods to ac - cruals models. Review of Accounting Studies. https://doi.org/10.1007/s11142-021-09654-0 Brown, N. C., Crowley, R. M., & Elliott, W. B. (2020). What Are You Saying? Using topic to Detect Fi - nancial Misreporting. Journal of Accounting Research, 58(1), 237–291. https://doi.org/10.1111/1475-679X.12294 Cao, K., &You, H. (2020). Fundamental Analysis via Machine Learning. Working Paper. Cao, S., Jiang, W., Wang, J.L., & Yang, B. (2021). From Man vs. Machine to Manþ Machine: The Art and Ai of Stock Analyses (No. W28800). National Bureau of Economic Research. Cecchini, M., Aytug, H., Koehler, G. J., & Pathak, P. (2010). Detecting Management Fraud in Public Companies. Management Science, 56(7), 1146–1160. https://doi.org/10.1287/mnsc.1100.1174 Chen, H., De, P., Hu, Y. (Jeffrey), & Hwang, B.-H. (2014). Wisdom of Crowds: The Value of Stock Opin- ions Transmitted Through Social Media. The Review of Financial Studies, 27(5), 1367–1403. https://doi.org/ 10.1093/rfs/hhu001 Chen, L., Pelger, M., & Zhu, J. (2021). Deep learning in asset pricing. Working Paper. Available at: https://arxiv.org/pdf/1904.00745.pdf Chen, X., Cho, Y. H. (Tony), Dou, Y., & Lev, B. (2022). Predicting Future Earnings Changes Using Ma- chine Learning and Detailed Financial Data. Journal of Accounting Research, 60(2), 467–515. https://doi.org/ 10.1111/1475-679X.12429 Cohen, L., Malloy, C., & Nguyen, Q. (2020). Lazy Prices. The Journal of Finance (New York), 75(3), 1371–1415. https://doi.org/10.1111/jofi.12885 Commerford, B. P., Dennis, S. A., Joe, J. R., & Ulla, J. W. (2022). Man Versus Machine: Complex Esti - mates and Auditor Reliance on Artificial Intelligence. Journal of Accounting Research, 60(1), 171–201. https:// doi.org/10.1111/1475-679X.12407 Davis, A. K., Piger, J. M., & Sedor, L. M. (2012). Beyond the Numbers: Measuring the Information Con- tent of Earnings Press Release Language. Contemporary Accounting Research, 29(3), 845–868. https://doi.org/ 10.1111/j.1911-3846.2011.01130.x Dechow, P. M., Ge, W., Larson, C. R., & Sloan, R. G. (2011). Predicting Material Accounting Misstate - ments. Contemporary Accounting Research, 28(1), 17–82. https://doi.org/10.1111/j.1911-3846.2010.01041.x Dichev, I.D., & Qian, J. (2021). The Benefits of Transaction-Level Data: The Case of Nielsen Scanner Data. Available at: SSRN 3740052. Ding, K., Lev, B., Peng, X., Sun, T., & Vasarhelyi, M. A. (2020). Machine learning improves accounting estimates: evidence from insurance payments. Review of Accounting Studies, 25(3), 1098–1134. https://doi.org/ 10.1007/s11142-020-09546-9 Donovan, J., Jennings, J., Koharki, K., & Lee, J. (2021). Measuring credit risk using qualitative disclo - sure. Review of Accounting Studies, 26(2), 815–863. https://doi.org/10.1007/s11142-020-09575-4 Doron Nissim, & Stephen H. Penman. (2001). Ratio Analysis and Equity Valuation: From Research to Practice. Review of Accounting Studies, 6(1), 109–. Drake, M. S., Johnson, B. A., Roulstone, D. T., & Thornock, J. R. (2020). Is There Information Content in Information Acquisition? The Accounting Review, 95(2), 113–139. https://doi.org/10.2308/accr-52498 Du, K., Huddart, S.J., & Jiang, D. (2022). Lost in Standardization: Revisiting Accounting-Based Return Anomalies Using As-Filed Financial Statement Data. Available at: SSRN 3781979. Dutta, I., Dutta, S., & Raahemi, B. (2017). Detecting financial restatements using data mining tech- niques. Expert Systems with Applications, 90, 374–393. https://doi.org/10.1016/j.eswa.2017.08.030 Easton, P.D., Kapons, M., Monahan, S.J., Schutt, H.H., & Weisbrod, E.H. (2021). Forecasting Earnings Using K-Nearest Neighbor Matching. Available at: SSRN 3752238.
  9. 9 European Commission. (2018). Directorate-General for Justice and Consumers, the EU Data Protection Reform and Big Data. Publications Office. https://data.europa.eu/doi/10.2838/190200. Favaretto, M., De Clercq, E., Schneble, C. O., & Elger, B. S. (2020). What is your definition of Big Data? Researchers’ understanding of the phenomenon of the decade. PloS One, 15(2), e0228987–e0228987. https:// doi.org/10.1371/journal.pone.0228987 Feldman, R., Govindaraj, S., Livnat, J., & Segal, B. (2009). Management’s tone change, post-earnings an- nouncement drift, and accruals. Review of Accounting Studies, 15(4), 915–953. https://doi.org/10.1007/s11142-009- 9111-x Florakis, C., Louca, C., Michaely, R., & Weber, M. (2020). Cybersecurity Risk (No. W28196). National Bureau of Economic Research. Froot, K., Kang, N., Ozik, G., & Sadka, R. (2017). What do measures of real-time corporate sales say about earnings surprises and post-announcement returns? Journal of Financial Economics, 125(1), 143–162. https://doi.org/10.1016/j.jfineco.2017.04.008 Geertsema, P., & Lu, H. (2021). Relative Valuation with Machine Learning. Available at: SSRN 3740270. Green, T. C., Huang, R., Wen, Q., & Zhou, D. (2019). Crowdsourced employer reviews and stock re- turns. Journal of Financial Economics, 134(1), 236–251. https://doi.org/10.1016/j.jfineco.2019.03.012 Hajek, P., & Henriques, R. (2017). Mining corporate annual reports for intelligent detection of financial statement fraud – A comparative study of machine learning methods. Knowledge-Based Systems, 128, 139–152. https://doi.org/10.1016/j.knosys.2017.05.001 Hendriock, M. (2021). Forecasting Earnings with Predicted, Conditional Probability Density Functions. Available at: SSRN 3901386. Henry, E., & Leone, A. J. (2016). Measuring Qualitative Information in Capital Markets Research: Com- parison of Alternative Methodologies to Measure Disclosure Tone. The Accounting Review, 91(1), 153–178. https://doi.org/10.2308/accr-51161 Hobson, J. L., Mayew, W. J., & Venkatachalam, M. (2012). Analyzing Speech to Detect Financial Misre- porting. Journal of Accounting Research, 50(2), 349–392. https://doi.org/10.1111/j.1475-679X.2011.00433.x Huang, A. H., Zang, A. Y., & Zheng, R. (2014). Evidence on the Information Content of Text in Analyst Reports. The Accounting Review, 89(6), 2151–2180. https://doi.org/10.2308/accr-50833 [47] Huang, F., No, W. G., & Vasarhelyi, M. A. (2019). Do Managers Use Extension Elements Strategically in the SEC’s Tagged Data for Financial Statements? Evidence from XBRL Complexity. The Journal of Information Sys- tems, 33(3), 61–74. https://doi.org/10.2308/isys-52162 [48] Huang, J. (2018). The customer knows best: The investment value of consumer opinions. Journal of Financial Economics, 128(1), 164–182. https://doi.org/10.1016/j.jfineco.2018.02.001 [49] Huang, K., Li, M., & Markov, S. (2020). What Do Employees Know? Evidence from a Social Media Plat- form. The Accounting Review, 95(2), 199–226. https://doi.org/10.2308/accr-52519 [50] Hunt, J. O., Rosser, D. M., & Rowe, S. P. (2021). Using machine learning to predict auditor switches: How the likelihood of switching affects audit quality among non-switching clients. Journal of Accounting and Public Pol- icy, 40(5), 106785–. https://doi.org/10.1016/j.jaccpubpol.2020.106785 [51] Hunt, J., Myers, J., & Myers, L. (2019). Improving earnings predictions with machine learning. Unpubl. Work. Pap. [52] Jame, R., Johnston, R., Markov, S., & Wolfe, M. C. (2016). The Value of Crowdsourced Earnings Fore- casts. Journal of Accounting Research, 54(4), 1077–1110. https://doi.org/10.1111/1475-679X.12121 [53] Jin, H., Stubben, S., & Ton, K. (2021). Customer Loyalty and the Persistence of Revenues and Earnings. Avail- able at: SSRN 3744417. [54] Kang, J. K., Stice‐Lawrence, L., & Wong, Y. T. F. (2021). The Firm Next Door: Using Satellite Images to Study Local Information Advantage. Journal of Accounting Research, 59(2), 713–750. https://doi.org/ 10.1111/1475-679X.12360 [55] Karpoff, J. M., Lee, D. S., & Martin, G. S. (2008). The Cost to Firms of Cooking the Books. Journal of Finan- cial and Quantitative Analysis, 43(3), 581–611. https://doi.org/10.1017/S0022109000004221 [56] Katona, Z., Painter, M., Patatoukas, P.N., & Zeng, J. (2018). On the capital market consequences of alternative data: evidence from outer space. In: 9th Miami Behavioral Finance Conference. [57] Kim, Y. J., Baik, B., & Cho, S. (2016). Detecting financial misstatements with fraud intention using multi-class cost-sensitive learning. Expert Systems with Applications, 62, 32–43. https://doi.org/10.1016/j.eswa.2016.06.016 [58] Kryzanowski, L., Galler, M., & Wright, D. W. (1993). Using Artificial Neural Networks to Pick Stocks. Finan- cial Analysts Journal, 49(4), 21–27. https://doi.org/10.2469/faj.v49.n4.21. Nissim The Journal of Finance and Data Science 8 (2022) 69–85 84 [59] Larcker, D. F., & Zakolyukina, A. A. (2012). Detecting Deceptive Discussions in Conference Calls. Journal of Accounting Research, 50(2), 495–540. https://doi.org/10.1111/j.1475-679X.2012.00450.x [60] Li, B., & Venkatachalam, M. (2022). Leveraging Big Data to Study Information Dissemination of Material Firm Events. Journal of Accounting Research, 60(2), 565–606. https://doi.org/10.1111/1475-679X.12419 [61] Li, F. (2008). Annual report readability, current earnings, and earnings persistence. Journal of Accounting & Economics, 45(2), 221–247. https://doi.org/10.1016/j.jacceco.2008.02.003
  10. 10 [62] Li, F. (2010). The Information Content of Forward-Looking Statements in Corporate Filings-A Naïve Bayesian Machine Learning Approach. Journal of Accounting Research, 48(5), 1049–1102. https://doi.org/10.1111/j.1475- 679X.2010.00382.x [63] Li, K., Mai, F., Shen, R., & Yan, X. (2021). Measuring Corporate Culture Using Machine Learning.  The Re- view of Financial Studies, 34(7), 3265–3315. https://doi.org/10.1093/rfs/hhaa079 [64] Liang, P.J., Wang, A., Akoglu, L., & Faloutsos, C. (2021). Pattern Recognition and Anomaly Detection in Bookkeeping Data. Carnegie Mellon University. Working Paper. [65] Lo, K., Ramos, F., & Rogo, R. (2017). Earnings management and annual report readability. Journal of Ac- counting & Economics, 63(1), 1–25. https://doi.org/10.1016/j.jacceco.2016.09.002 [66] Lynch, B., & Taylor, D.J. (2021). The Information Content of Corporate Websites. Available at: SSRN 3791474. [67] Meursault, V., Liang, P.J., Routledge, B., & Scanlon, M. (2021). PEAD. Txt: Post-Earnings-Announcement Drift Using Text. Available at: SSRN 3778798. [68] Nissim, D. (2022a). Earnings Quality. Columbia Business School. Available at: https://ssrn.com/ abstract¼3794378 [69] Nissim, D. (2022b). Profitability Analysis. Columbia Business School. Available at: https://ssrn.com/ abstract¼4064824. [70] Nissim, D. (2022c). Reformulated Financial Statements. Columbia Business School. Available at: https://ssrn.- com/abstract¼4064722 [71] Noh, S., So, E.C., & Zhu, C. (2021). Financial Reporting and Consumer Behavior. Available at: SSRN. [72] Perols, J. L., Bowen, R. M., Zimmerman, C., & Samba, B. (2017). Finding Needles in a Haystack: Using Data Analytics to Improve Fraud Prediction. The Accounting Review, 92(2), 221–245. https://doi.org/10.2308/accr-51562 [73] Peterson, K., Schmardebeck, R., & Wilks, T. J. (2015). The Earnings Quality and Information Processing Ef - fects of Accounting Consistency. The Accounting Review, 90(6), 2483–2514. https://doi.org/10.2308/accr-51048 [74] Rogers, J. L., Van Buskirk, A., & Zechman, S. L. C. (2011). Disclosure Tone and Shareholder Litigation.  The Accounting Review, 86(6), 2155–2183. https://doi.org/10.2308/accr-10137 [75] Ryans, J. P. (2020). Textual classification of SEC comment letters. Review of Accounting Studies, 26(1), 37–80. https://doi.org/10.1007/s11142-020-09565-6 [76] S. P. Kothari, Ted E. Laguerre, & Andrew J. Leone. (2002). Capitalization versus Expensing: Evidence on the Uncertainty of Future Earnings from Capital Expenditures versus R&D Outlays. Review of Accounting Studies, 7(4), 355–. [77] Tetlock, P. C., Saar-Tsechansky, M., & Macskassy, S. (2008). More Than Words: Quantifying Language to Measure Firms’ Fundamentals. The Journal of Finance (New York), 63(3), 1437–1467. https://doi.org/10.1111/ j.1540-6261.2008.01362.x [78] van Binsbergen, J.H., Han, X., Lopez-Lira, A. (2020). Man Vs. Machine Learning: The Term Structure of Earnings Expectations and Conditional Biases (No. W27843). National Bureau of Economic Research. [79] Yan, X. (Sterling), & Zheng, L. (2017). Fundamental Analysis and the Cross-Section of Stock Returns: A Data- Mining Approach. The Review of Financial Studies, 30(4), 1382–1423. https://doi.org/10.1093/rfs/hhx001
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
7=>1