intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Tóm tắt Luận án Tiến sĩ Kinh tế học: Tiếp cận Machine Learning trong quản trị danh mục trên thị trường chứng khoán Việt Nam

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:24

2
lượt xem
1
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tóm tắt Luận án Tiến sĩ Kinh tế học "Tiếp cận Machine Learning trong quản trị danh mục trên thị trường chứng khoán Việt Nam" được nghiên cứu với mục tiêu: Xây dựng danh mục tối ưu sử dụng các phương pháp học máy kết hợp với bài toán tối ưu Markowitz và đánh giá hiệu quả của các phương pháp này trong các bối cảnh khác nhau của thị trường Việt Nam. Từ đó đề xuất các khuyến nghị cho các nhà đầu tư trong quản trị danh mục cũng như các nhà nghiên cứu thực nghiệm trên thị trường chứng khoán Việt Nam.

Chủ đề:
Lưu

Nội dung Text: Tóm tắt Luận án Tiến sĩ Kinh tế học: Tiếp cận Machine Learning trong quản trị danh mục trên thị trường chứng khoán Việt Nam

  1. 1 LỜI MỞ ĐẦU 1. Lý do lựa chọn đề tài Quản trị danh mục đầu tư trên thị trường chứng khoán là một nhiệm vụ khó khăn do thị trường luôn biến động phức tạp. Việc quản trị danh mục đầu tư gồm các bước tích hợp, bao gồm: xác định mục tiêu và kế hoạch đầu tư; xây dựng danh mục đầu tư; và đánh giá danh mục và thực hiện các điều chỉnh cần thiết. Trong các bước này, việc xây dựng danh mục đầu tư là một khâu quan trọng. Các quan điểm và phương pháp lựa chọn danh mục đã được phát triển qua các giai đoạn lịch sử. Trong đó, sự đa dạng hóa của danh mục đầu tư nhận được sự quan tâm từ phía các nhà nghiên cứu và cả các nhà đầu tư. Quan điểm đa dạng hóa danh mục đầu tư được bắt nguồn từ công trình của Harry Markowitz (Markowitz, 1952). Lý thuyết danh mục hiện đại với cốt lõi là bài toán phân tích Trung bình - phương sai (mean - variance analysis: MV) lựa chọn danh mục tối ưu nhằm cực đại hóa lợi suất với mức độ rủi ro định sẵn, hoặc một cách tương đương, cực tiểu hóa rủi ro với mức lợi suất kỳ vọng định sẵn. Việc lựa chọn này được dựa trên hai thông số cơ bản, gồm lợi nhuận và độ rủi ro của danh mục. Trong đó, lợi nhuận được đo bởi lợi suất kỳ vọng của danh mục, còn độ rủi ro được đo bởi phương sai của danh mục. Quá trình tính toán danh mục đòi hỏi việc ước lượng giá trị kỳ vọng của lợi suất và ma trận hiệp phương sai giữa các tài sản. Với số tài sản trên thị trường chứng khoán ngày càng nhiều và sự liên hệ giữa các tài sản ngày càng phức tạp, phương pháp Trung bình - phương sai có thể gặp phải một số hạn chế. Thứ nhất là, như các nghiên cứu thực nghiệm đã chỉ ra, ước lượng của ma trận hiệp phương sai, nhất là trong điều kiện số tài sản lớn, là khá nhạy cảm với nhiễu (Jobson & Korkie, 1980; Best & Grauer, 1991). Cụ thể hơn, một cú sốc dù nhỏ trên thị trường cũng có thể dẫn đến sự thay đổi lớn trong ma trận hiệp phương sai, và do đó sẽ có sai lệch lớn của danh mục nhận được. Vấn đề này càng trở nên nghiêm trọng khi mà cấu trúc của thị trường thay đổi nhanh, khi đó việc thu được ước lượng cho ma trận hiệp phương sai có độ chính xác cao càng trở nên khó khăn hơn. Hạn chế thứ hai là tính quá khớp của lời giải bài toán MV. Theo Kinn (2018), cách tiếp cận theo mô hình MV tiêu chuẩn tương đương với giải bài toán hồi quy tuyến tính bằng phương pháp bình phương tối thiểu (Ordinary Least Squares - OLS), trong đó các biến hồi quy là lợi suất của các tài sản và các hệ số là các trọng số của danh mục đầu tư. Vì OLS nhằm mục đích tạo ra ước lượng tuyến tính không chệch tốt nhất nên nó không cho phép đánh đổi giữa độ chệch và phương sai của ước lượng. Do đó, khi số tài sản trên thị trường là lớn thì hiệu suất của danh mục thu được có thể không tốt do hậu quả của vấn đề quá khớp. Gần đây, đã có một số hướng nghiên cứu nhằm cải thiện các vấn đề trên của phương pháp MV tiêu chuẩn, trong đó đáng kể đến là sự kết hợp các phương pháp Học máy (Machine learning - ML) với bài toán tối ưu MV. Các nghiên cứu thực nghiệm theo hướng này đã cho thấy những ưu việt đáng kể so với phương pháp MV tiêu chuẩn (Nanda và cộng sự, 2010; Iorio và cộng sự, 2018; DeMiguel & Nogales, 2009; Awoye, 2016; Bjerring và cộng sự, 2017; Brodie và cộng sự, 2009; Kinn, 2018; Ta và cộng sự, 2020; Ma và cộng sự, 2021; Zhang và cộng sự, 2022).
  2. 2 Các nghiên cứu theo hướng kết hợp ML với bài toán tối ưu có thể phân thành ba nhóm chính. Nhóm thứ nhất theo tiếp cận giảm chiều dữ liệu, nhằm hướng tới một danh mục ít tài sản hơn, bằng phương pháp phân cụm chuỗi thời gian. Kết quả thực nghiệm của các công trình được thực hiện theo hướng này đã cho thấy sự cải thiện của danh mục tìm được so với danh mục xác định theo phương pháp MV tiêu chuẩn, chẳng hạn Nanda và cộng sự (2010), Iorio và cộng sự (2018), Marvin và Bhatt (2015), Ren (2005). Nhóm tiếp theo là giải quyết vấn đề quá khớp bằng cách tích hợp các mô hình dự báo vào lựa chọn danh mục đầu tư tối ưu. Các công trình tiêu biểu có thể kể đến là Ta và cộng sự (2020), Wang và cộng sự (2020), Fjellström (2022), Zhang và cộng sự (2022). Các nghiên cứu cho thấy việc sử dụng giá trị dự báo bởi các mô hình ML phù hợp hơn so với sử dụng giá trị lợi suất lịch sử trong các mô hình xây dựng danh mục tối ưu. Và hướng tiếp theo là giải quyết vấn đề quá khớp bằng phương pháp chính quy. Các nghiên cứu của Brodie và cộng sự (2009), Kinn (2018) hay Husmann và cộng sự (2022) sử dụng phương pháp chính quy với mô hình MV. Chủ trương của phương pháp chính quy là chấp nhận một phần chệch cho giá trị trung bình của các hệ số cần ước lượng nhưng giảm thiểu được phương sai của ước lượng. Việc giảm thiểu phương sai này về nguyên tắc sẽ giúp cải thiện được độ chính xác cho các tính toán cho ngoài mẫu. Các nghiên cứu ở Việt Nam chưa tập trung vào hướng khắc phục những hạn chế này bằng cách sử dụng Học máy. Thêm vào đó, các nghiên cứu ở Việt Nam (và trên thế giới) thường tập trung vào việc so sánh các phương pháp trên cùng một bộ số liệu, mà chưa làm rõ được ưu điểm của từng phương pháp trên các trạng thái khác nhau của thị trường. Cụ thể hơn, chẳng hạn lúc thị trường bình ổn, việc ước lượng ma trận hiệp phương sai có thể tốt hơn so với lúc thị trường có những biến động lớn, khi đó vấn đề quá khớp có thể là không đáng kể. Còn trong khi thị trường có biến động lớn thì chất lượng của ước lượng này cũng như chất lượng cho việc tính toán ngoài mẫu có thể bị giảm sút. Bên cạnh đó, các nghiên cứu trên thế giới theo cách tiếp cận Học máy thường chỉ tập trung cho các thị trường mới nổi hoặc đã phát triển, mà chưa nghiên cứu cho thị trường cận biên như thị trường Việt Nam. Do vậy, nghiên cứu sinh (NCS) lựa chọn “Tiếp cận Machine Learning trong quản trị danh mục trên thị trường chứng khoán Việt Nam” là chủ đề nghiên cứu cho luận án của mình. Trong luận án, NCS sẽ áp dụng một số phương pháp Machine Learning để nghiên cứu thực nghiệm cho TTCK Việt Nam, ngoài ra, cũng sẽ tìm hiểu hiệu quả của các phương pháp này khi thị trường ở các trạng thái khác nhau. 2. Mục tiêu nghiên cứu Mục tiêu nghiên cứu của luận án là xây dựng danh mục tối ưu sử dụng các phương pháp học máy kết hợp với bài toán tối ưu Markowitz và đánh giá hiệu quả của các phương pháp này trong các bối cảnh khác nhau của thị trường Việt Nam. Từ đó đề xuất các khuyến nghị cho các nhà đầu tư trong quản trị danh mục cũng như các nhà nghiên cứu thực nghiệm trên thị trường chứng khoán Việt Nam. 3. Câu hỏi nghiên cứu và giả thuyết nghiên cứu Câu hỏi nghiên cứu Luận án nhằm trả lời các câu hỏi nghiên cứu sau:
  3. 3 1) Danh mục đề xuất bởi các phương pháp học máy có hiệu quả hơn so với các danh mục tiêu chuẩn thông dụng khác trong điều kiện thị trường bình thường hay không? 2) Danh mục đề xuất bởi các phương pháp học máy có hiệu quả hơn so với các danh mục tiêu chuẩn thông dụng khác trong điều kiện thị trường có biến động hay không? 3) Hiệu quả của các phương pháp học máy khác nhau như thế nào trong điều kiện thị trường bình thường và điều kiện thị trường có biến động? Giả thuyết nghiên cứu: Luận án sử dụng 3 nhóm phương pháp Học máy kết hợp với bài toán tối ưu MV, đó là phương pháp phân cụm với chuỗi thời gian, phương pháp Bộ nhớ ngắn - dài hạn (Long Short-Term Memory: LSTM) và phương pháp chính quy hóa Lasso. Mục đích của việc sử dụng 3 phương pháp này là nhằm khắc phục vấn đề sai số khi ước lượng các đầu vào (ma trận hiệp phương sai và lợi suất trung bình). Tính ưu việt của các phương pháp này so với các danh mục tiêu chuẩn, do đó sẽ phụ thuộc vào khả năng khắc phục này. Vì vậy, luận án đưa ra một số giả thuyết nghiên cứu như sau: H1: Sử dụng các phương pháp Học máy kết hợp MV sẽ giúp cải thiện hiệu quả so với phương pháp MV. Thứ hai là, do cấu trúc về mặt thống kê của thị trường trong giai đoạn thị trường biến động sẽ khác với giai đoạn thông thường nên luận án đề xuất kiểm định giả thuyết H2: H2: Hiệu quả của các phương pháp Học máy kết hợp MV so với MV có thể khác nhau trong điều kiện thị trường bình thường và trong điều kiện thị trường có biến động. Thứ ba là, do phương pháp LSTM có tính tự học cao, có tính đến bài toán dự báo trong quá trình tính toán, và với bản chất phi tuyến, nên nó sẽ giúp cải thiện hơn so với các phương pháp học máy khác trong bài toán xây dựng danh mục. H3: Phương pháp LSTM có ưu việt hơn so với hai phương pháp Học máy còn lại. 4. Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu Đối tượng nghiên cứu của luận án là các cổ phiếu trên TTCK Việt Nam, mô hình MV và các phương pháp ML trong xây dựng danh mục tối ưu. Phạm vi nghiên cứu Phạm vi thời gian: Thời kỳ nghiên cứu là từ năm 2008 đến năm 2022. Thời gian nghiên cứu này được chia làm ba giai đoạn: * Giai đoạn 2008 - 2012, đại diện cho thời kỳ thị trường có những biến động lớn do chịu tác động của khủng hoảng tài chính thế giới. * Giai đoạn 2013 - 2019, đại diện cho thời kỳ thị trường tương đối bình ổn. * Giai đoạn 2020 - 2022, đại diện giai đoạn thị trường có sự ảnh hưởng bởi các biến động lớn như dịch Covid-19, các sự kiện tài chính - kinh tế. Phạm vi nội dung: Quản trị danh mục bao hàm nhiều nội dung. Luận án tập trung vào nghiên cứu bài toán danh mục tối ưu theo hướng khắc phục một số nhược điểm của bài toán MV bằng phương pháp Học máy. Luận án xây dựng danh mục tối ưu bằng một số phương pháp Học máy kết hợp với bài toán tối ưu theo mô hình Markowitz cho thị trường trong các tình trạng khác nhau, bao gồm thị trường chịu ảnh hưởng của cuộc
  4. 4 khủng hoảng tài chính - kinh tế quốc tế, thị trường trong điều kiện bình thường và thị trường chịu sự tác động bởi dịch Covid-19. Số liệu: Luận án sử dụng dữ liệu là giá đóng cửa hàng ngày của các cổ phiếu giao dịch trên sàn thành phố Hồ Chí Minh (HOSE) của Việt Nam. Dữ liệu được cung cấp bởi công ty VietStock. Số liệu về lãi suất trái phiếu chính phủ sử dụng dữ diệu được công bố trên trang vn.investing.com. 5. Phương pháp nghiên cứu Luận án sẽ sử dụng một số phương pháp chính sau đây. Phương pháp nghiên cứu tại bàn Phương pháp thống kê Các phương pháp mô hình hóa: Luận án sử dụng bốn phương pháp cụ thể, gồm phương pháp MV tiêu chuẩn và ba phương pháp kết hợp mô hình tối ưu với các phương pháp học máy, thể hiện cho ba nhóm chính đã được trình bày ở trên. Phần mềm xử lý số liệu và phân tích kết quả: Python. Thiết kế nghiên cứu trong luận án là sử dụng thí nghiệm với số liệu thứ cấp. Trong các thí nghiệm này, nhóm đối chứng là danh mục thu được từ phương pháp MV tiêu chuẩn. Nhóm thực nghiệm là các danh mục dự báo từ phương pháp MV kết hợp với các phương pháp học máy (MV-ML): phân cụm chuỗi thời gian, bộ nhớ ngắn - dài hạn, và Lasso. Ngoài ra, luận án cũng thực hiện đối sánh bản thân các danh mục thu được từ các phương pháp MV-ML trong hai điều kiện khác nhau của thị trường, nhằm xem xét một cách thực nghiệm hiệu quả của các phương pháp này. • Số liệu sử dụng là giá đóng cửa của các cổ phiếu trên sàn HOSE trong giai đoạn từ năm 2008 đến năm 2022. Thí nghiệm được thực hiện trên từng giai đoạn nhỏ là 2008 - 2012, 2013 - 2019 và 2020 - 2022, nhằm đánh giá kết quả trên các bối cảnh thị trường khác nhau. • Phương pháp phân tích là so sánh các danh mục thu được từ bốn phương pháp nêu trên trên các tiêu chí: (i) chuỗi lợi suất tích lũy; (ii) lợi suất trung bình; (iii) độ lệch chuẩn của lợi suất; (iv) tỷ số Shapre; (v) tỷ số thông tin; (vi) chỉ số luân chuyển danh mục; (vi) giá trị rủi ro VaR và (vii) tổn thất kỳ vọng CVaR, trong đó sẽ quan tâm nhiều hơn đến lợi suất trung bình, thể hiện cho lợi nhuận thu được, và độ lệch chuẩn, thể hiện cho độ rủi ro của danh mục. Cách bước trong tính toán các tiêu chí đánh giá: - Bước 1: Sử dụng một phần dữ liệu như tập dữ liệu huấn luyện (training data), xác định các danh mục theo phương pháp MV tiêu chuẩn và theo phương pháp MV kết hợp với các phương pháp học máy. - Bước 2: Tính toán lợi suất của các danh mục nhận được từ Bước 1 trong giai đoạn kế tiếp. Sử dụng chuỗi lợi suất này để tính toán các tiêu chí đánh giá danh mục. - Bước 3: Nhập giai đoạn dự báo ở Bước 2 vào tập dữ liệu huấn luyện và tiếp tục dự báo cho giai đoạn tiếp theo và lặp lại quy trình từ Bước 2.
  5. 5 So sánh kết quả thực nghiệm: - So sánh nhóm thực nghiệm với nhóm đối chứng trên mỗi giai đoạn: 2008 – 2012; 2013 – 2019 và 2020 – 2022 (sử dụng chuỗi lợi suất tính toán với các cửa sổ trượt riêng cho mỗi nhóm đối chứng). - So sánh ba nhóm thực nghiệm với nhau trên mỗi giai đoạn: 2008 – 2012; 2013 – 2019 và 2020 – 2022. 6. Những đóng góp mới của luận án Những đóng góp mới về mặt học thuật, lý luận • Luận án phân tích về hiệu quả của các phương pháp Học máy kết hợp Tối ưu (Machine Learning - Mean Variance: ML-MV) trong bài toán tối ưu hóa danh mục cho thị trường Việt Nam – thuộc nhóm thị trường cận biên – là nhóm thị trường hầu như chưa được nghiên cứu trên thế giới (sử dụng các phương pháp này). Điều này giúp cho việc đánh giá về hiệu quả của phương pháp ML-MV trên các thị trường chứng khoán với mức độ phát triển khác nhau được toàn diện hơn. • Luận án đã tận dụng 2 tình huống thị trường có biến động (khủng hoảng tài chính quốc tế, và đại dịch Covid) để đối sánh hiệu quả của các phương pháp trên các tình huống khác nhau của thị trường. Các nghiên cứu hiện có thường chỉ tập trung so sánh hiệu quả của các phương pháp trong cùng thời kỳ, do đó luận án giúp cung cấp bằng chứng mới để từ đó có thể đưa ra một cái nhìn đầy đủ hơn về hiệu quả thực nghiệm của các phương pháp với các trạng thái khác nhau của cùng một thị trường. Những phát hiện, đề xuất mới rút ra được từ kết quả nghiên cứu của luận án • Kết quả thực nghiệm cho thấy, sử dụng các phương pháp Học máy có thể giúp cải thiện hiệu quả của danh mục so với phương pháp Trung bình - Phương sai (Mean - Variance: MV) tiêu chuẩn. Trong cả ba giai đoạn nghiên cứu, danh mục có lợi suất tích lũy cao nhất trong các danh mục Học máy có hiệu quả hơn về mặt lợi suất so với danh mục MV tiêu chuẩn, và sự vượt trội này là có ý nghĩa thống kê. Điều này cũng tương tự như các nghiên cứu trước đây trên thế giới. Tuy nhiên, hiệu quả của danh mục Học máy mang lại (so với danh mục MV tiêu chuẩn) ở thị trường Việt Nam lớn hơn khá đáng kể so với trên thị trường phát triển. • Trong cả ba giai đoạn nghiên cứu, giá trị rủi ro của các danh mục Học máy cũng cao hơn so với danh mục MV. Điều này có nghĩa rằng, về mặt dài hạn danh mục Học máy ưu việt hơn so với danh mục MV tiêu chuẩn do sự vượt trội về lợi suất đã được khẳng định bởi kết quả kiểm định. Tuy nhiên, trong ngắn hạn thì sự ưu việt này chưa hẳn đã có tính thuyết phục, bởi vì tuy lợi suất cao hơn nhưng độ biến động cũng cao hơn và giá trị rủi ro (VaR) hay tổn thất kỳ vọng (CVaR) cũng lớn hơn. • Trong hai giai đoạn thị trường có biến động, hiệu quả của các danh mục Học máy có thể rất khác biệt với nhau và với danh mục MV tiêu chuẩn. Cụ thể, danh mục đề xuất từ phương pháp Bộ nhớ ngắn - dài hạn (LSTM-MV) là có ưu việt một cách ổn định, trong khi hai danh mục còn lại, đề xuất từ phương pháp phân cụm chuỗi thời gian (MTS-MV) và từ phương pháp Lasso (Lasso), hoặc sự khác biệt là không đáng kể hoặc thua kém so với danh mục MV tiêu chuẩn. • Sự vượt trội về lợi suất của danh mục LSTM-MV và danh mục MTS-MV so với danh mục MV đều chỉ được thể hiện trong giai đoạn thị trường bình thường. Trong đó, độ rủi ro của danh mục LSTM-MV lại cao hơn một cách đáng kể so với danh mục MTS-MV. Do vậy nhà đầu tư cần có những cân nhắc thận trọng trong việc lựa chọn danh mục.
  6. 6 7. Kết cấu của luận án Ngoài phần Lời giới thiệu và tài liệu tham khảo, luận án được cấu trúc thành 4 chương, bao gồm: Chương 1: Cơ sở lý luận và tổng quan nghiên cứu Chương 2: Các phương pháp nghiên cứu Chương 3: Phân tích thực nghiệm và kết quả Chương 4: Kết luận và khuyến nghị CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN NGHIÊN CỨU 1.1 Cơ sở lý thuyết 1.1.1 Một số khái niệm trong quản trị danh mục đầu tư Danh mục đầu tư chứng khoán gồm tập hợp các chứng khoán mà một cá nhân hoặc tổ chức nắm giữ. Quản trị danh mục đầu tư chứng khoán là quá trình quản lý và điều chỉnh danh mục đầu tư chứng khoán nhằm hướng tới mục tiêu tối ưu hóa lợi nhuận và kiểm soát rủi ro cho danh mục đầu tư. 1.1.2 Cơ sở lý thuyết của Quản trị danh mục đầu tư Quản trị danh mục đầu tư đã phát triển dựa trên một số nền tảng lý thuyết cơ sở. Tùy thuộc vào mục đích và môi trường đầu tư, hai cách tiếp cận cơ bản để quản trị danh mục đầu tư là cách tiếp cận truyền thống và cách tiếp cận hiện đại. Tiếp cận truyền thống Cách tiếp cận truyền thống dựa trên nền tảng lý thuyết đầu tư danh mục cổ điển (Traditional Portfolio Theory - TPT), xuất hiện vào đầu thế kỷ 20. Lý thuyết này đóng một vai trò quan trọng trong lĩnh vực tài chính cho tới khi bài báo “Lựa chọn danh mục đầu tư” của Markowitz xuất bản vào năm 1952. TPT được dựa trên các phân tích tương đối đơn giản. TPT đặc trưng cho cách tiếp cận chủ quan, không phân tích đầy đủ và không có quy tắc chung để đưa ra quyết định. Tiếp cận hiện đại Cách tiếp cận thứ hai dựa trên nền tảng lý thuyết danh mục đầu tư hiện đại (Modern Portfolio Theory - MPT). Sự xuất hiện của MPT và nền kinh tế tài chính hiện đại nói chung được đánh dấu bằng việc xuất bản công trình “Lựa chọn danh mục đầu tư” của Markowitz vào tháng 3 năm 1952 (Markowitz, 1952). MPT cung cấp một khung toán học để tối ưu hóa tỷ lệ lợi nhuận và rủi ro. Cùng với đó là tạo ra một bước tiến so hơn TPT, chuyển từ phân tích các chứng khoán riêng lẻ sang phân tích các đặc điểm của danh mục đầu tư. Danh mục đầu tư trở thành một yếu tố quyết định khi đưa ra quyết định đầu tư, chứ không phải là các chứng khoán riêng lẻ trong đó. 1.1.3 Mô hình Trung bình - phương sai của Markowitz Nền tảng toán học của lý thuyết danh mục đầu tư hiện đại MPT theo Markowitz (1952) được thể hiện trong mô hình Trung bình - phương sai. Trong mô hình này, danh mục tối ưu được lựa chọn dựa trên hai đại lượng cốt yếu trong đầu tư tài chính: lợi suất trung bình của danh mục và phương sai - thể hiện cho độ rủi ro của danh mục. Bài toán tối ưu (Markowitz, 1952) có thể được phát biểu dưới dạng bài toán xây dựng danh mục tối thiểu hóa rủi ro với lợi suất mục tiêu cho trước 𝑟 𝑃 , như sau:
  7. 7 Xác định véc tơ trọng số 𝒘 của danh mục sao cho: 1 min 𝒘 𝑇 𝚺𝒘 (1.12) 𝒘 2 với điều kiện 𝝁 𝑇 𝒘 ≥ 𝑟 𝑃 và 𝒘 𝑇 𝟏 𝑁 = 1. Mô hình MV đã trở thành nền tảng của lý thuyết danh mục đầu tư và do đó có vị trí quan trọng trong tài chính định lượng. Tuy nhiên, mô hình vẫn có một số hạn chế, nhất là về mặt thực nghiệm. Thứ nhất là sự nhạy cảm của danh mục MV đối với ma trận hiệp phương sai và lợi suất kỳ vọng. Thứ hai, bài toán MV thuần túy dễ dẫn đến vấn đề quá khớp (over-fitting): một mô hình quá hoàn hảo với số liệu quá khứ rất có thể dẫn đến không phù hợp với tương lai. Trong khuôn khổ của luận án, NCS sẽ chỉ tập trung vào cải thiện các hạn chế: (1) Quá nhiều tham số đầu vào dẫn đến xuất hiện nhiều sai số của ước lượng. Từ đó làm cho danh mục đầu tư tìm được sai khác với danh mục tối ưu, và thêm vào đó, là danh mục đầu tư có quá nhiều tài sản, gây khó khăn trong quản lý, và (2) Vấn đề quá khớp trong khi giải bài toán MV và dẫn đến danh mục tối ưu nhận được sẽ không còn phù hợp trong tương lai. Hướng thứ nhất là giảm số lượng cổ phiếu lựa chọn được thực hiện thông qua sử dụng kỹ thuật phân cụm chuỗi thời gian. Bài toán tối ưu được thực hiện trên các cổ phiếu đại diện từ các cụm chứ không phải trên toàn bộ cổ phiếu của thị trường. Kỹ thuật phân cụm hướng tới việc giảm trực tiếp số cổ phiếu, trong khi vẫn bảo toàn được tính đại diện cho toàn thị trường. Hướng thứ hai nhằm bổ sung thêm thông tin về tương lai của thị trường (qua mô hình dự báo) trong việc tính các tham số đầu vào với mục đích cải thiện vấn đề quá khớp của mô hình MV. Đầu tiên, mạng LSTM được sử dụng để tính các giá trị lợi suất dự báo của các cổ phiếu. Sau đó, giá trị lợi suất dự báo và giá trị lợi suất lịch sử được sử dụng để xác định các tham số đầu vào cho bài toán tối ưu hóa theo mô hình MV. Hướng thứ ba hướng tới giải quyết bài toán quá khớp thông qua kỹ thuật chính quy hóa khi giải bài toán tối ưu, và đồng thời với nó, kỹ thuật này cũng giúp giảm số lượng cổ phiếu được lựa chọn. 1.2 Tổng quan nghiên cứu 1.2.1 Các nghiên cứu trên thế giới Gần đây, một số nghiên cứu đã phát triển nhằm khắc phục vấn đề này bằng cách sử dụng các phương pháp Học máy. Các phương pháp này có thể phân thành ba nhóm chính, bao gồm: sử dụng phương pháp phân cụm chuỗi thời gian kết hợp với tối ưu hóa, sử dụng mô hình LSTM kết hợp với tối ưu hóa và sử dụng phương pháp Lasso trong xây dựng danh mục. Các nghiên cứu sử dụng phân cụm chuỗi thời gian kết hợp với tối ưu hóa Các nghiên cứu sử dụng kỹ thuật phân cụm trong xây dựng danh mục đầu tư thường theo quy trình gồm 2 bước. Ban đầu là sử dụng các kỹ thuật phân cụm lựa chọn các tài sản cho danh mục và sau đó thực hiện giải bài toán tối ưu để đưa ra tỷ trọng cho mỗi tài sản trong danh mục. Các nghiên cứu sử dụng kỹ thuật học sâu Bộ nhớ ngắn - dài hạn
  8. 8 Bộ nhớ ngắn - dài hạn được cho là có cấu trúc phù hợp để xử lý các dữ liệu theo thời gian nhờ việc kết hợp được thông tin ngắn và dài hạn của dữ liệu. Chuỗi lợi suất của danh mục được xây dựng từ sự kết hợp giữa kết quả dự báo bởi phương pháp LSTM và mô hình tối ưu MV có giá trị tích lũy cao hơn rõ rệt. Các nghiên cứu sử dụng phương pháp chính quy hóa Phương pháp chính quy hóa (Regularization method) là một phương pháp quan trọng trong Machine learning, đặc biệt là trong các bài toán liên quan đến dự báo, trong đó có bài toán xây dựng danh mục tối ưu. Các nghiên cứu cho thấy rằng phương pháp chính quy hóa LASSO giúp cải thiện hiệu quả ngoài mẫu của danh mục tối ưu. 1.2.2 Các nghiên cứu trong nước Ở Việt Nam, vấn đề tối ưu hóa danh mục cũng được nhiều nhà nghiên cứu quan tâm. Các công trình tập trung vào ứng dụng các phương pháp xây dựng danh mục nhằm cải thiện so với danh mục MV tiêu chuẩn. Các nghiên cứu này chủ yếu tập trung vào việc kết hợp mô hình MV với một số mô hình truyền thống và theo hiểu biết của NCS, các nghiên cứu sử dụng các phương pháp học máy trong xây dựng danh mục tối ưu trên TTCK Việt Nam còn khá hạn chế. 1.3 Khoảng trống và khung nghiên cứu 1.3.1 Khoảng trống nghiên cứu Các kết quả thực nghiệm cho thấy các phương pháp Học máy có thể giúp cải thiện danh mục so với phương pháp MV tiêu chuẩn. Tuy nhiên, các nghiên cứu này hầu như mới chỉ được thực hiện tại các thị trường phát triển và thị trường mới nổi. Thị trường chứng khoán Việt Nam thuộc dạng thị trường cận biên, do đó nó có một số khác biệt quan trọng với các thị trường đã phát triển. Chẳng hạn, với thị trường cận biên, cơ sở hạ tầng cũng như thiết chế pháp lý chưa được hoàn thiện, tính đa dạng hóa chưa nên độ biến động thường cao hơn, cấu trúc thị trường kém ổn định hơn, và do đó khó dự báo hơn. Trong khi đó, các nghiên cứu trên thị trường cận biên sử dụng ML còn rất hạn chế, và ở Việt Nam thì hầu như chưa được nghiên cứu. Vì vậy, luận án xác định đây là một khoảng trống nghiên cứu mình. Ngoài ra, các nghiên cứu trên thế giới về xây dựng danh mục sử dụng ML hầu như chỉ thực hiện so sánh trên cùng một giai đoạn của thị trường, do đó chưa có cơ sở để có thể đưa ra những kết luận chung cho hiệu quả của các phương pháp này trong các điều kiện khác nhau của thị trường. Đây là khoảng trống thứ hai mà NCS xác định cho luận án của mình. Về lý luận, tính ưu việt của các phương pháp MV- ML phụ thuộc vào cấu trúc dữ liệu của thị trường. Luận án sẽ tận dụng thời kỳ có Covid để nghiên cứu thực nghiệm khoảng trống này. Thêm vào đó, các phương pháp MV-ML này chưa được nghiên cứu ở Việt Nam, do đó chưa có các đánh giá một cách định lượng về hiệu quả của các phương pháp này cho chính thị trường Việt Nam. Đây là khoảng trống thứ ba mà Luận án muốn thực hiện nghiên cứu. Một cách cụ thể hơn, từ tổng quan cho thấy, hầu như không có phương pháp nào tạo ra được danh mục ưu việt hoàn toàn đồng thời cả tiêu chí lợi nhuận và rủi ro. Trong khi đó, để quyết định lựa chọn danh mục, nhà đầu tư cần cân nhắc vào sự đánh đổi cụ thể giữa các tiêu chí này, do đó họ cần có các con số định lượng cụ thể. NCS xác định ba vấn đề trên là khoảng trống nghiên cứu tại Việt Nam cho luận án của mình. Cụ thể hơn, luận án sẽ sử dụng các công cụ học máy nhằm cải thiện các hạn
  9. 9 chế của phương pháp MV tiêu chuẩn và đánh giá, so sánh hiệu quả của các phương pháp này trong các điều kiện khác nhau của thị trường. 1.3.2 Khung nghiên cứu Khung nghiên cứu của luận án được trình bày như trong Hình 1.1. Sử dụng Sử dụng bổ sung Giảm vấn đề phân cụm dữ liệu dự báo quá khớp Phân cụm Chính quy hóa LSTM chuỗi thời gian Lasso Mô hình Trung bình - phương sai 4 Các tiêu chí lựa chọn: (i) tỷ số Sharpe (ii) VaR, CVaR … Danh mục đầu tư Hình 1.1. Khung nghiên cứu của luận án Nguồn: Tác giả đề xuất Như thể hiện trong Hình 1.1, luận án sử dụng 3 phương pháp chính: Phân cụm chuỗi thời gian, LSTM, và chính quy Lasso để tạo ra các danh mục ở bước đầu tiên. Sau đó, phương pháp tối ưu Trung bình – phương sai Markowitz sẽ được thực hiện trên các danh mục này để tạo ra được danh mục tối ưu cho mỗi phương pháp. CHƯƠNG 2. PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Các phương pháp học máy ứng dụng trong quản trị danh mục 2.1.1 Giới thiệu về học máy 2.1.2 Phương pháp phân cụm với số liệu chuỗi thời gian Phương pháp phân cụm là phương pháp nằm trong lĩnh vực học máy không giám sát. Phân cụm nhằm khám phá cấu trúc cơ bản của dữ liệu và tổ chức nó thành các cụm (nhóm) sao cho các quan sát trong cùng một cụm giống nhau hơn so với các quan sát trong các cụm khác nhau. Việc phân cụm với chuỗi thời gian có thể giúp phân tách các nhóm dựa trên tiến trình thay đổi của dữ liệu theo thời gian. Các phương pháp phân cụm
  10. 10 chuỗi thời gian sẽ dựa vào đặc tính mang tính chuỗi thời gian trong quá trình phân cụm, chẳng hạn chúng phải duy trì được thứ tự thời gian của các biến đầu vào. 2.1.3 Phương pháp Bộ nhớ ngắn – dài hạn (Long Short - Term Memory) LSTM là một dạng mạng nơ-ron tạo ra dựa trên kiến trúc RNN, được đề xuất để xử lý vấn đề phụ thuộc xa trong các chuỗi dữ liệu. LSTM được thiết kế để có khả năng ghi nhớ thông tin trong suốt một khoảng thời gian dài, mà không bị phụ thuộc vào khoảng cách giữa các thông tin. LSTM sử dụng cơ chế gọi là “cổng’’ (gate) để kiểm soát các thông tin được truyền qua các đơn vị bên trong mạng. Các cổng này cho phép LSTM biết thông tin nào cần được ghi nhớ và thông tin nào có thể bị loại bỏ. 2.1.4 Phương pháp chính quy hóa Trong học máy, phương pháp chính quy hóa là các kỹ thuật được sử dụng để giảm thiểu sự quá khớp (overfitting) và tăng tính tổng quát hóa (generalization) của mô hình. Phương pháp này dựa trên việc thêm một thành phần bổ sung vào hàm mất mát (loss function), giúp điều chỉnh mô hình bằng cách giảm thiểu hệ số của các biến độc lập (các tham số) sử dụng trong mô hình. 2.2 Học máy kết hợp với mô hình MV trong xây dựng danh mục tối ưu 2.2.1 Phương pháp phân cụm kết hợp với mô hình MV Luận án sẽ kết hợp các phương pháp phân cụm với bài toán tối ưu hóa trong mô hình Trung bình - phương sai Markowitz để xây dựng danh mục tối ưu. Phương pháp phân cụm giúp lọc các cổ phiếu đưa vào danh mục. Từ đó, danh mục tối ưu sẽ được lựa chọn dựa trên một tập nhỏ các cổ phiếu thay cho toàn bộ các cổ phiếu trên thị trường. Hình 2.1. Phương pháp xây dựng danh mục dựa trên kỹ thuật phân cụm Nguồn: Nanda và cộng sự (2010) Phương pháp này sẽ bao gồm ba bước. Bước thứ nhất sẽ thực hiện phân cụm các cổ phiếu dựa trên thông tin chuỗi thời gian, nhằm tách các cổ phiếu tương đồng nhau vào cùng một cụm. Bước thứ hai sẽ lựa chọn các cổ phiếu từ các cụm đã được phân tách ở Bước 1; và ở Bước 3, thuật toán tối ưu sẽ được áp dụng trên các cổ phiếu được lựa chọn từ Bước 2 để xác định ra danh mục tối ưu. 2.2.2 Phương pháp LSTM kết hợp với mô hình MV Luận án sử dụng phương pháp kết hợp LSTM với bài toán tối ưu hóa Markowitz trong việc xây dựng danh mục tối ưu. Tư tưởng của phương pháp kết hợp này như sau: kết quả dự báo LSTM sẽ cung cấp thông tin về lợi suất trong tương lai của các cổ phiếu. Các thông tin này sẽ được sử dụng thay thế cho giá trị lịch sử trong việc tính toán lợi suất và rủi ro của danh mục. Sau đó, phương pháp tối ưu hóa của bài toán trung bình - phương sai MV sẽ được áp dụng để lựa chọn danh mục tối ưu.
  11. 11 Phương pháp này gồm 2 bước chính như sau: Bước 1: Ứng dụng LSTM dự báo lợi suất cổ phiếu trên toàn thị trường. Bước 2: Giải bài toán tối ưu hóa MV với lợi suất và rủi ro của danh mục được tính toán trên các giá trị dự báo ở Bước 1. 2.2.3 Phương pháp chính quy hóa kết hợp với mô hình MV Mô hình Markowitz cho phép các nhà đầu tư đánh giá các danh mục đầu tư khác nhau dựa trên lợi nhuận kỳ vọng và rủi ro tiềm ẩn. Phương pháp chính quy hóa Lasso được sử dụng kết hợp với mô hình Markowitz, giúp danh mục chỉ tập trung vào lựa chọn các cổ phiếu quan trọng. CHƯƠNG 3. PHÂN TÍCH THỰC NGHIỆM VÀ KẾT QUẢ 3.1 Thực trạng TTCK Việt Nam giai đoạn 2008 - 2022 3.1.1 Kết quả thực nghiệm của các phương pháp Kết quả thực nghiệm của phương pháp phân cụm: Ký hiệu cho các danh mục đầu tư: • Sử dụng tối ưu MV trên kết quả phân cụm theo 2 chuỗi thời gian: MTS-MV • Sử dụng tối ưu MV trên toàn bộ cổ phiếu của thị trường: MV. • Chỉ số VNIndex: VNIndex. Giai đoạn 2008 - 2012 Chuỗi lợi suất của các danh mục được xác định từ ngày 03/01/2010 đến ngày 28/12/2012, bao gồm 748 giá trị. Kết quả cho các chỉ số đánh giá các danh mục trong giai đoạn 2008 - 2012 được trình bày trong Bảng 3.1. Bảng 3.1. Các chỉ số đánh giá danh mục (giai đoạn 2008 - 2012) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) MTS-MV -0,058% 1,231% 0,02018 0,02677 -0,07170 0,6796 MV -0,014% 0,890% 0,01515 0,02073 -0,05002 0,2051 VNIndex -0,024% 1,310% 0,02294 0,03066 -0,04174 Nguồn: Tính toán của tác giả Các chuỗi lợi suất tích lũy của các danh mục được thể hiện trong Hình 3.1. Hình 3.1. Lợi suất tích lũy (giai đoạn 2008 - 2012) Nguồn: Tính toán của tác giả
  12. 12 Giai đoạn 2013 - 2019 Kết quả cho các chỉ số đánh giá các danh mục trong giai đoạn 2013 - 2019 được trình bày trong Bảng 3.5. Chuỗi lợi suất của các danh mục được xác định từ ngày 04/01/2015 đến ngày 31/12/2019, bao gồm 1247 giá trị. Bảng 3.2. Các chỉ số đánh giá danh mục (giai đoạn 2013 - 2019) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) MTS-MV 0,092% 1,061% 0,01604 0,02277 0,07215 1,11337 MV 0,055% 0,414% 0,00599 0,00868 0,09495 0,22500 VNIndex 0,045% 0,971% 0,01499 0,02374 0,03077 Nguồn: Tính toán của tác giả Hình ảnh về chuỗi lợi suất tích lũy được thể hiện trong Hình 3.2. Hình 3.2. Chuỗi lợi suất tích lũy (giai đoạn 2013 - 2019) Nguồn: Tính toán của tác giả Giai đoạn 2020 - 2022 Trong giai đoạn này, dữ liệu huấn luyện là giao dịch trong năm 2020 và 2021. Chuỗi lợi suất của các danh mục được xác định từ ngày 04/01/2022 đến ngày 30/12/2022, bao gồm 249 giá trị. Kết quả cho các chỉ số đánh giá các danh mục trong giai đoạn 2020 - 2022 được trình bày trong Bảng 3.3. Bảng 3.3. Các chỉ số đánh giá danh mục (giai đoạn 2020 - 2022) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) MTS-MV -0,00154 0,01456 0,03145 0,03736 -0,11251 1,17790 MV -0,00176 0,00815 0,01642 0,02192 -0,22843 0,26776 VNIndex -0,00160 0,01572 0,03357 0,04208 -0,10777 Nguồn: Tính toán của tác giả Các chuỗi lợi suất tích lũy của các danh mục được thể hiện trong Hình 3.3.
  13. 13 Hình 3.3. Lợi suất tích lũy (giai đoạn 2020 - 2022) Nguồn: Tính toán của tác giả Kết quả thực nghiệm của phương pháp LSTM: Các danh mục được ký hiệu như sau: • Danh mục được xác định theo mô hình MV dựa trên các giá trị dự báo bởi mạng LSTM: LSTM-MV. • Danh mục được xác định theo mô hình MV dựa trên dữ liệu lịch sử,: MV. • Chỉ số VNIndex: VNIndex. Giai đoạn 2008 - 2012 Chuỗi lợi suất của danh mục được ghi nhận bắt đầu từ ngày đầu tiên tới ngày cuối cùng của tập kiểm tra. Việc đầu tư thực hiện trong 246 ngày giao dịch, từ ngày 09/01/2012 đến ngày 28/12/2012. Các chỉ số đánh giá danh mục được thể hiện trong Bảng 3.4. Bảng 3.4. Các chỉ số đánh giá danh mục (giai đoạn 2008 - 2012) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) LSTM-MV 0,301% 2,417% 0,04218 0,04545 0,11270 0,90151 MV 0,092% 0,792% 0,01175 0,01664 0,07968 0,05051 VNIndex 0,084% 1,267% 0,02190 0,03122 0,04348 Nguồn: Tính toán của tác giả Chuỗi lợi suất tích lũy được thể hiện trong Hình 3.4. Hình 3.4. Lợi suất tích lũy (giai đoạn 2008 - 2012) Nguồn: Tính toán của tác giả
  14. 14 Giai đoạn 2013 - 2019 Chuỗi lợi suất của danh mục được ghi nhận bắt đầu từ ngày đầu tiên tới ngày cuối cùng của tập kiểm tra. Việc đầu tư thực hiện trong 346 ngày giao dịch, từ ngày 16/8/2018 đến ngày 31/12/2019. Các chỉ số đánh giá danh mục được thể hiện trong Bảng 3.5. Bảng 3.5. Các chỉ số đánh giá danh mục (giai đoạn 2013 - 2019) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) LSTM-MV 0,216% 3,510% 0,05608 0,06329 0,05800 0,37476 MV 0,070% 0,293% 0,00406 0,00543 0,19447 0,04881 VNIndex 0,000% 0,807% 0,01341 0,01905 -0,01575 Nguồn: Tính toán của tác giả Chuỗi lợi suất tích lũy được thể hiện trong Hình 3.5. Hình 3.5. Lợi suất tích lũy (giai đoạn 2013 - 2019) Nguồn: Tính toán của tác giả Giai đoạn 2020 - 2022 Chuỗi lợi suất của danh mục được ghi nhận bắt đầu từ ngày đầu tiên tới ngày cuối cùng của tập kiểm tra. Việc đầu tư thực hiện trong 147 ngày giao dịch, từ ngày 07/6/2022 đến ngày 30/12/2022. Các chỉ số đánh giá danh mục được thể hiện trong Bảng 3.6. Bảng 3.6. Các chỉ số đánh giá danh mục (giai đoạn 2020 - 2022) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) LSTM-MV 0,039% 3,084% 0,05917 0,06611 0,00866 0,37476 MV -0,083% 0,580% 0,01106 0,01443 -0,16395 0,04881 VNIndex -0,168% 1,609% 0,03504 0,03964 -0,11203 Nguồn: Tính toán của tác giả Các chuỗi lợi suất tích lũy của các danh mục được thể hiện trong Hình 3.6.
  15. 15 Hình 3.6. Lợi suất tích lũy (giai đoạn 2020 - 2022) Nguồn: Tính toán của tác giả Kết quả thực nghiệm của phương pháp Lasso: Ký hiệu cho các danh mục đầu tư: • Sử dụng chính quy hóa Lasso, ký hiệu là Lasso. • Sử dụng bài toán MV tiêu chuẩn có cho phép bán khống, ký hiệu là MV. • Chỉ số thị trường VNIndex, ký hiệu là VNIndex. Giai đoạn 2008 - 2012 Chuỗi lợi suất của danh mục được ghi nhận bắt đầu từ ngày đầu tiên tới ngày cuối cùng của tập kiểm tra. Việc đầu tư thực hiện trong 748 ngày giao dịch, từ ngày 04/01/2010 đến ngày 28/12/2012. Các chỉ số đánh giá danh mục được thể hiện trong Bảng 3.7. Bảng 3.7. Các chỉ số đánh giá danh mục (giai đoạn 2008 - 2012) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) Lasso -0,003% 0,906% 0,01589 0,02064 -0,03739 0,52688 MV -0,002% 1,012% 0,01759 0,02325 -0,02883 0,71633 VNIndex -0,024% 1,310% 0,02294 0,03066 -0,04174 Nguồn: Tính toán của tác giả Các chuỗi lợi suất tích lũy được thể hiện trong Hình 3.7. Hình 3.7. Lợi suất tích lũy (giai đoạn 2008 - 2012) Nguồn: Tính toán của tác giả
  16. 16 Giai đoạn 2013 - 2019 Chuỗi lợi suất của danh mục được ghi nhận bắt đầu từ ngày đầu tiên tới ngày cuối cùng của tập kiểm tra. Việc đầu tư thực hiện trong 1247 ngày giao dịch, từ ngày 05/01/2015 đến ngày 31/12/2019. Các chỉ số đánh giá danh mục được thể hiện trong Bảng 3.8. Bảng 3.8. Các chỉ số đánh giá danh mục (giai đoạn 2013 - 2019) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) Lasso 0,060% 0,423% 0,00642 0,00895 0,10439 0,42120 MV 0,071% 0,491% 0,00719 0,00977 0,11287 0,84221 VNIndex 0,045% 0,971% 0,01499 0,02374 0,03077 Nguồn: Tính toán của tác giả Các chuỗi lợi suất tích lũy được thể hiện trong Hình 3.8. Hình 3.8. Lợi suất tích lũy (giai đoạn 2013 - 2019) Nguồn: Tính toán của tác giả Giai đoạn 2020 - 2022 Chuỗi lợi suất của danh mục được ghi nhận bắt đầu từ ngày đầu tiên tới ngày cuối cùng của tập kiểm tra. Việc đầu tư thực hiện trong 249 ngày giao dịch, từ ngày 04/01/2022 đến ngày 30/12/2022. Các chỉ số đánh giá danh mục được thể hiện trong Bảng 3.9. Bảng 3.9. Các chỉ số đánh giá danh mục (giai đoạn 2020 - 2022) VaR CVaR Danh mục 𝒎 𝒔 SR TO (5%) (5%) Lasso -0,153% 0,768% 0,01620 0,02158 -0,21175 0,46522 MV -0,160% 0,829% 0,01630 0,02222 -0,20499 1,13133 VNIndex -0,160% 1,572% 0,03357 0,04208 -0,10777 Nguồn: Tính toán của tác giả Các chuỗi lợi suất tích lũy được thể hiện trong Hình 3.9.
  17. 17 Hình 3.9. Lợi suất tích lũy (giai đoạn 2020 - 2022) Nguồn: Tính toán của tác giả 3.1.2 So sánh các danh mục Học máy với danh mục MV tiêu chuẩn Sự khác biệt này được tính theo tỷ lệ phần trăm, được thể hiện ở cột “Chênh lệch với MV” và được tính theo công thức: X_giá trị – MV_giá trị Chênh lệch = |MV_giá trị| trong đó, X_giá trị là giá trị của danh mục được tính toán từ phương pháp học máy X, bao gồm phân cụm chuỗi thời gian, LSTM, và Lasso; và giá trị bao gồm lợi suất trung bình và rủi ro - đo bằng độ lệch chuẩn; MV_giá trị là giá trị tương ứng với danh mục MV. Giai đoạn 2008 - 2012 So sánh kết quả: Danh mục đề xuất theo phương pháp phân cụm: Kết quả so sánh danh mục MTS-MV và danh mục MV được thể hiện trong Bảng 3.10. Bảng 3.10. So sánh danh mục MTS và MV giai đoạn 2008 - 2012 Danh Trung Độ lệch Chênh lệch với MV SR mục bình chuẩn Trung bình Độ lệch chuẩn MTS-MV -0,058% 1,231% -0,072 -317% 38% MV -0,014% 0,890% -0,050 Nguồn: Tính toán của tác giả Kết quả từ Bảng 3.10 cho thấy danh mục nhận được từ phương pháp phân cụm MTS-MV kém hơn một cách đáng kể so với danh mục từ phương pháp MV. Cụ thể hơn, lợi suất trung bình của danh mục MTS-MV là -0,058% , trong khi giá trị này của danh mục MV là -0,014%, sai lệch tới 3,17 lần. Còn với độ rủi ro, thể hiện bởi độ lệch chuẩn, thì độ rủi ro của danh mục MTS-MV lại lớn hơn so với của danh mục MV. Như vậy trong giai đoạn này, có thể nói danh mục MV có ưu thế tuyệt đối hơn so với danh mục MTS- MV khi so sánh trên đồng thời hai tiêu chí cơ bản là lợi suất trung bình và độ rủi ro. Danh mục đề xuất theo phương pháp Lasso: Kết quả so sánh danh mục Lasso và danh mục MV được trình bày trong Bảng 3.11.
  18. 18 Bảng 3.11. So sánh danh mục Lasso và MV giai đoạn 2008 - 2012 Trung Độ lệch Chênh lệch so với MV Danh mục SR bình chuẩn Trung bình Độ lệch chuẩn Lasso -0,003% 0,906% -0,037 -250% -10% MV 0,002% 1,012% -0,029 Nguồn: Tính toán của tác giả Bảng 3.11 cho thấy kết quả khá tương đồng với Bảng 3.10, trong đó danh mục từ phương pháp Lasso có lợi suất trung bình bé hơn so với MV, ở mức -0,003% so với +0,002%. Tuy về mặt con số tuyệt đối, sự chênh lệch này là không đáng kể (-0,005%), nhưng tính theo tỷ lệ phần trăm thì sự khác biệt này lên tới -250%, đây là một giá trị khá lớn. Còn về độ rủi ro, tuy độ rủi ro từ danh mục Lasso có bé hơn so với danh mục MV nhưng sự khác biệt là không đáng kể (bé hơn 10%). Ở bảng này, do lợi suất trung bình của danh mục Lasso là âm, nên việc so sánh chỉ số Sharpe là không có ý nghĩa thực tế. Danh mục đề xuất theo phương pháp LSTM: Kết quả so sánh danh mục LSTM-MV và danh mục MV được trình bày trong Bảng 3.12. Bảng 3.12. So sánh danh mục LSTM-MV và MV giai đoạn 2008 - 2012 Trung Độ lệch Chênh lệch so với MV Danh mục SR bình chuẩn Trung bình Độ lệch chuẩn LSTM-MV 0,301% 2,417% 0,113 227% 205% MV 0,092% 0,792% 0,080 Nguồn: Tính toán của tác giả Bảng 3.12 cho thấy danh mục từ phương pháp LSTM tốt hơn đáng kể so với danh mục MV: lợi suất trung bình lớn hơn khá nhiều (0,301% so với 0,092%), nghĩa là tăng thêm ở mức 227% so với danh mục MV. Tuy độ lệch chuẩn của danh mục LSTM-MV cao hơn phần nào so với danh mục MV, nhưng do mức chênh lớn của lợi suất nên tỷ số Sharpe của danh mục LSTM-MV cao hơn đáng kể (0,113 so với 0,080). Như vậy có thể cho rằng trong giai đoạn này, danh mục LSTM-MV có ưu thế khá vượt trội so với danh mục MV. Kiểm định thống kê về sự khác biệt giai đoạn 2008 - 2012: Sự khác biệt về giá trị trung bình của lợi suất (tính theo ngày) và lợi suất tích lũy (tính theo tháng) của ba danh mục sử dụng học máy kết hợp MV so với danh mục MV được thực hiện bởi kiểm định T-bắt cặp (paired t-test). Các kết quả kiểm định được trình bày trong Bảng 3.13. Bảng 3.13. Kiểm định sự khác nhau trong giai đoạn 2008 - 2012 Lợi suất Lợi suất tích lũy Cặp so sánh T-Test P-value T-Test P-value MTS-MV; MV -1,25822 0,20870 -6,54699 0,00000 Lasso; MV -0,33525 0,73753 -0,20237 0,83968 LSTM-MV; MV 0,92927 0,35367 2,86680 0,00454 Nguồn: Tính toán của tác giả Bảng 3.13 cho thấy:
  19. 19 • Lợi suất trung bình theo ngày: sự khác biệt về lợi suất của cả 3 danh mục Học máy so với danh mục MV đều không có ý nghĩa thống kê. Các giá trị P-value tương ứng đều rất lớn, lớn hơn 0,2. • Lợi suất tích lũy theo tháng: sự khác biệt về lợi suất tích lũy của danh mục MTS- MV và LSTM-MV là khác biệt so với danh mục MV một cách có ý nghĩa thống kê, với mức ý nghĩa 1%. Sự khác biệt giữa danh mục Lasso và danh mục MV là không có ý nghĩa thống kê. Giai đoạn 2013 - 2019 So sánh kết quả: Danh mục đề xuất theo phương pháp phân cụm: Kết quả so sánh danh mục MTS-MV và danh mục MV được thể hiện trong Bảng 3.14. Bảng 3.14. So sánh danh mục MTS-MV và MV giai đoạn 2013 - 2019 Chênh lệch với MV Danh mục Trung bình Độ lệch chuẩn SR Trung bình Độ lệch chuẩn MTS-MV 0,092% 1,061% 0,072 68% 156% MV 0,055% 0,414% 0,095 Nguồn: Tính toán của tác giả Bảng 3.14 cho thấy một sự vượt trội khá đáng kể của danh mục MTS-MV so với danh mục MV khi tính theo tiêu chí lợi suất (0,092% so với 0,055%), với mức gia tăng 68 phần trăm. Tuy nhiên nếu sử dụng danh mục này thì nhà đầu tư cũng phải chấp nhận mức rủi ro cao hơn (1,061% so với 0,414%). Từ đó dẫn tới tỷ số Sharpe của danh mục MV-MTS là bé hơn so với danh mục MV (0,072 so với 0,095). Danh mục đề xuất theo phương pháp Lasso: Kết quả so sánh danh mục Lasso và danh mục MV được thể hiện trong Bảng 3.15. Bảng 3.15. So sánh danh mục Lasso và MV giai đoạn 2013 - 2019 Chênh lệch so với MV Danh mục Trung bình Độ lệch chuẩn SR Trung bình Độ lệch chuẩn Lasso 0,060% 0,423% 0,104 -16% 14% MV 0,071% 0,419% 0,113 Nguồn: Tính toán của tác giả Bảng 3.15 cho thấy danh mục Lasso là không tốt bằng danh mục MV: lợi suất trung bình thấp hơn 0,16 điểm phần trăm (0,060% so với 0,071%), và đồng thời, mức rủi ro của danh mục này cũng nhỉnh hơn 0,14 điểm phần trăm. Danh mục đề xuất theo phương pháp LSTM: Kết quả so sánh danh mục MTS-MV và danh mục MV được thể hiện trong Bảng 3.16. Bảng 3.16. So sánh danh mục LSTM-MV và MV giai đoạn 2013 - 2019 Trung Độ lệch Chênh lệch so với MV Danh mục SR bình chuẩn Trung bình Độ lệch chuẩn LSTM-MV 0,216% 3,510% 0,058 209% 1094% MV 0,070% 0,294% 0,194 Nguồn: Tính toán của tác giả
  20. 20 Bảng 3.19 cho thấy trong giai đoạn này, tương tự như giai đoạn trước, kết quả cũng cho thấy sự vượt trội đáng kể của danh mục LSTM-MV so với danh mục MV. Tuy nhiên độ lệch chuẩn của phương pháp này cũng cao hơn đáng kể. Do đó mà tỷ số SR của danh mục LSTM-MV chưa bằng 1/3 giá trị tỷ số này của danh mục MV. Kiểm định thống kê về sự khác biệt giai đoạn 2013 - 2019: Kết quả kiểm định trong giai đoạn 2013-2019 giữa các phương pháp học máy kết hợp MV và phương pháp MV được cho trong Bảng 3.17. Bảng 3.17. Kiểm định sự khác nhau trong giai đoạn 2013 - 2019 Lợi suất Lợi suất tích lũy Cặp so sánh T-Test P-value T-Test P-value MTS-MV; MV 1,38759 0,16551 5,26426 0,00000 Lasso; MV -1,53434 0,12520 -8,43590 0,00000 LSTM-MV; MV 0,78530 0,43282 4,32429 0,00002 Nguồn: Tính toán của tác giả Bảng 3.17 cho thấy: • Lợi suất trung bình theo ngày: sự khác biệt về lợi suất của cả 3 danh mục Học máy so với danh mục MV đều không có ý nghĩa thống kê. Các giá trị P-value tương ứng đều lớn hơn 0,1. • Lợi suất tích lũy theo tháng: sự khác biệt về lợi suất tích lũy của danh mục MTS- MV, LSTM-MV, Lasso là khác biệt so với danh mục MV một cách có ý nghĩa thống kê, với mức ý nghĩa 1%. Trong đó, danh mục MTS-MV và LSTM-MV là ưu việt hơn, còn danh mục Lasso là kém hơn so với danh mục MV. Giai đoạn 2020 - 2022 So sánh kết quả: Danh mục đề xuất theo phương pháp phân cụm: Kết quả so sánh danh mục MTS-MV và danh mục MV được thể hiện trong Bảng 3.18. Bảng 3.18. So sánh danh mục MTS-MV và MV giai đoạn 2020 – 2022 Danh Trung Độ lệch Chênh lệch với MV SR mục bình chuẩn Trung bình Độ lệch chuẩn MTS-MV -0.154% 1.456% -0.112 13% 79% MV -0.176% 0.815% -0.228 Nguồn: Tính toán của tác giả Bảng 3.18 cho thấy danh mục MV-MTS khá tương tự như danh mục MV: trong khi lợi suất của danh mục MV-MTS lớn hơn 0.13 điểm phần trăm, thì độ rủi ro cũng lớn hơn 0.79 điểm phần trăm. Danh mục đề xuất theo phương pháp Lasso: Kết quả so sánh danh mục Lasso và danh mục MV được thể hiện trong Bảng 3.19. Bảng 3.19. So sánh danh mục Lasso và MV giai đoạn 2020 – 2022 Danh Trung Độ lệch Chênh lệch so với MV SR mục bình chuẩn Trung bình Độ lệch chuẩn Lasso -0.153% 0.768% -0.212 4% -7% MV -0.160% 0.829% -0.205 Nguồn: Tính toán của tác giả
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2