intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Xây dựng danh mục tối ưu với kỹ thuật phân cụm chuỗi thời gian trường hợp thị trường chứng khoán Việt Nam

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:12

12
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết này tiến hành xây dựng danh mục tối ưu cho thị trường chứng khoán Việt Nam theo cách tiếp cận mới, gồm hai giai đoạn. Đầu tiên, kỹ thuật phân cụm với chuỗi thời gian sẽ được thực hiện để phân cụm các cổ phiếu. Từ các cụm này, các cổ phiếu đại diện sẽ được chọn dựa trên chỉ số Sharpe.

Chủ đề:
Lưu

Nội dung Text: Xây dựng danh mục tối ưu với kỹ thuật phân cụm chuỗi thời gian trường hợp thị trường chứng khoán Việt Nam

  1. XÂY DỰNG DANH MỤC TỐI ƯU VỚI KỸ THUẬT PHÂN CỤM CHUỖI THỜI GIAN - TRƯỜNG HỢP THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM Bùi Quốc Hoàn Trường Đại học Kinh tế Quốc dân Email: buiquochoan@neu.edu.vn Mã bài: JED - 703 Ngày nhận bài: 02/06/2022 Ngày nhận bài sửa: 27/07/2022 Ngày duyệt đăng: 02/08/2022 Tóm tắt: Việc xây dựng danh mục tối ưu trong thực tế không chỉ quan tâm đến mối quan hệ giữa lợi nhuận – rủi ro mà còn tính đến chi phí quản trị, được thể hiện bởi số lượng cổ phiếu trong danh mục. Bài viết này tiến hành xây dựng danh mục tối ưu cho thị trường chứng khoán Việt Nam theo cách tiếp cận mới, gồm hai giai đoạn. Đầu tiên, kỹ thuật phân cụm với chuỗi thời gian sẽ được thực hiện để phân cụm các cổ phiếu. Từ các cụm này, các cổ phiếu đại diện sẽ được chọn dựa trên chỉ số Sharpe. Ở giai đoạn tiếp theo, thuật toán tối ưu Markowitz được áp dụng cho nhóm các cổ phiếu đại diện để lựa chọn ra được danh mục tối ưu. Kết quả thực nghiệm cho thấy, danh mục tối ưu tìm được bằng phương pháp này tốt hơn đáng kể so với thị trường (đại diện bởi VN-Index) trong giai đoạn nghiên cứu cả về lợi suất trung bình và tỷ suất lợi suất trên rủi ro. Từ khóa: Phân cụm K-means, Tối ưu hóa danh mục đầu tư, Phân cụm chuỗi thời gian, VN- Index. Mã JEL: C02, C38, G11 Portfolio optimization based on time series clustering method –  An empirical study of the Vienamese stock market Abstract: In practice, portfolio optimization does not only deal with the risk-return relationship, but also involves management costs, as shown by the number of stocks in the portfolio. This paper proceeds to build the optimal investment portfolio for stocks listed on the Vietnamese stock market according to a new approach consisting of two phases. First, time series clustering technique will be implemented to cluster the stocks. Then, the stocks with the highest Sharpe ratios from each cluster are selected to create a stock market portfolio. In the next stage, the Markowitz optimization algorithm will be applied to the representative group of stocks to choose the optimal portfolio. The results of our analysis show that the optimal portfolio found by this method outperforms the market (represented by the VN-Index) over the study period in terms of both average return and return after risk adjustment. Keywords: K-means clustering, Portfolio optimization, Time series clustering, VN-Index. JEL codes: C02, C38, G11 Số 302(2) tháng 8/2022 14
  2. 1. Giới thiệu và tổng quan nghiên cứu Lý thuyết danh mục đầu tư hiện đại của Markowitz được sử dụng rộng rãi trong việc xác định danh mục đầu tư. Phương pháp này nhằm tối đa hóa lợi suất kỳ vọng trong khi đảm bảo rủi ro không quá một mức độ nào đó, hoặc cực tiểu hóa rủi ro với một mức lợi nhuận nào đó (Markowitz, 1952). Markowitz đã chỉ ra rằng rủi ro có thể được giảm thiểu bằng việc đa dạng hóa danh mục. Tuy nhiên, việc có quá nhiều cổ phiếu trong danh mục là không cần thiết (Fisher & Lorie, 1970). Số lượng cổ phiếu trong danh mục càng nhiều, thì chi phí theo dõi danh mục càng lớn. Ngoài ra, các kết quả cũng đã chỉ ra rằng sai số dự báo của danh mục tăng theo số lượng cổ phiếu (DeMiguel & cộng sự, 2007). Điều này có thể là do việc ước lượng các tham số càng trở nên kém chính xác nếu số lượng cổ phiếu được đưa vào tính toán khi tối ưu hóa bằng mô hình Markowitz là lớn (Black & Litterman, 1992). Do đó gần đây, người ta quan tâm đến việc giới hạn lượng cổ phiếu được xem xét, và thường là dựa vào kỹ thuật phân cụm. Trong các nghiên cứu về phân cụm cổ phiếu có thể phân ra thành hai cách tiếp cận là sử dụng dữ liệu tĩnh và sử dụng chuỗi thời gian. Phân cụm với dữ liệu tĩnh dựa vào các thuộc tính của dữ liệu được cố định, không biến động theo thời gian. Phân cụm với chuỗi thời gian dựa trên các đặc điểm động của dữ liệu. Chẳng hạn, khi xem xét dữ liệu là lợi suất của một cổ phiếu, nếu ta sử dụng giá trị trung bình của lợi suất để phân cụm, thì giá trị này là cố định và không biến động trong cả giai đoạn. Trong khi đó để sử dụng chuỗi thời gian, ta sẽ xem xét giá trị lợi suất của cổ phiếu biến động theo mỗi ngày. Gần đây, các nghiên cứu về phân cụm với chuỗi thời gian được sử dụng trong nhiều lĩnh vực. Các kết quả đáng chú ý được tổng hợp trong các bài viết của Liao (2005), Aghabozorgi & cộng sự (2015) và Ali & cộng sự (2020). Sử dụng phân cụm với dữ liệu tĩnh, Nanda & cộng sự (2010) dùng phương pháp K-means, SOM (Self- Organizing Maps: bản đồ tự tổ chức) và FCM (Fuzzy C-means: C-means mờ) phân cụm các cổ phiếu trên thị trường chứng khoán Bombay (Ấn Độ). Các thuộc tính được đại diện cho các cổ phiếu là các giá trị tài chính được tính trong khoảng thời gian nghiên cứu. Ngoài ra, các tác giả còn sử dụng thêm các giá trị lợi suất trung bình theo các chu kỳ khác nhau, trong khoảng ngắn hạn (ngày, tuần, 30 ngày) và dài hạn (3 tháng, 6 tháng và 1 năm). Kết quả thực nghiệm cho thấy phân cụm bằng phương pháp K-means là tốt nhất trong 3 phương pháp được sử dụng. Cùng với đó, lợi suất của các danh mục đầu tư tìm được theo mô hình Markowitz (khi sử dụng kết quả phân cụm làm đầu vào) cao hơn lợi suất của chỉ số Sensex. Vẫn theo các tiếp cận này, Nejad (2014) đã sử dụng các phương pháp K-means, FCM và SOM để phân cụm các cổ phiếu trên thị trường chứng khoán Tehran của Iran. Các thuộc tính được lựa chọn là các chỉ số tài chính: doanh thu tài sản, tỷ suất lợi nhuận ròng, lợi nhuận trên mỗi cổ phần, tốc độ tăng tổng lợi nhuận, tốc độ tăng lợi nhuận trên mỗi cổ phần, tỷ lệ giá trị thị trường trên giá trị sổ sách, tỷ lệ giá trên lợi nhuận, doanh thu của vốn cổ đông. Kết quả thực nghiệm cho thấy việc phân cụm làm giảm thời gian lựa chọn danh mục nhưng vẫn đảm bảo được tính đa dạng, rủi ro của danh mục được giảm thiểu. Trong nghiên cứu khác của Tavakoli & cộng sự (2020), các tác giả đưa ra một cách tiếp cận phân cụm chuỗi thời gian theo thuật toán autoencoder của học sâu (deep learning). Thuật toán K-means được sử dụng trong bước thứ nhất để xác định cụm mà các chuỗi thời gian sẽ được gán vào. Khi thực hiện phân cụm theo K-means, chuỗi thời gian được đại diện bởi thuộc tính lợi suất và độ rủi ro (tính trên toàn bộ khoảng thời gian). Các chuỗi thời gian với các nhãn là số cụm của chuỗi thuộc vào sau đó được tiếp tục sử dụng đưa vào mô hình phân cụm học sâu. Các tác giả nhận thấy việc sử dụng học sâu có thể phát hiện ra những thuộc tính ẩn mà K-means có thể không phát hiện ra. Tuy nhiên, kết quả ở giai đoạn sử dụng học sâu không quá khác biệt so với kết quả khi sử dụng phân cụm K-means. Một cách tiếp cận khác, là phân cụm dựa trên tính chất chuỗi thời gian của cổ phiếu. Trong đó, mỗi đặc tính của cổ phiếu không chỉ được đại diện bởi một giá trị duy nhất cho cả giai đoạn nghiên cứu, mà được đại diện bởi nhiều thông tin dọc theo cả giai đoạn đó. Chẳng hạn, Iorio & cộng sự đã phân cụm dựa theo biến động của chuỗi giá đóng cửa. Trong nghiên cứu này, các tác giả đã sử dụng các hệ số ước tính theo phương pháp hàm ghép trơn (B-spline) để đại diện cho đường cong giá đóng cửa. Phân cụm K-means được thực hiện trên hệ số ước tính B-spline từ các chuỗi. Các cụm gồm các cổ phiếu có biến động giá tương tự nhau. Kết quả thực nghiệm sử dụng 86 cổ phiếu trên thị trường chứng khoán Italia. Bài viết gợi ý nhà đầu tư về việc xây dựng danh mục sau khi phân cụm, các nhà đầu tư có thể lựa chọn cổ phiếu từ các cụm theo tiêu chí của cá nhân. Trong một nghiên cứu khác, Kim & Kim (2020) đã thực hiện so sánh 10 độ đo khoảng cách giữa các chuỗi thời gian khi thực hiện phân cụm theo hai phương pháp là phân cụm phân cấp và K-means. Các tác Số 302(2) tháng 8/2022 15
  3. giả sử dụng phân loại khoảng cách đo sự tương đồng của các chuỗi thời gian theo Montero & Vilar (2014). Sự tương đồng của hai chuỗi có thể xác định bởi sự gần nhau của các giá trị tại một vài thời điểm cụ thể. Khoảng cách cũng có thể xác định từ việc sử dụng các tham số nhận được từ mô hình khi áp dụng trên các chuỗi thời gian. Phức tạp hơn, khoảng cách có thể dựa trên việc đo lường mức độ thông tin được chia sẻ bởi cả hai chuỗi thời gian. Các tác giả thực hiện hai phương pháp phân cụm là phân cụm phân cấp và K-means với 10 khoảng cách cho chuỗi thời gian. Kết quả thực nghiệm cho thấy không có cách phân cụm nào có ưu thế rõ rệt. Ở Việt Nam, thị trường chứng khoán đã khá phát triển, với số lượng mã cổ phiếu trên sàn giao dịch thành phố Hồ Chí Minh (HOSE) tính đến ngày 29/04/2022 theo Ủy ban chứng khoán nhà nước công bố là 408 cổ phiếu. Các nghiên cứu về vấn đề lựa chọn danh mục tối ưu còn khá hạn chế, một số ít các nghiên cứu đã được thực hiện. Chẳng hạn, Võ Thị Thúy Anh (2012) đã ứng dụng lý thuyết trung bình - phương sai Markowitz để lựa chọn cổ phiếu thống trị. Cổ phiếu thống trị được tác giả định nghĩa là “những cổ phiếu mà không có cổ phiếu nào có tỷ suất sinh lợi kỳ vọng cao hơn hoặc bằng nó nhưng lại có rủi ro thấp hơn”. Trần Văn Trí (2015) nghiên cứu về vấn đề xây dựng và quản lý danh mục đầu tư trên thị trường chứng khoán Việt Nam. Tác giả ứng dụng mô hình định giá tài sản vốn và lý thuyết danh mục đầu tư Markowitz với số liệu từ Sở Giao dịch Chứng khoán Thành phố Hồ Chí Minh và Hà Nội giai đoạn 2008-2013. Tuy nhiên, hầu như chưa có nghiên cứu nào sử dụng kỹ thuật phân cụm để lọc các cổ phiếu trước khi thực hiện bài toán tối ưu danh mục trên thị trường chứng khoán Việt Nam. Nghiên cứu này khác với các nghiên cứu trước là, trong nghiên cứu sẽ sử dụng phương pháp phân cụm để chia các cổ phiếu vào các cụm, các cổ phiếu trong cụm sẽ có sự tương quan cao với nhau. Thêm vào đó, kỹ thuật phân cụm được sử dụng ở đây là kỹ thuật phân cụm theo chuỗi thời gian, chứ không phải là phân cụm thông thường, là một kỹ thuật còn được hiếm sử dụng trong các nghiên cứu về thị trường chứng khoán tại Việt Nam. Sau khi các cổ phiếu được phân vào các cụm, chỉ số Sharpe được sử dụng để lấy từ mỗi cụm các cổ phiếu có chỉ số cao nhất và thiết lập danh mục. Các cổ phiếu có chỉ số Sharpe cao được chọn ngụ ý với cùng mức rủi ro việc đầu tư vào các cổ phiếu này sẽ đem lại lợi suất tốt hơn các cổ phiếu có chỉ số thấp hơn. Cuối cùng, trọng số của danh mục tối ưu được lập bằng cách sử dụng mô hình Markowitz với mục tiêu tối thiểu hóa rủi ro. Kết quả sẽ được so sánh với danh mục cơ sở là VN-Index. Các giai đoạn xây dựng danh mục tối ưu có thể được tóm tắt trong Hình 1. Các giai đoạn xây dựng danh mục tối ưu có thể được tóm tắt trong Hình 1. Bài viết này sử dụng phương pháp phân cụm với chuỗi thời gian để đề xuất danh mục trước khi thực hiện Hình 1. Các giai đoạn xây dựng danh mục tối ưu Nguồn: Theo Nanda & cộng sự (2010). tối ưu hóa. Tác giả hy vọng đóng góp được một số điểm mới về nghiên cứu thực nghiệm trong việc xây dựng danh mục tối ưu trên thị trường chứng khoán tại Việt Nam. Bố cục của bài viết như sau: phần đầu tiên là Giới thiệu và tổng quan nghiên cứu, phần tiếp theo là Phương pháp hainày sử dụng phương pháp phân cụm với chuỗi thời gian để đề xuất tả dữ mục trước khi tư là Bài viết giai đoạn trong lựa chọn doanh mục đầu tư, phần thứ ba là Mô danh liệu, phần thứ Kết quả thực nghiệm, vàTác giả hy vọng đóng góp được một số điểm mới về nghiên cứu thực nghiệm trong thực hiện tối ưu hóa. cuối cùng là phần Kết luận. 2. việcdụng hai danhđoạntối ưu trên thị trường chứng khoán tư Việt Nam. Sử xây dựng giai mục trong lựa chọn danh mục đầu tại 2.1. Giai đoạn 1:bài viết như sau: phần đầu tiên là Giới thiệu và tổng quan nghiên cứu,lựa chọn các cổ phiếu Bố cục của Sử dụng K-means với chuỗi thời gian để phân cụm cổ phiếu và phần tiếp theo là đưa vào danh mục giai đoạn trong lựa chọn doanh mục đầu tư, phần thứ ba là Mô tả dữ liệu, phần thứ tư Phương pháp hai là Kết quả thực nghiệm, và cuối cùng là phần Kết luận. Số 302(2) tháng 8/2022 16 2. Sử dụng hai giai đoạn trong lựa chọn danh mục đầu tư 2.1. Giai đoạn 1: Sử dụng K-means với chuỗi thời gian để phân cụm cổ phiếu và lựa chọn các cổ
  4. Phân cụm là việc nhóm các đối tượng thành các cụm, sao cho sự tương đồng của các đối tượng trong một cụm cao hơn so với các đối tượng ngoài cụm đó. Nhiều thuật toán phân cụm đã được đưa ra, chúng khác nhau về cách xác định sự tương đồng và cách thiết� lập các cụm. Sự tương đồng giữa các đối tượng thường � � 𝑑𝑑(𝑥𝑥𝑥 𝑥𝑥� )� được thể hiện bởi khoảng cách giữa chúng. Nếu khoảng cách giữa hai đối tượng nhỏ thì hai đối tượng được ��� ���� coi là tương đồng cao (giống nhau về đặc điểm đang xem xét), ngược lại nếu khoảng cách giữa hai đối tượng lớn thì hai đối tượng được coi là ít tương đồng.� � � 𝑑𝑑(𝑥𝑥𝑥 𝑥𝑥� )� Phương pháp K-means phát 𝑆𝑆 𝑆 𝑆𝑆𝑆� , 𝑆𝑆MacQueen=(1967) ,…,Lloyd (1982). K-means là một thuật toánđiểm trong đó x là quan sát, biểu bởi � , … , 𝑆𝑆� } S���{S1,S2 và Sk} là các cụm và μi là trung bình của các phân 2.1.1. Phương pháp K-means ��� � cụm phântrong Sđơn giản vàgọi là tâmdụng Si). phổ biến. Các đối tượng tương tự được nhóm trong cùng một vùng i (còn được được sử cụm khá các bình phương sai sốthực𝑆𝑆hiện𝑆𝑆𝑆� , 𝑆𝑆� ,toán𝑆𝑆K-means 1như tử tronglà các cụm và μi là trung bình của các điểm 𝑆 trong đó x là quan sát, mỗi tâm cụm � } S = {S ,S2,…, Sk} cụm. … , và các phần cụm bằng cách sử dụng tinh chỉnh lặp đi lặp lại với mục tiêu là giảm thiểu hàm tổn thất được tính bởi tổng Các bước giữa thuật sau: Phân cụmi 1. Tìm k phâncụm ban đầu i(có thể chọn phần cách lấy ngẫu nhiêncụm có tử). (trung bình của các trong S K-means tâm làphầncụm S ). cụm, mỗi bằng tử được phân vào k phần tâm (còn được gọi tâm tử vào � phần tử) gần 2. nhất. Trong mỗi lần tinh chỉnh,phần tử tớilà tối thiểu hóa tổng bình phương cụm có tâm gần nó Tính toán khoảng cách của mỗi mục tiêu các tâm. Phần tử sẽ được phân vào khoảng cách: � � 𝑑𝑑(𝑥𝑥𝑥 𝑥𝑥� )� Các bước thực hiện thuật toán K-means như sau: nó nhất. ��� ���� 1. 3. Tính lại k tâm cụm bằngthể chọn bằng cách lấy ngẫu nhiên ktử được gán cho mỗi cụm. Tìm k tâm cụm ban đầu (có cách lấy trung bình tất cả các phần phần tử). trong đó x 4. quan lại các bước12 và 3 mỗi}phần tử cáccác tâm.là không bìnhthay phân điểm trong Si (còn được 2. là Lặp sát, S = {S ,S của cho đến các tới tâm cụmPhần tử còn của đổi. vào cụm có tâm gần Tính toán khoảng cách ,…, S là khi cụm và μ trung sẽ được các Cáctrong đóTínhquanksát, 𝑆𝑆 cụm � , K-means S =trung bình Sk}cả các phầnvà μđược gánbình của các điểm bước thực hiện thuật 𝑆 𝑆𝑆𝑆bằng … , 𝑆𝑆� } như sau:2,…, tất là các cụm tử i là trung cho mỗi cụm. lại tâm toán 𝑆𝑆� , cách lấy {S1,S 2 k i nó nhất. gọi là tâm cụm Si) Trong làphương pháp K-means có hai yếu tố cần quan tâm, đó là hàm khoảng cách và số lượng cụm khi 3. x thực(còn được gọi là tâm cụm Si). hiện phân cụm. trong Si Lặp lại các đầu 2 và 3 chọn bằng các tâm ngẫu nhiên k thay đổi. 1.Tìm k tâm cụm ban bước(có thể cho đến khi cách lấycụm không cònphần tử). 4. 2.Tính CácTrongthựccách thuậtmỗi phần phương pháp, K-meanslà hàmsử dụng cáchdữ liệulượng mỗi phần tử toánbước phát biểu bantoán hai yếu tới các tâm. Phần tử được khoảng với và số tĩnh, gần khi khoảng hiện của đầu của tử như sau: Trong phương pháp K-means có K-meanstố cần quan tâm, đó sẽ được phân vào cụm có tâm cụm nó nhất. 3.Tính được đạikdiện bởi các cách lấy thể chọn bằngnhư các điểm mtử được Tuy nhiên, phương pháp này có thể lại Tìm cụm bằng giá trị cố định (giống cách lấy phần chiều). gán cho thực1. k tâm tâm cụm ban đầu (có trung bình tất cả các ngẫu nhiên k phần tử). mỗi cụm. hiện phân cụm. sử dụng được với dữ liệu chuỗi thời gian. Trong bài viết này, việc phân cụm thực hiện bởi phương pháp 4. Lặp lại các bước 2 và 3 cho đến khi các tâmtới cáckhông còn thay đổi.phân vào cụm có tâm gần cụm tâm. Trong phát biểu ban cách của mỗi phần tử để K-meansPhần tửsử dụng với dữ cổ tĩnh, 2. Tính toán khoảng đầu được sẽ được K-means với khoảng cáchcủa phương pháp, đo mức độ tương quan giữa các liệuphiếu. mỗi phần tử được lựa chọn Trong phương phápcác giá trị cố định (giống như các điểm m đó là hàm khoảngphương pháp lượng cụm khi được đại diện bởi K-means có hai yếu tố cần quan tâm, chiều). Tuy nhiên, cách và số này có thể nó nhất. thực hiện2.1.2. Khoảngtâm cụm bằng cách lấy trung bình tất cả các phần tử được gán cho mỗi cụm. phân cụm. 3. Tính lại k cách sử dụng sử dụng được với dữ liệu chuỗi thời gian. Trong bài viết này, việc phân cụm thực hiện bởi phương pháp Trong phátLặp lạiban bước của phương pháp, K-means được sử dụng đổi. dữ liệu tĩnh, mỗi phần tử được 4. biểu các đầu 2 và 3 cho đến khi các tâm cụm không còn thay với K-means với khoảng cách (1998) đãchọnxuấtđo mức độ tương quan giữa đồng giữa các chuỗi thời gian là Golay & cộng sự được lựa đề để khoảng cách đo sự tương các cổ phiếu. đại diện bởiphương phápcố định (giống như tố cần quanm chiều). Tuy khoảng cách và số lượng cụm khi sử dụng Trong các giá trị K-means có hai yếuquan Pearson (còn được gọi là khoảng cáchpháp này có thể các điểm tâm, đó là hàm nhiên, phương khoảng cách dựa trên hệ số tương Pearson): được với dữKhoảng cách sử dụng Trong bài viết này, việc phân cụm thực hiện bởi phương pháp K-means với 2.1.2. liệu chuỗi thời gian. thực hiện phân cụm. khoảng cách được lựa chọn để đo mức độ tương quan giữa các cổ phiếu. được đại diện bởi trên hệ số tương (giống (𝑥𝑥𝑥 𝑥𝑥) (còn m chiều). Tuy (1) 𝑑𝑑��� như các �2�1 − 𝜌𝜌(𝑥𝑥𝑥 khoảng cách Pearson): khoảng cách dựa các giá trị cố định quan Pearson=điểmđược gọi là𝑥𝑥)� nhiên, phương pháp này có thể Golay phát biểusự (1998) đã đề xuất khoảng cách đo sự tương đồng giữa các chuỗi thời gian là Trong & cộng dụng 2.1.2. Khoảng cách sửban đầu của phương pháp, K-means được sử dụng với dữ liệu tĩnh, mỗi phần tử Golay & cộng sự (1998) đã đề xuất khoảng cách đo sự tương đồng giữa các chuỗi thời gian là khoảng cách dựadụng được với dữ liệu chuỗi thời gian. Trong bàigọi là khoảng cách Pearson): bởi phương pháp sử trên hệ số tương quan Pearson (còn được viết này, việc phân cụm thực hiện 𝑑𝑑 (𝑥𝑥𝑥 𝑥𝑥) = �2�1 − 𝜌𝜌(𝑥𝑥𝑥 𝑥𝑥)� (1) 2.1.2. Khoảng cách sử dụng quan Pearson, đo sự tương quan tuyến tính giữa 𝑥𝑥 và 𝑦𝑦: K-means với khoảng cách được lựa chọn để đo mức độ tương quan giữa các cổ phiếu. ��� trong đó ρ là hệ số tương trong đó ρ là hệ số tương quan Pearson, đo sự∑� (𝑥𝑥�quan)tuyến tính giữa 𝑥𝑥 và 𝑦𝑦: tương − 𝑥𝑥̅ (𝑦𝑦� − �)𝑦𝑦 trong đó ρ là& cộngtương quan Pearson, khoảngtươngđo sự tương đồng giữa các chuỗi thời gian là Golay hệ số sự (1998) đã đề xuất đo sự cách quan tuyến tính giữa x và y: 𝜌𝜌(𝑥𝑥𝑥 𝑥𝑥) = ��� (2) �∑���(𝑥𝑥� − 𝑥𝑥̅ )� �∑���(𝑦𝑦� − �)� khoảng cách dựa trên hệ số tương quan Pearson (còn được gọi là khoảng cách Pearson): � � 𝑦𝑦 𝑑𝑑��� (𝑥𝑥𝑥 𝑥𝑥) = � �2�1 − 𝜌𝜌(𝑥𝑥𝑥 𝑥𝑥)� (1) với μx, μy là giá trị trung bình và𝑥𝑥) x=σy là độ ���(𝑥𝑥chuẩn(𝑦𝑦� − �) y. 𝜌𝜌(𝑥𝑥𝑥 σ , ∑ lệch � − 𝑥𝑥̅ ) của x 𝑦𝑦 (2) � (𝑥𝑥 −lệch �∑� (𝑦𝑦� x �)y. �∑���lànghĩa ̅ )� chuẩn của − và � của chúng là tương đồng lớn với 𝑥𝑥 là xu ��� biến 𝑦𝑦 và với μx, y là giá trị trung bình và σx, có � Khi hai chuỗiμcó tương quan dương cao,σy độ thế động ρ là hệ chuỗi có tương quan dương cao, có nghĩa là tính giữa 𝑥𝑥 và 𝑦𝑦: nhau, thì khoảng cách giữa hai chuỗi là bé. Và ngược lại, khi hệ số tương quan là thấp, thì sự tương đồng là trong đó Khi hai số tương quan Pearson, đo sự tương quan tuyếnxu thế biến động của chúng là tương đồng lớn bé đi, sự khác biết về xu thế biến động là lớn hơn – khoảng cách sẽ là lớn hơn. Khi hệ số tương quan âm, hai chuỗi với xu thếlà giá trị trung bình chiều, nhau độkhoảng cách giữa hai chuỗi sẽ càngquan là thấp, thì sự tương có vớiμy biến động ngược và σxhaiy chuỗi lệch chuẩn của x lại, y. hệ số tương lớn. nhau, thì khoảng cách giữa σ là – là bé. Và ngược khi Trong nghiên cứu này, chúng quan dương∑� (𝑥𝑥đặc 𝑥𝑥̅ )(𝑦𝑦là− �) mỗi cổđộng của chúng là tươngcổ phiếu dưới tôi sử dụng ��� � − trưng xu thế 𝑦𝑦 μ x, và quan hai chuỗi có tương thế phiếu cao, có nghĩa � nhaucổbiến (2) Đặc điểm chuỗi sẽ cànglớn dạng chuỗi thời gian, gồm lợi 𝜌𝜌(𝑥𝑥𝑥 𝑥𝑥) = ∑� và độ biến chiều (𝑦𝑦 − – khoảng cách giữa haiquan sát của cổ phiếu đồng là bé đi, sự khác biết về xu thế biến động là lớn hơn – khoảng cách sẽ là lớn hơn. Khi hệ số tương với nhau, thì khoảng cách giữa hai � ���(𝑥𝑥�bé. 𝑥𝑥̅ )� �∑��� lại, khi hệ số tương quan là thấp, thì sự tương suất cổ biến động ngược động của �)� chuỗi là − Và ngược � 𝑦𝑦 các cho phiếu là thông tin về đồng � Khi âm, hai chuỗi có xu lớn. phiếu đó. sẽ được ghi nhận theo từng ngày giao dịch. đồng là bé đi, sự khác biết về xu thế biến động là lớn hơn – khoảng cách sẽ là lớn hơn. Khi hệ số tương Nghiên cứu này sử dụng hai chuỗi thời gian thể hiện đặc điểm của cổ phiếu là chuỗi lợi suất và độ biến động của μxâm, hai chuỗi có xu thếvà σx, độngđộ lệch chuẩn nhau – khoảng cách giữa hai chuỗi sẽ càng lớn. định quan biến ngược chiều với chuỗilà giá trị trung biến động được đo lường bởi 6 x và y. sai có điều kiện thay đổi và được xác , μy lợi suất. Độ bình σy là phương của Khi hai chuỗi có tương quan dương cao, có nghĩa là xu thế biến động của chúng là tương đồng lớn 17 Số 302(2) tháng 8/2022 với nhau, thì khoảng cách giữa hai chuỗi là bé. Và ngược lại, khi hệ số tương quan là thấp, thì sự tương 6 đồng là bé đi, sự khác biết về xu thế biến động là lớn hơn – khoảng cách sẽ là lớn hơn. Khi hệ số tương quan âm, hai chuỗi có xu thế biến động ngược chiều nhau – khoảng cách giữa hai chuỗi sẽ càng lớn.
  5. biến động của chuỗi lợi suất. Độ biến động được đo lường bởi phương sai có điều kiện thay đổi và được xác định từ mô hình GARCH(1,1) (Engle & Rangle, 2008). Khi đó, khoảng cách giữa hai cổ phiếu được xác định như sau. Trước tiên, chúng tôi xác định khoảng cách giữa hai chuỗi lợi suất của hai cổ phiếu này, theo công thức (1), ký hiệu là d1, tương tự cho khoảng cách giữa hai chuỗi độ biến động, ký hiệu là d2. Khoảng cách giữa hai cổ phiếu sẽ là giá trị kết hợp bởi hai giá trị d1 và d2 theo công thức: từ mô hình GARCH(1,1) (Engle & Rangle, + d d = d1 2008). Khi đó, khoảng cách giữa hai cổ phiếu được xác định như 2 sau. Trước tiên, chúng tôi xác định khoảng cách giữa hai chuỗi lợi suất của hai cổ phiếu này, theo công thức (1), ký hiệu là d1, tương nhằm đại diện cho sự tươnghai chuỗi độ biến động, ký hiệu là d2. Khoảng cách giữa Giá trị khoảng cách này tự cho khoảng cách giữa đồng của hai cổ phiếu khi xem xét đồng thời theo hai cổ phiếu sẽ là giá độ biếnhợp bởi hai giágian. 1 và d2 theo công thức: Pearson, khi khoảng cách đặc trưng: lợi suất và trị kết động theo thời trị d Tương tự như khoảng cách giữa hai cổ phiếu lớn nghĩa là hai cổdphiếu + d2 tương đồng thấp. = d1 có sự Giá trị khoảng cách này nhằm đại diện cho sự tương đồng của hai cổ phiếu khi xem xét đồng thời theo 2.1.3 Lựa chọn số cụm đặc trưng: lợi suất và độ biến động theo thời gian. Tương tự như khoảng cách Pearson, khi khoảng cách giữa Một trong các cách lựa chọn số cụm k trong phương pháp K-means là sử dụng phương pháp khuỷu hai cổ phiếu lớn nghĩa là hai cổ phiếu có sự tương đồng thấp. 2.1.3 Lựa chọn số Phương pháp này xác định độ phân tán trong cụm Wk cho các giá trị của k với: tay (Elbow method). cụm Một trong các cách lựa chọn số cụm k trong phương pháp K-means là sử dụng phương pháp khuỷu tay 1 � (Elbow method). Phương pháp này xác định độ phân tán trong cụm Wk cho các giá trị của k với: 𝑊𝑊� = � � 𝑑𝑑𝑑𝑑𝑑𝑑 𝑑𝑑𝑑 2|𝑆𝑆� | ��� �𝑑���� trong đó |Si | là số lượng quan sát trong cụm i và d (x,y) là khoảng cách giữa quan sát x và y. Số lượng cụm “tối ưu” là giá trị k mà khi ta tăng số cụm thêm nhưng hiệu quả giải thích của việc phân cụm không cải thiện nhiều. Biểu đồ giá trị của Wk tương ứng với giá trị của k thường được vẽ ra và giá trị được lựa chọn |Si | biểu hiện như một “khuỷu tay” trong biểu đồ. 2.1.4. Lựa chọn các cổ phiếu từ các cụm đưa vào danh mục 5 cổ Ratio = chỉ cụm thêm cao − trong mỗi rủi được trong đó |Si | là số lượng quanphân vào cụm cụm, chỉ số Sharpe của các cổquan sát x và y Số lượng Sau khi các cổ phiếu được sát trong các i và d (x,y) là khoảng cách giữa phiếu trong mỗi cụm được tính toán. Sau ưu” từ giá trịSharpekhi ta tăng số số Sharpe nhưng hiệu quả giải thíchro việc phânđể lậpkhông mục đầu cụm “tối đó, là 3 đến k mà phiếu có Lợi suất trung bình nhấtLãi suất phicụm của lấy ra cụm danh tư. Tiếp theo trọng số của cáccủa phiếu trong danh chuẩnđầu tưthường được vẽ ra và giáviệc giảilựa toán tối cải thiện nhiều. Biểu đồ giá trị cổ Wk tương Độ lệch giá trị của k sẽ được xác định qua trị được bài ứng với mục của lợi suất Lợi suất trung bình − Lãi suất phi rủi ro ưu Markowitz. như một “khuỷu tay” trong biểu đồ. chọn biểu hiện đầu tư trung bình − ro suất phi rủi ro Ở đây, khi thực hiện lựa chọn cổRatio = theo lý thuyết danh mục đầu tư hiện đại của Markowitz, chúng ta Sharpe phiếu Các đánh chọnchỉ số suất vàcao phù NhàLợi suấtcó thể giảm rủicủacủa suất bộ cố định. Cách tư 2.1.4. phiếu có các cổ phiếu rủi ro. hợp với mục Độ lệch chuẩn ro lợi lợi phảicổ Lựađổi giữa lợi Sharpe từ các cụm đưa vào danh mụcthiểu rủiLãi vớitoànsuất danh mục đầulựa bằng cách tiêu tối Sharpe Ratio = saicứu của Marvin làm giảm Iorio & kỳ vọng. kết hợp hai này tương tự như trong phương cụm, Độ số Sharpe của các cổ phiếu trong mỗi cụm được chọn Sausố chứng khoán được phân vào các âm, chỉ không (2015) và lợi tức cộng sự (2018). chỉ khi các cổ phiếu có hiệp các nghiên màlệch chuẩn của lợi suất theo trọng số của các cổ trung bình − Lãi Marvin tư sẽ được xác & cộng việc giải 2.2. Giai đoạn 2: Giải3bài toán Markowitz xác định tỷcủa Sharpecác cổ phiếu trong danh mục danh thức: tính toán. Sau đó, từ đến 5 cổtheo kết quả công bố trọng củatrong mỗi cụm số được tính theo công Chỉ số Sharpe được đặt tên phiếu có chỉ số Sharpe cao nhất (1964). Chỉ được lấy ra để lập |𝑆𝑆� | thuyết danhSharpe RatioMarkowitzĐộ lệch chuẩn của lợi suấtđầu tư là phương sai của chuỗi lợi Các cổ phiếu có chỉ số Sharpe cao phù hợp với mục tiêu tối thiểu rủi ro với lợi suất cố định. Cách lựa Lợi suất phiếu trong danh suất phi rủi ro mục đầu tư. Tiếp này tương tự như trong các nghiên cứu củamục đầu (2015) và Iorio định quasự (2018). Lýchọn chỉ số mục đầu tư = xác định rủi ro danh mục Lợi với trung bình − Lãi suất phi rủi ro bài toán tối ưu Markowitz. tức của2.2. Giai đoạn 2: Giải toántoán Markowitz xác định tỷ trọng tối ưu trong phiếu trong này cómục danh mục đầu tư. Bài bài Markowitz để xác định danh mục của các cổ trường hợp danh thể Các cổ phiếu có chỉ số Sharpe cao phù hợp suấtmục tiêu tối thiểu rủi ro với lợi suất cố định. Cách lựa chọn biểu biễn dưới dạng toán học như sau: phiếu theo lý thuyết danh mục đầu tư hiện đại của Markowitz, Ở đây, khi thực hiện Sharpe cổ lựa chọn chỉ số này Lý thuyết như trong đầuRatio = cứu của Marvinchuẩn của lợi đầu tư là phương sai của chuỗi lợi tương tự danh mục các tư Markowitz xác định rủi(2015) và Iorio & cộng sự (2018). nghiên Độ lệch ro danh mục của chúng ta phải đánh đổi giữa lợi suất và rủi mục tiêu tối thiểu rủi ro với lợisuất toàn bộ Cách lựa Các cổ phiếu có chỉ số Sharpe cao phù hợp với ro. Nhà đầu tư có thể giảm rủi rosuất cố định. danh mục đầu 2.2. tức của danh mục đầu tư. Bài toán Markowitz để xáctỷ trọng của các cổ phiếu trong danhnày có thể Giai đoạn 2: Giải bài toán Markowitz xác định định danh mục tối ưu trong trường hợp mục � � � chọntư bằngnày tươnghợpnhư trong các nghiênhiệp phương sai âm, mà và Iorio & cộng sự (2018). vọng. chỉ số cách kết tự hai chứng khoán có cứu của Marvin (2015) không làm giảm lợi tức kỳ được đặtmin�𝜎𝜎 � � kếtmin �định𝜎𝜎 � + � �(1964). Chỉ𝑖𝑖 số được tính mụchợp thức: Chỉ số Sharpe đầubài toán toán Markowitz  𝑤𝑤bốxác định của�các𝑤𝑤 𝜎𝜎 phiếu𝑖trong danhtheo côngnày có thể biểu tên Markowitz xác để tỷ trọng danh mục tối ưu 𝑖𝑖trong trường theo = quả công � của Sharpe   𝑤𝑤 � � cổ �� , � Lý thuyết danh mục đầu tư học như sau:xác định rủi ro danh mục đầu tư là phương sai của chuỗi lợi tức biểu biễn dưới dạng toán Markowitz � biễn dưới dạng toán học như sau: � � = ��� �   𝑤𝑤�� ��� � �   �   𝑤𝑤� 𝑤𝑤� 𝜎𝜎�� , 𝑖𝑖 𝑖 𝑖𝑖 min� 𝜎𝜎 � � min 𝜎𝜎�� ��� 2.2.của danh mục Giai đoạn 2: Giải tư. Bài � � � ��� ��� ��� �� với các ràng buộc: tư. Bài toán Markowitz để xác định � 𝜎𝜎 � + � tối ưu𝑤𝑤 𝑤𝑤 𝜎𝜎 trường 𝑖𝑖 min�𝜎𝜎 = min � 7𝑤𝑤�danh mục   �   trong�� , 𝑖𝑖 𝑖 hợp này có thể   Lý thuyết danh mục đầu tư Markowitz xác định rủi ro danh mục đầu tư là phương sai của chuỗi lợi � � � tức của danh mục đầu ��� ��� ��� 1. ∑�   � = 1: với các ràng𝑤𝑤buộc: tổng tỉ trọng (trọng số) trong danh mục bằng 1 biểu biễn dưới dạng toán học như sau: 1. với�các𝑤𝑤ràng1: tổng tỉ trọng (trọng số) trong danh mục bằng 1 ∑���   � = buộc: ��� 𝑤𝑤� ≥ 0 với 𝑖𝑖 𝑖𝑖𝑖 𝑖 𝑖 𝑖𝑖: không được bán�khống 𝑤𝑤� ≥ 0 với 𝑖𝑖 𝑖𝑖𝑖 𝑖 𝑖 𝑖𝑖: không được�bán khống � � min�𝜎𝜎 � � = min �   𝑤𝑤� 𝜎𝜎 � + �   �   𝑤𝑤� 𝑤𝑤� 𝜎𝜎 , 𝑖𝑖 𝑖 𝑖𝑖 2. 3. ∑1.   ∑� 𝑅𝑅�   𝑤𝑤� =�1:lợi suất trọngdanh � số) lớn hơn hoặc �� bằng 1 suất cho trước � ��� 𝑤𝑤��� ≥ 𝑅𝑅 : tổng tỉ của (trọng � � 2. 3. ∑���   𝑤𝑤� 𝑅𝑅� ≥ 𝑅𝑅� : lợi suất của danh mục lớn��� ��� bằng lợi suất cho trước ��� mục trong danh mục bằng lợi các ràng 𝜎𝜎 ��� =𝑤𝑤 ��𝑅𝑅� 𝐸𝐸�𝑅𝑅 𝑖𝑖𝑖 𝑖 là phương sai của cổ phiếu 𝑖𝑖 và 𝜎𝜎�� = 𝐸𝐸 ��𝑅𝑅� − 𝐸𝐸 � 𝑅𝑅� �� �𝑅𝑅� − 𝐸𝐸�𝑅𝑅� ��� với trong đó buộc: 𝐸𝐸 �𝐸𝐸≥ 0− − 𝑖𝑖𝐸𝐸 ����� �𝑖 � 𝑖𝑖: không được bán khống trong đó 𝜎𝜎 𝑅𝑅 � � hơn hoặc � = ��𝑅𝑅� � � 2. với 3. ∑� 𝑤𝑤� 𝑅𝑅� ≥ 𝑅𝑅� : lợi và của danh mục là hiệp phương sai  giữa cổ phiếu isuất cổ phiếu j. lớn hơn hoặc bằng lợi suất cho trước ��� 1. ∑�   𝑤𝑤� = 1:�tổng𝐸𝐸tỉ trọng (trọng số) trong danh mục bằng 1 (định trước)đó 𝜎𝜎�chophiếu 𝑖𝑖 và thấp� �� � Trong bài viết này, lợi suất kỳ vọng là lợi suất trung bình của toàn = ��𝑅𝑅� − 𝐸𝐸�𝑅𝑅 nhất. � ��� Chúng tôi thực hiện tìm vectơ trọng số của danh mục đầu tư đảm bảo một mức lợi tức kỳ vọng nhất định thị trường0 với 𝑖𝑖 mỗi giai 𝑖𝑖: không đượccứu. Trọng số của các cổ phiếu của danh mục tối ưu là lời giải của bài 2. 𝑤𝑤� ≥ trong 𝑖𝑖𝑖 𝑖 𝑖 đoạn nghiên bán khống trong là phương saisao cổ rủi ro là của 𝜎𝜎�� tối ��𝑅𝑅� − 𝐸𝐸�𝑅𝑅� �� toán= 𝐸𝐸 ưu Markowitz.�𝑅𝑅� − 𝐸𝐸�𝑅𝑅� ��� 3. ∑� phương sai :của cổ phiếu danh mục lớn hơn hoặc bằng lợi suất cho trước ���   𝑤𝑤� 𝑅𝑅� ≥ 𝑅𝑅� lợi suất của 𝑖𝑖 và 𝐸𝐸 𝐸𝐸 ��𝑅𝑅 𝐸𝐸�𝑅𝑅� �� � trong đó 𝜎𝜎��𝜎𝜎= = ��𝑅𝑅� − − 𝐸𝐸�𝑅𝑅 �� �𝑅𝑅 − 𝐸𝐸�𝑅𝑅 ��� là Số 302(2) tháng 8/2022 � là hiệp phương sai giữa cổ phiếu 𝑖𝑖 và cổ phiếu 𝑗𝑗. 18 �� � � � � Chúng tôi thực hiện tìm vectơ trọng số của danh mục đầu tư đảm bảo một mức lợi tức kỳ vọng
  6. 3. Mô tả dữ liệu sử dụng Bài báo sử dụng số liệu giá đóng cửa của các cổ phiếu được giao dịch trên sàn chứng khoán thành phố Hồ Chí Minh, thị trường chứng khoán Việt Nam. Để đánh giá kết quả của phương pháp trong các khoảng 𝑝𝑝�,� thời gian khác nhau, chúng tôi thực hiện kết quả trên bốn khoảng thời gian: từ ngày 3/1/2018 đến ngày 𝑟𝑟�,� = ln 28/12/2018 (năm 2018), từ ngày 2/1/2019 đến ngày 31/12/2019 (năm 2019), và từ ngày 3/1/2018 đến ngày 𝑝𝑝�,��� 𝑝𝑝�,� 31/12/2029 (hai năm 2018 – 2019), từ ngày 2/1/2020 đến ngày 31/12/2021 (hai năm 2020 - 2021). Những cổ Lợi suất của cổ phiếu i tại ngày t được xác định bởi công thức: 𝑟𝑟�,� = ln ln 𝑝𝑝 𝑟𝑟�,� = 𝑝𝑝�,� 𝑝𝑝�,� phiếu mới tham gia hoặc ngừng niêm yết không giao dịch đủ trong các khoảng thời gian này được loại bỏ. 𝑟𝑟�,� = ln 𝑝𝑝�,����,��� 𝑝𝑝�,��� 𝑟𝑟�,� = µ + 𝜎𝜎 ε�,� với ∀i = 1,2, … . , N� trong đó pi,t và pi,t-1 lần lượt là giá của �,� phiếu i tại ngày t và ngày t-1 Chuỗi biến động cổ phiếu i trong ngày t được xác định theo +µ 𝜎𝜎hình GARCH(1,1):… . , N� . , N� 𝑟𝑟�,� = µ= + ε�,� với với ∀i = 1,2, … 𝑟𝑟�,� mô �,� 𝜎𝜎�,� ε�,� ∀i = 1,2, cổ Phương trình trung bình: 𝑟𝑟�,� = µ + 𝜎𝜎�,� ε�,� với ∀i = 1,2, … . , N� : σ� = 𝛼𝛼� + α���,��� � �� + β𝜎𝜎�,��� � � �,� Phương trình phương saiσ:�σ= =� 𝛼𝛼� α���,��� � ����� β𝜎𝜎�,���� : �,� �,� 𝛼𝛼 + + α���,��� � + + � �,��� β𝜎𝜎 � � : σ�,� = 𝛼𝛼� + α���,��� � �� + β𝜎𝜎�,��� � � � với α > số VN-Index 0; đoạn 𝛼 𝛼 Hình 2.�Chỉ 0, α > 0, β >giai𝛼𝛼 𝛼 𝛼𝛼 2/1/2018 – 31/12/2019 vớivới >�0, α0, α0, β 0, β > 0; 𝛼𝛼 𝛼 𝛼𝛼𝛼 𝛼 𝛼 α� α > > > > 0; 𝛼𝛼 𝛼 𝛼𝛼 𝛼 trong đó Nt là số lượng cổ phiếu trong ngày t; εi,t là các biến ngẫu nhiên độc lập, cùng phân phối chuẩn hóa. vớiTrong năm 2019,β >dao 𝛼𝛼 𝛼 𝛼𝛼 của 𝛼VN-Index không quá chênh lệch, trong α� > 0, α > 0, sự 0; động 𝛼 Giai đoạn đầu năm 2018 chỉ số Vn-Index có sự tăng và đạt mức cao nhất hơn 1200 điểm. Sau đó chỉ số VnIndex1819_xts 2018-01-02 / 2019-12-31 thay đổi quanh ngưỡng 950 điểm. 1200 1200 khoảng gần 900 tới hơn 1000 điểm. 1150 1150 1100 1100 Hình 2. Chỉ số VN-Index giai đoạn 2/1/2018 – 31/12/2019 1050 1050 1000 VnIndex1819_xts 2018-01-02 / 2019-12-31 1000 1200 1200 950 950 1150 1150 900 900 1100 1100 Jan 02 2018 Apr 02 2018 Jul 02 2018 Oct 01 2018 Jan 02 2019 Apr 01 2019 Jul 01 2019 Oct 01 2019 Dec 31 2019 1050 1050 1000 1000 Nguồn: Tác giả tính toán. 950 950 900 900 Giai đoạn này VN-Index giảm khá nhiều, mức lợi suất trung bình của VN-Index là giá trị âm Jan 02 2018 Apr 02 2018 Jul 02 2018 Oct 01 2018 Jan 02 2019 Apr 01 2019 Jul 01 2019 Oct 01 2019 Dec 31 2019 (−0.000714) và mức rủi ro là 0.0110. Nguồn: Tác giả tính toán. Hình 3. Lợi suất theo ngày của VN-Index giai đoạn 2018 – 2019 Giai đoạn này VN-Index giảm khá nhiều, mức lợi suất trung bình của VN-Index là giá trị âm returnVnIndex1819 2018-01-03 / 2019-12-31 (−0.000714) và mức rủi ro là 0.0110. 0.02 0.02 0.00 Hình 3. Lợi suất theo ngày của VN-Index giai đoạn 2018 – 2019 0.00 -0.02 -0.02 returnVnIndex1819 2018-01-03 / 2019-12-31 -0.04 -0.04 0.02 0.02 0.00 03 2018 Jan Apr 02 2018 Jul 02 2018 Oct 01 2018 Jan 02 2019 Apr 01 2019 Jul 01 2019 Oct 01 2019 Dec 31 2019 0.00 Nguồn: Tác giả tính toán. -0.02 -0.02 -0.04 -0.04 Số 302(2) tháng 8/2022 19 Trong năm 2018, VN-Index tăng trong khoảng đầu năm sau đó bước vào giai đoạn giảm. Chỉ số Jan 03 2018 Apr 02 2018 Jul 02 2018 Oct 01 2018 Jan 02 2019 Apr 01 2019 Jul 01 2019 Oct 01 2019 Dec 31 2019 kết thúc năm 2018 với mức điểm ở ngưỡng 900 điểm (thấp nhất trong năm). Do đó, lợi suất trung bình
  7. Hình 4. VN-Index giai đoạn 3/1/2018 – 28/12/2018 Hình 4. VN-Index giai đoạn 3/1/2018 – 28/12/2018 VnIndex18_xts 2018-01-02 / 2018-12-28 1200 1200 VnIndex18_xts 2018-01-02 / 2018-12-28 1150 1150 1200 1200 1100 1100 1150 1150 1050 1050 1100 1100 1000 1000 1050 1050 950 950 1000 1000 900 900 950 950 900 02 2018 Jan Mar 01 2018 May 02 2018 Jul 02 2018 Sep 04 2018 Nov 01 2018 900 Dec 28 2018 Nguồn: TácMar 01 2018 toán.02 2018 Jan 02 2018 giả tính May Jul 02 2018 Sep 04 2018 Nov 01 2018 Dec 28 2018 Nguồn: Tác giả tính toán. Hình 5. Lợi suất theo ngày của VN-Index trong năm 2018 Hình 5. Lợi suất theo ngày của VN-Index trong năm 2018 returnVnIndex18 2018-01-03 / 2018-12-28 returnVnIndex18 2018-01-03 / 2018-12-28 0.02 0.02 0.02 0.00 0.02 0.00 0.00 0.00 -0.02 -0.02 -0.02 -0.04 -0.02 -0.04 -0.04 -0.04 Jan 03 2018 Mar 01 2018 May 02 2018 Jul 02 2018 Sep 04 2018 Nov 01 2018 Dec 28 2018 Jan 03 2018 Mar 01 2018 May 02 2018 Jul 02 2018 Sep 04 2018 Nov 01 2018 Dec 28 2018 Nguồn: Tác giả tính toán. Nguồn: Tác giả tính toán. giai đoạn 2/1/2019 – 31/12/2019 Hình 6. VN-Index trưởng. Lợi suất VN-Index tăng trong giai đoạn đầu là 0.00030 có giảm nhưng 0.00685. Trong năm 2019, VN-Index tăng trong giai đoạn đầu năm sau đó có giảm nhưng nhìn chung có sự VnIndex19_xts 2019-01-02 / 2019-12-31 tăng trưởng. Lợi suất trung bình của VN-Index năm 2019 là 0.00030 và mức rủi ro là 0.00685. tăngTrong năm 2019, trung bình của VN-Index năm 2019 năm sau đó và mức rủi ro là nhìn chung có sự 1000 1000 950 950 900 900 Jan 02 2019 Mar 01 2019 May 02 2019 Jul 01 2019 Sep 03 2019 Nov 01 2019 Dec 31 2019 Nguồn: Tính toán của tác giả. Giai đoạn này VN-Index giảm khá nhiều, mức lợi suất trung bình của VN-Index là giá trị âm (-0.000714) và mức rủi ro là 0.0110. 10 Hình 7. Lợi suất theo ngày của VN-Index trong năm 2019 Trong năm 2018, VN-Index tăng trong khoảng đầu năm sau đó bước vào giai đoạn giảm. Chỉ số kết thúc 10 năm 2018 với mức điểm ở ngưỡng 900 điểm (thấp nhất trong năm). Do đó, lợi /suất trung bình của VN-Index returnVnIndex19 2019-01-03 2019-12-31 năm 2018 là -0.00044 và mức rủi ro là 0.01408. Trong năm 2019, VN-Index tăng trong giai đoạn đầu năm sau đó có giảm nhưng nhìn chung có sự tăng 0.01 0.01 0.00 0.00 Số 302(2) tháng 8/2022 20 -0.01 -0.01 -0.02 -0.02
  8. Jan 02 2019 Mar 01 2019 May 02 2019 Jul 01 2019 Sep 03 2019 Nov 01 2019 Dec 31 2019 Nguồn: Tính toán của tác giả. trưởng. Lợi suất trung bình của VN-Index năm 2019 là 0.00030 và mức rủi ro là 0.00685. Hình 7. Lợi suất theo ngày của VN-Index trong năm 2019 returnVnIndex19 2019-01-03 / 2019-12-31 0.01 0.01 0.00 0.00 -0.01 -0.01 -0.02 -0.02 Jan 03 2019 Mar 01 2019 May 02 2019 Jul 01 2019 Sep 03 2019 Nov 01 2019 Dec 31 2019 Nguồn: Tính toán của tác giả. Lợi suất phi rủi ro được sử dụng để tính chỉ số Sharpe là trung bình lãi suất trái phiếu chính phủ 10 năm trong mỗi giai đoạn. Giá trị được tính toán theo số liệu công bố trên trang vn.investing.com. Lợi suất phi rủi ro được sử dụng để chỉ số Sharpe là trung bình lãi suất trái phiếu chính phủ 10 năm Giai đoạn từ 2/1/2020 đến 31/12/2021 là một giai đoạn biến động mạnh của thị trường chứng khoán Việt là một nhậnđoạn tăngtrị là 4.58%/năm. trong giai đoạn 2018 - 2019. Chúng tôi tính toán theo số liệu được công bố trên trang vn.investing.com Nam. VN-Index sụt giảm trong 4 tháng đầu năm 2020 từ ngưỡng 1000 điểm xuống mức 659 điểm. Sau đó và giai được giá mạnh của VN-Index tới ngưỡng 1500 điểm vào cuối năm 2021. 4. Kết quả thực nghiệm đến 31/12/2021 là một giai đoạn biến động mạnh của thị trường chứng khoán Giai đoạn từ 2/1/2020 4.1. Số cụmVN-Index sụt giảm trong 4 tháng đầu năm 2020 từ ngưỡng 1000 điểm xuống mức 659 điểm. Việt Nam. lựa chọn đoạn này, từ suất phi cụm và sử dụng phương chỉ số Sharpe là 2.53%/năm. Để tìm ra số cụm tối ưu, chúng tôi thực hiện phân ngưỡng 1500 điểm lần. cuối năm các giá trị của số cụm Sau đó là một giai đoạn tăng mạnh của VN-Index tới cụm K-means 20 vào Mỗi lần 2021. Trong giai được xem xét lợi 2 đến 10rủi ro được sử dụng để tính pháp khuỷu tay để xác định số cụm lựa chọn. Số cụm tối ưu là giá trị có tần suất cao nhất trong số 20 lần thực hiện phân cụm. Hình 8. VN-Index giai đoạn 2/1/2020 – 31/12/2021 VnIndex2021_xts 2020-01-02 / 2021-12-31 1400 1400 1200 1200 1000 1000 11 800 800 Jan 02 2020 Jun 01 2020 Nov 02 2020 Apr 01 2021 Sep 01 2021 Số cụm lựa chọn với dữ liệu trong các giai đoạn được thể hiện trong Bảng 1. Trong năm 2018, các cổ phiếu tập trung trong Cụm 3, chiếm gần 50% tổng số cổ phiếu. Trong năm 2019, 4. Kết quả thực nghiệm các cổ phiếu tập trung trong hai Cụm 3 và Cụm 4. Tương tự như vậy, trong các giai đoạn 2018 – 2019 và 4.1. Số cụm lựa chọn 2020 - 2021, cũng tồn tại một cụm tập trung nhiều cổ phiếu hơn hẳn các cụm còn lại. Điều này cho thấy rằng nhiều cổ phiếura số cụm tối ưu,có sự tương quan cao. cụm K-means 20 lần. Mỗi lần các giá trị của số Để tìm trên thị trường chúng tôi thực hiện phân Sau khi tính toán chỉ số đến 10 cụm và sử dụng phương phápcụm, 3 tay để xác định số cụm Sharpe cao nhất cụm được xem xét từ 2 Sharpe của các cổ phiếu trong mỗi khuỷu – 5 cổ phiếu có chỉ số lựa chọn. sẽ được lựa chọnlà giá trịdanh mục. Tiếpnhất trong số số của thực cổ phiếu trong danh mục sẽ được xác định Số cụm tối ưu để tạo có tần suất cao theo, trọng 20 lần các hiện phân cụm. để cho danh mục tối ưu.với dữ liệu trong các giai đoạn được thể hiện trong Bảng 1. Số cụm lựa chọn 4.2. Xác định danh mục tối ưu Bài toán tối ưu theo mô hình Markowitz được sửcổ phiếu trongtơ trọng số của danh mục sao cho mức rủi Bảng 1. Số lượng dụng tìm véc các cụm ro là thấp nhất với lợi suất không nhỏ 2 lợi suất trung bình4của VN-Index. Cụm 6 Giai đoạn Cụm 1 Cụm hơn Cụm 3 Cụm Cụm 5 Tổng 2018 62 73 150 19 28 332 Số 302(2) tháng 8/2022 21 2019 48 148 132 36 364 2018 - 2019 20 54 30 174 46 324 2020 – 2021 114 59 34 12 43 91 353
  9. Để tìm ra số cụm tối ưu, chúng tôi thực hiện phân cụm K-means 20 lần. Mỗi lần các giá trị của số cụm được xem xét từ 2 đến 10 cụm và sử dụng phương pháp khuỷu tay để xác định số cụm lựa chọn. Số cụm tối ưu là giá trị có tần suất cao nhất trong số 20 lần thực hiện phân cụm. Số cụm lựa chọn với dữ liệu trong các giai đoạn được thể hiện trong Bảng 1. Bảng 1. Số lượng cổ phiếu trong các cụm Giai đoạn Cụm 1 Cụm 2 Cụm 3 Cụm 4 Cụm 5 Cụm 6 Tổng 2018 62 73 150 19 28 332 2019 48 148 132 36 364 2018 - 2019 20 54 30 174 46 324 2020 – 2021 114 59 34 12 43 91 353 Nguồn: Tính toán của tác giả. 4.3. Nhận xét kết quả Kết quả tính toán trêncác cổ phiếu tậpđược cho trong Bảng 3. gần 50% tổng số cổ phiếu. Trong năm Trong năm 2018, các giai đoạn trung trong Cụm 3, chiếm Chuỗi các suất tích tập trung các danh Cụm 3 và Cụmsánh với chuỗi lợi suất tích lũy của VN-Index. Danh 2019, lợi cổ phiếu lũy của trong hai mục được so 4. Tương tự như vậy, trong các giai đoạn 2018 – 2019 và 2020 - 2021, cũng tồn tại một cụm tập trung nhiều cổ phiếu hơn hẳn các cụm còn lại. Điều này mục tìm được khi thực hiện phương pháp với dữ liệu trong năm 2019 cho lợi suất tích lũy cao hơn của VN- cho thấy rằng nhiều cổ phiếu trên thị trường có sự tương quan cao. Bảng 2. Tỷ trọng các cổ phiếu trong danh mục tối ưu Sau khi tính toán chỉ số Sharpe của các cổ phiếu trong mỗi cụm, 3 – 5 cổ phiếu có chỉ số Sharpe cao nhất sẽ được lựa chọn để tạo danh mục.2019 theo, trọng 2018 - 2019 cổ phiếu trong – 2021mục sẽ 2018 Tiếp số của các 2020 danh được xác định để cho danh mục tối ưu. Cổ Cổ Cổ Cổ TT Tỷ trọng Tỷ trọng Tỷ trọng Tỷ trọng phiếu phiếu phiếu phiếu 0.03145 0.02265 0.00152 0.01028 4.2. Xác định danh mục tối ưu 1 ACL BCG ACL DCM mức rủi ro là thấpANV với0.02362 không nhỏ hơn lợi suất trung bình của VN-Index. 0.02614 0.03007 DHM 0.10829 Bài toán tối ưu theo mô hình Markowitz được sử dụng tìm véc tơ trọng số của danh mục sao cho 2 DAH ANV 0.08528 0.13001 0.06237 0.23533 nhất lợi suất 3 APG Bảng 2. Tỷ trọng các cổ phiếu trong danh mục tối ưu GAB DHG APG 4 CIG 0.05326 FIR 0.29532 CCL 0.05351 KDC 0.12361 0.02944 0.02869 0.02515 0.09277 12 5 CMX FIT CMX LBM 6 FTM 0.28493 GTN 0.02923 DAH 0.09443 LCM 0.00162 7 NTL 0.08172 SAM 0.28633 HOT 0.02053 LHG 0.01221 8 OGC 0.03348 TCH 0.05804 IJC 0.06911 PDR 0.11711 9 SFG 0.12889 TNC 0.01972 LGC 0.04946 SHI 0.05115 10 SMA 0.04006 TRC 0.04932 NTL 0.05171 SVT 0.04194 11 SVI 0.05149 VCB 0.05456 PGD 0.07148 TGG 0.01600 12 TNI 0.13091 SVI 0.05483 TNT 0.00338 13 UDC 0.02547 TNI 0.12638 TVS 0.08609 14 VCB 0.04244 VPG 0.04161 15 VSH 0.24701 VSC 0.5862 Tổng 𝟏𝟏 𝟏𝟏 𝟏𝟏 1 Nguồn: Tính toán của tác giả. Index trong toàn bộ giai đoạn. Danh mục tìm được với dữ liệu trong năm 2018 có khoảng 4 tháng đầu thấp hơn nhưng sau đó vẫn thể hiện ưu thế trong giai đoạn tiếp theo. Tương tự trong năm 2018, khi sử dụng dữ liệu của giai đoạn 2018 – 2019, lợi suất tích lũy của danh mục vẫn cao hơn của VN-Index trong khoảng thời gian sau tháng 4/2018. Trong giai đoạn 2020 – 2021, lợi suất tích lũy của danh mục đề xuất thể hiện ưu thế so với lợi suất tích Số 302(2) tháng 8/2022 22
  10. 4.3. Nhận xét kết quả Kết quả tính toán trên các giai đoạn được cho trong Bảng 3. Bảng 3. Lợi suất trung bình và độ lệch chuẩn của lợi suất của các danh mục và của VN-Index Giai đoạn Lợi suất trung bình Độ lệch chuẩn của lợi suất VN-Index Danh mục VN-Index Danh mục 2018 −0.00044 0.00136 0.01408 0.00806 2019 0.00030 0.00131 0.00685 0.00504 2018 - 2019 −0.00007 0.00078 0.011048 0.00818 2020 - 2021 0.00088 0.00332 0.01390 0.01040 Nguồn: Tính toán của tác giả. lũy của VN-Index. Trong 4 tháng đầu năm 2020, VN-Index giảm điểm, nhưng trong khoảng thời gian này lợi suất tích lũy của danhlũy của cáckhá mạnh. được so sánh với chuỗi lợi suất tích lũy của VN-Index. Chuỗi lợi suất tích mục tăng danh mục Danh mục tìm được khi thực hiện phương pháp với dữ liệu trong năm 2019 cho lợi suất tích lũy cao Có thể thấy rằng, trong những giai đoạn mà VN-Index được điểm thì các danh mục càng có lợi suất tích hơn của VN-Index trong toàn bộ giai đoạn. Danh mục tìm tăng với dữ liệu trong năm 2018 có khoảng Hình 9. nhưng sau đó VN-Index giai đoạn và của danh tiếp trong năm 2018 Hình 8. lũy của VN-Index 2/1/2020 – 31/12/2021 4 tháng đầu thấp hơn Lợi suất tích vẫn thể hiện ưu thế trong giai đoạn mục theo. Tương tự trong năm 2018, khi sử dụng dữ liệu của giai đoạn 2018 – 2019, lợi suất tích lũy của danh mục vẫn cao hơn của VnIndex2021_xts 2020-01-02 / 2021-12-31 VN-Index trong khoảng thời gian sau tháng 4/2018. 1400 1400 1200 1200 Hình 8. Lợi suất tích lũy của VN-Index và của danh mục trong năm 2018 1000 1000 Loi800 tich luy trong nam 2018 suat 2018-01-03 / 2018-12-28 800 0.4 VnIndex Port2TS 0.3 Jan 02 2020 Jun 01 2020 Nov 02 2020 Apr 01 2021 Sep 01 2021 0.2 Hình 10. Lợi suất tích lũy của VN-Index và của danh mục trong năm 2019 Hình 9. 0.1 suất tích lũy của VN-Index và của danh mục trong năm 2019 4. Kết quả thực nghiệm 0.0 Loi suat tich luy trong nam 2019 2019-01-03 / 2019-12-31 4.1. Số cụm lựa chọn -0.1 VnIndex Port2TS Để tìm ra số cụm tối ưu, chúng tôi thực hiện phân cụm K-means 20 lần. Mỗi lần các giá trị của số 0.3 03 2018 Jan Mar 01 2018 May 02 2018 Jul 02 2018 Sep 04 2018 Nov 01 2018 Dec 28 2018 cụm được xem xét từ 2 đến 10 cụm và sử dụng phương pháp khuỷu tay để xác định số cụm lựa chọn. Số cụm tối ưuNguồn:trị có tần suất cao nhất trong số 20 lần thực hiện phân cụm. là giá Tính toán của tác giả. 0.2 Số cụm lựa chọn với dữ liệu trong các giai đoạn được thể hiện trong Bảng 1. 0.1 Bảng 1. Số lượng cổ phiếu trong các cụm 0.0 Giai đoạn Cụm 1 Cụm 2 Cụm 3 Cụm 4 Cụm 5 Cụm 6 Tổng 2018 Jan 03 2019 62Mar 01 2019 73 May 02 2019 150 Jul 01 2019 19 Sep 03 2019 28 Nov 01 2019 Dec 31 2019 332 14 2019 48 148 132 36 364 Nguồn: Tính toán của tác giả. 2018 - 2019 20 54 30 174 46 324 lũy tăng cao. 2021 năm114 2020 – Trong 2021, cùng59 sự tăng điểm mạnh của VN-Index, danh mục tìm được cho lợi suất với 34 12 43 91 353 tích lũyNguồn: Tính lần so với tạigiả. điểm đầu năm 2020. của danh mục trong giai đoạn 2018 - 2019 tăng gần 7 toán Lợi suất thời lũy của VN-Index và Hình 10. của tác tích 5. Kết luận Loi suat tich luy trong giai doan 2018 - 2019 2018-01-03 / 2019-12-31 Trong năm 2018,VnIndex cổ phiếu tập trung trong Cụm 3, chiếm gần 50% tổng số cổ phiếu. Trong năm các 302(2) tháng 8/2022 0.5 Port2TS 23 Số 2019, các cổ phiếu tập trung trong hai Cụm 3 và Cụm 4. Tương tự như vậy, trong các giai đoạn 2018 – 0.4 2019 và 2020 - 2021, cũng tồn tại một cụm tập trung nhiều cổ phiếu hơn hẳn các cụm còn lại. Điều này 0.3 cho thấy rằng 0.2 nhiều cổ phiếu trên thị trường có sự tương quan cao.
  11. Jan 03 2019 Mar 01 2019 May 02 2019 Jul 01 2019 Sep 03 2019 Nov 01 2019 Dec 31 2019 Nguồn: Tính toán của tác giả. Hình 11. Lợi suất tích lũy của VN-Index và của của danh mục trong giai đoạn 2018 2019 Hình 10. Lợi suất tích lũy của VN-Index và danh mục trong giai đoạn 2018 - - 2019 Loi suat tich luy trong giai doan 2018 - 2019 2018-01-03 / 2019-12-31 VnIndex 0.5 Port2TS 0.4 0.3 0.2 0.1 0.0 -0.1 Jan 03 2018 Apr 02 2018 Jul 02 2018 Oct 01 2018 Jan 02 2019 Apr 01 2019 Jul 01 2019 Oct 01 2019 Dec 31 2019 Nguồn: Tính toán của tác giả. Hình 11. Lợi suất tích lũy của VN-Index Hình 12. Lợi suất tích lũy của VN-Index và của danh mục2021 giai đoạn 2020 - 2021 và của danh mục trong giai đoạn 2020 - trong Loi suat tich luy trong giai doan 2020 - 2021 2020-01-03 / 2021-12-28 VnIndex Port2TS 6 5 4 3 2 1 Jan 03 2020 Apr 01 2020 Jul 01 2020 Oct 01 2020 Jan 04 2021 Apr 01 2021 Jul 01 2021 Oct 01 2021 Nguồn: Tính toán của tác giả. 15 Mục đích của bài báo này xây dựng danh mục tối ưu kết hợp giữa phân cụm chuỗi thời gian và tối ưu hóa Markowitz. Phương pháp Kmeans thường đượclũy dụng với mục vécxuất thểsố) thể hiện so với lợi suất của Trong giai đoạn 2020 – 2021, lợi suất tích sử của danh các đề tơ (bộ hiện ưu thế những đặc điểm đối tích lũy Trong bài viết, Trong 4 sử dụng phân cụm K-means với chuỗi thờinhưng Sự tương đồng giữa các tượng. của VN-Index. tác giả tháng đầu năm 2020, VN-Index giảm điểm, gian. trong khoảng thời cổ phiếu được đánhtích lũy của qua chuỗităngsuất mạnh. biến động của chuỗi lợi suất của cổ phiếu. Các cổ gian này lợi suất giá thông danh mục lợi khá và độ phiếu có sự tương quan trong những giai đoạn mà VN-Index tăng điểm thì các danh cổ phiếu tốt nhất trong các Có thể thấy rằng, dương mạnh được nhóm thành các cụm. Sau đó, những mục càng có lợi suất cụm (theo chỉ số Sharpe) được 2021, cùng với sự tăng điểm mạnh của VN-Index, danh mục tìm được cho tích lũy tăng cao. Trong năm chọn để lập danh mục đầu tư. Việc lựa tích lũy tăng gần phiếuso với tại thời điểmđưa ra một danh mục có số lượng nhỏ cổ phiếu. Điều đó lợi suất chọn một số cổ 7 lần trong các cụm sẽ đầu năm 2020. giúp các nhà đầu tư dễ dàng kiểm soát và giảm chi phí trong việc quản trị. Nhà đầu tư cũng thuận lợi hơn 5. Kết luận trong việc thu thập thông tin bổ sung về các cổ phiếu trong danh mục. Ngoài ra, bài toán Markowitz phải sử dụng các đích của bàimẫu nàydanh dựng danh mục tối ưu kết hợp giữa phân cụm chuỗi thời gian vàước lượng Mục ước lượng báo từ xây mục. Số lượng cổ phiếu nhỏ sẽ làm giảm bớt sai số của các tối đầuưu hóa Markowitz. Phương pháp Kmeans thường được sử dụng với các véc tơ (bộ số) thể hiện những vào này. Kết quả thực nghiệm được thực bài viết, tác giả sử dụng phâncác cổK-means với giai đoạn hai giai đoạn: từ đặc điểm của đối tượng. Trong hiện với dữ liệu lợi suất của cụm phiếu trong chuỗi thời gian. Sự ngày 3/1/2018 giữa ngày 28/12/2019 đánh giá thông qua chuỗi lợi suất31/12/2021. Haicủa chuỗi lợi suất diện tương đồng đến các cổ phiếu được và từ ngày 2/1/2020 đến ngày và độ biến động giai đoạn này đại chocủa cổ phiếu. Các cổ thường” sự tương quan dương mạnh được nhóm thành cácvà 2021, các nhà đầu tư bị hai thời gian “bình phiếu có và “chịu tác động khách quan”. Hai năm 2020 cụm. Sau đó, những ảnhcổ phiếutâmnhất trong các cụm (theo VN-Index thay đổi khá “cực đoan”: mục đầu tư. sau đó tăng mạnh. hưởng tốt lý bởi dịch Covid nên chỉ số Sharpe) được chọn để lập danh giảm sâu và Tuy nhiên, danh mục được đề xuất trong các giai đoạn thể hiện lợi thế so với tiêu chuẩn chung thị trường (đại diện bởilựa chọn một số cổso sánhtrongVN-Index, trong các giai đoạn danh mục tối nhỏ đềuphiếu.lợi suất Việc VN-Index). Khi phiếu với các cụm sẽ đưa ra một danh mục có số lượng ưu cổ cho Điều đó giúp các nhà đầu tư dễ dàng kiểm soát và giảm chi phí trong việc quản trị. Nhà đầu tư cũng Số thuận lợitháng 8/2022 thu thập thông tin bổ sung về các cổ phiếu trong danh mục. Ngoài ra, bài toán 302(2) hơn trong việc 24 Markowitz phải sử dụng các ước lượng mẫu từ danh mục. Số lượng cổ phiếu nhỏ sẽ làm giảm bớt sai số của các ước lượng đầu vào này.
  12. trung bình cao hơn và độ lệch chuẩn của chuỗi lợi suất thấp hơn. Trong những giai đoạn VN-Index có lợi suất trung bình dương, danh mục có lợi suất tích lũy cao hơn rõ rệt so với lợi suất tích lũy của VN-Index. Dựa vào kết quả thực nghiệm có thể thấy kỹ thuật xây dựng danh mục tối ưu dựa trên phân cụm chuỗi thời gian có hiệu quả trong giai đoạn nghiên cứu. Chúng tôi hy vọng kết quả này có thể là một phương pháp để các nhà đầu tư tham khảo khi tham gia thị trường chứng khoán. Tài liệu tham khảo Aghabozorgi, S., Shirkhorshidi, A. S. & Wah, T. Y. (2015), ‘Time series clustering - A decade review’, Information System, 53, 16 - 38. Black, F. & Litterman, R. (1992), ‘Global portfolio optimization’, Financial Analysts Journal, 48(5), 28 - 43. Demiguel, V., Garlappi, L. & Uppal R. (2007), ‘Optimal versus Naive Diversification: How Inefficient Is the 1/N Portfolio Strategy?’, The Review of Financial Studies, 22, 3411 - 3447. Engle, R.F. & Rangel, J.G. (2008), ‘The spline-GARCH model for low-frequency volatility and its global macroeconomic causes’, The Review of Financial Studies, 21(3), 1187-1222. Fisher, L. & Lorie, J. (1970), ‘Some studies of variability ofreturns on investments in common stock’, Journal of Business, 43(2), 99 - 134. Lloyd, S.P. (1982), ‘Least squares quantization in PCM’, IEEE Transactions on Information Theory, 28 (2), 129–137, Golay, X., Kollias, S., Stoll, G., Meier, D., Valavanis, A. & Boesiger, P. (1998), ‘A new correlation-based fuzzy logic clustering algorithm for FMRI’, Magnetic Resonance in Medicine, 40(2), 249–260. Iorio, C., Frasso, G., Dambrosio, A. & Siciliano, R. (2018), ‘A p-spline based clustering approach for portfolio selection’, Expert Systems with Applications, 95, 88 - 103. Javed, A., Lee, B.S. & Rizzo, D.M. (2020), ‘A benchmark study on time series clustering’, Machine Learning with Applications, DOI: 10.1016/j.mlwa.2020.100001. Kim, J. & Kim, J. (2020), ‘Comparison of time series clustering methods and application to power consumption pattern clustering’, Communications for Statistical Applications and Methods, 27(6), 589 - 602. Marvin, K. (2015), ‘Creating diversified portfolios using cluster analysis’, Independent Work Report Fall, Princeton University. Markowitz, H. (1952), ‘Portfolio Selection’, The Journal of Finance, 7(1), 77 - 91. MacQueen, J.B. (1967), ‘Some Methods for classification and Analysis of Multivariate Observations’, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1:281-297 Montero, P., & Vilar, J. A. (2014), ‘TSclust: An R Package for Time Series Clustering’, Journal of Statistical Software, 62(1), 1 – 43. Nanda, S., Mahanty, B. & Tiwari, M. (2010), ‘Clustering Indian stock market data for portfolio management’, Expert Systems with Applications, 37, 8793 - 8798. Nejad, M.K. (2014), ‘Clustering stock exchange data by using evolutionary algorithms for portfolio management’, European Research Studies Journal, 17(4), 55 - 66. Liao, T.W. (2005), ‘Clustering of time series data - A survey’, Pattern Recognition, 38(11), 1857 - 1874. Tavakoli, N., Siami-Namini, S., Adl Khanghah, M., Soltani, F.M. & Namin, A.S. (2020), ‘An autoencoder-based deep learning approach for clustering time series data’, Springer Nature Applied Sciences, 2, DOI: https://doi. org/10.1007/s42452-020-2584-8. Trần Văn Trí (2015), ‘Xây dựng và quản lý danh mục đầu tư chứng khoán ở Việt Nam’, Luận án Tiến sĩ, Học viện Ngân hàng, Sharpe, W.F. (1994), ‘The sharpe ratio’, Journal of Portfolio Management, 21(1), 49 – 58. Võ Thị Thúy Anh (2012), ‘Đề xuất lựa chọn cổ phiếu thống trị theo lý thuyết Markowitz’, Công nghệ Ngân hàng, số 75 tháng 6/2012, 53 – 55. Số 302(2) tháng 8/2022 25
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2