BỘ GIÁO DỤC ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TP. HỒ CHÍ MINH
TRẦN HÙNG CƯỜNG
TÁC ĐỘNG CỦA BIẾN MỚI ĐƯA THÊM VÀO
MÔ HÌNH ĐẾN CẤU TRÚC DANH MỤC CỔ PHIẾU
NGHIÊN CỨU THỰC NGHIỆM CHO
THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM
LUẬN VĂN THẠC SĨ KINH TẾ
THÀNH PHỐ HỒ CHÍ MINH - 2017
BỘ GIÁO DỤC ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TP. HỒ CHÍ MINH
TRẦN HÙNG CƯỜNG
TÁC ĐỘNG CỦA BIẾN MỚI ĐƯA THÊM VÀO
MÔ HÌNH ĐẾN CẤU TRÚC DANH MỤC CỔ PHIẾU
NGHIÊN CỨU THỰC NGHIỆM CHO
THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM
Chuyên ngành: Tài chính - Ngân hàng
Mã ngành: 60340201
LUẬN VĂN THẠC SĨ KINH TẾ
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. NGUYỄN VĂN SĨ
THÀNH PHỐ HỒ CHÍ MINH - 2017
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu và kết quả
nghiên cứu trong luận văn này là trung thực và không trùng lặp với các đề tài khác.
Học viên thực hiện
Trần Hùng Cường
MỤC LỤC
Trang
TRANG PHỤ BÌA
LỜI CAM ĐOAN
MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TẮT
DANH MỤC CÁC BẢNG
DANH MỤC HÌNH VẼ, ĐỒ THỊ
Chương 1. GIỚI THIỆU ........................................................................................ 1
1.1 Lý do thực hiện đề tài .................................................................................. 1
1.2 Mục tiêu nghiên cứu .................................................................................... 1
1.3 Câu hỏi nghiên cứu ...................................................................................... 1
1.4 Đối tượng nghiên cứu .................................................................................. 2
1.5 Phạm vi nghiên cứu ..................................................................................... 2
1.6 Phương pháp nghiên cứu ............................................................................ 2
1.7 Ý nghĩa của đề tài ......................................................................................... 3
1.8 Kết cấu của luận văn .................................................................................... 3
1.9 Tóm tắt luận văn .......................................................................................... 3
Chương 2. TỔNG QUAN CÁC NGHIÊN CỨU TRƯỚC ĐÂY ....................... 5
2.1 Nghiên cứu Fama and Macbeth (1973) ...................................................... 8
2.2 Nghiên cứu Fama and French (2006) ....................................................... 11
2.3 Nghiên cứu Lewellen (2011) ...................................................................... 15
2.4 Nghiên cứu Fama and French (2015) ....................................................... 17
Chương 3. PHƯƠNG PHÁP - DỮ LIỆU NGHIÊN CỨU ................................ 24
3.1 Mô hình thực nghiệm ................................................................................. 24
3.1.1 Xác định tỷ suất sinh lợi ước tính theo phương pháp Fama - Macbeth
24
3.1.2 Xác định tỷ suất sinh lợi danh mục theo ngũ phân vị ............................ 25
3.2 Dữ liệu nghiên cứu ..................................................................................... 26
Chương 4. KẾT QUẢ NGHIÊN CỨU ............................................................... 29
4.1 Kết quả nghiên cứu dựa trên mức độ phân tán tỷ suất sinh lợi ............ 29
4.2 Kết quả nghiên cứu dựa trên phương pháp kiểm định GRS ................. 54
Chương 5. KẾT LUẬN ........................................................................................ 59
5.1 Kết luận chung từ kết quả nghiên cứu ..................................................... 59
5.2 Hạn chế nghiên cứu ................................................................................... 60
DANH MỤC TÀI LIỆU THAM KHẢO
PHỤ LỤC
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt Ý nghĩa
B/M Tỷ số giá trị sổ sách chia cho giá trị thị trường
DANH MỤC CÁC BẢNG
Bảng 3.1 Thống kê mô tả dữ liệu nghiên cứu .......................................................... 26
Bảng 4.1 Kết quả ước lượng mô hình ..................................................................... 29
Bảng 4.2 Giá trị trung bình và thống kê t của mức độ phân tán tỷ suất sinh lợi ..... 31
Bảng 4.3 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân trong mô
hình hai biến ............................................................................................ 34
Bảng 4.4 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân trong mô
hình ba biến .............................................................................................. 40
Bảng 4.5 Tỷ lệ pha loãng biến ................................................................................. 43
Bảng 4.6 Kết quả ước tính chênh lệch tỷ suất sinh lợi trong mô hình hai biến ...... 48
Bảng 4.7 Kết quả ước tính chênh lệch tỷ suất sinh lợi trong mô hình ba biến ........ 51
Bảng 4.8 Kiểm định GRS......................................................................................... 57
DANH MỤC HÌNH VẼ, ĐỒ THỊ
Hình 3.1 Đồ thị tỷ suất sinh lợi bình quân của các công ty trên sàn Hose giai đoạn
01/2009 - 10/2016 theo tháng ................................................................ 27
Hình 3.2 Đồ thị quy mô bình quân của các công ty trên sàn Hose giai đoạn 01/2009
- 10/2016 theo tháng .............................................................................. 27
Hình 3.3 Đồ thị tỷ số B/M bình quân của các công ty trên sàn Hose giai đoạn
01/2009 - 10/2016 theo tháng ................................................................ 28
Hình 3.4 Đồ thị khuynh hướng sinh lời bình quân của các công ty trên sàn Hose
giai đoạn 01/2009 - 10/2016 theo tháng ................................................ 28
Hình 4.1 Đồ thị mức độ phân tán tỷ suất sinh lợi của 7 mô hình giai đoạn 01/2009
- 10/2016 ................................................................................................ 32
Hình 4.2 Tác động khuyếch đại và pha loãng của biến độc lập ............................. 41
Hình 4.3 Mức độ chênh lệch biến quy mô trong các mô hình ............................... 44
Hình 4.4 Mức độ chênh lệch biến khuynh hướng sinh lời trong các mô hình ....... 44
Hình 4.5 Mức độ chênh lệch biến tỷ số B/M trong các mô hình ........................... 46
Hình 4.6 Minh họa phương pháp kiểm định thống kê GRS .................................. 55
1
Chương 1. GIỚI THIỆU
1.1 Lý do thực hiện đề tài
Các nghiên cứu trước đây xây dựng nhiều mô hình định giá tài sản để xác định
mối quan hệ giữa tỷ suất sinh lợi bình quân và các yếu tố đặc trưng của công ty như:
quy mô (size), tỷ số giá thị trường trên giá sổ sách (B/M), chỉ số xu hướng
(momentum). Các nghiên cứu này thường dựa vào giá trị thống kê t (t-statistic) trong
phương pháp hồi quy của Fama - Macbeth (1973) để phán xét ý nghĩa tác động của
các biến giải thích trong mô hình. Tuy nhiên, ý nghĩa của một biến giải thích còn thể
hiện qua đóng góp của nó trong việc gia tăng mức độ phân tán tỷ suất sinh lợi bình
quân giữa các danh mục được hình thành từ việc sắp xếp giá trị ước tính của biến phụ
thuộc từ mô hình hồi quy. Nghiên cứu của tôi tập trung lý giải tác động của việc thêm
một biến mới vào mô hình hồi quy đến mức độ phân tán tỷ suất sinh lợi bình quân
các danh mục.
1.2 Mục tiêu nghiên cứu
Bài nghiên cứu này của tôi được thực hiện nhằm mục tiêu sau:
- Giải thích mức độ đóng góp tăng thêm của một biến mới (có ảnh hưởng đến
tỷ suất sinh lợi) khi đưa thêm biến mới này vào mô hình sẵn có.
- Lý giải vì sao các biến độc lập có mức giải thích mạnh khi thêm vào mô hình
hồi quy lại chỉ làm tăng thêm một lượng nhỏ độ phân tán tỷ suất sinh lợi.
1.3 Câu hỏi nghiên cứu
Bài nghiên cứu này của tôi trả lời cho những câu hỏi nghiên cứu sau;
- Việc đưa thêm biến mới vào mô hình sẽ tác động thế nào đến hệ số ước lượng
đã có sẵn trong mô hình, và điều này sẽ ảnh hưởng đến mức độ phân tán tỷ
suất sinh lợi như thế nào ?
2
- Việc đưa thêm biến mới vào mô hình sẽ tác động đến cấu trúc danh mục cổ
phiếu như thế nào ?
- Hệ số đo lường nào đánh giá hợp lý cho mức độ đóng góp của biến mới đưa
vào mô hình trong việc làm tăng thêm mức độ phân tán tỷ suất sinh lợi bình
quân ?
1.4 Đối tượng nghiên cứu
- Mức độ đóng góp của biến mới đưa vào mô hình đến mức chênh lệch tỷ suất
sinh lợi bình quân.
1.5 Phạm vi nghiên cứu
- Phạm vi không gian: các cổ phiếu niêm yết trên SGDCK Thành Phố Hồ Chí
Minh (Hose).
- Phạm vi thời gian: 01/2009 - 10/2016
- Phạm vi nội dung: Mức độ đóng góp của biến mới đưa vào mô hình đến mức
chênh lệch tỷ suất sinh lợi bình quân, từ đó xác định cấu trúc danh mục cổ
phiếu.
1.6 Phương pháp nghiên cứu
Tôi sử dụng phương pháp hồi quy Fama-Macbeth để đánh giá mức độ tăng thêm
của độ phân tán tỷ suất sinh lợi kỳ vọng khi thêm một biến mới vào mô hình. Đầu
tiên, tôi tiến hành hồi quy dữ liệu chéo với biến phụ thuộc là tỷ suất sinh lợi cổ phiếu
cùng các biến giải thích. Sau khi ước lượng mô hình theo dữ liệu chéo như bước một
cho tất cả các tháng, các chỉ số thống kê giá trị trung bình và thống kê t sẽ được tính
toán để xem xét mức độ ý nghĩa của từng biến.
Cần lưu ý rằng: mục đích của bài nghiên cứu là xác định mức độ đóng góp tăng
thêm của một biến mới đưa vào mô hình đối với mức phân tán tỷ suất sinh lợi bình
quân nên sau khi ước lượng mô hình, tôi sẽ tiến hành xây dựng các danh mục ngũ
phân vị để xác định tỷ suất sinh lợi danh mục ước tính. Tôi sẽ kiểm tra kết quả cho
mẫu dữ liệu các cổ phiếu thu thập từ Sàn Giao Dịch Chứng Khoán Thành Phố Hồ Chí
3
Minh (Hose). Phần chi tiết phương pháp nghiên cứu của bài nghiên cứu sẽ được trình
bày cụ thể ở Chương 3.
1.7 Ý nghĩa của đề tài
Bài nghiên cứu đã tìm ra chỉ số được dùng để đánh giá tầm quan trọng của một
biến trong việc dự đoán tỷ suất sinh lợi kỳ vọng. Đó chính là mức đóng góp tăng thêm
của biến vào độ phân tán tỷ suất sinh lợi.
Đồng thời, vấn đề vì sao đôi khi đưa một biến mới có mức độ giải thích cao vào
mô hình sẽ làm pha loãng giá trị của những biến có sẵn trong danh mục cũng được
làm rõ. Điều này sẽ cung cấp cơ sở để nhà đầu tư lựa chọn danh mục cổ phiếu như
thế nào nhằm đạt được tỷ suất sinh lợi cao nhất.
1.8 Kết cấu của luận văn
Nội dung chính của luận văn gồm những phần chính sau:
Chương 1: Giới thiệu
Chương 2: Tổng quan các nghiên cứu trước đây
Chương 3: Phương pháp và dữ liệu nghiên cứu
Chương 4: Kết quả nghiên cứu
Chương 5: Kết luận
1.9 Tóm tắt luận văn
Trên thế giới đã có nhiều nghiên cứu xây dựng các mô hình hồi quy diễn giải
mối quan hệ giữa tỷ suất sinh lợi bình quân và các biến đặc trưng cho công ty. Tuy
nhiên, các biến có mức giải thích mạnh trong các mô hình định giá tài sản thường
mang rất ít ý nghĩa trong việc giải thích thêm cho tỷ suất sinh lợi bình quân của danh
mục bởi hai lý do: (1) việc đưa thêm một biến mới vào mô hình có thể sẽ khiến pha
loãng hệ số ước lượng của các biến sẵn có trong mô hình (2) việc đưa thêm một biến
có mức độ giải thích cao vào mô hình sẽ làm pha loãng giá trị của những biến có sẵn
4
trong các danh mục cực trị (extreme portfolios) được cấu tạo từ việc sắp xếp các giá
trị ước tính của biến phụ thuộc thành nhóm ngũ phân vị.
Và khi không có sự giới hạn đối với tỷ trọng danh mục, hệ số Sharpe tối thiểu
trong chỉ số thống kê GRS được nghiên cứu bởi Gibbons, Ross, Shanken (1989) đã
làm rõ hơn về mức độ tác động của một biến mới đến tỷ suất sinh lợi tăng thêm. Từ
đó giúp cho nhà đầu tư có thể lựa chọn danh mục cổ phiếu của mình để nâng cao khả
năng đạt được mức tỷ suất sinh lợi kỳ vọng mong muốn.
5
Chương 2. TỔNG QUAN CÁC NGHIÊN CỨU TRƯỚC ĐÂY
Nhiều nghiên cứu về định giá tài sản chỉ ra các biến đặc trưng của công ty có
tác động đến tỷ suất sinh lợi bình quân như: quy mô, tỷ số B/M, khuynh hướng giá
cổ phiếu, phát hành cổ phiếu. Sự quan trọng của một biến giải thích bất kỳ thường
được phán xét thông qua sự phân hóa của dải tỷ suất sinh lợi mà nó tạo ra. Hai dải tỷ
suất sinh lợi bình quân thu được từ hai phương trình hồi quy đơn biến giữa hai biến
khác nhau. Dải tỷ suất sinh lợi nào có độ phân hóa lớn hơn cho thấy rằng biến độc
lập trong phương trình đó giải thích tốt hơn cho tỷ suất sinh lợi. Điểm lưu ý này
thường được thể hiện thông qua sự khác biệt trong tỷ suất sinh lợi giữa nhóm ngũ
phân vị hoặc thập phân vị cao nhất và thấp nhất. Đã có nhiều mô hình về tỷ suất sinh
lợi được đưa ra trước đây, tuy nhiên sự phân hóa trong tỷ suất sinh lợi bình quân từ
mô hình chỉ với một biến mới luôn lớn hơn phần sự phân hóa tăng thêm mà nó đóng
góp vào mô hình đa biến.
Mục tiêu nghiên cứu của tôi là giải thích mức độ đóng góp tăng thêm của một
biến mới (có ảnh hưởng đến tỷ suất sinh lợi) khi đưa thêm biến mới này vào mô hình
sẵn có. Tôi giải thích điều này dựa trên quan điểm sử dụng các ước lượng của tỷ suất
sinh lợi kỳ vọng theo phương pháp hồi quy Fama - Macbeth (1973) để sắp xếp cổ
phiếu thành các danh mục.
Mức độ tác động tăng thêm của một biến lên mức độ phân hóa của tỷ suất sinh
lợi bình quân từ mô hình hồi quy đa biến thường nhỏ hơn so với mô hình một biến
bởi hai lý do. Thứ nhất, một biến giải thích mới thường pha loãng hệ số ước lượng
của các biến có sẵn trong mô hình. Sự pha loãng hệ số góc xuất hiện trong mô hình
hồi quy hai biến. Ví dụ: khi các biến giải thích tương quan dương và các hệ số góc có
cùng dấu hoặc khi các biến giải thích tương quan âm và các hệ số góc ngược dấu.
Điều này làm giảm tác động tăng thêm của một biến lên sự phân hóa của tỷ suất sinh
lợi kỳ vọng. Thứ hai, sự pha loãng biến nghiên cứu. Việc thêm vào một biến có mức
6
giải thích cao luôn làm giảm đi giá trị của các biến giải thích khác trong phân vị lớn
nhất và phân vị nhỏ nhất. Kết quả là, lợi ích tăng lên từ sự thêm vào một biến mới sẽ
luôn đi kèm với phần lợi ích giảm xuống từ các biến có sẵn. Nhận định này hết sức
rõ ràng. Việc sắp xếp giá trị ước lượng của biến phụ thuộc từ hồi quy một biến cũng
tương đương với việc sắp xếp chính biến đó, do đó danh mục có tỷ suất sinh lợi kỳ
vọng cao và thấp từ mô hình hồi quy một biến sẽ tối ưu hóa sự phân tán trong chính
biến giải thích. Một biến mới chỉ có thể làm tăng sự phân tán trong tỷ suất sinh lợi kỳ
vọng bằng cách thay thế những cổ phiếu trong danh mục cực trị (extreme portfolios)
và điều đó làm giảm mức phân tán trong biến gốc. Điều này cũng đúng cho trường
hợp tổng quát với mô hình hồi quy nhiều biến, khi độ phân tán của biến tỷ suất sinh
lợi kỳ vọng tăng lên cao cũng ám chỉ sự phân tán nhiều hơn trong các biến ban đầu.
Vì thống kê t trong ước lượng của Fama - Macbeth dùng để đo lường liệu một
biến cụ thể có tác động đến tỷ suất sinh lợi hay không nên có nhiều ý kiến xung quanh
về việc nghiên cứu này tập trung vào sự phân tán của tỷ suất sinh lợi thì có đúng chỗ
hay không. Tuy nhiên, một biến có thể có tác động đáng kể đến sự biến động của tỷ
suất sinh lợi khi các biến khác không đổi nhưng tác động tăng thêm của biến này đến
độ phân tán của tỷ suất sinh lợi giảm đi đáng kể khi xem xét sự biến động đồng thời
của tất cả các biến trong một mô hình. Để hiểu được sự kết hợp của các biến như thế
nào trong việc tạo ra một tỷ suất sinh lợi sẵn có cho nhà đầu tư, điều tốt nhất là xem
xét sự phân tán của tỷ suất sinh lợi trong các danh mục được hình thành từ việc sắp
xếp các ước lượng hồi quy khi có và không thêm vào biến giải thích mới.
Bài nghiên cứu này của tôi sẽ xem xét ba nghiên cứu trước đây trong việc sử
dụng giá trị ước lượng của biến giải thích để cung cấp bằng chứng về tỷ suất sinh lợi
tăng thêm.
Thứ nhất, nghiên cứu của Fama and French (2006) xem xét độ phân tán tỷ suất
sinh lợi bình quân của các danh mục được hình thành từ việc phân chia giá trị ước
lượng của biến giải thích. Các tác giả cho rằng: việc thêm vào một biến chỉ làm tăng
7
thêm một lượng nhỏ độ phân tán tỷ suất sinh lợi và lí do là ở sự phân chia các cổ
phiếu hai danh mục.
Thứ hai, nghiên cứu của Lewellen (2011) tìm thấy rằng, mặc dù các cổ phiếu
được chia thành 10 danh mục thì việc thêm vào một biến mới cũng tác động rất ít đến
việc cải thiện độ phân tán tỷ suất sinh lợi bình quân. Tác giả đã kiểm định các mô
hình sử dụng lần lượt ba biến giải thích (quy mô, tỷ số B/M, xu hướng); 7 biến giải
thích (ba biến trên và các biến phát hành cổ phiếu, dồn tích, khả năng sinh lời, tăng
trưởng tài sản); 15 biến giải thích (7 biến trên cộng với 8 biến khác sẽ được mô tả
trong phần phụ lục). Kết quả từ nghiên cứu của tác giả cho thấy: mô hình tăng từ 7
biến lên 15 biến thì mức độ phân tán tỷ suất sinh lợi bình quân tăng thêm không đáng
kể. Điều này là vì các biến mới thêm vào không có nhiều ý nghĩa trong việc giải thích
cho biến phụ thuộc. Kết quả này cũng giống với nghiên cứu Fama and French (2006),
khi các tác giả sử dụng mô hình hồi quy với 2, 5, 7 và 9 biến giải thích.
Tóm lại, điểm chung trong nghiên cứu của Fama and French (2006) và Lewellen
(2011) là không giải thích: vì sao các biến độc lập có mức giải thích mạnh khi thêm
vào mô hình lại chỉ làm tăng thêm một lượng nhỏ độ phân tán tỷ suất sinh lợi.
Thứ ba, nghiên cứu của Fama and French (2015). Nhóm tác giả thực hiện không
nhằm mục đích cung cấp một sự lý giải hoàn chỉnh về việc: làm thế nào các biến độc
lập được nêu trong các nghiên cứu trước đây kết hợp với nhau để tạo ra tỷ suất sinh
lợi bình quân. Mục tiêu chính là giải quyết hai vấn đề. Đó là: sự pha loãng của hệ số
ước lượng và sự pha loãng giá trị của biến độc lập trong các danh mục cực trị. Điều
này sẽ giải thích cho câu hỏi: vì sao những biến tạo ra độ phân tán tỷ suất sinh lợi lớn
trong mô hình một biến và có mức giải thích mạnh lại chỉ tạo ra tác động nhỏ trong
việc thiết lập danh mục đầu tư khi đối mặt với sự cạnh tranh từ những biến khác.
Phần tiếp theo sẽ đề cập sơ lược đến các vấn đề nổi trội kèm theo kết quả thu
được trong các nghiên cứu chính yếu được sử dụng trong bài nghiên cứu này.
8
2.1 Nghiên cứu Fama and Macbeth (1973)
➢ Tổng quan lý thuyết
Nghiên cứu này của các tác giả kiểm định mối quan hệ giữa tỷ suất sinh lợi và
rủi ro của các công ty đại chúng niêm yết trên sàn giao dịch chứng khoán New York.
Nền tảng lý thuyết cho kiểm định của các tác giả là mô hình danh mục hai hệ số và
các mô hình cân bằng thị trường dựa trên mô hình hai hệ số này. Các tác giả không
thể bác bỏ giả thuyết rằng: việc định giá cổ phiếu niêm yết phản ánh nỗ lực của nhà
đầu tư quan ngại rủi ro trong việc nắm giữ các danh mục hiệu quả trên phương diện
giá trị kỳ vọng và mức độ phân tán của tỷ suất sinh lợi. Hơn nữa, thuộc tính “trò chơi
công bằng” trong hệ số ước lượng và phần dư trong mô hình hồi quy tỷ suất sinh lợi
- rủi ro là nhất quán với thị trường tài chính hiệu quả (nơi mà giá cả của cổ phiếu
phản ánh một cách đầy đủ thông tin sẵn có).
Trong quá trình thiết lập danh mục, nhà đầu tư chỉ quan tâm tác động của một
cổ phiếu đến giá trị danh mục ở hai khía cạnh là giá trị tỷ suất sinh lợi kỳ vọng và độ
phân tán tỷ suất sinh lợi. Với giả định tỷ suất sinh lợi tuân theo phân phối chuẩn thì
rủi ro của một danh mục p được đo lường bằng độ lệch chuẩn σ(𝑅̃ p) của tỷ suất sinh
lợi 𝑅̃ p. Khi đó, rủi ro của một tài sản đối với nhà đầu tư đang nắm giữ danh mục p là
mức độ đóng góp của tài sản đó đến σ(𝑅̃ p). Nếu đặt xip là tỷ trọng của tài sản i trong
danh mục p, thì σij= cov(𝑅̃ i, 𝑅̃ j) là hiệp phương sai giữa tỷ suất sinh lợi của tài sản i
và tài sản j. Với N là tổng số tài sản trong danh mục, khi đó rủi ro của danh mục được
đo lường thông qua độ lệch chuẩn sẽ được xác định như sau:
Do đó, phần đóng góp của tài sản i tới σ(𝑅̃ p) hay chính là rủi ro của tài sản i
trong danh mục p sẽ tỷ lệ thuận với tỷ số bên dưới
9
Lưu ý rằng: bởi vì tỷ trọng xjp khác nhau ở các danh mục nên rủi ro của một tài
sản trong các danh mục khác nhau sẽ mang giá trị khác nhau.
Đối với một nhà đầu tư cá nhân, mối quan hệ giữa rủi ro và tỷ suất sinh lợi kỳ
vọng được xác định bởi thực tế rằng: danh mục tối ưu của nhà đầu tư là hiệu quả. Do
đó, nếu nhà đầu tư chọn danh mục m bởi danh mục m hiệu quả thì tức là tỷ trọng của
các tài sản xim (với i=1,2,3… N) sẽ tối đa hóa tỷ suất sinh lợi kỳ vọng của danh mục
với các ràng buộc:
Phương pháp Lagrangian được áp dụng để giải ra các giá trị tỷ trọng xjm lựa
chọn cho danh mục m
Trong đó: Sm đo lường mức độ thay đổi của tỷ suất sinh lợi kỳ vọng E(𝑅̃ p) khi
rủi ro σ(𝑅̃ p) thay đổi từ điểm danh mục hiệu quả. Nếu ràng buộc điều kiện bán khống
thì danh mục từ lời giải của phương trình (1) chỉ bao gồm các tài sản có tỷ trọng xim
> 0.
Mặc dù phương trình (1) chỉ đặt điều kiện lên tỷ trọng xjm của các tài sản để
danh mục là hiệu quả, song điều này cũng thể hiện mối quan hệ giữa rủi ro của tài
sản i trong danh mục m và tỷ suất sinh lợi của tương ứng. Phương trình trên nói lên
10
rằng sự khác biệt trong tỷ suất sinh lợi của một tài sản và danh mục sẽ tỷ lệ thuận với
sự khác biệt trong rủi ro giữa tài sản và danh mục. Tỷ lệ này được thể hiện thông qua
chỉ số Sm (chính là hệ số góc của danh mục hiệu quả tại điểm tương ứng với danh
mục m). Đồng thời, rủi ro của một tài sản sẽ là phần đóng góp của tài sản đó vào rủi
ro chung của danh mục σ(𝑅̃ m).
➢ Phương pháp nghiên cứu của Fama - Macbeth (1973)
Nghiên cứu này của các tác giả đưa ra một cách làm chuẩn mực mới trong việc
thiết lập danh mục để tránh những sai số từ việc đo lường hệ số β. Cụ thể, đầu tiên
các tác giả sẽ sử dụng dữ liệu tỷ suất sinh lợi hàng tháng trong 4 năm để ước lượng
hệ số β cho từng cổ phiếu riêng rẽ. Sắp xếp các công ty theo hệ số này, tác giả sẽ thiết
̂ nhỏ lập 20 danh mục cổ phiếu trong đó nhóm đầu tiên sẽ là nhóm có các giá trị 𝛽𝑖
̂ lớn nhất. Dữ liệu của 5 năm tiếp nhất và nhóm cuối cùng là nhóm có các giá trị 𝛽𝑖
theo được sử dụng để tính toán lại giá trị β ước lượng của các chứng khoán, trung
bình của các hệ số này tạo nên giá trị β ước lượng của danh mục được sử dụng cho
các kiểm định tỷ suất sinh lợi - rủi ro.
Một đóng góp quan trọng của nghiên cứu này là xây dựng hệ số đo lường rủi ro
mà không được thể hiện thông qua hệ số β (rủi ro phi β). Hệ số này được xác định
bằng độ lệch chuẩn của phần dư trong mô hình thị trường 𝑠(𝜀̂𝑖).
Xuất phát từ phương trình (8), ta thấy rằng rủi ro của một chứng khoán thể hiện
qua độ phân tán tỷ suất sinh lợi của nó sẽ được xác định thông qua hai phần. Phần
thứ nhất là đóng góp của nó tới độ phân tán của tỷ suất sinh lợi danh mục hiệu quả,
phần thứ hai chính là độ phân tán trong phần dư không liên quan tới β. Nếu ta xem
𝑐𝑜𝑣̂ (𝑅̂𝑖,𝑅̃𝑚) 𝜎̂ 2(𝑅̃𝑚)
𝛽𝑖 ≡ thì từ phương trình (8) sẽ có được 𝑐𝑜𝑣(𝑒̂𝑖, 𝑅̃𝑚) = 0. Trong phương
trình (9), vế cuối cùng bên phải phương trình chính là hiệp phương sai giữa phần tỷ
suất sinh lợi có liên quan tới β và phần dư, giá trị này bằng 0.
11
Tỷ suất sinh lợi hàng tháng cho 20 danh mục đo lường bằng bình quân không
trọng số tỷ suất sinh lợi của các cổ phiếu được tính toán. Phương trình hồi quy dữ liệu
chéo cho mỗi tháng được biểu diễn bên dưới
Với p = 1,2,…,20.
➢ Kết quả nghiên cứu
Các kết quả mà tác giả tìm được ủng hộ kiểm định đối với mô hình hai tham số.
Với một danh mục thị trường hiệu quả hay danh mục đại diện được lựa chọn là tương
đối hiệu quả thì kết quả nghiên cứu này không thể bác bỏ giả thuyết rằng: tỷ suất sinh
lợi bình quân của cổ phiếu phản ánh nỗ lực của nhà đầu tư quan ngại rủi ro để nắm
giữ danh mục hiệu quả. Cụ thể, về mặt trung bình thì có một hệ số đánh đổi dương
giữa rủi ro và tỷ suất sinh lợi, với rủi ro được đo lường theo quan điểm danh mục. Do
đó, chúng ta không thể bác bỏ giả thuyết cho rằng một quyết định lựa chọn danh mục
của nhà đầu tư sẽ dựa trên giả định rằng: mối quan hệ giữa rủi ro danh mục cổ phiếu
và tỷ suất sinh lợi kỳ vọng của nó có mối quan hệ tuyến tính và hàm ý này xuất phát
từ mô hình hai tham số. Chúng ta cũng không thể bác bỏ giả thuyết cho rằng: không
tồn tại bất kỳ một rủi ro nào khác trong rủi ro danh mục mà có tác động một cách hệ
thống đến tỷ suất sinh lợi trung bình.
2.2 Nghiên cứu Fama and French (2006)
➢ Tổng quan nghiên cứu
Lý thuyết định giá cho rằng tỷ suất sinh lợi kỳ vọng của cổ phiếu phụ thuộc vào
ba biến là: tỷ số giá sổ sách trên giá thị trường (B/M ratio), khả năng sinh lời kỳ vọng
và mức độ đầu tư kỳ vọng. Với tỷ số B/M và khả năng sinh lời cho trước, mức độ đầu
tư kỳ vọng cao sẽ dẫn đến tỷ suất sinh lợi kỳ vọng thấp. Nhưng khi kiểm soát đối với
hai biến còn lại thì một công ty có khả năng sinh lời cao sẽ có tỷ suất sinh lợi kỳ vọng
12
cao, điều này cũng tương tự đối với trường hợp công ty có tỷ số B/M cao. Nghiên
cứu của các tác giả sẽ kiểm định các nhận định này.
Lý thuyết nền tảng cho nghiên cứu của các tác giả dựa trên mô hình chiết khấu
dòng tiền, trong đó giá trị thị trường của một cổ phiếu được đo lường bằng hiện giá
của dòng cổ tức kỳ vọng
Trong đó: Mt là giá cổ phiếu tại thời điểm t; E(Dt+ τ) là cổ tức kỳ vọng ở kỳ t+τ;
r là tỷ suất sinh lợi kỳ vọng bình quân dài hạn hay chính là tỷ suất sinh lợi nội bộ của
cổ tức; Dt là cổ tức trong kỳ t [được đo lường bằng thu nhập trên mỗi cổ phần (Yt)
trừ đi thay đổi giá trị sổ sách mỗi cổ phần (dBt= Bt- Bt-1)]. Khi đó, mô hình chiết khấu
dòng cổ tức sẽ được viết lại như sau:
Chia 2 vế của phương trình cho giá trị sổ sách ở kỳ t (tức Bt)
Phương trình (3) đưa ra ba nhận xét dành cho tỷ suất sinh lợi kỳ vọng. Thứ nhất,
khi kiểm soát yếu tố thu nhập kỳ vọng và sự thay đổi trong giá trị sổ sách thì tỷ số
B/M có quan hệ cùng chiều với tỷ suất sinh lợi kỳ vọng của cổ phiếu, một công ty có
chỉ số B/M cao sẽ hàm ý một tỷ suất sinh lợi kỳ vọng cao và ngược lại. Thứ hai, Khi
kiểm soát tỷ số B/M và tăng trưởng kỳ vọng trong giá trị sổ sách, một công ty có khả
năng sinh lời kỳ vọng cao (đo lường bằng kỳ vọng thu thập chia cho giá trị sổ sách)
sẽ có tỷ suất sinh lợi cổ phiếu kỳ vọng cao. Thứ ba, với tỷ số B/M và thu nhập kỳ
vọng so với giá trị sổ sách cho trước, một công ty có mức tăng trưởng trong giá trị sổ
13
sách do tái đầu tư thu nhập sẽ có tỷ suất sinh lợi cổ phiếu kỳ vọng thấp. Các tác giả
sẽ kiểm định tác động của tỷ số B/M, khả năng sinh lời và mức độ tái đầu tư đến việc
dự đoán tỷ suất sinh lợi kỳ vọng thông qua phương trình định giá (3).
Trong những nghiên cứu trước đây; mối quan hệ giữa tỷ số B/M, khả năng sinh
lời, mức đầu tư kỳ vọng và tỷ suất sinh lợi cổ phiếu trong tương lai thường được lý
giải bởi việc định giá sai sót (mispricing). Và như thường lệ, việc định giá không hợp
lý không phải là lý do duy nhất. Với việc định giá hợp lý, thì tác động của các yếu tố
trên đến tỷ suất sinh lợi được giải thích thông qua sự khác biệt trong rủi ro. Khi kiểm
soát các yếu tố còn lại thì một công ty có tỷ số B/M cao hoặc khả năng sinh lời cao
sẽ có rủi ro cao trong khi một công ty có mức tăng trưởng nhanh thì sẽ ít rủi ro hơn.
Tuy nhiên kiểm định của tác giả chỉ đơn giản thông qua phương trình định giá chứ
không nhằm mục đích lý giải sự hợp lý hay bất hợp lý trong định giá. Mục tiêu trong
nghiên cứu này của các tác giả nhằm cung cấp một cách nhìn toàn diện về sự kết hợp
cả ba yếu tố trên trong việc giải thích cho tỷ suất sinh lợi cổ phiếu trung bình.
➢ Mô hình hồi quy dữ liệu chéo giải thích cho tỷ suất sinh lợi kỳ vọng
Mục tiêu của nghiên cứu này là tập trung kiểm định tác động của khả năng sinh
lời và đầu tư đến tỷ suất sinh lợi được nêu ra ở phương trình (3) thông qua ba kiểm
định.
Thứ nhất, tác giả sẽ tiến hành hồi quy dữ liệu chéo với biến phụ thuộc là tỷ suất
sinh lợi bình quân với các biến độc lập là độ trễ của lần lượt các biến quy mô (size),
tỷ số Bt/Mt, tăng trưởng tài sản, khả năng sinh lời. Mục đích của bước này là để kiểm
định xem việc sử dụng các biến đại diện đơn giản cho khả năng sinh lời và tăng trưởng
tài sản có tăng thêm mức độ giải thích cho biến tỷ suất sinh lợi bình quân bên cạnh
hai biến quy mô và tỷ số Bt/Mt.
Thứ hai, các tác giả sử dụng những biến có tính phức tạp hơn để đại diện cho
khả năng sinh lời kỳ vọng và tăng trưởng tài sản kỳ vọng, các biến này chính là giá
trị ước tính trong hai mô hình hồi quy tương ứng được trình bày ở phần trên.
14
Thứ ba, tác giả sử dụng các danh mục để xem xét liệu tác động của khả năng
sinh lời và tăng trưởng tài sản xác định trong mô hình hồi quy có đủ lớn và rộng khắp
cho toàn bộ mẫu và trong từng danh mục được thiết lập dựa vào hai yếu tố quy mô,
tỷ số Bt/Mt. Các mô hình hồi quy được sử dụng trong nghiên cứu sử dụng dữ liệu
hàng tháng bắt đầu từ tháng 7 năm 1963 và cập nhật hàng năm vào cuối tháng 6.
Kết quả nghiên cứu cho thấy rằng khi sử dụng riêng lẻ, biến quy mô và tỷ số
Bt/Mt giải thích rất mạnh cho tỷ suất sinh lợi. Cụ thể, biến tỷ số Bt/Mt có quan hệ cùng
chiều với biến tỷ suất sinh lợi, những công ty có tỷ số Bt/Mt cao (công ty giá trị) có
tỷ suất sinh lợi bình quân cao hơn so với những công ty có tỷ số Bt/Mt thấp (công ty
tăng trưởng). Trong khi, biến quy mô (size) có mối quan hệ ngược chiều với tỷ suất
sinh lợi. Những công ty có quy mô nhỏ có tỷ suất sinh lợi bình quân cao hơn những
công ty có quy mô lớn. Điều thú vị hơn, biến đại diện đơn giản cho khả năng sinh lời
và tăng trưởng tài sản kỳ vọng lần lượt có tác động dương và âm đến tỷ suất sinh lợi
bình quân giống như dự đoán trong phương trình (3).
Khi các biến trễ của khả năng sinh lời và mức độ đầu tư được đưa vào phương
trình hồi quy của biến tỷ suất sinh lợi bình quân cùng với các biến tỷ số Bt/Mt, quy
mô thì tác động dương của biến khả năng sinh lời và tác động âm của tăng trưởng tài
sản đến tỷ suất sinh lợi bình quân được thể hiện một cách rõ ràng. Hơn nữa, khi đưa
hai biến này vào mô hình thì mức độ tác động của biến tỷ số Bt/Mt và quy mô dường
như không thay đổi. Kết quả cũng cho thấy rằng việc thêm độ trễ hoặc thay thế độ trễ
khác của hai biến khả năng sinh lời và tăng trưởng tài sản không làm cải thiện mức
độ giải thích của chúng.
➢ Những kết luận quan trọng
Theo phương trình định giá (3), khi kiểm soát khả năng sinh lời và đầu tư kỳ
vọng, những công ty có tỷ số Bt/Mt (tỷ số giá trị sổ sách trên giá thị trường) càng cao
sẽ có mức tỷ suất sinh lợi càng cao. Những công ty có quy mô càng nhỏ thì tỷ suất
sinh lợi càng cao. Nếu kiểm soát tỷ số Bt/Mt và mức đầu tư kỳ vọng, khả năng sinh
15
lời kỳ vọng cao hơn cũng sẽ hàm ý một tỷ suất sinh lợi cao hơn. Với tỷ số Bt/Mt và
khả năng sinh lời cho trước, mức độ đầu tư kỳ vọng cao sẽ ám chỉ một tỷ suất sinh
lợi thấp.
2.3 Nghiên cứu Lewellen (2011)
Tác giả nghiên cứu thuộc tính dữ liệu chéo của tỷ suất sinh lợi dự báo các hồi
quy bằng phương pháp Fama - Macbeth. Những dự báo này mô phỏng lại cách thức
mà nhà đầu tư trên thực tế kết hợp rất nhiều các yếu tố đặc trưng của doanh nghiệp
để tạo ra một hệ số ước lượng tổng hợp của tỷ suất sinh lợi kỳ vọng cổ phiếu. Thực
tế cho thấy rằng các giá trị dự báo này biến động theo từng cổ phiếu và khả năng dự
báo rất mạnh cho tỷ suất sinh lợi thực tế. Ví dụ như khi dựa vào các hệ số ước lượng
bằng phương pháp Fama - Macbeth cho khung cửa sổ 10 năm cùng với một mô hình
dữ liệu chéo với 15 đặc trưng của công ty, giá trị tỷ suất sinh lợi kỳ vọng ước lượng
có độ lệch chuẩn chỉ 0.87% theo tháng và hệ số dự báo cho tỷ suất sinh lợi tương lai
là 0.74 với sai số chuẩn là 0.07.
Nghiên cứu này kế thừa kết quả từ những nghiên cứu về định giá tài sản trước
đây trong việc giải thích tỷ suất sinh lợi cổ phiếu. Các yếu tố đặc trưng cho công ty
như quy mô, tỷ số Bt/Mt, tỷ suất sinh lợi quá khứ và đầu tư có tương quan với tỷ suất
sinh lợi cổ phiếu. Các tác động này được thể hiện thông qua kết quả nghiên cứu danh
mục và hệ số ước lượng theo phương pháp hồi quy dữ liệu chéo của Fama – Macbeth
(1973). Nghiên cứu này đưa ra các thuộc tính chéo (cross - sectional properties) của
tỷ suất sinh lợi kỳ vọng, trong đó đưa ra hai câu hỏi chính. Thứ nhất, chúng ta có thể
dự báo được bao nhiêu phần biến động chéo trong tỷ suất sinh lợi kỳ vọng. Thứ hai,
các ước lượng của tỷ suất sinh lợi kỳ vọng theo phương pháp Fama - Macbeth đáng
tin cậy như thế nào. Những câu hỏi này không được trả lời bằng phương thiết lập
danh mục dựa trên sắp xếp một hoặc hai yếu tố và phương pháp hồi quy dữ liệu chéo
như thông thường. Trong nghiên cứu này, tác giả sẽ trả lời những câu hỏi trên bằng
phương pháp nghiên cứu sự phân phối và khả năng dự báo ngoài mẫu của tỷ suất sinh
lợi kỳ vọng được ước tính bằng phương pháp Fama - Macbeth dựa trên các hệ số ước
16
lượng. Câu hỏi chính được xác định trong nghiên cứu này là liệu rằng các ước lượng
tỷ suất sinh lợi có thẳng hàng với các giá trị tỷ suất sinh lợi thực tế và nếu nó đưa ra
một ước lượng tốt cho tỷ suất sinh lợi kỳ vọng thì hệ số ước lượng của nó trong
phương trình dự báo cho tỷ suất sinh lợi thực tế có nên bằng một hay không. Kết quả
nghiên cứu của tác giả đưa ra những đóng góp sau:
Thứ nhất, các nghiên cứu trước đây chỉ ra rất nhiều thuộc tính của công ty có
tương quan với tỷ suất sinh lợi cổ phiếu tương ứng tuy nhiên có rất ít bằng chứng cho
thấy rằng liệu các thuộc tính này có thể được sử dụng một cách độc lập hoặc kết hợp
lẫn nhau để ước tính cho tỷ suất sinh lợi cổ phiếu trong thực tế. Chúng ta đều biết
rằng tỷ số B/M và mức độ dồn tích có ý nghĩa trong việc giải thích cho tỷ suất sinh
lợi nhưng chúng ta không biết liệu rằng các dự báo từ hai biến này có thẳng hàng với
giá trị tỷ suất sinh lợi thực tế. Khi các hệ số ước lượng chéo là không đúng vì lý do
nhiễu trong các hệ số ước lượng hoặc do sự biến động theo thời gian của hệ số ước
lượng đúng, thì mức độ dự báo tỷ suất sinh lợi kỳ vọng ước tính có thể thấp nếu các
đặc trưng của công ty ý nghĩa dự báo cho tỷ suất sinh lợi trong quá khứ.
Thứ hai, chúng ta đều biết rằng các chiến lược đầu tư thiết lập danh mục dựa
vào một hoặc hai yếu tố của doanh nghiệp có được kết quả tương đối tốt trong lịch
sử nhưng chúng ta không làm thế nào mà nhà đầu tư kết hợp các yếu tố này thành
một chiến lược giao dịch tổng hợp dựa trên những thông tin đã có sẵn. Phương pháp
Fama - Macbeth đưa ra một phương pháp đơn giản nhưng rất hiệu quả trong việc thiết
lập một chiến lược giao dịch tổng hợp, chiến lược này tập trung mua những cổ phiếu
có tỷ suất sinh lợi kỳ vọng cao và bán những cổ phiếu có tỷ suất sinh lợi kỳ vọng thấp
chỉ dựa trên duy nhất hệ số ước lượng trong thực tế. Nghiên cứu này của tác giả thực
hiện hồi quy cho 15 thuộc tính của doanh nghiệp và trong đó có rất nhiều thuộc tính
không có ý nghĩa thống kê trong việc giải thích cho tỷ suất sinh lợi kỳ vọng. Điều này
để giải thích rằng các nhà đầu tư không thể nào biết trước được đâu là biến tốt nhất
để giải thích cho tỷ suất sinh lợi.
17
Thứ ba, có rất nhiều nghiên cứu trước đây cố gắng lý giải tỷ suất sinh lợi kỳ
vọng của một cổ phiếu dựa vào giá của nó cũng như cổ tức và thu nhập dự báo nhưng
không có nhiều nghiên cứu ước tính tỷ suất sinh lợi kỳ vọng dựa vào các biến có tác
động tỷ suất sinh lợi đã biết. Nghiên cứu này của tác giả đề xuất rằng các ước lượng
dữ liệu chéo cung cấp các giá trị ước lượng đáng tin cậy cho tỷ suất sinh lợi kỳ vọng
và thực tế thì các hệ số ước lượng này giải thích tốt hơn so với các nghiên cứu trước
đây áp dụng chi phí sử dụng vốn.
2.4 Nghiên cứu Fama and French (2015)
Trong phần này, tác giả xây dựng các công thức để lý giải tác động của việc
thêm biến đến sự thay đổi mức độ phân tán tỷ suất sinh lợi. Cụ thể hơn, tác giả muốn
làm rõ: tại sao những biến độc lập có mức giải thích mạnh khi đưa vào mô hình lại
chỉ làm tăng một mức nhỏ độ phân tán tỷ suất sinh lợi bình quân.
➢ Xác định độ phân tán tỷ suất sinh lợi từ mô hình đơn biến – đa biến
Giả định rằng: tỷ suất sinh lợi được tạo ra tuân theo mô hình bên dưới:
𝑹 = 𝒃𝟏𝑿𝟏 + 𝒃𝟐𝑿𝟐 + 𝒗𝒊 (1)
Trong đó: R là tỷ suất sinh lợi cổ phiếu; b1 và b2 lần lượt là hệ số ước lượng của
biến X1, X2 trong mô hình hồi quy 2 biến; X1 và X2 là các yếu tố tác động đến R và
được giả định tuân theo phân phối chuẩn; vi là giá trị phần dư và được giả định là
không tương quan với các biến độc lập.
Tác giả bắt đầu xem xét vấn đề nghiên cứu như sau. Đầu tiên, tác giả xem xét
∗ 𝑿𝟏 + 𝒖 (2)
mô hình tỷ suất sinh lợi đơn biến được giải thích chỉ bởi biến X1 theo mô hình sau:
𝑹 = 𝒃𝟏
Trong đó: b1* là hệ số ước lượng của biến X1 trong mô hình đơn biến.
18
Giả định rằng: X2 là biến mới có tác động đến tỷ suất sinh lợi được đưa vào mô
hình (2). Đặt ρ là hệ số tương quan giữa hai biến X1 và X2 thì mô hình diễn đạt mối
quan hệ của hai biến này được thể hiện như sau:
𝑿𝟐 = 𝝆𝑿𝟏 + 𝒆 (3)
Với giả định (3), tác giả triển khai phương trình ước lượng (2) để tìm ra mối
∗ = 𝒃𝟏 + 𝝆𝒃𝟐 (4) 𝒃𝟏
quan hệ giữa hệ số ước lượng trong phương trình một biến và phương trình hai biến.
Thay (4) vào (2), tác giả thu được mô hình hồi quy đơn biến của R theo X1 trong
đó thể hiện mối quan hệ giữa hệ số góc trong mô hình đơn biến và mô hình hai biến:
𝑹 = (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 + 𝒖 (5)
Theo phương trình (1) và (5), tác giả nhận thấy: tỷ suất sinh lợi kỳ vọng có điều
kiện từ mô hình đơn biến và mô hình hai biến lần lượt là (b1 + ρb2)X1; b1X1 + b2X2
đều tuân theo phân phối chuẩn. Như vậy, nếu sắp xếp cổ phiếu dựa trên tỷ suất sinh
lợi kỳ vọng có điều kiện thì mức chênh lệch tỷ suất sinh lợi giữa nhóm danh mục ngũ
phân vị có tỷ suất sinh lợi kỳ vọng lớn nhất và nhỏ nhất (hay còn gọi là mức độ phân
tán của tỷ suất sinh lợi) sẽ tỷ lệ thuận với độ lệch chuẩn của tỷ suất sinh lợi bình quân
có điều kiện. Điều này ám chỉ rằng: mức đóng góp của một biến mới đến độ phân tán
tỷ suất sinh lợi sẽ được xác định thông qua tác động của biến đó đến độ lệch chuẩn
của giá trị ước tính biến phụ thuộc trong mô hình hồi quy.
Thay (3) vào (1), phương trình tỷ suất sinh lợi theo mô hình đa biến là:
𝑹 = (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 + 𝒃𝟐𝒆 + 𝒗 (6)
𝟐(𝟏 − 𝒑𝟐) (7)
Khi đó, phương sai sẽ bằng:
𝑽𝒂𝒓(𝑹) = (𝒃𝟏 + 𝝆𝒃𝟐)𝟐 + 𝒃𝟐
Lúc này, vế trái trong phương trình (7) chính là phương sai của tỷ suất sinh lợi
kỳ vọng có điều kiện từ phương trình hồi quy đơn biến (5). Vì vậy, nếu thêm biến X2
19
vào phương trình (5) thì đồng nghĩa việc thêm vào giá trị . Theo đó, X2 sẽ
đóng góp đáng kể vào tỷ suất sinh lợi nếu p (tức hệ số tương quan giữa X1 và X2) tiến
dần về 0 và b2 (tức độ dốc của X2 trong phương trình hồi quy 2 biến) mang giá trị
lớn. Ngược lại, nếu tồn tại mức tương quan mạnh (dù cùng chiều hay ngược chiều)
hoặc b2 mang giá trị nhỏ đều sẽ làm giảm mức đóng góp của biến mới vào phương
sai của mô hình.
Phương trình (7) miêu tả tác động của biến tăng thêm đến phương sai của tỷ
suất sinh lợi trong mô hình hồi quy. Như đã phân tích trước đó, mức chênh lệch giữa
tỷ suất sinh lợi kỳ vọng trong mô hình hồi quy đơn biến – đa biến tỷ lệ với độ lệch
chuẩn của giá trị phụ thuộc (fitted value), đồng thời tác giả cũng đã giả định độ lệch
2)1/2.
chuẩn của X1 và X2 mang giá trị 1. Cho nên, độ lệch chuẩn của giá trị biến phụ thuộc
2+ ρb1b2+ b2
trong mô hình hồi quy đơn biến và đa biến lần lượt là |b1+ρb2| và (b1
Khi đó, tỷ lệ độ phân tán tỷ suất sinh lợi kỳ vọng bình quân của mô hình đơn biến và
𝟐)𝟏/𝟐 (𝟖)
∗ 𝑹𝟏 𝑹′ =
mô hình đa biến được xác định như sau:
∗ là chênh lệch (độ phân tán) tỷ suất sinh lợi bình quân của mô hình đơn biến.
|𝒃𝟏 + 𝒃𝟐| 𝟐 + 𝟐𝝆𝒃𝟏𝒃𝟐 + 𝒃𝟐 (𝒃𝟏
Với: 𝑅1
𝑅′ là chênh lệch (độ phân tán) tỷ suất sinh lợi bình quân của mô hình đa biến.
Giả sử: đặt 𝑟 ≡ 𝑏2/𝑏1 thì phương trình (8) sẽ trở thành
Tóm lại, với giả định độ lệch chuẩn của X1 và X2 mang giá trị 1, tỷ lệ độ phân
tán tỷ suất sinh lợi kỳ vọng bình quân của mô hình đơn biến và mô hình đa biến sẽ
phụ thuộc vào giá trị p (tức hệ số tương quan giữa X1 và X2) và giá trị r (tức tỷ lệ giữa
các độ dốc trong phương trình hồi quy đa biến).
➢ Vấn đề pha loãng và khuếch đại biến
20
Phân tích cụ thể, tác giả nhận thấy rằng: một biến độc lập mới khi thêm vào mô
hình sẽ tác động đến độ phân tán tỷ suất sinh lợi bình quân thông qua việc thay đổi
các cổ phiếu trong nhóm danh mục có tỷ suất sinh lợi ước tính lớn nhất và nhỏ nhất.
Với mô hình đơn biến, danh mục có tỷ suất sinh lợi bình quân cao được hiểu là
danh mục chứa các cổ phiếu được dự đoán có mức sinh lợi cao nhất, .
Cho nên, danh mục có tỷ suất sinh lợi bình quân cao sẽ tối đa hóa giá trị bình quân
của biến X1 nếu độ dốc trong phương trình hồi quy là cùng chiều, hoặc tối thiểu hóa
nếu ngược chiều. Trong khi đó, với mô hình hồi quy hai biến, danh mục có tỷ suất
sinh lợi bình quân cao được hình thành từ việc: thay thế những cổ phiếu đang có X1
cao, X2 thấp bằng những cổ phiếu có X1 thấp hơn nhưng X2 cao hơn. Đối với danh
mục có tỷ suất sinh lợi bình quân thấp thì sẽ tiến hành ngược lại. Kết quả từ biện pháp
thay thế này sẽ làm gia tăng mức chênh lệch tỷ suất sinh lợi kỳ vọng thông qua việc
tăng độ phân tán của biến X2 giữa hai danh mục cực hạn, nhưng đồng thời cũng làm
giảm độ phân tán của biến X1. Giả sử:
* : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X1 ứng với nhóm
X1
danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đơn biến.
* : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X2 ứng với nhóm
X2
′ : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X1 ứng với nhóm
danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đơn biến.
𝑋1
′ : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X2 ứng với nhóm
danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đa biến.
𝑋2
danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đa biến.
𝐼2 : phần đóng góp tăng thêm của biến X2 đến mức chênh lệch tỷ suất sinh lợi
′)
kỳ vọng trong mô hình hồi quy đa biến.
∗ = 𝑹′ − (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 ′ − 𝜌𝑋1
∗ ′ − (𝑏1 + 𝜌𝑏2)𝑋1 ∗ − 𝑋1 ∗) − 𝑏1(𝑋1
′ + 𝑏2𝑋2 ′) = 𝑏2(𝑋2
∗) − 𝑏1(𝑋1
′ − 𝑋2
∗ = −𝑏1𝑋1 ∗ − 𝑋1 = 𝒃𝟐 ∗ (độ khuếch đại của X2) − 𝒃𝟏 ∗ (độ pha loãng của X1) (9)
𝑰𝟐 = 𝑹′ − 𝑹𝟏 = 𝑏2(𝑋2
21
*, còn sự pha loãng giá trị
′ và X2
Dựa vào phương trình trên, tác giả nhận thấy rằng: sự khuếch đại giá trị của biến
′. Rõ ràng, khuếch
X2 chính là sự khác biệt giữa giá trị kỳ vọng của 𝑋2
* và 𝑋1
của biến X1 chính là sự khác biệt giữa giá trị kỳ vọng của X1
đại giá trị của biến X2 sẽ làm gia tăng độ phân tán tỷ suất sinh lợi kỳ vọng, nhưng
đồng thời sự khuếch đại này cũng làm giảm đi độ phân tán của biến X1 và do đó sẽ
làm giảm mức độ đóng góp tăng thêm của biến X2.
➢ Phân tích dựa vào mức độ chênh lệch tỷ suất sinh lợi (return gap)
Trong phương trình (9), tác giả đã sử dụng tác động của biến mới thêm vào đối
với kết cấu của danh mục cực trị để giải thích cho ảnh hưởng của tác động này đến
sự chênh lệch tỷ suất sinh lợi kỳ vọng giữa các danh mục cực trị. Cụ thể hơn, phần
phân tích này sẽ nêu thêm một cách thức khác để xem xét sự khác biệt giữa tổng các
mức độ phân tán tỷ suất sinh lợi kỳ vọng trong danh mục ngũ phân vị thông qua
phương thức tính toán từ mô hình hồi quy sử dụng riêng rẽ từng biến X1, X2 so với
phương thức tính toán từ mô hình hồi quy sử dụng đồng thời cả hai biến. Giá trị khác
biệt này được gọi là mức độ chênh lệch tỷ suất sinh lợi được biểu diễn thông qua hệ
số ước lượng trong mô hình hồi quy nhân với mức độ phân tán trong giá trị kỳ vọng
của từng biến.
∗ + 𝑏2
𝑹𝒆𝒕𝒖𝒓𝒏 𝒈𝒂𝒑 = (R1
∗ + R2 ∗ ) − R′ ∗𝑋2 ∗𝑋1 = (𝑏1+ 𝜌𝑏2)𝑋1
′ + 𝑏2𝑋2
′)]
′) ′ + 𝑏2𝑋2 ∗) − (𝑏1𝑋1 ∗ + (𝑏2+ 𝜌𝑏1)𝑋2 ∗ − (𝑏1𝑋1 ∗) + [𝑏1(𝑋1
′) ∗ − 𝑋2
∗ + 𝑏1𝑋2
= (𝑏1
′) + 𝑏2(𝑋2
∗ − 𝑋1 = Pha loãng hệ số ước lượng + Pha loãng biến (10)
= 𝜌(𝑏2𝑋1
Nếu biến X1 và X2 không tương quan với nhau (ρ=0), hệ số ước lượng của các
biến trong mô hình đơn biến và hai biến là giống nhau và do đó không có sự pha
loãng hệ số ước lượng. Tuy nhiên, nếu X1 và X2 tương quan với nhau, giá trị ước
lượng của mỗi biến trong mô hình riêng rẽ, cụ thế là b1+b2ρ (đối với X1) và b2+b1ρ
(đối với X2) chính bằng hệ số ước lượng của các biến này trong mô hình hai biến
22
cộng thêm một phần giá trị đại diện cho thông tin tỷ suất sinh lợi kỳ vọng hàm chứa
trong biến được thêm vào do sự tương quan của biến đó với biến bị loại ra.
Bởi vì với giả định rằng các biến b1, b2 là dương; nếu ρ cũng dương thì hệ số
ước lượng của mỗi biến sẽ điều chỉnh giảm đi một phần tương ứng lần lượt là b2ρ
hoặc b1ρ khi biến còn lại được thêm vào mô hình. Phương trình (10) chỉ ra rằng việc
pha loãng hệ số ước lượng sẽ làm giảm mức độ phân tán tỷ suất sinh lợi kỳ vọng
*+b1ρX2
*) và do đó làm tăng độ chênh lệch
trong mô hình hai biến một mức là (b2ρX1
tỷ suất sinh lợi (return gap) giữa tổng các giá trị phân tán tỷ suất sinh lợi kỳ vọng của
hai mô hình đơn biến riêng rẽ và độ phân tán tỷ suất sinh lợi kỳ vọng của mô hình hai
biến một khoảng tương tự.
Nếu hệ số ước lượng của mô hình đơn biến và hai biến đều dương nhưng hệ số
ρ âm thì sự pha loãng hệ số ước lượng sẽ trở thành sự khuếch đại. Ví dụ, bởi vì hệ số
B/M có tương quan âm với tỷ suất sinh lợi kỳ trước dùng để xác định biến khuynh
* và
hướng (momentum), cho nên hệ số ước lượng của mỗi biến lớn hơn nếu đưa thêm
* cùng dương và xuất hiện sự cải thiện hệ số bởi tương quan âm sẽ làm giảm chênh
biến khác vào mô hình. Khi các hệ số ước lượng trong mô hình đơn biến của X1
X2
lệch tỷ suất sinh lợi.
Sự pha loãng giá trị của biến cũng có tác động đến chênh lệch tỷ suất sinh lợi.
Ví dụ, sự pha loãng biến X1 chính là mức chênh lệch giữa độ phân tán kỳ vọng của
*
biến X1 trong danh mục ngũ phân vị cực trị của mô hình hồi quy đơn biến và hai biến
*- X1
’). Nếu hệ số ước lượng trong mô hình một biến và hai biến là dương thì X1
* cũng dương. Khi đó, sự pha loãng biến sẽ làm giảm mức độ phân tán của biến
(X1
và X2
X1 và X2 trong mô hình hồi quy hai biến, do đó làm giảm mức phân tán tỷ suất sinh
lợi kỳ vọng trong mô hình hồi quy hai biến và làm tăng chênh lệch tỷ suất sinh lợi
(return gap).
Tóm lại, sự pha loãng hệ số ước lượng và pha loãng biến có tương quan ngược
chiều với nhau. Khi hệ số b1, b2 trong mô hình hồi quy hai biến dương và hệ số tương
23
quan của hai biến X1, X2 xấp xỉ bằng 1 thì hệ số ước lượng trong mô hình đơn biến
*=b1+ρb2, b2
*=b2+ρb1) sẽ lớn hơn so với mô hình hai biến. Hệ số ước lượng của
(b1
mỗi biến sẽ bị pha loãng bằng chính hệ số ước lượng của biến còn lại. Tuy nhiên, nếu
* sẽ tiến
tồn tại một hệ số tương quan cùng chiều mạnh giữa biến X1 và X2 thì mức độ pha
* sẽ tiến gần về X1
’; X2
’ bởi vì một sự sắp xếp danh mục dựa trên cả hai biến cũng tương tự như
loãng biến của X1 và X2 sẽ trở nên nhỏ đi. Lúc này, X1
gần về X2
sắp xếp dựa trên một biến. Bên cạnh đó, nếu tồn tại hệ số ρ thấp hơn, mức độ pha
loãng hệ số ước lượng trong mô hình hai biến sẽ thấp đi. Ngoài ra, nếu ρ ngược chiều,
sự pha loãng hệ số ước lượng chuyển thành gia tăng hệ số ước lượng. Song, nếu mức
tương quan giữa biến X1, X2 thấp thì đồng nghĩa phải hi sinh nhiều hơn mức phân tán
của biến X1 để gia tăng mức độ phân tán X2 và ngược lại.
Ngoài ra, chênh lệch tỷ suất sinh lợi còn có một cách giải thích khác. Đó là sự
khác biệt trong tổng các mức độ phân tán kỳ vọng giữa các mô hình đơn biến với mô
hình hai biến cũng chính bằng sự chênh lệch tỷ suất sinh lợi kỳ vọng trong mô hình
đơn biến (với từng biến riêng rẽ) và sự đóng góp tăng thêm của biến đó vào độ phân
∗ − 𝑹′
tán của mô hình hai biến.
𝑹𝒆𝒕𝒖𝒓𝒏 𝑮𝒂𝒑 = 𝑹𝟏
∗ − 𝑰𝟏 ∗ − 𝑰𝟐 (11)
∗ + 𝑹𝟐 ∗ − (𝑹′ − 𝑹𝟐 ∗ − (𝑹′ − 𝑹𝟏
= 𝑹𝟏
∗ ) = 𝑹𝟏 ∗ ) = 𝑹𝟐
= 𝑹𝟐
*- I1 = R2
*- I2). Hai
Lưu ý rằng: X1 và X2 có cùng mức chênh lệch tăng thêm (R1
biến này mặc dù có thể tạo ra độ phân tán tỷ suất sinh lợi kỳ vọng trong mô hình đơn
biến và mức độ đóng góp tăng thêm đối với độ phân tán trong mô hình hai biến rất
khác nhau, nhưng hiệu số giữa hai yếu tố này của mỗi biến đều bằng nhau và bằng
với mức chênh lệch giữa tổng các mức phân tán tỷ suất sinh lợi kỳ vọng trong mô
hình đơn biến với mức phân tán tỷ suất sinh lợi kỳ vọng trong mô hình hai biến.
24
Chương 3.
PHƯƠNG PHÁP - DỮ LIỆU NGHIÊN CỨU
3.1 Mô hình thực nghiệm
3.1.1 Xác định tỷ suất sinh lợi ước tính theo phương pháp Fama - Macbeth
Tôi sử dụng phương pháp hồi quy Fama-Macbeth để đánh giá mức độ tăng thêm
của độ phân tán tỷ suất sinh lợi kỳ vọng khi thêm một biến mới vào mô hình. Như đã
nêu ở phần trước, tôi sẽ đánh giá hiệu ứng thêm biến mới vào mô hình thông qua các
giá trị tính toán liên quan đến tỷ suất sinh lợi kỳ vọng chính bằng giá trị tỷ suất sinh
lợi ước tính thu được từ mô hình hồi quy đơn biến và đa biến. Phương pháp Fama-
Macbeth được tôi áp dụng như một mô hình chuẩn mực được sử dụng trong các mô
hình định giá tài sản khi dữ liệu nghiên cứu có dạng bảng với hai bước như sau.
Đầu tiên, tôi tiến hành hồi quy chéo tỷ suất sinh lợi với các biến gồm: quy mô
(size), tỷ số giá sổ sách trên giá thị trường (B/M ratio), chỉ số xu hướng (momentum)
theo từng tháng trong giai đoạn 01/2009 - 10/2016 theo mô hình:
Ri = β1.Sizei + β2.B/Mi + β3.Momentumi + ∈i
Biến quy mô (Sizei) được xác định bằng hàm lô-ga-rít mức vốn hóa thị trường
của cổ phiếu. Biến tỷ số B/Mi được xác định bằng giá trị sổ sách chia cho giá trị thị
trường, với giá trị sổ sách B được cập nhật vào cuối tháng 6 mỗi năm sử dụng giá trị
sổ sách của năm tài khóa kết thúc vào năm trước đó. Cụ thể, tỷ số B/M sẽ được tính
bằng lô-ga-rít của giá trị sổ sách trừ đi lô-ga-rít của giá trị vốn hóa thị trường. Biến
chỉ số xu hướng (Momentumi) được đo lường tỷ suất sinh lợi cộng dồn của 11 tháng
tính từ tháng 2 đến tháng 12 (từ t-2 đến t-12). Dựa vào các nghiên cứu Jegadeesh
(1990), Jegadeesh and Titman (1995); tôi bỏ qua tháng một trong việc tính tỷ suất
sinh lợi cộng dồn để loại đi khả năng các biến độc lập bị đảo chiều về dấu.
Giá cổ phiếu được sử dụng để tính toán tỷ suất sinh lợi là giá đóng cửa điều
chỉnh tại ngày giao dịch cuối cùng của tháng được thu thập từ Sở Giao Dịch Chứng
Khoán Thành Phố Hồ Chí Mình (Hose). Các số liệu về số lượng cổ phiếu đang lưu
hành, giá trị sổ sách được thu thập trên các báo cáo tài chính của công ty.
25
Sau khi ước lượng mô hình theo dữ liệu chéo như bước một cho tất cả các tháng,
các chỉ số thống kê giá trị trung bình và t-statistic sẽ được tính toán để xem xét mức
độ ý nghĩa của từng biến. Hệ số t-statistic cao cho thấy biến giải thích trong mô hình
có ý nghĩa thống kê và ngược lại. Hệ số ước lượng bình quân của tỷ suất sinh lợi được
sử dụng để tính toán giá trị tỷ suất sinh lợi ước tính. Việc sử dụng hệ số ước lượng
bình quân để tính toán các giá trị ước tính thay vì hệ số ước lượng cụ thể ở từng tháng
cũng được đề cập trong nghiên cứu của Fama and French (2015). Điều này giúp cho
việc thực hiện kiểm định chính xác hơn vì kết quả thu được không bị tác động bởi
tính chu kỳ trong hoạt động của doanh nghiệp. Ví dụ, đối với những công ty đang
trong giai đoạn tăng trưởng thường có tỷ suất sinh lợi cao và khiến cho hệ số ước
lượng của biến này với tỷ số B/M là âm mặc dù hai biến này có tương quan dương.
Và nếu chúng ta thiết lập các danh mục dựa vào hệ số ước lượng theo tháng sẽ tồn tại
sự chênh lệch lớn giữa tỷ suất sinh lợi ước tính và tỷ suất sinh lợi thực tế.
3.1.2 Xác định tỷ suất sinh lợi danh mục theo ngũ phân vị
Để đo lường phần chéo của tỷ suất sinh lợi bình quân hàm ý trong mô hình hồi
quy, hàng tháng tôi xây dựng các danh mục ngũ phân vị với tỷ trọng các cổ phiếu
trong mỗi danh mục là bằng nhau dựa trên sự sắp xếp tỷ suất sinh lợi ước tính thu
được từ mô hình hồi quy. Tôi kiểm tra kết quả cho mẫu dữ liệu các cổ phiếu thu thập
từ Sàn Giao Dịch Chứng Khoán Thành Phố Hồ Chí Minh (Hose).
Như đã nêu, mục đích của bài nghiên cứu là xác định mức độ đóng góp tăng
thêm của một biến mới đưa vào mô hình đối với mức phân tán tỷ suất sinh lợi bình
quân. Mức phân tán tỷ suất sinh lợi bình quân ở đây là được xác định bằng chênh
lệch giữa tỷ suất sinh lợi bình quân của danh mục có tỷ suất sinh lợi cao nhất và danh
mục có tỷ suất sinh lợi thấp nhất khi phân chia các cổ phiếu thành thập phân vị theo
giá trị ước tính của biến phụ thuộc từ mô hình hồi quy.
Cụ thể, mỗi tháng, sau khi ước lượng mô hình, tôi sẽ phân chia dữ liệu thành 05
nhóm phân vị (có số lượng công ty bằng nhau) theo mức giảm dần đối với giá trị ước
tính của tỷ suất sinh lợi. Nhóm phân vị trên cùng sẽ là nhóm có tỷ suất sinh lợi ước
26
tính cao nhất và nhóm phân vị dưới cùng sẽ là nhóm có tỷ suất sinh lợi ước tính thấp
nhất. Sau đó, tôi tính được giá trị trung bình của tỷ suất sinh lợi ước tính đối với hai
nhóm phân vị cực trị (là nhóm phân vị có tỷ suất sinh lợi cao nhất và thấp nhất) theo
phương pháp bình quân. Từ đấy, tôi tính toán được mức phân tán tỷ suất sinh lợi ước
tính bình quân (average return spread) chính bằng chênh lệch giữa giá trị trung bình
của tỷ suất sinh lợi ước tính giữa hai nhóm phân vị cao nhất và thấp nhất.
3.2 Dữ liệu nghiên cứu
Chúng tôi ước lượng mô hình sử dụng dữ liệu của 300 công ty niêm yết trên
Sàn Giao Dịch Chứng Khoán Thành Phố Hồ Chí Minh trong giai đoạn 01/2009 -
10/2016. Giá cổ phiếu và các chỉ tiêu tài chính của công ty như giá trị vốn cổ phần,
số lượng cổ phiếu đang lưu hành sẽ được thu thập và đối chiếu với cơ sở dữ liệu của
Sở Giao Dịch Chứng Khoán Thành Phố Hồ Chí Minh nhằm phục vụ cho việc tính
toán các biến nghiên cứu. Các công ty thiếu thông tin để tính toán tỷ số B/M, quy mô
hoặc có các hệ số này âm sẽ bị loại khỏi mẫu nghiên cứu. Giá cổ phiếu dùng để tính
toán tỷ suất sinh lợi được xác định bằng giá đóng cửa của ngày giao dịch cuối cùng
trong tháng.
Bảng 3.1 Thống kê mô tả dữ liệu nghiên cứu
Biến Trung bình Số quan sát Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất
Tỷ suất sinh lợi 20,133 0.00 0.13 -1.06 1.64
Xu hướng sinh lời 20,133 -0.01 0.55 -2.80 3.33
Quy mô 20,133 26.85 1.56 22.70 33.09
Tỷ số B/M 20,133 1.19 0.95 -0.07 10.49
0.4
0.3
0.2
0.1
0 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
-0.1
-0.2
-0.3
27
Hình 3.1 Đồ thị tỷ suất sinh lợi bình quân của các công ty trên sàn Hose
28
27.5
27
26.5
26
25.5
25 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
giai đoạn 01/2009 - 10/2016 theo tháng
Hình 3.2 Đồ thị quy mô bình quân của các công ty trên sàn Hose
giai đoạn 01/2009 - 10/2016 theo tháng
2.5
2
1.5
1
0.5
0 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
28
Hình 3.3 Đồ thị tỷ số B/M bình quân của các công ty trên sàn Hose
1
0.5
0 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
-0.5
-1
-1.5
-2
giai đoạn 01/2009 - 10/2016 theo tháng
Hình 3.4 Đồ thị khuynh hướng sinh lời bình quân của các công ty
trên sàn Hose giai đoạn 01/2009 - 10/2016 theo tháng
29
Chương 4. KẾT QUẢ NGHIÊN CỨU
4.1 Kết quả nghiên cứu dựa trên mức độ phân tán tỷ suất sinh lợi
Phần này tôi sẽ trình bày thứ tự các bước chạy mô hình nghiên cứu về mức độ
phân tán tỷ suất sinh lợi và thảo luận các kết quả liên quan.
➢ Bước 1: Hồi quy biến tỷ suất sinh lợi với các biến giải thích
Tôi sẽ tiến hành hồi quy theo dữ liệu chéo cho từng tháng, trong đó biến phụ
thuộc là biến tỷ suất sinh lợi (Return) còn các biến giải thích gồm có: quy mô (size),
tỷ số B/M (bm ratio), khuynh hướng sinh lời (prior)] trong mô hình hồi quy đơn biến
và đa biến. Như vậy, lần lượt tôi sẽ thu được 3 mô hình hồi quy đơn biến, 3 mô hình
hồi quy hai biến và 1 mô hình hồi quy 3 biến.
Kết quả ước lượng của mô hình theo phương pháp Fama-Macbeth được tôi trình
bày trong bảng 4.1. Giá trị trung bình và hệ số thống kê t được trình bày lần lượt cho
bảy mô hình. 1
(1) size
(2) bm
(3) prior
(4) size + bm
(6) bm + prior
(7) 3 biến
(5) size + prior
size
Bảng 4.1 Kết quả ước lượng mô hình
0.003 (2.91)***
0.003 (2.45)**
bm
0.015 (7.78)***
-0.002 (1.80)* 0.017 (7.43)***
prior
-0.083
-0.015
0.008 (1.81)* 0.003
0.042
0.006 (1.34) -0.072
0.016 (8.88)*** -0.005 (1.21) -0.018
-0.002 (2.04)** 0.018 (9.46)*** -0.006 (1.31) 0.047
_cons
(2.55)**
(1.68)*
(0.52)
(1.31)
(2.22)**
(2.35)**
(1.43)
R2
0.02
0.04
0.03
0.06
0.05
0.06
0.08
N
20,133
20,133
20,133
20,133
20,133
20,133
20,133
* p<0.1; ** p<0.05; *** p<0.01
1 Tham khảo Bước 1 trong “Phụ Lục 1. Thao tác tính toán trên Stata”
30
Kết quả nghiên cứu cho thấy rằng: khi ước lượng riêng rẽ trong mô hình hồi
quy đơn biến thì các biến giải thích đều giải thích tốt cho tỷ suất sinh lợi bình quân.
Hệ số ước lượng và mức ý nghĩa thống kê đối với các biến quy mô, tỷ số B/M, khuynh
hướng sinh lời lần lượt mang giá trị (0.003; 1%), (0.015; 1%) và (0.008; 10%) và cả
ba đều có quan hệ cùng chiều đối với biến tỷ suất sinh lợi ước tính.
Tuy nhiên, khi tiến hành hồi quy đa biến thì tôi đã thu được nhiều kết quả đáng
lưu ý. Thứ nhất, biến tỷ số B/M luôn duy trì được mức ổn định cao trong hệ số ước
lượng và mức ý nghĩa thống kê qua các mô hình. Đối với mô hình hồi quy đơn biến
là giá trị (0.015; 1%), khi hồi quy 02 biến là giá trị (0.017; 1%) với biến giải thích là
size, b/m và giá trị (0.016; 1%) với biến giải thích là b/m, prior. Sau cùng là hồi quy
03 biến với giá trị (0.017; 1%).
Thứ hai, khi tiến hành thêm biến b/m vào mô hình có sẵn biến size và biến prior
đã ghi nhận sự thay đổi mạnh về dấu và độ lớn đối với hệ số ước lượng và mức ý
nghĩa thống kê. Cụ thể, đối với biến size, mô hình (4) và mô hình (7) cho thấy sự đảo
chiều về dấu trong hệ số ước lượng và mức ý nghĩa thống kê lần lượt còn 10% và 5%.
Tương tự, đối với biến prior, mô hình (6) và mô hình (7) cũng cho thấy sự đảo chiều
về dấu trong hệ số ước lượng. Đặc biệt, sự tồn tại của biến prior trong hai mô hình
này không còn ý nghĩa thống kê. Dấu âm trong giá trị ước lượng của biến size và biến
prior được giải thích dựa trên các nghiên cứu trước đây của Fama and French về định
giá tài sản bằng mô hình ba nhân tố. Đó là khi xuất hiện thêm biến tỷ số B/M, những
công ty có quy mô nhỏ sẽ có mức tỷ suất sinh lợi cao hơn so với những công ty có
quy mô lớn.
Tuy nhiên, từ kết quả nghiên cứu này đã mở ra hai vấn đề cần được lí giải. Vì
sao biến b/m qua các mô hình hồi quy vẫn duy trì được mức ổn định cao trong giá trị
hệ số ước lượng và mức ý nghĩa thống kê? Vì sao khi thêm biến b/m vào mô hình
gồm biến size và prior lại có thể gây ra tác động đảo chiều về dấu đối với hệ số ước
lượng hay thậm chí làm mất luôn ý nghĩa thống kê? Hai câu hỏi này chính là tiền đề
mở ra các bước nghiên cứu tiếp theo.
31
➢ Bước 2: Đo lường mức độ phân tán tỷ suất sinh lợi
Như đã đề cập ở phần phương pháp nghiên cứu, một trong những điểm mới của
bài nghiên cứu này chính là việc thiết lập được các danh mục ngũ phân vị theo cách
sắp xếp giá trị tỷ suất sinh lợi ước tính từ cao nhất đến thấp nhất ở mỗi mô hình. Từ
đó tính toán giá trị tỷ suất sinh lợi ước tính bình quân đại diện cho mỗi danh mục.
Việc đo lường mức độ phân tán thông qua chênh lệch tỷ suất sinh lợi ước tính bình
quân của nhóm phân vị lớn nhất và nhỏ nhất sẽ cho thấy mô hình chứa biến giải thích
nào sẽ có mức chênh lệch tỷ suất sinh lợi cao nhất và thấp nhất. 2
Bảng 4.2 Giá trị trung bình và thống kê t của mức độ phân tán tỷ suất sinh lợi
(1) size
(2) bm
(3) prior
(4) size + bm
(5) size + prior
(6) bm + prior
(7) 3 biến
μ
1.32% 3.30% 0.61% 3.21%
1.45%
3.34%
3.27%
σ
0.10% 0.80% 0.31% 0.88%
0.14%
0.86%
0.92%
t
12.86
4.10
1.99
3.65
10.49
3.89
3.54
Kết quả nghiên cứu cho thấy rằng: mức độ phân tán tỷ suất sinh lợi bình quân
là tương đối lớn và đều có ý nghĩa thống kê trong cả 7 mô hình. Trong đó, mức độ
phân tán bình quân nhỏ nhất là 0.61% đối với mô hình chỉ sử dụng biến prior (cột 3),
và mức độ phân tán bình quân lớn nhất là 3.34% đối với mô hình sử dụng biến tỷ số
B/M và xu hướng tỷ suất sinh lợi (cột 6). Tất cả 7 mô hình đều có độ lệch chuẩn thấp
chứng tỏ các giá trị ước lượng thu được nếu như có ý nghĩa thống kê sẽ có độ tin cậy.
Đồng thời, bảng 4.2 cũng đưa ra một điểm hết sức đáng lưu ý. Đó là, mô hình
nào có sử dụng tỷ số B/M làm biến giải thích (cột 2, cột 4, cột 6, cột 7) đều đem lại
mức độ phân tán tỷ suất sinh lợi xấp xỉ nhau và lớn hơn 3% cùng giá trị ý nghĩa thống
kê t luôn lớn hơn 3.5. Điều này cho thấy rằng biến tỷ số B/M có ý nghĩa rất mạnh
2 Tham khảo Bước 2 trong “Phụ Lục 1. Thao tác tính toán trên Stata”
32
trong việc giải thích tỷ suất sinh lợi cổ phiếu và lập luận này hoàn toàn tương đồng
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
spread.f(size)
spread.f(bmratio)
spread.f(prior)
spread.f(size&bmratio)
spread.f(size&prior)
spread.f(bmratio&prior)
spread.three variables
với những kết quả thu được từ bước 1.
Hình 4.1 Đồ thị mức độ phân tán tỷ suất sinh lợi
của 7 mô hình giai đoạn 01/2009 - 10/2016
Bên cạnh đó, để có cái nhìn rõ hơn về đường đi của mức độ chênh lệch tỷ suất
sinh lợi bình quân qua 7 mô hình, tôi cũng đã tiến hành phác họa hình 4.1 nhằm có
những nhận định cụ thể hơn. Kết quả thu được khi quan sát biểu đồ hoàn toàn trùng
lắp với các kết quả khi tiến hành tính toán mức độ phân tán tỷ suất sinh lợi bình quân.
Đường đi của mức chênh lệnh tỷ suất sinh lợi trong tất cả 4 mô hình có chứa biến tỷ
số b/m hầu như trùng lên nhau và có mức giá trị cao hơn hẳn so với các mô hình còn
lại. Điều này nói lên b/m có vai trò quyết định tác động đến mức độ phân tán trong
mỗi mô hình mà có chứa biến này. Trong khi đó, các mô hình (1), (3), (5) là những
mô hình không chứa biến b/m đều có mức độ chênh lệch thấp hơn hẳn.
33
Đặc biệt, mô hình (3) có biến giải thích là biến prior lại có mức độ chênh lệch
nhỏ hơn 0. Điều này có nghĩa là giá trị trung bình của nhóm phân vị có tỷ suất sinh
lợi cao nhất nhỏ hơn giá trị trung bình của nhóm phân vị có tỷ suất sinh lợi nhỏ nhất.
Chính điều này làm cho giá trị tỷ suất sinh lợi bình quân mang giá trị âm. Kết quả
này đã phần nào lý giải chi tiết cho câu hỏi tại sao khi thêm biến b/m vào mô hình (3)
chỉ gồm biến prior lại thu được giá trị ước lượng tỷ suất sinh lợi âm.
Đồng thời, một kết quả đáng lưu ý khác chính là sự thay đổi khi quan sát các
giá trị trung bình ước lượng chênh lệch tỷ suất sinh lợi bình quân thu được khi hồi
quy qua 7 mô hình. Cụ thể, xem xét riêng biến size, nếu như trong mô hồi quy đơn
biến thu được giá trị ước lượng tỷ suất sinh lợi bình quân là 1.32%, thì khi thêm biến
b/m trong mô hình (4) và mô hình (7) thì giá trị này tăng lên xấp xỉ lần lượt là 3.21%
và 3.27%. Trong khi đó, nếu như thêm biến prior trong mô hình (5) thì chỉ thu được
mức tăng nhỏ hơn rất nhiều là 1.45%. Và điều tương tự cũng xảy ra khi ta xem xét
riêng biến prior. Ngược lại, đối với biến b/m, khi đưa thêm các biến size và prior vào
thì đều làm cho mức chênh lệch tỷ suất sinh lợi bình quân tăng không đáng kể.
Từ những nhận định trên, để tìm hiểu rõ hơn về sự đóng góp của một biến mới
khi thêm vào mô hình hồi quy đơn biến, tôi sẽ tiến hành tính toán mức thay đổi trong
độ phân tán tỷ suất sinh lợi bình quân theo hai khía cạnh. Thứ nhất, trường hợp thêm
một biến mới vào mô hình hồi quy đơn biến. Thứ hai, trường hợp thêm một biến mới
vào mô hình hồi quy hai biến. Phần tiếp theo sẽ làm sáng tỏ vấn đề trên.
➢ Bước 3: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình
quân trong mô hình hai biến.
Ở bải nghiên cứu của Fama and French (2015), trong phần mô hình lý thuyết,
công thức số (9) đã chỉ ra có 2 cách để đo lường mức độ đóng góp tăng thêm của một
biến mới đến tỷ suất sinh lợi bình quân. Thứ nhất, đo lường theo chênh lệch độ phân
tán tỷ suất sinh lợi bình quân giữa mô hình đơn biến và mô hình hai biến (gồm 1 biến
trước đó và 1 biến mới được thêm vào). Thứ hai, sử dụng thêm hệ số tương quan để
34
ước lượng tỷ lệ phần trăm đóng góp của biến mới vào tỷ suất sinh lợi bình quân (
I2/R’ ). Dựa trên cơ sở lý thuyết này, tôi đã xây dựng cách tính toán như sau.
Bảng 4.3 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân
trong mô hình hai biến
I2/R'
I2/R'
*/R'
*/R'
*/R'
*/R'
R1
R2
R1
R2
Cách 1
ρ=0.55
ρ =0
Cách 1 ρ=0.55
ρ =0
-0.13
thêm B/M ratio vào Size thêm Size vào B/M ratio
0.03
μ 0.44 1.03 0.56 0.04 1.30 1.03 0.44 -0.03 -0.05
-3.90
σ 0.11 0.03 0.11 0.32 0.08 0.03 0.11 0.03 0.02
16.72 34.18
t 3.84 34.18 4.90 0.13 3.84 -1.09 -1.99
I2/R'
I2/R'
*/R'
*/R'
*/R'
*/R'
R1
R2
R1
R2
Cách 1
ρ=0.16
ρ =0
Cách 1 ρ=0.16
ρ =0
thêm Prior vào Size thêm Size vào Prior
μ 0.91 0.42 0.09 -0.05 0.21 0.42 0.91 0.18 0.48 0.51
σ 0.07 0.21 0.06 0.21 0.07 0.21 0.06 0.06
0.21 0.07 t 13.04 2.03 1.26
-0.23 3.43 2.03 13.04 2.77 7.90 8.43
I2/R'
I2/R'
R1*/R' R2*/R'
R1*/R'
R2*/R'
Cách 1
ρ=0.35
ρ =0
Cách 1 ρ=0.35
ρ =0
thêm Prior vào B/M ratio thêm B/M ratio vào Prior
-0.06
μ 0.99 0.20 0.01 0.06 0.20 0.99 0.80 0.97 1.19
-1.49
21.68
σ 0.04 0.03 0.04 0.12 0.04 0.12 0.10 0.05
0.12 0.04 t 26.12 1.67 0.23 2.12 1.67 26.12 6.91 9.73
*) chia cho độ
Hai cột đầu tiên trong mỗi mô hình ở bảng 4.3 trình bày mức độ phân tán tỷ
* và R2
suất sinh lợi đối với mô hình chỉ sử dụng một trong hai biến (R1
phân tán tỷ suất sinh lợi khi sử dụng đồng thời cả hai biến (R’). Cột thứ ba trình bày
35
*) / R’.
giá trị đóng góp tăng thêm của biến mới khi đưa vào mô hình theo cách thứ nhất,
được đo lường bằng tỷ lệ I2/R’= (R’- R1
Cột thứ 4 và thứ 5 lần lượt trình bày giá trị đóng góp tăng thêm của một biến
mới theo phương thức có tính đến mức độ tương quan giữa các biến giải thích trong
mô hình hồi quy. Cột thứ 4 được tính dựa trên hệ số tương quan mẫu (tính toán từ dữ
liệu nghiên cứu) và cột thứ 5 được tính dựa trên giả định hệ số tương quan bằng 0.
Kết quả nghiên cứu cho thấy rằng, ở tất cả các mô hình thì tổng giá trị của hai
cột đầu luôn lớn hơn 1. Điều này ám chỉ rằng: tổng mức độ phân tán tỷ suất sinh lợi
của các mô hình mà tỷ suất sinh lợi được giải thích bằng các biến riêng lẻ luôn lớn
hơn mức độ phân tán tỷ suất sinh lợi của mô hình mà tỷ suất sinh lợi được giải thích
đồng thời bằng tất cả các biến. Điều này cũng giống với các kết quả trong nghiên cứu
trước đây của Fama and French (2006) hay Lewellen (2011) và điểm chung trong các
bài nghiên cứu này là đều chưa giải thích được tại sao khi đem hồi quy đồng thời các
biến giải thích có tác động mạnh đến tỷ suất sinh lợi lại chỉ thu về một giá trị tỷ suất
sinh lợi bình quân ước tính thấp hơn so với tổng giá trị tỷ suất sinh lợi bình quân ước
tính trong mỗi mô hình đơn biến. Tuy nhiên, các bước tiếp theo trong bài nghiên cứu
này sẽ lý giải cho vấn đề trên.
❖ Xét về phương diện đo lường mức độ đóng góp tăng thêm của một biến
mới đến tỷ suất sinh lợi bình quân theo chênh lệch độ phân tán tỷ suất sinh lợi bình
quân giữa mô hình đơn biến và mô hình hai biến 3
Đối với biến tỷ số B/M, trong hai trường hợp lần lượt thêm biến B/M vào mô
hình đơn biến gồm mỗi biến size và biến prior, thì đều thu về tỷ số giá trị ước lượng
tăng thêm (I2/R’) cao hơn hẳn so với các trường hợp còn lại, lần lượt là 0.56 và 0.8.
Đối với biến size, trong hai trường hợp lần lượt thêm biến size vào mô hình đơn biến
gồm mỗi biến B/M và biến prior, thì lại thu về tỷ số I2/R’ thấp hơn so với khi thêm
biến B/M rất nhiều, lần lượt là -0.03 và 0.18. Tuy nhiên, giá trị -0.03 lại không còn
3 Tham khảo Bước 3 – Mục A trong “Phụ Lục 1. Thao tác tính toán trên Stata”
36
mang ý nghĩa thống kê. Và cũng tương tự như biến size, đối với biến prior cũng thu
về I2/R’ thấp hơn nhiều so với khi thêm biến B/M, lần lượt là 0.01 (khi thêm prior vào
B/M) và 0.09 (khi thêm prior vào size).
Kết quả này cũng ủng hộ cho các kết quả thu được ở bước 1 và bước 2. Do B/M
là biến có khả năng giải thích mạnh hơn so với biến size và prior nên khi thêm biến
B/M vào phương trình hồi quy đơn biến gồm mỗi biến size và prior thì sẽ làm gia
tăng mức đóng góp tăng thêm trong độ phân tán tỷ suất sinh lợi bình quân. Ngược
lại, đối với biến size và prior là các biến không có mức giải thích tốt bằng biến B/M
thì khi thêm biến size hoặc prior vào phương trình hồi quy đơn biến chỉ gồm biến
B/M sẽ chịu tác động lấn át từ biến B/M nên phần gia tăng trong độ phân tán thu được
không đáng kể. Đặc biệt, khi tác động lấn át từ biến B/M quá mạnh sẽ làm cho tỷ số
I2/R’ trở nên rất nhỏ và thậm chí mất luôn ý nghĩa thống kê. Lập luận này cũng góp
phần giải thích rõ thêm về trường hợp mất ý nghĩa thống kê trong bước 1 được trình
bày ở phần trên.
❖ Xét về phương diện đo lường mức đóng góp tăng thêm của một biến
mới đến tỷ suất sinh lợi bình quân trong trường hợp dùng hệ số tương quan 4
∗ đo lường tác động của
Thông qua dữ liệu có được tôi tiến hành tính toán hệ số tương quan (𝜌) giữa các
biến giải thích và áp dụng công thức 𝑰𝟐 = 𝑹′ − (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 một biến khi thêm biến đó vào phương trình hồi quy. Đồng thời, tôi cũng xem xét
cho trường hợp giả định khi không tồn tại sự tương quan giữa các biến giải thích với
nhau (𝜌 = 0) và so sánh giữa ba trường hợp này đâu là trường hợp có mức đóng góp
lớn nhất đến tỷ suất sinh lợi bình quân.
Về mặt tổng quát, bảng kết quả nghiên cứu dẫn đến những nhận định rõ ràng.
Thứ nhất, trường hợp không tồn tại độ tương quan giữa các biến giải thích hầu hết
mang đến mức tăng I2 vượt trội hơn so với các trường hợp còn lại. Đồng thời, giá trị
thống kê t thu được trong trường hợp này cũng duy trì ở mức cao hơn nhiều. Nguyên
4 Tham khảo Bước 3 – Mục B trong “Phụ Lục 1. Thao tác tính toán trên Stata”
37
nhân của điều này là vì hai biến độc lập khi không bị ràng buộc bởi hệ số tương quan
thì phần đóng góp tăng thêm do hai biến đó tạo ra sẽ không chịu tác động lấn án phục
thuộc lẫn nhau. Khi đó, hai biến càng có mức giải thích tốt cho tỷ suất sinh lợi thì
càng gia tăng khả năng thu được mức tỷ suất sinh lợi kỳ vọng bình quan cao hơn và
ngược lại.
Thứ hai, trường hợp có tồn tại độ tương quan giữa các biến giải thích lại thu về
mức đóng góp gia tăng ít hơn. Tồn tại thực tế trên là bởi các biến độc lập có mức
tương quan càng cao thì ảnh hưởng phụ thuộc và tác động qua lại giữa chúng càng
lớn. Cụ thể, trong mô hình đơn biến, một biến được xem là có mức giải thích rất mạnh
cho tỷ suất sinh lợi sẽ ngay lập tức bị giảm tác động khi đưa thêm một biến khác vào
mô hình hồi quy để kiểm định. Vì đóng góp tăng thêm của biến độc lập ban đầu lúc
này sẽ chịu tác động lấn át từ phần đóng góp của biến độc lập mới do giữa hai biến
tồn tại mức tương quan với nhau. Nếu tồn tại sự tương quan dương, thì hệ số tương
quan càng lớn sẽ đem đến tác động lấn át càng lớn và ngược lại.
Thứ ba, tỷ số I2/R2 trong trường hợp hệ số tương quan giữa các biến độc lập bằng 0 hầu hết vượt trội hơn so với khi tồn tại hệ số tương quan đưa tôi đến nhận định
rằng: tồn tại tác động lấn át sẽ đi kèm theo tác động pha loãng của các biến độc lập.
Hai biến có thể có thể làm gia tăng mạnh tỷ suất sinh lợi bình quân khi chúng không
hề chịu tác động ràng buộc nào và khi xuất hiện mức tương quan giữa hai biến độc
lập thì phần gia tăng này sẽ bị giảm xuống. Tuy nhiên, vấn đề đặt ra là giữa hai biến
độc lập thì biến nào là biến mang lại sự gia tăng chính cho tỷ suất sinh lợi và làm thế
nào để đo lường cụ thể thì “Bước 5. Đo lường sự pha loãng biến” sẽ làm rõ hơn cho
câu hỏi này.
Về mặt chi tiết, bảng kết quả nghiên cứu giúp tôi đưa ra một số nhận xét sau.
Đối với biến tỷ số B/M: mức độ đóng góp tăng thêm trung bình của biến B/M
khi thêm vào mô hình có biến quy mô lần lượt là 0.04 (khi hệ số tương quan mẫu
trung bình là 0.55) và 1.30 (khi giả định hệ số tương quan bằng 0). Trong khi đó, đối
38
với mô hình có biến prior thì biến B/M mang đến sự gia tăng trong tỷ số I2/R2 cao hơn, lần lượt là 0.97 (khi tồn tại hệ số tương quan) và 1.19 (khi không có độ tương
quan). Và khi quan sát các trường hợp còn lại thì việc thêm B/M vào mô hình đơn
biến gồm chỉ biến size hoặc prior mang lại mức gia tăng tỷ suất sinh lợi cao hơn hẳn
so với các trường hợp còn lại. Điều này đưa tôi đi đến giả thuyết rằng: thứ tự tăng
dần mức độ giải thích của biến độc lập đối với biến phụ thuộc sẽ là: prior, size và
B/M. Bởi vì mức gia tăng tỷ suất sinh lợi bình quân khi thêm biến B/M vào mô hình
chỉ có biến prior lớn hơn so với mô hình chỉ có biến size. Do đó, tác động lấn át của
biến B/M đối với biến prior sẽ mạnh hơn đối với biến size. Hay nói cách khác, biến
prior có mức giải thích cho tỷ suất sinh lợi không tốt bằng biến size và biến B/M.
Đối với biến size, biến prior cũng cho những nhận định đồng thuận. Cụ thể, mức
độ đóng góp tăng thêm trung bình của biến size khi đưa vào mô hình chỉ có biến tỷ
số B/M trước đó lần lượt là -0.05 và -0.13. Mức đóng góp tăng thêm âm này của biến
quy mô có thể được lý giải bởi độ mạnh của biến tỷ số B/M trong việc giải thích cho
biến tỷ suất sinh lợi và hệ số tương quan khá lớn của hai biến này (ρ=0.55). Việc đưa
thêm biến quy mô vào mô hình đã có biến tỷ số B/M không làm tăng mức độ giải
thích cho tỷ suất sinh lợi cổ phiếu.
Hệ số tương quan bình quân giữa biến quy mô và biến xu hướng sinh lời là 0.16.
Đóng góp tăng thêm của biến size khi thêm vào mô hình sử dụng biến prior trong
trường hợp tồn tại hệ số tương quan mẫu là 0.48 và trong trường hợp giả định hệ số
tương quan bằng 0 là 0.51. Trường hợp khi thêm biến prior vào mô hình sử dụng biến
size, đóng góp tăng thêm của biến prior tăng lên đáng kể (từ -0.05 lên 0.21) khi giả
định hệ số tương quan bằng 0.
Hệ số tương quan bình quân giữa biến tỷ số B/M và khuynh hướng sinh lời là
0.35. Đóng góp tăng thêm của biến tỷ số B/M khi thêm vào mô hình trong trường hợp
sử dụng hệ số tương quan mẫu là 0.97 và trong trường hợp giả định hệ số tương quan
bằng 0 là 1.19. Mức đóng góp này của biến tỷ số B/M là khá lớn thể hiện độ mạnh
39
của biến tỷ số B/M so với biến khuynh hướng sinh lời trong việc giải thích tỷ suất
sinh lợi cổ phiếu.
Mức đóng góp tăng thêm trong trường hợp sử dụng hệ số tương quan mẫu có xu
hướng nhỏ hơn so với mức đóng góp tăng thêm với giả định hệ số tương quan giữa
hai biến bằng 0. Khi biến mới thêm vào mô hình không tương quan với biến sẵn có,
những thông tin hàm chứa trong biến này là hoàn toàn mới và do đó sẽ tăng mức độ
giải thích cho biến phụ thuộc.
➢ Bước 4: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình
quân trong mô hình ba biến
Phần trên đây tôi vừa tiến hành đo lường mức gia tăng của biến mới khi xem xét
trong mô hình hồi quy hai biến. Trong phần này, tôi sẽ xem xét vấn đề này trong mô
hình ba biến. 5
Hai cột đầu tiên của bảng 4.4 là giá trị mức độ phân tán tỷ suất sinh lợi của mô
hình hai biến và mô hình của biến thứ ba. Cả hai đều chia cho giá trị mức độ phân tán
tỷ suất sinh lợi của mô hình hồi quy sử dụng đồng thời cả ba biến.
Tương tự như kết quả ở bảng 4.3, tổng giá trị của hai cột này luôn lớn hơn 1.
Giá trị đóng góp tăng thêm của biến khuynh hướng sinh lời (prior) đối với mô hình
đã có biến quy mô và tỷ số B/M là 0.01 trong khi giá trị đóng góp tăng thêm của biến
quy mô chỉ là -0.03. Đóng góp của từng biến này vào mô hình hai biến là không có ý
nghĩa thống kê với giá trị thống kê lần lượt là 0.37 và -1.04. Giá trị đóng góp tăng
thêm lớn nhất là của biến tỷ số B/M đạt 0.52 và có ý nghĩa thống kê ở mức 1%, điều
này càng khẳng định mức độ quan trọng của tỷ số B/M trong việc giải thích cho tỷ
suất sinh lợi cổ phiếu đối với mẫu là các công ty niêm yết trên Sàn Giao Dịch Chứng
Khoán Thành Phố Hồ Chí Minh.
5 Tham khảo Bước 4 trong “Phụ Lục 1. Thao tác tính toán trên Stata”
∗/𝑅′ sẽ cung cấp thêm bằng chứng
40
Ngoài ra, khi so sánh về độ lớn giữa hệ số 𝑅1
∗ đại diện cho mức chênh lệch tỷ suất
về dự đoán B/M chính là yếu tố giải thích mạnh hơn nhiều cho tỷ suất sinh lợi so với
hai biến size và prior. Trong trường hợp này, 𝑅1 sinh lợi bình quân trong mô hình hai biến, còn 𝑅′ đại diện cho mức chênh lệch tỷ suất
∗ 𝑅1 𝑅′ = 0.99 khi thêm biến prior vào mô hình hai biến, có thể nhận thấy rằng: mức đóng góp tăng thêm của biến prior
sinh lợi bình quân trong mô hình ba biến. Với giá trị
∗ 𝑅1 𝑅′ = 1.03 khi thêm biến size vào mô hình hai biến còn chứng minh rằng: mô hình hai biến gồm biến B/M và prior còn
trong tỷ suất sinh lợi là rất ít. Ngoài ra, với giá trị
thu được mức tỷ suất sinh lợi bình quân cao hơn so với khi thêm biến size vào mô
∗ 𝑅1 𝑅′ = 0.48 lại mang đến kết quả trái ngược. Đó là minh chứng rõ ràng cho việc khi thêm biến B/M vào mô hình hai biến gồm biến size và prior đã
hình. Tuy nhiên, giá trị
tạo ra tỷ suất sinh lợi vượt trội hơn so với hai trường hợp còn lại. Điều này hoàn toàn
phù hợp với các nhận định trên về khả năng giải thích mạnh cho tỷ suất sinh lợi bình
quân của tỷ số B/M.
Bảng 4.4 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân
trong mô hình ba biến
Thêm biến prior vào Thêm biến B/M vào Thêm biến size vào
*/R'
*/R'
*/R'
FV(size,B/M ) FV(size,prior) FV(B/M,prior)
*/R' R2
*/R' R2
*/R' R2
R1 I2/R' R1 I2/R' R1 I2/R'
μ 0.99 0.20 0.01 0.48 1.02 0.52 1.03 0.44 -0.03
σ 0.04 0.12 0.04 0.15 0.05 0.15 0.03 0.12 0.03
t 27.42 1.66 0.37 3.27 21.09 3.52 37.75 3.71 -1.04
Hai bước 3 và 4 vừa trình bày trên đây đã giải thích rất kĩ về tác động tăng thêm
của biến khi xem xét trong mô hình hồi quy hai biến và đa biến. Qua đó, câu hỏi
41
nghiên cứu về tác động của biến mới đã được làm sáng tỏ rằng: bản thân các biến độc
lập trong mô hình hồi quy đơn biến có thể tự mình giải thích tốt cho tỷ suất sinh lợi.
Nhưng khi đưa thêm một biến mới vào mô hình thì tỷ suất sinh lợi có thể gia tăng rất
mạnh nếu biến đó là b/m và ngược lại, tỷ suất sinh lợi cũng có thể gia tăng không
đáng kể nếu biến đó là size hay đặc biệt là prior. Và nghiên cứu của Fama and French
(2015) đã tìm ra lời giải cho câu hỏi này: đó là mối tương quan giữa tác động khuyếch
đại và pha loãng của biến độc lập. Phần tiếp theo sẽ làm rõ hơn về vấn đề này.
➢ Bước 5: Đánh giá sự pha loãng biến.
Trước khi bàn về kết quả nghiên cứu, tôi sẽ phân tích rõ hơn về mối quan hệ
giữa sự khuyếch đại (Variable Amplification) và sự pha loãng (Variable Attenuation)
biến độc lập.
Hình 4.2 Tác động khuyếch đại và pha loãng của biến độc lập
Giả định trong mô hình hồi quy đơn biến gồm chỉ có biến X1 , sau khi tính toán
giá trị ước lượng tỷ suất sinh lợi bình quân của tất cả các mã cổ phiếu cho từng tháng,
tôi tiến hành sắp xếp các giá trị này thành 5 nhóm phân vị có số lượng cổ phiếu bằng
nhau theo thứ tự từ cao nhất đến thấp nhất. Sau đó, tôi sẽ thu được giá trị trung bình
của hai nhóm phân vị cao nhất và thấp nhất theo phương pháp bình quân không trọng
∗ (mức chênh lệch kỳ vọng giữa giá trị
42
số. Từ đấy, mỗi tháng tôi thu được giá trị 𝑿𝟏
∗ (độ phân tán tỷ suất sinh lợi bình quân trong
trung bình của biến X1 ứng với nhóm danh mục phân vị cao nhất và thấp nhất trong
mô hình hồi quy đơn biến) và giá trị 𝑹𝟏
trong mô hình hồi quy đơn biến).
Bây giờ tôi tiến hành thêm biến X2 vào phương trình và kiểm định liệu việc
thêm biến có làm tăng mức chênh lệch tỷ suất sinh lợi bình quân. Và kết quả thu được
đã giúp tôi chứng minh được tồn tại đồng thời hai tác động khuyếch đại và pha loãng
biến độc lập. Cụ thể, khi tôi thêm biến X2 vào phương trình và tiến hành hồi quy đã
tác động đến độ phân tán tỷ suất sinh lợi bình quân thông qua việc thay đổi các cổ
phiếu trong nhóm danh mục có tỷ suất sinh lợi ước tính lớn nhất và nhỏ nhất. Trong
phương trình đơn biến, danh mục có tỷ suất sinh lợi bình quân cao sẽ tối đa hóa giá
trị bình quân của biến X1 nếu độ dốc trong phương trình hồi quy là cùng chiều, hoặc
tối thiểu hóa nếu ngược chiều. Trong khi đó, với mô hình hồi quy hai biến, danh mục
có tỷ suất sinh lợi bình quân cao được hình thành từ việc: thay thế những cổ phiếu
đang có X1 cao, X2 thấp bằng những cổ phiếu có X1 thấp hơn nhưng X2 cao hơn. Đối
′ (mức
với danh mục có tỷ suất sinh lợi bình quân thấp thì sẽ tiến hành ngược lại. Và đó là
′ , 𝑿𝟐
nguyên nhân giải thích vì sao trong mô hình hai biến xuất hiện hai giá trị 𝑿𝟏
chênh lệch kỳ vọng giữa giá trị trung bình của biến X1, X2 ứng với nhóm danh mục
ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy hai biến).
Kết quả từ biện pháp thay thế này sẽ làm gia tăng mức chênh lệch tỷ suất sinh
′ị), nhưng đồng thời cũng làm giảm độ phân tán của biến X1 (vì giá
lợi kỳ vọng thông qua việc tăng độ phân tán của biến X2 giữa hai danh mục cực hạn
′ lúc này nhỏ hơn X1). Vì vậy, tác động làm gia tăng độ phân tán của biến X2
(cụ thể là giá tr𝑋2
trị 𝑋1
được xem là tác động khuếch đại. Trong khi đó, tác động làm giảm bớt độ phân tán
của biến X1 được hiểu là tác động pha loãng.
Bảng 4.5 trình bày kết quả tính toán tỷ lệ độ phân tán của biến độc lập khi ước
lượng riêng lẽ và khi thêm biến mới vào mô hình.6 Cụ thể, đối với mỗi biến, cột thứ
6 Tham khảo Bước 5 trong “Phụ Lục 1. Thao tác tính toán trên Stata”
43
nhất và cột thứ hai thể hiện tỷ lệ độ phân tán của biến đó được hình thành từ các danh
mục sắp xếp dựa trên tỷ suất sinh lợi ước tính từ mô hình hai biến (một biến mới được
thêm vào). Khi đó, cột thứ ba sẽ thể hiện tỷ lệ độ phân tán của biến đó từ các danh
mục được hình thành dựa trên tỷ suất sinh lợi ước tính từ mô hình ba biến (hai biến
mới được thêm vào).
Đối với biến quy mô, kết quả cho thấy: khi thêm biến mới vào mô hình thì mức
độ phân tán của biến quy mô giảm đi đáng kể. Mức độ phân tán giảm đi 74% và 12%
khi lần lượt thêm biến tỷ số B/M và biến xu hướng sinh lời vào mô hình. Khi thêm
đồng thời cả hai biến này thì mức độ phân tán giảm đi 79%. Các mức phân tán tăng
thêm này đều có ý nghĩa thống kê với giá trị thống kê t lần lượt là 3.35; 21.35 và 1.74.
Bảng 4.5 Tỷ lệ pha loãng biến
Quy mô Tỷ số B/M Xu hướng sinh lời
𝐸𝑄4 𝐸𝑄1 𝐸𝑄5 𝐸𝑄1 𝐸𝑄7 𝐸𝑄1 𝐸𝑄4 𝐸𝑄2 𝐸𝑄6 𝐸𝑄2 𝐸𝑄7 𝐸𝑄2 𝐸𝑄5 𝐸𝑄3 𝐸𝑄6 𝐸𝑄3 𝐸𝑄7 𝐸𝑄3
μ 0.26 0.88 0.21 0.95 0.98 0.91 0.62 0.18 0.14
σ 0.08 0.04 0.12 0.02 0.02 0.05 0.11 0.17 0.17
t 3.35 21.35 1.74 43.96 64.18 17.40 5.87 1.10 0.81
Điều tương tự cũng xảy ra đối với biến prior, thêm biến mới vào mô hình thì
mức phân tán của biến prior giảm mạnh hơn so với biến quy mô. Mức độ phân tán
giảm đi 38% và 82% khi lần lượt thêm biến quy mô và tỷ số B/M vào mô hình. Khi
thêm đồng thời cả hai biến này thì mức độ phân tán giảm đi 86%. Tuy nhiên khác với
hai biến trên, mức giảm mức độ phân tán của biến xu hướng sinh lời chỉ có ý nghĩa
thống kê trong trường hợp thêm biến quy mô vào mô hình với giá trị thống kê t đạt
5.87 (tương ứng với 1%), các trường hợp còn lại mức giảm này đều không có ý nghĩa
thống kê với giá trị thống kê lần lượt là 1.10 và 0.81.
44
Và điểm chung trong kết quả thu được từ hai nhóm chỉ số quy mô và khuynh
hướng sinh lợi chính là mỗi khi thêm biến b/m thì mức độ pha loãng luôn mạnh hơn
nhiều so với các trường hợp còn lại. Đó chính là do bản thân biến b/m đã có khả năng
′ cao hơn. Đồng thời, tác động này
giải thích mạnh hơn so với hai biến còn lại nên khi thêm biến b/m vào hình thì b/m
′ nhỏ hơn nhiều so với giá trị ban đầu X1. Chính điều này đã lí
giải thích tốt hơn nên sinh ra giá trị tăng thêm 𝑋2
cũng làm cho giá trị 𝑋1
giải cho kết quả pha loãng đối với nhóm hai biến quy mô và khuynh hướng sinh lời
trong trường hợp thêm biến b/m luôn lớn hơn so với hai trường hợp còn lại.
Mặt khác, đối với biến tỷ số B/M, khi thêm biến mới vào mô hình thì mức độ
phân tán của biến này không thay đổi đáng kể. Mức độ phân tán giảm đi 5% và 2%
khi ta thêm lần lượt riêng lẻ biến quy mô, biến xu hướng sinh lời vào mô hình. Đồng
thời, mức độ phân tán của biến tỷ số B/M trong trường hợp thêm vào cả hai biến cũng
giảm với mức độ rất thấp (giảm 9%). Các mức giảm này đều có ý nghĩa thống kê với
tỷ số thống kê t lớn, lần lượt là 43.96; 64.18 và 17.4 và đều có ý nghĩa thống kê ở
mức 1%.
Trên đây tôi vừa trả lời cho câu hỏi nghiên cứu vì sao việc đưa thêm một biến
có ảnh hưởng đến tỷ suất sinh lợi nhưng lại không làm gia tăng giá trị độ phân tán tỷ
suất sinh lợi bình quân thông qua kết quả của tác động pha loãng biến và khuyếch đại
biến. Tuy nhiên, phương pháp này chỉ được tính toán dựa trên việc xem xét giá trị
của 2 nhóm phân vị cao nhất và thấp nhất. Phần tiếp theo sẽ đưa ra cái nhìn tổng thể
hơn khi tính toán đồng thời cả 5 nhóm phân vị.
➢ Bước 6: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong
trường hợp mô hình hai biến.
Mức độ chênh lệch tỷ suất sinh lợi được đo lường bằng tổng mức độ phân tán
tỷ suất sinh lợi của hai mô hình đơn biến trừ đi mức độ phân tán của mô hình kết hợp
đồng thời cả hai biến để giải thích cho tỷ suất sinh lợi của cổ phiếu (return gap). Với
mỗi mô hình hai biến, giá trị ước tính tỷ suất sinh lợi từ mô hình hồi quy sẽ được sử
45
dụng để tính toán các kết quả nghiên cứu liên quan. Dựa trên cơ sở này, tôi tiến hành
5
4
3
2
1
0 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
-1
spread.size model7
spread.size model5
spread.size model4
spread.size model1
tính toán mức độ chênh lệch kỳ vọng của từng biến qua các mô hình hồi quy.
4
3
2
1
0 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
-1
-2
spread.prior model7
spread.prior model6
spread.prior model5
spread.prior model3
Hình 4.3 Mức độ chênh lệch biến quy mô trong các mô hình
Hình 4.4 Mức độ chênh lệch biến khuynh hướng sinh lời trong các mô hình
4
3.5
3
2.5
2
1.5
1
0.5
0 2009m1
2010m1
2011m1
2012m1
2013m1
2014m1
2015m1
2016m1
spread.bm model7
spread.bm model6
spread.bm model4
spread.bm model2
46
Hình 4.5 Mức độ chênh lệch biến tỷ số B/M trong các mô hình
Hai biểu đồ về độ phân tán của biến quy mô và biến khuynh hướng sinh lời đưa
ra một số đặc điểm cần lưu ý. Thứ nhất, từ mô hình đơn biến cho đến mô hình hai
biến và sau cùng là mô hình ba biến thì mức độ phân tán giảm mạnh tiến gần về mức
0, thậm chí có thời kỳ mang giá trị âm. Thứ hai, mỗi khi đưa thêm biến tỷ số b/m vào
phương trình hồi quy thì ngay lập tức tác động pha loãng xảy ra rất mạnh chính là
nguyên nhân làm cho giá trị độ phân tán giảm sâu. Nhận định này hoàn toàn đồng
nhất với các kết quả nghiên cứu thu được từ các bước kiểm định trước đó. Ngoài ra,
đây cũng là nhân tố củng cố thêm cho giả thuyết tỷ số b/m chính là yếu tố mạnh nhất
quyết định tỷ suất sinh lợi kỳ vọng bình quân.
Trái ngược với hai biến quy mô và khuynh hướng sinh lợi, biểu đồ chênh lệch
biến tỷ số b/m luôn duy trì ổn định qua các thời kỳ khi tiến hành hồi quy trong phương
trình đơn biến, hai biến và ba biến. Ngoài ra, giá trị độ phân tán mà biến b/m thể hiện
luôn mang giá trị dương chứng tỏ biến b/m luôn làm tăng giá trị chênh lệch tỷ suất
sinh lợi kỳ vọng mỗi khi được đưa vào mô hình.
Sau khi nhận xét tổng quan về biểu đồ diễn biến mức độ phân tán của các biến
độc lập qua các thời kỳ khi tiến hành hồi quy hai biến và ba biến, tôi sẽ đưa ra đánh
47
giá chi tiết về giá trị độ lớn ước tính chênh lệch tỷ suất sinh lợi trong mô hình hai biến
(return gap). Bài nghiên cứu của Fama and French (2015) đã chỉ ra có hai cách để
tính toán giá trị return gap.
∗ − 𝑹′
Thứ nhất, theo chênh lệch tỷ suất sinh lợi bình quân giữa các phương trình.
∗ + 𝑹𝟐
𝑹𝒆𝒕𝒖𝒓𝒏 𝑮𝒂𝒑 = 𝑹𝟏
′ )]
Thứ hai, theo sự kết hợp giữa tác động pha loãng độ dốc và pha loãng biến.7
∗ + 𝒃𝟏𝑿𝟐
∗ ) + [𝒃𝟏(𝑿𝟏
∗ − 𝑿𝟏
′ ) + 𝒃𝟐(𝑿𝟐
∗ − 𝑿𝟐
𝑹𝒆𝒕𝒖𝒓𝒏 𝒈𝒂𝒑 = 𝝆(𝒃𝟐𝑿𝟏
Kết quả nghiên cứu trong bảng 4.6 đã đề cập đến mức độ chênh lệch tỷ suất
sinh lợi khi ước tính bằng hệ số tương quan và các thành phần cấu thành nên giá trị
này (bao gồm mức độ pha loãng biến và mức độ pha loãng hệ số ước lượng).
Đối với hai biến tỷ số b/m và quy mô, mức độ chênh lệch tỷ suất sinh lợi trong
mô hình sử dụng hai biến này được tính toán theo cách thứ nhất mang giá trị 1.40%.
Điều này cho thấy tổng mức độ phân tán tỷ suất sinh lợi của hai mô hình ước lượng
riêng lẻ hai biến độc lập (quy mô và tỷ số B/M) lớn hơn mức độ phân tán tỷ suất sinh
lợi khi ước lượng đồng thời cả hai biến này. Giá trị thống kê t của mức chênh lệch tỷ
suất sinh lợi này đạt giá trị 7.71 cho thấy sự khác biệt này có ý nghĩa thống kê mạnh.
Trong khi đó, nếu phân tích mức độ chênh lệch tỷ suất sinh lợi dựa trên các yếu
tố cấu thành nên nó bao gồm sự pha loãng biến và sự pha loãng hệ số ước lượng thì
kết quả nghiên cứu thu được không có nhiều sự khác biệt. Mức độ pha loãng hệ số
ước lượng đạt 3.47% với hệ số tương quan bình quân giữa biến quy mô và tỷ số B/M
xấp xỉ 0.55 (tương đối cao) cho thấy rằng mức độ pha loãng hệ số ước lượng của biến
tỷ số B/M lớn hơn mức độ pha loãng hệ số ước lượng của biến quy mô. Điều này xuất
phát từ sự đối lập về dấu đối với hệ số ước lượng của hai biến này trong phương trình
tỷ suất sinh lợi cổ phiếu như đã trình bày trong cột 4 bảng 4.2. Mức độ pha loãng
biến đạt -0.50% cho thấy sự thay đổi trong độ phân tán của biến quy mô giữa mô hình
7 Tham khảo Bước 6 trong “Phụ Lục 1. Thao tác tính toán trên Stata”
48
một biến và mô hình thêm biến tỷ số B/M là lớn hơn so với sự thay đổi trong mức độ
phân tán của biến tỷ số B/M giữa mô hình một biến và mô hình thêm biến quy mô.
Tổng hai mức độ phân tán này đạt 2.96% cho thấy việc thêm biến vào mô hình giúp
giải thích tốt hơn cho tỷ suất sinh lợi.
Bảng 4.6 Kết quả ước tính chênh lệch tỷ suất sinh lợi
trong mô hình hai biến
Pha loãng
size + bm Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng
μ 1.40% 3.47% -0.50% 2.96%
σ 0.18% 0.55% 0.05% 0.53%
t 7.71 6.27 -9.55 5.58
Pha loãng
size + prior Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng
μ 0.48% 0.45% 0.40% 0.84%
σ 0.28% 0.43% 0.08% 0.37%
t 1.68 1.04 5.22 2.30
Pha loãng
bm + prior Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng
μ 0.57% 0.28% 0.64% 0.92%
σ 0.34% 0.20% 0.14% 0.25%
t 1.66 1.37 4.47 3.64
49
Đối với hai biến quy mô và xu hướng sinh lời, mức độ chênh lệch tỷ suất sinh
lợi đối với mô hình sử dụng hai biến này đạt 0.48%. Khi sử dụng hệ số tương quan
để tính toán thì mức độ phân tán tỷ suất sinh lợi đạt 0.84% trong đó mức độ pha loãng
hệ số ước lượng là 0.45% và mức độ pha loãng biến là 0.40%. Hệ số tương quan bình
quân của biến quy mô và xu hướng sinh lời đạt 0.16, các giá trị ước lượng của cả hai
biến này trong mô hình tỷ suất sinh lợi (bảng 4.1, cột 5) đều dương cho thấy hệ số
ước lượng của hai biến này khi ước lượng đồng thời đã giảm đi so với khi ước lượng
riêng lẻ. Các mức chênh lệch đều có ý nghĩa thống kê trừ trường hợp pha loãng hệ số
ước lượng với giá trị thống kê t chỉ đạt 1.04.
Trong trường hợp mô hình nghiên cứu sử dụng hai biến tỷ số B/M và xu hướng
sinh lời để giải thích cho tỷ suất sinh lợi, mức độ chênh lệch đạt 0.57% cho thấy rằng
tổng mức độ phân tán tỷ suất sinh lợi của hai mô hình ước lượng riêng lẻ lớn hơn
mức độ phân tán tỷ suất sinh lợi khi sử dụng đồng thời cả hai biến. Khi sử dụng hệ
số tương quan bình quân để tính toán thì mức độ chênh lệch tỷ suất sinh lợi đạt 0.92%;
trong đó mức độ pha loãng hệ số ước lượng là 0.28% và mức độ pha loãng biến là
0.64%. Tất cả các mức độ chênh lệch đều có ý nghĩa thống kê với giá trị t lớn, trừ
trường hợp pha loãng hệ số ước lượng với giá trị thống kê t đạt 1.37. Một điểm đáng
lưu ý khi thêm biến tỷ số B/M vào mô hình đã có biến quy mô và ngược lại thì hệ số
pha loãng biến là âm (-0.50%) với mức ý nghĩa thống kê 1% (t=9.55). Điều này
chuyển sự pha loãng trở thành sự phóng đại. Lập luận này phù hợp với kết quả ước
lượng khi hệ số ước lượng của biến quy mô chuyển dấu từ 0.003 khi ước lượng riêng
lẻ (bảng 4.1, cột 1) sang -0.002 khi thêm biến tỷ số B/M vào mô hình (bảng 4.1, cột
4). Kết quả của sự chuyển dấu này khiến sự pha loãng biến trở thành phóng đại biến.
Nhìn chung, các kết quả tính toán mức độ chênh lệch tỷ suất sinh lợi (return
gap) khi xem xét trên cả 5 nhóm danh mục phân vị theo hai cách thu được kết quả
tương đương nhau. Trong đó, mô hình chứa đựng tỷ số quy mô và tỷ số b/m mang lại
mức chênh lệch tỷ suất sinh lợi cao nhất. Kết quả này hoàn toàn phù hợp với những
50
nhận định trên đây. Phần tiếp theo sẽ đo lường mức độ chênh lệch tỷ suất sinh lợi khi
tiến hành hồi quy 3 biến.
➢ Bước 7: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong
trường hợp mô hình ba biến.
Đối với mô hình sử dụng cả ba biến để giải thích cho tỷ suất sinh lợi, mức độ
chênh lệch tỷ suất sinh lợi được tính toán bằng độ phân tán tỷ suất sinh lợi của mô
hình hai biến và độ phân tỷ suất sinh lợi của mô hình chứa biến còn lại trừ đi độ phân
tán tỷ suất sinh lợi mô hình cả ba biến.8
Bảng 4.7 trình bày kết quả chênh lệch tỷ suất sinh lợi ước tính khi sử dụng mức
độ phân tán tỷ suất sinh lợi lẫn khi sử dụng hệ số ước lượng bình quân giữa giá trị tỷ
suất sinh lợi ước tính từ mô hình hai biến với biến còn lại. Các thành phần cấu thành
nên sự chênh lệch tỷ suất sinh lợi khi ước tính bằng hệ số tương quan được trình bày
ở cột 2 và cột 3 với từng mô hình.
Đối với mô hình sử dụng biến quy mô và biến tỷ số B/M để giải thích cho tỷ
suất sinh lợi cổ phiếu, khi thêm vào biến xu hướng sinh lời sẽ tạo ra một sự chênh
lệch tỷ suất sinh lợi đạt 0.56%. Điều này hàm ý rằng, tổng mức độ phân tán tỷ suất
sinh lợi của mô hình hai biến và mô hình chỉ chứa biến xu hướng sinh lời lớn hơn
mức độ phân tán tỷ suất sinh lợi của mô hình khi sử dụng đồng thời cả ba biến này.
Khi phân tích dựa vào hệ số tương quan bình quân giữa biến xu hướng sinh lời
và giá trị ước tính tỷ suất sinh lợi trong mô hình ước lượng với hai biến còn lại, ta
thấy mức độ pha loãng hệ số ước lượng đạt 1.58% trong khi hệ số pha loãng biến là
-0.56% và khiến cho tổng chênh lệch tỷ suất sinh lợi đạt 1.03%. Hệ số pha loãng biến
âm được lý giải bởi hệ số ước lượng của biến xu hướng sinh lời trong phương trình
sử dụng đồng thời cả ba biến để giải thích cho tỷ suất sinh lợi là âm. Điều này cho
thấy rằng mặc dù việc đưa hai biến mới vào mô hình đã có sẵn biến xu hướng sinh
8 Tham khảo Bước 7 trong “Phụ Lục 1. Thao tác tính toán trên Stata”
51
lời sẽ làm cho mức độ phân tán của biến này giảm đi nhưng lại tạo ra tác động phóng
đại thay vì pha loãng biến.
Bảng 4.7 Kết quả ước tính chênh lệch tỷ suất sinh lợi
trong mô hình ba biến
Pha loãng
μ
Fv(size,B/M) và prior Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng
σ
0.56% 1.58% -0.56% 1.03%
t
0.33% 0.21% 0.12% 0.19%
1.68 7.66 -4.57 5.26
Pha loãng
μ
Fv(size,prior) và B/M Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng
σ
1.48% -0.59% 0.32% -0.27%
t
0.28% 0.14% 0.12% 0.25%
5.22 -4.10 2.44 -1.06
Pha loãng
μ
Fv(B/M,prior) và size Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng
σ
1.39% 2.33% -0.81% 1.53%
t
0.18% 0.18% 0.15% 0.13%
7.72 12.88 -5.39 11.33
52
Đóng góp này làm giảm một phần mức chênh lệch tỷ suất sinh lợi giữa các mô
hình ước lượng riêng lẻ so với mô hình ước lượng sử dụng đồng thời cả ba biến. Các
giá trị chênh lệch được lý giải ở trên đều có ý nghĩa thống kê với giá trị t lớn.
Đối với trường hợp thêm biến tỷ số B/M vào mô hình đã tồn tại các biến quy
mô, xu hướng sinh lời, mức độ chênh lệch tỷ suất sinh lợi đạt 1.48%. Điều này cho
thấy rằng, tổng độ phân tán tỷ suất sinh lợi của mô hình sử dụng biến tỷ số B/M và
mô hình sử dụng hai biến còn lại lớn hơn mức độ phân tán tỷ suất sinh lợi khi sử dụng
đồng thời cả ba biến này. Mức chênh lệch này có ý nghĩa thống kê với giá trị t đạt
5.22. Khi xem xét mức độ chênh lệch dựa vào hệ số tương quan và các yếu tố cấu
thành, kết quả từ cột 2 đến cột 4 cho thấy mức độ pha loãng hệ số ước lượng của biến
độc lập là -0.59% trong khi mức độ pha loãng biến độc lập là 0.32%.
Hai tác động đối nghịch này khiến cho mức độ chênh lệch tỷ suất sinh lợi tính
theo hệ số tương quan giữa biến tỷ số B/M và giá trị tỷ suất sinh lợi ước tính từ mô
hình sử dụng hai biến còn lại đạt -0.27%. Mức độ pha loãng hệ số ước lượng mang
dấu âm trong khi dấu của biến tỷ số B/M dương và hệ số tương quan của hai yếu tố
này là dương cho thấy dấu của giá trị tỷ suất sinh lợi ước tính đã đổi dấu khi đưa thêm
biến tỷ số B/M vào mô hình. Mức độ pha loãng biến mang dấu dương cho thấy rằng
hệ số ước lượng của biến tỷ số B/M trong phương trình tỷ suất sinh lợi cổ phiếu không
hề đổi dấu khi ước lượng một mình hay khi thêm hai biến còn lại vào mô hình. Mặc
dù có sự khác biệt về dấu giữa mức độ chênh lệch tỷ suất sinh lợi khi ước tính đơn
giản và khi ước tính sử dụng hệ số tương quan nhưng sự khác biệt này dường như lại
không có ý nghĩa thống kê để giải thích cho sự thay đổi mức độ phân tán tỷ suất sinh
lợi khi thêm biến mới vào mô hình.
Đối với trường hợp thêm biến quy mô vào mô hình đã sử dụng hai biến còn lại
là tỷ số B/M và xu hướng sinh lời để giải thích cho tỷ suất sinh lợi thì kết quả tính
toán cho thấy một sự tương đồng với trường hợp thêm biến xu hướng sinh lời vào mô
hình. Mức độ chênh lệch tỷ suất sinh lợi trong trường hợp này đạt 1.39%. Điều này
được diễn giải rằng tổng mức độ phân tán tỷ suất sinh lợi của mô hình sử dụng hai
53
biến giải thích và mô hình sử dụng biến còn lại lớn hơn so với mô hình ước lượng sử
dụng đồng thời cả ba biến này. Giá trị chênh lệch này khi sử dụng hệ số tương quan
bình quân giữa biến xu hướng sinh lời và giá trị tỷ suất sinh lợi ước tính từ mô hình
ước lượng sử dụng hai biến còn lại là 1.53%. Cả hai giá trị này đều có ý nghĩa thống
kê mạnh với các giá trị t lần lượt là 7.72 và 11.33.
Khi phân tích mức độ chênh lệch dựa vào hệ số tương quan và các yếu tố cấu
thành, kết quả cho thấy rằng tồn tại mối quan hệ trái chiều giữa mức độ pha loãng hệ
số ước lượng và mức độ pha loãng biến. Mức độ pha loãng hệ số ước lượng trong
trường hợp này đạt 2.33% trong khi mức độ pha loãng biến đạt -0.81%. Mức độ pha
loãng biến mang dấu âm khi thêm biến quy mô vào mô hình sử dụng hai biến còn lại
trước đó có thể được giải thích tương tự như đối với biến xu hướng sinh lời. Kết quả
ước lượng trong bảng 4.1 được trình bày ở phần trước cho thấy rằng hệ số ước lượng
của biến quy mô có sự đổi dấu khi thêm hai biến còn lại vào mô hình. Ta dễ dàng
nhận thấy rằng sự lấn át của biến tỷ số B/M trong việc giải thích cho tỷ suất sinh lợi
là nguyên nhân chính dẫn đến sự đổi dấu này. Cả mức độ pha loãng hệ số ước lượng
và hệ số pha loãng biến đều có ý nghĩa thống kê 1% với giá trị thống kê t khá lớn (lớn
hơn 5).
Phần nghiên cứu trên đây vừa trình bày kết quả tính toán mức độ chênh lệch tỷ
suất sinh lợi (return gap) trong phương trình hồi quy ba biến khi xem xét trên cả 5
nhóm danh mục phân vị theo hai cách thu được kết quả tương đương nhau. Các kết
quả này cũng tương tự như khi xem xét trong phương trình hai biến, trong đó tỷ số
b/m được ghi nhận đóng vai trò then chốt trong việc tạo ra tỷ suất sinh lợi tăng thêm.
Tóm lại, thông qua bảy bước nghiên cứu vừa trình bày, tôi đã trả lời được hai
vấn đề sau. Thứ nhất là đóng góp của biến mới trong việc dự đoán mức tỷ suất sinh
lợi. Thứ hai là vì sao khi đưa các biến có ảnh hưởng đến tỷ suất sinh lợi bình quân
vào phương trình hồi quy lại không làm gia tăng mức độ phân tán tỷ suất sinh lợi bình
quân. Nguyên nhân chính nằm ở sự tồn tại của hai tác động pha loãng hệ số ước lượng
của biến độc lập và tác động pha loãng biến độc lập. Mặc dù biến mới đưa thêm vào
54
mô hình đã tạo nên phần giá trị tăng thêm nhưng hai tác động pha loãng biến này đã
làm giảm đi mức chênh lệch tỷ suất sinh lợi bình quân của cả danh mục. Tất cả bảy
bước trên đều nghiên cứu dựa trên ý tưởng tạo ra danh mục ngũ phân vị bằng nhau.
Tuy nhiên, thực tế tồn tại vấn đề mà các nhà đầu tư quan tâm chính là ý nghĩa
thực tế của việc đưa thêm biến mới vào để dự đoán tỷ suất sinh lợi kỳ vọng. Phần
nghiên cứu tiếp theo sẽ sử dụng phương pháp kiểm định thống kê GRS để trả lời cho
câu hỏi này.
4.2 Kết quả nghiên cứu dựa trên phương pháp kiểm định GRS
Phương pháp kiểm định thống kê GRS xuất hiện trong nghiên cứu của Gibbon,
Ross and Shanken (1989) được sử dụng khá phổ biến trên thế giới để kiểm định: liệu
một mô hình định giá tài sản có giải thích tốt cho tỷ suất sinh lợi cổ phiếu. Giả thuyết
kiểm định được hầu hết các mô hình định giá tài sản thực hiện là liệu hệ số chặn trong
mô hình hồi quy tỷ suất sinh lợi vượt trội lên các nhân tố tỷ suất sinh lợi danh mục
có bằng 0 hay không.
Ý tưởng trong bài nghiên cứu của Gibbon, Ross and Shanken (1989) chỉ ra rằng
giả thiết này có thể được kiểm định thông qua việc trả lời câu hỏi liệu hệ số Sharpe
tối đa mà một nhà đầu tư có thể thiết lập chỉ dựa vào các danh mục bên vế phải của
phương trình hồi quy có thấp hơn đáng kể so với hệ số Sharpe tối đa mà một nhà đầu
tư thiết lập dựa vào cả các danh mục vế trái và danh mục vế phải. Nói cách khác,
danh mục tiếp điểm hiệu quả trung bình - phương sai (mean-variance efficient
tangency portfolio) được tạo ra bởi các danh mục bên vế phải có sinh ra danh mục
tiếp điểm hiệu quả trung bình - phương sai được xây dựng sử dụng cả danh mục vế
trái lẫn danh mục vế phải. Đó là phương pháp kiểm định GRS truyền thống.
Trong bài nghiên cứu này, tôi cũng sử dụng chỉ số thống kê GRS và hệ số Sharpe
tối ưu điều chỉnh để kiểm định xem liệu việc thêm vào một biến mới được biết là có
liên quan tới tỷ suất sinh lợi bình quân có làm tăng các cơ hội đầu tư được tạo ra từ
các biến liên quan đến tỷ suất sinh lợi bình quân đã biết trước đó không. Và theo bài
55
nghiên cứu của Fama and French (2015), nhóm tác giả đã tiến hành kiểm định dựa
trên phương trình hồi quy hai biến. Sau đó, tác giả tiến hành đưa thêm một biến mới
vào phương trình để kiểm định xem liệu việc thêm biến có làm gia tăng mức độ chênh
lệch tỷ suất sinh lợi kỳ vọng bình quân. Tuy nhiên, do bài nghiên cứu này được thực
hiện dựa trên ý tưởng xây dựng danh mục nhóm năm phân vị bằng nhau, khác với
nghiên cứu gốc của Gibbon, Ross and Shanken (1989) nên phần tiếp theo tôi sẽ đề
cập chi tiết phương pháp GRS cho nhóm danh mục ngũ phân vị.
Hình 4.6 Minh họa phương pháp kiểm định thống kê GRS
Giả định rằng: tôi đang xem xét trường hợp thêm biến khuynh hướng sinh lời
vào phương trình hồi quy hai biến gồm biến tỷ số b/m và biến quy mô (phương trình
4). Thứ nhất, mỗi tháng tôi sẽ tiến hành tính toán giá trị ước lượng tỷ suất sinh lợi
bình quân và sắp xếp theo thứ tự từ lớn nhất đến nhỏ nhất đối với phương trình hồi
quy hai biến. Khi đó, nhóm mang giá trị ước lượng tỷ suất sinh lợi bình quân cao nhất
sẽ được ký hiệu là nhóm 1 và nhóm mang giá trị ước lượng tỷ suất sinh lợi bình quân
thấp nhất sẽ được ký hiệu là nhóm 5 và có số lượng các cổ phiếu bằng nhau. Sau 94
tháng, tôi sẽ thu được 94 nhóm danh mục ngũ phân vị trong phương trình hai biến.
Thực hiện tương tự, tôi cũng sẽ thu được 94 nhóm danh mục ngũ phân vị trong
56
phương trình gồm cả ba biến quy mô, tỷ số b/m và khuynh hướng sinh lợi. Một điểm
cần nhấn mạnh rằng: các giá trị tính toán mức chênh lệch tỷ suất sinh lợi kỳ vọng ước
tính từ hai phương trình hồi quy là hoàn toàn khác nhau nên khả năng bị trùng dữ liệu
hoàn toàn có thể loại trừ.
Thứ hai, đối với phương trình hồi quy hai biến gồm biến quy mô và biến size
(phương trình 4), tôi tiến hành gộp các danh mục phân vị 1 lại thành nhóm. Như vậy,
sau 94 tháng, tôi sẽ thu được một nhóm gồm 94 phân vị 1. Đây chính là 94 giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1 qua 94 tháng (kí hiệu 𝑌̂1,4,𝑡 – được
hiểu là phân vị 1 của phương trình 4 theo kỳ t).
Với cách làm tương tự khi áp dụng cho phương trình trình hồi quy gồm cả ba
biến (phương trình 7), tôi sẽ thu được 94 giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1 qua 94 tháng (kí hiệu 𝑌̂1,7,𝑡 – được hiểu là phân vị 1 của phương
trình 7 theo kỳ t).
Thứ ba, xây dựng phương trình hồi quy để thực hiện kiểm định GRS. Tôi sẽ tiến
hành hồi quy giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1 trong
phương trình 7 theo giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1
trong phương trình 4.
𝒀̂𝟏,𝟕,𝒕 = 𝜷. 𝒀̂𝟏,𝟒,𝒕 + 𝜶𝟏 + 𝜺𝟏
Khi đó, 𝛼1 là hệ số chặn, 𝛽 là hệ số góc, 𝜀1 là phần dư của phương trình. Cũng
theo các bước tiến hành như trên, tôi tiến hành tiến toán các giá trị ước lượng tỷ suất
sinh lợi cho 4 nhóm phân vị còn lại và thu được thêm 4 phương trình kiểm định GRS
như sau:
𝒀̂𝟐,𝟕,𝒕 = 𝜷. 𝒀̂𝟐,𝟒,𝒕 + 𝜶𝟐 + 𝜺𝟐
𝒀̂𝟑,𝟕,𝒕 = 𝜷. 𝒀̂𝟑,𝟒,𝒕 + 𝜶𝟑 + 𝜺𝟑
𝒀̂𝟒,𝟕,𝒕 = 𝜷. 𝒀̂𝟒,𝟒,𝒕 + 𝜶𝟒 + 𝜺𝟒
𝒀̂𝟓,𝟕,𝒕 = 𝜷. 𝒀̂𝟓,𝟒,𝒕 + 𝜶𝟓 + 𝜺𝟓
57
Đến đây, tôi sẽ tiến hành thực hiện kiểm định thống kê GRS với giả định là
𝜶𝟏 = 𝜶𝟐 = 𝜶𝟑 = 𝜶𝟒 = 𝜶𝟓 = 𝟎. Nếu như kết quả kiểm định thu được là bác bỏ giả
thuyết thống kê, nghĩa là tồn tại giá trị 𝛼𝑖 > 0 thì nghĩa là việc thêm biến mới làm gia
tăng tỷ suất sinh lợi kỳ vọng mà nhà đầu tư mong muốn. Đây có thể xem là một công
cụ để nhà đầu tư có thể ra quyết định xây dựng danh mục cổ phiếu của mình.
Phần trên là toàn bộ quy trình xây dựng phương trình kiểm định thống kê GRS
đối với trường hợp thêm biến khuynh hướng sinh lời vào phương trình hồi quy hai
biến gồm biến tỷ số b/m và biến quy mô (phương trình 4). Và cách làm hoàn toàn
tương tự đối với trường hợp thêm biến tỷ số b/m vào phương trình hồi quy hai biến
gồm biến khuynh hướng sinh lời và biến quy mô (phương trình 5), cũng như trường
hợp thêm biến quy mô vào phương trình hồi quy hai biến gồm biến khuynh hướng
sinh lời và biến tỷ số b/m (phương trình 6). Phần công thức và phương pháp tính toán
giá trị thống kê GRS sẽ được trình bày theo công thức trong “Phụ Lục 2. Tính giá
trị thống kê GRS”.
Bảng 4.8 Kiểm định GRS
Mô hình GRS statistic p-value
size + bm 951 0.00
size + prior 45.3 0.00
bm + prior 523 0.00
Kết quả kiểm định theo phương pháp GRS trình bày trong bảng 4.8 cho thấy
rằng việc thêm bất kỳ biến nào vào mô hình đã gồm hai biến còn lại đều cải thiện hệ
số Sharpe của danh mục hiệu quả. Giá trị p-value cho kiểm định GRS ở cả ba mô
hình đều xấp xỉ bằng 0, nghĩa là ta sẽ bác giả thuyết thống kê hay nói cách khác là
tồn tại giá trị 𝛼𝑖 > 0.
Việc hệ số thống kê GRS tương đối lớn trong các mô hình cho thấy rằng khi
thêm một biến bất kỳ vào mô hình hai biến còn lại thì mức độ biến động trong phần
dư của mô hình 3 biến là nhỏ hơn rất nhiều lần so với mức độ biến động của tỷ suất
58
sinh lợi vượt trội trong mô hình 2 biến. Lý giải này hoàn toàn hợp lý khi khẳng định
rằng việc đưa thêm biến mới vào mô hình giúp cải thiện đáng kể danh mục biên. Tóm
lại, việc thực hiện kiểm định thống kê GRS đã đưa đến kết luận rằng, các phương
trình hồi quy hai biến (phương trình 4, 5, 6) khi thêm biến mới vào đều làm gia tăng
tỷ suất sinh lợi kỳ vọng bình quân. Tuy nhiên, không phải tất cả trường hợp đều làm
tăng mạnh giá trị độ phân tán. Vì gia tăng tỷ suất sinh lợi luôn đi kèm với tác động
pha loãng kép đã được trình bày trong quy trình bảy bước của bài nghiên cứu này.
59
Chương 5. KẾT LUẬN
5.1 Kết luận chung từ kết quả nghiên cứu
Có rất nhiều nghiên cứu trước đây về mô hình định giá tài nhằm tìm kiếm các
biến mới có thể giải thích tốt hơn cho tỷ suất sinh lợi kỳ vọng bình quân. Tuy nhiên,
chưa có nhiều nghiên cứu giải thích được nguyên nhân vì sao khi đưa tất cả các biến
độc lập có tác động đến tỷ suất sinh lợi vào phương trình hồi quy lại chỉ làm gia tăng
lượng nhỏ độ phân tán. Thông qua việc dựa trên nghiên cứu chính của nhóm tác giả
Fama and French (2015), bài nghiên cứu này đã trả lời được câu hỏi này.
Thứ nhất, các biến mới đưa vào mô hình có thể tương quan dương với các biến
sẵn có, điều này dẫn đến sự pha loãng hệ số ước lượng. Thứ hai, sự tồn tại đồng thời
hai tác động pha loãng hệ số ước lượng của biến độc lập và tác động pha loãng biến
độc lập. việc đưa một biến mới có mức độ giải thích cao vào mô hình sẽ pha loãng
giá trị của các biến sẵn có trong các danh mục cực trị (nhóm danh mục phân vị cao
nhất và thấp nhất). Sự pha loãng biến này khiến đóng góp tăng thêm của biến mới
đưa vào nhỏ đi. Cho nên, các biến mới đưa thêm vào mô hình dù tạo ra phần giá trị
tăng thêm nhưng hai tác động pha loãng này đã làm giảm đi mức chênh lệch tỷ suất
sinh lợi bình quân của cả danh mục.
Đồng thời, thông qua việc xây dựng nhóm danh mục ngũ phân vị, bài nghiên
cứu đã thiết lập được phương thức tính toán giá trị độ phân tán của tỳ suất sinh lợi kỳ
vọng bình quân nhưng đồng thời cũng chứng minh được tồn tại chỉ số đánh giá chất
lượng biến giải thích tốt hơn. Đó là mức đóng góp tăng thêm của biến mới vào độ
phân tán tỷ suất sinh lợi so với những biến đã được sử dụng trong mô hình trước đó
thông qua phương pháp kiểm định GRS. Điều này giúp cho nhà đầu tư có thể biết
được liệu việc thêm biến mới vào hồi quy có làm tăng giá trị tỷ suất sinh lợi mong
muốn cũng như tính toán được mức gia tăng cụ thể.
Bên cạnh đó, bài nghiên cứu cũng đã chứng minh được khi tiến hành hồi quy tỷ
suất sinh lợi cổ phiếu với ba biến quy mô, tỷ số b/m và khuynh hướng sinh lời thì
60
biến tỷ số b/m có tác động gia tăng mạnh nhất. Tất cả các mô hình hồi quy chứa biến
tỷ số b/m đều mang lại mức giải thích cho tỷ suất sinh lợi cao hơn nhiều so với hai
biến còn lại. Dựa trên kết quả này, tôi có thể đưa ra đề xuất xây dựng danh mục cổ
phiếu cho các nhà đầu tư như sau. Nếu giá trị độ phân tán tỷ suất sinh lợi là dương,
nhà đầu tư sẽ chọn các cổ phiếu trong nhóm phân vị cao nhất để xem xét lựa chọn.
Và thứ tự lựa chọn ưu tiên sẽ là theo biến tỷ số b/m, biến quy mô và cuối cùng là biến
khuynh hướng sinh lợi. Giả sử như trong nhóm phân vị cao nhất, nhà đầu tư sẽ chọn
ra các cổ phiếu có tỷ số b/m cao nhất trước. Sau đó, trong các cổ phiếu này sẽ chọn
ra các cổ phiếu có quy mô nhỏ để đầu tư vì các nghiên cứu trước của Fama and French
(2006) đã chứng minh được rằng cổ phiếu có tỷ số b/m càng cao, quy mô càng thấp
thì khả năng đạt được mức tỷ suất sinh lợi kỳ vọng mong muốn là cao hơn. Điểm ưu
việt trong cách đầu tư này chính là việc giới hạn số lượng các công ty được lọc thông
qua danh mục phân vị cực trị.
5.2 Hạn chế nghiên cứu
Bài nghiên cứu chưa tiến hành khảo sát đối với các yếu tố còn lại có tác động
đến tỷ suất sinh lợi đã được chứng minh qua mô hình năm nhân tố trong nghiên cứu
của Fama and French (2013) nên chưa thể có nhận định xác đáng nhất về giá trị độ
phân tán tỷ suất sinh lợi tạo ra và độ mạnh của các biến độc lập trong việc tạo ra giá
trị tăng thêm khi đưa thêm biến đó vào mô hình hồi quy.
DANH MỤC TÀI LIỆU THAM KHẢO
Davis, James L., Eugene F. Fama, and Kenneth R. French. "Characteristics,
covariances, and average returns: 1929 to 1997." The Journal of Finance 55.1 (2000):
389-406.
Fama, Eugene F., and James D. MacBeth. "Risk, return, and equilibrium:
Empirical tests." Journal of political economy 81.3 (1973): 607-636.
Fama, Eugene F., and Kenneth R. French. "Common risk factors in the returns
on stocks and bonds." Journal of financial economics 33.1 (1993): 3-56.
Fama, Eugene F., and Kenneth R. French. "Dissecting anomalies with a five-
factor model." Review of Financial Studies 29.1 (2016): 69-103.
Fama, Eugene F., and Kenneth R. French. "Incremental variables and the
investment opportunity set." Journal of Financial Economics 117.3 (2015): 470-488.
Fama, Eugene F., and Kenneth R. French. "Multifactor explanations of asset
pricing anomalies." The journal of finance 51.1 (1996): 55-84.
Fama, Eugene F., and Kenneth R. French. "Profitability, investment and
average returns." Journal of Financial Economics 82.3 (2006): 491-518.
Fama, Eugene F., and Kenneth R. French. "The cross‐section of expected
stock returns." the Journal of Finance 47.2 (1992): 427-465.
Fama, Eugene F., and Kenneth R. French. "The cross‐section of expected
stock returns." the Journal of Finance 47.2 (1992): 427-465.
Gibbons, Michael R., Stephen A. Ross, and Jay Shanken. "A test of the
efficiency of a given portfolio." Econometrica: Journal of the Econometric
Society (1989): 1121-1152.
Jegadeesh, Narasimhan. "Evidence of predictable behavior of security
returns." The Journal of Finance 45.3 (1990): 881-898.
Jensen, Michael C., Fischer Black, and Myron S. Scholes. "The capital asset
pricing model: Some empirical tests." (1972).
Jonathan Lewellen. "Institutional investors and the limits of arbitrage." The
Journal of Financial Economics 102 (2011) 62–80.
PHỤ LỤC
Phụ lục 1. Thao tác tính toán trên Stata
Phụ lục 2. Tính giá trị thống kê GRS
Phụ lục 1. Thao tác tính toán trên Stata
1. Bước 1: Hồi quy biến tỷ suất sinh lợi với các biến giải thích
- Nhập dữ liệu excel vào stata.
- Chạy do-file “format from excel”
encode stock,gen(nfirm)
drop date
gen date=ym(year,month)
format date %tm
xtset nfirm date
- Chạy do-file “table4.1.1”
*gen variable as coefficient:
*reg return size
*gen beta=_b[size]
* set up panel data
xtset nfirm date,monthly
*run fama-macbeth for each of 3 variables
xtfmb return size
gen bsize1=_b[size]
outreg using table1fmb,ctitles("",(1)) starlevels(10,5,1) replace
xtfmb return bmratio
gen bbm2=_b[bmratio]
outreg using table1fmb,ctitles("",(2)) starlevels(10,5,1) merge
xtfmb return prior
gen bprior3=_b[prior]
outreg using table1fmb,ctitles("",(3)) starlevels(10,5,1) merge
* fama-macbeth for 2 of 3 variables
xtfmb return size bmratio
gen bsize4=_b[size]
gen bbm4=_b[bmratio]
outreg using table1fmb,ctitles("",(4)) starlevels(10,5,1) merge
xtfmb return size prior
gen bsize5=_b[size]
gen bprior5=_b[prior]
outreg using table1fmb,ctitles("",(5)) starlevels(10,5,1) merge
xtfmb return bmratio prior
gen bbm6=_b[bmratio]
gen bprior6=_b[prior]
outreg using table1fmb,ctitles("",(6)) starlevels(10,5,1) merge
*fama-macbeth for all 3 variables
xtfmb return size bmratio prior
gen bsize7=_b[size]
gen bbm7=_b[bmratio]
gen bprior7=_b[prior]
outreg using table1fmb,ctitles("",(7)) starlevels(10,5,1) merge
- Xuất dữ liệu ra Bảng 4.1 Kết quả ước lượng mô hình, lưu file là
“table4.1.1result”.
2. Bước 2: Đo lường mức độ phân tán tỷ suất sinh lợi
- Dựa trên file dataset “table4.1.1result”, tiếp tục chạy do-file “table4.1.2”
*gen spread_1
xtset nfirm date
xtfmb return size
predict rhat1
egen quintile1=xtile(rhat1),by(date) nq(5)
bysort date quintile1:egen ew1=mean(rhat1)
gen mquintile1=-quintile1
sort date quintile1
bysort date:gen min1=ew1[1]
sort date mquintile1
bysort date:gen max1=ew1[1]
gen spread1=max1-min1
*gen spread_2
xtset nfirm date
xtfmb return bmratio
predict rhat2
egen quintile2=xtile(rhat2),by(date) nq(5)
bysort date quintile2:egen ew2=mean(rhat2)
gen mquintile2=-quintile2
sort date quintile2
bysort date:gen min2=ew2[1]
sort date mquintile2
bysort date:gen max2=ew2[1]
gen spread2=max2-min2
*gen spread_3
xtset nfirm date
xtfmb return prior
predict rhat3
egen quintile3=xtile(rhat3),by(date) nq(5)
bysort date quintile3:egen ew3=mean(rhat3)
gen mquintile3=-quintile3
sort date quintile1
bysort date:gen min3=ew3[1]
sort date mquintile3
bysort date:gen max3=ew3[1]
gen spread3=max3-min3
*gen spread_4
xtset nfirm date
xtfmb return size bmratio
predict rhat4
egen quintile4=xtile(rhat4),by(date) nq(5)
bysort date quintile4:egen ew4=mean(rhat4)
gen mquintile4=-quintile4
sort date quintile4
bysort date:gen min4=ew4[1]
sort date mquintile4
bysort date:gen max4=ew4[1]
gen spread4=max4-min4
*gen spread_5
xtset nfirm date
xtfmb return size prior
predict rhat5
egen quintile5=xtile(rhat5),by(date) nq(5)
bysort date quintile5:egen ew5=mean(rhat5)
gen mquintile5=-quintile5
sort date quintile5
bysort date:gen min5=ew5[1]
sort date mquintile5
bysort date:gen max5=ew5[1]
gen spread5=max5-min5
*gen spread_6
xtset nfirm date
xtfmb return bmratio prior
predict rhat6
egen quintile6=xtile(rhat6),by(date) nq(5)
bysort date quintile6:egen ew6=mean(rhat6)
gen mquintile6=-quintile6
sort date quintile6
bysort date:gen min6=ew6[1]
sort date mquintile6
bysort date:gen max6=ew6[1]
gen spread6=max6-min6
*gen spread_7
xtset nfirm date
xtfmb return size bmratio prior
predict rhat7
egen quintile7=xtile(rhat7),by(date) nq(5)
bysort date quintile7:egen ew7=mean(rhat7)
gen mquintile7=-quintile7
sort date quintile7
bysort date:gen min7=ew7[1]
sort date mquintile7
bysort date:gen max7=ew7[1]
gen spread7=max7-min7
- Lưu file là “table4.1.2result”
- Thực hiện câu lệnh xuất dữ liệu của spread trong 7 mô hình
edit date spread1 spread2 spread3 spread4 spread5 spread6 spread7
- Thực hiện tính toán giá trị
▪ Trung bình: hàm AVERAGE
▪ Độ lệch chuẩn: hàm STDEV.S
▪ Thống kê t = (Trung bình)/(Độ lệch chuẩn)
- Lưu sheet là “spreads 7 models”
3. Bước 3: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình
quân trong mô hình hai biến (I2/R’)
3.1. Theo chênh lệch độ phân tán tỷ suất sinh lợi bình quân giữa mô hình
đơn biến và mô hình hai biến
- Tính toán mức I2/R’ trong 6 trường hợp. Dữ liệu tính toán được lấy từ
spread1,2,3,4,5,6,7 trong sheet “spreads 7 models”.
- Tính trung bình, độ lệch chuẩn, thống kê t.
3.2. Theo hệ số tương quan
3.2.1. Tính toán hệ số tương quan giữa các biến độc lập
- Dựa trên file dataset “table4.1.2”, tiến hành xác định hệ số tương quan giữa 3
cặp biến sau: (size;bm) , (size;prior) , (bm;prior) theo do-file “correlation”
*gen correlation
bysort date:egen csizebm=corr(size bmratio)
bysort date:egen csizeprior=corr(size prior)
bysort date:egen cbmprior=corr(bmratio prior)
egen mcsizebm=mean(csizebm)
egen mcsizeprior=mean(csizeprior)
egen mcbmprior=mean(cbmprior)
- Xem kết quả tính toán qua lệnh:
edit date mcsizebm mcsizeprior mcbmprior
3.2.2. Tính toán giá trị đóng góp tăng thêm
- Tiến hành chạy do-file “B3.2-table4_1_3-incremental by correlation”
* size spread in column1
xtset nfirm date
bysort date quintile1:egen msize1=mean(size)
sort date quintile1
bysort date:gen minsize1= msize1[1]
sort date mquintile1
bysort date:gen maxsize1= msize1[1]
gen spreadsize1= maxsize1- minsize1
*gen bm spread in column2
bysort date quintile2:egen mbmratio2=mean(bmratio)
sort date quintile2
bysort date:gen minbm2= mbmratio2[1]
sort date mquintile2
bysort date:gen maxbm2= mbmratio2[1]
gen spreadbm2= maxbm2- minbm2
*gen prior spread in column3
bysort date quintile3:egen mprior3=mean(prior)
sort date quintile3
bysort date:gen minprior3= mprior3[1]
sort date mquintile3
bysort date:gen maxprior3= mprior3[1]
gen spreadprior3= maxprior3- minprior3
*gen size bm spread in column4
bysort date quintile4:egen msize4=mean(size)
bysort date quintile4:egen mbm4=mean(bmratio)
sort date quintile4
bysort date:gen minsize4= msize4[1]
bysort date:gen minbm4= mbm4[1]
sort date mquintile4
bysort date:gen maxsize4= msize4[1]
bysort date:gen maxbm4= mbm4[1]
gen spreadsize4= maxsize4- minsize4
gen spreadbm4= maxbm4- minbm4
*gen size bm spread in column5
bysort date quintile5:egen msize5=mean(size)
bysort date quintile5:egen mprior5=mean(prior)
sort date quintile5
bysort date:gen minsize5= msize5[1]
bysort date:gen minprior5= mprior5[1]
sort date mquintile5
bysort date:gen maxsize5= msize5[1]
bysort date:gen maxprior5= mprior5[1]
gen spreadsize5= maxsize5- minsize5
gen spreadprior5= maxprior5- minprior5
*gen size bm spread in column6
bysort date quintile6:egen mbm6=mean(bmratio)
bysort date quintile6:egen mprior6=mean(prior)
sort date quintile6
bysort date:gen minbm6= mbm6[1]
bysort date:gen minprior6= mprior6[1]
sort date mquintile6
bysort date:gen maxbm6= mbm6[1]
bysort date:gen maxprior6= mprior6[1]
gen spreadbm6= maxbm6- minbm6
gen spreadprior6= maxprior6- minprior6
*gen size bm spread in column7
bysort date quintile7:egen msize7=mean(size)
bysort date quintile7:egen mbm7=mean(bmratio)
bysort date quintile7:egen mprior7=mean(prior)
sort date quintile7
bysort date:gen minsize7= msize7[1]
bysort date:gen minbm7= mbm7[1]
bysort date:gen minprior7= mprior7[1]
sort date mquintile7
bysort date:gen maxsize7= msize7[1]
bysort date:gen maxbm7= mbm7[1]
bysort date:gen maxprior7= mprior7[1]
gen spreadsize7= maxsize7- minsize7
gen spreadbm7= maxbm7- minbm7
gen spreadprior7= maxprior7- minprior7
*gen incremental using correlation
gen spread14corr=(bsize4+csizebm*bbm4)*spreadsize1
gen ibm4corr=1-spread14corr/spread4
gen spread24corr=(bbm4+bsize4*csizebm)*spreadbm2
gen isize4corr=1-spread24corr/spread4
gen spread15corr=(bsize5+bprior5*csizeprior)*spreadsize1
gen iprior5corr=1-spread15corr/spread5
gen spread35corr=(bprior5+bsize5*csizeprior)*spreadprior3
gen isize5corr=1-spread35corr/spread5
gen spread26corr=(bbm6+bprior6*cbmprior)*spreadbm2
gen iprior6corr=1-spread26corr/spread6
gen spread36corr=(bprior6+bbm6*cbmprior)*spreadprior3
gen ibm6corr=1-spread36corr/spread6
*gen incremental using corr=0
gen csizebm0=0
gen csizeprior0=0
gen cbmprior0=0
gen spread14corr0=(bsize4+csizebm0*bbm4)*spreadsize1
gen ibm4corr0=1-spread14corr0/spread4
gen spread24corr0=(bbm4+bsize4*csizebm0)*spreadbm2
gen isize4corr0=1-spread24corr0/spread4
gen spread15corr0=(bsize5+bprior5*csizeprior0)*spreadsize1
gen iprior5corr0=1-spread15corr0/spread5
gen spread35corr0=(bprior5+bsize5*csizeprior0)*spreadprior3
gen isize5corr0=1-spread35corr0/spread5
gen spread26corr0=(bbm6+bprior6*cbmprior0)*spreadbm2
gen iprior6corr0=1-spread26corr0/spread6
gen spread36corr0=(bprior6+bbm6*cbmprior0)*spreadprior3
gen ibm6corr0=1-spread36corr0/spread6
- Chiết xuất dữ liệu tính toán phần đóng góp của biến mới khi áp dụng hệ số
tương quan giữa từng cặp biến đã được tính trước đó theo lệnh:
edit date ibm4corr isize4corr iprior5corr isize5corr iprior6corr ibm6corr
- Chiết xuất dữ liệu tính toán phần đóng góp của biến mới khi giả định hệ số
tương quan giữa từng cặp biến bằng 0 theo lệnh:
edit date ibm4corr0 isize4corr0 iprior5corr0 isize5corr0 iprior6corr0 ibm6corr0
- Tiếp theo, xác định mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình
quân đối với mô hình hai biến dựa trên hệ số tương quan mẫu và hệ số tương
quan được giả định bằng 0.
▪ Tính toán mức độ đóng góp của biến mới trong 6 trường hợp.
▪ Tính trung bình, độ lệch chuẩn, thống kê t.
4. Bước 4: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình
quân trong mô hình ba biến (I2/R’).
4.1. Theo chênh lệch giữa độ phân tán tỷ suất sinh lợi bình quân giữa mô
hình 2 biến và mô hình 3 biến
- Tính toán mức độ đóng góp của biến mới trong 3 trường hợp.
- Dữ liệu tính toán dựa vào sheet “spread 7 models”
5. Bước 5: Đánh giá sự pha loãng biến
- Chiết xuất dữ liệu tính toán phần chênh lệch giá trị kỳ vọng của mỗi biến trong
7 mô hình theo lệnh:
edit date spreadsize1 spreadbm2 spreadprior3 spreadsize4 spreadbm4 spreadsize5
spreadprior5 spreadbm6 spreadprior6 spreadsize7 spreadbm7 spreadprior7
- Tính toán tỷ lệ độ phân tán của từng biến độc lập khi ước lượng riêng lẽ và khi
thêm biến mới vào mô hình.
- Tính trung bình, độ lệch chuẩn, thống kê t.
6. Bước 6: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong
trường hợp mô hình hai biến
6.1. Tính toán theo chênh lệch tỷ suất sinh lợi
- Tính toán Rerurn Gap bằng cách: spread [1+2-4], spread [1+3-5], spread [2+3-
6] theo từng tháng.
- Tính trung bình, độ lệch chuẩn, thống kê t.
6.2. Tính toán theo tác động pha loãng
- Tiến hành chạy do-file “B6-table4_1_6-return gap”
gen slopeatt4=csizebm*(bsize4*spreadbm2+bbm4*spreadsize1)
gen varatt4=bsize4*(spreadsize1-spreadsize4)+bbm4*(spreadbm2-spreadbm4)
gen slopeatt5=csizeprior*(bsize5*spreadprior3+bprior5*spreadsize1)
gen/varatt5=bsize5*(spreadsize1-spreadsize5)+bprior5*(spreadprior3- spreadprior5)
gen slopeatt6=cbmprior*(bbm6*spreadprior3+bprior6*spreadbm2)
gen varatt6=bbm6*(spreadbm2-spreadbm6)+bprior5*(spreadprior3-spreadprior6)
*gen slope of fitted value on eq7
gen bfv4=(bsize7*spreadsize7+bbm7*spreadbm7)/spread4
gen bfv5=(bsize7*spreadsize7+bprior7*spreadprior7)/spread5
gen bfv6=(bprior7*spreadprior7+bsize7*spreadsize7)/spread6
*gen correlation fv and variable by calculation
gen cfvprior=(bprior3-bprior7)/bfv4
gen cfvsize=(bsize1-bsize7)/bfv6
gen cfvbm=(bbm2-bbm7)/bfv5
*gen slope attenuations by rho
gen slopeatt7_4rho=cfvprior*(bprior7*spread4+bfv4*spreadprior3)
gen slopeatt7_5rho=cfvbm*(bbm7*spread5+bfv5*spreadbm2)
gen slopeatt7_6rho=cfvsize*(bsize7*spread6+bfv6*spreadsize1)
*gen variable attenuations by rho
gen varatt7_4rho=bprior7*(spreadprior3-spreadprior7)
gen varatt7_5rho=bbm7*(spreadbm2-spreadbm7)
gen varatt7_6rho=bsize7*(spreadsize1-spreadsize7)
- Chiết xuất dữ liệu tính toán hệ số pha loãng độ dốc và pha loãng biến trong
mô hình 2 biến theo lệnh:
edit date slopeatt4 varatt4 slopeatt5 varatt5 slopeatt6 varatt6
- Tính tổng tác động pha loãng kép trong 3 trường hợp.
- Tính trung bình, độ lệch chuẩn, thống kê t.
7. Bước 7: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong
trường hợp mô hình ba biến
- Chiết xuất dữ liệu tính toán hệ số pha loãng độ dốc và pha loãng biến trong
mô hình 3 biến theo lệnh:
edit date slopeatt7_4rho varatt7_4rho slopeatt7_5rho varatt7_5rho slopeatt7_6rho varatt7_6rho
- Tính tổng tác động pha loãng kép trong 3 trường hợp.
- Tính trung bình, độ lệch chuẩn, thống kê t.
Phụ lục 2. Tính giá trị thống kê GRS
1. Công thức tính giá trị thống kê GRS
- Dựa trên công thức chính trong bài nghiên nghiên cứu gốc của Gibbon, Ross
and Shanken (1989), tôi áp dụng vào bài nghiên cứu này như sau
với, N: số bậc phân vị
T: chuỗi thời gian
L: số biến độc lập
𝛼̂: giá trị ước lượng của ma trận hệ số chặn
𝛼̂ ′: giá trị ước lượng của ma trận chuyển vị hệ số chặn
𝛴̂: giá trị ước lượng của ma trận hiệp phương sai của phần dư
𝜇̅: giá trị trung bình của tỷ suất sinh lợi vượt trội
𝛺̂: giá trị ước lượng của ma trận hiệp phương sai của tỷ suất sinh lợi vượt trội
2. Tiến hành chạy do-file “GRS-test”
*grs test model7 vs model4
reg exreturn7 exreturn4 if quintile==1
predict res74q1 if quintile==1,residual
gen b74q1=_b[_cons]
reg exreturn7 exreturn4 if quintile==2
predict res74q2 if quintile==2,residual
gen b74q2=_b[_cons]
reg exreturn7 exreturn4 if quintile==3
predict res74q3 if quintile==3 ,residual
gen b74q3=_b[_cons]
reg exreturn7 exreturn4 if quintile==4
predict res74q4 if quintile==4,residual
gen b74q4=_b[_cons]
reg exreturn7 exreturn4 if quintile==5
predict res74q5 if quintile==5,residual
gen b74q5=_b[_cons]
*grs test model7 vs model5
reg exreturn7 exreturn5 if quintile==1
predict res75q1 if quintile==1,residual
gen b75q1=_b[_cons]
reg exreturn7 exreturn5 if quintile==2
predict res75q2 if quintile==2,residual
gen b75q2=_b[_cons]
reg exreturn7 exreturn5 if quintile==3
predict res75q3 if quintile==3,residual
gen b75q3=_b[_cons]
reg exreturn7 exreturn5 if quintile==4
predict res75q4 if quintile==4,residual
gen b75q4=_b[_cons]
reg exreturn7 exreturn5 if quintile==5
predict res75q5 if quintile==5,residual
gen b75q5=_b[_cons]
*grs test model7 vs model6
reg exreturn7 exreturn6 if quintile==1
predict res76q1 if quintile==1,residual
gen b76q1=_b[_cons]
reg exreturn7 exreturn6 if quintile==2
predict res76q2 if quintile==2,residual
gen b76q2=_b[_cons]
reg exreturn7 exreturn6 if quintile==3
predict res76q3 if quintile==3,residual
gen b76q3=_b[_cons]
reg exreturn7 exreturn6 if quintile==4
predict res76q4 if quintile==4,residual
gen b76q4=_b[_cons]
reg exreturn7 exreturn6 if quintile==5
predict res76q5 if quintile==5,residual
gen b76q5=_b[_cons]