BỘ GIÁO DỤC ĐÀO TẠO

TRƯỜNG ĐẠI HỌC KINH TẾ TP. HỒ CHÍ MINH

TRẦN HÙNG CƯỜNG

TÁC ĐỘNG CỦA BIẾN MỚI ĐƯA THÊM VÀO

MÔ HÌNH ĐẾN CẤU TRÚC DANH MỤC CỔ PHIẾU

NGHIÊN CỨU THỰC NGHIỆM CHO

THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM

LUẬN VĂN THẠC SĨ KINH TẾ

THÀNH PHỐ HỒ CHÍ MINH - 2017

BỘ GIÁO DỤC ĐÀO TẠO

TRƯỜNG ĐẠI HỌC KINH TẾ TP. HỒ CHÍ MINH

TRẦN HÙNG CƯỜNG

TÁC ĐỘNG CỦA BIẾN MỚI ĐƯA THÊM VÀO

MÔ HÌNH ĐẾN CẤU TRÚC DANH MỤC CỔ PHIẾU

NGHIÊN CỨU THỰC NGHIỆM CHO

THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM

Chuyên ngành: Tài chính - Ngân hàng

Mã ngành: 60340201

LUẬN VĂN THẠC SĨ KINH TẾ

NGƯỜI HƯỚNG DẪN KHOA HỌC

PGS.TS. NGUYỄN VĂN SĨ

THÀNH PHỐ HỒ CHÍ MINH - 2017

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu và kết quả

nghiên cứu trong luận văn này là trung thực và không trùng lặp với các đề tài khác.

Học viên thực hiện

Trần Hùng Cường

MỤC LỤC

Trang

TRANG PHỤ BÌA

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC CÁC TỪ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC HÌNH VẼ, ĐỒ THỊ

Chương 1. GIỚI THIỆU ........................................................................................ 1

1.1 Lý do thực hiện đề tài .................................................................................. 1

1.2 Mục tiêu nghiên cứu .................................................................................... 1

1.3 Câu hỏi nghiên cứu ...................................................................................... 1

1.4 Đối tượng nghiên cứu .................................................................................. 2

1.5 Phạm vi nghiên cứu ..................................................................................... 2

1.6 Phương pháp nghiên cứu ............................................................................ 2

1.7 Ý nghĩa của đề tài ......................................................................................... 3

1.8 Kết cấu của luận văn .................................................................................... 3

1.9 Tóm tắt luận văn .......................................................................................... 3

Chương 2. TỔNG QUAN CÁC NGHIÊN CỨU TRƯỚC ĐÂY ....................... 5

2.1 Nghiên cứu Fama and Macbeth (1973) ...................................................... 8

2.2 Nghiên cứu Fama and French (2006) ....................................................... 11

2.3 Nghiên cứu Lewellen (2011) ...................................................................... 15

2.4 Nghiên cứu Fama and French (2015) ....................................................... 17

Chương 3. PHƯƠNG PHÁP - DỮ LIỆU NGHIÊN CỨU ................................ 24

3.1 Mô hình thực nghiệm ................................................................................. 24

3.1.1 Xác định tỷ suất sinh lợi ước tính theo phương pháp Fama - Macbeth

24

3.1.2 Xác định tỷ suất sinh lợi danh mục theo ngũ phân vị ............................ 25

3.2 Dữ liệu nghiên cứu ..................................................................................... 26

Chương 4. KẾT QUẢ NGHIÊN CỨU ............................................................... 29

4.1 Kết quả nghiên cứu dựa trên mức độ phân tán tỷ suất sinh lợi ............ 29

4.2 Kết quả nghiên cứu dựa trên phương pháp kiểm định GRS ................. 54

Chương 5. KẾT LUẬN ........................................................................................ 59

5.1 Kết luận chung từ kết quả nghiên cứu ..................................................... 59

5.2 Hạn chế nghiên cứu ................................................................................... 60

DANH MỤC TÀI LIỆU THAM KHẢO

PHỤ LỤC

DANH MỤC CÁC TỪ VIẾT TẮT

Từ viết tắt Ý nghĩa

B/M Tỷ số giá trị sổ sách chia cho giá trị thị trường

DANH MỤC CÁC BẢNG

Bảng 3.1 Thống kê mô tả dữ liệu nghiên cứu .......................................................... 26

Bảng 4.1 Kết quả ước lượng mô hình ..................................................................... 29

Bảng 4.2 Giá trị trung bình và thống kê t của mức độ phân tán tỷ suất sinh lợi ..... 31

Bảng 4.3 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân trong mô

hình hai biến ............................................................................................ 34

Bảng 4.4 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân trong mô

hình ba biến .............................................................................................. 40

Bảng 4.5 Tỷ lệ pha loãng biến ................................................................................. 43

Bảng 4.6 Kết quả ước tính chênh lệch tỷ suất sinh lợi trong mô hình hai biến ...... 48

Bảng 4.7 Kết quả ước tính chênh lệch tỷ suất sinh lợi trong mô hình ba biến ........ 51

Bảng 4.8 Kiểm định GRS......................................................................................... 57

DANH MỤC HÌNH VẼ, ĐỒ THỊ

Hình 3.1 Đồ thị tỷ suất sinh lợi bình quân của các công ty trên sàn Hose giai đoạn

01/2009 - 10/2016 theo tháng ................................................................ 27

Hình 3.2 Đồ thị quy mô bình quân của các công ty trên sàn Hose giai đoạn 01/2009

- 10/2016 theo tháng .............................................................................. 27

Hình 3.3 Đồ thị tỷ số B/M bình quân của các công ty trên sàn Hose giai đoạn

01/2009 - 10/2016 theo tháng ................................................................ 28

Hình 3.4 Đồ thị khuynh hướng sinh lời bình quân của các công ty trên sàn Hose

giai đoạn 01/2009 - 10/2016 theo tháng ................................................ 28

Hình 4.1 Đồ thị mức độ phân tán tỷ suất sinh lợi của 7 mô hình giai đoạn 01/2009

- 10/2016 ................................................................................................ 32

Hình 4.2 Tác động khuyếch đại và pha loãng của biến độc lập ............................. 41

Hình 4.3 Mức độ chênh lệch biến quy mô trong các mô hình ............................... 44

Hình 4.4 Mức độ chênh lệch biến khuynh hướng sinh lời trong các mô hình ....... 44

Hình 4.5 Mức độ chênh lệch biến tỷ số B/M trong các mô hình ........................... 46

Hình 4.6 Minh họa phương pháp kiểm định thống kê GRS .................................. 55

1

Chương 1. GIỚI THIỆU

1.1 Lý do thực hiện đề tài

Các nghiên cứu trước đây xây dựng nhiều mô hình định giá tài sản để xác định

mối quan hệ giữa tỷ suất sinh lợi bình quân và các yếu tố đặc trưng của công ty như:

quy mô (size), tỷ số giá thị trường trên giá sổ sách (B/M), chỉ số xu hướng

(momentum). Các nghiên cứu này thường dựa vào giá trị thống kê t (t-statistic) trong

phương pháp hồi quy của Fama - Macbeth (1973) để phán xét ý nghĩa tác động của

các biến giải thích trong mô hình. Tuy nhiên, ý nghĩa của một biến giải thích còn thể

hiện qua đóng góp của nó trong việc gia tăng mức độ phân tán tỷ suất sinh lợi bình

quân giữa các danh mục được hình thành từ việc sắp xếp giá trị ước tính của biến phụ

thuộc từ mô hình hồi quy. Nghiên cứu của tôi tập trung lý giải tác động của việc thêm

một biến mới vào mô hình hồi quy đến mức độ phân tán tỷ suất sinh lợi bình quân

các danh mục.

1.2 Mục tiêu nghiên cứu

Bài nghiên cứu này của tôi được thực hiện nhằm mục tiêu sau:

- Giải thích mức độ đóng góp tăng thêm của một biến mới (có ảnh hưởng đến

tỷ suất sinh lợi) khi đưa thêm biến mới này vào mô hình sẵn có.

- Lý giải vì sao các biến độc lập có mức giải thích mạnh khi thêm vào mô hình

hồi quy lại chỉ làm tăng thêm một lượng nhỏ độ phân tán tỷ suất sinh lợi.

1.3 Câu hỏi nghiên cứu

Bài nghiên cứu này của tôi trả lời cho những câu hỏi nghiên cứu sau;

- Việc đưa thêm biến mới vào mô hình sẽ tác động thế nào đến hệ số ước lượng

đã có sẵn trong mô hình, và điều này sẽ ảnh hưởng đến mức độ phân tán tỷ

suất sinh lợi như thế nào ?

2

- Việc đưa thêm biến mới vào mô hình sẽ tác động đến cấu trúc danh mục cổ

phiếu như thế nào ?

- Hệ số đo lường nào đánh giá hợp lý cho mức độ đóng góp của biến mới đưa

vào mô hình trong việc làm tăng thêm mức độ phân tán tỷ suất sinh lợi bình

quân ?

1.4 Đối tượng nghiên cứu

- Mức độ đóng góp của biến mới đưa vào mô hình đến mức chênh lệch tỷ suất

sinh lợi bình quân.

1.5 Phạm vi nghiên cứu

- Phạm vi không gian: các cổ phiếu niêm yết trên SGDCK Thành Phố Hồ Chí

Minh (Hose).

- Phạm vi thời gian: 01/2009 - 10/2016

- Phạm vi nội dung: Mức độ đóng góp của biến mới đưa vào mô hình đến mức

chênh lệch tỷ suất sinh lợi bình quân, từ đó xác định cấu trúc danh mục cổ

phiếu.

1.6 Phương pháp nghiên cứu

Tôi sử dụng phương pháp hồi quy Fama-Macbeth để đánh giá mức độ tăng thêm

của độ phân tán tỷ suất sinh lợi kỳ vọng khi thêm một biến mới vào mô hình. Đầu

tiên, tôi tiến hành hồi quy dữ liệu chéo với biến phụ thuộc là tỷ suất sinh lợi cổ phiếu

cùng các biến giải thích. Sau khi ước lượng mô hình theo dữ liệu chéo như bước một

cho tất cả các tháng, các chỉ số thống kê giá trị trung bình và thống kê t sẽ được tính

toán để xem xét mức độ ý nghĩa của từng biến.

Cần lưu ý rằng: mục đích của bài nghiên cứu là xác định mức độ đóng góp tăng

thêm của một biến mới đưa vào mô hình đối với mức phân tán tỷ suất sinh lợi bình

quân nên sau khi ước lượng mô hình, tôi sẽ tiến hành xây dựng các danh mục ngũ

phân vị để xác định tỷ suất sinh lợi danh mục ước tính. Tôi sẽ kiểm tra kết quả cho

mẫu dữ liệu các cổ phiếu thu thập từ Sàn Giao Dịch Chứng Khoán Thành Phố Hồ Chí

3

Minh (Hose). Phần chi tiết phương pháp nghiên cứu của bài nghiên cứu sẽ được trình

bày cụ thể ở Chương 3.

1.7 Ý nghĩa của đề tài

Bài nghiên cứu đã tìm ra chỉ số được dùng để đánh giá tầm quan trọng của một

biến trong việc dự đoán tỷ suất sinh lợi kỳ vọng. Đó chính là mức đóng góp tăng thêm

của biến vào độ phân tán tỷ suất sinh lợi.

Đồng thời, vấn đề vì sao đôi khi đưa một biến mới có mức độ giải thích cao vào

mô hình sẽ làm pha loãng giá trị của những biến có sẵn trong danh mục cũng được

làm rõ. Điều này sẽ cung cấp cơ sở để nhà đầu tư lựa chọn danh mục cổ phiếu như

thế nào nhằm đạt được tỷ suất sinh lợi cao nhất.

1.8 Kết cấu của luận văn

Nội dung chính của luận văn gồm những phần chính sau:

Chương 1: Giới thiệu

Chương 2: Tổng quan các nghiên cứu trước đây

Chương 3: Phương pháp và dữ liệu nghiên cứu

Chương 4: Kết quả nghiên cứu

Chương 5: Kết luận

1.9 Tóm tắt luận văn

Trên thế giới đã có nhiều nghiên cứu xây dựng các mô hình hồi quy diễn giải

mối quan hệ giữa tỷ suất sinh lợi bình quân và các biến đặc trưng cho công ty. Tuy

nhiên, các biến có mức giải thích mạnh trong các mô hình định giá tài sản thường

mang rất ít ý nghĩa trong việc giải thích thêm cho tỷ suất sinh lợi bình quân của danh

mục bởi hai lý do: (1) việc đưa thêm một biến mới vào mô hình có thể sẽ khiến pha

loãng hệ số ước lượng của các biến sẵn có trong mô hình (2) việc đưa thêm một biến

có mức độ giải thích cao vào mô hình sẽ làm pha loãng giá trị của những biến có sẵn

4

trong các danh mục cực trị (extreme portfolios) được cấu tạo từ việc sắp xếp các giá

trị ước tính của biến phụ thuộc thành nhóm ngũ phân vị.

Và khi không có sự giới hạn đối với tỷ trọng danh mục, hệ số Sharpe tối thiểu

trong chỉ số thống kê GRS được nghiên cứu bởi Gibbons, Ross, Shanken (1989) đã

làm rõ hơn về mức độ tác động của một biến mới đến tỷ suất sinh lợi tăng thêm. Từ

đó giúp cho nhà đầu tư có thể lựa chọn danh mục cổ phiếu của mình để nâng cao khả

năng đạt được mức tỷ suất sinh lợi kỳ vọng mong muốn.

5

Chương 2. TỔNG QUAN CÁC NGHIÊN CỨU TRƯỚC ĐÂY

Nhiều nghiên cứu về định giá tài sản chỉ ra các biến đặc trưng của công ty có

tác động đến tỷ suất sinh lợi bình quân như: quy mô, tỷ số B/M, khuynh hướng giá

cổ phiếu, phát hành cổ phiếu. Sự quan trọng của một biến giải thích bất kỳ thường

được phán xét thông qua sự phân hóa của dải tỷ suất sinh lợi mà nó tạo ra. Hai dải tỷ

suất sinh lợi bình quân thu được từ hai phương trình hồi quy đơn biến giữa hai biến

khác nhau. Dải tỷ suất sinh lợi nào có độ phân hóa lớn hơn cho thấy rằng biến độc

lập trong phương trình đó giải thích tốt hơn cho tỷ suất sinh lợi. Điểm lưu ý này

thường được thể hiện thông qua sự khác biệt trong tỷ suất sinh lợi giữa nhóm ngũ

phân vị hoặc thập phân vị cao nhất và thấp nhất. Đã có nhiều mô hình về tỷ suất sinh

lợi được đưa ra trước đây, tuy nhiên sự phân hóa trong tỷ suất sinh lợi bình quân từ

mô hình chỉ với một biến mới luôn lớn hơn phần sự phân hóa tăng thêm mà nó đóng

góp vào mô hình đa biến.

Mục tiêu nghiên cứu của tôi là giải thích mức độ đóng góp tăng thêm của một

biến mới (có ảnh hưởng đến tỷ suất sinh lợi) khi đưa thêm biến mới này vào mô hình

sẵn có. Tôi giải thích điều này dựa trên quan điểm sử dụng các ước lượng của tỷ suất

sinh lợi kỳ vọng theo phương pháp hồi quy Fama - Macbeth (1973) để sắp xếp cổ

phiếu thành các danh mục.

Mức độ tác động tăng thêm của một biến lên mức độ phân hóa của tỷ suất sinh

lợi bình quân từ mô hình hồi quy đa biến thường nhỏ hơn so với mô hình một biến

bởi hai lý do. Thứ nhất, một biến giải thích mới thường pha loãng hệ số ước lượng

của các biến có sẵn trong mô hình. Sự pha loãng hệ số góc xuất hiện trong mô hình

hồi quy hai biến. Ví dụ: khi các biến giải thích tương quan dương và các hệ số góc có

cùng dấu hoặc khi các biến giải thích tương quan âm và các hệ số góc ngược dấu.

Điều này làm giảm tác động tăng thêm của một biến lên sự phân hóa của tỷ suất sinh

lợi kỳ vọng. Thứ hai, sự pha loãng biến nghiên cứu. Việc thêm vào một biến có mức

6

giải thích cao luôn làm giảm đi giá trị của các biến giải thích khác trong phân vị lớn

nhất và phân vị nhỏ nhất. Kết quả là, lợi ích tăng lên từ sự thêm vào một biến mới sẽ

luôn đi kèm với phần lợi ích giảm xuống từ các biến có sẵn. Nhận định này hết sức

rõ ràng. Việc sắp xếp giá trị ước lượng của biến phụ thuộc từ hồi quy một biến cũng

tương đương với việc sắp xếp chính biến đó, do đó danh mục có tỷ suất sinh lợi kỳ

vọng cao và thấp từ mô hình hồi quy một biến sẽ tối ưu hóa sự phân tán trong chính

biến giải thích. Một biến mới chỉ có thể làm tăng sự phân tán trong tỷ suất sinh lợi kỳ

vọng bằng cách thay thế những cổ phiếu trong danh mục cực trị (extreme portfolios)

và điều đó làm giảm mức phân tán trong biến gốc. Điều này cũng đúng cho trường

hợp tổng quát với mô hình hồi quy nhiều biến, khi độ phân tán của biến tỷ suất sinh

lợi kỳ vọng tăng lên cao cũng ám chỉ sự phân tán nhiều hơn trong các biến ban đầu.

Vì thống kê t trong ước lượng của Fama - Macbeth dùng để đo lường liệu một

biến cụ thể có tác động đến tỷ suất sinh lợi hay không nên có nhiều ý kiến xung quanh

về việc nghiên cứu này tập trung vào sự phân tán của tỷ suất sinh lợi thì có đúng chỗ

hay không. Tuy nhiên, một biến có thể có tác động đáng kể đến sự biến động của tỷ

suất sinh lợi khi các biến khác không đổi nhưng tác động tăng thêm của biến này đến

độ phân tán của tỷ suất sinh lợi giảm đi đáng kể khi xem xét sự biến động đồng thời

của tất cả các biến trong một mô hình. Để hiểu được sự kết hợp của các biến như thế

nào trong việc tạo ra một tỷ suất sinh lợi sẵn có cho nhà đầu tư, điều tốt nhất là xem

xét sự phân tán của tỷ suất sinh lợi trong các danh mục được hình thành từ việc sắp

xếp các ước lượng hồi quy khi có và không thêm vào biến giải thích mới.

Bài nghiên cứu này của tôi sẽ xem xét ba nghiên cứu trước đây trong việc sử

dụng giá trị ước lượng của biến giải thích để cung cấp bằng chứng về tỷ suất sinh lợi

tăng thêm.

Thứ nhất, nghiên cứu của Fama and French (2006) xem xét độ phân tán tỷ suất

sinh lợi bình quân của các danh mục được hình thành từ việc phân chia giá trị ước

lượng của biến giải thích. Các tác giả cho rằng: việc thêm vào một biến chỉ làm tăng

7

thêm một lượng nhỏ độ phân tán tỷ suất sinh lợi và lí do là ở sự phân chia các cổ

phiếu hai danh mục.

Thứ hai, nghiên cứu của Lewellen (2011) tìm thấy rằng, mặc dù các cổ phiếu

được chia thành 10 danh mục thì việc thêm vào một biến mới cũng tác động rất ít đến

việc cải thiện độ phân tán tỷ suất sinh lợi bình quân. Tác giả đã kiểm định các mô

hình sử dụng lần lượt ba biến giải thích (quy mô, tỷ số B/M, xu hướng); 7 biến giải

thích (ba biến trên và các biến phát hành cổ phiếu, dồn tích, khả năng sinh lời, tăng

trưởng tài sản); 15 biến giải thích (7 biến trên cộng với 8 biến khác sẽ được mô tả

trong phần phụ lục). Kết quả từ nghiên cứu của tác giả cho thấy: mô hình tăng từ 7

biến lên 15 biến thì mức độ phân tán tỷ suất sinh lợi bình quân tăng thêm không đáng

kể. Điều này là vì các biến mới thêm vào không có nhiều ý nghĩa trong việc giải thích

cho biến phụ thuộc. Kết quả này cũng giống với nghiên cứu Fama and French (2006),

khi các tác giả sử dụng mô hình hồi quy với 2, 5, 7 và 9 biến giải thích.

Tóm lại, điểm chung trong nghiên cứu của Fama and French (2006) và Lewellen

(2011) là không giải thích: vì sao các biến độc lập có mức giải thích mạnh khi thêm

vào mô hình lại chỉ làm tăng thêm một lượng nhỏ độ phân tán tỷ suất sinh lợi.

Thứ ba, nghiên cứu của Fama and French (2015). Nhóm tác giả thực hiện không

nhằm mục đích cung cấp một sự lý giải hoàn chỉnh về việc: làm thế nào các biến độc

lập được nêu trong các nghiên cứu trước đây kết hợp với nhau để tạo ra tỷ suất sinh

lợi bình quân. Mục tiêu chính là giải quyết hai vấn đề. Đó là: sự pha loãng của hệ số

ước lượng và sự pha loãng giá trị của biến độc lập trong các danh mục cực trị. Điều

này sẽ giải thích cho câu hỏi: vì sao những biến tạo ra độ phân tán tỷ suất sinh lợi lớn

trong mô hình một biến và có mức giải thích mạnh lại chỉ tạo ra tác động nhỏ trong

việc thiết lập danh mục đầu tư khi đối mặt với sự cạnh tranh từ những biến khác.

Phần tiếp theo sẽ đề cập sơ lược đến các vấn đề nổi trội kèm theo kết quả thu

được trong các nghiên cứu chính yếu được sử dụng trong bài nghiên cứu này.

8

2.1 Nghiên cứu Fama and Macbeth (1973)

➢ Tổng quan lý thuyết

Nghiên cứu này của các tác giả kiểm định mối quan hệ giữa tỷ suất sinh lợi và

rủi ro của các công ty đại chúng niêm yết trên sàn giao dịch chứng khoán New York.

Nền tảng lý thuyết cho kiểm định của các tác giả là mô hình danh mục hai hệ số và

các mô hình cân bằng thị trường dựa trên mô hình hai hệ số này. Các tác giả không

thể bác bỏ giả thuyết rằng: việc định giá cổ phiếu niêm yết phản ánh nỗ lực của nhà

đầu tư quan ngại rủi ro trong việc nắm giữ các danh mục hiệu quả trên phương diện

giá trị kỳ vọng và mức độ phân tán của tỷ suất sinh lợi. Hơn nữa, thuộc tính “trò chơi

công bằng” trong hệ số ước lượng và phần dư trong mô hình hồi quy tỷ suất sinh lợi

- rủi ro là nhất quán với thị trường tài chính hiệu quả (nơi mà giá cả của cổ phiếu

phản ánh một cách đầy đủ thông tin sẵn có).

Trong quá trình thiết lập danh mục, nhà đầu tư chỉ quan tâm tác động của một

cổ phiếu đến giá trị danh mục ở hai khía cạnh là giá trị tỷ suất sinh lợi kỳ vọng và độ

phân tán tỷ suất sinh lợi. Với giả định tỷ suất sinh lợi tuân theo phân phối chuẩn thì

rủi ro của một danh mục p được đo lường bằng độ lệch chuẩn σ(𝑅̃ p) của tỷ suất sinh

lợi 𝑅̃ p. Khi đó, rủi ro của một tài sản đối với nhà đầu tư đang nắm giữ danh mục p là

mức độ đóng góp của tài sản đó đến σ(𝑅̃ p). Nếu đặt xip là tỷ trọng của tài sản i trong

danh mục p, thì σij= cov(𝑅̃ i, 𝑅̃ j) là hiệp phương sai giữa tỷ suất sinh lợi của tài sản i

và tài sản j. Với N là tổng số tài sản trong danh mục, khi đó rủi ro của danh mục được

đo lường thông qua độ lệch chuẩn sẽ được xác định như sau:

Do đó, phần đóng góp của tài sản i tới σ(𝑅̃ p) hay chính là rủi ro của tài sản i

trong danh mục p sẽ tỷ lệ thuận với tỷ số bên dưới

9

Lưu ý rằng: bởi vì tỷ trọng xjp khác nhau ở các danh mục nên rủi ro của một tài

sản trong các danh mục khác nhau sẽ mang giá trị khác nhau.

Đối với một nhà đầu tư cá nhân, mối quan hệ giữa rủi ro và tỷ suất sinh lợi kỳ

vọng được xác định bởi thực tế rằng: danh mục tối ưu của nhà đầu tư là hiệu quả. Do

đó, nếu nhà đầu tư chọn danh mục m bởi danh mục m hiệu quả thì tức là tỷ trọng của

các tài sản xim (với i=1,2,3… N) sẽ tối đa hóa tỷ suất sinh lợi kỳ vọng của danh mục

với các ràng buộc:

Phương pháp Lagrangian được áp dụng để giải ra các giá trị tỷ trọng xjm lựa

chọn cho danh mục m

Trong đó: Sm đo lường mức độ thay đổi của tỷ suất sinh lợi kỳ vọng E(𝑅̃ p) khi

rủi ro σ(𝑅̃ p) thay đổi từ điểm danh mục hiệu quả. Nếu ràng buộc điều kiện bán khống

thì danh mục từ lời giải của phương trình (1) chỉ bao gồm các tài sản có tỷ trọng xim

> 0.

Mặc dù phương trình (1) chỉ đặt điều kiện lên tỷ trọng xjm của các tài sản để

danh mục là hiệu quả, song điều này cũng thể hiện mối quan hệ giữa rủi ro của tài

sản i trong danh mục m và tỷ suất sinh lợi của tương ứng. Phương trình trên nói lên

10

rằng sự khác biệt trong tỷ suất sinh lợi của một tài sản và danh mục sẽ tỷ lệ thuận với

sự khác biệt trong rủi ro giữa tài sản và danh mục. Tỷ lệ này được thể hiện thông qua

chỉ số Sm (chính là hệ số góc của danh mục hiệu quả tại điểm tương ứng với danh

mục m). Đồng thời, rủi ro của một tài sản sẽ là phần đóng góp của tài sản đó vào rủi

ro chung của danh mục σ(𝑅̃ m).

➢ Phương pháp nghiên cứu của Fama - Macbeth (1973)

Nghiên cứu này của các tác giả đưa ra một cách làm chuẩn mực mới trong việc

thiết lập danh mục để tránh những sai số từ việc đo lường hệ số β. Cụ thể, đầu tiên

các tác giả sẽ sử dụng dữ liệu tỷ suất sinh lợi hàng tháng trong 4 năm để ước lượng

hệ số β cho từng cổ phiếu riêng rẽ. Sắp xếp các công ty theo hệ số này, tác giả sẽ thiết

̂ nhỏ lập 20 danh mục cổ phiếu trong đó nhóm đầu tiên sẽ là nhóm có các giá trị 𝛽𝑖

̂ lớn nhất. Dữ liệu của 5 năm tiếp nhất và nhóm cuối cùng là nhóm có các giá trị 𝛽𝑖

theo được sử dụng để tính toán lại giá trị β ước lượng của các chứng khoán, trung

bình của các hệ số này tạo nên giá trị β ước lượng của danh mục được sử dụng cho

các kiểm định tỷ suất sinh lợi - rủi ro.

Một đóng góp quan trọng của nghiên cứu này là xây dựng hệ số đo lường rủi ro

mà không được thể hiện thông qua hệ số β (rủi ro phi β). Hệ số này được xác định

bằng độ lệch chuẩn của phần dư trong mô hình thị trường 𝑠(𝜀̂𝑖).

Xuất phát từ phương trình (8), ta thấy rằng rủi ro của một chứng khoán thể hiện

qua độ phân tán tỷ suất sinh lợi của nó sẽ được xác định thông qua hai phần. Phần

thứ nhất là đóng góp của nó tới độ phân tán của tỷ suất sinh lợi danh mục hiệu quả,

phần thứ hai chính là độ phân tán trong phần dư không liên quan tới β. Nếu ta xem

𝑐𝑜𝑣̂ (𝑅̂𝑖,𝑅̃𝑚) 𝜎̂ 2(𝑅̃𝑚)

𝛽𝑖 ≡ thì từ phương trình (8) sẽ có được 𝑐𝑜𝑣(𝑒̂𝑖, 𝑅̃𝑚) = 0. Trong phương

trình (9), vế cuối cùng bên phải phương trình chính là hiệp phương sai giữa phần tỷ

suất sinh lợi có liên quan tới β và phần dư, giá trị này bằng 0.

11

Tỷ suất sinh lợi hàng tháng cho 20 danh mục đo lường bằng bình quân không

trọng số tỷ suất sinh lợi của các cổ phiếu được tính toán. Phương trình hồi quy dữ liệu

chéo cho mỗi tháng được biểu diễn bên dưới

Với p = 1,2,…,20.

➢ Kết quả nghiên cứu

Các kết quả mà tác giả tìm được ủng hộ kiểm định đối với mô hình hai tham số.

Với một danh mục thị trường hiệu quả hay danh mục đại diện được lựa chọn là tương

đối hiệu quả thì kết quả nghiên cứu này không thể bác bỏ giả thuyết rằng: tỷ suất sinh

lợi bình quân của cổ phiếu phản ánh nỗ lực của nhà đầu tư quan ngại rủi ro để nắm

giữ danh mục hiệu quả. Cụ thể, về mặt trung bình thì có một hệ số đánh đổi dương

giữa rủi ro và tỷ suất sinh lợi, với rủi ro được đo lường theo quan điểm danh mục. Do

đó, chúng ta không thể bác bỏ giả thuyết cho rằng một quyết định lựa chọn danh mục

của nhà đầu tư sẽ dựa trên giả định rằng: mối quan hệ giữa rủi ro danh mục cổ phiếu

và tỷ suất sinh lợi kỳ vọng của nó có mối quan hệ tuyến tính và hàm ý này xuất phát

từ mô hình hai tham số. Chúng ta cũng không thể bác bỏ giả thuyết cho rằng: không

tồn tại bất kỳ một rủi ro nào khác trong rủi ro danh mục mà có tác động một cách hệ

thống đến tỷ suất sinh lợi trung bình.

2.2 Nghiên cứu Fama and French (2006)

➢ Tổng quan nghiên cứu

Lý thuyết định giá cho rằng tỷ suất sinh lợi kỳ vọng của cổ phiếu phụ thuộc vào

ba biến là: tỷ số giá sổ sách trên giá thị trường (B/M ratio), khả năng sinh lời kỳ vọng

và mức độ đầu tư kỳ vọng. Với tỷ số B/M và khả năng sinh lời cho trước, mức độ đầu

tư kỳ vọng cao sẽ dẫn đến tỷ suất sinh lợi kỳ vọng thấp. Nhưng khi kiểm soát đối với

hai biến còn lại thì một công ty có khả năng sinh lời cao sẽ có tỷ suất sinh lợi kỳ vọng

12

cao, điều này cũng tương tự đối với trường hợp công ty có tỷ số B/M cao. Nghiên

cứu của các tác giả sẽ kiểm định các nhận định này.

Lý thuyết nền tảng cho nghiên cứu của các tác giả dựa trên mô hình chiết khấu

dòng tiền, trong đó giá trị thị trường của một cổ phiếu được đo lường bằng hiện giá

của dòng cổ tức kỳ vọng

Trong đó: Mt là giá cổ phiếu tại thời điểm t; E(Dt+ τ) là cổ tức kỳ vọng ở kỳ t+τ;

r là tỷ suất sinh lợi kỳ vọng bình quân dài hạn hay chính là tỷ suất sinh lợi nội bộ của

cổ tức; Dt là cổ tức trong kỳ t [được đo lường bằng thu nhập trên mỗi cổ phần (Yt)

trừ đi thay đổi giá trị sổ sách mỗi cổ phần (dBt= Bt- Bt-1)]. Khi đó, mô hình chiết khấu

dòng cổ tức sẽ được viết lại như sau:

Chia 2 vế của phương trình cho giá trị sổ sách ở kỳ t (tức Bt)

Phương trình (3) đưa ra ba nhận xét dành cho tỷ suất sinh lợi kỳ vọng. Thứ nhất,

khi kiểm soát yếu tố thu nhập kỳ vọng và sự thay đổi trong giá trị sổ sách thì tỷ số

B/M có quan hệ cùng chiều với tỷ suất sinh lợi kỳ vọng của cổ phiếu, một công ty có

chỉ số B/M cao sẽ hàm ý một tỷ suất sinh lợi kỳ vọng cao và ngược lại. Thứ hai, Khi

kiểm soát tỷ số B/M và tăng trưởng kỳ vọng trong giá trị sổ sách, một công ty có khả

năng sinh lời kỳ vọng cao (đo lường bằng kỳ vọng thu thập chia cho giá trị sổ sách)

sẽ có tỷ suất sinh lợi cổ phiếu kỳ vọng cao. Thứ ba, với tỷ số B/M và thu nhập kỳ

vọng so với giá trị sổ sách cho trước, một công ty có mức tăng trưởng trong giá trị sổ

13

sách do tái đầu tư thu nhập sẽ có tỷ suất sinh lợi cổ phiếu kỳ vọng thấp. Các tác giả

sẽ kiểm định tác động của tỷ số B/M, khả năng sinh lời và mức độ tái đầu tư đến việc

dự đoán tỷ suất sinh lợi kỳ vọng thông qua phương trình định giá (3).

Trong những nghiên cứu trước đây; mối quan hệ giữa tỷ số B/M, khả năng sinh

lời, mức đầu tư kỳ vọng và tỷ suất sinh lợi cổ phiếu trong tương lai thường được lý

giải bởi việc định giá sai sót (mispricing). Và như thường lệ, việc định giá không hợp

lý không phải là lý do duy nhất. Với việc định giá hợp lý, thì tác động của các yếu tố

trên đến tỷ suất sinh lợi được giải thích thông qua sự khác biệt trong rủi ro. Khi kiểm

soát các yếu tố còn lại thì một công ty có tỷ số B/M cao hoặc khả năng sinh lời cao

sẽ có rủi ro cao trong khi một công ty có mức tăng trưởng nhanh thì sẽ ít rủi ro hơn.

Tuy nhiên kiểm định của tác giả chỉ đơn giản thông qua phương trình định giá chứ

không nhằm mục đích lý giải sự hợp lý hay bất hợp lý trong định giá. Mục tiêu trong

nghiên cứu này của các tác giả nhằm cung cấp một cách nhìn toàn diện về sự kết hợp

cả ba yếu tố trên trong việc giải thích cho tỷ suất sinh lợi cổ phiếu trung bình.

➢ Mô hình hồi quy dữ liệu chéo giải thích cho tỷ suất sinh lợi kỳ vọng

Mục tiêu của nghiên cứu này là tập trung kiểm định tác động của khả năng sinh

lời và đầu tư đến tỷ suất sinh lợi được nêu ra ở phương trình (3) thông qua ba kiểm

định.

Thứ nhất, tác giả sẽ tiến hành hồi quy dữ liệu chéo với biến phụ thuộc là tỷ suất

sinh lợi bình quân với các biến độc lập là độ trễ của lần lượt các biến quy mô (size),

tỷ số Bt/Mt, tăng trưởng tài sản, khả năng sinh lời. Mục đích của bước này là để kiểm

định xem việc sử dụng các biến đại diện đơn giản cho khả năng sinh lời và tăng trưởng

tài sản có tăng thêm mức độ giải thích cho biến tỷ suất sinh lợi bình quân bên cạnh

hai biến quy mô và tỷ số Bt/Mt.

Thứ hai, các tác giả sử dụng những biến có tính phức tạp hơn để đại diện cho

khả năng sinh lời kỳ vọng và tăng trưởng tài sản kỳ vọng, các biến này chính là giá

trị ước tính trong hai mô hình hồi quy tương ứng được trình bày ở phần trên.

14

Thứ ba, tác giả sử dụng các danh mục để xem xét liệu tác động của khả năng

sinh lời và tăng trưởng tài sản xác định trong mô hình hồi quy có đủ lớn và rộng khắp

cho toàn bộ mẫu và trong từng danh mục được thiết lập dựa vào hai yếu tố quy mô,

tỷ số Bt/Mt. Các mô hình hồi quy được sử dụng trong nghiên cứu sử dụng dữ liệu

hàng tháng bắt đầu từ tháng 7 năm 1963 và cập nhật hàng năm vào cuối tháng 6.

Kết quả nghiên cứu cho thấy rằng khi sử dụng riêng lẻ, biến quy mô và tỷ số

Bt/Mt giải thích rất mạnh cho tỷ suất sinh lợi. Cụ thể, biến tỷ số Bt/Mt có quan hệ cùng

chiều với biến tỷ suất sinh lợi, những công ty có tỷ số Bt/Mt cao (công ty giá trị) có

tỷ suất sinh lợi bình quân cao hơn so với những công ty có tỷ số Bt/Mt thấp (công ty

tăng trưởng). Trong khi, biến quy mô (size) có mối quan hệ ngược chiều với tỷ suất

sinh lợi. Những công ty có quy mô nhỏ có tỷ suất sinh lợi bình quân cao hơn những

công ty có quy mô lớn. Điều thú vị hơn, biến đại diện đơn giản cho khả năng sinh lời

và tăng trưởng tài sản kỳ vọng lần lượt có tác động dương và âm đến tỷ suất sinh lợi

bình quân giống như dự đoán trong phương trình (3).

Khi các biến trễ của khả năng sinh lời và mức độ đầu tư được đưa vào phương

trình hồi quy của biến tỷ suất sinh lợi bình quân cùng với các biến tỷ số Bt/Mt, quy

mô thì tác động dương của biến khả năng sinh lời và tác động âm của tăng trưởng tài

sản đến tỷ suất sinh lợi bình quân được thể hiện một cách rõ ràng. Hơn nữa, khi đưa

hai biến này vào mô hình thì mức độ tác động của biến tỷ số Bt/Mt và quy mô dường

như không thay đổi. Kết quả cũng cho thấy rằng việc thêm độ trễ hoặc thay thế độ trễ

khác của hai biến khả năng sinh lời và tăng trưởng tài sản không làm cải thiện mức

độ giải thích của chúng.

➢ Những kết luận quan trọng

Theo phương trình định giá (3), khi kiểm soát khả năng sinh lời và đầu tư kỳ

vọng, những công ty có tỷ số Bt/Mt (tỷ số giá trị sổ sách trên giá thị trường) càng cao

sẽ có mức tỷ suất sinh lợi càng cao. Những công ty có quy mô càng nhỏ thì tỷ suất

sinh lợi càng cao. Nếu kiểm soát tỷ số Bt/Mt và mức đầu tư kỳ vọng, khả năng sinh

15

lời kỳ vọng cao hơn cũng sẽ hàm ý một tỷ suất sinh lợi cao hơn. Với tỷ số Bt/Mt và

khả năng sinh lời cho trước, mức độ đầu tư kỳ vọng cao sẽ ám chỉ một tỷ suất sinh

lợi thấp.

2.3 Nghiên cứu Lewellen (2011)

Tác giả nghiên cứu thuộc tính dữ liệu chéo của tỷ suất sinh lợi dự báo các hồi

quy bằng phương pháp Fama - Macbeth. Những dự báo này mô phỏng lại cách thức

mà nhà đầu tư trên thực tế kết hợp rất nhiều các yếu tố đặc trưng của doanh nghiệp

để tạo ra một hệ số ước lượng tổng hợp của tỷ suất sinh lợi kỳ vọng cổ phiếu. Thực

tế cho thấy rằng các giá trị dự báo này biến động theo từng cổ phiếu và khả năng dự

báo rất mạnh cho tỷ suất sinh lợi thực tế. Ví dụ như khi dựa vào các hệ số ước lượng

bằng phương pháp Fama - Macbeth cho khung cửa sổ 10 năm cùng với một mô hình

dữ liệu chéo với 15 đặc trưng của công ty, giá trị tỷ suất sinh lợi kỳ vọng ước lượng

có độ lệch chuẩn chỉ 0.87% theo tháng và hệ số dự báo cho tỷ suất sinh lợi tương lai

là 0.74 với sai số chuẩn là 0.07.

Nghiên cứu này kế thừa kết quả từ những nghiên cứu về định giá tài sản trước

đây trong việc giải thích tỷ suất sinh lợi cổ phiếu. Các yếu tố đặc trưng cho công ty

như quy mô, tỷ số Bt/Mt, tỷ suất sinh lợi quá khứ và đầu tư có tương quan với tỷ suất

sinh lợi cổ phiếu. Các tác động này được thể hiện thông qua kết quả nghiên cứu danh

mục và hệ số ước lượng theo phương pháp hồi quy dữ liệu chéo của Fama – Macbeth

(1973). Nghiên cứu này đưa ra các thuộc tính chéo (cross - sectional properties) của

tỷ suất sinh lợi kỳ vọng, trong đó đưa ra hai câu hỏi chính. Thứ nhất, chúng ta có thể

dự báo được bao nhiêu phần biến động chéo trong tỷ suất sinh lợi kỳ vọng. Thứ hai,

các ước lượng của tỷ suất sinh lợi kỳ vọng theo phương pháp Fama - Macbeth đáng

tin cậy như thế nào. Những câu hỏi này không được trả lời bằng phương thiết lập

danh mục dựa trên sắp xếp một hoặc hai yếu tố và phương pháp hồi quy dữ liệu chéo

như thông thường. Trong nghiên cứu này, tác giả sẽ trả lời những câu hỏi trên bằng

phương pháp nghiên cứu sự phân phối và khả năng dự báo ngoài mẫu của tỷ suất sinh

lợi kỳ vọng được ước tính bằng phương pháp Fama - Macbeth dựa trên các hệ số ước

16

lượng. Câu hỏi chính được xác định trong nghiên cứu này là liệu rằng các ước lượng

tỷ suất sinh lợi có thẳng hàng với các giá trị tỷ suất sinh lợi thực tế và nếu nó đưa ra

một ước lượng tốt cho tỷ suất sinh lợi kỳ vọng thì hệ số ước lượng của nó trong

phương trình dự báo cho tỷ suất sinh lợi thực tế có nên bằng một hay không. Kết quả

nghiên cứu của tác giả đưa ra những đóng góp sau:

Thứ nhất, các nghiên cứu trước đây chỉ ra rất nhiều thuộc tính của công ty có

tương quan với tỷ suất sinh lợi cổ phiếu tương ứng tuy nhiên có rất ít bằng chứng cho

thấy rằng liệu các thuộc tính này có thể được sử dụng một cách độc lập hoặc kết hợp

lẫn nhau để ước tính cho tỷ suất sinh lợi cổ phiếu trong thực tế. Chúng ta đều biết

rằng tỷ số B/M và mức độ dồn tích có ý nghĩa trong việc giải thích cho tỷ suất sinh

lợi nhưng chúng ta không biết liệu rằng các dự báo từ hai biến này có thẳng hàng với

giá trị tỷ suất sinh lợi thực tế. Khi các hệ số ước lượng chéo là không đúng vì lý do

nhiễu trong các hệ số ước lượng hoặc do sự biến động theo thời gian của hệ số ước

lượng đúng, thì mức độ dự báo tỷ suất sinh lợi kỳ vọng ước tính có thể thấp nếu các

đặc trưng của công ty ý nghĩa dự báo cho tỷ suất sinh lợi trong quá khứ.

Thứ hai, chúng ta đều biết rằng các chiến lược đầu tư thiết lập danh mục dựa

vào một hoặc hai yếu tố của doanh nghiệp có được kết quả tương đối tốt trong lịch

sử nhưng chúng ta không làm thế nào mà nhà đầu tư kết hợp các yếu tố này thành

một chiến lược giao dịch tổng hợp dựa trên những thông tin đã có sẵn. Phương pháp

Fama - Macbeth đưa ra một phương pháp đơn giản nhưng rất hiệu quả trong việc thiết

lập một chiến lược giao dịch tổng hợp, chiến lược này tập trung mua những cổ phiếu

có tỷ suất sinh lợi kỳ vọng cao và bán những cổ phiếu có tỷ suất sinh lợi kỳ vọng thấp

chỉ dựa trên duy nhất hệ số ước lượng trong thực tế. Nghiên cứu này của tác giả thực

hiện hồi quy cho 15 thuộc tính của doanh nghiệp và trong đó có rất nhiều thuộc tính

không có ý nghĩa thống kê trong việc giải thích cho tỷ suất sinh lợi kỳ vọng. Điều này

để giải thích rằng các nhà đầu tư không thể nào biết trước được đâu là biến tốt nhất

để giải thích cho tỷ suất sinh lợi.

17

Thứ ba, có rất nhiều nghiên cứu trước đây cố gắng lý giải tỷ suất sinh lợi kỳ

vọng của một cổ phiếu dựa vào giá của nó cũng như cổ tức và thu nhập dự báo nhưng

không có nhiều nghiên cứu ước tính tỷ suất sinh lợi kỳ vọng dựa vào các biến có tác

động tỷ suất sinh lợi đã biết. Nghiên cứu này của tác giả đề xuất rằng các ước lượng

dữ liệu chéo cung cấp các giá trị ước lượng đáng tin cậy cho tỷ suất sinh lợi kỳ vọng

và thực tế thì các hệ số ước lượng này giải thích tốt hơn so với các nghiên cứu trước

đây áp dụng chi phí sử dụng vốn.

2.4 Nghiên cứu Fama and French (2015)

Trong phần này, tác giả xây dựng các công thức để lý giải tác động của việc

thêm biến đến sự thay đổi mức độ phân tán tỷ suất sinh lợi. Cụ thể hơn, tác giả muốn

làm rõ: tại sao những biến độc lập có mức giải thích mạnh khi đưa vào mô hình lại

chỉ làm tăng một mức nhỏ độ phân tán tỷ suất sinh lợi bình quân.

➢ Xác định độ phân tán tỷ suất sinh lợi từ mô hình đơn biến – đa biến

Giả định rằng: tỷ suất sinh lợi được tạo ra tuân theo mô hình bên dưới:

𝑹 = 𝒃𝟏𝑿𝟏 + 𝒃𝟐𝑿𝟐 + 𝒗𝒊 (1)

Trong đó: R là tỷ suất sinh lợi cổ phiếu; b1 và b2 lần lượt là hệ số ước lượng của

biến X1, X2 trong mô hình hồi quy 2 biến; X1 và X2 là các yếu tố tác động đến R và

được giả định tuân theo phân phối chuẩn; vi là giá trị phần dư và được giả định là

không tương quan với các biến độc lập.

Tác giả bắt đầu xem xét vấn đề nghiên cứu như sau. Đầu tiên, tác giả xem xét

∗ 𝑿𝟏 + 𝒖 (2)

mô hình tỷ suất sinh lợi đơn biến được giải thích chỉ bởi biến X1 theo mô hình sau:

𝑹 = 𝒃𝟏

Trong đó: b1* là hệ số ước lượng của biến X1 trong mô hình đơn biến.

18

Giả định rằng: X2 là biến mới có tác động đến tỷ suất sinh lợi được đưa vào mô

hình (2). Đặt ρ là hệ số tương quan giữa hai biến X1 và X2 thì mô hình diễn đạt mối

quan hệ của hai biến này được thể hiện như sau:

𝑿𝟐 = 𝝆𝑿𝟏 + 𝒆 (3)

Với giả định (3), tác giả triển khai phương trình ước lượng (2) để tìm ra mối

∗ = 𝒃𝟏 + 𝝆𝒃𝟐 (4) 𝒃𝟏

quan hệ giữa hệ số ước lượng trong phương trình một biến và phương trình hai biến.

Thay (4) vào (2), tác giả thu được mô hình hồi quy đơn biến của R theo X1 trong

đó thể hiện mối quan hệ giữa hệ số góc trong mô hình đơn biến và mô hình hai biến:

𝑹 = (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 + 𝒖 (5)

Theo phương trình (1) và (5), tác giả nhận thấy: tỷ suất sinh lợi kỳ vọng có điều

kiện từ mô hình đơn biến và mô hình hai biến lần lượt là (b1 + ρb2)X1; b1X1 + b2X2

đều tuân theo phân phối chuẩn. Như vậy, nếu sắp xếp cổ phiếu dựa trên tỷ suất sinh

lợi kỳ vọng có điều kiện thì mức chênh lệch tỷ suất sinh lợi giữa nhóm danh mục ngũ

phân vị có tỷ suất sinh lợi kỳ vọng lớn nhất và nhỏ nhất (hay còn gọi là mức độ phân

tán của tỷ suất sinh lợi) sẽ tỷ lệ thuận với độ lệch chuẩn của tỷ suất sinh lợi bình quân

có điều kiện. Điều này ám chỉ rằng: mức đóng góp của một biến mới đến độ phân tán

tỷ suất sinh lợi sẽ được xác định thông qua tác động của biến đó đến độ lệch chuẩn

của giá trị ước tính biến phụ thuộc trong mô hình hồi quy.

Thay (3) vào (1), phương trình tỷ suất sinh lợi theo mô hình đa biến là:

𝑹 = (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 + 𝒃𝟐𝒆 + 𝒗 (6)

𝟐(𝟏 − 𝒑𝟐) (7)

Khi đó, phương sai sẽ bằng:

𝑽𝒂𝒓(𝑹) = (𝒃𝟏 + 𝝆𝒃𝟐)𝟐 + 𝒃𝟐

Lúc này, vế trái trong phương trình (7) chính là phương sai của tỷ suất sinh lợi

kỳ vọng có điều kiện từ phương trình hồi quy đơn biến (5). Vì vậy, nếu thêm biến X2

19

vào phương trình (5) thì đồng nghĩa việc thêm vào giá trị . Theo đó, X2 sẽ

đóng góp đáng kể vào tỷ suất sinh lợi nếu p (tức hệ số tương quan giữa X1 và X2) tiến

dần về 0 và b2 (tức độ dốc của X2 trong phương trình hồi quy 2 biến) mang giá trị

lớn. Ngược lại, nếu tồn tại mức tương quan mạnh (dù cùng chiều hay ngược chiều)

hoặc b2 mang giá trị nhỏ đều sẽ làm giảm mức đóng góp của biến mới vào phương

sai của mô hình.

Phương trình (7) miêu tả tác động của biến tăng thêm đến phương sai của tỷ

suất sinh lợi trong mô hình hồi quy. Như đã phân tích trước đó, mức chênh lệch giữa

tỷ suất sinh lợi kỳ vọng trong mô hình hồi quy đơn biến – đa biến tỷ lệ với độ lệch

chuẩn của giá trị phụ thuộc (fitted value), đồng thời tác giả cũng đã giả định độ lệch

2)1/2.

chuẩn của X1 và X2 mang giá trị 1. Cho nên, độ lệch chuẩn của giá trị biến phụ thuộc

2+ ρb1b2+ b2

trong mô hình hồi quy đơn biến và đa biến lần lượt là |b1+ρb2| và (b1

Khi đó, tỷ lệ độ phân tán tỷ suất sinh lợi kỳ vọng bình quân của mô hình đơn biến và

𝟐)𝟏/𝟐 (𝟖)

∗ 𝑹𝟏 𝑹′ =

mô hình đa biến được xác định như sau:

∗ là chênh lệch (độ phân tán) tỷ suất sinh lợi bình quân của mô hình đơn biến.

|𝒃𝟏 + 𝒃𝟐| 𝟐 + 𝟐𝝆𝒃𝟏𝒃𝟐 + 𝒃𝟐 (𝒃𝟏

Với: 𝑅1

𝑅′ là chênh lệch (độ phân tán) tỷ suất sinh lợi bình quân của mô hình đa biến.

Giả sử: đặt 𝑟 ≡ 𝑏2/𝑏1 thì phương trình (8) sẽ trở thành

Tóm lại, với giả định độ lệch chuẩn của X1 và X2 mang giá trị 1, tỷ lệ độ phân

tán tỷ suất sinh lợi kỳ vọng bình quân của mô hình đơn biến và mô hình đa biến sẽ

phụ thuộc vào giá trị p (tức hệ số tương quan giữa X1 và X2) và giá trị r (tức tỷ lệ giữa

các độ dốc trong phương trình hồi quy đa biến).

➢ Vấn đề pha loãng và khuếch đại biến

20

Phân tích cụ thể, tác giả nhận thấy rằng: một biến độc lập mới khi thêm vào mô

hình sẽ tác động đến độ phân tán tỷ suất sinh lợi bình quân thông qua việc thay đổi

các cổ phiếu trong nhóm danh mục có tỷ suất sinh lợi ước tính lớn nhất và nhỏ nhất.

Với mô hình đơn biến, danh mục có tỷ suất sinh lợi bình quân cao được hiểu là

danh mục chứa các cổ phiếu được dự đoán có mức sinh lợi cao nhất, .

Cho nên, danh mục có tỷ suất sinh lợi bình quân cao sẽ tối đa hóa giá trị bình quân

của biến X1 nếu độ dốc trong phương trình hồi quy là cùng chiều, hoặc tối thiểu hóa

nếu ngược chiều. Trong khi đó, với mô hình hồi quy hai biến, danh mục có tỷ suất

sinh lợi bình quân cao được hình thành từ việc: thay thế những cổ phiếu đang có X1

cao, X2 thấp bằng những cổ phiếu có X1 thấp hơn nhưng X2 cao hơn. Đối với danh

mục có tỷ suất sinh lợi bình quân thấp thì sẽ tiến hành ngược lại. Kết quả từ biện pháp

thay thế này sẽ làm gia tăng mức chênh lệch tỷ suất sinh lợi kỳ vọng thông qua việc

tăng độ phân tán của biến X2 giữa hai danh mục cực hạn, nhưng đồng thời cũng làm

giảm độ phân tán của biến X1. Giả sử:

* : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X1 ứng với nhóm

X1

danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đơn biến.

* : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X2 ứng với nhóm

X2

′ : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X1 ứng với nhóm

danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đơn biến.

𝑋1

′ : mức chênh lệch kỳ vọng giữa giá trị trung bình của biến X2 ứng với nhóm

danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đa biến.

𝑋2

danh mục ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy đa biến.

𝐼2 : phần đóng góp tăng thêm của biến X2 đến mức chênh lệch tỷ suất sinh lợi

′)

kỳ vọng trong mô hình hồi quy đa biến.

∗ = 𝑹′ − (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 ′ − 𝜌𝑋1

∗ ′ − (𝑏1 + 𝜌𝑏2)𝑋1 ∗ − 𝑋1 ∗) − 𝑏1(𝑋1

′ + 𝑏2𝑋2 ′) = 𝑏2(𝑋2

∗) − 𝑏1(𝑋1

′ − 𝑋2

∗ = −𝑏1𝑋1 ∗ − 𝑋1 = 𝒃𝟐 ∗ (độ khuếch đại của X2) − 𝒃𝟏 ∗ (độ pha loãng của X1) (9)

𝑰𝟐 = 𝑹′ − 𝑹𝟏 = 𝑏2(𝑋2

21

*, còn sự pha loãng giá trị

′ và X2

Dựa vào phương trình trên, tác giả nhận thấy rằng: sự khuếch đại giá trị của biến

′. Rõ ràng, khuếch

X2 chính là sự khác biệt giữa giá trị kỳ vọng của 𝑋2

* và 𝑋1

của biến X1 chính là sự khác biệt giữa giá trị kỳ vọng của X1

đại giá trị của biến X2 sẽ làm gia tăng độ phân tán tỷ suất sinh lợi kỳ vọng, nhưng

đồng thời sự khuếch đại này cũng làm giảm đi độ phân tán của biến X1 và do đó sẽ

làm giảm mức độ đóng góp tăng thêm của biến X2.

➢ Phân tích dựa vào mức độ chênh lệch tỷ suất sinh lợi (return gap)

Trong phương trình (9), tác giả đã sử dụng tác động của biến mới thêm vào đối

với kết cấu của danh mục cực trị để giải thích cho ảnh hưởng của tác động này đến

sự chênh lệch tỷ suất sinh lợi kỳ vọng giữa các danh mục cực trị. Cụ thể hơn, phần

phân tích này sẽ nêu thêm một cách thức khác để xem xét sự khác biệt giữa tổng các

mức độ phân tán tỷ suất sinh lợi kỳ vọng trong danh mục ngũ phân vị thông qua

phương thức tính toán từ mô hình hồi quy sử dụng riêng rẽ từng biến X1, X2 so với

phương thức tính toán từ mô hình hồi quy sử dụng đồng thời cả hai biến. Giá trị khác

biệt này được gọi là mức độ chênh lệch tỷ suất sinh lợi được biểu diễn thông qua hệ

số ước lượng trong mô hình hồi quy nhân với mức độ phân tán trong giá trị kỳ vọng

của từng biến.

∗ + 𝑏2

𝑹𝒆𝒕𝒖𝒓𝒏 𝒈𝒂𝒑 = (R1

∗ + R2 ∗ ) − R′ ∗𝑋2 ∗𝑋1 = (𝑏1+ 𝜌𝑏2)𝑋1

′ + 𝑏2𝑋2

′)]

′) ′ + 𝑏2𝑋2 ∗) − (𝑏1𝑋1 ∗ + (𝑏2+ 𝜌𝑏1)𝑋2 ∗ − (𝑏1𝑋1 ∗) + [𝑏1(𝑋1

′) ∗ − 𝑋2

∗ + 𝑏1𝑋2

= (𝑏1

′) + 𝑏2(𝑋2

∗ − 𝑋1 = Pha loãng hệ số ước lượng + Pha loãng biến (10)

= 𝜌(𝑏2𝑋1

Nếu biến X1 và X2 không tương quan với nhau (ρ=0), hệ số ước lượng của các

biến trong mô hình đơn biến và hai biến là giống nhau và do đó không có sự pha

loãng hệ số ước lượng. Tuy nhiên, nếu X1 và X2 tương quan với nhau, giá trị ước

lượng của mỗi biến trong mô hình riêng rẽ, cụ thế là b1+b2ρ (đối với X1) và b2+b1ρ

(đối với X2) chính bằng hệ số ước lượng của các biến này trong mô hình hai biến

22

cộng thêm một phần giá trị đại diện cho thông tin tỷ suất sinh lợi kỳ vọng hàm chứa

trong biến được thêm vào do sự tương quan của biến đó với biến bị loại ra.

Bởi vì với giả định rằng các biến b1, b2 là dương; nếu ρ cũng dương thì hệ số

ước lượng của mỗi biến sẽ điều chỉnh giảm đi một phần tương ứng lần lượt là b2ρ

hoặc b1ρ khi biến còn lại được thêm vào mô hình. Phương trình (10) chỉ ra rằng việc

pha loãng hệ số ước lượng sẽ làm giảm mức độ phân tán tỷ suất sinh lợi kỳ vọng

*+b1ρX2

*) và do đó làm tăng độ chênh lệch

trong mô hình hai biến một mức là (b2ρX1

tỷ suất sinh lợi (return gap) giữa tổng các giá trị phân tán tỷ suất sinh lợi kỳ vọng của

hai mô hình đơn biến riêng rẽ và độ phân tán tỷ suất sinh lợi kỳ vọng của mô hình hai

biến một khoảng tương tự.

Nếu hệ số ước lượng của mô hình đơn biến và hai biến đều dương nhưng hệ số

ρ âm thì sự pha loãng hệ số ước lượng sẽ trở thành sự khuếch đại. Ví dụ, bởi vì hệ số

B/M có tương quan âm với tỷ suất sinh lợi kỳ trước dùng để xác định biến khuynh

* và

hướng (momentum), cho nên hệ số ước lượng của mỗi biến lớn hơn nếu đưa thêm

* cùng dương và xuất hiện sự cải thiện hệ số bởi tương quan âm sẽ làm giảm chênh

biến khác vào mô hình. Khi các hệ số ước lượng trong mô hình đơn biến của X1

X2

lệch tỷ suất sinh lợi.

Sự pha loãng giá trị của biến cũng có tác động đến chênh lệch tỷ suất sinh lợi.

Ví dụ, sự pha loãng biến X1 chính là mức chênh lệch giữa độ phân tán kỳ vọng của

*

biến X1 trong danh mục ngũ phân vị cực trị của mô hình hồi quy đơn biến và hai biến

*- X1

’). Nếu hệ số ước lượng trong mô hình một biến và hai biến là dương thì X1

* cũng dương. Khi đó, sự pha loãng biến sẽ làm giảm mức độ phân tán của biến

(X1

và X2

X1 và X2 trong mô hình hồi quy hai biến, do đó làm giảm mức phân tán tỷ suất sinh

lợi kỳ vọng trong mô hình hồi quy hai biến và làm tăng chênh lệch tỷ suất sinh lợi

(return gap).

Tóm lại, sự pha loãng hệ số ước lượng và pha loãng biến có tương quan ngược

chiều với nhau. Khi hệ số b1, b2 trong mô hình hồi quy hai biến dương và hệ số tương

23

quan của hai biến X1, X2 xấp xỉ bằng 1 thì hệ số ước lượng trong mô hình đơn biến

*=b1+ρb2, b2

*=b2+ρb1) sẽ lớn hơn so với mô hình hai biến. Hệ số ước lượng của

(b1

mỗi biến sẽ bị pha loãng bằng chính hệ số ước lượng của biến còn lại. Tuy nhiên, nếu

* sẽ tiến

tồn tại một hệ số tương quan cùng chiều mạnh giữa biến X1 và X2 thì mức độ pha

* sẽ tiến gần về X1

’; X2

’ bởi vì một sự sắp xếp danh mục dựa trên cả hai biến cũng tương tự như

loãng biến của X1 và X2 sẽ trở nên nhỏ đi. Lúc này, X1

gần về X2

sắp xếp dựa trên một biến. Bên cạnh đó, nếu tồn tại hệ số ρ thấp hơn, mức độ pha

loãng hệ số ước lượng trong mô hình hai biến sẽ thấp đi. Ngoài ra, nếu ρ ngược chiều,

sự pha loãng hệ số ước lượng chuyển thành gia tăng hệ số ước lượng. Song, nếu mức

tương quan giữa biến X1, X2 thấp thì đồng nghĩa phải hi sinh nhiều hơn mức phân tán

của biến X1 để gia tăng mức độ phân tán X2 và ngược lại.

Ngoài ra, chênh lệch tỷ suất sinh lợi còn có một cách giải thích khác. Đó là sự

khác biệt trong tổng các mức độ phân tán kỳ vọng giữa các mô hình đơn biến với mô

hình hai biến cũng chính bằng sự chênh lệch tỷ suất sinh lợi kỳ vọng trong mô hình

đơn biến (với từng biến riêng rẽ) và sự đóng góp tăng thêm của biến đó vào độ phân

∗ − 𝑹′

tán của mô hình hai biến.

𝑹𝒆𝒕𝒖𝒓𝒏 𝑮𝒂𝒑 = 𝑹𝟏

∗ − 𝑰𝟏 ∗ − 𝑰𝟐 (11)

∗ + 𝑹𝟐 ∗ − (𝑹′ − 𝑹𝟐 ∗ − (𝑹′ − 𝑹𝟏

= 𝑹𝟏

∗ ) = 𝑹𝟏 ∗ ) = 𝑹𝟐

= 𝑹𝟐

*- I1 = R2

*- I2). Hai

Lưu ý rằng: X1 và X2 có cùng mức chênh lệch tăng thêm (R1

biến này mặc dù có thể tạo ra độ phân tán tỷ suất sinh lợi kỳ vọng trong mô hình đơn

biến và mức độ đóng góp tăng thêm đối với độ phân tán trong mô hình hai biến rất

khác nhau, nhưng hiệu số giữa hai yếu tố này của mỗi biến đều bằng nhau và bằng

với mức chênh lệch giữa tổng các mức phân tán tỷ suất sinh lợi kỳ vọng trong mô

hình đơn biến với mức phân tán tỷ suất sinh lợi kỳ vọng trong mô hình hai biến.

24

Chương 3.

PHƯƠNG PHÁP - DỮ LIỆU NGHIÊN CỨU

3.1 Mô hình thực nghiệm

3.1.1 Xác định tỷ suất sinh lợi ước tính theo phương pháp Fama - Macbeth

Tôi sử dụng phương pháp hồi quy Fama-Macbeth để đánh giá mức độ tăng thêm

của độ phân tán tỷ suất sinh lợi kỳ vọng khi thêm một biến mới vào mô hình. Như đã

nêu ở phần trước, tôi sẽ đánh giá hiệu ứng thêm biến mới vào mô hình thông qua các

giá trị tính toán liên quan đến tỷ suất sinh lợi kỳ vọng chính bằng giá trị tỷ suất sinh

lợi ước tính thu được từ mô hình hồi quy đơn biến và đa biến. Phương pháp Fama-

Macbeth được tôi áp dụng như một mô hình chuẩn mực được sử dụng trong các mô

hình định giá tài sản khi dữ liệu nghiên cứu có dạng bảng với hai bước như sau.

Đầu tiên, tôi tiến hành hồi quy chéo tỷ suất sinh lợi với các biến gồm: quy mô

(size), tỷ số giá sổ sách trên giá thị trường (B/M ratio), chỉ số xu hướng (momentum)

theo từng tháng trong giai đoạn 01/2009 - 10/2016 theo mô hình:

Ri = β1.Sizei + β2.B/Mi + β3.Momentumi + ∈i

Biến quy mô (Sizei) được xác định bằng hàm lô-ga-rít mức vốn hóa thị trường

của cổ phiếu. Biến tỷ số B/Mi được xác định bằng giá trị sổ sách chia cho giá trị thị

trường, với giá trị sổ sách B được cập nhật vào cuối tháng 6 mỗi năm sử dụng giá trị

sổ sách của năm tài khóa kết thúc vào năm trước đó. Cụ thể, tỷ số B/M sẽ được tính

bằng lô-ga-rít của giá trị sổ sách trừ đi lô-ga-rít của giá trị vốn hóa thị trường. Biến

chỉ số xu hướng (Momentumi) được đo lường tỷ suất sinh lợi cộng dồn của 11 tháng

tính từ tháng 2 đến tháng 12 (từ t-2 đến t-12). Dựa vào các nghiên cứu Jegadeesh

(1990), Jegadeesh and Titman (1995); tôi bỏ qua tháng một trong việc tính tỷ suất

sinh lợi cộng dồn để loại đi khả năng các biến độc lập bị đảo chiều về dấu.

Giá cổ phiếu được sử dụng để tính toán tỷ suất sinh lợi là giá đóng cửa điều

chỉnh tại ngày giao dịch cuối cùng của tháng được thu thập từ Sở Giao Dịch Chứng

Khoán Thành Phố Hồ Chí Mình (Hose). Các số liệu về số lượng cổ phiếu đang lưu

hành, giá trị sổ sách được thu thập trên các báo cáo tài chính của công ty.

25

Sau khi ước lượng mô hình theo dữ liệu chéo như bước một cho tất cả các tháng,

các chỉ số thống kê giá trị trung bình và t-statistic sẽ được tính toán để xem xét mức

độ ý nghĩa của từng biến. Hệ số t-statistic cao cho thấy biến giải thích trong mô hình

có ý nghĩa thống kê và ngược lại. Hệ số ước lượng bình quân của tỷ suất sinh lợi được

sử dụng để tính toán giá trị tỷ suất sinh lợi ước tính. Việc sử dụng hệ số ước lượng

bình quân để tính toán các giá trị ước tính thay vì hệ số ước lượng cụ thể ở từng tháng

cũng được đề cập trong nghiên cứu của Fama and French (2015). Điều này giúp cho

việc thực hiện kiểm định chính xác hơn vì kết quả thu được không bị tác động bởi

tính chu kỳ trong hoạt động của doanh nghiệp. Ví dụ, đối với những công ty đang

trong giai đoạn tăng trưởng thường có tỷ suất sinh lợi cao và khiến cho hệ số ước

lượng của biến này với tỷ số B/M là âm mặc dù hai biến này có tương quan dương.

Và nếu chúng ta thiết lập các danh mục dựa vào hệ số ước lượng theo tháng sẽ tồn tại

sự chênh lệch lớn giữa tỷ suất sinh lợi ước tính và tỷ suất sinh lợi thực tế.

3.1.2 Xác định tỷ suất sinh lợi danh mục theo ngũ phân vị

Để đo lường phần chéo của tỷ suất sinh lợi bình quân hàm ý trong mô hình hồi

quy, hàng tháng tôi xây dựng các danh mục ngũ phân vị với tỷ trọng các cổ phiếu

trong mỗi danh mục là bằng nhau dựa trên sự sắp xếp tỷ suất sinh lợi ước tính thu

được từ mô hình hồi quy. Tôi kiểm tra kết quả cho mẫu dữ liệu các cổ phiếu thu thập

từ Sàn Giao Dịch Chứng Khoán Thành Phố Hồ Chí Minh (Hose).

Như đã nêu, mục đích của bài nghiên cứu là xác định mức độ đóng góp tăng

thêm của một biến mới đưa vào mô hình đối với mức phân tán tỷ suất sinh lợi bình

quân. Mức phân tán tỷ suất sinh lợi bình quân ở đây là được xác định bằng chênh

lệch giữa tỷ suất sinh lợi bình quân của danh mục có tỷ suất sinh lợi cao nhất và danh

mục có tỷ suất sinh lợi thấp nhất khi phân chia các cổ phiếu thành thập phân vị theo

giá trị ước tính của biến phụ thuộc từ mô hình hồi quy.

Cụ thể, mỗi tháng, sau khi ước lượng mô hình, tôi sẽ phân chia dữ liệu thành 05

nhóm phân vị (có số lượng công ty bằng nhau) theo mức giảm dần đối với giá trị ước

tính của tỷ suất sinh lợi. Nhóm phân vị trên cùng sẽ là nhóm có tỷ suất sinh lợi ước

26

tính cao nhất và nhóm phân vị dưới cùng sẽ là nhóm có tỷ suất sinh lợi ước tính thấp

nhất. Sau đó, tôi tính được giá trị trung bình của tỷ suất sinh lợi ước tính đối với hai

nhóm phân vị cực trị (là nhóm phân vị có tỷ suất sinh lợi cao nhất và thấp nhất) theo

phương pháp bình quân. Từ đấy, tôi tính toán được mức phân tán tỷ suất sinh lợi ước

tính bình quân (average return spread) chính bằng chênh lệch giữa giá trị trung bình

của tỷ suất sinh lợi ước tính giữa hai nhóm phân vị cao nhất và thấp nhất.

3.2 Dữ liệu nghiên cứu

Chúng tôi ước lượng mô hình sử dụng dữ liệu của 300 công ty niêm yết trên

Sàn Giao Dịch Chứng Khoán Thành Phố Hồ Chí Minh trong giai đoạn 01/2009 -

10/2016. Giá cổ phiếu và các chỉ tiêu tài chính của công ty như giá trị vốn cổ phần,

số lượng cổ phiếu đang lưu hành sẽ được thu thập và đối chiếu với cơ sở dữ liệu của

Sở Giao Dịch Chứng Khoán Thành Phố Hồ Chí Minh nhằm phục vụ cho việc tính

toán các biến nghiên cứu. Các công ty thiếu thông tin để tính toán tỷ số B/M, quy mô

hoặc có các hệ số này âm sẽ bị loại khỏi mẫu nghiên cứu. Giá cổ phiếu dùng để tính

toán tỷ suất sinh lợi được xác định bằng giá đóng cửa của ngày giao dịch cuối cùng

trong tháng.

Bảng 3.1 Thống kê mô tả dữ liệu nghiên cứu

Biến Trung bình Số quan sát Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất

Tỷ suất sinh lợi 20,133 0.00 0.13 -1.06 1.64

Xu hướng sinh lời 20,133 -0.01 0.55 -2.80 3.33

Quy mô 20,133 26.85 1.56 22.70 33.09

Tỷ số B/M 20,133 1.19 0.95 -0.07 10.49

0.4

0.3

0.2

0.1

0 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

-0.1

-0.2

-0.3

27

Hình 3.1 Đồ thị tỷ suất sinh lợi bình quân của các công ty trên sàn Hose

28

27.5

27

26.5

26

25.5

25 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

giai đoạn 01/2009 - 10/2016 theo tháng

Hình 3.2 Đồ thị quy mô bình quân của các công ty trên sàn Hose

giai đoạn 01/2009 - 10/2016 theo tháng

2.5

2

1.5

1

0.5

0 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

28

Hình 3.3 Đồ thị tỷ số B/M bình quân của các công ty trên sàn Hose

1

0.5

0 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

-0.5

-1

-1.5

-2

giai đoạn 01/2009 - 10/2016 theo tháng

Hình 3.4 Đồ thị khuynh hướng sinh lời bình quân của các công ty

trên sàn Hose giai đoạn 01/2009 - 10/2016 theo tháng

29

Chương 4. KẾT QUẢ NGHIÊN CỨU

4.1 Kết quả nghiên cứu dựa trên mức độ phân tán tỷ suất sinh lợi

Phần này tôi sẽ trình bày thứ tự các bước chạy mô hình nghiên cứu về mức độ

phân tán tỷ suất sinh lợi và thảo luận các kết quả liên quan.

➢ Bước 1: Hồi quy biến tỷ suất sinh lợi với các biến giải thích

Tôi sẽ tiến hành hồi quy theo dữ liệu chéo cho từng tháng, trong đó biến phụ

thuộc là biến tỷ suất sinh lợi (Return) còn các biến giải thích gồm có: quy mô (size),

tỷ số B/M (bm ratio), khuynh hướng sinh lời (prior)] trong mô hình hồi quy đơn biến

và đa biến. Như vậy, lần lượt tôi sẽ thu được 3 mô hình hồi quy đơn biến, 3 mô hình

hồi quy hai biến và 1 mô hình hồi quy 3 biến.

Kết quả ước lượng của mô hình theo phương pháp Fama-Macbeth được tôi trình

bày trong bảng 4.1. Giá trị trung bình và hệ số thống kê t được trình bày lần lượt cho

bảy mô hình. 1

(1) size

(2) bm

(3) prior

(4) size + bm

(6) bm + prior

(7) 3 biến

(5) size + prior

size

Bảng 4.1 Kết quả ước lượng mô hình

0.003 (2.91)***

0.003 (2.45)**

bm

0.015 (7.78)***

-0.002 (1.80)* 0.017 (7.43)***

prior

-0.083

-0.015

0.008 (1.81)* 0.003

0.042

0.006 (1.34) -0.072

0.016 (8.88)*** -0.005 (1.21) -0.018

-0.002 (2.04)** 0.018 (9.46)*** -0.006 (1.31) 0.047

_cons

(2.55)**

(1.68)*

(0.52)

(1.31)

(2.22)**

(2.35)**

(1.43)

R2

0.02

0.04

0.03

0.06

0.05

0.06

0.08

N

20,133

20,133

20,133

20,133

20,133

20,133

20,133

* p<0.1; ** p<0.05; *** p<0.01

1 Tham khảo Bước 1 trong “Phụ Lục 1. Thao tác tính toán trên Stata”

30

Kết quả nghiên cứu cho thấy rằng: khi ước lượng riêng rẽ trong mô hình hồi

quy đơn biến thì các biến giải thích đều giải thích tốt cho tỷ suất sinh lợi bình quân.

Hệ số ước lượng và mức ý nghĩa thống kê đối với các biến quy mô, tỷ số B/M, khuynh

hướng sinh lời lần lượt mang giá trị (0.003; 1%), (0.015; 1%) và (0.008; 10%) và cả

ba đều có quan hệ cùng chiều đối với biến tỷ suất sinh lợi ước tính.

Tuy nhiên, khi tiến hành hồi quy đa biến thì tôi đã thu được nhiều kết quả đáng

lưu ý. Thứ nhất, biến tỷ số B/M luôn duy trì được mức ổn định cao trong hệ số ước

lượng và mức ý nghĩa thống kê qua các mô hình. Đối với mô hình hồi quy đơn biến

là giá trị (0.015; 1%), khi hồi quy 02 biến là giá trị (0.017; 1%) với biến giải thích là

size, b/m và giá trị (0.016; 1%) với biến giải thích là b/m, prior. Sau cùng là hồi quy

03 biến với giá trị (0.017; 1%).

Thứ hai, khi tiến hành thêm biến b/m vào mô hình có sẵn biến size và biến prior

đã ghi nhận sự thay đổi mạnh về dấu và độ lớn đối với hệ số ước lượng và mức ý

nghĩa thống kê. Cụ thể, đối với biến size, mô hình (4) và mô hình (7) cho thấy sự đảo

chiều về dấu trong hệ số ước lượng và mức ý nghĩa thống kê lần lượt còn 10% và 5%.

Tương tự, đối với biến prior, mô hình (6) và mô hình (7) cũng cho thấy sự đảo chiều

về dấu trong hệ số ước lượng. Đặc biệt, sự tồn tại của biến prior trong hai mô hình

này không còn ý nghĩa thống kê. Dấu âm trong giá trị ước lượng của biến size và biến

prior được giải thích dựa trên các nghiên cứu trước đây của Fama and French về định

giá tài sản bằng mô hình ba nhân tố. Đó là khi xuất hiện thêm biến tỷ số B/M, những

công ty có quy mô nhỏ sẽ có mức tỷ suất sinh lợi cao hơn so với những công ty có

quy mô lớn.

Tuy nhiên, từ kết quả nghiên cứu này đã mở ra hai vấn đề cần được lí giải. Vì

sao biến b/m qua các mô hình hồi quy vẫn duy trì được mức ổn định cao trong giá trị

hệ số ước lượng và mức ý nghĩa thống kê? Vì sao khi thêm biến b/m vào mô hình

gồm biến size và prior lại có thể gây ra tác động đảo chiều về dấu đối với hệ số ước

lượng hay thậm chí làm mất luôn ý nghĩa thống kê? Hai câu hỏi này chính là tiền đề

mở ra các bước nghiên cứu tiếp theo.

31

➢ Bước 2: Đo lường mức độ phân tán tỷ suất sinh lợi

Như đã đề cập ở phần phương pháp nghiên cứu, một trong những điểm mới của

bài nghiên cứu này chính là việc thiết lập được các danh mục ngũ phân vị theo cách

sắp xếp giá trị tỷ suất sinh lợi ước tính từ cao nhất đến thấp nhất ở mỗi mô hình. Từ

đó tính toán giá trị tỷ suất sinh lợi ước tính bình quân đại diện cho mỗi danh mục.

Việc đo lường mức độ phân tán thông qua chênh lệch tỷ suất sinh lợi ước tính bình

quân của nhóm phân vị lớn nhất và nhỏ nhất sẽ cho thấy mô hình chứa biến giải thích

nào sẽ có mức chênh lệch tỷ suất sinh lợi cao nhất và thấp nhất. 2

Bảng 4.2 Giá trị trung bình và thống kê t của mức độ phân tán tỷ suất sinh lợi

(1) size

(2) bm

(3) prior

(4) size + bm

(5) size + prior

(6) bm + prior

(7) 3 biến

μ

1.32% 3.30% 0.61% 3.21%

1.45%

3.34%

3.27%

σ

0.10% 0.80% 0.31% 0.88%

0.14%

0.86%

0.92%

t

12.86

4.10

1.99

3.65

10.49

3.89

3.54

Kết quả nghiên cứu cho thấy rằng: mức độ phân tán tỷ suất sinh lợi bình quân

là tương đối lớn và đều có ý nghĩa thống kê trong cả 7 mô hình. Trong đó, mức độ

phân tán bình quân nhỏ nhất là 0.61% đối với mô hình chỉ sử dụng biến prior (cột 3),

và mức độ phân tán bình quân lớn nhất là 3.34% đối với mô hình sử dụng biến tỷ số

B/M và xu hướng tỷ suất sinh lợi (cột 6). Tất cả 7 mô hình đều có độ lệch chuẩn thấp

chứng tỏ các giá trị ước lượng thu được nếu như có ý nghĩa thống kê sẽ có độ tin cậy.

Đồng thời, bảng 4.2 cũng đưa ra một điểm hết sức đáng lưu ý. Đó là, mô hình

nào có sử dụng tỷ số B/M làm biến giải thích (cột 2, cột 4, cột 6, cột 7) đều đem lại

mức độ phân tán tỷ suất sinh lợi xấp xỉ nhau và lớn hơn 3% cùng giá trị ý nghĩa thống

kê t luôn lớn hơn 3.5. Điều này cho thấy rằng biến tỷ số B/M có ý nghĩa rất mạnh

2 Tham khảo Bước 2 trong “Phụ Lục 1. Thao tác tính toán trên Stata”

32

trong việc giải thích tỷ suất sinh lợi cổ phiếu và lập luận này hoàn toàn tương đồng

0.07

0.06

0.05

0.04

0.03

0.02

0.01

0 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

spread.f(size)

spread.f(bmratio)

spread.f(prior)

spread.f(size&bmratio)

spread.f(size&prior)

spread.f(bmratio&prior)

spread.three variables

với những kết quả thu được từ bước 1.

Hình 4.1 Đồ thị mức độ phân tán tỷ suất sinh lợi

của 7 mô hình giai đoạn 01/2009 - 10/2016

Bên cạnh đó, để có cái nhìn rõ hơn về đường đi của mức độ chênh lệch tỷ suất

sinh lợi bình quân qua 7 mô hình, tôi cũng đã tiến hành phác họa hình 4.1 nhằm có

những nhận định cụ thể hơn. Kết quả thu được khi quan sát biểu đồ hoàn toàn trùng

lắp với các kết quả khi tiến hành tính toán mức độ phân tán tỷ suất sinh lợi bình quân.

Đường đi của mức chênh lệnh tỷ suất sinh lợi trong tất cả 4 mô hình có chứa biến tỷ

số b/m hầu như trùng lên nhau và có mức giá trị cao hơn hẳn so với các mô hình còn

lại. Điều này nói lên b/m có vai trò quyết định tác động đến mức độ phân tán trong

mỗi mô hình mà có chứa biến này. Trong khi đó, các mô hình (1), (3), (5) là những

mô hình không chứa biến b/m đều có mức độ chênh lệch thấp hơn hẳn.

33

Đặc biệt, mô hình (3) có biến giải thích là biến prior lại có mức độ chênh lệch

nhỏ hơn 0. Điều này có nghĩa là giá trị trung bình của nhóm phân vị có tỷ suất sinh

lợi cao nhất nhỏ hơn giá trị trung bình của nhóm phân vị có tỷ suất sinh lợi nhỏ nhất.

Chính điều này làm cho giá trị tỷ suất sinh lợi bình quân mang giá trị âm. Kết quả

này đã phần nào lý giải chi tiết cho câu hỏi tại sao khi thêm biến b/m vào mô hình (3)

chỉ gồm biến prior lại thu được giá trị ước lượng tỷ suất sinh lợi âm.

Đồng thời, một kết quả đáng lưu ý khác chính là sự thay đổi khi quan sát các

giá trị trung bình ước lượng chênh lệch tỷ suất sinh lợi bình quân thu được khi hồi

quy qua 7 mô hình. Cụ thể, xem xét riêng biến size, nếu như trong mô hồi quy đơn

biến thu được giá trị ước lượng tỷ suất sinh lợi bình quân là 1.32%, thì khi thêm biến

b/m trong mô hình (4) và mô hình (7) thì giá trị này tăng lên xấp xỉ lần lượt là 3.21%

và 3.27%. Trong khi đó, nếu như thêm biến prior trong mô hình (5) thì chỉ thu được

mức tăng nhỏ hơn rất nhiều là 1.45%. Và điều tương tự cũng xảy ra khi ta xem xét

riêng biến prior. Ngược lại, đối với biến b/m, khi đưa thêm các biến size và prior vào

thì đều làm cho mức chênh lệch tỷ suất sinh lợi bình quân tăng không đáng kể.

Từ những nhận định trên, để tìm hiểu rõ hơn về sự đóng góp của một biến mới

khi thêm vào mô hình hồi quy đơn biến, tôi sẽ tiến hành tính toán mức thay đổi trong

độ phân tán tỷ suất sinh lợi bình quân theo hai khía cạnh. Thứ nhất, trường hợp thêm

một biến mới vào mô hình hồi quy đơn biến. Thứ hai, trường hợp thêm một biến mới

vào mô hình hồi quy hai biến. Phần tiếp theo sẽ làm sáng tỏ vấn đề trên.

➢ Bước 3: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình

quân trong mô hình hai biến.

Ở bải nghiên cứu của Fama and French (2015), trong phần mô hình lý thuyết,

công thức số (9) đã chỉ ra có 2 cách để đo lường mức độ đóng góp tăng thêm của một

biến mới đến tỷ suất sinh lợi bình quân. Thứ nhất, đo lường theo chênh lệch độ phân

tán tỷ suất sinh lợi bình quân giữa mô hình đơn biến và mô hình hai biến (gồm 1 biến

trước đó và 1 biến mới được thêm vào). Thứ hai, sử dụng thêm hệ số tương quan để

34

ước lượng tỷ lệ phần trăm đóng góp của biến mới vào tỷ suất sinh lợi bình quân (

I2/R’ ). Dựa trên cơ sở lý thuyết này, tôi đã xây dựng cách tính toán như sau.

Bảng 4.3 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân

trong mô hình hai biến

I2/R'

I2/R'

*/R'

*/R'

*/R'

*/R'

R1

R2

R1

R2

Cách 1

ρ=0.55

ρ =0

Cách 1 ρ=0.55

ρ =0

-0.13

thêm B/M ratio vào Size thêm Size vào B/M ratio

0.03

μ 0.44 1.03 0.56 0.04 1.30 1.03 0.44 -0.03 -0.05

-3.90

σ 0.11 0.03 0.11 0.32 0.08 0.03 0.11 0.03 0.02

16.72 34.18

t 3.84 34.18 4.90 0.13 3.84 -1.09 -1.99

I2/R'

I2/R'

*/R'

*/R'

*/R'

*/R'

R1

R2

R1

R2

Cách 1

ρ=0.16

ρ =0

Cách 1 ρ=0.16

ρ =0

thêm Prior vào Size thêm Size vào Prior

μ 0.91 0.42 0.09 -0.05 0.21 0.42 0.91 0.18 0.48 0.51

σ 0.07 0.21 0.06 0.21 0.07 0.21 0.06 0.06

0.21 0.07 t 13.04 2.03 1.26

-0.23 3.43 2.03 13.04 2.77 7.90 8.43

I2/R'

I2/R'

R1*/R' R2*/R'

R1*/R'

R2*/R'

Cách 1

ρ=0.35

ρ =0

Cách 1 ρ=0.35

ρ =0

thêm Prior vào B/M ratio thêm B/M ratio vào Prior

-0.06

μ 0.99 0.20 0.01 0.06 0.20 0.99 0.80 0.97 1.19

-1.49

21.68

σ 0.04 0.03 0.04 0.12 0.04 0.12 0.10 0.05

0.12 0.04 t 26.12 1.67 0.23 2.12 1.67 26.12 6.91 9.73

*) chia cho độ

Hai cột đầu tiên trong mỗi mô hình ở bảng 4.3 trình bày mức độ phân tán tỷ

* và R2

suất sinh lợi đối với mô hình chỉ sử dụng một trong hai biến (R1

phân tán tỷ suất sinh lợi khi sử dụng đồng thời cả hai biến (R’). Cột thứ ba trình bày

35

*) / R’.

giá trị đóng góp tăng thêm của biến mới khi đưa vào mô hình theo cách thứ nhất,

được đo lường bằng tỷ lệ I2/R’= (R’- R1

Cột thứ 4 và thứ 5 lần lượt trình bày giá trị đóng góp tăng thêm của một biến

mới theo phương thức có tính đến mức độ tương quan giữa các biến giải thích trong

mô hình hồi quy. Cột thứ 4 được tính dựa trên hệ số tương quan mẫu (tính toán từ dữ

liệu nghiên cứu) và cột thứ 5 được tính dựa trên giả định hệ số tương quan bằng 0.

Kết quả nghiên cứu cho thấy rằng, ở tất cả các mô hình thì tổng giá trị của hai

cột đầu luôn lớn hơn 1. Điều này ám chỉ rằng: tổng mức độ phân tán tỷ suất sinh lợi

của các mô hình mà tỷ suất sinh lợi được giải thích bằng các biến riêng lẻ luôn lớn

hơn mức độ phân tán tỷ suất sinh lợi của mô hình mà tỷ suất sinh lợi được giải thích

đồng thời bằng tất cả các biến. Điều này cũng giống với các kết quả trong nghiên cứu

trước đây của Fama and French (2006) hay Lewellen (2011) và điểm chung trong các

bài nghiên cứu này là đều chưa giải thích được tại sao khi đem hồi quy đồng thời các

biến giải thích có tác động mạnh đến tỷ suất sinh lợi lại chỉ thu về một giá trị tỷ suất

sinh lợi bình quân ước tính thấp hơn so với tổng giá trị tỷ suất sinh lợi bình quân ước

tính trong mỗi mô hình đơn biến. Tuy nhiên, các bước tiếp theo trong bài nghiên cứu

này sẽ lý giải cho vấn đề trên.

❖ Xét về phương diện đo lường mức độ đóng góp tăng thêm của một biến

mới đến tỷ suất sinh lợi bình quân theo chênh lệch độ phân tán tỷ suất sinh lợi bình

quân giữa mô hình đơn biến và mô hình hai biến 3

Đối với biến tỷ số B/M, trong hai trường hợp lần lượt thêm biến B/M vào mô

hình đơn biến gồm mỗi biến size và biến prior, thì đều thu về tỷ số giá trị ước lượng

tăng thêm (I2/R’) cao hơn hẳn so với các trường hợp còn lại, lần lượt là 0.56 và 0.8.

Đối với biến size, trong hai trường hợp lần lượt thêm biến size vào mô hình đơn biến

gồm mỗi biến B/M và biến prior, thì lại thu về tỷ số I2/R’ thấp hơn so với khi thêm

biến B/M rất nhiều, lần lượt là -0.03 và 0.18. Tuy nhiên, giá trị -0.03 lại không còn

3 Tham khảo Bước 3 – Mục A trong “Phụ Lục 1. Thao tác tính toán trên Stata”

36

mang ý nghĩa thống kê. Và cũng tương tự như biến size, đối với biến prior cũng thu

về I2/R’ thấp hơn nhiều so với khi thêm biến B/M, lần lượt là 0.01 (khi thêm prior vào

B/M) và 0.09 (khi thêm prior vào size).

Kết quả này cũng ủng hộ cho các kết quả thu được ở bước 1 và bước 2. Do B/M

là biến có khả năng giải thích mạnh hơn so với biến size và prior nên khi thêm biến

B/M vào phương trình hồi quy đơn biến gồm mỗi biến size và prior thì sẽ làm gia

tăng mức đóng góp tăng thêm trong độ phân tán tỷ suất sinh lợi bình quân. Ngược

lại, đối với biến size và prior là các biến không có mức giải thích tốt bằng biến B/M

thì khi thêm biến size hoặc prior vào phương trình hồi quy đơn biến chỉ gồm biến

B/M sẽ chịu tác động lấn át từ biến B/M nên phần gia tăng trong độ phân tán thu được

không đáng kể. Đặc biệt, khi tác động lấn át từ biến B/M quá mạnh sẽ làm cho tỷ số

I2/R’ trở nên rất nhỏ và thậm chí mất luôn ý nghĩa thống kê. Lập luận này cũng góp

phần giải thích rõ thêm về trường hợp mất ý nghĩa thống kê trong bước 1 được trình

bày ở phần trên.

❖ Xét về phương diện đo lường mức đóng góp tăng thêm của một biến

mới đến tỷ suất sinh lợi bình quân trong trường hợp dùng hệ số tương quan 4

∗ đo lường tác động của

Thông qua dữ liệu có được tôi tiến hành tính toán hệ số tương quan (𝜌) giữa các

biến giải thích và áp dụng công thức 𝑰𝟐 = 𝑹′ − (𝒃𝟏 + 𝝆𝒃𝟐)𝑿𝟏 một biến khi thêm biến đó vào phương trình hồi quy. Đồng thời, tôi cũng xem xét

cho trường hợp giả định khi không tồn tại sự tương quan giữa các biến giải thích với

nhau (𝜌 = 0) và so sánh giữa ba trường hợp này đâu là trường hợp có mức đóng góp

lớn nhất đến tỷ suất sinh lợi bình quân.

Về mặt tổng quát, bảng kết quả nghiên cứu dẫn đến những nhận định rõ ràng.

Thứ nhất, trường hợp không tồn tại độ tương quan giữa các biến giải thích hầu hết

mang đến mức tăng I2 vượt trội hơn so với các trường hợp còn lại. Đồng thời, giá trị

thống kê t thu được trong trường hợp này cũng duy trì ở mức cao hơn nhiều. Nguyên

4 Tham khảo Bước 3 – Mục B trong “Phụ Lục 1. Thao tác tính toán trên Stata”

37

nhân của điều này là vì hai biến độc lập khi không bị ràng buộc bởi hệ số tương quan

thì phần đóng góp tăng thêm do hai biến đó tạo ra sẽ không chịu tác động lấn án phục

thuộc lẫn nhau. Khi đó, hai biến càng có mức giải thích tốt cho tỷ suất sinh lợi thì

càng gia tăng khả năng thu được mức tỷ suất sinh lợi kỳ vọng bình quan cao hơn và

ngược lại.

Thứ hai, trường hợp có tồn tại độ tương quan giữa các biến giải thích lại thu về

mức đóng góp gia tăng ít hơn. Tồn tại thực tế trên là bởi các biến độc lập có mức

tương quan càng cao thì ảnh hưởng phụ thuộc và tác động qua lại giữa chúng càng

lớn. Cụ thể, trong mô hình đơn biến, một biến được xem là có mức giải thích rất mạnh

cho tỷ suất sinh lợi sẽ ngay lập tức bị giảm tác động khi đưa thêm một biến khác vào

mô hình hồi quy để kiểm định. Vì đóng góp tăng thêm của biến độc lập ban đầu lúc

này sẽ chịu tác động lấn át từ phần đóng góp của biến độc lập mới do giữa hai biến

tồn tại mức tương quan với nhau. Nếu tồn tại sự tương quan dương, thì hệ số tương

quan càng lớn sẽ đem đến tác động lấn át càng lớn và ngược lại.

Thứ ba, tỷ số I2/R2 trong trường hợp hệ số tương quan giữa các biến độc lập bằng 0 hầu hết vượt trội hơn so với khi tồn tại hệ số tương quan đưa tôi đến nhận định

rằng: tồn tại tác động lấn át sẽ đi kèm theo tác động pha loãng của các biến độc lập.

Hai biến có thể có thể làm gia tăng mạnh tỷ suất sinh lợi bình quân khi chúng không

hề chịu tác động ràng buộc nào và khi xuất hiện mức tương quan giữa hai biến độc

lập thì phần gia tăng này sẽ bị giảm xuống. Tuy nhiên, vấn đề đặt ra là giữa hai biến

độc lập thì biến nào là biến mang lại sự gia tăng chính cho tỷ suất sinh lợi và làm thế

nào để đo lường cụ thể thì “Bước 5. Đo lường sự pha loãng biến” sẽ làm rõ hơn cho

câu hỏi này.

Về mặt chi tiết, bảng kết quả nghiên cứu giúp tôi đưa ra một số nhận xét sau.

Đối với biến tỷ số B/M: mức độ đóng góp tăng thêm trung bình của biến B/M

khi thêm vào mô hình có biến quy mô lần lượt là 0.04 (khi hệ số tương quan mẫu

trung bình là 0.55) và 1.30 (khi giả định hệ số tương quan bằng 0). Trong khi đó, đối

38

với mô hình có biến prior thì biến B/M mang đến sự gia tăng trong tỷ số I2/R2 cao hơn, lần lượt là 0.97 (khi tồn tại hệ số tương quan) và 1.19 (khi không có độ tương

quan). Và khi quan sát các trường hợp còn lại thì việc thêm B/M vào mô hình đơn

biến gồm chỉ biến size hoặc prior mang lại mức gia tăng tỷ suất sinh lợi cao hơn hẳn

so với các trường hợp còn lại. Điều này đưa tôi đi đến giả thuyết rằng: thứ tự tăng

dần mức độ giải thích của biến độc lập đối với biến phụ thuộc sẽ là: prior, size và

B/M. Bởi vì mức gia tăng tỷ suất sinh lợi bình quân khi thêm biến B/M vào mô hình

chỉ có biến prior lớn hơn so với mô hình chỉ có biến size. Do đó, tác động lấn át của

biến B/M đối với biến prior sẽ mạnh hơn đối với biến size. Hay nói cách khác, biến

prior có mức giải thích cho tỷ suất sinh lợi không tốt bằng biến size và biến B/M.

Đối với biến size, biến prior cũng cho những nhận định đồng thuận. Cụ thể, mức

độ đóng góp tăng thêm trung bình của biến size khi đưa vào mô hình chỉ có biến tỷ

số B/M trước đó lần lượt là -0.05 và -0.13. Mức đóng góp tăng thêm âm này của biến

quy mô có thể được lý giải bởi độ mạnh của biến tỷ số B/M trong việc giải thích cho

biến tỷ suất sinh lợi và hệ số tương quan khá lớn của hai biến này (ρ=0.55). Việc đưa

thêm biến quy mô vào mô hình đã có biến tỷ số B/M không làm tăng mức độ giải

thích cho tỷ suất sinh lợi cổ phiếu.

Hệ số tương quan bình quân giữa biến quy mô và biến xu hướng sinh lời là 0.16.

Đóng góp tăng thêm của biến size khi thêm vào mô hình sử dụng biến prior trong

trường hợp tồn tại hệ số tương quan mẫu là 0.48 và trong trường hợp giả định hệ số

tương quan bằng 0 là 0.51. Trường hợp khi thêm biến prior vào mô hình sử dụng biến

size, đóng góp tăng thêm của biến prior tăng lên đáng kể (từ -0.05 lên 0.21) khi giả

định hệ số tương quan bằng 0.

Hệ số tương quan bình quân giữa biến tỷ số B/M và khuynh hướng sinh lời là

0.35. Đóng góp tăng thêm của biến tỷ số B/M khi thêm vào mô hình trong trường hợp

sử dụng hệ số tương quan mẫu là 0.97 và trong trường hợp giả định hệ số tương quan

bằng 0 là 1.19. Mức đóng góp này của biến tỷ số B/M là khá lớn thể hiện độ mạnh

39

của biến tỷ số B/M so với biến khuynh hướng sinh lời trong việc giải thích tỷ suất

sinh lợi cổ phiếu.

Mức đóng góp tăng thêm trong trường hợp sử dụng hệ số tương quan mẫu có xu

hướng nhỏ hơn so với mức đóng góp tăng thêm với giả định hệ số tương quan giữa

hai biến bằng 0. Khi biến mới thêm vào mô hình không tương quan với biến sẵn có,

những thông tin hàm chứa trong biến này là hoàn toàn mới và do đó sẽ tăng mức độ

giải thích cho biến phụ thuộc.

➢ Bước 4: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình

quân trong mô hình ba biến

Phần trên đây tôi vừa tiến hành đo lường mức gia tăng của biến mới khi xem xét

trong mô hình hồi quy hai biến. Trong phần này, tôi sẽ xem xét vấn đề này trong mô

hình ba biến. 5

Hai cột đầu tiên của bảng 4.4 là giá trị mức độ phân tán tỷ suất sinh lợi của mô

hình hai biến và mô hình của biến thứ ba. Cả hai đều chia cho giá trị mức độ phân tán

tỷ suất sinh lợi của mô hình hồi quy sử dụng đồng thời cả ba biến.

Tương tự như kết quả ở bảng 4.3, tổng giá trị của hai cột này luôn lớn hơn 1.

Giá trị đóng góp tăng thêm của biến khuynh hướng sinh lời (prior) đối với mô hình

đã có biến quy mô và tỷ số B/M là 0.01 trong khi giá trị đóng góp tăng thêm của biến

quy mô chỉ là -0.03. Đóng góp của từng biến này vào mô hình hai biến là không có ý

nghĩa thống kê với giá trị thống kê lần lượt là 0.37 và -1.04. Giá trị đóng góp tăng

thêm lớn nhất là của biến tỷ số B/M đạt 0.52 và có ý nghĩa thống kê ở mức 1%, điều

này càng khẳng định mức độ quan trọng của tỷ số B/M trong việc giải thích cho tỷ

suất sinh lợi cổ phiếu đối với mẫu là các công ty niêm yết trên Sàn Giao Dịch Chứng

Khoán Thành Phố Hồ Chí Minh.

5 Tham khảo Bước 4 trong “Phụ Lục 1. Thao tác tính toán trên Stata”

∗/𝑅′ sẽ cung cấp thêm bằng chứng

40

Ngoài ra, khi so sánh về độ lớn giữa hệ số 𝑅1

∗ đại diện cho mức chênh lệch tỷ suất

về dự đoán B/M chính là yếu tố giải thích mạnh hơn nhiều cho tỷ suất sinh lợi so với

hai biến size và prior. Trong trường hợp này, 𝑅1 sinh lợi bình quân trong mô hình hai biến, còn 𝑅′ đại diện cho mức chênh lệch tỷ suất

∗ 𝑅1 𝑅′ = 0.99 khi thêm biến prior vào mô hình hai biến, có thể nhận thấy rằng: mức đóng góp tăng thêm của biến prior

sinh lợi bình quân trong mô hình ba biến. Với giá trị

∗ 𝑅1 𝑅′ = 1.03 khi thêm biến size vào mô hình hai biến còn chứng minh rằng: mô hình hai biến gồm biến B/M và prior còn

trong tỷ suất sinh lợi là rất ít. Ngoài ra, với giá trị

thu được mức tỷ suất sinh lợi bình quân cao hơn so với khi thêm biến size vào mô

∗ 𝑅1 𝑅′ = 0.48 lại mang đến kết quả trái ngược. Đó là minh chứng rõ ràng cho việc khi thêm biến B/M vào mô hình hai biến gồm biến size và prior đã

hình. Tuy nhiên, giá trị

tạo ra tỷ suất sinh lợi vượt trội hơn so với hai trường hợp còn lại. Điều này hoàn toàn

phù hợp với các nhận định trên về khả năng giải thích mạnh cho tỷ suất sinh lợi bình

quân của tỷ số B/M.

Bảng 4.4 Mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình quân

trong mô hình ba biến

Thêm biến prior vào Thêm biến B/M vào Thêm biến size vào

*/R'

*/R'

*/R'

FV(size,B/M ) FV(size,prior) FV(B/M,prior)

*/R' R2

*/R' R2

*/R' R2

R1 I2/R' R1 I2/R' R1 I2/R'

μ 0.99 0.20 0.01 0.48 1.02 0.52 1.03 0.44 -0.03

σ 0.04 0.12 0.04 0.15 0.05 0.15 0.03 0.12 0.03

t 27.42 1.66 0.37 3.27 21.09 3.52 37.75 3.71 -1.04

Hai bước 3 và 4 vừa trình bày trên đây đã giải thích rất kĩ về tác động tăng thêm

của biến khi xem xét trong mô hình hồi quy hai biến và đa biến. Qua đó, câu hỏi

41

nghiên cứu về tác động của biến mới đã được làm sáng tỏ rằng: bản thân các biến độc

lập trong mô hình hồi quy đơn biến có thể tự mình giải thích tốt cho tỷ suất sinh lợi.

Nhưng khi đưa thêm một biến mới vào mô hình thì tỷ suất sinh lợi có thể gia tăng rất

mạnh nếu biến đó là b/m và ngược lại, tỷ suất sinh lợi cũng có thể gia tăng không

đáng kể nếu biến đó là size hay đặc biệt là prior. Và nghiên cứu của Fama and French

(2015) đã tìm ra lời giải cho câu hỏi này: đó là mối tương quan giữa tác động khuyếch

đại và pha loãng của biến độc lập. Phần tiếp theo sẽ làm rõ hơn về vấn đề này.

➢ Bước 5: Đánh giá sự pha loãng biến.

Trước khi bàn về kết quả nghiên cứu, tôi sẽ phân tích rõ hơn về mối quan hệ

giữa sự khuyếch đại (Variable Amplification) và sự pha loãng (Variable Attenuation)

biến độc lập.

Hình 4.2 Tác động khuyếch đại và pha loãng của biến độc lập

Giả định trong mô hình hồi quy đơn biến gồm chỉ có biến X1 , sau khi tính toán

giá trị ước lượng tỷ suất sinh lợi bình quân của tất cả các mã cổ phiếu cho từng tháng,

tôi tiến hành sắp xếp các giá trị này thành 5 nhóm phân vị có số lượng cổ phiếu bằng

nhau theo thứ tự từ cao nhất đến thấp nhất. Sau đó, tôi sẽ thu được giá trị trung bình

của hai nhóm phân vị cao nhất và thấp nhất theo phương pháp bình quân không trọng

∗ (mức chênh lệch kỳ vọng giữa giá trị

42

số. Từ đấy, mỗi tháng tôi thu được giá trị 𝑿𝟏

∗ (độ phân tán tỷ suất sinh lợi bình quân trong

trung bình của biến X1 ứng với nhóm danh mục phân vị cao nhất và thấp nhất trong

mô hình hồi quy đơn biến) và giá trị 𝑹𝟏

trong mô hình hồi quy đơn biến).

Bây giờ tôi tiến hành thêm biến X2 vào phương trình và kiểm định liệu việc

thêm biến có làm tăng mức chênh lệch tỷ suất sinh lợi bình quân. Và kết quả thu được

đã giúp tôi chứng minh được tồn tại đồng thời hai tác động khuyếch đại và pha loãng

biến độc lập. Cụ thể, khi tôi thêm biến X2 vào phương trình và tiến hành hồi quy đã

tác động đến độ phân tán tỷ suất sinh lợi bình quân thông qua việc thay đổi các cổ

phiếu trong nhóm danh mục có tỷ suất sinh lợi ước tính lớn nhất và nhỏ nhất. Trong

phương trình đơn biến, danh mục có tỷ suất sinh lợi bình quân cao sẽ tối đa hóa giá

trị bình quân của biến X1 nếu độ dốc trong phương trình hồi quy là cùng chiều, hoặc

tối thiểu hóa nếu ngược chiều. Trong khi đó, với mô hình hồi quy hai biến, danh mục

có tỷ suất sinh lợi bình quân cao được hình thành từ việc: thay thế những cổ phiếu

đang có X1 cao, X2 thấp bằng những cổ phiếu có X1 thấp hơn nhưng X2 cao hơn. Đối

′ (mức

với danh mục có tỷ suất sinh lợi bình quân thấp thì sẽ tiến hành ngược lại. Và đó là

′ , 𝑿𝟐

nguyên nhân giải thích vì sao trong mô hình hai biến xuất hiện hai giá trị 𝑿𝟏

chênh lệch kỳ vọng giữa giá trị trung bình của biến X1, X2 ứng với nhóm danh mục

ngũ phân vị cao nhất và thấp nhất trong mô hình hồi quy hai biến).

Kết quả từ biện pháp thay thế này sẽ làm gia tăng mức chênh lệch tỷ suất sinh

′ị), nhưng đồng thời cũng làm giảm độ phân tán của biến X1 (vì giá

lợi kỳ vọng thông qua việc tăng độ phân tán của biến X2 giữa hai danh mục cực hạn

′ lúc này nhỏ hơn X1). Vì vậy, tác động làm gia tăng độ phân tán của biến X2

(cụ thể là giá tr𝑋2

trị 𝑋1

được xem là tác động khuếch đại. Trong khi đó, tác động làm giảm bớt độ phân tán

của biến X1 được hiểu là tác động pha loãng.

Bảng 4.5 trình bày kết quả tính toán tỷ lệ độ phân tán của biến độc lập khi ước

lượng riêng lẽ và khi thêm biến mới vào mô hình.6 Cụ thể, đối với mỗi biến, cột thứ

6 Tham khảo Bước 5 trong “Phụ Lục 1. Thao tác tính toán trên Stata”

43

nhất và cột thứ hai thể hiện tỷ lệ độ phân tán của biến đó được hình thành từ các danh

mục sắp xếp dựa trên tỷ suất sinh lợi ước tính từ mô hình hai biến (một biến mới được

thêm vào). Khi đó, cột thứ ba sẽ thể hiện tỷ lệ độ phân tán của biến đó từ các danh

mục được hình thành dựa trên tỷ suất sinh lợi ước tính từ mô hình ba biến (hai biến

mới được thêm vào).

Đối với biến quy mô, kết quả cho thấy: khi thêm biến mới vào mô hình thì mức

độ phân tán của biến quy mô giảm đi đáng kể. Mức độ phân tán giảm đi 74% và 12%

khi lần lượt thêm biến tỷ số B/M và biến xu hướng sinh lời vào mô hình. Khi thêm

đồng thời cả hai biến này thì mức độ phân tán giảm đi 79%. Các mức phân tán tăng

thêm này đều có ý nghĩa thống kê với giá trị thống kê t lần lượt là 3.35; 21.35 và 1.74.

Bảng 4.5 Tỷ lệ pha loãng biến

Quy mô Tỷ số B/M Xu hướng sinh lời

𝐸𝑄4 𝐸𝑄1 𝐸𝑄5 𝐸𝑄1 𝐸𝑄7 𝐸𝑄1 𝐸𝑄4 𝐸𝑄2 𝐸𝑄6 𝐸𝑄2 𝐸𝑄7 𝐸𝑄2 𝐸𝑄5 𝐸𝑄3 𝐸𝑄6 𝐸𝑄3 𝐸𝑄7 𝐸𝑄3

μ 0.26 0.88 0.21 0.95 0.98 0.91 0.62 0.18 0.14

σ 0.08 0.04 0.12 0.02 0.02 0.05 0.11 0.17 0.17

t 3.35 21.35 1.74 43.96 64.18 17.40 5.87 1.10 0.81

Điều tương tự cũng xảy ra đối với biến prior, thêm biến mới vào mô hình thì

mức phân tán của biến prior giảm mạnh hơn so với biến quy mô. Mức độ phân tán

giảm đi 38% và 82% khi lần lượt thêm biến quy mô và tỷ số B/M vào mô hình. Khi

thêm đồng thời cả hai biến này thì mức độ phân tán giảm đi 86%. Tuy nhiên khác với

hai biến trên, mức giảm mức độ phân tán của biến xu hướng sinh lời chỉ có ý nghĩa

thống kê trong trường hợp thêm biến quy mô vào mô hình với giá trị thống kê t đạt

5.87 (tương ứng với 1%), các trường hợp còn lại mức giảm này đều không có ý nghĩa

thống kê với giá trị thống kê lần lượt là 1.10 và 0.81.

44

Và điểm chung trong kết quả thu được từ hai nhóm chỉ số quy mô và khuynh

hướng sinh lợi chính là mỗi khi thêm biến b/m thì mức độ pha loãng luôn mạnh hơn

nhiều so với các trường hợp còn lại. Đó chính là do bản thân biến b/m đã có khả năng

′ cao hơn. Đồng thời, tác động này

giải thích mạnh hơn so với hai biến còn lại nên khi thêm biến b/m vào hình thì b/m

′ nhỏ hơn nhiều so với giá trị ban đầu X1. Chính điều này đã lí

giải thích tốt hơn nên sinh ra giá trị tăng thêm 𝑋2

cũng làm cho giá trị 𝑋1

giải cho kết quả pha loãng đối với nhóm hai biến quy mô và khuynh hướng sinh lời

trong trường hợp thêm biến b/m luôn lớn hơn so với hai trường hợp còn lại.

Mặt khác, đối với biến tỷ số B/M, khi thêm biến mới vào mô hình thì mức độ

phân tán của biến này không thay đổi đáng kể. Mức độ phân tán giảm đi 5% và 2%

khi ta thêm lần lượt riêng lẻ biến quy mô, biến xu hướng sinh lời vào mô hình. Đồng

thời, mức độ phân tán của biến tỷ số B/M trong trường hợp thêm vào cả hai biến cũng

giảm với mức độ rất thấp (giảm 9%). Các mức giảm này đều có ý nghĩa thống kê với

tỷ số thống kê t lớn, lần lượt là 43.96; 64.18 và 17.4 và đều có ý nghĩa thống kê ở

mức 1%.

Trên đây tôi vừa trả lời cho câu hỏi nghiên cứu vì sao việc đưa thêm một biến

có ảnh hưởng đến tỷ suất sinh lợi nhưng lại không làm gia tăng giá trị độ phân tán tỷ

suất sinh lợi bình quân thông qua kết quả của tác động pha loãng biến và khuyếch đại

biến. Tuy nhiên, phương pháp này chỉ được tính toán dựa trên việc xem xét giá trị

của 2 nhóm phân vị cao nhất và thấp nhất. Phần tiếp theo sẽ đưa ra cái nhìn tổng thể

hơn khi tính toán đồng thời cả 5 nhóm phân vị.

➢ Bước 6: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong

trường hợp mô hình hai biến.

Mức độ chênh lệch tỷ suất sinh lợi được đo lường bằng tổng mức độ phân tán

tỷ suất sinh lợi của hai mô hình đơn biến trừ đi mức độ phân tán của mô hình kết hợp

đồng thời cả hai biến để giải thích cho tỷ suất sinh lợi của cổ phiếu (return gap). Với

mỗi mô hình hai biến, giá trị ước tính tỷ suất sinh lợi từ mô hình hồi quy sẽ được sử

45

dụng để tính toán các kết quả nghiên cứu liên quan. Dựa trên cơ sở này, tôi tiến hành

5

4

3

2

1

0 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

-1

spread.size model7

spread.size model5

spread.size model4

spread.size model1

tính toán mức độ chênh lệch kỳ vọng của từng biến qua các mô hình hồi quy.

4

3

2

1

0 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

-1

-2

spread.prior model7

spread.prior model6

spread.prior model5

spread.prior model3

Hình 4.3 Mức độ chênh lệch biến quy mô trong các mô hình

Hình 4.4 Mức độ chênh lệch biến khuynh hướng sinh lời trong các mô hình

4

3.5

3

2.5

2

1.5

1

0.5

0 2009m1

2010m1

2011m1

2012m1

2013m1

2014m1

2015m1

2016m1

spread.bm model7

spread.bm model6

spread.bm model4

spread.bm model2

46

Hình 4.5 Mức độ chênh lệch biến tỷ số B/M trong các mô hình

Hai biểu đồ về độ phân tán của biến quy mô và biến khuynh hướng sinh lời đưa

ra một số đặc điểm cần lưu ý. Thứ nhất, từ mô hình đơn biến cho đến mô hình hai

biến và sau cùng là mô hình ba biến thì mức độ phân tán giảm mạnh tiến gần về mức

0, thậm chí có thời kỳ mang giá trị âm. Thứ hai, mỗi khi đưa thêm biến tỷ số b/m vào

phương trình hồi quy thì ngay lập tức tác động pha loãng xảy ra rất mạnh chính là

nguyên nhân làm cho giá trị độ phân tán giảm sâu. Nhận định này hoàn toàn đồng

nhất với các kết quả nghiên cứu thu được từ các bước kiểm định trước đó. Ngoài ra,

đây cũng là nhân tố củng cố thêm cho giả thuyết tỷ số b/m chính là yếu tố mạnh nhất

quyết định tỷ suất sinh lợi kỳ vọng bình quân.

Trái ngược với hai biến quy mô và khuynh hướng sinh lợi, biểu đồ chênh lệch

biến tỷ số b/m luôn duy trì ổn định qua các thời kỳ khi tiến hành hồi quy trong phương

trình đơn biến, hai biến và ba biến. Ngoài ra, giá trị độ phân tán mà biến b/m thể hiện

luôn mang giá trị dương chứng tỏ biến b/m luôn làm tăng giá trị chênh lệch tỷ suất

sinh lợi kỳ vọng mỗi khi được đưa vào mô hình.

Sau khi nhận xét tổng quan về biểu đồ diễn biến mức độ phân tán của các biến

độc lập qua các thời kỳ khi tiến hành hồi quy hai biến và ba biến, tôi sẽ đưa ra đánh

47

giá chi tiết về giá trị độ lớn ước tính chênh lệch tỷ suất sinh lợi trong mô hình hai biến

(return gap). Bài nghiên cứu của Fama and French (2015) đã chỉ ra có hai cách để

tính toán giá trị return gap.

∗ − 𝑹′

Thứ nhất, theo chênh lệch tỷ suất sinh lợi bình quân giữa các phương trình.

∗ + 𝑹𝟐

𝑹𝒆𝒕𝒖𝒓𝒏 𝑮𝒂𝒑 = 𝑹𝟏

′ )]

Thứ hai, theo sự kết hợp giữa tác động pha loãng độ dốc và pha loãng biến.7

∗ + 𝒃𝟏𝑿𝟐

∗ ) + [𝒃𝟏(𝑿𝟏

∗ − 𝑿𝟏

′ ) + 𝒃𝟐(𝑿𝟐

∗ − 𝑿𝟐

𝑹𝒆𝒕𝒖𝒓𝒏 𝒈𝒂𝒑 = 𝝆(𝒃𝟐𝑿𝟏

Kết quả nghiên cứu trong bảng 4.6 đã đề cập đến mức độ chênh lệch tỷ suất

sinh lợi khi ước tính bằng hệ số tương quan và các thành phần cấu thành nên giá trị

này (bao gồm mức độ pha loãng biến và mức độ pha loãng hệ số ước lượng).

Đối với hai biến tỷ số b/m và quy mô, mức độ chênh lệch tỷ suất sinh lợi trong

mô hình sử dụng hai biến này được tính toán theo cách thứ nhất mang giá trị 1.40%.

Điều này cho thấy tổng mức độ phân tán tỷ suất sinh lợi của hai mô hình ước lượng

riêng lẻ hai biến độc lập (quy mô và tỷ số B/M) lớn hơn mức độ phân tán tỷ suất sinh

lợi khi ước lượng đồng thời cả hai biến này. Giá trị thống kê t của mức chênh lệch tỷ

suất sinh lợi này đạt giá trị 7.71 cho thấy sự khác biệt này có ý nghĩa thống kê mạnh.

Trong khi đó, nếu phân tích mức độ chênh lệch tỷ suất sinh lợi dựa trên các yếu

tố cấu thành nên nó bao gồm sự pha loãng biến và sự pha loãng hệ số ước lượng thì

kết quả nghiên cứu thu được không có nhiều sự khác biệt. Mức độ pha loãng hệ số

ước lượng đạt 3.47% với hệ số tương quan bình quân giữa biến quy mô và tỷ số B/M

xấp xỉ 0.55 (tương đối cao) cho thấy rằng mức độ pha loãng hệ số ước lượng của biến

tỷ số B/M lớn hơn mức độ pha loãng hệ số ước lượng của biến quy mô. Điều này xuất

phát từ sự đối lập về dấu đối với hệ số ước lượng của hai biến này trong phương trình

tỷ suất sinh lợi cổ phiếu như đã trình bày trong cột 4 bảng 4.2. Mức độ pha loãng

biến đạt -0.50% cho thấy sự thay đổi trong độ phân tán của biến quy mô giữa mô hình

7 Tham khảo Bước 6 trong “Phụ Lục 1. Thao tác tính toán trên Stata”

48

một biến và mô hình thêm biến tỷ số B/M là lớn hơn so với sự thay đổi trong mức độ

phân tán của biến tỷ số B/M giữa mô hình một biến và mô hình thêm biến quy mô.

Tổng hai mức độ phân tán này đạt 2.96% cho thấy việc thêm biến vào mô hình giúp

giải thích tốt hơn cho tỷ suất sinh lợi.

Bảng 4.6 Kết quả ước tính chênh lệch tỷ suất sinh lợi

trong mô hình hai biến

Pha loãng

size + bm Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng

μ 1.40% 3.47% -0.50% 2.96%

σ 0.18% 0.55% 0.05% 0.53%

t 7.71 6.27 -9.55 5.58

Pha loãng

size + prior Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng

μ 0.48% 0.45% 0.40% 0.84%

σ 0.28% 0.43% 0.08% 0.37%

t 1.68 1.04 5.22 2.30

Pha loãng

bm + prior Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng

μ 0.57% 0.28% 0.64% 0.92%

σ 0.34% 0.20% 0.14% 0.25%

t 1.66 1.37 4.47 3.64

49

Đối với hai biến quy mô và xu hướng sinh lời, mức độ chênh lệch tỷ suất sinh

lợi đối với mô hình sử dụng hai biến này đạt 0.48%. Khi sử dụng hệ số tương quan

để tính toán thì mức độ phân tán tỷ suất sinh lợi đạt 0.84% trong đó mức độ pha loãng

hệ số ước lượng là 0.45% và mức độ pha loãng biến là 0.40%. Hệ số tương quan bình

quân của biến quy mô và xu hướng sinh lời đạt 0.16, các giá trị ước lượng của cả hai

biến này trong mô hình tỷ suất sinh lợi (bảng 4.1, cột 5) đều dương cho thấy hệ số

ước lượng của hai biến này khi ước lượng đồng thời đã giảm đi so với khi ước lượng

riêng lẻ. Các mức chênh lệch đều có ý nghĩa thống kê trừ trường hợp pha loãng hệ số

ước lượng với giá trị thống kê t chỉ đạt 1.04.

Trong trường hợp mô hình nghiên cứu sử dụng hai biến tỷ số B/M và xu hướng

sinh lời để giải thích cho tỷ suất sinh lợi, mức độ chênh lệch đạt 0.57% cho thấy rằng

tổng mức độ phân tán tỷ suất sinh lợi của hai mô hình ước lượng riêng lẻ lớn hơn

mức độ phân tán tỷ suất sinh lợi khi sử dụng đồng thời cả hai biến. Khi sử dụng hệ

số tương quan bình quân để tính toán thì mức độ chênh lệch tỷ suất sinh lợi đạt 0.92%;

trong đó mức độ pha loãng hệ số ước lượng là 0.28% và mức độ pha loãng biến là

0.64%. Tất cả các mức độ chênh lệch đều có ý nghĩa thống kê với giá trị t lớn, trừ

trường hợp pha loãng hệ số ước lượng với giá trị thống kê t đạt 1.37. Một điểm đáng

lưu ý khi thêm biến tỷ số B/M vào mô hình đã có biến quy mô và ngược lại thì hệ số

pha loãng biến là âm (-0.50%) với mức ý nghĩa thống kê 1% (t=9.55). Điều này

chuyển sự pha loãng trở thành sự phóng đại. Lập luận này phù hợp với kết quả ước

lượng khi hệ số ước lượng của biến quy mô chuyển dấu từ 0.003 khi ước lượng riêng

lẻ (bảng 4.1, cột 1) sang -0.002 khi thêm biến tỷ số B/M vào mô hình (bảng 4.1, cột

4). Kết quả của sự chuyển dấu này khiến sự pha loãng biến trở thành phóng đại biến.

Nhìn chung, các kết quả tính toán mức độ chênh lệch tỷ suất sinh lợi (return

gap) khi xem xét trên cả 5 nhóm danh mục phân vị theo hai cách thu được kết quả

tương đương nhau. Trong đó, mô hình chứa đựng tỷ số quy mô và tỷ số b/m mang lại

mức chênh lệch tỷ suất sinh lợi cao nhất. Kết quả này hoàn toàn phù hợp với những

50

nhận định trên đây. Phần tiếp theo sẽ đo lường mức độ chênh lệch tỷ suất sinh lợi khi

tiến hành hồi quy 3 biến.

➢ Bước 7: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong

trường hợp mô hình ba biến.

Đối với mô hình sử dụng cả ba biến để giải thích cho tỷ suất sinh lợi, mức độ

chênh lệch tỷ suất sinh lợi được tính toán bằng độ phân tán tỷ suất sinh lợi của mô

hình hai biến và độ phân tỷ suất sinh lợi của mô hình chứa biến còn lại trừ đi độ phân

tán tỷ suất sinh lợi mô hình cả ba biến.8

Bảng 4.7 trình bày kết quả chênh lệch tỷ suất sinh lợi ước tính khi sử dụng mức

độ phân tán tỷ suất sinh lợi lẫn khi sử dụng hệ số ước lượng bình quân giữa giá trị tỷ

suất sinh lợi ước tính từ mô hình hai biến với biến còn lại. Các thành phần cấu thành

nên sự chênh lệch tỷ suất sinh lợi khi ước tính bằng hệ số tương quan được trình bày

ở cột 2 và cột 3 với từng mô hình.

Đối với mô hình sử dụng biến quy mô và biến tỷ số B/M để giải thích cho tỷ

suất sinh lợi cổ phiếu, khi thêm vào biến xu hướng sinh lời sẽ tạo ra một sự chênh

lệch tỷ suất sinh lợi đạt 0.56%. Điều này hàm ý rằng, tổng mức độ phân tán tỷ suất

sinh lợi của mô hình hai biến và mô hình chỉ chứa biến xu hướng sinh lời lớn hơn

mức độ phân tán tỷ suất sinh lợi của mô hình khi sử dụng đồng thời cả ba biến này.

Khi phân tích dựa vào hệ số tương quan bình quân giữa biến xu hướng sinh lời

và giá trị ước tính tỷ suất sinh lợi trong mô hình ước lượng với hai biến còn lại, ta

thấy mức độ pha loãng hệ số ước lượng đạt 1.58% trong khi hệ số pha loãng biến là

-0.56% và khiến cho tổng chênh lệch tỷ suất sinh lợi đạt 1.03%. Hệ số pha loãng biến

âm được lý giải bởi hệ số ước lượng của biến xu hướng sinh lời trong phương trình

sử dụng đồng thời cả ba biến để giải thích cho tỷ suất sinh lợi là âm. Điều này cho

thấy rằng mặc dù việc đưa hai biến mới vào mô hình đã có sẵn biến xu hướng sinh

8 Tham khảo Bước 7 trong “Phụ Lục 1. Thao tác tính toán trên Stata”

51

lời sẽ làm cho mức độ phân tán của biến này giảm đi nhưng lại tạo ra tác động phóng

đại thay vì pha loãng biến.

Bảng 4.7 Kết quả ước tính chênh lệch tỷ suất sinh lợi

trong mô hình ba biến

Pha loãng

μ

Fv(size,B/M) và prior Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng

σ

0.56% 1.58% -0.56% 1.03%

t

0.33% 0.21% 0.12% 0.19%

1.68 7.66 -4.57 5.26

Pha loãng

μ

Fv(size,prior) và B/M Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng

σ

1.48% -0.59% 0.32% -0.27%

t

0.28% 0.14% 0.12% 0.25%

5.22 -4.10 2.44 -1.06

Pha loãng

μ

Fv(B/M,prior) và size Chênh lệch tỷ suất sinh lợi Biến Tổng Hệ số ước lượng

σ

1.39% 2.33% -0.81% 1.53%

t

0.18% 0.18% 0.15% 0.13%

7.72 12.88 -5.39 11.33

52

Đóng góp này làm giảm một phần mức chênh lệch tỷ suất sinh lợi giữa các mô

hình ước lượng riêng lẻ so với mô hình ước lượng sử dụng đồng thời cả ba biến. Các

giá trị chênh lệch được lý giải ở trên đều có ý nghĩa thống kê với giá trị t lớn.

Đối với trường hợp thêm biến tỷ số B/M vào mô hình đã tồn tại các biến quy

mô, xu hướng sinh lời, mức độ chênh lệch tỷ suất sinh lợi đạt 1.48%. Điều này cho

thấy rằng, tổng độ phân tán tỷ suất sinh lợi của mô hình sử dụng biến tỷ số B/M và

mô hình sử dụng hai biến còn lại lớn hơn mức độ phân tán tỷ suất sinh lợi khi sử dụng

đồng thời cả ba biến này. Mức chênh lệch này có ý nghĩa thống kê với giá trị t đạt

5.22. Khi xem xét mức độ chênh lệch dựa vào hệ số tương quan và các yếu tố cấu

thành, kết quả từ cột 2 đến cột 4 cho thấy mức độ pha loãng hệ số ước lượng của biến

độc lập là -0.59% trong khi mức độ pha loãng biến độc lập là 0.32%.

Hai tác động đối nghịch này khiến cho mức độ chênh lệch tỷ suất sinh lợi tính

theo hệ số tương quan giữa biến tỷ số B/M và giá trị tỷ suất sinh lợi ước tính từ mô

hình sử dụng hai biến còn lại đạt -0.27%. Mức độ pha loãng hệ số ước lượng mang

dấu âm trong khi dấu của biến tỷ số B/M dương và hệ số tương quan của hai yếu tố

này là dương cho thấy dấu của giá trị tỷ suất sinh lợi ước tính đã đổi dấu khi đưa thêm

biến tỷ số B/M vào mô hình. Mức độ pha loãng biến mang dấu dương cho thấy rằng

hệ số ước lượng của biến tỷ số B/M trong phương trình tỷ suất sinh lợi cổ phiếu không

hề đổi dấu khi ước lượng một mình hay khi thêm hai biến còn lại vào mô hình. Mặc

dù có sự khác biệt về dấu giữa mức độ chênh lệch tỷ suất sinh lợi khi ước tính đơn

giản và khi ước tính sử dụng hệ số tương quan nhưng sự khác biệt này dường như lại

không có ý nghĩa thống kê để giải thích cho sự thay đổi mức độ phân tán tỷ suất sinh

lợi khi thêm biến mới vào mô hình.

Đối với trường hợp thêm biến quy mô vào mô hình đã sử dụng hai biến còn lại

là tỷ số B/M và xu hướng sinh lời để giải thích cho tỷ suất sinh lợi thì kết quả tính

toán cho thấy một sự tương đồng với trường hợp thêm biến xu hướng sinh lời vào mô

hình. Mức độ chênh lệch tỷ suất sinh lợi trong trường hợp này đạt 1.39%. Điều này

được diễn giải rằng tổng mức độ phân tán tỷ suất sinh lợi của mô hình sử dụng hai

53

biến giải thích và mô hình sử dụng biến còn lại lớn hơn so với mô hình ước lượng sử

dụng đồng thời cả ba biến này. Giá trị chênh lệch này khi sử dụng hệ số tương quan

bình quân giữa biến xu hướng sinh lời và giá trị tỷ suất sinh lợi ước tính từ mô hình

ước lượng sử dụng hai biến còn lại là 1.53%. Cả hai giá trị này đều có ý nghĩa thống

kê mạnh với các giá trị t lần lượt là 7.72 và 11.33.

Khi phân tích mức độ chênh lệch dựa vào hệ số tương quan và các yếu tố cấu

thành, kết quả cho thấy rằng tồn tại mối quan hệ trái chiều giữa mức độ pha loãng hệ

số ước lượng và mức độ pha loãng biến. Mức độ pha loãng hệ số ước lượng trong

trường hợp này đạt 2.33% trong khi mức độ pha loãng biến đạt -0.81%. Mức độ pha

loãng biến mang dấu âm khi thêm biến quy mô vào mô hình sử dụng hai biến còn lại

trước đó có thể được giải thích tương tự như đối với biến xu hướng sinh lời. Kết quả

ước lượng trong bảng 4.1 được trình bày ở phần trước cho thấy rằng hệ số ước lượng

của biến quy mô có sự đổi dấu khi thêm hai biến còn lại vào mô hình. Ta dễ dàng

nhận thấy rằng sự lấn át của biến tỷ số B/M trong việc giải thích cho tỷ suất sinh lợi

là nguyên nhân chính dẫn đến sự đổi dấu này. Cả mức độ pha loãng hệ số ước lượng

và hệ số pha loãng biến đều có ý nghĩa thống kê 1% với giá trị thống kê t khá lớn (lớn

hơn 5).

Phần nghiên cứu trên đây vừa trình bày kết quả tính toán mức độ chênh lệch tỷ

suất sinh lợi (return gap) trong phương trình hồi quy ba biến khi xem xét trên cả 5

nhóm danh mục phân vị theo hai cách thu được kết quả tương đương nhau. Các kết

quả này cũng tương tự như khi xem xét trong phương trình hai biến, trong đó tỷ số

b/m được ghi nhận đóng vai trò then chốt trong việc tạo ra tỷ suất sinh lợi tăng thêm.

Tóm lại, thông qua bảy bước nghiên cứu vừa trình bày, tôi đã trả lời được hai

vấn đề sau. Thứ nhất là đóng góp của biến mới trong việc dự đoán mức tỷ suất sinh

lợi. Thứ hai là vì sao khi đưa các biến có ảnh hưởng đến tỷ suất sinh lợi bình quân

vào phương trình hồi quy lại không làm gia tăng mức độ phân tán tỷ suất sinh lợi bình

quân. Nguyên nhân chính nằm ở sự tồn tại của hai tác động pha loãng hệ số ước lượng

của biến độc lập và tác động pha loãng biến độc lập. Mặc dù biến mới đưa thêm vào

54

mô hình đã tạo nên phần giá trị tăng thêm nhưng hai tác động pha loãng biến này đã

làm giảm đi mức chênh lệch tỷ suất sinh lợi bình quân của cả danh mục. Tất cả bảy

bước trên đều nghiên cứu dựa trên ý tưởng tạo ra danh mục ngũ phân vị bằng nhau.

Tuy nhiên, thực tế tồn tại vấn đề mà các nhà đầu tư quan tâm chính là ý nghĩa

thực tế của việc đưa thêm biến mới vào để dự đoán tỷ suất sinh lợi kỳ vọng. Phần

nghiên cứu tiếp theo sẽ sử dụng phương pháp kiểm định thống kê GRS để trả lời cho

câu hỏi này.

4.2 Kết quả nghiên cứu dựa trên phương pháp kiểm định GRS

Phương pháp kiểm định thống kê GRS xuất hiện trong nghiên cứu của Gibbon,

Ross and Shanken (1989) được sử dụng khá phổ biến trên thế giới để kiểm định: liệu

một mô hình định giá tài sản có giải thích tốt cho tỷ suất sinh lợi cổ phiếu. Giả thuyết

kiểm định được hầu hết các mô hình định giá tài sản thực hiện là liệu hệ số chặn trong

mô hình hồi quy tỷ suất sinh lợi vượt trội lên các nhân tố tỷ suất sinh lợi danh mục

có bằng 0 hay không.

Ý tưởng trong bài nghiên cứu của Gibbon, Ross and Shanken (1989) chỉ ra rằng

giả thiết này có thể được kiểm định thông qua việc trả lời câu hỏi liệu hệ số Sharpe

tối đa mà một nhà đầu tư có thể thiết lập chỉ dựa vào các danh mục bên vế phải của

phương trình hồi quy có thấp hơn đáng kể so với hệ số Sharpe tối đa mà một nhà đầu

tư thiết lập dựa vào cả các danh mục vế trái và danh mục vế phải. Nói cách khác,

danh mục tiếp điểm hiệu quả trung bình - phương sai (mean-variance efficient

tangency portfolio) được tạo ra bởi các danh mục bên vế phải có sinh ra danh mục

tiếp điểm hiệu quả trung bình - phương sai được xây dựng sử dụng cả danh mục vế

trái lẫn danh mục vế phải. Đó là phương pháp kiểm định GRS truyền thống.

Trong bài nghiên cứu này, tôi cũng sử dụng chỉ số thống kê GRS và hệ số Sharpe

tối ưu điều chỉnh để kiểm định xem liệu việc thêm vào một biến mới được biết là có

liên quan tới tỷ suất sinh lợi bình quân có làm tăng các cơ hội đầu tư được tạo ra từ

các biến liên quan đến tỷ suất sinh lợi bình quân đã biết trước đó không. Và theo bài

55

nghiên cứu của Fama and French (2015), nhóm tác giả đã tiến hành kiểm định dựa

trên phương trình hồi quy hai biến. Sau đó, tác giả tiến hành đưa thêm một biến mới

vào phương trình để kiểm định xem liệu việc thêm biến có làm gia tăng mức độ chênh

lệch tỷ suất sinh lợi kỳ vọng bình quân. Tuy nhiên, do bài nghiên cứu này được thực

hiện dựa trên ý tưởng xây dựng danh mục nhóm năm phân vị bằng nhau, khác với

nghiên cứu gốc của Gibbon, Ross and Shanken (1989) nên phần tiếp theo tôi sẽ đề

cập chi tiết phương pháp GRS cho nhóm danh mục ngũ phân vị.

Hình 4.6 Minh họa phương pháp kiểm định thống kê GRS

Giả định rằng: tôi đang xem xét trường hợp thêm biến khuynh hướng sinh lời

vào phương trình hồi quy hai biến gồm biến tỷ số b/m và biến quy mô (phương trình

4). Thứ nhất, mỗi tháng tôi sẽ tiến hành tính toán giá trị ước lượng tỷ suất sinh lợi

bình quân và sắp xếp theo thứ tự từ lớn nhất đến nhỏ nhất đối với phương trình hồi

quy hai biến. Khi đó, nhóm mang giá trị ước lượng tỷ suất sinh lợi bình quân cao nhất

sẽ được ký hiệu là nhóm 1 và nhóm mang giá trị ước lượng tỷ suất sinh lợi bình quân

thấp nhất sẽ được ký hiệu là nhóm 5 và có số lượng các cổ phiếu bằng nhau. Sau 94

tháng, tôi sẽ thu được 94 nhóm danh mục ngũ phân vị trong phương trình hai biến.

Thực hiện tương tự, tôi cũng sẽ thu được 94 nhóm danh mục ngũ phân vị trong

56

phương trình gồm cả ba biến quy mô, tỷ số b/m và khuynh hướng sinh lợi. Một điểm

cần nhấn mạnh rằng: các giá trị tính toán mức chênh lệch tỷ suất sinh lợi kỳ vọng ước

tính từ hai phương trình hồi quy là hoàn toàn khác nhau nên khả năng bị trùng dữ liệu

hoàn toàn có thể loại trừ.

Thứ hai, đối với phương trình hồi quy hai biến gồm biến quy mô và biến size

(phương trình 4), tôi tiến hành gộp các danh mục phân vị 1 lại thành nhóm. Như vậy,

sau 94 tháng, tôi sẽ thu được một nhóm gồm 94 phân vị 1. Đây chính là 94 giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1 qua 94 tháng (kí hiệu 𝑌̂1,4,𝑡 – được

hiểu là phân vị 1 của phương trình 4 theo kỳ t).

Với cách làm tương tự khi áp dụng cho phương trình trình hồi quy gồm cả ba

biến (phương trình 7), tôi sẽ thu được 94 giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1 qua 94 tháng (kí hiệu 𝑌̂1,7,𝑡 – được hiểu là phân vị 1 của phương

trình 7 theo kỳ t).

Thứ ba, xây dựng phương trình hồi quy để thực hiện kiểm định GRS. Tôi sẽ tiến

hành hồi quy giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1 trong

phương trình 7 theo giá trị ước lượng tỷ suất sinh lợi kỳ vọng của nhóm phân vị 1

trong phương trình 4.

𝒀̂𝟏,𝟕,𝒕 = 𝜷. 𝒀̂𝟏,𝟒,𝒕 + 𝜶𝟏 + 𝜺𝟏

Khi đó, 𝛼1 là hệ số chặn, 𝛽 là hệ số góc, 𝜀1 là phần dư của phương trình. Cũng

theo các bước tiến hành như trên, tôi tiến hành tiến toán các giá trị ước lượng tỷ suất

sinh lợi cho 4 nhóm phân vị còn lại và thu được thêm 4 phương trình kiểm định GRS

như sau:

𝒀̂𝟐,𝟕,𝒕 = 𝜷. 𝒀̂𝟐,𝟒,𝒕 + 𝜶𝟐 + 𝜺𝟐

𝒀̂𝟑,𝟕,𝒕 = 𝜷. 𝒀̂𝟑,𝟒,𝒕 + 𝜶𝟑 + 𝜺𝟑

𝒀̂𝟒,𝟕,𝒕 = 𝜷. 𝒀̂𝟒,𝟒,𝒕 + 𝜶𝟒 + 𝜺𝟒

𝒀̂𝟓,𝟕,𝒕 = 𝜷. 𝒀̂𝟓,𝟒,𝒕 + 𝜶𝟓 + 𝜺𝟓

57

Đến đây, tôi sẽ tiến hành thực hiện kiểm định thống kê GRS với giả định là

𝜶𝟏 = 𝜶𝟐 = 𝜶𝟑 = 𝜶𝟒 = 𝜶𝟓 = 𝟎. Nếu như kết quả kiểm định thu được là bác bỏ giả

thuyết thống kê, nghĩa là tồn tại giá trị 𝛼𝑖 > 0 thì nghĩa là việc thêm biến mới làm gia

tăng tỷ suất sinh lợi kỳ vọng mà nhà đầu tư mong muốn. Đây có thể xem là một công

cụ để nhà đầu tư có thể ra quyết định xây dựng danh mục cổ phiếu của mình.

Phần trên là toàn bộ quy trình xây dựng phương trình kiểm định thống kê GRS

đối với trường hợp thêm biến khuynh hướng sinh lời vào phương trình hồi quy hai

biến gồm biến tỷ số b/m và biến quy mô (phương trình 4). Và cách làm hoàn toàn

tương tự đối với trường hợp thêm biến tỷ số b/m vào phương trình hồi quy hai biến

gồm biến khuynh hướng sinh lời và biến quy mô (phương trình 5), cũng như trường

hợp thêm biến quy mô vào phương trình hồi quy hai biến gồm biến khuynh hướng

sinh lời và biến tỷ số b/m (phương trình 6). Phần công thức và phương pháp tính toán

giá trị thống kê GRS sẽ được trình bày theo công thức trong “Phụ Lục 2. Tính giá

trị thống kê GRS”.

Bảng 4.8 Kiểm định GRS

Mô hình GRS statistic p-value

size + bm 951 0.00

size + prior 45.3 0.00

bm + prior 523 0.00

Kết quả kiểm định theo phương pháp GRS trình bày trong bảng 4.8 cho thấy

rằng việc thêm bất kỳ biến nào vào mô hình đã gồm hai biến còn lại đều cải thiện hệ

số Sharpe của danh mục hiệu quả. Giá trị p-value cho kiểm định GRS ở cả ba mô

hình đều xấp xỉ bằng 0, nghĩa là ta sẽ bác giả thuyết thống kê hay nói cách khác là

tồn tại giá trị 𝛼𝑖 > 0.

Việc hệ số thống kê GRS tương đối lớn trong các mô hình cho thấy rằng khi

thêm một biến bất kỳ vào mô hình hai biến còn lại thì mức độ biến động trong phần

dư của mô hình 3 biến là nhỏ hơn rất nhiều lần so với mức độ biến động của tỷ suất

58

sinh lợi vượt trội trong mô hình 2 biến. Lý giải này hoàn toàn hợp lý khi khẳng định

rằng việc đưa thêm biến mới vào mô hình giúp cải thiện đáng kể danh mục biên. Tóm

lại, việc thực hiện kiểm định thống kê GRS đã đưa đến kết luận rằng, các phương

trình hồi quy hai biến (phương trình 4, 5, 6) khi thêm biến mới vào đều làm gia tăng

tỷ suất sinh lợi kỳ vọng bình quân. Tuy nhiên, không phải tất cả trường hợp đều làm

tăng mạnh giá trị độ phân tán. Vì gia tăng tỷ suất sinh lợi luôn đi kèm với tác động

pha loãng kép đã được trình bày trong quy trình bảy bước của bài nghiên cứu này.

59

Chương 5. KẾT LUẬN

5.1 Kết luận chung từ kết quả nghiên cứu

Có rất nhiều nghiên cứu trước đây về mô hình định giá tài nhằm tìm kiếm các

biến mới có thể giải thích tốt hơn cho tỷ suất sinh lợi kỳ vọng bình quân. Tuy nhiên,

chưa có nhiều nghiên cứu giải thích được nguyên nhân vì sao khi đưa tất cả các biến

độc lập có tác động đến tỷ suất sinh lợi vào phương trình hồi quy lại chỉ làm gia tăng

lượng nhỏ độ phân tán. Thông qua việc dựa trên nghiên cứu chính của nhóm tác giả

Fama and French (2015), bài nghiên cứu này đã trả lời được câu hỏi này.

Thứ nhất, các biến mới đưa vào mô hình có thể tương quan dương với các biến

sẵn có, điều này dẫn đến sự pha loãng hệ số ước lượng. Thứ hai, sự tồn tại đồng thời

hai tác động pha loãng hệ số ước lượng của biến độc lập và tác động pha loãng biến

độc lập. việc đưa một biến mới có mức độ giải thích cao vào mô hình sẽ pha loãng

giá trị của các biến sẵn có trong các danh mục cực trị (nhóm danh mục phân vị cao

nhất và thấp nhất). Sự pha loãng biến này khiến đóng góp tăng thêm của biến mới

đưa vào nhỏ đi. Cho nên, các biến mới đưa thêm vào mô hình dù tạo ra phần giá trị

tăng thêm nhưng hai tác động pha loãng này đã làm giảm đi mức chênh lệch tỷ suất

sinh lợi bình quân của cả danh mục.

Đồng thời, thông qua việc xây dựng nhóm danh mục ngũ phân vị, bài nghiên

cứu đã thiết lập được phương thức tính toán giá trị độ phân tán của tỳ suất sinh lợi kỳ

vọng bình quân nhưng đồng thời cũng chứng minh được tồn tại chỉ số đánh giá chất

lượng biến giải thích tốt hơn. Đó là mức đóng góp tăng thêm của biến mới vào độ

phân tán tỷ suất sinh lợi so với những biến đã được sử dụng trong mô hình trước đó

thông qua phương pháp kiểm định GRS. Điều này giúp cho nhà đầu tư có thể biết

được liệu việc thêm biến mới vào hồi quy có làm tăng giá trị tỷ suất sinh lợi mong

muốn cũng như tính toán được mức gia tăng cụ thể.

Bên cạnh đó, bài nghiên cứu cũng đã chứng minh được khi tiến hành hồi quy tỷ

suất sinh lợi cổ phiếu với ba biến quy mô, tỷ số b/m và khuynh hướng sinh lời thì

60

biến tỷ số b/m có tác động gia tăng mạnh nhất. Tất cả các mô hình hồi quy chứa biến

tỷ số b/m đều mang lại mức giải thích cho tỷ suất sinh lợi cao hơn nhiều so với hai

biến còn lại. Dựa trên kết quả này, tôi có thể đưa ra đề xuất xây dựng danh mục cổ

phiếu cho các nhà đầu tư như sau. Nếu giá trị độ phân tán tỷ suất sinh lợi là dương,

nhà đầu tư sẽ chọn các cổ phiếu trong nhóm phân vị cao nhất để xem xét lựa chọn.

Và thứ tự lựa chọn ưu tiên sẽ là theo biến tỷ số b/m, biến quy mô và cuối cùng là biến

khuynh hướng sinh lợi. Giả sử như trong nhóm phân vị cao nhất, nhà đầu tư sẽ chọn

ra các cổ phiếu có tỷ số b/m cao nhất trước. Sau đó, trong các cổ phiếu này sẽ chọn

ra các cổ phiếu có quy mô nhỏ để đầu tư vì các nghiên cứu trước của Fama and French

(2006) đã chứng minh được rằng cổ phiếu có tỷ số b/m càng cao, quy mô càng thấp

thì khả năng đạt được mức tỷ suất sinh lợi kỳ vọng mong muốn là cao hơn. Điểm ưu

việt trong cách đầu tư này chính là việc giới hạn số lượng các công ty được lọc thông

qua danh mục phân vị cực trị.

5.2 Hạn chế nghiên cứu

Bài nghiên cứu chưa tiến hành khảo sát đối với các yếu tố còn lại có tác động

đến tỷ suất sinh lợi đã được chứng minh qua mô hình năm nhân tố trong nghiên cứu

của Fama and French (2013) nên chưa thể có nhận định xác đáng nhất về giá trị độ

phân tán tỷ suất sinh lợi tạo ra và độ mạnh của các biến độc lập trong việc tạo ra giá

trị tăng thêm khi đưa thêm biến đó vào mô hình hồi quy.

DANH MỤC TÀI LIỆU THAM KHẢO

Davis, James L., Eugene F. Fama, and Kenneth R. French. "Characteristics,

covariances, and average returns: 1929 to 1997." The Journal of Finance 55.1 (2000):

389-406.

Fama, Eugene F., and James D. MacBeth. "Risk, return, and equilibrium:

Empirical tests." Journal of political economy 81.3 (1973): 607-636.

Fama, Eugene F., and Kenneth R. French. "Common risk factors in the returns

on stocks and bonds." Journal of financial economics 33.1 (1993): 3-56.

Fama, Eugene F., and Kenneth R. French. "Dissecting anomalies with a five-

factor model." Review of Financial Studies 29.1 (2016): 69-103.

Fama, Eugene F., and Kenneth R. French. "Incremental variables and the

investment opportunity set." Journal of Financial Economics 117.3 (2015): 470-488.

Fama, Eugene F., and Kenneth R. French. "Multifactor explanations of asset

pricing anomalies." The journal of finance 51.1 (1996): 55-84.

Fama, Eugene F., and Kenneth R. French. "Profitability, investment and

average returns." Journal of Financial Economics 82.3 (2006): 491-518.

Fama, Eugene F., and Kenneth R. French. "The cross‐section of expected

stock returns." the Journal of Finance 47.2 (1992): 427-465.

Fama, Eugene F., and Kenneth R. French. "The cross‐section of expected

stock returns." the Journal of Finance 47.2 (1992): 427-465.

Gibbons, Michael R., Stephen A. Ross, and Jay Shanken. "A test of the

efficiency of a given portfolio." Econometrica: Journal of the Econometric

Society (1989): 1121-1152.

Jegadeesh, Narasimhan. "Evidence of predictable behavior of security

returns." The Journal of Finance 45.3 (1990): 881-898.

Jensen, Michael C., Fischer Black, and Myron S. Scholes. "The capital asset

pricing model: Some empirical tests." (1972).

Jonathan Lewellen. "Institutional investors and the limits of arbitrage." The

Journal of Financial Economics 102 (2011) 62–80.

PHỤ LỤC

Phụ lục 1. Thao tác tính toán trên Stata

Phụ lục 2. Tính giá trị thống kê GRS

Phụ lục 1. Thao tác tính toán trên Stata

1. Bước 1: Hồi quy biến tỷ suất sinh lợi với các biến giải thích

- Nhập dữ liệu excel vào stata.

- Chạy do-file “format from excel”

encode stock,gen(nfirm)

drop date

gen date=ym(year,month)

format date %tm

xtset nfirm date

- Chạy do-file “table4.1.1”

*gen variable as coefficient:

*reg return size

*gen beta=_b[size]

* set up panel data

xtset nfirm date,monthly

*run fama-macbeth for each of 3 variables

xtfmb return size

gen bsize1=_b[size]

outreg using table1fmb,ctitles("",(1)) starlevels(10,5,1) replace

xtfmb return bmratio

gen bbm2=_b[bmratio]

outreg using table1fmb,ctitles("",(2)) starlevels(10,5,1) merge

xtfmb return prior

gen bprior3=_b[prior]

outreg using table1fmb,ctitles("",(3)) starlevels(10,5,1) merge

* fama-macbeth for 2 of 3 variables

xtfmb return size bmratio

gen bsize4=_b[size]

gen bbm4=_b[bmratio]

outreg using table1fmb,ctitles("",(4)) starlevels(10,5,1) merge

xtfmb return size prior

gen bsize5=_b[size]

gen bprior5=_b[prior]

outreg using table1fmb,ctitles("",(5)) starlevels(10,5,1) merge

xtfmb return bmratio prior

gen bbm6=_b[bmratio]

gen bprior6=_b[prior]

outreg using table1fmb,ctitles("",(6)) starlevels(10,5,1) merge

*fama-macbeth for all 3 variables

xtfmb return size bmratio prior

gen bsize7=_b[size]

gen bbm7=_b[bmratio]

gen bprior7=_b[prior]

outreg using table1fmb,ctitles("",(7)) starlevels(10,5,1) merge

- Xuất dữ liệu ra Bảng 4.1 Kết quả ước lượng mô hình, lưu file là

“table4.1.1result”.

2. Bước 2: Đo lường mức độ phân tán tỷ suất sinh lợi

- Dựa trên file dataset “table4.1.1result”, tiếp tục chạy do-file “table4.1.2”

*gen spread_1

xtset nfirm date

xtfmb return size

predict rhat1

egen quintile1=xtile(rhat1),by(date) nq(5)

bysort date quintile1:egen ew1=mean(rhat1)

gen mquintile1=-quintile1

sort date quintile1

bysort date:gen min1=ew1[1]

sort date mquintile1

bysort date:gen max1=ew1[1]

gen spread1=max1-min1

*gen spread_2

xtset nfirm date

xtfmb return bmratio

predict rhat2

egen quintile2=xtile(rhat2),by(date) nq(5)

bysort date quintile2:egen ew2=mean(rhat2)

gen mquintile2=-quintile2

sort date quintile2

bysort date:gen min2=ew2[1]

sort date mquintile2

bysort date:gen max2=ew2[1]

gen spread2=max2-min2

*gen spread_3

xtset nfirm date

xtfmb return prior

predict rhat3

egen quintile3=xtile(rhat3),by(date) nq(5)

bysort date quintile3:egen ew3=mean(rhat3)

gen mquintile3=-quintile3

sort date quintile1

bysort date:gen min3=ew3[1]

sort date mquintile3

bysort date:gen max3=ew3[1]

gen spread3=max3-min3

*gen spread_4

xtset nfirm date

xtfmb return size bmratio

predict rhat4

egen quintile4=xtile(rhat4),by(date) nq(5)

bysort date quintile4:egen ew4=mean(rhat4)

gen mquintile4=-quintile4

sort date quintile4

bysort date:gen min4=ew4[1]

sort date mquintile4

bysort date:gen max4=ew4[1]

gen spread4=max4-min4

*gen spread_5

xtset nfirm date

xtfmb return size prior

predict rhat5

egen quintile5=xtile(rhat5),by(date) nq(5)

bysort date quintile5:egen ew5=mean(rhat5)

gen mquintile5=-quintile5

sort date quintile5

bysort date:gen min5=ew5[1]

sort date mquintile5

bysort date:gen max5=ew5[1]

gen spread5=max5-min5

*gen spread_6

xtset nfirm date

xtfmb return bmratio prior

predict rhat6

egen quintile6=xtile(rhat6),by(date) nq(5)

bysort date quintile6:egen ew6=mean(rhat6)

gen mquintile6=-quintile6

sort date quintile6

bysort date:gen min6=ew6[1]

sort date mquintile6

bysort date:gen max6=ew6[1]

gen spread6=max6-min6

*gen spread_7

xtset nfirm date

xtfmb return size bmratio prior

predict rhat7

egen quintile7=xtile(rhat7),by(date) nq(5)

bysort date quintile7:egen ew7=mean(rhat7)

gen mquintile7=-quintile7

sort date quintile7

bysort date:gen min7=ew7[1]

sort date mquintile7

bysort date:gen max7=ew7[1]

gen spread7=max7-min7

- Lưu file là “table4.1.2result”

- Thực hiện câu lệnh xuất dữ liệu của spread trong 7 mô hình

edit date spread1 spread2 spread3 spread4 spread5 spread6 spread7

- Thực hiện tính toán giá trị

▪ Trung bình: hàm AVERAGE

▪ Độ lệch chuẩn: hàm STDEV.S

▪ Thống kê t = (Trung bình)/(Độ lệch chuẩn)

- Lưu sheet là “spreads 7 models”

3. Bước 3: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình

quân trong mô hình hai biến (I2/R’)

3.1. Theo chênh lệch độ phân tán tỷ suất sinh lợi bình quân giữa mô hình

đơn biến và mô hình hai biến

- Tính toán mức I2/R’ trong 6 trường hợp. Dữ liệu tính toán được lấy từ

spread1,2,3,4,5,6,7 trong sheet “spreads 7 models”.

- Tính trung bình, độ lệch chuẩn, thống kê t.

3.2. Theo hệ số tương quan

3.2.1. Tính toán hệ số tương quan giữa các biến độc lập

- Dựa trên file dataset “table4.1.2”, tiến hành xác định hệ số tương quan giữa 3

cặp biến sau: (size;bm) , (size;prior) , (bm;prior) theo do-file “correlation”

*gen correlation

bysort date:egen csizebm=corr(size bmratio)

bysort date:egen csizeprior=corr(size prior)

bysort date:egen cbmprior=corr(bmratio prior)

egen mcsizebm=mean(csizebm)

egen mcsizeprior=mean(csizeprior)

egen mcbmprior=mean(cbmprior)

- Xem kết quả tính toán qua lệnh:

edit date mcsizebm mcsizeprior mcbmprior

3.2.2. Tính toán giá trị đóng góp tăng thêm

- Tiến hành chạy do-file “B3.2-table4_1_3-incremental by correlation”

* size spread in column1

xtset nfirm date

bysort date quintile1:egen msize1=mean(size)

sort date quintile1

bysort date:gen minsize1= msize1[1]

sort date mquintile1

bysort date:gen maxsize1= msize1[1]

gen spreadsize1= maxsize1- minsize1

*gen bm spread in column2

bysort date quintile2:egen mbmratio2=mean(bmratio)

sort date quintile2

bysort date:gen minbm2= mbmratio2[1]

sort date mquintile2

bysort date:gen maxbm2= mbmratio2[1]

gen spreadbm2= maxbm2- minbm2

*gen prior spread in column3

bysort date quintile3:egen mprior3=mean(prior)

sort date quintile3

bysort date:gen minprior3= mprior3[1]

sort date mquintile3

bysort date:gen maxprior3= mprior3[1]

gen spreadprior3= maxprior3- minprior3

*gen size bm spread in column4

bysort date quintile4:egen msize4=mean(size)

bysort date quintile4:egen mbm4=mean(bmratio)

sort date quintile4

bysort date:gen minsize4= msize4[1]

bysort date:gen minbm4= mbm4[1]

sort date mquintile4

bysort date:gen maxsize4= msize4[1]

bysort date:gen maxbm4= mbm4[1]

gen spreadsize4= maxsize4- minsize4

gen spreadbm4= maxbm4- minbm4

*gen size bm spread in column5

bysort date quintile5:egen msize5=mean(size)

bysort date quintile5:egen mprior5=mean(prior)

sort date quintile5

bysort date:gen minsize5= msize5[1]

bysort date:gen minprior5= mprior5[1]

sort date mquintile5

bysort date:gen maxsize5= msize5[1]

bysort date:gen maxprior5= mprior5[1]

gen spreadsize5= maxsize5- minsize5

gen spreadprior5= maxprior5- minprior5

*gen size bm spread in column6

bysort date quintile6:egen mbm6=mean(bmratio)

bysort date quintile6:egen mprior6=mean(prior)

sort date quintile6

bysort date:gen minbm6= mbm6[1]

bysort date:gen minprior6= mprior6[1]

sort date mquintile6

bysort date:gen maxbm6= mbm6[1]

bysort date:gen maxprior6= mprior6[1]

gen spreadbm6= maxbm6- minbm6

gen spreadprior6= maxprior6- minprior6

*gen size bm spread in column7

bysort date quintile7:egen msize7=mean(size)

bysort date quintile7:egen mbm7=mean(bmratio)

bysort date quintile7:egen mprior7=mean(prior)

sort date quintile7

bysort date:gen minsize7= msize7[1]

bysort date:gen minbm7= mbm7[1]

bysort date:gen minprior7= mprior7[1]

sort date mquintile7

bysort date:gen maxsize7= msize7[1]

bysort date:gen maxbm7= mbm7[1]

bysort date:gen maxprior7= mprior7[1]

gen spreadsize7= maxsize7- minsize7

gen spreadbm7= maxbm7- minbm7

gen spreadprior7= maxprior7- minprior7

*gen incremental using correlation

gen spread14corr=(bsize4+csizebm*bbm4)*spreadsize1

gen ibm4corr=1-spread14corr/spread4

gen spread24corr=(bbm4+bsize4*csizebm)*spreadbm2

gen isize4corr=1-spread24corr/spread4

gen spread15corr=(bsize5+bprior5*csizeprior)*spreadsize1

gen iprior5corr=1-spread15corr/spread5

gen spread35corr=(bprior5+bsize5*csizeprior)*spreadprior3

gen isize5corr=1-spread35corr/spread5

gen spread26corr=(bbm6+bprior6*cbmprior)*spreadbm2

gen iprior6corr=1-spread26corr/spread6

gen spread36corr=(bprior6+bbm6*cbmprior)*spreadprior3

gen ibm6corr=1-spread36corr/spread6

*gen incremental using corr=0

gen csizebm0=0

gen csizeprior0=0

gen cbmprior0=0

gen spread14corr0=(bsize4+csizebm0*bbm4)*spreadsize1

gen ibm4corr0=1-spread14corr0/spread4

gen spread24corr0=(bbm4+bsize4*csizebm0)*spreadbm2

gen isize4corr0=1-spread24corr0/spread4

gen spread15corr0=(bsize5+bprior5*csizeprior0)*spreadsize1

gen iprior5corr0=1-spread15corr0/spread5

gen spread35corr0=(bprior5+bsize5*csizeprior0)*spreadprior3

gen isize5corr0=1-spread35corr0/spread5

gen spread26corr0=(bbm6+bprior6*cbmprior0)*spreadbm2

gen iprior6corr0=1-spread26corr0/spread6

gen spread36corr0=(bprior6+bbm6*cbmprior0)*spreadprior3

gen ibm6corr0=1-spread36corr0/spread6

- Chiết xuất dữ liệu tính toán phần đóng góp của biến mới khi áp dụng hệ số

tương quan giữa từng cặp biến đã được tính trước đó theo lệnh:

edit date ibm4corr isize4corr iprior5corr isize5corr iprior6corr ibm6corr

- Chiết xuất dữ liệu tính toán phần đóng góp của biến mới khi giả định hệ số

tương quan giữa từng cặp biến bằng 0 theo lệnh:

edit date ibm4corr0 isize4corr0 iprior5corr0 isize5corr0 iprior6corr0 ibm6corr0

- Tiếp theo, xác định mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình

quân đối với mô hình hai biến dựa trên hệ số tương quan mẫu và hệ số tương

quan được giả định bằng 0.

▪ Tính toán mức độ đóng góp của biến mới trong 6 trường hợp.

▪ Tính trung bình, độ lệch chuẩn, thống kê t.

4. Bước 4: Đo lường mức độ đóng góp của biến mới đến tỷ suất sinh lợi bình

quân trong mô hình ba biến (I2/R’).

4.1. Theo chênh lệch giữa độ phân tán tỷ suất sinh lợi bình quân giữa mô

hình 2 biến và mô hình 3 biến

- Tính toán mức độ đóng góp của biến mới trong 3 trường hợp.

- Dữ liệu tính toán dựa vào sheet “spread 7 models”

5. Bước 5: Đánh giá sự pha loãng biến

- Chiết xuất dữ liệu tính toán phần chênh lệch giá trị kỳ vọng của mỗi biến trong

7 mô hình theo lệnh:

edit date spreadsize1 spreadbm2 spreadprior3 spreadsize4 spreadbm4 spreadsize5

spreadprior5 spreadbm6 spreadprior6 spreadsize7 spreadbm7 spreadprior7

- Tính toán tỷ lệ độ phân tán của từng biến độc lập khi ước lượng riêng lẽ và khi

thêm biến mới vào mô hình.

- Tính trung bình, độ lệch chuẩn, thống kê t.

6. Bước 6: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong

trường hợp mô hình hai biến

6.1. Tính toán theo chênh lệch tỷ suất sinh lợi

- Tính toán Rerurn Gap bằng cách: spread [1+2-4], spread [1+3-5], spread [2+3-

6] theo từng tháng.

- Tính trung bình, độ lệch chuẩn, thống kê t.

6.2. Tính toán theo tác động pha loãng

- Tiến hành chạy do-file “B6-table4_1_6-return gap”

gen slopeatt4=csizebm*(bsize4*spreadbm2+bbm4*spreadsize1)

gen varatt4=bsize4*(spreadsize1-spreadsize4)+bbm4*(spreadbm2-spreadbm4)

gen slopeatt5=csizeprior*(bsize5*spreadprior3+bprior5*spreadsize1)

gen/varatt5=bsize5*(spreadsize1-spreadsize5)+bprior5*(spreadprior3- spreadprior5)

gen slopeatt6=cbmprior*(bbm6*spreadprior3+bprior6*spreadbm2)

gen varatt6=bbm6*(spreadbm2-spreadbm6)+bprior5*(spreadprior3-spreadprior6)

*gen slope of fitted value on eq7

gen bfv4=(bsize7*spreadsize7+bbm7*spreadbm7)/spread4

gen bfv5=(bsize7*spreadsize7+bprior7*spreadprior7)/spread5

gen bfv6=(bprior7*spreadprior7+bsize7*spreadsize7)/spread6

*gen correlation fv and variable by calculation

gen cfvprior=(bprior3-bprior7)/bfv4

gen cfvsize=(bsize1-bsize7)/bfv6

gen cfvbm=(bbm2-bbm7)/bfv5

*gen slope attenuations by rho

gen slopeatt7_4rho=cfvprior*(bprior7*spread4+bfv4*spreadprior3)

gen slopeatt7_5rho=cfvbm*(bbm7*spread5+bfv5*spreadbm2)

gen slopeatt7_6rho=cfvsize*(bsize7*spread6+bfv6*spreadsize1)

*gen variable attenuations by rho

gen varatt7_4rho=bprior7*(spreadprior3-spreadprior7)

gen varatt7_5rho=bbm7*(spreadbm2-spreadbm7)

gen varatt7_6rho=bsize7*(spreadsize1-spreadsize7)

- Chiết xuất dữ liệu tính toán hệ số pha loãng độ dốc và pha loãng biến trong

mô hình 2 biến theo lệnh:

edit date slopeatt4 varatt4 slopeatt5 varatt5 slopeatt6 varatt6

- Tính tổng tác động pha loãng kép trong 3 trường hợp.

- Tính trung bình, độ lệch chuẩn, thống kê t.

7. Bước 7: Đánh giá mức độ chênh lệch tỷ suất sinh lợi (return gap) trong

trường hợp mô hình ba biến

- Chiết xuất dữ liệu tính toán hệ số pha loãng độ dốc và pha loãng biến trong

mô hình 3 biến theo lệnh:

edit date slopeatt7_4rho varatt7_4rho slopeatt7_5rho varatt7_5rho slopeatt7_6rho varatt7_6rho

- Tính tổng tác động pha loãng kép trong 3 trường hợp.

- Tính trung bình, độ lệch chuẩn, thống kê t.

Phụ lục 2. Tính giá trị thống kê GRS

1. Công thức tính giá trị thống kê GRS

- Dựa trên công thức chính trong bài nghiên nghiên cứu gốc của Gibbon, Ross

and Shanken (1989), tôi áp dụng vào bài nghiên cứu này như sau

với, N: số bậc phân vị

T: chuỗi thời gian

L: số biến độc lập

𝛼̂: giá trị ước lượng của ma trận hệ số chặn

𝛼̂ ′: giá trị ước lượng của ma trận chuyển vị hệ số chặn

𝛴̂: giá trị ước lượng của ma trận hiệp phương sai của phần dư

𝜇̅: giá trị trung bình của tỷ suất sinh lợi vượt trội

𝛺̂: giá trị ước lượng của ma trận hiệp phương sai của tỷ suất sinh lợi vượt trội

2. Tiến hành chạy do-file “GRS-test”

*grs test model7 vs model4

reg exreturn7 exreturn4 if quintile==1

predict res74q1 if quintile==1,residual

gen b74q1=_b[_cons]

reg exreturn7 exreturn4 if quintile==2

predict res74q2 if quintile==2,residual

gen b74q2=_b[_cons]

reg exreturn7 exreturn4 if quintile==3

predict res74q3 if quintile==3 ,residual

gen b74q3=_b[_cons]

reg exreturn7 exreturn4 if quintile==4

predict res74q4 if quintile==4,residual

gen b74q4=_b[_cons]

reg exreturn7 exreturn4 if quintile==5

predict res74q5 if quintile==5,residual

gen b74q5=_b[_cons]

*grs test model7 vs model5

reg exreturn7 exreturn5 if quintile==1

predict res75q1 if quintile==1,residual

gen b75q1=_b[_cons]

reg exreturn7 exreturn5 if quintile==2

predict res75q2 if quintile==2,residual

gen b75q2=_b[_cons]

reg exreturn7 exreturn5 if quintile==3

predict res75q3 if quintile==3,residual

gen b75q3=_b[_cons]

reg exreturn7 exreturn5 if quintile==4

predict res75q4 if quintile==4,residual

gen b75q4=_b[_cons]

reg exreturn7 exreturn5 if quintile==5

predict res75q5 if quintile==5,residual

gen b75q5=_b[_cons]

*grs test model7 vs model6

reg exreturn7 exreturn6 if quintile==1

predict res76q1 if quintile==1,residual

gen b76q1=_b[_cons]

reg exreturn7 exreturn6 if quintile==2

predict res76q2 if quintile==2,residual

gen b76q2=_b[_cons]

reg exreturn7 exreturn6 if quintile==3

predict res76q3 if quintile==3,residual

gen b76q3=_b[_cons]

reg exreturn7 exreturn6 if quintile==4

predict res76q4 if quintile==4,residual

gen b76q4=_b[_cons]

reg exreturn7 exreturn6 if quintile==5

predict res76q5 if quintile==5,residual

gen b76q5=_b[_cons]