Dự đoán giá cổ phiếu (Stock price prediction) bằng Học máy thống kê: Báo cáo môn học

ĐẠI HỌC QUỐC GIA TP. HCM

ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

---------------  ---------------

BÁO CÁO

Môn: Học máy thống kê

Lớp : DS102.L21

ĐỀ TÀI: STOCK PRICE PREDICTION

GIẢNG VIÊN HƯỚNG DẪN:

TS. Nguyễn Tấn Trần Minh Khang

Th.S. Võ Duy Nguyên

Hồ Thái Ngọc

NHÓM THỰC HIỆN:

Nguyễn Lương Toàn - 18521510

Nguyễn Anh Phi - 19522005

TPHCM, Ngày 16 tháng 6 năm 2021

ĐẠI HỌC QUỐC GIA TP. HCM

ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

---------------  ---------------

BÁO CÁO

Môn: Học máy thống kê

Lớp : DS102.L21

ĐỀ TÀI: STOCK PRICE PREDICTION

GIẢNG VIÊN HƯỚNG DẪN:

TS. Nguyễn Tấn Trần Minh Khang

Th.S. Võ Duy Nguyên

Hồ Thái Ngọc

NHÓM THỰC HIỆN:

Nguyễn Lương Toàn - 18521510

Nguyễn Anh Phi - 19522005

TPHCM, Ngày 16 tháng 6 năm 2021

LỜI CẢM ƠN

Đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Trường Đại học Công

nghệ thông tin – Đại học Quốc gia TP.HCM và xin gửi lời cảm ơn sâu sắc nhất tới

TS. Nguyễn Tấn Trần Minh Khang, người thầy đã trực tiếp giảng dạy, hướng dẫn và

tận tình chỉ bảo chúng em trong suốt quá trình học tập. Chân thành cảm ơn ThS. Võ

Duy Nguyên, anh Hồ Thái Ngọc đã hỗ trợ, giúp đỡ và đóng góp nhiều ý kiến quý

báu cho chúng em trong suốt môn học cũng như thực hiện đồ án.

Trong quá trình thực hiện nhóm chúng em đã vận dụng những kiến thức nền tảng

đã tích lũy đồng thời kết hợp với việc học hỏi và nghiên cứu những kiến thức mới.

Từ đó đã vận dụng tối đa những gì đã thu thập được để hoàn thành một báo cáo đồ

án tốt nhất. Tuy nhiên, khi thực hiện chắc chắn không tránh khỏi được những sai sót.

Chính vì vậy, chúng em rất mong nhận được sự góp ý của thầy cô nhằm hoàn thiện

những kiến thức mà nhóm chúng em đã học tập và là hành trang để thực hiện tiếp

các đề tài khác trong tương lai.

Nhóm em xin chân thành cảm ơn quý Thầy Cô!

TP. Hồ Chí Minh, ngày 10 tháng 6 năm 2021

MỤC LỤC

Tóm tắt nội dung

LỜI CẢM ƠN .............................................................................................................................................. 3

Danh mục viết tắt .......................................................................................................................................... 5

Tổng quan ..................................................................................................................................................... 7

1.1. Giới thiệu đề tài ............................................................................................................................ 7

1.1.1. Giới thiệu bài toán ................................................................................................................ 7

Cơ sở lý thuyết .............................................................................................................................................. 8

2.1 Mô hình hồi quy ............................................................................................................................ 8

2.2 Hàm tổn thất .................................................................................................................................. 8

2.3 Bài toán Hồi quy ........................................................................................................................... 9

2.3.1 Đo hiệu năng bài toán hồi quy ..................................................................................................... 9

2.4 Nội dung........................................................................................................................................ 9

2.4.1 Hồi quy tuyến tính........................................................................................................................ 9

2.4.2 Support Vector Machine – Regression (SVR) ........................................................................... 15

2.4.3 Long Short-Term Memory (LSTM) .......................................................................................... 19

............................................................................................................................................................ 27

Thực nghiệm ............................................................................................................................................... 28

3.1. Phân tích tập dữ liệu .................................................................................................................... 28

3.2. Các bước tiến hành ...................................................................................................................... 32

3.3. Kết quả thực nghiệm .................................................................................................................... 33

Kết luận ....................................................................................................................................................... 42

4.1. Những kết quả đạt được .................................................................................................................. 42

4.2. Khó khăn .......................................................................................................................................... 42

4.2. Hướng phát triển ............................................................................................................................. 42

Bảng phân chia công việc ............................................................................................................................ 43

Tài liệu tham khảo ....................................................................................................................................... 44