
1
ĐẠI HỌC QUỐC GIA TP. HCM
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
--------------- ---------------
BÁO CÁO
Môn: Học máy thống kê
Lớp : DS102.L21
ĐỀ TÀI: STOCK PRICE PREDICTION
GIẢNG VIÊN HƯỚNG DẪN:
TS. Nguyễn Tấn Trần Minh Khang
Th.S. Võ Duy Nguyên
Hồ Thái Ngọc
NHÓM THỰC HIỆN:
Nguyễn Lương Toàn - 18521510
Nguyễn Anh Phi - 19522005
TPHCM, Ngày 16 tháng 6 năm 2021

2
ĐẠI HỌC QUỐC GIA TP. HCM
ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
--------------- ---------------
BÁO CÁO
Môn: Học máy thống kê
Lớp : DS102.L21
ĐỀ TÀI: STOCK PRICE PREDICTION
GIẢNG VIÊN HƯỚNG DẪN:
TS. Nguyễn Tấn Trần Minh Khang
Th.S. Võ Duy Nguyên
Hồ Thái Ngọc
NHÓM THỰC HIỆN:
Nguyễn Lương Toàn - 18521510
Nguyễn Anh Phi - 19522005
TPHCM, Ngày 16 tháng 6 năm 2021

3
LỜI CẢM ƠN
Đầu tiên, chúng em xin gửi lời cảm ơn chân thành đến Trường Đại học Công
nghệ thông tin – Đại học Quốc gia TP.HCM và xin gửi lời cảm ơn sâu sắc nhất tới
TS. Nguyễn Tấn Trần Minh Khang, người thầy đã trực tiếp giảng dạy, hướng dẫn và
tận tình chỉ bảo chúng em trong suốt quá trình học tập. Chân thành cảm ơn ThS. Võ
Duy Nguyên, anh Hồ Thái Ngọc đã hỗ trợ, giúp đỡ và đóng góp nhiều ý kiến quý
báu cho chúng em trong suốt môn học cũng như thực hiện đồ án.
Trong quá trình thực hiện nhóm chúng em đã vận dụng những kiến thức nền tảng
đã tích lũy đồng thời kết hợp với việc học hỏi và nghiên cứu những kiến thức mới.
Từ đó đã vận dụng tối đa những gì đã thu thập được để hoàn thành một báo cáo đồ
án tốt nhất. Tuy nhiên, khi thực hiện chắc chắn không tránh khỏi được những sai sót.
Chính vì vậy, chúng em rất mong nhận được sự góp ý của thầy cô nhằm hoàn thiện
những kiến thức mà nhóm chúng em đã học tập và là hành trang để thực hiện tiếp
các đề tài khác trong tương lai.
Nhóm em xin chân thành cảm ơn quý Thầy Cô!
TP. Hồ Chí Minh, ngày 10 tháng 6 năm 2021

4
MỤC LỤC
Tóm tắt nội dung
LỜI CẢM ƠN .............................................................................................................................................. 3
Danh mục viết tắt .......................................................................................................................................... 5
Tổng quan ..................................................................................................................................................... 7
1.1. Giới thiệu đề tài ............................................................................................................................ 7
1.1.1. Giới thiệu bài toán ................................................................................................................ 7
Cơ sở lý thuyết .............................................................................................................................................. 8
2.1 Mô hình hồi quy ............................................................................................................................ 8
2.2 Hàm tổn thất .................................................................................................................................. 8
2.3 Bài toán Hồi quy ........................................................................................................................... 9
2.3.1 Đo hiệu năng bài toán hồi quy ..................................................................................................... 9
2.4 Nội dung........................................................................................................................................ 9
2.4.1 Hồi quy tuyến tính........................................................................................................................ 9
2.4.2 Support Vector Machine – Regression (SVR) ........................................................................... 15
2.4.3 Long Short-Term Memory (LSTM) .......................................................................................... 19
............................................................................................................................................................ 27
Thực nghiệm ............................................................................................................................................... 28
3.1. Phân tích tập dữ liệu .................................................................................................................... 28
3.2. Các bước tiến hành ...................................................................................................................... 32
3.3. Kết quả thực nghiệm .................................................................................................................... 33
Kết luận ....................................................................................................................................................... 42
4.1. Những kết quả đạt được .................................................................................................................. 42
4.2. Khó khăn .......................................................................................................................................... 42
4.2. Hướng phát triển ............................................................................................................................. 42
Bảng phân chia công việc ............................................................................................................................ 43
Tài liệu tham khảo ....................................................................................................................................... 44

5
Danh mục viết tắt
MSE Mean - Square Error
SSE Sum of Squared Errors
LNR Linear Regression
SVR Support Vector Regression
RNN Recurrent Neural Network
BPTT Backpropagation Through Time
LSTM Long Short Term Memory