TNU Journal of Science and Technology
229(15): 103 - 111
http://jst.tnu.edu.vn 103 Email: jst@tnu.edu.vn
USING LSTM DEEP LEARNING MODEL IN STOCK PRICE PREDICTION
Tran Quang Quy1*, Nguyen Vu Hai1, Ha Van Ninh1, Nguyen Thi Thuy2
1TNU - University of Information and Communication Technology
2Department of Education and Training of Thai Nguyen City
ARTICLE INFO
ABSTRACT
Received:
14/11/2024
In recent times, the stock market has attracted a diverse range of
participants, from organizations to financial experts, each employing
different investment strategies. The common objective of investors is to
maximize returns through investment. While various prediction
methods have been proposed to mitigate risks, the application of
artificial intelligence in stock price prediction continues to garner
attention and research interest. Particularly, predicting time series data
with irregular, non-seasonal characteristics, such as stock price data,
remains a challenging task. This paper presents a method utilizing the
Long Short-Term Memory deep learning model for stock price
prediction and provides a comprehensive review of this model. The
results indicate that the proposed method can predict stock price trends
of adjusted closing prices with a root mean square error of 0.1387 and
mean absolute error of 0.1007. Although the Long Short-Term Memory
method may not achieve highly accurate predictions, it can offer a
reasonably close approximation to real-world data trends.
Revised:
18/12/2024
Published:
18/12/2024
KEYWORDS
Deep learning
Time series data
Long Short-Term Memory
Stock price prediction
Recurrent Neural Network
S
DỤNG MÔ HÌNH HỌC SÂU LSTM TRONG DỰ
ĐOÁN GIÁ TRỊ
C
PHIU
Trần Quang Quý1*, Nguyễn Vũ Hải1, Hà Văn Ninh1, Nguyn Th
Thúy2
1Trường Đại học Công nghệ
thông tin và Truyền thông -
ĐH
Thái Nguyên
2Phòng Giáo dục và Đào tạo thành phố
Thái Nguyên
TÓM TẮT
Ngày nhận bài:
14/11/2024
Trong thi gian gần đây, thị trường chứng khoán đã thu t nhiều đối
ợng khác nhau, t nhng t chức các chuyên gia tài chính với các
cách thức đầu khác nhau. Mục tiêu chung của nđầu tư gia tăng
li nhun nh việc đầu . Nhiều cách thức v d đoán đảm bo ri ro
đã được đ xuất, tuy nhiên sử dụng trí tuệ nhân tạo trong d đoán giá trị
c phiếu vẫn được quan tâm nghiên cu. Đặc bit, vic d đoán dữ
liu chui thi gian tr nên thách thức khi d liệu mang tính bất thường,
không tuân theo quy luật c định, điển hình dữ liệu giá tr c phiếu,
với các biến động khó lường và không theo mô hình định trưc. Bài báo
đưa ra phương pháp s dụng hình học sâu Long Short-Term
Memory trong d đoán giá trị c phiếu nghiên cứu tng quan v
hình này. Kết qu bài báo thể d đoán được xu hướng giá trị c
phiếu của giá đóng điều chnh vi sai s độ lệch bình phương trung
bình gốc, sai s tuyệt đối trung bình lần lượt 0,1387 0,1007. Tuy
phương pháp Long Short-Term Memory không thể d đoán gtrị c
phiếu mức độ chính xác cao nhưng thể cung cp mt kết qu theo
xu hướng gần đúng so với d liu thc tế.
Ngày hoàn thiện:
18/12/2024
Ngày đăng:
18/12/2024
T KHÓA
DOI: https://doi.org/10.34238/tnu-jst.11554
* Corresponding author. Email: tqquy@ictu.edu.vn
TNU Journal of Science and Technology
229(15): 103 - 111
http://jst.tnu.edu.vn 104 Email: jst@tnu.edu.vn
1. Gii thiu
D đoán dữ liu chui thi gian nói chung d đn giá trị c phiếu nói riêng luôn gặp
phải c thách thức ln khi d đoán xu ớng, c bất thường đặc trưng ca c phiếu [1]. D
báo li nhun c phiếu, đặc biệt là t sut sinh li [2], tác động đáng k đến quyết định kinh
doanh của các nhà đầu tư, góp phn định ng chiến lược tối ưu hóa hiu qu đầu . T
đó, vic d đoán giá trị c phiếu vẫn là một trong những công vic cp thiết bng nhiều phương
pháp nh thức khác nhau. Trong mọi nh vc của đời sng hiện nay, trí tu nhân tạo đã
đưc ng dụng như một phương pháp mang li hiu qu vượt tri. nh 1 cho thy t năm
1995 đến 2019, việc áp dụng trí tuệ nhân tạo trong c phiếu luôn vấn đ nhận được s quan
m t nhiều nhà khoa học tn khắp thế gii [3].
Hình 1. Các xu hướng nghiên cứu v s dụng trí tu nhân tạo
dành cho dữ liu c phiếu t năm 1995 đến 2019 trong tài liệu s [3]
Trong thi gian qua, nhiều nhà nghiên cứu trong ngoài nước đã đề xuất các phương pháp
khác nhau nhằm nâng cao khả năng dự đoán xu hướng th trường chứng khoán.
Nhóm tác giả Trần Trung Kiên [4] đã đưa ra phương pháp kết hp GA-SVR (Genetic
Algorithm - Support Vector Regression) trong d đoán và đạt được kết qu sai s phần trăm tuyệt
đối trung bình (MAPE - Mean Absolute Percentage Error) là 1,308. hình mờ TSK (TSK
fuzzy model) đã được đề xuất để d đoán giá trị c phiếu Vit Nam bi Nguyễn Đức Hiền
Mnh Thch [5]. Mô hình đạt được các kết qu độ sai s trung bình tuyệt đối (MAE - Mean
Absolute Error) t 0,01-0,02. Vũ Thị Loan cùng các tác giả [6] đề xuất phương pháp d báo biến
động tiếp theo của giá cổ phiếu trước các thông tin tài chính phi tài chính bằng phương pháp
nghiên cứu s kin (event study) thuật toán học máy Random Forest, đưa ra các kết qu d
đoán biến động chính xác gần 90%. Với các nghiên cu quc tế, Wenjie Lu cộng s [7] đề
xuất phương pháp phối hp s dụng các mạng -ron tích chập CNN-BiLSTM-AM trong các
công đoạn d đoán giá trị c phiếu, kết qu cho ra vi sai s MAE căn bậc hai của trung bình
bình phương sai số (RMSE - Root Mean Squared Error) lần lượt 21,952 31,694. Phương
pháp dự đoán sử dng mng -ron nhân tạo (ANN) đưc Mehar Vijh và nhóm tác giả [8] chng
minh tốt hơn so với phương pháp sử dng thuật toán Random Forest, trong bài toán dự đoán
giá đóng (closing) trong cổ phiếu.
Qua các nghiên cứu, mng hi quy Long Short-Term Memory (LSTM) [9] đưc chng minh
một phương pháp hiệu qu hơn đối vi d liu chui thi gian v lĩnh vực c phiếu [10], song
vic d đoán giá trị c phiếu vẫn một bài toán đầy thách thức. Vậy trong nghiên cứu này,
TNU Journal of Science and Technology
229(15): 103 - 111
http://jst.tnu.edu.vn 105 Email: jst@tnu.edu.vn
chúng tôi s làm rõ phương pháp sử dng mng hi quy LSTM trong d đoán giá trị c phiếu, và
đưa ra các kết qu b sung cho các nghiên cứu liên quan tới lĩnh vực d đoán giá cổ phiếu.
2. Phương pháp nghiên cứu
2.1. Mô tả d liệu và bài toán nghiên cứu
D liệu nghiên cứu trong bài báo là giá cổ phiếu ca Amazon với thị trường AMZN
[11], d liu c phiếu gồm 25 năm dữ liệu. Thông tin dữ liu bao gồm giá cổ phiếu cao nht ca
ngày, thấp nht của ngày, giá m ca, giá đóng cửa, gđóng cửa điều chỉnh khối lượng giao
dch. Bng 1 thống kê dữ liệu được s dng cho hun luyện và kiểm tra mô hình LSTM:
Bng 1. D liu thống kê (Dữ liệu đnh dng t ngày 02/01/1999 - 31/07/2024)
D liu
D liu hun luyn
D liu kim tra
Thi gian
02/01/1999 31/07/2024
02/01/1999 31/12/2021
02/01/2022 31/07/2024
Hình 2. Trc quan b d liu s dng
Ch d liệu giá đóng cửa điều chỉnh được s dụng trong quá trình d đoán. Hình 2 trực quan giá
tr c phiếu giá đóng ca điu chỉnh trên toàn bộ tp d liu gm d liu s dng cho vic hun
luyện và kiểm tra hình LSTM đề xut. Mục tiêu của nghiên này đánh giá khả năng của
LSTM trong vic hc t d liu chui thời gian đơn giản, do đó, chúng tôi chỉ s dụng giá đóng
ca điu chỉnh đ la chn cho vic hun luyện hình, thể giải k hơn do này qua các
tiêu chí sau:
- Giá đóng cửa điều chỉnh thường được coi đại din tt nhất cho gtrị ca mt c phiếu
trong một ngày giao dịch. phản ánh tất c các thông tin hoạt động giao dch din ra trong
ngày, được "tng hợp" vào một điểm d liu duy nhất. Điều này làm cho việc phân tích và dự
đoán trở nên đơn giản hơn.
- D liệu giá đóng cửa điều chỉnh (đã tính toán cả chia tách cổ phiếu, c tcv.v.) sẵn rng
rãi và dễ dàng thu thập t nhiu nguồn khác nhau.
- Vic s dụng quá nhiu yếu t đầu vào thể dẫn đến hiện tượng "nhiễu", làm cho mô hình
khó học được các mẫu quan trng t d liu. Ch s dụng giá đóng cửa điều chỉnh giúp giảm
thiu nhiễu và tập trung vào xu hướng giá chính.
- Vic b qua các yếu t khác như tin tức th trưng, báo cáo tài chính, khối lượng giao dch,...
có th m mất đi thông tin quan trọng ảnh hưởng đến giá cổ phiếu. Tuy nhiên, trong một s trưng
hợp, tác đng ca nhng yếu t y đã được phản ánh mt phn vào g đóng cửa điều chnh.
TNU Journal of Science and Technology
229(15): 103 - 111
http://jst.tnu.edu.vn 106 Email: jst@tnu.edu.vn
Để gii quyết vấn đề d đoán giá cổ phiếu của Amazon (AMZN), mô hình mạng nơron LSTM
s được áp dụng nhm d đoán giá trị c phiếu cho ngày tiếp theo. Giá đóng cửa c phiếu là mỗi
chuỗi giá trị biến đổi theo thời gian ký hiệu là . Trong đó, đại diện cho giá đóng cửa vào ngày
th với điều kin .
Mt ca s trượt s được thiết lập trên trục thi gian, với kích thước được gi c định
bước di chuyển cũng bằng kích thước này, nhằm đm bảo không sự chồng chéo dữ liu. Mc
tiêu là sử dng d liu trong ca s để d đoán giá cho .
2.2. Kiến trúc mô hình hồi quy Long Short-term Memory (LSTM)
2.2.1. Mạng nơ-ron hồi quy (RNN - Recurrent Neural Network)
Mng hồi quy LSTM là một dng ca mạng nơ-ron hi quy RNN. RNN được gọi mạng nơ
ron hi quy áp dụng cùng một phép biến đổi cho mi phn t ca mt chuỗi theo cách
đầu ra ca RNN ph thuộc vào kết qu của các lần lặp trước đó. Do đó, RNN duy trì một trng
thái nội b để nm bt thông tin về các phần t trước đó trong chuỗi, giống như bộ nh. Một đơn
v n RNN s được hc dựa vào công thức (1), đầu ra ca RNN: , là một phép biến đổi phi
tuyến ca tổng hai phép nhân ma trận, s dụng ví dụ như các hàm kích hoạt tanh hoc ReLU:
(1)
Trong đó:
W: ma trn d liu cần tính toán
áp dụng cho trạng thái ở trạng thái ẩn trước
áp dụng cho trạng thái ở trạng thái đầu vào hiện ti
2.2.2. Mạng hồi quy Long Short-term Memory (LSTM)
Tuy nhiên, mạng RNN gp phi mt s hn chế đáng chú ý, bao gồm hiện tượng bùng nổ
gradient (gradient explosion) suy biến gradient (vanishing gradient) [12]. Việc nhân liên tiếp
ma trn không ổn định dẫn đến vic gradient biến mất trong quá trình triển khai thuật toán
lan truyền ngược, hoặc bùng nổ gradient dẫn đến các giá trị ln một cách không ổn định. Mng
hi quy LSTM s dng bn biến trung gian kích thước chiu. Ma trn cp nht
được hiệu được s dụng để nhân trước vi vecct
. Cp nht ma
trn s đưc biu din bằng công thức (2):
[
] (
) [
] [thiết lp tham s]
(2)
S xác định vectơ trạng thái n vec trạng thái ô s dng một quá trình nhiu
bước, bắt đầu bng việc tính toán các biến trung gian ti lần lượt (3) và (4).
(3)
[Chn lọc rò rỉ b nh dài hạn vào trạng thái ẩn]
(4)
Tại đây, phép nhân từng phn của các vec được ký hiệu bằng ,” hiệu “sigm” ch hàm
sigmoid. Ti lp th nht (k=1), trong phương trình trên nên được thay thế bng
và ma trận
ch thưc . Trong các triển khai thc tế, các hệ s điu chnh (bias) cũng
đưc s dụng trong các cập nht trên. Kiến trúc mônh LSTM sẽ đưc minh ha ti Hình 3.
TNU Journal of Science and Technology
229(15): 103 - 111
http://jst.tnu.edu.vn 107 Email: jst@tnu.edu.vn
Hình 3. Kiến trúc mô hình LSTM trong quá trình cp nht ma trn [13]
2.3. Thiết lập mô hình LSTM và điều chỉnh siêu tham số mô hình
hình LSTM được s dụng trong bài báo kiến trúc bao gồm mt lớp LSTM 200 đơn vị
vi t l 0,2 trên lớp dropout, điều này được lp li 4 ln. Tham s 200 đơn vị kích thước ca
-ron cho lớp LSTM, do đó trong trường hợp này, lớp LSTM 200 đơn vị n hoặc ô n. Lp
dropout được thc hiện để ngăn ngừa các vấn đề quá khớp (overfitting), vấn đề y thể gp
phải trong quá trình hun luyện hình. Trong giai đon hun luyện, các nút kết nối được
xóa ngẫu nhiên khỏi mạng. Trong trường hợp phương pháp được đề xuất, xác suất loi b
20%. Sau lp dropout cuối cùng, mt lp dense với 1 đơn vị được s dụng. Thông tin chi tiết v
mô hình được đề cp Hình 4.
Hình 4. Mô hình LSTM được đề xut
hình học sâu sử dng thuật toán tối ưu bằng các vòng lập, các tham số hình sẽ được
ci thin dựa vào thuật toán tối ưu mất mát mini-batch gradient descent [14]. Vic hun luyn d
liu nhiều hơn mt lần để tối ưu tham số, điều này sẽ phải dùng đến siêu tham số epoch, đây cũng
biu din s ln thuật toán sẽ chy li thuật toán lan truyền ngược xuôi để cp nht tham s
mô hình. Việc chia d liệu trong bài toán chuỗi thi gian cần tuân thủ nguyên tắc duy trì tính liên
tc thời gian để tránh rỉ d liệu. Trong nghiên cứu này, tập d liệu được chia thành ba phần:
tp hun luyn, tp kim th (validation), và tp kim tra (test). Tp hun luyện được s dụng đ
mô hình học t các mẫu quá khứ, trong khi tp kim th (25% t cui tp hun luyện) giúp đánh
giá hiệu suất trong quá trình tối ưu mà không ảnh hưởng đến tp kim tra. Tp kim tra, bao gm