TRƯỜNG ĐẠI HC KINH T QUC DÂN
TRƯỜNG CÔNG NGH
----------------
KHÓA LUN TT NGHIP
ĐỀ TÀI:
D BÁO DOANH S BÁN L T D LIU CHUI THI GIAN
BNG MÔ HÌNH THNG KÊ, HC MÁY VÀ MẠNG NƠ-RON
Tên sinh viên : Bùi Th D Hương
Ging viên hưng dn : TS.Lương Văn Thiện
2025. k II KHOA HC MÁY TÍNH BÙI TH D HƯƠNG 11218410
TRƯỜNG ĐẠI HC KINH T QUC DÂN
TRƯỜNG CÔNG NGH
----------------
KHÓA LUN TT NGHIP
ĐỀ TÀI:
D BÁO DOANH S BÁN L T D LIU CHUI THI GIAN BNG
MÔ HÌNH THNG KÊ, HC MÁY VÀ MẠNG NƠ-RON
Tên sinh viên : Bùi Th D Hương
Mã sinh viên : 11218410
Lp : Khoa hc máy tính K63
Ngành : Khoa hc máy tính
Khoa : Công ngh thông tin
Giảng viên hướng dn : TS.Lương Văn Thin
(Ch ký GVHD)
Hà Ni, 5/2025
1
MC LC
MC LC .................................................................................................................. 1
LỜI CAM ĐOAN ....................................................................................................... 4
LI CẢM ƠN ............................................................................................................ 5
DANH MC CÁC T VIT TT ........................................................................... 6
DANH MC BNG, BIỂU ĐỒ ................................................................................ 7
DANH MC HÌNH ................................................................................................... 8
M ĐẦU .................................................................................................................... 9
CHƯƠNG 1. TNG QUAN V ĐỀ TÀI ............................................................... 10
1.1. Gii thiệu đề tài ............................................................................................... 10
1.1.1. Tng quan và lý do chọn đề tài .................................................................. 10
1.1.2. Mc tiêu .................................................................................................... 11
1.1.3. Đối tượng và phm vi nghiên cu .............................................................. 11
CHƯƠNG 2. CƠ SỞTHUYT ........................................................................ 13
2.1. Gii thiu chung v Trí tu nhân to và Hc máy ............................................ 13
2.1.1. Trí tu nhân to ......................................................................................... 13
2.1.2. Hc máy (Machine Learning - ML) ........................................................... 13
2.1.3. Mi liên h gi AI, ML và D báo chui thi gian .................................... 13
2.2. Gii thiu chung v Trí tu nhân to và Hc máy ............................................ 14
2.2.1. Khái nim Chui thi gian......................................................................... 14
2.2.2. Các thành phần cơ bản ca Chui thi gian ............................................... 14
2.2.3. Thách thc trong d báo Chui thi gian ngành bán l .............................. 14
2.3. Các phương pháp thống kê trong d báo Chui thi gian ................................. 15
2.3.1. Phương pháp Trung bình trưt (Moving Average MA)........................... 15
2.3.2. Phương pháp D báo ngây thơ (Na𝒊ve Forecasting) .................................. 16
2.4. Phương pháp Hồi quy tuyến tính trong d báo Chui thi gian ........................ 16
2.4.1. Khái nim .................................................................................................. 16
2.4.2. ng dng Hi quy tuyến tính trong d báo Chui thi gian ...................... 17
2.4.3. Ưu điểm và hn chế ................................................................................... 17
2.5. Gii thiu chung v Trí tu nhân to và Hc máy ............................................ 17
2.5.1. Random Forest .......................................................................................... 18
2.5.2. XGBoost ................................................................................................... 19
2
2.5.3. LightGBM ................................................................................................. 20
2.6. Mạng -ron truyn thng (Feedforward Neural Network FNN) .................. 21
2.6.1. Kiến trúc mng FNN ................................................................................. 21
2.6.1. Chun b d liu Chui thi gian cho FNN ................................................ 21
2.6.3. Cu hình mô hình FNN ............................................................................. 22
2.6.4. Ưu điểm và hn chế ................................................................................... 22
2.7. Các ch s đánh giá mô hình dự báo ................................................................. 23
2.7.1. MAE Sai s tuyệt đối trung bình............................................................. 23
2.7.2. RMSE Căn bc hai ca sai s bình phương trung bình ............................ 24
2.7.3. 𝑹𝟐 H s xác định (Coefficient of Determination).................................. 24
2.7.4. So sánh và gi ý s dng ........................................................................... 25
2.8. Phương pháp nghiên cứu ................................................................................. 26
2.8.1. Tng quan v lý thuyết .............................................................................. 26
2.8.2. Thu thp và Tin xd liu ................................................................... 27
2.8.3. Xây dng mô hình ..................................................................................... 27
2.8.4. Đánh gmô hình ...................................................................................... 28
2.8.5. Kết lun ..................................................................................................... 28
CHƯƠNG 3. DATASET ......................................................................................... 29
3.1. Gii thiu D liu ............................................................................................ 29
3.1.1. Tng quan b d liu ................................................................................. 29
3.1.2. Cấu trúc và các trường d liu ................................................................... 29
3.1.3. Phm vi thi gian và Quy mô d liu......................................................... 32
3.2. Tin x lý d liu ............................................................................................ 32
3.2.1. Chuẩn hóa định dng ngày tháng ............................................................... 32
3.2.2. Kết hp d liu ph t các bng ................................................................ 33
3.2.3. Kim tra và X lý d liu b thiếu ............................................................. 34
3.3. Phân tích km phá d liu (EDA) .................................................................. 35
3.3.1. Trc quan hóa chui thi gian doanh s .................................................... 35
3.3.2. Phân tích xu hướng, mùa v và dịp đặc bit ............................................... 37
3.3.3. Phân phi doanh s và phát hin ngoi l .................................................. 41
3.3.4. Tương quan giữa các đặc trưng.................................................................. 43
3.4. Tạo đặc trưng đầu vào (Feature Engineering)................................................... 47
3.4.1. Tạo đặc trưng thời gian (Datatime Features) .............................................. 47
3
3.4.2. Tạo đặc trưng theo xu hướng mùa v (Trend and Seasonality Features) .... 49
3.5. X lý d liệu đầu vào cui cùng ...................................................................... 50
3.5.1. Loi b các biến dư thừa ........................................................................... 50
3.5.2. Chun hóa d liu...................................................................................... 51
3.5.3. Tng kết d liu sau khi x ................................................................... 51
3.5.4. Chia tp hun luyn và kim tra (Train-Test Split) .................................... 53
CHƯƠNG 4: CÀI ĐẶT TH NGHIM VÀ KT QU ....................................... 54
4.1. Cài đặt th nghim........................................................................................... 54
4.1.1. Môi trường cài đặt ..................................................................................... 54
4.1.2. Cu hình phn cng ................................................................................... 54
4.1.3. Các mô hình th nghim............................................................................ 55
4.1.4. Quy trình th nghim ................................................................................ 55
4.2. Kết qu mô hình trước khi s dng k thut Resampling ................................. 56
4.2.1. Tng quan quy trình hun luyn mô hình .................................................. 56
4.2.2. Bng tng hp kết qu ............................................................................... 58
4.2.3. Hình nh minh ha kết qu d báo ............................................................ 61
4.2.4. Phân tích độ quan trng của các đặc trưng (Features Importance) .............. 63
4.3. Điều chnh tham s và Đánh giá kết qu .......................................................... 66
4.3.1. Các tham s được điều chnh ..................................................................... 66
4.3.2. Kết qu sau điều chnh .............................................................................. 66
KT LUN .............................................................................................................. 68
TÀI LIU THAM KHO ....................................................................................... 69