BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
BÁO CÁO TỔNG KẾT
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG
NGHIÊN CỨU MỘT SỐ THUẬT TOÁN HỌC MÁY (MACHINE LEARNING)
ỨNG DỤNG CHO BÀI TOÁN XÁC ĐỊNH CÁC CHỦ ĐỀ QUAN TÂM
CỦA KHÁCH HÀNG TRỰC TUYẾN
Mã số đề tài: CS20_37
Chủ nhiệm đề tài:
ThS. Nguyễn Thị Hội
Thành viên tham gia:
ThS. Trần Thị Nhung
ThS. Nguyễn Thị Đào
Hà Nội, 03 - 2021
2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC THƯƠNG MẠI
BÁO CÁO TỔNG KẾT
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP TRƯỜNG
NGHIÊN CỨU MỘT SỐ THUẬT TOÁN HỌC MÁY (MACHINE LEARNING)
ỨNG DỤNG CHO BÀI TOÁN XÁC ĐỊNH CÁC CHỦ ĐỀ QUAN TÂM
CỦA KHÁCH HÀNG TRỰC TUYẾN
Mã số đề tài: CS20_37
Chủ nhiệm đề tài:
ThS. Nguyễn Thị Hội
Thành viên tham gia:
ThS. Trần Thị Nhung
ThS. Nguyễn Thị Đào
Xác nhận của Trường Đại học Thương mại Chủ nhiệm đề tài
3
MỤC LỤC
DANH MỤC TỪ VIẾT TẮT ......................................................................................... 5
DANH MỤC BẢNG BIỂU ............................................................................................. 6
DANH MỤC HÌNH VẼ .................................................................................................. 6
THÔNG TIN KẾT QUẢ NGHIÊN CỨU ....................................................................... 7
MỞ ĐẦU ......................................................................................................................... 8
CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI NGHIÊN CỨU ................................................... 8
1.1. TÍNH CẤP THIẾT CỦA ĐỀ TÀI NGHIÊN CỨU .............................................. 8
1.2. TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU ........................................................ 9
1.2.1 Tình hình nghiên cứu trong nước .................................................................... 9
1.2.2. Tính hình nghiên cứu ngoài nước ................................................................ 11
1.3. MỤC TIÊU NGHIÊN CỨU ............................................................................... 12
1.4. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU ................................................... 13
1.4.1. Đối tượng nghiên cứu .................................................................................. 13
1.4.2. Phạm vi nghiên cứu ...................................................................................... 13
1.5. PHƯƠNG PHÁP NGHIÊN CỨU ...................................................................... 13
1.5.1. Cách tiếp cận ................................................................................................ 13
1.5.2. Phương pháp nghiên cứu .............................................................................. 13
1.6. KẾT CẤU BÁO CÁO NGHIÊN CỨU .............................................................. 14
CHƯƠNG 2. HỌC MÁY VÀ ỨNG DỤNG TRONG BÀI TOÁN KINH TẾ ............. 16
2.1. TỔNG QUAN VỀ HỌC MÁY ........................................................................... 16
2.2. QUY TRÌNH PHÂN TÍCH DỮ LIỆU BẰNG HỌC MÁY ............................... 17
2.3. MỘT SỐ THUẬT TOÁN HỌC MÁY PHỔ BIẾN............................................ 17
2.3.1. Phân loại dựa trên phương thức học ............................................................ 17
2.3.2. Phân loại dựa trên sự tương đồng về cách hoạt động .................................. 20
2.4. ỨNG DỤNG HỌC MÁY TRONG CÁC BÀI TOÁN KINH TẾ ...................... 22
2.4.1. Học máy ứng dụng trong tài chính ............................................................... 22
2.4.2. Học máy ứng dụng trong Marketing ............................................................ 27
2.4.3. Học máy ứng dụng trong Thương mại điện tử............................................. 28
CHƯƠNG 3. BÀI TOÁN PHÂN LOẠI KHÁCH HÀNG THEO CHỦ ĐỀ ................ 31
3.1. VAI TRÒ CỦA PHÂN TÍCH DỮ LIỆU KHÁCH HÀNG ................................ 31
3.1.1. Quan hệ khách hàng trong kinh doanh......................................................... 31
4
3.1.2. Vai trò của bài toán phân tích dữ liệu khách hàng ....................................... 32
3.1.3. Dữ liệu khách hàng ...................................................................................... 33
3.2. BÀI TOÁN PHÂN LOẠI KHÁCH HÀNG TRỰC TUYẾN THEO CHỦ ĐỀ . 34
3.3. CÁC HƯỚNG TIẾP CẬN CỦA BÀI TOÁN .................................................... 35
3.4. ỨNG DỤNG CỦA BÀI TOÁN ......................................................................... 37
3.4.1. Ứng dụng trong hệ thống khuyến nghị ........................................................ 37
3.4.2. Ứng dụng trong phân nhóm khách hàng ...................................................... 38
CHƯƠNG 4: THỰC NGHIỆM, ĐÁNH GIÁ VÀ THẢO LUẬN ................................ 41
4.1. MỤC ĐÍCH VÀ CHUẨN BỊ CHO THỰC NGHIỆM ....................................... 41
4.1.1. Mục đích của thực nghiệm ........................................................................... 41
4.1.2. Các bước chuẩn bị cho thực nghiệm ............................................................ 41
4.2. KỊCH BẢN THỰC NGHIỆM VÀ THAM SỐ ĐẦU RA .................................. 48
4.2.1. Kịch bản thực nghiệm .................................................................................. 48
4.2.2. Tham số đầu ra ............................................................................................. 49
4.3. KẾT QUẢ THỰC NGHIỆM, ĐÁNH GIÁ VÀ THẢO LUẬN ......................... 49
4.5 CÁC HÀM Ý ĐỀ XUẤT ỨNG DỤNG CHO TỔ CHỨC, DOANH NGHIỆP .. 55
KẾT LUẬN ................................................................................................................... 59
DANH MỤC TÀI LIỆU THAM KHẢO ...................................................................... 60
PHỤ LỤC ...................................................................................................................... 62
5
DANH MỤC TỪ VIẾT TẮT
Từ viết
tắt
Diễn giải Nghĩa tiếng việt
AI Artificial Intelligence Trí tuệ nhân tạo
B2C Business to Customer Doanh nghiệp đến khách hàng
ML Machine Learning Học máy
TMĐT Thương mại điện tử
CNTT Công nghệ thông tin
CNN Convolutional Neural Network Mạng nơ ron tích chập
KNN K - Nearest Neighbors Người láng giềng gần nhất
MNB Multinomial Naive Bayes Mô hình xác suất phân lớp
SVM Support Vector Machines Mô hình không gian véc tơ
W2Vec Word to Vector Mô hình véc tơ