
Trang: iii
MỤC LỤC
DANH MỤC TỪ VIẾT TẮT ......................................................................................... v
DANH MỤC CÁC BẢNG ............................................................................................. v
DANH MỤC BIỂU ĐỒ, ĐỒ THÌ, HÌNH ẢNH, SƠ ĐỒ .............................................. v
TÓM TẮT LUẬN VĂN ................................................................................................ vi
MỞ ĐẦU ........................................................................................................................ 1
CHƯƠNG 1. GIỚI THIỆU ............................................................................................ 2
1.1. Phân lớp dữ liệu ................................................................................................. 2
1.2. Tình hình nghiên cứu ......................................................................................... 2
1.3. Mục tiêu của đề tài ............................................................................................. 2
1.4. Nội dung và phương pháp nghiên cứu ............................................................... 2
CHƯƠNG 2. MÔ HÌNH VÀ PHƯƠNG PHÁP NGHIÊN CỨU .................................. 4
2.1. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU ........................................................ 4
2.1.1. Khái niệm .................................................................................................. 4
2.2. MỘT PHƯƠNG PHÁP HỌC MÁY PHỔ BIẾN .............................................. 5
2.2.1. Khái niệm học máy .................................................................................... 5
2.2.2. Một số phương pháp học máy ................................................................... 5
2.2.2.1. Học có giám sát ...................................................................................... 5
2.2.2.2. Học không có giám sát ........................................................................... 6
2.2.2.3. Học bán giám sát .................................................................................... 6
2.2.3. Một số thuật toán học máy ........................................................................ 6
2.2.3.1. Hồi quy tuyến tính (Linear regression) .................................................. 6
2.2.3.2. Thuật toán cây quyết định (Decision trees) ............................................ 7
2.2.3.3. Thuật toán K_means ............................................................................... 7
2.2.3.4. Thuật toán K láng giềng gần nhất (K-nearest neighbors) ...................... 7
2.3. PHƯƠNG PHÁP RANDOM FOREST ............................................................. 7
2.3.1. Cây quyết định ........................................................................................... 7
2.3.2. Rừng ngẫu nhiên (Random Forest) ........................................................... 8
2.4. Một số công trình nghiên cứu liên quan ............................................................ 8
CHƯƠNG 3. XÂY DỰNG MÔ HÌNH DỰ ĐOÁN ĐIỂM CỦA HỌC SINH
DÙNG RANDOM FOREST ........................................................................................ 10
3.1. MÔ TẢ DỮ LIỆU BÀI TOÁN ........................................................................ 10
3.2. MÔ HÌNH HUẤN LUYỆN ............................................................................. 13