
GV: HOÀNG ANH THƠ108

4.1. KHÁI NIỆM
Học Máy (M
achine Learning
) là một lĩnh vực của tr tu nhân
to liên quan đến vic nghiên cứu và xây dựng các kĩ thuật cho
phép các h thống "học" tự động từ dữ liu để giải quyết những
vấn đ cụ thể.
Học máy là một phương pháp để to ra các chương trình máy
tnh bằng vic phân tch các tập dữ liu.
Học máy có liên quan lớn đến thống kê, nghiên cứu vic phân tch
dữ liu, nhưng tập trung vào sự phức tp của các giải thuật trong
vic thực thi tnh toán.
GV: HOÀNG ANH THƠ109

4.2. NGUYÊN LÝ XÂY DỰNG MÔ HÌNH HỌC
MÁY
Vic xây dựng mô hình Machine Learning hin nay sẽ
được thực hin dựa trên 4 bước chnh như sau.
Bước 1: Chuẩn bị tập dữ liu để huấn luyn máy
Bước 2: Chọn thuật toán thực hin phân tch trên
nhóm dữ liu vừa chuẩn bị
Bước 3: Huấn luyn thuật toán để to ra mô hình
Machine Learning
Bước 4: Sử dụng và cải thin mô hình sau này
GV: HOÀNG ANH THƠ110

4.2. NGUYÊN LÝ XÂY DỰNG MÔ HÌNH HỌC
MÁY
Bước 1: Chuẩn bị tập dữ liệu để huấn luyện máy
Lưu ý: Tập dữ liu này phải ngẫu nhiên, không lặp li nhằm tránh
to hin tượng kết quả bị sai lch v một hướng nào đó
GV: HOÀNG ANH THƠ111
Dữ liệu được
gán nhãn (biết rõ
đặc tính)
Dữ liệu chưa
được gán nhãn
Dữ liệu huấn
luyện
(training
subset)
Dữ liệu kiểm
tra (evaluation
subset)
Dữ liệu huấn
luyện
(training
subset)
Dữ liệu kiểm
tra (evaluation
subset)

4.2. NGUYÊN LÝ XÂY DỰNG MÔ HÌNH HỌC
MÁY
Bước 2: Chọn thuật toán thực hiện phân tích trên
nhóm dữ liệu vừa chuẩn bị
oHin nay, có rất nhiu thuật toán được sử dụng để
phân tch dữ liu trong Machine Learning, trong đó
có thể kể đến như thuật toán cụm, thuật toán hồi
quy,...
GV: HOÀNG ANH THƠ112