GV: HOÀNG ANH THƠ108
4.1. KHÁI NIỆM
Học Máy (M
achine Learning
) là một lĩnh vực của tr tu nhân
to liên quan đến vic nghiên cứu và xây dựng các kĩ thuật cho
phép các h thống "học" tự động từ dữ liu để giải quyết những
vấn đ cụ thể.
Học máy là một phương pháp để to ra các chương trình máy
tnh bằng vic phân tch các tập dữ liu.
Học máy có liên quan lớn đến thống kê, nghiên cứu vic phân tch
dữ liu, nhưng tập trung vào sự phức tp của các giải thuật trong
vic thực thi tnh toán.
GV: HOÀNG ANH THƠ109
4.2. NGUYÊN LÝ XÂY DỰNG MÔ HÌNH HỌC
MÁY
Vic xây dựng mô hình Machine Learning hin nay sẽ
được thực hin dựa trên 4 bước chnh như sau.
Bước 1: Chuẩn bị tập dữ liu để huấn luyn máy
Bước 2: Chọn thuật toán thực hin phân tch trên
nhóm dữ liu vừa chuẩn bị
Bước 3: Huấn luyn thuật toán để to ra mô hình
Machine Learning
Bước 4: Sử dụng và cải thin mô hình sau này
GV: HOÀNG ANH THƠ110
4.2. NGUYÊN LÝ XÂY DỰNG MÔ HÌNH HỌC
MÁY
Bước 1: Chuẩn bị tập dữ liệu để huấn luyện máy
Lưu ý: Tập dữ liu này phải ngẫu nhiên, không lặp li nhằm tránh
to hin tượng kết quả bị sai lch v một hướng nào đó
GV: HOÀNG ANH THƠ111
Dữ liệu được
gán nhãn (biết rõ
đặc tính)
Dữ liệu chưa
được gán nhãn
Dữ liệu huấn
luyện
(training
subset)
Dữ liệu kiểm
tra (evaluation
subset)
Dữ liệu huấn
luyện
(training
subset)
Dữ liệu kiểm
tra (evaluation
subset)
4.2. NGUYÊN LÝ XÂY DỰNG MÔ HÌNH HỌC
MÁY
Bước 2: Chọn thuật toán thực hiện phân tích trên
nhóm dữ liệu vừa chuẩn bị
oHin nay, có rất nhiu thuật toán được sử dụng để
phân tch dữ liu trong Machine Learning, trong đó
có thể kể đến như thuật toán cụm, thuật toán hồi
quy,...
GV: HOÀNG ANH THƠ112