
Các khái ni m trong H c máy (Machine Learning) (1) – T ng quanệ ọ ổ
H c máyọ(Machine Learning) là m t ngành khoa h c nghiên c u cácộ ọ ứ
thu t toánậ cho phép máy tính có th h c đ c các khái ni m (ể ọ ượ ệ concept).
Phân lo i:ạCó hai lo i ph ng pháp h c máy chínhạ ươ ọ
•Ph ng pháp quy n pươ ạ : Máy h c/phân bi t các khái ni m d a trênọ ệ ệ ự
d li u đã thu th p đ c tr c đó. Ph ng pháp này cho phép t nữ ệ ậ ượ ướ ươ ậ
d ng đ c ngu n d li u r t nhi u và s n có.ụ ượ ồ ữ ệ ấ ề ẵ
•Ph ng pháp suy di nươ ễ : Máy h c/phân bi t các khái ni m d a vàoọ ệ ệ ự
các lu t. Ph ng pháp này cho phép t n d ng đ c các ki n th cậ ươ ậ ụ ượ ế ứ
chuyên ngành đ h tr máy tính.ể ỗ ợ
Hi n nay, các thu t toán đ u c g ng t n d ng đ c u đi m c a haiệ ậ ề ố ắ ậ ụ ượ ư ể ủ
ph ng pháp này.ươ
Các ngành khoa h c liên quan:ọ
•Lý thuy t th ng kê:ế ố các k t qu trong xác su t th ng kê là ti nế ả ấ ố ề
đ cho r t nhi u ph ng pháp h c máy. Đ c bi t, lý thuy t th ngề ấ ề ươ ọ ặ ệ ế ố
kê cho phép c l ng sai s c a các ph ng pháp h c máy.ướ ượ ố ủ ươ ọ
•Các ph ng pháp tính:ươ các thu t toán h c máy th ng s d ngậ ọ ườ ử ụ
các tính toán s th c/s nguyên trên d li u r t l n. Trong đó, cácố ự ố ữ ệ ấ ớ
bài toán nh : t i u có/không ràng bu c, gi i ph ng trình tuy nư ố ư ộ ả ươ ế
tính v.v… đ c s d ng r t ph bi n.ượ ử ụ ấ ổ ế
•Khoa h c máy tính:ọ là c s đ thi t k các thu t toán, đ ng th iơ ở ể ế ế ậ ồ ờ
đánh giá th i gian ch y, b nh c a các thu t toán h c máy.ờ ạ ộ ớ ủ ậ ọ
ng d ng:Ứ ụ H c máyọ có ng d ng r ng kh p trong các ngành khoaứ ụ ộ ắ
h c/s n xu t, đ c bi t nh ng ngành c n phân tích kh i l ng d li uọ ả ấ ặ ệ ữ ầ ố ượ ữ ệ
kh ng l . M t s ng d ng th ng th y (ổ ồ ộ ố ứ ụ ườ ấ wikipedia§):
•X lý ngôn ng t nhiên (Natural Language Processing): x lýử ữ ự ử
văn b n, giao ti p ng i – máy, …ả ế ườ
•Nh n d ng (Pattern Recognition): nh n d ng ti ng nói, ch vi tậ ạ ậ ạ ế ữ ế
tay, vân tay, th giác máy (Computer Vision) …ị
•Tìm ki m (Search Engine)ế
•Ch n đoán trong y t : phân tích nh X-quang, các h chuyên giaẩ ế ả ệ
ch n đoán t đ ng.ẩ ự ộ
•Tin sinh h c: phân lo i chu i gene, quá trình hình thànhọ ạ ỗ
gene/protein
•V t lý: phân tích nh thiên văn, tác đ ng gi a các h t …ậ ả ộ ữ ạ
•Phát hi n gian l n tài chính (financial fraud): gian l n th t nệ ậ ậ ẻ ỉ
d ngụ
•Phân tích th tr ng ch ng khoán (stock market analysis)ị ườ ứ
•Ch i trò ch i: t đ ng ch i c , hành đ ng c a các nhân v t oơ ơ ự ộ ơ ờ ộ ủ ậ ả
•Rôb t: là t ng h p c a r t nhi u ngành khoa h c, trong đó ố ổ ợ ủ ấ ề ọ h cọ
máy t o nên h th n kinh/b não c a ng i máy.ạ ệ ầ ộ ủ ườ
Các nhóm gi i thu t h c máy:ả ậ ọ
•H c có giám sát:ọ Máy tính đ c xem m t s m u g m ượ ộ ố ẫ ồ đ u vàoầ

(input) và đ u raầ (output) t ng ng tr c. Sau khi h c xong cácươ ứ ướ ọ
m u này, máy tính quan sát m t đ u vào m i và cho ra k t qu .ẫ ộ ầ ớ ế ả
•H c không giám sát:ọ Máy tính ch đ c xem các m u ỉ ượ ẫ không có
đ u raầ, sau đó máy tính ph i t tìm cách phân lo i các m u này vàả ự ạ ẫ
các m u m i.ẫ ớ
•H c n a giám sát:ọ ử M t d ng lai gi a hai nhóm gi i thu t trên.ộ ạ ữ ả ậ
•H c tăng c ng:ọ ườ Máy tính đ a ra quy t đ nh ư ế ị hành đ ngộ (action)
và nh n k t qu ậ ế ả ph n h iả ồ (response/reward) t ừmôi tr ngườ
(environment). Sau đó máy tính tìm cách ch nh s a cách ra quy t đ nhỉ ử ế ị
hành đ ng c a mình.ộ ủ
Các khái ni m trong H c máy (Machine Learning)ệ ọ
(2) – Xác su t, công th cấ ứ Bayes
Đ nh nghĩa ị(- đ i sạ ố): Cho t p , t p g i là - đ i s c a n uậ ậ ọ ạ ố ủ ế
1. Các ph n t c a là các t p con c a ầ ử ủ ậ ủ
2. T p khác r ng: ậ ỗ
3. T p đóng v i phép h p: .ậ ớ ợ
4. T p đóng v i phép bù: ậ ớ
Ví d :ụ
1. T các tính ch t, ta th y - đ i s luôn ch a t p r ng và t p vũừ ấ ấ ạ ố ứ ậ ỗ ậ
tr (vì ).ụ
2. N u thì , , là các - đ i s trên .ế ạ ố
Đ nh nghĩa (đ đo):ị ộ Cho và là - đ i s trên . Hàm g i là ạ ố ọ đ đoộ trên
n uế
1.
2.

3. N u và không giao nhau t ng đôi m t () thì ế ừ ộ
Ta nói b là không gian đo đ c.ộ ượ
Đ nh nghĩa (không gian m u, bi n c , xác su t):ị ẫ ế ố ấ
Không gian m u:ẫ M t t p khác r ng g i là ộ ậ ỗ ọ không gian m uẫ n u cácế
ph n t c a nó có th là k t qu c a m t phép ầ ử ủ ể ế ả ủ ộ th c nghi m ng uự ệ ẫ
nhiên.
Ví d :ụ
1. Có m t h p có g m 10 viên bi bên trong, nh m m t l i ch nộ ộ ồ ắ ắ ạ ọ
ng u nhiên 1 viên bi. Nh v y m i viên bi đ u có th là k t quẫ ư ậ ỗ ề ể ế ả
c a phép th c nghi m này, không gian m u là là s hi u cuủ ự ệ ẫ ố ệ ả
t ng viên bi.ừ
2. Có 3 ng i, ch n ng u nhiên 1 ng i và h i ng i này có thíchườ ọ ẫ ườ ỏ ườ
màu đ không? Không gian m u là . N u h i c 3 ng i xem hỏ ẫ ế ỏ ả ườ ọ
có thích màu đ không, lúc này không gian m u l i là , trong đó làỏ ẫ ạ
thích, là không thích.
Bi n c :ế ố M t - đ i s c a không gian m u g i là ộ ạ ố ủ ẫ ọ t p các bi n cậ ế ố
trên . M i t p g i là m t ỗ ậ ọ ộ bi n cế ố. Khi th c nghi m ng u nhiên cho k tự ệ ẫ ế
qu thì v i các bi n c mà , ta nói bi n c đã x y ra.ả ớ ế ố ế ố ả
Ví d :ụ
1. Xét hòm bi có 3 viên bi, và t p bi n c . N u ta nh c đ c hòn biậ ế ố ế ấ ượ
s thì các bi n c đã x y ra, còn các bi n c không x y ra.ố ế ố ả ế ố ả
2. N u h i c 3 ng i xem h có thích màu đ không, không gianế ỏ ả ườ ọ ỏ
m u là . Bi n c “có đúng 2 ng i thích màu đ là” , bi n c “cóẫ ế ố ườ ỏ ế ố
ít nh t 1 ng i không thích màu đ ” là .ấ ườ ỏ
Xác su t:ấ Xét m t th c nghi m ng u nhiên v i không gian m u và t pộ ự ệ ẫ ớ ẫ ậ
các bi n c , ta nói đ đo trên là ế ố ộ đ đo xác su tộ ấ n u (có th suy ra ).ế ể

