Các khái ni m trong H c máy (Machine Learning) (1) – T ng quan
H c máy(Machine Learning) là m t ngành khoa h c nghiên c u các
thu t toán cho phép máy tính có th h c đ c các khái ni m ( ượ concept).
Phân lo i:Có hai lo i ph ng pháp h c máy chính ươ
Ph ng pháp quy n pươ : Máy h c/phân bi t các khái ni m d a trên
d li u đã thu th p đ c tr c đó. Ph ng pháp này cho phép t n ượ ướ ươ
d ng đ c ngu n d li u r t nhi u và s n có. ượ
Ph ng pháp suy di nươ : Máy h c/phân bi t các khái ni m d a vào
các lu t. Ph ng pháp này cho phép t n d ng đ c các ki n th c ươ ượ ế
chuyên ngành đ h tr máy tính.
Hi n nay, các thu t toán đ u c g ng t n d ng đ c u đi m c a hai ượ ư
ph ng pháp này.ươ
Các ngành khoa h c liên quan:
Lý thuy t th ng kê:ế các k t qu trong xác su t th ng kê là ti nế
đ cho r t nhi u ph ng pháp h c máy. Đ c bi t, lý thuy t th ng ươ ế
kê cho phép c l ng sai s c a các ph ng pháp h c máy.ướ ượ ươ
Các ph ng pháp tính:ươ các thu t toán h c máy th ng s d ng ườ
các tính toán s th c/s nguyên trên d li u r t l n. Trong đó, các
bài toán nh : t i u có/không ràng bu c, gi i ph ng trình tuy nư ư ươ ế
tính v.v… đ c s d ng r t ph bi n.ượ ế
Khoa h c máy tính: là c s đ thi t k các thu t toán, đ ng th iơ ế ế
đánh giá th i gian ch y, b nh c a các thu t toán h c máy.
ng d ng: H c máy ng d ng r ng kh p trong các ngành khoa
h c/s n xu t, đ c bi t nh ng ngành c n phân tích kh i l ng d li u ượ
kh ng l . M t s ng d ng th ng th y ( ườ wikipedia§):
X lý ngôn ng t nhiên (Natural Language Processing): x
văn b n, giao ti p ng i – máy, … ế ườ
Nh n d ng (Pattern Recognition): nh n d ng ti ng nói, ch vi t ế ế
tay, vân tay, th giác máy (Computer Vision) …
Tìm ki m (Search Engine)ế
Ch n đoán trong y t : phân tích nh X-quang, các h chuyên gia ế
ch n đoán t đ ng.
Tin sinh h c: phân lo i chu i gene, quá trình hình thành
gene/protein
V t lý: phân tích nh thiên văn, tác đ ng gi a các h t …
Phát hi n gian l n tài chính (financial fraud): gian l n th t n
d ng
Phân tích th tr ng ch ng khoán (stock market analysis) ườ
Ch i trò ch i: t đ ng ch i c , hành đ ng c a các nhân v t oơ ơ ơ
Rôb t: là t ng h p c a r t nhi u ngành khoa h c, trong đó h c
máy t o nên h th n kinh/b não c a ng i máy. ườ
Các nhóm gi i thu t h c máy:
H c có giám sát: Máy tính đ c xem m t s m u g m ượ đ u vào
(input) và đ u ra (output) t ng ng tr c. Sau khi h c xong cácươ ướ
m u này, máy tính quan sát m t đ u vào m i và cho ra k t qu . ế
H c không giám sát: Máy tính ch đ c xem các m u ượ không có
đ u ra, sau đó máy tính ph i t tìm cách phân lo i các m u này và
các m u m i.
H c n a giám sát: M t d ng lai gi a hai nhóm gi i thu t trên.
H c tăng c ng: ườ Máy tính đ a ra quy t đ nh ư ế hành đ ng (action)
và nh n k t qu ế ph n h i (response/reward) t môi tr ngườ
(environment). Sau đó máy tính tìm cách ch nh s a cách ra quy t đ nh ế
hành đ ng c a mình.
Các khái ni m trong H c máy (Machine Learning)
(2) – Xác su t, công th c Bayes
Đ nh nghĩa (- đ i s ): Cho t p , t p g i là - đ i s c a n u ế
1. Các ph n t c a là các t p con c a
2. T p khác r ng:
3. T p đóng v i phép h p: .
4. T p đóng v i phép bù:
Ví d :
1. T các tính ch t, ta th y - đ i s luôn ch a t p r ng và t p vũ
tr (vì ).
2. N u thì , , là các - đ i s trên .ế
Đ nh nghĩa (đ đo): Cho và là - đ i s trên . Hàm g i là đ đo trên
n uế
1.
2.
3. N u và không giao nhau t ng đôi m t () thì ế
Ta nói b không gian đo đ c. ượ
Đ nh nghĩa (không gian m u, bi n c , xác su t): ế
Không gian m u: M t t p khác r ng g i không gian m u n u cácế
ph n t c a nó có th là k t qu c a m t phép ế th c nghi m ng u
nhiên.
Ví d :
1. Có m t h p có g m 10 viên bi bên trong, nh m m t l i ch n
ng u nhiên 1 viên bi. Nh v y m i viên bi đ u có th là k t qu ư ế
c a phép th c nghi m này, không gian m u là là s hi u cu
t ng viên bi.
2. Có 3 ng i, ch n ng u nhiên 1 ng i và h i ng i này có thíchườ ườ ườ
màu đ không? Không gian m u là . N u h i c 3 ng i xem h ế ườ
có thích màu đ không, lúc này không gian m u l i là , trong đó là
thích, là không thích.
Bi n c :ế M t - đ i s c a không gian m u g i là t p các bi n c ế
trên . M i t p g i là m t bi n cế . Khi th c nghi m ng u nhiên cho k t ế
qu thì v i các bi n c mà , ta nói bi n c đã x y ra. ế ế
Ví d :
1. Xét hòm bi có 3 viên bi, và t p bi n c . N u ta nh c đ c hòn bi ế ế ượ
s thì các bi n c đã x y ra, còn các bi n c không x y ra. ế ế
2. N u h i c 3 ng i xem h có thích màu đ không, không gianế ườ
m u là . Bi n c “có đúng 2 ng i thích màu đ là” , bi n c “có ế ườ ế
ít nh t 1 ng i không thích màu đ ” là . ườ
Xác su t: Xét m t th c nghi m ng u nhiên v i không gian m u và t p
các bi n c , ta nói đ đo trên là ế đ đo xác su t n u (có th suy ra ).ế