Hc Máy
(IT 4862)
h
Nguy
n N
h
t Quang
quangnn-fit@mail.hut.edu.vn
Trường Đại hc Bách Khoa Hà Ni
Vin Công ngh thông tin và truyn thông
Năm hc 2011-2012
Ni
d
ô
h
Ni
d
ung m
ô
n
h
c:
Gii thiu chun
g
g
Đánh giá hiunăng hthng hcmáy
Các phương pháp hcdatrênxácsut
Các
phương
pháp
hc
da
trên
xác
sut
Các phương pháp hccógiámsát
Gii
thut
di
truyn
(Genetic algorithm)
Gii
thut
di
truyn
(Genetic
algorithm)
Các phương pháp hc không giám sát
L
L
cc
ng
c
Hctăng cường
2
Hc Máy – IT 4862
Gii thut di tru
y
n
Gii thiu
Da trên (bt chước) quá trình tiến hóa t nhiên trong sinh hc
Á
p
d
n
g
p
hươn
g
p
p
tìm kiếm n
g
u nhiên
(
stochastic search
)
pgp gp p g()
để tìm được li gii (vd: mt hàm mc tiêu, mt mô hình phân
lp, …) ti ưu
Giithutditruyn (Generic Algorithm
GA) khnăng tìm
Gii
thut
di
truyn
(Generic
Algorithm
GA)
kh
năng
tìm
được các li gii tt thm chí ngay c vi các không gian tìm
kiếm (li gii) không liên tc rt phc tp
Mikh ă liiiđbidib hih
Mi
kh
n
ă
ng c
a
li
g
ii
đ
ược
bi
u
di
n
b
ng m
t c
h
u
i
n
h
phân (vd: 100101101) – được gi là nhim sc th
(chromosome)
Vic biu din này ph thuc vào tng bài toán c th
GA cũng được xem như mt bài toán hc máy (a learning
bl
)d á hti (
ti i ti
)
3
Hc Máy – IT 4862
p
ro
bl
em
)
d
a
t
r
ê
n qu
á
t
r
ì
n
h
ti
ưu
a
(
op
ti
m
i
za
ti
on
)
Gii thut di tru
y
n
Các bước chính
Xây dng (khito) qunth(population) ban đầu
To nên mtscác githiết(khnăng caligii) ban đầu
Mi
gi
thiết
khác
các
gi
thiết
khác
(
vd
:
khác
nhau
đối
vi
các
giá
tr
ca
mt
Mi
gi
thiết
khác
các
gi
thiết
khác
(
vd
:
khác
nhau
đối
vi
các
giá
tr
ca
mt
stham snào đóca bài toán)
Đánh giá qunth
Đánh
giá
(
cho
đim
)
mi
gi
thiết
(
d
bng
cách
kim
tra
độ
chính
ác
ca
Đánh
giá
(
cho
đim
)
mi
gi
thiết
(
v
d
:
bng
cách
kim
tra
độ
chính
x
ác
ca
hthng trên mttpdliukimth)
Trong lĩnh vcsinhhc, đimđánh giá này camigithiếtđượcgilàđộ
phù
hp
(fitness)
ca
gi
thiết
đó
phù
hp
(fitness)
ca
gi
thiết
đó
Xếphng các githiết theo mcđộ phù hpca chúng, và chgili các gi
thiếtttnht(gilàcác githiết phù hpnht survival of the fittest)
Sn
sinh
ra
thế
h
tiếp
theo
(next generation)
Sn
sinh
ra
thế
h
tiếp
theo
(next
generation)
Thay đổingu nhiên các githiếtđể snsinhrathế htiếp theo (gilàcác
con cháu offspring)
Lp
li
quá
trình
trên
cho
đến
khi
mt
thế
h
nào
đó
gi
thiết
tt
nht
độ
4
Hc Máy – IT 4862
Lp
li
quá
trình
trên
cho
đến
khi
mt
thế
h
nào
đó
gi
thiết
tt
nht
độ
phù hp cao hơn giá tri phù hp mong mun(định trước)
GA(Fitness, θ, n, rco, rmu)
Fit
A f ti th t d th (fit ) i h th i
Fit
ness:
A
f
unc
ti
on
th
a
t
pro
d
uces
th
e score
(fit
ness
)
g
i
ven a
h
ypo
th
es
i
s
θ: The desired fitness value (i.e., a threshold specifying the termination condition)
n: The number of hypotheses in the population
r
co: The percentage of the population influenced by the crossover operator at each step
rmu: The percentage of the population influenced by the mutation operator at each step
Initialize the population:
H
Randomly generate
hypotheses
Initialize
the
population:
H
Randomly
generate
n
hypotheses
Evaluate the initial population. For each hH: compute Fitness(h)
w
hile (max
{h
H
}
Fitness(h) <
θ
)
do
{h
H
}
Hnext
Reproduction (Replication). Probabilistically select (1-rco).nhypotheses of
H
to add to
H
next
H
to
add
to
H
next
.
The probability of selecting hypothesis hifrom His:
=n
j
i
i
)Fitness(h
)Fitness(h
)P(h
=
j
1
5
Hc Máy – IT 4862