ĐẠI HC QUC GIA HÀ NI
TRƢỜNG ĐẠI HC CÔNG NGH
NGUYN THU TRANG
BÀI TOÁN TÌM KIM MOTIF VÀ
PHƢƠNG PHÁP TỐI ƢU ĐÀN KIẾN
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
Hà Nội, năm 2016
ĐẠI HC QUC GIA HÀ NI
TRƢỜNG ĐẠI HC CÔNG NGH
NGUYN THU TRANG
BÀI TOÁN TÌM KIM MOTIF VÀ
PHƢƠNG PHÁP TỐI ƢU ĐÀN KIẾN
Ngành : Công ngh thông tin
Chuyên ngành : H thng thông tin
Mã s : 60480104
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
Ngƣời hƣớng dn khoa hc: PGS. TS Hoàng Xuân Hun
Hà Nội, năm 2016
1
LI CM ƠN
Trƣớc tiên, tôi xin gi li cảm ơn chân thành lòng biết ơn sâu sc nht
ti thy giáo, PGS.TS. Hoàng Xuân Huấn, ngƣời thầy đáng kính đã tận tình ch
bảo, hƣớng dn, động viên giúp đỡ tôi trong sut quá trình tìm hiu, nghiên
cu và hoàn thin luận văn. Thầy cũng đƣa ra những góp ý chi tiết, t m hết sc
quý báu giúp cho tôi có th hoàn thành quyn luận văn này.
Th hai, tôi ng xin đƣợc gi li cảm ơn sâu sc ti em Dƣơng Thị Ánh
Tuyết, ngƣời đã giúp đỡ tôi gii quyết nhng khúc mc trong quá trình viết
chƣơng trình để chy thc nghim.
Th ba, tôi xin gi li cảm ơn ti các thầy cô trƣờng Đại Hc Công Ngh
- Đại Hc Quc Gia Ni những ngƣời đã tận tình giúp đỡ, c góp ý
cho tôi trong sut thi gian tôi hc tp và nghiên cu tại trƣờng.
Th tƣ, tôi xin gi li cảm ơn tới các bn hc viên cùng hc tp nghiên
cu tại trƣờng Đại hc Công ngh đã hỗ tr tôi rt nhiu trong quá trình hc tp
cũng nhƣ thực hin luận văn.
Th năm, tôi xin gi li cảm ơn tới gia đình bn bè, những ngƣời thân
yêu luôn bên cnh, quan tâm, động viên tôi giúp tôi vƣợt qua khó khăn trong
quá trình hc tp và thc hin luận văn tốt nghip này.
Cuối cùng tôi cũng bày t lòng biết ơn về s giúp đ ca lãnh đạo trƣờng,
khoa Công ngh thông tin Trƣờng cao đẳng Thng quan nơi tôi công
tác đã tạo điu kin tt nht cho tôi v thời gian cũng nhƣ động viên tôi sm
hoàn thành bài luận văn.
Hà Ni, tháng 10 năm 2016
2
LI CAM ĐOAN
Tôi xin cam đoan rằng đây công trình nghiên cu của nhân tôi i
s ng dn giúp đỡ ca PGS.TS. Hoàng Xuân Hun. Các kết qu đƣc viết
chung vi các tác gi khác đều đƣợc s đồng ý ca tác gi trƣớc khi đƣa vào
luận văn. Trong toàn b ni dung nghiên cu ca luận văn, các vấn đề đƣc
trình bày đều nhng tìm hiu nghiên cu ca chính nhân tôi hoc
đƣc trích dn t các ngun tài liu có ghi tham kho rõ ràng, hp pháp.
Trong luận văn, tôi tham khảo đến mt s tài liu ca mt s tác gi
đƣc lit kê ti mc tài liu tham kho
Hà ni, tháng 10 năm 2016
Nguyn Thu Trang
3
MC LC
LI CẢM ƠN .................................................................................................................. 1
LỜI CAM ĐOAN ............................................................................................................ 2
DANH MC KÝ HIU VÀ T VIT TT .................................................................. 5
DANH MC CÁC BNG .............................................................................................. 6
DANH SÁCH CÁC HÌNH V ....................................................................................... 7
M ĐẦU ......................................................................................................................... 8
Chƣơng 1: TIN SINH HỌC VÀ BÀI TOÁN TÌM KIM (l,d) MOTIF ....................... 10
1.1. Tin sinh hc ........................................................................................................ 10
1.1.1 Gii thiu v tin sinh hc ............................................................................. 10
1.1.2 Khái nim trong sinh hc ............................................................................. 10
1.1.2.1 DNA ........................................................................................................ 10
1.1.2.2 RNA ......................................................................................................... 11
1.1.2.3 Protein ..................................................................................................... 12
1.1.2.4 Quá trình tng hp protein ...................................................................... 13
1.1.2.5 Mt s bài toán trong tin sinh hc ........................................................... 13
1.1.3 Motif ............................................................................................................. 14
1.1.3.1 Quá trình điu hòa gen ............................................................................ 14
1.1.3.2 Ý nghĩa của Motif.................................................................................... 15
1.1.3.3 Biu din Motif ....................................................................................... 16
1.2. Bài toán tối ƣu tổ hp và bài toán tìm kiếm (ℓ,d) motif ..................................... 18
1.2.1 Bài toán tối ƣu t hp ................................................................................... 18
1.2.1.1 Gii thiu bài toán tối ƣu tổ hp ............................................................. 18
1.2.1.2 Gii thiệu bài toán ngƣời chào hàng ........................................................ 18
1.2.1.3 Các cách tiếp cn gii quyết bài toán tối ƣu tổ hp ................................ 19
1.2.2 Phát biu bài toán tìm kiếm (ℓ,d) motif ........................................................ 22
CHƢƠNG 2. GIỚI THIU V THUT TOÁN ANT COLONY OPTIMIZATION
(ACO) ............................................................................................................................ 25
2.1 Gii thiu v thut toán ACO .............................................................................. 25
2.2 Mô hình mô phng ca thut toán ....................................................................... 25
2.2.1 Kiến t nhiên ................................................................................................ 25