
GIÁOTRÌNH
NHẬNDẠNGVÀXỬLÝẢNH
Biênsoạn:TS.HoàngVănDũng
Tháng5năm2018

Lờinóiđầu
Cùngvớisựpháttriểnnhanhchóngcủakhoahọccôngnghệ,cáckỹthuậtdựa
trêntrítuệnhântạovàthịgiácmáytínhứngdụngtrongcáchệthốngthôngminhđạt
đượcnhữngkếtquảvượtbậc,cónhiềutriểnvọng.Cuộccáchmạngcôngnghiệplần
thứ4(Industry4.0)hiệnđangdiễnratạitrênphạmvitoàncầu,đặcbiệtởcácnướccó
nền khoa học kỹ thuật phát triển…. Industry4.0 tập trung vào sảnxuất và dịch vụ
thôngminhchủyếudựatrêncáchệthốngtươngtácthựcảo,cáchệthốngthôngminh
dầnthaythếconngười.Nềntảngcủacáchệthốngthôngminhcóthểnóibắtnguồntừ
lĩnhvựctrítuệnhântạovàthịgiácmáy.Trongđó,thịgiácmáylàmộttrongnhững
giácquanmáyquantrọngnhấtgiúpchoquátrìnhthunhậntínhiệu,xửlý,phântích
nhằmđưaratrithứcphụcvụcáchệthốngraquyếtđịnh.
Trongthờigianqua,cáckỹthuậtmớitronglĩnhvựcthịgiácmáytính,màcụthể
hơnlàxửlýảnhvànhậndạngđãđượcnhiềunhàkhoahọc,tậpđoàncôngnghệchú
trọngnghiêncứu,pháttriển,làmthayđổihướngtiếpcậntruyềnthốngvídụnhưcác
kỹthuậthọcsâu.Vìthế,cáckiếnthứcvềxửlýảnh,nhậndạngmẫu,trítuệnhântạo,
học máy đã trở thành môn học quan trọngđốivớisinh viên các chuyên ngành liên
quanđếnkhoahọcmáytính,côngnghệthôngtin,tựđộnghóatrongcáctrườngđại
họcởViệtNamhiệnnay.Tuynhiên,tàiliệutiếngViệtchosinhviênvànhữngngười
quantâmlạicógiớihạnvềcậpnhậtcôngnghệ,kỹthuật.GiáotrìnhNhậndạngvàxử
lý ảnhnhằmcungcấpnhữngkiếnthứccơbảnvềkỹthuậtxửlýhìnhảnhcũngnhư
giớithiệumộtsốphươngpháptrítuệnhântạođượcápdụngphântíchhìnhảnhvà
nhậndạngmẫu.Kỹthuậthọcsâulàhướngtiếpcậnmớiđangđượcnhiềunhàkhoahọc
nghiêncứuvàcáccôngtycôngnghệquantâmvàkhảnăngứngdụngcaotrongthực
tếcũngđượctrìnhbàytrongtàiliệunày.
Nộidunggiáotrìnhgồm7chươnglầnlượttrìnhbàynhữngkiếnthứcnhậpmôn
vềxửlýảnh,cácphươngphápnângcaotrongphântích,nhậndạngmẫu,kỹthuậthọc
sâunhư:cácphépbiếnđổi,điềuchỉnhnângcaochấtlượngảnh;biếnđổiảnhmàu,ảnh
đamứcxám,toántửtíchchập,cácbộlọcảnhvàphépbiếnđổikhônggianảnh,biến
đổihình tháihọcứngdụngtrong phântích vùng ảnh,trích biênđốitượng;phương
phápphânđoạnảnhtheophânngưỡngthủcông,phânngưỡngtựđộng;phươngpháp
phân tích ảnh như phân đoạn ảnh bằng thuật toán phân cụm k-means, Meanshift,
Watershed, trích chọn đặc trưng cơ bản như kỹ thuật trích chọn cạnh, điểm chính
(keypoint) và mô tả vùng đặc trưng vùng ảnh. Giáo trình cũng giới thiệu một số
phươngpháptríchchọnđặctrưngnângcaonhưSIFT,SUFT,HOG,Haar-likefeature;
phươngphápsokhớpđặctrưnggiữacácảnhphụcvụpháthiệnđốitượngtươngđồng
vànhậndạngmẫucùngvớikỹthuậtlọcloạitrừnhiễutrongsokhớpảnh.Phầncuối
trìnhbàynhữngkỹthuậtnhậndạngmẫuvàphânloạiđốitượngtừcáchtiếpcậntruyền
thống như cây quyết định,rừngngẫu nhiên, boosting, máy phân loại hỗ trợ vector
SVM,mạngneuralnhântạovàđếnkỹthuậthọcsâu,mạngneuraltíchchậpnhưmạng
LeNet,AlexNet,ZFNet,GooLeNet,VGGNet,R-CNNvàkiếntrúcmạngmôtảngữ
nghĩaảnh.
Tàiliệunàyđượcbiênsoạndựatrênkinhnghiệmtíchlũyquaquátrìnhnghiên
cứuvàgiảngdạycủatácgiảliênquanđếnlĩnhvựcthịgiácmáytính,trítuệnhântạo
vàcáchệthốngthôngminh.Hyvọng,giáotrìnhlàtàiliệuhữuíchphụcvụhọctập,

thamkhảochosinhviêncácngànhliênquanđếnkhoahọcmáytính,côngnghệthông
tin,cũngnhưđộcgiảquantâmđếnlĩnhvựcnhậndạngxửlýảnhvàứngdụngtrítuệ
nhântạotrongnhậndạngmẫu.
Tácgiảxinchânthànhcảmơncácýkiếnđónggóp,hỗtrợcủađồngnghiệpvà
đặcbiệtlàsựquantâmcủaLãnhđạoTrườngĐạihọcQuảngBìnhtrongquátrìnhbiên
soạntàiliệunày.
Trongquátrìnhbiênsoạn,giáotrìnhchắcchắnkhôngthểtránhkhỏinhữngthiếu
sót.Tácgiảrấtmongnhậnđượcnhữngýkiếnđónggópcủaquýthầycô,nhànghiên
cứu,sinhviênvàđộcgiảđểtácgiảcóthểđiềuchỉnhhợplý,kịpthời.
Gópýxingửivề: HoàngVănDũng
TrườngĐạihọcQuảngBình
312LýThườngKiệt,TP.ĐồngHới,QuảngBình
Email:zunghv@gmail.com
Ngườibiênsoạn:HoàngVănDũng

i
MỤCLỤC
CHƯƠNG1.NHẬPMÔNXỬLÝẢNH...............................................................1
1.1.Tổngquanvềxửlýảnh...................................................................................1
1.1.1.Cáckháiniệmvềảnhsố,điểmảnh..........................................................1
1.1.2.Cácthànhphầntronghệthốngxửlýảnh.................................................3
1.1.3.Cácứngdụng............................................................................................4
1.2.Hệmàuvàloạiảnh..........................................................................................4
1.2.1.Cáchệmàuthôngdụng............................................................................4
1.2.2.Mộtsốloạiảnhthôngdụng......................................................................7
1.3.Cấutrúcdữliệuảnh........................................................................................9
1.3.1.Cấutrúcảnhvector...................................................................................9
1.3.2.Cấutrúcảnhraster..................................................................................10
1.4.Mộtsốđịnhdạngảnhphổbiến.....................................................................10
1.4.1.ĐịnhdạngảnhTIFF...............................................................................11
1.4.2.ĐịnhdạngảnhGIF.................................................................................11
1.4.3.ĐịnhdạnghìnhảnhJPG.........................................................................12
1.4.4.ĐịnhdạngảnhBMP...............................................................................12
1.4.5.ĐịnhdạngảnhPNG................................................................................13
1.4.6.Sosánhcácchuẩnđịnhdạng..................................................................13
Câuhỏivàbàitập.................................................................................................13
CHƯƠNG2.BIẾNĐỔIXỬLÝẢNH.................................................................15
2.1.Kháiniệm......................................................................................................15
2.2.Cácphépbiếnđổitrênđiểmảnh...................................................................16
2.2.1.Lượcđồảnh............................................................................................16
2.2.2.Điềuchỉnhmứcsáng..............................................................................16
2.2.3.Điềuchỉnhđộtươngphản......................................................................17
2.2.4.Cânbằnglượcđồảnh.............................................................................18
2.2.5.Biếnđổiảnhmàuvàđamứcxám..........................................................20
2.3.Cácphươngphápxửlýảnhthôngdụng........................................................22
2.3.1.Phươngpháptíchchập...........................................................................22
2.3.2.Cáckỹthuậtlọcthôngdụng...................................................................23
2.4.Cácphépbiểnđổitoàncục............................................................................28
2.4.1.Biếnđổicosinrờirạc..............................................................................28
2.4.2.BiếnđổiFourierrờirạc..........................................................................31
2.5.Biếnđổihìnhtháihọc....................................................................................34
2.5.1.Phầntửcấutrúc......................................................................................34
2.5.2.Phépcoảnh–Erosion............................................................................35

ii
2.5.3.Phépgiãnảnh–Dilation........................................................................36
2.5.4.Phépmởảnh–Openning.......................................................................36
2.5.5.Phépđóngảnh-Closing..........................................................................37
2.5.6.Phépbiếnđổi"Hitormiss"....................................................................37
2.5.7.Ứngdụngcủakỹthuậthìnhtháihọc.....................................................39
Câuhỏivàbàitập.................................................................................................43
CHƯƠNG3.PHƯƠNGPHÁPPHÂNĐOẠNẢNH...........................................46
3.1.Tổngquanvềphânđoạnảnh.........................................................................46
3.2.Phânđoạnbằngngưỡng................................................................................47
3.2.1.Phânngưỡngthủcông............................................................................48
3.2.2.Phânđoạnngưỡngtựđộng.....................................................................48
3.2.3.PhânđoạnbằngkỹthuậtOtsu................................................................53
3.3.Phânđoạnbằngk-means...............................................................................55
3.4.KỹthuậtphânđoạnMeanShift......................................................................58
3.5.PhânđoạnbằngkỹthuậtWatershed.............................................................59
3.6.Phânđoạnphâncấp.......................................................................................62
Câuhỏivàbàitập.................................................................................................63
CHƯƠNG4.TRÍCHCHỌNĐẶCTRƯNGCƠBẢN........................................65
4.1.Cáckháiniệm................................................................................................65
4.1.1.Đặctrưngvàtríchchọnđặctrưngảnh...................................................65
4.1.2.Đặctrưngmứcthấp................................................................................66
4.1.3.Đặctrưngmứccao.................................................................................67
4.2.Kỹthuậttríchchọnđặctrưngcạnh...............................................................67
4.2.1.TríchchọnbiênbằngtoántửSobel........................................................68
4.2.2.TríchchọnbiênbằngtoántửPrewitt.....................................................69
4.2.3.TríchchọnbiênbằngtoántửRobert......................................................70
4.2.4.TríchchọnbiênbằngphươngphápCanny............................................70
4.3.Kỹthuậttríchchọnđặctrưngđiểmchính.....................................................72
4.3.1.Tríchxuấtđiểmgóc................................................................................72
4.3.2.Tríchxuấtđặctrưngđốm.......................................................................77
Câuhỏivàbàitập.................................................................................................80
CHƯƠNG5.ĐẶCTRƯNGNÂNGCAOVÀSOKHỚPẢNH.........................83
5.1.Giớithiệuchung............................................................................................83
5.2.MôtảđặctrưngSIFT....................................................................................83
5.2.1.ĐặctrưngSIFT.......................................................................................83
5.2.2.QuátrìnhxửlýSIFT..............................................................................84
5.3.MôtảđặctrưngSURF..................................................................................89

