- 1 -
B GIÁO DC VÀ ĐÀO TO
ĐI HC ĐÀ NNG
NGUYN VĂN TRUNG
C ĐNH VN TC ĐI TƯNG CHUYN ĐNG QUA
CAMERA
Chuyên ngành: KHOA HC MÁY TÍNH
Mã s: 60.48.01
TÓM TT LUN VĂN THC SĨ K THUT
Ngưi hưng dn khoa hc: TS. Hunh Hu Hưng
Đà Nng - Năm 2012
- 2 -
M ĐU
1. Lý do chn ñi
Vi s phát trin nhanh chóng ca các loi máy móc hin ñi như
máy nh s, máy quay s, máy vi tính, ñin thoi ñi ñng … thì lưng
thông tin con ngưi thu ñưc dưi dng hình nh là khá ln. Đ lưng
thông tin này tr nên có ích hơn con ngưi cn các thao tác ñ tin
hành x và t ñó to ñiu kin cho s phát trin không ngng
ca các k thut x nh nh. X nh mt trong nhng công
ngh ñưc ng dng rng rãi hin nay trong nhiu lĩnh vc ca ñi
sng hi. Không ch! dng li vic x nhng vt nhèo, tái ch
phc h"i các nh cũ (Hình 1), ngày nay công ngh x lý nh ñã
mang li nhng tin b vưt bc như nhn dng vân tay, nhn dng
khuôn m$t, nhn dng ñi tưng …v.v khi kt hp vi lĩnh vc trí
tu nhân to.
Bên cnh ñó, h thng camera quan sát ngày càng ñưc s dng
mt cách rng rãi vi mc ñích tr giúp cnh sát, ngưi tham gia giao
thông ti các ñim nút giao thông, t ñó phát hin ngưi vi phm.
Hm ñưng b ngày càng ph% bin nưc ta, có vai trò ln trong
vic tích kim chi phí và an toàn cho ngưi tham gia giao thông. Do ñ$c
thù ca hm dưi lòng ñ&t nên vic qun lý xe qua li r&t khó khăn.
Nên vic cnh sát giao thông x lý xe vi phm trc tip trong hm
không th.
Vì vy vic xác ñ(nh vn tc ca xe da vào video ñã ghi li phc
v cho vic x lý và qun lý xe vi phm tc ñ chm ti hm ñưng b
ñiu cn thit.
2. Mc tiêu và nhim v nghiên cu
Mc ñích ca ñ tài nh)m nghiên cu các thut toán phát hin
theo vt, t ñó tính toán vn tc ca ñi tưng chuyn ñng t d liu
- 3 -
video, làm cơ s ñ xây dng h thng xác ñ(nh vn tc ca ñi tưng
tham gia giao thông.
- Xác ñ(nh ñi tưng giao thông ñang chuyn ñng.
- Dò vt và ưc lưng vn tc s dng phương pháp optical flow.
- To tin ñ cho vic xác ñ(nh vn tc ca các ñi tưng vi phm,
làm b)ng chng cho vic x lý vi phm, góp phn nâng cao ý thc ch&p
hành tham gia giao thông ca ngưi dân
Bên cnh ñó ñ tài còn mong mun giúp cho mi ngưi có mt cái
nhìn toàn din hơn v vai trò kh năng ng dng ca công ngh x
nh vào trong thc t ca ñi sng xã hi.
3. Đ i tư!ng và ph"m vi nghiên cu
- Đi tưng nghiên cu
Trong lun văn này, d liu ñưc x lý các ñon video có s*n
ñưc quay t mt camera tĩnh ghi li vi chu+n AVI (Audio Video
Interleave).
- Phm vi nghiên cu
Phm vi nghiên cu ca ñ tài liên quan ñn lĩnh vc x nh s
thông qua vic s phn mm Matlab.
4. Phương pháp nghiên cu
- Phương pháp nghiên cu lý thuyt
Tìm hiu cách lp trình vi Matlab
Tìm hiu phương pháp tr nn (background subtraction) ñ
phát hin chuyn ñng
Tìm hiu phương pháp phân mnh ng(region based
segmentation) ñ dò vt ñi tưng
m hiu phương pháp xác ñ(nh vn tc ca ñi tưng
chuyn ñng s dng camera calibration.
- Phương pháp nghiên cu thc nghim
- 4 -
Tin hành phân tích cài ñ$t: thut toán tr nn ñ phát
hin chuyn ñng, thut toán phát hin theo vt ñi tưng
chuyn ñng t d liu video, tñó c ñ(nh vn tc ca ñi
tưng chuyn ñng.
So sánh và ñánh giá kt qu ñt ñưc.
5. K$t qu% d& ki$n
- N:m vng và cài ñ$t thành công các thut toán: phát hin chuyn
ñng b)ng phương pháp tr nn, truy vt ñi tưng b)ng phương
pháp phân mnh ng (region based segmentation), t ñó xây dng
thành công chương trình c ñ(nh vn tc ñi tưng chuyn ñng.
-To ñưc bng so sánh kt qu, ñ chính xác ca các phương
pháp phát hin theo vt ñi tưng chuyn ñng da trên tp các
video có s*n.
6. Ý nghĩa khoa hc và th&c ti(n c)a lu*n văn
-V m$t lý thuyt
>ng dng thành công công ngh x nh vào trong thc
t.
To tin ñ cho nhng nghiên cu tip theo trong tương lai.
-V m$t thc ti?n
Giúp gim công sc, tăng hiu qu trong vic xác ñ(nh ñi
tưng vi phm tc ñ khi tham gia giao thông (qua hm,
cu…).
Đ tài ng dng trong c hthng chăm c sc khBe
như c ñ(nh nh vi té ngã ca ngưi bnh.
7. B cc lu*n văn
Ni dung ca lun văn ñưc chia thành các phn như sau:
M+ ñ,u
Chương 1: Nghiên cu t-ng quan
- 5 -
T%ng quan v camera s, v video, các k thut phát hin theo
vt ñi tưng trong video s nh)m giúp chúng ta hiu hơn v các k
thut phát hin chuyn ñng, theo vt ñi tưng, phương pháp hiu
ch!nh camera (camera calibration).
Chương 2: Phân tích thi$t k$ h th ng
Phân tích và thit k h thng ñ xây dng các chc năng ca
chương trình.
Chương 3: Cài ñ.t và k$t qu%
Cài ñ$t chương trình, kt qu minh ha và các ràng buc ca
chương trình.
K$t lu*n và hư/ng phát tri0n
Kt lun, phm vi ng dng, hn ch ca chương trình các
hưng phát trin trong tương lai.
Ph lc
Trình bày v vic thit lp môi trưng cho vic lp trình vi
Matlab và các bng thng kê kt qu.
- 6 -
CHƯƠNG 1: NGHIÊN C2U T3NG QUAN
1.1.T3NG QUAN V4 CAMERA S
1.1.1. Khái nim v Camera s
Camera là mt thit b( ghi hình th ghi li ñưc nhng hình nh
trong mt khong thi gian nào ñó và lưu tr các d liu hình nh này.
1.1.2. Phân lo"i Camera
Có 3 cách phân loi Camera.
Cách 1: Phân loi theo kĩ thut hình nh.
Cách 2: Phân loi theo kĩ thut ñưng truyn.
Cách 3: Phân loi theo tính năng s dng.
1.1.3. H th ng camera quan sát
H thng camera giúp cho nhng nhà qun th kim soát
công vic mt cách ch$t chG hơn, tit kim ñưc chi phí làm cho
hình nh ca doanh nghip ñưc chuyên nghip, hin ñi hơn.
1.2. T3NG QUAN V4 VIDEO
1.2.1. Khái nim v Video
Thut ng video dùng ñ ch! ngu"n thông tin nh nh trc quan
(pictorial visual information), bao g"m mt chuHi các nh tĩnh (still
image) liên tip nhau, ñưc s:p xp theo chiu thi gian.
1.2.2. Video s
1.2.2.1. Tín hiu video s
Tín hiu video s ñưc lưu tr dưi dng s, do ñó chúng ñưc
l&y mu và lưng t hóa.
1.2.2.2. Ưu và nhưc ñim ca video s
- Ưu ñim
Vi tín hiu s, ta không cn phi chuyn ñ%i gia các tín hiu
như trong tín hiu tun t. Ngoài ra, còn có th ch!nh sa, to các hiu
- 7 -
ng trên tín hiu video s.
- Nhưc ñim
Nhưc ñim ca video s ñó là ñòi hBi khi lưng lưu tr ln
và băng thông rng ñ truyn ti.
1.2.2.3. Chun video s AVI
1.3. CÁC PHƯƠNG PHÁP TR5 N4N PHÁT HI6N ĐI TƯNG
1.3.1. T-ng quan v phát hin ñ i tư!ng
Phát hin ñi tưng chuyn ñng trong video là mt trong các bài
toán ñưc nghiên cu rng rãi nhiu ng dng trong cuc sng
hin nay..
1.3.2. Gi/i thiu v phương pháp tr7 nn
Ý tưng chung ca các phương pháp tr nn là: Đ phát hin ra
ñưc các ñi tưng chuyn ñng trong video chúng ta phi ñưc
nh nn (background model). hình nn này th ñưc hc
qua nhiu frame nh nu nn b( thay ñ%i, ngưc li ta có th chn mt
nn s*n nu nn không b( thay ñ%i. Sau ñó, ta sG dùng mô hình nn
này ñ so sánh vi frame nh hin ti kt qu ta sG nhn bit
ñưc ñâu là phn nn, ñâu là các phn chuyn ñng.
1.3.3. Frame Difference
Ý tưng chính trong phương pháp Frame Difference các ñi
tưng chuyn ñng sG ñưc phát hin da trên s khác bit gia hai
frame nh liên tip nhau cùng vi mt ngưIng ñưc chn trưc.
1.3.4. Running Gaussian Average
Phương pháp này do Wren, Azarbayejani, Darrell Pentland ñưa
ra vào năm 1997. Phương pháp này ñ$t mt phân phi Gaussian G(J, σ)
lên s bin thiên giá tr( ca mHi pixel trong ñon video.
1.3.5. Codebook
- 8 -
Ý tưng chính ca phương pháp y ti mHi pixel ca hình
nn, mt tp các cluster vi tâm gii hn trong không gian màu sG
ñưc xây dng nh)m th hin s phân b ca pixel nn trong không
gian màu ñó. MHi cluster như vy ñưc gi codeword, tp cluster ti
mHi v( trí pixel ñưc gi là codebook.
1.3.6. Đánh giá và k$t lu*n
Đ so sánh gia các phương pháp tr nn, ta tin hành th nghim
trên hơn 40 mu video khác nhau v kích thưc, ánh sáng, ñ rung ca
camara, ñ d(ch chuyn ca nn,…v.v.
Da vào kt qu ca vic phát hin chuyn ñng ca các phương
pháp tr nn trên các video mu ta th kt lun r)ng: Trong 3
phương pháp tr nn ñưc ñ cp trên thì phương pháp Running
Gaussian Average luôn cho kt qu vi ñ chính xác cao và tc ñ x
ca phương pháp này khá nhanh. Tuy nhiên xét v tc ñ x thì
phương pháp Frame Difference tn ít thi gian x nh&t. Vi phương
pháp Codebook thì ñ chính xác ca phương pháp này ph thuc vào s
nh ñưc chn ñ hc nn b( nh hưng bi ñ sáng th kt
qu ca nó không chính xác trong mt s trưng hp.
T nhng do trên ta th áp dng phương pháp tr nn
Running Gaussian Average ho$c Frame Difference ñ phát hin ñưc
các ñi tưng chuyn ñng trong file video ñưc lưu t camera quan sát
tùy vào tình hung c th.
1.4. PHƯƠNG PP HI6U CH;NH CAMERA
1.4.1. T-ng quan v hiu ch>nh camera
Hiu ch!nh camera bưc ñu tiên hương ti nh toán th( giác
y nh. M$c mt i thông tin tngcnh ño thñưc l&y t
c camera không hiu ch!nh, vic hiu ch!nh cn thit khi thông tin
h ño ñưc yêu cu.
- 9 -
1.4.1.1. Phân loi
- Hiu ch!nh camera thñưc phân loi da theo nhiu tiêu chí
khác nhau.
- Chúng ta thphân loi da o c phương phương pháp ño
ñc s dng ñ ưc nh c thông s ca mô nh camera:
thut ti ưu không tuyn nh (non linear optimization).
Nhng thut tuyn nh vic nh toán chuyn ñ%i ma
trn.
Nhng kĩ thut 2 bưc (two-step).
1.4.1.2. Các phương pháp hiu chnh camera
Phương pháp hiu ch!nh camera ph thuc o nh ng
ñ ưc lưng nh vi ca camera. Nhng nh tuyn tính Hall
Faugeras-Toscani, s dng phương pháp nh phương ít nh&t ñ thu
ñưc c tham s ca nh camera. Tuy nhiên, c phương pháp
hiu ch!nh camera phi tuyn nh như: Faugeras-Toscani vi nhng bin
dng, Tsai và Weng; s dng thut hai bưc.
1.4.2. Đánh giá và k$t lu*n
Đ chính c trên ng nh ca c phương pháp phi tuyn là tt
hơn phương pháp ha tuyn. Tuy nhiên thi gian thc hin ca phương
pháp ha tuyn th&p hơn.
T nhng kt lun trên, ñ tăng ñ chính c ca hiu ch!nh
camera, thun tin trong phát trin i tn sdng Matlab, ta chn
công c camera calibration toolbox [7], i ch hp nhiu phương
pháp hiu ch!nh [6] r&t thích hp ñ phát trin i toán.
1.5. CÁC PHƯƠNG PHÁP THEO V?T ĐI TƯNG
1.5.1. T-ng quan v theo v$t ñ i tư!ng
- 10 -
Theo vt ñi tưng giám sát các thay ñ%i theo không gian
thi gian ca ñi tưng trong sut chuHi video như v( trí, kích thưc
ho$c hình dáng ca ñi tưng.
1.5.2. Phương pháp Region Segmentation
1.5.2.1. Gii thiu v vùng (Region).
ng (region) trong xnh là mt nhóm c ñim nh liên kt
vi nhau có cùng c thuc nh.
Vnh sG ñưc phân chia thành nhiu ng, i liên quan ñn
nhiu ñi tưng, ho$c mt phn ca ñi tưng,
Sphân chia c ng thưng ñưc thc hin b)ng ch sdng
giá tr( m (gray values) ca ñim nh. G"m hai phương pháp tip cn
ph% bin: Region-based, Edge Detection.
Bng 1. 1 Bng so nh hai hưng tip cn
Region based Edge detection
Đưng biên ñóng (closed
boundaries)
Biên không cn thit phi ñóng
nh toán da trên stương ñ"ng nh toán da trên s khác bit.
1.5.2.2. Region-based segmentation
Mc tiêu ca phân khúc ñ phân vùng mt hình nh vào khu
vc. Khi mt ñi tưng di chuyn ñưc phân ñon, mt khu vc ca
các ñim nh gán cho ñi tưng là kh dng. Khu vc này th ñưc
theo dõi s dng phương pháp tip cn như cross-correlation. V( trí ca
khu vc trong khung tip theo ñưc xác ñ(nh. Mt ñi tưng chuyn
ñng thưng tương ng vi mt ho$c mt s khu vc theo dõi.