
- 1 -
B GIÁO DC VÀ ĐÀO TO
ĐI HC ĐÀ NNG
NGUYN VĂN TRUNG
XÁC ĐNH VN TC ĐI TƯNG CHUYN ĐNG QUA
CAMERA
Chuyên ngành: KHOA HC MÁY TÍNH
Mã s: 60.48.01
TÓM TT LUN VĂN THC SĨ K THUT
Ngưi hưng dn khoa hc: TS. Huỳnh Hu Hưng
Đà Nng - Năm 2012
- 2 -
M ĐU
1. Lý do chn ñ tài
Vi s phát trin nhanh chóng ca các loi máy móc hin ñi như
máy nh s, máy quay s, máy vi tính, ñin thoi ñi ñng … thì lưng
thông tin con ngưi thu ñưc dưi dng hình nh là khá ln. Đ lưng
thông tin này tr nên có ích hơn con ngưi cn có các thao tác ñ tin
hành x lý nó và t ñó to ñiu kin cho s phát trin không ngng
ca các k thut x lý hình nh. X lý nh là mt trong nhng công
ngh ñưc ng dng rng rãi hin nay trong nhiu lĩnh vc ca ñi
sng xã hi. Không ch! dng li vic x lý nhng vt nhèo, tái ch
và phc h"i các nh cũ (Hình 1), ngày nay công ngh x lý nh ñã
mang li nhng tin b vưt bc như nhn dng vân tay, nhn dng
khuôn m$t, nhn dng ñi tưng …v.v khi nó kt hp vi lĩnh vc trí
tu nhân to.
Bên cnh ñó, h thng camera quan sát ngày càng ñưc s dng
mt cách rng rãi vi mc ñích tr giúp cnh sát, ngưi tham gia giao
thông ti các ñim nút giao thông, t ñó phát hin ngưi vi phm.
Hm ñưng b ngày càng ph% bin nưc ta, có vai trò ln trong
vic tích kim chi phí và an toàn cho ngưi tham gia giao thông. Do ñ$c
thù ca hm là dưi lòng ñ&t nên vic qun lý xe qua li r&t khó khăn.
Nên vic cnh sát giao thông x lý xe vi phm trc tip trong hm là
không th.
Vì vy vic xác ñ(nh vn tc ca xe da vào video ñã ghi li phc
v cho vic x lý và qun lý xe vi phm tc ñ chm ti hm ñưng b
là ñiu cn thit.
2. Mc tiêu và nhim v nghiên cu
Mc ñích ca ñ tài nh)m nghiên cu các thut toán phát hin và
theo vt, t ñó tính toán vn tc ca ñi tưng chuyn ñng t d liu

- 3 -
video, làm cơ s ñ xây dng h thng xác ñ(nh vn tc ca ñi tưng
tham gia giao thông.
- Xác ñ(nh ñi tưng giao thông ñang chuyn ñng.
- Dò vt và ưc lưng vn tc s dng phương pháp optical flow.
- To tin ñ cho vic xác ñ(nh vn tc ca các ñi tưng vi phm,
làm b)ng chng cho vic x lý vi phm, góp phn nâng cao ý thc ch&p
hành tham gia giao thông ca ngưi dân
Bên cnh ñó ñ tài còn mong mun giúp cho mi ngưi có mt cái
nhìn toàn din hơn v vai trò và kh năng ng dng ca công ngh x
lý nh vào trong thc t ca ñi sng xã hi.
3. Đ i tư!ng và ph"m vi nghiên cu
- Đi tưng nghiên cu
Trong lun văn này, d liu ñưc x lý là các ñon video có s*n
ñưc quay t mt camera tĩnh ghi li vi chu+n AVI (Audio Video
Interleave).
- Phm vi nghiên cu
Phm vi nghiên cu ca ñ tài liên quan ñn lĩnh vc x lý nh s
thông qua vic s phn mm Matlab.
4. Phương pháp nghiên cu
- Phương pháp nghiên cu lý thuyt
• Tìm hiu cách lp trình vi Matlab
• Tìm hiu phương pháp tr nn (background subtraction) ñ
phát hin chuyn ñng
• Tìm hiu phương pháp phân mnh vùng(region based
segmentation) ñ dò vt ñi tưng
• Tìm hiu phương pháp xác ñ(nh vn tc ca ñi tưng
chuyn ñng s dng camera calibration.
- Phương pháp nghiên cu thc nghim
- 4 -
• Tin hành phân tích và cài ñ$t: thut toán tr nn ñ phát
hin chuyn ñng, thut toán phát hin và theo vt ñi tưng
chuyn ñng t d liu video, t ñó xác ñ(nh vn tc ca ñi
tưng chuyn ñng.
• So sánh và ñánh giá kt qu ñt ñưc.
5. K$t qu% d& ki$n
- N:m vng và cài ñ$t thành công các thut toán: phát hin chuyn
ñng b)ng phương pháp tr nn, truy vt ñi tưng b)ng phương
pháp phân mnh vùng (region based segmentation), t ñó xây dng
thành công chương trình xác ñ(nh vn tc ñi tưng chuyn ñng.
-To ñưc bng so sánh kt qu, ñ chính xác ca các phương
pháp phát hin và theo vt ñi tưng chuyn ñng da trên tp các
video có s*n.
6. Ý nghĩa khoa hc và th&c ti(n c)a lu*n văn
-V m$t lý thuyt
• >ng dng thành công công ngh x lý nh vào trong thc
t.
• To tin ñ cho nhng nghiên cu tip theo trong tương lai.
-V m$t thc ti?n
• Giúp gim công sc, tăng hiu qu trong vic xác ñ(nh ñi
tưng vi phm tc ñ khi tham gia giao thông (qua hm,
cu…).
• Đ tài có ng dng trong các h thng chăm sóc sc khBe
như xác ñ(nh hành vi té ngã ca ngưi bnh.
7. B cc lu*n văn
Ni dung ca lun văn ñưc chia thành các phn như sau:
M+ ñ,u
Chương 1: Nghiên cu t-ng quan

- 5 -
T%ng quan v camera s, v video, các k thut phát hin và theo
vt ñi tưng trong video s nh)m giúp chúng ta hiu rõ hơn v các k
thut phát hin chuyn ñng, theo vt ñi tưng, phương pháp hiu
ch!nh camera (camera calibration).
Chương 2: Phân tích thi$t k$ h th ng
Phân tích và thit k h thng ñ xây dng các chc năng ca
chương trình.
Chương 3: Cài ñ.t và k$t qu%
Cài ñ$t chương trình, kt qu minh ha và các ràng buc ca
chương trình.
K$t lu*n và hư/ng phát tri0n
Kt lun, phm vi ng dng, hn ch ca chương trình và các
hưng phát trin trong tương lai.
Ph lc
Trình bày v vic thit lp môi trưng cho vic lp trình vi
Matlab và các bng thng kê kt qu.
- 6 -
CHƯƠNG 1: NGHIÊN C2U T3NG QUAN
1.1.T3NG QUAN V4 CAMERA S
1.1.1. Khái nim v Camera s
Camera là mt thit b( ghi hình có th ghi li ñưc nhng hình nh
trong mt khong thi gian nào ñó và lưu tr các d liu hình nh này.
1.1.2. Phân lo"i Camera
Có 3 cách phân loi Camera.
Cách 1: Phân loi theo kĩ thut hình nh.
Cách 2: Phân loi theo kĩ thut ñưng truyn.
Cách 3: Phân loi theo tính năng s dng.
1.1.3. H th ng camera quan sát
H thng camera giúp cho nhng nhà qun lý có th kim soát
công vic mt cách ch$t chG hơn, tit kim ñưc chi phí và làm cho
hình nh ca doanh nghip ñưc chuyên nghip, hin ñi hơn.
1.2. T3NG QUAN V4 VIDEO
1.2.1. Khái nim v Video
Thut ng video dùng ñ ch! ngu"n thông tin hình nh trc quan
(pictorial visual information), bao g"m mt chuHi các nh tĩnh (still
image) liên tip nhau, ñưc s:p xp theo chiu thi gian.
1.2.2. Video s
1.2.2.1. Tín hiu video s
Tín hiu video s ñưc lưu tr dưi dng s, do ñó chúng ñưc
l&y mu và lưng t hóa.
1.2.2.2. Ưu và nhưc ñim ca video s
- Ưu ñim
Vi tín hiu s, ta không cn phi chuyn ñ%i gia các tín hiu
như trong tín hiu tun t. Ngoài ra, còn có th ch!nh sa, to các hiu

- 7 -
ng trên tín hiu video s.
- Nhưc ñim
Nhưc ñim ca video s ñó là nó ñòi hBi khi lưng lưu tr ln
và băng thông rng ñ truyn ti.
1.2.2.3. Chun video s AVI
1.3. CÁC PHƯƠNG PHÁP TR5 N4N PHÁT HI6N ĐI TƯNG
1.3.1. T-ng quan v phát hin ñ i tư!ng
Phát hin ñi tưng chuyn ñng trong video là mt trong các bài
toán ñưc nghiên cu rng rãi và có nhiu ng dng trong cuc sng
hin nay..
1.3.2. Gi/i thiu v phương pháp tr7 nn
Ý tưng chung ca các phương pháp tr nn là: Đ phát hin ra
ñưc các ñi tưng chuyn ñng trong video chúng ta phi có ñưc
mô hình nn (background model). Mô hình nn này có th ñưc hc
qua nhiu frame nh nu nn b( thay ñ%i, ngưc li ta có th chn mt
nn có s*n nu nn không b( thay ñ%i. Sau ñó, ta sG dùng mô hình nn
này ñ so sánh vi frame nh hin ti và kt qu là ta sG nhn bit
ñưc ñâu là phn nn, ñâu là các phn chuyn ñng.
1.3.3. Frame Difference
Ý tưng chính trong phương pháp Frame Difference là các ñi
tưng chuyn ñng sG ñưc phát hin da trên s khác bit gia hai
frame nh liên tip nhau cùng vi mt ngưIng ñưc chn trưc.
1.3.4. Running Gaussian Average
Phương pháp này do Wren, Azarbayejani, Darrell và Pentland ñưa
ra vào năm 1997. Phương pháp này ñ$t mt phân phi Gaussian G(J, σ)
lên s bin thiên giá tr( ca mHi pixel trong ñon video.
1.3.5. Codebook
- 8 -
Ý tưng chính ca phương pháp này là ti mHi pixel ca mô hình
nn, mt tp các cluster vi tâm và gii hn trong không gian màu sG
ñưc xây dng nh)m th hin s phân b ca pixel nn trong không
gian màu ñó. MHi cluster như vy ñưc gi là codeword, tp cluster ti
mHi v( trí pixel ñưc gi là codebook.
1.3.6. Đánh giá và k$t lu*n
Đ so sánh gia các phương pháp tr nn, ta tin hành th nghim
trên hơn 40 mu video khác nhau v kích thưc, ánh sáng, ñ rung ca
camara, ñ d(ch chuyn ca nn,…v.v.
Da vào kt qu ca vic phát hin chuyn ñng ca các phương
pháp tr nn trên các video mu ta có th kt lun r)ng: Trong 3
phương pháp tr nn ñưc ñ cp trên thì phương pháp Running
Gaussian Average luôn cho kt qu vi ñ chính xác cao và tc ñ x lý
ca phương pháp này khá nhanh. Tuy nhiên xét v tc ñ x lý thì
phương pháp Frame Difference tn ít thi gian x lý nh&t. Vi phương
pháp Codebook thì ñ chính xác ca phương pháp này ph thuc vào s
nh ñưc chn ñ hc nn và nó b( nh hưng bi ñ sáng vì th kt
qu ca nó không chính xác trong mt s trưng hp.
T nhng lý do trên ta có th áp dng phương pháp tr nn
Running Gaussian Average ho$c Frame Difference ñ phát hin ñưc
các ñi tưng chuyn ñng trong file video ñưc lưu t camera quan sát
tùy vào tình hung c th.
1.4. PHƯƠNG PHÁP HI6U CH;NH CAMERA
1.4.1. T-ng quan v hiu ch>nh camera
Hiu ch!nh camera là bưc ñu tiên hương ti tính toán th( giác
máy tính. M$c dù mt vài thông tin t ng cnh ño có th ñưc l&y t
các camera không hiu ch!nh, vic hiu ch!nh là cn thit khi thông tin
h ño ñưc yêu cu.

- 9 -
1.4.1.1. Phân loi
- Hiu ch!nh camera có th ñưc phân loi da theo nhiu tiêu chí
khác nhau.
- Chúng ta có th phân loi da vào các phương phương pháp ño
ñc s dng ñ ưc tính các thông s ca mô hình camera:
• Kĩ thut ti ưu không tuyn tính (non linear optimization).
• Nhng kĩ thut tuyn tính mà vic tính toán chuyn ñ%i ma
trn.
• Nhng kĩ thut 2 bưc (two-step).
1.4.1.2. Các phương pháp hiu chnh camera
Phương pháp hiu ch!nh camera ph thuc vào mô hình dùng
ñ ưc lưng hành vi ca camera. Nhng mô hình tuyn tính Hall và
Faugeras-Toscani, s dng phương pháp bình phương ít nh&t ñ thu
ñưc các tham s ca mô hình camera. Tuy nhiên, các phương pháp
hiu ch!nh camera phi tuyn tính như: Faugeras-Toscani vi nhng bin
dng, Tsai và Weng; s dng kĩ thut hai bưc.
1.4.2. Đánh giá và k$t lu*n
Đ chính xác trên vùng nh ca các phương pháp phi tuyn là tt
hơn phương pháp ha tuyn. Tuy nhiên thi gian thc hin ca phương
pháp ha tuyn là th&p hơn.
T nhng kt lun trên, ñ tăng ñ chính xác ca hiu ch!nh
camera, và thun tin trong phát trin bài toán s dng Matlab, ta chn
công c camera calibration toolbox [7], cái mà tích hp nhiu phương
pháp hiu ch!nh [6] r&t thích hp ñ phát trin bài toán.
1.5. CÁC PHƯƠNG PHÁP THEO V?T ĐI TƯNG
1.5.1. T-ng quan v theo v$t ñ i tư!ng
- 10 -
Theo vt ñi tưng là giám sát các thay ñ%i theo không gian và
thi gian ca ñi tưng trong sut chuHi video như v( trí, kích thưc
ho$c hình dáng ca ñi tưng.
1.5.2. Phương pháp Region Segmentation
1.5.2.1. Gii thiu v vùng (Region).
Vùng (region) trong x lý nh là mt nhóm các ñim nh liên kt
vi nhau có cùng các thuc tính.
Vnh sG ñưc phân chia thành nhiu vùng, cái mà liên quan ñn
nhiu ñi tưng, ho$c mt phn ca ñi tưng,
S phân chia các vùng thưng ñưc thc hin b)ng cách s dng
giá tr( xám (gray values) ca ñim nh. G"m hai phương pháp tip cn
ph% bin: Region-based, Edge Detection.
Bng 1. 1 Bng so sánh hai hưng tip cn
Region based Edge detection
Đưng biên ñóng (closed
boundaries)
Biên không cn thit phi ñóng
Tính toán da trên s tương ñ"ng Tính toán da trên s khác bit.
1.5.2.2. Region-based segmentation
Mc tiêu ca phân khúc là ñ phân vùng mt hình nh vào khu
vc. Khi mt ñi tưng di chuyn ñưc phân ñon, mt khu vc ca
các ñim nh gán cho ñi tưng là kh dng. Khu vc này có th ñưc
theo dõi s dng phương pháp tip cn như cross-correlation. V( trí ca
khu vc trong khung tip theo ñưc xác ñ(nh. Mt ñi tưng chuyn
ñng thưng tương ng vi mt ho$c mt s khu vc theo dõi.

