id3289046 pdfMachine by Broadgun Software - a great PDF writer! - a great PDF creator! - http://www.pdfmachine.com http://www.broadgun.com
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
TR(cid:221)ỜNG —ẠI HỌC KHOA HỌC TỰ NHI˚N KHOA C(cid:212)NG NGHỆ TH(cid:212)NG TIN BỘ M(cid:212)N C(cid:212)NG NGHỆ TRI THỨC
-0112207
-0112211
-0112275
NGUYỄN QUỐC TUẤN NGUYỄN VˆN KỶ CANG PHAN VĨNH PH(cid:221)ỚC
PH´N T˝CH TỰ —ỘNG DỮ LIỆU VIDEO SỐ HỖ TRỢ TRUY T(cid:204)M TH(cid:212)NG TIN THỊ GI`C DỰA V(cid:192)O NỘI DUNG
KH(cid:211)A LUẬN CỬ NH´N TIN HỌC
GI`O VI˚N H(cid:221)ỚNG DẪN Th.s L(cid:221) QUỐC NGỌC
NI˚N KH(cid:211)A 2001-2005
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
1
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
LỜI CẢM (cid:213)N
Luận vªn của chœng em sẽ rất kh(cid:243) ho(cid:224)n th(cid:224)nh nếu kh(cid:244)ng c(cid:243) sự truyền (cid:240)ạt kiến thức qu(cid:237) bÆu v(cid:224) sự h(cid:253)ớng dẫn tận t(cid:236)nh của Thầy L(cid:253) Quốc Ngọc. Chœng em xin ch(cid:226)n th(cid:224)nh cÆm ın sự chỉ bảo của thầy.
Chœng con xin gửi tất cả l(cid:242)ng biết ın, sự k(cid:237)nh trọng (cid:240)ến (cid:244)ng b(cid:224), cha mẹ, cøng to(cid:224)n thể gia (cid:240)(cid:236)nh, những ng(cid:253)ời (cid:240)ª nu(cid:244)i dạy, (cid:240)ª cho chœng con niềm tin v(cid:224) nghị lực (cid:240)ể v(cid:253)ợt qua mọi kh(cid:243) khªn.
Chœng em xin tr(cid:226)n trọng cÆm ın qu(cid:253) Thầy c(cid:244) trong Khoa C(cid:244)ng nghệ th(cid:244)ng tin tr(cid:253)ờng —ại học Khoa học Tự nhiŒn Tp.Hồ Ch(cid:237) Minh (cid:240)ª tận t(cid:236)nh giảng dạy, truyền (cid:240)ạt những kiến thức qu(cid:253) bÆu v(cid:224) tạo (cid:240)iều kiện cho chœng em (cid:240)(cid:253)ợc thực hiện luận vªn n(cid:224)y. Xin ch(cid:226)n th(cid:224)nh cÆm ın sự giœp (cid:240)ỡ, (cid:240)ộng viŒn v(cid:224) chỉ bảo rất nhiệt t(cid:236)nh của cÆc anh chị (cid:240)i tr(cid:253)ớc v(cid:224) tất cả bạn bŁ. CÆc anh chị, cÆc bạn lu(cid:244)n c(cid:243) mặt trong những thời (cid:240)iểm kh(cid:243) khªn nhất, tiếp thŒm (cid:240)ộng lực v(cid:224) (cid:253) ch(cid:237), giœp chœng t(cid:244)i ho(cid:224)n th(cid:224)nh (cid:240)(cid:253)ợc luận vªn.
Mặc dø (cid:240)ª cố gắng nỗ lực hết sức m(cid:236)nh, song chắc chắn luận vªn kh(cid:244)ng khỏi c(cid:242)n nhiều thiếu s(cid:243)t. Chœng em rất mong nhận (cid:240)(cid:253)ợc sự th(cid:244)ng cảm v(cid:224) chỉ bảo tận t(cid:236)nh của qu(cid:253) Thầy c(cid:244) v(cid:224) cÆc bạn. Tp.HCM, 7/2005
Nh(cid:243)m sinh viŒn thực hiện Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc (cid:150) Nguyễn Quốc Tuấn
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
2
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
NHẬN X(cid:201)T CỦA GI`O VI˚N H(cid:221)ỚNG DẪN .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. ..............................................................................................................................................
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
3
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
NHẬN X(cid:201)T CỦA GI`O VI˚N PHẢN BIỆN .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. ..............................................................................................................................................
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
4
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
MỤC LỤC
LỜI CẢM (cid:213)N .................................................................................................................2 MỤC LỤC.......................................................................................................................5 DANH S`CH C`C H(cid:204)NH VẼ ......................................................................................8 DANH S`CH C`C BẢNG..........................................................................................10 T(cid:211)M TẮT LUẬN VˆN ...............................................................................................11 CH(cid:221)(cid:213)NG 1 MỞ —ẦU .................................................................................................12 1. Giới thiệu tổng quan .........................................................................................13 2. CÆc h(cid:253)ớng nghiŒn cứu liŒn quan (cid:240)ến (cid:240)ề t(cid:224)i ...................................................17 3. Qui tr(cid:236)nh ch(cid:237)nh (cid:240)(cid:253)ợc thực hiện trong luận vªn .............................................19 3.1. Giai (cid:240)oạn ngoại tuyến (off-line) ..................................................................19 3.2. Giai (cid:240)oạn trực tuyến (on-line) .....................................................................20 3.3. CÆc lĩnh vực liŒn quan: ................................................................................20 4. Cấu trœc luận vªn..............................................................................................21 CH(cid:221)(cid:213)NG 2 MỘT SỐ KH`I NIỆM V(cid:192) —ẶC TR(cid:221)NG TRONG XỬ L(cid:221) ẢNH SỐ V(cid:192) VIDEO SỐ..............................................................................................................22 1. Một số khÆi niệm, (cid:240)ịnh nghĩa trong xử l(cid:253) video.............................................23 1.1. Khung h(cid:236)nh (frame) .....................................................................................23 1.2. —oạn cı sở (shot).........................................................................................24 1.3. Chuyển cảnh ................................................................................................24 2. Kh(cid:244)ng gian m(cid:224)u ................................................................................................26 2.1. Kh(cid:244)ng gian (cid:240)ộ xÆm......................................................................................26 2.2. Kh(cid:244)ng gian m(cid:224)u RGB .................................................................................27 2.3. Kh(cid:244)ng gian m(cid:224)u CMY ................................................................................29 2.4. Kh(cid:244)ng gian m(cid:224)u HSV..................................................................................30 3. L(cid:253)ợc (cid:240)ồ m(cid:224)u (Color Histogram) .....................................................................33 3.1. —ịnh nghĩa ...................................................................................................33 3.2. Thuật toÆn t(cid:237)nh l(cid:253)ợc (cid:240)ồ m(cid:224)u :......................................................................34 3.3. (cid:221) nghĩa của l(cid:253)ợc (cid:240)ồ m(cid:224)u.............................................................................38 3.4. —Ænh giÆ (cid:253)u (cid:240)iểm, khuyết (cid:240)iểm...................................................................38 3.5. Ứng dụng .....................................................................................................39 4. L(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u (Color Correlogram) ............................................40 4.1. Giới thiệu l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u.............................................................40 4.2. T(cid:237)nh l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u .....................................................................40 4.3. L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u ........................................................................40 4.4. Ứng dụng .....................................................................................................41 5. BiŒn dạng (Edge) ...............................................................................................41 5.1. KhÆi niệm : ..................................................................................................41
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
5
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
5.2. Ph(cid:253)ıng phÆp phÆt hiện biŒn ........................................................................41 6. —ặc tr(cid:253)ng chuyển (cid:240)ộng (Motion) ....................................................................46 6.1. Giới thiệu .....................................................................................................46 6.2. L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng ..................................................................................46 6.3. Ảnh chuyển (cid:240)ộng.........................................................................................47 7. CÆc (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở...........................................................48 7.1. —ặc tr(cid:253)ng ảnh trung b(cid:236)nh.............................................................................49 7.2. L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u trung b(cid:236)nh.......................................................50 7.3. L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh.................................................................51 7.4. Ảnh chuyển (cid:240)ộng trung b(cid:236)nh .......................................................................52 8. T(cid:243)m tắt ch(cid:253)ıng .................................................................................................53
CH(cid:221)(cid:213)NG 3 PH´N T˝CH TỰ —ỘNG VIDEO SỐ TH(cid:192)NH C`C —OẠN C(cid:213) SỞ ........................................................................................................................................54 1. Giới thiệu sı l(cid:253)ợc ph(cid:226)n (cid:240)oạn (cid:240)oạn cı sở........................................................55 2. Một số t(cid:224)i liệu in, b(cid:224)i bÆo (cid:240)iển h(cid:236)nh về ph(cid:226)n (cid:240)oạn cı sở ..............................57 2.1. Kỹ thuật m(cid:244) h(cid:236)nh Markov ẩn (The Hidden Markov Model).......................57 2.2. PhÆt hiện chuyển cảnh dựa v(cid:224)o ph(cid:226)n t(cid:237)ch v(cid:224) t(cid:253)ıng tÆc nghe nh(cid:236)n..............59 2.3. PhÆt hiện chuyển cảnh dựa v(cid:224)o l(cid:253)ợc (cid:240)ồ ......................................................59 2.4. So sÆnh cÆc kỹ thuật phÆt hiện biŒn (cid:240)oạn cı sở ..........................................60 3. CÆc h(cid:253)ớng tiếp cận ph(cid:226)n (cid:240)oạn (cid:240)iển h(cid:236)nh .......................................................61 3.1. Sự sai biệt về l(cid:253)ợc (cid:240)ồ m(cid:224)u...........................................................................61 3.2. Tỉ số thay (cid:240)ổi biŒn cạnh...............................................................................62 3.3. Sự ph(cid:226)n t(cid:237)ch (cid:240)ặc tr(cid:253)ng (cid:226)m thanh .................................................................62 3.4. Sự ph(cid:226)n t(cid:237)ch phÆt hiện chuyển (cid:240)ộng............................................................63 4. Một số ph(cid:253)ıng phÆp cải tiến............................................................................63 4.1. Ph(cid:253)ıng phÆp hai ng(cid:253)ỡng.............................................................................65 4.2. Kết hợp l(cid:253)ợc (cid:240)ồ m(cid:224)u v(cid:224) toÆn tử h(cid:236)nh thÆi học Morphology v(cid:224) giải thuật Watershed...............................................................................................................67 4.3. L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u ........................................................................71 5. —Ænh giÆ cÆc ph(cid:253)ıng phÆp...............................................................................73 5.1. —ộ (cid:240)o Precision, Recall...............................................................................73 5.2. Thống kŒ kết quả .........................................................................................74 5.3. —Ænh giÆ cÆc ph(cid:253)ıng phÆp ..........................................................................76 6. T(cid:243)m tắt ch(cid:253)ıng .................................................................................................77 CH(cid:221)(cid:213)NG 4 TỔ CHỨC C`C —OẠN C(cid:213) SỞ THEO CẤU TR(cid:218)C C´Y ..............79 1. Giới thiệu............................................................................................................80 2. Tổ chức cÆc (cid:240)oạn cı sở theo cấu trœc c(cid:226)y nhị ph(cid:226)n ......................................80 2.1. Giải thuật ph(cid:226)n lớp ph(cid:226)n cấp .......................................................................80 2.2. Tạo liŒn kết l(cid:226)n cận......................................................................................81 2.3. —ặc tr(cid:253)ng v(cid:224) (cid:240)ộ (cid:240)o dị biệt giữa cÆc (cid:240)oạn cı sở trong liŒn kết ....................82
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
6
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.4. Cụ thể h(cid:243)a giai (cid:240)oạn ph(cid:226)n lớp trong giải thuật ph(cid:226)n lớp ph(cid:226)n cấp ở mục 2.1 ở trŒn 83
3. X(cid:226)y dựng bảng mục lục v(cid:224) chỉ mục.................................................................85 4. XÆc (cid:240)ịnh cÆc lớp của cÆc (cid:240)oạn cı sở v(cid:224) phần tử (cid:240)ại diện của lớp ...............88 4.1. Lớp của cÆc (cid:240)oạn cı sở ...............................................................................88 4.2. Phần tử (cid:240)ại diện của lớp ..............................................................................89 5. Khung h(cid:236)nh ch(cid:237)nh (cid:240)ại diện cho (cid:240)oạn cı sở.....................................................89 5.1. Giới thiệu .....................................................................................................89 5.2. CÆch xÆc (cid:240)ịnh khung h(cid:236)nh ch(cid:237)nh .................................................................90 6. T(cid:243)m tắt ch(cid:253)ıng .................................................................................................91 CH(cid:221)(cid:213)NG 5 TRUY VẤN DỮ LIỆU VIDEO SỐ .....................................................92 1. Giới thiệu............................................................................................................93 2. CÆc ph(cid:253)ıng phÆp truy vấn dữ liệu video số...................................................93 2.1. Dữ liệu nhập l(cid:224) (cid:240)oạn cı sở ..........................................................................93 2.2. Dữ liệu nhập l(cid:224) (cid:240)oạn video clip...................................................................98 3. Kết quả thực nghiệm.......................................................................................100 4. Nhận xØt ...........................................................................................................100 5. T(cid:243)m tắt ch(cid:253)ıng ...............................................................................................101 CH(cid:221)(cid:213)NG 6 HỆ THỐNG —ˆ C(cid:192)I —ẶT .................................................................102 1. CÆc chức nªng ch(cid:237)nh v(cid:224) h(cid:253)ớng dẫn sử dụng ch(cid:253)ıng tr(cid:236)nh ........................103 1.1. Giới thiệu sı về Giao diện của ch(cid:253)ıng tr(cid:236)nh.............................................105 1.2. CÆc chức nªng ch(cid:237)nh:.................................................................................108 2. CÆc thuật toÆn c(cid:224)i (cid:240)ặt .....................................................................................116 2.1. Kh(cid:244)ng gian m(cid:224)u :.......................................................................................116 2.2. CÆc thuật toÆn ph(cid:226)n (cid:240)oạn...........................................................................116 2.3. CÆc thuật toÆn t(cid:237)nh (cid:240)ặc tr(cid:253)ng.....................................................................117 2.4. CÆc thuật toÆn x(cid:226)y dựng c(cid:226)y ph(cid:226)n lớp ph(cid:226)n cấp .......................................117 CH(cid:221)(cid:213)NG 7 KẾT LUẬN...........................................................................................118 1. CÆc kết quả (cid:240)ạt (cid:240)(cid:253)ợc ......................................................................................119 2. H(cid:253)ớng phÆt triển.............................................................................................119 T(cid:192)I LIỆU THAM KHẢO .........................................................................................120
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
7
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
DANH S`CH C`C H(cid:204)NH VẼ H(cid:236)nh 1 —oạn video døng dể truy vấn .............................................................................16 H(cid:236)nh 2 kết quả truy vấn..................................................................................................16 H(cid:236)nh 3 Qui tr(cid:236)nh ch(cid:237)nh ...................................................................................................19 H(cid:236)nh 4 CÆc khung h(cid:236)nh ..................................................................................................23 H(cid:236)nh 5 —oạn cı sở..........................................................................................................24 H(cid:236)nh 6 Chuyển cảnh tức th(cid:236) ...........................................................................................25 H(cid:236)nh 7 Chuyển cảnh tiệm tiến........................................................................................25 H(cid:236)nh 8. Kh(cid:244)ng gian m(cid:224)u (cid:240)ộ xÆm ...................................................................................26 H(cid:236)nh 9. Kh(cid:244)ng gian RGB...............................................................................................27 H(cid:236)nh 10. Kh(cid:244)ng gian RGB.............................................................................................28 H(cid:236)nh 11. Kh(cid:244)ng gian RGB.............................................................................................28 H(cid:236)nh 12. Kh(cid:244)ng gian CMY............................................................................................29 H(cid:236)nh 13. CÆc th(cid:224)nh ph(cid:226)n tạo nŒn kh(cid:244)ng gian m(cid:224)u HSV ...............................................30 H(cid:236)nh 14. Kh(cid:244)ng gian m(cid:224)u HSV d(cid:253)ới dạng (cid:240)ối t(cid:253)ợng h(cid:236)nh n(cid:243)n ....................................32 H(cid:236)nh 15 L(cid:253)ợc (cid:240)ồ m(cid:224)u ....................................................................................................33 H(cid:236)nh 16 Mắt ng(cid:253)ời kh(cid:244)ng nhạy cảm với sự thay (cid:240)ổi m(cid:224)u sắc ......................................36 H(cid:236)nh 17 Kh(cid:244)ng gian m(cid:224)u HSV (cid:240)ª (cid:240)(cid:253)ợc (cid:240)ịnh l(cid:253)ợng......................................................37 H(cid:236)nh 18CÆc m(cid:224)u (cid:240)ª (cid:240)(cid:253)ợc (cid:240)ịnh l(cid:253)ợng trong kh(cid:244)ng gian HSV.......................................38 H(cid:236)nh -19. Những ảnh khÆc nhau nh(cid:253)ng c(cid:243) l(cid:253)ợc (cid:240)ồ m(cid:224)u giống nhau ............................39 H(cid:236)nh 20...........................................................................................................................42 H(cid:236)nh 21...........................................................................................................................44 H(cid:236)nh 22...........................................................................................................................46 H(cid:236)nh 23. BiŒn (cid:240)oạn cı sở...............................................................................................55 H(cid:236)nh 24.T(cid:237)nh sự khÆc biệt (cid:240)ặc tr(cid:253)ng giữa những khung h(cid:236)nh liŒn tiếp .........................56 H(cid:236)nh 25 —(cid:253)ờng sai biệt về (cid:240)ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ giữa cÆc khung h(cid:236)nh liŒn tiếp ................56 H(cid:236)nh 26Sı (cid:240)ồ giải thuật ph(cid:226)n (cid:240)oạn................................................................................57 H(cid:236)nh 27 Chuyển cảnh tức th(cid:236) dễ phÆt hiện.....................................................................63 H(cid:236)nh 28 Chuyển cảnh tiệm tiến kh(cid:243) phÆt hiện...............................................................64 H(cid:236)nh 29...........................................................................................................................65 H(cid:236)nh 30 Kết quả ph(cid:226)n (cid:240)oạn bằng ph(cid:253)ıng phÆp 2 ng(cid:253)ỡng ............................................67 H(cid:236)nh 31 —(cid:253)ờng sai biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục...............................................................68 H(cid:236)nh 32...........................................................................................................................69 H(cid:236)nh 33...........................................................................................................................70 H(cid:236)nh 34. —(cid:253)ờng cong ban (cid:240)ầu (ở trŒn) v(cid:224) sau khi qua toÆn tử h(cid:236)nh thÆi học (ở d(cid:253)ới). —(cid:253)ờng m(cid:224)u (cid:240)ỏ l(cid:224) những nıi phÆt hiện chuyển cảnh .....................................................71 H(cid:236)nh 35. Ph(cid:226)n (cid:240)oạn theo l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u v(cid:224) toÆn tử h(cid:236)nh thÆi học, giải thuật watershed........................................................................................................................72
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
8
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 36 LiŒn kết l(cid:226)n cận cho bảng mục lục...................................................................81 H(cid:236)nh 37 LiŒn kết l(cid:226)n cận cho bảng chỉ mục...................................................................82 H(cid:236)nh 38 Dªy liŒn kết l(cid:226)n cận ban (cid:240)ầu ............................................................................83 H(cid:236)nh 39Kết quả sau khi liŒn kết 2 (cid:240)oạn cı sở c(cid:243) khoảng cÆch bØ nhất.........................84 H(cid:236)nh 40Kết quả của giai (cid:240)oạn ph(cid:226)n lớp ph(cid:226)n cấp .........................................................85 H(cid:236)nh 41...........................................................................................................................86 H(cid:236)nh 42. C(cid:226)y sau khi rœt gọn ........................................................................................87 H(cid:236)nh 43...........................................................................................................................88 H(cid:236)nh 44 CÆc khung h(cid:236)nh trong (cid:240)oạn cı sở.....................................................................90 H(cid:236)nh 45 Khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở trŒn.............................................................90 H(cid:236)nh 46. —ặc tr(cid:253)ng h(cid:236)nh dạng........................................................................................96 H(cid:236)nh 47. Truy t(cid:236)m với dữ liệu nhập l(cid:224) (cid:240)oạn cı sở .........................................................98 H(cid:236)nh 48 M(cid:224)n h(cid:236)nh ch(cid:237)nh ..............................................................................................104 H(cid:236)nh 49 Menubar .........................................................................................................105 H(cid:236)nh 50 Toolbar ...........................................................................................................107 H(cid:236)nh 51 Ba lựa chọn ph(cid:226)n (cid:240)oạn ...................................................................................108 H(cid:236)nh 52.Duyệt cÆc (cid:240)oạn cı sở .....................................................................................109 H(cid:236)nh 53. Xem cÆc khung h(cid:236)nh của (cid:240)oạn cı sở.............................................................110 H(cid:236)nh 54.........................................................................................................................111 H(cid:236)nh 55.........................................................................................................................112 H(cid:236)nh 56. Truy vấn với dữ liệu nhập l(cid:224) (cid:240)oạn cı sở.......................................................114 H(cid:236)nh 57. Truy vấn với dữ liệu nhập l(cid:224) (cid:240)oạn video ......................................................115 H(cid:236)nh 58. Truy vấn với dữ liệu nhập l(cid:224) ảnh tĩnh ...........................................................116
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
9
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
DANH S`CH C`C BẢNG
Bảng 1 Bảng thống kŒ kết quả ph(cid:226)n (cid:240)oạn......................................................................76 Bảng 2. Kết quả truy t(cid:236)m ..............................................................................................100
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
10
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
T(cid:211)M TẮT LUẬN VˆN
TŒn (cid:240)ề t(cid:224)i : Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin thị giÆc
dựa v(cid:224)o nội dung.
Nội dung của luận vªn gồm c(cid:243) hai phần ch(cid:237)nh. Thứ nhất l(cid:224) ph(cid:226)n t(cid:237)ch tự (cid:240)ộng
dữ liệu video số. Thứ hai l(cid:224) hỗ trợ truy t(cid:236)m.
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số l(cid:224) việc chuyển những dữ liệu video ban (cid:240)ầu vốn rất lớn về k(cid:237)ch th(cid:253)ớc th(cid:224)nh cÆc (cid:240)ặc tr(cid:253)ng cấp cao với k(cid:237)ch th(cid:253)ớc bØ l(cid:224) cÆc (cid:240)oạn cı sở (cid:240)ª (cid:240)(cid:253)ợc ph(cid:226)n cấp ph(cid:226)n lớp, giœp l(cid:253)u trữ v(cid:224) quản l(cid:253) dữ liệu video hiệu quả hın.
Hỗ trợ truy t(cid:236)m th(cid:244)ng tin thị giÆc l(cid:224) việc (cid:240)(cid:253)a ra một ph(cid:253)ıng phÆp mới trong việc truy t(cid:236)m th(cid:244)ng tin video trong cı sở dữ liệu dựa v(cid:224)o nội dung. Với ph(cid:253)ıng phÆp n(cid:224)y, việc truy t(cid:236)m sẽ trở nŒn dễ d(cid:224)ng hın, tiện lợi hın, ch(cid:237)nh xÆc hın, v(cid:224) nhanh ch(cid:243)ng hın. H(cid:253)ớng nghiŒn cứu n(cid:224)y (cid:240)ang thu hœt (cid:240)(cid:253)ợc sự quan t(cid:226)m của nhiều ng(cid:253)ời do nhu cầu ng(cid:224)y c(cid:224)ng tªng về l(cid:253)u trữ v(cid:224) truy vấn dữ liệu video số. Trong khu(cid:244)n khổ luận vªn n(cid:224)y, chœng t(cid:244)i tr(cid:236)nh b(cid:224)y một số ph(cid:253)ıng phÆp ph(cid:226)n (cid:240)oạn, x(cid:226)y dựng c(cid:226)y ph(cid:226)n cấp ph(cid:226)n lớp, truy t(cid:236)m video, v(cid:224) t(cid:237)ch hợp cÆc ph(cid:253)ıng phÆp n(cid:224)y v(cid:224)o một ch(cid:253)ıng tr(cid:236)nh c(cid:224)i (cid:240)ặt.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
11
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
CH(cid:221)(cid:213)NG 1 MỞ —ẦU
Ch(cid:253)ıng n(cid:224)y giới thiệu tổng quan về t(cid:236)nh h(cid:236)nh sử dụng dữ liệu video trŒn thế giới, những vấn (cid:240)ề phÆt sinh, cÆc h(cid:253)ớng nghiŒn cứu giải quyết. Trong ch(cid:253)ıng n(cid:224)y cũng giới thiệu sı l(cid:253)ợc qui tr(cid:236)nh xử l(cid:253) ch(cid:237)nh trong luận vªn v(cid:224) cấu trœc bÆo cÆo luận vªn.
Nội dung của ch(cid:253)ıng :
1. Giới thiệu tổng quan. 2. CÆc h(cid:253)ớng nghiŒn cứu liŒn quan (cid:240)ến (cid:240)ề t(cid:224)i. 3. Qui tr(cid:236)nh ch(cid:237)nh của luận vªn. 4. Cấu trœc luận vªn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
12
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1. Giới thiệu tổng quan
Trong cÆc giÆc quan của con ng(cid:253)ời, c(cid:243) thể n(cid:243)i thị giÆc (cid:240)(cid:243)ng vai tr(cid:242) quan trọng nhất. Nhờ c(cid:243) thị giÆc m(cid:224) chœng ta tiếp nhận th(cid:244)ng tin từ thế giới bŒn ngo(cid:224)i một cÆch phong phœ v(cid:224) sống (cid:240)ộng. Trong quÆ tr(cid:236)nh phÆt triển của lo(cid:224)i ng(cid:253)ời nảy sinh ra nhu cầu giữ lại những th(cid:244)ng tin thị giÆc tiếp nhận (cid:240)(cid:253)ợc. Mới (cid:240)ầu chỉ l(cid:224) những h(cid:236)nh thø (cid:240)(cid:253)ợc khắc một cÆch th(cid:244) sı trong cÆc hang (cid:240)ộng, trŒn những tảng (cid:240)Æ, (cid:240)ể truyền lại kinh nghiệm cho thế hệ sau. Trải qua một quªng thời gian sau, con ng(cid:253)ời phÆt minh ra giấy viết. Từ (cid:240)(cid:226)y, th(cid:244)ng tin thị giÆc (cid:240)(cid:253)ợc l(cid:253)u giữ d(cid:253)ới h(cid:236)nh thức mới tiện lợi hın. Rồi con ng(cid:253)ời phÆt minh ra mÆy ảnh (cid:240)ể chụp ảnh tĩnh, v(cid:224) mÆy quay phim (cid:240)ể thu ảnh (cid:240)ộng (video). —(cid:226)y thực sự l(cid:224) một cuộc cÆch mạng. Mặc dø chỉ l(cid:224) hai chiều, nh(cid:253)ng h(cid:236)nh ảnh thu (cid:240)(cid:253)ợc rất ch(cid:237)nh xÆc, gần nh(cid:253) giống với những g(cid:236) mắt ta cảm nhận (cid:240)(cid:253)ợc. Kh(cid:244)ng những vậy m(cid:224) n(cid:243) c(cid:242)n l(cid:224) những (cid:240)oạn video thể hiện một cÆch sống (cid:240)ộng thế giới v(cid:224) những g(cid:236) mắt ta thấy (cid:240)(cid:253)ợc. Con ng(cid:253)ời nh(cid:253) c(cid:243) (cid:240)(cid:253)ợc quyền nªng (cid:240)(cid:243)ng bªng thời gian v(cid:224) kh(cid:244)ng gian. Nhờ (cid:240)(cid:243), kiến thức của con ng(cid:253)ời về thế giới ng(cid:224)y c(cid:224)ng tªng, tr(cid:236)nh (cid:240)ộ khoa học kỹ thuật c(cid:224)ng lœc c(cid:224)ng cao.
V(cid:224) mÆy t(cid:237)nh xuất hiện. Sự ra (cid:240)ời của mÆy t(cid:237)nh (cid:240)Ænh dấu một kỷ nguyŒn mới, thời kỳ của mÆy t(cid:237)nh v(cid:224) kỹ thuật số. Tất cả (cid:240)ều (cid:240)(cid:253)ợc số h(cid:243)a nếu c(cid:243) thể. —iều n(cid:224)y dẫn (cid:240)ến sự bøng nổ về th(cid:244)ng tin thị giÆc, khiến chœng trở th(cid:224)nh một phần kh(cid:244)ng thể thiếu trong cuộc sống ng(cid:224)y nay.
Trong thời (cid:240)ại c(cid:244)ng nghệ th(cid:244)ng tin, c(cid:243) thể n(cid:243)i th(cid:244)ng tin l(cid:224) quan trọng nhất. Ai nắm (cid:240)(cid:253)ợc th(cid:244)ng tin, ng(cid:253)ời (cid:240)(cid:243) c(cid:243) sức mạnh trong tay. Th(cid:244)ng tin th(cid:236) kh(cid:244)ng thiếu, thậm ch(cid:237) quÆ nhiều dẫn (cid:240)ến thừa th(cid:244)ng tin. Vấn (cid:240)ề l(cid:224) việc chọn lọc t(cid:236)m kiếm, l(cid:253)u giữ, v(cid:224) sử dụng nh(cid:253) thế n(cid:224)o cho hợp l(cid:253).
Phần lớn dữ liệu video số hiện nay (cid:240)(cid:253)ợc l(cid:253)u giữ d(cid:253)ới dạng th(cid:244) v(cid:224) (cid:240)(cid:253)ợc gÆn nhªn, (cid:240)Ænh chỉ mục bằng vªn bản.Chẳng hạn nh(cid:253) trong một cı sở dữ liệu video c(cid:243) chứa một (cid:240)oạn video c(cid:243) tŒn nh(cid:253) sau : (cid:147)euro2004_France_England.mpg(cid:148). —oạn video
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
13
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
n(cid:224)y (cid:240)(cid:253)ợc (cid:240)Ænh chỉ mục v(cid:224) gÆn nhªn l(cid:224) (cid:147)euro2004_France_England(cid:148), cho biết (cid:240)(cid:226)y l(cid:224) (cid:240)oạn video về trận (cid:240)ấu ở Euro 2004 giữa hai (cid:240)ội b(cid:243)ng PhÆp v(cid:224) Anh. Sở dĩ hiện nay ph(cid:253)ıng phÆp gÆn nhªn chỉ mục dựa v(cid:224)o vªn bản n(cid:224)y (cid:240)(cid:253)ợc sử dụng nhiều v(cid:236) n(cid:243) (cid:240)ın giản, cho kết quả t(cid:236)m kiếm nhanh. Tuy nhiŒn kh(cid:244)ng lœc n(cid:224)o kết quả cũng l(cid:224)m vừa l(cid:242)ng ng(cid:253)ời truy t(cid:236)m, thậm ch(cid:237) ng(cid:253)ời døng phải mất khÆ nhiều c(cid:244)ng sừc. V(cid:237) dụ nh(cid:253) trong cı sở dữ liệu video (cid:240)ề cập ở trŒn c(cid:243) thể c(cid:242)n c(cid:243) nhiều (cid:240)oạn video t(cid:253)ıng tự nh(cid:253) euro2004_Portugal_Spain.mpg, euro2004_Russia_Greece.mpg , (cid:133) Một ng(cid:253)ời n(cid:224)o (cid:240)(cid:243) muốn truy t(cid:236)m những cảnh ghi b(cid:224)n thắng trong Euro 2004. Ng(cid:253)ời (cid:240)(cid:243) sẽ t(cid:236)m kiếm cÆc (cid:240)oạn video với từ kh(cid:243)a l(cid:224) (cid:147)euro 2004(cid:148). Kết quả truy t(cid:236)m l(cid:224) rất nhiều (cid:240)oạn video c(cid:243) liŒn quan (cid:240)ến vªn bản (cid:147)euro 2004(cid:148) nh(cid:253) cÆc (cid:240)oạn video ở trŒn. Ng(cid:253)ời truy t(cid:236)m phải lần luợt duyệt qua cÆc (cid:240)oạn video vừa t(cid:236)m (cid:240)(cid:253)ợc, mỗi (cid:240)oạn video phải duyệt từ (cid:240)ầu (cid:240)ến cuối, xem những chỗ n(cid:224)o c(cid:243) cảnh ghi b(cid:224)n, nếu c(cid:243) th(cid:236) l(cid:253)u giữ lại cảnh (cid:240)(cid:243), nếu kh(cid:244)ng th(cid:236) duyệt tiếp. —ộ d(cid:224)i trung b(cid:236)nh một (cid:240)oạn video về trận (cid:240)ấu b(cid:243)ng (cid:240)Æ l(cid:224) 90 phœt, nếu (cid:240)uợc nØn d(cid:253)ới dạng MPEG1 th(cid:236) c(cid:243) dung l(cid:253)ợng khoảng 800MB. Euro 2004 c(cid:243) tổng cộng 31 trận (cid:240)ấu. Nh(cid:253) vậy, (cid:240)ể ho(cid:224)n th(cid:224)nh c(cid:244)ng việc, ng(cid:253)ời truy t(cid:236)m phải tải một dung l(cid:253)ợng video bằng 31x 800MB = 24800MB = 24.8GB, v(cid:224) phải mất 31 x 90 phœt = 2790 phœt = 46.5 giờ (cid:240)ể duyệt dữ liệu video. Nếu duyệt với tốc (cid:240)ộ nhanh gấp 5 lần, tức l(cid:224) chỉ xem l(cid:253)ớt qua, th(cid:236) cũng phải mất 9.3 giờ, ch(cid:253)a kể thời gian tải dữ liệu video. Rı r(cid:224)ng cÆch truy t(cid:236)m n(cid:224)y tốn rất nhiều chi ph(cid:237), thời gian, v(cid:224) c(cid:244)ng sức. Ngo(cid:224)i ra, (cid:240)ể c(cid:243) (cid:240)uợc dữ liệu video (cid:240)ª gÆn nhªn chỉ mục, tr(cid:253)ớc (cid:240)(cid:243) ng(cid:253)ời ta cũng phải duyệt, chọn lọc nội dung của cÆc (cid:240)oạn video một cÆch thủ c(cid:244)ng, lại thŒm một lần nữa mất rất nhiều thời gian v(cid:224) c(cid:244)ng sức. M(cid:224) th(cid:244)ng tin kh(cid:244)ng chỉ c(cid:243) thể thao, m(cid:224) c(cid:242)n ở nhiều lĩnh vực khÆc, v(cid:224) dữ liệu ng(cid:224)y c(cid:224)ng nhiều, c(cid:224)ng phong phœ, v(cid:224) tªng thŒm rất nhanh mỗi ng(cid:224)y, việc gÆn nhªn chỉ mục thủ c(cid:244)ng c(cid:224)ng tốn nhiều chi ph(cid:237). Ch(cid:253)a kể (cid:240)ến sự khÆc biệt về ng(cid:244)n ngữ tự nhiŒn. Chẳng hạn nh(cid:253) kho dữ liệu (cid:240)(cid:243) do những nguời Nhật gÆn nhªn chỉ mục theo tiếng Nhật, bắt buộc chœng ta cũng phải biết tiếng Nhật mới c(cid:243) thể truy t(cid:236)m (cid:240)uợc th(cid:244)ng tin. —(cid:226)y l(cid:224) một khuyết (cid:240)iểm khÆ lớn của việc truy t(cid:236)m video theo vªn bản v(cid:236) th(cid:244)ng tin thị giÆc l(cid:224)
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
14
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
nh(cid:253) nhau với mọi nguời, mọi ng(cid:253)ời (cid:240)ều cảm nhận giống nhau, kh(cid:244)ng ph(cid:226)n biệt ng(cid:244)n ngữ, sắc tộc.
Những c(cid:244)ng việc gÆn nhªn chỉ mục trŒn (cid:240)ều (cid:240)(cid:253)ợc l(cid:224)m thủ c(cid:244)ng do cÆch thức l(cid:253)u trữ ch(cid:253)a hợp l(cid:253), ch(cid:253)a phÆt triển kịp với sự bøng nổ của th(cid:244)ng tin. Từ (cid:240)(cid:243) nảy sinh nhu cầu c(cid:243) cÆch thức n(cid:224)o l(cid:253)u trữ hợp l(cid:253) hın, với những (cid:240)ặc tr(cid:253)ng cấp cao hın, mang nhiều ngữ nghĩa hın, (cid:240)ể con ng(cid:253)ời c(cid:243) thể t(cid:236)m kiếm v(cid:224) sử dụng hiệu quả th(cid:244)ng tin thị giÆc.
B(cid:226)y giờ, giả sử một ng(cid:253)ời lại t(cid:236)m th(cid:244)ng tin về những b(cid:224)n thắng trong Euro 2004, nh(cid:253)ng l(cid:224) t(cid:236)m trong những b(cid:224)i viết, những b(cid:224)i bÆo, vªn bản m(cid:244) tả những cảnh ghi b(cid:224)n (cid:240)(cid:243). C(cid:244)ng việc trở nŒn dễ d(cid:224)ng hın nhiều, chœng ta chỉ cần v(cid:224)o một trang t(cid:236)m kiếm n(cid:224)o (cid:240)(cid:243) trŒn mạng internet, gı v(cid:224)o cÆc từ kh(cid:243)a (cid:147)sœt tung l(cid:253)ới, ghi b(cid:224)n, euro 2004(cid:148), sẽ c(cid:243) rất nhiều b(cid:224)i viết (cid:240)(cid:253)ợc t(cid:236)m thấy. Lœc n(cid:224)y, cÆch thức t(cid:236)m kiếm (cid:240)i trực tiếp v(cid:224)o nội dung vªn bản cần t(cid:236)m nŒn kết quả ch(cid:237)nh xÆc v(cid:224) dễ chấp nhận hın. Vậy tại sao chœng ta kh(cid:244)ng t(cid:236)m kiếm th(cid:244)ng tin thị giÆc dựa v(cid:224)o nội dung?
Luận vªn của chœng t(cid:244)i t(cid:236)m hiểu v(cid:224) phÆt triển một ph(cid:253)ıng phÆp giœp ph(cid:226)n t(cid:237)ch tự (cid:240)ộng cấu trœc video số giœp l(cid:253)u trữ, quản l(cid:253), t(cid:236)m kiếm một cÆch hiệu quả th(cid:244)ng tin video dựa v(cid:224)o nội dung. N(cid:243)i cÆch khÆc, chœng t(cid:244)i h(cid:253)ớng tới việc truy t(cid:236)m cÆc (cid:240)oạn video trực tiếp bằng nội dung của ch(cid:237)nh (cid:240)oạn video. Nh(cid:253) v(cid:237) dụ t(cid:236)m b(cid:224)n thắng ở trŒn, chœng ta chỉ cần c(cid:243) một (cid:240)oạn video nhỏ m(cid:244) tả cảnh quả b(cid:243)ng (cid:240)ang bay v(cid:224)o khung th(cid:224)nh, v(cid:224) chœng ta døng (cid:240)oạn video (cid:240)(cid:243) l(cid:224)m (cid:147)từ kh(cid:243)a(cid:148) (cid:240)ể truy t(cid:236)m cÆc b(cid:224)n thắng trong dữ liệu video, với (cid:253) nghĩa l(cid:224) : t(cid:236)m những (cid:240)oạn video n(cid:224)o m(cid:224) c(cid:243) cảnh quả b(cid:243)ng bay v(cid:224)o khung th(cid:224)nh. Chi ph(cid:237) t(cid:236)m kiếm sẽ giảm rất nhiều m(cid:224) kết quả truy t(cid:236)m lại rất khả quan.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
15
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
V(cid:237) dụ : —oạn video døng (cid:240)ể truy vấn l(cid:224) cảnh ảnh trÆi b(cid:243)ng (cid:240)ang bay v(cid:224)o khung th(cid:224)nh
H(cid:236)nh 1 —oạn video døng dể truy vấn
Kết quả truy vấn :
H(cid:236)nh 2 kết quả truy vấn
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
16
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2. CÆc h(cid:253)ớng nghiŒn cứu liŒn quan (cid:240)ến (cid:240)ề t(cid:224)i
Tr(cid:253)ớc nhu cầu ng(cid:224)y c(cid:224)ng lớn trong việc quản l(cid:253) dữ liệu video, nhiều nh(cid:243)m nghiŒn cứu (cid:240)ª nhảy v(cid:224)o cuộc. —ª c(cid:243) nhiều thuật toÆn về nØn dữ liệu video số cho kết quả rất khả quan v(cid:224) (cid:240)ang (cid:240)(cid:253)ợc Æp dụng rộng rªi. CÆc (cid:240)ịnh dạng file video MPEG1, MPEG2, MPEG4, WMV, MOV, (cid:133) g(cid:243)p phần l(cid:224)m giảm (cid:240)Æng kể k(cid:237)ch th(cid:253)ớc của dữ liệu video. Nh(cid:253)ng chœng chỉ giœp cho việc l(cid:253)u trữ nhiều hın trong một kh(cid:244)ng gian nhỏ hın, chứ kh(cid:244)ng giải quyết (cid:240)(cid:253)ợc việc l(cid:253)u trữ hiệu quả (cid:240)ể truy t(cid:236)m.
Tuy nhiŒn, hiện nay một số nh(cid:243)m (cid:240)ang tiến h(cid:224)nh việc nghiŒn cứu v(cid:224) Æp dụng v(cid:224)o thực tế một số ph(cid:253)ıng phÆp l(cid:253)u trữ v(cid:224) truy t(cid:236)m dựa v(cid:224)o nội dung, cho thấy (cid:240)(cid:226)y l(cid:224) một h(cid:253)ớng phÆt triển mới v(cid:224) rất c(cid:243) triển vọng. Sau (cid:240)(cid:226)y l(cid:224) một số nh(cid:243)m tiŒu biểu:
—ại học Carnegie Mellon Nh(cid:243)m phÆt triển thuộc —ại học Carnegie Mellon (cid:240)ang thực hiện một dự Æn th(cid:253) viện th(cid:244)ng tin cho phØp ng(cid:253)ời døng truy t(cid:236)m video bằng ng(cid:244)n ngữ tự nhiŒn. CÆc b(cid:253)ớc xử l(cid:253) (cid:240)ể tạo nŒn th(cid:253) viện video : phÆt hiện cÆc (cid:240)oạn cı sở bằng cÆch sử dụng ph(cid:253)ıng phÆp (cid:240)ộ sai biệt về l(cid:253)ợc (cid:240)ồ m(cid:224)u, rồi rœt tr(cid:237)ch khung h(cid:236)nh ch(cid:237)nh, nhận dạng khu(cid:244)n mặt, nhận dạng chữ viết qua video, v(cid:224) t(cid:236)m ảnh dựa v(cid:224)o (cid:240)ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ m(cid:224)u trong cÆc kh(cid:244)ng gian m(cid:224)u v(cid:224) v(cid:226)n khÆc nhau.
Nh(cid:243)m nghiŒn cứu của IBM Nh(cid:243)m nghiŒn cứu của IBM (cid:240)ª phÆt triển một hệ thống truy t(cid:236)m video theo nội dung tự (cid:240)ộng v(cid:224) t(cid:253)ıng tÆc dựa v(cid:224)o những (cid:240)ặc (cid:240)iểm trực quan v(cid:224) m(cid:244) h(cid:236)nh thống kŒ. Hệ thống sử dụng IBM Cue Video (cid:240)ể phÆt hiện (cid:240)oạn cı sở v(cid:224) lựa chọn khung h(cid:236)nh ch(cid:237)nh một cÆch tự (cid:240)ộng.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
17
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
—ại học Johns Hopkins Nh(cid:243)m nghiŒn cứu JHU/APL (cid:240)ª phÆt triển một hệ thống truy t(cid:236)m tự (cid:240)ộng video dựa v(cid:224)o nội dung của cÆc khung h(cid:236)nh video số. Mỗi khung h(cid:236)nh ch(cid:237)nh (cid:240)(cid:253)ợc (cid:240)Ænh chỉ số bởi ch(cid:237)nh (cid:240)ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ m(cid:224)u v(cid:224) v(cid:226)n ảnh của n(cid:243).
—ại học Maryland —ại học Maryland, (cid:240)ang l(cid:224)m việc với những nh(cid:224) nghiŒn cứu từ (cid:240)ại học Oulu,
mở rộng cÆc ph(cid:253)ıng thức (cid:240)(cid:253)ợc døng cho việc truy t(cid:236)m ảnh.
—ại học Bắc Texas Nh(cid:243)m —ại học Bắc Texas tr(cid:237)ch cÆc khung h(cid:236)nh từ dữ liệu video theo chu kỳ 5 gi(cid:226)y. Những khung h(cid:236)nh n(cid:224)y sẽ qua tiến tr(cid:236)nh chọn khung h(cid:236)nh ch(cid:237)nh (cid:240)ể bỏ (cid:240)i những khung h(cid:236)nh thừa. Những khung h(cid:236)nh ch(cid:237)nh sau (cid:240)(cid:243) sẽ (cid:240)(cid:253)ợc (cid:240)(cid:253)a v(cid:224)o ứng dụng UNT(cid:146)s Brighton Image Searcher, dựa v(cid:224)o cÆc (cid:240)ộ (cid:240)o toÆn học t(cid:253)ıng ứng với những (cid:240)ặc t(cid:237)nh quan trọng của ảnh. —ộ ch(cid:237)nh xÆc của quÆ tr(cid:236)nh chọn khung h(cid:236)nh ch(cid:237)nh t(cid:253)ıng (cid:240)ối khả quan.
C(cid:243) thể thấy rằng, hiện nay, lĩnh vực xử l(cid:253) video theo nội dung khÆ hấp dẫn v(cid:224) thu hœt (cid:240)(cid:253)ợc sự quan t(cid:226)m của ng(cid:224)y c(cid:224)ng nhiều nh(cid:243)m nghiŒn cứu v(cid:236) những nhu cầu v(cid:224) ứng dụng thực tế của n(cid:243). Tuy nhiŒn, phần lớn những nghiŒn cứu vẫn c(cid:242)n ở trong l(cid:253) thuyết, c(cid:242)n những hệ thống (cid:240)ª c(cid:224)i (cid:240)ặt Æp dụng th(cid:236) chỉ c(cid:243) kết quả t(cid:253)ıng (cid:240)ối. V(cid:236) vậy, trong luận vªn n(cid:224)y, chœng t(cid:244)i nghiŒn cứu v(cid:224) thực hiện c(cid:224)i (cid:240)ặt một số ph(cid:253)ıng phÆp giœp l(cid:253)u trữ v(cid:224) truy t(cid:236)m th(cid:244)ng tin thị giÆc hiệu quả hın, ho(cid:224) v(cid:224)o d(cid:242)ng xử l(cid:253) video (cid:240)ang phÆt triển mạnh mẽ hiện nay.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
18
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
3. Qui tr(cid:236)nh ch(cid:237)nh (cid:240)(cid:253)ợc thực hiện trong luận vªn
Gồm 2 giai (cid:240)oạn : Giai (cid:240)oạn ngoại tuyến v(cid:224) giai (cid:240)oạn trực tuyến (xem h(cid:236)nh)
H(cid:236)nh 3 Qui tr(cid:236)nh ch(cid:237)nh
3.1. Giai (cid:240)oạn ngoại tuyến (off-line)
Mục (cid:240)(cid:237)ch của giai (cid:240)oạn n(cid:224)y ph(cid:226)n t(cid:237)ch v(cid:224) l(cid:253)u trữ những (cid:240)ặc tr(cid:253)ng cấp cao của dữ liệu video, gồm cÆc b(cid:253)ớc :
—ầu tiŒn, dữ liệu video d(cid:253)ới dạng tập tin video th(cid:244)ng th(cid:253)ờng (avi, mpeg) (cid:240)(cid:253)ợc (cid:240)(cid:253)a v(cid:224)o bộ ph(cid:226)n (cid:240)oạn (cid:240)ể ph(cid:226)n t(cid:237)ch (cid:240)oạn video ban (cid:240)ầu th(cid:224)nh cÆc (cid:240)oạn cı sở.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
19
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Tiếp theo, tiến h(cid:224)nh rœt tr(cid:237)ch (cid:240)ặc tr(cid:253)ng của cÆc (cid:240)oạn cı sở (cid:240)ể tạo th(cid:224)nh cı sở dữ liệu cÆc (cid:240)ặc tr(cid:253)ng của cÆc (cid:240)oạn cı sở. CÆc (cid:240)ặc tr(cid:253)ng c(cid:243) thể l(cid:224) (cid:240)ặc tr(cid:253)ng m(cid:224)u, (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng, (cid:240)ặc tr(cid:253)ng biŒn cạnh, (cid:133) Kế (cid:240)ến, ph(cid:226)n lớp cÆc (cid:240)oạn cı sở v(cid:224) chọn phần tử (cid:240)ại diện, tạo nŒn cı sở dữ liệu cÆc lớp của cÆc (cid:240)oạn cı sở với phần tử (cid:240)ại diện.
3.2. Giai (cid:240)oạn trực tuyến (on-line)
Sau khi (cid:240)ª ph(cid:226)n t(cid:237)ch v(cid:224) l(cid:253)u trữ cÆc (cid:240)ặc tr(cid:253)ng cấp cao của video, chœng ta (cid:240)ª c(cid:243) một cı sở dữ liệu c(cid:243) thể truy vấn. Giai (cid:240)oạn n(cid:224)y thực hiện truy vấn dữ liệu video số qua cÆc b(cid:253)ớc sau :
—(cid:253)a (cid:240)oạn video cần truy vấn v(cid:224)o, ph(cid:226)n t(cid:237)ch (cid:240)oạn video n(cid:224)y th(cid:224)nh cÆc (cid:240)oạn cı sở giống nh(cid:253) ở giai (cid:240)oạn ngoại tuyến trŒn. Sau (cid:240)(cid:243) tiến h(cid:224)nh rœt tr(cid:237)ch (cid:240)ặc tr(cid:253)ng của cÆc (cid:240)oạn cı sở của (cid:240)oạn video truy vấn, rồi thực hiện ph(cid:226)n chia cÆc (cid:240)oạn cı sở v(cid:224) chọn phần tử (cid:240)ại diện. So sÆnh cÆc (cid:240)ặc tr(cid:253)ng của cÆc (cid:240)oạn cı sở của (cid:240)oạn video truy vấn với cÆc (cid:240)ặc tr(cid:253)ng của cÆc (cid:240)oạn cı sở (cid:240)(cid:253)ợc l(cid:253)u trong cı sở dữ liệu tạo ra ở giai (cid:240)ọan ngoại tuyến. Ứng với mỗi (cid:240)oạn cı sở của (cid:240)oạn video truy vấn, chọn ra v(cid:224) xếp hạng những (cid:240)oạn cı sở gần nhất với n(cid:243), ta c(cid:243) kết quả của truy vấn.
3.3. CÆc lĩnh vực liŒn quan:
Xử l(cid:253) ảnh số v(cid:224) video số Xử l(cid:253) t(cid:237)n hiệu số Truy t(cid:236)m ảnh dựa v(cid:224)o nội dung (cid:133)
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
20
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
4. Cấu trœc luận vªn
4.1. CH(cid:221)(cid:213)NG 1 : MỞ —ẦU.
Ch(cid:253)ıng n(cid:224)y giới thiệu tổng quÆt về xử l(cid:253) video trŒn thế giới, sı l(cid:253)ợc về (cid:240)ề t(cid:224)i, l(cid:253) do chọn, h(cid:253)ớng tiếp cận (cid:240)ề t(cid:224)i, cÆc nghiŒn cứu (cid:240)ª v(cid:224) (cid:240)ang (cid:240)(cid:253)ợc thực hiện. 4.2. CH(cid:221)(cid:213)NG 2 : MỘT SỐ KH`I NIỆM V(cid:192) —ẶC TR(cid:221)NG TRONG XỬ L(cid:221)
ẢNH SỐ V(cid:192) VIDEO SỐ. Nội dung ch(cid:237)nh của ch(cid:253)ıng n(cid:224)y l(cid:224) giới thiệu một số khÆi niệm, (cid:240)ặc tr(cid:253)ng hay sử dụng trong xử l(cid:253) ảnh số v(cid:224) video số nh(cid:253) : cÆc kh(cid:244)ng gian m(cid:224)u, l(cid:253)ợc (cid:240)ồ m(cid:224)u, (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng, (cid:133)
4.3. CH(cid:221)(cid:213)NG 3 : PH´N T˝CH TỰ —ỘNG VIDEO SỐ TH(cid:192)NH C`C —OẠN C(cid:213)
SỞ. Ch(cid:253)ıng n(cid:224)y tr(cid:236)nh b(cid:224)y về vấn (cid:240)ề ph(cid:226)n t(cid:237)ch video th(cid:224)nh cÆc (cid:240)oạn cı sở, bao gồm cÆc khÆi niệm cı bản, một số ph(cid:253)ıng phÆp th(cid:253)ờng døng, cÆc ph(cid:253)ıng phÆp cải tiến (cid:240)(cid:253)ợc døng trong luận vªn.
4.4. CH(cid:221)(cid:213)NG 4 : TỔ CHỨC C`C —OẠN C(cid:213) SỞ THEO CẤU TR(cid:218)C C´Y.
Nội dung ch(cid:237)nh của ch(cid:253)ıng l(cid:224) cÆc thuật toÆn tổ chức cÆc (cid:240)oạn cı sở theo cấu trœc c(cid:226)y, x(cid:226)y dựng bảng mục lục v(cid:224) bảng chỉ mục v(cid:224) ph(cid:226)n lớp cÆc (cid:240)oạn cı sở.
4.5. CH(cid:221)(cid:213)NG 5 : TRUY VẤN DỮ LIỆU VIDEO SỐ
Ch(cid:253)ıng n(cid:224)y n(cid:243)i về cÆc thuật toÆn døng cho việc truy vấn, truy t(cid:236)m video số.
4.6. CH(cid:221)(cid:213)NG 6 : HỆ THỐNG —ˆ C(cid:192)I —ẶT
Ch(cid:253)ıng n(cid:224)y giới thiệu về ch(cid:253)ıng tr(cid:236)nh (cid:240)ª c(cid:224)i (cid:240)ặt, cÆc chức nªng ch(cid:237)nh của ch(cid:253)ıng tr(cid:236)nh, cÆc thuật toÆn (cid:240)ª c(cid:224)i (cid:240)ặt, v(cid:224) h(cid:253)ớng dẫn sử dụng.
4.7. CH(cid:221)(cid:213)NG 7 : KẾT LUẬN
Ở phần n(cid:224)y, chủ yếu l(cid:224) những kết quả (cid:240)ạt (cid:240)(cid:253)ợc, những (cid:240)(cid:243)ng g(cid:243)p mới v(cid:224) h(cid:253)ớng phÆt triển trong t(cid:253)ıng lai.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
21
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
CH(cid:221)(cid:213)NG 2 MỘT SỐ KH`I NIỆM V(cid:192) —ẶC TR(cid:221)NG TRONG XỬ L(cid:221) ẢNH SỐ V(cid:192) VIDEO SỐ.
Ch(cid:253)ıng n(cid:224)y giới thiệu về cÆc (cid:240)ặc tr(cid:253)ng hay døng trong xử l(cid:253) ảnh số v(cid:224) video số. —(cid:243) l(cid:224) cÆc (cid:240)ặc tr(cid:253)ng về m(cid:224)u sắc, (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng, biŒn cạnh, (cid:133) Ngo(cid:224)i ra cũng giới thiệu sı qua cÆc kh(cid:244)ng gian m(cid:224)u, l(cid:253)ợc (cid:240)ồ m(cid:224)u, l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u.
Nội dung của ch(cid:253)ıng :
1. Một số khÆi niệm, (cid:240)ịnh nghĩa trong xủ l(cid:253) video 2. Kh(cid:244)ng gian m(cid:224)u 3. L(cid:253)ợc (cid:240)ồ m(cid:224)u 4. L(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u 5. BiŒn cạnh 6. —ặc tr(cid:253)ng chuyển (cid:240)ộng 7. CÆc (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở 8. T(cid:243)m tắt ch(cid:253)ıng
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
22
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1. Một số khÆi niệm, (cid:240)ịnh nghĩa trong xử l(cid:253) video
1.1. Khung h(cid:236)nh (frame)
Một (cid:240)oạn video gồm nhiều ảnh tĩnh (cid:240)ặt liŒn tiếp nhau tạo nŒn chuyển (cid:240)ộng trong phim. Một khung h(cid:236)nh l(cid:224) một ảnh tĩnh (cid:240)(cid:243). Vd :
H(cid:236)nh 4 CÆc khung h(cid:236)nh
Khung h(cid:236)nh thứ i Khung h(cid:236)nh thứ i + 1
—ể (cid:240)oạn video c(cid:243) thể tạo cảm giÆc chuyển (cid:240)ộng, cÆc khung h(cid:236)nh phải (cid:240)(cid:253)ợc quay với tốc (cid:240)ộ phø hợp. V(cid:236) mắt ng(cid:253)ời chỉ c(cid:243) thể nhận (cid:240)(cid:253)ợc 24 h(cid:236)nh/gi(cid:226)y, nŒn nếu nh(cid:253) trong một gi(cid:226)y, lần l(cid:253)ợt 24 h(cid:236)nh hoặc nhiều hın (cid:240)(cid:253)ợc phÆt th(cid:236) mắt sẽ kh(cid:244)ng nhận ra (cid:240)(cid:253)ợc sự rời rạc giữa những khung h(cid:236)nh, m(cid:224) chỉ thấy những cảnh liŒn tục. C(cid:243) nhiều hệ video v(cid:224) mỗi hệ c(cid:243) tốc (cid:240)ộ quay khÆc nhau nh(cid:253) : NTSC 30 h(cid:236)nh/gi(cid:226)y, PAL 24 h(cid:236)nh/gi(cid:226)y, SECAM 29.99 h(cid:236)nh/gi(cid:226)y.
Khung h(cid:236)nh l(cid:224) (cid:240)ın vị cı bản nhất của dữ liệu video. Theo chuẩn của hệ NTSC th(cid:236) một gi(cid:226)y c(cid:243) 30 khung h(cid:236)nh, vậy một phœt c(cid:243) 1800 khung h(cid:236)nh, một giờ c(cid:243) 60x1800 = 108000 khung h(cid:236)nh. C(cid:243) thể thấy rằng số l(cid:253)ợng khung h(cid:236)nh cho một (cid:240)oạn video th(cid:253)ờng l(cid:224) rất lớn, cần phải c(cid:243) một (cid:240)ın vị cấp cao hın cho video số.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
23
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2. —oạn cı sở (shot)
—oạn cı sở l(cid:224) một chuỗi một hay nhiều khung h(cid:236)nh liŒn tiếp nhau theo thời gian
m(cid:244) tả một h(cid:224)nh (cid:240)ộng liŒn tục, (cid:240)(cid:253)ợc giới hạn bởi 2 chuyển cảnh.
—oạn cı sở thứ i+1 —oạn cı sở thứ i+2 —oạn cı sở thứ i
BiŒn (cid:240)oạn cı sở BiŒn (cid:240)oạn cı sở `
Chuyển Cảnh H(cid:236)nh 5 —oạn cı sở
Một (cid:240)oạn video c(cid:243) thể c(cid:243) nhiều (cid:240)oạn cı sở, m(cid:224) cũng c(cid:243) thể chỉ l(cid:224) một (cid:240)oạn cı sở. Những (cid:240)oạn cı sở (cid:240)ại diện cho to(cid:224)n bộ (cid:240)oạn video, v(cid:224) truy xuất (cid:240)ến chœng cũng coi nh(cid:253) l(cid:224) truy xuất (cid:240)ến ch(cid:237)nh (cid:240)oạn video. Tổ chức những (cid:240)oạn video ở mức (cid:240)ộ (cid:240)oạn cı sở l(cid:224) th(cid:237)ch hợp nhất cho việc duyệt v(cid:224) truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung. 1.3. Chuyển cảnh
Nh(cid:253) (cid:240)ª n(cid:243)i ở trŒn, chuyển cảnh l(cid:224) những (cid:240)(cid:253)ờng biŒn ph(cid:226)n chia cÆc (cid:240)oạn cı sở. Ngo(cid:224)i cÆc chuyển cảnh tự nhiŒn th(cid:236) ng(cid:224)y c(cid:224)ng xuất hiện nhiều chuyển cảnh do chỉnh sửa video tạo nŒn. CÆc phần mềm xử l(cid:253) phim nổi tiếng nh(cid:253) Adobe Premiere hoặc Ulead MediaStudio cung cấp hın 100 kiểu chỉnh sửa video (cid:240)ể tạo nŒn những (cid:240)oạn chuyển cảnh khÆc nhau. Tuy nhiŒn, hın 99% rıi v(cid:224)o một trong những loại chuyển cảnh sau :
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
24
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.3.1. Chuyển cảnh tức th(cid:236) (Hard cut) :
L(cid:224)những chuyển cảnh rı r(cid:224)ng, dứt khoÆt, ngay lập tức v(cid:224) dễ nhận biết
H(cid:236)nh 6 Chuyển cảnh tức th(cid:236)
1.3.2. Chuyển cảnh tiệm tiến (gradual/fade/dissolve) : l(cid:224) những cảnh trong (cid:240)(cid:243) (cid:240)ối t(cid:253)ợng mờ dần v(cid:224) ch(cid:236)m v(cid:224)o nền của ảnh hoặc cảnh cũ mờ dần v(cid:224) (cid:240)an xen v(cid:224)o cảnh mới
H(cid:236)nh 7 Chuyển cảnh tiệm tiến
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
25
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2. Kh(cid:244)ng gian m(cid:224)u
Một kh(cid:244)ng gian m(cid:224)u l(cid:224) một m(cid:244) h(cid:236)nh (cid:240)ại diện cho m(cid:224)u về mặt giÆ trị (cid:240)ộ sÆng; một kh(cid:244)ng gian m(cid:224)u xÆc (cid:240)ịnh bao nhiŒu th(cid:244)ng tin m(cid:224)u (cid:240)(cid:253)ợc thể hiện. N(cid:243) (cid:240)ịnh nghĩa kh(cid:244)ng gian 1,2,3, hoặc 4 chiều m(cid:224) mỗi chiều của n(cid:243), c(cid:242)n gọi l(cid:224) th(cid:224)nh phần, (cid:240)ại diện cho những giÆ trị (cid:240)ộ sÆng. Một th(cid:224)nh phần m(cid:224)u c(cid:242)n (cid:240)(cid:253)ợc gọi l(cid:224) một kŒnh m(cid:224)u.
Mỗi (cid:240)iểm ảnh trong ảnh c(cid:243) thể (cid:240)(cid:253)ợc (cid:240)ại diện bởi một (cid:240)iểm trong kh(cid:244)ng gian m(cid:224)u 3 chiều. Những kh(cid:244)ng gian m(cid:224)u th(cid:253)ờng (cid:240)(cid:253)ợc døng (cid:240)ể bao gồm RGB, CMY, Munsell, CIE l*a*b*, CIE L*u*v*, HSV, HSL. Cho (cid:240)ến nay vẫn ch(cid:253)a c(cid:243) sự thống nhất kh(cid:244)ng gian n(cid:224)o l(cid:224) tốt nhất.
Sau (cid:240)(cid:226)y l(cid:224) một số kh(cid:244)ng gian m(cid:224)u th(cid:253)ờng gặp
2.1. Kh(cid:244)ng gian (cid:240)ộ xÆm
Kh(cid:244)ng gian (cid:240)ộ xÆm chỉ c(cid:243) một th(cid:224)nh phần, biến (cid:240)ổi từ (cid:240)en (cid:240)ến trắng, nh(cid:253) trong h(cid:236)nh. Kh(cid:244)ng gian (cid:240)ộ xÆm (cid:240)(cid:253)ợc døng chủ yếu trong việc hiển thị v(cid:224) in ấn trắng (cid:240)en v(cid:224) (cid:240)ộ xÆm.
H(cid:236)nh 8. Kh(cid:244)ng gian m(cid:224)u (cid:240)ộ xÆm
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
26
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.2. Kh(cid:244)ng gian m(cid:224)u RGB
Kh(cid:244)ng gian RGB l(cid:224) kh(cid:244)ng gian m(cid:224)u (cid:240)(cid:253)ợc sử dụng rộng rªi trong việc hiển thị h(cid:236)nh ảnh. (cid:221) t(cid:253)ởng tạo ra kh(cid:244)ng gian m(cid:224)u RGB (cid:240)ến từ cÆi cÆch m(cid:224) mắt con ng(cid:253)ời hoạt (cid:240)ộng. N(cid:243) c(cid:243) những cı quan cảm nhận (cid:240)ể phÆt hiện ra 3 m(cid:224)u khÆc nhau : (cid:240)ỏ(red), lục (green), lam (blue). Kh(cid:244)ng gian m(cid:224)u RGB cũng gồm c(cid:243) 3 th(cid:224)nh phần m(cid:224)u : Red, Green, v(cid:224) Blue. Những th(cid:224)nh phần n(cid:224)y (cid:240)(cid:253)ợc gọi l(cid:224) m(cid:224)u gốc (cid:240)ể cộng v(cid:224)o, v(cid:236) mỗi m(cid:224)u (cid:240)(cid:253)ợc tạo nŒn bằng cÆch cộng thŒm cÆc phần tử v(cid:224)o m(cid:224)u (cid:240)en(0,0,0).
H(cid:236)nh 9. Kh(cid:244)ng gian RGB
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
27
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 10. Kh(cid:244)ng gian RGB
H(cid:236)nh 11. Kh(cid:244)ng gian RGB
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
28
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.3. Kh(cid:244)ng gian m(cid:224)u CMY
Kh(cid:244)ng gian CMY (cid:240)(cid:253)ợc døng chủ yếu trong in ấn. CMY l(cid:224) viết tắt của Cyan- Magenta-Yellow (m(cid:224)u lục lam, m(cid:224)u (cid:240)ỏ t(cid:253)ıi, m(cid:224)u v(cid:224)ng), (cid:240)(cid:243) l(cid:224) ba m(cid:224)u ch(cid:237)nh t(cid:253)ıng ứng với ba m(cid:224)u mực in. Chœng (cid:240)(cid:253)ợc gọi l(cid:224) những m(cid:224)u gốc (cid:240)ể trừ, v(cid:236) mỗi m(cid:224)u trong kh(cid:244)ng gian CMY (cid:240)(cid:253)ợc tạo ra th(cid:244)ng qua việc hấp thu (cid:240)ộ sÆng. Cyan hấp thu sự chiếu sÆng của m(cid:224)u (cid:240)ỏ, Magenta hấp thu m(cid:224)u xanh lục, Yellow hấp thu m(cid:224)u xanh d(cid:253)ıng.
H(cid:236)nh 12. Kh(cid:244)ng gian CMY
R
M
G
1 1 1 B
C Y
Mối quan hệ giữa RGB v(cid:224) CMY :
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
29
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.4. Kh(cid:244)ng gian m(cid:224)u HSV 2.4.1. —ịnh nghĩa
M(cid:244) h(cid:236)nh HSV(Hue, Saturation, Value), c(cid:242)n gọi l(cid:224) HSB (Hue, Saturation,
Brightness) (cid:240)ịnh nghĩa một kh(cid:244)ng gian m(cid:224)u gồm c(cid:243) 3 th(cid:224)nh phần tạo nŒn :
Hue, loại m(cid:224)u (chẳng hạn m(cid:224)u (cid:240)ỏ, xanh, hay v(cid:224)ng)
C(cid:243) giÆ trị từ 0 - 360 hoặc từ 0 - 2(cid:240)
Saturation, (cid:240)ộ thuần khiết của m(cid:224)u
C(cid:243) giÆ trị từ 0 (cid:150) 100%, th(cid:253)ờng (cid:240)(cid:253)ợc chuẩn hoÆ về 0 (cid:150) 1. —ộ thuần khiết của một m(cid:224)u c(cid:224)ng thấp, (cid:240)ộ xÆm của m(cid:224)u (cid:240)(cid:243) c(cid:224)ng nhiều v(cid:224) m(cid:224)u (cid:240)(cid:243) c(cid:224)ng mờ.
Value, (cid:240)ộ sÆng của m(cid:224)u
C(cid:243) giÆ trị từ 0 (cid:150) 100%, th(cid:253)ờng (cid:240)(cid:253)ợc chuẩn h(cid:243)a về 0 (cid:150) 1.
M(cid:244) h(cid:236)nh HSV (cid:240)(cid:253)ợc tạo ra từ nªm 1978 bởi Alvy Ray Smith. N(cid:243) l(cid:224) một phØp biến (cid:240)ổi phi tuyến của kh(cid:244)ng gian m(cid:224)u RGB. M(cid:244) h(cid:236)nh HSV giœp tÆch bạch m(cid:224)u (H, S) v(cid:224) (cid:240)ộ sÆng (V), phø hợp với cảm nhận của con ng(cid:253)ời.
H(cid:236)nh 13. CÆc th(cid:224)nh ph(cid:226)n tạo nŒn kh(cid:244)ng gian m(cid:224)u HSV
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
30
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.4.2. H(cid:236)nh dung về HSV
M(cid:244) h(cid:236)nh HSV th(cid:253)ờng (cid:240)(cid:253)ợc døng nhiều trong cÆc ứng dụng (cid:240)ồ họa mÆy t(cid:237)nh. Trong cÆc ch(cid:253)ıng tr(cid:236)nh ứng dụng, khi một ng(cid:253)ời døng phải chọn một m(cid:224)u cho một (cid:240)ối t(cid:253)ợng (cid:240)ồ hoạ cụ thể, bÆnh xe m(cid:224)u HSV th(cid:253)ờng (cid:240)(cid:253)ợc døng(Xem H(cid:236)nh). Trong (cid:240)(cid:243), th(cid:224)nh phần loại m(cid:224)u Hue (cid:240)(cid:253)ợc thể hiện bằng một vøng h(cid:236)nh tr(cid:242)n, c(cid:242)n một vøng tam giÆc riŒng biệt th(cid:253)ờng (cid:240)uợc døng (cid:240)ể thể hiện th(cid:224)nh phần Saturation v(cid:224) Value. Trục (cid:240)ứng của tam giÆc ứng với Saturation, v(cid:224) trục ngang ứng với Value. Bằng cÆch n(cid:224)y, một m(cid:224)u c(cid:243) thể (cid:240)(cid:253)ợc chọn bằng cÆch (cid:240)ầu tiŒn chọn loại m(cid:224)u từ vøng h(cid:236)nh tr(cid:242)n, rồi chọn (cid:240)ộ thuần khiết v(cid:224) (cid:240)ộ sÆng t(cid:253)ıng ứng trong vøng tam giÆc.
Một ph(cid:253)ıng thức khÆc h(cid:236)nh dung về m(cid:244) h(cid:236)nh HSV l(cid:224) h(cid:236)nh n(cid:243)n. Trong cÆch thể hiện n(cid:224)y, th(cid:224)nh phần Hue (cid:240)(cid:253)ợc m(cid:244) tả nh(cid:253) l(cid:224) một dạng h(cid:236)nh n(cid:243)n 3 chiều của bÆnh xe m(cid:224)u. Th(cid:224)nh phần Saturation (cid:240)(cid:253)ợc thể hiện bằng khoảng cÆch (cid:240)ến t(cid:226)m của v(cid:242)ng tr(cid:242)n cắt h(cid:236)nh n(cid:243)n, v(cid:224) th(cid:224)nh phần Value l(cid:224) khoảng cÆch (cid:240)ến (cid:240)iểm cuối của h(cid:236)nh n(cid:243)n. CÆch thể hiện khÆc l(cid:224) sử dụng một h(cid:236)nh n(cid:243)n lục giÆc (c(cid:243) (cid:240)Æy v(cid:224) thiết diện l(cid:224) h(cid:236)nh lục giÆc) thay v(cid:236) h(cid:236)nh n(cid:243)n tr(cid:242)n. Ph(cid:253)ıng thức n(cid:224)y th(cid:237)ch hợp với việc h(cid:236)nh dung to(cid:224)n bộ kh(cid:244)ng gian m(cid:224)u HSV trong một (cid:240)ối t(cid:253)ợng (cid:240)ın.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
31
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 14. Kh(cid:244)ng gian m(cid:224)u HSV d(cid:253)ới dạng (cid:240)ối t(cid:253)ợng h(cid:236)nh n(cid:243)n
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
32
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
3. L(cid:253)ợc (cid:240)ồ m(cid:224)u (Color Histogram)
3.1. —ịnh nghĩa
iH
][
][ in n
L(cid:253)ợc (cid:240)ồ m(cid:224)u của ảnh cho biết sự ph(cid:226)n bố của cÆc m(cid:224)u trong ảnh.
]255
,0[i
Trong (cid:240)(cid:243) :
24 ]2,0[
i
i l(cid:224) một bin m(cid:224)u, nếu ảnh (cid:240)ộ xÆm th(cid:236) , nếu ảnh m(cid:224)u RGB
th(cid:236)
n[i] : số (cid:240)iểm ảnh c(cid:243) giÆ trị m(cid:224)u l(cid:224) i n : tổng số (cid:240)iểm ảnh
H(cid:236)nh 15 L(cid:253)ợc (cid:240)ồ m(cid:224)u
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
33
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
3.2. Thuật toÆn t(cid:237)nh l(cid:253)ợc (cid:240)ồ m(cid:224)u :
3.2.1. L(cid:253)ợc (cid:240)ồ m(cid:224)u trong kh(cid:244)ng gian RGB
Giải thuật tạo l(cid:253)ợc (cid:240)ồ ảnh m(cid:224)u trong kh(cid:244)ng gian RGB B(cid:253)ớc 1. Tạo mảng 3 chiều histogram, k(cid:237)ch th(cid:253)ớc 2bx2bx2b(b : số bit cho th(cid:224)nh phần R,G,B) B(cid:253)ớc 2. Với mọi giÆ trị r, g, b nằm trong khoảng [0-2b]
Histogram[r][g][b] = 0
B(cid:253)ớc 3. Với mọi (cid:240)iểm ảnh c(cid:243) toạ (cid:240)ộ x, y
Phần lớn cÆc ảnh (cid:240)(cid:253)ợc sử dụng trong mÆy t(cid:237)nh hiện nay (cid:240)ều sử dụng 24 bit m(cid:224)u, do (cid:240)(cid:243), muốn t(cid:237)nh l(cid:253)ợc (cid:240)ồ m(cid:224)u của kh(cid:244)ng gian m(cid:224)u RGB gồm c(cid:243) 2 một ảnh RGB cần tốn nhiều chi ph(cid:237) l(cid:253)u trữ v(cid:224) thời gian t(cid:237)nh toÆn. Ngo(cid:224)i ra, khi l(cid:253)ợc (cid:240)ồ m(cid:224)u (cid:240)(cid:253)ợc ứng dụng v(cid:224)o việc truy t(cid:236)m ảnh số hay video số th(cid:236) kh(cid:244)ng gian m(cid:224)u RGB kh(cid:244)ng th(cid:237)ch hợp v(cid:236) mắt ng(cid:253)ời kh(cid:244)ng nhạy cảm với m(cid:224)u sắc.
3.2.2. L(cid:253)ợc (cid:240)ồ m(cid:224)u trong kh(cid:244)ng gian HSV
M(cid:244) h(cid:236)nh m(cid:224)u HSV giœp tÆch bạch giữa m(cid:224)u sắc(H,S) v(cid:224) (cid:240)ộ sÆng (V), phø hợp cho việc truy t(cid:236)m ảnh số v(cid:224) video số. Nh(cid:253)ng những ảnh th(cid:244)ng th(cid:253)ờng hay những (cid:240)oạn video số l(cid:253)u trong mÆy t(cid:237)nh th(cid:253)ờng sử dụng kh(cid:244)ng gian m(cid:224)u RGB, nŒn phải chuyển (cid:240)ổi từ RGB sang kh(cid:244)ng gian HSV.
Rœt tr(cid:237)ch th(cid:224)nh phần m(cid:224)u r, g, b của (cid:240)iểm ảnh (cid:240)(cid:243) Histogram[r][g][b] += 1
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
34
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Thuật toÆn chuyển từ RGB sang HSV
Gọi R,G,B l(cid:224) giÆ trị nhập của RGB với giÆ trị trong khoảng [0,1] hay [0,255]
{
V := Max(R, G, B);
Min := Min(R, G, B);
If (V >= 0) then
S := (V - Min)/V;
Else S := 0;
If (S <= 0) then
{
H := -1;
Return;
}
Diff := V-Min;
If (R = V) then H := ((cid:240)/3)*(G - R) /Diff; Else if (G = V) then H := (2*(cid:240)/3) + (cid:240)/3*(B - R)/diff; Else if (B = V) then H := (4*(cid:240)/3) + (cid:240)/3*(R - G)/diff; If (H <= 0) H := H + (cid:240)/2;
}
V : GiÆ trị xuất của c(cid:253)ờng (cid:240)ộ sÆng [0,1] S : GiÆ trị xuất của (cid:240)ộ bảo h(cid:242)a saturation [0,1] H : GiÆ trị xuất của m(cid:224)u sắc hue [0,2—] R,G,B,H,V,S: Tất cả (cid:240)ều l(cid:224) những giÆ trị số thực. Procedure RGB_to_HSV(in R, G, B; out H, S, V)
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
35
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Tuy kh(cid:244)ng gian m(cid:224)u HSV c(cid:243) (cid:253)u (cid:240)iểm hın RGB l(cid:224) ph(cid:226)n rı m(cid:224)u v(cid:224) (cid:240)ộ sÆng, nh(cid:253)ng n(cid:243) vẫn ch(cid:253)a thực sự phø hợp với cÆch truy t(cid:236)m th(cid:244)ng thị giÆc của con ng(cid:253)ời v(cid:236) mắt ng(cid:253)ời kh(cid:244)ng nhạy cảm với m(cid:224)u sắc, chỉ cần một sự thay (cid:240)ổi nhỏ l(cid:224) mắt ng(cid:253)ời kh(cid:244)ng ph(cid:226)n biệt (cid:240)(cid:253)ợc, do (cid:240)(cid:243), c(cid:243) những ảnh nh(cid:236)n rất giống nhau nh(cid:253)ng l(cid:253)ợc (cid:240)ồ m(cid:224)u rất khÆc nhau.
H(cid:236)nh 16 Mắt ng(cid:253)ời kh(cid:244)ng nhạy cảm với sự thay (cid:240)ổi m(cid:224)u sắc
—ể cải tiến phø hợp cho việc ứng dụng trong t(cid:236)m kiếm, cÆc m(cid:224)u trong kh(cid:244)ng gian m(cid:224)u HSV (cid:240)(cid:253)ợc (cid:240)ịnh l(cid:253)ợng tr(cid:253)ớc khi t(cid:237)nh l(cid:253)ợc (cid:240)ồ m(cid:224)u. C(cid:243) nhiều cÆch (cid:240)ịnh l(cid:253)ợng, một trong những cÆch (cid:240)(cid:243) l(cid:224) chia Hue th(cid:224)nh 18 vøng, chia Saturation th(cid:224)nh 3 vøng chia Value th(cid:224)nh 3 vøng
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
36
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Khi (cid:240)(cid:243), tổng số m(cid:224)u bằng HxSxI = 162 m(cid:224)u, chi ph(cid:237) t(cid:237)nh toÆn v(cid:224) l(cid:253)u trữ giảm (cid:240)i rất nhiều, v(cid:224) l(cid:253)ợc (cid:240)ồ m(cid:224)u n(cid:224)y rất th(cid:237)ch hợp cho việc truy t(cid:236)m th(cid:244)ng tin thị giÆc.
H(cid:236)nh 17 Kh(cid:244)ng gian m(cid:224)u HSV (cid:240)ª (cid:240)(cid:253)ợc (cid:240)ịnh l(cid:253)ợng
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
37
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 18CÆc m(cid:224)u (cid:240)ª (cid:240)(cid:253)ợc (cid:240)ịnh l(cid:253)ợng trong kh(cid:244)ng gian HSV
3.3. (cid:221) nghĩa của l(cid:253)ợc (cid:240)ồ m(cid:224)u
—ối với một m(cid:224)u ci, Hci(I) thể hiện số (cid:240)iểm ảnh c(cid:243) m(cid:224)u ci trong ảnh I. N(cid:243)i cÆch khÆc, với mỗi (cid:240)iểm ảnh trong ảnh I, Hci(I) thể hiện xÆc suất (cid:240)iểm ảnh (cid:240)(cid:243) c(cid:243) m(cid:224)u l(cid:224) ci. Kh(cid:244)ng c(cid:243) mang th(cid:244)ng tin về kh(cid:244)ng gian.
3.4. —Ænh giÆ (cid:253)u (cid:240)iểm, khuyết (cid:240)iểm
(cid:221)u (cid:240)iểm
T(cid:237)nh toÆn l(cid:253)ợc (cid:240)ồ m(cid:224)u (cid:237)t tốn chi ph(cid:237), (cid:240)ın giản, nhanh ch(cid:243)ng. L(cid:253)ợc (cid:240)ồ m(cid:224)u bất biến (cid:240)ối với một số phØp biến (cid:240)ổi h(cid:236)nh học nh(cid:253) phØp biến (cid:240)ổi Affine : tịnh tiến, xoay, sự co, giªn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
38
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Khuyết (cid:240)iểm
L(cid:253)ợc (cid:240)ồ m(cid:224)u chỉ xØt ph(cid:226)n bố to(cid:224)n cục về m(cid:224)u của ảnh m(cid:224) kh(cid:244)ng xØt (cid:240)ến yếu tố cục bộ về vị tr(cid:237), l(cid:224)m mất th(cid:244)ng tin về quan hệ kh(cid:244)ng gian giữa cÆc m(cid:224)u. Dẫn (cid:240)ến việc c(cid:243) thể c(cid:243) nhiều ảnh khÆc nhau nh(cid:253)ng lại c(cid:243) cøng l(cid:253)ợc (cid:240)ồ m(cid:224)u.(H(cid:236)nh)
H(cid:236)nh -19. Những ảnh khÆc nhau nh(cid:253)ng c(cid:243) l(cid:253)ợc (cid:240)ồ m(cid:224)u giống nhau
3.5. Ứng dụng
—(cid:253)ợc ứng dụng nhiều trong việc ph(cid:226)n (cid:240)oạn video v(cid:224) truy t(cid:236)m th(cid:244)ng tin thị giÆc.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
39
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
4. L(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u (Color Correlogram)
4.1. Giới thiệu l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u
Quan sÆt thấy rằng l(cid:253)ợc (cid:240)ồ m(cid:224)u thiếu th(cid:244)ng tin về cÆch m(cid:224) m(cid:224)u sắc (cid:240)(cid:253)ợc ph(cid:226)n bố theo kh(cid:244)ng gian, Một (cid:240)ặc tr(cid:253)ng mới (cid:240)(cid:253)ợc giới thiệu gọi l(cid:224) l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u.
L(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u hứa hẹn m(cid:244) tả kh(cid:244)ng chỉ l(cid:224) ph(cid:226)n phối m(cid:224)u của cÆc
(cid:240)iểm ảnh m(cid:224) c(cid:242)n l(cid:224) sự t(cid:253)ıng quan về kh(cid:244)ng quan giữa cÆc cặp m(cid:224)u.
,...,
, dd 1
Dd
2
4.2. T(cid:237)nh l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u
i cc ,
(cid:240)(cid:253)ợc (cid:240)o bằng (cid:240)ộ (cid:240)o L .
j
[
p
I
||
p
|
d
]
2
c
p 1
2
d cc , i
j
j
L
v(cid:224) Gọi [D] l(cid:224) tập gồm D khoảng cÆch L(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u của ảnh I (cid:240)(cid:253)ợc xÆc (cid:240)ịnh với cặp m(cid:224)u
Pr p ,
c
2
Ip 1
I
I
|
khoảng cÆch d nh(cid:253) sau: I
I c
p
pI
c
, Trong (cid:240)(cid:243) I l(cid:224) ảnh, k(cid:237)ch th(cid:253)ớc MxN (—iểm ảnh),
1p v(cid:224)
2p chịu sự
p
d
l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u thể hiện xÆc suất cặp (cid:240)iểm ảnh bất kỳ
ic ,
p 1
2
1p c(cid:243) m(cid:224)u
2p c(cid:243) m(cid:224)u
jc ) v(cid:224) vị tr(cid:237) (
L
). r(cid:224)ng buộc về m(cid:224)u (
4.3. L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u
d
)
I )(
I )(
) d ( cc ,
( c
Nếu chœng ta xØt (cid:240)ến tất cả sự kết hợp c(cid:243) thể c(cid:243) của cÆc cặp m(cid:224)u, k(cid:237)ch th(cid:253)ớc của l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u sẽ rất lớn, hın nữa, thời gian t(cid:237)nh toÆn sẽ l(cid:226)u. Do (cid:240)(cid:243), một phiŒn bản (cid:240)ın giản hın (cid:240)(cid:253)ợc sử dụng, gọi l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u. L(cid:253)ợc (cid:240)ồ n(cid:224)y chỉ quan t(cid:226)m (cid:240)ến sự t(cid:253)ıng quan về kh(cid:244)ng gian giữa những m(cid:224)u giống nhau v(cid:224) do (cid:240)(cid:243) giảm (cid:240)(cid:253)ợc số chiều v(cid:224) chi ph(cid:237) t(cid:237)nh toÆn. L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u (cid:240)(cid:253)ợc xÆc (cid:240)ịnh nh(cid:253) sau:
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
40
d
)() I
( c
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u của ảnh I ứng với m(cid:224)u c v(cid:224)
khoảng cÆch d.
4.4. Ứng dụng
Døng trong việc ph(cid:226)n (cid:240)oạn video Tạo chỉ mục v(cid:224) so sÆnh ảnh —ịnh vị (cid:240)ối t(cid:253)ợng, theo vết (cid:240)ối t(cid:253)ợng
So với l(cid:253)ợc (cid:240)ồ m(cid:224)u, l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u cho những kết quả truy t(cid:236)m tốt hın nh(cid:253)ng tốn chi ph(cid:237) nhiều hın.
5. BiŒn dạng (Edge) 5.1. KhÆi niệm :
BiŒn l(cid:224) (cid:240)ối t(cid:253)ợng ph(cid:226)n cÆch giữa hai vøng ảnh thuần nhất (kh(cid:244)ng c(cid:243) biến thiŒn lớn về (cid:240)ộ sÆng) c(cid:243) (cid:240)ộ sÆng khÆc nhau. Hay n(cid:243)i cÆch khÆc, biŒn l(cid:224) nıi c(cid:243) biến thiŒn cục bộ về (cid:240)ộ sÆng. 5.2. Ph(cid:253)ıng phÆp phÆt hiện biŒn
C(cid:243) nhiều ph(cid:253)ıng phÆp phÆt hiện biŒn của (cid:240)ối t(cid:253)ợng trong ảnh: nh(cid:253) ph(cid:253)ıng phÆp Gradient, ph(cid:253)ıng phÆp toÆn tử Laplace, ph(cid:253)ıng phÆp Laplace of the Gaussian (LOG), ph(cid:253)ıng phÆp phØp biến (cid:240)ổi Hough,(cid:133)
Do phần lớn cÆc ảnh c(cid:243) (cid:240)ộ sÆng thay (cid:240)ổi rı nØt, v(cid:224) trong tr(cid:253)ờng hợp n(cid:224)y, ph(cid:253)ıng phÆp Gradient hoạt (cid:240)ộng tốt nhất, nŒn chœng t(cid:244)i chọn ph(cid:253)ıng phÆp Gradient (cid:240)ể phÆt hiện biŒn của cÆc ảnh. C(cid:244)ng thức ch(cid:237)nh tạo ảnh Gradient
—ầu v(cid:224)o input l(cid:224) một ảnh, qua ph(cid:253)ıng phÆp Gradient, (cid:240)ầu ra output l(cid:224)
một ảnh (cid:240)ª (cid:240)(cid:253)ợc xử l(cid:253) l(cid:224)m nổi bật biŒn dạng.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
41
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Ảnh gốc
Gradient
Ảnh kết quả
H(cid:236)nh 20
yxg ,(
)
xfkjh )
,(
(
yj ,
k
)
yxf ,(
)
C(cid:244)ng thức ch(cid:237)nh (cid:240)ể tạo ra ảnh Gradient l(cid:224) toÆn tử Convolution
yxg ,(
)
với l(cid:224) h(cid:224)m ảnh của ảnh ban (cid:240)ầu.
kjh ,(
)
l(cid:224) h(cid:224)m ảnh của ảnh kết quả sau khi xử l(cid:253).
l(cid:224) h(cid:224)m của bộ lọc.
t
)
)
,
f
,
f
,( yxf
)
x
y
t
yxf ,( x
yxf ,( y
f thể hiện mức (cid:240)ộ biến thiŒn lớn nhất của f.
Gradient của f(x,y) :
yxe ,(
)
(
f
f
2/1)
x
y
Mỗi (cid:240)iểm trŒn ảnh (cid:240)ều c(cid:243) 2 th(cid:224)nh phần :
BiŒn (cid:240)ộ :
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
42
f
y
yx ,(
)
arctan(
)
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
f
x
H(cid:253)ớng :
trong (cid:240)(cid:243) fx l(cid:224) (cid:240)ạo h(cid:224)m riŒng theo x, fy l(cid:224) (cid:240)ạo h(cid:224)m riŒng theo y.
f
T w 1
x
f
w
T 2
y
yxf ,(
)
(
)
,
x
Rời rạc hoÆ toÆn tử Gradient : yxf ,( ynxf ) nyxf ,(
yxf ,(
yxf ,(
)
)
)
y
'
(
f
(
x
)
(
xf (
)
xf (
))
/(
x
x
))
i
i
i
i
i
1
1
Vấn (cid:240)ề cần giải quyết l(cid:224) t(cid:236)m cÆch rœt ra (cid:240)(cid:253)ợc biŒn (cid:240)ộ v(cid:224) h(cid:253)ớng của mỗi (cid:240)iểm trŒn ảnh. Muốn vậy, phải t(cid:237)nh fx, fy :
)
xfw (1
Bộ lọc th(cid:244)ng dụng Prewitt
Lọc
1 -1 0
0 -1 0
)
yfw (2
1 -1 0
Lọc
1 1 1
0 0 0
-1 -1 -1
Nhận xØt
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
43
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Trong vøng thuần nhất do tổng hệ số Mask = 0 => e(x,y) = 0. Tại vøng chuyển tiếp e(x,y) 0, e(x,y) c(cid:224)ng lớn nếu (cid:240)ộ t(cid:253)ıng phản c(cid:224)ng lớn.
Kết quả : ảnh sau khi qua Gradient sẽ c(cid:243) m(cid:224)u tối, trừ (cid:240)(cid:253)ờng biŒn sẽ sÆng lŒn
H(cid:236)nh 21
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
44
)
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Lọc Sobel Lọc xfw (1
1 0 -1
2 0 -2
)
yfw (2
1 0 -1
Lọc
-1 -2 -1
0 0 0
1 2 1
Nhận xØt chung
Nh(cid:236)n chung, th(cid:236) mỗi phØp biến (cid:240)ổi Gradient theo một h(cid:253)ớng cụ thể v(cid:224) kết quả của từng phần cuối cøng sẽ (cid:240)(cid:253)ợc kết hợp lại v(cid:224) tạo ra kết quả cuối cøng. V(cid:224) kết quả của mỗi phØp biến (cid:240)ổi của từng phần xấp xỉ (cid:240)ến phØp biến (cid:240)ổi Gradient ch(cid:237)nh xÆc bằng cÆch sử dụng cÆc khoảng cÆch Euclidean hoặc sự khÆc biệt tuyệt (cid:240)ối.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
45
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
6. —ặc tr(cid:253)ng chuyển (cid:240)ộng (Motion)
6.1. Giới thiệu
Chuyển (cid:240)ộng l(cid:224) một trong những (cid:240)ặc tr(cid:253)ng của dữ liệu video. —(cid:226)y l(cid:224) một (cid:240)ặc tr(cid:253)ng nổi bật của video m(cid:224) ảnh tĩnh kh(cid:244)ng c(cid:243). —ặc tr(cid:253)ng chuyển (cid:240)ộng (cid:240)(cid:253)ợc sử dụng rất rộng rªi trong cÆc nghiŒn cứu cũng nh(cid:253) c(cid:224)i (cid:240)ặt ứng dụng xử l(cid:253) video số.
H(cid:236)nh 22
6.2. L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng 6.2.1. Giới thiệu
Nếu nh(cid:253) l(cid:253)ợc (cid:240)ồ m(cid:224)u thể hiện sự ph(cid:226)n phối m(cid:224)u trong ảnh th(cid:236) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng cho thấy sự ph(cid:226)n phối chuyển (cid:240)ộng của cÆc khung h(cid:236)nh liŒn tiếp. Sự ph(cid:226)n phối n(cid:224)y (cid:240)(cid:253)ợc thể hiện d(cid:253)ới dạng cÆc g(cid:243)c chuyển (cid:240)ộng.
o-359o.
6.2.2. Thuật toÆn t(cid:237)nh l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng
Chia khung h(cid:236)nh th(cid:224)nh n khối (cid:240)iểm ảnh, v(cid:224) (cid:240)ịnh l(cid:253)ợng cÆc g(cid:243)c từ 0 (cid:240)ến 360 (cid:240)ộ th(cid:224)nh 8 phần : 0o-44o, 45o-89o,(cid:133), 315
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
46
0
][ iH
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
B(cid:253)ớc 1 : khởi (cid:240)ộng mảng cÆc g(cid:243)c (cid:240)ª (cid:240)ịnh l(cid:253)ợng : , với i từ 0 (cid:240)ến 7.
][
aHaH
1][
B(cid:253)ớc 4 : tªng giÆ trị của
. Quay lại b(cid:253)ớc 2 cho (cid:240)ến khi t(cid:237)nh
hết tất cả cÆc khối (cid:240)iểm ảnh của khung h(cid:236)nh.
6.2.3. (cid:221) nghĩa :
L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng cho thấy (cid:240)(cid:253)ợc h(cid:253)ớng chuyển (cid:240)ộng của (cid:240)ối t(cid:253)ợng
trong ảnh hoặc h(cid:253)ớng chuyển (cid:240)ộng của camera.
6.3. Ảnh chuyển (cid:240)ộng 6.3.1 Giới thiệu
L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng th(cid:236) quan t(cid:226)m (cid:240)ến g(cid:243)c chuyển (cid:240)ộng, c(cid:242)n ảnh chuyển (cid:240)ộng thể hiện (cid:240)ộ lớn của chuyển (cid:240)ộng, tức l(cid:224) khoảng cÆch di chuyển của cÆc (cid:240)iểm ảnh, hoặc khối (cid:240)iểm ảnh. Ảnh chuyển (cid:240)ộng gồm một cặp ảnh : ảnh chuyển (cid:240)ộng theo ph(cid:253)ıng ngang, ảnh chuyển (cid:240)ộng theo ph(cid:253)ıng dọc.
B(cid:253)ớc 2 : XØt một khối (cid:240)iểm ảnh của khung h(cid:236)nh hiện tại, t(cid:237)nh (cid:240)ộ dịch chuyển của n(cid:243) bằng cÆch : trong khung h(cid:236)nh tiếp theo, t(cid:236)m khối c(cid:243) sự khÆc biệt (cid:240)ặc tr(cid:253)ng nhỏ nhất so với khối (cid:240)ang xØt v(cid:224) sự khÆc biệt n(cid:224)y cũng nhỏ hın một ng(cid:253)ỡng (cid:240)ịnh tr(cid:253)ớc. Mục (cid:240)(cid:237)ch của b(cid:253)ớc n(cid:224)y l(cid:224) (cid:240)ể xem khối n(cid:224)y dịch chuyển (cid:240)ến vị tr(cid:237) n(cid:224)o. Nếu kh(cid:244)ng t(cid:236)m thấy th(cid:236) xem nh(cid:253) khối (cid:240)iểm ảnh n(cid:224)y kh(cid:244)ng di chuyển. B(cid:253)ớc 3 : Sau khi t(cid:237)nh (cid:240)ộ dịch chuyển, dễ d(cid:224)ng t(cid:237)nh (cid:240)(cid:253)ợc g(cid:243)c dịch chuyển của khối v(cid:224) (cid:240)ịnh l(cid:253)ợng g(cid:243)c (cid:240)(cid:243) về một giÆ trị a, a nằm trong khoảng từ 0 (cid:240)ến 7.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
47
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
6.3.2 Thuật toÆn t(cid:237)nh ảnh chuyển (cid:240)ộng
6.3.3 (cid:221) nghĩa
Ảnh chuyển (cid:240)ộng cho biết (cid:240)ộ lớn chuyển (cid:240)ộng theo 2 ph(cid:253)ıng của mỗi (cid:240)iểm ảnh của khung h(cid:236)nh. Tại vị tr(cid:237) n(cid:224)o (cid:240)(cid:243) m(cid:224) ảnh chuyển (cid:240)ộng c(cid:243) giÆ trị lớn th(cid:236) (cid:240)iểm ảnh (cid:240)(cid:243) chuyển (cid:240)ộng c(cid:224)ng nhiều.
B(cid:253)ớc 1 : tạo 2 ảnh c(cid:243) k(cid:237)ch th(cid:253)ớc giống k(cid:237)ch th(cid:253)ớc của khung h(cid:236)nh (cid:240)ang xØt. B(cid:253)ớc 2 : xØt một (cid:240)iểm ảnh của khung h(cid:236)nh hiện tại, t(cid:237)nh (cid:240)ộ dịch chuyển của n(cid:243) bằng cÆch : trong khung h(cid:236)nh tiếp theo, trong l(cid:226)n cận của (cid:240)iểm ảnh (cid:240)ang xØt, t(cid:236)m (cid:240)iểm c(cid:243) (cid:240)ặc tr(cid:253)ng m(cid:224)u giống n(cid:243). Nếu kh(cid:244)ng t(cid:236)m thấy th(cid:236) xem nh(cid:253) (cid:240)iểm ảnh n(cid:224)y kh(cid:244)ng di chuyển. B(cid:253)ớc 3 : T(cid:237)nh khoảng cÆch theo ph(cid:253)ıng ngang v(cid:224) ph(cid:253)ıng dọc giữa (cid:240)iểm ảnh (cid:240)ang xØt với (cid:240)iểm ảnh giống n(cid:243) t(cid:236)m (cid:240)(cid:253)ợc ở b(cid:253)ớc 2, v(cid:224) l(cid:253)u 2 giÆ trị n(cid:224)y v(cid:224)o 2 ảnh tại vị tr(cid:237) (cid:240)iểm ảnh (cid:240)ang xØt. Lặp lại b(cid:253)ớc 2 cho (cid:240)ến khi t(cid:237)nh hết cÆc (cid:240)iểm ảnh trong khung h(cid:236)nh. Sau khi t(cid:237)nh toÆn cho tất cả (cid:240)iểm ảnh trong khung h(cid:236)nh, ta c(cid:243) (cid:240)(cid:253)ợc 2 ảnh chuyển (cid:240)ộng của khung h(cid:236)nh theo 2 ph(cid:253)ıng.
7. CÆc (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở
Xử l(cid:253) video c(cid:243) một kh(cid:243) khªn so với xử l(cid:253) ảnh tĩnh l(cid:224) dữ liệu video số lớn. Một phœt dữ liệu video c(cid:243) gần 2000 khung h(cid:236)nh. Tuy nhiŒn (cid:240)(cid:226)y cũng l(cid:224) một yếu tố thuận lợi v(cid:236) cÆc ảnh của video kh(cid:244)ng biến (cid:240)ổi bất ngờ nh(cid:253) ảnh tĩnh m(cid:224) th(cid:253)ờng liŒn tiếp nhau theo thứ tự thời gian. Do (cid:240)(cid:243), (cid:240)ể xử l(cid:253) video một cÆch hiệu quả phải (cid:240)ặt cÆc khung h(cid:236)nh lại với nhau trong bối cảnh một (cid:240)oạn cı sở, v(cid:224) cÆc (cid:240)ặc tr(cid:253)ng của mỗi khung h(cid:236)nh th(cid:224)nh viŒn sẽ tạo nŒn (cid:240)ặc tr(cid:253)ng chung của (cid:240)oạn video cı sở (cid:240)(cid:243).
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
48
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
7.1. —ặc tr(cid:253)ng ảnh trung b(cid:236)nh
7.1.1. Giới thiệu:
Ảnh trung b(cid:236)nh của một (cid:240)oạn cı sở l(cid:224) một ảnh (cid:240)ại diện cho cÆc khung
h(cid:236)nh trong (cid:240)oạn cı sở (cid:240)(cid:243).
7.1.2. C(cid:244)ng thức t(cid:237)nh :
S
s S
h S
,
I
,
I
I
I
Ảnh trung b(cid:236)nh của (cid:240)oạn cı sở c(cid:243) N khung h(cid:236)nh (cid:240)(cid:253)ợc t(cid:237)nh nh(cid:253) sau :
S
,
v
trong (cid:240)(cid:243)
1
1
1
h s
s s
v s
I
I
I
I
I
I
h t
s t
v t
1 N N
1 N N
1 N N
0
t
0
t
0
t
v
h sI ,
s sI ,
sI l(cid:224) ảnh trung b(cid:236)nh (cid:240)ối với th(cid:224)nh phần H,S,V của (cid:240)oạn cı sở.
, ,
Mỗi một (cid:240)iểm ảnh của ảnh trung b(cid:236)nh mang một giÆ trị m(cid:224)u l(cid:224) trung b(cid:236)nh m(cid:224)u của tất cả cÆc (cid:240)iểm ảnh của cÆc khung h(cid:236)nh trong (cid:240)oạn cı sở tại vị tr(cid:237) (cid:240)iểm ảnh (cid:240)(cid:243). Ở (cid:240)(cid:226)y chœng t(cid:244)i sử dụng kh(cid:244)ng gian m(cid:224)u H, S, V v(cid:236) kh(cid:244)ng gian m(cid:224)u HSV tÆch bạch (cid:240)(cid:253)ợc m(cid:224)u sắc v(cid:224) (cid:240)ộ sÆng, phø hợp với cảm nhận của con ng(cid:253)ời, v(cid:224) th(cid:237)ch hợp cho việc truy t(cid:236)m th(cid:244)ng tin thị giÆc
7.1.3. Ứng dụng :
L(cid:224)m (cid:240)ặc tr(cid:253)ng cho (cid:240)oạn cı sở, (cid:240)(cid:253)ợc døng (cid:240)ể so sÆnh trong cÆc quÆ tr(cid:236)nh gom nh(cid:243)m, ph(cid:226)n lớp (cid:240)oạn cı sở, chọn (cid:240)oạn cı sở (cid:240)ại diện cho lớp, hay so sÆnh (cid:240)ể truy vấn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
49
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
7.2. L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u trung b(cid:236)nh
7.2.1. Giới thiệu
L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u trung b(cid:236)nh của một (cid:240)oạn cı sở cho ta một cÆi nh(cid:236)n tổng quÆt về sự t(cid:253)ıng quan giữa cÆc m(cid:224)u trong (cid:240)oạn cı sở (cid:240)(cid:243).
7.2.2. C(cid:244)ng thức t(cid:237)nh
s
s
s
0[
],...,
cd
CD [
cd
L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u trung b(cid:236)nh của (cid:240)oạn cı sở (cid:240)(cid:253)ợc t(cid:237)nh bằng cÆch lấy trung b(cid:236)nh của cÆc l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u của tất cả khung h(cid:236)nh trong (cid:240)oạn cı sở (cid:240)(cid:243). C(cid:244)ng thức cụ thể:
,
]1
cd trong (cid:240)(cid:243) :
N
1
m
]1
mcd [ s
]
]
mcd [ t
CD ..0[
1 N
0
t
,
N l(cid:224) số khung h(cid:236)nh trong (cid:240)oạn cı sở, C l(cid:224) số (cid:244) m(cid:224)u (cid:240)ịnh l(cid:253)ợng, D l(cid:224) số l(cid:253)ợng khoảng cÆch (cid:240)(cid:253)ợc døng trong b(cid:253)ớc t(cid:237)nh l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u. tcd l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u của khung h(cid:236)nh thứ t trong (cid:240)oạn
scd l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng tự m(cid:224)u trung b(cid:236)nh của (cid:240)oạn cı sở s.
cı sở s.
7.2.3. Ứng dụng
L(cid:224)m (cid:240)ặc tr(cid:253)ng cho (cid:240)oạn cı sở, (cid:240)(cid:253)ợc døng (cid:240)ể so sÆnh trong cÆc quÆ tr(cid:236)nh gom nh(cid:243)m, ph(cid:226)n lớp (cid:240)oạn cı sở, chọn (cid:240)oạn cı sở (cid:240)ại diện cho lớp, hay so sÆnh (cid:240)ể truy vấn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
50
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
7.3. L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh
7.3.1. Giới thiệu
L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh của (cid:240)oạn cı sở cho biết th(cid:244)ng tin về cÆc h(cid:253)ớng chuyển (cid:240)ộng trong (cid:240)oạn cı sở.
m s
m s
m Dh [ s
],...,
0[
h
h
7.3.2. C(cid:244)ng thức t(cid:237)nh
,
]1
L(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh (cid:240)(cid:253)ợc t(cid:237)nh bằng cÆch lấy trung b(cid:236)nh cÆc l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng của cÆc khung h(cid:236)nh trong (cid:240)oạn cı sở (cid:240)(cid:243). C(cid:244)ng thức t(cid:237)nh nh(cid:253) sau :
N
2
1
m dh ][ s
m dh ][ t
N
1
0
t
m ][dh t
Trong (cid:240)(cid:243) :
l(cid:224) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng của khung h(cid:236)nh thứ t ứng với
m ][dh s
chuyển (cid:240)ộng thứ d.
l(cid:224) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh của (cid:240)oạn cı sở ứng với
chuyển (cid:240)ộng thứ d. N l(cid:224) số khung h(cid:236)nh trong (cid:240)oạn cı sở, D l(cid:224) số vector dịch chuyển
(cid:240)ª (cid:240)(cid:253)ợc (cid:240)ịnh l(cid:253)ợng.
7.3.3. Ứng dụng
L(cid:224)m (cid:240)ặc tr(cid:253)ng cho (cid:240)oạn cı sở, (cid:240)(cid:253)ợc døng (cid:240)ể so sÆnh trong cÆc quÆ tr(cid:236)nh gom nh(cid:243)m, ph(cid:226)n lớp (cid:240)oạn cı sở, chọn (cid:240)oạn cı sở (cid:240)ại diện cho lớp, hay so sÆnh (cid:240)ể truy vấn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
51
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
7.4. Ảnh chuyển (cid:240)ộng trung b(cid:236)nh
7.4.1. Giới thiệu
Ảnh chuyển (cid:240)ộng trung b(cid:236)nh của (cid:240)oạn cı sở cho biết th(cid:244)ng tin về (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng của (cid:240)oạn cı sở. Nếu l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh xem xØt (cid:240)ến g(cid:243)c chuyển (cid:240)ộng trung b(cid:236)nh th(cid:236) ảnh chuyển (cid:240)ộng trung b(cid:236)nh quan t(cid:226)m (cid:240)ến (cid:240)ộ lớn của chuyển (cid:240)ộng. Ảnh chuyển (cid:240)ộng trung b(cid:236)nh bao gồm 2 ảnh thể hiện (cid:240)ộ lớn chuyển (cid:240)ộng theo ph(cid:253)ıng ngang v(cid:224) theo ph(cid:253)ıng dọc của (cid:240)oạn cı sở.
7.4.2. C(cid:244)ng thức t(cid:237)nh
S
Y S
X MM , S
(
)
Ảnh chuyển (cid:240)ộng trung b(cid:236)nh (cid:240)(cid:253)ợc t(cid:237)nh bằng cÆch lấy trung b(cid:236)nh cÆc ảnh chuyển (cid:240)ộng của cÆc khung h(cid:236)nh trong (cid:240)oạn cı sở (cid:240)(cid:243). C(cid:244)ng thức t(cid:237)nh nh(cid:253) sau :
M
,
N
2
1
X s
M
M
Trong (cid:240)(cid:243) :
X t
N
01 t
N
2
1
Y s
M
M
Y t
N
01 t
X
X
sM l(cid:224) ảnh chuyển (cid:240)ộng trung b(cid:236)nh theo ph(cid:253)ıng ngang của (cid:240)oạn cı sở. tM l(cid:224) ảnh chuyển (cid:240)ộng theo ph(cid:253)ıng ngang của khung h(cid:236)nh thứ t.
Y
sM l(cid:224) ảnh chuyển (cid:240)ộng trung b(cid:236)nh theo ph(cid:253)ıng dọc của (cid:240)oạn cı sở.
Y
sM l(cid:224) ảnh chuyển (cid:240)ộng theo ph(cid:253)ıng ngang của khung h(cid:236)nh thứ t.
,
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
52
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
7.4.3. Ứng dụng
L(cid:224)m (cid:240)ặc tr(cid:253)ng cho (cid:240)oạn cı sở, (cid:240)(cid:253)ợc døng (cid:240)ể so sÆnh trong cÆc quÆ tr(cid:236)nh gom nh(cid:243)m, ph(cid:226)n lớp (cid:240)oạn cı sở, chọn (cid:240)oạn cı sở (cid:240)ại diện cho lớp, hay so sÆnh (cid:240)ể truy vấn.
8. T(cid:243)m tắt ch(cid:253)ıng
Chœng ta (cid:240)ª khảo sÆt một số (cid:240)ặc tr(cid:253)ng th(cid:253)ờng (cid:240)(cid:253)ợc sử dụng trong xử l(cid:253) ảnh số v(cid:224) video số. Trong xử l(cid:253) video số, chœng t(cid:244)i quan t(cid:226)m (cid:240)ến (cid:240)ặc tr(cid:253)ng m(cid:224)u, cÆc l(cid:253)ợc (cid:240)ồ m(cid:224)u, l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u, v(cid:224) (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng. Ở ch(cid:253)ıng tiếp theo, cÆc (cid:240)ặc tr(cid:253)ng n(cid:224)y (cid:240)(cid:253)ợc sử dụng (cid:240)ể ph(cid:226)n dữ liệu video th(cid:224)nh cÆc (cid:240)oạn cı sở.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
53
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
CH(cid:221)(cid:213)NG 3 PH´N T˝CH TỰ —ỘNG VIDEO SỐ TH(cid:192)NH C`C —OẠN C(cid:213) SỞ
Ch(cid:253)ıng n(cid:224)y tr(cid:236)nh b(cid:224)y về vấn (cid:240)ề ph(cid:226)n t(cid:237)ch video th(cid:224)nh cÆc (cid:240)oạn cı sở, bao gồm cÆc khÆi niệm cı bản, một số ph(cid:253)ıng phÆp th(cid:253)ờng døng, cÆc ph(cid:253)ıng phÆp cải tiến (cid:240)(cid:253)ợc døng trong luận vªn.
Nội dung ch(cid:237)nh của ch(cid:253)ıng :
1. Giới thiệu sı l(cid:253)ợc ph(cid:226)n (cid:240)oạn cı sở 2. Một số t(cid:224)i liệu in, b(cid:224)i bÆo (cid:240)iển h(cid:236)nh về ph(cid:226)n (cid:240)oạn cı sở 3. CÆc h(cid:253)ớng tiếp cận ph(cid:226)n (cid:240)oạn (cid:240)iển h(cid:236)nh 4. Một số ph(cid:253)ıng phÆp cải tiến 5. —Ænh giÆ cÆc ph(cid:253)ıng phÆp cải tiến
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
54
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
—ể thiết kế hệ thống truy t(cid:236)m dữ liệu video số dựa v(cid:224)o nội dung, việc (cid:240)ầu tiŒn cần giải quyết l(cid:224) phải c(cid:243) ph(cid:253)ıng phÆp ph(cid:226)n t(cid:237)ch dữ liệu video số vốn rất lớn về k(cid:237)ch th(cid:253)ớc th(cid:224)nh cÆc (cid:240)ặc tr(cid:253)ng cấp cao với k(cid:237)ch th(cid:253)ớc bØ (cid:240)ể tiện l(cid:253)u trữ v(cid:224) truy t(cid:236)m. —(cid:226)y l(cid:224) một trong những b(cid:253)ớc quan trọng nhất, (cid:240)(cid:253)ợc gọi l(cid:224) ph(cid:226)n (cid:240)oạn cı sở.
1. Giới thiệu sı l(cid:253)ợc ph(cid:226)n (cid:240)oạn (cid:240)oạn cı sở
Việc chia một (cid:240)oạn video th(cid:224)nh một hay nhiều (cid:240)oạn cı sở gọi l(cid:224) ph(cid:226)n (cid:240)oạn cı sở. QuÆ tr(cid:236)nh n(cid:224)y cũng (cid:240)(cid:253)ợc coi nh(cid:253) l(cid:224) việc phÆt hiện những chuyển cảnh giữa cÆc (cid:240)oạn, xÆc (cid:240)ịnh khung h(cid:236)nh bắt (cid:240)ầu v(cid:224) khung h(cid:236)nh kết thœc của một (cid:240)oạn cı sở.
H(cid:236)nh 23. BiŒn (cid:240)oạn cı sở
Trong những nªm gần (cid:240)(cid:226)y, những nghiŒn cứu về việc phÆt hiện tự (cid:240)ộng (cid:240)oạn cı sở (cid:240)ang bøng nổ, những ứng dụng ng(cid:224)y c(cid:224)ng nhiều v(cid:224) c(cid:224)ng c(cid:243) nhiều thuật toÆn (cid:240)(cid:253)ợc c(cid:244)ng bố (cid:240)ể giải quyết vấn (cid:240)ề ph(cid:226)n (cid:240)oạn cı sở cho những mức (cid:240)ộ phức tạp khÆc nhau của dữ liệu thật.
Phần lớn cÆc ph(cid:253)ıng phÆp t(cid:236)m (cid:240)oạn cı sở (cid:240)ều c(cid:243) chung (cid:253) t(cid:253)ởng ch(cid:237)nh l(cid:224) : rœt tr(cid:237)ch cÆc (cid:240)ặc tr(cid:253)ng của mỗi khung h(cid:236)nh trong (cid:240)oạn video, rồi t(cid:237)nh toÆn sự khÆc biệt giữa (cid:240)ặc tr(cid:253)ng của cÆc khung h(cid:236)nh liŒn tiếp, v(cid:224) so sÆnh những sự khÆc biệt n(cid:224)y với một ng(cid:253)ỡng cho tr(cid:253)ớc. Mỗi khi sự khÆc biệt v(cid:253)ợt quÆ ng(cid:253)ỡng th(cid:236) c(cid:243) nghĩa l(cid:224) t(cid:236)m thấy (cid:240)(cid:253)ợc một
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
55
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
(cid:240)oạn cı sở. Vấn (cid:240)ề l(cid:224) sử dụng (cid:240)ặc tr(cid:253)ng n(cid:224)o của khung h(cid:236)nh, v(cid:224) sử dụng nh(cid:253) thế n(cid:224)o, từ (cid:240)(cid:243) nảy sinh ra nhiều ph(cid:253)ıng phÆp, h(cid:253)ớng tiếp cận khÆc nhau.
H(cid:236)nh 24.T(cid:237)nh sự khÆc biệt (cid:240)ặc tr(cid:253)ng giữa những khung h(cid:236)nh liŒn tiếp
H(cid:236)nh 25 —(cid:253)ờng sai biệt về (cid:240)ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ giữa cÆc khung h(cid:236)nh liŒn tiếp
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
56
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
—oạn video gồm cÆc khung h(cid:236)nh
Rœt tr(cid:237)ch (cid:240)ặc tr(cid:253)ng của cÆc khung h(cid:236)nh
Sự khÆc biệt về (cid:240)ặc tr(cid:253)ng giữa cÆc khung h(cid:236)nh liŒn tiếp
PhÆt hiện chuyển cảnh (PhÆt hiện biŒn (cid:240)oạn cı sở)
Kết quả ph(cid:226)n (cid:240)oạn l(cid:224) cÆc (cid:240)oạn cı sở
H(cid:236)nh 26Sı (cid:240)ồ giải thuật ph(cid:226)n (cid:240)oạn
2. Một số t(cid:224)i liệu in, b(cid:224)i bÆo (cid:240)iển h(cid:236)nh về ph(cid:226)n (cid:240)oạn cı sở
Chœng ta hªy xem xØt lại một số t(cid:224)i liệu, b(cid:224)i bÆo (cid:240)iển h(cid:236)nh về ph(cid:226)n (cid:240)oạn cı sở (cid:240)ª
(cid:240)(cid:253)ợc c(cid:244)ng bố.
2.1. Kỹ thuật m(cid:244) h(cid:236)nh Markov ẩn (The Hidden Markov Model)
Boreczky v(cid:224) Wilcox [Proceedings of the International Conference on Acoustics, Speech, and Signal Processing, pp.3741-3744] m(cid:244) tả một kỹ thuật (cid:240)ể ph(cid:226)n (cid:240)oạn
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
57
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
video bằng cÆch sử dụng m(cid:244) h(cid:236)nh Markov ẩn. N(cid:243) sử dụng ba loại (cid:240)ặc tr(cid:253)ng (cid:240)ể ph(cid:226)n (cid:240)oạn video : sự khÆc biệt về l(cid:253)ợc (cid:240)ồ chuẩn, (cid:240)ộ (cid:240)o khoảng cÆch (cid:226)m thanh, v(cid:224) (cid:253)ớc l(cid:253)ợng chuyển (cid:240)ộng của (cid:240)ối t(cid:253)ợng giữa hai khung h(cid:236)nh kế tiếp nhau.
—ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ (cid:240)o sự khÆc biệt giữa những khung h(cid:236)nh liŒn tiếp dựa trŒn mức (cid:240)ộ sÆng. Những (cid:240)iểm ảnh (cid:240)(cid:253)ợc ph(cid:226)n phối v(cid:224)o 64 vøng dựa v(cid:224)o (cid:240)ộ sÆng của chœng. Sự khÆc nhau từng (cid:240)(cid:244)i một giữa cÆc l(cid:253)ợc (cid:240)ồ của cÆc khung h(cid:236)nh liŒn tiếp (cid:240)(cid:253)ợc gọi l(cid:224) (cid:240)ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ.
Khoảng cÆch (cid:226)m thanh (cid:240)(cid:253)ợc (cid:240)o bằng cÆch : (cid:240)ầu tiŒn, chuyển n(cid:243) th(cid:224)nh một chuỗi vector, (cid:240)(cid:253)ợc t(cid:237)nh toÆn sau mỗi 20 mili gi(cid:226)y. Những (cid:240)ộ (cid:240)o likelihood (cid:240)(cid:253)ợc t(cid:237)nh toÆn riŒng biệt theo 2 chu kỳ liŒn tiếp v(cid:224) sau (cid:240)(cid:243) t(cid:237)nh theo sự nối ghØp của 2 chu kỳ (cid:240)(cid:243).(Tỉ số giữa 2 giÆ trị cho biết tỉ số likelihood (cid:240)ể kiểm tra giả thuyết rằng )
—ặc tr(cid:253)ng chuyển (cid:240)ộng phÆt hiện sự chuyển (cid:240)ộng của (cid:240)ối t(cid:253)ợng giữa những khung h(cid:236)nh. —ặc tr(cid:253)ng chuyển (cid:240)ộng (cid:240)(cid:253)ợc t(cid:237)nh toÆn bằng cÆch sử dụng ch(cid:237)n vector chuyển (cid:240)ộng ở ch(cid:237)n khối trong cửa sổ. —ộ lớn của giÆ trị trung b(cid:236)nh của 9 vector v(cid:224) giÆ trị trung b(cid:236)nh của (cid:240)ộ lớn của cÆc vector n(cid:224)y giœp phÆt hiện những cảnh camera quØt v(cid:224) zoom.
M(cid:244) h(cid:236)nh Markov ẩn (HMM) gồm c(cid:243) cÆc trạng thÆi sau : chuyển cảnh tức th(cid:236), tiệm tiến, quØt, ph(cid:243)ng to nhỏ (zoom). Mỗi trạng thÆi của HMM c(cid:243) một ph(cid:226)n phối xÆc suất liŒn quan (cid:240)ể l(cid:224)m mẫu cho ph(cid:226)n phối của cÆc (cid:240)ặc tr(cid:253)ng ảnh, (cid:226)m thanh, v(cid:224) chuyển (cid:240)ộng ở trạng thÆi (cid:240)(cid:243). CÆc tham số của HMM (cid:240)(cid:253)ợc học qua một pha luyện. Khi cÆc tham số (cid:240)ª (cid:240)(cid:253)ợc luyện, việc ph(cid:226)n (cid:240)oạn video th(cid:224)nh cÆc (cid:240)oạn cı sở, cÆc chuyển (cid:240)ộng camera v(cid:224) cÆc chuyển cảnh (cid:240)(cid:253)ợc thực hiện bằng thuật toÆn viterbi. Cho một chuỗi cÆc (cid:240)ặc tr(cid:253)ng, thuật toÆn viterbi phÆt sinh một chuỗi trạng thÆi gần giống nh(cid:253) l(cid:224) (cid:240)(cid:253)ợc tạo ra từ những (cid:240)ặc tr(cid:253)ng n(cid:224)y.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
58
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.2. PhÆt hiện chuyển cảnh dựa v(cid:224)o ph(cid:226)n t(cid:237)ch v(cid:224) t(cid:253)ıng tÆc nghe nh(cid:236)n
Tsekeridou [Scene change detection based on Audiovisual analysis and
interaction, 1998] tr(cid:236)nh b(cid:224)y một ph(cid:253)ıng thức phÆt hiện chuyển cảnh dựa trŒn những nguồn th(cid:244)ng tin th(cid:237)nh giÆc v(cid:224) thị giÆc. Ph(cid:226)n t(cid:237)ch (cid:226)m thanh ph(cid:226)n (cid:240)oạn video th(cid:224)nh 3 loại ngữ nghĩa ch(cid:237)nh : im lặng, tiếng n(cid:243)i, v(cid:224) tiếng nhạc. Một khung (cid:226)m thanh (cid:240)(cid:253)ợc coi l(cid:224) phần (cid:226)m thanh ngắn nhất về thời gian (cid:240)(cid:253)ợc døng trong ph(cid:226)n t(cid:237)ch (cid:226)m thanh ngắn hạn. Ban (cid:240)ầu, việc phÆt hiện im lặng (cid:240)(cid:253)ợc døng (cid:240)ể nhận ra những chu kỳ im lặng v(cid:224) loại bỏ n(cid:243) ra khỏi những ph(cid:226)n t(cid:237)ch sau (cid:240)(cid:243). Việc phÆt hiện (cid:240)iểm cuối quyết (cid:240)ịnh phần (cid:240)ầu v(cid:224) cuối của từ, cụm từ, v(cid:224) c(cid:226)u. PhÆt hiện tiếng nhạc (cid:240)(cid:253)ợc thực hiện s(cid:226)u hın nữa (cid:240)ể ph(cid:226)n biệt tiếng n(cid:243)i v(cid:224) tiếng nhạc. Những (cid:240)oạn c(cid:243) t(cid:237)Œng nhạc c(cid:243) nội dung tần số cao rı rệt, c(cid:243) ZCR cao (Zero Crossing Rate), v(cid:224) th(cid:253)ờng l(cid:224) d(cid:224)i. Những (cid:240)oạn c(cid:243) tiếng n(cid:243)i (cid:240)ựoc ph(cid:226)n t(cid:237)ch nhiều hın (cid:240)ể cố gắng xÆc (cid:240)ịnh những chuyển (cid:240)ổi tức th(cid:236) của ng(cid:253)ời n(cid:243)i. —ể l(cid:224)m (cid:240)(cid:253)ợc (cid:240)iều (cid:240)(cid:243), những vector (cid:240)ặc tr(cid:253)ng cấp thấp (cid:240)(cid:253)ợc rœt tr(cid:237)ch từ những khung (cid:240)ª (cid:240)(cid:253)ợc ph(cid:226)n loại tr(cid:253)ớc.
2.3. PhÆt hiện chuyển cảnh dựa v(cid:224)o l(cid:253)ợc (cid:240)ồ
Toole [Evaluation of Automatic Shot Boundary Detection on a Large Video
Test Suite] tr(cid:236)nh b(cid:224)y một sự (cid:240)Ænh giÆ chi tiết của bộ phÆt hiện chuyển cảnh dựa trŒn l(cid:253)ợc (cid:240)ồ. (Thuật toÆn (cid:240)(cid:253)ợc Æp dụng cho tập dữ liệu video số lớn v(cid:224) khÆc nhau. Sự chọn lựa ng(cid:253)ỡng cho (cid:240)ộ t(cid:253)ıng tự (cid:240)ể quyết (cid:240)ịnh biŒn (cid:240)oạn)
Kỹ thuật l(cid:253)ợc (cid:240)ồ so sÆnh những khung h(cid:236)nh liŒn tiếp nhau dựa trŒn 3 l(cid:253)ợc (cid:240)ồ 64 bit (một cho (cid:240)ộ sÆng, v(cid:224) 2 cho m(cid:224)u). Ba l(cid:253)ợc (cid:240)ồ n(cid:224)y sau (cid:240)(cid:243) (cid:240)(cid:253)ợc nối với nhau tạo th(cid:224)nh vector N-chiều, trong (cid:240)(cid:243) N l(cid:224) tổng số bin trong cả 3 l(cid:253)ợc (cid:240)ồ. —ộ (cid:240)o cosine (cid:240)(cid:253)ợc døng (cid:240)ể so sÆnh cÆc l(cid:253)ợc (cid:240)ồ của cÆc khung h(cid:236)nh liŒn tiếp. GiÆ trị cosine thấp biểu thị sự t(cid:253)ıng tự. Việc (cid:240)ặt ng(cid:253)ỡng phải xem xØt (cid:240)ến sự c(cid:226)n bằng giữa 2 (cid:240)iểm
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
59
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
m(cid:226)u thuẫn : ng(cid:253)ỡng (cid:240)ủ cao (cid:240)ể bộ phÆt hiện loại bỏ (cid:240)(cid:253)ợc nhiễu, v(cid:224) ng(cid:253)ỡng (cid:240)ủ thấp (cid:240)ể bộ phÆt hiện (cid:240)ủ nhạy cảm khi phÆt hiện chuyển cảnh tiệm tiến.
2.4. So sÆnh cÆc kỹ thuật phÆt hiện biŒn (cid:240)oạn cı sở
Boreczky v(cid:224) Rowe [SPIE96] tr(cid:236)nh b(cid:224)y một sự so sÆnh giữa một v(cid:224)i kỹ thuật phÆt hiện biŒn (cid:240)oạn cı sở v(cid:224) sự khÆc nhau giữa chœng, bao gồm cÆc thuật toÆn : l(cid:253)ợc (cid:240)ồ, biến (cid:240)ổi cosine rời rạc, vector chuyển (cid:240)ộng v(cid:224) so sÆnh khối. SÆu ph(cid:253)ıng thức sau (cid:240)ều khả thi cho việc t(cid:236)m biŒn (cid:240)oạn cı sở :
2.4.1. KhÆc biệt về (cid:240)iểm ảnh : (cid:240)ếm số l(cid:253)ợng (cid:240)iểm ảnh c(cid:243) giÆ trị thay (cid:240)ổi v(cid:253)ợt quÆ một ng(cid:253)ỡng cho tr(cid:253)ớc. T(cid:237)nh toÆn một (cid:240)ộ (cid:240)o sự khÆc biệt của ảnh. Tuy nhiŒn, kỹ thuật n(cid:224)y nhạy cảm với camera v(cid:224) chuyển (cid:240)ộng của (cid:240)ối t(cid:253)ợng.
2.4.2. KhÆc biệt thống kŒ : ph(cid:253)ıng thức n(cid:224)y mở rộng (cid:253) t(cid:253)ởng khÆc biệt về (cid:240)iểm ảnh bằng cÆch ph(cid:226)n chia ảnh th(cid:224)nh cÆc vøng v(cid:224) so sÆnh (cid:240)ộ (cid:240)o thống kŒ cÆc (cid:240)iểm ảnh trong cÆc vøng.
2.4.3. L(cid:253)ợc (cid:240)ồ : ph(cid:253)ıng thức n(cid:224)y t(cid:237)nh toÆn l(cid:253)ợc (cid:240)ồ (cid:240)ộ xÆm hoặc l(cid:253)ợc (cid:240)ồ m(cid:224)u giữa 2 ảnh. Nếu sự khÆc biệt mỗi bin giữa 2 l(cid:253)ợc (cid:240)ồ v(cid:253)ợt quÆ một ng(cid:253)ỡng , coi nh(cid:253) t(cid:236)m (cid:240)(cid:253)ợc một biŒn (cid:240)oạn cı sở.
2.4.4. KhÆc biệt về (cid:240)ộ nØn : ph(cid:253)ıng phÆp n(cid:224)y sử dụng sự khÆc biệt trong cÆc hệ số biến (cid:240)ổi cosine rời rạc (DCT) của cÆc khung h(cid:236)nh nØn JPEG nh(cid:253) l(cid:224) (cid:240)ộ (cid:240)o về sự t(cid:253)ıng tự v(cid:224) rồi sử dụng một dạng của t(cid:236)m kiếm nhị ph(cid:226)n (cid:240)ể quyết (cid:240)ịnh biŒn thực sự.
2.4.5. Theo vết biŒn cạnh : t(cid:237)nh toÆn phần trªm biŒn cạnh v(cid:224)o v(cid:224) ra giữa 2 khung h(cid:236)nh. BiŒn của (cid:240)oạn cı sở (cid:240)(cid:253)ợc t(cid:236)m thấy bằng cÆch t(cid:236)m phần trªm biŒn cạnh thay (cid:240)ổi lớn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
60
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.4.6. Vector chuyển (cid:240)ộng : vector chuyển (cid:240)ộng c(cid:243) thể (cid:240)(cid:253)ợc døng (cid:240)ể phÆt hiện (cid:240)oạn cı sở c(cid:243) phải l(cid:224) ph(cid:243)ng to nhỏ (zoom) hoặc quØt (pan) hay kh(cid:244)ng. V(cid:236) những (cid:240)oạn cı sở c(cid:243) chuyển (cid:240)ộng của camera c(cid:243) thể (cid:240)(cid:253)ợc ph(cid:226)n loại kh(cid:244)ng (cid:240)œng do chuyển cảnh tiệm tiến, việc phÆt hiện zoom v(cid:224) quØt sẽ tªng (cid:240)ộ ch(cid:237)nh xÆc của thuật toÆn phÆt hiện biŒn (cid:240)oạn cı sở.
Nªm thuật toÆn (cid:240)ª (cid:240)(cid:253)ợc c(cid:224)i (cid:240)ặt v(cid:224) so sÆnh kết quả. —(cid:243) l(cid:224) những thuật toÆn :
L(cid:253)ợc (cid:240)ồ L(cid:253)ợc (cid:240)ồ vøng L(cid:253)ợc (cid:240)ồ liŒn tục (running) Sự khÆc biệt hệ số biến (cid:240)ổi cosine rời rạc
So sÆnh kết quả : những thuật toÆn cho kết quả tốt hın l(cid:224) : so sÆnh dựa theo
vøng (region based), ph(cid:226)n t(cid:237)ch vector chuyển (cid:240)ộng.
3. CÆc h(cid:253)ớng tiếp cận ph(cid:226)n (cid:240)oạn (cid:240)iển h(cid:236)nh
Qua một số t(cid:224)i liệu, b(cid:224)i bÆo, chœng t(cid:244)i nhận thấy c(cid:243) 4 h(cid:253)ớng tiếp cận (cid:240)iển h(cid:236)nh cho
việc phÆt hiện chuyển cảnh v(cid:224) ph(cid:226)n (cid:240)oạn. Bốn h(cid:253)ớng tiếp cận (cid:240)(cid:243) l(cid:224) : Sự sai biệt về l(cid:253)ợc (cid:240)ồ m(cid:224)u giữa cÆc khung h(cid:236)nh liŒn tiếp. Tỉ số thay (cid:240)ổi biŒn cạnh. Sự ph(cid:226)n t(cid:237)ch (cid:240)ặc tr(cid:253)ng (cid:226)m thanh. Sự ph(cid:226)n t(cid:237)ch phÆt hiện chuyển (cid:240)ộng.
Bốn h(cid:253)ớng tiếp cận sẽ (cid:240)(cid:253)ợc m(cid:244) tả ngắn gọn sau (cid:240)(cid:226)y.
3.1. Sự sai biệt về l(cid:253)ợc (cid:240)ồ m(cid:224)u
—ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ (cid:240)o khoảng cÆch giữa những khung h(cid:236)nh liŒn tiếp dựa trŒn mức (cid:240)ộ sÆng. CÆc (cid:240)iểm ảnh (cid:240)(cid:253)ợc ph(cid:226)n phối v(cid:224)o 64 bin dựa v(cid:224)o (cid:240)ộ sÆng của chœng. Sự khÆc biệt giữa cÆc bin của l(cid:253)ợc (cid:240)ồ của cÆc khung h(cid:236)nh liŒn tiếp (cid:240)(cid:253)ợc gọi l(cid:224) (cid:240)ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ. Nếu sự khÆc biệt bin giữa 2 l(cid:253)ợc (cid:240)ồ v(cid:253)ợt quÆ một ng(cid:253)ỡng, coi nh(cid:253) c(cid:243) l(cid:224) một biŒn (cid:240)oạn cı sở.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
61
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Thuật toÆn phÆt hiện biŒn (cid:240)oạn cı sở theo l(cid:253)ợc (cid:240)ồ m(cid:224)u dựa v(cid:224)o thực tế l(cid:224) nội dung m(cid:224)u kh(cid:244)ng thay (cid:240)ổi nhanh ch(cid:243)ng trong cøng một (cid:240)oạn cı sở m(cid:224) sẽ biến (cid:240)ổi nhanh giữa cÆc (cid:240)oạn cı sở khÆc nhau. Do (cid:240)(cid:243), những chuyển cảnh tức th(cid:236) c(cid:243) thể (cid:240)(cid:253)ợc phÆt hiện nh(cid:253) l(cid:224) những cao (cid:240)iểm của (cid:240)(cid:253)ờng cong sai biệt về l(cid:253)ợc (cid:240)ồ m(cid:224)u giữa cÆc khung h(cid:236)nh liŒn tiếp. Kỹ thuật l(cid:253)ợc (cid:240)ồ so sÆnh những khung h(cid:236)nh liŒn tiếp nhau dựa trŒn 3 l(cid:253)ợc (cid:240)ồ 64 bit (một cho (cid:240)ộ sÆng, v(cid:224) 2 cho m(cid:224)u). Ba l(cid:253)ợc (cid:240)ồ n(cid:224)y sau (cid:240)(cid:243) (cid:240)(cid:253)ợc nối với nhau tạo th(cid:224)nh vector N-chiều, trong (cid:240)(cid:243) N l(cid:224) tổng số bin trong cả 3 l(cid:253)ợc (cid:240)ồ. —ộ (cid:240)o cosine (cid:240)(cid:253)ợc døng (cid:240)ể so sÆnh cÆc l(cid:253)ợc (cid:240)ồ của cÆc khung h(cid:236)nh liŒn tiếp. GiÆ trị cosine thấp biểu thị sự t(cid:253)ıng tự. Việc (cid:240)ặt ng(cid:253)ỡng phải xem xØt (cid:240)ến sự c(cid:226)n bằng giữa 2 (cid:240)iểm m(cid:226)u thuẫn : ng(cid:253)ỡng (cid:240)ủ cao (cid:240)ể bộ phÆt hiện loại bỏ (cid:240)(cid:253)ợc nhiễu, v(cid:224) ng(cid:253)ỡng (cid:240)ủ thấp (cid:240)ể bộ phÆt hiện (cid:240)ủ nhạy cảm khi phÆt hiện chuyển cảnh tiệm tiến. 3.2. Tỉ số thay (cid:240)ổi biŒn cạnh
Dựa v(cid:224)o sự phÆt hiện biŒn trong cÆc khung h(cid:236)nh liŒn tiếp. T(cid:237)nh toÆn phần trªm biŒn cạnh v(cid:224)o v(cid:224) ra giữa 2 khung h(cid:236)nh. BiŒn của (cid:240)oạn cı sở (cid:240)(cid:253)ợc t(cid:236)m thấy bằng cÆch t(cid:236)m phần trªm biŒn cạnh thay (cid:240)ổi lớn.
Tỉ số biến (cid:240)ổi biŒn cạnh, (cid:240)(cid:253)ợc t(cid:237)nh toÆn từ số l(cid:253)ợng (cid:240)iểm ảnh biŒn v(cid:224)o v(cid:224) ra ở
những khung h(cid:236)nh liŒn tiếp. 3.3. Sự ph(cid:226)n t(cid:237)ch (cid:240)ặc tr(cid:253)ng (cid:226)m thanh
Ph(cid:226)n t(cid:237)ch (cid:226)m thanh ph(cid:226)n (cid:240)oạn video th(cid:224)nh 3 loại ngữ nghĩa ch(cid:237)nh : im lặng, tiếng n(cid:243)i, v(cid:224) tiếng nhạc. Một khung (cid:226)m thanh (cid:240)(cid:253)ợc coi l(cid:224) phần (cid:226)m thanh ngắn nhất về thời gian (cid:240)(cid:253)ợc døng trong ph(cid:226)n t(cid:237)ch (cid:226)m thanh ngắn hạn. Ban (cid:240)ầu, việc phÆt hiện im lặng (cid:240)(cid:253)ợc døng (cid:240)ể nhận ra những chu kỳ im lặng v(cid:224) loại bỏ n(cid:243) ra khỏi những ph(cid:226)n t(cid:237)ch sau (cid:240)(cid:243). Việc phÆt hiện (cid:240)iểm cuối quyết (cid:240)ịnh phần (cid:240)ầu v(cid:224) cuối của từ, cụm từ, v(cid:224) c(cid:226)u. PhÆt hiện tiếng nhạc (cid:240)(cid:253)ợc thực hiện s(cid:226)u hın nữa (cid:240)ể ph(cid:226)n biệt tiếng n(cid:243)i v(cid:224) tiếng nhạc. Những (cid:240)oạn c(cid:243) t(cid:237)Œng nhạc c(cid:243) nội dung tần số cao rı rệt, c(cid:243) ZCR cao (Zero Crossing Rate), v(cid:224) th(cid:253)ờng l(cid:224) d(cid:224)i.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
62
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
3.4. Sự ph(cid:226)n t(cid:237)ch phÆt hiện chuyển (cid:240)ộng
Một trong những (cid:240)ặc tr(cid:253)ng của mª h(cid:243)a MPEG l(cid:224) mỗi khung h(cid:236)nh (cid:240)(cid:253)ợc chia th(cid:224)nh một số cố (cid:240)ịnh những vøng gọi l(cid:224) macroblock. C(cid:243) 3 loại macroblock : I-, P- v(cid:224) BI- (cid:240)(cid:253)ợc mª h(cid:243)a (cid:240)ộc lập với nhau. Macroblock P- c(cid:243) một vector chuyển (cid:240)ộng cho biết sự khÆc biệt giữa vøng (cid:240)ang (cid:240)(cid:253)ợc mª h(cid:243)a với vøng t(cid:253)ıng ứng ở cÆc khung h(cid:236)nh tr(cid:253)ớc. —iều n(cid:224)y giœp l(cid:224)m giảm k(cid:237)ch th(cid:253)ớc l(cid:253)u trữ do thay v(cid:236) phải l(cid:253)u từng khung h(cid:236)nh th(cid:236) chỉ cần l(cid:253)u những thay (cid:240)ổi so với khung h(cid:236)nh tr(cid:253)ớc.
Chœng ta c(cid:243) thể nhận biết v(cid:224) sử dụng những (cid:240)ặc (cid:240)iểm n(cid:224)y (cid:240)ể quyết (cid:240)ịnh biŒn (cid:240)oạn cı sở một cÆch trực tiếp từ dạng nØn của video. V(cid:237) dụ, nếu một loại khung h(cid:236)nh (cid:240)uợc mong chờ sẽ chứa những th(cid:244)ng tin của những block tr(cid:253)ớc (cid:240)(cid:243), nh(cid:253)ng n(cid:243) kh(cid:244)ng chứa g(cid:236), th(cid:236) c(cid:243) thể giả (cid:240)ịnh rằng ảnh tiếp theo thay (cid:240)ổi một cÆch (cid:240)ột ngột v(cid:224) c(cid:243) thể coi nh(cid:253) (cid:240)(cid:226)y l(cid:224) một biŒn (cid:240)oạn cı sở.
4. Một số ph(cid:253)ıng phÆp cải tiến
Trong cÆc h(cid:253)ớng tiếp cận trŒn, ph(cid:253)ıng phÆp khÆc biệt về l(cid:253)ợc (cid:240)ồ m(cid:224)u (cid:240)(cid:253)ợc sử dụng nhiều v(cid:224) th(cid:244)ng dụng nhất. (cid:221)u (cid:240)iểm của n(cid:243) l(cid:224) t(cid:237)nh toÆn nhanh v(cid:224) (cid:240)ın giản, hiệu quả trong việc phÆt hiện chuyển cảnh tức th(cid:236), chuyển cảnh rı r(cid:224)ng, hoặc c(cid:243) sự dịch chuyển bØ của (cid:240)ối t(cid:253)ợng v(cid:224) sự dịch chuyển bØ của camera.
H(cid:236)nh 27 Chuyển cảnh tức th(cid:236) dễ phÆt hiện
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
63
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Thế nh(cid:253)ng nếu gặp những chuyển cảnh dạng tiệm tiến th(cid:236) sẽ gặp vấn (cid:240)ề. Trong chuyển cảnh tiệm tiến, cÆc ảnh từ từ mờ (cid:240)i, (cid:240)an xen lẫn nhau, l(cid:224)m cho sự khÆc biệt về (cid:240)ặc tr(cid:253)ng giữa cÆc khung h(cid:236)nh liŒn tiếp trong chuyển cảnh t(cid:253)ıng (cid:240)ối nhỏ v(cid:224) kh(cid:244)ng (cid:240)ủ (cid:240)ể v(cid:253)ợt ng(cid:253)ỡng xÆc (cid:240)ịnh (cid:240)ª (cid:240)ặt ra, dẫn (cid:240)ến việc kh(cid:244)ng phÆt hiện (cid:240)(cid:253)ợc chuyển cảnh giữa 2 (cid:240)oạn cı sở. Nếu nh(cid:253) ng(cid:253)ỡng xÆc (cid:240)ịnh thấp quÆ th(cid:236) sẽ t(cid:236)m ra nhiều (cid:240)oạn cı sở d(cid:253) thừa, nếu nh(cid:253) ng(cid:253)ỡng quÆ cao th(cid:236) kh(cid:244)ng phÆt hiện (cid:240)(cid:253)ợc chuyển cảnh.
Ngo(cid:224)i ra trong tr(cid:253)ờng hợp camera hay (cid:240)ối t(cid:253)ợng chuyển (cid:240)ộng nhanh cũng tạo ra sự khÆc biệt t(cid:253)ıng (cid:240)ối lớn giữa cÆc khung h(cid:236)nh mặc dø chœng cøng thuộc một (cid:240)oạn cı sở.
H(cid:236)nh 28 Chuyển cảnh tiệm tiến kh(cid:243) phÆt hiện
—ể giải quyết cÆc vấn (cid:240)ề trŒn, một số cải tiến (cid:240)(cid:253)ợc Æp dụng (cid:240)ể ph(cid:226)n t(cid:237)ch chuyển
cảnh hiệu quả hın
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
64
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
4.1. Ph(cid:253)ıng phÆp hai ng(cid:253)ỡng
4.1.1 Giới thiệu
Ph(cid:253)ıng phÆp n(cid:224)y giœp tªng mức (cid:240)ộ t(cid:236)m (cid:240)œng v(cid:224) phÆt hiện (cid:240)(cid:253)ợc chuyển
cảnh tiệm tiến.
Nh(cid:253) (cid:240)ª (cid:240)ề cập ở phần trŒn, vấn (cid:240)ề ch(cid:237)nh l(cid:224) trong chuyển cảnh tiệm tiến, sự khÆc biệt giữa những cặp khung h(cid:236)nh liŒn tiếp kh(cid:244)ng (cid:240)Æng kể. Nh(cid:253)ng nếu chœ (cid:253), chœng ta dễ d(cid:224)ng nhận thấy bằng mắt rằng c(cid:243) sự khÆc biệt lớn giữa khung h(cid:236)nh (cid:240)ầu v(cid:224) khung h(cid:236)nh cuối của chuyển cảnh tiệm tiến(xem H(cid:236)nh.). Ph(cid:253)ıng phÆp hai ng(cid:253)ỡng hoạt (cid:240)ộng theo nhận xØt trŒn. Kế thừa từ ph(cid:253)ıng phÆp sự sai biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u, ng(cid:253)ỡng thứ nhất (cid:240)(cid:253)ợc døng (cid:240)ể xØt (cid:240)ộ khÆc biệt giữa 2 khung h(cid:236)nh liŒn tiếp, thŒm v(cid:224)o (cid:240)(cid:243), một ng(cid:253)ỡng thứ 2 (cid:240)(cid:253)ợc døng (cid:240)ể xØsự khÆc biệt giữa mỗi khung h(cid:236)nh trong ph(cid:226)n (cid:240)oạn với khung h(cid:236)nh (cid:240)ầu tiŒn của ph(cid:226)n (cid:240)oạn(khung h(cid:236)nh n(cid:224)y (cid:240)(cid:253)ợc gọi l(cid:224) khung h(cid:236)nh boundary ). —ộ dị biệt (cid:240)(cid:253)ợc t(cid:237)nh dựa trŒn (cid:240)ặc tr(cid:253)ng m(cid:224)u.
H(cid:236)nh 29
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
65
cf l(cid:224) khung h(cid:236)nh hiện h(cid:224)nh ,
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1cf
f
t
l(cid:224) khung h(cid:236)nh truớc khung h(cid:236)nh 4.1.2 Thuật toÆn Gọi
bf
c
1
f c 1
f
f
c
b
2t
hay hiện h(cid:224)nh 1 khung h(cid:236)nh , l(cid:224) khung h(cid:236)nh boundary : nếu
cf (cid:240)(cid:253)ợc gọi l(cid:224) khung h(cid:236)nh boundary . Trong (cid:240)(cid:243) 1t , 2t l(cid:224) ng(cid:253)ỡng
th(cid:236)
t
1
a
v(cid:224) (cid:240)(cid:253)ợc t(cid:237)nh nh(cid:253) sau :
với l(cid:224) trung b(cid:236)nh histogram của cả (cid:240)oạn video v(cid:224) l(cid:224) (cid:240)ộ
t
2
1
t
4 5
lệch ph(cid:253)ıng sai.
CÆc b(cid:253)ớc x(cid:226)y dựng :
t
1
1
2
2
d , hay t
B(cid:253)ớc 1 : T(cid:237)nh 2 ng(cid:253)ỡng 1t , 2t theo c(cid:244)ng thức trŒn.
d th(cid:236) khung h(cid:236)nh
hiện tại l(cid:224) khung h(cid:236)nh boundary v(cid:224) (cid:240)(cid:226)y l(cid:224) biŒn (cid:240)oạn cı sở mới.
B(cid:253)ớc 2 : T(cid:237)nh (cid:240)ộ sai biệt về (cid:240)ặc tr(cid:253)ng khung h(cid:236)nh hiện h(cid:224)nh (cid:240)ang xØt với khung h(cid:236)nh tr(cid:253)ớc (cid:240)(cid:243) (cid:240)ặt l(cid:224) d1 v(cid:224) với khung h(cid:236)nh boundary (cid:240)ặt l(cid:224) d2. B(cid:253)ớc 3 : Nếu nh(cid:253) (cid:240)ộ sai biệt
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
66
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 30 Kết quả ph(cid:226)n (cid:240)oạn bằng ph(cid:253)ıng phÆp 2 ng(cid:253)ỡng
4.2. Kết hợp l(cid:253)ợc (cid:240)ồ m(cid:224)u v(cid:224) toÆn tử h(cid:236)nh thÆi học Morphology v(cid:224) giải thuật
Watershed.
4.2.1. X(cid:226)y dựng (cid:240)(cid:253)ờng cong sai biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u
—ầu tiŒn, t(cid:237)nh cÆc sai biệt về l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục giữa cÆc khung h(cid:236)nh liŒn tiếp, ta c(cid:243) (cid:240)(cid:253)ợc (cid:240)(cid:253)ờng cong sai biệt.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
67
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
M
)( tHD
[
]
Sự sai biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u (cid:240)(cid:253)ợc t(cid:237)nh nh(cid:253) sau:
[ 1
t
] mhmh t
1 M
m
1
]
[mht
,
l(cid:224) l(cid:253)ợc (cid:240)ồ m(cid:224)u tại (cid:244) m(cid:224)u thứ m của khung h(cid:236)nh thứ t, M l(cid:224) số (cid:244)
m(cid:224)u trong l(cid:253)ợc (cid:240)ồ m(cid:224)u.
H(cid:236)nh 31 —(cid:253)ờng sai biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục
4.2.2. Lọc (cid:240)(cid:253)ờng (cid:240)ồ thị bằng toÆn tử h(cid:236)nh thÆi học
Sau khi c(cid:243) (cid:240)(cid:253)ợc (cid:240)(cid:253)ờng cong sai biệt, tiến h(cid:224)nh lọc (cid:240)(cid:253)ờng cong sai biệt
nhằm mở rộng vøng ứng với cÆc (cid:240)ỉnh (cid:226)m v(cid:224) (cid:240)ỉnh d(cid:253)ıng c(cid:243) giÆ trị bØ. Gồm cÆc b(cid:253)ớc :
CD
t )(
(
tCD (
))
fn
w
Lọc cÆc (cid:240)ỉnh (cid:226)m bằng toÆn tử phi tuyến h(cid:236)nh thÆi học nh(cid:253)ng vẫn giữ (cid:240)(cid:253)ợc cÆc (cid:240)ỉnh d(cid:253)ıng. Sử dụng toÆn tử (cid:240)(cid:243)ng (Closing operator) (cid:240)ể thực hiện việc n(cid:224)y.
(
xf (
))
w
w w
xf )(
(
xf (
))
xf (
b
)
w
max wb
(
xf (
))
(
)
w
bxf
min wb
trong (cid:240)(cid:243):
w l(cid:224) cửa sổ l(cid:226)n cận quanh vị tr(cid:237) (cid:240)ang xØt x, CD(t), CDfn(t) l(cid:224) (cid:240)(cid:253)ờng cong sai biệt tr(cid:253)ớc v(cid:224) sau khi lọc (cid:240)ỉnh (cid:226)m
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
68
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 32
CD
t )(
(
CD
(
t
),
CD
t )(
h
)
fp
fn
fn
h
Loại bớt một số (cid:240)ỉnh d(cid:253)ıng c(cid:243) giÆ trị bØ bằng toÆn tử phi tuyến h(cid:236)nh thÆi học. Sử dụng toÆn tử tÆi cấu trœc mở (Opening reconstruction operator) (cid:240)ể thực hiện việc n(cid:224)y.
(
xf (
),
xf )(
h
)
xf )(
h
w
w
xf )(
xf )(
(
)
w
bxf
max wb
trong (cid:240)(cid:243) :
w l(cid:224) l(cid:226)n cận quanh vị tr(cid:237) (cid:240)ang xØt x, l(cid:224) toÆn tử min, CDfn(t) l(cid:224) (cid:240)(cid:253)ờng cong sai biệt sau khi lọc (cid:240)ỉnh (cid:226)m, CDfp(t) l(cid:224) (cid:240)(cid:253)ờng cong sai biệt sau khi lọc (cid:240)ỉnh d(cid:253)ıng, h l(cid:224) (cid:240)ại l(cid:253)ợng sẽ (cid:240)(cid:253)ợc t(cid:237)nh trong thực nghiệm, thể hiện (cid:240)ộ cao của (cid:240)ỉnh cần loại bỏ
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
69
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 33
4.2.3. T(cid:236)m cÆc (cid:240)oạn cı sở
Ở b(cid:253)ớc n(cid:224)y, Æp dụng giải thuật ph(cid:226)n (cid:240)oạn Watershed cho (cid:240)(cid:253)ờng cong sai biệt sau khi lọc (cid:240)ỉnh d(cid:253)ıng. Tiến h(cid:224)nh xÆc (cid:240)ịnh vị tr(cid:237) cÆc (cid:240)iểm mầm trŒn (cid:240)(cid:253)ờng cong sai biệt CDfp(t) dựa v(cid:224)o cÆc (cid:240)oạn c(cid:243) (cid:240)ộ biến thiŒn thấp, cÆc (cid:240)iểm mầm n(cid:224)y ch(cid:237)nh l(cid:224) cÆc khung h(cid:236)nh (cid:240)ại diện trong (cid:240)oạn cı sở cần t(cid:236)m.
Từ cÆc (cid:240)iểm mầm, lan rộng sang 2 ph(cid:237)a, 2 (cid:240)iểm mầm liŒn tiếp nhau sẽ gặp nhau tại vị tr(cid:237) c(cid:243) giÆ trị lớn nhất giữa 2 (cid:240)iểm mầm trŒn (cid:240)(cid:253)ờng cong sai biệt CDfp(t), trong quÆ tr(cid:236)nh lan rộng theo nguyŒn tắc trŒn (cid:240)ª loại (cid:240)(cid:253)ợc cÆc (cid:240)ỉnh ảo. —oạn cı sở ch(cid:237)nh l(cid:224) (cid:240)oạn ở giữa cÆc vị tr(cid:237) n(cid:224)y.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
70
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 34. —(cid:253)ờng cong ban (cid:240)ầu (ở trŒn) v(cid:224) sau khi qua toÆn tử h(cid:236)nh thÆi học (ở d(cid:253)ới). —(cid:253)ờng m(cid:224)u (cid:240)ỏ l(cid:224) những nıi phÆt hiện chuyển cảnh
4.3. L(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u
Nh(cid:253) (cid:240)ª (cid:240)ề cập ở ch(cid:253)ıng 2, (cid:240)iểm yếu của l(cid:253)ợc (cid:240)ồ m(cid:224)u l(cid:224) kh(cid:244)ng thể hiện (cid:240)(cid:253)ợc sự quan hệ về kh(cid:244)ng gian giữa cÆc m(cid:224)u, từ (cid:240)(cid:243) dẫn (cid:240)ến c(cid:243) những ảnh khÆc nhau nh(cid:253)ng lại c(cid:243) chung l(cid:253)ợc (cid:240)ồ m(cid:224)u. V(cid:224) (cid:240)iều n(cid:224)y c(cid:243) thể l(cid:224)m cho việc ph(cid:226)n (cid:240)oạn kh(cid:244)ng ch(cid:237)nh xÆc. Tuy nhiŒn, l(cid:253)ợc (cid:240)ồ t(cid:253)ıng quan m(cid:224)u khắc phục (cid:240)(cid:253)ợc nh(cid:253)ợc (cid:240)iểm n(cid:224)y. Do (cid:240)(cid:243), (cid:240)ể cải tiến thŒm ph(cid:253)ıng phÆp ph(cid:226)n (cid:240)oạn, giœp t(cid:236)m những (cid:240)oạn cı sở ch(cid:237)nh xÆc hın, chœng t(cid:244)i thay thế l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục bằng l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u. 4.3.1 X(cid:226)y dựng (cid:240)(cid:253)ờng cong sai biệt
1L (cid:240)o (cid:240)ộ sai biệt giữa khung h(cid:236)nh t v(cid:224) t+1 dựa v(cid:224)o l(cid:253)ợc (cid:240)ồ
Sử dụng (cid:240)ộ (cid:240)o
d
)
d
)
tCD )(
(
I
(
I
)
t
t
( c
) 1
( c [ ] DdCc [ ],
tự t(cid:253)ıng quan m(cid:224)u:
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
71
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Trong (cid:240)(cid:243):
d
)
( c
t
() I
[C] l(cid:224) tập cÆc m(cid:224)u (cid:240)(cid:253)ợc sử dụng (cid:240)ể (cid:240)ịnh l(cid:253)ợng m(cid:224)u. [D] l(cid:224) tập cÆc khoảng cÆch (cid:240)(cid:253)ợc dung (cid:240)ể (cid:240)Ænh giÆ mức (cid:240)ộ ph(cid:226)n bố m(cid:224)u cục bộ.
l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u của khung h(cid:236)nh thứ t ứng với
m(cid:224)u c v(cid:224) khoảng cÆch d. 4.3.2 Lọc (cid:240)(cid:253)ờng (cid:240)ồ thị v(cid:224) t(cid:236)m cÆc (cid:240)oạn cı sở
Giống nh(cid:253) ph(cid:253)ıng phÆp trŒn, chœng t(cid:244)i sử dụng cÆc toÆn tử h(cid:236)nh thÆi học (cid:240)ể lọc (cid:240)(cid:253)ờng cong sai biệt. Sau (cid:240)(cid:243), døng giải thuật Watershed (cid:240)ể tiến h(cid:224)nh t(cid:236)m cÆc (cid:240)oạn cı sở
H(cid:236)nh 35. Ph(cid:226)n (cid:240)oạn theo l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u v(cid:224) toÆn tử h(cid:236)nh thÆi học, giải thuật watershed
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
72
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
5. —Ænh giÆ cÆc ph(cid:253)ıng phÆp 5.1. —ộ (cid:240)o Precision, Recall. 5.1.1 —ịnh nghĩa :
—ể (cid:240)Ænh giÆ hiệu quả ph(cid:226)n (cid:240)oạn, chœng t(cid:244)i sử dụng (cid:240)ộ (cid:240)o precision v(cid:224) reall. —(cid:226)y l(cid:224) những (cid:240)ộ (cid:240)o th(cid:253)ờng (cid:240)(cid:253)ợc sử dụng trong việc ph(cid:226)n (cid:240)oạn video.
precision
D F
Precision : (cid:240)ộ ch(cid:237)nh xÆc, (cid:240)(cid:253)ợc t(cid:237)nh bằng c(cid:244)ng thức :
recall
D T
Recall : (cid:240)ộ trung thực, (cid:240)(cid:253)ợc t(cid:237)nh bằng c(cid:244)ng thức :
Trong (cid:240)(cid:243) :
D l(cid:224) số (cid:240)oạn cı sở thuật toÆn t(cid:236)m (cid:240)œng. F l(cid:224) tổng số (cid:240)oạn cı sở thuật toÆn t(cid:236)m (cid:240)(cid:253)ợc. T l(cid:224) tổng số (cid:240)oạn cı sở thực c(cid:243), (cid:240)(cid:253)ợc (cid:240)ếm trực tiếp bằng mắt.
5.1.2 (cid:221) nghĩa
Precision cho biết (cid:240)ộ ch(cid:237)nh xÆc của thuật toÆn. Precision c(cid:224)ng lớn th(cid:236) thuật toÆn ph(cid:226)n (cid:240)oạn c(cid:224)ng ch(cid:237)nh xÆc. —iều n(cid:224)y c(cid:243) nghĩa l(cid:224) trong số những (cid:240)oạn cı sở t(cid:236)m (cid:240)(cid:253)ợc, phần lớn l(cid:224) những (cid:240)oạn cı sở thực sự (cid:240)œng. Tuy nhiŒn precision lớn kh(cid:244)ng (cid:240)ảm bảo việc t(cid:236)m (cid:240)ủ số (cid:240)oạn cı sở thực sự. V(cid:237) dụ nh(cid:253) tiến h(cid:224)nh ph(cid:226)n (cid:240)oạn cho 1 (cid:240)oạn video gồm c(cid:243) 10 (cid:240)oạn cı sở ((cid:240)(cid:253)ợc (cid:240)ếm bằng mắt). Kết quả t(cid:236)m (cid:240)(cid:253)ợc 5 ph(cid:226)n (cid:240)oạn, trong (cid:240)(cid:243) c(cid:243) 4 ph(cid:226)n (cid:240)oạn (cid:240)œng, vậy precision = 80%, tỉ lệ (cid:240)œng khÆ cao, nh(cid:253)ng thuật toÆn chỉ t(cid:236)m (cid:240)(cid:253)ợc gần một nửa trong tổng số (cid:240)oạn cı sở cần t(cid:236)m.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
73
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Recall cho biết tỉ lệ t(cid:236)m (cid:240)œng so với số (cid:240)oạn cı sở thực sự c(cid:243). Recall c(cid:224)ng lớn th(cid:236) c(cid:224)ng nhiều (cid:240)oạn cı sở (cid:240)(cid:253)ợc t(cid:236)m (cid:240)œng. Tuy nhiŒn, recal lớn kh(cid:244)ng c(cid:243) nghĩa l(cid:224) thuật toÆn t(cid:236)m ch(cid:237)nh xÆc. V(cid:237) dụ nh(cid:253) tiến h(cid:224)nh ph(cid:226)n (cid:240)oạn video gồm c(cid:243) 10 (cid:240)oạn cı sở. Kết quả t(cid:236)m (cid:240)(cid:253)ợc 16 (cid:240)oạn, trong (cid:240)(cid:243) c(cid:243) 7 (cid:240)oạn (cid:240)œng, vậy recall = 70%, tỉ lệ khÆ cao, nh(cid:253)ng thuật toÆn t(cid:236)m d(cid:253) khÆ nhiều (cid:240)oạn cı sở, v(cid:224) những (cid:240)oạn cı sở d(cid:253) thừa n(cid:224)y (cid:240)ều kh(cid:244)ng ch(cid:237)nh xÆc. Precision v(cid:224) recall c(cid:224)ng lớn th(cid:236) thuật toÆn c(cid:224)ng tốt. Tuy nhiŒn, th(cid:253)ờng th(cid:236) chœng m(cid:226)u thuẫn nhau. Precision lớn th(cid:236) recall bØ v(cid:224) ng(cid:253)ợc lại.
5.2. Thống kŒ kết quả
5.2.1 Ph(cid:253)ıng phÆp thử nghiệm
Chœng t(cid:244)i (cid:240)ª tiến h(cid:224)nh c(cid:224)i (cid:240)ặt 4 ph(cid:253)ıng phÆp ph(cid:226)n (cid:240)oạn cı sở : Ph(cid:253)ıng phÆp sử khÆc biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục cổ (cid:240)iển Ph(cid:253)ıng phÆp sự khÆc biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục sử dụng 2 ng(cid:253)ỡng. Ph(cid:253)ıng phÆp sự khÆc biệt l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục, kết hợp toÆn tử h(cid:236)nh thÆi học Morphology v(cid:224) giải thuật Watershed. Ph(cid:253)ıng phÆp sự khÆc biệt về l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u, kết hợp toÆn tử h(cid:236)nh thÆi học Morphology v(cid:224) giải thuật Watershed.
M(cid:244) h(cid:236)nh m(cid:224)u (cid:240)(cid:253)ợc chọn l(cid:224) kh(cid:244)ng gian m(cid:224)u HSV, với 12 th(cid:224)nh phần H, 3
th(cid:224)nh phần S, v(cid:224) 3 th(cid:224)nh phần V, tập m(cid:224)u (cid:240)(cid:253)ợc døng gồm 108 m(cid:224)u.
Tập [D] = {1,3,5,7} l(cid:224) tập cÆc khoảng cÆch (cid:240)(cid:253)ợc døng trong tr(cid:237)ch (cid:240)ặc
tr(cid:253)ng tự t(cid:253)ıng quan m(cid:224)u của cÆc khung h(cid:236)nh. 5.2.2 Dữ liệu video
Dữ liệu sử dụng l(cid:224) 30 (cid:240)oạn video (cid:240)ª (cid:240)(cid:253)ợc (cid:240)ếm số (cid:240)oạn cı sở trực tiếp bằng mắt, trong (cid:240)(cid:243) c(cid:243) 10 (cid:240)oạn về b(cid:243)ng (cid:240)Æ, 10 (cid:240)oạn tin tức thời sự, 10 (cid:240)oạn về thế giới (cid:240)ộng vật, mỗi (cid:240)oạn 15 phœt.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
74
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
5.2.3 Bảng thống kŒ kết quả ph(cid:226)n (cid:240)oạn
Sau khi tiến h(cid:224)nh ph(cid:226)n (cid:240)oạn bằng 4 ph(cid:253)ıng phÆp với dữ liệu l(cid:224) 30 (cid:240)oạn video trŒn, chœng t(cid:244)i c(cid:243) bảng kết quả nh(cid:253) sau :
—oạn video
Ph(cid:253)ıng phÆp l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục + giải thuật Watershed
Ph(cid:253)ıng phÆp l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u + giải thuật Watershed
—ộ trung
—ộ trung
—ộ trung
—ộ trung
—ộ ch(cid:237)nh xÆc (%)
thực (%)
—ộ ch(cid:237)nh xÆc (%)
thực (%)
—ộ ch(cid:237)nh xÆc (%)
thực (%)
—ộ ch(cid:237)nh xÆc (%)
thực (%)
video1
11
36
45
66
70
40
78
72
Video2
26
33
40
63
78
50
77
73
Video3
34
35
49
63
63
45
72
65
Video4
21
28
52
58
79
49
71
66
Video5
25
35
40
64
65
40
49
78
Video6
31
33
45
65
78
55
59
79
Video7
27
25
47
45
68
45
55
77
Video8
22
27
55
64
73
58
65
62
Video9
17
22
44
62
66
60
65
65
video10
45
48
55
50
59
45
56
78
video11
57
48
46
42
70
50
55
62
Ph(cid:253)ıng phÆp l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục cổ (cid:240)iển Ph(cid:253)ıng phÆp l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục sử dụng 2 ng(cid:253)ỡng
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
75
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
video12 35 33 55 49 65 65 63 72
video13 48 44 42 45 53 45 66 70
video14 62 52 40 43 72 50 64 71
video15 45 33 45 49 60 62 62 63
video16 51 45 49 42 78 45 71 56
video17 19 27 46 45 75 63 76 54
video19
41
33
45
53
70
45
66
66
35
55
55
46
63
55
52
71
Video20
44
25
46
60
79
60
76
70
Video21
37
22
44
55
63
58
61
72
Video22
43
32
42
46
66
42
55
67
Video23
26
38
45
59
69
48
64
54
Video24
33
26
42
42
62
66
66
66
Video25
46
55
53
45
71
65
67
65
Video26
44
43
45
46
63
58
68
71
Video27
58
38
42
52
69
66
55
51
Video28
46
42
53
36
75
49
49
46
Video29
35
29
49
49
62
64
55
56
Video30
Trung
36.2
35.6
46.7
48.3
68.3
56.9
66.4
58.6
b(cid:236)nh
video18 22 28 51 52 66 61 79 46
Bảng 1 Bảng thống kŒ kết quả ph(cid:226)n (cid:240)oạn
5.3. —Ænh giÆ cÆc ph(cid:253)ıng phÆp
Nhận xØt chung : cả 3 ph(cid:253)ıng phÆp cải tiến ngo(cid:224)i việc phÆt hiện ngay chuyển cảnh tức th(cid:236), (cid:240)ều c(cid:243) thể phÆt hiện chuyển cảnh tiệm tiến tốt hın cÆc ph(cid:253)ıng phÆp b(cid:236)nh th(cid:253)ờng khÆc. Trong (cid:240)(cid:243), ph(cid:253)ıng phÆp 2 ng(cid:253)ỡng, nhờ v(cid:224)o ng(cid:253)ỡng thứ
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
76
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2, v(cid:224) 2 ph(cid:253)ıng phÆp c(cid:242)n lại nhờ v(cid:224)o toÆn tử h(cid:236)nh thÆi học, giải thuật Watershed nŒn c(cid:243) thể phÆt hiện (cid:240)(cid:253)ợc những (cid:240)oạn chuyển cảnh dạng tiệm tiến. —ối với ph(cid:253)ıng phÆp 2 ng(cid:253)ỡng : số ph(cid:226)n (cid:240)oạn t(cid:236)m (cid:240)(cid:253)ợc t(cid:253)ıng (cid:240)ối nhiều (th(cid:253)ờng th(cid:236) gấp 2 lần số ph(cid:226)n (cid:240)oạn thực c(cid:243)) do trong một số chuyển cảnh tiệm tiến, sự khÆc biệt giữa cÆc khung h(cid:236)nh liŒn tiếp tuy kh(cid:244)ng lớn nh(cid:253)ng vừa (cid:240)ủ (cid:240)ể v(cid:253)ợt ng(cid:253)ỡng thứ 1 (cid:240)ặt ra (døng (cid:240)ể xØt giữa những khung h(cid:236)nh liŒn tiếp). Ngo(cid:224)i ra, một ph(cid:226)n (cid:240)oạn thực sự c(cid:243) thể bị chia th(cid:224)nh cÆc ph(cid:226)n (cid:240)oạn con nhỏ hın do ng(cid:253)ỡng thứ 2 (døng (cid:240)ể xØt một khung h(cid:236)nh với khung h(cid:236)nh biŒn (cid:240)oạn cı sở) thấp hın ng(cid:253)ỡng thứ 1. —ối với 2 ph(cid:253)ıng phÆp Æp dụng toÆn tử h(cid:236)nh thÆi học v(cid:224) giải thuật Watershed : nhờ toÆn tử h(cid:236)nh thÆi học lọc bớt cÆc (cid:240)ỉnh d(cid:253) thừa trong (cid:240)(cid:253)ờng cong sai biệt, nŒn c(cid:243) thể loại bỏ (cid:240)(cid:253)ợc phần n(cid:224)o cÆc (cid:240)ỉnh trŒn (cid:240)(cid:253)ờng cong kh(cid:244)ng phải thực sự l(cid:224) chuyển cảnh trong chuyển cảnh tiệm tiến. BŒn cạnh (cid:240)(cid:243), nhờ ph(cid:226)n (cid:240)oạn bằng giải thuật Watershed tự d(cid:242) t(cid:236)m cÆc chuyển cảnh m(cid:224) kh(cid:244)ng cần døng một ng(cid:253)ỡng cố (cid:240)ịnh, giœp trÆnh phÆt hiện d(cid:253) thừa v(cid:224) t(cid:236)m ph(cid:226)n (cid:240)oạn ch(cid:237)nh xÆc hın. Tuy nhiŒn, do lọc bớt cÆc (cid:240)ỉnh của (cid:240)(cid:253)ờng cong sai biệt, 2 ph(cid:253)ıng phÆp c(cid:243) thể loại bỏ bớt những (cid:240)iểm thực sự l(cid:224) chuyển cảnh, dẫn tới việc t(cid:236)m s(cid:243)t (cid:240)oạn cı sở. Trong 2 ph(cid:253)ıng phÆp n(cid:224)y th(cid:236) ph(cid:253)ıng phÆp sử dụng l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u (cid:240)ể x(cid:226)y dựng (cid:240)(cid:253)ờng cong sai biệt cho kết quả tốt hın ph(cid:253)ıng phÆp sử dụng l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục do c(cid:243) thŒm th(cid:244)ng tin về quan hệ vị tr(cid:237) giữa cÆc m(cid:224)u.
6. T(cid:243)m tắt ch(cid:253)ıng
Nội dung ch(cid:253)ıng n(cid:224)y l(cid:224) n(cid:243)i về ph(cid:226)n (cid:240)oạn dữ liệu video. —(cid:226)y l(cid:224) một b(cid:253)ớc rất quan trọng trong việc x(cid:226)y dựng hệ thống truy t(cid:236)m th(cid:244)ng tin video. —ầu v(cid:224)o của giai (cid:240)oạn n(cid:224)y l(cid:224) cÆc dữ liệu video b(cid:236)nh th(cid:253)ờng, sau khi ph(cid:226)n (cid:240)oạn, (cid:240)ầu ra l(cid:224) những (cid:240)oạn cı sở của chœng.
Trong ch(cid:253)ıng n(cid:224)y, chœng t(cid:244)i (cid:240)ª lần l(cid:253)ợt giới thiệu cÆc ph(cid:253)ıng phÆp ph(cid:226)n (cid:240)oạn cı sở (cid:240)ª v(cid:224) (cid:240)ang (cid:240)(cid:253)ợc sử dụng rộng rªi. V(cid:224) chœng t(cid:244)i cũng cải tiến một số ph(cid:253)ıng
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
77
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
phÆp (cid:240)ể kết quả ph(cid:226)n (cid:240)oạn tốt hın. Sau khi c(cid:224)i (cid:240)ặt v(cid:224) chạy thử trŒn bộ dữ liệu video (cid:240)ª (cid:240)ề cập ở trŒn, kết quả t(cid:253)ıng (cid:240)ối khả quan.
Nh(cid:253) (cid:240)ª n(cid:243)i, kết quả của giai (cid:240)oạn n(cid:224)y l(cid:224) cÆc (cid:240)oạn cı sở của dữ liệu video, nh(cid:253)ng bất kỳ loại dữ liệu n(cid:224)o, muốn sử dụng (cid:240)(cid:253)ợc hiệu quả cũng phải (cid:240)(cid:253)ợc tổ chức theo một cấu trœc hợp l(cid:253). Ở ch(cid:253)ıng sau, chœng t(cid:244)i giới thiệu ph(cid:253)ıng phÆp tổ chức cÆc (cid:240)oạn cı sở theo cấu trœc c(cid:226)y, v(cid:224) tiến h(cid:224)nh ph(cid:226)n lớp cÆc (cid:240)oạn cı sở.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
78
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
CH(cid:221)(cid:213)NG 4 TỔ CHỨC C`C —OẠN C(cid:213) SỞ THEO CẤU TR(cid:218)C C´Y
Nội dung ch(cid:237)nh của ch(cid:253)ıng l(cid:224) thuật toÆn tổ chức cÆc (cid:240)oạn cı sở theo cấu trœc c(cid:226)y, x(cid:226)y dựng bảng mục lục v(cid:224) bảng chỉ mục, v(cid:224) tiến h(cid:224)nh ph(cid:226)n lớp cÆc (cid:240)oạn cı sở.
Nội dung của ch(cid:253)ıng : 1. Giới thiệu 2. Tổ chức cÆc (cid:240)oạn cı sở theo cấu trœc c(cid:226)y nhị ph(cid:226)n 3. X(cid:226)y dựng bảng mục lục v(cid:224) chỉ mục 4. XÆc (cid:240)ịnh cÆc lớp của cÆc (cid:240)oạn cı sở v(cid:224) phần tử (cid:240)ại diện của lớp 5. XÆc (cid:240)ịnh khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở 6. T(cid:243)m tắt ch(cid:253)ıng
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
79
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1. Giới thiệu
Ở ch(cid:253)ıng tr(cid:253)ớc, chœng ta (cid:240)ª tiến h(cid:224)nh việc ph(cid:226)n (cid:240)oạn, từ dữ liệu video ban (cid:240)ầu, sau khi qua quÆ tr(cid:236)nh t(cid:236)m (cid:240)oạn cı sở, chœng ta (cid:240)ª c(cid:243) (cid:240)(cid:253)ợc những (cid:240)oạn cı sở tạo nŒn (cid:240)oạn video. Dø Æp dụng nhiều thuật toÆn v(cid:224) c(cid:243) nhiều cải tiến, nh(cid:253)ng cũng kh(cid:244)ng thể n(cid:224)o trÆnh (cid:240)(cid:253)ợc cÆc tr(cid:253)ờng hợp sai s(cid:243)t, t(cid:236)m d(cid:253) (cid:240)oạn cı sở. —ể khắc phục (cid:240)iều n(cid:224)y, chœng t(cid:244)i thực hiện việc ghØp nối cÆc (cid:240)oạn cı sở c(cid:243) (cid:240)ộ t(cid:253)ıng (cid:240)ồng cao v(cid:224) (cid:240)ộ dị biệt thấp nhằm loại bớt cÆc (cid:240)oạn cı sở thừa. Ngo(cid:224)i ra, (cid:240)ể sử dụng (cid:240)(cid:253)ợc, cÆc (cid:240)oạn cı sở n(cid:224)y cần phải (cid:240)(cid:253)ợc tổ chức theo một cấu trœc dữ liệu th(cid:237)ch hợp. Cấu trœc dữ liệu (cid:240)(cid:253)ợc sử dụng l(cid:224) cấu trœc c(cid:226)y ph(cid:226)n cấp.
2. Tổ chức cÆc (cid:240)oạn cı sở theo cấu trœc c(cid:226)y nhị ph(cid:226)n
X
,...,2,1
N
Chœng t(cid:244)i vận dụng giải thuật Hierarchical Agglemerative Clustering (HAC) (cid:240)ể liŒn kết cÆc (cid:240)oạn cı sở theo cấu trœc c(cid:226)y nhị ph(cid:226)n. Giai (cid:240)oạn n(cid:224)y cũng (cid:240)(cid:253)ợc coi l(cid:224) giai (cid:240)oạn ph(cid:226)n lớp cÆc (cid:240)oạn cı sở. 2.1. Giải thuật ph(cid:226)n lớp ph(cid:226)n cấp
ix l(cid:224) cÆc (cid:240)oạn cı sở .
,
, ix i Giai (cid:240)oạn khởi (cid:240)ộng
R
,...,2,1
x
0
i
i
C
Giả sử với
, ix i
N
P 0
B(cid:253)ớc 1. Tạo ph(cid:226)n cấp , với cÆc lớp
XP
iP ,(
j
)
(
,
)
B(cid:253)ớc 2. —ặt
i xxd
j
Trong (cid:240)(cid:243) : ( XP ) l(cid:224) ma trận k(cid:237)ch th(cid:253)ớc NxN , với
d l(cid:224) (cid:240)ộ (cid:240)o khÆc biệt giữa 2 (cid:240)oạn cı sở .
i CC ,
j
sao cho : B(cid:253)ớc 3. t=0 Giai (cid:240)oạn ph(cid:226)n lớp B(cid:253)ớc 1. t=t+1 B(cid:253)ớc 2. Chọn cặp
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
80
(
,
)
min
srCCd
),
(
,
,
,...,2,1
, rN
s
CCd i
j
r
s
i CC ,
j
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
qC v(cid:224) tạo một ph(cid:226)n cấp tR .
(
R
})
C {
}
R t
t
CC , { i
j
q
1
)(tP
)1
( tP
B(cid:253)ớc 3. Kết nạp v(cid:224)o lớp
B(cid:253)ớc 4. Cập nhật từ bằng 2 b(cid:253)ớc :
XoÆ cÆc d(cid:242)ng v(cid:224) cột t(cid:253)ıng ứng với 2 lớp vừa kết nạp. ThŒm d(cid:242)ng mới v(cid:224) cột mới chứa khoảng cÆch giữa lớp mới tạo v(cid:224) cÆc lớp cũ .
ix , (cid:240)ều ch(cid:253)a thuộc cøng một
B(cid:253)ớc 5. Lặp lại B1 cho (cid:240)ến khi n(cid:224)o cÆc
lớp .
2.2. Tạo liŒn kết l(cid:226)n cận
i CC ,
j
Trong b(cid:253)ớc 2 tại giai (cid:240)oạn ph(cid:226)n lớp của giải thuật ph(cid:226)n lớp ph(cid:226)n cấp , việc
chọn cặp (cid:240)ể (cid:240)ối sÆnh phụ thuộc v(cid:224)o dạng liŒn kết .
Chœng t(cid:244)i khảo sÆt 2 dạng liŒn kết l(cid:226)n cận : liŒn kết cho bảng mục lục v(cid:224) liŒn
kết cho bảng chỉ mục.
LiŒn kết cho bảng mục lục : chịu sự r(cid:224)ng buộc theo chiều thời gian, cÆc cặp (cid:240)(cid:253)ợc chọn (cid:240)ể (cid:240)ối sÆnh phải l(cid:224) những cặp kế tiếp nhau.
H(cid:236)nh 36 LiŒn kết l(cid:226)n cận cho bảng mục lục
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
81
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
LiŒn kết cho bảng chỉ mục kh(cid:244)ng chịu sự r(cid:224)ng buộc theo chiều thời gian, tất cả cÆc cặp c(cid:243) thể c(cid:243) (cid:240)ều (cid:240)(cid:253)ợc chọn (cid:240)ể (cid:240)ối sÆnh.
H(cid:236)nh 37 LiŒn kết l(cid:226)n cận cho bảng chỉ mục
2.3. —ặc tr(cid:253)ng v(cid:224) (cid:240)ộ (cid:240)o dị biệt giữa cÆc (cid:240)oạn cı sở trong liŒn kết
Chœng t(cid:244)i chọn cÆc (cid:240)ặc tr(cid:253)ng m(cid:224)u v(cid:224) (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng của (cid:240)oạn cı sở.
s
s
( xF
)
cd
,
m MhI s
,
,
i
—ặc tr(cid:253)ng của (cid:240)oạn cı sở xi :
s
scd l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u trung b(cid:236)nh của (cid:240)oạn cı sở
sI l(cid:224) ảnh trung b(cid:236)nh của (cid:240)oạn cı sở
m
sh l(cid:224) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh của (cid:240)oạn cı sở
sM l(cid:224) ảnh chuyển (cid:240)ộng trung b(cid:236)nh của (cid:240)oạn cı sở
Trong (cid:240)(cid:243) :
CÆc (cid:240)ặc tr(cid:253)ng n(cid:224)y (cid:240)ª (cid:240)(cid:253)ợc tr(cid:236)nh b(cid:224)y ở ch(cid:253)ıng 2 phần 7, trang 50 —ộ (cid:240)o dị biệt giữa 2 (cid:240)oạn cı sở
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
82
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
),...,
F
),
x
)
(
j
1
xF ( j
i
i
i
N
i
1
xF ( 0
,)
Giả sử (cid:240)oạn cı sở gồm c(cid:243) N (cid:240)ặc tr(cid:253)ng : xF ( N ..0 l(cid:224) (cid:240)ặc tr(cid:253)ng thứ j của xi
N
1
ld (
,
l
)
lFdw ( (
),
))
—ộ (cid:240)o dị biệt giữa 2 (cid:240)oạn cı sở la v(cid:224) lb :
b
a
i
i
lF ( i
b
a
0
i
,
Trong (cid:240)(cid:243) :
N
1
1
iw
i
0
wi l(cid:224) trọng số xÆc (cid:240)ịnh mức (cid:240)ộ quan trọng của (cid:240)ặc tr(cid:253)ng thứ i
d (cid:240)(cid:253)ợc chọn l(cid:224) khoảng cÆch L1
2.4. Cụ thể h(cid:243)a giai (cid:240)oạn ph(cid:226)n lớp trong giải thuật ph(cid:226)n lớp ph(cid:226)n cấp ở mục 2.1 ở
i CC ,
j
trŒn
B(cid:253)ớc 1. Chọn 2 (cid:240)oạn cı sỏ khoảng cÆch bØ nhất trong dªy liŒn kết
(cid:240)ể tạo nŒn nœt mới.
Sı (cid:240)ồ liŒn kết :
H(cid:236)nh 38 Dªy liŒn kết l(cid:226)n cận ban (cid:240)ầu
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
83
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 39Kết quả sau khi liŒn kết 2 (cid:240)oạn cı sở c(cid:243) khoảng cÆch bØ nhất
bn
B(cid:253)ớc 2. Cập nhật liŒn kết v(cid:224) khoảng cÆch giữa cÆch nœt mới v(cid:224) cũ trong liŒn kết
an v(cid:224)
n
,....,
l
..0[
p
]
a
p
0
i
Giả sử xØt cặp nœt kh(cid:244)ng l(cid:224) nœt cı sở
1
n
,....,
l
..0[ q
]
b
q
0
j
, l(cid:224) nœt cı sở ,
1
l l
i , l j , l
, l(cid:224) nœt cı sở ,
),
d
)
(
(
,
nnd a
b
nn , a
b
nn , a
b
max
min
d
,)
d
)
max
,
l
),
l
...0[
p
],1
j
q ...0[
(max
nn , a
b
i
j
i
ln , a
j
in , b
d
)
min
,
l
),
l
...0[
p
],1
j
q ...0[
(max
nn , a
b
i
j
ln , a
j
in , b
i
ld ( ld (
]1 , ]1 ,
Khoảng cÆch giữa 2 nœt kh(cid:244)ng l(cid:224) nœt cı sở (cid:240)(cid:253)ợc xÆc (cid:240)ịnh nh(cid:253) sau : (
B(cid:253)ớc 3. Tiếp tục B1 cho (cid:240)ến khi n(cid:224)o tất cả cÆc nœt (cid:240)ều (cid:240)ựıc xử l(cid:253).
Sau cøng chœng ta c(cid:243) (cid:240)(cid:253)ợc cấu trœc ph(cid:226)n cấp liŒn kết cÆc (cid:240)oạn cı sở dựa v(cid:224)o mức (cid:240)ộ t(cid:253)ıng tự giữa cÆc (cid:240)oạn cı sở
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
84
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 40Kết quả của giai (cid:240)oạn ph(cid:226)n lớp ph(cid:226)n cấp
3. X(cid:226)y dựng bảng mục lục v(cid:224) chỉ mục
Ở phần tr(cid:253)ớc, sau khi thực hiện giải thuật HAC, cÆc (cid:240)oạn cı sở (cid:240)ª (cid:240)(cid:253)ợc tổ chức theo cấu trœc c(cid:226)y nhị ph(cid:226)n. Tøy v(cid:224)o dạng liŒn kết m(cid:224) ta c(cid:243) c(cid:226)y nhị ph(cid:226)n của bảng mục lục hay c(cid:226)y nhị ph(cid:226)n của bảng chỉ mục. Tuy nhiŒn, v(cid:236) l(cid:224) c(cid:226)y nhị ph(cid:226)n, nŒn mỗi nœt chỉ c(cid:243) thể c(cid:243) tối (cid:240)a 2 nhÆnh con, khiến cho chiều cao của c(cid:226)y c(cid:243) thể lớn. Ngo(cid:224)i ra, c(cid:243) những (cid:240)oạn cı sở c(cid:243) (cid:240)ặc tr(cid:253)ng t(cid:253)ıng tự nhau nh(cid:253)ng thuộc ở những nœt khÆc nhau, g(cid:226)y kh(cid:243) khªn cho việc truy t(cid:236)m ở giai (cid:240)oạn sau.
Trong phần n(cid:224)y chœng t(cid:244)i c(cid:243) một số cải tiến (cid:240)ối với giải thuật ph(cid:226)n lớp ph(cid:226)n cấp giœp giảm chiều cao của cấu trœc ph(cid:226)n cấp, v(cid:224) giœp gom những (cid:240)oạn cı sở c(cid:243) (cid:240)ặc tr(cid:253)ng gần giống nhau th(cid:224)nh một nh(cid:243)m. Muốn nh(cid:253) vậy, cần phải gom những nœt gần
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
85
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
giống nhau cho thuộc v(cid:224)o cøng một nœt cha, v(cid:224) loại bỏ những nœt cha d(cid:253) thừa của những nœt giống nhau (cid:240)(cid:243).
Nœt cần loại bỏ dựa trŒn tiŒu chuẩn xØt (cid:240)ộ t(cid:253)ıng (cid:240)ồng v(cid:224) dị biệt với nœt cha của
n(cid:243). Trong quÆ tr(cid:236)nh tạo cấu trœc ph(cid:226)n cấp, ta c(cid:243):
),
),
d
d
(
nn , l
r
nn , l
r
max
min
l nn , r
),
),
d
d
(
Nœt pl (cid:240)(cid:253)ợc tạo lập v(cid:224) (cid:240)(cid:253)ợc liŒn kết 2 giÆ trị : ( l(cid:224) nœt con trÆi v(cid:224) phải của nœt pl
, cc l
, cc l
max
min
r
r
r
Nœt nl (cid:240)(cid:253)ợc tạo lập v(cid:224) (cid:240)(cid:253)ợc liŒn kết 2 giÆ trị: ( , cc l l(cid:224) nœt con trÆi v(cid:224) phải của nœt nl
p n [dmin, dmax]
[dmin, dmax]
nr nl n
cl
cr
H(cid:236)nh 41 Giả sử n l(cid:224) con của nœt p , xØt 2 (cid:240)ại l(cid:253)ợng :
d
d
n min
(
np ),
min
p min d
n min
d
d
n max
(
np ),
max
, thể hiện sự t(cid:253)ıng (cid:240)ồng giữa nœt p v(cid:224) nœt n
p max d
n max
, thể hiện sự dị biệt giữa nœt p v(cid:224) nœt n
max
min
Nœt n (cid:240)(cid:253)ợc loại bỏ nếu : v(cid:224)
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
86
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Khi nœt n bị loại bỏ , nœt con của nœt n l(cid:224) nœt c kh(cid:244)ng bị mất (cid:240)i m(cid:224) (cid:240)(cid:253)ợc liŒn kết với trở lại với nœt p. Sau b(cid:253)ớc n(cid:224)y , chiều cao của cấu trœc ph(cid:226)n cấp ban (cid:240)ầu (cid:240)(cid:253)ợc giảm (cid:240)Æng kể v(cid:224) ta c(cid:243) một cấu trœc ph(cid:226)n cấp mới, với cÆc nœt kh(cid:244)ng cı sở chứa cÆc (cid:240)oạn cı sở với (cid:240)ộ t(cid:253)ıng (cid:240)ồng cao v(cid:224) (cid:240)ộ dị biệt thấp. Tuỳ theo viŒc chọn liŒn kết l(cid:226)n cận cho bảng mục lục hoặc liŒn kết l(cid:226)n cận cho bảng chỉ mục m(cid:224) ta c(cid:243) bảng mục lục v(cid:224) chỉ mục cho (cid:240)oạn video.
H(cid:236)nh 42. C(cid:226)y sau khi rœt gọn
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
87
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
4. XÆc (cid:240)ịnh cÆc lớp của cÆc (cid:240)oạn cı sở v(cid:224) phần tử (cid:240)ại diện của lớp
4.1. Lớp của cÆc (cid:240)oạn cı sở
Sau b(cid:253)ớc rœt gọn c(cid:226)y ở trŒn, chœng ta c(cid:243) (cid:240)(cid:253)ợc bảng mục lục hoặc bảng chỉ mục, trong (cid:240)(cid:243) cÆc nœt t(cid:253)ıng tự nhau (cid:240)(cid:253)ợc gom th(cid:224)nh nh(cid:243)m v(cid:224) c(cid:243) cøng nœt cha. —ể c(cid:243) thể sử dụng cho việc truy t(cid:236)m, chœng t(cid:244)i tiến h(cid:224)nh xÆc (cid:240)ịnh cÆc lớp của cÆc (cid:240)oạn cı sở. Mỗi một lớp bao gồm những (cid:240)oạn cı sở c(cid:243) (cid:240)ặc tr(cid:253)ng gần giống nhau, do (cid:240)(cid:243), cÆc (cid:240)oạn cı sở (nœt lÆ) c(cid:243) cøng một nœt cha sẽ (cid:240)(cid:253)ợc nh(cid:243)m lại th(cid:224)nh một lớp với phần tử (cid:240)ại diện.
H(cid:236)nh 43
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
88
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
4.2. Phần tử (cid:240)ại diện của lớp
4.2.1 —ịnh nghĩa
Phần tử (cid:240)ại diện của lớp l(cid:224) một (cid:240)oạn cı sở thuộc lớp v(cid:224) (cid:240)ại diện cho to(cid:224)n bộ
iC ,{
n }..1
i
i
C
..1
m
}
i
i iS , { j
i
lớp (cid:240)(cid:243). 4.2.2 CÆch xÆc (cid:240)ịnh phần tử (cid:240)ại diện V —oạn video , trong (cid:240)(cid:243) Ci l(cid:224) cÆc lớp.
jS l(cid:224) cÆc (cid:240)oạn cı sở, mi l(cid:224) số (cid:240)oạn cı
Lớp , trong (cid:240)(cid:243)
sở c(cid:243) trong lớp Ci.
Trong mỗi lớp Ci , chọn phần tử (cid:240)ại diện Repi , trong (cid:240)(cid:243) Repi l(cid:224) (cid:240)oạn cı
sở trong lớp Ci.
m
i
m i
d
(Re
)
(
,
,)
..1[
m
]
Sp , i
i j
i SSd k
i j
i
k
j
j
1
1
Phần tử (cid:240)ại diện thoả :
C(cid:244)ng thức trŒn c(cid:243) nghĩa : phần tử (cid:240)ại diện l(cid:224) phần tử c(cid:243) tổng khoảng
cÆch (cid:240)ến cÆc phần tử c(cid:242)n lại trong lớp l(cid:224) nhỏ nhất.
5. Khung h(cid:236)nh ch(cid:237)nh (cid:240)ại diện cho (cid:240)oạn cı sở
5.1. Giới thiệu
CÆc (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở c(cid:243) thể (cid:240)ại diện cho (cid:240)oạn cı sở v(cid:224) døng trong việc so sÆnh với cÆc (cid:240)oạn cı sở khÆc. Ngo(cid:224)i ra, c(cid:242)n một cÆch khÆc (cid:240)ể so sÆnh cÆc (cid:240)oạn cı sở với nhau l(cid:224) sử dụng khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở. Khung h(cid:236)nh ch(cid:237)nh l(cid:224) một hoặc một số khung h(cid:236)nh nằm trong (cid:240)oạn cı sở, (cid:240)ại diện cho (cid:240)oạn cı sở (cid:240)(cid:243). CÆc (cid:240)ặc tr(cid:253)ng của khung h(cid:236)nh ch(cid:237)nh của cÆc (cid:240)oạn cı sở khÆc nhau (cid:240)(cid:253)ợc døng (cid:240)ể so sÆnh, v(cid:224) sự khÆc biệt giữa chœng (cid:240)(cid:253)ợc coi nh(cid:253) l(cid:224) sự khÆc biệt giữa những (cid:240)oạn cı sở (cid:240)(cid:243) với nhau.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
89
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
5.2. CÆch xÆc (cid:240)ịnh khung h(cid:236)nh ch(cid:237)nh
Trong mỗi (cid:240)oạn cı sở, thiết lập (cid:240)(cid:253)ờng cong sai biệt, cÆc khung h(cid:236)nh tại cÆc vị tr(cid:237) v(cid:253)ợt giÆ trị trung b(cid:236)nh của (cid:240)(cid:253)ờng cong sai biệt (cid:240)(cid:253)ợc chọn l(cid:224)m vị tr(cid:237) chốt (cid:240)ể tÆch mỗi (cid:240)oạn cı sở th(cid:224)nh cÆc (cid:240)oạn con. Trong mỗi (cid:240)oạn con, chọn khung h(cid:236)nh ở vị tr(cid:237) ở giữa l(cid:224)m khung h(cid:236)nh ch(cid:237)nh.
Một cÆch khÆc t(cid:236)m khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở l(cid:224) chọn những khung h(cid:236)nh
n(cid:224)o c(cid:243) tổng khoảng cÆch (cid:240)ến cÆc khung h(cid:236)nh c(cid:242)n lại trong (cid:240)oạn cı sở nhỏ nhất.
H(cid:236)nh 44 CÆc khung h(cid:236)nh trong (cid:240)oạn cı sở
H(cid:236)nh 45 Khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở trŒn
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
90
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
6. T(cid:243)m tắt ch(cid:253)ıng
Nội dung ch(cid:253)ıng n(cid:224)y chủ yếu tập trung v(cid:224)o việc gom nh(cid:243)m cÆc (cid:240)oạn cı sở, x(cid:226)y dựng cấu trœc c(cid:226)y ph(cid:226)n cấp, bảng mục lục, bảng chỉ mục v(cid:224) tiến h(cid:224)nh ph(cid:226)n lớp cÆc (cid:240)oạn cı sở, chọn phần tử (cid:240)ại diện của lớp. —ầu v(cid:224)o của giai (cid:240)oạn n(cid:224)y l(cid:224) cÆc (cid:240)oạn cı sở, (cid:240)ầu ra l(cid:224) cÆc c(cid:226)y c(cid:243) cấu trœc ph(cid:226)n cấp ph(cid:226)n lớp v(cid:224) c(cid:243) phần tử (cid:240)ại diện của mỗi lớp, tạo nŒn cı sở dữ liệu c(cid:243) thể truy vấn (cid:240)(cid:253)ợc.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
91
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
CH(cid:221)(cid:213)NG 5 TRUY VẤN DỮ LIỆU VIDEO SỐ
Ch(cid:253)ıng n(cid:224)y n(cid:243)i về cÆc thuật toÆn, ph(cid:253)ıng phÆp døng cho việc truy vấn, truy t(cid:236)m video số. Nội dung của ch(cid:253)ıng :
1. Giới thiệu 2. CÆc ph(cid:253)ıng phÆp truy vấn dữ liệu video số 3. Nhận xØt 4. T(cid:243)m tắt ch(cid:253)ıng
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
92
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1. Giới thiệu
Nh(cid:253) (cid:240)ª tr(cid:236)nh b(cid:224)y ở ch(cid:253)ıng tr(cid:253)ớc về x(cid:226)y dựng cấu trœc c(cid:226)y ph(cid:226)n cấp. Mục (cid:240)(cid:237)ch của việc x(cid:226)y dựng cÆc cấu trœc c(cid:226)y ph(cid:226)n cấp l(cid:224) giœp l(cid:253)u trữ nội dung (cid:240)oạn video số theo cấu trœc ph(cid:226)n cấp: video, lớp, (cid:240)oạn cı sở, khung h(cid:236)nh ch(cid:237)nh v(cid:224) truy t(cid:236)m trŒn (cid:240)oạn cı sở, khung h(cid:236)nh ch(cid:237)nh.
Sau khi (cid:240)ª c(cid:243) cı sở dữ liệu video (cid:240)(cid:253)ợc l(cid:253)u trữ phø hợp, (cid:240)ª c(cid:243) thể thực hiện việc
truy vấn.Việc truy vấn (cid:240)(cid:253)ợc thực hiện theo cÆc h(cid:236)nh thức sau:
Dữ liệu nhập v(cid:224)o l(cid:224) một (cid:240)oạn cı sở. Dữ liệu nhập l(cid:224) một (cid:240)oạn video clip (gồm một hoặc nhiều (cid:240)oạn cı sở).
Với dữ liệu nhập l(cid:224) (cid:240)oạn cı sở hoặc video clip nh(cid:253) trŒn, chœng t(cid:244)i tiến h(cid:224)nh truy vấn theo hai cÆch:
CÆch 1: dựa trŒn cÆc (cid:240)ặc tr(cid:253)ng to(cid:224)n cục (cid:240)ª c(cid:243) của (cid:240)oạn cı sở (cid:240)ể truy vấn. CÆch 2: dựa trŒn cÆc (cid:240)ặc tr(cid:253)ng của cÆc khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở (cid:240)ể truy vấn.
2. CÆc ph(cid:253)ıng phÆp truy vấn dữ liệu video số
2.1. Dữ liệu nhập l(cid:224) (cid:240)oạn cı sở
2.1.1 Kỹ thuật t(cid:236)m kiếm dựa trŒn (cid:240)oạn cı sở
Dựa v(cid:224)o (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở truy vấn QS (cid:240)ể xÆc (cid:240)ịnh lớp gần nhất với n(cid:243). Sau (cid:240)(cid:243) tiến h(cid:224)nh xếp hạng cÆc (cid:240)oạn cı sở t(cid:236)m (cid:240)(cid:253)ợc trong lớp (cid:240)ª chọn.QuÆ tr(cid:236)nh gồm cÆc b(cid:253)ớc sau:
B(cid:253)ớc 1:Rœt tr(cid:237)ch (cid:240)ặc tr(cid:253)ng cho (cid:240)oạn cı sở truy vấn
m
QS
QS
QS
QS
QSF (
)
cd {
,
I
,
h
,
M
}
—ặc tr(cid:253)ng của (cid:240)oạn cı sở truy vấn QS gồm (cid:240)ặc tr(cid:253)ng m(cid:224)u v(cid:224) (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng:
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
93
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
scd l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u trung b(cid:236)nh của (cid:240)oạn cı sở
sI l(cid:224) ảnh trung b(cid:236)nh của (cid:240)oạn cı sở
m
sh l(cid:224) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng trung b(cid:236)nh của (cid:240)oạn cı sở
sM l(cid:224) ảnh chuyển (cid:240)ộng trung b(cid:236)nh của (cid:240)oạn cı sở
Trong (cid:240)(cid:243) :
CÆc (cid:240)ặc tr(cid:253)ng n(cid:224)y (cid:240)ª (cid:240)(cid:253)ợc tr(cid:236)nh b(cid:224)y ở ch(cid:253)ıng 2 phần 7, trang 50
),...,
3..0
)},
),
{
j
B(cid:253)ớc 2: T(cid:237)nh (cid:240)ộ dị biệt giữa QS v(cid:224) cÆc phần tử (cid:240)ại diện của cÆc lớp.
SF ( f
SF ( 0
3
d
QS (
Re,
p
)
FQS ), (
(Re
p
))
i
Fdw ( j
j
j
i
j
0
Mỗi (cid:240)oạn cı sở gồm cÆc (cid:240)ặc tr(cid:253)ng sau: SF )( SF ( 3 l(cid:224) (cid:240)ặc tr(cid:253)ng thứ j của S.
jw l(cid:224) trọng số xÆc (cid:240)ịnh mức (cid:240)ộ quan trọng của (cid:240)ặc tr(cid:253)ng thứ j,
3
,1
1L .
Với
jw
0
j
d (cid:240)(cid:253)ợc chọn l(cid:224) khoảng cÆch
n ..1[
Re,
Re,
QS
QS
),
d
p
p
)
(
(
i
i
QS
B(cid:253)ớc 3:XÆc (cid:240)ịnh lớp gần nhất (cid:240)ối với QS d min{ ]}
C
S {
,
j
...1
m
}
B(cid:253)ớc 4: —ối sÆnh cÆc (cid:240)oạn cı sở trong lớp với (cid:240)oạn cı sở truy vấn QS v(cid:224) sắp xếp kết quả theo thứ tự tªng dần của (cid:240)ộ dị biệt giữa chœng với (cid:240)oạn cı sở truy vấn QS.
QS
QS j
QS
QS jS
,
d
SQS , (
)
d
SQS , (
),
j
...1[
m
]1
QS j
QS
QS j 1
trong (cid:240)(cid:243) l(cid:224) cÆc (cid:240)oạn cı sở trong lớp gần nhất với QS,
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
94
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.1.2 Kỹ thuật t(cid:236)m kiếm dựa trŒn khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở
Việc truy t(cid:236)m dựa trŒn cÆc (cid:240)ặc tr(cid:253)ng của (cid:240)oạn cı sở xØt (cid:240)ến yếu tố to(cid:224)n cục của dữ liệu trong to(cid:224)n bộ (cid:240)oạn cı sở, ch(cid:253)a xØt (cid:240)ến cÆc (cid:240)ặc tr(cid:253)ng cục bộ nổi trội (cid:240)ại diện cho (cid:240)oạn cı sở. V(cid:236) vậy sẽ c(cid:243) sự tồn tại cÆc (cid:240)oạn cı sở c(cid:243) sự biệt về to(cid:224)n cục lớn nh(cid:253)ng sự dị biệt về cục bộ thấp, do (cid:240)(cid:243) nếu tận dụng yếu tố cục bộ (cid:240)ể truy vấn cũng trợ giœp thŒm cho tiến tr(cid:236)nh truy vấn. QuÆ tr(cid:236)nh gồm cÆc b(cid:253)ớc sau:
B(cid:253)ớc 1: Tự (cid:240)ộng rœt tr(cid:237)ch cÆc khung h(cid:236)nh ch(cid:237)nh cho (cid:240)oạn cı sở truy vấn. Giả sử (cid:240)oạn cı sở truy vấn QS (cid:240)(cid:253)ợc (cid:240)ại diện bởi tập cÆc khung h(cid:236)nh
{
,
k
p }..1
F QS k
ch(cid:237)nh
QS
B(cid:253)ớc 2: Rœt tr(cid:237)ch (cid:240)ặc tr(cid:253)ng cho cÆc khung h(cid:236)nh ch(cid:237)nh.
kF gồm cÆc (cid:240)ặc tr(cid:253)ng m(cid:224)u, h(cid:236)nh dạng
—ặc tr(cid:253)ng của khung h(cid:236)nh ch(cid:237)nh
(
d
)
QS k
() c F
v(cid:224) chuyển (cid:240)ộng.
—ặc tr(cid:253)ng m(cid:224)u (cid:240)(cid:253)ợc chọn l(cid:224) l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u :
,
i
,...,1,0[
]71
i ),
QS FH ( k
), )
QS i , Fm ( k QS ( Fn E k
H
)72(
)
H )72( QS E Fn ( k
i ),
;5*i
Im D (
i
—ặc tr(cid:253)ng h(cid:236)nh dạng l(cid:224) l(cid:253)ợc (cid:240)ồ hệ số g(cid:243)c :
)
E In ( D
l(cid:224) số (cid:240)iểm ảnh thuộc biŒn cạnh c(cid:243) hệ số g(cid:243)c l(cid:224)
)
l(cid:224) tổng cÆc (cid:240)iểm ảnh thuộc biŒn cạnh.
( DIn
. l(cid:224) tổng số cÆc (cid:240)iểm ảnh của ảnh DI
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
95
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 46. —ặc tr(cid:253)ng h(cid:236)nh dạng
h
—ặc tr(cid:253)ng chuyển (cid:240)ộng (cid:240)(cid:253)ợc chọn l(cid:224) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng của khung h(cid:236)nh ch(cid:237)nh ứng với ph(cid:253)ıng ngang v(cid:224) ph(cid:253)ıng dọc:
]0[m F QS k
l(cid:224) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng của khung h(cid:236)nh ch(cid:237)nh ứng
h
với chuyển (cid:240)ộng ngang.
]1[m F QS k
l(cid:224) l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng của khung h(cid:236)nh ch(cid:237)nh ứng
với chuyển (cid:240)ộng dọc.
d
(
QS
Re,
p
)
d min{
(
QS
Re,
p
),
i
n ...1[
]}
QS
i
B(cid:253)ớc 3: XÆc (cid:240)ịnh lớp gần QSC (cid:240)ối với QS.
{
,
k
...1
N
}
QS F k
QS
Giả sử (cid:240)oạn cı sở QS (cid:240)(cid:253)ợc (cid:240)ại diện bởi tập cÆc khung h(cid:236)nh ch(cid:237)nh
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
96
ipRe
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
{
...1
N
}
i kF , k
Re ip
N
N
QS
QS
(
Re,
p
)
(
,
QS
)
1 QS Fdw k
ik
i
1 i Fdw k
il
0
k
0
l
d
(
QS
Re,
p
)
i
2
QSN l(cid:224) số khung h(cid:236)nh ch(cid:237)nh của QS.
Giả sử (cid:240)oạn cı sở (cid:240)(cid:253)ợc (cid:240)ại diện bởi tập cÆc khung h(cid:236)nh ch(cid:237)nh
ipRe
ipN Re
Re,
p
)
min{
,
..0
N
}1
QS Fd ( k
i
QS Fd ( k
i lF ), l
. l(cid:224) số khung h(cid:236)nh ch(cid:237)nh của
Re ip
QS
ipRe
kF (cid:240)ối với
QS
i
,
QS
)
min{
(
,
),
l
..0
N
}1
i Fd ( k
i FFd l k
QS
l(cid:224) (cid:240)ộ dị biệt của
kF (cid:240)ối
l(cid:224) (cid:240)ộ dị biệt của
ikw v(cid:224)
jlw thể hiện vai tr(cid:242) quan trọng của khung h(cid:236)nh ch(cid:237)nh trong
với QS.
(cid:240)ộ (cid:240)o (cid:240)ối sÆnh.
QSpRe
B(cid:253)ớc 4: —ối sÆnh cÆc (cid:240)oạn cı sở trong lớp QSC (Với phần tử (cid:240)ại diện l(cid:224)
) với QS v(cid:224) sắp xếp kết quả theo thứ tự tªng dần của (cid:240)ộ dị biệt giữa
C
S {
,
j
..1
m
}
QS
QS j
QS
QS jS
chœng với (cid:240)oạn cı sở truy vấn QS.
j
..1[
]1
d
SQS , (
)
d
SQS , (
)
trong (cid:240)(cid:243) l(cid:224) cÆc (cid:240)oạn cı sở,
QSm
QS j
QS 1 j
,
—ộ (cid:240)o dị biệt (cid:240)(cid:253)ợc t(cid:237)nh t(cid:253)ıng tự ở B(cid:253)ớc 3.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
97
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
H(cid:236)nh 47. Truy t(cid:236)m với dữ liệu nhập l(cid:224) (cid:240)oạn cı sở
2.2. Dữ liệu nhập l(cid:224) (cid:240)oạn video clip
QV
S {
,
j
..1
m
}
QV j
QV
QV jS
B(cid:253)ớc 1: Ph(cid:226)n (cid:240)oạn video clip theo thời gian theo cÆc ph(cid:253)ıng phÆp: ng(cid:253)ỡng, l(cid:253)ợc (cid:240)ồ m(cid:224)u, l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u.
Trong (cid:240)(cid:243) l(cid:224) cÆc (cid:240)oạn cı sở của QV.
B(cid:253)ớc 2: Rœt tr(cid:237)ch (cid:240)ặc tr(cid:253)ng cho cÆc (cid:240)oạn cı sở truy vấn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
98
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
QS
QS
QS
SF (
)
cd {
,
I
m Mh , QS
,
},
j
..1[
m
]
QV j
QV
—ặc tr(cid:253)ng của (cid:240)oạn cı sở truy vấn QS gồm cÆc (cid:240)ặc tr(cid:253)ng m(cid:224)u v(cid:224) (cid:240)ặc tr(cid:253)ng chuyển (cid:240)ộng:
B(cid:253)ớc 3: T(cid:237)nh (cid:240)ộ dị biệt giữa QV jS v(cid:224) cÆc phần tử (cid:240)ại diện của cÆc lớp.
SF )(
{
),...,
)},
jSF (
),
3..0
SF ( 0
SF ( 3
j
Mỗi (cid:240)oạn cı sở gồm cÆc 4 (cid:240)ặc tr(cid:253)ng:
3
Sd (
Re,
p
)
SFdw (
(
),
(Re
p
)),
j
..1[
m
]
QV j
i
k
k
QV j
F k
i
QV
kw l(cid:224) trọng số xÆc
k
0
3
,1
d
k
l(cid:224) (cid:240)ặc tr(cid:253)ng thứ j của S.
w
k
0
1L .
(cid:240)ịnh mức (cid:240)ộ quan trọng của (cid:240)ặc tr(cid:253)ng thứ k, (cid:240)(cid:253)ợc chọn l(cid:224)
khoảng cÆch của
jQVC
Sd (
Re,
p
)
min{
Sd (
Re,
p
),
i
n ..1[
]},
j
..1[
m
]
QV j
QV
QV j
i
QV
j
. B(cid:253)ớc 4: XÆc (cid:240)ịnh lớp gần nhất (cid:240)ối với QV jS
jQVC
B(cid:253)ớc 5: —ối sÆnh cÆc (cid:240)oạn cı sở trong lớp với QV jS v(cid:224) sắp xếp kết quả
j
C
S {
,
k
..1[
m
]}
. theo thứ tự tªng dần của (cid:240)ộ dị biệt giữa chœng với (cid:240)oạn cı sở truy vấn QV jS
QV
QV k
QS
j
j
jQV
,
kS
,
jQVC
j
Sd (
,
S
)
Sd (
,
S
),
k
..1[
m
],1
j
..1[
m
]
QV j
QV k
QV j
QV
QV
j
QV j 1 k
trong (cid:240)(cid:243) l(cid:224) cÆc (cid:240)oạn cı sở trong lớp
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
99
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
3. Kết quả thực nghiệm Chœng t(cid:244)i thử nghiệm trŒn cÆc (cid:240)oạn video về b(cid:243)ng (cid:240)Æ, thời sự, v(cid:224) thế giới (cid:240)ộng vật.
Dạng nhập liệu
—ộ ch(cid:237)nh xÆc (%) —ộ trung thực (%)
70 75
72 74
75
71
73
74
74
76
Ảnh tĩnh —oạn cı sở (với (cid:240)ặc tr(cid:253)ng to(cid:224)n cục) —oạn cı sở ((cid:240)(cid:253)ợc (cid:240)ại diện bởi cÆc khung h(cid:236)nh ch(cid:237)nh) —oạn video clip ((cid:240)(cid:253)ợc (cid:240)ại diện bởi cÆc khung h(cid:236)nh ch(cid:237)nh) —oạn video clip ((cid:240)(cid:253)ợc (cid:240)ại diện bởi cÆc khung h(cid:236)nh ch(cid:237)nh)
Bảng 2. Kết quả truy t(cid:236)m
4. Nhận xØt
M(cid:244) h(cid:236)nh truy t(cid:236)m hoạt (cid:240)ộng chủ yếu dựa trŒn (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở v(cid:224)
dựa trŒn (cid:240)ặc tr(cid:253)ng của khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở.
Ph(cid:253)ıng phÆp dựa trŒn cÆc (cid:240)ặc tr(cid:253)ng của (cid:240)oạn cı sở c(cid:243) (cid:253)u (cid:240)iểm l(cid:224) xØt (cid:240)ến yếu tố to(cid:224)n cục của dữ liệu trong to(cid:224)n bộ (cid:240)oạn cı sở. Ph(cid:253)ıng phÆp n(cid:224)y hiệu quả (cid:240)ối với những (cid:240)oạn cı sở m(cid:224) cÆc khung h(cid:236)nh của n(cid:243) kh(cid:244)ng khÆc nhau nhiều hay cÆc (cid:240)oạn cı sở ngắn, chứa (cid:237)t khung h(cid:236)nh, v(cid:236) khi (cid:240)(cid:243) cÆc (cid:240)ặc tr(cid:253)ng của cả (cid:240)oạn gần giống với (cid:240)ặc tr(cid:253)ng của mỗi khung h(cid:236)nh trong (cid:240)oạn cı sở (cid:240)(cid:243). —a số cÆc (cid:240)oạn cı sở chứa những khung h(cid:236)nh kh(cid:244)ng khÆc nhau nhiều, do (cid:240)(cid:243) ph(cid:253)ıng phÆp n(cid:224)y l(cid:224) một cÆch tốt (cid:240)ể truy t(cid:236)m dữ liệu video trong phần lớn cÆc tr(cid:253)ờng hợp.
Tuy nhiŒn, (cid:240)ối với những (cid:240)oạn cı sở t(cid:253)ıng (cid:240)ối d(cid:224)i với nhiều khung h(cid:236)nh, hay c(cid:243) sự khÆc biệt kh(cid:244)ng nhỏ giữa một số khung h(cid:236)nh trong (cid:240)oạn (chẳng hạn giữa những khung
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
100
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
h(cid:236)nh (cid:240)ầu v(cid:224) khung h(cid:236)nh cuối của (cid:240)oạn cı sở) th(cid:236) ph(cid:253)ıng phÆp truy t(cid:236)m dựa trŒn (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở kh(cid:244)ng hiệu quả lắm v(cid:236) lœc n(cid:224)y (cid:240)ặc tr(cid:253)ng to(cid:224)n cục kh(cid:244)ng (cid:240)ại diện cho tất cả cÆc khung h(cid:236)nh của (cid:240)oạn cı sở. Trong tr(cid:253)ờng hợp n(cid:224)y, ph(cid:253)ıng phÆp truy t(cid:236)m dựa trŒn (cid:240)ặc tr(cid:253)ng của cÆc khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở tỏ ra hiệu quả hın. Ph(cid:253)ıng phÆp n(cid:224)y xØt cÆc (cid:240)ặc tr(cid:253)ng cục bộ trong (cid:240)oạn cı sở, những khung h(cid:236)nh ch(cid:237)nh (cid:240)ại diện cho những vøng t(cid:253)ıng tự nhau trong (cid:240)oạn cı sở, do (cid:240)(cid:243) c(cid:243) thể (cid:240)ại diện cho to(cid:224)n bộ (cid:240)oạn.
Hai ph(cid:253)ıng phÆp n(cid:224)y bổ sung cho nhau, giœp truy t(cid:236)m dữ liệu video vừa theo cÆc (cid:240)ặc tr(cid:253)ng to(cid:224)n cục, vừa theo cÆc (cid:240)ặc tr(cid:253)ng cục bộ. Do (cid:240)(cid:243) sử dụng cả 2 ph(cid:253)ıng phÆp n(cid:224)y (cid:240)ể truy t(cid:236)m sẽ mang lại kết quả tốt hın l(cid:224) sử dụng riŒng lẽ. 5. T(cid:243)m tắt ch(cid:253)ıng
Nội dung ch(cid:237)nh của ch(cid:253)ıng n(cid:224)y l(cid:224) n(cid:243)i về truy vấn dữ liệu video. —(cid:226)y l(cid:224) giai (cid:240)oạn quan trọng, sử dụng kết quả của những giai (cid:240)oạn tr(cid:253)ớc (cid:240)ể cho ra kết quả thấy (cid:240)(cid:253)ợc v(cid:224) c(cid:243) (cid:253) nghĩa với ng(cid:253)ời sử dụng.
M(cid:244) h(cid:236)nh truy t(cid:236)m của chœng t(cid:244)i hoạt (cid:240)ộng chủ yếu dựa trŒn :
CÆc (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của cÆc (cid:240)oạn cı sở CÆc (cid:240)ặc tr(cid:253)ng của cÆc khung h(cid:236)nh ch(cid:237)nh của (cid:240)oạn cı sở
CÆc (cid:240)ặc tr(cid:253)ng trŒn (cid:240)(cid:253)ợc t(cid:237)nh toÆn từ những giai (cid:240)oạn tr(cid:253)ớc nh(cid:253) giai (cid:240)oạn ph(cid:226)n
(cid:240)oạn cı sở, giai (cid:240)oạn x(cid:226)y dựng c(cid:226)y ph(cid:226)n cấp ph(cid:226)n lớp. Mỗi cÆch truy t(cid:236)m (cid:240)ều c(cid:243) (cid:253)u (cid:240)iểm v(cid:224) khuyết (cid:240)iểm v(cid:224) (cid:240)(cid:253)ợc ứng dụng cho những tr(cid:253)ờng hợp khÆc nhau. CÆch truy t(cid:236)m hiệu quả nhất l(cid:224) kết hợp cÆc cÆch truy t(cid:236)m lại (cid:240)ể c(cid:243) (cid:240)(cid:253)ợc kết quả tốt.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
101
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
CH(cid:221)(cid:213)NG 6 HỆ THỐNG —ˆ C(cid:192)I —ẶT
Ch(cid:253)ıng n(cid:224)y giới thiệu ch(cid:253)ıng tr(cid:236)nh (cid:240)ª c(cid:224)i (cid:240)ặt, cÆc chức nªng ch(cid:237)nh của ch(cid:253)ıng tr(cid:236)nh v(cid:224) h(cid:253)ớng dẫn sử dụng, cÆc thuật toÆn (cid:240)ª c(cid:224)i (cid:240)ặt. Nội dung của ch(cid:253)ıng :
1. CÆc chức nªng ch(cid:237)nh v(cid:224) h(cid:253)ớng dẫn sử dụng ch(cid:253)ıng tr(cid:236)nh. 2. CÆc thuật toÆn c(cid:224)i (cid:240)ặt
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
102
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1. CÆc chức nªng ch(cid:237)nh v(cid:224) h(cid:253)ớng dẫn sử dụng ch(cid:253)ıng tr(cid:236)nh
Ch(cid:253)ıng tr(cid:236)nh thực hiện hai giai (cid:240)oạn: Giai (cid:240)oạn tạo cı sở dữ liệu:
Dữ liệu (cid:240)ầu v(cid:224)o của giai (cid:240)oạn n(cid:224)y: L(cid:224) một (cid:240)oạn video số døng (cid:240)ể tạo cı sở dữ liệu, v(cid:224) lĩnh vực m(cid:224) (cid:240)oạn video n(cid:224)y liŒn quan (cid:240)ến (Thể thao, thời sự, thề giới (cid:240)ộng vật(cid:133)). Bởi v(cid:236) phải nhập v(cid:224)o th(cid:244)ng tin về lĩnh vực của (cid:240)oạn video số (cid:240)(cid:243), l(cid:224) nhằm l(cid:224)m giảm (cid:240)i thời gian chi ph(cid:237) t(cid:236)m kiếm sau n(cid:224)y, bằng cÆch chœng ta sẽ bỏ qua t(cid:236)m kiếm cÆc cı sở dữ liệu thuộc cÆc lĩnh vực kh(cid:244)ng liŒn quan tới lĩnh vực m(cid:224) ng(cid:253)ời døng muốn truy vấn sau n(cid:224)y. Dữ liệu (cid:240)ầu ra l(cid:224) : Th(cid:244)ng tin chi tiết về cÆc (cid:240)oạn cı sở, cÆc (cid:240)ặc tr(cid:253)ng về m(cid:224)u, chuyển (cid:240)ộng, về c(cid:226)y chỉ mục v(cid:224) c(cid:226)y mục lục, v(cid:224) lĩnh vực của (cid:240)oạn video (cid:240)(cid:243) (cid:240)(cid:253)ợc l(cid:253)u xuống cı sở dữ liệu trŒn (cid:240)ĩa cứng.
Giai (cid:240)oạn truy vấn:
Dữ liệu (cid:240)ầu v(cid:224)o của giai (cid:240)oạn n(cid:224)y:c(cid:243) 3 dạng : (cid:240)oạn cı sở của cı sở dữ liệu c(cid:243) sẵn, một (cid:240)oạn video clip hoặc một file ảnh bitmap chứa nội dung cần truy vấn. Dữ liệu (cid:240)ầu ra của giai (cid:240)oạn n(cid:224)y : Th(cid:244)ng tin cÆc (cid:240)oạn cı sở trong cı sở dữ liệu thuộc về cı sở dữ liệu n(cid:224)o v(cid:224) (cid:240)ộ sai biệt của cÆc (cid:240)oạn cı sở (cid:240)(cid:243) so với th(cid:244)ng tin của (cid:240)oạn video cần t(cid:236)m. V(cid:224) ng(cid:253)ời døng c(cid:243) thể rœt tr(cid:237)ch cÆc (cid:240)oạn cı sở t(cid:236)m (cid:240)(cid:253)ợc ghi ra file *.avi v(cid:224) l(cid:253)u xuống (cid:240)ĩa cứng.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
103
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
M(cid:224)n h(cid:236)nh ch(cid:237)nh của ch(cid:253)ıng tr(cid:236)nh nh(cid:253) sau:
H(cid:236)nh 48 M(cid:224)n h(cid:236)nh ch(cid:237)nh
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
104
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.1. Giới thiệu sı về Giao diện của ch(cid:253)ıng tr(cid:236)nh.
1.1.1 Ch(cid:253)ıng tr(cid:236)nh c(cid:243) thanh Menubar nh(cid:253) sau:
H(cid:236)nh 49 Menubar
Tập tin: Trong menu Item n(cid:224)y gồm c(cid:243) cÆc item sau:
Tạo Mới Project: Chức nªng n(cid:224)y cho phØp chœng ta tạo một Project mới. Mở Project: Chức nªng n(cid:224)y døng (cid:240)ể mở một Project (cid:240)ª c(cid:243) sẵn. —(cid:243)ng Project: —(cid:243)ng lại Project. ThŒm Database: Chức nªng n(cid:224)y døng (cid:240)ể thŒm database v(cid:224)o tập database của Project hiện tại. ThoÆt : Kết thœc ứng dụng.
Xem
Menu (cid:150) Item n(cid:224)y døng (cid:240)ể xem cÆc th(cid:244)ng tin ch(cid:237)nh sau:
Xem ảnh của từng (cid:240)oạn cı sở : Chức nªng n(cid:224)y døng (cid:240)ể xem chi tiết tất cả cÆc ảnh của một (cid:240)oạn cı sở. Xem video của (cid:240)oạn cı sở: Chức nªng n(cid:224)y cho phØp bạn xem (cid:240)oạn video của từng (cid:240)oạn cı sở. Xem (cid:240)ồ thị biểu diễn (cid:240)ộ chŒnh lệch : Cho phØp xem (cid:240)ồ thị biểu diễn (cid:240)ộ chŒnh lệch của l(cid:253)ợc (cid:240)ồ Histogram.
Ph(cid:226)n t(cid:237)ch shot Chức nªng n(cid:224)y døng trong việc ph(cid:226)n (cid:240)oạn video số th(cid:224)nh cÆc (cid:240)oạn cı sở. Ph(cid:226)n (cid:240)oạn : Chức nªng n(cid:224)y døng (cid:240)ể chọn ph(cid:253)ıng phÆp ph(cid:226)n (cid:240)oạn, khi chọn chức nªng n(cid:224)y th(cid:236) một hộp thoại sẽ xuất hiện.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
105
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Th(cid:244)ng tin về cÆc shot: Chức nªng n(cid:224)y cho phØp bạn xem th(cid:244)ng tin về cÆc (cid:240)oạn cı sở thu (cid:240)(cid:253)ợc sau khi ph(cid:226)n (cid:240)oạn video số. Morphology (cid:150) WaterShed : Chức nªng n(cid:224)y døng (cid:240)ể ph(cid:226)n (cid:240)oạn (cid:240)oạn video số một cÆch tự (cid:240)ộng.
C(cid:244)ng cụ: Trong Menu (cid:150) Item n(cid:224)y cung cấp cÆc chức nªng hổ trợ thŒm trong quÆ tr(cid:236)nh duyệt cũng nh(cid:253) rœt tr(cid:237)ch th(cid:244)ng tin. Truy vấn: Trong Menu (cid:150) Item n(cid:224)y cung cấp cÆc chức nªng hổ trợ truy vấn th(cid:244)ng tin dựa v(cid:224)o nội dung.
—oạn cı sở : Chức nªng n(cid:224)y døng (cid:240)ể truy vấn trŒn databases với dữ liệu nhập døng (cid:240)ể truy vấn l(cid:224) cÆc (cid:240)oạn cı sở , nhằm kiểm chứng v(cid:224) (cid:240)Ænh giÆ kết quả t(cid:236)m kiếm. —oạn video clip: Chức nªng n(cid:224)y døng (cid:240)ể truy vấn th(cid:244)ng tin trŒn databases với dữ nhập døng (cid:240)ể truy vấn l(cid:224) một (cid:240)oạn video clip. Dựa v(cid:224)o ảnh tĩnh : Chức nªng n(cid:224)y døng (cid:240)ể truy vấn th(cid:244)ng tin với dữ liệu l(cid:224) một ảnh tĩnh (Ảnh Bitmap).
C(cid:226)y
Trong Menu (cid:150) Item n(cid:224)y cung cấp cÆc chức nªng hổ trợ x(cid:226)y dựng c(cid:226)y Mục lục v(cid:224) c(cid:226)y Chỉ mục.
X(cid:226)y dựng c(cid:226)y : Chức nªng n(cid:224)y døng (cid:240)ể rœt tr(cid:237)ch cÆc (cid:240)ặc tr(cid:253)ng trŒn cÆc (cid:240)oạn cı sở (cid:240)ể x(cid:226)y dựng c(cid:226)y Mục lục v(cid:224) c(cid:226)y Chỉ mục. C(cid:226)y ToC: Chức nªng n(cid:224)y cho bạn xem c(cid:226)y Mục lục v(cid:224) bạn c(cid:243) thể duyệt v(cid:224) xem th(cid:244)ng tin từng node trŒn c(cid:226)y. C(cid:226)y Index: Chức nªng n(cid:224)y cho bạn xem c(cid:226)y Chỉ mục v(cid:224) bạn c(cid:243) thể duyệt v(cid:224) xem th(cid:244)ng tin từng node trŒn c(cid:226)y.
Xem thống kŒ
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
106
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
Trong Menu (cid:150) Item n(cid:224)y cung cấp cÆc chức nªng hổ trợ xem th(cid:244)ng tin về cÆc (cid:240)ặc tr(cid:253)ng của (cid:240)oạn video v(cid:224) cÆc kết quả Morphology (cid:150) Watershed. Giœp (cid:240)ỡ H(cid:253)ớng dẫn sử dụng ch(cid:253)ıng tr(cid:236)nh v(cid:224) th(cid:244)ng tin về nh(cid:243)m. Ng(cid:244)n Ngữ
Cho phØp bạn chọn ng(cid:244)n ngữ cho giao diện ( c(cid:243) 2 ng(cid:244)n ngữ : Tiếng Việt v(cid:224) Tiếng Anh ).
1.1.2 Ch(cid:253)ıng tr(cid:236)nh c(cid:243) thanh Toolbar nh(cid:253) sau:
H(cid:236)nh 50 Toolbar
: ThŒm Database.
: Xem ảnh của từng (cid:240)oạn cı sở.
: Xem video của (cid:240)oạn cı sở.
: X(cid:226)y dựng c(cid:226)y.
:C(cid:226)y Mục lục.
: C(cid:226)y Chỉ mục.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
107
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2. CÆc chức nªng ch(cid:237)nh:
—ể tr(cid:236)nh b(cid:224)y cÆc chức nªng ch(cid:237)nh của ch(cid:253)ıng tr(cid:236)nh, chœng t(cid:244)i chọn (cid:240)oạn video c(cid:243) tŒn l(cid:224) Football_1.avi 1.2.1. Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng video số th(cid:224)nh cÆc (cid:240)oạn cı sở bằng 4 ph(cid:253)ıng phÆp:
ph(cid:253)ıng phÆp l(cid:253)ợc (cid:240)ồ m(cid:224)u cổ (cid:240)iển sử dụng một ng(cid:253)ỡng, ph(cid:253)ıng phÆp l(cid:253)ợc (cid:240)ồ m(cid:224)u sử dụng 2 ng(cid:253)ỡng, ph(cid:253)ıng phÆp l(cid:253)ợc (cid:240)ồ m(cid:224)u Æp dụng toÆn tử h(cid:236)nh thÆi học v(cid:224) giải thuật Watershed, l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u.
Với input l(cid:224) (cid:240)oạn video clip trŒn.
H(cid:236)nh 51 Ba lựa chọn ph(cid:226)n (cid:240)oạn
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
108
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.2. Duyệt cÆc (cid:240)oạn cở sở:
Với th(cid:244)ng tin thu (cid:240)(cid:253)ợc từ việc ph(cid:226)n (cid:240)oạn (cid:240)oạn video clip th(cid:224)nh cÆc (cid:240)oạn cı sở ở b(cid:253)ớc 1.2.1 , m(cid:224)n h(cid:236)nh d(cid:253)ới (cid:240)(cid:226)y n(cid:243) (cid:240)ang thực hiện việc xem (cid:240)oạn cı sở thứ 7 của (cid:240)oạn video clip. V(cid:224) (cid:240)ể xem (cid:240)oạn cı sở n(cid:224)o, chœng ta chỉ cần nhấn chuột v(cid:224)o h(cid:236)nh t(cid:253)ıng ứng với (cid:240)oạn cı sở ở ph(cid:237)a bŒn tay phải, sau (cid:240)(cid:243) nhấn Button play (cid:240)ể xem.
H(cid:236)nh 52.Duyệt cÆc (cid:240)oạn cı sở
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
109
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.3. Xem cÆc khung h(cid:236)nh từng (cid:240)oạn cı sở:
Với th(cid:244)ng tin thu (cid:240)(cid:253)ợc từ việc ph(cid:226)n (cid:240)oạn (cid:240)oạn video trŒn th(cid:224)nh cÆc (cid:240)oạn cı
sở ở b(cid:253)ớc 1.2.1 , m(cid:224)n h(cid:236)nh d(cid:253)ới (cid:240)(cid:226)y n(cid:243) (cid:240)ang thực hiện việc xem tất cả cÆc khung h(cid:236)nh của (cid:240)oạn cı sở thứ 2 của (cid:240)oạn video v(cid:224) (cid:240)oạn n(cid:224)y c(cid:243) 14 khung h(cid:236)nh. —ể xem cÆc Khung h(cid:236)nh của (cid:240)oạn cı sở n(cid:224)o, chœng ta chỉ cần nhấn chọn ở hộp sổ xuống c(cid:243) nhªn l(cid:224) ID của Shot, sau (cid:240)(cid:243) nhấn button Xem.
H(cid:236)nh 53. Xem cÆc khung h(cid:236)nh của (cid:240)oạn cı sở
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
110
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.4. X(cid:226)y dựng cấu trœc c(cid:226)y Chỉ mục v(cid:224) c(cid:226)y Mục lục.
Với việc ph(cid:226)n (cid:240)oạn nh(cid:253) trŒn , th(cid:236) 2 c(cid:226)y Mục lục v(cid:224) c(cid:226)y Chỉ mục (cid:240)(cid:253)ợc x(cid:226)y dựng dựa trŒn giải thuật Hierarchical Agglomerative Clustering . Sau khi x(cid:226)y dựng hai c(cid:226)y Mục lục v(cid:224) Chỉ mục c(cid:243) h(cid:236)nh dạng nh(cid:253) sau:
1.2.4.1 C(cid:226)y Mục lục:
H(cid:236)nh 54
C(cid:226)y Mục lục (cid:240)(cid:253)ợc x(cid:226)y dựng dựa trŒn thuật giải HAC v(cid:224) bảo (cid:240)ảm tr(cid:236)nh tự của
thời gian.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
111
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.4.2 C(cid:226)y Chỉ mục:
H(cid:236)nh 55
KhÆc với c(cid:226)y Mục lục, c(cid:226)y Chỉ mục n(cid:243) thực hiện gom cÆc (cid:240)oạn cı sở c(cid:243) cøng
nội dung th(cid:224)nh một cluster .
1.2.5. Chức nªng thŒm v(cid:224) tạo mới cı sở dữ liệu :
CÆc th(cid:244)ng tin thu (cid:240)(cid:253)ợc từ việc ph(cid:226)n t(cid:237)ch (cid:240)oạn video (cid:240)ể tạo cı sở dữ liệu bao gồm : th(cid:244)ng tin chi tiết về cÆc (cid:240)oạn cı sở, cÆc (cid:240)ặc tr(cid:253)ng về m(cid:224)u, chuyển (cid:240)ộng, về c(cid:226)y chỉ mục v(cid:224) c(cid:226)y mục lục, v(cid:224) lĩnh vực của (cid:240)oạn video (cid:240)(cid:243) .cÆc th(cid:244)ng tin n(cid:224)y sẽ (cid:240)(cid:253)ợc l(cid:253)u xuống tạo nŒn một cı sở dữ liệu mới trong tập cı sở dữ liệu ban (cid:240)ầu c(cid:243) sẵn. Nếu ch(cid:253)a c(cid:243) cı sở dữ liệu c(cid:243) sẵn th(cid:236) cÆc th(cid:244)ng tin n(cid:224)y sẽ (cid:240)(cid:253)ợc l(cid:253)u trữ trong một dự Æn mới (Project).
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
112
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.6. Truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung:
Truy t(cid:236)m theo (cid:240)oạn cı sở, theo (cid:240)oạn video clip v(cid:224) theo ảnh tĩnh. Việc truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o cấu trœc c(cid:226)y Chỉ mục (cid:240)ª x(cid:226)y dựng ở b(cid:253)ớc trŒn nhằm giảm thời gian v(cid:224) chi ph(cid:237) t(cid:236)m kiếm. Giœp cho con ng(cid:253)ời thao tÆc t(cid:236)m kiếm một cÆch nhanh v(cid:224) (cid:240)ın giªn hın trŒn tập dữ liệu video số lớn.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
113
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.6.1 Truy vấn với dữ liệu nhập v(cid:224)o l(cid:224) (cid:240)oạn cı sở:
H(cid:236)nh 56. Truy vấn với dữ liệu nhập l(cid:224) (cid:240)oạn cı sở
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
114
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.6.2 Truy vấn với dữ liệu nhập l(cid:224) Video Clip:
H(cid:236)nh 57. Truy vấn với dữ liệu nhập l(cid:224) (cid:240)oạn video
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
115
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1.2.6.3 Truy vấn với dữ liệu nhập l(cid:224) ảnh tĩnh:
H(cid:236)nh 58. Truy vấn với dữ liệu nhập l(cid:224) ảnh tĩnh
2. CÆc thuật toÆn c(cid:224)i (cid:240)ặt
Sau (cid:240)(cid:226)y l(cid:224) cÆc thuật toÆn (cid:240)ª (cid:240)(cid:253)ợc c(cid:224)i (cid:240)ặt trong ch(cid:253)ıng tr(cid:236)nh. CÆc thuật toÆn n(cid:224)y (cid:240)ều (cid:240)(cid:253)ợc nhắc (cid:240)ến trong cÆc ch(cid:253)ıng tr(cid:253)ớc v(cid:224) (cid:240)(cid:253)ợc c(cid:224)i (cid:240)ặt giống nh(cid:253) l(cid:253) thuyết (cid:240)ª tr(cid:236)nh b(cid:224)y. 2.1. Kh(cid:244)ng gian m(cid:224)u :
Chœng t(cid:244)i sử dụng kh(cid:244)ng gian m(cid:224)u HSV (cid:240)ª (cid:240)(cid:253)ợc (cid:240)ịnh l(cid:253)ợng th(cid:224)nh 162 m(cid:224)u thay thế cho kh(cid:244)ng gian RGB.
2.2. CÆc thuật toÆn ph(cid:226)n (cid:240)oạn
2.2.1. Ph(cid:226)n (cid:240)oạn theo l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục sử dụng 2 ng(cid:253)ỡng 2.2.2. ToÆn tử h(cid:236)nh thÆi học, giải thuật watershed, v(cid:224) Æp dụng v(cid:224)o việc ph(cid:226)n (cid:240)oạn theo l(cid:253)ợc (cid:240)ồ m(cid:224)u to(cid:224)n cục, l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
116
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
2.3. CÆc thuật toÆn t(cid:237)nh (cid:240)ặc tr(cid:253)ng 2.3.1. —ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ m(cid:224)u 2.3.2. —ặc tr(cid:253)ng l(cid:253)ợc (cid:240)ồ tự t(cid:253)ıng quan m(cid:224)u 2.3.3. —ặc tr(cid:253)ng chuyển (cid:240)ộng, ảnh chuyển (cid:240)ộng, l(cid:253)ợc (cid:240)ồ chuyển (cid:240)ộng 2.3.4. —ặc tr(cid:253)ng h(cid:236)nh dạng
2.4. CÆc thuật toÆn x(cid:226)y dựng c(cid:226)y ph(cid:226)n lớp ph(cid:226)n cấp
2.4.1. Thuật toÆn t(cid:236)m phần tự (cid:240)ại diện 2.4.2. Thuật toÆn t(cid:236)m khung h(cid:236)nh ch(cid:237)nh
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
117
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
CH(cid:221)(cid:213)NG 7 KẾT LUẬN
Ch(cid:253)ıng n(cid:224)y n(cid:243)i về cÆc kết quả (cid:240)ª (cid:240)ạt (cid:240)(cid:253)ợc, v(cid:224) những kiến nghị về h(cid:253)ớng phÆt
triển tiếp theo.
Nội dung của ch(cid:253)ıng :
1. CÆc kết quả (cid:240)ạt (cid:240)(cid:253)ợc 2. H(cid:253)ớng phÆt triển
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
118
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
1. CÆc kết quả (cid:240)ạt (cid:240)(cid:253)ợc
Ch(cid:253)ıng tr(cid:236)nh (cid:240)ª c(cid:224)i (cid:240)ặt c(cid:243) thể (cid:240)(cid:253)ợc sử dụng (cid:240)ể ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số, tạo th(cid:224)nh cı sở dữ liệu cấp cao l(cid:224) cÆc c(cid:226)y ph(cid:226)n cấp ph(cid:226)n lớp v(cid:224) l(cid:253)u xuống (cid:240)ĩa cứng (cid:240)ể sử dụng sau n(cid:224)y. Dữ liệu video (cid:240)(cid:253)ợc tạo ra bằng cÆch sử dụng 3 ph(cid:253)ıng phÆp cải tiến khÆc nhau trong giai (cid:240)oạn ph(cid:226)n (cid:240)oạn video v(cid:224) sử dụng 4 (cid:240)ặc tr(cid:253)ng to(cid:224)n cục của (cid:240)oạn cı sở trong giai (cid:240)oạn ph(cid:226)n lớp. Ngo(cid:224)i ra, ch(cid:253)ıng tr(cid:236)nh c(cid:242)n t(cid:237)ch hợp chức nªng t(cid:236)m kiếm truy vấn video theo nội dung với cÆc kiểu input : (cid:240)oạn cı sở v(cid:224) (cid:240)oạn video. Sau khi t(cid:236)m kiếm, ch(cid:253)ıng tr(cid:236)nh c(cid:243) thể thực hiện việc l(cid:253)u kết quả l(cid:224) những (cid:240)oạn cı sở t(cid:236)m (cid:240)(cid:253)ợc, xuất ra tập tin video (cid:240)ể l(cid:253)u trữ.
2. H(cid:253)ớng phÆt triển
C(cid:243) thể phÆt triển tiếp (cid:240)ể ch(cid:253)ıng tr(cid:236)nh c(cid:243) khả nªng gÆn nhªn tự (cid:240)ộng cÆc (cid:240)oạn video. V(cid:224) nh(cid:253) vậy, sau khi ph(cid:226)n (cid:240)oạn, mỗi (cid:240)oạn cı sở c(cid:242)n (cid:240)(cid:253)ợc gắn thŒm nhªn nh(cid:253) (cid:147)b(cid:243)ng (cid:240)Æ(cid:148) cho biết (cid:240)oạn cı sở (cid:240)(cid:243) về b(cid:243)ng (cid:240)Æ, giœp l(cid:224)m tªng ngữ nghĩa cho dữ liệu video, thuận lợi cho việc truy t(cid:236)m. Xử l(cid:253) trực tiếp trŒn dữ liệu video dạng nØn nh(cid:253) MPEG1, MPEG2, chứ kh(cid:244)ng thực hiện việc giải nØn rồi mới xử l(cid:253), giœp giảm chi ph(cid:237) t(cid:237)nh toÆn v(cid:224) thời gian khi x(cid:226)y dựng cı sở dữ liệu v(cid:224) truy t(cid:236)m video. Kết hợp với nhận dạng ảnh, xử l(cid:253) (cid:226)m thanh, tiếng n(cid:243)i trong dữ liệu video (cid:240)ể tªng (cid:240)ộ ch(cid:237)nh xÆc v(cid:224) hiệu quả của việc truy t(cid:236)m. C(cid:243) thể t(cid:237)ch hợp thŒm chức nªng loại bỏ những (cid:240)oạn cı sở kh(cid:244)ng mong muốn ra khỏi dữ liệu video, ứng dụng l(cid:224)m bộ lọc video C(cid:243) thể phÆt triển tiếp (cid:240)ể tạo ra ch(cid:253)ıng tr(cid:236)nh ứng dụng thực sự døng (cid:240)(cid:253)ợc trong thực tế nh(cid:253) tự (cid:240)ộng lọc tin tức, ph(cid:226)n loại tin tức cho (cid:240)(cid:224)i truyền h(cid:236)nh, hay c(cid:243) thể tạo ra cı sở dữ liệu video lớn (cid:240)ể mọi ng(cid:253)ời c(cid:243) thể truy t(cid:236)m thống qua internet.
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
119
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
T(cid:192)I LIỆU THAM KHẢO [1] Nguyễn Lªm, L(cid:253) Quốc Ngọc, Phan Vĩnh Ph(cid:253)ớc, Nguyễn Vªn Kỷ Cang, Nguyễn Quốc Tuấn.
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin thị giÆc dựa v(cid:224)o nội dung, Tạp ch(cid:237) PhÆt triển Khoa học C(cid:244)ng nghệ, —H Quốc gia TpHCM, tập 8, thÆng 4 nªm 2005
[2] Nguyễn Lªm, L(cid:253) Quốc Ngọc
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video dựa trŒn m(cid:244) h(cid:236)nh ph(cid:226)n cấp dữ liệu, Tạp ch(cid:237) Tin học & —iều khiển
[3] Nguyễn Lªm, L(cid:253) Quốc Ngọc, D(cid:253)ıng Anh —ức
Truy vấn dữ liệu video số dựa trŒn m(cid:244) h(cid:236)nh ph(cid:226)n cấp dữ liệu, Tạp ch(cid:237) Tin học v(cid:224) —iều khiển
[4] Rafael C.Gonzelez, Richard E.Woods
Digital Image Processing.Second Edition, Prentice-Hall, Inc.2002
[5] Sergios Theodoridis, Konstantinos Koutroumbas
Pattern Recognition, Academic Press, 1999
[6] Shengjiu Wang
A Robust CBIR Approach Using Local Color Histograms, 2001, pp.10-16
[7] LifangGu
Video Analysis In MPEG Compressed Domain, 2001, pp.23-35
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
120
Ph(cid:226)n t(cid:237)ch tự (cid:240)ộng dữ liệu video số hỗ trợ truy t(cid:236)m th(cid:244)ng tin dựa v(cid:224)o nội dung
[8] Alan F.Smeaton, Paul Over, Cash J.Costello, Arjen P. de Vries, Davide
Doermann, Alexander Hauptmann, Mark E. Rorvig, John R. Smiths, Lide Wu.
The TREC2001 Video Track : Information Retrieval on Digital Video
Information, 2001
[9] Abhishek Tiwari, Nitin Jain
Video Segmentation and Video Content Analysis, 2002
[10] Jordi Mas, Gabriel Fernandez
Video Shot Boundary Detection Based On Color Histogram, 2003 [11] Rainer Lienhart
Comparison Of Automatic Shot Boundary Detection Algorithms, 2003
Nh(cid:243)m sinh viŒn : Nguyễn Quốc Tuấn - Nguyễn Vªn Kỷ Cang (cid:150) Phan Vĩnh Ph(cid:253)ớc
121