intTypePromotion=1

Luận văn:Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin thị giác dựa vào nội dung

Chia sẻ: Nguyen Bao Ngoc | Ngày: | Loại File: PDF | Số trang:0

0
107
lượt xem
23
download

Luận văn:Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin thị giác dựa vào nội dung

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin thị giác dựa vào nội dung. Nội dung của luận vãn gồm có hai phần chính. Thứ nhất là phân tích tự ðộng dữ liệu video số. Thứ hai là hỗ trợ truy tìm. Phân tích tự ðộng dữ liệu video số là việc chuyển những dữ liệu video ban ðầu vốn rất lớn về kích thýớc thành các ðặc trýng cấp cao với kích thýớc bé là các ðoạn cõ sở ðã ðýợc phân cấp phân lớp, giúp lýu trữ và quản lý dữ liệu...

Chủ đề:
Lưu

Nội dung Text: Luận văn:Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin thị giác dựa vào nội dung

  1. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung TRÝỜNG ÐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN CÔNG NGHỆ TRI THỨC  NGUYỄN QUỐC TUẤN -0112207 NGUYỄN VÃN KỶ CANG -0112211 PHAN VĨNH PHÝỚC -0112275 PHÂN TÍCH TỰ ÐỘNG DỮ LIỆU VIDEO SỐ HỖ TRỢ TRUY TÌM THÔNG TIN THỊ GIÁC DỰA VÀO NỘI DUNG KHÓA LUẬN CỬ NHÂN TIN HỌC GIÁO VIÊN HÝỚNG DẪN Th.s LÝ QUỐC NGỌC NIÊN KHÓA 2001-2005 Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 1
  2. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung LỜI CẢM ÕN Luận vãn của chúng em sẽ rất khó hoàn thành nếu không có sự truyền ðạt kiến thức quí báu và sự hýớng dẫn tận tình của Thầy Lý Quốc Ngọc. Chúng em xin chân thành cám õn sự chỉ bảo của thầy. Chúng con xin gửi tất cả lòng biết õn, sự kính trọng ðến ông bà, cha mẹ, cùng toàn thể gia ðình, những ngýời ðã nuôi dạy, ðã cho chúng con niềm tin và nghị lực ðể výợt qua mọi khó khãn. Chúng em xin trân trọng cám õn quý Thầy cô trong Khoa Công nghệ thông tin trýờng Ðại học Khoa học Tự nhiên Tp.Hồ Chí Minh ðã tận tình giảng dạy, truyền ðạt những kiến thức quý báu và tạo ðiều kiện cho chúng em ðýợc thực hiện luận vãn này. Xin chân thành cám õn sự giúp ðỡ, ðộng viên và chỉ bảo rất nhiệt tình của các anh chị ði trýớc và tất cả bạn bè. Các anh chị, các bạn luôn có mặt trong những thời ðiểm khó khãn nhất, tiếp thêm ðộng lực và ý chí, giúp chúng tôi hoàn thành ðýợc luận vãn. Mặc dù ðã cố gắng nỗ lực hết sức mình, song chắc chắn luận vãn không khỏi còn nhiều thiếu sót. Chúng em rất mong nhận ðýợc sự thông cảm và chỉ bảo tận tình của quý Thầy cô và các bạn. Tp.HCM, 7/2005 Nhóm sinh viên thực hiện Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc – Nguyễn Quốc Tuấn Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 2
  3. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung NHẬN XÉT CỦA GIÁO VIÊN HÝỚNG DẪN .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 3
  4. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. .............................................................................................................................................. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 4
  5. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung MỤC LỤC LỜI CẢM ÕN .................................................................................................................2 MỤC LỤC .......................................................................................................................5 DANH SÁCH CÁC HÌNH VẼ ......................................................................................8 DANH SÁCH CÁC BẢNG ..........................................................................................10 TÓM TẮT LUẬN VÃN ...............................................................................................11 CHÝÕNG 1 MỞ ÐẦU .................................................................................................12 1. Giới thiệu tổng quan .........................................................................................13 2. Các hýớng nghiên cứu liên quan ðến ðề tài ...................................................17 3. Qui trình chính ðýợc thực hiện trong luận vãn .............................................19 3.1. Giai ðoạn ngoại tuyến (off-line) ..................................................................19 3.2. Giai ðoạn trực tuyến (on-line) .....................................................................20 3.3. Các lĩnh vực liên quan: ................................................................................20 4. Cấu trúc luận vãn ..............................................................................................21 CHÝÕNG 2 MỘT SỐ KHÁI NIỆM VÀ ÐẶC TRÝNG TRONG XỬ LÝ ẢNH SỐ VÀ VIDEO SỐ..............................................................................................................22 1. Một số khái niệm, ðịnh nghĩa trong xử lý video.............................................23 1.1. Khung hình (frame) .....................................................................................23 1.2. Ðoạn cõ sở (shot).........................................................................................24 1.3. Chuyển cảnh ................................................................................................24 2. Không gian màu ................................................................................................26 2.1. Không gian ðộ xám......................................................................................26 2.2. Không gian màu RGB .................................................................................27 2.3. Không gian màu CMY ................................................................................29 2.4. Không gian màu HSV..................................................................................30 3. Lýợc ðồ màu (Color Histogram) .....................................................................33 3.1. Ðịnh nghĩa ...................................................................................................33 3.2. Thuật toán tính lýợc ðồ màu :......................................................................34 3.3. Ý nghĩa của lýợc ðồ màu .............................................................................38 3.4. Ðánh giá ýu ðiểm, khuyết ðiểm...................................................................38 3.5. Ứng dụng .....................................................................................................39 4. Lýợc ðồ týõng quan màu (Color Correlogram) ............................................40 4.1. Giới thiệu lýợc ðồ týõng quan màu .............................................................40 4.2. Tính lýợc ðồ týõng quan màu .....................................................................40 4.3. Lýợc ðồ tự týõng quan màu ........................................................................40 4.4. Ứng dụng .....................................................................................................41 5. Biên dạng (Edge) ...............................................................................................41 5.1. Khái niệm : ..................................................................................................41 Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 5
  6. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung 5.2. Phýõng pháp phát hiện biên ........................................................................41 Ðặc trýng chuyển ðộng (Motion) ....................................................................46 6. 6.1. Giới thiệu .....................................................................................................46 6.2. Lýợc ðồ chuyển ðộng ..................................................................................46 6.3. Ảnh chuyển ðộng.........................................................................................47 7. Các ðặc trýng toàn cục của ðoạn cõ sở ...........................................................48 7.1. Ðặc trýng ảnh trung bình .............................................................................49 7.2. Lýợc ðồ tự týõng quan màu trung bình .......................................................50 7.3. Lýợc ðồ chuyển ðộng trung bình.................................................................51 7.4. Ảnh chuyển ðộng trung bình .......................................................................52 8. Tóm tắt chýõng .................................................................................................53 CHÝÕNG 3 PHÂN TÍCH TỰ ÐỘNG VIDEO SỐ THÀNH CÁC ÐOẠN CÕ SỞ ........................................................................................................................................54 1. Giới thiệu sõ lýợc phân ðoạn ðoạn cõ sở ........................................................55 2. Một số tài liệu in, bài báo ðiển hình về phân ðoạn cõ sở ..............................57 2.1. Kỹ thuật mô hình Markov ẩn (The Hidden Markov Model).......................57 2.2. Phát hiện chuyển cảnh dựa vào phân tích và týõng tác nghe nhìn ..............59 2.3. Phát hiện chuyển cảnh dựa vào lýợc ðồ ......................................................59 2.4. So sánh các kỹ thuật phát hiện biên ðoạn cõ sở ..........................................60 3. Các hýớng tiếp cận phân ðoạn ðiển hình .......................................................61 3.1. Sự sai biệt về lýợc ðồ màu...........................................................................61 3.2. Tỉ số thay ðổi biên cạnh...............................................................................62 3.3. Sự phân tích ðặc trýng âm thanh .................................................................62 3.4. Sự phân tích phát hiện chuyển ðộng............................................................63 4. Một số phýõng pháp cải tiến ............................................................................63 4.1. Phýõng pháp hai ngýỡng.............................................................................65 4.2. Kết hợp lýợc ðồ màu và toán tử hình thái học Morphology và giải thuật Watershed...............................................................................................................67 4.3. Lýợc ðồ tự týõng quan màu ........................................................................71 5. Ðánh giá các phýõng pháp ...............................................................................73 5.1. Ðộ ðo Precision, Recall...............................................................................73 5.2. Thống kê kết quả .........................................................................................74 5.3. Ðánh giá các phýõng pháp ..........................................................................76 6. Tóm tắt chýõng .................................................................................................77 CHÝÕNG 4 TỔ CHỨC CÁC ÐOẠN CÕ SỞ THEO CẤU TRÚC CÂY ..............79 1. Giới thiệu............................................................................................................80 2. Tổ chức các ðoạn cõ sở theo cấu trúc cây nhị phân ......................................80 2.1. Giải thuật phân lớp phân cấp .......................................................................80 2.2. Tạo liên kết lân cận......................................................................................81 2.3. Ðặc trýng và ðộ ðo dị biệt giữa các ðoạn cõ sở trong liên kết ....................82 Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 6
  7. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung 2.4. Cụ thể hóa giai ðoạn phân lớp trong giải thuật phân lớp phân cấp ở mục 2.1 ở trên 83 3. Xây dựng bảng mục lục và chỉ mục.................................................................85 4. Xác ðịnh các lớp của các ðoạn cõ sở và phần tử ðại diện của lớp ...............88 4.1. Lớp của các ðoạn cõ sở ...............................................................................88 4.2. Phần tử ðại diện của lớp ..............................................................................89 5. Khung hình chính ðại diện cho ðoạn cõ sở.....................................................89 5.1. Giới thiệu .....................................................................................................89 5.2. Cách xác ðịnh khung hình chính .................................................................90 6. Tóm tắt chýõng .................................................................................................91 CHÝÕNG 5 TRUY VẤN DỮ LIỆU VIDEO SỐ .....................................................92 1. Giới thiệu............................................................................................................93 2. Các phýõng pháp truy vấn dữ liệu video số ...................................................93 2.1. Dữ liệu nhập là ðoạn cõ sở ..........................................................................93 2.2. Dữ liệu nhập là ðoạn video clip...................................................................98 3. Kết quả thực nghiệm.......................................................................................100 4. Nhận xét ...........................................................................................................100 5. Tóm tắt chýõng ...............................................................................................101 CHÝÕNG 6 HỆ THỐNG ÐÃ CÀI ÐẶT .................................................................102 1. Các chức nãng chính và hýớng dẫn sử dụng chýõng trình ........................103 1.1. Giới thiệu sõ về Giao diện của chýõng trình. ............................................105 1.2. Các chức nãng chính:.................................................................................108 2. Các thuật toán cài ðặt .....................................................................................116 2.1. Không gian màu :.......................................................................................116 2.2. Các thuật toán phân ðoạn...........................................................................116 2.3. Các thuật toán tính ðặc trýng .....................................................................117 2.4. Các thuật toán xây dựng cây phân lớp phân cấp .......................................117 CHÝÕNG 7 KẾT LUẬN ...........................................................................................118 1. Các kết quả ðạt ðýợc ......................................................................................119 2. Hýớng phát triển .............................................................................................119 TÀI LIỆU THAM KHẢO .........................................................................................120 Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 7
  8. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung DANH SÁCH CÁC HÌNH VẼ Hình 1 Ðoạn video dùng dể truy vấn .............................................................................16 Hình 2 kết quả truy vấn..................................................................................................16 Hình 3 Qui trình chính ...................................................................................................19 Hình 4 Các khung hình ..................................................................................................23 Hình 5 Ðoạn cõ sở..........................................................................................................24 Hình 6 Chuyển cảnh tức thì ...........................................................................................25 Hình 7 Chuyển cảnh tiệm tiến........................................................................................25 Hình 8. Không gian màu ðộ xám ...................................................................................26 Hình 9. Không gian RGB ...............................................................................................27 Hình 10. Không gian RGB .............................................................................................28 Hình 11. Không gian RGB .............................................................................................28 Hình 12. Không gian CMY ............................................................................................29 Hình 13. Các thành phân tạo nên không gian màu HSV ...............................................30 Hình 14. Không gian màu HSV dýới dạng ðối týợng hình nón ....................................32 Hình 15 Lýợc ðồ màu ....................................................................................................33 Hình 16 Mắt ngýời không nhạy cảm với sự thay ðổi màu sắc ......................................36 Hình 17 Không gian màu HSV ðã ðýợc ðịnh lýợng......................................................37 Hình 18Các màu ðã ðýợc ðịnh lýợng trong không gian HSV .......................................38 Hình -19. Những ảnh khác nhau nhýng có lýợc ðồ màu giống nhau ............................39 Hình 20 ...........................................................................................................................42 Hình 21 ...........................................................................................................................44 Hình 22 ...........................................................................................................................46 Hình 23. Biên ðoạn cõ sở ...............................................................................................55 Hình 24.Tính sự khác biệt ðặc trýng giữa những khung hình liên tiếp .........................56 Hình 25 Ðýờng sai biệt về ðặc trýng lýợc ðồ giữa các khung hình liên tiếp ................56 Hình 26Sõ ðồ giải thuật phân ðoạn................................................................................57 Hình 27 Chuyển cảnh tức thì dễ phát hiện.....................................................................63 Hình 28 Chuyển cảnh tiệm tiến khó phát hiện...............................................................64 Hình 29 ...........................................................................................................................65 Hình 30 Kết quả phân ðoạn bằng phýõng pháp 2 ngýỡng ............................................67 Hình 31 Ðýờng sai biệt lýợc ðồ màu toàn cục...............................................................68 Hình 32 ...........................................................................................................................69 Hình 33 ...........................................................................................................................70 Hình 34. Ðýờng cong ban ðầu (ở trên) và sau khi qua toán tử hình thái học (ở dýới). Ðýờng màu ðỏ là những nõi phát hiện chuyển cảnh .....................................................71 Hình 35. Phân ðoạn theo lýợc ðồ tự týõng quan màu và toán tử hình thái học, giải thuật watershed........................................................................................................................72 Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 8
  9. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung Hình 36 Liên kết lân cận cho bảng mục lục...................................................................81 Hình 37 Liên kết lân cận cho bảng chỉ mục...................................................................82 Hình 38 Dãy liên kết lân cận ban ðầu ............................................................................83 Hình 39Kết quả sau khi liên kết 2 ðoạn cõ sở có khoảng cách bé nhất.........................84 Hình 40Kết quả của giai ðoạn phân lớp phân cấp .........................................................85 Hình 41 ...........................................................................................................................86 Hình 42. Cây sau khi rút gọn ........................................................................................87 Hình 43 ...........................................................................................................................88 Hình 44 Các khung hình trong ðoạn cõ sở.....................................................................90 Hình 45 Khung hình chính của ðoạn cõ sở trên .............................................................90 Hình 46. Ðặc trýng hình dạng........................................................................................96 Hình 47. Truy tìm với dữ liệu nhập là ðoạn cõ sở .........................................................98 Hình 48 Màn hình chính ..............................................................................................104 Hình 49 Menubar .........................................................................................................105 Hình 50 Toolbar ...........................................................................................................107 Hình 51 Ba lựa chọn phân ðoạn ...................................................................................108 Hình 52.Duyệt các ðoạn cõ sở .....................................................................................109 Hình 53. Xem các khung hình của ðoạn cõ sở.............................................................110 Hình 54 .........................................................................................................................111 Hình 55 .........................................................................................................................112 Hình 56. Truy vấn với dữ liệu nhập là ðoạn cõ sở .......................................................114 Hình 57. Truy vấn với dữ liệu nhập là ðoạn video ......................................................115 Hình 58. Truy vấn với dữ liệu nhập là ảnh tĩnh ...........................................................116 Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 9
  10. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung DANH SÁCH CÁC BẢNG Bảng 1 Bảng thống kê kết quả phân ðoạn......................................................................76 Bảng 2. Kết quả truy tìm ..............................................................................................100 Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 10
  11. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung TÓM TẮT LUẬN VÃN Tên ðề tài : Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin thị giác dựa vào nội dung. Nội dung của luận vãn gồm có hai phần chính. Thứ nhất là phân tích tự ðộng dữ liệu video số. Thứ hai là hỗ trợ truy tìm. Phân tích tự ðộng dữ liệu video số là việc chuyển những dữ liệu video ban ðầu vốn rất lớn về kích thýớc thành các ðặc trýng cấp cao với kích thýớc bé là các ðoạn cõ sở ðã ðýợc phân cấp phân lớp, giúp lýu trữ và quản lý dữ liệu video hiệu quả hõn. Hỗ trợ truy tìm thông tin thị giác là việc ðýa ra một phýõng pháp mới trong việc truy tìm thông tin video trong cõ sở dữ liệu dựa vào nội dung. Với phýõng pháp này, việc truy tìm sẽ trở nên dễ dàng hõn, tiện lợi hõn, chính xác hõn, và nhanh chóng hõn. Hýớng nghiên cứu này ðang thu hút ðýợc sự quan tâm của nhiều ngýời do nhu cầu ngày càng tãng về lýu trữ và truy vấn dữ liệu video số. Trong khuôn khổ luận vãn này, chúng tôi trình bày một số phýõng pháp phân ðoạn, xây dựng cây phân cấp phân lớp, truy tìm video, và tích hợp các phýõng pháp này vào một chýõng trình cài ðặt. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 11
  12. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung CHÝÕNG 1 MỞ ÐẦU Chýõng này giới thiệu tổng quan về tình hình sử dụng dữ liệu video trên thế giới, những vấn ðề phát sinh, các hýớng nghiên cứu giải quyết. Trong chýõng này cũng giới thiệu sõ lýợc qui trình xử lý chính trong luận vãn và cấu trúc báo cáo luận vãn. Nội dung của chýõng : 1. Giới thiệu tổng quan. 2. Các hýớng nghiên cứu liên quan ðến ðề tài. 3. Qui trình chính của luận vãn. 4. Cấu trúc luận vãn. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 12
  13. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung 1. Giới thiệu tổng quan Trong các giác quan của con ngýời, có thể nói thị giác ðóng vai trò quan trọng nhất. Nhờ có thị giác mà chúng ta tiếp nhận thông tin từ thế giới bên ngoài một cách phong phú và sống ðộng. Trong quá trình phát triển của loài ngýời nảy sinh ra nhu cầu giữ lại những thông tin thị giác tiếp nhận ðýợc. Mới ðầu chỉ là những hình thù ðýợc khắc một cách thô sõ trong các hang ðộng, trên những tảng ðá, ðể truyền lại kinh nghiệm cho thế hệ sau. Trải qua một quãng thời gian sau, con ngýời phát minh ra giấy viết. Từ ðây, thông tin thị giác ðýợc lýu giữ dýới hình thức mới tiện lợi hõn. Rồi con ngýời phát minh ra máy ảnh ðể chụp ảnh tĩnh, và máy quay phim ðể thu ảnh ðộng (video). Ðây thực sự là một cuộc cách mạng. Mặc dù chỉ là hai chiều, nhýng hình ảnh thu ðýợc rất chính xác, gần nhý giống với những gì mắt ta cảm nhận ðýợc. Không những vậy mà nó còn là những ðoạn video thể hiện một cách sống ðộng thế giới và những gì mắt ta thấy ðýợc. Con ngýời nhý có ðýợc quyền nãng ðóng bãng thời gian và không gian. Nhờ ðó, kiến thức của con ngýời về thế giới ngày càng tãng, trình ðộ khoa học kỹ thuật càng lúc càng cao. Và máy tính xuất hiện. Sự ra ðời của máy tính ðánh dấu một kỷ nguyên mới, thời kỳ của máy tính và kỹ thuật số. Tất cả ðều ðýợc số hóa nếu có thể. Ðiều này dẫn ðến sự bùng nổ về thông tin thị giác, khiến chúng trở thành một phần không thể thiếu trong cuộc sống ngày nay. Trong thời ðại công nghệ thông tin, có thể nói thông tin là quan trọng nhất. Ai nắm ðýợc thông tin, ngýời ðó có sức mạnh trong tay. Thông tin thì không thiếu, thậm chí quá nhiều dẫn ðến thừa thông tin. Vấn ðề là việc chọn lọc tìm kiếm, lýu giữ, và sử dụng nhý thế nào cho hợp lý. Phần lớn dữ liệu video số hiện nay ðýợc lýu giữ dýới dạng thô và ðýợc gán nhãn, ðánh chỉ mục bằng vãn bản.Chẳng hạn nhý trong một cõ sở dữ liệu video có chứa một ðoạn video có tên nhý sau : “euro2004_France_England.mpg”. Ðoạn video Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 13
  14. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung này ðýợc ðánh chỉ mục và gán nhãn là “euro2004_France_England”, cho biết ðây là ðoạn video về trận ðấu ở Euro 2004 giữa hai ðội bóng Pháp và Anh. Sở dĩ hiện nay phýõng pháp gán nhãn chỉ mục dựa vào vãn bản này ðýợc sử dụng nhiều vì nó ðõn giản, cho kết quả tìm kiếm nhanh. Tuy nhiên không lúc nào kết quả cũng làm vừa lòng ngýời truy tìm, thậm chí ngýời dùng phải mất khá nhiều công sừc. Ví dụ nhý trong cõ sở dữ liệu video ðề cập ở trên có thể còn có nhiều ðoạn video týõng tự nhý euro2004_Portugal_Spain.mpg, euro2004_Russia_Greece.mpg , … Một ngýời nào ðó muốn truy tìm những cảnh ghi bàn thắng trong Euro 2004. Ngýời ðó sẽ tìm kiếm các ðoạn video với từ khóa là “euro 2004”. Kết quả truy tìm là rất nhiều ðoạn video có liên quan ðến vãn bản “euro 2004” nhý các ðoạn video ở trên. Ngýời truy tìm phải lần luợt duyệt qua các ðoạn video vừa tìm ðýợc, mỗi ðoạn video phải duyệt từ ðầu ðến cuối, xem những chỗ nào có cảnh ghi bàn, nếu có thì lýu giữ lại cảnh ðó, nếu không thì duyệt tiếp. Ðộ dài trung bình một ðoạn video về trận ðấu bóng ðá là 90 phút, nếu ðuợc nén dýới dạng MPEG1 thì có dung lýợng khoảng 800MB. Euro 2004 có tổng cộng 31 trận ðấu. Nhý vậy, ðể hoàn thành công việc, ngýời truy tìm phải tải một dung lýợng video bằng 31x 800MB = 24800MB = 24.8GB, và phải mất 31 x 90 phút = 2790 phút = 46.5 giờ ðể duyệt dữ liệu video. Nếu duyệt với tốc ðộ nhanh gấp 5 lần, tức là chỉ xem lýớt qua, thì cũng phải mất 9.3 giờ, chýa kể thời gian tải dữ liệu video. Rõ ràng cách truy tìm này tốn rất nhiều chi phí, thời gian, và công sức. Ngoài ra, ðể có ðuợc dữ liệu video ðã gán nhãn chỉ mục, trýớc ðó ngýời ta cũng phải duyệt, chọn lọc nội dung của các ðoạn video một cách thủ công, lại thêm một lần nữa mất rất nhiều thời gian và công sức. Mà thông tin không chỉ có thể thao, mà còn ở nhiều lĩnh vực khác, và dữ liệu ngày càng nhiều, càng phong phú, và tãng thêm rất nhanh mỗi ngày, việc gán nhãn chỉ mục thủ công càng tốn nhiều chi phí. Chýa kể ðến sự khác biệt về ngôn ngữ tự nhiên. Chẳng hạn nhý kho dữ liệu ðó do những nguời Nhật gán nhãn chỉ mục theo tiếng Nhật, bắt buộc chúng ta cũng phải biết tiếng Nhật mới có thể truy tìm ðuợc thông tin. Ðây là một khuyết ðiểm khá lớn của việc truy tìm video theo vãn bản vì thông tin thị giác là Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 14
  15. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung nhý nhau với mọi nguời, mọi ngýời ðều cảm nhận giống nhau, không phân biệt ngôn ngữ, sắc tộc. Những công việc gán nhãn chỉ mục trên ðều ðýợc làm thủ công do cách thức lýu trữ chýa hợp lý, chýa phát triển kịp với sự bùng nổ của thông tin. Từ ðó nảy sinh nhu cầu có cách thức nào lýu trữ hợp lý hõn, với những ðặc trýng cấp cao hõn, mang nhiều ngữ nghĩa hõn, ðể con ngýời có thể tìm kiếm và sử dụng hiệu quả thông tin thị giác. Bây giờ, giả sử một ngýời lại tìm thông tin về những bàn thắng trong Euro 2004, nhýng là tìm trong những bài viết, những bài báo, vãn bản mô tả những cảnh ghi bàn ðó. Công việc trở nên dễ dàng hõn nhiều, chúng ta chỉ cần vào một trang tìm kiếm nào ðó trên mạng internet, gõ vào các từ khóa “sút tung lýới, ghi bàn, euro 2004”, sẽ có rất nhiều bài viết ðýợc tìm thấy. Lúc này, cách thức tìm kiếm ði trực tiếp vào nội dung vãn bản cần tìm nên kết quả chính xác và dễ chấp nhận hõn. Vậy tại sao chúng ta không tìm kiếm thông tin thị giác dựa vào nội dung? Luận vãn của chúng tôi tìm hiểu và phát triển một phýõng pháp giúp phân tích tự ðộng cấu trúc video số giúp lýu trữ, quản lý, tìm kiếm một cách hiệu quả thông tin video dựa vào nội dung. Nói cách khác, chúng tôi hýớng tới việc truy tìm các ðoạn video trực tiếp bằng nội dung của chính ðoạn video. Nhý ví dụ tìm bàn thắng ở trên, chúng ta chỉ cần có một ðoạn video nhỏ mô tả cảnh quả bóng ðang bay vào khung thành, và chúng ta dùng ðoạn video ðó làm “từ khóa” ðể truy tìm các bàn thắng trong dữ liệu video, với ý nghĩa là : tìm những ðoạn video nào mà có cảnh quả bóng bay vào khung thành. Chi phí tìm kiếm sẽ giảm rất nhiều mà kết quả truy tìm lại rất khả quan. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 15
  16. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung Ví dụ : Ðoạn video dùng ðể truy vấn là cảnh ảnh trái bóng ðang bay vào khung thành Hình 1 Ðoạn video dùng dể truy vấn Kết quả truy vấn : Hình 2 kết quả truy vấn Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 16
  17. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung 2. Các hýớng nghiên cứu liên quan ðến ðề tài Trýớc nhu cầu ngày càng lớn trong việc quản lý dữ liệu video, nhiều nhóm nghiên cứu ðã nhảy vào cuộc. Ðã có nhiều thuật toán về nén dữ liệu video số cho kết quả rất khả quan và ðang ðýợc áp dụng rộng rãi. Các ðịnh dạng file video MPEG1, MPEG2, MPEG4, WMV, MOV, … góp phần làm giảm ðáng kể kích thýớc của dữ liệu video. Nhýng chúng chỉ giúp cho việc lýu trữ nhiều hõn trong một không gian nhỏ hõn, chứ không giải quyết ðýợc việc lýu trữ hiệu quả ðể truy tìm. Tuy nhiên, hiện nay một số nhóm ðang tiến hành việc nghiên cứu và áp dụng vào thực tế một số phýõng pháp lýu trữ và truy tìm dựa vào nội dung, cho thấy ðây là một hýớng phát triển mới và rất có triển vọng. Sau ðây là một số nhóm tiêu biểu: Ðại học Carnegie Mellon Nhóm phát triển thuộc Ðại học Carnegie Mellon ðang thực hiện một dự án thý viện thông tin cho phép ngýời dùng truy tìm video bằng ngôn ngữ tự nhiên. Các býớc xử lý ðể tạo nên thý viện video : phát hiện các ðoạn cõ sở bằng cách sử dụng phýõng pháp ðộ sai biệt về lýợc ðồ màu, rồi rút trích khung hình chính, nhận dạng khuôn mặt, nhận dạng chữ viết qua video, và tìm ảnh dựa vào ðặc trýng lýợc ðồ màu trong các không gian màu và vân khác nhau. Nhóm nghiên cứu của IBM Nhóm nghiên cứu của IBM ðã phát triển một hệ thống truy tìm video theo nội dung tự ðộng và týõng tác dựa vào những ðặc ðiểm trực quan và mô hình thống kê. Hệ thống sử dụng IBM Cue Video ðể phát hiện ðoạn cõ sở và lựa chọn khung hình chính một cách tự ðộng. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 17
  18. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung Ðại học Johns Hopkins Nhóm nghiên cứu JHU/APL ðã phát triển một hệ thống truy tìm tự ðộng video dựa vào nội dung của các khung hình video số. Mỗi khung hình chính ðýợc ðánh chỉ số bởi chính ðặc trýng lýợc ðồ màu và vân ảnh của nó. Ðại học Maryland Ðại học Maryland, ðang làm việc với những nhà nghiên cứu từ ðại học Oulu, mở rộng các phýõng thức ðýợc dùng cho việc truy tìm ảnh. Ðại học Bắc Texas Nhóm Ðại học Bắc Texas trích các khung hình từ dữ liệu video theo chu kỳ 5 giây. Những khung hình này sẽ qua tiến trình chọn khung hình chính ðể bỏ ði những khung hình thừa. Những khung hình chính sau ðó sẽ ðýợc ðýa vào ứng dụng UNT’s Brighton Image Searcher, dựa vào các ðộ ðo toán học týõng ứng với những ðặc tính quan trọng của ảnh. Ðộ chính xác của quá trình chọn khung hình chính týõng ðối khả quan. Có thể thấy rằng, hiện nay, lĩnh vực xử lý video theo nội dung khá hấp dẫn và thu hút ðýợc sự quan tâm của ngày càng nhiều nhóm nghiên cứu vì những nhu cầu và ứng dụng thực tế của nó. Tuy nhiên, phần lớn những nghiên cứu vẫn còn ở trong lý thuyết, còn những hệ thống ðã cài ðặt áp dụng thì chỉ có kết quả týõng ðối. Vì vậy, trong luận vãn này, chúng tôi nghiên cứu và thực hiện cài ðặt một số phýõng pháp giúp lýu trữ và truy tìm thông tin thị giác hiệu quả hõn, hoà vào dòng xử lý video ðang phát triển mạnh mẽ hiện nay. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 18
  19. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung 3. Qui trình chính ðýợc thực hiện trong luận vãn Gồm 2 giai ðoạn : Giai ðoạn ngoại tuyến và giai ðoạn trực tuyến (xem hình) Hình 3 Qui trình chính 3.1. Giai ðoạn ngoại tuyến (off-line) Mục ðích của giai ðoạn này phân tích và lýu trữ những ðặc trýng cấp cao của dữ liệu video, gồm các býớc : Ðầu tiên, dữ liệu video dýới dạng tập tin video thông thýờng (avi, mpeg) ðýợc ðýa vào bộ phân ðoạn ðể phân tích ðoạn video ban ðầu thành các ðoạn cõ sở. Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 19
  20. Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung Tiếp theo, tiến hành rút trích ðặc trýng của các ðoạn cõ sở ðể tạo thành cõ sở dữ liệu các ðặc trýng của các ðoạn cõ sở. Các ðặc trýng có thể là ðặc trýng màu, ðặc trýng chuyển ðộng, ðặc trýng biên cạnh, … Kế ðến, phân lớp các ðoạn cõ sở và chọn phần tử ðại diện, tạo nên cõ sở dữ liệu các lớp của các ðoạn cõ sở với phần tử ðại diện. 3.2. Giai ðoạn trực tuyến (on-line) Sau khi ðã phân tích và lýu trữ các ðặc trýng cấp cao của video, chúng ta ðã có một cõ sở dữ liệu có thể truy vấn. Giai ðoạn này thực hiện truy vấn dữ liệu video số qua các býớc sau : Ðýa ðoạn video cần truy vấn vào, phân tích ðoạn video này thành các ðoạn cõ sở giống nhý ở giai ðoạn ngoại tuyến trên. Sau ðó tiến hành rút trích ðặc trýng của các ðoạn cõ sở của ðoạn video truy vấn, rồi thực hiện phân chia các ðoạn cõ sở và chọn phần tử ðại diện. So sánh các ðặc trýng của các ðoạn cõ sở của ðoạn video truy vấn với các ðặc trýng của các ðoạn cõ sở ðýợc lýu trong cõ sở dữ liệu tạo ra ở giai ðọan ngoại tuyến. Ứng với mỗi ðoạn cõ sở của ðoạn video truy vấn, chọn ra và xếp hạng những ðoạn cõ sở gần nhất với nó, ta có kết quả của truy vấn. 3.3. Các lĩnh vực liên quan: Xử lý ảnh số và video số Xử lý tín hiệu số Truy tìm ảnh dựa vào nội dung … Nhóm sinh viên : Nguyễn Quốc Tuấn - Nguyễn Vãn Kỷ Cang – Phan Vĩnh Phýớc 20
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2