Lê Thanh Hà, TS. Lê Thanh Hà, TS. Phòng thí nghiệm Tương tác người máy Phòng thí nghiệm Tương tác người máy

Video conference Video conference Camera số Video Camera số Video DVD/VCD DVD/VCD Các hệ thống giám sát bằng video Các hệ thống giám sát bằng video Cơ sở dữ liệu video/ảnh Cơ sở dữ liệu video/ảnh tác, học trực Multimedia tương tác, học trực Multimedia tương tuyến tương tác tuyến tương tác Truyền hình số Truyền hình số

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

2

Mỗi năm thông tin được bổ sung thêm bao nhiêu? Mỗi năm thông tin được bổ sung thêm bao nhiêu?

Một nghiên cứu từ School of Information Management and Systems at UC Một nghiên cứu từ School of Information Management and Systems at UC Berkeley Berkeley

2003/ http://www.sims.berkeley.edu/research/projects/how--muchmuch--infoinfo--2003/ http://www.sims.berkeley.edu/research/projects/how

Thông tin được tạo lập mới được lưu trữ dưới những dạng: Thông tin được tạo lập mới được lưu trữ dưới những dạng:

Print In ấn -- Print In ấn Phim Phim -- FilmFilm Magnetic Từ Từ -- Magnetic Optical Quang -- Optical Quang

Thông tin được thu nhận từ các kênh điện tử: Thông tin được thu nhận từ các kênh điện tử:

Điện thoại Telephone Điện thoại -- Telephone Đài phát thanh -- RadioRadio Đài phát thanh Tivi Tivi -- TVTV Internet Internet

Khoảng 5 exabytes thông tin mới đã được tạo lập và lưu trữ dưới dạng Khoảng 5 exabytes thông tin mới đã được tạo lập và lưu trữ dưới dạng in ấn, phim, từ và quang vào năm 2002. in ấn, phim, từ và quang vào năm 2002.

5 exabytes lớn như thế nào? 5 exabytes lớn như thế nào?

1000 gigabytes = 1 terabytes 1000 gigabytes = 1 terabytes 1000 terabytes = 1 petabytes 1000 terabytes = 1 petabytes petabytes = 1 exabytes 1000 petabytes = 1 exabytes 1000 Nó tương đương với kích thước của nửa triệu thư viện quốc gia Mỹ. Nó tương đương với kích thước của nửa triệu thư viện quốc gia Mỹ.

92% thông tin được lưu trong đĩa từ, hầu hết trong ổ cứng 92% thông tin được lưu trong đĩa từ, hầu hết trong ổ cứng

Magnetic: Magnetic: FilmFilm: : Print: Print: Optical: Optical:

92 %92 % 77%% 0.010.01%% 0.002% 0.002%

Thông tin mới của mỗi người là bao nhiêu? Thông tin mới của mỗi người là bao nhiêu?

Khoảng 800 MB thông tin được tạo lập bởi mỗi người. Khoảng 800 MB thông tin được tạo lập bởi mỗi người.

Tổng lượng thông tin được lưu trữ trên giấy, Tổng lượng thông tin được lưu trữ trên giấy, phim, từ và quang được tăng gấp đôi trong phim, từ và quang được tăng gấp đôi trong khoảng năm 1999 đến 2002 khoảng năm 1999 đến 2002

Bùng nổ thông tin Bùng nổ thông tin Xã hội không giấy-- paperless Xã hội không giấy

society paperless society

Thông tin lưu trữ dưới dạng văn bản giấy vẫn tăng Thông tin lưu trữ dưới dạng văn bản giấy vẫn tăng Nhưng hầu hết thông tin gốc trên giấy được tạo lập từ Nhưng hầu hết thông tin gốc trên giấy được tạo lập từ các tài liệu văn phòng thư tín chứ không phải là sách vở, các tài liệu văn phòng thư tín chứ không phải là sách vở, tin báo, hay tạp chí. tin báo, hay tạp chí.

Thông tin được truyền trên các kênh điện tử chứa đựng khoảng 18 Thông tin được truyền trên các kênh điện tử chứa đựng khoảng 18 exabytes vào năm 2002, gấp khoảng 3.5 lần kích thước thông tin lưu exabytes vào năm 2002, gấp khoảng 3.5 lần kích thước thông tin lưu trữ. trữ.

Điện thoại chiếm khoảng 98% tổng lượng thông tin lưu chuyển, hầu hết trong Điện thoại chiếm khoảng 98% tổng lượng thông tin lưu chuyển, hầu hết trong số đó là thông tin giữa người với người. số đó là thông tin giữa người với người.

Thông tin lưu chuyển trên các kênh điện tử chứa đựng khoảng 18 Thông tin lưu chuyển trên các kênh điện tử chứa đựng khoảng 18 exabytes vào năm 2002, gấp khoảng 3.5 lần kích thước thông tin lưu exabytes vào năm 2002, gấp khoảng 3.5 lần kích thước thông tin lưu trữ. trữ.

WWW chiếm khoảng 170TB WWW chiếm khoảng 170TB Tin nhắn nhanh chiếm khoảng 5 tỉ tin nhắn mỗi ngày (750GB) Tin nhắn nhanh chiếm khoảng 5 tỉ tin nhắn mỗi ngày (750GB) Email chiếm khoảng 400, 000 TB thông tin vào năm 2002 Email chiếm khoảng 400, 000 TB thông tin vào năm 2002

Truyền file P2P tăng trưởng rất nhanh: Truyền file P2P tăng trưởng rất nhanh:

Các file có dung lượng lớn là các file video, lớn hơn 100MB Các file có dung lượng lớn là các file video, lớn hơn 100MB Hầu hết các file được truyền tải là file âm thanh (MP3) Hầu hết các file được truyền tải là file âm thanh (MP3)

Thông tin về người Mỹ: Thông tin về người Mỹ:

Sử dụng điện thoại 16.17 giờ/tháng Sử dụng điện thoại 16.17 giờ/tháng Nghe phát thanh 90 giờ/tháng Nghe phát thanh 90 giờ/tháng Xem TV 131 giờ/tháng Xem TV 131 giờ/tháng Sử dụng Internet 100 giờ/tháng (khoảng 53% dân số sử dụng Internet) Sử dụng Internet 100 giờ/tháng (khoảng 53% dân số sử dụng Internet)

Vậy ta có nên sử dụng một đoạn ký tên ngắn để tiết kiệm đường truyền không? Vậy ta có nên sử dụng một đoạn ký tên ngắn để tiết kiệm đường truyền không?

Table 4: Summary of media use by US households in hours per year, with estimated megabyte equivalent

Item

1992 Hours 2000 Hours 2000 MBytes % Change

1510 1571 3,142,000 TV 4

1150 1056 57,800 Radio -8

233 269 13,450 15 Recorded Music

Newspaper 172 154 11 -10

Books 100 96 7 -4

Magazines 85 80 6 -6

Home video 42 55 110,000 30

Video games 19 43 21,500 126

Thời gian sử dụng để Thời gian sử dụng để xem TV và nghe đài xem TV và nghe đài không thay đổi nhiều không thay đổi nhiều Thời gian đọc tài liệu Thời gian đọc tài liệu được in trên giấy được in trên giấy giảmgiảm Tăng trưởng nhanh ở Tăng trưởng nhanh ở home video, video home video, video games, và sử dụng games, và sử dụng Internet Internet

Internet 2 43 9 2,050

Cả 3 lĩnh vực này vẫn là Cả 3 lĩnh vực này vẫn là rất nhỏ so với tổng thể. rất nhỏ so với tổng thể.

http://www.sims.berkeley.edu/research/projects/how-much-info/summary.html

Total: 1.7 3,324 3,380 3,344,783

Thông tin Video là lớn nhất Thông tin Video là lớn nhất Quan trọng nhất.  Quan trọng nhất.

Table 4: Summary of yearly media use by US households in hours per year, with estimated megabyte equivalent

Item

1992 Hours 2000 Hours 2000 MBytes % Change

TV 1510 1571 3,142,000 4

Radio 1150 1056 57,800 -8

233 269 13,450 15 Recorded Music

Newspaper 172 154 11 -10

Books 100 96 7 -4

Magazines 85 80 6 -6

Home video 42 55 110,000 30

Video games 19 43 21,500 126

Internet 2 43 9 2,050

http://www.sims.berkeley.edu/research/projects/how-much-info/summary.html

Total: 1.7 3,324 3,380 3,344,783

Nhu cầu rất lớn từ người sử dụng Nhu cầu rất lớn từ người sử dụng

Văn bản viết

Ảnh tĩnh

THE LORD OF THE RINGS

Three Rings for the Elven-kings under the sky,

Seven for the Dwarf-lords in their halls of stone,

Nine for Mortal Men doomed to die,

One for the Dark Lord on his dark throne

In the Land of Mordor where the Shadows lie,

One Ring to rule them all, One Ring to find them,

One Ring to bring them all and in the darkness bind them

In the Land of Mordor where the Shadows lie.

Một vấn đề chính trong truyền thông đa Một vấn đề chính trong truyền thông đa âm thanh, hình ảnh phương tiện –– nén nén âm thanh, hình ảnh phương tiện Tại sao chúng ta cần nén video? Tại sao chúng ta cần nén video?

Để có thể xử lý được một khối lượng lớn video số Để có thể xử lý được một khối lượng lớn video số Tiết kiệm chi phí để lưu trữ và truyền video Tiết kiệm chi phí để lưu trữ và truyền video

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

11

Uncompressed ITU-R Rec. 601: • 720 x 576 pixels at 25 frames per second (4:2:2); • 8-bit per component, leading to Total bit rate = 25 frames/s x (720+360+360) X 576 component pixels/frame x 8 bits per component pixel = 166 Mbps, and a 90 minute movie requires over 100 GBytes.

• 10-bit per component, leading to Total bit rate = 25 frames/s x (720+360+360) component pixels/frame x 10 bits per component pixel = 207 Mbps, a 90 minute movie requires over 135 GBytes.

Digital Storage Capacities: CD/VCD: 640~700 MB, typically at 1.2Mbps, (142:1 compression required for storage and 138:1 compression required for bandwidth); DVD: 4.6 GB, at 4.5 to 6 Mbps (21:1 compression required for storage, 28:1 for bandwidth); PC Hard Disk: 40 to 80 GB with PCI bus bandwidth of ~132 MBps

Lê Thanh Hà - Phòng TN Tương tác người máy

12 11/4/2013

Connection technology

Transmission rate

Compression required for video

14.4/28.8/56 Kbps 1.544 Mbps 1.5 Mbps 6.312 Mbps 10 Mbps

~11528/5764/2964:1 ~108:1 ~110:1 ~26:1 ~16.6:1

V.32bis/V.34/V42.bis Modems T1 HDSL ADSL 3 Cable modem ISDN Channel Type B 2B H0 H11 H12 H4 B-ISDN (ATM SONET)

64 kbps 128 kbps 384 kbps 1536 kbps 1920 kbps Up to 150 Mbps 100 Mbps up

~2600:1 ~1297:1 ~432:1 ~108:1 ~87:1 ~1.1:1 <1.6:1

Lê Thanh Hà - Phòng TN Tương tác người máy

13 11/4/2013

Các tần suất dữ liệu audio (Audio data Các tần suất dữ liệu audio (Audio data rates) rates) Ảnh và chuỗi video (Image and Video Ảnh và chuỗi video (Image and Video Sequence) Sequence) Thể hiện điểm (Pixel Representation) Thể hiện điểm (Pixel Representation) Lấy mẫu “giảm” theo thành phần màu Lấy mẫu “giảm” theo thành phần màu sampling) (Chrominance sub--sampling) (Chrominance sub Các khuôn dạng video số (Digital Video Các khuôn dạng video số (Digital Video Formats) Formats)

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

14

Thu nhận từ thiết bị cảm nhận âm thanh Thu nhận từ thiết bị cảm nhận âm thanh (Microphone) (Microphone)

Bản chất của âm thanh là sóng áp suất truyền từ Bản chất của âm thanh là sóng áp suất truyền từ nguồn phát qua không khí đập vào màng thu của nguồn phát qua không khí đập vào màng thu của microphone. microphone. Màng thu microphone dao động và tạo nên dòng Màng thu microphone dao động và tạo nên dòng điện biến thiên truyền tới thiết bị. điện biến thiên truyền tới thiết bị.

Phát âm thanh: Quá trình ngược lại. Phát âm thanh: Quá trình ngược lại.

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

15

Biểu diễn dưới dạng sóng của âm thanh: Biểu diễn dưới dạng sóng của âm thanh: Mono: chỉ có 1 kênh âm thanh (điện thoại). Mono: chỉ có 1 kênh âm thanh (điện thoại). Stereo: nhiều kênh âm thanh (Hội thoại trực tuyến, truyền Stereo: nhiều kênh âm thanh (Hội thoại trực tuyến, truyền phát thanh). phát thanh). channel: Âm nhạc chất lượng cao. MultiMulti--channel: Âm nhạc chất lượng cao. Thực hành: Sử dụng chương trình Audacity Thực hành: Sử dụng chương trình Audacity http://audacity.sourceforge.net/download/windows:: http://audacity.sourceforge.net/download/windows

Hiểu thêm về bản chất của âm thanh Hiểu thêm về bản chất của âm thanh Soạn thảo các file âm thanh. Soạn thảo các file âm thanh.

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

16

Mã hóa

Phương tiện lưu trữ

Dải thông audio (kHz)

Tần suất lấy mẫu (kHz)

CD

20

44.1

Stereo Audio Bitrate (kbits/s) 1411.2

PCM

DAT

16

32.0

1024.0

PCM

DCC

20

44.1

384

PASC

MD

22

44.1

292

ATRAC

CD: Compact Disk, DAT: Digital Audio Tape, DCC: Digital Compact Cassette, MD: MiniDisk

PCM: Pulse Code Modulation, PASC: Precision Adaptive Subband coding, ATRAC: Adaptive Transform Acoustic Coding

Lê Thanh Hà - Phòng TN Tương tác người máy

17 11/4/2013

Ảnh và video số Ảnh và video số

Đơn vị cơ bản để xây dựng một ảnh được gọi là điểm -- Đơn vị cơ bản để xây dựng một ảnh được gọi là điểm pixel (pel) pixel (pel) Độ phân giải ảnh được tính bằng số lượng ảnh theo chiều Độ phân giải ảnh được tính bằng số lượng ảnh theo chiều ngang và dọc ngang và dọc Các chuỗi video chứa một số các hình ảnh chuyển động Các chuỗi video chứa một số các hình ảnh chuyển động Một trong những định dạng chuỗi video nổi tiếng là cấu Một trong những định dạng chuỗi video nổi tiếng là cấu trúc xen kẽ (interlaced) dựa theo định dạng PAL trúc xen kẽ (interlaced) dựa theo định dạng PAL

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

18

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

19

Định dạng video xen kẽ Định dạng video xen kẽ

Tần suất khung (frame rate) chuẩn (25 or 30 fps) đủ cao để Tần suất khung (frame rate) chuẩn (25 or 30 fps) đủ cao để tạo ra các chuyển động mịn tuy nhiên chưa đủ cao để loại tạo ra các chuyển động mịn tuy nhiên chưa đủ cao để loại bỏ giật (flickering) bỏ giật (flickering) Để loại bỏ giật có thể nhìn thấy được ở một bức ảnh sáng, Để loại bỏ giật có thể nhìn thấy được ở một bức ảnh sáng, tần suất refresh phải tối thiểu là 40fps. Với sự xen kẽ 2 tần suất refresh phải tối thiểu là 40fps. Với sự xen kẽ 2--toto-- 1, các dòng lẻ của frame (field 1) được hiển thị trước sau 1, các dòng lẻ của frame (field 1) được hiển thị trước sau đó là các dòng chẵn (field 2). đó là các dòng chẵn (field 2). Chuỗi 25 khung trên một giây được hiển thị với tần suất 50 Chuỗi 25 khung trên một giây được hiển thị với tần suất 50 field một giây field một giây Cả khung hình có vẻ như đã được refresh 50 lần một giây. Cả khung hình có vẻ như đã được refresh 50 lần một giây.

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

20

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

21

Không gian màu Y,U,V Không gian màu Y,U,V Hệ thống thị giác của con người nhạy cảm với ba thành phần màu. Hệ thống thị giác của con người nhạy cảm với ba thành phần màu. Màu có thể được thể hiện thông qua ba thành phần: Đỏ (Red), Xanh lá Màu có thể được thể hiện thông qua ba thành phần: Đỏ (Red), Xanh lá cây (Green) và Xanh da trời (Blue) (RGBRGB).). cây (Green) và Xanh da trời (Blue) ( YCbCr:: Chuyển sang YUV hay YCbCr Chuyển sang YUV hay

Lưu ý: Hai thành phần (U,V) thường chứa ít thông tin hơn nhiều so với thành phần Y( độ sáng – luminance)

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

22

Không gian màu YddCCbbCCrr Không gian màu Y theo công thức: Chuyển từ RGB sang YddCCbbCCrr theo công thức: Chuyển từ RGB sang Y

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

23

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

24

Thị giác con người thường không nhạy cảm với các thành phần màu (chrominance). Chính vì thế, các thành phần màu thường được lấy mẫu “giảm”. Lấy mẫu “giảm” thường được mô tả theo tỉ lệ của ba thành phần.

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

25

360 x 576 điểm 720 x 576 và Cr & Cb –– 360 x 576 điểm

360 x 288 điểm 720 x 576 và Cr & Cb –– 360 x 288 điểm

720 x 576 điểm trên khung Ở định dạng 4:4:4 : Y, Cr & Cb –– 720 x 576 điểm trên khung Ở định dạng 4:4:4 : Y, Cr & Cb Ở định đạng 4:2:2 : Y Ở định đạng 4:2:2 : Y –– 720 x 576 và Cr & Cb trên khung trên khung Ở định dạng 4:2:0 : Y –– 720 x 576 và Cr & Cb Ở định dạng 4:2:0 : Y trên khung trên khung Ở định dạng 4:1:1 : Y –– 720x576 và Cr & Cb Ở định dạng 4:1:1 : Y

144x576 720x576 và Cr & Cb –– 144x576

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

26

International Consultative Committee for International Consultative Committee for Radio (CCIR) Rec. 601: Radio (CCIR) Rec. 601:

Hai tần suất: Hai tần suất: 50Hz: 720x576 pixels at 50 fields per second. 50Hz: 720x576 pixels at 50 fields per second. 720x480 pixels at 60 fields per second. 60Hz: 720x480 pixels at 60 fields per second. 60Hz: Cả hai đều là xen kẽ 2:1 và lấy mẫu thành phần Cả hai đều là xen kẽ 2:1 và lấy mẫu thành phần màu 4:2:2 (có thể lựa chọn 4:4:4). màu 4:2:2 (có thể lựa chọn 4:4:4).

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

27

Common Intermediate Format (CIF): Common Intermediate Format (CIF):

Được định nghĩa bởi CCITT (TSS) cho chuẩn mã hóa H.261 Được định nghĩa bởi CCITT (TSS) cho chuẩn mã hóa H.261 (teleconferencing and videophone). (teleconferencing and videophone). Một số kích thước khác nhau: Một số kích thước khác nhau:

SQCIF: 88x72 pixels. SQCIF: 88x72 pixels. 176x144 pixels. QCIF: 176x144 pixels. QCIF: 352x288 pixels. CIF: CIF: 352x288 pixels. 704x576 pixels.. 4CIF: 4CIF: 704x576 pixels interlaced), và lấy mẫu thành phần màu xen kẽ (Non--interlaced), và lấy mẫu thành phần màu Không xen kẽ (Non Không 4:2:0. 4:2:0.

Tần suất khung (Frame rates): 25 frames/sec Tần suất khung (Frame rates): 25 frames/sec

Chuẩn khác: Chuẩn khác: : 1280x720 progressive/interlace 720p/720i: 1280x720 progressive/interlace 720p/720i : 1920x1080 progresive/interlace 1080p/1080i: 1920x1080 progresive/interlace 1080p/1080i

Lê Thanh Hà - Phòng TN Tương tác người máy

11/4/2013

28