2. Các dạng dữ liệu Multimedia
Các dạng dữ liệu Multimedia gồm
16
Các dạng dữ liệu truyền thống: văn bản, số liệu… Âm thanh: tiếng ồn, âm nhạc, tiếng nói… Hình ảnh tĩnh: đồ họa, ảnh Ảnh động: animation, video
2.1 Văn bản
Dữ liệu văn bản kinh điển: plain text Đơn giản, không đòi hỏi phải xử lý nhiều. Mã hóa bởi bộ mã ASCII, ISO/IEC 646 hoặc EBCDIC. Chuyên dùng để tạo các tệp tin cấu hình, thư điện tử do tính tương thích cao.
Dạng Rich Text: kiểu chữ, cỡ chữ, màu chữ…
Các vấn đề
Nhập: gõ phím, tự động nhận dạng text. Xử lý: tạo văn bản và chỉnh lý, biên tập theo nguyên tắc WYSIWYG (What
Lưu trữ: tách biệt nội dung và cấu trúc, mã hóa và nén, nén không mất thông
you see is what you get).
Hiển thị: hiển thị và cảm giác. Vấn đề phổ biến: thường gặp sự không tương thích giữa các văn bản.
17
tin.
2.1 Văn bản
Biểu diễn văn bản
ASCII – American Standard Code for information interchange là bộ mã mã hóa ký tự và hỗ trợ biểu diễn văn bản trên máy tính và các thiết bị khác liên quan. Trước khi ASCII được phát triển, người ta sử dụng các bộ mã để mã
CCITT ≥ 64 ký tự (tương đương với 6 bit). Các công nghệ băng bấm lỗ thời bấy giờ cho phép 8 bit cùng được lưu
hóa 26 ký tự, 10 chữ số và khoảng từ 11 – 25 biểu tượng đặc biệt, ngoài ra còn một số các ký tự điều khiển khác nhằm tương tích với chuẩn CCITT (Consultative Committee International Telephone and Telegraph)
Chính vì thế bên cạnh 7 bit biểu diễn cho một ký tự, chúng ta có thêm 1 bit khác gọi là parity bit để có thể sửa lỗi xảy ra trong quá trình truyền dẫn.
18
tại một vị trí.
2.1 Văn bản
Biểu diễn văn bản
Bảng mã ASCII: Sử dụng 7 bit để biểu diễn một ký tự, ngoài ra còn có một bit (parity bit) chuyên dùng để sửa lỗi.
19
2.1 Văn bản
Biểu diễn văn bản
Bộ mã chuẩn dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ trên thế
Mã Unicode
Hỗ trợ các ký tự tượng hình phức tạp như tiếng Trung Quốc, tiếng Thái.
Unicode chiếm 1.114.112 ((16+1)*65536) code point, đã gán 96000 mã chữ. Unicode chia làm 17 mặt phẳng. Mỗi mặt gồm 65536 code point.
20
giới.
2.1. Văn bản
Mã Unicode ( tiếp )
Mặt phẳng đầu tiên (plane 0), "Mặt phẳng đa ngôn ngữ căn bản" (Basic Multilingual Plane- BMP), là nơi mà đa số các ký hiệu được gán mã. BMP chứa các ký hiệu cho hầu hết các ngôn ngữ hiện đại đặc biệt là các ngôn ngữ CJKV (Hán-Nhật-Hàn-Việt).
Hai mặt phẳng tiếp theo được dùng cho các ký tự "đồ họa".
Mặt phẳng 1, "Mặt phẳng đa ngôn ngữ bổ sung" (Supplementary Multilingual Plane- SMP), được dùng chủ yếu cho các loại chữ viết cổ, ví dụ Egyptian hieroglyph (chưa được mã hóa), nhưng cũng còn được dùng cho các ký hiệu âm nhạc.
Mặt phẳng 2, (Supplementary Ideographic Plane- SIP), được dùng cho
khoảng 40000 chữ Trung Quốc ít gặp mà đa số là các ký hiệu cổ, ngoài ra cũng có một số ký hiệu hiện đại.
Mặt phẳng 14 hiện chứa một số các ký tự thẻ ngôn ngữ không được
256 mã đầu tiên phù hợp với ISO 8859-1 17 mặt phẳng gồm :
Mặt phẳng 15 và Mặt phẳng 16 được mở cho các sử dụng cá nhân.
21
khuyến khích và một số ký hiệu lựa chọn biến thể.
2.1 Văn bản
Các dạng mã Unicode : UTF-32, UTF-16 và UTF-8 UTF-32 : sử dụng 32 bit cho mỗi ký tự, được gọi là
UTF-32 và ISO/IEC 10646 gọi là UCS-4
UTF-16/UCS-2
16 bit để mã hóa các ký tự BMP.
Mã hóa dùng Unicode 20 bit. Trong Windows NT, CE người ta dùng
Most Significant: U+D800 – U+DBFF Least Significant: U+DC00 – U+DFFF
D800 DC00 U+00010000 DBFF DFFF U+0010FFFF
Bộ mã sử dụng cặp thay thế UTF-16
22
Một code point có 20 bit được chia làm hai nhóm 10 bit:
2.1 Văn bản
UTF-8
Mã hóa các xâu ký tự theo UCS hoặc Unicode theo dạng mỗi ký tự dùng 2 hoặc 4 byte – tương ứng các sơ đồ mã hóa UCS-2 và UCS-4.
Sơ đồ mã hóa UTF-8
UTF-8 được thiết kế để tương thích với chuẩn ASCII. UTF-8 có thể sử dụng từ một (ASCII) cho đến 6 byte để biểu diễn một ký tự. tương thích với các hệ thống hiện tại
U+0000 – U+007F: các ký tự ASCII. Các ký tự > U+007F được mã hóa thành một dãy các byte có các nhóm bit đặc biệt sao cho không có byte nào của ASCII xuất hiện trong thành phần các ký tự này.
0xFD. Byte đầu chỉ rõ có bao nhiêu byte sẽ theo sau byte này trong chuỗi mã của ký tự đang xét. Ví dụ: byte đầu là 11110xxx: có nghĩa ký tự này sẽ được mã hóa bằng chuỗi bit bao gồm 4 byte.
Byte đầu tiên của các ký tự nhiều byte luôn bắt đầu từ 0xC0 đến
23
Các byte sau sẽ có giá trị từ 0x80 đến 0xBF.
2.1 Văn bản
Sơ đồ mã hóa UTF-8
10xxxxxx 10xxxxxx
U+00000000 – U+0000007F: 0xxxxxxx U+00000080 – U+000007FF: 110xxxxx 10xxxxxx U+00000800 – U+0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx U+00010000 – U+0010FFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx U+00200000 – U+03FFFFFF: 111110xx 10xxxxxx 10xxxxxx
10xxxxxx 10xxxxxx 10xxxxxx
U+04000000 – U+7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx
10100000 = 0xE2 0x89 0xA0
24
U+00A9 1010 1001 UTF-8: 11000010 10101001 U+2260 10 0010 0110 0000 UTF-8: 11100010 10001001
2.1 Văn bản
Các phiên bản Unicode
25
1991 Unicode 1.0 1993 Unicode 1.1 1996 Unicode 2.0 1998 Unicode 2.1 2000 Unicode 3.0 2001 Unicode 3.1 2002 Unicode 3.2 2003 Unicode 4.0
2.1 Văn bản
Văn bản được đánh dấu (Markup Text)
Biểu diễn bằng khuôn dạng và nội dung Nội dung là chuỗi các ký tự của văn bản Khuôn dạng là cấu trúc biểu diễn của văn bản
giới hạn cấu trúc và khuôn dạng của từng phần văn bản
Markup text: văn bản chứa những chuối ký tự chuyên biệt thể hiện
Nhược điểm: chứa hỗn độ các cấu trúc logic như: điểm bắt đầu và kết thúc từng phần, mục với các cấu trúc xác định cách bố trí của văn bản như căn lề…
logic và layout bằng các document type. Gồm nhiều phần tử (element) có tên riêng. Sử dụng cặp start-tag và end-tag để đánh dấu phần tử.
SGML (Standardized General Markup Language) phân tách cấu trúc
trang Web. Phiên bản mới nhất 4.01 XHTML
26
HTML (HyperText Markup Language): ngôn ngữ đánh dấu cho các
2.1 Văn bản
Văn bản được đánh dấu (Markup Text)
Ví dụ minh họa cho XML
Ví dụ minh họa cho SGML
27
2.1 Văn bản
Khuôn dạng văn bản ASCII:
Văn bản không định cấu trúc. Không có các định dạng trang.
128 ký tự đầu là không đổi, 128 ký tự sau phụ thuộc vào từng biến dạng.
Dạng phương tiện đơn. Khuôn dạng Rich Text: RTF.
Khuôn dạng cơ sở ASCII chuẩn ISO 8859. Đặc tính.
Windows, OS2, Apple.
28
Ký tự có kiểu, cỡ. Trang văn bản có định dạng. Cho phép tạo văn bản chứa các hình đồ hoạ. Khuôn dạng của Microsoft cho văn bản trong môi trường MS-DOS,
2.1 Văn bản
Khuôn dạng HTML(HyperText Markup Language).
Một số khái niệm.
Ra đời từ năm 1989 HIện nay: phiên bản HTML 4.01. HTML là khuôn dạng được dẫn xuất từ SGML bằng một DTD.
Trong một trang HTML có thể chứa các liên kết với các trang HTML khác. Trong một trang HTML có thể chứa các dạng thông tin khác nhau như: text, hình ảnh, video, âm thanh.
HTML là cơ sở của dịch vụ WWW. Hiển thị các trang HTML bằng các trình duyệt Web.
Một số đặc điểm.
Định dạng của trang Web được biểu thị qua các thẻ.
Các thẻ được biểu diễn qua dấu < và >.
Thẻ được ghi theo cặp: thẻ mở và thẻ đóng. VD:
: biểu diễn văn bản là một trang HTML.
29
2.1 Văn bản
Một số loại thẻ HTML.
: xác định văn bản HTML.
: phần đầu trang HTML. : xác định cỡ chữ.
: xác định paragraph
30
2.1 Văn bản
Ưu điểm của HTML. Đơn giản, dễ hiểu. Mô tả được cấu trúc văn bản. Mô tả được định dạng văn bản. Tạo được các kết nối trên mạng.
Nhược điểm.
Không tuân thủ theo chuẩn về cấu trúc cũng như định dạng văn bản. Các thuộc tính văn bản quá ít, do đó không tạo được những văn bản có cấu
Cần phải mở rộng khả năng của HTML.
31
trúc phức tạp.
2.1 Văn bản
Dạng văn bản XML(eXtensible Markup Language).
Dạng XML đươc W3C đưa ra vào 1998. XML là tập con của SGML, là đơn giản hoá của SGML cho viêc sử dụng
trên WWW. Về đặc tính:
XML là một siêu ngôn ngữ: là ngôn ngữ mô tả ngôn ngữ. XML là ngôn ngữ xác định cấu trúc, cho phép đưa ra lừ điển từ vựng và cấu trúc cú pháp của dữ liệu. XML cho phép phân tách nội dung văn bản và cách trình bày. Điều này ngược lại với HTML.
Kiểm tra cú pháp của một văn bản: DTD – document type definition
Một văn bản XML có định dạng chặt chẽ. Mỗi văn bản XML có một DTD và được định dạng theo DTD đó.
32
2.1 Văn bản
Giải mã văn bản XML.
Để đọc một văn bản XML, ta phải tách được thông tin trong văn bản đó. Sử dụng bộ phân tích cú pháp. Bộ phân tích cú pháp phải cho phép tách thông tin một cách thích hợp.
Ba dạng file.
File nội dung: văn bản XML. Định dạng hiển thị: tệp định kiểu XSL. Định dạng cách viết nội dung: DTD.
Một số dạng dữ liệu văn bản dựa trên XML:
OFX – Open Financial eXchange. MathML – Mathematical Markup Language. CML – Chemical Markup Language. SMIL – Synchronize Multimedia Integration Language.
33
2.1 Văn bản
Hiệu quả của XML:
Dễ đọc: không cần biết lý thuyết để hiểu nội dung văn bản XML. Tự mô tả và mở rộng. Cấu trúc mềm dẻo: cho phép mô hình hoá phần lớn các dạng thông tin văn
Tính vạn năng và cơ động. Khả năng triển khai: có thể được truyền theo các giao thức dùng để truyền
bản.
Tính tích hợp: một văn bản XML có thể được được mở trong mọi ứng dụng
text: HTTP.
Khả năng mở rộng: các văn bản XML có thể được sử dụng trong tất cả các
có cài bộ duyệt cú pháp XML.
XML trên thực tế được sử dụng để trao đổi dữ liệu và văn bản.
34
lĩnh vực ứng dụng.
2.1 Văn bản
Các thao tác trên văn bản
Các thao tác trên ký tự: các thao tác đơn giản nhất trên các ký tự và là thành phần cho các thao tác phức tạp hơn. Thể hiện thông qua kiểu ký tự.
cấu trúc của văn bản
Các thao tác trên xâu: các thao tác trên chuỗi các ký tự. Soạn thảo và biên tập văn bản: các thao tác thay đổi khuôn dạng và
của văn bản WYGIWYS.
Định dạng văn bản: thực hiện các thao tác đặt các thuộc tính về bố trí
bằng cách so sánh với mẫu hoặc theo các tiêu chí tìm kiếm.
So sánh mẫu và tìm kiếm: tìm kiếm những đoạn văn bản cho trước
35
Sắp xếp văn bản.
2.1 Văn bản
Các thao tác trên văn bản
Nén Huffman: tìm độ dài mã tối ưu theo tần xuất xuất hiện ký tự –
xuất hiện càng nhiều thì độ dài mã càng ngắn.
Nén Zip-Lempel: tìm kiếm những xâu lặp nhiều lần và thay bằng
con trỏ tới bảng các xâu.
Tỷ lệ nén: từ 1/2 đến 2/3 kích thước ban đầu.
Nén văn bản: dùng mã ASCII cần 7bit cho một ký tự. Lý thuyết chứng minh cần khoảng 1-2bit dể biểu diễn ngôn ngữ tự nhiên. Nén là phương pháp loại bỏ sự dư thừa này.
Mã hoá: các sơ đồ mã hoá đối xứng và mã hoá công khai. Phương pháp
36
DES(Data Encryption Standard) và RSA(Rivest-Shamir-Adleman)
2.2 Âm thanh
Các dạng âm thanh: tiếng nói, tiếng ồn, âm nhạc… Âm thanh là dạng tín hiệu tương tự. Âm thanh được sinh ra do các dao động của môi
trường truyền.
Các sóng âm được truyền trong các môi trường hỗ trợ
(không khí, kim loại, nước, …)
37
2.2 Âm thanh
Các thuộc tính của âm thanh
Ở nhiệt độ 15°C, tốc độ âm thanh chuẩn là: 340 m/s
Tốc độ - phụ thuộc vào nhiệt độ của môi trường
Cách đo âm thanh: quan sát các hiện tượng xung quanh như sấm chớp Âm thanh truyền cả trong môi trường lỏng và rắn.
38
v = 331.5 m/s + 0.6T
2.2 Âm thanh
Các thuộc tính của âm thanh
Tai người nghe thấy âm thanh trong khoảng 20 Hz – 20 kHz Tần số: tel: 4 kHz, AM: 7 kHz, FM: 15 kHz, HI-FI: 20 kHz, Audio CD: 22
Tần số: v = f.λ, và được tính bằng Hz.
Thính lực giảm theo tuổi tác. > 20 kHz: cao hơn khoảng nghe thấy, một số động vật có thể cảm nhận
kHz. 0 – 20 Hz: Thấp hơn khoảng nghe thấy, có thể cảm nhận qua cơ thể.
được âm thanh ở tần số này.
cao thiết bị Amplifier. Cường độ được tính theo dB.
Cường độ phụ thuộc vào biên độ, biên độ càng lớn thì cường độ càng
39
0-30 dB: tiếng thì thầm, 31-50 dB: đối thoại nhỏ, 51-70 dB: trao đổi bình thường, 71-90 dB: tiếng ô tô di chuyển, 91-110 dB: tiếng nhạc to có thể gây đau tai, > 110 dB: có thể gây điếc.
Bảng cường độ âm thanh
1*10-12 W/m2 1*10-11 W/m2 1*10-10 W/m2 1*10-6 W/m2 1*10-5 W/m2 1*10-4 W/m2 6.3*10-3 W/m2 1*10-2 W/m2 1*10-1 W/m2 1*101 W/m2 1*102 W/m2 1*104 W/m2
0 dB Ngưỡng nghe 10 dB Tiếng lá xào xạc 20 dB Tiếng huýt sáo 60 dB Nói chuyện thông thường 70 dB Tiếng xe cộ đường phố 80 dB Máy hút bụi 98 dB Dàn nhạc giao hưởng 100 dB Walkman at Maximum 110 dB Dàn nhạc rock 130 dB Ngưỡng đau 140 dB Máy bay quân sự cất cánh 160 dB Thủng màng nhĩ
40
2.2 Âm thanh
Các thuộc tính của âm thanh
trong một chu kỳ dao động của sóng
vT
v f
Bước sóng (wavelength) - Là quãng đường mà sóng truyền đi được
41
Bước sóng thường được đo là khoảng cách giữa hai đỉnh xung
2.2 Âm thanh
Âm sắc
tính vật lý của âm là tần số và biên độ
Là một đặc tính sinh lý của âm , được hình thành trên cơ sở các đặc
âm có tần số f1 thì đồng thời cũng phát ra các âm có tần số f2=2*f1,f3=3*f1, f4=4*f1,…, trong đó f1 được gọi là âm cơ bản,các tần số f2,f3,f4 ,…được gọi là các hoạ âm thứ hai,ba,bốn…..
42
Thực nghiệm chứng tỏ khi một nhạc cụ hoặc một người phát ra một
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Phản xạ: khi sóng âm chạm tới biên giới hai môi trường khác nhau thì có hiện tượng phản xạ, sóng phản xạ quay trở lại môi trường ban đầu, nó có thể trùng pha hoặc ngược pha với sóng ban đầu Có hai hiện tượng: Echo, Reverberation Bộ não con người có thể ghi nhớ âm thanh trong khoảng 0,1 s. Nếu sóng phản xạ đến tai ≤ 0.1 s so với sóng trước đó, ta có cảm giác
Trong trường hợp khác, ta sẽ thấy âm thanh lặp lại liên tục Echo. Nếu căn phòng có kích thước 17m x 17m x 17m. Môt người đứng trong
âm thanh kéo dài mãi Reverberation.
43
phòng phát ra tiếng động thì hiện tượng gì sẽ xảy ra ?
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Ứng dụng: trong nhà hát người ta thường làm tường sần sùi để cho bất kỳ
Phản xạ
ai ngồi vị trí nào đều có thể cảm nhận được các sóng phản xạ.
Khúc xạ
Là hiện tượng thay đổi hướng của sóng khi truyền từ môi trường này qua môi trường khác.
Nhiễu xạ
44
Là hiện tượng thay đổi hướng khi sóng đi qua khe hở hoặc vòng qua một vật cản trên đường đi của nó.
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Hiệu ứng Doppler
Tần số tăng lên khi nguồn tiến về phía ngưới quan sát và giảm đi khi
Là hiện tượng xảy ra khi nguồn sóng chuyển động tương đối với người quan sát và tốc độ chuyển động của nguồn âm chậm hơn so với tốc độ truyền âm.
f
(
)
f
0
v
v
v s
Ứng dụng:
Tiếng còi xe cấp cứu. Súng bắn tốc độ…
45
nguồn xa người quan sát.
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Shock wave - Là hiện tượng xảy ra khi nguồn sóng chuyển động đối với người quan sát, và tốc độ chuyển động của nguồn âm nhanh hơn so với tốc độ truyền âm
46
Ví dụ : Sonic boom
2.2 Âm thanh
Tai người
Cấu tạo của tai Tâm lý của mỗi người Âm thanh
Cách thức mà con người nghe liên quan đến 3 yếu tố
=> Tạo ra độ phức tạp của âm thanh:
47
Quá trình nghe gồm: Chuyển năng lượng của âm thanh thành năng lượng của sóng cơ học,sau đó lại chuyển thành tín hiệu thần kinh truyền đến não.Con người có thể phân biệt được : Độ cao thấp của âm thanh là nhờ nhận ra được tần số của âm thanh Độ to nhỏ của âm thanh:Là do phân biệt được biên độ Âm sắc: Là phân biệt được various frequencies
48
2.2 Âm thanh
Biểu diễn âm thanh
thanh âm nhạc.
Âm thanh là tín hiệu tương tự số hóa. Tần số lấy mẫu, ≥ 8 kHz đối với âm thanh thoại, ≥ 44 kHz đối với âm
bằng cách mã hóa sự khác biệt. Khi mã hóa: một mẫu được thay thế bằng một bit xác định dấu của sai
Lượng tử hóa sử dụng 8 hoặc 16 bit. Phương pháp mã hóa thông thường: PCM. ADPCM – Adaptive Differential PCM: giảm tỉ lệ dữ liệu của PCM
Khi giải mã: giá trị mẫu được xác định bằng cách nhân sai phân với hệ số
phân giữa mẫu đó và mẫu trước.
49
tỉ lệ và cộng vào mẫu trước đó ứng với dấu. ADPCM sử dụng trong các thiết bị CD, DVI Chuẩn ADPCM: CCITT G.721. Tỉ lệ nén: 4:1 đến 2:1
2.2 Âm thanh
Biểu diễn âm thanh AC’97 (Audio Code ‘97)
Chuẩn audio được Intel phát triển vào năm 1997 và tích hợp trong các
Hỗ trợ cho công nghệ Dolby bao gồm cả Dolby Pro Logic IIx (7.1 channel
thiết bị mainboard, modem, sound card. Lấy 9600 mẫu/s và dùng 20 bit để mã hóa cho một mẫu. 2004: AC’97 được thay thế bằng Intel HD Audio. Intel HD Audio – 192 kHz và 32 bit cho 2 kênh và 96 kHz, 32 bit cho 8 kênh.
Có khả năng multi-streaming cho phép người dùng một lúc có thể gửi 2
surround sound).
50
hay nhiều tín hiệu âm thanh trên cùng PC.
2.2 Âm thanh
Một số hệ thống loa phổ biến
4.0 Quadraphonic
4.0 Dolby Pro Logic
3.0 Dolby Surround
6.1 Dolby Digital EX
5.1 Dolby Stereo
51
Các khuôn dạng âm thanh
Dạng file WAV.
Lấy mẫu âm thanh 44KHz, lượng
Khuôn dạng RIFF – resource
tử hoá 16bit.
52
interchange file format. Khuôn dạng AIFF – audio interchange file format. Số hoá 44.1KHz, 16bit. Tương đương WAV cho Apple. Đầu file: chuỗi ký tự ASCII: RIFF xác định khuôn dạng file WAV. Sau đó đến độ dài khối thông tin. Sau đó đến xâu “WAVE”
Các khuôn dạng âm thanh
Dạng âm nhạc.
Là khuôn dạng tổng hợp. Cho phép nhạc công kiểm soát và điều khiển các dụng cụ âm nhạc. Lưu trữ các thông điệp âm nhạc cho phép điều khiển dụng cụ âm nhạc:
Nốt sẽ được chơi. Dụng cụ sẽ được chơi. Cường độ âm thanh.
Thiết bị chơi nhạc không được xác định trong khuôn dạng. Dung lượng dữ liệu nhỏ hơn 1000 lần so với dữ liệu âm thanh số chất
lượng CD.
Chất lượng âm nhạc phụ thuộc vào chất lượng thiết bị ngoại vi dùng để
chơi nhạc.
53
Các khuôn dạng âm thanh
Khuôn dạng MIDI – musical instrument digital interface.
Cung cấp 16 kênh âm thanh cho phép 16 dụng cụ âm nhạc chơi đồng thời. Xác định các nốt sẽ được chơi, trên dụng cụ âm nhạc nào và âm lượng. Dung lượng thông tin cho 2 phút âm nhạc:
MIDI 20Ko. WAV chất lượng CD: 20Mo
Các file dễ dàng được soạn thảo bởi những chương trình soạn thảo MIDI. Dễ dàng thay đổi thiết bị âm thanh. Các hạn chế của khuôn dạng MIDI
Chất lượng âm thanh phụ thuộc vào: thiết bị ngoại vi và số lượng kênh âm thanh.
Việc mã hoá dụng cụ âm nhạc không bình thường
54
2.2 Âm thanh
Các thao tác đối với âm thanh số
Trễ
Lưu trữ Truy xuất (lưu trự và tìm kiếm, trích chọn) âm thanh số Các hiệu ứng âm thanh, lọc
Lọc nhiễu
Chuyển từ ADPCM về PCM hoặc ngược lại (quá trình giải nén và nén)
55
Chuyển đổi khuôn dạng âm thanh
2.3 Hình ảnh tĩnh
Ảnh sáng. Tần số. Cường độ.
Màu sắc:
Phụ thuộc vào bước sóng. <380nm: tia cực tím. 380nm – 450nm: tia tím. 450nm – 490nm: tia xanh lơ. 490nm – 560nm: xanh lá cây. 560nm – 590nm: vàng. 590nm – 640nm: da cam. 640nm – 760nm: đỏ. >760nm – hồng ngoại.
Cảm nhận ánh sáng
Cảm nhận theo bước sóng ánh sáng bàng các tế bào nón. Có ba dạng tế bào nón cảm nhận theo ba màu: đỏ, xanh lá cây, xanh
da trời.
Các tế bào này cảm nhận theo bước sóng từ 400nm – 700nm. Chứng mù màu.
56
2.3 Hình ảnh tĩnh
Tổng hợp màu: Tổng hợp dương.
Màu sắc được xác định như tổng cân bằng của ba màu cơ bản. Ba màu cơ bản: đỏ, xanh lá cây, xanh da trời. Mô hình RGB.
Các màu cơ bản: Red, Green, Blue. Màu là tổng hợp của ba màu cơ bản theo thành phần.
Nguyên lý chính của thiết bị màn hình.
Màu sắc được xác định như cân bằng giữa màu trắng và ba màu cơ
Tổng hợp âm.
Ba màu ngược với Red, Green, Blue là Cyan, Magenta, Yellow. Mô hình CMYK.
Ba màu ngược với RGB: CMY. Màu là tổng hợp của ba màu cơ bản là ánh sáng phản xạ trên bề mặt của vật. Tổng của ba thành phần bằng nhau là màu đen. CMYK: màu tổng với màu đen tuyền.
Nguyên lý của các thiết bị in.
57
bản.
2.3 Hình ảnh tĩnh
Tổng hợp âm
Tổng hợp dương
58
2.3 Hình ảnh tĩnh
Ảnh: thông tin về vật thể hay quang cảnh được chiếu sáng mà con người quan sát và cảm nhận bằng mắt và hệ thống thần kinh thị giác.
Ảnh đơn được biểu diễn bởi hàm độ chói và các biến tọa độ trong
mặt phẳng ảnh I(x,y).
Pixel: phần tử nhỏ nhất để biểu diễn ảnh, về nguyên tắc mắt
thường không thể phân biệt được hai mức kề nhau.
Pixel thiết bị: Màn hình máy tính là tập hợp của nhiều điểm nhỏ -
pixel. Mỗi pixel gồm một cặp x,y và màu.
Pixel có thể lưu trữ bằng:
1 bit - ảnh nhị phân (0-1). 8 bit - ảnh đa mức xám (0-255). 24 bit - ảnh màu (3 kênh RGB).
59
2.3 Hình ảnh tĩnh
Ảnh 8 bit hay 16 bit
Ảnh 8 bit RGB biểu diễn được hơn 16,7 triêu màu. Tuy nhiên các phép xử lý ảnh đều gây mất mát thông tin đặc biệt là với ảnh 8 bit.
Cho phép biểu diễn nhiều sắc thái màu hơn (65536 mức trên một kênh). Thông tin của ảnh sẽ nhiều hơn khi ảnh được xử lý, lương tin mất
Ảnh 8 bit được thay thế bằng ảnh 16 bit
Nhiều công cụ như Photoshop CS hỗ trợ xử lý ảnh 16 bit với đầy đủ các
không đáng kể.
Máy NIKON hỗ trợ ảnh nguyên thể 12 bit. Ảnh 48 bit thực ra là ảnh màu RGB (16 bit/kênh).
60
tính năng.
2.3 Hình ảnh tĩnh
Các thiết bị thu nhận ảnh
scanner chuyên dụng.
Máy camera + bộ chuyển đổi tương tự thành số AD hoặc máy quét
Cảm biến: biến đổi năng lượng quang học thành năng lượng điện. Tổng hợp năng lượng điện thành ảnh điện.
Số hóa ảnh
Hệ thống thu nhận ảnh thực hiện hai quá trình:
cách quét ảnh theo hàng ngang.
Lấy mẫu: áp dụng cho ảnh có giải tần giới hạn được thực hiện bằng
đầu vào.
61
Lương hóa ảnh: thực hiện ánh xạ từ một biến liên tục u (biểu diễn giá trị độ sáng) sang một biến rời rạc u* với các giá trị thuộc tập hưu hạn: Bộ lượng hóa không nhớ: giá trị đầu ra chỉ phụ thuộc duy nhất vào
2.3 Hình ảnh tĩnh
Biểu diễn màu
Dựa vào các màu gốc, việc xác định màu gốc có liên quan đến các khái niệm sinh học hơn là vật lý. Mắt người phản ứng khác nhau đối với ánh sáng khác nhau.
Mô hình màu RGB sử dụng mô hình bổ xung trong đó ánh sáng đỏ, xanh là cây và xanh lam tổ hợp với nhau để tạo thành nhiều màu khác. RGB được dùng trong đồ họa máy tính, ống tia âm cực…
Kiểu 16 bit: 555 hoặc 565. Kiểu 32 bit: được đưa ra để phù hợp hơn với các phần cứng của máy tính. 32 bit RGBA: RGB + Alpha channel
62
2.3 Hình ảnh tĩnh
Biểu diễn màu
Quy định không gian màu được tạo bởi một độ sáng Y (luminance) và hai
YUV
Y về cơ bản giống tín hiệu truyền hình ti vi đen trắng, trong khi U, V có
thành phần màu (chrominance).
YUV có thể dễ dàng xử lý loại bỏ bớt thông tin để tiết kiệm băng thông. Được sử dụng trong giải thuật nén video như MPEG-2
thể bỏ qua.
Brightness: độ chói. Hue: sắc lượng, hay sắc thái màu Saturation: độ bão hòa.
63
HSV
2.3 Hình ảnh tĩnh
Hệ thống xử lý ảnh
64
2.3 Hình ảnh tĩnh
Các vấn đề về xử lý ảnh tĩnh: Thu nhận ảnh: số hoá ảnh. Xử lý ảnh: tạo ảnh, biên tập ảnh, hiển thị và thao tác ảnh trực quan. Lưu trữ ảnh:mã hoá ảnh, nén và giải nén; chất lượng nén; lưu trữ
ảnh, các khuôn dạng lưu trữ ảnh.
Thay đổi các khuôn dạng video, hoạt hình..
Nhiều khuôn dạng biểu diễn làm giảm tính tương thích.
Vấn đề tăng chi phí truyền ảnh.
Các tiêu chuẩn chất lượng ảnh:
Phục hồi ảnh: hiển thị ảnh, chiếu ảnh; cảm nhận ảnh. Phổ biến ảnh:
65
Tiêu chuẩn về màu sắc: số lượng màu sắc dùng biểu diễn ảnh. Tiêu chuẩn về độ phân giải: số lượng điểm dùng để biểu diễn ảnh.
2.3 Hình ảnh tĩnh
Ảnh 3D
Hình ảnh 3D là tập hợp của các điểm trong không gian 3 chiều được kết nối với nhau bằng các đoạn thẳng, tam giác hoặc mặt phẳng cong…
Sử dụng cấu trúc đặc. Sử dụng được biên.
66
Hình ảnh 3D được tạo ra bằng tay, sử dụng thuật toán hoặc scanner. Các cách biểu diễn hình ảnh 3D:
2.3 Hình ảnh tĩnh
Các khuôn dạng ảnh:hai dạng chính
Ảnh vector.
Là các dữ liệu đồ hoạ. Các dạng PIC, WMF, ... Một ảnh được coi là tập hợp của các hình hình học đơn giản.
Ảnh bitmap.
Các dạng file: BMP, GIF, TIFF, JPG, ...
Là các dữ liệu hình ảnh.
67
ảnh được biểu diễn bằng ma trận các điểm. Mỗi điểm có các giá trị tương ứng với các màu.
Các khuôn dạng ảnh
Ảnh vector
đối tượng của ảnh.
ảnh được hiểu như tổ hợp các hình hình học đơn giản. ảnh được hiển thị bằng cách vẽ các hình đồ hoạ tương ứng với các
68
Có ba dạng đối tượng rời rạc trên ảnh: Các điểm rời rạc: các đối tượng điểm. Các đường rời rạc: các đối tượng đường. Các mặt rời rạc: các đối tượng mặt.
Các khuôn dạng ảnh
Các ảnh vector. Các ưu điểm:
Mã hóa ảnh bằng các hình đơn giản. Gọn, kích thước nhỏ.
Thay đổi kích thước đơn giản, không bị mất thông tin. Sửa dễ dàng do các phần tử của ảnh độc lập.
Các nhược điểm:
Không biểu diễn được các ảnh chụp. Xử lý các ảnh phức tạp với nhiều đối tượng gặp
nhiều khó khăn.
Khuôn dạng không chuẩn, các trình duyệt web
không nhận dạng được.
Khuôn dạng WMF:
Chứa các thông tin về các đối tượng.
Một file WMF có thể chứa 65535 đối tượng.
69
Các khuôn dạng ảnh
Ảnh bitmap
biểu diễn màu.
Hình ảnh được biểu diễn thông qua ma trận các điểm. Giá trị các điểm ảnh chỉ tới các mầu của điểm tương ứng với các sơ đồ
70
Biểu diễn màu theo sơ đồ RGB. Hai sơ đồ mã hóa màu: RGB và CYMK. Không gian màu và chuyển đổi: RGB(1,1,1) -> CMY (0,0,0) C=1-R; G=1-M; R=1-C; Y=1-B; M=1-G;B=1-Y;
Các khuôn dạng ảnh
Mã hóa màu:
Giá trị của điểm ảnh. Màu tương ứng theo giá trị đó tùy theo bảng màu.
Phương pháp đơn giản.
Đối với mỗi điểm ảnh giá trị của điểm ảnh là giá trị của màu. Màu được lựa chọn theo mô hình RGB. Đối với mỗi pixel:
Mã hoá một thành phần RGB sử dụng n bit. Mô hình màu theo RGB sẽ được mã hoá theo 3 x n bit.
Số lượng màu cho phép đối với mô hình RGB: 2n x 2n x 2n.
Màu thực: true color: sử dụng 8 bit cho một thành phần màu, do đó số lượng màu
cho phép biểu diễn sẽ là: 224 màu.
71
Các khuôn dạng ảnh
Thành phần thứ tư là phần mở rộng có độ dài 8 bit để biểu diễn.
Kênh alpha. Kênh alpha dùng để biểu diễn tính trong suốt của ảnh (transparence).
Tính chất này dùng để tránh hiệu ứng bậc thang khi có nhiều ảnh chồng lên nhau.
Biểu diễn bảng màu.
N được lựa chọn trong số 2m x 2m x 2m màu. m chỉ số lượng bit để biểu diễn một thành phần màu. N là vị trí tương ứng trong bảng màu.
Kích thước khối thông tin ảnh:
X * Y * n trong đó X: số cột,Y: số hàng, n: số bit dùng để mã hoá một ảnh.
ảnh bitmap cho chất lượng cao.
72
2.3 Hình ảnh tĩnh
Một số định dạng ảnh phổ biến
hiệu quả với tỷ lệ nén tới vài chục lần. Sử dụng phương pháp nén mất mát thông tin. Các bước gồm: Phân khối, biến đổi Cosin rời rạc (DCT), lượng tử hóa và
JPEG (Joint Photographic Experts Group): phương pháp nén ảnh
mã hóa.
.bmp hoặc .dib. Bitmap header (14 bytes): giúp nhận dạng tệp tin bitmap. Bitmap information (40 bytes): lưu chi tiết hiển thị ảnh. Color pallete (4x bytes), x là số màu của ảnh. Bitmap data: dữ liệu ảnh.
BMP: Các tệp tin đồ họa lưu dưới dạng BMP và có phần mở rộng
bitmap sử dụng ít hơn 256 bit.
GIF (Graphics Interchange Format): là định dạng tệp tin hình ảnh
fax, xử lý văn bản, nhận dạng chữ viết…
73
TIFF (Tagged Image File Format): được sử dụng trong quét ảnh, gửi
2.4 Hình ảnh động
Video
Video là chuỗi các hình ảnh tĩnh được trình diễn trong một đơn vị thời gian khiến người xem có cảm giác như các sự vật trên đó như đang chuyển động.
PAL, NTSC, MPEG-4 hay DVI
Video có thể lưu trữ và truyền trong nhiều môi trường khác nhau:
Framework eXtension (AFX).
3D video được quy định trong chuẩn MPEG-4 Part 16 Animation
Số lượng khung (frame) trên một giây.
Các đặc tính của video:
74
Interlacing Độ phân giải Kích thước khung hình Phương pháp nén video Tốc độ truyền (đối với video số)
2.4 Hình ảnh động
Video số
Truy cập ngẫu nhiên trực tiếp thuận tiện, Việc tạo, lưu trữ và ghi đọc nhiều lần không ảnh hưởng đến chất lượng
Thuận lợi:
Không cần xung xoá và xung đồng bộ. Xử lý thuận tiện, không gặp trở ngại về giới hạn tần số, băng thông.
ảnh.
Tuy nhiên, tín hiệu số gặp một số trở ngại xoay quanh vấn đề về tính
Khó khăn
hiệu quả, chẳng hạn bộ lọc số có giá thành tương đối cao.
Thuận lợi trong việc xử lý đối với tín hiệu video thành phần, nhưng băng
Tiêu chuẩn lấy mẫu màu:
75
thông yêu cầu lớn.
2.4 Hình ảnh động
Video
Số lượng khung hình trên một giây (Frame rate) Thông thường từ 6-25 frame/s, tùy theo camera. PAL (EU), SECAM (EU): 25 frame/s NTSC (US, Japan): 29,97 frame/s
Interlacing
Interlacing: Chia màn hình thành các dòng, mỗi lần chùm electron chỉ quét dòng chẵn hoặc lẻ tiết kiệm băng thông đường truyền. NTSC, PAL, SECAM sử dụng chế độ interlacing: PAL 576i50. Progressive: dòng electron sẽ quét tất cả màn hình cho hình ảnh chất
lượng cao, vd: HDTV.
Được tính theo đơn vị pixel đối với dữ liệu số và dòng quét ngang, quét
Độ phân giải
NTSC: 720/704/640x480i60. PAL: 768/720x576i50. HDTV: 1920x1080p60
76
dọc với dữ liệu tương tự.
2.4 Hình ảnh động
Video
Màn hình truyền thống: 4:3 Màn hình HD: 16x9 widescreen.
Kích thước màn hình
Các phương pháp nén video
MPEG-2: sử dụng cho DVD và ti vi truyền từ vệ tinh. MPEG-4 dùng cho video gia đình.
Intraframe compression: nén tương tự như kỹ thuật nén ảnh. Interframe compression: nén dựa trên sự khác biệt giữa các frame (chỉ lưu sự khác biệt).
Tốc độ càng cao, chất lượng video càng tốt.
Video CD; 1 Mbps. DVD: 5 Mbps. HDTV: 20 Mbps.
77
Tốc độ truyền (bitrate):
2.4 Hình ảnh động
Hoạt hình (Animation)
được chiếu tiếp diễn liên tục.
Tạo ra ảo giác quang học về sự chuyển động do nhiều hình ảnh tĩnh
vision).
Nguyên lý: dựa vào hiện tượng lưu ảnh của mắt (persistence of
GIF, MNG, SVG, Flash kích thước nhỏ, cho phép truyền trên máy tính
Một số định dạng đồ họa:
Motion capture
Kỹ thuật lưu lại chuyển động và tái hiện thông qua mô hình mô phỏng. Được sử dụng rộng rãi trong các lĩnh vực thể thao, giải trí…
78
thông qua Internet.
2.4 Hình ảnh động
Một số các định dạng video
giới thiệu vào tháng 11 năm 1992. AVI là tập tin có thể chứa cả âm thanh và video dữ liệu trong một container cho phép đồng bộ tập tin âm thanh-với-video. AVI là một trong những định dạng của RIFF. Phần header (56 byte) chứa các thông tin :
Thời gian trễ giữa các frame Tốc độ dữ liệu, Số lượng frame, Số dòng dữ liệu Kích thước video ….
AVI (Audio Video Interleave) là một định dạng của Microsoft được
79
MKV (Matroska Multimedia Container) - là một chuẩn mở miễn phí định dạng container. Được công bố vào ngày 06 tháng 12 2002, Matroska là một định dạng tập tin có thể chứa đựng một số lượng không giới hạn video, âm thanh, hình ảnh hoặc phụ đề trong một tập tin duy nhất.
2.4 Hình ảnh động
Một số các định dạng video
MPEG (Moving Picture Expert Group) được ra đời vào năm 1988 nhằm mục đích chuẩn hoá cho nén tín hiệu âm thanh và video Mpeg-1 là chuẩn lưu trữ và phục hồi ảnh động và Audio trong lưu trữ
Mpeg-2 là chuẩn cho TV số Mpeg-4 là chuẩn cho các ứng dụng MultiMedia Mpeg-7 chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin
Media
hình và video phone H261 – phục vụ cho truyền qua ISDN ở tốc độ 64 kbps
Sử dụng CIF và QCIF
H263 – cải tiến cho video tốc độ thấp, có thể truyền trên mạng thoại công
H26x – Do tổ chức ITU đưa ra phục vụ cho dịch vụ hội nghị truyền
80
cộng PSTN
2.4 Hình ảnh động
Một số dạng tín hiệu video số theo các chuẩn
Sử dụng trong chuẩn H261, dễ chuyển sang chuẩn PAL hay NTSC Y resolution: 352 x 288, 8 bits/pixel(sample) CrCb/UV resolution: 176 x 144 Frame rate: 30 frames/second progressive QCIF:Quarter Common Intermediate Format Y resolution: 176 x 144, 8 bits/pixel (sample) CrCb/UV resolution: 88 x 72 Frame rate: 30 frames/second progressive
CIF : Common Intermediate Format
Resolution: 704 x 480, 30 frames/second interlaced
TV –NTSC
Resolution: 720 x 480, 24 –30 frames/second progressive
81
DVD –NTSC
2.4 Hình ảnh động
Các vấn đề liên quan đến thao tác:
Tạo, biên tập theo phương pháp tương tự và số Các phần mềm hiển thị và thao tác với ảnh động Hiển thị và thao tác chuỗi video Chèn các hiệu ứng thích hợp
Xử lý
Mã hóa và nén
Lưu trữ:
Mất thông tin khi nén dữ liệu
Lưu trữ, các khuôn dạng lưu trữ
Hiển thị ảnh, chiếu ảnh, cảm nhận ảnh
82
Phục hồi ảnh
2.4 Hình ảnh động
Đồng bộ giữa audio và video
khác nhau cả về thời gian và không gian
Tại sao ? Dữ liệu đa phương tiện : dữ liệu từ nhiều nguồn phương tiện (media)
dòng dữ liệu nguồn Một số khái niệm
Nhiệm vụ của đồng bộ: xác lập lại quan hệ thời gian thực giữa các
Đồngbộ liêntục: đồng bộ bám liên tục theo thời gian, Đồngbộ điểm: đồng bộ các khối dữ liệu tại các thời điểm, Đồngbộ trongmộtdòngdữ liệuphươngtiện (Intramedia
Synchronization) : xác lập lại quan hệ thời gian giữa các sự kiện trong 1 dòng dữ liệu của 1 phương tiện, đơn luồng
quan hệ thời gian giữa các dòng dữ liệu phương tiện.
83
Đồngbộ giữacácdòng(Intermediasynchronization) : xác lập lại