TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
CÔNG CỤ MULTIMEDIA
Giảng viên: Trần Nguyên Ngọc
Bộ môn: Truyền thông và Mạng máy tính
1
E-mail: ngoctn@soict.hut.edu.vn
MULTIMEDIA
Những khái niệm cơ bản của Multimedia
Các dạng dữ liệu Multimedia
Nén thông tin đa phương tiện và các chuẩn
Văn bản.
Âm thanh.
Hình ảnh tĩnh và đồ họa.
Hình ảnh động.
2
Nhu cầu nén đa phương tiện
Nén không mất thông tin và nén mất thông tin
Phương pháp nén văn bản
Phương pháp nén âm thanh
Phương pháp nén ảnh tĩnh
Phương pháp nén ảnh động
1. Những khái niệm cơ bản của Multimedia
Khái niệm Multimedia
Lịch sử và đối tượng của Multimedia
Các dạng dữ liệu của kỹ thuật Multimedia
Các thiết bị Multimedia
Các lợi thế, hạn chế của kỹ thuật Multimedia
Các ứng dụng của kỹ thuật Multimedia
3
1.1 Khái niệm về công cụ Multimedia
Định nghĩa: Multimedia là kỹ thuật tích hợp trên một nền thống nhất các
dạng dữ liệu khác nhau với mục đích thao tác bằng các kỹ thuật tương
tác trực tiếp có sự hộ trợ của máy tính.
Tùy các dạng dữ liệu khác nhau, nhưng thao tác thích hợp.
Thu thập dữ liệu, xử lý dữ liệu, truyền dữ liệu, truy xuất dữ liệu (information retrieval).
Các dạng dữ liệu: văn bản, âm thanh, hình ảnh tĩnh, hình ảnh động.
Thiết bị: CD-ROM, Disc…
Các thao tác:
Các thiết bị vật lý và phần mềm.
Xử lý số.
Các thiết bị tính toán:
Lựa chọn phần tử cần thao tác.
Thời điểm lựa chọn các phần tử thao tác.
4
Tương tác trực quan:
1.2 Lịch sử và đối tượng của công cụ Multimedia
Lịch sử của kỹ thuật Multimedia
nghệ thông tin và truyền thông.
Multimedia là sự kết hợp của các kỹ thuật: âm thanh, hình ảnh, công
Ra đời vào những năm 80 khi xuất hiện các đĩa hình sử dụng kỹ
thuật tương tự và dùng để lưu trữ âm thanh, hình ảnh tĩnh và các
đoạn video.
Nguyên nhân phát triển
Một số máy tính vào những năm 1990 cũng được gọi là multimedia
computer bởi nó có thể chứa đồng thời hàng trăm megabyte các
khuôn dạng dữ liệu khác nhau.
Kỹ thuật lưu trữ
Kỹ thuật nén và giải nén dữ liệu
Kỹ thuật truyền dữ liệu
Khả năng tính toán và xử lý của máy tính tăng nhanh
5
Sử dụng được các kỹ thuật tiên tiến
1.2 Lịch sử và đối tượng của công cụ Multimedia
Công nghệ liên quan đến Multimedia
Hiện thực ảo
Hội thảo truyền hình
Lasershow (kết hợp ánh sáng, hình ảnh, âm thanh)
6
Các hệ thống multimedia
Các hệ thống truyền thông điệp Multimedia
Hội thảo truyền hình
Hiện thực ảo
Mạng Internet
1.2 Lịch sử và đối tượng của công cụ Multimedia
Đối tượng của Multimedia
hình ảnh, video.
Thu nhận, quản lý và thao tác các số, văn bản, âm thanh, đồ họa,
Thao tác trên các thiết bị khác nhau
Kết hợp kỹ thuật tương tự và kỹ thuật số
Yêu cầu
Số hóa thông tin
Dung hòa khả năng lưu trữ thông tin, truyền thông tin, chất lượng và giá
Lưu trữ và quản lý một số lượng lớn thông tin
7
thành
1.3 Các dạng dữ liệu Multimedia
Dữ liệu số
Các tín hiệu vật lý là liên tục theo thời gian
Quá trình xử lý trên máy tính là xử lý số
Vấn đề số hóa tín hiệu: chuyển tín hiệu tương tự thành tín hiệu số
Vấn đề nảy sinh: sai số Mất mát thông tin
Lấy mẫu
Lượng tử hóa
hiệu. Định luật Nyquist - Shannon: Nếu tần số lấy mẫu lớn hơn hoặc bằng
2 tần số có ý nghĩa cao nhất thì mẫu lấy được sẽ phản ánh tốt nhất
tín hiệu ban đầu.
Ứng dụng trong các lĩnh vực lý thuyết thông tin, viễn thông và xử lý tín
8
1.3 Các dạng dữ liệu Multimedia
Các dạng dữ liệu multimedia
Dữ liệu rời rạc
Các dạng dữ liệu truyền thống: văn bản, số liệu
Tín hiệu âm thanh: tín hiệu một chiều liên tục
Số hóa tín hiệu âm thanh
Âm thanh: tiếng ồn, âm nhạc, tiếng nói…
Tín hiệu ảnh: tín hiệu hai chiều liên tục trên miền không gian
Số hóa ảnh
Ảnh tĩnh: đồ họa, ảnh
Chuỗi các ảnh
Tín hiệu theo thời gian, phụ thuộc vào hai chiều không gian và thời gian
9
Ảnh động: hoạt hình, video
1.4 Các thiết bị Multimedia
Các thiết bị số
Máy tính số
Các thiết bị số hóa video, audio
Các thiết bị tương tự
Các thiết bị đồng bộ
Video camera
Microphone
Videodisc (tape), Audiodisc (tape) player, recorder
Các thiết bị tương tác
Màn hình, chuột…
10
Hỗ trợ đồng bộ về thời gian
1.5 Mạng truyền thông đa phương tiện
Băng thông
B-ISDN, ATM
Thời gian thực
Độ tin cậy
Đảm bảo chất lượng dịch vụ, QoS
Yêu cầu băng thông lớn… GbNetwork
Các công nghệ truyền dẫn băng thông rộng
lỗi cực đại 1%.
Các mô hình cung cấp dịch vụ
Các yêu cầu dịch vụ: băng thông 64 kbps, trễ cực đại 100 ms, tỷ lệ
11
Voice over internet protocol (VoIP):
Băng thông: 24 kbps – 90 kbps
Trễ cực đại ~ 100 ms (chất lượng tốt) và không vượt quá 400 ms
Tỷ lệ mất gói tin ~ 4% - 5%
1.6 Ưu điểm và hạn chế của công nghệ Multimedia
Ưu điểm
Nhược điểm
Tích hợp trên một nền thống nhất các dạng dữ liệu khác nhau
Khả năng thao tác dữ liệu
Khả năng lưu trữ và trích xuất dữ liệu
Mức độ trung thực của các phiên bản dữ liệu
Dữ liệu số được biểu diễn trên cùng hệ nhị phân
Cấu trúc dữ liệu có nhiều nguồn gốc khác nhau
quyền sử dụng
Các khuôn dạng dữ liệu khác nhau làm cho tính tương thích kém
Khó khăn trong việc quản lý quyền sở hữu cũng như kiểm soát
12
Quá trình số hóa dữ liệu làm dữ liệu bị rời rạc hóa Sai số
1.7 Các ứng dụng của công nghệ Multimedia
Các hệ thống soạn thảo và sản xuất
Các hệ thống soạn thảo văn bản, bảng biểu
Các hệ thống xử lý số video
Các hệ thống trình diễn
Các hệ thống dạy học
Các khóa học trực quan
Các lớp học trên mạng sử dụng công nghệ Multimedia
13
Các phần mềm chương trình (PowerPoint)
Các hệ thống tương tác
Các hệ thư mục như: văn bản, âm thanh, hình ảnh, video
1.7 Các ứng dụng của công nghệ Multimedia
Các hệ mô phỏng
Hiện thực ảo
Các hệ thống mô phỏng: các hệ điều khiển, kỹ thuật hàng không, trò
chơi.
Trong truyền thông
14
Điện thoại qua mạng IP (VoIP)
Phân phối dữ liệu đa phương tiện qua mạng
Hội thảo truyền hình từ xa
Điện thoại truyền hình
Phụ lục
Dạng dữ liệu
Công cụ
Microsoft Office Word, Corel WordPerfect, Tex, Latex
Văn bản
Đồ họa
Corel Draw, Adobe Illustrator, Macromedia, Adobe ImageReady, Macromedia Flash
Ảnh
Adobe Photoshop, Macromedia Fireworks
Audio
Sony Sound Edit Pro, Sony Sound Forge for Windows, Sony Acid
Hoạt họa
Macromedia Flash, AutoDesk AutoCAD, Discreet 3D Studio (MAX)
Video
Adobe Premiere, Ulead Media Studio Pro, Microsoft Movie Maker, Apple iMovie
Xử lý nhiều kiểu dữ liệu
Macromedia Dreamweaver, Microsoft Front Page, Adobe Page Mill, Microsoft PowerPoint with
Producer
Các chương trình cho phép thao trên số, văn bản, hình ảnh, video
15
2. Các dạng dữ liệu Multimedia
Các dạng dữ liệu Multimedia gồm
16
Các dạng dữ liệu truyền thống: văn bản, số liệu…
Âm thanh: tiếng ồn, âm nhạc, tiếng nói…
Hình ảnh tĩnh: đồ họa, ảnh
Ảnh động: animation, video
2.1 Văn bản
Dữ liệu văn bản kinh điển: plain text
Đơn giản, không đòi hỏi phải xử lý nhiều.
Mã hóa bởi bộ mã ASCII, ISO/IEC 646 hoặc EBCDIC.
Chuyên dùng để tạo các tệp tin cấu hình, thư điện tử do tính tương thích cao.
Dạng Rich Text: kiểu chữ, cỡ chữ, màu chữ…
Các vấn đề
Nhập: gõ phím, tự động nhận dạng text.
Xử lý: tạo văn bản và chỉnh lý, biên tập theo nguyên tắc WYSIWYG (What
Lưu trữ: tách biệt nội dung và cấu trúc, mã hóa và nén, nén không mất thông
you see is what you get).
Hiển thị: hiển thị và cảm giác.
Vấn đề phổ biến: thường gặp sự không tương thích giữa các văn bản.
17
tin.
2.1 Văn bản
Biểu diễn văn bản
ASCII – American Standard Code for information interchange là
bộ mã mã hóa ký tự và hỗ trợ biểu diễn văn bản trên máy tính và
các thiết bị khác liên quan.
Trước khi ASCII được phát triển, người ta sử dụng các bộ mã để mã
CCITT ≥ 64 ký tự (tương đương với 6 bit).
Các công nghệ băng bấm lỗ thời bấy giờ cho phép 8 bit cùng được lưu
hóa 26 ký tự, 10 chữ số và khoảng từ 11 – 25 biểu tượng đặc biệt, ngoài
ra còn một số các ký tự điều khiển khác nhằm tương tích với chuẩn
CCITT (Consultative Committee International Telephone and Telegraph)
Chính vì thế bên cạnh 7 bit biểu diễn cho một ký tự, chúng ta có thêm 1
bit khác gọi là parity bit để có thể sửa lỗi xảy ra trong quá trình truyền
dẫn.
18
tại một vị trí.
2.1 Văn bản
Biểu diễn văn bản
Bảng mã ASCII: Sử dụng 7 bit để biểu diễn một ký tự, ngoài ra còn có một bit (parity bit) chuyên dùng để sửa lỗi.
19
2.1 Văn bản
Biểu diễn văn bản
Bộ mã chuẩn dùng làm bộ mã duy nhất cho tất cả các ngôn ngữ trên thế
Mã Unicode
Hỗ trợ các ký tự tượng hình phức tạp như tiếng Trung Quốc, tiếng Thái.
Unicode chiếm 1.114.112 ((16+1)*65536) code point, đã gán 96000 mã chữ.
Unicode chia làm 17 mặt phẳng. Mỗi mặt gồm 65536 code point.
20
giới.
2.1. Văn bản
Mã Unicode ( tiếp )
Mặt phẳng đầu tiên (plane 0), "Mặt phẳng đa ngôn ngữ căn bản" (Basic
Multilingual Plane- BMP), là nơi mà đa số các ký hiệu được gán mã.
BMP chứa các ký hiệu cho hầu hết các ngôn ngữ hiện đại đặc biệt là các
ngôn ngữ CJKV (Hán-Nhật-Hàn-Việt).
Hai mặt phẳng tiếp theo được dùng cho các ký tự "đồ họa".
Mặt phẳng 1, "Mặt phẳng đa ngôn ngữ bổ sung" (Supplementary Multilingual
Plane- SMP), được dùng chủ yếu cho các loại chữ viết cổ, ví dụ Egyptian
hieroglyph (chưa được mã hóa), nhưng cũng còn được dùng cho các ký hiệu
âm nhạc.
Mặt phẳng 2, (Supplementary Ideographic Plane- SIP), được dùng cho
khoảng 40000 chữ Trung Quốc ít gặp mà đa số là các ký hiệu cổ, ngoài ra
cũng có một số ký hiệu hiện đại.
Mặt phẳng 14 hiện chứa một số các ký tự thẻ ngôn ngữ không được
256 mã đầu tiên phù hợp với ISO 8859-1
17 mặt phẳng gồm :
Mặt phẳng 15 và Mặt phẳng 16 được mở cho các sử dụng cá nhân.
21
khuyến khích và một số ký hiệu lựa chọn biến thể.
2.1 Văn bản
Các dạng mã Unicode : UTF-32, UTF-16 và UTF-8
UTF-32 : sử dụng 32 bit cho mỗi ký tự, được gọi là
UTF-32 và ISO/IEC 10646 gọi là UCS-4
UTF-16/UCS-2
16 bit để mã hóa các ký tự BMP.
Mã hóa dùng Unicode 20 bit. Trong Windows NT, CE người ta dùng
Most Significant: U+D800 – U+DBFF
Least Significant: U+DC00 – U+DFFF
D800 DC00 U+00010000
DBFF DFFF U+0010FFFF
Bộ mã sử dụng cặp thay thế UTF-16
22
Một code point có 20 bit được chia làm hai nhóm 10 bit:
2.1 Văn bản
UTF-8
Mã hóa các xâu ký tự theo UCS hoặc Unicode theo dạng mỗi ký tự
dùng 2 hoặc 4 byte – tương ứng các sơ đồ mã hóa UCS-2 và UCS-4.
Sơ đồ mã hóa UTF-8
UTF-8 được thiết kế để tương thích với chuẩn ASCII. UTF-8 có thể
sử dụng từ một (ASCII) cho đến 6 byte để biểu diễn một ký tự.
tương thích với các hệ thống hiện tại
U+0000 – U+007F: các ký tự ASCII.
Các ký tự > U+007F được mã hóa thành một dãy các byte có các
nhóm bit đặc biệt sao cho không có byte nào của ASCII xuất hiện
trong thành phần các ký tự này.
0xFD.
Byte đầu chỉ rõ có bao nhiêu byte sẽ theo sau byte này trong
chuỗi mã của ký tự đang xét. Ví dụ: byte đầu là 11110xxx: có
nghĩa ký tự này sẽ được mã hóa bằng chuỗi bit bao gồm 4 byte.
Byte đầu tiên của các ký tự nhiều byte luôn bắt đầu từ 0xC0 đến
23
Các byte sau sẽ có giá trị từ 0x80 đến 0xBF.
2.1 Văn bản
Sơ đồ mã hóa UTF-8
10xxxxxx 10xxxxxx
U+00000000 – U+0000007F: 0xxxxxxx
U+00000080 – U+000007FF: 110xxxxx 10xxxxxx
U+00000800 – U+0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
U+00010000 – U+0010FFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U+00200000 – U+03FFFFFF: 111110xx 10xxxxxx 10xxxxxx
10xxxxxx 10xxxxxx 10xxxxxx
U+04000000 – U+7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx
10100000 = 0xE2 0x89 0xA0
24
U+00A9 1010 1001 UTF-8: 11000010 10101001
U+2260 10 0010 0110 0000 UTF-8: 11100010 10001001
2.1 Văn bản
Các phiên bản Unicode
25
1991 Unicode 1.0
1993 Unicode 1.1
1996 Unicode 2.0
1998 Unicode 2.1
2000 Unicode 3.0
2001 Unicode 3.1
2002 Unicode 3.2
2003 Unicode 4.0
2.1 Văn bản
Văn bản được đánh dấu (Markup Text)
Biểu diễn bằng khuôn dạng và nội dung
Nội dung là chuỗi các ký tự của văn bản
Khuôn dạng là cấu trúc biểu diễn của văn bản
giới hạn cấu trúc và khuôn dạng của từng phần văn bản
Markup text: văn bản chứa những chuối ký tự chuyên biệt thể hiện
Nhược điểm: chứa hỗn độ các cấu trúc logic như: điểm bắt đầu và
kết thúc từng phần, mục với các cấu trúc xác định cách bố trí của
văn bản như căn lề…
logic và layout bằng các document type.
Gồm nhiều phần tử (element) có tên riêng.
Sử dụng cặp start-tag và end-tag để đánh dấu phần tử.
SGML (Standardized General Markup Language) phân tách cấu trúc
trang Web.
Phiên bản mới nhất 4.01 XHTML
26
HTML (HyperText Markup Language): ngôn ngữ đánh dấu cho các
2.1 Văn bản
Văn bản được đánh dấu (Markup Text)
Ví dụ minh họa cho XML
Ví dụ minh họa cho SGML
27
2.1 Văn bản
Khuôn dạng văn bản ASCII:
Văn bản không định cấu trúc.
Không có các định dạng trang.
128 ký tự đầu là không đổi, 128 ký tự sau phụ thuộc vào từng biến dạng.
Dạng phương tiện đơn.
Khuôn dạng Rich Text: RTF.
Khuôn dạng cơ sở ASCII chuẩn ISO 8859.
Đặc tính.
Windows, OS2, Apple.
28
Ký tự có kiểu, cỡ.
Trang văn bản có định dạng.
Cho phép tạo văn bản chứa các hình đồ hoạ.
Khuôn dạng của Microsoft cho văn bản trong môi trường MS-DOS,
2.1 Văn bản
Khuôn dạng HTML(HyperText Markup Language).
Một số khái niệm.
Ra đời từ năm 1989
HIện nay: phiên bản HTML 4.01.
HTML là khuôn dạng được dẫn xuất từ SGML bằng một DTD.
Trong một trang HTML có thể chứa các liên kết với các trang HTML khác.
Trong một trang HTML có thể chứa các dạng thông tin khác nhau như: text, hình
ảnh, video, âm thanh.
HTML là cơ sở của dịch vụ WWW.
Hiển thị các trang HTML bằng các trình duyệt Web.
Một số đặc điểm.
Định dạng của trang Web được biểu thị qua các thẻ.
Các thẻ được biểu diễn qua dấu < và >.
Thẻ được ghi theo cặp: thẻ mở và thẻ đóng.
VD:
: biểu diễn văn bản là một trang HTML.
: biểu diễn phần tiêu đề.
29
2.1 Văn bản
Một số loại thẻ HTML.
: xác định văn bản HTML.
: phần đầu trang HTML.
: tiêu đề trang HTML.
: phần thân văn bản HTML.
: xác định cỡ chữ.
: xác định paragraph
30
2.1 Văn bản
Ưu điểm của HTML.
Đơn giản, dễ hiểu.
Mô tả được cấu trúc văn bản.
Mô tả được định dạng văn bản.
Tạo được các kết nối trên mạng.
Nhược điểm.
Không tuân thủ theo chuẩn về cấu trúc cũng như định dạng văn bản.
Các thuộc tính văn bản quá ít, do đó không tạo được những văn bản có cấu
Cần phải mở rộng khả năng của HTML.
31
trúc phức tạp.
2.1 Văn bản
Dạng văn bản XML(eXtensible Markup Language).
Dạng XML đươc W3C đưa ra vào 1998.
XML là tập con của SGML, là đơn giản hoá của SGML cho viêc sử dụng
trên WWW.
Về đặc tính:
XML là một siêu ngôn ngữ: là ngôn ngữ mô tả ngôn ngữ.
XML là ngôn ngữ xác định cấu trúc, cho phép đưa ra lừ điển từ vựng và cấu trúc
cú pháp của dữ liệu.
XML cho phép phân tách nội dung văn bản và cách trình bày. Điều này ngược lại
với HTML.
Kiểm tra cú pháp của một văn bản: DTD – document type definition
Một văn bản XML có định dạng chặt chẽ.
Mỗi văn bản XML có một DTD và được định dạng theo DTD đó.
32
2.1 Văn bản
Giải mã văn bản XML.
Để đọc một văn bản XML, ta phải tách được thông tin trong văn bản đó.
Sử dụng bộ phân tích cú pháp.
Bộ phân tích cú pháp phải cho phép tách thông tin một cách thích hợp.
Ba dạng file.
File nội dung: văn bản XML.
Định dạng hiển thị: tệp định kiểu XSL.
Định dạng cách viết nội dung: DTD.
Một số dạng dữ liệu văn bản dựa trên XML:
OFX – Open Financial eXchange.
MathML – Mathematical Markup Language.
CML – Chemical Markup Language.
SMIL – Synchronize Multimedia Integration Language.
33
2.1 Văn bản
Hiệu quả của XML:
Dễ đọc: không cần biết lý thuyết để hiểu nội dung văn bản XML.
Tự mô tả và mở rộng.
Cấu trúc mềm dẻo: cho phép mô hình hoá phần lớn các dạng thông tin văn
Tính vạn năng và cơ động.
Khả năng triển khai: có thể được truyền theo các giao thức dùng để truyền
bản.
Tính tích hợp: một văn bản XML có thể được được mở trong mọi ứng dụng
text: HTTP.
Khả năng mở rộng: các văn bản XML có thể được sử dụng trong tất cả các
có cài bộ duyệt cú pháp XML.
XML trên thực tế được sử dụng để trao đổi dữ liệu và văn bản.
34
lĩnh vực ứng dụng.
2.1 Văn bản
Các thao tác trên văn bản
Các thao tác trên ký tự: các thao tác đơn giản nhất trên các ký tự và
là thành phần cho các thao tác phức tạp hơn. Thể hiện thông qua
kiểu ký tự.
cấu trúc của văn bản
Các thao tác trên xâu: các thao tác trên chuỗi các ký tự.
Soạn thảo và biên tập văn bản: các thao tác thay đổi khuôn dạng và
của văn bản WYGIWYS.
Định dạng văn bản: thực hiện các thao tác đặt các thuộc tính về bố trí
bằng cách so sánh với mẫu hoặc theo các tiêu chí tìm kiếm.
So sánh mẫu và tìm kiếm: tìm kiếm những đoạn văn bản cho trước
35
Sắp xếp văn bản.
2.1 Văn bản
Các thao tác trên văn bản
Nén Huffman: tìm độ dài mã tối ưu theo tần xuất xuất hiện ký tự –
xuất hiện càng nhiều thì độ dài mã càng ngắn.
Nén Zip-Lempel: tìm kiếm những xâu lặp nhiều lần và thay bằng
con trỏ tới bảng các xâu.
Tỷ lệ nén: từ 1/2 đến 2/3 kích thước ban đầu.
Nén văn bản: dùng mã ASCII cần 7bit cho một ký tự. Lý thuyết chứng minh
cần khoảng 1-2bit dể biểu diễn ngôn ngữ tự nhiên. Nén là phương pháp loại
bỏ sự dư thừa này.
Mã hoá: các sơ đồ mã hoá đối xứng và mã hoá công khai. Phương pháp
36
DES(Data Encryption Standard) và RSA(Rivest-Shamir-Adleman)
2.2 Âm thanh
Các dạng âm thanh: tiếng nói, tiếng ồn, âm nhạc…
Âm thanh là dạng tín hiệu tương tự.
Âm thanh được sinh ra do các dao động của môi
trường truyền.
Các sóng âm được truyền trong các môi trường hỗ trợ
(không khí, kim loại, nước, …)
37
2.2 Âm thanh
Các thuộc tính của âm thanh
Ở nhiệt độ 15°C, tốc độ âm thanh chuẩn là: 340 m/s
Tốc độ - phụ thuộc vào nhiệt độ của môi trường
Cách đo âm thanh: quan sát các hiện tượng xung quanh như sấm chớp
Âm thanh truyền cả trong môi trường lỏng và rắn.
38
v = 331.5 m/s + 0.6T
2.2 Âm thanh
Các thuộc tính của âm thanh
Tai người nghe thấy âm thanh trong khoảng 20 Hz – 20 kHz
Tần số: tel: 4 kHz, AM: 7 kHz, FM: 15 kHz, HI-FI: 20 kHz, Audio CD: 22
Tần số: v = f.λ, và được tính bằng Hz.
Thính lực giảm theo tuổi tác.
> 20 kHz: cao hơn khoảng nghe thấy, một số động vật có thể cảm nhận
kHz.
0 – 20 Hz: Thấp hơn khoảng nghe thấy, có thể cảm nhận qua cơ thể.
được âm thanh ở tần số này.
cao thiết bị Amplifier. Cường độ được tính theo dB.
Cường độ phụ thuộc vào biên độ, biên độ càng lớn thì cường độ càng
39
0-30 dB: tiếng thì thầm, 31-50 dB: đối thoại nhỏ, 51-70 dB: trao đổi bình
thường, 71-90 dB: tiếng ô tô di chuyển, 91-110 dB: tiếng nhạc to có thể
gây đau tai, > 110 dB: có thể gây điếc.
Bảng cường độ âm thanh
1*10-12 W/m2
1*10-11 W/m2
1*10-10 W/m2
1*10-6 W/m2
1*10-5 W/m2
1*10-4 W/m2
6.3*10-3 W/m2
1*10-2 W/m2
1*10-1 W/m2
1*101 W/m2
1*102 W/m2
1*104 W/m2
0 dB Ngưỡng nghe
10 dB Tiếng lá xào xạc
20 dB Tiếng huýt sáo
60 dB Nói chuyện thông thường
70 dB Tiếng xe cộ đường phố
80 dB Máy hút bụi
98 dB Dàn nhạc giao hưởng
100 dB Walkman at Maximum
110 dB Dàn nhạc rock
130 dB Ngưỡng đau
140 dB Máy bay quân sự cất cánh
160 dB Thủng màng nhĩ
40
2.2 Âm thanh
Các thuộc tính của âm thanh
trong một chu kỳ dao động của sóng
vT
v
f
Bước sóng (wavelength) - Là quãng đường mà sóng truyền đi được
41
Bước sóng thường được đo là khoảng cách giữa hai đỉnh xung
2.2 Âm thanh
Âm sắc
tính vật lý của âm là tần số và biên độ
Là một đặc tính sinh lý của âm , được hình thành trên cơ sở các đặc
âm có tần số f1 thì đồng thời cũng phát ra các âm có tần số
f2=2*f1,f3=3*f1, f4=4*f1,…, trong đó f1 được gọi là âm cơ bản,các tần
số f2,f3,f4 ,…được gọi là các hoạ âm thứ hai,ba,bốn…..
42
Thực nghiệm chứng tỏ khi một nhạc cụ hoặc một người phát ra một
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Phản xạ: khi sóng âm chạm tới biên giới hai môi trường khác nhau thì
có hiện tượng phản xạ, sóng phản xạ quay trở lại môi trường ban
đầu, nó có thể trùng pha hoặc ngược pha với sóng ban đầu
Có hai hiện tượng: Echo, Reverberation
Bộ não con người có thể ghi nhớ âm thanh trong khoảng 0,1 s.
Nếu sóng phản xạ đến tai ≤ 0.1 s so với sóng trước đó, ta có cảm giác
Trong trường hợp khác, ta sẽ thấy âm thanh lặp lại liên tục Echo.
Nếu căn phòng có kích thước 17m x 17m x 17m. Môt người đứng trong
âm thanh kéo dài mãi Reverberation.
43
phòng phát ra tiếng động thì hiện tượng gì sẽ xảy ra ?
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Ứng dụng: trong nhà hát người ta thường làm tường sần sùi để cho bất kỳ
Phản xạ
ai ngồi vị trí nào đều có thể cảm nhận được các sóng phản xạ.
Khúc xạ
Là hiện tượng thay đổi hướng của sóng khi truyền từ môi trường này qua
môi trường khác.
Nhiễu xạ
44
Là hiện tượng thay đổi hướng khi sóng đi qua khe hở hoặc vòng qua một
vật cản trên đường đi của nó.
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Hiệu ứng Doppler
Tần số tăng lên khi nguồn tiến về phía ngưới quan sát và giảm đi khi
Là hiện tượng xảy ra khi nguồn sóng chuyển động tương đối với người
quan sát và tốc độ chuyển động của nguồn âm chậm hơn so với tốc độ
truyền âm.
f
(
)
f
0
v
v
v
s
Ứng dụng:
Tiếng còi xe cấp cứu.
Súng bắn tốc độ…
45
nguồn xa người quan sát.
2.2 Âm thanh
Một số hiện tượng và hiệu ứng
Shock wave - Là hiện tượng xảy ra khi nguồn sóng chuyển động đối
với người quan sát, và tốc độ chuyển động của nguồn âm nhanh hơn
so với tốc độ truyền âm
46
Ví dụ : Sonic boom
2.2 Âm thanh
Tai người
Cấu tạo của tai
Tâm lý của mỗi người
Âm thanh
Cách thức mà con người nghe liên quan đến 3 yếu tố
=> Tạo ra độ phức tạp của âm thanh:
47
Quá trình nghe gồm: Chuyển năng lượng của âm thanh thành năng
lượng của sóng cơ học,sau đó lại chuyển thành tín hiệu thần kinh
truyền đến não.Con người có thể phân biệt được :
Độ cao thấp của âm thanh là nhờ nhận ra được tần số của âm thanh
Độ to nhỏ của âm thanh:Là do phân biệt được biên độ
Âm sắc: Là phân biệt được various frequencies
48
2.2 Âm thanh
Biểu diễn âm thanh
thanh âm nhạc.
Âm thanh là tín hiệu tương tự số hóa.
Tần số lấy mẫu, ≥ 8 kHz đối với âm thanh thoại, ≥ 44 kHz đối với âm
bằng cách mã hóa sự khác biệt.
Khi mã hóa: một mẫu được thay thế bằng một bit xác định dấu của sai
Lượng tử hóa sử dụng 8 hoặc 16 bit.
Phương pháp mã hóa thông thường: PCM.
ADPCM – Adaptive Differential PCM: giảm tỉ lệ dữ liệu của PCM
Khi giải mã: giá trị mẫu được xác định bằng cách nhân sai phân với hệ số
phân giữa mẫu đó và mẫu trước.
49
tỉ lệ và cộng vào mẫu trước đó ứng với dấu.
ADPCM sử dụng trong các thiết bị CD, DVI
Chuẩn ADPCM: CCITT G.721.
Tỉ lệ nén: 4:1 đến 2:1
2.2 Âm thanh
Biểu diễn âm thanh
AC’97 (Audio Code ‘97)
Chuẩn audio được Intel phát triển vào năm 1997 và tích hợp trong các
Hỗ trợ cho công nghệ Dolby bao gồm cả Dolby Pro Logic IIx (7.1 channel
thiết bị mainboard, modem, sound card.
Lấy 9600 mẫu/s và dùng 20 bit để mã hóa cho một mẫu.
2004: AC’97 được thay thế bằng Intel HD Audio. Intel HD Audio – 192
kHz và 32 bit cho 2 kênh và 96 kHz, 32 bit cho 8 kênh.
Có khả năng multi-streaming cho phép người dùng một lúc có thể gửi 2
surround sound).
50
hay nhiều tín hiệu âm thanh trên cùng PC.
2.2 Âm thanh
Một số hệ thống loa phổ biến
4.0 Quadraphonic
4.0 Dolby Pro Logic
3.0 Dolby Surround
6.1 Dolby Digital EX
5.1 Dolby Stereo
51
Các khuôn dạng âm thanh
Dạng file WAV.
Lấy mẫu âm thanh 44KHz, lượng
Khuôn dạng RIFF – resource
tử hoá 16bit.
52
interchange file format.
Khuôn dạng AIFF – audio
interchange file format.
Số hoá 44.1KHz, 16bit.
Tương đương WAV cho Apple.
Đầu file: chuỗi ký tự ASCII: RIFF
xác định khuôn dạng file WAV.
Sau đó đến độ dài khối thông tin.
Sau đó đến xâu “WAVE”
Các khuôn dạng âm thanh
Dạng âm nhạc.
Là khuôn dạng tổng hợp.
Cho phép nhạc công kiểm soát và điều khiển các dụng cụ âm nhạc.
Lưu trữ các thông điệp âm nhạc cho phép điều khiển dụng cụ âm nhạc:
Nốt sẽ được chơi.
Dụng cụ sẽ được chơi.
Cường độ âm thanh.
Thiết bị chơi nhạc không được xác định trong khuôn dạng.
Dung lượng dữ liệu nhỏ hơn 1000 lần so với dữ liệu âm thanh số chất
lượng CD.
Chất lượng âm nhạc phụ thuộc vào chất lượng thiết bị ngoại vi dùng để
chơi nhạc.
53
Các khuôn dạng âm thanh
Khuôn dạng MIDI – musical instrument digital interface.
Cung cấp 16 kênh âm thanh cho phép 16 dụng cụ âm nhạc chơi đồng thời.
Xác định các nốt sẽ được chơi, trên dụng cụ âm nhạc nào và âm lượng.
Dung lượng thông tin cho 2 phút âm nhạc:
MIDI 20Ko.
WAV chất lượng CD: 20Mo
Các file dễ dàng được soạn thảo bởi những chương trình soạn thảo MIDI.
Dễ dàng thay đổi thiết bị âm thanh.
Các hạn chế của khuôn dạng MIDI
Chất lượng âm thanh phụ thuộc vào: thiết bị ngoại vi và số lượng kênh âm thanh.
Việc mã hoá dụng cụ âm nhạc không bình thường
54
2.2 Âm thanh
Các thao tác đối với âm thanh số
Trễ
Lưu trữ
Truy xuất (lưu trự và tìm kiếm, trích chọn) âm thanh số
Các hiệu ứng âm thanh, lọc
Lọc nhiễu
Chuyển từ ADPCM về PCM hoặc ngược lại (quá trình giải nén và nén)
55
Chuyển đổi khuôn dạng âm thanh
2.3 Hình ảnh tĩnh
Ảnh sáng.
Tần số.
Cường độ.
Màu sắc:
Phụ thuộc vào bước sóng.
<380nm: tia cực tím.
380nm – 450nm: tia tím. 450nm – 490nm: tia xanh lơ.
490nm – 560nm: xanh lá cây. 560nm – 590nm: vàng.
590nm – 640nm: da cam. 640nm – 760nm: đỏ.
>760nm – hồng ngoại.
Cảm nhận ánh sáng
Cảm nhận theo bước sóng ánh sáng bàng các tế bào nón.
Có ba dạng tế bào nón cảm nhận theo ba màu: đỏ, xanh lá cây, xanh
da trời.
Các tế bào này cảm nhận theo bước sóng từ 400nm – 700nm.
Chứng mù màu.
56
2.3 Hình ảnh tĩnh
Tổng hợp màu:
Tổng hợp dương.
Màu sắc được xác định như tổng cân bằng của ba màu cơ bản.
Ba màu cơ bản: đỏ, xanh lá cây, xanh da trời.
Mô hình RGB.
Các màu cơ bản: Red, Green, Blue.
Màu là tổng hợp của ba màu cơ bản theo thành phần.
Nguyên lý chính của thiết bị màn hình.
Màu sắc được xác định như cân bằng giữa màu trắng và ba màu cơ
Tổng hợp âm.
Ba màu ngược với Red, Green, Blue là Cyan, Magenta, Yellow.
Mô hình CMYK.
Ba màu ngược với RGB: CMY.
Màu là tổng hợp của ba màu cơ bản là ánh sáng phản xạ trên bề mặt của vật.
Tổng của ba thành phần bằng nhau là màu đen.
CMYK: màu tổng với màu đen tuyền.
Nguyên lý của các thiết bị in.
57
bản.
2.3 Hình ảnh tĩnh
Tổng hợp âm
Tổng hợp dương
58
2.3 Hình ảnh tĩnh
Ảnh: thông tin về vật thể hay quang cảnh được chiếu sáng mà
con người quan sát và cảm nhận bằng mắt và hệ thống thần kinh
thị giác.
Ảnh đơn được biểu diễn bởi hàm độ chói và các biến tọa độ trong
mặt phẳng ảnh I(x,y).
Pixel: phần tử nhỏ nhất để biểu diễn ảnh, về nguyên tắc mắt
thường không thể phân biệt được hai mức kề nhau.
Pixel thiết bị: Màn hình máy tính là tập hợp của nhiều điểm nhỏ -
pixel. Mỗi pixel gồm một cặp x,y và màu.
Pixel có thể lưu trữ bằng:
1 bit - ảnh nhị phân (0-1).
8 bit - ảnh đa mức xám (0-255).
24 bit - ảnh màu (3 kênh RGB).
59
2.3 Hình ảnh tĩnh
Ảnh 8 bit hay 16 bit
Ảnh 8 bit RGB biểu diễn được hơn 16,7 triêu màu. Tuy nhiên các
phép xử lý ảnh đều gây mất mát thông tin đặc biệt là với ảnh 8 bit.
Cho phép biểu diễn nhiều sắc thái màu hơn (65536 mức trên một kênh).
Thông tin của ảnh sẽ nhiều hơn khi ảnh được xử lý, lương tin mất
Ảnh 8 bit được thay thế bằng ảnh 16 bit
Nhiều công cụ như Photoshop CS hỗ trợ xử lý ảnh 16 bit với đầy đủ các
không đáng kể.
Máy NIKON hỗ trợ ảnh nguyên thể 12 bit.
Ảnh 48 bit thực ra là ảnh màu RGB (16 bit/kênh).
60
tính năng.
2.3 Hình ảnh tĩnh
Các thiết bị thu nhận ảnh
scanner chuyên dụng.
Máy camera + bộ chuyển đổi tương tự thành số AD hoặc máy quét
Cảm biến: biến đổi năng lượng quang học thành năng lượng điện.
Tổng hợp năng lượng điện thành ảnh điện.
Số hóa ảnh
Hệ thống thu nhận ảnh thực hiện hai quá trình:
cách quét ảnh theo hàng ngang.
Lấy mẫu: áp dụng cho ảnh có giải tần giới hạn được thực hiện bằng
đầu vào.
61
Lương hóa ảnh: thực hiện ánh xạ từ một biến liên tục u (biểu diễn giá
trị độ sáng) sang một biến rời rạc u* với các giá trị thuộc tập hưu hạn:
Bộ lượng hóa không nhớ: giá trị đầu ra chỉ phụ thuộc duy nhất vào
2.3 Hình ảnh tĩnh
Biểu diễn màu
Dựa vào các màu gốc, việc xác định màu gốc có liên quan đến các
khái niệm sinh học hơn là vật lý. Mắt người phản ứng khác nhau đối
với ánh sáng khác nhau.
Mô hình màu RGB sử dụng mô hình bổ xung trong đó ánh sáng đỏ,
xanh là cây và xanh lam tổ hợp với nhau để tạo thành nhiều màu
khác. RGB được dùng trong đồ họa máy tính, ống tia âm cực…
Kiểu 16 bit: 555 hoặc 565.
Kiểu 32 bit: được đưa ra để phù
hợp hơn với các phần cứng của
máy tính.
32 bit RGBA: RGB + Alpha channel
62
2.3 Hình ảnh tĩnh
Biểu diễn màu
Quy định không gian màu được tạo bởi một độ sáng Y (luminance) và hai
YUV
Y về cơ bản giống tín hiệu truyền hình ti vi đen trắng, trong khi U, V có
thành phần màu (chrominance).
YUV có thể dễ dàng xử lý loại bỏ bớt thông tin để tiết kiệm băng thông.
Được sử dụng trong giải thuật nén video như MPEG-2
thể bỏ qua.
Brightness: độ chói.
Hue: sắc lượng, hay sắc thái màu
Saturation: độ bão hòa.
63
HSV
2.3 Hình ảnh tĩnh
Hệ thống xử lý ảnh
64
2.3 Hình ảnh tĩnh
Các vấn đề về xử lý ảnh tĩnh:
Thu nhận ảnh: số hoá ảnh.
Xử lý ảnh: tạo ảnh, biên tập ảnh, hiển thị và thao tác ảnh trực quan.
Lưu trữ ảnh:mã hoá ảnh, nén và giải nén; chất lượng nén; lưu trữ
ảnh, các khuôn dạng lưu trữ ảnh.
Thay đổi các khuôn dạng video, hoạt hình..
Nhiều khuôn dạng biểu diễn làm giảm tính tương thích.
Vấn đề tăng chi phí truyền ảnh.
Các tiêu chuẩn chất lượng ảnh:
Phục hồi ảnh: hiển thị ảnh, chiếu ảnh; cảm nhận ảnh.
Phổ biến ảnh:
65
Tiêu chuẩn về màu sắc: số lượng màu sắc dùng biểu diễn ảnh.
Tiêu chuẩn về độ phân giải: số lượng điểm dùng để biểu diễn ảnh.
2.3 Hình ảnh tĩnh
Ảnh 3D
Hình ảnh 3D là tập hợp của các điểm trong không gian 3 chiều được
kết nối với nhau bằng các đoạn thẳng, tam giác hoặc mặt phẳng
cong…
Sử dụng cấu trúc đặc.
Sử dụng được biên.
66
Hình ảnh 3D được tạo ra bằng tay, sử dụng thuật toán hoặc scanner.
Các cách biểu diễn hình ảnh 3D:
2.3 Hình ảnh tĩnh
Các khuôn dạng ảnh:hai dạng chính
Ảnh vector.
Là các dữ liệu đồ hoạ.
Các dạng PIC, WMF, ...
Một ảnh được coi là tập hợp của các hình hình học đơn giản.
Ảnh bitmap.
Các dạng file: BMP, GIF, TIFF, JPG, ...
Là các dữ liệu hình ảnh.
67
ảnh được biểu diễn bằng ma trận các điểm. Mỗi điểm có các giá trị
tương ứng với các màu.
Các khuôn dạng ảnh
Ảnh vector
đối tượng của ảnh.
ảnh được hiểu như tổ hợp các hình hình học đơn giản.
ảnh được hiển thị bằng cách vẽ các hình đồ hoạ tương ứng với các
68
Có ba dạng đối tượng rời rạc trên ảnh:
Các điểm rời rạc: các đối tượng điểm.
Các đường rời rạc: các đối tượng đường.
Các mặt rời rạc: các đối tượng mặt.
Các khuôn dạng ảnh
Các ảnh vector.
Các ưu điểm:
Mã hóa ảnh bằng các hình đơn giản.
Gọn, kích thước nhỏ.
Thay đổi kích thước đơn giản, không bị mất
thông tin.
Sửa dễ dàng do các phần tử của ảnh độc lập.
Các nhược điểm:
Không biểu diễn được các ảnh chụp.
Xử lý các ảnh phức tạp với nhiều đối tượng gặp
nhiều khó khăn.
Khuôn dạng không chuẩn, các trình duyệt web
không
nhận dạng được.
Khuôn dạng WMF:
Chứa các thông tin về các đối tượng.
Một file WMF có thể chứa 65535 đối tượng.
69
Các khuôn dạng ảnh
Ảnh bitmap
biểu diễn màu.
Hình ảnh được biểu diễn thông qua ma trận các điểm.
Giá trị các điểm ảnh chỉ tới các mầu của điểm tương ứng với các sơ đồ
70
Biểu diễn màu theo sơ đồ RGB.
Hai sơ đồ mã hóa màu: RGB và CYMK.
Không gian màu và chuyển đổi:
RGB(1,1,1) -> CMY (0,0,0)
C=1-R; G=1-M;
R=1-C; Y=1-B;
M=1-G;B=1-Y;
Các khuôn dạng ảnh
Mã hóa màu:
Giá trị của điểm ảnh.
Màu tương ứng theo giá trị đó tùy theo bảng màu.
Phương pháp đơn giản.
Đối với mỗi điểm ảnh giá trị của điểm ảnh là giá trị của màu.
Màu được lựa chọn theo mô hình RGB.
Đối với mỗi pixel:
Mã hoá một thành phần RGB sử dụng n bit.
Mô hình màu theo RGB sẽ được mã hoá theo 3 x n bit.
Số lượng màu cho phép đối với mô hình RGB: 2n x 2n x 2n.
Màu thực: true color: sử dụng 8 bit cho một thành phần màu, do đó số lượng màu
cho phép biểu diễn sẽ là: 224 màu.
71
Các khuôn dạng ảnh
Thành phần thứ tư là phần mở rộng có độ dài 8 bit để biểu diễn.
Kênh alpha.
Kênh alpha dùng để biểu diễn tính trong suốt của ảnh (transparence).
Tính chất này dùng để tránh hiệu ứng bậc thang khi có nhiều ảnh chồng lên nhau.
Biểu diễn bảng màu.
N được lựa chọn trong số 2m x 2m x 2m màu.
m chỉ số lượng bit để biểu diễn một thành phần màu.
N là vị trí tương ứng trong bảng màu.
Kích thước khối thông tin ảnh:
X * Y * n trong đó X: số cột,Y: số hàng, n: số bit dùng để mã hoá một ảnh.
ảnh bitmap cho chất lượng cao.
72
2.3 Hình ảnh tĩnh
Một số định dạng ảnh phổ biến
hiệu quả với tỷ lệ nén tới vài chục lần.
Sử dụng phương pháp nén mất mát thông tin.
Các bước gồm: Phân khối, biến đổi Cosin rời rạc (DCT), lượng tử hóa và
JPEG (Joint Photographic Experts Group): phương pháp nén ảnh
mã hóa.
.bmp hoặc .dib.
Bitmap header (14 bytes): giúp nhận dạng tệp tin bitmap.
Bitmap information (40 bytes): lưu chi tiết hiển thị ảnh.
Color pallete (4x bytes), x là số màu của ảnh.
Bitmap data: dữ liệu ảnh.
BMP: Các tệp tin đồ họa lưu dưới dạng BMP và có phần mở rộng
bitmap sử dụng ít hơn 256 bit.
GIF (Graphics Interchange Format): là định dạng tệp tin hình ảnh
fax, xử lý văn bản, nhận dạng chữ viết…
73
TIFF (Tagged Image File Format): được sử dụng trong quét ảnh, gửi
2.4 Hình ảnh động
Video
Video là chuỗi các hình ảnh tĩnh được trình diễn trong một đơn vị thời
gian khiến người xem có cảm giác như các sự vật trên đó như đang
chuyển động.
PAL, NTSC, MPEG-4 hay DVI
Video có thể lưu trữ và truyền trong nhiều môi trường khác nhau:
Framework eXtension (AFX).
3D video được quy định trong chuẩn MPEG-4 Part 16 Animation
Số lượng khung (frame) trên một giây.
Các đặc tính của video:
74
Interlacing
Độ phân giải
Kích thước khung hình
Phương pháp nén video
Tốc độ truyền (đối với video số)
2.4 Hình ảnh động
Video số
Truy cập ngẫu nhiên trực tiếp thuận tiện,
Việc tạo, lưu trữ và ghi đọc nhiều lần không ảnh hưởng đến chất lượng
Thuận lợi:
Không cần xung xoá và xung đồng bộ.
Xử lý thuận tiện, không gặp trở ngại về giới hạn tần số, băng thông.
ảnh.
Tuy nhiên, tín hiệu số gặp một số trở ngại xoay quanh vấn đề về tính
Khó khăn
hiệu quả, chẳng hạn bộ lọc số có giá thành tương đối cao.
Thuận lợi trong việc xử lý đối với tín hiệu video thành phần, nhưng băng
Tiêu chuẩn lấy mẫu màu:
75
thông yêu cầu lớn.
2.4 Hình ảnh động
Video
Số lượng khung hình trên một giây (Frame rate)
Thông thường từ 6-25 frame/s, tùy theo camera.
PAL (EU), SECAM (EU): 25 frame/s
NTSC (US, Japan): 29,97 frame/s
Interlacing
Interlacing: Chia màn hình thành các dòng, mỗi lần chùm electron chỉ
quét dòng chẵn hoặc lẻ tiết kiệm băng thông đường truyền.
NTSC, PAL, SECAM sử dụng chế độ interlacing: PAL 576i50.
Progressive: dòng electron sẽ quét tất cả màn hình cho hình ảnh chất
lượng cao, vd: HDTV.
Được tính theo đơn vị pixel đối với dữ liệu số và dòng quét ngang, quét
Độ phân giải
NTSC: 720/704/640x480i60.
PAL: 768/720x576i50.
HDTV: 1920x1080p60
76
dọc với dữ liệu tương tự.
2.4 Hình ảnh động
Video
Màn hình truyền thống: 4:3
Màn hình HD: 16x9 widescreen.
Kích thước màn hình
Các phương pháp nén video
MPEG-2: sử dụng cho DVD và ti vi truyền từ vệ tinh.
MPEG-4 dùng cho video gia đình.
Intraframe compression: nén tương tự như kỹ thuật nén ảnh.
Interframe compression: nén dựa trên sự khác biệt giữa các frame (chỉ
lưu sự khác biệt).
Tốc độ càng cao, chất lượng video càng tốt.
Video CD; 1 Mbps.
DVD: 5 Mbps.
HDTV: 20 Mbps.
77
Tốc độ truyền (bitrate):
2.4 Hình ảnh động
Hoạt hình (Animation)
được chiếu tiếp diễn liên tục.
Tạo ra ảo giác quang học về sự chuyển động do nhiều hình ảnh tĩnh
vision).
Nguyên lý: dựa vào hiện tượng lưu ảnh của mắt (persistence of
GIF, MNG, SVG, Flash kích thước nhỏ, cho phép truyền trên máy tính
Một số định dạng đồ họa:
Motion capture
Kỹ thuật lưu lại chuyển động và
tái hiện thông qua mô hình mô
phỏng. Được sử dụng rộng rãi
trong các lĩnh vực thể thao, giải
trí…
78
thông qua Internet.
2.4 Hình ảnh động
Một số các định dạng video
giới thiệu vào tháng 11 năm 1992. AVI là tập tin có thể chứa cả âm
thanh và video dữ liệu trong một container cho phép đồng bộ tập tin
âm thanh-với-video.
AVI là một trong những định dạng của RIFF.
Phần header (56 byte) chứa các thông tin :
Thời gian trễ giữa các frame
Tốc độ dữ liệu, Số lượng frame, Số dòng dữ liệu
Kích thước video ….
AVI (Audio Video Interleave) là một định dạng của Microsoft được
79
MKV (Matroska Multimedia Container) - là một chuẩn mở miễn phí
định dạng container. Được công bố vào ngày 06 tháng 12 2002,
Matroska là một định dạng tập tin có thể chứa đựng một số lượng
không giới hạn video, âm thanh, hình ảnh hoặc phụ đề trong một tập
tin duy nhất.
2.4 Hình ảnh động
Một số các định dạng video
MPEG (Moving Picture Expert Group) được ra đời vào năm 1988
nhằm mục đích chuẩn hoá cho nén tín hiệu âm thanh và video
Mpeg-1 là chuẩn lưu trữ và phục hồi ảnh động và Audio trong lưu trữ
Mpeg-2 là chuẩn cho TV số
Mpeg-4 là chuẩn cho các ứng dụng MultiMedia
Mpeg-7 chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin
Media
hình và video phone
H261 – phục vụ cho truyền qua ISDN ở tốc độ 64 kbps
Sử dụng CIF và QCIF
H263 – cải tiến cho video tốc độ thấp, có thể truyền trên mạng thoại công
H26x – Do tổ chức ITU đưa ra phục vụ cho dịch vụ hội nghị truyền
80
cộng PSTN
2.4 Hình ảnh động
Một số dạng tín hiệu video số theo các chuẩn
Sử dụng trong chuẩn H261, dễ chuyển sang chuẩn PAL hay NTSC
Y resolution: 352 x 288, 8 bits/pixel(sample)
CrCb/UV resolution: 176 x 144
Frame rate: 30 frames/second progressive
QCIF:Quarter Common Intermediate Format
Y resolution: 176 x 144, 8 bits/pixel (sample)
CrCb/UV resolution: 88 x 72
Frame rate: 30 frames/second progressive
CIF : Common Intermediate Format
Resolution: 704 x 480, 30 frames/second interlaced
TV –NTSC
Resolution: 720 x 480, 24 –30 frames/second progressive
81
DVD –NTSC
2.4 Hình ảnh động
Các vấn đề liên quan đến thao tác:
Tạo, biên tập theo phương pháp tương tự và số
Các phần mềm hiển thị và thao tác với ảnh động
Hiển thị và thao tác chuỗi video
Chèn các hiệu ứng thích hợp
Xử lý
Mã hóa và nén
Lưu trữ:
Mất thông tin khi nén dữ liệu
Lưu trữ, các khuôn dạng lưu trữ
Hiển thị ảnh, chiếu ảnh, cảm nhận ảnh
82
Phục hồi ảnh
2.4 Hình ảnh động
Đồng bộ giữa audio và video
khác nhau cả về thời gian và không gian
Tại sao ?
Dữ liệu đa phương tiện : dữ liệu từ nhiều nguồn phương tiện (media)
dòng dữ liệu nguồn
Một số khái niệm
Nhiệm vụ của đồng bộ: xác lập lại quan hệ thời gian thực giữa các
Đồngbộ liêntục: đồng bộ bám liên tục theo thời gian,
Đồngbộ điểm: đồng bộ các khối dữ liệu tại các thời điểm,
Đồngbộ trongmộtdòngdữ liệuphươngtiện (Intramedia
Synchronization) : xác lập lại quan hệ thời gian giữa các sự kiện
trong 1 dòng dữ liệu của 1 phương tiện, đơn luồng
quan hệ thời gian giữa các dòng dữ liệu phương tiện.
83
Đồngbộ giữacácdòng(Intermediasynchronization) : xác lập lại
3. Các kỹ thuật trong đa phương tiện
Các kỹ thuật điều khiển
Các kỹ thuật thu nhận
Các kỹ thuật lưu trữ
Các kỹ thuật xử lý
Các kỹ thuật hiển thị
Các kỹ thuật truyền dữ liệu
84
Quá trình xử lý thông tin Multimedia
Quá trình Multimedia thực hiện thao tác trên các đổi
tượng Multimedia:
Văn bản, các số
Âm thanh: tiếng ồn, tiếng nói, âm nhạc
Hình ảnh tính: đồ họa, ảnh tĩnh
Hình ảnh động: video, animation
Quá trình xử lý thông tin Multimedia
85
Thu nhận thông tin: thông qua các thiết bị đầu vào
Xử lý thông tin: thông qua bộ xử lý
Lưu trữ thông tin: các thiết bị lưu trữ
Hiển thị thông tin: các thiết bị ra
Trao đổi thông tin: các thiết bị truyền thông
3.1 Các kỹ thuật điều khiển
Bàn phím
chữ. Về hình dáng, bàn phím là sự sắp đặt các nút hay phím.
Các ký tự được khắc lên bàn phím
Mỗi một phím tương ứng với một ký hiệu, tuy nhiên có thể kết hợp nhiều
Thiết bị ngoại vi được mô hình một phần theo bàn phím máy đánh
Bàn phím được sử dụng để tạo ra ký tự, nhưng trong nhiều trường hợp có
phím lại với nhau.
thể đưa ra lệnh thực thi.
và một vài biểu tượng đặc biệt.
Bàn phím chuẩn: 101-key US hay 104-key Windows gồm các chữ, số
cho mục đích nghe nhạc, lướt web v.v…
86
Gaming and Multimedia: Bàn phím có một số nút mở rộng phục vụ
3.1 Các kỹ thuật điều khiển
Bàn phím
Hoạt động dựa trên tiếp xúc của lớp bề mặt với mạch điện phía dưới.
Sử dụng từ những năm 1980 trong các máy tính gia đình như Z80, Z81,
Menbrane keyboard
Giá thành tốt, có khả năng chống bụi và chất lỏng, tuy nhiên khả năng
Atari 400.
Thích hợp các thiết bị nút như remote điều khiển từ xa, lò vi sóng hay
tạo cảm giác kém gây khó khăn cho người dùng.
87
điện thoại di động.
3.1 Các kỹ thuật điều khiển
Bàn phím
Kết hợp bàn phím menbrane và bàn phím cơ học. Gốm hai bản mạch
nằm bên dưới một nút tròn cao sư có bọc trì. Khi phím được ấn, mạch sẽ
đòng và truyền tín hiệu đi.
Được sử dụng trong nhiều thiết bị điều khiển cầm tay như video game
Dome-switch keyboard
console
Scissor-switch keyboard
Phím được đưa vào giữa hai miếng nhựa giống như một cái kéo.
Có các nút hình cao su ngắn so với trường hợp dome-switch, khoảng
Là trường hợp đặc biệt của dome-switch.
Được sử dụng làm bàn phím laptop.
88
cách di chuyển của các phím chỉ vào 2 mm.
3.1 Các kỹ thuật điều khiển
Bàn phím
Bàn phím nhựa deo có thể cuộn lại. Vật liệu sử dụng có thể là silicon…
Roll-up keyboad
Được bọc lớp vỏ cao sư khiến nó có khả năng chống nước giống như
chỉ đứt khi chịu tác dụng lực mạnh.
membrane. Nó ít tạo cảm giác cho người dùng.
Không chỉ có các bộ chuyển mạch giống nhu dome-switch mà còn có bộ
vi xử lý thường là chip 8048 cho phép bàn phím có thể cung cấp nhiều
tính năng đặc biệt. Nó xử lý các tín hiệu đến và các đèn caps lock, num
lock, scroll lock.
Vấn đề:
Nhấn một phím có thể tạo cảm giác đóng mạch nhiều lần.
3 phím ấn cùng một lúc
Kết nối qua cổng PS/2 hoặc USB
89
Bàn phím thông thường
3.1 Các kỹ thuật điều khiển
Chuột
Bill English phát minh năm 1972.
Cấu tạo gồm 1 viên bi cao su và hai con lăn ở hai bên xác định vị trí lên
Chuột bi
Chuyển động biến thành tín hiệu và truyền tới máy tính thông qua dây
xuống, sang trái phải.
dẫn và chuyển thành tọa độ x, y trên màn hình hiển thị.
Sử dung diot và photo diot để xác định chuyển động tương đối trên mặt
Chuột quang
Chuột quang hiện đại có bộ cảm biến cho phép ghi nhận hình ảnh bề
mặt chuyển động, kèm theo một chip có khả năng xử lý ảnh để xác định
vị trí chuyển động.
90
phẳng.
3.1 Các kỹ thuật điều khiển
Chuột
91
Chuột kết nối qua cổng PS/2 gồm 6 chân mini-DIM, ở chế độ bình
thường chuột PS/2 sẽ truyền tín hiệu truyền động và trạng thái của
các nút bấm bằng một gói tin 3 bytes, có dạng như sau
3.1 Các kỹ thuật điều khiển
92
3.1 Các kỹ thuật điều khiển
Bút quang học
có yêu cầu đặc biệt về bàn để.
Hỗ trợ vẽ trên máy tính và có khả năng hoạt động như chuột, nhưng
Touchscreen
Kết nối với máy tính thông qua cổng USB.
Nhược điểm: khó sử dụng và giá thành tương đối cao.
game.
Có tác dụng tương tác trực tiếp với vật hiển thị.
Được thiết kế chủ yếu cho các thiết bị PDA, mobile phone hoặc video
thành lệnh thực thi.
Đặc tính của nó là có thể nhận được tay người ấn lên và chuyển
Resistive touchscreen
Surface acoustic wave
Capacitive
93
Phân loại:
3.1 Các kỹ thuật điều khiển
Joystick
Joystick là thiết bị ngoại vi cho phép điều khiển cả hướng và góc,
được sử dụng chủ yếu trong trò chơi điện tử và có một hoặc nhiều
nút ấn.
có thể trả tín hiệu ngược lại gây ra rung động trên joystick.
Joystick được kết nối với máy tính thông qua cổng USB.
Thay đổi vị trí trái – phải: dịch theo trục X.
Thay đổi vị trí trước – sau: dịch theo trục Y.
Quay vòng theo hoặc ngược chiều kim đồng hồ: dịch theo trục Z.
Một số loại Joystick có khả năng force feedback, cho phép máy tính
94
Hat switch: để điều khiển một số loại joystick, trong nhiều trường hợp
nó cho phép nhìn xung quang khi người chơi tham gia vào thế giới ảo
như trong các chương trình mô phỏng lái máy bay…
3.2 Các kỹ thuật thu nhận
Máy scanner
Máy quét scanner là thiết bị cho phép chụp ảnh quang học các văn
bản, chữ viết tay hay ảnh và chuyển nó sang dạng ảnh số, lưu trữ
trong máy tính.
CCD (Charge-coupled device)
CIS (Contact Image Sensor)
95
Sử dụng công nghệ:
3.2 Các kỹ thuật thu nhận
Máy scanner
CCD
Shift register tương tự cho phép truyền tín hiệu tương tự và được điểu khiển bởi
xung đồng hồ. Ngày nay nó thường được sử dụng làm bộ cảm biến ánh sáng
quang điện.
Về nguyên tắc hoạt động CCD có thể chia ra làm hai miền: miền quang hoạt và
miền truyền.
CCD được sử dụng trong máy ảnh kỹ thuật số, camera, scanner quang như các
thiết bị cảm biến ánh sáng.
CCD tương đối nhạy với tia hồng ngoại, gây ra hiện tượng mắt đỏ trên ảnh.
Được sử dụng trong các máy desktop scanner, CIS sử dụng hệ thống đèn LED đỏ,
lục, lam để chiếu sáng.
CIS thường sử dụng ít năng lượng hơn cho nên có thể áp dụng cho một số scanner
có nguồn cung điện thế thấp.
CIS cho chất lượng ảnh kém hơn, nhưng lại cho cấu trúc tương đối nhỏ gọn, tất cả
các thành phần cần thiết đều có thể tích hợp trong một môđun duy nhất.
CIS được sử dụng trong đọc mã vạch và một số các thiết bị nhận dạng.
96
CIS
3.2 Các kỹ thuật thu nhận
Máy ảnh số
Máy ảnh số thường gọi là máy ảnh kỹ thuật số là một thiết bị điện tử
dùng để thư và lưu giữ hình ảnh một cách tự động thay vì dùng phim
ảnh giống như máy chụp ảnh thường.
Máy chụp ảnh số xem ngay
Máy chụp ảnh số gọn
Máy chụp ảnh số chuyên nghiệp dạng rời
Phân loại
Độ phân giải của máy chụp ảnh số thường được quyết định bởi bộ cảm
Độ phân giải ảnh
Một thuộc tính quan trọng của máy chụp ảnh số là số pixel của nó, tính
biến, đó là phần đổi ánh sáng thành những tín hiệu rời rạc.
Tỉ lệ kích thước ảnh có thể là 4:3 hoặc 3:2.
97
theo hàng triệu gọi là megapixel.
3.2 Các kỹ thuật thu nhận
Máy ảnh số
98
Độ phân giải ảnh
3.2 Các kỹ thuật thu nhận
Máy ảnh số
Phương pháp chụp một lần
Phương pháp thứ hai gọi là chụp nhiều lần
Phương pháp thứ ba là quét ảnh giống như desktop scanner
Các phương pháp thu ảnh
99
Lưới lọc màu, nội suy, chống răng cưa
3.2 Các kỹ thuật thu nhận
Camera số và Webcam
Nhận trực tiếp thông tin video số
Lưu trữ thông tin video dạng số
Ưu điểm của video số:
Dễ dàng đưa vào máy tính và xử lý
Nén video là nén mất mát thông tin
Không sử dụng băng từ, do đó làm thu nhỏ thiết bị
Nhìn trực quan video thu được
Không giảm chất lượng khi sao chép
Nhược điểm
Độ phân giải thấp
Giá bộ nhớ cao
Camera số:
Camera số có chất lượng thấp
Gắn trực tiếp vào máy tính
Cho phép tương tác trực tiếp với Internet
Độ phận giải thấp – 640 x 480 300.000 pixel
100
Webcam
3.3 Các kỹ thuật lưu trữ
Đĩa CD
Đĩa CD là một trong những loại đĩa quang học, chúng thường được
chế tạo bằng chất dẻo có đường kính là 4,75 inch, dùng phương
pháp ghi quang học để lưu trữ khoảng 80 phút âm thanh hoặc 700
MB dữ liệu máy tính đã được mã hóa theo kỹ thuật số.
Tốc độ quét: 1.2 – 1.4 m/s
Độ dài rãnh: 1.6 µm
Đường kính đĩa: 120 mm
Độ dày: 1.2 mm
Bán kính trong của vùng lưu trữ: 25 mm
Bán kính ngoài của vùng lưu trữ: 58 mm
Đường kính lỗ trục: 15 mm
101
Đặc điểm
3.3 Các kỹ thuật lưu trữ
Đĩa CD
Một lớp nhựa
Một lớp bảo vệ bề mặt
Một lớp màng kim loại phản xạ
Các vết dữ liệu được khắc lên lớp màng kim loại theo các lỗ có độ sâu
0.83µm, độ cách quãng: 1.6µm.
Các vết khắc thể hiện các mã nhị phân: vùng bằng tương ứng bit 0, sự biến
đổi từ vùng cao sang vùng thấp hoặc từ vùng thấp sang vùng cao tương ứng
bit 1.
102
Cấu tạo của đĩa CD gồm có 3 lớp:
3.3 Các kỹ thuật lưu trữ
Đĩa CD
Đơn vị lưu trữ nhỏ nhất trong CD là frame gồm 33 byte:
6 mẫu 16 bit stereo (2 byte x 2 kênh x 6 mẫu = 24 byte).
8 byte sửa lỗi CIRC (Cross-interleaved Reed-Solomon coding)
1 byte lưu thông tin điều khiển và hiển thị
Mỗi byte được chuyển thành 14 bit theo phương pháp điều chế eight-to-
fourteen. + 3 bit bổ trợ tạo thành 17 bit. Như vậy tổng cộng có 33 x
(14+3) = 561 bit + 27 bit đồng bộ = 588 bit cho một frame.
Các frame được nhóm lại tạo thành sector: Mỗi sector có 98 frame tương
đương 2352 (98x24) byte âm nhạc. Đầu đọc CD có khả năng quét 75
sector/s ~ 176.400 byte/s. Chia cho hai kênh và hai byte cho một mẫu
chúng ta có tốc độ là 44,100 mẫu/s.
103
Cấu trúc dữ liệu
3.3 Các kỹ thuật lưu trữ
Đĩa CD
Không có hai bit 1 nằm kề nhau, tối
thiểu phải cách 2 bit 0 để tránh bước
chuyển và làm giảm tốc độ đọc.
Như vậy thời gian tối thiểu để xảy ra
bước chuyển là 3T (T = 231.4 ns)
Thời gian tối đa xảy ra bước chuyển
là 11 T (chuỗi 14 bit có hơn 10 bit 0
nằm giữa hai bit 1).
104
Điều chế eight-to-fourteen
3.3 Các kỹ thuật lưu trữ
Đĩa CD
Các chuẩn CD
Dùng lưu trữ thông tin Multimedia.
Music Disc
SACD (Super Audio CD)
CD-Text
CD-I (Compact Disc interative)
CD-ROM XA
CD-I Bridge
CD-R
Video CD (VCD)
Mini CD
105
ISO 9660.
3.3 Các kỹ thuật lưu trữ
Đĩa CD
CD-DA
Được giới thiệu lần đầu tiên vào những năm 1980 bởi Sony và Philips
Một sector (block) chứa 98 dải 24 octect tương được bới 2.352 octet
Lưu trữ âm thanh số: 44.1 KHz và 16 bit.
44100 x 16 x 2 = 1411200 bit/s
Dung lượng: 1411200 x 60 x 70 = 747 MB
Kiểm soát lỗi bằng CICR và EFM
106
(1/75 giây âm nhạc): là đơn vị nhỏ nhất trên đĩa CD-DA.
CD-DA: 747 MB, 1-99 rãnh, mỗi rãnh chứa 300 sector.
Tốc độ dữ liệu: 44.1 KHz tần số lấy mẫu, 16 bit mã hóa, 2 kênh
3.3 Các kỹ thuật lưu trữ
Đĩa CD
Dược giới thiệu lần đầu tiên vào năm 1983 bởi Sony và Philips
Mỗi khối thông tin chứa 98 khung dữ liệu, mỗi khung dài 24 octet, cho ta
CD-ROM
Có hai chế độ: chứa dữ liệu tin học và âm thanh
Trong chế độ thứ nhất: các dữ được tăng thêm tính sửa lỗi và phát hiện
lệ bit lỗi: 10-15. Khuôn dạng dữ liệu có: 12 byte Sync, 4 byte
lỗi: tỉ
Hearder, 8 byte dự phòng, 2048 byte dữ liệu, 276 byte sửa lỗi và 4 byte
phát hiện lỗi.
Trong chế độ thứ 2: toàn bộ 2336 byte dữ liệu, 16 byte đầu giống chế độ
2.352 octet dữ liệu
Tốc độ đọc khối: 75 khối/s; data rate: chế độ thứ nhất: 150 KBps, chế độ
thứ nhất.
Dung lượng
Chế độ thứ nhất: 74 x 60 x 75 x 2048 = 650 MB.
Chế độ thứ hai: 74 x 60 x 75 x 2336 = 742 MB.
107
thứ hai: 171 KBps.
3.3 Các kỹ thuật lưu trữ
DVD
Còn gọi là Digital Versatile Disc hoặc Digital Video Disc được phát
minh vào năm 1995. Nó dùng để lưu dữ liệu và video. DVD có cùng
kích thước với CD nhưng dung lượng của nó gấp 6 lần.
DVD-5: có một mặt và một lớp lưu thông tin, khả năng lưu trữ 4.7 GB.
DVD-9: có một mặt và hai lớp lưu thông tin, khả năng lưu trữ là 8.5 GB.
DVD-10: có hai mặt và mỗi mặt có một lớp lưu thông tin, khả năng lưu trữ
Phân loại
DVD-9: có hai mặt và mỗi mặt có hai lớp lưu thông tin, khả năng lưu trữ
9.4 GB.
là 17 GB.
Blu-ray sử dụng ánh sáng laser xanh với bước sóng 405 nm để đọc và
Blu-ray
108
viết dữ liệu
Hard-coating
3.3 Các kỹ thuật lưu trữ
Hard disk driver
HDD là thiết bị lưu trữ dữ liệu trên bề mặt các tấm đĩa hình tròn phủ
vật liệu từ tính, thuộc dạng bộ nhớ “không thể xâm phạm”, có nghĩa
là chúng không bị mất dữ liệu khi ngừng cung cấp nguồn điện.
109
Cấu tạo
3.3 Các kỹ thuật lưu trữ
Hard disk driver
Hoạt động
Head: Đầu đọc/ghi di chuyển trên bề mặt đĩa
Grain: Các thành phần hạt từ và phương của chúng sắp xếp đồng hướng
R, N: vị trí từ ngược/thuận (theo quy ước)
Magnetic Field lines: Đường sức từ (khi không có đầu đọc/ghi)
Binary value encoded: Giá trị tín hiệu nhị phân (0101…) nhận được
110
trong một khoảng.
3.3 Các kỹ thuật lưu trữ
Hard disk driver
Thời gian truy cập ngẫu nhiên: là thời giant rung binh để đĩa cứng tìm
kiếm một dữ liệu ngẫu nhiên, tính băng ms (số liệu năm 2007 là từ 5-15
ms).
Thời gian làm việc tin cậy: MTBF (Mean time between failures) có thể
Một số thông số của ổ đĩa
Dung lượng và tốc độ
Thời gian tìm kiếm trung bình: là khoảng thời giant rung bình (đơn vi ms)
mà đầu đọc có thể di chuyển từ một cylinder này đến cylinder khác ngẫu
nhiên.
Bộ nhớ đệm: giống như RAM trong máy tính, đầu đọc ghi đọc dữ liệu và
hiểu là tuổi thọ của ổ đĩa cứng tính theo đơn vị giờ.
111
lưu vào trong bộ nhớ tạm.
3.3 Các kỹ thuật lưu trữ
Hard disk driver
SCSI (Small Computer System Interface)
ATA (Advanced Technology Attactment) tốc độ truyền dữ liệu tối đa là
Chuẩn giao tiếp vật lý
SATA (Serial ATA) tốc độ truyền theo chuyền 150 MB/s, tuy nhiên ATA II
cho phép tốc tộ lên đến 150 MB/s còn ATA III, tốc độ có thể đạt được là
600 MB/s.
112
133 MB/s
3.4 Các kỹ thuật xử lý
CPU – Central Processing Unit
ứng dụng trong máy tính cá nhân và mainframe.
Intel 4004 ra đời vào năm 1970, nâng cấp lên thành Intel 8080 và
đôi cứ sau 1 năm.
Định luật Moore: số lượng transistor trên một bo mạch tăng lên gấp
khả năng tính toán song song.
Máy tính đời mới như máy tính lượng tử, máy tính được tăng cường
Bộ điều khiển: điều khiển hoạt động xử lý, được điều tiết chính xác bởi
Cấu tạo:
Thanh ghi: phần tử nhớ tạm trong bộ vi xử lý
Bộ số học – logic: thực hiện các phép toán logic và số học
113
xung nhịp đồng hồ.
3.4 Các kỹ thuật xử lý
CPU – Hoạt động
CPU đưa địa chỉ của lệnh cần nhận từ bộ đếm chương trình PC ra bus
Nhận lệnh
CPU phát tín hiệu điều khiển đọc bộ nhớ
địa chỉ.
CPU tăng nội dung PC để trỏ sang lệnh kế tiếp
114
Lệnh từ bộ nhớ được đặt lên bus dữ liệu và được CPU copy vào thanh
ghi lệnh IR
3.4 Các kỹ thuật xử lý
CPU – Hoạt động
Giải mã lệnh
Đơn vị điều khiển tiến hành giải mã lệnh để xác định các thao tác phải
Lệnh từ thanh ghi lệnh IR được đưa đến đơn vị điều khiển
Giải mã lệnh xảy ra bên trong CPU
thực hiện
CPU đưa địa chỉ của toán hạng ra bus địa chỉ
CPU phát tín hiệu điều khiển đọc
Toán hạng được đọc vào CPU
Tương tự như nhận lệnh
Nhận toán hạng
Có nhiều dạng tùy thuộc vào lệnh có thể là: Đọc/Ghi bộ nhớ, Vào/Ra,
Chuyển giữa các thanh ghi, Thao tác số học/logic. Chuyển điều khiển (rẽ
nhánh).
115
Thực hiện lệnh
3.4 Các kỹ thuật xử lý
CPU – Hoạt động
Ghi toán hạng
CPU đưa địa chỉ ra bus địa chỉ
CPU đưa dữ liệu cần ghi ra bus dữ liệu
CPU phát tín hiệu điều khiển ghi
Dữ liệu trên bus dữ liệu được copy đến vị trí xác định
116
3.4 Các kỹ thuật xử lý
CPU – Hoạt động
Nội dung của bộ đếm chương trình PC được đưa ra bus dữ liệu
CPU đưa địa chỉ ra bus địa chỉ
CPU phát tín hiệu điều khiển thanh ghi bộ nhớ
Địa chỉ trở về trên bus dữ liệu được ghi vào vị trí xác định ở ngăn xếp SP
Địa chỉ lệnh đầu tiên của chương trình con điều khiển ngắt được náp vào
Ngắt
117
PC.
3.4 Các kỹ thuật xử lý
Sound Card
Trong máy tính Sound Card là một bo mạch mở rộng các chức năng
về âm thanh, thông qua các phần mềm nó cho phép ghi lại âm thanh
(đầu vào) hoặc trích xuất âm thanh (đầu ra) thông qua các thiết bị
chuyên dụng khác.
Trích xuất các tín hiệu âm thanh dạng tín hiệu tương tự hoặc tín hiệu số
Chức năng chính
Ghi lại âm thanh để lưu trữ như tiếng nói, âm thanh tự nhiên, âm nhạc,
tới các loa
Xử lý và phát lại âm thanh từ các thiết bị khác: Phát âm thanh trực tiếp
phim… thông qua các ngõ đầu vào.
Kết nối các bọ điểu khiển game như joystick.
từ các ổ đĩa quang, thiết bị phát MIDI.
Sử dụng bus ISA
Sử dụng bus PCI
Sử dụng bus USB
118
Phân loại
3.4 Các kỹ thuật xử lý
Sound Card
Các đặc điểm
Nhiễu (Noise): nhiễu cho phép trong khoảng -90 dB.
Distortion: nguyên nhân là do sự xuất hiện của những tần số âm thanh
khác trên tần số âm thanh phát ra và gây nhiễu, được tính ra đơn vị %.
THD (Total Harmonic Distortion): 0.005%.
Nhiễu xuyên kênh: xuất hiện do có nhiều kênh âm thanh phát ra cùng
Dynamic range và SNR (Signal-to Noise Ratio): được tính bằng tỉ số của
một lúc. Nhiễu cho phép là khoảng -90 dB.
119
âm thanh to nhất không bị méo và nhiễu, giá trị cho phép là 90 dB.
3.5 Các kỹ thuật hiển thị
Màn hình CRT
hạt điện tử.
Quét mặt màn hình thủy tinh bằng chùm tia điện tử, bản thân mặt
người không nhìn thấy chùm tia quét do sự lưu ảnh trên võng mạc.
Các hạt huỳnh quang trên màn hình phát sáng do va chạm với các
120
Điểm sáng được hợp thành từ ba điểm đơn sắc: Red, Green và Blue.
3.5 Các kỹ thuật hiển thị
Màn hình CRT
Các đặc điểm
Độ phân giải: là số điểm có thể hiển thị.
Kích thước màn hình:
CRT 15” với độ phân giải 800x600
CRT 17” với độ phân giải 1024x768
CRT 19”-21” với độ phân giải 1280x1024 - 1600x1200
Dot pitch: là khoảng cách giữa hai pixel, giá trị thông thường của nó
Tần số quét: tương đương số lượng hình ảnh hiển thị trong một đơn vị
thời gian, với tần số > 75 Hz thì mắt người sẽ không cảm nhận thấy màn
hình nháy.
Hai dạng quét: là progressive và interlace.
Interlace quét và hiển thị các dòng chắn sau đó đến các dòng lẻ, do đó hình
ảnh bị nhấp nháy dễ làm mỏi mắt. Màn hình TV làm theo kỹ thuật Interlace.
121
trong khoảng từ 0.22 – 0.3 mm.
3.5 Các kỹ thuật hiển thị
Màn hình CRT
Một số vấn đề
Độ chính xác của hệ thống điều khiển hướng.
3 súng bắn tia điện tử cùng hoạt động đồng thời và phải cùng tìm thấy
một điểm duy nhất trên màn hình.
Sử dụng các hạt huỳnh quang cho chất lượng ảnh tốt.
Góc nhìn 180o
Giá thành thấp
Ưu điểm
Tiêu tốn năng lượng: 150 watt với màn hình 17”.
Vấn đề hội tụ
Tạo ra các tia có hại cho sức khỏe
Cồng kềnh và nặng
122
Nhược điểm
3.5 Các kỹ thuật hiển thị
Màn hình TFT
Một bộ lọc có hướng phân cực cố định
Một bộ lọc khác được làm từ tinh thể lỏng.
Sự thay đổi của điện trường sẽ dẫn đến sự thay đổi của cấu trúc lớp tinh
thể lỏng và làm thay đổi hướng phân cực. Sự thay đổi điện trường là do
một lưới các bóng bán dẫn (transistor) tạo ra.
123
Màn hình TFT thông thường gồm có hai bộ lọc phân cực:
3.5 Các kỹ thuật hiển thị
Màn hình TFT
TN+Film
Giữa hai tầng phân cực cố định có một lớp tinh thể lỏng. Các tinh thể
lỏng khi tạo thành các đường xoắn có thể cho phép ánh sáng đi qua và
tạo thành một điểm sáng trên màn hình. Tuy nhiên dưới sự tác động của
điện trường, các tinh thể này bị xáo trộn và ngăn ánh sáng lại và tạo
thành các điểm tối.
124
3.5 Các kỹ thuật hiển thị
Màn hình TFT
TN+Film
Ưu điểm:
Là loại màn hình tốc độ làm mới nhanh nhất khoảng 4 ms.
Giá thành thấp
Tiêu thụ điện năng thấp nhất nên có thể được sử dụng cho các màn hình
laptop.
Nhược điểm:
Sự xáo trộn của các tinh thể không phải là hoàn hảo nên nó không tạo thành
màu đen tuyệt đối, do đó độ tương phản của màn hình này thấp.
Không thể điều chỉnh các tinh thể lỏng tối ưu, nên số lượng màu có thể biểu
diễn giảm đi đáng kể. Mỗi một kênh màu chỉ biểu diễn được bằng 6 bit, như
vậy màn hình hiển thị được 264.000 màu sắc khác nhau.
Màn hình thường xuất hiện hiện tượng một bên sáng hơn và một bên tối hơn.
Màn hình LG 1915S – 19” có góc nhìn 140o, độ tương phải 1:500, thời
125
gian trả lời 12 ms với độ sáng tương đương 250 cd/m2.
3.5 Các kỹ thuật hiển thị
Màn hình TFT
ISP/S-ISP
Màn hình này ở trạng thái bình thường các tinh thể lỏng có hướng vuông
góc với hướng của các tầng phân cực. Chính vì thế khi không có tác
động của điện trường, nó sẽ không cho ánh sáng đi qua tạo thanh màu
đen.
126
3.5 Các kỹ thuật hiển thị
Màn hình TFT
MVA/PVA
Ưu điểm:
Có thời gian trả lời lớn.
Góc nhìn thấp hơn so với màn hình IPS và có độ tương phản khoảng 1:300.
Màn hình LG 1910P có góc nhìn 176o, độ tương phải 1:400, cường độ
127
sáng 250 cd/m2 và thời gian trả lời là 25 ms.
3.5 Các kỹ thuật hiển thị
So sánh TFT và CRT
hơn, nhưng trên thực tế TFT cho ảnh tự nhiên hơn rất nhiều.
CRT theo quan điểm của nhiều người cho chất lượng hình ảnh tổt
Màn hình Plasma
TFT có góc nhìn kém như trường hợp của TN+film, góc nhìn là 140o.
TFT có thời gian trả lời lâu hơn.
Màn hình này gồm khí trong đó có các hạt ion và electron. Khi hai hạt
này va chạm với nhau nó sẽ tạo ra tia sáng, thường là các tia cực
tím.
60.000 giờ.
Màn hình này có độ tương phản tốt, có thời gian sử dụng là khoảng
128
Màn hình Panasonic TH-65PHD7E, 65” có độ phân giải 1366x768,
sử dụng 30 bit cho một kênh. Độ tương phải là 1:3000 và góc nhìn
khoảng 160o.
3.6 Các kỹ thuật truyền dẫn
Modem không đồng bộ:
Khi gửi thông tin từ máy tính: phải chuyển đổi thông tin từ dạng số sang
Modulation and Demodulation.
Nhận và gửi thông tin thông qua mạng điện thoại công cộng.
Khi nhận thông tin từ mạng điện thoại: phải chuyển đổi thông tin từ dạng
dạng tương tự.
tương tự sang dạng số.
129
Tốc độ truyền dữ liệu: 56 Kbps
3.6 Các kỹ thuật truyền dẫn
Mạng ISDN
Mạng ISDN – Intergrated Services Digital Network
Mạng điện thoại tương tự:
Dịch vụ điện thoại tương tự chỉ cho phép sử dụng từng đường điện thoại độc
lập cho thiết bị
Khối lượng thông tin được truyền hạn chế: hiện nay với kỹ thuật tương tự, tốc
độ truyền thông tin chỉ đạt 56Kbps.
ISDN là mạng truyền thông số.
Là công nghê truyền thông hoàn toàn dạng số được xây dựng trên cơ sở
hạ tầng của mạng điện thoại công cộng.
Cho phép sử dụng đường điện thoại tiêu chuẩn và chuyển thành đường
truyền số cho phép truyền tải đồng thời dữ liệu âm thanh, hình ảnh và
các dạng dữ liệu khác.
Cung cấp nhiều kênh dữ liệu trên cùng một dây điện thoại tiêu chuẩn.
ISDN:
Đường truyền số cho phép giảm nhiễu và sự giao thoa của sóng điện từ
Mỗi kênh có tốc độ truyền 64Kbps.
130
trên các kênh mang
3.6 Các kỹ thuật truyền dẫn
Các kênh ISDN
Giao diện ISDN
131
3.6 Các kỹ thuật truyền dẫn
Các nhóm chức năng
S
T
U
V
TE1
NT1
NT2
LT
ET
R
TA
Đường kết nối
Tổng đài số
USER SIDE
ASDL (Asymmetric Digital Subriber Line)
Công nghệ bất đối xứng tốc độ tải xuống > tốc độ tải lên
Mạch ADSL được kết nối với một modem ADSL bằng đường dây cáp xoắn
Kênh tải xuống tốc độ cao (1.5 – 9 Mbps)
Kênh song công tốc độ trung bình (16-640 kbps)
Kênh cơ bản đề truyền dịch vụ thoại.
ADSL modem truyền tốc độ tương thích với chuẩn Bắc Mỹ T1 – 1.544 Mbps
và Châu Âu E1 – 2.048 Mbps (cho tốc độ tải xuống 6.1 Mbps và 64 kbps kênh
song công).
132
thao tạo ra 3 kênh khác nhau:
3.6 Các kỹ thuật truyền dẫn
Mạch Ethernet
133
3.7. Nén dữ liệu
Khái niệm nén dữ liệu.
Các phương pháp nén không mất thông tin.
Các phương pháp nén mất thông tin.
134
Khái niệm về nén dữ liệu
Nhu cầu về nén dữ liệu
Sự phát triển mạnh mẽ của công nghệ truyền thông, kỹ thuật tính toán
và Internet.
Sự mất cân bằng về:
Các khối dữ liệu lớn có thể được xử lý.
Các khối dữ liệu lớn có thể được lưu trữ.
Các khối dữ liệu lớn có thể được truyền.
Vấn đề đặt ra:
Do không đáp ứng được các yêu cầu về xử lý, lưu trữ và truyền thông,
vấn đề đặt ra là: giảm kích thước khối dữ liệu mà không làm giảm lượng
thông tin chứa trong đó.
Ví dụ:Một dòng video: 25 hình /s, mỗi hình chứa 16 triệu màu, độ phân
giải 640x480.
Tốc độ tạo thông tin: 25 x 8 x 3 x640 x 480 =184320000bit/s = 23Mo/s
Với 2h video, lượng dữ liệu sinh ra bằng 162GB
ứng dụng:
Lưu trữ thông tin: trong các ngân hàng ảnh, đĩa DVD.
Truyền thông:truyền ảnh trên mạng Internet, mạng không dây.
135
Khái niệm về nén dữ liệu
Các tiêu chuẩn lựa chọn các phương pháp nén dữ liệu:3 tiêu chuẩn
Tỷ lệ nén: tỷ lệ giữa kích thước khối thông tin sau khi nén với kích thước
trước khi nén.
Chất lượng nén:
Nén mất thông tin.
Nén không mất thông tin.
Chất lượng cảm nhận thông tin
Tốc độ của các thuật toán:
Tốc độ nén.
Tốc độ giải nén.
136
Nén không mất thông tin
Phương pháp nén không mất thông tin cho phép khôi
phục lại hoàn toàn khối dữ liệu ban đầu qua các chu
trình nén – giải nén.
Đòi hỏi phải có thiết bị lưu trữ và đường truyền lớn
Các thuật toán của nén không mất dữ liệu dựa vào
việc thay thế một nhóm các ký tự trùng lặp bởi một
nhóm các ký tự đặc biệt khác ngắn hơn không quan
tâm tới ý nghĩa của dữ liệu
Run-Length Encoding (RLE), Huffman Coding,
Arithmetic coding, Shannon-Fano Coding, LZ78, LZH,
LZW ...
137
Nén không mất thông tin
Ba dạng thuật toán nén không mất thông tin:
Các thuật toán này hoạt động dựa trên tần suất xuất hiện của các ký tự
mã trong khối thông tin. Giảm số lượng bit dùng để biểu diễn các ký tự
mã xuất hiện thường xuyên.
Tăng số lượng bit dùng để biểu diễn những ký tự mã ít xuất hiện.
Các thuật toán dựa trên sự thay thế các chuỗi: các thuật toán này
nén các chuỗi chứa các ký tự đồng nhất.
Các thuật toán mã hoá thống kê:
Giảm số lượng các bit dùng để chứa các từ xuất hiện thường xuyên.
Tăng số lượng các bit để chứa các từ xuất hiện thưa thớt.
Các đặc tính:
Thuật toán đơn giản.
Tỷ lệ nén thấp.
Thích hợp với nén ảnh và văn bản.
138
Các thuật toán dựa trên từ điển:
Các phương pháp nén không mất thông tin
Phương pháp nén Shannon-Fano.
Nguyên lý:
Các từ mã có độ dài biến thiên.
Độ dài mã tỷ lệ nghịch với xác suất xuất hiện của ký tự.
Từ mã được giải mã một cách duy nhất.
Thuật toán:
Xác định các xác suất xuất hiện của các ký tự trong bản tin.
Sắp xếp các ký tự theo trình tự xác suất xuất hiện giảm dần.
Phân chia các ký tự thành hai nhóm có tổng xác suất xấp xỉ(nếu dùng mã nhị phân
thì phân chia làm hai nhóm, nếu mã cơ số m thì chia làm m nhóm).
Gán cho mỗi nhóm ký hiệu mã 0 hoặc 1.
Tiếp tục phân chia cho tới khi trong các nhóm chỉ chứa một ký hiệu.
Từ mã cho ký hiệu là tổ hợp của các ký hiệu của các nhóm chứa ký hiệu tính theo
thứ tự từ lần tạo nhóm đầu tiên.
139
Các phương pháp nén không mất thông tin
Ví dụ:
Cho thông điệp “BBCAACADBDCADAEEEABAC
140
DBACADCBADABEABEAAA”
Tần suất xuất hiện của các ký tự trong thông điệp lần lượt bằng:
A: 15; B: 8; C: 6; D: 6; E: 5.
A: 00; B: 01; C: 10; D: 110; E: 111.
Số lượng bit dùng để chứa chuỗi mã:
2x15+2x8+2x6+3x6+3x5=91bit.
Nếu dùng mã ASCII: 40x8=320bit.
Tỷ lệ nén: 91/320 = 28%
Mã Fano là mã có tính prefix.
Các phương pháp nén không mất thông tin
Phương pháp Huffman.
Nguyên lý: tương tự mã Shannon-Fano.
Thuật toán:
Xây dựng danh sách các ký tự với xác suất xuất hiện giảm dần.
Các ký tự sẽ là các nút của cây Huffman.
Mã hoá bắt đầu với hai ký hiệu có xác suất nhỏ nhất. Hai ký hiệu được hợp lại, hai
nhánh được gán ký hiệu 0 hoặc 1.
Nút của hai nhánh được coi là một ký hiệu mới có xác suất xuất hiện bằng tổng hai
xác suất xuất hiện của hai ký hiệu tạo ra nút.
Tiếp tục quá trình trên với hai nút có xác suất xuất hiện nhỏ nhất.
Từ mã ứng với mỗi ký hiệu nguồn là tổ hợp của các ký hiệu mã ở các nhánh tính
từ gốc.
Các ưu điểm:
Cho phép thực hiện tốt với hình ảnh cũng như text.
Tỷ lệ nén trung bình: 50%.
Tốc độ nén nhanh.
141
Các phương pháp nén không mất thông tin
Ví dụ: với cùng thông điệp trước:
“BCAACADBDCADAEEEABACDBACADCBADABEABEAAA”
A: 17; B: 7; C: 6; D: 6; E: 5.
A: 0; B:100; C: 101;
D: 110; E: 111
Mã Huffman có tính prefix.
Số lượng bit dùng để
chứa chuỗi mã:
1x17+3x7+3x6+3x6+3x5=87
Tỷ lệ nén: 87/320=27%
142
Các phương pháp nén không mất thông tin
Phương pháp thay thế RLE(Run Length Encoding).
Nguyên lý:
Tối ưu hoá mã bằng cách thay thế các chuỗi ký tự giống nhau liên tiếp.
ứng dụng trong các loại ảnh BMP, TIFF. Các điểm ảnh liên tiếp có giá trị
như nhau sẽ được thay thế bằng một điểm ảnh và chỉ rõ số lượng điểm.
Các bước thuật toán:
Tìm trong thông điệp những ký tự liên tiếp lặp lại.
Thay thế chuỗi ký tự đó bằng:
Một ký tự đặc biệt chỉ việc nén.
Số lần lặp lại của ký tự.
Ký tự lặp lại được nén.
Ví dụ:
Cho chuỗi “ABCCCCCCDDEEEE”
Chọn ký tự nén: #
Chuỗi sau khi nén: AB#6CDD#4E
Tỷ lệ nén: 57%
143
Các phương pháp nén không mất thông tin
Phương pháp LWZ
Nguyên lý:
Phân tích thông điệp.
Lần lượt lập bảng chứa vị trí xuất hiện của các từ tìm thấy trong thông điệp.
Giảm số lượng bit để mã hoá những từ xuất hiện thường xuyên.
Tăng số lượng bit để mã hoá những từ ít gặp hơn.
đặc tính:
ít hiệu quả đối với ảnh.
Có hiệu quả cao với text hoặc dữ liệu số. Lỷ lệ nén có thể đạt tới 50%.
Các bước thuật toán:
Thông điệp được phân chia thành những khối có độ dài thay đổi. Các khối này gọi
là các câu.
Một câu mới là một khối của ký tự nguồn và thêm một ký tự cuối.
Các câu được liệt kê trong từ điển kèm theo vị trí xuất hiện.
Để mã hoá một câu mới ta chỉ vị trí của câu trong từ điển và chèn thêm ký hiệu mới
vào cuối.
144
Các phương pháp nén không mất thông tin
Ví dụ:
Chuỗi ký tự: PQPQPQRPQRPQRPQRPQR
Từ điển:
256 PQ
257 QR
258 PQP
259 PQR
260 PQRPQR
Kết quả mã hoá: 256 256 260 260 259
Tỷ lệ nén: 2 x 5 / 1 x 19 = 53%
Để giải mã ta cũng phải lập có từ điển và tra cứu ngược lại trong từ điển
145
Các phương pháp nén mất thông tin
Nhận xét về các phương pháp nén không mất thông tin:
Tỷ lệ nén trung bình của các phương pháp nén không mất thông tin
khoảng 40%.
Các phương pháp này không thích hợp với thông tin Multimedia.
Nguyên lý nén mất thông tin.
Dựa vào khả năng cảm nhận của thị giác và thính giác.
Giữ những thông tin quan trọng trong cảm nhận bằng thị giác và thính
giác.
Loại bỏ những thông tin dư thừa đối với cảm nhận.
Nén âm thanh.
Dựa vào khả năng cảm nhận âm thanh của thính giác:
Từ 20Hz đến 20KHz.
Cảm nhận cực đại trong khoảng: từ 2 KHz – 5KHz
Các phương pháp DPCM, ADPCM, LPC.
146
Nén âm thanh
Một số phương pháp nén âm thanh
147
PCM (Pulse-Code Modulation)
DPCM (differential pulse-code modulation)
ADPCM (Adaptive Differential PCM)
PASC (Perceptual Audio Sub-band Coding)
LPC (Linear predictive coding)
Các phương pháp nén mất thông tin
Phương pháp PCM
các xung.
PCM(Pulse Code Modulation). Biểu diễn các tín hiệu số bằng chuỗi
148
Dùng để mã hóa tương tự - số
Tuân theo định lý Nyquist-Shannon
Nén âm thanh
Phương pháp DPCM
trị các mẫu.
Giảm tỷ lệ dữ liệu của PCM bằng cách mã hoá sự khác biệt giữa giá
mẫu tín hiệu trước đó.
n
1
)(~
ns
isa
)(
i
i
0
Mã hoá dự đoán: dự đoán mẫu thứ n+1 theo tổ hợp tuyến tính của n
149
ai là n hệ số dự đoán
Nén âm thanh
150
Nén âm thanh
Phương pháp DM (Delta Modulation) :
Là trường hợp riêng của phương pháp DPCM
Mã hóa sai khác chỉ dùng 1 bit
Mã hóa 0 hoặc 1 tùy thuộc vào cường độ tín hiệu xung hiện tại so
với xung trước đó
Ưu nhược điểm
Phương pháp tăng cường hiệu năng
Đơn giản
Mã hóa ít bit
Độ chính xác không cao, sai số lớn
Tỉ lệ SNR thấp
151
Tăng tần số mã hóa
Phương pháp DM (tiếp)
152
Nén âm thanh
ADPCM(Adaptive Differential PCM):
cố định hiệu năng thay đổi tùy vào dữ liệu đầu vào
Phương pháp DPCM có hạn chế là : bộ dự đoán và lượng tử hóa là
vào các dữ liệu đã nhận được trước đó tối thiểu hóa sự sai khác
giữa mẫu dự đoán và mẫu thực tế
Bộ dự đoán thích nghi : thay đổi tham số tùy thuộc đầu vào trước đó
Lượng tử thích nghi : thay đổi các bước lượng tử hóa khác nhau
ADPCM sử dụng các bộ dự đoán và lượng tử hóa thích nghi dựa
153
ADPCM sử dụng trong các thiết bị CD-i và DVI.
Chuẩn ADPCM: CCITT G.721.
Tỷ lệ nén: 4:1 đến 2:1
Nén âm thanh
154
Nén âm thanh
Phương pháp PASC (Perceptual Audio Sub-band
Coding)
Là phương pháp dựa trên SBD (Sub-band Coding) : chia một tín hiệu
thành nhiều dải tần con mã hóa mỗi dải tần riêng biệt
Cảm nhận từ 20Hz – 20kHz
Nhưng cảm nhận âm thanh không đồng đều ở các tần số khác nhau
Hiệu ứng che tần số : âm thanh tần số mạnh che âm thanh tần số yếu
Mã hóa dự vào cảm nhận âm thanh của con người
MP3 : MPEG-1 or MPEG-2 Audio Layer III
Mã hóa dùng 32 băng tần con, mã hóa cảm nhận và Entropy
155
Được sử dụng trong mã hóa âm thanh chuẩn MPEG 1,2,4
Nén âm thanh
156
Nén âm thanh
Phương pháp LPC (Linear Predictive Coding)
Dây thanh quản
Vòng họng
Miệng+mũi
Mã hóa tiếng nói dựa vào các tham số tổng hợp giọng nói
Dựa vào cấu tạo hình thành âm thanh con người
Phân tích và tái tạo tiếng nói
Sử dụng trong việc truyền âm thanh số, mã hóa trong điều kiện tốc độ
Phân tích và tổng hợp lại các âm con người phát ra
Ứng dụng :
Sử dụng kết hợp với các kỹ thuật khác
157
thấp
158
Nén mất Thông tin: nén ảnh và video
Ảnh được khôi phục không giống hoàn toàn với ảnh
gốc
Thích hợp cho việc lưu trữ và truyền ảnh tĩnh, video
qua một mạng có băng thông hạn chế
Differential Encoding, Discrete Cosine
Transform(DCT), Vector Quantization, JPEG (Joint
Photographic Experts Group) và MPEG (Motion
Picture Experts Group)
159
Nén ảnh
Các phương pháp nén ảnh có mất tín hiệu gồm có 4
bước như hình .
Sơ đồ cơ bản của bộ mã hoá
Các bộ mã hoá khối có thể dựa trên hai nguyên tắc
biến đổi cơ bản: Discrete Cosine Transform (DCT) và
Vector Quantization (VQ)
160
Nén ảnh
161
Nén ảnh
Phương pháp nén ảnh JPG:
Nguyên lý: 4 bước thực hiện
Biến đổi hệ toạ độ màu.
Thay đổi các bước lấy mẫu: các điểm được nhóm theo các thông tin về
Thực hiện phép biến đổi từ miền không gian về miền tần số không gian.
màu thành các nhóm 2 điểm hoặc 4 điểm.
162
Lượng tử hóa không đều các hệ số biến đổi
Sử dụng các thuật toán nén RLE và Huffman.
Biến đổi hệ màu RGB YCbCr
Do mắt người nhạy với thành phần Y hơn so với Cb,
Cr nên giảm số bit lưu trữ Cb, Cr
163
Nén ảnh
164
Nén ảnh
Ta có thể xác định 64 giá trị chỉ bằng 5 số ngyên nếu ta ap
dụng công thức discrete cosine transform(DCT)
Bộ giải mã có thể tái tạo lại giá trị của các pixel thông qua công
thức inverse discrete cosine transform(IDCT)
c
165
Nén ảnh
166
Nén ảnh – ví dụ
Tru
128
DCT
167
Nén ảnh – ví dụ
168
169
170
Nén ảnh
Chuẩn JPEG 2000
JPEG đã đưa ra một chuẩn nén ảnh mới là JPEG2000. JPEG2000
sử dụng biến đổi Wavelet và các phương pháp mã hoá đặc biệt để
có được ảnh nén ưu việt hơn hẳn JPEG.
Cho chất lượng ảnh tốt nhất khi áp dụng nén ảnh tĩnh có tổn thất.
Sử dụng được với truyền dẫn và hiển thị luỹ tiến về chất lượng, độ phân
JPEG2000 có nhiều chức năng đặc biệt hơn các chuẩn nén ảnh tĩnh
khác như JPEG hay GIF. Dưới đây là các chức năng ưu việt của
JPEG2000 so với các chuẩn nén ảnh tĩnh khác
Sử dụng cùng một cơ chế nén ảnh cho cả hai dạng thức nén.
Truy nhập và giải nén tại mọi thời điểm trong khi nhận dữ liệu.
Giải nén từng vùng trong ảnh mà không cần giải nén toàn bộ ảnh
Có khả năng mã hoá ảnh với tỷ lệ nén theo từng vùng khác nhau
Nén một lần nhưng có thể giải nén với nhiều cấp chất lượng tuỳ theo yêu
giải, các thành phần màu và có tính định vị không gian.
171
cầu của người sử dụng
Nén ảnh
172
Nén ảnh
173
Nén ảnh
174
Nén ảnh
So sánh chuẩn JPEG và JPEG2000 với tỉ lệ 0.25 bpp, CR = 32
175
Nén video
Đối với tín hiệu video số, số lượng bit được sử dụng để truyền
tải thông tin đối với mỗi miền tần số khác nhau, có nghĩa là: miền
tần số thấp, nơi chứa đựng nhiều thông tin, được sử dụng số
lượng bít lớn hơn và miền tần số cao, nơi chứa đựng ít thông tin,
được sử dụng số lượng bít ít hơn.
Thực chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin
dư thừa. Các thông tin dư thừa trong nén video số thường là:
Độ dư thừa không gian giữa các pixel;
Độ dư thừa thời gian do các ảnh liên tiếp nhau;
Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ tương quan
Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xuất
cao;
Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của
hiện không đều nhau;
176
mắt).vv…
Nén video
MJPEG (Motion JPEG) – là việc sử dụng chuẩn mã
hóa video sử dụng các frame được mã hóa bằng
chuẩn nén ảnh JPEG
Đơn giản – các frame độc lập với nhau
Giới hạn mã hóa 1:20
MJPEG được phát triển cho các máy tính cá nhân,
hiện nay dùng các thiết bị khác. Hiện nay MJPEG
được ứng dụng cho
Máy quay số
Thu nhận và chỉnh sửa video
IP Camera
Sử dụng cho các thiết bị hiển thị video
177
Nén video
MPEG (Moving Picture Expert Group) là nhóm chuyên gia về
hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây
dựng tiêu chuẩn cho tín hiệu Audio và Video số. Ngày nay,
MPEG đã trở thành một kỹ thuật nén Audio và Video phổ biến
nhất
MPEG-1, mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ
MPEG-2 (1990) : MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát
trong đĩa CD.
MPEG-4 (10/1998), Là chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng
dụng về đồ hoạ và video tương tác hai chiều (games, videoconferencing) và
các ứng dụng multimedia tương tác hai chiều (World Wide Web, Internet
video...)
MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ không
triển. (3-15Mbps)
178
phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-1, MPEG-2
hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML(Extansible
Markup Language) để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode
để gắn thẻ cho các sự kiện, hay đồng bộ các dữ liệu.
179
Nén video
Các cấu trúc lấymẫu vỡ số hoá tín hiệu video
Đối với truyền hình số NTSC vỡ PAL, chuỗi video
gồm các khung hình (frame ảnh) có độ phân giải 576
x 720, các dòng video chứa 720 điểm ảnh đ−ợc lấy
mẫu vỡ số hoá theo các cấu trúc sau :
180
Nén video
181
Nén video
182
Nén video
Các chuẩn nén video hầu hết đều sử dụng 2 kỹ thuật
chính là :
Nén video không dùng kỹ thuật phát hiện và bù chuyển động -
MJPEG
Nén ảnh tĩnh để giảm độ dư thừa không gian
Đánh giá, ước lượng chuyển động để giảm độ dư thừa về mặt thời gian
183
Nén video dùng kỹ thuật phát hiện và bù chuyển động
Nén video
Phân loại các frame video
dự đoán nội suy 2 chiều
184
Frame I : là frame đầu tiên trong chuỗi video
Frame P : (predicted frame) – frame được dự đoán tiếp theo
Frame B (Bi-directional interpolated prediction frame) - frame được
Nén video
Cấu trúc
dòng bit MPEG
185
186
Cấu trúc
dòng bit MPEG
187
Nén video
Mô hình mã hóa MPEG
188
Nén video
Đánh giá chuyển động (Motion Estimation) : xác định
vector chuyển động
Bù chuyển động (Motion Compensation) : khôi phục
ảnh bằng cách sử dụng vector chuyển động và sai số
chuyển động (phần sai lệch giữa 2 frame)
189
Nén video
Quá trình nén frame I
190
Nén video
Quá trình nén frame P
Frame B ?
191
Giải thuật đối sánh, xác định vector
chuyển động
192