intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Nhập môn Đa phương tiện: Phần 2 - ĐH CNTT&TT

Chia sẻ: Kiếp Này Bình Yên | Ngày: | Loại File: PDF | Số trang:37

228
lượt xem
45
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tiếp nối nội dung ở phần 1, bài giảng Nhập môn Đa phương tiện phần 2 cung cấp cho người học những kiến thức về dữ liệu ảnh, dữ liệu âm thanh và dữ liệu video. Mời các bạn cùng tham khảo để nắm bắt các nội dung chi tiết của bài giảng.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Nhập môn Đa phương tiện: Phần 2 - ĐH CNTT&TT

  1. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Chƣơng 4: Dữ liệu ảnh 4.1. Một số khái niệm cơ bản Hình ảnh tĩnh có thể được biểu diễn bởi hàm hai chiều f(x,y), trong đó, x và y là tọa độ không gian phẳng (2 chiều). Khi xét ảnh "đen-trắng", giá trị hàm f tại một điểm được xác định bởi tọa độ (x,y) được gọi là độ chói (mức xám) của ảnh tại điểm này. Nếu x,y,và f là một số hiện hữu các giá trị rời rạc, chúng ta có ảnh số. Xử lý ảnh số là quá trình biến đổi ảnh số trên máy tính (PC). Như vậy, ảnh số được tạo ra bởi một số hữu hạn các điểm ảnh, mỗi điểm ảnh nằm tại một vị trí nhất định và có 1 giá trị nhất định. Một điểm ảnh trong một ảnh còn được gọi là một pixel.  Ảnh và điểm ảnh: Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong không gian của đối tượng và ảnh được xem như là 1 tập hợp các điểm ảnh.  Mức xám, màu: Là số các giá trị có thể có của các điểm ảnh của ảnh Hệ thống thị giác là cơ quan cảm nhận hình ảnh quang học tương đối hoàn hảo, cho phép con người cảm nhận được hình ảnh quang học trong thiên nhiên. Ứng dụng quan trọng nhất của xử lý ảnh là biến đổi tính chất của ảnh số nhằm tạo ra cảm nhận về sự gia tăng chất lượng hình ảnh quang học trong hệ thống thị giác. Tuy nhiên, mắt người chỉ cảm nhận được sóng điện từ có bước sóng hạn chế trong vùng nhìn thấy được, do đó ảnh theo quan niệm thông thường gắn liền với hình ảnh quang học mà mắt người có thể cảm nhận. Trong khi đó "ảnh" đưa vào xử lý có thể được tạo ra bởi các nguồn bức xạ có phổ rộng hơn, từ sóng vô tuyến tới tia gamma, ví dụ: ảnh do sóng siêu âm hoặc tia X tạo ra. Nhiều hệ thống xử lý ảnh có thể tương tác với những "ảnh" nêu trên, vì vậy trên thực tế, lĩnh vực xử lý ảnh có phạm vi tướng đối rộng, và liên quan tới nhiều lĩnh vực khoa học khác. Có thể tạm phân biệt các hệ thống xử lý ảnh theo mức độ phức tạp của thuật toán xử lý như sau: 66 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  2. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT 1- Xử lý ảnh mức thấp: đó là các quá trình biến đổi đơn giản như thực hiện các bộ lọc nhằm khử nhiễu trong ảnh, tăng cường độ tương phản hay độ nét của ảnh. Trong trường hợp này, tín hiệu đưa vào hệ thống xử lý và tín hiệu ở đầu ra là ảnh quang học. 2- Xử lý ảnh mức trung: quá trình xử lý phức tạp hơn, thường được sử dụng để phân lớp, phân đọan ảnh, xác định và dự đóan biên ảnh, nén anh để lưu trữ hoặc truyền phát. Đặc điểm của các hệ thống xử lý ảnh mức trung là tín hiệu đầu vào là hình ảnh, còn tín hiệu đầu ra là các thành phần được tách ra từ hình ảnh gốc, hoặc luồng dữ liệu nhận được sau khi nén ảnh. 3- Xử lý ảnh mức cao: là quá trình phân tích và nhận dạng hính ảnh. Đây cũng là quá trình xử lý được thực hiện trong hệ thống thì giác của con người. 4.2 Lĩnh vực ứng dụng kỹ thuật xử lý ảnh Như đã nói ở trên, các kỹ thuật xử lý ảnh trước đây chủ yếu được sử dụng để nâng cao chất lượng hính ảnh, chình xác hơn là tạo cảm giác về sự gia tăng chất lượng ảnh quang học trong mắt người quan sát. Thời gian gần đây, phạm vi ứng dụng xử lý ảnh mở rộng không ngừng, có thể nói hiện không có lĩnh vực khoa học nào không sử dụng các thành tựu của công nghệ xử lý ảnh số. Trong y học các thuật tóan xử lý ảnh cho phép biến đổi hính ảnh được tạo ra từ nguồn bức xạ X -ray hay nguồn bức xạ siêu âm thành hính ảnh quang học trên bề mặt film x-quang hoặc trực tiếp trên bề mặt màn hính hiển thị. Hính ảnh các cơ quan chức năng của con người sau đó có thể được xử lý tiếp để nâng cao độ tương phản, lọc, tách các thành phần cần thiết (chụp cắt lớp) hoặc tạo ra hính ảnh trong không gian ba chiều (siêu âm 3 chiều). Trong lĩnh vực địa chất, hính ảnh nhận được từ vệ tinh có thể được phân tìch để xác định cấu trúc bề mặt trái đất. Kỹ thuật làm nổi đường biên (image enhancement) và khôi phục hính ảnh (image restoration) cho phép nâng cao chất lượng ảnh vệ tinh và tạo ra các bản đồ địa hính 3-D với độ chình xác cao. 67 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  3. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Ảnh nhận được từ vệ tinh dùng trong khì tượng học Trong ngành khì tượng học, ảnh nhận được từ hệ thống vệ tinh theo dõi thời tiết cũng được xử lý, nâng cao chất lượng và ghép hính để tạo ra ảnh bề mặt trái đất trên một vùng rộng lớn, qua đó có thể thực hiện việc dự báo thời tiết một cách chình xác hơn. Dựa trên các kết quả phân tìch ảnh vệ tinh tại các khu vục đông dân cư còn có thể dự đóan quá trính tăng trưởng dân số, tốc độ ô nhiễm môi trường cũng như các yếu tố ảnh hưởng tới môi trường sinh thái. Ảnh chụp từ vệ tinh có thể thu được thông qua các thiết bị ghi hính cảm nhận được tia sáng quang học (λ = 450 − 520 nm) (hính 2a), hoặc tia hồng ngoại (λ = 760 − 900 nm) (hính2b). Trên hính 2a và 2b lần lượt là ảnh bề mặt trái đất nhận được từ 2 ống ghi hính nói trên, dễ dàng nhận thấy sự khác biệt rõ ràng giữa hai ảnh. Đặc biệt trên ảnh 2b, hính con sông được tách biệt rất rõ ràng so với vùng ảnh hai bên bờ. Thiết bị thu hính nhạy cảm với vật thể bức xạ các tia trong miền hồng ngoại sẽ cho ra những bức ảnh trong đó vật thể có nhiệt độ thấp sẽ được phân biệt rõ ràng so với vật thể có nhiệt độ cao hơn. Như vậy việc lựa chọn các thiết bị ghi hính khác nhau sẽ tạo ra ảnh có đặc tình khác nhau, tùy thuộc vào mục đìch sử dụng trong các lĩnh vực khoa học cụ thể . 2.2.1a 2.2.1b Hình 2.1.2 - Ảnh bề mặt trái đất thu được từ hai camera khác nhau 68 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  4. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Xử lý ảnh còn được sử dụng nhiều trong các hệ thống quản lý chất lượng và số lượng hàng hóa trong các dây truyền tự động, vì dụ như hệ thống phân tìch ảnh để phát hiện bọt khì bên vật thể đúc bằng nhựa, phát hiện các linh kiện không đạt tiêu chuẩn (bị biến dạng) trong quá trính sản xuất hoặc hệ thống đếm sản phẩm thông qua hính ảnh nhận được từ camera quan sát. Xử lý ảnh còn được sử dụng rộng rãi trong lĩnh vực hính sự và các hệ thống bảo mật hoặc kiểm soát truy cập: quá trính xử lý ảnh với mục đìch nhận dạng vân tay hay khuôn mặt cho phép phát hiện nhanh các đối tương nghi vấn cũng như nâng cao hiệu quả hệ thống bảo mật cá nhân cũng như kiểm soát ra vào. Ngoài ra, có thể kể đến các ứng dụng quan trọng khác của kỹ thuật xử lý ảnh tĩnh cũng như ảnh động trong đời sống như tự động nhận dạng, nhận dạng mục tiêu quân sự, máy nhín công nghiệp trong các hệ thống điều khiển tự động, nén ảnh tĩnh, ảnh động để lưu và truyền trong mạng viễn thông v.v. 4.3. Các giai đoạn chính trong xử lý ảnh 1- Thu nhận hính ảnh: đây là giai đoạn đầu tiên và quan trọng nhất trong tòan bộ quá trính xử lý ảnh. Ảnh nhận được tại đây chình là ảnh gốc để đưa vào xử lý tại các giai đoạn sau, trường hợp ảnh gốc có chất lượng kém hiệu quả của các bước xử lý tiếp theo sẽ bị giảm. Thiết bị thu nhận có thể là các ông ghi hính chân không (vidicon, plumbicon v.v.) hoặc thiết bị cảm biến quang điện bán dẫn CCD (Charge-Coupled Device). 2- Tiền xử lý ảnh: giai đoạn xử lý tương đối đơn giản nhằm nâng cao chất lượng ảnh để trợ giúp cho các quá trính xử lý nâng cao tiếp theo, vì dụ: tăng độ tương phản, làm nổi đường biên, khử nhiễu v.v. 3- Phân đoạn: là quá trính tách hính ảnh thành các phần hoặc vật thể riêng biệt. Đây là một trong nhưng vấn đề khó giải quyết nhất trong lĩnh vực xử lý ảnh. Nếu thực hiện tách quá chi tiết thí bài toán nhận dạng các thành phần được tách ra trở nên phức tạp, còn ngược lại nếu quá trính phân đoạn được thực hiện quá thô hoặc phân đọan sai thí kết quả nhận được cuối cùng sẽ không chình xác. 4- Biểu diễn và mô tả: là quá trính xử lý tiếp sau khâu phân đoạn hính ảnh. Các vật thể sau khi phân đọan có thể được mô tả dưới dạng chuỗi các điểm ảnh tạo nên ranh giới 69 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  5. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó. Phương pháp mô tả thông qua ranh giới vùng thường được sử dụng khi cần tập trung sự chú ý vào hính dạng bên ngòai của chi tiết ảnh như độ cong, các góc cạnh v.v. Biểu diễn vùng thường được sử dụng khi chúng ta quan tâm tới đặc tình bên trong của vùng ảnh như đường vân (texture) hay hính dạng skeletal. 5- Nén ảnh - bao gồm các biện pháp giảm thiểu dung lượng bộ nhớ cần thiết để lưu trữ hính ảnh, hay giảm băng thông kênh truyền, cần thiết để truyền tìn hiệu hính ảnh số. 6- Nhận dạng: là quá trính phân loại vật thể dựa trên cơ sở các chi tiết mô tả vật thể đó (vì dụ các phương tiện giao thông có trong ảnh). Các quá trính xử lý liệt kê ở trên đều được thực hiện dưới sự giám sát và điều khiển dựa trên cơ sở các kiến thức về lĩnh vực xử lý ảnh. Các kiến thức cơ bản có thể đơn giản như vị trì vùng ảnh nơi có những thông tin cần quan tâm, như vậy có thể thu nhỏ vùng tím kiếm. Trường hợp phức tạp hơn, cơ sở kiến thức có thể chứa danh sách tất cả những hư hỏng có thể gặp trong quá trính kiểm sóat chất lượng thành phẩm hoặc các ảnh vệ tinh có độ chi tiết cao trong các hệ thống theo dõi sự thay đổi môi trường trong một vùng. Ngoài việc điều khiển họat động của từng modul xử lý ảnh (hính 2.1.3), cơ sở kiến thức còn sử dụng để thực hiện việc điều khiển tương tác giữa các modules. Trong hính 2.1.3, quá trính điều khiển nói trên được biểu diễn bằng mũi tên hai chiều. Các giai đoạn xử lý ảnh số 4.4. Các phần tử cơ bản của hệ thống xử lý ảnh số 70 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  6. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Cấu trúc một hệ thống xử lý ảnh đa dụng dùng để thực hiện các giai đoạn xử lý ảnh đề cập ở trên được mô tả trên hính 2.1.4. Các thành phần chình của hệ thống xử lý ảnh Thiết bị thu nhận hình ảnh: là thiết bị biến đổi quang-điện, cho phép biến đổi hình ảnh quang học thành tín hiệu điện dưới dạng analog hay trực tiếp dưới dạng số. Có nhiều dạng cảm biến cho phép làm việc với ánh sáng nhìn thấy hoặc hồng ngoại. Hai loại thiết bị biến đổi quang – điện chủ yếu thường được sử dụng là đèn ghi hình điện tử và chip CCD (Charge Couple Device – linh kiện ghép điện tích). Ống vidicon là đại diện tiêu biểu cho họ đèn ghi hình điện tử được sử dụng tương đối rộng rãi trong camera màu cũng như đen trắng. Ống Vidicon có kích thước nhỏ gọn (đường kính 18-25 mm, chiều dài 10-12 cm), nhẹ, cấu tạo đơn giản, dễ sử dụng. Đèn hình này sử dụng nguyên lý hiệu ứng quang điện trong và nguyên lý tìch lũy điện tích. Chip CCD là linh kiện bán dẫn có khả năng biến đổi năng lượng quang phổ thành tín hiệu điện. Thành phần chính của chip CCD là 71 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  7. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT các tụ điện MOS (Metal-Oxide- Semiconductor). Tụ điện MOS được hình thành bởi ba lớp: một má tụ bằng kim loại, chất điện môi nằm giữa là lớp SiO2 và một má tụ bằng lớp bán dẫn loại p hoặc n (hình 2.1.5). Hình 2.1.5 Cấu trúc tụ điện MOS Một chuỗi tụ điện MOS phân bố đều trên bề mặt chip CCD được biểu diễn trên hình 2.1.6a, mỗi tụ điện với bề mặt cảm quang là má bán dẫn sẽ tạo ra một điểm trên hình ảnh thu được.Theo phương pháp dịch chuyển điện tích, các chip CCD có thể chia ra làm hai loại: CCD dạng chuỗi (một chiều) và dạng ma trận (hai chiều). Trên Hình 2.1.6a là cấu trúc chip CCD dạng chuỗi, quá trình ghi (tích điện) và đọc được thực hiện tại hai khu vực khác nhau, gọi là miền tích điện và miền nhớ. Hai khu vực trên được ngăn cách bởi cổng chuyển dịch. Sau khi kết thúc quá trình tích điện tại các phần tử cảm quang, điện tìch sẽ được truyền song song qua cổng chuyển dịch vào thanh dịch ngang (không nhạy cảm với ánh sáng) tức miền nhớ. Sau khi cổng chuyển dịch đóng lại, quá trình ghi và đọc tại hai miền nói trên sẽ được tiến hành song song. Chip CCD sử dụng trong máy quay video thường có cấu trúc ma trận (hình 2.16b). Các phần tử cảm quang trong CCD tập hợp thành ma trận hai chiều, quá trình “đọc” tín hiệu được thực hiện theo chiều ngang và chiều dọc. Có nhiều cách tổ chức quá trình ghi và đọc tín hiệu trong CCD, nhưng phổ biến nhất là phương pháp dịch chuyển từng ảnh. Khi sử dụng phương pháp này, trong chip CCD được thiết kế một miền nhớ, không 72 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  8. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT tiếp xúc với ánh sáng và có diện tìch bằng miền tìch lũy – là ma trận các phần tử cảm quang. Điện tích thu được tại miền tích lũy được chuyển về miền nhớ. Sau đó, quá trình ghi ảnh tại miền tích lũy và đọc ảnh từ miền nhớ vào thanh dịch ngang sẽ được tiến hành song song.Từng dòng ảnh được dịch chuyển xuống thanh dịch ngang, sau đó các gói điện tìch ứng với các điểm trong dòng ảnh sẽ được đẩy ra lần lượt khỏi thanh dịch. Sau khi toàn bộ ảnh trong miền nhớ được đọc ra hết, một ảnh mới từ miền tích lũy sẽ lại được chuyển về đây.Với những tính năng vượt trội trước ống ghi hình điện tử cổ điển, linh kiện biến đổi - quang điện CCD được sử dụng rất rộng rãi trong công nghệ truyền hình và ảnh số. Hầu hết các camera quay video dân dụng và bán chuyên nghiệp (semi- professional) được thiết kế trên cơ sở chip CCD. Bộ nhớ trong và ngoài trong các hệ thống xử lý ảnh số thường có dung lượng rất lớn dùng để lưu trữ ảnh tĩnh và động dưới dạng số. Ví dụ, để lưu một ảnh số đen trắng kích thước 1024x1024 điểm, mỗi điểm được mã hóa bằng 8 bits cần bộ nhớ ~1MB. Để lưu một ảnh màu không nén, dung lượng bộ nhớ phải tăng lên gấp 3. Bộ nhớ số trong hệ thống xử lý ảnh có thể chia làm 3 loại: 1- bộ nhớ đệm trong máy tính để lưu ảnh trong quá trình xử lý. Bộ nhớ này phải có khả năng ghi/đọc rất nhanh (ví dụ 25 hình/s); 2- bộ nhớ ngoài có tốc độ truy cập tương đối nhanh, dùng để lưu thông tin thường dùng. Các bộ nhớ ngoài có thể là ổ cứng, thẻ nhớ flash v.v.. 3- Bộ nhớ dùng để lưu trữ dữ liệu. Loại bộ nhớ này thường có dung lượng lớn, tốc độ truy cập không cao. Thông dụng nhất là đĩa quang ghi 1 lần (ROM) hoặc nhiều lần (ROM) như đĩa DVD có dung lượng 4.7GB (một mặt). Ngoài ra trong hệ thống xử lý ảnh còn sử dụng các thiết bị cho phép lưu ảnh trên vật liệu khác như giấy in, giấy in nhiệt, giấy trong, đó có thể là máy in phun, in laser, in trên giấy ảnh đặc biệt bằng công nghệ nung nóng v.v. Bộ xử lý ảnh chuyên dụng: Xử dụng chip xử lý ảnh chuyên dụng, có khả năng thực hiện nhanh các lệnh chuyên dùng trong xử lý ảnh. Cho phép thực hiện các quá trình xử lý ảnh như lọc, làm nổi đường bao, nén và giải nén video số v.v.. Trong bộ xử lý ảnh thường tìch hợp bộ nhớ đệm có tốc độ cao. 73 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  9. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Màn hình hiển thị: Hệ thống biến đổi điện - quang hay đèn hình (đen trắng cũng như màu) có nhiệm vụ biến đổi tín hiệu điện có chứa thông tin của ảnh (tìn hiệu video) thành hính ảnh trên màn hình. Có hai dạng display được sử dụng rộng rãi là đèn hình CRT (Cathode-Ray Tube) và màn hình tinh thể lỏng LCD (Liquid Crystal Display). Đèn hình CRT thường có khả năng hiển thị màu sắc tốt hơn màn hình LCD nên được dùng phổ biến trong các hệ thống xử lý ảnh chuyên nghiệp. Máy tính: có thể là máy tính để bàn cũng như siêu máy tính có chức năng điều khiển tất cả các bộ phận chức năng trong hệ thống xử lý ảnh số. 4.5 Hệ màu 4.5.1. Màu sắc Màu sắc được sử dụng trong các ứng dụng đồ họa máy tính để giúp người dùng hiểu rõ về đối tượng hính học. Các màn hính đồ họa sử dụng các Màu sắc chromatic. Chúng dựa trê n lý thuy ết v ề bộ não người là Màu sắc ánh sáng được tiếp nhận như sự phối hợp từ 3 Màu là đỏ (red), xanh lá cây (green), và anh dương (blue). Nói chung, Màu được mô tả bằng 3 thuộc tình là Màu sắc (hue), độ bão hòa (saturation), và độ sáng (brightness), chúng xác định vị trì trong quang phổ Màu, độ tinh khiết và cường độ sáng. Có hàng loạt phương pháp được tạo các mô hính Màu trong các ứng dụng đồ họa. Trong phần này chỉ đưa ra những mô hính Màu tiêu biểu hơn cả, giúp tím hiểu các ứng dụng đã lựa chọn Màu sắc thìch h ợp như thế nào. 4.5.2. Mô hình màu RGB Mô hính màu RGB mô tả màu sắc bằng 3 thành phần chình là Red - Green và Blue. Mô hình này được xem như một khối lập phương 3 chiều với màu red là trục x, 74 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  10. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT màu Green là truc y, và màu Blue là trục z. Mỗi màu trong mô hình này được xác định bởi 3 thành phần R, G, B. Ứng với các tổ hợp khác nhau của 3 màu này sẽ cho ta một màu mới . Trong hính lập phương trên, mỗi màu gốc (R,G,B) có các gốc đối diện là các màu bù với nó. Hai màu được gọi là bù nhau khi kết hợp hai màu này lại với nhau ra Màu trắng. Vì dụ : Green -Magenta, Red - Cyan, Blue - Yellow. Hệ màu RGB (Red - Green - Blue) ra đời đầu tiên dựa trên sự pha trộn từ 3 nguồn ánh sáng cơ bản là Red (đỏ cờ), Green (màu lục, xanh lá), và Blue (màu lam, xanh dương) để tạo nên tất cả các màu còn lại, ngoại trừ màu đen.  Màu đen: màu đen là "không màu", lúc cả 3 nguồn sáng đều tắt (lúc màn hính tối thui)  Màu trắng xuất hiện khi cả 3 nguồn sáng trên chiếu sáng ở cường độ tối đa Từ đây có thể dễ dàng suy ra các màu xám là do pha trộn 3 nguồn có cường độ chiếu sáng bằng nhau. Các màu khác là do sự hòa trộn 3 màu trên với tỉ lệ khác nhau theo qui tắc màu cộng (additive primaries) - cộng thêm màu từ màu đen ban đầu, là màu lúc màn hính "cúp điện", tối thui.. với thang màu từ 0 đến 255. Hính bên thí sự giao thoa 3 màu RGB tạo ra 3 màu thứ cấp, màu bậc 2 (pha trộn lần thứ nhất) là vàng (yellow), xanh da trời (cyan) và hồng cánh sen (Magagenta) RGB là hệ màu phổ biến cho các máy hiển thị hính bằng đèn phóng như màn hính vi tình, tivi màu, máy chiếu phim... 4.5.3. Mô hình màu CMYK 75 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  11. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Tương tự như mô hính màu RGB nhưng 3 thành phần chình là Cyan - Magenta - Yellow. Do đó, tọa độ các màu trong mô hình CMY trái ngược với mô hính RGB. Vì dụ : màu White có các thành phần là (0,0,0), màu Black (1,1,1), màu Cyan (1,0,0),... Trong in ấn thí "không màu" lại là màu trắng, đó là màu trang giấy hay mảnh vải lúc chưa in.... rắc rối phát sinh ví không thể sử dụng hệ màu RGB cho trường hợp này được. Vậy là một hệ màu mới được tạo riêng cho in ấn theo quy tắc màu trừ (subtractive primaries) - trừ bớt màu từ màu trắng ban đầu. 3 màu chình của hệ màu này là xanh cô- ban (Cyan, turquoise: màu xanh lơ), hồng cách sen (Magenta) và màu Vàng (Yellow) . Ba màu này, theo lý thuyết, khi trộn vào nhau ở cường độ cao nhất, sẽ tạo ra màu đen (ngược lại với trường hợp RGB), Thực chất 3 màu này là 3 màu đối nghịch với 3 màu cơ bản RGB, được pha trộn theo qui tắc màu trừ, sự thêm vào các màu này giống như là quá trính trừ bớt màu RGB từ màu trắng ban đầu (là màu lúc tờ giấy chưa in, còn mới, trắng tinh) thang màu từ 0 đến 100%. 4.5.4. Mô hình màu HSV 76 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  12. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Thực chất của mô hính này là sự biến đổi của mô hính RGB. Mô hình HSV được mô tả bằng lệnh lập phương RGB quay trên đỉnh Black. H (Hue) là góc quay trục V (value) qua 2 đỉnh Black và White. Các giá trị biến thiën của H, S, V như sau: (Hue) chỉ sắc thái có giá trị từ 00 - 3600 . S (Saturation) chỉ độ bão hoâ. V (Value) có giá trị từ 0 - 1. Các Màu đạt giá trị bão hòa khi s = 1 và v = 1. 4.6 Thu nhận và các thiết bị thu nhận ảnh Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận này có thể cho ảnh đen trắng .Các thiết bị thu nhận ảnh có 2 loại chình ứng với 2 loại ảnh thông dụng Raster, Vector. Các thiết bị thu nhận ảnh thông thường Raster là camera các thiết bị thu nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc được chuyển đổi từ ảnh Raster. Nhín chung các hệ thống thu nhận ảnh thực hiện 1 quá trính: - Cảm biến: biến đổi năng lượng quang học thành năng lượng điện - Tổng hợp năng lượng điện thành ảnh 4.7 Biểu diễn ảnh Ảnh trên máy tình là kết quả thu nhận theo các phương pháp số hoá được nhúng trong các thiết bị kỹthuật khác nhau. Quá trính lưu trữ ảnh nhằm 2 mục đìch: - Tiết kiệm bộnhớ - Giảm thời gian xử lý Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng kìch thước nếu sử dụng càng nhiều điểm ảnh thí bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độphân giải. Việc lựa chọn độ phân giải thìch hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo 2 mô hính cơ bản 4.7.1. Mô hình Raster 77 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  13. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Đây là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được biểu diễn dưới dạng ma trận các điểm (điểm ảnh). Thường thu nhận qua các thiết bị như camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễn qua 1 hay nhiều bìt. Mô hính Raster thuận lợi cho hiển thị và in ấn. Ngày nay công nghệ phần cứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc độ nhanh và chất lượng cao cho cả đầu vào và đầu ra. Một thuận lợi cho việc hiển thị trong môi trường Windows là Microsoft đưa ra khuôn dạng ảnh DIB (Device Independent Bitmap) làm trung gian. Hình dưới thể hính quy trính chung để hiển thị ảnh Raster thông qua DIB. Một trong những hướng nghiên cứu cơ bản trên mô hính biểu diễn này là kỹ thuật nén ảnh các kỹ thuật nén ảnh lại chia ra theo 2 khuynh hướng là nén bảo toàn và không bảo toàn thông tin nén bảo toàn có khảnăng phục hồi hoàn toàn dữ liệu ban đầu còn nếu không bảo toàn chỉ có khả năng phục hồi độ sai số cho phép nào đó. Theo cách tiếp cận này người ta đã đề ra nhiều quy cách khác nhau như BMP, TIF, GIF, PCX… Hiện nay trên thế giới có trên 50 khuôn dạng ảnh thông dụng bao gồm cả trong đó các kỹthuật nén có khả năng phục hồi dữ liệu 100% và nén có khảnăng phục hồi với độ sai số nhận được. Quá trính hiển thị và chỉnh sửa, lưu trữ ảnh thông qua DIB 4.7.2. Mô hình Vector Biểu diễn ảnh ngoài mục đìch tiết kiệm không gian lưu trữ dễ dàng cho hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn sao chép di chuyển tím kiếm… Theo những yêu cầu này kỹ thuật biểu diễn vector tỏ ra ưu việt hơn. Trong mô hính vector người ta sử dụng hướng giữa các vector của điểm ảnh lân cận để mã hoá và tái tạo hính ảnh ban đầu ảnh vector được thu nhận trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các chương trính số hoá. 78 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  14. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và chất lượng cho cả đầu vào và ra nhưng lại chỉ hỗ trợ cho ảnh Raster. Do vậy, những nghiên cứu về biểu diễn vectơ đều tập trung từ chuyển đổi từ ảnh Raster. Sự chuyển đổi giữa các mô hính biểu diễn ảnh 4.8 Nén ảnh Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thí thường có khả năng nén cao hơn nhưng khả năng phục hồi thí kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:  Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thìch hợp. Một vì dụ điển hính cho kỹthuật mã hóa này là *.TIF  Nén ảnh không gian: Kỹ thuật này dựa vào vị trì không gian của các điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau. Vì dụ cho kỹthuật này là mã nén *.PCX  Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy kỹ thuật thường hiệu quả hơn. *.JPG chình là tiếp cận theo kỹ thuật nén này.  Nén ảnh Fractal: Sử dụng tình chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tình toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal. 4.8.1. Nén JPEG 4.8.1.1. Tổng quan Các phương pháp nén JPEG thường tổn hao, có nghĩa là một số thông tin hính ảnh ban đầu là bị mất và không thể phục hồi, có thể ảnh hưởng đến chất lượng hính ảnh. 4.8.1.2. Mã hóa JPEG 79 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  15. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Mặc dù một tập tin JPEG có thể được mã hóa trong nhiều cách khác nhau, phổ biến nhất được thực hiện với mã hóa JFIF. Quá trính mã hóa bao gồm các bước:  Các đại diện của các màu sắc trong hính ảnh được chuyển đổi từ RGB sang YCbCr, bao gồm một thành phần luma (Y), đại diện cho độ sáng, và hai thành phần sắc độ (Cb và Cr), đại diện cho màu.  Giảm độ phân giải của dữ liệu, thường là một hệ số 2. Điều này phản ánh thực tế là mắt ìt nhạy cảm với các chi tiết màu sắc tốt hơn các chi tiết độ sáng tốt.  Hính ảnh được chia thành các khối điểm ảnh 8 × 8, và với mỗi khối, mỗi dữ liệu Y, Cb, và Cr trải qua một biến đổi cosin rời rạc (DCT).  Biên độ của các thành phần tần số được lượng tử hóa.  Các dữ liệu kết quả cho tất cả các khối 8 × 8 nén với một thuật toán không mất dữ liệu, một biến thể của mã hóa Huffman. Quá trính giải mã đảo ngược các bước này, ngoại trừ lượng tử bởi ví nó là không thể đảo ngược.  Mã hóa Nhiều tùy chọn trong tiêu chuẩn JPEG không được sử dụng phổ biến, trong khi những thứ khác quy định cụ thể các phương pháp mã hóa. Đây là một mô tả ngắn gọn của một trong các phương pháp mã hóa phổ biến khi áp dụng cho một đầu vào có 24 bit cho mỗi pixel.  Không gian biến đối màu Thứ nhất, hính ảnh được chuyển đổi từ RGB thành một không gian màu khác nhau gọi là YCbCr. Nó có ba thành phần Y, Cb và Cr: Y: thành phần đại diện cho độ sáng của điểm ảnh, và các thành phần Cb và Cr đại diện cho màu (chia thành các thành phần màu xanh và đỏ).  Lấy mẫu sắc độ Do đặc điểm về nhạy cảm trong mắt người đối với m ật độ của màu sắc và độ sáng, con người có thể cảm nhận tốt hơn đáng kể đối với độ sáng của một hính ảnh (thành phần Y) so với màu sắc và độ bão hòa màu sắc của một hính ảnh (các thành phần CbCr). 80 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  16. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT  Phân tách khối Sau khi lấy mẫu, mỗi kênh được chia thành các khối 8 × 8.  Biến đổi Cosin rời rạc Tiếp theo, mỗi khối 8 × 8 của mỗi thành phần (Y, Cb, Cr) chuyển đổi sang một miền tần số đại diện, thông thường là biến đổi cosin rời rạc (DCT) hai chiều.  Lượng tử hóa Mắt người có thể nhín thấy sự khác biệt về độ sáng trên một trên một tần số thấp, nhưng không phân biệt chình xác m ức độ của sự thay đổi độ sáng ở tần số cao. Điều này cho phép giảm đáng kể số lượng thông tin trong các thành phần tần số cao. Điều này được thực hiện đơn giản là bằng cách chia mỗi thành phần trong các mức tần số với một hằng số, và sau đó làm tròn đến số nguyên gần nhất.  Mã hóa Entropy Mã hóa entropy là một hính thức đặc biệt của nén không mất dữ liệu. Nó liên quan đến việc sắp xếp các thành phần hính ảnh trong một trật tự "ngoằn ngoèo" sử dụng thuật toán mã hóa duyệt chiều dài (RLE) tình toán tần số các nhóm tương tự nhau, chèn mã đánh sốchiều dài, và sau đó sử dụng mã hóa Huffman vào những gí còn lại. Quá trính mã hóa và giải mã JPEG tuần tự  Tỷ số nén JPEG Tỉ số nén có thể được thay đổi theo nhu cầu chất lượng trong các ước lượng được sử dụng trong giai đoạn lượng tử hóa. Tỉ số nén 10 :1 thường cho kết quả hính ảnh 81 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  17. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT mà không thể được phân biệt bằng mắt thường so với bản gốc. Tỉ số nén 100 : 1 thường có thể phân biệt rõ ràng so với bản gốc. Mức độ thìch hợp của tỉ số nén phụ thuộc vào việc sử dụng hính ảnh. 4.8.1.3. Giải mã JPEG a. Các bước giải mã Giải mã để hiển thị hính ảnh bao gồm tất cả các mã hóa theo chiều ngược lại. b. Yêu cầu về độ chính xác Quá trính mã hóa trong chuẩn JPEG không giúp khắc phục được độ chình xác cần thiết cho việc nén hính ảnh đầu ra. Tuy nhiên, chuẩn JPEG lại bao gồm một số yêu cầu nhằm tăng tình chình xác cho việc giải mã, đầu ra từ các thuật toán không được vượt quá: - Tối đa là 1 bit khác biệt cho mỗi Pixel - Chất lượng thấp có nghĩa lỗi một ô vuông trên mỗi khối 8 × 8 Pixel - Chất lượng rất thấp có nghĩa là lỗi trên mỗi khối 8 x 8 Pixel - Chất lượng rất thấp có nghĩa là lỗi ô vuông trên toàn bộ hính ảnh - Chất lượng quá thấp có nghĩa là lỗi trên toàn bộ hính ảnh 4.8.1.4. Hiệu ứng hình ảnh thu đƣợc khi nén JPEG Tỷ lệ nén cao ảnh hưởng nghiêm trọng đến chất lượng của hính ảnh, mặc dù màu sắc và hính thức tổng thể hính ảnh vẫn còn nhận ra. 4.8.2. Nén Fractal 4.8.2.1 Tổng quan Lý thuyết hính học Fractal là một ngành toán học hiện đại còn rất non trẻ. Bài toán trung tâm của lý thuyết là mô tả các đối tượng tự nhiên một cách hiệu quả dựa vào các công cụ toán học. Lý thuyết này do B.Mandelbrot đưa ra thông qua tác phẩm “Hính học Fractal trong tự nhiên”. 4.8.2.2 Thuật toán nén – giải nén a. Thuật toán nén ảnh Fractal Quá trính bắt đầu bằng việc phân hoạch ảnh cần nén thành các khối không lấp lên nhau gọi là các khối range, sau đó xác định một tập các khối domain. 82 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  18. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Với mỗi khối range cần phải chọn được khối domain thìch hợp sao cho khi áp dụng một phép ánh xạ affirne co 3 chiều (về vị trì và độ xám), ảnh thu được có thể đối sánh tốt với khối range đang xét. b. Thuật toán giải nén Fractal Xuất phát từ dữ liệu nén chứa trong file ảnh Fractal, chúng ta xây dựng lại hệ hàm lặp tương ứng với ảnh khởi động bất kỳ và sau đó áp dụng liên tiếp hàm lặp này vào các ảnh thu được sau mỗi lần lặp cho đến khi thu được ảnh xấp xỉ tốt nhất với ảnh ban đầu. c. Các cách phân hoạch ảnh - Phân hoạch quadtree - Phân hoạch HV - Phân hoạch tam giác d. Phân loại Bước so sánh domain-range của nén ảnh Fractal có cường độ tình toán rất lớn. Để có thể giảm thời gian nén ảnh, chúng ta tạo sẵn các domain và đưa chúng vào một thư viện domain gọi là domain pool. Trước khi mã hóa, tất cả các domain trong thư viện domain được phân loại. Điều này tránh sự phân loại lại của các domain. e. Kết luận Dựa vào lý thuyết và các kiểm nhiệm thực tế, phương pháp nén ảnh này cho thấy: - Tỉ số nén cao: Điểm nổi bật nhất mà thuật toán nén và giải nén bằng kỹ thuật Fractal cung cấp được là tỉ số nén cực cao với chất lượng ảnh nén không thay đổi. - Tốc độ giải nén ảnh nhanh: Thuật toán được trính bày là một thuật toán không đối xứng ví các tình toán trong việc nén ảnh đòi hỏi một lượng thời gian lớn hơn rất nhiều lần so với thời gian giải nén. - Tình độc lập về độ phân giải giữa ảnh nén và ảnh gốc: Thuật toán nén ảnh và giải nén bằng kỹ thuật Fractal về thực chất đã cung cấp một bộ tạo sinh để vẽ lại ảnh gốc dựa trên một số cực nhỏ thông tin cần thiết ban đầu. 83 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  19. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Chƣơng 5: Dữ liệu âm thanh 5.1. Một số khái niệm cơ bản - Âm thanh (audio): là dao động các sóng âm gây ra áp lực làm dịch chuyển các hạt vật chất trong môi trường đàn hồi làm tai người cảm nhận được các dao động này. Tai người có thể nghe được các dao động trong khoảng tần số 20Hz đến 20kHz. - Âm thanh tự nhiên: là sự kết hợp giữa các sóng âm mang tần số khác nhau. - Dải động của tai: giới hạn bởi ngưỡng nghe thấy (0dB) đến ngưỡng đau (120dB) của người. - Ngưỡng nghe tối thiểu: mức thấp nhất của biên độ mà tai người có thể cảm nhận được âm thanh tùy thuộc vào từng người, mức áp lực và tần số của âm thanh. - Hiệu ứng che khuất âm thanh: hiện tượng âm thanh mà tại đó ngưỡng nghe của một âm tăng lên trong khi có mặt của một âm khác (khó nghe hơn). Được sử dụng trong kỹ thuật nén. - Hướng âm thanh: tai và não có thể giúp ta xác định hướng âm thanh, điều này có thể ứng dụng để tạo các hiệu ứng âm thanh như stereo, surround. - Vang và trễ: vang là hiện tượng kéo dài âm thanh sau khi nguồn âm đã tắt. Trễ là thời gian d âm thanh phản xạ đến đìch so với âm thanh trực tiếp. Nếu d > 50ms thí trễ đó gọi là tiếng vọng. Biên độ của âm thanh cứ sau một lần phản xạ thí bị suy giảm. 5.2. Ứng dụng của âm thanh Âm thanh đóng vai trò quan trọng trong các ứng dụng truyền thông đa phương tiện. Các hiệu ứng đặc biệt của âm thanh như âm nhạc và tiếng nói có thể được đưa vào các ứng dụng, đặc biệt là các ứng dụng trong hệ thống đào tạo và bán hàng tự động hoặc hệ thống điểm thông tin. Một lời chú thìch bằng tiếng nói có thể được dùng để diễn tả những gí đang diễn ra trên màn hính hoặc để làm nổi bật và nhấn mạnh những khái niệm then chốt. Âm thanh có thể được sử dụng kết hợp với hính ảnh tĩnh hoặc động để giải thìch cho người sử dụng một ý tưởng hay một quy trính hiệu quả hơn theo cách giải thìch 84 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
  20. Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT chỉ đơn giản bằng văn bản hay đồ họa, âm nhạc có thể được sử dụng để thu hút sự chú ý của khách hàng hoặc để tạo ra một phong cách riêng biệt. Trong một số lĩnh vực chuyên dụng tự âm thanh có thể hính thành lên sự lôi cuốn của một số ứng dụng truyền thông đa phương tiện, chẳng hạn như các hệ thống chỉ đường của người khiếm thị, ... Công nghệ xử lý âm thanh ngày càng được cải tiến, mối quan tâm của người dùng đến các hệ thống xử lý và nhận dạng tiếng nói trong các ứng dụng kinh doanh, an ninh, ... ngày càng tăng lên. 5.3. Kỹ thuật Audio số Để máy tình làm việc được với âm thanh, chúng phải được chuyển thành tìn hiệu số (digital) từ tìn hiệu tương tự. Quá trính này gọi là “lấy mẫu” (sampling), mỗi một phần của một thời gian lấy mẫu, tìn hiệu tương tự được ghi nhận lại thành những bit. Có 2 yếu tố ảnh hưởng đến chất lượng âm thanh: 1. Tần số lấy mẫu: - Tần số lấy mẫu là số lần mẫu được lấy trong một đơn vị thời gian. - Tần số chung nhất là: 11.025 kHz, 22.05 kHz, và 44.1 kHz. - Nếu tần số lấy mẫu cao hơn thí chất lương sẽ tốt hơn. 2. Số bit mã hoá (kích thước lấy mẫu): Quyết định tổng lượng thông tin có thể biểu diễn (mã hoá). Minh họa: Tìn hiệu analog và digital. - Kìch thước lấy mẫu thông thường là 8 bit và 16 bit. - Kìch thước lấy mẫu 8-bit cho 256 giá trị dùng để thể hiện âm thanh, nếu 16- bit thí cho 65. 536 giá trị. - Nếu kìch thước lấy mẫu cao hơn thí chất lượng sẽ tốt hơn. Kìch thước file của 10 giây ứng với giá trị tần số và số bit: 85 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
5=>2