Bài giảng Xử lý Audio và Video
lượt xem 266
download
Bài giảng Xử lý Audio và Video là tài liệu được biện soạn nhằm phục vụ cho đối tượng học viên thuộc chuyên ngành Kỹ thuật Điện tử - Viễn thông. Để giúp học viên tìm hiểu môn học một cách dễ dàng, tài liệu đã được chọn lọc biên soạn với những nội dung rất căn bản về lý thuyết theo một trình tự logic, được trình bày qua 5 chương. Chương 1, đại cương về tín hiệu audio và video, đây là bức tranh toàn cảnh về tín hiệu audio và video. Chương 2, số hóa tín hiệu...
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Xử lý Audio và Video
- BÀI GIẢNG XỬ LÝ AUDIO & VIDEO
- LỜI MỞ ĐẦU Bài giảng Xử lý Audio và Video là tài liệu được biện soạn nhằm phục vụ cho đối tượng học viên thuộc chuyên ngành Kỹ thuật Điện tử - Viễn thông. Để giúp học viên tìm hiểu môn học một cách dễ dàng, tài liệu đã được chọn lọc biên soạn với những nội dung rất căn bản về lý thuyết theo một trình tự logic, được trình bày qua 5 chương. Chương 1, đại cương về tín hiệu audio và video, đây là bức tranh toàn cảnh về tín hiệu audio và video. Chương 2, số hóa tín hiệu audio và video, trình bày những đặc trưng về biến đổi của tín hiệu audio và video tương tự-số. Chương 3, truyền dẫn tín hiệu audio và video, trình bày những nguyên tắc truyền dẫn tín hiệu audio và video số. Chương 4, ghi phát tín hiệu audio và video số, trình bày những nguyên tắc ghi phát (lưu trữ) tín hiệu audio và video số. Chương 5, nén dữ liệu audio và video, trình bày những phương pháp xử lý nén audio và video. Biên soạn tài liệu này, tác giả đã tổng hợp và chọn lọc những nội dung dựa theo các tài liệu của các tác giả đã được xuất bản, qua đó cũng đã cập nhật những nội dung mới nhằm làm phong phú cho môn học. Tuy đã có nhiều cố gắng và thận trọng nhưng tài liệu không sao tránh khỏi những sai sót, mong sự thông cảm và đóng góp ý kiến của bạn đọc.
- Chương 1: Đại cương về tín hiệu audio và video Chương 1 ĐẠI CƯƠNG VỀ AUDIO VÀ VIDEO 1.1. QUÁ TRÌNH PHÁT TRIỂN Khoảng cuối thế kỷ 19 đầu thế kỷ 20, nhiều thiết bị xử lý âm thanh điện tử ra đời, đã mở ra một hướng phát triển mới trong chế tạo các thiết bị điện tử dân dụng. Trong giai đoạn này các nhà khoa học đã thành công trong chế tạo các thiết bị xử lý âm thanh như: hệ thống máy điện thoại, máy cassette, các máy quay đĩa và máy phát thanh…Ngày nay âm thanh điện tử được ứng dụng rộng rãi trong các thiết bị dân dụng, nhiều thiết bị âm thanh số ra đời có tính năng kỹ thuật cao từng bước thay thế cho các thiết bị âm thanh tương tự trước đây. Cho đến nay, hầu như các gia đình đều sở hữu một vài thiết bị điện tử phục vụ đời sống tinh thần. Khi kỹ thuật truyền thanh ra đời thì truyền hình là tiêu điểm nghiên cứu quan trọng cho các nhàkhoa học. Đến khoảng giữa thế kỷ 20, thời kỳ thế chiến thứ II, kỹ thuật truyền hình ảnh động đấu tiên ra đời, nhưng chỉ nhằm để phục vụ cho mục đích quâ sự. Sau khi kết thúc chiến tranh, truyền hình ở các quốc gia mới thực sự nhằm vào mục đích dân dụng, từ đó kỹ thuật truyền hình không ngừng được cải tiến và phát triển. Cho đến nay, thế giới thực sự đổi thay từ khi mọi gia đình có thể thưởng thức thông tin bằng hình ảnh và âm thanh. Trong suốt hơn 50 năm qua, truyền hình đóng một vai trò quan trọng trong sự phát triển của nền kinh tế tri thức của thế giới. Cho đến nay cùng với sự phát triển mạnh mẽ của công nghệ điện tử, nhiều công nghệ truyền hình thế hệ mới ra đời với những tính năng kỹ thuật cao dần thay thế cho truyền hình tương tự trước đây, truyền hình số với những công nghệ khác nhau như: truyền hình mặt đất, truyền hình cáp, truyền hình vệ tinh...đã thực sự làm cho thế giới truyền hình ngày càng sóng động hơn. 1.2. ẢNH TỰ NHIÊN Ảnh tự nhiên là những gì mà chúng ta có thể trông thấy xung quanh thế giới thực, chúng được tạo ra bởi các nguồn ánh sáng mặt trời hoặc ánh sáng nhân tạo phản xạ lên các vật thể mà ta có thể trông thấy. Truyền hình là một hệ thống tín hiệu hình ảnh và tín hiệu âm thanh analog được phát triển rất cao. Cơ sở của hệ thống truyền hình là dựa trên đặc tính của thị giác con người, đặc tính này cũng được áp dụng trong hệ thống truyền hình kỹ thuật số hiện nay. 1
- Chương 1: Đại cương về tín hiệu audio và video Mục đích hệ thống tái tạo ảnh điện tử (video) là thu ảnh tự nhiên và tái tạo lại với những khoảng cách về không gian, hoặc cả hai (hình 1.1). Ở đây chúng ta quan tâm đến hai thuộc tính nhìn thấy của cảnh quan là màu sắc và độ chói. Ảnh tự Ống kính nhiên Chuyển đổi Xử lý tín hiệu ảnh-tín hiệu Tạo xung đồng bộ Lưu trữ hoặc truyền dẫn Mắt người Chuyển đổi Xử lý tín hiệu xem tín hiệu-ảnh Ảnh tái tạo Tách xung đồng bộ Hình 1.1. Hệ thống tái tạo ảnh điện tử Nhưng cảnh tự nhiên ít khi được tạo nên từ một nguồn sáng đơn sắc. Ảnh tại mọi điểm trong cảnh quan là tổng của ánh sáng từ các nguồn đồng nhất với ánh sáng phản xạ từ các vật xung quanh. Sự chiếu sáng vừa nêu đã được sửa đổi bởi các thành phần phản chiếu từ các vật xung quanh môi trường tạo ra một sự chiếu sáng mà màu sắc và độ sáng của nó thay đổi theo từng cảnh. Đối với những cảnh phức tạp hơn, mắt người có thể thích nghi với sự thay đổi từng khu vực chiếu sáng cho đến lúc không còn cảm nhận được nữa khi quan sát trực tiếp. Hệ thống tái tạo hình ảnh cũng cần tạo ra một kết quả tương tự . Quá trình chuyển đổi tín hiệu-ảnh hoàn toàn đồng bộ và đồng pha với quá trình chuyển đổi ảnh-tín hiệu thì mới khôi phục được ảnh quang đã truyền đi. Để thực hiện sự đồng bộ và đồng pha, trong hệ thống truyền hình phải dùng một bộ tạo xung đồng bộ. Xung đồng bộ được đưa đến bộ xử lý tín hiệu để khống chế quá trình phân tích ảnh, đồng thời đưa đến bộ xử lý tín hiệu hình rồi truyền sang phía thu, tín hiệu hình được cộng thêm xung đồng bộ gọi là tín hiệu truyền hình. 1.3. ÂM THANH TỰ NHIÊN Âm thanh là những biến đổi áp suất nhanh xảy ra trong không khí do nhiều quá trình tự nhiên gây nên. Tiếng gió thổi trên cành cây, tiếng sóng biển vỗ bờ , tiếng chim kêu…tất cả đều là âm thanh tự nhiên. Nhiều hệ thống do con người chế 2
- Chương 1: Đại cương về tín hiệu audio và video tạo cũng tạo ra những biến đổi áp suất tương tự, đôi khi còn có ý chủ định, hay đôi khi còn do khách quan. Một dàn nhạc tạo ra những âm thanh có chủ định với mục đích thưởng thức âm nhạc. Trong khi, âm thanh của một động cơ phản lực phát ra khi cất cánh lại được coi là do khách quan gây lên. Tai con người phản ứng lại những biến đổi áp suất không khí ở phạm vi tần số trong khoảng từ 30Hz đến 15000Hz sau đó đưa đến não và đó chính là âm thanh. Độ lớn hay biên độ dao động của những biến đổi áp suất này tạo nên cảm giác về tiếng ồn. Âm thanh chuyển động trong không khí theo quy tắc truyền sóng, vì vậy người ta có thể nghe thấy một âm thanh phát ra từ khoảng cách khá xa và những biến đổi áp suất âm thanh thường được gọi là sóng âm. Trong mọi trường hợp, sóng âm thanh là sóng tương tự. Sóng âm chuyển động trong không khí với vận tốc xắp xỉ bằng 345m/s ở nhiệt độ phòng và mực nước biển. Theo lý thuyết về sóng, mối liên hệ giữa tần số f và bước sóng λ là: λ = v/f (1.1) Ngoài ra, các tính chất khác của sóng âm thanh cũng có tầm quan trọng đối với việc thiết kế các thiết bị âm thanh. Sóng âm sẽ phản xạ với bề mặt cứng (những bề mặt không hấp thụ sóng âm) tạo nên hiệu ứng về tiếng vọng và vang âm. Sóng âm thanh bị nhiễu xạ, chúng có thể xuyên qua các lỗ hỏng, các khe hở và đến từng ngóc ngách. Sóng âm thanh cũng có thể bị khúc xạ, nó sẽ bị bẻ cong khi vận tốc truyền thay đổi ở những khu vực khác nhau với nhiệt độ và mật độ không khí khác nhau. Tầm quan trọng của những hệ quả này là hàm điều kiện môi trường và bước sóng. Về mặt toán học, việc tạo những đường truyền sóng âm thanh trong một môi trường thực tiễn khá phức tạp. Âm thanh tự nhiên không chỉ liên quan đến hai yếu tố là nguồn phát và người nghe, bởi vì sóng âm luôn phản xạ với các đồ vật xung quanh môi trường. Người nghe tiếp nhận âm thanh phản xạ ngay sau khi âm thanh đó được phát ra. Người ta gọi các yếu tố có liên quan đến âm thanh này là môi trường âm thanh. Môi trường này rất quan trọng đối với việc tái tạo lại âm thanh bằng hệ thống điện tử. Một trong những yếu tố chủ yếu của môi trường âm thanh được tạo ra do hiện tượng phản xạ, thường xảy ra ở những không gian kín (như phòng hoà nhạc). Do tốc độ giới hạn của âm thanh, song âm được truyền đi trong một phòng kín mất nhiều thời gian để đến được tai người hơn là âm thanh trực tiếp và được gọi là những âm bị trễ mà có thể nghe thấy sự lặp lại của âm thanh trước. Chúng ta có thể nhận thấy rõ tiếng vọng xẩy ra khi sự trễ âm phản xạ lớn hơn khoảng 50m/s, tương đương với khoảng cách là 17m. Tiếng vọng rõ nhất với những âm thanh có thời gian trễ lớn hơn, ví dụ như tiếng vọng xảy ra trong một thung lũng. 3
- Chương 1: Đại cương về tín hiệu audio và video Ở những khu vực không gian hẹp hơn, có thể có rất nhiều phản xạ mà không một phản xạ nào có thể bị trễ khác biệt hẳn tới mức là tiếng vọng. Tuy nhiên, âm thanh vẫn tiếp tục truyền đi trong phòng cho đến khi nó biến mất hoàn toàn do có hiện tượng hấp thụ âm, và gọi là hiện tượng tiếng vọng. Hiện tượng tiếng vang tạo ra cảm giác về không gian, nó rất quan trọng trong quá trình mô phỏng âm thanh. Ví dụ, nếu việc mô phỏng âm thanh không thu được tiếng vang (trường hợp máy thu đặt gần, hoặc thậm chí đặt máy thu ngay tại nguồn âm), âm thanh sẽ trở thành âm “chết”. Điều kiện này có thể khắc phục bằng cách đưa vào những tiếng vang nhân tạo (thường xử lý bằng kỹ thuật số). Các chương trình truyền hình gốc (chưa được biên tập) thường được thực hiện ở những điều kiện âm “chết” này với mục đích là tiếng vang nhân tạo sẽ được đưa vào trong quá trình biên tập, điều này giúp cho biên tập viên có thể kiểm soát được âm thanh. Tiếng vang được lượng tử hoá trong khoảng thời gian đủ để nó phá huỷ 1/1000 âm gốc. Đối với phòng thiết kế riêng cho phòng hội thảo, thời gian vang của âm thích hợp nhất là 1 giây. Với một phòng hòa nhạc, thời gian dài hơn một chút, lên đến khoảng 2 giây. Việc đo âm bằng các thiết bị như micro hay loa cần phải được thực hiện trong một môi trường hoàn toàn cách âm để tách các đặc tính của chúng ra khỏi các đặc tính của môi trường. Một loại phòng đặc biệt được gọi là phòng cách âm được thiết kế cho mục đích này. Loại phòng này hấp thụ tất cả các âm thanh nhập vào chu vi của nó, vì vậy hiện tượng phản xạ không xảy ra. Về cơ bản đây là một không gian “chết”. Khi nói trong căn phòng này, người ta hầu như không thể nghe được giọng nói của chính mình . 1.4. TÁI TẠO ÂM THANH ĐIỆN TỬ Âm thanh điện tử được gọi chung là audio. Hình 1.2 minh họa một hệ thống audio điển hình. Âm được thu từ nguồn nhờ một hoặc nhiều micro và những tín hiệu audio thu được truyền qua hệ thống cho đến khi tới loa phát (bộ phận chuyển các tín hiệu điện thành sóng âm). Lưu trữ hay Nguồn Thu audio Máy thu truyền dẫn âm Hình 1.2. Hệ thống tái tạo âm thanh điện tử Mục đích tái tạo âm thanh điện tử là để tải các sóng âm thanh đến những khoảng cách xa cả về không gian và thời gian, để người nghe có thể tiếp nhận như thể họ đang nghe âm trực tiếp từ nguồn. Một mục đích khác nữa là để chau chuốt 4
- Chương 1: Đại cương về tín hiệu audio và video âm thanh mới không có trong tự nhiên, làm cho âm thanh điện tử hay hơn âm gốc, hoặc tạo ra những âm thanh mới không có trong tự nhiên. 1.5. THỊ GIÁC CON NGƯỜI Mắt người là một thiết bị rất đặc biệt bao gồm trên 100.000.000 (108) phần tử cảm biến cùng một hệ thống điều khiển độ sáng cho phép nhìn rõ ở một phạm vi độ sáng hơn 10 triệu tới 1. Hai mắt kết hợp với não tạo ra khả năng nhận biết các vật trong không gian ba chiều. Mặc dù hầu hết các hệ thống tái tạo điện tử không có các tính năng này nhưng bằng cánh thiết kế như các đặc điểm của mắt trong bộ não điện tử, hệ thống có khả năng đáp ứng nhiều mục đích ứng dụng. 1.5.1. Độ phân giải Thị lực trung bình của mắt là 20/20, vùng trung tâm thị lực là một cung có góc khoảng 1/60 độ. Đây là độ phân giải của mắt, tất nhiên chỉ áp dụng đối với những ảnh của các vật thể trên thang xám. Còn đối với ảnh màu, độ phân giải của mắt sẽ giảm đi (xem phần 1.8.1). Độ phân giải ở đây có nghĩa là mắt người có thể nhìn rõ các vật thể có kích thước khoảng 1cm khi nhìn khoảng cách là 3m, trường nhìn của mắt gần bằng 1800, một người có thể phân biệt được tổng cộng 180×60 =10.800 vật thể ngang qua trường nhìn. Tuy nhiên, độ phân giải của mắt giảm dần từ trung tâm của thị giác, vì vậy tổng số vật thể trong thực tế là ít hơn nhiều . Hệ thống ảnh điện tử phân biệt được một số lượng lớn các vật thể trong ảnh đơn thực tế là rất hiếm. Vì vậy, nó thường được thiết kế sao cho màn hình hiển thị có kích thước nhỏ hơn tổng trường nhìn của mắt. Do đó, hầu hết hình ảnh đều được quan sát bởi phần có độ phân giải đầy đủ nhất của mắt, và độ phân giải đầy đủ cũng là yếu tố quan trọng cần được sử dụng trong các thao tác tính toán hình ảnh điện tử. Một đặc điểm khác cũng yêu cầu sử dụng độ phân giải đầy đủ nhất là khả năng chuyển động của mắt để mang vật thể cần nhìn vào trung tâm thị giác. Một màn hình hiển thị ở một góc rộng, khi nhìn gần sẽ gặp một số vấn đề đó là người xem sẽ nhìn trực tiếp vào bất cứ phần nào trên màn hình thu hút họ trước nhất. Ở một thời gian đặc biệt nào đó nó có thể là một điểm bất kỳ trên màn hình. Do vậy toàn bộ màn hình đều cần phải có độ phân giải cao. Ta biết rằng, ảnh trong các hệ thống số được miêu tả là một chuỗi các pixel. Hệ thống hiển thị cần phải thiết kế sao cho các pixel không bị lộ diện nếu như không có sẽ gây ảnh hưởng xấu tới chất lượng ảnh. Người ta thường hạn chế số lượng pixel trong ảnh để đủ cho người xem ở khoảng cách nhìn quy định hoặc lớn hơn, không thể phân tích được. Một thông số quan trọng cần tính đến ở đây là tỉ lệ nhìn, được xác định bằng tỉ lệ giữa khoảng cách người xem (tính từ màn hình) với độ cao nhất của ảnh. 5
- Chương 1: Đại cương về tín hiệu audio và video VR= d/PH (1.2) Trong đó: VR = tỉ lệ nhìn. d: khoảng cách từ mắt tới màn hình. PH: độ cao của ảnh (lấy theo cùng đơn vị d) Khi sử dụng hình ảnh theo độ phân giải trên đây, số lượng tối đa của các điểm ảnh có thể nhìn thấy được ở một tỉ lệ nhất định là: Số điểm ảnh = 3440/VR (1.3) Lưu ý, đối với một bức ảnh có số pixel xác định, nếu ở khoảng cách cho trước mà mắt chưa phân biệt được các điểm ảnh thì đây là kích cỡ lớn nhất của ảnh, điều đó tương đương với tỉ lệ nhìn là nhỏ nhất (bảng 1.1). Điều này đúng cho cả hệ thống video số và video tương tự. Hệ thống video tương tự quan tâm đến số dònd quét hơn là số pixel trên một ảnh. Trong khi đó, các dòng quét lại ngây nhiễu cho khả năng nhìn hơn pixel, đây chính là nhược điểm của hệ thống video analog. Các máy tính thường hoạt động với các thông số thấp hơn. Hệ thống Dòng hoặc pixel/ph Tỉ lệ nhìn Hệ NTSC 483 7.2 HDTV 1080 3.2 Màn hình máy tính 768 4.5* Bảng 1.1. Các tỉ lệ nhìn nhỏ nhất 1.5.2. Tạo mức xám Để tạo ra hình ảnh rõ nét, ánh sáng phát ra ở màn hình phải tỉ lệ với độ sáng phát ra từ cảnh ở một điểm. Điều này có nghĩa là các tín hiệu video phải là một hàm tuyến tính với độ chói của ảnh. Tuy nhiên, thiết bị hiển thị tiêu biểu (CRT) lại có cường độ hàm phi tuyến, ngược với hàm tín hiệu, rất nhiều các tiêu chuẩn của hệ thống đã đưa vào các phần sửa lỗi phi tuyến trong tín hiệu video, bởi vì nếu sửa lỗi phi tuyến tại các máy thu thì giá thành rất cao . Hầu hết các bộ cảm biến trong camera truyền hình có đặc tuyến ánh sáng tuyến tính, vì vậy camera thường được lắp đặt hệ thống sửa méo gamma để đưa vào tín hiệu có đặc tính biên độ phi tuyến cần thiết. Gamma là một đường đặc tuyến của hàm mũ xấp xỉ bằng biên độ phi tuyến chuyển giao. Ví dụ, gamma của một CRT điển hình là 2,2. Như vậy một camera phải đưa phần sửa lỗi với số mũ là 1/2,2 hoặc 0,45. Đặc tính này được thể hiện bằng đường cong trên hình 1.3. 6
- Chương 1: Đại cương về tín hiệu audio và video 1.0 Ү= 45 Đầu ra tương đối 0.5 0.0 0.5 1.0 Hình 1.3. Đường cong sửa lỗi γ = 0.45 Tuy nhiên, đa phần máy tính áp dụng tiêu chuẩn sửa lỗi gamma chứ không phải truyền hình, vì vậy đôi khi việc gây lỗi là cần thiết khi chuyển đổi giữa các tín hiệu truyền hình và tín hiệu trong máy tính. 1.5.3. Rung hình và tỷ lệ phục hồi Người ta không nhận thấy sự nhấp nháy của màn hình bởi vì mắt có khả năng lưu hình. Có nghĩa là, hệ thống thị giác phản ứng rất chậm với sự thay đổi nhanh của ánh sáng trên màn hình. Tuy nhiên, sự chiếu sáng thay đổi theo chu kỳ với tần số thấp (khi được chiếu sáng bởi đèn điện có tần số thấp), gây ra hiệu ứng mà ta gọi là hiện tượng rung hình. Hiện tượng rung hình phụ thuộc vào số lượng của độ chiếu sáng (rung hình dễ nhận thấy hơn khi hình ảnh có độ chói cao) và cũng dễ nhìn hơn khi nhìn ở ngoại vi tầm nhìn. Hiệu ứng vừa rồi giúp chúng ta nhạy cảm hơn với những vật chuyển động nhanh (có thể là nguy hiểm) xuất hiện đầu tiên ở ngoại vi tầm nhìn. Vấn đề điều khiển rung hình khá quan trọng, bởi vì nếu ánh sáng ở màn hình bị rung kéo dài sẽ gây ra chứng mổi mắt người xem. Hệ thống Tỷ lệ phục hồi Môi trường VR NTSC 60 (59,94) Phòng khách 7 PAL 50 Phòng khách 7 Màn hình máy tính 72 Phòng sáng 1-2 Rạp chiếu phim 48 Phòng tối 5-10 Bảng 1.2. Các tỉ lệ phục hồi tiêu biểu 7
- Chương 1: Đại cương về tín hiệu audio và video Thiết bị điện tử lại có hiệu ứng lưu hình ngược lại, ánh sáng phát ra sẽ bị hủy sau một thời gian ngắn. Vì vậy, ảnh điện tử phải được phục hồi thường xuyên để duy trì hiệu ứng chiếu sáng ổn định. Tỉ lệ phục hồi phải đủ để tránh tình trạng rung hình ở các điều kiện xem mong muốn. Tỉ lệ phục hồi tiêu biểu được trình bày trong bảng 1.2. Ở điện ảnh, tỉ lệ phục hồi có thể thấp bởi vì các rạp chiếu phim thường phải tối và ảnh không được quá sáng. Riêng máy tính lại ở trong tình trạng ngược lại, thường hiển thị trong một phòng sáng, màn hình cũng phải sáng, và như vậy tỉ lệ nhìn thấp có nghĩa là những phần màn hình này xuất hiện ở ngoại vi tầm nhìn. Hiện tượng rung hình với một số lượng thích nghi nhất định, điều này xảy ra khi cùng một kiểu nhìn đều đặn diễn ra. Ví dụ, tỉ lệ phục hồi 50 Hz được sử dụng ở một số quốc gia được đánh giá là hoàn toàn hợp lí với người bản địa. Song, một số quốc gia khác tỉ lệ 60 Hz cũng được áp dụng. 1.5.4. Tái tạo ảnh chuyển động Sự chuyển động của ảnh được tạo ra trong hệ thống video nhờ vào cập nhật nội dung trên màn hình với tỉ lệ vừa đủ để người xem có thể nhận biết được một quá trình chuyển động liên tục. Trong một hệ thống truyền hình, nó được thực hiện ở camera và tỉ lệ quét của màn hình. Trong những trường hợp đơn giản nhất, camera video sẽ tạo ra mành riêng biệt cho mỗi chu kỳ phục hồi của màn hình. Đây chính là cách hoạt động thông thường của tryuền hình số, tỉ lệ mành của camera và màn hình như nhau. Thực chất, tỉ lệ ở hai bộ phận này đã được đồng bộ hoá. Trong phương thức vận hành này, tín hiệu phát ra từ camera không ngừng đi tới màn hình mà không cần sự can thiệp của quá trình xử lý hay lưu trữ nào. Khi đề ra các tiêu chuẩn màn hình, vấn đề xử lý hay lưu trữ vẫn chưa được bàn đến, do vậy hệ thống thiết kế cho màn hình được phục hồi bằng cách liên tục phát ra các tín hiệu mới từ camera, thậm chí ngay cả khi hình ảnh đã dừng. Hiện nay với công nghệ kỹ thuật số, lưu trữ và xử lý là hai quá trình tồn tại thường xuyên trong hệ thống, và camera cũng như màn hình không cần thiết phải có tỉ lệ mành như nhau thậm chí không cần phải đồng bộ. Camera có thể hoạt động ở một tỉ lệ mành vừa đủ để tạo lại chuyển động, còn màn hình có thể vận hành ở một tỉ lệ cao hơn, đáp ứng chỉ tiêu rung hình cần thiết. Thậm chí có thể ngừng hẳn việc truyền theo chu kỳ của những hình ảnh đã dùng, để giảm yêu cầu mà quá trình truyền dữ liệu đặt ra. Như đề cập ở trên, để giảm độ rung hình, tần số mành ở 50 Hz hoặc cao hơn nữa và màn hình cũng có thể quét ở tần số này. Nhưng quá trình tái tạo chuyển động thường tốt nhất với tần số mành 30Hz, hoặc thậm chí có thể thấp hơn. Do vậy quá trình quét ảnh của camera càng phải diễn ra nhanh, để đủ hỗ trợ quá trình tạo 8
- Chương 1: Đại cương về tín hiệu audio và video chuyển động. Các hệ thống số có thể đáp ứng cả những tiêu chí này. Khi theo dõi một vật chuyển động nhanh, người ta có cảm giác như sự chuyển động này rất rõ nét. Tuy nhiên, thực chất hình ảnh chuyển động lại rất mờ do hiệu ứng lưu hình của mắt đã nêu ở trên. Tuy nhiên, nếu mắt di chuyển theo chuyển động của vật, sự mờ ảo của chính vật đó sẽ giảm xuống nhưng phong hình lại trở lên mờ ảo. Một hệ thống mô phỏng không thể đồng thời giải quyết tình trạng này do camera thu ảnh điện tử đều có lưu hình như nhau. Đây được gọi là sự kéo vết của chuyển động xảy ra do camera có thời gian lộ sáng xác định. Vấn đề đặt ra không khó khăn lắm với hệ thống truyền hình bình thường hoạt động ở tỉ lệ nhìn thiết kế sẵn vì hình ảnh ở đó không rộng đến mức người xem có thể di chuyển theo chiều chuyển động của vật. Camera thường di chuyển theo chuyển động của vật, người xem không cần thiết phải làm việc này. Tuy nhiên, với màn hình có độ phân giải cao và rộng hơn, người xem có thể phải di chuyển mắt theo những phần khác nhau của cảnh để đáp ứng đầy đủ trường nhìn của mình. Sau nữa, camera cũng không nên di chuyển theo vật và phải có thời gian lộ sáng ngắn để vật chuyển động sắc nét hơn. 1.6. THÍNH GIÁC CỦA CON NGƯỜI Độ nhạy của tai con người không hề thua kém mắt. Kết hợp với não, tai có thể tiếp nhận sóng âm ở phạm vi biên độ lớn và trong chốc lát nó có thể xác định phương hướng tần số, đặc tính của âm nguồn thông tin (trong trường hợp đây là lời nói). Hiểu được khả năng và hạn chế của hệ thống sinh học tuyệt vời này là một điều quan trọng đối với công việc tái tạo hệ thống âm thanh diện tử. Nghiên cứu quá trình thích giác của con người được gọi là khoa học tâm lý âm thanh. 1.6.1. Tiếng ồn Tiếng ồn là phản ứng của con người với biên độ sóng âm thanh, nó nằm trong ngưõng có thể nghe được ở mức độ âm thanh thấp đến ngưỡng của sự chói tai của những âm cao nằm trong phạm vi từ 1012 (1000.000.000.000:1) hoặc nhiều hơn ở những âm thanh có cường độ cao. Âm thanh có cường độ cao được biểu thị bằng W/m×m. Do phạm vi rộng, thông thường âm thanh được tính theo dB. Ở mức độ âm chuẩn (0 dB) thường được sử dụng như là ngưỡng nghe và 120dB (ví dụ như mức độ âm ở khoảng cách 457,2m phát ra từ một động cơ máy bay phản lực khi cất cánh) gần như được coi là ngưỡng của âm chói, ở mức độ này tiếng ồn trở nên khó chịu. Nếu như ở mức độ cao hơn thính giác của con người có thể bị tổn thương. Con người cũng không thể nghe được nhiều âm thanh ở các mức độ khác nhau trên toàn bộ phạm vi ở bất kỳ thời điểm nào, bởi vì các âm thanh lớn có xu hướng lấn áp những âm thanh yếu. Tuy nhiên, khi những âm thanh hữu ích (như lời nói, 9
- Chương 1: Đại cương về tín hiệu audio và video âm nhạc) có xu hướng xuất hiện những khoảng lặng và tai con người nhanh chóng phản ứng với sự thay đổi mức độ âm thanh đó. Vì vậy, việc đưa ra tỉ lệ tín hiệu trên tạp âm S/N ở 80 hoặc 90dB, nếu như tiếng ồn hoàn toàn không thể nghe được, là rất quan trọng đối với quá trình tái tạo âm thanh điện tử chất lượng cao. Mặc khác, nếu chỉ tính đến khả năng nghe rõ, tai có thể hiểu được lời nói S/N bằng 30dB hoặc thậm chí còn thấp hơn. 1.6.2. Đặc tuyến tần số Đặc tuyến tần số của thính giác con người nằm trong phạm vi từ 30 đến 15000Hz. Tuy nhiên, con số này thay đổi một cách đáng kể tùy theo từng người và từng loại tiếng ồn. Các đường cong ở hình 1.4 biểu diễn một số cấp độ âm thanh tạo ra cảm giác tiếng ồn như nhau ở những tần số và các cấp độ âm thanh khác nhau. 120 120 100 100 80 80 Biên độ (dB) 60 60 40 40 20 20 0 0 20 50 100 500 1000 5000 10000 Tần số (MHz ) Hình 1.4. Đường cong biên độ tín hiệu duy trì độ ổn định âm lượng Những đường cong này dựa trên cơ sở nghiên cứu tâm lý do Fletcher và Munson tiến hành. Đường cong thấp hơn biểu thị chệch khỏi phạm vi tần số khoảng 40dB, khi âm thanh lớn hơn có sự thay đổi cảm giác đối với tần số. Ở 120dB, mọi tần số âm thanh đều lớn như nhau. Do phụ thuộc vào mục đích của hệ thống nên không biết lúc nào phải tái tạo đủ phạm vi tần số. Ví dụ như điện thoại, loại máy được thiết kế dùng cho đàm thoại chỉ có độ rộng band tần từ 300 đến 3000Hz. Mặc khác, đối với các loại máy nghe nhạc HI-FI lại cần toàn bộ band tần từ 30 đến 15000Hz. Rất nhiều hệ thống audio lại yêu cầu độ rộng band tần ở mức cao hơn thế, từ 20 dến 20000Hz. 1.7. QUÉT ẢNH 10
- Chương 1: Đại cương về tín hiệu audio và video Một cảnh tự nhiên phản chiếu ánh sáng đồng thời từ tất cả các điểm, trong khi mắt người có thể cảm thụ được tất cả các điểm này tương đương 108 bộ cảm biến của mắt. Việc cảm nhận dòng dữ liệu này song song phụ thuộc vào não. Tuy nhiên cấu trúc song song như vậy không thông dụng trong điện tử, vì vậy hệ thống ảnh điện tử gặp phải những vấn đề khó khăn khác, nó phải chuyển dữ liệu song thành một hoặc vài tín hiệu điện tử thay đổi theo thời gian, phương tiện để thực hiện việc này chính là quá trình quét ảnh. Quét ảnh cũng giống như đọc một quyển sách, bắt đầu ở bên góc trái trên cùng của cuốn sách, mắt người đọc sẽ di chuyển theo chiều ngang từ trái sang phải bắt đầu dòng đầu tiên của văn bản, ở cuối dòng này mắt lại quay ngược trở lại bên trái và di chuyển xuống dòng tiếp theo, đây được coi là quá trình quét dòng. Hướng quét ngang Hướng quét dọc Xung quét dòng Xung quét mành Hình 1.5. Quét liên dòng: a) mành quét, b) dạng xung quét. Do vậy, quét ảnh là một quá trình di chuyển các phần tử cảm biến lên mọi điểm của một ảnh đến khi toàn bộ ảnh được quét hết, tất nhiên điều này có thể được thực hiện trong mô hình quét như rada, theo hình soắn ốc hoặc thậm chí là ngẫu nhiên. Trong truyền hình người ta đã lựa chọn kiểu quét hình chữ nhật (được gọi là mành) bao gồm các chuyển động theo hàng dọc hàng ngang tách rời nhau. Điều này đã được chứng tỏ ưu thế ở chỗ toàn bộ cảnh do một phần tử chuyển động đồng bộ với tốc độ đồng nhất quét và thiết bị lắp đặt phần cứng cũng đơn giản. 1.7.1. Quét ảnh điện tử 11
- Chương 1: Đại cương về tín hiệu audio và video Để có mô hình quét ảnh ổn định, tần số quét ảnh hàng dọc (quét mành) và hàng ngang (quét dòng) phải được đồng bộ hoá trong mối quan hệ thống nhất. Nếu một hệ thống có N dòng, tần số quét dòng phải ở mức cao nhất và tỉ lệ với tần số quét dọc theo công thức: fh = N × fv Tần số quét dòng cũng là tần số quét ảnh trong hệ thống. Ví dụ nếu tần số quét ảnh là 60Hz thì tần số quét dọc cũng là 60 Hz. Đối với hệ thống 525 dòng, tần số quét dòng là 525× 60 = 31500Hz. Các tín hiệu quét phải được thiết kế để tạo ra quá trình quét tuyến tính, có nghĩa là tốc độ quét phải đồng nhất trên mọi vị trí của ảnh. Điều này khá quan trọng đối với camera và máy thu nhằm đảm bảo sự đồng bộ của ảnh trên màn hình máy thu. Bất cứ độ phi tuyến trong quá trình quét ảnh cũng sẽ gây ra sự biến dạng vị trí trên một vài phần ảnh. Mặc dù, trên lí thuyết có thể sử dụng mô hình quét ảnh phi tuyến, nhưng mô hình này rất khó di trì, và tốc độ quét không đồng bộ nên sẽ gây ra một số vấn đề như: sự thay đổi độ phân giải, độ nhạy cảm và độ chói. Chính vì vậy các tiêu chuẩn quét ảnh của video đều sử dụng quét tuyến tính. 1.7.2. Xoá khoảng trống Vị trí của các phần tử quét phải chuyển động tuyến tính trên một đường thẳng theo thời gian. Điều này được áp dụng trong quá trình quét ảnh từ trái qua phải trên một dòng của màn hình (đây là thời gian quét tích cực), nhưng không cần thiết trong quá trình quét ngược lại. Giai đoạn này thời gian quét càng ngắn càng tốt. Trước đây, quét ngược trong các hệ thống truyền hình bị giới hạn bởi các mạch quét, do vậy thời gian quét ngược chiếm gần 18% tổng thời gian quét một dòng. Điều này gây ra lãng phí, bởi vì trong thời gian này không có một thông tin nào được tuyền. Thực tế trong thời gian này tín hiệu bị xoá do bị đẩy tới điện áp của mức đen. Do vậy, chu kỳ quét ngược thường được gọi là khoảng xoá dòng và quét ảnh tuyến tính phải có dạng hình răng cưa. Hình 1.5(b) quét mành cũng là một quá trình tuyến tính, khoảng xóa mành (VBI) là 8 % đối với truyền hình. 1.7.3. Độ phân giải theo chiều ngang và dải thông tín hiệu Như trong khi đọc một cuốn sách, mắt phải nhận biết từ kí tự này đến kí tự khác, quá trình quét ảnh ở một camera video di chuyển rất hiệu quả các phần tử cảm biến nên ảnh. Điện áp lấy tại đầu ra thay đổi tỉ lệ với cường độ ánh sáng ở mỗi điểm mà bộ cảm biến quét qua, (trong thực tế không có phần tử chuyển động nào, nhưng kết quả lại giống như chuyển động này vẫn tồn tại). Một phần tử cảm biến có kích cỡ xác định, bộ cảm biến lấy trung bình ánh sáng mà nó cảm nhận được thông qua góc mở. Lấy trung bình như vậy đã làm mất 12
- Chương 1: Đại cương về tín hiệu audio và video các chi tiết nhỏ hoặc gây ra độ dốc của tuyến tính ở tần số cao khi chúng ta quan sát tín hiệu điện này, hiệu ứng gây ra bởi góc mở, gọi là đặc tưyến góc mở, được minh họa trong hình 1.6. Hình này đưa ra một góc mở tròn, tuy nhiên góc mở có thể là bất cứ hình gì và độ nhạy không được phân bổ đồng đều. Điều này đã biến quá trình lấy trung bình thành một quá trình gộp toàn bộ diện tích góc mở. Kết quả như đã chỉ trong hình vẽ, là làm tròn các biên trên các quá trình chuyển tiếp và số biên độ bị mất khi khoảng cách giữa các hình nhỏ hơn kích thước của góc mở. Góc mở trong quá trình quét Đầu ra tín hiệu video Hình 1.6. Đặc tuyến góc mở trong quá trình quét Về hình thức bên ngoài các tần số video tạo bởi quá trình quét ảnh phụ thuộc vào những chi tiết nhỏ của cảnh và tốc độ quét. Việc quan sát các chi tiết nhỏ để biết hệ thống tạo ra mô hình có dòng đen và trắng cân bằng là rất hữu ích trong các hình theo chiều dọc kiểm tra độ phân giải theo chiều ngang của hệ thống và ngược lại, các hình theo chiều ngang kiểm tra độ phân giải theo chiều dọc. Đối với độ phân giải theo chiều ngang tần số video fv tạo bởi một hình của các dòng đen và trắng theo chiều đứng ở khoảng cách đồng nhất được cho tính bằng biểu thức: fV= (fH × Np × AR)/ 2(1-HB) (1.3) fH: tần số quét dòng Np: số dòng đen trắng ở khoảng cách cân bằng với độ cao của ảnh AR: cỡ ảnh là tỷ lệ của chiều rộng và chiều cao của màn hình (NTSC là 1,33). HB: thời gian xóa dòng (0,18 đối với hệ NTSC) 1.7.4. Quét cách dòng Phương pháp quét mô tả trong những phần trên được gọi là quá trình quét liên dòng bởi vì tất cả các dòng hoặc mỗi ảnh đều được quét liên tục. Công thức (1.5) chỉ rõ tần số video lớn nhất được tạo bởi quá trình quét ảnh tỉ lệ với tần số quét dòng, và tất nhiên sẽ bằng tần số quét dọc nhân với số dòng quét. Do tần số quét dọc phải đủ lớn để không gây ra hiện tượng rung hình, nên người ta có thể nhận 13
- Chương 1: Đại cương về tín hiệu audio và video thấy độ rộng band tần video cần thiết là một hàm số dòng trực tiếp trong ảnh và giá trị của tần số quét theo hàng dọc. Tuy nhiên, tần số video có thể hạ thấp mà không gây ra hiện tượng rung hình bằng phương pháp quét cách dòng. Quét cách dòng được thực hiện bằng cách chỉ quét từng phần của dòng quét trong mỗi lần quét dọc. Ví dụ, một lần quét dọc thứ nhất có thể quét tất cả các dòng lẻ, và lần quét dọc thứ hai quét tất cả các dòng chẵn. Đây chính là quét cách dòng tỉ lệ 2:1, và tần số video giảm theo hệ số 2:1 so với quá trình quét liên dòng ở cùng tần số quét dọc. Do tần số quét dọc không đổi, nên hiện tượng rung hình hầu như không xảy ra. Hướng quét ngang Hướng quét dọc Xung quét dòng Xung quét mành Hình 1.7. Quét cách dòng: a) mành quét b) dạng xung quét Quá trình quét dòng được hoàn thành khi tổng số dòng quét phải là số lẻ (525 hoặc 625) và tần số quét dòng bằng 1,5 lần tích của số dòng và tần số quét dọc. Từ mối quan hệ tần số này sẽ cho ra kết quả của quá trình quét cách dòng như trong hình 1.7. Trong hình này, điểm cuối của lượt quét dọc thứ nhất nằm ở trung tâm của dòng, vì vậy điểm xuất phát của dòng quét dọc thứ hai cũng nằm ở trung tâm của một dòng (chính xác là diểm giữa của dòng đầu tiên). Phải mất hai lượt quét mới quét hết một ảnh gồm hai mành: mành 1 bao gồm tất cả các dòng lẻ và mành 2 bao gồm tất cả các dòng chẵn. 1.7.5. Độ phân giải đứng 14
- Chương 1: Đại cương về tín hiệu audio và video Không giống như độ phân giải ngang thường bị giới hạn bởi độ rộng band tần của hệ thống, độ phân giải đứng lại bị giới hạn bởi số lượng các dòng quét trên hình. Các hình ngang hoặc gần kề, ở những chi tiết nhỏ được lấy mẫu bằng tần số không gian của số dòng quét thể hiện qua số dòng quét tích cực. Tiêu chuẩn Nyquist đã chỉ ra rằng các tần số vượt quá 1,5 chu kỳ lấy mẫu sẽ không lấy được mẫu chính xác nên người ta có thể kết luận giới hạn độ phân giải theo hàng dọc đo ở TVL là 1.5 số dòng tích cực. Tuy nhiên, trong thực tế giớn hạn này có thể cao hơn bởi vì hiện tượng méo do chồng phổ, không hoàn toàn che khuất tín hiệu. Trước đây, trong hệ thống truyền hình, người ta đã đặt tên cho tỷ lệ giữa độ phân giải giới hạn biểu kiến và số dòng tích cực là hệ số Kell. Nó nằm trong phạm vi từ 0.5 đến 0.9 và thường lấy ở 0.7. Kết hợp quét cách dòng và chồng phổ theo chiều dọc ở các biên ngang sẽ gây ra hiệu ứng giả trong quá trình tái tạo lại ảnh tự nhiên, đó chính là hiện tượng rung hình ở các biên ngang gần kề và hiện tượng rung hình theo hình chữ chi ở một phần của ảnh có hướng tập trung theo chiều ngang. Hiệu ứng lấy mẫu theo chiều dọc xảy ra ở bất cứ hệ thống nào có sử dụng quét dòng, vì vậy nó tồn tại trong các hệ thống video số cũng như truyền hình. Để loại trừ hoàn toàn hiện ứng này, tần số đầu vào trên giới hạn Nyquist phải được lọc ra trước quá trình lấy mẫu. Điều này có nghĩa là, quá trình lọc phải được thực hiện ở phần quang học của camera trước khi quá trình quét xảy ra ở bộ cảm biến ảnh. 1.8. BIỂU DIỄN MÀU SẮC 1.8.1. Đặc trưng màu sắc của ánh sáng Ánh sáng tự nhiên là một nguồn sáng tổng hợp các sóng điện từ nằm trong giải phổ có bước sóng từ 400 đến 700nm (10-9m) mà mắt người có thể quan sát được. Sự phân bố phổ biến của ánh sáng trắng tương đối đồng đều trên toàn bộ dải ánh sáng quan sát được mặc dù có rất nhiều loại ánh sáng trắng. Ngược lại, sự phân bố của ánh sáng màu không đồng đều, thường có từ hai vùng phổ trở lên. Quá trình phản chiếu ánh sáng trắng từ bề mặt của những vật tự nhiên có thể có sự chọn lọc bước sóng, điều này tạo ra đặc tính màu sắc của vật. Sóng của ánh sáng ở bước sóng của màu sắc được phản chiếu, bước sóng khác ít nhiều bị hấp thụ thay bằng bị phản chiếu Mắt người nhận biết được màu sắc bằng ba loại tế bào hình nón khác nhau trong bộ thụ cảm của võng mạc. Chúng phản ứng khác nhau với những màu sắc khác nhau và phát tín hiệu ba chiều tới não, tại đây màu sắc sẽ được nhận biết. Chính vì quá trình nhận biết này mà mắt người cảm nhận màu sắc không giống với màu sắc vật lý. Một hệ thống tái tạo màu sắc thường quan tâm tới các thông tin về 15
- Chương 1: Đại cương về tín hiệu audio và video màu sắc vật lý (phân bố phổ), tuy nhiên nó vẫn phải tái tạo lại được cảm giác màu sắc mà người xem cảm nhận được. Từ thế kỷ thứ 17, Isaac Newton đã chỉ ra rằng tất cả các màu sắc đều có thể cảm nhận chỉ bởi từ ba màu tương đương với ba thành phần cảm thụ màu sắc trong mắt và điều này được trình bày thông qua thuyết ba màu. Đây là cơ sở cho ảnh màu, in màu, sơn màu và các hệ thống truyền hình màu. 1.8.2. Các màu cơ bản Thuyết ba màu cho rằng bất kỳ màu sắc nào cũng được tạo ra bởi sự kết hợp của ba màu, được gọi là các màu cơ bản (hình 1.10). Ba màu cơ bản sử dụng trong hệ thống truyền hình này: đỏ, lục, lam. (gọi tắt là RGB). Khi trộn ba màu theo tỷ lệ bằng nhau thì sẽ thu được màu trắng . Mỗi màu cơ bản có một màu phụ tương ứng, mà khi trộn với màu cơ bản của nó sẽ tạo ra nàu trắng. Màu phụ của màu đỏ là màu lơ, của màu lục là màu mận chín và của màu lam là màu vàng như biễu diễn ở hình 1.8. Như vậy trong sử lý ảnh màu cũng như trong kỹ thuật truyền hình màu người ta chỉ dùng ba màu cơ bản để biểu diễn cho vô số các màu sắc của ảnh bằng cách pha trộn những màu sắc cơ bản này theo những tỷ lệ màu nhất định. Phụ của màu lục Đỏ tươi Đỏ Phụ của Lam Vàng Các màu cơ bản màu lam Phụ của Lơ Lục màu đỏ Hình 1.8. Các màu cộng và trừ cơ bản 1.8.3. Hệ thống truyền hình thành phần Trong hệ thống truyền hình màu, camera phải phát đi ba thành phần màu sắc điều khiển các nguồn ánh sáng đỏ, lục, lam của màn hình. Camera video chuyên nghiệp thực hiện việc này bằng cách sử dụng ba bộ thụ cảm hình ảnh được quét đồng thời và ba bộ này có bộ phận lọc màu sắc phù hợp để đạt được đặc tuyến phổ tương ứng. Đầu ra của bộ thụ cảm sẽ truyền tín hiệu để điều khiển ba súng điện tử 16
- Chương 1: Đại cương về tín hiệu audio và video của máy thu. Các camera giá thấp hơn chỉ sử dụng một bộ thụ cảm có bộ lọc màu sửa sai để thu ba màu từ khu vực lân cận trên bề mặt thụ cảm. Quá trình xử lý điện tử của các tín hiệu ở camera này cho phép lấy ra các thành phần màu sắc RGB. Khi hệ thống lớn, việc xử lý các tín hiệu thành phần màu sắc trên ba mạch song song trở nên phức tạp, có nhiều tín hiệu video mắc nối tiếp và không thể thực hiện được khi các tín hiệu màu analog được truyền hoặc phát quảng bá trên một kênh đơn. Vì vậy, cần thiết phải có một hệ thống màu tổng hợp kết hợp ba thành phần màu sắc thành một tín hiệu đơn . Chú ý rằng, trong hệ thống số mà các thành phần RGB được số hoá, việc kết hợp các kênh số cho một trong ba thành phần, một kênh đơn giản chỉ là quá trình chuyển đổi song song-nối tiếp. Tuy nhiên, tạo ra một tín hiệu tổng hợp ở một hệ thống analog không phải là một công việc đơn giản và thường có liên quan đến các quy ước về chỉ tiêu kỹ thuật. Do đó, bất cứ một hệ thống nào được thiết kế theo tiêu chuẩn kỹ thuật số đều không nên sử dụng các tín hiệu tổng hợp analog. Dù vậy, rất nhiều hệ thống sẽ đổi từ analog sang số và việc số hoá các tín hiệu tổng hợp analog được miêu tả dưới đây là rất có ích trong giai đoạn chuyển tiếp . Một số thao tác kĩ thuật giúp hệ thống màu tổng hợp analog có thể sử dụng vào hệ thống số cũng rất hữu ích với các hệ thống số. Phần bàn luận dưới đây sẽ chỉ ra điều đó. Tuy nhiên, phần bàn luận hệ thống tổng hợp này mới chỉ dừng lại ở việc khái quát. 1.8.4. Hệ thống màu tổng hợp Mắt người còn có một đặc tính nữa góp một phần khá quan trọng cho hệ thống truyền hình màu. Từ cách thu thập thông tin trong não, có thể nhận thấy là mắt có độ phân giải kém với các vật thể có màu sắc hơn là với các vật đen trắng. Vì vậy, một hệ thống video cũng phải giảm độ phân giải, để khai thác đặc tính này của mắt, các tín hiệu màu cơ bản của một hệ thống video tạo bởi camera cần phải được cấu trúc lại thành các màu sắc riêng biệt và đơn sắc giống như cách mà mắt thực hiện. Thuyết ba màu cho rằng, bất cứ một tín hiệu ba màu nào xuất hiện, đều có thể thực hiện phép chuyển đổi ma trận tuyến tính của các tín hiệu thành phần R,G,B thành một tín hiệu đơn sắc (độ chói) và hai tín hiệu hiệu màu. Các tín hiệu màu là các khác nhau về màu sắc, có nghĩa là khi không có màu ta có kết quả bằng 0. Đây là kết quả của phép trừ tín hiệu chói cho các tín hiệu màu thành phần. 1.8.4.1. Độ chói và các thành phần tín hiệu màu Tín hiệu chói có đặc tuyến phổ tương ứng với đường chói (hình 1.9), nó thể hiện độ chói tương đối mà mắt người thu được ở những phổ màu khác nhau. Tín hiệu chói Y được tổng hợp bằng cách kết hợp các tín hiệu R, G, B theo công thức: 17
- Chương 1: Đại cương về tín hiệu audio và video Y = 0,59G + 0.30R + 0,11B (1.6) Chú ý là trọng số của màu sắc ở công thức chói là thích hợp với sự cảm nhận của thị giác về độ chói của màu sắc. Màu lục xuất hiện chói nhất, màu đỏ tối hơn và màu lam là tối nhất. Các tín hiệu màu nhận được bằng cách trừ Y với R và B để tạo ra tín hiệu R-Y và B-Y. Những tín hiệu này có thể truyền đi với dải band tần có độ rộng một nữa do sự phân giải của mắt kém hơn. Độ chói các tín hiệu màu được sử dụng rộng rãi trong hệ thống tương tự và số. 1.0 0.5 400 440 480 520 560 600 640 680 Hình 1.9. Đường cong độ chói 1.8.4.2. Tần số quét cách dòng Một đặc tính khác của tín hiệu video là có thể kết hợp các thành phần tín hiệu chói và các thành phần tín hiệu màu thành một kênh đơn. Điều này được lý giải là các thành phần tần số tạo bởi tín hiệu video được quét hầu hết đều tập trung xung quanh hài của tần số quét dòng. 210 x fH 211 x fH Biên độ 212 x fH 0 1.0 2.0 3.0 4.0 Tần số MHz Hình 1.10. Phổ của tín hiệu video đơn sắc 18
CÓ THỂ BẠN MUỐN DOWNLOAD
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn