Tutorials Vbook v0.1-Thủ Thuật UDS part 17

Chia sẻ: Qwdsdasdvdfv Qwdasdasdasd | Ngày: | Loại File: PDF | Số trang:6

Thêm vào BST

Báo xấu

51
lượt xem 5
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tham khảo tài liệu 'tutorials vbook v0.1-thủ thuật uds part 17', công nghệ thông tin, cơ sở dữ liệu phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Tutorials Vbook v0.1-Thủ Thuật UDS part 17

Quantization type,chọn H.263 nếu bạn có ý định nén một bộ phim có độ dài trung bình vào 1 CD 700 MB (có nghĩa là H.263 nếu bitrate cho file video xuất ra nhỏ hơn 1000 kbit/s),chọn MPEG nếu muốn xuất ra hai CD(đối với tôi là khoảng trên 1500 kbit/s).MPEG-Custom sẽ cho phép bạn tạo riêng ma trận quantilization cho video của mình,hoặc bạn cũng có thể sử dụng các ma trận được soạn sẵn cho từng trường hợp-các ma trận loại này có thể download tại các forum XviD như http://anonym.to/?http://forum.doom9.org - XviD forum.Một ma trận thích hợp có thể cải thiện chất lượng file xuất ra tới hàng chục phần trăm so với ma trận mặc định. Adaptive quantization(còn được biết đến như là lumi-masking)-bình thường,có những phần thông tin mà mắt người thường hay để ý hơn,đó là do tâm lý chú ý về một số điểm nhất định trong khung hình của con người và những phần đó sẽ cần phải có chất lượng đủ tốt để đáp ứng sự chú ý đó.Ví dụ như trong một cảnh quay có những khu vực nhất định rất tối,thường thì lúc đó,phần tối sẽ được mắt người nhìn nhận là màu đen tương đối(trong khi thực tế ở đó vẫn đầy đủ chi tiết) và vì mắt người quy cho phần đó là màu đen nên thực sự không cần thiết phải xử lý và lưu lại những chi tiết đó mà đơn giản chỉ cần tiết kiệm được bitrate cho phần
đó.XviD cógán cho cả khu vực đó một màu tối khả năng sử dụng những quantizer khác nhau cho mỗi macroblock-hay dễ hiểu hơn là 16x16 block (tính năng mà DivX không có).Khi gặp những phần quá tối hoặc quá sáng,adaptive quantization(lumi-masking) sẽ nén những phần đó với tỷ lệ nén cao hơn các phần có màu bình thường mà mắt người dễ nhận biết hơn.Và bởi vì có những chi tiết đã được nén mạnh nên một số lượng bitrate sẽ được tiết kiệm và dành cho các phần hình ảnh khác,do đó chất lượng video thu được ở những phần mà người xem hay chú ý là cao hơn. Mặc dù vậy,đôi khi những phần mất chi tiết đó sẽ làm cho việc theo dõi hình ảnh trở nên khó khăn(khó chịu?!) hơn và làm mất đi những chi tiết quan trọng(không phải phần hình ảnh quá tối hay quá sáng nào cũng là “đồ bỏ”).Vì vậy tùy chọn này là không nên đối với những video có bitrate cao(khoảng trên 1500 kbit/s). Interlaced Encoding Nếu file video xuất ra được chọn là dạng interlace thì check vào ô này sẽ cải thiện hiệu năng trong quá trình encode. Quarter pixel(qpel) được biết đến là như là “quarter pixel motion estimation”-một nâng cấp của “motion estimation”.Tính năng này giúp đánh giá chuyển động chính xác hơn(trên ¼ pixel thay vì 1 pixel)và đặc biệt có tác dụng với hình ảnh ở độ phân giải thấp.Chỉ một số thiết bị chơi mp4 có hỗ trợ qpel. Global Motion Compensation(GMC)-giúp cho hình ảnh thể hiện tốt hơn khi tạm dừng và quan sát gần cũng như có khả năng cải thiện chất lượng hình ảnh nếu tỷ lệ khung hình được định dạng kích cỡ quá chênh lệch so với tỉ lệ khung hình gốc.Có vẻ như tính năng này rất ít khi được sử dụng(ngay cả tôi cũng vậy).Hiện tại tôi chưa biết loại thiết bị nào có thể chơi được mp4 sử dụng GMC,một khi bạn đã check vào nó,hãy tin tôi đi,hầu như chắc chắn bạn sẽ encode ra một file mp4 không thể chạy được ở bất kỳ thiết bị nào ngoài chính chiếc PC của mình. Reduced resolution-giảm độ phân giải của hình ảnh thu được so với độ phân giải gốc,chỉ hoạt động khi cần capture thời gian thực những chương trình truyền hình trực tuyến.Loại nguồn này được gọi là streaming,những treaming nổi tiếng và phổ biến nhất có thể kể ra là WMA của M$,realvideo của RealNetworks,Quicktime của Apple. (tính năng này chỉ xuất hiện ở XviD 1.0.3,khi tôi dùng bản 1.1 beta 2 thì không có)
Trước khi tiếp tục phần tiếp theo,hãy để tôi giải thích một chút với các bạn về khái niệm các loại frame. Một chuỗi các hình ảnh tạo thành một đoạn film hoàn chỉnh mà bạn nhìn thấy,mỗi hình ảnh đó gọi là một khung hình(frame).Trong điện ảnh,người ta thường coi 24 khung hình/giây(frame/sec) là đủ để mắt người có thể cảm nhận chuyển động giống như nó xảy ra liên tục. Đối với video kỹ thuật số,đặc biệt là mpeg-4,các frame không phải là bình đẳng như nhau,chúng được xử lý với những cách thức khác nhau và được phân làm 3 loại: - I frame-ỉntra frame-hay ỉntra picture:là những frame hoàn chỉnh theo đúng nghĩa(có nghĩa là nếu tách riêng I frame ra ta sẽ được một bức ảnh hoàn chỉnh).Nó còn được gọi là Key Frame. - P-frame-predictively coded frame-là những frame chỉ lưu những thông tin khác nhau từ những frame trước.Mỗi P-frame sẽ tham khảo dữ liệu hình ảnh từ feame trước nó và chỉ định cho B-frame và P-frame sau nó trong một nhóm frame(GOP- Group of pictures).Mỗi macroblock(16x16 block)của P-frame có thể được encode độc lập hay được bổ xung từ frame đến trước nó. - B-frame- Bi-Directionally Predictively Coded Frame-cũng như P-frame,không phải là một frame hoàn chỉnh,nó chỉ mang thông tin khác biệt giữa nó và 2 frame đứng cạnh nó(trước và sau).B-frame cũng được dự đoán(predict) bới 2 frame này.Bởi vì có sự liên kết,tham khảo với cả 2 frame trước và sau nên tên của loại frame này là "Bidirectional-frame" hay frame 2 chiều. Cách hoạt động:đầu tiên ta có một nhóm picture(GOP-Group of pictures),ở đầu mỗi nhóm này là một I-frame lưu đầy đủ giữ liệu của một hình ảnh.Các P-frame và B-frame đứng sau I-frame này và lưu các giữ liệu thể hiện sự khác nhau giữa các frame đứng trước hay sau chúng,mặt khác chúng cũng liên kết với I-frame trong nhóm để tìm thông tin cần thiết. Ví dụ:ta có 1 GOP như sau:IBBPBBBPBBBPBBP,trong GOP này,I sẽ là frame
đứng đầu nhóm và P sẽ là frame kết thúc nhóm,sau P chắc chắn sẽ là một I-frame để bắt đầu GOP tiếp theo.Cụ thể hơn,nếu ta có một đoạn film quay cảnh một chiếc xe hơi đang di chuyển từ phải qua trái,đầu tiên,I-frame sẽ lưu lại đầy đủ hình ảnh của chiếc xe khi nó ở bên phải,sau đó,các B hay P frame thay vì tiếp tục lưu những hình ảnh hoàn chỉnh của chiếc xe sẽ chỉ nhận ra những điểm khác ở thời điểm xảy ra frame đó với I-frame đầu nhóm,rốt cuộc hình ảnh chiếc xe khi nó ở bên trái màn hình thực chất ra không phải là một hình ảnh theo đúng nghĩa,frame ở vị trí đó sẽ chỉ làm nhiệm vụ là di chuyển chiếc xe từ phía bên phải qua bằng cách chỉ ra tọa độ để đặt chiếc xe vào đó(trên thực tế mọi việc diễn ra phúc tạp hơn) Với cách phân chia như vậy,I-frame là frame có dung lượng lớn nhất(thường là gấp hơn 5 lần so với B-frame với các setting và matrix tôi hay sử dụng),P-frame có dung lượng lớn hơn B-frame nhưng đa số vẫn nhỏ hơn so với I-frame.Trong một file mpeg,số lượng I-frame là ít nhất,chúng đóng vai trò là hình ảnh đầu tiên mỗi khi chuyển cảnh,nhiều hơn là P-frame và nhiều nhất là b-frame.Khi kéo thanh trượt trên chương trình playback mpeg,những hình ảnh mà chúng ta có thể truy cập tới chính là những I-frame,đó cũng là một lý do loại frame này được gọi là key frame. B-VOPs-là tùy chọn dành cho những người đã đọc qua phần trên Max consecutive BVOPs:số B-frame giới hạn được phép đứng liền nhau.Như tôi đã trình bày ở trên,càng nhiều B-frame có nghĩa là video càng thể hiện đại khái(bởi nó không lưu những hình ảnh hoàn chỉnh và cũng không đóng vai trò liên kết,tiên đoán như P-frame).Nhưng điểm mạnh của B-frame là kích thước rất nhỏ,do đó dung lượng file nén sẽ nhỏ và thời gian sẽ không lâu như khi dùng nhiều I-frame hơn.Để tham khảo thêm,bạn nên biết DivX codec chỉ đặt hệ số này là 1.Và bạn không nên đặt quá 3 nếu không muốn thu được 1 kết quả tồi.Cá nhân tôi thường đặt 3 khi encode VCD và đặt 2 với DVD. Quantizer ratio chỉ định độ nén của B-frame là hơn bao nhiêu so với P-frame(đơn vị tính theo quantizer),bình thường hệ số này là 1,5. Quantizer offset là một hệ sô được bù thêm vào mỗi quantizer. Lấy một ví dụ để bạn hiểu rõ hơn về hai hệ số này:có hai B-frame,một p-frame đứng giữa hai b-frame này.P-frame có quantizer là 2,vậy khi ta set ratio và offset là 1,các B-frame kể trên sẽ mang quantizer là 3.
Packet bitstream sẽ nhóm các B và P-frame cạnh nhau vào một bitstream.Ví dụ:[i][PB][b][trống][PB][b][trống][P].Dạng đóng gói như thế này sẽ cho phép encoding không bị trì hoãn. Closed GOV (trong hình mà tôi dùng để minh họa không có tùy chọn này,nếu phiên bản của bạn dùng có closed GOV,nó sẽ hiện cùng dòng với packet bitstream.Closed GOV sẽ tạo ra những closed GOP-là GOV có frame cuối cùng là P-frame.Điều này đồng nghĩa với việc trước mỗi I-frame sẽ là một P-frame.Tác dụng của closed GOP là sẽ tạo ra những file mpeg có thể chỉnh sửa được(trái ngược với một fiel mpeg dùng open GOP sẽ không thể chỉnh sửa được). Level Ta chuyển qua Tab level,ở đây không có gì để bạn chỉnh sửa ngoài việc chọn level(công việc mà chúng ta đã làm ngay từ đầu).Đây có thể coi là phần tham khảo thêm để bạn thực sự hiểu rõ mỗi profile @ level sẽ tương ứng với những “cấu hình” nào cho file tạo thành.
Aspect Ratio(AR)