Xử lý âm thanh, hình ảnh P2: Hướng dẫn chi tiết

Hình 1.30 (a) Lấy mẫu đơn vị, (b) đơn vị bước, (c) hàm mũ thực và (d) hàm sin suy giảm

Hình 1.31 Sơ đồ khối (a) hệ thống đơn ngõ vào/đơn ngõ ra; (b) hệ thống đơn ngõ vào/đa ngõ ra

Khi hệ thống gồm nhiều ngõ ra, tín hiệu chuỗi ngõ ra sẽ được biểu diễn bằng một vector

được mô tả như ở Hình 1.31.

Hệ thống tuyến tính dịch bất biến là hệ thống đặc biệt hữu dụng cho việc xử lý tín hiệu âm

thoại. Hệ thống được đặc trưng bởi đáp ứng xung, )(nh , khi đó tín hiệu ngõ ra được tính bởi

công thức

∑

∞

−∞=

=−=

nhnxknhkxny )(*)()()()( (1.52a)

∑

∞

−∞=

=−=

nxnhknxkhny )(*)()()()( (1.52b)

với * là phép chập hai tín hiệu

1.3 LÝ THUYẾT VÀ CÁC BÀI TOÁN CƠ BẢN

1.3.1 Phân tích dự đoán tuyến tính [12]

Dự đoán tuyến tính (Linear prediction, viết tắt là LP) là một phần không thể thiếu của hầu

hết tất cả giải thuật mã hóa thoại hiện đại ngày nay. Ý tưởng cơ bản là một mẫu thoại có thể được

xấp xỉ bằng một kết hợp tuyến tính của các mẫu trong quá khứ. Trong một khung tín hiệu, các

trọng số dùng để tính toán kết hợp tuyến tính được tìm bằng cách tối thiểu hóa bình phương trung

bình lỗi dự đoán; các trọng số tổng hợp, hoặc các hệ số dự đoán tuyến tính (LPC) được dùng đại

diện cho một khung cụ thể.

Trong phần chương 3, sự sắp xếp LP theo hệ thống dựa trên mô hình ngược tự động

Trong thực tế, phân tích dự là một tiến trình ước lượng để tìm các thông số của AR, mà

các thông số này được cho bởi các mẫu của tín hiệu. Như vậy, LP là một kỹ thuật nhận dạng với

các thông số của một hệ thống đựoc tìm từ việc quan sát. Với giả định là tín hiệu thoại được mô

hình như là tín hiệu AR, điều này đã được chứng minh tính đúng đắn của nó trong thực tiễn.

Một cách biểu diễn LP khác là phương pháp ước lượng phổ. Như đã trình bày ở trên, phân

tích LP cho phép việc tính toán các thông số của AR, đã được định nghĩa trong mật độ phổ công

suất (PSD) của chính bản thân tín hiệu. Bằng cách tính toán LPC của một khung tín hiệu, ta có thể

tạo ra một tín hiệu khác theo cách thức có nội dung phổ gần như tương đồng với tín hiệu gốc.

LP cũng có thể được xem như là một quá trình loại bỏ các dư thừa khi thông tin bị lặp lại

trong một sự trường hợp cần khử. Sau cùng, việc truyền dữ liệu có thể không cần thiết nếu như dữ

liệu cần truyền có thể được dự đoán trước. Bằng cách thức chuyển chỗ các dư thừa trong một tín

hiệu, số lượng bit cần thiết để mang thông tin sẽ ít hơn và như thế sẽ đạt được mục tiêu nén dữ

liệu.

Trong phần này sẽ đề cập đến bài toán cơ bản của phân tích LP đã được định rõ, kết hợp

với việc hiệu chỉnh lại cho phù hợp theo hướng các tín hiệu động, cũng như ví dụ và các giải thuật

cần thiết cho quá trình dự đoán tuyến tính.

1.3.1.1 Bài toán dự đoán tuyến tính

Dự đoán tuyến tính được mô tả như là một bài toán nhận dạng hệ thống, với các thông số

của một mô hình AR được ước lượng từ bản thân tín hiệu. Mô hình được trình bày ở Hình 1.32.

Tín hiệu nhiễu trắng ][n

được lọc bởi quá trình tổng hợp AR để có được tín hiệu AR ][n

, với

các thông số AR được ký hiệu là i

. Dự đoán tuyến tính thực hiện ước đoán ][n

dựa vào

mẫu trong quá khứ:

][][

insan

s−−= ∑

(1.53)

Với i

alà các ước lượng của các thông số AR được xem là các hệ số dự đoán tuyến tính

(LPC). Hằng số

trong công thức là bậc dự đoán. Như vậy, việc dự đoán dự trên tổ hợp tuyến

tính của

mẫu trong quá khứ của tín hiệu, chính vì thế việc dự đoán mang tính tuyến tính. Lỗi

dự đoán được tính bằng công thức:

][][][ ^

nsnsne −= (1.54)

Hình 1.32 Hệ thống nhận dạng dưới dạng dự đoán tuyến tính

Hình 1.33 Bộ lọc lỗi dự đoán

Lỗi dự đoán chính là độ sai biệt giữa mẫu thật sự và mẫu ước lượng. Hình 1.33 mô tả lưu

đồ tín hiệu thực hiện bộ lọc lỗi dự đoán. Bộ lọc có ngõ vào là tín hiệu AR và ngõ ra chính là tín

hiệu lỗi dự đoán.

Tối thiểu hoá lỗi

Bài toán nhận dạng hệ thống bao gồm việc ước lượng các thông số AR i

từ ][n

. Để

thực hiện việc ước lượng, tiêu chuẩn phải được thiết lập. Trong đó, bình phương trung bình lỗi dự

đoán được tính bởi công thức:

{}

⎭

⎬

⎫

⎩

⎨

⎧⎟

⎠

⎞

⎜

⎝

⎛−+== ∑

2][][][ M

iinsansEneEJ (1.55)

Được tối thiểu hóa bằng cách lựa chọn LPC thích hợp. Thông số LPC tối ưu có thể được

tìm bằng cách thiết lập các đạo hàm riêng phần của

khi i

atiến tới zero:

0][][][2

⎭

⎬

⎫

⎩

⎨

⎧−

⎟

⎠

⎞

⎜

⎝

⎛−+=

∂

∂∑

knsinsansE

(1.56)

Với Mk ,...,2,1=, khi (4.4) xảy ra thì i

iaa

=, lúc này LPC chính bằng các thông số

AR.

Độ lợi dự đoán

Độ lợi dự đoán của bộ dự đoán được cho bởi công thức

{

}

{}

⎟

⎠

⎞

⎜

⎝

⎛

⎟

⎠

⎞

⎜

⎝

⎛

=][

][

log10log10 2

10 neE

nsE

(1.57)

Là tỉ số giữa biến tín hiệu ngõ vào và biến của lỗi dự đoán theo đơn vị decibels (dB). Độ

lợi dự đoán là thông số đo lường chất lượng của bộ dự đoán. Một bộ dự đoán tốt hơn có khả năng

tạo ra lỗi dự đoán nhỏ hơn với độ lợi cao hơn.

Tối thiểu hóa bình phương trung bình lỗi dự đoán

Từ Hình 1.33, ta có thể nhận xét khi i

iaa

=, thì ][][ n

; như vậy lỗi dự đoán tương

tự như dùng tín hiệu nhiễu trắng để tạo ra tín hiệu AR ][n

. Đây là trường hợp tối ưu khi lỗi bình

phương trung bình được tối thiểu hóa, với

{

}

{

}

222

min ][][ x

nxEneEJ

=== (1.58)

Khi đó, độ lợi dự đoán đạt giá trị lớn nhất.

Điều kiện tối ưu có thể đạt được khi bậc của bộ dự đoán lớn hơn hoặc bằng bậc của quá

trình tổng hợp AR. Trong thực tế,

thường là số chưa biết trước. Một phương pháp đơn giản để

có thể ước lượng được giá trị

từ tín hiệu nguồn là vẽ biểu đồ độ lợi dự đoán như là một hàm

của bậc dự đoán. Với phương pháp này, ta có thể quyết định được bậc của dự đoán ứng với độ lợi

bão hòa, khi đó khi tăng bậc dự đoán thì độ lợi không tăng. Giá trị của bậc dự đoán tại điểm thỏa

điều kiện bão hòa này được xem là giá trị ước lượng tốt nhất cho bậc của tín hiệu AR.

Sau khi đã xác định được giá trị M, hàm chi phí

đạt giá trị tối thiểu khi i

iaa

=, dẫn đến

][][ n

ne =. Và khi đó, lỗi dự đoán sẽ bằng với giá trị tín hiệu đầu vào của bộ tổng hợp quá trình

AR.

1.3.1.2 Phân tích dự đoán tuyến tính cho tín hiệu động

Tín hiệu thoại trong thực tế là tín hiệu động, nên LPC phải được tính ứng với từng khung

tín hiệu. Trong một khung tín hiệu, một tập LPC được tính toán và dùng để đại diện cho các thuộc

tính của tín hiệu trong một chu kỳ cụ thể, với giả định rằng số liệu thống kê của tín hiệu vẫn

không thay đổi trong một khung. Quá trình tính toán LPC từ dữ liệu tín hiệu được gọi là phân tích

dự đoán tuyến tính.

Bài toán dự đoán tuyến tính cho tín hiệu động được phát biểu lại như sau: đây là bài toán

thực hiện việc tính các giá trị LPC ứng với

điểm dữ liệu với thời gian kết thúc là m:

]1[ +−

, ]2[ +−

, …, ][m

. Vector LPC được viết như sau:

[] []

[

]

[

][]

Mmamamama ...

= (1.59)

Với

là bậc dự đoán

Độ lợi dự đoán

Độ lợi dự đoán của bộ dự đoán được cho bởi công thức

[] []

[]

⎟

⎠

⎞

⎜

⎝

⎛

=∑

∑

+−=

Nmn

mPG

log10 (1.60)

Với

[] [] [] [] [ ][ ]

insmansnsnsne

i−+=−= ∑

; 1+

−

mn , …, m (1.61)

Các LPC

[

]

mai được tính toán từ các mẫu trong chu kỳ. Độ lợi dự đoán định nghĩa ở

công thức (4.23) là một hàm theo biến thời gian m.

Ví dụ: Nhiễu trắng được tạo ra bởi bộ tạo số ngẫu nhiên phân phối đều, sau đó được lọc

bởi bộ tổng hợp AR với

534.1

1=a 1

2=a 587.0

a 347.0

a 08.0

56 =a

061.0

6−=a 172.0

7−=a 156.0

−

a 157.0

−

a 141.0

10 −=a

Khung tổng hợp của tín hiệu AR được dùng cho phân tích LP, với tổng cộng là 240 mẫu.

Ước lượng tự động tương quan không hồi qui sử dụng cửa sổ Hamming. Phân tích LP được thực

hiện với bậc từ 2 đến 20. Hình 1.34 tóm tắt kết quả, với độ lợi dự đoán được tính toán tại 2

và đạt giá trị cao nhất tại 10=

. Các bậc lớn hơn 10 không cho được độ lợi cao hơn nữa, cho

nên ta có thể chỉ cần xét đến 10=

Hình 1.34 Độ lợi dự đoán (PG) là một hàm theo biến bậc dự đoán M

Xử lý âm thanh - hình ảnh P2

Chủ đề:

Tài liệu liên quan

Tài liêu mới

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi