intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Báo cáo khoa học: "PHÂN TÍCH THỐNG KÊ MÃ HÓA CELP"

Chia sẻ: Nguyễn Phương Hà Linh Linh | Ngày: | Loại File: PDF | Số trang:5

56
lượt xem
7
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tóm tắt: Bài báo đề cập đến phương pháp đánh giá các bộ Mã hoá tiếng nói CELP, cách xử lý các tham số, để tạo ra bộ mã hoá tiếng nói CELP. Vừa bảo đảm hiệu quả kinh tế vừa bảo đảm chất lượng tiếng nói. Đây là một vấn đề thời sự trong lĩnh vực mã hoá tiếng nói trong các hệ thống thoại của mạng viễn thông, đang được các nhà nghiên cứu quan tâm.

Chủ đề:
Lưu

Nội dung Text: Báo cáo khoa học: "PHÂN TÍCH THỐNG KÊ MÃ HÓA CELP"

  1. PHÂN TÍCH THỐNG KÊ MÃ HÓA CELP TS. TRẦN QUỐC THỊNH Bộ môn Kỹ thuật viễn thông Khoa Điện – Điện tử Trường Đại học Giao thông Vận tải Tóm tắt: Bài báo đề cập đến phương pháp đánh giá các bộ Mã hoá tiếng nói CELP, cách xử lý các tham số, để tạo ra bộ mã hoá tiếng nói CELP. Vừa bảo đảm hiệu quả kinh tế vừa bảo đảm chất lượng tiếng nói. Đây là một vấn đề thời sự trong lĩnh vực mã hoá tiếng nói trong các hệ thống thoại của mạng viễn thông, đang được các nhà nghiên cứu quan tâm. Summary: This paper presents the methods to analyse CELP encoder and deal with parameters which produce encoder CELP for ensuring both economic efficiency and quality of voice. It takes much researchers’ attention in area of voice coding of telecommunication network now. I. GIỚI THIỆU Chúng ta xem xét phân tích sự hoạt động của bộ Mã hoá CELP với sơ đ ồ được giới thiệu ĐT trên hình 1. Tín hiệu kích thích U(h) được hình thành b ằng cách cộng tín hiệu tỷ lệ từ sổ mã hoá thích ứng (AKK) (b ổ xung thành phần trên số thời gian dài của tín hiệu tiếng nói) và tín hiệu tỷ lệ từ sổ mã cố định lớn (CKK). Tín hiệu kích động nhận được điều khiển bộ lọc tổng hợp, nó mô phỏng hiệu ứng thiết bị tiếng nói. Trong bộ giải mã tín hiệu kích động đi qua bộ lọc tổng hợp, khi tái tạo tín hiệu tiếng nói (h) ta nhận thấy, đầu tiên các tham số của bộ lọc được xác định, còn sau đó là các chỉ số của sổ mã  và k. Các hệ số khuếch đại tương ứng G1 và G2, các tham số của sổ mã được chọn sao cho sai lệch gây ra giữa tín hiệu tiếng nói gốc và tín hiệu tiếng nói tái tạo được cực tiểu hoá, đạt được việc truyền mỗi tế bào của sổ mã đến bộ lọc tổng hợp với mục đích xuất hiện lớn nhất các mẫu giống nhất. Tất nhiên trên thực tế đ ưa ra 2 sự đơn giản hoá phân tích. Đầu tiên gắn liền với xác định tham số bộ lọc tổng hợp đ ặc tính của nó để đơn giản lựa chọn bộ lọc đảo dự đoán tuyến tính thời gian ngắn, được cực tiểu hoá năng lượng tín hiệu sai lệnh dự đoán. Tham số của bộ lọc tổng hợp được xác định với tính toán tín hiệu kích động U(h), tất nhiên sau đó chúng được xác định, các thay đổi nào đó lớn hơn của tín hiệu sẽ không đ ược tính đến, điều đó có nghĩa là, khi xác định tham số của bộ lọc có thể các thành phần thời gian dài bị ảnh hưởng, khi đó sự mô phỏng của chúng tốt hơn cả là “dừng lại” đối với sổ mã thích ứng. Sự đơn giản hoá thứ 2 của phân tích được thực hiện khi xác định các tham số của sổ mã. Nếu thay xác định đồng thời tham số sổ mã (thích ứng và cố định) để cực tiến hoá sai lệch. Ban đầu xác định trễ và hệ số khuếch đ ại AKK, khi đó cho rằng tín hiệu CKK bằng 0, còn sau đó khi có tín hi ệu AKK thì xác định tham số
  2. CKK. Cách giải quyết như vậy làm giảm độ phức tạp của các bộ mã hoá CELP đến mức chấp nhận được, tất nhiên dẫn đến làm giảm chất lượng tiếng nói tái tạo. Chúng ta xem xét sự ảnh hưởng của hai phương pháp đơn giản trên đến chất lượng tiếng nói tái tạo. Tối thiểu hóa sai lệch Hình 1. Sơ đồ mã hóa CELP II. TÍNH TOÁN THAM SỐ BỘ LỌC TỔNG HỢP Như nhận xét ở trên, đặc tính đơn giản của bộ lọc tổng hợp là đảo đối với đặc tính của bộ lọc dự đoán sai lệch. A(z) = 1 - 1z-1 - 2z-2 - .... - pz-p ĐT Bộ lọc này tối thiểu hoá năng lượng còn lại từ sự dự đoán tín hiệu tiếng nói vào  (h). Ở đây P là bậc của bộ lọc. Rõ ràng điều đó còn xa thực tế xác định tham số bộ lọc tổng hợp: vì vậy khi tín hiệu kích thích (h) được xác định, các hệ số của bộ lọc tổng hợp có thể đ ược tính toán kỹ với mục đích làm tăng tỉ số S/N của tiếng nói tái tạo. Chúng ta xem xét đến các phương pháp khác nhau khi tiến hành tối thiểu hoá. Một trong các phương pháp tối thiểu hoá, nó có thể đ ược đề nghị khi phân tích bộ mã hoá với kích thích nhiều xung điện gọi là lặp theo phương pháp bình phương bé nhất. Khi có tín hi ệu kích thích (h) và bộ hệ số bộ lọc α k = 1, 2, 3, …, P. Tín hi ệu tiếng nói tái tạo có thể đ ược tính toán với biểu thức   P  ( h )  U( h )    k ( h  k ) (1) k 1 Tối thiểu hoá E – năng lượng tín hiệu sai lệch  e(h) =  (h) -  (h) Theo chiều dài L đoạn tín hiệu - được thực hiện với sự trợ giúp của biểu thức.
  3. 2 L 1  λh   λh  ˆ E h 0 (2) 2 L 1 P   ˆ   λh   Uh   α k λh  k      h 0   k 1 Rõ ràng E phụ thuộc không chỉ vào hệ số bộ lọc, mà còn phụ thuộc vào tín hiệu tái tạo   (h), nó cũng phụ thuộc vào hệ số của bộ lọc và kết quả không thể nhận đ ược đạo hàm riêng E/i tiến đến “0” và nhận hệ thống P phương trình tuyến tính để xác định bộ hệ số tối ưu. Với mục đích đơn giản hoá phân tích chúng ta cho phép ˆ λh - k   λh  k  (3) Khi đó ta nhận được: 2 L 1 P    λh   Uh   α k λ h  k    (4) E   h 0   k 1 Bây giờ thực hiện đạo hàm E/i cho bằng 0. Đối với i = 1, 2,…, P có thể nhận được P phương trình tuyến tính, khi giải nó chúng ta nhận đ ược các hệ số lặp của bộ lọc. Cùng với điều đó sự ứng dụng phương pháp này có thể dẫn đ ến làm kém đi S/N. Nguyên nhân là do ta làm gần đúng ở phương trình (3). Để làm tốt hơn các S/N thành phần trong tiếng nói tái tạo, cần thiết trong mỗi đoạn xác định các tham số của bộ lọc, khi sử dụng các hệ số gốc, cũng như hệ số lặp ĐT và đưa ra những tham số từ các hệ số trên, nó bảo đảm S/N max. Tính toán tham số kích thích Để làm giảm độ phức tạp của bộ mã hoá, bộ lọc tín hiệu sai lệch (hình 1) thường được đưa  vào đ ể tín hiệu vào (h) và tín hiệu tái tạo  (h) xem xét riêng biệt trước khi tiến hành so sánh chúng và tính toán sai lệch, đối với bộ lọc tổng hợp với đặc tính H(z) = 1/A(z), ở đây A(z) = 1 - 1z-1 - 2z-2 - .... - pz-p, và bộ lọc tính toán tín hiệu sai lệch A(z)/A(z/) ở đây  là hằng số và thực tế bằng 0.9. Sự nối tầng đ ương nhiên được sử dụng bộ lọc tổng hợp tính toán 1/A(z/). Sai lệch trong trường hợp này   ew(h) = w(h) -  w(h) =  w(h) -  0(h) - G1u(h - )v(h) - G2 ek(h)v(h) (5)  ở đây  w(h) - tín hiệu vào,  o(h) - đáp ứng bộ lọc tổng hợp đối với giá trị vào của khoảng tín hiệu trước, v(h) - đặc tính xung của bộ lọc tổng hợp. Trong quá trình của trình tự tìm kiếm các giá trị hệ số khuếch đại xuất hiện G1 và trễ  đối với AKK, còn chỉ số k và hệ số khuếch đại G2 đối với CKK, nó đ ược tối thiếu hoá sai lệch bình phương trung bình Ew, nhận đ ược trong các khoảng tín hiệu có chiều dài H
  4. 1 H 2   λ h   Tαk   (6) Ew    H  n 0  ở đây Tk = 2 (G1 R + G2Rk - G1G2 Yk) - G12  G12 k (7) là đại lượng, tăng lên trong quá trình tìm kiếm trong sổ mã (có nghĩa giá trị lớn nhất Tk chỉ ra được bộ tham số của số mã). ˆ Uh    w h    0 h  - tín hiệu - dấu hiệu tìm kiếm 2 H 1  uh   vh  và  = - năng lượng tín hiệu lọc AKK h 0 H 1 R    u h u h   vh  (8) h 0 là sự tương quan tín hiệu lọc AKK và tín hiệu tìm kiếm U(h). Tương t ự k - là năng lượng tín hiệu lọc CKK,  ek(h) v(h), còn Rk - sự tương quan giữa tín hi ệu này và tín hiệu tìm kiếm. Ta có H 1 R k   u h   h e k ( h )( k ) (9) h 0 là tương quan giữa các tín hiệu lọc của 2 sổ mã. Ở phương pháp bình thường tìm kiếm tham số sổ mã trong (7) bắt đầu bằng giả thiết ĐT G2 = 0. Sau đó đối với giá trị số liệu đã cho  có thể xác định hệ số khuếch đại tối ưu G1, nếu đưa đ ến ‘0’ giá trị đạo hàm riêng Tk tương ứng G1, kết quả chúng ta tìm đ ược giá trị Tk đ ối với mỗi giá trị  và chọn giá trị trước đó nó tương ứng với giá trị lớn nhất Tk. Các tham số AKK cố định và trình tự tương tự diễn ra đối với việc xác định tham số CKK R và G2. Có thể đề xuất một vài phương pháp tối ưu như sau: Phương pháp A:  và k tìm được với sử dụng trình tự tìm kiếm bình thường, còn sau đó biểu thức được sử dụng để xác định giá trị tối ưu G1, G2 Phương pháp B: Đề xuất G2 = 0 trễ AKK  được xác định sau đó sử dụng giá trị này, thực hi ện tìm kiếm trong CKK, từ đó giá trị G1, G2 và k được xác định Phương pháp C: Các hệ số a, k, G1 và G2 được tính tương tự như phương pháp B, còn sau đó đối với k đã bi ết  đ ược lặp, nói cách khác, đối với khả năng có thể , G1, G2 và Tk được xác định và lựa chọn giá trị  như thế, nó tương ứng với giá trị lớn nhất Tk. Chúng ta tiến hành so sánh các phương p háp tính toán lại với sự tìm kiếm liên tiếp bình thường và với sự tìm kiếm mô phỏng đồng thời trong hai số mã. Nếu lấy đạo hàm riêng T k tương ứng với G1 và G2 cho đến 0, chúng ta nhận được hệ thống 2 phương trình, qua nó tìm được giá trị tối ưu của hệ số khuếch đại đối với trị số sổ mã đặt ra  và k R   k  R k R k G1  (10)  k  R 2k 
  5. R k    R  R k G2  (11) 2    k  R k Bảng 1. Đặc tính CELP Độ phức Phương pháp S/N tạp Liên tục tìm kiếm a,7 i A 10.10 1.02 B 10.3 1.3 C 10.6 1.4 Tìm kiếm đủ 10.8 60 Trình tự tìm kiếm đầy đủ, dự tính α, k, R, Rk và Rk đối với mỗi cặp trị số  và k, đ ể theo chúng tìm hệ số khuếch đ ại G1 và G2. Các hệ số khuếch đại này có thể sau đó đ ưa vào (7) để tính TR max. Tối thiểu hoá nó cần thiết để lựa chọn bộ chỉ số đúng. Khó khăn chính tìm ki ếm đầy đủ nảy sinh khi xác định sự t ương quan liên hệ RR đ ối với mỗi cặp chỉ số của sổ mã. Sử dụng sổ mã cố định. Cho phép đồng thời với k và Rk, xác định Rk hiệu quả hơn, khi sử dụng chỉ số trong 4 khung đặt ra. Theo bảng 1 trình bày đặc tính CELP đối với tốc độ 48kb/s các quan hệ S/N và độ phức tạp kéo theo đối với các phương pháp tìm kiếm khác nhau. Có thể nhìn thấy, tìm ki ếm đầy đủ đ ưa ra trội hơn theo chỉ số S/N khoảng 1dB so với tìm ki ếm liên tiếp, nhưng đ ộ phức tạp của nó cao hơn gấp 60 lần. Phương pháp C làm tăng đ ộ phức ĐT tạp của bộ mã hóa cỡ 40%, còn tỷ số S/N như của bộ mã hoá với tìm kiếm đầy đủ. Cuối cùng phương pháp A làm tăng tính phức tạp của bộ mã hoá lên 2% nhưng sự tăng S/N chỉ lên chút ít. III. KẾT LUẬN Chúng ta có thể đưa ra các phương pháp xác định các tham số và cấu trúc của bộ mã hoá tiếng nói CELP. Như trên đã phân tích việc lựa chọn các phương pháp có liên quan chặt chẽ đến chất lượng mã hoá tiếng nói, tái tạo tiếng nói, giá thành sản phẩm, những đánh giá này được dựa vào các phân tích và suy luận được trình bày ở phần trên của bài báo. Tài liệu tham khảo [1]. Bellami Đ. D, “Điện thoại số”, NXB Vô tuyến điện - thông tin liên lạc, 1986. [2]. Duain. G, “Điện thoại gọi”, NXB Vô tuyến điện - thông tin liên lạc,1988. [3]. Pintkuk, “Điện thoại IP”, NXB Vô tuyến điện - thông tin liên lạc, 2000. [4]. Smalko, “Mạng thông tin số”, NXB Vô tuyến điện - thông tin liên lạc, 2001. [5]. Oliphep, “Công nghệ và trang bị mạng IP mới”, NXB Vô tuyến điện - thông tin liên lạc, 2000. [6]. Selukhin O. I., “Gia công số và truyền tiếng nói”, NXB Vô tuyến điện - thông tin liên lạc, 2002. [7]. Lomakin, “IP- Telephone/ mobile system”,1999
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2