intTypePromotion=3

Bài giảng xử lý tiếng nói part 8

Chia sẻ: Ashfjshd Askfaj | Ngày: | Loại File: PDF | Số trang:6

0
102
lượt xem
28
download

Bài giảng xử lý tiếng nói part 8

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tín hiệu tiếng nói được biểu diễn chính xác bởi các giá trị phổ trong một khung thời gian ngắn (short-term amplitude spectrum). Nhờ vậy ta có thể trích ra các đặc điểm tiếng nói từ những khoảng thời gian ngắn và dùng các đặc điểm này làm dữ liệu để nhận dạng tiếng nói. Nội dung của tiếng nói được biểu diễn dưới dạng chữ viết, là một dãy các ký hiệu ngữ âm. Do đó ý nghĩa của một phát âm được bảo toàn khi chúng ta phiên âm phát âm thành dãy các ký hiệu ngữ âm....

Chủ đề:
Lưu

Nội dung Text: Bài giảng xử lý tiếng nói part 8

  1. 3. M· ho¸ tiÕng nãi 3. M· 3. M· ho¸ tiÕng nãi D·y thao t¸c m· ho¸ vµ gi¶i m· NhiÔu, suy gi¶m, sai sè F1 AD M· ho¸ NhiÔu, suy gi¶m, sai sè Gi¶i m· DA F2 43
  2. 3. M· ho¸ tiÕng nãi Mét Mét sè tÝnh chÊt thèng kª cña tÝn tÝn hiÖu tiÕng nãi  MËt ®é x¸c suÊt N : sè l­îng mÉu x(n) cã biªn ®é trong kho¶ng [-/2, +/2] n[-N,...,N] x egodic vµ dõng px ( )  lim [ N /(2 N  1)] N    0 44
  3. 3. M· ho¸ tiÕng nãi  Gi¸ trÞ trung b×nh vµ ph­¬ng sai • Gi¸ trÞ trung b×nh cña tÝn hiÖu dõng  N 1 N x(n)  x    px ( ) d   lim N  2 N  1 n   víi tÝn hiÖu tiÕng nãi, gi¶ thiÕt x = 0 • Ph­¬ng sai  N 1  x    2 px ( ) d   lim 2 x 2 ( n) N N  2 N  1 n   45
  4. 3. M· ho¸ tiÕng nãi L­îng tö tøc thêi (kh«ng nhí) • LuËt l­îng tö y = Q(x) ®­îc ®Þnh nghÜa: (L+1) møc tÝn hiÖu x(0), x(1), ..., x(L) L møc l­îng tö ho¸ • Mçi møc l­îng tö ho¸ biÓu diÔn b»ng tõ b bit L = 2b. • Sai sè l­îng tö (t¹p ©m l­îng tö) e = Q(x) - x • B­íc l­îng tö : hiÖu 2 møc tÝn hiÖu kÒ nhau (i) = x(i)-x(i-1) • Th«ng l­îng I = bFs (bit/s). Fs : tÇn sè lÊy mÉu 46
  5. 3. M· ho¸ tiÕng nãi Thông lượng (1) • Tín hiệu lượng tử 8 bit (256 mức), Fs = 8 kHz Thông lượng = 64 kbit/s • Tín hiệu lượng tử 16 bit (65536 mức), Fs = 16 kHz Thông lượng = 256 kbit/s , 1 giờ tiếng nói  100 Mbyte • Cần phải mã hoá tín hiệu tiếng nói (MPEG, GSM, G723, ...) để truyền tiếng nói trên mạng hoặc lưu trữ 47
  6. 3. M· ho¸ tiÕng nãi Thông lượng (2) Dung lượng Tần số lấy Số bit cho Thông / phút Lĩnh vực mẫu (kHz) 1 mẫu luợng kbit/s (kbyte) 48 16 768 11520 Ghi âm chuyên nghiệp 44,1 16 705,6 10584 CD Audio 32 16 512 7680 Radio FM 22 8 264 3960 Radio AM 8 8 64 960 Điện thoại 48

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản