Giáo trình xử lý tiếng nói

Xem 1-20 trên 73 kết quả Giáo trình xử lý tiếng nói
  • Xử lý tiếng nói là sự nghiên cứu tiếng nói của con người dưới dạng tín hiệu, và các phương pháp xử lý những tín hiệu này. Tín hiệu tiếng nói thường được thể hiện dưới dạng số, tức là được "số hóa", và do đó xử lý tiếng nói có thể được coi là giao của xử lý tín hiệu số[1] và xử lý ngôn ngữ tự nhiên[2].

    pdf6p poseidon07 04-08-2011 174 68   Download

  • Xử lý tiếng nói ?  Xử lý thông tin chứa trong tín hiệu tiếng nói nhằm truyền, lưu trữ trữ tín hiệu này hoặc tổng hợp, nhận dạng tiếng nói.  Các nghiên cứu được tiến hành để xử lý tiếng nói yêu cầu những nhữ hiểu biết trên nhiều lĩnh vực ngày càng đa dạng: từ ngữ âm và ngôn ngữ ngữ ngữ học cho đến xử lý tín hiệu...

    pdf6p poseidon07 04-08-2011 135 58   Download

  • • Mã hoá một cách có hiệu quả tín hiệu tiếng nói để truyền và lu trữ tiếng nói. 1. Một số khái niệm cơ bản •Tổng hợp và nhận dạng tiếng nói tiến tới giao tiếp ngời- máy bằng tiếng nói. ?Tất cả các ứng dụng của xử lý tiếng nói đều cần phải dựa trên các kết quả của phân tích tiếng nói

    pdf60p 986753421 30-05-2012 128 51   Download

  • Công nghệ xử lý tín hiệu số là công nghệ bùng nổ nhanh chóng trong ngành công nghiệp điện tử và viễn thông hiện nay. Xử lý tín hiệu số có nhiều ứng dụng đa dạng, ví dụ như trong lĩnh vực điện tử y sinh, trong điều chỉnh động cơ diesel, xử lý thoại, các cuộc gọi điện thoại khoảng cách xa, xử lý tiếng nói, xử lý âm thanh, và tăng cường chất lượng hình ảnh và truyền hình. Các công nghệ nén MPEG hay WMV hiện nay đều dựa trên tiến bộ của công nghệ xử lý...

    pdf0p huemanvdoc 20-11-2009 2268 779   Download

  • Nhận dạng người nói: mục đích là để nhận ra người nói là ai và/hoặc là xác minh liệu người đang nói có đúng là người mà máy tính đã được biết trước hay không (tính xác thật của giọng nói). Tăng chất lượng tiếng nói: nhằm tăng sự cảm nhận của người nghe về chất lượng tiếng nói. Nó bao gồm: giảm nhiễu ồn của tín hiệu tiếng nói, giảm/khử tiếng vọng (trong kỹ thuật điện thoại), v.v...

    pdf6p poseidon07 04-08-2011 115 43   Download

  • Tổng hợp tiếng nói: là tạo ra tiếng nói một cách nhân tạo nhờ máy tính. Phân tích giọng nói:được ứng dụng chủ yếu trong y học, nhằm phát hiện ra khuyết tật hay vấn đề của dây thanh âm, thanh quản, v.v... Định vị nguồn âm thanh: xử lý tín hiệu tiếng nói để xác định vị trí của nguồn phát ra âm thanh (có thể là loa, người nói, v.v...).

    pdf6p poseidon07 04-08-2011 94 37   Download

  • Nhận dạng tiếng nói là một quá trình nhận dạng mẫu, với mục đích là phân lớp (classify) thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu đã được học trước đó và lưu trữ trong bộ nhớ. Các mẫu là các đơn vị nhận dạng, chúng có thể là các từ, hoặc các âm vị. Nếu các mẫu này là bất biến và không thay đổi thì công việc nhận dạng tiếng nói trở nên đơn giản bằng cách so sánh dữ liệu tiếng nói cần nhận dạng với các mẫu đã...

    pdf6p poseidon07 04-08-2011 72 32   Download

  • Khó khăn cơ bản của nhận dạng tiếng nói đó là tiếng nói luôn biến thiên theo thời gian và có sự khác biệt lớn giữa tiếng nói của những người nói khác nhau, tốc độ nói, ngữ cảnh và môi trường âm học khác nhau. Xác định những thông tin biến thiên nào của tiếng nói là có ích và những thông tin nào là không có ích đối với nhận dạng tiếng nói là rất quan trọng.

    pdf6p poseidon07 04-08-2011 57 29   Download

  • Tín hiệu tiếng nói được biểu diễn chính xác bởi các giá trị phổ trong một khung thời gian ngắn (short-term amplitude spectrum). Nhờ vậy ta có thể trích ra các đặc điểm tiếng nói từ những khoảng thời gian ngắn và dùng các đặc điểm này làm dữ liệu để nhận dạng tiếng nói. Nội dung của tiếng nói được biểu diễn dưới dạng chữ viết, là một dãy các ký hiệu ngữ âm.

    pdf6p poseidon07 04-08-2011 74 26   Download

  • Khi vị trí người nói trong hội nghị được xác định, máy ghi hình được lập trình sẽ tự động quay đến vị trí đó và gửi hình ảnh đi. Ngoài ra định vị nguồn âm thanh còn có ứng dụng trong các kỹ thuật tăng chất lượng tiếng nói, trong theo dõi an ninh, v.v...

    pdf6p poseidon07 04-08-2011 61 23   Download

  • 3. Mã hoá tiếng nói Tỷ số tớn hiệu trờn nhiễu N ăng lượng tín hiệu Ws SN   N ăng lượng nhiễu Wn SN dB  10 log 10 SN Mã hoá tiếng nói Tỷ số tớn hiệu trờn nhiễu Năng lượng Tớn hiệu = Nhiễu Tớn hiệu = 2 Nhiễu Tớn hiệu = 10 Nhiễu Tớn hiệu = 100 Nhiễu Tớn hiệu = 1000 Nhiễu Tớn hiệu = 10N Nhiễu SN (dB) 0 2 10 20 30 N x 10 57

    pdf6p poseidon07 04-08-2011 68 23   Download

  • Lượng tử đều • Tổng quát, bước lượng tử là hàm của biên độ tín hiệu x (lượng tử không đều) đơn giản nhất là lượng tử đều. • Mức lượng tử được chọn giữa 2 mức tín hiệu y(i) = (1/2)[x(i-1)+x(i)] • Luật lượng tử đều và đối xứng đặc trưng bởi: - các mức bão hoà xs - mức lượng tử L hoặc (L+1) = 2b.

    pdf6p poseidon07 04-08-2011 50 26   Download

  • Tiếng nói đóng vai trò rất quan trọng trong thông tin liên lạc. Quá trình truyền tín hiệu tiếng nói được truyền đi qua các phương tiện thông tin bị các loại nhiễu tác động nên chất lượng bị suy giảm. Vì vậy, các thuật toán Speech Enhancement và các kĩ thuật làm giảm nhiễu được ra đời. Trong bài Lab này ta sẽ đi nghiên cứu 2 thuật toán ước lượng phổ để khử nhiễu kinh điển là Spectral Subtraction [1] và Wiener Filter [2].

    pdf32p tuyethuong 05-01-2013 44 10   Download

  • Công nghệ xử lý tín hiệu số là công nghệ bùng nổ nhanh chóng trong ngành công nghiệp điện tử và viễn thông hiện nay. Xử lý tín hiệu số có nhiều ứng dụng đa dạng, ví dụ như trong lĩnh vực điện tử y sinh, trong điều chỉnh động cơ diesel, xử lý thoại, các cuộc gọi điện thoại khoảng cách xa, xử lý tiếng nói, xử lý âm thanh, và tăng cường chất lượng hình ảnh và truyền hình. Các công nghệ nén MPEG hay WMV hiện nay đều dựa trên tiến bộ của công nghệ xử lý...

    ppt153p nguyenducquang0903 10-05-2012 236 120   Download

  • Cùng nắm kiến thức trong giáo trình "Ô nhiễm tiếng ồn và kỹ thuật xử lý" thông qua việc tìm hiểu nội dung các chương sau: chương 1 tiếng ồn-loại ô nhiễm vô hình, chương 2 những khái niệm cơ bản của âm thanh, chương 3 truyền âm, chương 4 những loại hình của tiếng ồn, chương 5 chống tiếng ồn trong thành phố, chương 6 vật liệu và kết cấu hút ẩm, chương 7 cách âm cho các kết cấu nhà cửa, chương 8 chống tiếng ồn của các thiết bị và nhà công nghiệp.

    pdf137p hoaitan_ck 19-09-2014 182 108   Download

  • Quá trình tạo ra tín hiệu như vậy thường liên quan đến một hệ thống, hệ thống này đáp ứng lại một kích thích nào đó. Trong tín hiệu tiếng nói, hệ thống là hệ thống phát âm, gồm môi, răng, lưỡi, dây thanh... Kích thích liên quan đến hệ thống được gọi là nguồn tín hiệu (signal source). Như vậy ta có nguồn tiếng nói, nguồn ảnh và các nguồn tín hiệu khác.

    pdf6p cinny06 28-01-2011 73 30   Download

  • Nếu tín hiệu là hàm theo một biến, ta gọi đó là các tín hiệu một hướng (one-dimention signal), như tín hiệu tiếng nói, ECG, EEG. Ngược lại ta gọi là tín hiệu nhiều hướng (multidimention signal), ví dụ như tín hiệu ảnh trắng đen, mỗi điểm ảnh là hàm theo 2 biến độc lập.

    pdf5p cinny06 28-01-2011 55 10   Download

  • Tín hiệu liên tục (continuous-time signal) hay còn gọi là tín hiệu tương tự là tín hiệu được xác định tại tất cả các giá trị thời gian. Về mặt toán học, có thể mô tả tín hiệu này là hàm của một biến liên tục, ví dụ tín hiệu tiếng nói.

    pdf5p cinny06 28-01-2011 50 10   Download

  • Ta có thể dùng biến nguyên n thay cho biến thời gian rời rạc tn. Lúc này, tín hiệu trở thành một hàm theo biến nguyên, về mặt toán ta có thể biểu diễn tín hiệu rời rạc là một dãy số (thực hoặc phức). Ta sử dụng ký hiệu x(n) thay cho x(tn), nghĩa là tn = nT với T là hằng số- khoảng cách giữa hai thời điểm rời rạc cạnh nhau. Hình 1.3 là một ví dụ về tín hiệu tiếng nói rời rạc.

    pdf5p cinny06 28-01-2011 40 9   Download

  • Tất cả các tín hiệu đều do một nguồn nào đó tạo ra, theo một cách thức nào đó. Ví dụ tín hiệu tiếng nói được tạo ra bằng cách ép không khí đi qua dây thanh âm. Một bức ảnh có được bằng cách phơi sáng một tấm phim chụp một cảnh/ đối tượng nào đó.

    pdf6p cinny06 28-01-2011 50 8   Download

Đồng bộ tài khoản