Xử lý tiếng nói - Speech Synthesis for Vietnamese

Chia sẻ: Khinh Kha Kha | Ngày: | Loại File: PDF | Số trang:15

0
125
lượt xem
36
download

Xử lý tiếng nói - Speech Synthesis for Vietnamese

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tổng hợp tiếng nói tiếng Việt Ở Việt Nam, việc nghiên cứu trong lĩnh vực xử lý tiếng nói mới được phát triển trong thời gian gần đây Tổng hợp tiếng nói tiếng Việt chủ yếu dựa vào phương pháp ghép nối các đ vị â à h há hé ối á đơn ị âm Âm tiết tiếng Việt Âm tiết là đơn vị ngữ âm nhỏ nhất khi nói. Cho dù phát âm thật chậm, thật rõ ràng thì những âm thanh tiếng nói phát ra không thể chia nhỏ ra được nữa. Âm iế ó í h à Â tiết...

Chủ đề:
Lưu

Nội dung Text: Xử lý tiếng nói - Speech Synthesis for Vietnamese

  1. Bài 6: Tổng hợp tiếng nói tiếng Việt Ở Việt Nam, việc nghiên cứu trong lĩnh vực xử lý tiếng nói mới được phát triển trong thời gian gần đây Tổng hợp tiếng nói tiếng Việt chủ yếu dựa vào phương pháp ghép nối các đ vị â à h há hé ối á đơn ị âm
  2. Âm tiết tiếng Việt Âm tiết là đơn vị ngữ âm nhỏ nhất khi nói. Cho dù phát âm thật chậm, thật rõ ràng thì những âm thanh tiếng nói phát ra không thể chia nhỏ ra được nữa. Âm iế ó í h à Â tiết có tính toàn vẹn đ được tạo ra bởi một đợt căng của bộ máy phát âm Các Cá đợt căng nối tiếp nhau tạo thành một ă ối tiế h t thà h ột chuỗi âm tiết
  3. Đặc điểm âm tiết tiếng Việt Tính độc lập – Âm tiết tiếng Việt được thể hiện rõ ràng, riêng biệt với nhau. Trong tiếng Việt không có hiện tượng nối âm Có khả năng mang ý nghĩa – Hầu hết các âm tiết tiếng Việt đều mang ý nghĩa
  4. Âm tiết tiếng Việt có cấu trúc chặt chẽ. Mỗi âm tiết tiếng Việt ở dạng đầy đủ có 5 thành phần như sau: Thanh điệu Âm đầu Vần Âm đệm Âm chính Âm cuối
  5. Âm đầu: – Thường là phụ âm, có chức năng tạo ra âm sắc cho âm tiết lúc mở đầu. Â đầu có thể khuyết Âm ể trong một số trường hợp. Âm đệm: – Có chức năng làm thay đổi âm sắc của âm tiết lúc khởi đầu và làm p phân biệt âm tiết này với âm ệ y tiết khác. Âm đệm có thể khuyết trong một số trường hợp.
  6. Âm chính: – Luôn luôn có mặt trong mọi âm tiết, có chức năng quy định âm sắc chủ yếu của âm tiết. Âm chính ắ Â luôn luôn là nguyên âm Âm cuối: – Có thể là phụ âm hoặc bán nguyên âm, có chức năng là cơ sở p g phân chia loại hình âm tiết, để nhận ạ , ậ ra sự xuất hiện của thanh điệu Thanh điệu: – luôn có mặt trong âm tiết, có chức năng phân biệt âm tiết về cao độ
  7. Các g p p tổng hợp tiếng nói giải pháp g ợp g tiếng Việt Ghép tiếng nói từ những từ riêng lẻ Ghép tiếng nói p g từ những đơn âm cơ bản g Ghép tiếng nói theo hai phần: phụ âm đầu và phần vần Ghép tiếng nói từ các âm vị kép (diphone)
  8. Tổng hợp tiếng việt bằng cách g p nối g ợp g ệ g ghép các âm vị kép (diphone) Tiếng việt là ngôn ngữ đơn âm tiết, bất kỳ từ nào cũng có thể được tạo thành từ hai âm vị kép (diphone) ghép lại Ví dụ: – từ tôi có thể phân tích thành hai diphone “tô” và ể “ôi”
  9. Các bước thực hiện tổng hợp tiếng nói ự ệ g ợp g tiếng Việt 1. Thu âm và tạo cơ sở dữ liệu diphone 2. Phân tích văn bản, xác định các diphone , ị p cần sử dụng để tổng hợp 3. Ghép nối các diphone để tạo thành tiếng nói tương ứng 4. Làm trơn và biến đổi thanh điệu tiếng nói sau khi ghép nối
  10. Các diphone trong tiếng việt Mỗi từ trong tiếng việt có thể được tạo thành từ hai diphone Từ = diphone bắt đầu + diphone kết thúc – Ví dụ: bạn = ba + an + thanh điệu Diphone bắt đầu: một phụ âm đứng trước và tiếp theo là nguyên âm – Ví dụ: ba, kha Diphone kết thúc: một nhóm các nguyên âm đứng trước à tiế th â đứ t ướ và tiếp theo là phụ âm h â – Ví dụ: an, ương
  11. Theo thống kê, tổng số diphone cần có để tạo nên các từ trong tiếng việt là 389 diphone trong đó có 61 diphone kết thúc có dấu Xem bả phụ lục các di h X bảng h l á diphone tiếng việt iế iệ
  12. Xây dựng cơ sở dữ liệu diphone y ự g ệ p tiếng việt Thu âm các mẫu tiếng nói Tách các diphone từ mẫu tiếng nói p g Lưu trữ dạng sóng âm thanh của diphone vào cơ sở dữ liệu
  13. Tổng hợp tiếng nói bằng cách g p hai g ợp g g ghép phần: phụ âm đầu và phần vần Theo thống kê, trong tiếng Việt có 28 phụ âm làm âm đầu và 650 vần Xem bảng phụ lục các phụ âm đầu và vần trong tiếng Việt
  14. Xây dựng cơ sở dữ liệu p ụ âm đầu và y ự g ệ phụ phần vần Thu âm các mẫu tiếng nói Tách các phụ âm đầu và p p ụ phần vần từ mẫu tiếng nói Lưu trữ dạng sóng âm thanh của phụ âm đầu và phần vần vào cơ sở dữ liệu
  15. Các bước thực hiện tổng hợp tiếng nói ự ệ g ợp g tiếng Việt 1. Thu âm và tạo cơ sở dữ liệu phụ âm đầu và phần vần 2. Phân tích văn bản, xác định phụ âm đầu và vần tạo nên từ 3. Ghép nối phụ âm đầu và phần vần tương ứng trong CSDL để tạo thành tiếng nói tươ ứ tương ứng 4. Làm trơn và biến đổi thanh điệu tiếng nói sau khi ghép nối
Đồng bộ tài khoản