Xử lý tiếng nói - Spoken Language System Architecture

Chia sẻ: Khinh Kha Kha | Ngày: | Loại File: PDF | Số trang:12

Thêm vào BST

Báo xấu

135
lượt xem 34
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Kiến trúc hệ thống ngôn ngữ nói Xử lý ngôn ngữ nói liên quan đến các kỹ thuật như: – Nhận dạng tiếng nói: chuyển nội dung tiếng nói thành văn bản tương ứng – Đọc nội dung văn bản: chuyển nội dung văn bản sang tiếng nói tương ứng – Hiểu ngôn ngữ nói: chuyển nội dung văn bản g g y ộ g thành hành động tương ứng để hệ thống thực hiện Bộ não của người nói quyết định dãy các từ cần nói W Tín hiệu nguồn được chuyển qua một kênh giao tiếp có nhiễu gồm bộ...

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Xử lý tiếng nói - Spoken Language System Architecture

Bài 3: Kiến trúc hệ thống ngôn ngữ nói Xử lý ngôn ngữ nói liên quan đến các kỹ thuật như: – Nhận dạng tiếng nói: chuyển nội dung tiếng nói thành văn bản tương ứng – Đọc nội dung văn bản: chuyển nội dung văn bản sang tiếng nói tương ứng – Hiểu ngôn ngữ nói: chuyển nội dung văn bản g g y ộ g thành hành động tương ứng để hệ thống thực hiện
Bộ não của người nói quyết định dãy các từ cần nói W Tín hiệu nguồn được chuyển qua một kênh giao tiếp có nhiễu gồm bộ máy phát âm để sinh ra sóng tiếng nói i h ó iế ói Bộ giải mã tiếng nói có nhiệm vụ giải mã tín hiệ â học X thành chuỗi từ W’ sao cho W’ hiệu âm h thà h h ỗi h gần giống nhất với chuỗi từ ban đầu W
Tự động nhận dạng tiếng nói
Một hệ thống nhận dạng tiếng nói thông thường trong thực tế bao gồm các thành phần: – Các mô hình ngữ âm: biểu diễn tri thức về ngữ âm âm vị, tác động của nhiễu, cách phát âm âm, vị nhiễu của nhiều người nói khác nhau – Các mô hình ngôn ngữ: bao gồm tri thức về các g g g thành phần cấu tạo nên từ ngữ, đặc điểm của từ ngữ
Bộ xử lý tín hiệu trích xuất các đặc điểm quan trọng cho bộ giải mã Bộ giải mã sử dụng cả mô hình ngữ âm và ngôn ngữ để sinh ra chuỗi các từ có khả năng đú nhất với các đặc điểm được đưa ă đúng hấ ới á đặ điể đ đ vào
Chuyển đổi văn bản thành tiếng nói Hệ thống chuyển văn bản thành tiếng nói (Text-to- (Text-to-Speech) là một hệ thống có thể sinh ra tiếng nói gần giống với con người từ các văn bản được đưa vào (còn được gọi là hệ thống tổng hợp tiếng nói) Sự chuyển đổi các từ dưới dạng viết sang tiếng nói là một công việc khó khăn vì hệ thống TTS cần dữ liệu từ vựng rất lớn và nhiều ngữ điệu của âm thanh
Các thành phần cơ bản của một hệ thống TTS Bộ phân tích văn bản: chuẩn hóa văn bản sang dạng thích hợp cho hệ thống TTS Bộ phân tích ngữ âm chuyển đổi văn bản đã được xử lý thành dãy các âm tương ứng sau đó đ được phân tích ngữ điệ để xác đị h hâ í h ữ điệu á định trọng âm, ngắt nhịp, thời gian, .. Cuối ù C ối cùng, bộ tổng hợp tiếng nói nhận các tổ hợ tiế ói hậ á tham số đầu vào từ dãy âm vị đã xử lý đầy đủ
Hệ thống hiểu ngôn ngữ nói Một hệ thống hiểu ngôn ngữ nói có khả năng hiểu được lời nói và thực hiện hành động tương ứng Hệ thống hiểu ngôn ngữ nói thông thường gồm bộ phận nhận d ồ hậ hậ dạng tiếng nói và bộ iế ói à phận tổng hợp tiếng nói Thành hầ hiê dị h â ói ó hứ Thà h phần phiên dịch câu nói có chức năng chuyển đổi kết quả nhận dạng tiếng nói sang dạng ngữ nghĩa được quy ước
Thành phần quản lý hội thoại có chức năng giao tiếp với các ứng dụng và các thành phần khác trong hệ thống