thiết kế hệ thống trả lời tự động, chương 7

Chia sẻ: Nguyen Van Dau | Ngày: | Loại File: PDF | Số trang:10

0
120
lượt xem
40
download

thiết kế hệ thống trả lời tự động, chương 7

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Mô hình thiết kế TAPI được chia làm 2 lĩnh vực, mỗi lĩnh vực có các lời gọi TAPI khác nhau tuỳ thuộc vào thiết bị mà từng lĩnh vực sủ dụng: + Các thiết bị đường truyền (Line Devices) : Là mô hình sử dụng đường truyền vật lý điện thoại để gửi và nhận tiếng nói (voice) và dữ liệu giữa 2 địa điểm. + Các thiết bị điện thoại (Phone Devices) : Là mô hình để thực hiện và nhận cuộc các gọi. Lines Trong TAPI, các thiết bị đường truyền thực chất không phải là một...

Chủ đề:
Lưu

Nội dung Text: thiết kế hệ thống trả lời tự động, chương 7

  1. Chương 7: Mô hình thiết kế của TAPI Mô hình thiết kế TAPI ñược chia làm 2 lĩnh vực, mỗi lĩnh vực có các
  2. lời gọi TAPI khác nhau tuỳ thuộc vào thiết bị mà từng lĩnh vực sủ dụng: + Các thiết bị ñường truyền (Line Devices) : Là mô hình sử dụng ñường truyền vật lý ñiện thoại ñể gửi và nhận tiếng nói (voice) và dữ liệu giữa 2 ñịa ñiểm. + Các thiết bị ñiện thoại (Phone Devices) : Là mô hình ñể thực hiện và nhận cuộc các gọi. Lines Trong TAPI, các thiết bị ñường truyền thực chất không phải là một ñường dây vật lý. Nó như là một ñối tượng ñại diện cho 1 ñường dây vật lý. Trong các hàm TAPI, một chương trình có thể nắm giữ nhiều thiết bị ñường truyền, mỗi thiết bị ñường truyền này kết nối tới một ñường dây vật lý. Ví dụ như một chương trình TAPI có thể ñược thiết kế ñể cung cấp voice (gọi ñiện thoại), fax, và liên kết dữ liệu cho người sủ dụng. Ứng dụng sẽ ñịnh danh 3 thiết bị ñường truyền. Một là ñể cho voice, một ñể truyền dẫn fax, một là ñể gửi và nhận dữ liệu thông qua một modem. Nếu PC chỉ có một ñường truyền ñiện thoại vật lý, ứng dụng TAPI sẽ chia sẻ ñường tryền này cho cả 3 thiết bị ñường truyền. ðiều này ñược gọi là qui hoạch ñộng ñường truyền (dynamic line mapping).
  3. Hình 2. 2: Mô hình của TAPI Vào mỗi thời ñiểm, ứng dụng TAPI sẽ khởi ñộng một thiết bị ñường truyền, nó sẽ yêu cầu ñường truyền vật lý. Nếu ñường truyền vật lý chưa sẵn sàng, một thông báo sẽ ñược gửi trả về. Trong một số trường hợp, ví dụ như truyền dẫn fax, ứng dụng có thể “xếp hàng” các yêu cầu ñể xử lý dần dần. Nếu có 2 ñường truyền sẵn sàng, TAPI sẽ ñiều khiển chúng như chúng yêu cầu. Nếu thiết bị ñường truyền thứ 3 lúc này cũng gửi yêu cầu thì ứng dụng TAPI sẽ nhận biết rằng không còn ñường truyền nào rỗi và sẽ thông báo cho người sử dụng biết. Phone Mô hình này cho phép người lập trình dễ dàng tạo ra các “máy ñiện thoại ảo”. Ví dụ như 1 PC với 1 sound card, loa, và microphone có thể thực hiện ñược tất cả các chức năng của một ñiện thoại ñể bàn. Những “ñiện thoại ảo” này cũng giống như các thiết bị ñường truyền, tức là không cần có sự tương quan 1-1 với ñường truyền vật lý. Một PC có thể có nhiều thiết bị ñiện thoại, mỗi thiết bị ñiện thoại có ñặc ñiểm riêng. Khi “1 cuộc gọi thực sự” ñược yêu cầu, người sủ dụng có thể lựa chọn một trong các thiết bị ñiện thoại, gõ số ñiện thoại và sau ñó ứng dụng TAPI sẽ gán thiết bị ñiện thoại với một thiết bị ñường truyền sẵn có(sẵn sàng). 2. 1. 7. Cấu trúc các lớp của TAPI.
  4. Cấu trúc lớp của TAPI ñược gói gọn trong 5 phần : LineApp, Line, Call, PhoneApp, Phone. Chúng ñược mô tả như hình vẽ dưới ñây:
  5. Hình 2. 3: Cấu trúc các lớp Của TAPI 2. 2 Công nghệ tổng hợp giọng nói. 2. 2. 1 Lịch sử. Từ lâu trước khi kỹ thuật xử lý tín hiệu bằng thiết bị ñiện tử hiện ñại ra ñời, các nhà nghiên cứu giọng nói ñã cố gắng xây dựng các máy móc bắt chước giọng nói của người. Các ví dụ ñầu tiên của các máy này ñược chế tạo bởi Gerbert ở Aurillac (1003, Albertus Magnus(1198–1280), và Roger Bacon (1214–1294). Năm 1779, nhà khoa học người ðan Mạch Christian Kratzenstein, lúc ñó làm việc tại Viện Hàn lâm Khoa học Nga, xây dựng một mô hình có thể bắt chước giọng nói người với năm nguyên âm ([a], [e], [I], [o] và [u]). Năm 1961, nhà vật lý học John Larry Kelly, Jr dùng máy tính IBM 704 ñể tổng hợp giọng nói, ñây là sự kiện ñáng nhớ trong lịch sử của phòng thí nghiệm Bell. Máy ghi âm và tổng hợp giọng nói của Kelly tạo ra bài hát Daisy Bell, với âm nhạc phụ họa bởi Max Mathews. Vào lúc trình diễn, Arthur C. Clarke ñang thăm Ta
  6. và ñồng nghiệp John Pierce ở khu thí nghiệm Bell ở Murray Hill. Clarke ñã bị ấn tượng mạnh bởi trình diễn của máy phát âm và ñã dùng hình ảnh này trong tiểu thuyết và kịch bản phim của ông 2001: A Space Odyssey, [1] trong ñó máy tính HAL 9000 hát cùng bài hát khi nó
  7. sắp bị nhà du hành vũ trụ Dave Bowman ñặt vào trạng thái ngủ. [2] Công nghệ tổng hợp giọng nói ñã tiến hóa nhanh kể từ ñó. Hiện nay có hàng trăm hệ thống tổng hợp giọng nói, thương mại cũng như tự do (xem liên kết ngoài). Tuy ñã ñạt ñược thành tựu trong tổng hợp giọng nói bằng kỹ thuật ñiện tử, các nghiên cứu vẫn ñang ñược tiến hành ñể tạo ra bộ tổng hợp giọng nói cơ học, mô phỏng thanh quản của người, dùng trong robot dạng người. Các bộ tổng hợp giọng nói ñiện tử bị giới hạn bởi chất lượng của loa, bộ phận cuối cùng tạo ra âm thanh, dù tín hiệu ñiện tử có hoàn hảo. Có hy vọng rằng bộ thanh quản cơ khí có thể tạo ra giọng nói chuẩn hơn loa thông thường. 2. 2. 2 Khái Niệm. Trên máy tính, tổng hợp giọng nói là việc tạo ra giọng nói của người từ ñầu vào là văn bản hay các mã hóa việc phát âm. Hệ thống thực hiện việc này còn gọi là máy tổng hợp giọng nói, có thể là hệ thống phần mềm hoặc phần cứng. Hệ thống này còn ñược gọi là văn bản-sang-tiếng nói (text-to-speech, TTS); tuy rằng không phải hệ thống tổng hợp giọng nói nào cũng có ñầu vào là văn bản (nhiều hệ thống thu nhận mã hóa cách phát âm, ví dụ mã IPA, như ñầu vào). Các hệ thống này có nhiều ứng dụng. Ví dụ như hệ thống này có thể giúp người khiếm thị nghe ñược máy ñọc ra văn bản; ñặc biệt là các văn bản có thể xử lý trên máy tính. Hệ thống như vậy có thể lắp ñặt trong phần mềm xử lý văn bản hay trình duyệt mạng.
  8. Hình 2.4 Mô hình hệ thống mã hóa giọng nói. 2. 2. 3. Tổng quan.
  9. Một máy tổng hợp giọng nói bao gồm hai phần: ngoại diện và hậu trường. Phần ngoại diện nhận ñầu vào ở dạng văn bản rồi cho ñầu ra là thể hiện biểu tượng ngôn ngữ của văn bản (tức là một cách mã hóa cách phát âm văn bản). Phần hậu trường nhận lấy thể hiện biểu tượng ngôn ngữ như ñầu vào và cho ra giọng nói tổng hợp ở dạng sóng âm thanh. Phần ngoại diện có hai nhiệm vụ chính. Trước tiên, nó nhận văn bản và chuyển ñổi các ký tự như các chữ số hay cách viết tắt thành dạng viết ñầy ñủ. Quá trình này gọi là chuẩn hóa văn bản, hay tiền xử lý. Sau ñó nó cho ra mã phát âm ứng với từng từ, rồi phân chia và ñánh dấu văn bản thành từng ñoạn văn, nhóm từ, mệnh ñề, hay câu văn. Quá trình chuyển văn bản sang mã phát âm ñược gọi là văn bản-sang-âm vị. Kết hợp mã phát âm và thông tin ñoạn văn tạo nên ñầu ra cuối cùng thể hiện biểu tượng ngôn ngữ. Phần hậu trường, nhận lấy thể hiện biểu tượng ngôn ngữ rồi chuyển nó thành âm thanh. Phần này thường ñược gọi là máy tổng hợp. Có nhiều kỹ thuật tổng hợp, ñược mô tả bên dưới.
Đồng bộ tài khoản