intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn thạc sĩ: Nghiên cứu kỹ thuật nhận dạng tiếng nói tiếng Việt và ứng dụng

Chia sẻ: Viet Ha Linh | Ngày: | Loại File: PDF | Số trang:81

164
lượt xem
44
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Xây dựng hệ thống nhận dạng tiếng nói tiếng Việt dựa trên kỹ thuật sử dụng mạng nơron MLP (trên môi trường Matlab). Hệ thống có thể vừa nhận dạng trực tuyến (thu âm trực tiếp và nhận dạng) hoặc nhận dạng từ tệp âm thanh có sẵn. Ứng dụng của hệ thống là đọc điểm và kết quả là điểm số sẽ được xuất sang bảng điểm trên Excel.

Chủ đề:
Lưu

Nội dung Text: Luận văn thạc sĩ: Nghiên cứu kỹ thuật nhận dạng tiếng nói tiếng Việt và ứng dụng

BỘ GIÁO DỤC VÀ ĐÀO TẠO<br /> <br /> BỘ QUỐC PHÒNG<br /> <br /> HỌC VIỆN KỸ THUẬT QUÂN SỰ<br /> <br /> NGÔ VĂN CƯƠNG<br /> <br /> NGHIÊN CỨU KỸ THUẬT NHẬN DẠNG TIẾNG NÓI<br /> TIẾNG VIỆT VÀ ỨNG DỤNG<br /> Chuyên ngành: Hệ thống thông tin<br /> Mã số: 60 48 01 04<br /> <br /> LUẬN VĂN THẠC SĨ KỸ THUẬT<br /> <br /> Hà Nội - Năm 2015<br /> <br /> CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI<br /> HỌC VIỆN KỸ THUẬT QUÂN SỰ<br /> <br /> Cán bộ hướng dẫn chính: PGS.TS. Bùi Thế Hồng<br /> <br /> Cán bộ chấm phản biện 1: TS. Trần Nguyên Ngọc<br /> <br /> Cán bộ chấm phản biện 2: TS. Trần Thị Thu Hà<br /> <br /> Luận văn thạc sĩ được bảo vệ tại:<br /> HỘI ĐỒNG CHẤM LUẬN VĂN THẠC SĨ<br /> HỌC VIỆN KỸ THUẬT QUÂN SỰ<br /> Ngày tháng năm 2015<br /> <br /> Tôi xin cam đoan:<br /> Những kết quả nghiên cứu được trình bày trong luận văn là hoàn toàn<br /> trung thực, của tôi, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và<br /> pháp luật Việt Nam. Nếu sai, tôi hoàn toàn chịu trách nhiệm trước pháp luật.<br /> TÁC GIẢ LUẬN VĂN<br /> <br /> Ngô Văn Cương<br /> <br /> MỤC LỤC<br /> Trang<br /> Trang phụ bìa<br /> Bản cam đoan<br /> Mục lục<br /> Các thuật ngữ viết tắt<br /> Mở đầu ......................................................................................................... 1<br /> Chương 1<br /> CƠ SỞ LÝ THUYẾT XỬ LÝ TIẾNG NÓI<br /> 1.1. Lý thuyết âm thanh và tiếng nói .............................................................. 5<br /> 1.1.1. Nguồn gốc âm thanh:............................................................................ 5<br /> 1.1.2. Các đại lượng đặc trưng cho âm thanh:................................................. 5<br /> 1.1.2.1. Tần số của âm thanh: ......................................................................... 5<br /> 1.1.2.2. Chu kì của âm thanh: ......................................................................... 5<br /> 1.1.2.3. Tốc độ truyền âm: .............................................................................. 5<br /> 1.1.2.4. Cường độ âm thanh: ......................................................................... 5<br /> 1.1.2.5. Thanh áp:.......................................................................................... 6<br /> 1.1.2.6. Âm sắc: ............................................................................................ 6<br /> 1.1.2.7. Âm lượng: ........................................................................................ 6<br /> 1.1.3. Các tần số của âm thanh: ...................................................................... 6<br /> 1.1.4. Cơ chế tạo lập tiếng nói của con người: ................................................ 6<br /> 1.1.5. Mô hình lọc nguồn tạo tiếng nói: .......................................................... 7<br /> 1.1.6. Hệ thống nghe của người: ..................................................................... 8<br /> 1.1.7. Quá trình sản xuất tiếng nói và thu nhận tiếng nói: ............................... 9<br /> 1.1.8. Các âm thanh tiếng nói và các đặc trưng:............................................ 10<br /> 1.1.8.1. Nguyên âm: ..................................................................................... 10<br /> 1.1.8.2. Các âm vị khác: ............................................................................... 10<br /> 1.2. Giới thiệu về xử lý tiếng nói .................................................................. 11<br /> <br /> 1.3. Nhận dạng tiếng nói .............................................................................. 12<br /> 1.3.1. Bài toán nhận dạng tiếng nói .............................................................. 12<br /> 1.3.2. Các phương pháp nhận dạng tiếng nói ................................................ 14<br /> 1.3.2.1. Phương pháp âm học ngữ âm học .................................................... 14<br /> 1.3.2.2. Phương pháp nhận dạng mẫu .......................................................... 16<br /> 1.3.2.3. Phương pháp ứng dụng trí tuệ nhân tạo........................................... 18<br /> 1.4. Nhận dạng tiếng Việt ............................................................................. 19<br /> 1.4.1. Một số đặc điểm ngữ âm tiếng Việt .................................................... 19<br /> 1.4.2. Những thuận lợi và khó khăn đối với nhận dạng tiếng Việt ................ 20<br /> 1.4.2.1. Thuận lợi ......................................................................................... 20<br /> 1.4.2.2. Khó khăn ......................................................................................... 20<br /> <br /> Chương 2<br /> MÔ HÌNH NHẬN DẠNG TIẾNG NÓI<br /> 2.1. Các kiểu mô hình mạng nơron ............................................................... 22<br /> 2.1.1. Perceptron .......................................................................................... 24<br /> 2.1.2. Mạng nhiều tầng truyền thẳng (MLP)<br /> <br /> 25<br /> <br /> 2.2. Huấn luyện mạng nơron ........................................................................ 26<br /> 2.2.1. Các phương pháp học<br /> <br /> 26<br /> <br /> 2.2.2. Học có giám sát trong các mạng nơron ............................................... 28<br /> 2.2.3. Thuật toán lan truyền ngược ............................................................... 29<br /> 2.3. Các vấn đề trong xây dựng mạng MLP.................................................. 30<br /> 2.3.1. Chuẩn bị dữ liệu ................................................................................. 30<br /> 2.3.1.1. Kích thước mẫu ............................................................................... 30<br /> 2.3.1.2. Mẫu con........................................................................................... 32<br /> 2.3.2. Xác định các tham số cho mạng.......................................................... 32<br /> 2.3.2.1. Chọn hàm truyền ............................................................................. 32<br /> 2.3.2.2. Xác định số nơron tầng ẩn ............................................................... 33<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2