Hệ số MFCC

Xem 1-7 trên 7 kết quả Hệ số MFCC

Thuật toán mạng nơron truyền thẳng đa lớp cho phân loại tiếng nói trong điều khiển xe lăn điện cho người tàn tật

Bài viết Thuật toán mạng nơron truyền thẳng đa lớp cho phân loại tiếng nói trong điều khiển xe lăn điện cho người tàn tật đề xuất một thuật toán mạng nơron truyền thẳng đa lớp (MLFNN) cho phân loại tiếng nói trong điều khiển xe lăn điện, trong đó trích dẫn đặc trưng của tín hiệu được thực hiện bằng phương pháp dựa vào hệ số phổ tần số Mel.

5p vijaguar 16-11-2022 11 3 Download

Hệ thống nhúng nhận dạng tiếng nói tiếng Việt sử dụng Mel-Frequency Cepstral Coefficients và Dynamic Time Warping

Bài viết mô hình nhận dạng mẫu từ đơn tiếng Việt được trình bày. Tiếng nói được trích đặc trưng bằng giải thuật MFCC (Mel-Frequency Cepstral Coefficients). Giải thuật thời gian động DTW (Dynamic Time Warping) được sử dụng để so sánh tiếng nói đầu vào với các mẫu thu sẵn, từ đó sẽ chọn ra được kết quả nhận dạng phù hợp nhất với tiếng nói phát ra. Mời các bạn cùng tham khảo!

6p wangziyi_1307 26-04-2022 26 2 Download

Kiến trúc vi mạch FFT cơ số hai với số điểm linh động và độ chính xác cao với công nghệ 130nm

Bài viết bàn về thuật toán biến đổi FFT (Fast Fourier Transform) được áp dụng một cách rộng rãi trong nhiều ứng dụng khác nhau bao gồm phân tích phổ tín hiệu trong các hệ thống OFDM (Orthogonal Frequency Division Multi-plexing), trích đặc trưng âm thanh MFCC (Mel Frequency Cepstral Coefficients) trong hệ thống nhận dạng giọng nói hay trong các hệ thống xử lý số tín hiệu cần phân tích trên miền tần số nói chung. Mời các bạn cùng tham khảo!

5p wangziyi_1307 26-04-2022 41 5 Download
Phân lớp, định danh Chèo và Quan họ

Bài viết trình bày một phương pháp phân lớp và định danh làn điệu Chèo và Quan họ sử dụng mô hình GMM (Gaussian Mixture Model) với tham số của mô hình là các hệ số MFCC (Mel Frequency Cepstral Coefficients) kết hợp với năng lượng. Kết quả cho thấy có sự phân lớp tương đối rõ ràng giữa hai loại hình dân ca này, trung bình tỷ lệ định danh đúng tăng theo số thành phần Gauss và rất khả quan.

9p vijihyo2711 25-09-2021 59 4 Download
Tóm tắt Luận văn Thạc sĩ: Nghiên cứu về nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản

Mục đích của Luận văn này tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, từ đó xây dựng ứng dụng nhận dạng một số từ, các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC. Ngoài ra, một số kỹ thuật khử nhiễu dữ liệu như CMS cũng được tích hợp để tăng tính hiệu quả của hệ thống. Các kỹ thuật nhận dạng giọng nói trong luận văn tập trung vào loại dữ liệu âm thanh tiếng Việt.

24p monsterhunterer 15-06-2021 35 5 Download
Luận văn Thạc sĩ Kỹ thuật: Nghiên cứu về nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản

Luận văn tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, từ đó xây dựng ứng dụng nhận dạng một số từ, các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC. Mời các bạn cùng tham khảo!

69p monsterhunterer 15-06-2021 40 5 Download
Trích chọn các tham số đặc trưng tiếng nói cho hệ thống tổng hợp tiếng Việt dựa vào mô hình Markov ẩn

The overall performance of the systems is often limited by the accuracy of the underlying speech parameterization and reconstruction method. The method proposed in this paper allows accurate MFCC, F0 and tone extraction and high-quality reconstruction of speech signals assuming Mel Log Spectral Approximation filter. Its suitability for high-quality HMM-based speech synthesis is shown through evaluations subjectively.

11p binhminhmuatrenngondoithonggio 09-06-2017 149 17 Download

CHỦ ĐỀ BẠN MUỐN TÌM

TOP DOWNLOAD

CEO.29: Bộ Tài Liệu Hệ Thống Quản Trị Doanh Nghiệp

628 tài liệu

881 lượt tải

LV.26: Bộ 320 Luận Văn Thạc Sĩ Y Học

320 tài liệu

1248 lượt tải

FORM.07: Bộ 125+ Biểu Mẫu Báo Cáo Trong Doanh Nghiệp

125 tài liệu

898 lượt tải

Hệ số MFCC

Thuật toán mạng nơron truyền thẳng đa lớp cho phân loại tiếng nói trong điều khiển xe lăn điện cho người tàn tật

Hệ thống nhúng nhận dạng tiếng nói tiếng Việt sử dụng Mel-Frequency Cepstral Coefficients và Dynamic Time Warping

Kiến trúc vi mạch FFT cơ số hai với số điểm linh động và độ chính xác cao với công nghệ 130nm

Phân lớp, định danh Chèo và Quan họ

Tóm tắt Luận văn Thạc sĩ: Nghiên cứu về nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản

Luận văn Thạc sĩ Kỹ thuật: Nghiên cứu về nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản

Trích chọn các tham số đặc trưng tiếng nói cho hệ thống tổng hợp tiếng Việt dựa vào mô hình Markov ẩn

CHỦ ĐỀ BẠN MUỐN TÌM