intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Hệ số MFCC

Xem 1-7 trên 7 kết quả Hệ số MFCC
  • Bài viết Thuật toán mạng nơron truyền thẳng đa lớp cho phân loại tiếng nói trong điều khiển xe lăn điện cho người tàn tật đề xuất một thuật toán mạng nơron truyền thẳng đa lớp (MLFNN) cho phân loại tiếng nói trong điều khiển xe lăn điện, trong đó trích dẫn đặc trưng của tín hiệu được thực hiện bằng phương pháp dựa vào hệ số phổ tần số Mel.

    pdf5p vijaguar 16-11-2022 11 3   Download

  • Bài viết mô hình nhận dạng mẫu từ đơn tiếng Việt được trình bày. Tiếng nói được trích đặc trưng bằng giải thuật MFCC (Mel-Frequency Cepstral Coefficients). Giải thuật thời gian động DTW (Dynamic Time Warping) được sử dụng để so sánh tiếng nói đầu vào với các mẫu thu sẵn, từ đó sẽ chọn ra được kết quả nhận dạng phù hợp nhất với tiếng nói phát ra. Mời các bạn cùng tham khảo!

    pdf6p wangziyi_1307 26-04-2022 26 2   Download

  • Bài viết bàn về thuật toán biến đổi FFT (Fast Fourier Transform) được áp dụng một cách rộng rãi trong nhiều ứng dụng khác nhau bao gồm phân tích phổ tín hiệu trong các hệ thống OFDM (Orthogonal Frequency Division Multi-plexing), trích đặc trưng âm thanh MFCC (Mel Frequency Cepstral Coefficients) trong hệ thống nhận dạng giọng nói hay trong các hệ thống xử lý số tín hiệu cần phân tích trên miền tần số nói chung. Mời các bạn cùng tham khảo!

    pdf5p wangziyi_1307 26-04-2022 41 5   Download

  • Bài viết trình bày một phương pháp phân lớp và định danh làn điệu Chèo và Quan họ sử dụng mô hình GMM (Gaussian Mixture Model) với tham số của mô hình là các hệ số MFCC (Mel Frequency Cepstral Coefficients) kết hợp với năng lượng. Kết quả cho thấy có sự phân lớp tương đối rõ ràng giữa hai loại hình dân ca này, trung bình tỷ lệ định danh đúng tăng theo số thành phần Gauss và rất khả quan.

    pdf9p vijihyo2711 25-09-2021 59 4   Download

  • Mục đích của Luận văn này tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, từ đó xây dựng ứng dụng nhận dạng một số từ, các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC. Ngoài ra, một số kỹ thuật khử nhiễu dữ liệu như CMS cũng được tích hợp để tăng tính hiệu quả của hệ thống. Các kỹ thuật nhận dạng giọng nói trong luận văn tập trung vào loại dữ liệu âm thanh tiếng Việt.

    pdf24p monsterhunterer 15-06-2021 35 5   Download

  • Luận văn tập trung nghiên cứu các kỹ thuật nhận dạng tiếng nói, từ đó xây dựng ứng dụng nhận dạng một số từ, các số và cụ thể là nhận dạng âm thanh và ứng dụng trong chuyển đổi âm thoại sang văn bản sử dụng mô hình Markov ẩn dựa trên các đặc trưng MFCC. Mời các bạn cùng tham khảo!

    pdf69p monsterhunterer 15-06-2021 40 5   Download

  • The overall performance of the systems is often limited by the accuracy of the underlying speech parameterization and reconstruction method. The method proposed in this paper allows accurate MFCC, F0 and tone extraction and high-quality reconstruction of speech signals assuming Mel Log Spectral Approximation filter. Its suitability for high-quality HMM-based speech synthesis is shown through evaluations subjectively.

    pdf11p binhminhmuatrenngondoithonggio 09-06-2017 149 17   Download

CHỦ ĐỀ BẠN MUỐN TÌM

ADSENSE

nocache searchPhinxDoc

 

Đồng bộ tài khoản
2=>2