Statistical machine translation
-
Một ứng dụng dịch tự động (Machine Translation - MT) từ tiếng Việt sang tiếng dân tộc K’Ho được trình bày. Ứng dụng nhằm mục đích giới thiệu phương pháp dịch tự động dựa vào thống kê (Statistics Machine Translation - STMT). Do tiếng Việt và tiếng dân tộc K’Ho cùng ngữ hệ Nam Á, nhưng lại thuộc nhóm ngôn ngữ khác nhau, nên phần chuyển ngữ thường được xử lý bằng cách sử dụng từ vựng, cụm từ và câu, thay vì bằng quy tắc cú pháp tổng quát.
10p vidanh95 15-12-2018 75 4 Download
-
Lecture “Natural language processing – Chapter 5: Foundation of statistical machine translation” has contents: Introduction to statistical machine translation, statistical MT systems, three problems in statistical MT systems, translation model, and other contents.
12p dien_vi01 21-11-2018 21 0 Download
-
Trong bài báo này, ccác tác giả sẽ trình bày một phương pháp lai, kết hợp luật và thống kê, để dịch lại các UKW dạng thực thể có tên biểu thức số. Áp dụng phương pháp này vào trong hệ dịch thống kê Hoa-Việt, kết quả thử nghiệm cho thấy phương pháp của chúng tôi đã cải tiến đáng kể hiệu suất dịch máy thống kê Hoa-Việt.
12p binhminhmuatrenngondoithonggio 09-06-2017 74 3 Download
-
Bài báo đề xuất hướng tiếp cận dịch máy thống kê Pháp-Việt kết hợp thông tin phân đoạn ngữ cho cặp ngôn ngữ Pháp-Việt nhằm khắc phục hạn chế đối của hệ dịch với những câu dài. Tiến hành thử nghiệm mô hình hệ thống với kho ngữ liệu song ngữ Pháp-Việt gồm 10.000 cặp câu và kết quả độ đo BLEU tăng gần 2% so với mô hình cơ sở.
11p dieutringuyen 07-06-2017 85 3 Download
-
Hướng đến việc giải quyết bài toán thêm dấu tiếng việt theo mô hình dịch máy thống kê. Dịch máy bằng phương pháp thống kê (Statistical Machine Translation) là một hướng tiếp cận cho dịch máy.
45p chieuwindows23 01-06-2013 126 23 Download
-
In the past, we presented tutorials called “Introduction to Statistical Machine Translation”, aimed at people who know little or nothing about the field and want to get acquainted with the basic concepts. This tutorial, by contrast, goes more deeply into selected topics of intense current interest. We aim at two types of participants: 1. People who understand the basic idea of statistical machine translation and want to get a survey of hot-topic current research, in terms that they can understand. 2.
1p hongphan_1 15-04-2013 63 3 Download
-
We describe Joshua (Li et al., 2009a)1 , an open source toolkit for statistical machine translation. Joshua implements all of the algorithms required for translation via synchronous context free grammars (SCFGs): chart-parsing, n-gram language model integration, beam- and cubepruning, and k-best extraction. The toolkit also implements suffix-array grammar extraction and minimum error rate training. It uses parallel and distributed computing techniques for scalability.
4p hongphan_1 15-04-2013 46 2 Download
-
Research on a non-statistical scheme for the insertion of English articles in machine-translated Russian is described. Ideal article insertion as a goal is challenged as unreasonable. Classification of English nouns, simple syntactic criteria, and multiple printout are the scheme's main features.
0p nghetay_1 06-04-2013 61 3 Download
-
The general approach used at The RAND Corporation is that of convergence by successive refinements. The philosophy that underlies this approach is empirical. Statistical data are collected from careful translation of actual Russian text, analyzed, and used to improve the program.
8p nghetay_1 06-04-2013 53 1 Download