
IT4772 X lý ngôn ng t nhiênử ữ ự
Vi n CNTT-TT, ĐHBKHNệ
2
Ch ng 11 D ch máyươ ị
D ch máy th ng kêị ố
D ch máy d a trên mô hình kênh nhi uị ự ễ
3
INFORMATION EXTRACTION
NATURAL LANGUAGE UNDERSTANDING
NATURAL LANGUAGE GENERATION
DATA + LINGUISTICS + MACHINE LEARNING
END-TO-END
APPLICATIONS
4
Ch ng 11 D ch máyươ ị
D ch máy th ng kêị ố

5
Ch ng 11 D ch máyươ ị
D ch máy th ng kêị ố
●D ch m t câu t ngôn ng ngu n sang ngôn ị ộ ừ ữ ồ
ng đíchữ
●Y/c
–Gi đc ý nghĩa so v i ngôn ng ngu nữ ượ ớ ữ ồ
–Đm b o tính chính xác c a cú pháp v i ngôn ng ả ả ủ ớ ữ
đích
–Đm b o tính phù h p v i “văn hóa” trong ngôn ả ả ợ ớ
ng đíchữ
6
Ch ng 11 D ch máyươ ị
D ch máy th ng kêị ố
●Ph ng pháp d a trên mô hình kênh nhi uươ ự ễ
●Ph ng pháp d a trên cú phápươ ự
●Ph ng pháp d a trên c mươ ự ụ
7
Ch ng 11 D ch máyươ ị
D ch máy d a trên mô hình kênh nhi uị ự ễ
●e
1I
chu i các t trong ngôn ng đích eỗ ừ ữ
1
,e
2
..e
I
●f
1J
chu i các t trong ngôn ng ngu n fỗ ừ ữ ồ
1
,f
2
..f
j
8
Ch ng 11 D ch máyươ ị
D ch máy d a trên mô hình kênh nhi uị ự ễ
●Law of total probability

9
Ch ng 11 D ch máyươ ị
D ch máy d a trên mô hình kênh nhi uị ự ễ
mô hình ngôn ngữmô hình d chị
●Áp d ng đnh lu t Bayesụ ị ậ
10
Ch ng 11 D ch máyươ ị
D ch máy d a trên mô hình kênh nhi uị ự ễ
●Mô hình ngôn ngữ
11
Ch ng 11 D ch máyươ ị
D ch máy d a trên mô hình kênh nhi uị ự ễ
●Mô hình d chị
12
Ch ng 11 D ch máyươ ị
D ch máy d a trên mô hình kênh nhi uị ự ễ
●c l ng tham s :Ướ ượ ố
–Maximum likelihood estimation
–Expectaction maximization

13
Ch ng 11 D ch máyươ ị
D ch máy d a trên mô hình kênh nhi uị ự ễ
●Gi i mãả
14
Q&A
hieunk@soict.hust.edu.vn