IT4772 X lý ngôn ng t nhiên
Vi n CNTT-TT, ĐHBKHN
2
Ch ng 5 H h i - đápươ
H h i – đáp
Chatbot
3
INFORMATION EXTRACTION
NATURAL LANGUAGE UNDERSTANDING
NATURAL LANGUAGE GENERATION
DATA + LINGUISTICS + MACHINE LEARNING
END-TO-END
APPLICATIONS
4
Ch ng 5 H h i – đápươ
H h i - đáp
Tr l i các câu h i d i d ng ngôn ng t ướ
nhiên
Siri, could you tell me where
can I find a husband who
just talk and give me money
whenever I want?
Uhm, let me think...
...
Maybe you should try
combining a cassette
and an ATM.
câu h i
câu tr l i
5
Ch ng 5 H h i – đápươ
H h i - đáp
Tiêu chí IR QA
Đu vàoCâu truy v n d i d ng t ướ
khóa
Câu h i
Yêu c uLiên quan Chính xác
Đu raCác văn b nCâu tr l i
6
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i đóng:
Ai?
Ai là tác gi c a cu n sách “Su i ngu n t i tr ”? ươ
Tác ph m “Su i ngu n t i tr ” do ai sáng tác? ươ
Ti u thuy t “Su i ngu n t i tr đc vi t b i nhà văn ế ươ ượ ế
nào?
Ai là ng i đu tiên d ch “Su i ngu n t i tr ” sang ti ng ườ ươ ế
Vi t?
7
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i đóng:
Bao gi ?
Bài hát “Ng i l i” đc vi t khi nào?ườ ơ ượ ế
Bài “Ng i l i” đc sáng tác năm nào?ườ ơ ượ
Tác ph m “Ng i l i” đc sáng tác vào th i đi m ườ ơ ượ
nào?
8
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i đóng
đâu?
Tuyên ngôn đc l p đc đc đâu? ượ
Tuyên ngôn đc l p đc vi t đâu? ượ ế
Đa đi m n ra Cách m ng tháng Tám đâu?
9
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i đóng
Bao nhiêu?
M t ngày c n u ng ít nh t bao nhiêu n c? ướ
L ng n c t i thi u ph i u ng m t ngày là bao nhiêu?ượ ướ
10
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i đóng
Đúng/sai, l a ch n
Có ph i M t tr i và các hành tinh quay xung quanh Trái
Đt không?
N u cùng lúc có tín hi u đi u khi n c a đèn báo và c nh ế
sát giao thông thì tuân theo cái nào?
Trong bài toán phân tích t lo i có nh t thi t ph i ti n ế ế
hành tách t không?
11
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i m
Đnh nghĩa
X lý ngôn ng t nhiên là gì?
NLP là gì?
Ngôn ng t nhiên là gì?
12
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i m
Gi i thích
T i sao tách t trong ti ng Vi t l i ph c t p h n ti ng ế ơ ế
Anh?
Vì sao t Trái đt không th quan sát đc toàn b b ượ
m t M t Trăng?
Do đâu gi i Nobel không có lĩnh v c Toán h c?
13
Ch ng 5 H h i – đápươ
H h i – đáp
Các lo i câu h i
Câu h i m
So sánh
Con voi và con ki n con nào n ng h n?ế ơ
Đng th ng và đng cong đng nào ng n h n?ườ ườ ườ ơ
S l ng dân đô th hay nông thôn nhi u h n? ượ ơ
14
Ch ng 5 H h i – đápươ
H h i – đáp
Cách ti p c n IRế
From Dan Jurafsky (2018)
15
Ch ng 5 H h i – đápươ
H h i – đáp
Cách ti p c n IRế
Phân lo i câu h i
Tìm lo i câu tr l i t ng ng v i câu h i ươ
Vd: “Ai là tri u phú?” PERSON
16
Ch ng 5 H h i – đápươ
H h i – đáp
Cách ti p c n IRế
Chu n hóa câu h i
Xóa b các t đ h i, t d ng
Chuy n sang d ng t khóa
Chuy n sang d ng câu kh ng đnh
17
Ch ng 5 H h i – đápươ
H h i – đáp
Cách ti p c n IRế
Tìm ki m văn b nế
S d ng n n t ng tìm ki m thông tin đ thu v các ế
văn b n liên quan đn câu truy v n ế
18
Ma tr n t - văn b n
From Information Retrieval by D. Manning et al. 2008
19
From Information Retrieval by D. Manning et al. 2008
20
Tf-idf
tf-idf(t,d) = tf(t,d) x idf(t)
idf(t) = log ( N / df(t) )