intTypePromotion=1

Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 3 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)

Chia sẻ: Dien_vi10 Dien_vi10 | Ngày: | Loại File: PDF | Số trang:7

0
26
lượt xem
6
download

Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 3 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Xử lý ngôn ngữ tự nhiên - Chương 3: Nhận dạng thực thể có tên" cung cấp cho người học các kiến thức: Thực thể có tên, hướng dẫn gán nhãn, phương pháp dựa trên máy học có giám sát. Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 3 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)

Chương 3 Nhận dạng thực thể có<br /> tên<br /> Thực thể có tên<br /> Hướng dẫn gán nhãn<br /> Phương pháp dựa trên học máy có giám sát<br /> IT4772 Xử lý ngôn ngữ tự nhiên<br /> Viện CNTT-TT, ĐHBKHN<br /> <br /> 2<br /> <br /> Thực thể có tên<br /> <br /> Chương 3 Nhận dạng thực thể có tên<br /> Thực thể có tên<br /> <br /> ●<br /> <br /> ●<br /> <br /> Thực thể: tất cả những thứ tồn tại m ột cách c ụ<br /> thể hoặc trừu tượng<br /> <br /> ●<br /> <br /> Vd:<br /> <br /> ●<br /> <br /> Các đối tượng vật lý hoặc trừu tượng có mang<br /> tên riêng<br /> Vd:<br /> <br /> –<br /> <br /> Thực thể vật lý: cây, giảng đường, Bphone<br /> <br /> –<br /> <br /> Hà nội<br /> <br /> –<br /> <br /> Thực thể phi vật lý: phương pháp<br /> <br /> –<br /> <br /> Đại học Bách khoa Hà nội<br /> <br /> –<br /> <br /> Thực thể sống: mèo, chó<br /> <br /> –<br /> <br /> IBM, Bitcoin, Cortana<br /> <br /> –<br /> <br /> Thực thể khác: rồng, lân, thiên đ ường, đ ịa ng ục<br /> <br /> 3<br /> <br /> 4<br /> <br /> Rigid-designator<br /> ●<br /> <br /> ●<br /> <br /> Chỉ đến cùng một thứ trong tất c ả các tr ường<br /> hợp khác nhau<br /> <br /> ●<br /> ●<br /> <br /> Ví dụ:<br /> –<br /> <br /> Hà nội là rigid-designator<br /> <br /> –<br /> <br /> “Thủ đô của Việt nam” là flaccid-designator<br /> <br /> “Lý Nam Đế” là một rigid-designator<br /> “Hoàng đế đầu tiên của Việt nam” không ph ải là<br /> một rigid-designator (?)<br /> <br /> 5<br /> <br /> 6<br /> <br /> Chương 3 Nhận dạng thực thể có tên<br /> Hướng dẫn gán nhãn<br /> INFORMATION EXTRACTION<br /> ●<br /> <br /> NATURAL LANGUAGE UNDERSTANDING<br /> <br /> END-TO-END<br /> APPLICATIONS<br /> <br /> NATURAL LANGUAGE GENERATION<br /> <br /> Các loại thực thể có tên phổ bi ến<br /> –<br /> <br /> Người<br /> <br /> –<br /> <br /> Tổ chức<br /> <br /> –<br /> <br /> Địa điểm<br /> <br /> –<br /> <br /> Sản phẩm<br /> <br /> –<br /> <br /> Thời gian<br /> <br /> DATA + LINGUISTICS + MACHINE LEARNING<br /> <br /> 7<br /> <br /> 8<br /> <br /> Người<br /> ●<br /> <br /> ●<br /> <br /> Chỉ người<br /> –<br /> <br /> Hồ Chí Minh, Donald Trump<br /> <br /> –<br /> <br /> Harry Porter<br /> <br /> ●<br /> <br /> Không lấy các danh xưng đi kèm (?)<br /> <br /> ●<br /> <br /> Ví dụ:<br /> <br /> Chỉ dòng họ<br /> –<br /> <br /> –<br /> <br /> Chủ tịch [Hồ Chí Minh]PER<br /> <br /> –<br /> <br /> President [Donald Trump]PER<br /> <br /> dòng họ [Nguyễn]PER<br /> <br /> 9<br /> <br /> 10<br /> <br /> Tổ chức<br /> ●<br /> <br /> ●<br /> <br /> Địa điểm<br /> <br /> Ví dụ:<br /> –<br /> <br /> Đại học Bách khoa Hà nội<br /> <br /> –<br /> <br /> Bộ môn Hệ thống Thông tin<br /> <br /> ●<br /> <br /> Đất nước<br /> –<br /> <br /> ●<br /> <br /> ‘Seagames’ không phải là một th ực th ể có tên<br /> mà là một sự kiện<br /> <br /> Thành phố, tỉnh<br /> –<br /> <br /> ●<br /> <br /> 11<br /> <br /> Hồ Chí Minh, Nghệ An<br /> <br /> Núi, sông, hồ<br /> –<br /> <br /> ●<br /> <br /> Việt Nam<br /> <br /> Trường Sơn, Tiền Giang<br /> <br /> Cơ sở vật chất: bệnh viện, trường đại h ọc<br /> <br /> 12<br /> <br /> ●<br /> <br /> Không lấy đơn vị đi kèm (?)<br /> <br /> ●<br /> <br /> Ví dụ<br /> –<br /> <br /> thủ đô [Hà nội]LOC<br /> <br /> –<br /> <br /> tỉnh [Quảng bình]LOC<br /> <br /> ●<br /> <br /> [Việt Nam]LOC giành thắng lợi trước [Qatar] LOC<br /> trên chấm phạt đền.<br /> <br /> 13<br /> <br /> 14<br /> <br /> Sản phẩm<br /> ●<br /> <br /> Hôm nay, [Apple]ORG ra mắt [Iphone 8]PRO<br /> <br /> ●<br /> <br /> [Viettel]ORG cung cấp dịch vụ [4G]PRO<br /> <br /> ●<br /> <br /> trợ lý ảo [Cortana]PRO của [Microsoft]ORG<br /> <br /> Thời gian<br /> ●<br /> <br /> 15<br /> <br /> [Hôm nay]DATE, [Apple]ORG ra mắt [Iphone 8]PRO<br /> <br /> 16<br /> <br /> Ví dụ 1<br /> <br /> Ví dụ 2<br /> <br /> - Kế hoạch gặp mặt giữa anh và ông Pierre Francois Flores trong ngày hôm<br /> nay 26/2 như thế nào?<br /> - Thông qua truyền thông, Pierre Francois Flores tuyên b ố mu ốn thách đ ấu<br /> với tôi. Sáng nay tôi có điện thoại thì phía võ s ư ng ười Canada nói đang ở<br /> sân bay rời Hà Nội.<br /> - Pierre Francois Flores muốn đấu để phục hận trận thua trong quá kh ứ,<br /> quan điểm của anh như thế nào?<br /> <br /> Khách mất 245 tỷ đồng tiền gửi tiết kiệm<br /> Lợi dụng lòng tin của khách hàng VIP, Phó giám đ ốc Eximbank chi nhánh<br /> TP HCM đã làm giả hồ sơ để chiếm đoạt 245 tỷ đồng tiền gửi ti ết ki ệm.<br /> Thông tin ban đầu cho biết, từ năm 2007, bà Bình - m ột ng ười có ti ếng<br /> trong kinh doanh thuỷ sản bắt đầu giao dịch g ửi ti ết ki ệm t ại chi nhánh TP<br /> HCM của Eximbank. Do bà gửi số tiền khá l ớn nên đ ược nhà băng này<br /> chăm sóc theo tiêu chuẩn khách hàng VIP.<br /> <br /> - Nếu là giao lưu võ thuật thì khác, gặp nhau lúc nào cũng đ ược. Còn thách<br /> đấu mang tính chất khác, có thắng có thua. Flores nói không xin đ ược gi ấy<br /> phép để đấu. Tôi nói luôn nếu cậu ấy nhất quy ết muốn, tôi s ẽ đ ứng ra xin<br /> giấy phép. Tôi là người Việt Nam, sống và làm việc tuân th ủ theo pháp lu ật,<br /> không thể đấu “chui”.<br /> <br /> Ông Lê Nguyên Hưng, Phó giám đốc chi nhánh này là ng ười tr ực ti ếp th ực<br /> hiện các giao dịch với bà Bình. Lợi dụng sự tin t ưởng c ủa bà Bình, ông<br /> Hưng nhiều lần cùng nhân viên của Eximbank đến nhà riêng của bà đ ể trình<br /> bày những khoản đã tất toán dựa theo kỳ hạn gửi.<br /> <br /> 17<br /> <br /> 18<br /> <br /> Ví dụ 1<br /> <br /> Ví dụ 2<br /> <br /> - Kế hoạch gặp mặt giữa anh và ông [Pierre Francois Flores]PER trong ngày<br /> hôm nay 26/2 như thế nào?<br /> - Thông qua truyền thông, [Pierre Francois Flores]PER tuyên bố muốn thách<br /> đấu với tôi. Sáng nay tôi có điện thoại thì phía võ s ư người [Canada]LOC nói<br /> đang ở sân bay rời [Hà Nội]LOC.<br /> - [Pierre Francois Flores]PER muốn đấu để phục hận trận thua trong quá khứ,<br /> quan điểm của anh như thế nào?<br /> - Nếu là giao lưu võ thuật thì khác, gặp nhau lúc nào cũng đ ược. Còn thách<br /> đấu mang tính chất khác, có thắng có thua. [Flores]PER nói không xin được<br /> giấy phép để đấu. Tôi nói luôn nếu cậu ấy nhất quy ết muốn, tôi s ẽ đ ứng ra<br /> xin giấy phép. Tôi là người [Việt Nam]LOC, sống và làm việc tuân thủ theo<br /> pháp luật, không thể đấu “chui”.<br /> 19<br /> <br /> Khách mất 245 tỷ đồng tiền gửi tiết kiệm<br /> Lợi dụng lòng tin của khách hàng VIP, Phó giám đ ốc [Eximbank]ORG chi<br /> nhánh [TP HCM]LOC đã làm giả hồ sơ để chiếm đoạt 245 tỷ đồng tiền gửi ti ết<br /> kiệm.<br /> Thông tin ban đầu cho biết, t ừ năm 2007, bà [Bình]PER - một người có tiếng<br /> trong kinh doanh thuỷ sản bắt đầu giao dịch gửi ti ết ki ệm t ại chi nhánh [TP<br /> HCM]LOC của [Eximbank]ORG. Do bà gửi số tiền khá lớn nên được nhà băng<br /> này chăm sóc theo tiêu chuẩn khách hàng VIP.<br /> Ông [Lê Nguyên Hưng]PER, Phó giám đốc chi nhánh này là người trực ti ếp<br /> thực hiện các giao dịch với bà [Bình]PER. Lợi dụng sự tin tưởng của bà<br /> [Bình]PER, ông [Hưng]PER nhiều lần cùng nhân viên của [Eximbank]ORG đến<br /> nhà riêng của bà để trình bày những khoản đã tất toán d ựa theo kỳ h ạn g ửi.<br /> 20<br /> <br />

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản