intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 3 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)

Chia sẻ: Dien_vi10 Dien_vi10 | Ngày: | Loại File: PDF | Số trang:7

95
lượt xem
9
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Xử lý ngôn ngữ tự nhiên - Chương 3: Nhận dạng thực thể có tên" cung cấp cho người học các kiến thức: Thực thể có tên, hướng dẫn gán nhãn, phương pháp dựa trên máy học có giám sát. Mời các bạn cùng tham khảo nội dung chi tiết.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Xử lý ngôn ngữ tự nhiên: Chương 3 - Nguyễn Kiêm Hiếu (ĐH Bách khoa Hà Nội)

Chương 3 Nhận dạng thực thể có<br /> tên<br /> Thực thể có tên<br /> Hướng dẫn gán nhãn<br /> Phương pháp dựa trên học máy có giám sát<br /> IT4772 Xử lý ngôn ngữ tự nhiên<br /> Viện CNTT-TT, ĐHBKHN<br /> <br /> 2<br /> <br /> Thực thể có tên<br /> <br /> Chương 3 Nhận dạng thực thể có tên<br /> Thực thể có tên<br /> <br /> ●<br /> <br /> ●<br /> <br /> Thực thể: tất cả những thứ tồn tại m ột cách c ụ<br /> thể hoặc trừu tượng<br /> <br /> ●<br /> <br /> Vd:<br /> <br /> ●<br /> <br /> Các đối tượng vật lý hoặc trừu tượng có mang<br /> tên riêng<br /> Vd:<br /> <br /> –<br /> <br /> Thực thể vật lý: cây, giảng đường, Bphone<br /> <br /> –<br /> <br /> Hà nội<br /> <br /> –<br /> <br /> Thực thể phi vật lý: phương pháp<br /> <br /> –<br /> <br /> Đại học Bách khoa Hà nội<br /> <br /> –<br /> <br /> Thực thể sống: mèo, chó<br /> <br /> –<br /> <br /> IBM, Bitcoin, Cortana<br /> <br /> –<br /> <br /> Thực thể khác: rồng, lân, thiên đ ường, đ ịa ng ục<br /> <br /> 3<br /> <br /> 4<br /> <br /> Rigid-designator<br /> ●<br /> <br /> ●<br /> <br /> Chỉ đến cùng một thứ trong tất c ả các tr ường<br /> hợp khác nhau<br /> <br /> ●<br /> ●<br /> <br /> Ví dụ:<br /> –<br /> <br /> Hà nội là rigid-designator<br /> <br /> –<br /> <br /> “Thủ đô của Việt nam” là flaccid-designator<br /> <br /> “Lý Nam Đế” là một rigid-designator<br /> “Hoàng đế đầu tiên của Việt nam” không ph ải là<br /> một rigid-designator (?)<br /> <br /> 5<br /> <br /> 6<br /> <br /> Chương 3 Nhận dạng thực thể có tên<br /> Hướng dẫn gán nhãn<br /> INFORMATION EXTRACTION<br /> ●<br /> <br /> NATURAL LANGUAGE UNDERSTANDING<br /> <br /> END-TO-END<br /> APPLICATIONS<br /> <br /> NATURAL LANGUAGE GENERATION<br /> <br /> Các loại thực thể có tên phổ bi ến<br /> –<br /> <br /> Người<br /> <br /> –<br /> <br /> Tổ chức<br /> <br /> –<br /> <br /> Địa điểm<br /> <br /> –<br /> <br /> Sản phẩm<br /> <br /> –<br /> <br /> Thời gian<br /> <br /> DATA + LINGUISTICS + MACHINE LEARNING<br /> <br /> 7<br /> <br /> 8<br /> <br /> Người<br /> ●<br /> <br /> ●<br /> <br /> Chỉ người<br /> –<br /> <br /> Hồ Chí Minh, Donald Trump<br /> <br /> –<br /> <br /> Harry Porter<br /> <br /> ●<br /> <br /> Không lấy các danh xưng đi kèm (?)<br /> <br /> ●<br /> <br /> Ví dụ:<br /> <br /> Chỉ dòng họ<br /> –<br /> <br /> –<br /> <br /> Chủ tịch [Hồ Chí Minh]PER<br /> <br /> –<br /> <br /> President [Donald Trump]PER<br /> <br /> dòng họ [Nguyễn]PER<br /> <br /> 9<br /> <br /> 10<br /> <br /> Tổ chức<br /> ●<br /> <br /> ●<br /> <br /> Địa điểm<br /> <br /> Ví dụ:<br /> –<br /> <br /> Đại học Bách khoa Hà nội<br /> <br /> –<br /> <br /> Bộ môn Hệ thống Thông tin<br /> <br /> ●<br /> <br /> Đất nước<br /> –<br /> <br /> ●<br /> <br /> ‘Seagames’ không phải là một th ực th ể có tên<br /> mà là một sự kiện<br /> <br /> Thành phố, tỉnh<br /> –<br /> <br /> ●<br /> <br /> 11<br /> <br /> Hồ Chí Minh, Nghệ An<br /> <br /> Núi, sông, hồ<br /> –<br /> <br /> ●<br /> <br /> Việt Nam<br /> <br /> Trường Sơn, Tiền Giang<br /> <br /> Cơ sở vật chất: bệnh viện, trường đại h ọc<br /> <br /> 12<br /> <br /> ●<br /> <br /> Không lấy đơn vị đi kèm (?)<br /> <br /> ●<br /> <br /> Ví dụ<br /> –<br /> <br /> thủ đô [Hà nội]LOC<br /> <br /> –<br /> <br /> tỉnh [Quảng bình]LOC<br /> <br /> ●<br /> <br /> [Việt Nam]LOC giành thắng lợi trước [Qatar] LOC<br /> trên chấm phạt đền.<br /> <br /> 13<br /> <br /> 14<br /> <br /> Sản phẩm<br /> ●<br /> <br /> Hôm nay, [Apple]ORG ra mắt [Iphone 8]PRO<br /> <br /> ●<br /> <br /> [Viettel]ORG cung cấp dịch vụ [4G]PRO<br /> <br /> ●<br /> <br /> trợ lý ảo [Cortana]PRO của [Microsoft]ORG<br /> <br /> Thời gian<br /> ●<br /> <br /> 15<br /> <br /> [Hôm nay]DATE, [Apple]ORG ra mắt [Iphone 8]PRO<br /> <br /> 16<br /> <br /> Ví dụ 1<br /> <br /> Ví dụ 2<br /> <br /> - Kế hoạch gặp mặt giữa anh và ông Pierre Francois Flores trong ngày hôm<br /> nay 26/2 như thế nào?<br /> - Thông qua truyền thông, Pierre Francois Flores tuyên b ố mu ốn thách đ ấu<br /> với tôi. Sáng nay tôi có điện thoại thì phía võ s ư ng ười Canada nói đang ở<br /> sân bay rời Hà Nội.<br /> - Pierre Francois Flores muốn đấu để phục hận trận thua trong quá kh ứ,<br /> quan điểm của anh như thế nào?<br /> <br /> Khách mất 245 tỷ đồng tiền gửi tiết kiệm<br /> Lợi dụng lòng tin của khách hàng VIP, Phó giám đ ốc Eximbank chi nhánh<br /> TP HCM đã làm giả hồ sơ để chiếm đoạt 245 tỷ đồng tiền gửi ti ết ki ệm.<br /> Thông tin ban đầu cho biết, từ năm 2007, bà Bình - m ột ng ười có ti ếng<br /> trong kinh doanh thuỷ sản bắt đầu giao dịch g ửi ti ết ki ệm t ại chi nhánh TP<br /> HCM của Eximbank. Do bà gửi số tiền khá l ớn nên đ ược nhà băng này<br /> chăm sóc theo tiêu chuẩn khách hàng VIP.<br /> <br /> - Nếu là giao lưu võ thuật thì khác, gặp nhau lúc nào cũng đ ược. Còn thách<br /> đấu mang tính chất khác, có thắng có thua. Flores nói không xin đ ược gi ấy<br /> phép để đấu. Tôi nói luôn nếu cậu ấy nhất quy ết muốn, tôi s ẽ đ ứng ra xin<br /> giấy phép. Tôi là người Việt Nam, sống và làm việc tuân th ủ theo pháp lu ật,<br /> không thể đấu “chui”.<br /> <br /> Ông Lê Nguyên Hưng, Phó giám đốc chi nhánh này là ng ười tr ực ti ếp th ực<br /> hiện các giao dịch với bà Bình. Lợi dụng sự tin t ưởng c ủa bà Bình, ông<br /> Hưng nhiều lần cùng nhân viên của Eximbank đến nhà riêng của bà đ ể trình<br /> bày những khoản đã tất toán dựa theo kỳ hạn gửi.<br /> <br /> 17<br /> <br /> 18<br /> <br /> Ví dụ 1<br /> <br /> Ví dụ 2<br /> <br /> - Kế hoạch gặp mặt giữa anh và ông [Pierre Francois Flores]PER trong ngày<br /> hôm nay 26/2 như thế nào?<br /> - Thông qua truyền thông, [Pierre Francois Flores]PER tuyên bố muốn thách<br /> đấu với tôi. Sáng nay tôi có điện thoại thì phía võ s ư người [Canada]LOC nói<br /> đang ở sân bay rời [Hà Nội]LOC.<br /> - [Pierre Francois Flores]PER muốn đấu để phục hận trận thua trong quá khứ,<br /> quan điểm của anh như thế nào?<br /> - Nếu là giao lưu võ thuật thì khác, gặp nhau lúc nào cũng đ ược. Còn thách<br /> đấu mang tính chất khác, có thắng có thua. [Flores]PER nói không xin được<br /> giấy phép để đấu. Tôi nói luôn nếu cậu ấy nhất quy ết muốn, tôi s ẽ đ ứng ra<br /> xin giấy phép. Tôi là người [Việt Nam]LOC, sống và làm việc tuân thủ theo<br /> pháp luật, không thể đấu “chui”.<br /> 19<br /> <br /> Khách mất 245 tỷ đồng tiền gửi tiết kiệm<br /> Lợi dụng lòng tin của khách hàng VIP, Phó giám đ ốc [Eximbank]ORG chi<br /> nhánh [TP HCM]LOC đã làm giả hồ sơ để chiếm đoạt 245 tỷ đồng tiền gửi ti ết<br /> kiệm.<br /> Thông tin ban đầu cho biết, t ừ năm 2007, bà [Bình]PER - một người có tiếng<br /> trong kinh doanh thuỷ sản bắt đầu giao dịch gửi ti ết ki ệm t ại chi nhánh [TP<br /> HCM]LOC của [Eximbank]ORG. Do bà gửi số tiền khá lớn nên được nhà băng<br /> này chăm sóc theo tiêu chuẩn khách hàng VIP.<br /> Ông [Lê Nguyên Hưng]PER, Phó giám đốc chi nhánh này là người trực ti ếp<br /> thực hiện các giao dịch với bà [Bình]PER. Lợi dụng sự tin tưởng của bà<br /> [Bình]PER, ông [Hưng]PER nhiều lần cùng nhân viên của [Eximbank]ORG đến<br /> nhà riêng của bà để trình bày những khoản đã tất toán d ựa theo kỳ h ạn g ửi.<br /> 20<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2