ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
TRẦN MAI VŨ<br />
<br />
NGHIÊN CỨU NHẬN DẠNG THỰC THỂ CÓ TÊN<br />
VÀ THỰC THỂ BIỂU HIỆN TRONG VĂN BẢN VÀ ỨNG DỤNG<br />
<br />
LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN<br />
<br />
Hà Nội – 2018<br />
<br />
ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
TRẦN MAI VŨ<br />
<br />
NGHIÊN CỨU NHẬN DẠNG THỰC THỂ CÓ TÊN<br />
VÀ THỰC THỂ BIỂU HIỆN TRONG VĂN BẢN VÀ ỨNG DỤNG<br />
<br />
Chuyên ngành: Hệ thống thông tin<br />
Mã số: 62.48.05.01<br />
LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN<br />
<br />
NGƯỜI HƯỚNG DẪN KHOA HỌC:<br />
1. PGS.TS. Hà Quang Thụy<br />
2. PGS.TS. Nguyễn Lê Minh<br />
<br />
Hà Nội – 2018<br />
<br />
LỜI CAM ĐOAN<br />
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các kết quả được<br />
viết chung với các tác giả khác đều được sự đồng ý của các đồng tác giả trước khi<br />
đưa vào luận án. Các kết quả nêu trong luận án là trung thực và chưa từng được<br />
công bố trong các công trình nào khác.<br />
Tác giả<br />
<br />
Trần Mai Vũ<br />
<br />
1<br />
<br />
LỜI CẢM ƠN<br />
Luận án được thực hiện tại Bộ môn Hệ thống thông tin - Khoa Công nghệ<br />
thông tin - Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, dưới sự hướng<br />
dẫn khoa học của PGS.TS. Hà Quang Thụy và PGS.TS. Nguyễn Lê Minh.<br />
Trước tiên tôi xin bày tỏ lòng biết ơn sâu sắc tới thầy PGS.TS. Hà Quang<br />
Thụy và PGS.TS. Nguyễn Lê Minh, những người đã đưa tôi đến với lĩnh vực<br />
nghiên cứu này. Các thầy đã tận tình giảng dạy, hướng dẫn giúp tôi tiếp cận và đạt<br />
được thành công trong công việc nghiên cứu của mình. Các thầy đã luôn tận tâm<br />
động viên, khuyến khích và chỉ dẫn giúp tôi hoàn thành được bản luận án này.<br />
Tôi xin bày tỏ lòng biết ơn tới các Thầy Cô thuộc Khoa Công nghệ thông tin<br />
và cán bộ Phòng Đào tạo - Trường Đại học Công nghệ, đã tạo mọi điều kiện thuận<br />
lợi giúp đỡ tôi trong quá trình học tập và nghiên cứu tại trường.<br />
Tôi xin cảm ơn PGS. TS. Nigel Collier và cộng sự đã đóng góp ý kiến quý báu<br />
giúp tôi hoàn thiện bản luận án.<br />
Sự động viên, cổ vũ của bạn bè là nguồn động lực quan trọng để tôi hoàn<br />
thành luận án. Tôi xin bày tỏ lòng biết ơn sâu sắc tới gia đình, vợ và các con tôi đã<br />
tạo điểm tựa vững chắc cho tôi có được thành công như ngày hôm nay.<br />
Tác giả<br />
<br />
Trần Mai Vũ<br />
<br />
2<br />
<br />
MỤC LỤC<br />
LỜI CAM ĐOAN<br />
<br />
1<br />
<br />
LỜI CẢM ƠN<br />
<br />
2<br />
<br />
MỤC LỤC<br />
<br />
3<br />
<br />
DANH MỤC CÁC KÍ HIỆU VÀ CHỮ VIẾT TẮT<br />
<br />
7<br />
<br />
DANH MỤC CÁC BẢNG<br />
<br />
8<br />
<br />
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ<br />
<br />
10<br />
<br />
MỞ ĐẦU<br />
<br />
11<br />
<br />
Lý do chọn đề tài<br />
<br />
11<br />
<br />
Mục tiêu cụ thể và phạm vi nghiên cứu của luận án<br />
<br />
12<br />
<br />
Cấu trúc của luận án<br />
<br />
15<br />
<br />
Chương 1 - KHÁI QUÁT VỀ NHẬN DẠNG THỰC THỂ<br />
1.1.<br />
<br />
Một số khái niệm cơ bản<br />
<br />
17<br />
17<br />
<br />
1.1.1. Định nghĩa bài toán nhận dạng thực thể<br />
<br />
17<br />
<br />
1.1.2. Thách thức<br />
<br />
19<br />
<br />
1.1.3. Độ đo đánh giá<br />
<br />
19<br />
<br />
1.1.4. Ứng dụng của nhận dạng thực thể<br />
<br />
21<br />
<br />
1.2. Sơ lược về lịch sử nghiên cứu và một số hướng giải quyết bài toán<br />
<br />
22<br />
<br />
1.3. Nhận dạng thực thể trong dữ liệu văn bản tiếng Việt và một số nghiên cứu<br />
liên quan<br />
<br />
24<br />
<br />
1.3.1. Những thách thức đối với xử lý dữ liệu tiếng Việt<br />
<br />
24<br />
<br />
1.3.2. Động cơ nghiên cứu<br />
<br />
26<br />
<br />
1.3.3. Các nghiên cứu liên quan<br />
<br />
26<br />
<br />
1.4. Nhận dạng thực thể trong dữ liệu văn bản y sinh tiếng Anh và một số<br />
nghiên cứu liên quan<br />
<br />
29<br />
<br />
1.4.1. Những thách thức đối với xử lý dữ liệu y sinh<br />
<br />
29<br />
<br />
1.4.2. Động cơ nghiên cứu<br />
<br />
30<br />
<br />
1.4.3. Các nghiên cứu liên quan<br />
<br />
31<br />
3<br />
<br />