BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
CAO XUÂN TUẤN
NGHIÊN CU PHƯƠNG PHÁP
TÌM KIM TÀI LIU DA TRÊN CÔNG THC TOÁN
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Hà Nội - 2017
BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
CAO XUÂN TUẤN
NGHIÊN CU PHƯƠNG PHÁP
TÌM KIM TÀI LIU DA TRÊN CÔNG THC TOÁN
Chuyên ngành : Hệ thống Thông tin
Mã số: 62.48.01.04
LUẬN ÁN TIẾN SĨ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS Võ Trung Hùng
2. TS Nguyễn Mạnh Hùng
Hà Nội – 2017
i
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong Luận án trung thực chưa từng được ai
công bố trong bất kỳ công trình nào khác.
Tác giả Luận án
ii
LỜI CẢM ƠN
Để hoàn thành được luận án này, đầu tiên, nghiên cứu sinh xin chân thành
cảm ơn sự hướng dẫn khoa học tận tình giúp đỡ của PGS.TS. Võ Trung Hùng
TS. Nguyễn Mạnh Hùng. Nghiên cứu sinh trân trọng cảm ơn Ban Giám đốc Học
viện Công nghệ Bưu chính Viễn thông, Hội đồng tiến sĩ, Khoa Quốc tế Đào tạo
sau đại học đã tạo điều kiện thuận lợi cho nghiên cứu sinh thực hiện hoàn thành
chương trình nghiên cứu. Xin chân thành cảm ơn Quý thầy, cô đã đọc và góp ý kiến
cho luận án.
Nghiên cứu sinh chân thành cảm ơn quan Bộ Giáo dục và Đào tạo đã tạo
điều kiện công tác thuận lợi để nghiên cứu sinh tham gia hoàn thành khóa học
này.
Cuối cùng, nghiên cứu sinh bày tỏ lòng biết ơn đến gia đình, người thân,
những người bạn đã luôn bên cạnh, động viên ủng hộ nghiên cứu sinh trong suốt
thời gian qua.
Nghiên cứu sinh
Cao Xuân Tuấn
iii
MỤC LỤC
LỜI CẢM ƠN ......................................................................................................... ii
DANH MỤC CÁC TỪ VIẾT TẮT ........................................................................ vi
DANH MỤC HÌNH VẼ ........................................................................................ vii
DANH MỤC BẢNG .............................................................................................. ix
MỞ ĐẦU ........................................................................................................... 1
CHƯƠNG 1.
TỔNG QUAN VỀ TÌM KIẾM VĂN BẢN CÔNG THỨC TN . 8
1.1. Tìm kiếm văn bản ....................................................................................... 8
1.1.1. Khái niệm văn bản ................................................................................ 8
1.1.2. Hệ thống tìm kiếm văn bản ................................................................... 9
1.2. Tìm kiếm văn bản chứa công thức toán ..................................................... 12
1.2.1. Đặc thù của tìm kiếm văn bản chứa công thức toán ............................ 12
1.2.2. Các công cụ soạn thảo văn bản chứa công thức toán ......................... 13
1.2.3. Biểu diễn văn bản chứa công thức toán .............................................. 17
1.2.4. Lưu trữ văn bản chứa công thức toán ................................................. 19
1.2.5.
Tìm kiếm công thức toán với hệ thống MathWebSearch ............................ 23
1.3. Hướng tiếp cận của luận án ....................................................................... 25
1.4. Kết luận Chương 1 .................................................................................... 29
CHƯƠNG 2.
BIỂU DIỄN VÀ LƯU TRỮ CÔNG THỨC TOÁN .......................... 31
2.1. Mô hình biểu diễn và tìm kiếm công thức toán trong văn bản ................... 31
2.2. Biểu diễn và lưu trữ công thức toán với MathML ..................................... 34
2.3. Soạn thảo và hiển thị công thức toán với Amaya ....................................... 38