
1
MỞ ĐẦU
Trong những năm gần đây, cùng với sự phát triển mạnh mẽ của
mạng Internet và công nghệ Web là sự bùng nổ thông tin số. Số lượng
người sử dụng và lượng thông tin sản sinh ra trên mạng Internet gia
tăng rất nhanh và chúng ta có thể tìm thấy hầu hết thông tin cần thiết
khi có nhu cầu. Đặc biệt, lượng thông tin liên quan đến khoa học, phục
vụ học tập, nghiên cứu cũng gia tăng nhanh chóng và phong phú về
lĩnh vực. Các công cụ tìm kiếm phổ biến hiện nay như Google, Yahoo,
Bing… chỉ hỗ trợ mạnh việc tìm kiếm các dữ liệu dưới dạng văn bản
và hình ảnh, việc tìm kiếm các dữ liệu đặc biệt như các công thức toán
thì các công cụ này hầu như chưa thực hiện được.
Hiện nay, đã có nhiều công cụ cho phép soạn thảo và quản lý công
thức toán, nhưng việc tìm kiếm còn gặp nhiều khó khăn do chưa có
chuẩn chung về biểu diễn và lưu trữ. Vì thế, để tìm kiếm tài liệu dựa
trên công thức toán, chúng ta cần có một cơ chế thống nhất để mô tả,
lưu trữ và tìm kiếm theo ngữ nghĩa tương ứng với công thức đó.
Mục tiêu nghiên cứu
Mục tiêu tổng quát của đề tài là đề xuất được một mô hình hệ thống
cho phép biểu diễn, lưu trữ và tìm kiếm tài liệu dựa trên công thức toán
với nhiều nền tảng hệ thống khác nhau: máy đơn, mạng nội bộ, trên
Internet. Mục tiêu cụ thể như sau:
(1) Đề xuất một không gian biểu diễn và lưu trữ công thức toán
theo một cách thống nhất và có thể chuyển đổi dễ dàng từ nhiều
nguồn, nhiều công cụ soạn thảo và lưu trữ khác nhau.
(2) Trên cơ sở mô hình thống nhất cách biểu diễn và lưu trữ đó, đề
xuất phát triển một công cụ cho phép soạn thảo, tìm kiếm công thức
toán một cách thuận lợi trong các văn bản.