
2
Chƣơng 1: Giới thiệu
Chương 1 trình bày ngữ cảnh của đề tài luận văn, mục đích
và ý nghĩa. Giới thiệu tổng quan về dữ liệu đa phương thức,
truy hồi thông tin và truy hồi chéo mô hình. Cách phân loại
truy hồi chéo mô hình dựa trên biểu diễn không gian chung
cho dữ liệu. Phát biểu bài toán luận văn.
1.1 Dữ liệu đa phƣơng thức và truy hồi thông tin
Phần 1.1 trình bày tổng quan dữ liệu đa phương thức và
truy hồi thông tin. Dữ liệu đa phương thức được ứng dụng cho
truy hồi chéo mô hình, hệ tư vấn hoặc phát hiện chủ đề ẩn. Dữ
liệu dạng hình ảnh, âm thanh hay văn bản cùng đề cập tới một
sự kiện, chủ đề thì giữa chúng có mối tương quan ngữ nghĩa.
Bên cạnh sự phát triển của dữ liệu đa phương thức, phương
pháp, kỹ thuật để lập chỉ mục và tìm kiếm dữ liệu đa phương
thức được quan tâm nghiên cứu. Tuy nhiên, các kỹ thuật tìm
kiếm này chủ yếu dựa trên mô hình dựa trên từ khóa hoặc nội
dung truy xuất cho phép thực hiện tìm kiếm tương tự trên cùng
một loại dữ liệu, ví dụ truy hồi văn bản, truy hồi hình ảnh, truy
hồi. Do đó, một yêu cầu đòi hỏi để thúc đẩy truy hồi thông tin
là phát triển một mô hình truy hồi mới có thể hỗ trợ tìm kiếm
tương tự cho nhiều kiểu dữ liệu đề cập tới cùng chủ đề hay sự
kiện gọi là truy hồi chéo mô hình.
1.2 Phân loại truy hồi chéo mô hình
Đối với truy hồi chéo mô hình dựa trên nội dung của dữ
liệu đa phương thức, theo nhóm tác giả Wang và cộng sự [16],
truy hồi thông tin chéo được chia thành 2 loại chính dựa trên
học biểu diễn là giá trị thực [13, 14, 18] và học biểu diễn là giá
trị nhị phân [5, 17, 22]. Truy hồi thông tin chéo dựa trên biểu
diễn giá trị thực, không gian biểu diễn chung được học cho các