ĐẠI HC QUC GIA HÀ NI
TRƢỜNG ĐẠI HC CÔNG NGH
VƢƠNG THỊ HNG
TRUY HI CHÉO MÔ HÌNH CHO
NHC VÀ LI BÀI HÁT
Ngành: H thng thông tin
Chuyên ngành: H thng thông tin
Mã S: 8480104.01
TÓM TT LUN VĂN THẠC SĨ HỆ THNG THÔNG TIN
Hà ni, tháng 10/2018
2
Chƣơng 1: Giới thiu
Chương 1 trình bày ng cnh của đề tài luận văn, mục đích
ý nghĩa. Giới thiu tng quan v d liệu đa phương thức,
truy hi thông tin truy hi chéo hình. Cách phân loi
truy hi chéo hình da trên biu din không gian chung
cho d liu. Phát biu bài toán lun văn.
1.1 D liệu đa phƣơng thức và truy hi thông tin
Phn 1.1 trình bày tng quan d liệu đa phương thức
truy hi thông tin. D liệu đa phương thức được ng dng cho
truy hi chéo mô hình, h tư vấn hoc phát hin ch đề n. D
liu dng hình nh, âm thanh hay văn bản cùng đề cp ti mt
s kin, ch đ tgia chúng mối tương quan ngữ nghĩa.
Bên cnh s phát trin ca d liệu đa phương thức, phương
pháp, k thuật để lp ch mc tìm kiếm d liệu đa phương
thức được quan tâm nghiên cu. Tuy nhiên, các k thut m
kiếm này ch yếu da trên mô hình da trên t khóa hoc ni
dung truy xut cho phép thc hin tìm kiếm tương tự trên cùng
mt loi d liu, ví d truy hồi văn bản, truy hi hình nh, truy
hi. Do đó, một yêu cu đòi hỏi để thúc đẩy truy hi thông tin
phát trin mt hình truy hi mi th h tr tìm kiếm
tương tự cho nhiu kiu d liệu đề cp ti cùng ch đề hay s
kin gi là truy hi chéo mô hình.
1.2 Phân loi truy hi chéo mô hình
Đối vi truy hi chéo hình da trên ni dung ca d
liệu đa phương thức, theo nhóm tác gi Wang và cng s [16],
truy hồi thông tin chéo được chia thành 2 loi chính da trên
hc biu din là giá tr thc [13, 14, 18] và hc biu din là giá
tr nh phân [5, 17, 22]. Truy hi thông tin chéo da trên biu
din giá tr thc, không gian biu din chung được hc cho các
3
kiu d liu giá tr thực được trích xut da trên chính ni
dung ca kiu d liệu đó. Còn với truy hi thông tin chéo da
trên biu din giá tr nh phân, không gian đại diện chung được
hc cho các kiu d liu giá tr nh phân cho các kiu d
liu là giá tr nh phân với bit 0 và bit 1 được chuyển đổi t ni
dung d liệu tương ứng. Phương pháp hc biu din nh phân
mc tiêu chuyển đổi các kiu d liu khác nhau thành mt
không gian Hamming chung. Do đó, các ng dng thc tin
quan trng tốc độ x s ưu tiên việc s dụng phương
pháp hc biu din nh phân. Tuy nhiên, vi vic biu din
hóa các nh phân nên độ chính xác truy hồi thường
gim nh do mt mát thông tin trong quá trình hóa. Tuy
nhiên vi các ng dng thc tin mà quan trọng độ chính xác
ca truy hồi thông tin được ưu tiên hơn nên sử dụng phương
pháp hc biu din giá tr thc. Khóa lun tp trung vào truy
hi chéo mô hình da trên hc giá tr thc bng cách trích xut
đặc trưng của d liệu đa phương thức bng các k thut hc
máy da trên chính ni dung ca d liu.
1.3 Phát biu bài toán
Để tn dng tối đa d liệu đa phương tiện nói chung s
dng tối ưu công nghệ đa phương tiện đang phát triển nhanh
chóng, các cơ chế t động cn thiết để thiết lp mt liên kết
tương tự t mt d liu dng này sang mt d liu dng khác
nếu chúng có liên quan ng nghĩa. Xuất phát t ng dng thc
tế cn xây dng h thng truy hi chéo thông tin ca các d
liệu đa phương tiện. Luận văn tập trung vào gii quyết bài toán
ci tiến đ chính xác cho truy hi chéo mô hình gia nhc
li bài hát.
Đầu vào: Tp các d liu nhc, d liu li bài hát và nhãn
cảm xúc tươngng vi mi cp d liu.
4
Đầu ra: hình học đại din chung cho nhc li bài
hát. S dụng hình này để truy hi chéo hình gia nhc
và li bài hát.
C th luận văn giải quyết hai bài toán con:
Xây dng hình cho phép truy hi thông tin chéo gia
nhc và li bài hát. C th tìm ra được không gian đại din S =
{SA, ST} với 2 hàm không gian đại din vi d chiu cho nhc
lời bài hát được ánh x bi hàm fA, fT : SA = fA(A, θA), ST
= fT(T, θT), trong đó θA, θT các tham s hc. hình cho
phép s dng nhạc như truy vấn truy xut ra danh sách các
lời bài hát đã được xếp hạng ngược li, s dng li bài t
như truy vấn truy xut ra danh sách các nhạc đã được xếp
hng.
S dng hình biu din chung cho truy hi chéo
hình và đánh giá hiệu qu mô hình bằng độ đo xếp hng.
Luận văn được trình bày trong bn chương. Chương 1 trình
bày ng cnh, các nghiên cứu đã về vấn đề cn gii quyết,
cơ sở khoa hc và thc tin của đề tài, mc tiêu của đề tài, cu
trúc ca luận văn. Chương 2 trình bày các phương pháp truy
hi chéo mô hình mt s khái niệm cơ bản phc v cho đề tài.
Chương 3 trình bày nh đề xut ca luận văn. Chương 4
trình bày thc nghiệm đánh giá. Kết luận hướng phát
triển cho đề tài và tài liu tham kho.
Chƣơng 2: Các phƣơng pháp truy hi chéo mô hình
2. 1 Phƣơng pháp học không gian con
Tính toán đo được s tương tự gia các d liu nh
khác nhau cho truy hồi chéo hình là bài toán khó. Phương
pháp hc không gian con mt phương pháp phổ biến nht.
5
Mục đích của phương pháp này tìm được không gian chung
chia s bi d liu các hình khác nhau. Hc không gian
con bán giám sát s dng thông tin cặp để hc ra không gian
n chung cho d liệu đa phương thức. Chúng buc các cp gn
nhau gia các d liệu đa phương thức thành không gian chung.
Phân tích tương quan chính tắc (Canonical Correlation
Analyis) CCA một phương pháp học không gian để xác
định mi quan h chéo hình gia các d liu t các
hình khác nhau. CCA một phương pháp thống thăm
ph biến, cho phép phân ch các mi quan h tn ti gia hai
tp biến. Vic chuyển đổi tuyến tính tt nht cho hai tp d
liệu đa chiều, cho phép tương quan tối đa giữa chúng th
đạt được bng s dụng CCA. CCA đã được áp dng thành
công cho nhiều lĩnh vực khoa hc y sinh quan trọng cũng như
được s dng rng rãi cho bài toán truy hồi chéo đa phương
thc [18, 19, 20].
Phn 2.1 trình bày chi tiết (a) các khái niệm bản, công
thc phương pháp phân tích tương quan chính tắc CCA (b)
RCCA vi tham s chun hóa và tham s co.
2. 2 Phƣơng pháp học sâu
Phn 2.2 trình bày phương pháp học sâu cho bài toán truy
hi chéo mô hình: phân tích tương quan chính tắc sâu (DCCA)
và mng cnh tranh sinh (Generative Adversarial Nets).
D liệu đa phương thức các kiu d liu khác nhau
nhưng cùng tả cùng s kin hoc ch đề. d, ni dung
do người dùng tạo thường cha nhiu loi d liu khác nhau
như ảnh, văn bản video. Điu này là thách thc ln vi các
phương pháp truyền thng tìm mt biu din chung cho
nhiu mô hình. Gần đây, sự phát trin học sâu được cộng đồng
nghiên cứu được quan tâm và ng dng vào gii quyết các bài