i
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYN TH THÙY ANH
NGHIÊN CU PHÁT TRIN CÁC K THUT HC MÁY
HOÀN THIỆN ĐỒ TH TRI THC
Ngành đào tạo: H thng thông tin
Mã s: 9480104
TÓM TT LUN ÁN TIẾN SĨ H THNG THÔNG TIN
Hà Ni 2025
ii
Công trình được hoàn thành ti: Trưng Đại hc Công nghệ, Đi hc
Quc gia Hà Ni
Ngưi hưng dn khoa hc:
1. PGS. TS. Hà Quang Thy
2. PGS. TS. Phan Xuân Hiếu
Phn bin:
Phn bin:
Phn bin:
Lun án s được bo v trưc Hi đồng cp Đại hc Quc gia chm lun án
tiến sĩ hp ti
vào hi gi ngày tháng năm
Có th tìm hiu lun án ti:
- Thư viện Quc gia Vit Nam
- Trung tâm Thông tin - Thư viện, Đại hc Quc gia Hà Ni
1
M đầu
Đồ th tri thc (ĐTTT, Knowledge graph: KG) đóng vai tquan trng đặc bit, cung cp thông tin
ng nghĩa phong phú đã nổi lên như mt đng lc thúc đẩy các lĩnh vực tìm kiếm ng nghĩa và Trí tuệ nhân
to (TTNT, Artificial Intelligence: AI) [1]. ĐTTT được biu diễn dưới dng mt b ba 𝐾𝐺=(𝐸,𝑅,𝐹), trong
đó 𝐸tp hu hn các thc th (tp nút), 𝑅 là tp hu hn các quan h (tp nhãn ca các cung), còn 𝐹 là mt
tp c th hin quan h (tp cung) 𝐹𝐸×𝑅×𝐸; mt cung trong 𝐹 được biu diễn dưới dng b ba (,𝑟,𝑡)
trong đó ℎ,𝑡𝐸còn 𝑟𝑅; trong cung (ℎ,𝑟,𝑡), được gi là nút đầu, 𝑡 được gi là nút cui và 𝑟 được gi
là nhãn ca cung.
Gần đây, nhu cầu cung cp ng cnh tính thi gian đã trở nên hết sc cp thiết, t đó hình thành
mt kiểu ĐTTT mới - ĐTTT thi gian (Temporal Knowledge Graph: TKG) vi s b sung yếu t thi gian
vào tp các d kin 𝐹 trong ĐTTT thông thưng. Thêm na, tìm kiếm trên Science Direct, Springer và DBLP,
lun án nhn thy rng công b khoa hc có tiêu đề liên quan ti các cm t “Multi modal Knowledge Graph
Completion” hoặc “Multimodal Knowledge Graph Completion” mi ch xut hin t năm 2022 trở lại đây .
Điều đó có nghĩa nghiên cứu v Hoàn thiện ĐTTT, Hoàn thiện ĐTTT đa phương thức, Hoàn thiện ĐTTT
thi gian là rt cn thiết và có tính thi s.
Mặc dù ĐTTT có giá trị rt ln trong nhiu ng dụng, nhưng chúng thưng đưc xây dng th công
hoc bán t đng nên vẫn không đầy đủ. Vì vy, bài toán Thu thp tri thc vi mc tiêu là gii quyết các vn
đề v tính không đầy đủ và thưa thớt trong ĐTTT tầm quan trng đặc bit. Thu thp tri thc bao gm ba
bài toán con đ gii quyết ba trưng hợp chưa đầy đủ điển hình của ĐTTT là: (i) Phát hin thc th (Entity
Discovery),(ii) Trích xut quan h (Relation Extraction), (iii) Hoàn thiện ĐTTT (Knowledge Graph
Completion)[7].
Định hướng ti các ch đề nghiên cu quan trng và xu hướng nghiên cu v hoàn thiện ĐTTT như
đã được đề cp, theo dòng nghiên cu ca các lun án Tiến s trên thế gii, lun án đặt ra hai câu hi nghiên
cu vi mc tiêu nghiên cu tương ứng như sau: Câu hi nghiên cứu đầu tiên là v phương pháp và nguồn
tài nguyên cho phép s dng thông tin b sung cho Hoàn thiện ĐTTT, tương ng với xu hướng nghiên cu
(1). Luận án hướng mục tiêu đề xuất đưc các hình hoàn thiện ĐTTT bằng k thut hc chuyn giao
(transfer learning) đ s dng thông tin b sung bên ngoài làm giàu thông tin bên trong cho hoàn thiện ĐTTT.
Câu hi nghiên cu th hai là v các k thut và mô hình Hoàn thiện ĐTTT trong các miền ng dng c th
có s dng hình ngôn ng hun luyện trước, tương ng vi hai xu hướng nghiên cu (3) và (4). Lun án
hướng mục tiêu đề xuất được các k thut hình hoàn thiện ĐTTT thi gian hoàn thiện ĐTTT đa
phương thức.
Đối tượng nghiên cu ca lun án là các hình hoàn thiện ĐTTT các k thuật đưc áp dng
trong các mô hình đó.
Phm vi nghiên cu ca lun án tp trung ti các k thut và gii pháp ci tiến được áp dng trong
các mô hình hoàn thin ĐTTT trên mt s min d liệu ĐTTT mở, ĐTTT đa phương thức và ĐTTT thi gian.
Lun án s dng phương pháp nghiên cu kết hp bao gm phương pháp nghiên cứu định tính
phương pháp nghiên cứu định lượng.
2
Tham gia vào dòng nghiên cứu trên thế giới về hoàn thiện ĐTTT, luận án ba đóng góp chính sau
đây: (i) Đề xut mô hình hoàn thiện ĐTTT qua hc chuyn giao BERT/FastText-GRU-KGC được ci tiến t
mô hình GloVe-GRU-KGC do V. Kocijan và T. Lukasiewicz đề xuất năm 2021 [17]; (ii) Đề xut hai mô hình
hoàn thiện ĐTTT đa phương thức ViT-AdaMF-MAT T5-ViT-AdaMF-MAT được ci tiến t hình
AdaMF-MAT được Y. Zhang cng s đề xuất năm 2024 [18], trong đó, ViT-AdaMF-MAT T5-ViT-
AdaMF-MAT s dng mô hình nhúng ảnh Vision Transformer (ViT) và mô hình nhúng văn bn T5; (iii) Đề
xut hai mô hình hoàn thiện ĐTTT thi gian DE-RotatE và DE-RotatE-sinc được ci tiến t hình DE-
SimplE do R. Goel và cng s đề xuất năm 2020 [19] theo ý tưởng s dng phép quay chiếu thay vì s dng
phép tnh tiến chiếu trong DE-SimplE. Các hình đề xuất đều được trin khai thc nghiệm đánh giá hiệu
năng và được công b ti trong các báo cáo [NCS1], [NCS4], [NCS2, NCS3].
B cc ca lun án gm phn M đầu và bốn chương ni dung, phn Kết lun danh mc các tài
liu tham kho.
Chương 1. Đồ th tri thc và hoàn thiện đồ th tri thc
1.1 Đồ thi tri thc
1.1.1 Khái nim v đồ th tri thc
Định nghĩa 1.1 ĐTTT [7]: ĐTTT một b ba KG=(E,R,F), trong đó E là tập hu hn các thc th
(tp nút), R là tp hu hn các quan h (tp nhãn ca các cung), còn F mt tp các th hin quan h (tp
cung), F
E×R×E; một cung trong F được biu diễn dưới dng b ba (h,r,t) trong đó h,t
E và còn r
R; trong
cung (h,r,t),h được gi là nút đầu, t được gi là nút cuối và r được gi là nhãn.
1.1.2 Pn loi ĐTTT
Theo Liang và cng s [23], ĐTTT có thể được phân chia làm các loi khác nhau ph thuc vào đặc
điểm, tính chất, đặc nh ca các thc th và quan h trong đó, trong đó, ba loại ĐTTT điển hình là: ĐTTT mở
(Open Knowledge Graph, OKG), ĐTTT đa phương thức (Multi-Modal Knowledge Graph MMKG), ĐTTT
thi gian (Temporal Knowledge Graph TKG).
1.1.3 Khái quát v c bài toán nghiên cu v ĐTTT
Bn bài toán nghiên cu v ĐTTT mc cao nht là Hc biu din tri thc, Thu thp tri thức, ĐTTT
thi gian Các ng dng nhn thc tri thc dựa trên ĐTTT. Nhim v thu thp tri thc chính vic xây
dựng ĐTTT. Bên cnh nhim v xây dựng ĐTTT thì mục đích của thu thp tri thc chính là m rng ĐTTT.
Các bài toán m rng ĐTTT trong thu thập tri thức được chia làm ba loi chính: hoàn thiện ĐTTT, trích xuất
quan h thc th và phát hin thc th [5].
1.2 Hoàn thiện ĐTTT
1.2.1 Khái nim v hoàn thiện đ th tri thc
Hoàn thiện ĐTTT, còn được gi là D đoán liên kết (Link Prediction), nhm mục đích t đng suy ra
các d kin còn thiếu cho mt ĐTTT bng cách hc hi t các d kin hin có trong ĐTTT đó.
3
1.2.2 Quy trình chung hoàn thin ĐTTT
Quy trình chung hoàn thiện ĐTTT (sau khi ĐTTT đã được tin x lý) bao gm ba phn: hun luyn
mô hình, xứng viên và xác định d kin [9].
1.2.3 H thng các k thut hoàn thiện ĐTTT
T. Shen cng s [9] đã hệ thng hóa các k thut hoàn thiện ĐTTT bao gm ba nhóm k thut
chính hoàn thiện ĐTTT là k thut hoàn thiện ĐTTT dựa trên thông tin cu trúc, k thut hoàn thiện ĐTTT
da trên thông tin b sung và k thut hoàn thiện ĐTTT khác.
1.2.4 Mt s hình hoàn thiện ĐTTT điển hình
Trong mc này, lun án gii thiu các mô hình hoàn thiện ĐTTT được coi là điển hình nht như là
hình TransE, DisMult, RotatE, SimplE, TuckER, 5E, ConvE thưng được s dng làm nn tng phát trin
các mô hình hoàn thiện ĐTTT khác, trong đó có các mô hình được lun án nghiên cu và ci tiến.
1.3 Hoàn thin ĐTTT đa phương thức
Hin nay, hoàn thiện ĐTTT đa phương thức thưng tập trung vào hai hướng phát triển: tăng cưng
biu din thc th bng cách dựa trên thông tin đa phương thức (hình ảnh, văn bản) ca chúng; ci thin quá
trình ly mu âm của các thông tin đa phương thức.
1.3.1 Tiếp cn biu din thc th với thông tin đa phương thức
Bn hình hoàn thiện ĐTTT đa phương thức điển hình theo tiếp cn biu din thc th vi thông
tin đa phương thức là IKRL, TBKGC, TransAE, VBKGC.
Mô hình IKRL được các tác gi xây dựng theo hướng: Đầu tiên đề xut mt bhóa ảnh để to ra
biu din da trên hình nh cho từng trưng hp; tiếp theo, xây dng biu din da trên nh tng hp cho tng
thc th; cui cùng, các tác gi kết hp vic hc các biu din tri thc bằng các phương pháp dựa trên dch
chuyn (translation-based methods). Hàm tính đim trong IKRL là TransE [36].
hình TBKGC (Translation-Based for Knowledge Graph Completion) do H. M. Sergieh cng
s đề xut [44]. Mô hình này được xây dng bng cách m rng thông tin ảnh và văn bản t mô hình IKRL
Trong hình TransAE, lp n ca các b hóa t đng được s dụng như biểu din ca các
thc th trong mô hình TransE. Do đó, nó không ch mã hóa tri thc có cu trúc mà còn mã hóa c tri thức đa
phương thức, như tri thức nh tri thức văn bản trong biu din cuối cùng. Hàm tính điểm tng trong
hình TransAE được xây dựng như sau:
𝑓(ℎ,𝑟,𝑡)=𝑓𝑆+𝑓𝑀1+𝑓𝑀2+𝑓𝑆𝑀+𝑓𝑀𝑆
(1-9)
Mô hình VBKGC (VisualBERT-enhanced Knowledge Graph Completion VBKGC) là mô hình da
trên nhúng và áp dụng VisualBERT như mt b mã hóa đa phương thức để nm bắt các đặc trưng đa phương
thc hp nht sâu sc ca các thc th.
1.3.2 Tiếp cn ly mu âm
Phương pháp ly mu âm (negative sampling) nhm mục đích tạo ra các b ba âm bng cách thay thế
ngu nhiên các thc th để tạo ra đ tương phản gia mu dương mu âm trong quá trình hun luyn.