B GIÁO DỤC VÀ ĐÀO TẠO
VIN HÀN LÂM KHOA HC
VÀ CÔNG NGH VIT NAM
HC VIN KHOA HC VÀ CÔNG NGH
-----------------------------
PHM TH LAN
TÓM TT D LIU BNG NGÔN NG
THEO CÁCH TIP CẬN ĐẠI S GIA T
LUN ÁN TIN SĨ NGÀNH MÁY TÍNH
Hà Ni 2022
B GIÁO DỤC VÀ ĐÀO TẠO
VIN HÀN LÂM KHOA HC
VÀ CÔNG NGH VIT NAM
HC VIN KHOA HC VÀ CÔNG NGH
-----------------------------
PHM TH LAN
TÓM TT D LIU BNG NGÔN NG
THEO CÁCH TIP CN ĐẠI S GIA T
LUN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
Chuyên ngành: Khoa hc máy tính
Mã s: 9 48 01 01
NGƯỜI HƯỚNG DN KHOA HC:
1. PGS.TSKH Nguyn Cát H
2. PGS.TS H Cm Hà
Hà Ni 2022
LỜI CAM ĐOAN
Tôi xin cam đoan đây công trình nghiên cu ca riêng tôi. Các kết
qu được viết chung vi các tác gi khác đều được s đồng ý của các đồng tác
gi trước khi đưa vào luận án. Các kết qu nêu trong lun án trung thc
chưa từng được công b trong các công trình nào khác.
Luận án được hoàn thành trong thi gian tôi làm Nghiên cu sinh ti
Hc vin Khoa hc Công ngh, Vin Hàn lâm Khoa hc Công ngh
Vit Nam.
Tác gi
NCS Phm Th Lan
LI CẢM ƠN
Trưc tiên, tôi xin gi li cảm ơn sâu sắc ti tp th hướng dn
PGS.TSKH Nguyn Cát H và PGS.TS H Cm Hà. Trong quá trình nghiên cu và
hoàn thành lun án, tác gi đã nhận được s ch dn tận tình, các định hướng khoa
hc, nhng kinh nghim quý báu trong nghiên cu t hai thy . Đặc bit, thy
luôn quan tâm, khuyến khích, động viên tác gi vượt qua các giai đoạn khó khăn đ
hoàn thành lun án.
Tác gi xin gi li cảm ơn chân thành tới các thy cô, các phòng ban trong
Hc vin Khoa hc Công ngh, Vin Hàn lâm Khoa hc Việt Nam đã tạo điều
kin thun li cho tác gi trong sut quá trình nghiên cu thc hin bo v lun
án. Tác gi xin gi li cảm ơn ti các thy cô và anh ch trong nhóm nghiên cứu Đi
s gia t ng dng đã luôn chia sẻ, động viên đưa ra góp ý quý báu đi vi
vấn đề nghiên cu ca tác gi.
Tác gi cũng xin gửi li cảm ơn chân thành tới Ban giám hiệu trường Đại
học phạm Ni, Ban ch nhim khoa cán b, ging viên ti khoa Công
ngh thông tin, trường Đại học phạm Hà Nội đã tạo điều kiện, giúp đỡ, động
viên trong sut quá trình hc tp, nghiên cu và hoàn thin bo v lun án.
Tác gi xin gi li cảm ơn ng biết ơn sâu sắc ti các thành viên trong
đại gia đình đã luôn hỗ tr, tạo điều kiện, động viên để tác gi thi gian, tâm
tt nht đ thc hin các nhim v trong nghiên cu.
Tác gi
NCS Phm Th Lan
1
MC LC
DANH MC CÁC BNG ............................................................................................ 5
DANH MC CÁC HÌNH VẼ, ĐỒ TH ...................................................................... 6
DANH MC CÁC KÝ HIU, CH VIT TT ....................................................... 8
M ĐẦU ....................................................................................................................... 10
CHƯƠNG 1. MỘT S KIN THỨC CƠ SỞ .............................................................. 20
1.1. Mt s kiến thc cơ bản v tp m ............................................................. 20
1.1.1. Định nghĩa tp m ................................................................................ 20
1.1.2. Biến ngôn ng ...................................................................................... 21
1.1.3. Phân hoch m ..................................................................................... 22
1.2. Khung nhn thc da trên lý thuyết tp m ................................................ 23
1.2.1. Định nghĩa khung nhận thc ................................................................ 23
1.2.2. Các ràng buc v tính giải nghĩa được ................................................. 24
1.3. Tng quan v trích rút tóm tt bng ngôn ng da trên lý thuyết tp m ... 26
1.3.1. Bài toán trích t tóm tt bng ngôn ng một nhánh trong lĩnh vc
khai phá d liu ................................................................................................. 26
1.3.2. Dng câu tóm tt có t ng hóa ngôn ngng dng ................... 29
1.3.3. Trích rút tóm tt t cơ sở d liu ......................................................... 36
1.4. Trích rút tp câu tóm tt tối ưu từ sở d liu .......................................... 38
1.4.1. Gii thut di truyn gii bài toán trích rút tp tóm tt .......................... 39
1.4.2. Các yếu t trong hình gii thut di truyn trích rút tp câu tóm tt
........................................................................................................................... 40
1.5. Lý thuyết đi s gia t ................................................................................. 41
1.5.1. Cấu trúc đại s cho min giá tr ca biến ngôn ng ............................. 42
1.5.2. Đại s gia t m rng mô hình lõi ng nghĩa của hng t .................. 48
1.6. Kết luận chương 1 ....................................................................................... 55