HC VIN CÔNG NGH BƯU CHÍNH VIN THÔNG
---------------------------------------
HÀ HOÀI NAM
XÂY DNG CHỨC NG TRA CU
THÔNG TIN VĂN BN DA TN WEB
NG NGHĨA CA H THNG TIC-OFFICE
Chun ngành: H Thng thông tin
Mã s: 8.48.01.04
TÓM TT LUN VĂN THC
(Theo định hưng ng dng)
TP. H CHÍ MINH - M 2022
Luận văn được hoàn thành tại:
HC VIN CÔNG NGH U CHÍNH VIN THÔNG
Ngườiớng dẫn khoa hc: PGS. TS Đ Văn Nhơn
Phn bin 1: PGS.TS. Trn Vĩnh Phước
Phn bin 2: PGS.TS. Hoàng Thái
Luận văn sẽ được bảo vệ trước Hi đng chấm lun văn
thạc sĩ tại Học vin Công ngh Bưu chính Vin tng
o lúc: 09 gi30 ngày 02 tháng 07 năm 2022
th m hiu lun văn tại:
- Thư vin ca Hc vin Công ngh Bưu chính Vin thông
1
M ĐU
Ngày nay ng vi s phát trin ca internet thì d liu
ca ngành công ngh thông tin ngày càng gia tăng. Nhu cu qun
lý, chia s, tìm kiếm thông tin trong ngành này ng được đặt ra
và đáp ứng mt phn nh các công c m kiếm. Mt s công c
tìm kiếm ni tiếng hiện nay như Google hay Yahoo đu th
cho phép ngưi ng tìm kiếm d liu liên quan bng ch
nhp t khóa và m nhng tài liu có cha t khóa đó. Vi các
h thng m kiếm này phn ln vn da trên t khóa và mc độ
ph biến ca tài liu. Mt danh sách các t khóa là dng biu
diễn lưc nht ca nội dung, nghĩa là mi tài liệu đưc biu
din bi mt tp t hay cm t đưc rút trích t chính ni dung
ca tài liệu và do đó, cách biu din này mang mức độ thông tin
còn thấp. Do đó h thng m kiếm này kết qu tr v không
phải lúc nào cũng tha mãn yêu cum kiếm ca ngưi s dng,
như là độ chính xác không cao khi kết qu tr v quá nhiu mà
t l s tài liu hu ích tn tng s tài liu tr v thp, hoc
th không m thấy đưc nhng tài liệu liên quan khi chúng đưc
mô t vi nhng t khóa khác đồng nghĩa hoặc gần nghĩa vi t
khóa mà ngưi ng m kiếm (độ bao ph không cao) gây ra
không ít khó khăn cho ngưi s dng trong vic tìm kiếm chính
xác thông tin cn tìm kiếm.
2
Xut phát t nhu cu thc tế ca h thng quản lý văn
bn ca Hi nông dân tnh Tây Ninh ng vi s ng dn tn
tình ca Thầy PGS.TS Đ Văn Nhơn, tôi quyết định chọn đề tài:
Xây Dng Chc Năng Tra Cu Thông Tin Văn Bn Da
Trên Web Ng Nghĩa Của H Thng Tic-Office làm luận
văn tt nghip.
Ni dung ca luận văn đưc tnh bày trong 5 chương,
bao gm:
Chương 1: Gii thiu và kho sátc h thng tìm kiếm
thông tin, phân ch đánh giá thc trng, trình bày mc tiêu, gii
hn ca đề tài, ý nghĩa lý lun và thc tiễn, phương pháp nghiên
cứu, hưng tiếp cn gii quyết vấn đề và ni dung thc hin ca
đề tài.
Chương 2: Tnh bày sở lý thuyết ca đề tài liên quan
đến vấn đ truy hi thông tin bao mô t cấu tc, các phương
pháp truy hồi thông tin và đánh giá h thng truy hi thông tin.
Các lý thuyết nn tng v mô hình không gian vector Ontology
ng vi các phương pháp xây dng mô hình d liu.
Chương 3: hình và giải pháp: Chương này đề xut
các mô hình gm mt mô hình ontology mô t tri thc v mt
lĩnh vc đặc biệt trong đó sử dng keyphrase là thành phn chính
để hình thành các khái nim ca ontology; Các k thut x lý i
3
liệu văn bản; Xây dng mô hình VSM trong tra cu tài liu
s dng ng nghĩa cho câu truy vn.
Chương 4: Cài đặt th nghim và đánh giá: Thiết kế mô
hình d liu ontology h tr x lý câu truy vn; Xây dng chc
năng tra cứu nâng cao cho h thng quản lý văn bản Tic-Office.
Tiến hành thc nghim, so sánh và đánh giá kết qu
Chương 5: Kết luận và hưng phát trin: Tng kết
nhng kết qu đạt đưc ca luận văn, nhng hn chế và hưng
phát trin ca đề tài trong tương lai.