ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Nguyễn Thanhn
PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG
KT QU TR LI CHO
H THNG HỎI ĐÁP DANH SÁCH TING VIT
KHOÁ LUN TT NGHIỆP ĐẠI HC H CHÍNH QUY
Ngành: Công ngh Thông tin
HÀ NI - 2010
ĐẠI HC QUC GIA HÀ NI
TRƯỜNG ĐẠI HC CÔNG NGH
Nguyễn Thanhn
PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG
KT QU TR LI CHO
H THNG HỎI ĐÁP DANH SÁCH TING VIT
KHOÁ LUN TT NGHIỆP ĐẠI HC H CHÍNH QUY
Ngành: Công ngh Thông tin
Cán b hướng dn: PGS.TS Hà Quang Thy
Cán b đồng hướng dn: ThS. Trn Mai Vũ
HÀ NI - 2010
Li cảm ơn
Trước tiên, tôi xin gi li cảm ơn lòng biết ơn sâu sắc nht tới Phó Giáo
Tiến sĩ Hà Quang Thy, Thc sĩ Trn Mai Vũ và C nhân Hoàng Qunh nhng
người đã tn tình ch bảo hướng dn tôi trong quá trình thc hin khoá lun tt
nghip.
Tôi chân thành cảm ơn các thầy, cô cán b ca trường Đại Hc Công Ngh đã
to cho tôi những điều kin thun li để hc tp và nghiên cu.
Tôi cũng xin gửi li cảm ơn tới các anh ch và c bn sinh viên trong phòng thí
nghiệm Sislab đã giúp tôi rt nhiu trong vic thu thp và x lý d liu.
Cui cùng, tôi mun gi li cảm ơn tới gia đình và bn bè, những người thân yêu
luôn bên cạnh, động viên tôi trong sut quá trình thc hin ka lun tt nghip.
Tôi xin chân thành cảm ơn!
Sinh viên
Nguyn Thanh Sơn
m tt
Nh kh năng h tr ngưi dùng trong vic khai thác các tài nguyên trên Internet
mt cách hiu qu và d dàng, h thng hỏi đáp nói chung đã đưc quan tâm nghiên
cu t khá lâu, tuy nhiên các dng h thng hỏi đáp đc biệt, trong đó có h thng hi
đáp danh sách vẫn còn đang bước đu phát trin. H thng hi đáp danh sách h
thng hi đáp, nhn đu vào câu hi i dng ngôn ng t nhiên tr v câu tr
lời dưới dng mt danh sách. Ti Vit Nam, các nghiên cu v h thng hỏi đáp nói
chung, cũng như về h thng hi đáp danh sách nói riêng tập trung cho min d liu
tiếng Vit còn rt nhiu hn chế. Mt trong nhng do chính chúng ta còn thiếu
các công c x tiếng Vit, các tài ngun ngôn ng hc,
Khóa lun Phương pháp nâng cao cht lượng kết qu tr li cho h thng hi
đáp danh sách tiếng Vit tp trung nghiên cứu các phương pháp xây dng h thng hi
đáp danh sách đã đưc áp dng trên thế gii cũng nmột s phương pháp nâng cao
chất ng kết qu tr li cho dng h thng hỏi đáp này. Trên s c nghiên cu
nói trên, kết hp vi vic khảo sát điu kin thc tế ca các công c x ngôn ng
tiếng Vit, ka luận đ xut mô hình nâng cao chất lượng kết qu tr li cho h thng
hỏi đáp danh sách tiếng Vit s dng lut Wrapper lut ng nghĩa. Thực nghim
hình cho kết qu khá kh quan, đạt đ chính xác cho câu tr li cha 5 kết qu
93.87% so vi độ chính xác 82.11% ca pha hỏi đáp danh sách, đồng thi ha hn
nhiu tiềm năng nghiên cứu mi.
Mục lục
Li m đu .................................................................................................................. 1
Chương 1. Giới thiu h thng hi đáp danh sách ........................................................ 3
1.1. H thng hỏi đáp ............................................................................................... 3
1.1.1. Gii thiu chung .......................................................................................... 3
1.1.2. Mt s vn đ cn quan tâm ........................................................................ 4
1.1.3. Các bước x lý chung .................................................................................. 5
1.1.4. Tiêu chuẩn đánh giá..................................................................................... 6
1.1.5. Phân loi...................................................................................................... 7
1.2. H thng hỏi đáp danh sách ............................................................................. 10
1.2.1. Gii thiu .................................................................................................. 10
1.2.2. Mt s ng tiếp cn xây dng h thng hi đáp danh sách..................... 10
1.2.3. Nhng vn đề cn gii quyết khi xây dng h hi đáp danh sách ............... 11
Chương 2. Các nghiên cu liên quan ......................................................................... 13
2.1. Mt s h thng hỏi đáp danh sách đin hình ................................................... 13
2.1.1. H thng hỏi đáp danh sách FADA ........................................................... 16
2.1.2. H thng hỏi đáp Ephyra ........................................................................... 20
2.2. Nâng cao chất lượng tr li cho h thng hi đáp danh sách ............................ 23
Chương 3: Đ xut mô hình nâng cao cht lượng câu tr li cho h thng hỏi đáp danh
sách tiếng Vit ........................................................................................................... 28
3.1. Mô hình nâng cao chất lượng câu tr li cho h thng hi đáp danh sách tiếng
Vit ........................................................................................................................ 28
3.2. Pha 1: Hỏi đáp danh sách tiếng Vit ................................................................ 29
3.2.1. Tìm kiếm câu tr li da vào các mu quan h thượng h danh ................. 29
3.2.2. Mônh pha 1: H thng hỏi đáp danh sách .............................................. 30
3.3. Pha 2: M rng thc th .................................................................................. 32