
BÀI GI NG TH VI N SẢ Ư Ệ Ố
CH NG 4: ƯƠ TÌM KI M THÔNG TINẾ
TS. Đ QUANG VINHỖ
HÀ N I - 2013Ộ

2
2
N I DUNGỘ
I. T NG QUAN V TH VI N S DLỔ Ề Ư Ệ Ố
II. MÔ HÌNH HÌNH TH C CHO TH VI N S DLỨ Ư Ệ Ố
III. CH M C TÀI LI UỈ Ụ Ệ
IV. TÌM KI M THÔNG TINẾ
V. CÁC CHU N S D NG TRONG TH VI N SẨ Ử Ụ Ư Ệ Ố
VI. TH C HÀNH H PH N M M Ự Ệ Ầ Ề
TH VI N S GREENSTONEƯ Ệ Ố

3
3
IV. TÌM KI M THÔNG TINẾ
4.1 MÔ HÌNH TÌM KI M THÔNG TIN Ế
Tìm ki m thông tin IR đ c p đ n t ch c, l u tr , tìm ki m ế ề ậ ế ổ ứ ư ữ ế
và đánh giá thông tin có liên quan t i nhu c u thông tin c a ớ ầ ủ
NSD.
Mô hình IR t ng quát là m t c p bao g m các đ i t ng và ổ ộ ặ ồ ố ượ
m t ánh x liên k t (“tìm ki m”) m t s đ i t ng v i m t ộ ạ ế ế ộ ố ố ượ ớ ộ
đ i t ng đ i di n cho m t truy v n. ố ượ ạ ệ ộ ấ
Cho
D = {d1, d2, ..., dM}, M ≥ 2 (4.1)
là m t t p h u h n không r ng đ i t ng.ộ ậ ữ ạ ỗ ố ượ
Chú ý: tr ng h p M = 1 có th đ c xem xét nh ng nó là ườ ợ ể ượ ư
t m th ng. Các đ i t ng tiêu bi u là đ i di n.ầ ườ ố ượ ể ạ ệ

4
4
Cho ℜ là m t ánh x tìm ki m t D vào trong l c l ng c a ộ ạ ế ừ ự ượ ủ
nó ρ(D), nghĩa là,
ℜ : D → ρ(D) (4.2)
B ng cách k t h p t p đ i t ng D và ánh x tìm ki m ằ ế ợ ậ ố ượ ạ ế
ℜ, chúng tôi đ nh nghĩa c u trúc tìm ki m thông tin nh sau:ị ấ ế ư
Đ nh nghĩa 4.1 (c u trúc tìm ki m thông tin):ị ấ ế
C u trúc tìm ki m thông tin ấ ế SIR là m t b 2 ộ ộ S = <D, ℜ>
(4.3)
Đ nh nghĩa 4.1 là m t đ nh nghĩa t ng quát: nó không đ c p ị ộ ị ổ ề ậ
đ n v các d ng riêng bi t c a ánh x tìm ki m ế ề ạ ệ ủ ạ ế ℜ và đ i ố
t ng D. T đó, các mô hình IR riêng bi t khác nhau có th ượ ừ ệ ể
nh n đ c b ng cách đ c t D và ậ ượ ằ ặ ả ℜ.

5
5
Đ nh nghĩa 4.2 (mô hình tìm ki m thông tin MIR):ị ế
Mô hình tìm ki m thông tin ếMIR là m t SIR ộS = <D, ℜ> v i 2 ớ
thu c tính sau đây:ộ
i. q = δ ⇒ µãi(q, δ) = 1 ∀i, q, δ (tính ph n x );ả ạ (4.4)
ii. ℜi (q) = {δ ∈ D| µãi(q, δ) = max µãk(q, δk)}∩ aαi, i c đ nh tùy ố ị
ý.
trong đó:
+ T = {t1, t2, ..., tN} là m t t p h u h n thu t ng ch m c, N ộ ậ ữ ạ ậ ữ ỉ ụ ≥ 1;
+ O = {o1, o2, ..., oU} là m t t p h u h n đ i t ng, U ộ ậ ữ ạ ố ượ ≥ 2;
+ (Dj)j ∈ J = {1, 2, ..., M} là m t h cluster đ i t ng, Dj ộ ọ ố ượ ∈ ρ(O),
M ≥ 2;