BÀI GI NG TH VI N S Ư
CH NG 4: ƯƠ TÌM KI M THÔNG TIN
TS. Đ QUANG VINH
HÀ N I - 2013
2
2
N I DUNG
I. T NG QUAN V TH VI N S DL Ư
II. MÔ HÌNH HÌNH TH C CHO TH VI N S DL Ư
III. CH M C TÀI LI U
IV. TÌM KI M THÔNG TIN
V. CÁC CHU N S D NG TRONG TH VI N S Ư
VI. TH C HÀNH H PH N M M
TH VI N S GREENSTONEƯ
3
3
IV. TÌM KI M THÔNG TIN
4.1 MÔ HÌNH TÌM KI M THÔNG TIN
Tìm ki m tng tin IR đ c p đ n t ch c, l u tr , tìm ki m ế ế ư ế
và đánh g tng tin liên quan t i nhu c u thông tin c a
NSD.
Mô nh IR t ng quát m t c p bao g m các đ i t ng ượ
m t ánh x liên k t (“tìm ki m”) m t s đ i t ng v i m t ế ế ượ
đ i t ng đ i di n cho m t truy v n. ượ
Cho
D = {d1, d2, ..., dM}, M 2 (4.1)
m t t p h u h n kng r ng đ i t ng. ượ
C ý: tr ng h p M = 1 th đ c xem xét nh ng ườ ượ ư
t m th ng. Các đ i t ng tiêu bi u đ i di n. ườ ượ
4
4
Cho m t ánh x tìm ki m t D vào trong l c l ng c a ế ượ
nó ρ(D), nghĩa là,
: D ρ(D) (4.2)
B ng ch k t h p t p đ i t ng D ánh x tìm ki m ế ượ ế
, chúng tôi đ nh nghĩa c u tc tìm ki m thông tin nh sau: ế ư
Đ nh nghĩa 4.1 (c u trúc tìm ki m thông tin): ế
C u tc tìm ki m thông tin ế SIR m t b 2 S = <D, >
(4.3)
Đ nh nghĩa 4.1 m t đ nh nghĩa t ng quát: không đ c p
đ n v c d ng riêng bi t c a ánh x tìm ki m ế ế và đ i
t ng D. T đó, c mô hình IR riêng bi t khác nhau th ượ
nh n đ c b ngch đ c t D và ượ .
5
5
Đ nh nghĩa 4.2 ( hình tìm ki m thông tin MIR): ế
Mô hình m ki m thông tin ếMIR m t SIR S = <D, > v i 2
thu cnh sau đây:
i. q = δ µãi(q, δ) = 1 i, q, δ (nh ph n x ); (4.4)
ii. i (q) = {δ D| µãi(q, δ) = max µãk(q, δk)} aαi, i c đ nh y
ý.
trong đó:
+ T = {t1, t2, ..., tN} m t t p h u h n thu t ng ch m c, N 1;
+ O = {o1, o2, ..., oU} m t t p h u h n đ i t ng, U ượ 2;
+ (Dj)j J = {1, 2, ..., M} m t h cluster đ i t ng, Dj ượ ρ(O),
M 2;