YOMEDIA
Bài giảng Chương 1 - Lưu trữ và tìm kiếm thông tin
Chia sẻ: Trần Liên
| Ngày:
| Loại File: PPT
| Số trang:12
217
lượt xem
12
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Bài giảng Chương 1 - Lưu trữ và tìm kiếm thông tin bao gồm các nội chính về: Nguyên tắc lưu trữ thông tin, các phương tin lưu trữ thông tin, phương thức và quá trình tìm tin... Đây là tài liệu rất bổ ích cho các bạn học chuyên ngành Thư viện thông tin. Mời các bạn cùng tham khảo.
AMBIENT/
Chủ đề:
Nội dung Text: Bài giảng Chương 1 - Lưu trữ và tìm kiếm thông tin
- BÀI GIẢNG
CHƯƠNG 1
LƢU TRỮ VÀ TÌM KIẾM THÔNG TIN
- 1. NGUYÊN TẮC LƢU TRỮ THÔNG TIN
Giả sử D là tập hợp các tài liệu:
D={1,2,3,4,5,6,7,8}
1,2,3,... là các số hiệu của tài liệu, nó là đặc trƣng hình
thức của tài liệu
T là tập hợp các chủ đề của tài liệu:
T={A,B,C,D,E,F,G,H}
Các từ khoá A=cây lúa, B=hoa màu, C=sâu bệnh, D=đất phèn
E= cây ngô, F=thuỷ lợi,G=kỹ thuật trồng trọt, H=chăn nuôi,
là đặc trƣng nội dung của tài liệu
Giữa D và T xác định quan hệ hai ngôi R:
iRx nếu “Tài liệu i nói về chủ đề x”
Quan hệ này xác định tập con R của tích Đề các
D*T. Quan hệ này có thể biểu diễn bằng một ma
trận, gọi là ma trận tƣ liệu
- MA TRẬN TƢ LIỆU
T A B C D E F G H
D
1 + + +
2 + + + +
3 + + + +
4 + + +
5 + + +
6 + +
7 + + + + +
8 + + + +
- MA TRẬN TƢ LIỆU THỂ HIỆN HAI NGUYÊN TẮC LƢU TRỮ
THÔNG TIN
Lƣu trữ theo tài liệu:
– Cắt ma trận theo chiều ngang: mỗi TL ứng với một
phiếu nêu lên những chủ đề của TL
TL 1 ứng với t1={A,C,G} Đây chính là các bản chỉ mục
của TL, ghi trên phiếu hay biểu
TL 2 ứng với t2={B,D,E,H} ghi mô tả thƣ mục của TL, ở
.... mục “Từ khoá”
Lƣu trữ theo nội dung chủ đề của tài liệu:
– Cắt ma trận theo chiều dọc: mỗi TK ứng với một phiếu
ghi số hiệu của tất cả những TL có nội dung đề cập tới
chủ đề đó Đây chính là các bảng đảo của
Chủ đề A ứng với dA={1,3,5,8} TL. Chúng lập thành bộ phiếu
đảo (phiếu lỗ soi, phiếu uniterm,
Chủ đề B ứng với dB={2,4,5,7,8}
biểu ghi trong tệp đảo của CSDL
.... thƣ mục)
- CÁC PHƢƠNG TIỆN LƢU TRỮ THÔNG TIN
Phƣơng tiện lƣu trữ thông tin truyền thống:
– Các bộ phiếu mục lục:
Mục lục tác giả
Mục lục chủ đề
Mục lục địa lý
Mục lục thời gian
Mục lục xếp kho,...
Phƣơng tiện lƣu trữ thông tin bán tự đông:
– Phiếu lỗ mép
– Phiếu lỗ soi
Phƣơng tiện lƣu trữ thông tin tự động hoá:
– Các biểu ghi trong các tệp dữ liệu của CSDL thƣ mục
Tệp chủ
Tệp đảo
- 2. LƢU TRỮ THÔNG TIN TRÊN MÁY TÍNH ĐIỆN TỬ
Trong MTĐT thông tin đƣợc tổ chức và lƣu trữ dƣới dạng tệp
dữ liệu. Các tệp lại có thể cấu trúc thành các biểu ghi, biểu
ghi lại gồm nhiều trƣờng.
Trong công tác TTTL, các tệp lƣu trữ các thông tin thƣ mục,
gọi là tệp dữ liệu thƣ mục, ở đó:
– Mỗi biểu ghi là một bản mô tả thƣ mục
– Mỗi chỉ dẫn thƣ mục là một trƣờng.
Có 3 loại tệp:
– Tệp kế tiếp
– Tệp truy nhập trực tiếp
– Tệp đảo
Việc quản lý dữ liệu trên máy tính đƣợc thực hiện bởi hai
dạng chƣơng trình:
– Hệ thống quản lý tệp
– Hệ thống quản trị CSDL
Phần mềm quản trị CSDL tài liệu, gọi là phần mềm tƣ liêu, ví
dụ: CDS/ISIS.
- 3. TÌM TIN
3.1. PHƢƠNG THỨC TÌM TIN CƠ BẢN
Phƣơng thức tìm tin cơ bản là phƣơng trình, tìm còn gọi là
biểu thức tìm.
Cú pháp của biểu thức tìm đƣợc xây dựng trên cơ sở của
các phép toán của logic mệnh đề: AND, OR, NOT, và một
số phép toán khác.
– AND: nối 2 từ chuẩn trong bản chỉ mục của cùng một TL.
– OR: nối 2 từ chuẩn mà ít nhất một trong hai từ đó có trong bản chỉ
mục của TL.
– NOT: nối 2 từ chuẩn mà từ thứ nhất có trong bản chỉ mục của TL,
còn từ thứ hai thì không.
Ví dụ:
– Q = C and (A or B) not E hay Q = C*(A+B)^E (trong ISIS)
– Câu trả lời là tập hợp: dQ= dc(dAdB)\dE
- 3.2. QUÁ TRÌNH TÌM TIN
Quá trình tìm tin gồm 7 bƣớc:
– 1. Xác định câu hỏi
– 2. Thể hiện câu hỏi bằng ngôn ngữ tƣ liệu: lập biểu thức
tìm (lệnh tìm).
– 3. Vạch ra chiến lƣợc tìm: xác định bộ máy tra cứu sẽ
sử dụng để tìm tin (mẫu tìm).
– 4. Thực hiện tìm: so sánh lệnh tìm với mẫu tìm để tìm
ra tài liệu thích hợp.
– 5. Phân tích kết quả tìm, từ đó đánh giá tính đúng đắn
của chiến lƣợc tìm (có thể phải quay về bƣớc 3)
– 6. Chuyển kết quả tìm cho ngƣời dùng tin.
– 7. Đánh giá tính phù hợp của thông tin nhận đƣợc (có
thể phải quay về bƣớc 1).
- 3.3. TÌM TIN TRÊN MTĐT THÔNG QUA BỘ
PHIẾU ĐẢO
CSDL thƣ mục với cấu trúc tệp đảo, có hai loại tệp
dữ liệu:
– Tệp chủ: chứa các biểu ghi thƣ mục
– Các tệp đảo kết hợp với tệp chủ: chứa các giá trị của
các trƣờng, đƣợc lấy ra từ các biểu ghi trong tệp chủ,
đƣợc coi là những điểm truy nhập thông tin.
– Cấu trúc logic của biểu ghi trong tệp đảo:
Sâu bệnh 71,88
Cây lúa 25,71,88 Chúng gọi chung là
Việt Nam 44,88 các bảng đảo
- TÌM TIN VỚI BỘ PHIẾU ĐẢO:
Quá trình tìm tin với bộ phiếu đảo:
– Thể hiện câu hỏi bằng biểu thức tìm.
– So sánh các điểm tiếp cận TT trong biểu thức tìm với
các bảng đảo của chúng.
– Các bảng đảo ứng với các yếu tố trong biểu thức tìm
đƣợc đƣa ra trên một phiếu làm việc.
– Phiếu làm việc dùng để thực hiện các phép toán logic
trong biểu thức tìm.
– Số hiệu các biểu ghi thoả mãn biểu thức tìm sẽ đƣợc
chuyển qua bộ phiếu chủ để đƣa ra câu trả lời.
Một ví dụ tìm tin trong CDS/ISIS
- LMÔ HÌNH HOÁ QUÁ TRÌNH TÌM TIN
Giả sử D là tập hợp các TL, Q là tập hợp các câu hỏi. Tìm
tin thực chất là một quan hệ R ứng tập con D’D với câu
hỏi qQ.
Việc thực hiện quan hệ R trong thực tế là rất khó, vì số TL
thƣờng rất lớn.
Vì thế ngƣời ta không chọn trên D các tài liệu thoả mãn
câu hỏi q, mà chọn trên mô hình của chúng. Đó là tập F
các ảnh y của x D, cho bởi song ánh I:DF, ứng x D
với y=I(x) xác định nhƣ sau: I= {ax, bx, mx, rx}, trong đó:
– ax là địa chỉ của x
– bx là các đặc trung hình thức của x
– mx các đặc trung nội dung của x
Chúng gọi chung là
– rx tóm tắt của x các mẫu tìm của x
Để thực hiện ánh xạ I ngƣời ta dùng ngôn ngữ tƣ liệu.
- MÔ HÌNH HOÁ QUÁ TRÌNH TÌM TIN (TIẾP)
Câu hỏi q đƣợc biểu diễn bằng ngôn ngữ tƣ liệu
dƣới dạng một biểu thức tìm. Nhƣ vậy biểu thức
tìm cũng có thể coi là ảnh của q qua ánh xạ I,
I:qI(q)
Nhờ ngôn ngữ tƣ liệu, ngƣời ta có thể so sánh biểu
thức tìm (lệnh tìm) với mẫu tìm để xem tài liệu có
phù hợp hay không.
Việc so sánh này đƣợc thực hiện trên các bộ máy
tra cứu: các bộ phiếu mục lục, các thƣ mục, các
tệp của CSDL.
Xem mô hình ở hình 20, trang 280 GT.
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
ERROR:connection to 10.20.1.98:9315 failed (errno=111, msg=Connection refused)
ERROR:connection to 10.20.1.98:9315 failed (errno=111, msg=Connection refused)
Đang xử lý...