Bài giảng Chương 1 - Lưu trữ và tìm kiếm thông tin
lượt xem 12
download
Bài giảng Chương 1 - Lưu trữ và tìm kiếm thông tin bao gồm các nội chính về: Nguyên tắc lưu trữ thông tin, các phương tin lưu trữ thông tin, phương thức và quá trình tìm tin... Đây là tài liệu rất bổ ích cho các bạn học chuyên ngành Thư viện thông tin. Mời các bạn cùng tham khảo.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng Chương 1 - Lưu trữ và tìm kiếm thông tin
- BÀI GIẢNG CHƯƠNG 1 LƢU TRỮ VÀ TÌM KIẾM THÔNG TIN
- 1. NGUYÊN TẮC LƢU TRỮ THÔNG TIN Giả sử D là tập hợp các tài liệu: D={1,2,3,4,5,6,7,8} 1,2,3,... là các số hiệu của tài liệu, nó là đặc trƣng hình thức của tài liệu T là tập hợp các chủ đề của tài liệu: T={A,B,C,D,E,F,G,H} Các từ khoá A=cây lúa, B=hoa màu, C=sâu bệnh, D=đất phèn E= cây ngô, F=thuỷ lợi,G=kỹ thuật trồng trọt, H=chăn nuôi, là đặc trƣng nội dung của tài liệu Giữa D và T xác định quan hệ hai ngôi R: iRx nếu “Tài liệu i nói về chủ đề x” Quan hệ này xác định tập con R của tích Đề các D*T. Quan hệ này có thể biểu diễn bằng một ma trận, gọi là ma trận tƣ liệu
- MA TRẬN TƢ LIỆU T A B C D E F G H D 1 + + + 2 + + + + 3 + + + + 4 + + + 5 + + + 6 + + 7 + + + + + 8 + + + +
- MA TRẬN TƢ LIỆU THỂ HIỆN HAI NGUYÊN TẮC LƢU TRỮ THÔNG TIN Lƣu trữ theo tài liệu: – Cắt ma trận theo chiều ngang: mỗi TL ứng với một phiếu nêu lên những chủ đề của TL TL 1 ứng với t1={A,C,G} Đây chính là các bản chỉ mục của TL, ghi trên phiếu hay biểu TL 2 ứng với t2={B,D,E,H} ghi mô tả thƣ mục của TL, ở .... mục “Từ khoá” Lƣu trữ theo nội dung chủ đề của tài liệu: – Cắt ma trận theo chiều dọc: mỗi TK ứng với một phiếu ghi số hiệu của tất cả những TL có nội dung đề cập tới chủ đề đó Đây chính là các bảng đảo của Chủ đề A ứng với dA={1,3,5,8} TL. Chúng lập thành bộ phiếu đảo (phiếu lỗ soi, phiếu uniterm, Chủ đề B ứng với dB={2,4,5,7,8} biểu ghi trong tệp đảo của CSDL .... thƣ mục)
- CÁC PHƢƠNG TIỆN LƢU TRỮ THÔNG TIN Phƣơng tiện lƣu trữ thông tin truyền thống: – Các bộ phiếu mục lục: Mục lục tác giả Mục lục chủ đề Mục lục địa lý Mục lục thời gian Mục lục xếp kho,... Phƣơng tiện lƣu trữ thông tin bán tự đông: – Phiếu lỗ mép – Phiếu lỗ soi Phƣơng tiện lƣu trữ thông tin tự động hoá: – Các biểu ghi trong các tệp dữ liệu của CSDL thƣ mục Tệp chủ Tệp đảo
- 2. LƢU TRỮ THÔNG TIN TRÊN MÁY TÍNH ĐIỆN TỬ Trong MTĐT thông tin đƣợc tổ chức và lƣu trữ dƣới dạng tệp dữ liệu. Các tệp lại có thể cấu trúc thành các biểu ghi, biểu ghi lại gồm nhiều trƣờng. Trong công tác TTTL, các tệp lƣu trữ các thông tin thƣ mục, gọi là tệp dữ liệu thƣ mục, ở đó: – Mỗi biểu ghi là một bản mô tả thƣ mục – Mỗi chỉ dẫn thƣ mục là một trƣờng. Có 3 loại tệp: – Tệp kế tiếp – Tệp truy nhập trực tiếp – Tệp đảo Việc quản lý dữ liệu trên máy tính đƣợc thực hiện bởi hai dạng chƣơng trình: – Hệ thống quản lý tệp – Hệ thống quản trị CSDL Phần mềm quản trị CSDL tài liệu, gọi là phần mềm tƣ liêu, ví dụ: CDS/ISIS.
- 3. TÌM TIN 3.1. PHƢƠNG THỨC TÌM TIN CƠ BẢN Phƣơng thức tìm tin cơ bản là phƣơng trình, tìm còn gọi là biểu thức tìm. Cú pháp của biểu thức tìm đƣợc xây dựng trên cơ sở của các phép toán của logic mệnh đề: AND, OR, NOT, và một số phép toán khác. – AND: nối 2 từ chuẩn trong bản chỉ mục của cùng một TL. – OR: nối 2 từ chuẩn mà ít nhất một trong hai từ đó có trong bản chỉ mục của TL. – NOT: nối 2 từ chuẩn mà từ thứ nhất có trong bản chỉ mục của TL, còn từ thứ hai thì không. Ví dụ: – Q = C and (A or B) not E hay Q = C*(A+B)^E (trong ISIS) – Câu trả lời là tập hợp: dQ= dc(dAdB)\dE
- 3.2. QUÁ TRÌNH TÌM TIN Quá trình tìm tin gồm 7 bƣớc: – 1. Xác định câu hỏi – 2. Thể hiện câu hỏi bằng ngôn ngữ tƣ liệu: lập biểu thức tìm (lệnh tìm). – 3. Vạch ra chiến lƣợc tìm: xác định bộ máy tra cứu sẽ sử dụng để tìm tin (mẫu tìm). – 4. Thực hiện tìm: so sánh lệnh tìm với mẫu tìm để tìm ra tài liệu thích hợp. – 5. Phân tích kết quả tìm, từ đó đánh giá tính đúng đắn của chiến lƣợc tìm (có thể phải quay về bƣớc 3) – 6. Chuyển kết quả tìm cho ngƣời dùng tin. – 7. Đánh giá tính phù hợp của thông tin nhận đƣợc (có thể phải quay về bƣớc 1).
- 3.3. TÌM TIN TRÊN MTĐT THÔNG QUA BỘ PHIẾU ĐẢO CSDL thƣ mục với cấu trúc tệp đảo, có hai loại tệp dữ liệu: – Tệp chủ: chứa các biểu ghi thƣ mục – Các tệp đảo kết hợp với tệp chủ: chứa các giá trị của các trƣờng, đƣợc lấy ra từ các biểu ghi trong tệp chủ, đƣợc coi là những điểm truy nhập thông tin. – Cấu trúc logic của biểu ghi trong tệp đảo: Sâu bệnh 71,88 Cây lúa 25,71,88 Chúng gọi chung là Việt Nam 44,88 các bảng đảo
- TÌM TIN VỚI BỘ PHIẾU ĐẢO: Quá trình tìm tin với bộ phiếu đảo: – Thể hiện câu hỏi bằng biểu thức tìm. – So sánh các điểm tiếp cận TT trong biểu thức tìm với các bảng đảo của chúng. – Các bảng đảo ứng với các yếu tố trong biểu thức tìm đƣợc đƣa ra trên một phiếu làm việc. – Phiếu làm việc dùng để thực hiện các phép toán logic trong biểu thức tìm. – Số hiệu các biểu ghi thoả mãn biểu thức tìm sẽ đƣợc chuyển qua bộ phiếu chủ để đƣa ra câu trả lời. Một ví dụ tìm tin trong CDS/ISIS
- LMÔ HÌNH HOÁ QUÁ TRÌNH TÌM TIN Giả sử D là tập hợp các TL, Q là tập hợp các câu hỏi. Tìm tin thực chất là một quan hệ R ứng tập con D’D với câu hỏi qQ. Việc thực hiện quan hệ R trong thực tế là rất khó, vì số TL thƣờng rất lớn. Vì thế ngƣời ta không chọn trên D các tài liệu thoả mãn câu hỏi q, mà chọn trên mô hình của chúng. Đó là tập F các ảnh y của x D, cho bởi song ánh I:DF, ứng x D với y=I(x) xác định nhƣ sau: I= {ax, bx, mx, rx}, trong đó: – ax là địa chỉ của x – bx là các đặc trung hình thức của x – mx các đặc trung nội dung của x Chúng gọi chung là – rx tóm tắt của x các mẫu tìm của x Để thực hiện ánh xạ I ngƣời ta dùng ngôn ngữ tƣ liệu.
- MÔ HÌNH HOÁ QUÁ TRÌNH TÌM TIN (TIẾP) Câu hỏi q đƣợc biểu diễn bằng ngôn ngữ tƣ liệu dƣới dạng một biểu thức tìm. Nhƣ vậy biểu thức tìm cũng có thể coi là ảnh của q qua ánh xạ I, I:qI(q) Nhờ ngôn ngữ tƣ liệu, ngƣời ta có thể so sánh biểu thức tìm (lệnh tìm) với mẫu tìm để xem tài liệu có phù hợp hay không. Việc so sánh này đƣợc thực hiện trên các bộ máy tra cứu: các bộ phiếu mục lục, các thƣ mục, các tệp của CSDL. Xem mô hình ở hình 20, trang 280 GT.
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Bài giảng Chương 1: Tổng quan về văn hóa học và văn hóa Việt Nam
17 p | 193 | 145
-
Bài giảng Chương 1: Chủ nghĩa duy vật biện chứng - Trần Đình Phụng
11 p | 642 | 109
-
Bài giảng Tâm lý học lao động: Chương 1 - ThS. Hoàng Thế Hải
12 p | 221 | 41
-
Bài giảng Tâm lý học đại cương: Chương 1 - ThS. Đoàn Thị Thanh Vân
11 p | 137 | 16
-
Bài giảng Phương pháp nghiên cứu khoa học - Chương 1: Tổng quan về đề tài nghiên cứu
7 p | 29 | 15
-
Bài giảng Tâm lý học đại cương: Chương 3.1 - ThS. Đoàn Thị Thanh Vân
7 p | 161 | 11
-
Bài giảng Tư tưởng Hồ Chí Minh - Chương 1: Khái niệm, đối tượng, phương pháp nghiên cứu và ý nghĩa học tập môn Tư tưởng Hồ Chí Minh (2022)
10 p | 36 | 10
-
Bài giảng Triết học - Chương 1: Triết học và vai trò của nó trong đời sống xã hội
14 p | 96 | 9
-
Bài giảng Chương 1: Đại cương về Lôgích học
9 p | 81 | 7
-
Bài giảng Quản trị thực hành trách nhiệm xã hội - Chương 1: Tổng quan về quản trị thực hành trách nhiệm xã hội (Trình độ Thạc sĩ)
18 p | 22 | 7
-
Bài giảng Chủ nghĩa xã hội khoa học - Chương 1: Nhập môn Chủ nghĩa xã hội khoa học (2022)
10 p | 35 | 6
-
bài giảng điện đại học công nghệ phần 1
10 p | 107 | 5
-
Bài giảng Khoa học đương đại và Phật giáo: Chương 1 - Nguyễn Hoàng Hải
10 p | 9 | 5
-
Bài giảng Kinh tế chính trị Mác - Lênin - Chương 1: Đối tượng, phương pháp nghiên cứu và chức năng của Kinh tế chính trị Mác - Lênin
7 p | 29 | 4
-
Bài giảng Lôgích học: Chương 1 - ĐH Kinh tế TP.HCM
19 p | 76 | 4
-
Bài giảng Triết học Mác - Lênin: Chương 01 - Triết học và vai trò của triết học trong đời sống xã hội
5 p | 19 | 4
-
Bài giảng Công tác kỹ sư - Chương 1: Kỹ sư và công tác kỹ sư
9 p | 5 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn