intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Giáo trình Hệ thống tìm tin: Phần 2 - TS. Ngô Thanh Thảo

Chia sẻ: Hoa La Hoa | Ngày: | Loại File: PDF | Số trang:53

207
lượt xem
56
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phần 2 Giáo trình "Hệ thống tìm tin" của TS. Ngô Thanh Thảo được biên soạn gồm nội dung chương 5 đến chương 7 của tài liệu. Nội dung phần này gồm có các nội dung chính sau: Hệ thống tìm tin thủ công, hệ thống tìm tin tự động hóa, đánh giá hiệu quả của hoạt động hệ thống tìm tin. Đây là giáo trình dành cho sinh viên ngành Thông tin - Thư viện.

Chủ đề:
Lưu

Nội dung Text: Giáo trình Hệ thống tìm tin: Phần 2 - TS. Ngô Thanh Thảo

  1. CHƯƠNG 5 HỆ THỐNG TÌM TIN THỦ CÔNG Hệ thống tìm tin thủ công bao gồm các thành phần chính là hệ thống mục lục, các bộ phiếu thư mục và các bộ phiếu dữ kiện. 5.1. Hệ thống mục lục 5.1.1. Khái niệm Hệ thống mục lục thư viện (hay thường ñược gọi là mục lục) là một tập hợp có tổ chức các biểu ghi phản ánh vốn tài liệu của một kho tài liệu hay một bộ sưu tập nào ñó. Một bộ sưu tập có thể bao gồm một hoặc nhiều loại hình tài liệu như sách, ấn phẩm ñịnh kỳ, bản ñồ, tranh ảnh, băng hình…Thông thường, mục lục phản ánh vốn tài liệu của một thư viện hoặc cơ quan thông tin. Tuy nhiên, cũng có những mục lục phản ánh vốn tài liệu của nhiều thư viện, cơ quan thông tin nhằm hỗ trợ cho việc chia sẻ nguồn lực thông tin giữa các tổ chức như mục lục liên hợp. Việc tổ chức mục lục trở nên cần thiết ñối với một thư viện khi vốn tài liệu phát triển ñến mức không thể kiểm soát ñược từng tài liệu trong kho. Một thư viện tư nhân nhỏ hoặc một thư viện của lớp học không nhất thiết phải tổ chức mục lục vì người sử dụng có thể nhớ từng quyển sách, băng ghi âm, bản ñồ và các tài liệu khác theo các dấu hiệu như tác giả, nhan ñề, chủ ñề, hình dáng, màu sắc hay thậm chí vị trí của tài liệu trên một giá sách cụ thể. Nếu vốn tài liệu lớn hơn một chút thì thư viện có thể sắp xếp tài liệu theo một cách nào ñó, chẳng hạn như phân nhóm tài liệu theo chủ ñề và cho phép người sử dụng tự chọn tài liệu trong kho. Khi vốn tài liệu quá lớn ñến mức không thể sử dụng cách sắp xếp và tìm tài liệu ñơn giản thì thư viện phải lập biểu ghi hay phiếu mô tả chính thức cho từng tài liệu ñể có thể dễ dàng tìm kiếm, kiểm kê và quản lý tài liệu. 5.1.2. Chức năng của mục lục Mục lục có các chức năng cơ bản là nhận dạng, tập hợp, ñánh giá hay chọn lọc và xác ñịnh vị trí của tài liệu. Các chức năng này có sự phụ thuộc lẫn nhau. Chức năng nhận dạng hay tìm kiếm tài liệu. Mục lục ñược xây dựng nhằm tạo ñiều kiện cho người sử dụng có thể ñối chiếu các dữ liệu về tài liệu ñã biết với các biểu ghi trong mục lục ñể xác ñịnh thư viện có tài liệu ñó hay không. Nói cách khác, mục lục cho phép người sử dụng nhận dạng hoặc tìm kiếm tài liệu dựa trên các dữ liệu ñã biết về tài liệu như tác giả, nhan ñề, chủ ñề… Chức năng tập hợp tài liệu. Chức năng này cho phép các biểu ghi của các tài liệu giống nhau hoặc có liên quan chặt chẽ với nhau về một phương diện hoặc dấu hiệu nào ñó ñược tập hợp vào một chỗ trong mục lục. Chẳng hạn, các tài liệu về cùng một chủ ñề ñược tập hợp lại với nhau trong mục lục chủ ñề hay mục lục phân loại, các tài liệu của cùng một tác giả ñược xếp cùng nhau trong mục lục chữ cái. Nhờ ñó, người 59
  2. sử dụng có thể biết ñược trong một thư viện, cơ quan thông tin có bao nhiêu tài liệu của một tác giả nào ñó hoặc có bao nhiêu tài liệu về một chủ ñề nào ñó…Một trong những cách tốt nhất ñể thực hiện chức năng tập hợp tài liệu là thông qua quá trình kiểm soát tiêu ñề chuẩn, ñặc biệt là xây dựng hệ thống tham chiếu (chỉ chỗ) qua lại. Chức năng ñánh giá hay chọn lọc tài liệu. Chức năng này cho phép người sử dụng lựa chọn từ nhiều biểu ghi những tài liệu thích hợp nhất và tốt nhất chứa ñựng kiến thức hoặc thông tin cần thiết. Chẳng hạn, người sử dụng có thể lựa chọn một lần xuất bản nào ñó trong nhiều lần xuất bản khác nhau của cùng một tác phẩm hoặc lựa chọn những tài liệu có cùng một nội dung nhưng ñược viết bởi các tác giả khác nhau và ñược chứa trên các vật mang tin khác nhau… Chức năng xác ñịnh vị trí tài liệu. Mục lục phản ánh ñịa chỉ lưu trữ tài liệu trong kho của một hoặc một số thư viện, cơ quan thông tin. Nhờ ñó, người sử dụng có thể dễ dàng xác ñịnh ñược vị trí của tài liệu cần tìm. 5.1.3. Các hình thức mục lục thủ công 5.1.3.1. Mục lục sách Mục lục sách là mục lục ñược ghi chép hoặc in dưới dạng các tập sách. Mục lục sách thường là các danh mục tài liệu ñược sắp xếp theo vần chữ cái tên tác giả, nhan ñề hoặc theo chủ ñề. So với mục lục phiếu, mục lục sách có ưu ñiểm là có ñộ nén cao, cơ ñộng, có thể ñem theo ñể sử dụng ở mọi nơi và có thể xem lướt nhanh. Tuy nhiên, mục lục sách có hạn chế là chi phí cập nhật cao nên mục lục sách không ñược cập nhật thường xuyên như mục lục phiếu. Hiện nay mục lục sách vẫn ñược sử dụng cùng với các loại mục lục khác trong nhiều thư viện. ðặc biệt, mục lục lục sách vẫn ñược sử dụng như phương tiện duy nhất ñể truy cập các tài liệu quí hiếm trong một số thư viện và cơ quan lưu trữ. 5.1.3.2. Mục lục phiếu Mục lục phiếu là mục lục ñược tạo thành từ những phiếu mô tả (biểu ghi) với kích thước khác nhau. Hiện nay, kích thước của phiếu chuẩn là 7,5 x 12,5 cm. Các phiếu mô tả có thể ñược chép tay, ñánh máy hoặc ñược in từ máy tính. Bên cạnh những hạn chế như thiếu tính gọn nén, chiếm nhiều diện tích, không cơ ñộng, mục lục phiếu cũng có các ưu ñiểm như dễ cập nhật và cho phép nhiều người sử dụng cùng một lúc. Hiện nay mục lục phiếu vẫn ñược sử dụng trong nhiều thư viện. Có nhiều lý do ñể các thư viện duy trì mục lục phiếu như thư viện không có khả năng và ñiều kiện trang bị phần mềm và thiết bị cần thiết cho mục lục ñiện tử; thư viện không có khả năng chuyển ñổi hồi cố hoàn toàn mục lục phiếu sang mục lục ñiện tử hoặc ñơn giản là do nó phù hợp với thói quen của người sử dụng thư viện. 5.1.4. Tiêu chí ñánh giá chất lượng mục lục Dù ñược tổ chức dưới bất kỳ hình thức nào, một mục lục hiệu quả phải ñảm bảo một số tiêu chuẩn nhất ñịnh cho phép tra cứu và quản trị dễ dàng. Có thể ñánh giá chất lượng của một mục lục dựa trên các tiêu chí dưới ñây. 60
  3. Tính linh hoạt và cập nhật. Việc bổ sung và thanh lọc tài liệu ñược tiến hành thường xuyên trong các thư viện, cơ quan thông tin. Mục lục phải phản ánh kịp thời sự thay ñổi trong vốn tài liệu của thư viện, cơ quan thông tin. Tính linh hoạt ở mục lục phiếu cao hơn so với mục lục dạng sách. Có thể dễ dàng thêm vào hay loại bỏ các biểu ghi khỏi các hộp phiếu khi cần thiết. So với mục lục phiếu thì mục lục sách khó cập nhật hơn vì một khi ñã ñược in ra thì không thể thêm vào hoặc loại bỏ các biểu ghi ñược nữa, trừ khi xuất bản các phụ trương hoặc tái bản. Tuy nhiên, vì hiện nay các mục lục này ñược biên soạn bằng máy tính nên có thể thay ñổi các biểu ghi hiện có một cách linh hoạt. Ví dụ, chỉ cần sử dụng một lệnh ñơn giản là có thể thay ñổi hàng loạt biểu ghi, trong khi với mục lục phiếu thì phải sửa từng phiếu một. Tính thân thiện ñối với người sử dụng. Mục lục phải ñược tổ chức sao cho người sử dụng có thể tìm kiếm nhanh chóng và dễ dàng các biểu ghi. ðiều này ñòi hỏi cách sắp xếp các biểu ghi trong mục lục phải khoa học, phù hợp với thói quen tìm tin của người dùng tin và các hướng dẫn sử dụng phải rõ ràng, dễ hiểu. Tính kinh tế. Mục lục phải ñược tổ chức với các phương án hợp lý, có tính ñến chi phí xây dựng, duy trì mục lục cũng như hiệu quả kinh tế của mục lục. Phiếu dùng cho các mục lục phiếu dễ sản xuất và chi phí không cao. Trong khi ñó, giá thành biên soạn và xuất bản mục lục sách tương ñối cao nếu như chỉ sản xuất ít bản. Nếu số bản mục lục ñược xuất bản nhiều thì chi phí sẽ thấp hơn so với mục lục phiếu. Tính sử dụng thuận tiện. Mục lục phải gọn nhẹ, chiếm ít diện tích và dễ dàng truy cập ñối với người sử dụng. 5.1.5. Các thành phần của hệ thống mục lục Một hệ thống mục lục truyền thống gồm ba thành phần là mục lục công cộng, mục lục công vụ và hộp phiếu tiêu ñề chuẩn Mục lục công cộng (public access catalog) là mục lục dành cho người sử dụng truy cập tự do. Tùy theo cách sắp xếp các phiếu mô tả, có thể chia mục lục công cộng thành mục lục chữ cái, mục lục phân loại, mục lục chủ ñề. Mục lục công vụ là mục lục sử dụng nội bộ (thường là mục lục vị trí, tổng mục lục chữ cái) phục vụ cho hoạt ñộng nghiệp vụ của nhân viên thư viện. Mục lục vị trí phản ánh tổ chức kho tài liệu của một thư viện. Các phiếu mô tả trong mục lục ñược sắp xếp theo trật tự của tài liệu trên giá. Vì vậy, mục lục vị trí còn ñược gọi là mục lục xếp giá. Các phiếu mô tả của mục lục vị trí thường phản ánh ñầy ñủ số lượng bản/tập và vị trí của các tài liệu trong kho, ñặc biệt khi một thư viện có nhiều kho tài liệu. Mục lục vị trí thường ñược bảo quản và sử dụng nội bộ ở bộ phận tổ chức kho. Các hộp phiếu tiêu ñề chuẩn chứa các phiếu thể hiện các hình thức tên cá nhân và tập thể, nhan ñề thống nhất, tùng thư và các ñề mục chủ ñề ñã ñược lựa chọn là các hình thức chuẩn ñể sử dụng như các tiêu ñề trong một mục lục cụ thể. Các hộp phiếu tiêu ñề chuẩn cũng chứa danh mục các tham chiếu dùng trong mục lục công cộng ñể 61
  4. chỉ chỗ từ dạng không chuẩn sang dạng chuẩn ñược sử dụng làm tiêu ñề. Các hộp phiếu này thường ñược sử dụng nội bộ. 5.1.6. Hệ thống mục lục chữ cái (MLCC) 5.1.6.1. Khái niệm Mục lục chữ cái là hệ thống mục lục trong ñó các phiếu mô tả ñược sắp xếp theo trật tự chữ cái tên tác giả hoặc nhan ñề tài liệu ñược phản ánh trong mục lục. Mục lục chữ cái là hệ thống tìm tin ñược tổ chức theo sơ ñồ tuyến tính. Trong mục lục chữ cái, thông tin về mỗi tài liệu ñược trình bày trên một phiếu mô tả. Các phiếu mô tả ñược sắp xếp dựa trên các ñặc trưng hình thức của tài liệu là tên tác giả/nhan ñề tài liệu. Cách sắp xếp này cho phép người sử dụng có thể trả lời ñược hai câu hỏi cơ bản sau: 1) Thư viện có hay không một tài liệu cụ thể với tên tác giả và/hoặc nhan ñề ñã ñược biết trước; 2) Thư viện có những tác phẩm nào của một tác giả cụ thể. Mục lục chữ cái phản ánh ñầy ñủ và toàn diện vốn tài liệu của thư viện vì thành phần của mục lục không chỉ có các phiếu mô tả chính mà còn bao gồm các phiếu mô tả bổ sung và các phiếu chỉ chỗ. 5.1.6.2. Cấu trúc mục lục chữ cái Các thành phần của mục lục chữ cái bao gồm các phiếu mô tả, các phiếu tiêu ñề và các phiếu chỉ chỗ. Phiếu mô tả Phiếu mô tả trình bày các yếu tố ñặc trưng cơ bản của một tài liệu dưới một hình thức chuẩn hóa giúp người sử dụng nhận dạng và phân biệt tài liệu này với các tài liệu khác. Phiếu mô tả có kích thước theo qui ñịnh là 7,5 x 12,5cm . Có hai loại phiếu mô tả là phiếu mô tả chính và phiếu mô tả bổ sung. Phiếu mô tả chính chứa ñầy ñủ các dữ liệu thư mục cho phép nhận dạng tài liệu và là thành phần chính trong các hệ thống mục lục. Phiếu mô tả bổ sung chứa mô tả giản lược, hỗ trợ cho phiếu mô tả chính nhằm mở rộng khả năng tìm tin cho người sử dụng. Người ta chọn một trong các ñiểm truy cập làm tiêu ñề của phiếu mô tả chính. Các ñiểm truy cập còn lại ñược sử dụng làm các tiêu ñề của các phiếu mô tả bổ sung. Tên tác giả và nhan ñề thường ñược dùng làm tiêu ñề của phiếu mô tả chính. Phiếu tiêu ñề Phiếu tiêu ñề ñược sử dụng ñể phân chia giới hạn các phiếu mô tả theo các từ, cụm từ nhằm tạo ñiều kiện thuận tiện cho người sử dụng. Phiếu tiêu ñề ñược làm bằng loại giấy cứng, có kích thước 7,5 x 12,5 cm và có phần nhô lên cao 1,5 cm (ñược gọi là gờ phiếu) Có hai loại phiếu tiêu ñề là phiếu tiêu ñề chính và phiếu tiêu ñề phụ. Phiếu tiêu ñề chính có phần gờ nhô phiếu lên ở giữa, chiếm 2/3 chiều rộng của phiếu. Phiếu tiêu ñề chính ñược sử dụng ñể phân ñịnh giới hạn các vần chữ cái của ngôn ngữ ñược sử dụng hoặc các tác giả nổi tiếng, các cơ quan, tổ chức quan trọng. Phiếu tiêu ñề phụ có gờ nhô lên bên phải hoặc bên trái và chiếm 1/3 hoặc ¼ chiều rộng của phiếu. Phiếu tiêu ñề phụ ñược sử dụng ñể phân biệt các phiếu trong cùng một vần (ví dụ C, CH hoặc N, NH) hoặc các tác giả nổi tiếng, tác giả có nhiều tài liệu. Phiếu chỉ chỗ 62
  5. ðể kiểm soát tính thống nhất trong hệ thống mục lục nhằm tạo ñiều kiện thuận tiện cho việc sử dụng, bên cạnh các phiếu mô tả mục lục chữ cái còn có các phiếu chỉ chỗ (cũng ñược xếp theo vần chữ cái). Phiếu chỉ chỗ (“xem”, “dùng cho”) ñược sử dụng ñể hướng dẫn người sử dụng ñến tiêu ñề mô tả thống nhất ñược sử dụng trong mục lục. Ví dụ: Trần Tế Xương xem Tú Xương Phiếu chỉ chỗ qua lại (“cũng xem”) ñược dùng ñể hướng dẫn người sử dụng tìm thêm những tiêu ñề khác trong mục lục có liên quan ñến vấn ñề ñang ñược tra cứu. 5.1.6.3.Cách tổ chức phiếu mô tả trong mục lục chữ cái Có hai kiểu sắp xếp phiếu mô tả trong MLCC là kiểu từ ñiển và kiểu phân ñoạn. Mục lục chữ cái kiểu từ ñiển. Cách tổ chức theo kiểu từ ñiển ñược sử dụng phổ biến ở Mỹ cho ñến những năm 1990. Trong MLCC kiểu từ ñiển, tất cả các phiếu mô tả có tiêu ñề là tên tác giả, nhan ñề tài liệu, chủ ñề ñược xếp chung theo trật tự chữ cái, lần lượt theo từng từ một. Cách sắp xếp này ñơn giản, dễ tra cứu nếu số phiếu mô tả ít và tập trung trong một ô phiếu. Tuy nhiên, khi thư viện phát triển, cách sắp xếp này trở nên cồng kềnh và phức tạp vì các phiếu mô tả sẽ ñược xếp dàn trải trong nhiều ô phiếu khác nhau. Khi ñó, cách sắp xếp sẽ trở nên phức tạp vì phải cân nhắc vị trí của các phiếu mô tả. Chẳng hạn, phiếu mô tả các tác phẩm của Charles Dicken ñược sắp xếp sau hay trước các phiếu mô tả của các tác phẩm viết về ông? Ngoài ra, còn xuất hiện một vấn ñề khác là các phiếu mô tả các tài liệu về cùng một chủ ñề bị phân tán ở nhiều chỗ trong mục lục. Trên thực tế, mục lục kiểu từ ñiển vẫn ñược sử dụng phổ biến vì phần lớn người sử dụng tìm tài liệu về một khía cạnh của vấn ñề nhiều hơn là tìm hiểu vấn ñề một cách toàn diện. Bên cạnh ñó, người sử dụng có thể sử dụng hệ thống các phiếu chỉ chỗ (“xem”, “cũng xem”) ñể tìm các khía cạnh khác nhau của các vấn ñề. Mục lục chữ cái kiểu phân ñoạn. Mục lục chữ cái phân ñoạn ñược ñưa vào sử dụng từ những năm 1930 ñể khắc phục nhược ñiểm của mục lục kiểu từ ñiển. Mục lục chữ cái ñược phân chia thành hai loại là mục lục chủ ñề và mục lục chữ cái tác giả/nhan ñề. Cách sắp xếp phiếu mô tả trong mục lục chữ cái kiểu phân ñoạn ñơn giản hơn trong mục lục kiểu từ ñiển và việc tra cứu cũng dễ dàng hơn tuy hiện tượng tài liệu về cùng một chủ ñề bị phân tán vẫn không khắc phục ñược. Ngoài ra, với cách sắp xếp này lại có sự bất tiện khác là trước khi tra cứu người sử dụng phải xác ñịnh mình cần tìm theo tác giả, nhan ñề hay chủ ñề ñể sử dụng bộ phận mục lục tương ứng. Vì vậy, người sử dụng cần ñược hướng dẫn và huấn luyện về cách tra cứu các hệ thống mục lục này. Có một số thư viện phân chia thành ba phần riêng biệt là mục lục tác giả, mục lục nhan ñề và mục lục chủ ñề. Mặc dù cách sắp xếp phiếu mô tả trong hệ thống này có thể ñơn giản nhưng cách tra cứu lại phức tạp hơn so với hệ thống ñược phân thành hai loại mục lục. Chẳng hạn, với cách sắp xếp này, các phiếu mô tả tác phẩm của Dickens ñược xếp dưới tên Dickens trong mục lục tác giả, các phiếu mô tả với tiêu ñề là nhan 63
  6. ñề của các tiểu thuyết riêng lẻ của Dickens ñược xếp trong mục lục nhan ñề và phiếu mô tả các tài liệu về Dickens ñược xếp trong mục lục chủ ñề. Cách tổ chức mục lục chủ ñề sẽ ñược ñề cập sau. Trong mục này chỉ ñề cập cách tổ chức mục lục chữ cái tác giả và nhan ñề ñược gọi là mục lục chữ cái (MLCC). Các qui tắc tổ chức. Qui tắc tổ chức chung nhất là tất cả các phiếu (bao gồm phiếu mô tả, phiếu tiêu ñề, phiếu chỉ chỗ) trong MLCC ñều ñược xếp theo trật tự vần chữ cái của từng ngôn ngữ hay của từng hệ ngôn ngữ ñược chọn ñể thể hiện tiêu ñề mô tả. Trong một số trường hợp, các phiếu ñược sắp xếp không theo nguyên tắc này. Ví dụ, các tác phẩm của cùng một tác giả ñược xếp theo thứ tự lần lượt là toàn tập, tuyển tập và các tác phẩm riêng lẻ (ở phần này các tác phẩm ñược xếp theo trật tự chữ cái tên tác phẩm). Qui tắc tổ chức này ñược thể hiện qua các qui tắc cụ thể sau ñây. - Các phiếu mô tả trong MLCC ñược xếp theo trật tự vần chữ cái ñầu tiên của tên tác giả hoặc nhan ñề tài liệu. Nếu chữ cái ñầu tiên giống nhau thì căn cứ vào các chữ cái tiếp theo. Ví dụ: Nguyễn Hiếu Nguyễn Hữu Phước Nguyễn Khắc Phê Khi xếp các phiếu mô tả bằng tiếng Việt, ngoài trật tự chữ cái còn phải theo trật tự các dấu lần lượt là không dấu, dấu huyền, sắc, hỏi, ngã, nặng. - Trong mỗi vần chữ cái, tên tác giả ñược viết tắt phải xếp trước các tên tác giả ñược viết ñầy ñủ. - Các tác giả Việt Nam ñược xếp theo vần chữ cái họ, tên ñệm, tên riêng hoặc bút danh. Các tác giả nước ngoài ñược xếp theo họ, tên riêng, tên ñệm ñúng như mô tả trên phiếu. Nếu các tác giả trùng cả họ, tên thì phân biệt theo nghề nghiệp hay thứ bậc trong gia ñình. Ví dụ: Nguyễn Quang Sáng, ðạo diễn Nguyễn Quang Sáng, Nhà văn - Phiếu mô tả các tác phẩm của một tác giả ñược xếp tập trung vào một chỗ và theo thứ tự sau: + Tác phẩm của riêng tác giả hoặc tác giả cùng viết với người khác ñược xếp theo thứ tự: toàn tập, tuyển tập, các tác phẩm riêng lẻ; + Các tác phẩm mà tác giả tham gia vào việc xuất bản với tư cách là người biên soạn, dịch, biên tập, hiệu ñính…ñược xếp theo vần chữ cái nhan ñề tài liệu và không tính ñến vai trò của tác giả trong việc xuất bản tài liệu. +Các tác phẩm nói về tác giả thì phiếu mô tả bổ sung về tác giả ñó ñược xếp theo thứ tự vần chữ cái họ tên người viết hoặc nhan ñề của tác phẩm. - Tác giả có nhiều tên gọi khác nhau, tác giả nước ngoài ñược dịch hoặc phiên âm theo nhiều cách khác nhau thì các phiếu mô tả liên quan ñến tác phẩm hay bản thân tác giả ñược sắp xếp dưới tên thông dụng nhất và lập phiếu chỉ chỗ cho các tên khác. Ví dụ: Phiếu chỉ chỗ: 64
  7. Lê Hữu Trác Xem Hải Thượng Lãn Ông - Tác giả là tổ chức, cơ quan + Các tổ chức chính trị, cơ quan nhà nước, các tổ chức quốc gia và quốc tế với các tên gọi trong các thời kỳ khác nhau ñược sắp xếp tập trung dưới tên gọi chính thức hiện nay của tổ chức hoặc cơ quan ñó và có phiếu chỉ chỗ cho các tên gọi cũ. + Các tổ chức chính trị ñược xếp theo thứ tự chữ cái các tổ chức trực thuộc. Ví dụ: ðảng Cộng sản Việt nam. Ban bí thư Ban chấp hành Bộ chính trị ðại hội Thành ủy Tỉnh ủy + Các lần ñại hội, hội nghị của các tổ chức chính trị ñược xếp theo trật tự lớn dần của các kỳ ñại hội, hội nghị. + Phiếu mô tả của các cơ quan nhà nước Việt Nam ñược xếp theo trình tự: Hiến pháp, luật Quốc hội Chủ tịch nước Chính phủ - Sắp xếp các phiếu mô tả theo vần chữ cái nhan ñề tài liệu: + Các phiếu mô tả có tiêu ñề bắt ñầu bằng chữ số thì khi xếp phải chuyển số thành chữ và xếp theo thứ tự vần chữ cái. Ví dụ: 1001 ñêm ñược xếp vào vần M - Một nghìn lẻ một ñêm + Nếu một tác phẩm ñược tái bản nhiều lần thì xếp theo trình tự thời gian ngược từ mới ñến cũ (lần tái bản sau ñược xếp lên trên lần xuất bản trước). + Nếu một tác phẩm ñược xuất bản hoặc tái bản bởi nhiều nhà xuất bản khác nhau thì các phiếu mô tả ñược xếp theo trật tự sau: Năm xuất bản – Nơi xuất bản – Nhà xuất bản. + Các mạo từ ñứng ñầu nhan ñề, tiêu ñề thường ñược bỏ qua khi xếp phiếu mô tả, trừ trường hợp ñó là một bộ phận không thể thiếu ñược trong tên cá nhân - Sắp xếp các phiếu chỉ chỗ: các phiếu chỉ chỗ “cũng xem” ñược xếp trước các phiếu mô tả hay biểu ghi có cùng tiêu ñề. Các bước tổ chức. Việc tổ chức các phiếu mô tả trong MLCC bao gổm các bước cụ thể như sau: - Bước 1: Nhóm sơ bộ các phiếu theo vần chữ cái: các thư viện thường sử dụng các hộp phiếu, mỗi hộp ñược chia thành nhiều ngăn nhỏ và ñược ñánh dấu theo trật tự chữ cái ñể nhóm phiếu sơ bộ. - Bước 2: Xếp phiếu vào các ô phiếu trong tủ mục lục theo các qui tắc sắp xếp phiếu. - Bước 3: Lập các phiếu hướng dẫn, chỉ chỗ nếu cần. 65
  8. 5.1.7.Hệ thống mục lục phân loại 5.1.7.1. Khái niệm Mục lục phân loại (MLPL) là hệ thống mục lục trong ñó các phiếu mô tả ñược sắp xếp theo các môn loại tri thức dựa trên một hệ thống phân loại nào ñó. Mục lục phân loại phản ánh kho tài liệu của thư viện theo nội dung các ngành khoa học một cách hệ thống. Ưu ñiểm của mục lục phân loaị là không bị ảnh hưởng bởi sự thay ñổi thuật ngữ vì nó sử dụng các ký hiệu, chữ và/hoặc số thay cho từ ngữ. Nhược ñiểm lớn nhất của MLPL là do ñược xây dựng dựa trên một khung phân loại nhất ñịnh nên nếu người dùng tin không quen với các ký hiệu phân loại thì sẽ gặp khó khăn khi tra cứu và nhiều khi cần có sự hướng dẫn của nhân viên thư viện. Mục lục phân loại là một trong những công cụ tra cứu quan trọng, ñặc biệt là trong các thư viện không tổ chức kho mở. MLPL giúp người dùng tin tra cứu tài liệu cần thiết theo các ñề tài hoặc các lĩnh vực tri thức nhất ñịnh. MLPL là công cụ hỗ trợ nhân viên thư viện trong công tác bổ sung tài liệu, tra cứu tài liệu, biên soạn thư mục, lựa chọn tài liệu cho các triển lãm chuyên ñề… 5.1.7.2. Cấu trúc mục lục phân loại Các bộ phận cấu thành phần MLPL bao gồm các phiếu mô tả, các phiếu tiêu ñề, các phiếu chỉ chỗ và phiếu ngăn. Phiếu mô tả Các yếu tố trong phiếu mô tả ñược trình bày thống nhất theo một qui tắc mô tả thư mục nhất ñịnh. Ký hiệu phân loại của tài liệu phải ñược thể hiện trên phiếu mô tả. ðối với những tài liệu có nội dung phản ánh nhiều vấn ñề, nghĩa là có từ hai ký hiệu phân loại trở lên thì phải có phiếu bổ sung cho các ký hiệu phân loại. Mỗi ký hiệu phân loại phải có một phiếu mô tả và các phiếu mô tả này sẽ ñược sắp xếp ở các vị trí khác nhau trong MLPL. Phiếu tiêu ñề Trong MLPL cũng sử dụng các phiếu tiêu ñề có gờ nhô lên như trong MLCC. Các phiếu tiêu ñề ñược chia thành nhiều cấp tương ñương với các lớp trong khung phân loại. Các phiếu tiêu ñề có gờ nhô ở giữa thường ñược dành cho các lớp phân chia thứ nhất (tiêu ñề cấp 1), thứ hai (tiêu ñề cấp 2), ñôi khi cho lớp thứ ba (tiêu ñề cấp 3). Các phiếu có gờ nhô bên phải hoặc bên trái dành cho các cấp chia tiếp theo. Trên gờ phiếu tiêu ñề ghi ký hiệu phân loại và tên ñề mục phân loại của khung phân loại ñược sử dụng. Trong thân phiếu ghi ký hiệu phân loại và tên các mục con trực thuộc. Ví dụ dưới ñây là phiếu tiêu ñề cấp 1. Các phiếu tiêu ñề cấp 3, cấp 4…cũng ñược mô tả tương tự. 66
  9. 3.Xã hội – Chính tri Gồm các mục: 31. Thống kê. Hạch toán. Phân tích kinh tế 32. Chính trị 33. Kinh tế. Khoa học kinh tế Các phiếu chỉ chỗ Phiếu chỉ chỗ qua lại (“cũng xem”) hướng dẫn người sử dụng tìm thêm ở các mục khác có liên quan ñể mở rộng nội dung và phạm vi tra cứu. Phiếu chỉ chỗ ñi (“xem”) hướng dẫn người sử dụng tìm tài liệu ở ñề mục chính xác trong trường hợp tài liệu có nội dung ñược phản ánh ở nhiều mục nhưng chỉ ñược xếp ở một mục nhất ñịnh. Phiếu ngăn Các phiếu ngăn có kích thước bằng phiếu mô tả nhưng khác màu, ñược dùng ñể phân cách các phiếu mô tả có cùng ký hiệu phân loại nhưng khác nhau ở một số ñặc ñiểm khác như ngôn ngữ, loại hình tài liệu… 5.1.7.3. Cách tổ chức phiếu mô tả trong MLPL Sơ ñồ tổ chức thông tin ñược áp dụng trong MLPL là sơ ñồ ñảo, nghĩa là các phiếu mô tả ñược sắp xếp theo kí hiệu phân loại thể hiện nội dung tài liệu. Trong MLPL, các phiếu mô tả có cùng ký hiệu phân loại ñược xếp chung sau mỗi phiếu tiêu ñề trên ñó ghi ký hiệu phân loại và tên ñề mục tương ứng trong khung phân loại. ðể thuận tiện cho việc tra cứu, sau mỗi phiếu tiêu ñề chỉ nên xếp khoảng 50 phiếu mô tả. Các phiếu mô tả trong từng mục ñược xếp theo từng nhóm ngôn ngữ và có phiếu ngăn giữa các nhóm ngôn ngữ. Trong mỗi nhóm ngôn ngữ, các phiếu mô tả ñược xếp theo thứ tự vần chữ cái các tiêu ñề mô tả (tên tác giả hoặc nhan ñề tài liệu). Cũng có thể sắp xếp các phiếu mô tả theo thứ tự thời gian ngược của năm xuất bản và các lần xuất bản tài liệu (tài liệu mới xuất bản ñược xếp lên trước các tài liệu cũ hơn) ñể ưu tiên giới thiệu các tài liệu mới. Mục lục phân loại ñược chứa trong các hộp phiếu trong tủ mục lục. Trên mỗi hộp phiếu có nhãn ghi ký hiệu phân loại và các mục chứa trong hộp phiếu. 5.1.7.4. Hộp phiếu tra chủ ñề - chữ cái Hộp phiếu tra chủ ñề-chữ cái là công cụ hỗ trợ cho MLPL nhằm giúp người sử dụng tra cứu MLPL một cách hiệu quả. Hộp phiếu tra chủ ñề-chữ cái gồm các ñề mục chủ ñề ñược trình bày trên phiếu (có hình thức như phiếu mô tả và ñược gọi là phiếu tra chủ ñề-chữ cái) phản ánh nội dung của các tài liệu hiện có tại thư viện. Việc tổ chức hộp phiếu tra chủ ñề-chữ cái thường ñược thực hiện ñồng thời với việc tổ chức MLPL. Việc lập các phiếu tra chủ ñề-chữ cái ñược thực hiện trên cơ sở phân loại tài liệu của thư viện hoặc cơ quan thông tin và theo các bước như sau: 67
  10. - Dựa trên nội dung tài liệu ñể xác ñịnh chủ ñề ñặc trưng của tài liệu; - ðối chiếu chủ ñề vừa ñược xác ñịnh với bảng tra chủ ñề trong khung phân loại ñể bảo ñảm sự thống nhất thuật ngữ; - Trình bày ñề mục chủ ñề trên phiếu thông thường (7,5 x 12,5 cm). Mỗi chủ ñề ñược trình bày trên một phiếu. Phần góc phải của phiếu ghi ký hiệu phân loại của ñề mục hoặc tiểu ñề mục. Nếu nội dung tài liệu gồm nhiều chủ ñề riêng biệt và ñược thể hiện bằng nhiều ký hiệu phân loại thì mỗi ký hiệu phân loại phải ñược thể hiện trên một phiếu tra chủ ñề. Các phiếu trong hộp phiếu chủ ñề-chữ cái ñược sắp xếp theo vần chữ cái của các ñề mục chủ ñề. 5.1.8. Mục lục chủ ñề 5.1.8.1. Khái niệm Mục lục chủ ñề là hệ thống mục lục trong ñó các phiếu mô tả ñược sắp xếp theo chủ ñề của tài liệu. Mục lục chủ ñề phản ánh vốn tài liệu của thư viện theo chủ ñề của nội dung tài liệu. Mục lục chủ ñề ñặc biệt hữu dụng khi phản ánh nội dung tài liệu thuộc các ngành khoa học ứng dụng. Vì vậy, mục lục này thường ñược sử dụng trong các thư viện, cơ quan thông tin chuyên ngành. Mục lục chủ ñề giúp người dùng tin tìm tài liệu cần thiết theo từng chủ ñể cụ thể. ðối với nhân viên thư viện, mục lục chủ ñề là công cụ hỗ trợ biên soạn các thư mục chuyên ñề, tra cứu theo yêu cầu, tuyên truyền, giới thiệu tài liệu theo các chuyên ñề… 5.1.8.2. Cấu trúc mục lục chủ ñề Phiếu mô tả Phiếu mô tả trình bày ñầy ñủ các yếu tố mô tả như trong mục lục chữ cái. Ở phía trên góc bên trái của phiếu ghi ký hiệu xếp giá của tài liệu. Các ñề mục chủ ñề của tài liệu và phụ ñề (nếu có) ñược liệt kê phía dưới các yếu tố mô tả. Nếu tài liệu có trên 2 ñề mục chủ ñề thì phải lập phiếu bổ sung cho các chủ ñề. Phiếu tiêu ñề Trong mục lục chủ ñề cũng sử dụng các phiếu tiêu ñề (bao gồm phiếu tiêu ñề chính và phiếu tiêu ñề phụ) ñể thể hiện các ñề mục chủ ñề, phụ ñề và phân chia các phiếu trong cùng chủ ñề. Thư viện có thể tự lập các phiếu tiêu ñề hoặc dựa trên một bảng ñề mục chủ ñề có sẵn. Phiếu chỉ chỗ Phiếu chỉ chỗ “xem” chỉ từ ñề mục chủ ñề không thông dụng sang ñề mục chủ ñề thông dụng. Phiếu chỉ chỗ “cũng xem” chỉ dẫn người sử dụng ñến các ñề mục chủ ñề khác có liên quan với chủ ñề mà người sử dụng quan tâm. 5.1.8.3. Cách tổ chức phiếu trong mục lục chủ ñề 68
  11. Các phiếu tiêu ñề ñược sắp xếp theo vần chữ cái của các ñề mục chủ ñề, không phân biệt chủ ñề ñơn hay phức. Trong từng ñề mục chủ ñề, các phiếu mô tả ñược sắp xếp theo trật tự chữ cái các tiêu ñề mô tả. Các phiếu ñược chứa trong các hộp phiếu trong tủ mục lục. Trên mỗi hộp phiếu có dán nhãn ghi ñề mục chủ ñề ở ñầu và cuối hộp phiếu. 5.2. Các bộ phiếu thư mục Bộ phiếu thư mục là công cụ phản ánh các tài liệu hoặc thông tin về những vấn ñề và ñề tài thuộc diện phục vụ của cơ quan thông tin, thư viện, không phụ thuộc vào loại hình tài liệu và nơi bảo quản chúng. Tùy theo nhiệm vụ và ñặc ñiểm của tổ chức, các cơ quan thông tin, thư viện có thể xây dựng các bộ phiếu thư mục như bộ phiếu tra cứu chính, các bộ phiếu chuyên ñề, các bộ phiếu thư mục theo loại hình tài liệu, bộ phiếu tra cứu nhân vật, bộ phiếu tra cứu ñịa chí. 5.2.1. Bộ phiếu tra cứu chính Bộ phiếu tra cứu chính ñược sử dụng ñể trả lời các yêu cầu tin chuyên ñề theo diện phục vụ của cơ quan thông tin, thư viện. ðặc ñiểm của bộ phiếu tra cứu chính là nó phản ánh các tài liệu về những chuyên ñề chính cũng như những vấn ñề có liên quan thuộc diện bao quát ñề tài của cơ quan thông tin, thư viện, không phụ thuộc vào loại hình và nơi bảo quản những tài liệu ñó. Bộ phiếu tra cứu chính không chỉ phản ánh các sách chuyên khảo, các báo cáo và những tài liệu tương tự mà còn phản ánh cả các bài trích từ các tạp chí, tuyển tập và các chương mục của sách... Bộ phiếu này thường ñược xây dựng trong các cơ quan thông tin hoặc thư viện chuyên ngành. 5.2.2. Các bộ phiếu chuyên ñề Các bộ phiếu chuyên ñề ñược xây dựng theo những vấn ñề/ñề tài ñược nhiều người quan tâm và có tính thời sự. Tương tự bộ phiếu tra cứu chính, các bộ phiếu này ñược sử dụng ñể trả lời các yêu cầu tin chuyên ñề. ðặc ñiểm của các bộ phiếu chuyên ñề là chúng phản ánh vấn ñề một cách ñầy ñủ, toàn diện và phản ánh nhiều loại hình tài liệu, không phụ thuộc vào nơi bảo quản tài liệu. 5.2.3. Các bộ phiếu theo loại hình tài liệu Các bộ phiếu theo loại hình tài liệu ñược sử dụng ñể trả lời những yêu cầu cung cấp các loại hình tài liệu nhất ñịnh hoặc thông tin về các loại hình tài liệu, không phụ thuộc vào nơi bảo quản chúng. Các cơ quan thông tin, thư viện có thể xây dựng các bộ phiếu theo loại hình tài liệu như bộ phiếu bài trích từ báo, tạp chí, bộ phiếu báo cáo về các công trình nghiên cứu khoa học, bộ phiếu catalo công nghiệp, bộ phiếu các công trình thiết kế, thử nghiệm… 5.3. Các bộ phiếu dữ kiện 69
  12. Các bộ phiếu tra dữ kiện ñược xây dựng ñể trả lời các yêu cầu tin dữ kiện cụ thể, giúp người dùng tin nhanh chóng tìm ñược thông tin cần thiết. Các bộ phiếu dữ kiện lưu trữ các số liệu hoặc dữ kiện về một ñối tượng hoặc một nhóm ñối tượng nhất ñịnh như các vật liệu, thiết bị, quy trình công nghệ, các tổ chức… Các số liệu/dữ kiện này ñược rút ra từ một hoặc nhiều tài liệu. Vì vậy, khi sử dụng các bộ phiếu dữ kiện, người dùng tin ñược giải phóng khỏi các bước tìm tài liệu và rút ra từ những tài liệu tìm ñược những thông tin cần thiết. 5.3.1. Bộ phiếu các sản phẩm, thiết bị Bộ phiếu các sản phẩm, thiết bị ñược sử dụng ñể trả lời các yêu cầu tin về các tính năng, các thông số kỹ thuật, ñặc ñiểm kết cấu, giá thành của sản phẩm hoặc thiết bị, các nhà sản xuất và cung cấp sản phẩm hoặc thiết bị… Nguồn thu thập và bổ sung thông tin cho bộ phiếu sản phẩm và thiết bị bao gồm nhiều loại tài liệu khác nhau như các catalô công nghiệp của các nhà sản xuất hoặc cung cấp trong và ngoài nước, các bảng giá, các tạp chí khoa học-công nghệ và tạp chí thương mại-công nghiệp… 5.3.2. Bộ phiếu dữ kiện về vật liệu Bộ phiếu dữ kiện về vật liệu cung cấp dữ kiện về tính năng, công dụng, lĩnh vực ứng dụng, thành phần hóa học, các tính chất cơ học, công nghệ chế tạo, giá thành, nhà sản xuất/cung cấp…của các vật liệu khác nhau. Bộ phiếu dữ kiện về vật liệu thường ñược xây dựng trong các cơ quan thông tin chuyên ngành như trung tâm thông tin xây dựng, trung tâm thông tin dệt-may… Nguồn thu thập và bổ sung thông tin cho bộ phiếu vật liệu là các loại tài liệu như các catalô công nghiệp của các nhà sản xuất/cung cấp, các tài liệu ñịnh mức kỹ thuật, sổ tay kỹ thuật… 5.3.3. Bộ phiếu các quy trình công nghệ và sáng kiến Bộ phiếu các quy trình công nghệ và sáng kiến cung cấp thông tin về các qui trình công nghệ và các trang thiết bị tiên tiến, các sáng kiến cải tiến kỹ thuật ñược ñề xuất và áp dụng ở các cơ sở nghiên cứu, sản xuất. Bộ phiếu này thuờng ñược xây dựng trong các cơ quan thông tin chuyên ngành. 70
  13. CHƯƠNG 6. HỆ THỐNG TÌM TIN TỰ ðỘNG HÓA 6.1. Khái quát về hệ thống tìm tin tự ñộng hóa 6.1.1. Khái niệm Hệ thống tìm tin tự ñộng hóa (HTTTTðH) là hệ thống tìm tin sử dụng máy tính ñiện tử ñể thực hiện một số chức năng. Một hệ thống tìm tin tự ñộng hóa bao gồm các thành phần cơ bản sau: - Hệ thống công cụ logic- ngữ nghĩa; - Các phương tiện kỹ thuật ñảm bảo thực hiện các chức năng của hệ thống; - Các cơ sở dữ liệu; - Các yếu tố và phương tiện ñảm bảo vận hành hệ thống. Hệ thống công cụ logic- ngữ nghĩa bao gồm các công cụ xử lý hình thức và nội dung tài liệu như các quy tắc mô tả thư mục, các khổ mẫu trao ñổi dữ liệu, các ngôn ngữ tìm tin, các quy tắc sử dụng các công cụ logic-ngữ nghĩa, các tiêu chuẩn phù hợp ngữ nghĩa và một số công cụ ngữ nghĩa khác. Hệ thống công cụ-ngữ nghĩa ñóng vai trò quan trọng trong việc xử lý, trình bày, tổ chức và tìm kiếm thông tin. Các phương tiện kỹ thuật bao gồm phần cứng, phần mềm và các thiết bị viễn thông. Một hệ thống phần cứng máy tính ñiện tử bao gồm một bộ xử lý trung tâm (CPU) và các thiết bị ngoại vi. Bộ xử lý trung tâm thực hiện các chức năng chủ yếu của máy tính ñiện tử. Bộ xử lý trung tâm có ba khối là khối ñiều khiển, khối tính toán và bộ nhớ trong. Bộ nhớ trong (RAM, ROM) chứa thông tin ñược ghi trước và ñược cung cấp. RAM (Random-access memory) là bộ nhớ chỉ chứa thông tin khi máy tính làm việc. Thông tin ở dạng dữ liệu hoặc chương trình ñược nhập vào RAM khi bộ xử lý trung tâm yêu cầu. Thông thường, thông tin ñược nhập trực tiếp vào RAM từ bàn phím hoặc các thiết bị nhập khác hoặc ñược tải từ các bộ nhớ ngoài (thiết bị lưu trữ ngoại vi). ROM (Read-only memory) là bộ nhớ chứa các chương trình ñiều khiển cơ bản, các phần mềm hệ thống và ứng dụng do nhà sản xuất cung cấp. Thông tin ñược chứa trong ROM có thể ñọc ñược - nghĩa là có thể tìm lại ñể bộ xử lý trung tâm sử dụng, nhưng không thể xóa, bổ sung hoặc chỉnh sửa. Các thiết bị ngoại vi thực hiện chức năng nhập, xuất hoặc lưu trữ thông tin. Các thiết bị nhập như bàn phím, máy quét …ñược sử dụng ñể nhập thông tin vào máy tính ñiện tử, nghĩa là chuyển thông tin từ dạng ngôn ngữ tự nhiên sang dạng ñọc máy. Thông tin ñược nhập vào máy tính dưới dạng mã hóa, mỗi ký tự ñược biểu diễn dưới dạng một chuỗi các số nhị phân. Có nhiều hệ thống mã dùng cho các loại máy tính ñiện tử khác nhau, trong ñó có hai hệ thống mã quan trọng là EBCDIC (Extended 71
  14. Binary Coded Decimal Interchange Code) và ASCII (American Standard Code for Information Interchange) Các thiết bị xuất như màn hình, máy in…ñược sử dụng ñể xuất thông tin từ máy tính ñiện tử, nghĩa là chuyển thông tin từ dạng ñọc máy sang dạng ngôn ngữ tự nhiên. Các thiết bị ngoại vi và phương tiện lưu trữ thông tin ñược thiết kế ñể lưu giữ thông tin ở dạng ñọc máy. Các thiết bị này ñược xem như bộ nhớ ngoài, bổ sung cho bộ nhớ trong hạn chế của bộ xử lý trung tâm. Bộ nhớ ngoài của máy tính ñiện tử bao gồm băng từ, ñĩa quang, ñĩa từ (ñĩa cứng và ñĩa mềm). Phần mềm là một chương trình hoặc một tập hợp có cấu trúc các lệnh cho phép máy tính thực hiện các chức năng xử lý thông tin. Các lệnh này có thể ñược biểu diễn bằng ngôn ngữ máy ở dạng mã nhị phân hoặc bằng ngôn ngữ lập trình và sau ñó ñược dịch sang ngôn ngữ máy bằng các trình dịch. Có hai loại phần mềm là phần mềm hệ thống và phần mềm ứng dụng. Phần mềm hệ thống là các chương trình cần thiết ñể thực hiện và ñiều khiển các hoạt ñộng của một máy tính như khởi ñộng máy tính, ñiều khiển xuất và nhập dữ liệu… Phần mềm ứng dụng là phần mềm ñược thiết kế ñể thực hiện các nhiệm vụ, chức năng thường ñược người sử dụng máy tính yêu cầu. Cũng giống như các loại phần mềm khác, phần mềm ứng dụng ñược cung cấp bởi các nhà sản xuất máy tính hoặc các công ty chuyên phát triển phần mềm. Có nhiều loại phần mềm ứng dụng như phần mềm soạn thảo văn bản, phần mềm quản trị dữ liệu, phần mềm thiết kế ñồ họa, phần mềm truyền thông và các phần mềm chuyên dụng trong các lĩnh vực khác. Cơ sở dữ liệu là thành phần cơ bản của một hệ thống thông tin tự ñộng hóa. Vì vậy, cơ sở dữ liệu sẽ ñược ñề cập chi tiết hơn ở những phần tiếp theo trong chương này. Các yếu tố và phương tiện ñảm bảo vận hành hệ thống tìm tin bao gồm nhân sự và các tài liệu hướng dẫn nghiệp vụ…Nhân sự làm việc với hệ thống bao gồm các nhóm chuyên gia có trách nhiệm thiết kế, xây dựng, vận hành, khai thác, bảo trì hệ thống và những người dùng tin sử dụng hệ thống ñể tìm tin. 6.1.2 Phân loại hệ thốngtìm tin tự ñộng hóa Có thể phân loại hệ thống tìm tin tự ñộng hoá dựa trên các cơ sở khác nhau. Sau ñây là cách phân loại dựa trên mục ñích cung cấp dịch vụ, phương thức truy cập và thế hệ của hệ thống tìm tin tự ñộng hóa. 6.1.2.1. Phân loại theo mục ñích cung cấp dịch vụ Theo mục ñích cung cấp dịch vụ, có thể phân các hệ thống tìm tin tự ñộng hóa thành hai loại là hệ thống tìm tin nội bộ và hệ thống tìm tin thương mại. Hệ thống tìm tin nội bộ ñược xây dựng nhằm phục vụ người sử dụng thuộc một tổ chức nhất ñịnh. Hệ thống tìm tin thương mại cung cấp dịch vụ truy cập các CSDL hoặc ngân hàng dữ liệu cho người sử dụng dựa trên cơ chế thị trường. Người sử dụng thanh toán phí dịch vụ dựa trên mức ñộ sử dụng dịch vụ. 6.1.2.2. Phân loại theo phương thức truy cập 72
  15. Theo phương thức truy cập CSDL, có thể chia các hệ thống tìm tin tự ñộng hóa thành hai loại là hệ thống tìm tin cục bộ và hệ thống tìm tin trực tuyến. Hệ thống tìm tin cục bộ cung cấp khả năng truy cập các CSDL ñược lưu trữ trên máy tính ñiện tử tại chỗ trong khi hệ thống tìm tin trực tuyến cung cấp khả năng truy cập các CSDL ñược lưu trữ trên các máy tính ñiện tử ở xa thông qua mạng máy tính và các phương tiện viễn thông. Nguyên lý và kỹ thuật tìm tin trên hai hệ thống này về cơ bản không có sự khác biệt. ðiểm khác biệt giữa hệ thống tìm tin trực tuyến với hệ thống tìm tin cục bộ là công nghệ truy cập phức tạp hơn, bắt buộc phải có các phương tiện viễn thông ñể ñảm bảo phương thức truy cập từ xa. 6.1.2.3. Phân loại theo thế hệ của hệ thống tìm tin Theo thế hệ của hệ thống tìm tin, có thể chia các hệ thống tìm tin tự ñộng hóa thành ba loại như sau: - Hệ thống tìm tin thế hệ thứ nhất: là hệ thống cung cấp khả năng tìm thông tin thư mục với các lệnh tìm ở dạng dòng lệnh. Cách sử dụng hệ thống phức tạp, ñòi hỏi người sử dụng phải có những kỹ năng tìm tin nhất ñịnh. Vì vậy, người sử dụng hệ thống này chủ yếu là các chuyên gia thông tin. - Hệ thống tìm tin thế hệ thứ hai: là hệ thống cung cấp khả năng tìm thông tin thư mục và toàn văn với các lệnh tìm ở dạng hệ thống thực ñơn. Cách sử dụng hệ thống này ñơn giản hơn so với hệ thống thế hệ thứ nhất. Người sử dụng hệ thống có thể là các chuyên gia hoặc người sử dụng thông thường. - Hệ thống tìm tin thế hệ thứ ba: là hệ thống cung cấp khả năng tìm thông tin ña phương tiện, cho phép người sử dụng khai thác thông tin một cách dễ dàng qua các giao diện ñồ họa. 6.2. Các chức năng của hệ thống tìm tin tự ñộng hóa 6.2.1. Tìm tin Chức năng tìm tin cho phép tìm các biểu ghi trong CSDL ñáp ứng yêu cầu tin cụ thể của người sử dụng. ðể thực hiện việc tìm tin trong hệ thống, người sử dụng phải thể hiện yêu cầu tin bằng biểu thức tìm. Biểu thức tìm có thể bao gồm văn bản với ngôn ngữ tự nhiên ở dạng kết hợp và/hoặc các thuật ngữ tìm ñược kết hợp với nhau bởi các toán tử tìm tin. Biểu thức tìm tin có thể áp dụng với biểu ghi ñầy ñủ hoặc chứa một số các thông số bổ sung giới hạn tìm trong một vùng của biểu ghi (ví dụ trong một trường nào ñó). 6.2.1.1. Logic Bool Logic Bool cho phép người sử dụng kết hợp nhiều khái niệm với nhau một cách logic ñể xác ñịnh thông tin cần thiết. Các phép toán của logic Bool cho phép thực hiện ba loại quan hệ cơ bản giữa các khái niệm là quan hệ tương giao, quan hệ kết hợp và 73
  16. quan hệ loại trừ. Các toán tử Bool ñược sử dụng tương ứng là AND, OR, và NOT. ðây là những toán tử Bool ñược sử dụng phổ biến nhất trong các hệ thống tìm tin. Toán tử AND ñược sử dụng ñể tìm các biểu ghi ñồng thời chứa các thuật ngữ tìm ñã ñược xác ñịnh. Với biểu thức tìm có dạng: A AND B, trong ñó A, B là các thuật ngữ tìm thì kết quả tìm ñược là các biểu ghi ñồng thời chứa A và B. Toán tử OR cho phép tìm các biểu ghi thỏa mãn yêu cầu là chứa ít nhất một trong những thuật ngữ tìm ñã ñược xác ñịnh trong biểu thức tìm. Với biểu thức tìm có dạng A OR B thì kết quả tìm ñược là các biểu ghi chứa một trong hai thuật ngữ hoặc chứa cả hai thuật ngữ A và B. Toán tử NOT cho phép tìm các biểu ghi thỏa mãn yêu cầu là chỉ chứa thuật ngữ tìm ñứng trước toán tử và không chứa thuật ngữ tìm ñứng sau toán tử. Nếu biểu thức tìm có dạng A NOT B thì kết quả tìm ñược là các biểu ghi chỉ chứa thuật ngữ A và không chứa thuật ngữ B. Thứ tự của các thuật ngữ tìm trong biểu thức tìm với toán tử NOT có ý nghĩa quan trọng. Kết quả của biểu thức tìm A NOT B sẽ khác kết quả của B NOT A. Ngoài các toán tử Bool nói trên, một số hệ thống còn sử dụng toán tử XOR (Exclusive OR) nhưng nói chung không hữu ích ñối với người sử dụng vì phần lớn người sử dụng không hiểu toán tử này. Toán tử XOR cho phép tìm các biểu ghi thỏa mãn ñiều kiện là chỉ chứa một trong hai thuật ngữ ñã ñược xác ñịnh, không ñược ñồng thời chứa cả hai thuật ngữ. Nếu biểu thức tìm có dạng A XOR B thì kết quả tìm ñược là các biểu ghi chỉ chứa A hoặc B, không bao gồm các biểu ghi chứa cả A và B. Dấu ngoặc ñơn ñược sử dụng trong biểu thức tìm tin ñể xác ñịnh trình tự thực hiện các phép toán Bool. Nếu trong biểu thức không sử dụng ngoặc ñơn, hệ thống sẽ thực hiện các phép toán theo trình tự ưu tiên mặc ñịnh (thông thường theo thứ tự NOT, AND, OR và từ trái sang phải). Phần lớn các hệ thống thương mại không cho phép sử dụng kỹ thuật tìm theo trọng số thuật ngữ (weighted term) trong các biểu thức sử dụng các phép toán Bool. Logic Bool có ưu ñiểm là logic rõ ràng và có thể dễ dàng viết trình dịch cho logic này. Hạn chế của logic Bool là phần lớn người sử dụng không tư duy một cách tự nhiên trong các ñiều kiện của logic Bool. Vì vậy, logic này có vẻ nhân tạo và ñôi khi người sử dụng gặp khó khăn khi biểu ñạt yêu cầu tin hoặc khi xem kết quả tìm ñược. Một hạn chế khác là các biểu thức Bool có thể cho nhiều kết quả tìm và không phân biệt mức ñộ thích hợp của các biểu ghi tìm ñược. Có thể khắc phục hạn chế này bằng cách tìm tinh lọc với các ñiều kiện như ngôn ngữ, thời gian… 6.2.1.2. Toán tử lân cận Toán tử lân cận ñược sử dụng ñể qui ñịnh khoảng cách yêu cầu giữa hai thuật ngữ tìm trong một biểu ghi nhằm tăng ñộ chính xác của việc tìm tin. Hình thức biểu diễn tổng quát của toán tử lân cận là: Thuật ngữ tìm 1 trong “m” “ñơn vị” của thuật ngữ tìm 2 Toán tử khoảng cách “m” là một số nguyên và các ñơn vị là ký tự, từ, câu hoặc ñoạn văn. Ví dụ, với biểu thức : “United” within five words of “American” ( m = 5 và ñơn vị là từ) 74
  17. Hệ thống tìm tin sẽ tìm ñược các biểu ghi có chứa “United States and American interests”; “United Airlines and American Airlines” và không tìm ñược biểu ghi có chứa “United States of America and the American dream” Các hệ thống tìm tin khác nhau có thể sử dụng các ñơn vị ngữ nghĩa khác nhau ñể xác ñịnh khoảng cách. Ví dụ, với các biểu ghi có cấu trúc, ñơn vị ñể tính khoảng cách là ký tự. Với các biểu ghi có chứa hình ảnh, ñoạn văn giữa các hình ảnh có thể giúp tìm chính xác một hình ảnh nào ñó. Trong một số trường hợp, toán tử lân cận xác ñịnh vị trí của thuật ngữ tìm thứ 2 ñối với thuật ngữ tìm thứ 1 (trước hoặc sau thuật ngữ tìm thứ 1) và trong một khoảng cách ñược xác ñịnh. Chẳng hạn, toán tử lân cận Adjacent (ADJ) thường qui ñịnh hai thuật ngữ phải nằm kề nhau và chỉ theo một chiều xuôi. Ví dụ, với biểu thức: Information ADJ Science Kết quả tìm ñược bao gồm các biểu ghi có chứa “Information Science” và không bao gồm các biểu ghi có chứa “Science Information”. Một trường hợp ñặc biệt khác là khi khoảng cách ñược xác ñịnh bằng zero có nghĩa là nằm trong cùng ñơn vị ngữ nghĩa. Ví dụ, với biểu thức: “Nuclear” within zero paragraphs of “clean-up” Kết quả tìm ñược bao gồm các biểu ghi chứa “Nuclear” và “clean-up” trong cùng một ñoạn văn. Các hệ thống tìm tin khác nhau có thể sử dụng các loại toán tử lân cận khác nhau. Hơn nữa, cách biểu ñạt cùng một toán tử lân cận trong các hệ thống tìm tin cũng có thể khác nhau. 6.2.1.3. Tìm cụm từ chính xác Một cụm từ bao gồm hai hoặc nhiều từ và ñược xem như một ñơn vị ngữ nghĩa ñộc lập. Ví dụ, “United States of America” là một cụm từ bao gồm bốn từ, ñược xác ñịnh như một thuật ngữ tìm thể hiện một khái niệm ngữ nghĩa cụ thể (một quốc gia) và có thể ñược sử dụng với một toán tử bất kỳ trong số các toán tử ñã ñược ñề cập ở trên. Toán tử tìm cụm từ chính xác là một toán tử ñặc biệt tương tự toán tử lân cận (Adjacent) cho phép tìm các từ nằm kề nhau và theo một trật tự xác ñịnh. 6.2.1.4 Toán tử chặt từ (truncation) Kỹ thuật tìm tin với toán tử chặt từ cho phép mở rộng một thuật ngữ tìm bằng cách chặt bớt một phần của thuật ngữ và tìm tất cả các biểu ghi có chứa phần còn lại của thuật ngữ ñó. Ví dụ, biểu thức tìm tin sử dụng toán tử chặt từ với ký hiệu * như sau: Fish* Khi ñó, các biểu ghi có chứa các thuật ngữ tìm như: Fish; Fishbone; Fisher; Fisherman; Fishery; Fish hook; Fishing; Fishing line ñều ñược xem là thích hợp với yêu cầu tin và ñều ñược liệt kê trong kết quả tìm. Kỹ thuật chặt từ có tác dụng mở rộng kết quả tìm. Các hệ thống tìm tin có thể hỗ trợ kỹ thuật chặt từ bên trái (tìm tiếp vĩ ngữ), chặt từ bên phải (tìm tiếp ñầu ngữ) hoặc chặt cả hai bên của từ. Có một số hệ thống hỗ trợ kỹ thuật chặt từ ở bên trong từ. Ví dụ: 75
  18. Biểu thức Thao tác của hệ thống *computer Các biểu ghi có chứa “minicomputer”. “microcomputer” hoặc “computer” ñều ñược coi là thích hợp comput* Các biểu ghi có chứa “computers”, “computing”, “computes” ñều ñược coi là thích hợp *comput* Các biểu ghi có chứa “microcomputers”. “minicomputing”, “compute” ñều ñược coi là thích hợp Multi$national Các biểu ghi có chứa “multi-national”, “multinational” ñều ñược coi là thích hợp. 6.2.1.5. Kỹ thuật tìm so sánh Kỹ thuật tìm so sánh cho phép tìm theo các dấu hiệu ñịnh lượng. Toán tử so sánh (=, , = ) ñược sử dụng trong nhiều hệ thống tìm tin ñể tìm theo giá trị số hoặc dãy số (hoặc ngày tháng). Ví dụ: (date>881014) (20,000 < salary < 100,000) 6.2.1.6. Ký tự thay thế Ký tự thay thế là một ký tự bàn phím như dấu * hoặc dấu ? ñược sử dụng ñể biểu diễn một hoặc nhiều ký tự khi tìm trong các CSDL. Ký tự thay thế ñược sử dụng ñể thay thế một hoặc nhiều từ khi người sử dụng không biết ký tự thực hoặc không muốn ñánh toàn bộ một từ hoặc ñể tìm các cụm từ có cùng từ ñầu và từ cuối. Ví dụ: - wom?m có thể cho kết quả là các biểu ghi chứa woman hoặc women - cooking * classes có thể cho kết quả là các biểu ghi chứa “cooking school classes” hoặc “cooking and wine tasting classes” 6.2.1.7. Kỹ thuật tìm theo trọng số của thuật ngữ Tìm theo trọng số của thuật ngữ (weighted term) là kỹ thuật tìm cho phép tìm các từ và cụm từ bằng cách xác ñịnh tầm quan trọng của từng thuật ngữ theo cảm nhận của người sử dụng. Trọng số là một số từ 0.0 ñến 1.0 (hoặc có thể là số nguyên) chỉ mức ñộ quan trọng của từng thuật ngữ tìm trong tập hợp các thuật ngữ. Ví dụ, trong một biểu thức tìm với nhiều thuật ngữ, ta có thể xác ñịnh cho từng thuật ngữ tìm một trọng số chỉ tầm quan trọng của thuật ngữ ñó trong mối tương quan với các thuật ngữ khác trong biểu thức tìm. Trong kết quả tìm, những biểu ghi thích hợp nhất sẽ ñược sắp xếp ñầu tiên, theo trọng số tương quan ñã ñược xác ñịnh. Ví dụ, với biểu thức tìm: (TENNIS(.8) OR GOLF(.4)) AND CHAMPION(.6) 76
  19. Một HTTT thực hiện biểu thức tìm này truớc hết có thể xử lý tương tự như với một biểu thức Bool thông thường ñể tạo ra một tập kết quả ban ñầu, sau ñó mới sử dụng các trọng số ñã xác ñịnh ñể tính hạng cho từng biểu ghi. Nếu TENNIS và CHAMPION xuất hiện trong một biểu ghi thì biểu ghi ñó sẽ có trọng số .8 + .6 = 1.4. Nếu hai thuật ngữ GOLF và CHAMPION xuất hiện, biểu ghi có trọng số .4 + .6 = 1.0. Nếu cả hai thuật ngữ TENNIS và GOLF cùng xuất hiện với CHAMPION, biểu ghi có thể có trọng số .8 + .4 + .6 = 1.8 hoặc .8 + .6 = 1.4 nếu ta chỉ sử dụng giá trị cao hơn trong biểu thức OR. Khi ñó, các biểu ghi trong kết quả tìm sẽ ñược sắp xếp theo thứ tự như sau: 1. Biểu ghi chứa ñồng thời 3 thuật ngữ với tổng trọng số 1.8 2. Biểu ghi chứa TENNIS và CHAMPION với tổng trọng số 1.4 3. Biểu ghi chứa GOLF và CHAMPION với tổng trọng số 1.0 6.2.2. Hiển thị kết quả Khi kết thúc tìm tin, chức năng hiển thị của hệ thống sẽ hỗ trợ người sử dụng xác ñịnh các biểu ghi cần thiết và lựa chọn ñể hiển thị. Có hai cách hiển thị tóm lược kết quả tìm của một biểu thức: trình bày các biểu ghi theo dòng và bằng ñồ thị. Từ những trình bày tóm lược này, người sử dụng có thể lựa chọn các biểu ghi cụ thể và các trường trong biểu ghi ñể hiển thị. Hệ thống cũng cho phép di chuyển dễ dàng giữa các trình bày tóm lược và xem các biểu ghi cụ thể. Nếu biểu thức tìm không chính xác thì kết quả tìm có thể chứa nhiều biểu ghi không thích hợp với yêu cầu tin của người sử dụng. Một số hệ thống cung cấp các chức năng Tìm lại trong các kết quả tìm; Lọc lại kết quả tìm hoặc ðánh dấu các biểu ghi ñược chọn ñể giúp người sử dụng chọn lọc ñược các biểu ghi thích hợp nhất. 6.2.2.1. Sắp xếp kết quả tìm Trong các hệ thống sử dụng toán tử Bool, kết quả tìm ñược hiển thị là tổng số các biểu ghi tìm ñược. Tất cả các biểu ghi tìm ñược ñều thỏa mãn các ñiều kiện của biểu thức Bool. Có thể dễ dàng tìm hiểu lý do một biểu ghi ñược lựa chọn (ví dụ dựa vào các thuật ngữ ñược ñánh dấu) và ñược hiển thị trong các biểu ghi tìm ñược. Các kết quả tìm có thể ñược sắp xếp theo một dấu hiệu nào ñó, ví dụ, theo nhan ñề hoặc theo trình tự thời gian từ mới ñến cũ. Nếu sử dụng cách sắp xếp dựa trên mức ñộ thích hợp của kết quả tìm ñược thì hệ thống sẽ hiển thị biểu ghi cùng với ñiểm số về mức ñộ thích hợp và một mô tả biểu ghi ngắn gọn (thường trong cùng một dòng trên màn hình). Vì mỗi biểu ghi thường chỉ ñược dành một dòng trên màn hình khi hiển thị ngắn gọn nên các hệ thống chỉ hiển thị một phần của một trường trong biểu ghi (thường là trường nhan ñề) cùng với ñiểm số về mức ñộ thích hợp của biểu ghi. ðiểm số về mức ñộ thích hợp là sự ñánh giá của hệ thống về mức ñộ ñáp ứng của biểu ghi ñối với biểu thức tìm. ðiều này cho phép người sử dụng dễ dàng lựa chọn các kết quả thích hợp nhất với yêu cầu tin. ðối với người sử dụng, cách trình bày ñiểm số cụ thể về mức ñộ thích hợp của biểu ghi khó hiểu hơn cách trình bày các biểu ghi theo từng loại mức ñộ thích hợp. Chẳng hạn, một số hệ thống phân ra các loại mức ñộ thích hợp và mỗi loại ñược thể hiện bằng một màu. Như vậy, các biểu ghi có mức ñộ thích hợp 77
  20. khác nhau sẽ ñược hiển thị bằng các màu khác nhau. Một số hệ thống phân thành các mức ñộ như cao, tương ñối cao, trung bình, thấp và không thích hợp. Với kỹ thuật sử dụng màu, hệ thống không cần ghi chỉ số về mức ñộ thích hợp của biểu ghi, nhờ vậy có thể dành thêm chỗ ñể hiển thị nhan ñề nhiều hơn. Tuy nhiên, kỹ thuật này cũng gây khó khăn cho những người sử dụng bị loạn màu hoặc mù màu. Kỹ thuật trình bày bằng ñồ thị thể hiện các mối liên quan thích hợp của các biểu ghi tìm ñược và có thể sử dụng. Ví dụ, có thể trình bày kết quả tìm bằng một ñồ thị 2 hoặc 3 chiều, trong ñó các ñiểm trên ñồ thị thể hiện các biểu ghi và vị trí của các ñiểm thể hiện mối tương quan giữa các biểu ghi và với yêu cầu tin của người sử dụng. Trong một số trường hợp, các loại màu cũng ñược sử dụng trong kỹ thuật hiển thị này. Kỹ thuật này cho phép người sử dụng xem các nhóm biểu ghi ñược phân theo chủ ñề và có thể xem toàn bộ một nhóm nào ñó hoặc chuyển qua một nhóm chủ ñề khác. Cách này cũng tương tự như khi lướt xem các giá sách trong một thư viện. Với cách này, người sử dụng có thể thấy hiệu quả của biểu thức tìm của mình hơn là chỉ hiển thị một ít biểu ghi. Hiên nay có nhiều hệ thống hỗ trợ cho người sử dụng chức năng lựa chọn cách sắp xếp kết quả tìm theo ý muốn, ví dụ sắp xếp theo nhan ñề, theo tác giả, năm xuất bản,… 6.2.2.2. Giới hạn vùng hiển thị ðể tiết kiệm thời gian, người sử dụng chỉ muốn xem những thông tin cần thiết nhất ñể xác ñịnh biểu ghi có thích hợp hay không. Nếu biểu ghi ñược xem là thích hợp thì người sử dụng mới cần hiển thị ñầy ñủ biểu ghi ñể xem chi tiết. Vì vậy, tóm lược kết quả tìm phải ñược trình bày một cách chọn lọc và phải hiển thị những thông tin cần thiết có thể giúp người sử dụng xác ñịnh ñược mức ñộ thích hợp của biểu ghi. Ví dụ, nhan ñề và tóm tắt có thể là thông tin cần thiết và ñủ ñể người sử dụng dự ñoán ñược mức ñộ thích hợp của một biểu ghi. Việc hiển thị giới hạn trong hai trường này cho phép hệ thống trình bày các kết quả tìm ñược trong một màn hình. ðiều này giúp người sử dụng có thể xem lướt nhanh và nắm ñược mức ñộ thích hợp có thể có của các biểu ghi trên màn hình. 6.2.2.3. ðánh dấu (highlighting) Kỹ thuật ñánh dấu giúp người sử dụng nhanh chóng tập trung vào những phần thích hợp của văn bản ñể xem mức ñộ thích hợp của biểu ghi. ðộ ñậm khác nhau của phần ñánh dấu cho biết mức ñộ quan trọng của từ ñược ñánh dấu ñối với việc lựa chọn biểu ghi ñó. Phần lớn các hệ thống cho phép việc hiển thị một tài liệu bắt ñầu từ phần ñược ñánh dấu ñầu tiên trong tài liệu và sau ñó chuyển sang phần ñược ñánh dấu tiếp theo. Một chức năng khác hỗ trợ hệ thống xác ñịnh ñoạn văn trong tài liệu thích hợp nhất với yêu cầu tin và sau ñó tài liệu sẽ ñược hiển thị bắt ñầu từ ñoạn văn này. Một số hệ thống cho phép người sử dụng hiển thị một tài liệu theo thứ tự các ñoạn văn hoặc các từ có tầm quan trọng nhất ñối với vị trí xếp hạng của tài liệu. Dưới ñây là một ví dụ về kỹ thuật ñánh dấu khi hiển thị kết quả tìm. 78
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2