TỔ CHỨC VÀ QUẢN LÝ, HỆ THỐNG CƠ SỞ DỮ LIỆU SỐ,<br />
BỘ SƯU TẬP TÀI LIỆU SỐ<br />
<br />
1. MỘT SỐ YÊU CẦU VỀ PHẦN MỀM QUẢN LÝ CƠ SỞ DỮ LIỆU SỐ<br />
<br />
Trong thời đại bùng nổ thông tin hiện nay, tài liệu số đang là một trong<br />
những xu thế của hoạt động thông tin thư viện hiện đại. Để quản lý và khai<br />
thác, sử dụng các nguồn tài liệu số, các cơ quan thông tin, thư viện nói<br />
chung và thông tin, thư viện trong quân đội nói riêng cần chú trọng đầu tư<br />
nghiên cứu phát triển phần mềm quản lý cơ sở dữ liệu (CSDL) số.<br />
<br />
I<br />
O<br />
D<br />
N<br />
<br />
1.1 Yêu cầu về phần mềm quản lý CSDL số<br />
Yêu cầu chung<br />
<br />
- Có khả năng lưu trữ các dạng dữ liệu số hoá, bao gồm hình ảnh, âm<br />
thanh, text, video;<br />
<br />
A<br />
U<br />
<br />
- Có khả năng hỗ trợ việc tìm kiếm toàn văn đối với tất cả các loại tài liệu<br />
điện tử, như Microsoft Word, Excel, WordPerfect, Acrobat PDF, HTML,<br />
XML...;<br />
<br />
Q<br />
N<br />
<br />
- Có khả năng tự xác định các thuộc tính của các file dữ liệu số hoá được<br />
đưa vào để cho phép tra cứu theo các thuộc tính đó, thí dụ kích cỡ file, loại<br />
nén (với hình ảnh, âm thanh và video), MIME type, cỡ và độ sâu (đối với hình<br />
ảnh), độ dài (đối với âm thanh và hình ảnh video)...;<br />
<br />
E<br />
I<br />
V<br />
U<br />
<br />
H<br />
T<br />
<br />
- Phần mềm phải cung cấp khả năng mô tả siêu dữ liệu cho các tư liệu<br />
số theo DCMI (Dublin Core Meta Data Initiative), cung cấp khả năng tra<br />
cứu và trao đổi siêu dữ liệu (metadata) bằng định dạng XML theo chuẩn<br />
Resource Description Format (RDF) của W3C.<br />
- Phần mềm phải cung cấp các tính năng quản lý truy cập để đảm bảo tính<br />
bảo mật và phân quyền sử dụng các tư liệu số.<br />
- Phần mềm có khả năng hỗ trợ thực hiện các chức năng cơ bản sau:<br />
Thu thập và bổ sung các tư liệu;<br />
Số hoá và xử lý các dữ liệu thu thập được;<br />
Biên mục, nhập vào CSDL, tạo các điểm truy cập để tìm kiếm;<br />
Tổ chức thông tin và khai thác, tra cứu các tài liệu liệu số;<br />
Quản trị hệ thống và bảo mật thông tin.<br />
<br />
155<br />
<br />
Yêu cầu về kĩ thuật<br />
Phần mềm quản lý CSDL số phải đáp ứng yêu cầu cập nhật và nâng cấp<br />
thuận tiện, có khả năng mở rộng và là hệ thống đa người dùng, an toàn;<br />
Hệ thống thư viện số cung cấp cho người sử dụng không chỉ khả năng truy<br />
cập đến các dữ liệu truyền thống như text, mà còn có khả năng hỗ trợ người<br />
sử dụng truy cập đến các nguồn dữ liệu số hoá trong hệ thống như văn bản, sơ<br />
đồ, hình ảnh, âm thanh...;<br />
Hệ thống được xây dựng dựa trên các tiêu chuẩn mở, do đó dễ dàng nâng<br />
cấp, mở rộng cũng như tích hợp với các hệ thống khác.<br />
<br />
A<br />
U<br />
<br />
Q<br />
N<br />
<br />
E<br />
I<br />
V<br />
U<br />
<br />
I<br />
O<br />
D<br />
N<br />
<br />
H<br />
T<br />
<br />
Sơ đồ cấu trúc hệ thống<br />
OPAC: không chỉ cung cấp các chức năng truyền thống như khả năng tra<br />
cứu, truy cập dữ liệu, mà còn trở thành cổng thông tin chung cho hầu hết<br />
mọi truy cập đến hệ thống thư viện điện tử;<br />
<br />
156<br />
<br />
Authority Control: cung cấp các chức năng kiểm soát truy cập, ghi nhận<br />
truy cập. Ngoài ra, Module này còn thực hiện các chức năng AAA:<br />
authorization (cấp quyền), authentication (xác thực) và accouting (tính tiền);<br />
Library Server: cung cấp các thông tin liên quan đến bạn đọc, tư liệu;<br />
Object Server: lưu trữ và cung cấp nội dung các tài liệu số. Các máy chủ<br />
có thể mở rộng theo nhu cầu (nâng cấp, thêm các máy chủ...).<br />
Thông qua OPAC, bạn đọc tiến hành các thao tác tra cứu tư liệu. Sau khi<br />
yêu cầu tra cứu được gửi đến Library Server, Library server trả lại kết quả,<br />
chỉ rõ nội dung tư liệu tại địa chỉ (URL)/ đường dẫn. Bạn đọc gửi địa chỉ/<br />
đường dẫn đến nội dung tư liệu, OPAC chuyển cho AAA Control để kiểm<br />
tra quyền truy cập. Trong trường hợp được quyền truy cập, Object Server sẽ<br />
trả lại nội dung và chuyển kết quả về cho bạn đọc thông qua OPAC, bao<br />
gồm cả việc thông báo lỗi truy cập.<br />
<br />
I<br />
O<br />
D<br />
N<br />
<br />
1.2 Các bước xây dựng CSDL số<br />
<br />
A<br />
U<br />
<br />
- Thu thập, bổ sung các tư liệu cần số hoá<br />
<br />
Đây là công đoạn chủ yếu do các cán bộ thư viện thực hiện. Các cán bộ<br />
thư viện sẽ phải xác định ra các loại tài liệu hoặc những phần tài liệu cần<br />
phải số hoá, sau đó tiến hành phân loại tài liệu tuỳ theo thuộc tính của<br />
chúng để xử lý. Có rất nhiều loại tài liệu khác nhau nhưng các tài liệu có<br />
thể được phân theo các nhóm: text, hình ảnh (images), audio, video và các<br />
dạng tài liệu khác (chương trình máy tính...).<br />
<br />
Q<br />
N<br />
<br />
E<br />
I<br />
V<br />
U<br />
<br />
- Số hoá và xử lý các tài liệu (xem bảng dưới đây)<br />
<br />
H<br />
T<br />
<br />
Bản gốc<br />
Hình ảnh số<br />
Dạng vật Vật thể, vật<br />
chất<br />
chất (sách,<br />
video...)<br />
Định<br />
Đa<br />
dạng<br />
dạng<br />
(văn<br />
bản<br />
(format)<br />
tiếng Anh,<br />
VHS, ...)<br />
<br />
File máy tính<br />
<br />
Thông tin số<br />
File máy tính<br />
<br />
File đồ hoạ File có cấu trúc<br />
(.BMP,<br />
(.DOC, .MPG)<br />
.MPG,...)<br />
biểu ghi chỉ số<br />
và cơ sở dữ<br />
liệu.<br />
Khả năng Người hoặc Các chương Các<br />
chương<br />
đọc<br />
là các thiết trình đồ hoạ trình máy tính<br />
bị<br />
chuyên máy tính<br />
như văn bản,<br />
dụng<br />
video hay cơ sở<br />
dữ liệu.<br />
157<br />
<br />
Khả năng Nhân<br />
bản Copy file và<br />
nhân bản vật<br />
chất in các bản sao<br />
(photocopy) theo số lượng<br />
mong muốn<br />
<br />
Xử lý<br />
<br />
Thay<br />
đổi<br />
bằng<br />
tay<br />
(viết vào lề<br />
sách, cắt và<br />
nối băng)<br />
<br />
Đánh<br />
dấu<br />
bằng<br />
máy<br />
tính và xử lý<br />
đồ hoạ (thêm<br />
vào các ghi<br />
chú<br />
của<br />
người dùng,<br />
phóng to/thu<br />
nhỏ, thay đổi<br />
màu sắc, thay<br />
bằng các hình<br />
ảnh khác).<br />
<br />
I<br />
O<br />
D<br />
N<br />
<br />
A<br />
U<br />
<br />
Q<br />
N<br />
<br />
E<br />
I<br />
V<br />
U<br />
<br />
Tạo các thông<br />
tin của bản gốc<br />
theo các định<br />
dạng khác nhau<br />
(in lại sách theo<br />
chữ in nghiêng,<br />
chơi video với<br />
các track âm<br />
thanh<br />
khác<br />
nhau).<br />
Sửa đổi lại các<br />
thông tin gốc,<br />
tạo ra các tài<br />
liệu mới từ tài<br />
liệu gốc, copy<br />
và phân phối.<br />
<br />
Số hoá và xử lý tài liệu là công đoạn quan trọng nhất để tạo nên một thư<br />
viện điện tử. Có rất nhiều dạng tài liệu gốc (sách, video, audio, hình ảnh...).<br />
Sách có thể bao gồm cả chữ và hình ảnh, video bao gồm cả audio và hình ảnh...<br />
Với mỗi dạng tài liệu thì có các cách xử lý khác nhau, nhưng tựu chung lại<br />
chúng đều phải qua các giai đoạn số hoá (tạo ra các hình ảnh số) và sau đó tiến<br />
hành xử lý để tạo ra các thông tin số - đối tượng của thư viện điện tử.<br />
<br />
H<br />
T<br />
<br />
- Biên mục, nhập vào CSDL, tạo các điểm truy cập để tìm kiếm<br />
Nguyên tắc chung của việc biên mục dữ liệu số là xây dựng các bộ nhãn<br />
trường cá biệt cho mỗi loại tài liệu cần số hoá. Các nhãn trường này phải<br />
tuân thủ theo các thành phần do tổ chức Sáng kiến siêu dữ liệu Dublin Core<br />
(DCMI) qui định. DCMI qui định 15 thành tố cần mô tả cho các nguồn tư<br />
liệu (không nhất thiết là các tư liệu điện tử). So với MARC21, DCMI đã<br />
được đơn giản hoá nhằm tăng khả năng chuyển tải và khai thác đối với các<br />
bản ghi thư mục. Ngoài ra, DCMI còn qui định phương pháp mở rộng, tuy<br />
<br />
158<br />
<br />
nhiên các trường mở rộng này cần thuộc vào 15 thành tố đã qui định trong<br />
DCMES (Dublin Core Metadata Element Set).<br />
1.3 Tổ chức thông tin và khai thác, tra cứu<br />
Sau khi kết thúc quá trình số hoá, biên mục tài liệu, các tài liệu sẽ<br />
được đưa vào khai thác. Theo đó, hệ thống cung cấp cho người dùng tin<br />
khả năng tra cứu đầy đủ theo các tiêu chí chung (như đã mô tả trong<br />
phần OPAC), người dùng tin có thể tìm kiếm theo tiêu đề, từ khoá, tác<br />
giả… Đối với dữ liệu số, hệ thống còn cung cấp các khả năng tra cứu<br />
đặc trưng riêng cho từng kiểu dữ liệu, ví dụ với kiểu văn bản, người<br />
dùng tin có thể thực hiện tìm kiếm toàn văn; kiểu hình ảnh: có thể tra<br />
cứu theo màu sắc... Hệ thống quản lý quyền truy cập đến từng tài liệu sẽ<br />
kiểm soát và ghi lại mọi yêu cầu truy cập, bảo đảm người dùng tin chỉ<br />
được tra cứu các tài liệu được cấp phép và thực hiện chức năng AAA<br />
(dịch vụ bán thông tin và tính tiền).<br />
<br />
I<br />
O<br />
D<br />
N<br />
<br />
Có hai phương thức truy cập (thể hiện) dữ liệu: một là, người dùng tin<br />
có thể tải (download) toàn bộ dữ liệu về máy trạm, sau đó mới xem tư<br />
liệu. Phương pháp này cho phép người dùng tin có thể xem lại nhiều lần<br />
mà không cần truy cập lại. Tuy nhiên, hạn chế của phương pháp này là<br />
người dùng tin sẽ phải chờ cho đến khi toàn bộ tư liệu được tải xuống,<br />
quá trình tải xuống sẽ phải mất nhiều thời gian tùy thuộc vào tốc độ<br />
đường truyền và dung lượng file dữ liệu; hai là, ứng dụng công nghệ<br />
streaming. Ưu điểm của công nghệ này là, sau khi đã nhận được các thông<br />
tin mô tả cần thiết, bạn đọc có thể xem tư liệu ngay lập tức, đồng thời hệ<br />
thống tiếp tục tải các gói dữ liệu tiếp theo về máy trạm. Công nghệ<br />
streaming không đòi hỏi đường truyền tốc độ cao, cho phép xem theo thời<br />
gian thực, nên khắc phục những nhược điểm của phương pháp thứ nhất.<br />
<br />
A<br />
U<br />
<br />
Q<br />
N<br />
<br />
E<br />
I<br />
V<br />
U<br />
<br />
H<br />
T<br />
<br />
1.4 Quản trị hệ thống và bảo mật thông tin<br />
Module quản trị dữ liệu số cần cung cấp các chức năng chính sau:<br />
<br />
- Phân quyền truy cập cho người sử dụng: cho phép định nghĩa các tài<br />
liệu (loại tài liệu) mà bạn đọc (nhóm bạn đọc) được phép truy cập;<br />
- Kiểm soát truy cập;<br />
- Bảo trì hệ thống: cung cấp các khả năng theo dõi tình trạng hệ thống<br />
trong quá trình vận hành.<br />
Phần mềm thư viện số đưa ra một phương pháp chung cho việc biên<br />
mục các tư liệu số. Thư viện có thể xây dựng các bộ sưu tập số hoá theo<br />
mục đích riêng. Các bản ghi thư mục đối với các nguồn tư liệu số hoá có<br />
<br />
159<br />
<br />