Tổ chức và quản lý, hệ thống cơ sở dữ liệu số, bộ sưu tập tài liệu số

Chia sẻ: Nguyễn Thị Thanh Triều | Ngày: | Loại File: PDF | Số trang:19

0
27
lượt xem
2
download

Tổ chức và quản lý, hệ thống cơ sở dữ liệu số, bộ sưu tập tài liệu số

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết trình bày một số yêu cầu về phần mềm quản lý cơ sở dữ liệu số bao gồm yêu cầu các bước xây dựng cơ sở dữ liệu số, tổ chức thông tin và khai thác, tra cứu; quản trị hệ thống và bảo mật thông tin. Bên cạnh đó, bài viết còn đề cập một số vấn đề xây dựng cơ sở dữ liệu điện tử, dữ liệu số trong quân đội hiện nay; yêu cầu về các phân hệ trong phần mềm thư viện điện tử hay xây dựng cơ sở dữ liệu thư mục và toàn văn.

Chủ đề:
Lưu

Nội dung Text: Tổ chức và quản lý, hệ thống cơ sở dữ liệu số, bộ sưu tập tài liệu số

TỔ CHỨC VÀ QUẢN LÝ, HỆ THỐNG CƠ SỞ DỮ LIỆU SỐ,<br /> BỘ SƯU TẬP TÀI LIỆU SỐ<br /> <br /> 1. MỘT SỐ YÊU CẦU VỀ PHẦN MỀM QUẢN LÝ CƠ SỞ DỮ LIỆU SỐ<br /> <br /> Trong thời đại bùng nổ thông tin hiện nay, tài liệu số đang là một trong<br /> những xu thế của hoạt động thông tin thư viện hiện đại. Để quản lý và khai<br /> thác, sử dụng các nguồn tài liệu số, các cơ quan thông tin, thư viện nói<br /> chung và thông tin, thư viện trong quân đội nói riêng cần chú trọng đầu tư<br /> nghiên cứu phát triển phần mềm quản lý cơ sở dữ liệu (CSDL) số.<br /> <br /> I<br /> O<br /> D<br /> N<br /> <br /> 1.1 Yêu cầu về phần mềm quản lý CSDL số<br /> Yêu cầu chung<br /> <br /> - Có khả năng lưu trữ các dạng dữ liệu số hoá, bao gồm hình ảnh, âm<br /> thanh, text, video;<br /> <br /> A<br /> U<br /> <br /> - Có khả năng hỗ trợ việc tìm kiếm toàn văn đối với tất cả các loại tài liệu<br /> điện tử, như Microsoft Word, Excel, WordPerfect, Acrobat PDF, HTML,<br /> XML...;<br /> <br /> Q<br /> N<br /> <br /> - Có khả năng tự xác định các thuộc tính của các file dữ liệu số hoá được<br /> đưa vào để cho phép tra cứu theo các thuộc tính đó, thí dụ kích cỡ file, loại<br /> nén (với hình ảnh, âm thanh và video), MIME type, cỡ và độ sâu (đối với hình<br /> ảnh), độ dài (đối với âm thanh và hình ảnh video)...;<br /> <br /> E<br /> I<br /> V<br /> U<br /> <br /> H<br /> T<br /> <br /> - Phần mềm phải cung cấp khả năng mô tả siêu dữ liệu cho các tư liệu<br /> số theo DCMI (Dublin Core Meta Data Initiative), cung cấp khả năng tra<br /> cứu và trao đổi siêu dữ liệu (metadata) bằng định dạng XML theo chuẩn<br /> Resource Description Format (RDF) của W3C.<br /> - Phần mềm phải cung cấp các tính năng quản lý truy cập để đảm bảo tính<br /> bảo mật và phân quyền sử dụng các tư liệu số.<br /> - Phần mềm có khả năng hỗ trợ thực hiện các chức năng cơ bản sau:<br /> Thu thập và bổ sung các tư liệu;<br /> Số hoá và xử lý các dữ liệu thu thập được;<br /> Biên mục, nhập vào CSDL, tạo các điểm truy cập để tìm kiếm;<br /> Tổ chức thông tin và khai thác, tra cứu các tài liệu liệu số;<br /> Quản trị hệ thống và bảo mật thông tin.<br /> <br /> 155<br /> <br /> Yêu cầu về kĩ thuật<br /> Phần mềm quản lý CSDL số phải đáp ứng yêu cầu cập nhật và nâng cấp<br /> thuận tiện, có khả năng mở rộng và là hệ thống đa người dùng, an toàn;<br /> Hệ thống thư viện số cung cấp cho người sử dụng không chỉ khả năng truy<br /> cập đến các dữ liệu truyền thống như text, mà còn có khả năng hỗ trợ người<br /> sử dụng truy cập đến các nguồn dữ liệu số hoá trong hệ thống như văn bản, sơ<br /> đồ, hình ảnh, âm thanh...;<br /> Hệ thống được xây dựng dựa trên các tiêu chuẩn mở, do đó dễ dàng nâng<br /> cấp, mở rộng cũng như tích hợp với các hệ thống khác.<br /> <br /> A<br /> U<br /> <br /> Q<br /> N<br /> <br /> E<br /> I<br /> V<br /> U<br /> <br /> I<br /> O<br /> D<br /> N<br /> <br /> H<br /> T<br /> <br /> Sơ đồ cấu trúc hệ thống<br /> OPAC: không chỉ cung cấp các chức năng truyền thống như khả năng tra<br /> cứu, truy cập dữ liệu, mà còn trở thành cổng thông tin chung cho hầu hết<br /> mọi truy cập đến hệ thống thư viện điện tử;<br /> <br /> 156<br /> <br /> Authority Control: cung cấp các chức năng kiểm soát truy cập, ghi nhận<br /> truy cập. Ngoài ra, Module này còn thực hiện các chức năng AAA:<br /> authorization (cấp quyền), authentication (xác thực) và accouting (tính tiền);<br /> Library Server: cung cấp các thông tin liên quan đến bạn đọc, tư liệu;<br /> Object Server: lưu trữ và cung cấp nội dung các tài liệu số. Các máy chủ<br /> có thể mở rộng theo nhu cầu (nâng cấp, thêm các máy chủ...).<br /> Thông qua OPAC, bạn đọc tiến hành các thao tác tra cứu tư liệu. Sau khi<br /> yêu cầu tra cứu được gửi đến Library Server, Library server trả lại kết quả,<br /> chỉ rõ nội dung tư liệu tại địa chỉ (URL)/ đường dẫn. Bạn đọc gửi địa chỉ/<br /> đường dẫn đến nội dung tư liệu, OPAC chuyển cho AAA Control để kiểm<br /> tra quyền truy cập. Trong trường hợp được quyền truy cập, Object Server sẽ<br /> trả lại nội dung và chuyển kết quả về cho bạn đọc thông qua OPAC, bao<br /> gồm cả việc thông báo lỗi truy cập.<br /> <br /> I<br /> O<br /> D<br /> N<br /> <br /> 1.2 Các bước xây dựng CSDL số<br /> <br /> A<br /> U<br /> <br /> - Thu thập, bổ sung các tư liệu cần số hoá<br /> <br /> Đây là công đoạn chủ yếu do các cán bộ thư viện thực hiện. Các cán bộ<br /> thư viện sẽ phải xác định ra các loại tài liệu hoặc những phần tài liệu cần<br /> phải số hoá, sau đó tiến hành phân loại tài liệu tuỳ theo thuộc tính của<br /> chúng để xử lý. Có rất nhiều loại tài liệu khác nhau nhưng các tài liệu có<br /> thể được phân theo các nhóm: text, hình ảnh (images), audio, video và các<br /> dạng tài liệu khác (chương trình máy tính...).<br /> <br /> Q<br /> N<br /> <br /> E<br /> I<br /> V<br /> U<br /> <br /> - Số hoá và xử lý các tài liệu (xem bảng dưới đây)<br /> <br /> H<br /> T<br /> <br /> Bản gốc<br /> Hình ảnh số<br /> Dạng vật Vật thể, vật<br /> chất<br /> chất (sách,<br /> video...)<br /> Định<br /> Đa<br /> dạng<br /> dạng<br /> (văn<br /> bản<br /> (format)<br /> tiếng Anh,<br /> VHS, ...)<br /> <br /> File máy tính<br /> <br /> Thông tin số<br /> File máy tính<br /> <br /> File đồ hoạ File có cấu trúc<br /> (.BMP,<br /> (.DOC, .MPG)<br /> .MPG,...)<br /> biểu ghi chỉ số<br /> và cơ sở dữ<br /> liệu.<br /> Khả năng Người hoặc Các chương Các<br /> chương<br /> đọc<br /> là các thiết trình đồ hoạ trình máy tính<br /> bị<br /> chuyên máy tính<br /> như văn bản,<br /> dụng<br /> video hay cơ sở<br /> dữ liệu.<br /> 157<br /> <br /> Khả năng Nhân<br /> bản Copy file và<br /> nhân bản vật<br /> chất in các bản sao<br /> (photocopy) theo số lượng<br /> mong muốn<br /> <br /> Xử lý<br /> <br /> Thay<br /> đổi<br /> bằng<br /> tay<br /> (viết vào lề<br /> sách, cắt và<br /> nối băng)<br /> <br /> Đánh<br /> dấu<br /> bằng<br /> máy<br /> tính và xử lý<br /> đồ hoạ (thêm<br /> vào các ghi<br /> chú<br /> của<br /> người dùng,<br /> phóng to/thu<br /> nhỏ, thay đổi<br /> màu sắc, thay<br /> bằng các hình<br /> ảnh khác).<br /> <br /> I<br /> O<br /> D<br /> N<br /> <br /> A<br /> U<br /> <br /> Q<br /> N<br /> <br /> E<br /> I<br /> V<br /> U<br /> <br /> Tạo các thông<br /> tin của bản gốc<br /> theo các định<br /> dạng khác nhau<br /> (in lại sách theo<br /> chữ in nghiêng,<br /> chơi video với<br /> các track âm<br /> thanh<br /> khác<br /> nhau).<br /> Sửa đổi lại các<br /> thông tin gốc,<br /> tạo ra các tài<br /> liệu mới từ tài<br /> liệu gốc, copy<br /> và phân phối.<br /> <br /> Số hoá và xử lý tài liệu là công đoạn quan trọng nhất để tạo nên một thư<br /> viện điện tử. Có rất nhiều dạng tài liệu gốc (sách, video, audio, hình ảnh...).<br /> Sách có thể bao gồm cả chữ và hình ảnh, video bao gồm cả audio và hình ảnh...<br /> Với mỗi dạng tài liệu thì có các cách xử lý khác nhau, nhưng tựu chung lại<br /> chúng đều phải qua các giai đoạn số hoá (tạo ra các hình ảnh số) và sau đó tiến<br /> hành xử lý để tạo ra các thông tin số - đối tượng của thư viện điện tử.<br /> <br /> H<br /> T<br /> <br /> - Biên mục, nhập vào CSDL, tạo các điểm truy cập để tìm kiếm<br /> Nguyên tắc chung của việc biên mục dữ liệu số là xây dựng các bộ nhãn<br /> trường cá biệt cho mỗi loại tài liệu cần số hoá. Các nhãn trường này phải<br /> tuân thủ theo các thành phần do tổ chức Sáng kiến siêu dữ liệu Dublin Core<br /> (DCMI) qui định. DCMI qui định 15 thành tố cần mô tả cho các nguồn tư<br /> liệu (không nhất thiết là các tư liệu điện tử). So với MARC21, DCMI đã<br /> được đơn giản hoá nhằm tăng khả năng chuyển tải và khai thác đối với các<br /> bản ghi thư mục. Ngoài ra, DCMI còn qui định phương pháp mở rộng, tuy<br /> <br /> 158<br /> <br /> nhiên các trường mở rộng này cần thuộc vào 15 thành tố đã qui định trong<br /> DCMES (Dublin Core Metadata Element Set).<br /> 1.3 Tổ chức thông tin và khai thác, tra cứu<br /> Sau khi kết thúc quá trình số hoá, biên mục tài liệu, các tài liệu sẽ<br /> được đưa vào khai thác. Theo đó, hệ thống cung cấp cho người dùng tin<br /> khả năng tra cứu đầy đủ theo các tiêu chí chung (như đã mô tả trong<br /> phần OPAC), người dùng tin có thể tìm kiếm theo tiêu đề, từ khoá, tác<br /> giả… Đối với dữ liệu số, hệ thống còn cung cấp các khả năng tra cứu<br /> đặc trưng riêng cho từng kiểu dữ liệu, ví dụ với kiểu văn bản, người<br /> dùng tin có thể thực hiện tìm kiếm toàn văn; kiểu hình ảnh: có thể tra<br /> cứu theo màu sắc... Hệ thống quản lý quyền truy cập đến từng tài liệu sẽ<br /> kiểm soát và ghi lại mọi yêu cầu truy cập, bảo đảm người dùng tin chỉ<br /> được tra cứu các tài liệu được cấp phép và thực hiện chức năng AAA<br /> (dịch vụ bán thông tin và tính tiền).<br /> <br /> I<br /> O<br /> D<br /> N<br /> <br /> Có hai phương thức truy cập (thể hiện) dữ liệu: một là, người dùng tin<br /> có thể tải (download) toàn bộ dữ liệu về máy trạm, sau đó mới xem tư<br /> liệu. Phương pháp này cho phép người dùng tin có thể xem lại nhiều lần<br /> mà không cần truy cập lại. Tuy nhiên, hạn chế của phương pháp này là<br /> người dùng tin sẽ phải chờ cho đến khi toàn bộ tư liệu được tải xuống,<br /> quá trình tải xuống sẽ phải mất nhiều thời gian tùy thuộc vào tốc độ<br /> đường truyền và dung lượng file dữ liệu; hai là, ứng dụng công nghệ<br /> streaming. Ưu điểm của công nghệ này là, sau khi đã nhận được các thông<br /> tin mô tả cần thiết, bạn đọc có thể xem tư liệu ngay lập tức, đồng thời hệ<br /> thống tiếp tục tải các gói dữ liệu tiếp theo về máy trạm. Công nghệ<br /> streaming không đòi hỏi đường truyền tốc độ cao, cho phép xem theo thời<br /> gian thực, nên khắc phục những nhược điểm của phương pháp thứ nhất.<br /> <br /> A<br /> U<br /> <br /> Q<br /> N<br /> <br /> E<br /> I<br /> V<br /> U<br /> <br /> H<br /> T<br /> <br /> 1.4 Quản trị hệ thống và bảo mật thông tin<br /> Module quản trị dữ liệu số cần cung cấp các chức năng chính sau:<br /> <br /> - Phân quyền truy cập cho người sử dụng: cho phép định nghĩa các tài<br /> liệu (loại tài liệu) mà bạn đọc (nhóm bạn đọc) được phép truy cập;<br /> - Kiểm soát truy cập;<br /> - Bảo trì hệ thống: cung cấp các khả năng theo dõi tình trạng hệ thống<br /> trong quá trình vận hành.<br /> Phần mềm thư viện số đưa ra một phương pháp chung cho việc biên<br /> mục các tư liệu số. Thư viện có thể xây dựng các bộ sưu tập số hoá theo<br /> mục đích riêng. Các bản ghi thư mục đối với các nguồn tư liệu số hoá có<br /> <br /> 159<br /> <br />

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản