intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Ứng dụng phần mềm mã nguồn mở DSPACE 5.4 trong xây dựng và quản lý tài nguyên số

Chia sẻ: Anhnangchieuta | Ngày: | Loại File: PDF | Số trang:6

45
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nghiên cứu này phân tích những ưu điểm và hạn chế của phần mềm nhằm khai thác và ứng dụng vào việc quản lý tài nguyên số tại Trung tâm Học liệu và truyền thông. Đồng thời đề xuất phương pháp chuyển đổi kho dữ liệu số từ các hệ thống cũ sang hệ thống mới và chính sách cập nhật dữ liệu dàng cho từng đối tượng, từng đơn vị.

Chủ đề:
Lưu

Nội dung Text: Ứng dụng phần mềm mã nguồn mở DSPACE 5.4 trong xây dựng và quản lý tài nguyên số

  1. Võ Đức Hoàng 219 Ứng dụng phần mềm mã nguồn mở DSPACE 5.4 trong xây dựng và quản lý tài nguyên số Võ Đức Hoàng1 1 Khoa Công nghệ Thông tin, Trường Đại học Bách khoa, Đại học Đà Nẵng hoangvd.it@dut.udn.vn Tóm tắt: Nghiên cứu giới thiệu về phần mềm mã nguồn mở Dspace 5.4 và ứng dụng vào xây dựng và quản lý tài nguyên số tại Trường Đại học Bách khoa, Đại học Đà Nẵng. Nghiên cứu này phân tích những ưu điểm và hạn chế của phần mềm nhằm khai thác và ứng dụng vào việc quản lý tài nguyên số tại Trung tâm Học liệu và truyền thông. Đồng thời đề xuất phương pháp chuyển đổi kho dữ liệu số từ các hệ thống cũ sang hệ thống mới và chính sách cập nhật dữ liệu dàng cho từng đối tượng, từng đơn vị. Với đề xuất nghiên cứu này sẽ giúp cho việc quản lý hệ thống tài nguyên số được thuận tiện hơn, bảo đảm tính pháp lý của tác giả và đơn vị sở hữu bản quyền của sản phẩm. Ngoài ra, hệ thống sẽ được kết nối với nguồn tài liệu các đơn vị khác để được đồng bộ và triển khai rộng rãi. Từ khóa: Phần mềm mã nguồn mở, tài nguyên số, Dspace, kho dữ liệu. 1 Đặt vấn đề Hoạt động đào tạo và nghiên cứu khoa học của Trường Đại học Bách khoa đã tạo ra một khối lượng tài liệu đặc biệt có giá trị. Đó là các giáo trình, các tập bài giảng của giảng viên, các Khoá luận Tốt nghiệp của sinh viên, các Luận văn Thạc sỹ của học viên, các Luận án Tiến sỹ của nghiên cứu sinh, các công trình nghiên cứu khoa học của giảng viên và sinh viên đăng tải trên các tạp chí khoa học, các kỷ yếu hội nghị khoa học… Chúng được gọi chung là nguồn tài liệu nội sinh và thông tin mà các nguồn tài liệu này cung cấp được gọi là nguồn thông tin nội sinh. Nguồn thông tin nội sinh của trường đại học là yếu tố phản ánh đầy đủ và hệ thống các thành tựu và tiềm năng khoa học của một trường đại học và có vai trò quan trọng trong công tác đào tạo của nhà trường. Các nguồn thông tin này ngày càng phong phú, đa dạng và luôn chứa đựng những thông tin mới nhất trong lĩnh vực mà nó xem xét, rất cần được quản lý và khai thác một cách hiệu quả. Một thuận lợi là các nguồn thông tin này thường được lưu trữ dưới dạng tệp văn bản, tức là đã được số hoá và về cơ bản nhà trường có quyền sử dụng, không gặp nhiều khó khăn trong vấn đề bản quyền. Năm 2017, Trung tâm Học liệu và truyền thông, Trường Đại học Bách khoa được thành lập kế thừa từ Trung tâm Thông tin học liệu của Đại học Đà Nẵng. Việc kế thừa nguồn thông tin nội sinh đã có và cập nhật nguồn thông tin mới là vấn đề cần thiết và cấp bách. Ngày nay cùng với sự phát triển mạnh mẽ của Công nghệ Thông tin và mạng Internet đã làm thay đổi nhiều lĩnh vực trong đời sống con người và trong đó có ngành Thông tin - Thư viện. Cùng với sự phát triển của công nghệ, nhu cầu đọc và văn hóa đọc của con người cũng dần thay đổi. Bên cạnh tài liệu truyền thống (dạng in ấn), dạng tài liệu số đã và đang được phổ biến và được người đọc quan tâm bởi tính tiện lợi của chúng. Tài liệu số được sử dụng không giới hạn về không gian và thời gian. Tài liệu số phát triển nhanh mạnh, đòi hỏi các thư viện phải có phần mềm để quản lý. Có rất nhiều phần mềm dùng để quản lý các bộ sưu tập số, bao gồm cả phần
  2. 220 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” mềm thương mại và phần mềm mã nguồn mở miễn phí. Mỗi phần mềm đều có ưu và nhược điểm riêng. Đối với các đơn vị có kinh phí hạn chế, giải pháp lựa chọn phần mềm mã nguồn mở là lựa chọn tối ưu. Hiện nay, trên thế giới có 2 phần mềm mà nguồn mở được sử dụng rộng rãi dùng để xây dựng, quản lý các bộ sưu tập số là GreenStone [3] và Dspace [2]. Tuy nhiên, qua quá trình sử dụng, phần mềm mà nguồn mở DSpace được đánh giá tốt hơn bởi các tính năng nổi trội của nó. Hiện nay, có hơn 1.000 trường đại học và các tổ chức văn hoá sử dụng phần mềm số DSpace để quản lý và chia sẻ nguồn tài nguyên: sách, tạp chí, luận văn và các sưu tập hình ảnh, âm thanh và phim... 2 Vài nét về phần mềm mã nguồn mở DSpace Dspace do Công ty Hewlett-Packard (HP) và thư viện MIT (Massachusetts Institute of Technology) phát triển vào năm 2002. DSpace là một hệ thống mã nguồn mở được miễn phí cho các tổ chức, các thư viện, các cơ quan nghiên cứu phát triển và mở rộng. DSpace cung cấp một phương thức mới trong việc tổ chức và xuất bản thông tin trên internet. Từ khi ra đời cho đến nay DSpace luôn được cải tiến nhằm đáp ứng mạnh mẽ các nhu cầu thiết yếu của thư viện và người dùng. Đến nay, năm 2017 phần mềm đã phát triển đến phiên bản 6.x. Đồng thời các phiên bản ra đời sau DSpace cho phép nâng cấp dễ dàng từ các phiên bản trước đó. Tuy nhiên, qua quá trình thử nghiệm phiên bản 5.x hiện đang hoạt động khá ổn định và được ứng dụng rộng rãi tại các đơn vị trong nước và trên thế giới. 2.1 Vai trò chính của DSpace DSpace được sử dụng như một phần mềm lưu trữ và phân phối tài liệu số với ba vai trò chính:  Giúp cho việc thu nhận và quản lý tài liệu số dễ dàng, bao gồm siêu dữ liệu của tài liệu;  Giúp cho việc truy cập tài liệu được dễ dàng (bao gồm liệt kê và tìm kiếm);  Giúp cho việc bảo quản tài liệu được lâu dài. 2.2 Ưu điểm của phần mềm Dspace 5.x Ngoài những tính năng cơ bản được kế thừa từ phiên bản 4.x [1] như: hệ quản trị cơ sở dữ liệu, bảo mật, chức năng tìm kiếm, định dạng tài liệu và nhập xuất bản ghi.. DSpace 5.x còn có những ưu điểm nổi bật như sau:  Cho phép nâng cấp DSpace dễ dàng từ bất kỳ phiên bản nào trước đây sang phiên bản 5.x;  Cho phép nhập/xuất dữ liệu, siêu dữ liệu từ giao diện diện web, giúp người quản trị có thể thực hiện trực tiếp không cần nhiều kiến thức về CNTT;  Phân quyền và bảo mật mạnh. Có thể phân quyền đến từng tài khoản người dùng, đến từng bộ sưu tập hoặc thậm chí đến từng tài liệu. Các quyền được cấu hình khá chi tiết như: Quyền xem biểu ghi thư mục, quyền xem toàn văn... Ngoài ra, DSpace 5.x còn cho phép phân quyền truy cập theo cơ chế tài khoản truy cập hoặc qua địa chỉ IP;  Tích hợp các công cụ cho phép người dùng xem nội dung dữ liệu trực tuyến như văn bản (.doc, .xlx, .ppt…), âm thanh, hình ảnh, phim.
  3. Võ Đức Hoàng 221  Xác nhận cho phép quyền tải tài liệu là người cập nhật tài liệu (người quản trị không thể thực hiện) vì vậy sẽ đảm bảo cơ chế sở hữu trí tuệ quyền tác giả. 2.3 Hạn chế Dspace Chưa có tính năng phát hiện trùng tài liệu khi nhập dữ liệu. 3 Tổng quan về hệ thống 3.1 Mô hình đề xuất hệ thống tài nguyên số DUT Hình 1. Mô hình đề xuất tổ chức thông tin Trước khi đưa tài liệu vào các bộ sưu tập, ta nên đề ra chính sách khai thác tài liệu đối với các bộ sưu tập số để cấu hình cho các đơn vị và bộ sưu tập. Cần xác định người dùng và nhóm người dùng để có thể phân quyền cụ thể về quyền truy cập, quyền xem trực tuyến, quyền tải về, quyền yêu cầu… như vậy sẽ dễ dàng quản lý và thay đổi quyền khi cần thiết. Cần phân cấp quyền cho đơn vị và bộ sưu tập đến cấp quản lý từng khoa, phòng, dự án để các đơn vị có thể tự động cập nhật dữ liệu và bảo đảm quyền sở hữu tác giả đối với các tài nguyên số. 3.2 Kiến trúc hệ thống Kiến trúc hệ thống của Dspace là một kiến trúc ba lớp:  Lớp lưu trữ;  Lớp nghiệp vụ;  Lớp ứng dụng. Các lớp lưu trữ được thực hiện bằng cách sử dụng hệ thống tập tin, quản lý bởi các bảng trong cơ sở dữ liệu PostgreSQL. Lớp nghiệp vụ là lớp các chức năng cụ thể của Dspace, bao gồm cả các module luồng công việc, quản lý nội dung, quản trị, tìm kiếm và duyệt tài liệu. Mỗi
  4. 222 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” module có một API để cho phép Dspace tùy chỉnh, nâng cấp các chức năng phù hợp với từng đối tượng. Cuối cùng, lớp ứng dụng bao gồm các giao diện cho hệ thống giao diện người dùng web và bộ xử lý theo lô, đặc biệt còn hỗ trợ OAI (Open Archives Initiative) và xử lý máy chủ để giải quyết định danh liên tục (Handle) đến các biểu ghi trong Dspace. 3.3 Metadata (siêu dữ liệu) Dspace sử dụng siêu dữ liệu chuẩn Dublin core để mô tả các thông tin về tài nguyên điện tử cần lưu trữ, phân phối. Trong đó có 3 yếu tố (thông tin) bắt buộc phải mô tả: Nhan đề, ngôn ngữ, ngày đăng, các yếu tố còn lại là tùy chọn. Ngoài ra, có một số các yếu tố bổ sung cho tài liệu: tóm tắt, từ khóa, siêu dữ liệu kỹ thuật và siêu dữ liệu quyền. Các siêu dữ liệu này được hiển thị trong biểu ghi của tài liệu trong hệ thống Dspace và được lập chỉ mục để hỗ trợ tìm kiếm, duyệt thông tin trong hệ thống (duyệt theo Bộ sưu tập, theo chủ đề, theo các đơn vị thành viên của tổ chức…). Hệ thống hỗ trợ kết xuất siêu dữ liệu và tài liệu điện tử trong kho lưu trữ theo dạng chuẩn XML, và hiện đang phát triển để hỗ trợ chuẩn METS đối với các siêu dữ liệu kỹ thuật và siêu dữ liệu quyền cho các định dạng kỹ thuật số tùy ý. 3.4 Giao diện người dùng Dspace sử dụng giao diện người dùng dạng web-based. Có 3 giao diện người dùng trong hệ thống Dspace: Giao diện người dùng cho những người tham gia trong quá trình đăng xuất bản phẩm điện tử; Giao diện cho người dùng tin: tìm kiếm, duyệt thông tin trong kho lưu trữ; Giao diện người dùng cho người quản trị. Giao diện cho người dùng tin hỗ trợ tìm kiếm và nhận thông tin trả về bằng cách duyệt hoặc tìm kiếm siêu dữ liệu. Một biểu ghi thỏa mãn các điều kiện tìm kiếm trong kho lưu trữ sẽ được trả về, người dùng tin có thể tải tài liệu điện tử gắn với biểu ghi thông qua các siêu liên kết, người dùng tin có thể xem trực tiếp nội dung tài liệu trên DSpace 5.x không cần phải cài đặt thêm các tích hợp. 3.5 Luồng công việc trong Dspace 5.x Bằng cách áp dụng mô hình luồng công việc, Dspace là một kho lưu trữ tài liệu điện tử mã nguồn mở giải quyết những vấn đề phức tạp của một thư viện khoa học. Cơ chế phân quyền Đơn vị và Bộ sưu tập có thể tạo cho mỗi đơn vị khoa, phòng, trung tâm, cá nhân là một thư viện số có thể toàn quyền xử lý hoặc cho phép các đơn vị được trao đổi dữ liệu lẫn nhau mà không cần phải chuyển đổi vị trí lưu dữ liệu. Cơ chế quản lý của DSpace 5.x tự động xác định loại tài liệu điện tử phải nộp là gì? Ai là người gửi tài liệu? Ai là người duyệt? Ai được xem và ai là người bị hạn chế xem các tài liệu này… Mỗi thành viên trong Dspace đều được gán các quyền thích hợp với vai trò của mình: vai trò người đăng tài liệu điện tử, vai trò người biên tập siêu dữ liệu, vai trò quản trị các bộ sưu tập, vai trò quản trị hệ thống … Có 2 cách để tạo lập, quản trị bộ sưu tập số. Cách thứ nhất, thư viện có thể quy định tất cả mọi bạn đọc đều có quyền đăng tài liệu điện tử, và bất kỳ người dùng nào (trong nội bộ và bên ngoài) đều có quyền xem các tài liệu đã được đăng tải. Cách thứ hai, thư viện có thể tổ chức mô hình lưu trữ và phân phối tài liệu chặt chẽ hơn: các tác giả nộp các tài liệu điện tử do mình tạo lập, sau đó sẽ có một bộ phận chịu trách nhiệm biên tập siêu dữ liệu và người có quyền cao nhất sẽ quyết định có xuất bản tài liệu đó không. Như vậy mỗi bước trong quá trình đăng tài liệu điện tử sẽ được xem xét, phê duyệt trước khi tài liệu đó được đưa vào bộ sưu tập, các tài liệu điện tử không được thông qua trong quá trình này sẽ không được phép lưu trữ trong hệ thống Dspace.
  5. Võ Đức Hoàng 223 4 Một số hình ảnh triển khai Với giao diện thiết kế trang chủ có thể hiển thị danh mục các đơn vị quản lý trong thư viện số giúp người dùng có thể dễ dàng truy cập đến tài nguyên đơn vị mà cần tìm. Đồng thời việc tổ chức duyệt theo một số tính năng như: tác giả, chủ đề, năm xuất bản… hỗ trợ thuận tiện và nhanh chóng trong việc tìm kiếm tài liệu. Với cơ chế tìm kiếm tiêu đề, danh mục và trong cả nội dung, được hỗ trợ tìm kiếm tiếng Việt không dấu DSpace 5.4 đã tối ưu hóa thời gian của người dùng. Hình 2. Giao diện trang chủ Hình 3. Duyệt dữ liệu theo nhan đề 5 Kết luận Việc triển khai ứng dụng phần mềm mã ngưồn mở DSpace tại Trường Đại học Bách khoa thực sự đem lại hiệu quả cao cho công tác quản lý, lưu trữ nguồn tài liệu nội sinh đã có kết hợp cùng việc cập nhật mới. Với việc triển khai ứng dụng phần mềm mã nguồn mở DSpace 5.4 tại Trường Đại học Bách khoa đã thu được một số kết quả như sau:
  6. 224 KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA CITA 2017 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”  Triển khai và sử dụng sản phẩm tại Trung tâm Học liệu và truyền thông với địa chỉ “http://tainguyenso.dut.udn.vn/” hoàn chỉnh với các chức năng: đăng ký thành viên, biên mục, kết nối dữ liệu…  Xây dựng giao diện thống nhất và hiện đã được kết nối đến hệ thống tài nguyên số của Đại học Đà Nẵng.  Xây dựng đơn vị, bộ sưu tập để phân quyền đến từng Phòng, Khoa, Bộ môn hoặc dự án để có thể lưu trữ tài nguyên số.  Xây dựng cơ chế cập nhật tài liệu cũ đã có và chia sẻ thông tin tài liệu của các đơn vị. Tuy nhiên hiện DSpace đã phát triển các phiên bản mới 6.x, nghiên cứu sẽ tiếp tục nâng cấp và hoàn thiện hơn để phục vụ công tác quản lý tài liệu tại trường Đại học Bách khoa. Hệ thống sẽ được tiếp tục nghiên cứu và phát triển để tích hợp công cụ phát hiện trùng lặp nội dung nhằm cảnh báo công tác nhập nội dung trùng lặp và sao chép luận văn. Tài liệu tham khảo 1. Phan Ngọc Đông, Thư viện hướng đến tương lai: Hợp tác, tiến bộ và phát triển, Trường Đại học Khoa học Xã hội & Nhân văn - Đại học Quốc gia TP. Hồ Chí Minh, DOI: 10.13140/2.1.4027.6800 (2014). 2. https://dspace.org/. 3. http://www.greenstone.org/
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2