ĐAĨ H<)( Q V Ù C i ; ỉ ^ lÌA N ộ ỉ
T k ư Ờ N G ỈÌẠỈ H O Í K ì i D A h ọ ì : x ả h ộ i V a n h ả n V à n
PHẠM v â n H ù n g
lÊ N CỮU XÂY DƯNG v i
GUYÊM SỐ NÔỈ SIN
NG
TRUNG TÂM THÔNG TĩN KHOA
VÀ CÔNG NGHỆ QUỐC GIA
LliẬN VÃN THẠC s l THÔNG T iK - THƯ ViỆIS
'■r
•
*-
Hà N ộ ì-ac
ỊMij^‘iííí|itviii!^i!twMiW iii7Traiìiriiitfal^ĩff Ji^fl^riftTrnritr m ¥ PHẠM VĂN HÙNG Mã số: 60 32 20 C h u y ê n n g à n h K h o a h ọc th ư v iệ n L U Ậ N V Ă N T H Ạ C s ĩ T H Ô N G T IN - T H Ư V IỆ N Hà Nội - 2009 m N g ư ờ i h ư ớ n g d ẫ n k h o a h ọ c: T S . N g u y ễ n V iế t N g h ĩa LƠI CẢM ƠN Để hoàn thành luận văn này, bên cạnh sự tận tâm dạy dỗ của các thầy cô giáo trong suốt ba năm học tại Trường Đại học Khoa học Xã hội và Nhân văn, tác giả đã nhận được sự giúp đỡ nlìiệt tình của thầy giáo hướng dẫn và các đồng nghiệp tại cơ quan nơi công tác. Qua đây, tác giả xin bày tỏ sự biết ơn sâu sắc tới các thầy cô giáo, đặc biệt là thày giáo hướng dẫn, Tiến sĩ Nguyễn Viết Nghĩa - người đã tận tâm giúp đỡ tác giả trong suốt quá trình làm khoá luận. Tác giả cũng xin bày tỏ sự biết ơn tới ông Nguyễn Thắng, chuyên viên tin học của Trung târfi - người đã giúp đỡ tác giả tiếp cận tới những kiến thức liên quan trong lĩnli vực tin học; bà Nguyễn Thị Đào, chuyên viên trong lĩnh vực biên mục cùng các đồng nghiệp thuộc các phòng Phát triển nguồn tin, Tin học, Cơ sở dữ liệu, Thông tin nông ứiôn miền núi, Phát triển hoạt động thông tin và phòng Tra cứu và cung cấp tài liệu điện tử đã nhiệt tình giúp đỡ tác giả hoàn thành khoá luận này. Xin chân ữọng cảm ơn! Hà Nội, Ngày 20 thảng ỈO năm 2009 MỤC LỤC MỞ ĐẦU...................... ....................................................................................... ..........3
VAI TRÒ CỬA NGƯÔN TÀI NGUYÊN sổ NỘI SINH ĐỐI VỚI
Chương 1.
S ự PHÁT ITUỂN CỦA TRƯNG TÂM THÔNG TIN KHOA HỌC VÀ CÔNG
NGHỆ QUỐC G IA ....................... ............................................................ .......................7
1.1. Giới thiệu chung về Trung tâiĩi Thông tin Khoa học và Công nghệ Quốc gia..........7
1.2. Định hướng phát triển Trung tâm trong tìbời gian tới.............................................15
1.3. Tẩm quan trọng của nguồn tài nguyên sổ nội sinh đối với sự phát triển Trung tâm 17
1.3.1. Một số khái niệm.......................................................................................... 17
1.3.2. Tài nguyên sổ nội sinh trong sự phát triển của Trung tâm ............................20 THỰC TRẠNG CÔNG TÁC XÂY DựNG VÀ QUẢN LÝ Chương 2.
NGUỒN TÀI NGUYÊN số NỘI SINH TẠI TRUNG T Â M ....................................24
2.1. Nguồn tài nguyên số nội sinh trong cơ cấu vốn tài liệu của Trung tâm.................. 24
2.1.1. Cơ sở dữ Hệu thư mục...............................................................................24
2.1.2. Cơ sở dữ liệu toàn văn..............................................................................24
2.2. Hiện trạng công tác phát triển nguồn tài nguyên số nội sinh................................... 25
2.2.1. Khùng kho pháp lý..........r..............1............................................................ 25
2.2.2. Quy trình tạo lập tài liệu số...........................................................................30
2.2.3. Xây dựng cơ sờ dữ liệu.................................................................................38
2.2.4. Tổ chức khai thác nguồn tài nguyên số nội sinh........................................ 58
2.2.5. Công tác tuyên truyền, giới thiệu nguồn tài nguyên số nội sinh..................70
GIẢI PHÁP TỐI UtJ HOÁ CÔNG TÁC XÂY DựNG VÀ QUẢN
Chương 3.
LÝ NGUỔN TÀI NGUYÊN s ố NỘI SINH TẠI TRUNG TÂM ..............................72
3.1. Đảm bào tính pháp lý cho nguồn tài nguyên số nội sinh......................................... 72
3.2. Đảm bảo nguồn nguyên liệu đầu vào...................................................................... 77
3.3. Nâng cao chất lượng nguồn tài nguyên số nội sinh.................................................79
3.3.1.
l ối ưu hoá còng tác số hoá tài liệu truyền thống............................................79
3.3.2. Hoàn thiện công tác biên mục........................................................................ 81
3.3.3. Tối ưu hoá quá trình ứao đổi và lưu dữ liệu giữa các bộ phận........................88
3.4. TỔ chức lại các bố sưu tập số.................................................................................. 91
3.5. Hoàn thiện hệ thống phần mềm..............................................................................94
3.6. Một số giải pháp khác...........................................................................................107
3.6.1. Tăng cường chia sẻ nguồn tài nguyên số nội sinh........................................ 107
3.6.2. Đảm bảo an toàn cho dữ liệu số................................................................... 110
3.6.3. Xậy dựng cơ chế truy cập phù hợp..............................................................112
3.6.4. Đẩy mạnh công (ác tuyên truyền giới thiệu nguồn tài nguyên số nội sinh....] 13
Phát triển dội ngũ cán bộ..........................................................................1 i4
3.6.5.
KẾT LUẬN...................................................................................................................117
rÀI LIỆU THAM KHẢO................................................................................................118
PHỤ LỤC................................................... ................................... .. ..................... 12Ỉ BẢNG CÁC CHỮ VIẾT TẮT Bộ sưu tập số BSTS Công nghệ thông tin CNTT Cơ sở dữ liệu CSDL Khoa học và công nghệ KH&CN Kết quả nghiên cứu KQNC Người dùng tin NDT Scientific and technological documents STD Trans - Eurasia information network TEIN Tài liệu số TLS Tài nguyên số TNS Tài nguyên số nội sinh TNSNS Thông tin Khoa học và Công nghệ Quốc gia TTKH&CNQG Thông tin -- Thư viện TT-TV Thư viện số TVS Vietnam research and education network VINAREN MỞĐẲU Nhân loại đang bước vào kỷ nguyên mới - “kỷ nguyên thông tin”, trong đó thông tin là nhân tố quyết định mọi hoạt động kinh tể xã hội của con người. Vì ứiế các quổc gia phát triển đã sớm đề ra chính sách phát triển hạ tầng thông tin quốc gia, theo đó nhiều dự án phát triển nguồn tài nguyên số và xây dựng thư viện số đã được triển khai. Trong đó có nhiều dự án mang tính quốc gia như dự án “Digital libraries iniiiative” ở Mỹ, dự án “Electronic Libraries Programme” ở Anh, dự án '•Digital Image Library” ờ úc,...C ác dự án này đà mở đường cho chiển dịch phát triển thư viện số ừên thế giới. ở Việt Nam, ngay từ đầu những năm 90 chúng ta đã ý thức được vai trò quan trọng của thông tin trong sự nghiệp xây đựng và phát ưiển đất nước cũng như tỉnh trạng lạc hậu về ứiông tin của nước nhà. Trên cơ sở đó, Chính phủ đã đặt mục tiêu "phổ cập văn hoá thông tin" ữong xã hội nhằm tạo môi trường thuận lợi cho đất nước chuẩn bị hướng tới một "xã hội thông tin" [10]. 1. Lý do chọn đề tài: Trung tâm Thông tin Khoa học và Công nghệ Quốc gia với chức năng là cơ quan đứng đầu hệ thống thông tin khoa học và công nghệ ừong cả nước, thực hiện chức năng ''thông tin, thĩf viện trung tâm của cả nước về khoa học và công nghệ MỘI trong những nhiệm vụ quan trọng của Trung tâm Thông tin Khoa học và Công nghệ Quốc gia là thu thập, quản lý và lưu giữ các nguồn tài liệu nội sinh quan trọng như kết quả nghiên cứu, tài liệu hội nghị, các tạp chí khoa học v.v... Bên cạnh những lợi thế về cơ sở vật chất, trang tíiiểt bị và đội ngũ cáti bộ, Trung tâm Thông tin Khoa học và Công nghệ Quốc gia cũng gặp không ít khó khăn trong quá trình xây đựng và quản lý nguồn tài nguyên số như tìĩu thập tài liệu, xây
dựng quy trình số hóa, xây dựng công cụ tìm kiếm v.v... vấn đề xây dựng và phát
triển nguồn tài nguyên sổ đã tìr lâu thu hút được sự quan tâm của nhiều nhà nghiên cứu. Trong những năm qua, đã có một số công trình nghiên cứu liên quan đến nguồn tài nguyên số tại Trung tâm như đề tài "Nghiên cứu xây dựng cơ chế tổ chức và khai thác hiệu quả ngân hàng dữ liệu khoa học và công nghệ quốc gia tại Trung tâm Thông tin Tư liệu Khoa học và Công nghệ Quốc gia phục vụ sự nghiệp công nghiệp hoả - hiện đại hoá ” ; một số bài nghiên cứu trên Tạp chí Thông tin & Tư liệu liên quan đến các hoạt động như số hoá tài liệu, đảm bảo chất lượng tài liệu số, xây dựng cơ sở dữ liệu,... Tuy nhiên, các công trình trên mới chỉ dừng lại ớ mức khái quát hoặc nghiên cứu từng khía cạnh của vấn đề hoặc không còn phù hợp với hoàn cành hiện tại. Thấy được tầm quan ư^ọng của vấn đề xây dựng và quản lý nguồn tải nguyên số nội sinh và sự thiếu vắng các nghiên cứu có tính hệ thống về vẩn đề này, tác giả đã mạnh đạn chọn đề tài “Nghiên cứu xây dựng và quản lý nguồn tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia” làm đề tài cho luận văn của mình. 2. Mục đích nghiên cứu của đề tài “Nghiên cứu xây dựng và quản ]ý nguồn tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia” là nhằm hoàn tíĩiện các quy trình xây đựng và quản lý nguồn tài nguyên số nội sinh tại Trung tâm bao gồm: - Quy trình xây đựng cơ sở dữ liệu - Quy trình quản lý, tổ chức khai thác nguồn tài nguyên số nội sinh Bên cạnh đó, tác giả cũng hy vọng những kinh nghiệm này có thể áp dụng cho các đơn vị khác ừong hệ thống, đồng thời góp phần hoàn thiện về mặt ỉý luận cho công tác phát triển nguồn tài nguyên số trong các cơ quan thông tin - thư viện nói chung. 3. Nhiệm vụ nghiên cứu của đề tài: - Khảo sát toàn bộ quy trình số hoá tài liệu gồm (khung khổ pháp lý cho công tác số hoá, thiết bị và phương pháp số hoá) - Nghiên cứu quy trình xây dựng các cơ sở dữ liệu gồm (các phần mềm, các chuẩn và những công cụ được sử dụng và quy trình kỹ thuật trong xây dựng cơ sờ đữ liệu) - Nghiên cứu công tác tổ chức khai thác nguồn tài nguyên số gồm (các hình thức cung cấp thông tin, cơ chế quản lý người dùng tin và hiệu quả khai thác nguồn tài nguyên số) - Phân tích những thế mạnh, khả năng, thuận ỉựi, ỉdió khăn vả những hạn chế trong từng quy trinh. - Xây dựng các mô hình và giải pháp giúp hoàn thiện các quy trình xây dựng và quản lý nguồn tài nguyên số nội sinh. 4. Đối tượng nghiên cứu của luận văn là toàn bộ hoạt động xây đựng, phát triển nguồn tài nguyên sổ nội sinh tại Trung tâm, trong đó gồm các cơ sở dữ liệu thư mục, cơ sở dữ liệu toàn văn và các bản tin điện tử. Do đặc điểm của đề tài nghiên cứu chù yếu liên quan đến nguồn tài nguyên số nên phạm vi nghiên cứu của luận văn chỉ tập trung vào công tảc xây dựng, phát triển nguồn tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia từ khi tiến hành xây các cơ sở dữ iiệu (từ năm 1987 đến nay). 5. Phirơng pháp nghiên cứu; Trong quá trình làm luận văn này, tác giả đã sử dụng phương pháp luận duy vật biện chứng và duy vật lịch sử để nghiên cứu toàn bộ quá trình xây đựng, phát triển nguồn tài nguyên số nội sinh của Trung tâm, ngoài ra tác giả còn vận đụng các phương pháp phân tích, tổng hợp tài liệu, quan sát và phỏng vấn trực tiếp người dùng tin, cán bộ thông tin để tìm hiểu và đánh giá toàn bộ những vấn đề cỏ liên quan đến công tác xây dựng và phát triển nguồn tài nguyên số nội sinh. 6. Giả thuyết khoa học xuất phát từ thực tiễn phát triển Trung tâm Thông tin Khoa học và Công nghệ Quốc gia với mục tiêu trở thành một Trung tâm dữ liệu về khoa học và công nghệ của cả nước, vấn đề đầu tiên !à cần phát triển một kho đữ liệu số (trong đó bao gồm cả nguồn tài nguyên số nội sinh) có chất lượng tốt. Bên cạnh đó, việc quản lý và phổ biến nguồn tài nguyên này cũng cần được nghiên cứu triệt để. Trên cơ sở tìm hiểu rõ từng quy trình, phát hiện những mặt hạn chế, đồng thời tham khảo kinh nghiệm và kỹ thuật tại các đơn vỊ trong và ngoài nước, luận văn đưa ra những giải pháp giúp hoàn thiện toàn bộ quy trình xây dựng và quản lý nguồn tài nguyên số nội sinh tại Trung tâm. 7. Cấu trúc của luận văn gồm; Phần mờ đầu, phần nội dung và kểt luận, trong đó phần nội dung gồm có 3 chương: Chương ỉ: giới thiệu khái quát về Trung tâm Thông tin Khoa học và Công nghệ Quốc gia; trình bày vị trí, vai trò của nguồn tài nguyên số nội sinh đối với sự phát triển của Trung tâm đồng thời đưa ra khái niệm tài nguyên số nội sinh và các ichái niệm liên quan. Chương 2: Tìm hiểu và đánh giá toàn bộ quy trình phát triển nguồn tài nguyên số nội sinh tại Trung tâm bao gồm: Quy trình số hoá tài liệu, xây dựng các cơ sở dữ liệu, lưu giữ tài liệu số và tổ chức khai thác, quảng bá nguồn tài nguyên số nội sinh lại Trung tâm Chương 3: Đề xuất các giải pháp tối uu hoá công tác xây dựng và quản lý nguồn tài nguyên số nội sinh tại Trung tâm như giải pháp cho vấn đề bản quyền trong công tác số hoá tài liệu; vấn đề đảm bảo nguồn nguyên liệu phục vụ số hoá; công tác tổ chức, lun giữ và phổ biến nguồn tài nguyên số nội sinh... Chưong 1. VAI TRÒ CỦA NGUỒN TÀI NGUYÊN số NỘI SINH ĐỐI VỚI S ự PHÁT TRIÊN CỦA TRUNG TÂM THỎNG ™ KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA Lịch sử phát triển Trung tàm TTKH&CNQG trực thuộc Bộ KH&CN được thành lập ngày 24 tháng 9 năm 1990 tìieo Quyết định số 487/TCCB của Chủ nhiệm Uỷ ban Khoa học Nhà nước (nay là Bộ KH&CN) trên cơ sờ hợp nhất hai đơn vị: Thư viện Khoa học và Kỹ thuật Trung ương, 1960-1990 Viện Thông tin Khoa học và Kỹ thuật Trung ương, 1972-1990 Trong thời gian hoạt động, Trung tâm TTKH&CNQG đã thay đổi tên như sau: Trung tâm Thông tin Tư liệu KH&CN Quốc gia 1990-2004 Trung tâm TTKH&CNQG, 2004 - đến nay Chức năng nhỉệm vụ và cơ cấu tổ chức Ngày 13/5/2004, Bộ KH&CN ban hành Quyết định số 11/2004/QĐ-BKHCN quy định điều lệ về tổ chúc và hoạt động của Trung tâm TTKH&CNQG. Theo Điều lệ, Trung tâm TTKH&CNQG là đơn vị trực thuộc Bộ KH&CN, tổ chức đứng đầu hệ thống các tổ chức thông tin KH&CN, thực hiện chức năng ''thông tin, thư viện trung tâm của cà nước về KH&CN". Tham gia xây đựng và tổ chức thực hiện các chủ trương, chiến lược, chính sách, quy hoạch, kế hoạch, văn bản quy phạm pháp luật về hoạt động thông tin KH&CN; phát triển nguồn lực thông tin KH&CN của đất nước; Thu thập, chọn lọc, xử lý, lưu trữ và phát triển nguồn tin KH&CN trong nước và thế giới, đặc biệt ỉà nguồn tin về tài liệu điều tra cơ bản, luận án trên đại học, tài liệu hội nghị, hội thảo kiioa học, các nhiệm vụ KH&CN đang tiến hành; Tổ chức và thực hiện đăng ký, lưu giữ kểt quả nghiên cứu khoa học và phát triển công nghệ; Thực hiện nhiệm vụ Thư viện trung tâm của cả nước về KH&CN; xây dựng thư viện điện tử quốc gia về KH&CN; Tổ chức và thực hiện việc cung cấp thông tin phục vụ lãnh đạo, quản lý nghiên cứu khoa học, phát triển công nghệ, giáo dục, đào tạo, sản xuất, kinh doanh; Xuất bản “Sách KH&CN Việt Nam”; Tạp chí “Thông tin và Tư liệu”, ấn phẩm thông tin; công bổ danh mục các nhiệm vụ KH&CN trong nước đang tiến hành và kết quả thực hiện các nhiệm vụ KH&CN nói trên; Phái triển Mạng thông tin KH&CN Việt Nam (VISTA), Chợ ảo Công nghệ và Thiết bị Việt Nam; Tổ chức và thực hiện công tác thông tin tuyên truyền KH&CN, đưa tri thức khoa học đến với mọi người, đặc biệt là ứiông tin KH&CN phục vụ phát triển kinh tế - xã hội nông thôn, miền núi, phục vụ các doanh nghiệp nhỏ và vừa; Nghiên cứu khoa học và phát ừiển công nghệ, áp đụng các chuẩn trong lĩnh vực thông tin, thư viện KH&CN; Phối hợp tổ chức đào tạo, bồi dưỡng, nâng cao trình độ nghiệp vụ thông tin KH&CN; Phối hợp thực hiện các nhiệm vụ hợp tác quốc tế ừong lĩnh vực thông tin KH&CN; Được thực hiện các dịch vụ trong lĩnh vực thông tin KH&CN theo quy định của pháp luật; Thực hiện các nhiệm vụ khác đo Bộ trưởng Bộ KH&CN giao. Cơ cấu tổ chức Theo Điều lệ, cơ cấu tổ chức của Trung tâm có Ban Giám đốc và 15 đơn vị trực thuộc: Phòng Phát triển hoạt động thông tin KH&CN 1. Phòng Phát triển nguồn tin 2. 3. Phòng Cơ sở dữ liệu 4. Phòng Đọc sách 5. Phòng Đọc tạp chí 6. Phòng Tra cứu và cung cấp tài liệu điện tử 7. Phòng Phân tích thông tin 8. Phòng Thông tin tìiị trường KH&CN 9. Phòng Thông tin nông thôn, miền núi 10. Phòng Tin học 11. Phòng Hợp tác quốc tế 12. Phòng Thông tin tuyên truyền KH&CN 13. Phòng I n - s a o 14. Trung tâm Iníoterra Việt Nam 15. Vãn phòng 165 Tổng số 100% Nguồn nhân lực: 120 Trình độ đại học và ữên đại học 72,72% 7 Tiến sỹ 4,24% 22 Thạcsỹ 13,33% 91 Đại học 55,15% 45 Trình độ khác 21,81% Nguồn tin và các dịch vụ Trung tâm TTKH&CNQG là đơn vị có nguồn lực thông tin lớn nhất cả nước với nhiều dạng tài liệu khác nhau: - Tài liệu dạng in gồm có: + Sách: Trên 450.000 đầu sách + Tạp chí; Khoảng 7.000 tên tạp chí và ấn phẩm kế tiếp xuất bản ữên giấy, trong đó có gần 1000 tên tạp chí được bổ sung thường xuyên. + Kết quả nghiên cửu: Khoảng 9000 báo cáo kết quả nghiên cứu của các đề tài các cấp - Các CSDL do Trung tâm xây dựng Hiện Trung tâm có trên 10 CSDL, trong đó có các CSDL lớn được xây đựng từ nhiều năm trước như STD (Tài liệu KH«&CN Việt Nam) được xây dựng từ năm 1987; Book (Sách tại Thư viện Khoa học Kỹ thuật Trung ương); KQNC (Báo cáo kết quả nghiên cứu khoa học),... - Các CSDL KH&CN thế giới: Trên 10 CSDL, trong đó có các CSDL nổi tiếng nhu lEEE/IEE Pulltext (Thư viện điện tử về CNTT, điện và điện tử) Chemical Abstracts (Tạp chí tóm tắt về hoá học); PASCAL (CSDL đa ngành về KH&CN), đặc biệt là các CSDL trực tuyến như ScienceDirect, EBSCO, WEB 0 F SCIENCE, EBRARY,... - Mạng Vista Mạng Thông tin KH&CN Việt Nam (Vietnam Information for Science and Technology Advance) bao gồm nhiều dịch vụ về KH&CN như: + Các dịch vụ thư viện thông qua Web site Thư viện Khoa học và Kỹ thuật Trung ương (www.clst.ac.vn) + Khai thác ứiông tin KH&CN trên các CSDL thư mục và toàn văn của Trung tâm TTKH&CNQG + Khai tíiác các thông tin trong chợ ảo về công nghệ và thiết bị Việt Nam thông qua web site www.techmartvietnam.com.vn + Cung cấp các dịch vụ Internet (World Wide Web, Truyền tệp, Thư điện tử, Dịch vụ Web hosting,,.) + Quảng cáo ữên mạng VISTA - Chợ Công nghệ và Thiết bị Việt Nam trên mạng (Techmart ảo) Chợ công nghệ ảo có chức năng giới thiệu công nghệ, thiết bị cần mua và chào bán trong và ngoài nước đồng thời là sàn giao địch về công nghệ, thiết bị và tư vấn KH&CN. - Xuất bản phẩm Hiện Tmng tâm có hàng chục xuất bản phẩm dạng in như Sách KH&CN Việt Nam; Tạp chí Thông tin & Tư liệu; Tổng luận Khoa học - Công nghệ - Kinh tế và hàng chục bản tin điện tử như Nông thôn đổi mới; Khoa học công nghệ và môi trường; Vietnara iníoteưa nevvsletter,.., - Các chương trình phim KHCN Các phim KH&CN ưong nước và nước ngoài được cung cấp cho NDT dưới 10 dạng các đĩa VCD, DVD theo yêu cầu + Dịch vụ phục vụ bạn đọc + Thông tỉn phục vụ cho công tác hoạch định chính sách, xây dựng chiến lược và dự báo về kinh tế, KH&CN. + Cung cẩp tìiông tin về thị trường công nghệ, chuyển giao công nghệ, các cơ hội liên doanh với bạn hàng trong và ngoài nước + Tổ chức các hội thảo, hội nghị khách hàng, triển lãm, chợ công nghệ nhằm giới thiệu công nghệ và sản phẩm mới. + Tra cửu và chỉ dẫn theo các yêu cầu thông tin của các cá nhân, tổ chức, cơ quan + Dịch vụ phổ biến thông tin có chọn lọc + Cung cấp nội dung thông tin trực tuyến trên Internet + Tổ chức các khoá đào tạo nghiệp vụ theo yêu cầu + Tư vấn về công tác xây đựng, tổ chức, điều hành tìiư viện, cơ quan thống tin + Tổ chức các đoàn nghiên cửu, khảo sát và học tập ở nước ngoài về thông tin KH&CN Công tác nghiên cứu và đào tạo Công tác nghiên cứu được đẩy mạnh theo hướng gắn kết với những yêu cầu thực tiễn, góp phần nâng cao chất lượng hoạt động chuyên môn, nghiệp vụ của Trung tâm TTKH&CNQG. Trong đó tập trung vào hiện đại hoá hệ thống thông tin KH&CN, xây dựng thư viện điện tử, xây dựng và áp dụng các tiêu chuẩn quốc gia, quốc tế vào hoạt động thông tin, thư viện. Hàng năm Trung tâm tổ chức trên 20 khoá đào tạo cho cản bộ thông tin KH&CN trong mạng lưới. Đặc biệt, nội dung đào tạo, bồi dưỡng nghiệp vụ được chú trọng hướng vào các vấn đề ứng dụng CNTT và các tiêu chuẩn quốc tế vào hoạt động TT-TV. Hợp tác quốc tế Trung tâm TTKHếfeCNQG trao đồi thông tin, tài liệu với hoTti 50 tổ chức của 35 nước trên thế giới; họp tác song phương, đa phương với các thư viện và các trung tâm thông tin cùa hơn 70 nước trên thế giới. 11 - Tnmg tâm TTKH&CNQG ỉà thành viên cùa + UNESCO/IFA, Chương trình Thông tin cho mọi người (Trụ sờ tại Paris, Pháp) + IFLA - Hiệp hội Thư viện Quốc tế (Trụ sở tại Hague, Hà Lan) + ICSTI - Trung tâm Thông tin KH&CN Quốc tế - Trung tâm TTKH&CNQG là đầu mối quốc gia của: + INPOTERRA" Mạng Thông tin Môi trường Toàn cầu + APIN - Mạng Thông tin châu Á - Thái Bình Dương (Trụ sở tại New Deỉhi, ấn Độ) + Trung tâm ISSN Quốc tế (Trụ sở tại Pari, Pháp) + Mạng ứiông tin khoa học công nghệ ASEAN + Mạng Nghiên cứu và đào tạo Á-Âu (TEIN2, TEIN3) Quá trình ứng dụng công nghệ thông tin và những thành tựu đạt được Trung tâm TTKH&CNQG là một ừong những đơn vị đi tiên phong và đạt được nhiều thành quả trong việc ứng dụng CNTT. Từ những năm 80 của thế kỷ XX Trung tâm đã triển khai nghiên cứu áp dụng CNTT vào hoạt động. Quá trình này được chia thành những giai đoạn sau: Giai đoạn mở đầu bằng việc sử dụng các máy tính IBM 360, họ máy tính ES để tổ chức và phục vụ thông tin, Viện thông tin Khoa học và Kỹ thuật Trung ương ( tiền thân của Trung tâm TTKH&CNQG) đã iđiai thác các băng từ thông tin KH&CN của Trung tâm Thông tin Khoa học Kỹ thuật Quốc Tế để phục vụ thông tin chọn lọc cho NDT trong nước bằng cách tận dụng công nghệ truyền tin mạng viễn thông quốc tế, Viện đã tiến hành các đợt thử nghiệm truy cập từ xa - Teledostup" vào các CSDL của Trung tâm Thông tin Khoa học Kỹ thuật Quốc Tể Với tốc độ 8 bíưgiây. Các ứng dụng CNTT thời kỳ này mới chỉ mang tính thử nghiệm, rất ít sản phẩm được áp dụng trên quy mô công nghiệp. Phần mềm được sử dụng để xây dưng CSDL và số hoá các nguồn tin chủ yếu là Dbase. Giai đoạn tiếp theo từ 1990-1997, với sự đầu tư của nhà nước việc số hoá các nguồn tài liệu được triển khai bằng việc xây dựng các CSDL thư mục do các cơ quan thông tin thư viện trong nước đảm nhiệm. Hệ thống quản lý thư điện tử TOOLNET do Hà Lan hỗ trợ, Mạng Thông tin Kinh tế, KH&CN Việt Nam (mạng 12 VESTENET) với hàng chục CSDL của Trung tâm TTKH&CNQG và các CSDL thư mục khác do các cơ quan thông tin trong rnạng lưới xây dựng là cơ sở để tiến hành việc tổ chức phục vụ thông tin trực tuyến trong cả nước. Các CSDL này có thể làm việc được trên mạng, sử dụng phần mềm quản trị CDS/ISIS. Dbase, Poxpro, bộ mã tiêu chuẩn TCVN 5712 đã được đưa vào áp dụng, ở giai đoạn này, NDT có thể khai thác các dịch vụ và sản phẩm thông tin bằng phương thức truy cập từ xa vào các CSDL trên (được cài đặt trên máy chủ) tra cứu ừên CD-ROM (on-line), hoặc mạng nội bộ hay đặt hàng theo phương thức dịch vụ ứiông tin có chọn lọc. Tháng 11/1997 cùng với mốc Việt Nam chính thức hoà mạng Internet, Trung tâm TTKH&CNQG là một trong những cơ quan đầu tiên đã két nối mạng Internet và đưa mạng của mình (lúc này đã đổi tên thành Mạng Thông tin KHCN Việt Nam- VISTA chạy trên hệ điều hành Windows NT) lên phạm vi toàn cầu. Giai đoạn 1998-2002, việc sổ hoá các nguồn tài liêu của Trung tâm TTKH&CNQG được nâng lên một bước về chất lượng nhờ ứng dụng công nghệ Internet và phát ừiển CSDL tích hợp. Trung tâm đã tập trung xây dựng mạng VISTA ừên cơ sở công nghệ Web tĩnh với hệ điều hành là Windows NT, địa chi URL là: http://www.vista.gov.vn. Cũng trong thời gian này các hệ quản trị CSDL như SQL server, Oracle đã được triển khai nghiên cứu nhưng chưa đưa vào sử dụng. Ciai đoạn 2003 đến nay được đánh dấu bằng việc áp dụng công nghệ mới (công nghệ Portal) để xây dựng và tổ chức mạng thông tin tích hợp dữ liệu KH&CN với trang web động có khả năng liên kết dữ liệu với hệ điều hành Windows 2000 và ■Winđows 2003, hệ quản trị CSDL là MSQL server, Oracle,....Đặc biệt, từ đầu năm 2004 Trung tâm tiến hành xây dựng CSDL toàn văn Tài liệu KH&CN Việt Nam trên cơ sở sổ hoá các bài trích trong các tạp chí khoa học và những tài liệu hội nghị hội thảo khoa học. Cũng trong năm 2004, Trung tâm tiến hành xây dựng thư viện điện tử với phần mềm Libol của Công ty Tinh Vân và triển khai các CSDL thư mục về tài liệu KH&CN Việt Nam. Do vậy phưong thức truy cập mở được ừiển khai và áp dụng mạnh mễ giúp cho NDT lchai thác các sản phẩm và dịch vụ thông tin một cách dễ dàng và thuận tiện hoTi. Một trong những sự kiện đánh đấu một bước phát triền raới ưong quá trình 13 ứng dụng CNTT tại Trung tâm là Dự án TEIN2 (Dự án nhằm hỗ trợ các nước đang phát triển trong ASEM thông qua việc cung cấp và củng cố đường trục (backbone) tốc độ cao lên tới 155 Mbps cho liên khu vực Âu-Á ). Dự án này được bắt đầu từ đầu năm 2004 và đã mở ra cơ hội lớii đối với cộng đồng NDT Việt Nam nói chung và đối với Trung tâm TTKH&CNQG nói riêng. Tháng 4 năm 2006 Trung tâm TTKH&CNQG được Bộ KH&CN giao cho nhiệm vụ làm đầu mối và chủ tri tham gia dự án TEIN2. Đây là một sự kiện quan ừọng đánh mở đầu cho sự ra đời và phát triển của mạng VINAREN. Mạng VINAREN ỉà mạng Nghiên cứu và Đào tạo quốc gia hoạt động phi lợi nhuận, chính thức khai tnromg trên toàn quốc ngày 27/3/2008, do Trung tâm phát triển và quản lý. Mục tiêu của VINAREN là xây dựng và phát triển Mạng nghiên cứu và đào tạo Việt nam kết nối với các mạng nghiên cứu và đào tạo của các nước trong khu vực và trên thế giới nhằm nâng cao hiệu quả, thúc đẩy họp tác và hội nhập quốc tể trong lĩnh vực nghiên cứu và đào tạo thông qua TEIN2, TEIN3 với tốc độ từ 45 đến 155 Mbps. Thành viên VINAREN bao gồm các viện nghiên cửu, trường đại học, bệnh viện và trung tâm thông tin hàng đầu trong nước. VINAREN kết nối các nhà nghiên cứu và đào tạo Việt Nam với cộng đồng 30 triệu nhà khoa học ở khu vực châu Á-Thái Bình Dương, châu Âu và các khu vực khác. Sau một năm hoạt động, đến năm 2Ọ08 quy mô của VINAREN đã vươn tới hơn 50 trung tâm nghiên cứu và đào tạo quan trọng của đất nước thuộc 11 tỉnh, thành phố. Năm 2008 cũng là năm thử nghiệm việc truy cập, khai thác các nguồn tin số hoá, trực tuyến trong nước và quốc tế giữa các thành viên của VINAREN ờ cả trong và ngoài nước. Lần đầu tiên các CSDL KH&CN trong nước đo Trung tâm Thông tin KH&CN Quốc gia xây dựng được đưa lên mạng VINAREN để truy cập và khai thác theo chế độ mạng. Tóm lại, có ứiể thấy quá trình ứng dụng CNTT tại Trung tâm TTKH&CNQG đã diễn ra rất sớm, nhanh chóng và hiệu quả. Tuy nhiên, các giai đoạn phát triển phụ ứiuộc vào sự phát triển chung trong lĩnh vực CNTT. Đẻ có được những thành quả trên là nhờ có sự quan tâm ngày càng tăng của Nhà nước đến lĩnh vực TT-TV. Bên cạnh đó cũng phải kể đến những nỗ lực không mệt mỏi của các thế hệ cán bộ của Trung tâm trong việc thúc đẩy phát triển ứng dụng CNTT vào hoạt động. Với 14 những điều kiện về công nghệ hiện nay, trong một thời gian không xa nữa Trung tâm TTKH&CNQG có thể trở thành một Trung tâm thông tin/TVS tầm cỡ quốc tế. Để nắm bắt những cơ hội này, đòi hỏi phải có những nghiên cứu mang tính toàn diện và tuân theo xu hướng chung của thế giới, đó là tập trung nghiên cứu phát triển và quản lý nguồn TNS. Để phấn đấu xây dựng Trung tâm trở thành tập đoàn dịch vụ công về thông tin KHCN, Trung tâm TTKH&CNQG đã đưa ra 10 định hướng phát triển giai đoạn 2006-2010 và tầm nhìn đến 2015, trong đó hầu hết các nội dung đều liên quan đến việc xây dựng và quản !ý nguồn TNSNS đó là: - Xúc tiến và phát triển thị trường công nghệ trong đó tập trung vào xăy dựng CSDL đa phưcmg tiện "Hồ sơ công nghệ" nhằm tư liệu hoá và giới thiệu, phổ biển thông tin về; + Kết quả nổi bật cùa các chương ưình, đề tài, dự án KHCN trọng điểm cấp Nhà nước qua các giai đoạn. + Hồ sơ các công nghệ sẵn sàng cho chuyển giao, nhân rộng. + Phim tư liệu KHCN. + Hồ sơ các phát minh, sáng chế có tính đột phá của KHCN thế giới. - Phát triển hệ thống thông tin KHCN nông thôn thông qua việc tăng cường cung cấp thông tin KHCN phục vụ phát triển kinh tế - xã hội nông thôn, miền núi, theo hướng: + Hỗ trợ các địa phương nhân rộng mô hình cung cấp thông tin KHCN phục vụ phát triển kinh tế - xã hội tại cơ sờ (xã, phường). + Xây dụmg và phát ưíển mô hình phổ biến ừi thức khoa học và thông tin chuyển giao công nghệ tuyến quận, huyện. + Hình thành và phát triển Mạng thông tin KHCN nông ứiôn, miền núi hoạt động trên quy mô toàn quốc (từ Trung ương tới cơ sở). - Phái triển dịch vụ thông tin KHCNphục vụ các doanh nghiệp (heo hướng: + Phát triển Ngân hàng cung cấp thông tin KHCN phục vụ các doanh nghiệp, 15 nhất là các doanh nghiệp vừa và nhỏ. + Triển khai dịch vụ thông tin cảnh báo cạnh tranh và cảnh bảo chiến luợc nhằm hỗ trợ phát triển các ngành hàng chủ lực của Việt Nam. + Triển khai các dịch vụ tì*a cứu - chỉ dẫn thông tin theo yêu cầu của các doanh nghiệp. + Hình thành và phát triển Mạng thông tin KHCN phục vụ các doanh nghiệp. - Hiện đại hoả vá nâng cao chất ỉượng hoạt động của Thư viện Trung ương của cả nước về KHCN với các nội dung: + Tổ chức và triển khai Dịch vụ cung cấp tài liệu theo yêu cầu + Phát triển liên kết bổ sung và chia sẻ nguồn tin KHCN (Vietnam Consortium on STI Resources). - Hoàn thiện và phát triển Mạng thông tin KHCN Việt Nam - Trung tâm liên kết mạng lưới các tề chức dịch vụ thông tin KHCN theo hướtíg: + Hoàn thiện và nâng cấp hệ thống phần mềm theo hướng một cổng thông tin tổng hợp về KHCN của Việt Nam. + Phát triển các nội dung số hoá theo hướng chuyên nghiệp và hiện đại. + Thưòrng xuyên nâng cấp năng lực ừuy cập, lưu giữ, xử lý, an nính và phổ biến thông tin trên mạng. - Triển khai Trung tâm đăng kỷ, Imi giữ và phổ biến các kêt quá nhiệm vụ KHCN trong đó tập trung vào việc: + Xây dựng và vận hành CSDL toàn văn về các đề tài, dự án. + Tổ chức phổ biến, cung cấp thông tin kịp thời, đầy đủ về các đề tài, dự án KHCN đang tiến hành và thông tin về két quả các nhiệm vụ KHCN đã hoàn thành. - Đẩy mạnh công tác nghiên cứu và phân tích thông tin phục vụ lãnh đạo, quản lý với các nội dung: + Thực hiện tốt nhiệm vụ đầu mối cung cấp thông tin phân tích cho các cơ quan lãnh đạo Đảng và Nhà nước. + Thực hiện tốt nhiệm vụ cung cấp nội dung về KHCN trên Website của Chính phủ. - Xây dựng Thư viện điện tử quốc gia về KHCN trong đó tập trung vào việc xây 16 dựng và triển khai bước đầu dự án Thư viện điện từ quốc gia về KH&CN tại khuôn viên 24-26 Lý Thường Kiệt, Hà Nội theo hướng một Tổ hợp dịch vụ công về ihông tin KHCN, bao gồm: + Thư viện điện tử Trung ưcmg của cà nước về KHCN với vai trò đầu mối Hên kết trung tâm (Central Hub) của Hệ thống thông tin quốc gia về KHCN, đủ sức phục vụ hàng vạn người tại chỗ và hàng triệu người qua mạng. + Trung tâm giao dịch quốc gia về công nghệ - trung tâm thúc đẩy thương mại hoá sản phẩm KHCN và cầu nối các nhà khoa học và các doanh nghiệp. + Trung tâm giao lưu, hội nghị, hội thảo khoa học quốc gia và quốc tế. + Bảo tàng Trung ương về KHCN của Việt Nam. Tới năm 2015, Trung tâm Thông tin KHCN Quốc gia phấn đấu ttở ứiành Tập đoàn dịch vụ công về thông tin KHCN, trong đó có: - Thư viện điện tử quốc gia về KHCN đạt trình độ tiên tiến trong khu vực; - Ngân hàng dữ liệu quốc gia cung cấp thông tin KHCN cần ứiiết cho các doanh nghiệp, các tổ chức KHCN; - Trung tâm xúc tiến thị trường công nghệ, bao hàm Sàn giao dịch điện tử về công nghệ, Techmart Việt Nam, Techmart khu vực,...; - Mạng thông tin KHCN Việt Nam - mạng nòng cốt của Hệ thống thông tin quốc gia về KHCN. - Trung tâm nghiên cứu và đào tạo nguồn nhân lực về thông tin KHCN; - Bảo tàng quốc gia về KHCN góp phần giáo dục truyền thống và nâng cao nhận hX Tầm quan trọng của nguồn tài nguyên số nội sình đối vửi sự thức của xã hội về ICHCN, 1.3.1. Một số khái niệm Để tìm hiểu khái niệm nguồn TNSNS, cần có cách hiểu đúng đắn về TNS, TLS và BSTS. Trong đó cần phân biệt rõ khái niệm TLS và TNS. Hiện tại vẫn chưa có khái niệm rõ ràng về TNS. Tuy nhiên, TNS được hiểu là 17 toàn bộ thông tin do con người tạo ra dưới hình thức số hoá nhằm mục đích phục vụ cho những lợi ích của con người. Nguồn TNS có thể tồn tại dưới nhiều dạng khác nhau (dạng văn bản, dạng hình ảnh và âm thanh hoặc kết hợp hai hay ba dạng trên). Nguồn TNS cũng có ứiể tồn tại dưới đạng thư mục hay dạng toàn vãn. Theo từ điển giải nghĩa cùa Mindwrap, “Tài liệu số” là những tài liệu được lưu giữ bằng máy tính. TLS có thể được tạo lập bởi máy tính như việc xử lý các file văn bản, các bàng biểu hoặc chúng có thể được chuyển đổi sang dạng số tìr những tài liệu dạng khác. TLS cũng được đề cập đến như là tài liệu điện tử. Từ định nghĩa trên cho thấy, TLS được xây dựng thông qua hai kênh: - Kênh 1; Tạo lập tài liệu gốc bằng máy tính thông qua việc xử lý các file văn bản, hình ảnh, bảng biểu,... - Kênh 2: Tạo lập TLS thông qua hình thức chuyển đổi định dạng các tài liệu đã được tạo lập ở dạng khác như (Scan, ghi âm ,...) Tóm lại có thể hiểu TLS là tất cả những tài liệu được trình bày dưới dạng số mà máy tính có thể đọc được. Hiện nay, vẫn chưa có sự lý giải xác đáng nào về sự phân biệt hai khái niệm trên. Tuy nhiên có thể khẳng định rằng: + TLS thuộc về nguồn TNS + Một số dạng của TNS không phải là TLS Thí dụ: Một biểu ghi thư mục ưên máy tính không thể coi là TLS bởi vì bản thân một biểu ghi thư mục không được coi là một tài liệu. Do vậy, khi chúng ta đề cập đến vấn đề “biên mục cho tài liệu s ổ ” các biểu ghi thư mục sẽ không thuộc diện đối tượng biên mục. Theo từ điển giải nghĩa các thuật ngữ khoa học của trường Đại học Bay Lor, "bộ sưii tập số là bộ sim tập của thư viện hoặc các tài liệu Itm trữ được chuyển đổi sang định dạng thuật ngữ máy tính nhằm mục đích bảo quản hoặc phục vụ truy cập 18 điện tử ” Tốĩíí -Íậỉybộ sưu tập số được hiểu là “ một tập hợp cỏ tố chức nhiều tài liệu đã được sổ hoá dưới nhiều hình thức khác nhau (văn bản, hình ảnh, Audio, Video...) về một chủ đề. Mặc dù mỗi loại hĩnh tài liệu có sự khác nhau về cách thể hiện, nhưng nỏ đều cung cấp một giao diện đồng nhất mà qua đỏ các tài ỉiệu cổ thể truy cập d ễ dàng'' [5]. Vỉ dụ: Bộ sưu tập số về chủ tịch Hồ Chí Minh gồm các văn bản, các tác phẩm văn hpc, các văn kiện chính trị đo Bác viết và do người khác viết về Bác; những bài hát, bòn nhạc viết về Hồ Chí Minh; những đoạn phim, những băng video phản ánh cuộc dời và sự nghiệp hoạt động cách mạng cùa Người. Trên ứiế giới đã có những bộ sưu tập lớn được xây đựng nhằm phục vụ khai thác trên web như Bộ sưu tập các tin tức truyền hình Vanderbilt Television News Archive do trường đại học Vanderbilt xây dựng, bộ sưu tập này tập hợp các tin túc đã được phát trên truyền hình từ tháng 8 nảm 1968 của các kênh truyền hình ABC, CBS, NBC, CNN, Fox News và tin tức từ một số mạng truyền hỉnh khác [30]. Như vậy, một TVS có thể bao gồm nhiều bộ sưu tập theo các chủ đề khác nhau, có thể do tập thể hoặc cá nhân tự xây dựng hoặc ừao đổi, mua bán. Các BSTS có thể được lưu giữ tại thư viện nhưng cũng có thể nằm ngoài thư viện thông qua một kênh cung cấp từ phía đối tác (ví dụ: CSDL toàn văn mua quyền truy cập theo thời gian như Science direct, Ebrary,...). Hiện nay, có nhiều quan niệm khác nhau về BSTS, có những quan niệm cho rằng, CSDL cũng chính là BSTS. Điều này theo chúng tôi là chưa chính xác bởi lẽ: Theo khái niệm về tài liệu và TLS thì một biểu ghi thư mục không phải là TLS. Trong khi đó, BSTS được định nghĩa là “wộ/ tập hợp có tồ chức nhiều tài ỉiệu đõ được sổhoá... Như vậy, một CSDL thư mục không tìiể gọi là BSTS. Như trên đã trinh bày, nguồn TNS có thể bao gồm nhiều BSTS/CSDL khác nhau, trong đó có những BSTS/CSDL do chính cơ quan, tổ chức tự thiết kế xây 19 dựng và những bộ sưu tập được mua hoặc trao đổi từ bên ngoài. Như vậy, chúng ta c6 ứiể coi nguồn TNSNS là nguồn tài nguyên do cơ quan/tổ chức, tự xây đựng dưới dạng bộ sưu tập. Nguồn TNSNS gồm một số đặc trưng sau: + Do cơ quan/đơn vị tạo ra hoặc tự thu thập, xử lý và xây dựng + Phải được xử lý bời cơ quan/đơn vị sở hữu + Có thể được sản sinh ra ừong quá trình hoạt động của cơ quan, tổ chức (các báo cáo, thống kê, bản tin hoạt động,...) + Lưu giữ cục bộ trên máy tính, server riêng + Có thể bao gồm những tài liệu từ bên ngoài được xử lý và tổ chức lại theo một cơ ché thống nhất. + Có thể truy cập từ xa thông qua mạng máy tính Thí dụ, nguồn TNSNS tại Trung tâm TTKH&CNQG là toàn bộ những sản phẩm do Trung tâm làm ra dưới dạng sổ hoá như biểu ghi thư mục, biểu ghi toàn văn, các bản tin điện tử ,... Tóm lại, nguồn TNSNS là nguồn tài nguyên được sản sinh ra ngay trong cơ quan/đơn vị chứ không phải những nguồn tài nguyên được mua hay trao đổi tìr bên ngoài mà chưa được xử lý hay biên soạn lại. U .2 . Tài nguyên sổ nội sỉnb trong sự phát triển cửa Trung tâm Trong 10 định hướng phát triển và tầm nhìn chiến lược đến năm 2015 của Trung tâm, nguồn TNSNS giữ vị trí quan trọng hàng đầu thể hiện ở một số điểm chính sau: - Nguồn TNSNS đóng vai trò quan trọng giúp thực hiện chức năng lưu giữ và quản lý kho tài liệu truyền thống tại Trung tâm. Một trong những nhiệm vụ quan trọng của Trung tâm được quy định trong Điều 16 Nghị định số 159/2004/NĐ-CP ngày 31/8/2004 của Chính phủ về hoạt động thông tin khoa học và công nghệ và Điều 25 Luật Khoa học công nghệ là “Đăng ký, hiến tặng và ỉưu giữ kết quả tíiực hiện nhiệm vụ khoa học và công nghệ”. Bến cạnh đó, quá trình lưu giữ toàn bộ nguồn tài liệu truyền thống tại Trung tâm cũng phụ thuộc rất nhiều vào nguồn TNSNS (giúp thực hiện chức năng thống kê, 20 quản lý tài liệu truyền thống) - Nguồn TNSẩVS ỉà cơ sở để Trung tâm phổ biến nguồn tài liệu truyền thống hiện có. Trong điều kiện hiện nay, hầu hết các cơ quan TT-TV đã ứng dụng CNTT vào hoạt động và cho phép tra cứu bằng máy tính, đặc biệt là tra cứu thông qua mạng Iniemet. Do đó, nguồn TNSNS được coi là phương tiện duy nhất giúp NDT có thể tiếp cận đến nguồn tài liệu truyền thống. Trung tâm TTKH&CNQG là một trong những cơ quan lưu giữ kho tài liệu truyền thống lớn nhất cả nước và giá trị idioa học cao bao gồm sách, tạp chí khoa học kỹ thuật, báo cáo các đề tài đang tiến hành, kết quả nghiên cứu,.... Do vậy, việc tạo .ập các điểm truy cập tới kho dữ liệu quý này thông qua nguồn TNSNS có ý nghĩa quyết định hiệu quả khai thác kho dữ liệu truyền thống. - Nguồn TNSNS giúp đẩy nhanh quá trình hiện đại hoá Thư viện Trung ương Theo số liệu thổng kê của Trung tâm năm 2007 và 2008 cho tìiấy, lượng bạn đọc đến khai thác tài liệu dạng truyền thống tại Tung tâm ngày càng giảm đi. Nếu như năm 2007, Trung tâm phục vụ 70.725 lượt bạn đọc thì năm 2008 con số này giảni xuống còn 67.824 lượt, thay vào đó, số lượng NDT truy cập vào các CSDL của Trung tâm để khai thác dữ liệu ngày càng tăng lên. Chỉ tính riêng dịch vụ “Bạn đọc đặc biệt" trong 6 tháng đầu năm 2Ọ09 đã thu hút 28.998 lượt người truy cập với khố. lượng bài toàn văn được dovvnload lên tới 28.074 bài. Điều đó cho thấy, trong bối cảnh hiện nay, hình thức phục vụ tài liệu dạng truyền thống đã và đang nhường chỗ cho phương thức cung cấp tài liệu ừực tuyến. Do vậy, để đẩy nhanh quá trình hiệr đại hoá và nâng cao chất lượng hoạt động của Thư viện Trung ương, Trung tâm cần xây dựng được các BSTS đủ mạnh về khối lượng và chất lượng - đó chính là nguồn TNSNS. - Phát triển nguồn TNSNS giúp Trung tâm thực hiện và hoàn thành các chức nởrìỊ, nhiệm vụ, định hướng và mục tiêu đõ đề ra.. + Trong việc xây dựng CSDL đa phưomg tiện "Hồ sơ công nghệ" phục vụ cho việc xúc tiến và phát ừiển thị trưòrng công nghệ, nguồn TNSNS là nhân tố quyết định toàn bộ CSDL này. Nguồn TNSNS càng lớn, chất lượng càng cao, Trung tâm 21 cảng thu hút được nhiều NDT đặc biệt là các nhà doanh nghiệp và nhà khoa học. + Tăng cường cung cấp thông tin phục vụ phát triển nông thôn miền núi là nhỉệm vụ mang tính chiến lược của Trung tâm. Xuất phát từ nhu cầu sử dụng thông tin ngày càng cao và mở rộng tới các vùng nông thôn, Trung tâm đã có nhiều dự án ừiển khai cung cấp thông tin tới các vùng sâu, vùng xa. Tuy nhiên, nhu cầu thông tin ở khu vực này đang ngày một gia tăng. Vì thể, trong những năm tới, nhu cầu phát triển nguồn TNSNS ở Trung tâm đặc biệt là những tài liệu hướng dẫn kỹ thuật ( trong đó có phim khoa học) nhàm cung cấp thông tin, đáp ứng cho nhu cầu phát triển nông thôn, đặc biệt là vùng sâu vùng xa là rất lớn. + Để thực hiện tốt nhiệm vụ cung cấp thông tin phục vụ lãnh đạo và quản lý được giao, đòi hỏi Trung tâm phải xây dựng được một hệ thống cung cấp thông tin đủ mạnh luôn sẵn sàng đảm bảo những thông tin cần thiết một cách nhanh nhất và chính xác nhất dựa trên nguồn TNSNS hiện có. Từ những phân tích trên cho thấy, nhu cầu phát triển nội dung số tại Trung tâm trong thời gian tới là rất lớn. Đê đáp ứng được nhu cầu này, Trung tâm cần huy động toàn bộ lực lượng và điều kiện hiện có để phục vụ cho công tác phát triển nguồn TNSNS. Khả năng phát triển nguồn TNSNS tại Trung tâm Trong những năm gần đây, được sự quan tâm đầu tư của Nhà Nước, đặc biệt là Bộ KH&CN, Trung tâm TTKH&CNQG có điều kiện để phát triển về mọi mặt. Trong đó, phát triển nguồn TNSNS là một trong những vấn đề được Trung tâm quan tâm hàng đầu. Phát triển nguồn TNSNS và đưa ra phục vụ hiệu quả nguồn tài nguyên đó là nhiệm vụ đòi hỏi rất nhiều điều kiện về nhân lực và vật lực. Trung tâm TTKH&CNQG có đầy đủ mọi điều kiện để phát triển và đưa vào khai thác nguồn TNSNS một cách hiệu quả dựa trên những điều kiện sau: - Trung tâm cỏ nguồn tài liệu làm nguyên liệu đầu vào đủ lớn để phục vụ cho công tác tạo lập nguồn TNS gồm: (Kho sách, tạp chí tiếng Việt và ngoại văn với khối lượng lớn; nguồn thông tin đa dạng và cập nhật được cung cấp từ các nhà khoa học, doanh nghiệp...) - Trung tâm có đội ngũ cán bộ đông đủ về số lượng, có trình độ và được đào tạo 22 đầy đủ các kỹ năng nghiệp vụ cho nhiệm vụ phát triển TNSNS Vữi khối lượng lớn. - Hệ thống máy tính với khoảng 150 máy (đại đa số từ Pentium IV trở lên) và gần 20 máy chủ tốc độ cao, dung lượng lớn là cơ sở cho phép Trung tâm tiến hành xử iý, lưu giữ và phục vụ một khối lượng TNSNS lớn mà ít đcm vị có khả năng thực hiện được. - Máy scanner Kirtas tốc độ 1200 ừang/giờ, và hơn 10 máy scanner tốc độ cao cùng với các thiết bị ghi đĩa CD, VCD cho phép Trung tâm số hoá tài liệu với khối lưọTig lớn (hàng triệu trang tài liệu và hàng trăm bộ phim KHCN / năm). - Hệ thống phần mềm đa dạng, linh hoạt (Zope, Libol, Win ISIS, SQL Server, Oracle portal,...) là cơ sở quan trọng cho phép Trung tâm tiến hành quản lý và khai thác nguồn TNSNS hiện có và trong tương lai. - Mạng VINAREN với tốc độ từ 40 đến 155 Mps là điều kiện thuận lợi để Trung tâm triển khai phục vụ trực tuyến nguồn TNSNS trên phạm vi rộng (trong nước và quốc tế). - Ngoài ra, nguồn kinh phí khoảng 50 tỷ đồng của Nhà Nước mỗi năm là tiền đề quan trọng để phát triển Trung tâm nói chung và phát triển nguồn TNSNS nói riêng. Những điều kiện trên đây cho phép Trung tâm phát ưiển nguồn TNSNS với tốc độ nhanh, khối lượng lớn và chất lượng cao, đáp ứng được nhu cầu khai thác 23 TÌ^S ngày một cao. Chưong2. THỰC TRẠNG CÔNG TÁC XÂY DựNG VÀ QUẢN LÝ NGUỒN TÀI NGUYÊN s ô NỘI SINH TẠ! TRƯNG TÂM 2.1. Nguồn tài nguyên số nội sinh trong cơ cấu vốn tàỉ liệu của Trung tâm Trung tâm TTKH&CNQG là một trong những đơn vị có nguồn tài ngyên số lớn nhất cà nước. Trong đó, bên cạnh nguồn TNS mua từ bên ngoài, Trung tâm cũng là đơn vị đứng đầu cả nước về nguồn TNSNS. Nguồn TNSNS của Trung tâm rất phong phú về nội dung và đa dạng về hình thức. Trong phạm vi đề tài này, tác giả phân chia chúng thành hai loại CSDL chính là CSDL thư mục và CSDL toàn văn. 2.1.1. Cơ sở dữ liệu thư mục Các CSDL thư mục là một trong những nguồn TNSNS lớn nhất hiện có của Trung tâm, chúng đóng vai írò quan trọng giúp NDT có thể tiếp cận tới nguồn tài nguyên truyền thống quý báu vói hàng triệu bàn mà Trung tâm đang sở hữu. Các CSDL này bao gồm: - Sách ờ Thư viện khoa học và kỹ thuật Trung ương 143.969 biểu ghi - Tạp chí ở Thư viện khoa học và kỹ thuật Trung ương 6.938 biểu ghi ' Tài liệu KH&CN nước ngoài (345.323 biểu ghi) - Báo cáo kết quả nghiên cứu (9.851 biểu ghi) - Tài liệu KHCN Việt Nam trước 2004 ( 73.259 biểu ghi) - Đề tài đang tiến hành (3.706 biểu ghi) - Mục lục liên họfp tạp chí (3.808 biểu ghi) 2.1.2. Cơ sở dữ liệu toàn văn Các CSDL toàn văn của Trung tâm hầu hết được xây dựng từ năm 2004 đến nay bao gồm: 24 - Tài liệu KH&CN Việt Nam STD (gần 55.000 biểu ghi) - Thư viện điện tử khoa học và công nghệ phục vụ nông thôn (112.000 biểu ghi) - Công nghệ chào bán (hơn 7.600 biểu ghi) - Dịch vụ KH&CN (856 biểu ghi) - Báo cáo kết quả nghiên cứu (trên 6.500 biểu ghi) - Văn bản pháp quy về KH&CN - Giải pháp phần mềm (2288 biểu ghi) - Tiêu chuẩn Việt Nam - Nhãn hiệu hàng hoá - Các bản tin điện tử (gồm Nông thôn đổi mới, Tri thức và phát triển, Tổng luận KH&CN, Khoa học Công nghệ Môi trường, Môi trường và phát triển bền vững, Viet Nam Infoterra Newsletter, Thông tin & tư liệu,...) - 'í'hư viện phim KHCN ( hơn 265 phim KH&CN được lưu trữ trên 145 đĩa CD- ROM ) Ngoài ra, Trung tâm còn lưu giữ nhiều CSDL trước năm 2004 như: Khoa học Công nghệ Môi trường, Vietnam Development News, Tạp chí Hoạt động Khoa học, Communication Physỉcs, Acta Matìiematica Vietnamica, Báo cáo khoa học công nghệ, Tổng quan về khoa học công nghệ và môi trưòfng,... Với hàng triệu biểu ghi thuộc nhiều CSDL quý như Book, STD, Kết quả nghiên cứu.,., nguồn TNSNS đã và đang là nguồn lực thông tin chủ yếu trong cơ 2.2. Hiện trạng công tác phát ữiển nguồn tài nguyên số nội sinh cấu nguồn tin của Trung tâm. 2.2.Ỉ. Khung khổ pháp lý Để hoàn thành chức năng nhiệm vụ được quy định ừong Luật Khoa học công nghệ, Nghị định số 159/2004/NĐ-CP ngày 31/8/2004 của Chính phủ về hoạt động thông tin khoa học và công nghệ và Quyết định số 11/2004/QĐ-BKHCN quy định điều lệ về tổ chức và hoạt động của Trung tâm TTKH&CNQG, Trung tâm TTKH&CNQG cần đẩy nhanh quá trình hiện đại hoá công tác lưu giữ, phát ữiển và phổ biến các nguồn tin KH&CN. Nguồn TNSNS đóng vai trò quan trọng, quyết định đến hiệu quả toàn bộ 25 nguồn tin trong nước tại Trung tâm, do vậy vấii đề xây đựng và phát triển nguồn TNSNS là một nhiệm vụ tất yếu. Tuy nhiên, trong quá trình ưiển khai xây dựng và phát triển nguồn tài nguyên này, Trung tâm cũng gặp phải một số khó khăn nhất định, trong đó có vấn đề về bản quyền cho nguồn tài liệu số hoá. Vấn đề bản quyền được coi là vấn đề chung của nhiều quốc gia và nhiều lĩnh vực, đặc biệt là trong lĩnh vực TT-TV. Đã có nhiều trường hợp vi phạm bản quyền xảy ra như trường hợp nhà cung cấp dịch vụ tìm kiếm thông tin Google đã quét và số hóa khoảng hơn 4.000 tác phẩm của các tác giả Việt Nam cho dự án Thư viện số Google Books mà chưa được sự đồng ý của chủ sở hữu. Theo đó, Trung tâm Quyền tác giả văn học Việt Nam đã và đang nỗ lực yêu cầu Google thực hiện Luật bản quyền đối với tác giả Việt Nam... Tại các cơ quan Thông tin và thư viện của Việt Nam, trong đó có Trung tâm TTKH&CNQG cũng không tránh khỏi hiện tượng này. Hiện tại, Trung tâm đã tiến hành số hoá gần 200.000 tài liệu, trong đó cỏ 55.000 bài trích tạp chí khoa học trong nước, 112.000 tài liệu dạng sách kỹ thuậtj giáo trình và 6.500 báo cáo kết quả nghiên cúru. Tuy nhiên, công tác số hoá vẫn chưa tìm kiếm được sự sáng tỏ và thuyết phục trong vấn đề bản quyền. Điểm đ, khoản 1 Điều 25 Luật Sở hữu ừí tuệ và điểm đ điều 761 mục 2 chương 1 Bộ luật Dân sự về quyền tác giả quy định các trường hợp sử dụng tác phẩm đã công bố không phải xin phép, không phải trả tiền nhuận bút, thù lao cho phép '\<ỉao chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên c ứ ứ \l}. Tuy nhiên, trong khoản 2 Điều 25 Nghị định 100/2006/NĐ-CP Quy định chi tiết và hướng dẫn thi hành một số điều của Bộ luật Dân sự, Luật Sờ hữu trí tuệ về quyền tác già và quyền liên quan cũng quy định rõ "Sao chép tác phẩm để lưii trữ trong thư viện với mục đích nghiên cứu quy định tại điểm đ khoản ỉ Điền 25 của Luật Sở hữu trí tuệ là việc sao chép không quá một bản. Thư viện không được sao chép và phân phối bàn sao tác phẩm tới công chủng, kể cả bản sao kỹ thuật 5ỡ"[9]. Vậy, công tác số hoá tàí liệu tại Trung tâm có vi phạm bản quyền hay không?. Hiện dang có hai quan điểm trái ngược nhau cho vấn đề này. Quan điểm thứ nhất cho ràng việc số hoá là hoàn toàn họp pháp trong khi quan điểm thứ hai cho rằng việc iàm này đang vi phạm tới quyền tác giả được nêu trong các văn bản pháp luật. Để có thể đưa ra câu ừ ả lời chính xác cho vấn đề này, cần xem xét và đối 26 chiếu các văn bản pháp lý vào trường hợp cụ thể của Trung tâm. vấn đề quyền tác giả và quyền sở hữu được quy định rõ trong một sổ văn kiện trong nirớc và quốc tế, trong đó cỏ Công ước quôc tế Beme (1986), Bộ luật Dân sự, Luật Sở hữu trí tuệ Việt Nam (2005) và Nghị định 100/2006/NĐ-CP Quy định chi tiết và hướng dẫn thi hành một số điều cùa Bộ luật Dân sự. Các văn kiện này đều quy định rõ đối tượng được bảo hộ quyền tác già, thời gian bảo hộ, các trường hợp vi phạm và không vi phạm quyền tác giả. Để có những luận cứ chính xác, đảm bảo đầy đủ tính pháp lý cho công tác số hoá cần tìm hiểu rõ những quy định nêu trong các văn kiện này. - về đối tượng được bảo hộ quyền tác giả, khoản 1 Điều 2 Công ước Beme quy định về tác phẩm được bảo hộ nêu rõ "Các tác phẩm văn học và nghệ thuật bao gồm (ất cá các sản phẩm trong lĩnh vực văn học, khoa học và nghệ thuật, bất kỳ được biểu hiện theo phương thức hay dưới hình thức nào, chang hạn như sách, tập in nhỏ và các bản viết khác, các bài giảng, bài phát biểu, bài thuyết giáo và các tác phẩm cùng ỉoạì... ” [29]. ờ Việt Nam, đối tượng được bảo hộ quyền tác giả được quy định cụ ứiể trong Điều 737 của Bộ Luật Dân sự là “mọi sản phẩm sáng tạo trong các lĩnh vực văn học, nghệ thuật, khoa học được thể hiện dưới bất kỳ hình thức và bằng bất ^ phương tiện nào, không phán biệt nội dung, giá (rị và không phụ thuộc vào bất kỳ thủ tục nào ”[!]. Khoản I Điều 14 của Luật Sở hữu trí tuệ cũng quy định rõ các đối tượng sau: a) Tác phẩm văn học, khoa học, sách giáo khoa, giáo trình và tác phẩm khác được thể hiện dưới dạng chữ viết hoặc ký tự khác; b) Bài giảng, bài phát biểu và bài nói khác; c) Tác phẩm báo chí; đ) Tác phẩm âm nhạc; đ) Tác phẩm sân khấu; e) Tác phẩm điện ảnh và tác phẩm được tạo ra theo phương pháp tương tự g) Tác phẩm tạo hình, mỷ thuật ứng dụng; h) Tác phẩm nhiếp ảnh; 27 i) Tác phẩm kiến trúc; k) Bàn họa đồ, sơ đồ, bản đồ, bản vẽ liên quan đến địa hình, công ữình khoa học; 1) Tác phẩm văn học, nghệ thuật dân gian; m) Chương trình máy tính, sun tập dữ liệu. Như vậy, có thể khẳng định răng, các đổi tượng số hoá của Trung lâm (Sách, bài trích, kết quả nghiên cứu,.,.) ứiuộc diện bảo hộ của quyền tác giả . - v ề nội dung quyền tác giả, Điều 750, 751, 752 trong Bộ luật Dân sự và Điều 18 Luật Sở hữu trí tuệ quy định '^Quyền tác giả đối với tác phẩm quy định tại Luật này bao gồm quyền nhân thân và quyền tài sản” [7]. Quvền nhân thân được quy định trong Điều 19 của Luật Sở hữu trí tuệ gồm các quyền sau: 1. Đặt tên cho tác phẩm; 2. Đứng tên thật hoặc bút danh trên tác phẩm; được nêu tên thật hoặc bút danh khi tác phẩm được công bố, sử đụng; 3. Công bố tác phẩm hoặc cho phép người khác công bố tác phẩm; 4. Bảo vệ sự toàn vẹn của tác phẩm, không cho người khác sửa chữa, cắt xén hoặc xuyên tạc tác phẩm dưới bất kỳ hình thức nào gây phương hại đến danh dự và uy tín của tác giả. Quyền tài sản được quy định frong ichoản 1 Điều 20 bao gồm các quyền sau đây; a) Làm tác phẩm phải sinh; b) Biểu diễn tác phẩm trước công chúng; c) Sao chép tác phẩm; d) Phân phối, nhập khẩu bản gốc hoặc bản sao tác phẩm; đ) Truyền đạt tác phẩm đến công chúng bằng phương tiện hữu tuyến, vô tuyến, mạng thông tin điện tử hoặc bất kỳ phương tiện kỹ thuật nào khác; e) Cho thuê bản gốc hoặc bản sao tác phẩm điện ảnh, chưong trình máy tính. - v ề thời gian bảo hộ, theo khoản 1 Điều 7 Công ước Beme quy định là “5wố/ cuộc đời của tác giả và năm mươi năm sau khi tác giả chết”. Bên cạnh đó, khoản 8 của điều này cũng quy định thêm ''^Trong bất kỳ trường hợp nào thời hạn bảo hộ sẽ 28 do quy định của Luật pháp của mrớc nơi sự bảo hộ được áp dụng. Tuy nhiên, trừ ỉnường hợp Luật pháp của nước đó quy định khác đi, cỏn không thì thời hạn bảo hộ sẽ không quá thời hạn được quy định ở quổc gia gốc của tác phẩm ”.[29] ở Việt Nam, thời gian bảo hộ quyền tác giả được quy định tại Điều 27 Luật Sở hữu trí tuệ và Điều 766 Bộ luật Dân sự như sau; + Quyền nhân thân của tác giả được bảo hộ vô thời hạn”. + Quyền tài sản là cuộc đời tác giả vờ năm mươi năm tiếp theo năm tác gì ả chết; trong trường hợp tác phẩm có đồng tác giả thỉ thời hạn bảo hộ chấm dứt vào năm thứ năm mươi sau năm đồng tác giả cuổi củng chết ”[ 1 ]. - v ề Các trường hợp vi phạm quyền tác giả dược quy định rõ trong khoản 3 Điều 20 của Luật Sờ hữu trí tuệ như sau: "Tổ chức, cả nhân khi khai thác, sử dụng một, một sổ hoặc toàn bộ các quyền qiiy định tại khoản ĩ Điều này và khoản i Điều 19 của Luật này phải xin phép và trả tiền nhuận bút, thừ lao, các quyền lợi vật chất khác cho chủ sở hữu qiĩỹền tác giả ”[7]. Mặt khác, khoản 2 Điều 25 Nghị định 100/2006/NĐ-CP cũng chỉ rõ; "Sao chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên cứu qưy định tại điểm đ khoản 1 Điều 25 của Luật Sở hữu trí tuệ là việc sao chép không quá một bản. Thu viện không được sao chép và phân phổi bản sao tác phẩm tới công chúng, kể cả bản sao ỉ<ỹ thuật íớ"[9]. Trong đó, bản sao tác phẩm được giải thích rõ trong Khoản 4 Điều 4 của Nghị định này “/ứ bản sao chép trực tiếp hoặc giản tiếp một phần hoặc toàn bộ lác phẩm. Bản sao chụp tác phẩm cũng là bản sao tác phẩm'' [9], Như vậy, hình thức số hoá tài liệu tại Trung tâm thuộc vào điểm c khoản 1 Điều 20 của Luật Sở hữu trí tuệ “sao chép tác phẩm”. Đối chiếu với các văn bản trên cho thấy, việc số hoá tài liệu tại Trung tâm đã đáp ứng được yêu cầu về mục đích (phục vụ nghiên cứu, giảng dạy), tuy nhiên vẫn chưa đáp ứng được những quy định đã nêu tại khoản 3 Điều 20 và điểm đ khoản I Điều 25 của Luật Sở hữu trí tuệ. Việc số hoá tài liệu khi chưa xin phép chủ sở hữu đã vi phạm khoản 6 Điều 28 Luật Sờ hữu trí tuệ về những hành vi xâm phạm quyền tác giả đó là "Sơo chép tác phẩm mà không đirợc phép của tác giả, chủ sở hữu quyền tác giả" [7]. Tuy nhiên, cũng cần giải thích thêm rằng ở Việt Nam trong lúc luật Bản quyền 29 còn chưa được áp dụng triệt để thì những sai phạm như đã nêu là rất phổ biến và không thể tránh khỏi. Hon nữa, công tác số hoá tài liệu của Trung tâm được tiến hành tìr khá sớm (trước khi Việt Nam trờ thành thành viên của Công ước Beme và trước khi ban hành Bộ luật Dân sự và Luật Sở hữu trí tuệ). 2.2.2. Quy trình tạo lập tài lỉệu sế Tạo lập TLS là bước đầu tiên của quá trình xây dựng BSTS. Sự phong phú, đa dạng và chất lượng của các BSTS phụ thuộc rất lớn vào quá trình tạo lập TLS. Quá trình tạo lập TLS quyết định đến: ' Định dạng của TLS (Dạng text, dạng ảnh và dạng đa phương tiện) - Chất lượng của TLS nói riêng và BSTS nói chung (Sự chuẩn xác về ngôn ngữ và chỉnh tả, chất lưọmg các fíle ảnh, vi đeo...) - Sự đa dạng và mức độ bao quát nguồn thông tin - Chất lượng TLS ưong bộ sưu tập về mặt nội dung Quá ưình tạo lập nguồn TNS diễn ra ở hầu hết các bộ phận chức năng cùa Trung tâm trong đó tập trung vào một số bộ phận chủ yếu là: “ Phòng Phát triển nguồn tin - Phòng CSDL - Phòng Phân tích thông tin - Phòng Thông tin Thị trường KH&CN - Phòng Phát triển hoạt động thông tín - Phòng Thông tin nông thôn, miền núi - Trung tâm Iníorteưa Việt Nam Do nguồn TNSNS của Trung tâm rất phong phú và đa dạng, bao gồm nhiều loại CSDL khác nhau nên việc tạo lập TLS cũng liên quan đến nhiều phương thức kỹ thuật. Hiện nay, Trung tâm đang sử dụng ba hình thức tạo lập TLS chủ yếu đó là; - Sổ hoá tài liệu bằng máy scanner - Tạo các file TLS dạng đa phương tiện (các phim khoa học) - Tạo lập TLS thông qua xử lý các file văn bàn Trong phần này tác giả tập ừung chủ yếu vào phương thức tạo lập nguồn TNS thông qua phương thức sổ hoá tài liệu truyền thống bằng máy scanner cho CSDL 30 điển hinh là STD. Quv trình số hoá tài ỉiệu gồm ba công đoạn chủ yếu là: Lựa chọn nguồn tài liệu để sổ hoả; quét tài liệu và xử lý kỹ thuật; lưu giữ các file dữ liệu đầu ra. Ba công đoạn này quyết định đến chất lượng tài liệu cả về nội dung và hình thức. Việc lựa chọn nguồn tài liệu để tiến hành số hoá là khâu đầu tiên và cũng là khâu quyết định nội dung nguồn tài nguyên được số hoá. Hiện nay» công tác số hoá tài liệu tốn kém khá nhiều thời gian và công sức nên việc lựa chọn tài liệu để số hoá rất quan ừọng, nó góp phần giảm thiểu chi phí cho công tác số hoá và cũng góp phần làm tăng chất lượng về nội dung nguồn TNS. Quá trình lựa chọn và số hoá — — u — — 1 — — 1 được thực hiện theo sơ đồ sau: Các file bài trích
toàn văn T ạp chi khoa học
tiếng V iệt và tài liệu
hội ng hị, hội thảo File toàn văn dạng
p đ f của toàn bộ sô
tạp chí Lựa chọn Scan H. 2. ỉ. Sơ đồ quá trình lựa chọn và sổ hoá tài liệu Quả trình ỉựa chọn bài trích để sẻ hoá: Hàng năm, các tạp chí khoa học tiếng Việt và tài liệu hội nghị, hội thảo sau khi được bổ sung về sẽ được giao cho bộ phận chức năng là Phòng CSDL, bộ phận này sẽ tiến hành phân loại và xử lý theo sự phân công từng lĩnh vực chuyên môn, Những chuyên gia có kiến thức và kỉnh nghiệm trong lĩnh vực nào thì được giao nhiệm vụ lựa chọn bài trích trong các tài liệu thuộc lĩnh vực đó. Quá trình lựa chọn cũng được tiến hành khoa học và tuân thủ những nguyên tắc chặt chẽ đối với tài liệu khoa học như: Nội dung đề cập, giá trị khoa học, khối lượng bài viết,...Sau khi nhận tài liệu từ bộ phận Bổ sung, cán bộ chuyên môn nhận tài liệu thuộc diện quản lý của mình và chuyển sang bộ phận sổ hoá. Sau khi tài liệu được số hoá, cán bộ xử lý nhận file toàn văn của toàn bộ số tạp chí, tài liệu hội thảo,, - .và tiến hành lựa chọn 31 bài trích để số hoá, sau đó gửi cán bộ phụ trách bộ phận duyệt lại những bài đã chọn, nếu bài trích không đủ tiêu chuẩn sẽ không được tiếp tục xử lý đế đưa vào CSDL. Qua quá trình tìm hiểu nhu cầu từ bộ phận xử lý tài liệu cho CSDL này cho thấy, vẫn còn một số bất cập trong quá trình cung cấp nguồn thông tin phục vụ cho công tác số hoá tài liệu truyền thống. Những bất cập này được thể hiện ở các điểm chính sau; + Thiếu một số tài liệu khoa học đã được bổ sung từ những năm trước + Chưa cập nhật được đầy đủ các tài liệu khoa học địa phương (các tạp chí khoa học của các sở KH&CN các tỉnh/thành phố) + Nguồn tài liệu bổ sung chưa đáp ứng kịp thời về thời gian ( một số tạp chí khoa học bị trễ từ một đến vài tháng) + Nguồn tài liệu dạng kỷ yếu hội nghị, hội thảo còn hạn chế về số lượng và chưa được cập nhật kịp thời Đe đảm bảo nguồn nguyên liệu cho công tác số hoá, những tồn tại trên cần sớm được khắc phục. Các biện pháp cụ thể để khắc phục những hiện tượng trên sẽ được trình bày cụ thể trong chưcmg 3 của luận văn. Quét tài liệu là khâu quan trọng phụ thuộc nhiều vào các thiết bị, kỹ thuật vận về thiết bi: hành thiết bị và kỹ năng xử lý hình ảnh. Trước đây, thiết bị được sử dụng để số hoá tài liệu chủ yếu là máy scanner thủ công, Trung tâm đã đầu tư 06 máy scanner hiệu HP 5590 (H. 2.2) cho bộ phận xây dựng CSDL STD. Đen đầu năm 2009, Trung tâm đã đầu tư mua 01 máy scanner công nghiệp APT BookScan 1200 (H. 2.3) để sổ hoá tài liệu cho CSDL STD và một số CSDL khác. Sau đây là những mô tả chi tiết về thông số của hai loại máy trên: - Máy Scanner HP 5590 Đây là loại máy scan máy scan phẳng hiện đại có thông số kỹ thuật như sau: + Độ phân giải scan tò 12 dpi đến 999999 dpi + Độ phân giải scan, phần cứng 2400 X 2400 dpi 32 + Bit depth 48 bit + Tốc độ thực hiện dưới 24 giây: hình 4 x 6 trong M icrosoữ Word; dưới 36 giây + OCR nguyên trang văn bản với Microsoữ Word; dưới 18 giây (dùng để email hình). + Bộ phận cung cấp nguyên liệu tự động tiêu chuẩn, 50 tờ + Kích cỡ scan tối đa 8.5 X 11 inch + Kích thước (w X d X h ) 19.21 X 13.39 X 6.38 inch + Giao diện két nối USB 2.0 + Hệ điều hành tương thích Microsoít Windows XP , Microsofì Windows 98, MicrosoỀ Windows 2000 , Microsoít Windows M E , Apple MacOS H. 2.2: Mảy scanner HP 5590 dùng cho sổ hoá tài liệu - Máy scanner công nghiệp A PT BookScan Dây là loại máy scanner tự động tốc độ cao cỏ các thông số kỹ thuật đạt tiêu chuẩn công nghiệp: + Tốc độ quét: 1200 trang/giờ + Máy ảnh số với độ phân giải 16.6 triệu điểm ảnh, độ phân giải ảnh: 300 - 600 dpi + Định dạng đầu ra: TIFF, JPEG, PDF có thể tìm kiếm, nhận dạng cho ỉ 89 ngôn ngữ khác nhau + Kích cỡ của trang giấy: 11.5 cm X 18 cm - 28 cm X 35.5 cm, Độ dày của giấy: 49 GSM - ỉ 20 GSM, Độ dày đóng tập <= ỈO cm - Kích cỡ ba chiều của máy; 84X 86X 114cm + Công nghệ SureTum với cánh tay rôbốt được điều chỉnh bằng máy tính sao 33 cho lật chì một trang duy nhất tại một thời điểm. • Bộ ph ận nâníi sách với côn g tiíỊhộ Smar lC rad lc đư ợc thiốl kế hình nôi theo chù' V cỏ g{)C rnở 110 dộ d ỡ lấy sách nhẹ n h àn ụ theo mọi kích c ỡ và độ dàv khác nhau. : rií:<ìf » t i ;s ÌO
^ Mk n ( .oì»íìiv> L i q h t T i x t u r e Adiusscìbie f ' o n e i r»;J? tí 1 u r n
V a c u u í ì ' * H c a d ;jco 4> P « J J f C 'Ỉ . V M I p
A/1 .1 l*.t M tt-O t'
K f i o : ỉ I h p M n t o í Page Í'lutfí*r
ACỈJtJsĩmeni Lcvci //, 2.3: M áy A P T B ookScan ỉ 200 đirực Iraiìo bị đê số lioâ tài liệu (liiii iliich; I - Háim dicu kliiõn 1- Cìinicra 3- í)èn chi ếu sánu 4- C án h lay lật trang 5- Ciiá nâiìg sách và rhan íi chỉnh ụiá dỡ 6- Kẹp sách và N ú m điêu chỉnh kẹp 7- Ọ n ụ ihổi và c ầ n diều chình ố nụ ihồi 8- iiộ ph ận íiưưng lật Ả'ỳ ihiiâi vàn hành thiết hi và xử lý anh: l-liện tại r r u n ạ tâm đà thử n s h i ệ m và đira 1 chiếc m á v A P ỉ Bo okScan 1200 \ ả o hoạt clộn2 ncn \'iệc quét tài liệu cho CSD I. S T D dirợc ticn hành íoãn bộ trên cỉiiếc ni;í\' Iià\-. Sau dày là một số kỹ tlìuậl \ ụn hành \ à \ ứ ỉý ánh cho máy A P r [3ookScan 1200: - Câc bước chỉnh /ro n ^ q u v trình so hoá tài liệu trên ììĩáv A P T BookScan Ị200 ơỏDì: Smoíí
CrsU)lc + Nhận tài liệu từ các bộ phận, xây dựng bảng danh sách các sách, kiểm tra lại số lượng, phân loại sách theo độ ưu tiên cho việc quét và phân loại các sách cần xừ lý trước khi quét. Tất cả kết quả được lun vào bảng quản lý sách (được xâỵ dựng bang mẫu định dạng Excel) + Xứ lý sách trước khi quét (Pre-scan): Làm sạch sách đối với sách bẩn; chỉnh íại mép sách nếu cong, quăn; mở những trang sách bị gấp; rọc những trang sách bị dính liền. + Thực hiện quét sách bàng máy APT (Image Capture, Scan) + Thực hiện xừ lý ảnh và nâng cao chất lượng hình ảnh (Image Processing) + Thực hiện kiểm tra chẩt lượng (Quality Check) bằng cách review sản phẩm theo check list và chỉnh sửa lại sản phẩm nếu chưa đạt chất lượng (Image Correction). Đây là điểm khởi đầu của quá trình Kiểm tra chất lượng, và chủ yếu tập trung vào chất lượng hình ảnh. + Thực hiện nhận dạng (OCR) và tạo file PDF + Thực hiện review và chỉnh sửa tài liệu sau OCR - Những thao tác chỉnh khi sử dụng mảy APT BookScan 1200: + Điều chỉnh góc chụp và vị trí chụp thông qua giá nâng và kẹp sách + Điều chỉnh ống thổi + Điều chỉnh gương lật + Sừ dụng màn hình Scan đocument settings để chọn thư mục sẽ liru trữ các file ảnh (Hình 2.4 ) Ú 35 H. 2.4: Màn hình Scan document settỉngs + Thao tác trên màn hình Scan setting để điều chỉnh: Độ rộng sách Tốc độ scan Độ kẹp mạnh/yếu của kẹp sách Độ hút mạnh/yếu của Cánh tay giở trang Độ thổi mạnh/yếu của ống thổi Chế độ chụp là tự động hay lật giở bằng tay Chế độ chụp cả hai trang hoặc chỉ trang phải hoặc chi trang trái + Sử dụng màn hình điều khiển thông số camera (Hình 2.5) để điều chỉnh: Tốc độ đóng/mở cửa trập Độ mở ống kính Độ nhạy sáng Kích thước ảnh Chất lượng ảnh 36 H. 2.5: Màn hình file management imỂìMhíàiấr H. 2.6: Màn hình điều chỉnh các thông sẻ cho camera - Xử íý cácýìỉe p d f vàfìle ảnh sau khi scan Đây là khâu cuối cùng để tạo nên một file pdf hoàn chỉnh. Những công việc phải thực hiện bao gồm: + Kiểm tra toàn bộ file quét để phát hiện những chỗ bị mất chữ + Kiểm tra độ phân giải (phát hiện những trang bị mờ để tiến hành quét lại) + Kiểm tra độ nghiêng (nếu trang bị nghiêng thì chỉnh lại hoặc quét lại) + Thực hiện việc crop các trang quét để loại bỏ phần lề có màu den và căn lề cho trang quét + Tối ưu hoá file pdf bằng công cụ PDF Optimizer để tạo ra ĩile pdf có dung lượng nhỏ và chất lượng tốt. Đối với máy APT BookScan 1200, công việc xử lý file ảnh có các công cụ riêng là phần mềm “BookScan Editor” (BSE). Công cụ này có 2 hệ thống chức năng chính sau: + Xử lý hình ảnh cho template và chạy theo bó (run batch). Các chức năng ở đây chủ yếu để tạo ra template để sau đó áp dụng cho tất cả các trang tài liệu. + Xử lý tinh từng hình ảnh sau khi đâ xử lý theo bó. - Lưu giữ các fiỉe dữ liệu đầu ra Sau khi thực hiện đầy đủ các thao tác kỹ thuật để cho ra các file dạng pdf, các 37 file này được lưu giữ ưên một server đặt tại bộ phận số hoá. Thông qua việc khảo sát một sổ bài toàn văn đã quét trước đây (trên máy HP 5590) và theo phản ánh của Bộ phận xây dựng CSDL sau khi triển khai quét tài liệu trên máy APT BookScan 1200 cho thấy, các kỹ thuật quét tài liệu cũng tồn tại một số hạn chế nhất định chưa được khắc phục. Một số lỗi vẫn tồn tại trên bài toàn văn như lỗi lệch trang, đen lề, mờ không đọc được... Những lỗi này cần sớm được íchắc phục triệt để khi sử dụng máy scarmer APT BookScan 1200. 2.2.3. Xây dựng cơ sở dữ liệu Xây dựng các CSDL đòi hỏi nhiều yếu tố liên quan như phần mềm, các công cụ biên mục, các chuẩn dùng ữong công tác biên mục, phương thức lưu giữ fíle toàn văn,... Trong đó việc sử dụng phần mềm đóng vai trò quan trọng, quyết định đến cấu trúc của CSDL. Trong phần này, tác giả sẽ tập trung tìm hiểu các phần mềm dùng cho việc xây dựng các CSDL nội sinh và phương pháp xây dựng một sổ CSDL như BOOK, STD và KQNC. Phần mềm Trung tâm TTKH&CNQG là một trong những cơ quan đi đầu trong quá trình ứng dụng CNTT. Việc ứng dụng các phần mềm quản lý tài liệu được triển khai khá sớm (từ đầu thập niên 80). Cùng với quá trình phát triển của CNTT, Trung tâm không ngừng đẩy nhanh quá trình áp dụng các phần mềm vào hoạt động. Xuất phát từ sự phong phú và đa dạng của các nguồn TNS, hiện tại Trung tâm đang sử dụng đồng thời nhiều phần mềm để quản lý nguồn tài nguyên này, Dưới - CDS/ISISfor DOS và ÌVINISIS đây là một số phần mềm đã và đang được sử dụng: Phần mềm đầu tiên được áp dụng tại Trung tâm là CDS/ISIS for DOS, Đây là phần mềm tư liệu dùng để quản lý các CSDL dạng văn bản có cấu trúc do UNESCO phát triển và phổ biến từ năm 1985 và được cung cấp miễn phí cho các thư viện Việt Nam. Đây cũng là phần mềm đầu tiên được sử dụng phổ biến tại Việt Nam để quản lý thư viện truyền thống. CDS/ISIS có các đặc trưng sau: + Sử dụng giao điện DOS để xây dựng CSDL + Sử dụng dạng biên mục máy đọc được CCF (Common Commưnication 38 Pormaí) + Là phần mềm kết hợp Hệ quản trị CSDL với Phần giao tiếp. + Quàn lý được đồng thời nhiều CSDL + Cho phép xây dựng các CSDL lớn tới 16 triệu biểu ghi + Kích thước của trường không hạn chế (có thể tới 32.000 ký tự) Các giai đoạn phát triển của CDS/ỈSIS for DOS + Cuối những năm 60; Phiên bản chính + Tháng 12/1985: Phiên bản 1.0 chạy trên IBM PC/XT + Tháng 3/1989; Phiên bàn 2.0 + Tháng 6/1993: Phiên bản 3.0 CDS/ISIS for DOS cũng đã được Trung tâm Việt hoá và triển khai áp dụng rộng rãi. Trước năm 2002, toàn bộ CSDL của Trung tâm được xây dựng và quản lý trên phần mềm CDS/ĨSIS for DOS. Hiện nay, do những tính năng ưu việt của CSDL này, đặc biệt là trong quá trình nhập liệu, kiểm tta ư tn g lặp và duyệt tài liệu nên Trung tâm vẫn sử dụng CDS/ISIS for DOS để nhập liệu cho những tài liệu hồi cố. Từ tháng 11 năm 1997 phiên bản CDS/ISIS for WINDOWS 1.0 (WINISIS) ra đời và đến năm 1998, Trung tâm đã áp dụng phần mềm này vào việc xây dựng và quản lý các CSDL. WĨNISIS được phát triển từ phần mềm CDS/ISIS for DOS cho phép chạy trên môi trưÒTĩg Windows với nhiều tính năng ưu việt như: + Xây dựng cấu trúc CSDL dễ dàng nhờ có các phương tiện trợ giúp trong việc tạo biểu mẫu nhập tin và íormat hiện hình. + Hiệu quả tìm tin tăng, nhờ nhiều phương tiện trợ giúp (cửa sổ từ điển, nút toán tử,...) + Cho phép tìm tin theo nhiều phượng thức: tìm tin trình độ cao và tìm tin có trợ giúp. + Có khả năng kết nối CSDL này với các CSDL khác để mở rộng chức năng quản lý nhờ các lệnh kết nối siêu văn bản trong ngôn ngữ tạo fomial. + Cho phép quản lý các tệp toàn văn nhờ những liên kết siêu văn bản + Có cải tiến Phần giao tiếp tìr DOS đến Web và két nối thêm Hệ quản trị 39 CSDL Access. + Dễ thao tác và sử dụng, phù hợp với trình độ của mọi đối tưọTig; khả năng kết nối mạng LAN, liên kết với các trang Web trên mạng Internet thuận tiện. WINISIS giúp toàn bộ hoạt động nghiệp vụ thư viện được tự động hoá tối đa và tích hợp trong một hệ thống nhất đồng thời cho phép trao đổi, tương tác, hỗ trợ lẫn nhau tạo ra một quy trình nghiệp vụ chuẩn của một thư viện hiện đại bao gồm: + Bổ sung: Bổ sung tài liệu qua đơn đặt, tra trùng tài liệu, tra cứu báo cáo bổ sung... + Biên mục: Xuất, nhập dữ liệu theo chuẩn MARC 21, in phích mục lục, in nhãn tài liệu, in thư mục tài liệu mới, tài liệu chuyên đề, tìm kiếm tra cửu nhanh theo nhiều tiêu chí, thống kê báo cáo tài liệu,... + Hồi cổ, hiệu đính, tái xử lý tài liệu kho đọc, kho mượn, tạo lập và tổ chức quản lý kho theo yêu cầu của thư viện. + Quản lý lưu ứiông: cấp thẻ bạn đọc» lưu thông đọc, mượn, ừả, gia hạn theo quy trình tra cứu, quản lý bạn đọc, báo cáo tìiống kê lượt người đọc, lượt tài liệu luân chuyển... + Dữ liệu sử dụng trong WINISIS có thể tái sử dụng sau này nếu thư viện nâng cấp sử dụng các chương ưình phần mềm quản lý khác với tính năng cao hơn như ILIB, LIBOL,,.. Hiện nay, WINSIS đã phát triển đến phiên bản 1.5 nhưng do nhu cầu trong quản lý dữ liệu và thư viện tại Trung tâm ngày càng cao, phần mềm WINISIS không thể đáp ứng được nên Trung tâm đã triển khai thêm các phần mềm khác. Phần mềm WINISIS chỉ được sử dụng để xây dựng và quản lý một số CSDL như Kết quả nghiên cứu, Đê tài đang tiến hành và Mục lục liên hợp. Các CSDL này sau khi được xây dựng trên WIN1SIS sẽ được chuyển sang WEBISIS để phục vụ truy - Phần mềm Zope cập trực tuyến thông qua mạng Vista. Zope (Z Object Publishing Environment) là một tập hợp các phần mềm mã nguồn mở, do công ty Zope Corporation và một cộng đồng lớn các nhà phát triển phần mềm xây dựng. Zope được viết bàng ngôn ngữ Python, phiên bản đầu tiên của 40 Zope là vào năm 1998. Zope cung cấp các dịch vụ nền tảng trên web. Dựa ữên nền tảng này, rất nhiều phần mềm (trong đó có nhiều phần mềm nguồn mở) đã được xây dựng để bổ sung mở rộng thêm nhiều tính năng khác trong đó: + CMF (Content Management Framework) là các công cụ nền tảng mạnh và có khả năng tùy biến cao để xây dựng các ứng dụng quản trị nội dung (theo thuật ngữ thư viện là quản trị các CSDL toàn văn tài liệu hay các CSDL đa phương tiện như hình ảnh, âm thanh, video...) + Plone là một phần mềm mở rộng nữa của Zope cung cấp thêm nhiều địch vụ mới như quản ưị người đùng tốt hơn, có sẵn nhiều loại đữ liệu, giao diện người đùng thân thiện với nhiều trợ giúp để định hướng, các cửa sổ, liên kết... Tập hợp phần mềm Zope và tất cả các phần mềm mở rộng đó sau đây gọi tắt là Zope. Yêu cầu về phần cứng và phần mềm của Zope + về phần cứng, Zope có thể chạy trên một máy tính có cấu hình trung bình. Tuy nhiên để có ứiể đáp ứng nhanh chóng một lượng truy cập lớn. Đê cài đặt Zope, cần có một máy tính có cẩu hình nhu sau trở lên (Pemtium IV, 3GHz, 512MB RAM trở ỉên, 80GB HDD). + về phần mềm, trên máy chủ, Zope được dùng với các hệ điều hành phổ biến (Winđows, Linux,..,). Hệ thống tuân thủ chuẩn HTTP và có thể sử dụng các phần mềm web server miễn phí (IIS, Apache,...)- Các phần mềm khác, íhí dụ như một hệ quản trị CSĐL bên ngoài, là không bắt buộc và chỉ cần có nếu ta muốn mở rộng các chức năng. Trên máy trạm, chỉ cần một ừình duyệt (MS lE hoặc FireFox,...) là làm việc được. Hệ thống hoàn toàn tương thích với mã Unicode nên có thể dùng với các bộ gõ thông thường (ưnikey, Vietkey,-)- Việc kết nối giữa người dùng đầu cuối với hệ thống được thực hiện theo cách thức thông thường do hệ thống hoàn toàn tuân thủ các chuẩn Internet (TCP/IP). Các thành phần chỉnh của Zope: + Dịch vụ ứng dụng web, cho phép xuất bản các đối tượng lên web, vào các vùng riêng biệt trên màn hình (portlet); + CSDL hướng đối tượng ZODB, cho phép quản trị các loại đối tượng; 41 + Các thành phần mở rộng được gọi là các “sản phẩm” (products); + Có thể lập trình phát triển bằng ngôn ngữ ZPT (Zope Page Template) hoặc Python, thay đổi giao điện trình bày bằng CSS; + Một cơ chế lập chỉ mục thông qua một bộ máy tìm kiếm Zcatalog; + Quản trị người dùng, nhóm người đùng và các quyền; + Kết nối với các nguồn lực bên ngoài ( các hệ quản ưị CSDL quan hệ, các hệ thống quản trị nguồn lực LDAP...); + Quản trị hệ thống thông qua giao diện web ( ZMI - Zope Management Interíace); + Quản trị dòng công việc; + Quản trị siêu dữ liệu (Dublin Core); + Quản ư-ị giao diện người dùng. ưu điểm của Zope + Có thể chạy trên các hệ điều hành phổ biến như Windows, Linux, BSD, Unix, Solaris + Có thể chạy như một ửng dụng riêng lẻ hoặc kết hợp với các web server phổ biến như MS IIS hay Apache; + Có kiến trúc đơn giản, trực giác; + Có giao điện hoàn toàn qua web kể cả sử dụng, quản trị và phát ưiển phần mềm; + Dễ định hướng; + Tìm kiếm thuận tiện; + Cho phép tổ chức hợp lý dữ liệu trong và ngoài cơ quan; + Nội dung và công cụ do cán bộ thông tin, chứ không phải người lập trình, lựa chọn. Việc nhập tài liệu theo mẫu có sẵn và trực quan, không yêu cầu kiến tíiức vềH TM L,C SS...; + Có thể mở rộng các chức năng, tìiay đổi giao diện; + Hỗ trợ các công đoạn xuất bản điện tử các tài liệu, theo dòng công việc có tiiể tùy biến, phù hợp với qui trình riêng do Cỡ quan đặt ra; + Bao gồm một hệ quản trị nội dung đầy đủ, cho phép quản trị cả phần mô tả 42 và toàn văn tài liệu, cho phép xây dựng danh mục các yếu tố mô tả theo yêu cầu; + Cho phép quản trị người dùng và nhóm người dùng, quản trị quyền truy cập vào từng đổi tượng cho từng người hoặc từng nhóm; + Dễ dàng sao lưu và ỉdiôi phục dữ liệu (toàn bộ dữ liệu chứa trong một fiie). Có thề tải về các bản nâng cấp chương ừình thưcmg xuyên; + Hỗ trợ các chuẩn CNTT cơ bản, thí dụ như Unicode, Web, XML, RSS, LDAP, ... có thể tích hợp với các phần mềm thông dụng khác như các hệ quản trị CSDL quan hệ Oracle, MS SQL Server, MySQL,... ; + Hỗ trợ sẵn hoặc có thể cài đặt thêm các mở rộng để hỗ trợ nhiều chuẩn về thông tin - tư liệu như chuẩn siêu dữ liệu Dublin Core, hoặc chuẩn phổ biến trong các hệ thống tài liệu toàn ván OAI-PMH (Open Archives Initiative - Protocol for Metadata Harvesting). Hiện nay, hầu hết các CSDL toàn văn của Trung tâm đều được xây đựng, quản - Phần mềm Libol lý và phục vụ khai thác ừên phần mềm này. Libol (Library Online) là phần mềm quàn trị thư viện tích hợp được công ty Tinh Vân phát triển từ năm 1998. Phiên bản Libol 5.5 đã được Trung tâm TTỈCH&CNQG áp dụng vào quản lý các hoạt động thư viện từ năm 2004 đến nay. Mặc dù không được sử dụng để xây dựng và quản lý tài liệu toàn văn nhưng Libol là phần mềm đóng vai trò quan trọng trong việc tạo ra nguồn tài nguyên thư mục tại Trung tâm. Hiện nay, bên cạnh các chức năng thống kê, quản lý bạn đọc,,,, phần mềm này là công cụ chủ yếu được dùng để xây dựng, quản lý và khai thác CSDL Sách và Tạp chí. LIBOL 5.5 có ichả năng hỗ trợ nghiệp vụ quản lý nội đung với nhiều tính năng nổi bật như chuẩn biên mục MARC 21, AACR-2 giúp nhập và xuất thông tin đễ dàng, có tính bảo mật cao, nhập liệu, tìm kiếm và hiển thị đa ngữ. Song song đó, phần mềm được xây dụmg có tính tùy biến cao, tiện lợi cho người quản lý, hỗ trợ mã vạch và thè từ, cho phép vận hành trên CSDL lớn đến nhiều triệu bản ghi. Giao thức mở rộng Z39.50 cũng được áp dụng trong LIBOL 5.5 giúp người sử dụng thư viện tiếp cận nguồn tiiông tin đa dạng của Internet. Dưới đây là một số tính năng nổi bật của Liboỉ: 43 + HỖ trợ chuẩn biên mục MARC 21, AACR-2, ISBD. -- I lồ trợ các k h u n g ph â n loại th ô n ỵ (.iụna: nhu D DC. B B K , N l . M , rX)C\ ƯDC. -t N h ập /x u ấl d ừ liệu theo cliiiẩn IS O 2709. + Liên kết với các th ư viện và tài ntiii> ên i h ô n a tin irực tuỵốn trên Internel qua ííiao thức Z39.50 và O A l - P M l l . ‘ M ư ợ n liên Ihư viện iheo chu ẩn ISO 10161 ; tích hợp với các thiết bị mượn tra tự liộníi ihc o chiuin SIP 2. ' híồ trợ đa n a ữ \ Inicodc \ ớ i dữ liệu \ à eiao diộn làm \ iệc ; dồn« tliời hỗ trợ cúc bán.e m ã tiến ụ việt n h ư '1'CVN 5712. VNI, '!'CVN' 6909. - lí ao mậl và phân q u y ề n ch<ặt chẽ. - Vận hànli hiệu q uả trèn Iihữnu C S l)! . kVn nỉiiều triệu bản íihi. í Hỗ trự hệ quản Irị C S D L Oracle hoặc Mlcrosoít SQL Servcr. ^ Khai thác vả Irao dồi t h ô n ạ tin qua \vcb. ihư điện tư. G P R S ( diện thoại di d(Mie) \ à thicl hị hỗ trợ nuười khicm thị. ~ llồ irự họ thốnụ ihir viện nhiều kho, n h iầ i diốm lưu thôníi ; lươiìt’ Ihich với cả IIÌÔ liình kho clónu và kho mở. D u ói dâ> là uiao diộiì của pliầii m ề m I.ibol phiên bản 5.5 iđ^icãl i D D Ì J .'J (iKtSC.S I riiKAHII S ONIIM, » hy Tinh VM •r' C;'|Ị UPAC
"a
ẻ-1
C.ci VL. Irự:
L 9 ' ỉnư vỉẬt M l ĨHONC T-i
C" SSC'*
k è. : j c O tá* > -."ẻ 3oc
ĩ j r -9 •«/? D3Ú c ao riỉA Ĩ HÀMt y.ỡ •ỳ -.•ó- c i v IU
Gú ;.-C^ civ.
Àũ jOu
T-ổr-3 “ã C3C C30 BILN Mll
6 t"* ‘Vui
Tiưriví rĩKicíí l ư liệ .j đ iẻ '* :ừ C-LÌ^ di.rr5 Mitôlií 'ệ\: //, 2. /: G iao diện p h ầ n m ẻni Lìhol p ỉiià i han 5.J 44 ĨƯLIẼIDỈÉSỈỨ Sau sáu năm triển khai xây dựng, hiện nay số biểu ghi trong Các CSDL được xây dựng trên phần mềm Liboỉ (bao gồm cả phần dữ liệu được chuyển sang từ phần - Phần mềm Greenstone mềm ISIS ) đã lên tới hơn 220 nghìn biểu ghi. G reenstone là m ột trong những hệ thống phần mềm nguồn mở TVS nổi tiếng và phổ biến nhất hiện nay. Phần mềm này được phát triển bởi Dự án TVS New Zealand của trường đại học Waikato, New Zealand và được UNESCO phân phối. Greenstone là một phần mềm đa ngôn ngữ được dịch sang gần 50 thứ tiếng, bản tiếng Việt do Công ty lES của Phần Lan ở Việt Nam phối hợp với Thư viện Đại học Khoa học Tự nhiên thành phố Hồ Chí Minli biên dịch. Phần mềm nguồn mở TVS Greenstone và tài liệu hướng dẫn bằng tiếng Việt có thể tải xuống thông qua trang web GreenstoneW iKi: http://greenstỡne. sourceforge. net/wikưindex.php/Greenstone Wiki). Greenstone được đùng để thu gom và biên mục tài liệu theo Dublin Core, đồng thời tổ chức thành bộ sưu tập và xuất ra đĩa CD hay để khai thác trực tuyến qua Internet. Greenstone được lưu hành với giấy phép GPL, được dùng rộng rãi khắp nơi trên thế giới, ở Việt Nam nhiều thư viện đã sử dụng Greensíone để xây dựng các bộ sưu tập số, đáng kể nhất là Thư viện đại học Khoa học Tự nhiên và Thư viện đại học Ngân hàng thành phố Hồ Chí Minh. G reenstone cũng được áp dụng vào hoạt động của Trung tâm từ khá sớm (năm 2004). H iện nay G reenstone được sử dụng để quản lý và khai thác trực tuyến thư viện điện tử các tài liệu toàn văn về kỹ thuật nông nghiệp với địa chi: http://icadI2007. vừtagơv. vn/gsdưcgi-birưlibrcoy Các tính năng của Greenstone: + X ây dựng các bộ sưu tập tài liệu điện tủ từ Internet và các CSDL trực tuyến dạng đa phươ ng tiện; Sưu tập âm thanh, tranh ảnh, hình ảnh động, hoạt hình, đồ hỉnh, toàn văn,... + Xây dựng các bộ sưu tập về các chuyến ngành, bằng cách số hoá các tài liệu hiện có tại thư viện: Sách, tạp chí, luận văn, báo cáo khoa học, đề tài 45 nghiên cứu khoa học, bài giảng, giáo trình, w . .. với bộ sưu tập toàn văn. + Xây dựng C SD L bộ sưu tập dạng thư tịch biên m ục theo Dublin Core hay M A R C 21. + Hỗ trợ thực hành xây dựng bộ sưu tập và biên m ục Dublin Core và M A R C 21 của G reenstone bằng công cụ Librarian Interface. + K hả năng tìm kiếm m ạnh với nhiều điểm truy cập, đặc biệt là khả năng tìm kiếm toàn văn trong CSDL + G reenstone có thể tích hợp vào phần m ềm quản lý thư viện có sẵn. + G reenstone có thể được phát triển thành m ột phần m ềm quản lý thư viện hoàn chỉnh theo yêu cầu của từng thư viện. Bên cạnh các phần m ềm trên, năm 2009 Trung tâm cung đã tiép quản phần m ềm OJS (O pen Journal System). Đây là phần m ềm quản lý tạp chí mã nguồn m ở do D ự án “Tri thức công cộng” thuộc trường Đại học British C olum bia của C anada xây dựng. Phần m ềm này được áp dụng cho dự án X ây dựng C SD L Tạp chí khoa học Việt N am (V JO L) thuộc tất cả các lĩnh vực. D ự án này do M ạng Q uốc tế về ấn phẩm khoa học (IN A SP) của Anh tài trợ cho V iệt N am . T rung tâm TTK H & CN Q G không trực tiếp xây dựng mà chỉ quản lý C SD L này. T hông tin trên CSD L được upload lên m ột cách tự động dưới sự quản lý của T rung tâm TTK H & C N Q G . H iện đã có 23 tạp chí được xuất bân trên V JO L với 142 M ục lục Tạp chí, liệt kê 1473 bài viết, trong đó 1010 bài viết được cung cấp toàn văn dưới định dạng pdf. C ác chuẩn cho phát triển nôi d u n s số Vấn đề áp dụng các chuẩn cho dữ liệu số là một ữong những vấn đề được quan tâm hàng đầu trong công tác TT-TV. Việc áp đụng các chuẩn thống nhất sẽ tạo ra sự thống nhất về dữ liệu trong toàn bộ hệ thống, bên cạnh đó các chuẩn dữ liệu còn giúp trao đổi dữ liệu được dễ đàng và thuận tiện. Cùng với sự phát triển của nội dung số là sự xuất hiện của các chuẩn kèm theo, trong đó có rất nhiều chuẩn cần được áp dụng như chuẩn về ngôn ngữ, chuẩn mô tả dữ liệu, trao đổi dữ liệu... Các chuẩn hiện đang được áp dụng đối với dữ liệu thư mục của Trung tâm gồm: 46 Khổ mẫu M arc21 + Mã địa danh Việt Nam: TCVN 7587-2006 + Mã nước: ISO 3166-2 + Mã ngôn ngữ: ISO 639-2 + Mã tên cơ quan: TCVN 7588-2006 + Mã tên tác giả (kho mở): Cutter-Sanborn Việc áp dụng các chuẩn trong phát ừiển nội dung số tại Trung tâm hiện nay cần được tiếp tục nghiên cứu và ừiển khai. Trong khi chuẩn ngôn ngữ đã được áp dụng cho toàn bộ hệ thống thì các chuẩn khác mới chỉ áp dụng chủ yếu cho các CSDL thư mục. Các chuẩn dành cho TLS hầu như chưa được áp dụng hoặc áp dụng không thống nhất. Thỉ dụ: Chuẩn mô tả trang trong CSDL STD được áp dụng là định dạng pdf, trong khi trong các bản tin điện tử là định dạng doc Hoặc: CSDL STD chưa áp dụng các chuẩn về mô tả dữ liệu số Những sự thiếu đồng bộ và chậm trễ trong việc áp dụng các chuẩn trên đã tạo ra sự thiếu ứiống nhất về dữ liệu và hạn chiế trong quá trình trao đổi dữ liệu. X âv dưn£ CSDL Sách N guồn TN SN S dạng thư m ục chiếm tỷ lệ lớn trong cơ cấu vốn TLS nội sinh tại T rung tâm . T rong phần này, tác giả sẽ tập trung tìm hiểu công tác biên m ục cho C SD L Sách tại T hư viện Khoa học Kỹ thuật Trung ương. CSD L này được xem là C SD L lớn nhất về khối lượng biểu ghi (trên 100 nghìn biểu ghi) được xây dựng từ khá sớm và đã được chuyển đổi sang phần m ềm L ibol (trước đây CSD L này được xây dựng ưên CSDL CD S/ISIS). Q uy trình xây đựng C SD L này liên quan đến hai phân hệ trong phần mềm L ibol là Phân hệ B ổ sung và Phân hệ Biên mục. Các bưófc được tiến 47 hành như sau: Bước I : K iểm tra trùng lặp cho tài liệu trước khi nhập vào CSDL (sử dụng các trường ISB N , N han đề, tác giả,...để kiểm tra xem tài liệu đã tồn tại trong CSDL chưa?) B ưởc 2 : N hập thông tin về tài liệu (lập yêu cầu cho ấn phầm , duyệt yêu cầu, lập đơn đặt cho tài liệu v à biên m ục sơ lược) Bước 3 : T iến hành biên m ục chi tiết cho tài liệu (cập nhật các trường từ khoá, chỉ sổ phân loại, chỉ số cutter và m ột số trường khác) Bước 4 : K iểm nhận và m ở khoá để phát hành biểu ghi Các chuẩn, khổ m ẫu và cô n g cụ xử lý gồm; +Q uy m ô tả ĨSB D + K hổ m ẫu M arc2 1 + Mà ngôn ngữ: ISO 639-2 + Mã tên tác giả: Cưtter-Sanbom + Bảng T ừ khoá có kiểm soát + K hung phân loại B B K Q uá trình áp dụng các chuẩn, khổ mẫu và các công cụ trên vào công tác biên m ục cũng gặp không ít khó khăn, đồng Uiời vẫn còn m ột sổ tồn tại cần được khắc phục: - Trong quả trình áp dụng tiêu chuẩn mô tả tài ỉiệu Tiêu chuẩn quốc tế về mô tà thư mục (ISBD) được áp dụng vào công tác xử lý tài liệu tại Trung tâm từ năm những năm 1981-1982 (Trước đó là tiêu chuẩn GOCT 7.1 về mô tả dữ liệu thư mục của Liên Xô). Hiện nay, Trung tâm đang dự kiến sẽ triển khai áp dụng AACR2 vào công tác xử lý bởi lẽ hiện tại Trung tâm đang sử dụng khổ mẫu MARC21 mà khổ mẫu này chịu nhiều ảnh hưởng của AACR2. Vì vậy, để áp dụng ưiệt để khổ mẫu Marc21 Trung tâm cần sớm triển khai áp dụng AACR2 trong công tác xây đựng CSDL. Việc áp đụng khổ mẫu M ARC21 vào xử lý tài liệu góp phần tạo nên sự thống nhất đữ liệu, đồng thời hỗ trợ công tác trao đổi tài liệu trong nước và quốc tế. Trước đây, hầu hết dữ ỉiệu của Trung tâm được xây dựng trên phần mềm CDS/ISIS nhưng 48 sau khi triển khai thêm một số phần mềm mới, toàn bộ dữ liệu này đều được chuyển đổi sang cấu trúc MARC21. Mặc dù vậy, quá trình triển khai MARC21 tại Trung tâm cũng gặp phải một số khó khăn nhất định, thể hiện ở một số điểm sau: + Fề tài liệu hướng dẫn: Mặc dù đã có 2 tài liệu chính thức bằng tiếng V iệ t, xong cả hai tài liệu này đều quá đồ sộ nên không thuận tiện trong quá ừình tác nghiệp của cán bộ xử lý [17]. + Trong quả ừình tác nghiệp cùa cán bộ: Do khổ mẫu này bao gồm rất nhiều thành phần và tương đối phức tạp (đặc biệt là trong phần cấu trúc biểu ghi), điều này cũng gầy không ít khó khăn cho người trực tiếp xử lý tài liệu. + Trong khi chuyển đổi dữ liệu từ cấu trúc cũ: Phần lớn các nhẫn trường/ưưòmg con không trùng nhau giữa CSDL dùng cấu trúc cũ và MARC21 nên khi chuyển đổi dữ liệu các nhà cung cấp phần mềm hoặc Trung tâm phải tự viết phần mềm chuyển đổi. Trong quá ừình chuyển đổi dữ liệu cũng đã xuất hiện những trường hợp sai lệch hoặc mất dữ liệu,... - Trong quả ừ-ình sử dụng các công cụ biên mục + Q uá trình sử đụng khung phân loại BBK cũng gặp phải m ột số khó khăn nhất định, M ột số thuật ngữ không tìm được m ột ký hiệu phân loại phù hợp, đặc biệt là các tài liệu liên ngành, các tài liệu thuộc lĩnh vực m ớ i... Bên cạnh đó cũng tồn tại một số trường hợp không thống nhất trong quá trình xử iý phân loại. Thỉ dụ: Những tài liệu có cùng một chủ đề lại được phân loại khác nhau (như trường hợp các tài liệu về lĩnh vực thống kê đang được xếp ờ hai mục của Khung phân loại BBK là Ô 6 và Q 051). Hiện tượng này là do sự thiếu thống nhất về quan điểm trong khâu phân loại giữa nhữĩig người làm công tác xử lý. + Việc áp dụng bộ Từ khoá có kiểm soát vẫn tồn tại một số khó khăn và chưa được áp dụng triệt để như: Một số thuật ngữ mới chưa được cập nhật, có nhiều từ khoá tồn tại trong CSDL không chính xác với nội dung hoặc không đáp ứng được yêu cầu đối với một từ khoá. Thỉ dụ: vẫn tồn tại những từ khoá “Ảỹ thuật rađỉo ” trong bộ Từ khoá có kiểm soát 49 quy định sử dụng "‘Kỹ thuật vô tuyển " thay cho thuật ngữ trên,... Hay: Trong bộ Từ khoá quy định sử dụng thuật ngữ ỉạc 5ố” thay cho thuật ngữ '■''Thông tin sổ ’\ Điều này dễ dẫn đến tình trạng hiểu sai thuật ngữ '-''Thông tin ” như là m ột danh từ ... - Trong quả trình sử dụng phần mềm Thông qua tim hiểu đồng thời trực tiếp tham gia biên mục cho CSDL này, tác giả thấy có m ột số vẩn đề về phần mềm còn tồn tại gây khó khăn cho những người làm biên mục đồng thời ảnh hưởng đến chất lượng CSDL. N hững bất cập này tồn tại trong cả hai phân hệ Bổ sung và Biên mục. T rong phân hệ Bồ sung + Có quá nhiều công đoạn để bổ sung một ấn phẩm ừ-ong klii có ửiể bỏ qua một số công đoạn (duyệt yêu cầu,...). + Không ửiể thêm một giá trị cho một tài liệu đã có săn (đối với những biểu ghi được xây dựng trước khi áp dụng phần mềm này). Hiện tượng này nếu không được khắc phục sẽ dẫn đến tình ừạng biểu ghi bị trùng tên. Thỉ dụ: Khi muốn thêm một ký hiệu xếp giá cho cuốn sách "Mô hình tồ chức kình doanh thương nghiệp xã hội chủ nghĩa trong cải cách kinh tế ” khi biểu ghi này đã có sẵn một ký hiệu là Vđ 259/2002, người xử lý sẽ không thể sinh thêm giá trị cho tên sách này vì tên sách này không được xây dựng ưên một đơn đặt cụ thể. Trong trường hợp người xử lý vẫn muốn bổ sung thêm một giá trị cho tên sách này thì chỉ có một cách duy nhất là tạo một biểu ghi mới để tránh hiện tượng một tên sách xuất hiện hai lần trên CSDL gây khó khàn cho việc quản lý và tìm kiếm. Trong phân hệ Biên muc Phân hệ Biên mục cũng tồn tại nhiều hạn chế như: + Chưa hỗ trợ lưu các giá trị ngầm định + Các giá ưị ngầm định trong trường lặp không được sử dụng lại + Chưa hỗ trợ từ điển + Phần trợ gúp chưa được thiết kế khoa học 50 Thí dụ: Trong phần trợ giúp đối với trường 700 - Mục từ bổ trợ tên riêng liệt kê các số 3, 5, 6, 8 và các chữ cái. Giả sử khi người xử lý cần trợ giúp về chức đanh của tác giả được iập bổ sung thì không biết sử dụng ký hiệu cho trường con nào trong số các chữ sổ và chữ cái đã được ỉiệt kê trong đó. Khi đó nếu người xử íý không muốn dùng bảng hướng dẫn MARC21 thì phải dò từng số và chữ cái trong mục hướng dần để tìm ra trường con $c - bổ trợ chức danh cho tác giả. Điều này cho thấy hệ thống trợ giúp gần như không mang lại tiện ích gì cho người xử lý. X âydưm C SD L STD CSDL Tài liệu KH&CN Việt Nam là CSDL đa ngành lón nhất cả nước hiện nay được Trung tâm xây dựng từ năm 1987 với nguồn trích từ hơn 300 tạp chí khoa học trong nước, các tài liệu hội nghị hội thảo và tuyển tập báo cáo. Hiện tại CSDL này có hơn 127.000 biểu ghi ừong đó có 55.000 biểu ghi có đính kèm file toàn văn. Công tác biên mục tài liệu cho CSDL này cũng được thay đổi theo cấu trúc và quy mô của CSDL. Trước năm 2004, khi Tmng tâm chưa triển khai quét tài liệu gốc đính kèm thì CSDL ở dạng thư mục, tài liệu được biên mục như đối với CSDL thư mục về bài trích. Từ năm 2004 đến nay Trung tâm đã triển khai quét tất cả các bài trích khi đưa vào CSDL thì công tác biên mục cũng có sự ứiay đổi. Nếu như trước đây công tác biên mục bao gồm cả việc xây dựng bài tóm tắt cho bài trích thì từ năm 2004 trở lại đây công việc này trở nên không quan trọng (vì dung lượng fĩle đính kèm cũng khá nhỏ, NDT có thể xem lướt bài toàn văn mà không cần có thông tin tóm tát). Quá trình biên mục tài liệu cho CSDL này cũng được tuân thù theo những quy trình và nguyên tắc chặt chẽ theo các bước sau: Bước 1: Cán bộ xử lý nhận file toàn văn (fíle chưa extract bài trích) từ bộ phận số hoá về để xử lý Bước 2: Đọc bài ữích để xác định nội dung (Những bài trích có giá trị klioa học sẽ được tiếp tục xử lý) Buớc 3: Gửi danh mục các bài sẽ xử lý cho lành đạo phòng duyệt Bước 4: Xử lý tiền máy thông qua việc nhập thông tin vào phiếu tiền máy Buớc 5: Gửi phiếu tiền máy cho lãnh đạo phòng duyệt 51 Bước 6: Chỉnh sửa lại phiếu tiền máy Bước 7: Nhập thông tin trên phiếu tiền máy vào CSDL Bước 8: Chuyển bài toàn vãn lên server Bước 9: Tạo đường link giữa biểu ghi và file toàn văn. cvv20ỉj009_cvv20ỉs0ỉ2009072 Trong CSDL STD tên file lưu được đặt như sau: Giải thích: CVvlOl là số ký hiệu của tạp chí Nông nghiệp và phát triển nông thôn SOI: Số 1 2009; Năm phát hành của tạp chí 72: Số trang của tên bài trích Các công cụ dùng cho công tác biên mục gồm có Khung Đề mục Quốc gia và Bảng Từ khoá có kiểm soát đo Trung tâm biên soạn. Thông tin trước khi nhập vào CSDL được điền vào các ừường trong phiểu tiền máy (Xem phụ lục 1). Một biểu ghi trong CSDL STD sau khi được phát hành lên mạng có cấu trúc như sau: you dro hCf9i: pếTì Chi đA rnt^c I - CciCỉt enl ‘ PhAm THt ỉi<« Tư: rhH íxitíog kỉtKtyẶii; ^ 1« Cỉit T^H ỉ iiny ::...: .. f*hAA cỉcfi đ o d ^ tig ílt truyi^n C(ia 90 ^ldi>9 lúa niA* twii tr trtriH ìỊi Qcn vlQti p h ắ t tri^ r* oủn^ tKỉDn d&HQ b4i»y «o»iQ c I^íđrvg đia phưdỉi<| } ỏ m t ^ t kíỉiIẠm kho ♦tKi^NQc;, í:vv « 1 1 52 H. 2.8: Cẩu trúc biểu ghi trong CSDL STD sau khi được phát hành ỉên mạng Trong công tác biên mục cho CSDL toàn văn nói chung và CSDL STD nói riêng, liên kết giữa biểu ghi và địa chỉ lưu fíle toàn văn đóng vai trò rất quan trọng, nó quyét định khả năng truy cập đến file toàn văn trong CSDL. Tuy nhiên, trong CSDL STD đã xuất hiện những lồi liên kết dẫn đến tình trạng không thể ừuy cập đến file toàn văn. Nguyên nhân của hiện tượng ưên được xác định là do quá trình trao đổi dữ liệu giữa bộ phận xử lý và bộ phận quản lý CSDL (bộ phận Tin học). Do vậy, để khắc phục hiện tượng trên cần có một cơ chế trao đổi thông tin khoa học giữa bộ phận biên mục với các bộ phận khác. Xđv d ư m CSDL KONC KQNC là CSDL được xây dựng ưr ỉchá sớm trên phần mềm CDS/ISIS và được khai thác trực tuyến qua WebISIS. Quy trình biên mục cho CSDL này cũng được tiến hành gần giống với CSDL STD. Các biểu ghi được mô tả trên phiếu tiền máy trước khi nhập máy, bao gồm các trường; Phân loại Mã số đề tài Thời gian bắt đầu Số đăng ký Thời gian kết tìhúc Tên báo cáo Bảo mật thông tin Cơ quan chủ írỉ Vật mang tin Cơ quan chủ quản Mã ngôn ngữ tiếng Việt Cấp quản lý đề tài Dạng tài liệu Cơ quan quản lý đề tài Tóm tắt Chủ nhiệm đề tài Từ khoá Cán bộ phối hợp Nơi lưu trữ Đề mục Thông qua việc khảo sát một số biểu ghi trong CSDL KQNC cho thấy, có hai vấn đề còn tồn tại frong CSDL này là sự thống nhất írong mô tả một số trường (trường Cơ quan chủ trì đề tài và trường Cơ quan quản lý đề tài) và kỹ thuật xử ỉý 53 nội dung (xử lý bài tóm tắt cho đề tài). Trường hơp thứ nhất: Xuất hiện sự thiếu thống nhất trong cách mô tả tên cơ quan chủ trì. Thỉ dụ: Khi tiến hành tìm kiểm các đề tài nghiên cửu theo tên cơ quan chủ trì với vần chữ cái T thấy xuất hiện; + 4 cơ quan có cùng tên; TLĐLĐVN, Viện NC KHKT BHLĐ (Tổng Liên đoàn Lao động Việt Nam, Viện Nghiên cứu Khoa học Kỹ tìiuật Bảo hộ lao động) + 1 tên; TLĐLĐVN, Viện NC KHKH BHLĐ + 1 tên: Thanh tra Nhà nước, 218 Ba Đình, Hà Nội + 1 tên; Thanh tra Nhà nước, 218C Đội cấn, Hà Nội + 1 tên; Thanh tra Nhà nước, 218C Đội cẩn, Hà Nội, 8325056; 8325885... Trường hơp thử hai: Trong trường tóm tắt, nhiều biểu ghi có bài tóm tắt không phản ánh được tính khách quan của tài liệu Vỉdụ\ Đề tài nghiên cứu mã số: 97-0043 - Việc giải quyết khiếu nại của công dân trong hệ thống các cơ quan hành chính Nhà nước sau khi tòa án hành chinh được thành lập Nội dung bài tóm tắt được trích toàn văn nhự sau: "Đây là công trình khoa học có nội dung và phạm vi nghiên cứu rộng, được tiến hành nghiêm túc, công phu và chất ỉượìĩg. Kết qíiả nghiên cứu đã thực hiện tốt mục tiêu Vđ yéu cầu đặt ra về nội dung và chất lượng, phương pháp tổ chức nghiên cứu. thời gian và hiệu quả. Sử dụng kinh phí: Đề tài đã nêu lên được quá ừinh hình thành và hoàn thiện quyền khiếu nại của cóng dần và các chế định bảo đảm quỵền khiếu nại. Vai trò của các cơ quan hành chỉnh Nhà nừởc, các tổ chức thanh tra Nhà nước trong việc giải quyết các khiếu nại hành chỉnh khi Tòa án nhân dãn xét xử các vụ kiện hành chính, thực trạng tình hình khiếu nại và giải quyết khiếu nại trong các năm qua, tồn tại, nguyên nhân và giải pháp; Phương hưởng sửa đổi bổ sung pháp lệnh khiếu nại của công dân và đưa ra một số các kiến nghị khoa học khác ” Hay trong đề tài có mã số: 2000-277 - Kháo sát, đánh giá vai trò lãnh đạo tồ chức Đảng và cán bộ chủ chốt các cấp trong việc thực hiện nghị quyết Trung ương 54 4 (khóa 7) vể chỉnh sách dân số - KHHGĐ ở nước ta Nội dung bài tóm tắt như sau: "Để íài đã đánh giá đủng hiện trạng vai trò ỉãnh đạo của Đảng vả cán bộ chù chốt trong việc thực hiện nghị quyết Trung ương Đảng 4 (khóa 7) về chính sách dân sổ - KHHGĐ. Đánh giá được những tiến bộ, nguyên nhần, hạn chế, đồng thời đề ra được một số giải pháp có tỉnh khả thi nhằm tăng cường sự lãnh đạo, chỉ đạo tiếp tục thực hiện công tác dân số theo mục tiêu đề ra ”... Nội dung các bài tóm tắt ưên mang tính chất đánh giá từ phía người xử lý về nội đung tài liệu nên đã vi phạm một trong những quy định quan trọng trong kỹ thuật xử lý bài tóm tắt là đảm bảo tính khách quan. Để khắc phục những hạn chế nêu trên, công tác biên mục cho CSDL này cần được kiểm duyệt chặt chẽ hơn, bên cạnh đó, việc bồi dưỡng cho những cán bộ mới kiến thức về xử lý nội dung là rất cần thiết. Lưu giữ dữ liệu số là một trong những khâu quan trọng quyết định đến sự an toàn và khả năng truy cập đến toàn bộ nội dung nguồn TNS. Do nguồn TNSNS của Trung tâm khá đa dạng về loại hình và có khối lượng lớn nên công tác lưu giữ cũng phức tạp, đòi hỏi nhiều thiết bị lưu giữ đồng thời và những phương pháp khoa học. - Các phương tện ỈICU giữ: Hiện tại, nguồn TNSNS của Trung tâm được lưu giữ trên các phuơng tiện chính đó là ổ đĩa cứng di động, ổ cứng gắn trên các server và đĩa CD-ROM. Các CSDL đều được lưu giữ trên 1 hoặc 2 server riêng với cấu hình và dung lượng phù hợp ( xem phụ lục 2). Các phim khoa học sau khi được ghi lại sẽ được lưu giữ trong các ổ cứng đi động, các ổ này thường có dung lượng từ 1 đến 2 TB. CSDL toàn văn KQNC được lưu giữ trên một ổ cứng riêng và chỉ phục vụ tại chỗ theo yêu cầu. Năm 2009, cùng với việc đầu tư mua máy APT BookScan 1200, Trung tâm đã đầu tư thêm hai máy chủ IBM cấu hình mạnh vớỉ dung lượng dĩa cứng 12 TB để đáp ứng yêu cầu lưu giữ và xử iý nhanh các file ảnh sau khi số hoá. Đa phần các server lưu dữ liệu là những thiết bị có thương hiệu như IBM, Hp, 55 D ell,... nên tuổi tíiọ khá cao, ít có nguy cơ hỏng hóc. - Phương thức lưu g iữ : Phương thức tiến hành lưu giữ TNS được thực hiện theo các hình thức khác nhau, tuỳ thuộc vào phần mềm và đặc trưng của các CSDL. Tựu chung lại có thể chia làm hai hình thức chủ yếu là lưu giữ trực tiếp và gián tiếp; + Phương ứiức lưu giữ trực tiếp được tiến hành từ những máy trạm, theo phương thức này, cán bộ xử lý thông tin cho các CSDL được cấp các acount riêng, từ những acount này, người xử lý thông tin có thể trực tiếp upload dữ liệu lên server sau khi đã được kiểm duyệt và chinh sửa lại mà không cần chuyển dữ liệu cho bộ phận phụ trách tin học. Hiện nay» đa số CSDL của Trung tâm được lưu giữ theo phương thức này. + Phương thức lưu giữ gián tiếp được tiến hành bởi cán bộ phụ trách tin học, theo phương thức này, sau khi xử lý và hiệu chỉnh đữ liệu cán bộ xử lý chuyển dữ liệu cho cán bộ phụ ừách tin học (trong phạm vi quản lý CSDL) để upload vào máy chủ. Phương thức này được tiến hành chủ yếu đối với các CSDL đang sử dụng phần mềm CDS/ISIS như CSDL KQNC, đữ liệu hồi cố cho CSDL Sách,... + Ngoài ra, đối với dữ ỉiệu được lưu giữ dưới dạng CD-ROM (các phim khoa học, nội dung kết quả nghiên cứu,,..) phương thức lưu giữ được thực hiện một cách trực tiếp. Vì dữ liệu dạng này không lưu giữ ứên server nên đưực lưu giữ trên các máy trạm hay ổ cứng đi động sau đó ghi ra đĩa CD-ROM với khối lượng bản tuỳ thuộc vào nhu cầu của NDT. - Cơ chế sao ỉưu giữ liệu : Cơ chế sao lưu dữ liệu cũng được thực hiện đối với toàn bộ các CSDL TNS. Hiện nay, toàn bộ CSDL của Trung tâm đều được sao lưu từ 1 đến 2 bản. Các bản sao liru hầu hết được thực hiện trên đĩa cứng để đề phòng các trường hợp hỏng hóc thiết bị hay CSDL. Trong khi xây dựng các CSDL, quá trình trao đổi và lưu dừ liệu số vẫn tồn tại một vấn đề lớn cần được giải quyết đó là hiện tượng dữ liệu bị thất lạc và bị mất. Hiện tượng này sảy ra đối với cả phưcmg thức lưu giữ trực tiếp và gián tiếp (trường hợp sảy ra đối với CSDL STD là một ví dụ cụ thể). Để tìm hiểu nguyên nhân và 56 cách khắc phục hiện tượng này, chúng ta sẽ xem xét trường hợp CSDL STD thông qua quy trình trao đổi dữ liệu giữa các bộ phận tham gia xây dựng CSDL này từ khi dữ liệu số được tạo lập đến khi được upload vào server phục vụ khai thác : Trong quá trình xây dựng CSDL STD, dây truyền trao đổi dữ liệu số được ứiể hiện theo sơ đồ sau: Server 3 H. 2.9: Sơ đè đường đi cùa tài liệu sau khi được sể hoá Giải thích: + Server 1: Lưu các fíle ảnh sau khi scan + Server 2; Lưu các file ảnh đã được chỉnh sửa và chuyển đổi thành íìle đạng pdf. + Client: Máy trạm nhận tài liệu dạng pdf từ server 2 xử lý và chuyển đến Server 3 + Server 3: Lưu giữ toàn bộ CSDL phục vụ khai thác Thông qua việc tìm hiểu phương pháp giao - nhận đữ ỉiệu cho thấy, đữ liệu được ưao đổi chủ yếu thông qua phương tiện là ổ lưu dữ liệu và USB. Phương pháp này rất thủ công và không thuận tiện, đồng thời dễ sảy ra hiện tượng mất dữ liệu 57 hay nguy cơ bị vi rút tấn công toàn bộ CSDL. (Trưòíng hợp gần 1/3 số bài toàn văn ciiối năiíi 2008 và dấu nãni 2009 khô ng tlìê kcl nối dirực h'i một vi dụ minh hoạ). Do vậy. quy trình này cần dư ợc ihict kế lại cho phù hợp. T r o n c c hư ơ n g 3 cùa luận văn. tác ^iá sc trình bàv chi tiết inô hình ciíip tối ưu hoá quá Irinh trao dỏi và lưu 2Ìừ dừ liệu số từ khi đưọ c số hoá dổn khi dược úii lên servcr pliục vụ khai Ihác. 2.2.4. Tố chức khai thát ivguồn tài nguyên số nội sinh Truim lâin I T K i l & C N Q G là dưn \ ị di dàu Iroim lĩnh v ực cLiiiụ cấp TNS. licn cạnh n s u ồ n T N S bổ s u n ạ từ ben nạoài. mỗi nãm có lìànu Irảm Iiuhìn bicu slìi số hoá nội sinh dư ợc bỏ s u n s vào n au ồn 'TNS cùa 'i r un a tàin. 1 heo dó, các dịch vụ ciinu cấp i N S cMĨnạ dược phát tricn khỏns; ngừnỉỊ. Hiện nay. ' ĩ r u n e tâni đ an c áp dụnt: nhiều hình ihức cu n g cấp lài liệu nhưim tựu chiinụ lại. có ba hình thức cuníỊ cấp chu \ếii là CUIIÚ cấp trực luvến từ xa. c u n a cấp tại chồ và CUIIÍỊ cấp trọn ụói tới tồ cluk . đưn vị sứ d ụ n ẹ thônu lin. - Hình thức ca n ẹ cắp từ xa: Hiện lại hình thức ciinsi cẩp thỏim lin từ xa ớ T ru no tâm dưực chia làm hai phirơnỉ2 thức chính là tru\ cập lừ xa miền phí vù có Irá phí lliện nay. hầu hết niíuồn TNSNS cùa Triina tílni dều cho phép truv cập từ \ a iniồn p]ií (Irừ CSDI s T I ) ) \(Vi dịiì cl)i ini\ rf)p hiiịv \\\\A\ A isi;i.LM)\ ,\n \iVi lỉiiU) diC'n nh ư hình dưới dây; (i. Các hình thúc cunỊỊ cấp T SS tại Trunỵ tâm ...... IHĨỊỊÃWim THllVIỆH r z Ỵ i ỷ.y ỳ: 33 K.M Mấ>r-A-T.iá V - ? íi H. 2. ÌO: G iao diện ỉiìạní> Visía cho N D T 58 a Bên cạnh hình thức truy cập từ xa miễn phí, CSDL STD được cung cấp thông qua tài khoản truy cập cá nhân cùng với một số CSDL bổ sung bên ngoài như ScienceDirect, Isiknovvledge, Springerlink, proquest Central, Ebrary,.... Đây là CSDL nội sinh duy nhất của Trung tâm được cung cấp dưới hình thức trả phí với địa chỉ: http://db.vista.gov.vn/ - Hình thức cung cấp tại chỗ Hình thức cung cấp thông tin tại chỗ được áp dụng tại Tning tâm từ nhiều năm nay, đặc biệt khí nhu cầu sử dụng TLS ngày một cao thì phương thức cung cấp tại chỗ đối với tài liệu truyền thống được chuyển dần sang TLS. Hình thức cung cấp thông tin này cũng được chia làm hai phương thức đó là cung cấp theo yêu cầu và cưng cấp điểm truy cập miễn phí. Đối với một số NDT cỏ nhu cầu tự mình tìm kiém thông tin, Trung tâm sẽ cung cấp các điểm truy cập miễn phí tại khu vực tra cứu tài liệu điện tử (tầng 1, Nhà 24 Lỷ Thường Kiệt - Hà Nội). Tại đây, NDT có thể ữuy cập vào mọi nguồn tin mà Trung tâm có. Đối với NDT có nhu cầu được cung cấp và bao gói thông tin từ các dịch vụ cung cấp thông tin theo yêu cầu, Trung tâm cũng đáp ứng dưới mọi hình thức thông qua bộ phận cung cấp tài liệu điện tử, Thông qua bộ phận này, NDT có thể gửi các yêu cầu tin tới bộ phận cung cấp và nhận lại thông tin ứieo đúng diện yêu cầu về nội đung, hình thức, thời gian..... Phương thức này tỏ ra rất hiệu quả khi mà NDT có nhu cầu cung cấp thông tin theo chủ đề với khối lượng lớn hay từ nhiều nguồn khác nhau trong Thư viện. Phương thức cung cấp thông tin theo yêu cầu cũng được thực hiện dưới nhiều dạng khác nhau, tiêu biểu là: + Cung cấp bản sao tài liệu gốc (Theo bài, theo phần và toàn b ộ ) + Cung cấp toàn bộ hoặc một phần CSDL (Dưới dạng file điện tử hoặc CD- ROM) + Cung cấp các bài trích, phần, chương của tài liệu dưới dạng điện tử Đom giá cho các hình thức cung cấp tài liệu cũng cỏ sự khác biệt giữa dạng tài liệu và nội dung tài liệu, cụ thể là; 59 + Đơn giá cung cấp tài liệu dạng số từ mức 500 đến 1000 đ/ ữang + Đơn giá cung cấp các tài liệu dưới dạng đĩa CD cũng khác nhau từ 10 nghìn đến 500 nghìn đồng một đĩa, tuỳ theo nội dung thông tin chứa trong đĩa + Đơn giá cung cấp CSDL hoặc một phần CSDL cũng được xây dựng dựa trên những chi phí xây dựng và bảo trì CSDL. - Hình thức cung cấp íhóng tin trọn gói tới từng địa phương Hình thức này được triển khai bởi dự án "Tăng cường cung cấp thông tin KHCNphục vụ phát triển kỉnh tế - xã hội vùng sâu, vừng xa" do TS. Tạ Bá Hưng chủ trì. Dự án này được triển khai năm 2002 tại Ninh Bình và được nhân rộng ra nhiều địa phưong thuộc các tỉnh Miền núi phía Bắc. Đến nay, dự án này đã chuyển thành mô hình cung cấp thông tin KH&CN phụ vụ phát triển kinh tế - xã hội nông thôn, miền núi. Tính đến tháng 6 năm 2009, mô hình này đã cimg cấp thông tin tới 34 tỉnh trong cả nước với khoảng gần 200 cơ sở. Cùng với Dự án này, mỗi đơn vị thuộc diện cung cấp thông tin của đự án được trang bị cả về thiết bị, thông tin, nhân lực và tổ chức để vận hành hệ thống thông tin được cung cấp. + v ề thiết b ị : Trang bị cho các đơn vị những thiết bị, công nghệ thông tin hiện đại bao gồm (01 bộ máy tính, máy in, máy photocopy, máy ảnh số, tivi, đầu đọc VCD/DVD và máy sao đĩa VCD/DVD) + v ề nhân lực : Đào tạo cho mỗi đơn vị 02 cán bộ có kỹ năng sử dụng các trang thiết bị, công nghệ để quản lý và khai thác thông tin. + v ề ứiông tin : Tạo lập, xử lý, bao gói và cung cấp ứiông tin (thư viện điện tử với trên 52.500 tài liệu, 320 phim khoa học công nghệ, 1053 tiêu chuẩn,1824 két quả nghiên cứu, 636 dự án ,.,,); Xây dựng dòng tin từ dưới lên (gồm bản tin KH&CN và trang web địa phương) ; Xây dựng và chuyển giao quy chế, quy định, bản hướng dẫn vận hành mô hình,... + v ề tổ chức ; Xây dựng ở mỗi đơn vị một Điểm nút (Trung tâm) khai thác và cung cấp ứiông tin. Mô hình này được xem là hình thức cung cấp thông tin hiệu quả phục vụ chương trình phát triển kính tế - xã hội vùng nông thôn và miền núi. Nhờ có mô hình này mà nhiều hộ dân, doanh nghiệp tại địa phương có cơ hội tìm kiếm những 60 cách làm ăn mới, quá bá sản phẩm trên mạng đenm lại hiệu quả kinh tế cao. Tuy nhiên, việc nhân rộng mô hình này vẫn còn phụ thuộc nhiều vào chính sách của từng địa phương nơi tiếp nhận dự án. Hiệu quả hoạt động của một hệ điống cung cấp thông tin không chỉ phụ thuộc vào nguồn lực thông tin mà đơn vị nắm giữ. Thiết bị hỗ ữợ khai thác đóng vai ừò rất quan trọng giúp cho quá trình khai thác diễn ra hiệu quả, tiết kiệm tíiời gian và chi phí. Thiết bị hỗ trợ khai thác thông tin số gồm nhiều loại, trong đó quan trọng nhất là hệ thống đường truyền, server và các máy trạm. Sự thiếu đồng bộ giữa các thiết bị trong hệ thống sẽ ảnh hưởng rất lớn đến hiệu quả khai thác thông tin. Trung tâm TTKH&CNQG là một ừong những đơn vị đi đầu ừong việc ứng dụng CNTT vào hoạt động và cũng là đơn vị được Nhà nước quan tâm đầu tư do vậy các điều kiện về thiết bị và hạ tầng phục vụ khai thác thông tin được đảm bảo khá tốt, bao gồm: + Hệ thống đường truyền cáp quang tổc độ cao trên 40 Mbs kết nối với mạng VINAREN cho phép phục vụ đồng thời một khối lượng lớn NDT trong và ngoài lãnh thổ Việt Nam. + Mạng nội bộ tốc độ 100 Mbs cho phép kết nối, chia sẻ thông tin nhanh chóng + Hệ thống server (trên 10 chiếc) với cấu hình mạnh và dung lượng lớn được sử đụng cho từng CSDL riêng là những ỉdho lưu giữ nguồn tài ngyên số cho phép lưu giữ các CSDL lớn, phục vụ khai thác lâu dài. + Hệ thống máy tính với hcm 20 máy có cấu hỉnh ưr Pentium IV trở lên, đây là những máy trạm phục vụ hiệu quả cho việc khai thác thông tin tại chỗ + Máy in tốc độ cao đáp ứng nhu cầu phục vụ TLS dưới dạng truyền thống + Mạng Vista với khả năng liên kết mạnh đảm bảo các liên kết trong và ngoài c. Giao diện tìm tin mạng. Toàn bộ CSDL của Trung tâm đều được thiết kế trên các phần mềm ứiư viện - thông tin, có giao diện đcm giản và thân thiện đồng thời cho phép thiết lập các phương thức tìm kiếm íinh hoạt và có trợ giúp. Dưới đây là một số giao điện tìm 61 kiếm cơ bản: w 11»%« 6mgt f;n.\'i?<- >.:.y*:.y-i-3 ti' ĩC-.iM
';.;
. j r r •-}r ...>‘. i '
Cf:í»:- V- M V •i^OPi-.;:;
■:Jí.-ír‘-íí Kco-I-. ■■■'SK'' rv. H. 2 .1 1: G iao diện lìm kiếm (km í^ián trên ph ầ n mềm Lihoỉ ,5.5 /«tww ”0^*>C Ww4fwNif»ei09W(< ifi»r(»ainf^»ftt8íwnv’^>>*"Ị4i V i--.- r« IJỈ .«A \„JU, r-.v* «£ ■■ỵýi-Jí\'t'■ fỊjịặ^ ^ «ạg>ậ>iie y b p i 0 'ứxẩúỂ vòp) ưi!i9íik'ij( TriR^ H. 2. ì 2: G iao diện ùm kiếm nâììi’ cao trên p h ầ n m ềm L ibol 5.5 62 Ỉ^fữỉ-- (ĐUạ
■ -'p?ậ.- , fMắh. ■ 1i5W í ■ i'ÍÌÌÌỊỊS i-l^ ílt^ ỊỊIT ịạ râ ọ !!
»S ỊỊfT ỊỈlT O f« , ị ử dìr Ì :ĩ) m w - iw j
1 MM
ị
1QF7 Ị
1ÍW ' 19S
1 9 «
1351 * 1..,::___ __ _____ ]
’ 63 *«• •; íâ; "Hu ' ệtH ẹềt-TẤX |!^UrẸẸH.jìgS 'pẹ-CĩÔlH^ĨPCiGBCậ- TCTỆ-ITNẠIMI fc#r :___________________________________________________________
I
inyl^Nem truứrịị MÌ Ir/ » ' ã: tr T ùn^i [ 2 Q W | H * i i * j í i i j \ ; ] r amKMtrrrnjiqMW ia m / ủ n c o l n T tn ™
l.Đ íH m ií-ín h ic -c c ư n EJ,f-i3v íjttííT ia r v a s S c w p . ỤO: nmđh H(nr»a líunu v * a a C * th 5 y a 5 ; 'ú S l i i l t '
2 ,S ú d ư T g (^ l:a a n W W D lT .-iậ rO K Ii.e i(x C 'k ftlC trifln ữ í ts n ii ƠIJ ch|rfi)iiJt r ti a lí« : q u í.
t t j ’ T tiớ n i) t ín ’ *fJD •ữT ư . t ^ r V eầơ-tCin ktìc o u í IỦ3 b tf u ln ícứ ryj d u n a 0 3 0 QtiỊ^2i:ữ ‘& /jr^ ĩlr,-'ti ‘t f u : v l 4 r i ': b . ■tnđng tln ' OR 'triư » l< n n ctia ra K « < _
H i Ũm ' LỈ It^ D^arr^ ■ ■ ..a H . 2. ỉ 3 : G i a o d i ệ n í h n k i ế m c ơ b á n Ị r ê ỉ ì p h ầ n m ề m Z o p e ỉ > .
ị TuA - lim •• .-PKifc - ^ Ị B ^ Ì T»Ịmirt«JỊ^ÍỊ^1
mTtÕMio: najrpt rôá
M^TÌOMụ: □EMTR râá Ic Uf> Tg>t>t000Ì3Ì>i. ữró»*wncM; WAJCC»T>
ồ»
ồy> fỉtW 9Ể‘^T A l U C IT KHOA HQ£^ e TOĨ!^^^ĩíRỈ®mwõÃĩ«cv!rõ355??^iSõ^ r\ifnữệi
m m c w , c g f f m ^ k 3CHWIJP1C wTeoiPW oèoqD c>N Lr--------- ----- • i ta m ■■'**'.. rvl ^nh I>*r
Inh vẠtr i.WÕ"Ị^ rtlnh >-»c-
' ■ y
Ị/WD 'í’ T i nJm : -------------------------------------------1 TV HMá
__
Ịnci Aìhb
rãũM i*ÌOéri r>SmỊVror ' • ' .............- '
I Ị ỡ ^ tííiã iiiậ ũ
•'
dm .Qễn } TTm ffrn ííLVì................. / / . 2 . 1 4 : G i a o d i ệ n l ì n i k i ể m n â n ^ c a o I r è n p h o n m ề m y .o p e ỏ.’ >jwríữtcíi __ j>Vc'- | | 0 K i t q i â t r < n í ^ Ị j 'ù áf Si’’ © TRUMG TAM THOUO TIw KHOA H gc VA O0WG MGHỆ QUOC QŨLA
KfcTDOH MACim -■ r"». Iii.tt I I. I . Khần Im l I í i i BMt ca 1 hoc 3Ề h»fa n iâ ■ Qĩ T l U t h a :
ữĩ Ut^ n]r. CA: tfca hủi: l>rh ạỵ
Q< >11 hổi h jĩ i«|WCwC<3r l» ẽ lĩa ủ fu ^ ụ -: K Ẽ I ^ W Ắ cnữtl^ , ỉ y
\ĩom(, ir ì Ị. 2. 15: G i a o d i ệ n t ìm k i ế m t r o n g C S D L K Ọ N C ( h e o p h ư ơ n g p h á p d u y ệ t đ ể m ụ c ĩ r ê n p h ầ n m é m Z o p c lln Q - « o i » ụ IH O II ( l o i intPi í>c>- Ũ Ti I thức Và p h it ti >61) Tõn9 liiỹn Khoa học V9 Cvrig It^h? KhOđ hoc Còno n g h ị MÒI tiương Mòi liưưttg vi phểl lĩỉííii Uán VI>>«9 ^ " ■ g4t ^ . ỹ S 5 V i , t N , m I n f , W í r . N e w ! l c « í r Thóno Un lư tt#u H ộ i n g h ị l ẽ n ^ h v V I v e t ự d ộ n p h õ « ( V I C A «!>): r h ò n g bà O K H p * h ọ c U^uụ.
,ỉ;ỉỊíi\*^ ,ir^‘í H . 2. l ố : G i a o d i ệ n t ìm k i ế m t h e o p h t r ơ n g p h á p í i u y ệ í í r ự c t i ế p c á c b a n t in d i ệ n í i f I r é n p h a n m ề m Z o p e 64 gmSSSMí&BỂữ . ■ r »* rrt tt»ng Ciuptf» TPu^t imh Tàl liệu Kỹ thuật
Nông nghiệp tim kiềm • V- - .?ỉ -iiĩĩi N ' ĩ Sì tỉV^ịv' l .. IIVI.K ^.1 . • \:yj\ ' //. 2. / 7; G/oo c//ệ/7 ///?; kìểni của phần mèm Cìreenstone gim^^yymg Trk--ìg Ou BB tỉKiỉC trtt Tài liệu K ỹ thuật
Nông nghiệp dỗ mục l i l i . l ui 'JV(
ãK-ãvnọítạu
• 'riit; - •: .V ỉT.-tĩ Aiii r.Ki:Ị .ÍM ■il'-!;....... ..■.•..IV
0-^u :u.r^ - • cH !>í«:
.iÃK" đ«i-fn ị
•/ <:íií.-7ựs.? • .
fĩi'»íi : w l ị .Vií.v ~ J ĩ>ộ<‘ ị^:ứ'~Ị • HircKỉ jâ íỉ
“
" j r i í u IS 2 Ị-Ĩ-;:;- J ) i . . c ụ «--•.S.;W'ứ.iỸ '•ìtv 1 ỈXiu \aith • Trvnẹ \r,!i -.V ^.J»’ i-ldỉ •
" ' ÍV.ỈU - Kí WmH ìtiĩĩỊ Aku v« r- •• to.' .'r;..;;!- • ■ Oi i ^.v.^ • 1'^;. t‘. ì;ì :i;i ^VI' i !..>• N cV J-t Í5X:.J H. 2. ỈH: Giao diện tìm kiểm íheo đế m uc cỏ cẫii írúc hình cây trèìì phần mèm G reenstone 65 . ■ a i a P B M Các hình minh hoạ trên cho thấy, tất cả các CSDL phục vụ khai thác nguồn TNSNS của Trung tâm đều cho phép hỗ trợ tìm kiếm thông tin theo hai phương thức !à tìm tin đơn giản và tìm tin có kết hợp các toán tử. Hầu hết các CSDL đều được tích hợp sẵn các toán tử AND, OR và NOT ưên giao diện, cho phép NDT có thể tìm kiểm thông tin kết hợp trên một hoặc nhiều trường đồng thời. Các CSDL nguồn TNSNS của Trung tâm được xây đựng với nhiều điểm truy cập khác nhau cho phép NDT truy cập đến tài liệu theo một hoặc một số trường két hợp như; Từ khoá Nhan đề Tác giả Đề mục ISBN, ISSN Ký hiệu kho mở Địa chỉ nguồn ừích Năm xuất bản, nhà xuất bản, ngôn ngữ,... Đối với một số CSDL như KQNC, Tài liệu kỹ thuật nông nghiệp, các bản tin điện tử,.. .giao diện tìm kiếm của phần mềm cho phép tìm kiếm duyệt trực tiếp Thí dụ: CSDL KQNC cho phép duyệt theo vần chữ cái của chủ nhiệm đề tài, cơ quan chù trì; theo đề mục các chuyên ngành hay các bản tin điện tử cho phép duyệt theo tên các bản tin, theo năm và số của các bản tin,.... Với cấu trúc cây, phương pháp tìm kiếm duyệt trực tiếp đang tỏ ra khá thân thiện và hiệu quả đối với NDT. Để giúp NDT có ứiể tiếp cận và khai thác hiệu quả thông tin trong các CSDL của mình, Trung tâm đã biên soạn những tài ỉỉệu hướng dẫn tìm tin cụ thể và tích hợp sẵn trên giao diện tìm kiếm của từng CSDL. Thông qua quá trình khảo sát các các bộ sưu tập trên mạng Vista, phỏng vấn trực tiếp NDT và cán bộ công tác tại Trung tâm cho tíiấy, hiện tại vẫn còn nhiều điểm chưa hợp lý xuất hiện khi khai thác nguồn TNSNS như sau; Thứ nhất Tổ chức các bộ sưu tập còn phân tán, phức tạp và chồng chéo Thí dụ: Khi truy cập vào bản tin nông thôn, có 3 cách có thể truy cập như sau: Cách 1: Từ trang Vista, truy cập vào biểu tượng CSDL CSDL toàn văn —í- Bản 66 tin điện tử sau đó truy cập vào từng năm của bản tin. Cách 2: Từ trang Vista, truy cập vào biểu tượng Thư viện Khoa học Kỹ ứiuật —> Tra cứu — Bản tin điện tử ^ Bản tin nông thôn Cách 3: Từ trang Vista, ưuy cập vào biểu tượng KHCN địa phuomig -> Thư viện vid€0 —> Bản tin nông thôn Trong ba cách ữên, thực ra chỉ có thể tra cứu thông qua cách 1 là có khả năng tiếp cận được bản tin này (một cách đầy đủ tương đối), còn cách 2 chỉ truy cập được bản tin nông thôn năm 2006 và cách 3 thường không truy cập được. Việc sáp xếp không rố ràng dẫn đến tình trạng Ichi truy cập vào mạng Vista, NDT sẽ phải đặt ra câu hỏi “nên truy cập vào biểu tượng nào ” ( giữa hai biểu tượng Cơ sở dữ liệu và Thư viện Khoa học Kỹ thuật) để có thể khai thác được toàn bộ nguồn tin mà Trung tâm có. Nếu NDT truy cập vào phần tra cứu ừong Thư viện Khoa học Kỹ thuật, sẽ có 7 biểu tượng xuất hiện gồm: + Sách tại Thư viện KHỈCT TW + Tạp chí tại Thư viện KHKT TW + Báo cáo kết quả NC + Tài liệu KHCN trong nước + Tài liệu KHCN nước ngoài + Bản tin điện tử + Tra cứu liên thư viện Trong các mục trên, có 2 mục là Báo cáo kết quả NC và Bản tin điện tử là không truy cập được, 5 mục còn lại cho ra kết quả giống nhau đó là giao điện tra cứu CSDL Sách và tạp chí ưên phần mềm Libol. Thứ hai'. Phần mềm hỗ ữợ tìm tin chưa đáp ứng được yêu cầu thể hiện ở chỗ: - Kết quả tìm tin thiếu chính xác (kể cả ưong tìm kiếm cơ bản và nâng cao), một số trường hợp không thể tìm được thuật ngữ chính xác ngay cả khi đâ sử dụng dấu ngoặc kép (đối với một sổ CSDL có yêu cầu sử dụng dấu này cho việc tìm chính xác thuật ngữ). Thỉ dụ: Khi tìm thuật ngữ “thỏ” trong CSDL STD, két quả cho ra tớí 59.686 biểu ghi gần như ỉchông liên quan tới thuật ngữ này. 67 Hay: Khi tìm tác giả có tên ‘''Ngưyễn Ngọc H ợ r trong CSDL STD, kết quả đưa ra gồm các tác giả ""Nguyễn Ngọc Hợi" và “ Nguyễn Ngọc H ồi’' Hoặc: Cũng trong CSDL này, khi tìm tên tác giả “Nguyễn Thị Thanh Hằng” tại trường tác giả, kết quả sẽ cho ra nhiều tác giả khác như Nguyễn Thị Thanh Hưomg, Nguyễn Thị Thanh Hưng, Nguyễn ThỊ Thanh Hường,...còn néu tìm tên tác giả này ở trường bất kỳ thì kết quả chỉ cho ra những biểu ghi có tác giả là “Nguễn Thị Thanh Hằng”. Điều này cho thấy đã xuất hiện một số lỗi trong quá trình tạo lập bảng tra tới CSDL. - Việc sử dụng thuật ngữ tìm chính xác không thống nhất trong toàn bộ hệ thống Thí dụ: Trong CSDL KQNC, NDT không ứiể sử dụng dấu ngoặc kép để tìm thuật ngữ chính xác trong jkhi CSDL STD lại yêu cầu sử dụng dấu này, - Kết quả tìm kiếm không hỗ trợ sắp xếp, hiện thị (dạng rút gọn hay đầy đủ) hoặc export dữ liệu sang các định dạng khác (MS Word, Excel,...) - Giao điện không thuận tiện, không hỗ trợ lưu kết quả tìm ưuớc đó Thí dụ: Trong CSDL KQNC, khi tìm tin cơ bản, NDT muốn trở lại giao diện tìm tin cơ bản vẫn phải sử dụng chức năng “back to” của ừình duyệt néu như không thực hiện thao tác tiếp theo trên những biểu ghi vừa tìm được Hoặc: Trong các CSDL trên phần mềm Líbol, chức năng back to không được hiển thị trên màn hình tìm kiếm mặc dù NDT có thể dùng phím Backscape để quay ngược lại trang trước đó,... Thứ ba: Có nhiều mục tìm kiếm trên trang Vista không kết nối được với dữ liệu (CSDL Thư viện video, Tra cứu liên thư viện, Báo cáo két quả nghiên cứu,.,.) Thứ tư: Không kết nổi được file toàn văn (trưÒTig hợp gần 1/3 file toàn văn trong CSDL STD không kết nối được trong một thời gian dài) hay trong Bản tin Nông thôn đổi mới chỉ có 36 số được tìm ứiấy trong năm 2007, 30 số trong năm 2008 và tính đến đàu tháng 11/2009 bản tin này mới chỉ có 14 số. Những tình ừạng ừên đây 68 cần sớm được khắc phục nhằm đảm bảo chất lưọng cho các CSDL. Như đã ừình bày ở trên, toàn bộ nguồn TNSNS của Trung tâm đều cho phép truy cập miễn phí từ xa, ngoại trừ CSDL STD. STD là một trong những CSDL bài trích toàn văn lớn nhất cả nước, do vậy việc xây dựng và bảo ừì rất tốn kém và mất nhiều công sức. Hơn nữa, việc khai tíiác ồ ạt sẽ tạo ra hiện tượng tắc nghẽn mạng gây ảnh hưởng trực tiếp đến hiệu quả khai thác. Vì thế, Trung tâm tìiực hiện cơ chế quản lý người dùng theo từng tài khoản cá nhân. Trên thực tế, CSDL này gần như miễn phí vì nó được kết hợp với rất nhiều CSDL nước ngoài như Sciencedirect, ISI Knowledge, Ebrary,.... Để có thể khai thác thông tin trong CSDL này NDT cần tham gia vào địch vụ “Bạn đọc đặc biệt” của Trung tâm. Đây là dịch vụ cho phép NDT truy cập toàn bộ CSDL trong nước và nước ngoài có tại Trung tâm từ bất cứ đâu và bất cứ thời gian nào trong ngày. Tuy nhiên, để tham gia vào dịch vụ này, NDT thực hiện một số thủ tục đăng ký và đóng góp một khoản lệ phí nhất định. Khoản lệ phí này sẽ được chi vào việc duy trì và phát triển nguồn thông tin của Trung tâm. - Thủ tục tham gia dịch vụ "Bạn đọc độc biệt” gồm: + Có đơn đề nghị được tham gia dịch vụ bạn đọc đặc biệt (Xem phụ lục 3) + Đơn phải được dán ảnh và có xác nhận của cơ quan - Điều kiện đăng ký dịch vụ: + Là bạn đọc chính thức của Trung tâm + Có trình độ từ Thạc sĩ ưở lên hoặc đang là học viên cao học, nghiên cứu sinh, tiến sĩ + Cam kết tuân thủ quy định về sử dụng dịch vụ bạn đọc đặc biệt + Đóng góp chi phí cho tổ chức thực hiện dịch vụ (300.000đ/năm) - Quyền ỉợỉ và trách nhiệm của NDT khi tham gia dịch vụ: + Có thể khai tiiác nguồn tin điện tử không phụ thuộc thời gian 24/24 giờ, 7 ngày trong tuần + Truy cập nguồn tin điện tử mà không cần đến Trung tâm. Bạn đọc có thể truy cập nguồn tin được phép từ bất kỳ máy tính nào có két nổi mạng Internet, + Chỉ được phép khai thác nguồn tin phục vụ cho giảng dạy, học tập, nghiên 69 cứu khoa học + Không được phép cung cấp tên truy cập và mật khẩu cho người khác sử dụng + Được phép ừuy cập tối đa 5 lần/ngày vào các CSDL + Được tải xuống (dovvnload) tối đa 20 bài toàn văn/1 phiên truy cập. Không được tải dữ liệu một cách có hệ thống và ồ ạt nhàm ĩTiục đích lưu trữ hoặc cung cấp cho bên thử ba + Chịu ừách nhiệm cả nhân (về pháp luật và tài chính) đối với những vi phạm nếu có của mọi lượt truy cập mạng bằng tên và mật khẩu được cấp Theo ghi nhận từ phía NDT, phương thức cung cấp tìiông tin trên đã và đang bộc lộ những điểm bất cập, thể hiện ở hai điểm sau: Thứ nhất. Thủ tục đăng ký dịch vụ vẫn còn phức tạp, để đăng ký dịch vụ, người tham gia phải có đơn kèm theo ảnh và dấu xác nhận của cơ quan công tác,.... Điều này đã và đang gây frở ngại lớn cho NDT. Thử hai: Đối với những NDT không có nhu cầu sử dụng thưòmg xuyên các CSDL nước ngoài hay chì truy cập CSDL STD để tìm tài liệu cho một mục đích trước mắt (làm khoá luận, đề tài,,.) thì việc đầu tư một khoản kiiứk phí để đăng ký địch vụ này là không phù hợp. Những bất cập ứên cho thấy, phưong thức cung cấp thông tin tại Trung tâm cần có những sự điều chỉnh nhất định. 2.2.5. Công tác tuyên truyền, gỉớỉ thiệu nguồn tàỉ nguyên sé nội sinh Công tác tuyên truyền, giới thiệu đóng vai trò quan trọng trong việc quảng bá các sản phẩm và dịch vụ của bẩt cứ một cơ quan, tổ chức hay doanh nghiệp nào. Nguồn TNSNS của Trung tâm là vốn tài sản thông tin quý giá của quốc gia, vì thế cần được tuyên truyền và giới thiệu rộng rãi để phát huy khả năng sử đụng cao nhất. Cùng với sự ra đời của dịch vụ Bạn đọc đặc biệt, từ năm 2008 Trung tâm đã áp dụng phương pháp giới thiệu đến tận người dùng tin thông qua hình thức tổ chức các buổi giới thiệu dịch vụ Bạn đọc đặc biệt tại một số trường đại học, viện nghiên cứu,...Theo kế hoạch này, Trung tâm đã thành lập một nhóm Marketing gồm các chuyên gia có khả năng và kinh nghiệm trong quản lý và khai thác thông tin, nhóm 70 này có nhiệm vụ giới thiệu cho NDT những nguồn thông tĩn trong và ngoài nước hiện có tại Trung tâm đồng thời trình bày những kỹ thuật khai thác các nguồn tin đó. Hình thức này đã mang lại những kết quả đáng khích lệ, sổ lượng NDT ứiam gia dịch vụ “Bạn đọc đặc biệt” đã tăng lên rõ rệt (sổ liệu đã nêu tại mục 1.2). Tuy nhiên, sau một thời gian hoạt động, hình thức giới thiệu trên vẫn tồn tại một số hạn chế, thể hiện ở chỗ; + Chưa thành lập được một đội ngũ marketing thực sự chuyên nghiệp: Đa phần cán bộ tham gia công tác marketing không tíiuộc tổ Marketing nên không thể dành nhiều thời gian cho hoạt động này + Chưa xây dựng được một chương trình và ké hoạch cụ thể: Đối với những cán bộ tham gia, chưa có sự phân công rõ ràng tới từng cá nhân mà hầu hết đều tham gia dưới hình thức huy động tạm thời. Điều này không phát huy được tính chủ động của cán bộ tham gia. + Việc ưiển khai vẫn mang tính cục bộ, chưa được nhân rộng: Mặc dù đã ttiển khai giói thiệu được ở nhiều đơn vị, song vẫn chưa có một kế hoạch mang tính vĩ mô để có thể triển khai theo vùng hay lĩnh vực cần giói thiệu. Từ những tồn tại nêu trên, đòi hỏi Trung tâm cần chú trọng hom nữa công tác marketing và tăng cường thêm các hình thức tuyên truyền giới thiệu nguồn TNSNS 71 tới NDT. Chương 3. GIẢI PHẤP TỐI ư u HOẢ CÔNG TÁC XÂY DựNG VÀ QUẢN LÝ NGUÔN TÀI NGUYÊN s ô NỘI SINH
TẠI TRUNG TÂM 3,1. Đảm bảo tính pháp lý cho nguồn tài ngụỵên số nội sình Để giải quyết vấn đề pháp lý cho công tác số hoá tại Trung tâm như đã trình bày tại mục 2.2.1, cần dựa trên các văn bản hướng dẫn và chính sách của Nhà nước trong lĩnh vực này. Chính sách của Nhà nước về quyền tác giả và những quyền liên quan được quy định tại Điều 8 cùa Luật Sở hữu trí tuệ, trong đó khoản 2 và 3 nêu rõ: + Khuyến khích, íhúc đẩy hoạt động sáng tạo, khai thác tài sản tri tuệ nhằm góp phần phát triển kỉnh tể - xã hội, nâng cao đời sổng vật chất và tinh thần cùa nhân dân. + H ỗ trợ tài chỉnh cho việc nhận chuyển giao, khai thác quyền sở hữu ừ'i tuệ phục vụ ỉợi ích công cộng; khuyến khích tổ chức, cá nhân trong nước và nước ngoài tài trợ cho hoạt động sáng tạo và bảo hộ qưyền sở hữu trí tuệ.[l]. Như vậy, công tác số hoá tài liệu tại Trung tâm có thể tận dụng chính sách này để thực hiện những vấn đề liên quan đến bản quyền cho tài liệu số hoá. Lộ trình và phương pháp tiến hành như sau: Thứ nhất, Vẩn đề mua bản quyền: Trung tâm cần có đơn gửi Bộ Văn hoá - Thông tin đồng thời có công văn gửi Bộ Tài chính, Bộ Kế hoạch và Đầu tư để xin hỗ trợ kinh phí thực hiện bản quyền cho tài liệu số hoá. (Khoản 1 Điều 5 Nghị định 100/2006/NĐ-CP Quy định chi tiết và hướng dẫn thi hành một số điều của Bộ luật Dân sự, Luật Sở hữu trí tuệ về quyền tác giả và quyền Hên quan có hướng dẫn cụ thể “Bộ Văn hõá - Thông tin chủ trì, phối hợp với Bộ Tài chính, Bộ Ke hoạch và Đầu tư và các cơ quan liên quan hưởng dẫn ỉập kế hoạch tài chính (tạo nguồn, quỹ), cơ chế thực hiện việc mua bản quyền ” 72 [9]. Thử hai\ Quy trình thực hiện: Bước 1; Lập đanh mục những tài liệu số hoá kèm theo đơn trình Bộ Văn hoá - Thông tin phê duyệt. Khoản i Điều 5 Nghị định 100/2006/NĐ-CP nêu rõ "Bộ Văn hoả - Thông tin duyệt danh mục tác phẩm thuộc diện hẫ trợ mua bản quyền đối với các cơ quan, tổ chức thuộc trung ương ”[9] Bước 2: Soạn thảo công văn xin hỗ ượ kinh phí gửi Bộ Tài chính, Bộ Kế hoạch và Đầu tư. Bước 3: Xác định các chủ sở hữu cần thương lượng mua bản quyền Chủ sở hữu bản quyền được nêu trong các điều từ 36 đến điều 42 của Luật Sở hữu trí tuệ gồm: + Chủ sở hữu quyền tác giả là tổ chức, cá nhân nắm giữ một, một số hoặc toàn bộ các quyền tài sản quy định tại Điều 20 của Luật Sở hữu trí tuệ (Điều 36) + Chủ sở hữu quyền tác già ià tác giả (Điều 37): Tác giả sử dụng thời gian, tài chính, cơ sở vật chất - kỹ thuật của mình để sáng tạo ra tác phẩm có các quyền nhân thân quy định tại Điều 19 và các quyền tài sản quy định tại Điều 20 của Luật Sở hữu trí tuệ. + Chù sở hữu quyền tác giả là các đồng tác giả (Điều 38): Các đồng tác giả sử dụng thời gian, tài chính, cơ sở vật chất - kỹ thuật của mình để cùng sáng tạo ra tác phẩm có chung các quyền quy định tại Điều 19 và Điều 20 của Luật này đối với tác phẩm đó. Trong đó, các đồng tác giả sáng tạo ra tác phẩm quy định tại khoản 1 Điều này. nếu có phần riêng biệt có thể tách ra sử dụng độc lập mà không làm phưoTng hại đến phần của các đồng tác giả khác thì có các quyền quy định tại Điều 19 và Điều 20 của Luật này đối với phần riêng biệt đó. + Chủ sở hữu quyền tác giả là tổ chức, cá nhân giao nhiệm vụ cho tác giả hoặc giao kết hợp đồng với tác giả (Điều 39): Tổ chức giao nhiệm vụ sáng tạo tác phẩm cho tác giả là người thuộc tổ chức mình là chủ sở hừu các quyền quy định tại Điều 20 và khoản 3 Điều 19 của Luật Sở hữu ừí tuệ, trừ trường hợp có thoả thuận khác. + Tổ chức, cá nhân giao kết hợp đồng với tác giả sáng tạo ra tác phẩm là chủ sở hữu các quyền quy định tại Điều 20 và khoản 3 Điều 19 của Luật Sờ hữu trí tuệ, 73 trừ trường hợp có thoả thuận khác. + Chủ sờ hữu quyền tác giả là người thừa kế (Điều 40): Tổ chức, cá nhân được thừa kế quyền tác giả theo quy định của pháp luật về thừa ké là chủ sở hữu các quyền quy định tại Điều 20 và khoản 3 Điều 19 của Luật này, + Chủ sở hữu quyền tác giả là người được chuyển giao quyền (Điều 41): Tồ chức, cá nhân được chuyển giao một, một số hoặc toàn bộ các quyền quy định tại Điều 20 và khoản 3 Điều 19 của Luật này theo thoả thuận trong hợp đồng là chủ sở hữu quyền tác già. + Chủ sở hữu quyền tác giả là Nhà nước (Điều 42) đối với các trường hợp sau: a) Tác phẩm khuyết danh; b) Tác phẩm còn trong thời hạn bảo hộ mà chủ sờ hữu quyền tác giả chết không có người thừa kế, người thừa kế từ chối nhận di sản hoặc không được quyền hường di sản; c) Tác phẩm được chủ sở hữu quyền tác giả chuyển giao quyền sờ hữu cho Nhà nước. Bước 4 : Xác định mức giá và tiến hành thương lượng với chủ sở hữu Hiện tại, chưa có khung giá cho việc chi trả quyền tác giả, tuy nhiên có thể tham khảo kinh nghiệm ữong nước và nước ngoài để xây dựng khung giá cho vấn đề này, Trong điều kiện hiện nay, việc quan trọng nhất vẫn là thương lượng với tác giả và những cá nhân, tổ chức nắm giữ bản quyền của tài liệu như đã nêu ờ phần trên. Trên thế giới, thông qua tìm hiểu cách làm cùa Google trong vẩn đề chi trà bản quyền cho thấy, tổ chức này thông qua các cơ quan đăng ký bản quyền sách ưên ứiế giới để thu xếp, Google sẽ ửianh toán 63% doanh thu từ những lần sử dụng cho người nắm giữ bản quyền và 60 USD cho việc số hóa mỗi tác phẩm. ở Việt Nam, Công ty cổ phần Tin học Lạc Việt đã áp dụng hình thức chi trả tác quyền cho tác giả thông qua Lễ ký kết hợp đồng tác quyền với Trung tâm Quyền tác giả vãn học Việt Nam được diễn ra sáng 29/7 tại trụ sở Hội Nhà văn Việt Nam. Với dự án số hoá đợt 1 là 3000 đầu sách và theo kể hoạch sẽ đạt 5000 bảti đến hểt năm 2009. 74 Theo ông Hà Thân - Tổng Giám đốc Lạc Việt cho biết: Mô hình thu nhập của
Lạc Việt được tính theo số lần độc giả lấy tài liệu xuống đọc. số tiền tải tác phẩm đó sẽ có giá thành thấp hoTi so với việc mua sách xuất bản vì chỉ tốn tiền băng thông rộng vá in đĩa. Chi phỉ cho giấy mực là 40% írong khi phát hành trên mạng không có phí giấy mực nữa chúng ta có tíiể tiết kiệm được 30%. Việc này cũng sẽ tránh sự tồn kho sách, gây lăng phí như việc sách xuất bản hiện nay. Số tiền được chi trả cho tác giả khi tác phẩm được số hoá là 40% doanh thu từ tác phẩm đó và theo đó, Trung tâm Quyền tác giả văn học Việt Nam cũng sẽ thu được 20% lừ chính các tác phẩm này từ thư viện sách của Lạc Việt. Bà Đoàn Thị Lam Luyến - Giám đốc Trung tâm Quyền tác giả văn học Việt Nam, nếu ở Việt Nam việc quàn lý các tác phẩm số hoá tốt thì các tác giả sẽ được hưởng một khoản thu lớn từ doanh thu các tác phẩm đó. Bên cạnh đó, việc Việt Nam có thêm kênh tra cứu sách trực tuyến sẽ giúp cho cộng đồng người Việt hoặc người nước ngoài quan tâm đến sách Việt Nam. Thông qua kênh này, bạn đọc cỏ thể tra cứu và tải xuống với giá rẻ hơn và tiện ích so với sách in. Những kinh nghiệm trên đây tuy không thể áp dụng nhưng có thể coi là những gợi ý hữu ích cho Trung tâm trong vấn đề này. Theo tác giả, có hai phưomg án để thực hiện việc thanh toán bản quyền cho chủ sở hữu đó là; - Phươn2 án ỉ : Xin hỗ trợ toàn bộ kinh phí chi trả cho chủ sờ hữu từ phía Nhà nước theo hướng dẫn tại Khoản 2 và 3 Điều 8 của Luật Sở hữu trí tuệ. Nếu thực hiện phưong án này, các địch vụ cung cấp trực tuyến tài liệu toàn văn của Trung tâm phải được cung cấp hoàn toàn miễn phí. - Phươm án 2 : Trung tâm chịu một phần kinh phí, Theo phương án này, một phần kinh phí chi trả cho chủ sở hữu sẽ được trích ra từ các dịch vụ cung cấp tài liệu số hoá có trả phí đối với NDT. Như vậy, các địch vụ cung cấp tài liệu toàn văn trực tuyến sẽ tiếp tục được thực hiện theo hỉnh thốc thu phí. Một trong những vấn đề gây khó khăn cho Trung tâm hiện nay là không ứiể thống kê được sổ lần đọc/download cho một bài báo cụ ứiể, do vậy không thể có căn cứ để thực hiện việc chi trả như Công ty c ổ phần Lạc Việt đã làm. Khó khăn thứ hai đổi với Trung tâm là không hạn chế được hiện tượng sao 75 chép ứái phép nội dung. Để giải quyết hai khó khăn trên, giải pháp duy nhất là thay thế phần mềm, vì vậy việc thực hiện phương án này trong điều kiện hiện nay là không thể thực hiện được. Tuy nhiên, trong việc thương lượng với chủ sở hữu tài liệu, có một kinh nghiệm nên được học tập đỏ là hình thức thông báo rộng rãi tới chủ sở hữu như Ban Biên tập Tạp chí Thư viện Việt Nam đã áp dụng đối với các chủ sở hữu có các bài báo đăng trên tạp chí này, sau đây tác giả xin trích toàn văn bản thông báo đăng trên tạp chí Thư viện Việt Nam số 4/2009: "Sững song với việc phát triển nội dung và hình thức của Tạp chỉ, trong khuôn khổ dự ản Mạng Quốc tể về ẩn phẩm Khoa học (INASP) của Anh tài trợ nhằm giúp nâng cao hiểu biểt và sử dụng của bạn đọc về các tạp chỉ khoa học xuất bản tại Việt Nam, thời gian tới Ban Biên tập Tạp chi Thtĩ viện Việt Nam sẽ chính thức đăng tải nội dung Tạp chỉ ìên mạng Internet thông qua ừơng Tạp chí Khoa học Việt Nam trực tuyến (VỈOL)- http://wMrw.vjol.mfor. Việc đăng tải ừực tuyến này sẽ góp phần qnảng bả rộng rãi hem về hoạt động của ngành Thư viện trong vờ ngoài nước. Đồng thời cũng tạo điều kiện cho những ai quan tâm đến nghiệp vụ thư viện được tiếp cận nhanh chỏng những vẩn đề nóng hổi, những kiến thức mới trong hoạt động của ngành Thư viện. Việc đăng tải bài trên mạng sẽ không được trả thêm tiền nhuận bút. Vì thế nếu tác giả nào không muốn đưa bài của mình lên mạng trên xin thông báo cho Ban Biên tập biết ngay khi gửi bài đăng tạp chỉ. Nếu tác giả không có ý kiến gì, Ban Biên tập sẽ tự động đưa các bài viết đó lên mạng. Vậy xin thông báo để cộng tác viên Tạp chí Thư viện Việt Nam được biết! Toà soạn rất mong tiếp tục nhận được sự cộng tác, góp ỷ của đông đảo bạn đọc’’ Hình thức thông báo trên cũng được xem như một dạng “xin phép” giúp xác định và hạn chế được những trường họp cần phải tiến hành thương lượng. Do vậy, 76 hình thức này cần được áp dụng tại Trung tâm trong thời gian tới. 3.2. Đảm bảo nguồn nguyên liệu đầu vào Đảm bảo nguồn nguyên liệu là điều kiện tiên quyết cho việc phát triển nội dung sổ, đặc biệt là những CSDL được xây dựng dựa trên cơ sở số hoá tài liệu truyền thống như STD và KQNC. Trong mục 2.2.1 đã nêu một số tồn tại trong việc cung cấp nguồn thông tin đầu vào cho CSDL STD, nguyên nhân của hiện tượng trên là do: + Nguồn tài liệu bổ sung về (các tạp chí khoa học và tài liệu hội nghị, hội thảo) không được cập nhật đều đặii + Thiếu sự phối hợp giữa các bộ phận tham gia + Cơ chế bổ sung tài liệu còn những vướne mắc chưa được giải quyết hợp lý Các giải pháp giúp hạn chế những tồn tại trên gồm: - Tăng cường tính chủ động cùa các bộ phận tạo lập nguồn TNS, đặc biệt là bộ phận xây dụng CSDL toàn văn qua kênh sổ hoá. Công việc phát hiện và bổ sung nguồn tài liệu có giá trị là nhiệm vụ ứiưèmg xuyên của bộ phận bổ sung tài liệu. Tuy nhiên, bộ phận tạo iập nguồn TNS ià nơi trực tiếp xử lý, theo dõi tính cập nhật của các tài liệu khoa học, vì thế việc phát hiện những tài liệu truyền thống có giá ưị và ứieo đõi tính cập nhật của tài liệu khoa học phụ thuộc nhiều vào bộ phận này. Phát huy tính chủ động của bộ phận này cũng chính là nhân tố góp phẩn đảm bảo tính bao quát của nguồn nguyên liệu đầu vào cho công tác phát triển nguồn TNSNS. đầy đủ V ứ kịp thời - Tăng cường phối hợp giữa các bộ phận liên quan để đảm bảo nguồn tin ỉuôn Các bộ phận liên quan bao gồm: + Bộ phận bổ sung + Bộ phận số hoá và bộ phận xử lý + Bộ phận phục vụ và cung cấp tài liệu truyền thống, tài liệu điện tử Các bộ phận trên có mối liên hệ chặt chẽ và hỗ trợ lẫn nhau trong việc đảm bào nguồn nguyên liệu cho phát triển nguồn TNSNS. Mối liên hệ này thể hiện qua 77 sơ đồ sau; H. 3. ỉ: Sơ đồ thể hiện mẻi liên hệ giữa các bộ phận trong việc đảm bảo nguồn ngityên liệu cho phát triển nguồn TNS + Bộ phận 1 cung cấp những tài liệu cần thiết cho bộ phận 2 + Bộ phận 2 phát hiện những tài liệu mới có giá trị và những tài liệu bổ sung bị thiếu sau đó thông báo cho bộ phận 1 + Bộ phận 3 tíiổng kê và phát hiện nhu cầu của NDT sau đó thông báo cho bộ phận 1 và 2 + Bộ phận 1 và 2 cung cấp tài liệu dạng truyền thống và nguồn TNSNS cho bộ phận 3. Sự phối hợp tốt giữa 3 bộ phận trên sẽ góp phần đảm bảo nguồn nguyên liệu cho phát triển TNS tại Trung tâm được đầy đủ, Hên tục và kịp thời. - Quản ỉý chặt chẽ các nguồn tài liệu dạng in thuộc diện số hoả Các nguồn tài liệu dạng in phục vụ cho quá trình tạo lập TNSNS bao gồm 3 nguồn chính là: + Nguồn mua (chủ yếu là các tạp chí khoa học ừong nước) + Nguồn lưu chiểu (đối với các tạp chí khoa học của các sở KH&CN các tỉnh/thành phố và các báo cáo kết quả nghiên cứu các cấp) + Nguồn thu thập qua kênh biếu tặng, sao chụp lại (đối với các tài liệu hội 78 nghị hội thảo lchoa học) Giải pháp đối với nguồn tạp chí mua trong nước là; Thường xuyên theo dõi nguồn tạp chí đang đặt mua (theo định kỳ), phát hiện những số tạp chí bị thiếu để có khiếu nại kịp thời đồng thời tìm kiếm những tạp chí mới hoặc những tạp chí từ các nguồn khác chưa được bổ sung về Trung tâm. Giải pháp cho nguồn tài liệu nộp lưu chiểu là: Yêu cầu các tổ chức, cá nhân có trách nhiệm nộp lưu chiểu đầy đủ và đúng hạn; có quy định và cơ chế giao nhận luxi chiểu rõ ràng đảm bảo tài liệu không bị thất lạc (đối với những tài liệu được gửi qua đường bưu điện). Đối với nguồn tài liệu hội nghị, hội ứiảo khoa học cần được phát triển hơn nữa bởi đây ỉà nguồn tài liệu rất có giá trị khoa học. Để thu thập đầy đủ và kịp thời nguồn tài liệu này, Trung tâm cần; + Tăng khối lượng thu thập nguồn tài liệu này lên mức ỉchông hạn chế thay vì hạn chế như hiện nay (hiện tại là 150 tài liệu/ năm). + Xây dựng cơ chế bổ sung tài liệu cụ ứiể cho nguồn tài liệu này (về đơn giá sao chụp, phương thức thanh toán và hỗ trợ kinh phí đi lại cho những người trực tiếp tham gia thu thập) + Bộ phận chịu trách nhiệm bổ sung nguồn tài liệu này cần tăng cường các mối quan hệ với những cơ quan, tổ chức và cá nhân đang lưu giữ những tài liệu thuộc diện thu thập của Trung tâm để có biện pháp và phương thức thu thập phù họp (khuyến khích thu thập thông qua hình thức biếu /tặng). + Thường xuyên tìm kiếm và phát hiện những tài iiệu khoa học dạng hội nghị, 3.3. Nâng cao chất lượng nguồn tài nguyên số nội sinh hội thảo ứiuộc diện để đảm bảo tính cập nhật Chất lượng TNS phụ thuộc vào nhiều yếu tố và quá trình, trong đó chủ yểu phụ thuộc vào quá trình lựa chọn nguồn nguyên liệu đầu vào, kỹ thuật tạo lập TLS và công tác xử lý dữ liệu số. Sau đây là một số giải pháp nẳng cao chất lưọTig nguồn 3.3.1. Tối mi hoá công tác sổ hoá tài liệu truyền tbống TNSNS tại Trung tâm: Trong quá trình số hoá tài liệu, dù sử đụng loại máy scan nào, người xử lý 79 cũng Ichông ừánh khỏi một số lỗi nhất định như đã trình bày trong mục 2.2.2. Trong phần này, tác giả sẽ tập trung vào tìm hiểu cách khắc phục những lỗi trên để đảm bảo chất iượtig cho TLS (áp dụng đối với máy APT BookScan 120Q và các phần mềm kèm theo) - Tài ỉiệu bị thiểufìle ảnh Nguyên nhân: + Trang tài liệu bị dính vào nhau + Độ hút quá mạnh của cánh tay lật trang + Do độ thổi quá mạnh của ống thổi Khắc phục: + Kiểm tra tài liệu ttirớc khi thực hiện sổ hoá (các góc quăn có thể là nguyên nhân khiến các trang tài liệu đính vào nhau) + Điều chỉnh độ hút của cánh tay lật trang - Trang ảnh bị cut-off vào text Nguyên nhân: + BỊ cắt vào text trong quá trình loại bỏ kẹp hoặc crop + Do khuông lề quá rộng Khắc phục: + Chia nhỏ theo các lô nếu tài iiệu quá dày ( mỗi lô khoảng 300 trang) + Xử lý khuông lề cho các trang ở giữa lô - Anh bị mờ Nguyên nhân: + Tài liệu gốc bị mờ + Thiết đặt các thông số camera không phù hợp + Tài liệu có ảnh màu, trong đó có nhiều màu nhạt gần với màu nền trắng của trang tài liệu Khắc phục: + Điều chỉnh lại các thông số cho camera + Sử dụng các chức năng ừong Book Scan Editor (BSE) để điều chỉnh - Nền ảnh bị tối Nguyên nhân: 80 + Trang tài liệu quét có nền tối + Thiết đặt các thông số cho camera chưa phù hợp Khăc phục: + Đặt lại các thông số cho camera + Đặt lại chế độ mở ống kính + Sử dụng các chức năng trong BSE để điều chỉnh (tăng độ sáng) -Anh bị nghiêng Nguyên nhân: + Trang tài liệu bị in nghiêng hoặc vị trí đặt không thẳng Khẳc phục: + Đặt lại tài vị trí liệu cần quét cho thẳng + Sử dụng chức năng Manual deskewing trong chưoíng trình BSE để chỉnh lại - Đen ỉề Nguyên nhân: + Khuông lề quá rộng Khắc phục: + Khuông lại trang tài liệu (sử dụng chức năng crop ữong chương trình BSE hoặc Acrobat proíessional) + Sử dụng chức năng “Erase” hoặc “Black border cleanup” trong chương trình BSE để xoá viền đen. Trong Acrobat proíessional có thể sử dụng chức năng crop “odd pages only” hoặc “even pages only” - Sìze ảnh không đồng nhất giữa các trang Nguyên nhân: + Quá trình crop các trang chẵn và lẻ không thống nhất + Tài íiệu scan là tài liệu phô tô hai trang trên một mặt giấy Khãc phục: + Thực hiện crop lại + Nên quét cả trang trắng để đảm bảo số trang chẵn và lẻ không bị lệch nhau 3.3.2. Hoàn thiện công tác biên mục Công tác biên mục đóng vai trò quan trọng trong quá trình xây dựng các BSTS, nó quyết định đến sự thống nhất dữ liệu trong toàn hệ thống, giúp cho quá 81 trìnlì quản lý, khai thác được thuận lợi và nhanh chóng. Công tác biên mục liên quan đến nhiều công cụ và thao tác nghiệp vụ khác nhau, trong đó việc ứng dụng các chuẩn dữ liệu và sử dụng các công cụ biên mục đóng vai trò quan trọng nhất. Liên quan đến việc đảm bảo chất lượng trong công tác biên mục chúng ta thấy cỏ một số vấn đề chính nổi lên như sau; Thứ nhất: vẩn đề áp dụng các chuẩn, khổ mẫu và công cụ biên mục - Chuẩn mô tả dữ ỉiệu thư mục: Hiện nay Trung tâm đang sử dụng khổ mẫu Marc21 cho công tác biên mục, trong khi đó khổ mẫu này lại chịu ảnh hưởng nhiều của quy tắc mô tả AACR2. Do vậy, Trung tâm cần sớm triển khai áp dụng quy tắc này vào công tác biên mục. Để áp dụng AACR2 vào xử lý tài liệu tại Trung tâm, trước hết cần có một tải liệu AACR2 rút gọn bởi vì hiện nay tuy đã có bản dịch đầy đủ về AACR2, nhưng tài liệu này quá công kềnh. Bản dịch đầy đủ này dày khoảng hcm một nghìn ữang, trong đó từ chương 2 đến chương 13 là những chương mô tả các dạng tài liệu đặc thừ nên thường được chỉ đẫn xem chương 1 (Quy tắc mô tả tổng quát). Trong khi đó lại thiếu nhiều chỉ dẫn cần thiết cho biên mục tài liệu Việt Nam. Bởi vậy, cần có một tài liệu mang tính rút gọn về AACR2, trong đó chỉ nên đưa Chương l (Quy tắc mô tả tổng quát) và một số chương có dạng tài liệu phổ biến như sách, tạp chí, bài trích và nguồn tin điện tử để thuận lợi cho việc ưa cúai hàng ngày của các cán bộ biên mục. Điều quan trọng nhất là phải đưa vào quy tắc này những vấn đề cụ thể của Việt Nam theo quy định của AACR2. - Áp dụng kho mẫu: + Đối với dữ liêu thư muc: Khổ mẫu dữ liệu thư mục đóng vai trò quan trọng trong xây dựng các CSDL thư mục. Tiêu chuẩn hoá khổ mẫu thư mục là cơ sở thiết yếu trong trao đổi thông tin. Do phát triển tự phát, thiếu sự kết hợp và sự chưa nhận thức được đầy đủ vai trò của chuẩn khổ mẫu dữ liệu nên xuất hiện tình ừạng không thống nhất khổ mẫu dữ liệu, gây khó khăn trong việc trao đổi dữ liệu. Một nghiên cứu do Trung tâm Thông tin Tư liệu KHCN Quốc gia tiến hành đã cho thấy, chỉ riêng trong các CSDL trên mạng VISTA ở Trung tâm cũng đã có đến 12 loại khổ mẫu đữ liệu thư mục khác nhau [2]. Qua tìm hiểu thấy có hai khổ mẫu được phổ biến rộng rãi nhất ở Việt 82 Nam; khổ mẫu dữ liệu thư mục do Trung tâm Thông tin Tư liệu KH&CN Quốc gia biên soạn [3] được phổ biến rộng rãi trong hệ thống thông tin KHCN quốc gia và khổ mẫu CSDL Sách do Thu viện Quốc gia biên soạn lại phổ biến rộng rãi ữong hệ thống thư viện công cộng. Tuy nhiên, cả hai khổ mẫu trên đều không tuân thủ khổ mẫu chuẩn quốc tế nào (như MARC, UNIMARC, CCF,...)- MARC 21 là một khổ mẫu tích họp có thể dùng chung cho các loại hình tài liệu thư viện không phải thiết kế các mẫu nhập tin khác nhau, mà chỉ cần ứiêm bớt các trường dữ liệu đặc thù cho phù hợp; Khả năng chia sẻ và sử dụng các biểu ghi thư mục giữa các thư viện với nhau được đễ đảng không chỉ giữa các thư viện trong nước mà cả với thư viện nước ngoài. Tài liệu khổ mẫu MARC21 rút gọn xuất bản năm 2005 có bổ sung một sổ công cụ hồ trợ thổng nhất cho người biên mục; danh mục mã ngôn ngữ theo tiêu chuẩn ISO 639-2; mã nước theo tiêu chuẩn ISO 3166; từ và cụm từ viết tắt dùng ừong biên mục; nguồn hệ thống phân loại, thuật ngữ. Việc áp dụng khổ mẫu Marc21 vào xây dựng CSDL là rất hữu ích và cần thiết. Đẻ giảm bớt những khó khăn như đã nêu tại mục 2.2.3, Trung tâm cần biên soạn một tài liệu hướng dẫn rút gọn trong phạm vi sử dụng của minh để cán bộ xử lý áp dụng một cách dễ dàng hcm. Bên cạnh đó, việc tăng cường các khoá tập huấn về MARC21 cho cán bộ, đặc biệt là những cán bộ mới cQng cần được quan tâm hofn nữa. + Đối vái toàn bô hê thống Cùng với việc áp dụng MARC21 cho dữ iiệu thư mục, một số chuẩn dùng cho mô tả, trao đổi dữ liệu, siêu dữ liệu phổ biến cũng cần được triển khai nghiên cứu và áp dụng thống nhất. Dưới đây là một số chuẩn được khuyến nghị dùng chung cho các Cữ quan TT-TV ở Việt Nam [2]: ChuẩD Ghi chú Dịch vụ, ứng dụng STT Dùng trong trao đổi dữ liệu: 1 Định dạng mô tả trang PDF Dùng để cung cấp tài liệu số hoá 2 Dữ liệu có câu trúc Dùng cho tài liệu điện tử Chuấn quốc tế ISO 8879. Sử dụng SGML MARC-DTD do Thư viện Quốc hội 83 Mỹ xây dựng Hypertexr Mark-up Language HTML Extensible Mark-up Language XML Kliô mâu phân phôi tài PDF liệu 2002 UNICODE, ISO 10646 4. Bộ Mã ký tự TCVN 6909- Dùng trong siêu dữ liệu và biên mục 1 Tiêu chuânNISO Z39.85-200Ì Dublin Core Siêu dữ liệu Dùng cho dữ liệu thư mục Biên mục mảy đọc được MARC21 ISO 2709 Dùng trong các dịch vụ ứng dụng 1 áp dụng cho các máy chủ thông tin Z39.50 Máy chủ ứng dụng tìm thư mục, là chuẩn ISO 23950. tin và yêu cầu tin - Sử dụng khung phân loại: Việc sử dụng khung phân loại trong công tác xử lý tài liệu được Trung tâm áp dụng khá sớm. Trước khi biên soạn và đưa vào sử dụng Khung phân loại BBK (năm 1975), Trung tâm (khi đó là Thư viện Khoa học Kỹ thuật Trung ương) đã sử dụng hai khung phân loại đó là Khung phân loại Trung tiểu hình và Khung phân loại ƯDC. Hiện nay, bên cạnh Khung phân loại BBK, Khung Đê mục Quốc gia Trung tâm còn sử dụng thêm Khung phân loại dành cho các sản phẩm công nghiệp (đối các CSDL về thị trường công nghệ). Đối với Khung phân loại đành cho dữ liệu thư mục, mặc dù theo xu hướng hiện nay cũng như theo khuyến nghị của Vụ Thư viện thì Khung phân loại DDC đang được nhiều cơ quan TT-TV triển khai áp dụng cùng vớỉ MARC21 và AACR2. Tuy nhiên theo quan điểm của những người trực tiếp làm công tác phân ioại tài liệu tại Trung tâm cũng như quá trình tìm hiểu, so sánh khung phân loại DDC với BBK chúng tôi nhận thấy: Việc sử dụng khung phân loại BBK cho các tài liệu khoa học kỹ thuật vẫn có 84 nhiều ưu điểm hơn so với DDC bởi lẽ trong khung phân loại BBK, các mục đành cho khoa học kỹ thuật được trình bày tương đối khoa học và chi tiết. Trong khi đó khung phân loại DDC các mục này được trình bày rất đơn giản và chung chung. Đối với các CSDL thị trường công nghệ hiện đang áp dụng hai công cụ phân loại là Khung Đề mục Quốc gia và Khung phân loại đành cho các sản phẩm công nghiệp. Theo kiến nghị của những cán bộ trực tiếp xây dựng CSDL này thì chỉ nên sử dụng một trong hai công cụ trên cho công tác phân loại tài liệu. Tuy nhiên, việc sử dụng đồng thời 3 công cụ phân loại đã tạo nên sự thiếu thống nhất trong toàn hệ ứiống. Do vậy, trong thời gian tới Trung tâm cần thống nhất lại việc áp dụng khung phân loại chung cho toàn hệ thống. - Sử dụng Bộ từ khoả cỏ kiểm soát trong quá trình xử lý từ khoá Hiện nay, đa số các cơ quan thông tin - thư viện đều lựa chọn phương pháp đánh từ khoả tự do bởi hai nguyên nhân là do không có bộ từ khoá có kiểm soát và để cho nhanh chóng, thuận tiện trong quá trình xử lý tài liệu. Điều này làm mất đi tính nhất quán của dữ liệu bởi vì từ khoá tự do bị ảnh hưởng lớn bời yếu tố chủ quan của người xử lý. Trong cùng một chủ đề sẽ có nhiều từ Iđioá khác nhau do sự thiếu thống nhất ữong quá ưình sử dụng ngôn ngữ ở các địa phương,..,Với hệ thống chỉ dẫn và bảng tra chéo, bộ Từ khóa có kiểm soát đã tạo ra được sự thổng nhất về thuật ngữ trong toàn bộ hệ thống CSDL của Trung tâm. Để khắc phục những tồn tại như đã nêu tại mục 2.2.3 và đảm bảo tính thống nhất của hệ thống từ khoá ưong các CSDL thư mục cũng như toàn văn, Trung tâm cần tiếp tục áp dụng đầy đủ và có kiểm duyệt bộ Từ khoá có kiểm soát vào quá ưình xử lý từ khoá. Bên cạnh đó cũng cần đối chiếu các thuật ngữ mới với các từ điển chuyên ngành và cập nhật vào Bộ Từ khoá có kiểm soát. Trước mắt, khi chưa tái bản có ứiể cập nhật trực tiếp bằng cách viết tay trực tiếp vào bản in của Bộ Từ khoá. Thứ hai: Công iảc kiểm duyệt Vớ hiệu đính Một trong những đặc trưng của các CSDL thư mục tại Trung tâm là có thời gian xây dựng khá dài, trải qua nhiều thế hệ cán bộ xử lý, qua nhiều tiêu chuẩn và phần mềm khác nhau nên sự thiếu đồng bộ về dữ liệu hoặc một sổ biểu ghi không đảm bảo chất lượng là khó tránh khỏi. Trong số đó có những sự khác biệt có ứiể chấp nhận và cả những sự khác biệt, sai sót cần được chỉnh sửa lại cho thống nhất. 85 Thi dụ: + Các biểu ghi hồi cố cho kho sách thường có các ký hiệu không kèm theo năm hoặc không có trường Chỉ sổ Cutter. Đây là sụ khác biệt cỏ thể chấp nhận vì những ký hiệu này được lập từ nhiều năm trước, khi đó chưa quy định việc đánh ký hiệu kèm theo năm, trong khi khối lượng kho tài liệu tài liệu dạng này rất lớn nên Trung tâm đã quyết định không bồ sung thêm năm lập ký hiệu đăng ký cá biệt kèm theo. Đối với trường Chỉ sổ Cutter, do sử đụng phần mềm CDS/ĨSIS để nhập liệu và sau đó chuyển dữ liệu sang phần mềm Libol nên xuất hiện một số lồi trong quá trình chuyển đổi. Do vậy, Trung tâm cũng quyết định bỏ qua trường này khi xử lý tài liệu hồi cố cho CSDL Sách. Hay: + Những tài liệu có cùng một chủ đề lại được phân ioại khác nhau (như trường hợp các tài liệu về lĩnh vực thống kê đang được xếp ở hai mục của Khung phân loại BBK là ô 6 và Q 051). Hiện tượng này là do sự thiếu thống nhất về quan điểm trong khâu phân loại giữa những người làm công tác xử lý. Trong trường hợp này, càn sớm có sự thống nhất và hiệu đính lại để đảm bảo tính thống nhất trong toàn bộ CSDL. Hoặc: + Trường hợp thiếu thống nhất ưong mô tả trường Cơ quan chủ ừì đề tài và trưòrng Tóm tắt cùa CSDL KQNC như đã nêu tại mục 2.2.3. Thực tế hiện nay cho thấy, đội ngũ cán bộ xỏ lý dữ liệu thư mục của Trung tâm đang được trẻ hoá vì vậy rất cần được đào tạo một cách hệ thống, toàn diện và lâu dài. Hơn nữa công tác xử lý tài liệu liên quan đến nhiều kiến thức chuyên môn, đặc biệt là kinh nghiệm nên những cán bộ trẻ thường gặp phải không ít khó khăn khi bắt đầu tham gia công việc này. Nhằm đảm bảo cho những cán bộ mới có điều kiện nâng cao kỹ năng nghiệp vụ, trước mắt cần tạo cơ hội cho họ vừa học vừa làm trên cơ sờ áp dụng lý thuyết và thực tiễn. Vì vậy, trong một vài năm trở lại đây bộ phận xử lý CSDL Sách đã phân công những cán bộ có chuyên môn giỏi và kinh nghiệm chịu trách nhiệm hiệu đính biểu ghi và truyền đạt lại kiến thức chuyên môn cũng như kinh nghiệm cho những cán bộ mới. Những lỗi xuất hiện trong quá trình xử lý sẽ được những cán bộ mới tổng hợp và ghi chép lại để làm cơ sở cho những 86 lần xử lý tiếp íheo. Tuy nhiên, giải pháp này chỉ mang tính tạm thời vì trong thực tế, những lỗi sảy ra ở từiig cán bộ xử lý khác nhau thường không giống nhau nên một người không thể tìm hiểu hết những lỗi mà những người khác thường mắc phải. Giải pháp cho vấn đề này là Trung tâm cần có một nhóm cán bộ chuyên môn có nghiệp vụ và kinh nghiệm đảm nhiệm nhiệm vụ biên soạn tài liệu hướng dẫn. Tài liệu này cần được xây dựng ngắn gọn, dễ hiểu và đặc biệt là phải dựa trên thực tế để làm căn cứ chung cho những người tham gia xử lý có thể tham khảo và áp dụng. Thử ba: Phái triển nhân lực cho công tác xử lỷ dữ liệu thư mục Hiện nay, đội ngũ cán bộ làm công tác xử lý dữ ỉiệu thư mục của Trung tâm ngày một giảm đi không chỉ về số lượng mà cả chất lượng. Thi dụ: Bộ phận xử lý sách tại Phòng Phát trển nguồn tin hiện nay được phân công gồm 03 người, trong khi đó bộ phận đảm nhiệm khâu này trước đây ỉuôn được duy trì từ 5 đến 7 người cũng với một khối lượng sách tương đương. Điều này cho thấy sự phân phối nhân lực cho bộ phận này là chưa hợp lý. Mặt khác, những cán bộ cỏ kinh nghiệm xử lý tài liệu lâu năm đang dần dần giảm đi do đến tuổi nghi hưu trong khi đó, đa số đội ngũ cán bộ trẻ không được đào tạo chính quy nên sẽ mất rất nhiều thời gian để làm quen với công việc. Do đặc điểm của khâu xử ỉý là đòi hỏi rất cao về nghiệp vụ, có những cản bộ phụ trách những chuyên ngành nhất định và khả năng ngoại ngữ tôt nên hầu như rất khó để xây dựng được một đội ngũ cán bộ xử lý có khả năng đáp ứng tốt yêu cầu của khâu này. Để khắc phục hiện tượng ừên, Trung tâm cần có kế hoạch lâu dài cho việc phát triển đội ngũ cán bộ tham gia xử lý đó là: + Tăng cường thêm nhân lực cho khâu xử lý dữ liệu thư mục (trước hết là khâu xử lý sách, số lượng cán bộ xử lý cần ít nhất là 4 người mới có thể đảm bào được tiến độ công việc) -I- Sớm xây dựng tài liệu hướng dẫn cụ thể cho công tác xử lý (về quy tắc mô tà, nhập liệu đối với tìrng dạng tài liệu cụ thể) + Sớm ừiển khai áp dụng các chuẩn cho một kế hoạch lâu dài + Thường xuyên mở các lớp tập huấn cho cản bộ xử lý (đặc biệt là các lớp tập 87 huấn về MARC21, sử dụng khung phân loại, định từ khoá,...) + Tạo điều kiện cho cán bộ xử lý nâng cao khả năng ngoại ngữ. 3.3.3. Tối ưu hoá quá trình trao đỗi và lun dữ liệu gỉữa các bộ phận Công tác lưu giữ nguồn TNS có ý nghĩa quan trọng về nhiều mặt. về cơ bản, nó tạo ra sự sắp xếp mang tính khoa học giúp cho việc truy cập đển nội dung thông tin một cách nhanh chóng, thuận tiện đồng thời tạo ra sự an toàn cho toàn bộ dữ liệu. Ngay từ khí ưiển khai xây đựng nguồn TNS, Trung tâm đã chú trọng đến công tác lưu giữ, điều này được thể hiện ở chỗ: + Các CSDL đều có server lưu giữ riêng (Phụ lục 2) + Các máy chủ được ừang bị có tốc độ và dung lượng đáp ứng được nhu cầu + Dữ liệu trong các CSDL thường được sao từ 1 đến 2 bản liru trong ổ cứng + Hệ thống mạng LAN tốc độ cao (100 MB) Tuy nhiên công tác luxi giữ của Trung tâm hiện nay vẫn còn một số vấn đề dẫn đến tình trạng mất dữ liệu như đã trình bày tại mục 2.2.3 đối với CSDL STD hay đối với bản tin Nông thôn đổi mới. Sau đây chúng ta sẽ tập trung giải quyết từng ưường hợp cụ thể: - Đổi với CSDL STD Sau khi tìm hiểu cho thấy, nguyên nhân chính của hiện tượng mất tin là đo phưomg pháp trao đổi dữ liệu gián tiếp bằng ổ lưu dữ liệu giữa hai bộ phận (Phòng tin học và Phòng CSDL). Để khắc phục hiện tượng trên, cần có một mô hình chia sẻ thông tin trong quá trình trao đổi và cập nhật dữ liệu giữa ba bộ phận (số hoá - xử lý 88 - lưu g iữ ) như sau: Đường đi cùa ^ dừ liệu H. 3.2: Mô hình chia sè dữ liệu trong ba bộ phận số hoả - xử ỉỷ - ỉưu giữ Giải thích: Với mô hình trên, bài toàn văn sẽ được gửi trực tiép đến server lưu giữ sau khi được tách ra tìr fíle gốc. Cán bộ xử lý cũng có thể thực hiện việc tách, sửa file ngay trên máy chủ hoặc tải về để chỉnh sửa rồi upload lên server phục vụ thông qua acount được cấp. Để thực hiện mô hình trên, yêu cầu cần có cơ chế phân quyền và bào mật tốt. Mỗi cá nhân tham gia xử lý chỉ được phân quyền trong phạm vi lĩnh vực mình phụ trách (quyền tách, sửa các file dữ liệu và gửi đến server phục vụ). Bên cạnh đó, Dữ liệu được lưu giữ tại server sau khi số hoá cần được tổ chức khoa học, thuận tiện cho người sử dụng. Việc sắp xếp có thể tiến hành theo năm kết hợp với tên và số của tài liệu (đối với tạp chí khoa học), theo năm kết hợp với ngành (đối với tài liệu thuộc dạng sách) 89 như sơ đồ dưới đây: H. 3.3: Mô hình phân phổi dữ ỉiệu sau khi sổ hoá Việc áp dụng mô hình ưên ưong quá trình trao đổi dữ liệu sẽ giảm thiểu được đường đi của tài liệu số hoá và những thao tác tíiù công đồng thời tránh được những nguy cơ lây nhiễm virút từ các máy trạm. Tuy nhiên, trong khi sử dụng mô hình này, cần thực hiện cơ chế sao lưu tài liệu đầy đủ (những tài liệu lưu tại server sau khi số hoá) cần được lưu giữ đến khi toàn bộ dữ liệu đã được chuyển đến đích để 90 phòng trừ trường hợp người sử dụng làm mất dữ liệu khi tíiao tác. - Đối với Bản tin N ô m thôn đổi mới Bản tỉn Nông thôn đổi mới là bản tin được phát hành từng tuần có nội dung về nông nghiệp và phát triển nông thôn. Bản tin này được xây dựng từ năm 2004 trên cơ sở phối hợp giữa Đoàn thanh niên Trung tâm với Phòng Thông tin nông thôn miền núi. Công tác biên soạn bàn tin này được triển khai trên phần mềm ZOPE với cơ chế phân quyền tới các cá nhân tham gia và upload trực tiếp biểu ghi lên server từ máy trạm. Theo định kỳ xuất bản, bản tin này phải đảm bảo từ 51 đến 52 số một năm, tuy nhiên theo thống kê cho thấy, ừong nhiều năm liền, các sổ của bản tin này chỉ đạt được khoảng honn 60% như đã nêu tại mục 2.2.4. Để khắc phục hiện tượng ữên, các bộ phận tham gia xây dựng bản tin cần kiểm tra lại quy trinh xuất bàn một số của bản tin và có sự phân công, giám sát chặt chẽ từng quy trình biên soạn cho bản tin này. Bên cạnh đó cần đối chiếu lại toàn bộ những số đã được biên tập trên thực tế và những số hiện có trên mạng để có kể hoạch bổ sung và sửa chữa kịp thời. Bên cạnh những hiện tượng mất dữ liệu do ừao đổi, lưu dữ liệu trong quá ưình xây dựng CSDL, trường hợp dữ liệu bị mất có liên quan đến việc nâng cấp, chuyển đổi phần mềm, server....cũng rất phổ biến hiện nay. Đây là những vấn đề liên quan nhiều đến kỹ thuật và nghiệp vụ tin học, do vậy cần dưực nghiên cứu, tính toán và thử nghiệm kỹ lưỡng trước khi tiến hành để đảm bảo an toàn tuyệt đổi cho toàn bộ 3.4. TỔ chức lại các bố sưu tập số dữ liệu. vấn đề tổ chức các BSTS rất quan trọng trong việc phổ biến các nguồn TNS. Các BSTS được tổ chức khoa học và có tính thẩm mỹ sẽ thuận lợi cho NDT khi ưuy cập và nâng cao hiệu quả khai thác. Ngược lại, nếu các BSTS không được tổ chức sắp xếp khoa học sẽ gây trở ngại cho NDT khi tiếp cận đến nguồn TNS, thậm trí không thể truy cập được. Trong mục 2.2.4 đã đề cập đến những điểm bất cập trong việc tổ chức các BSTS và những khó khăn ỉchi khai thác các bộ siru tập này. Đẻ phát huy tối đa hiệu quả khai thác nguồn TNSNS nói riêng và toàn bộ TNS tại Trung nói chung, Trung 91 tâm cần sắp xếp lại các CSDL trên ừang Vista. Việc tổ chức các BSTS trên trang Vista cầB đảm bảo một số nguyên tẳc sau: - Trang chủ chỉ bao quát các dịch vụ chủ yếu và không tạo nên sự băn khoăn cho NDT khi truy cập. - Tên các mục cần bao quát được toàn bộ sản phẩm và dịch vụ có trong nó - Các mục và tiểu mục không được chồng chéo và nên đồng nhất về nội dung - Các mục và tiểu mục cần được trình bày nổi bật về màu sắc và cỡ chữ - Khi đã xuất hiện trên trang web, các mục và tiểu mục nhất thiết phải tạo được kết nối đến địa chỉ của mục hay tiểu mục đó. Việc tổ chức, sắp xếp ỉại các biểu tượng chính chứa các bộ sưu tập trên trang Vista có thể tham khảo sơ đồ sau: H. 3.4. Các biểu tượng chỉnh trong giao diện của mạng Vista Trong sơ đồ trên, Biểu tượng NACESTI được đặt đầu tiên có thể bao gồm những thông tin sau: + Giới thiệu về Trung tâm và Thư viện Khoa học Kỹ thuật Trung ưcmg + Giới thiệu các sản phẩm và dịch vụ hiện có + Kết nối tra cứu tới toàn bộ CSDL và nguồn tín hiện có thông qua liên kết với biểu tượng TRA cứu CHUNG. Biểu tượng TRA cứ u CHUNG sẽ bao gồm toàn bộ nguồn tin hiện có tại 92 Trung tâm và có thể thiết ké theo mô hình sau: 93 H. 3.5. Các mục và tiểu mục trong biểu tượng Tra cứu chung Trong sơ đồ trên, biểu tượng Tra cứu chung có thể bao quát được toàn bộ nguồn tin hiện có tại Trung tâm. Tuy nhiên, trong mục chính chỉ nên đưa vào những thông tin giới thiệu về những bộ sưu tập có trong mục chính bởi vì chức năng chủ yếu của các mục chính này là tra cứu tới các bộ sưu tập thuộc lĩnh vực nó bao quát. Cơ sở để phân chia và sắp xếp các mục và tiểu mục cần dựa trên loại hình, cấu trúc và phưoTìg pháp tra cứu đối với tìmg nguồn tin hay CSDL. Thỉ dụ: Các bản tin điện tử và CSDL STD đều cung cấp các bài toàn văn, tuy nhiên giao diện tìm kiếm và cách thức tìm kiếm khác nhau nên cần được xếp khác chỗ. Đối với các biểu tượng còn lại sẽ bao gồm những thông tin liên quan đến lĩnh vực đỏ và kèm theo giao diện tra cứu riêng đồng thời có liên kết đến biểu tượng tra cứu chung. Trong quá trình tạo các liên kết, cần đảm bảo được tính khoa học, tính hệ thống và nhất quán giữa các biểu tượng, các mục chính và các tiểu mục. không nên đưa vào quá nhiều liên kết không cần thiết. Như chứng ta đã biết, sẽ không cổ một phần mềm nào ỉà hoàn hảo ngay từ khi được triển khai áp dụng mà đa số các phần mềm đều được nâng cấp và phát triển sau một thời gian sử dụng nhất địnli. Cũng giống như các thế hệ điện thoại di động, máy tính hay các thiết bị điện tử khác thời gian lỗi thời của các phần mềm ngày càng được rút ngắn. Do vậy các nhà cung cấp phần mềm thường xuyên nghiên cứu nâng cấp phiên bản mới cho phù hợp với thực tế. (phần mềm Zope đã phát triển đến phiên bản 3.9, Libol đã cho ra phần mềm 6.0, Win ISIS đã có phiên bản 1.5,...)- Hiện tại Trung tâm đang sử đụng một phần mềm thương mại (Libol 5.5) và một số phần mềm miễn phí và mã nguồn mở như Zope, ISIS và Greenstone để xây đựng và quản lý các CSDL. Vẩn đề triển khai nâng cấp phần mềm cũng được coi là rất quan trọng bởi vì sau một thời gian áp dụng vào thực tế, các nhà cung cẩp phần mềm thường tổng hợp lại những hạn chế của phần mềm để ữên cơ sở đó đưa ra phiên bản mới hoàn thiện 94 hơn. Thực tế trong suốt thời gian xây dựng và phát triển, Trung tâm đã nhiều lần thực hiện việc chuyển đổi và nâng cấp phần mềm. Những công việc này được thực hiện bởi các chuyên gia tin học và chuyên gia trong lĩnh vực thông tin - thư viện. Tuy nhiên, một thực tế hiện nay cho thấy Trung tâm đang ngày một thiếu các chuyên gia ờ cả hai lĩnh vực trên, điều này sẽ tạo nên nhiều khỏ khăn và thách thức trong quá trình nghiên cứu, ứng dụng và nâng cấp các phần mềm quản lý thư viện cũng như các phần mềm quản lý dữ liệu. Dựa trên những khảo sát các phần mềm đang được sử dụng tại Trung tâm cho thấy, các phần mềm này đều có khả năng nâng cấp và hoàn thiện một số tính năng. Bên cạnh đó, có thể nghiên cứu và ữiển khai thêm một số phần mềm khác để hoàn thiện dần toàn bộ hệ thống. a. Từng bước hoàn thiện những phần mềm đang sử dụng - Đối với phần mềm Libol Đây là phần mềm thương mại có chức năng quản trị thư viện và đang là một trong những phần mềm quan trọng nhất dùng để xây dựng và quản lý nguồn TNSNS tại Trung tâm. Mặc dù hiện nay, công ty Tinh Vân đã cho ra mắt phiên bản Libol 6.0 với điểm nối bật so với những phiên bản trước đó là Phân hệ Quản lý tư liệu điện tử, cho phép thư viện có thể quản lý các dạng TLS phổ biến (âm thanh, hình ảnh, video, text), cung cấp TLS tới mọi đối tượng người dùng....Tuy nhiên, theo quan điểm của các nhà quản lý CSDL tại Trung tâm thì trong thời gian tới, Trung tâm chưa có hướng chuyển sang sử dụng phiên bản mới này. Bên cạnh những hạn ché trong quá teình xử lý dữ liệu thư mục trong hai phân hệ Bổ sung và Biên mục như đã trình bày ở phần ữên, trong phân hệ OPAC cũng tồn tại một số hạn chế nhất định như chưa hỗ trợ chức năng lưu biểu thức tìm kiếm trước đó hay không hỗ trợ lựa chọn thuật ngữ tại mục từ điển để tìm tin ,... Thí dụ: Khi muốn tìm một tác giả mà NDT không nhớ chính xác, cách nhanh nhất là lựa chọn từ điển tác giả. Tuy nhiên, rất nhiều tác giả cỏ trong từ điển không tồn tại trong CSDL ợ^guyễn Thanh Quế, Phạm Thái Hùng, Nguyễn Ngọc Đích,..,) Trong 95 khi đó việc tạo lập từ điển lại thường xuất hiện lỗ i... Giải pháp chung cho những tồn tại của phần mềm này ở các phân hệ là tổng hợp tất cả những mục chưa chưa đáp ứng được thành văn bản và hợp tác trực tiếp với nhà cung cấp để tìm ra giải pháp khắc phục. Bên cạnh đó, nhừng cán bộ thực hiện các nhiệm vụ có liên quan đến phần mềm có thể tìm hiểu các biện pháp khắc phục tạm thời để giảm thiểu những lỗi có thể sảy ra (dữ liệu bị trùng hoặc sai đo phần mềm). - Đắỉ với các phần mềm Zope, Greemíone, CDS/ỈSĨS Nếu như Libol là phần mềm chính trong xây dựng các CSDL thư mục thì Zope đang là phần mềm chủ đạo trong việc xây dựng và quản lý các CSDL toàn văn. Trong đó đáng kể nhất là CSDL STD và các bản tin điện tử. Zope có nhiều tính năng iru việt như đã nêu ở phần trên, bên cạnh đó cũng có những điểm hạn chế nhất định trong khi sử dụng. Một trong những điểm hạn chế lớn nhất hiện nay khi sử dụng phần mềm này là những tiện ích về ngôn ngữ. Thí dụ được nêu tại mục 2.2.4 cho thấy trong quá trình tim kiếm xuất hiện những kết quả không chính xác đối với một số từ có chứa các chữ cái như ô, ơ, ư,....Để khắc phục hiện tượng này, Trung tâm (cụ thể là bộ phận tin học ) cần tiếp tục nghiên cứu và thử nghiệm các giải pháp (nâng cấp, hoàn thiện hay mở rộng các tính nàng) để tiến tới loại bỏ hoàn toàn những hạn chế nêu trên. Greenstone được áp dụng vào xây dựng và quản lý CSDL tại Trung tâm từ năm 2004 với CSDL Tài liệu kỹ thuật nông nghiệp. Phần mềm này tỏ ra rất ưu việt đặc biệt là trong việc tổ chức và khai thác tài liệu toàn văn. Một trong những tính năng nổi trội của phần mềm này là khả năng tìm kiếm linh hoạt trong toàn bộ văn bản. Đến nay, phần mềm này vẫn được sử đụng để quản ỉý và khai thác CSDL Tài liệu kỹ thuật nông nghiệp với hơn 1000 biểu ghi toàn văn. Mặc dù hiện nay CSDL Tài liệu kỹ thuật nông nghiệp không được tiếp tục xây dựng, tuy nhiên dựa trên cơ sở tìm hiểu các tính năng của phần mềm Greenstone và tham khảo các đơn vỊ đang sử đụng phần mềm này, tác giả cho rằng Trung tâm nên tiếp tục sử dụng phần mềm Greenstone trong công tác xây dựng và quản lý nguồn TNSNS. Đối với phần mềm CDS/ISIS, mặc dù không còn phù hợp với điều kiện hiện 96 tại nhưng phần mềm này vẫn rất cần thiết trong việc hỗ trợ nhập tin cho các biểu ghi hồi cố CSDL Sách bời những tính năng ưu việt trong quá trình nhập liệu và kiểm duyệt. Bên cạnh đó, CSDL KQNC cũng được xây dựng trên phần mềm này từ khá sớm, cho đến nay vẫn chưa được chuyển đổi sang phần mềm khác nên cần được tiếp tục duy trì. Việc nâng cấp phiên bản mới cho phần mềm này sẽ tuỳ theo nhu cầu xây dựng các CSDL mà có thể giữ nguyên phiên bản đang sử dụng hoặc sử dụng phiên bản mới khi cần đến các tính năng mà phiên bản đang được sử dụng chưa có. b. Nghiên cứu ứng dụng một số phần mềm thư viện số Như đã trình bày tại mục 2.2.3 và mục 2.2.4, đa số các phần mềm đang sử dụng tại Trung tâm hiện nay chưa đáp ứng được yêu cầu quản lý và phát triển nguồn TNSNS thể hiện ở chỗ: + Các phần mềm chưa đáp ứng được yêu cầu xây dựng bộ sưu tập về tính năng cũng như khả năng hỗ frợ các chuẩn cho đữ liệu số. + Chưa có công cụ két nối các bộ sưu tập để tạo ra một điểm ừuy cập ứiống nhất. Hiện tại, ữên thị trưòng đã xuất hiện một số phần mềm chuyên dùng cho việc quản lý các nguồn TNS như Metalib, SFX, Digitool, Aleph, Verde, Primo...của tập đoàn Ex Libris (tập đoàn cung cấp các giải pháp tự động hoá thư viện). Dưới đây, tác giả xin giới thiệu sơ lược một sổ phần có thể ứng dụng vào công tác xây dựng và quản lý nguồn TNSNS tại Trung tâm. - Metaỉib Metalib là công cụ tìm kiểm tài liệu nghiên cứu rất phổ biển hiện nay. Công cụ này cho phép thực hiện tìm kiểm song song và trả về kết quả trên một giao diện duy nhất thông qua việc kết nối tới một số lượng không hạti chế các CSDL bên ngoài cũng như nguồn tài nguyên nội sinh cùa đơn vị. Metalib được xây dựng dựa trên một kiến trúc mở với các tính năng nổi trội như: + Tạo ra một hệ thống với một điểm truy cập duy nhất + Cho phép NDT truy cập đến các nguồn tin khác 97 + Xác nhận quyền của NDT cho các nguồn và địch vụ đặc biệt + Cung cấp siêu tìm kiếm giúp người dùng có thể tìm kiếm tổng hợp các nguồn tài liệu một cách song song + Cung cấp đường link giữa các CSDL + Hỗ trợ cán bộ thư viện phân loại nguồn tin và tìm ra những nguồn tin và dịch vụ phù hợp + Tích hợp các nguồn tài nguyên nội sinh với các nguồn tin bên ngoài + Quản lý người dùng với môi trường cá nhân + Hỗ trợ liên kết toàn diện với phạm vi rộng + Tương thích với các ứng dụng và có thể tích hợp ữong môi trường thư viện. Hỗ trợ các chuẩn (Marc, Unicode, OpenưRL, XML, OAI, Z3950) Metalib có khả năng kết nối mạnh mẽ các nguồn tin dưới nhiều dạng kliác nhau giúp NDT có thể truy cập đến toàn bộ nguồn tài nguyên hiện có như hình minh hoạ đưới đây: , i'"í:! Tồilucthin to MrtiLlb U b ris H. 3.6: Sơ đồ liên kết tài nguyên thông tin trong Metalib Thdng qua phượng thức tìm tin Metasearching, NDT có thể tiếp cận đến nhiều nguồn thông tin chỉ với một điểm truy cập đuy nhất. Phương thức này được mô tả 98 thông qua mô hình dưới đây: What is MetaSearch? Query Diverse inlbnnalĩon resourc«s H. 3.7: Mô hình thể siêu tìm kiếm trong Metalib - S F X - Côns cu kết nối hiêu auả SFX là phần mềm độc lập có khả năng tích hợp dễ đàng với phần lớn các hệ thống tự động hóa thư viện lởn, hệ thống quản lý học tập, cổng điện từ của đơn vị, cũng như với toàn bộ các giải pháp ứiư viện khác của Ex Libris. Sau khi một danh sách tài liệu được hiển thị qua việc tìm kiếm, dịch vụ SFX cho phép liên kết tới tài liệu toàn văn nếu sẵn cỏ hoặc đưa ra những tuỳ chọn khác khi tài liệu toàn vãn không tồn tại như cho phép đăng ký mượn tài liệu in liên thư viện hay kết nối tới mục lục trong thư viện hoặc bản tóm tắt,... Những tính năng nổi bật của SFX: + SFX dựa trên tiêu chuẩn OpenURL phát triển đầu tiên bởi Oren Beit-Arie của Ex Libris và Herbert Van de Sompel. + SFX cung cấp một khả năng kích hoạt theo khối dừ liệu (batch activation) đối với vốn tư liệu của thư viện nhận được từ các nhà cung cấp dịch vụ quản lý truy cập công cộng sẵn có (PAMS - Public Access Managment Services). + Máy chủ SFX có thể cài đặt tại thư viện hoặc lưu trữ và quản lý bởi Ex Libris thông qua dịch vụ đăng ký thuê bao truy cập SFX sẵn có. Thư viện có thể lựa chọn một trong hai giải pháp, hoặc cài đặt SFX ngay tại thư viện hoặc đãng ký thuê 99 bao với dịch vụ quản lý SFX của Ex Libris. + Sử dụng phân hệ quản trị SFX trên vveb giúp các thư viện có thể kiểm soát máy chủ SFX của họ và tự cấu hinh các cơ sở dữ liệu mục tiêu phù hợp với nhu cầu cụ thể của đơn vị mình. + SFX cũng cho phép thư viện cấu hình các dịch vụ phù hợp trên toàn bộ hệ thống của tổ chức hoặc tùy biến phù họp đối với từng nhóm và người dùng riêng. Ví dụ như dịch vụ “xin cấp bản quyền” có thể chỉ phục vụ cho đối tượng là nhân viên ở bộ phận dịch vụ kỹ thuật của thư viện, và các dịch vụ chuyển giao tài liệu trực tiếp chi sẵn có đối với từng loại đối tượng. + Công cụ quản trị trên nền tảng Web của SFX tạo điều kiện thuận lợi cho các ứiư viện sử dụng các quy tắc lưu trữ cơ sở kiến thức toàn diện của SFX nhẳm thiết íập và duy ữì các dịch vụ nối kết phù hợp. Một khi đã được cấu hình phù hợp với nhu cầu nối kết của thư viện, SFX có thể phục vụ như kho dữ liệu trung tâm thông tin tạp chí điện tử của thư viện. + SFX cung cấp công cụ nối kết ưích dần (Citation Linker), một khổ mẫu Web có khả năng dễ dàng nhúng vào các trang web của thư viện và phục vụ như một giao diện xác định thông tin tạp chí điện tử. + SFX có khả năng tạo ra một danh mục nhan đề tạp chí điện tử theo ừật tự xắp xếp bảng chữ có thể tùy biến đối với Nvebsite của thư viện. Kết hợp với dịch vụ MARCit! của Ex Libris, SFX cung cấp các biểu ghi thư mục MARC tùy chọn để có thể tải vào mục lục thư viện hoặc Metalib, cổng thư viện Ex Libris. + SFX có thể kiểm tra trực tiếp các yêu cầu chuyển giao tài liệu so với vốn tư liệu trước ỉchi bạn đọc gửi đi nhừng yêu cầu về tài liệu đó. + Thông qua SFX, cán bộ thư viện có thể có được thước đo thống nhất về mức độ sử dụng - ứiông tin quan ừọng để quản lý hiệu quả tài nguyên thông tin trên web của mỗi nhà cung cấp. Để thấy được tính năng nổi bật của SFX, chúng ta hãy so sánh bai phưcmg 100 pháp liên kểt được thể hiện ừong các sơ đồ sau: How d o e s It w o rk ? — Línking th e old w ay ... “ - r------- -------- “ - !
ị :: r -
F«HT«xt OPAC ^ ■ 'Mm’
ILLyOoc Del ..) Learnìng Mgiinl
System I
C ltãĩion
M anag«r H. 3.8; Sơ đồ liên kết theo phương pháp truyền thống Í-Ễ, Google Fun T«xt
_j Ĩ L Aggregator
Datatos« ■ « í - H ■ ■ — c s : sB
" " _Ố *■
Digital
conẽctlon 101 H. 3.9: Liên kết theo phương pháp mới OpenưRL How d o e s it w o rk ? - U nk in g t h e olđ w ay Lihu.i ự 5_„ t __ ______ OPAC ^ g p ^ a to r
Database Google Portal A&I
Service ILL/DOC D«l 0 EPpL: ! ■ ........ ....... H. 3. Ị 0: Sơ đồ thể hiện quả trình thực hiện ỉỉên kểt truyền thống Citatlon
Mana^er 102 H. 3.ỈỈ: Sơ đồ thể hiện quá trình thực hiện phương pháp liên kết mở URL _______ • — * EyLibris ^ H. 3.12: Sơ đồ thể hiện dòng liên kết SFX Hiện nay, Metalib-SFX được coi là giải pháp hiệu quả cho các trung tâm thông tin - thư viện thuộc các viện nghiên cứu, trường đại học trên toàn thế giới với gần 2000 khách hàng lớn. Nhiều cơ quan nghiên cứu, trường đại học hàng đầu thé giới đã chọn Metalib-SFX làm giải pháp thư viện - thông tin như Trung tâm Vũ trụ lohnson (lohnson Space Center) thuộc Cơ quan Hàng không và Vũ trụ Quốc gia (NASA), Đại học New York, Đại học Califomia,... ở Việt Nam, Trung tâm thông tin tư liệu thuộc Viện Khoa học Công nghệ Việt nam là đơn vị đầu tiên ứng dụng phần mềm Metalib-SFX vào hoạt động, - Disitooỉ - Giải pháv cho n2uền TNS DigiTool là một giải pháp ừên toàn hệ thống cho việc quản iý tài sản số trong môi trường thư viện, ừung tâm tìiông tin và trường học. DigiTool tạo điều kiện cho các thư viện và trung tâm thông tin có tíiể tạo ra, quản lý, bảo quản và chia sẻ các BSTS nội sinh của mình. Bằng cách cải tiến tích hợp các BSTS với những cổng truy cập của thư viện và hệ thống học tập trực tuyến, Với DigiTool, các tìiư viện sẽ cung 103 cấp cho người dùng một môi trường làm việc thông suốt. Digitool cho phép xây đựng, quản lý và khai thác các BSTS với mọi dạng tài liệu gồm; Dạng text (.doc, .pđf, .rtf, .exl, .ppt) Dạng ảnh (.gif, jpeg jp2) Dạng âm thanh (.ram, .wav) Dạng đa phương tiện (.mpeg, .mpg, .avi) Dựa trên sự hợp nhất của những phân hệ quản trị (Modules) để cung cấp một giải pháp toàn diện, các phân hệ quản trị của Digitool làm việc linh hoạt và cấu trúc mở của nó được thiết kế để giải quyết mọi đòi hỏi hiện tại và tương lại đổi với nhiều dạng BSTS gồm: + Kho Dữ liệu Thư viện (InstiíuỊỉonal Reposìtories): Kho này quản lý và phổ biến các TLS nội sinh do chính thư viện tạo ra như luận án, luận văn, tài liệu trước khi xuất bản, tài liệu nghiên cứu, báo cáo,.. + Bộ Sưu tập Tài liệu Đào tạo (Coỉlections o f Educatìonaỉ Materials): Gồm các đối tượng học tập, tài liệu đào tạo dưới dạng điện tử (e-reserves), và các bộ sưu tập được cấp phép truy cập, mà mục đích của các tài liệu này là nhằm nâng cao kinh nghiệm học tập và trợ giúp nghiên cứu khoa học được tìiuận tiện hem. + Bộ Sưu tập Đặc biệt (Special Collections)'. Thư viện lưu trữ và bảo quản vì lợi ích của xã hội, bao gồm các bộ sưu tập di sản văn hóa được số hóa. Digitool bao gồm nhiều phần hệ quản trị, mỗi phân hệ lại được thiết kế nhằm giải quyết nhiều nhu cầu, chức năng và quy trình công việc khác nhau gắn iiền với vòng đời của một đối tượng số theo quy trình sau: Trước tiên, các đối tượng sổ với siêu dữ liệu gắn kết được nhập vào kho lưu trữ dữ liệu Digiíool Repository Tiép theo, thư viện sẽ tiến hành quản lý một quy trình thao tác nhất định, bao gồm việc biên tập siêu dữ liệu và quản lý bộ sưu tập. Cuổi cùng, người đùng sẽ tìm kiếm trên kho dữ liệu đó và yêu cầu chuyển giao các đối tượng sổ. Các phân hệ được kết hợp với nhau, cung cấp một giải pháp tổng thể cho mọi nhu cầu và đòi hỏi trong việc quản lý tài sản số. 104 Các phân hệ của Digừooỉ gồm: + Phán hệ quản trị kho dữ Liệu số mạnh (The robust Dỉgitool reposiíory moduỉe), một phân hệ năm chính giữa ừái tim của hệ thống này, nó có trách nhiệm lưu trữ và quản lý các đổi tượng số - như hình ảnh hoặc các tệp tin văn bản và siêu dữ liệu gắn kết. Trong khi siêu dữ liệu được lưu trữ trong CSDL dựa trên hệ quản trị CSDL Oracle của Digitool repository, thì các đối tượng đa nhập vào hệ thống sẽ được lưu trữ trong một hệ thống tập tin mạng bảo mật (NFS - Network File System) hoặc trên hệ thống từ xa được truy cập thông qua đường dẫn URLs. Một lớp dịch vụ Web tiêu chuẩn SOAP (Simple Object Access Protocol) cho phép kho dữ liệu tương tác với những phân hệ Digitool khác cũng như với những hệ thống nội bộ của thư viện hay của bên thứ ba. + Một bộ phân hệ quản trị mạnh (A set o f powerful administrative modules) được thiết kế cho nhân viên và người quản trị hệ thống sè hỗ trợ cho bốn hoạt động chính - tiếp nhận đữ liệu, biên tập siêu dữ liệu, quản lý bộ sưu tập, và quản trị hệ thống. Phân hệ Ingest (Ingest Module) xử lý việc nhập những đối tượng vào kho dữ liệu. Biên tập siêu dữ liệu mô tả hoặc siêu dữ liệu đối tượng khác (chẳng hạn như siêu dữ liệu bảo quản hoặc kỹ thuật) được hoàn thành thông qua trình biên tập siêu dữ liệu Meditor. Khi sử dụng phân hệ Quản Lý Bộ Sưu Tập, nhân viên thư viện có thể tổ chức các đối tượng vào trong những bộ sưu tập được cấu trúc nhằm giúp người dùng di chuyển qua lại ứiuận tiện. + Phân hệ Phát hiện tài nguyên thông tin (The sophisticated resource dỉscovery module) ừao quyền cho người dùng bằng việc tạo điều kiện cho họ tìm kiém siêu dữ liệu đối tượng hoặc phàn toàn văn của tài liệu; di chuyển qua những bộ sưu tập được tích hợp trong thư viện; mở xem các đối tượng số và tận dụng được những dịch vụ cá nhân như là các công cụ quản lý bộ sưu tập. Digitool đảm bảo tính bảo mật của tài sản số và gắn với quyền ữuy xuất dữ liệu bẳng việc cho phép thư viện xác lập và kiểm soát việc truy cập đến những đối tượng số. Tính năng kiểm soát cho phép điều chỉnh quyền truy xuất dữ liệu của người dùng phù hợp với những tham số nhu tình trạng người dùng, số lượng sinh viên tham dự khóa học, và địa chì IP. Giao diện người dùng trên phân hệ phát hiện tìm kiếm và phát hiện nguồn tài nguyên The Resouìxe discovery có thể dễ dàng tùy biến để phù hợp mong 105 muốn của thư viện. + Phân hệ nhập dữ liệu (The Deposỉte moduỉe) giúp nhân viên chưa được đào tạo về thư viện cũng có thể dễ dàng tải các đối tượng số sử dụng công cụ Web lên trên mạng như luận án, luận văn, và những đối tượng học tập. Phân hệ này cũng xứ lý quy trình công việc nhập dữ liệu theo hình thức kiểm soát tình trạng dữ liệu, nghĩa là nó cho phép những nhân viên được ủy quyền xét duyệt và chấp nhận dữ liệu được nhập vào hệ thống. Được trang bị với các khả năng quản lý người dùng, Digitool xác thực quyền truy cập của người dùng hay bạn đọc của thư viện bằng việc tham vấn một CSDL bạn đọc bên trong hoặc một máy chủ xác thực bên ngoài như máy chủ cung cấp truy cập dịch vụ thư mục - LDAP (Lightweight Directory Access Protocoỉ). Digitool hỗ trợ việc đăng nhập đơn (SSO - Single Sign-on), cho phép người dùng đăng nhập vào hệ thống khác của Ex Libris có thể truy cập vào Digitool mà không cần phải lặp lại quá ưình xác tíiực quyền truy cập. Cấu trúc của Digitool dựa trên các công nghệ tiên tiến nhất như địch vụ Web SOAP, XML (Extensible Markup Language), XSD (XML Schema Deíinition), XSL (Xtensib)e Stylesheet Language), ODBC (Open Database Connectivity), Unicode, và JPEG 2000. Digitool hỗ ừợ đầy đủ các tiêu chuẩn ngành như MARC21, Qualified Dublin Core, METS (Metadata Encoding and Transmission Standard), Z39.87-2002 - Siêu dữ liệu kỹ thuật cho hình ảnh tĩnh, OpenưRL, Z39.50, và OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting). Kiến trúc mở và các tiêu 106 chuẩn được hồ trợ cho phần mềm này được minh hoạ bởi hình sau: Dfflơool Oveivlevv - ConíM enttal ĐÌSỈTOỠỈ 10 ĩ y Lỉbria H. 3. ỉ 3: Kiến trúc mở với các tiêu chuẩn được hỗ trợ cùa Digitool Hoạt động trong nhiều môi trường khác nhau, Digitool là một công cụ hỗ ữợ các đơn vị với nhiều phân hệ quản trị - cung cấp kho dữ liệu duy nhất để mọi bộ phận hoặc đơn vị của một tổ chức đều có thể truy xuất và sử đụng. Mỗi đơn vị có thể quản lý và kiểm soát các bộ sưu tập riêng của minh trong chỉ một kho dữ liệu với phân hệ quản trị duy nhất này - Digitool Repository. NDT có ứiể tìm kiếm trên tất cả các bộ sưu tập thông qua một giao diện phát hiện tài nguyên thông tin duy nhất với khả năng tùy biến để phản ánh được tính riêng biệt trong các bộ sưu tập của từng đơn vị thành viên. Những tính năng nổi bật của ữên cho thấy, Digitool là một công cụ hữu ích cho việc quản lý nguồn TNS. Hiện nay trên thế giới đa có hàng trăm khách hàng từ nhiều quốc gia sử dụng công cụ này, tiêu biểu như Thư viện Quốc gia Luxembourg, Đại học Quốc tế London, Thư viện British,... 107 3.6.Í. Tâng cường chia sẻ nguồn tàỉ Dguyên sổ nội sinh Chia sè tài nguyên là một trong những hoạt động rất quan trong giúp thư viện: + Tăng cưÒTig khả năng phát hiện và thu thập các nguồn tài nguyên bên ngoài + Phổ biến rộng rãi nguồn tài nguyên đang lưu giữ + Trao đổi tài nguyên và thúc đẩy hợp tác nhiều mặt với các đơn vị khác Thông qua tìm hiểu công tác xây dựng và phát triển nguồn TNSNS tại Trung tâm cho thấy hoạt động chia sẻ nguồn TNSNS của Trưng tâm hiện nay mới chỉ dừng lại ở một mức độ nhất định, chưa phát huy hết khả năng hiện có. Các hoạt động chia sẻ nguồn lực thông tin số mới chỉ diễn ra dưới dạng cung cấp thông tin phục vụ nhu cầu sử dụng cá nhân và một số hoạt động hỗ ữợ các gói CSDL. Trong phần này, chúng ta sẽ xem xét một số khả năng có thể tihúc đẩy hoạt động chia sẻ nguồn lực thông tin với các đơn vị trong và ngoài nước. - Khả năng tạo lập TNS dựa trên những tài nguyên có sẵn: Nguồn TNSNS của Taing tâm dù được tạo lập ở hình thức nào thì chúng ta cũng có thể tìm kiếm những nguồn tài nguyên sẵn có (kể cả nguồn tin số hoá). Hiện nay, với sự phát ừiển mạnh mẽ của TNS, NDT có thể tìm kiếm một bài trích, thậm trí một quyển sách toàn văn trên mạng một cách dễ dàng trên các trang cung cấp Ebook miễn phí như Thuvien-eBook.com, Ebook.edu.vn, Ebooks.vdcmedia.com hay Sachứiamkhao.edu.net.vn,....Trong điều kiện hiện tại, khi dạng TLS hoá cùa Trung tâm chưa được mở rộng ứiì việc tận dụng các nguồn TNS sẵn có vẫn có thể áp đụng đối với một số dạng tài liệu. Việc tận dụng nguồn tài nguyên có sẵn để bổ sung cho bộ sưu tập của mình là một hoạt động, đồng thời cũng là giải pháp giảm bớt công sức và chi phí. Đối với các CSDL toàn văn, đặc biệt là các bản tin điện tử thì việc tận dụng nguồn TNS có sẵn đang ngày một dễ dàng hcm bởi hiện nay số lượng bài viết trên mạng đang ngày một gia tăng, v ấn đề ở đây là lựa chọn những nguồn thông tin cập nhật và chính xác đồng thời có tính khoa học để đảm bảo các yểu tố cùa thông tin đó là nhanh chỏng, kịp thời, chỉnh xác và phù hợp. Đối với các CSDL thư mục, trong đó chù yếu là CSDL Sách thì việc tận dụng các nguồn TNS sẵn có ở txong nước cùng như ở nước ngoài là hoàn toàn khả thi bởi 108 các lý do sau: Thứ nhất: Trung tâm đang sử dụng phần mềm Libol 5.5, đây là phần mềm tích hợp cho phép trao đổi dữ liệu qua cổng Z3950 với tiêu chuẩn trao đổi dữ liệu thư mục quốc tế ISO 2709 nên việc tận dụng những biểu ghi thư mục sẵn có tại các thư viện trong và ngoài nước rất thuận tiện, Thứ hai: Trung tâm đang sử đụng khổ mẫu Marc21 nên việc trao đổi dữ liệu gặp nhiều thuận lợi, đặc biệt là trong quá trình sử dụng các biểu ghi sẵn có từ các website nước ngoài. Thứ ba: Một số website, đặc biệt là các \vebsite nước ngoài cho phép download miễn phí các biểu ghi thư mục như website của Thư viện Quốc hội Mỹ, Thư viện Đại học Boston, Thư viện Đại học tổng hợp quốc gia ú c ,...là điều kiện thuận lợi cho công tác biên mục tài liệu ngoại văn tại Trung tâm. Thứ tư: Hiện tại đa phần các sách ngoại văn được Trung tâm mua về hàng năm đều được biên mục tại các thư viện nước ngoài, đặc biệt !à Thư viện Quốc hội Mỹ. Mặc dù có đầy đủ điều kiện cho việc tận dụng nguồn tài nguyên ứiư mục sẵn có trong và ngoài nước, tuy nhiên cho đến nay Trung tâm vẫn chưa tận dụng được khả năng này. Nguyên nhân chủ yếu được xác định là do phần mềm không hỗ trợ phát hiện nguồn của biểu ghi đồng thời (trong nhiều CSDL khác nhau) và không kết nối được với server lưu giữ các biểu ghi cần download. Do vậy, để tận đụng chức năng này, Trung tâm cần phối hợp chặt chẽ với đối tác cung cấp phần mềm đế ứiực hiện các kết nối lới những server có thể download dữ liệu nhàm giảm thiểu thời gian và công sức không cần thiết cho việc biên mục tài liệu đã có sẵn. - Khả năng chia sẻ nguồn tin hiện cỏ với các đơn vị khác Trung tâm TTKH&CNQG là một trong những đơn vị có khối lượng biểu ghi thư mực lớn nhất cả nước. Việc tận dụng những biểu ghi có sẵn tại Trung tâm sẽ góp phần làm giảm ứiiểu thời gian và công sức cho các đơn vị trong hệ thống thư viện. Tuy nhiên, cho đến nay, vẫn chưa có đơn vỊ nào tận dụng được nguồn tài nguyên quý giá này cho công tác biên mục của mình. Nguyên nhân cũng có tiiể xuất phát từ phía các đon vị trong hệ thống (do phần mềm, cơ chế tạo lập dữ liệu thư mục,...) nhưng nguyên nhân chủ yếu là do cơ chế chia sẻ nguồn tin của Trung tâm 109 chưa được chú trọng. Đe tăng cường khả năng chia sẻ nguồn dữ liệu thư mục giữa Trung tâm và các đơn vị khác ữong hệ thống, có hai giải pháp có thể thực hiện trong thời gian tới là xây dựng mục lục liên hợp trực tuyến và cài đặt dịch vụ truy cập dữ liệu thư mục thông qua cổng Z3950 đối với các CSDL được xây dựng trên phần mềm Libol. Trong khi chưa xây dựng được mục lục liên hợp trực tuyến thi giải pháp trước mắt đổi với Trung íâm trong vấn đề này là sớm triển khai cơ chế cung cấp dữ liệu thư mục thông qua việc cài đặt phần mềm hồ trợ dovvnload biểu ghi qua cổng Z3950 để các đơn vị ừong hệ thống cỏ thể tận đụng nguồn tài nguyên này. Tuy nhiên, trong quá trình chia sẻ nguồn lực thông tin với các đơn vị trong hệ thống, công tác biên mục tại Trung tâm cũng cần đảm bảo các vấn đề về chuẩn mô tả, công tác phân loại, định tò khoá,...để các đơn vị sử đụng coi đó như là những biểu ghi thư mục chuẩn có thể tận dụng vào việc phát triển nguồn tài nguyên thư mục của mình. 3.6.2. Đảm bảo an toàn cho dữ liệu sổ Công tác đảm bảo an ninh thông tin trong giai đoạn hiện nay là hết sức quan trọng đối với Trung tâm nói riêng và các cơ quan TT-TV nói chung bời; + Nguồn TNS tuy rất dễ phổ biến, sao lưu nhưng nguy cơ bị mất cũng rất cao. Sự phát ừiển mạnh của mạng máy tính ngày càng tạo ra nhiều hinh thức tấn công đo virút. + Tuổi thọ của các sản phẩm phần cứng không có cơ sở đảm bảo an toàn cho thông tin + Các máy trạm của Trung tâm hầu hết chưa được trang bị phần mềm có bản quyền và phần mềm diệt virút hiệu quả.. + Do khối lượng tài liệu và nguồn tin tại Trung tâm rất lớn và giá trị nên khi sảy ra sự cố sẽ rất khó khôi phục. Từ những lý do nêu trên cho thấy công tác bảo vệ an ninh cho nguồn TNSNS tại Trung tâm cần có những giải pháp cụ tiiể và đồng bộ. Dưới đây, tác giả xin đưa ra một số giải pháp cụ thể như sau: - Xày dựng cơ chế sao ỉưu dữ liệu hợp ỉý: Hiện nay, các CSDL của Trung tâm tuy đã được sao lưu ra ổ cứng để đề 110 phòng các trường họpp xấu sảy ra. Tuy nhiên, để đảm bảo an toàn hoTi cho dữ liệu, toàn bộ CSDL của Trung tâm cần được sao lưu sang đĩa CD và cất giữ tại những nơi an toàn không bị ảnh hường bởi các nguy cơ chập cháy. Bên cạnh đó, các bàn copy này cũng cần được update thường xuyên để đảm bảo giảm thiểu thiệt hại nếu có tình huống xấu sảy ra. - Lựa chọn các thiết bị có chất lượng tốt, nâng cấp và thay mới các máy trạm: Một trong những yếu tổ quan trọng góp phàn đàm bảo an toàn cho dữ liệu là các thiết bị phần cứng (các server và các ổ cứng di động). Thực tế cho thấy đã có một số trường hợp hỏng ổ cúmg và server sảy ra tại Trung tâm, gần đây nhất là năm 2007 tuy không gây thiệt hại nhiều nhưng cũng cần lưu ý, nếu đữ liệu không được sao lưu thường xuyên thì khả năng mất mát sẽ rất lớn. Để khắc phục những hỏng hóc do phần cứng, ngoài việc sử dụng bảo quản thiết bị một cách khoa học, việc chọn mua các sản phẩm có thưcmg hiệu và chất lượng cao đóng vai trò rất quan trọng. Hiện tại cỏ rẩt nhiều nhà cung cấp thiết bị tin học, tuy nhiên chỉ nên lựa chọn sản phẩm của những thương hiệu cỏ uy tín và chất lượng như Intel, IBM, Dell, Hp,... Hệ thống máy trạm tại Trung tâm theo thống kê, hầu hết mới được trang bị một vài năm gần đây và có cấu hình đáp ứng được yêu cầu công việc. Tuy nhiên vẫn còn một số máy tính cũ, trong đó có cả những máy đã quá cũ và có cấu hình thấp Pentium lĩl (như tại bộ phận bổ sung) cần được thay mới để đảm bảo quá ữình xử lý và update dữ liệu được nhanh chóng. - Triển khai các phần mềm và chương trình diệt vỉrút có bản quyền; Theo nguồn tin từ Vnexpress, tại Việt Nam bình quân thiệt hại do virus gây ra đối với mỗi người sử dụng máy tính khoảng 488,000 đồng/năm [19]. Trung tâm TTKH&CNQG cũng không nằm ngoài số đó, Hiện nay, toàn bộ máy chủ và một sổ máy trạm của Trung tâm đang sử dụng phần mềm có bản quyền của nhà cung cấp và các chương trình diệt virút như Norton, Avg, Avast,.,.. Tuy nhiên, hầu hết các máy trạm đều đang sử dụng các phần mềm không có bàn quyền và chưa có chương trình diệt virut hiệu quả nên nguy cơ virút tấn công là rất cao. Mặc dù những thiệt hại sảy ra chủ yếu trên máy trạm nhưng tổn thất cũng không nhỏ và có thể ảnh hưởng đến toàn hệ thống. Đe 111 đảm bảo an toàn cho toàn hệ thống, Trung tâm nên trang bị cho toàn bộ máy ừạm các phần mềm (chủ yểu là Windows XP) và chương trình diệt virút có bản quyền như Bkav Pro, Kaspersky, Norton,... - Làm tối cóng tác quản ỉỷ các bộ phận tham gia xây dựng các BSTS Cùng với sự đa dạng và phong phú của các BSTS !à sự tham gia cùa nhiều bộ phận, cá nhân vào hoạt động xây đựng, quản lý và phổ biến các BSTS nội sinh. Do đó, việc quản lý và phân quyền truy cập cho các cá nhân tham gia sẽ gặp phải một số khó khăn nhất định. Để đảm bảo an toàn cho nguồn TNSNS, bộ phận chịu ừách nhiệm quản lý kỹ thuật (bộ phận tin học) cần phân công cụ thể từng cá nhân phụ trách từng bộ phận và xác định quyền hạn của từng cá nhân tham gia xây đựng và quản lý các CSDL để cung cấp các acount với các quyền truy cập phù họp, tránh hiện tượng những người không có trách nhiệm tham gia vào các mảng công việc 3,6,3. Xây dụmg cơ chế truy cập phù hợp ichác gây mất an toàn cho các CSDL. - Đồi với CSDL STD Trong toàn bộ nguồn TNSNS của Trung tâm, chỉ có duy nhất CSDL STD ỉà được phục vụ theo phương thức có trả phí. Như đã trình bày tại mục 2.2.4, phương thức phục vụ này có những mặt hạn chế nhất định làm giảm khả năng truy cập tới CSDL trong khi nó được coi là một trong những CSDL về KH&CN cỏ giá ưị nhát hiện nay. Vì vậy, trong tương lai, Trung tâm cần sớm triển khai cơ chế phục vụ miễn phí đối với NDT truy cập CSDL này. Tuy nhiên, để có thể cung cấp miễn phí, vấn đề chính là phải đảm bảo được hai yếu tố: Thứ nhắt. Đảm bảo về hạ tầng phục vụ khai thác bao gồm mạng và server lưu dữ liệu. Với lưu lượng khai thác như hiện nay, hệ thống đường truyền và server có thể đáp ứng tốt quá trình nhận và truyền dữ liệu. Tuy nhiên, nếu khối lượng khai thác tăng lên gấp nhiều ỉần, rất có thể dẫn đến tình trạng nghẽn mạng như trường hợp TVS hoá của Liên minh châu Âu. Thư viện này được khai trương vào tháng 11/2008, tuy nhiên đã bị phá sản chỉ vài giờ sau đó do có quá nhiều người truy cập[6]. Thứ haL Trong khi vấn đề pháp lý cho CSDL này vần chưa được giải quyết thấu 112 đáo, việc cung cấp rộng răi CSDL này có thể gặp phải những ý kiến phản hồi khác nhau. Do vậy, để có thể chính thức phục vụ khai thác rộng râi CSDL này, Trung tâm cần sớm hoàn thành các thủ tục về mặt pháp lý trong công tác số hoá tài liệu nói chung và số hoá các bài trích nói riêng. - Đoi với các phim khoa hoc Hiện tại Trung tâm đã đưa một số phim lên mạng nhưng với khối lượiig ít và khả năng truy cập thấp. Hầu hết các phim khoa học đang được phục vụ theo hình thức cung cấp gói tin tới các địa phương nên hiệu quả khai thác chưa rõ rệt. Trong tương lai, để đáp ứng nhu cầu khai thác thông tin từ xa, đặc biệt là những vùng sâu vùng xa đã được trang bị máy tính và mạng máy tính thi các phim khoa học này cần được cung cấp miễn phí trên mạng. Do đặc điểm của những tài liệu phim khoa học là có dung lượng lớn (200 đến 300 Mb/1 phim) nên việc cung cấp sẽ gặp nhiều khó khăn. Bên cạnh những yêu cầu về hạ tầng như đối với CSDL STD, các phim khoa học có những yêu cầu riêng về phần mềm quản lý cũng như các kỹ ứiuật và chương trình để xử lý trước khi cung 3.6.4. Đẩy mạnh công tác tuyên truyền giới thiệu nguền tàì nguyên số nội sình cấp tới NDT. Để phát huy hơn nữa hiệu quả của công tác tuyên truyền, quảng bá nguồn TNSNS, Trung tâm cần tăng cường hoạt động marketing đồng thời ừiển khai thêm các hình thức tuyên truyền giới thiệu khác. Như trên đã trình bày (mục 2.2.5), để đẩy mạnh hơn nữa hoạt động marketing, Trung tâm cần giải quyết số vấn đề sau:
Thứ nhất: về mặt tổ chức. Theo biên chế, hiện tại tổ Marketing chỉ có hai cán bộ nữ, ữong khi hoạt động này đòi hỏi thường xuyên phải đi công tác nên cần bổ sung thêm nhân lực đặc biệt là cán bộ nam.
Thứ hai: về chương trình và kế hoạch Cần xây đựng một chương trình tổng ứiể, trong đó có sự phân chia theo nhóm các viện, trường hay theo địa bàn cần triển khai giới thiệu. Bên cạnh đó cần có sự phân công cụ ứiể đối với những người tham gia không thuộc tổ Marketing để đảm 113 bảo tính chủ động trong công việc. Song song với hình thức tuyên truyền giới thiệu tới tìrng đơn vị, hình thức tuyên truyền quảng bá trên các phương tiện thông tin đại chúng, đặc biệt là mạng Internet cần được chú trọng phát triển. Đổi với các phương tiện thông tin đại chúng như các kênh truyền thanh, truyền hình, có thể giới thiệu nguồn tin trên các chương trình khoa học và giảo dục. Nội dung giới thiệu không càn dài đòng và quan trọng nhất là phải giới thiệu được địa chỉ truy cập tới nguồn tin trên Internet (cần tiả lời câu hỏi nguồn tin có những gì và có thể truy cập ở đâu?) Đối với hình thức tuyên truyền quảng bá trên mạng Internet, đây là hình thức phổ biến hiện nay và cũng là hình thức mang lại hiệu quả cao nhất. Với vị trí và vai trò của Trung tâm hiện nay, hình ứiức tuyên truyền quảng bá các sản phẩm và dịch vụ ngày càng trở nên dễ dàng hofĩi. Điều này được lý gíài như sau: Hiện nay, hầu hết các trường đại học, viện nghiên cứu trong nước đều bị hạn ché về nguồn tin do kinh phí bổ sung hạn hẹp. Trong khi đó, rất nhiều NDT (đặc biệt là đối tượng sinh viên) vẫn chưa biết đến nguồn tin hiện có tại Trung tâm. Đẻ có thể tiếp cận đến một nguồn tin phong phú, đa dạng và quý giá của Trung tâm là điều mà các cơ quan TT-TV đều mong muốn. Mặt khác, sự hỗ trợ của mạng máy tính đã mở ra khả năng kết nối tới tất cả các cơ quan TT-TV lớn nên khả năng truy cập tới nguồn tin tại Trung tâm là hoàn toàn có thể thực hiện. Với những thuận lợi ữên, một phương pháp rất đơn giản và hiệu quả mà Trung tâm có thể tiến hành là tạo ra các kết nối liên kết trang tìm kiếm của các cơ quan TT-TV trong cả nước tới nguồn tài nguyên của Trung tâm. 3.6,5. Phát triển đội ngtl cán bộ Nguồn nhân lực được xem là nhân tố quyết định trong công tác phát triển nguồn TNSNS. Do yêu cầu của công tác phát ữiển nguồn TNSNS đòi hỏi nguồn nhân lực không chỉ ở một ngành, một lĩnh vực nhất định nên việc đồng bộ hoá đội ngũ cán bộ tham gia công tác phát triển nguồn tài nguyên này gặp không ít khó khăn, đặc biệt là cán bộ trong lĩnh vực TT-TV và cán bộ tin học. Thực té cho thấy, số cán bộ có chuyên môn về TT-TV và cán bộ tin học có 114 kiến thức trong lĩnh vực TT-TV tại Trung tâm chỉ chiếm khoảng 15 % (25/165 người), con số này không đủ để đáp ứng yêu cầu cho công tác phát triển nguồn TNSNS hiện nay và trong tương lai. Đa số cán bộ của Trung tâm được đào tạo từ các chuyên ngành khác như công nghệ sinh học, môi trưÒTig, kinh tể,...và được đào tạo thêm nghiệp vụ TT-TV sau khi được nhận về Trung tâm. Để đáp ứng nhu cầu phát triển nguồn TNSNS trong thời gian tới, bên cạnh việc tận dụng kiến thức và kinh nghiệm của lớp cán bộ đi trước Trung tâm cẩn bổ sung thêm nguồn nhân lực, đặc biệt là đội ngũ cán bộ trẻ, đồng thời đẩy mạnh công tác đào tạo và đào tạo lại nghiệp vụ cho lớp cán bộ này. Những nội dung chủ yểu cần được đào tạo gồm: - Kỹ năng tìm kiếm và phát hiện những nguồn tin có giá trị - Kỹ năng biên tập, xử lý bài (đối với cán bộ tham gia xây dựng CSDL dạng bản tin) - Kỹ thuật xử lý nội dung (mô tả, phân loại, định từ khoá, làm tóm tắt,...) đối với tất cả cán bộ tham gia xây dựng CSDL. - Kỹ thuật sé hoá tài liệu (đối với những cán bộ tham gia số hoá) - Sự hiểu biết và khả năng áp dụng các chuẩn nghiệp vụ (ISBD, Marc21, Dublin Core, AACR2, các khung phân loại,...) - Khả năng sử dụng phần mềm hiện có và ứng dụng các phần mềm mới ữong lĩnh vực TT-TV (đối với tất cà cán bộ tham gia phát triển nội dung số). Đối với cán bộ tin học cần đào tạo thêm kỹ năng phát triển các phần mềm hiện có và tiếp cận các phần mềm mới, - Kỹ năng tìm kiếm thông tin trong hệ thống và bên ngoài (đối với tất cả cán bộ tham gia xây dựng và quản lý nguồn TNSNS), đặc biệt lả cán bộ phục vụ. Hình thức đào tạo gồm: - Tổ chức các lớp đào tạo cơ bản và nâng cao tại Trung tâm cho từng đối tượng cụ thề - Tổ chức các cuộc hội thảo về nghiệp vụ cho các cá nhân tham gia thuộc các khâu trong toàn bộ quy trình phát triên nguồn TNSNS. - Mờí các chuyên gia trong nước và nước ngoài thuộc lĩnh vực tham gia đào 115 tạo cho cán bộ - Vận động và tạo điều kiện hỗ trợ cho cán bộ đi đào tạo thạc sĩ và tiến sĩ trong nước cũng như ở nước ngoài. Bên cạnh việc đào tạo và đào tạo lại đội ngũ cán bộ, Trung tâm cần có chính sách thu hút cán bộ có trình độ gắn bó lâu dài với Trung tâm, đặc biệt !à những cán 16 bộ đã được đào tạo tạo từ nước ngoài về. Qua quá trình khảo sát, tìm hiểu toàn bộ quy trình xây dựng và phát triển nguồn tài nguyên số nội sinh tại Trung tâm, đồng thời nghiên cứu các giải pháp khả thi có thể áp đụng cho từng quy trình cụ thể, luận văn đã giải quyết cơ bản nhOnng vấn đề được đặt ra. Trong hoạt động số hoá, luận văn đã tìm ra giải pháp cho những vấn đề về bản quyền, vấn đề đảm bảo nguồn nguyên liệu đầu vào và những giải pháp kỹ thuật trong quy ữình số hoá tài liệu, đồng thời xây dựng được mô hình trao đổi dữ liệu trong nội bộ giữa các bộ phận tham gia phát triển nguồn tài nguyên số nội sinh. Trong công tác xây dựng và tổ chức các bộ sưu tập tài nguyên số nội sinh, luận văn đã đề xuất một số giải pháp kỹ thuật gồm: Áp dụng tiêu chuẩn ưong xử lý nội dung; phối họp giữa các bộ phận tham gia phát triển nội dung số; sủ dụng phần mềm; chia sẻ và phân phối nguồn tin; tổ chức khoa học các bộ sưu tập tài nguyên số nội sinh hiện cỏ tại Trung tâm. Ngoài ra, luận văn cũng nghiên cứu và đưa ra các giải pháp khác có liên quan đến toàn bộ quá trình xây dựng và quản lý nguồn tài nguyên số nội sinh tại Trung tâm như: Đảm bảo an ninh cho nguồn tài nguyên số nội sinh; phổ biến nguồn tài nguyên sổ nội sinh tới người dùng tin và phát triển đội ngũ cán bộ. Bên cạnh những vấn đề đã được nêu ra và giải quyết trên đây, công tác xây dựng và quản lý nguồn tài nguyên số nội sinh tại Trung tâm nói riêng và công tác phát triển nguồn tài nguyên số tại các cơ quan thông tin - thư viện nói chung còn nhiều vấn đề tồn tại cần được giải quyết lĩiột cách thấu đáo. Trong đó có ba vấn đề quan trọng nhất là đảm bảo tính pháp lý cho nguồn tài liệu số hoá, áp dụng các chuẩn dữ liệu và lựa chọn phần mềm quàn lý tài nguyên số. Đây ià những vấn đề phức tạp và phụ thuộc vào điều kiện của từng cơ quan/đơn vị, do vậy cần được tiếp tục nghiên cứu. Tác giả hy vọng trong thời gian tới sẽ được tiếp tục quá trình nghiên 117 cứu những vấn đề nêu trên một cách đầy đủ và hoàn thiện hơn. DANH MỤC TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt 1. Bộ luật Dân sự nước Cộng hoà Xâ hội Chủ nghĩa Việt Nam. số 33/2005/QHl 1 ngày 14 tháng 6 năm 2005, Website: Cục Sờ hữu ưí tuệ, URL;
http://www.noip.gov.vny Cập nhật 10/6/2009 mạng, Website: Trung tâm Thông tin KH&CNQG, URL: http://www.clst.ac.vn,
Cập nhật 9/8/2009 2. Cao Minh Kiểm, Lê Xưân Định, Mộí số suy nghĩ về chuần dữ liệu (rong Ìỉêrì kết 3. Cao Minh Kiểm, Nguyễn Đức Trị, Vũ Anh Tuấn (2000), Đánh giá hiện trạng tổ
chức và khổ mẫu CSDL, phương pháp khai thác ngân hàng dữ liệu KHCN quốc gia
tại Trung íâm TTTLKHCNQG, Trung tâm TTTLKHCNQG, Hà Nội. 4. Đoàn Phan Tân (2006), Thông tin học'. Giáo trình dành cho sinh viên ngành Thông (2005), Website: Cục Sở hữu tuệ, URL: tuệ trí trí 7. tin - Thư viện và Quản trị thông tin, Nxb Đại học Quốc gia Hà Nội, Hà Nội.
5. Hoàng Đức Liên, Nguyễn Hữu Ty (2008), Giải pháp xây dựng các bộ sim tập tài
ỉiệu số, Website: Thuvien.net, URL: http://www.thuvien.net, Cập nhật 20/6/2009
6. Khai trưcmg thư viện số tại UNESCO, Báo Hà Nội mới ngày 20/4/2009, Website;
Báo Hà Nội mới, URL: http:/Avww.hanoìmoi.com.vn/vn, Cập nhật 06/9/2009
Luật Sở hữu
http://www.noip.gov.vn, Cập nhật 25/6/2009 8. Luật sửa đổi, bổ sung một số điều của Luật Sờ hữu trí tuệ, Website: Cục Sở hữu ữí tuệ, URL; http://www.noip.gov.vn, Cập nhật 12/6/2009 9. Nghị định 100/2006/NĐ-CP Quy định chi tiết và hướng dẫn ứii hành một sổ điều
của Bộ luật Dân sự, Luật Sở hữu ưí tuệ về quyền tác giả và quyền liên quan,
Website: Bộ Thông tin và Truyền thông, URL: http://mic.gov.vn, Cập nhật
21/6/2009 10. Nghị quyết số 49/CP về phát triển công nghệ thông tin ở nước ta trong những năm 90, Website: Bộ Giáo dục và đào tạo, URL:
http://vanban.moet.gov.vn, Cập nhật 15/6/2009 11. Ngô Thaiih Nhàn (2007), vấn đề số hoá kho tư liệu hán - nôm theo chuần
Dublincore tại Viện Thông tin Khoa học Xã hội, Website: Đại học Temple, URL:
http://www.temple.edu, Cập nhật 9/6/2009 12. Nguyễn Hữu Hùng (2003), Phát ừiển đào tạo cán bộ ửiông tin thư viện ở Việt Nam, Thông tin và íư ỉiệu, Tr. 8-14 118 13. Nguyễn Minh Hiệp (2004), Thế giới thư viện số, Website: Trưòaig Đại học Khoa học tự nhiên thành phố Hồ Chí Minh, URL:
http://www.glib.hcmuns.edu.vn, Cập nhật 20/6/2008 14. Nguyễn Thị Đào (2007), Xây dựng mục lục liên hợp ữực tuyến cho hệ thống thông
tin khoa học và công nghệ Việt Nam, Hội thảo khoa học "Tiếp cận xây dựng thư
viện sổ ở Việt Nam: Hiện trạng và vẩn đề'\ Trung tâm Thông tin Khoa học và
Công nghệ Quốc gia, Tr. 52-58 15. Nguyễn Hoàng Sơn (2007), Nghiên cứu thư viện số trên thế giới và định hướng
nghiên cứu tliư viện số ờ Việt Nam ''"Tiếp cạn xây dựng thư viện số ở Việt Nam:
Hiện trạng và vấn đ ề'\ Trung tâm Thông tin Khoa học và Công nghệ Quốc gia,
Tr. 10-23 16. Nguyễn Thị Hạnh (2007), Đàm bào chất lượng dữ liệu trong xây dựng ứiư viện
điện tử, Hội thảo khoa học "Tiểp cận xây dựng thư viện sổ ở Việt Nam: Hiện trạng
và vấn để", Trung tâm Thông tin Khoa học và Công nghệ Quốc gia, Tr. 59-64
17. Nguyễn Thị Xuân Bình (2006), Áp dụng MARC21 0 một số ca quan ứiông tin, thư viện tại Hà Nội, Thông tin và tư liệu, số 2, tr. 16-19 18. Nguyễn Tiến Đức (2008), Tình hỉnh an ninh thông tin ờ Việt Nam và sự tiếp cận
ISO/IEC 27001 - Hệ ửiống quản lý an ninh ưiông tin (ISMS), Thông tin và Tư liệu,
Số 4, Tr. 22-23 19. Phạm Văn Rinh, Nguyễn Viết Nghĩa (2007), Phát triền vốn tài ỉiệu trong thư viện
vỏ cơ quan thông tin : Giáo trình dùng cho sinh viên đại học và cao đẳng Ngành
Thư viện - thông tin, Nxb Đại học Quốc gia Hà nội, Hà Nội
20. Số hoá và vấn đề bản quyền, Website: Thuvien.net, URL: http://www.thuvien.net, Cập nhật 18/6/2008 21. Tạ Bá Hưng (2000), Phát ư-iển nội dung số ở Việt Nam: những nguyên tắc chi đạo, ĩhõng tin và Tư liệu, số Tr, 2'6 22. Tạ Bá Hưng í^003), Bước đầu tăng cirờng cung cấp thông tin KHCNphục vụ phát triển kinh íể-xã hội vùng sâu, vùng xa, Trung tâm Thông tin KH&CNQG, Hà Nội 24. Trần Thị Quý, Trần Hữu Huỳnh, Đồ Văn Hùng (2006), Nghiên cứu xãy dựng mục
lục liên hợp trực tuyến cho hệ thống (hư viện công cộng ViệỊ Nam: Đê lài nghiên
cứu khoa học, Đại học Quốc gia Hà Nội. 119 23. Tạ Bá Hưng (2006), Trung tâm Thông tin KHCN Quốc gia: định hướng phát triển
giai đoạn 2006-2010 và tầm nhìn đén năm 2015, Thông tin và Tư liệu, số 1, ử. 89-
95 Tài liệu tiếng Anh 25. About Greenstone software, Website: Greenstone digital library software, URL: http://www.greenstone.org, Cập nhật 14/6/2009 26. Alan Oliver (2009), Digĩtool’s support of web services, Repositories and web
services workshop I, Website: Electronic Theses Online Service , URL:
htlp://wM>w.ethos.ac.uk, Cập nhật 14/6/2009 27. Berne Convention for the Protection of Literary and Artistic Works, Website: Tổ
chức Sờ hữu trí tuệ thế giới (WIPO), URL: http://www.wipo.int, Cập nhật
21/6/2009, 28. CDS/ISIS database soíhvare, Website: UNESCO, URL: http://portal.unesco.org, Cập nhật 10/6/2009 29. Fox Edward A. (1999), The Digital Libraries Initiative: Update and Discussion,
Website: American Society for Information Science, URL: http://www.asis.org,
Cập nhật 14/6/2009 30. Paula J. Hane (2002),Vanderbilt Improves Television News Archive: It’s recently
added TV-NewsSearch offers users a single searchable database, Website:
Vanderbilt university, URL: hnp://tvnews.vanderbiỉt.eđu, Cập nhật 13/6/2009 31. Zope Object Database, Website: Wikipedia, URL: 120 http://en.wỉkipedia.org/wỉkỉ/Zope_Object_patabase, Cập nhật 18/6/2009 PHỤ LỤC 1 BIỂU MẪU NHẬP TIN CHO CSDL STD TINKK«CNQG PHIẾU N H Ậ P TIN
C ơ S ỏ D ữ LIỆU TO À N V Ă N Dạng tài liậu: B ò i irictì tạp ctìí ■ Bà! ịríGtì sầch ■ B6! tnch bào B ài tnch tưỵễn tệp bắo cào KQNC
Bối (rich K ỷ yỐu/Hăĩ nghựHộl thào
BAi nghiồn CÌÁÌ__________________ N h a r đé địch sang tiín g Việt: Tôc giả: ' TẠn lạ p c h i / n g u ổ ri Irich: SỐ: T ệ p ; Ị O ữlĩèu noiưỉn trich: Nâm: Oàc trưng số lưạng: C h i S Ổ đé m ụo q u â o gla: ISSN/ISSN: T ừ k fió a ohinh: Ị Từ khửa phụ: Từtchốa $lnh học: Ký h i ệ u kho. TTKHCNQ Q , Đ i a c ^ l i l u u t ộ p : 121 PHỤ LỤC 2 THIẾT BỊ LƯU GIỮ TÀI NGUYÊN sổ NỘI SINH Dung lirợng Tên CSDL Server đĩa cứng Sách, Tạp chí 01 80 GB (Gigabyte) STD 01 300 GB Các bản tin điện tử 01 100 GB Các tin ngày trên Visía 02 400 GB Các CSDL về chợ công nghệ 01 200 GB CSDL Kết quả nghiên cứu 01 100 GB 122 CSDL Tạp chí VN 01 1 TB (Terabyte) PHỤ LỤC 3 C Ọ N G H O À XẢ H Ọ l C H Ủ N G H ĨA V IẸ T N A M
Độc lập • T ự d o - H ạn iì pliú c «Ơ N OẺ NG HI ĐƯỢC T H A M G íA
DJCH VỤ "B Ậ N ĐỌC ĐẶC B IỆ T " K ính gíri: G iảm đổc T ru n g tâm T h ổ n lỉ tin K H & C N Q u é c 0 » Hộ và tền: ..... .............................................................................................. N gày sin h :.................................. .......................................................... ...... H o c h à n ilio c v i-T rìn h đ ộ :....................................................................... Cliuv*! ngànli;..................... ................. .............................. . SỔ C M r nlứn dâ»................................. cẩp ngảỵ;....................... tại;. Nơi công tíc^ioc tập;............... . .............. ................................... . MẦU ĐƠN THAM GIA DỊCH v ự BẠN ĐỌC ĐẶC BIỆT Đ è nghị c )(0 tôi ditợc thstn giu siirdựng í!^ch vụ " B ạ n d ọ t jaăc b iệt” d o Trui®
tâm T b ồ rg tin K tx » ht>c ^ C ô n g ^ h ệ Q uốc gia cung c lp . Tôi t a n i két Ihực hiện cấc
qdV dinh cús T nm g fJm vồ khsi iW c đich V\1 nãy n h ư anp: - Chí khui thác Iigitàn lÌH d í pbực vụ họQ lập và nghicii cứ u khoa họe, n ồng cao h iầ i bict; - Khòng xiéố)\g (dow nkw d) d ừ liệu nipt eốch !iệ Ihổiig vả A
cưng cAp eho b ín th ứ - l3ào mậl tên Iniv cập và Iiiật khair, tcliân{; cliuyán ẸÌIH) Téi» Ituy cập v à mật k h n i i d iR ,ic c ầ p c h ợ n g u ừ i ỉ c h a c s ứ d ụ n g ; - Chịu trnch nhiộm cá n hìn {vể pháf> luật vả lãi chinh) rf(*i vói nhiíng VT phạm nêu Cữ gựn 0K>ĩ ÌHỤt lỉv y cặp inạog bàiig tỉn lỊgưtíi dvuíg và 1181 kliầii (luục «ã|>. - Dóng góp clũ pW vận hành dịch vụ Ihco Qii>- dinh ciia TniiỉịỊ lâin. /Igày.......... i/KÍng.. .../lăm....... X Á C N H Ậ N C Ú A C ơ Q Ụ A N /O Ơ N V |
(ký và đóng dắu) N G Ư Ờ I L À M fK>N
(ký V IÌ glii rữ họ tê)j) 123 r>ỊHohi: ...............................
D T ;...................................................K ro il:.ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG Đ Ạ I H Ọ C K H O A HỌC XÃ HỘI VÀ N H Â N VĂN
NGHIÊN CỨU XÂY DựNG VÀ QUẢN LÝ
NGUÒN TÀI NGUỴÊN SÓ NỘI SINH TẠI
TRUNG TÂM THÔNG TIN KHOA HỌC
VÀ CÔNG NGHỆ QUÓC GIA
ầ
ỉ.l. Giới thiệu chung về Trung tâm Thống tin Khoa học và
Công nghệ Quốc gia
Chửc năng
Nhỉệm vụ
Nguồn tin
Các dịch vụ chã yếu
1.2. Định hướng phát trỉển Trung tâm trong thời gian toi
Tầm nhìn đến năm 2015
phát triển Trung tâm
Tài nguyên số
Tài liệu sổ
Phãn biệt giữa tài nguyên số và tài liệu số
Bộ sưu tập số
Phân biệt giữa BSTS và CSDL
Nguồn tài nguyên số nội sinh
a, Lựa chọn tài liệu cần sổ hoả
b. Quét tài liệu và xử lỷ file quét
a. Phần mềm và các chuẩn
b. Xây dựng CSDL
D^i(0tdl M<ịu
TA tt
c. Lưu giữ dữ lỉệu số
■
b. Các thiết bị hỗ trợ khai ihảc
Libol
t ì m IdMíin t è l ềệiM ICHCN
, *t A I;
tf-iM tmiL ũtiitb
la Htia ruii: va nnafl.iuâL
11 chhh tri
13 V ĩ n r » a
Í 4 g a o dm:
•II TârA w hnr
‘ - y - V >•
t).u: Iiũỉiị ‘ỉ ị \i ti.-a-.-.v V.. ic:.ị f:í-ii <\it i.Ịi M, "•■•ỉ
d. Cơ chế quản lý người dùng
3.5. Hoàn thỉện hệ thống phần mềm
MetaLib a s a source fpr linkìrtg
m etasea'ching = íederated searcHng =
crcỉss ddtabase searching = paralld searching =
consolỉdábed searching = irteg'ated searching
A&I
Service
Digital
c o lle c tìo n
How đoes It work? - Linking the NEW OpenURL way]
OPAC
Portal
A&I
Servlcâ
SFX glves users
easy access to ali
avaỉlable
resources and
s e rv ic e s
ILL/Doc Del
Citatìan
Manaạer
Leamĩns Mgĩtít
System
http://publish.aps.0t9/afc$tract/P>ỈA/v63 /p062103
RiHText
ĩ ị ầ ỉ ỉ
... !J..l i.
Oi^itại
collection
s
Citatĩon
Manager
I
taarnlng Mgmt
System
How does It work? - Linking the NEW OpenURL way!
System
The SFX Flow
SFX Sourcô«Pi4 ^SFX M enuiiii^ SFX Target
In%roductk>n to SFX
W hy D igiTool ?
- Supports interoperabỉlity through open architecture
» Based on industry standards
3.6. Một số giải phảp khác
KÉT LUẬN
t Am t h ô n g
T v n tá i liệu < N h a n <34 (l<íng V i ^ } .