ĐAĨ H<)( Q V Ù C i ; ỉ ^ lÌA N ộ ỉ

T k ư Ờ N G ỈÌẠỈ H O Í K ì i D A h ọ ì : x ả h ộ i V a n h ả n V à n

PHẠM v â n H ù n g

lÊ N CỮU XÂY DƯNG v i

GUYÊM SỐ NÔỈ SIN

NG

TRUNG TÂM THÔNG TĩN KHOA

VÀ CÔNG NGHỆ QUỐC GIA

LliẬN VÃN THẠC s l THÔNG T iK - THƯ ViỆIS

'■r

*-

Hà N ộ ì-ac

ỊMij^‘iííí|itviii!^i!twMiW

iii7Traiìiriiitfal^ĩff Ji^fl^riftTrnritr

m

¥

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG Đ Ạ I H Ọ C K H O A HỌC XÃ HỘI VÀ N H Â N VĂN

PHẠM VĂN HÙNG

NGHIÊN CỨU XÂY DựNG VÀ QUẢN LÝ NGUÒN TÀI NGUỴÊN SÓ NỘI SINH TẠI TRUNG TÂM THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUÓC GIA

Mã số: 60 32 20

C h u y ê n n g à n h K h o a h ọc th ư v iệ n

L U Ậ N V Ă N T H Ạ C s ĩ T H Ô N G T IN - T H Ư V IỆ N

Hà Nội - 2009

m

N g ư ờ i h ư ớ n g d ẫ n k h o a h ọ c: T S . N g u y ễ n V iế t N g h ĩa

LƠI CẢM ƠN

Để hoàn thành luận văn này, bên cạnh sự tận tâm dạy dỗ của các thầy cô

giáo trong suốt ba năm học tại Trường Đại học Khoa học Xã hội và Nhân văn, tác

giả đã nhận được sự giúp đỡ nlìiệt tình của thầy giáo hướng dẫn và các đồng

nghiệp tại cơ quan nơi công tác. Qua đây, tác giả xin bày tỏ sự biết ơn sâu sắc tới

các thầy cô giáo, đặc biệt là thày giáo hướng dẫn, Tiến sĩ Nguyễn Viết Nghĩa -

người đã tận tâm giúp đỡ tác giả trong suốt quá trình làm khoá luận. Tác giả cũng

xin bày tỏ sự biết ơn tới ông Nguyễn Thắng, chuyên viên tin học của Trung târfi -

người đã giúp đỡ tác giả tiếp cận tới những kiến thức liên quan trong lĩnli vực tin

học; bà Nguyễn Thị Đào, chuyên viên trong lĩnh vực biên mục cùng các đồng

nghiệp thuộc các phòng Phát triển nguồn tin, Tin học, Cơ sở dữ liệu, Thông tin

nông ứiôn miền núi, Phát triển hoạt động thông tin và phòng Tra cứu và cung cấp

tài liệu điện tử đã nhiệt tình giúp đỡ tác giả hoàn thành khoá luận này.

Xin chân ữọng cảm ơn!

Hà Nội, Ngày 20 thảng ỈO năm 2009

MỤC LỤC

MỞ ĐẦU...................... ....................................................................................... ..........3 VAI TRÒ CỬA NGƯÔN TÀI NGUYÊN sổ NỘI SINH ĐỐI VỚI Chương 1. S ự PHÁT ITUỂN CỦA TRƯNG TÂM THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC G IA ....................... ............................................................ .......................7 1.1. Giới thiệu chung về Trung tâiĩi Thông tin Khoa học và Công nghệ Quốc gia..........7 1.2. Định hướng phát triển Trung tâm trong tìbời gian tới.............................................15 1.3. Tẩm quan trọng của nguồn tài nguyên sổ nội sinh đối với sự phát triển Trung tâm 17 1.3.1. Một số khái niệm.......................................................................................... 17 1.3.2. Tài nguyên sổ nội sinh trong sự phát triển của Trung tâm ............................20 THỰC TRẠNG CÔNG TÁC XÂY DựNG VÀ QUẢN LÝ

Chương 2. NGUỒN TÀI NGUYÊN số NỘI SINH TẠI TRUNG T Â M ....................................24 2.1. Nguồn tài nguyên số nội sinh trong cơ cấu vốn tài liệu của Trung tâm.................. 24 2.1.1. Cơ sở dữ Hệu thư mục...............................................................................24 2.1.2. Cơ sở dữ liệu toàn văn..............................................................................24 2.2. Hiện trạng công tác phát triển nguồn tài nguyên số nội sinh................................... 25 2.2.1. Khùng kho pháp lý..........r..............1............................................................ 25 2.2.2. Quy trình tạo lập tài liệu số...........................................................................30 2.2.3. Xây dựng cơ sờ dữ liệu.................................................................................38 2.2.4. Tổ chức khai thác nguồn tài nguyên số nội sinh........................................ 58 2.2.5. Công tác tuyên truyền, giới thiệu nguồn tài nguyên số nội sinh..................70 GIẢI PHÁP TỐI UtJ HOÁ CÔNG TÁC XÂY DựNG VÀ QUẢN Chương 3. LÝ NGUỔN TÀI NGUYÊN s ố NỘI SINH TẠI TRUNG TÂM ..............................72 3.1. Đảm bào tính pháp lý cho nguồn tài nguyên số nội sinh......................................... 72 3.2. Đảm bảo nguồn nguyên liệu đầu vào...................................................................... 77 3.3. Nâng cao chất lượng nguồn tài nguyên số nội sinh.................................................79 3.3.1. l ối ưu hoá còng tác số hoá tài liệu truyền thống............................................79 3.3.2. Hoàn thiện công tác biên mục........................................................................ 81 3.3.3. Tối ưu hoá quá trình ứao đổi và lưu dữ liệu giữa các bộ phận........................88 3.4. TỔ chức lại các bố sưu tập số.................................................................................. 91 3.5. Hoàn thiện hệ thống phần mềm..............................................................................94 3.6. Một số giải pháp khác...........................................................................................107 3.6.1. Tăng cường chia sẻ nguồn tài nguyên số nội sinh........................................ 107 3.6.2. Đảm bảo an toàn cho dữ liệu số................................................................... 110 3.6.3. Xậy dựng cơ chế truy cập phù hợp..............................................................112 3.6.4. Đẩy mạnh công (ác tuyên truyền giới thiệu nguồn tài nguyên số nội sinh....] 13 Phát triển dội ngũ cán bộ..........................................................................1 i4 3.6.5. KẾT LUẬN...................................................................................................................117 rÀI LIỆU THAM KHẢO................................................................................................118 PHỤ LỤC................................................... ................................... .. ..................... 12Ỉ

BẢNG CÁC CHỮ VIẾT TẮT

Bộ sưu tập số BSTS

Công nghệ thông tin CNTT

Cơ sở dữ liệu CSDL

Khoa học và công nghệ KH&CN

Kết quả nghiên cứu KQNC

Người dùng tin NDT

Scientific and technological documents STD

Trans - Eurasia information network TEIN

Tài liệu số TLS

Tài nguyên số TNS

Tài nguyên số nội sinh TNSNS

Thông tin Khoa học và Công nghệ Quốc gia TTKH&CNQG

Thông tin -- Thư viện TT-TV

Thư viện số TVS

Vietnam research and education network VINAREN

MỞĐẲU

Nhân loại đang bước vào kỷ nguyên mới - “kỷ nguyên thông tin”, trong đó

thông tin là nhân tố quyết định mọi hoạt động kinh tể xã hội của con người. Vì ứiế

các quổc gia phát triển đã sớm đề ra chính sách phát triển hạ tầng thông tin quốc

gia, theo đó nhiều dự án phát triển nguồn tài nguyên số và xây dựng thư viện số đã

được triển khai. Trong đó có nhiều dự án mang tính quốc gia như dự án “Digital

libraries iniiiative” ở Mỹ, dự án “Electronic Libraries Programme” ở Anh, dự án

'•Digital Image Library” ờ úc,...C ác dự án này đà mở đường cho chiển dịch phát

triển thư viện số ừên thế giới.

ở Việt Nam, ngay từ đầu những năm 90 chúng ta đã ý thức được vai trò quan

trọng của thông tin trong sự nghiệp xây đựng và phát ưiển đất nước cũng như tỉnh

trạng lạc hậu về ứiông tin của nước nhà. Trên cơ sở đó, Chính phủ đã đặt mục tiêu

"phổ cập văn hoá thông tin" ữong xã hội nhằm tạo môi trường thuận lợi cho đất

nước chuẩn bị hướng tới một "xã hội thông tin" [10].

1. Lý do chọn đề tài: Trung tâm Thông tin Khoa học và Công nghệ Quốc gia với

chức năng là cơ quan đứng đầu hệ thống thông tin khoa học và công nghệ ừong cả

nước, thực hiện chức năng ''thông tin, thĩf viện trung tâm của cả nước về khoa học

và công nghệ MỘI trong những nhiệm vụ quan trọng của Trung tâm Thông tin

Khoa học và Công nghệ Quốc gia là thu thập, quản lý và lưu giữ các nguồn tài liệu

nội sinh quan trọng như kết quả nghiên cứu, tài liệu hội nghị, các tạp chí khoa học

v.v... Bên cạnh những lợi thế về cơ sở vật chất, trang tíiiểt bị và đội ngũ cáti bộ,

Trung tâm Thông tin Khoa học và Công nghệ Quốc gia cũng gặp không ít khó khăn

trong quá trình xây đựng và quản lý nguồn tài nguyên số như tìĩu thập tài liệu, xây dựng quy trình số hóa, xây dựng công cụ tìm kiếm v.v... vấn đề xây dựng và phát triển nguồn tài nguyên sổ đã tìr lâu thu hút được sự quan tâm của nhiều nhà nghiên

cứu. Trong những năm qua, đã có một số công trình nghiên cứu liên quan đến

nguồn tài nguyên số tại Trung tâm như đề tài "Nghiên cứu xây dựng cơ chế tổ chức

và khai thác hiệu quả ngân hàng dữ liệu khoa học và công nghệ quốc gia tại Trung

tâm Thông tin Tư liệu Khoa học và Công nghệ Quốc gia phục vụ sự nghiệp công

nghiệp hoả - hiện đại hoá ” ; một số bài nghiên cứu trên Tạp chí Thông tin & Tư

liệu liên quan đến các hoạt động như số hoá tài liệu, đảm bảo chất lượng tài liệu số,

xây dựng cơ sở dữ liệu,... Tuy nhiên, các công trình trên mới chỉ dừng lại ớ mức

khái quát hoặc nghiên cứu từng khía cạnh của vấn đề hoặc không còn phù hợp với

hoàn cành hiện tại. Thấy được tầm quan ư^ọng của vấn đề xây dựng và quản lý

nguồn tải nguyên số nội sinh và sự thiếu vắng các nghiên cứu có tính hệ thống về

vẩn đề này, tác giả đã mạnh đạn chọn đề tài “Nghiên cứu xây dựng và quản lý

nguồn tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ Quốc

gia” làm đề tài cho luận văn của mình.

2. Mục đích nghiên cứu của đề tài “Nghiên cứu xây dựng và quản ]ý nguồn tài

nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ Quốc gia” là

nhằm hoàn tíĩiện các quy trình xây đựng và quản lý nguồn tài nguyên số nội sinh tại

Trung tâm bao gồm:

- Quy trình xây đựng cơ sở dữ liệu

- Quy trình quản lý, tổ chức khai thác nguồn tài nguyên số nội sinh

Bên cạnh đó, tác giả cũng hy vọng những kinh nghiệm này có thể áp dụng cho

các đơn vị khác ừong hệ thống, đồng thời góp phần hoàn thiện về mặt ỉý luận cho

công tác phát triển nguồn tài nguyên số trong các cơ quan thông tin - thư viện nói

chung.

3. Nhiệm vụ nghiên cứu của đề tài:

- Khảo sát toàn bộ quy trình số hoá tài liệu gồm (khung khổ pháp lý cho công

tác số hoá, thiết bị và phương pháp số hoá)

- Nghiên cứu quy trình xây dựng các cơ sở dữ liệu gồm (các phần mềm, các

chuẩn và những công cụ được sử dụng và quy trình kỹ thuật trong xây dựng cơ sờ

đữ liệu)

- Nghiên cứu công tác tổ chức khai thác nguồn tài nguyên số gồm (các hình thức

cung cấp thông tin, cơ chế quản lý người dùng tin và hiệu quả khai thác nguồn tài

nguyên số)

- Phân tích những thế mạnh, khả năng, thuận ỉựi, ỉdió khăn vả những hạn chế

trong từng quy trinh.

- Xây dựng các mô hình và giải pháp giúp hoàn thiện các quy trình xây dựng và

quản lý nguồn tài nguyên số nội sinh.

4. Đối tượng nghiên cứu của luận văn là toàn bộ hoạt động xây đựng, phát triển

nguồn tài nguyên sổ nội sinh tại Trung tâm, trong đó gồm các cơ sở dữ liệu thư

mục, cơ sở dữ liệu toàn văn và các bản tin điện tử.

Do đặc điểm của đề tài nghiên cứu chù yếu liên quan đến nguồn tài nguyên số

nên phạm vi nghiên cứu của luận văn chỉ tập trung vào công tảc xây dựng, phát

triển nguồn tài nguyên số nội sinh tại Trung tâm Thông tin Khoa học và Công nghệ

Quốc gia từ khi tiến hành xây các cơ sở dữ iiệu (từ năm 1987 đến nay).

5. Phirơng pháp nghiên cứu; Trong quá trình làm luận văn này, tác giả đã sử dụng

phương pháp luận duy vật biện chứng và duy vật lịch sử để nghiên cứu toàn bộ quá

trình xây đựng, phát triển nguồn tài nguyên số nội sinh của Trung tâm, ngoài ra tác

giả còn vận đụng các phương pháp phân tích, tổng hợp tài liệu, quan sát và phỏng

vấn trực tiếp người dùng tin, cán bộ thông tin để tìm hiểu và đánh giá toàn bộ những

vấn đề cỏ liên quan đến công tác xây dựng và phát triển nguồn tài nguyên số nội

sinh.

6. Giả thuyết khoa học xuất phát từ thực tiễn phát triển Trung tâm Thông tin Khoa

học và Công nghệ Quốc gia với mục tiêu trở thành một Trung tâm dữ liệu về khoa

học và công nghệ của cả nước, vấn đề đầu tiên !à cần phát triển một kho đữ liệu số

(trong đó bao gồm cả nguồn tài nguyên số nội sinh) có chất lượng tốt. Bên cạnh đó,

việc quản lý và phổ biến nguồn tài nguyên này cũng cần được nghiên cứu triệt để.

Trên cơ sở tìm hiểu rõ từng quy trình, phát hiện những mặt hạn chế, đồng thời

tham khảo kinh nghiệm và kỹ thuật tại các đơn vỊ trong và ngoài nước, luận văn đưa

ra những giải pháp giúp hoàn thiện toàn bộ quy trình xây dựng và quản lý nguồn tài

nguyên số nội sinh tại Trung tâm.

7. Cấu trúc của luận văn gồm; Phần mờ đầu, phần nội dung và kểt luận, trong đó

phần nội dung gồm có 3 chương:

Chương ỉ: giới thiệu khái quát về Trung tâm Thông tin Khoa học và Công

nghệ Quốc gia; trình bày vị trí, vai trò của nguồn tài nguyên số nội sinh đối với sự

phát triển của Trung tâm đồng thời đưa ra khái niệm tài nguyên số nội sinh và các

ichái niệm liên quan.

Chương 2: Tìm hiểu và đánh giá toàn bộ quy trình phát triển nguồn tài nguyên

số nội sinh tại Trung tâm bao gồm: Quy trình số hoá tài liệu, xây dựng các cơ sở dữ

liệu, lưu giữ tài liệu số và tổ chức khai thác, quảng bá nguồn tài nguyên số nội sinh

lại Trung tâm

Chương 3: Đề xuất các giải pháp tối uu hoá công tác xây dựng và quản lý

nguồn tài nguyên số nội sinh tại Trung tâm như giải pháp cho vấn đề bản quyền

trong công tác số hoá tài liệu; vấn đề đảm bảo nguồn nguyên liệu phục vụ số hoá;

công tác tổ chức, lun giữ và phổ biến nguồn tài nguyên số nội sinh...

Chưong 1. VAI TRÒ CỦA NGUỒN TÀI NGUYÊN số NỘI

SINH ĐỐI VỚI S ự PHÁT TRIÊN CỦA TRUNG TÂM

THỎNG ™ KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA

ỉ.l. Giới thiệu chung về Trung tâm Thống tin Khoa học và

Công nghệ Quốc gia

Lịch sử phát triển

Trung tàm TTKH&CNQG trực thuộc Bộ KH&CN được thành lập ngày 24

tháng 9 năm 1990 tìieo Quyết định số 487/TCCB của Chủ nhiệm Uỷ ban Khoa học

Nhà nước (nay là Bộ KH&CN) trên cơ sờ hợp nhất hai đơn vị:

Thư viện Khoa học và Kỹ thuật Trung ương, 1960-1990

Viện Thông tin Khoa học và Kỹ thuật Trung ương, 1972-1990

Trong thời gian hoạt động, Trung tâm TTKH&CNQG đã thay đổi tên như sau:

Trung tâm Thông tin Tư liệu KH&CN Quốc gia 1990-2004

Trung tâm TTKH&CNQG, 2004 - đến nay

Chức năng nhỉệm vụ và cơ cấu tổ chức

Chửc năng

Ngày 13/5/2004, Bộ KH&CN ban hành Quyết định số 11/2004/QĐ-BKHCN

quy định điều lệ về tổ chúc và hoạt động của Trung tâm TTKH&CNQG.

Theo Điều lệ, Trung tâm TTKH&CNQG là đơn vị trực thuộc Bộ KH&CN, tổ

chức đứng đầu hệ thống các tổ chức thông tin KH&CN, thực hiện chức năng ''thông

tin, thư viện trung tâm của cà nước về KH&CN".

Nhỉệm vụ

Tham gia xây đựng và tổ chức thực hiện các chủ trương, chiến lược, chính

sách, quy hoạch, kế hoạch, văn bản quy phạm pháp luật về hoạt động thông tin

KH&CN; phát triển nguồn lực thông tin KH&CN của đất nước;

Thu thập, chọn lọc, xử lý, lưu trữ và phát triển nguồn tin KH&CN trong nước

và thế giới, đặc biệt ỉà nguồn tin về tài liệu điều tra cơ bản, luận án trên đại học, tài

liệu hội nghị, hội thảo kiioa học, các nhiệm vụ KH&CN đang tiến hành;

Tổ chức và thực hiện đăng ký, lưu giữ kểt quả nghiên cứu khoa học và phát

triển công nghệ;

Thực hiện nhiệm vụ Thư viện trung tâm của cả nước về KH&CN; xây dựng

thư viện điện tử quốc gia về KH&CN;

Tổ chức và thực hiện việc cung cấp thông tin phục vụ lãnh đạo, quản lý nghiên

cứu khoa học, phát triển công nghệ, giáo dục, đào tạo, sản xuất, kinh doanh;

Xuất bản “Sách KH&CN Việt Nam”; Tạp chí “Thông tin và Tư liệu”, ấn phẩm

thông tin; công bổ danh mục các nhiệm vụ KH&CN trong nước đang tiến hành và

kết quả thực hiện các nhiệm vụ KH&CN nói trên;

Phái triển Mạng thông tin KH&CN Việt Nam (VISTA), Chợ ảo Công nghệ và

Thiết bị Việt Nam;

Tổ chức và thực hiện công tác thông tin tuyên truyền KH&CN, đưa tri thức

khoa học đến với mọi người, đặc biệt là ứiông tin KH&CN phục vụ phát triển kinh

tế - xã hội nông thôn, miền núi, phục vụ các doanh nghiệp nhỏ và vừa;

Nghiên cứu khoa học và phát ừiển công nghệ, áp đụng các chuẩn trong lĩnh

vực thông tin, thư viện KH&CN;

Phối hợp tổ chức đào tạo, bồi dưỡng, nâng cao trình độ nghiệp vụ thông tin

KH&CN;

Phối hợp thực hiện các nhiệm vụ hợp tác quốc tế ừong lĩnh vực thông tin

KH&CN;

Được thực hiện các dịch vụ trong lĩnh vực thông tin KH&CN theo quy định

của pháp luật;

Thực hiện các nhiệm vụ khác đo Bộ trưởng Bộ KH&CN giao.

Cơ cấu tổ chức

Theo Điều lệ, cơ cấu tổ chức của Trung tâm có Ban Giám đốc và 15 đơn vị

trực thuộc:

Phòng Phát triển hoạt động thông tin KH&CN 1.

Phòng Phát triển nguồn tin 2.

3. Phòng Cơ sở dữ liệu

4. Phòng Đọc sách

5. Phòng Đọc tạp chí

6. Phòng Tra cứu và cung cấp tài liệu điện tử

7. Phòng Phân tích thông tin

8. Phòng Thông tin tìiị trường KH&CN

9. Phòng Thông tin nông thôn, miền núi

10. Phòng Tin học

11. Phòng Hợp tác quốc tế

12. Phòng Thông tin tuyên truyền KH&CN

13. Phòng I n - s a o

14. Trung tâm Iníoterra Việt Nam

15. Vãn phòng

165

Tổng số

100%

Nguồn nhân lực:

120 Trình độ đại học và ữên đại học 72,72%

7 Tiến sỹ 4,24%

22 Thạcsỹ 13,33%

91 Đại học 55,15%

45 Trình độ khác 21,81%

Nguồn tin và các dịch vụ

Nguồn tin

Trung tâm TTKH&CNQG là đơn vị có nguồn lực thông tin lớn nhất cả nước với

nhiều dạng tài liệu khác nhau:

- Tài liệu dạng in gồm có:

+ Sách: Trên 450.000 đầu sách

+ Tạp chí; Khoảng 7.000 tên tạp chí và ấn phẩm kế tiếp xuất bản ữên giấy,

trong đó có gần 1000 tên tạp chí được bổ sung thường xuyên.

+ Kết quả nghiên cửu: Khoảng 9000 báo cáo kết quả nghiên cứu của các đề tài

các cấp

- Các CSDL do Trung tâm xây dựng

Hiện Trung tâm có trên 10 CSDL, trong đó có các CSDL lớn được xây đựng

từ nhiều năm trước như STD (Tài liệu KH«&CN Việt Nam) được xây dựng từ năm

1987; Book (Sách tại Thư viện Khoa học Kỹ thuật Trung ương); KQNC (Báo cáo

kết quả nghiên cứu khoa học),...

- Các CSDL KH&CN thế giới:

Trên 10 CSDL, trong đó có các CSDL nổi tiếng nhu lEEE/IEE Pulltext (Thư

viện điện tử về CNTT, điện và điện tử) Chemical Abstracts (Tạp chí tóm tắt về hoá

học); PASCAL (CSDL đa ngành về KH&CN), đặc biệt là các CSDL trực tuyến như

ScienceDirect, EBSCO, WEB 0 F SCIENCE, EBRARY,...

- Mạng Vista

Mạng Thông tin KH&CN Việt Nam (Vietnam Information for Science and

Technology Advance) bao gồm nhiều dịch vụ về KH&CN như:

+ Các dịch vụ thư viện thông qua Web site Thư viện Khoa học và Kỹ thuật

Trung ương (www.clst.ac.vn)

+ Khai thác ứiông tin KH&CN trên các CSDL thư mục và toàn văn của Trung

tâm TTKH&CNQG

+ Khai tíiác các thông tin trong chợ ảo về công nghệ và thiết bị Việt Nam

thông qua web site www.techmartvietnam.com.vn

+ Cung cấp các dịch vụ Internet (World Wide Web, Truyền tệp, Thư điện tử,

Dịch vụ Web hosting,,.)

+ Quảng cáo ữên mạng VISTA

- Chợ Công nghệ và Thiết bị Việt Nam trên mạng (Techmart ảo)

Chợ công nghệ ảo có chức năng giới thiệu công nghệ, thiết bị cần mua và chào

bán trong và ngoài nước đồng thời là sàn giao địch về công nghệ, thiết bị và tư vấn

KH&CN.

- Xuất bản phẩm

Hiện Tmng tâm có hàng chục xuất bản phẩm dạng in như Sách KH&CN Việt

Nam; Tạp chí Thông tin & Tư liệu; Tổng luận Khoa học - Công nghệ - Kinh tế và

hàng chục bản tin điện tử như Nông thôn đổi mới; Khoa học công nghệ và môi

trường; Vietnara iníoteưa nevvsletter,..,

- Các chương trình phim KHCN

Các phim KH&CN ưong nước và nước ngoài được cung cấp cho NDT dưới

10

dạng các đĩa VCD, DVD theo yêu cầu

Các dịch vụ chã yếu

+ Dịch vụ phục vụ bạn đọc

+ Thông tỉn phục vụ cho công tác hoạch định chính sách, xây dựng chiến lược

và dự báo về kinh tế, KH&CN.

+ Cung cẩp tìiông tin về thị trường công nghệ, chuyển giao công nghệ, các cơ

hội liên doanh với bạn hàng trong và ngoài nước

+ Tổ chức các hội thảo, hội nghị khách hàng, triển lãm, chợ công nghệ nhằm

giới thiệu công nghệ và sản phẩm mới.

+ Tra cửu và chỉ dẫn theo các yêu cầu thông tin của các cá nhân, tổ chức, cơ

quan

+ Dịch vụ phổ biến thông tin có chọn lọc

+ Cung cấp nội dung thông tin trực tuyến trên Internet

+ Tổ chức các khoá đào tạo nghiệp vụ theo yêu cầu

+ Tư vấn về công tác xây đựng, tổ chức, điều hành tìiư viện, cơ quan thống tin

+ Tổ chức các đoàn nghiên cửu, khảo sát và học tập ở nước ngoài về thông tin

KH&CN

Công tác nghiên cứu và đào tạo

Công tác nghiên cứu được đẩy mạnh theo hướng gắn kết với những yêu cầu

thực tiễn, góp phần nâng cao chất lượng hoạt động chuyên môn, nghiệp vụ của

Trung tâm TTKH&CNQG. Trong đó tập trung vào hiện đại hoá hệ thống thông tin

KH&CN, xây dựng thư viện điện tử, xây dựng và áp dụng các tiêu chuẩn quốc gia,

quốc tế vào hoạt động thông tin, thư viện.

Hàng năm Trung tâm tổ chức trên 20 khoá đào tạo cho cản bộ thông tin

KH&CN trong mạng lưới. Đặc biệt, nội dung đào tạo, bồi dưỡng nghiệp vụ được

chú trọng hướng vào các vấn đề ứng dụng CNTT và các tiêu chuẩn quốc tế vào hoạt

động TT-TV.

Hợp tác quốc tế

Trung tâm TTKHếfeCNQG trao đồi thông tin, tài liệu với hoTti 50 tổ chức của

35 nước trên thế giới; họp tác song phương, đa phương với các thư viện và các

trung tâm thông tin cùa hơn 70 nước trên thế giới.

11

- Tnmg tâm TTKH&CNQG ỉà thành viên cùa

+ UNESCO/IFA, Chương trình Thông tin cho mọi người (Trụ sờ tại Paris,

Pháp)

+ IFLA - Hiệp hội Thư viện Quốc tế (Trụ sở tại Hague, Hà Lan)

+ ICSTI - Trung tâm Thông tin KH&CN Quốc tế

- Trung tâm TTKH&CNQG là đầu mối quốc gia của:

+ INPOTERRA" Mạng Thông tin Môi trường Toàn cầu

+ APIN - Mạng Thông tin châu Á - Thái Bình Dương (Trụ sở tại New Deỉhi,

ấn Độ)

+ Trung tâm ISSN Quốc tế (Trụ sở tại Pari, Pháp)

+ Mạng ứiông tin khoa học công nghệ ASEAN

+ Mạng Nghiên cứu và đào tạo Á-Âu (TEIN2, TEIN3)

Quá trình ứng dụng công nghệ thông tin và những thành tựu đạt được

Trung tâm TTKH&CNQG là một ừong những đơn vị đi tiên phong và đạt

được nhiều thành quả trong việc ứng dụng CNTT. Từ những năm 80 của thế kỷ XX

Trung tâm đã triển khai nghiên cứu áp dụng CNTT vào hoạt động. Quá trình này

được chia thành những giai đoạn sau:

Giai đoạn mở đầu bằng việc sử dụng các máy tính IBM 360, họ máy tính ES

để tổ chức và phục vụ thông tin, Viện thông tin Khoa học và Kỹ thuật Trung ương (

tiền thân của Trung tâm TTKH&CNQG) đã iđiai thác các băng từ thông tin

KH&CN của Trung tâm Thông tin Khoa học Kỹ thuật Quốc Tế để phục vụ thông

tin chọn lọc cho NDT trong nước bằng cách tận dụng công nghệ truyền tin mạng

viễn thông quốc tế, Viện đã tiến hành các đợt thử nghiệm truy cập từ xa -

Teledostup" vào các CSDL của Trung tâm Thông tin Khoa học Kỹ thuật Quốc Tể

Với tốc độ 8 bíưgiây. Các ứng dụng CNTT thời kỳ này mới chỉ mang tính thử

nghiệm, rất ít sản phẩm được áp dụng trên quy mô công nghiệp. Phần mềm được sử

dụng để xây dưng CSDL và số hoá các nguồn tin chủ yếu là Dbase.

Giai đoạn tiếp theo từ 1990-1997, với sự đầu tư của nhà nước việc số hoá các

nguồn tài liệu được triển khai bằng việc xây dựng các CSDL thư mục do các cơ

quan thông tin thư viện trong nước đảm nhiệm. Hệ thống quản lý thư điện tử

TOOLNET do Hà Lan hỗ trợ, Mạng Thông tin Kinh tế, KH&CN Việt Nam (mạng

12

VESTENET) với hàng chục CSDL của Trung tâm TTKH&CNQG và các CSDL

thư mục khác do các cơ quan thông tin trong rnạng lưới xây dựng là cơ sở để tiến

hành việc tổ chức phục vụ thông tin trực tuyến trong cả nước. Các CSDL này có thể

làm việc được trên mạng, sử dụng phần mềm quản trị CDS/ISIS. Dbase, Poxpro, bộ

mã tiêu chuẩn TCVN 5712 đã được đưa vào áp dụng, ở giai đoạn này, NDT có thể

khai thác các dịch vụ và sản phẩm thông tin bằng phương thức truy cập từ xa vào

các CSDL trên (được cài đặt trên máy chủ) tra cứu ừên CD-ROM (on-line), hoặc

mạng nội bộ hay đặt hàng theo phương thức dịch vụ ứiông tin có chọn lọc. Tháng

11/1997 cùng với mốc Việt Nam chính thức hoà mạng Internet, Trung tâm

TTKH&CNQG là một trong những cơ quan đầu tiên đã két nối mạng Internet và

đưa mạng của mình (lúc này đã đổi tên thành Mạng Thông tin KHCN Việt Nam-

VISTA chạy trên hệ điều hành Windows NT) lên phạm vi toàn cầu.

Giai đoạn 1998-2002, việc sổ hoá các nguồn tài liêu của Trung tâm

TTKH&CNQG được nâng lên một bước về chất lượng nhờ ứng dụng công nghệ

Internet và phát ừiển CSDL tích hợp. Trung tâm đã tập trung xây dựng mạng

VISTA ừên cơ sở công nghệ Web tĩnh với hệ điều hành là Windows NT, địa chi

URL là: http://www.vista.gov.vn. Cũng trong thời gian này các hệ quản trị CSDL

như SQL server, Oracle đã được triển khai nghiên cứu nhưng chưa đưa vào sử

dụng.

Ciai đoạn 2003 đến nay được đánh dấu bằng việc áp dụng công nghệ mới

(công nghệ Portal) để xây dựng và tổ chức mạng thông tin tích hợp dữ liệu KH&CN

với trang web động có khả năng liên kết dữ liệu với hệ điều hành Windows 2000 và

■Winđows 2003, hệ quản trị CSDL là MSQL server, Oracle,....Đặc biệt, từ đầu năm

2004 Trung tâm tiến hành xây dựng CSDL toàn văn Tài liệu KH&CN Việt Nam

trên cơ sở sổ hoá các bài trích trong các tạp chí khoa học và những tài liệu hội nghị

hội thảo khoa học. Cũng trong năm 2004, Trung tâm tiến hành xây dựng thư viện

điện tử với phần mềm Libol của Công ty Tinh Vân và triển khai các CSDL thư mục

về tài liệu KH&CN Việt Nam. Do vậy phưong thức truy cập mở được ừiển khai và

áp dụng mạnh mễ giúp cho NDT lchai thác các sản phẩm và dịch vụ thông tin một

cách dễ dàng và thuận tiện hoTi.

Một trong những sự kiện đánh đấu một bước phát triền raới ưong quá trình

13

ứng dụng CNTT tại Trung tâm là Dự án TEIN2 (Dự án nhằm hỗ trợ các nước đang

phát triển trong ASEM thông qua việc cung cấp và củng cố đường trục (backbone)

tốc độ cao lên tới 155 Mbps cho liên khu vực Âu-Á ). Dự án này được bắt đầu từ

đầu năm 2004 và đã mở ra cơ hội lớii đối với cộng đồng NDT Việt Nam nói chung

và đối với Trung tâm TTKH&CNQG nói riêng. Tháng 4 năm 2006 Trung tâm

TTKH&CNQG được Bộ KH&CN giao cho nhiệm vụ làm đầu mối và chủ tri tham

gia dự án TEIN2. Đây là một sự kiện quan ừọng đánh mở đầu cho sự ra đời và phát

triển của mạng VINAREN.

Mạng VINAREN ỉà mạng Nghiên cứu và Đào tạo quốc gia hoạt động phi lợi

nhuận, chính thức khai tnromg trên toàn quốc ngày 27/3/2008, do Trung tâm phát

triển và quản lý. Mục tiêu của VINAREN là xây dựng và phát triển Mạng nghiên

cứu và đào tạo Việt nam kết nối với các mạng nghiên cứu và đào tạo của các nước

trong khu vực và trên thế giới nhằm nâng cao hiệu quả, thúc đẩy họp tác và hội

nhập quốc tể trong lĩnh vực nghiên cứu và đào tạo thông qua TEIN2, TEIN3 với tốc

độ từ 45 đến 155 Mbps. Thành viên VINAREN bao gồm các viện nghiên cửu,

trường đại học, bệnh viện và trung tâm thông tin hàng đầu trong nước. VINAREN

kết nối các nhà nghiên cứu và đào tạo Việt Nam với cộng đồng 30 triệu nhà khoa

học ở khu vực châu Á-Thái Bình Dương, châu Âu và các khu vực khác.

Sau một năm hoạt động, đến năm 2Ọ08 quy mô của VINAREN đã vươn tới

hơn 50 trung tâm nghiên cứu và đào tạo quan trọng của đất nước thuộc 11 tỉnh,

thành phố. Năm 2008 cũng là năm thử nghiệm việc truy cập, khai thác các nguồn

tin số hoá, trực tuyến trong nước và quốc tế giữa các thành viên của VINAREN ờ cả

trong và ngoài nước. Lần đầu tiên các CSDL KH&CN trong nước đo Trung tâm

Thông tin KH&CN Quốc gia xây dựng được đưa lên mạng VINAREN để truy cập

và khai thác theo chế độ mạng.

Tóm lại, có ứiể thấy quá trình ứng dụng CNTT tại Trung tâm TTKH&CNQG

đã diễn ra rất sớm, nhanh chóng và hiệu quả. Tuy nhiên, các giai đoạn phát triển

phụ ứiuộc vào sự phát triển chung trong lĩnh vực CNTT. Đẻ có được những thành

quả trên là nhờ có sự quan tâm ngày càng tăng của Nhà nước đến lĩnh vực TT-TV.

Bên cạnh đó cũng phải kể đến những nỗ lực không mệt mỏi của các thế hệ cán bộ

của Trung tâm trong việc thúc đẩy phát triển ứng dụng CNTT vào hoạt động. Với

14

những điều kiện về công nghệ hiện nay, trong một thời gian không xa nữa Trung

tâm TTKH&CNQG có thể trở thành một Trung tâm thông tin/TVS tầm cỡ quốc tế.

Để nắm bắt những cơ hội này, đòi hỏi phải có những nghiên cứu mang tính toàn

diện và tuân theo xu hướng chung của thế giới, đó là tập trung nghiên cứu phát triển

và quản lý nguồn TNS.

1.2. Định hướng phát trỉển Trung tâm trong thời gian toi

Để phấn đấu xây dựng Trung tâm trở thành tập đoàn dịch vụ công về thông tin

KHCN, Trung tâm TTKH&CNQG đã đưa ra 10 định hướng phát triển giai đoạn

2006-2010 và tầm nhìn đến 2015, trong đó hầu hết các nội dung đều liên quan đến

việc xây dựng và quản !ý nguồn TNSNS đó là:

- Xúc tiến và phát triển thị trường công nghệ trong đó tập trung vào xăy dựng

CSDL đa phưcmg tiện "Hồ sơ công nghệ" nhằm tư liệu hoá và giới thiệu, phổ biển

thông tin về;

+ Kết quả nổi bật cùa các chương ưình, đề tài, dự án KHCN trọng điểm cấp

Nhà nước qua các giai đoạn.

+ Hồ sơ các công nghệ sẵn sàng cho chuyển giao, nhân rộng.

+ Phim tư liệu KHCN.

+ Hồ sơ các phát minh, sáng chế có tính đột phá của KHCN thế giới.

- Phát triển hệ thống thông tin KHCN nông thôn thông qua việc tăng cường cung

cấp thông tin KHCN phục vụ phát triển kinh tế - xã hội nông thôn, miền núi, theo

hướng:

+ Hỗ trợ các địa phương nhân rộng mô hình cung cấp thông tin KHCN phục

vụ phát triển kinh tế - xã hội tại cơ sờ (xã, phường).

+ Xây dụmg và phát ưíển mô hình phổ biến ừi thức khoa học và thông tin

chuyển giao công nghệ tuyến quận, huyện.

+ Hình thành và phát triển Mạng thông tin KHCN nông ứiôn, miền núi hoạt

động trên quy mô toàn quốc (từ Trung ương tới cơ sở).

- Phái triển dịch vụ thông tin KHCNphục vụ các doanh nghiệp (heo hướng:

+ Phát triển Ngân hàng cung cấp thông tin KHCN phục vụ các doanh nghiệp,

15

nhất là các doanh nghiệp vừa và nhỏ.

+ Triển khai dịch vụ thông tin cảnh báo cạnh tranh và cảnh bảo chiến luợc

nhằm hỗ trợ phát triển các ngành hàng chủ lực của Việt Nam.

+ Triển khai các dịch vụ tì*a cứu - chỉ dẫn thông tin theo yêu cầu của các doanh

nghiệp.

+ Hình thành và phát triển Mạng thông tin KHCN phục vụ các doanh nghiệp.

- Hiện đại hoả vá nâng cao chất ỉượng hoạt động của Thư viện Trung ương của

cả nước về KHCN với các nội dung:

+ Tổ chức và triển khai Dịch vụ cung cấp tài liệu theo yêu cầu

+ Phát triển liên kết bổ sung và chia sẻ nguồn tin KHCN (Vietnam Consortium

on STI Resources).

- Hoàn thiện và phát triển Mạng thông tin KHCN Việt Nam - Trung tâm liên kết

mạng lưới các tề chức dịch vụ thông tin KHCN theo hướtíg:

+ Hoàn thiện và nâng cấp hệ thống phần mềm theo hướng một cổng thông tin

tổng hợp về KHCN của Việt Nam.

+ Phát triển các nội dung số hoá theo hướng chuyên nghiệp và hiện đại.

+ Thưòrng xuyên nâng cấp năng lực ừuy cập, lưu giữ, xử lý, an nính và phổ

biến thông tin trên mạng.

- Triển khai Trung tâm đăng kỷ, Imi giữ và phổ biến các kêt quá nhiệm vụ KHCN

trong đó tập trung vào việc:

+ Xây dựng và vận hành CSDL toàn văn về các đề tài, dự án.

+ Tổ chức phổ biến, cung cấp thông tin kịp thời, đầy đủ về các đề tài, dự án

KHCN đang tiến hành và thông tin về két quả các nhiệm vụ KHCN đã hoàn thành.

- Đẩy mạnh công tác nghiên cứu và phân tích thông tin phục vụ lãnh đạo, quản lý

với các nội dung:

+ Thực hiện tốt nhiệm vụ đầu mối cung cấp thông tin phân tích cho các cơ

quan lãnh đạo Đảng và Nhà nước.

+ Thực hiện tốt nhiệm vụ cung cấp nội dung về KHCN trên Website của

Chính phủ.

- Xây dựng Thư viện điện tử quốc gia về KHCN trong đó tập trung vào việc xây

16

dựng và triển khai bước đầu dự án Thư viện điện từ quốc gia về KH&CN tại khuôn

viên 24-26 Lý Thường Kiệt, Hà Nội theo hướng một Tổ hợp dịch vụ công về ihông

tin KHCN, bao gồm:

+ Thư viện điện tử Trung ưcmg của cà nước về KHCN với vai trò đầu mối Hên

kết trung tâm (Central Hub) của Hệ thống thông tin quốc gia về KHCN, đủ sức

phục vụ hàng vạn người tại chỗ và hàng triệu người qua mạng.

+ Trung tâm giao dịch quốc gia về công nghệ - trung tâm thúc đẩy thương mại

hoá sản phẩm KHCN và cầu nối các nhà khoa học và các doanh nghiệp.

+ Trung tâm giao lưu, hội nghị, hội thảo khoa học quốc gia và quốc tế.

+ Bảo tàng Trung ương về KHCN của Việt Nam.

Tầm nhìn đến năm 2015

Tới năm 2015, Trung tâm Thông tin KHCN Quốc gia phấn đấu ttở ứiành Tập

đoàn dịch vụ công về thông tin KHCN, trong đó có:

- Thư viện điện tử quốc gia về KHCN đạt trình độ tiên tiến trong khu vực;

- Ngân hàng dữ liệu quốc gia cung cấp thông tin KHCN cần ứiiết cho các doanh

nghiệp, các tổ chức KHCN;

- Trung tâm xúc tiến thị trường công nghệ, bao hàm Sàn giao dịch điện tử về

công nghệ, Techmart Việt Nam, Techmart khu vực,...;

- Mạng thông tin KHCN Việt Nam - mạng nòng cốt của Hệ thống thông tin quốc

gia về KHCN.

- Trung tâm nghiên cứu và đào tạo nguồn nhân lực về thông tin KHCN;

- Bảo tàng quốc gia về KHCN góp phần giáo dục truyền thống và nâng cao nhận

hX Tầm quan trọng của nguồn tài nguyên số nội sình đối vửi sự

thức của xã hội về ICHCN,

phát triển Trung tâm

1.3.1. Một số khái niệm

Để tìm hiểu khái niệm nguồn TNSNS, cần có cách hiểu đúng đắn về TNS,

TLS và BSTS. Trong đó cần phân biệt rõ khái niệm TLS và TNS.

Tài nguyên số

Hiện tại vẫn chưa có khái niệm rõ ràng về TNS. Tuy nhiên, TNS được hiểu là

17

toàn bộ thông tin do con người tạo ra dưới hình thức số hoá nhằm mục đích phục vụ

cho những lợi ích của con người. Nguồn TNS có thể tồn tại dưới nhiều dạng khác

nhau (dạng văn bản, dạng hình ảnh và âm thanh hoặc kết hợp hai hay ba dạng trên).

Nguồn TNS cũng có ứiể tồn tại dưới đạng thư mục hay dạng toàn vãn.

Tài liệu sổ

Theo từ điển giải nghĩa cùa Mindwrap, “Tài liệu số” là những tài liệu được

lưu giữ bằng máy tính. TLS có thể được tạo lập bởi máy tính như việc xử lý các file

văn bản, các bàng biểu hoặc chúng có thể được chuyển đổi sang dạng số tìr những

tài liệu dạng khác. TLS cũng được đề cập đến như là tài liệu điện tử.

Từ định nghĩa trên cho thấy, TLS được xây dựng thông qua hai kênh:

- Kênh 1; Tạo lập tài liệu gốc bằng máy tính thông qua việc xử lý các file văn bản,

hình ảnh, bảng biểu,...

- Kênh 2: Tạo lập TLS thông qua hình thức chuyển đổi định dạng các tài liệu đã

được tạo lập ở dạng khác như (Scan, ghi âm ,...)

Tóm lại có thể hiểu TLS là tất cả những tài liệu được trình bày dưới dạng số

mà máy tính có thể đọc được.

Phãn biệt giữa tài nguyên số và tài liệu số

Hiện nay, vẫn chưa có sự lý giải xác đáng nào về sự phân biệt hai khái niệm

trên. Tuy nhiên có thể khẳng định rằng:

+ TLS thuộc về nguồn TNS

+ Một số dạng của TNS không phải là TLS

Thí dụ:

Một biểu ghi thư mục ưên máy tính không thể coi là TLS bởi vì bản thân một

biểu ghi thư mục không được coi là một tài liệu. Do vậy, khi chúng ta đề cập đến

vấn đề “biên mục cho tài liệu s ổ ” các biểu ghi thư mục sẽ không thuộc diện đối

tượng biên mục.

Bộ sưu tập số

Theo từ điển giải nghĩa các thuật ngữ khoa học của trường Đại học Bay Lor,

"bộ sưii tập số là bộ sim tập của thư viện hoặc các tài liệu Itm trữ được chuyển đổi

sang định dạng thuật ngữ máy tính nhằm mục đích bảo quản hoặc phục vụ truy cập

18

điện tử ”

Tốĩíí -Íậỉybộ sưu tập số được hiểu là “ một tập hợp cỏ tố chức nhiều tài liệu đã

được sổ hoá dưới nhiều hình thức khác nhau (văn bản, hình ảnh, Audio, Video...)

về một chủ đề. Mặc dù mỗi loại hĩnh tài liệu có sự khác nhau về cách thể hiện,

nhưng nỏ đều cung cấp một giao diện đồng nhất mà qua đỏ các tài ỉiệu cổ thể truy

cập d ễ dàng'' [5].

Vỉ dụ:

Bộ sưu tập số về chủ tịch Hồ Chí Minh gồm các văn bản, các tác phẩm văn

hpc, các văn kiện chính trị đo Bác viết và do người khác viết về Bác; những bài hát,

bòn nhạc viết về Hồ Chí Minh; những đoạn phim, những băng video phản ánh cuộc

dời và sự nghiệp hoạt động cách mạng cùa Người. Trên ứiế giới đã có những bộ sưu

tập lớn được xây đựng nhằm phục vụ khai thác trên web như Bộ sưu tập các tin tức

truyền hình Vanderbilt Television News Archive do trường đại học Vanderbilt xây

dựng, bộ sưu tập này tập hợp các tin túc đã được phát trên truyền hình từ tháng 8

nảm 1968 của các kênh truyền hình ABC, CBS, NBC, CNN, Fox News và tin tức từ

một số mạng truyền hỉnh khác [30].

Như vậy, một TVS có thể bao gồm nhiều bộ sưu tập theo các chủ đề khác

nhau, có thể do tập thể hoặc cá nhân tự xây dựng hoặc ừao đổi, mua bán. Các BSTS

có thể được lưu giữ tại thư viện nhưng cũng có thể nằm ngoài thư viện thông qua

một kênh cung cấp từ phía đối tác (ví dụ: CSDL toàn văn mua quyền truy cập theo

thời gian như Science direct, Ebrary,...).

Phân biệt giữa BSTS và CSDL

Hiện nay, có nhiều quan niệm khác nhau về BSTS, có những quan niệm cho

rằng, CSDL cũng chính là BSTS. Điều này theo chúng tôi là chưa chính xác bởi lẽ:

Theo khái niệm về tài liệu và TLS thì một biểu ghi thư mục không phải là

TLS. Trong khi đó, BSTS được định nghĩa là “wộ/ tập hợp có tồ chức nhiều tài ỉiệu

đõ được sổhoá... Như vậy, một CSDL thư mục không tìiể gọi là BSTS.

Nguồn tài nguyên số nội sinh

Như trên đã trinh bày, nguồn TNS có thể bao gồm nhiều BSTS/CSDL khác

nhau, trong đó có những BSTS/CSDL do chính cơ quan, tổ chức tự thiết kế xây

19

dựng và những bộ sưu tập được mua hoặc trao đổi từ bên ngoài. Như vậy, chúng ta

c6 ứiể coi nguồn TNSNS là nguồn tài nguyên do cơ quan/tổ chức, tự xây đựng dưới

dạng bộ sưu tập.

Nguồn TNSNS gồm một số đặc trưng sau:

+ Do cơ quan/đơn vị tạo ra hoặc tự thu thập, xử lý và xây dựng

+ Phải được xử lý bời cơ quan/đơn vị sở hữu

+ Có thể được sản sinh ra ừong quá trình hoạt động của cơ quan, tổ chức (các

báo cáo, thống kê, bản tin hoạt động,...)

+ Lưu giữ cục bộ trên máy tính, server riêng

+ Có thể bao gồm những tài liệu từ bên ngoài được xử lý và tổ chức lại theo

một cơ ché thống nhất.

+ Có thể truy cập từ xa thông qua mạng máy tính

Thí dụ, nguồn TNSNS tại Trung tâm TTKH&CNQG là toàn bộ những sản

phẩm do Trung tâm làm ra dưới dạng sổ hoá như biểu ghi thư mục, biểu ghi toàn

văn, các bản tin điện tử ,...

Tóm lại, nguồn TNSNS là nguồn tài nguyên được sản sinh ra ngay trong cơ

quan/đơn vị chứ không phải những nguồn tài nguyên được mua hay trao đổi tìr bên

ngoài mà chưa được xử lý hay biên soạn lại.

U .2 . Tài nguyên sổ nội sỉnb trong sự phát triển cửa Trung tâm

Trong 10 định hướng phát triển và tầm nhìn chiến lược đến năm 2015 của

Trung tâm, nguồn TNSNS giữ vị trí quan trọng hàng đầu thể hiện ở một số điểm

chính sau:

- Nguồn TNSNS đóng vai trò quan trọng giúp thực hiện chức năng lưu giữ và

quản lý kho tài liệu truyền thống tại Trung tâm.

Một trong những nhiệm vụ quan trọng của Trung tâm được quy định trong

Điều 16 Nghị định số 159/2004/NĐ-CP ngày 31/8/2004 của Chính phủ về hoạt

động thông tin khoa học và công nghệ và Điều 25 Luật Khoa học công nghệ là

“Đăng ký, hiến tặng và ỉưu giữ kết quả tíiực hiện nhiệm vụ khoa học và công nghệ”.

Bến cạnh đó, quá trình lưu giữ toàn bộ nguồn tài liệu truyền thống tại Trung tâm

cũng phụ thuộc rất nhiều vào nguồn TNSNS (giúp thực hiện chức năng thống kê,

20

quản lý tài liệu truyền thống)

- Nguồn TNSẩVS ỉà cơ sở để Trung tâm phổ biến nguồn tài liệu truyền thống hiện

có.

Trong điều kiện hiện nay, hầu hết các cơ quan TT-TV đã ứng dụng CNTT vào

hoạt động và cho phép tra cứu bằng máy tính, đặc biệt là tra cứu thông qua mạng

Iniemet. Do đó, nguồn TNSNS được coi là phương tiện duy nhất giúp NDT có thể

tiếp cận đến nguồn tài liệu truyền thống.

Trung tâm TTKH&CNQG là một trong những cơ quan lưu giữ kho tài liệu

truyền thống lớn nhất cả nước và giá trị idioa học cao bao gồm sách, tạp chí khoa

học kỹ thuật, báo cáo các đề tài đang tiến hành, kết quả nghiên cứu,.... Do vậy, việc

tạo .ập các điểm truy cập tới kho dữ liệu quý này thông qua nguồn TNSNS có ý

nghĩa quyết định hiệu quả khai thác kho dữ liệu truyền thống.

- Nguồn TNSNS giúp đẩy nhanh quá trình hiện đại hoá Thư viện Trung ương

Theo số liệu thổng kê của Trung tâm năm 2007 và 2008 cho tìiấy, lượng bạn

đọc đến khai thác tài liệu dạng truyền thống tại Tung tâm ngày càng giảm đi. Nếu

như năm 2007, Trung tâm phục vụ 70.725 lượt bạn đọc thì năm 2008 con số này

giảni xuống còn 67.824 lượt, thay vào đó, số lượng NDT truy cập vào các CSDL

của Trung tâm để khai thác dữ liệu ngày càng tăng lên. Chỉ tính riêng dịch vụ “Bạn

đọc đặc biệt" trong 6 tháng đầu năm 2Ọ09 đã thu hút 28.998 lượt người truy cập với

khố. lượng bài toàn văn được dovvnload lên tới 28.074 bài. Điều đó cho thấy, trong

bối cảnh hiện nay, hình thức phục vụ tài liệu dạng truyền thống đã và đang nhường

chỗ cho phương thức cung cấp tài liệu ừực tuyến. Do vậy, để đẩy nhanh quá trình

hiệr đại hoá và nâng cao chất lượng hoạt động của Thư viện Trung ương, Trung

tâm cần xây dựng được các BSTS đủ mạnh về khối lượng và chất lượng - đó chính

là nguồn TNSNS.

- Phát triển nguồn TNSNS giúp Trung tâm thực hiện và hoàn thành các chức

nởrìỊ, nhiệm vụ, định hướng và mục tiêu đõ đề ra..

+ Trong việc xây dựng CSDL đa phưomg tiện "Hồ sơ công nghệ" phục vụ cho

việc xúc tiến và phát ừiển thị trưòrng công nghệ, nguồn TNSNS là nhân tố quyết

định toàn bộ CSDL này. Nguồn TNSNS càng lớn, chất lượng càng cao, Trung tâm

21

cảng thu hút được nhiều NDT đặc biệt là các nhà doanh nghiệp và nhà khoa học.

+ Tăng cường cung cấp thông tin phục vụ phát triển nông thôn miền núi là

nhỉệm vụ mang tính chiến lược của Trung tâm. Xuất phát từ nhu cầu sử dụng thông

tin ngày càng cao và mở rộng tới các vùng nông thôn, Trung tâm đã có nhiều dự án

ừiển khai cung cấp thông tin tới các vùng sâu, vùng xa. Tuy nhiên, nhu cầu thông

tin ở khu vực này đang ngày một gia tăng. Vì thể, trong những năm tới, nhu cầu

phát triển nguồn TNSNS ở Trung tâm đặc biệt là những tài liệu hướng dẫn kỹ thuật

( trong đó có phim khoa học) nhàm cung cấp thông tin, đáp ứng cho nhu cầu phát

triển nông thôn, đặc biệt là vùng sâu vùng xa là rất lớn.

+ Để thực hiện tốt nhiệm vụ cung cấp thông tin phục vụ lãnh đạo và quản lý

được giao, đòi hỏi Trung tâm phải xây dựng được một hệ thống cung cấp thông tin

đủ mạnh luôn sẵn sàng đảm bảo những thông tin cần thiết một cách nhanh nhất và

chính xác nhất dựa trên nguồn TNSNS hiện có.

Từ những phân tích trên cho thấy, nhu cầu phát triển nội dung số tại Trung

tâm trong thời gian tới là rất lớn. Đê đáp ứng được nhu cầu này, Trung tâm cần huy

động toàn bộ lực lượng và điều kiện hiện có để phục vụ cho công tác phát triển

nguồn TNSNS.

Khả năng phát triển nguồn TNSNS tại Trung tâm

Trong những năm gần đây, được sự quan tâm đầu tư của Nhà Nước, đặc biệt

là Bộ KH&CN, Trung tâm TTKH&CNQG có điều kiện để phát triển về mọi mặt.

Trong đó, phát triển nguồn TNSNS là một trong những vấn đề được Trung tâm

quan tâm hàng đầu.

Phát triển nguồn TNSNS và đưa ra phục vụ hiệu quả nguồn tài nguyên đó là

nhiệm vụ đòi hỏi rất nhiều điều kiện về nhân lực và vật lực. Trung tâm

TTKH&CNQG có đầy đủ mọi điều kiện để phát triển và đưa vào khai thác nguồn

TNSNS một cách hiệu quả dựa trên những điều kiện sau:

- Trung tâm cỏ nguồn tài liệu làm nguyên liệu đầu vào đủ lớn để phục vụ cho

công tác tạo lập nguồn TNS gồm: (Kho sách, tạp chí tiếng Việt và ngoại văn với

khối lượng lớn; nguồn thông tin đa dạng và cập nhật được cung cấp từ các nhà khoa

học, doanh nghiệp...)

- Trung tâm có đội ngũ cán bộ đông đủ về số lượng, có trình độ và được đào tạo

22

đầy đủ các kỹ năng nghiệp vụ cho nhiệm vụ phát triển TNSNS Vữi khối lượng lớn.

- Hệ thống máy tính với khoảng 150 máy (đại đa số từ Pentium IV trở lên) và gần

20 máy chủ tốc độ cao, dung lượng lớn là cơ sở cho phép Trung tâm tiến hành xử

iý, lưu giữ và phục vụ một khối lượng TNSNS lớn mà ít đcm vị có khả năng thực

hiện được.

- Máy scanner Kirtas tốc độ 1200 ừang/giờ, và hơn 10 máy scanner tốc độ cao

cùng với các thiết bị ghi đĩa CD, VCD cho phép Trung tâm số hoá tài liệu với khối

lưọTig lớn (hàng triệu trang tài liệu và hàng trăm bộ phim KHCN / năm).

- Hệ thống phần mềm đa dạng, linh hoạt (Zope, Libol, Win ISIS, SQL Server,

Oracle portal,...) là cơ sở quan trọng cho phép Trung tâm tiến hành quản lý và khai

thác nguồn TNSNS hiện có và trong tương lai.

- Mạng VINAREN với tốc độ từ 40 đến 155 Mps là điều kiện thuận lợi để Trung

tâm triển khai phục vụ trực tuyến nguồn TNSNS trên phạm vi rộng (trong nước và

quốc tế).

- Ngoài ra, nguồn kinh phí khoảng 50 tỷ đồng của Nhà Nước mỗi năm là tiền đề

quan trọng để phát triển Trung tâm nói chung và phát triển nguồn TNSNS nói riêng.

Những điều kiện trên đây cho phép Trung tâm phát ưiển nguồn TNSNS với

tốc độ nhanh, khối lượng lớn và chất lượng cao, đáp ứng được nhu cầu khai thác

23

TÌ^S ngày một cao.

Chưong2. THỰC TRẠNG CÔNG TÁC XÂY DựNG VÀ

QUẢN LÝ NGUỒN TÀI NGUYÊN s ô NỘI SINH TẠ!

TRƯNG TÂM

2.1. Nguồn tài nguyên số nội sinh trong cơ cấu vốn tàỉ liệu của

Trung tâm

Trung tâm TTKH&CNQG là một trong những đơn vị có nguồn tài ngyên số

lớn nhất cà nước. Trong đó, bên cạnh nguồn TNS mua từ bên ngoài, Trung tâm

cũng là đơn vị đứng đầu cả nước về nguồn TNSNS.

Nguồn TNSNS của Trung tâm rất phong phú về nội dung và đa dạng về hình

thức. Trong phạm vi đề tài này, tác giả phân chia chúng thành hai loại CSDL chính

là CSDL thư mục và CSDL toàn văn.

2.1.1. Cơ sở dữ liệu thư mục

Các CSDL thư mục là một trong những nguồn TNSNS lớn nhất hiện có của

Trung tâm, chúng đóng vai írò quan trọng giúp NDT có thể tiếp cận tới nguồn tài

nguyên truyền thống quý báu vói hàng triệu bàn mà Trung tâm đang sở hữu. Các

CSDL này bao gồm:

- Sách ờ Thư viện khoa học và kỹ thuật Trung ương 143.969 biểu ghi

- Tạp chí ở Thư viện khoa học và kỹ thuật Trung ương 6.938 biểu ghi

' Tài liệu KH&CN nước ngoài (345.323 biểu ghi)

- Báo cáo kết quả nghiên cứu (9.851 biểu ghi)

- Tài liệu KHCN Việt Nam trước 2004 ( 73.259 biểu ghi)

- Đề tài đang tiến hành (3.706 biểu ghi)

- Mục lục liên họfp tạp chí (3.808 biểu ghi)

2.1.2. Cơ sở dữ liệu toàn văn

Các CSDL toàn văn của Trung tâm hầu hết được xây dựng từ năm 2004 đến

nay bao gồm:

24

- Tài liệu KH&CN Việt Nam STD (gần 55.000 biểu ghi)

- Thư viện điện tử khoa học và công nghệ phục vụ nông thôn (112.000 biểu ghi)

- Công nghệ chào bán (hơn 7.600 biểu ghi)

- Dịch vụ KH&CN (856 biểu ghi)

- Báo cáo kết quả nghiên cứu (trên 6.500 biểu ghi)

- Văn bản pháp quy về KH&CN

- Giải pháp phần mềm (2288 biểu ghi)

- Tiêu chuẩn Việt Nam

- Nhãn hiệu hàng hoá

- Các bản tin điện tử (gồm Nông thôn đổi mới, Tri thức và phát triển, Tổng luận

KH&CN, Khoa học Công nghệ Môi trường, Môi trường và phát triển bền vững,

Viet Nam Infoterra Newsletter, Thông tin & tư liệu,...)

- 'í'hư viện phim KHCN ( hơn 265 phim KH&CN được lưu trữ trên 145 đĩa CD-

ROM )

Ngoài ra, Trung tâm còn lưu giữ nhiều CSDL trước năm 2004 như:

Khoa học Công nghệ Môi trường, Vietnam Development News, Tạp chí Hoạt động

Khoa học, Communication Physỉcs, Acta Matìiematica Vietnamica, Báo cáo khoa

học công nghệ, Tổng quan về khoa học công nghệ và môi trưòfng,...

Với hàng triệu biểu ghi thuộc nhiều CSDL quý như Book, STD, Kết quả

nghiên cứu.,., nguồn TNSNS đã và đang là nguồn lực thông tin chủ yếu trong cơ

2.2. Hiện trạng công tác phát ữiển nguồn tài nguyên số nội sinh

cấu nguồn tin của Trung tâm.

2.2.Ỉ. Khung khổ pháp lý

Để hoàn thành chức năng nhiệm vụ được quy định ừong Luật Khoa học công

nghệ, Nghị định số 159/2004/NĐ-CP ngày 31/8/2004 của Chính phủ về hoạt động

thông tin khoa học và công nghệ và Quyết định số 11/2004/QĐ-BKHCN quy định

điều lệ về tổ chức và hoạt động của Trung tâm TTKH&CNQG, Trung tâm

TTKH&CNQG cần đẩy nhanh quá trình hiện đại hoá công tác lưu giữ, phát ữiển và

phổ biến các nguồn tin KH&CN.

Nguồn TNSNS đóng vai trò quan trọng, quyết định đến hiệu quả toàn bộ

25

nguồn tin trong nước tại Trung tâm, do vậy vấii đề xây đựng và phát triển nguồn

TNSNS là một nhiệm vụ tất yếu. Tuy nhiên, trong quá trình ưiển khai xây dựng và

phát triển nguồn tài nguyên này, Trung tâm cũng gặp phải một số khó khăn nhất

định, trong đó có vấn đề về bản quyền cho nguồn tài liệu số hoá.

Vấn đề bản quyền được coi là vấn đề chung của nhiều quốc gia và nhiều lĩnh

vực, đặc biệt là trong lĩnh vực TT-TV. Đã có nhiều trường hợp vi phạm bản quyền

xảy ra như trường hợp nhà cung cấp dịch vụ tìm kiếm thông tin Google đã quét và

số hóa khoảng hơn 4.000 tác phẩm của các tác giả Việt Nam cho dự án Thư viện số

Google Books mà chưa được sự đồng ý của chủ sở hữu. Theo đó, Trung tâm Quyền

tác giả văn học Việt Nam đã và đang nỗ lực yêu cầu Google thực hiện Luật bản

quyền đối với tác giả Việt Nam... Tại các cơ quan Thông tin và thư viện của Việt

Nam, trong đó có Trung tâm TTKH&CNQG cũng không tránh khỏi hiện tượng này.

Hiện tại, Trung tâm đã tiến hành số hoá gần 200.000 tài liệu, trong đó cỏ

55.000 bài trích tạp chí khoa học trong nước, 112.000 tài liệu dạng sách kỹ thuậtj

giáo trình và 6.500 báo cáo kết quả nghiên cúru. Tuy nhiên, công tác số hoá vẫn

chưa tìm kiếm được sự sáng tỏ và thuyết phục trong vấn đề bản quyền.

Điểm đ, khoản 1 Điều 25 Luật Sở hữu ừí tuệ và điểm đ điều 761 mục 2

chương 1 Bộ luật Dân sự về quyền tác giả quy định các trường hợp sử dụng tác

phẩm đã công bố không phải xin phép, không phải trả tiền nhuận bút, thù lao cho

phép '\<ỉao chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên c ứ ứ \l}.

Tuy nhiên, trong khoản 2 Điều 25 Nghị định 100/2006/NĐ-CP Quy định chi tiết và

hướng dẫn thi hành một số điều của Bộ luật Dân sự, Luật Sờ hữu trí tuệ về quyền

tác già và quyền liên quan cũng quy định rõ "Sao chép tác phẩm để lưii trữ trong

thư viện với mục đích nghiên cứu quy định tại điểm đ khoản ỉ Điền 25 của Luật Sở

hữu trí tuệ là việc sao chép không quá một bản. Thư viện không được sao chép và

phân phối bàn sao tác phẩm tới công chủng, kể cả bản sao kỹ thuật 5ỡ"[9].

Vậy, công tác số hoá tàí liệu tại Trung tâm có vi phạm bản quyền hay không?.

Hiện dang có hai quan điểm trái ngược nhau cho vấn đề này. Quan điểm thứ nhất

cho ràng việc số hoá là hoàn toàn họp pháp trong khi quan điểm thứ hai cho rằng

việc iàm này đang vi phạm tới quyền tác giả được nêu trong các văn bản pháp luật.

Để có thể đưa ra câu ừ ả lời chính xác cho vấn đề này, cần xem xét và đối

26

chiếu các văn bản pháp lý vào trường hợp cụ thể của Trung tâm.

vấn đề quyền tác giả và quyền sở hữu được quy định rõ trong một sổ văn kiện

trong nirớc và quốc tế, trong đó cỏ Công ước quôc tế Beme (1986), Bộ luật Dân sự,

Luật Sở hữu trí tuệ Việt Nam (2005) và Nghị định 100/2006/NĐ-CP Quy định chi

tiết và hướng dẫn thi hành một số điều cùa Bộ luật Dân sự. Các văn kiện này đều

quy định rõ đối tượng được bảo hộ quyền tác già, thời gian bảo hộ, các trường hợp

vi phạm và không vi phạm quyền tác giả. Để có những luận cứ chính xác, đảm bảo

đầy đủ tính pháp lý cho công tác số hoá cần tìm hiểu rõ những quy định nêu trong

các văn kiện này.

- về đối tượng được bảo hộ quyền tác giả, khoản 1 Điều 2 Công ước Beme quy

định về tác phẩm được bảo hộ nêu rõ "Các tác phẩm văn học và nghệ thuật bao

gồm (ất cá các sản phẩm trong lĩnh vực văn học, khoa học và nghệ thuật, bất kỳ

được biểu hiện theo phương thức hay dưới hình thức nào, chang hạn như sách, tập

in nhỏ và các bản viết khác, các bài giảng, bài phát biểu, bài thuyết giáo và các tác

phẩm cùng ỉoạì... ” [29].

ờ Việt Nam, đối tượng được bảo hộ quyền tác giả được quy định cụ ứiể trong

Điều 737 của Bộ Luật Dân sự là “mọi sản phẩm sáng tạo trong các lĩnh vực văn

học, nghệ thuật, khoa học được thể hiện dưới bất kỳ hình thức và bằng bất ^

phương tiện nào, không phán biệt nội dung, giá (rị và không phụ thuộc vào bất kỳ

thủ tục nào ”[!].

Khoản I Điều 14 của Luật Sở hữu trí tuệ cũng quy định rõ các đối tượng sau:

a) Tác phẩm văn học, khoa học, sách giáo khoa, giáo trình và tác phẩm khác

được thể hiện dưới dạng chữ viết hoặc ký tự khác;

b) Bài giảng, bài phát biểu và bài nói khác;

c) Tác phẩm báo chí;

đ) Tác phẩm âm nhạc;

đ) Tác phẩm sân khấu;

e) Tác phẩm điện ảnh và tác phẩm được tạo ra theo phương pháp tương tự

g) Tác phẩm tạo hình, mỷ thuật ứng dụng;

h) Tác phẩm nhiếp ảnh;

27

i) Tác phẩm kiến trúc;

k) Bàn họa đồ, sơ đồ, bản đồ, bản vẽ liên quan đến địa hình, công ữình khoa

học;

1) Tác phẩm văn học, nghệ thuật dân gian;

m) Chương trình máy tính, sun tập dữ liệu.

Như vậy, có thể khẳng định răng, các đổi tượng số hoá của Trung lâm (Sách,

bài trích, kết quả nghiên cứu,.,.) ứiuộc diện bảo hộ của quyền tác giả .

- v ề nội dung quyền tác giả, Điều 750, 751, 752 trong Bộ luật Dân sự và Điều

18 Luật Sở hữu trí tuệ quy định '^Quyền tác giả đối với tác phẩm quy định tại Luật

này bao gồm quyền nhân thân và quyền tài sản” [7].

Quvền nhân thân được quy định trong Điều 19 của Luật Sở hữu trí tuệ gồm

các quyền sau:

1. Đặt tên cho tác phẩm;

2. Đứng tên thật hoặc bút danh trên tác phẩm; được nêu tên thật hoặc bút

danh khi tác phẩm được công bố, sử đụng;

3. Công bố tác phẩm hoặc cho phép người khác công bố tác phẩm;

4. Bảo vệ sự toàn vẹn của tác phẩm, không cho người khác sửa chữa, cắt xén

hoặc xuyên tạc tác phẩm dưới bất kỳ hình thức nào gây phương hại đến danh dự và

uy tín của tác giả.

Quyền tài sản được quy định frong ichoản 1 Điều 20 bao gồm các quyền sau

đây;

a) Làm tác phẩm phải sinh;

b) Biểu diễn tác phẩm trước công chúng;

c) Sao chép tác phẩm;

d) Phân phối, nhập khẩu bản gốc hoặc bản sao tác phẩm;

đ) Truyền đạt tác phẩm đến công chúng bằng phương tiện hữu tuyến, vô

tuyến, mạng thông tin điện tử hoặc bất kỳ phương tiện kỹ thuật nào khác;

e) Cho thuê bản gốc hoặc bản sao tác phẩm điện ảnh, chưong trình máy tính.

- v ề thời gian bảo hộ, theo khoản 1 Điều 7 Công ước Beme quy định là “5wố/

cuộc đời của tác giả và năm mươi năm sau khi tác giả chết”. Bên cạnh đó, khoản 8

của điều này cũng quy định thêm ''^Trong bất kỳ trường hợp nào thời hạn bảo hộ sẽ

28

do quy định của Luật pháp của mrớc nơi sự bảo hộ được áp dụng. Tuy nhiên, trừ

ỉnường hợp Luật pháp của nước đó quy định khác đi, cỏn không thì thời hạn bảo hộ

sẽ không quá thời hạn được quy định ở quổc gia gốc của tác phẩm ”.[29]

ở Việt Nam, thời gian bảo hộ quyền tác giả được quy định tại Điều 27 Luật Sở

hữu trí tuệ và Điều 766 Bộ luật Dân sự như sau;

+ Quyền nhân thân của tác giả được bảo hộ vô thời hạn”.

+ Quyền tài sản là cuộc đời tác giả vờ năm mươi năm tiếp theo năm tác

gì ả chết; trong trường hợp tác phẩm có đồng tác giả thỉ thời hạn bảo hộ chấm dứt

vào năm thứ năm mươi sau năm đồng tác giả cuổi củng chết ”[ 1 ].

- v ề Các trường hợp vi phạm quyền tác giả dược quy định rõ trong khoản 3

Điều 20 của Luật Sờ hữu trí tuệ như sau: "Tổ chức, cả nhân khi khai thác, sử dụng

một, một sổ hoặc toàn bộ các quyền qiiy định tại khoản ĩ Điều này và khoản i Điều

19 của Luật này phải xin phép và trả tiền nhuận bút, thừ lao, các quyền lợi vật chất

khác cho chủ sở hữu qiĩỹền tác giả ”[7].

Mặt khác, khoản 2 Điều 25 Nghị định 100/2006/NĐ-CP cũng chỉ rõ; "Sao

chép tác phẩm để lưu trữ trong thư viện với mục đích nghiên cứu qưy định tại điểm

đ khoản 1 Điều 25 của Luật Sở hữu trí tuệ là việc sao chép không quá một bản. Thu

viện không được sao chép và phân phổi bản sao tác phẩm tới công chúng, kể cả bản

sao ỉ<ỹ thuật íớ"[9]. Trong đó, bản sao tác phẩm được giải thích rõ trong Khoản 4

Điều 4 của Nghị định này “/ứ bản sao chép trực tiếp hoặc giản tiếp một phần hoặc

toàn bộ lác phẩm. Bản sao chụp tác phẩm cũng là bản sao tác phẩm'' [9],

Như vậy, hình thức số hoá tài liệu tại Trung tâm thuộc vào điểm c khoản 1

Điều 20 của Luật Sở hữu trí tuệ “sao chép tác phẩm”.

Đối chiếu với các văn bản trên cho thấy, việc số hoá tài liệu tại Trung tâm đã

đáp ứng được yêu cầu về mục đích (phục vụ nghiên cứu, giảng dạy), tuy nhiên vẫn

chưa đáp ứng được những quy định đã nêu tại khoản 3 Điều 20 và điểm đ khoản I

Điều 25 của Luật Sở hữu trí tuệ. Việc số hoá tài liệu khi chưa xin phép chủ sở hữu

đã vi phạm khoản 6 Điều 28 Luật Sờ hữu trí tuệ về những hành vi xâm phạm quyền

tác giả đó là "Sơo chép tác phẩm mà không đirợc phép của tác giả, chủ sở hữu

quyền tác giả" [7].

Tuy nhiên, cũng cần giải thích thêm rằng ở Việt Nam trong lúc luật Bản quyền

29

còn chưa được áp dụng triệt để thì những sai phạm như đã nêu là rất phổ biến và

không thể tránh khỏi. Hon nữa, công tác số hoá tài liệu của Trung tâm được tiến

hành tìr khá sớm (trước khi Việt Nam trờ thành thành viên của Công ước Beme và

trước khi ban hành Bộ luật Dân sự và Luật Sở hữu trí tuệ).

2.2.2. Quy trình tạo lập tài lỉệu sế

Tạo lập TLS là bước đầu tiên của quá trình xây dựng BSTS. Sự phong phú, đa

dạng và chất lượng của các BSTS phụ thuộc rất lớn vào quá trình tạo lập TLS. Quá

trình tạo lập TLS quyết định đến:

' Định dạng của TLS (Dạng text, dạng ảnh và dạng đa phương tiện)

- Chất lượng của TLS nói riêng và BSTS nói chung (Sự chuẩn xác về ngôn ngữ

và chỉnh tả, chất lưọmg các fíle ảnh, vi đeo...)

- Sự đa dạng và mức độ bao quát nguồn thông tin

- Chất lượng TLS ưong bộ sưu tập về mặt nội dung

Quá ưình tạo lập nguồn TNS diễn ra ở hầu hết các bộ phận chức năng cùa

Trung tâm trong đó tập trung vào một số bộ phận chủ yếu là:

“ Phòng Phát triển nguồn tin

- Phòng CSDL

- Phòng Phân tích thông tin

- Phòng Thông tin Thị trường KH&CN

- Phòng Phát triển hoạt động thông tín

- Phòng Thông tin nông thôn, miền núi

- Trung tâm Iníorteưa Việt Nam

Do nguồn TNSNS của Trung tâm rất phong phú và đa dạng, bao gồm nhiều

loại CSDL khác nhau nên việc tạo lập TLS cũng liên quan đến nhiều phương thức

kỹ thuật. Hiện nay, Trung tâm đang sử dụng ba hình thức tạo lập TLS chủ yếu đó là;

- Sổ hoá tài liệu bằng máy scanner

- Tạo các file TLS dạng đa phương tiện (các phim khoa học)

- Tạo lập TLS thông qua xử lý các file văn bàn

Trong phần này tác giả tập ừung chủ yếu vào phương thức tạo lập nguồn TNS

thông qua phương thức sổ hoá tài liệu truyền thống bằng máy scanner cho CSDL

30

điển hinh là STD.

Quv trình số hoá tài ỉiệu gồm ba công đoạn chủ yếu là: Lựa chọn nguồn tài

liệu để sổ hoả; quét tài liệu và xử lý kỹ thuật; lưu giữ các file dữ liệu đầu ra. Ba

công đoạn này quyết định đến chất lượng tài liệu cả về nội dung và hình thức.

a, Lựa chọn tài liệu cần sổ hoả

Việc lựa chọn nguồn tài liệu để tiến hành số hoá là khâu đầu tiên và cũng là

khâu quyết định nội dung nguồn tài nguyên được số hoá. Hiện nay» công tác số hoá

tài liệu tốn kém khá nhiều thời gian và công sức nên việc lựa chọn tài liệu để số hoá

rất quan ừọng, nó góp phần giảm thiểu chi phí cho công tác số hoá và cũng góp

phần làm tăng chất lượng về nội dung nguồn TNS. Quá trình lựa chọn và số hoá

— u

— 1

— 1

được thực hiện theo sơ đồ sau:

Các file bài trích toàn văn

T ạp chi khoa học tiếng V iệt và tài liệu hội ng hị, hội thảo

File toàn văn dạng p đ f của toàn bộ sô tạp chí

Lựa chọn Scan

H. 2. ỉ. Sơ đồ quá trình lựa chọn và sổ hoá tài liệu

Quả trình ỉựa chọn bài trích để sẻ hoá:

Hàng năm, các tạp chí khoa học tiếng Việt và tài liệu hội nghị, hội thảo sau

khi được bổ sung về sẽ được giao cho bộ phận chức năng là Phòng CSDL, bộ phận

này sẽ tiến hành phân loại và xử lý theo sự phân công từng lĩnh vực chuyên môn,

Những chuyên gia có kiến thức và kỉnh nghiệm trong lĩnh vực nào thì được giao

nhiệm vụ lựa chọn bài trích trong các tài liệu thuộc lĩnh vực đó. Quá trình lựa chọn

cũng được tiến hành khoa học và tuân thủ những nguyên tắc chặt chẽ đối với tài liệu

khoa học như: Nội dung đề cập, giá trị khoa học, khối lượng bài viết,...Sau khi

nhận tài liệu từ bộ phận Bổ sung, cán bộ chuyên môn nhận tài liệu thuộc diện quản

lý của mình và chuyển sang bộ phận sổ hoá. Sau khi tài liệu được số hoá, cán bộ xử

lý nhận file toàn văn của toàn bộ số tạp chí, tài liệu hội thảo,, - .và tiến hành lựa chọn

31

bài trích để số hoá, sau đó gửi cán bộ phụ trách bộ phận duyệt lại những bài đã

chọn, nếu bài trích không đủ tiêu chuẩn sẽ không được tiếp tục xử lý đế đưa vào

CSDL.

Qua quá trình tìm hiểu nhu cầu từ bộ phận xử lý tài liệu cho CSDL này cho

thấy, vẫn còn một số bất cập trong quá trình cung cấp nguồn thông tin phục vụ cho

công tác số hoá tài liệu truyền thống. Những bất cập này được thể hiện ở các điểm

chính sau;

+ Thiếu một số tài liệu khoa học đã được bổ sung từ những năm trước

+ Chưa cập nhật được đầy đủ các tài liệu khoa học địa phương (các tạp chí

khoa học của các sở KH&CN các tỉnh/thành phố)

+ Nguồn tài liệu bổ sung chưa đáp ứng kịp thời về thời gian ( một số tạp chí

khoa học bị trễ từ một đến vài tháng)

+ Nguồn tài liệu dạng kỷ yếu hội nghị, hội thảo còn hạn chế về số lượng và

chưa được cập nhật kịp thời

Đe đảm bảo nguồn nguyên liệu cho công tác số hoá, những tồn tại trên cần

sớm được khắc phục. Các biện pháp cụ thể để khắc phục những hiện tượng trên sẽ

được trình bày cụ thể trong chưcmg 3 của luận văn.

b. Quét tài liệu và xử lỷ file quét

Quét tài liệu là khâu quan trọng phụ thuộc nhiều vào các thiết bị, kỹ thuật vận

về thiết bi:

hành thiết bị và kỹ năng xử lý hình ảnh.

Trước đây, thiết bị được sử dụng để số hoá tài liệu chủ yếu là máy scanner thủ

công, Trung tâm đã đầu tư 06 máy scanner hiệu HP 5590 (H. 2.2) cho bộ phận xây

dựng CSDL STD. Đen đầu năm 2009, Trung tâm đã đầu tư mua 01 máy scanner

công nghiệp APT BookScan 1200 (H. 2.3) để sổ hoá tài liệu cho CSDL STD và một

số CSDL khác. Sau đây là những mô tả chi tiết về thông số của hai loại máy trên:

- Máy Scanner HP 5590

Đây là loại máy scan máy scan phẳng hiện đại có thông số kỹ thuật như sau:

+ Độ phân giải scan tò 12 dpi đến 999999 dpi

+ Độ phân giải scan, phần cứng 2400 X 2400 dpi

32

+ Bit depth 48 bit

+ Tốc độ thực hiện dưới 24 giây: hình 4 x 6 trong M icrosoữ Word; dưới 36

giây

+ OCR nguyên trang văn bản với Microsoữ Word; dưới 18 giây (dùng để

email hình).

+ Bộ phận cung cấp nguyên liệu tự động tiêu chuẩn, 50 tờ

+ Kích cỡ scan tối đa 8.5 X 11 inch

+ Kích thước (w X d X h ) 19.21 X 13.39 X 6.38 inch

+ Giao diện két nối USB 2.0

+ Hệ điều hành tương thích Microsoít Windows XP , Microsofì Windows 98,

MicrosoỀ Windows 2000 , Microsoít Windows M E , Apple MacOS

H. 2.2: Mảy scanner HP 5590 dùng cho sổ hoá tài liệu

- Máy scanner công nghiệp A PT BookScan

Dây là loại máy scanner tự động tốc độ cao cỏ các thông số kỹ thuật đạt tiêu

chuẩn công nghiệp:

+ Tốc độ quét: 1200 trang/giờ

+ Máy ảnh số với độ phân giải 16.6 triệu điểm ảnh, độ phân giải ảnh: 300 -

600 dpi

+ Định dạng đầu ra: TIFF, JPEG, PDF có thể tìm kiếm, nhận dạng cho ỉ 89

ngôn ngữ khác nhau

+ Kích cỡ của trang giấy: 11.5 cm X 18 cm - 28 cm X 35.5 cm, Độ dày của

giấy: 49 GSM - ỉ 20 GSM, Độ dày đóng tập <= ỈO cm - Kích cỡ ba chiều của máy;

84X 86X 114cm

+ Công nghệ SureTum với cánh tay rôbốt được điều chỉnh bằng máy tính sao

33

cho lật chì một trang duy nhất tại một thời điểm.

• Bộ ph ận nâníi sách với côn g tiíỊhộ Smar lC rad lc đư ợc thiốl kế hình nôi theo

chù' V cỏ g{)C rnở 110 dộ d ỡ lấy sách nhẹ n h àn ụ theo mọi kích c ỡ và độ dàv khác

nhau.

: rií:<ìf » t i ;s ÌO ^ Mk n ( .oì»íìiv>

L i q h t T i x t u r e

Adiusscìbie

f ' o n e i

r»;J? tí 1 u r n V a c u u í ì ' * H c a d

;jco

4>

P « J J f C 'Ỉ . V M I p A/1 .1 l*.t M tt-O t' K f i o : ỉ

I h p M n t o í

Page Í'lutfí*r ACỈJtJsĩmeni Lcvci

//, 2.3: M áy A P T B ookScan ỉ 200 đirực Iraiìo bị đê số lioâ tài liệu

(liiii iliich;

I - Háim dicu kliiõn

1- Cìinicra

3- í)èn chi ếu sánu

4- C án h lay lật trang

5- Ciiá nâiìg sách và rhan íi chỉnh ụiá dỡ

6- Kẹp sách và N ú m điêu chỉnh kẹp

7- Ọ n ụ ihổi và c ầ n diều chình ố nụ ihồi

8- iiộ ph ận íiưưng lật

Ả'ỳ ihiiâi vàn hành thiết hi và xử lý anh:

l-liện tại r r u n ạ tâm đà thử n s h i ệ m và đira 1 chiếc m á v A P ỉ Bo okScan 1200

\ ả o hoạt clộn2 ncn \'iệc quét tài liệu cho CSD I. S T D dirợc ticn hành íoãn bộ trên

cỉiiếc ni;í\' Iià\-. Sau dày là một số kỹ tlìuậl \ ụn hành \ à \ ứ ỉý ánh cho máy A P r

[3ookScan 1200:

- Câc bước chỉnh /ro n ^ q u v trình so hoá tài liệu trên ììĩáv A P T BookScan Ị200

ơỏDì:

Smoíí CrsU)lc

+ Nhận tài liệu từ các bộ phận, xây dựng bảng danh sách các sách, kiểm tra lại

số lượng, phân loại sách theo độ ưu tiên cho việc quét và phân loại các sách cần xừ

lý trước khi quét. Tất cả kết quả được lun vào bảng quản lý sách (được xâỵ dựng

bang mẫu định dạng Excel)

+ Xứ lý sách trước khi quét (Pre-scan): Làm sạch sách đối với sách bẩn; chỉnh

íại mép sách nếu cong, quăn; mở những trang sách bị gấp; rọc những trang sách bị

dính liền.

+ Thực hiện quét sách bàng máy APT (Image Capture, Scan)

+ Thực hiện xừ lý ảnh và nâng cao chất lượng hình ảnh (Image Processing)

+ Thực hiện kiểm tra chẩt lượng (Quality Check) bằng cách review sản phẩm

theo check list và chỉnh sửa lại sản phẩm nếu chưa đạt chất lượng (Image

Correction). Đây là điểm khởi đầu của quá trình Kiểm tra chất lượng, và chủ yếu

tập trung vào chất lượng hình ảnh.

+ Thực hiện nhận dạng (OCR) và tạo file PDF

+ Thực hiện review và chỉnh sửa tài liệu sau OCR

- Những thao tác chỉnh khi sử dụng mảy APT BookScan 1200:

+ Điều chỉnh góc chụp và vị trí chụp thông qua giá nâng và kẹp sách

+ Điều chỉnh ống thổi

+ Điều chỉnh gương lật

+ Sừ dụng màn hình Scan đocument settings để chọn thư mục sẽ liru trữ các

file ảnh (Hình 2.4 )

Ú

35

H. 2.4: Màn hình Scan document settỉngs

+ Thao tác trên màn hình Scan setting để điều chỉnh:

Độ rộng sách

Tốc độ scan

Độ kẹp mạnh/yếu của kẹp sách

Độ hút mạnh/yếu của Cánh tay giở trang

Độ thổi mạnh/yếu của ống thổi

Chế độ chụp là tự động hay lật giở bằng tay

Chế độ chụp cả hai trang hoặc chỉ trang phải hoặc chi trang trái

+ Sử dụng màn hình điều khiển thông số camera (Hình 2.5) để điều chỉnh:

Tốc độ đóng/mở cửa trập

Độ mở ống kính

Độ nhạy sáng

Kích thước ảnh

Chất lượng ảnh

36

H. 2.5: Màn hình file management

imỂìMhíàiấr

H. 2.6: Màn hình điều chỉnh các thông sẻ cho camera

- Xử íý cácýìỉe p d f vàfìle ảnh sau khi scan

Đây là khâu cuối cùng để tạo nên một file pdf hoàn chỉnh. Những công việc

phải thực hiện bao gồm:

+ Kiểm tra toàn bộ file quét để phát hiện những chỗ bị mất chữ

+ Kiểm tra độ phân giải (phát hiện những trang bị mờ để tiến hành quét lại)

+ Kiểm tra độ nghiêng (nếu trang bị nghiêng thì chỉnh lại hoặc quét lại)

+ Thực hiện việc crop các trang quét để loại bỏ phần lề có màu den và căn lề

cho trang quét

+ Tối ưu hoá file pdf bằng công cụ PDF Optimizer để tạo ra ĩile pdf có dung

lượng nhỏ và chất lượng tốt.

Đối với máy APT BookScan 1200, công việc xử lý file ảnh có các công cụ

riêng là phần mềm “BookScan Editor” (BSE). Công cụ này có 2 hệ thống chức

năng chính sau:

+ Xử lý hình ảnh cho template và chạy theo bó (run batch). Các chức năng ở

đây chủ yếu để tạo ra template để sau đó áp dụng cho tất cả các trang tài liệu.

+ Xử lý tinh từng hình ảnh sau khi đâ xử lý theo bó.

- Lưu giữ các fiỉe dữ liệu đầu ra

Sau khi thực hiện đầy đủ các thao tác kỹ thuật để cho ra các file dạng pdf, các

37

file này được lưu giữ ưên một server đặt tại bộ phận số hoá.

Thông qua việc khảo sát một sổ bài toàn văn đã quét trước đây (trên máy HP

5590) và theo phản ánh của Bộ phận xây dựng CSDL sau khi triển khai quét tài liệu

trên máy APT BookScan 1200 cho thấy, các kỹ thuật quét tài liệu cũng tồn tại một

số hạn chế nhất định chưa được khắc phục. Một số lỗi vẫn tồn tại trên bài toàn văn

như lỗi lệch trang, đen lề, mờ không đọc được... Những lỗi này cần sớm được íchắc

phục triệt để khi sử dụng máy scarmer APT BookScan 1200.

2.2.3. Xây dựng cơ sở dữ liệu

Xây dựng các CSDL đòi hỏi nhiều yếu tố liên quan như phần mềm, các công

cụ biên mục, các chuẩn dùng ữong công tác biên mục, phương thức lưu giữ fíle toàn

văn,... Trong đó việc sử dụng phần mềm đóng vai trò quan trọng, quyết định đến

cấu trúc của CSDL. Trong phần này, tác giả sẽ tập trung tìm hiểu các phần mềm

dùng cho việc xây dựng các CSDL nội sinh và phương pháp xây dựng một sổ

CSDL như BOOK, STD và KQNC.

a. Phần mềm và các chuẩn

Phần mềm

Trung tâm TTKH&CNQG là một trong những cơ quan đi đầu trong quá trình

ứng dụng CNTT. Việc ứng dụng các phần mềm quản lý tài liệu được triển khai khá

sớm (từ đầu thập niên 80). Cùng với quá trình phát triển của CNTT, Trung tâm

không ngừng đẩy nhanh quá trình áp dụng các phần mềm vào hoạt động.

Xuất phát từ sự phong phú và đa dạng của các nguồn TNS, hiện tại Trung tâm

đang sử dụng đồng thời nhiều phần mềm để quản lý nguồn tài nguyên này, Dưới

- CDS/ISISfor DOS và ÌVINISIS

đây là một số phần mềm đã và đang được sử dụng:

Phần mềm đầu tiên được áp dụng tại Trung tâm là CDS/ISIS for DOS, Đây là

phần mềm tư liệu dùng để quản lý các CSDL dạng văn bản có cấu trúc do UNESCO

phát triển và phổ biến từ năm 1985 và được cung cấp miễn phí cho các thư

viện Việt Nam. Đây cũng là phần mềm đầu tiên được sử dụng phổ biến tại Việt

Nam để quản lý thư viện truyền thống. CDS/ISIS có các đặc trưng sau:

+ Sử dụng giao điện DOS để xây dựng CSDL

+ Sử dụng dạng biên mục máy đọc được CCF (Common Commưnication

38

Pormaí)

+ Là phần mềm kết hợp Hệ quản trị CSDL với Phần giao tiếp.

+ Quàn lý được đồng thời nhiều CSDL

+ Cho phép xây dựng các CSDL lớn tới 16 triệu biểu ghi

+ Kích thước của trường không hạn chế (có thể tới 32.000 ký tự)

Các giai đoạn phát triển của CDS/ỈSIS for DOS

+ Cuối những năm 60; Phiên bản chính

+ Tháng 12/1985: Phiên bản 1.0 chạy trên IBM PC/XT

+ Tháng 3/1989; Phiên bàn 2.0

+ Tháng 6/1993: Phiên bản 3.0

CDS/ISIS for DOS cũng đã được Trung tâm Việt hoá và triển khai áp dụng

rộng rãi. Trước năm 2002, toàn bộ CSDL của Trung tâm được xây dựng và quản lý

trên phần mềm CDS/ĨSIS for DOS. Hiện nay, do những tính năng ưu việt của

CSDL này, đặc biệt là trong quá trình nhập liệu, kiểm tta ư tn g lặp và duyệt tài liệu

nên Trung tâm vẫn sử dụng CDS/ISIS for DOS để nhập liệu cho những tài liệu hồi

cố.

Từ tháng 11 năm 1997 phiên bản CDS/ISIS for WINDOWS 1.0 (WINISIS) ra

đời và đến năm 1998, Trung tâm đã áp dụng phần mềm này vào việc xây dựng và

quản lý các CSDL. WĨNISIS được phát triển từ phần mềm CDS/ISIS for DOS cho

phép chạy trên môi trưÒTĩg Windows với nhiều tính năng ưu việt như:

+ Xây dựng cấu trúc CSDL dễ dàng nhờ có các phương tiện trợ giúp trong

việc tạo biểu mẫu nhập tin và íormat hiện hình.

+ Hiệu quả tìm tin tăng, nhờ nhiều phương tiện trợ giúp (cửa sổ từ điển, nút

toán tử,...)

+ Cho phép tìm tin theo nhiều phượng thức: tìm tin trình độ cao và tìm tin có

trợ giúp.

+ Có khả năng kết nối CSDL này với các CSDL khác để mở rộng chức năng

quản lý nhờ các lệnh kết nối siêu văn bản trong ngôn ngữ tạo fomial.

+ Cho phép quản lý các tệp toàn văn nhờ những liên kết siêu văn bản

+ Có cải tiến Phần giao tiếp tìr DOS đến Web và két nối thêm Hệ quản trị

39

CSDL Access.

+ Dễ thao tác và sử dụng, phù hợp với trình độ của mọi đối tưọTig; khả năng

kết nối mạng LAN, liên kết với các trang Web trên mạng Internet thuận tiện.

WINISIS giúp toàn bộ hoạt động nghiệp vụ thư viện được tự động hoá tối đa

và tích hợp trong một hệ thống nhất đồng thời cho phép trao đổi, tương tác, hỗ trợ

lẫn nhau tạo ra một quy trình nghiệp vụ chuẩn của một thư viện hiện đại bao gồm:

+ Bổ sung: Bổ sung tài liệu qua đơn đặt, tra trùng tài liệu, tra cứu báo cáo bổ

sung...

+ Biên mục: Xuất, nhập dữ liệu theo chuẩn MARC 21, in phích mục lục, in

nhãn tài liệu, in thư mục tài liệu mới, tài liệu chuyên đề, tìm kiếm tra cửu nhanh

theo nhiều tiêu chí, thống kê báo cáo tài liệu,...

+ Hồi cổ, hiệu đính, tái xử lý tài liệu kho đọc, kho mượn, tạo lập và tổ chức

quản lý kho theo yêu cầu của thư viện.

+ Quản lý lưu ứiông: cấp thẻ bạn đọc» lưu thông đọc, mượn, ừả, gia hạn theo

quy trình tra cứu, quản lý bạn đọc, báo cáo tìiống kê lượt người đọc, lượt tài liệu

luân chuyển...

+ Dữ liệu sử dụng trong WINISIS có thể tái sử dụng sau này nếu thư viện nâng

cấp sử dụng các chương ưình phần mềm quản lý khác với tính năng cao hơn như

ILIB, LIBOL,,..

Hiện nay, WINSIS đã phát triển đến phiên bản 1.5 nhưng do nhu cầu trong

quản lý dữ liệu và thư viện tại Trung tâm ngày càng cao, phần mềm WINISIS

không thể đáp ứng được nên Trung tâm đã triển khai thêm các phần mềm khác.

Phần mềm WINISIS chỉ được sử dụng để xây dựng và quản lý một số CSDL như

Kết quả nghiên cứu, Đê tài đang tiến hành và Mục lục liên hợp. Các CSDL này sau

khi được xây dựng trên WIN1SIS sẽ được chuyển sang WEBISIS để phục vụ truy

- Phần mềm Zope

cập trực tuyến thông qua mạng Vista.

Zope (Z Object Publishing Environment) là một tập hợp các phần mềm mã

nguồn mở, do công ty Zope Corporation và một cộng đồng lớn các nhà phát triển

phần mềm xây dựng. Zope được viết bàng ngôn ngữ Python, phiên bản đầu tiên của

40

Zope là vào năm 1998. Zope cung cấp các dịch vụ nền tảng trên web.

Dựa ữên nền tảng này, rất nhiều phần mềm (trong đó có nhiều phần mềm nguồn

mở) đã được xây dựng để bổ sung mở rộng thêm nhiều tính năng khác trong đó:

+ CMF (Content Management Framework) là các công cụ nền tảng mạnh và

có khả năng tùy biến cao để xây dựng các ứng dụng quản trị nội dung (theo thuật

ngữ thư viện là quản trị các CSDL toàn văn tài liệu hay các CSDL đa phương tiện

như hình ảnh, âm thanh, video...)

+ Plone là một phần mềm mở rộng nữa của Zope cung cấp thêm nhiều địch vụ

mới như quản ưị người đùng tốt hơn, có sẵn nhiều loại đữ liệu, giao diện người

đùng thân thiện với nhiều trợ giúp để định hướng, các cửa sổ, liên kết...

Tập hợp phần mềm Zope và tất cả các phần mềm mở rộng đó sau đây gọi tắt là

Zope.

Yêu cầu về phần cứng và phần mềm của Zope

+ về phần cứng, Zope có thể chạy trên một máy tính có cấu hình trung bình.

Tuy nhiên để có ứiể đáp ứng nhanh chóng một lượng truy cập lớn. Đê cài đặt Zope,

cần có một máy tính có cẩu hình nhu sau trở lên (Pemtium IV, 3GHz, 512MB RAM

trở ỉên, 80GB HDD).

+ về phần mềm, trên máy chủ, Zope được dùng với các hệ điều hành phổ biến

(Winđows, Linux,..,). Hệ thống tuân thủ chuẩn HTTP và có thể sử dụng các phần

mềm web server miễn phí (IIS, Apache,...)- Các phần mềm khác, íhí dụ như một hệ

quản trị CSĐL bên ngoài, là không bắt buộc và chỉ cần có nếu ta muốn mở rộng các

chức năng. Trên máy trạm, chỉ cần một ừình duyệt (MS lE hoặc FireFox,...) là làm

việc được. Hệ thống hoàn toàn tương thích với mã Unicode nên có thể dùng với các

bộ gõ thông thường (ưnikey, Vietkey,-)- Việc kết nối giữa người dùng đầu cuối

với hệ thống được thực hiện theo cách thức thông thường do hệ thống hoàn toàn

tuân thủ các chuẩn Internet (TCP/IP).

Các thành phần chỉnh của Zope:

+ Dịch vụ ứng dụng web, cho phép xuất bản các đối tượng lên web, vào các

vùng riêng biệt trên màn hình (portlet);

+ CSDL hướng đối tượng ZODB, cho phép quản trị các loại đối tượng;

41

+ Các thành phần mở rộng được gọi là các “sản phẩm” (products);

+ Có thể lập trình phát triển bằng ngôn ngữ ZPT (Zope Page Template) hoặc

Python, thay đổi giao điện trình bày bằng CSS;

+ Một cơ chế lập chỉ mục thông qua một bộ máy tìm kiếm Zcatalog;

+ Quản trị người dùng, nhóm người đùng và các quyền;

+ Kết nối với các nguồn lực bên ngoài ( các hệ quản ưị CSDL quan hệ, các hệ

thống quản trị nguồn lực LDAP...);

+ Quản trị hệ thống thông qua giao diện web ( ZMI - Zope Management

Interíace);

+ Quản trị dòng công việc;

+ Quản trị siêu dữ liệu (Dublin Core);

+ Quản ư-ị giao diện người dùng.

ưu điểm của Zope

+ Có thể chạy trên các hệ điều hành phổ biến như Windows, Linux, BSD,

Unix, Solaris

+ Có thể chạy như một ửng dụng riêng lẻ hoặc kết hợp với các web server phổ

biến như MS IIS hay Apache;

+ Có kiến trúc đơn giản, trực giác;

+ Có giao điện hoàn toàn qua web kể cả sử dụng, quản trị và phát ưiển phần

mềm;

+ Dễ định hướng;

+ Tìm kiếm thuận tiện;

+ Cho phép tổ chức hợp lý dữ liệu trong và ngoài cơ quan;

+ Nội dung và công cụ do cán bộ thông tin, chứ không phải người lập trình,

lựa chọn. Việc nhập tài liệu theo mẫu có sẵn và trực quan, không yêu cầu kiến tíiức

vềH TM L,C SS...;

+ Có thể mở rộng các chức năng, tìiay đổi giao diện;

+ Hỗ trợ các công đoạn xuất bản điện tử các tài liệu, theo dòng công việc có

tiiể tùy biến, phù hợp với qui trình riêng do Cỡ quan đặt ra;

+ Bao gồm một hệ quản trị nội dung đầy đủ, cho phép quản trị cả phần mô tả

42

và toàn văn tài liệu, cho phép xây dựng danh mục các yếu tố mô tả theo yêu cầu;

+ Cho phép quản trị người dùng và nhóm người dùng, quản trị quyền truy cập

vào từng đổi tượng cho từng người hoặc từng nhóm;

+ Dễ dàng sao lưu và ỉdiôi phục dữ liệu (toàn bộ dữ liệu chứa trong một fiie).

Có thề tải về các bản nâng cấp chương ừình thưcmg xuyên;

+ Hỗ trợ các chuẩn CNTT cơ bản, thí dụ như Unicode, Web, XML, RSS,

LDAP, ... có thể tích hợp với các phần mềm thông dụng khác như các hệ quản trị

CSDL quan hệ Oracle, MS SQL Server, MySQL,... ;

+ Hỗ trợ sẵn hoặc có thể cài đặt thêm các mở rộng để hỗ trợ nhiều chuẩn về

thông tin - tư liệu như chuẩn siêu dữ liệu Dublin Core, hoặc chuẩn phổ biến trong

các hệ thống tài liệu toàn ván OAI-PMH (Open Archives Initiative - Protocol for

Metadata Harvesting).

Hiện nay, hầu hết các CSDL toàn văn của Trung tâm đều được xây đựng, quản

- Phần mềm Libol

lý và phục vụ khai thác ừên phần mềm này.

Libol (Library Online) là phần mềm quàn trị thư viện tích hợp được công ty

Tinh Vân phát triển từ năm 1998. Phiên bản Libol 5.5 đã được Trung tâm

TTỈCH&CNQG áp dụng vào quản lý các hoạt động thư viện từ năm 2004 đến nay.

Mặc dù không được sử dụng để xây dựng và quản lý tài liệu toàn văn nhưng

Libol là phần mềm đóng vai trò quan trọng trong việc tạo ra nguồn tài nguyên thư

mục tại Trung tâm. Hiện nay, bên cạnh các chức năng thống kê, quản lý bạn đọc,,,,

phần mềm này là công cụ chủ yếu được dùng để xây dựng, quản lý và khai thác

CSDL Sách và Tạp chí.

LIBOL 5.5 có ichả năng hỗ trợ nghiệp vụ quản lý nội đung với nhiều tính năng

nổi bật như chuẩn biên mục MARC 21, AACR-2 giúp nhập và xuất thông tin đễ

dàng, có tính bảo mật cao, nhập liệu, tìm kiếm và hiển thị đa ngữ. Song song đó,

phần mềm được xây dụmg có tính tùy biến cao, tiện lợi cho người quản lý, hỗ trợ

mã vạch và thè từ, cho phép vận hành trên CSDL lớn đến nhiều triệu bản ghi. Giao

thức mở rộng Z39.50 cũng được áp dụng trong LIBOL 5.5 giúp người sử dụng thư

viện tiếp cận nguồn tiiông tin đa dạng của Internet.

Dưới đây là một số tính năng nổi bật của Liboỉ:

43

+ HỖ trợ chuẩn biên mục MARC 21, AACR-2, ISBD.

-- I lồ trợ các k h u n g ph â n loại th ô n ỵ (.iụna: nhu D DC. B B K , N l . M , rX)C\ ƯDC.

-t N h ập /x u ấl d ừ liệu theo cliiiẩn IS O 2709.

+ Liên kết với các th ư viện và tài ntiii> ên i h ô n a tin irực tuỵốn trên Internel qua

ííiao thức Z39.50 và O A l - P M l l .

‘ M ư ợ n liên Ihư viện iheo chu ẩn ISO 10161 ; tích hợp với các thiết bị mượn

tra tự liộníi ihc o chiuin SIP 2.

' híồ trợ đa n a ữ \ Inicodc \ ớ i dữ liệu \ à eiao diộn làm \ iệc ; dồn« tliời hỗ trợ

cúc bán.e m ã tiến ụ việt n h ư '1'CVN 5712. VNI, '!'CVN' 6909.

- lí ao mậl và phân q u y ề n ch<ặt chẽ.

- Vận hànli hiệu q uả trèn Iihữnu C S l)! . kVn nỉiiều triệu bản íihi.

í Hỗ trự hệ quản Irị C S D L Oracle hoặc Mlcrosoít SQL Servcr.

^ Khai thác vả Irao dồi t h ô n ạ tin qua \vcb. ihư điện tư. G P R S ( diện thoại

di

d(Mie) \ à thicl hị hỗ trợ nuười khicm thị.

~ llồ irự họ thốnụ ihir viện nhiều kho, n h iầ i diốm lưu thôníi ; lươiìt’ Ihich với

cả IIÌÔ liình kho clónu và kho mở.

D u ói dâ> là uiao diộiì của pliầii m ề m I.ibol phiên bản 5.5

iđ^icãl

i D D Ì J .'J (iKtSC.S I riiKAHII S ONIIM,

» hy Tinh VM

•r'

C;'|Ị

UPAC "a ẻ-1 C.ci VL. Irự: L 9 ' ỉnư vỉẬt

M l ĨHONC

T-i C" SSC'* k è.

: j c

O tá* > -."ẻ 3oc ĩ j r -9 •«/? D3Ú c ao

riỉA Ĩ HÀMt

y.ỡ •ỳ -.•ó- c i v

IU Gú ;.-C^ civ. Àũ jOu T-ổr-3 “ã C3C C30

BILN Mll 6 t"* ‘Vui Tiưriví rĩKicíí

l ư liệ .j đ iẻ '* :ừ

C-LÌ^

di.rr5

Mitôlií 'ệ\:

//, 2. /: G iao diện p h ầ n m ẻni Lìhol p ỉiià i han 5.J

44

ĨƯLIẼIDỈÉSỈỨ

Sau sáu năm triển khai xây dựng, hiện nay số biểu ghi trong Các CSDL được

xây dựng trên phần mềm Liboỉ (bao gồm cả phần dữ liệu được chuyển sang từ phần

- Phần mềm Greenstone

mềm ISIS ) đã lên tới hơn 220 nghìn biểu ghi.

G reenstone là m ột trong những hệ thống phần mềm nguồn mở TVS nổi tiếng

và phổ biến nhất hiện nay. Phần mềm này được phát triển bởi Dự án TVS New

Zealand của trường đại học Waikato, New Zealand và được UNESCO phân phối.

Greenstone là một phần mềm đa ngôn ngữ được dịch sang gần 50 thứ tiếng, bản

tiếng Việt do Công ty lES của Phần Lan ở Việt Nam phối hợp với Thư viện Đại

học Khoa học Tự nhiên thành phố Hồ Chí Minli biên dịch. Phần mềm nguồn mở

TVS Greenstone và tài liệu hướng dẫn bằng tiếng Việt có thể tải xuống thông qua

trang web GreenstoneW iKi:

http://greenstỡne. sourceforge. net/wikưindex.php/Greenstone Wiki).

Greenstone được đùng để thu gom và biên mục tài liệu theo Dublin Core,

đồng thời tổ chức thành bộ sưu tập và xuất ra đĩa CD hay để khai thác

trực tuyến qua Internet. Greenstone được lưu hành với giấy phép GPL, được

dùng rộng rãi khắp nơi trên thế giới, ở Việt Nam nhiều thư viện đã sử dụng

Greensíone để xây dựng các bộ sưu tập số, đáng kể nhất là Thư viện đại học

Khoa học Tự nhiên và Thư viện đại học Ngân hàng thành phố Hồ Chí Minh.

G reenstone cũng được áp dụng vào hoạt động của Trung tâm từ khá

sớm (năm 2004). H iện nay G reenstone được sử dụng để quản lý và khai

thác trực tuyến thư viện điện tử các tài liệu toàn văn về kỹ thuật nông

nghiệp với địa chi:

http://icadI2007. vừtagơv. vn/gsdưcgi-birưlibrcoy

Các tính năng của Greenstone:

+ X ây dựng các bộ sưu tập tài liệu điện tủ từ Internet và các CSDL

trực tuyến dạng đa phươ ng tiện; Sưu tập âm thanh, tranh ảnh, hình ảnh

động, hoạt hình, đồ hỉnh, toàn văn,...

+ Xây dựng các bộ sưu tập về các chuyến ngành, bằng cách số hoá các

tài liệu hiện có tại thư viện: Sách, tạp chí, luận văn, báo cáo khoa học, đề tài

45

nghiên cứu khoa học, bài giảng, giáo trình, w . .. với bộ sưu tập toàn văn.

+ Xây dựng C SD L bộ sưu tập dạng thư tịch biên m ục theo Dublin

Core hay M A R C 21.

+ Hỗ trợ thực hành xây dựng bộ sưu tập và biên m ục Dublin Core và

M A R C 21 của G reenstone bằng công cụ Librarian Interface.

+ K hả năng tìm kiếm m ạnh với nhiều điểm truy cập, đặc biệt là khả

năng tìm kiếm toàn văn trong CSDL

+ G reenstone có thể tích hợp vào phần m ềm quản lý thư viện có sẵn.

+ G reenstone có thể được phát triển thành m ột phần m ềm quản lý thư

viện hoàn chỉnh theo yêu cầu của từng thư viện.

Bên cạnh các phần m ềm trên, năm 2009 Trung tâm cung đã tiép quản

phần m ềm OJS (O pen Journal System). Đây là phần m ềm quản lý tạp chí

mã nguồn m ở do D ự án “Tri thức công cộng” thuộc trường Đại học British

C olum bia của C anada xây dựng. Phần m ềm này được áp dụng cho dự án

X ây dựng C SD L Tạp chí khoa học Việt N am (V JO L) thuộc tất cả các lĩnh

vực. D ự án này do M ạng Q uốc tế về ấn phẩm khoa học (IN A SP) của Anh

tài trợ cho V iệt N am . T rung tâm TTK H & CN Q G không trực tiếp xây dựng

mà chỉ quản lý C SD L này. T hông tin trên CSD L được upload lên m ột cách

tự động dưới sự quản lý của T rung tâm TTK H & C N Q G . H iện đã có 23 tạp

chí được xuất bân trên V JO L với 142 M ục lục Tạp chí, liệt kê 1473 bài

viết, trong đó 1010 bài viết được cung cấp toàn văn dưới định dạng pdf.

C ác chuẩn cho phát triển nôi d u n s số

Vấn đề áp dụng các chuẩn cho dữ liệu số là một ữong những vấn đề được quan

tâm hàng đầu trong công tác TT-TV. Việc áp đụng các chuẩn thống nhất sẽ tạo ra

sự thống nhất về dữ liệu trong toàn bộ hệ thống, bên cạnh đó các chuẩn dữ liệu còn

giúp trao đổi dữ liệu được dễ đàng và thuận tiện.

Cùng với sự phát triển của nội dung số là sự xuất hiện của các chuẩn kèm theo,

trong đó có rất nhiều chuẩn cần được áp dụng như chuẩn về ngôn ngữ, chuẩn mô tả

dữ liệu, trao đổi dữ liệu...

Các chuẩn hiện đang được áp dụng đối với dữ liệu thư mục của Trung tâm

gồm:

46

Khổ mẫu M arc21

+ Mã địa danh Việt Nam: TCVN 7587-2006

+ Mã nước: ISO 3166-2

+ Mã ngôn ngữ: ISO 639-2

+ Mã tên cơ quan: TCVN 7588-2006

+ Mã tên tác giả (kho mở): Cutter-Sanborn

Việc áp dụng các chuẩn trong phát ừiển nội dung số tại Trung tâm hiện nay

cần được tiếp tục nghiên cứu và ừiển khai. Trong khi chuẩn ngôn ngữ đã được áp

dụng cho toàn bộ hệ thống thì các chuẩn khác mới chỉ áp dụng chủ yếu cho các

CSDL thư mục. Các chuẩn dành cho TLS hầu như chưa được áp dụng hoặc áp dụng

không thống nhất.

Thỉ dụ:

Chuẩn mô tả trang trong CSDL STD được áp dụng là định dạng pdf, trong khi

trong các bản tin điện tử là định dạng doc

Hoặc:

CSDL STD chưa áp dụng các chuẩn về mô tả dữ liệu số

Những sự thiếu đồng bộ và chậm trễ trong việc áp dụng các chuẩn trên đã tạo

ra sự thiếu ứiống nhất về dữ liệu và hạn chiế trong quá trình trao đổi dữ liệu.

b. Xây dựng CSDL

X âv dưn£ CSDL Sách

N guồn TN SN S dạng thư m ục chiếm tỷ lệ lớn trong cơ cấu vốn TLS

nội sinh tại T rung tâm . T rong phần này, tác giả sẽ tập trung tìm hiểu công

tác biên m ục cho C SD L Sách tại T hư viện Khoa học Kỹ thuật Trung ương.

CSD L này được xem là C SD L lớn nhất về khối lượng biểu ghi (trên 100

nghìn biểu ghi) được xây dựng từ khá sớm và đã được chuyển đổi sang

phần m ềm L ibol (trước đây CSD L này được xây dựng ưên CSDL

CD S/ISIS).

Q uy trình xây đựng C SD L này liên quan đến hai phân hệ trong phần

mềm L ibol là Phân hệ B ổ sung và Phân hệ Biên mục. Các bưófc được tiến

47

hành như sau:

Bước I : K iểm tra trùng lặp cho tài liệu trước khi nhập vào CSDL (sử dụng

các trường ISB N , N han đề, tác giả,...để kiểm tra xem tài liệu đã tồn tại

trong CSDL chưa?)

B ưởc 2 : N hập thông tin về tài liệu (lập yêu cầu cho ấn phầm , duyệt yêu cầu,

lập đơn đặt cho tài liệu v à biên m ục sơ lược)

Bước 3 : T iến hành biên m ục chi tiết cho tài liệu (cập nhật các trường từ

khoá, chỉ sổ phân loại, chỉ số cutter và m ột số trường khác)

Bước 4 : K iểm nhận và m ở khoá để phát hành biểu ghi

Các chuẩn, khổ m ẫu và cô n g cụ xử lý gồm;

+Q uy m ô tả ĨSB D

+ K hổ m ẫu M arc2 1

+ Mà ngôn ngữ: ISO 639-2

+ Mã tên tác giả: Cưtter-Sanbom

+ Bảng T ừ khoá có kiểm soát

+ K hung phân loại B B K

Q uá trình áp dụng các chuẩn, khổ mẫu và các công cụ trên vào công

tác biên m ục cũng gặp không ít khó khăn, đồng Uiời vẫn còn m ột sổ tồn tại

cần được khắc phục:

- Trong quả trình áp dụng tiêu chuẩn mô tả tài ỉiệu

Tiêu chuẩn quốc tế về mô tà thư mục (ISBD) được áp dụng vào công tác xử lý

tài liệu tại Trung tâm từ năm những năm 1981-1982 (Trước đó là tiêu chuẩn GOCT

7.1 về mô tả dữ liệu thư mục của Liên Xô). Hiện nay, Trung tâm đang dự kiến sẽ

triển khai áp dụng AACR2 vào công tác xử lý bởi lẽ hiện tại Trung tâm đang sử

dụng khổ mẫu MARC21 mà khổ mẫu này chịu nhiều ảnh hưởng của AACR2. Vì

vậy, để áp dụng ưiệt để khổ mẫu Marc21 Trung tâm cần sớm triển khai áp dụng

AACR2 trong công tác xây đựng CSDL.

Việc áp đụng khổ mẫu M ARC21 vào xử lý tài liệu góp phần tạo nên sự thống

nhất đữ liệu, đồng thời hỗ trợ công tác trao đổi tài liệu trong nước và quốc tế. Trước

đây, hầu hết dữ ỉiệu của Trung tâm được xây dựng trên phần mềm CDS/ISIS nhưng

48

sau khi triển khai thêm một số phần mềm mới, toàn bộ dữ liệu này đều được chuyển

đổi sang cấu trúc MARC21. Mặc dù vậy, quá trình triển khai MARC21 tại Trung

tâm cũng gặp phải một số khó khăn nhất định, thể hiện ở một số điểm sau:

+ Fề tài liệu hướng dẫn: Mặc dù đã có 2 tài liệu chính thức bằng tiếng V iệ t,

xong cả hai tài liệu này đều quá đồ sộ nên không thuận tiện trong quá ừình tác

nghiệp của cán bộ xử lý [17].

+ Trong quả ừình tác nghiệp cùa cán bộ: Do khổ mẫu này bao gồm rất nhiều

thành phần và tương đối phức tạp (đặc biệt là trong phần cấu trúc biểu ghi), điều

này cũng gầy không ít khó khăn cho người trực tiếp xử lý tài liệu.

+ Trong khi chuyển đổi dữ liệu từ cấu trúc cũ: Phần lớn các nhẫn

trường/ưưòmg con không trùng nhau giữa CSDL dùng cấu trúc cũ và MARC21 nên

khi chuyển đổi dữ liệu các nhà cung cấp phần mềm hoặc Trung tâm phải tự viết

phần mềm chuyển đổi. Trong quá ừình chuyển đổi dữ liệu cũng đã xuất hiện những

trường hợp sai lệch hoặc mất dữ liệu,...

- Trong quả ừ-ình sử dụng các công cụ biên mục

+ Q uá trình sử đụng khung phân loại BBK cũng gặp phải m ột số khó

khăn nhất định, M ột số thuật ngữ không tìm được m ột ký hiệu phân loại

phù hợp, đặc biệt là các tài liệu liên ngành, các tài liệu thuộc lĩnh vực

m ớ i... Bên cạnh đó cũng tồn tại một số trường hợp không thống nhất trong

quá trình xử iý phân loại.

Thỉ dụ:

Những tài liệu có cùng một chủ đề lại được phân loại khác nhau (như trường

hợp các tài liệu về lĩnh vực thống kê đang được xếp ờ hai mục của Khung phân loại

BBK là Ô 6 và Q 051). Hiện tượng này là do sự thiếu thống nhất về quan điểm

trong khâu phân loại giữa nhữĩig người làm công tác xử lý.

+ Việc áp dụng bộ Từ khoá có kiểm soát vẫn tồn tại một số khó khăn và chưa

được áp dụng triệt để như: Một số thuật ngữ mới chưa được cập nhật, có nhiều từ

khoá tồn tại trong CSDL không chính xác với nội dung hoặc không đáp ứng được

yêu cầu đối với một từ khoá.

Thỉ dụ:

vẫn tồn tại những từ khoá “Ảỹ thuật rađỉo ” trong bộ Từ khoá có kiểm soát

49

quy định sử dụng "‘Kỹ thuật vô tuyển " thay cho thuật ngữ trên,...

Hay:

Trong bộ Từ khoá quy định sử dụng thuật ngữ ỉạc 5ố” thay cho

thuật ngữ '■''Thông tin sổ ’\ Điều này dễ dẫn đến tình trạng hiểu sai thuật ngữ

'-''Thông tin ” như là m ột danh từ ...

- Trong quả trình sử dụng phần mềm

Thông qua tim hiểu đồng thời trực tiếp tham gia biên mục cho CSDL

này, tác giả thấy có m ột số vẩn đề về phần mềm còn tồn tại gây khó khăn

cho những người làm biên mục đồng thời ảnh hưởng đến chất lượng CSDL.

N hững bất cập này tồn tại trong cả hai phân hệ Bổ sung và Biên mục.

T rong phân hệ Bồ sung

+ Có quá nhiều công đoạn để bổ sung một ấn phẩm ừ-ong klii có ửiể bỏ qua

một số công đoạn (duyệt yêu cầu,...).

+ Không ửiể thêm một giá trị cho một tài liệu đã có săn (đối với những biểu

ghi được xây dựng trước khi áp dụng phần mềm này). Hiện tượng này nếu không

được khắc phục sẽ dẫn đến tình ừạng biểu ghi bị trùng tên.

Thỉ dụ:

Khi muốn thêm một ký hiệu xếp giá cho cuốn sách "Mô hình tồ chức kình

doanh thương nghiệp xã hội chủ nghĩa trong cải cách kinh tế ” khi biểu ghi này đã

có sẵn một ký hiệu là Vđ 259/2002, người xử lý sẽ không thể sinh thêm giá trị cho

tên sách này vì tên sách này không được xây dựng ưên một đơn đặt cụ thể. Trong

trường hợp người xử lý vẫn muốn bổ sung thêm một giá trị cho tên sách này thì chỉ

có một cách duy nhất là tạo một biểu ghi mới để tránh hiện tượng một tên sách xuất

hiện hai lần trên CSDL gây khó khàn cho việc quản lý và tìm kiếm.

Trong phân hệ Biên muc

Phân hệ Biên mục cũng tồn tại nhiều hạn chế như:

+ Chưa hỗ trợ lưu các giá trị ngầm định

+ Các giá ưị ngầm định trong trường lặp không được sử dụng lại

+ Chưa hỗ trợ từ điển

+ Phần trợ gúp chưa được thiết kế khoa học

50

Thí dụ:

Trong phần trợ giúp đối với trường 700 - Mục từ bổ trợ tên riêng liệt kê các số

3, 5, 6, 8 và các chữ cái. Giả sử khi người xử lý cần trợ giúp về chức đanh của tác

giả được iập bổ sung thì không biết sử dụng ký hiệu cho trường con nào trong số

các chữ sổ và chữ cái đã được ỉiệt kê trong đó. Khi đó nếu người xử íý không muốn

dùng bảng hướng dẫn MARC21 thì phải dò từng số và chữ cái trong mục hướng

dần để tìm ra trường con $c - bổ trợ chức danh cho tác giả. Điều này cho thấy hệ

thống trợ giúp gần như không mang lại tiện ích gì cho người xử lý.

X âydưm C SD L STD

CSDL Tài liệu KH&CN Việt Nam là CSDL đa ngành lón nhất cả nước hiện nay

được Trung tâm xây dựng từ năm 1987 với nguồn trích từ hơn 300 tạp chí khoa học

trong nước, các tài liệu hội nghị hội thảo và tuyển tập báo cáo. Hiện tại CSDL này

có hơn 127.000 biểu ghi ừong đó có 55.000 biểu ghi có đính kèm file toàn văn.

Công tác biên mục tài liệu cho CSDL này cũng được thay đổi theo cấu trúc và quy

mô của CSDL. Trước năm 2004, khi Tmng tâm chưa triển khai quét tài liệu gốc

đính kèm thì CSDL ở dạng thư mục, tài liệu được biên mục như đối với CSDL thư

mục về bài trích. Từ năm 2004 đến nay Trung tâm đã triển khai quét tất cả các bài

trích khi đưa vào CSDL thì công tác biên mục cũng có sự ứiay đổi.

Nếu như trước đây công tác biên mục bao gồm cả việc xây dựng bài tóm tắt cho

bài trích thì từ năm 2004 trở lại đây công việc này trở nên không quan trọng (vì

dung lượng fĩle đính kèm cũng khá nhỏ, NDT có thể xem lướt bài toàn văn mà

không cần có thông tin tóm tát).

Quá trình biên mục tài liệu cho CSDL này cũng được tuân thù theo những

quy trình và nguyên tắc chặt chẽ theo các bước sau:

Bước 1: Cán bộ xử lý nhận file toàn văn (fíle chưa extract bài trích) từ bộ phận số

hoá về để xử lý

Bước 2: Đọc bài ữích để xác định nội dung (Những bài trích có giá trị klioa học sẽ

được tiếp tục xử lý)

Buớc 3: Gửi danh mục các bài sẽ xử lý cho lành đạo phòng duyệt

Bước 4: Xử lý tiền máy thông qua việc nhập thông tin vào phiếu tiền máy

Buớc 5: Gửi phiếu tiền máy cho lãnh đạo phòng duyệt

51

Bước 6: Chỉnh sửa lại phiếu tiền máy

Bước 7: Nhập thông tin trên phiếu tiền máy vào CSDL

Bước 8: Chuyển bài toàn vãn lên server

Bước 9: Tạo đường link giữa biểu ghi và file toàn văn.

cvv20ỉj009_cvv20ỉs0ỉ2009072

Trong CSDL STD tên file lưu được đặt như sau:

Giải thích:

CVvlOl là số ký hiệu của tạp chí Nông nghiệp và phát triển nông thôn

SOI: Số 1

2009; Năm phát hành của tạp chí

72: Số trang của tên bài trích

Các công cụ dùng cho công tác biên mục gồm có Khung Đề mục Quốc gia và

Bảng Từ khoá có kiểm soát đo Trung tâm biên soạn.

Thông tin trước khi nhập vào CSDL được điền vào các ừường trong phiểu tiền

máy (Xem phụ lục 1).

Một biểu ghi trong CSDL STD sau khi được phát hành lên mạng có cấu trúc

như sau:

you dro hCf9i:

pếTì

Chi

đA rnt^c I

-

CciCỉt

enl

‘ PhAm THt ỉi<« Tư:

rhH íxitíog kỉtKtyẶii; ^ 1« Cỉit

T^H ỉ iiny

::...: ..

D^i(0tdl M<ịu TA tt

f*hAA cỉcfi đ o d ^ tig ílt truyi^n C(ia 90 ^ldi>9 lúa niA*

twii tr trtriH ìỊi

Qcn vlQti

p h ắ t tri^ r* oủn^ tKỉDn

d&HQ b4i»y «o»iQ c

I^íđrvg đia phưdỉi<|

} ỏ m t ^ t

kíỉiIẠm kho

♦tKi^NQc;, í:vv « 1 1

52

H. 2.8: Cẩu trúc biểu ghi trong CSDL STD sau khi được phát hành ỉên mạng

Trong công tác biên mục cho CSDL toàn văn nói chung và CSDL STD nói

riêng, liên kết giữa biểu ghi và địa chỉ lưu fíle toàn văn đóng vai trò rất quan trọng,

nó quyét định khả năng truy cập đến file toàn văn trong CSDL. Tuy nhiên, trong

CSDL STD đã xuất hiện những lồi liên kết dẫn đến tình trạng không thể ừuy cập

đến file toàn văn. Nguyên nhân của hiện tượng ưên được xác định là do quá trình

trao đổi dữ liệu giữa bộ phận xử lý và bộ phận quản lý CSDL (bộ phận Tin học). Do

vậy, để khắc phục hiện tượng trên cần có một cơ chế trao đổi thông tin khoa học

giữa bộ phận biên mục với các bộ phận khác.

Xđv d ư m CSDL KONC

KQNC là CSDL được xây dựng ưr ỉchá sớm trên phần mềm CDS/ISIS và được

khai thác trực tuyến qua WebISIS.

Quy trình biên mục cho CSDL này cũng được tiến hành gần giống với CSDL

STD. Các biểu ghi được mô tả trên phiếu tiền máy trước khi nhập máy, bao gồm

các trường;

Phân loại Mã số đề tài

Thời gian bắt đầu Số đăng ký

Thời gian kết tìhúc Tên báo cáo

Bảo mật thông tin Cơ quan chủ írỉ

Vật mang tin Cơ quan chủ quản

Mã ngôn ngữ tiếng Việt Cấp quản lý đề tài

Dạng tài liệu Cơ quan quản lý đề tài

Tóm tắt Chủ nhiệm đề tài

Từ khoá Cán bộ phối hợp

Nơi lưu trữ Đề mục

Thông qua việc khảo sát một số biểu ghi trong CSDL KQNC cho thấy, có hai

vấn đề còn tồn tại frong CSDL này là sự thống nhất írong mô tả một số trường

(trường Cơ quan chủ trì đề tài và trường Cơ quan quản lý đề tài) và kỹ thuật xử ỉý

53

nội dung (xử lý bài tóm tắt cho đề tài).

Trường hơp thứ nhất: Xuất hiện sự thiếu thống nhất trong cách mô tả tên cơ quan

chủ trì.

Thỉ dụ:

Khi tiến hành tìm kiểm các đề tài nghiên cửu theo tên cơ quan chủ trì với vần

chữ cái T thấy xuất hiện;

+ 4 cơ quan có cùng tên; TLĐLĐVN, Viện NC KHKT BHLĐ (Tổng Liên

đoàn Lao động Việt Nam, Viện Nghiên cứu Khoa học Kỹ tìiuật Bảo hộ lao động)

+ 1 tên; TLĐLĐVN, Viện NC KHKH BHLĐ

+ 1 tên: Thanh tra Nhà nước, 218 Ba Đình, Hà Nội

+ 1 tên; Thanh tra Nhà nước, 218C Đội cấn, Hà Nội

+ 1 tên; Thanh tra Nhà nước, 218C Đội cẩn, Hà Nội, 8325056; 8325885...

Trường hơp thử hai: Trong trường tóm tắt, nhiều biểu ghi có bài tóm tắt không phản

ánh được tính khách quan của tài liệu

Vỉdụ\

Đề tài nghiên cứu mã số: 97-0043 - Việc giải quyết khiếu nại của công dân

trong hệ thống các cơ quan hành chính Nhà nước sau khi tòa án hành chinh được

thành lập

Nội dung bài tóm tắt được trích toàn văn nhự sau:

"Đây là công trình khoa học có nội dung và phạm vi nghiên cứu rộng, được

tiến hành nghiêm túc, công phu và chất ỉượìĩg. Kết qíiả nghiên cứu đã thực hiện tốt

mục tiêu Vđ yéu cầu đặt ra về nội dung và chất lượng, phương pháp tổ chức nghiên

cứu. thời gian và hiệu quả. Sử dụng kinh phí: Đề tài đã nêu lên được quá ừinh hình

thành và hoàn thiện quyền khiếu nại của cóng dần và các chế định bảo đảm quỵền

khiếu nại. Vai trò của các cơ quan hành chỉnh Nhà nừởc, các tổ chức thanh tra Nhà

nước trong việc giải quyết các khiếu nại hành chỉnh khi Tòa án nhân dãn xét xử các

vụ kiện hành chính, thực trạng tình hình khiếu nại và giải quyết khiếu nại trong các

năm qua, tồn tại, nguyên nhân và giải pháp; Phương hưởng sửa đổi bổ sung pháp

lệnh khiếu nại của công dân và đưa ra một số các kiến nghị khoa học khác ”

Hay trong đề tài có mã số: 2000-277 - Kháo sát, đánh giá vai trò lãnh đạo tồ

chức Đảng và cán bộ chủ chốt các cấp trong việc thực hiện nghị quyết Trung ương

54

4 (khóa 7) vể chỉnh sách dân số - KHHGĐ ở nước ta

Nội dung bài tóm tắt như sau:

"Để íài đã đánh giá đủng hiện trạng vai trò ỉãnh đạo của Đảng vả cán bộ chù

chốt trong việc thực hiện nghị quyết Trung ương Đảng 4 (khóa 7) về chính sách dân

sổ - KHHGĐ. Đánh giá được những tiến bộ, nguyên nhần, hạn chế, đồng thời đề ra

được một số giải pháp có tỉnh khả thi nhằm tăng cường sự lãnh đạo, chỉ đạo tiếp

tục thực hiện công tác dân số theo mục tiêu đề ra ”...

Nội dung các bài tóm tắt ưên mang tính chất đánh giá từ phía người xử lý về

nội đung tài liệu nên đã vi phạm một trong những quy định quan trọng trong kỹ

thuật xử lý bài tóm tắt là đảm bảo tính khách quan.

Để khắc phục những hạn chế nêu trên, công tác biên mục cho CSDL này cần

được kiểm duyệt chặt chẽ hơn, bên cạnh đó, việc bồi dưỡng cho những cán bộ mới

kiến thức về xử lý nội dung là rất cần thiết.

c. Lưu giữ dữ lỉệu số

Lưu giữ dữ liệu số là một trong những khâu quan trọng quyết định đến sự an

toàn và khả năng truy cập đến toàn bộ nội dung nguồn TNS. Do nguồn TNSNS của

Trung tâm khá đa dạng về loại hình và có khối lượng lớn nên công tác lưu giữ cũng

phức tạp, đòi hỏi nhiều thiết bị lưu giữ đồng thời và những phương pháp khoa học.

- Các phương tện ỈICU giữ:

Hiện tại, nguồn TNSNS của Trung tâm được lưu giữ trên các phuơng tiện

chính đó là ổ đĩa cứng di động, ổ cứng gắn trên các server và đĩa CD-ROM.

Các CSDL đều được lưu giữ trên 1 hoặc 2 server riêng với cấu hình và dung

lượng phù hợp ( xem phụ lục 2).

Các phim khoa học sau khi được ghi lại sẽ được lưu giữ trong các ổ cứng đi

động, các ổ này thường có dung lượng từ 1 đến 2 TB.

CSDL toàn văn KQNC được lưu giữ trên một ổ cứng riêng và chỉ phục vụ tại

chỗ theo yêu cầu.

Năm 2009, cùng với việc đầu tư mua máy APT BookScan 1200, Trung tâm đã

đầu tư thêm hai máy chủ IBM cấu hình mạnh vớỉ dung lượng dĩa cứng 12 TB để

đáp ứng yêu cầu lưu giữ và xử iý nhanh các file ảnh sau khi số hoá.

Đa phần các server lưu dữ liệu là những thiết bị có thương hiệu như IBM, Hp,

55

D ell,... nên tuổi tíiọ khá cao, ít có nguy cơ hỏng hóc.

- Phương thức lưu g iữ :

Phương thức tiến hành lưu giữ TNS được thực hiện theo các hình thức khác

nhau, tuỳ thuộc vào phần mềm và đặc trưng của các CSDL. Tựu chung lại có thể

chia làm hai hình thức chủ yếu là lưu giữ trực tiếp và gián tiếp;

+ Phương ứiức lưu giữ trực tiếp được tiến hành từ những máy trạm, theo

phương thức này, cán bộ xử lý thông tin cho các CSDL được cấp các acount riêng,

từ những acount này, người xử lý thông tin có thể trực tiếp upload dữ liệu lên server

sau khi đã được kiểm duyệt và chinh sửa lại mà không cần chuyển dữ liệu cho bộ

phận phụ trách tin học. Hiện nay» đa số CSDL của Trung tâm được lưu giữ theo

phương thức này.

+ Phương thức lưu giữ gián tiếp được tiến hành bởi cán bộ phụ trách tin học,

theo phương thức này, sau khi xử lý và hiệu chỉnh đữ liệu cán bộ xử lý chuyển dữ

liệu cho cán bộ phụ ừách tin học (trong phạm vi quản lý CSDL) để upload vào máy

chủ. Phương thức này được tiến hành chủ yếu đối với các CSDL đang sử dụng phần

mềm CDS/ISIS như CSDL KQNC, đữ liệu hồi cố cho CSDL Sách,...

+ Ngoài ra, đối với dữ ỉiệu được lưu giữ dưới dạng CD-ROM (các phim khoa

học, nội dung kết quả nghiên cứu,,..) phương thức lưu giữ được thực hiện một cách

trực tiếp. Vì dữ liệu dạng này không lưu giữ ứên server nên đưực lưu giữ trên các

máy trạm hay ổ cứng đi động sau đó ghi ra đĩa CD-ROM với khối lượng bản tuỳ

thuộc vào nhu cầu của NDT.

- Cơ chế sao ỉưu giữ liệu :

Cơ chế sao lưu dữ liệu cũng được thực hiện đối với toàn bộ các CSDL TNS.

Hiện nay, toàn bộ CSDL của Trung tâm đều được sao lưu từ 1 đến 2 bản. Các bản

sao liru hầu hết được thực hiện trên đĩa cứng để đề phòng các trường hợp hỏng hóc

thiết bị hay CSDL.

Trong khi xây dựng các CSDL, quá trình trao đổi và lưu dừ liệu số vẫn tồn tại

một vấn đề lớn cần được giải quyết đó là hiện tượng dữ liệu bị thất lạc và bị mất.

Hiện tượng này sảy ra đối với cả phưcmg thức lưu giữ trực tiếp và gián tiếp (trường

hợp sảy ra đối với CSDL STD là một ví dụ cụ thể). Để tìm hiểu nguyên nhân và

56

cách khắc phục hiện tượng này, chúng ta sẽ xem xét trường hợp CSDL STD thông

qua quy trình trao đổi dữ liệu giữa các bộ phận tham gia xây dựng CSDL này từ khi

dữ liệu số được tạo lập đến khi được upload vào server phục vụ khai thác :

Trong quá trình xây dựng CSDL STD, dây truyền trao đổi dữ liệu số được ứiể

hiện theo sơ đồ sau:

Server 3

H. 2.9: Sơ đè đường đi cùa tài liệu sau khi được sể hoá

Giải thích:

+ Server 1: Lưu các fíle ảnh sau khi scan

+ Server 2; Lưu các file ảnh đã được chỉnh sửa và chuyển đổi thành íìle đạng

pdf.

+ Client: Máy trạm nhận tài liệu dạng pdf từ server 2 xử lý và chuyển đến

Server 3

+ Server 3: Lưu giữ toàn bộ CSDL phục vụ khai thác

Thông qua việc tìm hiểu phương pháp giao - nhận đữ ỉiệu cho thấy, đữ liệu

được ưao đổi chủ yếu thông qua phương tiện là ổ lưu dữ liệu và USB. Phương pháp

này rất thủ công và không thuận tiện, đồng thời dễ sảy ra hiện tượng mất dữ liệu

57

hay nguy cơ bị vi rút tấn công toàn bộ CSDL. (Trưòíng hợp gần 1/3 số bài toàn văn

ciiối năiíi 2008 và dấu nãni 2009 khô ng tlìê kcl nối dirực h'i một vi dụ minh hoạ). Do

vậy. quy trình này cần dư ợc ihict kế lại cho phù hợp. T r o n c c hư ơ n g 3 cùa luận văn.

tác ^iá sc trình bàv chi tiết inô hình ciíip tối ưu hoá quá Irinh trao dỏi và lưu 2Ìừ dừ

liệu số từ khi đưọ c số hoá dổn khi dược úii lên servcr pliục vụ khai Ihác.

2.2.4. Tố chức khai thát ivguồn tài nguyên số nội sinh

Truim lâin I T K i l & C N Q G là dưn \ ị di dàu Iroim lĩnh v ực cLiiiụ cấp TNS. licn

cạnh n s u ồ n T N S bổ s u n ạ từ ben nạoài. mỗi nãm có lìànu Irảm Iiuhìn bicu slìi số hoá

nội sinh dư ợc bỏ s u n s vào n au ồn 'TNS cùa 'i r un a tàin. 1 heo dó, các dịch vụ ciinu

cấp i N S cMĨnạ dược phát tricn khỏns; ngừnỉỊ. Hiện nay. ' ĩ r u n e tâni đ an c áp dụnt:

nhiều hình ihức cu n g cấp lài liệu nhưim tựu chiinụ lại. có ba hình thức cuníỊ cấp chu

\ếii là CUIIÚ cấp trực luvến từ xa. c u n a cấp tại chồ và CUIIÍỊ cấp trọn ụói tới tồ

cluk . đưn vị sứ d ụ n ẹ thônu lin.

- Hình thức ca n ẹ cắp từ xa:

Hiện lại hình thức ciinsi cẩp thỏim lin từ xa ớ T ru no tâm dưực chia làm hai

phirơnỉ2 thức chính là tru\ cập lừ xa miền phí vù có Irá phí

lliện nay. hầu hết niíuồn TNSNS cùa Triina tílni dều cho phép truv cập từ \ a

iniồn p]ií (Irừ CSDI

s T I ) ) \(Vi dịiì cl)i ini\ rf)p hiiịv

\\\\A\ A isi;i.LM)\ ,\n

\iVi lỉiiU)

diC'n nh ư hình dưới dây;

(i. Các hình thúc cunỊỊ cấp T SS tại Trunỵ tâm

......

IHĨỊỊÃWim

THllVIỆH

r z Ỵ i ỷ.y ỳ:

33

K.M Mấ>r-A-T.iá

V - ? íi

H. 2. ÌO: G iao diện ỉiìạní> Visía cho N D T

58

a

Bên cạnh hình thức truy cập từ xa miễn phí, CSDL STD được cung cấp thông

qua tài khoản truy cập cá nhân cùng với một số CSDL bổ sung bên ngoài như

ScienceDirect, Isiknovvledge, Springerlink, proquest Central, Ebrary,.... Đây là

CSDL nội sinh duy nhất của Trung tâm được cung cấp dưới hình thức trả phí với

địa chỉ: http://db.vista.gov.vn/

- Hình thức cung cấp tại chỗ

Hình thức cung cấp thông tin tại chỗ được áp dụng tại Tning tâm từ nhiều năm

nay, đặc biệt khí nhu cầu sử dụng TLS ngày một cao thì phương thức cung cấp tại

chỗ đối với tài liệu truyền thống được chuyển dần sang TLS. Hình thức cung cấp

thông tin này cũng được chia làm hai phương thức đó là cung cấp theo yêu cầu và

cưng cấp điểm truy cập miễn phí.

Đối với một số NDT cỏ nhu cầu tự mình tìm kiém thông tin, Trung tâm sẽ

cung cấp các điểm truy cập miễn phí tại khu vực tra cứu tài liệu điện tử (tầng 1, Nhà

24 Lỷ Thường Kiệt - Hà Nội). Tại đây, NDT có thể ữuy cập vào mọi nguồn tin mà

Trung tâm có.

Đối với NDT có nhu cầu được cung cấp và bao gói thông tin từ các dịch vụ

cung cấp thông tin theo yêu cầu, Trung tâm cũng đáp ứng dưới mọi hình thức thông

qua bộ phận cung cấp tài liệu điện tử, Thông qua bộ phận này, NDT có thể gửi các

yêu cầu tin tới bộ phận cung cấp và nhận lại thông tin ứieo đúng diện yêu cầu về nội

đung, hình thức, thời gian..... Phương thức này tỏ ra rất hiệu quả khi mà NDT có

nhu cầu cung cấp thông tin theo chủ đề với khối lượng lớn hay từ nhiều nguồn khác

nhau trong Thư viện.

Phương thức cung cấp thông tin theo yêu cầu cũng được thực hiện dưới nhiều

dạng khác nhau, tiêu biểu là:

+ Cung cấp bản sao tài liệu gốc (Theo bài, theo phần và toàn b ộ )

+ Cung cấp toàn bộ hoặc một phần CSDL (Dưới dạng file điện tử hoặc CD-

ROM)

+ Cung cấp các bài trích, phần, chương của tài liệu dưới dạng điện tử

Đom giá cho các hình thức cung cấp tài liệu cũng cỏ sự khác biệt giữa dạng tài

liệu và nội dung tài liệu, cụ thể là;

59

+ Đơn giá cung cấp tài liệu dạng số từ mức 500 đến 1000 đ/ ữang

+ Đơn giá cung cấp các tài liệu dưới dạng đĩa CD cũng khác nhau từ 10 nghìn

đến 500 nghìn đồng một đĩa, tuỳ theo nội dung thông tin chứa trong đĩa

+ Đơn giá cung cấp CSDL hoặc một phần CSDL cũng được xây dựng dựa trên

những chi phí xây dựng và bảo trì CSDL.

- Hình thức cung cấp íhóng tin trọn gói tới từng địa phương

Hình thức này được triển khai bởi dự án "Tăng cường cung cấp thông tin

KHCNphục vụ phát triển kỉnh tế - xã hội vùng sâu, vừng xa" do TS. Tạ Bá Hưng

chủ trì. Dự án này được triển khai năm 2002 tại Ninh Bình và được nhân rộng ra

nhiều địa phưong thuộc các tỉnh Miền núi phía Bắc. Đến nay, dự án này đã chuyển

thành mô hình cung cấp thông tin KH&CN phụ vụ phát triển kinh tế - xã hội nông

thôn, miền núi. Tính đến tháng 6 năm 2009, mô hình này đã cimg cấp thông tin tới

34 tỉnh trong cả nước với khoảng gần 200 cơ sở. Cùng với Dự án này, mỗi đơn vị

thuộc diện cung cấp thông tin của đự án được trang bị cả về thiết bị, thông tin, nhân

lực và tổ chức để vận hành hệ thống thông tin được cung cấp.

+ v ề thiết b ị : Trang bị cho các đơn vị những thiết bị, công nghệ thông tin hiện

đại bao gồm (01 bộ máy tính, máy in, máy photocopy, máy ảnh số, tivi, đầu đọc

VCD/DVD và máy sao đĩa VCD/DVD)

+ v ề nhân lực : Đào tạo cho mỗi đơn vị 02 cán bộ có kỹ năng sử dụng các

trang thiết bị, công nghệ để quản lý và khai thác thông tin.

+ v ề ứiông tin : Tạo lập, xử lý, bao gói và cung cấp ứiông tin (thư viện điện tử

với trên 52.500 tài liệu, 320 phim khoa học công nghệ, 1053 tiêu chuẩn,1824 két

quả nghiên cứu, 636 dự án ,.,,); Xây dựng dòng tin từ dưới lên (gồm bản tin

KH&CN và trang web địa phương) ; Xây dựng và chuyển giao quy chế, quy định,

bản hướng dẫn vận hành mô hình,...

+ v ề tổ chức ; Xây dựng ở mỗi đơn vị một Điểm nút (Trung tâm) khai thác và

cung cấp ứiông tin.

Mô hình này được xem là hình thức cung cấp thông tin hiệu quả phục vụ

chương trình phát triển kính tế - xã hội vùng nông thôn và miền núi. Nhờ có mô

hình này mà nhiều hộ dân, doanh nghiệp tại địa phương có cơ hội tìm kiếm những

60

cách làm ăn mới, quá bá sản phẩm trên mạng đenm lại hiệu quả kinh tế cao. Tuy

nhiên, việc nhân rộng mô hình này vẫn còn phụ thuộc nhiều vào chính sách của

từng địa phương nơi tiếp nhận dự án.

b. Các thiết bị hỗ trợ khai ihảc

Hiệu quả hoạt động của một hệ điống cung cấp thông tin không chỉ phụ thuộc

vào nguồn lực thông tin mà đơn vị nắm giữ. Thiết bị hỗ ữợ khai thác đóng vai ừò

rất quan trọng giúp cho quá trình khai thác diễn ra hiệu quả, tiết kiệm tíiời gian và

chi phí. Thiết bị hỗ trợ khai thác thông tin số gồm nhiều loại, trong đó quan trọng

nhất là hệ thống đường truyền, server và các máy trạm. Sự thiếu đồng bộ giữa các

thiết bị trong hệ thống sẽ ảnh hưởng rất lớn đến hiệu quả khai thác thông tin.

Trung tâm TTKH&CNQG là một ừong những đơn vị đi đầu ừong việc ứng

dụng CNTT vào hoạt động và cũng là đơn vị được Nhà nước quan tâm đầu tư do

vậy các điều kiện về thiết bị và hạ tầng phục vụ khai thác thông tin được đảm bảo

khá tốt, bao gồm:

+ Hệ thống đường truyền cáp quang tổc độ cao trên 40 Mbs kết nối với mạng

VINAREN cho phép phục vụ đồng thời một khối lượng lớn NDT trong và ngoài

lãnh thổ Việt Nam.

+ Mạng nội bộ tốc độ 100 Mbs cho phép kết nối, chia sẻ thông tin nhanh

chóng

+ Hệ thống server (trên 10 chiếc) với cấu hình mạnh và dung lượng lớn được

sử đụng cho từng CSDL riêng là những ỉdho lưu giữ nguồn tài ngyên số cho phép

lưu giữ các CSDL lớn, phục vụ khai thác lâu dài.

+ Hệ thống máy tính với hcm 20 máy có cấu hỉnh ưr Pentium IV trở lên, đây là

những máy trạm phục vụ hiệu quả cho việc khai thác thông tin tại chỗ

+ Máy in tốc độ cao đáp ứng nhu cầu phục vụ TLS dưới dạng truyền thống

+ Mạng Vista với khả năng liên kết mạnh đảm bảo các liên kết trong và ngoài

c. Giao diện tìm tin

mạng.

Toàn bộ CSDL của Trung tâm đều được thiết kế trên các phần mềm ứiư viện -

thông tin, có giao diện đcm giản và thân thiện đồng thời cho phép thiết lập các

phương thức tìm kiếm íinh hoạt và có trợ giúp. Dưới đây là một số giao điện tìm

61

kiếm cơ bản:

w

11»%«

Libol

6mgt

f;n.\'i?<-

>.:.y*:.y-i-3 ti'

ĩC-.iM ';.; . j r r

•-}r ...>‘. i ' Cf:í»:- V-

M

V

•i^OPi-.;:; ■:Jí.-ír‘-íí

Kco-I-. ■■■'SK''

rv.

H. 2 .1 1: G iao diện lìm kiếm (km í^ián trên ph ầ n mềm Lihoỉ ,5.5

/«tww ”0^*>C Ww4fwNif»ei09W(<

ifi»r(»ainf^»ftt8íwnv’^>>*"Ị4i

V

i--.-

IJỈ

.«A \„JU,

r-.v*

«£

■■ỵýi-Jí\'t'■ fỊjịặ^ ^ «ạg>ậ>iie

y b p i

0

'ứxẩúỂ

vòp) ưi!i9íik'ij( TriR^

H. 2. ì 2: G iao diện ùm kiếm nâììi’ cao trên p h ầ n m ềm L ibol 5.5

62

Ỉ^fữỉ-- (ĐUạ ■ -'p?ậ.- , fMắh. ■

1i5W

í ■ i'ÍÌÌÌỊỊS i-l^ ílt^ ỊỊIT ịạ râ ọ !! »S ỊỊfT ỊỈlT O f«

,

ử dìr Ì :ĩ) m w - iw

j 1 MM ị 1QF7 Ị 1ÍW

'

19S 1 9 « 1351

* 1..,::___ __ _____ ] ’ 63 *«• •; íâ; "Hu '

ệtH ẹềt-TẤX |!^UrẸẸH.jìgS

'pẹ-CĩÔlH^ĨPCiGBCậ- TCTỆ-ITNẠIMI

fc#r

:___________________________________________________________ I inyl^Nem

truứrịị MÌ Ir/ » '

ã: tr_________________________________I l 3 ^ Ịibst TimkMm tài:13W Ì139B _____________ Ịaoo l2dD1 hvi s)nH v a r ;2aoc

T ùn^i [ 2 Q W | H * i i * j í i i j \ ; ]

r amKMtrrrnjiqMW

ia

m / ủ n c o l n T tn ™ l.Đ íH m ií-ín h ic -c c ư n EJ,f-i3v íjttííT ia r v a s S c w p . ỤO: nmđh H(nr»a líunu v * a a C * th 5 y a 5 ; 'ú S l i i l t ' 2 ,S ú d ư T g (^ l:a a n W W D lT .-iậ rO K Ii.e i(x C 'k ftlC trifln ữ í ts n ii ƠIJ ch|rfi)iiJt r ti a lí« : q u í. t t j ’

T tiớ n i) t ín ’ *fJD •ữT ư . t ^ r V eầơ-tCin ktìc o u í IỦ3 b tf u ln ícứ ryj d u n a 0 3 0 QtiỊ^2i:ữ ‘& /jr^ ĩlr,-'ti ‘t f u : v l 4 r i ':

b . ■tnđng tln ' OR 'triư » l< n n ctia ra K « x>5c Wiy %lín'.

<

_ H i Ũm

'

LỈ It^ D^arr^

■ ■ ..a

H . 2. ỉ 3 : G i a o d i ệ n í h n k i ế m c ơ b á n Ị r ê ỉ ì p h ầ n m ề m Z o p e

ỉ > . ị TuA -

lim ••

.-PKifc -

^ Ị B ^ Ì T»Ịmirt«JỊ^ÍỊ^1 mTtÕMio: najrpt rôá M^TÌOMụ: □EMTR râá Ic Uf> Tg>t>t000Ì3Ì>i. ữró»*wncM;

WAJCC»T> ồ» ồy>

fỉtW 9Ể‘^T A l U C IT KHOA HQ£^ e

TOĨ!^^^ĩíRỈ®mwõÃĩ«cv!rõ355??^iSõ^ r\ifnữệi m m c w , c g f f m ^ k 3CHWIJP1C wTeoiPW oèoqD c>N Lr--------- ----- •

t ì m IdMíin t è l ềệiM ICHCN

i ta m

■■'**'..

rvl ^nh I>*r Inh vẠtr

i.WÕ"Ị^ rtlnh >-»c- ' ■ y Ị/WD

'í’

T i nJm :

-------------------------------------------1 TV HMá __ Ịnci Aìhb rãũM i*ÌOéri r>SmỊVror

'

' .............- ' I

Ị ỡ ^ tííiã iiiậ ũ •' dm .Qễn } TTm ffrn ííLVì.................

/ / . 2 . 1 4 : G i a o d i ệ n l ì n i k i ể m n â n ^ c a o I r è n p h o n m ề m y .o p e

ỏ.’

>jwríữtcíi

__ j>Vc'-

, *t A I;

| | 0 K i t q i â t r < n í ^

j

'ù áf

Si’’ ©

TRUMG TAM THOUO TIw KHOA H gc VA O0WG MGHỆ QUOC QŨLA KfcTDOHF0W »TrOW

MACim

-■

r"». Iii.tt I I. I

. Khần Im l I í i i BMt ca

1

hoc 3Ề h»fa n iâ

Qĩ T l U t h a : ữĩ Ut^ n]r. CA: tfca hủi: l>rh ạỵ Q< >11 hổi h jĩ

i«|WCwC<3r l» ẽ lĩa ủ fu ^ ụ -: K Ẽ I ^ W Ắ cnữtl^ ,

tf-iM tmiL ũtiitb

la Htia ruii: va nnafl.iuâL 11 chhh tri

13 V ĩ n r » a Í 4 g a o dm: •II TârA w hnr

ỉ y \ĩom(, ir

ì Ị. 2. 15: G i a o d i ệ n t ìm k i ế m t r o n g C S D L K Ọ N C ( h e o p h ư ơ n g p h á p d u y ệ t đ ể

m ụ c ĩ r ê n p h ầ n m é m Z o p c

lln N*rn ViinNỈMwtal»rw

Q

-

« o i » ụ IH O II ( l o i intPi

í>c>- Ũ

Ti I thức VÃ p h it ti >61)

Tõn9 liiỹn Khoa học V9 Cvrig It^h?

KhOđ hoc Còno n g h ị MÒI tiương

Mòi liưưttg vi phểl lĩỉííii Uán VI>>«9

^

" ■ g4t ^

. ỹ S 5 V i , t N , m I n f , W í r . N e w ! l c « í r

Thóno Un lư tt#u

H ộ i n g h ị l ẽ n ^ h v V I v e t ự d ộ n p h õ « ( V I C A «!>): r h ò n g bà O K H p * h ọ c

U^uụ. ,ỉ;ỉỊíi\*^ ,ir^‘í

H . 2. l ố : G i a o d i ệ n t ìm k i ế m t h e o p h t r ơ n g p h á p í i u y ệ í í r ự c t i ế p c á c b a n t in d i ệ n

í i f I r é n p h a n m ề m Z o p e

64

gmSSSMí&BỂữ . ■ r

»*

rrt

tt»ng

Ciuptf» TPu^t imh

Tàl liệu Kỹ thuật Nông nghiệp

tim kiềm

• V- - .?ỉ -iiĩĩi N '

ĩ Sì tỉV^ịv' l

.. IIVI.K

‘ - y - V >•

^.1

. • \:yj\ '

//. 2. / 7; G/oo c//ệ/7 ///?; kìểni của phần mèm Cìreenstone

gim^^yymg

Trk--ìg Ou

BB

tỉKiỉC trtt

Tài liệu K ỹ thuật Nông nghiệp

dỗ mục

l i l i . l ui

'JV( ãK-ãvnọítạu • 'riit;

- •: .V ỉT.-tĩ Aiii r.Ki:Ị

.ÍM

■il'-!;....... ..■.•..IV 0-^u :u.r^ -

t).u: Iiũỉiị ‘ỉ ị \i ti.-a-.-.v V.. ic:.ị f:í-ii <\it i.Ịi M, "•■•ỉ

• cH

!>í«: .iÃK"

đ«i-fn ị •/ <:íií.-7ựs.? • . fĩi'»íi : w l ị

.Vií.v

~ J ĩ>ộ<‘ ị^:ứ'~Ị • HircKỉ jâ íỉ “ " j r i í u IS 2 Ị-Ĩ-;:;-

J ) i . . c ụ

«--•.S.;W'ứ.iỸ '•ìtv

1 ỈXiu \aith • Trvnẹ

\r,!i -.V

^.J»’ i-ldỉ

• " ' ÍV.ỈU

- Kí WmH ìtiĩĩỊ Aku

r- •• to.' .'r;..;;!- •

■ Oi i ^.v.^ • 1'^;. t‘. ì;ì :i;i ^VI' i !..>• N cV J-t Í5X:.J

H. 2. ỈH: Giao diện tìm kiểm íheo đế m uc cỏ cẫii írúc hình cây trèìì phần mèm

G reenstone

65

. ■ a i a P B M

Các hình minh hoạ trên cho thấy, tất cả các CSDL phục vụ khai thác nguồn

TNSNS của Trung tâm đều cho phép hỗ trợ tìm kiếm thông tin theo hai phương

thức !à tìm tin đơn giản và tìm tin có kết hợp các toán tử. Hầu hết các CSDL đều

được tích hợp sẵn các toán tử AND, OR và NOT ưên giao diện, cho phép NDT có

thể tìm kiểm thông tin kết hợp trên một hoặc nhiều trường đồng thời. Các CSDL

nguồn TNSNS của Trung tâm được xây đựng với nhiều điểm truy cập khác nhau

cho phép NDT truy cập đến tài liệu theo một hoặc một số trường két hợp như;

Từ khoá Nhan đề

Tác giả Đề mục

ISBN, ISSN Ký hiệu kho mở

Địa chỉ nguồn ừích Năm xuất bản, nhà xuất bản, ngôn ngữ,...

Đối với một số CSDL như KQNC, Tài liệu kỹ thuật nông nghiệp, các bản tin

điện tử,.. .giao diện tìm kiếm của phần mềm cho phép tìm kiếm duyệt trực tiếp

Thí dụ:

CSDL KQNC cho phép duyệt theo vần chữ cái của chủ nhiệm đề tài, cơ quan

chù trì; theo đề mục các chuyên ngành hay các bản tin điện tử cho phép duyệt theo

tên các bản tin, theo năm và số của các bản tin,.... Với cấu trúc cây, phương pháp

tìm kiếm duyệt trực tiếp đang tỏ ra khá thân thiện và hiệu quả đối với NDT.

Để giúp NDT có ứiể tiếp cận và khai thác hiệu quả thông tin trong các CSDL

của mình, Trung tâm đã biên soạn những tài ỉỉệu hướng dẫn tìm tin cụ thể và tích

hợp sẵn trên giao diện tìm kiếm của từng CSDL.

Thông qua quá trình khảo sát các các bộ sưu tập trên mạng Vista, phỏng vấn

trực tiếp NDT và cán bộ công tác tại Trung tâm cho tíiấy, hiện tại vẫn còn nhiều

điểm chưa hợp lý xuất hiện khi khai thác nguồn TNSNS như sau;

Thứ nhất Tổ chức các bộ sưu tập còn phân tán, phức tạp và chồng chéo

Thí dụ:

Khi truy cập vào bản tin nông thôn, có 3 cách có thể truy cập như sau:

Cách 1: Từ trang Vista, truy cập vào biểu tượng CSDL CSDL toàn văn —í- Bản

66

tin điện tử sau đó truy cập vào từng năm của bản tin.

Cách 2: Từ trang Vista, truy cập vào biểu tượng Thư viện Khoa học Kỹ ứiuật —>

Tra cứu — Bản tin điện tử ^ Bản tin nông thôn

Cách 3: Từ trang Vista, ưuy cập vào biểu tượng KHCN địa phuomig -> Thư viện

vid€0 —> Bản tin nông thôn

Trong ba cách ữên, thực ra chỉ có thể tra cứu thông qua cách 1 là có khả năng

tiếp cận được bản tin này (một cách đầy đủ tương đối), còn cách 2 chỉ truy cập được

bản tin nông thôn năm 2006 và cách 3 thường không truy cập được.

Việc sáp xếp không rố ràng dẫn đến tình trạng Ichi truy cập vào mạng Vista,

NDT sẽ phải đặt ra câu hỏi “nên truy cập vào biểu tượng nào ” ( giữa hai biểu tượng

Cơ sở dữ liệu và Thư viện Khoa học Kỹ thuật) để có thể khai thác được toàn bộ

nguồn tin mà Trung tâm có. Nếu NDT truy cập vào phần tra cứu ừong Thư viện

Khoa học Kỹ thuật, sẽ có 7 biểu tượng xuất hiện gồm:

+ Sách tại Thư viện KHỈCT TW

+ Tạp chí tại Thư viện KHKT TW

+ Báo cáo kết quả NC

+ Tài liệu KHCN trong nước

+ Tài liệu KHCN nước ngoài

+ Bản tin điện tử

+ Tra cứu liên thư viện

Trong các mục trên, có 2 mục là Báo cáo kết quả NC và Bản tin điện tử là

không truy cập được, 5 mục còn lại cho ra kết quả giống nhau đó là giao điện tra

cứu CSDL Sách và tạp chí ưên phần mềm Libol.

Thứ hai'. Phần mềm hỗ ữợ tìm tin chưa đáp ứng được yêu cầu thể hiện ở chỗ:

- Kết quả tìm tin thiếu chính xác (kể cả ưong tìm kiếm cơ bản và nâng cao), một

số trường hợp không thể tìm được thuật ngữ chính xác ngay cả khi đâ sử dụng dấu

ngoặc kép (đối với một sổ CSDL có yêu cầu sử dụng dấu này cho việc tìm chính

xác thuật ngữ).

Thỉ dụ:

Khi tìm thuật ngữ “thỏ” trong CSDL STD, két quả cho ra tớí 59.686 biểu ghi

gần như ỉchông liên quan tới thuật ngữ này.

67

Hay:

Khi tìm tác giả có tên ‘''Ngưyễn Ngọc H ợ r trong CSDL STD, kết quả đưa ra

gồm các tác giả ""Nguyễn Ngọc Hợi" và “ Nguyễn Ngọc H ồi’'

Hoặc:

Cũng trong CSDL này, khi tìm tên tác giả “Nguyễn Thị Thanh Hằng” tại

trường tác giả, kết quả sẽ cho ra nhiều tác giả khác như Nguyễn Thị Thanh Hưomg,

Nguyễn Thị Thanh Hưng, Nguyễn ThỊ Thanh Hường,...còn néu tìm tên tác giả này

ở trường bất kỳ thì kết quả chỉ cho ra những biểu ghi có tác giả là “Nguễn Thị

Thanh Hằng”. Điều này cho thấy đã xuất hiện một số lỗi trong quá trình tạo lập

bảng tra tới CSDL.

- Việc sử dụng thuật ngữ tìm chính xác không thống nhất trong toàn bộ hệ thống

Thí dụ:

Trong CSDL KQNC, NDT không ứiể sử dụng dấu ngoặc kép để tìm thuật ngữ

chính xác trong jkhi CSDL STD lại yêu cầu sử dụng dấu này,

- Kết quả tìm kiếm không hỗ trợ sắp xếp, hiện thị (dạng rút gọn hay đầy đủ) hoặc

export dữ liệu sang các định dạng khác (MS Word, Excel,...)

- Giao điện không thuận tiện, không hỗ trợ lưu kết quả tìm ưuớc đó

Thí dụ:

Trong CSDL KQNC, khi tìm tin cơ bản, NDT muốn trở lại giao diện tìm tin cơ

bản vẫn phải sử dụng chức năng “back to” của ừình duyệt néu như không thực hiện

thao tác tiếp theo trên những biểu ghi vừa tìm được

Hoặc:

Trong các CSDL trên phần mềm Líbol, chức năng back to không được hiển thị

trên màn hình tìm kiếm mặc dù NDT có thể dùng phím Backscape để quay ngược

lại trang trước đó,...

Thứ ba: Có nhiều mục tìm kiếm trên trang Vista không kết nối được với dữ liệu

(CSDL Thư viện video, Tra cứu liên thư viện, Báo cáo két quả nghiên cứu,.,.)

Thứ tư: Không kết nổi được file toàn văn (trưÒTig hợp gần 1/3 file toàn văn trong

CSDL STD không kết nối được trong một thời gian dài) hay trong Bản tin Nông

thôn đổi mới chỉ có 36 số được tìm ứiấy trong năm 2007, 30 số trong năm 2008 và

tính đến đàu tháng 11/2009 bản tin này mới chỉ có 14 số. Những tình ừạng ừên đây

68

cần sớm được khắc phục nhằm đảm bảo chất lưọng cho các CSDL.

d. Cơ chế quản lý người dùng

Như đã ừình bày ở trên, toàn bộ nguồn TNSNS của Trung tâm đều cho phép

truy cập miễn phí từ xa, ngoại trừ CSDL STD.

STD là một trong những CSDL bài trích toàn văn lớn nhất cả nước, do vậy

việc xây dựng và bảo ừì rất tốn kém và mất nhiều công sức. Hơn nữa, việc khai tíiác

ồ ạt sẽ tạo ra hiện tượng tắc nghẽn mạng gây ảnh hưởng trực tiếp đến hiệu quả khai

thác. Vì thế, Trung tâm tìiực hiện cơ chế quản lý người dùng theo từng tài khoản cá

nhân. Trên thực tế, CSDL này gần như miễn phí vì nó được kết hợp với rất nhiều

CSDL nước ngoài như Sciencedirect, ISI Knowledge, Ebrary,.... Để có thể khai

thác thông tin trong CSDL này NDT cần tham gia vào địch vụ “Bạn đọc đặc biệt”

của Trung tâm. Đây là dịch vụ cho phép NDT truy cập toàn bộ CSDL trong nước và

nước ngoài có tại Trung tâm từ bất cứ đâu và bất cứ thời gian nào trong ngày. Tuy

nhiên, để tham gia vào dịch vụ này, NDT thực hiện một số thủ tục đăng ký và đóng

góp một khoản lệ phí nhất định. Khoản lệ phí này sẽ được chi vào việc duy trì và

phát triển nguồn thông tin của Trung tâm.

- Thủ tục tham gia dịch vụ "Bạn đọc độc biệt” gồm:

+ Có đơn đề nghị được tham gia dịch vụ bạn đọc đặc biệt (Xem phụ lục 3)

+ Đơn phải được dán ảnh và có xác nhận của cơ quan

- Điều kiện đăng ký dịch vụ:

+ Là bạn đọc chính thức của Trung tâm

+ Có trình độ từ Thạc sĩ ưở lên hoặc đang là học viên cao học, nghiên cứu

sinh, tiến sĩ

+ Cam kết tuân thủ quy định về sử dụng dịch vụ bạn đọc đặc biệt

+ Đóng góp chi phí cho tổ chức thực hiện dịch vụ (300.000đ/năm)

- Quyền ỉợỉ và trách nhiệm của NDT khi tham gia dịch vụ:

+ Có thể khai tiiác nguồn tin điện tử không phụ thuộc thời gian 24/24 giờ, 7

ngày trong tuần

+ Truy cập nguồn tin điện tử mà không cần đến Trung tâm. Bạn đọc có thể

truy cập nguồn tin được phép từ bất kỳ máy tính nào có két nổi mạng Internet,

+ Chỉ được phép khai thác nguồn tin phục vụ cho giảng dạy, học tập, nghiên

69

cứu khoa học

+ Không được phép cung cấp tên truy cập và mật khẩu cho người khác sử

dụng

+ Được phép ừuy cập tối đa 5 lần/ngày vào các CSDL

+ Được tải xuống (dovvnload) tối đa 20 bài toàn văn/1 phiên truy cập. Không

được tải dữ liệu một cách có hệ thống và ồ ạt nhàm ĩTiục đích lưu trữ hoặc cung cấp

cho bên thử ba

+ Chịu ừách nhiệm cả nhân (về pháp luật và tài chính) đối với những vi phạm

nếu có của mọi lượt truy cập mạng bằng tên và mật khẩu được cấp

Theo ghi nhận từ phía NDT, phương thức cung cấp tìiông tin trên đã và đang

bộc lộ những điểm bất cập, thể hiện ở hai điểm sau:

Thứ nhất. Thủ tục đăng ký dịch vụ vẫn còn phức tạp, để đăng ký dịch vụ, người

tham gia phải có đơn kèm theo ảnh và dấu xác nhận của cơ quan công tác,.... Điều

này đã và đang gây frở ngại lớn cho NDT.

Thử hai: Đối với những NDT không có nhu cầu sử dụng thưòmg xuyên các CSDL

nước ngoài hay chì truy cập CSDL STD để tìm tài liệu cho một mục đích trước mắt

(làm khoá luận, đề tài,,.) thì việc đầu tư một khoản kiiứk phí để đăng ký địch vụ này

là không phù hợp.

Những bất cập ứên cho thấy, phưong thức cung cấp thông tin tại Trung tâm cần

có những sự điều chỉnh nhất định.

2.2.5. Công tác tuyên truyền, gỉớỉ thiệu nguồn tàỉ nguyên sé nội sinh

Công tác tuyên truyền, giới thiệu đóng vai trò quan trọng trong việc quảng

bá các sản phẩm và dịch vụ của bẩt cứ một cơ quan, tổ chức hay doanh nghiệp nào.

Nguồn TNSNS của Trung tâm là vốn tài sản thông tin quý giá của quốc gia, vì thế

cần được tuyên truyền và giới thiệu rộng rãi để phát huy khả năng sử đụng cao nhất.

Cùng với sự ra đời của dịch vụ Bạn đọc đặc biệt, từ năm 2008 Trung tâm đã áp

dụng phương pháp giới thiệu đến tận người dùng tin thông qua hình thức tổ chức

các buổi giới thiệu dịch vụ Bạn đọc đặc biệt tại một số trường đại học, viện nghiên

cứu,...Theo kế hoạch này, Trung tâm đã thành lập một nhóm Marketing gồm các

chuyên gia có khả năng và kinh nghiệm trong quản lý và khai thác thông tin, nhóm

70

này có nhiệm vụ giới thiệu cho NDT những nguồn thông tĩn trong và ngoài nước

hiện có tại Trung tâm đồng thời trình bày những kỹ thuật khai thác các nguồn tin

đó.

Hình thức này đã mang lại những kết quả đáng khích lệ, sổ lượng NDT ứiam

gia dịch vụ “Bạn đọc đặc biệt” đã tăng lên rõ rệt (sổ liệu đã nêu tại mục 1.2).

Tuy nhiên, sau một thời gian hoạt động, hình thức giới thiệu trên vẫn tồn tại

một số hạn chế, thể hiện ở chỗ;

+ Chưa thành lập được một đội ngũ marketing thực sự chuyên nghiệp: Đa phần

cán bộ tham gia công tác marketing không tíiuộc tổ Marketing nên không thể dành

nhiều thời gian cho hoạt động này

+ Chưa xây dựng được một chương trình và ké hoạch cụ thể: Đối với những cán

bộ tham gia, chưa có sự phân công rõ ràng tới từng cá nhân mà hầu hết đều tham

gia dưới hình thức huy động tạm thời. Điều này không phát huy được tính chủ động

của cán bộ tham gia.

+ Việc ưiển khai vẫn mang tính cục bộ, chưa được nhân rộng: Mặc dù đã ttiển

khai giói thiệu được ở nhiều đơn vị, song vẫn chưa có một kế hoạch mang tính vĩ

mô để có thể triển khai theo vùng hay lĩnh vực cần giói thiệu.

Từ những tồn tại nêu trên, đòi hỏi Trung tâm cần chú trọng hom nữa công tác

marketing và tăng cường thêm các hình thức tuyên truyền giới thiệu nguồn TNSNS

71

tới NDT.

Chương 3. GIẢI PHẤP TỐI ư u HOẢ CÔNG TÁC XÂY

DựNG VÀ QUẢN LÝ NGUÔN TÀI NGUYÊN s ô NỘI SINH TẠI TRUNG TÂM

3,1. Đảm bảo tính pháp lý cho nguồn tài ngụỵên số nội sình

Để giải quyết vấn đề pháp lý cho công tác số hoá tại Trung tâm như đã trình

bày tại mục 2.2.1, cần dựa trên các văn bản hướng dẫn và chính sách của Nhà nước

trong lĩnh vực này.

Chính sách của Nhà nước về quyền tác giả và những quyền liên quan được

quy định tại Điều 8 cùa Luật Sở hữu trí tuệ, trong đó khoản 2 và 3 nêu rõ:

+ Khuyến khích, íhúc đẩy hoạt động sáng tạo, khai thác tài sản tri tuệ nhằm

góp phần phát triển kỉnh tể - xã hội, nâng cao đời sổng vật chất và tinh thần cùa

nhân dân.

+ H ỗ trợ tài chỉnh cho việc nhận chuyển giao, khai thác quyền sở hữu ừ'i tuệ

phục vụ ỉợi ích công cộng; khuyến khích tổ chức, cá nhân trong nước và nước ngoài

tài trợ cho hoạt động sáng tạo và bảo hộ qưyền sở hữu trí tuệ.[l].

Như vậy, công tác số hoá tài liệu tại Trung tâm có thể tận dụng chính sách này

để thực hiện những vấn đề liên quan đến bản quyền cho tài liệu số hoá. Lộ trình và

phương pháp tiến hành như sau:

Thứ nhất, Vẩn đề mua bản quyền:

Trung tâm cần có đơn gửi Bộ Văn hoá - Thông tin đồng thời có công văn gửi

Bộ Tài chính, Bộ Kế hoạch và Đầu tư để xin hỗ trợ kinh phí thực hiện bản quyền

cho tài liệu số hoá. (Khoản 1 Điều 5 Nghị định 100/2006/NĐ-CP Quy định chi tiết

và hướng dẫn thi hành một số điều của Bộ luật Dân sự, Luật Sở hữu trí tuệ về quyền

tác giả và quyền Hên quan có hướng dẫn cụ thể “Bộ Văn hõá - Thông tin chủ trì,

phối hợp với Bộ Tài chính, Bộ Ke hoạch và Đầu tư và các cơ quan liên quan hưởng

dẫn ỉập kế hoạch tài chính (tạo nguồn, quỹ), cơ chế thực hiện việc mua bản quyền ”

72

[9].

Thử hai\ Quy trình thực hiện:

Bước 1; Lập đanh mục những tài liệu số hoá kèm theo đơn trình Bộ Văn hoá -

Thông tin phê duyệt.

Khoản i Điều 5 Nghị định 100/2006/NĐ-CP nêu rõ "Bộ Văn hoả - Thông tin

duyệt danh mục tác phẩm thuộc diện hẫ trợ mua bản quyền đối với các cơ quan, tổ

chức thuộc trung ương ”[9]

Bước 2: Soạn thảo công văn xin hỗ ượ kinh phí gửi Bộ Tài chính, Bộ Kế hoạch và

Đầu tư.

Bước 3: Xác định các chủ sở hữu cần thương lượng mua bản quyền

Chủ sở hữu bản quyền được nêu trong các điều từ 36 đến điều 42 của Luật Sở

hữu trí tuệ gồm:

+ Chủ sở hữu quyền tác giả là tổ chức, cá nhân nắm giữ một, một số hoặc toàn

bộ các quyền tài sản quy định tại Điều 20 của Luật Sở hữu trí tuệ (Điều 36)

+ Chủ sở hữu quyền tác già ià tác giả (Điều 37): Tác giả sử dụng thời gian, tài

chính, cơ sở vật chất - kỹ thuật của mình để sáng tạo ra tác phẩm có các quyền nhân

thân quy định tại Điều 19 và các quyền tài sản quy định tại Điều 20 của Luật Sở

hữu trí tuệ.

+ Chù sở hữu quyền tác giả là các đồng tác giả (Điều 38): Các đồng tác giả sử

dụng thời gian, tài chính, cơ sở vật chất - kỹ thuật của mình để cùng sáng tạo ra tác

phẩm có chung các quyền quy định tại Điều 19 và Điều 20 của Luật này đối với tác

phẩm đó. Trong đó, các đồng tác giả sáng tạo ra tác phẩm quy định tại khoản 1 Điều

này. nếu có phần riêng biệt có thể tách ra sử dụng độc lập mà không làm phưoTng hại

đến phần của các đồng tác giả khác thì có các quyền quy định tại Điều 19 và Điều

20 của Luật này đối với phần riêng biệt đó.

+ Chủ sở hữu quyền tác giả là tổ chức, cá nhân giao nhiệm vụ cho tác giả hoặc

giao kết hợp đồng với tác giả (Điều 39): Tổ chức giao nhiệm vụ sáng tạo tác phẩm

cho tác giả là người thuộc tổ chức mình là chủ sở hừu các quyền quy định tại Điều

20 và khoản 3 Điều 19 của Luật Sở hữu ừí tuệ, trừ trường hợp có thoả thuận khác.

+ Tổ chức, cá nhân giao kết hợp đồng với tác giả sáng tạo ra tác phẩm là chủ

sở hữu các quyền quy định tại Điều 20 và khoản 3 Điều 19 của Luật Sờ hữu trí tuệ,

73

trừ trường hợp có thoả thuận khác.

+ Chủ sờ hữu quyền tác giả là người thừa kế (Điều 40): Tổ chức, cá nhân được

thừa kế quyền tác giả theo quy định của pháp luật về thừa ké là chủ sở hữu các

quyền quy định tại Điều 20 và khoản 3 Điều 19 của Luật này,

+ Chủ sở hữu quyền tác giả là người được chuyển giao quyền (Điều 41): Tồ

chức, cá nhân được chuyển giao một, một số hoặc toàn bộ các quyền quy định tại

Điều 20 và khoản 3 Điều 19 của Luật này theo thoả thuận trong hợp đồng là chủ sở

hữu quyền tác già.

+ Chủ sở hữu quyền tác giả là Nhà nước (Điều 42) đối với các trường hợp sau:

a) Tác phẩm khuyết danh;

b) Tác phẩm còn trong thời hạn bảo hộ mà chủ sờ hữu quyền tác giả chết

không có người thừa kế, người thừa kế từ chối nhận di sản hoặc không được quyền

hường di sản;

c) Tác phẩm được chủ sở hữu quyền tác giả chuyển giao quyền sờ hữu cho

Nhà nước.

Bước 4 : Xác định mức giá và tiến hành thương lượng với chủ sở hữu

Hiện tại, chưa có khung giá cho việc chi trả quyền tác giả, tuy nhiên có thể

tham khảo kinh nghiệm ữong nước và nước ngoài để xây dựng khung giá cho vấn

đề này, Trong điều kiện hiện nay, việc quan trọng nhất vẫn là thương lượng với tác

giả và những cá nhân, tổ chức nắm giữ bản quyền của tài liệu như đã nêu ờ phần

trên.

Trên thế giới, thông qua tìm hiểu cách làm cùa Google trong vẩn đề chi trà bản

quyền cho thấy, tổ chức này thông qua các cơ quan đăng ký bản quyền sách ưên ứiế

giới để thu xếp, Google sẽ ửianh toán 63% doanh thu từ những lần sử dụng cho

người nắm giữ bản quyền và 60 USD cho việc số hóa mỗi tác phẩm.

ở Việt Nam, Công ty cổ phần Tin học Lạc Việt đã áp dụng hình thức chi trả

tác quyền cho tác giả thông qua Lễ ký kết hợp đồng tác quyền với Trung tâm Quyền

tác giả vãn học Việt Nam được diễn ra sáng 29/7 tại trụ sở Hội Nhà văn Việt Nam.

Với dự án số hoá đợt 1 là 3000 đầu sách và theo kể hoạch sẽ đạt 5000 bảti đến hểt

năm 2009.

74

Theo ông Hà Thân - Tổng Giám đốc Lạc Việt cho biết: Mô hình thu nhập của Lạc Việt được tính theo số lần độc giả lấy tài liệu xuống đọc. số tiền tải tác phẩm

đó sẽ có giá thành thấp hoTi so với việc mua sách xuất bản vì chỉ tốn tiền băng thông

rộng vá in đĩa. Chi phỉ cho giấy mực là 40% írong khi phát hành trên mạng không

có phí giấy mực nữa chúng ta có tíiể tiết kiệm được 30%. Việc này cũng sẽ tránh sự

tồn kho sách, gây lăng phí như việc sách xuất bản hiện nay.

Số tiền được chi trả cho tác giả khi tác phẩm được số hoá là 40% doanh thu từ

tác phẩm đó và theo đó, Trung tâm Quyền tác giả văn học Việt Nam cũng sẽ thu

được 20% lừ chính các tác phẩm này từ thư viện sách của Lạc Việt.

Bà Đoàn Thị Lam Luyến - Giám đốc Trung tâm Quyền tác giả văn học Việt

Nam, nếu ở Việt Nam việc quàn lý các tác phẩm số hoá tốt thì các tác giả sẽ được

hưởng một khoản thu lớn từ doanh thu các tác phẩm đó. Bên cạnh đó, việc Việt

Nam có thêm kênh tra cứu sách trực tuyến sẽ giúp cho cộng đồng người Việt hoặc

người nước ngoài quan tâm đến sách Việt Nam. Thông qua kênh này, bạn đọc cỏ

thể tra cứu và tải xuống với giá rẻ hơn và tiện ích so với sách in.

Những kinh nghiệm trên đây tuy không thể áp dụng nhưng có thể coi là những

gợi ý hữu ích cho Trung tâm trong vấn đề này.

Theo tác giả, có hai phưomg án để thực hiện việc thanh toán bản quyền cho chủ

sở hữu đó là;

- Phươn2 án ỉ : Xin hỗ trợ toàn bộ kinh phí chi trả cho chủ sờ hữu từ phía Nhà

nước theo hướng dẫn tại Khoản 2 và 3 Điều 8 của Luật Sở hữu trí tuệ.

Nếu thực hiện phưong án này, các địch vụ cung cấp trực tuyến tài liệu toàn

văn của Trung tâm phải được cung cấp hoàn toàn miễn phí.

- Phươm án 2 : Trung tâm chịu một phần kinh phí,

Theo phương án này, một phần kinh phí chi trả cho chủ sở hữu sẽ được trích ra

từ các dịch vụ cung cấp tài liệu số hoá có trả phí đối với NDT. Như vậy, các địch vụ

cung cấp tài liệu toàn văn trực tuyến sẽ tiếp tục được thực hiện theo hỉnh thốc thu

phí.

Một trong những vấn đề gây khó khăn cho Trung tâm hiện nay là không ứiể

thống kê được sổ lần đọc/download cho một bài báo cụ ứiể, do vậy không thể có

căn cứ để thực hiện việc chi trả như Công ty c ổ phần Lạc Việt đã làm.

Khó khăn thứ hai đổi với Trung tâm là không hạn chế được hiện tượng sao

75

chép ứái phép nội dung.

Để giải quyết hai khó khăn trên, giải pháp duy nhất là thay thế phần mềm, vì

vậy việc thực hiện phương án này trong điều kiện hiện nay là không thể thực hiện

được.

Tuy nhiên, trong việc thương lượng với chủ sở hữu tài liệu, có một kinh

nghiệm nên được học tập đỏ là hình thức thông báo rộng rãi tới chủ sở hữu như Ban

Biên tập Tạp chí Thư viện Việt Nam đã áp dụng đối với các chủ sở hữu có các bài

báo đăng trên tạp chí này, sau đây tác giả xin trích toàn văn bản thông báo đăng trên

tạp chí Thư viện Việt Nam số 4/2009:

"Sững song với việc phát triển nội dung và hình thức của Tạp chỉ, trong khuôn

khổ dự ản Mạng Quốc tể về ẩn phẩm Khoa học (INASP) của Anh tài trợ nhằm giúp

nâng cao hiểu biểt và sử dụng của bạn đọc về các tạp chỉ khoa học xuất bản tại Việt

Nam, thời gian tới Ban Biên tập Tạp chi Thtĩ viện Việt Nam sẽ chính thức đăng tải

nội dung Tạp chỉ ìên mạng Internet thông qua ừơng Tạp chí Khoa học Việt Nam

trực tuyến (VỈOL)- http://wMrw.vjol.mfor.

Việc đăng tải ừực tuyến này sẽ góp phần qnảng bả rộng rãi hem về hoạt động

của ngành Thư viện trong vờ ngoài nước. Đồng thời cũng tạo điều kiện cho những

ai quan tâm đến nghiệp vụ thư viện được tiếp cận nhanh chỏng những vẩn đề nóng

hổi, những kiến thức mới trong hoạt động của ngành Thư viện. Việc đăng tải bài

trên mạng sẽ không được trả thêm tiền nhuận bút. Vì thế nếu tác giả nào không

muốn đưa bài của mình lên mạng trên xin thông báo cho Ban Biên tập biết ngay khi

gửi bài đăng tạp chỉ. Nếu tác giả không có ý kiến gì, Ban Biên tập sẽ tự động đưa

các bài viết đó lên mạng. Vậy xin thông báo để cộng tác viên Tạp chí Thư viện Việt

Nam được biết!

Toà soạn rất mong tiếp tục nhận được sự cộng tác, góp ỷ của đông đảo bạn

đọc’’

Hình thức thông báo trên cũng được xem như một dạng “xin phép” giúp xác

định và hạn chế được những trường họp cần phải tiến hành thương lượng. Do vậy,

76

hình thức này cần được áp dụng tại Trung tâm trong thời gian tới.

3.2. Đảm bảo nguồn nguyên liệu đầu vào

Đảm bảo nguồn nguyên liệu là điều kiện tiên quyết cho việc phát triển nội

dung sổ, đặc biệt là những CSDL được xây dựng dựa trên cơ sở số hoá tài liệu

truyền thống như STD và KQNC. Trong mục 2.2.1 đã nêu một số tồn tại trong việc

cung cấp nguồn thông tin đầu vào cho CSDL STD, nguyên nhân của hiện tượng

trên là do:

+ Nguồn tài liệu bổ sung về (các tạp chí khoa học và tài liệu hội nghị, hội

thảo) không được cập nhật đều đặii

+ Thiếu sự phối hợp giữa các bộ phận tham gia

+ Cơ chế bổ sung tài liệu còn những vướne mắc chưa được giải quyết hợp lý

Các giải pháp giúp hạn chế những tồn tại trên gồm:

- Tăng cường tính chủ động cùa các bộ phận tạo lập nguồn TNS, đặc biệt là bộ

phận xây dụng CSDL toàn văn qua kênh sổ hoá.

Công việc phát hiện và bổ sung nguồn tài liệu có giá trị là nhiệm vụ ứiưèmg

xuyên của bộ phận bổ sung tài liệu. Tuy nhiên, bộ phận tạo iập nguồn TNS ià nơi

trực tiếp xử lý, theo dõi tính cập nhật của các tài liệu khoa học, vì thế việc phát hiện

những tài liệu truyền thống có giá ưị và ứieo đõi tính cập nhật của tài liệu khoa học

phụ thuộc nhiều vào bộ phận này. Phát huy tính chủ động của bộ phận này cũng

chính là nhân tố góp phẩn đảm bảo tính bao quát của nguồn nguyên liệu đầu vào

cho công tác phát triển nguồn TNSNS.

đầy đủ V ứ kịp thời

- Tăng cường phối hợp giữa các bộ phận liên quan để đảm bảo nguồn tin ỉuôn

Các bộ phận liên quan bao gồm:

+ Bộ phận bổ sung

+ Bộ phận số hoá và bộ phận xử lý

+ Bộ phận phục vụ và cung cấp tài liệu truyền thống, tài liệu điện tử

Các bộ phận trên có mối liên hệ chặt chẽ và hỗ trợ lẫn nhau trong việc đảm

bào nguồn nguyên liệu cho phát triển nguồn TNSNS. Mối liên hệ này thể hiện qua

77

sơ đồ sau;

H. 3. ỉ: Sơ đồ thể hiện mẻi liên hệ giữa các bộ phận trong việc đảm bảo nguồn

ngityên liệu cho phát triển nguồn TNS

+ Bộ phận 1 cung cấp những tài liệu cần thiết cho bộ phận 2

+ Bộ phận 2 phát hiện những tài liệu mới có giá trị và những tài liệu bổ sung bị

thiếu sau đó thông báo cho bộ phận 1

+ Bộ phận 3 tíiổng kê và phát hiện nhu cầu của NDT sau đó thông báo cho bộ

phận 1 và 2

+ Bộ phận 1 và 2 cung cấp tài liệu dạng truyền thống và nguồn TNSNS cho bộ

phận 3.

Sự phối hợp tốt giữa 3 bộ phận trên sẽ góp phần đảm bảo nguồn nguyên liệu

cho phát triển TNS tại Trung tâm được đầy đủ, Hên tục và kịp thời.

- Quản ỉý chặt chẽ các nguồn tài liệu dạng in thuộc diện số hoả

Các nguồn tài liệu dạng in phục vụ cho quá trình tạo lập TNSNS bao gồm 3 nguồn

chính là:

+ Nguồn mua (chủ yếu là các tạp chí khoa học ừong nước)

+ Nguồn lưu chiểu (đối với các tạp chí khoa học của các sở KH&CN các

tỉnh/thành phố và các báo cáo kết quả nghiên cứu các cấp)

+ Nguồn thu thập qua kênh biếu tặng, sao chụp lại (đối với các tài liệu hội

78

nghị hội thảo lchoa học)

Giải pháp đối với nguồn tạp chí mua trong nước là; Thường xuyên theo dõi

nguồn tạp chí đang đặt mua (theo định kỳ), phát hiện những số tạp chí bị thiếu để có

khiếu nại kịp thời đồng thời tìm kiếm những tạp chí mới hoặc những tạp chí từ các

nguồn khác chưa được bổ sung về Trung tâm.

Giải pháp cho nguồn tài liệu nộp lưu chiểu là: Yêu cầu các tổ chức, cá nhân có

trách nhiệm nộp lưu chiểu đầy đủ và đúng hạn; có quy định và cơ chế giao nhận luxi

chiểu rõ ràng đảm bảo tài liệu không bị thất lạc (đối với những tài liệu được gửi qua

đường bưu điện).

Đối với nguồn tài liệu hội nghị, hội ứiảo khoa học cần được phát triển hơn nữa

bởi đây ỉà nguồn tài liệu rất có giá trị khoa học. Để thu thập đầy đủ và kịp thời

nguồn tài liệu này, Trung tâm cần;

+ Tăng khối lượng thu thập nguồn tài liệu này lên mức ỉchông hạn chế thay vì

hạn chế như hiện nay (hiện tại là 150 tài liệu/ năm).

+ Xây dựng cơ chế bổ sung tài liệu cụ ứiể cho nguồn tài liệu này (về đơn giá

sao chụp, phương thức thanh toán và hỗ trợ kinh phí đi lại cho những người trực

tiếp tham gia thu thập)

+ Bộ phận chịu trách nhiệm bổ sung nguồn tài liệu này cần tăng cường các

mối quan hệ với những cơ quan, tổ chức và cá nhân đang lưu giữ những tài liệu

thuộc diện thu thập của Trung tâm để có biện pháp và phương thức thu thập phù

họp (khuyến khích thu thập thông qua hình thức biếu /tặng).

+ Thường xuyên tìm kiếm và phát hiện những tài iiệu khoa học dạng hội nghị,

3.3. Nâng cao chất lượng nguồn tài nguyên số nội sinh

hội thảo ứiuộc diện để đảm bảo tính cập nhật

Chất lượng TNS phụ thuộc vào nhiều yếu tố và quá trình, trong đó chủ yểu

phụ thuộc vào quá trình lựa chọn nguồn nguyên liệu đầu vào, kỹ thuật tạo lập TLS

và công tác xử lý dữ liệu số. Sau đây là một số giải pháp nẳng cao chất lưọTig nguồn

3.3.1. Tối mi hoá công tác sổ hoá tài liệu truyền tbống

TNSNS tại Trung tâm:

Trong quá trình số hoá tài liệu, dù sử đụng loại máy scan nào, người xử lý

79

cũng Ichông ừánh khỏi một số lỗi nhất định như đã trình bày trong mục 2.2.2. Trong

phần này, tác giả sẽ tập trung vào tìm hiểu cách khắc phục những lỗi trên để đảm

bảo chất iượtig cho TLS (áp dụng đối với máy APT BookScan 120Q và các phần

mềm kèm theo)

- Tài ỉiệu bị thiểufìle ảnh

Nguyên nhân:

+ Trang tài liệu bị dính vào nhau

+ Độ hút quá mạnh của cánh tay lật trang

+ Do độ thổi quá mạnh của ống thổi

Khắc phục:

+ Kiểm tra tài liệu ttirớc khi thực hiện sổ hoá (các góc quăn có thể là nguyên

nhân khiến các trang tài liệu đính vào nhau)

+ Điều chỉnh độ hút của cánh tay lật trang

- Trang ảnh bị cut-off vào text

Nguyên nhân:

+ BỊ cắt vào text trong quá trình loại bỏ kẹp hoặc crop

+ Do khuông lề quá rộng

Khắc phục:

+ Chia nhỏ theo các lô nếu tài iiệu quá dày ( mỗi lô khoảng 300 trang)

+ Xử lý khuông lề cho các trang ở giữa lô

- Anh bị mờ

Nguyên nhân:

+ Tài liệu gốc bị mờ

+ Thiết đặt các thông số camera không phù hợp

+ Tài liệu có ảnh màu, trong đó có nhiều màu nhạt gần với màu nền trắng của

trang tài liệu

Khắc phục:

+ Điều chỉnh lại các thông số cho camera

+ Sử dụng các chức năng ừong Book Scan Editor (BSE) để điều chỉnh

- Nền ảnh bị tối

Nguyên nhân:

80

+ Trang tài liệu quét có nền tối

+ Thiết đặt các thông số cho camera chưa phù hợp

Khăc phục:

+ Đặt lại các thông số cho camera

+ Đặt lại chế độ mở ống kính

+ Sử dụng các chức năng trong BSE để điều chỉnh (tăng độ sáng)

-Anh bị nghiêng

Nguyên nhân:

+ Trang tài liệu bị in nghiêng hoặc vị trí đặt không thẳng

Khẳc phục:

+ Đặt lại tài vị trí liệu cần quét cho thẳng

+ Sử dụng chức năng Manual deskewing trong chưoíng trình BSE để chỉnh lại

- Đen ỉề

Nguyên nhân:

+ Khuông lề quá rộng

Khắc phục:

+ Khuông lại trang tài liệu (sử dụng chức năng crop ữong chương trình BSE

hoặc Acrobat proíessional)

+ Sử dụng chức năng “Erase” hoặc “Black border cleanup” trong chương trình

BSE để xoá viền đen. Trong Acrobat proíessional có thể sử dụng chức năng crop

“odd pages only” hoặc “even pages only”

- Sìze ảnh không đồng nhất giữa các trang

Nguyên nhân:

+ Quá trình crop các trang chẵn và lẻ không thống nhất

+ Tài íiệu scan là tài liệu phô tô hai trang trên một mặt giấy

Khãc phục:

+ Thực hiện crop lại

+ Nên quét cả trang trắng để đảm bảo số trang chẵn và lẻ không bị lệch nhau

3.3.2. Hoàn thiện công tác biên mục

Công tác biên mục đóng vai trò quan trọng trong quá trình xây dựng các

BSTS, nó quyết định đến sự thống nhất dữ liệu trong toàn hệ thống, giúp cho quá

81

trìnlì quản lý, khai thác được thuận lợi và nhanh chóng. Công tác biên mục liên

quan đến nhiều công cụ và thao tác nghiệp vụ khác nhau, trong đó việc ứng dụng

các chuẩn dữ liệu và sử dụng các công cụ biên mục đóng vai trò quan trọng nhất.

Liên quan đến việc đảm bảo chất lượng trong công tác biên mục chúng ta thấy cỏ

một số vấn đề chính nổi lên như sau;

Thứ nhất: vẩn đề áp dụng các chuẩn, khổ mẫu và công cụ biên mục

- Chuẩn mô tả dữ ỉiệu thư mục:

Hiện nay Trung tâm đang sử dụng khổ mẫu Marc21 cho công tác biên mục,

trong khi đó khổ mẫu này lại chịu ảnh hưởng nhiều của quy tắc mô tả AACR2. Do

vậy, Trung tâm cần sớm triển khai áp dụng quy tắc này vào công tác biên mục.

Để áp dụng AACR2 vào xử lý tài liệu tại Trung tâm, trước hết cần có một tải

liệu AACR2 rút gọn bởi vì hiện nay tuy đã có bản dịch đầy đủ về AACR2, nhưng

tài liệu này quá công kềnh. Bản dịch đầy đủ này dày khoảng hcm một nghìn ữang,

trong đó từ chương 2 đến chương 13 là những chương mô tả các dạng tài liệu đặc

thừ nên thường được chỉ đẫn xem chương 1 (Quy tắc mô tả tổng quát). Trong khi đó

lại thiếu nhiều chỉ dẫn cần thiết cho biên mục tài liệu Việt Nam. Bởi vậy, cần có

một tài liệu mang tính rút gọn về AACR2, trong đó chỉ nên đưa Chương l (Quy tắc

mô tả tổng quát) và một số chương có dạng tài liệu phổ biến như sách, tạp chí, bài

trích và nguồn tin điện tử để thuận lợi cho việc ưa cúai hàng ngày của các cán bộ

biên mục. Điều quan trọng nhất là phải đưa vào quy tắc này những vấn đề cụ thể

của Việt Nam theo quy định của AACR2.

- Áp dụng kho mẫu:

+ Đối với dữ liêu thư muc:

Khổ mẫu dữ liệu thư mục đóng vai trò quan trọng trong xây dựng các CSDL

thư mục. Tiêu chuẩn hoá khổ mẫu thư mục là cơ sở thiết yếu trong trao đổi thông

tin. Do phát triển tự phát, thiếu sự kết hợp và sự chưa nhận thức được đầy đủ vai trò

của chuẩn khổ mẫu dữ liệu nên xuất hiện tình ừạng không thống nhất khổ mẫu dữ

liệu, gây khó khăn trong việc trao đổi dữ liệu. Một nghiên cứu do Trung tâm Thông

tin Tư liệu KHCN Quốc gia tiến hành đã cho thấy, chỉ riêng trong các CSDL trên

mạng VISTA ở Trung tâm cũng đã có đến 12 loại khổ mẫu đữ liệu thư mục khác

nhau [2]. Qua tìm hiểu thấy có hai khổ mẫu được phổ biến rộng rãi nhất ở Việt

82

Nam; khổ mẫu dữ liệu thư mục do Trung tâm Thông tin Tư liệu KH&CN Quốc gia

biên soạn [3] được phổ biến rộng rãi trong hệ thống thông tin KHCN quốc gia và

khổ mẫu CSDL Sách do Thu viện Quốc gia biên soạn lại phổ biến rộng rãi ữong hệ

thống thư viện công cộng. Tuy nhiên, cả hai khổ mẫu trên đều không tuân thủ khổ

mẫu chuẩn quốc tế nào (như MARC, UNIMARC, CCF,...)-

MARC 21 là một khổ mẫu tích họp có thể dùng chung cho các loại hình tài

liệu thư viện không phải thiết kế các mẫu nhập tin khác nhau, mà chỉ cần ứiêm bớt

các trường dữ liệu đặc thù cho phù hợp; Khả năng chia sẻ và sử dụng các biểu ghi

thư mục giữa các thư viện với nhau được đễ đảng không chỉ giữa các thư viện trong

nước mà cả với thư viện nước ngoài. Tài liệu khổ mẫu MARC21 rút gọn xuất bản

năm 2005 có bổ sung một sổ công cụ hồ trợ thổng nhất cho người biên mục; danh

mục mã ngôn ngữ theo tiêu chuẩn ISO 639-2; mã nước theo tiêu chuẩn ISO 3166;

từ và cụm từ viết tắt dùng ừong biên mục; nguồn hệ thống phân loại, thuật ngữ.

Việc áp dụng khổ mẫu Marc21 vào xây dựng CSDL là rất hữu ích và cần thiết.

Đẻ giảm bớt những khó khăn như đã nêu tại mục 2.2.3, Trung tâm cần biên soạn

một tài liệu hướng dẫn rút gọn trong phạm vi sử dụng của minh để cán bộ xử lý áp

dụng một cách dễ dàng hcm. Bên cạnh đó, việc tăng cường các khoá tập huấn về

MARC21 cho cán bộ, đặc biệt là những cán bộ mới cQng cần được quan tâm hofn

nữa.

+ Đối vái toàn bô hê thống

Cùng với việc áp dụng MARC21 cho dữ iiệu thư mục, một số chuẩn dùng cho

mô tả, trao đổi dữ liệu, siêu dữ liệu phổ biến cũng cần được triển khai nghiên cứu và

áp dụng thống nhất. Dưới đây là một số chuẩn được khuyến nghị dùng chung cho

các Cữ quan TT-TV ở Việt Nam [2]:

ChuẩD

Ghi chú Dịch vụ, ứng dụng STT

Dùng trong trao đổi dữ liệu:

1 Định dạng mô tả trang PDF Dùng để cung cấp tài liệu số hoá

2 Dữ liệu có câu trúc Dùng cho tài liệu điện tử

Chuấn quốc tế ISO 8879. Sử dụng SGML

MARC-DTD do Thư viện Quốc hội

83

Mỹ xây dựng

Hypertexr Mark-up Language

HTML

Extensible Mark-up Language XML

Kliô mâu phân phôi tài PDF

liệu

2002

UNICODE, ISO 10646 4. Bộ Mã ký tự TCVN 6909-

Dùng trong siêu dữ liệu và biên mục

1

Tiêu chuânNISO Z39.85-200Ì Dublin Core Siêu dữ liệu

Dùng cho dữ liệu thư mục Biên mục mảy đọc được MARC21

ISO 2709

Dùng trong các dịch vụ ứng dụng

1

áp dụng cho các máy chủ thông tin Z39.50 Máy chủ ứng dụng tìm

thư mục, là chuẩn ISO 23950. tin và yêu cầu tin

- Sử dụng khung phân loại:

Việc sử dụng khung phân loại trong công tác xử lý tài liệu được Trung tâm áp

dụng khá sớm. Trước khi biên soạn và đưa vào sử dụng Khung phân loại BBK (năm

1975), Trung tâm (khi đó là Thư viện Khoa học Kỹ thuật Trung ương) đã sử dụng

hai khung phân loại đó là Khung phân loại Trung tiểu hình và Khung phân loại

ƯDC. Hiện nay, bên cạnh Khung phân loại BBK, Khung Đê mục Quốc gia Trung

tâm còn sử dụng thêm Khung phân loại dành cho các sản phẩm công nghiệp (đối

các CSDL về thị trường công nghệ).

Đối với Khung phân loại đành cho dữ liệu thư mục, mặc dù theo xu hướng

hiện nay cũng như theo khuyến nghị của Vụ Thư viện thì Khung phân loại DDC

đang được nhiều cơ quan TT-TV triển khai áp dụng cùng vớỉ MARC21 và AACR2.

Tuy nhiên theo quan điểm của những người trực tiếp làm công tác phân ioại tài liệu

tại Trung tâm cũng như quá trình tìm hiểu, so sánh khung phân loại DDC với BBK

chúng tôi nhận thấy:

Việc sử dụng khung phân loại BBK cho các tài liệu khoa học kỹ thuật vẫn có

84

nhiều ưu điểm hơn so với DDC bởi lẽ trong khung phân loại BBK, các mục đành

cho khoa học kỹ thuật được trình bày tương đối khoa học và chi tiết. Trong khi đó

khung phân loại DDC các mục này được trình bày rất đơn giản và chung chung.

Đối với các CSDL thị trường công nghệ hiện đang áp dụng hai công cụ phân

loại là Khung Đề mục Quốc gia và Khung phân loại đành cho các sản phẩm công

nghiệp. Theo kiến nghị của những cán bộ trực tiếp xây dựng CSDL này thì chỉ nên

sử dụng một trong hai công cụ trên cho công tác phân loại tài liệu.

Tuy nhiên, việc sử dụng đồng thời 3 công cụ phân loại đã tạo nên sự thiếu

thống nhất trong toàn hệ ứiống. Do vậy, trong thời gian tới Trung tâm cần thống

nhất lại việc áp dụng khung phân loại chung cho toàn hệ thống.

- Sử dụng Bộ từ khoả cỏ kiểm soát trong quá trình xử lý từ khoá

Hiện nay, đa số các cơ quan thông tin - thư viện đều lựa chọn phương pháp

đánh từ khoả tự do bởi hai nguyên nhân là do không có bộ từ khoá có kiểm soát và

để cho nhanh chóng, thuận tiện trong quá trình xử lý tài liệu. Điều này làm mất đi

tính nhất quán của dữ liệu bởi vì từ khoá tự do bị ảnh hưởng lớn bời yếu tố chủ

quan của người xử lý. Trong cùng một chủ đề sẽ có nhiều từ Iđioá khác nhau do sự

thiếu thống nhất ữong quá ưình sử dụng ngôn ngữ ở các địa phương,..,Với hệ

thống chỉ dẫn và bảng tra chéo, bộ Từ khóa có kiểm soát đã tạo ra được sự thổng

nhất về thuật ngữ trong toàn bộ hệ thống CSDL của Trung tâm.

Để khắc phục những tồn tại như đã nêu tại mục 2.2.3 và đảm bảo tính thống

nhất của hệ thống từ khoá ưong các CSDL thư mục cũng như toàn văn, Trung tâm

cần tiếp tục áp dụng đầy đủ và có kiểm duyệt bộ Từ khoá có kiểm soát vào quá ưình

xử lý từ khoá. Bên cạnh đó cũng cần đối chiếu các thuật ngữ mới với các từ điển

chuyên ngành và cập nhật vào Bộ Từ khoá có kiểm soát. Trước mắt, khi chưa tái

bản có ứiể cập nhật trực tiếp bằng cách viết tay trực tiếp vào bản in của Bộ Từ khoá.

Thứ hai: Công iảc kiểm duyệt Vớ hiệu đính

Một trong những đặc trưng của các CSDL thư mục tại Trung tâm là có thời

gian xây dựng khá dài, trải qua nhiều thế hệ cán bộ xử lý, qua nhiều tiêu chuẩn và

phần mềm khác nhau nên sự thiếu đồng bộ về dữ liệu hoặc một sổ biểu ghi không

đảm bảo chất lượng là khó tránh khỏi. Trong số đó có những sự khác biệt có ứiể

chấp nhận và cả những sự khác biệt, sai sót cần được chỉnh sửa lại cho thống nhất.

85

Thi dụ:

+ Các biểu ghi hồi cố cho kho sách thường có các ký hiệu không kèm theo

năm hoặc không có trường Chỉ sổ Cutter. Đây là sụ khác biệt cỏ thể chấp nhận vì

những ký hiệu này được lập từ nhiều năm trước, khi đó chưa quy định việc đánh ký

hiệu kèm theo năm, trong khi khối lượng kho tài liệu tài liệu dạng này rất lớn nên

Trung tâm đã quyết định không bồ sung thêm năm lập ký hiệu đăng ký cá biệt kèm

theo. Đối với trường Chỉ sổ Cutter, do sử đụng phần mềm CDS/ĨSIS để nhập liệu và

sau đó chuyển dữ liệu sang phần mềm Libol nên xuất hiện một số lồi trong quá trình

chuyển đổi. Do vậy, Trung tâm cũng quyết định bỏ qua trường này khi xử lý tài liệu

hồi cố cho CSDL Sách.

Hay:

+ Những tài liệu có cùng một chủ đề lại được phân ioại khác nhau (như trường

hợp các tài liệu về lĩnh vực thống kê đang được xếp ở hai mục của Khung phân loại

BBK là ô 6 và Q 051). Hiện tượng này là do sự thiếu thống nhất về quan điểm

trong khâu phân loại giữa những người làm công tác xử lý. Trong trường hợp này,

càn sớm có sự thống nhất và hiệu đính lại để đảm bảo tính thống nhất trong toàn bộ

CSDL.

Hoặc:

+ Trường hợp thiếu thống nhất ưong mô tả trường Cơ quan chủ ừì đề tài và

trưòrng Tóm tắt cùa CSDL KQNC như đã nêu tại mục 2.2.3.

Thực tế hiện nay cho thấy, đội ngũ cán bộ xỏ lý dữ liệu thư mục của Trung

tâm đang được trẻ hoá vì vậy rất cần được đào tạo một cách hệ thống, toàn diện và

lâu dài. Hơn nữa công tác xử lý tài liệu liên quan đến nhiều kiến thức chuyên môn,

đặc biệt là kinh nghiệm nên những cán bộ trẻ thường gặp phải không ít khó khăn

khi bắt đầu tham gia công việc này. Nhằm đảm bảo cho những cán bộ mới có điều

kiện nâng cao kỹ năng nghiệp vụ, trước mắt cần tạo cơ hội cho họ vừa học vừa làm

trên cơ sờ áp dụng lý thuyết và thực tiễn. Vì vậy, trong một vài năm trở lại đây bộ

phận xử lý CSDL Sách đã phân công những cán bộ có chuyên môn giỏi và kinh

nghiệm chịu trách nhiệm hiệu đính biểu ghi và truyền đạt lại kiến thức chuyên môn

cũng như kinh nghiệm cho những cán bộ mới. Những lỗi xuất hiện trong quá trình

xử lý sẽ được những cán bộ mới tổng hợp và ghi chép lại để làm cơ sở cho những

86

lần xử lý tiếp íheo. Tuy nhiên, giải pháp này chỉ mang tính tạm thời vì trong thực tế,

những lỗi sảy ra ở từiig cán bộ xử lý khác nhau thường không giống nhau nên một

người không thể tìm hiểu hết những lỗi mà những người khác thường mắc phải.

Giải pháp cho vấn đề này là Trung tâm cần có một nhóm cán bộ chuyên môn có

nghiệp vụ và kinh nghiệm đảm nhiệm nhiệm vụ biên soạn tài liệu hướng dẫn. Tài

liệu này cần được xây dựng ngắn gọn, dễ hiểu và đặc biệt là phải dựa trên thực tế để

làm căn cứ chung cho những người tham gia xử lý có thể tham khảo và áp dụng.

Thử ba: Phái triển nhân lực cho công tác xử lỷ dữ liệu thư mục

Hiện nay, đội ngũ cán bộ làm công tác xử lý dữ ỉiệu thư mục của Trung tâm

ngày một giảm đi không chỉ về số lượng mà cả chất lượng.

Thi dụ:

Bộ phận xử lý sách tại Phòng Phát trển nguồn tin hiện nay được phân công

gồm 03 người, trong khi đó bộ phận đảm nhiệm khâu này trước đây ỉuôn được duy

trì từ 5 đến 7 người cũng với một khối lượng sách tương đương. Điều này cho thấy

sự phân phối nhân lực cho bộ phận này là chưa hợp lý.

Mặt khác, những cán bộ cỏ kinh nghiệm xử lý tài liệu lâu năm đang dần dần

giảm đi do đến tuổi nghi hưu trong khi đó, đa số đội ngũ cán bộ trẻ không được đào

tạo chính quy nên sẽ mất rất nhiều thời gian để làm quen với công việc. Do đặc

điểm của khâu xử ỉý là đòi hỏi rất cao về nghiệp vụ, có những cản bộ phụ trách

những chuyên ngành nhất định và khả năng ngoại ngữ tôt nên hầu như rất khó để

xây dựng được một đội ngũ cán bộ xử lý có khả năng đáp ứng tốt yêu cầu của khâu

này.

Để khắc phục hiện tượng ừên, Trung tâm cần có kế hoạch lâu dài cho việc

phát triển đội ngũ cán bộ tham gia xử lý đó là:

+ Tăng cường thêm nhân lực cho khâu xử lý dữ liệu thư mục (trước hết là

khâu xử lý sách, số lượng cán bộ xử lý cần ít nhất là 4 người mới có thể đảm bào

được tiến độ công việc)

-I- Sớm xây dựng tài liệu hướng dẫn cụ thể cho công tác xử lý (về quy tắc mô

tà, nhập liệu đối với tìrng dạng tài liệu cụ thể)

+ Sớm ừiển khai áp dụng các chuẩn cho một kế hoạch lâu dài

+ Thường xuyên mở các lớp tập huấn cho cản bộ xử lý (đặc biệt là các lớp tập

87

huấn về MARC21, sử dụng khung phân loại, định từ khoá,...)

+ Tạo điều kiện cho cán bộ xử lý nâng cao khả năng ngoại ngữ.

3.3.3. Tối ưu hoá quá trình trao đỗi và lun dữ liệu gỉữa các bộ phận

Công tác lưu giữ nguồn TNS có ý nghĩa quan trọng về nhiều mặt. về cơ bản, nó

tạo ra sự sắp xếp mang tính khoa học giúp cho việc truy cập đển nội dung thông tin

một cách nhanh chóng, thuận tiện đồng thời tạo ra sự an toàn cho toàn bộ dữ liệu.

Ngay từ khí ưiển khai xây đựng nguồn TNS, Trung tâm đã chú trọng đến công tác

lưu giữ, điều này được thể hiện ở chỗ:

+ Các CSDL đều có server lưu giữ riêng (Phụ lục 2)

+ Các máy chủ được ừang bị có tốc độ và dung lượng đáp ứng được nhu cầu

+ Dữ liệu trong các CSDL thường được sao từ 1 đến 2 bản liru trong ổ cứng

+ Hệ thống mạng LAN tốc độ cao (100 MB)

Tuy nhiên công tác luxi giữ của Trung tâm hiện nay vẫn còn một số vấn đề dẫn

đến tình trạng mất dữ liệu như đã trình bày tại mục 2.2.3 đối với CSDL STD hay

đối với bản tin Nông thôn đổi mới. Sau đây chúng ta sẽ tập trung giải quyết từng

ưường hợp cụ thể:

- Đổi với CSDL STD

Sau khi tìm hiểu cho thấy, nguyên nhân chính của hiện tượng mất tin là đo

phưomg pháp trao đổi dữ liệu gián tiếp bằng ổ lưu dữ liệu giữa hai bộ phận (Phòng

tin học và Phòng CSDL). Để khắc phục hiện tượng trên, cần có một mô hình chia sẻ

thông tin trong quá trình trao đổi và cập nhật dữ liệu giữa ba bộ phận (số hoá - xử lý

88

- lưu g iữ ) như sau:

Đường đi cùa ^ dừ liệu

H. 3.2: Mô hình chia sè dữ liệu trong ba bộ phận số hoả - xử ỉỷ - ỉưu giữ

Giải thích:

Với mô hình trên, bài toàn văn sẽ được gửi trực tiép đến server lưu giữ sau khi

được tách ra tìr fíle gốc. Cán bộ xử lý cũng có thể thực hiện việc tách, sửa file ngay

trên máy chủ hoặc tải về để chỉnh sửa rồi upload lên server phục vụ thông qua

acount được cấp.

Để thực hiện mô hình trên, yêu cầu cần có cơ chế phân quyền và bào mật tốt.

Mỗi cá nhân tham gia xử lý chỉ được phân quyền trong phạm vi lĩnh vực mình phụ

trách (quyền tách, sửa các file dữ liệu và gửi đến server phục vụ). Bên cạnh đó, Dữ

liệu được lưu giữ tại server sau khi số hoá cần được tổ chức khoa học, thuận tiện

cho người sử dụng.

Việc sắp xếp có thể tiến hành theo năm kết hợp với tên và số của tài liệu (đối

với tạp chí khoa học), theo năm kết hợp với ngành (đối với tài liệu thuộc dạng sách)

89

như sơ đồ dưới đây:

H. 3.3: Mô hình phân phổi dữ ỉiệu sau khi sổ hoá

Việc áp dụng mô hình ưên ưong quá trình trao đổi dữ liệu sẽ giảm thiểu được

đường đi của tài liệu số hoá và những thao tác tíiù công đồng thời tránh được những

nguy cơ lây nhiễm virút từ các máy trạm. Tuy nhiên, trong khi sử dụng mô hình

này, cần thực hiện cơ chế sao lưu tài liệu đầy đủ (những tài liệu lưu tại server sau

khi số hoá) cần được lưu giữ đến khi toàn bộ dữ liệu đã được chuyển đến đích để

90

phòng trừ trường hợp người sử dụng làm mất dữ liệu khi tíiao tác.

- Đối với Bản tin N ô m thôn đổi mới

Bản tỉn Nông thôn đổi mới là bản tin được phát hành từng tuần có nội dung về

nông nghiệp và phát triển nông thôn. Bản tin này được xây dựng từ năm 2004 trên

cơ sở phối hợp giữa Đoàn thanh niên Trung tâm với Phòng Thông tin nông thôn

miền núi. Công tác biên soạn bàn tin này được triển khai trên phần mềm ZOPE với

cơ chế phân quyền tới các cá nhân tham gia và upload trực tiếp biểu ghi lên server

từ máy trạm.

Theo định kỳ xuất bản, bản tin này phải đảm bảo từ 51 đến 52 số một năm, tuy

nhiên theo thống kê cho thấy, ừong nhiều năm liền, các sổ của bản tin này chỉ đạt

được khoảng honn 60% như đã nêu tại mục 2.2.4. Để khắc phục hiện tượng ữên, các

bộ phận tham gia xây dựng bản tin cần kiểm tra lại quy trinh xuất bàn một số của

bản tin và có sự phân công, giám sát chặt chẽ từng quy trình biên soạn cho bản tin

này. Bên cạnh đó cần đối chiếu lại toàn bộ những số đã được biên tập trên thực tế

và những số hiện có trên mạng để có kể hoạch bổ sung và sửa chữa kịp thời.

Bên cạnh những hiện tượng mất dữ liệu do ừao đổi, lưu dữ liệu trong quá ưình

xây dựng CSDL, trường hợp dữ liệu bị mất có liên quan đến việc nâng cấp, chuyển

đổi phần mềm, server....cũng rất phổ biến hiện nay. Đây là những vấn đề liên quan

nhiều đến kỹ thuật và nghiệp vụ tin học, do vậy cần dưực nghiên cứu, tính toán và

thử nghiệm kỹ lưỡng trước khi tiến hành để đảm bảo an toàn tuyệt đổi cho toàn bộ

3.4. TỔ chức lại các bố sưu tập số

dữ liệu.

vấn đề tổ chức các BSTS rất quan trọng trong việc phổ biến các nguồn TNS.

Các BSTS được tổ chức khoa học và có tính thẩm mỹ sẽ thuận lợi cho NDT khi

ưuy cập và nâng cao hiệu quả khai thác. Ngược lại, nếu các BSTS không được tổ

chức sắp xếp khoa học sẽ gây trở ngại cho NDT khi tiếp cận đến nguồn TNS, thậm

trí không thể truy cập được.

Trong mục 2.2.4 đã đề cập đến những điểm bất cập trong việc tổ chức các

BSTS và những khó khăn ỉchi khai thác các bộ siru tập này. Đẻ phát huy tối đa hiệu

quả khai thác nguồn TNSNS nói riêng và toàn bộ TNS tại Trung nói chung, Trung

91

tâm cần sắp xếp lại các CSDL trên ừang Vista.

Việc tổ chức các BSTS trên trang Vista cầB đảm bảo một số nguyên tẳc sau:

- Trang chủ chỉ bao quát các dịch vụ chủ yếu và không tạo nên sự băn khoăn

cho NDT khi truy cập.

- Tên các mục cần bao quát được toàn bộ sản phẩm và dịch vụ có trong nó

- Các mục và tiểu mục không được chồng chéo và nên đồng nhất về nội dung

- Các mục và tiểu mục cần được trình bày nổi bật về màu sắc và cỡ chữ

- Khi đã xuất hiện trên trang web, các mục và tiểu mục nhất thiết phải tạo được

kết nối đến địa chỉ của mục hay tiểu mục đó.

Việc tổ chức, sắp xếp ỉại các biểu tượng chính chứa các bộ sưu tập trên trang

Vista có thể tham khảo sơ đồ sau:

H. 3.4. Các biểu tượng chỉnh trong giao diện của mạng Vista

Trong sơ đồ trên, Biểu tượng NACESTI được đặt đầu tiên có thể bao gồm

những thông tin sau:

+ Giới thiệu về Trung tâm và Thư viện Khoa học Kỹ thuật Trung ưcmg

+ Giới thiệu các sản phẩm và dịch vụ hiện có

+ Kết nối tra cứu tới toàn bộ CSDL và nguồn tín hiện có thông qua liên kết với

biểu tượng TRA cứu CHUNG.

Biểu tượng TRA cứ u CHUNG sẽ bao gồm toàn bộ nguồn tin hiện có tại

92

Trung tâm và có thể thiết ké theo mô hình sau:

93

H. 3.5. Các mục và tiểu mục trong biểu tượng Tra cứu chung

Trong sơ đồ trên, biểu tượng Tra cứu chung có thể bao quát được toàn bộ

nguồn tin hiện có tại Trung tâm. Tuy nhiên, trong mục chính chỉ nên đưa vào những

thông tin giới thiệu về những bộ sưu tập có trong mục chính bởi vì chức năng chủ

yếu của các mục chính này là tra cứu tới các bộ sưu tập thuộc lĩnh vực nó bao quát.

Cơ sở để phân chia và sắp xếp các mục và tiểu mục cần dựa trên loại hình, cấu

trúc và phưoTìg pháp tra cứu đối với tìmg nguồn tin hay CSDL.

Thỉ dụ:

Các bản tin điện tử và CSDL STD đều cung cấp các bài toàn văn, tuy nhiên

giao diện tìm kiếm và cách thức tìm kiếm khác nhau nên cần được xếp khác chỗ.

Đối với các biểu tượng còn lại sẽ bao gồm những thông tin liên quan đến lĩnh

vực đỏ và kèm theo giao diện tra cứu riêng đồng thời có liên kết đến biểu tượng tra

cứu chung.

Trong quá trình tạo các liên kết, cần đảm bảo được tính khoa học, tính hệ

thống và nhất quán giữa các biểu tượng, các mục chính và các tiểu mục. không nên

đưa vào quá nhiều liên kết không cần thiết.

3.5. Hoàn thỉện hệ thống phần mềm

Như chứng ta đã biết, sẽ không cổ một phần mềm nào ỉà hoàn hảo ngay từ khi

được triển khai áp dụng mà đa số các phần mềm đều được nâng cấp và phát triển

sau một thời gian sử dụng nhất địnli. Cũng giống như các thế hệ điện thoại di động,

máy tính hay các thiết bị điện tử khác thời gian lỗi thời của các phần mềm ngày

càng được rút ngắn. Do vậy các nhà cung cấp phần mềm thường xuyên nghiên cứu

nâng cấp phiên bản mới cho phù hợp với thực tế. (phần mềm Zope đã phát triển đến

phiên bản 3.9, Libol đã cho ra phần mềm 6.0, Win ISIS đã có phiên bản 1.5,...)-

Hiện tại Trung tâm đang sử đụng một phần mềm thương mại (Libol 5.5) và

một số phần mềm miễn phí và mã nguồn mở như Zope, ISIS và Greenstone để xây

đựng và quản lý các CSDL.

Vẩn đề triển khai nâng cấp phần mềm cũng được coi là rất quan trọng bởi vì

sau một thời gian áp dụng vào thực tế, các nhà cung cẩp phần mềm thường tổng hợp

lại những hạn chế của phần mềm để ữên cơ sở đó đưa ra phiên bản mới hoàn thiện

94

hơn. Thực tế trong suốt thời gian xây dựng và phát triển, Trung tâm đã nhiều lần

thực hiện việc chuyển đổi và nâng cấp phần mềm. Những công việc này được thực

hiện bởi các chuyên gia tin học và chuyên gia trong lĩnh vực thông tin - thư viện.

Tuy nhiên, một thực tế hiện nay cho thấy Trung tâm đang ngày một thiếu các

chuyên gia ờ cả hai lĩnh vực trên, điều này sẽ tạo nên nhiều khỏ khăn và thách thức

trong quá trình nghiên cứu, ứng dụng và nâng cấp các phần mềm quản lý thư viện

cũng như các phần mềm quản lý dữ liệu.

Dựa trên những khảo sát các phần mềm đang được sử dụng tại Trung tâm cho

thấy, các phần mềm này đều có khả năng nâng cấp và hoàn thiện một số tính năng.

Bên cạnh đó, có thể nghiên cứu và ữiển khai thêm một số phần mềm khác để hoàn

thiện dần toàn bộ hệ thống.

a. Từng bước hoàn thiện những phần mềm đang sử dụng

- Đối với phần mềm Libol

Đây là phần mềm thương mại có chức năng quản trị thư viện và đang là một

trong những phần mềm quan trọng nhất dùng để xây dựng và quản lý nguồn

TNSNS tại Trung tâm.

Mặc dù hiện nay, công ty Tinh Vân đã cho ra mắt phiên bản Libol 6.0 với

điểm nối bật so với những phiên bản trước đó là Phân hệ Quản lý tư liệu điện tử,

cho phép thư viện có thể quản lý các dạng TLS phổ biến (âm thanh, hình ảnh,

video, text), cung cấp TLS tới mọi đối tượng người dùng....Tuy nhiên, theo quan

điểm của các nhà quản lý CSDL tại Trung tâm thì trong thời gian tới, Trung tâm

chưa có hướng chuyển sang sử dụng phiên bản mới này.

Bên cạnh những hạn ché trong quá teình xử lý dữ liệu thư mục trong hai phân

hệ Bổ sung và Biên mục như đã trình bày ở phần ữên, trong phân hệ OPAC cũng

tồn tại một số hạn chế nhất định như chưa hỗ trợ chức năng lưu biểu thức tìm kiếm

trước đó hay không hỗ trợ lựa chọn thuật ngữ tại mục từ điển để tìm tin ,...

Thí dụ:

Khi muốn tìm một tác giả mà NDT không nhớ chính xác, cách nhanh nhất là

lựa chọn từ điển tác giả. Tuy nhiên, rất nhiều tác giả cỏ trong từ điển không tồn tại

trong CSDL ợ^guyễn Thanh Quế, Phạm Thái Hùng, Nguyễn Ngọc Đích,..,) Trong

95

khi đó việc tạo lập từ điển lại thường xuất hiện lỗ i...

Giải pháp chung cho những tồn tại của phần mềm này ở các phân hệ là tổng

hợp tất cả những mục chưa chưa đáp ứng được thành văn bản và hợp tác trực tiếp

với nhà cung cấp để tìm ra giải pháp khắc phục. Bên cạnh đó, nhừng cán bộ thực

hiện các nhiệm vụ có liên quan đến phần mềm có thể tìm hiểu các biện pháp khắc

phục tạm thời để giảm thiểu những lỗi có thể sảy ra (dữ liệu bị trùng hoặc sai đo

phần mềm).

- Đắỉ với các phần mềm Zope, Greemíone, CDS/ỈSĨS

Nếu như Libol là phần mềm chính trong xây dựng các CSDL thư mục thì Zope

đang là phần mềm chủ đạo trong việc xây dựng và quản lý các CSDL toàn văn.

Trong đó đáng kể nhất là CSDL STD và các bản tin điện tử. Zope có nhiều tính

năng iru việt như đã nêu ở phần trên, bên cạnh đó cũng có những điểm hạn chế nhất

định trong khi sử dụng. Một trong những điểm hạn chế lớn nhất hiện nay khi sử

dụng phần mềm này là những tiện ích về ngôn ngữ. Thí dụ được nêu tại mục 2.2.4

cho thấy trong quá trình tim kiếm xuất hiện những kết quả không chính xác đối với

một số từ có chứa các chữ cái như ô, ơ, ư,....Để khắc phục hiện tượng này, Trung

tâm (cụ thể là bộ phận tin học ) cần tiếp tục nghiên cứu và thử nghiệm các giải pháp

(nâng cấp, hoàn thiện hay mở rộng các tính nàng) để tiến tới loại bỏ hoàn toàn

những hạn chế nêu trên.

Greenstone được áp dụng vào xây dựng và quản lý CSDL tại Trung tâm từ

năm 2004 với CSDL Tài liệu kỹ thuật nông nghiệp. Phần mềm này tỏ ra rất ưu việt

đặc biệt là trong việc tổ chức và khai thác tài liệu toàn văn. Một trong những tính

năng nổi trội của phần mềm này là khả năng tìm kiếm linh hoạt trong toàn bộ văn

bản. Đến nay, phần mềm này vẫn được sử đụng để quản ỉý và khai thác CSDL Tài

liệu kỹ thuật nông nghiệp với hơn 1000 biểu ghi toàn văn.

Mặc dù hiện nay CSDL Tài liệu kỹ thuật nông nghiệp không được tiếp tục xây

dựng, tuy nhiên dựa trên cơ sở tìm hiểu các tính năng của phần mềm Greenstone và

tham khảo các đơn vỊ đang sử đụng phần mềm này, tác giả cho rằng Trung tâm nên

tiếp tục sử dụng phần mềm Greenstone trong công tác xây dựng và quản lý nguồn

TNSNS.

Đối với phần mềm CDS/ISIS, mặc dù không còn phù hợp với điều kiện hiện

96

tại nhưng phần mềm này vẫn rất cần thiết trong việc hỗ trợ nhập tin cho các biểu ghi

hồi cố CSDL Sách bời những tính năng ưu việt trong quá trình nhập liệu và kiểm

duyệt. Bên cạnh đó, CSDL KQNC cũng được xây dựng trên phần mềm này từ khá

sớm, cho đến nay vẫn chưa được chuyển đổi sang phần mềm khác nên cần được

tiếp tục duy trì. Việc nâng cấp phiên bản mới cho phần mềm này sẽ tuỳ theo nhu

cầu xây dựng các CSDL mà có thể giữ nguyên phiên bản đang sử dụng hoặc sử

dụng phiên bản mới khi cần đến các tính năng mà phiên bản đang được sử dụng

chưa có.

b. Nghiên cứu ứng dụng một số phần mềm thư viện số

Như đã trình bày tại mục 2.2.3 và mục 2.2.4, đa số các phần mềm đang sử

dụng tại Trung tâm hiện nay chưa đáp ứng được yêu cầu quản lý và phát triển

nguồn TNSNS thể hiện ở chỗ:

+ Các phần mềm chưa đáp ứng được yêu cầu xây dựng bộ sưu tập về tính

năng cũng như khả năng hỗ frợ các chuẩn cho đữ liệu số.

+ Chưa có công cụ két nối các bộ sưu tập để tạo ra một điểm ừuy cập ứiống

nhất.

Hiện tại, ữên thị trưòng đã xuất hiện một số phần mềm chuyên dùng cho việc

quản lý các nguồn TNS như Metalib, SFX, Digitool, Aleph, Verde, Primo...của tập

đoàn Ex Libris (tập đoàn cung cấp các giải pháp tự động hoá thư viện). Dưới đây,

tác giả xin giới thiệu sơ lược một sổ phần có thể ứng dụng vào công tác xây dựng và

quản lý nguồn TNSNS tại Trung tâm.

- Metaỉib

Metalib là công cụ tìm kiểm tài liệu nghiên cứu rất phổ biển hiện nay. Công cụ

này cho phép thực hiện tìm kiểm song song và trả về kết quả trên một giao diện duy

nhất thông qua việc kết nối tới một số lượng không hạti chế các CSDL bên ngoài

cũng như nguồn tài nguyên nội sinh cùa đơn vị.

Metalib được xây dựng dựa trên một kiến trúc mở với các tính năng nổi trội

như:

+ Tạo ra một hệ thống với một điểm truy cập duy nhất

+ Cho phép NDT truy cập đến các nguồn tin khác

97

+ Xác nhận quyền của NDT cho các nguồn và địch vụ đặc biệt

+ Cung cấp siêu tìm kiếm giúp người dùng có thể tìm kiếm tổng hợp các

nguồn tài liệu một cách song song

+ Cung cấp đường link giữa các CSDL

+ Hỗ trợ cán bộ thư viện phân loại nguồn tin và tìm ra những nguồn tin và

dịch vụ phù hợp

+ Tích hợp các nguồn tài nguyên nội sinh với các nguồn tin bên ngoài

+ Quản lý người dùng với môi trường cá nhân

+ Hỗ trợ liên kết toàn diện với phạm vi rộng

+ Tương thích với các ứng dụng và có thể tích hợp ữong môi trường thư viện.

Hỗ trợ các chuẩn (Marc, Unicode, OpenưRL, XML, OAI, Z3950)

Metalib có khả năng kết nối mạnh mẽ các nguồn tin dưới nhiều dạng kliác

nhau giúp NDT có thể truy cập đến toàn bộ nguồn tài nguyên hiện có như hình

minh hoạ đưới đây:

MetaLib a s a source fpr linkìrtg

, i'"í:!

Tồilucthin to MrtiLlb U b ris

H. 3.6: Sơ đồ liên kết tài nguyên thông tin trong Metalib

Thdng qua phượng thức tìm tin Metasearching, NDT có thể tiếp cận đến nhiều

nguồn thông tin chỉ với một điểm truy cập đuy nhất. Phương thức này được mô tả

98

thông qua mô hình dưới đây:

What is MetaSearch?

Query

Diverse inlbnnalĩon resourc«s

m etasea'ching = íederated searcHng = crcỉss ddtabase searching = paralld searching = consolỉdábed searching = irteg'ated searching

H. 3.7: Mô hình thể siêu tìm kiếm trong Metalib

- S F X - Côns cu kết nối hiêu auả

SFX là phần mềm độc lập có khả năng tích hợp dễ đàng với phần lớn các hệ

thống tự động hóa thư viện lởn, hệ thống quản lý học tập, cổng điện từ của đơn vị,

cũng như với toàn bộ các giải pháp ứiư viện khác của Ex Libris.

Sau khi một danh sách tài liệu được hiển thị qua việc tìm kiếm, dịch vụ SFX

cho phép liên kết tới tài liệu toàn văn nếu sẵn cỏ hoặc đưa ra những tuỳ chọn khác

khi tài liệu toàn vãn không tồn tại như cho phép đăng ký mượn tài liệu in liên thư

viện hay kết nối tới mục lục trong thư viện hoặc bản tóm tắt,...

Những tính năng nổi bật của SFX:

+ SFX dựa trên tiêu chuẩn OpenURL phát triển đầu tiên bởi Oren Beit-Arie

của Ex Libris và Herbert Van de Sompel.

+ SFX cung cấp một khả năng kích hoạt theo khối dừ liệu (batch activation)

đối với vốn tư liệu của thư viện nhận được từ các nhà cung cấp dịch vụ quản lý truy

cập công cộng sẵn có (PAMS - Public Access Managment Services).

+ Máy chủ SFX có thể cài đặt tại thư viện hoặc lưu trữ và quản lý bởi Ex

Libris thông qua dịch vụ đăng ký thuê bao truy cập SFX sẵn có. Thư viện có thể lựa

chọn một trong hai giải pháp, hoặc cài đặt SFX ngay tại thư viện hoặc đãng ký thuê

99

bao với dịch vụ quản lý SFX của Ex Libris.

+ Sử dụng phân hệ quản trị SFX trên vveb giúp các thư viện có thể kiểm soát

máy chủ SFX của họ và tự cấu hinh các cơ sở dữ liệu mục tiêu phù hợp với nhu cầu

cụ thể của đơn vị mình.

+ SFX cũng cho phép thư viện cấu hình các dịch vụ phù hợp trên toàn bộ hệ

thống của tổ chức hoặc tùy biến phù họp đối với từng nhóm và người dùng riêng.

Ví dụ như dịch vụ “xin cấp bản quyền” có thể chỉ phục vụ cho đối tượng là nhân

viên ở bộ phận dịch vụ kỹ thuật của thư viện, và các dịch vụ chuyển giao tài liệu

trực tiếp chi sẵn có đối với từng loại đối tượng.

+ Công cụ quản trị trên nền tảng Web của SFX tạo điều kiện thuận lợi cho các

ứiư viện sử dụng các quy tắc lưu trữ cơ sở kiến thức toàn diện của SFX nhẳm thiết

íập và duy ữì các dịch vụ nối kết phù hợp. Một khi đã được cấu hình phù hợp với

nhu cầu nối kết của thư viện, SFX có thể phục vụ như kho dữ liệu trung tâm thông

tin tạp chí điện tử của thư viện.

+ SFX cung cấp công cụ nối kết ưích dần (Citation Linker), một khổ mẫu

Web có khả năng dễ dàng nhúng vào các trang web của thư viện và phục vụ như

một giao diện xác định thông tin tạp chí điện tử.

+ SFX có khả năng tạo ra một danh mục nhan đề tạp chí điện tử theo ừật tự

xắp xếp bảng chữ có thể tùy biến đối với Nvebsite của thư viện.

Kết hợp với dịch vụ MARCit! của Ex Libris, SFX cung cấp các biểu ghi thư mục

MARC tùy chọn để có thể tải vào mục lục thư viện hoặc Metalib, cổng thư viện Ex

Libris.

+ SFX có thể kiểm tra trực tiếp các yêu cầu chuyển giao tài liệu so với vốn tư

liệu trước ỉchi bạn đọc gửi đi nhừng yêu cầu về tài liệu đó.

+ Thông qua SFX, cán bộ thư viện có thể có được thước đo thống nhất về mức

độ sử dụng - ứiông tin quan ừọng để quản lý hiệu quả tài nguyên thông tin trên web

của mỗi nhà cung cấp.

Để thấy được tính năng nổi bật của SFX, chúng ta hãy so sánh bai phưcmg

100

pháp liên kểt được thể hiện ừong các sơ đồ sau:

How d o e s It w o rk ? — Línking th e old w ay

...

-

r------- --------

-

! ị

:: r - F«HT«xt

OPAC

^

A&I Service

■ 'Mm’ ILLyOoc Del

Digital c o lle c tìo n

..)

Learnìng Mgiinl System

I C ltãĩion M anag«r

H. 3.8; Sơ đồ liên kết theo phương pháp truyền thống

How đoes It work? - Linking the NEW OpenURL way]

Í-Ễ,

OPAC

Google

Portal

Fun T«xt _j Ĩ L

Aggregator Datatos«

A&I Servlcâ

SFX glves users easy access to ali avaỉlable resources and s e rv ic e s

ILL/Doc Del

■ « í -

H ■ ■ —

c s : sB " " _Ố *■ Digital conẽctlon

Citatìan Manaạer

Leamĩns Mgĩtít System

101

H. 3.9: Liên kết theo phương pháp mới OpenưRL

How d o e s it w o rk ? - U nk in g t h e olđ w ay

Lihu.i ự

5_„

t

__ ______

OPAC

^ g p ^ a to r Database

Google

Portal

http://publish.aps.0t9/afc$tract/P>ỈA/v63 /p062103

RiHText

A&I Service

ILL/DOC D«l

0

EPpL:

ĩ ị ầ ỉ ỉ ... !J..l i. Oi^itại collection

! ■ ........ .......

s Citatĩon Manager

I taarnlng Mgmt System

H. 3. Ị 0: Sơ đồ thể hiện quả trình thực hiện ỉỉên kểt truyền thống

How does It work? - Linking the NEW OpenURL way!

Citatlon Mana^er

System

102

H. 3.ỈỈ: Sơ đồ thể hiện quá trình thực hiện phương pháp liên kết mở URL

The SFX Flow

_______ • — *

SFX Sourcô«Pi4 ^SFX M enuiiii^ SFX Target

In%roductk>n to SFX

EyLibris

^

H. 3.12: Sơ đồ thể hiện dòng liên kết SFX

Hiện nay, Metalib-SFX được coi là giải pháp hiệu quả cho các trung tâm

thông tin - thư viện thuộc các viện nghiên cứu, trường đại học trên toàn thế giới với

gần 2000 khách hàng lớn. Nhiều cơ quan nghiên cứu, trường đại học hàng đầu thé

giới đã chọn Metalib-SFX làm giải pháp thư viện - thông tin như Trung tâm Vũ trụ

lohnson (lohnson Space Center) thuộc Cơ quan Hàng không và Vũ trụ Quốc gia

(NASA), Đại học New York, Đại học Califomia,...

ở Việt Nam, Trung tâm thông tin tư liệu thuộc Viện Khoa học Công nghệ Việt

nam là đơn vị đầu tiên ứng dụng phần mềm Metalib-SFX vào hoạt động,

- Disitooỉ - Giải pháv cho n2uền TNS

DigiTool là một giải pháp ừên toàn hệ thống cho việc quản iý tài sản số trong

môi trường thư viện, ừung tâm tìiông tin và trường học. DigiTool tạo điều kiện cho

các thư viện và trung tâm thông tin có tíiể tạo ra, quản lý, bảo quản và chia sẻ các

BSTS nội sinh của mình. Bằng cách cải tiến tích hợp các BSTS với những cổng truy

cập của thư viện và hệ thống học tập trực tuyến, Với DigiTool, các tìiư viện sẽ cung

103

cấp cho người dùng một môi trường làm việc thông suốt.

Digitool cho phép xây đựng, quản lý và khai thác các BSTS với mọi dạng tài

liệu gồm;

Dạng text (.doc, .pđf, .rtf, .exl, .ppt)

Dạng ảnh (.gif, jpeg jp2)

Dạng âm thanh (.ram, .wav)

Dạng đa phương tiện (.mpeg, .mpg, .avi)

Dựa trên sự hợp nhất của những phân hệ quản trị (Modules) để cung cấp một

giải pháp toàn diện, các phân hệ quản trị của Digitool làm việc linh hoạt và cấu trúc

mở của nó được thiết kế để giải quyết mọi đòi hỏi hiện tại và tương lại đổi với nhiều

dạng BSTS gồm:

+ Kho Dữ liệu Thư viện (InstiíuỊỉonal Reposìtories): Kho này quản lý và phổ

biến các TLS nội sinh do chính thư viện tạo ra như luận án, luận văn, tài liệu trước

khi xuất bản, tài liệu nghiên cứu, báo cáo,..

+ Bộ Sưu tập Tài liệu Đào tạo (Coỉlections o f Educatìonaỉ Materials): Gồm các

đối tượng học tập, tài liệu đào tạo dưới dạng điện tử (e-reserves), và các bộ sưu tập

được cấp phép truy cập, mà mục đích của các tài liệu này là nhằm nâng cao kinh

nghiệm học tập và trợ giúp nghiên cứu khoa học được tìiuận tiện hem.

+ Bộ Sưu tập Đặc biệt (Special Collections)'. Thư viện lưu trữ và bảo quản vì lợi

ích của xã hội, bao gồm các bộ sưu tập di sản văn hóa được số hóa.

Digitool bao gồm nhiều phần hệ quản trị, mỗi phân hệ lại được thiết kế nhằm

giải quyết nhiều nhu cầu, chức năng và quy trình công việc khác nhau gắn iiền với

vòng đời của một đối tượng số theo quy trình sau:

Trước tiên, các đối tượng sổ với siêu dữ liệu gắn kết được nhập vào kho lưu

trữ dữ liệu Digiíool Repository

Tiép theo, thư viện sẽ tiến hành quản lý một quy trình thao tác nhất định, bao

gồm việc biên tập siêu dữ liệu và quản lý bộ sưu tập.

Cuổi cùng, người đùng sẽ tìm kiếm trên kho dữ liệu đó và yêu cầu chuyển giao

các đối tượng sổ. Các phân hệ được kết hợp với nhau, cung cấp một giải pháp tổng

thể cho mọi nhu cầu và đòi hỏi trong việc quản lý tài sản số.

104

Các phân hệ của Digừooỉ gồm:

+ Phán hệ quản trị kho dữ Liệu số mạnh (The robust Dỉgitool reposiíory

moduỉe), một phân hệ năm chính giữa ừái tim của hệ thống này, nó có trách nhiệm

lưu trữ và quản lý các đổi tượng số - như hình ảnh hoặc các tệp tin văn bản và siêu

dữ liệu gắn kết. Trong khi siêu dữ liệu được lưu trữ trong CSDL dựa trên hệ quản

trị CSDL Oracle của Digitool repository, thì các đối tượng đa nhập vào hệ thống sẽ

được lưu trữ trong một hệ thống tập tin mạng bảo mật (NFS - Network File

System) hoặc trên hệ thống từ xa được truy cập thông qua đường dẫn URLs. Một

lớp dịch vụ Web tiêu chuẩn SOAP (Simple Object Access Protocol) cho phép kho

dữ liệu tương tác với những phân hệ Digitool khác cũng như với những hệ thống

nội bộ của thư viện hay của bên thứ ba.

+ Một bộ phân hệ quản trị mạnh (A set o f powerful administrative modules)

được thiết kế cho nhân viên và người quản trị hệ thống sè hỗ trợ cho bốn hoạt động

chính - tiếp nhận đữ liệu, biên tập siêu dữ liệu, quản lý bộ sưu tập, và quản trị hệ

thống. Phân hệ Ingest (Ingest Module) xử lý việc nhập những đối tượng vào kho dữ

liệu. Biên tập siêu dữ liệu mô tả hoặc siêu dữ liệu đối tượng khác (chẳng hạn như

siêu dữ liệu bảo quản hoặc kỹ thuật) được hoàn thành thông qua trình biên tập siêu

dữ liệu Meditor. Khi sử dụng phân hệ Quản Lý Bộ Sưu Tập, nhân viên thư viện có

thể tổ chức các đối tượng vào trong những bộ sưu tập được cấu trúc nhằm giúp

người dùng di chuyển qua lại ứiuận tiện.

+ Phân hệ Phát hiện tài nguyên thông tin (The sophisticated resource

dỉscovery module) ừao quyền cho người dùng bằng việc tạo điều kiện cho họ tìm

kiém siêu dữ liệu đối tượng hoặc phàn toàn văn của tài liệu; di chuyển qua những

bộ sưu tập được tích hợp trong thư viện; mở xem các đối tượng số và tận dụng được

những dịch vụ cá nhân như là các công cụ quản lý bộ sưu tập. Digitool đảm bảo tính

bảo mật của tài sản số và gắn với quyền ữuy xuất dữ liệu bẳng việc cho phép thư

viện xác lập và kiểm soát việc truy cập đến những đối tượng số. Tính năng kiểm

soát cho phép điều chỉnh quyền truy xuất dữ liệu của người dùng phù hợp với

những tham số nhu tình trạng người dùng, số lượng sinh viên tham dự khóa học, và

địa chì IP. Giao diện người dùng trên phân hệ phát hiện tìm kiếm và phát hiện

nguồn tài nguyên The Resouìxe discovery có thể dễ dàng tùy biến để phù hợp mong

105

muốn của thư viện.

+ Phân hệ nhập dữ liệu (The Deposỉte moduỉe) giúp nhân viên chưa được đào

tạo về thư viện cũng có thể dễ dàng tải các đối tượng số sử dụng công cụ Web lên

trên mạng như luận án, luận văn, và những đối tượng học tập. Phân hệ này cũng xứ

lý quy trình công việc nhập dữ liệu theo hình thức kiểm soát tình trạng dữ liệu,

nghĩa là nó cho phép những nhân viên được ủy quyền xét duyệt và chấp nhận dữ

liệu được nhập vào hệ thống.

Được trang bị với các khả năng quản lý người dùng, Digitool xác thực quyền

truy cập của người dùng hay bạn đọc của thư viện bằng việc tham vấn một CSDL

bạn đọc bên trong hoặc một máy chủ xác thực bên ngoài như máy chủ cung cấp truy

cập dịch vụ thư mục - LDAP (Lightweight Directory Access Protocoỉ). Digitool hỗ

trợ việc đăng nhập đơn (SSO - Single Sign-on), cho phép người dùng đăng nhập vào

hệ thống khác của Ex Libris có thể truy cập vào Digitool mà không cần phải lặp lại

quá ưình xác tíiực quyền truy cập.

Cấu trúc của Digitool dựa trên các công nghệ tiên tiến nhất như địch vụ Web

SOAP, XML (Extensible Markup Language), XSD (XML Schema Deíinition),

XSL (Xtensib)e Stylesheet Language), ODBC (Open Database Connectivity),

Unicode, và JPEG 2000.

Digitool hỗ ừợ đầy đủ các tiêu chuẩn ngành như MARC21, Qualified Dublin

Core, METS (Metadata Encoding and Transmission Standard), Z39.87-2002 - Siêu

dữ liệu kỹ thuật cho hình ảnh tĩnh, OpenưRL, Z39.50, và OAI-PMH (Open

Archives Initiative Protocol for Metadata Harvesting). Kiến trúc mở và các tiêu

106

chuẩn được hồ trợ cho phần mềm này được minh hoạ bởi hình sau:

W hy D igiTool ? - Supports interoperabỉlity through open architecture » Based on industry standards

Dfflơool Oveivlevv - ConíM enttal

ĐÌSỈTOỠỈ

10

ĩ y Lỉbria

H. 3. ỉ 3: Kiến trúc mở với các tiêu chuẩn được hỗ trợ cùa Digitool

Hoạt động trong nhiều môi trường khác nhau, Digitool là một công cụ hỗ ữợ

các đơn vị với nhiều phân hệ quản trị - cung cấp kho dữ liệu duy nhất để mọi bộ

phận hoặc đơn vị của một tổ chức đều có thể truy xuất và sử đụng. Mỗi đơn vị có

thể quản lý và kiểm soát các bộ sưu tập riêng của minh trong chỉ một kho dữ liệu

với phân hệ quản trị duy nhất này - Digitool Repository. NDT có ứiể tìm kiếm trên

tất cả các bộ sưu tập thông qua một giao diện phát hiện tài nguyên thông tin duy

nhất với khả năng tùy biến để phản ánh được tính riêng biệt trong các bộ sưu tập

của từng đơn vị thành viên.

Những tính năng nổi bật của ữên cho thấy, Digitool là một công cụ hữu ích

cho việc quản lý nguồn TNS. Hiện nay trên thế giới đa có hàng trăm khách hàng từ

nhiều quốc gia sử dụng công cụ này, tiêu biểu như Thư viện Quốc gia Luxembourg,

Đại học Quốc tế London, Thư viện British,...

3.6. Một số giải phảp khác

107

3.6.Í. Tâng cường chia sẻ nguồn tàỉ Dguyên sổ nội sinh

Chia sè tài nguyên là một trong những hoạt động rất quan trong giúp thư viện:

+ Tăng cưÒTig khả năng phát hiện và thu thập các nguồn tài nguyên bên ngoài

+ Phổ biến rộng rãi nguồn tài nguyên đang lưu giữ

+ Trao đổi tài nguyên và thúc đẩy hợp tác nhiều mặt với các đơn vị khác

Thông qua tìm hiểu công tác xây dựng và phát triển nguồn TNSNS tại Trung

tâm cho thấy hoạt động chia sẻ nguồn TNSNS của Trưng tâm hiện nay mới chỉ

dừng lại ở một mức độ nhất định, chưa phát huy hết khả năng hiện có. Các hoạt

động chia sẻ nguồn lực thông tin số mới chỉ diễn ra dưới dạng cung cấp thông tin

phục vụ nhu cầu sử dụng cá nhân và một số hoạt động hỗ ữợ các gói CSDL. Trong

phần này, chúng ta sẽ xem xét một số khả năng có thể tihúc đẩy hoạt động chia sẻ

nguồn lực thông tin với các đơn vị trong và ngoài nước.

- Khả năng tạo lập TNS dựa trên những tài nguyên có sẵn:

Nguồn TNSNS của Taing tâm dù được tạo lập ở hình thức nào thì chúng ta

cũng có thể tìm kiếm những nguồn tài nguyên sẵn có (kể cả nguồn tin số hoá). Hiện

nay, với sự phát ừiển mạnh mẽ của TNS, NDT có thể tìm kiếm một bài trích, thậm

trí một quyển sách toàn văn trên mạng một cách dễ dàng trên các trang cung cấp

Ebook miễn phí như Thuvien-eBook.com, Ebook.edu.vn, Ebooks.vdcmedia.com

hay Sachứiamkhao.edu.net.vn,....Trong điều kiện hiện tại, khi dạng TLS hoá cùa

Trung tâm chưa được mở rộng ứiì việc tận dụng các nguồn TNS sẵn có vẫn có thể

áp đụng đối với một số dạng tài liệu. Việc tận dụng nguồn tài nguyên có sẵn để bổ

sung cho bộ sưu tập của mình là một hoạt động, đồng thời cũng là giải pháp giảm

bớt công sức và chi phí.

Đối với các CSDL toàn văn, đặc biệt là các bản tin điện tử thì việc tận dụng

nguồn TNS có sẵn đang ngày một dễ dàng hcm bởi hiện nay số lượng bài viết trên

mạng đang ngày một gia tăng, v ấn đề ở đây là lựa chọn những nguồn thông tin cập

nhật và chính xác đồng thời có tính khoa học để đảm bảo các yểu tố cùa thông tin

đó là nhanh chỏng, kịp thời, chỉnh xác và phù hợp.

Đối với các CSDL thư mục, trong đó chù yếu là CSDL Sách thì việc tận dụng

các nguồn TNS sẵn có ở txong nước cùng như ở nước ngoài là hoàn toàn khả thi bởi

108

các lý do sau:

Thứ nhất: Trung tâm đang sử dụng phần mềm Libol 5.5, đây là phần mềm tích hợp

cho phép trao đổi dữ liệu qua cổng Z3950 với tiêu chuẩn trao đổi dữ liệu thư mục

quốc tế ISO 2709 nên việc tận dụng những biểu ghi thư mục sẵn có tại các thư viện

trong và ngoài nước rất thuận tiện,

Thứ hai: Trung tâm đang sử đụng khổ mẫu Marc21 nên việc trao đổi dữ liệu gặp

nhiều thuận lợi, đặc biệt là trong quá trình sử dụng các biểu ghi sẵn có từ các

website nước ngoài.

Thứ ba: Một số website, đặc biệt là các \vebsite nước ngoài cho phép download

miễn phí các biểu ghi thư mục như website của Thư viện Quốc hội Mỹ, Thư viện

Đại học Boston, Thư viện Đại học tổng hợp quốc gia ú c ,...là điều kiện thuận lợi

cho công tác biên mục tài liệu ngoại văn tại Trung tâm.

Thứ tư: Hiện tại đa phần các sách ngoại văn được Trung tâm mua về hàng năm đều

được biên mục tại các thư viện nước ngoài, đặc biệt !à Thư viện Quốc hội Mỹ.

Mặc dù có đầy đủ điều kiện cho việc tận dụng nguồn tài nguyên ứiư mục sẵn

có trong và ngoài nước, tuy nhiên cho đến nay Trung tâm vẫn chưa tận dụng được

khả năng này. Nguyên nhân chủ yếu được xác định là do phần mềm không hỗ trợ

phát hiện nguồn của biểu ghi đồng thời (trong nhiều CSDL khác nhau) và không kết

nối được với server lưu giữ các biểu ghi cần download. Do vậy, để tận đụng chức

năng này, Trung tâm cần phối hợp chặt chẽ với đối tác cung cấp phần mềm đế ứiực

hiện các kết nối lới những server có thể download dữ liệu nhàm giảm thiểu thời gian

và công sức không cần thiết cho việc biên mục tài liệu đã có sẵn.

- Khả năng chia sẻ nguồn tin hiện cỏ với các đơn vị khác

Trung tâm TTKH&CNQG là một trong những đơn vị có khối lượng biểu ghi

thư mực lớn nhất cả nước. Việc tận dụng những biểu ghi có sẵn tại Trung tâm sẽ

góp phần làm giảm ứiiểu thời gian và công sức cho các đơn vị trong hệ thống thư

viện. Tuy nhiên, cho đến nay, vẫn chưa có đơn vỊ nào tận dụng được nguồn tài

nguyên quý giá này cho công tác biên mục của mình. Nguyên nhân cũng có tiiể xuất

phát từ phía các đon vị trong hệ thống (do phần mềm, cơ chế tạo lập dữ liệu thư

mục,...) nhưng nguyên nhân chủ yếu là do cơ chế chia sẻ nguồn tin của Trung tâm

109

chưa được chú trọng.

Đe tăng cường khả năng chia sẻ nguồn dữ liệu thư mục giữa Trung tâm và các

đơn vị khác ữong hệ thống, có hai giải pháp có thể thực hiện trong thời gian tới là

xây dựng mục lục liên hợp trực tuyến và cài đặt dịch vụ truy cập dữ liệu thư mục

thông qua cổng Z3950 đối với các CSDL được xây dựng trên phần mềm Libol.

Trong khi chưa xây dựng được mục lục liên hợp trực tuyến thi giải pháp trước mắt

đổi với Trung íâm trong vấn đề này là sớm triển khai cơ chế cung cấp dữ liệu thư

mục thông qua việc cài đặt phần mềm hồ trợ dovvnload biểu ghi qua cổng Z3950 để

các đơn vị ừong hệ thống cỏ thể tận đụng nguồn tài nguyên này.

Tuy nhiên, trong quá trình chia sẻ nguồn lực thông tin với các đơn vị trong hệ

thống, công tác biên mục tại Trung tâm cũng cần đảm bảo các vấn đề về chuẩn mô

tả, công tác phân loại, định tò khoá,...để các đơn vị sử đụng coi đó như là những

biểu ghi thư mục chuẩn có thể tận dụng vào việc phát triển nguồn tài nguyên thư

mục của mình.

3.6.2. Đảm bảo an toàn cho dữ liệu sổ

Công tác đảm bảo an ninh thông tin trong giai đoạn hiện nay là hết sức quan

trọng đối với Trung tâm nói riêng và các cơ quan TT-TV nói chung bời;

+ Nguồn TNS tuy rất dễ phổ biến, sao lưu nhưng nguy cơ bị mất cũng rất cao.

Sự phát ừiển mạnh của mạng máy tính ngày càng tạo ra nhiều hinh thức tấn công đo

virút.

+ Tuổi thọ của các sản phẩm phần cứng không có cơ sở đảm bảo an toàn cho

thông tin

+ Các máy trạm của Trung tâm hầu hết chưa được trang bị phần mềm có bản

quyền và phần mềm diệt virút hiệu quả..

+ Do khối lượng tài liệu và nguồn tin tại Trung tâm rất lớn và giá trị nên khi

sảy ra sự cố sẽ rất khó khôi phục.

Từ những lý do nêu trên cho thấy công tác bảo vệ an ninh cho nguồn TNSNS

tại Trung tâm cần có những giải pháp cụ tiiể và đồng bộ. Dưới đây, tác giả xin đưa

ra một số giải pháp cụ thể như sau:

- Xày dựng cơ chế sao ỉưu dữ liệu hợp ỉý:

Hiện nay, các CSDL của Trung tâm tuy đã được sao lưu ra ổ cứng để đề

110

phòng các trường họpp xấu sảy ra. Tuy nhiên, để đảm bảo an toàn hoTi cho dữ liệu,

toàn bộ CSDL của Trung tâm cần được sao lưu sang đĩa CD và cất giữ tại những

nơi an toàn không bị ảnh hường bởi các nguy cơ chập cháy. Bên cạnh đó, các bàn

copy này cũng cần được update thường xuyên để đảm bảo giảm thiểu thiệt hại nếu

có tình huống xấu sảy ra.

- Lựa chọn các thiết bị có chất lượng tốt, nâng cấp và thay mới các máy trạm:

Một trong những yếu tổ quan trọng góp phàn đàm bảo an toàn cho dữ liệu là

các thiết bị phần cứng (các server và các ổ cứng di động). Thực tế cho thấy đã có

một số trường hợp hỏng ổ cúmg và server sảy ra tại Trung tâm, gần đây nhất là năm

2007 tuy không gây thiệt hại nhiều nhưng cũng cần lưu ý, nếu đữ liệu không được

sao lưu thường xuyên thì khả năng mất mát sẽ rất lớn. Để khắc phục những hỏng

hóc do phần cứng, ngoài việc sử dụng bảo quản thiết bị một cách khoa học, việc

chọn mua các sản phẩm có thưcmg hiệu và chất lượng cao đóng vai trò rất quan

trọng. Hiện tại cỏ rẩt nhiều nhà cung cấp thiết bị tin học, tuy nhiên chỉ nên lựa chọn

sản phẩm của những thương hiệu cỏ uy tín và chất lượng như Intel, IBM, Dell,

Hp,...

Hệ thống máy trạm tại Trung tâm theo thống kê, hầu hết mới được trang bị

một vài năm gần đây và có cấu hình đáp ứng được yêu cầu công việc. Tuy nhiên

vẫn còn một số máy tính cũ, trong đó có cả những máy đã quá cũ và có cấu hình

thấp Pentium lĩl (như tại bộ phận bổ sung) cần được thay mới để đảm bảo quá ữình

xử lý và update dữ liệu được nhanh chóng.

- Triển khai các phần mềm và chương trình diệt vỉrút có bản quyền;

Theo nguồn tin từ Vnexpress, tại Việt Nam bình quân thiệt hại do virus gây ra

đối với mỗi người sử dụng máy tính khoảng 488,000 đồng/năm [19]. Trung tâm

TTKH&CNQG cũng không nằm ngoài số đó,

Hiện nay, toàn bộ máy chủ và một sổ máy trạm của Trung tâm đang sử dụng

phần mềm có bản quyền của nhà cung cấp và các chương trình diệt virút như

Norton, Avg, Avast,.,.. Tuy nhiên, hầu hết các máy trạm đều đang sử dụng các

phần mềm không có bàn quyền và chưa có chương trình diệt virut hiệu quả nên

nguy cơ virút tấn công là rất cao. Mặc dù những thiệt hại sảy ra chủ yếu trên máy

trạm nhưng tổn thất cũng không nhỏ và có thể ảnh hưởng đến toàn hệ thống. Đe

111

đảm bảo an toàn cho toàn hệ thống, Trung tâm nên trang bị cho toàn bộ máy ừạm

các phần mềm (chủ yểu là Windows XP) và chương trình diệt virút có bản quyền

như Bkav Pro, Kaspersky, Norton,...

- Làm tối cóng tác quản ỉỷ các bộ phận tham gia xây dựng các BSTS

Cùng với sự đa dạng và phong phú của các BSTS !à sự tham gia cùa nhiều bộ

phận, cá nhân vào hoạt động xây đựng, quản lý và phổ biến các BSTS nội sinh. Do

đó, việc quản lý và phân quyền truy cập cho các cá nhân tham gia sẽ gặp phải một

số khó khăn nhất định. Để đảm bảo an toàn cho nguồn TNSNS, bộ phận chịu ừách

nhiệm quản lý kỹ thuật (bộ phận tin học) cần phân công cụ thể từng cá nhân phụ

trách từng bộ phận và xác định quyền hạn của từng cá nhân tham gia xây đựng và

quản lý các CSDL để cung cấp các acount với các quyền truy cập phù họp, tránh

hiện tượng những người không có trách nhiệm tham gia vào các mảng công việc

3,6,3. Xây dụmg cơ chế truy cập phù hợp

ichác gây mất an toàn cho các CSDL.

- Đồi với CSDL STD

Trong toàn bộ nguồn TNSNS của Trung tâm, chỉ có duy nhất CSDL STD ỉà

được phục vụ theo phương thức có trả phí. Như đã trình bày tại mục 2.2.4, phương

thức phục vụ này có những mặt hạn chế nhất định làm giảm khả năng truy cập tới

CSDL trong khi nó được coi là một trong những CSDL về KH&CN cỏ giá ưị nhát

hiện nay. Vì vậy, trong tương lai, Trung tâm cần sớm triển khai cơ chế phục vụ

miễn phí đối với NDT truy cập CSDL này.

Tuy nhiên, để có thể cung cấp miễn phí, vấn đề chính là phải đảm bảo được

hai yếu tố:

Thứ nhắt. Đảm bảo về hạ tầng phục vụ khai thác bao gồm mạng và server lưu dữ

liệu. Với lưu lượng khai thác như hiện nay, hệ thống đường truyền và server có thể

đáp ứng tốt quá trình nhận và truyền dữ liệu. Tuy nhiên, nếu khối lượng khai thác

tăng lên gấp nhiều ỉần, rất có thể dẫn đến tình trạng nghẽn mạng như trường hợp

TVS hoá của Liên minh châu Âu. Thư viện này được khai trương vào tháng

11/2008, tuy nhiên đã bị phá sản chỉ vài giờ sau đó do có quá nhiều người truy

cập[6].

Thứ haL Trong khi vấn đề pháp lý cho CSDL này vần chưa được giải quyết thấu

112

đáo, việc cung cấp rộng răi CSDL này có thể gặp phải những ý kiến phản hồi khác

nhau. Do vậy, để có thể chính thức phục vụ khai thác rộng râi CSDL này, Trung

tâm cần sớm hoàn thành các thủ tục về mặt pháp lý trong công tác số hoá tài liệu

nói chung và số hoá các bài trích nói riêng.

- Đoi với các phim khoa hoc

Hiện tại Trung tâm đã đưa một số phim lên mạng nhưng với khối lượiig ít và

khả năng truy cập thấp. Hầu hết các phim khoa học đang được phục vụ theo hình

thức cung cấp gói tin tới các địa phương nên hiệu quả khai thác chưa rõ rệt. Trong

tương lai, để đáp ứng nhu cầu khai thác thông tin từ xa, đặc biệt là những vùng sâu

vùng xa đã được trang bị máy tính và mạng máy tính thi các phim khoa học này cần

được cung cấp miễn phí trên mạng.

Do đặc điểm của những tài liệu phim khoa học là có dung lượng lớn (200 đến

300 Mb/1 phim) nên việc cung cấp sẽ gặp nhiều khó khăn. Bên cạnh những yêu cầu

về hạ tầng như đối với CSDL STD, các phim khoa học có những yêu cầu riêng về

phần mềm quản lý cũng như các kỹ ứiuật và chương trình để xử lý trước khi cung

3.6.4. Đẩy mạnh công tác tuyên truyền giới thiệu nguền tàì nguyên số nội sình

cấp tới NDT.

Để phát huy hơn nữa hiệu quả của công tác tuyên truyền, quảng bá nguồn

TNSNS, Trung tâm cần tăng cường hoạt động marketing đồng thời ừiển khai thêm

các hình thức tuyên truyền giới thiệu khác.

Như trên đã trình bày (mục 2.2.5), để đẩy mạnh hơn nữa hoạt động marketing,

Trung tâm cần giải quyết số vấn đề sau: Thứ nhất: về mặt tổ chức.

Theo biên chế, hiện tại tổ Marketing chỉ có hai cán bộ nữ, ữong khi hoạt động

này đòi hỏi thường xuyên phải đi công tác nên cần bổ sung thêm nhân lực đặc biệt

là cán bộ nam. Thứ hai: về chương trình và kế hoạch

Cần xây đựng một chương trình tổng ứiể, trong đó có sự phân chia theo nhóm

các viện, trường hay theo địa bàn cần triển khai giới thiệu. Bên cạnh đó cần có sự

phân công cụ ứiể đối với những người tham gia không thuộc tổ Marketing để đảm

113

bảo tính chủ động trong công việc.

Song song với hình thức tuyên truyền giới thiệu tới tìrng đơn vị, hình thức

tuyên truyền quảng bá trên các phương tiện thông tin đại chúng, đặc biệt là mạng

Internet cần được chú trọng phát triển.

Đổi với các phương tiện thông tin đại chúng như các kênh truyền thanh, truyền

hình, có thể giới thiệu nguồn tin trên các chương trình khoa học và giảo dục. Nội

dung giới thiệu không càn dài đòng và quan trọng nhất là phải giới thiệu được địa

chỉ truy cập tới nguồn tin trên Internet (cần tiả lời câu hỏi nguồn tin có những gì và

có thể truy cập ở đâu?)

Đối với hình thức tuyên truyền quảng bá trên mạng Internet, đây là hình thức

phổ biến hiện nay và cũng là hình thức mang lại hiệu quả cao nhất. Với vị trí và vai

trò của Trung tâm hiện nay, hình ứiức tuyên truyền quảng bá các sản phẩm và dịch

vụ ngày càng trở nên dễ dàng hofĩi. Điều này được lý gíài như sau:

Hiện nay, hầu hết các trường đại học, viện nghiên cứu trong nước đều bị hạn

ché về nguồn tin do kinh phí bổ sung hạn hẹp. Trong khi đó, rất nhiều NDT (đặc

biệt là đối tượng sinh viên) vẫn chưa biết đến nguồn tin hiện có tại Trung tâm. Đẻ

có thể tiếp cận đến một nguồn tin phong phú, đa dạng và quý giá của Trung tâm là

điều mà các cơ quan TT-TV đều mong muốn.

Mặt khác, sự hỗ trợ của mạng máy tính đã mở ra khả năng kết nối tới tất cả các

cơ quan TT-TV lớn nên khả năng truy cập tới nguồn tin tại Trung tâm là hoàn toàn

có thể thực hiện.

Với những thuận lợi ữên, một phương pháp rất đơn giản và hiệu quả mà Trung

tâm có thể tiến hành là tạo ra các kết nối liên kết trang tìm kiếm của các cơ quan

TT-TV trong cả nước tới nguồn tài nguyên của Trung tâm.

3.6,5. Phát triển đội ngtl cán bộ

Nguồn nhân lực được xem là nhân tố quyết định trong công tác phát triển

nguồn TNSNS. Do yêu cầu của công tác phát ữiển nguồn TNSNS đòi hỏi nguồn

nhân lực không chỉ ở một ngành, một lĩnh vực nhất định nên việc đồng bộ hoá đội

ngũ cán bộ tham gia công tác phát triển nguồn tài nguyên này gặp không ít khó

khăn, đặc biệt là cán bộ trong lĩnh vực TT-TV và cán bộ tin học.

Thực té cho thấy, số cán bộ có chuyên môn về TT-TV và cán bộ tin học có

114

kiến thức trong lĩnh vực TT-TV tại Trung tâm chỉ chiếm khoảng 15 % (25/165

người), con số này không đủ để đáp ứng yêu cầu cho công tác phát triển nguồn

TNSNS hiện nay và trong tương lai. Đa số cán bộ của Trung tâm được đào tạo từ

các chuyên ngành khác như công nghệ sinh học, môi trưÒTig, kinh tể,...và được đào

tạo thêm nghiệp vụ TT-TV sau khi được nhận về Trung tâm.

Để đáp ứng nhu cầu phát triển nguồn TNSNS trong thời gian tới, bên cạnh

việc tận dụng kiến thức và kinh nghiệm của lớp cán bộ đi trước Trung tâm cẩn bổ

sung thêm nguồn nhân lực, đặc biệt là đội ngũ cán bộ trẻ, đồng thời đẩy mạnh công

tác đào tạo và đào tạo lại nghiệp vụ cho lớp cán bộ này.

Những nội dung chủ yểu cần được đào tạo gồm:

- Kỹ năng tìm kiếm và phát hiện những nguồn tin có giá trị

- Kỹ năng biên tập, xử lý bài (đối với cán bộ tham gia xây dựng CSDL dạng

bản tin)

- Kỹ thuật xử lý nội dung (mô tả, phân loại, định từ khoá, làm tóm tắt,...) đối

với tất cả cán bộ tham gia xây dựng CSDL.

- Kỹ thuật sé hoá tài liệu (đối với những cán bộ tham gia số hoá)

- Sự hiểu biết và khả năng áp dụng các chuẩn nghiệp vụ (ISBD, Marc21,

Dublin Core, AACR2, các khung phân loại,...)

- Khả năng sử dụng phần mềm hiện có và ứng dụng các phần mềm mới ữong

lĩnh vực TT-TV (đối với tất cà cán bộ tham gia phát triển nội dung số). Đối với cán

bộ tin học cần đào tạo thêm kỹ năng phát triển các phần mềm hiện có và tiếp cận

các phần mềm mới,

- Kỹ năng tìm kiếm thông tin trong hệ thống và bên ngoài (đối với tất cả cán

bộ tham gia xây dựng và quản lý nguồn TNSNS), đặc biệt lả cán bộ phục vụ.

Hình thức đào tạo gồm:

- Tổ chức các lớp đào tạo cơ bản và nâng cao tại Trung tâm cho từng đối

tượng cụ thề

- Tổ chức các cuộc hội thảo về nghiệp vụ cho các cá nhân tham gia thuộc các

khâu trong toàn bộ quy trình phát triên nguồn TNSNS.

- Mờí các chuyên gia trong nước và nước ngoài thuộc lĩnh vực tham gia đào

115

tạo cho cán bộ

- Vận động và tạo điều kiện hỗ trợ cho cán bộ đi đào tạo thạc sĩ và tiến sĩ trong

nước cũng như ở nước ngoài.

Bên cạnh việc đào tạo và đào tạo lại đội ngũ cán bộ, Trung tâm cần có chính

sách thu hút cán bộ có trình độ gắn bó lâu dài với Trung tâm, đặc biệt !à những cán

16

bộ đã được đào tạo tạo từ nước ngoài về.

KÉT LUẬN

Qua quá trình khảo sát, tìm hiểu toàn bộ quy trình xây dựng và phát triển

nguồn tài nguyên số nội sinh tại Trung tâm, đồng thời nghiên cứu các giải pháp khả

thi có thể áp đụng cho từng quy trình cụ thể, luận văn đã giải quyết cơ bản nhOnng

vấn đề được đặt ra.

Trong hoạt động số hoá, luận văn đã tìm ra giải pháp cho những vấn đề về bản

quyền, vấn đề đảm bảo nguồn nguyên liệu đầu vào và những giải pháp kỹ thuật

trong quy ữình số hoá tài liệu, đồng thời xây dựng được mô hình trao đổi dữ liệu

trong nội bộ giữa các bộ phận tham gia phát triển nguồn tài nguyên số nội sinh.

Trong công tác xây dựng và tổ chức các bộ sưu tập tài nguyên số nội sinh,

luận văn đã đề xuất một số giải pháp kỹ thuật gồm: Áp dụng tiêu chuẩn ưong xử lý

nội dung; phối họp giữa các bộ phận tham gia phát triển nội dung số; sủ dụng phần

mềm; chia sẻ và phân phối nguồn tin; tổ chức khoa học các bộ sưu tập tài nguyên số

nội sinh hiện cỏ tại Trung tâm.

Ngoài ra, luận văn cũng nghiên cứu và đưa ra các giải pháp khác có liên quan

đến toàn bộ quá trình xây dựng và quản lý nguồn tài nguyên số nội sinh tại Trung

tâm như: Đảm bảo an ninh cho nguồn tài nguyên số nội sinh; phổ biến nguồn tài

nguyên sổ nội sinh tới người dùng tin và phát triển đội ngũ cán bộ.

Bên cạnh những vấn đề đã được nêu ra và giải quyết trên đây, công tác xây

dựng và quản lý nguồn tài nguyên số nội sinh tại Trung tâm nói riêng và công tác

phát triển nguồn tài nguyên số tại các cơ quan thông tin - thư viện nói chung còn

nhiều vấn đề tồn tại cần được giải quyết lĩiột cách thấu đáo. Trong đó có ba vấn đề

quan trọng nhất là đảm bảo tính pháp lý cho nguồn tài liệu số hoá, áp dụng các

chuẩn dữ liệu và lựa chọn phần mềm quàn lý tài nguyên số. Đây ià những vấn đề

phức tạp và phụ thuộc vào điều kiện của từng cơ quan/đơn vị, do vậy cần được tiếp

tục nghiên cứu. Tác giả hy vọng trong thời gian tới sẽ được tiếp tục quá trình nghiên

117

cứu những vấn đề nêu trên một cách đầy đủ và hoàn thiện hơn.

DANH MỤC TÀI LIỆU THAM KHẢO

Tài liệu tiếng Việt

1. Bộ luật Dân sự nước Cộng hoà Xâ hội Chủ nghĩa Việt Nam. số 33/2005/QHl 1

ngày 14 tháng 6 năm 2005, Website: Cục Sờ hữu ưí tuệ, URL; http://www.noip.gov.vny Cập nhật 10/6/2009

mạng, Website: Trung tâm Thông tin KH&CNQG, URL: http://www.clst.ac.vn, Cập nhật 9/8/2009

2. Cao Minh Kiểm, Lê Xưân Định, Mộí số suy nghĩ về chuần dữ liệu (rong Ìỉêrì kết

3. Cao Minh Kiểm, Nguyễn Đức Trị, Vũ Anh Tuấn (2000), Đánh giá hiện trạng tổ chức và khổ mẫu CSDL, phương pháp khai thác ngân hàng dữ liệu KHCN quốc gia tại Trung íâm TTTLKHCNQG, Trung tâm TTTLKHCNQG, Hà Nội.

4. Đoàn Phan Tân (2006), Thông tin học'. Giáo trình dành cho sinh viên ngành Thông

(2005), Website: Cục Sở hữu tuệ, URL: tuệ trí trí 7.

tin - Thư viện và Quản trị thông tin, Nxb Đại học Quốc gia Hà Nội, Hà Nội. 5. Hoàng Đức Liên, Nguyễn Hữu Ty (2008), Giải pháp xây dựng các bộ sim tập tài ỉiệu số, Website: Thuvien.net, URL: http://www.thuvien.net, Cập nhật 20/6/2009 6. Khai trưcmg thư viện số tại UNESCO, Báo Hà Nội mới ngày 20/4/2009, Website; Báo Hà Nội mới, URL: http:/Avww.hanoìmoi.com.vn/vn, Cập nhật 06/9/2009 Luật Sở hữu http://www.noip.gov.vn, Cập nhật 25/6/2009

8. Luật sửa đổi, bổ sung một số điều của Luật Sờ hữu trí tuệ, Website: Cục Sở hữu ữí

tuệ, URL; http://www.noip.gov.vn, Cập nhật 12/6/2009

9. Nghị định 100/2006/NĐ-CP Quy định chi tiết và hướng dẫn ứii hành một sổ điều của Bộ luật Dân sự, Luật Sở hữu ưí tuệ về quyền tác giả và quyền liên quan, Website: Bộ Thông tin và Truyền thông, URL: http://mic.gov.vn, Cập nhật 21/6/2009

10. Nghị quyết số 49/CP về phát triển công nghệ thông tin ở nước ta trong những năm

90, Website: Bộ Giáo dục và đào tạo, URL: http://vanban.moet.gov.vn, Cập nhật 15/6/2009

11. Ngô Thaiih Nhàn (2007), vấn đề số hoá kho tư liệu hán - nôm theo chuần Dublincore tại Viện Thông tin Khoa học Xã hội, Website: Đại học Temple, URL: http://www.temple.edu, Cập nhật 9/6/2009

12. Nguyễn Hữu Hùng (2003), Phát ừiển đào tạo cán bộ ửiông tin thư viện ở Việt Nam,

Thông tin và íư ỉiệu, Tr. 8-14

118

13. Nguyễn Minh Hiệp (2004), Thế giới thư viện số, Website: Trưòaig Đại học Khoa

học tự nhiên thành phố Hồ Chí Minh, URL: http://www.glib.hcmuns.edu.vn, Cập nhật 20/6/2008

14. Nguyễn Thị Đào (2007), Xây dựng mục lục liên hợp ữực tuyến cho hệ thống thông tin khoa học và công nghệ Việt Nam, Hội thảo khoa học "Tiếp cận xây dựng thư viện sổ ở Việt Nam: Hiện trạng và vẩn đề'\ Trung tâm Thông tin Khoa học và Công nghệ Quốc gia, Tr. 52-58

15. Nguyễn Hoàng Sơn (2007), Nghiên cứu thư viện số trên thế giới và định hướng nghiên cứu tliư viện số ờ Việt Nam ''"Tiếp cạn xây dựng thư viện số ở Việt Nam: Hiện trạng và vấn đ ề'\ Trung tâm Thông tin Khoa học và Công nghệ Quốc gia, Tr. 10-23

16. Nguyễn Thị Hạnh (2007), Đàm bào chất lượng dữ liệu trong xây dựng ứiư viện điện tử, Hội thảo khoa học "Tiểp cận xây dựng thư viện sổ ở Việt Nam: Hiện trạng và vấn để", Trung tâm Thông tin Khoa học và Công nghệ Quốc gia, Tr. 59-64 17. Nguyễn Thị Xuân Bình (2006), Áp dụng MARC21 0 một số ca quan ứiông tin, thư

viện tại Hà Nội, Thông tin và tư liệu, số 2, tr. 16-19

18. Nguyễn Tiến Đức (2008), Tình hỉnh an ninh thông tin ờ Việt Nam và sự tiếp cận ISO/IEC 27001 - Hệ ửiống quản lý an ninh ưiông tin (ISMS), Thông tin và Tư liệu, Số 4, Tr. 22-23

19. Phạm Văn Rinh, Nguyễn Viết Nghĩa (2007), Phát triền vốn tài ỉiệu trong thư viện vỏ cơ quan thông tin : Giáo trình dùng cho sinh viên đại học và cao đẳng Ngành Thư viện - thông tin, Nxb Đại học Quốc gia Hà nội, Hà Nội 20. Số hoá và vấn đề bản quyền, Website: Thuvien.net, URL:

http://www.thuvien.net, Cập nhật 18/6/2008

21. Tạ Bá Hưng (2000), Phát ư-iển nội dung số ở Việt Nam: những nguyên tắc chi đạo,

ĩhõng tin và Tư liệu, số Tr, 2'6

22. Tạ Bá Hưng í^003), Bước đầu tăng cirờng cung cấp thông tin KHCNphục vụ phát

triển kinh íể-xã hội vùng sâu, vùng xa, Trung tâm Thông tin KH&CNQG, Hà Nội

24. Trần Thị Quý, Trần Hữu Huỳnh, Đồ Văn Hùng (2006), Nghiên cứu xãy dựng mục lục liên hợp trực tuyến cho hệ thống (hư viện công cộng ViệỊ Nam: Đê lài nghiên cứu khoa học, Đại học Quốc gia Hà Nội.

119

23. Tạ Bá Hưng (2006), Trung tâm Thông tin KHCN Quốc gia: định hướng phát triển giai đoạn 2006-2010 và tầm nhìn đén năm 2015, Thông tin và Tư liệu, số 1, ử. 89- 95

Tài liệu tiếng Anh

25. About Greenstone software, Website: Greenstone digital library software, URL:

http://www.greenstone.org, Cập nhật 14/6/2009

26. Alan Oliver (2009), Digĩtool’s support of web services, Repositories and web services workshop I, Website: Electronic Theses Online Service , URL: htlp://wM>w.ethos.ac.uk, Cập nhật 14/6/2009

27. Berne Convention for the Protection of Literary and Artistic Works, Website: Tổ chức Sờ hữu trí tuệ thế giới (WIPO), URL: http://www.wipo.int, Cập nhật 21/6/2009,

28. CDS/ISIS database soíhvare, Website: UNESCO, URL: http://portal.unesco.org,

Cập nhật 10/6/2009

29. Fox Edward A. (1999), The Digital Libraries Initiative: Update and Discussion, Website: American Society for Information Science, URL: http://www.asis.org, Cập nhật 14/6/2009

30. Paula J. Hane (2002),Vanderbilt Improves Television News Archive: It’s recently added TV-NewsSearch offers users a single searchable database, Website: Vanderbilt university, URL: hnp://tvnews.vanderbiỉt.eđu, Cập nhật 13/6/2009

31. Zope Object Database, Website: Wikipedia, URL:

120

http://en.wỉkipedia.org/wỉkỉ/Zope_Object_patabase, Cập nhật 18/6/2009

PHỤ LỤC 1

BIỂU MẪU NHẬP TIN CHO CSDL STD

t Am t h ô n g

TINKK«CNQG

PHIẾU N H Ậ P TIN C ơ S ỏ D ữ LIỆU TO À N V Ă N

Dạng tài liậu:

B ò i irictì tạp ctìí

■ Bà! ịríGtì sầch

■ B6! tnch bào

B ài tnch tưỵễn tệp bắo cào KQNC Bối (rich K ỷ yỐu/Hăĩ nghựHộl thào BAi nghiồn CÌÁÌ__________________

T v n tá i liệu < N h a n <34 (l<íng V i ^ } .

N h a r đé địch sang tiín g Việt:

Tôc giả:

' TẠn lạ p c h i / n g u ổ ri Irich:

SỐ:

T ệ p ;

Ị O ữlĩèu noiưỉn trich: Nâm:

Oàc trưng số lưạng:

C h i S Ổ đé m ụo q u â o gla:

ISSN/ISSN:

T ừ k fió a ohinh:

Ị Từ khửa phụ:

Từtchốa $lnh học:

Ký h i ệ u kho. TTKHCNQ Q ,

Đ i a c ^ l i l u u t ộ p :

121

PHỤ LỤC 2

THIẾT BỊ LƯU GIỮ TÀI NGUYÊN sổ NỘI SINH

Dung lirợng Tên CSDL Server

đĩa cứng

Sách, Tạp chí 01 80 GB (Gigabyte)

STD 01 300 GB

Các bản tin điện tử 01 100 GB

Các tin ngày trên Visía 02 400 GB

Các CSDL về chợ công nghệ 01 200 GB

CSDL Kết quả nghiên cứu 01 100 GB

122

CSDL Tạp chí VN 01 1 TB (Terabyte)

PHỤ LỤC 3

C Ọ N G H O À XẢ H Ọ l C H Ủ N G H ĨA V IẸ T N A M Độc lập • T ự d o - H ạn iì pliú c

«Ơ N OẺ NG HI ĐƯỢC T H A M G íA DJCH VỤ "B Ậ N ĐỌC ĐẶC B IỆ T "

K ính gíri: G iảm đổc T ru n g tâm T h ổ n lỉ tin K H & C N Q u é c 0 »

Hộ và tền: ..... ..............................................................................................

N gày sin h :.................................. .......................................................... ......

H o c h à n ilio c v i-T rìn h đ ộ :.......................................................................

Cliuv*! ngànli;..................... ................. .............................. .

SỔ C M r nlứn dâ»................................. cẩp ngảỵ;....................... tại;.

Nơi công tíc^ioc tập;............... . .............. ................................... .

MẦU ĐƠN THAM GIA DỊCH v ự BẠN ĐỌC ĐẶC BIỆT

Đ è nghị c )(0 tôi ditợc thstn giu siirdựng í!^ch vụ " B ạ n d ọ t jaăc b iệt” d o Trui® tâm T b ồ rg tin K tx » ht>c ^ C ô n g ^ h ệ Q uốc gia cung c lp . Tôi t a n i két Ihực hiện cấc qdV dinh cús T nm g fJm vồ khsi iW c đich V\1 nãy n h ư anp:

- Chí khui thác Iigitàn lÌH d í pbực vụ họQ lập và nghicii cứ u khoa họe, n ồng cao

h iầ i bict;

- Khòng

xiéố)\g (dow nkw d) d ừ liệu nipt eốch !iệ Ihổiig vả A cưng cAp eho b ín th ứ

- l3ào mậl tên Iniv cập và Iiiật khair, tcliân{; cliuyán ẸÌIH) Téi» Ituy cập v à mật

k h n i i d iR ,ic c ầ p c h ợ n g u ừ i ỉ c h a c s ứ d ụ n g ;

- Chịu trnch nhiộm cá n hìn {vể pháf> luật vả lãi chinh) rf(*i vói nhiíng VT phạm

nêu Cữ gựn 0K>ĩ ÌHỤt lỉv y cặp inạog bàiig tỉn lỊgưtíi dvuíg và 1181 kliầii (luục «ã|>.

- Dóng góp clũ pW vận hành dịch vụ Ihco Qii>- dinh ciia TniiỉịỊ lâin.

/Igày.......... i/KÍng.. .../lăm.......

X Á C N H Ậ N C Ú A C ơ Q Ụ A N /O Ơ N V | (ký và đóng dắu)

N G Ư Ờ I L À M fK>N (ký V IÌ glii rữ họ tê)j)

123

r>ỊHohi: ............................... D T ;...................................................K ro il:.