TS. Nguyn l Nhung 0912581997
www.vanthuluutru.com
1
Các siêu d liu ca tài liu đin t
dưới góc nhìn ca Tiêu chun Nga
và Tiêu chun quc tế
TS. Nguyn L Nhung
Các siêu d liu – nhng d liu v d liu đã được cu trúc hóa, đó là thông
tin cho phép nhn dng các ngun thông tin, tìm kiếm và qun lý chúng. Các
siêu d liu có ý nghĩa đặc bit trong mi quan h vi tài liu đin t. Theo
hướng dn ca tiêu chun Nga R 50.1.031, tài liu đin t nhưđối tượng
thông tin gm có hai thành phn:
1) tiêu chí, bao hàm nhng tiêu cđịnh dng (tên, thi đim và nơi xác lp, các
d liu v tác gi v.v.) và chđin t;
2) ni dung, cha đựng thông tin viết, s và /hoc đồ ha được x lý như là mt
vt th duy nht và đầy đủ.
Các “tiêu chí nhn dng” nêu trên được làm rõ nh thut ng “siêu d liu”.
Trong tiêu chun quc gia GOST 7.70-2003 thut ng “siêu d liu” được định
nghĩa như là “s mô t hình thc ngun thông tin, được s dng để nhn dng
và phân loi ngun thông tin khi làm vic vi các tp hp ln nhng ngun
thông tin”.
Tiêu chun quc tế ISO 15489 định nghĩa siêu d liu như các d liu mô t
ng cnh, ni dung, cu trúc và qun lý tài liu theo thi gian. T định nghĩa đó,
ta thy, nhng siêu d liu văn thư được s dng trước tiên là đểt thuc
tính ca tài liu như ni dung, cu trúc và ng cnh. Ch có các tài liu là có c
ni dung, c ng cnh và c cu trúc (các d liu ch có mt vài ni dung, còn
bn ghi ch có ni dung và cu trúc).
1. Mt s định nghĩa
Ni dung (content) - đó là thông tin thc tế ghi nhn hot động qun lý ca tài
liu. Ni dung ca mt tài liu có th được trình bày trong mt hoc vài bn ghi
giy và /hay đin t. Ngoài ni dung bn ghi (các bn ghi), tài liu có thông tin
v ng cnh và cu trúc ca bn ghi.
Cu trúc - đó là hình dáng bên ngoài và s sp xếp các phn ca ni dung (ví
d, vt mang tin, định dng ca file, t chc các d liu, sp xếp các tiêu chí,
các kiu ch, nhng ghi chú, các bng biu v.v.), cũng như các mi liên h hin
có ca tài liu này vi các tài liu khác (các siêu chú dn).
Có th ch ra s khác bit gia cu trúc vt lý và cu trúc logic ca tài liu. Đối
vi người s dng, cu trúc vt lý ca tài liu truyn thng là rõ ràng, còn cu
trúc vt lý ca tài liu đin t là không c định và nó ph thuc vào s duy trì
chương trình phn mm và k thut, vì vy, cu trúc logic - mi quan h gia
các b phn to thành tài liu đin t - làm cho tài liu đin t có th hiu được.
Ng cnh - là thông tin cha đựng trong tài liu hoc đi kèm vi nó, ch ra mi
quan h tương h gia tài liu vi hot động qun lý ca cơ quan, t chc và
vi các tài liu khác. Đó là các thông tin v bn thân tài liu (thí d, tên tài liu,
tác gi, ngày xác lp), v người lp và nhng mc đích lp tài liu (ví d, v
chc năng hay hot động qun lý, v cơ quan - đơn v lp tài liu), v vic s
dng tài liu (ai, khi nào, vào mc đích gì). Theo định nghĩa ca Tiêu chun
TS. Nguyn l Nhung 0912581997
www.vanthuluutru.com
2
quc tế ISO 15489, ng cnh có nghĩa là tình hung (các nhà to lp, mc đích
ca h, hành động và hoàn cnh), là nguyên nhân ca nhng s kin đã xy ra,
ca s to lp và lưu gi các tài liu ghi li các s kin đó.
Các siêu d liu - đó là b phn quan trng ca thông tin ng cnh.
2. Các siêu d liu theo tiêu chun ISO 15489
Tiêu chun ISO 15489 quy định: các tài liu, ngoài ni dung phn ánh hành
động qun lý các siêu d liu, còn phi có mi quan h thường xuyên hoc gn
kết vi các siêu d liu đó. Khi đó:
- cu trúc ca tài liu, nghĩa là định dng ca nó và các mi quan h ln nhau
gia nhng thành t to thành tài liu phi luôn là không thay đổi;
- trong tài liu phi phn ánh được ng cnh qun lý vic lp, tiếp nhn và s
dng tài liu (trong đó có quá trình qun lý mà mt phn ca nó là hành động
qun lý đó, có ngày tháng và thi gian din ra hành động và người tham gia
hành động);
- các bn ghi riêng bit trong tp hp to thành tài liu phi có mi liên h vi
nhau.
Các siêu d liu không ch được to nên ti thi đim to lp (hay tiếp nhn và
đăng ký) tài liu trong h thng tài liu ca t chc , mà chúng còn được b
sung theo thi gian (thí d, trong quá trình s dng tài liu).
Các siêu d liu - tuy không phi là hin tượng mi trong lĩnh vc thông tin và
tài liu, nhưng trong công tác văn thư lưu tr - đó là thut ng mi, s dng nó
có nghĩa là gn vi mt thc tế là trong thi đại thông tin s các siêu d liu đã
tr nên có ý nghĩa đặc bit. Trong môi trường đin t, nhng tài liu nguyên bn
luôn đi cùng vi các siêu d liu xác định chính xác nhng đặc đim cơ bn ca
chúng. Chính các siêu d liu làm cho tài liu đin t tr nên thích hp cho s
dng, d hiu và là nguyên bn, bo đảm tính bt biến, tính trung thc và hiu
lc làm chng c pháp lý ca tài liu đin t. Do vy, các siêu d liu là thành
phn bt buc ca qun lý tài liu đin t.
Trong văn thư truyn thng, các siêu d liu nm trên bìa h sơ, trong phiếu
đăng ký tài liu, danh sách h sơ. V ý tưởng các siêu d liu luôn gn vi
thông tin mà nó chú dn ti, ví d, chúng có th có chính phiếu thư mc tài
liu. Trong thc tin khi làm vic vi tài liu (s dng các h thng t động) các
siêu d liu thường được mã hoá ti mc không phân bit được trong đối
tượng thông tin đin t.
Như vy, các siêu d liu dùng đ mô t c tài liu giy ln tài liu đin t, làm
cho thông tin có dng cu trúc. Các siêu d liu văn thư mô t không ch bn
thân tài liu mà c nhng con người, quá trình, và h thng đang qun lý, to
lp, lưu gi và s dng chúng, cũng như c nhng nguyên tc, quy tc mà tài
liu tuân theo.
nước ngoài, tn ti nhng tiêu chun khác nhau ca các siêu d liu, trong
s đó có nhng tiêu chun được son tho cho mc đích ca công tác văn thư
và lưu tr.
3. Các siêu d liu theo tiêu chun ISO ca Liên bang Nga
Năm 2003, ti Nga đã biên son tiêu chun GOST 7.70. Tiêu chun quc gia
này đưa ra mt h thng đơn gin mô t các ngun thông tin (trong đó, có
ngun mng ca các mng cc b/địa phương và mng rng/toàn cu) và tim
cn h thng đó ti thc tin toàn cu. GOST 7.70 đề xut 29 tiêu chí để mô t
các ngun thông tin. Trong đó, có 10 tiêu chí mà theo chúng tôi là bt buc đối
TS. Nguyn l Nhung 0912581997
www.vanthuluutru.com
3
vi tt c các dng ngun:
1) Tiêu chí nhn dng ngun thông tin - dòng các ký t cho phép nhn dng
nht quán (đơn tr) ngun được mô t, được dùng đ chú dn ngun. S la
chn phương pháp n định tiêu chí nhn dng do t chc có thm quyn nhn
đăng ký hoc t chc áp dng h thng các siêu d liu mô t thc hin. Ví d,
trong trường hp đăng ký các ngun thông tin đin t thì tiêu chí nhn dng là
s đăng ký. Mi ngun thông tin phi có mt tiêu chí nhn dng riêng, không
trùng lp vi tiêu chí nhn dng các ngun khác trong mng hoc trong tp hp
các ngun.
2) Tên ngun - tên do người lp hay cơ quan ch qun đặt cho ngun. Nếu h
chưa làm vic đó thì người lp mô t ngun s đặt tên khi đăng ký và đưa nó
vào s tra cu.
3) Ch qun - tên ca đại din pháp lý hoc tên ca đại din thc th đang s
hu ngun.
4) Mô t - din gii bng ch ni dung ca ngun gm c tóm tt hay gii trình
(đối vi các tài liu văn bn), hoc mô t phn được lưu (đối vi các ngun
nghe, nhìn hay đa phương tin). Nếu ngun được mô t là tuyn tp tài liu
cùng dng hoc gn nhau v cu trúc, thì nêu dng hay cu trúc tài liu.
Yêu cu đối vi ni dung, xây dng và trình bày toàn văn mô t và tóm tt tài
liu được quy định trong GOST 7.9.95 tương đương vi tiêu chun quc tế ISO
214-76.
5) Mã tiêu đề - ch đề ca ngun thông tin được biu th bng các mã ca danh
mc chun nhng tiêu đề ch đề đang áp dng các nước SNG - Tiêu đề
thông tin khoa hc - k thut quc gia.
6) T khoá - Trong tiêu chí này ch ra các t khoá mô t đối tượng ca ngun
thông tin đin t (nghĩa là thông tin trong ngun v các khái nim cơ bn).
7) Ngôn ng - Trong tiêu chí này nêu ngôn ng được dùng để viết các thành
phn văn bn ca ngun thông tin. Nếu có các văn bn dùng các ngôn ng khác
nhau, thì cn ch rõ tng ngôn ng. Tên ca ngôn ng được chú gii đầy đủ
hoc rút gn phù hp vi tiêu chun GOST 7.75.
8) Chu k làm mi - Trong tiêu chí này ch ra chu k tiến hành làm mi ngun
bng cách ghi vào tiêu chí mt trong nhng t sau: “năm”, “quý”, “tháng”, “tun”,
“ngày”, “thường xuyên”, “theo s kin”, “không làm mi”.
9) Cp vn - ch nhng hình thc cp vn để lp và qun lý ngun. Ch dn
bng cách ghi vào tiêu chí mt trong các cm t sau: “ngân sách liên bang”,
“ngân sách ca các t chc liên bang”, “ngân sách thành ph”, “vn ngoi hi
quc gia”, “vn t có”, “vn ca nhng đại din pháp lý và thc th khác“,
“ngun cp vn không xác định”.
10) Thi gian làm mi ln cui ngun thông tin - thi gian làm mi ln cui ni
dung ca ngun hoc thi gian thiết lp nếu chưa làm mi. Đối vi thành t
“thi gian” (data) trên toàn thế gii s dng tiêu chun ISO 8601, nó đặt ra quy
cách thng nht trình bày ngày (NNNN-TT-nn/năm-tháng-ngày); gi
(gg:pp:gygy/gi:phút:giây); cũng như các khong thi gian. Tiêu chun GOST
ISO 8601 ca Liên bang Nga hoàn toàn tương thích vi tiêu chun quc tế trên.
Ngoài ra, còn có mt s tiêu chí bt buc có điu kin bao gm:
1. Thi gian làm mi ln cui siêu d liu ca ngun thông tin - thi gian (theo
quy cách ca GOST ISO 8601) làm mi ln cui siêu d liu ca ngun. Tiêu
chí này là bt buc nếu siêu d liu đã được làm mi.
2. Địa ch mng - địa ch tiếp cn ti ngun kiu “http” hoc “ftp”. Tiêu chí bt
TS. Nguyn l Nhung 0912581997
www.vanthuluutru.com
4
buc trong trường hp nếu ngun được đưa vào mng toàn cu.
3. Nhà tư vn - người cung cp các thông tin b sung v ngun. Tiêu chí bt
buc đối vi các ngun đin t ngoài mng.
4. Thi gian đăng ký - thi gian theo quy cách ca GOST ISO 8601. Tiêu chí bt
buc trong trường hp đăng ký ngun thông tin.
5. Cơ quan đăng ký - tên t chc thc hin vic đăng ký ngun thông tin đin t.
Tiêu chí bt buc trong trường hp đăng ký ngun thông tin.
Ngoài nhng tiêu chí bt buc và bt buc có điu kin trong tiêu chun còn quy
định các tiêu chí tu chn, chúng không bt buc phi có trong mô t nhưng cho
phép cung cp cho người s dng nhng thông tin b sung v ngun thông tin,
làm cho vic tiếp cn ngun thun tin hơn và hp dn hơn.
Tiêu chun GOST 7.70 hướng dn các cơ quan đăng ký ngun thông tin không
ch lp thư mc nhng ngun đã đăng ký mà còn c danh mc tiêu chí để s
dng khi son tho mô t ngun thông tin đin t như là “t chc” và “cá nhân”.
Được đưa vào danh mc tiêu chí (nhng file riêng bit) là nhng d liu v các
t chc và nhng người nm gi, xây dng và tham gia to lp và công b
nhng ngun thông tin, cũng như tư vn v s dng ngun. Danh mc “t
chc”, danh mc “cá nhân” là linh hot nghĩa là chúng có th được b sung theo
mc tích lu ca các ngun thông tin đin t.
Trong tiêu chun có danh mc tiêu chí để mô t ngun thông tin dng “t chc”
và dng “cá nhân”. Đối vi t chc (nhng đại din pháp lý) đã xây dng 14 tiêu
chí: nhn din (ví d, s th t do cơ quan đăng ký gán cho), tên chính thc,
tên khác đã được chp nhn chung, các tiêu chí giao tiếp (site, s đin thoi vi
mã nước và mã vùng, s fax vi mã nước và mã vùng, địa ch hp thư đin t,
địa ch hòm thư chính thc vi mã s bưu đin), nơi công tác (vùng , khu dân
cư), nhà lãnh đạo, t chc cp trên , thông tin b sung (v nhng ngun thông
tin có trong t chc), thi gian làm mi ln cui thông tin v t chc. Đối vi
nhng đại din thc th (cá nhân) đã định ra 10 tiêu chí: nhn din, h tên, chc
v, site cá nhân, đin thoi, fax, địa ch hp thư đin t, các thông tin b sung,
thi gian làm mi ln cui thông tin v cá nhân.
Các tiêu chí t chc nói chung đều là bt buc và bt buc có điu kin. Vi đại
din thc th các tiêu chí bt buc chnhn din và h tên (h, tên, ph danh)
Tóm li, phi tha nhn rng phiên bn mi ca tiêu chun GOST 7.70 th hin
đầy đủ thành qu ca cng đồng thế gii trong lĩnh vc mô t các ngun thông
tin đin t.
Các tiêu chun quc gia v siêu d liu được thông qua ti nhiu nước phát
trin. Công tác đó thường thc hin trong khuôn kh ca gii pháp xây dng
“Chính ph đin t”.
M đang áp dng sơ đồ ph dng khác - GILS (Government Information
Locator Service). Còn có các sơ đồ ph dng AACR2, EAD, TEI, MARC,
USMARC, ISAD(G), FRBR.
Ngoài tiêu chun ph dng, tn ti tiêu chun ca siêu d liu liên quan ti các
lĩnh vc hay ngành xác định: địa lý, nông nghip, giáo dc, công tác thư vin,
thng kê v.v... C th, ti mt lot nước đã thông qua cp độ quc tế các tiêu
chun mô t thông tin tài liu lưu tr. Nga còn áp dng tiêu chun GOST v
th đin t các siêu d liu.
Ti Úc, tiêu chun siêu d liu trong công tác văn thư do Lưu tr quc gia biên
son và áp dng cho các cơ quan nhà nước: hướng dn và mô t chi tiết 20
thành t cơ bn và 65 thành t ph ca siêu d liu. Cn nhn mnh thêm là
phm vi rng còn có tiêu chun siêu d liu do các cơ quan lưu tr các bang
TS. Nguyn l Nhung 0912581997
www.vanthuluutru.com
5
Victoria và New South Wales ca Úc biên son, cũng như có sơ đồ siêu d liu
do Đại hc tng hp Monash Úc xây dng.
C th, tiêu chun hoá siêu d liu văn thư đã được thc hin tích cc trong
khong vài năm cp quc gia vào nhng năm gn đây đã chuyn sang cp
quc tế. Năm 2004, tiêu chun quc tế v siêu d liu văn thư ISO 23081 đã
được thông qua.
4. Tiêu chun quc tế v siêu d liu văn thư ISO 23081
Đây là mt sơ đồ khá phc tp bao trùm tt c đặc tính vn có ca tài liu và ch
ra mi liên h gia tài liu vi chc năng qun lý, cũng như gia tài liu vi cá
nhân, các đơn v cu trúc, t chc đã to lp, s dng, qun lý và chu trách
nhim v tài liu hoc v hành động qun lý tương ng. Tiêu chun này đưa
các thành t xác nhn 5 dng thông tin v tài liu vào siêu d liu bt buc:
1) Thông tin cơ s cho phép nhn dng tài liu: kiu ca tài liu hay nhóm tài
liu (ví d, tài liu riêng bit, h sơ, tp/series); du hiu nhn dng ph dng
(thường là s, ch - s); tiêu đề ca tài liu; thi gian to lp tài liu.
2) Địa ch tài liu: nơi lưu gi (thí d s ca h sơ); nơi để hin ti ca tài liu
(thường là tên người s dng).
3) Mi liên h ca tài liu vi hot động qun lý, vi các tài liu và các tác gi tài
liu khác: chc năng qun lý mà tài liu có quan h ti; du hiu nhn dng các
tài liu liên quan; dng quan h gia các tài liu (tài liu trước, tài liu sau, kim
soát, b kim soát, là mt phn); người lp (mt người hay nhóm nhân viên); t
chc có trách nhim qun lý tài liu.
4) Tiếp cn tài liu: quyn tiếp cn (ví d “S dng ni b”); hn chế tiếp cn (ví
d “Bí mt thương mi”).
5) Qun lý tài liu: thi gian đăng ký tài liu; vt mang tin và quy cách lưu gi tài
liu đin t; di chuyn tài liu đin t; s h sơ theo danh mc h sơ; thi hn
lưu gi; tác động xy ra vi tài liu (hình thc, thi gian, người thc hin tác
động, ví d đăng ký hoc chuyn tài liu vào lưu tr).
Các tài liu văn thư đang cn có mt tp hp các siêu d liu đặc bit đa dng.
Các tài liu đang đòi hi nhiu hơn các siêu d liu ghi nhn ng cnh to lp
tài liu làm sao cho chúng vn là hiu được k c sau quãng thi gian dài. Song
cho đến thi đim này, các chuyên gia còn chưa đi ti ý kiến thng nht v
thành phn ca tp hp các siêu d liu. Nhng hy vng ln lao đang mong
ch tiêu chun quc tế ISO 23081 vì nó d kiến đánh giá các tp các siêu d
liu hin có và các d tho khác nhau trong lĩnh vc này có đáp ng vi nhng
yêu cu ca tiêu chun ISO 15489 hay không.
Các dng cơ bn ca các siêu d liu mà h thng qun lý tài liu phi x lý và
lưu gi cùng vi ni dung ca tài liu gm có: các siêu d liu ng cnh (d liu
v lp, nhn, chuyn tài liu; thi gian nhn; mi quan h ca tài liu ti quá
trình kinh doanh nht định và các tài liu liên quan); các siêu d liu v điu kin
tiếp cn và s dng tài liu (h thng phi ghi nhn lch trình s dng); các siêu
d liu v sp đặt tài liu; các siêu d liu mô t ni dung tài liu; các siêu d
liu v cu trúc tài liu. Như vy, các siêu d liu văn thư các mc độ khác
nhau phi c th hoá ni dung và cu trúc ca tài liu, ng cnh to lp nó.
Trong tiêu chun quc tế ISO 23081 có phân bit các siêu d liu v chính tài
liu, v các nguyên tc và quy tc hot động qun lý, v nhng người tham gia
vào quá trình qun lý và công tác văn thư, v hot động qun lý và các quá trình
ca nó, v quá trình ca công tác văn thư. Nhng yêu cu đối vi các dng siêu
d liu này được xác định xut phát t các yêu cu ca ISO 15489.