
L c d ch t “C m nang qu n lý tài li u đi n t ”ượ ị ừ ẩ ả ệ ệ ử
1.1. Khái ni m v tài li u l u tr đi n tệ ề ệ ư ữ ệ ử
M t tài li u là thông tin đ c ghi l i, đ c làm ra hay nh nộ ệ ượ ạ ượ ậ
đ c trong quá trình tri n khai, th c hi n hay hoàn t t m t ho tượ ể ự ệ ấ ộ ạ
đ ng c a cá nhân hay c a c quan, t ch c và bao g m n i dung,ộ ủ ủ ơ ổ ứ ồ ộ
b i c nh và c u trúc đ đ cung c p b ng ch ng v ho t đ ng đó.ố ả ấ ủ ể ấ ằ ứ ề ạ ộ
Quan ni m v b i c nh đ c g n v i môi tr ng c a tài li uệ ề ố ả ượ ắ ớ ườ ủ ệ
đó, ch ng h n nh giai đo n t o l p tài li u, t c là, ch c năng đãẳ ạ ư ạ ạ ậ ệ ứ ứ
t o ra tài li u. đây có ít nh t 3 khía c nh c a khái ni m v b iạ ệ ở ấ ạ ủ ệ ề ố
c nh c a tài li u. Th nh t là nh ng thông tin b i c nh có ch aả ủ ệ ứ ấ ữ ố ả ứ
trong tài li u (ch ký c a quan ch c th a hành). Th hai là m iệ ữ ủ ứ ừ ứ ố
quan h gi a m t tài li u và các tài li u khác trong fond. Và, th baệ ữ ộ ệ ệ ứ
là ho t đ ng mà trong đó tài li u đ c t o ra. Quan ni m v c uạ ộ ệ ượ ạ ệ ề ấ
trúc đ c g n v i câu h i là tài li u đ c ghi l i nh th nào, nóượ ắ ớ ỏ ệ ượ ạ ư ế
bao g m vi c s d ng các ký hi u, cách s p x p (layout), th lo iồ ệ ử ụ ệ ắ ế ể ạ
(format), ph ng ti n v t lý v.v... Đ i v i tài li u đi n t thì vi cươ ệ ậ ố ớ ệ ệ ử ệ
phân đ nh rõ ràng gi a c u trúc v t lý và c u trúc lô gic là đi u c nị ữ ấ ậ ấ ề ầ
thi t.ế
Khái ni m v tài li u nh v y đ c dùng không h l thu cệ ề ệ ư ậ ượ ề ệ ộ
vào th lo i (format) hay ph ng ti n ghi tin.ể ạ ươ ệ
Các h th ng l u tr tài li u hay h th ng qu n lý tài li uệ ố ư ữ ệ ệ ố ả ệ
đ c thi t l p đ b o qu n và tra tìm tài li u theo m t cách thíchượ ế ậ ể ả ả ệ ộ
h p. H th ng l u tr tài li u là m t h th ng thông tin đ c xâyợ ệ ố ư ữ ệ ộ ệ ố ượ
d ng nh m m c đích b o qu n và tra c u tài li u. H th ng đ cự ằ ụ ả ả ứ ệ ệ ố ượ
t ch c đ ki m soát nh ng ch c năng c th trong vi c t o l p,ổ ứ ể ể ữ ứ ụ ể ệ ạ ậ
b o qu n và ti p c n tra c u s d ng nh m b o v tính xác th c vàả ả ế ậ ứ ử ụ ằ ả ệ ự
đ tin c y c a tài li u. Nh v y, h th ng là công c chính đ b oộ ậ ủ ệ ư ậ ệ ố ụ ể ả
qu n tài li u và làm cho chúng luôn s n sàng cho vi c khai thác sả ệ ẵ ệ ử
d ng. Tuy nhiên, h th ng l u gi tài li u đ ng th i cũng là m tụ ệ ố ư ữ ệ ồ ờ ộ
ph n c a b i c nh c a m t tài li u. H th ng s cung c p nh ngầ ủ ố ả ủ ộ ệ ệ ố ẽ ấ ữ
thông tin b i c nh có vai trò thi t y u đ “ch ng minh” tính xácố ả ế ế ể ứ
th c c a tài li u và cũng có th cung c p nh ng thông tin b i c nhự ủ ệ ể ấ ữ ố ả
c n thi t cho vi c hi u đúng v n i dung c a nó.ầ ế ệ ể ề ộ ủ
Trong khi các khái ni m “tài li u” và “h th ng l u tr tàiệ ệ ệ ố ư ữ
li u” áp d ng chung cho tài li u b t kỳ d ng nào thì m t s nétệ ụ ệ ở ấ ạ ộ ố
đ c s c c a tài li u đi n t có nh h ng t i các chi n l c vàặ ắ ủ ệ ệ ử ả ưở ớ ế ượ
ph ng pháp h u hi u trong qu n lý và b o qu n lâu dài tài li uươ ữ ệ ả ả ả ệ
TS. Nguy n L Nhung 0912581997 ễ ệ
1

L c d ch t “C m nang qu n lý tài li u đi n t ”ượ ị ừ ẩ ả ệ ệ ử
đi n t . Nh ng đ c đi m đó giúp cho vi c phân bi t m t tài li uệ ử ữ ặ ể ệ ệ ộ ệ
đi n t v i m t tài li u trên n n gi y truy n th ng, đ ng th i, đòiệ ử ớ ộ ệ ề ấ ề ố ồ ờ
h i ph i áp d ng nh ng ph ng pháp m i trong vi c th c thi m tỏ ả ụ ữ ươ ớ ệ ự ộ
s ch c năng qu n lý văn th và l u tr c b n nh t. Vì v y, c nố ứ ả ư ư ữ ơ ả ấ ậ ầ
ph i hi u rõ các đ c đi m đó đ có th nh n di n tài li u đi n tả ể ặ ể ể ể ậ ệ ệ ệ ử
cũng nh qu n lý chúng theo đúng nh ng nguyên t c l u tr tài li uư ả ữ ắ ư ữ ệ
chu n m c. ẩ ự
M t tài li u đi n t là m t tài li u thích h p cho vi c ch nhộ ệ ệ ử ộ ệ ợ ệ ỉ
s a, truy n t i hay x lý b ng m t máy tính k thu t s . Nh ngử ề ả ử ằ ộ ỹ ậ ố ữ
đ c đi m d i đây s phân bi t tài li u đi n t v i nh ng tài li uặ ể ướ ẽ ệ ệ ệ ử ớ ữ ệ
khác d ng truy n th ng:ở ạ ề ố
- Vi c ghi tin và s d ng các ký hi u.ệ ử ụ ệ N i dung c a m t tàiộ ủ ộ
li u truy n th ng đ c ghi trên m t ph ng ti n v t lý (gi y...) vàệ ề ố ượ ộ ươ ệ ậ ấ
b ng cách s d ng các ký hi u (alphabet, ch s , v.v...) mà conằ ử ụ ệ ữ ố
ng i có th ti p c n (đ c) tr c ti p đ c. Tuy nhiên, n i dungườ ể ế ậ ọ ự ế ượ ộ
c a m t tài li u đi n t , đ c ghi theo cách th c và trên m tủ ộ ệ ệ ử ượ ứ ộ
ph ng ti n v t lý (v i m t đ cao trên m t thi t b t tính hayươ ệ ậ ớ ậ ộ ộ ế ị ừ
quang h c) mà con ng i không th ti p c n (đ c) tr c ti p đ cọ ườ ể ế ậ ọ ự ế ượ
và đ c bi u di n b i các ký hi u (ký t nh phân) b t bu c ph iượ ể ễ ở ệ ự ị ắ ộ ả
đ c gi i mã. Nói chung, khi m t tài li u đi n t đ c làm ra vàượ ả ộ ệ ệ ử ượ
l u l i, nó đ c chuy n giao và chuy n đ i t m t d ng th cư ạ ượ ể ể ổ ừ ộ ạ ứ
(format) ng i đ c sang đ c b ng máy. Phiên b n đ c b ng máy đóườ ọ ọ ằ ả ọ ằ
chính là ph n thông tin đ c ghi l i c u thành tài li u.ầ ượ ạ ấ ệ
Đ tra c u s d ng tài li u, vi c chuy n giao và chuy n đ iể ứ ử ụ ệ ệ ể ể ổ
s đi theo chi u ng c l i. Do con ng i không th đ c đ c tàiẽ ề ượ ạ ườ ể ọ ượ
li u đi n t nh nó v n có nên đi u quy t đ nh là s chuy n đ i trệ ệ ử ư ố ề ế ị ự ể ổ ở
l i d ng th c ng i đ c đ c ph i theo đúng các ch tiêu k thu tạ ạ ứ ườ ọ ượ ả ỉ ỹ ậ
nh chúng đã đ c s d ng đ chuy n đ i ban đ u. Đ đ t đ cư ượ ử ụ ể ể ổ ầ ể ạ ượ
đi u đó đòi h i ng i ta không ch ph i b o qu n an toàn tài li uề ỏ ườ ỉ ả ả ả ệ
mà còn ph i có các ph ng ti n c n thi t (ph n c ng và ph nả ươ ệ ầ ế ầ ứ ầ
m m) đ đ c tài li u và th c hi n vi c chuy n đ i m t cách chínhề ể ọ ệ ự ệ ệ ể ổ ộ
xác cùng v i nh ng ho t đ ng ki m soát nh m b o đ m r ng cáiớ ữ ạ ộ ể ằ ả ả ằ
mà ta nhìn th y chính là cái đã đ c ghi l i.ấ ượ ạ
- S liên k t gi a n i dung và ph ng ti n mang tin.ự ế ữ ộ ươ ệ N i dungộ
c a m t tài li u truy n th ng đ c ghi l i trên m t v t mang tinủ ộ ệ ề ố ượ ạ ộ ậ
(gi y) và không th tách r i đ c kh i ph ng ti n đó. N i dungấ ể ờ ượ ỏ ươ ệ ộ
c a m t tài li u đi n t cũng đ c ghi l i trên m t ph ng ti nủ ộ ệ ệ ử ượ ạ ộ ươ ệ
TS. Nguy n L Nhung 0912581997 ễ ệ
2

L c d ch t “C m nang qu n lý tài li u đi n t ”ượ ị ừ ẩ ả ệ ệ ử
mang tin, nh ng đôi khi n i dung đó bu c ph i tách bi t kh iư ộ ộ ả ệ ỏ
ph ng ti n ban đ u (nguyên g c) và chuy n sang các ph ng ti nươ ệ ầ ố ể ươ ệ
l u tr khác (và th ng là d ng khác) khi đ c ti p c n tra c uư ữ ườ ở ạ ượ ế ậ ứ
ti p ho c do s l c h u v công ngh bu c ng i ta ph i làm nhế ặ ự ạ ậ ề ệ ộ ườ ả ư
v y. Không nh các tài li u truy n th ng, m t tài li u đi n tậ ư ệ ề ố ộ ệ ệ ử
không h g n k t vĩnh vi n v i m t ph ng ti n hay thi t b l uề ắ ế ễ ớ ộ ươ ệ ế ị ư
tr c th nào và do đó, kh năng x y ra h h ng hay sai l ch giaữ ụ ể ả ả ư ỏ ệ
tăng đáng k . Đi u đó đã đ t ra nh ng v n đ b sung trong vi cể ề ặ ữ ấ ề ổ ệ
b o đ m duy trì tính xác th c và đ tin c y c a tài li u.ả ả ự ộ ậ ủ ệ
- Nh ng đ c đi m v c u trúc lôgic và c u trúc th c th (v tữ ặ ể ề ấ ấ ự ể ậ
lý). C u trúc c a m t tài li u truy n th ng hi n di n rõ ràng tr cấ ủ ộ ệ ề ố ể ệ ướ
m t ng i s d ng. C u trúc là m t b ph n không th tách r iắ ườ ử ụ ấ ộ ộ ậ ể ờ
c a m t văn b n b t kỳ trên n n gi y và là m t trong nh ng tiêuủ ộ ả ấ ề ấ ộ ữ
chu n đ đánh giá tính xác th c c a tài li u. C u trúc th c th c aẩ ể ự ủ ệ ấ ự ể ủ
m t tài li u đi n t không h hi n di n và th ng là r t xa l đ iộ ệ ệ ử ề ệ ệ ườ ấ ạ ố
v i ng i s d ng thông th ng. T t nhiên, cái mà ng i làm ra tàiớ ườ ử ụ ườ ấ ườ
li u t o l p trên màn hình c a mình là m t k t qu c a c u trúcệ ạ ậ ủ ộ ế ả ủ ấ
nh ng nó còn ph thu c vào h th ng máy tính (ph n c ng và ph nư ụ ộ ệ ố ầ ứ ầ
m m) và vào các ch tr ng còn l i trong thi t b l u tr (đĩa c ng,ề ỗ ố ạ ế ị ư ữ ứ
đĩa m m). M i l n tài li u đ c chuy n sang m t thi t b khác thìề ỗ ầ ệ ượ ể ộ ế ị
c u trúc v t lý có th thay đ i. Ng i s d ng s luôn ph i c nấ ậ ể ổ ườ ử ụ ẽ ả ầ
đ n m t h th ng máy tính có đ kh năng truy nh p, tra tìm tàiế ộ ệ ố ủ ả ậ
li u và do v y, ph i có đ kh năng đ “đ c” c u trúc v t lý.ệ ậ ả ủ ả ể ọ ấ ậ
Nh ng, ngo i tr đi u đó thì c u trúc v t lý s không có ý nghĩa vàư ạ ừ ề ấ ậ ẽ
không đáng quan tâm đ i v i ng i s d ng. Nói tóm l i, tài li uố ớ ườ ử ụ ạ ệ
không h ph thu c vào b t kỳ s ghi tin v t lý c th nào.ề ụ ộ ấ ự ậ ụ ể
Khi mà c u trúc v t lý c a m t tài li u đi n t thay đ i vàấ ậ ủ ộ ệ ệ ử ổ
không h hi n h u thì nó không th có cùng m t vai trò nh trongề ệ ữ ể ộ ư
tr ng h p tài li u truy n th ng. Vì v y, c n ph i có m t c u trúcườ ợ ệ ề ố ậ ầ ả ộ ấ
lô gic đ có th nh n di n ho c phân đ nh ranh gi i t ng tài li u vàể ể ậ ệ ặ ị ớ ừ ệ
trình di n các ph n t c u trúc n i t i (nh các tr ng trong m t sễ ầ ử ấ ộ ạ ư ườ ộ ơ
đ hay b ng bi u, l , đo n v.v...) Nói chung, c u trúc lô gic nhồ ả ể ề ạ ấ ư
v y c a m t tài li u đi n t th ng là c u trúc mà ng i t o l pậ ủ ộ ệ ệ ử ườ ấ ườ ạ ậ
tài li u t o ra trên màn hình c a mình. Đ có th đ c coi là hoànệ ạ ủ ể ể ượ
ch nh và xác th c thì tài li u, b ng cách nào đó, ph i gi l i đ cỉ ự ệ ằ ả ữ ạ ượ
c u trúc đó và h th ng máy tính ph i tái t o đ c c u trúc đó khiấ ệ ố ả ạ ượ ấ
chuy n đ i tài li u tr l i d ng con ng i có th đ c đ c. C uể ổ ệ ở ạ ạ ườ ể ọ ượ ấ
trúc lô gic c a m t tài li u đi n t đ c l u l i d i d ng các kýủ ộ ệ ệ ử ượ ư ạ ướ ạ
TS. Nguy n L Nhung 0912581997 ễ ệ
3

L c d ch t “C m nang qu n lý tài li u đi n t ”ượ ị ừ ẩ ả ệ ệ ử
hi u hay d li u (ký t th p phân). Vì v y, các đ c tính k thu tệ ữ ệ ự ậ ậ ặ ỹ ậ
c a ph ng pháp mã hoá đó ph i luôn s n sàng cho b t kỳ l n truyủ ươ ả ẵ ấ ầ
nh p tài li u nào.ậ ệ
- Metadata: Metadata đ c đ nh nghĩa là d li u v d li u.ượ ị ữ ệ ề ữ ệ
Đó là m t khái ni m quan tr ng đ i v i tài li u đi n t , b i l ,ộ ệ ọ ố ớ ệ ệ ử ở ẽ
metadata v b i c nh và c u trúc c a m t tài li u, là y u t c nề ố ả ấ ủ ộ ệ ế ố ầ
thi t đ làm cho tài li u có th hi u đ c và s d ng đ c. Nh đãế ể ệ ể ể ượ ử ụ ượ ư
đ c trình bày trong ph n khái ni m v tài li u, thông tin v b iượ ầ ệ ề ệ ề ố
c nh là m t trong nh ng ph n t c n thi t trong vi c cung c pả ộ ữ ầ ử ầ ế ệ ấ
b ng ch ng v ho t đ ng mà tài li u ph n ánh. Tài li u đi n tằ ứ ề ạ ộ ệ ả ệ ệ ử
thi u nh ng y u t nh t đ nh c a tài li u truy n th ng - nh ngế ữ ế ố ấ ị ủ ệ ề ố ữ
thành t góp ph n thi t l p, xác đ nh m i quan h gi a m t tài li uố ầ ế ậ ị ố ệ ữ ộ ệ
và b i c nh hành chính và b i c nh ch c năng c a tài li u đó. Nhố ả ố ả ứ ủ ệ ư
v y, tài li u đi n t ph thu c r t l n không ch vào vi c b i c nhậ ệ ệ ử ụ ộ ấ ớ ỉ ệ ố ả
hành chính có đ c ghi l i đ y đ hay không mà còn vào vi cượ ạ ầ ủ ệ
metadata mô t v vi c thông tin đ c ghi l i nh th nào.ả ề ệ ượ ạ ư ế
Metadata mô t v nh ng m i quan h hành chính và quan h tàiả ề ư ố ệ ệ
li u gi a các đ n v riêng bi t trong ph m vi m t h th ng l u giệ ữ ơ ị ệ ạ ộ ệ ố ư ữ
tài li u c th trong su t vòng đ i c a tài li u đó, s là m t ph nệ ụ ể ố ờ ủ ệ ẽ ộ ầ
c a b i c nh c a tài li u và nó ph i đ c b o toàn.ủ ố ả ủ ệ ả ượ ả
- Xác đ nh, nh n di n tài li uị ậ ệ ệ . M t tài li u đi n t không thộ ệ ệ ử ể
nh n di n đ c b ng cách xem nó nh là m t th c th v t lý màậ ệ ượ ằ ư ộ ự ể ậ
thay vào đó nó t o nên m t th c th lô gic, v a là k t qu v a làạ ộ ự ể ừ ế ả ừ
b ng ch ng v m t ho t đ ng hay tác nghi p công vi c. Trongằ ứ ề ộ ạ ộ ệ ệ
nhi u tr ng h p, tài li u đi n t có m t b n song song trên tài li uề ườ ợ ệ ệ ử ộ ả ệ
gi y t ng ng nh th tín, h p đ ng, biên b n ghi nh , b n đăngấ ươ ứ ư ư ợ ồ ả ớ ả
ký v.v... Trong nh ng tr ng h p khác, các b n song song v i tàiữ ườ ợ ả ớ
li u truy n th ng t ng ng không hi n di n m t cách rõ ràng (nhệ ề ố ươ ứ ể ệ ộ ư
trong tr ng h p c a m t s lo i c s d li u, hypertext, b ngườ ợ ủ ộ ố ạ ơ ở ữ ệ ả
tính đi n t , các h th ng đa ph ng ti n). Trong tr ng h p đó,ệ ử ệ ố ươ ệ ườ ợ
vi c nh n di n tài li u (và đôi khi còn c ngu n g c xu t x c aệ ậ ệ ệ ả ồ ố ấ ứ ủ
chúng) s còn g p nh ng khó khăn, thách th c l n h n.ẽ ặ ữ ứ ớ ơ
- B o qu n tài li u qua th i gianả ả ệ ờ . B o qu n tài li u truy nả ả ệ ề
th ng có nghĩa là gi gìn các đ n v v t lý (nh các t gi y,ố ữ ơ ị ậ ư ờ ấ
t p/quy n tài li u...) trong nh ng đi u ki n t t nh t có th nh mậ ể ệ ữ ề ệ ố ấ ể ằ
tránh nh ng h h i và s a ch a nh ng h h i n u có. B o qu n tàiữ ư ạ ử ữ ữ ư ạ ế ả ả
li u đi n t là m t v n đ t ng đ i khác. Các đ n v v t lýệ ệ ử ộ ấ ề ươ ố ơ ị ậ
TS. Nguy n L Nhung 0912581997 ễ ệ
4

L c d ch t “C m nang qu n lý tài li u đi n t ”ượ ị ừ ẩ ả ệ ệ ử
(ph ng ti n l u tr ) ph i đ c gi gìn trong nh ng đi u ki n t tươ ệ ư ữ ả ượ ữ ữ ề ệ ố
nh t có th đ c. Nh ng cho dù đi u ki n b o qu n có t t đ n đâuấ ể ượ ư ề ệ ả ả ố ế
thì nh ng thông tin đi n t v n s “b m t d n” sau m t th i gianữ ệ ử ẫ ẽ ị ấ ầ ộ ờ
t ng đ i ng n (t 5 - 30 năm tuỳ thu c vào lo i v t mang tin).ươ ố ắ ừ ộ ạ ậ
H n n a, đa s các h th ng máy tính đ u s tr nên l c h u trongơ ữ ố ệ ố ề ẽ ở ạ ậ
m t th i gian còn ng n h n. Đi u đó có nghĩa là thông tin mà các hộ ờ ắ ơ ề ệ
th ng máy tính t o ra s không th khai thác, s d ng đ c b ngố ạ ẽ ể ử ụ ượ ằ
các h th ng máy tính th h k ti p. Vì v y, đ b o qu n an toàn,ệ ố ế ệ ế ế ậ ể ả ả
tài li u đi n t ph i đ c th ng xuyên chuy n đ i/di trú sang cácệ ệ ử ả ượ ườ ể ổ
n n công ngh m i (sao chép sang các thi t b b o qu n m i ho cề ệ ớ ế ị ả ả ớ ặ
chuy n đ i sang m t d ng phù h p v i các h th ng máy tính m i).ể ổ ộ ạ ợ ớ ệ ố ớ
Ph n này đã minh ho nh ng đ c tính chung nh t c a tài li uầ ạ ữ ặ ấ ủ ệ
đi n t đ phân bi t tài li u đi n t v i nh ng tài li u trên n nệ ử ể ệ ệ ệ ử ớ ữ ệ ề
gi y truy n th ng. Tuy nhiên, chính các môi tr ng r t đa d ngấ ề ố ườ ấ ạ
trong đó tài li u đi n t đ c s n sinh đã t o ra nh ng lo i tài li uệ ệ ử ượ ả ạ ữ ạ ệ
đi n t khác nhau và nh v y, đòi h i ph i có nh ng ph ng phápệ ử ư ậ ỏ ả ữ ươ
qu n lý văn th và l u tr khác nhau. Còn nhi u vi c quan tr ngả ư ư ữ ề ệ ọ
c n ph i làm đ xác đ nh các môi tr ng, mà trong đó tài li u đi nầ ả ể ị ườ ệ ệ
t đ c t o l p, cũng nh trong vi c xác đ nh các d ng hay lo i tàiử ượ ạ ậ ư ệ ị ạ ạ
li u nh v y. ệ ư ậ
TS. Nguy n L Nhung 0912581997 ễ ệ
5

