
1
Hc vin Công ngh Bưu chính Vin thông
ð Trung Tun
Cơ s d liu ña phương tin
Hà N$i, 2010

2
Mc lc
Mc lc........................................................................................................................... 2
Gii thiu........................................................................................................................ 5
Chương I. Tng quan v cơ s d liu ña phương tin..................................................... 6
1.1 M ñ$u ......................................................................................................... 6
1.2 Khái nim d liu ña phương tin ................................................................. 6
1.1.1. Ki(u d liu và ña phương tin.............................................................. 6
1.1.2. Cơ s d liu và h qu*n tr, cơ s d liu .............................................. 7
1.1.3. Tìm ki1m thông tin tư liu văn b*n ........................................................ 7
1.1.4. Tìm ki1m và ch6 s7 hóa ña phương tin.................................................. 7
1.1.5. Trích ñ:c trưng, th( hin n<i dung và ch6 s7 hóa .................................... 8
1.3. ð:c trưng c?a các ñ7i tư@ng ña phương tin ............................................... 8
1.3.1. SB gia tăng d liu ña phương tin và các tính chCt c?a chúng............... 8
1.3.2. H qu*n tr, cơ s d liu và vai trò qu*n lí d liu ña phương tin......... 9
1.3.3. H th7ng tìm ki1m thông tin ñ7i vi d liu ña phương tin ................ 11
1.3.4. Ti1p cHn tích h@p ñ( tìm ki1m và ch6 s7 hóa ña phương tin ................ 11
1.3.5. Tng quan v h th7ng tìm ki1m và ch6 s7 hóa ña phương tin ............ 12
1.4. CCu trúc lưu tr cơ s d liu ña phương tin............................................. 12
1.4.1. Gii thiu ............................................................................................ 13
1.4.2. Cây kKD............................................................................................... 13
1.4.3. Cây tM phân......................................................................................... 18
1.4.4. Cây tM phân MX.................................................................................. 21
1.4.5. Cây R .................................................................................................. 24
1.4.6. So sánh các cCu trúc d liu ña phương tin......................................... 26
1.5. Ngôn ng thao tác d liu ña phương tin.................................................. 27
1.5.1. Giao din ngưRi dùng .......................................................................... 27
1.5.2. Kh* năng c?a h th7ng tìm ki1m và ch6 s7 hóa và Mng dng ................ 27
1.6. K1t luHn..................................................................................................... 28
Chương 2. Tư liu ña phương tin tương tác.................................................................. 29
2.1 Cơ s d liu ña phương tin tương tác....................................................... 29
2.1.1. Gii thiu ............................................................................................ 29
2.1.2. Ki1n trúc c?a MIRS............................................................................. 29
2.1.3. Các mô hình d liu ............................................................................ 31
2.1.4. Thi1t k1 giao din ngưRi dùng ............................................................. 35
2.2. Mô hình hoá tư liu ña phương tin tương tác IMD.................................... 37
2.2.1. Mô hình hoá tương tác vi các sB kin ................................................ 38
2.2.2. T h@p không gian, thRi gian và các nhân t7........................................ 40
2.2.3. D liu văn b*n ................................................................................... 42
2.2.4. ðU hVa vecto và hình ñ<ng .................................................................. 44
2.2.5. Âm thanh............................................................................................. 50
2.2.6. Hình *nh s7 ......................................................................................... 57
2.2.7. Video s7 .............................................................................................. 64
2.3. Phân lo[i.................................................................................................... 69

3
2.3.1. M<t s7 chu\n....................................................................................... 70
2.3.2. Các ñ:c tính và yêu c$u c?a d liu và Mng dng ña phương tin......... 71
2.4 Mô hình k,ch b*n....................................................................................... 74
2.4.1. K,ch b*n trong IMD ............................................................................ 74
2.4.2. K,ch b*n ña phương tin...................................................................... 75
2.5. Tìm ki1m tư liu ña phương tin tương tác................................................. 77
2.5.1. Tìm tư liu ña phương tin tương tác dBa trên cCu trúc không gian, thRi
gian...................................................................................................................... 78
2.6. K1t luHn..................................................................................................... 81
Chương 3. Thành tBu và xu hưng ................................................................................ 82
3.1 Các thành tBu chính c?a công ngh h qu*n tr, cơ s d liu ña phương tin
................................................................................................................................ 82
3.1.1. Mô hình hoá ........................................................................................ 82
3.1.2. Toàn v_n.............................................................................................. 82
3.1.3. Tìm theo n<i dung ............................................................................... 82
3.2 Các s*n ph\m thương m[i và m`u nghiên cMu............................................ 86
3.2.1. M<t s7 s*n ph\m ................................................................................. 86
3.2.2. Qu*n lý ña phương tin ....................................................................... 86
3.2.3. Các vai trò trong dB án ña phương tin ................................................ 89
3.3. Hưng phát tri(n c?a cơ s d liu ña phương tin..................................... 90
3.3.1. M<t s7 hưng hin t[i và khuynh hưng.............................................. 90
3.3.2. An toàn d liu ña phương tin............................................................ 91
3.3.3. Yêu c$u v t chMc d liu ña phương tin .......................................... 93
3.4. K1t luHn..................................................................................................... 95
Chương 4. Qu*n tr, d liu ña phương tin.................................................................... 96
4.1. Khái nim v qu*n tr, cơ s d liu ña phương tin.................................... 96
4.1.1. D[ng d liu ña phương tin................................................................ 96
4.1.2. Ngôn ng hei d liu ña phương tin................................................... 97
4.1.3. VCn ñ khác......................................................................................... 98
4.2. Ki1n trúc h qu*n tr, cơ s d liu ña phương tin ..................................... 98
4.2.1. Các ki1n trúc v t chMc n<i dung........................................................ 98
4.2.2. Nguyên tfc tB qu*n.............................................................................. 98
4.2.3. Nguyên tfc ñUng ñu........................................................................... 98
4.2.4. Nguyên tfc t chMc hgn h@p ................................................................ 99
4.2.5. M<t s7 nhHn xét................................................................................... 99
4.2.6. T chMc cơ s d liu dBa trên nguyên tfc th7ng nhCt........................ 100
4.3. Các ki thuHt mô hình hóa d liu............................................................ 100
4.3.1. Mô hình quan h................................................................................ 100
4.3.2. Cơ s d liu hưng ñ7i tư@ng .......................................................... 101
4.3.3. Cơ s d liu ña phương tin............................................................. 107
4.4 Các kĩ thuHt ch6 s7 hoá và trku tư@ng hoá.................................................. 108
4.4.1. Gii thiu .......................................................................................... 108
4.4.2. Ch6 s7 hoá cơ s d liu ña phương tin ............................................ 109
4.4.3. Các ch6 s7 hi(n hin........................................................................... 109
4.4.4. Trku tư@ng hoá video ........................................................................ 110
4.4.5. ðU th, chuy(n c*nh............................................................................ 112

4
4.5. Tìm thông tin ña phương tin dBa trên n<i dung....................................... 112
4.5.1. Gii thiu v tìm thông tin ña phương tin......................................... 112
4.5.2. LVc thông tin ..................................................................................... 113
4.5.3. Hei d liu ña phương tin ................................................................ 113
4.5.4. Tìm theo n<i dung, sm dng tk khoá................................................... 114
4.6. Thí d v cơ s d liu ña phương tin..................................................... 114
4.6.1. M<t s7 h th7ng................................................................................. 114
4.6.2. Tìm các ñ7i tư@ng dBa trên hình d[ng................................................ 117
4.6.3. Th( hin hình d[ng ............................................................................ 118
4.6.4. Vic khp các hình ............................................................................ 118
4.6.5. Các liên k1t video ña phương tin...................................................... 118
4.7. Các Mng dng c?a ña phương tin ............................................................ 119
4.7.1. Các hình *nh thô................................................................................ 120
4.7.2. Th( hin *nh ñã nén........................................................................... 122
4.7.3. Xm lí *nh thông qua vic phân ño[n *nh ............................................ 124
4.7.4. Tìm ki1m dBa trên sB tương tB........................................................... 126
4.7.5. Tng quát v cơ s d liu *nh .......................................................... 129
4.7.6. Th( hin cơ s d liu *nh nhR mô hình quan h ............................... 129
4.7.7. Th( hin cơ s d liu *nh trên cây R ................................................ 132
4.7.8. K1t luHn v cơ s d liu *nh............................................................. 134
4.8. NhHn xét v d liu ña phương tin.......................................................... 134
4.8.1. ð*m b*o QoS trong h th7ng truyn thông, t[i máy ch? và máy khách
.......................................................................................................................... 134
4.8.2. M<t s7 vCn ñ khác............................................................................ 135
4.9. K1t luHn................................................................................................... 137
Hưng d`n sm dng tài liu theo chương trình khung................................................... 138
Tài liu tham kh*o ...................................................................................................... 142

5
Gii thiu
Trong nhiu năm, nghiên cMu và phát tri(n ña phương tin là c$n thi1t trong Mng
dng truyn thông và ñ( th( hin thông tin ña phương tin. Ngày càng nhiu d liu s7
ña phương tin ñư@c th( hin dưi d[ng hình *nh, video, âm thanh… ñòi hei các kĩ
thuHt lưu tr , tìm ki1m hiu qu* và m[nh. NgưRi ta có th( so sánh yêu c$u này vi yêu
c$u th( hin d liu kí tB dưi d[ng tính toán ñư@c nh ng năm 70 c?a th1 k6 XX.
Do vHy phát tri(n v qu*n tr, d liu ña phương tin là bình thưRng ñ7i vi các t
chMc. Trưc h1t do nhu c$u thBc t1, ti1p theo là công ngh hin t[i không ñ? kh* năng
gi*i quy1t vCn ñ ñ7i vi d liu ña phương tin. M<t trong nh ng khó khăn là vic ch6
s7 hóa và tìm ki1m d liu ña phương tin.
NgưRi ta thCy c$n bi1t công ngh hin t[i c?a qu*n lí d liu ña phương tin. ð$u
tiên là các ñ:c tính c?a d liu ña phương tin và các khía c[nh v thi1t k1 cho phép h
th7ng cơ s d liu ña phương tin ñáp Mng các yêu c$u v d liu. ð7i vi tkng lo[i d
liu ña phương tin, như văn b*n, hình *nh, âm thanh và video, c$n có kĩ thuHt ch6 s7
hóa riêng, Mng vi ñ:c tính chính c?a d liu thô. Công c tìm ki1m d liu ña phương
tin c$n l< ñư@c câu hei ngưRi dùng, dBa trên mMc ñ< tương tB c?a m`u và d liu ñã
lưu tr . Vic tìm ki1m và ch6 s7 hóa theo n<i dung d liu ña phương tin là quan trVng
và khó khăn, do các khía c[nh rút tk d liu thô thưRng ñư@c th( hin qua vecto nhiu
chiu, ñòi hei nhiu thRi gian xm lí.
Các kĩ thuHt và các cCu trúc d liu có vai trò liên quan ñ1n hiu qu* tìm ki1m d
liu. Cơ s d liu ña phương tin vi truy cHp tk xa, qua m[ng máy tính, theo mô hình
khách/ ch?… sq ph*i xm lí các tình hu7ng liên quan ñ1n truyn d liu, mã hóa d liu.
VHy ki1n trúc máy tính, vic lưu tr ña phương tin, h th7ng ñiu hành, h[ t$ng m[ng
c$n ñư@c quan tâm.
Trong h qu*n tr, cơ s d liu truyn th7ng, hiu năng liên quan ñ1n tính hiu qu*,
theo thRi gian tr* lRi câu hei. Trong h th7ng ña phương tin, hiu qu* cũng quan trVng,
nhưng hiu qu* ñ7i vi tìm ki1m, ñ7i vi ñ7i tư@ng ñã có và phát hin ñ7i tư@ng tim
\n, là có ý nghĩa. NgưRi ta ñ cHp ñiu này do vic tìm ki1m ñó theo so sánh tương tB,
và các d liu cũng không cho phép so sánh khp. Do vHy ñ< ño hiu qu* là c$n thi1t
ñ7i vi h qu*n tr, cơ s d liu ña phương tin. M<t s7 khía c[nh khác, như an toàn d
liu, chu\n… cũng ñáng ñư@c quan tâm.