ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Trần Hoài Nam

CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN

YÊU CẦU VÀ CÁC VẤN ĐỀ

LUẬN VĂN THẠC SĨ Hà Nội – 2004

2

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Trần Hoài Nam

CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN YÊU CẦU VÀ CÁC VẤN ĐỀ

Chuyên ngành : Công nghệ thông tin Mã số : 1.01.10

LUẬN VĂN THẠC SĨ Người hướng dẫn khoa học: PGS.TS. Vũ Đức Thi

Hà Nội – 2004

3

1.2

Mục lục BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT .........................................................4 LỜI CẢM ƠN ..................................................................................................................5 MỞ ĐẦU..........................................................................................................................7 CHƯƠNG 1 ...................................................................................................................10 GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN ............................10 1.1 Các kiểu truyền thông và multimedia .............................................................11 1.1.1. Cơ sở dữ liệu và các DBMS ....................................................................12 1.1.2. Truy tìm thông tin tài liệu văn bản ..........................................................12 1.1.3. Truy xuất và chỉ số hoá multimedia.........................................................13 1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá .............................13 Sự cần thiết đối với MIRS...............................................................................13 1.2.1. Sự phát triển về dữ liệu multimedia và các đặc trưng của nó..................14 1.2.2. Các DBMS và vai trò của chúng trong việc xử lý dữ liệu multimedia....15 1.2.3. Hệ thống IR và vai trò của nó trong việc truy xuất multimedia ..............18 1.2.4. Cách tiếp cận tích hợp việc truy xuất và chỉ số hoá thông tin multimedia

19

1.3 Tổng quan về MIRS ........................................................................................19 1.4 Các ứng dụng nói chung và khả năng mong đợi của MIRS...........................20 CHƯƠNG 2 ...................................................................................................................24 CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (Multimedia Database) ................................24 2.1 Kiến trúc cho việc tổ chức nội dung................................................................25 2.4.1 Nguyên lý tự trị ........................................................................................25 2.4.2 Nguyên lý đồng nhất................................................................................26 2.4.3 Nguyên lý lai ghép ...................................................................................27 2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất. ..........................30 2.3 Cấu trúc tóm tắt media ....................................................................................32 2.4.1 Dữ liệu ảnh như là một tóm tắt media. ....................................................33 2.4.2 Dữ liệu video như là một tóm tắt media. .................................................34 2.4.3 Định nghĩa về một CSDL Multimedia đơn giản ......................................36 2.4.4 Định nghĩa về một CSDL Multimedia có cấu trúc ..................................37 2.4 Ngôn ngữ truy vấn khai thác dư liệu multimedia............................................39 Truy vấn SMDSs (mô tả đồng nhất) ........................................................40 2.4.1 Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo. ......................43 2.4.2 2.4.3 Chỉ số hoá SMDS với chỉ số đảo. ............................................................46 CHƯƠNG 3 ...................................................................................................................52 HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯONG TIỆN – YÊU CẦU VÀ CÁC VẤN ĐỀ...................................................................................................................................52 3.1 Mục đích của MDBMS ...................................................................................52

4

3.2 Các yêu cầu của một MDBMS........................................................................55 3.2.1 Khả năng quản trị lưu trữ lớn...................................................................57 3.2.2 Hỗ trợ truy vấn và khai thácdữ liệu. ........................................................58 3.2.3 Tích hợp các phương tiện, tổng hợp và thể hiện......................................59 3.2.4 Giao diện và tương tác. ............................................................................59 3.2.5 Hiệu suất. .................................................................................................60 3.3 Các vấn đề của MDBMS.................................................................................60 3.3.1 Mô hình hoá dữ liệu MULTIMEDIA ......................................................60 Lưu trữ đối tượng MULTIMEDIA ..........................................................62 3.3.2 3.3.3 Tích hợp multimedia, thể hiện và chất lượng của dịch vụ (QoS)............63 3.3.4 Chỉ số hoá multimedia .............................................................................64 3.3.5 Hỗ trợ truy vấn multimedia, khai thác và duyệt qua................................65 3.3.6 Quản trị CSDL multimedia phân tán .......................................................66 Sự hỗ trợ của hệ thống .............................................................................67 3.3.7 CHƯƠNG 4 ...................................................................................................................69 XÂY DỰNG HỆ THỐNG MUA BÁN HÀNG QUA MẠNG......................................69 4.2.1. Giới thiệu .....................................................................................................69 4.2.2. Ứng dụng CSDL đa phương tiện vào hệ thống bán hàng qua mạng...........70 4.2.1. Xây dựng kho dữ liệu hình ảnh 2D và 3D ...............................................71 4.2.2. Xây dựng cơ chế truy vấn đối với kho dữ liệu hình ảnh .........................71 4.2.3. Hệ thống bán hàng qua mạng ......................................................................73 4.3.1. Mô hình hệ thống .....................................................................................73 4.3.2. Các chức năng cơ bản của hệ thống.........................................................75 4.3.3. Các công cụ phát triển hệ thống...............................................................76 4.3.4. Quy trình thực hiện giao dịch của hệ thống.............................................77 4.3.5. Cài đặt hệ thống .......................................................................................78 4.4. Giải pháp tích hợp các hệ thống khác .............................................................80 4.4.1. Hệ thống quản lý và cấp phát chứng chỉ số (CA) ....................................80 4.4.2. Hệ thống thanh toán trực tuyến (VASC Payment) ..................................81 4.5. Một số giao diện chính của hệ thống...............................................................83 KẾT LUẬN ....................................................................................................................86 TÀI LIỆU THAM KHẢO..............................................................................................87

BẢNG THUẬT NGỮ VÀ CÁC CHỮ VIẾT TẮT

5

STT Ký hiệu viết tắt Giải thích

Information Retrival(IR)

1 Web browser 2 CSDL 3 DBMS 4 MDBMS 5 Video frame 6 RDBMS 7 Multimedia 8 MIRS 9 Metadata 10 Media 11 SMDS 12 13 Multimedia Information Trình duyệt Web Cơ sở dữ liệu Hệ quản trị cơ sở dữ liệu Hệ quản trị cơ sở dữ liệu đa phương tiện Khung hình video Hệ quản trị cơ sở dữ liệu quan hệ Đa phương tiện Hệ thống truy vấn thông tin đa phương tiện Siêu dữ liệu Phương tiện Hệ thống cơ sở dữ liệu đa phương tiện có cấu trúc Truy xuất thông tin Hệ thống truy xuất thông tin đa phương tiện

Retrieval System (MIRS)

LỜI CẢM ƠN

6

Tôi xin bầy tỏ lòng kính trọng và biết ơn sâu sắc tới PGS.TS Vũ Đức Thi, người thầy,

người đồng nghiệp đã trực tiếp hướng dẫn, cho tôi những định hướng và những ý kiến

rất quý báu về cơ sở dữ liệu đa phương tiện. Tôi cũng xin chân thành cám ơn các đồng

nghiệp của tôi tại phòng Các hệ thống quản trị dữ liệu – Viện Công nghệ thông tin đã

giúp đỡ tôi rất nhiều trong quá trình công tác để tôi có thể hoàn thành bản luận văn này

một cách tốt đẹp

Xin chân thành cám ơn các bạn bè của tôi, trong nước cũng như ngoài nước đã giúp đỡ

tôi rất nhiều trong quá trình tìm tòi và sưu tầm tài liệu.

Cuối cùng xin châm thành cám ơn các thành viên trong gia đình đã động viên và tạo

mọi điều kiện thuận lợi để tôi có được kết quả như ngày hôm nay.

Hà nội ngày 20/06/2004

Học viên

Trần Hoài Nam

7

MỞ ĐẦU

Công nghệ multimedia liên quan tới việc mô tả sự kết hợp các dạng thức thông tin

khác nhau (văn bản, dữ liệu, hình ảnh, âm thanh, video) dưới dạng tín hiệu số. Có thể

nêu ra đây một số ứng dụng multimedia như :

• E-learning.

• Hội thảo Video (Video Conferencing).

• Thư viện điện tử (Elibrary).

• Hiện tại ảo (Vitual Reality).

Các công nghệ truyền dùng để thao tác, truyền phát, điều khiển các dữ liệu multimedia

đã và đang được nghiên cứu một cách rất sôi động.

Các hệ thống multimedia cần có một hệ thống phân phối nhằm mục đích thu thập các

đối tượng multimedia và đưa chúng đến người dùng, một trong số các phương tiện đầu

tiên được dùng dến là đĩa từ và đĩa quang. Ngày nay, Internet cũng như các giao thức

khác như TCP/IP, NetBIOS, các mạng Lan đang trở thành các phương tiện để truyền

bá dữ liệu multimedia . Khả năng mô tả phong phú cũng như khả năng đồ họa của các

web browser cùng với các tính năng đang được tiếp tục tăng cường như hoạt họa, âm

thanh và Video khiến các web browser đang trở thành một phương tiện mới để mang

lại các dữ liệu multimedia cho người dùng[5]

Các công nghệ chủ yêu liên quan đến multimedia bao gồm:

• Kỹ thuật nén.

• Video Servers.

• Các kỹ thuật về mạng (internet, tokenring, ethernet, ATM …vv).

• Các công nghệ truyền dữ liệu.

• Các công nghệ về cáp truyền dẫn.

• Công nghệ xác thực.

• Các công nghệ về CSDL.

8

Một CSDL là tập hợp của các dữ liệu có liên quan đến nhau. Một hệ quản trị CSDL

(DBMS) là hệ thống phần mềm trợ giúp cho các quá trình khai báo, xây dựng và thao

tác với CSDL phục vụ cho các ứng dụng khác nhau. CSDL multimedia bao gồm thêm

các kiểu dữ liệu khác như:

• Văn bản.

• Hình ảnh.

• Âm thanh.

• Video.

• Hoạt hình.

Các kiểu dữ liệu khác này đòi hỏi phải có các phương thức đặc biệt nhằm mục đích tối

ưu hóa cho việc lưu trữ, truy cập, chỉ số hoá và khai thác. Một MDBMS phải cung cấp

một môi trường thích hợp để quản lý và sử dụng CSDL multimedia.

Một MDBMS cần phải đảm bảo các tính năng cơ bản của một DBMS, ngoài ra nó còn

phải có các tính năng khác như:

• Tích hợp các phương tiện khác (Media Intergration).

• Khả năng sắp xếp và mô tả thông tin.

• Khả năng khai thác dữ liệu..

• Khả năng lưu trữ lớn.

• Giao diện multimedia.

• Hỗ trợ truy vấn tương tác multimedia.

Thông thường các đối tượng riêng lẻ của một hình ảnh hoặc một video frame sẽ có một

vài mối liên hệ bộ phận với các đối tượng khác. Các mối liên hệ này đưa đến một số

các ràng buộc trong quá trình tìm kiếm các đối tượng trong CSDL multimedia. Căn cứ

trên cơ sở này việc triển khai các ứng dụng multimedia trên nền các hệ quản trị CSDL

hướng đối tượng sẽ thuận lợi hơn so với các RDMBS hiện thời[1].

9

Mục tiêu chính của bản luận văn này nhằm nghiên cứu và tìm hiểu một số vấn đền cơ

bản của một MDBMS:

• Tổng quan về cơ sử dữ liệu đa phương tiện

• Các yêu cầu của một MDBMS cũng như kiến trúc, thiết kế và truy vấn đối với

một MDBMS.

Luận văn này được bố cục thành 5 phần chính:

• Chương I: Giới thiệu chung về CSDL multimedia.

• Chương II: Cơ sở dữ liệu multimedia.

• Chương III: Hệ quản trị cơ sở dữ liệu multimedia – Yêu cầu và các vấn đề

• Chương IV: Xây dựng hệ thống bán hàng qua mạng.

• Kết luận

10

CHƯƠNG 1

GIỚI THIỆU CHUNG VỀ CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN

Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục và các dữ liệu không

liên tục. Các dữ liệu liên tục bao gồm các dữ liệu âm thanh, video thay đổi theo thời

gian. Các dữ liệu không liên tục là các dữ liệu không phục thuộc vào thời gian, các loại

dữ liệu đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có định dạng),

hình ảnh tĩnh và các đối tượng đồ họa. Các kiểu dữ liệu thông thường của một CSDL

multimedia bao gồm:

• Dữ liệu văn bản (có hoặc không có định dạng).

• Đồ họa: là các bản vẽ, minh họa được mã hóa như các tệp postscript.

• Hình ảnh: là các hình ảnh được mã hóa sử dụng các dạng thức chuẩn như là

JPEG hoặc MPEG.

• Các hoạt hình.

• Âm thanh.

• Video.

Các đặc tính chung của dữ liệu multimedia bao gồm:

• Thiếu cấu trúc: Các dữ liệu multimedia có khuynh hướng phi cấu trúc vì vậy

các tác nghiệp quản trị dữ liệu chuẩn như chỉ số hoá, tìm kiếm nội dung, truy

vấn dữ liệu thường là không áp dụng được.

• Tính tạm thời: Một vài kiểu dữ liệu multimedia như là Video, âm thanh và hoạt

hình đều phụ thuộc vào yếu tố thời gian liên quan mật thiết đến việc lưu trữ,

thao tác và mô tả chúng.

• Có dung lượng lớn: các dữ liệu video và âm thanh thường đòi hỏi các thiết bị

lưu trữ lớn.

11

• Các ứng dụng hỗ trợ: các dữ liệu phi chuần có thể đòi hỏi các quy trình xử lý

phức tạp như việc sử dụng các thuật toán nén dữ liệu đối với các ứng dụng

CSDL multimedia.

1.1 Các kiểu truyền thông và multimedia

Truyền thông đề cập đến các kiểu thông tin hoặc các kiểu biểu diễn thông tin, ví dụ

như dữ liệu vần chữ cái, hình ảnh, âm thanh, truyền hình. Có nhiều cách phân lớp

truyền thông. Những cách phân loại chung được dựa trên những dạng vật lý và những

mối quan hệ truyền thông với thời gian. Ta phân lớp truyền thông dựa trên việc có hay

không có chiều thời gian. Ngầm định này hướng tới hai lớp truyền thông tĩnh và động

(hoặc tính liên tục về thời gian).

Truyền thông tĩnh không bao hàm yếu tố thời gian, các nội dung và nghĩa của chúng

không phụ thuộc vào thời gian được biểu diễn. Truyền thông tĩnh bao gồm các dữ liệu

vần chữ cái, các đồ thị và các ảnh tĩnh.

Truyền thông động bao hàm yếu tố thời gian, các nghĩa và tính chính xác của chúng

phụ thuộc vào loại được biểu diễn. Truyền thông động gồm các hoạt hình, âm thanh và

video. Các truyền thông này có bản chất khoảng thống nhất hoặc tốc độ riêng của

chúng. Chẳng hạn, để truyền cảm giác chuyển động nhịp nhàng video phải thực hiện

25 hình mỗi giây (hoặc 30 hình phụ thuộc vào hệ thống video đang sử dụng). Tương

tự, khi chúng ta phát lại một lời nhắn hoặc đoạn nhạc đã được ghi âm, chỉ có một loại

thể hiện là thích hợp. Việc phát lại ở chế độ nhanh hơn hoặc chậm hơn sẽ làm méo

nghĩa hoặc chất lượng âm thanh. Vì những truyền thông này phải được phát liên tục ở

tốc độ cố định mà chúng thường được gọi là truyền thông liên tục. Chúng cũng còn

được gọi truyền thông đẳng thời vì mối quan hệ cố định giữa mỗi đơn vị truyền thông

và thời gian.

Truyền thông đề cập đến một bộ sưu tập các kiểu truyền thông đã sử dụng cùng nhau.

Điều đó có nghĩa là ít nhất có kiểu truyền thông dữ liệu là không theo ký tự chữ (nghĩa

12

là ít nhất có một kiểu truyền thông là ảnh, âm thanh hoặc truyền hình). Ở đây,

“multimedia” được sử dụng như một tính từ vì vậy chúng ta sẽ nói một cách đặc trưng

là thông tin multimedia, dữ liệu multimedia, hệ thống multimedia, liên lạc multimedia,

ứng dụng multimedia,... Dữ liệu multimedia chính là sự biểu diễn về các loại truyền

thông multimedia mà máy tính có thể đọc được. Thông tin multimedia là thông tin đã

truyền bằng các kiểu truyền thông multimedia. Đôi khi, thông tin multimedia và dữ

liệu multimedia được sử dụng có thể thay cho nhau.

Đôi khi chúng ta sử dụng thuật ngữ multimedia hay truyền thông và đối tượng nhằm

chỉ một thực thể tự trị nào đó trong một MIRS mà có thể được truy vấn, truy xuất và

được trình diễn. Thuật ngữ “đối tượng” có thể là chưa xác định thích hợp theo nghĩa

hướng đối tượng (0bject Oriented). Ngữ cảnh sẽ làm nó rõ ràng hơn dù cho nó được sử

dụng trong một ý nghĩa chung hoặc trong cách tiếp cận hướng đối tượng[10].

1.1.1. Cơ sở dữ liệu và các DBMS

Trong thư viện, CSDL và các DBMS đôi khi được sử dụng thay thế nhau. ở đây CSDL

hiểu như một bộ sưu tập hoặc một kho dữ liệu hoặc nhiều mục truyền thông. Chúng ta

sử dụng các DBMS như một hệ thống thực thể để quản lý CSDL.

1.1.2. Truy tìm thông tin tài liệu văn bản

Hệ thống truy tìm thông tin tự động hoá (IR) được phát triển để giúp quản lý một khối

lượng với các tài liệu khoa học đã được tạo lập từ những năm 1940. Chức năng chính

của một hệ thống IR là lưu trữ và quản lý một số rất lớn các tài liệu văn bản theo cách

sao cho các tài liệu thích hợp với việc sử dụng các truy vấn để truy tìm nhanh. Chú ý

rằng việc truy tìm thông tin tự động của các từ cấu tạo bằng chữ đầu của những từ khác

là nhằm vào việc truy tìm các tài liệu văn bản, mặc dù thuật ngữ đầy đủ là truy tìm

thông tin có thể hiểu là truy tìm một loại thông tin nào đó.

13

1.1.3. Truy xuất và chỉ số hoá multimedia

Các DBMS truy xuất các khoản mục dựa trên số liệu có cấu trúc khi sử dụng kết nối

chính xác. IR cũng được gọi là truy xuất dựa trên văn bản. Việc truy xuất dựa vào nội

dung đề cập đến việc truy xuất dựa trên những nét đặc trưng truyền thống hiện nay như

là màu sắc, hình thù thay cho lời giải thích văn bản về khoản mục truyền thông đó.

Việc truy xuất dựa trên nội dung là chuẩn dựa trên sự đồng dạng thay vì một kết nối

chính xác giữa một truy vấn và một tập các khoản mục dữ liệu.

MIRS đề cập đến một hệ thống cơ sở cung cấp việc truy xuất thông tin multimedia khi

sử dụng một tổ hợp DBMS, IR và các kỹ thuật truy xuất dựa trên nội dung. Trong một

MIRS, một vài vấn đề như phiên bản và điều khiển an toàn có thể không thực hiện

được đầy đủ. Một MIRS đủ bản lĩnh ra đời được gọi là MDBMS.

1.1.4. Trích rút đặc trưng, biểu diễn nội dung và chỉ số hoá

Trong các MIRS, một trong những vấn đề quan trọng nhất là trích rút đặc trưng hoặc

biểu diễn nội dung (cái gì là những nét đặc trưng hoặc nội dung chính trong một khoản

mục multimedia). Trích rút đặc trưng có thể là quá trình tự động hay bán tự động.

Trong một vài tài liệu truy xuất dựa vào nội dung, trích rút đặc trưng cũng được gọi là

chỉ số hoá. Sau đây, chúng ta theo quy ước chung. Khi mà thuật ngữ “chỉ số” được sử

dụng như một danh từ, điều đó có nghĩa là đề cập tới cấu trúc dữ liệu hoặc việc tổ chức

những đặc trưng đã được trích rút để nghiên cứu có hiệu quả và truy xuất.

1.2 Sự cần thiết đối với MIRS

Sự cần thiết đối với MIRS có thể được giải thích bằng ba yếu tố sau:

Trước hết, dữ liệu multimedia đang được dùng ngày càng nhiều và đang được chú ý.

Để sử dụng thông tin đó (chứa trong dữ liệu đó), đòi hỏi có một hệ thống truy xuất và

chỉ số hoá hiệu quả và có hiệu lực. Thứ hai, dữ liệu multimedia có những đặc tính và

những yêu cầu đặc biệt mà lại khác nhau đáng kể từ số liệu bảng chữ cái. Bởi vậy,

14

DBMS truyền thống không thích hợp cho việc xử lý dữ liệu multimedia. Thứ ba, mặc

dù các kỹ thuật IR có thể giúp chúng ta trong việc truy xuất multimedia nhưng chỉ một

mình chúng thì chưa đủ để xử lý dữ liệu multimedia một cách có hiệu quả[10].

1.2.1. Sự phát triển về dữ liệu multimedia và các đặc trưng của nó

Hiện nay chúng ta đang tập trung khai phá thông tin multimedia. Ví dụ, một số lượng

lớn hình ảnh và video đang được tạo lập và lưu trữ trên internet. Nhiều hoạ sỹ và bức

tranh trong nhiều kiểu in ra là đang được chuyển sang dạng kỹ thuật số cho dễ xử lý,

phân phối và bảo tồn. Các bức tranh từ các bản tin trên vô tuyến và trên báo cũng được

chuyển sang dạng kỹ thuật số để dễ bảo trì và bảo tồn. Một số lớn các hình ảnh y tế

đang được tập trung hàng ngày và các vệ tinh đang được sản xuất nhiều hơn. Khuynh

hướng này có ý định tiếp tục nâng cấp việc lưu trữ và các công nghệ kỹ thuật số. Việc

lập ra một chỗ chứa đối với lượng lớn thông tin multimedia ngày càng tăng như vậy

còn được ít sử dụng. Điều này sẽ không thể sử dụng đầy đủ thông tin multimedia này

trừ khi nó được tổ chức để truy xuất nhanh theo yêu cầu.

Không chỉ là đang tăng về số lượng dữ liệu đang được lưu trữ, mà còn cả các kiểu dữ

liệu và các đặc trưng của chúng là khác nhau từ dữ liệu ký tự chữ.

Có những đặc trưng chính của dữ liệu multimedia như sau:

• Dữ liệu multimedia, nhất là âm thanh và video, là dữ liệu có số lượng lớn. Ví

dụ, một video 10’ trung bình chiếm 1,5 GB chưa nén.

• Âm thanh và video có chiều thời gian và chúng khi biểu diễn sẽ chiếm tỷ lệ cố

định để hoạt động có hiệu quả như đã yêu cầu

• Âm thanh số, ảnh và video được trình diễn theo một loạt giá trị đơn cá thể và

thiếu cấu trúc ngữ nghĩa rõ ràng cho máy tính để tự động hoá nhận biết nội dung

• Nhiều ứng dụng multimedia đòi hỏi việc biểu diễn đồng thời các kiểu truyền

thông đa năng theo cách kết hợp không gian và thời gian

15

• Ý nghĩa của dữ liệu multimedia đôi khi rất mờ và có tính chủ quan. Ví dụ, mỗi

người có cách giải thích cùng 1 bức tranh theo cách khác nhau hoàn toàn riêng

• Dữ liệu multimedia là giàu về thông tin, nhiều tham số được đòi hỏi mới trình

diễn đủ nội dung của nó.

1.2.2. Các DBMS và vai trò của chúng trong việc xử lý dữ liệu

multimedia

Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng rãi đối với dữ liệu

có cấu trúc. Các DBMS trội nhất là các hệ quản trị dữ liệu quan hệ (RDBMS). Trong

RDBMS, thông tin dược tổ chức thành bảng hoặc các quan hệ. Các dòng của bảng

tương ứng với các khoản mục thông tin hoặc các record, trong khi đó các cột tương

ứng với các thuộc tính. Ngôn ngữ truy vấn có cấu trúc (SQL) được sử dụng để tạo ra

các bảng như thế và để chèn và truy xuất thông tin từ các bảng đó[11].

Chúng ta dùng một ví dụ đơn giản dể minh hoạ cách sử dụng SQL để tạo lập một bảng

và chèn, truy xuất thông tin từ đó. Giả sử chúng ta muốn lập một bảng chứa các bản

Create table STUDENT(

stu# integer,

name char(20),

address char(100));

ghi về sinh viên bao gồm số hiệu sinh viên, tên và địa chỉ. Ta có lệnh sau:

Khi chúng ta muốn chèn các bản ghi về sinh viên vào bảng, chúng ta sử dụng lệnh chèn

Insert into STUDENT values(10,"Lew, Tom","2 Main St.,

Churchill, australia");

SQL như sau:

Lệnh trên sẽ chèn một dòng vào bảng STuDeNT

16

Thông tin trong bảng được truy xuất khi sử dụng câu lệnh SELECT của SQL. Ví dụ,

Select Name

From STUDENT

Where Stu#=32

nếu muốn truy xuất tên của sinh viên với sinh viên số 32, ta sử dụng lệnh truy vấn sau:

Các thuộc tính trong RDBMS đã cố định kiểu và độ rộng. Trong ví dụ trên, thuộc tính

Stu# là kiểu integer với độ dài cố định là 32 bit. Như vậy, RDBMS là thích hợp để xử

lý dữ liệu số và dòng ký tự ngắn.

Để hỗ trợ cho các trường có giá trị lớn trong RDBMS, một khái niệm được gọi là đối

tượng rộng hoặc nhị phân (BLOB) sẽ được giới thiệu. Một BLOB là một xâu bit lớn

các độ dài biến. Ví dụ, nếu ta muốn lưu bức tranh của sinh viên trong bản ghi ở bảng

Create table STUDENT(

Stu# integer,

Name char(20),

address char(100),

Picture BLOB);

STUDENT trên, chúng ta có thể tạo ra một bảng khi sử dụng lệnh sau:

Các BLOB bình thường chỉ là xâu bit và hoạt động bằng việc so sánh chứ không mang

chúng ra ngoài. Đó là vì RDBMS không biết nội dung hoặc ngữ nghĩa của một BLOB.

Tất cả BLOB hiểu như một khối dữ liệu.

Một dạng khác của các DBMS là hệ thống quản trị CSDL hướng đối tượng

(OODBMS). Các OODBMS kết nối các khả năng của cơ sơ dữ liệu (như lưu trữ và

tìm kiếm) và các đặc trưng hướng đối tượng (tóm lược, sự thừa kế, tính đồng nhất đối

tượng). Một phương pháp tiếp cận chung là kết nối các đặc điểm hướng đối tượng với

cơ sở dữ liệu quan hệ. Hệ thống đã được kết nối thì được gọi là một hệ thống cơ sở dữ

17

liệu đối tượng quan hệ. Trong một hệ thống như vậy, các đối tượng được xác định một

cách thích hợp trong hướng đối tượng. Trong đó mỗi đối tượng chứa các đặc tính hoặc

thuộc tính và các phương pháp hoặc các hàm được sử dụng để chế tác ra các đặc tính

Create type IMAGE(

Private

Size integer,

Resolution integer,

Content float[ ],

publlic

...

);

khác. Ví dụ, chúng ta có thể định nghĩa một loại ảnh sau:

Sau đó khai báo các tranh bởi kiểu IMAGE có thể được sử dụng trong một bảng

Create table STUDENT(

Stu# integer,

Name char(20),

Address char(100)

Picture IMAGE);

như sau:

Điểm khác biệt chính giữa BLOB và các đối tượng là đối tượng thì được định rõ một

cách thích đáng, bao gồm các đặc tính và cho phép chúng có tác dụng, trong khi đó thì

BLOB thì không.

Các khái niệm về các BLOB và các đối tượng là một bước gần với xử lý dữ liệu

multimedia . Nhưng các BLOB được sử dụng chỉ để lưu dữ liệu có khối lượng lớn.

Trong khi các đối tượng chứa vài thuộc tính đơn giản, nhiều chức năng hơn nên được

18

phát triển để xử lý việc truy xuất multimedia dựa vào nội dung. Một vài các khả năng

được yêu cầu như sau:

• Các công cụ, tự động hoá hoặc bán tự động trích rút các nội dung và các đặc

trưng trong dữ liệu multimedia ;

• Các cấu trúc chỉ số hoá đa chiều, để điều khiển các vector multimedia

• Các độ đo tương đồng, nhằm truy xuất multimedia thay vì kết nối một cách

chính xác

• Lưu trữ các hệ thống phụ, thiết kế lại nhằm đáp ứng các yêu cầu của băng tần

cao với cỡ lớn, thoả mãn những đòi hỏi theo kiểu thời gian thực

• Giao diện sử dụng, được thiết kế cho phép các câu hỏi đa dạng trong nhiều kiểu

truyền thông đa dạng và cung cấp các trình diễn multimedia

1.2.3. Hệ thống IR và vai trò của nó trong việc truy xuất multimedia

Ngoài các DBMS, có loại hệ thống quản lý thông tin khác tập trung vào việc truy xuất

tài liệu văn bản. Loại hệ thống này được gọi là hệ thống truy xuất thông tin (IR).

Kỹ nghệ IR khá quan trọng trong hệ thống quản lý thông tin multimedia vì hai lý do

chính. Một là chúng tồn tại một lượng lớn các văn bản trong nhiều dạng tổ chức, ví dụ

như các thư viện. Văn bản là một nguồn thông tin quan trọng trong bất kỳ một tổ chức

nào. Để sử dụng các thông tin đã được lưu trữ trong các tài liệu này, cần có một hệ

thống IR hiệu quả. Hai là, văn bản có thể được sử dụng để chú giải các truyền thông

khác như âm thanh, hình ảnh, video. Thông thường thì các kỹ nghệ IR có thể dược sử

dụng cho việc phục hồi thông tin đa truyền thông. Tuy nhiên, việc sử dụng chỉ để xử lý

dữ liệu truyền thông phải tuân theo các giới hạn sau:

• Việc chú giải nhìn chung phải làm bằng tay và tiêu tốn thời gian

• Văn bản chú giải chưa đầy đủ và còn mang tính chủ quan

• Các kỹ nghệ IR không thể điều khiển các câu hỏi từ văn bản khác (như âm

thanh và ảnh).

19

• Một vài đặc tính của multimedia như bố cục hình ảnh và các dạng đối tượng là

khác nhau, nếu không thì cũng chỉ là cùng mô tả một văn bản.

1.2.4. Cách tiếp cận tích hợp việc truy xuất và chỉ số hoá thông tin

multimedia

Từ thảo luận trên chúng ta có thể thấy rằng các DBMS và IR không thể đáp ứng đầy đủ

các yêu cầu về chỉ số hoá và truy xuất multimedia, vì vậy cần có các công nghệ mới

để vận dụng những đặc trưng riêng của multimedia... Tuy vậy, vẫn nhận thấy rằng các

DBMS và IR vẫn đóng vai trò quan trọng trong các MDBMS. Các phần của dữ liệu

multimedia như ngày và tác giả tạo lập của tài liệu multimedia là có cấu trúc. Dữ liệu

có kết cấu này có thể được điều khiển bằng các kỹ nghệ DBMS. Văn bản chú giải vẫn

là phương pháp hiệu lực trong việc ghi lại nội dung.

Tóm lại, một cách tiếp cận tích hợp tổ hợp các DBMS với IR, và các kỹ thuật đặc tả để

xử lý dữ liệu multimedia được đòi hỏi để phát triển MIRS hiệu quả và có hiệu lực.

1.3 Tổng quan về MIRS

Các mục thông tin trong cơ sơ dữ liệu đã được xử lý trước để rút ra các đặc trưng và

nội dung ngữ nghĩa, được chỉ rõ dựa trên các đặc trưng và ngữ nghĩa này. Trong suốt

quá trình phục hồi thông tin, một câu hỏi của người sử dụng được xử lý và đặc điểm

chính được rút ra. Các đặc trưng này sau đó được chuẩn bị cùng với các đặc trưng hoặc

chủ thị của mỗi mục thông tin trong cơ sở dữ liệu. Các đặc trưng của mục thông tin là

hầu hết đều tương đồng để các câu hỏi được gọi ra trước người sử dụng

20

Hình 1.1 : Một mẫu truy xuất thông tin tổng quát

Có rất nhiều ấn bản đuợc viết theo mẫu trên trên. Ví dụ, Các mục thông tin có thể

được kết nối bất kỳ với các loại truyền thông. Làm thế nào để rút ra được những đặc

trưng từ các tin tức truyền thông này? Phải lưu và xây dựng được các đặc trưng này

như thế nào để việc truy tìm có hiệu quả? Phải đo độ “ tương đồng” như thế nào giữa

hai tin tức truyền thông? Cần phải làm gì để giao diện sử dụng có thể đảm nhận được

những câu hỏi phức tạp, rối rắm, linh hoạt? Phải so sánh như như thế nào về việc biểu

diễn các quá trình truy tìm giữa các MIRS khác nhau? Làm thế nào để đáp ứng các

yêu cầu tạm thời trong suốt quá trình truyền và biểu diễn dữ liệu multimedia?

1.4 Các ứng dụng nói chung và khả năng mong đợi của MIRS

MIRS được cho rằng hiệu quả và linh hoạt. Khả năng của nó được mimh hoạ trên các

dạng câu hỏi mà chúng có thể hỗ trợ. Các kiểu câu hỏi mong đợi có dạng sau:

• Câu hỏi dựa trên metadata: Đây là câu hỏi chỉ ra những thuộc tính thông thường

của các mục cơ sở dữ liệu như tên tác giả và ngày tạo lập. Một Ví dụ là câu hỏi

21

theo yêu cầu trên video (VOD) có thể là “liệt kê tên các phim được sản xuất

vào năm 1997”. Loại này được vận dụng bằng DBMS

• Các câu hỏi dựa trên chú giải: Đây là câu hỏi chỉ ra các mô tả dạng văn bản

trong nội dung của cơ sở dữ liệu. Các câu hỏi đều ở trong từ khoá hoặc tronng

phần văn bản miễn phí và việc truy tìm dựa trên sự tưong đồng giữa câu hỏi và

phần chú giải. Ví dụ, câu hỏi có thể là “Chỉ ra phân đoạn quay video khi diễn

viên nam đang đạp xe đạp”. Loại câu hỏi giả định này được chú giải thích đáng

và xử lý bởi kỹ nghệ IR

• Câu hỏi dựa trên mẫu dữ liệu hoặc tính năng: Đây là câu hỏi chỉ ra thông tin

dạng thống kê, như: âm thanh, mầu, độ mịn. Một ví dụ: “Chỉ ra ảnh video với

sự phân bổ màu như THIS” Để trả lời dang câu hỏi nay, thông tin liệt kê về mục

cơ sở dữ liệu nên được sưu tập trước và lưu trữ

Câu hỏi ví dụ

Đây là câu hỏi trong các đối tượng đa truyền thông như hinh ảnh, phác thảo, đoạn âm

thanh. Ví dụ:” chỉ ra 1 bộ phim và các cảnh tương tự như Bức tranh này”. Loại câu

hỏi này có thể bị làm rối lên bởi mối liên hệ về không gian và thời gian giữa các đối

tượng

Các câu hỏi ứng dụng riêng

Các câu hỏi ứng dụng riêng có rất nhiều loại. Ví dụ, câu hỏi dựa trên thông tin chi tiêt

và cụ thể như kích cỡ 1 đối tượng và quá trình già hoá của 1 người.

Các MIRS được mong mỏi có thể đưa ra nhiều loại câu hỏi khác nhau, do đó có ứng

dụng rộng rãi, bao gồm:

• Thuốc. Một bác sĩ đưa ra ảnh chụp sóng siêu âm mới và muốn tìm lại ảnh với

mức độ có thể so sánh được của sự phình tâm thất trái từ một ảnh chụp siêu âm

cơ sở

22

• Bảo mật. Một cảnh sát đưa ra hệ thống với một bức tranh vẽ mặt người và muốn

phục hồi lại những hình ảnh khác vào hồ sơ hiện thời của những người giống

với bức tranh này từ cơ sở thông tin bảo mật

• Giáo dục. Một sinh viên quét chụp một tranh động vật và muốn truy tìm tất cả

các thông tin (bao gồm âm thanh, hình ảnh, văn bản mô tả). Tiếp theo, một sinh

viên khác thêm âm thanh cho con vật và muốn khôi phục lại bức tranh và thông

tin mô tả loại động vật này

• Báo chí. Một báo cáo viên viết một bài báo về một người và muốn truy tìm bức

tranh của người đó và các thông tin tổng hợp đã xuất hiện trên các báo và tivi

20 năm trước

• Giải trí. Một quan sát viên muốn truy tìm một đoạn băng tương tự với những gì

mà anh ta đã xem trên một cơ sơ dữ liệu video lớn hơn

• Đăng ký nhãn hiệu. Một cán bộ gia công một nhãn hiệu đăng ký nào đó muốn

quyết đinh xem đã có một cái nhãn hiệu nào trước đó giống như vậy đã được

đăng ký chưa. Để làm điều này, anh ta cần một cơ sở dữ liệu về nhãn hiệu để so

sánh các nhãn hiệu giống nhau nhất hiện có để làm ra một nhãn hiệu hoàn toàn

mới

Cuối cùng, các MIRS sẽ tập trung vào chính thông tin thay thế các loại truyền thông

và việc miêu tả chúng có thể được sắp xếp hoặc dịch ra từ loại truyền thông này đến

loại truyền thông khác. Ví dụ, một video tài liệu cần phải được sử dụng video, hình

ảnh, văn từ, âm thanh, lời nói và những thứ tương tự như vậy. Vì vậy phương tiện dò

tìm phải kết nối các câu hỏi (dữ liệu) với các mục cơ sở dữ liệu.

Các loại truyền thông khác nhau cần các kỹ nghệ phục hồi và cách biểu thị khác nhau.

Các kỹ nghệ khác nhau được sử dụng cho từng loại truyền thông khác nhau. Người sử

dụng có thể thấy thích những thông tin xác đáng mà bất chấp sự khác nhau về các

loại truyền thông. Vấn đề là làm thế nào để tích hợp được các loại kỹ nghệ khác nhau

để tuy tìm thông tin cần tìm trong việc trả lời các câu hỏi của người sử dụng. Có rất

23

nhiều các ấn phẩm được viết để giải quyết vấn đề này, như ghi rõ câu hỏi và xử lý,

khoản phụ cấp thêm tương xứng, ghép các miêu tả đối tượng.

Để việc truy tìm có hiệu quả, cần có một cấu trúc các khoản mục hợp lý. Bởi vì các

vector đặc tính đều đa dạng về kích cỡ và việc truy tìm các khoản mục trong các

MIRS dựa trên sự tương động thay cho việc kết nối chính xác, cấu trúc mục lục được

sử dung trong các DBMS không thích hợp với các MIRS.

Khuynh hướng của các yêu cầu bao gồm hệ số trễ và độ giật, gọi là chất lượng dịch

vụ (QoS), cần có trong việc truyền và mô tả dữ liệu truyền thông.

Trong các DBMS, tiến hành chính liên quan đến hiệu quả (thời gian trả lời câu hỏi).

Nó rất quan trọng bởi kích cỡ lớn của multimedia. Ngoài ra, hiệu quả truy tìm cũng rất

quan trọng (khả năng truy tìm các mục thích hợp và khả năng loại bỏ các mục không

cần đến). Bởi các MIRS truy tìm các mục chọn dựa trên cơ sở đo sự tương đồng, sử

dụng luật tương ứng thay thế cho kết nối chính xác. Trừ khi nó trở nên quá khó đối với

việc thiết kế các độ đo tương đồng thì cần xác định một cách chính xác bằng óc phán

đoán của con người, giống như một vài khoản mục được hệ thống xác định là thích hợp

nhưng người dùng lại cho là không thich hợp và một số mục thích hợp lại không được

truy xuất.

24

CHƯƠNG 2

CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN (Multimedia Database)

Khi thiết kế một hệ thống CSDL multimedia mô tả các loại dữ liệu multimedia khác

nhau, chúng ta bắt buộc phải đối diện với một số câu hỏi quan trọng được đặt ra về

cách thức tổ chức hệ trống như:

• Việc tổ chức về mặt nội dung đối với dữ liệu của các loại dữ liệu

multimedia.

• Việc lưu trữ vật lý của các dữ liệu này trên các thiết bị lưu trữ như thế

nào.

Để trả lời cho các câu hỏi này, trước tiên chúng ta xem xét tới khía cạnh tổ chức nội

dung

25

2.1 Kiến trúc cho việc tổ chức nội dung

Ở đây chúng ta xem xét tới 3 kiến trúc áp dụng cho việc tổ chức nội dung của một hệ

thống CSDL multimedia

2.4.1 Nguyên lý tự trị

Nguyên lý này đề cập tới việc chúng ta nhóm tất cả các dữ liệu ảnh, dữ liệu video và tất

cả các dữ liệu văn bản và chỉ số hóa chúng theo nguyên tắc tối đa hóa hiệu suất của tất

cả các loại truy nhập đối với các loại dữ liệu mà chúng ta dự định. Nguyên lý này đảm

bảo rằng với mỗi loại dữ liệu (ảnh, video, văn bản) chúng đều được tổ chức với một

cách thức đặc trưng phù hợp với mỗi loại dữ liệu này[18].

Hình 2.1: Mô tả nguyên lý tự trị

26

2.4.2 Nguyên lý đồng nhất

Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là nguyên lý đồng nhất,

nguyên lý này giúp chúng ta tìm được một cấu trúc tóm tắt chung cho tất cả các loại dữ

liệu. Cấu trúc này có thể được dùng trong việc chỉ số hóa tất cả các loại dữ liệu qua đó

tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng để truy cập tới các đối tượng

khác nhau. Hay nói một cách khác là chúng ta có thể trình bầy tất cả các đối tượng

khác nhau( ảnh, video, âm thanh, văn bản) trong một cấu trúc dữ liệu duy nhất và qua

đó phát triển các thuật toán để truy vấn cấu trúc dữ liệu này[18].

Hình 2.2: Mô tả nguyên lý đồng nhất

27

2.4.3 Nguyên lý lai ghép

Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý đã trình bầy ở trên.

Kết quả của nguyên lý này là một kiểu dữ liệu nào đó sử dụng chỉ số (index) riêng của

chúng, trong khi đó các kiểu dữ liệu khác sẽ sử dụng một chỉ số (Index) “thống nhất”.

Loại dữ liệu nào sử dụng kiểu chỉ số nào sẽ phụ thuộc vào các đặc tính khác nhau sẽ

được nói đến ở phần sau[18].

Hình 2.3: Mô tả nguyên lý lai ghép

Cả ba loại nguyên lý trên đều có những ưu điểm và nhược điểm riêng của mình. Kiến

trúc dựa trên nguyên lý tự trị đòi hỏi việc tạo ra các thuật toán và cấu trúc dữ liệu của

mỗi kiểu dữ liệu, ngoài ra nó cũng đòi hỏi các kỹ thuật hỗ trợ cho việc liên kết chéo

giữa các cấu trúc dữ liệu khác nhau này. Các công việc này đòi hỏi tính phức tạp cao

và đòi hỏi một lượng thời gian lớn cho việc phát triển. Bên cạnh các nhược điểm trên,

việc xây dựng các cấu trúc được đặc biệt hóa tối ưu cho việc truy xuất dến từng loại dữ

28

liệu khác nhau, CSDL multimedia được tổ chức theo nguyên lý này thường đem lại

hiệu quả cao trong việc xử lý tìm kiếm. Đối với các ngân hàng dữ liệu đã được xây

dựng sẵn, nơi mà các thuật toán và các cấu trúc dữ liệu đã được sử dụng có hiệu quả thì

việc áp dụng nguyên lý tự trị là mô hình kiến trúc thích hợp nhất. Các kỹ thuật hướng

đối tượng chính là công cụ đắc lực nhất hỗ trợ cho việc triển khai theo nguyên lý này

bằng cách xem mỗi loại dữ liệu nguồn là một đối tượng mà các phương thức của nó có

thể truy cập được từ một CSDL multimedia tổng thể.

Trái ngược với nguyên lý tự trị, nguyên lý đồng nhất đòi hỏi chúng ta phải tìm ra được

một cấu trúc dữ liệu chung mà có thể dùng để lưu trữ các thông tin về nội dung của

hình ảnh, video, văn bản, âm thanh và các loại dữ liệu khác. Điều này đòi hỏi chúng ta

phải phân tích nội dung của mỗi kiểu dữ liệu và tóm tắt được phần chung của chúng,

qua đó xây dựng một bộ chỉ số dựa trên các yếu tố chung đã được xác định này. Ưu

điểm nổi bật của nguyên lý đồng nhất là dễ dàng triển khai và các thuật toán thường

được thực hiện rất nhanh. Nhược điểm chính của nguyên lý này là các sự chú giải phải

được tạo ra theo một cách riêng nào đó, thường là được tạo ra một cách thủ công hoặc

là tự động, việc tạo ra các chú giải một cách thủ công thường đỏi hòi nhiều về mặt thời

gian cũng như chi phí, mặt khác trong quá trình tạo các chú giải này thường sẩy ra sự

mất mát thông tin nếu ngôn ngữ dùng để chú giải không trình bầy hết được các khía

cạnh của nội dung. Có thể đưa ra đây một số ví dụ như ngôn ngữ chú giải nội dung của

hình ảnh có thể làm mất các thông tin về bề mặt của một điểm ảnh (pixel) hoặc một

nhóm điểm ảnh. Tương tự như vậy ngôn ngữ chú giải nội dung của âm thanh có thể

làm mất các thông tin về biên độ, tần số của tín hiệu tại một thời điểm nào đó.

Nguyên lý lai tạo tập hợp được các ưu điểm của cả hai nguyên lý nêu trên, đồng thời

giảm thiểu được một số các nhược điểm của chúng. Giả sử chúng ta muốn tạo ra một

CSDL multimedia bao gồm các kiểu dữ liệu M1,…….,Mn, chúng ta bắt đầu bằng việc

phân chia tập này thành 2 phần:

29

• Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có sẵn, tồn tại sẵn

các chỉ số và các thuật toán để thao tác với chỉ số. Với việc bố trí này chúng ta

đã tận dụng được lợi thế của các chỉ số và mã nguồn sẵn có.

• Phần 2: bao gồm các dữ liệu không được kế thừa từ bất kỳ nguồn nào và do đó

không có sẵn các chỉ số của mình (điều này đồng nghĩa với việc là cũng không

có bất kỳ thuật toán nào để có thể thao tác với tập chỉ số). Trong trường hợp này

việc tiếp cận xây dựng hệ thống theo nguyên lý đồng nhất là cách thức thích hợp

nhất ngay cả khi là cách tiếp cận này có thể nẩy sinh ra việc gây mất mát các

thông tin vật lý chi tiết.

Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến hành việc xây dựng các

thuật toán cần thiết để kết hợp các nguồn dữ liệu khác nhau lại bằng việc sử dụng các

tập chỉ sổ riêng của chúng. Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài

nguyên có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện thêm bởi vì các

tệp chỉ số riêng có sẵn đối với mỗi loại dữ liệu đã được tận dụng. Giả sử, một người

dùng muốn đưa ra một câu hỏi “ Hãy tìm tất cả các hình ảnh và các đọan video mà

trong đó ông chủ của dối tượng A có mặt và trao đổi với đối tượng B”. Câu hỏi này

bao gồm một sự kết hợp giữa các tệp chỉ số của các loại dữ liệu khác nhau, chúng sẽ

truy cập đến CSDL hình ảnh (thông qua tệp chỉ số của dữ liệu hình ảnh), đến CSDL âm

thanh (thông qua tệp chỉ số âm thanh) và đến một CSDL quan hệ (thông qua tệp chỉ số

SELECT Name, Image, Audio

From Employee E, Image I, Audio A

Where E.Name= “A” AND

I contains E.boss and

A contains E.boss AND

A CONTAINS B

quan hệ), câu hỏi này có thể được diễn tả như sau:

30

2.2 Tổ chức dữ liệu multimedia dựa trên nguyên lý đồng nhất.

Xét ví dụ sau:

• Bức ảnh photo1.gif có sự xuất hiện của đối tượng A, đối tượng B và một đối

tượng chưa được xác định được chụp tại thành phố C thuộc nước D vào ngày

10/01/1990.

• Đoạn video video1.mpg có hình ảnh của đối tượng A đưa cho đối tượng B một

chiếc vali (trong frames 50-100). Đoạn video này thu được từ sự theo dõi nhà

của đối tượng B tại thành phố E thuộc nước F vào tháng 1- 1991.

• Văn bản B.txt có chứa các thông tin chi tiết về dối tượng B được thu thập từ dữ

liệu của cơ quan an ninh.

Bản thân mỗi đối tượng trên cũng đã nói lên phần nào nội dung của từng đối tượng cụ

thể (hình ảnh, video, văn bản), tuy nhiên thông tin đưa ra ở đây chỉ nói lên nội dung về

mặt ngữ nghĩa hơn là đề cập đến các tính chất cụ thể của mỗi loại đối tượng, các tính

chất loại này được gọi là các đặc trưng bậc thấp (lower-level). Một cách tiếp cận hiệu

quả nhất đối với CSDL multimedia và đã được sử dụng rộng rãi trong thực tế là sử

dụng các đối tượng được phát biểu ở trên như là siêu dữ liệu (metadata).

Theo trên, giả sử chúng ta có một tập các đối tượng media o1,…..,on chúng ta kết hợp

một vài metadata md(o1) với mỗi đối tượng media o1 (định dạng chính xác của

metadata này sẽ được trình bầy sau), tương tự như vậy các metadata kết hợp với các

đối tượng media 01,….0n tương ứng sẽ là md(o1),……,md(on), Chúng ta sẽ tiến hành

việc chỉ số hóa các metadata này với một cách thức nhằm cung cấp các phương thức

triển khai hiệu quả đối với các yêu cầu truy cập từ phía người dùng.

Có thể rõ ràng thấy rằng, sự thành công của phương pháp này phụ thuộc cơ bản vào

việc chúng ta đảm bảo được rằng với mỗi đối tượng media 0i thì metadata tương ứng

của nó md(oi) là cô đọng và phản ánh đúng chỉ những gì mà người dùng yêu cầu[18].

Với một số lượng tối thiểu các metadata được dùng rõ ràng là chúng ta sẽ dễ dàng hơn

trong việc chỉ số hóa cũng như là thực hiện các thao tác khai thác dữ liệu, tuy nhiên

31

bên cạnh đó nếu số lượng metadata sử dụng ít thì có thể người sử dụng sẽ phải mất thời

gian hơn trong việc thiết lập các câu hỏi của mình. Có thể lấy trường hợp sau làm ví

dụ:

• Người dùng: hãy tìm cho tôi tất cả các đoạn video hoặc ảnh chụp mà đối tượng

A và đối tượng B (xem phần trên) trao đổi với nhau một gói hành lý.

• Hệ thống: Không tìm được (mặc dù hệ thống đã có đoạn video ghi lại đối tượng

A và đối tượng B trao đổi với nhau một chiếc vali nhưng hệ thống vẫn trả lời là

không tìm thấy vì nó không hiểu rằng một chiếc vali cũng có thể coi là một gói

hành lý).

• Người dùng: hãy tìm cho tôi tất cả các đoạn video hoặc ảnh chụp mà đối tượng

A và đối tượng B (xem phần trên) trao đổi với nhau một vật gì đó.

• Hệ thống: tìm thấy. frames 50-100 của đoạn video video1.mpg thỏa mãn yêu

cầu của bạn.

Mặc dù có một vài nhược điểm như sử dụng metadata không biểu diễn hết được các

khía cạnh của đối tượng media trong CSDL nhưng cách tiếp cận dựa trên nguyên lý

đồng nhất có một số ưu điểm nổi trội sau:

• Metadata thường được lưu trữ dưới dạng các cấu trúc có liên quan đến tính chất

quan hệ hoặc hướng đối tượng và có thể truy vấn một cách dễ dàng thông qua

việc mở rộng các ngôn ngữ (chẳng hạn như SQL).

• Việc viết mã để thao tác với metadata thường là dễ dàng.

• Việc viết các chương trình để tạo ra metadata là đơn giản đối với các lập trình

viên có năng lực

Chúng ta đã xem xét đến nội dung của dữ liệu media dưới các dạng khác nhau, một câu

hỏi đặt ra ở đây là đâu là phần chung nhất của các loại dữ liệu này? Mục đích của

chúng ta là tìm kiếm một cấu trúc chung nhất cho tất cả các loại dữ liệu mà qua nó ta

có thể thể hiện được nội dung của các loại dữ liệu đó. Tóm tắt media là một cấu trúc

32

toán học cho phép diễn đạt nội dung của các media này, sự tóm tắt media có thể được

triển khai thông qua một cấu trúc dữ liệu duy nhất.

2.3 Cấu trúc tóm tắt media

Cấu trúc media tóm tắt được định nghĩa như sau:

Một cấu trúc media tóm tắt là một tập gồm 8 tuple (S, fe, ATTR, λ, R, F, Var1, Var2)

Trong đó

• S là một tập các đối tượng gọi là các trạng thái.

• Fe là một tập các đối tượng gọi là các đặc trưng.

• ATTR là một tập các đối tượng gọi là các giá trị thuộc tính.

• λ: S--> 2fe là một ánh xạ từ các trạng thái sang tập các đặc trưng.

• R là một tập các quan hệ trên fei x ATTRj x S với i,j ≥ 0.

• F là một tập các quan hệ của S.

• Var1 là một tập các đối tượng gọi là các biến, thuộc S

• Var2 là một tập các biến, thuộc fe.

• Một trạng thái là đoạn (chunk) nhỏ nhất của dữ liệu media mà ta mong muốn.

Ví dụ như trong một CSDL hình ảnh, mỗi ảnh có thể được xem như là một

trạng thái. Nếu quan điểm này được chấp nhận, chúng ta sẽ coi như tất cả các

ảnh như là các đối tượng đơn lẻ cơ bản và tất cả các đặc tính của nó sẽ được

quan tâm và khi đó chúng ta sẽ không quan tâm đến các đặc tính đơn lẻ như là

các đặc tính của từng điểm ảnh. Trong trường họp dữ liệu video, một trạng

thái có thể được xem là một chuỗi liên tiếp các frame có dạng (10 x i, 10 x

(i+1)) thể hiện một đoạn gồm 10 frame bắt đầu từ frame có số thứ tự chia hết

cho 10.

• Một đặc trưng là bất kỳ đối tượng nào trong một trạng thái mà nó sẽ được quan

tâm. Một đặc trưng có thể gao gồm cả các đối tượng và các phạm vi của nó.

Ví dụ như chúng ta xem xét một bức ảnh gồm 3 đối tượng A, B và một đối

33

tượng chưa được nhận biết thì các đặc trưng được quan tâm đến ở đây là A, B

và đối tượng C nào đó. Tương tự như vậy nếu chúng ta phân tích đoạn video

từ frame 50-100 thì các đặc trưng được quan tâm ở đây là A, B và cái vali.

Các đặc trưng xuất hiện trong một trạng thái có thể có các thuộc tính của

mình, ví dụ như đối tượng A bước ra khỏi chiếc xe ôtô của mình thì các thuộc

tính của chiếc xe ô tô (loại xe, mầu sắc, biển số) cũng cần phải được ghi nhận.

Tương tự như vậy, một đối tượng media cũng có thể có một vài thuộc tính cần

được quan tâm như ngày, thời gian và địa điểm chụp bức ảnh đó.

• λ là một ánh xạ đặc trưng rút gọn cho phép ta biết đặc trưng nào xuất hiện

trong những trạng thái nào. λ có thể là một GUI cho phép người sử dụng

tương tác nhằm mục đích nhận biết được nội dung của một đối tượng media.

• R là một tập các quan hệ trên fei x ATTRj x S các quan hệ này phụ thuộc vào

trạng thái. Ví dụ nếu xem xét một bức ảnh như photo1.gif thì ở đây có thể có

một quan hệ phụ thuộc vào trạng thái gọi là left.of bao gồm một bộ ba có dạng

(đối tượng A, đối tượng B, photo1.gif). tương tự như vậy chúng ta cũng có thể

có một quan hệ khác gọi là background bao gồm một cặp có dạng (photo1.gif,

White_House).

• F có thể chứa các liên kết kết hợp 2 trạng thái chẳng hạn như liên kết có trước,

nếu chúng ta có 2 bức ảnh (photo1.gif, photo2.gif) mà giữa chúng tồn tại liên

kết có trước thì khi đó có nghĩa là bức ảnh 1 được chụp trước bức ảnh 2 và

tiếp tục như vậy[18].

Để nắm rõ hơn, chúng ta xem xét một số ví dụ áp dụng trên một số loại đối tượng

media sau

2.4.1 Dữ liệu ảnh như là một tóm tắt media.

Giả sử chúng ta xem một CSDL hình ảnh đơn giản gồm có 7 bức ảnh, CSDL này sẽ

tương ứng với media trừu tượng sau:

34

• Tập các trạng thái bao gồm (pic1.gif,……….,pic7.gif).

• Tập các đặc trưng bao gồm tên của các đối tượng xuất hiện trong các bức ảnh

tương ứng là Bob, Jim, Bill, Charlic và Ed.

• Ánh xạ thu gọn λ cho chúng ta biết với mỗi trạng thái có những đặc trưng nào

xuất hiện trong nó. Bảng sau sẽ mô tả cho vấn đề này

Trạng thái Đặc trưng

Pic1.gif Bob.Jim

Pic2.gif Jim

Pic3.gif Bob

Pic4.gif Bill

Pic5.gif Charlie

Pic6.gif Ed, Bill

Pic7.gif Ed

Bảng 2.1: Liên hệ giữa đặc trưng và trạng thái cho hình ảnh

Một điểm cần chú ý ở đây là chúng ta dùng bảng trên để mô tả cho λ nhưng cách thức

chỉ số hoá mà chúng ta sử dụng có thể khác đi.

• Tập các quan hệ chỉ chứa 2 quan hệ: một quan hệ phụ thuộc vào trạng thái gọi là

left_of và một quan hệ không phụ thuộc vào trạng thái gọi là father.

• Tập các quan hệ nội tại có thể trống

2.4.2 Dữ liệu video như là một tóm tắt media.

• Tập các trạng thái bao gồm 5 frames video từ frame 1 đến frame 5.

• Tập các đặc trưng bao gồm Jane Shady, Denis Dopeman, ngôi nhà của

Dopeman và chiếc valy.

35

State

Feature

Frame1 Dopemanhouse,briefcase,JaneShady

Frame2 Dopemanhouse,briefcase,JaneShady,DenisDopeman

Frame3 Dopemanhouse,briefcase,JaneShady,DenisDopeman

Frame4 Dopemanhouse_briefcase,JaneShady,DenisDopeman

Frame5 Dopemanhouse,JaneShady

• Ánh xạ rút gọn λ được mô tả ở bảng sau

Bảng 2.2: Liên hệ giữa đặc trưng và trạng thái cho video

Cũng giống như trường hợp áp dụng đối với CSDL hình ảnh, định dạng cụ thể

của ánh xạ λ có thể khác đi để tối ưu hoá cho quá trình chỉ số hoá và khai thác.

• Chúng ta có thể có một số quan hệ phụ thuộc vào trạng thái sau:

o Quan hệ có (have) là một quan hệ phụ thuộc vào trạng thái xác định

chiếc valy (đối tượng) xuất hiện cùng với nhân vật nào ở trong trạng

Person

Object

State

JaneShady

Briefcase

1

JaneShady

briefcase

2

JaneShady

briefcase

3

DenisDopeman

briefcase

4

thái nào? Quan hệ này có được mô tả như sau:

Bảng 2.3: Quan hệ Have

o Quan hệ vợ chồng (spouse) là một quan hệ phụ thuộc vào trạng thái

chỉ ra tên vợ (hoặc chồng) của một đối tượng nào đó. Quan hệ này có

thể được mô tả như sau

Person

Spouse

JaneShady

PeterShady

JaneShady

PeterShady

DenisDopeman

DebraDopewoman

36

Bảng 2.4: Quan hệ vợ- chồng

• Ở đây có thể chỉ có một quan hệ nội tại của trạng thái gọi là before (s1,s2)

chỉ ra rằng trạng thái s1 có trước trạng thái s2.

Cũng tương tự như trên, chúng ta có thể dễ dàng thấy rằng các kiểu media khác nhau

chằng hạn như dữ liệu âm thanh hoặc dữ liệu văn bản có thể được mô tả như là một

trường hợp của kiểu media tóm tắt tổng quát. Với cấu trúc đơn giản đề cập ở trên, một

CSDL Multimedia là một tập bao gồm các media tóm tắt.

2.4.3 Định nghĩa về một CSDL Multimedia đơn giản

Một CSDL Multimedia đơn giản là một tập hữu hạn M của các media tóm tắt.

Ví dụ, một CSDL Multimedia đơn giản có thể chứa tệp vidoe video1.mpg và một tệp

ảnh photo1.gif, trong trường hợp này CSDL có chứa hai trường hợp của media tóm tắt.

Tuy nhiên một CSDL Multimedia đơn giản tỏ ra quá đơn giản và kém hiệu quả nếu xét

thêm một số khía cạnh. Ví dụ, một media tóm tắt có thể liệt kê “nhà thờ” là một đặc

trưng, tuy nhiên khi chúng ta tìm kiếm với đặc trưng là “thánh đường” thì có thể sẽ

không tìm thấy nhà thờ đó vì hệ thống không thể hiểu được rằng nhà thờ và thành

đường là tương tự nhau. Các hạn chế về mặt từ đồng nghĩa này cũng thường rất hay

xẩy ra đối với CSDL văn bản. Một vấn đề nữa mà chúng ta cũng cần phải quan tâm là

người dùng thường hay tìm kiếm các đối tượng có chứa một hoặc nhiều các đặc trưng

khác nhau và một thực tế là mặc dù sau một số lần chỉnh sửa lại câu hỏi của mình một

37

cách hoàn chỉnh thì các kết quả trả về tương ứng với câu hỏi vẫn chưa chính xác với

những gì người dùng thực sự mong muốn, điều này được thể hiện rõ nhất trong trường

hợp chúng ta tìm kiến trên web sử dụng các công cụ tìm kiếm như Google hoặc

AltaVista.

Ngược lại, ở đây cũng tồn tại các trường hợp khi người dùng muốn mở rộng khả năng

tìm kiếm (tìm kiếm một cách chính xác hơn bằng cách khai bào câu hỏi rõ ràng hơn)

thì có thể sẽ không thu được kết quả nào, trong khi đó nếu đơn giản hoá bớt câu hỏi thì

lại tìm được các thông tin mình mong muốn.

Cuối cùng, khi người dùng đưa ra câu hỏi có dạng “ hãy tìm tất cả các hình ảnh mà

Jane Shady và Denis Dopeman có mặt tại địa điểm A”, nếu kết quả tìm kiếm trả về là

trống thì người dùng có thể suy nghĩ là “địa điểm A có thể tương tự như địa điểm B”

và sửa lại câu hỏi bằng cách thay thê việc tìm kiếm tại địa điểm A bằng việc tìm kiếm

tại địa điểm B, điều này dẫn đến việc chỉnh sửa lại câu hỏi bằng cách thay thế một

hằng số cụ thể này bằng một hằng số khác. Các ví dụ trên đưa đến việc thúc đẩy việc

tìm ra một cấu trúc khác để xác định CSDL Multimedia hỗ trợ được các vấn dề về ngữ

nghĩa cũng như kế thừa được mối quan hệ giữa các đặc trưng.

2.4.4 Định nghĩa về một CSDL Multimedia có cấu trúc

Một CSDL Multimedia có cấu trúc là một tập gồm có 5 thuộc tinh

({M1,…..,Mn),≡,≤,inh,subst) trong đó:

là một media tóm tắt. •

. • ≡ là một quan hệ tương đưong trên

của các lớp tương đương trên F. • ≤ là một thứ tự bộ phận trên tập

38

inh: giả sử cho biết Như vậy inh là •

một ánh xạ kết hợp với mỗi đặc trưng f một tập các đặc trưng “bên dưới f y

theo ≤ thứ tự trên đặc trưng.

đến • Subst là một ánh xạ từ

Để hiểu rõ hơn, chúng ta xem xét ví dụ sau:

Một CSDL Multimedia có chứa 3 loại media trừu tượng là hình ảnh, âm thanh và video

Object

Part_frame

Feature_s)

Media

image

Photo1.gif

_

Church,durnstein,danube,subrahmanian

image

Photo2.gif

_

Cathedral,melk,subrahmanian

image

Photo3.gif

_

Church,st.paul,rome

Video

Video1.mpg

1-5

Church,durnstein,stream

Video

Video1.mpg

6-10

stream

Audio

Audio1.wav

1-20

St.peters,tiber,rome

được liệt kê dưới đây

Bảng 2.5

• Tập các đặc trưng F có chứa: church, durnstein, danube, subrahmanian,

cathedral, melk, st. paul. Rome. Stream. Restaurant, st.peters, tiber.

• ≡ cho biết :

o Church ≡ cathedral.

o River ≡ Stream

39

• Quan hệ ≤ cho biết

Hình 2.4

Có nghĩa là

[tiber] ≤ [river], [danube] ≤ [river].

[st.paul] ≤ [church], [st.peter] ≤ [church].

Cách định nghĩa trên tuy cung cấp đầy đủ hơn các thông tin hữu ích cho việc tìm kiếm

và trình bầy cấu trúc đơn giản của một hệ CSDL Multimedia có cấu trúc nhưng nó vẫn

chưa cung cấp được một cấu trúc chỉ số hoá mà hệ thống CSDL Multimedia dùng để tổ

chức và lưu trữ dữ liệu. Trước khi đưa ra một cấu trúc chỉ số hoá thích hợp, chúng ta sẽ

được ra một ngôn ngữ truy vấn đơn giản dùng để truy vấn dữ liệu Multimedia. Ở đây

chúng ta trình bầy ngôn ngữ truy vấn trước vì chúng ta chỉ có được một cấu trúc chỉ số

hoá có hiệu quả khi mà chúng ta đã tối ưu được các kiểu truy vấn mà người sử dụng

mong muốn .

2.4 Ngôn ngữ truy vấn khai thác dư liệu multimedia

Trong phần này, chúng ta sẽ trình bầy một ngôn ngữ truy vấn đơn giản được xây dựng

dựa trên SQL dùng để khai thác dữ liệu Multimedia. Chúng ta đã chỉ ra được rằng một

media tóm tắt có thể được dùng để mô tả các loại dữ liệu media khác nhau sử dụng

kiến trúc mô tả đồng nhất. Việc mở rộng ngôn ngữ truy vấn SQL sử dụng cho việc truy

vấn dữ liệu được xây dựng bởi kiến trúc mô tả đồng nhất sẽ là tiền đề để chúng ta tiếp

tục mở rộng ngôn ngữ truy vấn dùng cho việc khai thác các dữ liệu media được xây

dụng theo kiến trúc lai ghép

40

2.4.1 Truy vấn SMDSs (mô tả đồng nhất)

Các hàm cơ bản của SMDSs bao gồm:

• FindType(Obj): hàm này sử dụng đối tượng media Obj làm đầu vào và sẽ trả về

kiểu của đối tượng, ví dụ:

o FindType(image1.gif) = gif.

o FindType(movie1.mpg) = mpg.

• FindObjWithFeature(f): hàm này sử dụng đặc trưng f là giá trị đầu vào và trả về

một tập tất cả các loại đối tượng media mà có chứa đặc trưng f, ví dụ

. o

o

• FindObjWithFeatureAttr(f,a,v): hàm này sử dụng đặc trưng f, một thuộc tính tên

a kết hợp với đặc trưng này và một giá trị v là đầu vào. Giá trị trả về sẽ là tất cả

các đối tượng o có chứa đặc trưng và giá trị của thuộc tính a trong đối tượng o là

v. Ví dụ:

: câu hỏi này đòi hỏi tìm o

tất cả các đối tượng media mà có sự xuất hiện của Jane Shady trong chiếc

áo mầu blue.

câu hỏi này đòi hỏi tìm tất cả o

các đối tượng media mà một con voi có mang một cái nơ mầu đỏ xuất

hiện.

• FindFeaturesInObj(Obj): câu hỏi này đòi hỏi phải tìm tất cả các đặc trưng có

mặt trong một đối tượng media đã cho. Kết quả trả về là một tập bao gồm tất cả

các đặc trưng. Ví dụ:

câu hỏi này yêu cầu trả về tất cả các đặc o

trưng có trong file ảnh im1.gif.

41

câu hỏi này yêu cầu trả về tất cả các o

đặc trưng có trong 5 frame đầu tiên của file video video1.mpg.

• FindFeatureandAttrinObj(Obj): hàm này cũng có chức năng tương tự như hàm

trước ngoại trừ việc nó trả về một quan hệ có schema như sau: (Feature,

Attribute,Value) trong đó cặp 3 (f,a,v) xuất hiện trong quan hệ đầu ra nếu thuộc

tính a của đặc trưng f được xác định và có giá trị là v. Ví dụ:

có thể trả về kết quả được mô tả ở bảng o

Feature Attribute

Value

John

age

32

John

address

32 PicoLane.Mclean.VA 22050.

Mary

age

46

Mary

address

16 ShawRoad.Dumfries.VA 2290s.

Mary

employer

XYZCorp.

Mary

boss

David

Bảng 2.6

sau

SMDS-SQL mở rộng của chúng ta sẽ bao gồm tất cả các câu lệnh chuẩn của SQL có

bổ sung thêm một số đặc trưng của dữ liệu Multimedia vào SQL (bổ sung thêm vào

Select, From, Where)

• Tuyên bố Select có thể chứa thực thể media. Một thực thể media được định

nghĩa như sau:

o Nếu m là một đối tượng media liên tục, i và j là 2 số nguyên khi đó m

: [i,j] là một thực thể media thể hiện một tập tất cả các frame của đối

tượng media m nằm trong (và chỉ trong) khoảng i và j.

o Nếu m không phải là một đối tượng media liên tục thì khi đó m là một

thực thể media.

42

o Nếu m là một thực thể media và a là một thuộc tính của m thì khi dó

m.a là một thực thể media.

• Tuyên bố From có thể có các thực thể theo mẫu sau: (media) (source) (M), có

nghĩa là chỉ có các đối tượng media kết hợp với tên của kiểu media và tên của

dữ liệu nguồn được xem xét dến khi thực hiện câu hỏi và M là một biến được

xếp loại trên các đối tượng media đó.

• Tuyên bố Where cho phép có các biểu thức có dạng term In func.call. Trong đó:

o Term có thể là một biến (trong trường hợp này được sắp xếp trên kiểu trả

về của func.call) hoặc là một đối tượng có kiểu đầu ra giống như

func.call.

o Func.call kà một trong 5 hàm đã nêu ra ở trên.

Chúng ta cũng xem xét một vài ví dụ

• Tìm tất cả các đối tượng ảnh hoặc video có chứa cả Jane Shady và Denis

SELECT M

Select M

FROM smds source M

WHERE (FindType(M)= Video OR FindType(M)=Image

AND

M IN FindObjWithFeatureand(Jane Shady) And

M IN FindObjWithFeatureand(Denis Dopeman)

Dopeman.

SELECT M

FROM smds source M

WHERE FindType(M)=Video OR FindType(M)=Image

AND

M IN FindObjWithFeatureandAttr(Jane

Shady,suit,purple)

• Tìm tất cả các ảnh và video mà đối tượng Jane Shady mặc áo vét mầu tím

• Tìm tất cả các ảnh có chứa cả Jane Shady và Denis Dopeman và Jane đứng bên

trái Denis

SELECT M

FROM smds source M

WHERE FindType(M)=Image AND

M IN FindObjWithFeature(Denis Dopeman) AND

M IN FindObjWithFeature(Jane Shady) AND

Left (jane Shady,Denis Dopeman.M)

43

Ở đây có một chú ý là quan hệ left được sử dụng ở trên là một quan hệ media

tóm tắt của CSDL hình ảnh

• Tìm tất cả các ảnh có Jane Shady cùng với đối tượng xuất hiện trong đoạn

Video cùng với Denis Hopeman. Khác với câu hỏi trước, câu hỏi này đòi hỏi

phải có các thao tác kết hợp giữa các loại dữ liệu khác nhau. Để thực hiện được

câu hỏi này, chúng ta phải sử dụng các biến mở rộng như là Person, biến này

được dùng để tham chiếu đến đối tượng chưa xác định được danh tính trong

đoạn băng video.

2.4.2 Truy vấn dữ liệu multimedia mô tả dưới kiến trúc lai tạo.

Trong phần trước, chúng ta đã trình bày ngôn ngữ SMDS-SQL như là một mô hình để

truy vấn các dối tượng Multimedia lưu trữ trong kiến trúc thổng nhất. Trong kiến trúc

44

đồng nhất, tất cả các dữ liệu nguồn được truy vấn đều là SMDSs, trong khi trong kiến

trúc lai tạo các cách thức mô tả khác (non-SMDS) cũng được sử dụng. Cách thức mô tả

dữ liệu kiểu lai tạo thường có hai phần chính:

• Một tập các đối tượng media được mô tả dưới dạng đồng nhất.

• Một tập các kiểu media khác nhau mà có cấu trúc để truy nhập và truy vấn

riêng.

Để mở rộng ngôn ngữ truy vấn SMDS-SQL thành ngôn ngữ có thể truy vấn được các

dữ liệu được mô tả dưới dạng lai tạo (HM-SQL) các yêu cầu sau bắt buộc phải có:

• HM-SQL phải có khả năng thực hiện tất cả các câu hỏi sử dụng ngôn ngữ riêng

đối với nguồn dữ liệu không đồng nhất này.

• HM-SQL phải có cơ chế “joins” hoặc các thao tác đại số nhị phân có trách

nhiệm “joins” giữa 2 nguồn dữ liệu SMDS và non-SMDS.

Ngôn ngữ HM-SQL cũng tương tự như ngôn ngữ SQL chuẩn ngoại trừ các mệnh đề

Select, From. Where được mở rộng như sau:

• Mệnh đề SELECT và WHERE được mở rộng giống như với ngôn ngữ SMDS-

SQL.

• Tuyên bố Where cho phép sự có mặt của biểu thức có dạng Term IN MS :

func_call trong đó:

o Term:có thể là một biến hoặc là một đối tượng có kiểu đầu ra giống hệt với của func_call đã được định nghĩa trong media gốc và .

o Nếu MS=SMDS hoặc họ func_call thuộc 1 trong 5 hàm đã đinh nghĩa ở

trên hoặc

o MS không phải là một nguồn SDMS và func_call là một câu hỏi trong

QL(MS).

• Khi đó có 2 sự khác nhau giữa SMDS-SQL và HM-SQL là:

o func_call xuất hiện trong mệnh đề where cần được chú thích một cách

tường minh với media gốc kèm theo và

45

o Các câu hỏi được xây dựng từ các ngôn ngữ hỏi đáp của từng loại dữ liệu

non-SMDS có thể được nhúng vào bên trong câu lệnh truy vấn của HM-

SQL. Điều này làm cho HM_SQL trở nên hết sức mạnh mẽ và linh hoạt.

Căn cứ vào điều này chúng ta có thể thực thi các câu hỏi đối với các

nguồn dữ liệu khác nhau.

Xét một số ví dụ sau:

• Giả sử chúng ta có 2 nguồn dữ liệu video video1 và video2, nguồn video1 được

triển khai qua hình thức SDMS, nguồn video2 được triển khai qua hình thức

non-SDMS (gọi là videob). Câu hỏi của chúng ta ở đây là “hãy tìm tất cả các

video clip có mặt Denis Hopeman từ cả 2 nguồn dữ liệu video1 và video2. Câu

hỏi này có thể được diễn đạt bằng ngôn ngữ HM-SQL như sau:

Trong câu hỏi này, chúng ta tìm kiếm tất cả các Ms mà chúng trả về kết quả

mong muốn từ cả 2 nguồn dữ liệu (SDMS và non-SDMS).

• Cũng với câu hỏi trên nhưng ở đây chúng ta thêm vào một nguồn dữ liệu mới là

dữ liệu hình ảnh (idb) được triền khai dưới hình thức non-SDMS và giả sử dữ

liệu hình ảnh này có riêng chức năng tìm kiếm getpic(obj) với tham số đầu vào

là obj và kết quả trả về là một cặp bao gồm một ảnh (file ảnh) và thứ tự có liên

quan. Giả sử chúng ta muốn tìm kiếm trên cả 3 loại dữ liệu này (video1, video2,

idb) có mặt của đối tượng Denis Hopeman thì câu hỏi diễn đạt bằng ngôn ngữ

Select M

From sdms Video1, vi•eob Video2

HM-SQL có thể như sau:

Where M IN sdms: FindObjWithFeature(Denis

Hopeman) OR

M IN videodb: FindVideoWithObj(Denis Dopeman)

UNION

(Select M.file

From imagedb idb M

Where M In imagedb:getpic(Denis Dopeman)

46

• Giả sử chúng ta muốn tìm tất cả các đối tượng có mặt cùng với Denis Dopeman

trong tất cả các nguồn dữ liệu (video1, video2, idb), câu hỏi sẽ như sau

2.4.3 Chỉ số hoá SMDS với chỉ số đảo.

Trong các phần trước, chúng ta đã trình bầy các cách thức để truy vấn CSDL

multimedia dưới cả 2 hình thức mô tả là đồng nhất và lai tạo. Các nguồn dữ liệu non-

SMDS được chỉ số hoá bởi các cơ chế riêng của chúng, ở đây chúng ta đi sâu vào tìm

hiểu cách thức chỉ số hoá đối với các nguồn dữ liệu SDMS.

Giả sử chúng ta có trước một SMDS có dạng:

47

trong đó

Chúng ta phải chỉ ra được một cách thức chỉ số hoá có hiệu quả dữ liệu này, ý tưởng cơ

bản ở đây là:

. • Featuretable: đây là một bảng băm có chứa tất cả các đặc trưng có trong

Mỗi bảng băm ở vị trí I có chứa một đại diện featurenodes được băm đến vị trí i.

. Cũng giống • Statetable: là một bảng băm chưa tất cả các trạng thái thuộc

như featuretable, statetable cũng chứa một đại diện của statenotes được băm

đến vị trí xác định.

• Featurenodes: mỗi featurenodes bao gồm các thành phần sau:

o Tên của đặc trưng (ví dụ “Denis Dopeman”).

o Một danh sách các nút con (nếu f1 và f2 là các đặc trưng trong

chúng ta nói rằng f2 là con của f1 nếu f2≤f1 và không có một đặc trưng f3

khác ( ) mà f2

o Một danh sách con trỏ trỏ tới statenodes có chứa các đặc trưng liên quan

(ví dụ trong trường hợp CSDL hình ảnh nó có thể là một con trỏ trỏ đến

node kết hợp với hình ảnh có chứa đặc trưng được nêu ra trong câu hỏi

(VD “Denis Hopeman”).

o Một tập các con trỏ trỏ đến featurenodes khác thích hợp để thay thế cho

featurenodes trong câu hỏi.

• Statenodes: Một statenodes chỉ chứa 2 thành phần bao gồm:

o Một con trỏ trỏ đến file có chứa đối tượng media (hình ảnh, video, audio

) mà trạng thái được quy đến trong câu hỏi.

48

o Một danh sách các mối quan hệ mà thành viên của nó trỏ đến

featurenodes, bằng trực giác chúng ta có thể thấy được là có một con trỏ

trỏ đến featurenodes f nếu đặc trưng có trong câu hỏi ở trạng thái đó.

Cấu trúc dữ liệu của SMDS được mô tả như sau:

Type featurenode = record of

trạng thái có thể cho là có đặc trưng kết hợp với node đó */

name: String ;/* Tên của đặc trưng */ children: ^ node1; /* trỏ đến danh sách các on trỏ trỏ đến nodes con */ statelist: ^ node2 ;/* trỏ đến danh sách các on trỏ trỏ đến các trạng thái có chứa đặc trưng này */ replacelít: ^ node3; /* trỏ đến một danh sách bao gồm các con cháu kết hợp với các

end record;

type node1 = record of

element: ^ featurenode; /* trỏ đến node con của một featurenode */ next: ^ node1; /* trỏ đến nodé con tiếp theo */

end record;

type node2 = record of

state: ^ statenode; /* trỏ đến danh sách kết hợp với trạng thái */ link: ^ node2; /* node tiếp theo */

end record;

type node3 = record of

feat: ^ featurenode; /* trỏ đến một node mà có thể cho là có đặc trưng kết hợp với node hiện thời

*/

link1: ^ node3;

end record;

49

type statenode = record of

rep: framerep; flist: ^ node4;

end record;

type node4 = record of f: ^ featurenode; link2: ^ node4;

end record;

Hình 2.5: Ví dụ về statetable

50

Chúng ta hãy xem xét một ví dụ của SDMS bao gồm 3 media trừu tượng bào gồm : dữ

liệu ảnh, video và âm thanh (audio) có nội dung như sau

Media trừu tượng

Trạng thái

Các đặc trưng

Img

Im1

john, mary

Im2

john, mary, lizt

Im3

lizt, mary

Video

Vid1: [1,10]

john, singing

Vid1: [11,20]

john, mary, dancing

Vid1: [21,40]

john, mary, lizt, singing, dancing

Vid2: [1,20]

ed, speaking

Vid2: [21,30]

man, speaking

Audio

Disk1: [1,20]

John, singing

Disk1: [21,40]

woman, speaking

Bảng 2.7

• Hình 2.5 cho chúng ta thấy một ví dụ về statetable (để đơn giản chúng ta không

đề cập đến các hàm băm được sử dụng) ví dụ về một featuretable. Một trong 10

trạng thái liệt kê ở trên được lưu trữ trong statetable cùng với 9 đặc trưng.

Trong trường hợp này phải chú ý là “singing” và “dancing” được xem như là

các đặc trưng.

• Thứ tự ≤ trên các đặc trưng được thể hiện ở hình dưới

Hình 2.6

• Chúng ta đã chỉ ra được sự kết hợp của featurelist với các trạng thái im1 và

disk1: [1,20], các featurelist khác không được thể hiện ra ở đây nhằm mục đích

đơn giản hoá.

51

• Tương tự như vậy chúng ta chỉ ra statelist kết hợp với các đặc trưng man và lizt.

• Mối liên hệ kết hợp giữa các media trừu tượng này có thể lưu trữ trong một

CSDL quan hệ chuẩn.

52

CHƯƠNG 3

HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU ĐA PHƯONG TIỆN – YÊU

CẦU VÀ CÁC VẤN ĐỀ

Trung tâm của một hệ thống thông tin multimedia chính là hệ quản trị CSDL

MULTIMEDIA (MDBMS). Theo truyền thống, một CSDL bao gồm một bộ các dữ có

liên quan về một thực thể cho trước hoặc một hệ quản trị CSDL (DBMS) là một bộ các

dữ liệu có liên quan đến nhau với một tập hợp các chương trình được dùng để khai báo,

tạo lập, lưu trữ, truy cập và truy vấn CSDL. Tương tự như vậy, chúng ta có thể xem

một CSDL MULTIMEDIA là một tập các loại dữ liệu multimedia như văn bản, hình

ảnh, video, âm thanh, các đối tượng đồ hoạ….Một hệ quản trị CSDL MULTIMEDIA

(MDBMS) cung cấp hỗ trợ cho các loại dữ liệu MULTIMEDIA trong việc tạo lập, lưu

trữ, truy cập, truy vấn và kiểm soát.

Sự khác nhau của các kiểu dữ liệu trong CSDL MULTIMEDIA có thể đòi hỏi các

phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai thác.

MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các cơ chế

tóm tắt bậc cao để quản lý các kiểu dữ liệu khác nhau cũng như các giao diện thích hợp

để thể hiện chúng.

3.1 Mục đích của MDBMS

Một MDBMS cung cấp một môi trường thích hợp để sử dụng và quản lý các thông tin

CSDL MULTIMEDIA. Vì vậy, nó phải hỗ trợ các kiểu dữ liệu MULTIMEDIA khác

nhau bên cạnh việc phải cung cấp đầy đủ các chức năng của một DBMS truyền thống

như khai báo và tạo lập CSDL, khai thác dữ liệu, truy cập và tổ chức dữ liệu, độc lập

dữ liệu, tính riêng, toàn vẹn dữ liệu, kiểm soát phiên bản. Các chức năng của MDBMS

cơ bản tương tự như các chức năng của DBMS, tuy nhiên, bản chất của thông tin

53

MULTIMEDIA tạo ra các đòi hỏi mới. Bằng cách sử dụng các chức năng tổng quát

của DBMS chúng ta có thể trình bầy mục đích của MDBMS như sau[1]:

• Sự thống nhất: bảo đảm rằng một dữ liệu không phải tạo lại khi các chương

trình khác nhau đòi hỏi dữ liệu đó.

• Độc lập dữ liệu: Đảm bảo sự tách rời giữa CSDL và các chức năng quản trị từ

các chương trình ứng dụng.

• Điều khiển nhất quán: đảm bảo sự toàn vẹn của CSDL MULTIMEDIA thông

qua các quy tắc dược áp dụng trên các giao dịch đồng thời.

• Sự tồn tại: bảo đảm các đối tượng dữ liệu tồn tại qua các giao dịch khác nhau

cũng như các yêu cầu của chương trình.

• Tính riêng: ngăn chặn các truy cập và sửa chữa các dữ liệu được lưu trữ một

cách trái phép.

• Kiểm soát sự toàn vẹn; bảo đảm sự toàn vẹn của CSDL một giao dịch này sang

một giao dịch khác thông qua việc áp đặt các ràng buộc.

• Khả năng phục hồi: phải có các phương thức cần thiết để đảm bảo rằng kết quả

của các giao dịch thất bại không làm ảnh hưởng đến dữ liệu lưu trữ.

• Hỗ trợ truy vấn: bảo đảm các cơ chế truy vấn phù hợp với dữ liệu

MULTIMEDIA.

• Kiểm soát phiên bản: tổ chức và quản lý các phiên bản khác nhau của các đối

tượng lưu trữ có thể được yêu cầu bởi các ứng dụng.

54

Hình3.1: Kiến trúc bậc cao cho một MDBMS đáp ứng các yêu cầu cho dữ liệu

MULTIMEDIA

Đối với việc điều khiển nhất quán, một giao dịch là một chuỗi các hướng dẫn được

thực thi một cách hoàn toàn hoặc không hoàn toàn, đối với trường hợp không hoàn

toàn CSDL sẽ được khôi phục lại trạng thái trước đó, việc đưa ra được một cơ chế

tương ứng đảm bảo cho việc nhất quán là một vấn đề khó khăn đối với CSDL

MULTIMEDIA. Các CSDL quan hệ truyền thống sử dụng một bản ghi hoặc một bảng

duy nhất như là một đơn vị nhất quán. CSDL MULTIMEDIA thường sử dụng một đối

tượng đơn lẻ (hoặc đối tượng ghép) như là một đơn vị logic của truy cập. Như vậy một

đối tượng MULTIMEDIA đơn lẻ có thể tạo thành đơn vị nhất quán[14].

Đối với vấn đề lưu trữ, một phương thức đơn giản là lưu trữ các tệp MULTIMEDIA

trong các tệp tương ứng của hệ điều hành. Tuy nhiên với đặc thù là dung lượng lớn, các

dữ liệu MULTIMEDIA là cho chi phí triển khai theo cách thức này trở nên tốn kém.

Hơn nữa, hệ thống cũng cần phải lưu trữ các metadata MULTIMEDIA và có thể cả các

đối tượng MULTIMEDIA tổng hợp. Vì vậy, hầu hết các MDBMS phân loại thành 2

phần là cố định và tạm thời và chỉ lưu trữ các dữ liệu cố định sau khi các giao dịch

55

được cập nhật. Các dữ liệu tạm thời chỉ được dùng trong các chương trình hoặc các

giao dịch khi chúng được thực thi và được loại bỏ sau đó.

Thông thường, một câu hỏi sẽ lựa chọn một tập con của các đối tượng dữ liệu dựa trên

các mô tả của người dùng (thường là thông qua các ngôn ngữ truy vấn) về truy nhập dữ

liệu nào. Một câu hỏi thường có nhiều thuộc tính khác nhau, có thể là dựa trên từ khoá

hoặc hướng theo nội dung và thường là tác động lẫn nhau. Vì vậy, các chức năng cho

phản hồi có liên quan, công thức của câu hỏi, các kết quả tương tự, và cơ chế thể hiện

kết quả rõ ràng là rất quan trọng trong MDBMS.

Khi các ứng dụng cần truy cập đến các trạng thái khác nhau của một đối tượng thì vấn

đề kiểm soát phiên bản đối với đối tượng MULTIMEDIA khi chúng được truy cập

hoăc sửa chữa trở nên rất quan trọng. Một DBMS cung cấp các khả năng truy cập như

vậy thông qua các phiên bản của các đối tượng lưu trữ, đối MDBMS khi mà phải lưu

trữ một khối lượng dữ liệu khổng lồ thì vấn đề kiểm soát phiên bản càng trở nên quan

trọng. Mặt khác, việc quản lý phiên bản không chỉ áp dụng cho một đối tượng riêng lẻ

mà nó còn được áp dụng để quản lý các đối tượng phức tạp tạo nên CSDL

MULTIMEDIA[1].

Các tính chất đặc biệt của dữ liệu MULTIMEDIA cũng đòi hỏi phải có các tính năng

đặc biệt mới để hỗ trợ cho nó như kết hợp và phân rã các đối tượng, quản trị dung

lượng khổng lồ dữ liệu MULTIMEDIA, lưu trữ và khai thác hiệu quả, có khả năng làm

việc được với các đối tượng dữ liệu tạm thời hoặc một phần của chúng.

3.2 Các yêu cầu của một MDBMS

Để có được một MDBMS đáp ứng được các yêu cầu đã nêu ra ở trên, chúng ta cần

phải có được một số các yêu cầu cụ thể cho nó, các yêu cầu ở đây bao gồm:

• Đầy đủ các khả năng của một DBMS truyền thống.

• Có khả năng lưu trữ lớn.

• Có khả năng khai thác dữ liệu thuận tiện.

56

• Có khả năng tích hợp, tổng hợp và thể hiện.

• Hỗ trợ truy vấn multimedia.

• Có giao diện multimedia và tương tác.

Bên cạnh các yêu cầu vừa nêu, để cho hệ thống hoạt động có thể hoạt động tốt chúng ta

cũng cần phải giả quyết các vấn đề sau:

• Hệ thống CSDL MULTIMEDIA sẽ được xây dựng như thế nào để có thể bao

gồm các lĩnh vực ứng dụng khác nhau.

• Xây dựng phần hạt nhân cho việc phân rã , lưu trữ và quản lý thông tin ở mức

độ nào? Các công nghệ, cấu trúc nền tảng được sắp xếp và sử dụng như thế nào?

• Các kiến thức về tổng hợp dữ liệu đối với CSDL MULTIMEDIA, làm thê nào

để có thể phát triển được một ngôn ngữ truy vấn đáng tin cậy và có hiệu quả để

hỗ trợ cho vô số phương thức truy nhập và các kiểu đối tượng khác nhau. Làm

thế nào để ngôn ngữ truy vấn hỗ trợ được các đặc tính và hình thái khác nhau

của dữ liệu MULTIMEDIA.

• Xác định được hạ tầng thể hiện nào mà một hệ thống MULTIMEDIA phải có để

đạt được các yêu cầu và cách thức thể hiện khác nhau. Làm cách nào để hỗ trợ

việc đồng bộ hoá việc thể hiện các dữ liệu tạm thời cũng như các dữ liệu bộ

phận của các dữ liệu MULTIMEDIA khác nhau.

• Giả sử các kiểu media khác nhau có các yêu cầu cập nhật và sửa đổi thông tin

khác nhau thì hệ thống sẽ cập nhật các thành phần này như thế nào.

Như hình 3.1 chúng ta đã thấy kiến trúc bậc cao dành cho một MDBMS đã chỉ ra được

một số các yêu cầu cần phải đạt được. Kiến trúc này bao gồm hầu hết các khối chức

năng về quản lý đi kèm với DBMS truyền thống.. Ngoài ra, nó cũng bao gồm một số

modul đặc biệt phục vụ cho việc quản trị dữ liệu MULTIMEDIA như tích hợp các

phương tiện và quản lý các đối tượng. Tuy nhiên hầu hết các chức năng thêm vào

DBMS truyền thống đều nằm ngoài phần lõi của MDBMS bao gồm thể hiện, giao diện,

và quản lý cầu hình[1].

57

3.2.1 Khả năng quản trị lưu trữ lớn

Hình 3.2

Các yêu cầu về khả năng lưu trữ của các hệ thống MULTIMEDIA có thể được đặc

trưng bởi khả năng lưu trữ lớn và cách thức tổ chức theo thứ bậc (dạng kim tự tháp)

của hệ thống lưu trữ. Việc lưu trữ theo thứ bậc đặt các đối tượng dữ liệu

MULTIMEDIA trong một hệ thống phân bậc bao gồm các thiết bị khác nhau, có thể là

trực tuyến (online), không trực tuyến (offline). Một cách tổng quát, mức cao nhất của

hệ thống sẽ cho ta hiệu suất cao nhất, khả năng lưu trữ nhỏ nhất, chi phí cao nhất và sự

cố định ít nhất. Các lớp cao trong hệ thống phân cấp này có thể sử dụng để lưu trữ các

đối tượng tóm tắt nhỏ hơn của một dữ liệu MULTIMEDIA hoàn chỉnh với mục đích

cung cấp khả năng duyệt và xem trước nhanh đối với nội dung của dữ liệu. Chi phí và

hiệu suất (tính về mặt thời gían) sẽ giảm dần nếu ta đi xuống các lớp phía dưới của hệ

thống phân cấp, cùng với điều này là sự tăng của khả năng lưu trữ và tính cố định.

Thông thường trong hầu hết các hệ thống lưu trữ MULTIMEDIA, mức cao nhất của

58

lưu trữ thường là RAM, tiếp theo đó là đĩa từ, các thiết bị này cung cấp các dịch vụ

trực tuyến (online services). Các thiết bị lưu trữ quang học cung cấp mức lưu trữ tiếp

theo, khái niệm trực tuyến ở đây có thể hiểu là gần như, tiêu biểu cho các thiết bị lưu

trữ kiểu này là các jukebox (CD-DVD jukebox). Mức thấp nhất trong hệ thống lưu trữ

phân cấp có thể là các thiết bị như băng từ, đĩa quang hoặc các thiết bị tương tự, các

thiết bị này cung cấp khả năng lưu trữ offline và có thể không cần kết nối trức tiếp với

máy tính. Chúng cung cấp khả năng lưu trữ và tính cố định cao hơn nhưng cũng có

hiệu suất kém nhất về thời gian truy nhập. Vì những lý do trên, một MDBMS phải

quản lý và tổ chức việc lưu trữ đối với bất kỳ mức nào của hệ thống phân cấp, nó phải

có cơ chế tự động để chuyển các đối tượng dữ liệu MULTIMEDIA từ một mức này

của hệ thống lưu trữ phân cấp sang mức khác, việc chuyển cấp này phải dựa trên tần

suất sử dụng của dữ liệu MULTIMEDIA. Trong trường hợp dữ liệu MULTIMEDIA

được lưu trữ ở các thiết bị offline thì MDBMS cũng phải có được các thông tin trợ giúp

cho việc dễ dàng xác định các thiết bị cụ thể có chứa các thông tin cần truy xuất.

3.2.2 Hỗ trợ truy vấn và khai thácdữ liệu.

Truy vấn đối với dữ liệu MULTIMEDIA bao gồm các kiểu dữ liệu khác nhau, các từ

khoá, thuộc tính, nội dung vv…Do người dùng có thể có các cách suy nghĩ khác nhau

về dữ liệu MULTIMEDIA vì vậy kết quả thu được từ việc truy vấn dữ liệu

MULTIMEDIA có thể không hoàn toàn chính xác và có thể chỉ là các kết quả tương tự

hoặc là một phần của kết quả hơn là các kết quả chuẩn xác. Do việc có thể kết quả là

không chính xác nên chúng ta phải có khả năng phân hạng các kết quả thu được sao

cho chúng gần với yêu cầu truy vấn nhất, tương tự như vậy chúng ta cũng phải có các

phương thức để loại bỏ bớt những kết quả không thoả mãn yêu cầu truy vấn. Việc làm

này sẽ giảm thiểu các sai sót về mặt tính toán trong quá trình tìm kiếm.

59

3.2.3 Tích hợp các phương tiện, tổng hợp và thể hiện

Giả sử tính đa dạng của các kiểu dữ liệu đã được hỗ trợ, một MDBMS cũng phải cung

cấp khả năng để tích hợp các loại dữ liệu này để tạo nên các kiểu dữ liệu

MULTIMEDIA mới và thể hiện các dữ liệu này khi có yêu cầu trong một khung thời

gian yêu cầu. Độ phức tạp của việc tích hợp, tổng hợp và thể hiện bị tăng thêm bởi các

đặc tính cơ bản của dữ liệu MULTIMEDIA như tính liên tục (tạm thời) của dữ liệu

MULTIMEDIA đặc biệt là với các kiểu dữ liệu như video, hoạt hình hoặc âm thanh.

Hơn nữa, một vài ứng dụng cụ thể như các hệ thống thông tin địa lý có thể đòi hỏi

MDBMS cung cấp các thông tin bộ phận (về một vùng, miền nào đó). Tất cả các yếu tố

này kết hợp với nhau làm cho việc tổng hợp và thể hiện MULTIMEDIA trở thành một

quy trình phức tạp mà MDBMS phải cung cấp để đáp ứng các yêu cầu mà người dùng

đòi hỏi.

Các vấn đề về tích hợp có thể được cải thiện trong một số trường hợp, đặc biệt là khi

các hệ thống CSDL MULTIMEDIA được xây dựng nhằm phục vụ cho các cộng đồng

người dùng xác định trước. Trong các trường hợp đặc biệt này, MDBMS có thể hỗ trợ

một số tính năng mà các ứng dụng khác không cần đến.

3.2.4 Giao diện và tương tác.

Sự khác nhau về bản chất của các dữ liệu MULTIMEDIA đòi hỏi phải có các giao diện

khác nhau để tương tác với dữ liệu. Thông thường, mỗi loại dữ liệu có các phương thức

truy nhập và thể hiện riêng của mình, ví dụ như dữ liệu video và âm thanh sẽ đòi hỏi

các giao diện người dùng khác nhau để thể hiện và truy vấn. Đối với một vài ứng dụng

Multimedia, đặc biệt là sự có mặt của các loại dữ liệu có tính liên tục người dùng

thường đòi hỏi phải có các khả năng tương tác với dữ liệu ( chẳng hạn như đối với dữ

liệu VCR thì người dùng thường mong muốn có chức năng như tua lên (fast forward)

hoặc tua ngược lại (reverse)). Khi mà một hệ thống Multimedia cung cấp các dịch vụ

60

như vậy thì nó phải được liên kết vào CSDL đặc biệt là việc khai thác các đối tượng,

tổng hợp và đồng bộ chúng.

3.2.5 Hiệu suất.

Hiệu suất là một vấn đề quan trọng cần được xem xét đối với một MDBMS. Các hệ

thống CSDL MULTIMEDIA tạo ra hiệu suất dựa trên sự tối ưu hoá việc truy nhập tới

các media, lưu trữ, chỉ số hoá, khai thác và truy vấn . Sự có tham gia của nhiều kiểu dữ

liệu khác nhau trong CSDL MULTIMEDIA có thể đòi hỏi một số phương thức đặc biệt

để tối ưu hoá việc truy cập, lưu trữ, chỉ số hoá và khai thác. Các yêu cầu này bao gồm

hiệu quả, tính ổn định, đảm bảo và đồng bộ việc trao đổi dữ liệu, chất lượng của dịch

vụ (QoS).

3.3 Các vấn đề của MDBMS

Để đáp ứng được các yêu cầu đã nêu ra ở phần trên, MDBMS cần phải xác định được

một số vấn đề quan trọng bao gồm:

• Mô hình hoá dữ liệu MULTIMEDIA.

• Lưu trữ đối tượng multimedia.

• Tích hợp, trình diễn, chất lượng dịch vụ multimedia.

• Chỉ số hoá, khai thác và duyệt.

• Hỗ trợ truy vấn multimedia.

• Quản trị dữ liệu MULTIMEDIA phân tán.

• Hỗ trợ của hệ thống.

3.3.1 Mô hình hoá dữ liệu MULTIMEDIA

Mô hình dữ liệu là đơn vị trung tâm của một hệ thống CSDL MULTIMEDIA. Một mô

hình dữ liệu cần phải tách rời người dùng ra khỏi chi tiết của việc quản lý các thiết bị

lưu trữ và cấu trúc lưu trữ. Điều này đòi hỏi phải phát triển các mô hình dữ liệu tương

61

ứng để tổ chức các kiểu dữ liệu khác nhau tường gặp trong các hệ thống CSDL

MULTIMEDIA.

Các mô hình dữ liệu MULTIMEDIA (cũng giống như các mô hình dữ liệu truyền

thống khác) nắm bắt các đặc tính cố định cũng như động của nội dung CSDL và vì vậy

nó cung cấp các khuôn mẫu cơ bản cho việc phát triển các công cụ cần thiết để sử dụng

dữ liệu MULTIMEDIA. Các thuộc tính cố định có thể bao gồm các đối tượng tạo nên

dữ liệu MULTIMEDIA, mối liên hệ giữa các đối tượng, thuộc tính của các đối tượng

…Các đặc tính động bao gồm sự tương tác giữa các đối tượng, sự hoạt động trên đối

tượng, các tương tác của người dùng.

Tuy nhiên, do các tính chất đặc biệt của mình, dữ liệu MULTIMEDIA đòi hỏi phải có

các quan tâm mới khi chọn lựa mô hình dữ liệu. Ví dụ, một vài kiểu dữ liệu

MULTIMEDIA (chẳng hạn video) hoặc một nhóm các kiểu (video và hình ảnh) có thể

đòi hỏi các mô hình dữ liệu đăc biệt để cải thiện hiệu quả và tính mềm dẻo. Hơn nữa,

do tầm quan trọng của việc tương tác trong các hệ thống MULTIMEDIA nên việc nó

được hỗ trợ bỏi các mô hình dữ liệu trở nên quan trọng.

Rât nhiều các mô hình dữ liệu khác nhau như là mạng lưới, liên hệ, ngữ nghĩa, và

hướng đối tượng đang tồn tại và một vài số trong chúng đã được xem xét để thiết lập

CSDL MULTIMEDIA. Có hai cách tiếp cận cơ bản trong việc mô hình hoá dữ liệu

MULTIMEDIA là:

• Phương pháp thứ nhất: xây dựng một mô hình dữ liệu MULTIMEDIA trên nền

tảng của mô hình dữ liệu của một CSDL truyền thống (thường là CSDL quan

hệ hoặc CSDL hướng đối tượng) bằng cách sử dụng các giao diện tương ứng

đối với dữ liệu MULTIMEDIA. Các vấn đề nẩy sinh với cách tiếp cận này là

các cấu trúc bên dưới (của CSDL truyền thống) không được thiết kế dành cho

dữ liệu MULTIMEDIA, hơn nữa sự khác biệt cơ bản các yêu cầu của một

CSDL truyền thống đối với CSDL MULTIMEDIA khiến cho giao diện trở

62

thành nơi nghẽn cổ chai trong toàn bộ hệ thống. Các vấn đề này dẫn tới cách

tiếp cận thứ hai.

• Phương pháp thứ hai: phát triển các mô hình dữ liệu thực thụ dành cho dữ liệu

MULTIMEDIA từ đầu chứ không xây dựng trên cơ sở của các CSDL truyền

thống, tuy nhiên mọi người đều nhất trí rằng các nỗ lực như vậy đều phải dựa

trên kỹ thuật hướng đối tượng.

3.3.2 Lưu trữ đối tượng MULTIMEDIA

Lưu trữ vật lý các dữ liệu multimedia đòi hỏi các phương thức để chuyển đổi, quản lý,

trao đổi và phân phối một số lượng dữ liệu khổng lồ, các hệ thống multimedia thông

thường sử dụng phương thức phân cấp đối với các thiết bị lưu trữ. Các thiết bị lưu trữ

online có tốc độ cao như RAM, HDD lưu trữ các dữ liệu đang được xử lý trong khi đó

các thiết bị lưu trữ offline (có tốc độ chậm) dùng để lưu trữ các dữ liệu có tính chất dài

hạn, cố định. Khi đó, hiệu suất sẽ phụ thuộc vào khả năng của cơ chế chuyển đổi các

dữ liệu multimedia tương ứng với mức tối ưu hoá trong hệ thống lưu trữ phân cấp.

Các cơ chế nén dữ liệu kết hợp với các cơ chế chuyển đổi dữ liệu giúp phần làm giảm

các yêu cầu khổng lồ về mặt lưu trữ, phương thức cơ bản được sử dụng ở đây là

chuyển đổi dữ liệu multimedia sang một số vùng chuyển đổi để loại bỏ sự dư thừa của

dữ liệu gốc, các quá trình giải nén sẽ làm nhiệm vụ chuyển đổi ngược các dữ liệu này

về dạng gốc của nó. Quá trình này sẽ dẫn đến việc mất mát dữ liệu, tuy nhiên việc mất

mát này đươc hầu hết các ứng dụng multimedia cho phép.

Phụ thuộc vào mức độ của hạt nhân mà một đối tượng multimedia có thể thể hiện toàn

bộ hoặc một phần đoạn video, một frame, một hình ảnh riêng lẻ thậm chí cả từng đối

tượng cá thể trong một ảnh hoặc một đoạn video. Vấn đề chính đặt ra ở đây là khả

năng lưu trữ có hạn, băng thông hạn chế của hệ thống lưu trữ các kênh truyền thông, tỷ

lệ sẵn sàng của các loại dữ liệu multimedia. Tỷ lệ sẵn sàng của dữ liệu chỉ ra số lượng

dữ liệu tối thiểu cần thiết đối với mỗi đơn vị thời gian cần đáp ứng đối với các đòi hỏi

63

về yêu cầu chất lượng trong quá trình thể hiện các đối tượng multimedia. Đứng từ quan

điểm này, các yêu cầu về lưu trữ của dữ liệu multimedia được giải quyết bằng cách

phân chia dữ liệu thành các đối tượng multimedia nhỏ hơn để có thể lưu trữ trong các

đơn vị lưu trữ nhỏ hơn.

Với việc sắp xếp lưu trữ phân cấp, các đối tượng multimedia có thể được lưu trữ ở các

mức độ khác nhau, khi mà tỷ lệ sử dụng các đối tượng dữ liệu multimedia thay đổi các

đối tượng này cần phải được phân phối lại có thể là được lưu trữ trên các thiết bị khác,

tại các mức khác nhau của hệ thống lưu trữ. Vấn đề cần giải quyết lúc này chỉ là tìm ra

giải pháp tối ưu cho việc phân rã, phân phối và tái phân phối các đối tượng multimedia.

3.3.3 Tích hợp multimedia, thể hiện và chất lượng của dịch vụ (QoS)

Khác với các dữ liệu truyền thống, dữ liệu multimedia đòi hỏi các ràng buộc về sự thể

hiện điều này bắt nguồn từ đặc tính liên tục của một số kiểu dữ liệu multimedia mà

chúng đòi hỏi thể hiện một số lượng nhất định dữ liệu trong một khoảng thời gian nhất

định mà kết quả đem lai cho người dùng vẫn phải đảm bảo được đặc trưng của các kiểu

dữ liệu đó. Khi mà dữ liệu multimedia được bố trí phân tán và truyền đi trên mạng thì

các vấn đề về thể hiện càng trở nên cấp thiết hơn, chúng ta đã bắt gặp điều này trong

trường hợp băng thông hạn chế. Các dữ liệu liên tục được định nghĩa là phục thuộc vào

thời gian, vì vậy thời gian trở thành một yếu tố quan trọng trong việc phân phát và thể

hiện chúng. Vì vậy trong MDBMS, thời gian hồi đáp đối với một câu hỏi thường được

đánh giá bởi cả tính chính xác và chất lượng đối với các kết quả khai thác.

Đứng từ quan điểm của người dùng, chất lượng, mức độ chấp nhận được về hiệu suất

của các loại dịch vụ khác nhau được cung cấp bởi hệ thống multimedia và có thể ảnh

hưởng đến kết quả của việc thể hiện multimedia. Vì vậy, để hỗ trợ cho việc thể hiện

multimedia trong điều kiện người dùng có thể xác định các mức độ QoS khác nhau đối

với các dịch vụ khác nhau, MDBMS cần phải hỗ trợ các mức QoS và một dịch vụ quản

64

lý QoS, chúng thông thường được thực hiện bằng cách cung cấp một ánh xạ tương ứng

từ QoS của người dùng sang QoS của hệ thống và ngược lại.

Khi thể hiện các loại dữ liệu multimedia khác nhau chẳng hạn video và âm thanh cùng

với nhau các vấn đề về tích hợp và đồng bộ các loại phương tiện trở nên hết sức quan

trọng. MDBMS cần phải cung cấp một cơ chế để đảm bảo sự đồng bộ trong việc thể

hiện cũng như đáp ứng được các yêu cầu khác như tỷ lệ sẵn sàng của dữ liệu và QoS.

Trong một vài trường hợp, MDBMS có thể phải dựa vào một cơ chế quản lý đồng bộ

hoá để đảm bảo được sự đồng bộ với một kiểu dữ liệu cho trước hoặc giữa các kiểu dữ

liệu khác nhau.

3.3.4 Chỉ số hoá multimedia

Cũng như trong các CSDL truyền thống, các dữ liệu multimedia có thể được khai thác

thông qua các định danh, các thuộc tính, các từ khoá và sự liên kết giữa chúng. Các từ

khoá là phương thức chiếm ưu thế trong việc sử dụng để chỉ số hoá dữ liệu

multimedia. Con người thường chọn các từ khoá từ một tập các từ vựng nhất định, điều

này tạo ra một số khó khăn khi áp dụng đối với dữ liệu multimedia vì chúng thường

được làm một cách thủ công và rất tốn thời gian và các kết quả thường là chủ quan và

rất hạn chế phụ thuộc vào từ vựng.

Một phương thức khác được sử dụng dựa trên việc truy cập nội dung, nó xem xét đến

nội dung thực sự của dữ liệu multimedia hoặc xuất phát từ ngữ cảnh của thông tin.

Trong thời gian gần đây, việc nghiên cứu chỉ số hoá dựa trên nội dung đã được tiến

hành hết sức mạnh mẽ với mục đích là chỉ số hoá dữ liệu multimedia dựa trên các đặc

trưng xác định thu được trực tiếp từ dữ liệu. Các đặc trưng khác nhau như mầu sắc,

hình dạng, kết cấu bề mặt, các chuỗi đặc trưng và các đặc trưng khác đã được dùng để

chỉ số hoá các ảnh.

Để thu được các đặc trưng này đòi hỏi phải phân tích tự động dữ liệu multimedia, các

phương thức chính được sử dụng đối với dữ liệu ảnh và dữ liệu video là xử lý ảnh,

65

đoán nhận ảnh và phân tích chuỗi video. Đối với dữ liệu video, chuỗi video trước tiên

được phân tách thành các chuỗi hợp thành, sau đó các đặc trưng tóm tắt (thường là các

frame khoá) sẽ được lựa chọn để đặc trưng cho mỗi chuỗi. Việc chỉ số hoá tiếp theo đối

với dữ liệu video cũng dựa trên các frame khoá cũng giống như đối với dữ liệu ảnh

Đối với dữ liệu âm thanh, việc chỉ số hoá dựa trên nội dung có thể có sự tham gia của

việc phân tích tín hiệu, tự động nhận biết lời nói cùng với việc chỉ số hoá dựa trên từ

khoá. Mặt khác, việc chỉ số hoá có thể dựa trên các thông tin khác phụ thuộc vào kiểu

của dữ liệu âm thanh, ví dụ một vài nhà phát triển đã sử dụng các đặc trưng về nhịp

điệu, hợp âm và giai điệu cho việc chỉ số hoá dựa trên nội dung đối với dữ liệu âm

thanh. Tương tự như vậy, việc tìm kiếm và khai thác dữ liệu âm thanh dựa trên nội

dung đã được đề xuất dựa trên các đặc tính của dữ liệu âm thanh như đã được chỉ ra

qua các đăc trưng về âm học và giác quan..

Việc chỉ số hoá dựa trên nội dung cũng gợi ra một vài vấn đề cần quan tâm. Trước hết,

cũng với một dữ liệu multimedia nhưng mỗi người có thể hiểu theo một cách khác

nhau. Thứ hai, người dùng thường cần các thông tin thay đổi khác nhau, vì vậy một đặc

trưng duy nhất có thể là không đủ để chỉ số hoá hoàn toàn một kiểu dữ liệu multimedia

cho trước. Một vấn đề khác cần phải xem xét là vấn đề hiệu quả, việc chỉ số hoá phải

nhanh và các chỉ số này phải được lưu trữ một cách hiệu quả để phục vụ cho việc truy

cập dễ dàng khi mà số lượng các dữ liệu multimedia được lưu trữ là rất lớn. Bởi vì đặc

tính vốn có của dữ liệu multimedia là rất khác nhau nên việc chỉ số hoá không thể tiến

hành một cách hoàn toàn tự động, đơn cử như máy tính có thể phân tích dễ dàng một

bức ảnh có chứa các tác phẩm nghệ thuật, nhưng nó gần như không thể tự động xác

định được ý nghĩa của tác phẩm đó, điều đó chỉ có con người làm được.

3.3.5 Hỗ trợ truy vấn multimedia, khai thác và duyệt qua.

Các câu hỏi của người dùng thường được xử lý sử dụng các chỉ số có sẵn, tuy nhiên

khác với CSDL truyền thống tính chính xác trong tìm kiếm đối với dữ liệu multimedia

66

không phải là chính xác tuyệt đối. Thông thường khi so sánh hai dữ liệu multimedia thì

kết quả thu được thường là gần đúng hoặc tương tự, giả sử trong trường hợp các dữ

liệu này có cùng dữ liệu đầu vào thì kết quả thu được từ một câu hỏi có thể sinh ra rất

nhiều giá trị. Đã có rất nhiều các nghiên cứu đi sâu vào việc tìm ra một phương thức

thích hợp trợ giúp cho người dùng có được một khả năng hiệu quả để khai thác các dữ

liệu multimedia, chẳng hạn thông qua việc cung cấp các giao diện thích hợp để người

dùng có thể duyệt một cách thuận lợi các kết quả có được từ quá trình tìm kiếm. Việc

hỗ trợ duyệt một cách trực tiếp cho phép người sử dụng có thể khai thác bất kỳ thông

tin nào có khả năng liên quan đến kết quả hiện thời bằng cách lựa chọn các mục dữ liệu

tương ứng cần quan tâm sâu hơn.

Truy vấn bằng ví dụ (Query-by-Example) là một phương thức chính được sử dụng để

nhập các câu hỏi đối với CSDL multimedia, đặc biệt là đối với dữ liệu ảnh. Ở đây

người dùng đưa ra các yêu cầu bằng cách sử dụng một mẫu có sẵn (ví dụ như một ảnh

tương tự), vì vậy giao diện được sử dụng để nhập câu hỏi vào hệ thống trở thành một

vấn đề cần phải quan tâm. Do tính chất đa dạng của các kiểu dữ liệu multimedia nên

mỗi kiểu dữ liệu multimedia có thể phải có các giao diện truy vấn khác nhau, vấn đề

cần được xem xét ở đây là làm thế nào để tích hợp được các giao diện khác nhau vào

một hệ thống tích hợp CSDL multimedia. Một vấn đề khác cũng cần phải giải quyết là

việc bao gồm truy vấn các dữ liệu không gian hoặc truy vấn các dự liệu tạm thời đòi

hỏi phải có các thông tin không gian hoặc tạm thời.

3.3.6 Quản trị CSDL multimedia phân tán

MDBMS phân tán có thể được hiểu là một bộ các MDBMS độc lập (các MDBMS này

có thể rất khác nhau) nằm tại các vị trí khác nhau mà có thể giao tiếp hoặc trao đổi dữ

liệu multimedia với nhau thông qua mạng. Các hệ thống multimedia thường được phân

tán với quan niệm một sự tương tác multimedia đơn lẻ thường liên quan đến việc dữ

liệu thu được từ các nguồn thông tin phân tán khác nhau. Điều này thường thấy trong

67

các môi trường multimedia cộng tác khi mà các người dùng có thể từ các địa điểm vật

lý khác nhau thao tác và là người tạo ra cùng một tài liệu multimedia. Ngoài ra, các vấn

đề về lưu trữ và phát sinh dữ liệu bắt buộc các nhà thiết kế hệ thống multimedia phải

bố trí dữ liệu multimedia ở các địa điểm khác nhau.

Để hỗ trợ cho việc truy vấn trong môi trường phân tán và cộng tác này , một MDBMS

phân tán phải xác định được các vấn đề tổng quát của CSDL phân tán như xử lý truy

vấn phân tán và song song, quản trị các giao dịch phân tán , sự trong suốt dữ liệu, an

toàn dữ liệu.. Ngoài ra các vấn đề về hệ thống mạng như băng thông hoặc độ trễ cũng

là các vấn đề quan trọng cần phải lưu tâm nhất là khi chúng có xu hướng bất lợi đối với

việc hỗ trợ QoS.

Không giống như DBMS truyền thống, việc tái tạo dữ liệu thường không được khuyến

khích trong MDBMS phân tán do số lượng dữ liệu khổng lồ. Mô hình tính toán

Khách-Chủ (client-server), trong đó các dịch vụ ứng dụng của máy chủ phục vụ cho

nhiều ứng dụng khách khác nhau (các dịch vụ của server và các ứng dụng client có thể

nằm ở các máy khác nhau) đã được chứng minh là thích hợp nhất cho các các hệ thống

multimedia trong cả trường hợp tổng quát cũng như đối với MDBMS phân tán.

3.3.7 Sự hỗ trợ của hệ thống

Các ứng dụng multimedia và các hệ thống CSDl multimedia phân tán đặt ra các yêu

cầu mới đối với tất cả các khía cạnh của hệ thống máy tính, từ các yêu cầu về hệ điều

hành, hệ thống mạng cũng như các yêu cầu về phần cứng. Hầu hết các hệ điều hành

hiện tại chưa hỗ trợ các xử lý mang tính thời gian thực. Một vài dữ liệu multimedia

chẳng hạn như các dữ liệu có tính liên tục có thể đòi hỏi các tính năng phân phát và thể

hiện thời gian thực mặc dù các yêu cầu về thời gian thực này có thể không nghiêm ngặt

như đối với các yêu cầu về thời gian thực thường bắt gặp đối với phần cứng. Vì vậy,

các hệ thống CSDL multimedia không thể cung cấp đầy đủ các tính năng cần thiết theo

68

yêu cầu trừ khi các hỗ trợ thời gian thực cho các thiết bị multimedia trở thành một

phần không thể thiếu của hệ điều hành.

Các đặc tính khác của multimedia chẳng hạn như số lượng lớn dữ liệu cần phải lưu trữ

có thể đòi hỏi một số ràng buộc đặc biệt đi với hệ thống về mặt quản lý bộ nhớ, hiệu

suất của CPU. Các vấn để khác cũng cần phải xem xét đến ở đây bao gồm việc quản lý

cơ chế vào/ra (I/O) của phần cứng nhằm mục đích hỗ trợ cho các kiểu khác nhau có

mặt trong CSDL multimedia, hệ thống mạng viễn thông cũng phải đảm bảo cho việc

truyền tải dữ liệu cho các môi trường multimedia phân tán đáp ứng các đòi hỏi nghiêm

ngặt của QoS đối với các ứng dụng cụ thể

69

CHƯƠNG 4

XÂY DỰNG HỆ THỐNG MUA BÁN HÀNG QUA MẠNG

4.2.1. Giới thiệu

Thương mại điện tử tiếng Anh là Electronic Commerce hay thường viết tắt là

eCommerce. Khi nói đến thương mại điện tử là người ta hay nghĩ đến việc sử dụng

Internet trợ giúp cho công việc kinh doanh. Trên thực tế, thương mại điện tử có vai trò

quan trọng hơn nhiều.

Vậy chúng ta hiểu thương mại điện tử như thế nào?. Có một số ý kiến cho rằng:

thương mại điện tử là mọi hình thức giao dịch được hỗ trợ bởi các phương tiện điện tử.

Nói như vậy có nghĩa là tất cả mọi hoạt động kinh doanh hiện nay đều là thương mại

điện tử vì đều sử dụng điện thoại, fax hay email... và tất cả đều là phương tiện điện tử?.

Trước hết, thuật ngữ thương mại điện tử chỉ mới được sử dụng khi có một số

người đã thực hiện được việc mua bán qua mạng Internet bằng cách trả tiền bằng một

loại tiền đã được mã hoá.

Vậy thương mại điện tử chỉ có thể thực hiện được qua Internet hay hệ thống các

máy tính nối mạng?. Đúng như vậy, nhưng không phải giao dịch nào trên Internet cũng

được gọi là thương mại điện tử. Các ứng dụng kinh doanh trên Internet được chia là 4

mức độ khác nhau:

• Brochureware: Quảng cáo trên Internet

• eCommerce: Thương mại điện tử

• eBusiness: Kinh doanh điện tử

• eEnterprise: Doanh nghiệp điện tử

70

Trong những năm gần đây, với sự bùng nổ của Internet, thương mại điện tử cũng đã

phát triển mạnh mẽ trên toàn thế giới. Tại các nước đang phát triển như Mỹ, Canada,

liên minh Châu Âu (EU) thương mại điện tử đã được áp dụng rất rộng rãi và mang lại

nhiều lợi ích cho cả người sử dụng cũng như các nhà cung cấp.

Hệ thống bán hàng qua mạng dự định xây dựng bao gồm những mục tiêu chính sau

• Mục đích: Hệ thống được thiết kế và xây dựng theo mô hình B2C, B2B. Việc

xây dựng hệ thống bao gồm các công việc: xây dựng hệ thống thực hiện việc

đăng ký giới thiệu, quảng bá các hàng hoá sản phẩm của doanh nghiệp, quản lý

các loại hàng hóa sản phẩm, quản lý việc kinh doanh hàng hoá và thực hiện mua

bán hàng hoá sản phẩm.

• Phạm vi: Trên mạng Internet, mô hình Client-Server. Hệ thống được hosting

trên một ISP (nhà cung cấp dịch vụ) trong nước

• Ứng dụng công nghệ mới: Áp dụng các kỹ thuật đa phương tiện tiến tiến nhằm

mục đích nâng cao hiệu quả kinh doanh của hệ thống.

4.2.2. Ứng dụng CSDL đa phương tiện vào hệ thống bán hàng qua

mạng

Việc xây dựng hệ thống bán hàng qua mạng được tiến hành qua 2 giai đoạn

• Giai đoạn 1: tiến hành xây dựng các chức năng cơ bản, cần thiết cho một

hệ thống B2C, B2B. Sau khi giai đoạn này kết thúc, người dùng đã có thể

sử dụng được các chức năng cơ bản của một hệ thống bán hàng qua

mạng, các doanh nghiệp cũng có được các chức năng chủ yếu để có thể

tiến hành các giao dịch thương mại với nhau.

• Giai đoạn 2: ứng dụng công nghệ đa phương tiện nhằm nâng cao hiệu

quả cũng như đáp ứng các đòi hỏi cao cấp của khách hàng. Cụ thể ở giai

đoạn này sẽ tiến hành ứng dụng công nghệ 2D, 3D trong việc hỗ trợ hiển

thị và tìm kiếm các sản phẩm, hàng hóa

71

4.2.1. Xây dựng kho dữ liệu hình ảnh 2D và 3D

Việc xây dựng kho dữ liệu 2D và 3D đối với các sản phẩm hàng hóa sẽ được tiến hành

theo 2 cách:

• Đối với các hình ảnh 2D: các sản phẩm, hàng hóa sẽ được số hóa thông

qua việc chụp hình bằng máy ảnh số (sử dụng máy ảnh số chất lượng

cao), hoặc dùng máy quét (Flatbed Scan) để số hóa các ảnh chụp đã có

sẵn. Định dạng của các ảnh này là .JPG.

• Các sản phẩm, hàng hóa cần lưu dưới dạng 3D sẽ được quét trực tiếp

bằng máy quét 3D chuyên dụng, kích thước tối đa về chiều cao của vật

thể được quét là 1.2m và tối thiểu là 10cm. Sau khi được xử lý, các vật

thể 3D này sẽ được lưu dưới dạng vector VRM

Sở dĩ chúng tôi chọn 2 định dạng này để lưu trữ vì chúng là các định dạng phổ biến và

được hỗ trợ tốt nhất đối với việc xây dựng các ứng dụng dựa trên nền web.

4.2.2. Xây dựng cơ chế truy vấn đối với kho dữ liệu hình ảnh

Việc xây dựng cơ chế truy vấn đối với kho dữ liệu ảnh được chia làm hai phần[15]

• Xây dựng giao diện truy vấn cho người dùng: giao diện truy vấn cho người

dùng sẽ được xây dựng dưới dạng component ActiveX để có thể plugin vào web

browser của người dùng. Mỗi khi truy vấn đến kho dữ liệu hình ảnh 2D và 3 D

người dùng sẽ thao tác thông qua giao diện này.

• Xây dựng cơ chế truy vấn tại server: cơ chế truy vấn này sẽ tiếp nhận yêu cầu

truy vấn từ phía người dùng, xử lý và trả lại kết quả mong muốn cho người

dùng.

72

Hình 4.1 sẽ minh họa cho việc xây dựng và vận hành cơ chế truy vấn này

Hình 4.1 Cơ chế truy vấn kho dữ liệu hình ảnh 2D,3D

Giải thích mô hình: trong cơ chế truy vấn, người dùng có thể truy xuất đến các hình

ảnh mong muốn bằng cách cung cấp các ảnh mẫu, các ảnh mẫu này có thể là toàn bộ

hoặc một phần của của ảnh gốc. Người dùng có thể tìm kiếm thông qua mầu sắc hoặc

tìm kiến thông qua hình dáng. Các bước truy vấn được diễn ra như sau:

• Bước 1: người dùng chọn ảnh mẫu (một phần hoặc toàn bộ), chọn kiểu truy vấn

(theo mầu sắc, theo hình dáng) sau đó gửi câu hỏi đến server.

• Bước 2: khi cơ chế truy vấn trên server nhận được câu hỏi, nó sẽ chuyển ảnh

mẫu và các yêu cầu kèm theo đến phần trích rút đặc trưng và đến cơ chế học

một cách riêng biệt.

73

• Bước 3: sau khi đã trích rút được các đặc trưng, cơ chế trích rút đặc trưng sẽ gửi

các thông tin đặc trưng của ảnh truy vấn đến cơ chế đo độ tương đồng và cơ chế

lọc.

• Bước 4: dựa vào các thông tin đặc trưng, cơ chế quản lý file sẽ lấy các ảnh có

liên quan để phục vụ cho việc đo tương đồng một cách chi tiết.

• Bước 5: cơ chế đo độ tương đồng sẽ đo độ tương đồng giữa các thông tin đặc

trưng của ảnh mẫu truy vấn với cơ sở dữ liệu hình ảnh và trả các kết quả thu

được về cơ chế học.

• Bước 6: Cơ chế học sẽ sắp xếp kết quả với thứ tự ưu tiên các ảnh thuộc cơ sở dữ

liệu hình ảnh tương đồng nhất với ảnh mẫu để truy vấn, sau đó trả kết quả về

cho cơ chế truy vấn (ID của các ảnh trong CSDL)

• Bước 7: cơ chế truy vấn sẽ trả kết quả về cho giao diện của phía client.

4.2.3. Hệ thống bán hàng qua mạng

4.3.1. Mô hình hệ thống

Hình 4.2 là mô hình hệ thống được lựa chọn. Theo thiết kế, Trung tâm Thông tin Bộ

Thương mại (Trung tâm) đóng vai trò trung tâm giao dịch. Tại đây sẽ xây dựng một

Web site mua bán hàng hoá. Các siêu thị sẽ cung cấp danh mục hàng, thông tin về

doanh nghiệp cùng các thông tin liên quan. Thông qua Web site, khách hàng sẽ tìm

kiếm, chọn hàng, đặt mua hàng, ... Các thông tin này sẽ được kiểm tra và xây dựng

thành các đơn hàng và được chuyển về cho các siêu thị tương ứng. Khi nhận được

đơn hàng do Trung tâm gửi đến, các siêu thị sẽ kiểm tra và gửi lại thông tin xác nhận

đơn hàng cùng cách thức thanh toán và giao hàng cho Trung tâm. Khi nhận được các

thông tin này Trung tâm sẽ gửi về cho khách hàng. Trong công việc thanh toán, người

sử dụng có thể lựa chọn hình thức thanh toán bằng tiền mặt hoặc thanh toán qua ngân

hàng. Trong trường hợp thanh toán bằng tiền mặt, khách hàng có thể thanh toán tại

74

nhà hay thông qua một văn phòng đại diện. Trong trường hợp thanh toán qua ngân

hàng hệ thống sẽ liên kết đến hệ thống thanh toán qua mạng của Ngân hàng công

Trao đổi thêm các thông tin khác

thương Việt Nam.

Máy tính khách

Máy chủ của doanh nghiệp (siêu thị)

Đơn hàng, yêu cầu dữ liệu, ...

Thông báo về thanh toán, giao hà

Tìm kiếm, chọn hàng, mua hàng, hỏi thông tin hàng,

Thông tin xác nhận đơn hàng, cách thức giao hàng, cập nhật

Máy chủ tại Trung tâm Thông tin Bộ Thương mại

Hình 4.2. Mô hình hệ thống bán hàng qua mạng

Mô hình giúp cho nhiều doanh nghiệp có thể nhanh chóng tham gia vào hệ thống

thương mại điện tử với chí phí thấp. Khi một doanh nghiệp muốn tham gia vào hệ thống

chỉ cần đăng ký thông qua Bộ Thương mại. Đối với doanh nghiệp vừa và nhỏ, việc trao

đổi, cập nhật thông tin lên hệ thống có thể được thực hiện thông qua thư điện tử hay kết

nối modem qua đường điện thoại thông thường. Đối với người sử dụng, đây là mô hình

giao dịch một cửa, mô hình giúp người sử dụng có nhiều thông tin và điều kiện so sánh,

lựa chọn, đặt hàng tại nhiều công ty trong cùng một giao dịch điều này rất thuận tiện

cho khách hàng khi mua hàng của nhiều doanh nghiệp (khách hàng không phải thực

hiện riêng từng giao dịch (lập đơn hàng, thanh toán, nhận hàng,...) với từng doanh

nghiệp).

75

4.3.2. Các chức năng cơ bản của hệ thống

Hệ thống được thiết kế với các chức năng cơ bản :

(cid:131) Trang Web cho phép doanh nghiệp thông qua đó có thể nhập thông tin về các loại

hàng hóa sản phẩm mà họ muốn đăng ký giới thiệu và thực hiện kinh doanh.

(cid:131) Cập nhật thông tin về các sản phẩm, hàng hoá vào cơ sở dữ liệu của hệ thống khi

doanh nghiệp có yêu cầu sửa đổi, thêm thông tin mới về hàng hóa.

(cid:131) Quản lý hàng: Quản lý các loại hàng hoá, sản phẩm xuất đi của doanh nghiệp, lưu

trữ các thông tin cụ thể mô tả các thuộc tính (hình ảnh, tên model, công dụng, các

chỉ tiêu kỹ thuật, thời gian sản xuất, hãng sản xuất...), số lượng hiện có, số lượng

đã bán của các model của từng loại hàng hoá, các thông tin thời gian xuất, thông

tin của hãng sản xuất hàng...

(cid:131) Quản lý thông tin của các phiên giao dịch đã thực hiện như đơn hàng, tên, địa chỉ

khách hàng, nơi giao nhận, thời gian đặt hàng, thời gian xuất hàng,...

(cid:131) Quản lý thông tin của các phiên giao dịch đang thực hiện phục vụ việc theo dõi về

tình hình các phiên giao dịch đang được thực hiện như số tiền mà khách hàng trả

trước, số lượng hàng hoá đã giao nhận, thời gian dự kiến kết thúc giao dịch, có

đánh giá tiến độ thực hiện...

(cid:131) Quản lý giá cả kinh doanh: quản lý các thông tin về giá bán ra của từng loại hàng

hoá theo thời gian.

(cid:131) Xây dựng chức năng quản lý khách hàng.

(cid:131) Xây dựng trang Web giới thiệu, quảng cáo các loại sản phẩm hàng hóa, đưa các

mô tả chi tiết về các thuộc tính của các model của từng loại hàng hoá, giá cả tính

theo loại tiền mà khách hàng lựa chọn.

(cid:131) Tìm kiếm hàng hoá theo một hoặc nhiều mô tả thuộc tính hàng hoá như tên hàng,

tên hãng sản xuất, giá cả... Liệt kê hiển thị kết quả tìm kiếm.

76

(cid:131) Tạo lập giỏ mua hàng: chức năng cho phép khách hàng chọn và quản lý các hàng

mà khách đã chọn.

(cid:131) Tạo lập hoá đơn đặt hàng: tạo hoá đơn đặt hàng, tính giá thành của đơn hàng.

(cid:131) Cho phép khách hàng theo dõi quá trình thực hiện đơn hàng.

(cid:131) Thanh toán và giao hàng:

(cid:131) Thanh toán trực tiếp hoặc kết hợp với Ngân hàng thanh toán qua ngân hàng.

(cid:131) Phương thức giao hàng: tuỳ thuộc điều kiện cụ thể mà thông báo giao hàng tại

nhà hay tại từng cửa hàng.

(cid:131) Có khả năng liên kết tới các Web site riêng của doanh nghiệp.

(cid:131) Thực hiện các dịch vụ khách hàng: Dịch vụ hướng dẫn khách hàng mua bán các

sản phẩm hàng hoá; dịch vụ khuyến mãi hàng hoá; dịch vụ giới thiệu, quảng cáo

các loại hàng hoá mới; dịch vụ trả lời câu hỏi và lấy ý kiến góp ý của khách hàng;

Hệ thống trợ giúp dịch vụ bảo hành, bảo trì sản phẩm.

4.3.3. Các công cụ phát triển hệ thống

• Máy chủ: Microsoft Windows 2000 Advanced Server SP4.

• Web Server: IIS 6.

• Database: Microsoft SQL Server 2000 Enterprise Edition SP3.

• Công cụ phát triển: Microsfot Visual Studio.NET 2003

77

4.3.4. Quy trình thực hiện giao dịch của hệ thống

Hình 4.3 Quy trình thực hiện giao dịch của hệ thống

Hình 4.3 là quy trình thực hiện giao dịch của hệ thống. Các công việc thực hiện trong

từng giai đoạn:

• Tìm kiếm: thực hiện các công việc liệt kê, tìm kiếm, lựa chọn hàng.

• Giỏ hàng: cung cấp các thông tin về hàng; lấy thông tin về số lượng hàng; tính giá sơ bộ cho các mặt hàng có trong giỏ hàng.

• Đặt hàng: hỏi các thông tin về hàng; hỏi thông tin địa điểm, thời gian giao hàng; xác nhận thông tin về số lượng hàng; tính giá toàn bộ dơn hàng.

• Kiểm tra khả năng thanh toán: kiểm tra khả năng thanh toán của khách hàng thông qua tài khoản của khách hàng tại ngân hàng hoặc thẻ tín dụng.

• Phân chia đơn hàng: tách đơn hàng tổng thành các đơn hàng riêng cho từng siêu thị.

• Kiểm tra thực hiện đơn hàng: kiểm tra khả năng cung cấp hàng của từng siêu thị.

78

• Liên hệ với khách hàng: thỏa thuận thời gian, địa điểm giao hàng; thỏa thuận phương thức thanh toán.

• Thực hiện đơn hàng: xác nhận các giao dịch; xác nhận việc hoàn tất đơn hàng; cập nhật đơn hàng.

4.3.5. Cài đặt hệ thống

Hệ thống được thiết kế theo mô hình khách/chủ trên Internet (hình 5) theo công nghệ

của Microsoft [Ramesh Chandak, Purshottam Chandak, 1998]. Máy trạm cung cấp

dịch vụ duyệt web, trình bầy giới thiệu sản phẩm, giao dịch với khách hàng. Máy chủ

Trung tâm có nhiệm vụ: quản lý các CSDL: công ty, hàng hoá, khách hàng, giao

dịch,...; cung cấp các dịch vụ internet, dịch vụ quảng bá thông tin, tìm kiếm thông tin,

giao dịch với khách hàng và doanh nghiệp. Máy chủ tại siêu thị có chức năng cung cấp

thông tin; nhận và xử lý các thông tin (đơn hàng, yêu cầu cập nhật dữ liệu,...) do máy

chủ trung tâm gửi tới; cung cấp, trả lời các yêu cầu cho máy chủ Trung tâm.

Máy khách

Trung tâm

Siêu thị

Các yêu cầu

Đơn hàng

Trình duyệt Web

Dịch vụ Web

Dịch vụ Web

Trang HTML kết quả

Trình TMĐT 1

Trình TMĐT 2

Xác nhận đơn hàng, yêu cầu cập nhật hàng, ...

CSDL TMĐT

CSDL hàng của siêu thị

4.4. Mô hình thiết kế cài đặt hệ thống

79

• Trình duyệt Web trên máy khách được bổ xung một số tính năng để kiểm tra,

trình diễn sản phẩm như ActiveX, Flash, ...

• Cơ sở dữ liệu thương mại điện tử chứa thông tin về các công ty và các mặt hàng,

thông tin khách hàng, thông tin giao dịch,... được xây dựng trên hệ quản trị cơ

sở dữ liệu SQL Server.

• Cơ sở dữ liệu hàng của siêu thị lưu trữ thông tin về hàng hóa của siêu thị được

xây dựng trên hệ quản trị cơ sở dữ liệu SQL Server hay Access.

• Trình thương mại điện tử 1 trên máy chủ Trung tâm bao gồm nhiều môđun

chương trình có nhiệm vụ chính:

o Xử lý yêu cầu tìm kiếm thông tin, chọn hàng, đặt mua hàng,... của khách

hàng và xây dựng các HTML trang kết quả.

o Xây dựng đơn hàng.

o Gửi đơn hàng về các siêu thị tương ứng.

o Tiếp nhận và xử lý thông tin từ các siêu thị.

o Quản lý khách hàng.

o Quản lý giao dịch,...

• Trình thương mại điện tử 2 trên máy chủ của siêu thị bao gồm nhiều môđun

chương trình có nhiệm vụ chính:

o Tiếp nhận đơn hàng.

o Xử lý đơn hàng.

o Gửi yêu cầu cập nhật hàng hoá cho Trung tâm.

• Các trình thương mại điện tử được xây dựng bằng ASP.NET, ADO.NET, kết

hợp với lập trình mở rộng dịch vụ Web của Microsoft. Với việc lựa chọn trên

giúp cho việc mở rộng hay tích hợp với các môi trường CSDL khác được thuận

lợi.

80

4.4. Giải pháp tích hợp các hệ thống khác

4.4.1. Hệ thống quản lý và cấp phát chứng chỉ số (CA)

CA là một tệp tin điện tử dùng trong các giao dich trên môi trường mạng hoặc Internet

để chứng thực các đối tượng sử dụng, đảm bảo an toàn và bảo mật thông tin, cung cấp

bằng chứng pháp lý nếu xảy ra tranh chấp.

Hiện tại có ba loại chứng chỉ số:

• Chứng chỉ số cho cá nhân

• Chứng chỉ số cho máy chủ (server)

• Chứng chỉ số cho nhà phát triển phần mềm

Trong tài liệu này chúng tôi chỉ nêu hệ thống chứng chỉ số cho máy chủ. Hệ thống CA

này nhằm bảo mật cho Website:

• Đảm bảo với khách hàng khi tham gia hệ thống về tính xác thực và tính hợp

pháp của Website

• Cho phép trao đổi thông tin an toàn và bảo mật giữa Website với những khách

hàng, nhân viên và đối tác thông qua giao thức SSL (giao thức truyền tin có bảo

mật)

Hệ thống này được xây dựng dựa trên công nghệ PKI (Public Key Infrastructure) - một

trong những công nghệ an toàn bảo mật quan trọng nhất hiện nay, được dùng làm nền

tảng cho nhiều các ứng dụng trên mạng, CA tránh được các nguy cơ mất an toàn thông

tin thường xảy ra trong các giao dịch quan trọng trên các hệ thống mạng. Người sử

dụng có thể hoàn toàn yên tâm về độ an toàn nếu bạn đang giao dịch với một người

hoặc một doanh nghiệp được cấp chứng chỉ số CA.

81

Người dùng cuối (end-user): gồm những người thực hiện các giao dịch qua Internet,

gửi-nhận các yêu cầu trao đổi, mua bán hàng hóa, thông tin có thể tránh được các nguy

cơ mất an toàn thông tin trong quá trình giao dịch điện tử với việc sử dụng chứng chỉ

số CA.

NCC gateway

VASC gateway

Database

Database

HÖ thèng cña NCC

VASC Payment

M« h×nh trao ®æi gi÷a 2 hÖ thèng Application Server

4.4.2. Hệ thống thanh toán trực tuyến (VASC Payment)

Hình trên là mô trao đổi thông tin giữa VASC Payment và NCC. Quá trình trao đổi này

diễn ra thường xuyên. VASC Payment sẽ nhận các lệnh thanh toán từ NCC và cập nhật

trang thái của từng lệnh thanh toán hoá đơn ngay sau khi nhận được phản hồi trả về từ

ngân hàng đối tác.

Quá trình trao đổi trên diễn ra ở độc lập với quá trình trao đổi trên Web.

Các hình thức trao đổi: Bằng Socket theo giao thức TCP/IP (tham khảo phương án kỹ

thuật kết nối bằng Socket – TCP/IP)

Các nghiệp vụ chính bao gồm:

• Nhận lệnh thanh toán hoá đơn

o VASC Payment sẽ nhận lệnh thanh toán do NCC chuyển đến. Lệnh thanh

toán này được xem như một ủy nhiệm chi bao gồm: Thông tin người trả

tiền; thông tin tài khoản trả; thông tin hoá đơn: số hoá đơn, số tiền; thông

tin về người nhận và tài khoản nhận. Ngoài ra để xác thực đối tượng

82

người gửi và bảo mật thông tin dữ liệu này được mã hoá bởi khoá riêng

của NCC.

o Lệnh thanh toán này sẽ được VASC payment chuyển đến NH tương ứng

để thực hiện chuyển khoản. Nều gửi thành công, VASC Payment sẽ

thông báo cho NCC.

• Cập nhật trạng thái lệnh thanh toán: Với mỗi lệnh thanh toán gửi sang VASC

Payment sẽ được gán một trạng thái ứng với tình trạng hiện tại. Các trạng thái

gồm có:

o A: Gửi lệnh thành công sang VASC Payment

o W: Đang chờ NH xử lý

o R: Lệnh thanh toán đã không thực hiện được

o D: Lệnh thanh toán đã được thực hiện thành công.

VASC Payment thường xuyên cập nhật các trạng thái lệnh thanh toán cho nhà

cung cấp. Căn cứ trên trạng thái của lệnh thanh toán NCC sẽ tiến hành xử lý đơn hàng.

83

4.5. Một số giao diện chính của hệ thống

Hình 4.5 Trang chủ của hệ thống

84

Hình 4.6 Trang chủ của một siêu thị thành viên

Hình 4.6 Thông tin về một chủng loại sản phẩm

85

Hình 4.7 Hệ thống hỗ trợ đa ngữ Việt - Anh

86

KẾT LUẬN

CSDL multimedia và các vấn để khác có liên quan đến nó như việc tổ chức, khai thác

nội dung thông tin vv.. đã và đang là những vấn đề mang tính thời sự của CNTT. Bản

luận văn này đã đề cập được một số vấn đề mang tính chất cơ sở của cơ sở dữ liệu đa

phương tiện như cách thức và mô hình lưu trữ dữ liệu, cách thức chỉ số hoá cũng như

các yêu cầu và các vấn đề cần được giải quyết đối với một hệ thống quản trị cơ sở dữ

liệu đa phương tiện (MDBMS). Bản luận văn cũng đề cập đến việc xây dựng một hệ

thống bán hàng qua mạng, các thành phần và các yêu cầu cơ bản của một hệ thống bán

hàng qua mạng làm cơ sở cho việc tiếp tục ứng dụng các công nghệ đa phương tiện cho

việc cung cấp các sản phẩm, dịch vụ qua mạng Internet.

Do sự eo hẹp về thời gian cũng như hạn chế về tài liệu cũng như sự thiếu thốn về các

thiết bị multimedia hiện có tại Việt nam nên bản luận văn chưa thể đi sâu vào việc

triển khai một mô hình khả thi áp dụng các kỹ thuật về multimedia như mong muốn.

Tuy nhiên sau bản luận văn này, các hướng nghiên cứu tiếp theo sẽ được tác giả triển

khai tiếp tục:

• Xây dựng một hệ thống quản trị nội dung multimedia (multimedia Content

management system) dựa trên chuẩn MPEG-7 nhằm phục vụ cho các dịch vụ về

truyền thanh, truyền hình (video on demand).

• Nghiên cứu một số kỹ thuật trích rút nội dung tự động từ dữ liệu multimedia

• Ứng dụng công nghệ 3D trong việc bán hàng qua mạng.

87

TÀI LIỆU THAM KHẢO

Tiếng Anh

[1]. Adjeroh D., Nwosu K.; "Multimedia Databases Management - Requirements

and Issues", IEEE Multimedia, July- September 1997.

[2]. Berra B., Nwosu K., Thuraisingham B.; "Multimedia Database Systems - A

New Frontier", IEEE Multimedia, July-September 1997.

[3]. Chen C.Y.R. , “Design of a Multimedia Object- Oriented DBMS,” Multimedia

Systems, Vol. 3, No. 5-6, 1995, pp. 217-227.

[4]. Flickner.M, Sawhney.H, Niblack.W, Ashley.J, Huang.Q,Dom.B,

Gorkani.D,Hafner.J, Lee. D, Petkovic. D, Steele.D,Yanker.D Query by Image and

Video Content : The QBIC System. IEEE Computer 1995, september, pp. 23-32.

[5]. Flynn R. - Tetzlaff W. ; "Multimedia an Introduction", IBM Journal Res. Dev.

Vol.42 No.2, March 1998.

[6]. Hull. R and King. R, “Semantic Database Modeling: Survey, Applications, and

Research Issues,” ACM Computing Surveys, Vol. 19, No. 3, 1987, pp.201-260.

[7]. Kim.W, , Modern Database Systems: The ObjectModel, Interoperability, and

Beyond, Addison-Wesley, Reading, Mass., 1995.

[8]. Khoshafian.S and Baker.B.A., Multimedia and Imaging Databases, Morgan

Kaufmann Publishers, San Francisco, Calif., 1996.

[9]. Kosch. H Distributed Multimedia Database Technologies Supported by MPEG-

7 and MPEG-21 ISBN:0849318548 Auerbach Publications © 2004

[10]. Kuo F.- Effelsberg W.- Garcia-Luna-Aceves J.; Multimedia Communications,

Prentice Hall,1998

[11]. Marcus. S and Subrahmanian V.S. , “Foundations of Multimedia Database

Systems,” J. ACM, Vol. 43, No. 3, May 1995, pp. 474-523.

88

[12]. Narasimhalu. A, “Multimedia Databases,” MultimediaSystems, Vol. 5, No. 4,

Oct. 1996, pp. 226-249.

[13]. Pazandak P., Srivastava J.; "Evaluating Object DBMSs for Multimedia", IEEE

Multimedia July-September 1997.

[14]. Polese. G, Chang.S.K. Towards a Theory of Normalization for Multimedia

Databases IEEE 2001 Symposia on Human Centric Computing Languages and

Environments (HCC'01) Publication Date: September 2001 pp. 406

[15]. Rahman.S.M Interactive Multimedia Systems ISBN:1931777071 Idea Group Publishing © 2002 [16]. Rodriguez. A.A. and Rowe. L.A. , “Multimedia Systems and Applications,”

Computer, Vol. 28, No. 5, 1995, pp. 20-22.

[17]. Shih.T.K Distributed Multimedia Databases: Techniques and Applications ISBN:1930708297 Idea Group Publishing © 2002 [18]. Subrahmanian.V.S Principles Of Multimedia Database Systems Morgan

Kaufmann publishers, Inc 1997

[19]. Woelk. D, Kim. W, and Luther. W, “An Object- Oriented Approach to

Multimedia Databases,” Proc. ACM SIGMOD 1986 Int’l Conf. on Management of

Data, Vol. 15, No. 2, 1986, ACM Press, New York, pp.311-325.