TAÏP CHÍ KHOA HOÏC ÑAÏI HOÏC SAØI GOØN Soá 1 (26) - Thaùng 1/2015<br />
<br />
<br />
ÁP DỤNG LÝ THUYẾT TẬP M ĐỂ MỞ RỘNG CSDL QUAN HỆ<br />
<br />
NGUYỄN HÒA(*)<br />
NGUYỄN THỊ UYÊN NHI (**)<br />
<br />
T M TẮT<br />
-Fuzzy Relational<br />
eM e) r ủ r<br />
) )<br />
r r ủ<br />
r M ủ<br />
r r<br />
ủ M<br />
ủ<br />
r ủ r<br />
r .<br />
óa: tậ ờ, qu ờ, sở d u qu ờ é o ạ s qu ờ.<br />
<br />
ABSTRACT<br />
This paper introduces a fuzzy relational data base model (FRDB) that extends the<br />
conventional relational data base model with two key features: (1) the relations represent<br />
the set of data tuples to be the fuzzy relations; (2) selection conditions are associated with<br />
fuzzy set values to be able to query the fuzzy, imprecise information of objects in relations.<br />
An interpretation of the membership degree of tuples for fuzzy relations is proposed on the<br />
foundation of the fuzzy set theory as the basis to develop the data and data manipulating<br />
model of FRDB including schemas, fuzzy relations and algebraic operations. Some<br />
properties of the fuzzy relational algebraic operations also are formulated and proven as<br />
those that are extended of the properties of relational algebraic operations in the<br />
conventional relational data base model.<br />
Keywords: fuzzy set, fuzzy relation, fuzzy relational data base, fuzzy relational<br />
algebraic operation.<br />
<br />
<br />
1. GIỚI THIỆU(*)(**) từ phần mềm cho đến cơ sở dữ liệu<br />
Như chúng ta đã biết, mô hình sở (CSDL). Tuy nhiên, các ứng dụng dựa trên<br />
d u qu uyề (conventional mô hình CSDL quan hệ truyền thống<br />
relational data base), được đề nghị bởi không biểu diễn được các đối tượng mà<br />
Codd E.F năm 1 70 ([2]), đã chứng tỏ thông tin về chúng không được xác định<br />
nhiều ưu điểm trong các vấn đề mô hình một cách rõ ràng và chính xác. Điều đó<br />
hóa, thiết kế và hiện thực các hệ thống lớn, làm hạn chế khả năng mô hình hóa và giải<br />
quyết các bài toán áp dụng trong thế giới<br />
(*)<br />
TS, Trường Đại học Sài Gòn thực. Chẳng hạn, các ứng dụng mô hình<br />
(**)<br />
ThS, Trường Đại học Sài Gòn<br />
<br />
108<br />
CSDL truyền thống không thể trả lời được Trong cách tiếp cận thứ nhất, giá trị<br />
các truy vấn kiểu như “tìm tất cả những thuộc tính quan hệ được biểu diễn bằng<br />
bệnh nhân ẻ có tiền sử bệnh viêm thanh một tập mờ và được diễn dịch bởi hàm<br />
quản”; hoặc “tìm tất cả các gói bưu kiện có thành viên của nó ([4], [7], [ ], [11]).<br />
trọng lượng k oả 10 kg và được vận Trong các mô hình được xây dựng bằng<br />
chuyển trong thời gian k oả 36 giờ từ cách tiếp cận này, các quan hệ hai ngôi cổ<br />
Hà Nội đến Sài Gòn”, v.v. Trong đó ẻ, điển giữa các thuộc tính được mở rộng<br />
k oả 10 kg và k oả 36 giờ là những thành các quan hệ mờ. Mức độ thành viên<br />
khái niệm và giá trị không chính xác. Để của các bộ được ẩn trong mức độ thành<br />
khắc phục được các hạn chế như vậy, cần viên của các giá trị thuộc tính. Trong cách<br />
phải xây dựng các mô hình dữ liệu có khả tiếp cận thứ hai, giá trị thuộc tính quan hệ<br />
năng biểu diễn và xử lý được các đối tượng được biểu diễn bằng một giá trị đơn rõ<br />
mà các thông tin về chúng có thể không rõ trong một quan hệ mờ trên các miền giá trị<br />
ràng (mờ) và không chính xác. của các thuộc tính đó ([ ], [ ], [10]). Trong<br />
Trong những năm qua đã có nhiều mô các mô hình được xây dựng bằng cách tiếp<br />
hình cơ sở dữ liệu quan hệ dựa trên lý cận này, các quan hệ nhiều ngôi cổ điển<br />
thuyết ậ ờ (fuzzy set) được nghiên cứu (quan hệ trên các lược đồ CSDL) được mở<br />
và xây dựng nhằm mô hình hóa các đối rộng thành các quan hệ nhiều ngôi mờ và<br />
tượng mà thông tin về chúng mờ, không mức độ thành viên của các giá trị thuộc<br />
chính xác [1], [3], [7], [9], [10]. Các mô tính được ẩn trong mức độ thành viên của<br />
hình như vậy gọi là ô ì sở d u các bộ trong các quan hệ mờ này.<br />
qu ờ (fuzzy relational data base Trong bài báo này, chúng tôi đề nghị<br />
model). Tuy nhiên, do tính đa dạng và một mô hình CSDL quan hệ mờ (FRDB)<br />
phức tạp về sự tồn tại của các đối tượng dựa trên cách tiếp cận thứ hai. Để xây dựng<br />
cũng như các mối quan hệ của chúng nên FRDB, chúng tôi áp dụng lý thuyết tập mờ<br />
khó có mô hình nào có thể biểu diễn và xử ([6], [12]), mở rộng quan hệ và các phép<br />
lý hết mọi khía cạnh không chắc chắn và toán đại số quan hệ truyền thống ([5])<br />
không chính xác về thông tin của các đối thành quan hệ mờ và các phép toán đại số<br />
tượng trong thế giới thực. Vì vậy, các mô quan hệ mờ. Chúng tôi cũng đề nghị một<br />
hình CSDL mờ vẫn được tiếp tục nghiên diễn dịch mức độ thành viên của các bộ đối<br />
cứu và phát triển để đáp ứng các mục tiêu với một quan hệ cho các điều kiện chọn<br />
ứng dụng khác nhau. làm cơ sở để truy vấn với thông tin mờ,<br />
Có hai cách tiếp cận chính để biểu diễn không chính xác trong FRDB.<br />
dữ liệu mờ trong mô hình CSDL mờ: (1) Cơ sở toán học để phát triển FRDB<br />
biểu diễn giá trị thuộc tính bằng các giá trị được trình bày trong Phần 2, lược đồ và thể<br />
tập mờ trong quan hệ mờ; (2) biểu diễn giá hiện FRDB được giới thiệu trong Phần 3.<br />
trị thuộc tính bằng các giá trị rõ trong quan Phần 4 trình bày các phép toán đại số trên<br />
hệ mờ. FRDB và cuối cùng, Phần là một số kết<br />
<br />
<br />
109<br />
luận và hướng nghiên cứu trong tương lai. 2.2. Bi u diễn tập mờ<br />
2. CƠ SỞ TOÁN HỌC CỦA FRDB Trong các ứng dụng, ngoài cách biểu<br />
Phần này giới thiệu tập mờ và quan hệ diễn tập mờ A như một hàm thành viên A:<br />
mờ như là cơ sở toán để phát triển FRDB. X → [0, 1], còn có một số cách biểu diễn<br />
Tập mờ được sử dụng để biểu diễn các truy tập mờ như sau:<br />
vấn với thông tin không rõ ràng, quan hệ 1. Đối với tập X hữu hạn, một tập mờ<br />
mờ được sử dụng để mở rộng các quan hệ A trên X thường được biểu diễn bởi một hệ<br />
trong FRDB. thức có dạng A = , trong đó ai =<br />
2.1. ập mờ A(xi) ≠ 0.<br />
Tập mờ là khái niệm mở rộng của tập<br />
2. Đối với tập X vô hạn không đếm<br />
cổ điển và được định nghĩa như sau.<br />
được, thường là tập số thực, một tập mờ A<br />
Định nghĩa 2.1.1 Giả sử X là một tập<br />
trên X có thể được biểu diễn bởi<br />
khác rỗng, một ánh xạ từ X đến khoảng<br />
A = ∫x A(x)/x.<br />
đóng [0, 1], A: X [0, 1], xác định ộ<br />
Chúng tôi lưu ý dấu tích phân ở đây<br />
ậ ờ (fuzzy set) A trên X. Ánh xạ A chỉ có ý nghĩa thể hiện một tập vô hạn<br />
được gọi là hàm thành viên (membership không đếm được các cặp x và A(x) trong X<br />
function) của tập mờ A. Với mỗi x X, định nghĩa cho A.<br />
A(x) là ộ (membership 2.3. C c p ép t n trên tập mờ<br />
degree) của x đối với A. Các phép toán trên các tập mờ được<br />
Để đơn giản, ký hiệu A: X [0, 1] có định nghĩa một cách tổng quát dựa trên các<br />
thể được sử dụng để biểu diễn tập mờ A. ánh xạ từ tập tích Descartes của các khoảng<br />
Ví dụ 2.1.1 Một ví dụ đơn giản về tập đóng [0,1] đến khoảng đóng [0,1]. Tuy<br />
mờ là tập các số gần số 2, about_2, được nhiên, phần này chỉ giới thiệu các phép<br />
cho bởi hàm thành viên của nó như sau: o uẩ (standard operation) trên các<br />
x 1 x [1, 2] tập mờ ([6], [12]) được ứng dụng trong<br />
FRDB.<br />
about _ 2 3 x x (2, 3]<br />
0 x [1,3] Định nghĩa 2.3.1 Giả sử A, B là hai tập<br />
<br />
mờ trên tập X và có các hàm thành viên lần<br />
và đồ thị hàm thành viên của about_2<br />
lượt là A, B. Phép toán lấy phần bù của<br />
như trong Hình 2.2.1.<br />
A, hợp, giao và hiệu của A và B được định<br />
nghĩa theo hàm thành viên của chúng như<br />
sau.<br />
1. Ac(x) = 1-A(x), x X<br />
2. AB(x) = max( A(x), B(x)), x X<br />
3. AB(x) = min( A(x), B(x)), x X<br />
4. A-B(x) = min( A(x), 1-B(x)), x X.<br />
Hì 2.1.1: Tậ ờ s ầ 2<br />
<br />
110<br />
2.4. Quan ệ mờ Chúng tôi lưu ý rằng, như trong CSDL<br />
Khái niệm quan hệ mờ là cơ sở để xây quan hệ truyền thống, để đơn giản, có thể<br />
dựng CSDL quan hệ mờ. Quan hệ mờ được viết R(U, ) thay cho cách viết R = (U, ).<br />
định nghĩa bằng cách mở rộng quan hệ cổ Ngoài ra, mỗi t = (v1, v2, …, vk) được gọi là<br />
điển như sau. một bộ trên tập thuộc tính {A1, A2, …, Ak}.<br />
Định nghĩa 2.4.1 Giả sử A1, A2,…, Ak Ví dụ 3.1.1 Một lược đồ quan hệ mờ<br />
là các tập khác rỗng, một quan hệ mờ k- PATIENT trong FRDB mô tả về các bệnh<br />
ngôi R giữa k tập A1, A2,…, Ak là một tập nhân có thể như sau:<br />
con mờ của tập tích Descartes A1A2 PATIENT(PATIENT_ID,<br />
…Ak. PATIENT_NAME, AGE, SEX, ), với <br />
Như vậy, một quan hệ mờ k-ngôi R là ánh xạ<br />
được kết hợp với một hàm thành viên R: : string string real binary[0,<br />
A1A2 …Ak [0,1]. Trường hợp quan hệ 1], trong đó string, real và binary là các<br />
mờ 2-ngôi R giữa X, Y (là cơ sở để xây miền giá trị của các thuộc tính<br />
dựng các phép toán mờ 2-ngôi), là một tập PATIENT_ID, PATIENT_NAME, AGE<br />
mờ R = {(x,y): R(x,y) | (x, y) X×Y } với và SEX<br />
hàm thành viên R(x,y): X×Y → [0,1]. 3.2. Quan ệ FRDB<br />
3. LƯỢC ĐỒ VÀ QUAN HỆ FRDB Quan hệ mờ được mở rộng từ quan hệ<br />
Lược đồ và quan hệ FRDB được mở truyền thống với mức độ thuộc được gán<br />
rộng từ lược đồ và quan hệ CSDL quan hệ cho mỗi bộ như định nghĩa dưới đây.<br />
truyền thống để biểu diễn khả năng các bộ Định nghĩa 3.2.1 Giả sử U = {A1, A2,<br />
thuộc về một quan hệ mờ. … Ak} là một tập thuộc tính đôi một khác<br />
3.1. ược đồ FRDB nhau, một quan h mờ (fuzzy relation) r<br />
Một lược đồ FRDB gồm một tập thuộc trên lược đồ R(U, ) là một tập hữu hạn<br />
tính kết hợp với một hàm thành viên làm các bộ {t1, t2,…, tn} trên tập các thuộc tính<br />
cơ sở để xác định các quan hệ mờ, được {A1, A2, …, Ak}, được kết hợp tương ứng<br />
định nghĩa như sau: với các giá trị (ti) biểu diễn mức độ thuộc<br />
Định nghĩa 3.1.1 Một ượ ồ quan h của ti trong r. Các ký hiệu t.A hoặc t[A]<br />
mờ (fuzzy relational schema) là một bộ đôi biểu thị giá trị thuộc tính A của bộ t trong r.<br />
R = (U, ) trong đó Mức độ thuộc của ti trong r được ký hiệu là<br />
1. U = {A1, A2, …, Ak} là một tập các r(ti).<br />
thuộc tính đôi một khác nhau (biểu diễn Chúng tôi cũng dùng ký hiệu t[X] để<br />
thông tin về giá trị các đối tượng trong biểu thị giá trị thu hẹp của bộ t trên tập<br />
quan hệ). thuộc tính X {A1, A2 … Ak}.<br />
2. là một ánh xạ đặt tương ứng mỗi Ví dụ 3.2.1 Một quan hệ mờ r<br />
(v1, v2, …, vk) D1D2…Dk với một số trên lược đồ PATIENT(PATIENT_ID,<br />
thực thuộc [0, 1], trong đó Di là miền giá PATIENT_NAME, SEX,<br />
trị của thuộc tính Ai (i = 1, …, k). MEDICAL_HISTORY, ) có thể như<br />
<br />
111<br />
Bảng 3.2.1. mở rộng từ phụ thuộc hàm trong CSDL<br />
Phụ thuộc hàm mờ trong FRDB được truyền thống như định nghĩa 3.2.2.<br />
<br />
Bảng 3.2.1: M t quan hệ mờ trên lược đồ PATIENT<br />
PATIENT_ID PATIENT_NAME SEX MEDICAL_HISTORY <br />
PT001 P.V. Ba male Bronchitis 0.8<br />
PT002 T.T. Mai female Cholecystitis 0.5<br />
PT003 N. Tuan male Gall-stone 0.4<br />
<br />
Định nghĩa 3.2.2 Cho một lược đồ Định nghĩa 3.2.3 Một sở d li u<br />
quan hệ mờ R(U, ), r là một quan hệ mờ quan h mờ (fuzzy relational database) trên<br />
bất kì trên R, X và Y là hai tập con các một tập các thuộc tính A là một tập các<br />
thuộc tính của U. Một ph thuộc hàm mờ quan hệ mờ tương ứng với tập các lược đồ<br />
(fuzzy function dependence) của Y đối với quan hệ mờ của chúng.<br />
X trên lược đồ quan hệ R, ký hiệu là X ⇝ Lưu ý rằng, nếu chỉ quan tâm đến một<br />
Y, nếu quan hệ duy nhất trên một lược đồ thì có<br />
t1, t2 r (r(t1) r(t2) t1[X] = thể đồng nhất ký hiệu tên quan hệ và lược<br />
t2[X]) f (t1[Y] = t2[Y]), trong đó đồ của chúng.<br />
1, khi a b Ví dụ 3.2.3 Một CSDL quan hệ mờ<br />
a f b = đơn giản các bệnh nhân tại phòng khám<br />
1 (a b), khi a b<br />
của một bệnh viện có thể được tổ chức như<br />
Phụ thuộc hàm X ⇝ Y còn được gọi là<br />
các Bảng 3.2.2, 3.2.3, 3.2.4. Ở đây, quy<br />
“X xác định hàm Y” hoặc “Y phụ thuộc<br />
ước đơn vị thời gian điều trị, chi phí điều<br />
hàm vào X”.<br />
trị tương ứng là ngày và 1000 (đồng VN).<br />
Lưu ý rằng, khi giá trị hàm r bằng 1<br />
Kinh nghiệm điều trị của bác sĩ được tính<br />
với mọi r trên R, phụ thuộc hàm mờ trong<br />
theo năm. Chúng tôi lưu ý rằng, một số<br />
định nghĩa này sẽ đồng nhất với phụ thuộc<br />
thuộc tính đã bị lược bỏ bớt (cho đơn giản)<br />
hàm trong CSDL truyền thống.<br />
và chúng cũng không ảnh hưởng đến việc<br />
Bây giờ CSDL quan hệ mờ là mở rộng<br />
minh họa cho mô hình CSDL quan hệ mờ.<br />
của CSDL quan hệ truyền thống và được<br />
định nghĩa như sau.<br />
<br />
<br />
Bảng 3.2.2: Quan hệ PATIENT<br />
<br />
PATIENT_ID PATIENT_NAME AGE WEIGHT MEDICAL_HISTORY <br />
PT005 L.V. Tam 53 70 Bronchitis 0.9<br />
PT006 N..T. Trang 29 49 Gall-stone 0.5<br />
PT007 T. T. Tu 21 65 Hepatitis 1.0<br />
<br />
<br />
112<br />
Bảng 3.2.3: Quan hệ DIAGNOSE<br />
PATIENT_ID PHYSICIAN_ID DISEASE DURATION COST <br />
PT005 DT001 Tuberculosis 400 300 0.7<br />
PT006 DT002 Hepatitis 40 30 0.5<br />
PT007 DT003 Lung cancer 500 350 0.4<br />
<br />
Bảng 3.2.4: Quan hệ PHYSICIAN<br />
PHYSICIAN_ID PHYSICIAN_NAME EXPERIENCE <br />
DT001 N. T. Son 30 0.6<br />
DT002 H. V. Tuan 25 0.8<br />
DT003 T. T. T. Nhan 6 0.9<br />
<br />
4. CÁC PH P TOÁN ĐẠI SỐ FRDB hai ngôi mờ và v là một giá tr tập mờ.<br />
Các phép toán đại số quan hệ mờ như 3. x.A1 x.A2, trong đó x X, A1 và A2 là<br />
phép chọn, phép giao, phép hợp và phép hai thuộc tính phân biệt trong R.<br />
trừ là cơ sở để truy vấn và thao tác dữ liệu 4. E nếu E là một điều kiện chọn mờ.<br />
mờ, không chính xác trong FRDB. Các<br />
5. E1 E2 nếu E1 và E2 là các điều kiện<br />
phép toán này được mở rộng từ các phép<br />
chọn mờ trên cùng một biến quan hệ.<br />
toán đại số quan hệ truyền thống, trong đó<br />
6. E1 E2 nếu E1 và E2 là các điều kiện<br />
mức độ thành viên của các bộ là một giá trị<br />
chọn mờ trên cùng một biến quan hệ.<br />
trong khoảng [0, 1].<br />
Ba dạng đầu của điều kiện chọn mờ<br />
4.1. P ép c n<br />
được gọi là các ều k sở<br />
Phép chọn trên một quan hệ FRDB là<br />
(atomic selection condition). Ba dạng sau<br />
cơ sở để thực hiện các truy vấn tìm kiếm<br />
của điều kiện chọn mờ được suy dẫn từ các<br />
thông tin trong CSDL. Trước khi định<br />
dạng cơ sở bằng đệ quy. Chúng tôi lưu ý có<br />
nghĩa phép chọn, chúng tôi giới thiệu cú<br />
thể coi mỗi giá trị rõ, chính xác cũng là<br />
pháp và ngữ nghĩa của các điều kiện chọn<br />
một giá trị tập mờ với hàm thành viên của<br />
như dưới đây.<br />
nó bằng 1.<br />
Định nghĩa 4.1.1 Giả sử R là một lược<br />
Ví dụ 4.1.1 Với lược đồ quan hệ<br />
đồ FRDB, X là một tập các biến bộ quan<br />
PATIENT trong CSDL các bệnh nhân ở<br />
hệ, là một quan hệ hai ngôi trong =, , Ví dụ 3.2.3, một số điều kiện chọn mờ có<br />
, , , ≥. Các ều k n mờ (fuzzy thể như sau (x là biến bộ):<br />
selection condition) được định nghĩa một 1. Tìm những bệnh nhân trẻ tuổi (young).<br />
cách đệ quy và có một trong các dạng sau: Yêu cầu này có thể được biểu diễn bởi<br />
1. x.A v, trong đó x X, A là một thuộc điều kiện chọn cơ sở x.AGE <br />
tính trong R và v là một giá trị. young.<br />
2. x.A v, trong đó x X, A là một 2. Tìm tất cả bệnh nhân trẻ tuổi và có<br />
thuộc tính trong R, là một quan hệ tiền sử bệnh viêm gan (hepatitis). Yêu<br />
<br />
<br />
113<br />
cầu này có thể được biểu diễn bởi điều (t) = v(t.A).<br />
kiện chọn x.AGE young Về trực giác, intR,r,t(x.A v) và intR,r,t(x.A<br />
x.MEDICAL_HISTORY=hepatitis. v) tương ứng cho biết mức độ thỏa mãn<br />
3. Tìm tất cả bệnh nhân cao tuổi (old) các điều kiện (quan hệ) t.A v và t.A v<br />
hoặc có cân nặng dưới 50 kg. Yêu cầu (ở đây v là tập mờ) của bộ t trong r còn<br />
này có thể được biểu diễn bởi điều intR,r,t(x.A1 x.A2) cho biết mức độ thỏa<br />
kiện chọn x.AGE old x.WEIGHT mãn điều kiện t.A1 t.A2 của bộ t trong r.<br />
50. Ví dụ 4.1.2 Giả sử các tập mờ young,<br />
Định nghĩa 4.1.2 Giả sử R(U, ) là một middle_aged, old tương ứng biểu diễn tuổi<br />
lược đồ quan hệ FRDB, r là một quan hệ ẻ, trung niên và của các bệnh nhân<br />
trên R, x là một biến bộ quan hệ và t là một với các hàm thành viên như dưới đây:<br />
bộ trong r. Di n d ch (interpretation) của<br />
các điều kiện chọn mờ theo R, r và t, được 1 x [0, 20]<br />
<br />
biểu thị bởi intR,r,t, là một ánh xạ bộ phận young (35 x) / 15 x (20, 35),<br />
từ tập tất cả các điều kiện chọn mờ đến 0 x 35<br />
<br />
khoảng [0, 1] và được định nghĩa đệ qui<br />
( x 20) / 15 x [20, 35)<br />
như sau: 1 x [ 35, 45)<br />
<br />
1. intR,r,t(x.A v) = r(t) nếu t.A v và middle_ aged <br />
(60 x) / 15 x [45, 60)<br />
intR,r,t(x.A v) = 0 nếu ngược lại. <br />
0 x (20, 60)<br />
2. intR,r,t(x.A v) = min(r(t), (t)), với ( x 60) / 15 x [45, 60)<br />
= t.A v <br />
old 1 x [60, 120]<br />
3. intR,r,t(x.A1 x.A2) = r(t) nếu t.A1 t.A2 0 x [45, 120]<br />
<br />
và intR,r,t(x.A1 x.A2) = 0 nếu ngược lại.<br />
Thì diễn dịch của các điều kiện chọn mờ E1<br />
4. intR,r,t(E) = 1 − intR,r,t(E)<br />
= “x.AGE young” và E2= “x.AGE <br />
5. intR,r,t(E1 E2) = min(intR,r,t(E1),<br />
young x.MEDICAL_HISTORY =<br />
intR,r,t(E2))<br />
hepatitis” theo quan hệ r = PATIENT trong<br />
6. intR,r,t(E1 E2) = max(intR,r,t(E1),<br />
CSDL các bệnh nhân ở Ví dụ 3.2.3 được<br />
intR,r,t(E2))<br />
tính toán như trong Bảng 5.2.1. Lưu ý rằng,<br />
Chúng tôi lưu ý rằng, v là một tập mờ<br />
để tiện theo dõi kết quả tính toán, các bộ<br />
trong t.A v nên = t.A v là một quan trong quan hệ PATIENT được đánh số<br />
hệ mờ. Vì vậy cũng là một tập mờ. Cụ theo thứ tự xuất hiện của chúng trong Bảng<br />
thể là tập mờ mà hàm thành viên của nó 4.1.1.<br />
có đối số là các bộ t của R. Với mỗi t R,<br />
<br />
<br />
<br />
<br />
114<br />
Bảng 4.1.1. Di n dịch biểu thức chọn mờ trên uan hệ PATIENT<br />
t intR,r,t(E1) intR,r,t (E2)<br />
t1 min(0.9, 0.0) = min(min(0.9, 0.0), )=0<br />
t2 min(0.5, 0.4) = 0.4 min(min(0.5, 0.4), )=0<br />
t3 min(1.0, 0.93) = 0.93 min(min(1.0, 0.93), 1.0 ) = 0.93<br />
<br />
Bây giờ, phép chọn trong FRDB được Ví dụ 4.1.3 Xét quan hệ r = PATIENT<br />
mở rộng từ phép chọn trong CSDL quan hệ trong cơ sở dữ liệu các bệnh nhân ở Ví dụ<br />
truyền thống như sau. 3.2.3, truy vấn “Tìm tất cả bệnh nhân trẻ và<br />
Định nghĩa 4.1.3 Giả sử R(U, ) là một có tiền sử bệnh viêm gan” có thể được thực<br />
lược đồ quan hệ mờ FRDB, r là một quan hiện bởi phép chọn = (PATIENT) với<br />
= “x.AGE young <br />
hệ trên R và là một điều kiện chọn trên x.MEDICAL_HISTORY= hepatitis”.<br />
biến bộ x. Phép ch n trên r theo , được ký Phép chọn được thực hiện bằng cách<br />
hiệu (r), là một quan hệ mờ trên R, kiểm tra sự thỏa mãn của tất cả các bộ<br />
bao gồm tất cả các bộ t được định nghĩa trong PATIENT đối với điều kiện chọn .<br />
Từ Ví dụ 4.1.2 ta dễ dàng thấy chỉ có bộ t3<br />
bởi:<br />
thỏa mãn với giá trị hàm thành viên là<br />
r’=t r | intR,r,t() 0 r’(t)=intR,r,t() 0.93. Vì vậy kết quả phép chọn là quan hệ<br />
Một cách đơn giản hơn, (r) = {t r | r’ như trong Bảng 4.1.2.<br />
intR,r,t() 0}.<br />
<br />
Bảng 4.1.2. Quan hệ r’= (PATIENT)<br />
PATIENT_ID PATIENT_NAME AGE WEIGHT MEDICAL_HISTORY <br />
PT007 T. T. Tu 21 65 Hepatitis 0.93<br />
<br />
4.2. Phép hợp, giao và tr<br />
r và s, kí hiệu là r s, là một quan hệ mờ<br />
Sử dụng các phép toán trên các tập hợp trên R bao gồm các bộ t được định nghĩa<br />
mờ trong Định nghĩa 2.3.1 chúng tôi mở bởi<br />
rộng các phép toán hợp, giao và trừ các r s = {t | rs(t)=max(r(t), s(t))}.<br />
quan hệ trong CSDL truyền thống thành<br />
Ví dụ 4.2.1 Giả sử hai quan hệ<br />
các phép toán hợp, giao và trừ các quan hệ<br />
DIAGNOSE1 và DIAGNOSE2 trên lược đồ<br />
trong FRDB như các định nghĩa dưới đây.<br />
quan hệ DIAGNOSE(PATIENT_ID,<br />
Định nghĩa 4.2.1 Giả sử r và s là hai quan DISEASE, COST, ) như trong các Bảng<br />
hệ mờ trên cùng một lược đồ R(U,). Phép 4.2.1, 4.2.2. Khi đó hợp của chúng là quan<br />
hợp (union) của hai quan hệ hệ DIAGNOSE được tính toán như trong<br />
Bảng 4.2.3.<br />
<br />
<br />
<br />
<br />
115<br />
Bảng 4.2.1: Quan hệ DIAGNOSE1<br />
PATIENT_ID DISEASE COST <br />
PT005 Tuberculosis 300 0.7<br />
PT006 Hepatitis 30 0.5<br />
<br />
Bảng 4.2.2: Quan hệ DIAGNOSE2<br />
PATIENT_ID DISEASE COST <br />
PT005 Tuberculosis 300 0.3<br />
PT006 Hepatitis 30 0.8<br />
PT017 Cirrhosis 70 0.4<br />
<br />
<br />
Bảng 4.2.3: DIAGNOSE = DIAGNOSE1 DIAGNOSE2<br />
PATIENT_ID DISEASE COST <br />
PT005 tuberculosis 300 0.7<br />
PT006 hepatitis 30 0.8<br />
PT017 cirrhosis 70 0.4<br />
<br />
các tính chất của các phép toán đại số quan<br />
Định nghĩa 4.2.2 Giả sử r và s là hai quan<br />
hệ truyền thống.<br />
hệ trên cùng một lược đồ R(U, ). Phép<br />
Sau đây là các định lý về các tính chất<br />
giao (intersection) của hai quan hệ r và s,<br />
của các phép toán đại số trên FRDB được<br />
kí hiệu là r s, là một quan hệ trên R bao chúng tôi mở rộng từ các tính chất của các<br />
gồm các bộ t được định nghĩa bởi phép toán đại số quan hệ truyền thống.<br />
r s = {t | rs(t) = min(r(t), s(t))}.<br />
Định lý 4.3.1 Giả sử r là một quan hệ mờ<br />
Định nghĩa 4.2.3 Giả sử r và s là hai quan<br />
trên lược đồ R(U, ) trong FRDB. Gọi 1<br />
hệ mờ trên cùng một lược đồ R(U,). Phép và 2 là hai điều kiện chọn. Khi đó<br />
trừ (difference) của quan hệ r cho s, kí hiệu<br />
1(2(r)) = 2(1(r)) = 12(r) (1)<br />
là r – s, là một quan hệ trên R bao gồm các<br />
bộ t được định nghĩa bởi Với giả thiết trong 12(r) các điều<br />
r–s = {t | rs(t) = min(r(t), 1-s(t))}. kiện chọn 1 và 2 là có cùng một biến bộ.<br />
4.3. n c ất của c c p ép t n đại s Chứng minh Đặt s = 2(r), ta có<br />
Như đã thấy ở các phần trên, mô hình 1(2(r))=ts intR,s,t(1)0<br />
FRDB được mở rộng từ mô hình CSDL (Định nghĩa 4.1.3)<br />
quan hệ truyền thống cả về biểu diễn dữ =tr intR,r,t(2)0 intR,s,t(1)0}<br />
liệu và các phép toán đại số quan hệ. Hệ =tr intR,r,t(2)0 intR,r,t(1)0)<br />
quả logic là các tính chất của các phép toán (do sr)<br />
đại số trong FRDB cũng được mở rộng từ =trmin(intR,r,t(2), intR,r,t(1))0)<br />
(Định nghĩa 4.1.2)<br />
<br />
116<br />
=trintR,r,t(21)> 0) = 12(r). . KẾT LUẬN<br />
Từ đó hệ thức 1(2(r)) = 1 2(r) Trong bài báo này, chúng tôi đã giới<br />
được chứng minh. Hệ thức 2(1(r)) = thiệu một mô hình cơ sở dữ liệu quan hệ<br />
2 1(r) được chứng minh tương tự. Vì 1 mờ, được gọi là FRDB, cùng với các phép<br />
toán đại số cơ bản như chọn, hợp, giao và<br />
2 2 1 (phép hội trên tập các điều<br />
trừ để cho phép thao tác và truy vấn thông<br />
kiện chọn mờ cũng như trên mệnh đề có<br />
tin không rõ ràng, không chính xác. Mỗi<br />
tính giao hoán), nên 1 2(r) = 21(r).<br />
quan hệ FRDB là một tập mờ với mức độ<br />
Từ đó suy ra hệ thức 1(2(r)) = thành viên bộ trong khoảng [0,1], các uy<br />
2(1(r)) và do đó 1(2(r)) = ấ ề (soft query) có thể được thực hiện<br />
2(1(r)) = 12(r) bằng cách sử dụng các điều kiện chọn kết<br />
hợp với các giá trị tập mờ. Một số các tính<br />
Định lý 4.3.2 Nếu r1, r2 và r3 là các quan chất của các phép toán đại số trên FRDB<br />
hệ mờ trên cùng một lược đồ R(U, ) thì cũng được đề nghị và chứng minh.<br />
r1 r2 = r2 r1 (2) Trong các bước tiếp theo, chúng tôi<br />
(r1 r2) r3 = r1 (r2 r3) (3) sẽ xây dựng các phép toán đại số khác như<br />
r1 r2 = r2 r1 (4) phép u (projection), phép tích<br />
(r1 r2) r3 = r1 (r2 r3) (5)<br />
Descartes và phép k (join) các quan hệ để<br />
Chứng minh Các hệ thức trong định lý hoàn thiện mô hình FRDB. Ngoài ra, việc<br />
này được chứng minh như sau:<br />
phát triển một hệ quản trị cho FRDB với<br />
Do các phép toán giao và hợp các tập<br />
hợp, phép lấy min và max có tính giao hoán ngôn ngữ thao tác và truy vấn tựa SQL để<br />
và kết hợp nên từ các Định nghĩa 4.2.1 và hỗ trợ ườ sử d ầu u (end-user)<br />
4.2.2 ta suy các hệ thức (2), (3), (4) và ( ). cũng là một nghiên cứu có nhiều ý nghĩa.<br />
<br />
<br />
<br />
<br />
TÀI LIỆU THAM KHẢO<br />
<br />
1. Dubois, D., and Prade, (2009) H. Using fuzzy sets in flexible querying: why and how?.<br />
In Proceedings of the workshop on flexible query-answering systems (FQAS’1 ),<br />
Denmark, 89-103.<br />
2. Codd, E.F. (1970) A Relational model of data for large shared data banks.<br />
Communications of the ACM, 13(6), 377-387.<br />
3. Cubero, J.C., Medina, J.M., Pons, O., and Vila, M.A. (1999) Data summarization in<br />
relational databases through fuzzy dependencies. International Journal of Information<br />
Sciences, 121, 22-43.<br />
4. Chakraborty, S. (2012) Codd s e o d ode d fuzzy o :<br />
approach to find the computer solution. International Journal of Advanced Technology<br />
& Engineering Research (IJATER), 2(4), 21-27.<br />
<br />
117<br />
5. Date C.J. (2008) An introduction to database systems. Addision–Wesley. 8th Edition.<br />
6. Klir, G.J. and Yuan, B. (1994) Fuzzy sets and fuzzy logic -Theory and applications.<br />
Prentice Hall PTR.<br />
7. Meng, X., Ma, Z.M., and Zhu, X. (2010) A Knowledge-based fuzzy query and results<br />
ranking approach for relational databases. Journal of Computational Information<br />
Systems, 6, 2037-2044.<br />
8. Mishra, J., and Ghosh, S. (2012) A new functional dependency in a vague relational<br />
database Model. International Journal of Computer Applications, 39(8), 29-36.<br />
9. Nguyen Cat Ho. (2006) A model of relational with linguistic data of hedge algebras-<br />
based semantics. In Proceedings of the 3rd National Symposium on Research,<br />
Development and Application of Information and Communication Technology<br />
(ICTrda’0 ) Hanoi-Vietnam, 145-156.<br />
10. Petry, F.E. (1996) Fuzzy databases: Principles and applications. Kluwer Academic<br />
Publishers.<br />
11. Yan, L., and Ma, Z.M. (2013) A Fuzzy probabilistic relational database model and<br />
algebra. International Journal of Fuzzy Systems, 15(1), 244-253.<br />
12. Zadeh, L.A. (1965) Fuzzy sets. Information and Control, 8, 338-353.<br />
<br />
* Ngày nhận bài: 13/10/2014. Biên tập xong: /1/201 . Duyệt đăng: 10/1/201 .<br />
<br />
<br />
<br />
<br />
118<br />