Tạp chí KHOA HỌC ĐHSP TPHCM Số 51 năm 2013<br />
_____________________________________________________________________________________________________________<br />
<br />
<br />
<br />
<br />
XÂY DỰNG, SO SÁNH HAI MÔ HÌNH DỮ LIỆU<br />
CỦA ỨNG DỤNG QUẢN LÍ LỊCH SỬ BIẾN ĐỘNG CÁC THỬA ĐẤT<br />
<br />
NGUYỄN GIA TUẤN ANH* , TRẦN THANH BÉ** ,<br />
NGUYỄN NGỌC TRUNG*** , PHAN THANH VŨ****<br />
<br />
TÓM TẮT<br />
Bài báo tập trung trình bày việc phân tích, thiết kế và xây dựng một cơ sở dữ liệu<br />
(CSDL) cho hệ thống quản lí biến động các thửa đất theo thời gian. Sự biến động các thửa<br />
đất được diễn tả theo ba khía cạnh: biến động về diện tích, sở hữu chủ và biến động về<br />
mục đích sử dụng đất. Các biến động này được lưu trữ và biểu diễn tường minh trong<br />
CSDL nhằm phục vụ cho công tác truy tìm lịch sử các thửa đất theo thời gian. Hệ thống<br />
này là cơ sở giúp các nhà hoạch định chính sách trong việc quản lí và hỗ trợ ra quyết định<br />
liên quan đến quỹ đất, một dạng tài nguyên quan trọng của mọi quốc gia. Bài báo cũng so<br />
sánh chi phí thời gian hiển thị, truy vấn, xóa dữ liệu liên quan đến các thửa đất khi được<br />
lưu trữ trong hai mô hình CSDL quan hệ và hướng đối tượng.<br />
Từ khóa: CSDL không gian, CSDL thời gian, GIS, thửa đất.<br />
ABSTRACT<br />
Building and comparing two data models of the application<br />
for land changes history management<br />
This paper presents the act of analyzing, designing and building a database for the<br />
management system of land changes over time. The changes of the land are described in<br />
three aspects: changing in size, owners and usages. The changes are stored and presented<br />
explicitly in the database to serve the tracking history of pieces of land over time. This<br />
system could support policy makers and managers to make decisions related to land. This<br />
paper also compares the cost of time for displaying, querying, and deleting data related to<br />
the land which are stored in both data models: relational and object-oriented database.<br />
Keywords: temporal database, spatial database, GIS, land.<br />
<br />
1. Mở đầu<br />
Nhu cầu xây dựng một hệ thống tin nhằm phục vụ việc thay đổi diện tích và mục<br />
đích sử dụng các thửa đất không chỉ là một nhu cầu của Việt Nam mà là một nhu cầu<br />
chung cho mọi quốc gia. Không chỉ cần cho lãnh vực nông nghiệp mà còn cần cho khu<br />
vực đô thị, công nghiệp…<br />
<br />
<br />
*<br />
TS, Trường Đại học Công nghệ Thông tin, ĐHQG TPHCM<br />
**<br />
HVCH, Trường Đại học Công nghệ Thông tin, ĐHQG TPHCM<br />
***<br />
NCS, Trường Đại học Sư phạm TPHCM<br />
****<br />
HVCH,Trường Đại học Công nghệ Thông tin, ĐHQG TPHCM<br />
<br />
<br />
178<br />
Tạp chí KHOA HỌC ĐHSP TPHCM Nguyễn Gia Tuấn Anh và tgk<br />
_____________________________________________________________________________________________________________<br />
<br />
<br />
<br />
<br />
Đất có vai trò trong việc sinh tồn và phát triển của con người, nhất là đất nông<br />
nghiệp. Đất nông nghiệp là đất nằm trong quỹ đất, nó có những đặc trưng sau: đa dạng;<br />
tính sở hữu và mục đích sử dụng; không thể sản sinh và có thể tái tạo. Đất là một dạng<br />
tài nguyên vô cùng quý giá của một quốc gia [7] nên việc xây dựng một hệ thống thông<br />
tin tự động cũng phải xứng với tầm quan trọng của nó. Việc quản lí, khai thác sử dụng<br />
đất ảnh hưởng đến nhiều yếu tố: kinh tế, xã hội, môi trường… và được quản lí thống<br />
nhất dưới sự kiểm soát của nhà nước. [8]<br />
Khi tình hình sử dụng đất rất đa dạng, phức tạp và tốc độ đô thị hóa ngày càng<br />
diễn ra nhanh chóng thì hệ thống quản lí các thửa đất càng trở nên cấp bách và ý nghĩa.<br />
Nó không chỉ giúp cơ quan chức năng trong việc tự động hóa các dữ liệu cần quản lí,<br />
mà còn phục vụ nhanh chóng việc tìm kiếm và thống kê. Đặc biệt các dữ liệu thống kê<br />
sẽ giúp các nhà hoạch định chính sách có công cụ hữu hiệu để quản lí và trợ giúp trong<br />
việc ra quyết định về quy hoạch đất. Nếu quy hoạch tốt sẽ giúp việc phân bổ, sử dụng<br />
đất sẽ hiệu quả, khoa học.<br />
Một thửa đất theo thời gian có thể có nhiều thay đổi, các thay đổi này có thể do<br />
các nguyên nhân, biến cố, chủ quan hoặc khách quan. Bài báo trình bày tập trung vào<br />
các thay đổi thường xảy ra trên các thửa đất: sở hữu chủ, diện tích và mục đích sử dụng<br />
đất.<br />
Về nghiệp vụ: một thửa đất có thể có đồng sở hữu. Theo thời gian, một thửa đất<br />
có thể có nhiều sở hữu khác nhau, thậm chí một sở hữu có thể sở hữu cùng một thửa<br />
đất tại hai thời điểm khác nhau.<br />
Một thửa đất theo thời gian có thể có nhiều mục đích sử dụng khác nhau. Tại hai<br />
thời điểm khác nhau một thửa đất có thể có cùng mục đích. Một thửa đất có thể hình<br />
thành mới mà trước đó không có thửa đất khác hoặc do thửa đất khác tách ra hay nhiều<br />
thửa đất gộp lại. Việc lưu trữ và biểu diễn gia phả các thửa đất cũng được đặt ra và giải<br />
quyết trong bài báo này. Khi một thửa đất mới hình thành, nó được gán một nhãn thời<br />
gian. Ngược lại, khi một thửa đất biến mất, nó cũng được gán một nhãn thời gian.<br />
Tính chất của thời gian trong bài báo có thể biểu diễn các biến động xảy ra tại<br />
một thời điểm hay một khoảng thời gian. Về lí thuyết có nhiều loại thời gian gắn cho<br />
CSDL không gian trong GIS (Geographic Information System) [3], nhưng có hai loại<br />
thời gian đáng quan tâm là: thời gian một đối tượng hình thành, biến mất, diễn ra trong<br />
thế giới thực và thời gian xảy ra trong CSDL. Nhằm làm phong phú dữ liệu, các biến<br />
cố là nguyên nhân làm xảy ra các biến động cho các thửa đất cũng được lưu trữ và biểu<br />
diễn trong bài báo.<br />
Nội dung bài báo bao gồm 5 phần, phần mở đầu trình bày ý nghĩa, tầm quan trọng<br />
của hệ thống, mô tả một số các nghiệp vụ chính và dữ liệu của hệ thống. Phần 2 trình<br />
bày ý nghĩa của các lớp dữ liệu, mô tả ý nghĩa các liên kết giữa các lớp dữ liệu và mô<br />
hình dữ liệu mức quan niệm. Phần 3 trình bày dữ liệu mức logic và ý nghĩa của các<br />
quan hệ. Phần 4 trình bày các truy vấn mẫu, gồm các truy vấn trên thuộc tính không<br />
gian, thời gian, ngữ nghĩa và các thuộc tính tổ hợp. Phần 5 bàn luận việc mở rộng mô<br />
<br />
179<br />
Tạp chí KHOA HỌC ĐHSP TPHCM Số 51 năm 2013<br />
_____________________________________________________________________________________________________________<br />
<br />
<br />
<br />
<br />
hình phục vụ cho các ứng dụng và so sánh thời gian hiển thị, truy vấn, xóa dữ liệu cho<br />
hai mô hình CSDL quan hệ (CSDLQH), CSDL quan hệ đối tượng (CSDLQHĐT).<br />
2. Mô hình CSDL mức quan niệm<br />
2.1. Chiều thời gian- CSDL thời gian<br />
Thời gian là một thuộc tính không chỉ cần cho các ứng dụng GIS mà còn nhiều<br />
ứng dụng khác. Các ứng dụng GIS có số chiều không gian là 2 (2D) khi thêm thuộc<br />
tính thời gian, nó sẽ thành ứng dụng 3 chiều (3D). Các đối tượng trong GIS nói chung<br />
chứa 3 thuộc tính: không gian (hình dạng, ví trí, kích thước), thời gian (khi hình thành,<br />
lúc biến mất) và ngữ nghĩa (tùy thuộc vào ứng dụng) [1]. Đặc điểm của thời gian là:<br />
mơ hồ, đa dạng, có thứ tự và hiệu quả. Thời gian có thể: liên tục hay rời rạc, có thể<br />
tuyệt đối hay tương đối [2]. Thời gian có thể biểu diễn bởi điểm thời gian (ví dụ, lúc<br />
13h ngày 5-6-2013) hay đoạn thời gian (ví dụ, thời gian hội nghị từ lúc 8h ngày 15-7-<br />
2013 đến 8h ngày 17-7-2013).<br />
CSDL thời gian là tập dữ liệu có thuộc tính thời gian. Ngôn ngữ truy vấn thời<br />
gian là ngôn ngữ truy vấn cho bất kì CSDL thời gian nào [4]. Mô hình phần 2.6 có 2<br />
lớp thuộc chiều thời gian: TIME, DMY.<br />
2.2. Chiều không gian<br />
Không gian là một thuộc tính đặc trưng của các đối tượng trong GIS. Trong<br />
không gian 2 chiều, nó gồm các đối tượng điểm, đường, đa giác. Trong không gian 3<br />
chiều, nó gồm các đối tượng: điểm, đường, mặt và khối. Một điểm trong không gian 2<br />
chiều được biểu diễn qua 2 tọa dộ X, Y, trong không gian 3 chiều, nó được biểu diễn<br />
qua 3 tọa độ X, Y, Z trên hệ trục Oxyz [1]. Mô hình phần 2.6 có 2 lớp thuộc chiều<br />
không gian: NODE, POLYGON.<br />
2.3. Chiều ngữ nghĩa<br />
Các ứng dụng khác nhau cần các lớp ngữ nghĩa khác nhau để mô tả cho ứng dụng<br />
đó. Các ứng dụng càng phức tạp, đa dạng càng cần nhiều lớp ngữ nghĩa để biểu diễn.<br />
các thuộc tính ngữ nghĩa khi gắn liền với thuộc tính không gian, nó cũng bị thay đổi<br />
theo thời gian. Ví dụ sở hữu chủ của một thửa đất L1 tại thời T1 là O1, nhưng tại thời<br />
điểm T2 là O2. Chiều ngữ nghĩa là chiều đa dạng, phụ thuộc vào các nhu cầu của các<br />
ứng dụng mà số lớp dữ liệu của chiều này sẽ khác nhau. Mô hình phần 2.6 có 4 lớp<br />
thuộc chiều ngữ nghĩa: OWNER, USED, EVENT, EVENTYPE.<br />
2.4. Ý nghĩa các lớp<br />
Mô hình mức quan niệm trong bài báo sử dụng các lớp và ý nghĩa của chúng<br />
được mô tả phần dưới đây:<br />
NODE(IDN, X, Y, Z): mô tả tọa độ 1 điểm trong không gian 3 chiều trên tục tọa<br />
độ Oxyz.<br />
POLYGON(IDP, DESC): mô tả thuộc tính không gian một thửa đất.<br />
DMY(IDDMY, DAY, MONTH, YEAR): mô tả các thể hiện của ngày tháng năm.<br />
<br />
180<br />
Tạp chí KHOA HỌC ĐHSP TPHCM Nguyễn Gia Tuấn Anh và tgk<br />
_____________________________________________________________________________________________________________<br />
<br />
<br />
<br />
<br />
TIME(IDT, DESC): mô tả một mốc thời gian, có thể là một thời điểm hoặc một<br />
khoảng thời gian.<br />
OWNER(IDO, NAME, ADDRESS): mô tả một sở hữu chủ của thửa đất.<br />
USED(IDU, DESC): mô tả mục đích sử dụng của một thửa đất.<br />
EVENTYPE(IDET, DESC): mô tả các loại biến cố, ví dụ: quy hoạch, động đất. . .<br />
EVENT(IDE, DESC): mô tả một biến cố cụ thể gắn liền với thời gian xảy ra của<br />
biến cố trong thực tế.<br />
2.5. Mô hình CSDL mức quan niệm<br />
Mô hình CSDL mức quan niệm của hệ thống quản lí lịch sử biến động các thửa<br />
đất được trình bày trong Hình 1.<br />
DMY<br />
+2<br />
OWNER +N<br />
<br />
TIME<br />
EVENTYPE<br />
+N<br />
+4<br />
N<br />
NODE N<br />
<br />
+N +1<br />
+N<br />
<br />
+N<br />
+N USED<br />
+N POLYGON<br />
<br />
+N +N<br />
+1<br />
+N EVENT<br />
N<br />
<br />
<br />
<br />
<br />
Hình 1. Mô hình CSDL mức quan niệm của hệ thống quản lí<br />
lịch biến động các thửa đất<br />
3. Mô hình CSDL mức logic<br />
Chuyển mô hình của Hình 1 từ mức quan niệm sang mức logic được mô tả trong<br />
phần 3, gồm 12 quan hệ.<br />
NODE(IDN, X, Y, Z): mô tả tọa độ 1 điểm trong không gian 3 chiều trên tục tọa<br />
độ Oxyz.<br />
POLYGON(IDP, IDTDBB, IDTDBE, IDTRB, IDTRE, IDE, DESC): mô tả thuộc<br />
tính không gian một thửa đất, được hình thành do biến cố nào (IDE), có thời điểm bắt<br />
đầu, kết thúc của nó trong thế giới thực (IDTRB, IDTRE) và trong CSDL (IDTDBB,<br />
IDTDBE).<br />
POLY_NODE(IDP, IDN, SEQ): mô tả các Node biểu diễn cho một đa giác và<br />
thứ tự (SEQ) của các Node.<br />
DMY(IDDMY, DAY, MONTH, YEAR): mô tả các thể hiện của ngày tháng năm.<br />
TIME(IDT, IDDMY1, IDDMY2, DESC): mô tả một mốc thời gian, có thể là một<br />
thời điểm hoặc một khoảng thời gian, nếu IDDMY1 IDDMY2 thì mô tả khoảng<br />
thời gian.<br />
<br />
181<br />
Tạp chí KHOA HỌC ĐHSP TPHCM Số 51 năm 2013<br />
_____________________________________________________________________________________________________________<br />
<br />
<br />
<br />
<br />
OWNER(IDO, NAME, ADDRESS): mô tả một sở hữu chủ của thửa đất.<br />
USED(IDU, DESC): mô tả mục đích sử dụng của một thửa đất.<br />
EVENTYPE(IDET, DESC): mô tả các loại biến cố, ví dụ: quy hoạch, động đất…<br />
EVENT(IDE, IDTDBB, IDTDBE, IDTRB, IDTRE, DESC): mô tả một biến cố<br />
cụ thể gắn liền với thời gian xảy ra của biến cố trong thực tế, có thời điểm bắt đấu, kết<br />
thúc của nó trong thế giới thực (IDTRB, IDTRE) và trong CSDL (IDTDBB, IDTDBE).<br />
POLY_CHILPAR(IDPPA, IDPCH): mô tả mối quan hệ gia phả không gian của<br />
các thửa đất.<br />
POLY_USED_TIME(IDP, IDT, IDU): mô tả một thửa đất tại một thời điểm được<br />
dùng cho mục đích sử dụng gì.<br />
POLY_OWNER_TIME(IDP, IDT, IDO): mô tả một thửa đất tại một thời điểm<br />
được ai là sở hữu chủ (có thể đồng sở hữu).<br />
4. Các truy vấn mẫu<br />
Bao gồm các truy vấn: không gian, thuộc tính, không gian theo thời gian, ngữ<br />
nghĩa theo thời gian.<br />
4.1. Truy vấn không gian<br />
Truy vấn 1. Tìm các thửa đất Pi đồng thời có các đỉnh là N1, N2.<br />
(Select IDP from POLY_NODE where IDN= N1) intersection<br />
(Select IDP from POLY_NODE where IDN= N2)<br />
4.2. Truy vấn thuộc tính<br />
Truy vấn 2. Tìm các thửa đất thuộc sở hữu chủ O1.<br />
Select IDP from POLY_OWNER_TIME where IDO= O1<br />
4.3. Truy vấn không gian theo thời gian<br />
Các bước khai thác dữ liệu lịch sử biến động các thửa đất<br />
B1. Xây dựng các nhóm thời gian (Bảng 1).<br />
B2. Xây dựng nhóm các câu truy vấn có các đặc điểm khác nhau theo thời gian<br />
(bảng 2).<br />
B3. Tạo các câu truy vấn khai thác dữ liệu lịch sử biến động các thửa đất bởi các<br />
truy vấn mẫu từ 3.1 đến 3.5.<br />
<br />
<br />
<br />
<br />
182<br />
Tạp chí KHOA HỌC ĐHSP TPHCM Nguyễn Gia Tuấn Anh và tgk<br />
_____________________________________________________________________________________________________________<br />
<br />
<br />
<br />
<br />
Bảng 1. Chia 5 nhóm dữ liệu cho các đa giác từ P1 đến P1000<br />
<br />
Nhóm IDTDBB IDTDBE IDTRB IDTRE Các khối<br />
G1 T1 T5 T1 T5 P1→ P200<br />
G2 T2 NULL T2 NULL P201→P 400<br />
G3 T2 T6 T1 T5 P401 →P600<br />
G4 T1 T5 T1 T5 P601→ P800<br />
G5 T2 T4 T2 T4 P801→ P1000<br />
<br />
Bảng 2. Phân loại 4 câu truy vấn theo quan hệ TOPOLOGY thời gian<br />
<br />
Truy vấn Quan hệ topology thời gian Đặc điểm truy vấn<br />
3.1 T11