
ỨNG D NGỤ CÔNG NGHỆ
OLAP
TRONG KHAI THÁC SỐ LIỆU DỊCH H IẠ TRÊN LÚA T IẠ TRÀ
VINH
ABSTRACT
Online Analytical Processing is used in wide variety of business applications to
analyze
the data and this helps in querying multidimensional data. This thesis describes the design
and
the implementation of OLAP Reporting Application in rice diseases Data Warehouse by
using
the architecture of Data Warehouse, OLAP technology and web structure. It helps to
build
and to exploit a Data Warehouse of rice diseases. To get this goal, some modern tools to
build
and to organize many parts of the system needed are used in its practice such as SQL
Server
2005 for Analysis Services 2005 for an OLAP database and Microsoft Office
Web
Components for a web based OLAP Reporting Applications. The user can analyze
directly
and flexibly the rice disease data on the Web
pages.
Keywords: Data Warehouse, Online Analytical Processing (OLAP), web
structure,
OLAP database, web based OLAP
Reporting.
TÓM
T TẮ
Kỹ thu tậ phân tích dữ li uệ trực tuyến OLAP (Online Analytical Processing) được
s ử
d ngụ r ngộ rãi trong nhi uề ứng d ngụ kinh doanh để phân tích dữ li uệ và giúp truy v nấ
trên
d ữ
li uệ đa chi uề nh mằ hỗ trợ vi cệ ra quy tế đ nhị c aủ các nhà quản lý. Bài báo này mô
tả và
xây
dựng m tộ ứng d ngụ th ngố kê trực tuy nế trên kho dữ li uệ d chị h iạ trên lúa b ngằ
cách sử
d ng ụ
ki nế trúc kho dữ li uệ (Data Warehouse), kỹ thu tậ phân tích trực tuy nế OLAP và
c uấ trúc
w
e
b.
Ứng d ngụ này hỗ trợ khai thác hi uệ quả kho dữ li uệ d chị h iạ trên lúa đã
được ngành
Trồng
tr tọ và B oả vệ Thực vật Trà Vinh tích tụ trong nhi uề năm qua. Để đạt
được m cụ đích này,
mộ
t vài công cụ được sử dụng đ xâyể dựng thành công ứng d ngụ như:
SQL Server 2005 cho kho
d ữ
li u,ệ Analysis Services 2005 cho CSDL đa chi uề OLAP và
Microsoft Office Web
Components
cho các báo cáo dựa trên web. Với k tế quả đạt được, ứng
d ngụ cho phép người sử d ngụ
phân
tích trực tuy nế và linh ho tạ dữ li uệ d chị h iạ trên lúa
trực ti pế trang web, đi uề này cho
thấ
y r ngằ công nghệ OLAP không những là công cụ được
áp dụng hiệu quả trong các ứng d ngụ
h ỗ
trợ kinh doanh mà còn c nầ được áp d ngụ mạnh mẽ
trong các h thệ ống tin h cọ hỗ tr ợlĩnh v
ự
c nông
nghi
ệ
p.
Từ khóa: kho dữ li u,ệ kỹ thu tậ phân tích trực tuy n,ế c uấ trúc web, CSDL đa
c
h
iề
u
OLAP, báo cáo dựa trên
web.

1. GIỚI
THIỆU
Nông nghi pệ là m tộ ngành kinh tế quan trọng trong n nề kinh tế của m iỗ qu cố gia,
đ
cặ
bi tệ là trong giai đo nạ hi nệ nay, khi mà v nấ đề an ninh lưngơ thực đưcợ đ tặ lên hàng
đ
ầ
u.
Ở
nưcớ ta, do n nề kinh tế phát tri nể lên từ một nưcớ nông nghi pệ nên kinh
t
ế
nông
nghi pệ càng có vai trò quan tr ngọ h nơ trong sự phát tri nể kinh tế c aủ đ tấ nưc.ớ
Đ
iề
u
này đã đưcợ chứng minh thực tế trong cu cộ khủng ho ngả giá lương thực năm 2008, đã
làm ả
nh
hưngở nghiêm tr ngọ đ nế nhiều thành ph nầ kinh tế khác và đ iờ s ngố c aủ hàng tri uệ
ngườ
i
.
Đ ngồ
b ngằ Sông Cửu Long (ĐBSCL) là vựa lúa l nớ nh tấ nưcớ ta, trong những
năm
g
ầ
n
đây, v iớ vi cệ thâm canh tăng vụ và áp d ngụ các ti nế bộ khoa h cọ kỹ thu tậ vào
s nả xu tấ lúa
đã
làm cho năng su tấ và s nả lưngợ lúa ngày m tộ nâng lên. H nơ mưiờ năm qua,
ĐBSCL
đượ
c
x
e
m
là vùng kinh tế tr ngọ điểm c aủ qu cố gia s nả xu tấ lương thực ph cụ vụ
xu tấ khẩu và
b
ả
o
đảm an ninh lưngơ thực qu cố
g
ia
.
Tuy nhiên, v i viớ ệc thâm canh cây lúa trong nhi uề năm li n ềđã tạo nguy c ơcho sự
bộ
c
phát d chị h iạ trên lúa, đ cặ bi tệ trong năm 2006 d chị r yầ nâu xuất hi nệ ở t tấ cả các tỉnh
t
huộ
c vùng ĐBSCL. Để ch ngố l i ạsự b cộ phát d chị hại, nâng cao năng su tấ và s nả lưngợ lúa.
Các
nhà
khoa h cọ đã nghiên cứu và đưa ra nhi uề bi nệ pháp hữu hi uệ như: lai t oạ ra các
gi ngố lúa
mớ
i có khả năng kháng dịch hại, thực hi nệ phương pháp qu ngả canh, gieo tr ngồ né
tránh d chị
h
ại
,
phun thu cố phòng trị d chị h iạ và nhi uề phương pháp khác. Dù là áp d ngụ
phưngơ pháp nào
đ
i nữa thì nhu c uầ tìm kiếm thông tin về d chị h iạ c aủ nhà nông, nhà qu nả lý
nông nghi pệ và
nhà
khoa h cọ cũng h t ếsức c nầ t
h
i tế
.
T i Chiạ c cụ Tr ngồ tr tọ và Bảo vệ thực v tậ Trà Vinh, nhu c uầ phân tích số li uệ dựa
t
rên
kh iố lưngợ dữ liệu khổng lồ để hỗ trợ thông tin nhanh về d chị h iạ trên lúa cho nông
dân,
cán
bộ qu nả lý nông nghiệp, cán bộ nghiên cứu là m cụ tiêu đưcợ đ tặ ra. Các k tế quả
phân tích
này
có ý nghĩa quan tr ngọ trong công tác phòng trị d chị hại. Để đ tạ được m cụ
tiêu này, vi cệ
x
â
y
d ngụ ứng d ngụ th ngố kê trực tuy nế sử d ngụ kỹ thu tậ phân tích trực
tuy nế (OLAP –
OnLine
Analytical Processing) là m tộ gi iả pháp
tố
t
.
Để thể hi nệ các báo cáo dựa trên nhi uề chỉ tiêu, theo yêu c uầ c aủ ngưiờ sử d ng,ụ
ngườ
i ta thưngờ m tấ r tấ nhiều th iờ gian cho vi cệ thu th pậ dữ li u,ệ tích h pợ số liệu, thực
hi nệ một
s ố
công thức tính toán, thi tế kế m uẫ báo cáo m i,ớ th mậ chí sửa đ iổ l iạ c uấ
trúc cơ sở dữ liệ
u
(CSDL) và thay đ iổ mã ngu nồ c aủ ph nầ mềm. Chính các bưcớ phức
t pạ này đã làm chậm
đ
i quá trình cung cấp thông tin nhanh đ đểáp ứng k pị th iờ cho công tác
phòng ch ngố dịch hại.
Vì
v y,ậ vi cệ thay thế b ngằ m tộ phưngơ pháp m iớ là c nầ
thi
ết
.
Từ yêu cầu thực t ,ế bài toán xây dựng ứng dụng thống kê trực tuy nế trên n nề web
phụ
c vụ công tác phân tích trực tuy nế trên dữ li u ệv d chề ị h iạ trên lúa là th tậ sự thi t thế ực.
Ứng
d ng ụ
đưcợ thi tế kế sao cho có thể cung c pấ thông tin chính xác, đáp ứng yêu c uầ
phân tích số liệ
u
trên nhi uề chỉ tiêu, theo yêu c uầ c aủ ngưiờ dùng khi phân tích dữ li u.ệ Để
đáp ứng các yêu
c
ầ
u
này thì vi cệ áp dụng công nghệ m iớ như: kho dữ li uệ (Data
Warehouse), kỹ thu tậ phân tíc
h

trực tuy nế (OLAP) và các công nghệ liên quan đ nế web vào vi cệ xây dựng ứng d ngụ là
gi
iả
pháp khả t
h
i
.
Bài báo ti nế hành mô t ảvà xây dựng một ứng d ngụ th ngố kê số li uệ d chị h iạ trên lúa
t
i ạTrà Vinh sử d ngụ ki n trúc khoế dữ li u,ệ k tỹhu t phânậ tích trực tuyến OLAP và ki nế trúc
w
e
b.
Bài báo cũng nghiên cứu các tiêu chí mà ngưiờ dùng sử d ngụ khi phân tích dữ li uệ
d chị
h
i ạtrên lúa trực tuy nế trên
web.
2. CÔNG NGHỆ
OLAP
2.1. OLAP là
gì?
Thu tậ ngữ OLAP đưcợ E. F. Codd đưa ra trong m tộ bài báo có tên “Providing
On-Line
Analytical Processing to User Analysts” được công bố vào tháng 8 năm 1993. Trong bài
báo
này ông cũng đưa ra 12 quy t cắ mà m tộ h thệ ống OLAP ph iả tuân theo. Từ đó OLAP đưcợ
b
i t ếđ nế như m tộ kỹ thu tậ phân tích dữ li uệ sử d ngụ các thể hi nệ dữ li uệ đa chi uề g iọ là các
khố
i (cube). OLAP cung cấp khả năng t oạ ra các kh iố dữ li uệ và thực hi nệ các truy v nấ tinh
vi t
rên
các ứng d ngụ ngưiờ
dùng.
12 tiêu chuẩn để đánh giá m tộ hệ thống OLAP của E. F.
Codd:
1. Khung nhìn khái ni mệ đa chi uề (Multidimensional Conceptual View): Dữ liệ
u
sẽ đưcợ trình bày cho ng iườ dùng trên khuân m uẫ đa c
h
iề
u.
2. Trong su tố (Transparency): Ngưiờ dùng không c nầ bi tế họ
đ
a
ng
sử d ngụ CSDL
đ
a
chi uề
OLAP.
3. Tính truy c pậ (Accessibility): Các công cụ OLAP nên ch nọ dữ liệ
u
ngu nồ t tố nh tấ
đ
ể
hỗ trợ truy
v
ấ
n.
4. Nh tấ quán trong thực thi báo cáo (Consistent Reporting Performance):
Sự
thực t
h
i
báo cáo ph iả như nhau không phụ thu cộ vào dung lưngợ CSDL và số chi uề đưcợ sử
d ng.ụ
5. Có ki nế trúc khách – chủ (Client-Server Architecture): Các công
cụ
OLAP đưcợ
t
r
iể
n
khai trên mô hình khách hàng – ph cụ
vụ.
6. Phân chi uề t ngổ quát (Generic Dimensionality): Đ mả b oả các chi uề dữ li uệ là
như
nhau trong c uấ trúc và tính toán. Không thiên vị trong vi cệ truy c pậ b tấ cứ chi uề
nào.
7. Xử lý đ ngộ Ma tr nậ dữ li uệ thừa (Dynamic Sparse Matrix Handling): Các giá
tr
ị
null đưcợ tổ chức lưu trữ hi uệ quả trên ma tr nậ
đ ng.ộ
8. Hỗ trợ đa ngưiờ dùng (Multi-User Support): Công cụ OLAP ph iả hỗ trợ
nh
iề
u
ngưiờ dùng đ ngồ t
hờ
i
.
9. Các toán t ử qua các chi u ề không gi i ớ h n ạ
(Unr
e
s
t
r
icte
d
Cross-
Dimensional Operations): Quy t cắ k tế h pợ đưcợ áp d ngụ trên t tấ cả các c
h
iề
u.

10. Thao tác dữ liệu b ngằ trực giác (Intuitive Data Manipulation): Ngưiờ
dùng
nhìn th yấ m iọ dữ li uệ c nầ thi tế trên giao di n,ệ tránh ph iả sử d ngụ qua menu ho cặ qua
nh
iề
u
thao tác

m iớ mở đưcợ giao
d
iệ
n.
11. L pậ báo cáo đ ngộ (Flexible Reporting): Cho phép ngưiờ
dùng
trình bày báo cáo
dữ
li uệ theo b tấ kỳ cách nào mà họ t
h
íc
h.
12. Mức độ k t h pế ợ và số chi uề không h nạ chế (Unlimited Dimensions
and
Aggregation Levels): Sẽ không có gi iớ h nạ số chi uề và mức k tế h pợ trong mô hình
OLAP.
2.2. Mô hình dữ li uệ đa c
h
iề
u
Trong thực tế ngưiờ ta có khuynh hướng suy nghĩ theo “đa chi u”.ề Ví dụ m tộ nhà
qu
ả
n
lý nông nghi pệ khi dự đoán d chị h iạ x yả ra anh ta mô tả như sau: “Có khả năng d chị
r yầ
nâu
sẽ bùng phát trở l iạ tại các t nhỉ Trà Vinh, Vĩnh Long, An Giang trong kho ngả
tháng 5
năm
2009 ”. Dự đoán này đưcợ những ngưiờ thi tế kế kh iố dữ li uệ mô tả l iạ như
s
a
u
:
Hình 1: Mô ph ngỏ các chiều trong mô tả dịch
h iạ
Kh iố dữ li uệ (cube): Kh iố là thành phần chính trong c uấ trúc OLAP đưcợ sử d ngụ
đ
lể ưu trữ và li tệ kê dữ li u.ệ Nó tưngơ tự như khái niệm bảng (table) trong hệ thống
CSDL
qu
a
n
h
ệ
.
Ví dụ: Để qu nả lý dịch h iạ trên lúa ta có thể t oạ ra m tộ kh iố dữ li uệ DICHHAI
nh
ằ
m
lưu l iạ các thông tin liên quan đ nế d chị h iạ trên lúa có xét đến chiều th iờ gian, lo iạ
d chị
h
ại
,
th iờ ti t,ế giai đo nạ sinh trưng,ở đ aị điểm. Những chi uề này cho phép ngưiờ
dùng theo
dõi
những thông tin liên quan đ nế d chị h i nhạ ư d chị h iạ x yả ra ởđâu, trong đi uề
ki nệ th iờ ti tế
nào,
trong kho ngả th iờ gian nào và ở giai đo nạ sinh trưngở nào c aủ cây l
ú
a
.
Hình Error! No text of specified style in document.: Lược đồ c uấ trúc kh iố
DICHHAI.

