NG D NG NG NGH
OLAP
TRONG KHAI TC S LIU DCH H I TRÊN LÚA T I TRÀ
VINH
ABSTRACT
Online Analytical Processing is used in wide variety of business applications to
analyze
the data and this helps in querying multidimensional data. This thesis describes the design
and
the implementation of OLAP Reporting Application in rice diseases Data Warehouse by
using
the architecture of Data Warehouse, OLAP technology and web structure. It helps to
build
and to exploit a Data Warehouse of rice diseases. To get this goal, some modern tools to
build
and to organize many parts of the system needed are used in its practice such as SQL
Server
2005 for Analysis Services 2005 for an OLAP database and Microsoft Office
Web
Components for a web based OLAP Reporting Applications. The user can analyze
directly
and flexibly the rice disease data on the Web
pages.
Keywords: Data Warehouse, Online Analytical Processing (OLAP), web
structure,
OLAP database, web based OLAP
Reporting.
M
T T
K thu t phân tích d li u trc tuyến OLAP (Online Analytical Processing) được
s
d ng r ng rãi trong nhi u ng d ng kinh doanh đ phân tích d li u và giúp truy v n
trên
d
li u đa chi u nh m h tr vi c ra quy tế đ nh c a các nhà qun lý. Bài báo này mô
t
xây
dng m t ng d ng th ng kê trc tuy nế trên kho d li u d ch h i trên lúa b ng
cách s
d ng
ki nế trúc kho d li u (Data Warehouse), k thu t phân tích trc tuy nế OLAP và
c u trúc
w
e
b.
ng d ng này h tr khai thác hi u qu kho d li u d ch h i trên lúa đã
được ngành
Trng
tr t B o v Thc vt Trà Vinh tích t trong nhi u năm qua. Đ đt
được m c đích này,
m
t vài công c đưc s dng đ xây dng thành công ng d ng như:
SQL Server 2005 cho kho
d
li u, Analysis Services 2005 cho CSDL đa chi u OLAP và
Microsoft Office Web
Components
cho các báo cáo da trên web. Vi k tế qu đt đưc, ng
d ng cho phép người s d ng
phân
tích trc tuy nế linh ho t d li u d ch h i trên lúa
trc ti pế trang web, đi u này cho
th
y r ng công ngh OLAP không nhng là công c được
áp dng hiu qu trong các ng d ng
h
tr kinh doanh còn c n đưc áp d ng mnh m
trong các h th ng tin h c h tr lĩnh v
c nông
nghi
p.
T khóa: kho d li u, k thu t phân tích trc tuy n,ế c u trúc web, CSDL đa
c
h
i
u
OLAP, báo cáo da trên
web.
1. GII
THIU
Nông nghi p m t ngành kinh tế quan trng trong n n kinh tế ca m i qu c gia,
đ
c
bi t là trong giai đo n hi n nay, khi v n đ an ninh lưngơ thc đưc đ t lên hàng
đ
u.
nưc ta, do n n kinh tế phát tri n lên t mt nưc nông nghi p nên kinh
t
ế
nông
nghi p ng vai trò quan tr ng h nơ trong s phát tri n kinh tế c a đ t nưc.
Đ
i
u
này đã đưc chng minh thc tế trong cu c khng ho ng giá lương thc năm 2008, đã
làm
nh
hưng nghm tr ng đ nế nhiu thành ph n kinh tế khác và đ i s ng c a ng tri u
ngườ
i
.
Đ ng
b ng Sông Cu Long BSCL) là va lúa l n nh t nưc ta, trong nhng
năm
g
n
đây, v i vi c thâm canh tăng v và áp d ng các ti nế b khoa h c k thu t vào
s n xu t lúa
đã
m cho năng su t s n lưng lúa ngày m t nâng lên. H nơ mưi m qua,
ĐBSCL
đượ
c
x
e
m
vùng kinh tế tr ng đim c a qu c gia s n xu t lương thc ph c v
xu t khu và
b
o
đm an ninh lưngơ thc qu c
g
ia
.
Tuy nhiên, v i vi c thâm canh cây lúa trong nhi u m li n đã to nguy c ơcho s
b
c
phát d ch h i trên lúa, đ c bi t trong năm 2006 d ch r y u xut hi n t t c các tnh
t
hu
c vùng ĐBSCL. Đ ch ng l i s b c phát d ch hi, nâng cao năng su t và s n lưng lúa.
Các
nhà
khoa h c đã nghiên cu đưa ra nhi u bi n pháp hu hi u như: lai t o ra các
gi ng lúa
m
ikh năng kháng dch hi, thc hi n phương pháp qu ng canh, gieo tr ng
tránh d ch
h
i
,
phun thu c phòng tr d ch h i nhi u phương pháp khác. áp d ng
phưngơ pháp nào
đ
i na thì nhu c u tìm kiếm thông tin v d ch h i c a nhà nông, nhà qu n
nông nghi p và
nhà
khoa h c ng h t ếsc c n t
h
i tế
.
T i Chi c c Tr ng tr t và Bo v thc v t TVinh, nhu c u phân tích s li u da
t
rên
kh i lưng d liu khng l đ h tr thông tin nhanh v d ch h i trên lúa cho nông
dân,
cán
b qu n nông nghip, cán b nghiên cu m c tiêu đưc đ t ra. Các k tế qu
phân tích
này
ý nghĩa quan tr ng trong công tác phòng tr d ch hi. Đ đ t được m c
tiêu y, vi c
x
â
y
d ng ng d ng th ng trc tuy nế s d ng k thu t phân tích trc
tuy nế (OLAP
OnLine
Analytical Processing) là m t gi i pháp
t
t
.
Đ th hi n các báo o da trên nhi u ch tiêu, theo yêu c u c a ngưi s d ng,
ngườ
i ta thưng m t r t nhiu th i gian cho vi c thu th p d li u, tích h p s liu, thc
hi n mt
s
công thc tính toán, thi tế kế m u báo cáo m i, th m chí sa đ i l i c u
trúc cơ s d li
u
(CSDL) thay đ i ngu n c a ph n mm. Chính các bưc phc
t p này đã làm chm
đ
i quá trình cung cp thông tin nhanh đ đáp ng k p th i cho công tác
phòng ch ng dch hi.
v y, vi c thay thế b ng m t phưngơ pháp m i c n
thi
ết
.
T yêu cu thc t ,ế bài toán xây dng ng dng thng kê trc tuy nế trên n n web
ph
c v công tác phân tích trc tuy nế trên d li u v d ch h i trên lúa th t s thi t thế c.
ng
d ng
đưc thi tế kế sao cho th cung c p thông tin chính xác, đáp ng yêu c u
phân tích s li
u
trên nhi u ch tiêu, theo yêu c u c a ngưi dùng khi phân tích d li u. Đ
đáp ng các yêu
c
u
này thì vi c áp dng công ngh m i như: kho d li u (Data
Warehouse), k thu t phân tíc
h
trc tuy nế (OLAP) và các công ngh liên quan đ nế web vào vi c xây dng ng d ng
gi
i
pháp kh t
h
i
.
Bài báo ti nế hành t xây dng mt ng d ng th ng kê s li u d ch h i trên lúa
t
i TVinh s d ng ki n trúc khoế d li u, k thu t phân tích trc tuyến OLAP ki nế trúc
w
e
b.
Bài o cũng nghiên cu các tiêu c ngưi dùng s d ng khi phân tích d li u
d ch
h
i trên lúa trc tuy nế trên
web.
2. CÔNG NGH
OLAP
2.1. OLAP
gì?
Thu t ng OLAP đưc E. F. Codd đưa ra trong m t bài báo tên Providing
On-Line
Analytical Processing to User Analystsđược công b vào tháng 8 năm 1993. Trong bài
báo
này ông cũng đưa ra 12 quy t c m t h th ng OLAP ph i tuân theo. T đó OLAP đưc
b
i t ếđ nế như m t k thu t phân tích d li u s d ng các th hi n d li u đa chi u g i là các
kh
i (cube). OLAP cung cp kh năng t o ra các kh i d li u và thc hi n các truy v n tinh
vi t
rên
các ng d ng ngưi
dùng.
12 tiêu chun đ đánh giá m t h thng OLAP ca E. F.
Codd:
1. Khung nhìn khái ni m đa chi u (Multidimensional Conceptual View): D li
u
s đưc trình bày cho ng iườ dùng trên khuân m u đa c
h
i
u.
2. Trong su t (Transparency): Ngưi dùng không c n bi tế h
đ
a
ng
s d ng CSDL
đ
a
chi u
OLAP.
3. Tính truy c p (Accessibility): Các công c OLAP nên ch n d li
u
ngu n t t nh t
đ
h tr truy
v
n.
4. Nh t quán trong thc thi báo cáo (Consistent Reporting Performance):
S
thc t
h
i
báo cáo ph i như nhau không ph thu c vào dung lưng CSDL và s chi u đưc s
d ng.
5. ki nế trúc khách ch (Client-Server Architecture): Các công
c
OLAP đưc
t
r
i
n
khai trên hình khách hàng ph c
v.
6. Phân chi u t ng quát (Generic Dimensionality): Đ m b o các chi u d li u là
như
nhau trong c u trúc tính toán. Không thiên v trong vi c truy c p b t c chi u
o.
7. X đ ng Ma tr n d li u tha (Dynamic Sparse Matrix Handling): Các giá
tr
null đưc t chc lưu tr hi u qu trên ma tr n
đ ng.
8. H tr đa ngưi dùng (Multi-User Support): Công c OLAP ph i h tr
nh
i
u
ngưi dùng đ ng t
h
i
.
9. Các toán t qua các chi u không gi i h n
(Unr
e
s
t
r
icte
d
Cross-
Dimensional Operations): Quy t c k tế h p đưc áp d ng trên t t c các c
h
i
u.
10. Thao tác d liu b ng trc giác (Intuitive Data Manipulation): Ngưi
dùng
nhìn th y m i d li u c n thi tế trên giao di n, tránh ph i s d ng qua menu ho c qua
nh
i
u
thao tác
m i m đưc giao
d
i
n.
11. L p báo cáo đ ng (Flexible Reporting): Cho phép ngưi
dùng
trình bày báo cáo
d
li u theo b t kỳ cách nào mà h t
h
íc
h.
12. Mc đ k t h pế s chi u không h n chế (Unlimited Dimensions
and
Aggregation Levels): S không có gi i h n s chi u và mc k tế h p trong hình
OLAP.
2.2. hình d li u đa c
h
i
u
Trong thc tế ngưi ta khuynh hướng suy nghĩ theo “đa chi u”. Ví d m t nhà
qu
n
nông nghi p khi d đoán d ch h i x y ra anh ta t như sau: kh năng d ch
r y
nâu
s bùng phát tr l i ti các t nh T Vinh, Vĩnh Long, An Giang trong kho ng
tháng 5
năm
2009 ”. D đoán này đưc nhng ngưi thi tế kế kh i d li u t l i như
s
a
u
:
Hình 1: ph ng các chiu trong t dch
h i
Kh i d li u (cube): Kh i thành phn chính trong c u trúc OLAP đưc s d ng
đ
l ưu tr li t d li u. tưngơ t như khái nim bng (table) trong h thng
CSDL
qu
a
n
h
.
d: Đ qu n dch h i trên lúa ta th t o ra m t kh i d li u DICHHAI
nh
m
lưu l i các thông tin liên quan đ nế d ch h i trên lúa xét đến chiu th i gian, lo i
d ch
h
i
,
th i ti t,ế giai đo n sinh trưng, đ a đim. Nhng chi u y cho phép ngưi
dùng theo
dõi
nhng thông tin liên quan đ nế d ch h i nh ư d ch h i x y ra đâu, trong đi u
ki n th i ti tế
nào,
trong kho ng th i gian nào giai đo n sinh trưng nào c a cây l
ú
a
.
Hình Error! No text of specified style in document.: Lược đ c u trúc kh i
DICHHAI.