
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Vũ Ngọc Anh
ÁP DỤNG KỸ THUẬT OLAP VÀ KHO DỮ LIỆU
TRONG DỰ BÁO TÀI CHÍNH
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Các hệ thống thông tin
HÀ NỘI - 2010

3
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Vũ Ngọc Anh
ÁP DỤNG KỸ THUẬT OLAP VÀ KHO DỮ LIỆU
TRONG DỰ BÁO TÀI CHÍNH
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Các hệ thống thông tin
Cán bộ hướng dẫn:
TS. Nguyễn Hà Nam
Cán bộ đồng hướng dẫn:
Ths. Nguyễn Thu Trang
HÀ NỘI - 2010

4
Lời cảm ơn
Trước tiên tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc tới TS.Nguyễn Hà Nam và
Ths.Nguyễn Thu Trang đã tận tình chỉ bảo và hướng dẫn tôi trong suốt quá trình thực hiện
khóa luận tốt nghiệp.
Tôi xin chân thành cảm ơn các thầy, các cô đã tạo cho tôi những điều kiện thuận lợi để
học tập và nghiên cứu tại trường Đại Học Công Nghệ.
Tôi xin cảm ơn các bạn trong nhóm làm “Data Warehouse và OLAP” đã cùng thảo luận
và trao đổi và giúp tôi rất nhiều trong quá trình thu thập tài liệu.
Tôi xin gửi lời cảm ơn vô hạn tới gia đình, bạn bè, những người thân yêu đã luôn bên
cạnh động viên tôi trong suốt quá trình thực hiện khóa luận.
Tôi xin chân thành cảm ơn!
Sinh viên
Vũ Ngọc Anh

1
Mục lục
Mục lục ....................................................................................................................... 1
Danh sách các hình ...................................................................................................... 3
Bảng từ viết tắt ............................................................................................................ 5
Lời mở đầu .................................................................................................................. 6
Chương 1. Giới thiệu kho dữ liệu và dữ liệu tài chính .................................................. 7
1.1. Dữ liệu trong lĩnh vực tài chính ...................................................................... 7
1.2. Kho dữ liệu (Data warehouse) ........................................................................ 8
1.2.1. Kho dữ liệu .............................................................................................. 8
1.2.2. Mục đích của kho dữ liệu ......................................................................... 9
1.2.3. Lợi ích của kho dữ liệu............................................................................. 9
1.2.4. Thành phần của kho dữ liệu ................................................................... 10
1.2.5. Cấu trúc của kho dữ liệu......................................................................... 11
1.2.6. Mô hình thực thể trong kho dữ liệu ........................................................ 12
1.2.7. Các lĩnh vực ứng dụng của kho dữ liệu .................................................. 15
Chương 2. Kỹ thuật phân tích OLAP ......................................................................... 16
2.1. Giới thiệu OLAP .......................................................................................... 16
2.2. Mô hình dữ liệu đa chiều .............................................................................. 16
2.3. Kiến trúc khối (Cube) của OLAP .................................................................. 18
2.4. So sánh OLAP và OLTP ............................................................................... 19
2.5. Các thành phần của OLAP ............................................................................ 20
2.6. Chuyển đổi dữ liệu từ OLTP tới OLAP ........................................................ 21
2.7. Các mô hình lưu trữ hỗ trợ OLAP ................................................................. 22
2.7.1. Mô hình Multidimentional OLAP (MOLAP) ......................................... 22
2.7.2. Mô hình Relational OLAP (ROLAP) ..................................................... 23
2.7.3. Mô hình Hybird OLAP (HOLAP) .......................................................... 24
2.7.4. So sánh các mô hình ............................................................................... 25
Chương 3. Bộ công cụ Pentaho .................................................................................. 26
3.1 Tổng quan .................................................................................................... 26
3.2 Các khả năng BI của pentaho ........................................................................ 26

2
3.3 Những đặc tính và lợi ích .............................................................................. 29
Chương 4. Giới thiệu bài toán triển khai trên Pentaho và kết quả đạt được ................ 33
4.1. Giới thiệu bài toán ........................................................................................ 33
4.2. Thu thập,xử lý dữ liệu................................................................................... 33
4.3. Tạo data warehouse ...................................................................................... 36
4.4. Xử lý dữ liệu bằng kỹ thuật OLAP ............................................................... 42
4.4.1. Tạo cube ................................................................................................ 42
4.4.2. Analysis View ........................................................................................ 43
Kết luận ..................................................................................................................... 52
Tài liệu tham khảo ..................................................................................................... 53