
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Trƣơng Vĩnh Long
NGHIÊN CỨU ỨNG DỤNG BỘ CÔNG CỤ
BUSINESS INTELLIGENCE TRONG VIỆC XỬ LÝ
SỐ LIỆU CỦA HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
MYSQL
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
HÀ NỘI - 2010

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Trƣơng Vĩnh Long
NGHIÊN CỨU ỨNG DỤNG BỘ CÔNG CỤ
BUSINESS INTELLIGENCE TRONG VIỆC XỬ LÝ
SỐ LIỆU CỦA HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU
MYSQL
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hƣớng dẫn: TS. Nguyễn Hà Nam
Cán bộ đồng hƣớng dẫn: ThS. Nguyễn Thu Trang
HÀ NỘI - 2010

LỜI CẢM ƠN
Trước tiên em xin gửi lời cảm ơn sâu sắc tới TS. Nguyễn Hà Nam và ThS. Nguyễn
Thu Trang đã tận tình chỉ bảo, giúp đỡ em hoàn thành luận văn này.
Em xin chân thành cảm ơn các thầy cô trong bộ môn Các hệ thống thông tin, trường
Đại học Công nghệ - Đại học Quốc gia Hà nội đã tạo điều kiện cho em thực hiện đề tài.
Đồng thời, em xin cảm ơn các thầy cô giáo trường Đại học Công nghệ đã dạy bảo, giúp
đỡ em trong 4 năm học vừa qua.
Cuối cùng em xin cảm ơn những người thân trong gia đình và bạn bè đã động viên,
giúp đỡ em trong quá trình học tập và thực hiện hoàn luận văn.
Xin chân thành cảm ơn!
Sinh viên
Trương Vĩnh Long.

TÓM TẮT
Ngày nay, việc lưu trữ, xử lý dữ liệu để tổng hợp thông tin, hỗ trợ ra quyết định đã
trở nên phổ biến đối với nhiều tổ chức sản xuất, kinh doanh. Có nhiều phương pháp để
đáp ứng yêu cầu này, trong đó Business Intelligence(BI- giải pháp quản trị doanh nghiệp
thông minh) là một giải pháp tiêu biểu, được nhiều tổ chức lựa chọn.
Khóa luận này giới thiệu một vài nét tổng quan về kho dữ liệu, hệ thống xử lý phân
tích trực tuyến và bộ công cụ Business Intelligence. Tiếp đó là việc triển khai cài đặt, ứng
dụng Business Intelligence, cụ thể là sử dụng bộ công cụ Pentaho trong việc xây dựng báo
cáo và khai phá dữ liệu dựa trên hệ quản trị cơ sở dữ liệu MySQL kết hợp phần mềm
Weka.

Danh sách các hình
Hình 1 – Cấu trúc hệ thống kho dữ liệu .. ................................. .............................. 3
Hình 2 – Dòng dữ liệu trong kho dữ liệu . ................................. .............................. 4
Hình 3 - Ứng dụng kho dữ liệu trong Business Intelligence ..... .............................. 5
Hình 4 – Ví dụ về cây quyết định . .......... ................................. .............................. 9
Hình 5 – Thành phần của hệ Business Intelligence ................... ............................ 12
Hình 6 – Cấu trúc của Pentaho Business Intelligence ............... ............................ 19
Hình 7 – Cơ sở dữ liệu về các thành phố ................................. ............................ 23
Hình 8 – Thiết lập Data Source .... .......... ................................. ............................ 24
Hình 9 – Thiết lập Constraint ....... .......... ................................. ............................ 25
Hình 10 – Mô tả báo cáo thu được sử dụng Pentaho ................ ............................ 26
Hình 11 – Mô tả bảng dữ liệu về khách hàng trong ngân hàng. ............................ 27
Hình 12 - Tải dữ liệu lên Weka từ MySQL ............................... ............................ 28
Hình 13 – Chọn bộ lọc MathExpression . ................................. ............................ 29
Hình 14 – Thay đổi thông số cho bộ lọc MathExpression ........ ............................ 30
Hình 15 – Sử dụng MathExpression để gán lại giá trị cho trường THU NHAP .... 30
Hình 16 – Chọn bộ lọc NumericToNominal ............................. ............................ 31
Hình 17 – Chọn bộ lọc AddValues .......... ................................. ............................ 32
Hình 18 – Thiết lập thông số cho bộ lọc AddValues ................ ............................ 32
Hình 19 – Sử dụng chức năng Replace Value trong phần Edit . ............................ 33
Hình 20 – Lựa chọn giá trị cần thay thế .. ................................. ............................ 34
Hình 21 – Lựa chọn giá trị thay thế ......... ................................. ............................ 34
Hình 22 – Lựa chọn xây dựng cây quyết định theo J48 ............ ............................ 35
Hình 23 - Cây quyết định thu được khi dùng Classifier J48 ..... ............................ 36