
Phân tích Business
Intelligence dựa trên Big Data

Các doanh nghiệp và khách hàng toàn cầu ngày càng thay đổi. Nó không chỉ còn là
dữ liệu khách hàng. Mục đích của một nền tảng phân tích Big Data và Business
Intelligence tích hợp là khai thác sâu hơn các câu hỏi vì sao, ở đâu, cái gì và như
thế nào về khách hàng, sản phẩm và công ty. Bài này sẽ thảo luận về việc tích hợp
Business Intelligence và phân tích Big Data.
Hệ thống doanh nghiệp trên thế giới đang thay đổi, sự năng động của khách hàng
đang thay đổi, và chính khách hàng cũng đang thay đổi. Tất cả đang chạy đua để
tìm ra lý do cho câu hỏi tại sao thay vì tìm ra đó là ai và sự việc đó như thế nào. Nó
không còn đơn thuần chỉ để hiểu làm thế nào một công ty có những bước chuyển
đổi từ A đến B. Các doanh nghiệp đang ở trong một cuộc chiến cạnh tranh thời
gian thực để biết khi khách hàng mua một cái gì đó, họ mua ở đâu, và những gì họ
đang suy nghĩ trước khi họ bước vào một cửa hàng hoặc truy cập vào một website.
Sức mạnh của Big Data, phân tích Big Data (Big Data analytics), nền tảng
Business Intelligence (BI) tích hợp và phân tích Big Data có thể giúp doanh nghiệp
làm được điều đó.
Lĩnh vực phân tích Big Data và BI vẫn còn mới. Làm thế nào để tích hợp các khái
niệm tương đồng nhưng khác nhau? Nó không chỉ còn là về dữ liệu hoặc công
nghệ, mà đó là tất cả mọi thứ — truyền thông mạng xã hội, hành vi của khách
hàng, và phân khúc khách hàng, những điều đó cũng chỉ là một vài đặc trưng mà

thôi. Bạn không thể dựa vào trong một số ứng dụng Big Data và mong muốn nhìn
thấy tương lai được. Cả BI, quản lý dữ liệu chủ (MDM - Master Data Mangement),
Big Data, và khả năng phân tích phải được tích hợp vào cùng một nền tảng, và
triển khai thành một giải pháp trực quan sáng tạo.
Điểm tương đồng và khác biệt giữa BI và Big Data analytics
BI không phải là một khái niệm mới. Data warehouses, data mining, và các công
nghệ database đã hiện hữu trong các hình thức khác nhau trong nhiều năm. Big
data có thể là một thuật ngữ mới, nhưng nhiều chuyên gia IT đã làm việc với dữ
liệu lớn trong các ngành khác nhau trong nhiều năm qua.
Tuy nhiên bây giờ Big Data không chỉ là về dữ liệu lớn. Điểm mới ở đây là đi sâu
và phân tích dữ liệu bán cấu trúc và phi cấu trúc. 15 năm trước, chúng ta không
phân tích các email, tập tin PDF, hoặc video. Có cảm giác như Internet chỉ mới
xuất hiện gần đây thôi; và điện toán phân tán cũng chỉ mới ra đời ngày hôm qua,
nhưng điểm mới ở đây là khả năng phổ biến và mở rộng hệ thống chỉ trong chớp
mắt — thậm chí đối với một ngân sách hạn hẹp. Tương tự như vậy, muốn dự đoán
tương lai không phải là một khái niệm mới, nhưng điểm mới chính là có thể truy
cập và lưu trữ tất cả các dữ liệu được tạo ra.

Có nhiều thông tin cho rằng 90 phần trăm các dữ liệu tồn tại ngày nay là từ hai
năm trước. Và dữ liệu đang tăng trưởng nhanh. Nếu 90 phần trăm tất cả dữ liệu
trên toàn thế giới được tạo ra trong hai năm qua thì ta có thể nói gì về dữ liệu đó?
Nhiều doanh nghiệp có nhiều cơ sở dữ liệu và nhiều nhà cung cấp cơ sở dữ liệu,
với nhiều terabyte hoặc thậm chí petabyte dữ liệu. Một số các hệ thống tích lũy dữ
liệu trên 30 hoặc 40 năm. Nhiều doanh nghiệp xây dựng toàn bộ kho dữ liệu và nền
tảng phân tích ra dữ liệu cũ này. Tập đoàn bán lẻ lớn như Wal-Mart, đã trở thành
công ty tỷ đô la trước thời Big Data. Vì vậy, dữ liệu không phải là yếu tố quyết
định chính mà chính là cách thức kinh doanh của họ.
Dữ liệu như một dịch vụ có thể điều khiển một doanh nghiệp. Tuy nhiên hãy suy
nghĩ về Amazon. Đó là một công ty thương mại điện tử trực tuyến. Bây giờ, mọi
người nhìn vào Amazon như là một công ty cung cấp nền tảng dịch vụ, phần mềm,
Big Data, và trung tâm dữ liệu điện toán đám mây. Trong những năm qua, Amazon
xây dựng giới thiệu các công cụ đáng kinh ngạc từ các công nghệ mã nguồn mở
khác nhau. Zynga, công ty game Facebook được biết đến với tựa game ăn khách
Farmville, đã sử dụng các dịch vụ đám mây của Amazon để mở rộng cơ sở dữ liệu
và phân tích riêng của mình.
Đối với dữ liệu có ích cho người dùng, nó phải tích hợp với tài chính của khách
hàng và dữ liệu bán hàng, với các sản phẩm dữ liệu, với các tiếp thị dữ liệu, truyền

thông xã hội, với các dữ liệu nhân khẩu học, với các dữ liệu đối thủ cạnh tranh, và
nhiều hơn nữa.
Những thách thức trong việc xây dựng một hệ thống BI và Big data analytics
Thiết kế một nền tảng tích hợp không bao giờ là dễ dàng. Extract, Transfer, và
Load (ETL) luôn luôn là giai đoạn dài nhất trong các dự án Data Warehouse. Có
nhiều giải pháp ETL khác nhau, đôi khi chúng có tác dụng, đôi khi không. Nếu
ETL không được thực hiện tốt, thì bạn ngẫu nhiên bạn sẽ có dữ liệu không chính
xác và không tin cậy. Dữ liệu không tin cậy sẽ tạo ra một hệ thống không đáng tin
và không sử dụng được. Tất nhiên chẳng ai muốn điều đó cả.
Có thể bạn sẽ dễ dàng nghĩ rằng đây có thể một thứ gì đó giống như một cơ sở dữ
liệu sản phẩm. Nhưng nó sẽ trở thành một trò chơi với nhiều phiên bản, lỗi, bản
cập nhật, bản phát hành khác nhau, chu kỳ phát hành khác nhau, giấy phép khác
nhau, và giấy phép khác nhau dựa trên địa điểm. Và đó chỉ là trong một công ty
với một vài sản phẩm. Nó sẽ trở nên phức tạp hơn trong trường hợp các công ty
bán lẻ có hàng ngàn sản phẩm khác nhau.
Nền tảng Big Data và BI tích hợp có thể có dữ liệu phi cấu trúc từ các email.
Chúng có thể bao gồm dữ liệu bán cấu trúc từ các bản ghi log. Hệ thống Email có
thể được phân tán trong cơ sở dữ liệu khác nhau trong nhiều trung tâm dữ liệu trên