Phân tích Business
Intelligence dựa trên Big Data
Các doanh nghip và khách hàng toàn cu ngày càng thay đổi. Nó không chn là
d liu khách hàng. Mục đích của mt nn tng phân tích Big Data và Business
Intelligence tích hp là khai thác sâu hơn các câu hi vì sao, đâu, cái gì như
thế nào v khách hàng, sn phm và công ty. Bài này s tho lun v vic tích hp
Business Intelligence và phân tích Big Data.
H thng doanh nghip trên thế gii đang thay đổi, s năng động ca khách hàng
đang thay đổi, và chính kháchng cũng đang thay đổi. Tt c đang chạy đua để
tìm ra lý do cho câu hi ti sao thay tìm ra đó là ai và s việc đó như thế nào.
không còn đơn thun ch để hiu làm thế nào mt công ty có nhng bước chuyn
đổi t A đến B. Các doanh nghiệp đang ở trong mt cuc chiến cnh tranh thi
gian thực để biết khi khách hàng mua mt cái đó, họ mua đâu, và những gì h
đang suy nghĩ trước khi h bước vào mt ca hàng hoc truy cp vào mt website.
Sc mnh ca Big Data, phân tích Big Data (Big Data analytics), nn tng
Business Intelligence (BI) tích hp và phân tích Big Data có th giúp doanh nghip
làm được điều đó.
Lĩnh vực phân tích Big Data và BI vn còn mi. Làm thế nào để tích hợp các khái
nim tương đồng nhưng khác nhau? Nó không chỉ còn là về dữ liu hoặc công
nghệ, mà đó là tất cmọi thứ — truyn thông mng xã hội, hành vi của khách
hàng, và phân khúc khách hàng, những điều đó cũng chỉ là một vài đặc trưng
thôi. Bn không thể dựa vào trong một số ứng dụng Big Data và mong muốn nhìn
thấy tương lai được. Cả BI, quản lý dữ liệu chủ (MDM - Master Data Mangement),
Big Data, và khnăng phân tích phải được tích hợp vào cùng một nền tảng, và
triển khai thành một giải pháp trực quan sáng tạo.
Điểm tương đng và khác bit gia BI và Big Data analytics
BI không phi là một khái niệm mới. Data warehouses, data mining, và các công
nghệ database đã hiện hữu trong các hình thức khác nhau trong nhiều năm. Big
datathể là một thuật ngữ mi, nhưng nhiều chuyên gia IT đã làm việc với dữ
liu lớn trong các ngành khác nhau trong nhiều năm qua.
Tuy nhiên bây giờ Big Data không chỉ là vdữ liệu lớn. Đim mới ở đây là đi sâu
và phân tích dliệu bán cấu trúc và phi cấu trúc. 15 m trước, chúng ta không
phân tíchc email, tp tin PDF, hoặc video. Có cm giác như Internet chỉ mới
xuất hiện gần đây thôi; và điện toán phân tán cũng chỉ mới ra đời ngày hôm qua,
nhưng điểm mớiđây là khnăng phổ biến và mở rộng hệ thống chỉ trong chớp
mắt — thm c đối với một ngân sách hạn hẹp. Tương tự như vậy, mun dự đoán
tương lai không phải là một khái niệm mi, nhưng điểm mới chính là có thể truy
cập và lưu trữ tất cả các dữ liệu được tạo ra.
Có nhiu thông tin cho rằng 90 phần trăm các dữ liệu tồn tại ngày nay là thai
năm trước. Và dữ liệu đang tăng trưởng nhanh. Nếu 90 phần trăm tất cả dữ liệu
trên toàn thế giới được tạo ra trong hai năm qua thì ta có thnói gì về dữ liệu đó?
Nhiều doanh nghiệp có nhiều cơ sở dữ liệu và nhiều nhà cung cp cơ sở dữ liệu,
với nhiều terabyte hoặc thm chí petabyte dữ liệu. Một số các hệ thống tích lũy dữ
liu trên 30 hoặc 40 năm. Nhiều doanh nghiệp xây dựng toàn bộ kho dữ liệu và nn
tảng phân tích ra dữ liệu cũ này. Tập đoàn bán llớn như Wal-Mart, đã trở thành
công ty tỷ đô la trước thời Big Data. Vì vậy, dữ liệu không phải là yếu tố quyết
định chính mà chính cách thức kinh doanh của họ.
Dliu như một dịch vụ có thể điều khiển một doanh nghiệp. Tuy nhiên hãy suy
nghĩ về Amazon. Đó là một công ty tơng mại đin tử trực tuyến. Bây giờ, mọi
người nhìn vào Amazon như là một công ty cung cấp nền tảng dịch vụ, phần mềm,
Big Data, và trung m dliệu điện toán đám mây. Trong những năm qua, Amazon
xây dng giới thiệu các công cụ đáng kinh ngạc từ các công nghệ mã ngun mở
khác nhau. Zynga, ng ty game Facebook được biết đến với tựa game ăn khách
Farmville, đã sử dụng các dịch vụ đám mây của Amazon để mở rộng cơ sở dữ liệu
và phân tích riêng của mình.
Đối với dữ liệu có ích cho người dùng, nó phi tích hợp với tài chính của khách
hàng và dliệu bán hàng, với các sản phẩm dữ liu, vi các tiếp thị dữ liệu, truyền
thông xã hội, với các dữ liu nhân khẩu học, với các dữ liu đối thủ cạnh tranh, và
nhiều hơn nữa.
Nhng thách thc trong vic xây dng mt h thng BI và Big data analytics
Thiết kế một nền tảng tích hợp không bao gilà ddàng. Extract, Transfer,
Load (ETL) luôn luôn là giai đoạn dài nhất trong các dự án Data Warehouse.
nhiều giải pháp ETL khác nhau, đôi khi chúngtác dụng, đôi khi không. Nếu
ETL không được thực hiện tốt, thì bn ngẫu nhiên bn sẽ có dữ liu không chính
xác và không tin cậy. Dữ liệu không tin cậy sẽ tạo ra một hệ thống không đáng tin
và không sử dụng được. Tất nhiên chẳng ai muốn điều đó cả.
Có thể bạn sẽ dễ dàng nghĩ rằng đây có thmột thứ gì đó giống như một cơ sở dữ
liu sản phẩm. Nhưng nó sẽ trở thành một trò chơi với nhiều phiên bn, lỗi, bản
cập nhật, bản phát hành khác nhau, chu kỳ phát hành khác nhau, giy phép khác
nhau, và giấy phép khác nhau dựa trên địa điểm. Và đó chỉ là trong một công ty
với một vài sn phẩm. Nó sẽ trở nên phức tạp hơn trong trường hợp các công ty
bán lẻ có hàng ngàn sn phẩm khác nhau.
Nền tảng Big Data và BI tích hợp có thể có dữ liệu phi cấu trúc từ các email.
Chúng có thể bao gồm dữ liệu bán cấu trúc từ các bản ghi log. Hệ thống Email có
thể được phân tán trong cơ sở dữ liệu khác nhau trong nhiều trung tâm dữ liệu trên