
56
CÔNG CỤ ỨNG DỤNG PHÂN TÍCH DỮ LIỆU CHO DOANH NGHIỆP
Nguyễn Chí Đạt
Phòng Công nghệ Thông tin, Trường Đại học Tài chính –Marketing
Email: nguyenchidat@ufm.edu.vn
Tóm tắt: Nghề phân tích dữ liệu nói riêng và cơ sở dữ liệu nói chung đang là một trong
những nghề nóng và phát triển nhanh trên toàn thế giới cùng với dữ liệu lớn, trí tuệ nhân tạo, vạn
vật kết nối. Bài viết tìm hiểu về nghề phân tích dữ liệu, các số liệu cần phân tích, cũng như tìm hiểu
các phần mềm hỗ trợ cho việc phân tích dữ liệu.
Từ khóa: phân tích dữ liệu, phần mềm phân tích dữ liệu, data analytics
1. PHÂN TÍCH DỮ LIỆU LÀ GÌ?
Phân tích dữ liệu là một quá trình kiểm tra, làm sạch, chuyển đổi và mô hình hóa dữ
liệu với mục tiêu khám phá thông tin hữu ích, thông báo kết luận và hỗ trợ ra quyết định.
Phân tích dữ liệu có nhiều khía cạnh và cách tiếp cận, bao gồm các kỹ thuật đa dạng dưới
nhiều tên khác nhau và được sử dụng trong các lĩnh vực kinh doanh, khoa học và khoa học
xã hội khác nhau. Trong thế giới kinh doanh ngày nay, phân tích dữ liệu đóng vai trò giúp
đưa ra quyết định khoa học hơn và giúp doanh nghiệp hoạt động hiệu quả hơn.
Khai thác dữ liệu là một kỹ thuật phân tích dữ liệu cụ thể tập trung vào mô hình thống
kê và khám phá tri thức cho mục đích dự đoán thay vì hoàn toàn mô tả, trong khi kinh doanh
thông minh bao gồm phân tích dữ liệu dựa chủ yếu vào tổng hợp, tập trung chủ yếu vào
thông tin kinh doanh.[2]
Trong các ứng dụng thống kê, phân tích dữ liệu có thể được chia thành thống kê mô
tả, phân tích dữ liệu khám phá (EDA) và phân tích dữ liệu xác nhận (CDA). EDA tập trung
vào việc khám phá các tính năng mới trong dữ liệu trong khi CDA tập trung vào xác nhận
hoặc làm sai lệch các giả thuyết hiện có. Phân tích dự đoán tập trung vào việc áp dụng các
mô hình thống kê để dự báo hoặc phân loại dự đoán, trong khi phân tích văn bản áp dụng
các kỹ thuật thống kê, ngôn ngữ và cấu trúc để trích xuất và phân loại thông tin từ các nguồn
văn bản, một loại dữ liệu phi cấu trúc. Tất cả các phương thức bên trên là các dạng khác
nhau của phân tích dữ liệu.
Tích hợp dữ liệu là tiền thân của phân tích dữ liệu, và phân tích dữ liệu được liên kết
chặt chẽ để trực quan hóa dữ liệu và phổ biến dữ liệu.