
117
CHƯƠNG 4. TRỰC QUAN HÓA DỮ LIỆU VÀ PHÂN TÍCH
4.1. Tổng quan về trực quan hóa dữ liệu
4.1.1. Khái niệm trực quan hóa dữ liệu
Hiện nay, chúng ta đang sống trong thời đại mà dữ liệu không phải là dữ liệu
truyền thống, nó đã trở thành dữ liệu lớn. Khi mỗi tổ chức hay doanh nghiệp càng có
nhiều dữ liệu thì tổ chức hay doanh nghiệp đó càng nắm trong tay nhiều tiềm năng
phát triển. Tuy nhiên, làm thế nào để biến dữ liệu thành tiềm năng, cơ hội thì lại là một
bài toán. Nếu chúng ta chỉ nhìn vào những con số và thông tin dưới dạng thống kê
trong tập dữ liệu thì chẳng thể hiểu hết được ý nghĩa của nó. Vì lý do này mà chúng ta
cần áp dụng trực quan hóa dữ liệu để thể hiện được các giá trị của dữ liệu một cách dễ
hiểu và dễ tiếp cận nhất với người xem. Vì vậy, trực quan hóa và phân tích dữ liệu là
kỹ năng cần phải có cho mỗi người lao động khi làm việc trong môi trường số.
Theo một nghiên cứu của Viện Công nghệ Massachusetts (MIT), bộ não của
chúng ta xử lý hình ảnh với tốc độ nhanh chóng. Việc thêm hình ảnh trong bài viết
không chỉ giúp tạo khoảng nghỉ giữa các nội dung văn bản dài mà còn giúp cho độc
giả có thể xử lý thông tin nhanh hơn. Trực quan hóa dữ liệu nâng giao tiếp bằng hình
ảnh lên một tầm cao mới, tích hợp số liệu thống kê và dữ liệu thành hình ảnh hấp dẫn
mà não của bạn có thể tiếp thu nhanh hơn so với việc chỉ đọc các con số dạng văn bản
thông thường.
Như vậy, ta có thể hình dung được khái niệm về trực quan hóa dữ liệu như sau:
Trực quan hóa dữ liệu (Data Visualization) là thể hiện dữ liệu thành các dạng
đồ họa như là đồ thị, biểu đồ hay sử dụng các phương pháp, công cụ khác nhau để
trực quan hóa và minh họa dữ liệu được tốt nhất. Mục đích trực quan hóa dữ liệu là
biến các nguồn dữ liệu thành những thông tin được thể hiện một cách trực quan, dễ
quan sát, dễ hiểu, để truyền đạt rõ ràng những hiểu biết đầy đủ (insights) từ dữ liệu
đến người xem, người đọc.
Trực quan hóa dữ liệu tốt là khi thể hiện được đặc điểm thú vị của tập dữ liệu ta
làm việc. Dữ liệu khác nhau yêu cầu những phương thức, cách giải mã, kỹ thuật hiển
thị khác nhau để thể hiện đặc điểm của nó. Với sự gia tăng của phân tích và trực quan
hóa dữ liệu trong thập kỷ qua, ngày càng nhiều công ty đầu tư vào các bộ công cụ phân
tích dữ liệu của mình. Bằng việc theo dõi và trực quan hóa dữ liệu với bản đồ, biểu đồ
và các công cụ trực quan hóa khác, doanh nghiệp sẽ nhận ra các xu hướng quan trọng
mà có thể đã bỏ lỡ.

118
Trực quan hóa dữ liệu có thể cho biết tổng quan về mẫu nghiên cứu, các xu
hướng, các giá trị ngoại lệ và mối tương quan trong dữ liệu. Bên cạnh đó, trực quan
hóa dữ liệu cũng giúp người phân tích và những người ra quyết định dễ dàng hiểu được
ý nghĩa của dữ liệu để thúc đẩy các quyết định trong kinh doanh và quản lý.
4.1.2. Các nguyên tắc trực quan hóa dữ liệu
Nguyên tắc 1: Xác định đúng mục tiêu, kỳ vọng khi trực quan dữ liệu
Trực quan hóa dữ liệu cần cung cấp một thông điệp rõ ràng và có ý nghĩa cho đối
tượng sử dụng. Mục tiêu, ngữ cảnh và đối tượng sử dụng kết quả theo đó cần được xác
định rõ ràng trước khi trực quan hóa dữ liệu. Chẳng hạn, tạo một báo cáo phân tích số
liệu cho lãnh đạo doanh nghiệp thì cần phải có những hình ảnh, số liệu đầy đủ, trung
thực, có thể có những thuật ngữ, ký hiệu chuyên môn sâu của doanh nghiệp, màu sắc
thể hiện trang trọng, lịch lãm. Báo cáo phân tích cho khách hàng bên ngoài doanh
nghiệp thuộc đối tượng trẻ thì cần tối giản và không có nhiều thuật ngữ, ký hiệu mang
tính chuyên môn cao; nhấn mạnh thông điệp cần hướng tới; trang trí cần bắt mắt với
các tông màu mạnh mẽ theo phong cách trẻ,…
Nguyên tắc 2: Tối giản và hiệu quả
Trực quan hóa dữ liệu phải được hiển thị tối giản đến mức các đối tượng không
chuyên có thể hiểu được thông điệp truyền đạt. Việc sử dụng tốt hình ảnh trực quan
(biểu đồ, màu sắc, cỡ chữ...) sẽ loại bỏ sự thiếu tập trung, giúp làm rõ thông điệp của
hình ảnh trực quan, giúp người đọc dễ dàng lĩnh hội các số liệu cần diễn đạt.
Nguyên tắc 3: Chuẩn mực cho tiêu đề và bình luận
Tiêu đề và bình luận cho các biểu đồ, sơ đồ trong các báo cáo phân tích nên được
sử dụng đúng lúc, đúng chỗ, ngắn gọn để giúp người đọc nhanh chóng xác định thông
điệp chính của báo cáo phân tích. Ngoài ra, tránh sử dụng các thuật ngữ chuyên ngành
hoặc từ viết tắt khi giao tiếp với đối tượng sử dụng đại chúng, loại bỏ các yếu tố phức
tạp không cần thiết.
Nguyên tắc 4: Chọn đúng công cụ
Có nhiều yếu tố cần xem xét khi lựa chọn một công cụ, từ công nghệ phù hợp,
tốc độ triển khai, đến chi phí sở hữu, tính tích hợp, khả năng mở rộng. Để đảm bảo có
lựa chọn đúng đắn và tiết kiệm cả thời gian lẫn chi phí, lãnh đạo các tổ chức và doanh
nghiệp nên cân nhắc sử dụng tư vấn chuyên môn trước khi quyết định triển khai các
công cụ và phần mềm trực quan hóa dữ liệu cho đơn vị mình. Hiện nay, trên thị trường
có rất nhiều công cụ cho trực quan hóa dữ liệu, từ các công cụ miễn phí cho đến các

119
công cụ trả phí với những tiện ích cao cấp cũng như tính năng an toàn, bảo mật dữ liệu
cho đơn vị sử dụng.
Nguyên tắc 5: Dữ liệu đầy đủ, trung thực
Trong khi thiết kế một hình ảnh trực quan dữ liệu, điều quan trọng là chúng ta
phải đảm bảo bạn không bóp méo dữ liệu và trình bày sai sự thật. Ngoài ra, khi thực
hiện trực quan hóa dữ liệu phải dựa trên quy chuẩn đo lường phổ biến và dữ liệu đầy
đủ để tránh các biểu đồ không trung thực gây ra cách hiểu sai lệch.
4.1.3. Những dạng biểu đồ chính trong trực quan hóa dữ liệu
a. Biểu đồ dạng thanh ngang hoặc cột (bar chart, column chart)
Biểu đồ dạng cột và thanh ngang loại biểu đồ phổ biến nhất để thể hiện dữ liệu.
Biểu đồ này thường được dùng để biểu diễn sự thay đổi theo thời gian, so sánh các
danh mục khác nhau hoặc so sánh các phần của tổng thể. Dữ liệu phổ biến nhất cho
biểu đồ cột và thanh ngang là một tập dữ liệu được chia thành các loại hay các trường
riêng biệt.
Hình 4.1. Một số biểu đồ dạng cột hoặc thanh ngang
b. Biểu đồ dạng đường (line chart)
Biểu đồ dạng đường là định dạng thông thường nhất để thể hiện những dữ liệu
tiếp diễn. Từ những điểm được liên kết thông qua đường nối, biểu đồ dạng đường để
hiển thị mối quan hệ chuỗi thời gian với dữ liệu nối tiếp nhau. Ngoài ra, nó cũng biểu
thị xu hướng, mức tăng trưởng và mức sụt giảm.

120
Hình 4.2. Hình ảnh các loại biểu đồ dạng đường
c. Biểu đồ dạng tròn (pie chart)
Biểu đồ tròn có hình dạng như một chiếc bánh và được sử dụng tốt nhất khi cần
hiển thị một dữ liệu được phân thành nhiều mục con. Biểu đồ loại này dùng để so sánh
từng phần với toàn bộ với hoặc các dữ liệu tiếp nối nhau.
Hình 4.3. Hình ảnh các loại biểu đồ dạng tròn
d. Biểu đồ dạng điểm hay biểu đồ phân tán (scatter chart)
Hình 4.4. Hình ảnh các loại biểu đồ phân tán

121
Biểu đồ phân tán thường hữu dụng trong việc thể hiện mối liên hệ giữa hai đối
tượng bởi vì chúng cho phép mã hóa đồng thời những dữ liệu trên 2 trục tọa độ để xác
định sự tồn tại cũng như định nghĩa một mối liên hệ nào đó.
Biểu đồ phân tán hiển thị các tương quan hoặc các mẫu trong dữ liệu không rõ
ràng khi chỉ nhìn vào các điểm dữ liệu cá nhân.
e. Biểu đồ nhiệt (heat map)
Biểu đồ nhiệt là một công cụ thể hiện dữ liệu trực quan mức độ hay tần suất tác
động nhiều hay ít của dữ liệu. Theo quy ước, trong biểu đồ nhiệt thì màu nóng là nơi
được tương tác nhiều (hay tần suất xuất hiện cao), màu lạnh là nơi tương tác ít (tần
suất xuất hiện ít hơn).
Hình 4.5. Các giá trị thể hiện trong một biểu đồ nhiệt
f. Biểu đồ dạng bản đồ (map chart)
Biểu đồ dạng bản đồ cho phép hiển thị dữ liệu lên bản đồ địa lí theo quốc gia,
vùng, tỉnh, quận/ huyện dưới dạng phủ màu lên toàn vùng đó. Sử dụng biểu đồ dạng
bản đồ khi ta muốn nhấn mạnh loại dữ liệu nào đó theo các khu vực/ quốc gia.
Hình 4.6. Biểu đồ dạng bản đồ thể hiện số liệu tại các quốc gia

