278
QUẢN LÝ CHẤT LƯỢNG DỮ LIỆU KINH DOANH
Trần Anh Sơn
Khoa Công nghệ Thông tin. Trường Đại học Tài chính – Marketing
Email: tason@ufm.edu.vn
Tóm tắt: Nếu như quản lý dữ liệu được ví nhưcột sống để kết nối tất cả các phân đoạn
của toàn bộ vòng đời thông tin thì việc quản lý chất lượng dữ liệu đó càng trở nên quan trọng hơn
bao giờ hết. Suy cho cùng thì dữ liệu kinh doanh của tổ chức chính mạch máu của doanh nghiệp
chất lượng dữ liệu kinh doanh không tốt hay xấu, không cao hay thấp đơn giản nó chỉ một
phạm vi hoặc thước đo tình trạng của dữ liệu được bơm qua tổ chức của bạn. Quản lý chất lượng
dữ liệu kinh doanh cung cấp một quy trình theo ngữ cảnh cụ thể để cải thiện tính phù hợp của dữ
liệu được sử dụng để phân tích và ra các quyết định liên quan đến hoạt động kinh doanh. Mục tiêu
là tạo ra những hiểu biết sâu sắc về tình trạng của dữ liệu kinh doanh bằng cách sử dụng các quy
trình và công nghệ khác nhau trên các tập dữ liệu ngày càng lớn hơn và phức tạp hơn.
Trong phạm vi bài tham luận này, tác giả đi sâu vào trình bày, phân tích những nội dung liên
quan đến dữ liệu kinh doanh, quản trị chất lượng dữ liệu kinh doanh trong bối cảnh của cuộc cách
mạng công nghiệp 4.0 tiếp cận trên cả phương diện quản trị hoạt động kinh doanh và quản trị hệ
thống Công nghệ thông tin ứng dụng trong kinh doanh. Kết quả của bài tham luận sẽ tài liệu
hữu ích không chỉ cho những nhà phát triển hệ thống thông tin quản kinh doanh số trong định
hướng chiến lược quản lý chất lượng dữ liệu kinh doanh của mình mà nội dung của bài tham luận
còn giúp cho tất cả những ai muốn tìm hiểu, nghiên cứu về các dự án quản lý chất lượng dữ liệu
nói chung cũng như các nhà quản lý kinh doanh có sở trong định hướng chiến lược công ngh
thông tin và quản lý dữ liệu, quản lý chất ợng dữ liệu đáp ứng với mục tiêu chiến lược hoạt động
kinh doanh của doanh nghiệp.
Từ khóa: Dữ liệu kinh doanh, chất lượng dữ liệu, quản lý chất lượng dữ liệu kinh doanh
1. ĐẶT VẤN ĐỀ
Dữ liệu là một chủ đề nóng trong thế giới kinh doanh hiện nay. Mọi người đều muốn
nói về những hiểu biết sâu sắc giá trị họ ththu được từ dữ liệu. một do
chính đáng cho điều đó bởi đơn giản dữ liệu là một trong những tài nguyên có giá trị nhất
hiện nay đối với mọi tổ chức hoạt động trong tất cả các ngành của nền kinh tế. Tuy nhiên,
dữ liệu chỉ hữu ích nếu chất lượng cao ngược lại dữ liệu sẽ trở nên không quan
trọng. Trong trường hợp xấu nhất, nó có thể khiến các công ty mắc phải những sai lầm đắt
giá. IBM ước tính rằng dữ liệu xấu gây thiệt hại cho nền kinh tế Mỹ khoảng 3,1 nghìn tỷ
279
Mỹ kim mỗi năm. Những chi phí đó đến từ thời gian nhân viên phải bỏ ra để sửa chữa dữ
liệu xấu và khắc phục những sai sót do dữ liệu xấu gây ra lỗi đối với khách hàng. Rõ ràng,
cải thiện chất lượng dữ liệu kinh doanh cho doanh nghiệp là một hội lớn giúp cải thiện
hoạt động của doanh nghiệp.
Đối với nhiều nhà lãnh đạo doanh nghiệp đang nhận thức được tác động to lớn của
dữ liệu lớn (Big data) đối với quỹ đạo của tổ chức doanh nghiệp vì nó liên quan đến nhiều
vấn đề như: Dự đoán kỳ vọng của khách hàng; Hỗ trợ quản sản phẩm hiệu quả; sẵn
theo yêu cầu để ảnh hưởng đến việc ra quyết định từ trên xuống; Điều chỉnh đổi mới dịch
vụ khách hàng bằng cách điều tra thói quen mua sắm của khách hàng; và Cung cấp cho các
tổ chức thông tin về đối thủ cạnh tranh. Tuy nhiên, có một lưu ý vô cùng quan trọng đó
nếu dữ liệu không chính xác, đầy đủ và nhất quán thì điều đó lại có thể dẫn đến những sai
lầm nghiêm trọng khi đưa ra một quyết định kinh doanh. Trên thực tế, Gartner ước tính tác
động tài chính trung bình của chất lượng dữ liệu kém đối với các doanh nghiệp là 15 triệu
đô la Mỹ mỗi năm, nghĩa bạn không thể không ưu tiên quản lý chất lượng dữ liệu ngay
từ bây giờ.
Hơn nữa, khi các tổ chức tìm cách áp dụng làn sóng công nghệ mới trong cuộc cách
mạng công nghiệp 4.0 hiện nay như tự động hóa, trí tuệ nhân tạo (AI), Internet kết nối vạn
vật (IoT),... sự thành công của họ trong việc làm như vậy và khả năng tạo sự khác biệt trong
những không gian đó sẽ phụ thuộc vào khả năng quản dữ liệu. Điều này ngày càng trở
nên quan trọng khi các thiết bị cùng các cảm biến được kết nối ngày càng nhiều đã gây ra
sự tăng trưởng dữ liệu theo cấp số nhân hội khai thác dữ liệu cũng tăng trưởng một
cách tương xứng. Những người định vị tổ chức để quản lý dữ liệu một cách chính xác
hiểu được giá trị vốn của nó sẽ nhiều lợi thế hơn. Trên thực tế, chúng ta thể thấy
các nhà lãnh đạo đã nhìn xa trước rằng sẽ làm cho thị trường trở nên rất khó khăn cho
những người chấp nhận chậm về công nghệ hoặc những người mới tham gia.
Khi các kỹ thuật công nghệ quản dữ liệu được cải thiện, dữ liệu ngày càng trở
nên quan trọng đối với các doanh nghiệp. Ngày càng nhiều công ty sử dụng dữ liệu để
đưa ra quyết định về tiếp thị, phát triển sản phẩm, tài chính và hơn thế nữa. Khi nhiều công
ty thu được lợi ích từ dữ liệu, việc sử dụng dữ liệu ngày càng trở thành một vấn đề để theo
kịp đối thủ. Các công ty không tận dụng dữ liệu và các công nghệ liên quan có nguy cơ bị
tụt hậu. Tuy nhiên, để dữ liệu lợi, cần phải chất lượng cao. Chất ợng dữ liệu
280
càng tốt thì doanh nghiệp càng thể khai thác được nhiều hơn. Nếu thông tin chất lượng
thấp, nó thậm chí có thể gây hại. Nếu bạn đưa ra quyết định dựa trên dữ liệu không hợp lệ,
bạn có thể lựa chọn sai. Các công nghệ mới ng đang làm tăng tầm quan trọng của dữ liệu
chất lượng của nó. Các công nghệ ntrí tuệ nhân tạo tự động hóa tiềm năng to
lớn, nhưng thành công với những công nghệ này phụ thuộc nhiều vào chất lượng dữ liệu.
dụ, máy học yêu cầu khối lượng lớn dữ liệu chính xác. Thuật toán máy học càng
nhiều dữ liệu tốt thì thể tạo ra kết quả càng nhanh những kết quả đó sẽ càng tốt.
Trong một cuộc khảo sát gần đây đối với các giám đốc điều hành cấp cao của New Vantage
Partners, hơn 3/4 số người được hỏi nói rằng sự gia tăng khối lượng và nguồn dữ liệu đang
thúc đẩy tăng cường đầu tư vào AI và học tập nhận thức.
Tóm lại, dữ liệu ngày càng trở nên không thể thiếu đối với hoạt động của doanh
nghiệp. Thay vì coi dữ liệu là tách biệt với các chức năng khác của chúng, một số công ty
thành công nhất hiện nay tích hợp nó vào mọi thứ họ làm. Sự tích hợp gia tăng này nghĩa
là chất lượng dữ liệu có thể tác động đến nhiều khía cạnh của doanh nghiệp từ tiếp thị đến
bán hàng đến sáng tạo nội dung. Điều này càng thể hiện rằng chất lượng dữ liệu cũng tất
yếu trở nên vô cùng quan trọng bởi các vấn đề liên quan đến sự tuân thủ. Khi các quy định
liên quan đến dữ liệu tiếp tục phát triển, việc các công ty quản lý dữ liệu của họ đúng cách
ngày càng trở nên quan trọng. Sẽ khó hơn để chứng minh sự tuân thủ nếu dữ liệu của bạn
thiếu tính tổ chức hoặc được duy trì kém. Điều này đặc biệt quan trọng đối với dữ liệu tài
chính và dữ liệu cá nhân nhạy cảm nhưng cũng có thể áp dụng cho các loại thông tin khác.
Chính vậy, hơn ai hết chúng ta cần phải xem xét bài bản về chất lượng dữ liệu kinh doanh
và nhanh chóng tiếp cận quản lý nó theo định hướng ứng dụng hiệu quả công nghệ để phát
huy hết giá trị to lớn của dữ liệu kinh doanh phục vụ cho các hoạt động của doanh nghiệp.
2. CƠ SỞ CỦA QUẢN LÝ CHẤT LƯỢNG DỮ LIỆU KINH DOANH
2.1. Chất lượng của dữ liệu kinh doanh
Chất lượng dữ liệu kinh doanh là rất quan trọng nếu không dữ liệu chất lượng
cao, bạn không thể hiểu hoặc giữ liên lạc với khách hàng của mình. Trong thời đại dựa trên
dữ liệu này, việc tìm hiểu thông tin chính về khách hàng hiện tại và khách hàng tiềm năng
trở nên dễ dàng hơn bao giờ hết. Thông tin này có thể cho phép bạn tiếp thị hiệu quả hơn
và khuyến khích lòng trung thành có thể tồn tại trong nhiều thập kỷ. Hãy yên tâm rằng nếu
bạn không bị thuyết phục về tầm quan trọng của chất lượng dữ liệu thì đối thủ cạnh tranh
281
của bạn cũng vậy và họ sẽ không ngần ngại cố gắng tìm kiếm dữ liệu tốt nhất để cải thiện
lợi thế cạnh tranh của chính họ. Vậy chất lượng dữ liệu kinh doanh là gì và làm thế nào để
được dữ liệu kinh doanh chất lượng phục vụ cho hoạt động của tổ chức đang là câu
hỏi mà bất kỳ nhà quản lý kinh doanh nào cũng rất cần có câu trả lời cụ thể vào trong ngữ
cảnh của doanh nghiệp mình. Tuy nhiên, như đã đề cập ngay đầu bài viết thì dữ liệu,
thông tin không hoàn toàn tốt hay tồi mà nó lệ thuộc vào người tiếp nhận dữ liệu, thông tin
đó. Một nội dung dữ liệu, thông tin thể rất hữu ích (rất giá trị) đối với một nhân
hay tổ chức này tuy nhiên nó có thể không ảnh hưởng gì (không giá trị) đối với một
nhân hay tổ chức khác, thậm chí còn thể ảnh hưởng không tốt đối với họ.
vậy, rất khó một định nghĩa chính xác về chất ợng dữ liệu nói chung hay chất lượng
dữ liệu kinh doanh nói riêng. Mặc dù vậy, các nhà nghiên cứu cũng đã cố gắng đưa ra nhiều
khái niệm liên quan đến chất lượng dữ liệu cũng như một số tiêu chuẩn tham khảo để đánh
giá về chất lượng của dữ liệu.
a). Khái niệm về chất lượng dữ liệu kinh doanh:
Theo ISO 9000:2014 định nghĩa chất ợng mức độ một tập hợp các đặc tính
vốn có của một đối tượng đáp ứng các yêu cầu, trong đó đối tượng là bất cứ thứ có th
hiểu được hoặc có thể hình dung được. Thuật ngữ đối tượng được thêm vào kể từ phiên bản
trước của tiêu chuẩn ISO 9000. Theo định nghĩa này, chất lượng của dữ liệu là mức độ mà
một tập hợp các đặc tính vốn có của dữ liệu đáp ứng các yêu cầu của người hay tổ chức sử
dụng dữ liệu.
- Trên phương diện của quản trị hoạt động của tổ chức thì chất lượng dữ liệu (Data
quality) nói chung chất lượng dữ liệu kinh doanh nói riêng (Business data quality)
thể hiểu theo nghĩa hẹp hoặc theo nghĩa rộng. Cụ thể:
Xét theo nghĩa hẹp, n cứ vào giá trị của dữ liệu kinh doanh đối với đối tượng sử
dụng dữ liệu là các doanh nghiệp thì: Chất lượng dữ liệu kinh doanh là mức độ đáp ứng của
dữ liệu đối với các nhiệm vụ hay mục tiêu kinh doanh (các hoạt động kinh doanh, các quyết
định kinh doanh) của doanh nghiệp.
Tuy nhiên, theo Cộng đồng quản trị dữ liệu toàn cầu (The Global Data Management
Community) thì chất lượng dữ liệu có thể hiểu rộng hơn không chỉ là giá trị của dữ liệu đối
với đối tượng sử dụng dữ liệu mà còn bao hàm cả các quy trình, phương pháp để cải thiện
chất lượng của chính nguồn dữ liệu đó.
282
- Trên phương diện của công nghệ thông tin quản trị dữ liệu số ứng dụng trong
kinh doanh tchất lượng dữ liệu kinh doanh ngoài các nội dung được xem xét như đối với
quản trị hoạt động của tổ chức thì còn phải đánh giá cả về tính phù hợp của công nghệ tổ
chức lưu trữ và khai thác nguồn lực dữ liệu này theo từng doanh nghiệp và theo từng ngành
kinh doanh.
b). Các tiêu chí đánh giá chất lượng dữ liệu kinh doanh:
Để đo lường chất lượng dữ liệu kinh doanh của tổ chức, rõ ràng bạn cần các thước đo
về chất lượng dữ liệu phù hợp với tổ chức đó. Thước đo về chất lượng dữ liệu cũng chính
chìa khóa để đánh giá nỗ lực của tổ chức trong việc gia tăng chất lượng dữ liệu, thông
tin của tổ chức. Trong số các kỹ thuật quản lý chất lượng dữ liệu khác nhau, các thước đo
chất lượng dữ liệu phải yếu tố quan trọng hàng đầu và phải được xác định một cách
ràng. Các chỉ số (hay các đặc tính đã được ISO 9000 : 2014 đề cập) để đo lường chất lượng
dữ liệu, thông tin nói chung chất lượng dữ liệu kinh doanh nói riêng thường bao gồm
nhiều khía cạnh khác nhau của chất lượng, tuy nhiên có 5 đặc tính quan trọng mà chúng ta
thường phải quan tâm đó là: Độ chính xác (Accuracy), tính nhất quán (Consistency), tính
đầy đủ (Completeness), tính toàn vẹn (Integrity) hay còn gọi tính hợp lệ (Validity)
tính kịp thời (Timeliness).
Mặc phân tích dữ liệu khá phức tạp, nhưng một số phép đo bản tất cả
các bên liên quan chính của quản lý chất lượng dữ liệu cần phải biết. Các chỉ số chất lượng
dữ liệu là điều cần thiết để cung cấp cơ sở tốt nhất vững chắc nhất cho các phân tích liên
quan trong tương lai. Các số liệu này sẽ giúp tổ chức theo dõi hiệu quả của các nỗ lực cải
tiến chất lượng của mình cơ sở cần thiết để đảm bảo ràng tổ chức đang đi đúng theo
định hướng. Bảng 1 mô tả về một số tính chất cơ bản để đánh giá chất lượng dữ liệu mà các
tổ chức thường tham khảo khi xây dựng bộ tiêu chí đánh giá chất lượng dữ liệu của mình.
Bảng 1: Mô tả một số tính chất ảnh hưởng đến chất lượng dữ liệu kinh doanh
TT
Tính chất
Ý nghĩa
Cách đo lường
1
Độ chính xác
Độ chính xác đo lường mức độ đung với thực
tế của giá trị dữ liệu. Độ chính xác điều tối
quan trọng đối với khả năng đưa ra kết luận
chính xác từ dữ liệu của bạn.
Đo ờng tỷ lệ dữ
liệu so với lỗi.