231
QUẢN LÝ BIG DATA TRONG MÔI TRƯỜNG KINH DOANH HIỆN ĐẠI
Nguyễn Thị Trần Lộc
Khoa Công nghệ Thông tin. Trường Đại học Tài chính - Marketing
Email: ntt.loc@ufm.edu.vn
Tóm tắt: Thế giới đang sống trong thời đại kỷ nguyên mới, chứng kiến sự thay đổi chóng mặt
của xu hướng phát triển công nghệ trong công cuộc cách mạng công nghệ 4.0, từ đó Big data,
thương mại điện tử những khái niệm quen thuộc trong tất cả các lĩnh vực. Trong thế giới trực
tuyến hiện đang không gian thị trường lớn nhất cho các doanh nghiệp trên toàn thế giới, Dữ liệu
lớn (Big Data) đang chứng tỏ bộ công cụ mạnh mẽ nhất để họ sở hữu và sử dụng. vậy việc
quản lý BigData và khai thác được BigData hiệu quả là những vấn đề mà hầu như doanh nghiệp
nào cũng quan tâm.
Từ khóa: bigdata, dữ liệu lớn, công nghệ thông tin
Sự tiến bộ vượt bậc của khoa học công nghệ, đến sự ra đời của các kênh truyền
thông đòi hỏi một hệ thống dữ liệu cực lớn mang tính toàn cầu như mạng xã hội và các thiết
bị công nghệ tiên tiến đã đặt ra thách thức không hề nhỏ cho các nền ng nghiệp khác nhau
phải tìm ra cách khác xử lý dữ liệu.
1. KHÁI NIỆM BIG DATA
Theo định nghĩa của Gartner: Big Data là tài sản thông tin, mà những thông tin này
có khối lượng dữ liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có công nghệ mới để
xử hiệu quả nhằm đưa ra được các quyết định hiệu quả, khám phá được các yếu tố ẩn
sâu trong dữ liệu và tối ưu hóa được quá trình xử lý dữ liệu
Những tập hợp dữ liệu lớn này thể bao gồm các dữ liệu cấu trúc (structured
data), dữ liệu không cấu trúc (unstructured data) dữ liệu bán cấu trúc (semistructured
data), mỗi tập hợp có chút khác biệt.
Hiểu theo cách đơn giản, thuật ngữ “Big Data” là một tập hợp dữ liệu rất lớn mà các
kỹ thuật điện toán thông thường không thể xử lý được. Thuật ngữ “Big Data” không chỉ đề
cập tới dữ liệu mà còn chỉ cơ cấu tổ chức dữ liệu, các công cụ và công nghệ liên quan.
Dữ liệu tạo thành các kho dữ liệu lớn thể đến từ các nguồn bao gồm các trang web,
phương tiện truyền thông xã hội, ứng dụng dành cho máy tính để bàn, ứng dụng trên thiết
232
bị di động, các thí nghiệm khoa học, thiết bị cảm biến ngày càng tăng và các thiết bị khác
trong mạng lưới thiết bị kết nối Internet (IoT- internet of things).
Big Data gồm 5 đặc trưng sau đây:
- Volume: Khối lượng dữ liệu cực lớn.
- Variety: Nhiều loại dữ liệu đa dạng.
- Velocity: Tốc độ mà dữ liệu cần phải được xử lý và phân tích nhanh.
- Veracity: Tính xác thực ảnh hưởng đến sự phân tích chính xác.
- Value: Có giá trị.
Big data tập hợp dữ liệu lớn phức tạp vượt khả năng của những ứng dụng
ng cụ truyền thống so với data bình thường. Điều thực sự mang lại giá trị từ các tổ chức
dữ liệu lớn là phân tích dữ liệu. Nếu không có phân tích, nó chỉ là một tập dữ liệu thô bình
thường. Ngoải ra, Big data còn ẩn chứa rất nhiều thông tin quý giá mà nếu trích xuất (data
mining) thành công sẽ giúp rất nhiều cho việc nắm bắt xu thế trong kinh doanh, nghiên cứu
khoa học, dự đoán trong tương lai.
2. QUẢN LÝ BIG DATA
Hiện nay, các lĩnh vực khác nhau từ ngành công nghệ phần mềm đến lập trình và
Logistics đều sử dụng ứng dụng của Big Data trong hoạt động của mình. Điển hình là các
ông lớn từ Software AG, IBM, Dell đã sẵn sàng chi hàng tỉ USD để đầu tư cho sự phát triển
công nghệ "dữ liệu lớn".
Để có thể lưu trữ dữ liệu thông tin khổng lồ như Big Data, chúng cần được sử dụng
các công nghệ đặc biệt. Từ năm 2011, Big Data đã thể sử dụng với một số dạng công
nghệ như Crowdsourcing, các thuật toán liên quan đến gen di truyền, công nghệ xử
ngôn ngữ tự nhiên (điển hình như Siri hay Google Voice), mô hình hóa…
Ngoài ra, một số công nghệ khác được sử dụng trong Big Data như kỹ thuật điện toán
đám mây, công nghệ Internet. Các công nghệ này giúp hoạt động nghiên cứu thông tin và
lưu trữ dữ liệu từ “Big Data” dễ dàng hơn. Ở cấp độ cao, sở hạ tầng của tổ chức bao gồm
hệ thống lưu trữ và các máy chủ được thiết kế cho Big Data, phần mềm quản và tích hợp
dữ liệu, phần mềm kinh doanh thông minh (business intelligence) và phân tích dữ liệu, các
ứng dụng Big Data. Phần lớn cơ sở hạ tầng này sẽ có mặt tại chỗ vì các công ty muốn tiếp
233
tục tận dụng các khoản đầu tư trung tâm dữ liệu của mình. Tuy nhiên, ngày càng có nhiều
tổ chức dựa vào các dịch vụ điện toán đám mây để xử lý nhiều yêu cầu dữ liệu lớn của họ.
Tác dụng của đám mây trong quản lý Big Data:
- Cloud cung cấp các công cụ để trích xuất dữ liệu. Từ đó, bằng việc phân tích dữ liệu
lớn, thì mục tiêu và các quyết định của kinh doanh được xác đnh.
- ng dng Big Data trên nn tng Cloud giúp các tổ chức quản hiệu quả nhiều
công cụ phần mềm và phần cứng.
- Cloud đã tăng tốc độ quản lý và truy cập cơ sở dữ liệu chứa khối lượng lớn hồ sơ.
Thu thập dữ liệu yêu cầu phải có nguồn. Rất nhiều trong số những ứng dụng sau như
các ứng dụng web, các kênh truyền thông hội, ứng dụng di động lưu trữ email đã
được cài sẵn. Nhưng khi IoT trở nên phổ biến hơn, các công ty thể sẽ cần triển khai cảm
biến trên tất cả các thiết bị, phương tiện và sản phẩm để thu thập dữ liệu, cũng như các ứng
dụng mới tạo ra dữ liệu người dùng. (Phân tích dữ liệu theo định hướng IoT có các kỹ thuật
và công cụ chuyên biệt của nó.)
Để lưu trữ tất cả dữ liệu đến, các tổ chức cần phải có đủ dung lượng lưu trữ tại chỗ.
Các tùy chọn lưu trữ bao gồm kho dữ liệu truyền thống, data lake (kho lưu trữ khối lượng
dữ liệu thô rất lớn định dạng gốc cho đến khi người dùng doanh nghiệp cần dữ liệu)
lưu trữ trên đám mây.
Các công cụ shạ tầng bảo mật bao gồm việc hóa dữ liệu, xác thực người dùng
các điều khiển truy cập khác, hệ thống giám sát, tường lửa, quản di động của doanh
nghiệp và các sản phẩm khác để bảo vệ hệ thống và dữ liệu.
Hiện nay, công nghệ Big Data cũng như công nghệ Blockchain được đầu với nguồn
tài chính khổng lồ để phát huy và có thêm nhiều ứng dụng công nghệ mới..
3. CÁC BƯỚC ỨNG DỤNG BIG DATA CHO DOANH NGHIỆP
Nhiều doanh nghiệp chưa chiến lược Big Data ràng thường có xu hướng thu
thập được càng nhiều thông tin càng tốt, càng chi tiết, càng chính xác càng tốt. Lượng dữ
liệu này được hi vọng sẽ có thể giúp đội ngũ chuyên gia phân tích dữ liệu trong tương lai
đưa ra những thông tin có giá trị trong điều hành doanh nghiệp. Tuy nhiên, điều này gây áp
lực lên hệ thống hạ tầng công nghệ thông tin của doanh nghiệp, và cũng không giúp được
nhiều cho các chuyên gia phân tích. Vậy nên chiến lược xây dựng Big Data trong doanh
234
nghiệp nên bắt đầu từ việc đặt câu hỏi, những thông tin nào cần thiết, và có khả năng đem
lại giá trị trước khi bàn tới việc thu thập chúng từ đâu và như thế nào.
Tầm quan trọng của Big Data không nằm ở việc khối lượng data thu thập được mỗi
ngày, chiến lược sử dụng chúng để đem lại những thông tin giá trị. Giá trị đây
thể hiện ở việc, nó giúp giảm chi phí, rút ngắn thời gian, hỗ trhoạt động kinh doanh và hỗ
trợ nhà quản trị trong công tác ra quyết định. ới đây là gợi ý 5 bước cơ bản để triển khai
chiến lược ứng dụng Big Data cho doanh nghiệp.
Bước 1: Định hình chiến lược dữ liệu lớn: cấp độ cao, chiến lược dữ liệu lớn
một kế hoạch được thiết kế để giúp doanh nghiệp giám sát và cải thiện cách thức thu thập,
lưu trữ, quản lý, chia sẻ sử dụng dữ liệu trên toàn bộ hệ thống. Với nền kinh tế số, nơi
các quyết định kinh doanh phụ thuộc nhiều vào dữ liệu, chiến lược dữ liệu lớn đúng đắn
có thể tạo tiền đề cho sự thành công cho bất kì doanh nghiệp nào. Nếu doanh nghiệp nhận
thức được đúng mức vtầm quan trọng này, cách thức tiếp cận mọi ứng dụng công nghệ
của họ sẽ cần phải thay đổi. Thay vì quan tâm đầu tiên đến việc phần mềm này có thể giúp
ích trực tiếp gì cho doanh nghiệp, người ta nên đặt câu hỏi, ứng dụng này mang lại những
dữ liệu gì có giá trị cho bức tranh thông tin chung.
Bước 2: Xác định các nguồn dữ liệu cần thiết: Việc ra đời của các mạng xã hội đã
làm thay đổi toàn bộ hướng tiếp cận dữ liệu của các doanh nghiệp. Hệ thống dữ liệu vận
hành trong nội tại doanh nghiệp vẫn chiếm vai trò chủ chốt trong chiến lược Big Data. Tuy
nhiên, doanh nghiệp hiện nay ngày càng quan tâm tới những thông tin trên nền tảng mạng
xã hội hoặc tự thu thập trên các kênh sở hữu của doanh nghiệp hoặc thông qua các dịch vụ
lắng nghe mạng xã hội. Ngoài ra, các dữ liệu được thu thập từ các nguồn dữ liệu công khai
235
hoặc các đơn vị nghiên cứu dữ liệu khác cũng sở quan trọng đối với các quyết định
kinh doanh.
Bước 3: Truy cập, quản lý và lưu trữ dữ liệu: Hiện nay, nền tảng công nghệ để đáp
ứng nhu cầu nhanh chóng để truy cập, quản lý và lưu trữ dữ liệu lớn của các doanh nghiệp.
tùy vào quy và định ớng chiến lược dữ liệu, mà doanh nghiệp có thể lựa chọn đầu
vào các hệ thống xử với mức độ khác nhau. 3 yếu tố cần cân nhắc khi xây dựng hệ
thống cơ sở hạ tầng phục vụ quản trị Big Data là: tính linh hoạt, tốc độ và sức mạnh xử lý.
Bước 4: Phân tích dữ liệu: Với các công nghệ hiệu suất cao như điện toán biên, điện
toán mạng lưới kết hợp với các thuật toán kỹ thuật cao như AI, hay Machine Learning,
doanh nghiệp có thể lựa chọn sử dụng tối đa dữ liệu mà mình thu thập được để phân tích.
Một cách tiếp cận khác là chọn lọc thông tin trước khi đưa ra phân tích. Dù bằng cách nào,
phân tích dữ liệu lớn sẽ giúp các công ty đạt được giá trị và hiểu biết sâu sắc từ dữ liệu.
Bước 5: Đưa ra quyết định dựa trên dữ liệu: Khi hệ thống quản trị hoạt động hiệu
quả, đầu ra của nó là những phân tích đáng tin cậy và các quyết định đáng tin cậy. Để duy
trì tính cạnh tranh, các doanh nghiệp cần nắm bắt toàn bộ giá trị của dữ liệu lớn và đưa ra
quyết định dựa trên bằng chứng xác thực được đưa ra bởi dữ liệu lớn thay vì bản năng hoặc
kinh nghiệm.
4. TÌNH HÌNH THƯƠNG MẠI ĐIỆN TỬ VIỆT NAM HIỆN NAY1
Theo Báo cáo Chỉ số Thương mại điện tử Việt Nam 2020, tốc độ tăng trưởng trung
bình của thương mại điện tử giai đoạn 2016 2019 khoảng 30%. Do đó, quy thương
mại điện tử bán lẻ hàng hoá dịch vụ tiêu dùng tăng từ 4 tUSD năm 2015 lên khoảng
11,5 tỷ USD năm 2019. Báo cáo dự đoán tốc độ tăng trưởng của năm 2020 tiếp tục duy trì
ở mức trên 30% và đạt quy mô 15 tỷ USD.
Đại dịch Covid-19 đã tác động to lớn toàn diện tới kinh tế - hội của đất nước
trong đó có thương mại điện tử. Vượt qua khó khăn nghiêm trọng bởi đại dịch này thương
mại điện tử vẫn đứng vững, thậm chí sự bứt phá trong một số lĩnh vực. Tháng 5 năm
2020 ngay sau giai đoạn một của đại dịch lắng xuống, Hiệp hội thương mại điện tử Việt
Nam (VECOM) đã tiến hành khảo sát nhanh tác động của đại dịch báo cáo: dịch
1 Theo Báo cáo chỉ số thương mại điện tử Việt Nam năm 2020 của Hiệp hội thương mại điện tử Việt Nam