296
NHU CẦU NGUỒN NHÂN LỰC PHÁT TRIỂN KHOA HỌC DỮ LIỆU
TRÍ TUỆ NHÂN TẠO TRONG THỜI ĐẠI KINH TẾ SỐ
Trương Xuân Hương, Lâm Hoàng Trúc Mai, Trần Thanh San
Khoa Công nghệ Thông tin. Trường Đại học Tài chính - Marketing
Email: tx.huong@ufm.edu.vn, lht.mai@ufm.edu.vn, san.tranthanh@ufm.edu.vn
Tóm tắt: Ngày nay cùng với xu thế hội nhập kinh tế toàn cầu, phát triển hoạt động kinh doanh
theo hình kinh tế số chiến ợc chủ đạo được các tổ chức, doanh nghiệp tập trung đầu .
Nguồn nhân lực trong lĩnh vực khoa học dữ liệu (Data Science) trí tuệ nhân tạo (Artificial
Intelligence) đang rất được quan tâm trở thành tiêu chí ưu tiên trong việc tuyển dụng đội ngũ
phát triển hệ thống thông tin theo định hướng chuyển đổi số nền kinh tế thông minh. Bài viết
tập trung các nội dung chính liên quan đến phân ch xu thế phát triển và nhu cầu nguồn nhân lực
trong lĩnh vực khoa học dữ liệu – trí tuệ nhân đáp ứng nhu cầu xã hội thích ứng với thời đại 4.0.
Từ khóa: khoa học dliệu (Data Science), kinh tế số, trí tuệ nhân tạo (Artificial Intelligence).
1. GIỚI THIỆU CHUNG VỀ LĨNH VỰC KHOA HỌC DỮ LIỆU TRÍ TUỆ
NHÂN TẠO
Khoa học dữ liệu (Data Science) là lĩnh vực khoa học ứng dụng quản trị và phân tích
các nguồn dữ liệu thu thập được liên quan đến phạm vi nghiên cứu, từ đó khai thác các giá
trị thông tin tiềm năng để tìm ra các tri thức từ hành vi của đối tượng muốn tiếp cận, các tri
thức phục vụ ra quyết định dẫn dắt hành động cho người quản trị. Hoạt động nghiên cứu
lĩnh vực Data Science bản chất việc tiến nh: Tạo ra quản trị dữ liệu, phân tích dữ
liệu, chuyển kết quả phân tích thành giá trị của hành động. vậy khai thác dữ liệu từ
Data Science thực chất bao gồm 2 bước: thứ nhất là số hóa dữ liệu thứ hai là sử dụng giá
trị tri thức khai thác từ dữ liệu hỗ trợ ra quyết định. Việc phân tích và dùng dữ liệu lại dựa
vào ba nguồn tri thức: toán học (thống toán học), công nghệ thông tin (máy học) tri
thức của lĩnh vực ứng dụng cụ thể.
Trí tuệ nhân tạo (Artificial intelligence AI) một ngành thuộc lĩnh vực khoa học
máy tính. trí tuệ do con người lập trình tạo nên với mục tiêu giúp máy tính thể tự
động hóa các hành vi thông minh như con người. Trí tuệ nhân tạo khác với việc lập trình
logic trong các ngôn ngữ lập trình việc ứng dụng các hệ thống học máy (machine
learning) để mô phỏng trí tuệ của con người trong các xử lý mà con người làm tốt hơn máy
tính. Cụ thể, trí tuệ nhân tạo giúp máy tính được những ttuệ của con người như: biết
297
suy nghĩ lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngôn ngữ, tiếng nói, biết
học và tự thích nghi,
Ngày nay, khoa học dữ liệu (Data Science) trở thành một trong những ngành nhu
cầu nhân lực cao nhất thế kỷ XXI. Khái niệm khoa học dữ liệu gắn liền với trí tuệ nhân
tạo trong nội dung nghiên cứu về các chiến lược phát triển kinh doanh thông minh. Điều
này cho thấy, ngoài việc thu thập phân tích dữ liệu, việc đưa ra các quyết định thông
minh vận dụng các thuật toán máy học từ việc khai thác nguồn tri thức tiềm năng là xu thế
tất yếu để phát triển của các tổ chức, doanh nghiệp trong nền kinh tế số hóa toàn cầu.
Hình 1: Giới thiệu chung về lĩnh vực Khoa học dữ liệu và Trí tuệ nhân tạo.
2. XU THẾ ĐÀO TẠO KHOA HỌC DỮ LIỆU VÀ TRÍ TUỆ NHÂN TẠO TRONG
THỜI ĐẠI KINH TẾ SỐ
Dưới những bước tiến mạnh mẽ của thành tựu của khoa học ng nghệ, đặc biệt
công nghthông tin viễn thông (ICT), những công nghệ mới như trí tuệ nhân tạo, dữ
liệu lớn (big data) bắt đầu có nhiều ứng dụng trong hoạt động sản xuất kinh doanh và phân
tích kinh tế. Điều này góp phần thúc đẩy quá trình nghiên cứu và đào tạo về công nghệ ứng
dụng trong kinh tế. Ngày càng có nhiều doanh nghiệp quan tâm hơn tới ngành khoa học dữ
liệu và họ sẵn sàng đầu cho việc nghiên cứu, đào tạo phát triển đội ngũ nhân lực phù
hợp với nhu cầu tuyển dụng.
298
Hình 2: Khoa học dữ liệu
Trong một nghiên cứu của O'Reilly, một trong những nhà phát hành chuyên về mảng
công nghệ khoa học máy tính, 4 dạng nhà khoa học dữ liệu tiêu biểu được định ớng
phát triển, cụ thể:
Doanh nhân (Data Businesspeople): Quan m vào sản phẩm và phát triển lợi nhuận,
họ là các nhà lãnh đạo, nhà quản lý và doanh nhân có sự am hiểu về mặt kỹ thuật. Đa phần
đều có nền tảng giáo dục xuất phát bằng kỹ sư kết hợp với một MBA.
Nhà sáng tạo (Data Creatives): nhiều thế mạnh kinh nghiệm với nhiều dạng
dữ liệu công cụ. Điểm nhấn thường thấy sự linh hoạt trong việc vận dụng các công
nghệ trực quan (Visualization Techonology) mã nguồn mở, sáng tạo trong việc khai thác
tiềm năng từ nguồn dữ liệu có sẵn và đưa ra có giải pháp sáng kiến hiệu quả.
Nhà phát triển (Data Developers): Nhà phát triển dữ liệu thường tập trung vào việc
viết phần mềm để làm phân tích, thống kê, nhiệm vụ học máy, thường xuyên trong môi
trường sản xuất. Họ thường có trình độ khoa học máy tính, có kinh nghiệm xử lý và thường
xuyên làm việc với “dữ liệu lớn" (Big Data).
Nhà nghiên cứu (Data Researchers): Đó những người áp dụng những kỹ năng
được đào tạo trong khoa học cùng với các công cụ và kỹ thuật, số liệu. Một số có bằng tiến
sĩ, và các ứng dụng sáng tạo các công cụ toán học mang lại những hiểu biết và sản phẩm có
giá trị.
299
Tại Việt Nam, với định hướng đa ngành, đa lĩnh vực cung cấp các chương trình
đào tạo đáp ứng yêu cầu mới của quá trình chuyển đổi số, xu thế phát triển nguồn nhân lực
chất ợng cao trong nh vực Data Science&Artificial Intelligence rất được quan tâm nhằm
đáp ứng phù hợp với các yêu cầu từ nền kinh tế số. Một số trường như Đại học Công Nghệ,
Đại học Khoa học tự nhiên, Đại học phạm (Hà Nội) cũng đã từng bước đưa vào chương
trình giảng dạy, hướng dẫn và đào tạo sinh viên, đồng thời ng nghiên cứu và công bố các
công trình liên quan tới lĩnh vực này. Nhiều nhóm nghiên cứu tại các đơn vị đào tạo được
thành lập nTS. Hoàng Sơn (Đại học Khoa học tự nhiên Đại học quốc gia Nội)
đang làm về phân cụm, phân nhóm, hay Viện toán ứng dụng tin học, Viện thông tin
truyền thông (Đại học Bách khoa Nội) cũng đang nghiên cứu về dữ liệu lớn (big
data). Về các đơn vị bên ngoài, đặc biệt là các ngành như viễn thông, y tế, giáo dục, cũng
các nhóm nghiên cứu riêng như trung tâm truyền hình VTV cab, tập đoàn giáo dục
Topica, tập đoàn Equest Academy hay trung tâm Công nghệ thông tin của bộ Y tế.
(Phượng Nguyễn, 2017). Hai tập đoàn lớn luôn đồng hành trong việc đào tạo nhân lực phải
kể đến FPT và Tập đoàn Công nghiệp - Viễn thông quân đội (Viettel).
3. VỊ TRÍ VIỆC LÀM TRONG LĨNH VỰC KHOA HỌC DỮ LIỆU TRÍ TUỆ
NHÂN TẠO
Trong xu thế phát triển và hội nhập, ngày
nay chúng ta không thbỏ qua tầm quan trọng
của dữ liệu cũng như khả năng phân tích, sắp
xếp bối cảnh hóa dliệu. Dựa trên kho dữ
liệu việc làm khổng lồ phản hồi của nhân
viên, Glassdoor xếp hạng Nhà khoa học dữ liệu
đứng số 1 trong danh sách 25 việc m tốt nhất
Mỹ. Khi các công nghệ như Machine Learning
trở nên phổ biến hơn bao giờ hết các nhà khoa
học dữ liệu tiếp tục làn sóng đổi mới và các tiến
bộ công nghệ đáng kinh ngạc.
Mặc khả năng lập trình giỏi rất quan trọng, nhưng khoa học dữ liệu không
phải là công nghệ phần mềm. Khả năng của nhà khoa học dữ liệu nằm ở điểm giao của lập
Hình 3: Data Science
300
trình, thống và tư duy phản biện. Như Josh Wills đã nói, “Nhà khoa học dữ liệu là người
giỏi thống kê hơn bất kỳ lập trình viên nào và giỏi lập trình hơn bất kỳ nhà thống kê nào”.
Nhà phân tích dữ liệu (Data Analyst): nhà phân tích dữ liệu đóng vai trò giải quyết
các công việc như: khai thác dữ liệu, làm sạch dữ liệu, thăm dò dữ liệu và trực quan hóa dữ
liệu. Cụ thể, họ chính người trích xuất phân tích các tập dữ liệu, tìm hiểu sâu câu trả
lời cho các câu hỏi nghiên cứu và biến dữ liệu thành báo cáo, mục tiêu và bảng điều khiển.
Nhà phân tích dữ liệu chỉ cần có các kiến thức, bằng cấp liên quan đến các lĩnh vực về toán
học, thống kê và khoa học máy tính, có kỹ năng lập trình cũng như hình dung được dữ liệu
và nắm vững các công cụ trực quan hóa dữ liệu.
Nhà khoa học dữ liệu (Data Scientist): thường đóng vai trò nhà vấn trong công
ty, tham gia vào các quá trình ra quyết định khác nhau và tạo ra các chiến lược. Nhờ vào sự
hiểu biết từ dữ liệu, họ hỗ trợ các công ty đưa ra quyết định kinh doanh thông minh hơn.
Nhà khoa học dữ liệu thường nhiều yêu cầu về lập trình hơn nhà phân tích dữ liệu, họ
không chỉ lấy dữ liệu mà còn phát triển các mô hình và thuật toán để giải quyết vấn đề, thử
nghiệm sản phẩm và đưa công ty đi theo hướng mới thông qua xử dữ liệu tiên tiến. Theo
đó các nkhoa học dữ liệu sẽ nghiên cứu các dữ liệu đã được tổ chức phân tích kỹ
lưỡng để trích xuất thông tin bằng cách sử dụng nhiều phương pháp thống khác nhau.
Họ sẽ sử dụng các phương pháp thống để tả, trực quan hóa đưa ra các thông tin
giả thuyết từ dữ liệu đó. Sau đó các nkhoa học dữ liệu sẽ sử dụng thuật toán Machine
learning để dự đoán c sự kiện sẽ xảy ra đưa ra quyết định dựa trên các dữ liệu đó.
Những nhà khoa học dữ liệu sẽ triển khai các mảng lớn công cụ và thực tiễn để nhận ra các
mẫu dư thừa trong dữ liệu. Các công cụ này bao gồm SQL, Hadoop, Weka, R và Python.
Nhà phân tích kinh doanh (Business Analyst): Các nhà phân tích kinh doanh có thể
xác định các cải tiến quy trình và xu hướng hành vi làm thay đổi kết quả kinh doanh và lợi
nhuận. Họ giúp doanh nghiệp đưa ra các nhu cầu do cần thay đổi, đồng thời thiết kế
và mô tả các giải pháp mang lại giá trị. Cụ thể, một nhà phân tích kinh doanh sẽ chịu trách
nhiệm cho c vai trò như: Khám phá những điều bản doanh nghiệp cần giải quyết
các thông tin liên quan đến yêu cầu sản phẩm dự án thường thông qua các cuộc trò
truyện với các n liên quan; tổ chức, chỉ định hình hóa các yêu cầu để đảm bảo
chúng được hoàn thiện và rõ ràng; tài liệu hóa các yêu cầu theo định dạng để có thể chia sẻ
được với các bên liên quan; đảm bảo các u cầu dẫn đến đúng nhu cầu doanh nghiệp trong