BỘ GIÁO DỤC VÀ ĐÀO TẠO

ĐẠI HỌC KINH TẾ QUỐC DÂN ---------------------------------

LÊ THỊ THU

PHÁT TRIỂN HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM

LUẬN ÁN TIẾN SĨ NGÀNH HỆ THỐNG THÔNG TIN QUẢN LÝ

HÀ NỘI – 2025

BỘ GIÁO DỤC VÀ ĐÀO TẠO

ĐẠI HỌC KINH TẾ QUỐC DÂN ---------------------------------

LÊ THỊ THU

PHÁT TRIỂN HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM Chuyên ngành: Hệ thống thông tin quản lý Mã số: 9340405

LUẬN ÁN TIẾN SĨ KINH TẾ

Người hướng dẫn khoa học: TS. Phạm Xuân Lâm

HÀ NỘI – 2025

i

LỜI CAM ĐOAN

Tôi đã đọc và hiểu về hành vi vi phạm sự trung thực trong học thuật. Tôi cam kết bằng danh dự cá nhân rằng nghiên cứu này do tôi thực hiện và không vi phạm yêu cầu về sự trung thực trong học thuật.

Hà Nội, ngày.....tháng.... năm 2025

Tác giả luận án

Lê Thị Thu

ii

LỜI CẢM ƠN

Tác giả xin gửi lời cảm ơn chân thành đến TS. Phạm Xuân Lâm đã luôn đồng hành, hỗ trợ và nhiệt tình hướng dẫn, chỉ bảo tác giả trong suốt quá trình nghiên cứu và hoàn

thành luận án này.

Tác giả xin trân trọng cảm ơn Ban giám hiệu, Viện Đào tạo Sau đại học, Khoa Hệ

thống thông tin quản lý, Khoa Công nghệ thông tin, cùng các thầy cô – Đại học Kinh tế

quốc dân đã hỗ trợ để tác giả có thể hoàn thành công việc học tập và nghiên cứu.

Tác giả xin chân thành cảm ơn nhóm cộng tác và Công ty TNHH Giải pháp công

nghệ Vietsearch Global đã đóng góp cho các hoạt động nghiên cứu và thực nghiệm trong

quá trình thực hiện luận án của tác giả.

Tác giả xin gửi lời cảm ơn đến các chuyên gia đã nhiệt tình tham gia trả lời phỏng vấn, chia sẻ kiến thức và đóng góp nhiều ý kiến quý báu cho luận án. Bên cạnh đó, tác giả

cũng xin gửi lời tri ân đến các Doanh nghiệp đã tham gia phỏng vấn và trả lời phiếu khảo

sát liên quan đến nội dung nghiên cứu.

Tác giả xin trân trọng cảm ơn lãnh đạo, cán bộ giảng viên Trường Đại học Thương

mại, Khoa Toán kinh tế và Bộ môn Phương pháp nghiên cứu khoa học đã quan tâm, tạo

Tác giả đặc biệt gửi lời tri ân đến gia đình và bạn bè thân thiết đã thường xuyên điều kiện giúp đỡ trong suốt thời gian qua.

động viên, khích lệ tác giả hoàn thành luận án.

Xin trân trọng cảm ơn!

iii

MỤC LỤC

LỜI CAM ĐOAN ...........................................................................................................i LỜI CẢM ƠN ............................................................................................................... ii MỤC LỤC .................................................................................................................... iii DANH MỤC TỪ VIẾT TẮT .......................................................................................vi DANH MỤC BẢNG BIỂU ..........................................................................................ix DANH MỤC HÌNH VẼ ................................................................................................xi MỞ ĐẦU ......................................................................................................................... 1 1. Lý do chọn đề tài .................................................................................................... 1 2. Mục tiêu nghiên cứu và câu hỏi nghiên cứu ........................................................ 4 2.1. Mục tiêu nghiên cứu.......................................................................................... 4 2.2. Câu hỏi nghiên cứu ........................................................................................... 5

3. Đối tượng và phạm vi nghiên cứu ........................................................................ 5 3.1. Đối tượng nghiên cứu ....................................................................................... 5 3.2. Phạm vi nghiên cứu ........................................................................................... 5

4. Phương pháp nghiên cứu ...................................................................................... 6 4.1. Phương pháp tiếp cận nghiên cứu ..................................................................... 8 4.2. Phát triển thang đo cho phiếu điều tra............................................................... 8 4.3. Phương pháp chọn mẫu ................................................................................... 10 4.4. Phương pháp thu thập dữ liệu ......................................................................... 11 4.5. Phương pháp xử lý dữ liệu .............................................................................. 12

5. Khung nghiên cứu lý thuyết của luận án ........................................................... 12 6. Những đóng góp mới của đề tài .......................................................................... 13 7. Kết cấu luận án .................................................................................................... 15 CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ LUẬN VỀ HỆ THỐNG TÌM KIẾM CHUYÊN GIA ........................................................................ 17 1.1. Tổng quan nghiên cứu ...................................................................................... 17 1.1.1. Phương pháp thực hiện ................................................................................ 19 1.1.2. Kết quả đánh giá các nghiên cứu trên thế giới ............................................. 21 1.1.3. Tình hình nghiên cứu tại Việt Nam ............................................................. 34 1.1.4. Khoảng trống nghiên cứu ............................................................................. 36

1.2. Cơ sở lý luận ...................................................................................................... 37 1.2.1. Chuyên gia ................................................................................................... 37 1.2.2. Hệ tìm kiếm chuyên gia ............................................................................... 41

iv

1.2.3. Cơ sở tri thức về chuyên gia ........................................................................ 54 1.2.4. Lý thuyết nền tảng ........................................................................................ 56

1.3. Tổng kết chương 1 ............................................................................................ 57 CHƯƠNG 2. PHÂN TÍCH YÊU CẦU HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM ..................................... 59 2.1. Thực trạng nhu cầu tìm kiếm chuyên gia trong DNNVV Việt Nam ........... 59 2.1.1. Mô tả mẫu .................................................................................................... 59 2.1.2. Phân tích thực trạng ..................................................................................... 60

2.2. Thực trạng hoạt động quản lý thông tin chuyên gia tại Việt Nam .............. 64 2.3. Đánh giá thực trạng hệ thống tìm kiếm chuyên gia hiện nay ....................... 65 2.3.1. Các hệ thống tìm kiếm chuyên gia hiện nay ................................................ 65 2.3.2. Kết quả đánh giá các hệ thống ..................................................................... 68

2.4. Đề xuất các chức năng của hệ thống tìm kiếm chuyên gia cho các DNNVV tại Việt Nam .............................................................................................................. 73 2.4.1. Đề xuất các chức năng của hệ thống ............................................................ 73 2.4.2. Yêu cầu phi chức năng ................................................................................. 77

2.5. Tổng kết chương 2 ............................................................................................ 78 CHƯƠNG 3. ĐỀ XUẤT KIẾN TRÚC THAM KHẢO HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM .......... 79 3.1. Quy trình thực hiện đề xuất kiến trúc tham khảo và thử nghiệm, đánh giá hệ thống ..................................................................................................................... 79 3.2. Kiến trúc tham khảo của hệ thống .................................................................. 80 3.2.1. Kiến trúc nền tảng ........................................................................................ 80 3.2.2. Đề xuất kiến trúc tham khảo ........................................................................ 81

3.3. Mô tả các thành phần ....................................................................................... 84 3.3.1. Tầng người dùng và kênh giao tiếp .............................................................. 84 3.3.2. Tầng quản lý dữ liệu .................................................................................... 85 3.3.3. Tầng nền tảng chia sẻ và tích hợp dữ liệu .................................................... 97 3.3.4. Tầng ứng dụng và dịch vụ ............................................................................ 99 3.3.5. Hạ tầng kỹ thuật, công nghệ và an toàn thông tin mạng ............................ 106

3.4. So sánh kiến trúc đề xuất với một số hệ thống tìm kiếm chuyên gia hiện nay .................................................................................................................................. 108 3.5. Đánh giá kiến trúc đề xuất ............................................................................. 111 3.6. Tổng kết chương 3 .......................................................................................... 113 CHƯƠNG 4. KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM ........ 114

v

4.1. Thử nghiệm độ phù hợp của thuật toán trong hệ thống ............................. 114 4.1.1. Thử nghiệm và đánh giá mô đun “Hợp nhất dữ liệu” ................................ 114 4.1.2. Thử nghiệm và đánh giá mô đun “Xếp hạng chuyên gia” ......................... 127

4.2. Kết quả xây dựng hệ thống thử nghiệm ....................................................... 135 4.2.1. Công nghệ, thư viện sử dụng ..................................................................... 136 4.2.2. Giao diện hệ thống ..................................................................................... 137

4.3. Đánh giá hệ thống thử nghiệm ....................................................................... 139 4.3.1. Phương pháp sử dụng đánh giá hệ thống ................................................... 139 4.3.2. Mô hình và giả thuyết ................................................................................ 141 4.3.3. Kết quả khảo sát ......................................................................................... 142

4.4. Một số khuyến nghị triển khai hệ thống ....................................................... 149 4.4.1. Triển khai hệ thống ở quy mô nhỏ và từng bước mở rộng ........................ 149 4.4.2. Phát triển hệ thống theo hướng bền vững .................................................. 150 4.4.3. Đề xuất các kế hoạch hỗ trợ và đào tạo cho DNNVV ............................... 151

4.5. Tổng kết chương 4 .......................................................................................... 152 KẾT LUẬN ................................................................................................................ 153 1. Kết quả đạt được của luận án ........................................................................... 153 2. Những đóng góp mới của luận án ..................................................................... 153 3. Những hạn chế và hướng phát triển ................................................................ 154 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ ........................ 156 TÀI LIỆU THAM KHẢO ......................................................................................... 157 PHỤ LỤC ................................................................................................................... 174

vi

DANH MỤC TỪ VIẾT TẮT

Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt

AHXH Social Influence Ảnh hưởng xã hội

AI Artificial Intelligence Trí tuệ nhân tạo

ALMA Architecture Level Phương pháp phân tích bậc của

Modifiability Analysis kiến trúc

API Application Programming Giao diện lập trình ứng dụng

Interface

ATAM Architecture Tradeoff Phương pháp phân tích đánh đổi

Analysis Method kiến trúc

ATTT Information Security An toàn thông tin

CBAM Cost Benefit Analysis Method Phương pháp phân tích lợi ích –

chi phí

CNTT Information Technology Công nghệ thông tin

CQA Question Cộng đồng hỏi đáp

Community Answering

CSDL Data Base Cơ sở dữ liệu

DKTL Facilitating conditions Điều kiện thuận lợi

DSRM Design Science Research Phương pháp nghiên cứu khoa

Methodology học thiết kế

Deep Learning Học sâu DL

Enterprise Doanh nghiệp DN

DNNVV Small and Medium Enterprise Doanh nghiệp nhỏ và vừa

Expert Finding System Hệ tìm kiếm chuyên gia EFS

Enterprise Service Bus ESB

Trục tích hợp dịch vụ doanh nghiệp

ETL Extract, Transform, Load Trích xuất, Chuyển đổi, Tải

vii

Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt

FAAM Architecture

Family- Assessment Method Phương pháp phân tích kiến trúc – gia đình

Frequently Asked Questions Câu hỏi thường gặp FAQ

System Hệ thống HT

HTTT Information System Hệ thống thông tin

Knowledge Base Cơ sở tri thức KB

Duplicate Phát hiện trùng lặp tri thức KDD

Knowledge Detection

KH&CN Science and Technology Khoa học và công nghệ

KH&KT Science and Engineering Khoa học và Kỹ thuật

KM Knowledge Management Quản lý tri thức

KVHQ Performance expectancy Kỳ vọng hiệu quả

KVNL Effort expectancy Kỳ vọng nỗ lực

L2R Learning to Rank Học để xếp hạng

MAE Mean Absolute Error Trung bình của các sai số tuyệt

đối

MSE Mean Squared Error Trung bình của bình phương các

sai số

NCS PhD student Nghiên cứu sinh

NDD Naive Duplicate Detection Phát hiện trùng lặp ngây thơ

NLP Natural Language Processing Xử lý ngôn ngữ tự nhiên

OWL Web Ontology Language Ngôn ngữ Web Ontology

PRISMA

Preferred Reporting Items for Systematic reviews and Meta- Các mục báo cáo cho tổng quan hệ thống và phân tích tổng hợp

Analyses

RDF Resource Description Nền tảng mô tả tài nguyên

Framework

viii

Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt

SAAM

Scenario-Based Architecture Analysis Method Phương pháp phân tích kiến trúc phần mềm

SOA Service Oriented Architecture Kiến trúc hướng dịch vụ

SVM Support Vector Machine Máy véc tơ hỗ trợ

TAM Technology Acceptance Mô hình chấp nhận công nghệ

Model

TMĐT E-commerce Thương mại điện tử

TOGAF Khung kiến trúc của Open Group

The Open Group Architecture Framework

TREC Text Retrieval Conference Hội nghị truy xuất văn bản

UTAUT Unified Theory of Acceptance Mô hình chấp nhận và sử dụng

and Use of Technology công nghệ hợp nhất

YDHV Behavioral Intention Ý định hành vi

ix

DANH MỤC BẢNG BIỂU Bảng 1. Thang đo phiếu khảo sát ý định chấp nhận sử dụng hệ thống ........................... 9

Bảng 1.1. Các nền tảng/lĩnh vực tìm kiếm chuyên gia .................................................. 23

Bảng 1.2. Bộ dữ liệu dùng trong thử nghiệm hệ tìm kiếm chuyên gia ......................... 25

Bảng 1.3. Các phương pháp đánh giá ............................................................................ 27

Bảng 1.4. Mô tả các từ khóa chính trong mỗi cụm ....................................................... 31

Bảng 1.5. Tổng hợp một số mô hình xác định chuyên gia ............................................ 47

Bảng 2.1. Mô tả mẫu tham gia phỏng vấn ..................................................................... 59

Bảng 2.2. Phương pháp và công cụ mà các DN thường sử dụng để tìm chuyên gia .... 62

Bảng 2.3. Một số tính năng cần có trong hệ thống tìm kiếm chuyên gia dành cho DN63

Bảng 2.4. Năm hệ thống tìm kiếm chuyên gia .............................................................. 67

Bảng 2.5. Kết quả đánh giá chức năng của năm hệ thống tìm kiếm chuyên gia. .......... 68

Bảng 2.6 Tổng hợp ưu nhược điểm của các hệ thống ................................................... 69

Bảng 2.7. Số lượng kết quả trả về khi tìm kiếm sáu lĩnh vực (Kết quả tìm kiếm vào ngày

26/3/2022) ........................................................................................................... 71

Bảng 2.8. Danh sách các chức năng đề xuất của hệ tìm kiếm chuyên gia cho DNNVV

............................................................................................................................. 74

Bảng 3.1. Người dùng chính của hệ thống tìm kiếm chuyên gia .................................. 84

Bảng 3.2. Các kênh giao tiếp của hệ thống ................................................................... 85

Bảng 3.3. Các thành phần trong mô hình biểu diễn tri thức chuyên gia sử dụng ontology

............................................................................................................................. 96

Bảng 3.4. Tiêu chí so sánh kiến trúc đề xuất với các hệ thống khác ........................... 108

Bảng 3.5. So sánh kiến trúc đề xuất với một số hệ thống tìm kiếm chuyên gia ......... 109

Bảng 3.6. Kết quả đánh giá khả năng tương tác và mở rộng của kiến trúc đề xuất .... 112

Bảng 4.1. Số lượng hồ sơ trong bộ dữ liệu .................................................................. 120

Bảng 4.2. Ví dụ về các trường hợp trong kết quả phát hiện trùng lặp ........................ 124

Bảng 4.3. Các trường hợp dự đoán cặp hồ sơ trùng lặp .............................................. 125

Bảng 4.4. Các chỉ số đánh giá thuật toán .................................................................... 125

Bảng 4.5. Thống kê kết quả tìm kiếm tuyển dụng chuyên gia CNTT ........................ 129

Bảng 4.6. Các trường thông tin về chuyên môn của Chuyên gia ................................ 130

Bảng 4.7. Đánh giá mô hình xếp hạng ........................................................................ 135

Bảng 4.8. So sánh giữa 2 mô hình TAM và UTAUT ................................................. 140

x

Bảng 4.9. Thống kê chức năng sử dụng trong hệ thống .............................................. 144

Bảng 4.10. Đánh giá về khả năng cung cấp thông tin của hệ thống............................ 144

Bảng 4.11. Độ tin cậy thang đo ................................................................................... 145

Bảng 4.12. Kết quả phân tích KMO và Bartlett's ........................................................ 146

Bảng 4.13. Kết quả ma trận xoay nhân tố ................................................................... 146

Bảng 4.14. Tổng kết mô hình ...................................................................................... 147

Bảng 4.15. Kết quả phân tích hồi quy các nhân tố ảnh hưởng đến chấp nhận sử dụng

........................................................................................................................... 147

Bảng 4.16. Kết quả kiểm định giả thuyết .................................................................... 148

xi

DANH MỤC HÌNH VẼ

Hình 1. Quy trình thực hiện nghiên cứu của luận án ....................................................... 7

Hình 2. Khung nghiên cứu lý thuyết của đề tài ............................................................. 13

Hình 1.1. Phương pháp thực hiện tổng quan nghiên cứu dựa trên phương pháp PRISMA

có chỉnh sửa ......................................................................................................... 19

Hình 1.2. Số lượng các bài nghiên cứu về lĩnh vực tìm kiếm chuyên gia từ năm 2000

đến 2023 .............................................................................................................. 20

Hình 1.3. Bản đồ các từ khóa xuất hiện đồng thời theo năm ........................................ 30

Hình 1.4. Bản đồ dựa trên dữ liệu văn bản được trích xuất từ tiêu đề và tóm tắt ......... 33

Hình 1.5. Các kỹ thuật sử dụng trong hệ tìm kiếm chuyên gia ..................................... 49

Hình 2.1. Ví dụ CSDL chuyên gia của thành phố Đà Nẵng.......................................... 66

Hình 3.1. Kiến trúc tham khảo VietSME-EFSA của hệ thống tìm kiếm chuyên gia .... 83

Hình 3.2. Quy trình thu thập, lưu trữ và xử lý dữ liệu chuyên gia ................................ 85

Hình 3.3. Quy trình xây dựng cơ sở tri thức về chuyên gia .......................................... 86

Hình 3.4. Quy trình thu thập dữ liệu từ nhiều nguồn .................................................... 88

Hình 3.5. Ví dụ lược đồ dữ liệu chuyên gia .................................................................. 94

Hình 3.6. Quy trình đánh chỉ mục với CSDL chuyên gia ............................................. 95

Hình 3.7. Mô hình biểu diễn tri thức chuyên gia sử dụng ontology.............................. 97

Hình 3.8. Các thành phần trong tầng chia sẻ và tích hợp dữ liệu .................................. 98

Hình 3.9. Các thành phần trong tầng ứng dụng và dịch vụ ......................................... 100

Hình 4.1. Hai mô đun lựa chọn để thử nghiệm ........................................................... 114

Hình 4.2. Quy trình kết hợp giữa Cơ sở tri thức về chuyên gia và mô đun hợp nhất dữ

liệu ..................................................................................................................... 115

Hình 4.3. Quy trình thực hiện xếp hạng chuyên gia CNTT theo yêu cầu của DN ..... 128

Hình 4.4. Giao diện trang chủ (phần 1) ....................................................................... 138

Hình 4.5. Kết quả trả về khi tìm kiếm chuyên gia trong lĩnh vực CNTT. .................. 138

Hình 4.6. Kết quả trả về khi xem thông tin một chuyên gia ....................................... 139

Hình 4.7. Tìm kiếm chuyên gia theo từng lĩnh vực ..................................................... 139

Hình 4.8. Mô hình nhân tố ảnh hưởng đến việc chấp nhận sử dụng hệ thống tìm kiếm

chuyên gia ......................................................................................................... 141

1

MỞ ĐẦU

1. Lý do chọn đề tài

Trong thời đại kinh tế tri thức và toàn cầu hóa, việc khai thác và quản lý hiệu quả nguồn lực chuyên gia đóng vai trò cực kỳ quan trọng đối với sự phát triển của quốc gia.

Chuyên gia là những người có kiến thức, kỹ năng và kinh nghiệm chuyên sâu trong nhiều lĩnh vực khác nhau (Weiss & Shanteau, 2003; Lin & cộng sự, 2017), góp phần

trực tiếp vào việc thúc đẩy đổi mới sáng tạo, nghiên cứu khoa học, và tăng trưởng kinh

tế (Pantouvakis & Karakasnaki, 2017). Tuy nhiên, thực trạng quản lý thông tin chuyên

gia ở Việt Nam hiện nay vẫn còn nhiều bất cập, chưa đáp ứng được yêu cầu của sự phát triển. Điều này đặt ra nhu cầu cấp bách về việc xây dựng một hệ thống quản lý và tìm

kiếm thông tin chuyên gia hiệu quả, giúp tận dụng tối đa nguồn tài sản trí thức này.

Hiện tại, Việt Nam vẫn chưa có một cơ sở dữ liệu (CSDL) chuyên gia đồng bộ,

thống nhất và tích hợp trên quy mô toàn quốc, tạm gọi là CSDL quốc gia về chuyên gia.

Trên thực tế, một số bộ, ngành, địa phương và tổ chức như Bộ Khoa học và Công nghệ

(KHCN), Cục công nghiệp - Bộ Công thương (Cục công nghiệp Việt Nam, 2019), tỉnh

Bình Định (Liên hiệp các Hội Khoa học và Kỹ thuật Bình Định, 2020), thành phố Đà

Nẵng, cùng một số cơ quan, tổ chức khác đã bắt đầu xây dựng các CSDL chuyên gia

riêng lẻ. Tuy nhiên, các CSDL này chỉ phục vụ nội bộ và không được kết nối với nhau,

dẫn đến nhiều khó khăn trong việc tìm kiếm, chia sẻ và khai thác thông tin chuyên gia

giữa các đơn vị. Điều này không chỉ gây lãng phí nguồn tài nguyên tri thức của quốc gia

mà còn khiến cho việc tìm kiếm chuyên gia phù hợp trở nên phức tạp và thiếu hiệu quả,

đặc biệt khi các doanh nghiệp, tổ chức có nhu cầu tìm kiếm nhanh thông tin chuyên gia để phục vụ cho các dự án quan trọng.

Bên cạnh đó, cũng còn thiếu các hệ thống tìm kiếm chuyên gia để quản lý dữ liệu

tích hợp, điều này đã tạo ra nhiều vấn đề bất cập. Các cơ quan, doanh nghiệp và tổ chức gặp khó khăn trong việc tiếp cận các chuyên gia phù hợp với nhu cầu của họ, dẫn đến mất nhiều thời gian và nguồn lực trong việc tìm kiếm thông tin hoặc phải sử dụng các kênh không chính thức, không đảm bảo chất lượng thông tin. Điều này ảnh hưởng không nhỏ đến các dự án nghiên cứu, đổi mới sáng tạo và cả hoạt động kinh doanh, sản xuất. Một số tổ chức phải xây dựng riêng hệ thống tìm kiếm chuyên gia của mình, nhưng điều

này lại dẫn đến tình trạng trùng lặp, thiếu đồng bộ và không tận dụng được nguồn lực chuyên gia từ các lĩnh vực khác.

Trước thực trạng này, nghiên cứu sinh (NCS) nhận thấy nhu cầu cần thiết phải xây dựng hệ thống quản lý thông tin và tìm kiếm chuyên gia, bên cạnh những dữ liệu

2

chuyên gia nội bộ của đơn vị triển khai, hệ thống này còn có thể đấu nối, tích hợp với

các cơ sở dữ liệu chuyên gia được chia sẻ tại đơn vị khác (như các bộ, ngành, địa phương

và tổ chức, doanh nghiệp). Ngoài ra, nếu trong tương lai, CSDL quốc gia về chuyên gia được thiết lập sẽ trở thành nguồn dữ liệu tập trung, tin cậy, phục vụ hiệu quả cho các

hoạt động nghiên cứu, hợp tác, và phát triển. Hệ thống tìm kiếm chuyên gia có thể kết nối với CSDL này để tìm kiếm thông tin chuyên gia một cách nhanh chóng nhất. Điều

này đặc biệt quan trọng trong bối cảnh các tổ chức, doanh nghiệp cần nhanh chóng tìm

kiếm và liên hệ với các chuyên gia để giải quyết các vấn đề kỹ thuật, nghiên cứu và phát

triển sản phẩm (Liff & Andersson, 2021).

Hệ thống tìm kiếm chuyên gia không chỉ giúp lưu trữ và quản lý thông tin chuyên

gia, mà còn cung cấp các tính năng hỗ trợ tìm kiếm nâng cao, giúp người dùng dễ dàng

tìm kiếm chuyên gia theo nhiều tiêu chí khác nhau như lĩnh vực chuyên môn, vị trí địa

lý, kinh nghiệm làm việc, hoặc các dự án đã tham gia. Hệ thống này có thể tích hợp trí

tuệ nhân tạo (AI) để gợi ý các chuyên gia phù hợp với nhu cầu cụ thể của từng tổ chức,

doanh nghiệp (Borna & cộng sự, 2024). Từ đó, không chỉ các cơ quan nhà nước mà các

doanh nghiệp, tổ chức giáo dục, viện nghiên cứu đều có thể dễ dàng tiếp cận nguồn lực

chuyên gia chất lượng cao, phục vụ cho các mục tiêu nghiên cứu, phát triển, và kinh

doanh (Pantouvakis & Karakasnaki, 2017).

Việc xây dựng hệ thống tìm kiếm chuyên gia có thể mang lại nhiều lợi ích thiết

thực như giúp nâng cao hiệu quả quản lý thông tin chuyên gia, tạo ra một hệ thống quản

lý tập trung, liên thông, giúp các cơ quan, doanh nghiệp và tổ chức có thể truy cập vào

cùng một nguồn thông tin đầy đủ, tin cậy. Tăng cường khả năng chia sẻ và kết nối thông

tin, hệ thống cho phép các bộ, ngành, địa phương, trường đại học, viện nghiên cứu, doanh nghiệp và hiệp hội doanh nghiệp dễ dàng chia sẻ và cập nhật thông tin chuyên

gia, từ đó tối ưu hóa việc sử dụng nguồn lực trí thức quốc gia. Bên cạnh đó, hệ thống có

thể hỗ trợ việc ra quyết định, giúp các doanh nghiệp có thể tìm kiếm chuyên gia phù hợp

một cách nhanh chóng, giúp tiết kiệm thời gian và nguồn lực trong việc tìm kiếm và triển khai các dự án liên quan. Việc có hệ thống tìm kiếm chuyên gia sẽ giúp cải thiện rõ rệt khả năng khai thác và tận dụng nguồn lực trí thức, thúc đẩy sự phát triển của đất nước trong mọi lĩnh vực từ khoa học công nghệ đến kinh tế xã hội.

Tuy nhiên, trong phạm vi luận án này, do giới hạn về thời gian và nguồn lực để

thực hiện quá trình thu thập và phân tích dữ liệu cũng như tiếp cận các đối tượng điều tra, NCS sẽ chỉ tập trung vào việc nghiên cứu thực trạng chung, đề xuất kiến trúc tham khảo của hệ thống tìm kiếm chuyên gia có khả năng kết nối và tích hợp nhiều nguồn dữ

liệu khác nhau, đồng thời xây dựng thử nghiệm một hệ thống tìm kiếm chuyên gia với

3

một số chức năng cụ thể để kiểm chứng tính khả thi. Ngoài ra, hệ thống này sẽ tập trung

chính vào đối tượng là các doanh nghiệp nhỏ và vừa (DNNVV). Đây là nhóm doanh

nghiệp (DN) được xác định là một nhân tố quan trọng trong chiến lược phát triển kinh tế của Việt Nam và thế giới. Tại châu Á, DNNVV chiếm đến 98% tổng số các DN và

chiếm khoảng 66% lực lượng lao động cả nước trong giai đoạn 2007–2012 (Yoshino & Taghizadeh Hesary, 2016). Còn tại Việt Nam, theo số liệu thống kê trong sách trắng

doanh nghiệp Việt Nam 2022, số lượng DNNVV đang hoạt động có kết quả sản xuất

kinh doanh tính đến hết năm 2020 chiếm tỉ lệ lớn với 97,4% (Bộ Kế hoạch và Đầu tư,

2022). Theo ủy ban Châu âu, DNNVV sẽ giúp giải quyết việc làm cho người lao động, góp phần tăng trưởng kinh tế và đảm bảo ổn định xã hội (European Commission, 2015)

cho nền kinh tế mỗi khu vực. Tuy nhiên, DNNVV đang phải đối mặt với không ít khó

khăn trong các hoạt động nhằm tiếp cận và mở rộng thị trường, đặc biệt trong việc đáp

ứng những yêu cầu ngày càng khắt khe của các thị trường lớn trên thế giới. Một số thách

thức mà DNNVV thường gặp bao gồm các vấn đề liên quan đến: Tài chính, nhận thức,

nguồn nhân lực, công nghệ, khả năng tiếp cận thông tin, v.v. (ASEAN CSR Network,

2017; Yoshino & Taghizadeh Hesary, 2016). Trong đó, việc tiếp cận với các chuyên

gia để hỗ trợ doanh nghiệp trong nhiều hoạt động khác nhau là vô cùng cần thiết. Theo

kết quả tổng hợp từ hơn 90 tài liệu nghiên cứu học thuật về mối quan hệ giữa việc tiếp

cận nguồn lực chuyên gia từ bên ngoài và hiệu quả kinh doanh của hai nhóm DN:

DNNVV và các DN lớn đã chỉ ra rằng, các DNNVV có nhu cầu cao hơn nhiều với nguồn

lực tư vấn từ bên ngoài so với DN lớn (IFAC, 2016). Với DNNVV, các nghiên cứu chỉ

ra rằng DN chủ yếu sử dụng tư vấn từ bên ngoài trong hoạt động kế toán, nguồn nhân

lực, vấn đề môi trường, hỗ trợ kinh doanh và quản lý, v.v. giúp DNNVV hoạt động hiệu quả hơn, tỷ lệ sống tốt hơn, tăng trưởng, lợi nhuận, ra quyết định tốt hơn, học tập và cải

thiện mối quan hệ với các mạng lưới liên hệ. Trong khi DN lớn thường có sẵn nhóm

chuyên gia (nội bộ và bên ngoài), đặc biệt trong lĩnh vực kế toán giúp tư vấn, hỗ trợ và

thực hiện các hoạt động của DN (IFAC, 2016). Đây cũng là cơ sở để NCS lựa chọn nhóm DNNVV làm khách thể nghiên cứu thay vì DN lớn khi tìm hiểu nhu cầu tìm kiếm chuyên gia từ bên ngoài.

Và để hỗ trợ DNNVV có khả năng tiếp cận với hệ thống tìm kiếm chuyên gia, NCS đề xuất sẽ có một cơ quan, tổ chức (thuộc Bộ, ban ngành Nhà nước) sẽ là đầu mối

triển khai hệ thống tìm kiếm chuyên gia với CSDL chuyên gia được tích hợp từ nhiều nguồn khác nhau. Từ đó, các DN có thể tiến hành kết nối đến hệ thống để tìm kiếm thông tin chuyên gia, kết nối với các chuyên gia và trích xuất các báo cáo thống kê từ

hệ thống này. Hoặc nếu DN đã có/ muốn xây dựng hệ thống tìm kiếm chuyên gia trong

4

nội bộ trong DN của mình, thì vẫn có thể kết nối với hệ thống tìm kiếm chuyên gia cấp

Bộ, để “hưởng lợi” từ hệ thống chung. Ngoài ra, kiến trúc hệ thống đề xuất cũng sẽ được

xây dựng dựa trên khung kiến trúc Chính phủ điện tử 3.0, để có thể phù hợp với kiến trúc chung của các hệ thống khác do Nhà nước chủ trì và ban hành.

Với những lý do trên, NCS đã lựa chọn đề tài nghiên cứu “Phát triển Hệ thống tìm kiếm chuyên gia cho Doanh nghiệp nhỏ và vừa tại Việt Nam” làm đề tài luận án

tiến sĩ chuyên ngành Hệ thống thông tin quản lý, nhằm đáp ứng tốt nhất cho nhu cầu tìm

kiếm chuyên gia của DNNVV trong giai đoạn hiện nay.

2. Mục tiêu nghiên cứu và câu hỏi nghiên cứu

2.1. Mục tiêu nghiên cứu

Mục tiêu chung:

Nghiên cứu phát triển hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam.

Mục tiêu cụ thể:

 Phân tích nhu cầu tìm kiếm chuyên gia của các DNNVV tại Việt nam hiện nay và hiện trạng trong việc quản lý thông tin chuyên gia, cũng như các hệ

thống tìm kiếm chuyên gia hiện có.

 Đề xuất kiến trúc tham khảo của hệ thống tìm kiếm chuyên gia theo hướng

tích hợp thông tin chuyên gia từ nhiều nguồn khác nhau.

 Phát triển một số thuật toán hỗ trợ tìm kiếm chuyên gia.

 Đánh giá kiến trúc đề xuất và đánh giá ý định chấp nhận sử dụng hệ thống tìm

kiếm chuyên gia của các DNNVV tại Việt Nam.

 Đề xuất, khuyến nghị một số giải pháp để có thể hoàn thiện và triển khai hệ

thống tìm kiếm chuyên gia phù hợp với yêu cầu thực tế.

Từ mục tiêu nghiên cứu trên, những nhiệm vụ cụ thể mà luận án cần thực

hiện được bao gồm:

 Nghiên cứu tài liệu về các vấn đề liên quan đến hệ thống tìm kiếm chuyên gia

 Phỏng vấn chuyên sâu một số quản lý của DNNVV tại Việt Nam để khảo sát nhu cầu sử dụng nguồn nhân lực chuyên gia tại các DNNVV tại Việt Nam.

 Lựa chọn hệ thống tìm kiếm chuyên gia điển hình hiện nay để thực hiện đánh

giá khả năng cung cấp thông tin trong việc tìm kiếm chuyên gia.

5

 Dựa trên việc phân tích hiện trạng, tiến hành đề xuất kiến trúc tham khảo của

hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam.

 Xây dựng thử nghiệm một số chức năng chính trong hệ thống tìm kiếm

chuyên gia.

 Khảo sát DN để đánh giá ý định chấp nhận HTTT mới và đánh giá HT trong

việc cung cấp thông tin chuyên gia cho DNNVV tại Việt Nam.

2.2. Câu hỏi nghiên cứu

Từ mục tiêu nêu trên, những câu hỏi nghiên cứu mà luận án cần trả lời:

 Câu hỏi 1: Xu hướng và các lĩnh vực, nền tảng được nghiên cứu trong lĩnh

vực tìm kiếm chuyên gia là gì?

 Câu hỏi 2: Thực trạng việc quản lý thông tin chuyên gia tại Việt Nam hiện nay như thế nào? Hệ thống tìm kiếm chuyên gia hiện có đã đáp ứng nhu cầu

tìm kiếm chuyên gia của DN chưa?

 Câu hỏi 3: Kiến trúc tham khảo của hệ thống tìm kiếm chuyên gia nên được xây dựng như thế nào để đáp ứng nhu cầu của DNNVV tại Việt Nam?

 Câu hỏi 4: Đánh giá ý định chấp nhận sử dụng hệ thống của các DN bằng

phương pháp nào?

3. Đối tượng và phạm vi nghiên cứu

3.1. Đối tượng nghiên cứu

Đối tượng nghiên cứu của luận án là Hệ thống tìm kiếm chuyên gia.

Khách thể nghiên cứu (Đơn vị phân tích)

- Đơn vị sử dụng/thụ hưởng hệ thống: Doanh nghiệp nhỏ và vừa tại Việt Nam

3.2. Phạm vi nghiên cứu

 Phạm vi nội dung

Nghiên cứu tập trung vào các vấn đề liên quan đến lĩnh vực tìm kiếm thông tin chuyến gia và hệ thống tìm kiếm chuyên gia. Đây là một trong các bài toán thuộc lĩnh

vực truy xuất thông tin của ngành Hệ thống thông tin. Bên cạnh đó, hệ thống đề xuất có thể được triển khai theo từng giai đoạn khác nhau tùy thuộc vào bối cảnh của Việt Nam. Ở thời điểm hiện tại, khi chưa có cơ chế về việc chia sẻ và quản lý CSDL chuyên gia tập trung, hệ thống tìm kiếm chuyên gia có thể do một tổ chức trung lập quản lý. Hệ

6

thống sẽ thu thập dữ liệu chuyên gia từ các nguồn dữ liệu có sẵn để tổng hợp và hình

thành nguồn dữ liệu tập trung, đồng thời tạo ra kênh thông tin để các DN có thể truy cập

và tìm kiếm chuyên gia một cách nhanh chóng. Trong thời gian tiếp theo, hệ thống có thể được tiếp nhận và triển khai tại một cơ quan, tổ chức (thuộc Bộ, ban ngành) có khả

năng và có đủ pháp lý để có thể đứng ra tiếp nhận, quản lý và tiếp cận với các nguồn dữ liệu từ nhiều tổ chức khác nhau, cũng như tiếp cận với trung tâm dữ liệu Quốc gia. Từ

đó, đơn vị này sẽ chia sẻ hệ thống tìm kiếm chuyên gia cho các doanh nghiệp kết nối và

sử dụng. Hệ thống này có thể được sử dụng cho bất kỳ loại hình doanh nghiệp nào.

 Phạm vi không gian

Về phạm vi điều tra, do điều kiện nguồn lực có hạn, tác giả sẽ tập trung thu thập

dữ liệu sơ cấp từ 20 DNNVV để phục vụ cho việc phỏng vấn chuyên sâu để tìm hiểu

thực trạng nhu cầu tìm kiếm chuyên gia trong các DN hiện nay và khảo sát 50 DNNVV

trong khu vực thương mại, dịch vụ tại một số khu vực như: Hà Nội (đại diện miền Bắc),

Thanh Hoá (đại diện miền Trung) và thành phố Hồ Chí Minh (đại diện miền Nam) để

phục vụ cho quá trình đánh giá hệ thống thử nghiệm.

Tuy nhiên, cách tiếp cận và phương pháp nghiên cứu được sử dụng cho đề tài

này hoàn toàn có thể áp dụng cho nhóm các doanh nghiệp ở khu vực khác hoặc với

phạm vi nghiên cứu, khảo sát rộng hơn.

 Phạm vi thời gian

Đối với dữ liệu thứ cấp về lý thuyết, NCS thu thập từ các nghiên cứu đã thực hiện

có liên quan đến đề tài từ trước cho đến nay.

Đối với dữ liệu sơ cấp về thực tiễn, NCS thu thập số liệu thông qua việc tiến hành

phỏng vấn và khảo sát một số DNNVV trong thời gian 2021 - 2024.

4. Phương pháp nghiên cứu

Theo kết quả tổng hợp 96 tài liệu có liên quan trực tiếp đến chủ đề “hệ tìm kiếm chuyên gia”, và những tài liệu này đáp ứng đủ các tiêu chí: có bối cảnh rõ ràng, phương

pháp nghiên cứu, phương pháp thu thập dữ liệu được mô tả và trình bày cụ thể, kết quả nghiên cứu được giải thích chi tiết; Husain & cộng sự (2019) đã thống kê về phương pháp nghiên cứu được sử dụng trong các tài liệu đó bao gồm: 94% sử dụng phương pháp

nghiên cứu định lượng, 1% sử dụng phương pháp nghiên cứu định tính, 1% sử dụng

phương pháp hỗn hợp và 4% sử dụng phương pháp đánh giá.

Nhận thấy phương pháp nghiên cứu định lượng là không thể thiếu trong các

nghiên cứu về chủ đề này, tuy nhiên nghiên cứu định tính cũng sẽ góp phần không nhỏ

7

trong quá trình xác định yêu cầu của bài toán, khi thực hiện phỏng vấn sâu một số nhà

quản lý tại đơn vị tiếp nhận và triển khai hệ thống cũng như tại một số DNNVV về nhu

cầu nhân lực chuyên gia và hệ thống tìm kiếm chuyên gia. Vì thế, NCS quyết định sẽ sử dụng phương pháp nghiên cứu hỗn hợp (kết hợp cả nghiên cứu định tính và nghiên cứu

định lượng) làm phương pháp nghiên cứu chính trong luận án này.

Ngoài ra, mục tiêu chính của luận án là phát triển hệ thống tìm kiếm chuyên gia,

vì thế phương pháp nghiên cứu khoa học thiết kế DSRM (Design Science Research

Methodology) cũng sẽ được NCS sử dụng để đánh giá mô hình kiến trúc hệ thống tìm

kiếm chuyên gia. DSRM là một phương pháp nghiên cứu được sử dụng để tạo ra và đánh giá các giải pháp sáng tạo cho các vấn đề phức tạp, đặc biệt trong lĩnh vực hệ thống

thông tin. DSRM tập trung vào việc thiết kế, xây dựng, đánh giá và cải thiện các sản

phẩm nhằm giải quyết các vấn đề thực tiễn.

Tổng quan

nghiên cứu

Xác định thực

trạng quản lý

Nghiên cứu một số hệ

thông tin chuyên

thống tìm kiếm chuyên

Phỏng vấn sâu

gia và nhu cầu

gia hiện có

một số DNNVV

tìm kiếm chuyên

tại Việt Nam

gia trong DN

Đề xuất kiến trúc

tham khảo của

Cài đặt thử nghiệm

Hệ thống tìm

hệ thống và thực

Kết luận

kiếm chuyên gia

hiện đánh giá

cho DNNVV

Quy trình thực hiện nghiên cứu gồm các giai đoạn chính như sau:

Nguồn: Tác giả đề xuất

Hình 1. Quy trình thực hiện nghiên cứu của luận án

8

4.1. Phương pháp tiếp cận nghiên cứu

Luận án sử dụng phương pháp nghiên cứu hỗn hợp, kết hợp cả phương pháp

nghiên cứu trong lĩnh vực khoa học xã hội cũng như trong lĩnh vực công nghệ thông tin,

để có thể tận dụng những ưu điểm của mỗi phương pháp trong quá trình thực hiện các

giai đoạn khác nhau của luận án. Bao gồm:

 Giai đoạn 1: Nghiên cứu định tính (Đánh giá hiện trạng và thu thập nhu cầu)

Được tác giả thực hiện trong giai đoạn đầu của luận án. Thông qua tổng hợp các

tài liệu, công trình nghiên cứu, phỏng vấn chuyên sâu đơn vị triển khai hệ thống

và một số DNNVV để nghiên cứu về hệ thống tìm kiếm chuyên gia nói chung,

và về nhu cầu nhân lực chuyên gia của DNNVV tại Việt Nam nói riêng, từ đó

nắm rõ nội dung nghiên cứu cũng như thu thập đủ thông tin về nhu cầu người

dùng. Trên cơ sở đó để có thể xây dựng hệ thống tìm kiếm chuyên gia phù hợp.

Ngoài ra, việc thu thập các dữ liệu thứ cấp có liên quan đến hệ tìm kiếm chuyên

gia cũng giúp cho NCS có cái nhìn tổng quát về vấn đề nghiên cứu, xác định

được những điều mà những nghiên cứu trước đã làm được và chưa làm được, từ

đó tìm ra khoảng trống nghiên cứu để tiến hành nghiên cứu sâu hơn trong luận

án của mình.

● Giai đoạn 2: Nghiên cứu khoa học thiết kế DSRM, FAAM và nghiên cứu định

lượng (Khảo sát đánh giá hệ thống thử nghiệm)

Được thực hiện trong quá trình đề xuất mô hình kiến trúc, xây dựng và đánh giá

hệ thống thử nghiệm. Trong quá trình đề xuất mô hình kiến trúc, phương pháp

nghiên cứu khoa học thiết kế được sử dụng. Trong quá trình thử nghiệm thuật

toán xếp hạng chuyên gia để phát hiện các chuyên gia phù hợp nhất với yêu cầu

đầu vào của DN, một số phương pháp định lượng để đánh giá độ chính xác của

thuật toán sẽ được sử dụng. Ngoài ra, sau khi xây dựng thử nghiệm hệ thống, để

đánh giá mô hình kiến trúc hệ thống đề xuất, phương pháp đánh giá FAAM sẽ

được sử dụng.

4.2. Phát triển thang đo cho phiếu điều tra

Phiếu khảo sát kế thừa thang đo từ các tác giả (Hevner & cộng sự, 2004; Im &

cộng sự, 2011; Ponce & cộng sự, 2016; sok foon & Yin-Fah, 2011).

9

Bảng 1. Thang đo phiếu khảo sát ý định chấp nhận sử dụng hệ thống

Nhân tố

Ký hiệu

Biến quan sát

Kế thừa từ tác giả

HQ1

Tôi thấy hệ thống tìm kiếm chuyên gia

ESSME hữu ích trong quá trình tìm kiếm

thông tin nhân sự chuyên gia của doanh

nghiệp tôi.

HQ2

Sử dụng hệ tìm kiếm chuyên gia ESSME

giúp tăng cơ hội tìm được chuyên gia phù

(Hevner & cộng sự,

hợp với nhu cầu nhân sự mà doanh nghiệp

2004),

KỲ VỌNG

tôi đang cần.

HIỆU QUẢ

(sok foon & Yin-

HQ3

Sử dụng hệ tìm kiếm chuyên gia ESSME

Fah, 2011)

giúp doanh nghiệp của tôi hoàn thành việc

tìm kiếm nhân sự nhanh hơn.

HQ4

Sử dụng hệ thống tìm kiếm chuyên gia

ESSME có thể giúp doanh nghiệp tôi tiết

kiệm thời gian và chi phí trong quá trình

tìm kiếm nhân sự chuyên gia.

NL1

Học cách sử dụng hệ thống tìm kiếm

chuyên gia ESSME rất dễ dàng đối với tôi.

NL2

Tôi thấy việc tương tác với hệ thống rõ

(Hevner & cộng sự,

ràng và dễ hiểu.

2004),

KỲ VỌNG

NỖ LỰC

(sok foon & Yin-

NL3

Tôi thấy hệ thống tìm kiếm chuyên gia

Fah, 2011)

ESSME dễ sử dụng.

NL4

Thật dễ dàng để tôi trở nên thuần thục

trong việc sử dụng hệ thống ESSME.

AHXH1 Những người bạn trong ngành nhân sự

(Hevner & cộng sự,

nghĩ rằng tôi nên sử dụng hệ thống tìm

2004),

kiếm chuyên gia ESSME.

ẢNH

(sok foon & Yin-

HƯỞNG

AHXH2 Bộ phận nhân sự trong doanh nghiệp của

Fah, 2011),

XÃ HỘI

tôi cũng khuyến khích tôi sử dụng hệ thống

(Im & cộng sự,

ESSME để tìm kiếm nhân sự chuyên gia

2011)

cho doanh nghiệp của mình.

10

Nhân tố

Ký hiệu

Biến quan sát

Kế thừa từ tác giả

AHXH3 Nhiều quản lý của các doanh nghiệp khác

cũng đồng ý cùng sử dụng hệ thống

ESSME để tìm kiếm nhân sự chuyên gia

cho doanh nghiệp.

DKTL1

Tôi có đủ tài nguyên cần thiết để sử dụng

hệ thống tìm kiếm chuyên gia.

(Hevner & cộng sự,

DKTL2

Tôi có kiến thức cần thiết để sử dụng hệ

2004),

ĐIỀU

tìm kiếm chuyên gia ESSME.

KIỆN

(sok foon & Yin-

DKTL3 Hệ thống ESSME tương thích với các hệ

THUẬN

Fah, 2011),

thống khác mà tôi đang sử dụng.

LỢI

(Ponce & cộng sự,

DKTL4

Tôi có thể nhận trợ giúp từ người khác khi

2016)

gặp khó khăn khi sử dụng hệ thống tìm

kiếm chuyên gia.

YDHV1 Tôi dự định sẽ tiếp tục sử dụng hệ thống

ESSME để tìm kiếm nhân sự chuyên gia cho

(Hevner & cộng sự,

doanh nghiệp của mình trong tương lai.

2004),

YDHV2 Tôi sẽ luôn cố gắng sử dụng hệ thống

(sok foon & Yin-

ESSME mỗi khi cần tìm kiếm nhân lực

Ý ĐỊNH

Fah, 2011),

chuyên gia.

HÀNH VI

(Ponce & cộng sự,

YDHV3 Tôi sẽ sử dụng hệ thống ESSME một cách

2016)

thường xuyên.

YDHV4 Tôi sẽ giới thiệu hệ thống ESSME cho

những người bạn của tôi ở các DN khác.

Nguồn: Tác giả tổng hợp

4.3. Phương pháp chọn mẫu

 Phương pháp chọn mẫu định tính

NCS sử dụng phương pháp chọn mẫu theo mục đích, tiến hành bằng phương pháp

phỏng vấn từng đại diện của DNNVV để xác định nhu cầu tìm kiếm và sử dụng chuyên

gia từ bên ngoài của các DN tại Việt Nam hiện nay. Các thông tin phỏng vấn sẽ được

11

xử lý một cách khách quan trên cơ sở các ý kiến của người trả lời đưa ra, vì thế dữ liệu

sẽ không bị lệch theo hướng chủ quan.

Số lượng mẫu:

- 20 đại diện DNNVV hoạt động trong một số lĩnh vực thuộc loại Hình DN dịch

vụ; Quy mô từ 10 đến 300 nhân viên. Thời gian thực hiện từ tháng 12/2021 đến tháng

1/2022.

 Phương pháp chọn mẫu định lượng

Trong luận án này, NCS sử dụng phương pháp chọn mẫu phi xác suất.

Cụ thể là phương pháp chọn mẫu thuận tiện và phương pháp quả bóng tuyết. Mẫu

thuận tiện được chọn là những người quản lý DNNVV mà NCS có quen biết. Tiến hành

gửi bảng khảo sát đến các đối tượng đó và thông qua họ gửi bảng khảo sát đến các đối

tượng tiếp theo (phương pháp quả bóng tuyết). Ưu điểm của phương pháp này là có thể

kết nối được nhiều DN nghiệp ở những vị trí địa lý khác nhau; có thể tiết kiệm được

thời gian và chi phí trong quá trình điều tra.

Số lượng mẫu: 50 DNNVV hoạt động trong một số lĩnh vực thuộc loại Hình DN

dịch vụ (bao gồm 20 DN tham gia phỏng vấn). Với số phiếu phát ra 182 phiếu, thu về 149

phiếu hợp lệ để đưa vào xử lý. Thời gian thực hiện từ tháng 1/2024 đến tháng 3/2024.

4.4. Phương pháp thu thập dữ liệu

 Các kỹ thuật thu thập dữ liệu được sử dụng trong nghiên cứu định tính là: tìm

hiểu tài liệu liên quan, quan sát một số hệ thống tìm kiếm chuyên gia hiện có,

phỏng vấn chuyên sâu với một số đối tượng là đại diện đơn vị triển khai hệ thống

và đại diện DN sử dụng hệ thống.

 Nghiên cứu định lượng sẽ thực hiện khảo sát các DN nhằm mục đích kiểm chứng

hệ thống tìm kiếm chuyên gia thử nghiệm mà NCS xây dựng. Hệ thống này sẽ

được cài đặt trên nền web, sau đó gửi đường link đến cho 50 DNNVV trong khu

vực Thương mại, dịch vụ mà tác giả đã đề cập trong phần phạm vi nghiên cứu.

Tiếp theo, lập phiếu khảo sát với bảng câu hỏi phù hợp để tìm hiểu xem các DN

có ý định chấp nhận sử dụng hệ thống mới không và đánh giá HT mới trong việc

12

cung cấp thông tin hỗ trợ tìm kiếm các chuyên gia trong các lĩnh vực mà DN cần.

Có hai hình thức gửi phiếu là: gửi trực tiếp bảng hỏi bản cứng hoặc gửi đường

link phiếu khảo sát thông qua Google Forms.

4.5. Phương pháp xử lý dữ liệu

 Trong phương pháp nghiên cứu định tính, tác giả chủ yếu sử dụng phương pháp

phân tích và tổng hợp tài liệu đối với dữ liệu thứ cấp nhằm tìm ra các xu hướng

công nghệ và kỹ thuật để phục vụ hoạt động xây dựng hệ tìm kiếm chuyên gia.

Việc phân tích này được thực hiện trên các phần mềm hỗ trợ như: Excel, Nvivo

và VOSViewer. Nghiên cứu tại bàn để xử lý các dữ liệu phỏng vấn chuyên sâu

nhằm tìm ra những thông tin quan trọng để xác định thực trạng cũng như nhu cầu

tìm kiếm chuyên gia của các DNNVV hiện nay.

 Đối với phương pháp nghiên cứu định lượng, dữ liệu thu về từ bộ phiếu khảo sát

sẽ được tổng hợp phân tích thống kê, phân tích hồi quy bằng phần mềm Excel,

SPSS. Kết quả thu về làm căn cứ cho các đánh giá và đề xuất cải tiến hệ thống

trong thời gian tới.

5. Khung nghiên cứu lý thuyết của luận án

Lý thuyết nền trong xây dựng hệ tìm kiếm chuyên gia

Cơ sở hình thành khung nghiên cứu lý thuyết của NCS được dựa trên một số lý

thuyết, bao gồm:

● Khung nghiên cứu lý thuyết về HTTT (IS Research Framework)

● Lý thuyết về phương pháp nghiên cứu khoa học thiết kế (DSRM)

● Lý thuyết về học máy (Machine learning theory)

● Mô hình chấp nhận và sử dụng công nghệ hợp nhất (UTAUT)

Từ cơ sở trên, NCS đề xuất khung nghiên cứu lý thuyết cho đề tài như sau:

13

Môi trường ngữ cảnh CON NGƯỜI Vai trò Năng lực Chuyên môn

Hệ thống tìm kiếm chuyên gia XÁC ĐỊNH Thực trạng quản lý thông tin chuyên gia Nhu cầu ứng dụng hệ thống tìm kiếm chuyên gia cho DNNVV

Cơ sở tri thức LÝ THUYẾT Khung lý thuyết nghiên cứu HTTT Lý thuyết học máy Mô hình Chấp nhận và sử dụng công nghệ hợp nhất

PHÁT TRIỂN Mô hình kiến trúc HT tìm kiếm chuyên gia

TỔ CHỨC Cấu trúc doanh nghiệp Chiến lược về nhân sự Quy trình hoạt động Văn hóa doanh nghiệp

CÔNG CỤ Thu thập, xử lý dữ liệu lớn, phi cấu trúc Trí tuệ nhân tạo Phát triển Web/App

CÔNG NGHỆ Tìm kiếm chuyên gia Phân loại chuyên gia Xếp hạng chuyên gia

PHƯƠNG PHÁP Phân tích định tính Phân tích định lượng Phương pháp nghiên cứu khoa học thiết kế

THỰC NGHIỆM VÀ ĐÁNH GIÁ Thu thập, xử lý dữ liệu Đánh chỉ mục, xếp hạng Lập trình hệ thống Đánh giá hệ thống

Nguồn: Tác giả đề xuất dựa trên khung nghiên cứu lý thuyết về HTTT

của Hevner & cộng sự (2004)

Hình 2. Khung nghiên cứu lý thuyết của đề tài

6. Những đóng góp mới của đề tài

Đóng góp về mặt lý luận

Thứ nhất, luận án đã sử dụng một phương pháp tiếp cận mới trong tổng quan nghiên cứu về xu hướng tìm kiếm chuyên gia bằng cách áp dụng kết hợp phương pháp trắc lượng thư mục và đánh giá tổng quan có hệ thống trong khoảng thời gian từ năm 2000 đến 2023. Kết quả không chỉ phát hiện ra sự dịch chuyển của xu hướng nghiên cứu từ tìm kiếm chuyên gia trong doanh nghiệp lớn sang lĩnh vực học thuật và nền tảng trực tuyến như cộng đồng hỏi đáp, mà còn phát hiện ra sự thay đổi về cách thức và mục tiêu tìm kiếm, trong đó theo hướng lấy người dùng làm trung tâm.

14

Thứ hai, luận án đã đề xuất kiến trúc tham khảo VietSME-EFSA của Hệ thống

tìm kiếm chuyên gia cho DNNVV tại Việt Nam, trong đó tập trung vào việc tích hợp và

thống nhất nguồn thông tin chuyên gia từ nhiều tổ chức, đơn vị khác nhau, theo khung kiến trúc TOGAF và khung kiến trúc Chính phủ điện tử 3.0. Với các thành phần chính

bao gồm: Hạ tầng kỹ thuật - công nghệ, an toàn thông tin mạng - an ninh mạng, tầng dữ liệu và cơ sở dữ liệu, tầng nền tảng tích hợp và chia sẻ dữ liệu, v.v. Từ đó, hệ thống có

thể kết nối với các hệ thống khác theo chuẩn chung của Chính phủ.

Thứ ba, luận án đã đề xuất thuật toán mới KDD để phát hiện trùng lặp hồ sơ

chuyên gia, trong đó độ tương tự giữa các thực thể được tính toán dựa trên sự kết hợp của việc phát hiện độ tương đồng trong tên người Việt và tập Cơ sở tri thức chuyên gia

(Expert Knowledge Base) được thu thập từ nhiều nguồn khác nhau, nhằm giải quyết vấn

đề tương tự phụ thuộc vào cấp độ.

Thứ tư, bên cạnh việc xác định bộ phương pháp đánh giá hệ thống tìm kiếm

chuyên gia, luận án cũng đề xuất áp dụng mô hình UTAUT vào đánh giá việc chấp nhận

sử dụng hệ thống tìm kiếm chuyên gia. Mặc dù, phương pháp này không mới, nhưng

với lĩnh vực tìm kiếm chuyên gia thì phương pháp này chưa được áp dụng. Vì thế, luận

án đã đề xuất bổ sung UTAUT vào bộ các phương pháp dùng để đánh giá trong lĩnh vực

tìm kiếm chuyên gia.

Đóng góp về mặt thực tiễn

Thứ nhất, kết quả nghiên cứu đã xác định được những bất cập trong thực trạng

quản lý thông tin chuyên gia hiện nay cùng với nhu cầu tìm kiếm của doanh nghiệp, trên

cơ sở đó đề xuất việc triển khai một hệ thống tìm kiếm chuyên gia phù hợp với DN, giúp

quản lý và tích hợp dữ liệu chuyên gia một cách hiệu quả hơn.

Thứ hai, kết quả đánh giá việc chấp nhận sử dụng hệ thống tìm kiếm chuyên gia

từ các DN đã cho thấy rằng, hai yếu tố quan trọng nhất mà đơn vị triển khai cần xem xét

khi triển khai hệ thống mới là “Điều kiện thuận lợi” liên quan đến cơ sở hạ tầng để cài

đặt và sử dụng hệ thống; và “Kỳ vọng nỗ lực” liên quan đến nhận thức của người dùng

về tính dễ sử dụng của hệ thống.

15

7. Kết cấu luận án

Mở đầu

1. Lý do chọn đề tài

2. Mục tiêu nghiên cứu và câu hỏi nghiên cứu

3. Phạm vi và đối tượng nghiên cứu

4. Phương pháp nghiên cứu

5. Khung nghiên cứu lý thuyết

6. Những đóng góp mới của đề tài

7. Kết cấu luận án

Chương 1. Tổng quan nghiên cứu và cơ sở lý luận về hệ thống tìm kiếm

chuyên gia

Chương 1 tập trung vào việc thực hiện nghiên cứu tổng quan các tài liệu có liên

quan đến tìm kiếm chuyên gia và hệ thống chuyên gia, với các tài liệu chủ yếu tập trung trong khoảng thời gian mà hệ thống tìm kiếm chuyên gia bắt đầu được chú ý và nghiên

cứu rộng rãi, từ năm 2000 đến năm 2023. Trong đó tập trung vào các khía cạnh chính:

(1) Lĩnh vực áp dụng hệ tìm kiếm chuyên gia; (2) Những bài toán cần xử lý trong hệ tìm

kiếm chuyên gia; và (3) Những công nghệ áp dụng trong các vấn đề liên quan đến hệ

tìm kiếm chuyên gia. Từ đó, NCS đã xác định được những khoảng trống trong lý thuyết

về hệ tìm kiếm chuyên gia, làm cơ sở cho việc định hướng nghiên cứu của luận án.

Bên cạnh đó, phần cơ sở lý luận sẽ trình bày các vấn đề cơ bản như khái niệm về

chuyên gia, phương thức tìm kiếm chuyên gia, hệ tìm kiếm chuyên gia và các vấn đề liên

quan. Những lý thuyết này cùng với phần tổng quan nghiên cứu sẽ là cơ sở để đánh giá

về thực trạng các hệ thống tìm kiếm chuyên gia hiện có ở Chương 2 và để đề xuất mô

hình kiến trúc của hệ thống tìm kiếm chuyên gia cho DNNVV Việt Nam ở Chương 3.

Chương 2. Phân tích yêu cầu của hệ thống tìm kiếm chuyên gia cho doanh

nghiệp nhỏ và vừa tại Việt Nam

Chương 2 sẽ tập trung vào việc phân tích thực trạng của hoạt động quản lý thông tin chuyên gia tại các đơn vị, tổ chức hiện nay cũng như nhu cầu tìm kiếm chuyên gia

trong doanh nghiệp nhỏ và vừa tại Việt Nam thông qua kết quả phỏng vấn sâu 20 DNNVV Việt Nam. Từ đó để thực hiện đánh giá về hai vấn đề chính: (1) Thực trạng hoạt động quản lý thông tin chuyên gia tại Việt Nam hiện nay như thế nào; và (2) Mong muốn của doanh nghiệp với hệ tìm kiếm chuyên gia trong tương lai.

16

Ngoài ra, Chương 2 cũng sẽ thực hiện đánh giá thực trạng quản lý thông tin

chuyên gia hiện nay, cũng như thực trạng một số hệ thống tìm kiếm chuyên gia hiện có,

từ đó thực hiện đánh giá về mặt chức năng và đánh giá về mặt dữ liệu để phân tích ưu, nhược điểm của các hệ thống, rút ra những điểm cần cải thiện.

Từ kết quả phân tích thực tiễn và lý thuyết, NCS sẽ tổng hợp những yêu cầu chính của hệ thống tìm kiếm chuyên gia cho doanh nghiệp nhỏ và vừa tại Việt Nam và đề xuất

các chức năng chính của hệ thống này.

Chương 3. Đề xuất kiến trúc tham khảo hệ thống tìm kiếm chuyên gia cho

doanh nghiệp nhỏ và vừa tại Việt Nam

Trên cơ sở lý thuyết ở Chương 1 và kết quả phân tích thực trạng ở Chương 2,

Chương 3 sẽ tiến hành đề xuất kiến trúc tham khảo của hệ thống tìm kiếm chuyên gia

cho DNNVV Việt Nam để giải quyết các vấn đề đặt ra ở Chương 2. Sau đó thực hiện phân tích chi tiết nội dung các tầng trong kiến trúc này. Tiếp theo, NCS thực hiện so

sánh và đánh giá kiến trúc đề xuất.

Chương 4. Kết quả thử nghiệm và đánh giá hệ thống tìm kiếm chuyên gia

cho doanh nghiệp nhỏ và vừa tại Việt Nam

Chương 4 sẽ mô tả kết quả thử nghiệm một số thuật toán giải quyết vấn đề cụ thể

trong hệ thống tìm kiếm chuyên gia và kết quả thử nghiệm xây dựng hệ thống tìm kiếm

chuyên gia cho doanh nghiệp nhỏ và vừa tại Việt Nam.

Tiếp theo, tiến hành khảo sát 50 DNNVV tại Việt Nam, thu về 149 phiếu hợp lệ

để đánh giá khả năng cung cấp thông tin nhân lực chuyên gia của hệ thống đề xuất và

đánh giá ý định chấp nhận sử dụng hệ thống của người dùng.

Từ đó, đưa ra một số thảo luận và khuyến nghị về kết quả nghiên cứu.

Ngoài ra, phần cuối của luận án còn có các mục Kết luận, Tài liệu tham khảo

và Phụ lục đi kèm.

17

CHƯƠNG 1. TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ LUẬN VỀ HỆ THỐNG TÌM KIẾM CHUYÊN GIA

1.1. Tổng quan nghiên cứu

Trong bối cảnh phát triển nhanh chóng của việc truy xuất thông tin và chia sẻ tri

thức, việc xác định và tiếp cận cũng như hợp tác chuyên gia đóng vai trò then chốt trong

việc thúc đẩy đổi mới và giải quyết vấn đề phức tạp trong các tổ chức, doanh nghiệp. Hoạt động tìm kiếm chuyên gia và Hệ thống tìm kiếm chuyên gia đã nổi lên như những

công cụ không thể thiếu, tạo điều kiện thuận lợi cho việc định vị hiệu quả các cá nhân

có kiến thức và kỹ năng chuyên môn. Do nhu cầu đặt ra trong cả lý thuyết và thực tiễn,

việc hiểu biết về các xu hướng, thách thức và tiến bộ trong lĩnh vực tìm kiếm chuyên gia trở nên cần thiết. Để đánh giá toàn diện về vấn đề này, NCS đã sử dụng phương pháp

kết hợp cả phân tích trắc lượng thư mục và đánh giá có hệ thống, để thực hiện nghiên cứu tổng quan về vấn đề tìm kiếm chuyên gia. Cách thức thực hiện theo phương pháp

phân tích tổng hợp (PRISMA) được đề xuất bởi Moher và cộng sự (2009), đảm bảo tuân

thủ theo các bước trong quy trình. Giai đoạn được xem xét kéo dài từ năm 2000 đến

năm 2023, là giai đoạn phát triển từ lúc việc nghiên cứu về tìm kiếm chuyên gia được

quan tâm cho đến hiện nay.

Trong lĩnh vực tìm kiếm chuyên gia, có một số bài đánh giá tổng quan rất đáng

chú ý, đặc biệt là những đánh giá được thực hiện từ năm 2017 đến năm 2019. Lin &

cộng sự (2017) đã tiến hành đánh giá toàn diện các kỹ thuật tìm kiếm chuyên gia, chỉ ra

rằng việc thu thập dữ liệu về các chuyên gia chủ yếu bắt nguồn từ ba kênh: cơ sở dữ liệu

meta, bộ sưu tập tài liệu và mạng lưới giới thiệu. Các mô hình được sử dụng để nhận

dạng chuyên gia bao gồm các mô hình xác suất tổng quát, mô hình bỏ phiếu, mô hình

dựa trên đồ thị và các mô hình kết hợp. Các bộ dữ liệu thử nghiệm đáng chú ý như W3C,

CERC, UvT, DBLP và CiteSeer cũng được đề cập. Năm 2018, Amjad và cộng sự đi sâu

vào nghiên cứu các phương pháp xếp hạng tác giả học thuật trong phạm vi mạng xã hội học thuật, phân tích các tài liệu từ năm 1999 đến năm 2017. Ba phương pháp xếp hạng tác giả nổi bật đã được xác định là dựa trên cách tiếp cận phân tích liên kết, độ tương tự văn bản và dựa trên học tập. Đánh giá cũng nhấn mạnh các bộ dữ liệu và biện pháp đánh giá khác nhau trên các danh mục này. Tuy nhiên, bài viết này chỉ tập trung vào nhiệm vụ cụ thể là tìm kiếm chuyên gia và xếp hạng các đối tượng, áp dụng riêng cho lĩnh vực học thuật (Amjad & cộng sự, 2018). Năm 2019, Yang và cộng sự đã khám phá về vấn đề khuyến nghị/đề xuất chuyên gia trong lĩnh vực cộng đồng hỏi đáp (CQA), phân loại

các nghiên cứu hiện có thành ba lĩnh vực chính: mô hình hóa hồ sơ chuyên gia, phương

pháp khuyến nghị chuyên gia và tác động của khuyến nghị chuyên gia. Bài viết này đã

18

trình bày một bản mô tả toàn diện trong lĩnh vực CQA, nghiên cứu các bài báo có liên

quan được xuất bản từ năm 2008 đến 2019 (Yang & cộng sự, 2019).

Đáng chú ý, cả ba bài đánh giá nói trên đều tập trung vào các khía cạnh đơn lẻ (về vấn đề kỹ thuật) hoặc các lĩnh vực cụ thể (xếp hạng tác giả học thuật hoặc khuyến

nghị chuyên gia trong cộng đồng hỏi đáp) và thiếu sự khám phá toàn diện trên các lĩnh vực và nhiệm vụ đa dạng.

Husain & cộng sự (2019) đã tiến hành đánh giá tổng quan tài liệu, tập trung vào

hệ thống tìm kiếm chuyên gia dựa trên các tài liệu được xuất bản từ năm 2010 đến năm

2019. Nghiên cứu này xem xét kỹ lưỡng năm khía cạnh chính: các lĩnh vực của hệ thống tìm kiếm chuyên gia, nguồn tìm kiếm chuyên gia, phương pháp tìm kiếm, bộ dữ liệu và

sự khác biệt giữa truy xuất và tìm kiếm kiến thức chuyên môn cũng như các yếu tố ngữ

cảnh. Ngoài ra, quá trình đánh giá đã xác định năm lỗ hổng trong hệ thống tìm kiếm chuyên gia tương ứng với các vấn đề trên. Nghiên cứu này có thể coi là một tài liệu đánh

giá kỹ lưỡng nhất về các hệ thống tìm kiếm chuyên gia.

Việc thiếu các đánh giá từ năm 2019 đến năm 2023 là một lỗ hổng trong lĩnh vực

tìm kiếm chuyên gia. Với những tiến bộ ngày càng tăng và sự tích hợp của nhiều công

nghệ mới vào lĩnh vực này trong những năm này, nhu cầu đánh giá toàn diện bổ sung

về lĩnh vực này là rất quan trọng. Khi các tổ chức, doanh nghiệp ngày càng dựa vào sức

mạnh hợp tác của các chuyên gia để giải quyết những thách thức phức tạp, việc hiểu

được quỹ đạo nghiên cứu của hoạt động tìm kiếm chuyên gia sẽ giúp ích rất nhiều cho

việc xây dựng các hệ thống truy xuất thông tin nói chung và hệ thống tìm kiếm chuyên

gia nói riêng. Hơn nữa, các khía cạnh như xem xét các xu hướng nghiên cứu, đồng trích

dẫn và đồng tác giả, thường được sử dụng trong các bài trắc lượng thư mục, hiếm khi được khám phá trong lĩnh vực này.

Bằng cách tận dụng phân tích trắc lượng thư mục của 494 bài báo, NCS sẽ thực hiện khám phá các xu hướng nghiên cứu về tìm kiếm chuyên gia. Đồng thời, thực hiện đánh giá có hệ thống, tập trung vào một tập hợp con gồm 51 bài viết, đi sâu vào phân tích các lĩnh vực nghiên cứu cụ thể của hệ thống tìm kiếm chuyên gia, các bộ dữ liệu phổ biến được sử dụng và các phương pháp đánh giá hệ thống tìm kiếm của chuyên gia. Từ đó chỉ ra những khoảng trống về lĩnh vực nghiên cứu và nội dung nghiên cứu của hệ

thống tìm kiếm chuyên gia, làm nền tảng để định hướng các mục tiêu nghiên cứu của luận án.

19

Bên cạnh đó, với các nghiên cứu trong nước trong lĩnh vực này, còn khá hạn chế

các bài viết nghiên chuyên sâu. Vì thế, NCS sẽ thực hiện tìm kiếm tài liệu và phân tích

thủ công những tài liệu này.

1.1.1. Phương pháp thực hiện

Tiêu chí tìm kiếm tài liệu được xác định dựa trên mức độ phù hợp của các bài

nghiên cứu với hệ tìm kiếm chuyên gia trong khoảng thời gian từ 2000 đến 2023. Để đảm bảo tính toàn diện, các từ khóa sau đã được sử dụng: "hệ thống tìm kiếm chuyên

gia", "tìm kiếm chuyên gia*," "định vị chuyên gia*", "xếp hạng chuyên gia*", "tìm kiếm

chuyên gia" và "truy xuất chuyên môn". Ngoài ra, việc tìm kiếm bị giới hạn ở các miền

cụ thể, bao gồm Tìm kiếm chuyên gia, Tìm kiếm chuyên gia, Hệ thống đề xuất, Truy xuất chuyên môn, Xếp hạng chuyên gia và Hệ thống tìm kiếm chuyên gia.

Hình 1.1. Phương pháp thực hiện tổng quan nghiên cứu dựa trên phương pháp

Nguồn: Tác giả đề xuất

PRISMA có chỉnh sửa

Tiêu chí loại trừ liên quan đến các nghiên cứu ngoài khung thời gian xác định, các ngôn ngữ không phải tiếng Anh và các bài viết không liên quan trực tiếp đến hoạt

20

động tìm kiếm chuyên gia. Các loại tài liệu được xem xét việc nghiên cứu tổng quan

này bao gồm các bài báo, sách, chương sách, bài hội thảo và các bài đánh giá tổng quan.

Việc tìm kiếm được giới hạn trong cơ sở dữ liệu Scopus, và xác định được 494 bài báo. Quá trình sàng lọc sẽ thực hiện việc đọc tiêu đề/tóm tắt/từ khóa và quyết định có nên

thu thập dữ liệu hay không dựa trên các tiêu chí đưa vào được xác định trước.

Quá trình thu thập và phân tích dữ liệu được thể hiện trong Hình 1.1.

Tuy nhiên, do dữ liệu thực hiện trong phương pháp PRISMA chỉ mới thực hiện

với bộ dữ liệu Scopus, nên NCS đã tìm hiểu thêm các tài liệu ngoài nguồn này, và thực

hiện phân tích thủ công để phát hiện thêm những thông tin khác.

Trích xuất dữ liệu liên quan đến việc mã hóa thông tin liên quan từ mỗi bài viết,

bao gồm lĩnh vực/nền tảng, bộ dữ liệu và phương pháp đánh giá. Phần mềm NVivo

tạo điều kiện thuận lợi cho việc tổ chức và phân tích dữ liệu văn bản một cách có hệ thống, đảm bảo việc khám phá nội dung một cách kỹ lưỡng (Booth & cộng sự, 2018).

Các kết quả thu được từ NVivo đã được tổng hợp để cung cấp những hiểu biết toàn

diện về các lĩnh vực/nền tảng, bộ dữ liệu và phương pháp đánh giá phổ biến trong lĩnh

vực tìm kiếm chuyên gia.

Hình 1.2. Số lượng các bài nghiên cứu về lĩnh vực tìm kiếm chuyên gia từ

năm 2000 đến 2023

Nguồn: Tác giả tổng hợp và đề xuất

Khi tiến hành phân tích thống kê các bài báo nghiên cứu trong lĩnh vực tìm kiếm chuyên gia, trích từ Scopus từ năm 2000 đến năm 2023 (Hình 1.2). Dữ liệu cho thấy, từ năm 2000 đến năm 2005, số lượng nghiên cứu trong lĩnh vực này tương đối khiêm tốn.

Tuy nhiên, đã có sự thay đổi đáng kể từ năm 2006 đến năm 2011, với số bài báo tăng từ 4 lên 33 bài mỗi năm. Sau đó, từ năm 2011 đến năm 2021, tỷ lệ xuất bản vẫn tương đối ổn định. Vào năm 2023, số lượng bài báo thấp hơn một chút, có thể do một số bài báo chưa được lập chỉ mục vào cơ sở dữ liệu Scopus tại thời điểm NCS thu thập dữ liệu.

21

Dữ liệu trên đường màu cam thể hiện số lượng các tài liệu mà NCS lựa chọn để

nghiên cứu về nội dung nhằm phân tích chuyên sâu để khám phá các vấn đề và phát hiện

ra những khoảng trống trong các nghiên cứu ở lĩnh vực này.

1.1.2. Kết quả đánh giá các nghiên cứu trên thế giới

Đánh giá có hệ thống nội dung tài liệu bằng NVivo

Dựa trên số lượng trích dẫn cao nhất trong số 494 bài báo được xác định, tác giả

đã chọn 51 bài báo từ nằm trong top 1 đến 4 bài báo có số lượng trích dẫn hàng đầu mỗi

năm để thực hiện nghiên cứu chuyên sâu. Nhóm các tài liệu này sẽ được phân tích chi

tiết để giải quyết ba câu hỏi nghiên cứu chính: các lĩnh vực nghiên cứu của hệ tìm kiếm

chuyên gia, các bộ dữ liệu thường được sử dụng trong thử nghiệm hệ tìm kiếm chuyên gia và các phương pháp đánh giá thường được sử dụng để đánh giá hệ tìm kiếm chuyên

gia. Để phân tích nội dung, phần mềm Nvivo đã được sử dụng (Alam, 2021).

1.1.2.1. Các nền tảng/ lĩnh vực tìm kiếm chuyên gia

Nhiệm vụ tìm kiếm chuyên gia đã thu hút được sự quan tâm trên nhiều lĩnh vực, nền

tảng khác nhau, đòi hỏi phải xác định các nhiệm vụ chi tiết và những thách thức liên quan.

Thông qua việc tìm kiếm thông tin trong 51 bài báo nghiên cứu được trích dẫn nhiều kéo

dài từ năm 2000 đến năm 2023, các tác giả đã xác định được sáu lĩnh vực, nền tảng nổi bật

thường được đề cập trong các nhiệm vụ tìm kiếm của chuyên gia. Bao gồm các:

 Học thuật : Lĩnh vực này bao gồm nhiều nhiệm vụ khác nhau liên quan đến tìm kiếm chuyên gia, bao gồm tìm kiếm chuyên gia để tư vấn trong các nỗ lực nghiên cứu

mới, tự động phân công bài viết cho người đánh giá trong quy trình đánh giá ngang

hàng, đề xuất của hội đồng đánh giá đối với đơn xin tài trợ nghiên cứu, tìm cố vấn

và người giám sát, tìm kiếm các chuyên gia (của trường đại học) cho các dự án hợp

tác và thúc đẩy hợp tác nghiên cứu. Những nhiệm vụ này giải quyết nhu cầu thường

xuyên của các tổ chức hoạt động trong lĩnh vực học thuật, chẳng hạn như trường đại học, viện nghiên cứu, hội nghị và tạp chí, nhấn mạnh bản chất thiết yếu của việc xác định chuyên gia trong lĩnh vực này. Những nghiên cứu này chủ yếu tập trung vào khung thời gian từ năm 2006 đến năm 2012, nêu bật sự chú ý ban đầu dành cho việc tìm kiếm chuyên gia trong lĩnh vực học thuật. Tuy nhiên, dường như có sự suy giảm sự quan tâm trong những năm gần đây.

 Doanh nghiệp: Nghiên cứu được thực hiện từ năm 2000 đến năm 2011 tập trung vào việc tìm kiếm các chuyên gia trong lĩnh vực doanh nghiệp, đặc biệt là trong các doanh nghiệp và tổ chức lớn có lực lượng lao động đông đảo. Những ấn phẩm này đánh dấu giai đoạn đầu của việc khám phá toàn diện trong lĩnh vực tìm kiếm

22

chuyên gia, với những đóng góp đáng chú ý từ các nghiên cứu của Balog và cộng sự, và việc sử dụng bộ dữ liệu TREC từ năm 2005 đến năm 2008. Nhiệm vụ được nêu trong các nghiên cứu này bao gồm tìm kiếm chuyên gia cho các dự án, cộng tác, trả lời câu hỏi, xác định các vấn đề phức tạp của hệ thống, chia sẻ kiến thức và tìm kiếm chuyên gia để tư vấn.

Tuy nhiên, một số lỗ hổng đã trở nên rõ ràng, chẳng hạn như bài viết chỉ tập trung

vào việc tìm kiếm các chuyên gia trong các doanh nghiệp lớn mà ít quan tâm đến việc

tìm kiếm các chuyên gia bên ngoài. Bên cạnh đó, nghiên cứu được tiến hành còn tương

đối cũ và thiếu các nghiên cứu gần đây. Xem xét những thay đổi đáng kể về nhu cầu của

doanh nghiệp do sự phát triển của công nghệ và thị trường, việc thiếu nghiên cứu mới về tìm kiếm chuyên gia trong khu vực doanh nghiệp hiện nay là một khoảng trống đáng

chú ý mà các nhà nghiên cứu có thể xem xét.

 Cộng đồng hỏi đáp (CQA): Nền tảng mới nổi này, đặc biệt nổi bật từ năm 2019 đến 2023, đã thu hút sự chú ý của các tác giả khi nghiên cứu các vấn đề liên quan đến việc tìm kiếm chuyên gia. Đặc điểm nổi bật của nền tảng này nằm ở khả năng đáp ứng vô số câu hỏi trải rộng trên nhiều lĩnh vực và mức độ khó khác nhau. Do đó, việc xác định các chuyên gia có thể trả lời những câu hỏi này một cách chính xác nhất là rất quan trọng. Do đó, việc đi sâu vào nền tảng Cộng đồng hỏi đáp (CQA) đã trở thành một hướng nghiên cứu hấp dẫn đối với các nhà nghiên cứu (Amendola & cộng sự, 2024). Một số nhiệm vụ mà tác giả đã xác định trong tài liệu là: tìm kiếm chuyên gia để trả lời các câu hỏi mục tiêu và thúc đẩy quá trình chia sẻ kiến thức; xác định nhóm chuyên gia; đáp ứng nhu cầu khoa học và cung cấp nguồn nhân lực có chuyên môn cho các tổ chức; và tìm kiếm các chuyên gia ứng viên cho công việc (Etemadi & cộng sự, 2024; Peng & cộng sự, 2024). Hơn nữa, một số nghiên cứu vẫn chưa mô tả các nhiệm vụ rõ ràng. Có thể thấy, đây là nền tảng mới cho thấy một xu hướng nghiên cứu mới trước đây chưa được đề cập nhiều trong các bài đánh giá, chẳng hạn như Husain & cộng sự (2019).

 Mạng xã hội: Nền tảng này này cũng thu hút sự chú ý của cộng đồng nghiên cứu tìm kiếm chuyên gia, mặc dù số lượng bài viết trong lĩnh vực này không cao bằng các lĩnh vực khác đã đề cập trước đó. Các nhiệm vụ cụ thể được thu thập từ tài liệu bao gồm: tìm kiếm chuyên gia để cộng tác; trả lời các câu hỏi thực tế; đưa ra khuyến nghị về sản phẩm, con người hoặc địa điểm; thực hiện các nhiệm vụ chung; và tìm kiếm các chuyên gia địa phương. Mạng xã hội thường đóng vai trò là công cụ để khám phá các kết nối xã hội hoặc trích xuất thông tin liên quan đến chuyên gia từ các bài đăng trên trang của chuyên gia.

23

 Cộng đồng tri thức trực tuyến & Mạng xã hội học thuật: Trong số 51 tài liệu tác giả sử dụng để tổng hợp nghiên cứu, đây là hai lĩnh vực có số lượng tài liệu tham khảo ít nhất. Trong các lĩnh vực này, tác giả đã xác định các nhiệm vụ chính liên quan đến tìm kiếm chuyên gia, bao gồm chia sẻ và tìm kiếm kiến thức, giải quyết các vấn đề kỹ thuật trong cộng đồng kiến thức trực tuyến, thúc đẩy hợp tác và đổi mới trong nghiên cứu cũng như tạo điều kiện trao đổi chuyên môn học thuật trong mạng xã hội học thuật. Mặc dù tài liệu viết về các nền tảng này trong nghiên cứu tìm kiếm chuyên gia bị hạn chế trong đánh giá của tác giả nhưng không thể bỏ qua tầm quan trọng của chúng. Các nền tảng như Google Scholar và ResearchGate đóng vai trò là trung tâm lưu trữ các nghiên cứu, tổng hợp thông tin từ các chuyên gia học thuật trên toàn cầu. Tương tự như cộng đồng tri thức trực tuyến, những nền tảng này rất quan trọng cho việc chia sẻ kiến thức rộng rãi giữa những người dùng đa dạng. Do đó, các nền tảng này vẫn không thể thiếu trong quá trình tìm kiếm chuyên gia.

Bảng 1.1. Các nền tảng/lĩnh vực tìm kiếm chuyên gia

Nhiệm vụ

TLTK

Nền tảng/ Lĩnh vực

(Deng & cộng sự, 2008) (Gao & cộng sự, 2024)

(Wang & cộng sự, 2010)

Học thuật

(Alarfaj & cộng sự, 2012)

(Cifariello & cộng sự, 2019)

Tìm kiếm chuyên gia tư vấn khi thực hiện một nghiên cứu mới Tự động chỉ định bài viết cho người đánh giá trong quy trình đánh giá ngang hàng Đề xuất ban đánh giá cho các đơn xin tài trợ nghiên cứu Tìm cố vấn Tìm người hướng dẫn cho NCS/ cao học viên/ SV Tìm chuyên gia (của trường đại học) cho các dự án chung Hợp tác nghiên cứu

(Balog & cộng sự, 2006;

Cifariello & cộng sự, 2019; Kang & cộng sự, 2023) (Balog & cộng sự, 2007)

(Wu & cộng sự, 2021)

Mạng xã hội học thuật

Chia sẻ tri thức Hợp tác và đổi mới trong nghiên cứu Chia sẻ và trao đổi chuyên môn học thuật Tìm kiếm chuyên gia để giải đáp các vấn đề và thúc đẩy quá trình chia sẻ tri thức

Cộng đồng hỏi đáp (CQA)

(Fu & cộng sự, 2020; Ghasemi & cộng sự, 2021; Liu & cộng sự, 2013; Nobari & cộng sự, 2017; Peng & cộng sự, 2022; Strukova & cộng sự, 2023; Yuan & cộng sự, 2020; Zhu & cộng sự, 2014)

24

Nhiệm vụ

TLTK

Nền tảng/ Lĩnh vực

Xác định nhóm chuyên gia

(Liu & cộng sự, 2005)

Đáp ứng nhu cầu khoa học & Cung cấp chuyên gia cho các tổ chức

(Dehghan & cộng sự, 2019)

Tìm kiếm ứng viên chuyên gia cho công việc

Không có nhiệm vụ cụ thể

(Dargahi Nobari & cộng sự, 2020; Deng & cộng sự, 2012; Fallahnejad & Beigy, 2022; Liu & cộng sự, 2022; Zhou & cộng sự, 2012)

Tìm chuyên gia cho dự án

(Balog & cộng sự, 2006; Serdyukov & cộng sự, 2008)

Tìm kiếm chuyên gia để hợp tác

(Bonchi & cộng sự, 2011; Macdonald & Ounis, 2008)

Tìm chuyên gia để trả lời câu hỏi

(Karimzadehgan & cộng sự,

2009)

(Tung & cộng sự, 2010)

Tìm chuyên gia chẩn đoán vấn đề cho các hệ thống phức tạp

Doanh nghiệp

(D'Amore, 2004)

Chia sẻ chuyên môn

(Balog & cộng sự, 2006)

Chuyên gia tư vấn

Không có nhiệm vụ cụ thể

(Balog & cộng sự, 2009; Balog & de Rijke, 2007; Dom & cộng sự, 2003; Fang & Zhai, 2007; Fang & cộng sự, 2010b; Macdonald &

Ounis, 2006; Smirnova & Balog, 2011; Yimam & Kobsa, 2000)

Chia sẻ và tìm kiếm tri thức

(Liu & cộng sự, 2014; Rafiei &

Kardan, 2015; Wang & cộng sự, 2013)

Cộng đồng tri thức trực tuyến

(Fallahnejad & Beigy, 2022)

Tìm chuyên gia giúp giải quyết các vấn đề kỹ thuật

Tìm kiếm chuyên gia để hợp tác

(Fazel-Zarandi & cộng sự, 2011;

Sun & cộng sự, 2015)

Trả lời các câu hỏi thực tế

Mạng xã hội

Đưa ra khuyến nghị về sản phẩm, con người hoặc địa điểm

(Bozzon & cộng sự, 2013)

Thực hiện các nhiệm vụ chung

(Cheng & cộng sự, 2014)

Tìm kiếm chuyên gia địa phương

(Deng & cộng sự, 2012)

Không có nhiệm vụ cụ thể

Nguồn: Tác giả tổng hợp

25

Theo Bảng 1.1, cộng đồng hỏi đáp và doanh nghiệp là các lĩnh vực được nghiên cứu thường xuyên nhất trong số các nghiên cứu, mỗi lĩnh vực chiếm tỷ lệ 32,6%. Tuy nhiên, có một điểm đặc biệt là những nghiên cứu về lĩnh vực doanh nghiệp chủ yếu là tìm chuyên gia trong doanh nghiệp lớn. Còn việc tìm chuyên gia để hỗ trợ cho doanh nghiệp nhỏ và vừa thì gần như không được nhắc đến. Tiếp theo là lĩnh vực học thuật với 15,2%, theo sát là mạng xã hội với 10,8%. Cuối cùng, cộng đồng tri thức trực tuyến và mạng xã hội học thuật lần lượt có tỷ lệ là 6,6% và 2,2%.

Điều này đã chỉ ra một khoảng trống rất cụ thể, đó là còn thiếu các nghiên cứu về hệ tìm kiếm chuyên gia bên ngoài hỗ trợ cho các DN, đặc biệt là DNNVV. Và khoảng trống này sẽ được khai thác trong phạm vi luận án này.

1.1.2.2. Bộ dữ liệu dùng trong thử nghiệm hệ tìm kiếm chuyên gia

Bảng 1.2 trình bày một cách có hệ thống tổng quan toàn diện về các bộ dữ liệu khác nhau thường được sử dụng trong thử nghiệm hệ tìm kiếm chuyên gia, cung cấp thông tin chi tiết về nền tảng, môi trường, năm và tần suất sử dụng cho từng bộ dữ liệu. Tập trung vào các bộ dữ liệu bắt nguồn từ các trang web cộng đồng hỏi đáp, các nền tảng bao gồm ByteCup, Wondir, Yahoo! Answers, Stack Overflow, Stack Exchange và Tianya Wenda, chủ yếu hoạt động trong môi trường cộng đồng hỏi đáp từ năm 2002 đến 2018. Đáng chú ý, bộ dữ liệu này đã được sử dụng rộng rãi trong mười nghiên cứu. Tiếp theo là các bộ dữ liệu mà hệ tìm kiếm chuyên gia trong lĩnh vực học thuật thường sử dụng như DBLP, EventSeer.net, Google Scholar, LExR, Microsoft Academic Search (MAS), NUCATS, PubMed, Thomson Reuters WoS, TU và UvT. Ví dụ: DBLP đã được giới thiệu trong năm nghiên cứu trong thời gian 2007-2008, trong khi EventSeer.net, Google Scholar, LExR, MAS, NUCATS, PubMed, Thomson Reuters WoS, TU và UvT đã được sử dụng ở các mức độ khác nhau với các năm cụ thể được ghi nhận cho một số bộ dữ liệu.

Bảng 1.2. Bộ dữ liệu dùng trong thử nghiệm hệ tìm kiếm chuyên gia

Bộ dữ liệu

Nền tảng

Năm

Nghiên cứu sử dụng bộ dữ liệu

Môi trường

2002-2005 2002-2005

2007-2008

CQA websites

2008-2018

Cộng đồng hỏi đáp

2009-2014

ByteCup Wondir Yahoo! Answers Stack Overflow Stack Exchange

Tianya Wenda

2008-2010

DBLP

Học thuật

2007-2008

(Yuan & cộng sự, 2020) (Liu & cộng sự, 2005) (Zhou & cộng sự, 2012; Zhu & cộng sự, 2011) (Dehghan & cộng sự, 2019; Fu & cộng sự, 2020) (Liu & cộng sự, 2022; Peng & cộng sự, 2022) (Zhu & cộng sự, 2011; Zhu & cộng sự, 2014) (Balog & cộng sự, 2006; Deng & cộng sự, 2012; Kang & cộng sự, 2023; Klamma & cộng sự, 2009; Wang & cộng sự, 2010)

26

Bộ dữ liệu

Nền tảng

Năm

Nghiên cứu sử dụng bộ dữ liệu

EventSeer.net Google Scholar

Môi trường Học thuật Học thuật

- -

LexR

Học thuật

-

(Klamma & cộng sự, 2009) (Deng & cộng sự, 2008) (Kang & cộng sự, 2023; Mangaravite & cộng sự, 2016)

Học thuật

-

(Chen & Lee, 2018)

2005-2007

(Wang & cộng sự, 2013)

Doanh nghiệp

Microsoft Academic Search (MAS) Microsoft Office Discussion Groups NUCATS PubMed

Học thuật Học thuật

(Fazel-Zarandi & cộng sự, 2011) (Albusac & cộng sự, 2018)

Học thuật

(Wu & cộng sự, 2021)

2009 2017 2019

-

(Cheng & cộng sự, 2014)

Doanh nghiệp

-

Mạng xã hội

(Bozzon & cộng sự, 2013; Wei & cộng sự, 2016)

CQA

2012-2013

(Zhao & cộng sự, 2015)

Bộ dữ liệu tự thu thập

CQA

(Liu & cộng sự, 2014)

2009-2010

Mạng xã hội học thuật (ResearchGate) Amazon Mechanical Turk Mạng xã hội công cộng (Facebook, LinkedIn, and Twitter) Quora Cộng đồng trực tuyến Reddit

CQA

2020-2021 -

(Strukova & cộng sự, 2023) (Sun & cộng sự, 2015)

-

(Karimzadehgan & cộng sự, 2009)

Doanh nghiệp

ScholarMate Học thuật Khảo sát trong các doanh nghiệp

Học thuật

2009

(Fazel-Zarandi & cộng sự, 2011)

Thomson Reuters WoS

TREC 2005, 2006

2005-2006

TREC

Doanh nghiệp

TREC 2007

TU

TREC 2008

2007 2008 -

Học thuật

UvT

Học thuật

-

(Balog & cộng sự, 2006; Balog & de Rijke, 2007; Macdonald & Ounis, 2006, 2008; Serdyukov & cộng sự, 2008) (Fang & cộng sự, 2010b; Serdyukov & cộng sự, 2008) (Fang & cộng sự, 2010b) (Cifariello & cộng sự, 2019) (Balog & cộng sự, 2007; Smirnova & Balog, 2011)

Nguồn: Tác giả tổng hợp

27

Bên cạnh đó, một bộ dữ liệu đặc biệt linh hoạt, dữ liệu tự thu thập, được lấy từ

các trang mạng xã hội học thuật (ResearchGate), Amazon Mechanical Turk, mạng xã

hội công cộng (Facebook, LinkedIn, Twitter), Quora, cộng đồng trực tuyến Reddit, ScholarMate và khảo sát nội bộ bên trong doanh nghiệp. Bộ dữ liệu này trải rộng trên

nhiều môi trường khác nhau, bao gồm học thuật, doanh nghiệp, mạng xã hội cũng như các trang web hỏi đáp, từ năm 2009 đến năm 2021 và đã được sử dụng trong chín nghiên

cứu. Bộ dữ liệu TREC (Text Retrieval Conference), bắt nguồn từ môi trường doanh

nghiệp từ năm 2005 đến 2008, nổi bật với tần suất sử dụng khá cao với sáu nghiên cứu.

Có thể nhận thấy, chưa có bộ dữ liệu nào dành riêng cho hệ tìm kiếm chuyên gia

cho DN tại Việt Nam. Vì thế, trong phạm vi luận án này, NCS sẽ tự thu thập dữ liệu từ

nhiều môi trường khác nhau để tạo ra bộ dữ liệu cho riêng mình, áp dụng thử nghiệm trong hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam.

1.1.2.3. Các phương pháp đánh giá trong hệ tìm kiếm chuyên gia

Để đánh giá các thuật toán, nhiệm vụ trong hệ tìm kiếm chuyên gia, có khá nhiều

phương pháp, chỉ số đánh giá được sử dụng. NCS đã thực hiện nghiên cứu các tài liệu

và thu được bảng kết quả như sau:

Bảng 1.3. Các phương pháp đánh giá

Chỉ số đánh giá

TLTK

Số lượng nghiên cứu

23

Độ chính xác: Precision; R- precision; mean R- precision; mean Pr

(Albusac & cộng sự, 2018; Balog & cộng sự, 2006; Cheng & cộng sự, 2014; Cifariello & cộng sự, 2019; D'Amore, 2004; Dargahi Nobari & cộng sự, 2020; Deng & cộng sự, 2012; Deng & cộng sự, 2008; Fallahnejad & Beigy, 2022; Fallahnejad & Beigy, 2024; Fang & cộng sự, 2010b; Fazel- Zarandi & cộng sự, 2011; Ghasemi & cộng sự, 2021; Kang & cộng sự, 2023; Liu & cộng sự, 2013; Macdonald & Ounis, 2006, 2008; Peng & cộng sự, 2022; Serdyukov & cộng sự, 2008; Smirnova & Balog, 2011; Wang & cộng sự, 2010; Wang & cộng sự, 2013; Wei & cộng sự, 2016; Zhao & cộng sự, 2015)

Đo lường trong lĩnh vực truy xuất thông tin (Áp dụng trong đánh giá thuật toán, mô hình)

MAP

22

(Alarfaj & cộng sự, 2012; Balog & cộng sự, 2006, 2009; Balog & cộng sự, 2007; Balog & de Rijke, 2007; Bozzon & cộng sự, 2013; Cifariello & cộng sự, 2019; Dargahi Nobari & cộng sự, 2020; Deng & cộng sự, 2012; Deng & cộng sự, 2008; Fallahnejad & Beigy, 2022; Fang & Zhai, 2007; Fang & cộng sự, 2010b; Liu & cộng sự, 2013; Macdonald & Ounis, 2006, 2008; Serdyukov & cộng sự, 2008; Smirnova & Balog, 2011; Wang & cộng sự, 2010; Zhou & cộng sự, 2012; Zhu & cộng sự, 2011; Zhu & cộng sự, 2014)

28

Chỉ số đánh giá

TLTK

Số lượng nghiên cứu

21

MRR

NDCG

12

Recall

4

Accuracy

3

(Balog & cộng sự, 2006, 2009; Balog & cộng sự, 2007; Balog & de Rijke, 2007; Bozzon & cộng sự, 2013; Cifariello & cộng sự, 2019; Dehghan & cộng sự, 2019; Deng & cộng sự, 2012; Fang & cộng sự, 2010b; Ghasemi & cộng sự, 2021; Karimzadehgan & cộng sự, 2009; Liu & cộng sự, 2013; Liu & cộng sự, 2005; Peng & cộng sự, 2022; Serdyukov & cộng sự, 2008; Smirnova & Balog, 2011; Wang & cộng sự, 2013; Zhao & cộng sự, 2015; Zhou & cộng sự, 2012; Zhu & cộng sự, 2011; Zhu & cộng sự, 2014) (Bozzon & cộng sự, 2013; Cheng & cộng sự, 2014; Cifariello & cộng sự, 2019; Dehghan & cộng sự, 2019; Ghasemi & cộng sự, 2021; Liu & cộng sự, 2014; Liu & cộng sự, 2022; Strukova & cộng sự, 2023; Wang & cộng sự, 2010; Wei & cộng sự, 2016; Yuan & cộng sự, 2020; Zhao & cộng sự, 2015) (Alarfaj & cộng sự, 2012; Chen & Lee, 2018; Dom & cộng sự, 2003; Wang & cộng sự, 2013) (Liu & cộng sự, 2022; Strukova & cộng sự, 2023; Zhao & cộng sự, 2015)

(Fazel-Zarandi & cộng sự, 2011)

ARC

1

(Strukova & cộng sự, 2023)

AUC

1

(Deng & cộng sự, 2008)

Bpref

1

(Dehghan & cộng sự, 2019)

ERR

1

1

(Wang & cộng sự, 2013)

(Smirnova & Balog, 2011)

1

(Bozzon & cộng sự, 2013)

1

Định tính

(Sun & cộng sự, 2015; Zhu & cộng sự, 2014)

2

Thước đo F trung bình Macro(Ma); Thước đo F trung bình Micro (Mi ) Đường cong 11-P Trung bình P@K Dựa trên đánh giá của con người

(Strukova & cộng sự, 2023)

1

R2 MAE

Hồi quy (Sử dụng trong xếp hạng chuyên gia)

1

Kendall’s

(Liu & cộng sự, 2014)

Tương quan khi xếp hạng

2

Spearman’s

(Liu & cộng sự, 2014; Rafiei & Kardan, 2015)

Nguồn: Tác giả tổng hợp

29

Có thể thấy, các phương pháp đánh giá sử dụng trong lĩnh vực truy xuất thông tin có số lượng lớn các nghiên cứu sử dụng như: Precision (23 nghiên cứu), MAP (22 nghiên cứu), MRR (21 nghiên cứu), v.v. Thông qua bảng tổng hợp này nhận thấy việc đánh giá các hệ thống tìm kiếm chuyên gia có thể thực hiện qua nhiều phương pháp khác nhau. Bên cạnh đó, việc đưa các số liệu định tính, đặc biệt là các số liệu dựa trên đánh giá của con người, nhấn mạnh phương pháp thực hiện mang tính chủ quan trong việc đánh giá tính hiệu quả của hệ thống tìm kiếm của chuyên gia. Sự hiện diện của chỉ số hồi quy, cụ thể là điểm R2 và MAE, trong một nghiên cứu, cho thấy việc cân nhắc sử dụng phân tích hồi quy định lượng để đánh giá hiệu suất hệ thống. Cuối cùng, việc kết hợp các số liệu tương quan như Kendall và Spearman dùng trong xếp hạng chuyên gia thể hiện tầm quan trọng của tính nhất quán trong xếp hạng của các hệ thống tìm kiếm chuyên gia.

Trong luận án này, NCS sẽ sử dụng kết hợp nhiều phương pháp đánh giá, để phù hợp với từng nhiệm vụ trong hệ thống tìm kiếm chuyên gia. Trong đó, đề xuất áp dụng phương pháp đánh giá ý định chấp nhận sử dụng hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam, đó là mô hình chấp nhận và sử dụng công nghệ hợp nhất (UTAUT). Hiện phương pháp đánh giá này chưa được áp dụng trong lĩnh vực tìm kiếm chuyên gia (theo kết quả tổng hợp các phương pháp đánh giá trong Bảng 1.3).

Phân tích thư mục bằng VOSviewer

Để tiến hành phân tích thư mục, NCS đã sử dụng phần mềm VOSviewer (Eck & Waltman, 2022). Công cụ này được sử dụng để xác định xu hướng dựa trên phân tích sự xuất hiện của từ khóa, nhóm đồng tác giả, liên kết thư mục giữa các quốc gia và tạo bản đồ dựa trên tóm tắt và tiêu đề của các bài báo được xác định (Eck & Waltman, 2022). VOSviewer cho phép thể hiện một cách trực quan các xu hướng và sự hợp tác trong các nghiên cứu về hệ tìm kiếm chuyên gia. Từ khóa được trích xuất từ các bài viết và phân tích về sự xuất hiện đồng thời, làm sáng tỏ những điểm nhấn ngày càng tăng trong lĩnh vực này. Mạng lưới đồng tác giả đã được kiểm tra để xác định các nhóm tác giả nổi bật, làm nổi bật các mô hình hợp tác. Ngoài ra, sự kết hợp thư mục giữa các quốc gia đã được khám phá để hiểu bối cảnh toàn cầu của nghiên cứu về hoạt động tìm kiếm chuyên gia. Bản đồ được tạo ra thể hiện một cách trực quan mối liên kết giữa các chủ đề nghiên cứu, từ đó giúp NCS có cái nhìn tổng thể liên quan đến vấn đề nghiên cứu.

1.1.2.4. Xu hướng nghiên cứu trong lĩnh vực tìm kiếm chuyên gia

Tổng hợp từ các tài liệu, có tổng cộng 1008 từ khóa (từ khóa do các tác giả đề

xuất) được tìm thấy, trong đó có 40 từ khóa xuất hiện hơn năm lần.

Hình 1.3 mô tả bản đồ xuất hiện đồng thời của các từ khóa trong những năm qua. Các nút có màu sắc khác nhau biểu thị các loại cụm khác nhau, kích thước nút biểu thị sự xuất hiện của từ khóa và đường kết nối dày cho thấy mối quan hệ chặt chẽ giữa hai

30

mục. Trong năm 2012 trở về trước, các từ khóa chính bao gồm “tìm kiếm doanh nghiệp” , “mô hình ngôn ngữ” và “quản lý tri thức”. Ngược lại, vào những năm 2020, các từ khóa nổi bật lại chuyển sang “cộng đồng hỏi đáp” , “stackoverflow” và “học sâu”. Sự thay đổi này cho thấy sự chuyển đổi trong trọng tâm nghiên cứu trong hệ thống tìm kiếm chuyên gia, tuy nhiên điều này hoàn toàn phù hợp với sự xuất hiện của các nền tảng và kỹ thuật mới.

Sự xuất hiện của các công nghệ và nền tảng mới, chẳng hạn như nền tảng cộng đồng hỏi đáp như Stack Overflow, đã thúc đẩy các nhà nghiên cứu khám phá các vấn đề trong thế

giới thực và điều chỉnh các phương pháp cho phù hợp với bối cảnh công nghệ đang phát

triển. Sự thay đổi này biểu thị sự nhấn mạnh ngày càng tăng vào các nghiên cứu lấy người dùng làm trung tâm, tập trung vào các vấn đề thực tế, hướng đến người dùng

(Fallahnejad & Beigy, 2024; Wang & cộng sự, 2024). Ngoài ra, sự sẵn có của lượng dữ

liệu khổng lồ từ các nền tảng cộng đồng đã nhấn mạnh giá trị của phân tích dữ liệu lớn,

dẫn đến sự công nhận các khía cạnh hợp tác, chia sẻ thông tin và giải quyết vấn đề. Các

nhà nghiên cứu cũng tận dụng các kỹ thuật học máy tiên tiến, đặc biệt là học sâu, cho

các ứng dụng thực tế, phản ánh nhu cầu và xu hướng đang thay đổi trong lĩnh vực này

(de Campos & cộng sự, 2024). Nhìn chung, sự thay đổi này hướng tới các nghiên cứu

có định hướng xã hội hơn và có tác động thực tế hơn, phù hợp với bối cảnh ngày càng

phát triển về chia sẻ thông tin và tiến bộ công nghệ trong những năm 2020 đến nay.

Nguồn: Tác giả tổng hợp từ phần mềm VOSviewer

Hình 1.3. Bản đồ các từ khóa xuất hiện đồng thời theo năm

31

Có ba cụm chính, bao gồm: (1) Tìm kiếm chuyên gia và nền tảng ứng dụng; (2)

Nhiệm vụ tìm kiếm chuyên gia; (3) Hệ thống tìm kiếm chuyên gia và các vấn đề liên quan.

Bảng 1.4 cho thấy số lần xuất hiện, tổng cường độ liên kết và mô tả chủ đề của

từng cụm. Theo kết quả phân tích cụm, các từ khóa này được chia thành ba cụm.

Bảng 1.4. Mô tả các từ khóa chính trong mỗi cụm

Cụm

Từ khóa chính

Chủ đề

Lần xuất hiện

Tổng độ lớn liên kết

tìm chuyên gia

233

155

tìm kiếm chuyên gia

66

35

cộng đồng hỏi đáp

32

31

truyền thông xã hội

18

17

tìm kiếm doanh nghiệp

16

16

Cụm 1

phân tích liên kết

13

13

(Màu đỏ)

phân tích mạng xã hội

12

12

Tìm kiếm chuyên gia và nền tảng ứng dụng

mô hình ngôn ngữ

11

11

hỏi đáp

8

8

stackoverflow

7

7

chia sẻ tri thức

7

7

học để xếp hạng

7

7

tìm kiếm chuyên gia

66

35

thu thập kiến thức chuyên môn

39

27

mạng xã hội

16

15

mô hình ngôn ngữ

11

11

đánh giá

7

7

Cụm 2

pagerank

8

8

Nhiệm vụ trong tìm kiếm chuyên gia

(Màu xanh lá)

dữ liệu được liên kết

6

6

hồ sơ chuyên gia

5

5

xếp hạng chuyên gia

14

4

học sâu

6

4

web ngữ nghĩa

6

4

32

Cụm

Từ khóa chính

Chủ đề

Lần xuất hiện

Tổng độ lớn liên kết

truy xuất thông tin

33

32

bản thể học

21

20

quản lý tri thức

21

20

khai thác dữ liệu

10

9

Cụm 3

mô hình chuyên gia

6

6

chuyên gia

5

5

Hệ thống tìm kiếm chuyên gia và các vấn đề liên quan

(Màu xanh da trời)

phân tích ngữ nghĩa

5

5

hệ thống tìm kiếm chuyên gia

8

4

hệ thống khuyến nghị

7

4

xếp hạng

5

3

Nguồn: Tác giả tổng hợp

Ba cụm từ khóa được xác định mô tả các chủ đề chính thường được tác giả khám phá trong lĩnh vực tìm kiếm chuyên gia. Cụ thể, Cụm 1 (màu đỏ) chỉ ra những lĩnh vực

thường được nghiên cứu trong tìm kiếm chuyên gia, bao gồm các lĩnh vực như cộng

đồng hỏi đáp, truyền thông xã hội, tìm kiếm doanh nghiệp, phân tích mạng xã hội và các

nền tảng như Stack Overflow. Đây là những lĩnh vực cần chuyên gia giải đáp các vấn

đề người dùng quan tâm, chia sẻ kiến thức trên mạng xã hội, góp phần giải quyết vấn đề

trong nội bộ doanh nghiệp (Balog & cộng sự, 2007; Nobari & cộng sự, 2017; Tran &

Huang, 2022). Hơn nữa, những môi trường này cũng giúp phân biệt chuyên gia và các

mối quan hệ của chuyên gia.

Với Cụm 2 (màu xanh lục), tập trung vào các nhiệm vụ cốt lõi không thể thiếu

trong tìm kiếm chuyên gia, chẳng hạn như truy xuất chuyên môn, liên kết dữ liệu, lập hồ sơ chuyên gia, mô hình ngôn ngữ, xếp hạng chuyên gia và đánh giá. Truy xuất chuyên môn là một bước khởi đầu quan trọng trong quá trình tìm kiếm. Sau đó, việc thu thập dữ liệu đòi hỏi phải liên kết thông tin và tạo hồ sơ chuyên gia. Các mô hình được sử dụng để xác định các chuyên gia phù hợp trong các lĩnh vực khác nhau, thực hiện xếp hạng chuyên gia và đánh giá kết quả. Các kỹ thuật đáng chú ý như PageRank, học sâu

và web ngữ nghĩa thường được áp dụng để hoàn thành các nhiệm vụ này (Fazel-Zarandi & cộng sự, 2011; Liu & cộng sự, 2022; Rafiei & Kardan, 2015; Schoegje & cộng sự, 2024).

33

Cuối cùng, Cụm 3 (màu xanh lam) hướng sự chú ý đến Hệ thống tìm kiếm chuyên

gia và các vấn đề liên quan. Đây là một hệ thống trong lĩnh vực truy xuất thông tin. Các

giai đoạn như khai thác dữ liệu, sử dụng bản thể luận và phân tích ngữ nghĩa để xử lý thông tin chuyên gia. Các kỹ thuật gồm lập mô hình chuyên gia và xếp hạng là các thành

phần không thể thiếu gắn liền với hệ thống tìm kiếm chuyên gia (Cifariello & cộng sự, 2019; Wang & cộng sự, 2013).

Bản đồ dựa trên dữ liệu văn bản

Khi xây dựng bản đồ dựa trên văn bản với các trường mà thuật ngữ được trích

xuất từ tiêu đề và phần tóm tắt, có 8123 thuật ngữ, số lần xuất hiện tối thiểu của thuật ngữ là 20, tác giả đã tìm thấy 101 thuật ngữ đáp ứng yêu cầu. Trong đó, sẽ có 61 thuật

ngữ phù hợp nhất được chọn ra (Hình 1.4).

Nguồn: Tác giả tổng hợp từ phần mềm VOSviewer

Hình 1.4. Bản đồ dựa trên dữ liệu văn bản được trích xuất từ tiêu đề và tóm tắt

Bốn cụm thời gian có thể được mô tả như sau:

 Năm 2000 đến 2013 (màu tím): Nhấn mạnh vào nhiệm vụ Tìm kiếm chuyên gia

và theo dõi doanh nghiệp (TREC).

 Năm 2014-2015 (màu xanh đậm): Tập trung vào phân tích truy vấn và kết quả trả về, bao gồm các chủ đề như hiệu suất, mức độ liên quan, hồ sơ, nguồn, ứng viên chuyên gia, kết quả thử nghiệm và độ chính xác.

34

 Năm 2016 (màu xanh nhạt): Tập trung vào phân tích các bài báo và nhà nghiên cứu trong lĩnh vực học thuật, kết hợp các yếu tố như khuyến nghị, bài báo, nhà

nghiên cứu, v.v.

 Từ 2017 trở đi (màu vàng): Tập trung vào bộ dữ liệu, trang web, cộng đồng hỏi

đáp, cũng như tính tương tác trên các nền tảng này.

Điều này cho thấy rõ ràng xu hướng nghiên cứu chính trong lĩnh vực tìm kiếm

chuyên gia, chuyển từ tập trung vào bên trong doanh nghiệp sang nền tảng học thuật và

trực tuyến, đặc biệt là những nền tảng dành riêng cho cộng đồng hỏi đáp.

1.1.3. Tình hình nghiên cứu tại Việt Nam

Hiện nay, Việt Nam đang tiến hành xây dựng Cơ sở dữ liệu Quốc gia về Khoa

học và Công nghệ (KH&CN) nhằm phát triển năng lực nghiên cứu và sáng tạo của quốc

gia. Theo bài viết của (Toàn, 2018), hướng đi của giải pháp này được đề xuất là xây

dựng một Cơ sở tri thức thay vì Cơ sở dữ liệu về KH&CN, vì khi nói đến cơ sở dữ liệu

chúng ta thường nghĩ đến việc sử dụng một cách bị động nguồn dữ liệu đó theo dạng

tìm kiếm, tra cứu. Hiện tại các kỹ thuật xử lý dữ liệu không chỉ dừng ở việc phục vụ tìm

kiếm tra cứu thông tin mà còn giúp hiểu sâu sắc hơn về dữ liệu, phát hiện ra các mối

quan hệ giữa các thực thể dữ liệu, để gợi ý các hành động và quyết định với dữ liệu.

Cơ sở dữ liệu Quốc gia về KH&CN được coi là một phần của Đề án “Phát triển

Hệ tri thức Việt số hóa” được phê duyệt theo Quyết định số 677/QĐ-TTg ngày 18 tháng

5 năm 2017 của Thủ tướng Chính phủ. Đây là một trong các hoạt động cụ thể nhằm triển

khai Chỉ thị 16/CT-TTg của Thủ tướng Chính phủ về tăng cường năng lực tiếp cận cuộc

Cách mạng công nghiệp lần thứ tư. Vào tháng 01/2018, tại Hà Nội, Đề án đã được chính

thức khởi động với thông điệp “Chia sẻ tri thức - Cổ vũ sáng tạo - Kết nối cộng đồng – Vì tương lai Việt Nam”. Mục tiêu của Đề án là nhằm xây dựng nền tảng hạ tầng dữ liệu

và tri thức trong các lĩnh vực, đặc biệt là những lĩnh vực liên quan trực tiếp đến đời sống của người dân như giáo dục, y tế, chăm sóc sức khỏe, nông nghiệp, văn hóa… nhằm tạo

điều kiện cho học tập, làm chủ tri thức, nghiên cứu và phát triển các ứng dụng công nghệ thông tin trên nền tảng AI và Big Data phục vụ cho cộng đồng và xã hội.

Các dữ liệu và tri thức được kết nối và chia sẻ với cấp số nhân, được phổ biến nhanh chóng và rộng rãi sẽ xoá bỏ khoảng cách số, tạo cơ hội để mọi người tiếp cận sử

dụng, tạo ra giá trị gia tăng cho cả cộng đồng. Đây là cốt lõi để triển khai phát triển hệ

thống đổi mới sáng tạo quốc gia, thúc đẩy khởi nghiệp sáng tạo trong mọi ngành, lĩnh

vực, khơi dậy niềm đam mê và khát vọng sáng tạo, nhất là thế hệ trẻ (Cục thông tin

Khoa học và Công nghệ Quốc gia - Bộ KHCN , 2018). Tuy nhiên, cho đến nay, hệ Tri

35

thức Việt số hoá mới ra mắt được một số ứng dụng như: Nền tảng nhân đạo số

inhandao.vn, Bản đồ chung sống an toàn Covid (antoancovid.vn), Nền tảng giáo dục số

- iGiaoduc.vn, Bách khoa toàn thư Việt Nam – bktt.vn; Còn chưa có ứng dụng nào dành riêng cho DN.

Ngoài ra, Cục công nghiệp – Bộ Công thương cũng đã xây dựng Hệ thống dữ liệu ngành công nghiệp hỗ trợ Việt Nam, trong đó tập trung vào Hệ thống Cơ sở dữ liệu

về nhân lực tư vấn. Hệ thống này cung cấp dịch vụ tư vấn cho các doanh nghiệp sản

xuất sản phẩm hoàn chỉnh và công nghiệp hỗ trợ (CNHT) Việt Nam, bao gồm:

- Cung cấp thông tin các chuyên gia tư vấn, bao gồm thông tin cơ bản thể hiện

năng lực chuyên môn, trình độ và kinh nghiệm tư vấn trong lĩnh vực công nghiệp.

- Cung cấp thông tin doanh nghiệp, tổ chức tư vấn: Thông tin của doanh nghiệp,

tổ chức tư vấn cùng năng lực, lĩnh vực chuyên môn và đội ngũ nhân sự, chuyên gia tư vấn, và tổ chức tư vấn.

- Tạo kênh thông tin để kết nối với chuyên gia tư vấn, đơn vị cung cấp dịch vụ tư

vấn với doanh nghiệp sản xuất sản phẩm hoàn chỉnh và công nghiệp hỗ trợ Việt Nam

(Cục công nghiệp Việt Nam, 2019).

Tuy nhiên, hệ thống này chỉ dừng lại việc cung cấp thông tin của các chuyên gia

về lĩnh vực công nghiệp đang sinh sống tại Việt Nam.

Bên cạnh đó, tại Bình Định, vào cuối năm 2019, Liên hiệp các Hội Khoa học và

Kỹ thuật (KH&KT) tỉnh đã xây dựng, thiết kế hoàn chỉnh Hệ thống quản lý cơ sở dữ

liệu trí thức, nhà khoa học, thu thập và cập nhật hơn 300 chuyên gia trên 10 lĩnh vực

khác nhau. Hệ thống đã phục vụ hiệu quả công tác quản lý, huy động các nhà khoa học

góp phần hiệu quả trong công tác tư vấn, phản biện, giám định xã hội và một số hoạt động khác trong tỉnh. Thêm nữa, giải pháp cũng góp phần thu hút, tìm kiếm các nhà

khoa học có nhiều ý tưởng, giải pháp nhằm hỗ trợ phát triển kinh tế, xã hội của Bình Định (Liên hiệp các Hội Khoa học và Kỹ thuật Bình Định, 2020).

Hệ thống VietSearch là một hệ thống CSDL tri thức chuyên gia khá đặc biệt hiện nay, bởi hệ thống này hướng đến nguồn dữ liệu chuyên gia người Việt nhưng sống tại nước ngoài. Đây là nguồn lực vô cùng quý giá mà nhà nước Việt Nam, các DN và người

dân có thể tiếp cận. VietSearch được thành lập năm 2017, với mục tiêu xây dựng một ứng dụng dựa trên nền tảng công nghệ mới hỗ trợ tìm kiếm, khai thác và phát huy tiềm năng của cộng đồng người Việt toàn cầu. Hệ thống gồm các chức năng tìm kiếm chuyên gia, dịch vụ, sự kiện, tin tức của cộng đồng Kiều bào. Tác giả nhận thấy đây là một hệ thống hết sức phù hợp để hỗ trợ các DNNVV có thể cập nhật, tiếp cận và hợp tác để hỗ

36

trợ DN phát triển hoạt động kinh doanh của mình. Tuy nhiên, hệ thống mới chỉ dừng lại

ở việc cung cấp thông tin chuyên gia Việt ở nước ngoài, cùng với các thông tin chung

khác về DN, dịch vụ, sự kiện ở nước ngoài. Còn nhu cầu thực sự của DN với các chuyên gia này là gì thì chưa thể đánh giá cụ thể được.

Có thể thấy rằng, sự quan tâm đến các hệ thống dữ liệu tri thức nói chung và dữ liệu chuyên gia nói riêng đã được thể hiện rất rõ trong các chính sách và nỗ lực của các

tổ chức, các bộ ban ngành. Tuy nhiên, thực tế cũng chỉ ra những hạn chế rõ rệt trong

việc quản lý thông tin chuyên gia ở Việt Nam. Thời điểm này, Việt Nam chưa có một

CSDL chuyên gia đồng bộ, thống nhất, và chủ yếu là các CSDL rời rạc, không được kết nối với nhau. Điều này gây khó khăn trong việc tìm kiếm chuyên gia cũng có thể gây

lãng phí trong việc tận dụng nguồn tài sản tri thức của đất nước. Từ đó NCS nhận thấy,

cần có giải pháp giúp quản lý thông tin chuyên gia tại Việt Nam hiệu quả hơn. Đặc biệt

là thực hiện nghiên cứu sâu về Hệ thống tìm kiếm chuyên gia cho DN tại Việt Nam.

1.1.4. Khoảng trống nghiên cứu

Có thể nhận thấy, có khá nhiều nghiên cứu về hệ tìm kiếm chuyên gia trên thế

giới, tuy nhiên các bài viết chủ yếu tập trung về vấn đề kỹ thuật để xây dựng hệ thống,

hoặc ứng dụng của hệ thống tìm kiếm chuyên gia trong các nền tảng như cộng đồng hỏi

đáp, bên trong doanh nghiệp và lĩnh vực học thuật. Những nghiên cứu tập trung vào vấn

đề phát triển hệ thống tìm kiếm chuyên gia cho DN, đặc biệt là tìm kiếm chuyên gia

người Việt phục vụ nhu cầu tìm nguồn nhân lực chuyên gia cho DNNVV tại Việt Nam

là khá ít. Bên cạnh đó, việc quản lý thông tin chuyên gia hiện nay cũng còn nhiều điểm

bất hợp lý và chưa thống nhất, gây khó khăn cho các hoạt động tìm kiếm và kết nối với

chuyên gia.

Từ những khoảng trống được phát hiện trong quá trình làm tổng quan nghiên cứu

và phân tích hiện trạng thực tiễn tại Việt Nam, NCS lựa chọn một số khoảng trống phù

hợp với bối cảnh tại Việt Nam để tiến hành nghiên cứu chuyên sâu và hỗ trợ giải quyết bài toán tìm kiếm chuyên gia cho DNNVV, như sau:

 Khoảng trống 1: Hiện nay, việc quản lý thông tin chuyên gia tại Việt Nam còn cục bộ, riêng lẻ và chưa có sự liên giữa các tổ chức, doanh nghiệp với CSDL chung của quốc gia. Vì thế, cần thực hiện nghiên cứu sâu hơn về vấn đề này và

đưa ra giải pháp để kết nối dữ liệu về chuyên gia, cũng như quản lý các dữ liệu này, phục vụ hoạt động tìm kiếm của doanh nghiệp một cách hiệu quả hơn.

 Khoảng trống 2: Có rất ít các nghiên cứu chuyên sâu về việc phát triển hệ tìm kiếm chuyên gia từ cả bên trong và bên ngoài cho doanh nghiệp, đặc biệt là phát

37

triển hệ thống dành riêng cho đối tượng là DNNVV. Vì thế, đây có thể coi là một

hướng nghiên cứu khá mới tại Việt Nam cũng như trên thế giới. Việc đề xuất một

kiến trúc tham khảo hệ thống tìm kiếm chuyên gia cho DNNVV sẽ góp phần giải quyết khoảng trống từ lý thuyết, và là đóng góp mới về mặt lý thuyết trong lĩnh

vực truy xuất thông tin của ngành HTTT.

 Khoảng trống 3: Trong quá trình thực hiện tổng quan nghiên cứu về các phương pháp đánh giá được sử dụng trong các bài toán về tìm kiếm chuyên gia, chủ yếu

là các phương pháp để đánh giá thuật toán hoặc mô hình cụ thể, còn ít nhắc đến

việc đánh giá mô hình kiến trúc hệ thống hoặc đánh giá việc chấp nhận sử dụng hệ thống. Vì thế, trong phạm vi luận án này, NCS đề xuất sử dụng thêm hai

phương pháp đánh giá, bổ sung cho những phương pháp đã được dùng trong các

nghiên cứu trước. (1) là sử dụng phương pháp nghiên cứu khoa học thiết kế và

phương pháp FAAM để đánh giá kiến trúc hệ thống, và (2) là phương pháp đánh

giá mô hình chấp nhận và sử dụng công nghệ hợp nhất (UTAUT) áp dụng trong

quá trình đánh giá thử nghiệm hệ thống tìm kiếm chuyên gia. Đây cũng là một

trong những đóng góp bổ sung cho lý thuyết và thực nghiệm của lĩnh vực nghiên

cứu này.

Ba khoảng trống này tương ứng với bốn câu hỏi nghiên cứu mà NCS đã trình bày

trong phần mở đầu của luận án.

1.2. Cơ sở lý luận

1.2.1. Chuyên gia

1.2.1.1. Khái niệm

Có khá nhiều khái niệm về chuyên gia được các nhà nghiên cứu đề xuất, trong

đó “chuyên gia” là biểu thị của một người có kiến thức, kỹ năng hoặc năng lực được đánh giá là vượt trội so với những người khác (Chi & cộng sự, 1988). Một chuyên gia được xác định bởi khả năng của họ để thực hiện các nhiệm vụ mà một người không phải chuyên gia sẽ không thể làm được, và bởi một xã hội mà ở đó chức danh chuyên gia được phong cho họ (Agnew & cộng sự, 1994). Từ “chuyên gia” mang nhiều ý nghĩa và việc sử dụng nó thường phụ thuộc vào hoàn cảnh sử dụng, nhận thức của người sử dụng và người được mô tả (Allen, 2020).

Theo Hoffman (1998) việc thiết lập một định nghĩa cụ thể, chính xác về “chuyên

gia” gặp khá nhiều khó khăn, điều này phụ thuộc vào bối cảnh, nghề nghiệp và lĩnh vực chuyên môn. Dựa trên thang đo mức độ thành thạo của nghệ nhân thủ công thời Trung

38

cổ, ông cho rằng, chuyên gia là những người xuất sắc, được đánh giá cao, có những

phán đoán chính xác và đáng tin cậy, có kỹ năng và đem lại hiệu quả kinh tế cao, có

khả năng giải quyết hoặc đối phó với một số khó khăn. Ngoài ra, chuyên gia cũng là người có các kỹ năng hoặc kiến thức đặc biệt thu được từ kinh nghiệm dày dặn về một

hoặc một vài lĩnh vực cụ thể (Hoffman, 1998). Các chuyên gia có nhận thức khác với những người không phải là chuyên gia. Họ nhìn thấy nhiều điều trong một tình huống

hơn bằng cách chú ý đến những dấu hiệu mà một người bình thường sẽ bỏ lỡ (Mosier &

cộng sự, 2018). Cần có thời gian để tiếp thu kiến thức chuyên môn, và số năm kinh

nghiệm là một trong những tiêu chí quan trọng để đo lường chuyên môn của một chuyên gia (Ericsson, 1996). Trong đó, Ericsson (1996) gợi ý rằng hiệu suất cao nhất của chuyên

gia trong bất kỳ lĩnh vực nhất định sẽ có được sau khoảng thời gian. Tuy nhiên, thành

tích về chuyên môn không chỉ dành riêng cho một người cụ thể nào, vì bất kỳ ai cũng

có thể đạt được sự xuất sắc trong một lĩnh vực bất kỳ (Ericsson & Pool, 2016). Về bản

chất, các chuyên gia là những người xuất sắc trong việc tích lũy kiến thức trong lĩnh vực

của họ, và theo thời gian trở thành những bậc thầy được công nhận kết quả, trong đó

họ đạt được mức hiệu suất công việc cao hơn so với người mới làm nghề (Horn &

Masunaga, 2006).

Nhóm đặc điểm của chuyên gia trong một tổ chức có thể chia thành 3 nhóm

chính: Kỹ năng (khả năng của chuyên gia), sự cam kết (mạng lưới chuyên môn) và sự

đánh giá (giá trị của chuyên gia) (Holtskog, 2017).

Từ những khái niệm và cách hiểu về chuyên gia như trên, NCS nhận thấy có một

số tiêu chí chung để xác định chuyên gia trong một lĩnh vực bao gồm:

 Có kiến thức chuyên sâu, kỹ năng trong một lĩnh vực cụ thể (được thể hiện thông qua bằng cấp, chứng chỉ trong một ngành nghề, lĩnh vực/ các tài liệu, bài báo đã

công bố, xuất bản/ các dự án đã tham gia, v.v.)

 Có kinh nghiệm làm việc trong lĩnh vực cụ thể tại một tổ chức, doanh nghiệp có

uy tín

 Được cộng đồng trong lĩnh vực công nhận (thông qua các giải thưởng/chức vụ/sự

tôn vinh/mạng lưới cộng tác, v.v.)

1.2.1.2. Tiêu chí xác định chuyên gia

Trên thế giới, các tiêu chí để xác định chuyên gia được khá nhiều tổ chức quan

tâm và công bố. Điển hình như Cơ quan kiểm soát và đảm bảo chất lượng giáo dục đại

39

học của Montenegro1 đã đưa ra bộ tiêu chí cho Chuyên gia học thuật và Chuyên gia trong lĩnh vực thị trường lao động. Trong đó, Chuyên gia học thuật cần: Sở hữu chức

danh khoa học; có chuyên môn và được đào tạo trong các lĩnh vực liên quan; có kinh nghiệm làm việc trong các lĩnh vực; kinh nghiệm ở vị trí quản lý tại các cơ sở giáo dục

đại học/ các cơ quan có liên quan trong lĩnh vực chuyên môn; kinh nghiệm tham gia các dự án trong lĩnh vực chuyên môn; có các giải thưởng/sự công nhận/thành tựu quan trọng

trong lĩnh vực chuyên môn; kiến thức về tiếng Anh và các ngôn ngữ khác.

Chuyên gia trong lĩnh vực thị trường lao động các tiêu chí yêu cầu ít hơn, tập

trung vào kinh nghiệm làm việc trong các lĩnh vực và tổ chức liên quan. Ngoài ra, không yêu cầu về việc tham gia các dự án hoặc có các giải thưởng trong lĩnh vực.

Trong cuốn sách thực hiện dưới sự uỷ quyền của Bộ Y tế và Chăm sóc xã hội

Hoa Kỳ ban hành, đã chỉ ra tiêu chí lựa chọn chuyên gia tiềm năng trong lĩnh vực y học, bao gồm: sự công nhận của đồng nghiệp, kiến thức chuyên môn hoặc kinh nghiệm lâm

sàng, công việc hiện tại trong lĩnh vực liên quan, và các kết quả nghiên cứu (Bojke &

cộng sự, 2021).

Trong dự án ENERI2 của uỷ ban Châu Âu EU nhằm mục đích tăng cường trao đổi kiến thức xuyên quốc gia trong các lĩnh vực về đạo đức nghiên cứu và tính toàn vẹn

nghiên cứu, đã đề xuất tiêu chí của các chuyên gia làm nhiệm vụ đánh giá về đạo đức

của các dự án nghiên cứu: Năng lực đạo đức; Kinh nghiệm nghiên cứu khoa học; Năng

lực pháp lý; Kinh nghiệm đánh giá/xem xét đạo đức. Ngoài ra còn cần các các kỹ năng

cứng (ví dụ như giáo dục, kỹ thuật, phân tích), kỹ năng mềm (ví dụ như giao tiếp, quan

hệ giữa các cá nhân), kỹ năng xử lý (ví dụ như hành chính, quản lý) và kỹ năng cảm xúc

(cam kết, cởi mở).

Bên cạnh đó, ở trong nước cũng có một số tổ chức/đơn vị đã tiến hành nghiên

cứu về các tiêu chí để lựa chọn chuyên gia. Trong đó, việc đưa ra các tiêu chí xác định chuyên gia thường gắn liền với việc xây dựng CSDL chuyên gia của các tổ chức.

1 https://akokvo.me/en/criteria-for-the-experts-list-selection/ 2 https://eneri.eu/criteria-for-expertise-in-reri/

Theo Quyết định số 588/QĐ-BKHCN về việc xây dựng, quản lý và sử dụng CSDL chuyên gia của Bộ Khoa học và Công nghệ, có đưa ra tiêu chí về chuyên gia khoa học công nghệ, bao gồm:

40

- Trình độ và kinh nghiệm nghiên cứu khoa học và công nghệ: Học vị, chức danh,

bằng cấp: Tiến sĩ, Phó Giáo sư, Giáo sư, nghiên cứu viên cao cấp, hoặc phải tốt nghiệp

đại học và có thêm tiêu chí về năng lực chuyên môn cụ thể, với ít nhất 5 năm kinh nghiệm nghiên cứu.

- Năng lực chuyên môn (đáp ứng ít nhất 1 tiêu chí): Chủ trì nhiệm vụ khoa học; Xuất bản bài báo; Hướng dẫn nghiên cứu sinh hoặc chủ biên sách chuyên khảo; Giải

thưởng khoa học và công nghệ; Bằng sáng chế;

- Có phẩm chất đạo đức (Bộ Khoa học và Công nghệ, 2014)

Ngoài ra, Viện Khoa học Đo đạc và Bản đồ khi thực hiện xây dựng hệ thống tiêu chí xác định chuyên gia trong lĩnh vực tài nguyên và môi trường đã chỉ ra 4 tiêu chí sau:

- Trình độ: Ngoài học vị và chức danh như Tiến sỹ, Giáo sư/Phó Giáo sư, còn có

thêm một số chức danh nghề nghiệp như Chuyên viên/giảng viên cao cấp, chuyên

viên/giảng viên/kỹ sư/nghiên cứu viên chính.

- Kinh nghiệm: Có kinh nghiệm nghiên cứu trong lĩnh vực tài nguyên môi trường.

- Năng lực chuyên môn: Chủ nhiệm các nhiệm vụ khoa học, bài báo khoa học,

hướng dẫn NCS/học viên cao học, tác giả sách, sở hữu trí tuệ, giải thưởng khoa học,

v.v.trong 5 năm tính đến thời điểm tham gia CSDL.

- Phẩm chất đạo đức (Dũng & cộng sự, 2018)

1.2.1.3. Chuyên gia trong các tổ chức nói chung và DNNVV nói riêng

Theo Balog & cộng sự (2012), chúng ta sẽ cần đến chuyên gia khi cần một ai đó

chỉ đường để giải quyết vấn đề. Các chuyên gia không chỉ được mời tham gia tư vấn,

mà còn để được giao một số vai trò hoặc công việc trong một doanh nghiệp, tổ chức. Ví

dụ: đơn vị tổ chức hội nghị/hội thảo có thể tìm kiếm các nhóm chuyên gia để hỗ trợ đánh giá bài viết, các công ty có thể mời các chuyên gia tham gia công tác tuyển dụng tìm kiếm những nhân viên tài năng, hay các doanh nghiệp có thể thuê các chuyên gia tới điều hành, giải quyết các vấn đề về việc giảm nguy cơ mất khách hàng. Nhu cầu về việc tìm kiếm chuyên gia rất quan trọng trong nhiều bối cảnh kinh doanh khác nhau. Giả sử DN muốn tập hợp một nhóm để phát triển các loại sản phẩm mới, sử dụng các công nghệ mới, hoặc tìm kiếm nhân sự cho các dự án tại một thị trường mới, v.v. khi đó sẽ

cần các chuyên gia có chuyên môn phù hợp. Bên cạnh đó, DN cũng có nhu cầu trong việc đào tạo, nâng cao năng lực cho nhân viên, tư vấn kinh doanh, hoặc tìm kiếm nhà lãnh đạo nhằm đổi mới hoặc tháo gỡ các khó khăn cho DN.

41

Nghiên cứu về các phương pháp chia sẻ kiến thức chuyên môn đã bắt nguồn từ

những năm 1960, khi các nghiên cứu về thư viện và khoa học thông tin nhằm mục đích

khám phá những nguồn thông tin mà các đối tượng như các nhà nghiên cứu và kỹ sư sử dụng (Menzel, 1960).

Từ đó đến nay, sức mạnh của kiến thức chuyên môn trong các xã hội hiện đại và trong các tổ chức đã được rất nhiều nhà nghiên cứu quan tâm và thực hiện các nghiên

cứu chuyên sâu. Tri thức của chuyên gia được coi là nguồn lực quyết định trong việc

tạo ra giá trị của tổ chức và coi các chuyên gia như những tác nhân có ảnh hưởng trong

việc ra quyết định của tổ chức. Trong các nghiên cứu về doanh nghiệp nhỏ, Chrisman & McMullan (2004) đã điều tra cách thức hỗ trợ từ bên ngoài, trong đó có sự hỗ trợ từ

các chuyên gia tư vấn giúp cải thiện khả năng của các chủ doanh nghiệp nhỏ. Các phát

hiện cho thấy kiến thức chuyên môn của chuyên gia tư vấn gồm hai phần: kiến thức kinh

doanh và kiến thức kinh nghiệm. Trong đó, kiến thức kinh doanh của chuyên gia tư vấn

giúp người quản lý các vấn đề liên quan đến lưu trữ hồ sơ, chuẩn bị kế hoạch kinh doanh

và hiểu biết về tài chính, còn kiến thức kinh nghiệm giúp các chủ doanh nghiệp liên kết

với các mạng lưới kinh doanh và các ngành khác nhau (Abeysekera, 2020). Các doanh

nghiệp không ngừng tìm kiếm và thu hút nhân lực tài năng, nhân lực chuyên gia từ bên

ngoài. Theo (Chambers & cộng sự, 1998), có đến 31% giám đốc nhân sự tại các công ty

hàng đầu cho biết rằng họ luôn tìm kiếm những nhân sự tài năng và sẵn sàng mời những

chuyên gia này về làm việc bất kỳ khi nào tìm thấy.

Có thể tổng kết những hoạt động trong DN thường cần sự tham gia của các

chuyên gia, bao gồm:

● Hỗ trợ doanh nghiệp mới thành lập và hỗ trợ lãnh đạo doanh nghiệp

● Đào tạo nâng cao trình độ nhân viên

● Tư vấn giải pháp, công nghệ, tháo gỡ khó khăn cho doanh nghiệp

● Hỗ trợ hoạt động bên trong doanh nghiệp như: lập kế hoạch, tài chính, phát triển

sản phẩm mới, dự án mới, kết nối mạng lưới kinh doanh, v.v.

Như vậy, có thể nhận thấy rằng, vai trò của chuyên gia trong các tổ chức nói

chung và DNNVV nói riêng là quan trọng và cần thiết.

1.2.2. Hệ tìm kiếm chuyên gia

1.2.2.1. Khái niệm

Hiện nay, khi mà các tổ chức trở nên đa dạng hơn và phân bố ở nhiều vị trí địa lý khác nhau, cùng với đó là độ phức tạp của công việc tăng lên, do đó nhiều công việc

42

cần hỗ trợ tích hợp kiến thức từ nhiều nguồn kiến thức chuyên môn cũng như kết nối

nhiều địa điểm khác nhau. Điều này trở nên khó giải quyết hơn bởi các hạn chế về quyền

riêng tư, việc chia sẻ thông tin và khả năng kết nối đến các chuyên gia. Vì thế, trong nhiều tổ chức, nhu cầu tìm kiếm trợ giúp hoặc cộng tác, cũng như sự hợp tác giữa các

nhóm làm việc và cộng đồng thực hành ngày càng xuất hiện nhiều hơn (Golzadeh & cộng sự, 2024).

Hoạt động tìm kiếm áp dụng cho cả các chiến lược tìm kiếm thủ công dựa trên

các mối quan hệ cá nhân, cũng như các phương pháp tự động để xây dựng những công

cụ tìm kiếm. Mặc dù việc tìm kiếm không hoàn toàn phù hợp với mô hình trả lời truy vấn được sử dụng trong truy xuất thông tin truyền thống, nhưng nó gợi ra một loạt các

phương pháp giúp định vị chuyên gia; trong đó những người tìm kiếm chuyên gia thường

mong muốn chuyên gia sẽ là người hỗ trợ giải quyết vấn đề cũng như hỗ trợ quy trình

làm việc của tổ chức (D'Amore, 2008). Những hệ thống có nhiệm vụ như thế này có thể

gọi là Hệ tìm kiếm chuyên gia (Expert Finding System - EFS), Hệ định vị chuyên

môn/chuyên gia (Expertise Location Systems - ELS) hay hệ thống truy xuất chuyên môn

(Expertise Retrieval - ER), v.v..

Theo Maybury (2006), “Hệ tìm kiếm chuyên gia là hệ thống cho phép người dùng

khám phá các chuyên gia về chủ đề cụ thể, để thuê hoặc tiếp thu kiến thức của họ”.

Bên cạnh đó, Yimam-Seid & Kobsa (2009) thì cho rằng, Hệ thống tìm kiếm

chuyên gia là một hệ thống máy tính tích lũy tất cả kiến thức, tài liệu và những thông

tin khác liên quan đến chuyên gia (bao gồm cả thông tin không được lưu trữ trên tài

liệu), trong một tổ chức hoặc trên toàn thế giới, với mục đích là tìm kiếm chuyên gia về

một vấn đề nhất định. Vấn đề này có thể phục vụ hai nhu cầu chính: tìm chuyên gia để bổ sung thông tin (nhu cầu thông tin) hoặc tìm chuyên gia để thực hiện một chức năng

nhất định (nhu cầu chuyên môn).

1.2.2.2. Phân loại

Thông qua việc tổng hợp các nghiên cứu về hệ thống tìm kiếm chuyên gia, nếu phân loại theo phạm vi của tổ chức/doanh nghiệp, thì có thể chia hệ tìm kiếm chuyên gia thành 2 loại chính: (1) Hệ tìm kiếm chuyên gia theo quan điểm của tổ chức (chuyên gia là nhân viên trong tổ chức) và (2) Hệ tìm kiếm chuyên gia theo quan điểm xã hội

(chuyên gia là người bên ngoài tổ chức). Với loại (1), thường dùng trong các DN, tổ chức có quy mô lớn, khi họ có mong muốn tìm đúng nhân viên có kỹ năng và kiến thức phù hợp cho một dự án hoặc công việc cụ thể. Điều này thường rất quan trọng đối với sự thành công của các dự án đang được thực hiện (Balog & cộng sự, 2006). Loại (2)

43

thường phù hợp với các DNNVV, thường thực hiện tìm kiếm chuyên gia là những người

bên ngoài tổ chức, để phục vụ cho nhiều mục đích khác nhau như tìm chuyên gia đầu

ngành cho các hội thảo, giới thiệu chuyên gia tư vấn hoặc thực hiện một dự án, hay phục vụ công tác đào tạo cho doanh nghiệp (Al-Taie & cộng sự, 2018).

Đối với loại (1), đã có khá nhiều các nghiên cứu về vấn đề này với mục đích chia sẻ tri thức giữa các nhân viên trong môi trường tổ chức, doanh nghiệp (Huber, 1999;

Maybury, 2006; Yimam-Seid & Kobsa, 2003). Vì thế, trong khuôn khổ luận án, NCS

sẽ lựa chọn nghiên cứu về hệ thống tìm kiếm chuyên gia kết hợp cả loại (1) và (2) với

mục đích tìm kiếm các chuyên gia từ cả bên trong và bên ngoài doanh nghiệp, nhằm hỗ trợ DNNVV giải quyết bài toán nguồn nhân lực chuyên gia hiện nay.

(1) Hệ tìm kiếm chuyên gia theo quan điểm của tổ chức

Với sự ra đời của mạng nội bộ doanh nghiệp và các hệ thống theo dõi công việc, việc tìm kiếm chuyên gia đang trở thành một công cụ hỗ trợ quản lý tri thức (KM)

(Reichling & Veith, 2005). Tuy nhiên, trong khi phần lớn công việc KM ban đầu tập

trung vào việc khai thác kho thông tin lớn, thì việc tìm kiếm chuyên gia lại chuyển trọng

tâm từ tài liệu sang con người và các hoạt động liên quan. Ackerman và Halverson

(2003) đã xác định 4 hướng kỹ thuật để giải quyết vấn đề phát hiện kiến thức chuyên

môn của chuyên gia bao gồm: kho lưu trữ, công cụ định vị chuyên gia, máy tính và các

nhóm triển khai để làm cho kiến thức có thể truy cập được và tạo ra nhận thức về nhu

cầu chuyên gia.

Từ góc độ doanh nghiệp, điều này gợi ý một cách thức thiết kế trong đó các cơ

chế chia sẻ kiến thức chuyên môn có thể hoạt động độc lập hoặc theo một kiểu tích hợp

nào đó sao cho các hướng kỹ thuật của Ackerman và Halverson xem như các yếu tố thiết kế có liên quan đến nhau được sử dụng để xây dựng các hệ thống kết hợp . Những hệ

thống này bao gồm các công cụ định vị chuyên gia được triển khai với vai trò kết nối mọi người dựa trên nhu cầu chuyên gia, hay các mô hình giúp tìm kiếm người hỗ trợ trong không gian làm việc ảo.

Các kiến trúc khác nhau có thể hỗ trợ các hoạt động tìm kiếm chuyên gia; tối ưu hóa thiết kế phụ thuộc vào môi trường hoạt động và văn hóa. Tuy nhiên, có thể xác định khung nghiên cứu để giải quyết vấn đề tìm kiếm chuyên gia trong tổ chức bao gồm các

giai đoạn sau:

 Xác định nhu cầu (hoặc nhận dạng vấn đề): Người dùng nhận ra nhu cầu cần trợ

giúp hoặc cộng tác với các chuyên gia.

44

 Cụ thể hoá nhu cầu: Người dùng sẽ chuyển nhu cầu thành chiến lược tìm kiếm

cụ thể

 Nhận dạng chuyên gia (hoặc kiến thức chuyên môn): Thông tin tìm kiếm sẽ được

so khớp với các hồ sơ, nhằm tìm ra ứng viên chuyên gia phù hợp nhất.

 Lựa chọn chuyên gia: Các chuyên gia ứng viên được lựa chọn dựa trên xếp hạng chuyên môn hoặc các tiêu chí liên quan đến nhiệm vụ như tính khả thi, kinh

nghiệm hoặc chi phí.

 Lập kế hoạch: Các chuyên gia được lựa chọn sẽ được sắp xếp các vai trò hoặc

nhiệm vụ cụ thể trong doanh nghiệp.

 Thực hiện nhiệm vụ: Các chuyên gia áp dụng kiến thức và kỹ năng vào nhiệm

vụ được giao.

 Theo dõi/Phản hồi: Hiệu quả công việc được theo dõi và đánh giá. Các thước đo hiệu suất cung cấp phản hồi cho các giai đoạn trước đó làm cơ sở để cải thiện hồ

sơ chuyên gia, hiệu suất tìm kiếm hoặc các hoạt động khác (D'Amore, 2008).

(2) Hệ tìm kiếm chuyên gia theo quan điểm xã hội

Trên thực tế, nhu cầu tìm kiếm chuyên gia không chỉ giới hạn trong phạm vi một

tổ chức. Có nhiều hoạt động cần sự trợ giúp của chuyên gia ở những doanh nghiệp, vị trí việc làm và vị trí địa lý khác nhau. Thậm chí, sự trợ giúp không chỉ từ một người mà

cần của cả một nhóm người với nguồn kiến thức chuyên môn sâu rộng. Vì thế, nhu cầu

tìm kiếm chuyên gia từ bên ngoài đã xuất hiện. Tuy nhiên, việc tìm kiếm ý kiến từ “tập

thể” chuyên gia là một vấn đề khó khăn, phức tạp do sự phân tán về địa lý cũng như

kiến thức chuyên môn và những ràng buộc về văn hoá. Điều này sẽ ảnh hưởng đến hiệu

quả tổ chức trong việc hoà nhập của chuyên gia với nhân viên trong tổ chức, trong việc

chia sẻ kiến thức và hợp tác (Dixon, 2000).

Việc tìm kiếm chuyên gia từ bên ngoài sẽ có tác động trên phạm vi rộng, trải rộng trên nhiều lĩnh vực, môi trường làm việc và các nền văn hóa đa dạng. Điều này thúc đẩy

một quan điểm xã hội: xem các chuyên gia kết nối thành một mạng lưới chuyên môn. Việc tìm kiếm chuyên gia sẽ không chỉ tập trung vào một người có những kiến thức chuyên môn và kinh nghiệm gì, mà cần phải xem xét thêm các mối quan hệ xã hội của

họ (Li và cộng sự, 2006). Cấu trúc đồ thị thường được dùng trong trường hợp này (Wu

& cộng sự, 2024).

45

1.2.2.3. Một số vấn đề liên quan hệ tìm kiếm chuyên gia

Yêu cầu của hệ tìm kiếm chuyên gia

Đã có một số nghiên cứu về yêu cầu của hệ tìm kiếm chuyên gia hỗ trợ cho các hoạt động của tổ chức. Theo nghiên cứu của Singh & cộng sự (2013), khả năng nhanh

chóng xác định các chuyên gia trong từng lĩnh vực là điều cần thiết cho hoạt động của tổ chức. Tuy nhiên, việc xác định vị trí và đánh giá xem chuyên gia nào phù hợp với

nhu cầu DN là một nhiệm vụ khó khăn, vì thông tin các chuyên gia khá ít và không được

phân bổ đồng đều, trong khi yêu cầu của những người tìm kiếm thường không được

trình bày một cách rõ ràng. Bên cạnh đó, thông tin về kết quả hoạt động trong quá khứ của các chuyên gia không đầy đủ, rất khó phân loại và định lượng chuyên môn. Việc

các chuyên gia chuyển đổi vị trí việc làm, lĩnh vực nghiên cứu cũng làm phức tạp thêm

nhiệm vụ xác định chuyên gia theo lĩnh vực. Thêm nữa, một số vấn đề phức tạp thường đòi hỏi trí tuệ tổng hợp của nhiều đối tượng chuyên gia khác nhau. Vì vậy, cần phải phát

triển một hệ thống thông tin để tìm kiếm các chuyên gia. Sự phát triển trong lĩnh vực

này có thể làm giảm thời gian giải quyết các vấn đề, từ đó nâng cao hiệu quả tổng thể

của một tổ chức (Singh & cộng sự, 2013).

Việc nghiên cứu về các hệ thống tìm kiếm chuyên gia để giải quyết vấn đề cho

một tổ chức cũng được trình bày ở một số tài liệu khác của (Maybury, 2006; Yimam-

Seid & Kobsa, 2003). Theo các nghiên cứu này, các tổ chức, DN có thể lựa chọn tự xây

dựng hệ thống, trong đó quy trình xây dựng hệ tìm kiếm chuyên gia thường bao gồm

các bước: (1) Khám phá, tìm kiếm kiếm chuyên gia trong các lĩnh vực chuyên sâu, (2)

Xem xét, phân tích các hệ thống hiện có trong lĩnh vực này, (3) Đề xuất mô hình hỗ trợ

cho việc thiết kế và phát triển hệ thống mới (Yimam-Seid & Kobsa, 2003). Ngoài ra, các tổ chức cũng có thể sử dụng một số dịch vụ và giải pháp thương mại có sẵn để tìm

kiếm chuyên gia (Maybury, 2006).

Xây dựng hệ tìm kiếm chuyên gia

Theo Singh & cộng sự (2013), một hệ thống tìm kiếm chuyên gia lý tưởng nên

thỏa mãn những yêu cầu sau:

- Nên cập nhật thông tin dễ dàng và hiệu quả mà không cần người dùng can thiệp

nhiều.

- Nên được phân loại theo từng lĩnh vực cụ thể.

- Nên cung cấp thông tin về các hoạt động trong quá khứ (kinh nghiệm) của chuyên gia.

- Nên định lượng về chuyên môn và xếp hạng chuyên gia.

46

- Nên dựa trên những nguồn thông tin xác thực.

- Nên hình thành các nhóm cộng tác chuyên gia.

- Nên xác định các chuyên gia sẵn có tại doanh nghiệp/tổ chức hoặc khu vực trước

khi tìm kiếm từ bên ngoài.

Những hoạt động mà hệ tìm kiếm chuyên gia cần thực hiện

Theo tổng hợp từ 96 nghiên cứu có liên quan đến hệ tìm kiếm chuyên gia, Husain

& cộng sự (2019) đã chỉ ra một số vấn đề mà hoạt động tìm kiếm chuyên gia thường

thực hiện bao gồm:

 Xác định nguồn dữ liệu để phát hiện chuyên gia: Trích xuất dữ liệu và thông tin liên quan đến kiến thức chuyên môn, từ đó có thể phát hiện ra các chuyên gia.

Dữ liệu liên quan cần được thu thập để khám phá xem người đó có phải là chuyên gia trong một lĩnh vực cụ thể hay không.

 Lựa chọn thông tin chuyên gia: mục tiêu chính của hệ thống tìm kiếm chuyên gia không chỉ là cung cấp cho người dùng thông tin về kiến thức chuyên môn của

chuyên gia, mà còn giúp người dùng xác định và lựa chọn được chuyên gia phù hợp. Để đưa ra quyết định chọn chuyên gia nào, người dùng có thể cần xem xét

các mối quan hệ và sự tương tác của chuyên gia ứng viên với những người khác

có liên quan (những yếu tố này thường được gọi là các yếu tố ngữ cảnh).

 Xây dựng mô hình: bao gồm các hoạt động tiền xử lý, lập chỉ mục và mô hình hóa. Dữ liệu của chuyên gia thường được thu thập từ nhiều tài liệu trong các

nguồn dữ liệu không đồng nhất. Vì thế cần thực hiện việc tiền xử lý và lập chỉ

mục. Đây là một sự khác biệt đáng kể với việc truy xuất tài liệu thông thường,

tạo ra những thách thức kỹ thuật đối với cả vấn đề tích hợp và lập chỉ mục dữ

liệu. Ví dụ, các tên khác nhau có thể đề cập đến cùng một người hoặc các tên

giống nhau trong các nguồn khác nhau có thể đề cập đến những người khác nhau. Lập mô hình và truy xuất là việc xây dựng các mô hình để liên kết ứng viên chuyên gia với truy vấn của người dùng và cung cấp bảng xếp hạng chuyên gia.

 Đánh giá mô hình: hệ thống tìm kiếm chuyên gia là một hệ thống truy xuất thông tin, bắt đầu bằng việc người dùng gửi một truy vấn đến hệ thống, sau đó hệ thống

truy xuất danh sách các chuyên gia có thể có liên quan đến truy vấn của người dùng. Thông thường, hiệu quả của hệ thống tìm kiếm chuyên gia được đánh giá bằng cách sử dụng một tập dữ liệu thử nghiệm (bộ dữ liệu).

47

 Thiết kế giao diện tương tác: việc trình bày kết quả tìm kiếm của chuyên gia cho người dùng là vấn đề quan trọng. Tuy nhiên, nếu chỉ hiển thị danh sách tên

chuyên gia thì không phải lúc nào cũng giúp người dùng đánh giá được mức độ

phù hợp của một ứng viên với truy vấn. Các trang kết quả tìm kiếm chuyên gia thường không chỉ hiển thị danh sách những người được xếp hạng, mà còn hiển

thị danh sách các tài liệu, hội nghị và tạp chí liên quan đến chuyên gia. Ngoài ra,

các thông tin chi tiết về liên hệ của mỗi chuyên gia được xếp hạng cũng rất quan

trọng, tạo điều kiện cho người dùng có thể giao tiếp với chuyên gia (Balog &

cộng sự, 2012). Bên cạnh đó, ảnh đại diện của các chuyên gia cũng rất cần thiết vì thông qua Hình ảnh chuyên gia, người dùng có thể xác định thâm niên hoặc sự

quen biết với một chuyên gia trước khi liên hệ với họ.

Một số mô hình điển hình và các kỹ thuật sử dụng trong hệ tìm kiếm chuyên gia

(i). Một số mô hình điển hình

Trong hệ thống tìm kiếm chuyên gia, cần xác định mối quan hệ giữa chủ đề truy

vấn và con người, nhiệm vụ này được gọi là mô hình hoá. Mô hình tìm kiếm chuyên gia

thường có ba thành phần chính: (1) Ứng viên - đại diện cho một người có thể là chuyên

gia, (2) Tài liệu - đề cập đến các tài nguyên về kiến thức chuyên môn, (3) Chủ đề - là một lĩnh vực cụ thể (Lin & cộng sự, 2017). Hiện nay, một số mô hình đã được phát triển

để nắm bắt mối quan hệ giữa thuật ngữ truy vấn và ứng viên chuyên gia.

Bảng 1.5. Tổng hợp một số mô hình xác định chuyên gia

Mô hình

Tên tiếng Anh

Tham khảo

(Hofmann & cộng sự, 2010), (Gollapalli & cộng

Probabilistic models

Mô hình xác suất

sự, 2012), (Liang & Rijke, 2016), (Fang & cộng sự, 2010a)

Mô hình

Voting models

(Alarfaj & cộng sự, 2012), (Afzal & Maurer, 2011), (Deng & cộng sự, 2012), (Peng, Xu, & cộng

bỏ phiếu

sự, 2024)

Mô hình dựa

(Wang & cộng sự, 2013), (Li, C.-T. & cộng sự,

Graph-based models

trên đồ thị

2011), (Cifariello & cộng sự, 2019)

Hybrid methods

Phương pháp lai

(Neshati & cộng sự, 2017), (Liu & cộng sự, 2013), (Margaris & cộng sự, 2015), (Wang & cộng sự, 2017), (Deng & cộng sự, 2012)

48

Others

(Naeem & cộng sự, 2013), (Li, M. & cộng sự, 2011), (Sun & cộng sự, 2015), (Silva & cộng sự, 2013)

Các mô hình khác

Nguồn: Husain & cộng sự, 2019

- Các mô hình xác suất (probabilistic models): Xếp hạng các chuyên gia theo xác

suất (khả năng mà một ứng viên có thể là một chuyên gia trong một lĩnh vực)

- Mô hình bỏ phiếu (voting models): Sử dụng danh sách xếp hạng các tài liệu

được truy xuất, có thể đặt trọng số cho tài liệu, ứng viên nào có tài liệu liên quan sẽ được

đưa thông tin vào bảng xếp hạng của các chuyên gia ứng viên (Peng, Xu, & cộng sự,

2024). Từ đó tính điểm để xác định chuyên gia trong lĩnh vực đó.

- Mô hình dựa trên đồ thị (graph-based models): Đồ thị truy xuất chuyên gia có thể được xây dựng theo hai cách sau. Một loại biểu đồ coi các tài liệu và các ứng viên

chuyên gia là các nút, và các mối quan hệ giữa tài liệu và ứng viên được xem như các

cạnh. Loại đồ thị khác chỉ lấy các ứng viên làm nút và các mối quan hệ của ứng viên

được xem như các cạnh. Các thuật toán HITS và PageRank thường được sử dụng. Hai

thuật toán này xem các ứng viên chuyên gia hoặc tài liệu như các trang web trên Internet, liên kết giữa ứng viên-ứng viên và liên kết tài liệu-ứng viên có vai trò tương tự như các

siêu liên kết giữa các trang web (Ví dụ, xây dựng đồ thị giữa người hỏi và người trả lời

trong một diễn đàn (Wu & cộng sự, 2024), hoặc người gửi email và người nhận email).

- Lai của các mô hình này (hybrids): Là sự kết hợp nhiều thuật toán mô hình khác

nhau, như kết hợp thuật toán đề xuất dựa trên nội dung (content-based) với một hệ thống

lọc cộng tác dựa trên mạng xã hội để tìm các chuyên gia từ các mạng xã hội; hay kết

hợp giữa mô hình xác suất động với mô hình chủ đề và mô hình lấy tài liệu làm trung

tâm. Ngoài ra, còn nhiều cách kết hợp khác cũng được các tác giả nghiên cứu và đề xuất.

- Các mô hình khác: Tìm kiếm chuyên gia có liên quan chặt chẽ đến tìm kiếm tài liệu và các nhiệm vụ truy xuất thông tin (IR) khác; cả phương pháp IR truyền thống và hiện đại đã được áp dụng cho tìm kiếm chuyên gia như logic mờ, mô hình không gian vectơ, truy xuất dựa trên cụm và dữ liệu lớn. Ngoài ra, mô hình bản thể học (Ontology) cũng được một số tác giả sử dụng trong hệ tìm kiếm chuyên gia.

(ii). Các kỹ thuật sử dụng khi xây dựng hệ tìm kiếm chuyên gia

Bên cạnh những nghiên cứu về hệ tìm kiếm chuyên gia cho các tổ chức, một số

nghiên cứu khác cũng về chủ đề này lại đi sâu vào các vấn đề kỹ thuật trong việc thu

thập, xử lý thông tin về chuyên gia cũng như các thuật toán để xác định, đánh giá chuyên

môn, xếp hạng chuyên gia một cách chính xác nhất. Al-Taie & cộng sự (2018) đã chỉ ra

49

một số phương pháp để phân loại lĩnh vực chuyên môn khác nhau của các chuyên gia:

(1) Phân loại dựa trên lĩnh vực (domain); (2) Phân loại dựa trên kỹ thuật (học máy và

đồ thị) (Hình 1.5).

Ngoài ra, việc kết hợp các chỉ số chuyên môn dựa trên nội dung và các mối quan

hệ xã hội không làm giảm bớt một số vấn đề còn tồn tại liên quan đến việc xác định và xếp hạng các chuyên gia (Al-Taie & cộng sự, 2018). Trong khi (Singh & cộng sự, 2013;

Wang & cộng sự, 2013) chỉ ra một số phương pháp chính để tìm kiếm chuyên gia là

phương pháp dựa trên khai phá thông tin phi cấu trúc và phương pháp dựa trên khai thác

thông tin từ các trang mạng xã hội, hệ thống quản lý liên hệ hoặc từ các hệ thống mà hồ sơ chuyên gia tải lên là thông tin họ tự khai.

Nguồn: (Al-Taie & cộng sự, 2018)

Hình 1.5. Các kỹ thuật sử dụng trong hệ tìm kiếm chuyên gia

50

Mỗi kỹ thuật đều có ưu và nhược điểm riêng, tuy nhiên các kỹ thuật học máy

đang được quan tâm nhiều hơn trong những năm gần đây cùng với sự phát triển của lĩnh

vực trí tuệ nhân tạo và học máy. Không nằm ngoài xu thế này, trong luận án, NCS sẽ thử nghiệm thuật toán Learning to rank trong kỹ thuật học máy có giám sát, áp dụng

trong việc xếp hạng cũng như đề xuất chuyên gia phù hợp cho nhiệm vụ tìm kiếm chuyên gia của hệ thống.

Nguồn dữ liệu cung cấp thông tin chuyên gia

Hiện nay, thông tin về nhân lực có khá nhiều trong môi trường bên trong và bên

ngoài tổ chức. Việc tìm kiếm những thông tin này có thể thực hiện dễ dàng nếu nó được công khai trên các nền tảng công cộng, nhưng cũng có thể rất khó khăn nếu như đó là

những thông tin riêng tư mà các tổ chức lưu trữ riêng và không muốn công bố cho nhiều

người biết.

Dưới đây là một số nguồn tìm kiếm và thu thập dữ liệu chính:

a. Các Website của tổ chức

Nguồn tài nguyên về thông tin nguồn nhân lực trong các DN và tổ chức là vô

cùng lớn và quan trọng. Tuy nhiên, đây cũng là nơi khó truy cập đến nhất, bởi thường

những nguồn thông tin này sẽ được giữ riêng trong tổ chức, được bảo mật và ít khi công

bố ra bên ngoài. Mặc dù vậy, trong một số ngành, ví dụ với Giáo dục, với yêu cầu thực

hiện ba công khai, danh sách các giảng viên, các nhà nghiên cứu được công bố khá chi

tiết trên trang web của các trường Đại học, Học viện. Ngoài ra, thông tin về cán bộ, nhân

viên của các viện nghiên cứu, các tổ chức thuộc các bộ ban ngành cũng được đăng trên

trang chủ của các đơn vị này (thường trong mục Cơ cấu tổ chức, Nhân sự, Đội ngũ cán

bộ hoặc Danh sách cán bộ). Độ chi tiết thông tin của từng cá nhân được đăng tải công khai tuỳ thuộc vào từng tổ chức. Tuy nhiên, những trường thông tin thường xuất hiện

bao gồm: Họ tên, chức vụ, học hàm/học vị, nơi công tác, lĩnh vực nghiên cứu, địa chỉ email, số điện thoại. Ngoài ra, mỗi cá nhân có thể được cấp một trang web riêng để cập nhật thông tin về quá trình công tác, các hướng nghiên cứu chuyên sâu, các dự án đã tham gia, các ấn phẩm đã xuất bản.

Trong số nhiều nguồn khác nhau, trang chủ cá nhân của giảng viên, các nhà nghiên cứu và trang chủ của các tổ chức là một nguồn đáng tin cậy và có giá trị, vì chúng

thường chứa dữ liệu được định dạng tương đối tốt (Brereton & cộng sự, 2007). Có thể nhận thấy, đây sẽ là nguồn cung cấp dữ liệu về nhân lực chuyên gia rất tốt, tuy nhiên số lượng bị hạn chế ở một số nhóm ngành nhất định. Và, các trang web này nên được tìm

51

kiếm trực tiếp, vì tiểu sử của từng cá nhân thường không xuất hiện trong kết quả của

công cụ tìm kiếm (Brennan & cộng sự, 2009).

b. Các Website tuyển dụng, giới thiệu chuyên gia, sàn giao dịch việc làm

Tại Việt Nam, có khá nhiều các sàn giao dịch việc làm cho các tỉnh, thành phố

hoặc các website tuyển dụng có chuyên mục “Người tìm việc” hoặc “Tìm ứng viên”. Tại đây, người lao động có thể đưa thông tin cá nhân cũng như kinh nghiệm làm việc

của mình để tìm những công việc phù hợp nhất. Thông qua các trang này, chúng ta có

thể thu thập được khá nhiều thông tin cụ thể và chi tiết liên quan đến ứng viên. Tuy

nhiên, khi xem xét kỹ về những người tìm việc đưa trên các website này thì hầu hết là các lao động phổ thông hoặc có tay nghề ở cấp độ vừa phải. Còn những nguồn nhân lực

có trình độ chuyên môn cao là không nhiều. Trên thế giới, các nền tảng tìm kiếm việc làm như LinkedIn3 hoặc Monster4, cho phép các cá nhân tạo và duy trì hồ sơ cá nhân. Người dùng có thể nhập tình trạng việc làm của họ, nhà tuyển dụng hiện tại và trước

đây, chức danh công việc, chứng chỉ và kỹ năng, cũng như nền tảng giáo dục, vị trí địa

lý, sở thích nghề nghiệp, kinh nghiệm liên quan và loại công việc họ đang tìm kiếm.

Một số dữ liệu này có thể tìm kiếm công khai khi người dùng chọn hiển thị công khai

hồ sơ của mình. Một số khác giữ riêng tư hoặc bí mật, để bảo vệ thông tin cá nhân hoặc

chủ sở hữu nền tảng sử dụng riêng cho việc phân tích nhằm tạo ra doanh thu bằng cách

bán quảng cáo hoặc để nâng cao dịch vụ, sản phẩm của họ (National Academies of

Sciences Engineering and Medicine, 2017).

Có những công ty chuyên giới thiệu chuyên gia cho các yêu cầu liên quan đến

pháp lý và hỗ trợ chuyên môn (Expert witness) của các cá nhân và tổ chức. Họ thực hiện

duy trì cơ sở dữ liệu có sẵn về các chuyên gia để sẵn sàng cho các nhiệm vụ. Lợi ích của việc sử dụng các dịch vụ này là cơ sở dữ liệu đa dạng và kích thước lớn, vì vậy người

dùng có thể tiết kiệm rất nhiều thời gian tìm kiếm các chuyên gia. Nhược điểm là người

3 https://www.linkedin.com 4 https://www.monster.com

dùng phải liên hệ với công ty giới thiệu để lấy thông tin cho chuyên gia, và sau đó trả một khoản phí bổ sung để giữ chân chuyên gia đó. Tuy nhiên, có một số trang web cung cấp miễn phí về thông tin của các chuyên gia được gọi là Thư mục chuyên gia (Expert Witness Directories). Thư mục chuyên gia cho phép nhà nghiên cứu duyệt tìm các nhà tư vấn trong một lĩnh vực chuyên môn cụ thể và liên hệ với họ trực tiếp. Bởi vì các

52

chuyên gia thường trả phí niêm yết, vì thế, việc tìm kiếm là miễn phí cho người dùng

(Brennan & cộng sự, 2009).

c. Các Website cá nhân

Trang web cá nhân đang là một nguồn dữ liệu vô cùng hữu ích mà những người

thu thập dữ liệu về nhân sự đang rất quan tâm. Hiện nay, có khá nhiều các nhà khoa học, các nhà nghiên cứu, những người nổi tiếng trong các lĩnh vực khác nhau đã xây dựng

trang web riêng cho cá nhân. Việc tạo ra các trang web này nhằm giới thiệu những thông

tin cơ bản cũng như những thành tích mà họ có được trong quá trình hoạt động chuyên

môn, và việc cập nhật thông tin sẽ do chính người chủ trang web tự thực hiện. Những trang web này thường được giới thiệu đường dẫn trong các trang thông tin về nhân sự

của tổ chức. Do đây là những trang web cá nhân nên độ tin cậy hoàn toàn phụ thuộc vào

người chủ web. Ngoài ra, với những trang web tự xây dựng, thường thông tin sẽ không được sắp xếp theo một cấu trúc chung, các mô tả về chuyên môn có xu hướng không có

cấu trúc, và thông tin ở dạng tĩnh nên khó được cập nhật theo thời gian thực.

d. Các trang mạng xã hội

Với sự phát triển nhanh chóng của mạng Internet kéo theo sự phát triển của các

nền tảng mạng xã hội, tạo ra một lượng lớn dữ liệu của người dùng các trang này. Những

dữ liệu này đang trở thành một trong những nguồn thông tin quan trọng (Xu & cộng sự,

2012). Dữ liệu do người dùng tạo ra chứa nhiều thông tin như các bài đăng, câu hỏi, ý

kiến, hoạt động, kinh nghiệm, v.v., có thể có giá trị cho việc tìm kiếm chuyên gia

(Neshati & cộng sự, 2013). Những dữ liệu trên mạng xã hội thường có tính cập nhật và

thể hiện nhiều mối quan hệ giữa những người dùng, ví dụ: khi vào một trang mạng xã

hội của một chuyên gia, chúng ta có thể tìm thấy nhiều người bạn trong danh sách bạn bè hoặc có tương tác trong các bài viết, v.v. cũng là các chuyên gia. Các trang mạng xã

hội của các chuyên gia có thể được sử dụng để trích xuất các yếu tố hiệu quả cho việc xếp hạng và xác định lĩnh vực chuyên môn của họ thông qua các yếu tố liên quan đến tổ chức, bài viết, các chia sẻ, v.v.

e. Các Website đánh chỉ mục

5 https://scholar.google.com/

Những nhà khoa học, những chuyên gia trong các lĩnh vực khác nhau, thường gửi các nghiên cứu lên các tạp chí, hoặc hội thảo uy tín. Các tạp chí hoặc các kỷ yếu hội thảo này được các hệ thống chỉ mục như Google Scholar5, Microsoft Academy Search

53

(MAS)6, ResearchGate7, v.v. thu thập và lập chỉ mục. Số lượng dữ liệu được đánh chỉ mục là rất lớn. Theo thống kê từ 2 website MAS và Google Scholar (vào năm 2014),

ước tính có ít nhất 114 triệu tài liệu học thuật bằng tiếng Anh có thể truy cập được trên Web, trong đó Google Scholar có gần 100 triệu. Trong số này, có ít nhất 27 triệu tài liệu

(24%) có sẵn, miễn phí vì họ không yêu cầu đăng ký hoặc thanh toán dưới bất kỳ Hình thức nào. Các tài liệu học thuật mới được tạo với tốc độ hàng chục nghìn mỗi ngày (Wu

& cộng sự, 2014). Thông qua những thông tin từ các bài viết, chúng ta có thể xác định

được tên tác giả, học hàm/học vị, nơi làm việc, địa chỉ email, những người thường cộng

tác cùng trong các bài viết, v.v. Ngoài ra, theo thống kê các bài viết về các lĩnh vực, thì có thể xác định việc tìm kiếm các nhà khoa học thuộc lĩnh vực Công nghệ thông tin hay

Kinh tế nói chung sẽ dễ hơn là tìm thông tin về các chuyên gia trong lĩnh vực Nông

nghiệp hoặc Khoa học vật liệu và Kỹ thuật (Wu & cộng sự, 2014). Đây là nguồn thông

tin với số lượng lớn dữ liệu có thể phục vụ cho các hoạt động tìm kiếm thông tin về

chuyên gia.

f. Giao diện lập trình

Dữ liệu có thể được truy cập vào thông qua các giao diện lập trình (Application

Programming Interface - API) của một số website có cung cấp dịch vụ này. API được

hiểu là tập các thủ tục và giao thức truyền thông cung cấp quyền truy cập vào dữ liệu

của một ứng dụng, hệ điều hành hoặc các dịch vụ khác (Perez, 2020). API cho phép các

tổ chức/công ty cung cấp dữ liệu, chức năng của các ứng dụng ở dạng mở với các nhà

phát triển bên ngoài, đối tác kinh doanh và các bộ phận nội bộ trong công ty của họ.

Điều này sẽ giúp các dịch vụ và sản phẩm giao tiếp với nhau và tận dụng dữ liệu và chức

năng của nhau thông qua một giao diện. Các nhà phát triển không cần biết API được triển khai như thế nào; họ chỉ đơn giản sử dụng giao diện để giao tiếp với các sản phẩm

và dịch vụ khác (IBM Cloud Education, 2020).

6 http://academic.microsoft.com/ 7 https://www.researchgate.net/

Thông qua các API của các tổ chức, chúng ta có thể dễ dàng truy cập thập dữ liệu mà không cần phải vào trực tiếp từng trang trong Website hoặc thông qua các công cụ cào dữ liệu (Crawler). Hiện nay một số các website về dữ liệu nghiên cứu như Elsevier, IEEE Xplore, JSTOR, PubMed, OECD, Springer, BioMed Central, arXiv, Scopus, ScienceDirect, Web of Science Lite, World Bank APIs, v.v. (MIT Libraries) cung cấp

54

API dưới Hình thức miễn phí hoặc trả phí để truy cập đến các nghiên cứu của các chuyên

gia trên thế giới.

g. Thông tin nội bộ của các tổ chức

Đây là những thông tin khó truy cập nhất. Họ thường không công khai trên môi

trường mạng Internet, mà chỉ để ở mạng nội bộ hoặc lưu trữ trong các tài liệu giấy. Các thông tin về nhân sự không được công bố vì các lý do như cần bảo vệ quyền riêng tư của

cá nhân hoặc thông tin kinh doanh độc quyền (National Academies of Sciences

Engineering and Medicine, 2017). Tuy nhiên, những dữ liệu về nhân sự, đặc biệt là nhân

sự có tay nghề cao lại là thứ mà chúng ta cần. Vì thế, để truy cập được những dữ liệu này, cần thông qua các mối quan hệ với ban lãnh đạo của tổ chức đó. Và những thông tin này

thường cũng chỉ có thể nhập bằng tay lên hệ thống, chứ không thể được xử lý tự động.

Từ những tổng hợp trên, có thể nhận thấy có rất nhiều nguồn dữ liệu khác nhau để thu thập phục vụ cho việc tìm kiếm nguồn nhân lực nói chung và các hệ thống tìm

kiếm nguồn nhân lực chuyên gia nói riêng. Nhiều nghiên cứu gần đây đã khuyến nghị

rằng, việc xác định một chuyên gia không nên chỉ dựa trên một nguồn dữ liệu duy nhất

mà nên kết hợp nhiều nguồn thông tin chuyên môn khác nhau để nâng cao chất lượng

của hệ tìm kiếm chuyên gia (Husain & cộng sự, 2019).

1.2.3. Cơ sở tri thức về chuyên gia

Cơ sở tri thức (KB) là một hệ thống lưu trữ, quản lý và tổ chức các thông tin, dữ

liệu dưới dạng tri thức. Cơ sở tri thức không chỉ lưu trữ dữ liệu thô mà còn cung cấp các

mối liên kết, ngữ cảnh và quy tắc logic giúp các hệ thống xử lý thông tin một cách hiệu

quả hơn. Cơ sở tri thức là một bộ sưu tập có cấu trúc các thông tin và tri thức về một

hoặc nhiều lĩnh vực cụ thể, bao gồm các sự kiện, quy tắc, và mối quan hệ giữa các thực

thể hoặc đối tượng trong hệ thống (Martínez & cộng sự, 2003). Cơ sở tri thức có thể

được sử dụng trong các hệ thống hỗ trợ ra quyết định, hệ thống thông minh, các hệ thống

tìm kiếm, phân loại thông tin. Một số loại cơ sở tri thức chính như: Cơ sở tri thức dựa trên luật thực hiện lưu trữ các luật logic, dùng để phân tích, suy diễn và ra quyết định (Nowak-Brzezińska & Wakulicz-Deja, 2019); Cơ sở tri thức ngữ nghĩa chứa các mối quan hệ ngữ nghĩa giữa các thực thể, thường sử dụng các chuẩn ngữ nghĩa như RDF hay OWL để định nghĩa các thực thể và mối quan hệ (Ren & cộng sự, 2024); Cơ sở tri thức

đồ thị lưu trữ thông tin dưới dạng đồ thị, trong đó các thực thể là các nút và các mối quan hệ là các cạnh (Liu & cộng sự, 2025; Xiao & cộng sự, 2023). Điều này giúp hệ thống có thể biểu diễn và truy vấn các mối quan hệ phức tạp giữa các thực thể.

55

Đối với hệ thống tìm kiếm chuyên gia, Cơ sở tri thức về chuyên gia đóng vai trò

nền tảng giúp lưu trữ và tổ chức các tri thức liên quan đến chuyên gia, lĩnh vực chuyên

môn và các mối quan hệ giữa chuyên gia với các đối tượng khác như công trình nghiên cứu, tổ chức và dự án. Đây là một loại cơ sở tri thức ngữ nghĩa đặc biệt, giúp nâng cao

hiệu quả của việc tìm kiếm, phân loại và xếp hạng các chuyên gia trong các lĩnh vực khác nhau. Cơ sở tri thức về chuyên gia có vai trò quan trọng trong việc nâng cao khả

năng tìm kiếm, kết nối và ra quyết định, như hỗ trợ tìm kiếm thông minh, đề xuất chuyên

gia phù hợp, hỗ trợ doanh nghiệp trong việc phân tích, đánh giá chuyên gia dựa trên các

thông tin mà hệ thống cung cấp. Trong hệ thống tìm kiếm chuyên gia sẽ thực hiện xây dựng mô hình tri thức Ontology dựa trên ngữ nghĩa để hoàn thiện cơ sở tri thức về

chuyên gia.

Ontology về cơ bản sẽ tạo ra một cây khung phân cấp, trong đó các nút cha sẽ

bao gồm khái niệm của các nút con, hay các khái niệm của nút con sẽ là một lĩnh vực,

chủ đề nhỏ của khái niệm nút cha. Từ đó, các tri thức sẽ được phân loại cũng như xây

dựng thêm vào cây khung này (Walowe, 2023). Máy tính hoàn toàn có thể trích xuất

thông tin dựa trên cây khung để có những kết quả tốt hơn cho các tiến trình xử lý. Với

ngữ cảnh là xây dựng một hệ thống thông tin các chuyên gia trong các chủ đề, lĩnh vực

khác nhau như: Công nghệ thông tin, kinh tế, v.v..Và không phải ai cũng có thể có những

hiểu biết sâu rộng trong các lĩnh vực để có thể tạo ra một cây phân loại như vậy. Bài

toán đặt ra là cần xây dựng một cây khung phân cấp cho một chủ đề, lĩnh vực và từ cây

khung này có thể tìm ra các chuyên gia trong từng chủ đề. Với bài toán được đặt ra cho

hệ thống quản lý thông tin các chuyên gia trên, có hai cách tiếp cận bài toán này là dựa

vào hiểu biết của các chuyên gia trong từng lĩnh vực để tạo ra một cây khung hoặc là dự vào kho dữ liệu đáng tin cậy như các bài báo, trích dẫn của các nhà nghiên cứu, nhà bác

học để có thể sử dụng máy tính tạo ra cây phân cấp một cách tự động (Uddin & cộng

sự, 2011). Cách tiếp cận đầu tiên thì sẽ đáng tin cậy và đúng đắn nhưng thực sự cần một

đội ngũ chuyên gia có kiến thức sâu rộng về từng chủ đề, cần rất nhiều thời gian và công sức chưa kể đến là mặc dù chỉ là cây khung nhưng càng ngày càng nhiều các lĩnh vực mới cũng như là các chủ đề mới trong các chủ đề cũ. Còn với cách tiếp cận sử dụng trí tuệ nhân tạo và xử lý ngôn ngữ tự nhiên thì ưu điểm là có thể dễ dàng cập nhật thêm tri thức mới nhưng kết quả tạo ra một cây phân loại có thể sẽ không được chắc chắn như

cách làm thủ công. Hai cách tiếp cận này có thể bổ trợ cho nhau bằng cách, sau khi khai phá dữ liệu sử dụng máy tính và tạo ra một cây khung phân cấp bằng các kỹ thuật học máy thì các chuyên gia có thể điều chỉnh lại cho phù hợp hơn (Borna & cộng sự, 2024;

de Campos & cộng sự, 2024).

56

1.2.4. Lý thuyết nền tảng

● Khung nghiên cứu lý thuyết về HTTT (IS Research Framework): Khung lý thuyết được Hevner & cộng sự (2004) đề xuất đã trình bày các khái niệm nền

tảng để có thể hiểu, thực thi và đánh giá hệ thống thông tin thông qua việc kết

hợp các mô hình khoa học hành vi và khoa học thiết kế. Khung lý thuyết của

Hevner & cộng sự (2004) đưa ra bao gồm ba yếu tố chính là: (1) Môi trường, (2) Hệ thống thông tin, và (3) Cơ sở tri thức. Trong đó, yếu tố môi trường là tổng

hợp các thuộc tính liên quan đến con người, tổ chức và công nghệ. Yếu tố hệ

thống thông tin được chia thành hai pha chính: (1) Phát triển và (2) đánh giá hệ

thống. Yếu tố cơ sở tri thức bao gồm (1) cơ sở tham chiếu (lý thuyết nền tảng, công cụ, v.v.) và (2) phương pháp luận để hỗ trợ nghiên cứu HTTT một cách

hoàn chỉnh nhất.

● Lý thuyết về phương pháp nghiên cứu khoa học thiết kế (DSRM): Phương pháp nghiên cứu khoa học thiết kế (Design Science Research Methodology - DSRM) là phương pháp tiếp cận nghiên cứu được sử dụng chủ yếu trong các lĩnh

vực liên quan đến hệ thống thông tin, kỹ thuật phần mềm và các ngành khoa học

ứng dụng. Mục tiêu chính của DSRM là tạo ra các giải pháp thực tiễn thông qua

việc thiết kế, phát triển và đánh giá các hiện vật (artifacts) mới nhằm giải quyết

những vấn đề phức tạp và thực tiễn trong môi trường cụ thể. Những hiện vật này

có thể là kiến trúc, mô hình, phương pháp, hoặc hệ thống công nghệ. Quy trình

của DSRM bao gồm sáu bước chính: (1) Xác định vấn đề, (2) Xác định mục tiêu

của giải pháp, (3) Thiết kế và phát triển, (4) Thử nghiệm, (5) Đánh giá, và (6)

Truyền đạt kết quả nghiên cứu. DSRM yêu cầu sự tương tác chặt chẽ giữa lý

thuyết và thực tiễn, từ đó tạo điều kiện phát triển các giải pháp có khả năng áp

dụng thực tiễn cao. Theo Hevner & cộng sự (2004), DSRM không chỉ dừng lại ở

việc phát triển các giải pháp công nghệ mà còn tập trung vào việc đánh giá và cải tiến liên tục, đảm bảo tính ứng dụng và hiệu quả của các giải pháp này trong thực tiễn. Chính vì thế, phương pháp này phù hợp để đánh giá mô hình kiến trúc hệ thống tìm kiếm chuyên gia đề xuất.

● Lý thuyết về học máy (Machine learning theory): Học máy hay còn gọi là học tự động, được hiểu là lập trình máy tính để chúng có thể “học” từ đầu vào có sẵn

(Shalev-Shwartz & Ben-David, 2014). Học máy là khả năng của một hệ thống tự động thu thập, tích hợp và phát triển kiến thức từ dữ liệu quy mô lớn, sau đó

mở rộng kiến thức thu được một cách tự động bằng cách khám phá thông tin mới

mà không cần được lập trình cụ thể để làm như vậy. Bên cạnh đó, thông tin về

57

chuyên gia thường cần kết hợp dữ liệu từ nhiều nguồn khác nhau, như từ thông

tin hồ sơ về chuyên gia, từ nội dung các tài liệu liên quan, hoặc từ các trang mạng

xã hội. Ngoài ra những thông tin này còn được cập nhật và thay đổi theo thời gian. Vì vậy, để xếp hạng chuyên gia, cần ước lượng chuyên môn của chuyên gia

từ nhiều nguồn khác nhau đó. Từ ý tưởng của lý thuyết học máy, NCS thấy rằng, việc sử dụng thuật toán học máy sẽ giúp kết quả xếp hạng được cải thiện hơn sau

mỗi lần thử nghiệm và bổ sung đánh giá từ kết quả đào tạo của những lần trước.

Vì thế, ứng dụng học máy trong xếp hạng chuyên gia là một hướng đi phù hợp.

Và cách tiếp cận mà NCS lựa chọn là tiếp cận theo phương pháp Học để xếp hạng (Learning to Rank – L2R). Một số thuật toán học có giám sát sẽ được thử nghiệm

nhằm tìm ra thuật toán phù hợp nhất cho việc xếp hạng chuyên gia.

● Mô hình chấp nhận và sử dụng công nghệ hợp nhất (Unified Theory of Acceptance and Use of Technology - UTAUT): Mô hình này được Venkatesh

& cộng sự (2003) đề xuất dựa trên mô hình chấp nhận công nghệ TAM, để nghiên

cứu sự chấp nhận của người dùng với một hệ thống thông tin mới. Trong đó, đã

xác định các yếu tố quyết định trực tiếp đến hành vi chấp nhận và sử dụng của

người dùng, gồm: Kỳ vọng nỗ lực; Kỳ vọng hiệu quả (Hiệu suất mong đợi); Ảnh

hưởng xã hội; Các điều kiện thuận lợi và các nhân tố điều tiết (Nguyen & Trường,

2021). Trong đó, (1) Kỳ vọng nỗ lực (hay mức độ dễ sử dụng của hệ thống) là sự

nhận thức về việc dễ/phức tạp của việc sử dụng hệ thống; (2) Kỳ vọng hiệu quả

là mức độ tin tưởng của cá nhân trong việc sử dụng hệ thống sẽ giúp họ đạt hiệu

quả trong công việc; (3) Ảnh hưởng xã hội là nhận thức của cá nhân bị tác động

bởi niềm tin của những người xung quanh khi họ cho rằng cá nhân đó nên sử dụng hệ thống mới; (4) Điều kiện thuận lợi là mức độ niềm tin của người dùng

về cơ sở hạ tầng kỹ thuật của tổ chức đủ điều kiện hỗ trợ cho hệ thống (Venkatesh

& cộng sự, 2003). Với ý nghĩa trên, việc sử dụng lý thuyết của mô hình UTAUT

sẽ phù hợp trong việc đánh giá xem ý định của người dùng có chấp nhận sử dụng hệ thống tìm kiếm chuyên gia đề xuất không, và đánh giá hệ thống về khả năng cung cấp thông tin nhân lực chuyên gia có đáp ứng được nhu cầu của DNNVV tại Việt Nam hay không.

1.3. Tổng kết chương 1

Thông qua việc nghiên cứu tổng quan các tài liệu về hoạt động tìm kiếm chuyên gia và hệ tìm kiếm chuyên gia từ năm 2000 đến 2023, NCS đã xác định được những kết quả mà những nghiên cứu trước đã làm được, đồng thời phát hiện ra những khoảng trống

58

trong lý thuyết và thực tiễn. Đây chính là cơ sở để định hướng cho những nội dung

nghiên cứu mà luận án sẽ thực hiện.

Kết quả nội dung tổng quan nghiên cứu trong Chương 1 đã được đăng trong bài báo:

Xuan-Lam Pham, Thi Thu Le (2024), ‘Bibliometric Analysis and Systematic

Review of Research on Expert Finding: A PRISMA-guided Approach’, International Arab Journal of Information Technology, 21(4), 2024, Q2 Scopus, SCIE.

59

CHƯƠNG 2. PHÂN TÍCH YÊU CẦU HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM

2.1. Thực trạng nhu cầu tìm kiếm chuyên gia trong DNNVV Việt Nam

2.1.1. Mô tả mẫu

NCS đã thực hiện phỏng vấn sâu 20 đại diện DNNVV hoạt động trong một số lĩnh vực như: Logistic, xây dựng và kiến trúc, công nghệ thông tin, dịch vụ, v.v. Mặc dù đây là con số nhỏ, nhưng với tính chất của nghiên cứu định tính là số lượng mẫu thường nhỏ, và chất lượng mẫu sẽ quyết định chất lượng của nghiên cứu, vì thế NCS đánh giá, kết quả của những cuộc phỏng vấn này cũng góp một phần có ý nghĩa để xác định thực trạng nhu cầu tìm kiếm chuyên gia trong các DN hiện nay.

Những DN này tập trung chủ yếu ở Hà Nội, có một vài DN đặt tại thành phố Hồ Chí Minh hoặc có chi nhánh ở nhiều khu vực khác nhau. Số lượng nhân viên cơ hữu của mỗi DN này nằm trong khoảng từ 10 nhân viên đến hơn 200 nhân viên (chi tiết trong bảng Phụ lục 1). Nội dung phỏng vấn tập trung vào việc khảo sát nhu cầu về nguồn nhân lực nói chung và nhu cầu tìm kiếm chuyên gia trong các DN hiện nay, đồng thời cũng khảo sát nhu cầu về các hệ thống thông tin hỗ trợ việc tìm kiếm, liên kết với nguồn nhân lực ở những vị trí, địa điểm khác nhau. Cách thức thực hiện phỏng vấn chủ yếu là sử dụng qua điện thoại hoặc Google meet do khoảng cách về vị trí địa lý và ảnh hưởng của dịch Covid-19 (năm 2021 - 2022) nên việc gặp mặt trực tiếp khá khó khăn. Do vấn đề nghiên cứu liên quan đến hoạch định nguồn nhân lực trong DN, nên những người tham gia phỏng vấn hầu hết đều là những người quản lý. Dữ liệu thu được từ các cuộc phỏng vấn sẽ được tiến hành mã hoá, tổng hợp theo các nhóm chỉ tiêu, từ đó tổng hợp lại thành một số tiêu chí để đánh giá về thực trạng nhu cầu tìm kiếm chuyên gia trong các DNNVV hiện nay.

Nguồn: Tác giả tổng hợp từ kết quả điều tra

Bảng 2.1. Mô tả mẫu tham gia phỏng vấn

60

2.1.2. Phân tích thực trạng

 Về nguồn nhân lực sẵn có trong doanh nghiệp

Đánh giá nguồn nhân lực hiện tại của DN là bước đầu tiên để xác định nhu cầu

về nguồn nhân lực bổ sung. Nguồn nhân lực này có đáp ứng được yêu cầu công việc của

doanh nghiệp trong quá trình hoạt động không?

Theo kết quả phỏng vấn, phần lớn các doanh nghiệp vẫn đang thiếu hụt nguồn nhân lực đáng kể ở nhiều phòng ban. Nhiều vị trí, bao gồm quản lý cấp cao, quản lý cấp trung, trưởng phòng, trưởng nhóm và nhân viên, cần thêm nhân sự. Trong đó, một người tham gia phỏng vấn đã nhận xét:

“Những vị trí mà chúng tôi thường thiếu và cần tuyển dụng là quản lý cấp trung

và trưởng nhóm. Tuy nhiên, việc tìm được ứng viên lý tưởng không hề đơn giản.”

Hầu hết những người tham gia phỏng vấn đều cho biết việc bổ sung nguồn nhân

lực thường được thực hiện tùy thuộc vào nhu cầu mở rộng của doanh nghiệp.

Thông thường, nguồn nhân lực bị thiếu bao gồm cả lao động có tay nghề và lao động phổ thông. Tất cả các doanh nghiệp đều báo cáo tình trạng thiếu hụt nhân sự có trình độ. Một giám đốc kinh doanh giải thích:

"Việc bổ sung lao động không có kỹ năng dễ hơn là bổ sung lao động có kỹ năng cao. Việc tìm kiếm và đảm bảo thỏa thuận hợp tác với các chuyên gia rất tốn thời gian và khó khăn."

Kết quả này cũng được đề cập trong nghiên cứu của Nguyen & Nguyen (2021), trong đó ghi nhận tình trạng thiếu hụt đáng kể nguồn nhân lực có trình độ và tay nghề cao trong các doanh nghiệp Việt Nam. Do đó, rõ ràng là hầu hết các DN đều thiếu lực lượng lao động thường trực phù hợp và phải cân nhắc mở rộng nguồn nhân lực, đặc biệt bằng cách bổ sung nhân sự có chuyên môn để hỗ trợ các hoạt động của mình.

 Về tầm quan trọng của việc tìm kiếm nhân sự chuyên gia

Phần lớn người được phỏng vấn cho biết DN của họ cần nguồn lực chuyên gia bên ngoài. Tuy nhiên, các DN đã chỉ ra rằng, nhu cầu tìm kiếm phụ thuộc vào yêu cầu trong các hoạt động sản xuất và kinh doanh. Những nhu cầu này thường phát sinh khi:

"Doanh nghiệp có một dự án mới và cần các chuyên gia tư vấn, hỗ trợ các giai

đoạn của dự án hoặc đáp ứng các yêu cầu của công việc cố định, định kỳ."

Hơn nữa, nếu một công ty muốn mở rộng hoạt động sang một thị trường quốc tế mới, họ sẽ muốn tìm các chuyên gia Việt Nam đang cư trú tại quốc gia đó. Những người

61

tham gia phỏng vấn đã liệt kê những hoạt động sau đây mà các doanh nghiệp tìm kiếm sự hỗ trợ từ các chuyên gia:

"Tiếp thị, vận chuyển, sản xuất, bán hàng và quản lý tài chính" cũng như "công nghệ thông tin và truyền thông, pháp lý và quản lý rủi ro" là một số hoạt động cần thêm nguồn chuyên gia từ bên ngoài.

Bên cạnh đó, Ủy ban Châu Âu cũng chỉ ra rằng, có một dạng tổ chức đang ngày càng được nhiều nơi áp dụng, đó là “ một tổ chức ảo bao gồm một nhóm nhỏ nhân viên toàn thời gian và các chuyên gia bên ngoài được thuê tạm thời khi cần thiết để làm việc cho các dự án ” (European Commission, 2015). Vì vậy, việc có được nguồn nhân lực có kiến thức chuyên môn từ các nguồn bên ngoài, bao gồm cả các chuyên gia trong và ngoài nước, là rất cần thiết.

 Về nhu cầu tư vấn, hợp tác từ các chuyên gia

Khi được hỏi về mức độ sẵn sàng liên hệ với những người có kiến thức chuyên môn trong lĩnh vực mà DN đang quan tâm, tất cả những người được phỏng vấn đều trả lời rằng, họ sẵn sàng liên hệ nếu cần tham khảo ý kiến hoặc hỗ trợ tư vấn từ các chuyên gia. Những người tham gia phỏng vấn cũng cho biết, họ đã từng liên hệ với các chuyên gia này rồi. Điều này chỉ ra rằng, các doanh nghiệp rất muốn có được sự trợ giúp từ những người am hiểu chuyên sâu về các vấn đề mà DN đang gặp khó khăn và cần giải quyết.

Ngoài ra, khá nhiều trường hợp đã xảy ra khi hỏi chi tiết hơn về kết quả của các cuộc tiếp xúc với các chuyên gia. Chỉ một phần nhỏ trong số này được hợp tác. Phần lớn các đề xuất còn lại đã bị từ chối ở các mức độ khác nhau.

"Khi tôi liên hệ với các chuyên gia bên ngoài, họ lịch sự từ chối vì nhiều lý do cá nhân. Thông thường, lý do là vì tôi đang có quá nhiều công việc hiện tại."

Đây là một trở ngại đáng kể cho các doanh nghiệp khi muốn hợp tác với các chuyên gia.

Vì vậy, ngoài những khó khăn mà doanh nghiệp gặp phải trong việc tìm kiếm và tiếp cận các chuyên gia, còn có những trở ngại nào liên quan đến việc hợp tác với họ không? Một số nguyên nhân chính được liệt kê, bao gồm:

"Không hiểu được những thách thức mà doanh nghiệp phải đối mặt."

"Không hiểu rõ về quy trình hoạt động kinh doanh."

"Không thể thống nhất về các điều kiện hợp tác".

Qua đó, có thể thấy một bài toán nữa đặt ra với DN khi muốn hợp tác với nguồn nhân lực bên ngoài là làm thế nào để họ có thể hiểu và nắm rõ quy trình hoạt động trong DN, để từ đó có thể hỗ trợ cho DN một cách hiệu quả và hiệu suất làm việc cao nhất.

62

Vì có khá nhiều khó khăn được chỉ ra, nên khi hỏi những người phỏng vấn lựa chọn giữa việc tự tuyển dụng/đào tạo lao động có sẵn để đáp ứng nhu cầu của DN với việc mời chuyên gia bên ngoài hợp tác theo từng giai đoạn/dự án, phương án nào thích hợp và có lợi với DN của họ hơn, thì có đến hơn một nửa số câu trả lời lựa chọn phương án “Tuyển dụng/sử dụng nhân viên cơ hữu” thay vì “Mời chuyên gia bên ngoài hợp tác theo nhu cầu”. Mặc dù, nếu phân tích việc tuyển dụng và đào tạo lao động có chuyên môn cao sẽ tốn khá nhiều thời gian thực hiện, phải trả lương cố định kèm theo các điều kiện phúc lợi khác, trong khi nếu chọn phương án hợp tác với chuyên gia từ bên ngoài thì có thể làm việc ngay và thù lao sẽ trả theo khối lượng và hiệu quả công việc.

Từ kết quả phỏng vấn trên, có thể nhận thấy rằng, mặc dù hiểu được tầm quan trọng của việc tìm kiếm và hợp tác với các chuyên gia, nhưng vẫn còn rất nhiều khó khăn cho DN trong quá trình tìm kiếm hoặc liên hệ với những chuyên gia này.

 Về phương pháp và phương tiện đang sử dụng để tìm kiếm, kết nối với chuyên gia

Bên cạnh nhu cầu hợp tác với nguồn nhân lực bên ngoài, cách thức và công cụ để hỗ trợ các DN trong quá trình tìm kiếm cũng là một trong những vấn đề quan trọng cần xem xét và đánh giá một cách kỹ lưỡng. Bởi nếu có một phương pháp giúp DN vừa có thể tìm được nhanh chóng những đối tượng phù hợp với nhu cầu của mình, đồng thời tiết kiệm chi phí và thời gian tìm kiếm thì lợi ích mang lại là vô cùng lớn. Dưới đây là những phương pháp, công cụ chính mà các DN thường dùng khi tìm kiếm chuyên gia.

Bảng 2.2. Phương pháp và công cụ mà các DN thường sử dụng để tìm chuyên gia

Bình luận

Số người lựa chọn

5

Phương pháp / công cụ Trang web tìm kiếm (ví dụ: Google Search)

8

Các trang web tìm việc làm

2

Hệ thống tìm kiếm chuyên gia

20

Mối quan hệ giữa các cá nhân

- "Không hiệu quả lắm. Việc tìm kiếm nguồn nhân lực phù hợp vẫn là một thách thức khó khăn." - “Chất lượng thấp.” - “Hiện nay, có rất nhiều kênh tuyển dụng nhân sự nhưng thường không đáp ứng được nhu cầu phù hợp hoặc chất lượng không đồng đều, chậm hoặc không phản hồi kịp thời”. - "Việc này tốn thời gian." - “Việc tìm kiếm nguồn nhân lực đáp ứng được kỳ vọng là khá khó khăn.” - "Hệ thống tìm kiếm khá nhanh, nhưng hiệu quả của nó không thể được đánh giá đầy đủ cho đến khi tiến hành phỏng vấn trực tiếp. Tuy nhiên đó là một bước sơ loại ban đầu." - “Tôi không biết nhiều về các hệ thống này.” “Phương pháp này khá linh hoạt, hiệu quả cao nhưng tốn thời gian và khó tìm được số lượng chuyên gia cùng lúc.”

Nguồn: Tác giả tổng hợp từ kết quả điều tra

63

Điều đáng ngạc nhiên là tất cả các nhà quản lý tham gia trả lời đều đề cập đến

phương pháp tìm kiếm nhân sự "thông qua mối quan hệ" trong khi các phương pháp

khác không được sử dụng nhiều. Điều này dẫn đến kết luận rằng các công cụ hiện tại để hỗ trợ hoạt động tìm kiếm chuyên gia chưa đáp ứng đầy đủ nhu cầu của doanh nghiệp.

 Về hệ thống tìm kiếm chuyên gia

Từ những thực trạng mà DNNVV đang gặp phải trong quá trình tìm kiếm chuyên

gia, tác giả đã có đề xuất xây dựng hệ thống tìm kiếm chuyên gia trong đó lưu trữ lượng

lớn dữ liệu về hồ sơ chuyên gia cho các DNNVV nhằm đáp ứng nhu cầu tìm kiếm và

hợp tác nhân chuyên gia từ bên ngoài. Một hệ thống với lượng dữ liệu lớn về chuyên gia có chuyên môn sâu về một số lĩnh vực các DN đang quan tâm, cũng như có thể kết

nối với nhiều CSDL chuyên gia khác nhau từ các tổ chức và CSDL của quốc gia. Hệ

thống này sẽ được triển khai tại một đơn vị trung lập hoặc một cơ quan của Nhà nước,

có chức năng hỗ trợ DN, nhằm tạo ra kênh liên lạc giữa DN với các chuyên gia trong

lĩnh vực khác nhau, ngoài ra còn có thể giới thiệu giúp DN những đối tượng phù hợp từ

các chuyên gia khác, nếu không tìm thấy thông tin sẵn có trong hệ thống. Hệ thống này

sẽ được xây dựng để thiết lập kênh giao tiếp giữa doanh nghiệp và chuyên gia trong

nhiều lĩnh vực khác nhau.

Để thực hiện ý tưởng này, các tác giả đã tiến hành phỏng vấn những người tham

gia về các vấn đề liên quan đến hệ thống. Phần lớn những người được phỏng vấn đều cho rằng một hệ thống tìm kiếm chuyên gia chuyên biệt cho các doanh nghiệp vừa và nhỏ là

điều cần thiết. Và một hệ thống lý tưởng phải cung cấp các tính năng thiết yếu sau:

Bảng 2.3. Một số tính năng cần có trong hệ thống tìm kiếm chuyên gia dành cho

DN

STT

Đặc trưng

Yêu cầu

1

Tìm một chuyên gia Tìm chuyên gia phù hợp nhất với truy vấn của người dùng

2

Đặt lịch với chuyên gia

Người dùng gửi yêu cầu cho một công việc cụ thể. Hệ thống sẽ phản hồi danh sách các chuyên gia tiềm năng phù

hợp với vị trí công việc.

Kết nối hoặc cộng tác

Gửi yêu cầu đặt lịch hẹn hoặc đề xuất hợp tác với một

3

với các chuyên gia

chuyên gia cụ thể

Giới thiệu/Gợi ý

Một chuyên gia có thể gợi ý một chuyên gia khác mà họ

4

chuyên gia

quen biết để đáp ứng nhu cầu của khách hàng.

5

Khách hàng đặt câu hỏi, chuyên gia trả lời.

Hỏi & Đáp của chuyên gia

Nguồn: Tác giả tổng hợp từ kết quả điều tra

64

Ngoài ra còn có một số góp ý thêm cho hệ thống như: Cần đảm bảo được chất

lượng dữ liệu đầu vào, có thể để chuyên gia tự đưa thông tin lên, v.v. Nền tảng ứng dụng

chính vẫn là Website, có một số ít đề xuất xây dựng App, và ngôn ngữ sử dụng có thể là cả tiếng Anh và tiếng Việt.

Về nguồn chuyên gia mà DN muốn hợp tác thì nhiều nhất vẫn là người Việt ở

trong nước, tiếp theo là người Việt ở nước ngoài và chuyên gia nước ngoài.

- Nắm tốt kiến thức chuyên môn

- Có kinh nghiệm thực tiễn nhiều

- Có kinh nghiệm về ngành và có cái nhìn tổng quan, lâu dài

- Cần có tư duy chiến lược, có kỹ năng quản lý và xử lý vấn đề

- Thực sự có tâm, có nhu cầu kết hợp công việc và các điều kiện khác theo thỏa thuận

- Khả năng thích nghi tốt

Những yêu cầu cụ thể mà DN mong muốn với các chuyên gia như sau:

Có thể thấy rằng, DN đã đặt khá nhiều kỳ vọng vào nguồn nhân lực chuyên gia.

Và tất cả các DN khẳng định họ rất mong chờ hệ thống này, sẽ sẵn sàng dùng thử và

đóng góp ý kiến nếu hệ thống hoàn thành và đưa vào thử nghiệm.

2.2. Thực trạng hoạt động quản lý thông tin chuyên gia tại Việt Nam

Hiện nay, hoạt động quản lý thông tin chuyên gia tại Việt Nam đang đối mặt với

nhiều thách thức về sự phân tán, thiếu chuẩn hóa và khả năng cập nhật thông tin. Các

cơ sở dữ liệu chuyên gia được quản lý bởi nhiều bộ, ngành và tổ chức khác nhau, như

Bộ Khoa học và Công nghệ (KH&CN), các tỉnh thành phố (Đà Nẵng, Bình Định v.v.),

các trường đại học, viện nghiên cứu, và các hiệp hội nghề nghiệp. Tuy nhiên, các cơ sở

dữ liệu này thường hoạt động độc lập, thiếu sự liên kết chặt chẽ, dẫn đến tình trạng phân

tán thông tin, gây khó khăn trong việc tìm kiếm và khai thác dữ liệu chuyên gia một

cách hiệu quả. Hơn nữa, hiện chưa có hệ thống tập trung quản lý thông tin về chuyên

gia trên phạm vi toàn quốc, đặc biệt trong các lĩnh vực như quản trị, tài chính, pháp lý,

công nghệ v.v.. Điều này ảnh hưởng đáng kể đến khả năng tiếp cận chuyên gia của các

doanh nghiệp, đặc biệt là các doanh nghiệp nhỏ và vừa.

Bên cạnh đó, cách thức thu thập thông tin chuyên gia chủ yếu được thực hiện

bằng cách để các chuyên gia gửi thông tin theo mẫu, sau đó các đơn vị chủ quản sẽ tổng

65

hợp và cập nhật lên CSDL chung. Với cách làm này, mặc dù thông tin chuyên gia sẽ có

tính tin cậy cao, tuy nhiên sẽ phải đánh đổi về chi phí thời gian, công sức và số lượng

chuyên gia được thu thập. Vì thế, nếu có thể thực hiện thu thập dữ liệu từ nhiều nguồn

và nhiều cách khác nhau, cả thủ công và tự động, đồng thời chuyên gia có thể tương tác

trực tiếp với các hệ thống quản lý và tìm kiếm chuyên gia, thì có thể tạo ra nguồn dữ

liệu chuyên gia phong phú và đầy đủ hơn.

Ngoài ra, các hệ thống hiện tại chưa có cơ chế cập nhật thường xuyên, dẫn đến

tình trạng dữ liệu có thể bị lỗi thời hoặc không đầy đủ. Việc áp dụng công nghệ trong

quản lý thông tin chuyên gia vẫn còn hạn chế. Phần lớn các hệ thống chưa ứng dụng các

công nghệ tiên tiến như trí tuệ nhân tạo (AI) hay học máy (machine learning) để hỗ trợ

việc tìm kiếm, phân tích và khuyến nghị chuyên gia. Điều này làm giảm tính hiệu quả

của các hệ thống quản lý và kết nối thông tin hiện tại.

Hơn nữa, việc hợp tác và chia sẻ dữ liệu giữa các tổ chức vẫn còn hạn chế do

thiếu các cơ chế chia sẻ dữ liệu rõ ràng và các quy định hợp tác chính thức. Các doanh

nghiệp, đặc biệt là các doanh nghiệp nhỏ và vừa, gặp khó khăn trong việc tìm kiếm và

kết nối với các chuyên gia phù hợp. Điều này đặt ra nhu cầu cấp thiết về việc xây dựng

các hệ thống quản lý thông tin chuyên gia toàn diện, có khả năng tích hợp, chuẩn hóa và

chia sẻ dữ liệu giữa các tổ chức, đồng thời áp dụng các công nghệ hiện đại để tối ưu hóa

quá trình quản lý và sử dụng dữ liệu chuyên gia.

2.3. Đánh giá thực trạng hệ thống tìm kiếm chuyên gia hiện nay

2.3.1. Các hệ thống tìm kiếm chuyên gia hiện nay

Tại Việt Nam, kênh được doanh nghiệp sử dụng để tìm kiếm nhân lực chủ yếu là

các website tìm việc. Tuy những trang web này chứa lượng lớn thông tin về các ứng

viên, tuy nhiên hầu hết các ứng viên là những lao động phổ thông, ít ứng viên chuyên

gia hoặc những người có chuyên môn cao. Vì thế, những kênh này sẽ không được lựa

chọn để đưa vào so sánh với các hệ tìm kiếm chuyên gia khác.

Ngoài ra, một số hệ thống tìm kiếm chuyên gia của các Bộ, ban ngành, các tổ

chức nghiên cứu, các trường Đại học. Điển hình như bộ CSDL chuyên gia KH&CN phát

triển bởi Bộ Khoa học và công nghệ; Trang thông tin về cán bộ giảng dạy và làm việc

tại các trường Đại học, Viện nghiên cứu, tổ chức nghiên cứu, v.v. Đây là những bộ dữ

liệu rất uy tín và có chất lượng cao, giới thiệu các chuyên gia đầu ngành. Tuy nhiên,

66

những dữ liệu này phần lớn là về chuyên gia Khoa học, chưa có các chuyên gia Công

nghệ. Vì thế, đây sẽ là những kênh dữ liệu đầu vào tin cậy, có thể kết nối hoặc tích hợp

(nếu được phép) với hệ thống tìm kiếm chuyên gia mà NCS đề xuất trong phạm vi luận

án này.

Hình 2.2. Ví dụ CSDL chuyên gia của thành phố Đà Nẵng

Nguồn: https://chuyengia.startupdanang.vn/ChuyenGia

Bên cạnh đó, NCS sẽ thực hiện so sánh một số hệ thống tìm kiếm chuyên gia

hiện có để đánh giá xem những hệ thống này đã đáp ứng được nhu cầu của DNNVV

Việt Nam hay chưa. Như Bảng 1.1 đã trình bày về các nền tảng/lĩnh vực thường được

sử dụng trong tìm kiếm chuyên gia, gồm: Mạng xã hội, học thuật, doanh nghiệp, cộng

đồng hỏi đáp. Có khá nhiều hệ thống thuộc các nền tảng/lĩnh vực này, tuy nhiên tác giả

không thể thực hiện so sánh tất cả các hệ thống, vì vậy chỉ có thể lựa chọn bốn hệ thống đang được sử dụng và xuất hiện ở vị trí hàng đầu trên trang tìm kiếm Google khi thực hiện tìm các hệ tìm kiếm chuyên gia. Bên cạnh đó, có thêm một số hệ thống tìm kiếm chuyên gia là người Việt Nam, như Vietsearch, Vnconnect, v.v., trong đó, hệ thống Vietsearch có chứa thông tin chuyên gia trong các lĩnh vực đa dạng hơn là Vnconnect (chuyên gia về trí tuệ nhân tạo). Vì thế, NCS quyết định lựa chọn bốn hệ thống tìm kiếm

chuyên gia hàng đầu trên thế giới và một hệ thống tìm kiếm chuyên gia người Việt để thực hiện so sánh, bao gồm:

67

Bảng 2.4. Năm hệ thống tìm kiếm chuyên gia

Hệ thống

Nền tảng/lĩnh vực

Mục tiêu

LinkedIn8

Mạng xã hội

Trang mạng xã hội được thiết kế riêng cho cộng đồng doanh nghiệp, cá nhân có nhu cầu kết nối tìm việc, tuyển dụng và tìm kiếm cơ hội việc làm.

Google Scholar9

Học thuật

Công cụ tìm kiếm thông tin tài liệu trên quy mô lớn, thiên về học thuật và chứa đựng nhiều thông tin về đa dạng ngành nghề với các nguồn trích dẫn cụ thể, thông tin về các nhà nghiên cứu từ khắp nơi trên thế giới.

ExpertFile10

Doanh nghiệp

Là hệ thống giới thiệu mạng lưới chuyên gia, quảng bá thông tin chuyên gia đến các khách hàng, đồng thời xây dựng các nền tảng hỗ trợ hoạt động của doanh nghiệp như: Marketing, HR, IT, Sales, v.v.

Cộng đồng hỏi đáp

Quora11

Là cộng đồng để kết nối những người có kiến thức với những người cần kiến thức, bằng cách đặt những câu hỏi quan trọng và nhận câu trả lời từ những người hiểu biết sâu về điều đó .

VietSearch12

Không phân biệt lĩnh vực

Là kênh thông tin kết nối cộng động người Việt trên toàn thế giới, cung cấp các dữ liệu tài nguyên Việt, bao gồm: Chuyên gia người Việt, Công ty và dịch vụ của người Việt.

Nguồn: Tác giả tổng hợp

✔ Đánh giá về mặt chức năng

Dựa vào các yêu cầu của một hệ tìm kiếm chuyên gia lý tưởng do Singh (2013) đề xuất và kết quả khảo sát nhu cầu của DNNVV tại Việt Nam, NCS đề xuất một số tiêu chí để đánh giá chức năng của hệ thống, bao gồm:

● Độ tin cậy của nguồn thông tin về chuyên gia

● Tự động cập nhật dữ liệu cho hệ thống

8 https://www.linkedin.com/ 9 https://scholar.google.com/ 10 https://expertfile.com/ 11 https://www.quora.com/ 12 https://vietsearch.org/

● Phân loại chuyên gia theo lĩnh vực cụ thể

68

● Xếp hạng chuyên gia

● Thông tin về kinh nghiệm và hoạt động của chuyên gia

● Tìm kiếm chuyên gia phù hợp yêu cầu của người dùng, đặc biệt là chuyên gia

người Việt

● Giới thiệu/đề xuất chuyên gia theo từng lĩnh vực

● Tính năng khác: Bản đồ chuyên gia, thống kê chuyên gia, v.v.

✔ Đánh giá về mặt dữ liệu:

NCS sẽ chọn một số lĩnh vực thuộc lĩnh vực, ngành nghề hoạt động của nhóm DNNVV đã tham gia khảo sát, cũng như nhu cầu tìm kiếm chuyên gia mà họ đã đề xuất để đánh giá mức độ phù hợp giữa dữ liệu của năm hệ thống tìm kiếm chuyên gia và nhu cầu của doanh nghiệp.

Sáu từ khoá đại diện cho sáu lĩnh vực được lựa chọn bao gồm: Logistics,

Marketing, Information Technology, Law, Sales, Manufacturing.

2.3.2. Kết quả đánh giá các hệ thống

Kết quả đánh giá năm hệ thống tìm kiếm chuyên gia mà NCS đã tìm hiểu.

Bảng 2.5. Kết quả đánh giá chức năng của năm hệ thống tìm kiếm chuyên gia

Hệ thống

Vietsearch

LinkedIn

Google Scholar

Expertfile

Quora

Tính năng

Độ tin cậy của nguồn thông tin về chuyên gia

X Trung bình: Dựa vào việc thu thập hồ sơ từ nhiều nguồn khác nhau, có thể nhiều thông tin chưa được kiểm chứng

X Cao: Thông tin từ các nghiên cứu khoa học được công bố, có kiểm chứng học thuật.

X Cao: Dựa vào hồ sơ chuyên gia tự khai và xác minh từ người dùng, nhưng có thể thiếu sự kiểm chứng chuyên sâu.

X Cao: Dữ liệu do chuyên gia và tổ chức cung cấp, thông qua xác minh từ Expertfile.

X Thấp: Thông tin chủ yếu là câu trả lời cộng đồng, không có hệ thống xác minh chính thức.

X

O

X

X

O

Tự động cập nhật dữ liệu cho hệ thống

Phân loại chuyên gia theo lĩnh vực cụ thể

X Chuyên gia được phân loại theo ngành nghề, lĩnh vực chuyên môn, vị trí địa lý.

X Chuyên gia được phân loại theo ngành nghề, lĩnh vực chuyên môn, và kỹ năng.

X Phân loại theo lĩnh vực nghiên cứu và học thuật dựa trên các công trình khoa học.

X Chuyên gia được phân loại theo lĩnh vực chuyên môn và tổ chức liên kết.

O Không có hệ thống phân loại cụ thể, chủ yếu dựa vào chủ đề của câu hỏi.

Xếp hạng chuyên gia

X Xếp hạng theo thuật toán riêng

X Xếp hạng theo thuật toán riêng

X Xếp hạng theo số lần được trích dẫn các bài viết học thuật của tác giả

O Không có hệ thống xếp hạng rõ ràng cho chuyên gia.

X Chuyên gia có thể tự tối ưu hoá hồ sơ cá nhân hoặc cộng đồng đề xuất để được xếp thứ hạng cao khi tìm kiếm

69

Hệ thống

Vietsearch

LinkedIn

Google Scholar

Expertfile

Quora

Tính năng

Thông tin về kinh nghiệm và hoạt động của chuyên gia

X Thông tin đầy đủ và chi tiết.

O Chỉ phán đoán thông qua câu trả lời của chuyên gia dựa trên câu hỏi của cộng đồng.

X Thông tin đầy đủ và chi tiết, tuy nhiên người dùng cần kết nối đến mạng lưới của chuyên gia đó thì mới có thể đọc được thông tin.

X Thông tin ở mức cơ bản (địa chỉ, email, số điện thoại, lĩnh vực nghiên cứu, nơi làm việc), nếu muốn biết chi tiết hơn thì người dùng cần vào phần liên kết đến hồ sơ mạng xã hội của chuyên gia.

X Thông tin ở mức cơ bản (email, lĩnh vực nghiên cứu), chủ yếu liệt kê các bài viết học thuật, không có thông tin về quá trình hoạt động của chuyên gia

Tìm kiếm chuyên gia phù hợp yêu cầu của người dùng, đặc biệt là người Việt

O Không hỗ trợ tìm kiếm chuyên gia phù hợp với yêu cầu rõ ràng.

X Có thể tìm chuyên gia theo lĩnh vực hoạt động, theo ngành nghề, theo công ty/nơi làm việc, theo vị trí địa lý. Có thể tìm được chuyên gia tại Việt Nam.

X Khó trong việc tìm kiếm theo yêu cầu người dùng vì hệ thống không cung cấp nhiều tiêu chí để tìm kiếm. Không thể tìm được riêng chuyên gia người Việt

X Có thể tìm chuyên gia theo lĩnh vực hoạt động. Tuy nhiên, không thể tìm được riêng chuyên gia người Việt.

X Có thể tìm chuyên gia theo lĩnh vực hoạt động, theo ngành nghề, theo công ty/nơi làm việc, theo vị trí địa lý. Các chuyên gia tìm được đều là chuyên gia người Việt, phù hợp với nhu cầu của DNNVV tại Việt Nam

X

X

O

X

O

Giới thiệu/đề xuất chuyên gia theo từng lĩnh vực

X

O

O

O

O

Tính năng khác: - Bản đồ chuyên gia - Thống kê chuyên gia

Nguồn: Tác giả tổng hợp

Có thể nhận thấy, hầu hết các hệ thống tìm kiếm chuyên gia ở trên đều có khá

đầy đủ các chức năng mà một hệ tìm kiếm chuyên gia nên có, chỉ có hệ thống Quora là

chưa phù hợp với một hệ thống tìm kiếm chuyên gia điển hình. Tuy vậy, mỗi hệ thống

vẫn có những điểm mạnh và điểm yếu riêng.

Bảng 2.6 Tổng hợp ưu nhược điểm của các hệ thống

Hệ thống

Ưu điểm

Nhược điểm

- Thông tin về các chuyên gia chỉ ở mức cơ bản, nhiều trường dữ liệu chưa đầy đủ.

VietSearch

- Có đầy đủ các chức năng mà một hệ tìm kiếm chuyên gia nên có - Có thêm những tính năng mới như: Đề xuất chuyên gia có liên quan; Bản đồ chuyên gia theo vị trí địa lý và Thống kê chuyên gia. Đây là những tính năng có thể hỗ trợ cho DNNVV ở Việt Nam khi muốn tìm kiếm và hợp tác với các chuyên gia người Việt.

- Có đầy đủ các chức năng mà một hệ tìm kiếm chuyên gia nên có.

LinkedIn

- Thông tin về các chuyên gia không công khai, và không “mở” khi người dùng cần. Điều này sẽ gây khó khăn khi muốn tìm

70

Hệ thống

Ưu điểm

Nhược điểm

kiếm và tham khảo nhiều chuyên gia khác nhau để so sánh hoặc lựa chọn. - Độ tin cậy của thông tin của thể không cao do người dùng tự khai báo.

- Thông tin chuyên gia đầy đủ và chi tiết về kinh nghiệm, vị trí làm việc. Có cả chuyên gia người Việt và nước ngoài. - Tính tương tác cao thông qua việc kết nối đến mạng lưới của từng chuyên gia.

- Các tính năng như Độ tin cậy của dữ liệu, Tự động cập nhật hay xếp hạng chuyên gia là những điểm nổi bật của nền tảng này.

GoogleScholar

- Thông tin chỉ có email và lĩnh vực hoạt động, không xác định được kinh nghiệm, vị trí làm việc và những thông tin chuyên sâu khác của chuyên gia. - Không tìm kiếm được theo nhiều tiêu chí mà người dùng cần. Không có chính xác số lượng kết quả trả về. - Không tìm riêng được chuyên gia người Việt.

ExpertFile

- Hệ thống ít phổ biến ở Việt Nam - Ít hỗ trợ tìm kiếm chuyên gia người Việt. - Hồ sơ chuyên gia thường được xây dựng thông qua các tổ chức liên kết. Vì thế, thông tin chuyên gia sẽ không được phong phú và đầy đủ.

- Thông tin của chuyên gia khá đầy đủ và chi tiết về thông tin liên lạc, vị trí làm việc, kinh nghiệm, v.v. - Số lượng danh mục theo lĩnh vực từ A đến Z nhiều (1293). - Phù hợp cho các doanh nghiệp tìm kiếm các chuyên gia để hợp tác.

- Mạng lưới cộng đồng lớn. - Dễ dàng truy cập kiến thức. - Có thể tìm chuyên gia dựa theo câu trả lời.

Quora

- Thiếu kiểm chứng thông tin, do người trả lời có thể là bất kỳ ai. - Không phân loại và đánh giá chuyên gia rõ ràng. - Không tập trung vào tìm kiếm chuyên gia.

Nguồn: Tác giả tổng hợp

Từ kết quả trên, tác giả nhận thấy, một hệ thống tìm kiếm chuyên gia cho DN

nên được xây dựng theo cách thức của Vietsearch, Linked hoặc ExpertFile. Tuy nhiên,

cần có những điều chỉnh để phù hợp hơn với nhu cầu của DN. Vì thế, tác giả đề xuất thêm một số chức năng để các hệ tìm kiếm chuyên gia có thể tăng tính tương tác với người dùng, cũng như phù hợp hơn với nhu cầu của doanh nghiệp nói chung, và DNNVV tại Việt Nam nói riêng, như:

● FAQs: Hỏi đáp với chuyên gia

● Đặt hàng chuyên gia: Gửi yêu cầu của doanh nghiệp về vị trí công việc mà họ cần, sau đó chuyên gia của hệ thống sẽ xem xét và có thể phản hồi yêu cầu đó.

● Đề xuất nhóm cộng tác: Khi doanh nghiệp đưa một yêu cầu cụ thể, hệ thống có

thể đề xuất nhóm một nhóm chuyên gia phù hợp với nhu cầu.

71

● Tìm kiếm theo danh mục ngành nghề

Tổng kết kết quả bộ dữ liệu trả về khi tìm kiếm các chuyên gia theo từng lĩnh vực của 5 hệ thống. Tuy nhiên, điểm khác biệt là số lượng chuyên gia trả về của Vietsearch

toàn bộ là người Việt, còn các hệ thống còn lại là không phân biệt quốc gia.

Bảng 2.7. Số lượng kết quả trả về khi tìm kiếm sáu lĩnh vực (Kết quả tìm kiếm vào ngày 26/3/2022)

Hệ thống

Vietsearch

LinkedIn

Google Scholar

ExpertFile

Quora

Từ khóa

Logistics

1,092

8,540,000

124

Chỉ liệt kê danh sách chuyên gia,

Chỉ liệt kê danh sách câu hỏi và câu

Marketing

9,460

50,000,000

1,766

sắp xếp

theo số

trả lời theo từ khóa

Information

126

10,900,000

579

Technology

lượng trích dẫn của từng tác giả, không

tìm kiếm, không biết chính xác số chuyên

gia thuộc lĩnh vực.

Law

2,453

13,200,000

1,123

biết chính xác số thuộc chuyên gia

Sales

3,127

52,700,000

915

lĩnh vực.

Manufacturing

587

8,210,000

375

Nguồn: Tác giả tổng hợp

Từ kết quả trả về khi thực hiện tìm kiếm chuyên gia theo từng lĩnh vực, có thể

đưa ra một số nhận xét như sau:

● VietSearch: Đây là nền tảng khá đặc biệt, và khác với những nền tảng còn lại, bởi vì những chuyên gia do VietSearch thu thập đều là chuyên gia người Việt ở

khắp nơi trên thế giới. Điều này sẽ đáp ứng được nhu cầu của DNNVV Việt Nam

khi muốn tìm kiếm chuyên gia người Việt tại Việt Nam và trên thế giới. Tuy

nhiên, số lượng chuyên gia trong các ngành nghề là khá chênh lệch, vì thế

VietSearch cần bổ sung thêm các chuyên gia ở đa dạng lĩnh vực hơn nữa mới có

thể đáp ứng nhu cầu tìm kiếm của nhiều doanh nghiệp hoạt động trong các lĩnh vực khác nhau.

● LinkedIn: bộ dữ liệu trên LinkedIn có số lượng bản ghi nhiều nhất, một phần do trang mạng xã hội này đã phát triển một thời gian khá dài, có cộng đồng người dùng rất lớn đến từ khắp nơi trên thế giới. Tuy nhiên, điểm bất tiện của LinkedIn

là thông tin của các chuyên gia không được công khai một cách rộng rãi, vì thế

người dùng sẽ phải lần lượt kết nối với mạng lưới của từng chuyên gia để có thể

nắm được thông tin về họ. Điều này sẽ làm tốn nhiều thời gian của mỗi người khi

sử dụng hệ thống.

72

● GoogleScholar: Mặc dù lượng kết quả trả về là vô cùng nhiều, tuy nhiên thông tin mà GoogleScholar cung cấp chủ yếu là danh sách các bài viết học thuật của chuyên gia, còn những thông tin liên quan đến công việc cụ thể, vị trí làm việc,

hoặc quá trình công tác. Vì thế, trang web này không phù hợp cho việc tìm kiếm

chuyên gia cho các vị trí làm việc của các doanh nghiệp, mà chỉ phù hợp với các nhà nghiên cứu học thuật khi muốn tìm kiếm các bài viết khoa học hoặc các

chuyên gia về một lĩnh vực nào đó.

● ExpertFile: Là những hệ thống giúp tìm kiếm chuyên gia khá chuyên nghiệp, tuy nhiên các nền tảng này phù hợp với một số quốc gia như Mỹ, Canada, v.v. là những nước mà chủ sở hữu của những nền tảng này xây dựng.

● Quora: Nền tảng này phù hợp với mục đích chia sẻ tri thức hơn là tìm kiếm thông

tin chuyên gia.

Có thể nhận thấy rằng, các hệ thống hiện tại khi vận hành vẫn còn nhiều điểm

hạn chế. Vì thế, việc xây dựng hệ thống tìm kiếm chuyên gia cho doanh nghiệp tại Việt

Nam là cần thiết trong giai đoạn hiện nay.

Tuy nhiên, một câu hỏi đặt ra là việc triển khai hệ thống tìm kiếm chuyên gia cho

DN có xung đột với CSDL chuyên gia về KH&CN mà Bộ Khoa học & Công nghệ đang

xây dựng? NCS đã thực hiện so sánh mục tiêu của hai hệ thống này và nhận thấy như sau:

- Có sự khác biệt về mục tiêu và đối tượng phục vụ của hai hệ thống. Trong khi

CSDL chuyên gia về KH&CN tập trung vào việc lưu trữ và cung cấp thông tin về các

chuyên gia trong lĩnh vực khoa học và công nghệ. Đối tượng phục vụ chủ yếu là các nhà

nghiên cứu, tổ chức khoa học, và cơ quan nhà nước. Hệ thống này hỗ trợ các hoạt động

nghiên cứu, phát triển, và chuyển giao công nghệ, đồng thời thúc đẩy sự hợp tác giữa

các tổ chức nghiên cứu và doanh nghiệp. Thì hệ thống tìm kiếm chuyên gia cho DNNVV lại tập trung vào việc hỗ trợ các nhu cầu thực tiễn của DN. Mục tiêu là cung cấp một nền tảng để doanh nghiệp có thể tìm kiếm và kết nối với các chuyên gia phù hợp nhằm giải quyết các vấn đề cụ thể, từ đó nâng cao năng lực cạnh tranh và khả năng phát triển bền vững.

- Hai hệ thống có thể bổ sung cho nhau, bằng cách tích hợp dữ liệu từ CSDL của Bộ KH&CN vào hệ thống tìm kiếm chuyên gia cho doanh nghiệp, từ đó có thể làm

phong phú thêm thông tin về chuyên gia, giúp doanh nghiệp tiếp cận được các chuyên gia trong cả lĩnh vực thực tiễn và khoa học công nghệ.

73

- Bên cạnh đó, để thực hiện việc chia sẻ và tích hợp dữ liệu, cần có các quy trình

chuẩn hóa và đồng bộ hóa dữ liệu để đảm bảo tính nhất quán, tránh trùng lặp và dư thừa

dữ liệu.

Việc chia sẻ dữ liệu cũng cần đảm bảo rằng quyền riêng tư của các chuyên gia,

và chỉ những thông tin phù hợp mới được công khai hoặc chia sẻ. Đồng thời, cần tuân thủ các quy định pháp lý về bảo vệ dữ liệu cá nhân và an toàn thông tin của Việt Nam.

- Nếu triển khai được hệ thống này, có thể giúp tối ưu hóa nguồn lực chuyên gia,

thúc đẩy sự đổi mới và hợp tác giữa DN và các nhà khoa học, và nâng cao hiệu quả quản

lý dữ liệu chuyên gia một cách hiệu quả hơn, giảm thiểu các chi phí liên quan đến việc duy trì nhiều cơ sở dữ liệu riêng biệt.

Từ đó, có thể kết luận rằng, triển khai hệ thống tìm kiếm chuyên gia cho DNNVV

là phù hợp và cần thiết trong giai đoạn hiện nay.

2.4. Đề xuất các chức năng của hệ thống tìm kiếm chuyên gia cho các DNNVV tại Việt Nam

2.4.1. Đề xuất các chức năng của hệ thống

Từ kết quả đánh giá chức năng của các hệ thống hiện có, cũng như ý kiến của các

DN thông qua việc phỏng vấn sâu về hệ thống tìm kiếm chuyên gia, NCS đề xuất một

số chức năng chính để hệ thống có thể hoàn thiện nhằm tăng cường tương tác với người

dùng, phù hợp hơn với nhu cầu của doanh nghiệp nói chung và DNNVV nói riêng.

Những chức năng này được tổng hợp dựa trên hai cơ sở:

(1) Thừa kế những chức năng từ các hệ thống tìm kiếm chuyên gia hiện nay đang

có (Bảng 2.3).

(2) Đề xuất của các doanh nghiệp đã tham gia phỏng vấn (Kết quả phỏng vấn mục 2.1).

 Tìm kiếm: Cho phép người dùng tìm kiếm chuyên gia theo danh mục công việc cụ thể, danh mục phụ, lĩnh vực chuyên môn và vị trí địa lý, cung cấp khả năng tìm kiếm toàn diện đáp ứng yêu cầu công việc cụ thể của các doanh nghiệp vừa và nhỏ.

 Hỏi đáp: Hỏi đáp cùng chuyên gia

 Đặt hàng: Gửi yêu cầu công việc của doanh nghiệp, sau đó chuyên gia sẽ xem xét

và phản hồi.

 Hợp tác: Khi doanh nghiệp có yêu cầu cụ thể, hệ thống có thể đề xuất một nhóm

chuyên gia phù hợp với nhu cầu của họ.

74

 Bản đồ: Trực quan hóa vị trí của các chuyên gia trên bản đồ để dễ dàng tham khảo

về mặt địa lý.

 Tin tức, sự kiện: Thông báo cho người dùng về tin tức và sự kiện liên quan đến các

chuyên gia trong lĩnh vực hoặc khu vực của họ.

 Thống kê: Cung cấp dữ liệu thống kê liên quan đến các chuyên gia.

Các tính năng đề xuất của hệ tìm kiếm chuyên gia dành cho doanh nghiệp vừa và

nhỏ bao gồm:

Bảng 2.8. Danh sách các chức năng đề xuất của hệ tìm kiếm chuyên gia cho

DNNVV

Chức năng

Chức năng con

Đối tượng sử dụng

Tìm kiếm

- Tìm kiếm theo tên

chuyên gia

- Tìm kiếm theo danh mục chủ đề

Tất cả các đối tượng người dùng và người quản lý hệ thống. Bao gồm:

- Tìm kiếm theo vị trí

Doanh nghiệp

- Tìm kiếm theo ngành

Chuyên gia

- Tìm kiếm theo danh mục công việc

Khách

Quản trị viên

- Tìm kiếm nâng cao: Kết hợp một số tiêu chí như Kỹ năng, Kinh nghiệm,

Trình độ học vấn, Khả năng ngôn ngữ và Độ tuổi.

- Danh sách chuyên gia hàng đầu theo

Doanh nghiệp

Danh sách chuyên gia

lĩnh vực/ ngành nghề

Chuyên gia

hàng đầu

- Danh sách chuyên gia hàng đầu theo

Khách

danh mục công việc

Quản trị viên

Quản lý hồ

- Tạo/ Cập nhật/ Xóa hồ sơ

Chuyên gia

chuyên

- Giám sát hồ sơ

Quản trị viên

sơ gia

Đặt hàng

- Gửi yêu cầu chuyên gia

Doanh nghiệp

chuyên gia

- Nhận yêu cầu

Chuyên gia

- Đề xuất chuyên gia

Quản trị viên

Hỏi đáp

- Danh sách câu hỏi

Doanh nghiệp

chuyên gia

75

Chức năng

Chức năng con

Đối tượng sử dụng

- Đặt câu hỏi

Chuyên gia

- Trả lời câu hỏi

Thống kê

- Thống kê theo danh mục công việc

Doanh nghiệp

chuyên gia

- Thống kê theo vị trí

Quản trị viên

- Thống kê theo trình độ học vấn

- Thống kê theo năm kinh nghiệm

Cộng tác

- Hợp tác chuyên gia

Doanh nghiệp

chuyên gia

- Giới thiệu chuyên gia

Chuyên gia

- Hệ thống xếp hạng và đánh giá

Quản trị viên

- Công cụ cộng tác thời gian thực

đồ

- Bộ lọc định vị địa lý

Doanh nghiệp

Bản chuyên gia

- Bản đồ tương tác

Chuyên gia

- Phân cụm địa lý

Khách

- Phân tích xu hướng địa lý

Quản trị viên

Tin

tức

- Nguồn cấp tin tức

Doanh nghiệp

chuyên gia

- Đề xuất nội dung

Chuyên gia

- Phỏng vấn chuyên gia

Khách

Quản trị viên

Sự

kiện

- Lịch sự kiện

Doanh nghiệp

chuyên gia

- Đăng ký sự kiện

Chuyên gia

- Nhắc nhở sự kiện

Khách

- Sự kiện do người dùng tạo

Quản trị viên

Nguồn: Tác giả đề xuất

Một số khuyến nghị liên quan đến cấu trúc dữ liệu để cải thiện các hệ thống tìm

kiếm chuyên gia hiện có:

 Thu thập dữ liệu tự động từ nhiều nguồn khác nhau: Mở rộng quy trình thu thập dữ liệu bao gồm nhiều nguồn khác nhau ngoài các trang web học thuật và nền

76

- Trang web của các tổ chức: Thu thập dữ liệu từ các trang web của các trường đại học, viện nghiên cứu và học viện vì các tổ chức này thường lưu giữ hồ sơ của các giảng viên và nhà nghiên cứu của họ.

- Trang cá nhân của chuyên gia: Thu thập và trích xuất dữ liệu từ các trang web cá nhân hoặc hồ sơ trực tuyến của chuyên gia. Nhiều chuyên gia duy trì thông tin chi tiết về nghiên cứu, ấn phẩm và chuyên môn của họ trên trang web cá nhân của họ.

tảng lập chỉ mục như ResearchGate, Google Scholar và Microsoft Academic Search, gồm:

 Thông tin đa chiều: Ngoài việc phân loại các chuyên gia chỉ theo lĩnh vực chuyên

- Danh mục công việc: Phân loại chuyên gia dựa trên danh mục công việc và danh mục phụ cụ thể, chẳng hạn như "Khoa học dữ liệu", "Kỹ thuật y sinh" hoặc "Chính sách môi trường".

- Vị trí làm việc: Bao gồm phân loại theo vị trí địa lý, cho phép người dùng tìm kiếm chuyên gia ở các khu vực hoặc quốc gia cụ thể. Điều này đặc biệt có giá trị trong việc kết nối các chuyên gia với các tổ chức và doanh nghiệp địa phương.

môn của họ, cần xem xét các khía cạnh bổ sung để phân loại:

 Chuẩn hóa dữ liệu: Thực hiện định dạng dữ liệu theo chuẩn và sử dụng các kỹ thuật chuẩn hóa để đảm bảo tính nhất quán trong việc trình bày dữ liệu. Điều này nâng cao khả năng sử dụng của hệ thống và đơn giản hóa quá trình tìm kiếm cho người dùng.

 Đảm bảo chất lượng dữ liệu: Thường xuyên cập nhật và duy trì cơ sở dữ liệu để đảm bảo thông tin về chuyên gia luôn chính xác và cập nhật. Thực hiện kiểm tra xác thực dữ liệu để xác định và sửa những thông tin không nhất quán, lỗi hoặc lỗi thời.

 Dữ liệu do người dùng tạo: Cho phép các chuyên gia quản lý và cập nhật hồ sơ của chính họ trong hệ thống, đảm bảo rằng chuyên môn và thành tích của họ được thể hiện chính xác. Cho phép người dùng cung cấp phản hồi về hồ sơ chuyên gia để giúp duy trì chất lượng dữ liệu.

 Tham khảo chéo và tích hợp: Triển khai khả năng tham khảo chéo để liên kết các chuyên gia hoặc lĩnh vực nghiên cứu có liên quan, cung cấp cho người dùng những hiểu biết sâu rộng hơn về chuyên môn liên quan. Cân nhắc việc tích hợp

77

các API hoặc nguồn dữ liệu bên ngoài để làm phong phú thêm hồ sơ chuyên gia với thông tin bổ sung, chẳng hạn như hồ sơ truyền thông xã hội, bằng sáng chế hoặc các đơn vị liên kết trong ngành.

 Khả năng mở rộng và tối ưu hóa hiệu suất: Thiết kế cấu trúc dữ liệu và lược đồ cơ sở dữ liệu có lưu ý đến khả năng mở rộng vì hệ thống có thể cần xử lý khối lượng dữ liệu chuyên gia ngày càng tăng theo thời gian. Tối ưu hóa các thuật toán tìm kiếm và truy xuất dữ liệu để đảm bảo truy vấn nhanh chóng và hiệu quả, ngay cả với các tập dữ liệu lớn.

Trong số các tính năng được đề xuất cho hệ tìm kiếm chuyên gia được thiết kế riêng cho các DNNVV, một số đặc điểm nổi bật bao gồm: Khả năng tìm kiếm nâng cao

cho phép người dùng tìm kiếm chuyên gia dựa trên danh mục công việc cụ thể, lĩnh vực

chuyên môn và vị trí địa lý là rất quan trọng vì chúng trao quyền cho các DNNVV tìm

kiếm các chuyên gia phù hợp chính xác với nhu cầu của họ. Chức năng đặt hàng chuyên

gia và giới thiệu chuyên gia giúp đơn giản hóa quá trình cộng tác, giúp các DNNVV dễ

dàng kết nối với các chuyên gia hơn. Bên cạnh đó, tính năng hỏi đáp chuyên gia và đề

xuất của nhóm cộng tác tạo điều kiện tương tác trực tiếp với các chuyên gia và đơn giản

hóa quy trình tập hợp các nhóm chuyên gia, thúc đẩy quá trình ra quyết định hiệu quả

cho DN. Những tính năng này, kết hợp với nhau, mang đến cho các DNNVV trải nghiệm toàn diện và thân thiện với người dùng trong quá trình tìm kiếm hợp tác chuyên gia,

đồng thời thúc đẩy khả năng cạnh tranh và đổi mới của họ trong bối cảnh kinh doanh.

2.4.2. Yêu cầu phi chức năng

 Phân loại nội dung hệ thống

Việc phân loại nội dung bao gồm: đảm bảo rằng người dùng có thể dễ dàng điều

hướng, duyệt và tìm kiếm các nội dung hệ thống. Một số cách để phân loại nội dung hệ

thống bao gồm phân loại nội dung theo chủ đề, theo nhiệm vụ, theo dịch vụ, theo nhóm đối tượng, theo vị trí địa lý hoặc theo bất kỳ sự kết hợp nào của các yếu tố này. Tuy nhiên, một trong những phương pháp phân loại phổ biến nhất là tổ chức nội dung theo chủ đề vì nó sẽ có ý nghĩa và dễ hiểu hơn.

 Độ tin cậy của hệ thống

Là thuộc tính mà bất kỳ thành phần nào của hệ thống đều hoạt động nhất quán theo thông số kỹ thuật của nó. Hệ thống có khả năng chịu lỗi và khắc phục nhanh, không làm gián đoạn hoạt động. Ngoài ra, thông tin về chuyên gia cần có độ tin cậy cao, bởi nếu thông tin sai lệch sẽ dẫn đến việc cung cấp thông tin không còn ý nghĩa nữa.

78

 Tính dễ sử dụng

Điều này bao gồm việc duyệt nội dung hệ thống nên được thực hiện với công sức

bỏ ra và thời gian tối thiểu. Muốn như thế, hệ thống các chức năng cần phải được bố trí,

sắp xếp đơn giản, rõ ràng và thuận mắt.

 Bảo mật quyền riêng tư thông tin

Các chuyên gia nếu đăng nhập hệ thống thì có thể lựa chọn để thông tin nào được

hiển thị, thông tin nào là riêng tư. Điều này giúp họ chỉ chia sẻ những thông tin họ muốn,

và giới hạn những thông tin họ không sẵn lòng chia sẻ với mọi người. Bên cạnh đó, thông tin phải được lưu trữ và bảo mật tốt tránh làm mất mát hoặc sai lệch thông tin, cần

phân quyền người dùng.

 Khả năng mở rộng trong tương lai

Có khả năng mở rộng thêm các chức năng mới. Có khả năng tích hợp hoặc kết

nối với một số hệ thống khác để phục vụ DN tốt hơn.

2.5. Tổng kết chương 2

Chương 2 đã thực hiện nghiên cứu tìm hiểu thực trạng về vấn đề quản lý thông

tin chuyên gia và về hoạt động tìm kiếm chuyên gia hiện nay thông qua việc phỏng vấn

sâu một số DNNVV Việt Nam để tìm hiểu nhu cầu, cũng như phân tích một số hệ thống

tìm kiếm chuyên gia hiện có để xác định ưu nhược điểm của các hệ thống này. Từ đó

xác định các vấn đề còn gặp phải với hệ thống và đề xuất các chức năng phù hợp với hệ thống tìm kiếm chuyên gia cho DNNVV. Những kết quả này sẽ là đầu vào để NCS đề

xuất mô hình kiến trúc cho hệ thống tìm kiếm chuyên gia cho DNNVV Việt Nam tại

Chương 3.

Kết quả phân tích nhu cầu DN về tìm kiếm chuyên gia ở Chương 2 đã được đăng

trong bài nghiên cứu:

Lê Thị Thu, Phạm Xuân Lâm (2021), ‘Phát triển hệ thống Cơ sở dữ liệu lớn về nguồn nhân lực chất lượng cao cho doanh nghiệp nhỏ và vừa tại Việt Nam: Đánh giá nhu cầu và đề xuất giải pháp’, Kỷ yếu hội thảo Quốc gia Hệ thống thông tin trong kinh doanh và quản lý ISBM’21, TP. Hồ Chí Minh, 2021.

79

CHƯƠNG 3. ĐỀ XUẤT KIẾN TRÚC THAM KHẢO HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM

3.1. Quy trình thực hiện đề xuất kiến trúc tham khảo và thử nghiệm, đánh giá hệ thống

Để tiến hành đề xuất kiến trúc tham khảo của hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam, phương pháp nghiên cứu khoa học thiết kế (DSRM) được sử dụng để phát triển và đánh giá hệ thống. Quy trình thực hiện trải qua các bước sau:

Bước 1. Nhận diện vấn đề và xác định nhu cầu

- Thiếu một nền tảng chung để kết nối và quản lý thông tin chuyên gia.

- Dữ liệu không được cập nhật đầy đủ và khó truy cập.

- Không có công cụ hiệu quả để xếp hạng và tìm kiếm chuyên gia theo các tiêu chí

Bước đầu tiên trong DSRM là nhận diện vấn đề mà hệ thống cần giải quyết. Đối với hệ tìm kiếm chuyên gia, vấn đề chính là sự phân tán và thiếu đồng bộ trong quản lý thông tin chuyên gia tại các tổ chức và cơ quan khác nhau ở Việt Nam. Các vấn đề chính bao gồm:

phù hợp.

Vì vậy, kiến trúc của hệ thống tìm kiếm chuyên gia được đề xuất phải giải quyết được những vấn đề trên bằng cách tạo ra một hệ thống tập trung, đồng bộ hóa dữ liệu từ nhiều nguồn khác nhau và cung cấp các công cụ hỗ trợ tìm kiếm, quản lý và kết nối chuyên gia.

Bước 2. Xác định mục tiêu

Các mục tiêu chính của hệ thống được xác định bao gồm việc tối ưu hóa quản lý thông tin chuyên gia, trong đó hệ thống phải đảm bảo dữ liệu chuyên gia được thu thập, làm sạch và chuẩn hóa từ nhiều nguồn khác nhau, đồng thời duy trì tính cập nhật và chính xác. Bên cạnh đó, hệ thống cần cung cấp các công cụ cho phép người dùng tìm kiếm chuyên gia theo các tiêu chí khác nhau, như lĩnh vực chuyên môn, nghề nghiệp, vị trí địa lý, hoặc tổ chức; đồng thời xếp hạng chuyên gia dựa trên các tiêu chí định trước. Ngoài ra, hệ thống phải có khả năng mở rộng để xử lý khối lượng dữ liệu lớn, do lượng dữ liệu thu thập về có thể tăng lên thường xuyên và tích hợp với các hệ thống bên ngoài thông qua các API hoặc dịch vụ dữ liệu mở.

Các mục tiêu này phải được thiết kế sao cho hệ thống có thể giải quyết các nhu

cầu thực tiễn của người dùng (các tổ chức, doanh nghiệp).

80

Bước 3. Thiết kế và phát triển

Giai đoạn tiếp theo bao gồm việc thiết kế kiến trúc và phát triển thử nghiệm hệ thống dựa trên kiến trúc tham khảo đã đề xuất. Kiến trúc hệ thống tìm kiếm chuyên gia gồm các tầng hạ tầng kỹ thuật và an toàn thông tin, tầng lưu trữ và xử lý dữ liệu, tầng nền tảng và chia sẻ tích hợp, tầng ứng dụng và dịch vụ người dùng, và tầng trình diễn.

Quá trình phát triển thử nghiệm hệ thống cần được triển khai theo kiến trúc đã đề xuất, đáp ứng các mục tiêu đặt ra. Tuy nhiên, để làm được một hệ thống hoàn chỉnh theo kiến trúc đã đề xuất cần phải có thời gian đủ dài và có bộ phận nhân lực đủ lớn để xây dựng hệ thống một cách hoàn chỉnh nhất. Vì thế, trong phạm vi luận án này, NCS chỉ mới dừng lại ở việc thử nghiệm một số thuật toán hỗ trợ các chức năng chính của hệ thống, cũng như thử nghiệm một hệ thống ở mức độ đơn giản để kiểm nghiệm tính khả thi của kiến trúc đề xuất.

Bước 4. Đánh giá hệ thống

Sau khi thiết kế kiến trúc và phát triển hệ thống thử nghiệm, bước tiếp theo là

đánh giá hệ thống để đảm bảo rằng hệ thống có đáp ứng được các mục tiêu ban đầu và

giải quyết vấn đề đã xác định. Việc đánh giá thường thông qua một số tiêu chí như:

Đánh giá hiệu suất của hệ thống, tính khả dụng và trải nghiệm của người dùng v.v. Bên

cạnh đó, việc đánh giá cần có sự tham gia của nhóm phát triển hệ thống thử nghiệm và

các đối tượng sử dụng chính như các chuyên gia, DN, và cơ quan quản lý nhà nước. Tuy

nhiên, trong phạm vi của luận án, do hệ thống chỉ mới được thử nghiệm ở mức độ đơn

giản nên NCS mới chỉ thực hiện được việc đánh giá thông qua đội ngũ phát triển hệ

thống và nhóm đối tượng sử dụng là một số DNNVV tại Việt Nam.

Các bước tiếp theo như trình bày kết quả hay nâng cấp cải tiến hệ thống sẽ

nằm trong những nghiên cứu tiếp theo, khi hệ thống đã được hoàn thiện và triển khai rộng rãi.

3.2. Kiến trúc tham khảo của hệ thống

3.2.1. Kiến trúc nền tảng

13 https://www.opengroup.org/togaf 14 https://zachman-feac.com/zachman/about-the-zachman-framework

Hiện nay, có một số mô hình kiến trúc phổ biến, thường được sử dụng làm cơ sở để phát triển kiến trúc của các hệ thống thông tin như TOGAF13, Zachman14, hay mô

81

hình Microservices15 và kiến trúc hướng dịch vụ (SOA) (Krafzig & cộng sự, 2004). Tuy nhiên, NCS lựa chọn khung TOGAF làm khung kiến trúc nền tảng cho việc xây dựng

kiến trúc hệ thống tìm kiếm chuyên gia cho DN, bởi TOGAF cung cấp một khung công việc toàn diện và có cấu trúc rõ ràng. TOGAF không chỉ định rõ các bước cụ thể từ phân

tích yêu cầu, thiết kế, đến triển khai và quản lý hệ thống, mà còn cung cấp các phương pháp và công cụ để đảm bảo tính nhất quán và toàn vẹn của kiến trúc. Điều này đặc biệt

quan trọng đối với hệ thống tìm kiếm chuyên gia, nơi mà sự tích hợp liền mạch giữa các

dịch vụ và khả năng mở rộng, bảo trì dễ dàng là yếu tố then chốt. TOGAF cũng giúp

giảm thiểu rủi ro và tối ưu hóa chi phí thông qua việc cung cấp các hướng dẫn chi tiết và chuẩn hóa quy trình, đảm bảo rằng hệ thống được thiết kế đáp ứng đầy đủ các yêu

cầu nghiệp vụ và kỹ thuật của doanh nghiệp. Hơn nữa, sự công nhận rộng rãi và áp dụng

chuẩn mực công nghiệp của TOGAF đảm bảo rằng kiến trúc của hệ thống tìm kiếm

chuyên gia sẽ phù hợp với các tiêu chuẩn quốc tế và có thể dễ dàng thích ứng với sự

phát triển và thay đổi của công nghệ trong tương lai.

Bên cạnh đó, khung kiến trúc Chính phủ điện tử Việt Nam, phiên bản 3.0 (Bộ

Thông tin và truyền thông, 2023) cũng là một kiến trúc hữu ích, bởi khung kiến trúc này

cũng kế thừa từ khung kiến trúc TOGAF và cải tiến để phù hợp với bối cảnh Việt Nam

hiện nay. Khung kiến trúc này bao gồm các nguyên tắc và tiêu chuẩn về CNTT, dữ liệu,

quản lý an toàn thông tin và tương tác người dùng, nhằm đảm bảo tính thống nhất, khả

năng mở rộng và bảo mật của các hệ thống. Trong đó, khung kiến trúc Chính phủ điện

tử 3.0 đặc biệt chú trọng đến: Tầng ứng dụng và dịch vụ, tầng chia sẻ và tích hợp dữ

liệu, tầng hạ tầng kỹ thuật, và tầng quản lý dữ liệu. Việc áp dụng khung kiến trúc Chính

phủ điện tử 3.0 cho hệ thống tìm kiếm chuyên gia sẽ giúp đảm bảo hệ thống tuân thủ các tiêu chuẩn và quy định hiện hành, đồng thời tận dụng được những lợi thế về tính

thống nhất, khả năng tích hợp và bảo mật cao. Chính vì vậy, những khung kiến trúc này

có thể giúp NCS đề xuất được mô hình kiến trúc hệ thống tìm kiếm chuyên gia cho

DNNVV tại Việt Nam một cách phù hợp.

3.2.2. Đề xuất kiến trúc tham khảo

15 https://microservices.io/

Thông qua việc phân tích các yêu cầu cũng như mong muốn có được một kiến trúc hệ thống phù hợp với yêu cầu của hệ tìm kiếm chuyên gia, NCS đề xuất kiến trúc tham khảo theo cấu trúc phân tầng. Trong đó, các tầng được chồng xếp lên nhau thể hiện

82

quan hệ dạng cung cấp - sử dụng, tầng bên dưới cung cấp dịch vụ cho tầng bên trên sử

dụng. Việc xây dựng kiến trúc theo mô hình phân tầng giúp đảm bảo hệ thống tìm kiếm

chuyên gia hoạt động hiệu quả, linh hoạt và có khả năng mở rộng, đồng thời tuân thủ các quy định chung. Mỗi tầng có các thành phần và chức năng rõ ràng, hỗ trợ và cung

cấp dịch vụ cho các tầng khác, tạo nên một hệ thống thống nhất và mạnh mẽ.

Kiến trúc này được đặt tên là VietSME-EFSA (Expert Finding System Architecture

for Vietnam SMEs) – Kiến trúc hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam.

Các tầng trong sơ đồ kiến trúc:

1. Tầng người dùng và kênh giao tiếp:

- Thể hiện tất cả người dùng có thể sử dụng các dịch vụ được Kiến trúc hệ thống

tìm kiếm chuyên gia cho DNNVV cung cấp. Tuỳ thuộc vào vai trò của người dùng, họ

có thể tiếp cận và sử dụng các dịch vụ với nhiều mức độ khác nhau.

- Thể hiện các hình thức, phương tiện mà qua đó người sử dụng tiếp cận và sử

dụng được các dịch vụ thông tin được mà hệ thống này cung cấp.

2. Tầng Ứng dụng và dịch vụ: Tầng này là sự gom nhóm, kết hợp các tầng Dịch

vụ cổng thông tin, và phần ứng dụng trong tầng Ứng dụng trong hệ thống. Mục đích của

việc gom nhóm, kết hợp này nhằm đảm bảo tính logic trong kiến trúc; phù hợp với hiện

trạng và định hướng triển khai của doanh nghiệp, tổ chức và của các bộ ban ngành. Tầng

này thể hiện tất cả các dịch vụ và các ứng dụng hỗ trợ cho hệ thống có liên quan.

3. Tầng Nền tảng chia sẻ, tích hợp: Tầng này bao gồm các dịch vụ dùng chung

hỗ trợ trực tiếp các ứng dụng và dịch vụ tầng trên, các dịch vụ chia sẻ, tích hợp, kết nối

liên thông giữa các ứng dụng bên trong và các ứng dụng bên ngoài.

4. Tầng Quản lý dữ liệu (bao gồm xử lý dữ liệu và lưu trữ, quản trị dữ liệu):

Tầng này bao gồm việc xử lý và lưu trữ tất cả các nhóm CSDL mà hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam cần xây dựng, kết hợp với Cơ sở tri thức về chuyên gia liên tục được cập nhật để có thể giúp hệ thống trả về kết quả tìm kiếm nhanh và phù hợp nhất với yêu cầu của DN.

5. Tầng Hạ tầng kỹ thuật – công nghệ và An toàn thông tin mạng: Tầng này cung cấp hạ tầng CNTT và ATTT mạng để triển khai các dịch vụ, ứng dụng và CSDL trong

kiến trúc, bao gồm các nền tảng hỗ trợ tính toán, lưu trữ, kết nối… và các thiết bị đảm bảo an toàn, an ninh thông tin, v.v.

Kiến trúc tham khảo chi tiết được mô tả như trong Hình 3.1 bên dưới.

83

Nguồn: Tác giả đề xuất

Hình 3.1. Kiến trúc tham khảo VietSME-EFSA của hệ thống tìm kiếm chuyên gia

84

3.3. Mô tả các thành phần

3.3.1. Tầng người dùng và kênh giao tiếp

3.3.1.1. Người dùng

Tầng này là nơi tương tác trực tiếp với người dùng, thể hiện các kênh giao tiếp

và quyền truy cập vào các dịch vụ của hệ thống. Người dùng có thể bao gồm khách truy cập, doanh nghiệp, chuyên gia, và các bộ ban ngành với các quyền truy cập khác nhau

dựa trên vai trò của từng đối tượng.

Đơn vị triển khai và quản lý hệ thống có thể là: Đơn vị, tổ chức/DN, Bộ, ban

ngành, cơ quan Nhà nước có nhiệm vụ hỗ trợ doanh nghiệp như: Bộ Công thương, Liên đoàn Thương mại và Công nghiệp Việt Nam VCCI, Hiệp hội DNNVV các tỉnh, thành

phố, v.v.

Bảng 3.1. Người dùng chính của hệ thống tìm kiếm chuyên gia

STT

Đối tượng

Mô tả

1

Quản trị viên (Đơn vị quản lý hệ thống)

Quản lý toàn bộ hệ thống, chịu trách nhiệm vận hành, giám sát và quản trị hệ thống.

2

Doanh nghiệp

Có thể vừa tìm kiếm chuyên gia, vừa cung cấp thông tin chuyên gia, và đăng tải các dự án, lời mời hợp tác.

Xem, cập nhật thông tin chuyên môn trong hồ sơ chuyên gia.

3

Chuyên gia

Xem xét các dự án, lời mời hợp tác từ các doanh nghiệp/tổ chức/cá nhân. Trả lời câu hỏi từ các DN, giới thiệu, hợp tác

chuyên gia với DN hoặc với các nhà khoa học khác.

Xem, tìm kiếm, cung cấp thông tin chuyên gia. Theo dõi và

4

Bộ, ban ngành

hỗ trợ các dự án, các vấn đề liên quan đến quản lý chuyên gia.

Những người chưa có tài khoản trên hệ thống nhưng có thể

5

Khách

truy cập và tìm hiểu về các dịch vụ cơ bản, xem thông tin tổng quát về hệ thống, chuyên gia hoặc doanh nghiệp.

Nguồn: Tác giả đề xuất

3.3.1.2. Kênh giao tiếp

Đây là tầng đóng vai trò kết nối người dùng với hệ thống. Bao gồm các kênh giao tiếp như cổng thông tin, website, ứng dụng di động, email, v.v. đảm bảo người dùng có

thể truy cập hệ thống qua nhiều phương tiện khác nhau.

85

Bảng 3.2. Các kênh giao tiếp của hệ thống

STT

Kênh

1

Cổng thông tin

2

Website

3

Ứng dụng di động (App)

4

API

5

Thư điện tử

6

Chatbot

Mô tả Là một nền tảng dựa trên web cung cấp cho người dùng một điểm truy cập thông tin duy nhất. Qua kênh giao tiếp này người dùng cũng thể tương tác/giao dịch với các ứng dụng của hệ thống. Được xây dựng để ngoài người dùng là khách từ bên ngoài, hoặc các thành viên của doanh nghiệp, tổ chức có thể sử dụng và tương tác với các thông tin và ứng dụng nghiệp vụ của hệ thống. Cung cấp ứng dụng cho phép truy cập từ các thiết bị di động, phục vụ người dùng ở mọi nơi. Cho phép bên thứ ba truy xuất thông tin chuyên gia phục vụ tìm kiếm và hợp tác, hoặc tích hợp dữ liệu chuyên gia vào hệ thống của họ. Gửi thông tin chuyên gia, hoặc các thông báo đến người dùng qua email. Công cụ hỗ trợ người dùng tìm kiếm thông tin, hỏi đáp nhanh thông qua giao tiếp tự động.

Nguồn: Tác giả đề xuất

Trong kiến trúc đề xuất, ba tầng đóng vai trò quan trọng nhất, cũng là trung tâm của kiến trúc bao gồm: Tầng Quản lý dữ liệu – Tầng chia sẻ, tích hợp – Tầng Ứng dụng, dịch vụ. Vì thế, NCS sẽ đi sâu vào phân tích quy trình thực hiện của ba tầng này.

3.3.2. Tầng quản lý dữ liệu

Trong hệ thống tìm kiếm chuyên gia, tầng này đóng vai trò then chốt trong việc quản dữ liệu liên quan đến chuyên gia, bao gồm các nội dung: thu thập, lưu trữ và xử lý dữ liệu, cũng như xây dựng Ontology - mô hình tri thức về chuyên gia (Hình 3.2).

Nguồn: Tác giả đề xuất

Hình 3.2. Quy trình thu thập, lưu trữ và xử lý dữ liệu chuyên gia

86

3.3.2.1. Dữ liệu và cơ sở tri thức chuyên gia

Thông tin chuyên gia có thể được thu thập thủ công hoặc tự động, nhưng hệ thống sẽ hoạt động tốt hơn nếu có thêm sự hỗ trợ từ Cơ sở tri thức về chuyên gia (Hình 3.3). Cơ sở tri thức thức bao gồm danh sách các chức danh và vị trí, công việc theo ngành hoặc lĩnh vực, các trường đại học xếp hạng cao và các công ty có nhiều chuyên gia làm việc, chứng chỉ v.v. Dữ liệu tri thức đến từ nhiều nguồn khác nhau được rút ra từ các danh mục được xác định trước, chẳng hạn như danh bạ các trang vàng (Yellow Pages), danh bạ các tạp chí nghiên cứu, danh bạ các trường đại học có danh tiếng hoặc danh bạ các công ty vốn hóa lớn (Brennan & cộng sự, 2009). Bộ dữ liệu này sẽ được cập nhật thường xuyên trong quá trình phân tích và xử lý dữ liệu.

Hơn nữa, Cơ sở tri thức về chuyên gia cũng tạo điều kiện thuận lợi cho việc xử lý dữ liệu tiếng Việt, bao gồm thông tin liên quan đến 3.000 loại nghề nghiệp bằng cả tiếng Việt và tiếng Anh, với hỗ trợ từ đồng nghĩa. Ngoài ra, nó bao gồm tên của gần 200 quốc gia, hoàn chỉnh với tọa độ địa lý và tên bằng tiếng Việt cũng như nhiều ngôn ngữ khác, cùng với số điện thoại, để phục vụ khách hàng quốc tế sử dụng số điện thoại toàn cầu. Cơ sở tri thức còn bao gồm 200 tên hoặc họ phổ biến của người Việt Nam (unigram) và gần 10.000 tổ hợp họ phổ biến của người Việt Nam (bigram) để hỗ trợ việc xác định tên tiếng Việt.

Thông tin chuyên gia cần được tổ chức và lưu trữ hiệu quả, giúp thông tin dễ dàng truy cập và hữu ích cho nhiều ứng dụng khác nhau, chẳng hạn như xếp hạng chuyên gia, hệ thống khuyến nghị giới thiệu/hợp tác chuyên gia.

Cơ sở tri thức về chuyên gia được xây dựng theo quy trình 5 bước:

Thu thập dữ liệu - Danh bạ các

Xác định thực thể và thuộc tính

trang vàng

Lưu trữ và quản lý - Sử dụng cơ sở

- Tổ chức

dữ

liệu đồ

thị

- Danh bạ các trường đại học,

- Lĩnh vực chuyên môn

Xây dựng Ontology – mô hình tri thức chuyên gia - Xây dựng mô

Neo4j để lưu trữ và quản lý các

- Vị trí địa lý

hình tri thức theo

doanh nghiệp - Danh bạ các tạp

mối quan hệ giữa các chuyên gia

- Công việc - v.v

chí nghiên cứu - v.v.

các chuẩn OWL RDF và (Resource

Tích hợp và cập nhật - Tích hợp với các hệ thống dữ liệu khác

- Cập nhật thường xuyên

Nguồn: Tác giả đề xuất

Hình 3.3. Quy trình xây dựng cơ sở tri thức về chuyên gia

87

Những thông tin dưới đây sẽ được lưu trữ trong cơ sở tri thức về chuyên gia:

Lĩnh vực chuyên môn: Đây là thành phần quan trọng của cơ sở tri thức, được thể

hiện thông qua một ontology xác định hệ thống phân cấp nghề nghiệp, lĩnh vực chuyên môn của chuyên gia. Các thông tin sẽ được phân loại và phân cấp theo cấp độ, thể hiện

mối liên hệ giữa lớp cha và con.

Vị trí địa lý: Thông tin về vị trí địa lý của chuyên gia, bao gồm thành phố, quốc

gia và khu vực, cho phép các chức năng tìm kiếm và đề xuất dựa trên vị trí.

Công việc: Thông tin về vị trí, công việc của các chuyên gia trong các lĩnh vực,

hoặc trong các tổ chức/doanh nghiệp sẽ được thu thập và tạo thành bộ dữ liệu trong cơ sở tri thức về các loại công việc liên quan đến các ngành nghề, lĩnh vực. Điều này sẽ

giúp ích cho chức năng tìm kiếm dựa trên vị trí việc làm.

Độ uy tín của Tổ chức/Doanh nghiệp: Thông tin này sẽ giúp ích cho việc tìm

kiếm hoặc xếp hạng chuyên gia dựa trên mức độ uy tín của những nơi họ từng làm việc

hoặc cộng tác.

Mối quan hệ chuyên gia: Mối quan hệ giữa các chuyên gia, chẳng hạn như mạng

lưới cộng tác, hợp tác trong các dự án, mối quan hệ đồng tác giả, kết nối người cố vấn-

người được cố vấn và các hiệp hội nghề, v.v. Điều này tạo điều kiện thuận lợi cho việc

phân tích mạng lưới và đề xuất các hoạt động hợp tác tiềm năng.

Bộ tiêu chí xếp hạng chuyên gia: Mô tả các trường thông tin sẽ được thu thập để

xếp hạng chuyên gia.

3.3.2.2. Quản lý dữ liệu

a. Thu thập dữ liệu

Do dữ liệu được thu thập từ các nguồn khác nhau như cơ sở dữ liệu, API, các trang web, và người dùng nhập liệu nên cần đảm bảo tính thống nhất, tích hợp và cập nhật. Ngoài ra, cơ chế thu thập dữ liệu từ nhiều nguồn mà vẫn đảm bảo tính khả thi và đảm bảo tính pháp lý cần được xem xét kỹ lưỡng, cẩn thận để đảm bảo yêu cầu của hệ thống.

Cơ chế thu thập dữ liệu của hệ thống sẽ được mô tả chi tiết trong Hình 3.4.

 Nguồn thu thập dữ liệu

Hệ thống tìm kiếm chuyên gia có thể thu thập dữ liệu từ bốn nguồn chính:

(1) Chuyên gia tự cung cấp thông tin,

88

(2) Nguồn mở có kiểm chứng bao gồm website các cơ quan, tổ chức uy tín (nơi

làm việc hoặc cấp chứng chỉ cho chuyên gia), và các trang mạng xã hội học thuật,

việc làm, (3) Trung tâm DL Quốc gia (áp dụng với các hệ thống tìm kiếm chuyên gia được

quản lý bởi Bộ, ban ngành được cấp phép), (4) Quản trị viên tự cập nhật thông tin chuyên gia lấy từ nguồn chính thống.

Nguồn: Tác giả đề xuất

Hình 3.4. Quy trình thu thập dữ liệu từ nhiều nguồn

Một số nguồn dữ liệu điển hình như: Cơ sở dữ liệu lưu trữ thông tin liên hệ cá nhân và các kỹ năng chuyên môn của các tổ chức, doanh nghiệp, Bộ ban ngành, cơ quan

89

Nhà nước. Những nơi này thường có danh sách cán bộ, các nhà khoa học trong đó có

thông tin về họ tên, địa chỉ, email, điện thoại, học hàm học vị, lĩnh vực nghiên cứu,

những dự án họ đã tham gia hoặc sách, bài báo họ đã viết. Những thông tin này chứa các trường thông tin khá rõ ràng, tuy nhiên sẽ có một số hạn chế: Thông tin không có

cấu trúc, sự đầy đủ của các trường thông tin không giống nhau giữa các nhà khoa học, DL tĩnh. Loại DL này đôi khi không thể thu thập tự động được mà phải thu thập thủ

công do dữ liệu không có cấu trúc và không đầy đủ; Tập các tài liệu từ các kết quả tìm

kiếm trực tuyến hoặc ngoại tuyến, chẳng hạn như các ấn phẩm, báo cáo, e-mail, diễn

đàn Hỏi và Đáp, các trang web, trang cá nhân của chuyên gia để xác định chuyên môn của chuyên gia. Việc khám phá thông tin từ các tài liệu này được thực hiện tự động

thông qua một số thuật toán liên quan đến truy xuất thông tin, phân tích ngữ nghĩa, v.v;

Mạng lưới giới thiệu, nơi chuyên gia được giới thiệu bởi một người quen thuộc với các

kỹ năng và kiến thức của chuyên gia. Loại dữ liệu này thường thấy ở một trang web

hoặc mạng xã hội, tập hợp một nhóm người có cùng sở thích hoặc cùng nghề nghiệp. Ví

dụ các mối quan hệ như đồng nghiệp, sinh viên/giáo viên và tác giả/đồng tác giả (của

một nghiên cứu); CSDL chuyên gia từ các trang mở, chứa thông tin về chuyên gia và

các ấn bản, tài liệu, thông tin hoạt động, v.v. Các trang trang mạng xã hội học thuật

(Google Scholar, ResearchGate, v.v.), mạng xã hội việc làm (LinkedIn) là những nguồn

dữ liệu có độ tin cậy cao, và được cập nhật liên tục.

 Phương pháp thu thập dữ liệu

Các dữ liệu này được thu thập thông qua nhiều phương thức như API, cào dữ liệu từ

Web, Form nhập liệu, v.v; sau đó hệ thống sẽ xác thực, xử lý, lưu trữ vào cơ sở dữ liệu

chuyên gia. Để đảm bảo tính khả thi, hệ thống sẽ áp dụng bốn phương pháp thu thập dữ

liệu:

(1) Thu thập dữ liệu tự khai báo từ chuyên gia. Khi đăng ký, chuyên gia bắt buộc

phải cung cấp thông tin hồ sơ cá nhân, kinh nghiệm làm việc, chuyên môn, chứng chỉ. Hệ thống sẽ có cơ chế xác thực dữ liệu như yêu cầu tải lên bản sao chứng chỉ, liên kết với tổ chức cấp chứng chỉ v.v. Đồng thời, các chuyên gia có thể cập nhật thông tin theo định kỳ để giúp dữ liệu có độ chính xác cao;

(2) Thu thập dữ liệu từ quá trình nhập liệu thủ công của Quản trị viên (3) Thu thập dữ liệu từ các tổ chức và nguồn mở có kiểm chứng. Hệ thống có thể

tích hợp API với các tổ chức đào tạo, hiệp hội nghề nghiệp để tự động cập nhật chứng chỉ, thông tin chuyên gia. Với nguồn dữ liệu từ mạng xã hội hoặc trang web, hệ thống sẽ thu thập dữ liệu tự động thông qua các công cụ như Web Scraping hoặc ứng dụng AI để xác minh độ chính xác của thông tin.

90

(4) Kết nối với trung tâm DL Quốc gia thông qua nền tảng Tích hợp, chia sẻ dữ

liệu của Chính phủ. Quá trình này có thể thực hiện nếu đơn vị quản lý hệ thống được uỷ

quyền và cấp phép để truy cập vào trung tâm DL của Quốc gia.

 Tính pháp lý

Để đảm bảo tính pháp lý trong quá trình thu thập dữ liệu, hệ thống sẽ tuân thủ các quy

định của Luật Bảo vệ dữ liệu cá nhân tại Việt Nam, như hệ thống chỉ thu thập thông tin

công khai của chuyên gia, đồng thời gửi email thông báo cho chuyên gia khi dữ liệu của

họ được thu thập. Cung cấp cơ chế cho chuyên gia yêu cầu chỉnh sửa hoặc xóa dữ liệu

cá nhân. Đáp ứng quy định về xử lý dữ liệu cá nhân trong giao dịch điện tử, thực hiện mã hóa và bảo vệ dữ liệu cá nhân, tránh rò rỉ hoặc sử dụng sai mục đích. Bên cạnh đó,

xây dựng chính sách quyền riêng tư rõ ràng. Khi chuyên gia hoặc doanh nghiệp sử dụng

hệ thống, họ sẽ cần đọc và chấp nhận các chính sách về quyền riêng tư.

Dữ liệu được thu thập về sẽ chia làm hai nhóm chính:

- Dữ liệu tập trung: Lưu trữ các CSDL có cấu trúc.

- Dữ liệu phân tán: Lưu trữ dữ liệu thô, dữ liệu phi/ bán cấu trúc về chuyên gia.

 Cơ chế cập nhật dữ liệu định kỳ

Việc cập nhật dữ liệu định kỳ là hết sức cần thiết nhằm đảm bảo tính chính xác, và tính

cập nhật của dữ liệu. Tuy nhiên, để tránh để tránh dư thừa dữ liệu và giảm tải hệ thống,

chỉ cập nhật những dữ liệu mới thay vì toàn bộ dữ liệu. Thực hiện xử lý dữ liệu theo lô

và theo thời gian biểu định trước. Cơ chế cập nhật dữ liệu định kỳ bao gồm ba phương

thức chính: Cập nhật tự động từ các nguồn bên ngoài thông qua API hoặc cào dữ liệu

từ web theo quý. Các trang như Google Scholar, ResearchGate sẽ thực hiện cập nhật theo quý để bổ sung bài báo, công trình mới. Hoặc từ LinkedIn để cập nhật thông tin

mới về nghề nghiệp, vị trí việc làm của chuyên gia. Cập nhật theo yêu cầu cho phép chuyên gia hoặc doanh nghiệp chủ động cập nhật thông tin khi cần. Cập nhật thủ công theo năm, bởi sau một năm, các nhà khoa học thường sẽ tổng kết các kết quả nghiên cứu

để báo cáo với đơn vị chủ quản. Vì thế, những thông tin này có thể được chia sẻ để người quản trị thực hiện cập nhật dữ liệu trực tiếp. Ngoài ra, cần kiểm duyệt thông tin trước khi công khai.

b. Làm sạch, chuẩn hóa dữ liệu

91

Dữ liệu sau khi thu thập về sẽ được làm sạch và chuẩn hóa dữ liệu, loại bỏ các

dữ liệu không chính xác, không đầy đủ hoặc không hợp lệ, và chuẩn hóa định dạng dữ

liệu theo tiêu chuẩn.

Quy trình bóc tách dữ liệu bao gồm việc trích xuất thông tin từ nhiều nguồn dữ

liệu khác nhau, bao gồm hồ sơ chuyên gia, cơ sở dữ liệu doanh nghiệp và các nguồn dữ

liệu bên ngoài. Sau khi dữ liệu được trích xuất, quá trình sàng lọc được thực hiện để loại

bỏ các thông tin không cần thiết hoặc không chính xác, nhằm giữ lại những dữ liệu có

giá trị và phù hợp. Tiếp theo, quy trình chuẩn hóa dữ liệu được tiến hành để đảm bảo

rằng tất cả dữ liệu được định dạng theo các chuẩn mực nhất quán, tạo điều kiện thuận

lợi cho việc quản lý và sử dụng. Một số kỹ thuật sử dụng trong nghiệp vụ này như công

cụ ETL để trích xuất dữ liệu từ các nguồn khác nhau, bao gồm cơ sở dữ liệu, tệp tin, và

các API dịch vụ web. Dữ liệu sau đó được chuyển đổi thành định dạng phù hợp và nạp

vào kho dữ liệu trung tâm; Các thuật toán phân tích cú pháp để trích xuất thông tin từ

các định dạng phi cấu trúc như văn bản tự do hoặc các tài liệu PDF; Sử dụng kỹ thuật

làm sạch dữ liệu để loại bỏ hoặc sửa chữa các dữ liệu không chính xác, không đầy đủ

hoặc không hợp lệ; Áp dụng các thuật toán phát hiện trùng lặp (như phương pháp phân

cụm hoặc học máy) để loại bỏ các bản ghi trùng lặp trong dữ liệu; Sử dụng các quy tắc

và tiêu chuẩn để định dạng dữ liệu một cách nhất quán. Ví dụ, chuẩn hoá các định dạng

ngày tháng, số điện thoại, hoặc tên tổ chức; Sử dụng các dịch vụ bên ngoài để bổ sung

thông tin cho dữ liệu hiện có, như thêm thông tin vị trí địa lý dựa trên địa chỉ;

c. Hợp nhất dữ liệu

Việc tích hợp dữ liệu từ nhiều nguồn và xử lý các mối quan hệ giữa các thực thể

trong hệ thống là một trong những yêu cầu then chốt trong xử lý dữ liệu của hệ thống

tìm kiếm chuyên gia. Quy trình này bao gồm các bài toán chính: Phát hiện trùng lặp và

hợp nhất hồ sơ chuyên gia, xử lý thực thể.

Phát hiện trùng lặp là quá trình sử dụng thuật toán để nhận diện các hồ sơ chuyên

gia trùng lặp, đảm bảo tính toàn vẹn và nhất quán của dữ liệu. Sau khi phát hiện, các hồ

sơ trùng lặp được hợp nhất thành một hồ sơ duy nhất, giúp đảm bảo rằng thông tin về

chuyên gia là chính xác và đầy đủ. Các thuật toán phát hiện trùng lặp gồm mô hình học

máy kết hợp thông tin từ cơ sở tri thức để nhận diện các hồ sơ chuyên gia trùng lặp. Phát

triển các quy tắc hợp nhất hồ sơ để kết hợp các thông tin từ các hồ sơ trùng lặp thành

một hồ sơ duy nhất.

92

Quy trình xử lý thông tin chuyên gia bao gồm việc phân loại các chuyên gia theo

lĩnh vực và ngành nghề, quản lý thông tin về các tổ chức mà họ làm việc hoặc đã từng

làm việc, phân tích và ghi nhận kinh nghiệm làm việc của chuyên gia, và xác định vị trí

địa lý của họ. Điều này giúp hệ thống cung cấp thông tin chi tiết và chính xác về từng

chuyên gia, hỗ trợ người dùng trong quá trình tìm kiếm và lựa chọn. Để phân loại thông

tin chuyên gia, các mô hình phân loại văn bản như SVM, Naive Bayes được sử dụng để

phân loại thông tin chuyên gia theo lĩnh vực và ngành nghề. Cùng với đó, quy trình này

cũng sử dụng các mô hình nhận diện thực thể để xác định và gán nhãn các thông tin về

tổ chức, kinh nghiệm và vị trí địa lý trong hồ sơ chuyên gia. Và sử dụng dịch vụ xác

định vị trí địa lý dựa trên địa chỉ để chuyển đổi địa chỉ văn bản thành tọa độ địa lý, hỗ

trợ xác định vị trí địa lý của chuyên gia, phục vụ cho các hoạt động tìm kiếm chuyên gia

theo vị trí địa lý của người dùng.

Sau quá trình xử lý dữ liệu, thông tin chuyên gia có thể được phân loại thành các

 Thông tin chuyên gia:

thực thể và lưu trữ thành CSDL. Dưới đây là những thực thể được trích xuất và lưu trữ:

ID (Khóa chính): Mã định danh duy nhất tự động tăng dần cho mỗi chuyên gia.

Tên: Tên đầy đủ của chuyên gia.

Chức danh/Chức vụ: Chức danh hoặc chức vụ của chuyên gia.

Thông tin liên lạc:

Email: Địa chỉ email của chuyên gia.

Điện thoại: Số điện thoại của chuyên gia.

Trình độ học vấn: Chi tiết về trình độ học vấn của chuyên gia. Lĩnh vực này có

thể phức tạp và có cấu trúc hơn, với các lĩnh vực phụ như:

Bằng cấp: Loại bằng cấp (ví dụ: Cử nhân, Thạc sĩ, Tiến sĩ).

Cơ sở giáo dục: Tên của cơ sở giáo dục.

Năm: Năm tốt nghiệp.

Kỹ năng: Một trường để liệt kê các kỹ năng và lĩnh vực chuyên môn mà chuyên

gia sở hữu. Đây có thể là một trường văn bản hoặc danh sách các từ khóa.

93

Lĩnh vực chuyên môn: Một trường để chỉ định các lĩnh vực hoặc chủ đề chính mà

chuyên gia có chuyên môn. Đây cũng có thể là một trường văn bản hoặc danh sách từ khóa.

Giải thưởng và danh hiệu: Bất kỳ giải thưởng hoặc danh hiệu nào mà chuyên gia

nhận được, với các lĩnh vực phụ như:

Tên giải thưởng: Tên của giải thưởng.

Năm: Năm nhận giải thưởng.

Kinh nghiệm làm việc: Thông tin về lịch sử làm việc của chuyên gia. Lĩnh vực

này cũng có thể được cấu trúc, với các lĩnh vực phụ như:

Chức vụ: Tên công việc.

Công ty: Tên công ty.

Ngày bắt đầu: Ngày bắt đầu công việc.

Ngày kết thúc: Ngày kết thúc của công việc.

Dự án: Thông tin về các dự án có chuyên gia tham gia.

Ấn phẩm: Danh sách các ấn phẩm do chuyên gia biên soạn. Trường này có thể

được cấu trúc với các trường con như:

Tiêu đề: Tiêu đề của ấn phẩm.

Ngày xuất bản: Ngày ấn phẩm được phát hành.

Sách /Chương sách: Danh sách các cuốn sách hoặc chương sách do chuyên gia

biên soạn.

Bằng sáng chế/Phát minh: Danh sách các bằng sáng chế hoặc phát minh của

 Mối quan hệ

chuyên gia.

Hợp tác, liên kết và cố vấn: Tên của tổ chức, doanh nghiệp hoặc quốc gia mà

 Trang thông tin

chuyên gia đó có liên kết.

Hồ sơ truyền thông xã hội: Liên kết hoặc tên người dùng đến hồ sơ truyền thông

xã hội của chuyên gia, nếu có.

 Nguồn dữ liệu

Trang web cá nhân: Liên kết đến trang web cá nhân của chuyên gia.

Danh sách các nguồn dữ liệu nơi thông tin chuyên gia được thu thập.

Thông tin chuyên gia có thể được lưu trữ trong lược đồ dữ liệu được trình bày

trong Hình 3.5. Cơ sở dữ liệu NoSQL nổi bật là lựa chọn phù hợp để lưu trữ thông tin

chuyên gia, nhờ tính linh hoạt, khả năng mở rộng và hiệu suất nhanh (Le & Pham,

94

2022). Cơ sở dữ liệu NoSQL, bao gồm cả những cơ sở dữ liệu sử dụng cặp khóa-giá trị

và cấu trúc hướng tài liệu, cung cấp tính linh hoạt để lưu trữ thông tin chuyên gia theo

cách vừa có thể thích ứng vừa có tính phân cấp. Điều này tạo điều kiện thuận lợi cho

việc truy cập và cập nhật dễ dàng. Hơn nữa, các cơ sở dữ liệu này được thiết kế để xử

lý khối lượng dữ liệu và lưu lượng truy cập lớn mà không ảnh hưởng đến hiệu suất,

khiến chúng phù hợp với việc lưu trữ lâu dài dữ liệu chuyên gia mở rộng theo thời gian.

Đáng chú ý, cơ sở dữ liệu NoSQL vượt trội trong việc hỗ trợ các mối quan hệ "một-

nhiều" giữa các thực thể, chẳng hạn như các chuyên gia và ấn phẩm của họ. Do đó, tất

cả các chi tiết của chuyên gia có thể được “đóng gói” thuận tiện trong một tài liệu duy

nhất, giúp đơn giản hóa quá trình truy xuất và bảo trì.

Nguồn: Tác giả đề xuất

Hình 3.5. Ví dụ lược đồ dữ liệu chuyên gia

d. Đánh chỉ mục

Việc đánh chỉ mục dữ liệu đóng vai trò quan trọng trong việc tăng cường hiệu suất truy vấn và tìm kiếm dữ liệu trong hệ thống. Khi dữ liệu được đánh chỉ mục, hệ

thống không cần phải quét toàn bộ cơ sở dữ liệu mỗi khi có yêu cầu truy vấn. Thay vào đó, chỉ mục sẽ hoạt động như một "bản đồ" giúp hệ thống tìm kiếm nhanh chóng các dữ

95

liệu liên quan mà không cần phải đọc qua toàn bộ các bản ghi. Trong hệ thống tìm kiếm

chuyên gia, khi người dùng tìm kiếm một chuyên gia theo từ khóa, chỉ mục sẽ giúp tìm

kiếm các chuyên gia phù hợp theo các trường dữ liệu như tên, lĩnh vực chuyên môn, hoặc vị trí địa lý mà không phải quét qua tất cả các hồ sơ chuyên gia. Ngoài ra, đánh chỉ

mục còn hỗ trợ việc tìm kiếm dữ liệu theo nhiều tiêu chí khác nhau như từ khóa, thuộc tính, mối quan hệ giữa các đối tượng trong hệ thống. Việc sử dụng chỉ mục đa chiều

giúp cải thiện khả năng tìm kiếm phức tạp, cho phép người dùng dễ dàng tìm kiếm thông

tin theo nhiều góc độ và điều kiện khác nhau. Bằng cách này, một doanh nghiệp có thể

thực hiện tìm kiếm một chuyên gia dựa trên kết hợp giữa các tiêu chí như kỹ năng, lĩnh vực chuyên môn, số năm kinh nghiệm, v.v.

Quy trình đánh chỉ mục được thực hiện thông qua bốn bước, chi tiết mô tả như

trong Hình 3.6 dưới đây.

Chọn loại chỉ mục phù hợp - Chỉ mục cây

Tạo chỉ mục - Thực hiện tạo

Xác định trường DL cần đánh chỉ mục - Tên chuyên gia - Lĩnh vực chuyên

cân bằng - Chỉ mục toàn

chỉ mục bằng các câu lệnh trên các

Duy trì và cập nhật chỉ mục - Tự động - Định kỳ

môn

hệ quản trị CSDL

văn - Chỉ mục đa

- Kinh nghiệm - Vị trí địa lý

chiều

- Chỉ mục đồ thị

- Bằng cấp - v.v

Nguồn: Tác giả đề xuất

Hình 3.6. Quy trình đánh chỉ mục với CSDL chuyên gia

e. Xây dựng Ontology

Vì có rất nhiều dữ liệu, thông tin nên việc lưu trữ thông tin hay biến thông tin

thành tri thức, thu thập quản lý các tri thức này và phân loại chúng sẽ giúp cho việc

khi muốn tìm kiếm về một chủ đề nào đó sẽ hiệu quả hơn và thông tin có ý nghĩa hơn.

Muốn làm được như vậy, tri thức cần được xây dựng theo một khung ontology. Đây

là một mô hình dữ liệu biểu diễn một lĩnh vực và được sử dụng để suy luận về các đối

tượng trong lĩnh vực đó và mối quan hệ giữa chúng. Ontology cung cấp một bộ từ

vựng chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về

các khái niệm và các thuộc tính này. Ngoài bộ từ vựng, ontology còn cung cấp các

ràng buộc, đôi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong

96

muốn của bộ từ vựng, nó được sử dụng trong một miền mà có thể được giao tiếp giữa

người và các hệ thống ứng dụng phân tán hỗn tạp khác. Các ontology được sử dụng

như là một biểu mẫu trình bày tri thức về các chủ đề. Trong mô hình tri thức chuyên

gia sẽ gồm những thực thể sau: Người, Chuyên gia, Tổ chức, Trường đại học, Ấn phẩm

xuất bản, Nghề nghiệp, Năng lực v.v.

Trong đó, Bảng 3.3 sẽ mô tả chi tiết về các thành phần này:

Bảng 3.3. Các thành phần trong mô hình biểu diễn tri thức chuyên gia

sử dụng ontology

Thực thể

Mô tả vai trò

Person

Đại diện cho một cá nhân trong hệ thống, có thể là chuyên gia hoặc người liên quan.

Expert

Một thực thể đặc biệt của Person, là chuyên gia với chuyên môn cao trong một hoặc nhiều lĩnh vực.

Occupation Nghề nghiệp của chuyên gia

Competency

Các thuộc tính hoặc mối quan hệ hasContact, hasEducation, hasAward, workFor, hasCompetency hasAward, hasPublication, hasPatent, hasExpertise, mentionedInMedia, hasCitation, hasPatent relatedCompetency Functional Competency, Behavioral Competency

Knowledge, Skill

Functional Competency Behavioral Competency

Organization

Academic Organization, Industry

University, Research Institute

Academic Organization

Industry

Company

Năng lực và kỹ năng mà một cá nhân hoặc chuyên gia có. Năng lực chuyên môn liên quan đến kỹ thuật hoặc chuyên môn cụ thể. Năng lực hành vi liên quan đến cách thức làm việc và giao tiếp. Các tổ chức mà chuyên gia làm việc hoặc hợp tác, gồm tổ chức học thuật và ngành nghề. Các tổ chức học thuật như trường đại học hoặc viện nghiên cứu. Các ngành nghề hoặc công ty mà chuyên gia làm việc. Trường đại học nơi chuyên gia đã học.

hasDegree

Bằng cấp mà chuyên gia đạt được.

hasEducationField

University Academic Degree

Publication

Conference paper, Journal article

Các ấn phẩm mà chuyên gia đã công bố, bao gồm các bài báo khoa học, báo cáo, v.v.

97

Media

News Article, Social Media Item

Expertise

Các tài liệu liên quan đến chuyên gia, bao gồm các bài báo và bài đăng trên mạng xã hội. Chuyên môn của chuyên gia

hasDomain, hasLevel

Domain

Lĩnh vực chuyên môn mà chuyên gia có kinh nghiệm.

EducationField, Business Domain, Research Domain

Nguồn: Tác giả đề xuất

Hình 3.7 dưới đây là mô hình biểu diễn tri thức của chuyên gia sử dụng ontology.

Nguồn: Tác giả đề xuất

Hình 3.7. Mô hình biểu diễn tri thức chuyên gia sử dụng ontology

3.3.3. Tầng nền tảng chia sẻ và tích hợp dữ liệu

Tầng chia sẻ và tích hợp dữ liệu trong hệ thống tìm kiếm chuyên gia là một thành phần quan trọng, đảm bảo việc kết nối và quản lý dữ liệu một cách nhất quán giữa các hệ thống và ứng dụng khác nhau. Tầng này cho phép tích hợp dữ liệu từ nhiều nguồn, cả nội bộ lẫn bên ngoài, và đảm bảo rằng thông tin luôn được đồng bộ hóa và sẵn sàng

cho các hoạt động tìm kiếm, phân tích. Cấu trúc của tầng gồm hai thành phần chính:

Dịch vụ API và Trung tâm tích hợp dữ liệu (Hình 3.8). Dịch vụ API cung cấp các giao diện lập trình ứng dụng cho phép các hệ thống bên ngoài truy cập vào dữ liệu chuyên gia, đồng thời giúp kết nối, giao tiếp với các hệ thống khác một cách an toàn và hiệu

98

quả. Trung tâm tích hợp dữ liệu chịu trách nhiệm thu thập, chuyển đổi, đồng bộ và lưu

trữ dữ liệu từ nhiều nguồn khác nhau, đảm bảo tính toàn vẹn và nhất quán của dữ liệu

trên toàn hệ thống. Nhờ tầng này, hệ thống tìm kiếm chuyên gia có thể tích hợp liền mạch với các nguồn dữ liệu quốc gia, các cơ sở dữ liệu học thuật, và các hệ thống khác,

từ đó nâng cao tính chính xác và hiệu quả của quá trình tìm kiếm và quản lý thông tin chuyên gia.

Các kỹ thuật sử dụng bao gồm nền tảng ESB như Apache Camel hoặc WSO2 để

hỗ trợ tích hợp các dịch vụ và ứng dụng khác nhau, các hệ thống trung gian truyền thông

như RabbitMQ, Kafka để đảm bảo việc truyền tải dữ liệu giữa các hệ thống một cách đáng tin cậy và hiệu quả, và các công cụ chuyển đổi dữ liệu như Apache NiFi để chuyển

đổi dữ liệu giữa các định dạng khác nhau và tích hợp vào hệ thống trung tâm.

Nguồn: Tác giả đề xuất

Hình 3.8. Các thành phần trong tầng chia sẻ và tích hợp dữ liệu

Dịch vụ API đóng vai trò như một cầu nối giữa hệ thống tìm kiếm chuyên gia và

các hệ thống bên ngoài, bao gồm các doanh nghiệp, tổ chức, và các nguồn dữ liệu khác. Bằng cách cung cấp các API công khai và nội bộ, dịch vụ này cho phép truy cập và thao tác với dữ liệu chuyên gia, từ việc tìm kiếm, truy xuất thông tin đến việc gửi và nhận

yêu cầu giữa các bên liên quan. Hệ thống API được thiết kế theo chuẩn RESTful API,

99

cho phép giao tiếp hiệu quả thông qua các giao thức như HTTP và sử dụng các định

dạng dữ liệu như JSON hoặc XML. Thông qua API Gateway, dịch vụ API không chỉ

đảm bảo việc điều phối và xử lý các yêu cầu một cách hiệu quả mà còn cung cấp các tính năng quản lý truy cập và bảo mật, như xác thực người dùng bằng OAuth 2.0. Nhờ

vào dịch vụ API, các doanh nghiệp và tổ chức có thể dễ dàng tích hợp hệ thống tìm kiếm chuyên gia vào quy trình làm việc của họ, giúp tận dụng dữ liệu chuyên gia một cách

linh hoạt và hiệu quả, đồng thời đảm bảo tính mở rộng và bảo mật của hệ thống.

Hệ thống tích hợp dữ liệu trong hệ thống tìm kiếm chuyên gia đóng vai trò trung

tâm trong việc thu thập, xử lý, và đồng bộ hóa dữ liệu từ nhiều nguồn khác nhau. Đây là thành phần chính đảm bảo rằng dữ liệu từ các hệ thống nội bộ và các nguồn bên ngoài

như cơ sở dữ liệu quốc gia, các tổ chức nghiên cứu, và các trang web học thuật được

quản lý một cách hiệu quả, chính xác và nhất quán. Hệ thống tích hợp dữ liệu giúp hệ

thống tìm kiếm chuyên gia duy trì tính toàn vẹn của dữ liệu và cung cấp thông tin kịp

thời, cập nhật cho người dùng. Hệ thống này bao gồm các quy trình ETL (Extract,

Transform, Load), trong đó dữ liệu được thu thập từ nhiều nguồn, chuyển đổi để phù

hợp với các tiêu chuẩn và định dạng của hệ thống, và sau đó tải vào kho dữ liệu trung

tâm để lưu trữ và sử dụng. Quá trình này bao gồm các bước làm sạch và chuẩn hóa dữ

liệu, giúp loại bỏ các dữ liệu không hợp lệ hoặc trùng lặp. Ngoài ra, hệ thống tích hợp

dữ liệu cũng đảm bảo rằng dữ liệu được đồng bộ hóa liên tục giữa các nguồn khác nhau,

đảm bảo tính kịp thời và chính xác cho các truy vấn tìm kiếm và phân tích dữ liệu.

3.3.4. Tầng ứng dụng và dịch vụ

Đây là tầng thực hiện các chức năng chính và logic của hệ thống, bao gồm xử lý yêu

cầu của người dùng, quản lý dữ liệu, và cung cấp các tính năng hỗ trợ doanh nghiệp và

chuyên gia. Tầng này chịu trách nhiệm cung cấp các dịch vụ chính của hệ thống, bao gồm

tìm kiếm, quản lý thông tin, hỏi đáp, khuyến nghị chuyên gia và các hoạt động quản trị.

Hình 3.9 mô tả các thành phần trong tầng ứng dụng và dịch vụ.

100

Nguồn: Tác giả đề xuất

Hình 3.9. Các thành phần trong tầng ứng dụng và dịch vụ

3.3.4.1. Dịch vụ tìm kiếm và xếp hạng chuyên gia

Chức năng Tìm kiếm và Xếp hạng chuyên gia là một trong những thành phần cốt

lõi của hệ thống, giúp người dùng (doanh nghiệp) tìm kiếm chuyên gia phù hợp với các

tiêu chí cụ thể và đảm bảo rằng kết quả tìm kiếm được sắp xếp theo mức độ phù hợp

hoặc chất lượng chuyên gia. Hệ thống tìm kiếm chuyên gia thường sử dụng công nghệ

như Elasticsearch để hỗ trợ tìm kiếm toàn văn và tìm kiếm ngữ nghĩa, giúp trả về kết

quả nhanh chóng và chính xác dựa trên các từ khóa, lĩnh vực chuyên môn, kỹ năng và

vị trí địa lý. Người dùng có thể áp dụng các bộ lọc nâng cao như số năm kinh nghiệm,

các dự án đã tham gia, nơi làm việc của chuyên gia hoặc thông tin về nền tảng giáo dục, để tinh chỉnh kết quả tìm kiếm.

Xếp hạng chuyên gia bao gồm việc xây dựng các tiêu chí đánh giá và xếp hạng, thu thập các đánh giá và phản hồi từ người dùng, và áp dụng các thuật toán xếp hạng để sắp xếp chuyên gia theo điểm số và độ uy tín. Việc xác định các trọng số để các chuyên gia có chuyên môn cao hay có tầm ảnh hưởng lớn trong lĩnh vực được xuất hiện top đầu

trong các kết quả tìm kiếm sẽ giúp việc lựa chọn chuyên gia hiệu quả hơn. Các yếu tố

hay hệ số để xác định trọng số tổng hợp đánh giá chuyên gia rất đa dạng. Có thể bao gồm các yếu tố như: học hàm, học vị, mức độ uy tín của nơi học tập, làm việc, hệ số trích dẫn, số công bố khoa học, phát minh, H-Index đối với chuyên gia trong lĩnh vực

101

học thuật; Hoặc vị trí trong công việc, số năm kinh nghiệm, bằng cấp, chứng chỉ, kỹ

năng, số dự án đã tham gia với các chuyên gia mà DN tìm kiếm. Khi kết hợp hai hay

nhiều trọng số trên và dựa vào các dữ liệu huấn luyện có thể tạo ra các ràng buộc để xác định các hệ số của hàm xếp hạng. Hàm R chỉ là tương đối và sẽ dần được hiệu chỉnh khi

có nhiều phản hồi của người sử dụng, ví dụ dựa trên số lần kích chuột hay xem hồ sơ chuyên gia trên hệ thống. Các thuật toán xếp hạng từ mô hình học máy như học để xếp

hạng (Learning to Rank) kết hợp cơ sở tri thức về chuyên gia sẽ được sử dụng để xếp

hạng các chuyên gia dựa trên các tiêu chí đánh giá.

3.3.4.2. Dịch vụ quản lý thông tin chuyên gia

Dịch vụ Quản lý thông tin chuyên gia thực hiện việc quản lý toàn bộ thông tin cá

nhân và hồ sơ chuyên môn của chuyên gia, bao gồm các yếu tố như thông tin liên hệ, kỹ

năng, kinh nghiệm làm việc, và các công trình nghiên cứu. Điều này cho phép chuyên gia xây dựng hồ sơ trực tuyến chi tiết, phản ánh chính xác năng lực và chuyên môn của

họ. Hơn nữa, hệ thống cho phép chuyên gia tự cập nhật thông tin cá nhân và chuyên

môn, đồng thời tải lên các tài liệu liên quan như chứng chỉ, bài báo khoa học, hoặc các

báo cáo dự án đã tham gia, giúp doanh nghiệp dễ dàng đánh giá mức độ chuyên môn và

uy tín của chuyên gia.

Về mặt công nghệ, MongoDB được đề xuất làm nền tảng lưu trữ dữ liệu.

MongoDB thích hợp cho việc quản lý các dữ liệu phi cấu trúc, chẳng hạn như tài liệu

đính kèm (chứng chỉ, bài báo), và dữ liệu và có cấu trúc. Sự kết hợp giữa dữ liệu có cấu

trúc và phi cấu trúc này giúp lưu trữ và quản lý thông tin chuyên gia một cách toàn diện,

đảm bảo rằng hệ thống có thể xử lý linh hoạt các loại dữ liệu khác nhau liên quan đến

hồ sơ chuyên gia.

Tính năng chi tiết của dịch vụ bao gồm khả năng cho phép chuyên gia tự quản lý

hồ sơ cá nhân thông qua việc thêm, xóa, hoặc chỉnh sửa thông tin. Các tài liệu liên quan như chứng chỉ và công trình nghiên cứu được lưu trữ trực tiếp trên hệ thống, giúp tạo ra một hồ sơ toàn diện và chính xác về chuyên gia. Điều này không chỉ giúp chuyên gia thể hiện đầy đủ năng lực của mình mà còn tạo ra sự minh bạch cho doanh nghiệp trong quá trình tìm kiếm và lựa chọn đối tác phù hợp. Hơn nữa, các doanh nghiệp có thể truy cập và xem chi tiết hồ sơ chuyên gia một cách nhanh chóng và dễ dàng, tạo điều kiện

thuận lợi cho việc đánh giá và ra quyết định hợp tác. Dịch vụ này không chỉ giúp tối ưu hóa quy trình quản lý thông tin chuyên gia mà còn đảm bảo tính tin cậy và cập nhật liên tục của dữ liệu trên hệ thống.

3.3.4.3. Dịch vụ hỏi đáp chuyên gia

102

Dịch vụ hỏi đáp chuyên gia cho phép các doanh nghiệp và người dùng trực tiếp

đặt câu hỏi và nhận phản hồi từ các chuyên gia trong các lĩnh vực cụ thể. Mục tiêu của

dịch vụ này là kết nối nhanh chóng giữa người dùng và chuyên gia, tạo điều kiện cho việc trao đổi thông tin và giải đáp các thắc mắc chuyên môn mà không cần thông qua

các quy trình hợp tác phức tạp hay hợp đồng lâu dài.

Hệ thống cung cấp một giao diện đơn giản nhưng hiệu quả để các bên có thể

tương tác và trao đổi kiến thức một cách liền mạch. Nhờ đó, dịch vụ này giúp doanh

nghiệp nhanh chóng giải quyết các vấn đề kỹ thuật hoặc chuyên môn mà họ đang gặp

phải trong các hoạt động kinh doanh. Các chức năng của dịch vụ bao gồm:

- Gửi câu hỏi: Doanh nghiệp và người dùng có thể dễ dàng gửi câu hỏi hoặc yêu

cầu thông tin về một vấn đề cụ thể liên quan đến chuyên môn mà họ cần hỗ trợ. Các câu

hỏi này có thể được liên kết với các lĩnh vực chuyên môn cụ thể để đảm bảo rằng câu hỏi sẽ được gửi đến đúng chuyên gia phù hợp.

- Phản hồi từ chuyên gia: Sau khi nhận được câu hỏi, chuyên gia sẽ có khả năng

phản hồi và cung cấp thông tin hoặc giải pháp cho vấn đề mà doanh nghiệp hoặc người

dùng đang đối mặt. Quá trình này có thể diễn ra trực tiếp qua hệ thống, đảm bảo tính kịp

thời và minh bạch của thông tin được chia sẻ.

- Lưu trữ và cập nhật cơ sở tri thức: Tất cả các câu hỏi và câu trả lời đều được

hệ thống lưu trữ. Điều này cho phép người dùng có thể tham khảo lại các câu trả lời

trước đó khi cần thiết, đồng thời đóng góp thêm vào cơ sở tri thức chuyên gia, giúp

những người dùng sau có thể truy cập để tra cứu mà không cần đặt câu hỏi mới.

- Theo dõi trạng thái câu hỏi: Hệ thống cung cấp tính năng theo dõi trạng thái

các câu hỏi đã gửi, giúp doanh nghiệp và người dùng biết được tình trạng phản hồi của

chuyên gia, bao gồm các thông tin như câu hỏi đã được đọc chưa, có đang được xử lý

hay không.

3.3.4.4. Dịch vụ đặt hàng chuyên gia

Dịch vụ đặt hàng chuyên gia giúp kết nối doanh nghiệp với các chuyên gia phù

hợp thông qua việc gửi các yêu cầu công việc cụ thể. Dịch vụ này cho phép doanh nghiệp

có thể tiếp cận và đặt hàng trực tiếp dịch vụ từ chuyên gia trong các lĩnh vực khác nhau

mà không cần phải tìm kiếm, ký kết hợp đồng dài hạn ngay từ ban đầu. Với dịch vụ này,

doanh nghiệp chỉ cần tạo ra yêu cầu, và các chuyên gia sẽ xem xét, đánh giá khả năng

thực hiện, đưa ra đề xuất về chi phí, thời gian và phương án triển khai. Việc đặt hàng

103

chuyên gia giúp doanh nghiệp dễ dàng tìm thấy chuyên gia phù hợp với nhu cầu cụ thể

của mình, đồng thời cho phép so sánh các đề xuất từ nhiều chuyên gia khác nhau trước

khi đưa ra quyết định hợp tác. Dịch vụ này không chỉ giúp tối ưu hóa quy trình hợp tác

mà còn tạo điều kiện để doanh nghiệp có thể kiểm soát tốt hơn chi phí và thời gian thực

hiện công việc.

Quy trình đặt hàng chuyên gia bao gồm các bước chính sau:

- Tạo yêu cầu đặt hàng: Doanh nghiệp truy cập vào hệ thống và tạo yêu cầu đặt

hàng dựa trên nhu cầu công việc cụ thể. Yêu cầu này sẽ được gửi đi bao gồm các thông

tin chi tiết về dự án, lĩnh vực chuyên môn, và các tiêu chí cần thiết.

- Hệ thống gửi yêu cầu: Hệ thống sẽ xác định các chuyên gia phù hợp với lĩnh

vực chuyên môn đã được chọn và gửi yêu cầu đến những chuyên gia đó. Điều này đảm

bảo rằng chỉ những chuyên gia có đủ năng lực và kinh nghiệm trong lĩnh vực liên quan

mới nhận được yêu cầu.

- Chuyên gia phản hồi: Các chuyên gia nhận được yêu cầu sẽ xem xét và gửi

phản hồi đến doanh nghiệp, bao gồm các thông tin về thời gian và phương án thực

hiện. Các chuyên gia cũng có thể đưa ra các gợi ý hoặc tùy chỉnh dựa trên yêu cầu

của doanh nghiệp.

- Doanh nghiệp so sánh và lựa chọn: Doanh nghiệp xem xét tất cả các phản hồi

từ chuyên gia, sau đó chọn chuyên gia phù hợp nhất với yêu cầu của mình.

3.3.4.5. Hệ thống gợi ý/ khuyến nghị chuyên gia

Ứng dụng này thường sử dụng các thuật toán thông minh và dữ liệu lớn để tự

động đề xuất các chuyên gia phù hợp với nhu cầu cụ thể của doanh nghiệp hoặc người

dùng. Dựa trên thông tin như lĩnh vực chuyên môn, kinh nghiệm, phản hồi từ các doanh

nghiệp khác, và yêu cầu công việc của doanh nghiệp, hệ thống có thể tìm ra và gợi ý

những chuyên gia có năng lực đáp ứng tốt nhất cho nhiệm vụ. Mục tiêu của hệ thống là

nâng cao hiệu quả và độ chính xác trong việc chọn lựa chuyên gia phù hợp với nhu cầu

của doanh nghiệp. Hệ thống này sẽ hỗ trợ cho các ứng dụng như: Đặt hàng chuyên gia

hay Xếp hạng chuyên gia. Các chức năng chính bao gồm:

- Gợi ý danh sách chuyên gia phù hợp: Dựa trên yêu cầu công việc cụ thể mà doanh

nghiệp đưa ra, hệ thống sẽ tự động tìm kiếm và đưa ra danh sách các chuyên gia có thể đáp

104

ứng được yêu cầu. Danh sách này được sắp xếp theo mức độ phù hợp và đánh giá từ các

yếu tố khác nhau như kỹ năng, kinh nghiệm và phản hồi từ các doanh nghiệp khác.

- Cá nhân hóa gợi ý: Hệ thống hỗ trợ việc cá nhân hóa kết quả dựa trên lịch sử

tìm kiếm và tương tác của doanh nghiệp. Điều này giúp gợi ý chuyên gia một cách nhanh

chóng và hiệu quả hơn, vì hệ thống sẽ học hỏi từ các yêu cầu trước đây để tinh chỉnh

các gợi ý phù hợp hơn với nhu cầu cụ thể của doanh nghiệp.

- Cung cấp thông tin chi tiết về chuyên gia: Hệ thống không chỉ gợi ý danh sách

chuyên gia, mà còn cung cấp thông tin chi tiết về từng chuyên gia như hồ sơ cá nhân,

lĩnh vực chuyên môn, kinh nghiệm làm việc, các dự án đã tham gia, và đánh giá từ các

doanh nghiệp trước. Thông tin này giúp doanh nghiệp có thể dễ dàng đưa ra quyết định

chính xác và hợp lý khi chọn chuyên gia.

3.3.4.6. Dịch vụ cộng tác chuyên gia

Dịch vụ cộng tác chuyên gia giúp tạo ra sự tương tác hai chiều giữa DN với chuyên gia,

và chuyên gia với các chuyên gia khác. Thông qua dịch vụ này, khi DN gửi yêu cầu đặt hàng, chuyên gia có thể giới thiệu những chuyên gia mà mình biết, phù hợp với yêu cầu

của DN. Hoặc các chuyên gia có thể mời nhau hợp tác để tạo ra một nhóm cộng tác,

thực hiện chung các hoạt động nghiên cứu mới.

- Giới thiệu chuyên gia: Cho phép chuyên gia hiện tại trong hệ thống có thể đề

xuất các chuyên gia khác phù hợp với nhu cầu của DN, sau khi đọc được thông tin đặt

hàng từ phía DN. Đây là một cách tăng cường tính kết nối, giúp doanh nghiệp dễ dàng

tìm kiếm chuyên gia có chuyên môn phù hợp, ngay cả khi họ chưa có thông tin đầy đủ

về các chuyên gia trên hệ thống.

- Hợp tác chuyên gia: Cho phép các chuyên gia trong hệ thống có thể tìm kiếm

và hợp tác với nhau để thực hiện các dự án nghiên cứu chung, giảng dạy, tư vấn hoặc các hoạt động chuyên môn khác. Chức năng này sẽ giúp thúc đẩy sự hợp tác liên ngành, giúp giải quyết các vấn đề phức tạp hơn. Tạo ra các nhóm nghiên cứu mạnh, có thể tiếp cận các dự án quy mô lớn; gia tăng cơ hội nhận tài trợ nghiên cứu từ các tổ chức hoặc doanh nghiệp; hỗ trợ chuyên gia kết nối và mở rộng mạng lưới quan hệ chuyên môn và nâng cao hiệu suất làm việc thông qua chia sẻ tài nguyên và kiến thức.

Dịch vụ này giúp hệ thống tìm kiếm chuyên gia trở thành một hệ sinh thái kết nối hiệu quả, có sự tương tác nhiều chiều, thúc đẩy các dự án nghiên cứu và hợp tác thực tiễn trong nhiều lĩnh vực khác nhau.

105

3.3.4.7. Dịch vụ báo cáo thống kê

Dịch vụ báo cáo thống kê giúp doanh nghiệp và người quản lý hệ thống theo dõi

và phân tích dữ liệu liên quan đến hoạt động của các chuyên gia và doanh nghiệp trong

hệ thống. Dịch vụ này cung cấp các báo cáo chi tiết về tình hình sử dụng dịch vụ, hiệu

suất làm việc của các chuyên gia, và tương tác giữa doanh nghiệp với các chuyên gia.

Ứng dụng này cung cấp các loại báo cáo:

- Báo cáo tổng quan: Cung cấp báo cáo tổng hợp về số lượng chuyên gia tham gia,

số yêu cầu được gửi đi, và các hoạt động tương tác giữa doanh nghiệp và chuyên gia.

- Báo cáo theo lĩnh vực: Cung cấp số liệu thống kê về các lĩnh vực chuyên môn

được yêu cầu nhiều nhất và mức độ phản hồi của chuyên gia trong từng lĩnh vực cụ thể.

- Báo cáo chi tiết: Doanh nghiệp có thể xem chi tiết các báo cáo về từng chuyên

gia hoặc từng dự án mà họ đã yêu cầu.

- Thống kê bản đồ chuyên gia: Doanh nghiệp có thể thống kê chuyên gia theo vị

trí địa lý để tìm ra những chuyên gia trong cùng khu vực.

3.3.4.8. Dịch vụ xác thực người dùng và quản lý truy cập

Dịch vụ xác thực người dùng và quản lý truy cập đảm bảo an toàn thông tin và

quyền truy cập phù hợp của người dùng đối với hệ thống. Dịch vụ này giúp xác thực

danh tính người dùng khi họ đăng nhập và đảm bảo rằng họ chỉ có thể truy cập vào

những tài nguyên và chức năng được phép. Những nhiệm vụ chính của ứng dụng gồm:

- Xác thực người dùng: Xác minh danh tính của người dùng thông qua các

phương thức như mật khẩu, xác thực hai yếu tố (2FA), hoặc công nghệ xác thực OAuth2.

- Quản lý quyền truy cập: Gán quyền truy cập cho từng vai trò (chuyên gia, doanh

nghiệp, quản trị viên) và đảm bảo rằng người dùng chỉ có quyền truy cập vào các tài

nguyên hoặc tính năng theo quyền hạn của họ.

- Quản lý vai trò và nhóm: Hỗ trợ quản lý người dùng theo nhóm và vai trò để dễ

dàng kiểm soát quyền truy cập đối với từng chức năng hoặc dịch vụ trong hệ thống.

- Theo dõi và ghi lại truy cập: Hệ thống ghi nhận các phiên đăng nhập và truy cập

của người dùng để đảm bảo rằng việc truy cập thông tin diễn ra minh bạch và an toàn.

3.3.4.9. Hệ thống quản trị nội dung

106

Hệ thống quản trị nội dung (CMS) là một công cụ quản lý các nội dung hiển thị

trên nền tảng như thông tin chuyên gia, tin tức, tài liệu, và hướng dẫn sử dụng. CMS cho

phép quản trị viên dễ dàng tạo mới, chỉnh sửa, và quản lý các nội dung được cung cấp

đến người dùng.

- Tạo và quản lý nội dung: Hỗ trợ việc tạo, cập nhật và xóa các nội dung trên hệ

thống bao gồm thông tin về chuyên gia, bài viết, tin tức liên quan, hoặc các tài liệu

hướng dẫn.

- Quản lý danh mục nội dung: Cho phép phân loại nội dung thành các danh mục

khác nhau như tin tức chuyên ngành, bài viết hướng dẫn, và nội dung quảng bá.

- Phân quyền quản lý nội dung: Cấp quyền cho từng người dùng hoặc nhóm

người dùng có khả năng truy cập và quản lý các loại nội dung khác nhau dựa trên vai

trò của họ.

3.3.4.10. Quản trị hệ thống

Dịch vụ quản trị hệ thống chịu trách nhiệm về việc giám sát, bảo trì, và quản lý

toàn bộ hệ thống, đảm bảo rằng tất cả các dịch vụ, dữ liệu và hạ tầng kỹ thuật của hệ

thống luôn hoạt động ổn định, an toàn và hiệu quả. Dịch vụ này thực hiện các hoạt động:

Giám sát hiệu suất hệ thống bao gồm việc theo dõi hoạt động của các thành phần hệ

thống như máy chủ, dịch vụ API, cơ sở dữ liệu, và ứng dụng để phát hiện và xử lý sớm

các sự cố tiềm ẩn. Sao lưu và phục hồi dữ liệu định kỳ để đảm bảo rằng thông tin quan

trọng được bảo vệ và có thể phục hồi trong trường hợp sự cố xảy ra. Cập nhật và bảo

trì hệ thống thông qua việc thực hiện cập nhật các phiên bản mới của phần mềm, vá lỗi

và cải thiện hiệu suất cho hệ thống. Cuối cùng là Quản lý người dùng và quyền truy cập

như quản lý tài khoản người dùng, cấp quyền và theo dõi hoạt động đăng nhập để đảm

bảo việc truy cập được an toàn và tuân thủ các quy định bảo mật.

3.3.5. Hạ tầng kỹ thuật, công nghệ và an toàn thông tin mạng

Hạ tầng công nghệ bao gồm các thành phần chính sau đây:

- Thiết bị đầu cuối: là những phương tiện mà người dùng (doanh nghiệp, chuyên

gia, bộ ban ngành) sử dụng để truy cập và tương tác với hệ thống, bao gồm các thiết bị

như máy tính, điện thoại di động, và máy tính bảng.

- Máy chủ: Chịu trách nhiệm thực thi các tác vụ tính toán, quản lý dữ liệu và xử

lý các yêu cầu từ người dùng. Chúng cung cấp sức mạnh xử lý để đảm bảo hệ thống

107

hoạt động mượt mà và ổn định. Gồm: Máy chủ ứng dụng thực hiện xử lý logic của ứng

dụng, bao gồm các chức năng tìm kiếm chuyên gia, quản lý thông tin, hỏi đáp, xếp hạng

và gợi ý chuyên gia. Máy chủ cơ sở dữ liệu lưu trữ thông tin về chuyên gia, doanh nghiệp

và các dữ liệu liên quan, sử dụng cơ sở dữ liệu MongoDB để lưu trữ cả dữ liệu có cấu

trúc (hồ sơ chuyên gia) và dữ liệu phi cấu trúc (tài liệu, chứng chỉ, báo cáo). Máy chủ

web, cung cấp nội dung web cho người dùng khi họ truy cập vào hệ thống.

- Thiết bị lưu trữ: Cung cấp khả năng lưu trữ dữ liệu an toàn, ổn định và dễ dàng

truy xuất. Hệ thống cần có đủ dung lượng để lưu trữ thông tin về các chuyên gia, tài liệu

đính kèm (như chứng chỉ, bài báo khoa học), và các công trình nghiên cứu. Bao gồm Hệ

thống lưu trữ tập trung, sử dụng các giải pháp lưu trữ trên đám mây như Amazon S3

hoặc Google Cloud Storage để lưu trữ các tệp tin lớn và dữ liệu phi cấu trúc như tài liệu

PDF, hình ảnh, video liên quan đến chuyên gia, đảm bảo rằng các tệp này có thể truy

xuất nhanh chóng và an toàn từ bất kỳ nơi đâu. Ngoài ra, có thể trang bị thêm Hệ thống

lưu trữ cục bộ tại các máy chủ trung tâm của hệ thống, và các dịch vụ sao lưu và khôi

phục để đảm bảo khả năng khôi phục trong trường hợp mất mát dữ liệu. Dịch vụ này có

thể được tự động hoá thực hiện bởi các giải pháp lưu trữ đám mây ở trên.

- Thiết bị mạng: tập hợp các thiết bị có chức năng chuyển mạch, định tuyến, xử

lý đa dịch vụ được kết nối với nhau tạo nên các hệ thống mạng như mạng diện rộng

(WAN) của Bộ, mạng cục bộ (LAN) các đơn vị, kết nối internet; đảm bảo rằng các thành

phần trong hệ thống có thể giao tiếp với nhau một cách ổn định và nhanh chóng, đồng

thời kết nối hệ thống với Internet để người dùng có thể truy cập từ xa.

- Hạ tầng kỹ thuật an toàn, an ninh thông tin: tập hợp giải pháp, thiết bị đảm bảo

an toàn, an ninh thông tin như: tường lửa, chống tấn công mạng (IPS), chống tấn công

từ chối dịch vụ (DDoS), chống thất thoát dữ liệu, chống virus v.v. An toàn thông tin là

yếu tố quan trọng để bảo vệ dữ liệu người dùng và thông tin nhạy cảm của hệ thống. Hệ

thống cần các biện pháp bảo mật để chống lại các cuộc tấn công mạng và đảm bảo an

toàn dữ liệu.

- Chính sách bảo vệ quyền riêng tư, bảo vệ dữ liệu cá nhân và mã hoá dữ liệu:

Bảo mật thông tin và bảo vệ quyền riêng tư là một thành phần quan trọng trong hệ thống

tìm kiếm chuyên gia, nhằm đảm bảo rằng dữ liệu cá nhân, thông tin nghiên cứu và quyền

riêng tư của người dùng được bảo vệ một cách an toàn.

108

3.4. So sánh kiến trúc đề xuất với một số hệ thống tìm kiếm chuyên gia hiện

nay

Kiến trúc của hệ thống tìm kiếm chuyên gia được đề xuất đã được phân tích qua mô

hình đa tầng, bao gồm tầng hạ tầng kỹ thuật, lưu trữ và xử lý dữ liệu, chia sẻ và tích hợp

dữ liệu, và ứng dụng dịch vụ. Để đánh giá rõ hơn về tính hiệu quả và khả năng của hệ thống, NCS sẽ thực hiện so sánh với một số kiến trúc của hệ thống tìm kiếm chuyên gia

đã được tham khảo trong Chương 2, như LinkedIn, Google Scholar, và VietSearch. Các

hệ thống này đã được triển khai rộng rãi trong việc hỗ trợ tìm kiếm và kết nối chuyên

gia trên toàn cầu. Để thực hiện so sánh kiến trúc, tác giả sẽ dựa trên một số tiêu chuẩn quốc tế để xác định mức độ quan trọng của từng yếu tố trong kiến trúc phần mềm: như ISO/IEC 2501016 dùng để đánh giá hiệu suất, bảo mật, khả năng mở rộng. TOGAF thường sử dụng để thiết kế và đánh giá mô hình kiến trúc doanh nghiệp. ISO 2501217, bộ tiêu chuẩn đánh giá chất lượng quản lý dữ liệu. Và ISO 9241-21018 là tiêu chuẩn đánh giá trải nghiệm người dùng và mức độ thân thiện.

Các tiêu chí và nguồn tham chiếu sẽ được mô tả chi tiết trong Bảng 3.4 dưới đây.

Bảng 3.4. Tiêu chí so sánh kiến trúc đề xuất với các hệ thống khác

Tầng kiến trúc

Tiêu chí đánh giá chính

Tiêu chuẩn tham chiếu

1. Tầng hạ tầng kỹ thuật - công

Bảo mật thông tin, quản lý truy

ISO/IEC 25010:2011

nghệ và an toàn thông tin

cập, khả năng mở rộng

2. Tầng lưu trữ và xử lý dữ liệu Chất lượng quản lý dữ liệu

ISO 25012

3. Tầng nền tảng chia sẻ và tích

Khả năng kết nối API, hỗ trợ

TOGAF, ISO 20022

hợp dữ liệu

trao đổi dữ liệu, tương thích hệ

thống

4. Tầng ứng dụng và dịch vụ

Khả năng cá nhân hóa, ứng

ISO 25010, IEEE 1232-2010

dụng AI, hỗ trợ doanh nghiệp và

chuyên gia (trong việc tìm kiếm

chuyên gia)

5. Tầng kênh giao tiếp

Giao diện người dùng (UI/UX),

ISO 9241-210

khả năng hỗ trợ đa nền tảng

Nguồn: Tác giả tổng hợp và đề xuất

16 https://iso25000.com/index.php/en/iso-25000-standards/iso-25010 17 https://iso25000.com/index.php/en/iso-25000-standards/iso-25012 18 https://www.iso.org/standard/77520.html

109

Từ bảng tiêu chí trên, NCS sẽ tiến hành chia nhỏ các tiêu chí, đồng thời dựa vào các

việc thử nghiệm trực tiếp trên các hệ thống đã có, cũng như nghiên cứu các tài liệu kỹ

thuật có liên quan đến các hệ thống, để đưa ra kết quả đánh giá như trong Bảng 3.5.

Bảng 3.5. So sánh kiến trúc đề xuất với một số hệ thống tìm kiếm chuyên gia

Tiêu chí Hệ thống đề xuất

LinkedIn Google Scholar VietSearch

Nguồn đánh giá

Tập trung vào phạm vi quốc gia, cơ quan, tổ chức

Toàn cầu, mạng lưới kết nối chuyên gia và doanh nghiệp

Toàn cầu, tập trung vào học thuật và tài liệu nghiên cứu

Quy mô và phạm vi

Tài liệu giới thiệu và tài liệu của thuật kỹ LinkedIn, Google Scholar và VietSearch

Toàn cầu, tập trung vào các gia chuyên người Việt và các dịch vụ phục vụ người Việt ở nước ngoài.

Hạ tầng kỹ thuật

Hạ tầng phân tán, quy mô toàn cầu, xử lý dữ liệu lớn

Hạ tầng đám mây của Google, xử lý hàng tỷ tài liệu học thuật

Hệ thống cỡ vừa, hạ tầng tập trung và phân tán, xử lý dữ liệu lớn

Hệ thống cỡ vừa, hạ tập trung và có thể sử dụng đám mây, xử lý dữ liệu lớn

Tài liệu giới thiệu và tài liệu kỹ của thuật LinkedIn, Google Scholar và VietSearch

Lưu trữ dữ liệu người dùng ở dạng metadata

Lưu trữ dữ liệu

Lưu trữ dữ liệu người dùng, kết nối mạng lưới chuyên gia

Lưu trữ chỉ mục tài liệu học thuật và thông tin tác giả

Data Warehouse, Data Lake: Lưu trữ dữ liệu chuyên gia chi tiết từ nhiều nguồn

Tài liệu giới thiệu và tài liệu kỹ của thuật LinkedIn, Google Scholar và VietSearch

Xử lý dữ liệu thô, làm sạch, chuẩn hóa và tích hợp từ nhiều nguồn.

Phân tích dữ liệu lớn, AI để gợi ý kết nối chuyên nghiệp

Xử lý dữ liệu học thuật, liên kết chỉ mục bài báo, tác giả

Xử lý dữ liệu thô, thu thập dữ liệu từ nhiều nguồn.

Xử lý dữ liệu

Tài liệu giới thiệu và tài liệu kỹ của thuật LinkedIn, Google Scholar và VietSearch

API mở, tích hợp dữ liệu từ nhiều hệ thống trong nước

API mạnh mẽ, tích hợp với hệ thống bên ngoài toàn cầu

Không tập trung vào tích hợp dữ liệu với hệ thống ngoài

Tích hợp hệ thống, Kết nối API

Tài liệu giới thiệu và tài liệu kỹ của thuật LinkedIn, Google Scholar và VietSearch

Tích hợp dữ liệu chủ yếu từ API của các hệ thống như Google Scholar, Research Gate, v.v.

Chia sẻ dữ liệu

trung vào Tập chia sẻ bài báo học thuật

Chia sẻ thông tin chuyên gia ở mức cơ bản, bao

Chia sẻ dữ liệu với các doanh nghiệp, tổ chức trong nước thông qua API

Chia sẻ dữ liệu mở các với doanh nghiệp, tổ chức bên ngoài

liệu giới Tài thiệu và tài liệu kỹ của thuật LinkedIn,

110

Tiêu chí Hệ thống đề xuất

LinkedIn Google Scholar VietSearch

Nguồn đánh giá

gồm cả vị trí việc làm, địa lý.

Google Scholar và VietSearch

Kiểm thử thực tế

Tìm kiếm người dùng theo tên, công ty, vị trí

Tìm kiếm tác giả và công trình học thuật

lý,

Tìm kiếm chuyên gia

Tìm kiếm chuyên gia theo lĩnh vực và vị trí địa lý.

Tìm kiếm theo tên, lĩnh vực chuyên tổ môn, địa chức

Không có xếp hạng, chỉ số trích dẫn được sử dụng

Dựa theo chức danh và nơi làm việc.

Kiểm thử thực tế

Xếp hạng dựa nối kết trên mạng lưới chuyên nghiệp

Xếp hạng chuyên gia

Xếp hạng chuyên gia theo tiêu chí định (kinh sẵn nghiệm, bằng cấp, trường học, nơi làm việc v.v.)

ý/

Gợi ý nhà khoa học trong cùng lĩnh vực

Kiểm thử thực tế

Gợi ý chuyên gia phù hợp với nhu cầu của tổ chức

Gợi ý kết nối chuyên nghiệp dựa trên mạng lưới

Không có khuyến nghị về chuyên gia, chỉ tập trung vào tài liệu

Gợi khuyến nghị chuyên gia

Chính sách bảo

Bảo mật ở mức độ trung bình

mật của các nền tảng

Quản lý truy cập tốt, nhưng có tính chia sẻ mở rộng

Bảo mật cao, tập trung vào thông tin học thuật công khai

Bảo mật thông tin và quản lý truy cập

Sử dụng công nghệ như AES- 256, , OAuth 2.0 nên khả năng bảo mật tốt với kiểm soát truy cập chặt chẽ.

Mở rộng toàn cầu với cơ sở hạ tầng Google

Khả năng mở rộng ở mức độ quốc gia hoặc cấp độ tổ chức

Mở rộng toàn cầu, phục vụ hàng triệu người dùng

Khả năng mở rộng

Mở rộng ở phạm cầu toàn vi nhưng giới hạn phạm vi người Việt

Tài liệu giới thiệu và tài liệu kỹ của thuật LinkedIn, Google Scholar và VietSearch

Ít sử dụng AI so với các hệ thống khác

Có khả năng triển khai, có áp dụng trong lưu trữ và xử lý dữ liệu

Sử dụng AI mạnh mẽ cho gợi ý và phân tích kết nối

Sử dụng AI để lập chỉ mục và xếp hạng tài liệu học thuật

Công nghệ AI và dữ liệu lớn

Tài liệu giới thiệu và tài liệu kỹ của thuật LinkedIn, Google Scholar và VietSearch

Website, App, API Website, App,

Website, API Website, API

Kiểm thử thực tế

API

Kênh truy cập

Nguồn: Tác giả tổng hợp

111

So với các hệ thống lớn như LinkedIn và Google Scholar, hệ thống tìm kiếm chuyên gia đề xuất có quy mô nhỏ hơn và chủ yếu tập trung vào việc quản lý thông tin chuyên gia trong phạm vi quốc gia hoặc tổ chức. Mặc dù khả năng mở rộng và tích hợp quốc tế của hệ thống này có thể không bằng các nền tảng toàn cầu, nhưng nó lại nhắm đến việc giải quyết các vấn đề nội bộ, chẳng hạn như cập nhật và quản lý dữ liệu chuyên gia chi tiết. Hệ thống đề xuất cũng nổi bật với các tính năng tìm kiếm, xếp hạng và khuyến nghị chuyên gia phong phú hơn so với ResearchGate hoặc Google Scholar, nhờ khả năng kết nối và khai thác thông tin đa chiều về chuyên gia, thay vì chỉ dựa trên các chỉ số học thuật. Ngoài ra, hệ thống này còn cung cấp các giao diện API mở tương tự LinkedIn, cho phép tích hợp với các hệ thống khác trong phạm vi quốc gia, một tính năng mà không phải hệ thống nào cũng có.

3.5. Đánh giá kiến trúc đề xuất

Mặc dù hệ thống chưa hoàn thành, nhưng việc đánh giá kiến trúc đã được nhận định là cần thiết và nên được triển khai sớm. Theo Ionita & cộng sự (2002), một số phương pháp để đánh giá kiến trúc hệ thống như: Phương pháp phân tích kiến trúc phần mềm SAAM, phương pháp phân tích đánh đổi kiến trúc ATAM, phương pháp phân tích lợi ích – chi phí CBAM, phương pháp phân tích bậc của kiến trúc ALMA, và phương pháp phân tích kiến trúc – gia đình FAAM. Mỗi phương pháp đánh giá có điểm mạnh và yếu khác nhau, cùng với số lượng người tham gia và vai trò của họ cũng khác nhau. Trong đó, tác giả nhận thấy, phương pháp FAAM có độ phù hợp cao hơn cả so với kiến trúc hệ thống đề xuất, bởi phương pháp này thường dùng để đánh giá các hệ thống có nhiều sự biến đổi khác nhau, và mục tiêu chính là đánh giá khả năng tương tác và khả năng mở rộng. Ngoài ra, phương pháp này còn trao quyền đánh giá cho các nhóm: Nhóm các bên liên quan bên ngoài (ko tham gia vào phát triển kiến trúc hệ thống); Nhóm các bên liên quan nội bộ là kiến trúc sư phần mềm; và Nhóm hướng dẫn, nhóm không có lợi ích trực tiếp trong kiến trúc phần mềm của hệ thống nhưng tiến hành tham gia đánh giá. Trong đó, phương pháp tự đánh giá cơ bản của FAAM là cần thiết, cho phép đánh giá kiến trúc trở thành một trong những nhiệm vụ chính trong việc phát triển các nhóm sản phẩm. Và thay vì để những người bên ngoài thực hiện đánh giá, cần có sự tham gia của các nhóm nội bộ để cải thiện quá trình phát triển kiến trúc.

Trong phạm vi luận án này, do hệ thống được xây dựng theo phương pháp Agile, cải tiến theo nhu cầu từ thực tiễn. Nên NCS không thể thực hiện đánh giá một cách đầy đủ và có đủ ba nhóm đánh giá. Vì thế, NCS sẽ thực hiện tự đánh giá, đại diện cho nhóm nội bộ. Trong đó, thực hiện đánh giá sơ bộ kiến trúc hệ thống khi so sánh với thực trạng, mục tiêu của giải pháp và kết quả so sánh ở Bảng 3.5. Cụ thể kết quả đánh giá như Bảng 3.6, với tiêu chí chính như FAAM đề xuất, đó là khả năng tương tác và khả năng mở rộng.

112

Bảng 3.6. Kết quả đánh giá khả năng tương tác và mở rộng của kiến trúc đề xuất

Tiêu chí cụ thể

Đánh giá kiến trúc

Nguồn đánh giá

Tiêu chí chung

ngoài

như

Khả năng tương tác tảng bên với nền ngoài

Khả năng tích hợp API với nền tảng LinkedIn, bên ResearchGate, Google Scholar, v.v.

Tầng nền tảng chia sẻ và tích hợp dữ liệu (Mục 3.2.3)

cho thấy tính linh hoạt trong việc kết nối.

trợ giao

thức

Khả

Hỗ chuẩn

Cung cấp API theo chuẩn (như RESTful API) sẽ giúp hệ thống dễ dàng tích hợp với bên thứ ba.

Tầng nền tảng chia sẻ và tích hợp dữ liệu (Mục 3.2.3)

Tích hợp với hệ thống dữ liệu mở

Có tích hợp với dữ liệu nghiên cứu khoa học và các hệ thống mở.

Tầng quản lý dữ liệu (Mục 3.2.2)

năng tương tác

Khả năng chia sẻ dữ liệu với bên thứ ba

Tập trung vào việc kết nối và trao đổi dữ liệu với doanh nghiệp, chuyên gia và các tổ chức.

Tầng người dùng (Mục 3.2.1) và nền tảng chia sẻ và tích hợp dữ liệu (Mục 3.2.3)

Tầng quản lý dữ liệu (Mục 3.2.2)

Hỗ trợ đồng bộ dữ liệu theo thời gian thực

Kiến trúc hệ thống có quan tâm đến vấn đề này, nhưng chưa thực hiện triển khai thử nghiệm.

Hệ thống có thể thực hiện xử lý với nhiều người dùng, nhiều truy cập.

Tầng ứng dụng và dịch vụ (Mục 3.2.4)

Hỗ trợ mở rộng theo số lượng chuyên gia và doanh nghiệp

Tính linh hoạt trong kiến trúc

Kiến trúc tham khảo đề xuất cho hệ thống

Hệ thống sử dụng kiến trúc mô đun và chia nhỏ dịch vụ, giúp dễ dàng cho việc mở rộng.

Hỗ trợ triển khai đa nền tảng

Khả năng mở

Có khả năng trên khai trên nhiều nền tảng khác nhau như cơ sở hạ tầng nội bộ, đám mây hoặc cả hai.

Tầng quản lý dữ liệu (Mục 3.2.2) và tầng Cơ sở hạ tầng ( Mục 3.2.5)

rộng

Vấn đề này chưa thực sự được mô tả rõ trong kiến trúc.

Kiến trúc tham khảo đề xuất cho hệ thống

Quản lý và tối ưu hóa hiệu suất khi số lượng người dùng tăng cao

Hỗ trợ lưu trữ và xử lý dữ liệu lớn, đáp ứng nhu cầu mở rộng.

Tầng quản lý dữ liệu (Mục 3.2.2)

Khả năng mở rộng CSDL để xử lý dữ liệu lớn

Nguồn: Tác giả đánh giá

Dựa trên phân tích đánh giá kiến trúc theo hai tiêu chí chính mà phương pháp FAAM hướng đến, hệ thống đề xuất có hỗ trợ 8/10 vấn đề liên quan đến khả năng tương

tác và khả năng mở rộng. Hệ thống có lợi thế tích hợp API mở rộng, khả năng chia sẻ

dữ liệu tốt, hỗ trợ nhiều nền tảng triển khai và có kiến trúc theo hướng chia nhỏ dịch vụ,

113

có thể mở rộng linh hoạt. Tuy nhiên, vấn đề đồng bộ dữ liệu theo thời gian thực, và tối

ưu hoá hiệu suất khi số lượng người dùng tăng chưa thực sự được chú trọng. Vì thế, cần

bổ sung thêm những khả năng này để hệ thống hoạt động hiệu quả hơn.

Thông qua bảng kết quả tự đánh giá, có thể nhận thấy mô hình kiến trúc đề xuất

mặc dù vẫn còn một số điểm yếu, tuy nhiên cũng có những điểm mạnh, và về cơ bản đạt được mục tiêu mà luận án đề ra, vì thế có thể thực hiện thử nghiệm cài đặt hệ thống tại

Chương 4.

3.6. Tổng kết chương 3

Trong Chương 3, NCS đã đề xuất một kiến trúc tham khảo hệ thống tìm kiếm

chuyên gia cho DNNVV tại Việt Nam với các thành phần được mô tả chi tiết. Trong kiến trúc đề xuất này, điểm nổi bật là bộ Cơ sở tri thức chuyên gia góp phần vào việc hỗ

trợ các nhiệm vụ trong hệ tìm kiếm chuyên gia, giúp hệ thống hoạt động một cách hiệu

quả hơn. Kiến trúc đề xuất này cũng giải quyết một số vấn đề mà hệ tìm kiếm chuyên gia đang gặp phải như đã trình bày trong Chương 2 của luận án. Việc thử nghiệm một

số chức năng nghiệp vụ cũng như thử nghiệm hệ thống sẽ được trình bày trong Chương

4 dưới đây.

Kết quả Chương 3 đã được phát triển và xuất bản trong ba tài liệu:

Thu Thi Le, Lam Xuan Pham (2022), ‘Towards NoSQL Databases: Experiences

from Actual Projects’, Kỷ yếu hội thảo Quốc tế “The 3rd International Conference on

Big Data Analytics and Practices – IBDAP”, Bangkok, 2022.

Thi Thu Le, Tuan-Dung Cao, Xuan Lam Pham, Duc Trung Pham, Toan Luu

(2023), ‘An Automatic Method for Building a Taxonomy of Areas of Expertise’, Kỷ yếu

hội thảo Quốc tế “15th International Conference on Agents and Artificial Intelligence

– ICAART”, Lisbon, 2023.

Thi Thu Le, Xuan Lam Pham, Thanh Huong Nguyen (2023), ‘Tailored Expert Finding Systems for Vietnamese SMEs: A Five-Step Framework’, International Journal of Advanced Computer Science and Applications (IJACSA), 14(11), 2023, Q3 Scopus.

114

CHƯƠNG 4. KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ

HỆ THỐNG TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP NHỎ VÀ VỪA TẠI VIỆT NAM

Theo bản mô tả kiến trúc đề xuất của hệ thống trong Chương 3, hai tầng đóng vai trò trọng tâm của hệ tìm kiếm chuyên gia, có liên quan trực tiếp đến quá trình xử lý dữ

liệu là: tầng quản lý dữ liệu và tầng ứng dụng – dịch vụ. Mỗi tầng lại có rất nhiều nghiệp

vụ bên trong. Do hạn chế về nguồn lực và thời gian, NCS chưa thể tiến hành thử nghiệm

toàn bộ các mô đun, cũng như xây dựng một hệ thống đầy đủ như kiến trúc đề xuất. Vì thế, NCS sẽ tiến hành thử nghiệm một số mô đun riêng lẻ để kiểm nghiệm độ phù hợp

của thuật toán (mỗi tầng một mô đun). Sau đó, xây dựng một hệ thống chung để thử

nghiệm kiến trúc và chức năng đã đề xuất trong Chương 2 và Chương 3 của luận án. Việc thực hiện đánh giá sẽ được thực hiện riêng với từng thuật toán và đánh giá hành vi

chấp nhận sử dụng hệ thống của người dùng với hệ thống thử nghiệm.

Nguồn: Tác giả đề xuất

Hình 4.1. Hai mô đun lựa chọn để thử nghiệm

4.1. Thử nghiệm độ phù hợp của thuật toán trong hệ thống

4.1.1. Thử nghiệm và đánh giá mô đun “Hợp nhất dữ liệu”

Một bài toán luôn cần giải quyết với các hệ thống tìm kiếm chuyên gia, đó là hợp nhất

dữ liệu được thu thập từ nhiều nguồn khác nhau, trong đó có hai yêu cầu chính là phát

hiện sự trùng lặp của các hồ sơ chuyên gia (Walowe & cộng sự, 2024) và hợp nhất các

115

hồ sơ thành một hồ sơ chung. Hoạt động này có được thực hiện tốt thì hồ sơ các chuyên

gia mới đảm tính chính xác và tránh dư thừa, trùng lặp dữ liệu. Hiện nay, có khá nhiều

cách giải quyết với bài toán này. Tuy nhiên, để phù hợp với kiến trúc hệ thống đã đề xuất, NCS đã thử nghiệm và đề xuất một thuật toán mới để phát hiện sự trùng lặp thông

tin trong các hồ sơ chuyên gia, đó là thuật toán phát hiện với tri thức KDD. Ý tưởng chính là sử dụng cơ sở tri thức về chuyên gia để bổ sung thêm tri thức, nhằm hỗ trợ việc

phát hiện trùng lặp. Quy trình thực hiện như sau:

Hình 4.2. Quy trình kết hợp giữa Cơ sở tri thức về chuyên gia và

mô đun hợp nhất dữ liệu

Nguồn: Tác giả đề xuất

NCS thực hiện triển khai phương pháp bao gồm ba bước chính: Tiền xử lý, Phát

hiện trùng lặp và Hợp nhất hồ sơ. Trong giai đoạn Tiền xử lý, tác giả chuẩn hóa dữ liệu,

phân đoạn từ, chuyển đổi các từ thành vectơ và mở rộng các thực thể bằng cách sử dụng

cách tiếp cận cơ sở tri thức để đảm bảo tính nhất quán và đầy đủ. Tiếp theo, trong giai đoạn Phát hiện trùng lặp, tác giả sử dụng các kỹ thuật Kỹ thuật tính năng nâng cao và tính toán điểm tương đồng để xác định và gắn cờ các bản sao tiềm năng trong bộ sưu tập thực thể. Cuối cùng, trong giai đoạn Hợp nhất hồ sơ, tác giả xác định hồ sơ chính trong số các hồ sơ tương tự dựa trên các thực thể trong chính hồ sơ đó. Hồ sơ chính sẽ

chứa nhiều thông tin thực thể hơn so với các hồ sơ khác. Bằng cách thực hiện các bước này một cách có hệ thống, tác giả mong muốn nâng cao độ chính xác và hiệu quả của

việc phân giải thực thể trong các bộ dữ liệu phức tạp, cuối cùng là tối ưu hóa chất lượng

và độ tin cậy của dữ liệu hồ sơ chuyên gia.

116

4.1.1.1. Định nghĩa vấn đề

Quá trình loại bỏ trùng lặp dữ liệu chuyên gia bao gồm nhiều tập dữ liệu khác nhau 𝓓. Mỗi tập dữ liệu chứa một hồ sơ chuyên gia 𝒫𝑖 ∈ 𝑑 (𝑑 ∈ 𝓓). Có hai trường hợp riêng biệt của vấn đề trùng lặp. Trong trường hợp đầu tiên , chúng ta sẽ tìm thấy hồ sơ 𝒫𝑖, 𝒫𝑗, v.v. là bản sao của 𝒫𝑖 cùng một tập dữ liệu 𝑑. Trong trường hợp khác , trong tập dữ liệu khác, p profile 𝒫𝑖 ∈ 𝑑𝑖, 𝒫𝑗 ∈ 𝑑𝑗, 𝒫𝑘 ∈ 𝑑𝑘 (𝑑𝑖, 𝑑𝑗, 𝑑𝑘 ∈ 𝓓) trình bày thông tin của một chuyên gia. Trong mỗi tập dữ liệu, hồ sơ 𝒫𝑖 chứa các thực thể ℰ = {ℰ𝑛, ℰ𝑜, ℰ𝑙, ℰ𝑝, ℰ𝑡} liên quan đến tên chuyên gia ℰ𝑛, tổ chức ℰ𝑜, địa điểm ℰ𝑙, nghề nghiệp ℰ𝑝và ℰ𝑡 - chủ đề chính của chuyên gia.

Một mô hình 𝑀 được xây dựng để phát hiện sự trùng lặp bằng cách sử dụng điểm

tương tự cao của các câu hình. Nó chứa các tham số 𝑊, sau đó tác giả tối ưu hóa mô

hình bằng cách tìm các tham số cung cấp điểm chuẩn cao nhất để đánh giá tập dữ liệu. Với hồ sơ 𝒫𝑖 và 𝒫𝑗 là đầu vào , mô hình sẽ dự đoán điểm tương đồng 𝑠̂ ∈ [0, 1]. Dựa vào ngưỡng 𝑡, nếu 𝑠̂ ≥ 𝑡, điều đó có nghĩa là 𝒫𝑖 và 𝒫𝑗 thuộc về cùng một người. Sau đó, tác giả áp dụng phương pháp hợp nhất 𝐹 để hợp nhất 𝒫𝑖 và 𝒫𝑗.

Phát hiện trùng lặp

Phát hiện trùng lặp ngây thơ

Phát hiện trùng lặp ngây thơ (Naive Duplicate Detection - NDD) dựa trên ý tưởng

ngây thơ xuất hiện dưới dạng thuật toán cơ bản đầu tiên. Logic cơ bản của phương pháp này là chuyển đổi tất cả các thực thể ℰ từ một cấu hình 𝒫 sang một vectơ 𝑉𝒫. Vector 𝑉𝒫 là kết quả của việc áp dụng hàm tiền xử lý 𝑝 thông qua các tệp ℰ𝑗 ∈ ℰ. Khi đánh giá độ tương đồng giữa hai hồ sơ, sau khi hoàn thành vector tiền xử lý 𝑉𝒫 cho mỗi hồ sơ (𝑉𝒫1, 𝑉𝒫2), 𝑉𝑢𝑛𝑖𝑡 vector được tạo bởi 𝑉𝑢𝑛𝑖𝑡 = 𝑉𝒫1 ∪ 𝑉𝒫2. Cuối cùng 𝑉1 và 𝑉2 được tạo dựa trên 𝑉𝑢𝑛𝑖𝑡.

Tính độ tương tự giữa các hồ sơ dựa trên cosin của hai véc tơ theo Phương trình 4.1:

𝑠̂ = 𝑐𝑜𝑠𝑖𝑛𝑒(𝑉1, 𝑉2) =

𝑉1.𝑉2 |𝑉1|.|𝑉2|

(4.1)

Phát hiện trùng lặp tri thức Trong quá trình nghiên cứu, tác giả nhận thấy thuật toán NDD có một số hạn chế khi

xuất hiện những vấn đề không thể giải quyết được. Thuật toán phát hiện trùng lặp ngây

thơ không thể nhận ra sự tương đồng giữa các thực thể của hồ sơ liên kết với nhau bằng

mối quan hệ cấp độ. Các vấn đề được tìm thấy trong các thực thể liên quan đến vị trí,

chủ đề, v.v. Do đó, cách tiếp cận của NDD không phù hợp để giải quyết mối quan hệ

117

phức tạp giữa các thực thể. Đó là lý do chính khiến NCS phát triển thuật toán phát hiện

trùng lặp tri thức. Mặc dù có nhiều phương pháp để phát hiện sự trùng lặp thực thể, trong

đó đang được quan tâm nhiều hiện nay là các phương pháp áp dụng học máy (Hechler & cộng sự, 2023), tuy nhiên, NCS lựa chọn việc phát triển thuật toán dựa vào cơ sở tri

thức là do kiến trúc đề xuất của hệ thống sử dụng sự hỗ trợ từ cơ sở tri thức chuyên gia khá nhiều. Vì thế, việc các thuật toán sử dụng trong hệ thống đi theo ý tưởng này sẽ đảm

bảo được tính thống nhất trong tổng thể.

Phát hiện trùng lặp tri thức (Knowledge Duplicate Detection - KDD) là một thuật

toán phát hiện các thực thể giống nhau trong các hồ sơ chuyên gia, giải quyết các hạn chế của các thuật toán trước đó trong việc phân biệt sự giống nhau giữa các thực thể ở

các cấp độ phân cấp khác nhau. Ví dụ, "Trí tuệ nhân tạo" (AI) và "Học sâu" (DL) là hai

thực thể khác nhau, nhưng DL là một phần của AI. Tương tự, Hà Nội và Hồ Chí Minh

là hai thành phố khác nhau nhưng đều thuộc Việt Nam khi xét ở cấp độ quốc gia. Các

ví dụ này nhấn mạnh sự cần thiết phải giải quyết vấn đề tương tự phụ thuộc vào cấp độ.

Hồ sơ 𝒫𝑖 và 𝒫𝑗 chứa thực thể ℰ𝑖 𝑣à ℰ𝑗 tương ứng là thông tin của các thực thể trong hồ sơ. Có hai thực thể con 𝑒𝑖 ∈ ℰ𝑖, 𝑒𝑗 ∈ ℰ𝑗, với 𝑒𝑖 ≠ 𝑒𝑗. Tuy nhiên, 𝑒𝑖 𝑣à 𝑒𝑗 sẽ chứa các mối quan hệ cấp độ như 𝑒𝑖 ⊂ 𝑒𝑗 hoặc 𝑒𝑗 ⊂ 𝑒𝑖 hoặc 𝑒𝑖, 𝑒𝑗 ∈ 𝑇 (𝑇 là một chủ đề cụ thể).

KDD kế thừa từ NDD, trong đó cấu hình 𝒫 được biểu thị dưới dạng vectơ 𝑉𝒫. Tuy nhiên, thay vì tính toán độ tương tự 𝑠̂ giữa 𝑉𝒫1và 𝑉𝒫2trực tiếp, tác giả xác định 𝑠̂ = 𝑛 ∑ 𝑤𝑖𝑠𝑖 . Điều này có nghĩa là 𝑠̂ được tính bằng cách tính tổng các độ tương tự phụ 𝑠𝑖 và 1 trọng số của chúng 𝑤𝑖 (trong đó ∑ 𝑤𝑖 = 1). Trong mỗi thành phần 𝑠𝑖, cách tính cụ thể được hỗ trợ bởi tập dữ liệu tri thức 𝓓𝑲. Tập dữ liệu tri thức được thu thập từ nhiều nguồn khác nhau và được xác nhận bởi các chuyên gia.

Việc tính toán độ giống nhau về tên giữa các chuyên gia Việt Nam đặt ra những thách thức đáng kể. Ở Việt Nam, gần 40% dân số có cùng họ “Nguyễn”, do đó tần suất xuất hiện cao. Do đó, các chuyên gia có cùng họ chung này có xu hướng thể hiện mức độ tương đồng cao hơn. Ngược lại, những cá nhân mang họ hoặc tên ít phổ biến hơn sẽ có điểm tương đồng thấp hơn. Để giải quyết vấn đề này, điều bắt buộc là phải giảm bớt điểm tương tự liên quan đến các họ có mức độ phổ biến cao như “Nguyen” và tăng điểm

tương tự cho các họ ít phổ biến hơn. Điều này đòi hỏi cần phải có một phân tích thống kê về sự phân bổ tần suất của các họ Việt Nam bằng cách tổng hợp các hồ sơ từ cơ sở dữ liệu. Sau đó, những hiểu biết thống kê thu được sẽ cung cấp thông tin cho quá trình

118

tính toán độ giống nhau về tên, từ đó thúc đẩy đánh giá mang tính chính xác hơn về độ

giống nhau của các chuyên gia Việt Nam.

Giả sử có thông tin tên 𝑛𝑖 ∈ 𝒫𝑖, 𝑛𝑗 ∈ 𝒫𝑗, chúng ta chuyển đổi 𝑛𝑖 𝑣à 𝑛𝑗 sang vectơ 𝑉𝑛𝑖 𝑣à 𝑉𝑛𝑖, tương ứng. Sau đó, áp dụng công thức cosin để tính điểm tương đồng của 𝑉𝑛𝑖 𝑣à 𝑉𝑗. Ngoài ra, với 𝑡𝑖 ∈ 𝑉𝑛𝑖, 𝑡𝑗 ∈ 𝑉𝑛𝑖, nếu 𝑡𝑖 = 𝑡𝑗, ta tìm điểm thường xuyên 𝑡𝑓 trong 𝓓 𝒏 ∈ 𝓓𝑲. Độ tương tự cuối cùng 𝑠̂𝑛 được tính bằng công thức: 𝑠̂𝑛 = (1 − 𝑤𝑡𝑓). 𝑐𝑜𝑠𝑖𝑛(𝑉𝑛𝑖, 𝑉𝑛𝑗) + 𝑤𝑡𝑓. 𝑡𝑓

Việc tính toán độ tương tự của vị trí 𝑠̂𝑙 và chủ đề 𝑠̂𝑡 bằng cách áp dụng trực tiếp công thức cosine có những hạn chế. Vì vậy, tác giả đưa ra giải pháp mở rộng các thực thể 𝑒𝑖, 𝑒𝑗 𝑣à𝑜 𝐸𝑖, 𝐸𝑗 tương ứng. Việc mở rộng 𝑒𝑖, 𝑒𝑗 được hỗ trợ bởi 𝓓𝒍, 𝓓𝒕 ∈ 𝓓𝑲, điều này sẽ phụ thuộc vào việc 𝑒𝑖, 𝑒𝑗 𝑙𝑖ê𝑛 𝑞𝑢𝑎𝑛 𝑣ớ𝑖 ℰ𝑙 𝑣à ℰ𝑡. Sau đó, độ tương đồng 𝑠̂𝑙 và 𝑠̂𝑡 được tính bằng hàm Độ tương tự 𝑓𝑠. 𝑠̂𝑖 ∈ [𝑠̂𝑙, 𝑠̂𝑡] với công thức 𝑠̂𝑖 = 𝑓𝑠(𝑒𝑖, 𝑒𝑗, 𝐸𝑖, 𝐸𝑗).

Thuật toán KDD có những điểm mới so với những thuật toán phát hiện trùng lặp

khác, đó là việc bổ sung quá trình tính toán độ tương đồng trong tên người Việt, và áp

dụng cơ sở tri thức để mở rộng các thực thể, từ đó áp dụng vào tính toán độ tương tự,

giải quyết vấn đề tương tự phụ thuộc vào cấp độ.

Hợp nhất hồ sơ chuyên gia

Khái niệm cơ bản của phương pháp hợp nhất 𝐹 là tìm một câu hình chính 𝒫𝑚 giữa 𝒫𝑖 và 𝒫𝑗, sau đó hợp nhất câu hình còn lại với câu hình chính. Hồ sơ chính được xác định bằng cách so sánh các thực thể trong 𝒫𝑖 và 𝒫𝑗, số lượng thực thể ℰ𝑖 ∈ 𝒫𝑖, ℰ𝑗 ∈ 𝒫𝑗. Nếu ℰ𝑖 ≥ ℰ𝑗 thì 𝒫𝑚 là 𝒫𝑖. Sau khi xác định được hồ sơ chủ 𝒫𝑚, ta có ℰ𝑚 = ℰ𝑖 ∪ ℰ𝑗.

4.1.1.2. Thử nghiệm và đánh giá

Cơ chế thu thập dữ liệu

19 https://serpapi.com/google-scholar-api 20 https://api.crossref.org/swagger-ui/index.html

Việc thu thập dữ liệu được ưu tiên lấy về thông qua API của các nền tảng. Tuy nhiên, ngoài LinkedIn cung cấp API chính thống (người dùng cần quyền truy cập OAuth 2.0), thì API của Google Scholar và Research Gate không cung cấp chính thức, mà dữ liệu được lấy thông qua nền tảng trung gian như SerpAPI19 hay CrossRef API20. Dữ liệu thu

119

thập về là dữ liệu ở dạng Metadata với các thông tin chính như: Họ tên, nơi làm việc,

công việc, vị trí địa lý, lĩnh vực nghiên cứu, liên kết hồ sơ.

Quy trình thu thập dữ liệu được thực hiện như sau:

Bước 1: Thu thập danh sách hồ sơ chuyên gia từ Google Scholar. Lưu vào file

.csv và chuyển đổi sang file .json với cấu trúc định sẵn.

Bước 2: Dựa trên danh sách profile của các chuyên gia, tiến hành thu thập profile

của chuyên gia ở các nguồn lần lượt là Linkedin và Researchgate. Nếu chuyên gia chỉ

có profile ở một nguồn thì vẫn tiến hành thu thập. Mỗi nguồn dữ liệu thu thập lưu thành

một file có đuôi .json.

Hồ sơ chuyên gia bao gồm ba phần thông tin chính bao gồm tên chính, các tên

gọi khác của chuyên gia và thực thể. Phần đầu tiên của hồ sơ chuyên gia cho biết tên

được sử dụng làm tên chính của các chuyên gia. Phần thứ hai gồm các tên khác, hiển thị

tất cả các tên tương tự với tên gốc mà tác giả đã thu thập được trong hồ sơ chuyên gia.

Phần cuối gồm các thực thể chứa thông tin thuộc về chuyên gia có liên quan đến địa

điểm (nơi chuyên gia sinh sống), tổ chức (nơi làm việc mà chuyên gia đã làm việc trong

quá khứ cho đến hiện tại), chủ đề (chuyên ngành chính) và nghề nghiệp (chức danh công

việc của chuyên gia). Cụ thể, trong một hồ sơ, lưu trữ các trường thông tin sau:

1. ID - string

ID của profile được tạo dựa trên format xx_yy

Trong đó: xx là tên viết tắt nguồn dữ liệu ld(Linkedin), gs(Google Scholar),

rg(ResearchGate).

yy là ID được cung cấp bởi file danh sách chuyên gia.

VD: ld_01, gs_12, rg23

2. name - string

Name là trường tên của chuyên gia

3. names - list

Name là trường thông tin thu thập các tên gọi khác của profile VD: ["Toan Luu", "Lưu Vĩnh Toàn", "Toàn Lưu", ...]

4. source_urls - list

Source url là trường thông tin lưu link trang web dẫn đến profile, hoặc là các

đường dẫn khác như là CV, profile cá nhân tại trang web của trường đại học.

VD: ["www.example1.com", "www.example2.com"]

5. entity - list

Trong thực thể (entity) bao gồm các thông tin đặc trưng của chuyên gia như

organizations, professions, topics, và locations.

VD:

120

[

{entity 1},

{entity 2}, ...,

{entity n}

]

Mỗi entity bao gồm các trường thông tin sau:

- name: Tên của thông tin - experiences: loại của thông tin bao được định nghĩa trong 4 loại sau: location,

organization, profession và topic.

VD:

{ "name": "Wallisellen",

"experiences": "location"

}

Bước 3: Tổng hợp các file hồ sơ hoàn chỉnh cho từng nguồn theo cấu trúc chung.

Dữ liệu sau khi được thu thập sẽ được làm sạch, chuẩn hoá trước khi đưa vào lưu

trữ trong CSDL. Việc xử lý tốn khá nhiều thời gian do một số công đoạn được thực hiện

thủ công bởi cấu trúc dữ liệu trong các nguồn thu thập là khác nhau. Vì thế, mặc dù số

lượng dữ liệu hồ sơ chuyên gia chưa nhiều, nhưng đã đủ cho triển khai thử nghiệm thuật

toán. Nên NCS chỉ thu thập số lượng như trong bộ dữ liệu được mô tả chi tiết trong

Bảng 4.1.

Tập dữ liệu

Trong thử nghiệm này, tác giả sử dụng các bộ dữ liệu 𝓓𝑳𝑰, 𝓓𝑹𝑮, 𝓓𝑮𝑺𝟏 , 𝓓𝑮𝑺𝟐 ∈ 𝓓. Tập 𝓓𝑳𝑰 dữ liệu chứa hồ sơ chuyên gia được thu thập từ trang: LinkedIn, 𝓓𝑹𝑮 từ trang Research Gate và 𝓓𝑮𝑺𝟏, 𝓓𝑮𝑺𝟐 từ trang Google Scholar. Số lượng thực thể chuyên gia của mỗi tập dữ liệu được minh họa ở Bảng 4.1.

Bảng 4.1. Số lượng hồ sơ trong bộ dữ liệu

Nhóm

Tập dữ liệu

Số lượng hồ sơ

43

𝓓𝑳𝑰

72

Nhóm 1

𝓓𝑮𝑺𝟏

30

𝓓𝑹𝑮

2179

𝓓𝑮𝑺𝟐

Nhóm 2

Nguồn: Tác giả tổng hợp từ kết quả thử nghiệm

121

Tổng số hồ sơ trong nhóm một: 𝓓𝑳𝑰, 𝓓𝑹𝑮, 𝓓𝑮𝑺𝟏 là 145. Tuy nhiên, 145 hồ sơ chỉ đại diện cho 47 chuyên gia duy nhất. Mặt khác, nhóm hai: 𝓓𝑮𝑺𝟐 cung cấp 2179 hồ sơ, trong đó có 274 hồ sơ trùng lặp.

Cấu trúc của hồ sơ chuyên gia 𝒫𝑖 ∈ 𝑑 ( 𝑑 ∈ 𝓓) như sau: trong hồ sơ 𝒫𝑖, có một số thực thể ℰ𝑖 và siêu dữ liệu ℳ𝑖. Tất cả các thực thể ℰ𝑖 bao gồm tên, địa điểm, tổ chức, chủ đề và ngành nghề. Ngoài ra, các trường trong ℳ𝑖 chứa ID hồ sơ và nguồn URL, được sử dụng để xác nhận hồ sơ và đảm bảo tính chính xác.

{

"id": "gs_01",

"name": "Toan Luu",

"names": [

"Toan Luu",

"toan luu",

"luu vinh toan"

],

"entities": [

{

"name": "EPFL",

"experiences": "organization",

},

{

}

],

"source_urls": [

"https://scholar.google.com/citations?user=KB9_4rgAAAAJ",

]

}

Ví dụ:

Cơ sở tri thức về chuyên gia

Bộ dữ liệu cơ sở tri thức 𝓓𝑲 đóng vai trò là tài liệu tham khảo cơ bản, bao gồm các danh mục được xác định trước liên quan đến tên chuyên gia, chủ đề (lĩnh vực chuyên

môn), ngành nghề, tổ chức và địa điểm. Để đảm bảo tính chính xác và nhất quán, các bộ

dữ liệu tri thức được xác định trước sau đó được sử dụng làm điểm chuẩn, cung cấp

điểm tham chiếu cho các thực thể như: tên chuyên gia hợp lệ, chủ đề, tổ chức và địa

điểm được công nhận.

122

Vì 𝓓𝒏 ∈ 𝓓𝑲, cấu trúc của tập dữ liệu 𝓓𝒏 = {𝒕𝒊: 𝒇𝒊} (𝒊 ∈ [𝟏, 𝒏]), 𝒕𝒊 là token tiếng Việt và 𝒇𝒊 thể hiện tần suất xuất hiện của token 𝒕𝒊, được đánh giá thông qua cơ sở dữ liệu. Mặt khác, tác giả thiết kế cấu trúc của tập dữ liệu 𝓓𝒍 , 𝓓𝒕 ∈ 𝓓𝑲 giống như cấu trúc của 𝓓𝒏, với 𝓓𝒍 , 𝓓𝒕 = {𝒕𝒊: 𝒕𝒊−𝟏}. Trong trường hợp này, 𝑡𝑖 biểu thị thông tin ở mức 𝑖 và 𝑡𝑖−1 biểu thị thông tin ở mức 𝑖 − 1.

Tiền xử lý

Quá trình này bao gồm bốn bước tuần tự: Chuẩn hóa, Mã thông báo, Chuyển đổi từ sang vectơ và Mở rộng các thực thể. Trong giai đoạn đầu, Chuẩn hóa nhằm mục đích chuẩn hóa các biểu diễn thực thể, đảm bảo tính nhất quán giữa các nguồn không đồng

nhất. Điều này liên quan đến việc áp dụng các quy tắc định dạng cho tên chuyên gia,

chẳng hạn như viết hoa và loại bỏ các ký tự đặc biệt, đồng thời chuẩn hóa các lĩnh vực

chuyên môn, ngành nghề, tổ chức và địa điểm để đạt được tính đồng nhất. Sau đó, trong

giai đoạn Mã hóa, dữ liệu được phân chia thành các mã thông báo (tức là các thành phần

từ), sau đó loại bỏ các mã thông báo trùng lặp để đảm bảo tính sạch sẽ và hiệu quả. Bước

thứ ba, chuyển đổi từ sang vectơ, đòi hỏi phải chuyển đổi thông tin văn bản thành định

dạng vectơ phù hợp cho phân tích định lượng, các chi tiết cụ thể phụ thuộc vào thuật

toán được sử dụng. Ngoài ra, bước tùy chọn của Mở rộng thực thể sẽ làm phong phú

thêm khả năng hiểu thực thể bằng cách tích hợp bối cảnh bổ sung từ cơ sở tri thức. Quy

trình này đảm bảo yêu cầu chuẩn hóa và tạo ra sự phong phú của các thực thể trên các

nguồn khác nhau.

Chi tiết triển khai

Trước khi đánh giá độ tương đồng của tất cả các hồ sơ, tác giả tạo một tập hợp 𝒞 = {(𝑖𝑑1, 𝑖𝑑2), , 𝑣. 𝑣. } của các cặp hồ sơ. Trong bộ sưu tập này, 𝑖𝑑1 𝑣à 𝑖𝑑2 đại diện cho ID duy nhất của hồ sơ.

Đối với thuật toán NDD, khi chuẩn hóa xong, chúng ta tạo một vectơ đơn vị 𝑉𝑢𝑛𝑖𝑡 giữa hai hồ sơ. Bước tiếp theo chuyển đổi chúng từ vectơ từ sang vectơ dựa trên vectơ đơn vị. Sau đó, áp dụng phương trình tương tự cosin để tính toán độ tương tự của các hồ sơ chuyên gia. Trong quá trình chuyển, ngưỡng phân biệt hồ sơ có thuộc về cùng

ngưỡng ngưỡng khác các 𝑡 = 0.63 và

quay khi một người hay không dựa trên ngưỡng 𝑡 = 0.23. Mặt khác, đối với thuật toán KDD, 𝑤𝑖 ∈ là 𝑤𝑛𝑎𝑚𝑒 =

{𝑤𝑛𝑎𝑚𝑒, 𝑤𝑡𝑜𝑝𝑖𝑐, 𝑤𝑙𝑜𝑐𝑎𝑡𝑖𝑜𝑛, 𝑤𝑜𝑟𝑔𝑎𝑛𝑖𝑧𝑎𝑡𝑖𝑜𝑛, 𝑤𝑝𝑟𝑜𝑓𝑒𝑠𝑠𝑖𝑜𝑛} sau 0.7, 𝑤𝑡𝑜𝑝𝑖𝑐 = 0.1, 𝑤𝑙𝑜𝑐𝑎𝑡𝑖𝑜𝑛 = 0.05, 𝑤𝑜𝑟𝑔𝑎𝑛𝑖𝑧𝑎𝑡𝑖𝑜𝑛 = 0.1 và 𝑤𝑝𝑟𝑜𝑓𝑒𝑠𝑠𝑖𝑜𝑛 = 0.05.

123

Các giá trị ngưỡng được xác định thông qua thử nghiệm thực tiễn trên tập dữ liệu.

Thực hiện chạy mô hình với nhiều ngưỡng khác nhau để đánh giá hiệu suất. Chọn

ngưỡng mang lại hiệu suất tốt nhất trên thước đo F1 Score (Phương trình 4.5), sau đó đánh giá kỹ lưỡng để đảm bảo rằng mô hình hoạt động hiệu quả và chính xác trong việc

phát hiện trùng lặp.

Ngoài ra, còn có một số thành phần thiết lập hỗ trợ tính toán 𝑠̂𝑛, 𝑠̂𝑙, 𝑠̂𝑡. Trong công

thức 𝑠̂𝑛 = (1 − 𝑤𝑡𝑓). 𝑐𝑜𝑠𝑖𝑛 (𝑉𝑛𝑖, 𝑉𝑛𝑗) + 𝑤𝑡𝑓. 𝑡𝑓, chọn 𝑤𝑡𝑓 = 0.4. Hơn nữa, khi phân tích 𝑠̂𝑖 ∈ [𝑠̂𝑙, 𝑠̂𝑡] bằng hàm 𝑓𝑠(𝑒𝑖, 𝑒𝑗, 𝐸𝑖, 𝐸𝑗), kết quả được đánh giá là 𝑠̂𝑖= 1,0 nếu 𝑒𝑖 giống với 𝑒𝑗. Áp dụng với (𝑒𝑖, 𝐸𝑗) ℎ𝑜ặ𝑐 (𝑒𝑗, 𝐸𝑖), nếu có điểm tương đồng 𝑠̂𝑖= 0,5. Cuối cùng, nếu 𝐸𝑖, 𝐸𝑗 giống với những cái khác, 𝑠̂𝑖= 0,1.

Đánh giá

Mỗi hồ sơ chứa một id duy nhất 𝒫𝑖, là sự kết hợp giữa nguồn dữ liệu và thứ tự số của hồ sơ, được phân tách bằng ký hiệu gạch dưới. Tác giả chuẩn bị một tệp đánh giá con người, trong đó mỗi dòng chứa một cặp hồ sơ thuộc về cùng một người, được phân

tách bằng ký tự dấu phẩy. Định dạng của hồ sơ chuyên gia như mô tả dưới đây:

gs_01,ld_01

gs_01,rg_01

ld_01,rg_01

gs_02,ld_02

Điều này chỉ ra rằng gs_01, ld_01, rg_01 thuộc về chuyên gia 01 và gs_02, ld_02

thuộc về chuyên gia 02 . Việc tạo ra một tập hợp các bản sao duy nhất bao gồm việc tạo

các cặp, trong đó mã định danh bên trái luôn đứng trước mã định danh bên phải theo thứ

tự bảng chữ cái. Sau khi thực hiện quá trình phát hiện sự trùng lặp, sẽ thu được một danh

sách bao gồm các cặp trùng lặp. Khi đánh giá các kết quả trùng lặp, ba trường hợp riêng biệt xuất hiện. Thứ nhất, tồn tại trường hợp trong đó các cặp trùng lặp trùng với các cặp được xác định trong tệp đánh giá con người, thể hiện nhận dạng chính xác. Ngược lại, những trường hợp không có cặp nào trong hồ sơ đánh giá biểu thị những phát hiện sai sót. Cuối cùng, có những trường hợp các cặp tồn tại trong tệp đánh giá nhưng vẫn không

được thuật toán nhận dạng, tạo thành các cặp bị thiếu. Kết quả minh họa được trình bày trong Bảng 4.2.

124

Bảng 4.2. Ví dụ về các trường hợp trong kết quả phát hiện trùng lặp

Hồ sơ đánh giá

Cặp phát hiện

Kết quả

gs_01-ld_01

gs_01-ld_01

Chính xác

gs_01-rg_01

gs_01-rg_01

Chính xác

ld_01-rg_01

ld_02-rg_01

Sai

gs_02-ld_02

Mất tích

Nguồn: Tác giả đề xuất

Trong định nghĩa bài toán, tác giả xác định đây là bài toán phân loại. Do đó, việc

đánh giá hiệu suất giữa các thuật toán sẽ sử dụng một số số liệu phổ biến như Precision,

Accuracy, Recall và F1-score. Precision (độ chính xác) là tỉ lệ giữa số lần dự đoán đúng (TP) trên tổng số dự đoán (PP), nó cho biết thông tin về độ chính xác của mô hình khi dự

đoán. Accuracy (độ chuẩn xác) được tính bằng tổng số trường hợp dự đoán đúng trên cả

âm tính (NP) và dương tính (TP) chia cho tổng số tất cả dự đoán. Recall là tỉ lệ giữa số

lượng True Positive (TP) trên tổng số Real Positive (RP), hay nói các khác là số lần dự đoán

đúng trên số nhãn đúng, nó cho biết tỉ lệ bỏ sót của mô hình khi dự đoán. F1-score là độ đo

kết hợp giữa Recall và Precision. Công thức cụ thể của các độ đo như sau:

Độ đo Precision được định nghĩa như Công thức 4.2:

(4.2) 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = = 𝑇𝑃 𝑃𝑃 𝑇𝑃 𝑇𝑃 + 𝐹𝑃

Độ đo Recall được định nghĩa như Công thức 4.3:

(4.3) 𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃 𝑅𝑃

Độ đo Accuracy được định nghĩa như Công thức 4.4:

(4.4) Accuracy = 𝑇𝑃 + 𝑇𝑁 𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁

Độ đo F1 được định nghĩa như Công thức 4.5:

(4.5) 𝐹1 = 2 × 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 × 𝑅𝑒𝑐𝑎𝑙𝑙 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 + 𝑅𝑒𝑐𝑎𝑙𝑙

Bảng 4.3 dưới đây thể hiện cách tính toán các trường hợp có thể xảy ra khi so

sánh các cặp hồ sơ để xác định trùng lặp.

125

Bảng 4.3. Các trường hợp dự đoán cặp hồ sơ trùng lặp

Thực tế Trường hợp ĐÚNG SAI

ĐÚNG Chính xác Sai Dự đoán SAI Mất tích 0

Nguồn: Tác giả đề xuất

Tuy nhiên, trong nghiên cứu này, tác giả không gắn nhãn hồ sơ chuyên gia không

khớp. Điều đó có nghĩa là dự đoán sẽ không chứa kết quả của hai hồ sơ không thuộc về

cùng một người. Vì vậy, sẽ bỏ qua trường hợp “âm tính thực sự”. Mục đích của thuật

toán là nhận biết liệu các hồ sơ khác nhau có thuộc về cùng một chuyên gia hay không.

Do đó, cách tiếp cận của tác giả là để đánh giá các số liệu phù hợp với mục tiêu này.

Kết quả

Phát hiện trùng lặp

Bảng 4.4 dưới đây trình bày hiệu suất của các thuật toán liên quan đến hai bộ dữ liệu

riêng biệt. Có thể nhận thấy rằng thuật toán KDD vượt qua NDD với độ chính xác gần gấp

đôi trong tập dữ liệu nhóm một. Hơn nữa, các đánh giá về hai thuật toán trên với tập dữ liệu

nhóm hai cũng được chỉ rõ, trong đó tất cả các chỉ số đánh giá với thuật toán KDD đều thể

hiện giá trị vượt trội so với các chỉ số đánh giá với thuật toán NDD. Do đó, các số liệu hiệu

suất khẳng định rằng KDD mang lại hiệu suất tốt hơn so với NDD.

Bảng 4.4. Các chỉ số đánh giá thuật toán

Tập dữ liệu nhóm 1 Tập dữ liệu nhóm 2 Độ đo

NDD KDD NDD KDD

Accuracy 0,4359 0,8600 0,4106 0,6696

Precision 0,6892 0,9348 0,4615 0,7729

Recall 0,5426 0,9149 0,7883 0,8321

F1 score 0,6071 0,9247 0,5822 0,8014

Nguồn: Tác giả tổng hợp từ kết quả thử nghiệm

Kết quả hợp nhất

Sau khi phát hiện các hồ sơ trùng lặp và hợp nhất chúng thành một hồ sơ duy nhất, chất lượng của hồ sơ cuối cùng được cải thiện đáng kể về mặt tính nhất quán, đầy

126

đủ và đa dạng của dữ liệu. Hồ sơ cuối cùng bao gồm tất cả các thực thể từ tất cả các phiên bản trùng lặp, đảm bảo rằng không có thông tin quan trọng nào bị bỏ sót.

Quá trình hợp nhất không chỉ tích hợp các thực thể từ các hồ sơ trùng lặp mà còn mở rộng hồ sơ để bao gồm các thực thể bắt nguồn từ tập dữ liệu kiến thức. Điều này có nghĩa là sau quá trình hợp nhất, dữ liệu chuyên gia không chỉ trở nên nhất quán mà còn phong phú hơn, với sự bổ sung từ các nguồn dữ liệu uy tín và được xác thực. Qua đó phản ánh rõ ràng tính hiệu quả của quá trình hợp nhất trong việc nâng cao chất lượng hồ sơ. Đồng thời cũng hỗ trợ người dùng trong việc tìm kiếm và đánh giá chuyên gia một cách hiệu quả hơn.

Minh họa của quá trình này như sau: Giả sử có hai hồ sơ chuyên gia trùng lặp

gồm Hồ sơ 1 và Hồ sơ 2. Hồ sơ 1 {

"id": "gs_01",

"name": "Toàn Lưu",

"names": ["Toàn Lưu", "toàn lưu", "lưu vĩnh toàn"],

" entities": [

{"name": "EPFL", "experiences": "organization"},

, v.v.

],

"source_urls": ["https://scholar.google.com/cites?user=KB9_4rgAAAAJ"]

}

Hồ sơ 2

{

"id": "li_01",

"name": "Lưu Toàn",

"names": ["Lưu Toàn", "toàn lưu"],

"entities": [

{"name ": "EPFL", "experiences ": "organization"},

{"name ": "Đại học Bách Khoa", "experiences ": "organization"},

, v.v.

],

127

"source_urls": ["https://linkedin.com/in/toanluu"]

}

Sau khi phát hiện trùng lặp, thực hiện hợp nhất hai hồ sơ này thành một hồ sơ duy nhất, bao gồm tất cả các thực thể và mở rộng thông tin từ cơ sở tri thức.

Hồ sơ sau hợp nhất:

{

"id": "merged_01",

" name": ["Toàn Lưu", "toàn lưu", "lưu vĩnh toàn", "Lưu Toàn"],

"entities": [

{"name": "EPFL", "experiences": "organization"},

{"name": "Đại học Bách Khoa", "experiences": "organization"},

, v.v.

],

["https://scholar.google.com/cites?user=KB9_4rgAAAAJ",

"source_urls": "https://linkedin.com/in/toanluu"]

}

4.1.2. Thử nghiệm và đánh giá mô đun “Xếp hạng chuyên gia”

Xếp hạng chuyên gia là một nhiệm vụ vô cùng quan trọng trong các hệ tìm kiếm

chuyên gia. Việc xếp hạng chuyên gia không chỉ giúp quá trình hiển thị kết quả tìm kiếm

tốt hơn, mà nó còn giúp đem lại trải nghiệm tốt, đáp ứng yêu cầu tìm kiếm của người dùng

(Mahmood & cộng sự, 2024).

Để thực hiện việc thử nghiệm xếp hạng, cần có bộ dữ liệu chuyên gia làm dữ liệu

21 https://trec.nist.gov/data/enterprise.html 22 https://dblp.uni-trier.de/xml/ 23 https://survey.stackoverflow.co/

đầu vào. Tuy nhiên, trong quá trình nghiên cứu, tác giả nhận thấy rằng, việc lựa chọn một bộ dữ liệu có sẵn thông tin về các ứng viên chuyên gia là rất khó thực hiện, bởi hiện nay, ngoại trừ bộ dữ liệu “TREC 2005-2006 enterprise track data”21, gần như có rất ít bộ dữ liệu về ứng viên chuyên gia trong doanh nghiệp. Bởi chủ yếu, các bộ dữ liệu mẫu về chuyên gia như DBLP22, hay Stack Overflow23 là những dữ liệu phù hợp với nhu cầu

128

tìm kiếm chuyên gia trong lĩnh vực học thuật hoặc cộng đồng hỏi đáp hơn là cho doanh

nghiệp.

Trong hệ thống thống tìm kiếm chuyên gia thực tế, quy trình “Xếp hạng chuyên gia” sẽ được thực hiện sau quy trình “Phát hiện trùng lặp và hợp nhất hồ sơ chuyên gia”.

Tuy nhiên, trong quá trình thử nghiệm thì hai quy trình này có thể thực hiện song song. Đây là lý do dẫn đến NCS đã sử dụng hai bộ dữ liệu khác nhau để thử nghiệm cho hai

mô đun này.

Để có thể thực hiện được việc thử nghiệm thuật toán xếp hạng chuyên gia, NCS

đã tự xây dựng bộ dữ liệu dựa trên các hồ sơ chuyên gia công bố trên mạng xã hội việc làm Linkedin. Một mạng xã hội chứa lượng lớn thông tin các chuyên gia mà doanh

nghiệp thường rất quan tâm.

Ngoài ra, bối cảnh nghiên cứu sẽ tập trung vào nhu cầu tìm kiếm chuyên gia trong lĩnh vực công nghệ thông tin. Đây là một lĩnh vực mà nhu cầu tìm kiếm chuyên gia về

công nghệ luôn rất lớn và liên tục trong các DN. Do đó, chuyên gia được lựa chọn để

thu thập thông tin đưa vào bộ dữ liệu thử nghiệm sẽ là các chuyên gia ngành CNTT.

Các bước thực hiện thử nghiệm thuật toán trong mô đun xếp hạng chuyên gia sẽ

3. Thu thập dữ liệu 150 ứng viên trên Linkedin

2. Lựa chọn một vị trí tuyển dụng cụ thể làm tình huống nghiên cứu

1. Xác định yêu cầu tìm kiếm chuyên gia CNTT cho một số vị trí công việc trong các doanh nghiệp

4. Xác định các trường thông tin về ứng viên để cấu trúc hoá bộ dữ liệu --> Tạo bộ dữ liệu thứ nhất

7. Đánh giá kết quả

6. Chạy thử nghiệm hai bộ dữ liệu với thuật toán xếp hạng Learning to rank

5. Kết hợp Cơ sở tri thức chuyên gia với bộ dữ liệu một, để làm giàu thêm thông tin -- > Tạo bộ dữ liệu thứ hai

trải qua bảy bước chính, được mô tả như Hình 4.3.

Hình 4.3. Quy trình thực hiện xếp hạng chuyên gia CNTT theo yêu cầu của DN

Nguồn: Tác giả đề xuất

129

Quy trình này có thể mở rộng cho nhiều lĩnh vực, nhiều tình huống khác nhau.

Đối với hệ thống tìm kiếm chuyên gia, thông qua kết quả thử nghiệm của quy trình này,

có thể xác định và cung cấp sẵn các tiêu chí mà DN thường quan tâm để doanh nghiệp lựa chọn xếp hạng chuyên gia, từ đó đáp ứng được đúng yêu cầu mà DN đưa ra.

4.1.2.1. Xác định yêu cầu tìm kiếm chuyên gia CNTT cho một số vị trí công việc trong các doanh nghiệp

Để tìm hiểu yêu cầu của các doanh nghiệp khi tìm kiếm chuyên gia về CNTT,

NCS đã thực hiện tìm kiếm các mẩu tin đăng tuyển của các doanh nghiệp. Kênh để thu

thập dữ liệu được hướng đến chính là những trang web tìm việc hàng đầu trong ngành CNTT. Vì thế, NCS đã sử dụng từ khoá “it job” để lựa chọn những trang web hàng đầu

về tìm việc ngành CNTT tại Việt Nam, sau đó chọn ba trang web trong top3 Google

search, và thu về 100 mẩu tin tuyển dụng. Kết quả cụ thể được thể hiện trong Bảng 4.5 dưới đây.

Bảng 4.5. Thống kê kết quả tìm kiếm tuyển dụng chuyên gia CNTT

Trang web tìm kiếm Từ khoá Số lượng tin Số lượng doanh nghiệp

tuyển dụng đăng tin

https://www.itjobs.com.vn - Chuyên gia 100 - Các doanh nghiệp trong

ngành CNTT/ Viễn https://itviec.com - Chuyên viên thông/ TMĐT: 59 DN cao cấp https://topdev.vn - Doanh nghiệp ngành - Expert ngân hàng: 10 DN - Manager - Doanh nghiệp lĩnh vực - Senior khác: 8 DN

- Leader

Nguồn: Tác giả tổng hợp

Tổng hợp tất cả các mẩu tin tuyển dụng, kết quả thu về cho thấy rằng, những tiêu chí mà các doanh nghiệp thường đưa ra cho các ứng viên bao gồm:

1) Bằng cấp: Tốt nghiệp đại học trở lên chuyên ngành liên quan đến CNTT

Chứng chỉ: Của một số tổ chức uy tín tuỳ theo yêu cầu công việc

2) Kinh nghiệm: 3 năm - 15 năm (trong lĩnh vực mà công việc yêu cầu)

3) Kiến thức:

130

 Chuyên môn: Có hiểu biết chuyên sâu về CNTT và các vấn đề liên quan trực tiếp

đến công việc mà DN đang tuyển dụng.

 Chung: Có hiểu biết về hoạt động CNTT trong ngành/lĩnh vực hoạt động của DN

 Năng lực hành vi/Thái độ

 Kỹ năng giao tiếp, khả năng sáng tạo, làm việc nhóm

 Năng lực quản lý/lãnh đạo

 Quản lý rủi ro

 Khả năng chịu áp lực trong công việc

4) Kỹ năng/khả năng:

5) Ngoại ngữ:

 Đọc, viết, giao tiếp tốt bằng tiếng Anh (hoặc một số ngoại ngữ khác tuỳ vào yêu

cầu cụ thể)

6) Độ tuổi (tuỳ chọn): Thường không có yêu cầu cụ thể.

4.1.2.2. Lựa chọn vị trí tuyển dụng cụ thể làm tình huống nghiên cứu

NCS lựa chọn một mẩu tin tìm kiếm chuyên gia cho vị trí kỹ sư phần mềm (Java)

của một doanh nghiệp trong lĩnh vực công nghệ thông tin đại diện làm yêu cầu đầu vào.

Tiếp theo đó, thực hiện thu thập thông tin ứng viên trên LinkedIn, với từ khoá tìm kiếm

“Senior Java Software Engineer” trong mục “People”, từ đó chọn ra 150 ứng viên có hồ

sơ gần nhất với yêu cầu tuyển dụng của doanh nghiệp.

Xây dựng bộ dữ liệu thử nghiệm

Việc thu thập dữ liệu trên LinkedIn được thực hiện bằng cách lấy dữ liệu về thông

qua API, dữ liệu cào về sẽ được lưu vào file .csv. Từ file dữ liệu thô này, thông tin về

các ứng viên được tác giả sắp xếp và tổng hợp thành nhóm các tiêu chí như Bảng 4.6. Việc phân nhóm này là dựa vào những thông tin mà các ứng viên đã công bố trong hồ sơ của mình. Còn các tiêu chí được lựa chọn là dựa vào nhóm những tiêu chí mà DN thường đưa ra mà NCS đã tổng hợp được trong bước trên.

Bảng 4.6. Các trường thông tin về chuyên môn của Chuyên gia

STT

Thuộc tính

Mô tả chi tiết

1

id

Id của chuyên gia

2

avatar

Ảnh đại diện

131

STT

Thuộc tính

Mô tả chi tiết

Có ảnh: 1

Không có ảnh: 0

Thông tin địa chỉ

address

Hà Nội: 1

3

Thành phố Hồ Chí Minh: 2

Khác: 0

4

summary_info

Thông tin giới thiệu

5

current_company

Thông tin về công ty hiện tại

current_company_position

Vị trí ở công ty hiện tại

Không có thông tin: 0

6

Senior Software Engineer: 1

Senior Java Software Engineer: 2

7

number_of_organization

Tổng số công ty đã từng làm việc

8

years_work_at_organization1

Tổng số năm làm việc ở công ty cũ thứ nhất

9

years_work_at_organization2

Tổng số năm làm việc ở công ty cũ thứ 2

10

years_work_at_organization3

Tổng số năm làm việc ở công ty cũ thứ 3

11

years_work_at_organization4

Tổng số năm làm việc ở công ty cũ thứ 4

12

years_work_at_organization5

Tổng số năm làm việc ở công ty cũ thứ 5

13

years_of_experience

Tổng số năm kinh nghiệm

14 College_Diploma_degree

Trình độ cao đẳng/trung cấp/học nghề

15 Engineer_Bachelor degree

Trình độ cử nhân/kỹ sư

16 Master_degree

Trình độ thạc sĩ

17

education_fos

Chuyên ngành học đại học

18

certificates

Tổng số chứng chỉ đạt được

Tổng số ngoại ngữ

19

num_languages

20

number_of_skills

Tổng số kỹ năng

revelance_skills

Kỹ năng liên quan đến yêu cầu tuyển dụng

21

- Không có/ không đạt theo yêu cầu: 0

- Có kỹ năng phù hợp yêu cầu: 1

132

STT

Thuộc tính

Mô tả chi tiết

22

endorsement_skill

Kỹ năng được xác nhận từ những người khác

23

projects

Tổng số dự án đã hoàn thành

24

followers

Tổng số người theo dõi

relevance_score

25

Điểm đánh giá của chuyên gia là con người. Tiêu chí này sẽ được sử dụng để gán nhãn cho tập dữ liệu.

Nguồn: Tác giả tổng hợp từ kết quả thử nghiệm

Do mục đích chính của việc xếp hạng là tính điểm của các ứng viên, từ đó đề

xuất danh sách xếp hạng, vì thế tác giả lựa chọn thuật toán Hồi quy trong phương pháp

học có giám sát với nhãn là một giá trị thực cụ thể. Nhãn sẽ được gán từ điểm trung bình

của bốn chuyên gia CNTT (được tác giả mời để cho điểm các chuyên gia dựa theo yêu

cầu tuyển dụng của doanh nghiệp) đánh giá hồ sơ của 150 chuyên gia ứng viên.

Bộ dữ liệu xây dựng sẽ chia làm hai bộ dữ liệu trước và sau. Bộ dữ liệu (1) gồm 25

trường thông tin như trên Bảng 4.6. Sau đó bộ dữ liệu này sẽ được so sánh với dữ liệu từ Cơ sở tri thức về chuyên gia để làm giàu thêm thông tin, và do đó sẽ bổ sung thêm hai thuộc

tính được trích xuất từ cơ sở tri thức. Từ đó xây dựng nên Bộ dữ liệu (2).

• Độ nổi tiếng của trường đại học (nơi ứng viên học tập).

• Độ nổi tiếng của doanh nghiệp (nơi ứng viên đã/đang làm việc).

Thông qua tên trường đại học nơi ứng viên học tập, và tên doanh nghiệp hiện tại nơi ứng

viên làm việc, so sánh với bảng xếp hạng độ nổi tiếng của các tổ chức này trong cơ sở

tri thức chuyên gia để gán các giá trị cho hai thuộc tính trên. Bộ dữ liệu (2) sẽ gồm 25

thuộc tính trên, và mở rộng thêm hai thuộc tính: top_university và top_company. Tổng

số thuộc tính trong bộ dữ liệu hai là 27.

Thuật toán xếp hạng

Hai bộ dữ liệu được xây dựng sẽ đều chia làm hai tập chính: Training (80%) và Testing (20%) từ bộ dữ liệu gốc. Thực hiện thử chạy dữ liệu với thuật toán boosting Learning to rank như XGBoost, từ đó có những đánh giá xem thuật toán có đem lại kết quả tốt cho việc xếp hạng tự động chuyên gia hay không. Việc lựa chọn thuật toán này

để thử nghiệm là do: Ý tưởng cơ bản là Boosting là tạo ra một loạt các mô hình yếu, học bổ sung lẫn nhau. Có nghĩa là các mô hình sau sẽ cố gắng học để hạn chế lỗi lầm của các mô hình trước. Điều này nếu áp dụng vào xếp hạng chuyên gia sẽ rất phù hợp, vì nếu danh sách chuyên gia đưa ra lần đầu mà chưa tốt, thì mô hình mới được thêm vào sẽ học và tạo ra kết quả tốt hơn. Boosting tiến hành đánh trọng số cho các mô hình mới

133

được thêm vào dựa trên các cách tối ưu khác nhau. Kết quả đầu ra là danh sách gợi ý

các chuyên gia cho vị trí mà DN đang tìm, sẽ giúp doanh nghiệp tiết kiệm thời gian

trong việc tìm kiếm và lựa chọn những người phù hợp nhất ở giai đoạn đầu, trước khi thực hiện gặp gỡ trực tiếp.

4.1.2.3. Kết quả thử nghiệm

Xác định các tiêu chí ảnh hưởng đến kết quả xếp hạng

Theo kết quả chạy thuật toán xếp hạng chuyên gia (chi tiết ở Phụ lục 5), một số

tiêu chí được đánh trọng số cao trong quá trình xếp hạng đã được đề xuất.

- Tổng số ngoại ngữ

- Tổng số công ty đã làm việc

- Tổng số kỹ năng

- Số năm làm việc ở công ty cũ gần nhất (công ty 2)

- Số năm làm việc ở công ty hiện tại (công ty 1)

- Số dự án tham gia

- Bằng đại học

- Địa chỉ

- Bằng cao học

- Kỹ năng được xác nhận

Với Bộ dữ liệu (1), top 10 các tiêu chí ảnh hưởng đến kết quả xếp hạng bao gồm:

- Tổng số ngoại ngữ

- Tổng số công ty đã làm việc

- Độ uy tín của công ty làm việc

- Tổng số kỹ năng

- Số năm làm việc ở công ty cũ gần nhất (công ty 2)

- Số dự án tham gia

- Công ty hiện tại

- Độ uy tín của trường học

Với Bộ dữ liệu (2), top 10 các tiêu chí ảnh hưởng đến kết quả xếp hạng bao gồm:

134

- Thông tin giới thiệu

- Số năm làm việc ở công ty hiện tại (công ty 1)

Có thể nhận thấy, đã có sự thay đổi về những yếu tố có ảnh hưởng đến kết quả xếp hạng chuyên gia. Trong đó, hai tiêu chí được thêm vào là: Độ uy tín của công ty làm

việc và Độ uy tín của trường đại học đã có tác động rõ rệt đến kết quả xếp hạng. Qua đó, có thể khẳng định rằng, thông tin bổ sung từ Cơ sở tri thức chuyên gia đã làm tăng

giá trị của bộ dữ liệu trong quá trình xếp hạng. Nếu cơ sở tri thức càng đầy đủ thì càng

làm giàu cho dữ liệu đầu vào và kết quả tìm kiếm cũng như xếp hạng sẽ càng tốt hơn.

Kết quả đánh giá mô hình xếp hạng

Việc đánh giá mô hình được thực hiện với ba độ đo: MAE, MSE, R2. Lý do sử dụng những thang đo này là do bản chất của mô hình xếp hạng chính là một dạng của

mô hình hồi quy, với các tiêu chí xếp hạng là biến độc lập, và điểm xếp hạng là biến phụ

thuộc. Và ba độ đo này phù hợp để đánh giá độ chính xác và hiệu suất của mô hình.

(1) Mean Squared Error (MSE): MSE đo lường giá trị trung bình của bình phương

các sai số giữa giá trị dự đoán và giá trị thực tế. Giá trị MSE càng thấp thì mô hình dự đoán

càng tốt. Công thức 4.6 thể hiện các thính của độ đo này.

(4.6)

(2) Mean Absolute Error (MAE): MAE đo lường giá trị trung bình của các sai số

tuyệt đối giữa giá trị dự đoán và giá trị thực tế. Tuy nhiên, MAE đo khoảng cách tuyệt đối

thay vì khoảng cách bình phương. Giá trị MAE càng thấp thì mô hình dự đoán càng tốt.

Cách tính giá trị MAE được thể hiện qua Công thức 4.7.

(4.7)

(3) R2 Score: R² Score đo lường mức độ mà các biến độc lập giải thích được biến phụ thuộc trong mô hình. Nó cung cấp một thước đo về độ chính xác tổng thể của mô hình, cho biết tỷ lệ phương sai của giá trị thực tế được giải thích bởi giá trị dự đoán.

Giá trị R2 càng gần 1 thì mô hình càng tốt. Giá trị này được tính bằng Công thức 4.8.

(4.8)

 𝑦𝑖 là giá trị thực tế,

Trong đó:

135

 𝑦̂𝑖 là giá trị dự đoán,

 𝑛 là số lượng mẫu, và

 𝑦̅ là giá trị trung bình của 𝑦𝑖.

Các độ đo MAE, MSE và R² Score cung cấp các góc nhìn khác nhau về hiệu suất

của mô hình xếp hạng chuyên gia. MAE cho thấy độ lệch trung bình, MSE nhấn mạnh các lỗi lớn và R² Score đánh giá mức độ giải thích của mô hình.

Kết quả đánh giá mô hình xếp hạng với hai bộ dữ liệu được mô tả trong Bảng 4.7 dưới

đây.

Bảng 4.7. Đánh giá mô hình xếp hạng

Bộ dữ liệu Bộ dữ liệu 1 Bộ dữ liệu 2

Độ đo

MSE 0,021 0,018

MAE 0,109 0,099

R2 0,624 0,676

Nguồn: Tác giả tổng hợp từ kết quả thử nghiệm

Có thể thấy, mặc dù không nhiều nhưng đã có sự thay đổi trong kết quả đánh giá

mô hình với hai bộ dữ liệu. Bộ dữ liệu 2 có chỉ số MSE và MAE đều giảm so với Bộ dữ liệu 1, và chỉ số R2 đã tăng từ 0.62 trong Bộ dữ liệu 1 lên 0.67 trong Bộ dữ liệu 2. Điều này chứng tỏ việc bổ sung thông tin từ cơ sở tri thức đã đem lại mô hình xếp hạng tốt

hơn. Vì thế, nếu xây dựng bộ cơ sở tri thức đầy đủ và cập nhật sẽ giúp hệ thống tìm kiếm

chuyên gia hoạt động hiệu quả hơn, đáp ứng được nhu cầu và đem lại trải nghiệm cho người dùng tốt hơn.

4.2. Kết quả xây dựng hệ thống thử nghiệm

Bên cạnh việc thử nghiệm một số thuật toán trong hệ thống tìm kiếm chuyên gia, NCS cũng đã thử nghiệm xây dựng một hệ thống trên thực tế để kiểm nghiệm mô hình

kiến trúc đề xuất. Hệ thống thử nghiệm có tên là ESSME (Expert Search for Small and Medium Enterprise).

Hệ thống được cài đặt trên hai ngôn ngữ là tiếng Anh và tiếng Việt, phù hợp

nhiều đối tượng người dùng khác nhau.

136

4.2.1. Công nghệ, thư viện sử dụng

Hệ thống được xây dựng trên nền tảng công nghệ hiện đại, với các công cụ và thư viện tối ưu cho cả frontend lẫn backend. Từ giao diện người dùng, xác thực bảo mật,

thu thập và quản lý dữ liệu đến xử lý thông tin thông minh và tương tác qua API, hệ

thống đảm bảo mang lại hiệu suất cao, tính bảo mật và trải nghiệm người dùng tốt.

Giao diện người dùng của hệ thống được xây dựng dựa trên Vue.js, một framework JavaScript hiện đại, kết hợp với Tailwind CSS để tạo ra một giao diện tương

tác, thân thiện và sáng tạo. Vue.js giúp tối ưu hóa trải nghiệm người dùng nhờ vào khả

năng linh hoạt và mạnh mẽ trong việc phát triển ứng dụng một trang (SPA - Single Page

Application), trong khi Tailwind CSS cung cấp một hệ thống lớp tiện ích sẵn có, giúp xây dựng giao diện nhanh chóng và hiệu quả, đồng thời đảm bảo tính tùy chỉnh cao.

Bên cạnh đó, để đảm bảo tính bảo mật và mang lại trải nghiệm đăng nhập dễ dàng

cho người dùng, hệ thống tích hợp Google Firebase OAuth cho quy trình xác thực người dùng. Giải pháp này cho phép người dùng đăng nhập an toàn thông qua tài khoản

Google, đồng thời đảm bảo quá trình truy cập hệ thống được diễn ra mượt mà và bảo

mật cao.

Quá trình thu thập dữ liệu từ các nguồn khác nhau, hệ thống sử dụng kết hợp hai

công cụ là Scrapy và Beautiful Soup. Scrapy được sử dụng để thực hiện web crawling,

thu thập dữ liệu từ nhiều trang web một cách tự động, còn Beautiful Soup hỗ trợ phân

tích và trích xuất dữ liệu có cấu trúc từ HTML hoặc XML. Sự kết hợp này đảm bảo khả

năng thu thập và làm sạch dữ liệu một cách hiệu quả, giúp hệ thống có được các thông

tin cập nhật liên tục và đáng tin cậy.

Để xây dựng phần backend, hệ thống sử dụng Java Spring Boot, một framework

phát triển ứng dụng Java nổi tiếng với khả năng giảm bớt sự phức tạp trong quá trình

phát triển và đảm bảo khả năng mở rộng tốt. Spring Boot cung cấp các giải pháp tích

hợp sẵn cho phát triển ứng dụng doanh nghiệp, giúp hệ thống có thể xử lý nhanh chóng và hiệu quả các yêu cầu từ phía người dùng.

Cùng với đó, hệ thống sử dụng ứng dụng MongoDB và Elasticsearch để quản lý và lưu trữ dữ liệu. MongoDB được dùng cho các dữ liệu phi cấu trúc, nhờ vào tính linh hoạt và khả năng mở rộng cao của nó. Elasticsearch hỗ trợ tối ưu hóa việc tìm kiếm và

truy vấn dữ liệu, đảm bảo quá trình truy xuất thông tin diễn ra nhanh chóng. Sự kết hợp giữa hai cơ sở dữ liệu này cung cấp một nền tảng lưu trữ hiệu quả, giúp tối ưu hóa việc quản lý và truy xuất dữ liệu.

137

Thêm nữa, hệ thống áp dụng các thuật toán phân loại và phân tích dữ liệu thông

minh để hiển thị danh sách chuyên gia phù hợp với nhu cầu của người dùng. Các thuật

toán này giúp cải thiện khả năng tìm kiếm và cung cấp kết quả chính xác hơn, đồng thời đảm bảo chất lượng và tính đáng tin cậy của thông tin hiển thị. Nhờ đó, người dùng có

thể tin tưởng vào kết quả tìm kiếm và thông tin về các chuyên gia được đề xuất.

Cuối cùng, hệ thống cung cấp một giao diện lập trình ứng dụng API đa năng,

giúp tạo môi trường trao đổi thông tin thuận tiện và linh hoạt. API này không chỉ giúp

hệ thống tương tác mượt mà với các ứng dụng và dịch vụ khác mà còn đảm bảo trải

nghiệm tương tác toàn diện cho người dùng. API đóng vai trò là cầu nối giữa hệ thống và các ứng dụng bên ngoài, hỗ trợ việc chia sẻ và tích hợp dữ liệu một cách dễ dàng và

an toàn.

4.2.2. Giao diện hệ thống

NCS đã tiến hành cài đặt thử nghiệm hệ thống trên nền web, với hai ngôn ngữ sử

dụng là tiếng Anh và tiếng Việt. Những chức năng trong hệ thống bao gồm:

- Tìm kiếm chuyên gia (Theo tên chuyên gia, lĩnh vực và địa điểm)

- Thống kê danh sách chuyên gia theo lĩnh vực

- Xem thông tin chuyên gia

- Xem danh sách chuyên gia hàng đầu

- Cập nhật thông tin chuyên gia

- Hỏi đáp chuyên gia

- Đặt hàng chuyên gia

- Bản đồ chuyên gia

- Tin tức, sự kiện

- Đăng nhập

Dưới đây là một số hình ảnh giao diện của hệ thống thử nghiệm mà NCS đã tiến hành xây dựng dự vào mô hình kiến trúc đề xuất ở Chương 3 và các chức năng cần có được trình bày ở Mục 2.4. (Một số giao diện các chức năng khác của hệ thống được

 Giao diện trang chủ với ngôn ngữ tiếng Việt

NCS để ở phần Phụ lục 4).

Khi vào hệ thống, người dùng có thể thực hiện chức năng tìm kiếm theo tên chuyên gia, theo lĩnh vực hoặc theo địa điểm. Ngoài ra, có thể xem danh sách chuyên

138

gia đã được sắp xếp theo một số lĩnh vực như: Công nghệ thông tin, kinh tế và kinh

doanh, nông nghiệp, y học v.v.

Hình 4.4. Giao diện trang chủ (phần 1)

 Kết quả tìm kiếm chuyên gia trong lĩnh vực Công nghệ thông tin

Nguồn: Kết quả thử nghiệm do tác giả thực hiện

Với từ khóa tìm kiếm “công nghệ thông tin”, hệ thống trả về kết quả 481 chuyên

gia, như trong Hình 4.5 dưới đây.

Hình 4.5. Kết quả trả về khi tìm kiếm chuyên gia trong lĩnh vực CNTT

 Thông tin chi tiết của từng chuyên gia

Nguồn: Kết quả thử nghiệm do tác giả thực hiện

Khi bấm vào tên chuyên gia, hệ thống sẽ điều hướng đến trang thông tin chuyên gia.

139

Hình 4.6. Kết quả trả về khi xem thông tin một chuyên gia

 Thống kê chuyên gia theo từng lĩnh vực

Nguồn: Kết quả thử nghiệm do tác giả thực hiện

Nếu muốn xem danh sách chuyên gia theo lĩnh vực, thực hiện chọn lĩnh vực tại trang chủ. Hình 4.7 là kết quả trả về danh sách chuyên gia trong lĩnh vực “Kinh tế và kinh doanh”

Hình 4.7. Tìm kiếm chuyên gia theo từng lĩnh vực

Nguồn: Kết quả thử nghiệm do tác giả thực hiện

4.3. Đánh giá hệ thống thử nghiệm

4.3.1. Phương pháp sử dụng đánh giá hệ thống

Để đánh giá kết quả hệ thống thử nghiệm, NCS đã tiến hành lập phiếu khảo sát với

mục đích khảo sát khả năng cung cấp thông tin của hệ thống và đánh giá các yếu tố có ảnh hưởng đến ý định chấp nhận hệ thống tìm kiếm chuyên gia của các DNNVV Việt Nam.

Cơ sở lý thuyết được sử dụng là mô hình chấp nhận và sử dụng công nghệ hợp nhất (UTAUT). Mô hình này được Venkatesh & cộng sự (2003) đề xuất dựa trên mô

140

hình chấp nhận công nghệ TAM (Davis, 1989), để nghiên cứu sự chấp nhận của người

dùng với một hệ thống thông tin mới. Mặc dù mô hình chấp nhận công nghệ TAM được

sử dụng rộng rãi để đánh giá ý định chấp nhận sử dụng công nghệ thông tin của người sử dụng. Tuy nhiên, TAM chỉ đề xuất hai yếu tố “cảm nhận tính hữu ích” và “cảm nhận

tính dễ sử dụng” có ảnh hưởng đến ý định.

Trong khi đó, mô hình mô hình chấp nhận và sử dụng công nghệ hợp nhất UTAUT

do Venkatesh & cộng sự (2003) đề xuất là sự mở rộng của mô hình TAM và một số mô

hình khác với ý tưởng rằng, các nghiên cứu sẽ không cần phải tổng hợp các ý tưởng từ

nhiều mô hình khác nhau. Mà chỉ cần áp dụng UTAUT để giải quyết nhiều vấn đề liên quan đến chấp nhận và sử dụng công nghệ. Ngoài hai yếu tố kế thừa từ TAM, mô hình UTAUT

còn đề xuất thêm hai yếu tố nữa là: Ảnh hưởng xã hội và Điều kiện hỗ trợ.

Bảng 4.8. So sánh giữa 2 mô hình TAM và UTAUT

TAM (Davis, 1989)

Tiêu chí

UTAUT (Venkatesh & cộng sự, 2003)

Tiền đề

Dựa trên lý thuyết hành vi hợp lý (TRA)

Tổng hợp từ tám mô hình lý thuyết khác nhau

- Cảm nhận tính hữu ích

- Kỳ vọng về hiệu quả

- Cảm nhận tính dễ sử dụng

- Kỳ vọng nỗ lực

Các yếu tố tác động đến ý định chấp nhận sử dụng hệ thống

- Ảnh hưởng xã hội

- Điều kiện thuận lợi

Mục tiêu

Dự đoán và giải thích hành vi chấp nhận công nghệ của người dùng

Cung cấp một khung lý thuyết tổng quát và toàn diện để dự đoán hành vi sử dụng công nghệ

Ứng dụng thực tiễn

- Dễ dàng áp dụng

- Toàn diện hơn

- Phù hợp với các nghiên cứu quy mô nhỏ hơn

- Phù hợp với nghiên cứu quy mô lớn hơn

Ưu điểm

Đơn giả, dễ hiểu và dễ áp dụng

Tích hợp nhiều yếu tố hơn, khả năng dự đoán tốt hơn

Nhược điểm

Bỏ qua một số yếu tố ảnh hưởng khác

Phức tạp hơn, yêu cầu nhiều dữ liệu để phân tích

Nguồn: Tác giả tổng hợp

Nhận thấy mô hình UTAUT là phù hợp để đánh giá hành vi chấp nhận sử dụng

hệ thống tìm kiếm chuyên gia, NCS đã đề xuất việc áp dụng mô hình này để thực hiện

141

việc đánh giá hệ thống thử nghiệm. Mặc dù đây không phải là phương pháp mới, tuy

nhiên phương pháp đánh giá này chưa được áp dụng để đánh giá hành vi chấp nhận sử

dụng các hệ thống tìm kiếm chuyên gia trong các nghiên cứu trước đây (Theo kết quả tổng quan nghiên cứu về các phương pháp đánh giá mà NCS đã tổng hợp trong Bảng

1.3 ở Chương 1). Vì thế, đây cũng được coi là một sự bổ sung cho bộ các phương pháp để đánh giá trong lĩnh vực nghiên cứu về tìm kiếm chuyên gia.

Mô hình, giả thuyết và kết quả đánh giá sẽ được trình bày cụ thể trong các mục

tiếp theo.

4.3.2. Mô hình và giả thuyết

Trong mô hình này, có bốn biến độc lập gồm: Kỳ vọng về hiệu quả, kỳ vọng nỗ lực, ảnh hưởng xã hội và điều kiện thuận lợi. Biến phụ thuộc là biến: Chấp nhận sử dụng

hệ thống tìm kiếm chuyên gia.

Kỳ vọng về hiệu quả

Kỳ vọng nỗ lực Chấp nhận sử dụng

hệ thống tìm kiếm

chuyên gia

Ảnh hưởng xã hội

Điều kiện thuận lợi

Nguồn: Tác giả đề xuất dựa trên mô hình UTAUT

Hình 4.8. Mô hình nhân tố ảnh hưởng đến việc chấp nhận sử dụng hệ thống tìm kiếm chuyên gia

 Kỳ vọng nỗ lực ảnh hưởng đến chấp nhận sử dụng hệ thống tìm kiếm chuyên gia

Là mức độ mà người dùng cho rằng việc sử dụng một hệ thống cụ thể sẽ không

đòi hỏi nỗ lực nhiều. Hoặc được hiểu là mức độ dễ sử dụng của hệ thống. Một hệ thống

142

càng dễ sử dụng thì người dùng càng dễ chấp nhận và sử dụng hệ thống đó. Vì thế, giả

thuyết đặt ra là:

H1: Kỳ vọng nỗ lực (tính dễ sử dụng) có ảnh hưởng tích cực đến việc chấp nhận

sử dụng hệ thống tìm kiếm chuyên gia.

 Kỳ vọng hiệu quả ảnh hưởng đến việc chấp nhận sử dụng hệ thống tìm kiếm

chuyên gia

Là yếu tố chỉ mức độ mà một người tin rằng công nghệ sẽ cải thiện hiệu suất

công việc. Khi hệ thống tìm kiếm chuyên gia có thể giúp cho người dùng nâng cao

hiệu quả về nhu cầu tìm kiếm chuyên gia thì người dùng sẽ dễ chấp nhận và sử dụng hệ thống hơn.

H2: Kỳ vọng hiệu quả có ảnh hưởng tích cực đến việc chấp nhận sử dụng hệ

thống tìm kiếm chuyên gia.

 Ảnh hưởng xã hội tác động đến việc chấp nhận sử dụng hệ thống tìm kiếm

chuyên gia

Là mức độ mà một người tin rằng những người quan trọng đối với họ cho rằng họ nên sử dụng công nghệ mới. Những người quan trọng ở đây có thể là bạn bè, đồng

nghiệp, người quản lý, đối tác, v.v. có liên quan hoặc ảnh hưởng trong việc sử dụng hệ

thống của người dùng.

H3: Ảnh hưởng xã hội có tác động tích cực đến việc chấp nhận sử dụng hệ thống

tìm kiếm chuyên gia.

 Điều kiện thuận lợi ảnh hưởng đến việc chấp nhận sử dụng hệ thống tìm kiếm

chuyên gia

Là mức độ mà một người tin rằng có những tài nguyên và điều kiện hỗ trợ cần

thiết để sử dụng công nghệ. Ở đây có thể hiểu là niềm tin của người dùng về cơ sở hạ tầng kỹ thuật của tổ chức đủ điều kiện hỗ trợ cho việc sử dụng hệ thống. Khi có đủ điều kiện thuận lợi, người dùng có xu hướng dễ dàng chấp nhận và sử dụng hệ thống hơn.

H4: Điều kiện thuận lợi có ảnh hưởng tích cực đến việc chấp nhận sử dụng hệ

thống tìm kiếm chuyên gia.

4.3.3. Kết quả khảo sát

Để kiểm chứng bốn giả thuyết và mô hình để đánh giá việc chấp nhận sử dụng hệ thống tìm kiếm chuyên gia, NCS sẽ thực hiện việc khảo sát trên thực tế một số người dùng trong các DNNVV để xác định xem, những nhân tố nào có tác động đến hành vi

143

chấp nhận sử dụng hệ thống tìm kiếm chuyên gia. Bảng thang đo của từng nhân tố được NCS kế thừa và chỉnh sửa để phù hợp với mục tiêu của việc đánh giá hệ thống. (Chi tiết thang đo sử dụng trong bảng hỏi được trình bày tại Bảng 1, mục 4.2, phần Mở đầu).

Theo Hair & cộng sự (2013), để phân tích nhân tố khám phá EFA, số quan sát (số người được khảo sát) trên một biến phân tích nên lựa chọn là 5:1, có nghĩa là kích thước mẫu nên gấp năm lần tổng số biến quan sát (số các chỉ báo) của các thang đo.

Bên cạnh đó, đối với phân tích hồi quy tuyến tính bội, theo Tabachnick & Fidell (2012), kích thước mẫu cần thoả mãn công thức: n >= 8*m + 50 (trong đó, m là kích thước mẫu, m là số biến độc lập).

Theo thống kê từ bảng thang đo (Bảng 1), có tổng 19 biến quan sát trong các biến độc lập, và 4 biến quan sát của biến phụ thuộc, vì thế, kích thước mẫu phù hợp để đưa vào phân tích EFA (theo công thức của Hair & cộng sự (2013) ) là 5*19 và 5*4, tổng hợp lại thì số mẫu khoảng 95 là chấp nhận được.

Và, có 4 biến độc lập được đưa vào khảo sát, nên theo công thức của Tabachnick & Fidell (2012), kích thước mẫu để đưa vào chạy hồi quy tối thiểu là: 8*4+50 = 82 mẫu.

Vì thế, NCS đã thực hiện gửi phiếu khảo sát cho 182 người dùng trong 50 DNNVV tại Việt Nam theo phương pháp chọn mẫu thuận tiện và chọn mẫu quả bóng tuyết. Kết quả thu về 149 phiếu hợp lệ. Số phiếu này mặc dù không nhiều, nhưng thoả mãn điều kiện mà Hair & cộng sự (2013) và Tabachnick & Fidell (2012) đã đưa ra.

Dữ liệu sau khi thu thập về sẽ được làm sạch và đưa vào phần mềm SPSS phiên bản 26.0 để thực hiện xử lý. Các phương pháp xử lý dữ liệu bao gồm: thống kê mô tả, kiểm định độ tin cậy thang đo Cronbach’s Alpha, phân tích nhân tố khám phá EFA và phân tích hồi quy để kiểm định các giả thuyết.

4.3.3.1. Thống kê mẫu điều tra

Về chức vụ những người tham gia được chia làm ba nhóm chính: Quản lý cấp cao (31 người) chiếm tỉ lệ 20,8%, quản lý cấp trung (48 người) chiếm tỉ lệ 32,2%, nhân viên (70 người) chiếm tỉ lệ 47%. Như thế có thể thấy, có sự phân bố đầy đủ giữa 3 cấp độ tác nghiệp trong doanh nghiệp.

Các doanh nghiệp tham gia khảo sát khá đa dạng trong lĩnh vực hoạt động, trong đó có thể kể đến như CNTT, dịch vụ, xây dựng, sản xuất, logistic, tài chính, truyền thông, tư vấn, v.v. Tập trung nhiều nhất là các doanh nghiệp CNTT (21 DN) với tỉ lệ 42% ; Xây dựng (8 DN) với tỉ lệ 16%; Dịch vụ (8 DN) với tỉ lệ 16%; còn lại là các doanh nghiệp khác. Như vậy, có thể thấy mặc dù số lượng mẫu khảo sát không nhiều, nhưng vẫn mang tính đại diện cho nhiều lĩnh vực DN và nhiều đối tượng người dùng trong DN.

144

4.3.3.2. Phân tích kết quả khảo sát

 Các chức năng thường xuyên sử dụng

Ngoài hai chức năng chính là: Tìm kiếm chuyên gia và Xem thông tin chuyên gia

được người dùng sử dụng 100%. Các chức năng còn lại có tỉ lệ sử dụng như sau:

Bảng 4.9. Thống kê chức năng sử dụng trong hệ thống

Chức năng Số người sử dụng Phần trăm

Thống kê chuyên gia 34 22,8%

Bản đồ chuyên gia 34 22,8%

Hỏi đáp chuyên gia 29 19,5%

Tin tức, sự kiện về chuyên gia 28 18,8%

Đặt hàng chuyên gia 18 12,1%

Nguồn: Tác giả tổng hợp từ kết quả khảo sát

Giới thiệu chuyên gia 6 4%

Qua kết quả này có thể nhận thấy, các chức năng như đặt hàng chuyên gia hay

giới thiệu chuyên gia chưa được người dùng quan tâm và sử dụng nhiều. Điều này có

thể được lý giải nguyên nhân là do người dùng mới chỉ được thử nghiệm hệ thống trong

thời gian ngắn, vì thế họ chưa có đủ thời gian cũng như kiểm nghiệm thực sự nhu cầu

của mình.

 Đánh giá về khả năng cung cấp thông tin của hệ thống

Bên cạnh đó, khi đánh giá về khả năng cung cấp thông tin cũng như một số tiêu

chí đánh giá khác về hệ thống, kết quả thu được như Bảng 4.10.

Bảng 4.10. Đánh giá về khả năng cung cấp thông tin của hệ thống

Điểm thấp Điểm cao Tiêu chí Trung bình nhất nhất

Tính cập nhật thông tin 1 3 1,81

Độ chi tiết thông tin 1 3 2,00

Tốc độ phản hồi thông tin 1 3 2,21

Đánh giá tổng thể hệ thống 1 3 2,27

Độ phù hợp thông tin 1 3 2,33

Nguồn: Tác giả tổng hợp từ kết quả khảo sát

Tính ổn định của hệ thống 1 3 2,44

145

Thông qua bảng kết quả này, có thể nhận thấy, hai tiêu chí là tính ổn định của hệ

thống và độ phù hợp thông tin được đánh giá cao. Trong khi đó, các tiêu chí tính cập

nhật thông tin và độ chi tiết của thông tin còn chưa tốt. Nguyên nhân của điều này là do đây chỉ là hệ thống thử nghiệm nên tính cập nhật của thông tin chưa cao, ngoài ra do hệ

thống chỉ xác định thu thập dữ liệu ở mức cơ bản (với các dữ liệu thu thập tự động), và để thêm đường link để kết nối đến nguồn thông tin ban đầu của chuyên gia, nên việc hệ

thống bị đánh giá có độ chi tiết thông tin không cao là hoàn toàn phù hợp.

• Phân tích hành vi chấp nhận sử dụng hệ thống tìm kiếm chuyên gia cho

- Kiểm định độ tin cậy thang đo

DNNVV Việt Nam

Theo (Hair & cộng sự, 2010), độ tin cậy tổng hợp Cronbach’s alpha của từng

nhân tố đạt yêu cầu tin cậy nếu nằm trong khoảng từ nằm trong khoảng từ 0.7 đến 0.9. Theo kết quả phân tích trong Bảng 4.11, các nhân tố đều có chỉ số Cronbach’s alpha

nằm trong khoảng từ 0,765 đến 0,914 nên đạt yêu cầu về độ tin cậy. Ngoài ra, các biến

quan sát bên trong mỗi nhân tố đều có chỉ số Cronbach’s alpha nếu loại biến < chỉ số

Cronbach’s alpha tổng, và thang đo đạt yêu cầu khi có hệ số tương quan biến tổng >=

0.3 (Nunnally & Bernstein,1994). Vì thế không cần loại bất kỳ biến quan sát nào.

Bảng 4.11. Độ tin cậy thang đo

Nhân tố

Số biến quan sát Cronbach’s alpha tổng

Kỳ vọng hiệu quả

4

0,847

Kỳ vọng nỗ lực

4

0,765

Ảnh hưởng xã hội

3

0,886

Điều kiện thuận lợi

4

0,914

Chấp nhận sử dụng hệ thống

4

0,850

Nguồn: Tác giả tổng hợp từ kết quả chạy phần mềm SPSS

- Phân tích khám phá nhân tố EFA

Theo Hair & cộng sự (2010), các tiêu chuẩn cần đạt được khi phân tích nhân tố khám phá bao gồm: chỉ số KMO nằm trong khoảng từ 0,5 đến 1; hệ số tải nhân tố lớn hơn 0,3;

phương sai trích trên 50% và Eigenvalue trên 1. Kết quả phân tích nhân tố khám phá cho tất cả các biến độc lập với phép quay góc Varimax cho thấy Eigenvalue lớn hơn 1.0 với các

chỉ số như sau: kiểm định KMO và Bartlett có giá trị 0,852; giá trị Eigenvalue lớn hơn 1 và

giải thích khoảng 73,632% sự biến thiên của dữ liệu. Giá trị hội tụ nhân tố của các biến

146

quan sát đều lớn hơn 0,5. Do đó, tất cả các biến đều được giữ lại trong mô hình. Kết quả

được mô tả trong Bảng 4.12.

Bảng 4.12. Kết quả phân tích KMO và Bartlett's

Kaiser-Meyer-Olkin 0,852

Approx. Chi-square 1407,743

105 df Bartlett’s Test of Sphericity

Nguồn: Tác giả tổng hợp từ kết quả chạy phần mềm SPSS

0,000 Sig.

Bảng 4.13. Kết quả ma trận xoay nhân tố

Biến quan sát Nhân tố

2 3 4 1

DKTL4 0,860

DKTL1 0,854

DKTL2 0,845

DKTL3 0,831

KVHQ3 0,761

KVHQ4 0,749

KVHQ2 0,738

KVHQ1 0,730

AHXH3 0,873

AHXH2 0,803

AHXH1 0,738

KVNL3 0,752

KVNL2 0,744

KVNL1 0,687

Nguồn: Tác giả tổng hợp từ kết quả chạy phần mềm SPSS

KVNL4 0,606

Thông qua ma trận xoay nhân tố theo phép quay Varimax, có thể thấy các biến quan sát đều đạt yêu cầu về độ hội tụ và độ phân biệt, qua Bảng 4.13, có thể thấy 15 biến

147

quan sát tập trung thành bốn nhóm nhân tố đúng theo nhóm nhân tố ban đầu NCS đề

- Kết quả phân tích hồi quy

xuất. Tiến hành đặt biến đại diện cho bốn nhân tố và đưa vào phân tích hồi quy.

Bảng 4.14. Tổng kết mô hình

Mô hình R R2 R2 hiệu chỉnh Sai số chuẩn của ước lượng

1 0,830a 0,689 0,680 0,5011

Yếu tố ảnh hưởng: (hằng số), KVHQ, DKTL, KVNL, AHXH

Nguồn: Tác giả tổng hợp từ kết kết quả chạy phần mềm SPSS

Biến phụ thuộc: YDHV

Thông qua Bảng 4.14 chỉ ra kết quả tổng kết mô hình, có thể thấy hệ số R2 hiệu chỉnh là 0.68 > 0.5, kết quả này có thể coi là một mô hình tốt. Và các biến độc lập trong

mô hình giải thích được 68% sự biến thiên của biến phụ thuộc về hành vi chấp nhận sử

dụng hệ thống, còn lại là sai số và do các biến ngoài mô hình.

Bảng 4.15. Kết quả phân tích hồi quy các nhân tố ảnh hưởng đến chấp nhận

Nguồn: Tác giả tổng hợp từ kết quả chạy phần mềm SPSS

sử dụng

Từ kết quả phân tích hồi quy ở Bảng 4.15, giá trị sig kiểm định của các biến

AHXH (Ảnh hưởng xã hội) và KVHQ (Kỳ vọng hiệu quả) đều có sig > 0.05, nên hai

biến này không có ý nghĩa thống kê ở mức sai số 5%. Chỉ có 2 biến DKTL (Điều kiện

thuận lợi) và KVNL (Kỳ vọng nỗ lực) có sig <0.05, có ý nghĩa thống kê.

Phương trình hồi quy chuẩn hoá: YDHV = 0.484*DKTL + 0.474*KVNL + ε

148

Kết quả kiểm định giả thuyết được mô tả ở Bảng 4.16.

Bảng 4.16. Kết quả kiểm định giả thuyết

Giả thuyết Quan hệ Kết quả

Kỳ vọng nỗ lực có ảnh hưởng tích cực đến việc chấp H1 Chấp nhận nhận sử dụng hệ thống tìm kiếm chuyên gia.

Kỳ vọng hiệu quả có ảnh hưởng tích cực đến việc H2 Bác bỏ chấp nhận sử dụng hệ thống tìm kiếm chuyên gia.

Ảnh hưởng xã hội có ảnh hưởng tích cực đến việc H3 Bác bỏ chấp nhận sử dụng hệ thống tìm kiếm chuyên gia.

Nguồn: Tác giả tổng hợp từ kết quả chạy phần mềm SPSS

Điều kiện thuận lợi có ảnh hưởng tích cực đến việc chấp nhận sử dụng hệ thống tìm kiếm chuyên gia. H4 Chấp nhận

Có thể kết luận, hai nhân tố ảnh hưởng nhiều nhất đến hành vi chấp nhận sử dụng

hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam:

• “Điều kiện thuận lợi” (cơ sở hạ tầng của DN đủ điều kiện hỗ trợ cho cài đặt và

sử dụng hệ thống).

• “Kỳ vọng nỗ lực” (nhận thức của người dùng về tính dễ sử dụng của hệ thống).

Kết quả này là khá phù hợp với bối cảnh thực tế vì hệ thống chưa đưa vào sử dụng lâu dài nên người dùng không thể đánh giá được hiệu quả sử dụng cũng như sự

ảnh hưởng từ những người xung quanh đến ý định chấp nhận sử dụng hệ thống của họ.

Kết quả đánh giá này là cơ sở để các đơn vị muốn triển khai hệ thống tìm kiếm chuyên gia, cần quan tâm nhiều hơn đến việc chuẩn bị các điều kiện cơ sở hạ tầng phục vụ người dùng trong doanh nghiệp thật tốt, cũng như hướng dẫn người dùng về cách sử dụng hệ thống để có thể giúp người dùng dễ dàng chấp nhận việc sử dụng hệ thống này.

Mặc dù phương pháp đánh giá hành vi chấp nhận sử dụng hệ thống bằng mô hình UTAUT không phải là phương pháp mới, tuy nhiên việc sử dụng phương pháp đánh giá

này trong quá trình đánh giá hệ thống tìm kiếm chuyên gia lại chưa được đề cập trong các nghiên cứu trước. Và kết quả thử nghiệm khi đánh giá bằng mô hình này đã chứng tỏ mức độ phù hợp của phương pháp đánh giá, đồng thời cũng đóng góp thêm vào ý nghĩa thực tiễn của luận án, khi các đơn vị xây dựng và triển khai hệ thống hiểu được

149

những mong muốn của người dùng, và đưa ra các phương án để hỗ trợ người dùng một

cách hiệu quả nhất.

4.4. Một số khuyến nghị triển khai hệ thống

Dựa vào kết quả xây dựng thử nghiệm và đánh giá hệ thống tìm kiếm chuyên gia,

có thể nhận thấy, có khá nhiều yêu cầu đặt ra về mặt kỹ thuật, công nghệ, tính pháp lý,

v.v. đối với việc xây dựng hệ thống này. Bên cạnh đó, việc triển khai hệ thống tìm kiếm chuyên gia sẽ tốn khá nhiều thời gian, công sức và cần có sự tham gia hỗ trợ từ nhiều

bên liên quan. Vì thế, nếu muốn hệ thống được xây dựng và triển khai hiệu quả, NCS sẽ

đề xuất các giai đoạn ở quy mô nhỏ và giai đoạn phát triển hệ thống theo hướng bền

vững, phù hợp với yêu cầu thực tế cho đơn vị triển khai và người dùng là các DNNVV tại Việt Nam.

4.4.1. Triển khai hệ thống ở quy mô nhỏ và từng bước mở rộng

Khi thực hiện nghiên cứu tài liệu và phân tích thực trạng nhu cầu tìm kiếm chuyên

gia của một số DNNVV tại Việt Nam, NCS nhận thấy rằng, mỗi DN trong các lĩnh vực,

ngành nghề và khu vực khác nhau sẽ có nhu cầu tìm kiếm chuyên gia cũng như khả năng

tiếp cận chuyên gia là khác nhau. Do đó, không thể ngay lập xây dựng được một hệ

thống tìm kiếm chuyên gia ở quy mô lớn, đáp ứng đầy đủ yêu cầu của DN. Chính vì

vậy, giai đoạn đầu nên triển khai hệ thống ở quy mô nhỏ để có thể thực hiện triển khai

hệ thống một cách phù hợp nhất, đồng thời đảm bảo được tính khả thi. Giai đoạn này

được chia làm hai giai đoạn nhỏ.

 Lựa chọn địa phương và ngành nghề: Đầu tiên, hệ thống sẽ được triển khai tại một số địa phương có DNNVV phát triển mạnh như Hà Nội, thành phố Hồ Chí

a. Giai đoạn thử nghiệm

Minh, Đà Nẵng hoặc các khu vực tập trung các ngành công nghiệp cần nhiều

 Triển khai thử nghiệm với số lượng nhỏ: Hệ thống sẽ được thử nghiệm với một

chuyên gia như công nghệ, tài chính, marketing và sản xuất. Các ngành nghề được lựa chọn sẽ là những lĩnh vực mà DNNVV trong khu vực gặp khó khăn trong việc tìm kiếm chuyên gia, ví dụ như ngành công nghệ thông tin với nhu cầu tìm chuyên gia về chuyển đổi số hoặc trí tuệ nhân tạo (AI).

số lượng DNNVV hạn chế, khoảng từ 10-20 doanh nghiệp, cùng với một nhóm chuyên gia ban đầu. Mục tiêu là đánh giá hiệu quả của hệ thống qua các tính năng cơ bản như tìm kiếm chuyên gia theo lĩnh vực, địa phương và khả năng liên hệ trực tiếp. Trong giai đoạn này, dữ liệu phản hồi từ DNNVV, chuyên gia và các

150

bên liên quan sẽ được thu thập để cải thiện các tính năng và giao diện của hệ

thống.

 Mở rộng các chức năng và dữ liệu: Sau khi thử nghiệm thành công, hệ thống sẽ

b. Giai đoạn mở rộng

được mở rộng để hỗ trợ các tính năng nâng cao, bao gồm đánh giá chuyên gia, hỗ trợ trực tuyến, tư vấn và các công cụ phân tích dựa trên AI (như gợi ý chuyên

gia và phân tích nhu cầu). Cơ sở dữ liệu về chuyên gia sẽ được mở rộng, bao gồm

nhiều lĩnh vực chuyên môn và địa phương, đồng thời tích hợp với các cơ sở dữ

 Khai thác các khu vực và ngành nghề khác nhau: Sau khi triển khai thành công

liệu của chính phủ và các tổ chức hỗ trợ doanh nghiệp.

tại các thành phố lớn, hệ thống sẽ được mở rộng ra các tỉnh thành khác, đặc biệt

là các vùng có tiềm năng phát triển mạnh trong các ngành công nghiệp sáng tạo, công nghệ và sản xuất. Đặc biệt, cần chú trọng đến các khu vực có nhu cầu sử

 Hợp tác với các tổ chức hỗ trợ DNNVV: Để thúc đẩy việc sử dụng hệ thống, đơn

dụng chuyên gia nhưng chưa tiếp cận được dịch vụ này.

vị triển khai cũng cần thiết lập quan hệ đối tác với các tổ chức hỗ trợ doanh nghiệp

như các trung tâm khởi nghiệp, hiệp hội ngành nghề, trường đại học và viện

nghiên cứu. Các tổ chức này sẽ giúp mở rộng mạng lưới chuyên gia và thúc đẩy

việc ứng dụng hệ thống trong cộng đồng DNNVV.

Sau giai đoạn này, hệ thống tìm kiếm chuyên gia đã có thể đáp ứng được nhu cầu của

nhiều DN ở nhiều lĩnh vực và vị trí địa lý khác nhau. Tuy nhiên, hệ thống cần được duy

trì và phát triển bền vững, có thể nâng cấp trong tương lai.

4.4.2. Phát triển hệ thống theo hướng bền vững

 Cập nhật cơ sở dữ liệu chuyên gia tự động: Đây là một trong những hạn chế mà hệ thống thử nghiệm trong luận án chưa thực hiện được. Để đảm bảo hệ thống hoạt động hiệu quả và cung cấp thông tin chính xác, việc xây dựng cơ chế tự động cập nhật dữ liệu chuyên gia là rất quan trọng. Hệ thống sẽ tự động xác thực thông tin chuyên môn, chứng chỉ, kinh nghiệm và lịch sử công việc của chuyên

a. Duy trì và phát triển hệ thống theo hướng bền vững

gia. Việc sử dụng công nghệ blockchain sẽ giúp đảm bảo tính xác thực và minh bạch trong quá trình này. Cơ sở dữ liệu sẽ được cập nhật thường xuyên với thông tin mới nhất từ các nguồn đáng tin cậy như các tổ chức nghề nghiệp, trường đại học và các cơ quan chính phủ.

151

 Chế độ bảo trì và hỗ trợ kỹ thuật: Để duy trì hoạt động ổn định của hệ thống, cần

xây dựng một đội ngũ bảo trì và hỗ trợ kỹ thuật chuyên trách. Đội ngũ này sẽ

chịu trách nhiệm về việc sửa chữa lỗi, cập nhật hệ thống và đảm bảo các tính năng hoạt động liên tục và ổn định. Đồng thời, cung cấp dịch vụ hỗ trợ người

dùng 24/7 qua nhiều kênh như chat, email và hotline sẽ giúp giải quyết các vấn đề kỹ thuật mà DNNVV gặp phải trong quá trình sử dụng hệ thống.

 Kiến trúc hệ thống mở và linh hoạt: Theo kiến trúc đề xuất của hệ thống, các

b. Đảm bảo khả năng mở rộng và nâng cấp hệ thống

chức năng đã được chia nhỏ thành các dịch vụ riêng, vì thế sẽ cho phép các thành phần của hệ thống có thể mở rộng và nâng cấp một cách độc lập mà không ảnh

hưởng đến toàn bộ hệ thống. Các dịch vụ như cơ sở dữ liệu, tìm kiếm chuyên gia

và giao diện người dùng có thể được cập nhật hoặc thay đổi mà không cần phải

thay đổi cấu trúc hệ thống toàn diện. Điều này sẽ giúp hệ thống có khả năng linh

 Sử dụng công nghệ đám mây và DevOps: Việc triển khai hệ thống trên nền tảng

hoạt thích ứng với các yêu cầu mới mà không gây gián đoạn hoạt động.

đám mây (AWS, Google Cloud, Azure) sẽ mang lại lợi ích về khả năng mở rộng

linh hoạt và tiết kiệm chi phí vận hành. Ngoài ra, việc áp dụng phương pháp

DevOps sẽ giúp tự động hóa quy trình triển khai, bảo trì và cập nhật hệ thống, từ

 Định kỳ nâng cấp và cải tiến hệ thống: Hệ thống sẽ được nâng cấp định kỳ về cả

đó nâng cao hiệu quả và giảm thiểu các sai sót trong quá trình vận hành.

phần mềm và phần cứng để đáp ứng sự phát triển và nhu cầu ngày càng tăng của

người dùng. Cập nhật các tính năng mới, tối ưu hóa hiệu suất và mở rộng khả

năng lưu trữ sẽ đảm bảo rằng hệ thống luôn sẵn sàng đáp ứng yêu cầu và sự phát triển của dữ liệu.

4.4.3. Đề xuất các kế hoạch hỗ trợ và đào tạo cho DNNVV

Theo kết quả đánh giá hành vi chấp nhận sử dụng hệ thống tìm kiếm chuyên gia của các DNNVV tại Việt Nam, một trong hai nhân tố quan trọng nhất, ảnh hưởng đến người dùng là nhân tố “Kỳ vọng nỗ lực”, hay được hiểu là nhận thức của người dùng về tính dễ sử dụng của hệ thống. Điều này chứng tỏ rằng, nếu người dùng hiểu về hệ thống và biết cách sử dụng hệ thống một cách thuần thục, họ sẽ sẵn sàng chấp nhận sử dụng hệ thống này. Chính vì thế, cần có kế hoạch rõ ràng trong việc hỗ trợ và đào tạo cho DNNVV khi sử dụng hệ thống tìm kiếm chuyên gia.

 Hướng dẫn sử dụng trực tuyến: Hệ thống sẽ cung cấp các tài liệu hướng dẫn sử

a. Chương trình đào tạo và hướng dẫn sử dụng hệ thống

dụng chi tiết về cách thức đăng ký chuyên gia, tìm kiếm chuyên gia và sử dụng

152

các tính năng nâng cao của hệ thống. Tài liệu này sẽ bao gồm video, bài viết

hướng dẫn hoặc các buổi đào tạo trực tuyến, giúp DNNVV dễ dàng làm quen và

 Tổ chức các buổi đào tạo trực tiếp và trực tuyến: Các khóa đào tạo trực tiếp và

sử dụng hệ thống hiệu quả.

hội thảo trực tuyến sẽ được tổ chức để giúp DNNVV hiểu rõ hơn về cách sử dụng hệ thống. Các chương trình đào tạo sẽ được tùy chỉnh theo từng ngành nghề, ví

dụ như đào tạo về tìm kiếm chuyên gia pháp lý cho DNNVV trong ngành sản

xuất, hoặc đào tạo về chuyên gia công nghệ cho các công ty khởi nghiệp.

 Mạng lưới hỗ trợ từ chuyên gia: Xây dựng một cộng đồng trực tuyến dành cho

b. Tạo cộng đồng hỗ trợ người dùng

DNNVV và chuyên gia để tạo cơ hội trao đổi thông tin, kinh nghiệm và hỗ trợ

nhau trong việc giải quyết các vấn đề liên quan đến tìm kiếm và hợp tác. Bên

cạnh đó, đơn vị quản lý hệ thống có thể tổ chức một số sự kiện kết nối chuyên

gia và doanh nghiệp (offline hoặc online) để tăng cường sự tương tác và thúc đẩy

 Hỗ trợ kỹ thuật: Cung cấp dịch vụ hỗ trợ kỹ thuật nhanh chóng và hiệu quả, giúp

việc sử dụng hệ thống.

DNNVV giải quyết các sự cố trong quá trình sử dụng hệ thống mà không làm

gián đoạn hoạt động kinh doanh. Dịch vụ này sẽ được cung cấp thông qua các

kênh hỗ trợ trực tuyến, đảm bảo sự tiện lợi và nhanh chóng.

Thông qua các kế hoạch này, hệ thống sẽ không chỉ giúp DNNVV tiếp cận được

nguồn lực chuyên gia mà còn đảm bảo hỗ trợ và duy trì hệ thống lâu dài, từ đó góp phần

thúc đẩy sự phát triển bền vững của các doanh nghiệp nhỏ và vừa tại Việt Nam.

4.5. Tổng kết chương 4

Chương 4 đã trình bày kết quả thử nghiệm và đánh giá thuật toán hai mô đun

quan trọng trong hệ tìm kiếm chuyên gia là Hợp nhất dữ liệu và Xếp hạng chuyên gia.

Những mô đun này đã chỉ ra tầm quan trọng của Cơ sở tri thức về chuyên gia đến hiệu quả hoạt động của hệ tìm kiếm chuyên gia cho DNNVV tại Việt Nam. Đồng thời, luận án cũng trình bày kết quả xây dựng hệ thống thử nghiệm và đánh giá các nhân tố tác động đến hành vi chấp nhận sử dụng hệ thống tìm kiếm chuyên gia của người dùng tại các DN thông qua mô hình UTAUT, bổ sung thêm vào bộ phương pháp đánh giá với hệ thống tìm kiếm chuyên gia.

153

KẾT LUẬN

1. Kết quả đạt được của luận án

Luận án đã thực hiện hệ thống hoá cơ sở lý thuyết về hệ thống tìm kiếm chuyên gia, phân tích thực trạng quản lý thông tin chuyên gia và tiến hành phỏng vấn sâu một

số DNNVV để hiểu rõ hiện trạng cũng như xác định nhu cầu tìm kiếm chuyên gia trong doanh nghiệp hiện nay. Bên cạnh đó, thực hiện nghiên cứu thêm về các hệ thống tìm

kiếm chuyên gia hiện có để phân tích ưu nhược điểm của những hệ thống này. Từ đó,

đề xuất kiến trúc tham khảo của hệ thống tìm kiếm chuyên gia dành cho các DNNVV

tại Việt Nam. Từ kiến trúc này có thể xây dựng ra các HTTT tìm kiếm chuyên gia cho phép nhiều doanh nghiệp trong các lĩnh vực dễ dàng sử dụng, nhằm trợ giúp việc tìm

kiếm chuyên gia trong nhiều lĩnh vực khác nhau. Hệ thống thử nghiệm hiện chứa danh

mục khoảng hơn 2200 chuyên gia, trong một số lĩnh vực thương mại và dịch vụ (Công nghệ thông tin, truyền thông, kinh tế và kinh doanh (tài chính, ngân hàng, logistic), y

dược, v.v.). Thông qua hệ thống này, các doanh nghiệp có thể thực hiện tìm kiếm một

chuyên gia cụ thể hoặc một nhóm chuyên gia để hỗ giải quyết bài toán nhân sự mà DN

đang cần. Đây là tiền để để doanh nghiệp có thể tìm kiếm chuyên gia một cách dễ dàng

và nhanh chóng hơn.

2. Những đóng góp mới của luận án

Đóng góp về mặt lý luận

Thứ nhất, luận án đã sử dụng một phương pháp tiếp cận mới trong tổng quan

nghiên cứu về xu hướng tìm kiếm chuyên gia bằng cách áp dụng kết hợp phương pháp

trắc lượng thư mục và đánh giá tổng quan có hệ thống trong khoảng thời gian từ năm

2000 đến 2023. Kết quả không chỉ phát hiện ra sự dịch chuyển của xu hướng nghiên cứu

từ tìm kiếm chuyên gia trong doanh nghiệp lớn sang lĩnh vực học thuật và nền tảng trực

tuyến như cộng đồng hỏi đáp, mà còn phát hiện ra sự thay đổi về cách thức và mục tiêu tìm kiếm, trong đó theo hướng lấy người dùng làm trung tâm.

Thứ hai, luận án đã đề xuất kiến trúc tham khảo VietSME-EFSA của Hệ thống tìm kiếm chuyên gia cho DNNVV tại Việt Nam, trong đó tập trung vào việc tích hợp và thống nhất nguồn thông tin chuyên gia từ nhiều tổ chức, đơn vị khác nhau, theo khung kiến trúc TOGAF và khung kiến trúc Chính phủ điện tử 3.0. Với các thành phần chính bao gồm: Hạ tầng kỹ thuật - công nghệ, an toàn thông tin mạng - an ninh mạng, tầng dữ liệu và cơ sở dữ liệu, tầng nền tảng tích hợp và chia sẻ dữ liệu, v.v. Từ đó, hệ thống có thể kết nối với các hệ thống khác theo chuẩn chung của Chính phủ.

154

Thứ ba, luận án đã đề xuất thuật toán mới KDD để phát hiện trùng lặp hồ sơ

chuyên gia, trong đó độ tương tự giữa các thực thể được tính toán dựa trên sự kết hợp

của việc phát hiện độ tương đồng trong tên người Việt và tập Cơ sở tri thức chuyên gia (Expert Knowledge Base) được thu thập từ nhiều nguồn khác nhau, nhằm giải quyết vấn

đề tương tự phụ thuộc vào cấp độ.

Thứ tư, bên cạnh việc xác định bộ phương pháp đánh giá hệ thống tìm kiếm

chuyên gia, luận án cũng đề xuất áp dụng mô hình UTAUT vào đánh giá việc chấp nhận

sử dụng hệ thống tìm kiếm chuyên gia. Mặc dù, phương pháp này không mới, nhưng

với lĩnh vực tìm kiếm chuyên gia thì phương pháp này chưa được áp dụng. Vì thế, luận án đã đề xuất bổ sung UTAUT vào bộ các phương pháp dùng để đánh giá trong lĩnh vực

tìm kiếm chuyên gia.

Đóng góp về mặt thực tiễn

Thứ nhất, luận án đã xác định được những bất cập trong thực trạng quản lý thông

tin chuyên gia hiện nay, cũng như nhu cầu tìm kiếm chuyên gia của các doanh nghiệp,

trên cơ sở đó đề xuất việc triển khai một hệ thống tìm kiếm chuyên gia đáp ứng nhu cầu

của doanh nghiệp, cũng như giúp quản lý và tích hợp dữ liệu chuyên gia một cách hiệu

quả hơn.

Thứ hai, kết quả đánh giá việc chấp nhận sử dụng hệ thống tìm kiếm chuyên gia

từ các doanh nghiệp đã cho thấy rằng, hai yếu tố quan trọng nhất mà đơn vị triển khai

cần xem xét khi triển khai hệ thống mới là “Điều kiện thuận lợi” liên quan đến cơ sở hạ

tầng để cài đặt và sử dụng hệ thống; và “Kỳ vọng nỗ lực” liên quan đến nhận thức của

người dùng về tính dễ sử dụng của hệ thống.

3. Những hạn chế và hướng phát triển

Bên cạnh đó, luận án cũng còn một số vấn đề chưa thực hiện như:

• Chưa áp dụng được đầy đủ các thuật toán nghiên cứu được vào hệ thống thực tế.

• Thu thập dữ liệu tự động và cập nhật liên tục cho hệ thống còn khó khăn.

• Hệ thống chưa đưa vào thực tế sử dụng đủ dài để người dùng đánh giá hiệu quả

thực sự.

Hệ thống thử nghiệm mới chỉ tập trung vào việc tìm kiếm chuyên gia trong một số lĩnh vực để hỗ trợ cho các doanh nghiệp trong lĩnh vực Thương mại và dịch vụ nên độ phủ rộng của chuyên gia trong nhiều lĩnh vực là chưa đầy đủ. Ngoài ra, việc đánh giá kết quả của của hệ thống sau khi triển khai là không hề dễ dàng. Việc tìm kiếm, liên lạc và kết nối với chuyên gia không thể thực hiện trong một khoảng thời gian ngắn. Vì thế,

155

để biết hệ thống có hoạt động hiệu quả và đáp ứng được nhu cầu tìm kiếm chuyên gia

của các DN hay không, thì cần có thời gian đủ dài để các doanh nghiệp trải nghiệm cũng

như đưa ra các đánh giá một cách chính xác nhất. Chính vì lý do đó, luận án mới chỉ đánh giá được bước đầu trong việc cung cấp thông tin về chuyên gia mà DN đang tìm

kiếm. Đây chính là một trong những hạn chế mà luận án gặp phải.

Trong thời gian tới, để có thể xây dựng được các hệ thống tìm kiếm chuyên gia

hoàn thiện và hiệu quả hơn, cần có thêm những nghiên cứu chuyên sâu với sự tham gia

của những bên liên quan. Đồng thời, mở rộng phạm vi nghiên cứu sang tìm kiếm chuyên

gia cho nhiều lĩnh vực khác nhiều lĩnh vực khác để có thể đánh giá được tốt hơn kiến trúc đề xuất trong luận án này.

156

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ

1. Lê Thị Thu, Phạm Xuân Lâm (2021), “Phát triển hệ thống Cơ sở dữ liệu lớn về nguồn nhân lực chất lượng cao cho doanh nghiệp nhỏ và vừa tại Việt Nam: Đánh

giá nhu cầu và đề xuất giải pháp”, Kỷ yếu hội thảo Quốc gia Hệ thống thông tin trong kinh doanh và quản lý ISBM”21, TP. Hồ Chí Minh.

2. Thu Thi Le, Lam Xuan Pham (2022), “Towards NoSQL Databases: Experiences from Actual Projects”, Kỷ yếu hội thảo Quốc tế “The 3rd International

Conference on Big Data Analytics and Practices – IBDAP”, Bangkok.

3. Thi Thu Le, Xuan Lam Pham, Thanh Huong Nguyen (2023), “Tailored Expert Finding Systems for Vietnamese SMEs: A Five-Step Framework”, International

Journal of Advanced Computer Science and Applications (IJACSA), 14(11), Q3

Scopus.

4. Thi Thu Le, Tuan-Dung Cao, Xuan Lam Pham, Duc Trung Pham, Toan Luu (2023), “An Automatic Method for Building a Taxonomy of Areas of Expertise”,

Kỷ yếu hội thảo Quốc tế “15th International Conference on Agents and Artificial

Intelligence – ICAART”, Lisbon.

5. Xuan-Lam Pham, Thi Thu Le (2024), “Bibliometric Analysis and Systematic Review of Research on Expert Finding: A PRISMA-guided Approach”,

International Arab Journal of Information Technology, 21(4), Q2 Scopus, SCIE.

157

TÀI LIỆU THAM KHẢO

1.

Abeysekera, R. (2020), “Examining Counsellor Expertise: Evidence from the Sri Lankan Microfinance Sector”, Business Ethics and Leadership, 4, 57-67.

https://doi.org/10.21272/bel.4(1).57-67.2020.

2. Afzal, M. & Maurer, H. (2011), “Expertise Recommender System for Scientific

Community”, J. UCS, 17, 1529-1549. https://doi.org/10.3217/jucs-017-11-1529.

3. Agnew, N. M., Ford, K. M. & Hayes, P. J. (1994), “Expertise in context:

personally constructed, socially selected, and reality-relevant?”, Int. J. Expert

Syst., 7(1), 65–88.

4.

Akpamah, P. & Matkó, A. (2021), “Information Technology deployment in Human Resource Management: A case study in deprived regions”, International

Review of Applied Sciences and Engineering, 13(1), 1-10.

https://doi.org/10.1556/1848.2021.00278.

5. Al-Taie, M. Z., Kadry, S. & Obasa, A. (2018), “Understanding expert finding

systems: domains and techniques”, Social Network Analysis and Mining, 8(1).

6. Alam, M. K. (2021), “A systematic qualitative case study: questions, data

collection, NVivo analysis and saturation”, Qualitative Research in

Organizations and Management: An International Journal, 16(1), 1-31.

https://doi.org/10.1108/QROM-09-2019-1825.

7. Alarfaj, F., Kruschwitz, U., Hunter, D. & Fox, C. (2012), “Finding the Right

Supervisor: Expert-Finding in a University Domain”, Proceedings of the NAACL

HLT 2012 Student Research Workshop, Montréal, Canada.

https://aclanthology.org/N12-2001.

8.

Albusac, C., de Campos, L. M., Fernández-Luna, J. M. & Huete, J. F. (2018), “PMSC-UGR: A Test Collection for Expert Recommendation Based on PubMed and Scopus”, In Herrera, F.& cộng sự, Advances in Artificial Intelligence, Cham.

9.

Allen, R. (2020), “Sources of expertise in social enterprises”, Strategic Change, 29, 447-458. https://doi.org/10.1002/jsc.2356.

10. Amendola, M., Passarella, A. & Perego, R. (2024), 'Towards Robust Expert Finding in Community Question Answering Platforms', Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), https://doi.org/10.1007/978-3-031-56069- 9_12.

158

11. Amjad, T., Daud, A. & Aljohani, N. R. (2018), “Ranking authors in academic 36(1), 97-128. survey”, Library Hi Tech, social networks: a

https://doi.org/10.1108/LHT-05-2017-0090.

12. ASEAN CSR Network (2017), Challenges of small and medium enterprises in Vietnam in meeting the requirements of the Trans-Pacific Partnership Agreement (TPP) on Environment and Corporate Social Responsibility", https://www.asean-

csr-network.org/c/images/small_grants_fund/Round_3/Annex_D1.Research-

report_CECR.pdf.

13. Balog, K., Azzopardi, L. & Rijke, M. d. (2006), “Formal models for expert finding in enterprise corpora”, Proceedings of the 29th annual international ACM

SIGIR, Seattle, Washington, USA. https://doi.org/10.1145/1148170.1148181.

14. Balog, K., Azzopardi, L. & Rijke, M. d. (2009), “A language modeling 45(1), 1–19. framework for expert finding”, Inf. Process. Manage.,

https://doi.org/10.1016/j.ipm.2008.06.003.

15. Balog, K., Bogers, T., Azzopardi, L., Rijke, M. d. & Bosch, A. v. d. (2007), “Broad expertise retrieval in sparse data environments”, Proceedings of the 30th

annual international ACM SIGIR conference on Research and development in

information retrieval, Amsterdam, The Netherlands.

https://doi.org/10.1145/1277741.1277836.

16. Balog, K. & de Rijke, M. (2007), “Determining Expert Profiles (With an Application to Expert Finding)”, International Joint Conference on Artificial

Intelligence.

17. Balog, K., Fang, Y., Rijke, M. d., Serdyukov, P. & Si, L. (2012), “Expertise 127–256. Retrieval”, 6(2–3), Found. Trends Retr., Inf.

https://doi.org/10.1561/1500000024.

18. Bojke, L., Soares, M., Claxton, K., Colson, A., Fox, A., Jackson, C., Jankovic, D., Morton, A., Sharples, L. & Taylor, A. (2021), “Developing a reference protocol for structured expert elicitation in health-care decision-making: A mixed-methods study”, (Health Technology Assessment), NIHR Journals

Library, No. 25.37.

19. Bonchi, F., Castillo, C., Gionis, A. & Jaimes, A. (2011), “Social Network Analysis and Mining for Business Applications”, ACM Trans. Intell. Syst. Technol., 2(3), Article 22. https://doi.org/10.1145/1961189.1961194.

159

20. Booth, S., O”Neill, M. & Lamb, J. (2018), “Using NVivo™ for Literature 23. Reviews: The Eight Step Pedagogy (N7+1)”, Qualitative Report,

https://doi.org/10.46743/2160-3715/2018.3030.

21. Borna, S., Barry, B. A., Makarova, S., Parte, Y., Haider, C. R., Sehgal, A., Leibovich, B. C. & Forte, A. J. (2024), 'Artificial Intelligence Algorithms for Expert Identification in Medical Domains: A Scoping Review' [Review],

European Journal of Investigation in Health, Psychology and Education, 14(5),

1182-1196. https://doi.org/10.3390/ejihpe14050078.

22. Bozzon, A., Brambilla, M., Ceri, S., Silvestri, M. & Vesci, G. (2013), “Choosing the right crowd: expert finding in social networks”, Proceedings of the 16th

International Conference on Extending Database Technology, Genoa, Italy.

https://doi.org/10.1145/2452376.2452451.

23. Bộ Kế hoạch và Đầu tư (2022), Sách trắng doanh nghiệp Việt Nam năm 2022

(Tổng cục thống kê), Nhà xuất bản Thống kê.

24. Bộ Khoa học và Công nghệ. (2014), Quyết định số 588/QĐ-BKHCN "Về việc xây

dựng, quản lý và sử dụng CSDL chuyên gia của Bộ Khoa học và Công nghệ".

25. Bộ Thông tin và truyền thông. (2023), QĐ số 2568/QĐ-BTTT, Quyết định ban hành Khung Kiến trúc Chính phủ điện tử Việt Nam, phiên bản 3.0, hướng tới Chính phủ số.

26. Brennan, M., Dilenschneider, D., Levin, M. & Robinson, J. (2009), Finding and LexisNexi, Testimony, Experts Their and

Researching https://www.lexisnexis.com/documents/pdf/20071211111707_large.pdf.

27. Brereton, P., Kitchenham, B. A., Budgen, D., Turner, M. & Khalil, M. (2007), “Lessons from applying the systematic literature review process within the software engineering domain”, Journal of Systems and Software, 80(4), 571-583. https://doi.org/https://doi.org/10.1016/j.jss.2006.07.009

28. Broderick, R. & Boudreau, J. W. (1992), “Human resource management, information technology, and the competitive edge”, Academy of Management Perspectives, 6(2), 7-17. https://doi.org/10.5465/ame.1992.4274391

29. Camey, D. (2014), “The Use of Information Technology Applications in Human Resource Management in Organizations”, International Journal ofEmerging Research in Management & Technology, 3(3).

160

30. Chambers, E. G., Foulon, M., Handfield-Jones, H., Hankin, S. & Michaels, E.

(1998), “The War for Talent”, The McKinsey Quarterly, 3, 44-57.

31. Chen, T. T. & Lee, M. (2018), “Research Paper Recommender Systems on Big Scholarly Data”, In Yoshida, K. & Lee, M., Knowledge Management and Acquisition for Intelligent Systems, Cham.

32. Cheng, Z., Caverlee, J., Barthwal, H. & Bachani, V. (2014), “Who is the barbecue king of texas? a geo-spatial approach to finding local experts on twitter”, Proceedings of the 37th international ACM SIGIR conference on Research & development in information retrieval, Gold Coast, Queensland, Australia. https://doi.org/10.1145/2600428.2609580.

33. Chi, M. T. H., Glaser, R. & Farr, M. J. (ed.,1988), The nature of expertise.

Lawrence Erlbaum Associates, Inc. https://doi.org/10.4324/9781315799681.

34. Chrisman, J. J. & McMullan, W. E. (2004), “Outsider Assistance as a Knowledge Resource for New Venture Survival”, Journal of Small Business Management,

42(3), 229-244. https://doi.org/https://doi.org/10.1111/j.1540-

627X.2004.00109.x

35. Cifariello, P., Ferragina, P. & Ponza, M. (2019), “Wiser: A semantic approach for expert finding in academia based on entity linking”, Inf. Syst., 82(C), 1–16. https://doi.org/10.1016/j.is.2018.12.003

36. D”Amore, R. (2004), “Expertise community detection”, Proceedings of the 27th annual international ACM SIGIR conference on Research and development in

information retrieval, Sheffield, United Kingdom.

https://doi.org/10.1145/1008992.1009089.

37. D”Amore, R., (2008), Expert Finding in Disparate Environments, University of from Kingdom, Sheffield, United

Sheffield, https://etheses.whiterose.ac.uk/30250/.

38. Dargahi Nobari, A., Neshati, M. & Sotudeh Gharebagh, S. (2020), “Quality- aware skill translation models for expert finding on StackOverflow”, Information Systems, 87, 101413. https://doi.org/https://doi.org/10.1016/j.is.2019.07.003

39. Davis, F. D. (1989), “Perceived Usefulness, Perceived Ease of Use, and User Acceptance of Information Technology”, Mis Quarterly, 13(3), 319-340.

40.

de Campos, L. M., Fernández-Luna, J. M., Huete, J. F., Ribadas-Pena, F. J. & Bolaños, N. (2024), 'Information Retrieval and Machine Learning Methods for

161

Academic Expert Finding' [Article], Algorithms, 17(2). Article 51.

https://doi.org/10.3390/a17020051.

41. Dehghan, M., Biabani, M. & Abin, A. A. (2019), “Temporal expert profiling: With an application to T-shaped expert finding”, Information Processing &

56(3), 1067-1079.

Management, https://doi.org/https://doi.org/10.1016/j.ipm.2019.02.017

42. Deng, H., Han, J., Lyu, M. R. & King, I. (2012), “Modeling and exploiting heterogeneous bibliographic networks for expertise ranking”, Proceedings of the

12th ACM/IEEE-CS joint conference on Digital Libraries, Washington, DC, USA. https://doi.org/10.1145/2232817.2232833.

43. Deng, H., King, I. & Lyu, M. R. (2008), “Formal Models for Expert Finding on DBLP Bibliography Data”, 2008 Eighth IEEE International Conference on Data Mining, 163-172.

44. Dom, B., Eiron, I., Cozzi, A. & Zhang, Y. (2003), “Graph-based ranking

algorithms for e-mail expertise analysis”, Proceedings of the 8th ACM SIGMOD

workshop on Research issues in data mining and knowledge discovery, San

Diego, California. https://doi.org/10.1145/882082.882093.

45. Dũng, N. M., Ngọc, L. T. T. & Hòa, T. T. (2018), “Khái niệm và đề xuất tiêu chí

xác định chuyên gia khoa học và công nghệ ngành tài nguyên và môi trường”,

Tạp chí Khoa học Đo đạc và Bản đồ, 35.

https://doi.org/10.54491/jgac.2018.35.268

46. Eck, N. J. v. & Waltman, L. (2022), VOSviewer Manual, Universiteit Leiden, 1-

54, https://www.vosviewer.com/documentation/Manual_VOSviewer_1.6.18.pdf

47. Ericsson, A. & Pool, R. (2016), Peak: Secrets from the new science of expertise,

Houghton Mifflin Harcourt.

48. Ericsson, K. A. (1996), The road to excellence: The acquisition of expert

performance in the arts and sciences, sports, and games, Lawrence Erlbaum

Associates, Inc.

49. Etemadi, R., Zihayat, M., Feng, K., Adelman, J., Zarrinkalam, F. & Bagheri, E.

(2024), 'It Takes a Team to Triumph: Collaborative Expert Finding in Community

QA Networks', SIGIR-AP 2024 - Proceedings of the 2024 Annual International

162

ACM SIGIR Conference on Research and Development in Information Retrieval

in the Asia Pacific Region, https://doi.org/10.1145/3673791.3698404.

50. European Commission (2015), Business management and organization, Global

innovative leadership module, Commission, E.,

https://ec.europa.eu/programmes/erasmus-plus/project-result-content/9a1c8bee-11f3-

48f0-8e25-

c86b14cf445a/Business%20Management%20And%20Organization%20Booklet.pdf.

51. European Commission (2015), User guide to the SME definition,

http://ec.europa.eu/DocsRoom/documents/10109.

52. Fallahnejad, Z. & Beigy, H. (2022), “Attention-based skill translation models for

expert finding”, Expert Systems with Applications, 193, 116433.

https://doi.org/https://doi.org/10.1016/j.eswa.2021.116433.

53. Fallahnejad, Z. & Beigy, H. (2024), 'SAST: A self-attention based method for

skill translation in T-shaped expert finding', Information Sciences, 680. Article

121116. https://doi.org/10.1016/j.ins.2024.121116.

54. Fang, H. & Zhai, C. (2007, 2007//), “Probabilistic Models for Expert Finding”,

Advances in Information Retrieval, Berlin, Heidelberg.

55. Fang, Y., Si, L. & Mathur, A. P. (2010a), “Discriminative graphical models for

faculty homepage discovery”, Information Retrieval, 13(6), 618-635.

https://doi.org/10.1007/s10791-010-9127-7

56. Fang, Y., Si, L. & Mathur, A. P. (2010b), “Discriminative models of integrating

document evidence and document-candidate associations for expert search”,

Proceedings of the 33rd international ACM SIGIR conference on Research and

development in information retrieval, Geneva, Switzerland.

https://doi.org/10.1145/1835449.1835563.

57. Fazel-Zarandi, M., Devlin, H. J., Huang, Y. & Contractor, N. (2011), “Expert recommendation based on social drivers, social network analysis, and semantic data representation”, Proceedings of the 2nd International Workshop on

Information Heterogeneity and Fusion in Recommender Systems, Chicago, Illinois. https://doi.org/10.1145/2039320.2039326.

58. Fu, J., Li, Y., Zhang, Q., Wu, Q., Ma, R., Huang, X. & Jiang, Y.-G. (2020), “Recurrent Memory Reasoning Network for Expert Finding in Community

163

Question Answering”, Proceedings of the 13th International Conference on Web

Search and Data Mining.

59. Gao, F., Fenoaltea, E. M., Zhang, P. & Zeng, A. (2024), 'A reviewer-reputation ranking algorithm to identify high-quality papers during the review process',

Applications, Systems with 249, 123551.

Expert https://doi.org/https://doi.org/10.1016/j.eswa.2024.123551.

60. Ghasemi, N., Fatourechi, R. & Momtazi, S. (2021), “User Embedding for Expert Finding in Community Question Answering”, ACM Trans. Knowl. Discov. Data,

15(4), Article 70. https://doi.org/10.1145/3441302

61. Gollapalli, S. D., Mitra, P. & Giles, C. L. (2012), “Similar researcher search in joint academic environments”, Proceedings of the 12th ACM/IEEE-CS

Digital on Libraries, Washington, DC, USA.

conference https://doi.org/10.1145/2232817.2232849.

62. Golzadeh, K., Golab, L. & Szlichta, J. (2024), 'Explaining Expert Search Systems with ExES', Proceedings - International Conference on Data Engineering,

https://doi.org/10.1109/ICDE60146.2024.00429.

63. Hair, J., Anderson, R., Babin, B. & Black, W. (2013), Multivariate Data Analysis

(7th ed.), Pearson.

64. Hechler, E., Weihrauch, M. & wu, y. (2023), Data Fabric and Data Mesh Approaches with AI: A Guide to AI-based Data Cataloging, Governance,

Integration, Orchestration, and Consumption. https://doi.org/10.1007/978-1-

4842-9253-2.

65. Hevner, A. R., March, S. T., Park, J. & Ram, S. (2004), “Design Science in 28(1), 75-105. Information Systems Research”, Mis Quarterly,

https://doi.org/10.2307/25148625.

(Ed.), Palgrave Macmillan UK,

66. Hoffman, R. R. (1998), How Can Expertise be Defined? Implications of Research from Cognitive Psychology, In Exploring Expertise: Issues and Perspectives 81-100. Williams, R.& cộng sự https://doi.org/10.1007/978-1-349-13693-3_4.

67. Hofmann, K., Balog, K., Bogers, T. & Rijke, M. d. (2010), “Contextual factors

for finding similar experts”, J. Am. Soc. Inf. Sci. Technol., 61(5), 994–1014.

164

68. Holtskog, H. (2017), “Defining the Characteristics of an Expert in a Social Context Through Subjective Evaluation”, Journal of the Knowledge Economy,

8(3), 1014-1031. https://doi.org/10.1007/s13132-015-0312-1.

69. Horn, J. & Masunaga, H. (2006), A Merging Theory of Expertise and Intelligence, In The Cambridge Handbook of Expertise and Expert Performance Ericsson, K. A.& cộng sự (Ed.), Cambridge University Press, 587-612.

https://doi.org/10.1017/CBO9780511816796.034.

70. Huber, B. J. (1999), “Experts in organizations : the power of expertise”, Globalization and Emerging Economies: International Conference Proceedings, Barcelona, Spain.

71. Husain, O., Salim, N., Alias, R. A., Abdelsalam, S. & Hassan, A. (2019), “Expert

Finding Systems: A Systematic Review”, Applied Sciences, 9(20).

72. IBM Cloud Education (2020), Application Programming Interface (API),

retrieved on June 10th 2022, from https://www.ibm.com/cloud/learn/api.

73. IFAC (2016), The Relationship between Accountancy Expertise and Business

Performance, https://www.ifac.org/system/files/publications/files/The-

Relationship-between-Accessing-Accountancy-Expertise-and-Business-

Performance.pdf.

74. Im, I., Hong, S. & Kang, M.-S. (2011), “An international comparison of

technology adoption: Testing the UTAUT model”, Inf. Manag., 48, 1-8.

75. Ionita, M. T., Hammer, D. K. & Obbink, H. (2002), “Scenario-Based Software

Architecture Evaluation Methods: An Overview “, Proceedings Workshop on

Methods and Techniques for Software Architecture Review and Assessment (International Conference on Software Engineering, ICSE”02, Orlando FL, USA,

May 19, 2002).

Applications, Systems Expert 211, with

76. Kang, Y.-B., Du, H., Forkan, A. R. M., Jayaraman, P. P., Aryani, A. & Sellis, T. (2023), “ExpFinder: A hybrid model for expert finding from text-based expertise 118691. data”, https://doi.org/https://doi.org/10.1016/j.eswa.2022.118691.

77. Karimzadehgan, M., White, R. W. & Richardson, M. (2009), “Enhancing Expert Finding Using Organizational Hierarchies”, In Boughanem, M.& cộng sự, Advances in Information Retrieval, Berlin, Heidelberg.

165

78. Klamma, R., Cuong, P. M. & Cao, Y. (2009), “You Never Walk Alone: Recommending Academic Events Based on Social Network Analysis”, In Zhou,

J., Complex Sciences, Berlin, Heidelberg.

79. Krafzig, D., Banke, K. & Slama, D. (2004), Enterprise SOA - Service-Oriented

Architecture Best Practices, Publisher: Prentice Hall PTR

80. Li, C.-T., Shan, M.-K. & Lin, S.-D. (2011), “Context-based people search in labeled social networks”, Proceedings of the 20th ACM international conference on Information and knowledge management, Glasgow, Scotland, UK. https://doi.org/10.1145/2063576.2063809.

systems”, Expert Syst. Appl., 38(7),

81. Li, M., Liu, L. & Li, C.-B. (2011), “An approach to expert recommendation based on fuzzy linguistic method and fuzzy text classification in knowledge 8586–8596. management https://doi.org/10.1016/j.eswa.2011.01.062.

82. Liang, S. & Rijke, M. d. (2016), “Formal language models for finding groups of 529–549. Manage., Process. 52(4), Inf.

experts”, https://doi.org/10.1016/j.ipm.2015.11.005.

83. Liff, R. & Andersson, T. (2021), “Experts” contribution to strategy when strategy is absent. A case study of quality experts in hospitals”, Public Management Review, 23(9), 1377-1397. https://doi.org/10.1080/14719037.2020.1751256.

84. Lin, S., Hong, W., Wang, D. & Li, T. (2017), “A survey on expert finding techniques”, Journal of Intelligent Information Systems, 49(2), 255-279. https://doi.org/10.1007/s10844-016-0440-5.

Manage., Process. 49(1), Inf.

85. Liu, D.-R., Chen, Y.-H., Kao, W.-C. & Wang, H.-W. (2013), “Integrating expert profile, reputation and link analysis for expert finding in question-answering websites”, 312–329. https://doi.org/10.1016/j.ipm.2012.07.002.

86. Liu, X., Croft, W. B. & Koll, M. (2005), “Finding experts in community-based question-answering services”, Proceedings of the 14th ACM international conference on Information and knowledge management, Bremen, Germany. https://doi.org/10.1145/1099554.1099644.

Systems Frontiers, Information 16(4),

87. Liu, X., Wang, G. A., Johri, A., Zhou, M. & Fan, W. (2014), “Harnessing global expertise: A comparative study of expertise profiling methods for online communities”, 715-727. https://doi.org/10.1007/s10796-012-9385-6.

166

88. Liu, Y., Liu, Z., Yu, Z., Fu, Q., Tang, W., Yao, W. & Sun, Z. (2025), 'Knowledge Augmented Expert finding framework via knowledge graph embedding for

Community Question Answering', Engineering Applications of Artificial 109891. Intelligence, Article 142.

https://doi.org/10.1016/j.engappai.2024.109891.

596(C), drift”, Inf.

89. Liu, Y., Tang, W., Liu, Z., Ding, L. & Tang, A. (2022), “High-quality domain expert finding method in CQA based on multi-granularity semantic analysis and 395–413. Sci., interest https://doi.org/10.1016/j.ins.2022.02.039.

90. Macdonald, C. & Ounis, I. (2006), “Voting for candidates: adapting data fusion techniques for an expert search task”, Proceedings of the 15th ACM international conference on Information and knowledge management, Arlington, Virginia, USA. https://doi.org/10.1145/1183614.1183671.

91. Macdonald, C. & Ounis, I. (2008), “Voting techniques for expert search”, 259-280. Information Systems, 16(3), and

Knowledge https://doi.org/10.1007/s10115-007-0105-3.

Access, IEEE 12,

92. Mahmood, S., Ghani, A., Daud, A., Alharbey, R., Bukhari, A. & Alshemaimri, B. (2024), 'Expert Ranking of Employees in Large Enterprises Using Tacit Reputation', 178309-178319. https://doi.org/10.1109/ACCESS.2024.3506819.

Information Retrieval, Pisa,

93. Mangaravite, V., Santos, R. L. T., Ribeiro, I. S., Gonçalves, M. A. & Laender, A. H. F. (2016), “The LExR Collection for Expertise Retrieval in Academia”, Proceedings of the 39th International ACM SIGIR conference on Research and Development Italy. in https://doi.org/10.1145/2911451.2914678.

94. Margaris, D., Georgiadis, P. & Vassilakis, C. (2015), “A Collaborative Filtering Algorithm with Clustering for Personalized Web Service Selection in Business Processes”, IEEE Research Challenges on Information Systems (RCIS) 2015, https://doi.org/10.1109/RCIS.2015.7128877.

95. Martínez, D., Taboada, M. & Mira, J. (2003), “Knowledge Base Development”, Knowledge-Based Intelligent Information and Engineering Systems, 7th International Conference, KES 2003, Oxford, UK.

96. Maybury, M. T. (2006), Expert Finding Systems, Technical Report MTR

06B000040, Corporation, M.

167

97. Menzel, H. (1960), Review of Studies in the Flow of Information Among Scientists, Bureau of Applied Social Research, Columbia University, New York.

98. MIT Libraries, Resources and Tools for Computational Research, retrieved on June 11th 2022, from https://libraries.mit.edu/scholarly/publishing/apis-for- scholarly-resources/.

99. Mosier, K., Fischer, U., Hoffman, R. R. & Klein, G. (2018), Expert professional judgments and "naturalistic decision making", In The Cambridge handbook of expertise and expert performance, 2nd ed., Cambridge University Press, 453- 475. https://doi.org/10.1017/9781316480748.025.

100. Naeem, M., Khan, M. B. & Afzal, M. T. (2013), “Expert Discovery: A web 1(1), 35-47. mining approach”, Journal of AI and Data Mining,

https://doi.org/10.22044/JADM.2013.116.

101. Neshati, M., Asgari, E., Hiemstra, D. & Beigy, H. (2013), “A Joint Classification Method to Integrate Scientific and Social Networks”, Advances in Information

Retrieval, Berlin, Heidelberg.

102. Neshati, M., Fallahnejad, Z. & Beigy, H. (2017), “On dynamicity of expert in community question answering”, Information Processing & finding

Management, 53(5), 1026-1042.

https://doi.org/https://doi.org/10.1016/j.ipm.2017.04.002.

103. Nguyen, P. & Trường, H. (2021), “Ứng dụng mô hình chấp nhận và sử dụng công nghệ hợp nhất (UTAUT): Trường hợp sử dụng phần mềm quản lý văn bản của

viên chức trường Đại học Quốc tế”, Tạp chí khoa học Đại học Mở thành phố Hồ 17, 19-37. Chí Minh kinh doanh, và quản kinh trị tế -

https://doi.org/10.46223/HCMCOUJS.econ.vi.17.2.1966.2022

104. Nguyen, T. Q. & Nguyen, H. T. T. (2021), Importance of Human Resources in Building Sustainable Enterprises: Cases of Small and Medium Enterprises in Vietnam, Human Resource Development in Vietnam: Research and Practice (2021): 277-296. https://doi.org/10.1007/978-3-030-51533-1_11.

105. Nhi, D. T. Y. & Phuong, H. C. (2018), “Training highlevel human resources in the industrial revolution 4.0”, High-quality training program - theoretical and

practical issues, Thu Dau Mot University, Binh Duong.

106. Nobari, A. D., Gharebagh, S. S. & Neshati, M. (2017), “Skill Translation Models in Expert Finding”, Proceedings of the 40th International ACM SIGIR

168

Conference on Research and Development in Information Retrieval, Shinjuku,

Tokyo, Japan. https://doi.org/10.1145/3077136.3080719.

107. Nowak-Brzezińska, A. & Wakulicz-Deja, A. (2019), “Exploration of rule-based knowledge bases: A knowledge engineer”s support”, Information Sciences, 485,

301-318.

108. Okeke, N. (2021), “Agile Methodology: Meaning, advantages, disadvantages & (2021), https://targettrend.com/agile-methodology- more, Diakses pada 8

meaning-advantages-disadvantages-more/

109. Pantouvakis, A. & Karakasnaki, M. (2017), “Role of the human talent in total quality management–performance relationship: an investigation in the transport sector”, Total Quality Management & Business Excellence, 28(9-10), 959-973. https://doi.org/10.1080/14783363.2017.1303873.

110. Peng, Q., Liu, H., Wang, Y., Xu, H., Jiao, P., Shao, M. & Wang, W. (2022), “Towards a Multi-View Attentive Matching for Personalized Expert Finding”, Proceedings of the ACM Web Conference 2022, Virtual Event, Lyon, France. https://doi.org/10.1145/3485447.3512086.

111. Peng, Q., Wang, W., Liu, H., Huo, C. & Shao, M. (2024), 'Graph Collaborative Expert Finding with Contrastive Learning', IJCAI International Joint Conference on Artificial Intelligence, https://www.scopus.com/inward/record.uri?eid=2- s2.0-85204288450&partnerID=40&md5=7efbb5f87dcf171e29d9932515a091af.

112. Peng, Q., Xu, H., Wang, Y., Liu, H., Huo, C. & Wang, W. (2024), 'PEPT: Expert Finding Meets Personalized Pre-Training', ACM Transactions on Information Systems, 43(1). Article 8. https://doi.org/10.1145/3690380.

113. Perez, M. (2020), Web Scraping vs API: What”s the Difference?, ParseHub,

retrieved on 8 May 2022, from https://www.parsehub.com/blog/web-scraping- vs-api/.

114. Ponce, L. B., García-Peñalvo, F. J. & Juanes-Méndez, J. A. (2016), Survey resource based on UTAUT model for acceptance of mobile learning among students and teachers.

115. Rafiei, M. & Kardan, A. A. (2015), “A novel method for expert finding in online communities based on concept map and PageRank”, Human-centric Computing and Information Sciences, 5(1), 10. https://doi.org/10.1186/s13673-015-0030-5.

169

116. Ren, J., Zhang, Z., Xu, J., Chen, G., Sun, Y. & Zhang, P. (2024), “Knowledge Base Enabled Semantic Communication: A Generative Perspective”, IEEE Wireless Communications, 31(4), 14 - 22.

117. Schoegje, T., Hardman, L., De Vries, A. & Pieters, T. (2024), 'Improving expert search effectiveness: Comparing ways to rank and present search results', CHIIR 2024 - Proceedings of the 2024 Conference on Human Information Interaction and Retrieval, https://doi.org/10.1145/3627508.3638296.

118. Serdyukov, P., Rode, H. & Hiemstra, D. (2008), “Modeling multi-step relevance propagation for expert finding”, Proceedings of the 17th ACM conference on Information and knowledge management, Napa Valley, California, USA. https://doi.org/10.1145/1458082.1458232.

119. Shalev-Shwartz, S. & Ben-David, S. (2014), Understanding Machine Learning:

From Theory to Algorithms, Cambridge University Press.

Systems, 55(4),

120. Silva, T., Guo, Z., Ma, J., Jiang, H. & Chen, H. (2013), “A social network- empowered research analytics framework for project selection”, Decision Support 957-968. https://doi.org/https://doi.org/10.1016/j.dss.2013.01.005.

Research, 19(4), 243 -

121. Singh, H., Singh, R., Malhotra, A. & Kaur, M. (2013), “Developing a Biomedical Expert Finding System Using Medical Subject Headings”, Healthcare 249. Informatics https://doi.org/10.4258/hir.2013.19.4.243.

122. Smirnova, E. & Balog, K. (2011), “A User-Oriented Model for Expert Finding”, In Clough, P.& cộng sự, Advances in Information Retrieval, Berlin, Heidelberg.

123. Sok foon, Y. & Yin-Fah, B. (2011), “Internet banking adoption in Kuala Lumpur: An application of UTAUT model”, International Journal of Business and Management, 6, p161. https://doi.org/10.5539/ijbm.v6n4p161.

124. Strukova, S., Ruipérez-Valiente, J. A. & Mármol, F. G. (2023), “Towards the Identification of Experts in Informal Learning Portals at Scale”, Proceedings of the Tenth ACM Conference on Learning @ Scale, Copenhagen, Denmark. https://doi.org/10.1145/3573051.3596179.

125. Sun, J., Xu, W., Ma, J. & Sun, J. (2015), “Leverage RAF to find domain experts on research social network services: A big data analytics methodology with MapReduce framework”, International Journal of Production Economics, 165, 185-193. https://doi.org/https://doi.org/10.1016/j.ijpe.2014.12.038.

170

126. Tabachnick, B. G. & Fidell, L. S. (2012), Using Multivariate Statistics (6th ed.),

Pearson.

127. Tien, N. H. & Nogalski, B. (2019), “Developing high quality human resource to benefit from CP-TPP and IR 4.0”, International Journal of Research in

Management, 1(2), 4-6.

128. Toàn, L. V. (2018), “Cơ sở dữ liệu Quốc gia về KH&CN: Một số việc cần làm”,

Khoa học và phát triển.

129. Tran, Q. & Huang, D. (2022), “Using PLS-SEM to analyze challenges hindering success of green building projects in Vietnam”, Journal of Economics and Development, 24(1), 47-64. https://doi.org/10.1108/JED-04-2020-0033.

130. Tung, Y.-H., Tseng, S.-S., Weng, J.-F., Lee, T.-P., Liao, A. Y. H. & Tsai, W.-N. (2010), “A rule-based CBR approach for expert finding and problem diagnosis”,

Expert Systems with Applications, 37(3), 2427-2438.

https://doi.org/https://doi.org/10.1016/j.eswa.2009.07.037.

131. Uddin, M. N., Duong, T. H., Oh, K.-j. & Jo, G.-S. (2011), “An Ontology Based Model for Experts Search and Ranking”, Intelligent Information and Database

Systems, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-20042-7_16.

132. Venkatesh, V., Morris, M. G., Davis, G. B. & Davis, F. D. (2003), “User Acceptance of Information Technology: Toward a Unified View”, Mis Quarterly,

27(3), 425-478. https://doi.org/10.2307/30036540.

133. Wang, C., Han, J., Jia, Y., Tang, J., Zhang, D., Yu, Y. & Guo, J. (2010), “Mining

advisor-advisee relationships from research publication networks”, Proceedings

of the 16th ACM SIGKDD international conference on Knowledge discovery and

data mining, Washington, DC, USA. https://doi.org/10.1145/1835804.1835833.

134. Wang, G. A., Jiao, J., Abrahams, A. S., Fan, W. & Zhang, Z. (2013),

“ExpertRank: A topic-aware expert finding algorithm for online knowledge

communities”, Decision Support Systems, 54(3), 1442-1451.

https://doi.org/https://doi.org/10.1016/j.dss.2012.12.020.

135. Wang, Y., Peng, Q., Liu, H., Xu, H., Shao, M. & Wang, W. (2024), 'Deep

expertise and interest personalized transformer for expert finding', Information

Processing and Management, 61(5). Article 103773.

https://doi.org/10.1016/j.ipm.2024.103773.

171

136. Walowe, N., Kimwele, M. & Kibe, A. (2024), 'An Ontology Based Web Crawler

with a Near-Duplicate Detection System to Improve the Performance of a Web

Crawler', International Journal of Technology and Systems, 9(5), 15–28.

https://doi.org/10.47604/ijts.2984.

137. Wang, Q., Ma, J., Liao, X. & Du, W. (2017), “A context-aware researcher

recommendation system for university-industry collaboration on R&D projects”,

Decision Support Systems, 103, 46-57.

https://doi.org/https://doi.org/10.1016/j.dss.2017.09.001.

138. Wei, W., Cong, G., Miao, C., Zhu, F. & Li, G. (2016), “Learning to Find Topic

Experts in Twitter via Different Relations”, IEEE Transactions on Knowledge

and Data Engineering, 28(7), 1764-1778.

https://doi.org/10.1109/TKDE.2016.2539166.

139. Weiss, D. J. & Shanteau, J. (2003), “Empirical Assessment of Expertise”, Human

Factors, 45(1), 104-116. https://doi.org/10.1518/hfes.45.1.104.27233.

140. Wu, D., Fan, S. & Yuan, F. (2021), “Research on pathways of expert finding on

academic social networking sites”, Information Processing & Management,

58(2), 102475. https://doi.org/https://doi.org/10.1016/j.ipm.2020.102475.

141. Wu, L., Wang, R., Su, L. & Li, J. (2024), 'A Study of Expert Finding Methods for

Multi-Granularity Encoded Community Question Answering by Fusing Graph

Neural Networks', IEEE Access, 12, 142168-142180.

https://doi.org/10.1109/ACCESS.2024.3450544.

142. Wu, Z., Wu, J., Khabsa, M., Williams, K., Chen, H.-H., Huang, W., Tuarob, S.,

Choudhury, S. R., Ororbia, A., Mitra, P. & Giles, C. L. (2014), “Towards building

a scholarly big data platform: challenges, lessons and opportunities”, Proceedings

of the 14th ACM/IEEE-CS Joint Conference on Digital Libraries, London, United

Kingdom.

143. Xiao, Y., Zheng, S., Shi, J., Du, X. & Hong, J. (2023), “Knowledge graph-based

manufacturing process planning: A state-of-the-art review”, Journal of

Manufacturing Systems, 70, 417-435.

144. Xu, Y., Guo, X., Hao, J., Ma, J., Lau, R. Y. K. & Xu, W. (2012), “Combining

social network and semantic concept analysis for personalized academic

172

researcher recommendation”, Decision Support Systems, 54(1), 564-573.

https://doi.org/https://doi.org/10.1016/j.dss.2012.08.003.

145. Yang, Z., Liu, Q., Sun, B. & Zhao, X. (2019), “Expert recommendation in community

question answering: a review and future direction”, International Journal of Crowd

Science, 3(3), 348-372. https://doi.org/10.1108/IJCS-03-2019-0011.

146. Yimam, D. & Kobsa, A. (2000, 14-16 June 2000), “DEMOIR: a hybrid

architecture for expertise modeling and recommender systems”, Proceedings

IEEE 9th International Workshops on Enabling Technologies: Infrastructure for

Collaborative Enterprises (WET ICE 2000),

https://doi.org/10.1109/ENABL.2000.883706.

147. Yimam-Seid, D. & Kobsa, A. (2003), “Expert-Finding Systems for

Organizations: Problem and Domain Analysis and the DEMOIR Approach”,

Journal of Organizational Computing and Electronic Commerce, 13(1), 1-24.

https://doi.org/10.1207/S15327744JOCE1301_1.

148. Yoshino, N. & Taghizadeh Hesary, F. (2016), “Major Challenges Facing Small

and Medium-Sized Enterprises in Asia and Solutions for Mitigating Them”,

Innovation Finance & Accounting eJournal.

https://www.adb.org/publications/major-challenges-facing-small-and-medium-

sized-enterprises-asia-and-solutions

149. Yuan, S., Zhang, Y., Tang, J., Hall, W. & Cabotà, J. B. (2020), “Expert finding

in community question answering: a review”, Artificial Intelligence Review,

53(2), 843-874. https://doi.org/10.1007/s10462-018-09680-6.

150. Zhao, Z., Zhang, L., He, X. & Ng, W. (2015), “Expert Finding for Question

Answering via Graph Regularized Matrix Completion”, IEEE Transactions on

Knowledge and Data Engineering, 27(4), 993-1004.

https://doi.org/10.1109/TKDE.2014.2356461.

151. Zhou, G., Lai, S., Liu, K. & Zhao, J. (2012), “Topic-sensitive probabilistic model

for expert finding in question answer communities”, Proceedings of the 21st ACM

international conference on Information and knowledge management, Maui,

Hawaii, USA. https://doi.org/10.1145/2396761.2398493.

173

152. Zhu, H., Cao, H., Xiong, H., Chen, E. & Tian, J. (2011), “Towards expert finding

by leveraging relevant categories in authority ranking”, Proceedings of the 20th

ACM international conference on Information and knowledge management,

153. Zhu, H., Chen, E., Xiong, H., Cao, H. & Tian, J. (2014), “Ranking user authority

Glasgow, Scotland, UK. https://doi.org/10.1145/2063576.2063931.

with relevant knowledge categories for expert finding”, World Wide Web, 17(5),

1081-1107. https://doi.org/10.1007/s11280-013-0217-5.

174

PHỤ LỤC

PHỤ LỤC 1

DANH SÁCH 20 DOANH NGHIỆP THAM GIA PHỎNG VẤN

“NHU CẦU TÌM KIẾM CHUYÊN GIA CHO DOANH NGHIỆP”

Số ĐT liên hệ

Tên doanh nghiệp

Chức vụ

Mã DN

Lĩnh vực hoạt động

Tổng số NV

(hoặc Email)

Họ tên người được khảo sát

damtrang.vcu

10

DN1

CTCP PT Tatsu Việt Nam

Đàm Thị Thu Trang

Chủ tịch HĐQT

@gmail.com

Nhập khẩu và phân phối ghế matxa

hai0209tb

Logistics

200

DN2

Phạm Văn Hải

Giám đốc giao nhận

@gmail.com

Công ty cổ phần giao nhận vận tải DH ( DH Logistics)

Logistics

50

0934****18

DN3

Chu Thị Kiều Liên

Trưởng Chi Nhánh

Công ty TNHH T&M Forwarding CN Hà Nội

lehang

20

Giám đốc

DN4

Công ty TNHH Nam Hoàng

Nguyễn Lê Hằng

@namhoang.com.vn

Cung cấp sản phẩm và dịch vụ cho Thư viện

50

Giám đốc

0912****09

DN5

Công ty TNHH Thủ Đô

Máy tính thiết bị văn phòng

Nguyễn Văn An

Sản xuất in ấn

23 Hoang Oanh Giám đốc

0918****69

DN6

Neo S Vietnam Co., Ltd

300

0979****66

DN7

Đầu tư, xây dựng

Đặng Xuân Chinh

Chi nhánh Công Ty Cổ Phần Tập Đoàn Đèo Cả

Phó giám đốc ban KSNB-PC

200

Giám đốc

0906****99

DN8

Công ty Cổ phần phần mềm EPR

Công nghệ thông tin

Trần Quang Huy

Marocom

Nhân viên

0946****99

22

DN9

Sửa chữa thiết bị viễn thông

Nguyễn Văn Cường

Xây dựng

25

0973****78

DN10

Lê Hữu Chung

Công ty cổ phần tư vấn và đầu tư xây dựng Vạn Hưng thịnh

Chủ tịch hội đồng quản trị

175

Kientruca1

10

Giám đốc

DN11

Công ty cổ phần Kiến Trúc A1

Thiết kế xây dựng

Nguyễn Thanh Tùng

@gmail.com

10

Giám đốc

0918****25

DN12

Cty cp dv tv đt XD Quang anh

Hoàng Ngọc Bình

Kinh doanh môi giới bất động sản

Xây dựng

50 Lê Anh Tuấn

0904****69

DN13

Công ty CP Xây dựng HTK Việt Nam

Phó Giám đốc

luongnguyen.dhcn

30

DN14

Công ty TNHH FIT Decor

Trang trí nội thất.

Nguyễn Thị Lương

Kế toán trưởng

@gmail.com

150

0971****67

DN15

Kinh doanh bất động sản

Nguyễn Mạnh Cường

Trưởng phòng

Công ty cổ phần đầu tư phát triển xây dựng đô thị Tân Thái Bình Dương

Xây dựng

20

Giám đốc

0986****59

DN16

Nguyễn Huy Nhã

Công ty cổ phần xây dựng và thương mại Trang Hùng Anh

Xây dựng

30

Giám đốc

0981****86

DN17

Dương Văn Quyết

Công ty cổ phần tư vấn và đầu tư xây dựng Bảo Châu land

cuongnvbk86

Xây dựng

10

DN18

Công ty CP ĐTXD và TMDV Anh Quân

Nguyễn Văn Cường

Trưởng phòng

@gmail.com

130

CEO

0904****19

DN19

Công ty Cổ phần Lumi Việt Nam

IoT, Smarthome

Nguyễn Đức Tài

120

Giám đốc

0932****58

DN20

Nguyễn Văn Minh

Sản xuất, chế biến thuỷ hải sản

Công ty TNHH một thành viên xuất nhập khẩu thủy sản Nghi Sơn

176

PHỤ LỤC 2

PHIẾU PHỎNG VẤN

Nhu cầu nguồn nhân lực chuyên gia trong doanh nghiệp nhỏ và vừa Việt Nam

Chào anh/chị, hiện tôi đang nghiên cứu đề tài “Phát triển Hệ thống tìm kiếm chuyên

gia cho Doanh nghiệp nhỏ và vừa tại Việt Nam”. Tôi rất mong được tham khảo ý kiến của anh/chị để nắm bắt thực trạng nhu cầu tìm kiếm, tư vấn và hợp tác với nguồn nhân

lực chất lượng cao, nhân lực chuyên gia trong các lĩnh vực mà DN đang hoạt động.

Xin chân thành cảm ơn!

Tên doanh nghiệp: ……………………………………………………………………

Lĩnh vực (ngành nghề) hoạt động: ……………………………………………………

Tổng số nhân viên: ……………………………………………………………………

Tên người được phỏng vấn: ……………………………………………………………

Chức vụ:……………… ………………………………………………………………

Số ĐT liên hệ:…………………………………………………………………………

GIỚI THIỆU

“Chuyên gia” (Expert) là cụm từ được sử dụng để nói về một người có kỹ năng, kiến

thức thông thạo trong một lĩnh vực hoặc một số lĩnh vực nhất định. Tại Việt Nam, những

cụm từ như: “Nhân lực chất lượng cao”, “nhân lực tài năng”, “nhân lực chuyên gia”

có thể được dùng với nghĩa tương tự nhau.

CÂU HỎI PHỎNG VẤN

1. Về nguồn nhân lực sẵn có trong Doanh nghiệp (DN)

- Hiện tại, theo anh/chị (A/C), số lượng nhân viên trong DN mình đã đáp ứng được nhu cầu của DN trong quá trình hoạt động chưa?

- Nếu chưa, theo A/C, DN cần bổ sung nhân lực vào những vị trí nào? Việc bổ sung này

cần thực hiện ngay hay theo lộ trình (tháng/quý/năm hoặc tuỳ vào nguồn vốn/nhu cầu mở rộng)?

- Nhân lực bị thiếu thường là lao động phổ thông hay nguồn lao động chất lượng cao/ nhân lực chuyên gia?

177

2. Về nhu cầu tìm kiếm nguồn nhân lực chuyên gia

- Doanh nghiệp A/C có nhu cầu tìm kiếm nguồn nhân lực chuyên gia từ bên ngoài không?

- Nhu cầu tìm kiếm này là nhiều hay ít? Nhu cầu này thường xuất hiện khi có một dự án/yêu cầu từ hoạt động kinh doanh nào đó, hay để đáp ứng những công việc cố định

thường xuyên diễn ra?

- Giả sử, DN A/C đang muốn mở rộng hoạt động sang một thị trường mới ngoài Việt

Nam, anh chị có nhu cầu tìm kiếm những chuyên gia người Việt hoạt động trong lĩnh vực của DN, đang sinh sống tại nước đó để hỗ trợ không?

- Trong các hoạt động của DN bao gồm: Sản xuất, Marketing, Bán hàng, Giao vận

(logistic), Quản trị tài chính, Quản trị rủi ro, Pháp lý, Công nghệ thông tin và truyền thông, v.v.; A/C thấy DN mình cần tìm kiếm nguồn nhân lực chuyên gia trong

những hoạt động nào nhiều nhất?

3. Về nhu cầu tư vấn, hợp tác từ các chuyên gia

- Khi cần tham khảo ý kiến hoặc hỗ trợ tư vấn từ những người có kiến thức chuyên môn

trong lĩnh vực mà DN A/C đang quan tâm, A/C có sẵn sàng liên hệ với những người đó

không? A/C đã từng liên hệ với chuyên gia nào đó chưa? Họ có hay từ chối lời mời của

A/C không?

- Theo A/C, khó khăn lớn nhất của việc sử dụng chuyên gia từ bên ngoài là gì? (Ví dụ:

Không hiểu qui trình hoạt động của DN/Không hiểu rõ khó khăn mà DN đang gặp

phải/Không thống nhất được điều kiện hợp tác/, v.v.)

- Giữa việc tự tuyển dụng/đào tạo lao động chất lượng cao trở thành nhân viên cơ hữu của DN với việc mời hợp tác theo nhu cầu của từng giai đoạn/dự án, A/C thấy phương án nào thích hợp và có lợi với DN của mình hơn? (Một bên thời gian thực hiện dài, phải trả lương cố định kèm theo các điều kiện phúc lợi khác/ So với một bên có thể hợp tác ngay, thù lao trả theo công việc)

4. Các phương pháp và phương tiện đang sử dụng để tìm kiếm, kết nối với các

chuyên gia

- Nếu cần tìm kiếm một chuyên gia nào đó, A/C thường dùng phương thức/công cụ nào để tìm hoặc liên hệ (Một số công cụ như: Dùng Google search/thông qua mối quan hệ/thông qua một hệ thống tìm kiếm, v.v.)?

178

- Theo A/C, việc tìm kiếm này là khó hay dễ?

- Thường A/C có tìm được đúng đối tượng theo yêu cầu của mình không?

- A/C đánh giá thế nào về những phương thức/công cụ tìm kiếm nhân lực hiện nay? (tính hiệu quả/tính dễ sử dụng/độ tiện lợi, v.v.)

5. Về hệ thống tìm kiếm chuyên gia với đầy đủ thông tin về các chuyên gia

trong lĩnh vực mà DN đang quan tâm

- Để đáp ứng nhu cầu tìm kiếm thông tin về chuyên gia, nếu có 1 hệ thống tích hợp sẵn

cơ sở dữ liệu về các chuyên gia trong lĩnh vực mà DN đang quan tâm, A/C thấy hệ thống

này có cần thiết không?

- Anh chị mong muốn/đề xuất hệ thống này nên có những chức năng gì? (tìm kiếm

chuyên gia, hỏi đáp chuyên gia, đặt hàng chuyên gia, kết nối chuyên gia, v.v.)

- Nguồn chuyên gia anh chị mong muốn hợp tác là người Việt trong nước/người Việt ở

nước ngoài/chuyên gia nước ngoài?

- Anh chị có yêu cầu cụ thể/đặc biệt nào về đối tượng chuyên gia này không?

- Nếu tác giả xây dựng một hệ thống tìm kiếm chuyên gia về một số lĩnh vực hoạt động

liên quan đến doanh nghiệp, A/C có sẵn sàng thử nghiệm sử dụng hệ thống này không?

(tất nhiên là sử dụng miễn phí!)

Xin chân thành cảm ơn anh/chị!

179

PHỤ LỤC 3

PHIẾU KHẢO SÁT

Ý định hành vi chấp nhận sử dụng hệ thống tìm kiếm chuyên gia và đánh giá khả năng cung cấp thông tin nhân lực chuyên gia cho doanh nghiệp nhỏ và vừa Việt Nam

Chào anh/chị, hiện tôi đang nghiên cứu đề tài “Phát triển Hệ thống tìm kiếm chuyên

gia cho Doanh nghiệp nhỏ và vừa tại Việt Nam”. Tôi rất mong được tham khảo ý kiến

của anh/chị để tìm hiểu về ý định chấp nhận sử dụng hệ thống tìm kiếm chuyên gia

ESSME mà tác giả đề xuất, cũng như đánh giá khả năng cung cấp thông tin nhân lực chuyên gia mà hệ thống này đem lại cho doanh nghiệp nhỏ và vừa Việt Nam.

Mong anh/chị dành chút thời gian tham gia đóng góp bằng cách trả lời phiếu khảo sát

này. Tác giả xin cam đoan những thông tin mà anh/chị cung cấp chỉ phục vụ cho mục

đích nghiên cứu và được bảo mật hoàn toàn. Mọi ý kiến đóng góp của anh/chị sẽ góp

phần tạo nên thành công cho đề tài nghiên cứu của tác giả.

Xin chân thành cảm ơn!

1. Thông tin về người sử dụng hệ thống ESSME

1.1 Tên Doanh nghiệp:

1.2 Loại Hình hoạt động kinh doanh:

1.3 Tổng số nhân viên:

1.4 Thông tin người trả lời phiếu câu hỏi:

Họ và tên:

Chức vụ:

Email : ______________________________________

2. Thông tin về tình Hình sử dụng hệ thống ESSME

2.1 Chức năng sử dụng thường xuyên trên Hệ thống ESSME

(1) (2) (3) (4)

2.2 Ý định chấp nhận sử dụng Hệ thống tìm kiếm chuyên gia cho DNNVV – hệ thống

ESSME

180

Xin vui lòng cho biết mức độ đồng ý của anh/chị với các phát biểu sau đây về các yếu

tố ảnh hưởng đến ý định chấp nhận sử dụng hệ thống theo thứ tự từ 1 đến 5 với mức độ

tăng dần. Vui lòng đánh dấu ✔ vào ô mà anh/chị chọn.

① ② ③ ④ ⑤

Hoàn toàn Không đồng ý Trung lập Đồng ý Hoàn toàn đồng

không đồng ý ý

KỲ VỌNG HIỆU QUẢ

(mức độ tin tưởng của cá nhân trong việc sử dụng hệ thống sẽ giúp họ đạt hiệu quả trong

công việc)

1 ① ② ③ ④ ⑤

Tôi thấy hệ thống tìm kiếm chuyên gia ESSME hữu ích trong quá trình tìm kiếm thông tin nhân sự

chuyên gia của doanh nghiệp tôi.

2 ① ② ③ ④ ⑤

Sử dụng hệ tìm kiếm chuyên gia ESSME giúp tăng cơ hội tìm được chuyên gia phù hợp với nhu cầu

nhân sự mà doanh nghiệp tôi đang cần.

3 ① ② ③ ④ ⑤

Sử dụng hệ tìm kiếm chuyên gia ESSME giúp doanh nghiệp của tôi hoàn thành việc tìm kiếm nhân

sự nhanh hơn.

4 ① ② ③ ④ ⑤

Sử dụng hệ thống tìm kiếm chuyên gia ESSME có thể giúp doanh nghiệp tác giả tiết kiệm thời gian và

chi phí trong quá trình tìm kiếm nhân sự chuyên gia.

KỲ VỌNG NỖ LỰC

(là sự nhận thức về việc dễ sử dụng hệ thống)

5 Học cách sử dụng hệ thống tìm kiếm chuyên gia ① ② ③ ④ ⑤

ESSME rất dễ dàng đối với tôi.

6 ① ② ③ ④ ⑤

Tôi thấy việc tương tác với hệ thống rõ ràng và dễ hiểu.

181

7 Tôi thấy hệ thống tìm kiếm chuyên gia ESSME dễ ① ② ③ ④ ⑤

sử dụng.

8 Thật dễ dàng để tôi trở nên thuần thục trong việc sử ① ② ③ ④ ⑤

dụng hệ thống ESSME.

ẢNH HƯỞNG XÃ HỘI

(nhận thức của cá nhân bị tác động bởi niềm tin của những người xung quanh khi họ

cho rằng cá nhân đó nên sử dụng hệ thống mới)

9 Những người bạn trong ngành nhân sự nghĩ rằng tôi ① ② ③ ④ ⑤

nên sử dụng hệ thống tìm kiếm chuyên gia ESSME.

10 Bộ phận nhân sự trong doanh nghiệp của tôi cũng ① ② ③ ④ ⑤

khuyến khích tôi sử dụng hệ thống ESSME để tìm

kiếm nhân sự chuyên gia cho doanh nghiệp của

mình.

11 Nhiều quản lý của các doanh nghiệp khác cũng ① ② ③ ④ ⑤

đồng ý cùng sử dụng hệ thống ESSME để tìm kiếm

nhân sự chuyên gia cho doanh nghiệp.

ĐIỀU KIỆN THUẬN LỢI

(niềm tin của người dùng về cơ sở hạ tầng kỹ thuật của tổ chức đủ điều kiện hỗ trợ cho

hệ thống)

12 Tôi có đủ tài nguyên cần thiết để sử dụng hệ thống ① ② ③ ④ ⑤

tìm kiếm chuyên gia.

13 Tôi có kiến thức cần thiết để sử dụng hệ tìm kiếm ① ② ③ ④ ⑤

chuyên gia ESSME.

14 Hệ thống ESSME tương thích với các hệ thống khác ① ② ③ ④ ⑤

mà tôi đang sử dụng.

15 Tôi có thể nhận trợ giúp từ người khác khi gặp khó ① ② ③ ④ ⑤

khăn khi sử dụng hệ thống tìm kiếm chuyên gia.

182

Ý ĐỊNH HÀNH VI

16 Tôi dự định sẽ tiếp tục sử dụng hệ thống ESSME để ① ② ③ ④ ⑤

tìm kiếm nhân sự chuyên gia cho doanh nghiệp của mình trong tương lai.

17 Tôi sẽ luôn cố gắng sử dụng hệ thống ESSME mỗi ① ② ③ ④ ⑤

khi cần tìm kiếm nhân lực chuyên gia.

18 Tôi sẽ sử dụng hệ thống ESSME một cách thường ① ② ③ ④ ⑤

xuyên.

19 Tôi sẽ giới thiệu hệ thống ESSME cho những người ① ② ③ ④ ⑤

bạn của tôi ở các DN khác.

2.3 Đánh giá khả năng đáp ứng thông tin tìm kiếm chuyên gia cho DNNVV của hệ

thống ESSME

2.3.1 Độ phù hợp của thông tin

[ ] Rất hài lòng [ ] Hài lòng [ ] Chưa hài lòng

- Lí do (nếu chưa hài lòng) :

2.3.2 Mức độ chi tiết của thông tin

[ ] Rất hài lòng [ ] Hài lòng [ ] Chưa hài lòng

- Lí do (nếu chưa hài lòng) :

2.3.3 Tính cập nhật của thông tin

[ ] Rất hài lòng [ ] Hài lòng [ ] Chưa hài lòng

- Lí do (nếu chưa hài lòng) :

2.3.4 Tốc độ phản hồi thông tin đến người sử dụng

[ ] Rất hài lòng [ ] Hài lòng [ ] Chưa hài lòng

- Lí do (nếu chưa hài lòng) :

2.3.5 Tính ổn định/khả năng truy cập của Hệ thống (Hệ thống hoạt động thông suốt

hay không)

[ ] Rất hài lòng [ ] Hài lòng [ ] Chưa hài lòng

183

- Lí do (nếu chưa hài lòng) :

2.3.6 Đánh giá tổng thể về hệ thống

[ ] Rất hài lòng [ ] Hài lòng [ ] Chưa hài lòng

2.4 Yêu cầu hoàn thiện Hệ thống ESSME

ST Chức năng sử dụng Yêu cầu hoàn Lý do yêu cầu Mức độ

T trên Hệ thống thiện hoàn thiện (Nêu thường xuyên

ESSME

cụ thể những vấn đề, vướng mắc gặp phải vấn đề (ảnh hưởng

liên cần xử quan đến chức đến hoạt động tìm kiếm nhân

năng sử dụng) sự như thế nào)

1

2

3

2.5 Đánh giá, kiến nghị khác:

XIN CẢM ƠN SỰ ĐÓNG GÓP TÍCH CỰC CỦA ANH/CH

184

PHỤ LỤC 4

MỘT SỐ SƠ ĐỒ TRONG PHÂN TÍCH THIẾT KẾ HỆ THỐNG

1. Chức năng của hệ thống

Sơ đồ phân cấp chức năng của hệ thống

Sơ đồ phân cấp chức năng của hệ thống tìm kiếm chuyên gia

185

Hệ thống có các chức năng chính sau:

Các chức năng của hệ thống tìm kiếm chuyên gia cho DNNVV

STT Tên chức năng

Mô tả

1

Đăng ký

Người dùng (Doanh nghiệp và Chuyên gia) phải đăng ký thông tin mới có thể thực hiện một số chức năng bên trong hệ thống.

2

Đăng nhập

Chức năng này cho phép người dùng có thể vào hệ thống thông qua tài khoản đã đăng ký để thực hiện các chức năng của họ.

3

Cập nhật tài khoản

Chức năng này giúp người dùng có thể cập nhật lại thông tin tài khoản của mình nếu có sự thay đổi.

4

Chuyển đổi ngôn ngữ

Ngoài tiếng Việt, hệ thống còn hỗ trợ ngôn ngữ tiếng Anh. Người dùng có thể tùy chọn ngôn ngữ sử dụng phù hợp, lúc này hệ thống sẽ tiến hành chuyển đổi từ ngôn ngữ mặc định của hệ thống sang ngôn ngữ người dùng đã chọn.

5

Tìm kiếm chuyên gia

Người dùng có thể tìm kiếm thông tin về chuyên gia theo một số tiêu chí mà hệ thống đưa sẵn (Tìm theo lĩnh vực hoạt động/ Tìm theo khu vực sinh sống, v.v.). Nhập từ khoá vào ô tìm kiếm, click vào nút Tìm kiếm, hệ thống sẽ trả về thông tin về những chuyên gia liên quan nhất đến từ khoá.

6

Xem thông tin chuyên gia

Trong danh sách các chuyên gia có sẵn trên hệ thống, người dùng có thể xem chi tiết thông tin về từng chuyên gia mà mình quan tâm.

7

Danh sách chuyên gia hàng đầu

Người dùng cũng có thể xem danh sách các chuyên gia hàng đầu theo lĩnh vực, danh sách này được xếp hạng theo tiêu chí mà hệ thống đề xuất.

8

Hỏi chuyên gia

Người dùng khi có một vấn đề hoặc câu hỏi ngắn cần được giải đáp, sẽ tiến hành nhập câu hỏi vào phần textbox. Sau đó, ấn nút “Gửi câu hỏi”,

câu hỏi sẽ được gửi lên hệ thống xét duyệt.

9

Đặt hàng chuyên gia

Người dùng (DN) sẽ gửi yêu cầu về công việc mà mình đang muốn tìm người vào phần Đặt hàng. Sau đó gửi yêu cầu đặt hàng lên hệ thống xét duyệt. Hệ thống sẽ duyệt yêu cầu đặt hàng, sau đó xác định xem những chuyên gia nào trong cùng lĩnh vực sẽ phù hợp với yêu cầu đó và gửi yêu cầu đến chuyên gia.

10

Trả lời câu hỏi

Chuyên gia khi đọc được một câu hỏi nào đó, nếu thấy có thể trả lời được thì sẽ hồi đáp bằng cách ấn vào nút “Trả lời”. Hệ thống sẽ hiện ra một ô Textbox để nhập nội dung. Sau đó ấn nút “Gửi”, hệ thống sẽ tiến hành xét duyệt và đăng thông tin.

186

11

Giới thiệu chuyên gia

Khi đọc được một yêu cầu đặt hàng của DN, chuyên gia có thể giới thiệu một chuyên gia khác (người mà mình biết) vào vị trí đó, bằng cách ấn vào nút “đề xuất chuyên gia”. Đề xuất này sẽ gửi lên hệ thống xét duyệt (hoặc gửi trực tiếp đến tài khoản của Khách hàng có yêu cầu, ví dụ vào mục “inbox”).

12

Nhận yêu cầu đặt hàng

Khi đọc được một yêu cầu đặt hàng của khách hàng, nếu thấy phù hợp, chuyên gia có thể nhận yêu cầu này bằng cách ấn vào nút “Nhận yêu cầu”.

13

Tin tức, sự kiện

Hiển thị các tin tức, sự kiện đã, đang và sắp diễn ra quanh thời điểm hiện tại có liên quan đến các chuyên gia.

14 Bản đồ chuyên gia Hiển thị vị trí của chuyên gia trên bản đồ.

15

Quản lý tài khoản

Chức năng này cho phép quản trị viên có thể quản lý tài khoản người dùng, bao gồm thêm tài khoản, cập nhật thông tin tài khoản khi người dùng thay đổi và xóa tài khoản.

Ở chức năng này:

16

- Quản trị viên có thể thêm mới một chuyên gia (nếu thông tin chuyên gia không được lấy tự động), chỉnh sửa thông tin chuyên gia, duyệt các bài trả lời, hoặc giới thiệu chuyên gia và xóa thông tin chuyên gia khi không còn phù hợp.

Quản lý hồ sơ chuyên gia

- Chuyên gia có thể đăng thông tin cá nhân của mình lên hệ thống theo

Form sẵn mà hệ thống đưa ra. Sau đó ấn nút “Gửi”, hệ thống sẽ tiến hành xét duyệt và đăng thông tin. Đồng thời có thể chỉnh sửa hoặc xoá thông tin chuyên gia.

17

Quản lý yêu cầu khách hàng

Chức năng này cho phép quản trị viên có thể quản lý các thông tin liên quan đến các yêu cầu mà khách hàng gửi lên hệ thống, bao gồm: Duyệt bài hỏi đáp, duyệt yêu cầu đặt hàng chuyên gia.

18

Báo cáo thống kê

Quản trị viên có thể tìm kiếm các thông tin để báo cáo thống kê khi cần thiết (ví dụ báo cáo về số lượng người dùng đang truy cập hệ thống, số chuyên gia hiện có trên hệ thống, số yêu cầu đặt hàng của khách hàng,…)

2. Các tác nhân ngoài

● Người dùng (User): Bao gồm tất cả các loại người dùng hệ thống như: Khách

vãng lai, Doanh nghiệp, Chuyên gia, v.v.

● Doanh nghiệp: Tìm kiếm và xem thông tin chuyên gia, đặt câu hỏi và đặt hàng

chuyên gia.

187

gia, trả lời câu hỏi, nhận đặt hàng của ● Chuyên gia: Tạo hồ sơ chuyên

khách và giới thiệu chuyên gia khác.

● Quản trị viên: Quản lý các tài khoản của người dùng (thêm, sửa, xóa tài khoản), quản lý hồ sơ chuyên gia, quản lý yêu cầu khách hàng, quản lý Tin

tức - Sự kiện - và báo cáo thống kê.

3. Biểu đồ use case

a) Các use case của hệ thống

● Đăng ký

● Đăng nhập

● Cập nhật tài khoản

● Chuyển đổi ngôn ngữ

● Tìm kiếm chuyên gia

● Xem thông tin chuyên gia

● Hỏi chuyên gia

● Trả lời câu hỏi

● Đặt hàng chuyên gia

● Nhận yêu cầu đặt hàng

● Giới thiệu chuyên gia

● Hợp tác chuyên gia

● Tin tức, sự kiện

● Bản đồ chuyên gia

● Quản lý thông tin tài khoản

● Quản lý hồ sơ chuyên gia

● Quản lý yêu cầu khách hàng

● Báo cáo thống kê

Hệ thống tìm kiếm chuyên gia cho DNNVV Việt Nam có những chức năng chính sau:

b) Đặc tả các Use Case và biểu đồ của hệ thống

● Biểu đồ Use Case tổng quát của hệ thống

188

Biểu đồ Use Case tổng quát của hệ thống

189

4. Thiết kế Cơ sở dữ liệu

Do dữ liệu được lưu trữ trên MongoDB một dạng lưu trữ theo kiểu tài liệu, nên sẽ không còn dạng bảng và hàng như trong CSDL quan hệ, mà thay vào đó là Collection (tập hợp)

và các document (tài liệu) được lưu trữ dưới dạng JSON.

Dưới đây là những collection và document được lưu trữ trong MongoDB phục vụ cho

việc lưu trữ dữ liệu trong hệ thống thử nghiệm.

Collection thông tin chuyên gia và vị trí địa lý

190

Collection Khách

Collection Đặt hàng chuyên gia

191

Collection Sự kiện

192

Collection Đặt câu hỏi – Trả lời

Collection Tin tức

193

Collection Lĩnh vực hoạt động

Collection Xếp hạng

194

Collection Công ty/Tổ chức

Collection Trường đại học

195

Thống kê số lượng chuyên gia được thu thập

- Dữ liệu về chuyên gia thu thập từ các nguồn, sau đó được làm sạch, chuẩn hoá và lưu trữ trong file JSON phục vụ cho các hoạt động tìm kiếm. Đường dẫn file:

- Thống kê số lượng chuyên gia được thu thập dựa theo nơi công tác

https://github.com/lethu86/ESSME/blob/main/Expert_VN.json

196

5. Giao diện hệ thống

- Trang chủ

Giao diện trang chủ (phần 2)

197

Giao diện trang chủ (phần 3)

- Trang thông tin chuyên gia

Trang thông tin chi tiết chuyên gia

198

- Chức năng: Hỏi đáp chuyên gia

Trang tổng hợp thông tin Hỏi đáp chuyên gia

- Chức năng: Đặt hàng chuyên gia

Trang thông tin Đặt hàng chuyên gia

199

- Chức năng: Đặt câu hỏi với chuyên gia

Trang thông tin Đặt câu hỏi chuyên gia

- Chức năng: Bản đồ chuyên gia

Trang thông tin Bản đồ chuyên gia

200

PHỤ LỤC 5

MỘT SỐ KẾT QUẢ CHẠY THỬ NGHIỆM CHỨC NĂNG XẾP HẠNG

Kết quả đánh giá ba độ đo: MSE, MAE và R2 với bộ dữ liệu ban đầu

Kết quả đánh giá ba độ đo: MSE, MAE và R2 với bộ dữ liệu hai (bộ dữ liệu một + Cơ sở tri thức)

201

Bảng xếp hạng chuyên gia với bộ dữ liệu ban đầu:

Bảng xếp hạng chuyên gia với bộ dữ liệu thứ hai:

202