3<br />
TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016<br />
<br />
<br />
ĐỀ XUẤT MÔ HÌNH TỔ CHỨC QUẢN LÝ KHO DỮ LIỆU CÔNG<br />
TRÌNH KHOA HỌC VÀ CÔNG NGHỆ TẠI TRƯỜNG ĐẠI HỌC<br />
GIAO THÔNG VẬN TẢI THÀNH PHỐ HỒ CHÍ MINH<br />
PROPOSED ORGANIZATIONAL MODEL DATA STORAGE MANAGEMENT<br />
PROJECTS THE SCIENCE AND TECHNOLOGY IN HO CHI MINH CITY<br />
UNIVERSITY OF TRANSPORT<br />
Vũ Ngọc Bích(1), Đặng Nhân Cách(2), Hồ Hải Vinh(3)<br />
(1), (3)<br />
Phòng Khoa học công nghệ - Nghiên cứu và Phát triển<br />
(2)<br />
Trung tâm Dữ liệu và Công nghệ thông tin<br />
Tóm tắt: Trong những năm qua, công tác nghiên cứu khoa học, xuất bản tạp chí, viết giáo giáo<br />
trình của Trường Đại học Giao thông vận tải Thành phố Hồ Chí Minh đã có những đóng góp đáng kể<br />
vào giải quyết các nhu cầu thực tiễn của Nhà trường, địa phương cũng như Bộ - Ngành. Tuy nhiên,<br />
việc tổ chức quản lý và vận hành chưa hiệu quả. Chúng ta đang lưu trữ bằng file và rải rác ở các đơn<br />
vị khác nhau. Bài viết đề xuất một giải pháp đề xây dựng kho dữ liệu tập trung về quản lý khoa học và<br />
đề xuất một hệ thống để quản lý và vận hành công tác quản lý khoa học công nghệ. Tác giả cũng đề<br />
xuất một số giải pháp để phân tích khai phá kho dữ liệu đề xuất ở trên để nhằm nâng cao chất lượng<br />
công tác nghiên cứu khoa học trong Nhà trường phù hợp với nhu cầu thực tiễn.<br />
Từ khóa: Kho dữ liệu, khai phá dữ liệu, hệ hỗ trợ ra quyết định, hệ tư vấn.<br />
Abstract: Scientific research in universities is among the criteria for assessing the quality of<br />
higher education, especially in the current context. Over the years, the scientific research activity of<br />
Ho Chi Minh City University of Transport has made a significant contribution to solving the practical<br />
needs of The university, locality as well as ministries - sectors. However, the quantity of research<br />
works hasn’t been corresponding to the potential of our teaching staff, students, and graduate<br />
students. Also, the quality of the studies doesn’t satisfy our desire. The paper outlines the current<br />
status of the scientific research activity at Ho Chi Minh City University of Transport, analyze the<br />
causes, and propose some solutions in order to improve the quality of the scientific research activity at<br />
the university in accordance with practical needs.<br />
Keywords: Data warehouse, data mining, making a decision system, recommender system.<br />
<br />
1. Giới thiệu để nhằm nâng cao chất lượng công tác<br />
Trong những năm qua, công tác nghiên nghiên cứu khoa học trong Nhà trường phù<br />
cứu khoa học, xuất bản tạp chí, viết giáo hợp với nhu cầu thực tiễn.<br />
trình của Trường Đại học Giao thông vận tải 2. Cơ sở lý thuyết và các vấn đề liên<br />
Thành phố Hồ Chí Minh đã có những đóng quan<br />
góp đáng kể vào giải quyết các nhu cầu thực 2.1. Kho dữ liệu<br />
tiễn của Nhà trường, địa phương cũng như Kho dữ liệu (Data Warehouse - DW) là<br />
Bộ - Ngành. Chiến lược phát triển dài hạn hệ thống cơ sở dữ liệu (kho dữ liệu) máy tính<br />
(2010 - 2020) và tầm nhìn đến năm 2030 [1] được thiết kế, sắp xếp có mục đích và định<br />
và bài báo [2] cũng đã xác định Nhà trường hướng rõ ràng của một tổ chức nhằm mục<br />
cần tăng cường công tác nghiên cứu khoa đích quản lý, cung cấp thông tin một cách kịp<br />
học (NCKH) và quản lý khoa học. Tuy thời, chính xác, đồng thời là nền tảng cho<br />
nhiên, hiện này, việc tổ chức quản lý và vận việc xây dựng các ứng dụng phân tích dữ<br />
hành là chưa hiệu quả. liệu, hỗ trợ ra quyết định [3].<br />
Bài viết đề xuất một giải pháp để xây Theo John Ladley [4], Công nghệ kho<br />
dựng kho dữ liệu tập trung về quản lý khoa dữ liệu (Data Warehouse Technology) là tập<br />
học và đề xuất một hệ thống để quản lý - vận các phương pháp, kỹ thuật và các công cụ có<br />
hành công tác quản lý khoa học công nghệ. thể kết hợp, hỗ trợ nhau để cung cấp thông<br />
Tác giả cũng đề xuất một số giải pháp để tin cho người sử dụng trên cơ sở tích hợp từ<br />
phân tích khai phá kho dữ liệu đề xuất ở trên<br />
4<br />
Journal of Transportation Science and Technology, Vol 20, Aug 2016<br />
<br />
<br />
nhiều nguồn dữ liệu, nhiều môi trường khác 1, 2, 3, 4 và 5), phần nào đáp ứng được nhu<br />
nhau. cầu của ngành giao thông vận tải, mặt khác<br />
Trong những năm qua, đặc biệt trong đã góp phần giải quyết một số vấn đề trong<br />
giai đoạn 2011 - 2015, công tác NCKH của công tác giảng dạy và học tập cũng như hợp<br />
Nhà trường đã đạt được những kết quả đáng tác, liên kết quốc tế trong đào tạo của Nhà<br />
khích lệ cả về số lượng và chất lượng (bảng trường.<br />
Bảng 1. Số lượng đề tài NCKH giai đoạn 2011-2015.<br />
Loại đề tài NCKH/Dự án<br />
Năm<br />
Cấp Bộ Cấp Cơ sở Sinh viên<br />
2011 07 14 14<br />
2012 07 15 16<br />
2013 08 24 17<br />
2014 06 12 24<br />
2015 05 39 16<br />
Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.<br />
Bảng 2. Số cán bộ giảng viên, người học tham gia NCKH giai đoạn 2011-2015.<br />
Loại đề tài NCKH/Dự án<br />
Năm<br />
Cấp Bộ Cấp Cơ sở Sinh viên<br />
2011 85 70 56<br />
2012 80 75 62<br />
2013 96 120 66<br />
2014 76 36 70<br />
2015 68 103 58<br />
Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.<br />
Bảng 3. Số bài báo khoa học công bố trên các Tạp chí/Hội nghị, hội thảo khoa học giai đoạn 2011-2015.<br />
<br />
Số bài báo khoa học đăng trên tạp chí Số bài báo khoa học đăng trong kỷ<br />
Năm khoa học chuyên ngành yếu hội nghị, hội thảo<br />
<br />
Quốc tế Quốc gia Quốc tế Quốc gia<br />
2011 08 46 14 05<br />
2012 08 51 8 13<br />
2013 13 89 18 68<br />
2014 17 102 13 79<br />
2015 23 91 15 105<br />
Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.<br />
Bảng 4. Số giáo trình, bài giảng đăng ký biên soạn giai đoạn 2011-2015.<br />
Loại giáo trình/bài giảng<br />
Năm Tài liệu tham khảo/bài<br />
Giáo trình Bài giảng<br />
tập<br />
2011 10 02 01<br />
2012 08 05 -<br />
2013 04 07 -<br />
2014 14 28 01<br />
2015 13 18 01<br />
Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.<br />
5<br />
TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016<br />
<br />
Bảng 5. Số lượng bài báo đăng trên tạp chí, ấn phẩm xuất bản có chỉ số, giai đoạn 2011-2015.<br />
Loại ấn phẩm<br />
Năm Kỷ yếu hội nghị có chỉ số Kỷ yếu hội nghị không có<br />
Tạp chí<br />
ISBN chỉ số ISBN<br />
2011 19 - -<br />
2012 101 - -<br />
2013 118 - 81<br />
2014 106 - -<br />
2015 76 45 -<br />
Nguồn: Báo cáo thống kế - phòng KHCN-NC&PT.<br />
Việc quản lý các đề tài, bài báo, giáo Quá trình khai thác tri thức không chỉ là<br />
trình, tài liệu tham khảo hiện nay chủ yếu là một quá trình tuần tự từ bước đầu tiên đến<br />
trên bản cứng, các thông tin đăng tải trên bước cuối cùng mà là một quá trình lặp và có<br />
mạng nội bộ mới chỉ dừng lại ở mức thống quay trở lại các bước đã qua.<br />
kê. Với tốc độ phát triển ngày càng nhiều đề 3. Mô hình quản lý khoa học công<br />
tài, công trình nghiên cứu,… thì việc quản lý nghệ<br />
và triển khai, khai thác như hiện tại là không 3.1. Kho dữ liệu Kho dữ liệu<br />
đáp ứng được nhu cầu thực tiễn, mặt khác<br />
Chúng tôi đã thiết kế mô hình kho dữ<br />
việc truy xuất dữ liệu phục vụ báo cáo về<br />
liệu KHCN có cấu trúc, dựa trên những dữ<br />
khoa học công nghệ là tốn khá nhiều thời<br />
liệu đang có sẵn của Nhà trường và đưa tất cả<br />
gian, bất tiện, không khoa học. Vì vậy, việc<br />
tập trung vào kho dữ liệu này. Tất cả những<br />
xây dựng kho dữ liệu tập trung về quản lý<br />
yêu cầu truy xuất đến dữ liệu của kho dữ liệu<br />
KHCN là nhu cầu tất yếu để khắc phục<br />
sẽ cho kết nối theo chuẩn quy định. Ngoài<br />
những hạn chế ở trên.<br />
bốn mô đun chức năng đã được thiết kế để<br />
2.2. Khai phá dữ liệu luôn phục vụ cho công tác quản lý khoa học<br />
Khai phá dữ liệu (Data mining) [5] là chúng tôi còn tạo ra những cổng giao tiếp<br />
quá trình khám phá các tri thức mới và các tri riêng cho phép những ứng dụng khác có thể<br />
thức có ích ở dạng tiềm năng trong nguồn dữ kết nối vào để truy vấn dữ liệu.<br />
liệu đã có. Khai phá dữ liệu là một bước của<br />
quá trình khai thác tri thức (Knowledge<br />
Discovery Process), bao gồm:<br />
- Xác định vấn đề và không gian dữ liệu<br />
để giải quyết vấn đề (Problem understanding<br />
and data understanding).<br />
- Chuẩn bị dữ liệu (Data preparation),<br />
bao gồm các quá trình làm sạch dữ liệu (data<br />
cleaning), tích hợp dữ liệu (Data integration),<br />
chọn dữ liệu (Data selection), biến đổi dữ<br />
liệu (Data transformation).<br />
- Khai thác dữ liệu (Data mining): Xác<br />
định nhiệm vụ khai thác dữ liệu và lựa chọn<br />
kỹ thuật khai thác dữ liệu. Kết quả cho ta một Hình 1. Mô hình kho dữ liệu KHCN.<br />
nguồn tri thức thô. 3.2. Hệ thống quản lý KHCN<br />
- Đánh giá (Evaluation): Dựa trên một số - Quản lý đề tài: Cho phép quản lý tất<br />
tiêu chí tiến hành kiểm tra và lọc nguồn tri cả các loại đề tài của CB - CNV trong trường<br />
thức thu được. như: Đề tại cấp sơ cở; đề tại cấp bộ; đề tài<br />
- Triển khai (Deployment). cấp nhà nước….Chức năng này hỗ trợ rất tốt<br />
6<br />
Journal of Transportation Science and Technology, Vol 20, Aug 2016<br />
<br />
<br />
cho phép chọn lọc những đề tài đã nghiệm Nếu chúng ta thực hiện đồng bộ các giải<br />
thu, hay chưa nghiệm thu… pháp như đã nêu thì chắc chắn, bức tranh<br />
- Quản lý tạp chí: Tất cả các bài báo KHCN của Trường ta sẽ ngày càng sáng nét<br />
trong các số tạp chí đều được tổ chức quản lý hơn; những kết quả mà NCKH và chuyển<br />
theo từng số xuất bản của tạp chí theo định giao công nghệ tạo ra sẽ chắc chắn có chất<br />
kỳ. Từ đó, dễ dàng tìm kiếm các bài báo cho lượng cao, đủ khả năng ứng dụng, góp phần<br />
những lúc cần thiết. giải quyết các vấn đề quan trọng của địa<br />
- Quản lý bài báo: Tất cả các bài báo phương, ngành, của quốc gia, mà trước mắt<br />
hội nghị, bài báo tạp chí trong nước hay quốc là góp phần đắc lực nâng cao công tác quản<br />
đề đều được tổ chức cập nhật thường xuyên lý KH CN của Nhà trường<br />
thông qua chức năng này. Tài liệu tham khảo<br />
- Quản lý giáo trình: Quản lý tất cả bài [1] Kế hoạch chiến lược phát triển dài hạn (2010-2020) và<br />
tầm nhìn đến năm 2030, Trường Đại học Giao thông<br />
giảng chi tiết hay giáo trình của Nhà trường vận tải Thành phố Hồ Chí Minh.<br />
nhằm phục vụ sinh viên… [2] Vũ Ngọc Bích, Hồ Hải Vinh, Nguyễn Hải Dương,<br />
.Nâng cao chất lượng công tác nghiên cứu khoa học<br />
3.3. Phân tích dữ liệu trong trường đại học Giao thông vận tải Tp. Hồ Chí<br />
Trên cơ sở các mô đun được thiết kế ở Minh, Tạp chí khoa học công nghệ giao thông vận tải,<br />
trên cho phép chúng ta tương tác qua kho dữ số 13, tháng 11/2014, trang 03-06.<br />
<br />
liệu như: Thêm, xóa sửa, cập nhật thông tin. [3] Nguyễn Vân Anh, Lê Vũ Toàn (2012), Tạp chí hoạt<br />
động khoa học –Bộ KH&CN, số ISSN 1859-4794, số<br />
Với dữ liệu ngày càng được cập nhật và thêm 635, tháng 4/2012, trang 57-60.<br />
vào, trên cơ sở đó, chúng ta có thể trích xuất [4] Bischoff, J. and T. Alexander, Data warehouse:<br />
và khai phá, phân tích dữ liệu để hỗ trợ ra practical advice from the experts1997: Prentice-Hall,<br />
quyết định hay đưa ra tư vấn cho những vấn Inc.<br />
đề liên quan đến công tác KHCN. Có thể dựa [5] https://vi.wikipedia.org/wiki/Khai_phá_dữ_lliệu<br />
trên những thuật toán và đưa ra những thống [6] https://en.wikipedia.org/wiki/Weka_(machine_lea<br />
kê phân tích tự động nhanh chóng. Hoặc rning).<br />
cũng có thể trích xuất ra và xử dụng những Ngày nhận bài: 25/07/2016<br />
công cụ hỗ trợ phân tích như Weka [6] để Ngày chuyển phản biện: 29/07/2016<br />
phân tích. Ngày hoàn thành sửa bài: 16/08/2016<br />
Ngày chấp nhận đăng: 23/08/2016<br />
4. Kết luận<br />
Trong bài báo này, tác giả đã giới thiệu<br />
được mô hình tổng quan trong việc quản lý<br />
và hoạt động KHCN của Nhà trường. Như:<br />
Xây dựng được kho dữ liệu KHCN tập trung;<br />
giới thiệu được hệ thống kết nối đến kho dữ<br />
liệu tập trung này và đưa ra một số giải pháp<br />
để phân tích khai phá dữ liệu khoa học nhằm<br />
phục vụ trong công tác của Nhà trường.<br />