intTypePromotion=1

Làm giàu thông tin kho dữ liệu tài sản thông qua dữ liệu tri thức trực tuyến

Chia sẻ: Nguyễn Đức Nghĩa | Ngày: | Loại File: PDF | Số trang:3

0
24
lượt xem
0
download

Làm giàu thông tin kho dữ liệu tài sản thông qua dữ liệu tri thức trực tuyến

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài báo này đề xuất một mô hình để xây dựng một hệ thống và kết nối đến kho dữ liệu tri thức trực tuyến để làm giàu thêm thông tin về tài sản nhằm nâng cao công tác quản lý và vận hành các tài sản trong Trường cho hiệu quả.

Chủ đề:
Lưu

Nội dung Text: Làm giàu thông tin kho dữ liệu tài sản thông qua dữ liệu tri thức trực tuyến

8<br /> Journal of Transportation Science and Technology, Vol 21, Nov 2016<br /> <br /> <br /> LÀM GIÀU THÔNG TIN KHO DỮ LIỆU TÀI SẢN THÔNG QUA<br /> DỮ LIỆU TRI THỨC TRỰC TUYẾN<br /> ENRICHING PROPERTY DATA WAREHOUSE BY MEANS OF ONLINE<br /> KNOWLEDGE DATA<br /> Lê Quốc Tuấn1, Bùi Dương Thế2<br /> 1<br /> Khoa Công nghệ thông tin – Đại học Giao thông vận tải Tp. Hồ Chí Minh<br /> 2<br /> Trung tâm Dữ liệu và CNTT – Đại học Giao thông vận tải Tp. Hồ Chí Minh<br /> Tóm tắt: Hiện nay, việc quản lý danh mục tài sản tại Trường Đại học Giao thông vận tải Thành<br /> phố Hồ Chí Minh (ĐH GTVT TP.HCM) vẫn dùng dưới dạng thủ công thông qua sổ sách và lưu dữ<br /> liệu dạng bảng Excel, do vậy rất khó khăn cho việc tra cứu thông tin, chuyển thiết bị từ nơi này qua<br /> nơi khác, theo dõi để thanh lý, nhất là các danh mục thiết bị có nhiều thành phần cấu thành như máy<br /> tính. Bài báo này đề xuất một mô hình để xây dựng một hệ thống và kết nối đến kho dữ liệu tri thức<br /> trực tuyến để làm giàu thêm thông tin về tài sản nhằm nâng cao công tác quản lý và vận hành các tài<br /> sản trong Trường cho hiệu quả.<br /> Từ khóa: Kho dữ liệu tri thức, dữ liệu liên kết, hệ hỗ trợ ra quyết định, hệ tư vấn.<br /> Abstract:. Property portfolio at University of Transport in Ho Chi Minh city is currently being<br /> managed by means of books and Excel, which makes it difficult to look up property-related<br /> information, to transfer property from one place to another or to follow the property up for<br /> liquidation. It is even more difficult if the property is multi - component equipment like computers.<br /> This paper is meant to propose a model that can link to knowlegde database to enrich information<br /> which is specially made to improve the efficiency of the property management and operation at the<br /> university.<br /> Keywords: Knowlegde database, linked data, making a decision system, recommender system.<br /> 1. Giới thiệu quan hệ và thuộc tính liên quan đến tài<br /> Ngày nay, Internet đã phát triển rộng nguyên Wikipedia, bao gồm các liên kết tới<br /> khắp và mang tính toàn cầu. Nó mang lại các dữ liệu liên kết. DBpedia được mô tả bởi Tim<br /> lợi ích lớn về mọi mặt. Nên dần dần các ứng Berners - Lee là một phần nổi tiếng của dự<br /> dụng chạy trên nền web ngày càng thay thế án dữ liệu liên kết.<br /> dần các ứng dụng chạy tại máy tính cá nhân, 2.2. Ngôn ngữ truy vấn SPARQL<br /> đáp ứng được nhu cầu sử dụng mọi lúc mọi SPARQL [5] là ngôn ngữ truy vấn có<br /> nơi thông qua môi trường Internet. Trong bài tính chất đồ thị giúp chia sẻ thông tin dữ liệu<br /> báo này, chúng tôi đề xuất một mô hình cho theo hướng thông minh. Đây là ngôn ngữ<br /> quản lý tài sản và xây dựng hệ thống quản lý được Wikipedia đang sử dụng. Khi nghiên<br /> tài sản cho Trường ĐH GTVT TP.HCM. Hệ cứu web ở tầm cao, vấn đề gặp phải là làm<br /> thống này được kết nối trực tiếp đến kho tri sao để các hệ thống web hiểu được ngôn ngữ<br /> thức [1, 2] nhằm làm giàu thêm thông tin cho cấu trúc thông tin để đưa ra kết quả cuối<br /> kho dữ liệu tài sản giúp cho việc tổ chức, cùng.<br /> quản lý và tra cứu tài sản tiện lợi.<br /> 2. Cơ sở lý thuyết và các vấn đề liên<br /> quan<br /> 2.1. Kho dữ liệu tri thức DBpedia<br /> DBpedia [3] là một dự án nhắm đến việc<br /> trích xuất dữ liệu cấu trúc từ các thông tin<br /> được tạo nên từ một phần của dự án<br /> Wikipedia. Cấu trúc thông tin này được xây<br /> dựng sẵn có trên World Wide Web [4].<br /> Hình 1. Thể hiện truy vấn về tên và email của một<br /> DBpedia cho phép người dùng truy vấn các người trong tập dữ liệu.<br /> 9<br /> TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 21-11/2016<br /> <br /> <br /> Như vậy thông thường chúng ta có cơ sở viện [7] cho phép các bệnh viện quản lý tài<br /> dữ liệu SQL, MySQL. Nên người ta chuyển sản thiết bị một cách dễ dàng. Với nhiều<br /> về dạng XML, JSON, JSONP nhằm giúp các chức năng hữu dụng và tiện lợi trong việc<br /> web khác có thể lấy thông tin, từ đó xây quản lý và vận hành như: nhật ký luân<br /> dựng nên các dòng ngôn ngữ truy vấn lấy tin chuyển tài sản, theo dõi tình trạng tài sản.<br /> ở các server khác. Có nhiều phương pháp Phần mềm quản lý tài sản thiết bị<br /> khác nhau để lấy dữ liệu này như Web CNS.IMS [8] và (ATS.NET) [9] được thiết<br /> Service, RSS, bóc tách HTML, 3 phương kế nhằm tăng hiệu quả khai thác tài sản của<br /> pháp này vẫn chưa đủ tầm để chia sẻ dữ liệu tổ chức, doanh nghiệp giúp nâng cao hiệu<br /> thông minh. Sau đó người ta phát triển rất quả hoạt động sản xuất kinh doanh, giảm chi<br /> nhiều phương pháp như: JSON/JSONP, phí, bảo vệ đầu tư và tăng khả năng cạnh<br /> AJAX Cross-domain, SPARQL, Web tranh của tổ chức, doanh nghiệp.<br /> Semantic, ... để đảm bảo chia sẻ dữ liệu với Các hệ thống này đều đáp ứng tốt nhu<br /> nhau với dạng tối ưu nhất. cầu quản lý theo từng đơn vị nhưng chỉ hoạt<br /> Ví dụ như khi tìm kiếm cụm từ Việt động độc lập của mỗi đơn vị. Hệ thống quản<br /> Nam trên wikipedia thì sẽ trỏ về các cơ sở dữ lý tài sản mà chúng tôi phát triển sẽ kết nối<br /> liệu đặt tại server khác nhau như: Địa lý Việt đến kho dữ liệu tri thức trực tuyến để làm<br /> Nam, con người Việt Nam, ngôn ngữ Việt giàu thêm thông tin các tài sản mà Nhà<br /> Nam và từ đó thu thập thành thông tin là bài trường quản lý.<br /> viết về Việt Nam.<br /> 3. Mô hình quản lý tài sản<br /> 2.3. Dữ liệu liên kết Hệ thống quản lý tài sản là hệ thống<br /> Dữ liệu liên kết (linked data) [6] mô tả thông tin chạy trên nền Web. Với hệ thống<br /> một phương thức tạo ra dữ liệu có cấu trúc để này, Nhà trường có thể quản lý tất cả các loại<br /> liên kết được với nhau và trở nên có ích. Dữ tài sản thiết bị trong Trường.<br /> liệu liên kết được xây dựng dựa trên các tiêu<br /> chuẩn công nghệ Web như HTTP và URI để<br /> mở rộng khả năng chia sẻ thông tin theo cách<br /> có thể được đọc tự động từ các máy. Điều<br /> này cho phép các nguồn tài nguyên khác<br /> nhau được kết nối và truy vấn.<br /> <br /> <br /> <br /> <br /> Hình 3. Mô hình tổng quan về hệ thống.<br /> Quản lý đơn vị cung cấp: Các đơn vị<br /> cung cấp tài sản cho nhà trường đều được hệ<br /> thống lưu lại. Việc này sẽ rất hữu ích cho<br /> phân tích thống kê, đánh giá năng lực, uy tín<br /> cũng như các dịch vụ chăm sóc khách hàng.<br /> Quản lý hãng sản xuất: Mỗi tài sản đều<br /> Hình 2. Thể hiện mối liên kết trong tập dữ liệu liên có thương hiêu của các nhà sản xuất. Thông<br /> kết. tin dữ liệu này cũng được đưa vào hệ thống<br /> 2.4. Các vấn đề liên quan để phân tích đánh giá.<br /> Trong phần này, chúng tôi sẽ trình bày Quản lý tài sản: Các loại danh mục tài<br /> các hệ thống liên quan đến hệ thống mà các sản được định nghĩa và tổ chức quản lý. Các<br /> nhóm đang phát triển để có sự so sánh với tài sản phải được phân nhóm để thuận tiện<br /> mô hình hiện tại của Trường ĐH GTVT trong quản lý và thống kê báo cáo sau này.<br /> TP.HCM. Phần mềm quản lý tài sản bệnh<br /> 10<br /> Journal of Transportation Science and Technology, Vol 21, Nov 2016<br /> <br /> <br /> Quản lý các đơn vị sử dụng tài sản: Mỗi Hệ thống đã hoạt động tốt và sử dụng rất<br /> tài sản sẽ được gán cho một đơn vị sử dụng tiện lợi. Muốn biết thông tin tài sản của đơn<br /> trong nhà trường. vị nào là có được thống kê nhanh chóng. Đặc<br /> Phân tích thống kê báo cáo: Cung cấp biệt thông tin lưu lại lịch sử của tài sản giúp<br /> một số mẫu báo cáo giúp cho việc quản lý các đơn vị sử dụng cũng như đơn vị quản lý<br /> nhanh chóng có số liệu để đưa ra các quyết hiểu rất rõ về những tài sản đó.<br /> định đầu tư, mua sắm, thay thế. 4. Kết luận<br /> 3.1. Quản lý dữ liệu tài sản Bài báo đã đề xuất được mô hình và xây<br /> dựng được một hệ thống quản lý tài sản thiết<br /> bị cho Trường ĐH GTVT TP.HCM. Hệ<br /> thống đáp ứng được tính đặc thù của Trường<br /> và sẽ được xây dựng dựa trên những nhu cầu<br /> của Nhà trường và xã hội. Về cơ bản, hệ<br /> thống có thể đưa vào sử dụng chính thức.<br /> Tuy nhiên, hệ thống quản lý tài sản này<br /> vẫn còn nhiều hướng có thể được mở rộng<br /> và phát triển thêm nhằm đáp ứng nhu cầu<br /> hiện tại tốt nhất. Dưới đây là một vài đề xuất<br /> để có thể mở rộng cho hệ thống:<br /> - Quản lý thiết bị theo mã vạch.<br /> - Phân cấp quản lý xuống từng đơn vị cơ<br /> sở trực thuộc trong Nhà trường. Cho phép<br /> Hình 4. Một truy vấn đến thiết bị Dell Vostro. báo hư báo hỏng trên hệ thống này.<br /> Chúng tôi đã nhập tất cả những thông tin - Bổ sung thêm quản lý tài sản cố định.<br /> liên quan vào hệ thống để xây dựng kho dữ<br /> Bài báo là kết quả của đề tài “Xây dựng<br /> liệu. Tất cả các tài sản được đưa vào hệ thống<br /> phần mềm quản lý tài sản cho Trường ĐH<br /> này (trừ tài sản cố định).<br /> GTVT TP.HCM” mã số KH14202<br /> Khi mỗi tài sản được đưa vào hệ thống,<br /> chúng tôi xác định những thành phần chính Tài liệu tham khảo<br /> [1] Mahdisoltani, F., J. Biega, and F. Suchanek. Yago3: A<br /> của tài sản này. Những thành phần này sẽ knowledge base from multilingual wikipedias. in 7th<br /> được kết nối đến các kho dữ liệu tri thức như Biennial Conference on Innovative Data Systems<br /> Yago3 hay BDPedia để có thêm thông tin về Research. 2014. CIDR Conference.<br /> [2] https://www.wikipedia.org/.<br /> tài sản này khi cần thiết.<br /> [3] "Dbpedia.org on Alexa". Alexa Internet. Amazon.com.<br /> 3.2. Phân tích và đánh giá Retrieved 7 September 2016.<br /> [4] Bizer, C., et al., DBpedia-A crystallization point for the<br /> Chúng tôi đã dùng dữ liệu thật của Web of Data. Web Semantics: science, services and<br /> Trường ĐH GTVT TP.HCM tính đến thời agents on the world wide web, 2009. 7: p. 154-165.<br /> điểm hiện nay. Tất cả những dữ liệu này [5] https://www.w3.org/TR/rdf-sparql-query/.<br /> đang được quản lý bằng file excel nên chúng [6] Bizer, C., T. Heath, and T. Berners-Lee, Linked data-<br /> the story so far. Semantic Services, Interoperability and<br /> tôi đã thực hiện việc nhập liều bằng tay để Web Applications: Emerging Concepts, 2009: p. 205-<br /> đưa vào hệ thống. 227.<br /> [7] http://www.cntt.ykhoa.net/phanmem/35_taisan.htm.<br /> Dữ liệu này đã được phân thành nhiều [8] http://cns.net.vn.<br /> nhóm chức năng khác nhau như: Máy chiếu; [9] http://phanmemvcs.com/SanPham.aspx?Id=1<br /> máy tính để bàn; máy tính sách tay; bàn làm<br /> Ngày nhận bài: 3/10/2016<br /> việc; ghế làm việc; máy lạnh... Nếu việc phân Ngày chuyển phản biện: 6/10/2016<br /> nhóm này càng chi tiết và càng đúng tính Ngày hoàn thành sửa bài: 27/10/2016<br /> chất của công việc thì hệ thống càng phát huy Ngày chấp nhận đăng: 3/11/2016<br /> được những ưu điểm của nó.<br />
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2