intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn:Nghiên cứu web ngữ nghĩa và ứng dụng vào xử lý thông tin du lịch

Chia sẻ: Nhung Thi | Ngày: | Loại File: PDF | Số trang:26

186
lượt xem
52
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Web ngữ nghĩa (Sematic web) là một triển vọng đầy hứng thú, song nó vẫn chưa phải là một thực tế đối với các nhà nghiên cứu khi họ phải đối mặt với sự gia tăng nhanh chóng của lượng tài liệu chuyển giao trên Web – nhiều tài liệu sẵn có miễn phí và nhiều tài liệu lại chỉ có thể truy cập khi có sự ủy quyền hay cấp phép...

Chủ đề:
Lưu

Nội dung Text: Luận văn:Nghiên cứu web ngữ nghĩa và ứng dụng vào xử lý thông tin du lịch

  1. -1- B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG NGUY N TH THU H NG NGHIÊN C U WEB NG NGHĨA VÀ NG D NG VÀO X LÝ THÔNG TIN DU L CH Chuyên ngành: Khoa h c máy tính Mã s : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T ĐÀ N NG - 2011
  2. -2- Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS.TS. Lê Văn Sơn Ph n bi n 1: PGS. TS. Lê M nh Th nh Ph n bi n 2: TS. Nguy n T n Khôi Lu n văn ñư c b o v t i H i ñ ng ch m Lu n văn t t nghi p th c s k thu t t i Đ i h c Đà N ng vào ngày 18 tháng 06 năm 2011. * Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng - Trung tâm H c li u, Đ i h c Đà N ng.
  3. -3- M Đ U 1. Lý do ch n ñ tài Trong nh ng năm qua, s phát tri n c a World Wide Web c v n i dung, ngư i s d ng và nh ng c i ti n trong công ngh công c tìm ki m ñã hoàn toàn thay ñ i cách th c tri th c và thông tin ñư c thu th p và chia s . Thu th p thông tin chưa bao gi tr nên d dàng và r ng m cho ngư i s d ng như hi n nay, tuy nhiên v n còn m t s trư ng h p ñáng k các k t qu thu ñư c thông qua m t công c tìm ki m có ch a lư ng l n các k t qu không liên quan. Nguyên nhân xu t phát t chính s ñơn gi n c a web hi n t i, ñã c n tr s phát tri n thông tin c a nó. Trong mô hình này, các máy tính ch làm nhi m v g i nh n d li u và th hi n thông tin dư i d ng thô mà ch con ngư i m i ñ c hi u và x lý ñư c. XML ra ñ i và tr thành m t công c trao ñ i d li u gi a các h th ng, nâng cao s tích h p c a các ng d ng. Tuy nhiên, các gi i pháp d a trên XML cho quá trình tích h p c a các ng d ng và các h th ng chưa ñ , do d li u ñư c chuy n ñ i thi u mô t tư ng minh v ng nghĩa c a nó. Vì th , m t thách th c m i ñư c ñ t ra là làm th nào ñ khai thác ñư c thông tin trên Web m t cách hi u qu , mà c th là làm th nào ñ máy tính có th tr giúp x lý t ñ ng ñư c chúng. Nh ng n l c phát tri n g n ñây c a công ngh thông tin và truy n thông nh m gi i quy t nh ng v n ñ này, không ch ñ i v i thông tin h c thu t mà còn ñ i v i t t c các d ng d li u có th chuy n giao trên Web. Trong nh ng n l c phát tri n ñó, thì m i quan tâm phát tri n Web ng nghĩa là tr ng tâm c a Tim Berners-Lee và t ch c W3C. Theo Lee, “web ng nghĩa là s m r ng c a web thông thư ng mà trong ñó thông tin ñư c ñ nh nghĩa rõ ràng sao cho con ngư i và
  4. -4- máy tính có th cùng làm vi c v i nhau m t cách hi u qu hơn”. Web ng nghĩa ra ñ i là m t bư c ti n vư t b c d a vào kh năng làm vi c v i thông tin “thông minh” hơn thay vì ñơn thu n lưu tr thông tin. V i s l n m nh và kh năng lưu gi thông tin ng nghĩa, web ng nghĩa s tr thành m t th h web cho tương lai. Hi n nay, nư c ta, lĩnh v c du l ch là m t lĩnh v c r t nhi u ti m năng phát tri n, vi c ng d ng xây d ng web ng nghĩa v du l ch s r t giúp ích cho vi c trao ñ i và chia s thông tin du l ch trên Internet. Và ñó cũng là lý do tôi ch n ñ tài: “Nghiên c u Web ng nghĩa và ng d ng vào x lý thông tin du l ch”. 2. M c tiêu và nhi m v nghiên c u Lu n văn nghiên c u s d ng công ngh Web ng nghĩa làm ngôn ng mô hình hóa cho lĩnh v c du l ch; nghiên c u v RDF và RDF Schema; nghiên c u ontology và nh ng lý thuy t có liên quan ñ có th h tr trong vi c xây d ng ontology v du l ch. 3. Đ i tư ng và ph m vi nghiên c u a) Đ i tư ng nghiên c u Đ i tư ng ñư c nghiên c u c th là: nghiên c u lý thuy t v Web ng nghĩa, RDF và ontology; tìm hi u các thông tin liên quan v du l ch c a Vi t Nam; tham kh o các ng d ng và d án hi n có trên các t p chí khoa h c và m ng Internet. b) Ph m vi nghiên c u Trong ph m vi gi i h n c a ñ tài, lu n văn nghiên c u xây d ng t p t v ng cơ b n v các ñ a ñi m du l ch Vi t Nam, t ch c lưu tr d li u c a ng d ng v i Protégé, và khai thác các tính năng v truy xu t d li u trong ontology. 4. Phương pháp nghiên c u V i các m c tiêu trên, lu n văn s d ng phương pháp nghiên c u
  5. -5- lý thuy t và phương pháp nghiên c u th c nghi m ñ th c hi n ñ tài. 5. Ý nghĩa khoa h c và th c ti n c a ñ tài a) Ý nghĩa khoa h c Hi u và v n d ng ñư c các ki n th c v RDF, Ontology, RDF/XML, RDF Schema, OWL ... Cung c p gi i pháp xây d ng ontology Xây d ng t p t v ng cơ b n v các ñ a ñi m du l ch Vi t Nam Khai thác các tính năng ñ c/xu t, truy v n trên m t tài li u có mô t ng nghĩa. b) Ý nghĩa th c ti n Vi c nghiên c u web ng nghĩa và ng d ng vào x lý thông tin du l ch mà c th là thông tin v các ñ a ñi m du l ch c a Vi t Nam làm cơ s nh m ph c v vi c tra c u, chia s thông tin v du l ch c a Vi t Nam. Đ ng th i, k t qu nghiên c u c a ñ tài làm n n t ng ñ gi i quy t các bài toán x lý ng nghĩa khác trong th c ti n, 6. B c c lu n văn Lu n văn ñư c chia làm 3 chương: Chương 1 trình bày n i dung nghiên c u t ng quan v web ng nghĩa, ki n trúc web ng nghĩa và các khái ni m v URI, RDF, RDF Scheme, Ontology. Gi i thi u m t s ngôn ng xây d ng web ng nghĩa và m t s ng d ng c a web ng nghĩa. Chương 2 ñi sâu vào nghiên c u RDF, Ontology và nh ng ñ i tư ng c n thi t ñ xây d ng RDF và Ontology. Đ ng th i, trong quá trình nghiên c u và phân tích v RDF và Ontology s ñưa ra gi i pháp v ngôn ng và công c ñ xây d ng ng d ng web ng nghĩa. Chương 3 gi i thi u v ng d ng, phân tích ng d ng và ñ ra gi i pháp xây d ng ng d ng. Ti n hành xây d ng ontology, x lý d li u, cài ñ t ng d ng và ñưa ra m t s k t qu th c hi n c a ng d ng.
  6. -6- Chương 1: T NG QUAN V WEB NG NGHĨA 1.1. WEB THÔNG THƯ NG 1.1.1 Các ñ c tính c a web Web thông thư ng ch y u là m t t p các trang HTML siêu liên k t có th ñư c xem b i các trình duy t trên các thi t b khác nhau và ch y u dành cho con ngư i truy c p và ñ c. 1.1.2 Các ti n ích c a web Web làm gi m th i gian truy c p thông tin và s l n giao tác, làm các giao d ch r hơn và g n như không t n phí cho các truy n thông siêu phương ti n trên th gi i. Nhi u c ng ñ ng ñư c hư ng l i t web. 1.1.3 Các ng d ng c a web 1.1.4 Các h n ch c a web thông thư ng M c dù web thông thư ng cung c p nhi u ti n ích ñáng kinh ng c nhưng nó không cung c p ñ c u trúc ñ h tr c i ti n máy tính x lý n i dung. Trong khi ngư i dùng c n thông tin t t hơn trình bày trên web ñ cho phép c i ti n ñư c nhi u ng d ng. Như v y, web thông thư ng ch y u là m t d ch v truy n t i tài li u t p trung vào nhu c u ngư i ñ c s d ng các trình duy t. Tuy nhiên, các công ngh web thông thư ng không ñ h tr nhi u yêu c u tính toán ph c t p. Công ngh web m i là c n thi t ñ c u trúc thông tin, c i thi n tìm ki m và ñ t ng nghĩa vào thông tin. 1.2. GI I THI U WEB NG NGHĨA 1.2.1. Khái ni m Web ng nghĩa: là m t web có d li u thông minh mà máy có th x lý ñư c. Ngoài ra còn có th ñ nh nghĩa d li u thông minh là d li u mà ñ c l p v i ng d ng, ñư c biên so n, ñư c phân lo i và là thành ph n c a m t h th ng thông tin r ng l n (ontology).
  7. -7- 1.2.2. L i ích c a vi c s d ng web ng nghĩa Web ng nghĩa v i thông tin ñưa ra ñã ñư c xác ñ nh rõ ý nghĩa cho phép máy tính và con ngư i h p tác làm vi c t t hơn. Web ng nghĩa s mang l i c u trúc cho các n i dung c a các trang web có ý nghĩa, t o ra m t môi trư ng mà các máy tính có th d dàng th c hi n nhi m v ph c t p cho ngư i dùng. Web ng nghĩa ñ t tên m i khái ni m ñơn gi n ch b ng m t URI, nên cho phép b t c ai th hi n các khái ni m m i mà h nghĩ ra ch v i n l c t i thi u. 1.2.3 Tính c n thi t c a vi c s d ng web ng nghĩa Web ng nghĩa s gi i quy t m t s v n ñ cơ b n mà các ki n trúc công ngh thông tin hi n nay ph i ñ i m t: − Thông tin quá t i − Phá v h th ng Stovepipe − Tích h p n i dung nghèo nàn 1.3. KI N TRÚC WEB NG NGHĨA Hình 1. 5 Ki n trúc Web ng nghĩa (phiên b n 4) Đây là phiên b n ñư c hoàn thi n năm 2006 và ñư c gi ñ nh là tám t ng thay vì b y t ng như các phiên b n trư c.
  8. -8- 1.3.1. T ng 1 - Unicode và URI 1.3.2. T ng 2 - XML 1.3.3. T ng 3 – RDF và RDF Schema 1.3.4. T ng 4 – Ontology và Rules 1.3.5. T ng 5 - Logic 1.3.6. T ng 6 - Proof 1.3.7. T ng 7 - Trust 1.3.8. T ng 8 – User Interface & Applications Đây là m t t ng riêng bi t n m trên cùng trong ki n trúc c a h th ng. 1.4. NGÔN NG CHO WEB NG NGHĨA Như ñư c mô t trong m c 1.3, các t ng c a ki n trúc web ng nghĩa ñã ñư c quy chu n v i các chu n ñã ñư c W3C ñ xu t cũng như c ng ñ ng nghiên c u web ng nghĩa th ng nh t s d ng trên th c t . Theo ñó, d li u trong web ng nghĩa d a cơ s trên XML và ñư c mô hình hóa b ng RDF. RDF cũng ñư c ch n là chu n trao ñ i d li u trong web ng nghĩa. Ngôn ng ontology ñư c chu n hóa là OWL d a trên cơ s c a RDF(S); ontology cung c p t v ng cho vi c trao ñ i thông tin gi a các ng d ng và d ch v Web. Bên c nh ñó, ngôn ng truy v n SPARQL ñã ñư c s d ng r ng rãi và là khuy n ngh c a W3C, tuy nó chưa tr thành chu n th t s . 1.5. CÁC NG D NG S D NG WEB NG NGHĨA Web có ng nghĩa cho phép tăng cư ng ch c năng, m c ñ thông minh và tính t ñ ng hoá c a nhi u ng d ng hi n có. Nh ng lĩnh v c ng d ng ñ c bi t h a h n cho web có ng nghĩa là các d ch v Web, qu n lý tri th c và thương m i ñi n t .
  9. -9- Chương 2: CÁC CÔNG NGH XÂY D NG WEB NG NGHĨA 2.1. TRUY V N D LI U RDF 2.1.1. Gi i thi u RDF RDF cung c p m t framework cho vi c mô t và trao ñ i siêu d li u v các tài nguyên trên web. Trong RDF, các tài nguyên trên web ñư c ñ nh danh b i các URI và s d ng URI ñ t o ra các phát bi u v tài nguyên. Đ làm cho máy d x lý, RDF k th a cú pháp d a trên XML. Do ñó, RDF cung c p kh năng tương tác gi a các ng d ng và trao ñ i thông tin trên web mà máy có th hi u ñư c. 2.1.1.1 Mô hình RDF cơ b n Mô hình d li u cơ b n c a RDF g m ba ñ i tư ng sau: - Tài nguyên (Resource): ch m i ñ i tư ng có th th y trên web. Các tài nguyên thì luôn ñư c ñ nh danh b i URI. - Thu c tính (Property): M t thu c tính là m t khía c nh, ñ c ñi m, ñ c tính hay m i quan h c th ñư c dùng ñ mô t m t tài nguyên. - Phát bi u (Statement): Phát bi u RDF cung c p m t tài nguyên ch th , m t thu c tính và m t ñ i tư ng. M i phát bi u ñư c bi u di n theo c u trúc b ba ñư c g i là “triple” b i vì nó có ba thành ph n cơ b n: Ch -th , Thu c-tính, Đ i-tư ng (Subject, Predicate, Object). 2.1.1.2 Các cách hi n th RDF a) N3 N3 hay Notation3 phá v m t ñ th RDF thành các triple riêng c a nó, m i triple có ch a m t ch th , m t thu c tính và m t ñ i tư ng ñư c tách ra b i các kho ng tr ng. b) Đ th RDF M t t p h p các RDF triple t o thành ñ th RDF. T p h p các nút trong ñ th RDF là t p các ch th và các ñ i tư ng trong triple, các
  10. - 10 - cung trong ñ th là các thu c tính. RDF triple ñư c khái ni m hóa b ng bi u ñ như sau: Thu c tính Ch th Đ i tư ng c) RDF/XML Phương th c th ba s d ng XML ñ bi u di n d li u RDF. Vì có cú pháp c u trúc m nh nên XML là m t n n t ng t t cho x lý t ñ ng trong các tài li u RDF. 2.1.1.3 Cú pháp RDF/XML RDF s d ng XML mã hóa như là cú pháp trao ñ i c a nó, còn g i là cú pháp d a trên XML. RDF/XML là s k t h p gi a cú pháp c a ngôn ng XML và kh năng mô t tài nguyên thông qua các URI. 2.1.2. RDF Schema RDF Schema (RDFS) là s m r ng c a RDF ñ cho phép mô t s phân lo i c a các l p và các thu c tính. RDFS ñ nh nghĩa các l p và các thu c tính ñ mô t các l p, các thu c tính và các tài nguyên khác. 2.1.2.1 L p trong RDFS Trong RDFS, các l p là m t nhóm các tài nguyên trên web có liên quan v i nhau. Chúng ñư c xác ñ nh b ng cách s d ng t p t v ng RDF như rdfs:Class, rdfs:Resource ñ nh nghĩa các nút (node) và rdf:type, rdfs:subClassOf ñ nh nghĩa các thu c tính. 2.1.2.2. Thu c tính trong RDFS Thu c tính trong RDFS chính là quan h gi a các ch th và ñ i tư ng trong RDF. Thu c tính hay ñư c s d ng là rdfs:range, rdfs:domain, rdfs:subClassOf và rdfs:subPropertyOf. Tương t như các mô t l p, các thu c tính ñư c ñ nh nghĩa b i th rdf:Property. 2.1.3. Lưu tr d li u RDF M t vài h th ng ñư c phát tri n cho vi c lưu tr và truy v n d
  11. - 11 - li u RDF, ví d như Sesame và RDFSuite. 2.1.4. Truy v n d li u RDF 2.1.4.1. Truy v n d li u RDF Các tài li u RDF và RDF Schema có th ñư c xem xét truy v n ba c p ñ tr u tư ng khác nhau: 1. c p ñ cú pháp, chúng là các tài li u XML. 2. c p ñ c u trúc, chúng bao g m m t t p các triple. 3. c p ñ ng nghĩa, chúng thi t l p m t ho c nhi u ñ th v i các thành ph n ng nghĩa ñư c ñ nh nghĩa trư c. 2.1.4.2. SPARQL SPARQL là m t ngôn ng cho phép truy v n các triple t m t cơ s d li u RDF (ho c t m t kho lưu tr triple). SPARQL truy v n b ng cách ñ nh nghĩa m t khuôn m u cho các triple tương ng. 2.2. BI U DI N ONTOLOGY 2.2.1. T ng quan v Ontology Ontology là “m t bi u di n s khái ni m hóa chung ñư c chia s ” c a m t mi n hay lĩnh v c nh t ñ nh. Nó cung c p m t b t v ng chung bao g m các khái ni m, các thu c tính quan tr ng và các ñ nh nghĩa v các khái ni m và các thu c tính này. Có b n thành ph n ontology cơ b n: − Các th c th (individuals) − Các l p (classes) − Các thu c tính (attributes) − Các quan h (relations) * Phân lo i Ontology: S phân lo i ontology có th ñư c t o ra theo ch ñ c a s khái ni m hóa và ñư c t ng k t thành b n lo i như sau: − Top-level Ontology: di n t các khái ni m t ng quan tr u tư ng
  12. - 12 - − Domain Ontology: l y tri th c t trong nh ng lĩnh v c xác ñ nh − Task Ontology: l y tri th c v m t tác v riêng bi t − Application Ontology 2.2.2. Phương th c xây d ng Ontology M t s nguyên t c cơ b n c a vi c xây d ng ontology thông qua các công ño n sau ñây: Xác ñ nh mi n và ph m vi c a ontology Xem xét vi c k th a các ontology có s n Li t kê các thu t ng quan tr ng trong ontology Xây d ng các l p và c u trúc l p phân c p Xác ñ nh các thu c tính và quan h cho l p Xác ñ nh gi i h n c a các thu c tính và quan h c a l p T o các th c th cho l p 2.2.3. Ngôn ng bi u di n Ontology Ngôn ng ontology chu n ñư c phát tri n g n ñây nh t là OWL t t ch c W3C. Xây d ng d a trên RDF và RDFS, OWL ñ nh nghĩa các ki u quan h có th ñư c th hi n trong RDF b ng cách s d ng m t t p t v ng XML ñ ch ra các phân c p và m i quan h gi a các tài nguyên khác nhau. OWL ñư c phát tri n b i nó có nhi u ti n l i ñ bi u di n ý nghĩa và ng nghĩa hơn so v i XML, RDF và RDFS, và vì OWL ra ñ i sau các ngôn ng này nên nó có kh năng bi u di n các n i dung trên web mà máy có th hi u ñư c. Các phiên b n c a OWL OWL ñư c chia làm ba phiên b n ngôn ng con: OWL Lite, OWL DL và OWL Full. L a ch n ngôn ng con ñ s d ng M t cách cơ b n, ngôn ng con ñư c s d ng nên có nhi u bi u c m c n thi t và càng ít ph c t p càng t t.
  13. - 13 - Các thành ph n c a các ontology OWL − L p (Classes): ñư c s d ng ñ t o ra các nhóm có cùng ñ c ñi m. − Th c th (Individuals): là các thành viên c a l p, làm rõ hơn v l p ñó. − Thu c tính (Properties): liên k t hai ñ i tư ng v i nhau. M i thu c tính có th có m t thu c tính ngh ch ñ o tương ng. Các ki u thu c tính OWL Có hai ki u thu c tính chính là thu c tính Object và Datatype. Thu c tính Object là các m i quan h gi a hai th c th , liên k t t th c th này ñ n th c th kia. Thu c tính Datatype mô t m i quan h gi a các th c th và giá tr d li u. OWL cũng có ki u thu c tính th ba là thu c tính Annotation ñư c s d ng ñ thêm thông tin vào l p, vào th c th ho c th c th khác thu c hai ki u trên object/datatype. Domain và Range c a thu c tính Thu c tính có th có m t domain và m t range c th . Các thu c tính liên k t các th c th thu c domain ñ n các th c th thu c range. Nhìn chung, domain c a m t thu c tính là range c a thu c tính ngh ch ñ o c a nó và ngư c l i. 2.3. CÔNG C VÀ PH N M M XÂY D NG WEB NG NGHĨA 2.3.1. Protégé Protégé là m t b ph n m m mã ngu n m mi n phí ñư c vi t b ng Java và thao tác các ontology dư i nhi u ñ nh d ng khác nhau bao g m c RDF(S), OWL và XML Schema. 2.3.2. OwlDotNetApi OwlDotNetApi ñư c vi t b ng C# và cung c p m t API cho các ng d ng .NET d a trên phân tích cú pháp RDF Drive. API này s d ng các mô hình d li u cơ b n t RDF Drive ñ xây d ng m t ñ th ñư c liên k t tr c ti p t các ontology OWL.
  14. - 14 - Chương 3: XÂY D NG NG D NG MINH H A X LÝ THÔNG TIN DU L CH 3.1. GI I THI U NG D NG V i nh ng ki n th c tìm hi u ñư c v web ng nghĩa trên, lu n văn nghiên c u s d ng công ngh web ng nghĩa vào xây d ng m t ng d ng minh h a nh m ph c v cho vi c lưu tr , tìm ki m, truy v n thông tin v các ñ a ñi m du l ch Vi t Nam và ñ ng th i ñ hi u rõ hơn v lĩnh v c web ng nghĩa này. M c tiêu chính c a ng d ng là ñ c i thi n k t qu tìm ki m và truy xu t nhi u thông tin liên quan hơn cho m c ñích s d ng c a ngư i dùng. Vì v y, chương trình ng d ng s cung c p và chia s các thông tin v các ñ a ñi m du l ch theo hai phương th c: • Tìm ki m thông tin H th ng s h tr tìm ki m chính xác và tìm g n ñúng. V i tìm ki m chính xác, ngư i dùng nh p ñ y ñ và chính xác t khóa c n tìm, lúc này có hai trư ng h p x y ra: + N u t khóa c n tìm là tên c a m t ñi m ñ n du l ch thì k t qu tr v là t t c các th c th có quan h v i ñ a ñi m này + Ngư c l i, n u t khóa c n tìm không ph i là tên c a m t ñi m ñ n du l ch thì k t qu tr v là thông tin v các th c th liên quan n u có t n t i trong ng d ng. V i tìm ki m g n ñúng, ngư i dùng ch c n nh p m t ph n trong chu i t khóa c n tìm, k t qu tr v là t p các tên th c th mà trong ñó có ch a m t ph n gi ng v i chu i gõ vào. Sau ñó ngư i dùng có th ch n ch c năng hi n th thông tin chi ti t ñ xem. • Duy t cây phân c p d a trên ontology Giao di n cây phân c p ñư c t ch c theo th t như hình 3.1 sau:
  15. - 15 - Đ a ñi m - T nh/Thành ph - Chi ti t ñ a ñi m T nh/Thành Chi ti t ñ a Đ a danh Đ a ñi m ph ñi m L h i m th c ... Hình 3. 1 Minh h a cây phân c p duy t thông tin Trư c tiên, ngư i s d ng ch n m c ñi m ñ n, h th ng s hi n th các t nh/thành ph . Ti p theo có th ch n m t t nh/thành ph ñ xem các thông tin v ñ a ñi m ñã ch n này. H th ng s hi n th ra thông tin chi ti t v ñ a ñi m ñã ch n và các thông tin khác liên quan ñ n ñ a ñi m. Kèm theo ñó, h th ng s cung c p m t danh sách các thông tin ñ c trưng v ñ a ñi m ñã ch n. 3.2. HƯ NG TI P C N VÀ GI I PHÁP * Gi i pháp k thu t Chương trình ng d ng s th c hi n x lý thông tin thông qua các công ngh web ng nghĩa hi n có và các gi i pháp ñã ñư c ñ c p: - Môi trư ng phát tri n: Visual Studio - Thi hành trên IE/Firefox - Ngôn ng s d ng: C# trên n n ASP.net - Chương trình s d ng công c Protégé, OwlDotNetApi. Vi c l a ch n n n t ng .NET như là công c phát tri n chính vì nó cho phép kh năng tương tác gi a nhi u ngôn ng . * Thi t k ontology Trư c h t không có gi i pháp nào là b t bu c v mô hình ontology. Các hư ng ti p c n khác nhau ñ u kh thi và gi i pháp t t nh t là ph thu c vào ng d ng.
  16. - 16 - M t trong nh ng ngôn ng ontology ph bi n hi n nay là Web Ontology Language (OWL). Có nh ng hình thái OWL khác nhau (OWL Full, OWL Lite và OWL DL) mà khác nhau ch y u tính ph c t p và tính bi u c m. Cách ti p c n trình bày trong báo cáo này d a trên OWL DL (Logic mô t ). Đ i v i thi t k ontology, Protégé (Protégé-OWL) ñư c l a ch n ñ s d ng b i nó là công c m nh m và ph bi n nh t hi n th i cho m c ñích này. Trong ng d ng này, ontology s ñư c tích h p vào m t thư m c máy c c b ñ ti n cho vi c minh h a ng d ng. Tuy nhiên cũng có th l y các ontology này tr c ti p t Internet (n u có). Các ontology thư ng lưu dư i d ng t p tin có ñuôi: .rdf, .rdfs, .owl, .daml, .xml, ... Ontology c a ng d ng ñư c lưu v i t p tin .owl. * Qu n lý các tài nguyên c a ng d ng Qu n lý các tài nguyên c a ng d ng bao g m vi c thêm, s a và xóa thông tin các tài nguyên. Ch c năng này chưa ñư c tri n khai trong ng d ng nên s ñư c th c hi n b ng cách thao tác tr c ti p v i ontology c a ng d ng thông qua công c Protégé. * S d ng thư vi n mã ngu n m OWLDotNetAPI Đ s d ng OwlDotNetApi, trư c h t ph i import thư vi n DLL ñư c biên d ch s n vào Visual Studio project. Bư c ti p theo là t o m t ñ th OWL t t p tin ontology: IOwlParser parser = new OwlXmlParser(); IOwlGraph graph = parser.ParseOwl(ñ a_ch _ch a_t p_tin_owl); M t khi m t ñ th OWL ñư c t o ra, các phương th c s ñư c g i ra ñ th c thi ng d ng. Đ truy xu t thông tin chi ti t v ñ th thì có th s d ng các thu c tính ChildEdges và ParentEdges.
  17. - 17 - 3.3. PHÂN TÍCH NG D NG 3.3.1. Mô hình use-case D a trên mô t v ng d ng, ph n này s xây d ng mô hình use- case nh m cung c p m t cách chi ti t v các ch c năng cơ b n như tìm ki m thông tin, xem thông tin v m t ñ a ñi m c th (duy t thông tin) và xem các thông tin chi ti t c a ñ a ñi m. Mô hình use-case ñư c th hi n như hình 3.2 sau: Duyeät thoâ ng tin Ngöôøi söû duïng Xem thoâng tin chi tieát Tìm kieám Hình 3. 2 Minh h a mô hình usecase c a ng d ng 3.3.2. Đ c t ch c năng - Ch c năng tìm ki m: Ch c năng này cho phép ngư i s d ng tìm thông tin trong h th ng b ng cách nh p t khóa thông tin mu n tìm. H th ng vào ontology tìm t t c các URIs liên quan ñ n t khóa mu n tìm và tr v k t qu . - Ch c năng duy t thông tin: Ch c năng này cho phép ngư i s d ng xem thông tin phân c p trong h th ng b ng cách ch n m c thông tin c n xem. H th ng vào ontology tìm các th c th ho c các phân c p con liên quan ñ n m c thông tin ñư c ch n và tr v các k t qu cho ngư i s d ng.
  18. - 18 - - Ch c năng xem thông tin chi ti t: Ch c năng này cho phép ngư i s d ng xem thông tin chi ti t c a m t tài nguyên trong h th ng b ng cách nh n ch n tên tài nguyên mu n xem thông tin chi ti t. H th ng vào ontology tìm URIs cho tài nguyên c n tìm. D a vào URIs ñã tìm ñư c, h th ng s theo ñ a ch này ñ tìm thông tin chi ti t c a tài nguyên và tr v k t qu tìm ñư c. 3.4. XÂY D NG ONTOLOGY M c ñích s d ng ontology trong ng d ng là giúp mô hình hóa d dàng các tri th c chung trong lĩnh v c du l ch. T t c các l p ñư c ñ t theo tên c a danh t và t t c các thu c tính có tên v i ti n t là hình th c ñ ng t has (như hasName) ho c is (như isRegionOf). M i bư c xây d ng ontology ñư c trình bày chi ti t như sau: 3.4.1. Xác ñ nh mi n và ph m vi c a ontology Lĩnh v c c n xây d ng ontology ñây là thông tin liên quan ñ n các ñ a ñi m du l ch, mà c th là xem xét các thông tin chi ti t v ñ a ñi m ñã ch n như ñ a danh ñ thăm quan, nơi ăn u ng, nơi , ... Mi n mà ontology s bao trùm là khái ni m và thông tin mô t c a các ñi m ñ n du l ch, các ñ a danh có trong ñi m ñ n, nơi ăn u ng - nơi - nơi vui chơi gi i trí – nơi tham quan tìm hi u thu c ñi m ñ n. Tri th c v lĩnh v c du l ch trong ontology ñư c chia s theo cách cho phép ngư i dùng tìm ñ a ñi m du l ch c n ñ n trên ñ t nư c Vi t Nam. 3.4.2. S d ng l i các ontology ñã có V i ng d ng này, không có ontology có s n nào ñư c s d ng l i. 3.4.3. Xác ñ nh các thu t ng quan tr ng Bư c ti p theo là vi t ra thông tin v nh ng thu t ng ho c nh ng khái ni m quan tr ng. Danh sách ng c các khái ni m v ñ a ñi m du l ch như sau: - Đ a ñi m - Đ a danh
  19. - 19 - - Khách s n - Nhà hàng - Nơi ăn u ng - Quán bar - Nơi mua s m - Quán cà phê -L h i - Ch -Đ cs n - Siêu th Ti p ñó, d a trên các khái ni m ñ ñ nh nghĩa các quan h gi a chúng. M t s quan h cơ b n bao g m: là ñ a danh thu c ñi m ñ n, là khách s n thu c ñi m ñ n, có ñi m ñ n, có thông tin chi ti t, … 3.4.4. Xác ñ nh l p và xây d ng cây phân c p l p Danh sách nh ng thu t ng ho c khái ni m ñã mô t trên s ñư c t ch c thành các l p và sau ñó t ch c chúng thành c u trúc l p phân c p. Các l p ñư c xây d ng như sau: − L p chính ñư c mô t ñ u tiên bao g m: Đ a ñi m và Chi ti t ñ a ñi m. − Chi ti t ñ a ñi m bao g m các thông tin chi ti t v ñ a ñi m nên s có các l p con: Đ a danh, Khách s n, Nơi ăn u ng, Nơi mua s m, L h i, Đ c s n. o L p Nơi ăn u ng mô t nh ng nơi ph c v ăn u ng thu c ñ a ñi m ñã ch n g m có các l p con: Nhà hàng, Quán cà phê, Quán Bar. o L p Nơi mua s m mô t nh ng nơi ph c v nhu c u mua s m t i ñ a ñi m ñã ch n g m có các l p con: Ch , Siêu th . − Đ a ñi m s thu c m t vùng mi n nào ñó nên s có thêm l p Vùng mi n. Chương trình so n th o Protége ñư c s d ng ñ mã hoá ontology và áp d ng hư ng ti p c n t trên xu ng dư i như hình 3.8 sau:
  20. - 20 - Hình 3. 8 Minh h a các l p c a ontology b ng Protégé 3.4.5. Xác ñ nh các thu c tính c a các l p Các thu c tính c a m i l p mô t tính ch t c a l p và các m i quan h c a nó v i các l p khác. Vi c xác ñ nh các thu c tính khá ph c t p. Các thu c tính Datatype thì d dàng nh n bi t hơn các thu c tính Object – là thu c tính bi u di n quan h gi a các th c th . T cây phân c p l p ñã mô t trên, các thu c tính ñ i tư ng c a các l p ñư c xây d ng như sau: − L p Destination (Đ a ñi m): có thu c tính hasName, hasOtherName, hasDescription, hasLocation, hasPlaceName, hasRestaurant, hasCafes, hasBar, hasHotel, hasLocalfood, hasFestival, hasMarket, hasSuperMarket. − L p Region (Vùng mi n): có thu c tính là hasDestination. − L p Characteristic (Chi ti t ñ a ñi m): có các thu c tính: hasName, hasOtherName, hasDescription. − L p Festival (L h i): là l p con c a l p Characteristic, ngoài các thu c tính k th a t Characteristic còn có thu c tính hasTime. − L p EatingAndDrinking (Ăn u ng): là l p con c a l p Characteristic, ngoài các thu c tính k th a t Characteristic còn có các thu c tính: hasPhone, hasFax, hasAdress.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2