intTypePromotion=3

Luận văn: Ứng dụng công nghệ tri thức xây dựng hệ hỗ trợ hỏi đáp tự động trong tư vấn tuyển sinh đào tạo

Chia sẻ: Sdfas Vfdtg | Ngày: | Loại File: PDF | Số trang:12

0
135
lượt xem
33
download

Luận văn: Ứng dụng công nghệ tri thức xây dựng hệ hỗ trợ hỏi đáp tự động trong tư vấn tuyển sinh đào tạo

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Ứng dụng công nghệ tri thức xây dựng hệ hỗ trợ hỏi đáp tự động trong tư vấn tuyển sinh đào tạo nhằm nghiên cứu hệ thống hỏi đáp tự động tập trung nghiên cứu các phương pháp áp d5ng cho ngôn ngữ tiếng Việt

Chủ đề:
Lưu

Nội dung Text: Luận văn: Ứng dụng công nghệ tri thức xây dựng hệ hỗ trợ hỏi đáp tự động trong tư vấn tuyển sinh đào tạo

  1. - 1- - 2- B GIÁO D C VÀ ĐÀO T O Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS.TS. Phan Huy Khánh HUỲNH T N D NG Ph n bi n 1: TS. Huỳnh H u Hưng NG D NG CÔNG NGH TRI TH C XÂY D NG H H TR H I ĐÁP T Đ NG TRONG TƯ V N TUY N SINH ĐÀO T O Ph n bi n 2: PGS.TS. Đoàn Văn Ban Chuyên ngành: KHOA H C MÁY TÍNH Lu n văn s ñư c b o v t i H i ñ ng ch m Lu n Mã s : 60.48.01 văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng ngày 11 tháng 09 năm 2011. TÓM T T LU N VĂN TH C SĨ K THU T Có th tìm hi u Lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng - Trung tâm H c li u, Đ i h c Đà N ng. Đà N ng - Năm 2012
  2. - 3- - 4- M Đ U Cùng v i s phát tri n c a Internet, nhu c u trao ñ i thông tin trên các di n ñàn ngày càng l n. Th c t cho th y các di n ñàn trên 1. Lý do ch n ñ tài m ng ngày m t nhi u. R t nhi u di n ñàn tư v n tr c tuy n ph c v Ngày nay, v i s phát tri n c a Internet, con ngư i ñư c th a h c t p cũng ra ñ i. Các câu h i ñư c g i lên di n ñàn ñ ñư c các hư ng m t kho tài li u kh ng l c a nhân lo i v i vô s tri th c t r t chuyên gia trong các lĩnh v c ñó gi i ñáp. Khi s lư ng câu h i ngày nhi u lĩnh v c khác nhau. T Internet, con ngư i có th tìm ki m càng nhi u và l p ñi l p l i thì vi c tr l i th công như v y là không ñư c các thông tin mà h c n b ng cách s d ng các công c tìm kh thi, h th ng h i-ñáp là m t phương pháp h u hi u ñ tr l i t ki m thông d ng hi n nay như Google, Yahoo!,... Các công c tìm ñ ng. Đây là m t nhu c u c n thi t. Di n ñàn tư v n là m t nhánh ki m này ñã giúp cho ngư i dùng tìm ki m thông tin ñư c nhanh ng d ng c a h th ng h i-ñáp t ñ ng. chóng và d dàng. Trong tuy n sinh ñào t o hi n nay có m t kh i lư ng l n các Trong khi các h th ng tìm ki m thông tin ch có th cung c p tài li u ñi n t cho phép tìm ki m c a b t kỳ thông tin tuy n sinh các tài li u liên quan và chúng ta ph i t tìm trong ñó câu tr l i cho nào, thông tin tuy n sinh thư ng xuyên thay ñ i và c p nh t h ng nhu c u thông tin c a mình, h th ng h i ñáp l i có th cho ta câu tr năm cho phù h p v i tình hình th c t c a ngành. Tuy nhiên, ñ khai l i d ng ng n g n, súc tích ch không ph i m t t p tài li u. Tuy thác kh i lư ng l n d li u này ñòi h i t n r t nhi u th i gian và nhiên, ñ có th có câu tr l i thư ng ph i s d ng k t h p nhi u công s c. Trong m t vài năm tr l i ñây, nh ng d ng t t công ngh phương pháp liên quan ñ n nhi u lĩnh v c khác nhau, bao g m ba thông tin và truy n thông, thông tin tuy n sinh ngày càng d ti p c n. lĩnh v c chính là x lý ngôn ng t nhiên (Natural Language Bên c nh ñó s lư ng thí sinh ñăng ký d thi vào trư ng h ng năm Processing), tìm ki m thông tin (Information Retrieval) và rút trích liên t c tăng cao, năm 2007 trư ng có s thí sinh ñăng ký thi là 1.120 thông tin (Information Extraction). H th ng h i-ñáp h tr tr l i trong khi ch tiêu tuy n là 240, năm 2008 có 5.812 thí sinh d thi và nhi u lo i câu h i khác nhau như câu h i v s v t, s ki n, ñ nh ch tiêu tuy n sinh là 400, ñ n năm 2011 s thí sinh ñăng ký thi lên nghĩa, danh sách, quá trình, cách th c, lý do… trên nhi u lĩnh v c ñ n 12.552 trong khi ch tiêu tuy n sinh là 1.250. Song v i vi c tuy n khác nhau. Các h th ng h i-ñáp t ñ ng dành cho ti ng Anh ñã sinh là s lư ng thí sinh ñăng ký thi vào các ngành là không ñư c nghiên c u r t nhi u, ng d ng trên nhi u lĩnh v c khác nhau, ñ ng ñ u nhau d n ñ n chênh l ch ñi m trúng tuy n ngành cao và ñ c bi t là tìm ki m câu tr l i t kho d li u kh ng l Internet. Các ngành th p là khá l n. h th ng h i-ñáp cho ti ng Vi t còn sơ kh i và chưa ñư c ng d ng Tính s n có c a các tài li u cơ s v tuy n sinh là r t nhi u, r ng rãi. Vì th , vi c nghiên c u và xây d ng h th ng h i-ñáp cho trong khi chưa có b t kỳ thông tin nào ñ m b o ch t lư ng và tính ti ng Vi t là m t vi c làm có ý nghĩa và thi t th c. chính th ng c a các thông tin này. Vì v y, ñó là m t m i quan tâm
  3. - 5- - 6- l n trong công tác tuy n sinh c a ph huynh và h c sinh khi ch n thi h h tr tư v n t ñ ng b ng ti ng Vi t trong tuy n sinh ñào t o. vào trư ng nào, ngành nào. N u chúng ta xây d ng m t h th ng h i Nh ng nghiên c u này làm cơ s lý thuy t cũng như th c nghi m ñáp gi i h n trong lĩnh v c tuy n sinh và ñào t o thì vi c làm này h t cho vi c xây d ng các h th ng h i-ñáp ti ng Vi t có hi u qu trong s c có ý nghĩa và mang tính c p thi t. tương lai. T i phòng Đào t o trư ng Cao ñ ng K thu t Y t II, là m t b 3. Đ i tư ng và ph m vi nghiên c u ph n ph trách công tác tuy n sinh h ng năm c a Nhà trư ng, v i s Đ i tư ng nghiên c u lư ng thí sinh ñăng ký d thi h ng năm liên t c tăng cao, s lư ng h c sinh và ph huynh quan tâm l n. Vì v y, v n ñ tư v n h c sinh Đ i tư ng nghiên c u là các website tìm ki m tr c tuy n, và ph huynh c a h c sinh bi t v t t c thông tin tuy n sinh c a Nhà nghiên c u các phương pháp ñ xây d ng m t h th ng tư v n, trư ng là r t c n thi t. nghiên c u các công ngh m i xây d ng m t website hi u qu v i t c ñ truy c p nhanh, có kh năng tích h p h th ng tư v n. V i nh ng lý do trên, tôi quy t ñ nh ch n ñ tài “ ng d ng Công ngh Tri th c xây d ng h h tr h i ñáp t ñ ng Đánh giá ng d ng c a h th ng. trong tư v n Tuy n sinh ñào t o” nh m giúp cho h c sinh và Ph m vi nghiên c u ph huynh c a h c sinh quan tâm có hi u bi t v công tác tuy n sinh Các v n ñ h i ñáp liên quan ñ n tuy n sinh và ng d ng t i c a B Giáo d c và Đào t o nói chung và c a Trư ng Cao ñ ng K phòng ñào t o Trư ng cao ñ ng K thu t Y t II. thu t Y t II nói riêng ñ t ñó có l a ch n ñúng ñ n trư ng và ngành s h c trong tương lai. 4. Phương pháp nghiên c u 2. M c tiêu và nhi m v nghiên c u. Đ tài này s k t h p hai phương pháp nghiên c u, ñó là: Nh ng k t qu nghiên c u nh m ng d ng có hi u qu cho Phương pháp nghiên c u lý thuy t công tác tư v n tuy n sinh t i Trư ng cao ñ ng K thu t Y t II. Đ Nghiên c u tài li u, ngôn ng và công ngh liên quan, t ng hoàn thành m c ñích ý tư ng ñ ra c n nghiên c u các n i dung như h p các tài li u, phân tích và xây d ng h th ng d a vào công ngh sau: tri th c. Nghiên c u t ng quát v h th ng h i-ñáp t ñ ng, t p trung Phương pháp nghiên c u th c nghi m nghiên c u các phương pháp có th áp d ng cho ngôn ng ti ng Vi t Phân tích yêu c u th c t c a bài toán và ñ xu t gi i pháp d a trên nh ng thành qu x lý ngôn ng ti ng Vi t ñã có. D a trên xây d ng h th ng h tr tư v n tuy n sinh. nh ng nghiên c u này, nh m ñ xu t ra ñư c m t gi i pháp xây d ng
  4. - 7- - 8- Xây d ng d li u và h th ng thông tin d a trên các s li u nói chung và c a Trư ng cao ñ ng K thu t Y t II nói riêng ñ t ñó và th ng kê tuy n sinh c a Nhà trư ng và c a các trư ng ñ i h c, cao có l a ch n ñúng ñ n trư ng và ngành s h c trong tương lai. ñ ng c nư c. Hư ng ñ n xây d ng h th ng h i-ñáp ng d ng ñư c trong Đánh giá k t qu ñ t ñư c. tương lai. 5. K t qu d ki n 7. B c c lu n văn Nghiên c u t ng quan v lĩnh v c h i-ñáp t ñ ng N i dung chính c a lu n văn ñư c chia thành 3 chương như (Question Answering). sau: Tìm hi u các phương pháp phân tích câu h i. Chương 1 – Cơ s lý thuy t, trong chương này g m có hai n i Tìm hi u các phương pháp tìm ki m văn b n. dung chính là t ng quan v h th ng h i ñáp t ñ ng và các phương pháp phân tích câu h i, tìm ki m thông tin trong h th ng Phân tích th c tr ng công tác tuy n sinh ñào t o t i trư ng h i-ñáp. Cao ñ ng K thu t Y t II t năm 2005 ñ n năm 2009, ñ xu t gi i pháp xây d ng h th ng h i-ñáp t ñ ng ph c v Chương 2 – Nghiên c u th c nghi m, chương này ch y u t p tư v n tuy n sinh ñào t o. trung ñ phân tích công tác tuy n sinh và ñào t o t i trư ng Cao ñ ng K thu t Y t II, t ñó nh m ñưa ra gi i pháp c n thi t ph i xây d ng 6. Ý nghĩa khoa h c và th c ti n c a lu n văn h th ng h tr h i ñáp t ñ ng trong chương 3. V m t lý thuy t Chương 3 –Xây d ng h th ng h i-ñáp, chương này ñưa ra gi i Tìm hi u cơ s lý thuy t liên quan ñ n ñ tài, tìm hi u các pháp nh m xây d ng h th ng h i ñáp trong tư v n tuy n sinh và ñào phương pháp phân tích câu h i và tìm ki m thông tin trong h th ng t o t i trư ng Cao ñ ng K thu t Y t II. h i-ñáp, phân tích s li u v tuy n sinh. Ph n k t lu n ñánh giá nh ng vi c ñã làm ñư c và nh ng vi c chưa làm ñư c, ñưa ra hư ng phát tri n trong tương lai. V m t th c ti n ng d ng các công c ñ xây d ng h th ng h i-ñáp. S n ph m là h th ng h i ñáp ph c v cho công tác tuy n sinh và ng d ng t i phòng ñào t o Trư ng cao ñ ng K thu t Y t II. Đ ng th i giúp cho h c sinh và ph huynh c a h c sinh quan tâm có hi u bi t v công tác tuy n sinh c a B Giáo d c và Đào t o
  5. - 9- - 10- CHƯƠNG 1 1.1.2. Sơ lư c l ch s phát tri n CƠ S LÝ THUY T 1.1.3. Ki n trúc h th ng h i-ñáp H th ng h i-ñáp phát tri n t lĩnh v c tìm ki m thông tin 1.1. T ng quan v h th ng h i ñáp t ñ ng (IR). IR truy n th ng th c hi n tìm ki m thông tin d a trên t khóa 1.1.1. H th ng h i-ñáp t ñ ng. c a các câu truy v n. Trong quá trình tìm ki m, các t khóa s ñư c H th ng h i-ñáp t ñ ng (Question Answering-QA) là m t so kh p (matching) v i m t ch m c tài li u tham kh o cho các tài h th ng ñư c xây d ng ñ th c hi n vi c tìm ki m câu tr l i cho li u khác nhau. Mô hình cơ b n c a m t h th ng IR [2] có ki n trúc m t câu h i c a ngư i dùng. H th ng h i-ñáp t ñ ng liên quan ñ n như sau: 3 lĩnh v c l n là x lý ngôn ng t nhiên (Natural Language Processing), tìm ki m thông tin (Information Retrieval) và rút trích thông tin (Information Extraction). Hình 1.2 H th ng tìm ki m thông tin Hình 1.1 Lĩnh v c h i-ñáp t ñ ng
  6. - 11- - 12- Ki n trúc chung c a các h th ng h i-ñáp [2] thư ng có d ng câu h i s ñư c s d ng ñ tìm ki m thông tin trong cơ s tri th c. như sau: Đi u này có th ñư c th c hi n b ng nhi u phương pháp khác nhau. M t h th ng h i-ñáp lĩnh v c r ng s s d ng m t máy tìm ki m (search engine) ñ tìm ki m các tài li u ñư c phân ph i qua internet. M t h th ng lĩnh v c h p (closed-domain) có th tìm ki m trong các ngu n d li u không có c u trúc, bán c u trúc, ho c có c u trúc ví d như m t cơ s d li u. 1.1.3.4. Rút trích câu tr l i Rút trích câu tr l i thu c lĩnh v c rút trích thông tin. Thông tin ñã ñư c tr v trong giai ño n này có th là các tài li u ho c các văn b n t vi c truy v n cơ s d li u. Nh ng thông tin này ñư c s d ng ñ rút trích các ño n (passage) có liên quan ng nghĩa ñ n Hình 1.3 Ki n trúc h th ng h i-ñáp câu h i mà ngư i dùng ñưa ra. Có r t nhi u phương pháp ñư c ñưa ra trong vi c rút trích các ño n văn b n ch a câu tr l i, ví d như 1.1.3.1. Giao di n ngư i dùng phương pháp phân ño n tài li u d a trên ch ñ và so kh p v i câu 1.1.3.2. Phân tích câu h i h i do ngư i dùng ñưa vào ñ ch n ra các phân ño n tài li u tương t v i câu h i ngư i dùng ñưa vào … Phân tích câu h i ñóng vai trò quan tr ng trong b t kỳ lo i hình h th ng h i-ñáp nào. Trong giai ño n này, câu h i ñư c phân tích và 1.1.3.5. Chi n lư c x p h ng (Ranking) x lý ñ trích l c càng nhi u thông tin càng t t mà có th ñư c s N u các k t qu c a giai ño n rút trích câu tr l i có nhi u hơn d ng sau này trong giai ño n tìm ki m d li u. K t qu c a bư c này m t câu tr l i thì các câu tr l i s ñư c x p h ng d a trên m c ñ khác nhau tùy theo vi c phân tích câu h i nông hay sâu. Ví d , vi c liên quan v m t ngôn ng v i câu h i c a ngư i dùng. Có r t nhi u phân tích có th tách nh ng t v ng trong câu h i và s d ng t t c cách ti p c n khác nhau ñ xác ñ nh m c ñ liên quan c a các câu tr m i th hay là lo i b các hư t (stopword) ñ nh m phân tích cú l i và ñi u này liên quan m t thi t v i cách xác ñ nh câu tr l i pháp c a câu [14]. trong giai ño n rút trích thông tin t các tài li u bư c trư c. Ví d 1.1.3.3. Tìm ki m d li u như trong [6], tác gi ñ xu t m t chi n lư c x p h ng nhi u pha d a trên s k t h p các ñ ño tương t gi a câu h i do ngư i dùng ñưa M t s thông tin ñã ñư c trích xu t trong giai ño n phân tích
  7. - 13- - 14- vào v i câu h i và câu tr l i trong kho d li u xác ñ nh t giai ño n 1.2.1.1. Phương pháp nông (Shallow Method) trư c. M t s phương pháp QA s d ng các k thu t d a trên t 1.1.3.6. Xác minh câu tr l i khóa ñ xác ñ nh v trí các ño n và các câu t các tài li u ñư c tr v b i giai ño n tìm ki m, và sau ñó l c ra câu tr l i d a trên s hi n M t s h th ng h i ñáp c i thi n thêm tính chính xác b ng di n c a lo i câu tr l i trong văn b n ñư c tr v ñó. Sau ñó m t cách phân tích các câu tr l i thu ñư c, qua vi c s d ng phương pháp chi n lư c x p h ng ñư c th c hi n, d a trên các ñ c ñi m cú pháp x lý ngôn ng t nhiên b ng cách phân tích sâu hơn ñ xác minh l i th t t ho c v trí t và s tương t v i câu truy v n. câu h i. Các câu h i và câu tr l i ñư c phân tích cú pháp và chuy n ñ i sang cùng m t hình th c logic. Các câu h i và câu tr l i sau ñó 1.2.1.2. Phương pháp sâu (Deep Method) ñư c so sánh v i nhau ñ xác minh tính h p lý c a các câu tr l i. Tuy nhiên, trong trư ng h p các k thu t t khóa hay k 1.1.4. H th ng h i-ñáp ti ng Vi t thu t s d ng khuôn m u không hi u qu , thì các k thu t x lý cú pháp, ng nghĩa và ng c nh ph c t p hơn ph i ñư c th c hi n ñ Lĩnh v c h i-ñáp ti ng Vi t còn khá m i m và m i ñư c trích xu t ho c xây d ng các câu tr l i. Nh ng phương pháp này có quan tâm trong m t vài năm g n ñây. th bao g m nh n d ng các th c th có tên (named- entity Trong lu n văn [1] năm 2001, tác gi lu n văn ñ c p ñ n regconition), phát hi n m i quan h , s d ng phương pháp suy lu n... v n ñ h i-ñáp t ñ ng, tuy nhiên tác gi ch xây d ng h h tr cho Các h th ng này cũng thư ng s d ng nh ng tri th c có th ñư c h th ng h i-ñáp, hoàn toàn chưa ñúng nghĩa là m t h th ng h i-ñáp tìm th y trong các ontology như Wordnet [8] ho c SUMO [15]. t ñ ng. Ý tư ng c a lu n văn là các câu h i g i lên di n ñàn s 1.2.2. V n ñ phân tích câu h i trong ngôn ng ti ng Vi t. ñư c phân lo i và phân ph i t ñ ng ñ n các chuyên gia có chuyên 1.2.3. Tìm ki m thông tin môn tương ng. Quá trình phân lo i d a trên các lu t phân l p ñư c Tìm ki m thông tin (Information Retrieval (IR)) ñã tr thành rút trích t ñ ng t t p d li u h c là các câu h i ñã gán nhãn. Các m t lĩnh v c quan tr ng trong h u h t các nghiên c u khi mà kh i câu h i này v n s ñư c tr l i th công b i các chuyên gia. lư ng d li u ngày càng gia tăng, ñ c bi t là s phát tri n 1.2. Các phương pháp phân tích câu h i và tìm ki m thông c a Internet. Đ tìm ki m thông tin có hi u qu , các tài li u thư ng tin trong h th ng h i ñáp ñư c chuy n ñ i thành các cách bi u di n tài li u thích h p. 1.2.4. Mô hình không gian vector 1.2.1. Phương pháp phân tích câu h i Mô hình không gian vector là mô hình ñ i s bi u di n cho các tài li u trong quá trình tìm ki m như là vector c a các ñ nh danh
  8. - 15- - 16- (c th ñ i v i văn b n thì nó là t , c m t ). M t tài li u ñư c bi u CHƯƠNG 2 di n như m t vector. M i chi u c a vector tương ng v i m t m c t (term). M c t có th là m t t ñơn hay m t c m t . N u m c t này NGHIÊN C U TH C NGHI M xu t hi n trong tài li u thì giá tr c a nó trong vector ñ c trưng là 2.1. Gi i thi u v trư ng Cao ñ ng K thu t Y t II khác 0. M t phương pháp n i ti ng nh t trong mô hình không gian vector dùng ñ xác ñ nh giá tr các c m t trong vector ñ c trưng là Trư ng Cao ñ ng K thu t Y t II – B Y t , ñư c thành l p phương pháp tr ng s tf-idf [3]. vào ngày 26/3/1963, ñ a ch t i s 99 Hùng Vương TP Đà N ng, có 1.2.5. Phương pháp gom c m d li u nhi m v ñào t o ñ i ngũ cán b y t cho các t nh Mi n trung và Tây nguyên, g m 03 chuyên ngành b c sơ c p, 10 chuyên ngành b c Đ i v i h th ng h i-ñáp cho tư v n tuy n sinh ñào t o, d trung c p và 08 chuyên ngành b c cao ñ ng. Trong ñó, có ñào t o h li u khá l n, c n các phương pháp có ñ ph c t p th p và k t qu chính quy và h v a làm v a h c, ñào t o liên thông t b c h c th p phân c m là ch p nh n ñư c. K-means và HAC là hai phương pháp ñ n b c h c cao hơn v i s lư ng tuy n sinh h ng năm luôn tăng có ñ ph c t p th p. Vì v y, chúng tôi ch n trình bày chi ti t 2 nh m ñáp ng nhu c u chăm sóc và b o v s c kh e cho nhân dân phương pháp này. các t nh Mi n trung và Tây nguyên. 1.2.5.1. Thu t toán K-Means Trong công cu c xây d ng và ñ i m i hi n nay c a ñ t nư c, ñ ñáp ng nhu c u ngày càng cao c a xã h i, Nhà trư ng không 1.2.5.2. Thu t toán HAC ng ng ñ u tư các phương ti n, trang thi t b , cơ s v t ch t và ñ c bi t là ñ u tư vào ñ i ngũ cán b gi ng d y v i mong mu n luôn cung c p cho xã h i m t ñ i ngũ cán b y t có chuyên môn k thu t v ng vàng và có ph m ch t ñ o ñ c t t nh m góp s c c i thi n và nâng cao s c kho c a nhân dân.
  9. - 17- - 18- 2.2. Phân tích tuy n sinh và ñào t o S lư ng h c sinh ñăng ký thi vào Trư ng ngày càng ñông 2.2.1. Tuy n sinh và ñ n t các t nh thành trên c nư c. Ch tiêu tuy n sinh h ng năm c a Trư ng luôn tăng cao so 2.2.1.1. Cao ñ ng h chính quy v i năm trư c. 2.2.1.2. Trung c p h chính quy S h c sinh và sinh viên t t nghi p h ng năm ñ t t l cao hơn năm trư c và v i t l t t nghi p khá gi i cũng không 2.2.1.3. Trung c p h v a làm v a h c ng ng tăng cao. K t lu n Ngày nay, v i vi c công ngh thông tin phát tri n nhanh chóng Qua các s li u th ng kê k t qu công tác tuy n sinh t năm cùng v i s quan tâm c a toàn xã h i trong công tác ñào t o c a ñ t 2006 ñ n năm 2010, ta nh n th y: nư c. Đ c bi t, h c sinh năm cu i THPT và ph huynh h c sinh r t • S lư ng thí sinh d thi liên t c tăng, v i năm sau quan tâm công tác tuy n sinh h ng năm ñ l a ch n trư ng và ngành hơn nhi u so v i năm trư c. Đi u ñó ch ng t h c h c ñúng v i s thích và phù h p v i kh năng c a mình. sinh quan tâm nhi u ñ n công tác ñào tào c a nhà trư ng và thích h c các ngành v y t . Trong các ho t ñ ng ñào t o c a nhà trư ng, trong ñó công tác • Ch tiêu tuy n sinh liên t c tăng cao, ñi u ñó kh n tuy n sinh ñư c lãnh ñ o nhà trư ng luôn ñ t bi t quan tâm. T th c ñ nh uy tín và ch t lư ng ñào t o cu nhà trư ng t ñó là c n ph i có m t h th ng h tr tư v n cho h c sinh và ph không ng ng nâng cao. huynh quan tâm tìm ñư c thông tin c n thi t m t cách chính xác và 2.2.2. Phân tích k t qu ñào t o các khóa nhanh chóng và giúp cho công tác tuy n sinh c a nhà trư ng ñư c 2.2.2.1. Các l p TCCN chính quy (t năm 2003-2007) hi u qu . 2.2.2.2. Các l p TCCN chính quy (khóa 2008-2010) 2.3. Phân tích th c tr ng tuy n sinh và ñào t o c a Nhà trư ng Qua các b ng báo cáo chi ti t trên ñây, ta rút ra m t s ý như sau: S lư ng các ngành ñào t o luôn tăng theo t ng năm các b c h c.
  10. - 19- - 20- CHƯƠNG 3 3.2.1. Giai ño n phân tích truy v n Đây là giai ño n quan tr ng nh t trong các h th ng h i-ñáp, XÂY D NG H TH NG H I ĐÁP v i m c tiêu là xác ñ nh thông tin c n thi t trong câu h i ñ ñưa vào 3.1. M c tiêu xây d ng h th ng h i ñáp t ñ ng giai ño n ti p theo. Thông tin này thu ñư c d a trên các t ng quan M c tiêu c a lu n văn là xây d ng h th ng h i-ñáp t ñ ng tr ng có trong câu h i. Vì v y, m c tiêu c a giai ñ an này là xác ñ nh ph c v cho m t mi n xác ñ nh ñó là tư v n trong tuy n sinh ñào t o các t khóa (các t có ý nghĩa trong câu h i). nên c n nh ng phương pháp gi i quy t riêng. - Tách t Các câu h i và câu tr l i trong tư v n trong tuy n sinh ñào - Trích t khóa t o mang nh ng ñ c ñi m riêng, ñó là dư i d ng văn b n t do, không theo m t lo i câu h i nh t ñ nh nào, cũng không theo m t ch 3.2.2 Giai ño n so kh p câu h i ñ nh t ñ nh nào c . Do ñó, m t ph n h t s c quan tr ng trong h - Xây d ng vector truy v n th ng này là phân tích câu h i như th nào ñ l y ñư c thông tin - Xác ñ nh c m c a truy v n nhi u nh t khi mà câu h i không h có m t c u trúc nh t ñ nh nào c . H u h t các h th ng h i-ñáp truy n th ng ñ u ch tr l i cho các câu - So kh p câu h i và x p h ng h i thu c v m t lo i câu h i nào ñó. Do ñó, phương pháp mà tôi 3.2.3 Giai ño n so kh p câu tr l i ch n th nghi m cho h th ng tư v n trong tuy n sinh ñào t o là nQ câu h i tìm ñư c s ñư c h th ng ch n ra nQ câu tr l i phương pháp d a trên t khóa, trích t khóa. Ngoài ra, nh m c i tương ng v i các câu h i này. Đ tăng tính hi u qu cho h th ng, thi n hi u qu h th ng, gi m không gian tìm ki m, trư c khi tìm h th ng ti n hành so kh p vector truy v n v i vector c a các câu tr ki m, các c p h i-ñáp ñư c phân thành các c m g m các câu h i l i tìm ñư c d a trên ñ tương t gi a các vector. tương t nhau. 3.2. Gi i pháp H th ng này ñư c chia thành 3 giai ño n chính: - Giai ño n phân tích truy v n - Giai ño n so kh p câu h i - Giai ño n so kh p câu tr l i
  11. - 21- - 22- 3.3.3. Nh p câu h i 3.3. Xây d ng giao di n Trong chương trình này, giao di n th hi n bao g m như sau: 3.3.1. Giao di n ban ñ u Hình 3.2 Giao di n ban ñ u 3.3.2. Đăng ký thành viên Hình 3.3 Đăng ký thành viên
  12. - 23- - 24- K T LU N 2. Hư ng phát tri n c a lu n văn Lu n văn ñã ñ t ñư c m t s k t qu nh t ñ nh, nhưng cũng 1. K t lu n còn m t s v n ñ chưa ñ t ñư c và cũng là hư ng phát tri n trong N i dung c a ñ tài ñưa ra khá r ng và ch ñư c th c thi n trong tương lai. th i gian ng n. Vì v y, ñ hoàn t t ñ tài này tôi g p r t nhi u khó khăn v m t tìm ki m tài li u, ñ c hi u tài li u và m t s k thu t ñ Chúng ta có th nâng cao hi u qu c a h th ng b ng cách b v n d ng ki n th c mình ñã tìm hi u ñư c. Nhưng bù ñ p l i nh ng sung các x lý ngôn ng sâu hơn như là thêm t ñ ng nghĩa ho c khó khăn v t v ñó là tôi ñã ti p thu ñư c r t nhi u ki n th c m i l thêm vi c phân tích ng pháp câu h i ... Đó chính là m t hư ng phát và r t b ích v vi c trích t khóa, gom c m d li u ñóng ñ xây tri n c a lu n văn. d ng h h i ñáp t ñ ng. Sau ñây là m t s k t qu ñ t ñư c nh ng Vi c xây d ng h th ng h i ñáp hi u qu ph thu c r t nhi u m c tiêu, yêu c u ñ ra c a lu n văn. vào tính xác th c và chu n hóa c a kho d li u. Chính vì v y, m t Lu n văn ñã t p trung nghiên c u v h th ng h i-ñáp t hư ng phát tri n c a ñ tài là ph i xây d ng ñư c ngu n d li u ñ ng và các phương pháp ti p c n trong lĩnh v c x lý ngôn ng trong kho d li u m t cách t ñ ng ñ phát sinh ra các k t qu t t ti ng Vi t và tìm ki m thông tin trên tinh th n c a h th ng h i-ñáp hơn. t ñ ng, và xây d ng ph n giao di n c a h th ng h i-ñáp t ñ ng Có r t nhi u phương pháp tìm ki m thông tin khác có th áp ph c v cho tư v n trong tuy n sinh ñào t o t i trư ng Cao ñ ng K d ng vào h th ng. H th ng h i-ñáp chính là s ph i h p hi u qu thu t Y t II. các phương pháp khác nhau. Do ñó, m t hư ng phát tri n khác c a Vi c nghiên c u và th nghi m h th ng h i-ñáp ti ng Vi t lu n văn là nghiên c u th nghi m các phương pháp tìm ki m và rút trong lĩnh v c h p là tư v n trong tuy n sinh ñào t o ñã ñưa ra m t trích thông tin khác nh m c i thi n tính hi u qu c a h th ng. cái nhìn m i cho các nghiên c u v h th ng h i-ñáp ti ng Vi t. H th ng h i-ñáp là m t lĩnh v c có r t nhi u hư ng m c n Phân tích k t qu công tác tuy n sinh và ñào t o c a Trư ng cao nghiên c u sâu hơn n a nh m ñáp ng ngày càng cao nhu c u tìm ñ ng k thu t y t II (2006-2010). ki m thông tin súc tích, chính xác trong kho d li u kh ng l . Nh ng k t qu ban ñ u còn gi i h n, nhưng lu n văn cũng ñã ñ t ñư c nh ng yêu c u ñ ra. K t qu ñ t ñư c s làm cơ s lý thuy t và th c nghi m cho vi c xây d ng các h h i-ñáp ti ng Vi t th c t ho t ñ ng hi u qu v sau.

CÓ THỂ BẠN MUỐN DOWNLOAD

Đồng bộ tài khoản