Luận văn thạc sĩ: Tìm hiểu cấu trúc ngữ nghĩa Hán-Việt, xây dựng kho ngữ vựng dựa nghĩa Hán-Việt trong xử lý tiếng Việt
lượt xem 15
download
Tìm hiểu cấu trúc ngữ nghĩa Hán-Việt, xây dựng kho ngữ vựng dựa nghĩa Hán-Việt trong xử lý tiếng Việt nhằm hỗ trợ cho việc xây ựng từ điển đơn, soang hoặc đa ngữ hay chương trình ứng dụng khác.
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Luận văn thạc sĩ: Tìm hiểu cấu trúc ngữ nghĩa Hán-Việt, xây dựng kho ngữ vựng dựa nghĩa Hán-Việt trong xử lý tiếng Việt
- -1- B GIÁO D C VÀ ĐÀO T O Đ I H C ĐÀ N NG ĐOÀN NG C DI M MY TÌM HI U C U TRÚC NG NGHĨA HÁN-VI T, XÂY D NG KHO NG V NG D A NGHĨA HÁN-VI T TRONG X LÝ TI NG VI T Chuyên ngành: KHOA H C MÁY TÍNH Mã s : 60.48.01 TÓM T T LU N VĂN TH C SĨ K THU T Đà N ng - Năm 2011
- -2- Công trình ñư c hoàn thành t i Đ I H C ĐÀ N NG Ngư i hư ng d n khoa h c: PGS. TS. Phan Huy Khánh Ph n bi n 1: Ph n bi n 2: Lu n văn s ñư c b o v trư c H i ñ ng ch m Lu n văn t t nghi p th c sĩ k thu t h p t i Đ i h c Đà N ng vào ngày tháng năm 2011. * Có th tìm hi u lu n văn t i: - Trung tâm Thông tin - H c li u, Đ i h c Đà N ng. - Trung tâm H c li u, Đ i h c Đà N ng.
- -3- M Đ U 1. Lý do ch n ñ tài nư c ta, t Hán Vi t, hay t Vi t g c Hán chi m m t t l r t l n trong kho t v ng ti ng Vi t. Do ñó hi n nay ñã có r t nhi u công trình nghiên c u v x lý t Hán Vi t trong văn b n ti ng Vi t như xây d ng b t ñi n Hán Vi t, công c chuy n ñ i nhanh gi a văn b n Hán Vi t và văn b n ch Hán… Nhưng nh ng ng d ng này v n còn m t s h n ch , c th như: - T t c ñ u chưa có kho ng li u t v ng dùng chung. M i ng d ng t xây d ng cho mình m t kho ng v ng riêng. Thi u tính nh t quán vì các kho ng li u này không có kh năng k t h p ñư c v i nhau. - Đây là các kho ng li u không có c u trúc, không có tính m vì th s t o ra m t s khó khăn nh t ñ nh trong vi c khai thác, c p nh t cũng như chia s ngu n ng li u dùng chung. Đư c s g i ý c a PGS.TS Phan Huy Khánh tôi ñã ch n ñ tài: ”Tìm hi u c u trúc ng nghĩa Hán-Vi t, xây d ng kho ng v ng d a nghĩa Hán-Vi t trong x lý ti ng Vi t” nh m ñưa ra gi i pháp xác ñ nh nghĩa c a các c m t hay câu và xây d ng m t kho ng v ng kh c ph c ñư c m t s như c ñi m trên. 2. M c tiêu và nhi m v nghiên c u M c ñích chính c a ñ tài là xây d ng kho ng v ng ti ng Hán Vi t d a nghĩa bao g m các t , c m t , th m chí c câu và nghĩa c a chúng mà các kho ng v ng hi n nay chưa có. Mu n làm ñư c ñi u ñó, ñ tài c n ñưa ra m t phương pháp thích h p ñ xây d ng nghĩa cho các t , các c m t , các câu trong kho ng v ng c n xây d ng. Các t , các c m t , các câu này ñư c ghép l i t các t ñơn và t ghép. Vì v y, mu n xây d ng nghĩa cho các t , các c m t và các
- -4- câu trong kho ng v ng ph i d a vào nghĩa c a các t trong các kho t ñơn và t ghép. Đ ñ t ñư c m c tiêu trên, ñ tài c n th c hi n các nhi m v sau: - Tìm hi u ti ng Hán Vi t, cú pháp t Hán Vi t, các kho ng v ng t Hán Vi t, các ng d ng x lý t Hán Vi t trong CNTT. - Tìm ra phương pháp xác ñ nh nghĩa cho kho ng v ng d a nghĩa. - Tìm hi u mô hình, c u trúc c a các kho ng v ng t Hán Vi t hi n có, t ñó xác ñ nh mô hình c u trúc c a kho ng v ng d a nghĩa. - Xây d ng kho ng v ng theo mô hình và thu c m t lĩnh v c nh t ñ nh. 3. Đ i tư ng và ph m vi nghiên c u Nghiên c u lý thuy t. Đưa ra các mô hình v x lý và c p nh t d li u ñ t o ra kho ng v ng d a nghĩa. Nghiên c u tri n khai các thu t toán, các ngôn ng l p trình thích h p, các công c h tr ñ xây d ng ng d ng th nghi m. 4. Gi thi t nghiên c u Nghiên c u lý thuy t v T Hán Vi t, b n ch t ng pháp, ng nghĩa c a t Hán Vi t, ñ c bi t là ki n th c v ng nghĩa c a t ghép Hán Vi t. Nghiên c u c u trúc kho ng v ng Hán Vi t, các gi i pháp c p nh t CSDL cho kho ng v ng Hán Vi t. 5. Phương pháp nghiên c u - Thu th p, tìm hi u, phân tích các tài li u và thông tin có liên quan ñ n lu n văn. - Phân tích thi t k h th ng chương trình.
- -5- - Tri n khai xây d ng chương trình. - Ki m th , ñưa ra nh n xét và ñánh giá k t qu . 6. Ý nghĩa khoa h c và th c ti n c a ñ tài Ý nghĩa khoa h c : H tr cho vi c xây d ng t ñi n ñơn, song ho c ña ng hay các chương trình ng d ng khác. Ý nghĩa th c ti n : Kh năng ng d ng kho ng v ng ñ x lý ngôn ng t Hán Vi t như: tìm ki m văn b n, phân tích văn b n, d ch thu t… 7. B c c c a lu n văn Lu n văn ñư c t ch c thành 4 chương Chương 1: T ng quan v t Hán Vi t Trong chương này, tôi nghiên c u các v n ñ v t Hán Vi t như khái ni m, ñ c ñi m, l i ích c a t Hán Vi t; cách dùng t Hán Vi t cho ñúng và m i quan h gi a t Hán Vi t và CNTT hi n nay. Chương 2: Nghiên c u các công c , môi trư ng và k thu t xây d ng kho ng v ng d a nghĩa t Hán Vi t Trong chương này, tôi nghiên c u v các v n ñ liên quan ñ xây d ng ñư c ng d ng như v n ñ x lý ngôn ng t nhiên: các công c , môi trư ng và các ngôn ng l p trình, các ñ án xây d ng kho ng v ng t Hán Vi t ñ rút ra k thu t xây d ng kho ng v ng d a nghĩa t Hán Vi t. Chương 3: Gi i pháp xây d ng kho ng v ng d a nghĩa trong x lý t Hán Vi t Trong chương này, tôi trình bày các giai ño n thi t k , xây d ng và tri n khai ng d ng, mô t ho t ñ ng c a ng d ng, trình bày các k t qu mà ng d ng ñã ñ t ñư c.
- -6- CHƯƠNG 1 - T NG QUAN V T HÁN VI T 1.1. Ch Hán là gì? 1.2. Ngu n g c ch Hán Vi t Vào th k th nh t trư c Công nguyên, cùng v i vi c phong ki n phương B c xâm lư c Vi t Nam, thì ngôn ng văn t Hán cũng ñư c ñưa vào Vi t Nam. Do s du nh p văn hoá quá m nh m nên nư c ta th i c trung ñ i s d ng ti ng Hán như m t văn b n chính th c cũng như hai nư c Tri u Tiên và Nh t B n. Ch Hán qua Vi t Nam chưa có âm Vi t, nên ngư i Vi t Nam ph i ñ t âm Vi t cho t ñó theo cách phát âm sai l ch c a mình. Theo dòng l ch s , nhi u ch Hán ñã ñư c ngư i Vi t Nam ti p thu tr thành t Hán Vi t, ñư c s d ng thông d ng như v n t ti ng Vi t. Chính s phong phú c a kho t v ng ti ng Vi t và nhu c u s lý các văn b n Hán Vi t mà vi c nghiên c u làm sao s d ng ñúng v n t Hán Vi t ñã ñư c nhi u nhà văn hoá và giáo d c quan tâm. 1.3. Đ c ñi m t Hán Vi t T Hán Vi t r t phong phú c v s lư ng và ng nghĩa. T Hán Vi t có th k t h p l i v i nhau ñ t o thành t m i. T Hán Vi t không bao gi gây mâu thu n trong cách hi u trong khi ñó t thu n Vi t nhi u khi r t hay gây nhi u hi u l m. T Hán Vi t nghe kêu và vang d i. T Hán Vi t thư ng mang nhi u nghĩa, hàm nghĩa c a âm ti t Hán Vi t r ng hơn hàm nghĩa c a âm ti t thu n Vi t. M t s ch Hán Vi t tr nên t i nghĩa ho c vô nghĩa khi ñ o tr t t các t . Ví d : tương quan, cơ quan, cơ th … M t s ch Hán Vi t khi ñ o tr t t thì sinh ra nghĩa khác, Ví d : qu nhân, ph m t i khi ñ o tr t t thành nhân qu , t i ph m thì mang nghĩa khác hoàn toàn.
- -7- Ch Hán Vi t v n gi nghĩa. Ví d : Đông phương, Tây phương,… 1.4. L i ích c a t Hán Vi t - Làm giàu thêm kho t ti ng Vi t. - T Hán Vi t làm tăng giá tr cho ngôn ng Vi t Nam. - T Hán Vi t giúp ích r t nhi u trong vi c so n th o nh ng danh t khoa h c. 1.5. C u trúc t Hán Vi t V i t Hán Vi t, c u trúc danh t Hán Vi t thư ng ngh ch v i c u trúc danh t thu n Vi t. N u t thu n Vi t trong câu ñư c c u trúc v i thành ph n chính ñ ng trư c, thành ph n ph ñ ng sau thì c u trúc câu t Hán Vi t thư ng ngư c l i, thành ph n ph ñ ng trư c, thành ph n chính ñ ng sau. Đây là ñi m khác bi t rõ r t gi a c u trúc câu t thu n Vi t và Hán Vi t. B ng 1.1. S khác bi t v c u trúc gi a t Hán Vi t và thu n Vi t T thu n Vi t (chính + ph ) T Hán Vi t (ph + chính) Hoa h ng H ng hoa M t tr ng B ch di n Lá r ng L c di p Ch Hán ñư c c u t o theo sáu nguyên t c g i là L c thư: Tư ng hình,Ch s , Hình thanh, H i ý, Chuy n chú, Gi tá. Nhưng tóm l i, có 3 cách chính t o ch , chuyên v hình th c và thư ng dùng: Tư ng hình, H i ý và Hình thanh. Còn ba cách kia: Ch s , Chuy n chú và Gi Tá không chính th c là cách t o ch mà ch thêm y u t v âm thanh.
- -8- 1.5.1. T ñơn Hán Vi t 1.5.1.1. T ñơn Hán Vi t nhìn t tiêu chí ng âm a. T ñơn Hán Vi t thu n âm Hán Vi t Nh ng t ñơn Hán Vi t lo i này thư ng mang âm Hán Vi t ph thông theo phiên thi t, ví d : ñ nh (ñ ninh thi t 弟 寧 切), như (nh c dư thi t 辱 余 切), tư ng (t y dư ng thi t 洗 養 切), sương (sư ương thi t 師 央 切). b. T ñơn Hán Vi t bi n âm Hán Vi t Đây là nh ng t ñơn Hán Vi t mang âm Hán Vi t ph thông nhưng l i mô ph ng phiên thi t ti ng Hán. Đó là: sinh (sư hanh thi t 師 亨 切), dung (dư long thi t 余 龍 切), hòe (h quai thi t), v.v.. 1.5.1.2. T ñơn Hán Vi t nhìn t tiêu chí ng nghĩa Thư ng thì nghĩa c a t Hán Vi t ña ph n là nghĩa vay mư n. Tuy nhiên, ñây có th chia nh ng t ñơn Hán Vi t tùy theo ng nghĩa thành hai lo i sau: a. T ñơn Hán Vi t nguyên nghĩa Hán Nguyên nghĩa c a m t t ñơn Hán Vi t là ch chung nh ng nét nghĩa v n có trong ti ng Hán văn ngôn. b. T ñơn Hán Vi t bi n nghĩa Vi t S bi n nghĩa m t s t ñơn Hán Vi t là nói v nh ng nét nghĩa ñư c hình thành trong ti ng Vi t. Chúng cùng t n t i v i nh ng nét nghĩa ti ng Hán và ch b c l rõ nét trong m t ng c nh nh t ñ nh. Đ c p nh t nghĩa c a t ñơn vào kho ng v ng, ta ch y u d a vào các t ñi n. 1.5.1.3. T ñơn Hán Vi t nhìn t tiêu chí ng pháp
- -9- Theo s ho t ñ ng t ng ng c nh, l p t ñơn Hán Vi t cũng có th chia thành danh t , ñ ng t và tính t . a. T ñơn Hán Vi t là danh t Danh t ñơn Hán Vi t bao g m danh t c th và danh t tr u tư ng ví d các t : Khách 客 chí 志 b c 幅 b 步 th y 水 thuy n 船 b. T ñơn Hán Vi t là ñ ng t M t s ñ ng t ñơn Hán Vi t như ti n, h c, phong v.v. ch v s ho t ñ ng c a ch th ; tư ng, s u, mu n, thương v.v. ch c m nghĩ, tâm tư, tình c m c a ch th ; ho c các ñ ng t ch quá trình bi n ñ i, như: hóa, tàn, gi i v.v… c. T ñơn Hán Vi t là tính t M t s tính t : tr ng 重 ti n 便 dư 餘 cao 高 Như v y r t khó có th xác ñ nh nghĩa c a t ñơn Hán Vi t, do ñó ta c p nh t nghĩa c a t ñơn Hán Vi t ch y u là d a vào các t ñi n ñã có. 1.5.2. T ghép Hán Vi t 1.5.2.1. T ghép Hán Vi t nhìn t tiêu chí ng âm a. T ghép Hán Vi t thu n âm Hán Vi t Đây là nh ng t ghép Hán Vi t mà hai y u t trong m t t ñ u ñ c âm Hán Vi t ph thông tương ng phiên thi t, ho c m t y u t ñ c âm Hán Vi t ph thông mô ph ng phiên thi t. Vì v y, có th nh n xét lo i t ghép này qua cách phân lo i sau: (1) T ghép thu n âm Hán Vi t ph thông tương ng v i phiên thi t, ví d 清 : thanh bình (清 thanh : th t anh thi t 室 嬰 切; 平 bình: bì nghinh thi t 皮 迎 切. (2) T ghép Hán Vi t thu n âm Hán Vi t ph thông.
- - 10 - b. T ghép Hán Vi t bi n âm Hán Vi t Bi n âm c c b thanh ñi u c a t ghép Hán Vi t là hi n tư ng khá ph bi n trong văn v n v i m c ñích hi p v n thơ, hay lu t thơ v n b ng. 1.5.2.2. T ghép Hán Vi t nhìn t tiêu chí ng nghĩa a. T ghép Hán Vi t nguyên nghĩa Hán Đa s t ghép Hán Vi t ñ u ñư c d n d ng b ng nét nghĩa v n có trong ti ng Hán văn ngôn. b. T ghép Hán Vi t bi n nghĩa Vi t Đây là lo i t ghép cũng ñư c vay mư n t ti ng Hán văn ngôn nhưng l i mang nét nghĩa ñư c hình thành trong ti ng Vi t thu c ph m vi d ch ph m. Ví d , t ghép hư không. Trong ti ng Hán hư không có nghĩa là kho ng không tr ng r ng, không có gì, nhưng trong ti ng Vi t thì hư không còn có nghĩa là không có th t, là tr ng thái l ng lơ, h t h ng trong mong ch . 1.5.2.3. T ghép Hán Vi t nhìn t tiêu chí ng pháp a. T ghép Hán Vi t ñ ng l p Lo i t ghép ñ ng l p này cũng có th x p vào các t lo i, như danh t , ñ ng t , tính t . a.1 T ghép ñ ng l p Hán Vi t là danh t Nh ng t ghép ñ ng l p ñây ñ u b ng hai danh t ñơn Hán Vi t, ho c bán t do ho c t do, ví d : th i ti t 時節 xuân thu 春秋 nhan s c 顏色 a.2. T ghép ñ ng l p Hán Vi t là ñ ng t Trong s ñ ng t ghép ñ ng l p Hán Vi t ñây cũng có hi n tư ng rút g n nguyên m t c m t và t hóa thành ñ ng t ghép. Ví d : ti n th o là t hóa t c m t ti n binh th o ngh ch, xu t chinh là xu t sư chinh thú . Riêng t trang ñi m là s t hóa t c m
- - 11 - t trang hoàng ñi m xuy t v n thư ng dùng trong các ho t ñ ng ngh thu t. b. T ghép Hán Vi t chính ph T ghép chính ph Hán Vi t ñây g m có hai lo i, ñó là t ghép chính ph Hán Vi t ph trư c chính sau v i quan h h n ñ nh và t ghép chính ph Hán Vi t chính trư c ph sau v i quan h chi ph i. b.1. T ghép chính ph Hán Vi t ph trư c chính sau Đa s các t ghép Hán Vi t có tr t t là y u t ph trư c còn y u t chính sau. h ng mao 鴻毛 chi n bào 戰袍 hà lương 河樑 b.2. T ghép chính ph Hán Vi t chính trư c ph sau: M t s t ghép Hán Vi t chính trư c ph sau có quan h chi ph i, ñó là: ñăng ñ 登途 xu t giá 出嫁 hư ng dương 向陽 1.5.3. Nghĩa c a các c m t Hán Vi t Ng Sơ ñ chung c a ng : Pt – T – (q) – Ps Nghĩa = Nghĩa Pt + Nghĩa T + Nghĩa Ps Trong ñó: Pt là ph n ph trư c T là ph n trung tâm Q là ph n liên t Ps là ph n ph sau Liên h p Liên h p bao g m hai ho c trên hai thành t . Các thành t ph i cùng b n ch t t lo i. như v y: Nghĩa = Nghĩa c a thành t 1 + Nghĩa c a thành t 2 +…. D ng láy D ng l y là c m t có quan h ng âm v i nhau, vì v y:
- - 12 - Nghĩa = Nghĩa c a t g c sau ñó nâng cao hay gi m nh m c ñ c a nghĩa 1.5.4. Nghĩa c a câu Hán Vi t -Câu ñơn bình thư ng: Nghĩa = Nghĩa c m t - ch ng + Nghĩa c m t - v ng -Câu ñ c bi t: Nghĩa = Nghĩa c a ng hay Nghĩa c a liên h p -Câu ñơn t nh lư c: Nghĩa = nghĩa c a c m t -ch ng (Câu t nh lư c v ng ) Ho c Nghĩa = nghĩa c a c m t -v ng (Câu tĩnh lư c ch ng ) Ho c Nghĩa = nghĩa ph n ph (Câu t nh lư c nòng c t) 1.6. Cách dùng t Hán Vi t 1.6.1. Dùng t ñúng âm 1.6.2. Dùng t ñúng nghĩa
- - 13 - CHƯƠNG 2 - CÔNG C , MÔI TRƯ NG VÀ K THU T XÂY D NG KHO NG V NG TI NG HÁN VI T D A NGHĨA 2.1. Cơ s lý thuy t 2.1.1. V n ñ x lý ngôn ng t nhiên 2.1.1.1. Khái ni m X lý ngôn ng t nhiên là m t nhánh trong lĩnh v c ng d ng trí tu nhân t o nh m m c ñích: phân tích, nh n bi t, t ng h p ngôn ng t nhiên. Nó là cơ s chính ñ ñi vào các hư ng: hi u ngôn ng , d ch ngôn ng , x lý ti ng nói, x lý văn b n,… 2.1.2. Sơ lư c bài toán tách t ti ng Vi t 2.1.2.1. Khó khăn trong bài toán tách t ti ng Vi t 2.1.2.2. Các v n ñ trong bài toán tách t ti ng Vi t *. X lý nh p nh ng *. Nh n di n t chưa bi t 2.1.2.3. Phương pháp tách t dùng trong lu n văn - Phương pháp Maximum Matching (forward/backward) 2.1.3. T ñi n h c 2.1.3.1. M t s t ñi n thông d ng - T ñi n gi y - T ñi n ñi n t - T ñi n máy tính 2.1.3.2. M t vài nh n xét v hình th c lưu tr t ñi n 2.1.3.3. Bách khoa toàn thư m Wikipedia - Gi i thi u - Ho t ñ ng Cách th c thu th p d li u Ch n l c d li u
- - 14 - - Đánh giá Ưu ñi m Như c ñi m 2.1.4. Kho ng v ng d a nghĩa ti ng Hán Vi t 2.1.4.1. Vai trò c a kho ng v ng ti ng Hán Vi t d a nghĩa Kho ng v ng ti ng Hán Vi t d a nghĩa dùng ñ lưu tr t t c các t v ng ( t ñơn, t ghép), các ng , các c m t , các câu dài nh t có th và gi i thích nghĩa c a c a chúng. V i kho ng v ng ti ng Hán Vi t d a nghĩa, chúng ta có th xây d ng các công c khai thác giúp ích cho vi c d y - h c ti ng Hán Vi t cũng như phát tri n thêm các ng d ng khác như: Xây d ng t ñi n, b t l i chính t trong x lý văn b n ti ng Hán Vi t, nh n d ng ti ng Hán Vi t… ñ c bi t là dùng ñ gi i quy t bài toán d ch t ñ ng - m t trong nh ng bài toán khó ñ i v i ngành CNTT hi n nay. 2.1.4.2. N i dung c a kho ng v ng ti ng Hán Vi t d a nghĩa Kho ng v ng ti ng Hán Vi t d a nghĩa ch a m t s lư ng t ñáng k . V i kho ng v ng ñu c xây d ng hoàn toàn m , t t c m i ngư i có th s d ng, khai thác t v ng trong kho m t cách d dàng, thu n ti n. Bên c nh ñó, ngư i s d ng có th c p nh t thêm v n t v ng cho kho ng li u, sao chép toàn b kho ng li u ñ tri n khai trên nhi u ng d ng nh m ph c v cho nh ng m c ñích khác nhau. 2.1.4.3. Tình tr ng c a kho ng v ng ti ng Hán Vi t d a nghĩa Kho ng v ng luôn ñ t trong tr ng thái m . D li u trong kho ñư c c p nh t thư ng xuyên, ngày càng phong phú, ña d ng, d ti p c n, d khai thác. Bên c nh ñó, do thu c tính m c a kho nên m i ngư i ñ u có th c p nh t tài nguyên trong kho. 2.2. Môi trư ng, công c xây d ng ng d ng 2.2.1. Ngôn ng s d ng
- - 15 - 2.2.1.1. Ngôn ng XML 2.2.1.2. Ngôn ng MySQL 2.2.1.3. Ngôn ng PHP 2.2.1.4. Ngôn ng CSHARP (C#) 2.2.2. Chu n b ng li u 2.2.3. Môi trư ng, công c th c hi n ng d ng ñư c xây d ng trên môi trư ng Windows, s d ng ngôn ng l p trình C# ñ cài ñ t. Môi trư ng cài ñ t Microsoft Visual Studio.Net 2005 truy xu t d li u t XML.
- - 16 - CHƯƠNG 3 - GI I PHÁP XÂY D NG KHO NG V NG D A NGHĨA T HÁN VI T 3.1. Phương pháp xây d ng kho ng v ng d a nghĩa t Hán Vi t 3.1.1. Quy mô Chúng ta xác ñ nh trong ñ tài này, ta ch d ng l i vi c làm th nào ñ t o ra ñư c kho ng v ng d a nghĩa. Đ thu th p d li u cho kho ng v ng này, th c hi n các công vi c sau: - Xây d ng c u trúc c a kho. - Thêm t v ng m i vào kho. - Gi i thích t v ng. 3.1.2. Ho t ñ ng Ta s xây d ng m t kho ng v ng ti ng Hán Vi t ho t ñ ng theo hư ng m ñ i v i d li u. Đ làm ñư c ñi u này, ta s xây d ng m t Website ñ thu th p d li u cho kho ng v ng, m i thành viên c a Website ñ u có th c p nh t, s a ñ i và góp ý ki n v i d li u c a kho ng v ng ti ng Vi t d a nghĩa. 3.1.3. Ch n l c d li u 3.1.3.1. Cách th c l a ch n chuyên gia Như ñã trình bày trên, d li u trong kho ng v ng ti ng Hán Vi t d a nghĩa s ñư c l y ý ki n t các thành viên và quy t ñ nh b i các chuyên gia, chuyên gia c a Website là nh ng thành viên có m t s ñóng góp nh t ñ nh, ñư c ñ xu t và quy t ñ nh ch n hay không ph thu c vào ngư i qu n lý Website. 3.1.3.2. Ch n l c d li u D li u c a Website ñư c t p h p t hai ph n Ph n g c
- - 17 - Đư c t p h p lúc tri n khai ñ tài, d li u này do ngư i qu n lý Website nh p tay, trích xu t t các b t ñi n ho c l y d li u t Internet. D li u này v n ñư c s a ñ i t các thành viên trong quá trình tri n khai ñ tài. Ph n b sung Trong m i th i ñi m, d li u s ñư c c p nh t, b sung b i các thành viên tham gia Website (ngư i dùng). D li u s ñư c chính th c c p nh t vào kho ng v ng ti ng Hán Vi t d a nghĩa theo quy ñ nh như sau: - Ngư i dùng nh p d li u b sung ho c thay ñ i d li u có s n. - Các d li u m i s ñư c n d u b i chương trình. - Sau m t th i gian các chuyên gia ph i xác ñ nh ñ ơc d li u c p nh t ho c thay ñ i có h p l hay không? Sau ñó s ñánh d u vào d li u. - Căn c vào ñánh d u c a chuyên gia chương trình s t ñ ng hi n th ho c xoá các d li u. 3.1.4. Mô hình Chương trình thu th p t v ng cho kho ng v ng ti ng Hán Vi t d a nghĩa ñư c ñ xu t trong ñ tài này là: Thi t l p m t trang Web m mi n phí trên Internet. Ngư i s d ng có th tra c u thông tin v t v ng ti ng Hán Vi t cũng như c p nh t và s a ñ i ñư c n i dung d li u t v ng. Các ch c năng chính c a Website bao g m: - Tra c u t ñi n ti ng Hán Vi t Online. - C p nh t và s a ñ i n i dung t ñi n. - Quy t ñ nh c a chuyên gia v tính ñúng ñ n c a d li u. - Sân chơi nh m nâng cao các ki n th c v ti ng Hán Vi t. 3.2. Phân tích và thi t k h th ng chương trình
- - 18 - 3.2.1. Mô hình t ng quát h th ng D li u l y t internet ho c ngư i dùng Thu th p d li u cho trò chơi CSDL thô C p nh t d li u vào kho d li u thô Thu th p d li u t Ngư i s d ng website trò chơi CSDL trung gian C p nh t d li u vào kho trung gian Tinh l c d a vào k t qu ñánh giá c a ngư i s d ng C p nh t vào CSDL chính th c C p nh t vào CSDL chính th c CSDL chính th c Hình 3.1. Mô hình t ng quát h th ng 3.2.2. Mô hình Use case h th ng System Dang ky Choi tro choi Guest Tra cuu Dang nhap Danh gia User Quan ly ngan hang tu Administrator Quan ly dang nhap Hình 3.2. Mô hình Use case h th ng
- - 19 - 3.3. Chương trình thu th p d li u cho kho ti ng Hán Vi t d a nghĩa 3.3.1. Sơ ñ ho t ñ ng c a chương trình H TH NG CH C NĂNG Ch c năng hi n Ch c năng t o Ch c năng Tra c u th qu n tr thông Sân Chơi Th ng kê qu n tr tin Hi n th Bài Th ng kê Tìm ki m t t c chung 1 ngư i chơi Hán vi t qu n tr Hi n th Bài Th ng kê t ngư i dùng 2 Hán Vi t C p nh t Hi n th Bài Đánh giá vào kho DN 3 chuyên gia qu n tr hình nh Hình 8. Sơ ñ ho t ñ ng c a chương trình Hình 3.3. Sơ ñ ch c năng h th ng 3.3.2. Gi i thích sơ ñ Khi vào website, ngư i s d ng có th làm m t s công vi c sau: Tra c u t v ng -N u t v ng có trong kho thì hi n th thông tin t v ng -N u không có t v ng này thì màn hình s báo không có t v ng này trong kho Đăng nh p -N u ngư i dùng chưa có tài kho n: T o m t tài kho n m i -N u ngư i dùng ñã có tài kho n: Sau khi ñăng nh p thành công, ngư i dùng có th s a ñ i l i các thông tin v tài kho n.
- - 20 - Thêm ho c thay ñ i thông tin t -Ngư i dùng ph i ti n hành ñăng nh p, ch ngư i nào là thành viên c a Website m i có th th c hi n m c này. -Sau khi t ñư c thêm ho c s a ñ i l i s ñư c ñưa vào CSDL t m th i, ñư c các chuyên gia x lý và quy t ñ nh ñưa vào kho ng v ng ti ng Vi t d a nghĩa hay không? Sân chơi -Đ chơi ñư c, ngư i s d ng ph i có tài kho n t i Website và ñăng nh p thành công. -Chương trình s hi n th lu t chơi và m t s liên k t, ngư i chơi có th : +Xem thông tin v tài kho n: Thông tin v tài kho n g m các thông tin như: H tên, vòng chơi, ñi m s m i vòng chơi, th i gian m i vòng chơi, c p b c… +Vào chơi: M i vòng chơi, ngư i chơi ph i ti n hành 3 bài t p Bài t p 1: -H th ng s ñưa ra 1 câu ti ng Hán Vi t b t kỳ ( câu ti ng Hán Vi t này ñư c l y t kho d li u trung gian). -Ngư i chơi ph i tách ra thành nh ng t có nghĩa. -Các t này s ñư c ñưa vào kho d li u thô Bài t p 2: -H th ng s hi n th lên các t ñư c tách bài t p 1. -Ngư i chơi s ghép các t ñó thành các t , c m t , câu có nghĩa trong ti ng Hán Vi t -Các t và c m t này s ñư c c p nh t vào kho d li u thô. Bài t p 3:
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Tóm tắt Luận văn Thạc sĩ Luật học: Xử lý hợp đồng lao động vô hiệu theo pháp luật Việt Nam
19 p | 278 | 71
-
Luận văn Thạc sĩ Ngôn ngữ học: Tìm hiểu ca từ của nhạc sĩ trẻ (qua các ca khúc tiếng Việt được yêu thích trên trang mạng mp3.zing.vn trong năm 2012)
341 p | 180 | 39
-
Luận văn thạc sĩ: Tìm hiểu web ngữ nghĩa, xây dựng ứng dụng tìm kiếm tài liệu tiếng Việt
13 p | 215 | 32
-
Luận văn thạc sĩ Sinh học: Tìm hiểu ảnh hưởng của liều lượng và thời điểm bón phân Kali đến khả năng chịu hạn cho giống ngô CP 888 tại xã EaPhê huyện Krông Pắc tỉnh Đăk Lăk
110 p | 180 | 31
-
Luận văn Thạc sĩ Quản trị kinh doanh: Nâng cao chất lượng cán bộ, công chức cấp xã tại Yên Khánh Ninh Bình
0 p | 137 | 29
-
Luận văn thạc sĩ: Tìm hiểu công nghệ tri thức, xây dựng hệ thống hỏi đáp phục vụ giảng dạy môn Vật Lý trường THPT
13 p | 114 | 27
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Ứng dụng web ngữ nghĩa và khai phá dữ liệu xây dựng hệ thống tra cứu, thống kê các công trình nghiên cứu khoa học
26 p | 159 | 17
-
Tóm tắt luận văn Thạc sĩ: Tìm hiểu mô hình quản lý và truy xuất dữ liệu đám mây IDRAGON ứng dụng cho thiết bị di động
29 p | 133 | 16
-
Luận văn thạc sĩ: Tìm hiểu ngữ nghĩa tiếng Việt xây dựng kho ngữ vựng dựa nghĩa trong xử lý tiếng Việ
26 p | 113 | 12
-
Luận văn thạc sĩ: Tìm hiểu hiện tượng nhập nhằng trong tiếng Việt và khả năng khắc phục trong soạn thảo văn bản
26 p | 63 | 12
-
Luận văn Thạc sĩ Công nghệ thông tin: Ứng dụng đồ thị Euler tối ưu hóa bài toán tìm đường đi ngắn nhất
79 p | 49 | 10
-
Luận văn Thạc sĩ Công tác xã hội: Dịch vụ công tác xã hội trong hỗ trợ tìm kiếm việc làm cho người nghèo tại xã Võng Xuyên, huyện Phúc Thọ, thành phố Hà Nội
154 p | 40 | 9
-
Tóm tắt luận văn Thạc sĩ Kỹ thuật: Khai phá luật kết hợp mờ đa cấp và ứng dụng
26 p | 127 | 8
-
Luận văn thạc sĩ: Tìm hiểu công nghệ kim xây dựng ứng dụng chú giải ngữ nghĩa tự động
14 p | 71 | 5
-
Luận văn Thạc sĩ Máy tính: Nghiên cứu thuật toán filter-wrapper tìm tập rút gọn của bảng quyết định không đầy đủ và ứng dụng phát hiện tàu thuyền từ ảnh vệ tinh
67 p | 23 | 5
-
Luận văn Thạc sĩ Công nghệ thông tin: Kỹ thuật Matrix Factorization trong xây dựng hệ tư vấn
74 p | 39 | 4
-
Luận văn Thạc sĩ ngành Máy tính: Ứng dụng mã nguồn mở ElasticSearch vào hệ thống tìm kiếm danh bạ y tế hiệu quả
98 p | 38 | 4
-
Luận văn Thạc sĩ Luật học: Tìm hiểu pháp luật quốc tế, pháp luật một số nước trên thế giới và liên hệ với pháp luật Việt Nam về hoạt động thăm dò, khai thác, sử dụng khoảng không vũ trụ
138 p | 22 | 2
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn