Luận văn: Phương pháp thêm dấu tiếng việt vào văn bản tiếng việt không dấu
lượt xem 19
download
Chữ tiếng việt của chúng ta cố một đặc điểm rất hay là có sự xuất hiện của các dấu thanh cũng như dấu của các ký tự, việc này giúp cho tiếng Việt thêm thanh thêm điệu. Tuy nhiên cũng chính việc thêm thanh thêm điệu đó lamg cho việc gõ tiếng Việt tốn nhiều thời gian hơn. 1 vấn đề khác khi sử dụng internet trở nên thông dụng, 1 tiện ích được mọi người ưa chuộng là dịch vụ E-mail, nhưng hầu hết các server đều chưa hỗ trợ tiếng Việt...
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Luận văn: Phương pháp thêm dấu tiếng việt vào văn bản tiếng việt không dấu
- TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN CÔNG NGH TRI TH C PHAN QU C LÂN PH NG PHÁP THÊM D U TI NG VI T VÀO V N B N TI NG VI T KHÔNG D U KHOÁ LU N C NHÂN TIN H C TP. HCM, N M 2005
- TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN CÔNG NGH TRI TH C PHAN QU C LÂN – 0112267 PH NG PHÁP THÊM D U TI NG VI T VÀO V N B N TI NG VI T KHÔNG D U KHOÁ LU N C NHÂN TIN H C GIÁO VIÊN H NG D N Th.S PH M PH M TUY T TRINH NIÊN KHÓA 2001 – 2005 1
- ic m n i u tiên, em xin chân thành c m n cô Ph m Ph m Tuy t Trinh, cô ã tr c ti p h ng d n và t o u ki n cho em nghiên c u và hoàn thành lu n v n này. Em c ng xin chân thành c m n th y inh n, th y ã h tr , giúp em r t nhi u trong quá trình th c hi n. Và em c ng xin c m n t t c các th y cô trong khoa Công ngh thông tin ã t n tình ch b o và giúp em trong su t quá trình h c t p trong tr ng. Con xin chân thành c m n ba m , ông bà, anh em và ng i thân trong gia ình ãt om i u ki n t t nh t cho con h c t p và ng viên, khích l con trong quá trình th c hi n lu n v n. Và cu i cùng, tôi xin g i l i c m n n t t c b n bè, c bi t là anh Toàn, b n Sinh, b n Kh ng …, nh ng ng i ã h tr và giúp tôi hoàn thi n lu n v n này. c dù em ã c g ng hoàn thành lu n v n trong ph m vi và kh n ng cho phép nh ng ch c ch n s không tránh kh i nh ng thi u sót. Em kính mong nh n cs m thông và t n tình ch b o c a quý Th y Cô và các b n. TP. H Chí Minh, tháng 7 n m 2005 Phan Qu c Lân – 0112267 2
- NH N XÉT C A GIÁO VIÊN H NG D N ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ Thành ph H Chí Minh, tháng 07 n m 2005 Giáo viên h ng d n Th.S Ph m Ph m T uy t Trinh 3
- NH N XÉT C A GIÁO VIÊN PH N BI N ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ Thành ph H Chí Minh, tháng 07 n m 2005 Giáo viên ph n bi n TS. inh n 4
- I NÓI U Ch vi t ti ng Vi t c a chúng ta có 1 c m r t hay là có s xu t hi n c a các u thanh c ng nh d u c a các ký t . u này giúp cho ti ng Vi t “thêm thanh, thêm u”. Tuy nhiên, c ng chính vi c “thêm thanh, thêm u” ó làm cho vi c gõ ti ng Vi t tr nên t n nhi u th i gian h n. 1 v n khác, khi vi c s d ng Internet tr nên thông d ng, 1 ti n ích c m i ng i a chu ng là d ch v Email. Nh ng, cho n hi n nay, h u h t các mail server v n ch a h tr t t ti ng Vi t, do ó, tình tr ng các lá mail trên m ng h u nh không có d u. Vi c phát tri n 1 công c giúp thêm d u ti ng Vi t vào v n b n không d u là vi c r t c n thi t và thú v . tài này h ng n vi c gi i quy t bài toán thêm d u ti ng Vi t theo m t ng m i, do ó, ch ng trình không chú tr ng chuyên sâu vào l nh v c nào. Vi c thêm ch c n ng h tr các l nh v c chuyên sâu khác không nh h ng nhi u nc u trúc c a mô hình mà ch ng trình áp d ng. Lu n v n c t ch c thành 5 ch ng v i n i dung nh sau : § Ch ng 1 gi i thi u t ng quan v bài toán Thêm d u ti ng Vi t vào v n b n không d u, và các công trình ã có liên quan n tài. § Ch ng 2 gi i thi u các c s lý thuy t _ tin h c c n s d ng. § Ch ng 3 nh n xét các mô hình ã có tr c ây, và a ra mô hình cài t chính. § Ch ng 4 c th hóa mô hình cài t. § Ch ng 5 t ng k t và ra h ng phát tri n .
- CL C Ch ng 1. NG QUAN....................................................................9 1.1. Gi i thi u v bài toán Thêm d u ti ng Vi t vào v n b n không d u .......10 1.1.1. Phát bi u bài toán.........................................................................................10 1.1.2. c m .......................................................................................................10 1.1.3. ng gi i quy t ..........................................................................................11 1.2. Gi i thi u các công trình ã có ..................................................................11 1.2.1. AMPad..........................................................................................................11 1.2.2. VietPad .........................................................................................................12 1.2.3. www.EasyVn.com.........................................................................................13 1.2.4. VnMark ........................................................................................................14 Ch ng 2. S LÝ THUY T TIN H C....................................15 2.1. Lý thuy t v ngôn ng h c .........................................................................16 2.1.1. Âm ti t (còn g i là “ti ng”) ..........................................................................16 2.1.1.1. nh ngh a và c m âm ti t ti ng Vi t ..............................................16 2.1.1.2. Thanh là thành ph n c a âm ti t ti ng Vi t .............................................16 2.1.1.3. T i sao l i ph i dùng d u thanh ? ............................................................17 2.1.2. ..................................................................................................................18 2.1.2.1. Các quan ni m v t ...............................................................................18 2.1.2.2. Tiêu chí nh n di n “t ” ti ng Vi t...........................................................18 2.1.2.2.1. Các tiêu chu n v hình th c .................................................................19 2.1.2.2.2. Các tiêu chu n v n i dung ..................................................................19 2.2. Tách t ........................................................................................................20 2.2.1. Kh p t i a (LRMM – Left Right Max Matching).....................................21 2.2.2. Mô hình m ng WFST và m ng n -ron .......................................................22 2.3. Tách câu......................................................................................................22 2.3.1. Tách câu b ng Heristics. ..............................................................................23 2.3.1.1. X lý d u ch m. .....................................................................................23 2.3.1.2. X lý d u ch m trong ngo c. ..................................................................24 Ch ng 3.MÔ HÌNH CÀI T ......................................................25 3.1. Các mô hình thêm d u ã c s d ng...................................................26 3.1.1. VietPad .........................................................................................................26 3.1.1.1. Mô hình thêm d u ti ng Vi t ..................................................................26 3.1.1.1.1. Ti n x lý ............................................................................................26 3.1.1.1.2. Tách token...........................................................................................27 3.1.1.1.3. L y ra các t không d u, chuy n thành t có d u .................................27 3.1.2. VnMark ........................................................................................................28 6
- 3.1.2.1. Mô hình thêm d u ti ng Vi t ..................................................................28 3.1.2.1.1. Ti n x lý ............................................................................................30 3.1.2.1.2. Tách câu ..............................................................................................30 3.1.2.1.3. Tìm các kh n ng ánh d u c a t , câu ................................................30 3.1.2.2. Mô hình hu n luy n ................................................................................31 3.2. Mô hình xu t..........................................................................................32 3.2.1. Mô hình.........................................................................................................32 3.2.1.1. Tách câu .................................................................................................33 3.2.1.2. Tách t b ng ph ng pháp LRMM.........................................................34 3.2.1.3. Ch n t thích h p ...................................................................................34 3.2.2. Mô hình hu n luy n .....................................................................................36 3.2.2.1. Th ng kê t n su t xu t hi n c a t ..........................................................36 3.2.2.1.1. Xây d ng kho ng li u.........................................................................36 3.2.2.1.2. Th ng kê t n su t xu t hi n c a t .......................................................37 3.2.2.1.3. T o t n chuy n i ........................................................................38 3.2.2.2. Trích xu t các c m t th ng s d ng ....................................................39 3.2.3. So sánh mô hình này v i 2 mô hình trên .....................................................41 Ch ng 4.CÀI T TH NGHI M.............................................43 4.1. Th ng kê t n s xu t hi n c a t ...............................................................44 4.1.1. Xây d ng kho ng li u text t báo n t ..................................................44 4.1.2. Tách câu........................................................................................................48 4.1.3. Tách t và th ng kê......................................................................................50 4.2. o t p tin t n chính............................................................................52 4.3. o t p tin t n c m t .........................................................................55 4.3.1. o kho d li u tinh gi n m i ......................................................................55 4.3.2. o t p tin t n c m t ...........................................................................58 4.4. Ch ng trình chính....................................................................................58 4.4.1. Ch ng trình VietEditor..............................................................................59 4.4.2. Ch ng trình thêm d u qua Clipboard.......................................................60 4.5. Th nghi m ................................................................................................62 Ch ng 5. T QU , H NG PHÁT TRI N .............................63 5.1. n ch và h ng phát tri n .....................................................................64 5.2. t lu n ......................................................................................................64 Ph l c : C u trúc kho ng li u ......................................................67 7
- DANH M C HÌNH Hình 1.2.1-1 : Thêm d u ti ng Vi t t ng b ng AMPad ......................................................12 Hình 1.2.2-2 : Gõ ti ng Vi t không d u trên VietPad .............................................................12 Hình 1.2.2-3 : V n b n sau khi th c hi n ch c n ng thêm d u ti ng Vi t c a VietPad ...........13 Hình 1.2.3-4 : Gõ ti ng Vi t không d u trên EasyVn..............................................................14 Hình 1.2.3-5 : V n b n sau khi t ng thêm d u trên EasyVn ..............................................14 Hình 1.2.4-6 : S k t c u âm ti ng Vi t .............................................................................17 Hình 3.1.1-7 : L u th c hi n c a mô hình ng d ng trong VietPad...................................26 Hình 3.1.2-8 : L u th c hi n c a mô hình n-gram ............................................................29 Hình 3.2-9: L u th c hi n c a mô hình xu t ................................................................33 Hình 3.2-10 : T p tin m u sau khi th ng kê t n su t t ..........................................................38 Hình 3.2-11 : Trích t p tin TuDienChinh.txt ..........................................................................39 Hình 3.2-12 : Trích t p tin CumTu.txt....................................................................................41 Hình 4.1.1-13: Giao di n ch ng trình HTML2TXT ..............................................................44 Hình 4.1.1-14: C u hình c a ch ng trình HTML2TXT.........................................................45 Hình 4.1.1-15 : M t trang báo thanh niên..............................................................................47 Hình 4.1.1-16 : li u c tách t trang báo Thanh niên ...................................................48 Hình 4.1.2-17: Giao di n ch ng trình Tách Câu ..................................................................49 Hình 4.1.2-18: T vi t t t cung c p cho ch ng trình Tách Câu............................................49 Hình 4.1.2-19: N i dung file k t xu t c a ch ng trình Tách Câu .........................................50 Hình 4.1.3-20: Giao di n module tách t ...............................................................................51 Hình4.1.3-21: N i dung t p tin th m c ngu n ......................................................................51 Hình 4.1.3-22: N i dung t p tin t n .................................................................................52 Hình 4.1.3-23: N i dung t p tin k t qu .................................................................................52 Hình 4.1.3-24: Giao di n ch ng trình t o t n chính .......................................................53 Hình 4.1.3-25 : Trích 1 ph n TuDienChinh.txt .......................................................................54 Hình 4.1.3-26 : Trích 1 ph n TuDienPhanLop.txt .................................................................54 Hình 4.1.3-27: Trích 1 ph n KhoCau.txt ................................................................................55 Hình 4.3.1-28: Giao di n ch ng trình t o kho d li u tinh gi n ...........................................56 Hình 4.3.1-29 : Trích 1 ph n th m c k t xu t .......................................................................57 Hình 4.3.1-30 : Th m c con _a trong th m c k t xu t.........................................................57 Hình 4.3.2-31: Giao di n ch ng trình t o t p tin c m t .....................................................58 Hình 4.4.1-32: Giao di n ch ng trình chính VietEditor .......................................................59 Hình 4.4.2-33: Giao di n ch ng trình chính thêm d u Clipboard ........................................60 Hình 4.4.2-34: Test ch ng trình thêm d u Clipboard ...........................................................61 Hình 5.2-35 : T p tin kho ng li u m u .................................................................................69 8
- NG QUAN Ch ng 1.
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u 1.1. Gi i thi u v bài toán Thêm d u ti ng Vi t vào n b n không d u 1.1.1. Phát bi u bài toán Bài toán có th c phát bi u nh sau : Cho m t v n b n ti ng Vi t không u. Chuy n v n b n không d u này thành có d u v i chính xác cao. Ch s d ng t n t và kho ng li u thô làm u vào. Khái ni m t ây là “t t n” – t c là các t n, t ghép và c m t c l u trong t n. Ch x lý các v n b n ti ng Vi t có mã Unicode. 1.1.2. c m Ch vi t ti ng Vi t có 1 c m r t hay là s xu t hi n c a các d u thanh ng nh d u c a các ký t . Vi c có d u thanh và d u c a ký t này làm phong phú thêm cho ngôn t ti ng Vi t, và c ng góp ph n t ng bi u c m c a ti n g Vi t. u thanh là 1 thành ph n “b t kh phân” trong âm ti t ti ng Vi t [8]. Khi lo i b d u thanh, vi c hi u ngh a c a t , g m 1 hay nhi u âm ti t k t h p v i nhau, tr nên khó kh n và d gây hi u l m. thêm d u, tr c tiên, ta c n ph i xác nh ranh gi i t . Bài toán xác nh ranh gi i t i v i v n b n ti ng Vi t có d u ã là 1 vi c th thách, thì khi không có d u, vi c nh n di n ranh gi i t càng tr nên khó kh n h n. V n này l i càng khó kh n, khi ranh gi i t trong ti ng Vi t c ng nh 1 s ngôn ng Châu Á khác, m t t chính t có th không t ng ng v i m t “t ” trên v n n. i v i các th ti ng Châu Âu, ta có th d dàng nh n ra m t t , do các t c phân cách b i kho ng tr ng. u này l i không úng v i ti ng Vi t. Trong ti ng Vi t, các ti ng _ hay còn g i là âm ti t _ c phân cách b i kho ng tr ng, ch không ph i t . 10
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Sau khi ã nh n di n c ranh gi i t , ta c n ph i xác nh cho úng t có u nào có d ng th hi n không d u nh v y. Vi c xác nh này c ng gây nhi u khó kh n, khi 1 t không d u có th có nhi u t có d u t ng ng v i nó. Ví d 1-1 : T không d u “toi” có 3 t có d u t ng ng là “tôi”, “t i” và “t i”. Do ó, sau khi ã gi i quy t xong bài toán tách t ti ng Vi t không d u, ta n ph i gi i quy t thêm bài toán xác nh t có d u thích h p v i t không d u ó. ây chính là 2 bài toán c n gi i quy t chính c a mô hình. 1.1.3. ng gi i quy t i v i tách t có d u, có nhi u mô hình c s d ng và t k t qu cao nh MM (Maximum Matching : forward / backward hay còn g i là LRMM: Left Right); gi i thu t h c c i bi n TBL; m ng chuy n d ch tr ng thái h u h n có tr ng s WFST (Weighted finite-state Transducer); gi i thu t d a trên nén (compression) [1] …. H ng gi i quy t c xu t là s d ng ph ng pháp tách t LRMM [1][7] k t h p v i mô hình Bigram ã gi i quy t khá hi u qu 2 n c a bài toán này. Ph ng pháp ch m i c áp d ng cho mô hình thêm u offine, nh ng có th c cài t gán d u online. 1.2. Gi i thi u các công trình ã có 1.2.1. AMPad AMPad [12] (tên version c và thông d ng v i m i ng i là AutoMark) a tác gi Tr n Tri t Tâm là s n ph m u tiên nghiên c u v l nh v c này. Ch ng trình ã c nhi u ng i bi t n và c s d ng r ng rãi. u này cho th y vi c phát tri n ng d ng hoàn thi n h n n a v thêm d u ti ng Vi t là có nhu c u, và nhu c u này s ngày càng t ng cao. Ch ng trình AMPad có 11
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u m hay là vi c áp d ng mô hình x lý thêm d u ch online, t o s tr c quan, thân thi n cho ng i s d ng. Hình 1.2.1-1 : Thêm d u ti ng Vi t t ng b ng AMPad 1.2.2. VietPad Vietpad [11] là trình so n th o h tr ti ng Vi t Unicode, c phát tri n i Quân Nguy n và nhóm phát tri n trên http://vietpad.sourceforge.net. Ngoài ch c n ng thêm d u t ng offline mà lu n v n ang nghiên c u, VietPad còn là 1 trình so n th o ti ng Vi t h tr r t t t Unicode và là mã ngu n m . Hình 1.2.2-2 : Gõ ti ng Vi t không d u trên VietPad 12
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Hình 1.2.2-3 : V n b n sau khi th c hi n ch c n ng thêm d u ti ng Vi t c a VietPad 1.2.3. www.EasyVn.com Trang web www.easyvn.com [10] cung c p d ch v email n t mi n phí trên m ng, v i s h tr ng i dùng r t t t v ngôn ng Vi t. 1 ch c n ng n i t c a www.easyvn.com là : sau khi so n th o xong b c mail, ng i dùng có th ch n ch c n ng Thêm d u ti ng Vi t bi n v n b n không d u thành có u. Do ây là d ch v c cung c p và thu phí trên NET (cho s d ng th trong 2 tháng), mô hình thêm d u t ng c a www.easyvn.com c gi kín. 13
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Hình 1.2.3-4 : Gõ ti ng Vi t không d u trên EasyVn Hình 1.2.3-5 : V n b n sau khi t ng thêm d u trên EasyVn 1.2.4. VnMark VnMark [2] c tác gi Nguy n V n Toàn phát tri n. Do tác gi ã làm th t l c ch ng trình, do ó, không có hình nh minh ho ch ng trình. 14
- S LÝ THUY T Ch ng 2. TIN H C
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u 2.1. Lý thuy t v ngôn ng h c 2.1.1. Âm ti t (còn g i là “ti ng”) 2.1.1.1. nh ngh a và c m âm ti t ti ng Vi t “Ti ng” là “ n v c b n” trong ti ng Vi t [1]. M t “ti ng” trong ti ng Vi t c nói lên là m t n v ng âm, và c ng là m t n v ng pháp. t “ti ng” là m t n v phát ngôn, và là m t n v c a l i nói t o ra nh ng k t c u l i nói trong ho t ng nói n ng giao ti p. c tính này c a ti ng chính là m t tính cách lo i hình c a ti ng Vi t, trong ó m i nv phát âm trùng khít v i n v ng pháp (hình v , và t ). Khi xét trên bình di n ng âm, ti ng là m t n v c a ng âm, t c là m t âm ti t [9]. Vi c nh n di n “ti ng” i v i ng i Vi t là u quá d dàng, t nhiên i v i m i ng i mà không c n m t trình ngôn ng gì cao, vì : trong l i nói (m t ng âm), m i “ti ng” bao gi c ng phát ra m t h i, nghe thành m t ti ng, và có mang m t thanh u nh t u; còn trong ch vi t (m t chính ), m i ti ng bao gi c ng c vi t r i thành t ng ch (ng n cách b ng kho ng tr ng hay các d u ng t). n v “ti ng” i v i ng i Vi t là m t n v t nhiên, khái ni m “ti ng” ã có t lâu và c ng i b n ng s ng nó tr c khi hi u và s d ng khái ni m “t ”. Ví d 2-1: Câu “Cái bàn này hình bán nguy t” có 6 ti ng 2.1.1.2. Thanh là thành ph n c a âm ti t ti ng Vi t Khi phát âm ti ng Vi t, chúng ta phát âm t ng n v l i nói c t r i nhau, i là âm ti t. Khi phát âm ch m m t â m ti t, có th nh n th y khá rõ là m i âm ti t u có th k t h p nhi u nh t là ba n v phát âm : âm u + âm chính + âm cu i. Ba thành ph n trên g m nh ng âm v xu t hi n t ng i theo th t tr c sau, nên g i là nh ng âm v tuy n tính. 16
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Ngoài ra, m i âm ti t c nh m t b c cao th p, g i là thanh u. Trong l i nói, m i âm ti t ti ng Vi t u mang m t thanh. Thanh này xu t hi n l p t c khi âm ti t c phát ra, cho nên có th nói r ng thanh là m t thành ph n b t kh phân c a âm ti t. Thanh là thành ph n âm v phi tuy n tính c a m t âm ti t ti ng Vi t. Thanh là m t s c thái c a âm thanh các âm ti t, qua ó khi phát âm s nh b c cao th p khác nhau c a m i nv c a chu i l i nói. Có sáu thanh làm tiêu chu n nh b c cao th p khác nhau, th ng g i là ngang, h i, s c, huy n, ngã, n ng. Nh v y thì m i âm ti t ti ng Vi t y có t i a b n n v c u thành. i thi u thì m i âm ti t c ng ph i có hai thành ph n : âm chính + thanh. Hình 1.2.4-6 : S k t c u âm ti ng Vi t 2.1.1.3. i sao l i ph i dùng d u thanh ? Các ngôn ng dùng b ng ch cái Latin không dùng thêm kí hi u ch thanh, mà ch ghi l i các âm v tuy n tính b ng các v là con ch . H th ng ch vi t kh i vuông nh ch Hán và ch Nôm c ng không có kí hi u ch thanh. Nh ng tr ng h p ch qu c ng có khác. Khi dùng b ng ch cái Latin, các v con ch ch a phân bi t ý ngh a m t t c vi t ra, vì có n sáu thanh ph i phân bi t. Ðã ành thanh ch là y u t ng âm không thu c v thành ph n â m v tuy n tính, nh ng thanh ti ng Vi t không h n ch là m t y u t ngôn u mang tính cách hoa m cho âm ti t, mà là m t thành ph n không th thi u c khi phát âm m t âm ti t. Nói cách khác, âm ti t ti ng Vi t ch a hoàn ch nh khi ch a c nh thanh. Có l các nhà sáng ch ra ch vi t theo b ng ch cái Latin mà ta th ng g i quen là "ch qu c ng " 17
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u ã hi u r t rõ tính cách b t kh phân c a thanh i v i âm ti t ti ng Vi t, cho nên các v ã dùng n nh ng kí hi u c h th các b c thanh t ng ng. Và ây c ng là c m n i b t c a ti ng Vi t. 2.1.2. 2.1.2.1. Các quan ni m v t Có 1 s nh ngh a n hình v t nh sau [1] : - Theo L.Bloomfield, thì t là t hình thái t do nh nh . - Theo Solncev thì là n v ngôn ng có tính hai m t: âm và ngh a. có kh n ng c l p v cú pháp khi s d ng trong l . - Theo B.Golovin, thì t là n v nh nh t có ngh a c a ngôn ng , c n d ng c l p, tái hi n t do trong l i nói xây d ng nên câu . ây ng chính là nh ngh a mà trong ngôn ng h c ic ng hay s d ng. Trong n i dung lu n v n này, ta quan tâm t i 3 thu t ng trong ngôn ng ic ng nh n di n t : 1. ng âm : ó là nh ng nv c th ng nh t v i hi n t ng ng âm nào ó. i v i ti ng Vi t, ó chính là nh ng âm ti t, hay còn g i là “ti ng”, “ti ng m t”. 2. chính t : ó là nh ng kho ng cách gi a 2 ch trên v n t , t c là nh ng nv c vi t li n thành kh i, i v i ti ng Vi t, ó chính là “ch ” 3. t n h c : ó là n v mà c n c vào c m ý ngh a c a nó ph i x p riêng trong t n. 2.1.2.2. Tiêu chí nh n di n “t ” ti ng Vi t r t nhi u quan ni m c ng nh các nh ngh a v “t ti ng Vi t”, ta có th rút ra tiêu chu n mà các nhà Vi t ng h c ã d a vào ó khi nh n di n t 18
- Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u ti ng Vi t [3]. Các tiêu chu n này chung qui ta có th phân thành : các tiêu chu n v hình th c và các tiêu chu n v n i dung. 2.1.2.2.1. Các tiêu chu n v hình th c Tính c nh : tính v ng ch c v c u t o, không th chêm – xen c Tính c l p : các nhà Vi t ng h c hay dùng tiêu chu n tính cl p phân bi t t ( n v có ngh a và c l p) v i hình v ( n v có ngh a và không c l p). Tính c l p còn c g i là kh n ng k t h p (t do – h n ch ) Tính t lo i và quan h cú pháp : trong ng /câu, t m nh n nh ng ch c n ng cú pháp nh t nh, nên m i t u ph i mang m t t lo i nào ó, còn hình v thì không có tính ch t t lo i. Quan h gi a các t là quan h cú pháp, còn quan h gi a các hình v c a t không ph i là quan h cú pháp. 2.1.2.2.2. Các tiêu chu n v n i dung Ch c n ng nh danh : ch c n ng này c dùng xác nh t cách c a (t th c), coi ó là c tr ng phân bi t gi a “t ” v i “hình v ” Bi u th khái ni m : vì t v i khái ni m không ph i là m t: có nh ng khái ni m c n bi u th b ng nhi u t , và có nh ng t không bi u th khái ni m. Ý ngh a bi u ni m : vì ý ngh a c a t và khái ni m không trùng nhau, vì y, ng i ta c n phân bi t ý ngh a t v ng và ý ngh a ng pháp. Hoàn ch nh v ngh a : ây là tiêu chu n quan tr ng, c a s các nhà Vi t ng h c ch p nh n trong vi c xác nh t cách c a t . Tiêu chu n này liên quan n tính thành ng và tính võ oán. 19
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Hình thức trình bày Luận văn Thạc sỹ - Dương Quý Phương
26 p | 1988 | 791
-
Luận văn tốt nghiệp “Những giải pháp chủ yếu nhằm đẩy mạnh tiến trình cổ phần hoá của Tổng công ty Dầu khí Việt Nam”
96 p | 323 | 141
-
Tiểu luận:Phương Pháp Sáng Tạo Ứng Dụng Trong Mạng Xã Hội
14 p | 179 | 42
-
LUẬN VĂN: Ứng dụng mô hình dịch máy thống kê cho bài toán bỏ dấu cho văn bản Tiếng Việt
45 p | 128 | 23
-
Luận văn:Nghiên cứu tổng hợp dấu hiệu nhận dạng hư hỏng cơ bản trong hệ truyền động cơ khí bằng phân tích dao động
27 p | 105 | 14
-
Luận văn Thạc sĩ Kinh tế: Giải pháp đẩy mạnh hoạt động của các quỹ đầu tư phát triển địa phương ở Việt Nam
101 p | 40 | 7
-
Luận văn thạc sĩ Kinh tế: Tác động của các yếu tố vĩ mô đến tăng trưởng kinh tế Việt Nam
68 p | 35 | 7
-
Luận văn Thạc sĩ Quản lý công: Quản lý nhà nước về đầu tư xây dựng cơ bản bằng ngân sách nhà nước trên địa bàn huyện Cư M’gar, tỉnh Đắk Lắk
119 p | 29 | 6
-
Luận văn Thạc sĩ Toán học: Tính chất nhân tử của tổng lũy thừa các số nguyên
53 p | 34 | 6
-
Luận văn Thạc sĩ Kinh tế: Ứng dụng mô hình lợi nhuận thặng dư để xác định giá trị doanh nghiệp trong quá trình cổ phần hoá doanh nghiệp nhà nước
100 p | 33 | 6
-
Luận văn Thạc sĩ Kinh tế: Mức độ truyền dẫn của giá dầu vào lạm phát Việt Nam giai đoạn 2001 – 2013
72 p | 16 | 5
-
Luận án Tiến sĩ Văn học: Tư tưởng học thuật và phương pháp biên định di sản văn chương của Lê Quý Đôn, Bùi Huy Bích và Phan Huy Chú
199 p | 17 | 5
-
Luận văn Thạc sĩ Kinh tế: Hoàn thiện hệ thống xếp hạng tín dụng doanh nghiệp tại Trung tâm Thông tin tín dụng - Ngân hàng Nhà nước Việt Nam
111 p | 37 | 4
-
Luận văn Thạc sĩ Kinh tế: Hoàn thiện các chỉ tiêu đo lường đánh giá thành quả hoạt động theo Bảng điểm cân bằng tại Công ty cổ phần dầu khí Thái Bình Dương
112 p | 35 | 4
-
Luận văn Thạc sĩ Kinh tế: Nghiên cứu ảnh hưởng của sự phân tán địa lý đến tỷ suất sinh lợi của các cổ phiếu niêm yết trên thị trường chứng khoán Việt Nam
86 p | 13 | 4
-
Luận văn Thạc sĩ Hoá học: Tổng hợp, cấu trúc một số hợp chất mới của quinolin
80 p | 17 | 4
-
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Xây dựng mô hình đối thoại cho Tiếng Việt trên miền mở dựa vào phương pháp học chuỗi liên tiếp
23 p | 55 | 3
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn